डेटाबेस, सूचनाओं (डेटा) का ऐसा सुव्यवस्थित संग्रह (Organised Collection) होता है, जिसमें हम किसी भी सूचना को आसानी से प्राप्त कर सकते हैं। डेटाबेस व्यवस्थित होता है, क्योंकि इमसें किसी भी डेटा या सूचना को एक निश्चित स्थान पर पहले से तय किए हुए रूप में रखा जाता है, तांकि कभी भी आवश्यकता पड़ने पर उसे सरलता से ढूँढकर देखा जा सके।
व्यवस्थिति डेटाबेस में हमें निम्नलिखित कार्य की सुविधा होती है –
- आवश्यक सूचना को निकालना।
- सूचनाओं के आधार पर रिपार्ट आदि तैयार करना तथा नई सूचनाएँ निकालना।
- सूचनाओं को नई आवश्यकताओं के अनुसार फिर से व्यवस्थित करना।
डेटाबेस के प्रकार
डेटाबेस के मुख्य रूप से तीन प्रकार होते है-
1. नेटवर्क डेटाबेस (Network Database) – इस प्रकार के डेटाबेस में, डेटा रिकाॅर्ड के रूप में तथा डेटा के बीच सम्बन्ध लिंक के माध्यम से प्रदर्शित किया जाता है।
2. हैरार्रिकल डेटाबेस (Hierarchical database) – इस प्रकार के डेटाबेस में, डेटा को वृक्ष के रूप में नोड्स के माध्यम से दर्शाया जाता है। हैरार्रिकल डेटाबेस में नोड्स आपस में लिंक के माध्यम से जुड़ी हुई रहती हैं।
3. रिलेशनल डेटाबेस (Relational Database) – रिलेशनल डेटाबेस को संचरित डेटाबेस (Structured Database) भी कहते है, जिसमें डेटा को सारणियों (Tables) के रूप में संग्रहीत (Store) कराया जाता है। इन डेटा सारणियों में स्तम्भ (Column), सारणी में स्टोर होने वाले डेटा के प्रकार को तथा पंक्तियाँ (Rows) डेटा को दर्शाती हैं।
डेटा (Data)
किसी वस्तु, व्यक्ति या समूह के बारे में किसी तथ्य अथवा जानकारी को डेटा (Data) कहा जाता है। किसी व्यक्ति का नाम, किसी वस्तु का वजन तथा मूल्य किसी कक्षा के विद्यार्थियों की उम्र आदि ये सभी डेटा के उदाहरण हैं।
सूचना (Information)
जब किसी डेटा को सार्थक तथा उपयोगी बनाने के लिए संसोधित, व्यवस्थित, संरक्षित किया जाता है, तो उसे सूचना कहते हैं।
डेटाबेस की घटक –
एक डेटाबेस का निर्माण कई प्रकार के अवयवों से मिलकर होता है। डेटाबेस के प्रत्येक अवयव को आब्जेक्ट (Object) कहा जाता हैं।
प्रत्येक डेटाबेस फाइल में डेटा को विभिन्न सारणियों (Tables) में विभाजित किया जा सकता हैं, फाॅर्म (Form) के माध्यम से सारणी के डेटा को देखा जा सकता हैं, एवं नया डेटा भी जोड़ सकते है तथा अपडेट (Update) भी कर सकते हैं, क्वैरी (Queries) के द्वारा आवश्यकतानुसार सारणियों में से डेटा को खोजा जा सकता है तथा फिर से प्राप्त भी किया जा सकता है। रिपोर्ट (Report) के माध्यम से डेटा का विश्लेषण (Analyse) तथा डेटा को एक विषेश लेआउट (layout) में प्रिन्ट कर सकते हैं।
डेटाबेस के अवयव –
1. सारणी (Table)
वैसे तो डेटाबेस के कई प्रकार होते हैं, परन्तु सबसे प्रचलित और प्राकृति डेटाबेस रिलेशनल डेटाबेस होता हैं, जिसमें डेटा एक सारणी के रूप में स्टोर होता है। सारणी, स्तम्भ तथा पंक्तियों के कटाव से बने सैल (Cells) से मिलकर बनी होती है, यही सैल सारणियों में डेटा को स्टोर करने के लिए उपयोग में ली जाती है।
इन सारणियों पर विभिन्न प्रकार के ऑपरेशन, जैसे कि डेटा को स्टोर करना, निस्पन्दन (Filtering) करना, पुनः प्राप्त करना, डेटा का सम्पादन करना आदि किए जाते हैं। मुख्य रूप से, सारणी फील्ड तथा रिकाॅर्ड से मिलकर बनी होती है।
2. फील्ड (Field)
सारणी के प्रत्येक स्तम्भ को फील्ड कहते हैं, प्रत्येक फील्ड का नाम निर्धारित होता है, जिसमें उसको पहचाना जा सकता है। प्रत्येक फील्ड का नाम उस फील्ड में स्टोर होने वाले डेटा के प्रकार को बताता है। उदाहरण के लिए विद्यार्थी का नाम, शहर, देश टेलीफोन नम्बर आदि फील्ड के नाम हो सकते हैं।
3. रिकाॅर्ड (Record)
सारणी की प्रत्येक पंक्ति को रिकार्ड कहा जाता है। अन्य शब्दों में, ‘एक रिकाॅर्ड एक एंटिटी’ (जैसे कि वस्तु, व्यक्ति आदि) से सम्बन्धित सभी फील्डों में उपस्थित डेटा का संग्रह होता है।
4. क्वैरी (Queries)
किसी सारणी या डेटाबेस से आवश्यकतानुसार डेटा को निकालने के लिए जो आदेश दिया जाता है, उसे क्वैरी कहते है। क्वैरी आवश्यकतानुसार डेटा को निकालने के लिए आवश्यक फील्डों, शर्ते, सारणी का नाम आदि को प्रदर्शित करता है। किसी क्वैरी के उत्तर में जो सूचनाएँ या रिकाॅर्ड डेटाबेस से निकाले जाते हैं, उसे उस क्वैरी का डायनासेट (Dynaset) कहा जाता हैं।
5. फार्म (Forms)
फाॅर्म स्क्रीन पर वह विण्डो होती है, जिसकी सहायता से आप किसी सारणी में भरे गए डेटा को देखा जा सकता हैं, सुधार सकते हैं और नया डेटा भी जोड़ा जा सकता है, सामान्यतः फाॅर्म एक समय पर एक रिकाॅर्ड को देखने तथा सुधारने के लिए प्रयोग किया जाता है।
6. रिपोर्ट (Reports)
सरल शब्दों में कोई रिपोर्ट एक ऐसा डायनासेट होता है, जिसे कागज पर छापा गया हो, किसी डायनासेट की सूचनाओं को किन्ही आधारों पर समूहबद्ध किया जा सकता है।
रिलेशनल डेटाबेस
रिलेशनल डेटाबेस में डेटा को द्वि-आयामी सारणियों (2-Dimensional Tables) के रूप में संग्रहीत किया जाता है। इन सारणियों को रिलेशन (Relation) भी कहते है। रिलेशन डेटाबेस के रख-रखाव के लिए रिलेशनल डेटाबेस प्रबन्धन प्रणाली (Relational Database Management System-RDBMS) की जरूरत होती है। RDBMS, DBMS का ही एक प्रकार है। रिलेशनल डेटाबेस की मुख्य विशेषता यह है कि एक एकल डेटाबेस में एक से अधिक सारणियों को संग्रहीत किया जा सकता है और ये सारणियाँ आपस में सम्बन्धित होती है।
रिलेशन (Relation) –
रिलेशन के अन्तर्गत एक टेबल (Table) बनायीं जाती है जो एक सिक्वेन्शियल फाइल का निरूपण करती है, जिसमें टेबल की पंक्तियाँ (Rows) फाइल के रिकाॅर्ड को प्रदर्शित करती हैं एवं स्तम्भ (Column) रिकाॅर्ड के फील्ड को दर्शाता है। ये टेबल्स रिलेशन ही होते हैं। रिलेशन को उच्च स्तरीय फाइल्स के रूप में समझा जाता है, जिसमें-
- प्रत्येक रिलेशन में एक ही तरह के रिकाॅर्ड होते हैं।
- किसी दिए गए रिलेशन में प्रत्येक रिकाॅर्ड के फील्डों की संख्या समान होती है।
- प्रत्येक रिकाॅर्ड का एक अलग पहचानने वाला (Identifier) होता है।
- रिलेशन के अन्दर रिकाॅर्ड किसी विशेष क्रम में व्यवस्थित होते हैं
टपल (Tuple) – रिलेशन में प्रत्येक रिकाॅर्ड को टपल कहा जाता है।
एट्रिब्यूट (Attribute) – रिलेशन के सन्दर्भ में प्रत्येक काॅलम (फील्ड) को एट्रिब्यूट कहा जाता है।
डोमेन (Domain) – रिलेशन के सन्दर्भ में डोमेन मानों का एक समूह होता है जिससे किसी काॅलम में दिए गए वास्तविक मानों को व्युत्पन्न किया जाता है।
कार्डिनैलिटी (Cardinality) – रिलेशन के सन्दर्भ में टपल (रिकाॅड्र्स) की कुल संख्या को कार्डिनैलिटी कहा जाता हैं।
डिग्री (Degree) – रिलेशन के सन्दर्भ में एट्रिब्यूट (फिल्ड या काॅलम) की कुल संख्या को रिलेशन की डिग्री कहते हैं।
की-फील्ड
सामान्यतः किसी डेटाबेस के हर रिकाॅर्ड कोपहचानने के लिए उसकी रिकाॅर्ड संख्या की सहायता ली जाती है, लेकिन सभी रिकाॅर्ड संख्या को याद रखना आसान नहीं है। इसलिए किसी रिकाॅर्ड को पहचानने के लिए हम उसके एक फील्ड को मुख्य फील्ड या की-फील्ड मान लेते हैं।
की (Key) कई प्रकार की होती है, जो निम्नलिखित हैं –
1. प्राइमरी की (Primary Key)
प्राइमरी की किसी रिलेशन का एक एट्रिब्यूट होता है, जिसमें विभिन्न प्रकार के मान होते हैं, और जिनके द्वारा उस रिलेशन के टपल को निर्धारित किया जाता है। प्राइमरी की के रूप् में चुना गया फील्ड NULL वैल्यू को स्वीकार नहीं करता है।
2. कैन्डिडेट की (Candidate Key)
कभी-कभी ऐसे रिलेशन भी उत्पन्न होते हैं जिनमें एक से अधिक एट्रिब्यूट का समूह होता है जिसमें विशेष निर्धारक गुण भी होते हैं एवं इसके लिए एक से अधिक की (Key) बनाना जरूरी हो जाता है। वह key जिस पर विशिष्ट निर्धारक गुण का प्रयोग किया जाता है, उसे कैन्डिडेट की कहा जाता है। किसी एक रिलेशन में एक या एक से अधिक कैन्डिडेट की हो सकती है।
3. आल्टरनेट की (Alternate Key)
आल्टरनेट की वह होती है जो प्राइमरी की नहीं होती। इसकी उपयोग उस रिलेशन में किया जाता है जिसमें एक से अधिक एट्रिब्यूटों का समूह होता है एवं एक से अधिक कैण्डिडेट की मौजूद होती है। इस स्थिति में, किसी विशिष्ट गुण को निर्धारित करने के लिए जब एक से अधिक की (Key) के समूहों का प्रयोग होता है तब प्रथम की को प्राइमरी की एवं दूसरी की को ऑल्टरनेट की कहा जाता है। आल्टरनेट की को सेकण्डरी की भी कहते है।
4. फाॅरेन की (Foreign Key)
फाॅरेन की किसी रिलेशन डेटाबेस में एक या एक से अधिक फील्डों का समूह होता है जो दो सारणियों के डेटा के बीच लिंक (Link) बनाती है। किसी सारणी की फाॅरेन की फील्ड के लिए वैल्यू उसी सारणी के प्राइमरी की फील्ड या अन्य किसी सारणी के प्राइमरी-की फील्ड की वैल्य से व्युत्पन्न (Derived) की जाती है। इस प्रकार फाॅरेन की दो सारणियों के बीच सम्बन्ध स्थापित करती है। किसी सारणी में एक से अधिक फाॅरेन की हो सकती हैं जो उस सारणी को अलग-अलग सारणियों से सम्बन्ध स्थापित करती है।
5. यूनीक की (Unique Key)
किसी सारणी में यूनीक की एक या एक से अधिक फील्डों का समूह होती है जिनके द्वारा उस सारणी में प्रत्येक टपल को निर्धारित किया जाता है। एक सारणी में एक से अधिक यूनीक की हो सकती है। यूनीक की के लिए चुना गया फील्ड NULL वैल्यू स्वीकार कर सकता है।