डेटाबेस की धारणाएँ

डेटाबेस, सूचनाओं (डेटा) का ऐसा सुव्यवस्थित संग्रह (Organised Collection) होता है, जिसमें हम किसी भी सूचना को आसानी से प्राप्त कर सकते हैं। डेटाबेस व्यवस्थित होता है, क्योंकि इमसें किसी भी डेटा या सूचना को एक निश्चित स्थान पर पहले से तय किए हुए रूप में रखा जाता है, तांकि कभी भी आवश्यकता पड़ने पर उसे सरलता से ढूँढकर देखा जा सके।
व्यवस्थिति डेटाबेस में हमें निम्नलिखित कार्य की सुविधा होती है –

  • आवश्यक सूचना को निकालना।
  • सूचनाओं के आधार पर रिपार्ट आदि तैयार करना तथा नई सूचनाएँ निकालना।
  • सूचनाओं को नई आवश्यकताओं के अनुसार फिर से व्यवस्थित करना।

डेटाबेस के प्रकार

डेटाबेस के मुख्य रूप से तीन प्रकार होते है-

1. नेटवर्क डेटाबेस (Network Database) – इस प्रकार के डेटाबेस में, डेटा रिकाॅर्ड के रूप में तथा डेटा के बीच सम्बन्ध लिंक के माध्यम से प्रदर्शित किया जाता है।

2. हैरार्रिकल डेटाबेस (Hierarchical database) – इस प्रकार के डेटाबेस में, डेटा को वृक्ष के रूप में नोड्स के माध्यम से दर्शाया जाता है। हैरार्रिकल डेटाबेस में नोड्स आपस में लिंक के माध्यम से जुड़ी हुई रहती हैं।

3. रिलेशनल डेटाबेस (Relational Database) – रिलेशनल डेटाबेस को संचरित डेटाबेस (Structured Database) भी कहते है, जिसमें डेटा को सारणियों (Tables) के रूप में संग्रहीत (Store) कराया जाता है। इन डेटा सारणियों में स्तम्भ (Column), सारणी में स्टोर होने वाले डेटा के प्रकार को तथा पंक्तियाँ (Rows) डेटा को दर्शाती हैं।

डेटा (Data)

किसी वस्तु, व्यक्ति या समूह के बारे में किसी तथ्य अथवा जानकारी को डेटा (Data) कहा जाता है। किसी व्यक्ति का नाम, किसी वस्तु का वजन तथा मूल्य किसी कक्षा के विद्यार्थियों की उम्र आदि ये सभी डेटा के उदाहरण हैं।

सूचना (Information)

जब किसी डेटा को सार्थक तथा उपयोगी बनाने के लिए संसोधित, व्यवस्थित, संरक्षित किया जाता है, तो उसे सूचना कहते हैं।

डेटाबेस की घटक –

एक डेटाबेस का निर्माण कई प्रकार के अवयवों से मिलकर होता है। डेटाबेस के प्रत्येक अवयव को आब्जेक्ट (Object) कहा जाता हैं।
प्रत्येक डेटाबेस फाइल में डेटा को विभिन्न सारणियों (Tables) में विभाजित किया जा सकता हैं, फाॅर्म (Form) के माध्यम से सारणी के डेटा को देखा जा सकता हैं, एवं नया डेटा भी जोड़ सकते है तथा अपडेट (Update) भी कर सकते हैं, क्वैरी (Queries) के द्वारा आवश्यकतानुसार सारणियों में से डेटा को खोजा जा सकता है तथा फिर से प्राप्त भी किया जा सकता है। रिपोर्ट (Report) के माध्यम से डेटा का विश्लेषण (Analyse) तथा डेटा को एक विषेश लेआउट (layout) में प्रिन्ट कर सकते हैं।
डेटाबेस के अवयव –

1. सारणी (Table)

वैसे तो डेटाबेस के कई प्रकार होते हैं, परन्तु सबसे प्रचलित और प्राकृति डेटाबेस रिलेशनल डेटाबेस होता हैं, जिसमें डेटा एक सारणी के रूप में स्टोर होता है। सारणी, स्तम्भ तथा पंक्तियों के कटाव से बने सैल (Cells) से मिलकर बनी होती है, यही सैल सारणियों में डेटा को स्टोर करने के लिए उपयोग में ली जाती है।
इन सारणियों पर विभिन्न प्रकार के ऑपरेशन, जैसे कि डेटा को स्टोर करना, निस्पन्दन (Filtering) करना, पुनः प्राप्त करना, डेटा का सम्पादन करना आदि किए जाते हैं। मुख्य रूप से, सारणी फील्ड तथा रिकाॅर्ड से मिलकर बनी होती है।

2. फील्ड (Field)

सारणी के प्रत्येक स्तम्भ को फील्ड कहते हैं, प्रत्येक फील्ड का नाम निर्धारित होता है, जिसमें उसको पहचाना जा सकता है। प्रत्येक फील्ड का नाम उस फील्ड में स्टोर होने वाले डेटा के प्रकार को बताता है। उदाहरण के लिए विद्यार्थी का नाम, शहर, देश टेलीफोन नम्बर आदि फील्ड के नाम हो सकते हैं।

3. रिकाॅर्ड (Record)

सारणी की प्रत्येक पंक्ति को रिकार्ड कहा जाता है। अन्य शब्दों में, ‘एक रिकाॅर्ड एक एंटिटी’ (जैसे कि वस्तु, व्यक्ति आदि) से सम्बन्धित सभी फील्डों में उपस्थित डेटा का संग्रह होता है।

4. क्वैरी (Queries)

किसी सारणी या डेटाबेस से आवश्यकतानुसार डेटा को निकालने के लिए जो आदेश दिया जाता है, उसे क्वैरी कहते है। क्वैरी आवश्यकतानुसार डेटा को निकालने के लिए आवश्यक फील्डों, शर्ते, सारणी का नाम आदि को प्रदर्शित करता है। किसी क्वैरी के उत्तर में जो सूचनाएँ या रिकाॅर्ड डेटाबेस से निकाले जाते हैं, उसे उस क्वैरी का डायनासेट (Dynaset) कहा जाता हैं।

5. फार्म (Forms)

फाॅर्म स्क्रीन पर वह विण्डो होती है, जिसकी सहायता से आप किसी सारणी में भरे गए डेटा को देखा जा सकता हैं, सुधार सकते हैं और नया डेटा भी जोड़ा जा सकता है, सामान्यतः फाॅर्म एक समय पर एक रिकाॅर्ड को देखने तथा सुधारने के लिए प्रयोग किया जाता है।

6. रिपोर्ट (Reports)

सरल शब्दों में कोई रिपोर्ट एक ऐसा डायनासेट होता है, जिसे कागज पर छापा गया हो, किसी डायनासेट की सूचनाओं को किन्ही आधारों पर समूहबद्ध किया जा सकता है।

रिलेशनल डेटाबेस

रिलेशनल डेटाबेस में डेटा को द्वि-आयामी सारणियों (2-Dimensional Tables) के रूप में संग्रहीत किया जाता है। इन सारणियों को रिलेशन (Relation) भी कहते है। रिलेशन डेटाबेस के रख-रखाव के लिए रिलेशनल डेटाबेस प्रबन्धन प्रणाली (Relational Database Management System-RDBMS) की जरूरत होती है। RDBMS, DBMS का ही एक प्रकार है। रिलेशनल डेटाबेस की मुख्य विशेषता यह है कि एक एकल डेटाबेस में एक से अधिक सारणियों को संग्रहीत किया जा सकता है और ये सारणियाँ आपस में सम्बन्धित होती है।

रिलेशन (Relation) –

रिलेशन के अन्तर्गत एक टेबल (Table) बनायीं जाती है जो एक सिक्वेन्शियल फाइल का निरूपण करती है, जिसमें टेबल की पंक्तियाँ (Rows) फाइल के रिकाॅर्ड को प्रदर्शित करती हैं एवं स्तम्भ (Column) रिकाॅर्ड के फील्ड को दर्शाता है। ये टेबल्स रिलेशन ही होते हैं। रिलेशन को उच्च स्तरीय फाइल्स के रूप में समझा जाता है, जिसमें-

  • प्रत्येक रिलेशन में एक ही तरह के रिकाॅर्ड होते हैं।
  • किसी दिए गए रिलेशन में प्रत्येक रिकाॅर्ड के फील्डों की संख्या समान होती है।
  • प्रत्येक रिकाॅर्ड का एक अलग पहचानने वाला (Identifier) होता है।
  • रिलेशन के अन्दर रिकाॅर्ड किसी विशेष क्रम में व्यवस्थित होते हैं

टपल (Tuple) – रिलेशन में प्रत्येक रिकाॅर्ड को टपल कहा जाता है।

एट्रिब्यूट (Attribute) – रिलेशन के सन्दर्भ में प्रत्येक काॅलम (फील्ड) को एट्रिब्यूट कहा जाता है।

डोमेन (Domain) – रिलेशन के सन्दर्भ में डोमेन मानों का एक समूह होता है जिससे किसी काॅलम में दिए गए वास्तविक मानों को व्युत्पन्न किया जाता है।

कार्डिनैलिटी (Cardinality) – रिलेशन के सन्दर्भ में टपल (रिकाॅड्र्स) की कुल संख्या को कार्डिनैलिटी कहा जाता हैं।

डिग्री (Degree) – रिलेशन के सन्दर्भ में एट्रिब्यूट (फिल्ड या काॅलम) की कुल संख्या को रिलेशन की डिग्री कहते हैं।

की-फील्ड

सामान्यतः किसी डेटाबेस के हर रिकाॅर्ड कोपहचानने के लिए उसकी रिकाॅर्ड संख्या की सहायता ली जाती है, लेकिन सभी रिकाॅर्ड संख्या को याद रखना आसान नहीं है। इसलिए किसी रिकाॅर्ड को पहचानने के लिए हम उसके एक फील्ड को मुख्य फील्ड या की-फील्ड मान लेते हैं।
की (Key) कई प्रकार की होती है, जो निम्नलिखित हैं –

1. प्राइमरी की (Primary Key)

प्राइमरी की किसी रिलेशन का एक एट्रिब्यूट होता है, जिसमें विभिन्न प्रकार के मान होते हैं, और जिनके द्वारा उस रिलेशन के टपल को निर्धारित किया जाता है। प्राइमरी की के रूप् में चुना गया फील्ड NULL वैल्यू को स्वीकार नहीं करता है।

2. कैन्डिडेट की (Candidate Key)

कभी-कभी ऐसे रिलेशन भी उत्पन्न होते हैं जिनमें एक से अधिक एट्रिब्यूट का समूह होता है जिसमें विशेष निर्धारक गुण भी होते हैं एवं इसके लिए एक से अधिक की (Key) बनाना जरूरी हो जाता है। वह key जिस पर विशिष्ट निर्धारक गुण का प्रयोग किया जाता है, उसे कैन्डिडेट की कहा जाता है। किसी एक रिलेशन में एक या एक से अधिक कैन्डिडेट की हो सकती है।

3. आल्टरनेट की (Alternate Key)

आल्टरनेट की वह होती है जो प्राइमरी की नहीं होती। इसकी उपयोग उस रिलेशन में किया जाता है जिसमें एक से अधिक एट्रिब्यूटों का समूह होता है एवं एक से अधिक कैण्डिडेट की मौजूद होती है। इस स्थिति में, किसी विशिष्ट गुण को निर्धारित करने के लिए जब एक से अधिक की (Key) के समूहों का प्रयोग होता है तब प्रथम की को प्राइमरी की एवं दूसरी की को ऑल्टरनेट की कहा जाता है। आल्टरनेट की को सेकण्डरी की भी कहते है।

4. फाॅरेन की (Foreign Key)

फाॅरेन की किसी रिलेशन डेटाबेस में एक या एक से अधिक फील्डों का समूह होता है जो दो सारणियों के डेटा के बीच लिंक (Link) बनाती है। किसी सारणी की फाॅरेन की फील्ड के लिए वैल्यू उसी सारणी के प्राइमरी की फील्ड या अन्य किसी सारणी के प्राइमरी-की फील्ड की वैल्य से व्युत्पन्न (Derived) की जाती है। इस प्रकार फाॅरेन की दो सारणियों के बीच सम्बन्ध स्थापित करती है। किसी सारणी में एक से अधिक फाॅरेन की हो सकती हैं जो उस सारणी को अलग-अलग सारणियों से सम्बन्ध स्थापित करती है।

5. यूनीक की (Unique Key)

किसी सारणी में यूनीक की एक या एक से अधिक फील्डों का समूह होती है जिनके द्वारा उस सारणी में प्रत्येक टपल को निर्धारित किया जाता है। एक सारणी में एक से अधिक यूनीक की हो सकती है। यूनीक की के लिए चुना गया फील्ड NULL वैल्यू स्वीकार कर सकता है।