अध्याय 03 डेटा का संगठन

1. परिचय

पिछले अध्याय में आपने सीखा कि डेटा कैसे एकत्र किया जाता है। आपने यह भी जाना कि जनगणना और नमूना ग्रहण में क्या अंतर होता है। इस अध्याय में आप जानेंगे कि आपके द्वारा एकत्रित डेटा को किस प्रकार वर्गीकृत किया जाएगा। कच्चे डेटा को वर्गीकृत करने का उद्देश्य उनमें क्रम लाना होता है ताकि उन्हें आगे की सांख्यिकीय विश्लेषण के लिए आसानी से प्रयोग किया जा सके।

क्या आपने कभी अपने स्थानीय कबाड़ी वाले को देखा है, जिसे आप पुराने अखबार, टूटे-फूटे घरेलू सामान, खाली कांच की बोतलें, प्लास्टिक आदि बेचते हैं? वह आपसे ये चीजें खरीदता है और उन्हें उन लोगों को बेचता है जो इनका पुनर्चक्रण करते हैं। लेकिन उसकी दुकान में इतना सारा कबाड़ होने पर, यदि वह उन्हें ठीक से संगठित न करे तो अपना व्यापार चलाना बहुत कठिन हो जाएगा। अपनी स्थिति को आसान बनाने के लिए वह विभिन्न कबाड़ को उपयुक्त रूप से समूहों या “वर्गों” में बाँटता है। वह पुराने अखबारों को एक साथ रखता है और उन्हें रस्सी से बाँध देता है। फिर सभी खाली कांच की बोतलों को एक बोरी में इकट्ठा करता है। वह धातुओं की वस्तुओं को अपनी दुकान के एक कोने में ढेर लगाकर रखता है और उन्हें “लोहा”, “तांबा”, “एल्युमिनियम”, “पीतल” आदि जैसे समूहों में बाँटता है। इस प्रकार वह अपने कबाड़ को विभिन्न वर्गों - “अखबार”, “प्लास्टिक”, “कांच”, “धातु” आदि - में बाँटता है और उनमें क्रम लाता है। एक बार जब उसका कबाड़ व्यवस्थित और वर्गीकृत हो जाता है, तो किसी खास वस्तु को खोजना आसान हो जाता है जो कोई खरीदार माँग सकता है।

इसी प्रकार जब आप अपनी स्कूल की किताबों को किसी निश्चित क्रम में रखते हैं, तो उन्हें संभालना आसान हो जाता है। आप उन्हें विषयों के अनुसार वर्गीकृत कर सकते हैं, जहाँ प्रत्येक विषय एक समूह या वर्ग बन जाता है। इसलिए, जब आपको इतिहास की कोई विशेष किताब चाहिए, उदाहरण के लिए, तो आपको बस “इतिहास” समूह में उस किताब की खोज करनी होती है। अन्यथा, आपको अपनी पूरी संग्रह में उस विशेष किताब को खोजना पड़ेगा।

जबकि वस्तुओं या चीजों का वर्गीकरण हमारा बहुमूल्य समय और प्रयास बचाता है, यह मनमाने ढंग से नहीं किया जाता है। कबड़ीवाला अपने कबाड़ को पुन: प्रयोग होने वाली वस्तुओं के बाजारों के अनुसार समूहित करता है। उदाहरण के लिए, “काँच” समूह के अंतर्गत वह खाली बोतलें, टूटे हुए दर्पण और खिड़कियों के काँच आदि रखेगा। इसी प्रकार जब आप अपनी इतिहास की किताबों को “इतिहास” समूह के अंतर्गत वर्गीकृत करते हैं, तो आप उस समूह में किसी अन्य विषय की किताब नहीं रखेंगे। अन्यथा समूहन का संपूर्ण उद्देश्य समाप्त हो जाएगा। वर्गीकरण, इसलिए, किसी मानदंड के आधार पर चीजों को समूहों या वर्गों में व्यवस्थित करना है।

गतिविधि

  • अपने स्थानीय डाक-घर जाकर पता करें कि पत्रों को कैसे छाँटा जाता है। क्या आप जानते हैं कि पत्र में दिया गया पिन-कोड क्या दर्शाता है? अपने डाकिया से पूछें।

2. कच्चा आँकड़ा

कबडीवाले के कबाड़ की तरह, अवर्गीकृत डेटा या कच्चा डेटा अत्यधिक असंगठित होता है। वे अक्सर बहुत बड़े और संभालने में कठिन होते हैं। इनसे सार्थक निष्कर्ष निकालना एक थकाऊ कार्य है क्योंकि वे सांख्यिकीय विधियों पर आसानी से प्रतिक्रिया नहीं करते। इसलिए किसी भी व्यवस्थित सांख्यिकीय विश्लेषण से पहले ऐसे डेटा का उचित संगठन और प्रस्तुति आवश्यक है। इसलिए डेटा एकत्र करने के बाद अगला चरण उन्हें संगठित करना और वर्गीकृत रूप में प्रस्तुत करना है।

मान लीजिए आप विद्यार्थियों के गणित में प्रदर्शन को जानना चाहते हैं और आपने अपने विद्यालय के 100 विद्यार्थियों के गणित में अंकों का डेटा एकत्र किया है। यदि आप उन्हें एक सारणी के रूप में प्रस्तुत करें, तो वे कुछ इस प्रकार दिखाई दे सकते हैं जैसा कि सारणी 3.1 में दिया गया है।

सारणी 3.1 गणित में प्राप्तांक जिन्हें 100 विद्यार्थियों ने एक परीक्षा में प्राप्त किया

474510605156661004940
60595655624859555141
42696466505957656250
64303775175620145590
62515514253490495654
70474982408260856566
49446469704812285565
4940254171800561422
66534670436159123035
45445776823932149025

या आप अपने पड़ोस के 50 घरों के मासिक खाद्य व्यय पर डेटा एकत्र कर सकते हैं ताकि उनका औसत खाद्य व्यय जाना जा सके। एकत्र किया गया डेटा, यदि आप उसे तालिका के रूप में प्रस्तुत करते, तो वह तालिका 3.2 जैसा दिखता। तालिका 3.1 और तालिका 3.2 दोनों कच्चे या अवर्गीकृत डेटा हैं। दोनों तालिकाओं में आप पाते हैं कि संख्याएँ किसी क्रम में नहीं रखी गई हैं। अब यदि आपसे तालिका 3.1 से गणित में अधिकतम अंक मांगे जाएँ तो आपको पहले 100 विद्यार्थियों के अंकों को या तो बढ़ते या घटते क्रम में व्यवस्थित करना होगा। यह एक थकाऊ कार्य है। यह और भी अधिक थकाऊ हो जाता है, यदि 100 के स्थान पर आपके पास 1,000 विद्यार्थियों के अंक हों। इसी प्रकार, तालिका 3.2 में आप देख सकते हैं कि 50 घरों का औसत मासिक व्यय ज्ञात करना आपके लिए कठिन है। और यह कठिनाई कई गुना बढ़ जाएगी यदि संख्या बड़ी हो — मान लीजिए, 5,000 घर। हमारे कबडीवाले की तरह, जिसे अपना कबाड़ बड़ा और बेतरतीब होने पर कोई विशेष वस्तु ढूँढने में कष्ट होता है, आपको भी कच्चे डेटा से कोई सूचना निकालने में इसी प्रकार की स्थिति का सामना करना पड़ेगा। एक शब्द में, इसलिए, बड़े अवर्गीकृत डेटा से सूचना निकालना एक थकाऊ कार्य है।

तालिका 3.2 50 घरों का खाद्य पर मासिक घरेलू व्यय (रुपयों में)

19041559347317352760
20411612175318554439
50901085182323461523
12111360111021521183
12181315110526282712
42481812126411831171
10071180195311372048
20251583132426213676
13971832196221772575
12931365114632221396

कच्चे आंकड़ों को संक्षेपित किया जाता है और वर्गीकरण द्वारा उन्हें समझने योग्य बनाया जाता है। जब समान लक्षणों वाले तथ्यों को एक ही वर्ग में रखा जाता है, तो यह उन्हें आसानी से खोजने, तुलना करने और बिना किसी कठिनाई के निष्कर्ष निकालने में सक्षम बनाता है। आपने अध्याय 2 में पढ़ा है कि भारत सरकार दस-दस वर्षों पर जनगणना करती है। जनगणना 2001 में लगभग 20 करोड़ व्यक्तियों से संपर्क किया गया था। जनगणना के कच्चे आंकड़े इतने विशाल और टुकड़ों में बंटे हुए हैं कि उनसे कोई सार्थक निष्कर्ष निकालना लगभग असंभव-सा प्रतीत होता है। लेकिन जब उन्हीं आंकड़ों को लिंग, शिक्षा, वैवाहिक स्थिति, व्यवसाय आदि के अनुसार वर्गीकृत किया जाता है, तब भारत की जनसंख्या की संरचना और स्वरूप आसानी से समझ में आता है।

कच्चे आंकड़े चरों पर प्रेक्षणों से बने होते हैं। तालिका 3.1 और 3.2 में दिए गए कच्चे आंकड़े किसी विशिष्ट चर या चरों के समूह पर प्रेक्षणों को दर्शाते हैं। उदाहरण के लिए तालिका 3.1 को देखिए जिसमें 100 विद्यार्थियों द्वारा गणित में प्राप्त अंक दिए गए हैं। हम इन अंकों का अर्थ कैसे समझ सकते हैं? इन अंकों को देखते हुए गणित की शिक्षिका सोच रही होगी—मेरे विद्यार्थियों ने कैसा प्रदर्शन किया है? कितने अनुत्तीर्ण हुए हैं? हम आंकड़ों को कैसे वर्गीकृत करते हैं यह इस उद्देश्य पर निर्भर करता है जो हमारे मन में है। इस स्थिति में शिक्षिका इन विद्यार्थियों के प्रदर्शन को कुछ गहराई से समझना चाहती है। वह संभवतः बारंबारता बंटन बनाने का विकल्प चुनेगी। इसकी चर्चा अगले खंड में की गई है।

गतिविधि

  • अपने परिवार के कुल साप्ताहिक व्यय का एक वर्ष का आंकड़ा एकत्र कीजिए और उसे एक सारणी में व्यवस्थित कीजिए। देखिए आपके पास कितने प्रेक्षण हैं। आंकड़ों को मासिक रूप से व्यवस्थित कीजिए और प्रेक्षणों की संख्या ज्ञात कीजिए।

3. आंकड़ों का वर्गीकरण

वर्गीकरण के समूह या वर्ग विभिन्न तरीकों से बनाए जाते हैं। अपनी पुस्तकों को विषयों के अनुसार—“इतिहास”, “भूगोल”, “गणित”, “विज्ञान” आदि—वर्गीकृत करने के बजाय आप उन्हें लेखक के नाम के अनुसार वर्णानुक्रम में भी वर्गीकृत कर सकते हैं। या फिर आप उन्हें प्रकाशन वर्ष के अनुसार भी वर्गीकृत कर सकते हैं। आप उन्हें जिस तरह वर्गीकृत करना चाहेंगे वह आपकी आवश्यकता पर निर्भर करेगा।

इसी प्रकार, कच्चे आंकड़ों को विभिन्न तरीकों से उद्देश्य के अनुसार वर्गीकृत किया जाता है। इन्हें समय के अनुसार भी समूहबद्ध किया जा सकता है। इस प्रकार की वर्गीकरण को कालानुक्रमिक वर्गीकरण (Chronological Classification) कहा जाता है। इस वर्गीकरण में, आंकड़ों को वर्ष, तिमाही, महीने, सप्ताह आदि के संदर्भ में आरोही या अवरोही क्रम में वर्गीकृत किया जाता है। निम्नलिखित उदाहरण भारत की जनसंख्या को वर्षों के आधार पर वर्गीकृत करता है। ‘जनसंख्या’ चर एक समय श्रृंखला (Time Series) है क्योंकि यह विभिन्न वर्षों के लिए मानों की एक श्रृंखला दर्शाता है।

उदाहरण 1

भारत की जनसंख्या (करोड़ों में)

वर्षजनसंख्या (करोड़ों में)
195135.7
196143.8
197154.6
198168.4
199181.8
2001102.7
2011121.0

स्थानिक वर्गीकरण (Spatial Classification) में, आंकड़ों को देश, राज्य, शहर, जिला आदि भौगोलिक स्थानों के संदर्भ में वर्गीकृत किया जाता है।

उदाहरण 2 विभिन्न देशों में गेहूं की पैदावार को दर्शाता है।

उदाहरण 2

विभिन्न देशों में गेहूं की पैदावार (2013)

देशगेहूं की पैदावार (किग्रा./हेक्टेयर)
कनाडा3594
चीन5055
फ्रांस7254
जर्मनी7998
भारत3154
पाकिस्तान2787

स्रोत: इंडियन एग्रीकल्चरल स्टेटिस्टिक्स एट अ ग्लांस, 2015

गतिविधियाँ

  • उदाहरण 1 में, उन वर्षों का पता लगाएँ जिनमें भारत की जनसंख्या न्यूनतम और अधिकतम थी,
  • उदाहरण 2 में, उस देश का पता लगाएँ जिसकी गेहूँ की पैदावार भारत की तुलना में थोड़ी अधिक है। यह प्रतिशत के संदर्भ में कितनी होगी?
  • उदाहरण 2 के देशों को पैदावार के आरोही क्रम में व्यवस्थित करें। पैदावार के अवरोही क्रम के लिए भी वही अभ्यास करें।

कभी-कभी आप ऐसी विशेषताओं से मिलते हैं जिन्हें मात्रात्मक रूप से व्यक्त नहीं किया जा सकता। ऐसी विशेषताओं को गुणवत्तापूर्ण या गुणधर्म कहा जाता है। उदाहरण के लिए, राष्ट्रीयता, साक्षरता, धर्म, लिंग, वैवाहिक स्थिति आदि। इन्हें मापा नहीं जा सकता। फिर भी इन गुणधर्मों को किसी गुणात्मक विशेषता की उपस्थिति या अनुपस्थिति के आधार पर वर्गीकृत किया जा सकता है। गुणधर्मों पर आधारित ऐसे आंकड़ों का वर्गीकरण गुणात्मक वर्गीकरण कहलाता है। निम्नलिखित उदाहरण में, हम पाते हैं कि किसी देश की जनसंख्या को गुणात्मक चर “लिंग” के आधार पर समूहबद्ध किया गया है। एक प्रेक्षण या तो पुरुष हो सकता है या महिला। इन दो विशेषताओं को वैवाहिक स्थिति के आधार पर आगे वर्गीकृत किया जा सकता है जैसा नीचे दिया गया है:

उदाहरण 3

पहले चरण का वर्गीकरण किसी लक्षण की उपस्थिति और अनुपस्थिति के आधार पर किया जाता है, अर्थात् पुरुष या पुरुष नहीं (महिला)। दूसरे चरण में, प्रत्येक वर्ग – पुरुष और महिला – को एक अन्य लक्षण की उपस्थिति या अनुपस्थिति के आधार पर और उपवर्गित किया जाता है, अर्थात् विवाहित या अविवाहित। ऊँचाई, वजन, आयु, आय, छात्रों के अंक आदि जैसी विशेषताएँ प्रकृति में मात्रात्मक होती हैं। जब ऐसी विशेषताओं के संग्रहित आँकड़ों को वर्गों में समूहबद्ध किया जाता है, तो यह मात्रात्मक वर्गीकरण बन जाता है।

गतिविधि

  • आस-पास की वस्तुओं को जीवित या अजीवित के रूप में समूहबद्ध किया जा सकता है। क्या यह मात्रात्मक वर्गीकरण है?

उदाहरण 4

100 छात्रों के गणित में अंकों का बारंबारता बंटन

अंकबारंबारता
0-101
10-208
20-306
30-407
40-5021
50-6023
60-7019
70-806
80-905
90-1004
कुल100

उदाहरण 4 तालिका 3.1 में दिए गए 100 छात्रों के गणित के अंकों के मात्रात्मक वर्गीकरण को दर्शाता है।

गतिविधि

  • उदाहरण 4 की बारंबारता मानों को कुल बारंबारता के अनुपात या प्रतिशत के रूप में व्यक्त करें। ध्यान दें कि इस प्रकार व्यक्त की गई बारंबारता को सापेक्ष बारंबारता कहा जाता है।
  • उदाहरण 4 में, किस वर्ग में आँकड़ों की अधिकतम सांद्रता है? इसे कुल प्रेक्षणों के प्रतिशत के रूप में व्यक्त करें। किस वर्ग में आँकड़ों की न्यूनतम सांद्रता है?

4. चर: सतत और विच्छिन्न

एक सरल परिभाषा चर की, जिसे आपने पिछले अध्याय में पढ़ा है, यह नहीं बताती कि यह कैसे बदलता है। चर विशिष्ट मानदंडों के आधार पर भिन्न होते हैं। इन्हें व्यापक रूप से दो प्रकारों में वर्गीकृत किया गया है:

(i) सतत और

(ii) विच्छिन्न।

एक सतत चर कोई भी संख्यात्मक मान ले सकता है। यह पूर्णांक मान $(1,2,3,4, \ldots)$, भिन्न मान $(1 / 2,2 / 3,3 / 4, \ldots)$, और ऐसे मान भी ले सकता है जो ठीक-ठीक भिन्न नहीं होते $(\sqrt{2}=1.414$, $\sqrt{3}=1.732, \ldots, \sqrt{7}=2.645$)। उदाहरण के लिए, किसी विद्यार्थी की ऊँचाई, जैसे-जैसे वह बढ़ता है मान लीजिए $90 \mathrm{~cm}$ से $150 \mathrm{~cm}$ तक, इस बीच की सभी मान लेगी। यह पूर्ण संख्याओं जैसे $90 \mathrm{~cm}, 100 \mathrm{~cm}, 108 \mathrm{~cm}, 150 \mathrm{~cm}$ के रूप में मान ले सकती है। यह भिन्न मान भी ले सकती है जैसे 90.85 $\mathrm{cm}, 102.34 \mathrm{~cm}, 149.99 \mathrm{~cm}$ आदि जो पूर्ण संख्याएँ नहीं हैं। इस प्रकार चर “ऊँचाई” हर संभावित मान प्रदर्शित करने में सक्षम है और इसके मानों को अनंत स्तरों में भी विभाजित किया जा सकता है। सतत चर के अन्य उदाहरण हैं वजन, समय, दूरी आदि।

एक सतत चर के विपरीत, एक विच्छिन्न चर केवल निश्चित मान ही ले सकता है। इसका मान केवल परिमित “छलांगों” से ही बदलता है। यह एक मान से दूसरे मान पर “छलांग” लगाता है लेकिन उनके बीच कोई मध्यवर्ती मान नहीं लेता। उदाहरण के लिए, एक चर जैसे “कक्षा में विद्यार्थियों की संख्या”, विभिन्न कक्षाओं के लिए, केवल पूर्ण संख्याओं के रूप में मान ग्रहण करेगा। यह कोई भिन्नात्मक मान जैसे 0.5 नहीं ले सकता क्योंकि “आधा विद्यार्थी” एक असंगत बात है। इसलिए यह 25 और 26 के बीच 25.5 जैसा मान नहीं ले सकता। इसके बजाय इसका मान या तो 25 हो सकता है या 26। हम देखते हैं कि जैसे ही इसका मान 25 से 26 बदलता है, उनके बीच के मान — भिन्न — इसके द्वारा नहीं लिए जाते। लेकिन हमें यह धारणा नहीं होनी चाहिए कि एक विच्छिन्न चर कोई भिन्नात्मक मान नहीं ले सकता। मान लीजिए $X$ एक चर है जो $1/8, 1/16, 1/32, 1/64, \ldots$ जैसे मान लेता है। क्या यह एक विच्छिन्न चर है? हाँ, क्योंकि यद्यपि $\mathrm{X}$ भिन्नात्मक मान लेता है, यह दो आसन्न भिन्नात्मक मानों के बीच कोई मान नहीं ले सकता। यह $1/8$ से $1/16$ और $1/16$ से $1/32$ पर बदलता या “छलांग” लगाता है। लेकिन यह $1/8$ और $1/16$ या $1/16$ और $1/32$ के बीच कोई मान नहीं ले सकता।

गतिविधि

  • निम्नलिखित चरों को सतत और विच्छिन्न के रूप में भेद कीजिए: क्षेत्रफल, आयतन, तापमान, पासे पर आने वाली संख्या, फसल उत्पादन, जनसंख्या, वर्षा, सड़क पर कारों की संख्या और आयु।

उदाहरण 4 दिखाता है कि किस प्रकार 100 विद्यार्थियों के अंकों को वर्गों में वर्गीकृत किया गया है। आप सोच रहे होंगे कि हमने यह सारणी 3.1 के कच्चे आँकड़ों से कैसे प्राप्त किया। लेकिन इस प्रश्न पर आने से पहले, आपको यह जानना होगा कि बारंबारता बंटन क्या होता है।

5. बारंबारता बंटन क्या है?

बारंबारता बंटन एक मात्रात्मक चर के कच्चे आँकड़ों को वर्गीकृत करने का एक व्यापक तरीका है। यह दर्शाता है कि चर के विभिन्न मान (यहाँ, गणित में प्राप्त अंक) विभिन्न वर्गों में किस प्रकार बँटे हैं और उनके संगत वर्ग बारंबारताएँ क्या हैं। इस स्थिति में हमारे पास अंकों के दस वर्ग हैं: $0-10,10-20, \ldots$, 90-100। वर्ग बारंबारता शब्द का अर्थ है किसी विशेष वर्ग में मानों की संख्या। उदाहरण के लिए, वर्ग 30-40 में हमें सारणी 3.1 के कच्चे आँकड़ों से 7 अंक मिलते हैं। वे हैं $30,37,34,30,35,39,32$। इस प्रकार वर्ग $30-40$ की बारंबारता 7 है। लेकिन आप सोच रहे होंगे कि $40-$ जो कच्चे आँकड़ों में दो बार आ रहा है, वर्ग 30-40 में क्यों नहीं शामिल किया गया। यदि इसे शामिल कर लिया जाता तो वर्ग 30-40 की बारंबारता 7 के स्थान पर 9 होती। यह पहेली आपके लिए स्पष्ट हो जाएगी यदि आप इस अध्याय को धैर्यपूर्वक पढ़ें। इसलिए आगे बढ़िए। आप स्वयं उत्तर पा लेंगे।

प्रत्येक वर्ग आवृत्ति बंटन सारणी में वर्ग सीमाओं से घिरा होता है। वर्ग सीमाएँ किसी वर्ग के दो अंत होते हैं। सबसे छोटा मान निम्न वर्ग सीमा कहलाता है और सबसे बड़ा मान उच्च वर्ग सीमा। उदाहरण के लिए, वर्ग: 60-70 के लिए वर्ग सीमाएँ 60 और 70 हैं। इसकी निम्न वर्ग सीमा 60 है और उच्च वर्ग सीमा 70। वर्ग अंतराल या वर्ग चौड़ाई उच्च वर्ग सीमा और निम्न वर्ग सीमा के बीच का अंतर होता है। वर्ग 60-70 के लिए वर्ग अंतराल 10 है (उच्च वर्ग सीमा घटा निम्न वर्ग सीमा)।

वर्ग मध्य-बिंदु या वर्ग चिह्न किसी वर्ग का मध्य मान होता है। यह वर्ग की निम्न वर्ग सीमा और उच्च वर्ग सीमा के ठीक बीच में आता है और निम्न प्रकार से ज्ञात किया जा सकता है:

वर्ग मध्य-बिंदु या वर्ग चिह्न

$$ \text { = (उच्च वर्ग सीमा + निम्न वर्ग सीमा)/2 } $$

प्रत्येक वर्ग का वर्ग चिह्न या मध्य-मान उस वर्ग को प्रस्तुत करने के लिए प्रयोग किया जाता है। एक बार कच्चे आँकड़ों को वर्गों में समूहबद्ध कर देने के बाद, व्यक्तिगत प्रेक्षण आगे की गणनाओं में प्रयोग नहीं किए जाते। इसके बजाय वर्ग चिह्न का उपयोग किया जाता है।

TABLE 3.3 निम्न वर्ग सीमाएँ, उच्च वर्ग सीमाएँ और वर्ग चिह्न

वर्गआवृत्तिनिचली वर्ग सीमाऊपरी वर्ग सीमावर्ग चिह्न
0-1010105
10-208102015
20-306203025
30-407304035
40-5021405045
50-6023506055
60-7019607065
70-806708075
80-905809085
90-10049010095

आवृत्ति वक्र एक आवृत्ति बंटन का आलेखीय चित्रण है। चित्र 3.1 हमारे उपरोक्त उदाहरण के आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति दिखाता है। आवृत्ति वक्र प्राप्त करने के लिए हम वर्ग चिह्नों को $\mathrm{X}$-अक्ष पर और आवृत्ति को $\mathrm{Y}$-अक्ष पर लेखांकित करते हैं।

चित्र 3.1: आँकड़ों के आवृत्ति बंटन की आरेखीय प्रस्तुति।

आवृत्ति बंटन कैसे तैयार करें

आवृत्ति बंटन तैयार करते समय निम्नलिखित पाँच प्रश्नों का समाधान करना आवश्यक होता है:

  1. क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?
  2. हमें कितने वर्ग होने चाहिए?
  3. प्रत्येक वर्ग का आकार क्या होना चाहिए?
  4. वर्ग सीमाओं का निर्धारण कैसे करें?
  5. प्रत्येक वर्ग के लिए आवृत्ति कैसे प्राप्त करें?

क्या हमें समान या असमान आकार की वर्ग अंतराल रखने चाहिए?

ऐसी दो स्थितियाँ हैं जिनमें असमान आकार के अंतरालों का प्रयोग किया जाता है। पहली, जब हमारे पास आय और अन्य इसी प्रकार के चरों पर आँकड़े हों जहाँ परास बहुत अधिक हो। उदाहरण के लिए, प्रतिदिन आय लगभग शून्य से लेकर सैकड़ों करोड़ रुपये तक हो सकती है। ऐसी स्थिति में समान वर्ग अंतराल उपयुक्त नहीं होते क्योंकि (i) यदि वर्ग अंतराल मध्यम आकार के और समान हों, तो वर्गों की संख्या बहुत अधिक हो जाएगी। (ii) यदि वर्ग अंतराल बड़े हों, तो हम या तो बहुत कम स्तर या बहुत अधिक स्तर की आय की सूचना को दबा देंगे।

दूसरी, यदि परास के एक छोटे भाग में बड़ी संख्या में मान केंद्रित हों, तो समान वर्ग अंतरालों से कई मानों की सूचना की कमी होगी।

अन्य सभी मामलों में, बारंबारता बंटनों में समान आकार के वर्ग अंतरालों का प्रयोग किया जाता है।

हमें कितने वर्ग होने चाहिए?

वर्गों की संख्या सामान्यतः छह से पंद्रह के बीच होती है। यदि हम समान आकार के वर्ग अंतरालों का प्रयोग कर रहे हों, तो वर्गों की संख्या परास (चर के सबसे बड़े और सबसे छोटे मानों के बीच का अंतर) को वर्ग अंतराल के आकार से भाग देकर निकाली जा सकती है।

गतिविधियाँ

निम्नलिखित का परास ज्ञात कीजिए:

  • उदाहरण 1 में भारत की जनसंख्या,
  • उदाहरण 2 में गेहूँ की पैदावार।

प्रत्येक वर्ग का आकार कितना होना चाहिए?

इस प्रश्न का उत्तर पिछले प्रश्न के उत्तर पर निर्भर करता है। चर की सीमा दी गई होने पर, हम वर्ग अंतराल तय करने के बाद वर्गों की संख्या निर्धारित कर सकते हैं। इस प्रकार हम पाते हैं कि ये दोनों निर्णय आपस में जुड़े हुए हैं। हम एक को तय किए बिना दूसरे को तय नहीं कर सकते।

उदाहरण 4 में, हमारे पास वर्गों की संख्या 10 है। सीमा का मान 100 दिया गया है, इसलिए वर्ग अंतराल स्वतः 10 हो जाते हैं। ध्यान दें कि वर्तमान संदर्भ में हमने समान परिमाण के वर्ग अंतराल चुने हैं। हालांकि, हम ऐसे वर्ग अंतराल भी चुन सकते थे जो समान परिमाण के नहीं होते। उस स्थिति में वर्ग असमान चौड़ाई के होते।

हम वर्ग सीमाएँ कैसे निर्धारित करें?

वर्ग सीमाएँ निश्चित और स्पष्ट रूप से बताई जानी चाहिए। सामान्यतः, खुली सीमाएँ जैसे “70 और ऊपर” या “10 से कम” वांछनीय नहीं होती हैं।

निचली और ऊपरी वर्ग सीमाएँ इस प्रकार निर्धारित की जानी चाहिए कि प्रत्येक वर्ग की आवृत्तियाँ वर्ग अंतराल के मध्य में केंद्रित होने की प्रवृत्ति रखें।

वर्ग अंतराल दो प्रकार के होते हैं:

(i) समावेशी वर्ग अंतराल: इस स्थिति में, किसी वर्ग की निचली और ऊपरी सीमा के बराबर मान उसी वर्ग की आवृत्ति में शामिल किए जाते हैं।

(ii) अपवर्जी वर्ग अंतराल: इस स्थिति में, कोई वस्तु जो ऊपरी या निचली वर्ग सीमा के बराबर हो, उस वर्ग की आवृत्ति से बाहर रखी जाती है।

विच्छेद चर के मामले में, अपवर्जी और समावेशी दोनों प्रकार के वर्ग अंतराल प्रयुक्त किए जा सकते हैं।

निरंतर चरों के मामले में समावेशी वर्ग अंतराल बहुत बार प्रयोग किए जाते हैं।

उदाहरण

मान लीजिए हमारे पास एक परीक्षा में छात्रों द्वारा प्राप्त किए गए अंकों का आंकड़ा है और सभी अंक पूर्ण संख्याओं में हैं (भिन्नात्मक अंकों की अनुमति नहीं है)। मान लीजिए छात्रों द्वारा प्राप्त किए गए अंक 0 से 100 तक भिन्न-भिन्न हैं।

यह विच्छिन्न चर का मामला है क्योंकि भिन्नात्मक अंकों की अनुमति नहीं है। इस मामले में, यदि हम समान आकार के वर्ग अंतरालों का प्रयोग कर रहे हैं और 10 वर्ग अंतराल रखने का निर्णय लेते हैं तो वर्ग अंतराल निम्नलिखित में से किसी भी रूप में हो सकते हैं:

समावेशी रूप के वर्ग अंतराल:

$0-10$

$11-20$

$21-30$

$-$

$-$

$91-100$

अपवर्जी रूप के वर्ग अंतराल: $0-10$

$10-20$

$20-30$

$-$

$-$

$90-100$

अपवर्जी वर्ग अंतरालों के मामले में हमें पहले से निर्णय लेना होता है कि यदि हमें कोई मान वर्ग सीमा के बराबर मिलता है तो उसे क्या करना है। उदाहरण के लिए हम निर्णय ले सकते हैं कि 10, 30 आदि जैसे मानों को वर्ग अंतरालों “0 से 10” और “20 से 30” में रखा जाए। इसे निचली सीमा अपवर्जित कहा जा सकता है।

अथवा हम 10, 30 आदि जैसे मानों को वर्ग अंतरालों “10 से 20” और “30 से 40” में रख सकते हैं। इसे ऊपरी सीमा अपवर्जित कहा जा सकता है।

निरंतर चर का उदाहरण

मान लीजिए हमारे पास किसी चर जैसे ऊंचाई (सेंटीमीटर) या वजन (किलोग्राम) पर आंकड़े हैं। यह आंकड़ा निरंतर प्रकार का है। ऐसे मामलों में वर्ग अंतराल निम्नलिखित प्रकार से परिभाषित किए जा सकते हैं:

$30 \mathrm{Kg}-39.999 \ldots \mathrm{Kg}$

$40 \mathrm{Kg}-49.999 \ldots \mathrm{Kg}$

$50 \mathrm{Kg}-59.999 \ldots \mathrm{Kg}$ आदि।

इन वर्ग अंतरालों को निम्नलिढि प्रकार से समझा जाता है:

$30 \mathrm{Kg}$ और इससे ऊपर तथा $40 \mathrm{Kg}$ से कम

$40 \mathrm{Kg}$ और इससे ऊपर तथा $50 \mathrm{Kg}$ से कम

$50 \mathrm{Kg}$ और इससे ऊपर तथा $60 \mathrm{Kg}$ से कम, आदि।

TABLE 3.4 एक कंपनी के 550 कर्मचारियों की आय की बारंबारता बंटन

आय $(रु)$कर्मचारियों की संख्या
800-89950
900-999100
1000-1099200
1100-1199150
1200-129940
1300-139910
कुल550

वर्ग अंतराल में समायोजन

Table 3.4 में समावेशी विधि के सावधानीपूर्वक निरीक्षण से यह स्पष्ट होता है कि यद्यपि चर “आय” एक सतत चर है, फिर भी जब वर्ग बनाए जाते हैं तो ऐसी निरंतरता बनाए नहीं रखी जाती। हमें एक वर्ग की ऊपरी सीमा और अगले वर्ग की निचली सीमा के बीच “अंतराल” या असांतत्यता दिखाई देती है। उदाहरण के लिए, पहले वर्ग की ऊपरी सीमा: 899 और दूसरे वर्ग की निचली सीमा: 900 के बीच हमें 1 का “अंतराल” दिखाई देता है। फिर हम वर्गीकरण करते समय चर की निरंतरता कैसे सुनिश्चित करते हैं? यह वर्ग अंतराल में समायोजन करके प्राप्त किया जाता है। समायोजन निम्नलिढि प्रकार से किया जाता है:

  1. दूसरे वर्ग की निचली सीमा और पहले वर्ग की ऊपरी सीमा के बीच का अंतर निकालें। उदाहरण के लिए, तालिका 3.4 में दूसरे वर्ग की निचली सीमा 900 है और पहले वर्ग की ऊपरी सीमा 899 है। इनके बीच का अंतर 1 है, अर्थात् $(900-899=1)$
  2. (1) में प्राप्त अंतर को दो से विभाजित करें, अर्थात् $(1 / 2=0.5)$
  3. (2) में प्राप्त मान को सभी वर्गों की निचली सीमाओं से घटाएँ (निचली वर्ग सीमा - 0.5)
  4. (2) में प्राप्त मान को सभी वर्गों की ऊपरी सीमाओं में जोड़ें (ऊपरी वर्ग सीमा +0.5$)$।

आवृत्ति बंटन में आंकड़ों की सततता को पुनः स्थापित करने वाले समायोजन के बाद, तालिका 3.4 को तालिका 3.5 में संशोधित किया गया है

वर्ग सीमाओं में समायोजन के बाद, समानता (1) जो वर्ग-चिह्न के मान को निर्धारित करती है, निम्नलिखित के रूप में संशोधित हो जाती है:

समायोजित वर्ग चिह्न = (समायोजित ऊपरी वर्ग सीमा + समायोजित निचली वर्ग सीमा)/2।

तालिका 3.5 एक कंपनी के 550 कर्मचारियों की आय का आवृत्ति बंटन

आय (रु.)कर्मचारियों की संख्या
799.5-899.550
899.5-999.5100
999.5-1099.5200
1099.5-1199.5150
1199.5-1299.540
1299.5-1399.510
कुल550

प्रत्येक वर्ग के लिए आवृत्ति हमें कैसे प्राप्त करनी चाहिए?

सरल शब्दों में, एक प्रेक्षण की बारंबारता का अर्थ है वह प्रेक्षण कच्चे आंकड़ों में कितनी बार आता है। हमारी तालिका 3.1 में हम देखते हैं कि मान 40 तीन बार आता है; 0 और 10 केवल एक-एक बार आते हैं; 49 पाँच बार आता है आदि। इस प्रकार 40 की बारंबारता 3 है, 0 की 1 है, 10 की 1 है, 49 की 5 है आदि। परंतु जब आंकड़ों को वर्गों में समूहबद्ध किया जाता है जैसे उदाहरण 3 में, वर्ग बारंबारता का तात्पर्य किसी विशेष वर्ग में आने वाले मानों की संख्या से है। वर्ग बारंबारता की गिनती संबंधित वर्ग के सामने टैली चिह्न लगाकर की जाती है।

टैली चिह्न लगाकर वर्ग बारंबारता ज्ञात करना

प्रत्येक विद्यार्थी के लिए जिसके अंक उस वर्ग में आते हैं, संबंधित वर्ग के सामने एक टैली (/) लगाया जाता है। उदाहरण के लिए, यदि किसी विद्यार्थी को 57 अंक मिले हैं, हम वर्ग $50-60$ के सामने एक टैली (/) लगाते हैं। यदि अंक 71 हैं, तो वर्ग 70-80 के सामने टैली लगाया जाता है। यदि किसी को 40 अंक मिले हैं, तो वर्ग 40-50 के सामने टैली लगाया जाता है। तालिका 3.6 तालिका 3.1 से गणित में 100 विद्यार्थियों के अंकों की टैली चिह्नन दिखाती है।

TABLE 3.6 Tally Marking of Marks of 100 Students in Mathematics

गिनती को आसान बनाने के लिए चार टैलियों को //// इस प्रकार लगाया जाता है और पाँचवीं टैली को उनके ऊपर इस प्रकार IN रखा जाता है। फिर टैलियों को पाँच-पाँच के समूहों में गिना जाता है। इसलिए यदि किसी वर्ग में 16 टैलियाँ हों, तो सुविधा के लिए हम उन्हें $M N / T N$ IN/ / इस प्रकार लगाते हैं। इस प्रकार किसी वर्ग की बारंबारता उस वर्ग के सामने बनी टैलियों की संख्या के बराबर होती है।

सूचना की हानि

आंकड़ों को बारंबारता बंटन के रूप में वर्गीकृत करने में एक अंतर्निहित कमी होती है। यह कच्चे आंकड़ों को संक्षिप्त और समझने योग्य बनाकर सारांशित तो कर देता है, पर उन विवरणों को नहीं दिखाता जो कच्चे आंकड़ों में मिलते हैं। कच्चे आंकड़ों को वर्गीकृत करने से सूचना की हानि होती है, यद्यपि इसे वर्गीकृत आंकड़े के रूप में सारांशित करके बहुत कुछ हासिल भी होता है। एक बार जब आंकड़ों को वर्गों में समूहीकृत कर दिया जाता है, तब किसी व्यक्तिगत प्रेक्षण की आगे की सांख्यिकीय गणनाओं में कोई महत्त्व नहीं रहता। उदाहरण 4 में, वर्ग 20-30 में 6 प्रेक्षण हैं: $25,25,20,22,25$ और 28। इसलिए जब इन आंकड़ों को बारंबारता बंटन में वर्ग $20-30$ के रूप में समूहीकृत किया जाता है, तो यह केवल उस वर्ग में रिकॉर्डों की संख्या (अर्थात् बारंबारता = 6) देता है, पर उनके वास्तविक मान नहीं देता। इस वर्ग के सभी मानों को वर्ग अंतराल या वर्ग चिह्न के मध्य मान (अर्थात् 25) के बराबर मान लिया जाता है। आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न के मानों पर आधारित होती हैं, न कि उस वर्ग में मौजूद प्रेक्षणों के मानों पर। यह बात अन्य वर्गों के लिए भी सच है। इस प्रकार सांख्यिकीय विधियों में प्रेक्षणों के वास्तविक मानों के स्थान पर वर्ग चिह्न के प्रयोग से पर्याप्त सूचना की हानि होती है। तथापि, कच्चे आंकड़ों को अधिक सार्थक रूप में समझने की क्षमता इस कमी से कहीं अधिक लाभ देती है।

असमान वर्गों के साथ बारंबारता बंटन

अब तक आप समान वर्ग अंतरालों की बारंबारता बंटन से परिचित हैं। आप जानते हैं कि वे कच्चे आंकड़ों से कैसे बनाए जाते हैं। लेकिन कुछ मामलों में असमान वर्ग अंतरालों वाले बारंबारता बंटन अधिक उपयुक्त होते हैं। यदि आप उदाहरण 4 की बारंबारता बंटन को तालिका 3.6 के रूप में देखें, तो आप देखेंगे कि अधिकांश प्रेक्षण वर्गों 40-50, 50-60 और 60-70 में केंद्रित हैं। इनकी संबंधित बारंबारताएँ 21, 23 और 19 हैं। इसका अर्थ है कि 100 छात्रों में से 63 $(21+23+19)$ छात्र इन वर्गों में केंद्रित हैं। इस प्रकार, 63 प्रतिशत 40-70 की मध्य सीमा में हैं। शेष 37 प्रतिशत आंकड़े वर्गों $0-10,10-20,20-30,30-40$, 70-80, 80-90 और 90-100 में हैं। ये वर्ग प्रेक्षणों से विरल आबादित हैं। आगे आप यह भी देखेंगे कि इन वर्गों में प्रेक्षण अपने-अपने वर्ग चिह्नों से अन्य वर्गों की तुलना में अधिक विचलित होते हैं। लेकिन यदि वर्ग इस प्रकार बनाए जाएं कि वर्ग चिह्न, जहाँ तक संभव हो, किसी ऐसे मान से मेल खाएं जिसके आसपास वर्ग में प्रेक्षण केंद्रित होते हैं, तो असमान वर्ग अंतराल अधिक उपयुक्त है।

TABLE 3.7 असमान वर्गों की बारंबारता बंटन

वर्गप्रेक्षणआवृत्तिवर्ग चिह्न
0-10015
10-2010,14,17,12,14,12,14,14815
20-3025,25,20,22,25,28625
30-4030,37,34,39,32,30,35735
40-4542,44,40,44,41,40,43,40,41942.5
45-5047,49,49,45,45,47,49,46,48,48,49,491247.5
50-5551,53,51,50,51,50,54752.5
55-6059,56,55,57,55,56,59,56,59,57,59,55,56,55,56,551657.5
60-6560,64,62,64,64,60,62,61,60,621062.5
65-7066,69,66,69,66,65,65,66,65967.5
70-8070,75,70,76,70,71675
80-9082,82,82,80,85585
90-10090,100,90,90495
योग100

तालिका 3.7 तालिका 3.6 की उसी बारंबारता बंटन को असमान वर्गों के रूप में दिखाती है। प्रत्येक वर्ग 40-50, 50-60 और 60-70 को दो-दो वर्गों में बाँटा गया है—वर्ग 40-50 को $40-45$ और 45-50 में विभाजित किया गया है। वर्ग 50-60 को 50-55 और 55-60 में बाँटा गया है। और वर्ग 60-70 को 60-65 और 65-70 में बाँटा गया है। नए वर्ग 40-45, 45-50, 50-55, 55-60, 60-65 और 65-70 की वर्ग अंतराल 5 है। अन्य वर्ग: 0-10, 10-20, 20-30, 30-40, 70-80, 80-90 और 90-100 अपने पुराने वर्ग अंतराल 10 को बरकरार रखते हैं। इस तालिका का अंतिम स्तंभ इन वर्गों के लिए वर्ग चिह्नों के नए मान दिखाता है। इनकी तुलना तालिका 3.6 में वर्ग चिह्नों के पुराने मानों से करें। ध्यान दें कि इन वर्गों में प्रेक्षण अपने पुराने वर्ग चिह्न मानों की तुलना में नए वर्ग चिह्न मानों से कम विचलित हैं। इस प्रकार नए वर्ग चिह्न मान इन वर्गों में आँकड़ों के लिए पुराने मानों की तुलना में अधिक प्रतिनिधि हैं।

आकृति 3.2 तालिका 3.7 की बंटन की बारंबारता वक्र दिखाती है।

आकृति 3.2: बारंबारता वक्र

तालिका के वर्ग चिह्न X-अक्ष पर और बारंबारताएँ Y-अक्ष पर आलेखित की गई हैं।

गतिविधि

  • यदि आप आकृति 3.2 की तुलना आकृति 3.1 से करें, तो आप क्या देखते हैं? क्या आपको इनमें कोई अंतर दिखता है? क्या आप इस अंतर की व्याख्या कर सकते हैं?

बारंबारता सरणी

अब तक हमने 100 विद्यार्थियों के गणित में प्रतिशत अंकों के उदाहरण का उपयोग करके एक सतत चर के लिए आँकड़ों के वर्गीकरण पर चर्चा की है। एक विचर चर (discrete variable) के आँकड़ों के वर्गीकरण को बारंबारता सरणी (Frequency Array) कहा जाता है। चूँकि एक विचर चर मान लेता है और दो पूर्णांक मानों के बीच कोई अंशीय मान नहीं लेता, इसलिए प्रत्येक पूर्णांक मान के अनुरूप बारंबारताएँ होती हैं।

तालिका 3.8 में दिया गया उदाहरण एक बारंबारता सरणी को दर्शाता है।

तालिका 3.8 परिवार के आकार की बारंबारता सरणी

परिवार का आकारपरिवारों की संख्या
15
215
325
435
510
65
73
82
योग100

चर “परिवार का आकार” एक विचर चर है जो केवल पूर्णांक मान लेता है जैसा कि तालिका में दिखाया गया है।

6. द्विचर बारंबारता बंटन (Bivariate Frequency Distribution)

अक्सर जब हम किसी जनसंख्या से एक प्रतिदर्श लेते हैं, तो प्रतिदर्श के प्रत्येक तत्व से एक से अधिक प्रकार की सूचना एकत्र करते हैं। उदाहरण के लिए, मान लीजिए हमने किसी शहर में आधारित कंपनियों की सूची से 20 कंपनियों का प्रतिदर्श लिया है। मान लीजिए कि हमने प्रत्येक कंपनी से बिक्री और विज्ञापन पर व्यय की सूचना एकत्र की है। इस स्थिति में, हमारे पास द्विचर प्रतिदर्श आँकड़े (bivariate sample data) हैं। ऐसे द्विचर आँकड़ों को द्विचर बारंबारता बंटन का उपयोग करके संक्षेप में प्रस्तुत किया जा सकता है।

द्विचर बारंबारता बंटन को दो चरों के बारंबारता बंटन के रूप में परिभाषित किया जा सकता है।

तालिका 3.9 दो चरों, 20 कंपनियों की बिक्री और विज्ञापन व्यय (रु. लाख में) की आवृत्ति बंटन दिखाती है। बिक्री के मानों को विभिन्न स्तंभों में और विज्ञापन व्यय के मानों को विभिन्न पंक्तियों में वर्गीकृत किया गया है। प्रत्येक कोशिका संगत पंक्ति और स्तंभ मानों की आवृत्ति दिखाती है। उदाहरण के लिए, 3 ऐसी फर्में हैं जिनकी बिक्री रु 135 से रु 145 लाख के बीच है और उनका विज्ञापन व्यय रु 64 से रु 66 हजार के बीच है। द्विचर बंटन के उपयोग को सहसंबंध पर अध्याय 8 में लिया जाएगा।

7. निष्कर्ष

प्राथमिक और द्वितीय स्रोतों से एकत्र किए गए आंकड़े कच्चे या अवर्गीकृत होते हैं। एक बार आंकड़े एकत्र हो जाने पर, अगला कदम उन्हें आगे के सांख्यिकीय विश्लेषण के लिए वर्गीकृत करना होता है। वर्गीकरण आंकड़ों में क्रम लाता है। यह अध्याय आपको यह जानने में सक्षम बनाता है कि आंकड़ों को आवृत्ति बंटन के माध्यम से समग्र रूप से कैसे वर्गीकृत किया जा सकता है। एक बार जब आप वर्गीकरण की तकनीकों को जान लेते हैं, तो आपके लिए सतत और विच्छिन्न चरों दोनों के लिए आवृत्ति बंटन बनाना आसान हो जाएगा।

तालिका 3.9 20 फर्मों की बिक्री (लाख रु में) और विज्ञापन व्यय (हजार रु में) का द्विचर आवृत्ति बंटन

115–125125–135135–145145–155155–165165–175योग
62-64213
64-66134
66-6811215
68-70224
70-7211114
योग45631120

सारांश

  • वर्गीकरण कच्चे आँकड़ों में क्रम लाता है।
  • एक बारंबारता बंटन यह दर्शाता है कि किसी चर के भिन्न-भिन्न मान भिन्न-भिन्न वर्गों में किस प्रकार बँटे हैं तथा उनके संगत वर्ग बारंबारताएँ क्या हैं।
  • अपवर्जी विधि में या तो ऊपरी वर्ग सीमा या निचली वर्ग सीमा को बाहर रखा जाता है।
  • समावेशी विधि में ऊपरी तथा निचली दोनों वर्ग सीमाएँ सम्मिलित की जाती हैं।
  • बारंबारता बंटन में आगे की सांख्यिकीय गणनाएँ केवल वर्ग चिह्न मानों पर आधारित होती हैं, प्रेक्षणों के मानों पर नहीं।
  • वर्गों को इस प्रकार बनाना चाहिए कि प्रत्येक वर्ग का वर्ग चिह्न उस मान के यथासंभव निकट आए, जिसके चारों ओर वर्ग में प्रेक्षण एकत्रित होते हैं।

अभ्यास

1. निम्नलिखित में से कौन-सा विकल्प सत्य है?

(i) वर्ग मध्य-बिंदु बराबर होता है:

(a) ऊपरी वर्ग सीमा तथा निचली वर्ग सीला के औसत के।

(b) ऊपरी वर्ग सीमा तथा निचली वर्ग सीमा के गुणनफल के।

(c) ऊपरी वर्ग सीमा तथा निचली वर्ग सीमा के अनुपात के।

(d) उपर्युक्त में से किसी के भी नहीं।

(ii) दो चरों का बारंबारता बंटन कहलाता है

(a) एकचर बंटन

(b) द्विचर बंटन

(c) बहुचर बंटन

(d) उपर्युक्त में से कोई नहीं

(iii) वर्गीकृत आँकड़ों में सांख्यिकीय गणनाएँ आधारित होती हैं

(a) प्रेक्षणों के वास्तविक मानों पर

(b) ऊपरी वर्ग सीमाओं पर

(c) निचली वर्ग सीमाओं पर

(d) वर्ग मध्य-बिंदुओं पर

(iv) परास है

(a) सबसे बड़े और सबसे छोटे प्रेक्षणों के बीच का अंतर

(b) सबसे छोटे और सबसे बड़े प्रेक्षणों के बीच का अंतर

(c) सबसे बड़े और सबसे छोटे प्रेक्षणों का औसत

(d) सबसे बड़े को सबसे छोटे प्रेक्षण से अनुपात

2. क्या चीज़ों को वर्गीकृत करने का कोई लाभ हो सकता है? अपने दैनिक जीवन के किसी उदाहरण के साथ समझाइए।

3. चर क्या होता है? विचर और संचर चर के बीच अंतर बताइए।

4. आँकड़ों के वर्गीकरण में प्रयुक्त ‘अपवर्जी’ और ‘अंतर्भारी’ विधियों की व्याख्या कीजिए।

5. सारणी 3.2 में दिए गए 50 परिवारों के भोजन पर मासिक घरेलू व्यय (रुपयों में) से संबंधित आँकड़ों का प्रयोग कीजिए और

(i) भोजन पर मासिक घरेलू व्यय की परास प्राप्त कीजिए।

(ii) परास को उपयुक्त संख्या में वर्ग अंतरालों में बाँटिए और व्यय की बारंबारता बंटन प्राप्त कीजिए।

(iii) उन परिवारों की संख्या ज्ञात कीजिए जिनका भोजन पर मासिक व्यय

(a) रु 2000 से कम है

(b) रु 3000 से अधिक है

(c) रु 1500 और रु 2500 के बीच है

6. एक शहर में 45 परिवारों से उनके द्वारा प्रयुक्त सेल फोनों की संख्या के लिए सर्वेक्षण किया गया। नीचे दर्ज उनकी प्रतिक्रियाओं के आधार पर एक बारंबारता सरणी तैयार कीजिए।

132222121223333
332322616215153
242742434203143

7. वर्गीकृत आँकड़ों में ‘सूचना की हानि’ क्या होती है?

8. क्या आप सहमत हैं कि वर्गीकृत आँकड़े कच्चे आँकड़ों से बेहतर होते हैं? क्यों?

9. एकचर और द्विचर बारंबारता बंटन के बीच अंतर स्पष्ट कीजिए।

10. निम्नलिखित आँकड़ों से 7 की वर्ग-अंतराल लेकर समावेशी विधि द्वारा एक बारंबारता बंटन तैयार कीजिए।

281715222921232718127294
1831052016128433272115
33627189246323129181413
151197153732282624201925
192069

11. “The quick brown fox jumps over the lazy dog” उपरोक्त वाक्य को ध्यान से देखिए और प्रत्येक शब्द में अक्षरों की संख्या को नोट कीजिए। अक्षरों की संख्या को एक चर मानकर इस आँकड़े के लिए एक बारंबारता सरणी तैयार कीजिए।

सुझाई गई गतिविधि

  • अपनी पुरानी अंक-पत्रिकाओं से पिछली कक्षा की अर्धवार्षिक या वार्षिक परीक्षाओं में गणित विषय में प्राप्त अंक देखें। उन्हें वर्षवार व्यवस्थित करें। जाँचें कि क्या आपने इस विषय में प्राप्त किए गए अंक एक चर हैं या नहीं। यह भी देखें कि क्या वर्षों के दौरान आपने गणित में सुधार किया है।