कौन बड़ा डेटा एकत्र करता है और क्यों?

2019 के पतन में, Apple कार्ड सेवा के साथ एक घोटाला हुआ: पंजीकरण करते समय, इसने पुरुषों और महिलाओं के लिए अलग-अलग क्रेडिट सीमाएँ जारी कीं। यहां तक कि स्टीव वोज्नियाक भी किस्मत से बाहर थे:

एक साल पहले, यह पता चला था कि नेटफ्लिक्स प्लेटफ़ॉर्म उपयोगकर्ताओं को उनके लिंग, आयु और राष्ट्रीयता के आधार पर अलग-अलग पोस्टर और टीज़र दिखाता है। इसके लिए सेवा पर नस्लवाद का आरोप लगाया गया था।

अंत में, फेसबुक द्वारा अपने उपयोगकर्ताओं के डेटा को कथित रूप से एकत्र करने, बेचने और हेरफेर करने के लिए मार्क जुकरबर्ग को नियमित रूप से फटकार लगाई जाती है। इन वर्षों में, उन पर आरोप लगाया गया और यहां तक कि अमेरिकी चुनावों के दौरान हेरफेर करने, रूसी विशेष सेवाओं का समर्थन करने, नफरत और कट्टरपंथी विचारों को उकसाने, अनुचित विज्ञापन, उपयोगकर्ता डेटा लीक करने, पीडोफाइल के खिलाफ जांच में बाधा डालने का प्रयास किया गया।

ज़क द्वारा फेसबुक पोस्ट

उसी समय, पोर्नहब ऑनलाइन सेवा सालाना रिपोर्ट प्रकाशित करती है कि विभिन्न राष्ट्रीयताओं, लिंग और उम्र के लोग किस तरह के पोर्न की तलाश कर रहे हैं। और किसी कारण से यह किसी को परेशान नहीं करता। हालाँकि ये सभी कहानियाँ समान हैं: उनमें से प्रत्येक में हम बड़े डेटा के साथ काम कर रहे हैं, जिसे XNUMX वीं सदी में "नया तेल" कहा जाता है।

बड़ा डेटा क्या है

बड़ा डेटा - वे बड़े डेटा भी हैं (इंग्लैंड। बिग डेटा) या मेटाडेटा - डेटा की एक सरणी है जो नियमित रूप से और बड़ी मात्रा में आती है। उन्हें एकत्र, संसाधित और विश्लेषण किया जाता है, जिसके परिणामस्वरूप स्पष्ट मॉडल और पैटर्न होते हैं।

लार्ज हैड्रोन कोलाइडर से प्राप्त डेटा एक उल्लेखनीय उदाहरण है, जो लगातार और बड़ी मात्रा में आता है। उनकी मदद से वैज्ञानिक कई समस्याओं का समाधान करते हैं।

लेकिन वेब पर बड़ा डेटा केवल वैज्ञानिक अनुसंधान के आंकड़े नहीं हैं। उनका उपयोग यह ट्रैक करने के लिए किया जा सकता है कि विभिन्न समूहों और राष्ट्रीयताओं के उपयोगकर्ता कैसे व्यवहार करते हैं, वे किस पर ध्यान देते हैं और सामग्री के साथ कैसे इंटरैक्ट करते हैं। कभी-कभी, इसके लिए डेटा एक स्रोत से नहीं, बल्कि कई स्रोतों से एकत्र किया जाता है, कुछ पैटर्न की तुलना और पहचान की जाती है।

नेटवर्क पर बड़ा डेटा कितना महत्वपूर्ण है, इस बारे में बात करना शुरू कर दिया जब वास्तव में बहुत कुछ था। 2020 की शुरुआत में, दुनिया में 4,5 बिलियन इंटरनेट उपयोगकर्ता थे, जिनमें से 3,8 बिलियन सोशल नेटवर्क में पंजीकृत थे।

बिग डेटा तक किसकी पहुंच है

सर्वेक्षणों के अनुसार, हमारे आधे से अधिक देशों का मानना है कि नेटवर्क पर उनके डेटा का उपयोग तीसरे पक्ष द्वारा किया जाता है। उसी समय, कई सामाजिक नेटवर्क और एप्लिकेशन पर व्यक्तिगत जानकारी, फोटो और यहां तक कि एक फोन नंबर भी पोस्ट करते हैं।

इसे यहाँ स्पष्ट करने की आवश्यकता है: पहला व्यक्ति स्वयं उपयोगकर्ता है, जो अपने डेटा को किसी संसाधन या एप्लिकेशन पर रखता है। उसी समय, वह इस डेटा के प्रसंस्करण के लिए सहमत होता है (अनुबंध में टिक लगाता है)। दूसरी पार्टी - यानी संसाधन के मालिक. एक तृतीय पक्ष वह है जिसे संसाधन के स्वामी उपयोगकर्ता डेटा को स्थानांतरित या बेच सकते हैं. अक्सर यह यूजर एग्रीमेंट में लिखा होता है, लेकिन हमेशा नहीं।

तीसरी पार्टी सरकारी एजेंसियां, हैकर्स या कंपनियां हैं जो व्यावसायिक उद्देश्यों के लिए डेटा खरीदती हैं। पूर्व अदालत या उच्च प्राधिकारी के निर्णय से डेटा प्राप्त कर सकता है। बेशक, हैकर्स किसी भी अनुमति का उपयोग नहीं करते - वे बस सर्वर पर संग्रहीत डेटाबेस को हैक कर लेते हैं। कंपनियां (कानून द्वारा) डेटा तक केवल तभी पहुंच सकती हैं जब आपने स्वयं उन्हें अनुमति दी हो - समझौते के तहत बॉक्स को चेक करके। अन्यथा, यह अवैध है।

कंपनियां बिग डेटा का उपयोग क्यों करती हैं?

वाणिज्यिक क्षेत्र में बड़े डेटा का उपयोग दशकों से किया जा रहा है, यह अभी उतना तीव्र नहीं था जितना अब है। उदाहरण के लिए, निगरानी कैमरों से रिकॉर्ड, जीपीएस नेविगेटर से डेटा या ऑनलाइन भुगतान। अब, सामाजिक नेटवर्क, ऑनलाइन सेवाओं और एप्लिकेशन के विकास के साथ, यह सब जोड़ा जा सकता है और सबसे संपूर्ण चित्र प्राप्त किया जा सकता है: जहां संभावित ग्राहक रहते हैं, वे क्या देखना पसंद करते हैं, वे छुट्टी पर कहां जाते हैं और उनके पास किस ब्रांड की कार है।

उपरोक्त उदाहरणों से यह स्पष्ट है कि बिग डेटा की मदद से कंपनियां सबसे पहले विज्ञापनों को लक्षित करना चाहती हैं। यानी, उत्पादों, सेवाओं या व्यक्तिगत विकल्पों को केवल सही दर्शकों के लिए पेश करना और यहां तक कि किसी विशिष्ट उपयोगकर्ता के लिए उत्पाद को अनुकूलित करना। इसके अलावा, फेसबुक और अन्य बड़े प्लेटफार्मों पर विज्ञापन अधिक से अधिक महंगा होता जा रहा है, और इसे सभी को एक पंक्ति में दिखाना बिल्कुल भी लाभदायक नहीं है।

खुले स्रोतों से संभावित ग्राहकों के बारे में जानकारी बीमा कंपनियों, निजी क्लीनिकों और नियोक्ताओं द्वारा सक्रिय रूप से उपयोग की जाती है। पूर्व, उदाहरण के लिए, बीमा की शर्तों को बदल सकता है यदि वे देखते हैं कि आप अक्सर कुछ बीमारियों या दवाओं के बारे में जानकारी ढूंढ रहे हैं, और नियोक्ता यह आकलन कर सकते हैं कि क्या आप संघर्ष और असामाजिक व्यवहार से ग्रस्त हैं।

लेकिन एक और महत्वपूर्ण कार्य है जो हाल के वर्षों में संघर्ष कर रहा है: सबसे अधिक विलायक दर्शकों के करीब आने के लिए। ऐसा करना इतना आसान नहीं है, हालांकि एकल ओएफडी (राजकोषीय डेटा ऑपरेटर) के माध्यम से भुगतान सेवाओं और इलेक्ट्रॉनिक चेक द्वारा कार्य को काफी सुगम बनाया गया है। जितना संभव हो उतना करीब आने के लिए, कंपनियां बचपन से ही संभावित ग्राहकों को ट्रैक करने और "पोषण" करने की कोशिश करती हैं।: ऑनलाइन गेम, इंटरैक्टिव खिलौनों और शैक्षिक सेवाओं के माध्यम से।

यह कैसे काम करता है?

डेटा संग्रह के सबसे बड़े अवसर वैश्विक निगमों से हैं जो एक साथ कई सेवाओं के स्वामी हैं। फेसबुक के अब 2,5 बिलियन से अधिक सक्रिय उपयोगकर्ता हैं। इसी समय, कंपनी अन्य सेवाओं का भी मालिक है: इंस्टाग्राम - 1 बिलियन से अधिक, व्हाट्सएप - 2 बिलियन से अधिक और अन्य।

लेकिन Google का और भी अधिक प्रभाव है: दुनिया में 1,5 बिलियन लोगों द्वारा Gmail का उपयोग किया जाता है, अन्य 2,5 बिलियन Android मोबाइल OS द्वारा, 2 बिलियन से अधिक YouTube द्वारा। और वह Google खोज और Google मानचित्र ऐप्स, Google Play स्टोर और Chrome ब्राउज़र की गिनती नहीं कर रहा है। यह आपके ऑनलाइन बैंक को मजबूत करने के लिए बनी हुई है - और Google आपके बारे में सचमुच सब कुछ जानने में सक्षम होगा। वैसे, यांडेक्स पहले से ही इस संबंध में एक कदम आगे है, लेकिन इसमें केवल रूसी भाषी दर्शकों को शामिल किया गया है।

???? सबसे पहले, कंपनियां इस बात में रुचि रखती हैं कि हम सोशल नेटवर्क पर क्या पोस्ट और पसंद करते हैं। उदाहरण के लिए, यदि बैंक देखता है कि आप शादीशुदा हैं और सक्रिय रूप से इंस्टाग्राम या टिंडर पर लड़कियों को पसंद कर रहे हैं, तो आपके द्वारा उपभोक्ता ऋण स्वीकृत किए जाने की अधिक संभावना है। और परिवार पर से कर्ज उतर गया।

यह भी महत्वपूर्ण है कि आप किन विज्ञापनों पर क्लिक करते हैं, कितनी बार और किस परिणाम के साथ।

(Ie अगला चरण निजी संदेश है: उनमें बहुत अधिक जानकारी होती है। VKontakte, Facebook, WhatsApp और अन्य तत्काल दूतों पर संदेश लीक हो गए। उनके मुताबिक वैसे तो मैसेज भेजते समय जियोलोकेशन को ट्रैक करना आसान होता है। निश्चित रूप से आपने ध्यान दिया होगा: जब आप किसी के साथ कुछ खरीदने या पिज्जा ऑर्डर करने के बारे में चर्चा करते हैं, तो प्रासंगिक विज्ञापन तुरंत फ़ीड में दिखाई देते हैं।

🚕 बड़ा डेटा सक्रिय रूप से उपयोग किया जाता है और डिलीवरी और टैक्सी सेवाओं द्वारा "लीक" किया जाता है। वे जानते हैं कि आप कहां रहते हैं और काम करते हैं, आप किस चीज से प्यार करते हैं, आपकी अनुमानित आय क्या है। उबेर, उदाहरण के लिए, यदि आप बार से घर चला रहे हैं और जाहिर तौर पर ओवरडोन कर रहे हैं तो कीमत अधिक है। और जब आपके फोन पर अन्य एग्रीगेटर्स का एक समूह होता है, तो इसके विपरीत, वे सस्ते वाले पेश करेंगे।

(Ie ऐसी सेवाएँ हैं जो अधिक से अधिक जानकारी एकत्र करने के लिए फ़ोटो और वीडियो का उपयोग करती हैं। उदाहरण के लिए, कंप्यूटर विज़न लाइब्रेरी - Google के पास एक है। वे आपको और आपके आस-पास को यह देखने के लिए स्कैन करते हैं कि आप किस आकार या ऊंचाई के हैं, आप कौन से ब्रांड पहनते हैं, आप कौन सी कार चलाते हैं, चाहे आपके बच्चे हों या पालतू जानवर।

(Ie जो लोग बैंकों को उनके मेलिंग के लिए एसएमएस गेटवे प्रदान करते हैं, वे कार्ड पर आपकी खरीदारी को ट्रैक कर सकते हैं - अंतिम 4 अंक और एक फोन नंबर जानना - और फिर इस डेटा को किसी और को बेच दें। इसलिए उपहार के रूप में छूट और पिज्जा के साथ यह सब स्पैम।

🤷️️ अंत में, हम स्वयं अपने डेटा को बाईं सेवाओं और एप्लिकेशन में लीक कर देते हैं। Getcontact के आसपास उस प्रचार को याद रखें, जब हर कोई यह जानने के लिए अपना फोन नंबर भरकर खुश था कि यह दूसरों के द्वारा कैसे लिखा गया था। और अब उनका समझौता खोजें और पढ़ें कि यह आपके डेटा के हस्तांतरण के बारे में क्या कहता है (बिगाड़ने वाला: मालिक उन्हें अपने विवेक पर तीसरे पक्ष को स्थानांतरित कर सकते हैं):

निगम वर्षों तक सफलतापूर्वक उपयोगकर्ता डेटा एकत्र कर सकते हैं और बेच भी सकते हैं, जब तक कि मुकदमा न हो - जैसा कि उसी फेसबुक के साथ हुआ था। और फिर निर्णायक भूमिका कंपनी द्वारा GDPR के उल्लंघन द्वारा निभाई गई - यूरोपीय संघ में एक कानून जो डेटा के उपयोग को अमेरिकी की तुलना में बहुत अधिक सख्ती से प्रतिबंधित करता है। एक और हालिया उदाहरण अवास्ट एंटीवायरस स्कैंडल है: कंपनी की सहायक सेवाओं में से एक ने 100 से 400 मिलियन उपयोगकर्ताओं का डेटा एकत्र और बेचा।

लेकिन क्या इन सबका हमारे लिए कोई फायदा है?

कितना बड़ा डेटा हम सभी की मदद करता है?

हां, इसका एक उजला पक्ष भी है।

बिग डेटा अपराधियों को पकड़ने और आतंकवादी हमलों को रोकने, लापता बच्चों को खोजने और उन्हें खतरे से बचाने में मदद करता है।

उनकी मदद से हम हम बैंकों और व्यक्तिगत छूट से अच्छे प्रस्ताव प्राप्त करते हैं. उनका धन्यवाद हम हम कई सेवाओं और सामाजिक नेटवर्क के लिए भुगतान नहीं करते हैं जो केवल विज्ञापन पर कमाते हैं. अन्यथा, अकेले इंस्टाग्राम पर हमें एक महीने में कई हजार डॉलर खर्च करने पड़ेंगे।

अकेले फेसबुक के 2,4 बिलियन सक्रिय उपयोगकर्ता हैं। वहीं, 2019 में उनका मुनाफा 18,5 अरब डॉलर रहा। यह पता चला है कि कंपनी विज्ञापन के माध्यम से प्रत्येक उपयोगकर्ता से प्रति वर्ष $7,7 तक कमाती है।

अंत में, कभी-कभी यह केवल सुविधाजनक होता है: जब सेवाओं को पहले से ही पता होता है कि आप कहां हैं और आप क्या चाहते हैं, और आपको अपने लिए आवश्यक जानकारी की तलाश करने की आवश्यकता नहीं है।

बिग डेटा के अनुप्रयोग के लिए एक अन्य आशाजनक क्षेत्र शिक्षा है।

वर्जीनिया में अमेरिकी विश्वविद्यालयों में से एक में तथाकथित जोखिम समूह के छात्रों पर डेटा एकत्र करने के लिए एक अध्ययन किया गया था। ये वे हैं जो खराब अध्ययन करते हैं, कक्षाओं को याद करते हैं और बाहर निकलने वाले हैं। हकीकत यह है कि राज्यों में हर साल करीब 400 लोगों की कटौती की जाती है। यह विश्वविद्यालयों के लिए बुरा है, जिनकी रेटिंग कम हो गई है और उनकी फंडिंग में कटौती हुई है, और स्वयं छात्रों के लिए: कई शिक्षा के लिए ऋण लेते हैं, जो कटौती के बाद भी चुकाना होगा। खोए हुए समय और करियर की संभावनाओं का जिक्र नहीं। बड़े डेटा की मदद से, समय के पिछड़ने की पहचान करना और उन्हें एक ट्यूटर, अतिरिक्त कक्षाएं और अन्य लक्षित सहायता प्रदान करना संभव है।

यह, वैसे, स्कूलों के लिए भी उपयुक्त है: तब सिस्टम शिक्षकों और माता-पिता को सूचित करेगा - वे कहते हैं, बच्चे को समस्या है, चलो उसकी मदद करें। बिग डेटा आपको यह समझने में भी मदद करेगा कि कौन सी पाठ्यपुस्तकें बेहतर काम करती हैं और कौन से शिक्षक सामग्री को अधिक आसानी से समझाते हैं।

एक और सकारात्मक उदाहरण करियर प्रोफाइलिंग है।: यह तब होता है जब किशोरों को उनके भविष्य के पेशे के बारे में निर्णय लेने में मदद की जाती है। यहां, बड़ा डेटा आपको ऐसी जानकारी एकत्र करने की अनुमति देता है जिसे पारंपरिक परीक्षणों का उपयोग करके प्राप्त नहीं किया जा सकता है: उपयोगकर्ता कैसे व्यवहार करता है, वह किस पर ध्यान देता है, वह सामग्री के साथ कैसे इंटरैक्ट करता है।

उसी यूएसए में, एक कैरियर मार्गदर्शन कार्यक्रम है - SC ACCELERATE। यह, अन्य बातों के अलावा, करियरचॉइस जीपीएस तकनीक का उपयोग करता है: वे छात्रों की प्रकृति, विषयों के प्रति उनके झुकाव, ताकत और कमजोरियों के बारे में डेटा का विश्लेषण करते हैं। डेटा का उपयोग किशोरों को उनके लिए सही कॉलेज चुनने में मदद करने के लिए किया जाता है।

Yandex.Zen पर हमें सब्सक्राइब करें और फॉलो करें — टेक्नोलॉजी, इनोवेशन, इकोनॉमिक्स, एजुकेशन और शेयरिंग इन वन चैनल।

कौन बड़ा डेटा एकत्र करता है और क्यों?

एक जवाब लिखें