डेटा की तरह स्वीकार करें: व्यवसाय बड़े डेटा से लाभ कैसे सीखते हैं

बड़े डेटा का विश्लेषण करके, कंपनियां छिपे हुए पैटर्न को उजागर करना सीखती हैं, जिससे उनके व्यावसायिक प्रदर्शन में सुधार होता है। दिशा फैशनेबल हैं, लेकिन उनके साथ काम करने की संस्कृति की कमी के कारण हर कोई बड़े डेटा से लाभ नहीं उठा सकता है

"किसी व्यक्ति का नाम जितना अधिक सामान्य होगा, उसके द्वारा समय पर भुगतान किए जाने की संभावना उतनी ही अधिक होगी। आपके घर में जितनी अधिक मंजिलें होंगी, सांख्यिकीय रूप से आप उतने ही बेहतर कर्जदार होंगे। उधारकर्ताओं के व्यवहार में अप्रत्याशित पैटर्न के बारे में, होम क्रेडिट बैंक के एक विश्लेषक स्टैनिस्लाव डुज़िन्स्की कहते हैं, "राशि वापसी की संभावना पर राशि चक्र के संकेत का लगभग कोई प्रभाव नहीं पड़ता है, लेकिन मनोविज्ञान महत्वपूर्ण रूप से करता है।" वह इनमें से कई प्रतिमानों की व्याख्या करने का उपक्रम नहीं करता है - वे कृत्रिम बुद्धिमत्ता द्वारा प्रकट किए गए थे, जिसने हजारों ग्राहक प्रोफाइल को संसाधित किया।

यह बड़े डेटा एनालिटिक्स की शक्ति है: बड़ी मात्रा में असंरचित डेटा का विश्लेषण करके, कार्यक्रम कई सहसंबंधों की खोज कर सकता है, जिनके बारे में सबसे बुद्धिमान मानव विश्लेषक को पता भी नहीं है। किसी भी कंपनी के पास बड़ी मात्रा में असंरचित डेटा (बिग डेटा) होता है - कर्मचारियों, ग्राहकों, भागीदारों, प्रतिस्पर्धियों के बारे में, जिनका उपयोग व्यावसायिक लाभ के लिए किया जा सकता है: पदोन्नति के प्रभाव में सुधार, बिक्री में वृद्धि हासिल करना, कर्मचारियों के कारोबार को कम करना आदि।

बड़े डेटा के साथ काम करने वाले पहले बड़ी प्रौद्योगिकी और दूरसंचार कंपनियां, वित्तीय संस्थान और खुदरा थे, डेलॉयट टेक्नोलॉजी इंटीग्रेशन ग्रुप, सीआईएस के निदेशक राफेल मिफ्ताखोव टिप्पणी करते हैं। अब कई उद्योगों में ऐसे समाधानों में रुचि है। कंपनियों ने क्या हासिल किया है? और क्या बड़ा डेटा विश्लेषण हमेशा मूल्यवान निष्कर्ष की ओर ले जाता है?

आसान भार नहीं है

बैंक मुख्य रूप से ग्राहकों के अनुभव को बेहतर बनाने और लागत का अनुकूलन करने के साथ-साथ जोखिम और मुकाबला धोखाधड़ी का प्रबंधन करने के लिए बड़े डेटा एल्गोरिदम का उपयोग करते हैं। "हाल के वर्षों में, बड़े डेटा विश्लेषण के क्षेत्र में एक वास्तविक क्रांति हुई है," डज़िन्स्की कहते हैं। "मशीन लर्निंग का उपयोग हमें ऋण डिफ़ॉल्ट की संभावना का अधिक सटीक रूप से अनुमान लगाने की अनुमति देता है - हमारे बैंक में अपराध केवल 3,9% है।" तुलना के लिए, 1 जनवरी, 2019 तक, सेंट्रल बैंक के अनुसार, व्यक्तियों को जारी किए गए ऋणों पर 90 दिनों से अधिक के अतिदेय भुगतान वाले ऋणों की हिस्सेदारी 5% थी।

माइक्रोफाइनेंस संगठन भी बड़े डेटा के अध्ययन से हैरान हैं। ऑनलाइन लेंडिंग प्लेटफॉर्म वेबबैंकिर के सीईओ एंड्री पोनोमारेव कहते हैं, "बिना बड़े डेटा का विश्लेषण किए आज वित्तीय सेवाएं देना बिना नंबर के गणित करने जैसा है।" "हम ग्राहक या उसके पासपोर्ट को देखे बिना ऑनलाइन पैसा जारी करते हैं, और पारंपरिक उधार के विपरीत, हमें न केवल किसी व्यक्ति की सॉल्वेंसी का आकलन करना चाहिए, बल्कि उसके व्यक्तित्व की पहचान भी करनी चाहिए।"

अब कंपनी का डेटाबेस 500 हजार से अधिक ग्राहकों की जानकारी संग्रहीत करता है। लगभग 800 मापदंडों में इस डेटा के साथ प्रत्येक नए एप्लिकेशन का विश्लेषण किया जाता है। कार्यक्रम न केवल लिंग, आयु, वैवाहिक स्थिति और क्रेडिट इतिहास को ध्यान में रखता है, बल्कि उस उपकरण को भी ध्यान में रखता है जिससे एक व्यक्ति ने मंच पर प्रवेश किया, उसने साइट पर कैसा व्यवहार किया। उदाहरण के लिए, यह खतरनाक हो सकता है कि एक संभावित उधारकर्ता ने ऋण कैलकुलेटर का उपयोग नहीं किया या ऋण की शर्तों के बारे में पूछताछ नहीं की। "कुछ रोक कारकों के अपवाद के साथ - कहते हैं, हम 19 वर्ष से कम आयु के व्यक्तियों को ऋण जारी नहीं करते हैं - इनमें से कोई भी पैरामीटर अपने आप में ऋण जारी करने से इनकार करने या सहमत होने का कारण नहीं है," पोनोमारेव बताते हैं। यह कारकों का संयोजन है जो मायने रखता है। 95% मामलों में, हामीदारी विभाग के विशेषज्ञों की भागीदारी के बिना, निर्णय स्वचालित रूप से किया जाता है।

आज बड़े डेटा का विश्लेषण किए बिना वित्तीय सेवाएं प्रदान करना बिना संख्या के गणित करने जैसा है।

बिग डेटा विश्लेषण हमें दिलचस्प पैटर्न, पोनोमेरेव शेयर प्राप्त करने की अनुमति देता है। उदाहरण के लिए, iPhone उपयोगकर्ता Android उपकरणों के मालिकों की तुलना में अधिक अनुशासित उधारकर्ता निकले - पूर्व में 1,7 बार अधिक बार अनुप्रयोगों की स्वीकृति प्राप्त होती है। पोनोमेरेव कहते हैं, "तथ्य यह है कि सैन्यकर्मी औसत उधारकर्ता की तुलना में लगभग एक चौथाई कम बार ऋण नहीं चुकाते हैं।" "लेकिन छात्रों को आमतौर पर बाध्य होने की उम्मीद नहीं है, लेकिन इस बीच, क्रेडिट डिफॉल्ट के मामले आधार के औसत से 10% कम हैं।"

बड़े डेटा का अध्ययन बीमाकर्ताओं के लिए स्कोरिंग की भी अनुमति देता है। 2016 में स्थापित, IDX दूरस्थ पहचान और दस्तावेजों के ऑनलाइन सत्यापन में लगा हुआ है। ये सेवाएं माल बीमाकर्ताओं के बीच मांग में हैं, जो माल के कम से कम नुकसान में रुचि रखते हैं। IDX के वाणिज्यिक निदेशक जन स्लोका बताते हैं कि माल के परिवहन का बीमा करने से पहले, बीमाकर्ता, चालक की सहमति से, विश्वसनीयता की जांच करता है। एक साथी के साथ - सेंट पीटर्सबर्ग कंपनी "रिस्क कंट्रोल" - IDX ने एक सेवा विकसित की है जो आपको ड्राइवर की पहचान, पासपोर्ट डेटा और अधिकारों, कार्गो के नुकसान से संबंधित घटनाओं में भागीदारी आदि की जांच करने की अनुमति देती है। विश्लेषण करने के बाद ड्राइवरों के डेटाबेस में, कंपनी ने एक "जोखिम समूह" की पहचान की: सबसे अधिक बार, लंबे ड्राइविंग अनुभव वाले 30-40 वर्ष की आयु के ड्राइवरों के बीच कार्गो खो जाता है, जिन्होंने हाल ही में नौकरी बदली है। यह भी पता चला कि माल अक्सर कारों के चालकों द्वारा चुराया जाता है, जिनकी सेवा जीवन आठ साल से अधिक है।

की खोज में

खुदरा विक्रेताओं का एक अलग कार्य है - उन ग्राहकों की पहचान करना जो खरीदारी करने के लिए तैयार हैं, और उन्हें साइट या स्टोर पर लाने के लिए सबसे प्रभावी तरीके निर्धारित करना। इसके लिए, कार्यक्रम ग्राहकों की प्रोफ़ाइल, उनके व्यक्तिगत खाते से डेटा, खरीदारी का इतिहास, खोज क्वेरी और बोनस बिंदुओं का उपयोग, इलेक्ट्रॉनिक बास्केट की सामग्री का विश्लेषण करते हैं जिसे उन्होंने भरना शुरू किया और छोड़ दिया। M.Video-Eldorado समूह के डेटा कार्यालय के निदेशक किरिल इवानोव कहते हैं, डेटा एनालिटिक्स आपको पूरे डेटाबेस को खंडित करने और संभावित खरीदारों के समूहों की पहचान करने की अनुमति देता है, जो किसी विशेष ऑफ़र में दिलचस्पी ले सकते हैं।

उदाहरण के लिए, कार्यक्रम ग्राहकों के समूहों की पहचान करता है, जिनमें से प्रत्येक को अलग-अलग मार्केटिंग टूल पसंद हैं - ब्याज मुक्त ऋण, कैशबैक या डिस्काउंट प्रोमो कोड। ये खरीदार संबंधित प्रचार के साथ एक ईमेल न्यूज़लेटर प्राप्त करते हैं। संभावना है कि एक व्यक्ति, पत्र खोलने के बाद, कंपनी की वेबसाइट पर जाएगा, इस मामले में, इवानोव नोटों में काफी वृद्धि हुई है।

डेटा विश्लेषण से आप संबंधित उत्पादों और एक्सेसरीज़ की बिक्री भी बढ़ा सकते हैं। सिस्टम, जिसने अन्य ग्राहकों के ऑर्डर इतिहास को संसाधित किया है, खरीदार को चयनित उत्पाद के साथ क्या खरीदना है, इस पर सिफारिशें देता है। इवानोव के अनुसार, काम के इस तरीके का परीक्षण, सामान के साथ ऑर्डर की संख्या में 12% की वृद्धि और सामान के कारोबार में 15% की वृद्धि दर्शाता है।

केवल खुदरा विक्रेता ही सेवा की गुणवत्ता में सुधार और बिक्री बढ़ाने का प्रयास नहीं कर रहे हैं। पिछली गर्मियों में, मेगाफोन ने लाखों ग्राहकों के डेटा के प्रसंस्करण के आधार पर "स्मार्ट" ऑफ़र सेवा शुरू की। उनके व्यवहार का अध्ययन करने के बाद, आर्टिफिशियल इंटेलिजेंस ने टैरिफ के भीतर प्रत्येक ग्राहक के लिए व्यक्तिगत प्रस्ताव तैयार करना सीख लिया है। उदाहरण के लिए, यदि प्रोग्राम नोट करता है कि कोई व्यक्ति सक्रिय रूप से अपने डिवाइस पर वीडियो देख रहा है, तो सेवा उसे मोबाइल ट्रैफ़िक की मात्रा बढ़ाने की पेशकश करेगी। उपयोगकर्ताओं की प्राथमिकताओं को ध्यान में रखते हुए, कंपनी ग्राहकों को उनके पसंदीदा प्रकार के इंटरनेट अवकाश के लिए असीमित ट्रैफ़िक प्रदान करती है - उदाहरण के लिए, तत्काल दूतों का उपयोग करना या स्ट्रीमिंग सेवाओं पर संगीत सुनना, सामाजिक नेटवर्क पर चैट करना या टीवी शो देखना।

"हम ग्राहकों के व्यवहार का विश्लेषण करते हैं और समझते हैं कि उनकी रुचियां कैसे बदल रही हैं," मेगाफोन में बड़े डेटा एनालिटिक्स के निदेशक विटाली शेर्बाकोव बताते हैं। "उदाहरण के लिए, इस वर्ष, AliExpress ट्रैफ़िक पिछले वर्ष की तुलना में 1,5 गुना बढ़ गया है, और सामान्य तौर पर, ऑनलाइन कपड़ों की दुकानों पर जाने की संख्या बढ़ रही है: विशिष्ट संसाधन के आधार पर 1,2–2 गुना।"

बड़े डेटा वाले एक ऑपरेटर के काम का एक और उदाहरण लापता बच्चों और वयस्कों की खोज के लिए मेगाफोन पोइस्क प्लेटफॉर्म है। सिस्टम विश्लेषण करता है कि लापता व्यक्ति के स्थान के पास कौन से लोग हो सकते हैं, और उन्हें लापता व्यक्ति की तस्वीर और संकेतों के साथ जानकारी भेजता है। ऑपरेटर ने आंतरिक मामलों के मंत्रालय और लिसा अलर्ट संगठन के साथ मिलकर सिस्टम का विकास और परीक्षण किया: लापता व्यक्ति के उन्मुखीकरण के दो मिनट के भीतर, 2 हजार से अधिक ग्राहक प्राप्त करते हैं, जो एक सफल खोज परिणाम की संभावना को काफी बढ़ा देता है।

पब में मत जाओ

बड़े डेटा विश्लेषण ने उद्योग में भी आवेदन पाया है। यहां यह आपको मांग की भविष्यवाणी करने और बिक्री की योजना बनाने की अनुमति देता है। तो, कंपनियों के चर्किज़ोवो समूह में, तीन साल पहले, SAP BW पर आधारित एक समाधान लागू किया गया था, जो आपको सभी बिक्री सूचनाओं को संग्रहीत और संसाधित करने की अनुमति देता है: मूल्य, वर्गीकरण, उत्पाद की मात्रा, प्रचार, वितरण चैनल, CIO व्लादिस्लाव बिल्लाएव कहते हैं समूह का ” चर्किज़ोवो। संचित 2 टीबी सूचना के विश्लेषण ने न केवल उत्पाद पोर्टफोलियो को प्रभावी ढंग से वर्गीकरण और अनुकूलन करना संभव बना दिया, बल्कि कर्मचारियों के काम को भी आसान बना दिया। उदाहरण के लिए, एक दैनिक बिक्री रिपोर्ट तैयार करने के लिए कई विश्लेषकों के एक दिन के काम की आवश्यकता होगी - प्रत्येक उत्पाद खंड के लिए दो। अब यह रिपोर्ट सभी सेगमेंट पर केवल 30 मिनट खर्च करके रोबोट द्वारा तैयार की जाती है।

अम्ब्रेला आईटी के सीईओ स्टानिस्लाव मेशकोव कहते हैं, "उद्योग में, बड़ा डेटा इंटरनेट ऑफ थिंग्स के साथ प्रभावी ढंग से काम करता है।" "उपकरण से लैस सेंसर से डेटा के विश्लेषण के आधार पर, इसके संचालन में विचलन की पहचान करना और ब्रेकडाउन को रोकना और प्रदर्शन की भविष्यवाणी करना संभव है।"

सेवेरस्टल में, बड़े डेटा की मदद से, वे गैर-तुच्छ कार्यों को हल करने का भी प्रयास कर रहे हैं - उदाहरण के लिए, चोट की दर को कम करने के लिए। 2019 में, कंपनी ने श्रम सुरक्षा में सुधार के उपायों के लिए लगभग 1,1 बिलियन रूबल आवंटित किए। सेवेरस्टल को चोट की दर में 2025% की कमी (50 की तुलना में) 2017% होने की उम्मीद है। "अगर एक लाइन मैनेजर - फोरमैन, साइट मैनेजर, शॉप मैनेजर - ने देखा कि एक कर्मचारी असुरक्षित तरीके से कुछ ऑपरेशन करता है (औद्योगिक स्थल पर सीढ़ियाँ चढ़ते समय हैंड्रिल पर पकड़ नहीं रखता है या सभी व्यक्तिगत सुरक्षा उपकरण नहीं पहनता है), तो वह लिखता है उनके लिए एक विशेष नोट - पीएबी ("बिहेवियरल सिक्योरिटी ऑडिट")," कंपनी के डेटा विश्लेषण विभाग के प्रमुख बोरिस वोस्करेन्स्की कहते हैं।

किसी एक डिवीजन में पीएबी की संख्या पर डेटा का विश्लेषण करने के बाद, कंपनी के विशेषज्ञों ने पाया कि सुरक्षा नियमों का सबसे अधिक उल्लंघन उन लोगों द्वारा किया गया था, जिनके पास पहले से ही कई टिप्पणियां थीं, साथ ही साथ जो बीमार छुट्टी पर थे या कुछ समय पहले छुट्टी पर थे घटना। छुट्टी या बीमारी की छुट्टी से लौटने के बाद पहले सप्ताह में उल्लंघन बाद की अवधि की तुलना में दोगुना अधिक था: 1 बनाम 0,55%। लेकिन रात की पाली में काम करना, जैसा कि यह निकला, PAB के आँकड़ों को प्रभावित नहीं करता है।

वास्तविकता से हटकर

कंपनी के प्रतिनिधियों का कहना है कि बड़े डेटा को संसाधित करने के लिए एल्गोरिदम बनाना काम का सबसे कठिन हिस्सा नहीं है। यह समझना बहुत कठिन है कि प्रत्येक विशिष्ट व्यवसाय के संदर्भ में इन तकनीकों को कैसे लागू किया जा सकता है। यहीं पर कंपनी के विश्लेषकों और यहां तक ​​कि बाहरी प्रदाताओं की दुखती रग है, जो ऐसा लगता है कि बिग डेटा के क्षेत्र में विशेषज्ञता जमा कर चुके हैं।

गुड्सफॉरकास्ट में विकास के निदेशक सर्गेई कोटिक कहते हैं, "मैं अक्सर बड़े डेटा विश्लेषकों से मिला, जो उत्कृष्ट गणितज्ञ थे, लेकिन उन्हें व्यावसायिक प्रक्रियाओं की आवश्यक समझ नहीं थी।" वह याद करते हैं कि कैसे दो साल पहले उनकी कंपनी को संघीय खुदरा श्रृंखला के लिए मांग पूर्वानुमान प्रतियोगिता में भाग लेने का अवसर मिला था। सभी सामानों और दुकानों के लिए एक पायलट क्षेत्र चुना गया था, जिसमें प्रतिभागियों ने पूर्वानुमान लगाया था। पूर्वानुमानों की वास्तविक बिक्री के साथ तुलना की गई थी। पहला स्थान रूसी इंटरनेट दिग्गजों में से एक द्वारा लिया गया था, जो मशीन सीखने और डेटा विश्लेषण में अपनी विशेषज्ञता के लिए जाना जाता है: अपने पूर्वानुमानों में, इसने वास्तविक बिक्री से न्यूनतम विचलन दिखाया।

लेकिन जब नेटवर्क ने उनके पूर्वानुमानों का अधिक विस्तार से अध्ययन करना शुरू किया, तो यह पता चला कि व्यावसायिक दृष्टिकोण से, वे बिल्कुल अस्वीकार्य हैं। कंपनी ने एक मॉडल प्रस्तुत किया जिसने एक व्यवस्थित समझ के साथ बिक्री योजना तैयार की। कार्यक्रम ने यह पता लगाया कि पूर्वानुमानों में त्रुटियों की संभावना को कैसे कम किया जाए: यह बिक्री को कम आंकने के लिए सुरक्षित है, क्योंकि अधिकतम त्रुटि 100% हो सकती है (कोई नकारात्मक बिक्री नहीं है), लेकिन अतिवृष्टि की दिशा में, यह मनमाने ढंग से बड़ा हो सकता है, कोटिक बताते हैं। दूसरे शब्दों में, कंपनी ने एक आदर्श गणितीय मॉडल प्रस्तुत किया, जो वास्तविक परिस्थितियों में आधे-अधूरे स्टोर और अंडरसेल्स से भारी नुकसान का कारण बनेगा। नतीजतन, एक और कंपनी ने प्रतियोगिता जीत ली, जिसकी गणना व्यवहार में लायी जा सकती थी।

बड़े डेटा के बजाय "हो सकता है"

बिग डेटा प्रौद्योगिकियां कई उद्योगों के लिए प्रासंगिक हैं, लेकिन उनका सक्रिय कार्यान्वयन हर जगह नहीं होता है, मेशकोव नोट करता है। उदाहरण के लिए, हेल्थकेयर में डेटा स्टोरेज की समस्या है: बहुत सारी जानकारी जमा हो गई है और इसे नियमित रूप से अपडेट किया जाता है, लेकिन अधिकांश भाग के लिए यह डेटा अभी तक डिजिटाइज़ नहीं किया गया है। सरकारी एजेंसियों में भी ढेर सारा डेटा होता है, लेकिन उन्हें एक कॉमन क्लस्टर में नहीं जोड़ा जाता है। विशेषज्ञ कहते हैं कि राष्ट्रीय डेटा प्रबंधन प्रणाली (NCMS) के एकीकृत सूचना मंच के विकास का उद्देश्य इस समस्या को हल करना है।

हालाँकि, हमारा देश एकमात्र ऐसे देश से बहुत दूर है जहाँ अधिकांश संगठनों में अंतर्ज्ञान के आधार पर महत्वपूर्ण निर्णय लिए जाते हैं, न कि बड़े डेटा के विश्लेषण के आधार पर। पिछले साल अप्रैल में, डेलॉइट ने बड़ी अमेरिकी कंपनियों (500 या उससे अधिक के कर्मचारियों के साथ) के एक हजार से अधिक नेताओं के बीच एक सर्वेक्षण किया और पाया कि सर्वेक्षण में शामिल 63% लोग बड़ी डेटा तकनीकों से परिचित हैं, लेकिन सभी आवश्यक नहीं हैं उनका उपयोग करने के लिए बुनियादी ढांचा। इस बीच, उच्च स्तर की विश्लेषणात्मक परिपक्वता वाली 37% कंपनियों में से लगभग आधे ने पिछले 12 महीनों में व्यावसायिक लक्ष्यों को काफी हद तक पार कर लिया है।

अध्ययन से पता चला कि नए तकनीकी समाधानों को लागू करने में कठिनाई के अलावा, कंपनियों में एक महत्वपूर्ण समस्या डेटा के साथ काम करने की संस्कृति का अभाव है। आपको अच्छे परिणामों की उम्मीद नहीं करनी चाहिए यदि बड़े डेटा के आधार पर किए गए निर्णयों की जिम्मेदारी केवल कंपनी के विश्लेषकों को सौंपी जाती है, न कि पूरी कंपनी को। "अब कंपनियां बड़े डेटा के लिए दिलचस्प उपयोग के मामलों की तलाश कर रही हैं," मिफ्ताखोव कहते हैं। "साथ ही, कुछ परिदृश्यों के कार्यान्वयन के लिए अतिरिक्त डेटा के संग्रह, प्रसंस्करण और गुणवत्ता नियंत्रण के लिए सिस्टम में निवेश की आवश्यकता होती है जिसका पहले विश्लेषण नहीं किया गया है।" काश, "एनालिटिक्स अभी तक एक टीम स्पोर्ट नहीं है," अध्ययन के लेखक स्वीकार करते हैं।

एक जवाब लिखें