एक ऐसी दुनिया होनी चाहिए जहां भाषा प्रौद्योगिकी के लिए कोई बाधा न बने- कालिका बाली

आर्टिफिशियल इंटेलिजेंस (एआई) का मातृभाषा के जरिए आर्थिक सम्बल

यह स्टार्टअप उन लाखों लोगों की मदद के लिए आगे आया है जिनकी मातृभाषाएं हाशिए पर हैं। एआई से उन्हें आर्थिक लाभ हो सकेगा
नारियल पेड़ की छाया में, चंद्रिका सूरज की रोशनी से बचने के लिए अपने स्मार्टफोन की स्क्रीन थोड़ा तिरछा कर लेती हैं। दक्षिण भारत के एक राज्य कर्नाटक के अलहल्ली गांव में सुबह का वक्त है लेकिन गर्मी और उमस बहुत है। स्क्रॉल करने के साथ ही चंद्रिका एक के बाद एक कई ऑडियो क्लिप पर क्लिक करती हैं। यह उस ऐप की आसानी को प्रदर्शित करता है जिसका उन्होंने हाल ही में उपयोग करना शुरू किया है। हर टैप पर फोन से उन्हें मातृभाषा में अपनी आवाज सुनाई देती है।
इस ऐप का इस्तेमाल शुरू करने से पहले, 30 वर्षीया चंद्रिका (अन्य दक्षिण भारतीयों की तरह, अपने पिता के नाम के पहले अक्षर के. का उपयोग करती हैं, लास्ट नेम के बजाय) के बैंक खाते में पहले केवल 184 रुपए (2.25 डॉलर) थे। अप्रेल के आखिर में उन्होंने कई दिनों तक लगभग छह घंटे काम किया। उन्हें 2,570 रुपए (31.30 डॉलर) की आय हुई। दूर के स्कूल में शिक्षिका के रूप में काम करने के दौरान वह लगभग उतनी ही राशि कमाती थीं, जितनी उन्हें वहां जाने और वापस आने में लगने वाले बस के किराए के बाद बचती थी। आने-जाने में उन्हें तीन बस बदलनी पड़ती थी। अब अपने काम के भुगतान के लिए उन्हें महीने के अंत तक इंतजार नहीं करना पड़ता। कुछ ही घंटों में पैसा उनके बैंक खाते में आ जाता है। केवल अपनी मातृभाषा कन्नड़, जो लगभग 60 मिलियन लोगों द्वारा बोली जाती है, ज्यादातर मध्य और दक्षिणी भारत में, भाषा के पाठ को जोर से पढ़कर, चंद्रिका ने इस ऐप का उपयोग करते हुए प्रतिघंटे लगभग 5 डॉलर का वेतन अर्जित किया है, जो भारतीयों की न्यूनतम आय से लगभग 20 गुना ज्यादा है। और कुछ ही दिनों में 50 फीसद बोनस के रूप में उनके खाते में और पैसा आ जाएगा। एक बार आवाज को सिर्फ वायस क्लिप से मिलाने की जरूरत है।
चंद्रिका की आवाज उन्हें इतनी राशि दिला सकती है? यह सम्भव हुआ है आर्टिफिशियल इंटेलिजेंस (एआई) में आए उछाल की वजह से। फिलहाल, अत्याधुनिक एआई- उदाहरण के लिए चैटजीपीटी अंग्रेजी जैसी भाषाओं में सबसे अच्छा काम कर रहे हैं, जहां टेक्स्ट और ऑडियो डेटा प्रचुर मात्रा में ऑनलाइन उपलब्ध हैं। चैटजीपीटी, कन्नड़ जैसी भाषाओं में बहुत अच्छा नहीं कर पा रहा है क्योंकि यह भाषा लाखों लोगों द्वारा बोले जाने के बावजूद इंटरनेट पर दुर्लभ है। (उदाहरण- विकिपीडिया पर अंग्रेजी में 6 मिलियन लेख हैं, जबकि कन्नड़ में सिर्फ 30,000) तो क्या एआई “कम संसाधन वाली” भाषाओं के लिए पक्षपाती हो सकते हैं? उदाहरण के लिए, एआई का हमेशा यह मानकर चलना कि डॉक्टर पुरुष ही होते हैं और महिलाएं नर्स। इससे भी समस्या गहरा सकती है। अंग्रेजी भाषा बोलने वाले एआई बनाने के लिए, केवल डेटा एकत्र करना ही पर्याप्त है। डेटा तो पहले से ही बड़ी संख्या में जमा है लेकिन कन्नड़ जैसी भाषाओं के लिए आपको बाहर निकल कर बहुत कुछ तलाशना होगा।

 


एआई ने दुनिया के कुछ सबसे गरीब लोगों द्वारा बोली जाने वाली भाषाओं के डेटासेट- टेक्स्ट या वॉयस डेटा के संग्रह- की भारी मांग उत्पन्न की है। ऐसी मांग उन तकनीकी कंपनियों द्वारा की जाती है जो अपने एआई उपकरण बनाना चाहती हैं। शिक्षा जगत और सरकारों की ओर से भी बड़ी मांग होती है खासकर भारत में, जहां 22 आधिकारिक भाषाओं और कम से कम 780 से अधिक स्वदेशी भाषाओं वाले लगभग 1.4 अरब लोगों के देश में अंग्रेजी और हिन्दी को लंबे समय से प्राथमिकता दी गई है। बढ़ती हुई मांग का मतलब है-करोड़ों भारतीयों का अचानक से एक दुर्लभ और नव-मूल्यवान संपत्ति के मालिक होना। वह मूल्यवान सम्पत्ति है उनकी मातृभाषा।
एआई को केन्द्रित करते हुए डेटा उत्पन्न करना या रिफाइन करना, भारत के लिए कोई नया काम भी नहीं है। 20वीं सदी के अंत में जिस अर्थव्यवस्था ने कॉल सेंटरों और कपड़ा कारखानों को उत्पादकता इंजन में बदलने के लिए बहुत कुछ किया, 21वीं सदी में चुपचाप डेटा वर्क के साथ वही किया जा रहा है। इंडस्ट्री में एक बार फिर श्रम मध्यस्थता आधारित कंपनियों, जिसका अर्थ है आउटसोर्सिंग, का प्रभुत्व है। ये कंपनियां न्यूनतम के करीब ही वेतन का भुगतान करती हैं, जबकि भारी शुल्क वसूलने के लिए डेटा विदेशी ग्राहकों को बेचती हैं। वर्ष 2022 में डेटा सेक्टर का वैश्विक मूल्य लगभग 2 बिलियन डॉलर से ज्यादा था जिसके 2030 तक बढ़कर 17 बिलियन डॉलर हो जाने का अनुमान है। इस धन का बहुत कम हिस्सा ही भारत, केन्या और फिलीपींस के डेटा वर्कर्स को मिला है।
ये स्थितियां व्यक्तिगत रूप से काम कर रहे श्रमिकों की जिन्दगी को कहीं अधिक नुकसान पहुंचा सकती हैं। ऑक्सफोर्ड यूनिवर्सिटी के इंटरनेट इंस्टीट्यूट में डिजिटल वर्क प्लेटफॉर्म के विशेषज्ञ जोनास वैलेंटे कहते हैं- ‘हम उस व्यवस्था के बारे में चर्चा कर रहे हैं जो हमारे पूरे समाज को प्रभावित कर रही है और वर्कर्स उन व्यवस्थाओं को विश्वसनीय और कम पक्षपाती बनाते हैं।’ वह आगे कहते हैं- ‘अगर आपके पास मूलभूत अधिकारों की जानकारी रखने वाले कर्मचारी हैं और ज्यादा सशक्त भी, तो मेरा मानना है कि तकनीकि व्यवस्था के जरिए जो परिणाम आएंगे, उनका गुणवत्ता बेहतर होगी।’
अलहल्ली और चिलुकावाड़ी के निकटवर्ती गांवों में, एक भारतीय स्टार्टअप नए मॉडल का परीक्षण कर रहा है। चंद्रिका, ‘कार्या’ के लिए काम करती हैं। ‘कार्या’ एक गैर-लाभकारी संस्था है जिसे 2021 में बेंगलुरु (पूर्व नाम बैंगलोर) में लॉंच किया गया था जो खुद को ‘दुनिया की पहली एथिकल डेटा कंपनी’ के रूप में पेश करती है। अपने अन्य प्रतिद्वंद्वियों की तरह, यह भी बाजार दर पर बड़ी तकनीकि कंपनियों और अन्य ग्राहकों को डेटा बेचती है। अपनी लागत को कवर करती है लेकिन उस रकम का अधिकांश हिस्सा लाभ के रूप में अपने पास रखने के बजाय शेष राशि भारत के ग्रामीण इलाकों के गरीबों को भेज देती है। (कार्या ने स्थानीय गैर सरकारी संगठनों के साथ साझेदारी की है ताकि यह सुनिश्चित किया जा सके कि उसकी नौकरियों तक पहुंच सबसे गरीब लोगों के साथ-साथ हाशिए पर रहने वाले समुदायों की हो।) अपने वर्कर्स को प्रति घंटे न्यूनतम 5 डॉलर देने वाला ‘कार्या’ श्रमिकों को उनके द्वारा बनाए गए डेटा का वास्तविक स्वामित्व भी देता है। जब श्रमिक इसे फिर बेचते हैं तो श्रमिकों को उनके पिछले वेतन के अलावा आय भी हासिल होती है। यह एक ऐसा मॉडल है जो इंडस्ट्री में कहीं अन्य जगह नहीं है।
‘कार्या’ जो काम कर रही है, उसका मतलब यह भी है कि लाखों लोग जिनकी भाषाएं ऑनलाइन हाशिए पर हैं, एआई सहित प्रौद्योगिकी के लाभों तक बेहतर पहुंच हासिल कर सकती हैं। 23 वर्षीय छात्रा विनुथा, जिसने माता-पिता पर अपनी वित्तीय निर्भरता कम करने के लिए ‘कार्या’ में काम किया है, कहती हैं- ‘गांवों में ज्यादातर लोगों को अंग्रेजी नहीं आती। यदि कम्प्यूटर कन्नड़ समझ सकता तो यह बड़ा फायदेमंद होगा।’
कार्या के 27 वर्षीय सीईओ मनु चोपड़ा कहते हैं-‘अभी जो वेतन दिया जा रहा है, वह बाजार की विफलता है।’ वह आगे कहते हैं-‘हमने कार्या को गैर-लाभकारी संस्था बनाने का फैसला इसलिए किया क्योंकि मौलिक रूप से आप बाजार में बाजार की विफलता का समाधान नहीं कर सकते।’ आप इसे इस तरह भी कह सकते हैं कि काम तो पूरक है।
कार्या अपने कर्मचारियों से पहली बात जो कहता है, वह यह हैः यह कोई स्थायी नौकरी नहीं है, बल्कि यह जल्दी से आय बढ़ाने का एक तरीका है जो आपको आगे बढ़ने और अन्य काम करने की अनुमति देगा। ऐप के जरिए एक कर्मचारी अधिकतम 1,500 डॉलर की आय अर्जित कर सकता है जो भारत में औसत वार्षिक आय है। उस बिंदु के बाद, वर्कर्स किसी और के लिए रास्ता बनाते हैं। कार्या का कहना है कि उसने देश भर में लगभग 30,000 ग्रामीण भारतीयों को मजदूरी के रूप में 65 मिलियन रुपए (लगभग 8,00,000 डॉलर) का भुगतान किया है। चोपड़ा चाहते हैं कि कार्या की पहुंच 2030 तक 100 मिलियन लोगों तक हो। गरीबी में जन्मे और स्टैनफोर्ड में छात्रवृत्ति हासिल करने वाले चोपड़ा कहते हैं- ‘मुझे वास्तव में लगता है कि अगर सही तरीके से काम किया जाए तो लाखों लोगों को गरीबी से बाहर निकालने का यह सबसे गतिशील और अच्छा तरीका है।’ वह कहते हैं कि निश्चित रूप से यह सामाजिक परियोजना है। वेल्थ इज पावर। हम उन समुदायों को धन का पुनर्वितरण करना चाहते हैं जो पीछे छूट गए हैं।
ऐसा भी नहीं है कि चोपड़ा एआई डेटा वर्क की क्षमता के बारे में बात करने वाले ऐसे पहले तकनीकि संस्थापक हों, जिन्होंने दुनिया के निम्नतम गरीबों को लाभ पहुंचाने का बीड़ा उठाया है। सामा- एक आउटसोर्सिंग कंपनी, जिसने ओपनएआई के चैटजीपीटी और मेटा के फेसबुक की हैंडलिंग के लिए कार्य अनुबंध किए हैं, ने ग्लोबल साउथ में लोगों को गरीबी से निजात दिलाने के लिए तकनीकी कंपनियों को “नैतिक” तरीके से प्रोत्साहित किया है। लेकिन जैसाकि मैंने जनवरी में खबर दी थी कि केन्या में चैटजीपीटी के कई कर्मचारियों-जिनमें से कुछ 2 डॉलर प्रतिघंटे से भी कम कमाते थे – ने मुझे बताया कि उन्हें ट्रेनिंग डेटा के सम्पर्क में लाया गया जिससे उन्हें आघात पहुंचा। कंपनी ने फेसबुक के लिए भी इसी तरह का कंटेंट मॉडरेशन कार्य किया; उस परियोजना के एक कर्मचारी ने मुझे बताया कि जब उसने बेहतर कामकाजी परिस्थितियों के लिए अभियान चलाया तो उसे निकाल दिया गया। बीबीसी ने वर्ष 2018 में जब कम वेतन के बारे में पूछा तो सामा के दिवंगत संस्थापक ने तर्क दिया था कि श्रमिकों को अधिक वेतन देने से स्थानीय अर्थव्यवस्थाएं बाधित हो सकती हैं, जिससे लाभ की तुलना में नुकसान अधिक हो सकता है। पिछले 18 महीनों में मैंने इस इंडस्ट्री पर रिपोर्टिंग की है। इस दौरान मैंने जिन डेटा कर्मियों से बात की है, उनमें से कई ने इस तर्क पर जोर देते हुए कहा कि यह उन कंपनियों के लिए सुविधाजनक आख्यान है जो अपने श्रमिकों की आय से अमीर हो रही हैं।
चैटजीपीटी पर मेरे जनवरी के लेख के जवाब में ट्वीट्स की एक श्रृंखला में चोपड़ा ने लिखा था-‘पिछले 5 वर्षों में मैंने सबसे बड़ा जो सबक सीखा है, वह यह है कि सब कुछ संभव है। यह कोई सपना नहीं है जिसमें हम किसी काल्पनिक और बेहतर दुनिया को देख रहे हैं। हम अपने श्रमिकों को न्यूनतम वेतन से 20 गुना अधिक भुगतान कर सकते हैं और फिर भी एक टिकाऊ संगठन बने रह सकते हैं।’
यह पहला मौका था जब मैंने कार्या के बारे में सुना और मेरी तत्काल और सहज प्रवृत्ति संदेहभरी थी। सामा ने भी अपना जीवन गरीबी उन्मूलन पर केंद्रित एक गैर-लाभकारी संस्था के रूप में शुरू किया था, लेकिन बाद में वह एक लाभकारी व्यवसाय में बदल गया। क्या कार्या एआई उद्योग के लिए वास्तव में और अधिक समावेशी और नैतिक मॉडल हो सकता है? अगर ऐसा है तो इसका पैमाना क्या हो सकता है? एक चीज तो स्पष्ट हैः जमीनी स्तर पर बेहतर परीक्षण के कुछ आधार हो सकते हैं- एक ऐसा देश जहां मोबाइल डेटा दुनिया में सबसे सस्ता है और जहां गरीब ग्रामीणों की भी स्मार्टफोन और बैंक खाता दोनों तक पहुंच आम है। एआई से और भी सम्भावित लाभ हो सकते हैं। विश्व बैंक के अनुसार कोविड महामारी से पहले भी भारत में लगभग 140 करोड़ लोग रोजाना 2.15 डॉलर से कम पर जीवनयापन करते थे। उन लोगों के लिए, चोपड़ा जिस वित्तीय स्थिरता की बात कर रहे हैं, वह जीवन बदलने वाला हो सकता है।
बेंगलुरु से सिर्फ 70 किमी की दूरी पर एक गांव है-चिलुकावडी। यह गांव प्रौद्योगिकी के महानगरीय कोलाहल से दूर गन्ने के खेतों के पीछे और खिले हुए गुलमोहर पेड़ों से आच्छादित है। कंक्रीट से बनी एक इमारत में, एक स्थानीय कृषि सहकारी समिति का मुख्यालय है। यहां लगभग दर्जनभर स्त्री-पुरुष एकत्रित हैं जिन्होंने हफ्तेभर पहले ही कार्या के लिए काम करना शुरू किया है। इन्हीं लोगों में से एक हैं 21 वर्षीय दुबले-पतले कनकराज एस., जो ठंडे फर्श पर पालथी मारकर बैठे हैं। वह पास के एक कॉलेज में पढ़ते हैं और पढ़ाई एवं आने-जाने में लगने वाले किराए का खर्च निकालने के लिए कभी-कभी आसपास के खेतों में दिहाड़ी मजदूर के रूप में काम कर लेते हैं। एक दिन काम करने के बदले में वे 350 रुपए (लगभग 4 डॉलर) कमा लेते हैं लेकिन ऐसी मेहनत उनके लिए असहनीय होती जा रही है क्योंकि गर्मी सामान्य से भी बहुत ज्यादा है। पास के शहर में एक कारखाने में काम करने पर उन्हे पैसे तो जरूर ज्यादा मिल जाएंगे लेकिन यह आय बहुत बड़ी कीमत लिए है। रोजाना आने-जाने में बसों में लगने वाला घंटों का वक्त, बस का किराया, अविश्वसनीय रूप से शारीरिक परेशानी, और सबसे बदतर तो यह कि अगर वे शहर में कमरा लेकर कहीं रहते हैं तो वे अपने नेटवर्क से दूर होते जाएंगे। मित्रों से मिलना भी दूर की कौड़ी रह जाएगा।
कार्या में, कनकराज एक घंटे में उससे ज्यादा कमा सकते हैं जितना वह खेतों में पूरा एक दिन काम करने के बाद कमा पाते। वह कहते हैं- “काम तो अच्छा है और आसान भी।” इस मुद्दे पर चोपड़ा का कहना है कि जब वह आम लोगों से मिलते हैं तो लोग अक्सर और हमेशा ही ऐसी प्रशंसाभरी बात कहते हैं। वह कहते हैं- ‘लोग खुश हैं कि हम उन्हें अच्छा वेतन देते हैं।’ लेकिन ज्यादा महत्वपूर्ण तो यह है कि ‘यह मुश्किलभरा और मेहनत वाला काम नहीं है। यह शारीरिक काम नहीं है।’ कनकराज को उस वक्त आश्चर्यमिश्रित खुशी हुई जब उनके बैंक खाते में भुगतान पहली बार आया। चोपड़ा कहते हैं कि कनकराज ने उन्हें बताया है- ‘इसके पहले घोटालों में उसका ढेर सारा धन लुट गया था।’ उसने यह भी कहा कि ग्रामीणों को अक्सर ही उनके मोबाइल पर एसएमएस आते हैं कि यदि वे उनके यहां धन जमा करें तो वापसी में दस गुना से भी ज्यादाधन लौटाया जाएगा। जब किसी ने उन्हें पहली बार कार्या के कामकाज के बारे में बताया तो उसकी भी प्रारम्भिक प्रतिक्रिया कुछ ऐसी ही थी।
लोगों की बचत बहुत कम है। स्थानीय लोग इमर्जेंसी जरूरतों के लिए कर्ज लेते हैं। लुटेरी एजेंसियां इन कर्जों पर ऊंची ब्याज दरें वसूलती हैं जिससे यहां के कुछ ग्रामीण कर्ज के चक्र में फंस जाते हैं। उदाहरण के लिए, चंद्रिका को कार्या से जब अपने काम के पैसे मिलेंगे तो वह इस राशि में से कुछ का उपयोग अपने परिवार के कर्ज की भरपाई के लिए करेगी। जब उसकी बहन बीमार हो गई थी तब चंद्रिका के परिवार ने इलाज के लिए बड़ा कर्ज लिया था। इलाज के बावजूद, उसकी बहन को बचाया नहीं जा सका। परिवार पर एक शिशु और कर्ज का पहाड़ दोनों का बोझ आ गया। चंद्रिका रोते हुए कहती है कि उसे यह समझ में नहीं आ रहा था कि कर्ज को कैसे चुकाया जाएगा। हम अपनी बहन को तो वापस नहीं ला सकते थे। कार्य के अन्य वर्कर्स की भी कमोवेश यही स्थिति है। 25 वर्षीय अजय कुमार भी कर्ज मे डूबे हैं। उनकी मां को पीठ में चोट लग गई थी। मां के इलाज के लिए उन्होंने कर्ज लिया था। ऐसे ही एक हैं 38 वर्षीय शिवन्ना एन.। उनका बचपन में ही पटाखे की एक फैक्ट्री में हुई दुर्घटना में हाथ चला गया था। उन पर कोई कर्ज तो नहीं है लेकिन उनकी दिव्यांगता का मतलब है-आजीवन अपने जीवन-यापन के लिए संघर्ष करना।
ये ग्रामीण जो काम कर रहे हैं, वह नई परियोजना का हिस्सा है जिसे कार्या स्वास्थ्य सेवा क्षेत्र के एनजीओ के साथ कर्नाटक राज्य में शुरू कर रहा है। टीबी को लेकर स्पीच डेटा (आवाज का डेटा संग्रह करने की प्रक्रिया) का संग्रह किया जा रहा है। टीबी इलाज योग्य और रोकथाम योग्य बीमारी है। इस बीमारी से अभी भी हर साल लगभग दो लाख भारतीयों की जान चली जाती है। आवाज की रिकॉर्डिंग कन्नड़ भाषा की दस अलग-अलग बोलियों में की जा रही है जिससे एआई स्पीच मॉडल के लिए प्रशिक्षित किया जाएगा। टीबी के बारे में एआई स्थानीय लोगों के सवालों, उनकी समस्याओं को समझेगा और जवाब भी देगा जिससे बीमारी के फैलने का खतरा कम हो सकेगा। उम्मीद यही है कि यह ऐप जब तैयार हो जाएगा, अशिक्षित लोगों को विश्वसनीय जानकारी देने में सक्षम होगा, जानकारी तक पहुंच को आसान बनाएगा। टीबी के मरीज को भी इस कलंक से निपटने में आसानी मिलेगी। यह रिकॉर्डिंग कन्नड़ डेटासेट के हिस्से के रूप में कार्या के प्लेटफॉर्म पर बिक्री के लिए भी जाएगी। एआई कम्पनियां इससे फायदा उठा सकेंगी। हर बार जब इसे दोबारा बेचा जाएगा तो 100 फीसद राजस्व उन कार्या कार्यकर्ताओं में बांटा जाएगा जिन्होंने डेटासेट में योगदान दिया था। राशि का वितरण इस काम में उनके द्वारा खर्च किए गए घंटों के अनुसार किया जाएगा।
ऐसी ही एक महिला हैं 30 वर्षीया राजम्मा एम, जो पास के ही गांव में रहती हैं। वह कोविड-19 में सरकार की तरफ से सर्वेयर का काम करती थीं। घर-घर जाकर वह आंकड़े जुटाती थीं कि किसे टीका लगा है और किसे नहीं। लेकिन यह काम जनवरी में खत्म हो गया। अब वह कार्या के लिए काम करती है और उन्हें आय होती है। वह काम मिलने के लिए कार्या की एहसानमंद तो हैं ही, साथ ही वह इस बात की भी प्रशंसा करती हैं कि उन्हें सीखने को बहुत कुछ मिला। वह कहती हैं- ‘इस काम ने मुझे टीबी के बारे में, लोगों को इसकी दवा कैसे लेनी चाहिए, कैसे बचना चाहिए, के संदर्भ में बहुत ज्यादा जानकारी और जागरूकता दी है। भविष्य में यह अनुभव मेरी नौकरी में सहायक होगा।’
कार्या हालंकि छोटी सी इकाई है। फिर भी पहले से ही माइक्रोसॉफ्ट, एमआईटी और स्टैनफोर्ड समेत कई हाई-प्रोफाइल कंपनियां उसकी क्लाइंट हैं और कार्या की सूची में हैं। फरवरी में, इसने बिल और मेलिंडा गेट्स फाउंडेशन के लिए एक नई परियोजना पर काम शुरू किया है। लगभग एक अरब भारतीयों द्वारा बोली जाने वाली पांच भाषाओं-मराठी, तेलुगु, हिंदी, बंगाली और मलयालम में वॉयस डेटासेट बनाने का लक्ष्य है। यह परियोजना उसी का हिस्सा है। अंतिम लक्ष्य एक चैटबॉट बनाना है जो स्वास्थ्य देखभाल, कृषि, स्वच्छता, बैंकिंग और कैरियर विकास के बारे में ग्रामीण भारतीयों के सवालों का उनकी मूल भाषाओं और बोलियों में जवाब दे सके। यह प्रौद्योगिकी (इसे गरीबी उन्मूलन के लिए चैटजीपीटी के रूप में सोचें) जीवन की गुणवत्ता में सुधार के लिए उपमहाद्वीप के विशाल क्षेत्र में आवश्यक जानकारी साझा करने में मदद कर सकती है।
माइक्रोसॉफ्ट रिसर्च की भाषाविद् और प्रमुख शोधकर्ता कालिका बाली कहती हैं कि, ‘मुझे लगता है कि एक ऐसी दुनिया होनी चाहिए जहां भाषा प्रौद्योगिकी के लिए कोई बाधा न बने ताकि हर कोई प्रौद्योगिकी का उपयोग कर सके, चाहे वह कोई भी भाषा, बोली बोलता हो।’ कालिका बाली परियोजना पर गेट्स फाउंडेशन के साथ काम कर रही हैं तथा परियोजना और कार्या के निरीक्षण बोर्ड की अवैतनिक सदस्य हैं। उन्होंने विशेष रूप से लिंग पूर्वाग्रह को कम करने पर काम किया है। उन्होंने श्रमिकों को जोर से पढ़ने के लिए दिए जाने वाले संकेतों को डिजाइन किया है। उनका काम सिर्फ संकेतों के बारे में ही नहीं है। बाली कहती हैं- कार्या का ज्यादा वेतन ‘डेटा की गुणवत्ता को बढ़ाने में बड़ा सहायक है। इससे सिस्टम के आउटपुट की बेहतर सटीकता तुरंत मिल सकेगी।’ वह आगे यह भी कहती हैं आमतौर पर उन्हें कार्या से जो डेटा मिलता है, उसमें एक फीसद से भी कम गलती होती है। जिस डेटा के साथ हम एआई का मॉडल बनाते हैं, उसके मामले में ऐसा लगभग कभी नहीं होता है।
मैं और चोपड़ा कई दिनों तक एकसाथ रहे। इस दौरान चोपड़ा ने मेरे साथ अपनी जिन्दगी के कुछ अंतरंग क्षण साझा किए। चौपड़ा ने ऐसा ही एक वाक्या सुनाया जो कार्या से उनके जुड़ाव को आत्मसात करता है। उनका जन्म 1996 में दिल्ली में रेलवे लाइन के बगल की एक बस्ती में हुआ था। उनके दादा-दादी 1947 में भारत के विभाजन के दौरान पाकिस्तान से शरणार्थी के रूप में वहां आए थे और परिवार दो पीढ़ियों तक वहीं रह रहा था। वह कहते हैं कि हालांकि, उनके माता-पिता सुशिक्षित थे फिर भी कभी-कभी उन्हें भोजन जुटाने के लिए संघर्ष करना पड़ता था। उनके पिता ट्रेन के कल-पुर्जे बनाने वाली एक छोटी फैक्ट्री चलाते थे। डिनर में उनके खाने में सस्ती दाल नहीं, बल्कि अपेक्षाकृत महंगी मैगी इंस्टेंट रेमन होती थी। पर, हर मानसून में बस्ती में गंदा पानी भर जाता था और उनका परिवार कुछ दिनों के लिए पास में ही स्थित दादी के घर चला जाता था। कार्या टीम के बारे में चोपड़ा कहते हैं कि मैं सोचता हूं कि हम सभी इस विचार से प्रेरित हैं कि धन सहारा है जो एक सच्चाई है। हमारा लक्ष्य यथासंभव अधिक से अधिक लोगों को वह सहायता प्रदान करना है।
चोपड़ा ने अपनी बस्ती के स्कूल में उत्कृष्ट प्रदर्शन किया है। यह स्कूल एक एनजीओ चलाता था। जब वह नौंवी कक्षा में थे, उन्हें दिल्ली के एक निजी स्कूल से छात्रवृत्ति मिली। गरीब पृष्ठभूमि के बच्चों को स्कूल में दाखिला देने के लिए प्रतियोगिता हुई थी जिसमें उन्हें सफलता मिली। हालांकि, उन्हें तंग किया गया। वह स्वीकार करते हैं कि कुछ विशेषाधिकारों ने उनके लिए दरवाजे खोलने में मदद की। वह कहते हैं- ‘मेरी जिन्दगी जितनी कठिन थी, भारत में अधिकांश लोगों की तुलना में वह काफी आसान थी क्योंकि मेरा जन्म एक बड़े शहर में, दो शिक्षित माता-पिता के घर और उच्च-जाति के परिवार में हुआ था।’ चोपड़ा जब 17 वर्ष के थे, दिल्ली में एक बस में एक महिला के साथ घृणतापूर्ण तरीके से दुष्कर्म किया गया था। यह एक ऐसा अपराध था जिसने भारत और दुनिया को झकझोर कर रख दिया। चोपड़ा का उस समय कंप्यूटर साइंस के प्रति लगाव बढ़ गया था और वे स्टीव जॉब्स को अपना आदर्श मानते थे। उन्होंने हाथ की घड़ी के स्टाइल में ‘छेड़छाड़-रोधी उपकरण’ बनाया जो बढ़ी हुई हृदयगति का पता लगा सकता था और हमलावर को धीमा बिजली का झटका दे सकता था ताकि पीड़ित को भाग निकलने का समय मिल सके। इस डिवाइस ने मीडिया का ध्यान खींचा और भारत के पूर्व राष्ट्रपति डॉ. ए.पी.जे. अब्दुल कलाम ने चोपड़ा को स्टैनफोर्ड में छात्रवृत्ति के लिए आवेदन करने के लिए प्रोत्साहित किया। (चोपड़ा याद करते हुए कहते हैं कि उन्हें स्टेनफोर्ड के बारे में केवल एक बात ही पता थी कि स्टीव जॉब्स ने वहां पढ़ाई की है। बाद में उन्हें पता चला कि उनकी जानकारी सच नहीं थी) बाद में, चोपड़ा को गैजेट के जरिए यौन हिंसा की समस्या हल करने की कोशिश की नादानी का एहसास हुआ। वह कहते हैं कि प्रौद्योगिकीविदों में किसी समस्या को देखने और उसे हल करने की प्रवृत्ति बहुत अधिक होती है। 11वीं कक्षा के बच्चे की आलोचना करना कठिन है, लेकिन यह बहुत ही तकनीकी समाधान था।
जैसाकि वह बताते हैं कि कैलिफोर्निया में उनका आना कई मायनों में एक सांस्कृतिक झटका था। चोपड़ा कहते हैं- पहली रात को ही उनके छात्रावास में हर छात्र ने यही बताया कि वह अपना पहला अरब डॉलर कैसे कमाएगा। किसी ने ‘पिल्लों (कुत्ते के बच्चों) के लिए स्नैपचैट’ बनाने का सुझाव दिया। उन्हें एहसास हुआ कि यहां तो हर किसी की योजना अरबपति बनने की है, सिवाय उनके। चोपड़ा आगे कहते हैं कि स्टैनफोर्ड में बहुत पहले, उन्हें अकेलापन महसूस होता था, जैसे गलत जगह पर आ गए हों। फिर भी वह कॉलेज में “टेक्नो-यूटोपियन” के रूप में आए थे। धीरे-धीरे उनका अकेलापन दूर होता गया क्योंकि उन्होंने कक्षा में सीखा कि आईबीएम ने कैसे दक्षिण अफ्रीका में अपना श्रमबल बढ़ाने के लिए व्यवस्था बनाई और प्रौद्योगिकी कंपनियों ने कैसे खुद ही लाभ कमाने के लिए दुनिया को नुकसान पहुंचाया।
भारत लौटने के बाद, चोपड़ा माइक्रोसॉफ्ट रिसर्च, जो बिग टैक कंपनी की सहायक कंपनी है, में शामिल हो गए। यह कंपनी मुश्किलभरी सामाजिक समस्याओं पर काम करने के लिए शोधकर्ताओं को बहुत छूट देती है। अपने सहयोगी विवेक शेषाद्रि के साथ, उन्होंने इस मुद्दे पर शोध करना शुरू किया कि क्या डिजिटल का उपयोग करके ग्रामीण भारतीयों तक पैसा पहुंचाना संभव हो सकेगा। चोपड़ा की पहली फील्ड विजिट मुंबई में एक एआई डेटा कंपनी द्वारा संचालित केंद्र की हुई। वह याद करते हुए कहते हैं कि कमरा गंदा, बहुत ही गरम था और लोगों से भरा हुआ था। इमेज एनोटेशन पर काम करने वाले लोग लैपटॉप पर झुके हुए थे। जब उन्होंने इन लोगों से पूछा कि वे कितना कमा लेते हैं, उनका जबाव था 30 रुपए यानी 0.40 डॉलर प्रतिघंटा। उन्हें यह बताने का साहस नहीं था कि जिस डेटा को वे एनोटेट कर रहे थे, उसकी दर, परंपरागत रूप से, उस राशि से 10 गुना है। वह कहते हैं कि मैंने सोचा, काम करने का यह एकमात्र तरीका नहीं हो सकता।
चोपड़ा और शेषाद्रि ने माइक्रोसॉफ्ट रिसर्च में चार वर्ष तक इस विचार पर काम किया, फील्ड-स्टडी की और एक प्रोटोटाइप ऐप बनाया। 2019 में चार सहयोगियों के साथ उन्होंने एक रिसर्च प्रकाशित की। भारत के गांवों में रहने वाले गरीबों के बीच काम करने की उत्साह से भरी यह रिसर्च थी। रिसर्च से चोपड़ा और शेषाद्रि के इस गुमान की पुष्टि हुई कि काम को बिना किसी प्रशिक्षण, कार्यालय के बजाए सिर्फ स्मार्टफोन से, अंग्रेजी न जानने वाले कार्यकर्ताओं के जरिए उच्च मानकों की सटीकता के साथ किया जा सकता है। इस प्रकार न केवल शहर के लोगों तक बल्कि ग्रामीण भारत के सबसे गरीब लोगों तक भी पहुंचना संभव हो गया। 2021 में चोपड़ा और शेषाद्रि ने, माइक्रोसॉफ्ट रिसर्च से अपनी नौकरी छोड़ दी और कार्या को एक स्वतंत्र गैर-लाभकारी संस्था के रूप में स्थापित किया। इसमें तीसरे सह-संस्थापक सफिया हुसैन भी शामिल हुए हैं। (माइक्रोसॉफ्ट की कार्या में कोई इक्विटी नहीं है।)
सिलिकॉन वैली के गरीबों से अमीर बनने की कई कहानियों के विपरीत, चोपड़ा कहते हैं कि उनकी सफलता उनके खुद की कड़ी मेहनता का परिणाम नहीं है। वह कहते हैं- ‘मैं लगातार 100 बार भाग्यशाली रहा। मैं गैर-लाभकारी संस्थाओं, स्कूलों, सरकार की अतार्किक करुणा का उत्पाद हूं-जिनसे हर किसी की मदद करने की अपेक्षा की जाती है, लेकिन वे ऐसा करते नहीं है। जब मुझे इतनी दया मिली है तो मैं कम से कम इतना तो कर ही सकता हूं कि उसे वापस लौटा दूं।’
हर कोई कार्या में काम करने के लिए उपयुक्त नहीं है। चोपड़ा कहते हैं कि शुरुआत में उन्होंने और उनकी टीम ने हर किसी के लिए ऐप को खोला। पर सामने आया कि पहले सौ साइन-अप करने वाले सभी लोग एक ही प्रमुख जाति- समुदाय के पुरुष थे। अनुभव ने उन्हें सिखा दिया है, ‘ज्ञान सत्ता के चैनलों के जरिए बहता है।’ चोपड़ा को पहले ही पता चल गया था कि उन्हें ग्रामीण क्षेत्रों में जमीनी स्तर पर खुद की मौजूगी के साथ गैर-लाभकारी संस्थाओं के साथ मिलकर काम करना होगा। सबसे गरीब समुदायों और हाशिये की जातियों तक पहुंचने के लिए यही रास्ता भी था। यह भी मालुम था कि ये संगठन आय और विविध आवश्यकताओं के अनुरूप कार्या की ओर से एक्सेस कोड वितरित कर सकते हैं। वह कहते हैं कि उन्हें ज्ञात है कि पैसा किसके लिए अच्छा है और किसके लिए यह जीवन बदलने वाला है। यह प्रक्रिया श्रमिकों द्वारा तैयार किए जाने वाले डेटा में ज्यादा विविधता भी सुनिश्चित करती है, जिसकी वजह से एआई पूर्वाग्रह को कम करने में मदद मिल सकती है।
चोपड़ा अपनी इस पद्धति को हिन्दी के एक शब्द -ठहराव- का उपयोग करके परिभाषित करते हैं। भारतीय शास्त्रीय संगीत में उपयोग किए जाने वाला यह एक शब्द है। इसका अनुवाद वह ‘विराम’ और ‘विचारशील प्रभाव’ के मिश्रण के रूप में करते हैं। उनका कहना है कि ठहराव एक अवधारणा है, जो न केवल अंग्रेजी भाषा से गायब है, बल्कि सिलिकॉन वैली, तकनीकी कंपनियों के व्यापार दर्शन से भी गायब है, जो अक्सर पैमाने और गति को बाकी सभी चीजों से ऊपर रखती हैं। उनके लिए ठहराव का अर्थ है-‘हर कदम पर आप रुक रहे हैं और सोच रहे हैं: क्या मैं सही काम कर रहा हूं? क्या हमारा काम उस समुदाय के लिए सही है जिसकी मैं सेवा करने का प्रयास कर रहा हूं?’ वह कहते हैं कि इस तरह की विचारशीलता बहुत से उपक्रमों से गायब है। अब नया मंत्र है- ‘तेजी से आगे बढ़ो और चीजों को अलग कर दो।’ उद्यमों के इसी दृष्टिकोण के कारण कार्या ने कंटेट मॉडरेशन करने के लिए चार ग्राहकों के प्रस्तावों को स्पष्ट रूप से अस्वीकार कर दिया।
यह कथन सम्मोहक है. लेकिन यह कथन एक ऐसे इंसान की तरफ से कहा जा रहा है जिसका कहना है कि वह अपने ऐप को 2030 तक 100 मिलियन भारतीयों तक पहुंचाना चाहता है। क्या जमीनी स्तर के गैर सरकारी संगठनों पर निर्भरता का मतलब यह नहीं है कि कार्या को एक महत्वपूर्ण बाधा का सामना करना पड़ रहा है? दरअसल, चोपड़ा ने मुझसे कहा, कार्या के विस्तार में नए कर्मचारी नहीं तलाश पाना सीमित कारक है। ऐसे लाखों लोग हैं जो उच्च वेतन के अवसर का लाभ उठाएंगे और कार्या ने उन्हें अपने साथ जोड़ने के लिए 200 से अधिक जमीनी स्तर के गैर सरकारी संगठनों का एक जांचा-परखा नेटवर्क बनाया है। वह कहते हैं कि हमें बड़े पैमाने पर जागरूकता बढ़ाने की जरूरत है। चोपड़ा का मानना है कि ऐप के प्रभाव के लिए, उन्हें अधिक ग्राहकों के भरोसे की जरूरत है। ज्यादा प्रौद्योगिकी कंपनियों, सरकारों और शैक्षणिक संस्थानों को राजी करना होगा कि वे कार्या से अपना एआई प्रशिक्षण डेटा प्राप्त करें।
लेकिन अक्सर होता यह है कि नैतिकता पर गर्व करने वाली कंपनियां नए ग्राहकों की तलाश के लिए समझौता कर सकती हैं। ऐसा न होने देने के लिए कार्या क्या करेगी? अपने जवाब के हिस्से में, चोपड़ा कहते हैं कि इसका जवाब कार्या की कॉर्पोरेट संरचना में निहित है। कार्या अमेरिका में एक गैर-लाभकारी संस्था के रूप में पंजीकृत है जो भारत में दो संस्थाओं को नियंत्रित करती है: एक गैर-लाभकारी और एक लाभ के लिए। लाभ कमाने वाली संस्था कानूनी रूप से अपने किसी भी लाभ को (कर्मचारियों को प्रतिपूर्ति करने के बाद) गैर-लाभकारी संस्था को दान देने के लिए बाध्य है जिससे री-इन्वेस्ट होता है। चोपड़ा कहते हैं, कार्या अनुदान निधि लेता है। यह अपने सभी 24 पूर्णकालिक कर्मचारियों के वेतन को कवर करता है लेकिन आंतरिक रूप से गैर-लाभकारी मॉडल संभव होने के लिए पर्याप्त नहीं है। चोपड़ा का कहना है कि इस व्यवस्था से उन्हें या उनके सह-संस्थापकों को आकर्षक अनुबंधों के बदले में श्रमिकों के वेतन या कल्याण से समझौता करने के लिए किसी भी प्रोत्साहन को हटाने का लाभ मिलेगा।
द/नज इंस्टीट्यूट की मैनेजिंग पार्टनर सुभाश्री दत्ता, जिन्होंने कार्या को 20 हजार डॉलर के अनुदान के साथ अपना सहयोग दिया है, कहती हैं-‘कार्या बहुत युवा संस्था है। उसके पास अपने मूल्यों के प्रति ईमानदार रहने और फिर भी पूंजी को आकर्षित करने की क्षमता है। मुझे नहीं लगता कि कार्या लाभ के लिए अथवा गैर-लाभ के लिए कशमकश की स्थिति में रहेगी।
दक्षिणी कर्नाटक में कार्या कार्यकर्ताओं के साथ दो दिन बिताने के बाद कार्या की मौजूदा व्यवस्था की सीमाएं दिखने लगीं। हर कार्यकर्ता का कहना था कि उन्होंने ऐप पर 1,287 टास्क पूरे कर लिए हैं। मेरे दौरे के समय, टीबी परियोजना पर उपलब्ध कार्यों की संख्या में यह अधिकतम है। श्रमिकों को मिलने वाली राशि एक स्वागत योग्य प्रोत्साहन है, लेकिन लंबे समय तक ऐसा नहीं चलने वाला है। अपनी यात्रा में, मैं ऐसे किसी भी कर्मचारी से नहीं मिला, जिसे रॉयल्टी मिली हो। चोपड़ा ने मुझसे कहा कि कार्या ने खरीदारों के लिए पर्याप्त पुनर्विक्रय योग्य डेटा एकत्र किया है; अब तक लगभग 4,000 श्रमिकों को 1,16,000 डॉलर की रॉयल्टी बांटी गई है।
मैंने चोपड़ा से बातचीत में कहा कि इन ग्रामीणों के जीवन पर सार्थक असर पड़ने में अभी बहुत समय लगेगा? उन्होंने जवाब दिया कि टीबी परियोजना तो अभी इन कामगारों के लिए शुरुआत है। वे जल्द ही ट्रांसक्रिप्सन टास्क पर काम शुरू करने जा रहे हैं। ट्रांसक्रिप्सन टास्क कन्नड़ सहित कई क्षेत्रीय भाषाओं में एआई मॉडल बनाने के लिए भारत सरकार के प्रयासों का हिस्सा है। उनका कहना है कि इससे कार्या को चिलुकावडी में ग्रामीणों को “बहुत ज्यादा” काम देने की अनुमति मिलेगी। फिर भी कामगार 1,500 डॉलर से बहुत दूर हैं जो कार्या के सिस्टम में है। चोपड़ा ने स्वीकार भी किया कि कार्या के 30,000 कर्मचारियों में से एक भी 1,500 डॉलर की सीमा तक नहीं पहुंचा है। फिर भी काम के प्रति उनका लगाव, काम के प्रति उनकी अधिक इच्छा स्पष्ट है। शेषाद्रि, जो अब कार्या के मुख्य प्रौद्योगिकी अधिकारी हैं, ने जब कामगारों से भरे कमरे में जब उनसे पूछा कि क्या वह कन्नड़ वाक्यों में अशुद्धियों को चिह्नित करने वाले नए कार्य में खुद को सक्षम महसूस करेंगे तो वे उत्साहित हो गए. उन्होंने सर्वसम्मति से हां में जवाब दिया।
मैं चिलुकावाडी और अलहल्ली गांव में जिन लोगों से मिला और बात की तो लगा कि उनकी ऑर्टिफिशियल इंटेलीजेंस के बारे में समझ सीमित है। चोपड़ा कहते हैं कि श्रमिकों को यह समझाना चुनौतीपूर्ण हो सकता है कि वे क्या कर रहे हैं। उनका कहना है कि उनकी टीम ने समझाने का जो सबसे सफल तरीका खोजा है, वह है कर्मचारियों को यह बताना कि वे ‘ कंप्यूटर को कन्नड़ बोलना सिखा रहे हैं’। यहां कोई भी चैटजीपीटी के बारे में नहीं जानता, लेकिन गांव वालों को मालुम है कि गूगल असिस्टेंट (जिसे वे ‘ओके गूगल’ कहते हैं) तब बेहतर काम करता है जब आप इससे अपनी मातृभाषा की तुलना में अंग्रेजी में कहते हैं। तीन बच्चों के 35 वर्षीय बेरोजगार पिता सिद्धाराजू एल. का कहना है कि उन्हें नहीं मालुम कि एआई क्या होता है, लेकिन अगर कंप्यूटर उनकी भाषा बोल सके तो उन्हें गर्व महसूस होगा। मेरे मन में अपने माता-पिता के लिए जितना सम्मान है, उतना ही सम्मान अपनी मातृभाषा के लिए भी है। जिस तरह भारत 4जी मामले में बाकी दुनिया से आगे निकलने में सक्षम था, क्योंकि उस पर मौजूदा मोबाइल डेटा इंफ्रास्ट्रक्चर का बोझ नहीं था। उम्मीद है कि उसी तरह कार्या की कोशिशों से भारतीय भाषा की एआई परियोजनाओं को सीखने में मदद मिलेगी। कहीं अधिक विश्वसनीय और निष्पक्ष बिंदु से शुरुआत करें। स्पीच शोधकर्ता बाली अपने उच्चारण को संदर्भित करते हुए कहती हैं, ‘कुछ वक्त पहले तक अंग्रेजी के लिए स्पीच-पहचान इंजन मेरी अंग्रेजी भी नहीं समझता था।’ वह यह भी कहती हैं-‘एआई प्रौद्योगिकियों के होने का क्या मतलब, अगर वे उपयोगकर्ताओं की जरूरत पूरा नहीं कर पाएं?’

You may have missed