(मार्च 17, 2024) हिमाचल प्रदेश के सुंदर पहाड़ों में एक नदी घाटी है - कांगड़ा - जो गर्मजोशी से भरे हिमाचली लोगों का घर है जो अपनी भाषा और रीति-रिवाजों को संजोते हैं। यह खूबसूरत भाषा अपना प्रभाव उत्तरी पंजाब तक फैलाती है - जहां दिल्ली के किशोर नव्वे आनंद की पारिवारिक जड़ें हैं। हालाँकि उनका परिवार दिल्ली में बस गया, लेकिन अपनी संस्कृति और विरासत से उनका जुड़ाव कांगड़ी भाषा के माध्यम से मजबूत बना हुआ है। जब उन्हें पता चला कि कांगड़ी भाषा यूनेस्को की 10 लुप्तप्राय भाषाओं की सूची में है, तो उन्होंने कार्रवाई करने का आह्वान किया। “मैंने भाषा को पुनर्जीवित करने के तरीकों की तलाश शुरू कर दी, और मुख्य रूप से मौखिक माध्यम का लाभ उठाने पर ध्यान केंद्रित किया। कांगड़ी में लिखित साहित्य की कमी को पहचानते हुए, मैंने एएसआर (ऑटोमेटेड स्पीच रिकग्निशन) की ओर रुख किया - जो मानव भाषण को लिखित पाठ में परिवर्तित करता है, ”वह बताते हैं वैश्विक भारतीय.
परंपरागत रूप से, भाषाविज्ञान मौखिक परंपराओं को मैन्युअल रूप से लिखने के लिए स्थानीय लोगों के साथ घंटों बिताता है, जिसमें अक्सर मानवीय त्रुटि की गुंजाइश के साथ-साथ भारी मात्रा में समय और प्रयास की आवश्यकता के कारण बाधाओं का सामना करना पड़ता है। “एएसआर का उपयोग प्रतिलेखन प्रक्रिया को सुव्यवस्थित करने के लिए किया जा सकता है। एआई में हाल की प्रगति ने पहले की तुलना में बहुत अधिक उच्च स्तर पर एएसआर का उपयोग करना संभव बना दिया है, ”नववे कहते हैं, जिनके प्रोजेक्ट, लुप्तप्राय भाषाओं के लिए क्रॉस-लिंगुअल ऑटोमैटिक स्पीच रिकॉग्निशन ने उन्हें $4800 का स्पिरिट ऑफ रामानुजन अनुदान जीता। हर साल, वर्जीनिया विश्वविद्यालय और टेम्पलटन वर्ल्ड चैरिटी ऑर्गनाइजेशन संयुक्त रूप से हाई स्कूल के छात्रों को अनुदान प्रदान करते हैं जो गणित और विज्ञान में असाधारण प्रतिभा प्रदर्शित करते हैं।
अनुदान के साथ, नवये ने अमेरिका में वोल्फ्राम हाई स्कूल ग्रीष्मकालीन कार्यक्रम में भाग लिया। "मैंने डॉ. स्टीवन वोल्फ्राम से सीखा, जो एक अग्रणी कंप्यूटर वैज्ञानिक और भाषाविद् हैं, और मुझे अपनी भाषाई क्षमताओं को निखारने और भाषाविज्ञान के बारे में और अधिक जानने का अवसर मिला," किशोर कहते हैं, जिन्होंने संख्या सिद्धांत पर यूलर सर्कल कार्यक्रम में भी भाग लिया था। "मैंने अनुदान का उपयोग अपनी शिक्षा में सहायता के लिए किया।"
शब्दों और भाषाओं से प्यार
अपने दादा के साथ बड़े होते हुए, जो सात भाषाओं में पारंगत बहुभाषी थे, नव्ये शब्दों और भाषाओं के प्रति ऐसे आकर्षित थे जैसे पतंगा आग की ओर आकर्षित होता था। “भाषाओं के प्रति मेरा प्रेम विरासत में मिला है, इसने मेरे पालन-पोषण में महत्वपूर्ण भूमिका निभाई,” किशोर कहता है, “भाषा के प्रति हमारे सामान्य प्रेम के कारण हम एक-दूसरे से बंधे, और हर बार जब मुझे किसी अज्ञात भाषा में एक नया पेंडोरा बॉक्स मिलता है, तो मैं” मैं उसके पास जाऊंगा और चर्चा करूंगा। मुझे उनके साथ भाषाओं के बारे में बात करना अच्छा लगता था। हम अक्सर किसी भाषा की कुछ विशिष्टताओं पर ध्यान केंद्रित करते हैं - जैसे कि शर्करा (गुड़) - एक उर्दू शब्द और अंग्रेजी में चीनी के बीच समानता। भाषाविज्ञान के प्रति मेरा प्रेम मुझमें सहज रूप से अंतर्निहित था।”
2022 में अपने दादाजी के निधन के बाद, नव्वे ने अपनी मूल भाषा की एक बोली को पुनर्जीवित करने की दिशा में काम करके उन्हें श्रद्धांजलि देने का फैसला किया। इसके अलावा, 2018 में कांगड़ा घाटी क्षेत्र की उनकी यात्रा ने उन्हें लोगों की गर्मजोशी से प्यार कर दिया। “उनके पास बताने के लिए हमेशा कोई न कोई लोककथा या कहानी होती थी और उन्हें अपनी संस्कृति और विरासत पर गर्व था। मुझे लगा कि यह विरोधाभासी है कि कांगड़ी एक लुप्तप्राय भाषा है क्योंकि ये लोग अपनी संस्कृति और विरासत से प्यार करते हैं। मैंने सोचा कि अगर मैं एआई में प्रगति के साथ उनके प्यार को एकजुट कर सकूं, तो यह एक बेहतरीन परियोजना होगी।''
कांगड़ी को संरक्षित करने के लिए एआई का उपयोग करना
इससे उन्हें पिछले शोधकर्ताओं के पेपर पढ़ने को मिले जिन्होंने अन्य भाषाओं के लिए एएसआर का उपयोग किया था। एक विशेष रूप से दिलचस्प अध्ययन बोस्टन कॉलेज के सहायक प्रोफेसर एमिली प्रूडहोमॉक्स द्वारा किया गया था, जिन्होंने अमेरिका में लुप्तप्राय भाषा - सेनेका को पुनर्जीवित करने का प्रयास किया था। "उनके शोध पत्रों ने मुझे कार्यप्रणाली को समझने में मदद की और बताया कि शोधकर्ता एएसआर का उपयोग कैसे करते हैं।" बाद में, वह राष्ट्रीय प्रौद्योगिकी संस्थान हमीरपुर की शोधकर्ता डॉ. श्वेता चौहान के पास पहुंचे, जिन्होंने कांगड़ी भाषा के लिए एक पाठ संग्रह तैयार किया था। "उसने मुझे अपनी लैब में इंटर्नशिप के लिए आमंत्रित किया, और तब से वह एक अमूल्य गुरु रही है।"
एएसआर में नवाचार भाषाविदों को उनके प्राकृतिक वातावरण में बातचीत को रिकॉर्ड करने और किसी भी मौखिक माध्यम को मैन्युअल रूप से डिजिटल किए बिना उनके सार को पकड़ने की अनुमति देता है। इस प्रक्रिया को समझाते हुए, Navvye ने विस्तार से बताया कि एक नियमित माइक को ASR मॉडल में फीड किया जा सकता है जो सटीक ट्रांसक्रिप्शन देने में मदद करता है। ऑडियो को ASR के माध्यम से टेक्स्ट में परिवर्तित किया जा रहा है। "वर्तमान में, सटीकता 85 प्रतिशत है, और समय के साथ, मेरा उद्देश्य अतिरिक्त डेटा इकट्ठा करना और 95 प्रतिशत की लक्ष्य सटीकता प्राप्त करने के लिए सिस्टम को बढ़ाना है।" यह परियोजना दो मोर्चों पर संचालित होती है - एक, जहां नव्वे व्यक्तिगत रूप से एएसआर का उपयोग करके बातचीत रिकॉर्ड करके डेटा एकत्र करता है, और दूसरा, जहां वह स्थानीय अनुवादकों से जुड़ता है जो एएसआर का उपयोग करके उसे ऑडियो ट्रांस्क्रिप्शन भेजते हैं। “यह मुझे एक मजबूत ऑडियो प्रदर्शनों की सूची बनाने की अनुमति देता है। इसके अतिरिक्त, मैं भारत सरकार के साथ उनके भाषिनी कार्यक्रम के माध्यम से साझेदारी कर रहा हूं, और अधिक कांगड़ी डेटा एकत्र करने के लिए उनके संसाधनों का लाभ उठा रहा हूं। मैं ऑडियो प्रदर्शनों की सूची का विस्तार करने के लिए उत्सुक हूं क्योंकि यह बेहतर सटीकता के साथ मॉडल को और बेहतर बनाने के लिए विशाल डेटासेट प्रदान करेगा।
जब नव्वे ने शुरुआत की तो वह केवल 15 वर्ष के थे, लेकिन अपने सपने को हकीकत में बदलने के जुनून ने उन्हें अपने माता-पिता और कांगड़ा के लोगों के समर्थन से आगे बढ़ने के लिए प्रेरित किया। हालाँकि, रास्ते में उन्हें अपनी यात्रा में कुछ तकनीकी अड़चनों का सामना करना पड़ा, जो मुख्य रूप से डेटा संग्रह, सफाई, मॉडल चयन और फाइन-ट्यूनिंग से संबंधित थीं। “अन्य मॉडलों के साथ प्रयोग करने के बाद, मैंने ओपन एआई के व्हिस्पर को चुना, जो अत्याधुनिक वाक् पहचान मॉडल है। एक साधारण विचार को फलीभूत करना कठिन है, लेकिन जब उद्देश्य नेक होगा, तो लोग आपका समर्थन करेंगे,'' उन्होंने आगे कहा।
यह भी पढ़ें | कार्या को एआई से प्रेरित: 2024 में एआई स्टार्टअप की आशा है
प्रभाव पैदा करना
पिछले दो वर्षों में, Navvye के काम ने विभिन्न अनुवादकों को कांगड़ी डोमेन में काम करने वाली बहुराष्ट्रीय कंपनियों से जोड़कर सशक्त बनाया है। "मैंने कुछ अनुवादकों को लेनोवो से संपर्क करने के लिए आवश्यक जानकारी इकट्ठा करने में मदद की है, उनकी लिंक्डइन प्रोफ़ाइल बनाई है, और उनके लिए तकनीकी दस्तावेज़ भरे हैं," नववे कहते हैं, जो स्कूली बच्चों के बीच कांगड़ी भाषा के महत्व के बारे में जागरूकता भी पैदा कर रहे हैं। उनसे कांगड़ी के लुप्तप्राय भाषा होने के पीछे के संभावित कारण के बारे में पूछें, उन्होंने तुरंत जवाब दिया, “कांगड़ी की तुलना में अब अधिक लोग हिंदी बोल रहे हैं क्योंकि वैश्वीकरण के कारण वे अपनी मूल बोली बोलने से हतोत्साहित हो रहे हैं। इसे पर्याप्त अच्छा नहीं माना जाता है - कुछ ऐसा जिसका हमें मुकाबला करने की ज़रूरत है,'' किशोर का कहना है।
अपने पूर्वजों की लुप्त होती भाषा को संरक्षित करने पर गर्व करते हुए, नव्वे कहते हैं कि श्रम का फल बहुत बड़ा है लेकिन काम अभी खत्म नहीं हुआ है। “अभी लंबा सफर तय करना है लेकिन जिस तरह से यह चल रहा है उससे मैं खुश हूं। मैं अपनी भाषा के संरक्षण के प्रयासों में शामिल होकर सम्मानित महसूस कर रहा हूं, जो इतिहास और विमर्श का एक समृद्ध मिश्रण है,'' नवेये कहते हैं। चूँकि वह इस पतझड़ में कैलिफोर्निया इंस्टीट्यूट ऑफ टेक्नोलॉजी में शामिल होने की योजना बना रहा है, वह इस परियोजना के प्रति प्रतिबद्ध रहना चाहता है, और दूर से परियोजना की दिशा में आगे काम करने के लिए प्रौद्योगिकी की शक्ति का उपयोग करने की अपनी क्षमता में विश्वास रखता है। “मेरे पास अपना ज्ञान बढ़ाने के लिए एक उचित सहायता प्रणाली होगी। मेरे पास एम्बेडिंग का उपयोग करके बोलियों को वर्गीकृत करने के बारे में पहले से ही एक नया विचार है जो विभिन्न बोलियों को समूहित करने और उन्हें पहचानने में मदद कर सकता है, ”नेववे ने खुलासा किया, यह कहते हुए कि इसका उपयोग अन्य भाषाओं के लिए एक मॉडल के रूप में किया जा सकता है।
साथी किशोरों को सलाह देते हुए, नव्वे ने उन्हें विश्वास की छलांग लगाने से डरना बंद करने के लिए कहा। वह कहते हैं, ''असफलता से डरना असफलता की ही निशानी है।'' उन्होंने आगे कहा, ''चिंता मत करो कि यह काम करेगा या नहीं, तुम्हें अपना रास्ता मिल जाएगा। यदि यह काम नहीं करता है, तो आप इस प्रक्रिया में कुछ नया सीखेंगे। हो सकता है कि आप इसमें बदलाव कर सकें ताकि यह भविष्य में बेहतर काम करे।''
- नवव्ये आनंद को फॉलो करें लिंक्डइन