Samwad 2026: विदेशी तकनीक लागू करना 'भारतीयता' नहीं, BharatGPT फाउंडर ने बताया कैसा हो असली देशी LLM
Amar Ujala Samwad Lucknow 2026: अमर उजाला संवाद उत्तर प्रदेश 2026 का आयोजन राजधानी लखनऊ में जारी है। दो दिवसीय संवाद के दूसरे दिन आज भारत जीपीटी के संस्थापक एवं सीईओ अंकुश सभरवाल इस कार्यक्रम में भाग लेने पहुंचे हैं। 'एआई और नया भारत' सेशन के अंतर्गत अंकुश ने अपनी एआई को लेकर सवालों के जवाब दिए और अपनी बात रखी।
खबरें लगातार पढ़ने के लिए अमर उजाला एप डाउनलोड करें
या
वेबसाइट पर पढ़ना जारी रखने के लिए वीडियो विज्ञापन देखें
अगर आपके पास प्रीमियम मेंबरशिप है तो
विस्तार
अमर उजाला संवाद उत्तर प्रदेश 2026 का आयोजन राजधानी लखनऊ में जारी है। इस वैचारिक कार्यक्रम में कई मशहूर नेता, अभिनेता और चर्चित चेहरों ने शिरकत की। इन्हीं चर्चित चेहरों में से एक देश में एआई का बड़ा चेहरा 'भारत जीपीटी' के फाउंडर 'अंकुश सभरवाल' भी शामिल हुए। संवाद के मंच पर न सिर्फ अपनी राय रखी बल्कि कुछ मुश्किल सवालों का भी जवाब दिया। आइए देखते हैं क्या थे वो सवाल?
सवाल: क्या 'भारतजीपीटी' ग्लोबल LLM का सिर्फ एक भारतीय संस्करण है या आप मूल रूप से कुछ अलग कर रहे हैं? आखिर इसमें 'भारतीयता' के अंश कहां हैं?
अंकुश सबरवाल (BharatGPT):
जब हम किसी चीज को भारतीय कहते हैं तो उसका मतलब यह कतई नहीं है कि हम बाहर से कोई तकनीक लाएं और उसे यहां लागू कर दें। असली भारतीयता तब है, जब उसका सारा रॉ-मटेरियल भी इसी देश में बना हो। एआई की दुनिया में डेटा ही रॉ-मटेरियल है। इसलिए, जब हम एक भारतीय LLM की बात करते हैं तो उसका डेटा भी पूरी तरह से भारतीय होना चाहिए।
यहां डेटा से हमारा मतलब केवल आंकड़ों से नहीं, बल्कि भारत की सोच, हमारी सभ्यता, लहजे और संवाद के उस तरीके से है। बिल्कुल वैसे ही, जैसे हम चाय पर चर्चा करते हैं। भारतजीपीटी में न सिर्फ 14 भारतीय भाषाओं का सपोर्ट है, बल्कि इसमें एक दमदार वॉइस मॉडल भी मौजूद है।
आजकल के ज्यादातर ग्लोबल एआई मॉडल रेडिट जैसे विदेशी प्लेटफॉर्म के डेटा से तैयार किए गए हैं। अगर हम उस डेटा को लेकर अपना मॉडल बनाएंगे तो उसमें भारतीय सोच कभी नहीं आ पाएगी। हालांकि, मैं यह नहीं कहता कि चैटजीपीटी या जेमिनी का इस्तेमाल करना गलत है। मैं खुद उनका इस्तेमाल करता हूं। जिसकी जहां जरूरत हो, उसका वहां इस्तेमाल होना चाहिए। हमारी जिद सिर्फ स्वदेशी प्रोडक्ट इस्तेमाल करने की नहीं होनी चाहिए, बल्कि मुख्य उद्देश्य अपनी समस्या का सही समाधान खोजना होना चाहिए।
सवाल: वो कौन सा डेटा है जिस पर आप भारत जीपीटी को ट्रेन (सिखाते) करते हैं?
अंकुश सबरवाल (BharatGPT):
हमने 2016 में कंपनी बनाई थी और अब तक हमारे प्लेटफार्म को करीब 1.8 करोड़ यूजर्स ने इस्तेमाल किया है। इसमें करीब 20-30 प्रतिशत डेटा हमारे पास हैं। कुछ ऐसे क्लाइंट हैं जो हमें डेटा इस्तेमाल करने की आजादी देते हैं, जिससे हम अपने LLM को ट्रेन (सिखा) कर पाते हैं। कई संस्थान हैं जहां हमें डेटा इस्तेमाल करने की आजादी मिली है, इसमें हेल्थकेयर, ट्रैवल, BFSI और रिटेल टर्मिनल्स शामिल हैं। कोविड के दौरान हमने 'Ask Doc' बनाया था। उस मॉडल में सिर्फ आवाज नहीं बल्कि असली डॉक्टर का एआई अवतार आपसे बात करता है।
इसी तरीके के करीब 15 हजार से 20 हजार प्लेटफार्म थे, जिन्हें हमने एजेंट्स के रूप में इस्तेमाल किया। हमारे ज्यादातर यूजर्स या कस्टमर्स भारत में ही हैं, तो हमारे पास काफी डेटा है। लेकिन हमने LLM बनाने के लिए शायद 10 प्रतिशत डेटा भी इस्तेमाल नहीं किया। हम 1 ट्रिलियन पैरामीटर का मॉडल भी बना सकते हैं लेकिन हमारा भारत जीपीटी सिर्फ आधा बिलियन पैरामीटर पर बना है। क्योकिं इतनी ही जरूरत है, अगर बड़ा मॉडल चाहिए तो उसके लिए दूसरे LLM इस्तेमाल किए जा सकते हैं। हम सिर्फ उद्देश्य संचालित मॉडल हैं जो विशिष्ट समस्या सुलझाने के लिए बने हैं।
सवाल: भारत जीपीटी का वॉइस फीचर इसके पीछे का उद्देश्य क्या है? और इससे आपको डेटा ट्रेन करने में कितना फायदा हुआ?
अंकुश सबरवाल (BharatGPT):
ये प्रश्न व्यक्ति को खुद से पूछना चाहिए कि वे सवाल पूछने के लिए वॉइस फीचर का इस्तेमाल क्यों नहीं कर रहे? वो भी तब जब आवाज संचार का प्राकृतिक माध्यम है। बाकि तकनीको में भी वॉइस कमांड का इस्तेमाल होता है। आज-कल के बच्चे टाइपिंग से ज्यादा वॉइस कमांड पर भरोसा करते हैं। मांग को देख कर नहीं बल्कि प्राकृतिक दृष्टिकोण देख कर कोई भी चीज बनाते हैं, क्योकिं प्राकृतिक चीज भूलना बहुत मुश्किल है और उसे सिखाने की भी जरूरत नहीं है। वॉइस के साथ वीडियो की भी तकनीक उपलब्ध है लेकिन लोग अभी उसको पूरी तरह अपना नहीं पाएं हैं।