Gemini: गूगल ने लॉन्च किया स्पेशल एआई मॉडल, इसकी मदद से इंसानों की तरह काम करेंगे रोबोट
Gemini AI: Google ने अपने ब्लॉग में लिखा है, "AI को भौतिक दुनिया में उपयोगी और सहायक बनने के लिए, उसमें 'embodied reasoning' यानी इंसानों जैसी समझ और प्रतिक्रिया देने की क्षमता होनी चाहिए, ताकि वह सुरक्षित तरीके से कार्यों को अंजाम दे सके।"

विस्तार
Google ने 2023 में अपना पहला AI मॉडल, Gemini लॉन्च किया था। तब से कंपनी लगातार अपने मॉडलों को और हाईटेक बनाने पर काम कर रही है। तर्कशीलता से लेकर इमेज जेनरेशन तक, Google का Gemini कई क्षमताओं से लैस है। अब कंपनी ने अपने नए AI मॉडल्स की घोषणा की है, जो रोबोट्स को इंसानों की तरह काम करने में सक्षम बनाएंगे। ये मॉडल्स Gemini Robotics और Gemini Robotics ER हैं।

MHA: डिजिटल अरेस्ट स्कैम पर सरकार का बड़ा एक्शन! WhatsApp और Skype के हजारों अकाउंट्स ब्लॉक
Google ने अपने ब्लॉग में लिखा है, "AI को भौतिक दुनिया में उपयोगी और सहायक बनने के लिए, उसमें 'embodied reasoning' यानी इंसानों जैसी समझ और प्रतिक्रिया देने की क्षमता होनी चाहिए, ताकि वह सुरक्षित तरीके से कार्यों को अंजाम दे सके।"
Gemini Robotics: क्या है और यह कैसे काम करता है?
Google के अनुसार, Gemini Robotics एक "vision-language-action (VLA) मॉडल" है, जिसे Gemini 2.0 के आधार पर तैयार किया गया है। इसमें एक नई क्षमता जोड़ी गई है- भौतिक क्रियाएं (physical actions) करने की, जिससे यह रोबोट्स को सीधे नियंत्रित कर सकता है। इस मॉडल में तीन महत्वपूर्ण विशेषताएं शामिल हैं, जो इसे खास बनाती हैं
- जनरलिटी (Generality)- यह नए वातावरण और परिस्थितियों के अनुकूल ढल सकता है।
- इंटरैक्टिविटी (Interactivity)- यह लोगों और अपने आसपास के माहौल के साथ प्रभावी ढंग से बातचीत कर सकता है।
- डेक्स्टेरिटी (Dexterity)- यह नाजुक कार्यों को भी कुशलता से कर सकता है, जैसे कागज मोड़ना या बोतल का ढक्कन खोलना।

यह मॉडल इंसानी भाषा को बेहतर ढंग से समझता है और उसके अनुसार अपनी क्रियाओं को समायोजित करता है। इसके अलावा, यह लगातार अपने वातावरण की निगरानी करता है और किसी भी बदलाव का तुरंत जवाब देता है। इसकी यह क्षमता इसे घरों से लेकर कार्यस्थलों तक, विभिन्न जगहों पर उपयोगी बनाती है।
Google ने यह भी बताया कि चूंकि रोबोट्स अलग-अलग आकार और डिजाइन में आते हैं, इसलिए Gemini Robotics को भी इसी अनुरूप विकसित किया गया है। इसे ALOHA 2 (bi-arm robotic platform) पर प्रशिक्षित किया गया है, लेकिन यह Franka arms जैसे अन्य रोबोटिक प्लेटफॉर्म्स को भी नियंत्रित कर सकता है।
Gemini Robotics ER

Gemini Robotics के साथ ही Google ने Gemini Robotics ER भी पेश किया है। यह मॉडल रोबोटिक्स के लिए विशेष रूप से स्थानिक तर्क (spatial reasoning) को बेहतर बनाता है और रोबोटिक इंजीनियरों को इसे अपने मौजूदा सिस्टम में आसानी से एकीकृत करने की सुविधा देता है।
Gemini Robotics ER, Gemini 2.0 की क्षमताओं को और बढ़ाता है, जिससे इसमें 3D डिटेक्शन और पॉइंटिंग (इशारा करने) की शक्ति बढ़ जाती है। यह मॉडल Gemini के कोडिंग कौशल को स्थानिक तर्क के साथ जोड़कर नए कार्य करने की क्षमता विकसित करता है। उदाहरण के लिए, यदि इसे एक कॉफी मग दिखाया जाए, तो यह तुरंत तय कर सकता है कि उसे हैंडल से दो उंगलियों से पकड़ना है और उसके पास जाने का सुरक्षित मार्ग कौन-सा होगा।