{"_id":"6836e34e559b6c3c990ba4de","slug":"google-unveiled-new-ai-tool-to-convert-sign-language-into-text-launch-expected-next-year-2025-05-28","type":"story","status":"publish","title_hn":"Google AI: गूगल का नया करिश्मा! आ गया साइन लैंग्वेज को टेक्स्ट में बदलने वाला एआई मॉडल","category":{"title":"Tech Diary","title_hn":"टेक डायरी","slug":"tech-diary"}}
Google AI: गूगल का नया करिश्मा! आ गया साइन लैंग्वेज को टेक्स्ट में बदलने वाला एआई मॉडल
टेक डेस्क, अमर उजाला, नई दिल्ली
Published by: नीतीश कुमार
Updated Wed, 28 May 2025 03:57 PM IST
विज्ञापन
सार
Google Sign Language To Text AI Tool: गूगल ने साइन लैंग्वेज को टेक्स्ट में बदलने वाला नया एआई मॉडल SignGemma पेश किया है। यह तकनीक दिव्यांगजन, विशेष रूप से मूक-बधिर समुदाय के लिए संचार को आसान और अधिक समावेशी बनाने की दिशा में एक बड़ा कदम मानी जा रही है।

Artificial Intelligence(AI), आर्टिफिशियल इंटेलिजेंस(एआई)
- फोटो : Freepik
विज्ञापन
विस्तार
गूगल ने हाल ही में आयोजित अपने वार्षिक इवेंट Google I/O 2025 में SignGemma नामक एक उन्नत आर्टिफिशियल इंटेलिजेंस मॉडल की घोषणा की है, जो साइन लैंग्वेज को टेक्स्ट में बदलने में सक्षम है। यह तकनीक विशेष रूप से मूक-बधिर और श्रवण बाधित व्यक्तियों के लिए डिजाइन की गई है, जिससे उन्हें दूसरों से संवाद करने में मदद मिलेगी।
गूगल के मुताबिक, SignGemma अब तक का उनका सबसे उन्नत साइन लैंग्वेज समझने वाला मॉडल है। कंपनी इसे एक ओपन मॉडल के तौर पर तैयार कर रही है, जिससे डेवलपर्स और शोधकर्ता इसमें भागीदारी कर सकें और इसे और बेहतर बना सकें। Gemma प्रोडक्ट मैनेजर गस मार्टिन्स ने बताया कि यह मॉडल विभिन्न प्रकार की साइन लैंग्वेज को समझने में सक्षम है, लेकिन अभी यह अमेरिकी साइन लैंग्वेज (ASL) और अंग्रेजी के साथ सबसे बेहतर प्रदर्शन करता है।
दिव्यांगजनों के काम आएगा यह मॉडल
उन्होंने कहा, “SignGemma को सटीक और रीयल-टाइम अनुवाद के लिए तैयार किया गया है। हमें उम्मीद है कि यह तकनीक मूक-बधिर समुदाय के लिए नई संभावनाएं खोलेगी और उन्हें आत्मनिर्भर बनाने में मदद करेगी।”
DeepMind की ओर से X (पहले ट्विटर) पर किए गए एक आधिकारिक पोस्ट में कहा गया, “हम SignGemma के लॉन्च की घोषणा करते हुए उत्साहित हैं। यह तकनीक दुनिया भर के मूक-बधिर समुदायों के अनुभवों, जरूरतों और सुझावों से प्रेरित होकर विकसित की जा रही है।”
यह भी पढ़ें: यूपीआई यूजर्स ध्यान दें! अब सिर्फ 50 बार ही कर पाएंगे बैलेंस चेक, जल्द बदलने वाले हैं ये 5 नियम
फिलहाल यह मॉडल परीक्षण चरण में है और कंपनी इसे 2025 के अंत तक आम जनता के लिए उपलब्ध कराने की योजना बना रही है। इस दौरान, गूगल ने शोधकर्ताओं, डेवलपर्स और वैश्विक मूक-बधिर समुदायों को आमंत्रित किया है कि वे इस तकनीक को टेस्ट करें और फीडबैक दें, ताकि इसे अधिक उपयोगी और प्रभावशाली बनाया जा सके।
गूगल ने लॉन्च किए नए एआई बेस्ड फीचर
Google I/O 2025 में इस बार एक्सेसिबिलिटी को खास महत्व दिया गया। कंपनी ने कई नए एआई-आधारित फीचर लॉन्च किए हैं, जो तकनीक को सभी के लिए सुलभ बनाने की दिशा में उठाया गया कदम हैं। इनमें से एक प्रमुख फीचर TalkBack में Gemini AI का एकीकरण है, जिससे स्क्रीन पर मौजूद इमेज का एआई जनरेटेड विवरण दिया जा सकेगा और उपयोगकर्ता उससे जुड़े सवाल भी पूछ सकेंगे।
इसके अलावा, गूगल ने क्रोम ब्राउज़र में एक नया फीचर जोड़ा है, जिसमें OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) के ज़रिए स्कैन की गई PDF फाइल्स को पढ़ने, सर्च करने और टेक्स्ट के साथ इंटरैक्ट करने की सुविधा मिलेगी। Chromebook पर छात्रों के लिए ‘Face Control’ नामक एक नई एक्सेसिबिलिटी टूल भी जोड़ा गया है, जिससे वे चेहरे की हरकतों से डिवाइस को कंट्रोल कर सकेंगे। गूगल की इन पहलों से यह स्पष्ट है कि कंपनी एआई को न सिर्फ स्मार्ट बना रही है, बल्कि उसे हर वर्ग के लोगों के लिए उपयोगी और समावेशी भी बना रही है।

Trending Videos
गूगल के मुताबिक, SignGemma अब तक का उनका सबसे उन्नत साइन लैंग्वेज समझने वाला मॉडल है। कंपनी इसे एक ओपन मॉडल के तौर पर तैयार कर रही है, जिससे डेवलपर्स और शोधकर्ता इसमें भागीदारी कर सकें और इसे और बेहतर बना सकें। Gemma प्रोडक्ट मैनेजर गस मार्टिन्स ने बताया कि यह मॉडल विभिन्न प्रकार की साइन लैंग्वेज को समझने में सक्षम है, लेकिन अभी यह अमेरिकी साइन लैंग्वेज (ASL) और अंग्रेजी के साथ सबसे बेहतर प्रदर्शन करता है।
विज्ञापन
विज्ञापन
दिव्यांगजनों के काम आएगा यह मॉडल
उन्होंने कहा, “SignGemma को सटीक और रीयल-टाइम अनुवाद के लिए तैयार किया गया है। हमें उम्मीद है कि यह तकनीक मूक-बधिर समुदाय के लिए नई संभावनाएं खोलेगी और उन्हें आत्मनिर्भर बनाने में मदद करेगी।”
DeepMind की ओर से X (पहले ट्विटर) पर किए गए एक आधिकारिक पोस्ट में कहा गया, “हम SignGemma के लॉन्च की घोषणा करते हुए उत्साहित हैं। यह तकनीक दुनिया भर के मूक-बधिर समुदायों के अनुभवों, जरूरतों और सुझावों से प्रेरित होकर विकसित की जा रही है।”
यह भी पढ़ें: यूपीआई यूजर्स ध्यान दें! अब सिर्फ 50 बार ही कर पाएंगे बैलेंस चेक, जल्द बदलने वाले हैं ये 5 नियम
फिलहाल यह मॉडल परीक्षण चरण में है और कंपनी इसे 2025 के अंत तक आम जनता के लिए उपलब्ध कराने की योजना बना रही है। इस दौरान, गूगल ने शोधकर्ताओं, डेवलपर्स और वैश्विक मूक-बधिर समुदायों को आमंत्रित किया है कि वे इस तकनीक को टेस्ट करें और फीडबैक दें, ताकि इसे अधिक उपयोगी और प्रभावशाली बनाया जा सके।
गूगल ने लॉन्च किए नए एआई बेस्ड फीचर
Google I/O 2025 में इस बार एक्सेसिबिलिटी को खास महत्व दिया गया। कंपनी ने कई नए एआई-आधारित फीचर लॉन्च किए हैं, जो तकनीक को सभी के लिए सुलभ बनाने की दिशा में उठाया गया कदम हैं। इनमें से एक प्रमुख फीचर TalkBack में Gemini AI का एकीकरण है, जिससे स्क्रीन पर मौजूद इमेज का एआई जनरेटेड विवरण दिया जा सकेगा और उपयोगकर्ता उससे जुड़े सवाल भी पूछ सकेंगे।
इसके अलावा, गूगल ने क्रोम ब्राउज़र में एक नया फीचर जोड़ा है, जिसमें OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) के ज़रिए स्कैन की गई PDF फाइल्स को पढ़ने, सर्च करने और टेक्स्ट के साथ इंटरैक्ट करने की सुविधा मिलेगी। Chromebook पर छात्रों के लिए ‘Face Control’ नामक एक नई एक्सेसिबिलिटी टूल भी जोड़ा गया है, जिससे वे चेहरे की हरकतों से डिवाइस को कंट्रोल कर सकेंगे। गूगल की इन पहलों से यह स्पष्ट है कि कंपनी एआई को न सिर्फ स्मार्ट बना रही है, बल्कि उसे हर वर्ग के लोगों के लिए उपयोगी और समावेशी भी बना रही है।