Sarvam AI
संदर्भ:
हाल ही में शिक्षा मंत्री धर्मेंद्र प्रधान और आईटी मंत्री अश्विनी वैष्णव ने सर्वम एआई की सराहना करते हुए इसे ‘इंडियाएआई मिशन’ की एक बड़ी सफलता बताया है। ताजा रिपोर्ट्स के अनुसार, सर्वम एआई मॉडल्स ने कई महत्वपूर्ण बेंचमार्क्स पर Google के Gemini और OpenAI के ChatGPT जैसे दिग्गजों को पीछे छोड़ दिया है।
सर्वम एआई के बारे में:
- परिचय: सर्वम एआई एक बेंगलुरु स्थित स्टार्टअप है, जिसकी स्थापना विवेक राघवन और प्रत्युष कुमार द्वारा की गई है। इस कंपनी का मुख्य ध्येय ऐसे एआई मॉडल बनाना है जो भारतीय संदर्भों, भाषाओं और विविधताओं को गहराई से समझते हों।
- विश्व स्तरीय एआई मॉडल्स: सर्वम एआई ने कई ऐसे मॉडल्स विकसित किए हैं जो अंतरराष्ट्रीय मानकों पर खरे उतरते हैं:
- Sarvam-M (LLM): यह 24 अरब (24B) पैरामीटर्स वाला एक मॉडल है। यह भारतीय भाषाओं, गणित और प्रोग्रामिंग में जटिल तर्क कर सकता है।
- Sarvam-1: यह 2 अरब (2B) पैरामीटर वाला एक हल्का मॉडल है जो भारतीय भाषाओं के लिए अनुकूलित है। यह कम पावर वाले डिवाइस पर भी काम कर सकता है।
- Saaras V3 (Speech-to-Text): यह स्पीच रिकग्निशन मॉडल भारत की सभी 22 अनुसूचित भाषाओं को सपोर्ट करता है। यह शोर-शराबे वाले माहौल में भी सटीक ट्रांसक्रिप्शन प्रदान करता है।
- Bulbul V3 (Text-to-Speech): यह मॉडल लिखित टेक्स्ट को भारतीय लहजे वाली आवाजों में बदलता है। इसमें 11 से अधिक भाषाओं की सुविधा है।
- Sarvam Vision: यह एक OCR मॉडल है जो जटिल दस्तावेज़ों, तालिकाओं और हस्तलिखित नोट्स को भारतीय भाषाओं में पढ़ सकता है।
- Sarvam Dub: यह एक डबिंग सिस्टम है जो मूल वक्ता की आवाज़ की समानता को बनाए रखते हुए वीडियो या ऑडियो का भारतीय भाषाओं में अनुवाद और डबिंग करता है।
- Sarvam Arya (Infrastructure): यह एक ‘मल्टी-एजेंट ऑर्केस्ट्रेशन’ प्लेटफॉर्म है। यह कंपनियों को जटिल और बड़े स्तर के AI सिस्टम को मैनेज करने में मदद करता है।
- आगामी 70 बिलियन पैरामीटर मॉडल: IndiaAI मिशन के तहत, सर्वम एआई एक विशाल 70-बिलियन पैरामीटर वाला मॉडल विकसित कर रहा है जो जटिल तर्क और कोडिंग कार्यों को करने में सक्षम होगा।
सर्वम एआई मॉडल की उपलब्धियां:
-
Sarvam Vision (OCR मॉडल): यह मॉडल ‘ऑप्टिकल कैरेक्टर रिकग्निशन’ (OCR) यानी दस्तावेजों को पढ़ने और उन्हें डिजिटल डेटा में बदलने पर केंद्रित है।
- विश्व स्तरीय प्रदर्शन: इसने olmOCR-Bench पर 84.3% की सटीकता हासिल की, जो Google Gemini 3 Pro और DeepSeek OCR v2 से अधिक है।
- OmniDocBench v1.5: वास्तविक दुनिया के जटिल दस्तावेजों को समझने में इसने 93.28% स्कोर किया है। यह विशेष रूप से तकनीकी तालिकाओं, गणितीय सूत्रों और जटिल लेआउट को समझने में सक्षम है।
- किफायती नवाचार (Frugal Innovation): जहाँ ग्लोबल मॉडल्स ट्रिलियन पैरामीटर्स का उपयोग करते हैं, Sarvam Vision मात्र 3 बिलियन पैरामीटर्स के साथ यह परिणाम दे रहा है, जो इसे ऊर्जा-कुशल बनाता है।
-
Bulbul V3 (वॉइस मॉडल): यह भारत का पहला स्वदेशी एआई वॉइस मॉडल है जो भारतीय भाषाओं की बारीकियों को समझता है।
- बहुभाषी दक्षता: यह भारत की 22 आधिकारिक भाषाओं और 35 से अधिक उच्च-गुणवत्ता वाली आवाजों को सपोर्ट करता है।
- भावनाओं का संचार: यह केवल ‘टेक्स्ट-टू-स्पीच’ नहीं करता, बल्कि बोलते समय भावनाओं, ठहराव और क्षेत्रीय लहजों का भी ध्यान रखता है।
महत्व:
- डेटा संप्रभुता: स्वदेशी मॉडल विकसित करने से भारत की डेटा संप्रभुता सुनिश्चित होती है, क्योंकि डेटा देश की सीमाओं के भीतर ही रहता है।
- समावेशी विकास: भारतीय भाषाओं (जैसे हिंदी, तमिल, तेलुगु, पंजाबी आदि) में एआई उपलब्ध होने से डिजिटल विभाजन कम होगा और अंतिम मील तक शासन की पहुंच आसान होगी।
- आर्थिक प्रभाव: भारत का एआई बाजार 25-35% की दर से बढ़ने का अनुमान है, जिसमें सर्वम जैसे स्टार्टअप नवाचार और रोजगार सृजन में प्रमुख भूमिका निभाएंगे।
- IndiaAI मिशन सहयोग: सरकार ने इस स्टार्टअप को 4,000 GPU (ग्राफिक प्रोसेसिंग यूनिट्स) और आवश्यक कंप्यूटिंग अवसंरचना उपलब्ध कराई है ताकि स्वदेशी तकनीक को वैश्विक स्तर पर प्रतिस्पर्धी बनाया जा सके।

