Google Cell2Sentence-Scale 27B
संदर्भ:
गूगल डीपमाइंड और गूगल रिसर्च ने एक नया एआई फाउंडेशन मॉडल Cell2Sentence-Scale 27B (C2S-Scale) पेश किया है, जो जैविक कोशिकाओं से संबंधित जटिल डाटा को समझने और उसे प्राकृतिक भाषा में परिवर्तित करने में सक्षम है।
C2S-Scale के बारे में:
- पूरा नाम: Cell2Sentence-Scale 27B (C2S-Scale)
- डेवलपर: Google DeepMind और Google Research
- मॉडल साइज: 27 बिलियन पैरामीटर्स वाला फाउंडेशन मॉडल
- मुख्य उद्देश्य: कोशिकाओं (Cells) की “भाषा” को समझना — अर्थात् जीन और प्रोटीन अभिव्यक्ति (gene & protein expression) के जटिल पैटर्न्स को डिकोड करना जो कोशिकीय व्यवहार को नियंत्रित करते हैं।
- प्रकाशन: इस मॉडल से जुड़ी विस्तृत जानकारी bioRxiv (ओपन-एक्सेस प्रीप्रिंट रिपॉजिटरी) पर प्रकाशित की गई है, और निष्कर्ष Google के आधिकारिक रिसर्च ब्लॉग पर भी साझा किए गए हैं।
C2S-Scale की कार्यप्रणाली:
- मुख्य उद्देश्य: मॉडल को ऐसी दवा (drug) की पहचान करने का कार्य दिया गया जो इम्यून सिग्नलिंग को बढ़ाए — विशेष रूप से एंटीजन प्रेजेंटेशन को — उन परिस्थितियों में जहां इंटरफेरॉन स्तर कम होते हैं (जो अक्सर शुरुआती ट्यूमर वृद्धि में देखे जाते हैं)।
- विश्लेषण प्रक्रिया: C2S-Scale ने 4,000 से अधिक दवाओं के व्यवहार का सिमुलेशन किया और ट्यूमर-इम्यून सिस्टम में उनके इंटरैक्शन पैटर्न का विश्लेषण किया।
- मुख्य खोज: मॉडल ने Silmitasertib नामक एक CK2 inhibitor की पहचान की, जो ट्यूमर की इम्यून सिस्टम द्वारा पहचान को बढ़ाने की क्षमता रखता है।
C2S-Scale की प्रमुख विशेषताएँ:
- सेलुलर लैंग्वेज फ्रेमवर्क: यह मॉडल उच्च-आयामी single-cell RNA sequencing (scRNA-seq) डेटा को “cell sentences” (जीन अभिव्यक्ति स्तर के आधार पर क्रमबद्ध जीन नाम) में परिवर्तित करता है, जिससे यह Natural Language Processing (NLP) तकनीकों को जटिल जैविक डेटा पर लागू कर पाता है।
- फाउंडेशन मॉडल: C2S-Scale को Google के ओपन-सोर्स Gemma-2 27B आर्किटेक्चर पर बनाया गया है, जो एक decoder-only transformer model है।
इसे 57 मिलियन से अधिक कोशिकाओं और 800+ डेटासेट्स (जैसे CellxGene, Human Cell Atlas) से लिए गए 1 अरब से अधिक ट्रांस्क्रिप्टोमिक टोकन्स पर प्रशिक्षित किया गया। - परिकल्पना निर्माण (Hypothesis Generation): मॉडल की एक मुख्य क्षमता यह है कि यह केवल मौजूदा डेटा का विश्लेषण नहीं करता, बल्कि नई और परीक्षण योग्य वैज्ञानिक परिकल्पनाएँ (hypotheses) भी उत्पन्न करता है।
- संदर्भ–आधारित विश्लेषण (Context-Dependent Reasoning): इसके 27 अरब पैरामीटर्स मॉडल को जटिल और संदर्भ-निर्भर जैविक इंटरैक्शन को समझने की उन्नत तर्क क्षमता (conditional reasoning ability) प्रदान करते हैं।
- ओपन–सोर्स उपलब्धता: मॉडल और इसके संसाधन वैश्विक शोध समुदाय के लिए खुले (open-source) हैं, जिससे आगे के विकास और सत्यापन को बढ़ावा मिलेगा।
C2S-Scale की खोज का महत्व:
- वैज्ञानिक उपलब्धि (Scientific Milestone): यह खोज AI द्वारा जैविक रूप से नई और परीक्षण योग्य दवा मार्ग (drug pathway) को स्वायत्त रूप से पहचानने के शुरुआती उदाहरणों में से एक है।
- चिकित्सीय संभावनाएँ (Medical Potential): यह खोज कैंसर के लिए संयोजन चिकित्सा (combination cancer therapies) विकसित करने के नए रास्ते खोलती है, जिसमें मौजूदा और नई दोनों दवाओं का उपयोग किया जा सकता है।
- दवा अनुसंधान में क्रांति (Drug Development Revolution): यह पारंपरिक trial-based pharmacology से एक बदलाव को दर्शाती है, जहाँ अब predictive, model-based drug discovery के माध्यम से दवा विकास तेज, अधिक सटीक और किफायती बन सकता है।

