विज्ञान

नया एआई टूल जो एक करोड़ से अधिक पेड़-पौधों और जीवों की छवियों की सटीक जानकारी दे सकता है

यह उपकरण एक ही प्रजाति के समान दिखने वाले जीवों और उनकी शक्ल की नकल करने वाली एक प्रजाति के बीच अंतर को स्पष्ट करता है।

Dayanidhi

शोधकर्ताओं ने मशीन लर्निंग द्वारा उपयोग किए जाने वाले जैविक छवियों का अब तक का सबसे बड़ा डेटासेट बनाया है, साथ ही इससे सीखने के लिए एक नया दिखाई देने वाला कृत्रिम बुद्धिमत्ता (एआई) उपकरण विकसित किया है।

प्रमुख अध्ययनकर्ता सैमुअल स्टीवंस ने कहा कि नए अध्ययन के निष्कर्षों ने इस दायरे को काफी हद तक बढ़ा दिया है। अब वैज्ञानिक नए सवालों के जवाब देने के लिए पौधों, जानवरों और कवक की छवियों का विश्लेषण करने के लिए कृत्रिम बुद्धिमत्ता का उपयोग कर सकते हैं। 

स्टीवंस ने कहा, हमारा मॉडल पूरी धरती पर फैले जीवन संबंधी कार्यों के लिए बहुत उपयोगी है। उन्होंने कहा, शोधकर्ता उस अध्ययन को करने में भी सक्षम होंगे जो पहले संभव नहीं था। यह शोध अरक्षिव प्रीप्रिंट सर्वर में प्रकाशित किया गया है।

स्टीवंस और उनके सहयोगियों ने सबसे पहले दुनिया के सबसे बड़े और सबसे विविध मशीन लर्निंग-रेडी इमेज डेटासेट, ट्रीऑफलाइफ-10एम को तैयार किया, जिसमें पौधों, जानवरों और कवक की एक करोड़ से अधिक छवियां शामिल हैं। इसकी तुलना में, मशीन लर्निंग के लिए तैयार पिछले सबसे बड़े डेटाबेस में 10,000 प्रजातियों के वर्गीकरण को कवर करने वाली केवल 27 लाख छवियां हैं। इन आंकड़ों की विविधता उनके एल्गोरिदम की प्रमुख विशेषताओं में से एक है।

इसके बाद उन्होंने बायोसीएलआईपी विकसित किया, जो हाल ही में शोधकर्ताओं के लिए जारी किया गया एक नया मशीन लर्निंग मॉडल है। यह छवियों में देखने के संकेतों का उपयोग करके छवियों से जुड़े विभिन्न प्रकार के पाठ, जैसे टैक्सोनोमिक लेबल और अन्य जानकारी के साथ डेटासेट से सीखने के लिए डिजाइन किया गया है।

शोधकर्ताओं ने यह देखकर बायोक्लिप का परीक्षण किया कि यह छवियों को कितनी अच्छी तरह वर्गीकृत कर सकता है, वे पूरे जीवन भर या ट्री ऑफ लाइफ में कहां तक कवर कर सकता है। जिसमें एक दुर्लभ प्रजाति डेटासेट भी शामिल है जिसे प्रशिक्षण के दौरान नहीं देखा गया था। परिणामों से पता चला कि इस कार्य में मौजूदा मॉडलों की तुलना में 17 से 20 फीसदी तक बेहतर प्रदर्शन किया।

बायोक्लिप मॉडल यहां सार्वजनिक रूप से उपलब्ध है। स्टीवंस ने कहा, इसका डेमो किसी मनमाने जीव की छवि को भी सटीक रूप से पहचान सकता है, चाहे वह सेरेन्गेटी सवाना, आपके स्थानीय चिड़ियाघर या आपके घर के पिछवाड़े से हो।

स्टीवंस ने कहा, प्रचुर मात्रा में जीव विज्ञान संबंधी छवि डेटाबेस को व्यवस्थित करने के लिए उपयोग किए जाने वाले पारंपरिक कम्प्यूटेशनल दृष्टिकोण आम तौर पर विशिष्ट कार्यों के लिए डिजाइन किए जाते हैं और नए प्रश्नों, संदर्भों और डेटासेट को हल करने में सक्षम नहीं होते हैं।

उन्होंने कहा, इसके अलावा क्योंकि मॉडल को संपूर्ण जीवन या ट्री ऑफ लाइफ को व्यापक रूप से लागू किया जा सकता है, उनका एआई उन जीव विज्ञानियों के लिए अधिक सहायक है, जिनका वास्तविक दुनिया का शोध विशिष्ट क्षेत्रों का अध्ययन करने वालों के बजाय अधिक व्यापक रूप से केंद्रित है।

सह-अध्ययनकर्ता और ओहियो राज्य में कंप्यूटर विज्ञान और इंजीनियरिंग के सहायक प्रोफेसर यू सु ने कहा, इस टीम के दृष्टिकोण को इतना प्रभावी क्या बनाता है, यह उनके मॉडल की छवियों के सुव्यवस्थित कर सीखने, या बताने में सक्षम होने की क्षमता है। एक ही प्रजाति के समान दिखने वाले जीवों और उनकी शक्ल की नकल करने वाली एक प्रजाति के बीच अंतर को स्पष्ट करता है।

जबकि सामान्य कंप्यूटर विजन मॉडल कुत्तों और भेड़ियों जैसे सामान्य जीवों की तुलना करने के लिए उपयोगी होते हैं, पिछले अध्ययनों से पता चला है कि वे एक ही पौधे की दो प्रजातियों के बीच सूक्ष्म अंतर नहीं बता पाते हैं।

सु ने कहा, बारीकियों की बेहतर समझ के कारण, यह मॉडल दुर्लभ और अनदेखी प्रजातियों का निर्धारण करने के लिए विशिष्ट रूप से सक्षम है।

उन्होंने कहा, बायोक्लिप सामान्य दृष्टि मॉडल के लिए पहले से सार्वजनिक रूप से उपलब्ध प्रजातियों की तुलना में अधिक चीजों को कवर करता है। यहां तक ​​कि जब उसने पहले किसी विशेष प्रजाति को नहीं देखा है, तब भी वह इस बारे में उचित निष्कर्ष पर पहुंच सकता है कि यदि यह जीव इसके समान दिखता है, तो इसकी संभावना क्या है।

जैसे-जैसे एआई आगे बढ़ रहा है, इस तरह के मशीन लर्निंग मॉडल जल्द ही जैविक रहस्यों को सुलझाने के लिए अहम उपकरण बन सकते हैं। जबकि बायोक्लिप का यह पहला संस्करण सिटीजन साइंस के प्लेटफार्मों से छवियों और जानकारी पर बहुत अधिक निर्भर करता है। स्टीवंस ने कहा कि वैज्ञानिक प्रयोगशालाओं और संग्रहालयों से अधिक छवियों और आंकड़ों को शामिल करके भविष्य के मॉडल को एडवांस बनाया जा सकता है।

प्रयोगशालाएं प्रजातियों के समृद्ध पाठ्य विवरण एकत्र करने में सक्षम हैं जो उनकी दिखने संबंधी विशेषताओं और निकट से संबंधित प्रजातियों के बीच सूक्ष्म अंतरों का विवरण देते हैं, ऐसे संसाधन एआई मॉडल के लिए महत्वपूर्ण जानकारी प्रदान कर सकते हैं।

इसके अलावा कई वैज्ञानिक प्रयोगशालाओं में विलुप्त प्रजातियों के जीवाश्मों के बारे में जानकारी है, टीम को उम्मीद है कि इससे मॉडल की उपयोगिता भी बढ़ेगी।

उन्होंने कहा, जैसे-जैसे हम नामों और नई प्रजातियों को अपडेट करते हैं, वर्गीकरण हमेशा बदलता रहता है, इसलिए एक चीज जो हम भविष्य में करना चाहेंगे वह है कि उन्हें कैसे एकत्र किया जाए, इस पर मौजूदा काम का अधिक लाभ उठाया जाए।

शोधकर्ता ने आगे कहा, एआई में, जब आप किसी समस्या पर अधिक आंकड़े देखते हैं, तो आपको बेहतर परिणाम मिलते हैं, इसलिए मुझे लगता है कि एक बड़ा संस्करण है जिसे हम एक बड़े, मजबूत मॉडल में प्रशिक्षित करना जारी रख सकते हैं।