ब्रेन-कंप्यूटर इंटरफ़ेस भाषण में विचारों का अनुवाद कर सकता है

$config[ads_kvadrat] not found

A day with Scandale - Harmonie Collection - Spring / Summer 2013

A day with Scandale - Harmonie Collection - Spring / Summer 2013

विषयसूची:

Anonim

मंगलवार को प्रकाशित एक अध्ययन के अनुसार, न्यूरोएन्जिनेर्स ने एक नई प्रणाली बनाई है जो सरल विचारों को पहचानने योग्य भाषण में बदल सकती है, कृत्रिम बुद्धि और एक भाषण सिंथेसाइज़र का उपयोग कर सकती है।

न्यूयॉर्क स्थित शोधकर्ताओं की एक टीम केवल मस्तिष्क गतिविधि का उपयोग करके शब्दों को फिर से बनाने में सक्षम थी, एक नवाचार जो मस्तिष्क-नियंत्रित प्रौद्योगिकियों के लिए मार्ग प्रशस्त कर सकता है, जैसे, एक स्मार्टफोन जो आपके विचारों को पाठ संदेशों में अनुवाद कर सकता है।

कोलंबिया विश्वविद्यालय में एक एसोसिएट प्रोफेसर डॉ। नीमा मेसगरानी ने अध्ययन और बताता है श्लोक में वह स्ट्रोक से उबरने वाले लोगों को वाणी को बहाल करने में मदद करने या एम्योट्रोफिक लेटरल स्क्लेरोसिस (एएलआई) के साथ रहने की महान क्षमता देखता है। इसके अलावा, इस प्रकार की तकनीक मस्तिष्क से जुड़े स्मार्टफ़ोन के लिए भी दरवाजे खोल सकती है जो उपयोगकर्ताओं को अपने दिमाग का उपयोग करने की सुविधा दे सकते हैं, हालांकि यह अभी भी एक रास्ता है। उनका काम पत्रिका में प्रकाशित हुआ था वैज्ञानिक रिपोर्ट.

"इस काम की प्रेरणाओं में से एक … वैकल्पिक मानव-कंप्यूटर इंटरैक्शन विधियों के लिए है, जैसे कि उपयोगकर्ता और स्मार्टफोन के बीच एक संभावित इंटरफ़ेस," वे कहते हैं। "हालांकि, यह अभी भी वास्तविकता से दूर है, और फिलहाल, गैर-इनवेसिव तरीकों का उपयोग करके निकाली जा सकने वाली जानकारी एक भाषण मस्तिष्क-कंप्यूटर इंटरफ़ेस एप्लिकेशन के लिए पर्याप्त अच्छी नहीं है।"

मस्तिष्क-कंप्यूटर इंटरफ़ेस द्वारा उत्पन्न भाषण को सुनें।

नई तकनीक विकसित करने के लिए, मेसर्गानी और उनके सहयोगी, नॉर्थवेल हेल्थ फिजिशियन पार्टनर्स न्यूरोसाइंस इंस्टीट्यूट के डॉ। आशीष दिनेश मेहता ने अपने अध्ययन के लिए मिर्गी रोगियों की मस्तिष्क गतिविधि की जांच शुरू की। इन रोगियों में पहले से ही बरामदगी की निगरानी करने के लिए उनके दिमाग में इलेक्ट्रोड प्रत्यारोपण थे, जो मेसगरानी और मेहता अपने शोध के लिए डेटा एकत्र करने के लिए उपयोग करने में सक्षम थे।

दोनों ने प्रतिभागियों को सुनने के लिए तैयार प्रतिभागियों को शून्य और नौ के बीच संख्या सुनाने के लिए कहा, और फिर उस बातचीत से मस्तिष्क के संकेतों को रिकॉर्ड किया। इसके बाद, उन्होंने एक तंत्रिका नेटवर्क को प्रशिक्षित किया - एक कार्यक्रम जो मानव मस्तिष्क में न्यूरॉन संरचना की नकल करता है - संकेतों में पैटर्न को पहचानने के लिए और उन्हें एक स्पीच सिंथेसाइज़र का उपयोग करके रोबोट-ध्वनि वाले शब्दों में अनुवाद करना, जिसे एक वोडर के रूप में जाना जाता है।

परिणाम शून्य से नौ तक माइक्रोसॉफ्ट सैम गिनती की तरह लगता है की एक छोटी आवाज क्लिप था। प्रभावशाली हिस्सा सिर्फ यह है कि शोधकर्ताओं द्वारा परीक्षण किए गए अन्य तरीकों की तुलना में भाषण कितना स्पष्ट है। हालांकि अभी भी बहुत सारे काम किए जाने बाकी हैं।

"यह तकनीक उपलब्ध होने से पहले एक दशक लग सकता है," मेसगरानी कहते हैं। “हमें गैर-इनवेसिव न्यूरल रिकॉर्डिंग विधियों में दीर्घकालिक, जैव-संगत इम्प्लांटेबल इलेक्ट्रोड और / या सफलता प्रौद्योगिकियों दोनों में अधिक प्रगति की आवश्यकता है। हमें यह समझने की भी बेहतर आवश्यकता है कि मस्तिष्क भाषण का प्रतिनिधित्व कैसे करता है, ताकि हम अपने डिकोडिंग के तरीकों को परिष्कृत कर सकें। ”

जो रोगी इस अध्ययन का हिस्सा थे, उदाहरण के लिए, सभी के पास इलेक्ट्रोकोर्टोग्राफी मॉनिटर को आरोपित करने के लिए मस्तिष्क की सर्जरी थी। यह एक अत्यंत आक्रामक प्रक्रिया है, जिसके लिए ओपन ब्रेन सर्जरी की आवश्यकता होती है, ऐसा कुछ जिसे ज्यादातर लोग करने के लिए तैयार नहीं हो सकते हैं, भले ही उनकी भाषण क्षमताओं में से कुछ को बहाल करने की संभावना हो।

अभी के लिए, इस अध्ययन ने भाषण में मस्तिष्क के संकेतों को डिकोड करने के लिए एक विधि पेश की। अगर हम यह पता लगाते हैं कि सर्जरी के बिना मस्तिष्क की गतिविधि का सही-सही पता कैसे लगाया जाए, तो हम न केवल स्पीच थैरेपी में क्रांतिकारी बदलाव लाएंगे, बल्कि मस्तिष्क से जुड़े स्मार्टफोन्स लाने की दिशा में भी यह एक कदम है।

पिछले कुछ वर्षों में ब्रेन-कंप्यूटर इंटरफ़ेस अनुसंधान में नए-नए ब्याज मिल रहे हैं। अप्रैल 2017 में, फेसबुक ने घोषणा की कि वह अपने वार्षिक F8 सम्मेलन के दौरान एक BCI पर काम कर रहा था। और एलोन मस्क ने नवंबर 2018 में घोषणा की कि न्यूरलिंक, जो उनका खुद का बीसीआई स्टार्टअप है, काम पर रख रहा था।

सार

श्रवण उत्तेजना पुनर्निर्माण एक तकनीक है जो विकसित तंत्रिका गतिविधि की आबादी से ध्वनिक उत्तेजना का सबसे अच्छा अनुमान लगाती है। मानव श्रवण प्रांतस्था से भाषण का पुनर्निर्माण मस्तिष्क के साथ एक सीधा संचार स्थापित करने के लिए एक भाषण न्यूरोपैस्टेटिक की संभावना पैदा करता है और इसे ओवरट और गुप्त दोनों स्थितियों में संभव होना दिखाया गया है। हालाँकि, पुनर्निर्मित भाषण की निम्न गुणवत्ता ने मस्तिष्क-कंप्यूटर इंटरफ़ेस (BCI) अनुप्रयोगों के लिए इस पद्धति की उपयोगिता को गंभीर रूप से सीमित कर दिया है। भाषण न्यूरोप्रोस्थेसिस में अत्याधुनिक को आगे बढ़ाने के लिए, हमने मानव श्रवण प्रांतस्था से बंद-सेट समझदार भाषण को फिर से बनाने के लिए भाषण संश्लेषण प्रौद्योगिकियों में नवीनतम नवाचारों के साथ गहन सीखने में हाल के अग्रिमों को जोड़ा। हमने रैखिक और nonlinear (गहरे तंत्रिका नेटवर्क) प्रतिगमन विधियों और पुनर्निर्माण के लक्ष्य के रूप में उपयोग किए जाने वाले ध्वनिक प्रतिनिधित्व पर पुनर्निर्माण सटीकता की निर्भरता की जांच की, जिसमें श्रवण स्पेक्ट्रोग्राम और भाषण संश्लेषण पैरामीटर शामिल हैं। इसके अलावा, हमने कम और उच्च तंत्रिका आवृत्ति श्रेणियों से पुनर्निर्माण सटीकता की तुलना की। हमारे परिणामों से पता चलता है कि एक गहरी तंत्रिका नेटवर्क मॉडल जो सीधे सभी तंत्रिका आवृत्तियों से एक भाषण सिंथेसाइज़र के मापदंडों का अनुमान लगाता है, एक अंक मान्यता कार्य पर उच्चतम व्यक्तिपरक और उद्देश्य स्कोर प्राप्त करता है, बेसलाइन विधि से 65% से अधिक बुद्धिमानी में सुधार होता है जो रैखिक प्रतिगमन पर श्रवण स्पेक्ट्रोग्राम का पुनर्निर्माण। ये परिणाम अगली पीढ़ी के भाषण बीसीआई सिस्टम को डिजाइन करने के लिए गहन शिक्षण और भाषण संश्लेषण एल्गोरिदम की प्रभावकारिता को प्रदर्शित करते हैं, जो न केवल लकवाग्रस्त रोगियों के लिए संचार बहाल कर सकते हैं, बल्कि मानव-कंप्यूटर इंटरैक्शन प्रौद्योगिकियों को बदलने की क्षमता भी रखते हैं।

संबंधित वीडियो: ब्रेन वेव सेंसिंग रोबोट मानव शरीर के एक्सटेंशन के रूप में सेवा कर सकते हैं

$config[ads_kvadrat] not found