स्पीचमैटिक्स AI का उपयोग भाषाओं को प्रसारित करने के लिए करता है, और यह Google की धड़कन है

$config[ads_kvadrat] not found

A day with Scandale - Harmonie Collection - Spring / Summer 2013

A day with Scandale - Harmonie Collection - Spring / Summer 2013
Anonim

Google के बाद स्पीचमैटिक्स चल रहा है। ब्रिटिश स्टार्टअप ने पिछले महीने स्वचालित भाषाविद को लपेट लिया, एक शक्तिशाली कृत्रिम बुद्धिमत्ता जो कुछ ही दिनों में भाषण-से-पाठ प्रतिलेखन के लिए कोई भी भाषा सीख सकती है। टीम दुनिया की लगभग 7,000 भाषाओं में से हर एक के लिए प्रौद्योगिकी को सक्षम करना चाहती है, जिसमें जीवन को बदलने की क्षमता है।

भाषाई उपकरण लॉन्च करने के बाद से, स्पीचमैटिक्स एक दिन एक भाषा बनाने की चुनौती, ओमनीग्लॉट पर काम कर रहा है।पिछले हफ्ते, कंपनी ने एक बड़ा मील का पत्थर मारा: इसने आधिकारिक तौर पर गूगल को हरा दिया है, जिसमें कुल मिलाकर 72 अनोखी भाषाएं हैं।

सिस्टम ट्रांसपेरेंट समकक्ष के साथ ऑडियो डेटा से मेल करने के लिए मशीन लर्निंग का उपयोग करता है। यह तब अन्य भाषाओं से भाषाई पैटर्न का उपयोग करता है ताकि इस प्रक्रिया को यथासंभव सरल बनाया जा सके, ध्वनियों और व्याकरणिक संरचनाओं के बीच समानता की पहचान की जा सके और उन्हें नई भाषाओं में लागू किया जा सके। यह प्रक्रिया अत्यधिक प्रभावी है: उदाहरण के तौर पर, हिंदी पर स्पीचमैटिक्स के काम को 80 प्रतिशत सटीकता तक पहुंचने में सिर्फ दो सप्ताह का समय लगा। जब Google के प्रयासों के खिलाफ अंतिम उत्पाद का परीक्षण किया गया, तो उसने 23 प्रतिशत कम गलतियाँ कीं।

श्लोक में अधिक जानने के लिए, स्पीचमैटिक्स के सीईओ बेनेडिकट वॉन थुन्गेन के साथ बात की।

आपने पहली बार प्रोजेक्ट पर काम करना कैसे शुरू किया?

हमने खुद को एक चुनौती के रूप में ओमनीग्लोट परियोजना शुरू की - यह देखने के लिए कि हम छह सप्ताह में कितनी भाषाओं का निर्माण कर पाएंगे। हमने कुछ समय पहले महसूस किया था कि प्रत्येक भाषा के व्यक्तिगत रूप से निर्माण का पारंपरिक दृष्टिकोण अब तीव्र दर से बड़े पैमाने पर देखने योग्य नहीं है। इस बात को ध्यान में रखते हुए, हमें यह सोचना होगा कि कोई भाषा क्या है, इसकी संरचना कैसी है और विभिन्न भाषाओं में क्या समानताएं हैं। हमने उन समानताओं का उपयोग करके पैटर्न की पहचान करने और हमारे एआई-संचालित फ्रेमवर्क, स्वचालित भाषाविद (एएल) की मदद करने के लिए, पहले से कहीं अधिक तेजी से भाषाओं का निर्माण करने के लिए - छह सप्ताह में 46 सटीक, या छह सप्ताह के लिए एक दिन में एक भाषा के बारे में एक तरीका खोजा !

यह Google के प्रयासों से कैसे भिन्न है?

भाषा निर्माण के लिए हमारा दृष्टिकोण मुख्य पहलुओं में से एक है जो हमें Google से अलग करता है। जब तक हम यह मान लेते हैं कि वे अपनी भाषाओं का निर्माण व्यक्तिगत रूप से करते हैं (या जिसे हम force ब्रूट फ़ोर्स’कहते हैं), हम ए। ए। की शक्ति का उपयोग कर रहे हैं। भाषा-निर्माण की प्रक्रिया को सुव्यवस्थित और तेज करना। इसके अलावा, जबकि Google जैसी अन्य सेवाएं अद्वितीय भाषाओं के बजाय बोलियों के निर्माण पर ध्यान केंद्रित करती हैं, हमें यह कहते हुए गर्व होता है कि हमारे प्रयासों को दुनिया भर की अनूठी भाषाओं पर ध्यान केंद्रित किया गया है, जिनमें वे क्षेत्र भी शामिल हैं जो पहले बड़ी प्रौद्योगिकी कंपनियों द्वारा रेखांकित किए गए हैं।

इसके लिए वास्तविक दुनिया के कुछ अनुप्रयोग क्या हैं?

अब हमारे पास अपनी सेवा को पहले से अधिक दूरगामी बनाने और सभी के लिए स्वचालित भाषण मान्यता (ASR) लाने के लिए तकनीक और ज्ञान है। यह कम साक्षरता दर वाले देशों में विशेष रूप से प्रासंगिक है, जहां संचार करने के लिए अनुपलब्ध भाषण-से-पाठ तकनीक का उपयोग करने की क्षमता लोगों के लिए सभी अंतर बना सकती है। अन्य वास्तविक जीवन के मामले जहां एएसआर प्रौद्योगिकी तक पहुंच के मुद्दों के साथ मदद कर सकता है - दुनिया भर के बिगड़ा लोगों को सुनने और / या दृष्टि को प्रभावित कर सकता है अब वे अपने आसपास के लोगों के साथ बातचीत करने के लिए एक फोन के रूप में सरल डिवाइस का उपयोग कर सकते हैं।

क्या इससे अंग्रेजी जैसी अच्छी तरह से कवर की गई भाषाओं की सटीकता में सुधार होता है?

जैसा कि हम अधिक भाषाओं को विकसित करना जारी रखते हैं, हमारे ए.आई. भाषाई विशेषताओं और पैटर्न की पहचान करने पर ढांचा तेजी से निपुण हो जाएगा। हम इस ज्ञान का उपयोग अंग्रेजी सहित हमारे वर्तमान भाषा आधार को पूर्ण करने के लिए करेंगे।

क्या यह Google Pixel Buds के वास्तविक समय के अनुवाद टूल की तरह कुछ सुधार कर सकता है?

हम निश्चित रूप से ओम्निग्लोट जैसी परियोजनाओं को देखते हैं जो वास्तविक समय के अनुवाद उपकरणों को बेहतर बनाने में मदद करती हैं। चूंकि भाषाओं की पहुंच और सटीकता का विस्तार करने के लिए अधिक संसाधन का निवेश किया जाता है, इसलिए हम अनुवाद सेवा क्षेत्र में निरंतर सुधार देखेंगे।

क्या यह किसी भी भाषा के साथ काम करता है, यहां तक ​​कि क्लिंगन जैसी भाषाओं का भी निर्माण किया गया है?

हम अभी तक कोई भी कॉन्क्लेव बनाने और बनाने की कोशिश नहीं कर रहे हैं, लेकिन हमें कोई कारण नहीं दिखता कि वे काम क्यों नहीं करेंगे। जैसा कि ये भाषाएं अभी भी मनुष्यों द्वारा बोली जाती हैं, वे भी रोज़मर्रा की भाषाओं (जैसे कि फ़ोनेम्स की संख्या) के समान संरचनात्मक नियमों और बाधाओं का पालन करते हैं, जो एएल को एक निर्माण के लिए पर्याप्त डेटा देंगे।

क्या आप प्रोजेक्ट की सोर्सिंग खोल रहे हैं?

नहीं, हमारे पास इसके लिए कोई योजना नहीं है।

लाइसेंस कैसे काम करेगा?

ओम्निग्लोट परियोजना के तहत पेश की जाने वाली भाषाएँ नि: शुल्क हैं और इसका इस्तेमाल व्यावसायिक उद्देश्यों के लिए नहीं किया जा सकता है। जैसे, भविष्य के लिए उनके पास कोई लाइसेंस नहीं होगा।

अगले चरण यहाँ से क्या हैं?

प्रोजेक्ट ओमनीग्लॉट हमारे लिए सिर्फ शुरुआत है। हम अंततः दुनिया की हर भाषा का निर्माण करना चाहते हैं, इसलिए हम उस लक्ष्य के लिए कड़ी मेहनत करेंगे!

$config[ads_kvadrat] not found