क्यों ए.आई. अरबी को समझने के लिए संघर्ष कर सकते हैं

$config[ads_kvadrat] not found

Faith Evans feat. Stevie J – "A Minute" [Official Music Video]

Faith Evans feat. Stevie J – "A Minute" [Official Music Video]
Anonim

कृत्रिम बुद्धि की दुनिया में, डेटा राजा है। आपके पास जितना अधिक होगा, आपके उपकरण उतने ही बेहतर बनेंगे जितने सिस्टम "सीखने" में सक्षम होते हैं और अधिक क्या उम्मीद की जाती है। लेकिन मंच के आधार पर ए.आई. याहू लैब्स के एक शोध वैज्ञानिक मिरियम रेडी के अनुसार, कुछ भाषाओं को अन्य की तुलना में बेहतर प्रतिनिधित्व दिया जा सकता है।

"फ़्लिकर जैसे उदाहरण के लिए, जहाँ से हम अपना डेटा लेते हैं, कुछ भाषाओं का बहुत कम प्रतिनिधित्व है," रेडी ने गुरुवार को लंदन के डीप लर्निंग समिट में बोलते हुए कहा। "तो हमारे पास अंग्रेजी है, अंग्रेजी के लिए लाखों चित्र हैं, लेकिन हमारे पास अरबी के लिए शायद 100,000 हैं।"

Redi की टीम एक ऐसे टूल पर काम कर रही है जो गैर-दृश्य तत्वों को सांस्कृतिक मूल्यों और भावनात्मक अर्थों की तरह छवियों की पहचान कर सकता है। उपकरण फ़्लिकर पर सार्वजनिक रूप से उपलब्ध छवियों से जुड़े पाठ का विश्लेषण करता है। समय के साथ, ए.आई. यह समझना शुरू कर देता है कि कोई व्यक्ति किसी "खुश पार्टी" या "अजीब क्षण" को क्यों टैग कर सकता है, लेकिन ये विचार कभी भी अधिक सटीक रूप से बढ़ेंगे क्योंकि उपकरण अधिक छवियों का विश्लेषण करता है।

"दुर्भाग्य से, अरबी भाषाओं के लिए छवियों में भावना का पता लगाने की सटीकता कम होती है क्योंकि हमारे पास पर्याप्त डेटा नहीं है," रेडी ने कहा।

जिन भाषाओं में बड़ी मात्रा में डेटा था, Redi की टीम ने कुछ दिलचस्प पैटर्न देखे। फ्रेंच और स्पैनिश जैसी रोमांस भाषाओं ने खुद को समान तरीके से व्यक्त किया, जबकि इतालवी एकमात्र भाषा थी जहां उपयोगकर्ताओं ने "टैक्स चोरी" शब्द के साथ छवियों की पहचान की।

भाषा अवरोध अभी भी ए.आई. शोधकर्ताओं। Google अनुवाद का उपयोग करने वाला कोई भी व्यक्ति जानता होगा कि भाषाओं को बदलना उतना सरल नहीं है जितना लगता है। हालांकि, नए घटनाक्रम चीजों को बदल रहे हैं, फेसबुक ने इस गर्मी की घोषणा करते हुए कहा कि यह एक एकल-भाषा सामाजिक नेटवर्क के अपने सपने के करीब जा रहा था, स्वचालित रूप से उपयोगकर्ताओं के लिए ग्रंथों का अनुवाद कर रहा था।

भाषा अवरोधों को दूर करने में विकास से अंतर्राष्ट्रीय संचार को बढ़ावा मिल सकता है, लेकिन Redi जैसी परियोजनाओं के लिए, मानव-जनित भावना डेटा के लिए कोई वास्तविक विकल्प नहीं है।

$config[ads_kvadrat] not found