कैसे दीपमिन्द ने एक स्वयंभू स्व-सिखाया ए.आई. दैट कैन आउटस्मार्ट ह्यूमन्स

$config[ads_kvadrat] not found

पृथà¥?वी पर सà¥?थित à¤à¤¯à¤¾à¤¨à¤• नरक मंदिर | Amazing H

पृथà¥?वी पर सà¥?थित à¤à¤¯à¤¾à¤¨à¤• नरक मंदिर | Amazing H

विषयसूची:

Anonim

कंप्यूटर कुछ दशकों से शतरंज में हमारे नाजुक मानव गधे को मार रहे हैं। यह पहली बार 1996 में हुआ था, जब आईबीएम का डीप ब्लू विश्व चैंपियन गैरी कैस्परोव को उतारने में सक्षम था। लेकिन वर्णमाला के ए.आई. संगठन दीपमिन्द ने इस बात पर प्रकाश डाला कि वास्तव में शुरुआती जीत कितनी सीमित थी।

एक के लिए, कैस्परोव ने एक पुरानी प्रति के हिसाब से छह गेम प्लेऑफ में दो बार तीन गेम जीते और दो बार ड्रॉ खेला दैनिक समाचार रिपोर्ट।

लेकिन बहुत अधिक उल्लेखनीय रूप से, जैसा कि दीपमिन्द शोधकर्ता जूलियन श्रिटविसर बताता है श्लोक में डीप ब्लू जैसे एप्लिकेशन भी मैन्युअल रूप से प्रोग्राम किए गए थे। इसका मतलब है कि मनुष्यों को ए.आई. प्रत्येक कल्पनाशील आकस्मिकता को कैसे संभालना है, इसके बारे में जानने के लिए आवश्यक सब कुछ। दूसरे शब्दों में, यह केवल उतना ही अच्छा हो सकता है जितना कि प्रोग्रामिंग करने वाले लोग। और जबकि डीप ब्लू स्पष्ट रूप से शतरंज में बहुत अच्छा पाने में सक्षम था; इसे दूसरा, समान, गो जैसे गेम दें और यह क्लूलेस हो गया है।

अल्फा जीरो पूरी तरह से अलग है। पत्रिका में आज प्रकाशित एक नए अध्ययन में विज्ञान लेखक बताते हैं कि कैसे वे अल्फ़ा ज़ीरो को न केवल सिखा सकते थे कि कैसे मनुष्यों को शतरंज में हराया जाए, बल्कि अल्फ़ा ज़ीरो को कैसे सिखाया जाए खुद ही सिखाओ कई खेलों में महारत हासिल करने के लिए।

कैसे सिखाएं ए.आई. खुद को सिखाने के लिए

अल्फा जीरो को गहन सुदृढीकरण सीखने नामक तकनीक का उपयोग करके विकसित किया गया था। अनिवार्य रूप से, इसमें शिक्षण ए.आई. कुछ बहुत ही सरल, जैसे कि शतरंज के बुनियादी नियम, और फिर उस सरल चीज़ को बार-बार करना जब तक कि यह अधिक जटिल, दिलचस्प चीजें जैसे रणनीति और तकनीक न सीख ले।

"परंपरागत रूप से … मनुष्य खेल के बारे में अपना ज्ञान लेते हैं और इसे नियमों में कोडित करने की कोशिश करते हैं," Schrittwieser, जो लगभग चार वर्षों से अल्फा ज़ीरो पर काम कर रहे हैं, कहते हैं। "हमारा दृष्टिकोण यह है कि हम बेतरतीब ढंग से शुरू करते हैं, और फिर इसे खुद के खिलाफ खेल खेलते हैं, और उन खेलों से ही यह सीख सकते हैं कि क्या रणनीति काम करती है।"

सभी अल्फ़ा ज़ीरो मूल नियम हैं, और वहाँ से यह सीखा जाता है कि कैसे स्वयं खेलकर जीतना है। नए निष्कर्षों के अनुसार, अल्फा जीरो को मास्टर शतरंज के लिए केवल नौ घंटे, मास्टर शोगी को 12 घंटे और मास्टर गो को लगभग 13 दिन लगते हैं। क्योंकि यह खुद खेल रहा है, यह अनिवार्य रूप से स्व-सिखाया जाता है। इसने शोगी के 91 प्रतिशत समय में 2017 के विश्व चैंपियन को हराकर, सभी विश्व चैंपियन मानव-निर्देशित एल्गोरिदम की नकल की।

"यह स्वतंत्र रूप से खेल के बारे में दिलचस्प ज्ञान की खोज कर सकता है," श्रिटविसर कहते हैं। "यह ऐसे कार्यक्रमों की ओर ले जाता है जो अधिक मानव की तरह खेलते हैं।"

हालांकि, इसकी शैली मानव-जैसी और रचनात्मक है, हालांकि, इसकी संभावना इष्टतम भी है, वे कहते हैं, इतना पर्याप्त है कि अल्फा ज़ीरो किसी भी खेल में बहुत अधिक हावी होने में सक्षम होना चाहिए जिसमें इसकी सभी उपलब्ध जानकारी तक पहुंच हो। वास्तव में, अल्फा शून्य इतना परिष्कृत है, हमें खेल की एक पूरी तरह से अलग वर्ग में जाने की आवश्यकता हो सकती है ताकि सीमाओं को धक्का दिया जा सके कि कैसे ए.आई. समस्याओं को हल करता है।

अल्पा जीरो इतनी अच्छी क्यों है

A.I. शोधकर्ता इन खेलों को कुछ कारणों से एल्गोरिदम के अधिक परिष्कृत रूपों के परीक्षण के आधार के रूप में उपयोग करना पसंद करते हैं। वे सुरुचिपूर्ण हैं, और लोग उन्हें सैकड़ों वर्षों से खेल रहे हैं, एक के लिए, जिसका अर्थ है कि आपको अपने एल्गोरिथ्म का परीक्षण करने के लिए बहुत सारे संभावित चैलेंजर्स मिले हैं। लेकिन वे जटिल और जटिल भी हैं, जिसका अर्थ है कि वे ए.आई. यह वास्तविक दुनिया में समस्याओं को हल कर सकता है। Schrittwieser का कहना है कि अनुसंधान का अगला क्षेत्र अल्फा ज़ीरो जैसा एक एल्गोरिथ्म बना रहा है जो अभी भी अपूर्ण जानकारी के साथ इष्टतम निर्णय ले सकता है।

"इन सभी खेलों में, आप सब कुछ जानते हैं कि क्या हो रहा है," वह कहते हैं। “वास्तविक दुनिया में, आप केवल जानकारी का हिस्सा जान सकते हैं। आप अपने स्वयं के कार्ड जान सकते हैं, लेकिन आप अपने प्रतिद्वंद्वी को नहीं जानते, आपके पास आंशिक जानकारी है।"

अल्फा जीरो जैसे एल्गोरिदम देने में सक्षम अभी भी कुछ बोर्डगेम हैं जो इस तरह की चुनौती भी हैं, - श्रिटविज़र ने स्ट्रैटेजो का उल्लेख किया है, जिसमें खिलाड़ी एक-दूसरे से अपनी चालें छिपाते हैं - और स्टारक्राफ्ट, जो दीपमिन्द के गेमिंग-केंद्रित शोधकर्ताओं के लिए रुचि का एक और क्षेत्र है।

वे कहते हैं, '' हम उन समस्याओं से निपटना चाहते हैं जिनसे हम अधिक से अधिक जटिल हैं। "लेकिन यह एक समय में हमेशा एक आयाम होता है।"

इसी समय, डीप माइंड की अगली पीढ़ी के कम्प्यूटरीकृत समस्या-समाधान पहले से ही गेमिंग की दुनिया से वास्तविक दुनिया में स्थानांतरित करने की क्षमता दिखा रहे हैं। इस सप्ताह की शुरुआत में, इसने अल्फ़ाफोल्ड नामक एक अन्य एल्गोरिदम की घोषणा की, जो प्रोटीन अनुक्रम को 3 डी संरचना की सटीक भविष्यवाणी में लाने में सक्षम है।यह एक ऐसी समस्या है जो दशकों से वैज्ञानिकों को परेशान कर रही है और अल्जाइमर से लेकर सिस्टिक फाइब्रोसिस तक के रोगों के इलाज के लिए द्वार खोलने में मदद कर सकती है।

$config[ads_kvadrat] not found