एनवीडिया का यह एआई न्यूरल नेटवर्क फोटोरियलिस्टिक फेक इमेज बनाता है

$config[ads_kvadrat] not found

Faith Evans feat. Stevie J – "A Minute" [Official Music Video]

Faith Evans feat. Stevie J – "A Minute" [Official Music Video]
Anonim

एक नज़र में, ऊपर की फोटो एक साधारण सड़क की एक साधारण तस्वीर की तरह दिखती है, या तो एक डेश कैम से ली गई है या किसी मूर्ख व्यक्ति से इस तरह के सांसारिक दृश्य की तस्वीर खींचने के लिए सड़क पर भटकना पड़ता है।

लेकिन थोड़ा करीब से देखो। ध्यान दें कि ट्रैफिक सिग्नल थोड़ा विकृत है, या कारों में से कुछ फजी कैसे लगते हैं? यहाँ कुछ गड़बड़ है यह बिल्कुल भी तस्वीर नहीं है। यह एक छवि है जो पूरी तरह से ए.आई.

टेक कंपनी एनवीडिया और कैलिफ़ोर्निया विश्वविद्यालय, बर्कले के कंप्यूटर वैज्ञानिकों ने एक शोध पत्र लिखा है, जो आर्टएक्सिव पर प्रीपेयर में उपलब्ध है, जिसमें विस्तार से बताया गया है कि वे यथार्थवादी स्ट्रीट इमेज और मानव चित्र बनाने के लिए एक तंत्रिका नेटवर्क कैसे प्राप्त कर सकते थे। यहां तक ​​कि उन्होंने एक यूजर इंटरफेस भी शामिल किया है, जिससे आप उन तस्वीरों को बदल सकते हैं, जो आप अतिरिक्त पर्णसमूह जोड़कर या यहां तक ​​कि मौसम को बदलकर पसंद करते हैं।

"गेमिंग तेजी से बढ़ रहा है, क्योंकि लोग आभासी वातावरण में एक-दूसरे के साथ बातचीत करना पसंद करते हैं," एनवीडिया के वरिष्ठ वैज्ञानिक मिंग-यू लियू बताते हैं श्लोक में एक ईमेल में "हालांकि, आभासी दुनिया का निर्माण आज की तकनीक के साथ महंगा है, क्योंकि इसमें कलाकारों को स्पष्ट रूप से मॉडल बनाने और दुनिया के लिए बनावट और प्रकाश व्यवस्था का अनुकरण करने की आवश्यकता होती है। छवि से छवि अनुवाद के साथ, हम इसके बजाय आभासी दुनिया बनाने के लिए वास्तविक दुनिया का नमूना ले सकते हैं। ”

तंत्रिका नेटवर्क ऐसे कंप्यूटर होते हैं, जो मानव मस्तिष्क की तरह काम करने के लिए जानकारी लेते हैं, इसे लागू करते हैं, और परिणामों से सीखते हैं। इस शोध में 2014 में इयान गुडफेलो द्वारा शुरू किए गए विशेष प्रकार के न्यूरल नेट का इस्तेमाल किया गया, जिसे जेनरेटर एडवरसियर नेटवर्क कहा जाता है - या जीएएन - जिसमें आमतौर पर दो नेटवर्क होते हैं, जनरेटर और डिस्क्रिमिनेटर।

जनरेटर को तस्वीरें दी गई हैं और यह उसी के समान सिंथेटिक छवियां बनाना शुरू करता है जो इसे दिया गया था। यह तब दी गई छवियों का मिश्रण दिखाता है और भेदभाव करने वाले को देता है, जिसका काम उन्हें अलग बताना है। जैसे-जैसे यह प्रक्रिया आगे बढ़ती है, जेनरेटर मूल चित्रों की नकल करने में बेहतर होता जाता है और भेदभाव करने वाला नकली को अलग बताता जाता है। परिणाम कुछ बहुत आश्वस्त हैं - और पूरी तरह से नकली - चित्र।

यह शोध पारंपरिक जीएएन मॉडल पर कुछ उप-नेटवर्कों में जनरेटर और विभेदक नेटवर्क को विभाजित करके, उच्च-रिज़ॉल्यूशन छवियों के आउटपुट के लिए अनुमति देता है। तंत्रिका नेटवर्क भी एक अर्थ-मानचित्र में लेने में सक्षम हैं - या तस्वीर को कैसे दिखना चाहिए - इसका एक खाका और बनावट को स्वायत्तता से भरने के लिए। उपयोगकर्ताओं को यहां तक ​​कि ब्लूप्रिंट में जा सकते हैं और चीजों को बदल सकते हैं यदि वे सड़क के दृश्य में पेड़ों के बजाय इमारतों को जोड़ना चाहते हैं या एक चित्र में आंखों को व्यापक बना सकते हैं।

इस पद्धति का उपयोग करते हुए इसी तरह के प्रयोगों के लिए पेपर अपने परिणामों की तुलना करता है, सबसे उल्लेखनीय एक Pix2pix है। एनवीडिया और यूसी बर्कले अध्ययन, सुपाठ्य लाइसेंस प्लेटों के रूप में छोटे और सटीक विवरणों के साथ छवियों को उत्पन्न करने में सक्षम है, जबकि पिक्स 2 पीक्स छवियों का उत्पादन करता है जो लगभग पानी के रंग के चित्रों की तरह दिखते हैं।

हालांकि इस टूल का उपयोग कुछ निशुल्क रेडिट कर्मों को करने के लिए किया जा सकता है, जिसमें कुछ आउटलैंडिश तस्वीरों के साथ कुछ भी हो सकता है, लेखक सिर्फ एक साधारण खाका के साथ यथार्थवादी ग्राफिक्स उत्पन्न करने के लिए इस दृष्टिकोण का उपयोग करने में बड़ी क्षमता देखते हैं।

Google मैप्स, फिल्मों और वीडियो गेम में उपयोग के लिए सैकड़ों घंटे श्रमसाध्य आभासी दुनिया बनाने में जाते हैं। लियू का कहना है कि यह मॉडल दर्द रहित तरीके से अधिकतर डिजाइनिंग का काम कर सकता है और बाद में विवरणों को बदल सकता है।

“दुनिया को स्पष्ट रूप से मॉडलिंग करने के बजाय, हम दुनिया के एक साधारण मॉडल के बीच अनुवाद करने के लिए छवि-से-छवि अनुवाद का उपयोग करके दुनिया का निर्माण कर सकते हैं जिसमें कोई बनावट या प्रकाश व्यवस्था नहीं है, और एक फोटो-यथार्थवादी आउटपुट । यह क्षमता आभासी दुनिया बनाने के लिए इसे बहुत सस्ता बनाना चाहिए, ”वह बताता है श्लोक में.

इस शोध के अगले चरण के लिए, टीम को वीडियो-टू-वीडियो अनुवाद का पता लगाने की उम्मीद है, जो यथार्थवादी वीडियो बनाने के लिए तंत्रिका जाल का उपयोग करेगा। ल्युई का कहना है कि एक लक्ष्य ने क्षेत्र के शोधकर्ताओं को चुनौती दी है।

अब आप जानते हैं कि आसानी से नकली चित्र कैसे बनाए जा सकते हैं। Google छवियों पर आपके द्वारा देखी गई सभी चीज़ों पर विश्वास न करें।

$config[ads_kvadrat] not found