प्रिंसटन अंडरग्रेजुएट गूगल डीप ड्रीम-इंस्पायर्ड डीपजैज ए.आई. संगीत बनाने वाला

$config[ads_kvadrat] not found

Faith Evans feat. Stevie J – "A Minute" [Official Music Video]

Faith Evans feat. Stevie J – "A Minute" [Official Music Video]
Anonim

जी-सुंग किम ने अप्रैल के पहले सप्ताहांत के शुरुआती घंटों को कैफीन और अपने कंप्यूटर पर कोडिंग के रूप में बिताया जब उन्होंने डीप जैज विकसित किया, एक गहरा सीखने वाला संगीत जनरेटर। यूनिवर्सिटी में 1-3 अप्रैल को आयोजित अपने पहले हैकथॉन, हैकप्रिंसटन के दौरान 20 साल के प्रिंसटन कंप्यूटर साइंस के सैम्पल में डीपजैज को पूरा करने के लिए केवल 36 घंटे थे। कोडिंग की मैराथन खत्म करने के बाद, उन्होंने डीपजैज के लिए एक वेबसाइट बनाई, और गीथहब पर स्रोत कोड पोस्ट किया।

लेकिन किम के आश्चर्य से बहुत दूर, कार्यक्रम बंद हो गया। दीपजज लगातार पायथन और गीथहब पर ट्रेंड कर रहा है - कुल मिलाकर गीथूब पर शीर्ष सातवें कार्यक्रम के रूप में उच्च तक पहुंच रहा है। यह भी HackerNews के सामने पृष्ठ पर चित्रित किया गया था और अभी भी एक जीवंत चर्चा उत्पन्न कर रहा है।

"मैंने कभी उम्मीद नहीं की थी कि लोकप्रियता के मामले में मेरा पहला पक्ष इस विस्फोटक होगा।" श्लोक में। "यह बहुत पागल और मजेदार रहा है।"

deepjazz - केर और थीनो का उपयोग करके डीप लर्निंग संचालित जैज़ जेनरेशन! http://t.co/G5wscglzO7 #python

- पायथन ट्रेंडिंग (@pythontrending) 11 अप्रैल, 2016

खाने, सोने और अन्य कोर्स पूरा करने के बीच, किम ने तर्क दिया कि डीपजैज के लिए स्रोत कोड विकसित करने में उसे लगभग 12 घंटे लग गए। हालांकि, वह हैकप्रिंसटन से बहुत पहले एक कृत्रिम बुद्धि संगीत जनरेटर के लिए विचार के साथ आया था। शिकागो विश्वविद्यालय में एक ग्रीष्मकालीन इंटर्नशिप के दौरान, वह Google के डीप ड्रीम में आया, एक फोटो जनरेटर जो एक छवि में पैटर्न की व्याख्या करता है और उन्हें उन अन्य वस्तुओं में बदल देता है जिन्हें वह जानता है। नतीजा यह है कि वे एक जंगली सपने से बाहर आए जैसे दिखते हैं।

किम कहते हैं, "कला की व्याख्या करने के लिए गहरी शिक्षा का उपयोग करने का विचार वास्तव में मेरे लिए दिलचस्प था।" "इस प्रकार का डीप ड्रीम फ्रेमवर्क जो Google ने प्रस्तुत किया और प्रकाशित किया गया था, वह वास्तव में आकर्षक था क्योंकि आप मौजूदा कलाकृतियों से उपन्यास के टुकड़े बना रहे हैं।"

डीपजैज़ जैज़ संगीत उत्पन्न करने के लिए मशीन-लर्निंग का उपयोग करता है - “ए.आई. जैज़ बनाने के लिए “साउंडक्लाउड प्रोफाइल राज्यों के रूप में। किम, जिन्होंने संगीत सिद्धांत की कक्षाएं नहीं ली हैं, लेकिन सात वर्षों तक शहनाई बजाते हैं, ने अपने अपरंपरागत धुनों के कारण जैज़ संगीत को चुना। एक ए.आई. सिस्टम का संगीत, "कुछ असामान्य आउटपुट हो सकते हैं, इसलिए मुझे लगता है कि जैज़ विशेष रूप से मक्खी पर संगीत बनाने के विचार के अनुकूल था," वे कहते हैं।

उन्होंने जैज़ संगीत के लिए अनुकूलित एक मौजूदा संगीत जनरेटर को फिर से तैयार किया जो कि उनके दोस्त इवान चो ने जैज़एमएल नामक विकसित किया, जो प्रासंगिक डेटा प्राप्त करने के लिए कोड का उपयोग करता है, लेकिन इसे एक द्विआधारी मैट्रिक्स में बदल देता है जो दो गहरे सीखने के पुस्तकालयों केरस और थेनो के साथ संगत है।

डीपजैज फ्रेमवर्क ने खुद को दो-परत वाला एलएसटीएम कहा, जो एक प्रकार का कृत्रिम तंत्रिका नेटवर्क वास्तुकला है, जिसे किम वर्णन करते हैं। यह संगीत नोट्स के प्रारंभिक आधारभूत बीज अनुक्रम (किम मेथनी के "और फिर मैं जानता था" के कुछ हिस्सों को सीखता है) के बाद, यह नोटों को संभाव्यता प्रदान करता है और उन संभावनाओं के आधार पर अगला नोट तैयार करता है। उदाहरण के लिए, यदि आप प्रोग्राम को ए, बी, सी खिलाते हैं, तो इस बात की बहुत अधिक संभावना है कि अगला नोट डीपजैज उत्पन्न करेगा, डी होने वाला है, किम बताते हैं।

ऐतिहासिक रूप से, आलोचकों ने कहा है कि कृत्रिम बुद्धिमत्ता वाले संगीत जनक गीतों के निर्माण से त्रस्त हैं, जो ध्वनि को भी रोबोट और बाँझ बनाते हैं - मनुष्यों द्वारा रचित संगीत में सुनाई देने वाले रंग की कमी। MIT के एक पूर्व छात्र जेफरी बिलम्स ने कंप्यूटर पर एक थीसिस लिखी थी जो 1993 में संगीत की लय को पुन: पेश करता है श्लोक में नवंबर में:

"जब आप संगीत खेलना सीख रहे हैं और आप जैज़ बजाना सीख रहे हैं, तो सहज रूप से यह समझने के लिए एक उपयोगिता है कि यह संगीत के बारे में क्या है जो इसे मानव बनाता है," बिलम्स ने कहा। "मनुष्य सहज ज्ञान युक्त प्राणी हैं, और मनुष्य अक्सर यह वर्णन करने में सक्षम नहीं होते हैं कि वे कैसे मानवीय चीजें करने में सक्षम हैं। मुझे उस समय लगा कि शायद मैं इन चीजों को परिभाषित करने में एक पवित्र शपथ का उल्लंघन कर रहा हूं कंप्यूटर कार्यक्रमों के लिए। ”

जब किम डीप जैज के लिए रिसर्च कर रहे थे, तो उन्हें कई ऐसे सिस्टम मिले जो कि रोबोट की आवाज पैदा करने वाला संगीत था।

"संगीत और कला ऐसी चीजें हैं जिन्हें हम गहन मानव मानते हैं," किम कहते हैं। "इसे और अधिक मानवीय और अधिक आजीवन ध्वनि देने के लिए इसे वर्गीकृत करना वास्तव में कठिन है।" किम का सुझाव है कि जनरेटर उन गीतों का निर्माण कर सकते हैं जो मूल ट्रैक के समान ध्वनि करने के लिए उन्हें प्रोग्रामिंग करके अधिक मानव ध्वनि उत्पन्न करते हैं।

अन्य डेवलपर्स ने किम से संपर्क किया है और डीपजैज का विस्तार करने में रुचि रखते हैं ताकि अधिक लोग इसके साथ बातचीत कर सकें। किम एक दिन एक आशिकमिजाजी के साथी के रूप में विकसित होते हुए देख सकते हैं जो एक संगीतकार के लिए कृत्रिम रूप से एक दरार पैदा कर सकता है। भविष्य में भी, वह उन अनुप्रयोगों को देख सकता है जो आपके पसंदीदा ट्रैक्स में नए, समान ध्वनि वाला संगीत बनाते हैं या जो संगीतकारों के लिए नए राग और प्रगति का सुझाव दे सकते हैं।

किम स्वीकार करते हैं कि वह अभी भी गहरी शिक्षा के विशेषज्ञ होने से दूर हैं, लेकिन इंटर्नशिप और प्रिंसटन में डीप जैज और प्रशिक्षण विकसित करने के उनके अनुभव ने उन्हें क्षेत्र में कुछ मूल्यवान जानकारी दी है।

"A.I. अब एक विज्ञान फाई सपना नहीं है। यह कुछ ऐसा है जो बहुत वास्तविक है और यह बहुत तेज गति से आ रहा है। "उम्मीद है कि यह देखते हुए कि यह कॉलेज छात्र, जो अभी तक एक बड़े पैमाने पर भी नहीं है, एक हैकाथॉन के भीतर कुछ बनाने में सक्षम था, अन्य छात्रों को प्रोत्साहित कर रहा है जो कंप्यूटर विज्ञान में प्रवेश पाने के लिए संघर्ष कर रहे हैं।"

$config[ads_kvadrat] not found