Как изкуственият интелект генерира музика?

+21
669
Как изкуственият интелект генерира музика?

Възможно ли е да автоматизирате творчеството? Днес детайлно ще разберем дали невронните мрежи наистина претендират да създават музикални шедьоври. 

Много е вероятно в бъдеще велики шедьоври да бъдат създадени съвместно от хората и изкуствения интелект.

Творчеството винаги се е смятало за важен аспект на човечеството. И ако в когнитивните задачи, като изчисляване и обработка на информация, вече сме признали превъзходството на изкуствения интелект и активно използваме плодовете на автоматизацията, то в такива „човешки“ дейности като рисуване, поезия или композиране алгоритмите ни отстъпват . И като цяло, възможно ли е да се постави производството на шедьоври на поток? Учените обаче са ангажирани със задачата да създават автоматично картини, стихове и музика в продължение на няколко десетилетия и определено е постигнат известен напредък.

Първата музика, генерирана от компютър, се появява през 1957 г. в Bell Laboratories. Това беше 17-секундна песен, наречена The Silver Scale от Нюман Гутман.

През същата година The Illiac Suite става първият компютърно написан резултат. Той е кръстен на компютъра ILLIAC I в Университета на Илинойс, САЩ. Това е ранен пример за алгоритмичен състав, основан на вероятностно моделиране (вериги на Марков). В областта на синтеза на звук, забележително събитие беше пускането на синтезатора DX 7 от Yamaha през 1983 г., използвайки модел на синтез на честотна модулация (FM).

Генериране на музика

Когато говорим за създаване на музика с помощта на компютър, можем да говорим както за помощна система, така и за компютърна среда, която помага на музикантите (композитори, аранжори, продуценти), както и за автономна система, насочена към създаване на оригинална музика. И двата типа системи могат да включват алгоритми на невронната мрежа и задълбочено обучение.

Можем да говорим и за различните етапи на правене на музика, където изкуственият интелект е вграден в процеса и ни помага: композиране, аранжиране, оркестриране и т.н. Когато човек композира музика, той рядко създава ново парче от нулата. Той използва повторно или адаптира (съзнателно или несъзнателно) музикални елементи, които е чувал преди, и се ръководи от принципи и насоки от музикалната теория. По същия начин компютърният асистент може да бъде включен на различни етапи от създаването на произведение, за да инициира, предложи или допълни човешки композитор.

Генериране на ноти

радиционният подход е да се създава музика в символична форма. Резултатът от процеса на генериране може да бъде музикална партитура, MIDI последователност от събития (общ стандарт за цифров аудио запис), проста мелодия, хордова прогресия, текстово представяне или някакво друго представяне на по-високо ниво. Тоест изкуственият интелект създава символична форма, която след това може да се използва за възпроизвеждане на пиесата.

С други думи, физическият процес, чрез който се създава звук, се премахва - вместо да създава цялото разнообразие от аудио сигнал, алгоритъмът издава „инструкция“. Това драстично намалява количеството информация, което алгоритмите трябва да произвеждат, което намалява проблема със синтеза до по-разрешим и позволява ефективно използване на прости модели за машинно обучение.

Този подход, например, направи възможно създаването на музика в стил Бах. Друг пример е невронна мрежа от OpenAI Musenet, която се появи през април 2019 г. MuseNet може да композира четириминутни композиции на десет инструмента и да комбинира стилове „от Моцарт до Бийтълс“. Тази невронна мрежа е обучена върху огромен набор от MIDI записи.

Генериране на аудио

Но символичният подход не позволява да се създадат нюансите на човешкия глас и различни характеристики на тембъра, динамиката и изразителността на едно музикално произведение. Друг начин е да създавате музика директно като аудио сигнал. Трудността при този подход е, че последователността, която се опитваме да създадем в този случай, е много дълга. Например за песен от няколко минути с добро студийно качество това би било десетки милиони стойности.

През април 2020 г. OpenAI пусна Jukebox, невронна мрежа, която генерира музика в различни жанрове. Тя може да генерира дори елементарен глас, както и различни музикални инструменти. Jukebox създава аудио сигнала директно, заобикаляйки символното представяне. Такива музикални модели имат много по-голям капацитет и сложност, отколкото техните символни колеги, което предполага по-високи изчислителни изисквания за обучение на модела.

Но какво ще кажете за текстовете?

Добре, разбрахме за генерирането на музикалните композиции, но какво ще кажете за текстовете на песните? 

Може ли изкуственият интелект да пише поезия? 

Да, и тази задача е дори по-лесна от писането на мелодии, въпреки че тук също има достатъчно трудности - алгоритъмът трябва не само да „измисли“ смислен текст, но и да вземе предвид неговата ритмична структура.

През 2016 г. разработчиците на Yandex издадоха албума Neural Defense. Включва 13 песни в стил „Гражданска защита“, текстовете за които са съставени от изкуствен интелект. Година по-късно излиза албумът "Neurona" с четири песни в стила на Nirvana, стиховете за които също са генерирани от невронни мрежи. 

Пеенето

Научихме се да създаваме музика, да пишем и поезия за нея, но какво да кажем за човешкия глас? Могат ли невронните мрежи да пеят за нас?

Генерирането на реалистичен човешки глас е необходимо не само за пеене, но и в много системи - от кол центрове до лични гласови асистенти. Още през 2016 г. DeepMind пусна алгоритъма WaveNet, който създава много реалистичен глас от даден текст (Text-To-Speech). Технологията е достъпна за два езика - английски и китайски.

Благодаря ви за четенето, искрено се надявам че бях полезен и интересен на вас. Бъдете винаги здрави и усмихнати!

RSS
Все още няма коментари. Бъдете първият, който добави коментар!
Зареждане...

Други статии