Как можно изменить голос в песне с помощью нейросети онлайн бесплатно
В настоящее время нейросети становятся все популярнее. При этом их функционал значительно расширяется. Современные приложения не только создают контент, но и имитируют голоса людей. Благодаря этому в сети стал появляться новый тренд – AI-каверы. При этом нейросеть исполняет популярные треки голосами других артистов. Однако далеко не каждому пользователю известно, как можно изменить голос в песне при помощи нейросети.
СОДЕРЖАНИЕ СТАТЬИ:
Замена голоса в песне с помощью нейронных сетей
Популярные ресурсы на основе искусственного интеллекта обладают похожим принципом работы. Для озвучки требуется написать текст, установить основные настройки и сгенерировать аудиозапись. После чего нейросеть создает аудио. Каждая программа говорит голосом, как живой человек. При этом отличие между разными вариантами софта заключается в тарификации и настройках.
Технология озвучки имеется у компании Microsoft и других популярных брендов. Они хорошо справляются с английским текстом. Однако отечественных пользователей в большей степени интересуют программы, которые генерируют русскую речь.
Использование Python для замены голоса в песне
Для использования ресурса Python требуется ввести в командной строке «pip install -U so-vits-svc-fork». Однако его требуется устанавливать на устройства с новой операционной системой. Если на ПК стоит 7 версия Виндовс, использовать Python не удастся. Это нужно учитывать при выборе ресурса для изменения голоса в треке.
Create AI Vocals – сайт для создания искусственного голоса
Чтобы воспользоваться специальным порталом для генерирования искусственного голоса, требуется перейти по ссылке https://create.musicfy.lol/. После чего нужно пройти регистрацию на платформе.
После того как откроется новое окно, слева требуется загрузить аудиофайл. Для этого нужно кликнуть на пункт «Select Audio File». Также можно записать трек самостоятельно. В этом случае нужно выбрать опцию «Start Recording».
На следующем этапе появится проигрыватель с записью. Тут нужно в правой части окна выбрать голос «Select an Artist». Ресурс предлагает 15 вариантов. Их предварительно можно прослушать. Голосу требуется задать высоту, перемещая ползунок «Set Pitch». Затем рекомендуется нажать на розовую кнопку «Remix» и записать кавер, который появится в левой части окна.
Справа в нижней части страницы будет присутствовать изображение стрелочки. Если нажать на этот значок, кавер удастся скачать. Это можно будет сделать в формате Wave Sound.
Этот ресурс считается достаточно простым, и его преимущественно используют ради развлечения. Портал не позволяет создать свою модель необходимого голоса. К тому же представленные там варианты не отличаются разнообразием.
Kaggle – платформа для работы с нейронными сетями
Для использования этого ресурса рекомендуется воспользоваться ссылкой https://www.kaggle.com/. При этом для российских пользователей есть некоторые ограничения. Дело в том, что для применения графического процессора GPU следует подтвердить свой номер телефона. Для российских юзеров эта опция недоступна.
Если все же хочется использовать этот ресурс, рекомендуется приобрести виртуальный номер. Это можно сделать на таких площадках, как https://novofon.com/numbers/ или https://onlinesim.io/ru. В таком случае регистрация станет доступна.
Google Colab – сервис для работы с нейронными сетями в облаке
Сгенерировать кавер можно при помощи платформы Google Colab. Для этого рекомендуется перейти по ссылке https://colab.research.google.com/drive/11syId1sx5vaoX1V_gmvC0E4uTUBnpmwr. После этого откроется блокнот с нужной информацией.
На следующем этапе требуется кликнуть на «Check GPU» и выбрать значок «Play». После запуска процесса проверки графического редактора GPU может появиться сообщение о том, что лимит исчерпан. Это чаще всего наблюдается при длительных экспериментах в блокноте. В этом нет ничего страшного. Чтобы получить нужный результат, стоит перейти в блокнот чуть позже.
Если все получилось, начнет вращаться черный кружок. Важно дождаться завершения этого процесса. При появлении предупреждающего сообщения, не стоит волноваться. Тут требуется кликнуть на пункт «Выполнить».
На следующем этапе рекомендуется нажать на «CELL 1» и «CELL 2». При этом может появиться еще одно предупреждение. Там сказано, что ряд пакетов были раньше импортированы в среду выполнения. Ее нужно перезапустить для использования новых установленных версий.
Чтобы продвинуться дальше, следует нажать на кнопку «Restart Runtime». При появлении предупреждения о перезапуске среды выполнения рекомендуется нажать на кнопку «Да». Некоторые пользователи его игнорируют, однако делать этого не рекомендуется.
При правильном выполнении манипуляций появится такая среда:
- тип среды выполнения – Python3;
- аппаратный ускоритель – GPU;
- тип графического процессора – Т4.
Дальше появляется Setup 1. Этот этап занимает 7-10 минут и включает много текста. Там могут появляться ошибки, обозначенные красным. Также может появиться кнопка перезагрузки среды. Ее требуется нажать.
На следующем этапе в нижней части экрана может появиться желтая надпись на черном фоне. Она говорит о том, что юзер не использует графическую среду и предложит переключиться. Тут следует нажать на ссылку.
После завершения Setup 1 без красной стрелки можно переходить к запуску Setup 2. Этот процесс не займет много времени. На следующем этапе загружается среда конвертации. При этом пользователь может видеть движущуюся черную полоску. После чего появится результат «Download ContentVec».
Затем обязательно требуется выбрать голос исполнителя. Большое количество голосов можно найти по ссылке https://huggingface.co/QuickWick/Music-AI-Voices/tree/main. Это дает возможность пользователю не тренировать свою модель, но и выбрать готовый вариант. Если модель уже имеется, можно загрузить архив с ней. Для этого требуется воспользоваться опцией «model_url».
Затем рекомендуется нажать на архивированный объект правой кнопкой мышки. После появления контекстного меню требуется кликнуть на пункт «Открыть доступ». Там рекомендуется выбрать пункт «Все, у кого есть ссылка». После чего нужно кликнуть на строку «Копировать ссылку».
Ее нужно привести в такой вид: «https://drive.google.com/uc?id=». После чего следует добавить идентификатор и вставить готовый вариант в «model_url».
После чего нужно запустить «Other Downloads (.zip) Step o.1» и загрузить архив с моделью. На следующем этапе следует нажать на «Extract .zip Downloads - Step o.2». После этого стоит загрузить файл, на основе которого планируется моделирование голоса и нажать на кнопку «Convert». Готовый вариант можно будет скачать.
Изменение голоса в треках при помощи нейросетей считается достаточно увлекательным процессом. Чтобы он был успешным, следует правильно выбрать ресурс и четко следовать инструкциям.