nitro.ru главная   фотогалерея  о проекте   e-mail
 
 



security
ИИ может сымитировать голос любого человека

Канадский ИИ-стартап Lyrebird опубликовал свой первый продукт – набор алгоритмов, которые могут сымитировать голос любого человека. В компании говорят, что достаточно звукового файла длинной 1 минута, чтобы обучить ИИ чужому голосу.  

Несколько лет назад это было невозможно, но с того времени машинное обучение доказало, что идеально подходит для подобных задач. Машинный голос больше не ассоциируется с Сэмом из старых версий Windows, теперь это более похоже на людские голоса: помощники от Google, Apple или Amazon. Сегодня ИИ смог заговорить по-человечески, но прошло не так много времени, и он смог говорить голосом любого человека.

Недавно Adobe рассказала о проекте VoСo — программа, которая позволяет работать с голосовыми файлами так же, как Photoshop позволяет работать с фотографиями. В случае с VoCo для воссоздания чужого голоса требуется не менее 20 минут записей. Алгоритмы Lyrebird работают совершенно иначе. Для «воровства» чужого голоса программе нужна запись не более 1 минуты. ИИ изучит ее, учтет все особенности говорящего и перенесет их на себя. 

В текущей версии программы можно достаточно быстро отличить воссозданный голос от оригинального, но схожесть точно есть. Учитывая, что уже сейчас голоса очень похожи, нет сомнений, что в будущих версиях программы отличить робота от оригинала будет все сложнее. Для демонстрации возможностей компания выложила беседу искусственных Обамы, Трампа и Клинтон.

В Lyrebird говорят, что могут не только воссоздать чужой голос, но и окрасить его эмоционально. Алгоритм может менять голос на сердитый, веселый, грустный. Создатели говорят, что в первую очередь это будет полезно для озвучивания текста голосами известных людей, для совершенствования работы голосовых ассистентов и прочих безобидных применений. Но очевидно, что перед массовым запуском создатели столкнутся с этическими проблемами подделки чужого голоса. 

Аудиозаписи часто используются в качестве доказательств в суде. Существуют системы голосовой идентификации, и подделка голоса позволит легко их обманывать. 

Развитие компьютерной графики, монтажа и нейронных сетей позволило воссоздавать реальных людей на экране и манипулировать ими. Добавим к этому «настоящие» голоса героев, и получится совсем дикая смесь — подделка политиков и публичных персон для создания вирусного контент встанет на поток. 

Учитывая, что многие вопросы дипломаты и политики по-прежнему решают по телефону, это еще одна область, где можно создать неудобства. На эти заявления в компании отвечают обещанием выложить технологию в открытый доступ. Якобы, зная о ее существовании, все будут более внимательно относиться к вербальному формату общения. 

st41n | источник: hightech.fm | 10/04/19, 12:37




Оставьте комментарии. Возможно вам есть что добавить.


Если хотите дать ссылку, пишите полностью URL с http://
Если заключить слово в *звёздочки*, оно будет показано курсивом