Представьте, что вы смотрите новый документальный фильм про жизнь Джона Леннона. Насыщенный визуальный ряд фильма сопровождается интересным повествованием. И, казалось бы, ничего необычного, вот только голос за кадром – это голос самого Леннона! Он сам анализирует происходящее на экране, напевает всем известные мелодии и подводит к трагическому финалу. Звучит как бред, но благодаря стартапу Respeecher это становится возможным.
Украинский стартап Respeecher строится на технологии, которая способна идеально копировать и воспроизводить голос любого человека. Единственное условие - наличие записи голоса (чуть больше часа), который пользователь хочет получить в результате. При этом нет привязки к какому-то определенному типу контента: голос может быть взят из телешоу, выступления, интервью, аудиокниги и т.д. На основе этой записи нейросеть создаст новую звуковую дорожку, и человек сможет произнести получившимся голосом что угодно.
Сервис работает по принципу «speech to speech». На вход подаются две аудиодорожки. Первая – с голосом носителя, которого мы хотим воспроизвести (например, Джона Леннона). Вторая - с голосом пользователя, чьи фразы будут трансформироваться в голос носителя. Система анализирует информацию, определяет разницу между двумя голосами и из одного делает другой.
К пользователю полностью переходит голосовой аппарат носителя: особенности произношения слов, скорость речи, акценты, тембр и т.д. При этом в голосе не остается никаких следов склеек, косноязычия или странного машинного произношения.
«Например, я смогу говорить голосом Барака Обамы. Для этого алгоритму передают мою фразу, и на выходе, через пару минут, получаем ту же фразу, сказанную голосом Обамы, с моими интонациями и эмоциональным наполнением», —объясняет идею продукта один из сооснователей компании Дмитрий Белевцов.
Технологию Respeecher планируют применять в самых разных областях. Например, теперь есть возможность создавать контент с голосами звёзд или исторических персонажей, даже если тех уже нет в живых. Можно озвучивать фильмы, сериалы и видеоигры, при этом не дергая актеров, график которых не позволяет много времени проводить в студиях. Можно менять голос операторов кол-центров, подстраиваясь под разные категории клиентов. Можно даже восстанавливать голос человека при частичной потере речи!
Всего в команде шесть человек. Они работают в киевском офисе Respeecher, но в настоящее время основатели проходят трёхмесячную программу акселерации Techstars в Филадельфии.
Сейчас компания находится на стадии коммерческого использования: она заключила контракты с несколькими киностудиями и медиа. Например, у стартапа уже подписан контракт с крупной голливудской студией. Сотрудники Respeecher пока не раскрывают ее название, но говорят, что студия входит в пятерку крупнейших Голливуда. Вместе со студией стартап работает над фильмом, в котором прозвучит голос актера, умершего несколько лет назад.
Respeecher заинтересованы в том, чтобы их клиентами были крупные компании. Именно с ними стартап сможет решать важные проблемы рынка и получать достойную прибыль. Поэтому в ближайшее время Respeecher планирует заключать как можно больше контрактов с представителями топ-сегмента рынка. На широкие сегменты компания планирует перейти, когда станет более самостоятельной и оснащенной в технологическом плане.
Что касается инвестиций, стартап уже получил два ангельских чека и $120 тысяч от Techstars. По мнению основателей, пока что стоимость Respeecher нельзя оценить достаточно точно. Но они уверены, что в следующем раунде финансирования оценка будет рыночной.