Специалисты из пекинской компании Baidu научили нейросеть имитировать человеческий голос.
Роботизированную систему Deep Voice «обучали» с помощью аудиозаписи с голосами людей. Запись длилась более месяца и включала около 2400 голосов, пишет Naked Science.
Прослушивая запись, нейросеть научилась имитировать человеческий голос, интонацию и его тембр. Система может говорить мужским, женским голосом или добавлять иностранный акцент.
Разработка применима в быту, медицине, культуре и в других областях.