Ученые Монреальского института изучения алгоритмов разработали технологию синтеза речи нового поколения, способную полностью скопировать голос человека. Ей достаточно прослушав речь в течение минуты для того, чтобы затем воспроизвести целые слова и фразы, неотличимые от оригинала.
Специалисты использовали вычислительные кластеры на GPU-ускорителях – алгоритмам под силу генерировать более тысячи предложений за полсекунды. Сейчас технологию нельзя назвать идеальной, но любой человек, который услышит искусственный голос, сможет сразу догадаться, кто именно произносит речь. По словам канадских исследователей, разработка может быть использована злоумышленниками для того, чтобы ввести в заблуждение дипломатов и СМИ. Они также могут способствовать появлению фальшивых новостей.
Lyrebird также могут использовать для кражи личности, а потому алгоритмы были выложены в открытый доступ для того, чтобы любой человек был осведомлен о том, что аудиозаписи нельзя считать надежным источником доказательств.