Эмоциональный Microsoft

Microsoft запатентовал технологию генерирования голоса с заданной эмоцией. 15 Март 2016, 17:09
Сгенирированная компьютером речь все чаще встречается в современных устройствах. Например, в смартфонах теперь обычно есть личный помощник, который может отвечать на различные вопросы, а также делать напоминания или предоставлять другую полезную информацию.

Во всех существующих системах какие-либо эмоции в читаемом тексте отсутствуют. Однако Microsoft запатентовал технику создания голоса с заданными типами эмоций, как на таблице ниже:

В начале, с учетом конкретного семантического контента, генерируются сегменты речи с различными эмоциями.

В таблица выше показаны 4 сегмента речи, которые предлагают различные варианты эмоциального произношения конкретного контента ("Путин вывел войска из Сирии"), в каждом из которых есть текстовая часть и эвристические характеристики, которые на слух человека будут отличаться друг от друга.

После этого, варианты ранжируются по заранее заданным критериям. Версия, оказавшаяся на первом месте, зачитывается вслух.

Patent Information Publication number: US 20160071510 Patent Title: Voice Generation With Predetermined Emotion Type Publication date: 10 Mar 2016 - microsoft.pdf