Реалистичный голос для преобразования текста в речь

Я пробовал несколько текстовых программ (на Linux), таких как Fetival, eSpeak, так далее; но голос во всех них очень роботизированный. Существуют голосовые шаблоны для изменения голоса с мужского на женский, но проблема во всех них заключается в том, что система читает каждое слово отдельно, а не начинает читать предложение.

Есть ли какая-нибудь продвинутая программа или трюк для чтения текста относительно естественным голосом?

Нынешние искусственные голоса не могут быть прослушаны для длинного текста (слишком скучно, поскольку слушатель не может сосредоточиться).

6 ответов

Решение

Я думаю, что вы имеете в виду Text-To-Speech (TTS), так как вы говорите о роботизированном голосе. Механизмы TTS принимают письменный текст и озвучивают его, тогда как механизмы распознавания речи понимают человеческую речь и преобразуют ее в машиночитаемый формат. У Loquendo самый естественный двигатель TTS, который я когда-либо слышал. У них есть версия для Linux. У них есть интерактивная демоверсия, с которой вы можете поиграть, чтобы услышать, как это здорово звучит. Там движок TTS может принимать специальные символы в тексте, чтобы делать такие вещи, как выделение фраз или даже заставлять голос смеяться или плакать. Не многие двигатели TTS делают это.

После нескольких недель изучения одного и того же вопроса я обнаружил, что голоса Ivona ( здесь) и Loquendo ( здесь и здесь) - лучшие голоса TTS, доступные для Windows. Только Ivona перечисляет цены на своем веб-сайте. Чтобы использовать голоса TTS на вашем ПК с Windows, я рекомендую Balabolka (бесплатно), Ivona MiniReader (бесплатно) или Ivona Reader.

Затем проверьте ясно из Evernote. Это расширение браузера в настоящее время доступно только для Google Chrome. Предоставляет TTS только премиум- клиентам. Голос TTS (с поддержкой iSpeech) не так хорош, как у Ivona или Loquendo, но дает читателю хороший обзор постов / статей в блоге, удаляя отвлекающие элементы страницы. Вы также можете установить автоматическое выделение прочитанного в данный момент слова!

Проверьте также ReadSpeaker, который может быть внедрен владельцами веб-сайтов на их сайт. Readspeaker обеспечивает автоматическое выделение текущего прочитанного абзаца / слова, автоматическую прокрутку и возможность изменять скорость TTS.

[Edit:] Есть несколько бесплатных полезных расширений Google Chrome, которые также работают на iSpeech.

Вы можете купить готовое устройство. http://www.textspeak.com/ делает звучание человека речевым продуктом, досками и коробками. Они имеют 20 языков, и простые TTS звучат лучше всего.

Там нет лицензии или разработки... просто купите коробку, если вам нужен только один голосовой вывод.

(Это НЕ ПО для программного обеспечения, но мы использовали его в системах подкачки... 5 минут для установки)

С их сайта

"Встраиваемые текстовые модули TextSpeak Text-To-Speech преобразуют текст ASCII в естественный, чистый голос с неограниченным словарным запасом. Компактное решение в виде плагина принимает широкий диапазон входных данных для генерации речи в реальном времени для Security Transit Medical и Industry.

http://www.textspeak.com/oemtts.htm

Я не знаю, является ли это открытым исходным кодом, но TTS от Google бесплатен и звучит очень естественно по сравнению с Samsung и Microsoft Anna.

Cepstral, кажется, обеспечивает разумные цены для преобразования текста в речь. Вы можете проверить их в качестве опции.

http://www.cepstral.com/

Когда дело доходит до хорошего звука, вы действительно хотите искать не программное обеспечение преобразования текста в речь, а хорошие голоса: это отдельная тема.

Один и тот же голос будет работать в разных программах. Лучшего из тех, кого я знаю на данный момент, зовут Одри. Женский голос с британским акцентом. Несмотря на то, что мне приходится менять большинство текста текста с копированием на клавиатуру, оно стоит почти реалистичного звучания. Я также должен поместить символ паузы (.,: Или такой) в конце заголовков, чтобы она не продолжала говорить прямо через них. Я все еще думаю, что это лучший голос, который у меня есть. Но я не возражаю против того, чтобы найти тот из погодного канала, который был упомянут выше:

"Погодные радиопередачи NOAA ОТЛИЧНЫ. Я не возражал бы против прослушивания этой программы и чтения длинного текста. - Жанна Пиндар"

Вот сайт, на котором есть образцы голосов: включая Одри. У меня есть другие, но я уже давно пользуюсь ею.

PS: вы должны платить за лучшие голоса, но потом они будут работать на бесплатном программном обеспечении для преобразования текста в речь... по крайней мере, у меня. (Бесплатный Natural Reader)

Пример голосовой веб-страницы: http://www.digitalfuturesoft.com/attnaturalvoices.php

Другие вопросы по тегам