Описание тега text-to-speech
Процесс преобразования текста в речь или синтеза речи - это создание искусственного человеческого голоса. Система, используемая для этой цели, называется синтезатором голоса и может быть реализована программно или аппаратно. Преобразование текста в речь (TTS) преобразует текст на обычном языке в голос; другие системы интерпретируют символическое лингвистическое представление (такое как фонетическая транскрипция) голоса.
Синтезированный голос может быть создан путем объединения фрагментов записанной речи, хранящихся в базе данных. Системы отличаются по размеру хранимых речевых единиц; система, которая хранит телефоны или аллофоны, обеспечивает самый большой выходной диапазон, но может не иметь ясности. Для конкретных целей хранение слов или целых фраз обеспечивает высокое качество вывода. Альтернативно, синтезатор может включать модель голосового тракта (путь, пройденный голосом) и другие характеристики человеческого голоса, чтобы создать в качестве речевого вывода полностью "синтетический".