Нужен инструмент для преобразования речи в текст (конвертировать.wav в текст)

Question

Нужен инструмент для преобразования речи в текст (конвертировать.wav в текст)

У меня есть возможность получать WAV-файлы голосовой почты, отправленные мне по электронной почте, но иногда я буду сидеть на собрании, и мне нужно знать содержание сообщения, не воспроизводя его вслух.

Есть ли хорошие (и, желательно, бесплатные) инструменты для преобразования WAV-файлов в текст? Я знаю, что у Google Voice есть такая возможность, но я не могу определить, будет ли она работать на индивидуальной основе.

Я понимаю, что это сложная исследовательская проблема, но даже 80% -ое решение может быть работоспособным.

3

software-rec wav speech-recognition speech-to-text

Источник

David 25 май '10 в 19:16

2 ответа

Другие вопросы по тегам software-rec wav speech-recognition speech-to-text

sleske 26 май '10 в 11:14 2010-05-26 11:14 · Answer 1 · 2010-05-26 11:14

Я считаю, что лучшее бесплатное программное обеспечение для распознавания речи - CMU Sphinx. Это выглядит довольно зрелым, хотя я не использовал его. Однако это скорее исследовательский проект, нежели сфокусированный на конечных пользователях, поэтому, хотя он, по-видимому, работает хорошо, его нужно немного отрегулировать; в частности, вам нужно будет тренировать его перед использованием.

Другое программное обеспечение, которое вы можете попробовать:

http://en.wikipedia.org/wiki/List_of_speech_recognition_software

Кстати, вы рассматривали просто прослушивание сообщений с помощью небольшой затычки для ушей, если вы находитесь на встрече. Может быть, самый простой способ:-). Или просто проводить меньше встреч...

patrick 05 дек '12 в 03:37 2012-12-05 03:37 · Answer 2 · 2012-12-05 03:37

Посмотри на Юлия

mkdir -p $HOME/tmp/ 
cd $HOME/tmp 
if [ ! -f  Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz ] ; then
    wget http://www.repository.voxforge1.org/downloads/Nightly_Builds/AcousticModel-2011-07-21/Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz  -O  Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz
fi 
tar xvpfz Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz 
echo "It might be installed."

1

Источник

patrick 05 дек '12 в 03:37