Нужен инструмент для преобразования речи в текст (конвертировать.wav в текст)
У меня есть возможность получать WAV-файлы голосовой почты, отправленные мне по электронной почте, но иногда я буду сидеть на собрании, и мне нужно знать содержание сообщения, не воспроизводя его вслух.
Есть ли хорошие (и, желательно, бесплатные) инструменты для преобразования WAV-файлов в текст? Я знаю, что у Google Voice есть такая возможность, но я не могу определить, будет ли она работать на индивидуальной основе.
Я понимаю, что это сложная исследовательская проблема, но даже 80% -ое решение может быть работоспособным.
2 ответа
Я считаю, что лучшее бесплатное программное обеспечение для распознавания речи - CMU Sphinx. Это выглядит довольно зрелым, хотя я не использовал его. Однако это скорее исследовательский проект, нежели сфокусированный на конечных пользователях, поэтому, хотя он, по-видимому, работает хорошо, его нужно немного отрегулировать; в частности, вам нужно будет тренировать его перед использованием.
Другое программное обеспечение, которое вы можете попробовать:
http://en.wikipedia.org/wiki/List_of_speech_recognition_software
Кстати, вы рассматривали просто прослушивание сообщений с помощью небольшой затычки для ушей, если вы находитесь на встрече. Может быть, самый простой способ:-). Или просто проводить меньше встреч...
Посмотри на Юлия
mkdir -p $HOME/tmp/
cd $HOME/tmp
if [ ! -f Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz ] ; then
wget http://www.repository.voxforge1.org/downloads/Nightly_Builds/AcousticModel-2011-07-21/Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz -O Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz
fi
tar xvpfz Julius-3.5.2-Quickstart-Linux_AcousticModel-2011-07-21.tgz
echo "It might be installed."