Создатель стенограммы ИЛИ Речь к тексту
Я слушаю ежедневный подкаст, который длится около 4 часов. Я думаю, что это был бы классный проект, если бы я мог придумать какой-нибудь способ автоматически генерировать его стенограммы. Есть ли программное обеспечение, которое будет "слушать" mp3-файлы и создавать текст того, что они говорят?
Меня не очень интересует различие между тем, кто говорит, потому что я думаю, что это будет слишком много. Говорят 4 основных человека и другие реже.
7 ответов
Я уверен, что Дракон позволит тебе это сделать. У вас могут быть проблемы с точностью, хотя.
Шаги :
- Загрузите бесплатный транскрипционный плеер Express Scribe и установите его.
- После того, как приложение установлено, вы найдете уже загруженный пример файла диктовки. Это даст вам возможность поиграть с элементами управления и опциями, чтобы настроить приложение в соответствии с вашими потребностями.
- В главном интерфейсе нажмите кнопку "Настройки".
- Express Scribe позволяет изменять или устанавливать несколько параметров, включая скорость перемотки назад и ускоренной перемотки вперед, горячие клавиши для всей системы (для управления приложением без использования мыши), настройку ножной педали управления (если она есть), автозагрузку файлов из папки LAN или FTP-сервера, выбор разрешенных типов файлов (поддерживается более 20) и настройка модуля распознавания речи.
- После настройки параметров вы можете загрузить свой первый аудиофайл. В зависимости от того, откуда вы его получаете, вы можете нажать "Загрузить" (откроется диалоговое окно, которое позволит вам найти файл на вашем ПК), "Загрузить сейчас" (если вы установили соединение по локальной сети или FTP) или "Док". (если у вас есть цифровой диктофон или диктофон с вами).
- Выберите аудиофайл в главном окне интерфейса и нажмите кнопку Play, чтобы начать. При необходимости замедлите или увеличьте скорость воспроизведения звука с помощью регулятора скорости в правом нижнем углу. Выше этого элемента управления вы также можете регулировать громкость воспроизведения.
- Если вы хотите, чтобы Express Scibe находился над вашим текстовым приложением, вы можете выбрать Scribe Mini на главной панели инструментов интерфейса. Как следует из названия, эта опция предоставляет мини-версию приложения.
- Как только вы закончите транскрибировать ваши аудиофайлы, вы можете пометить их как "Готово" (удаление файла из списка) или "Отправка" (возврат и отправка по электронной почте исходному отправителю вместе с приложением Trext и удаление аудиофайла из списка.,
подсказки
- Потратьте некоторое время, чтобы изучить все варианты приложения.
- Если вы получаете аудиофайл низкого качества, вы можете выбрать Special Audio Processes из меню File, чтобы попытаться очистить его.
- Когда Express Scribe получает аудиофайл, он сохраняется в C:\Documents and Settings\ имя пользователя \Application Data\NCH Swift Sound\scribe\Current
- Если вы пометили аудиофайл как "Готово", но хотите восстановить его, вы можете восстановить старые файлы из меню "Файл".
Одна вещь, которую вы можете попробовать (хотя и не ежедневно), это загрузить аудио в виде видео на Youtube, а затем попросить YouTube транскрибировать видео с надписями на английском языке... YouTube может сделать это до 24 часов, однако... Файл заголовка можно загрузить, и вы можете редактировать его самостоятельно, чтобы вы могли копировать и вставлять текст куда угодно...
Проблема с Dragon Naturally Speaking в таком контексте заключается в том, что вы действительно не сможете пройти тренировочный процесс, где он научится точно интерпретировать речь. Он не предназначен для такого использования. Может быть, у АНБ есть какое-то программное обеспечение для такого рода вещей.:)
Пробовал волна к тексту? Это только окна и имеет ограниченную бесплатную пробную версию.
Сколько голосов в этих файлах? Все ли файлы содержат речь одним (обучаемым) голосом? Какое качество звука? Если ответы на эти вопросы не такие: "Только я", "Да" и "Качество CD", @Snark прав, вы должны сделать это по существу вручную. Получить хорошую программу распознавания речи, потратить некоторое время на ее обучение и воспроизводить файлы, пока вы пытаетесь сказать, что они говорят.
Ожидайте 90% - 95% успешной транскрипции, которая звучит великолепно, пока вы не поймете, что означает, что 1 или 2 из каждых 20 слов неверны.
Другие факторы, которые могут повлиять на точность:
- Много акронимов в твоей речи
- неполные предложения - речь к тексту имеет тенденцию работать намного лучше с подсказками контекста, которые это получает от полных предложений.
Вам нужно программное обеспечение для распознавания речи .
Для этого существует несколько программ, но я не знаю ни одной, которая могла бы выполнять пакетное преобразование. Я уверен, что это особенность хотя бы одного из них. Обратите внимание, что большинство из них далеко не дешево.
Я использую Dragon NaturalSpeaking для транскрипции. отличное программное обеспечение!
но это не бесплатно, Amazon предлагает актуальную версию 10 за 45 долларов, если вы посмотрите вокруг, вы получите DNS9 еще дешевле.