Получение понятных стенограмм от AWS

Я пытаюсь создать стенограмму разговора по Skype/ телефону, который у меня был, путем преобразования видео в аудиофайл, загрузки файла в Amazon Web Services, получения там сделанной через службы транскрипции и загрузки транскрипта.

Когда я следую этому процессу, я получаю файл JSON. Когда я открываю файл в Excel, файл содержит текст стенограммы (с некоторыми неправильно распознанными словами, что и следовало ожидать) и набор цифр, букв и меток времени в скобках. Текст и другая информация отделены друг от друга, поэтому, если я копирую и вставляю содержимое файла в Word или Блокнот, я получаю текстовую расшифровку в начале файла (в этом примере ~3 страницы текста) и вся информация в скобках в нижней части файла (в этом примере ~90 страниц текста).

Как я могу получить информацию из загруженного файла JSON в документ, чтобы информация в скобках (цифры, буквы и метки времени) как-то соответствовала тексту? Я бы хотел, чтобы каждая временная метка была рядом с фрагментом текста, на который она ссылается.

Благодарю.

0 ответов

Другие вопросы по тегам