Получение списка слов из словаря GNU aspell

Question

Получение списка слов из словаря GNU aspell

Я скачал пакет aspell для поддержки словаря бенгальского языка. Из архива я смог выделить файл bn.wl, который представляет собой список из 100000 слов, по одному в каждой строке.

Проблема заключается в том, что кодировка, по-видимому, равна 13194-bn, и любой текстовый редактор, с которым я открываю файл, показывает мусор (одно слово-мусор на строку). Это, вероятно, ожидает utf8 или что-то.

Как я могу преобразовать этот файл в читаемую форму? Я пытался использовать iconv, но он не может распознать кодировку.

2

language utf-8 aspell

Источник

Velvet Ghost 13 апр '12 в 06:08

1 ответ

Решение

Другие вопросы по тегам language utf-8 aspell

Paul 13 апр '12 в 11:54 2012-04-13 11:54 · Accepted Answer · 2012-04-13 11:54

Используйте aspell для предоставления списка слов в удобочитаемом формате:

aspell -l bn dump master

Ключ -l предназначен для определенного словаря, если он отсутствует, то выбирается словарь по умолчанию.

2

Источник

Paul 13 апр '12 в 11:54