Как я могу найти самую длинную запись в словаре?
Я спросил на бирже английского стека: "Какое английское слово с самым длинным определением?" Лучший ответ, который они могли бы дать, - это то, что мне нужна программа, которая могла бы определить самую длинную запись в (текстовом) файле со списком определений словаря, подсчитав количество символов или слов в данной записи, а затем предоставить список самые длинные записи.
Мне удалось найти файл словаря, который преобразован в текст, имеет следующий формат:
a / a / неопределенный артикль (перед гласным) 1 любой, какой-то один (есть cookie). 2 одна вещь (нет магазина для миль). 3 на каждого (принимайте это два раза в день).
aardvark / ard-vark / n африканское млекопитающее с длинной мордой, которая питается муравьями.
abacus / a-ba-kus, a-ba-kus / na Счетная рамка с бисером.
Как видите, каждое определение следует за произношением (заключенным в косую черту), а затем либо:
1) заканчивается точкой или
2) заканчивается перед примером (заключенным в круглые скобки), или
3) следует за числом и заканчивается точкой или перед примером, когда слово имеет несколько определений.
В таком случае мне потребуется функция или программа, которые могут различать каждое определение (включая рассмотрение нескольких определений одного слова как отдельных), а затем подсчитывать количество символов и / или слов внутри (игнорируя примеры в скобках, поскольку не является правильным определением), и, наконец, приведу список самых длинных определений (я не думаю, что мне нужно больше, чем, скажем, топ-20 или около того для сравнения). Если формат файла был проблемой, я могу преобразовать файл в PDF, EPUB и т. Д. Без проблем. И, я думаю, в идеале я бы хотел иметь возможность выбирать между подсчетом длины по символам и по словам, если это было возможно.
Как я должен пойти, чтобы сделать это? Заранее спасибо.