Сортировка строк, чтобы сформировать уникальный словарь словарей
Много раз мы строим словари на онлайн-форумах для типичных слов, используемых на форуме, пользователь отвечает в следующем формате на форуме phpbb
термин: определение
следовательно, задача состоит в том, чтобы собрать все эти уникальные записи, устраняя шум, мы обычно копируем всю страницу и сортируем ее, чтобы удалить шум:
Дата регистрации: пт. Янв 24, 2014 9:49 pm Дата регистрации: пт, июнь 05, 2009, 17:57 Дата регистрации: пн, июл 07, 2014 7:20 Дата регистрации: пн, июл 07, 2014 7:20 Дата регистрации: пн 25, 2013 6:46 Посты: 49 Посты: 49 Посты: 49 Посты: 49 Посты: 5 Сообщений: 8152 Прогезиум: легкое пептидное неколие
Итак, как командная строка или скрипт на Python сортируют вышеуказанное содержимое, удаляя шум и получая записи только в алфавитном порядке, например:
Прогезиум: легкое пептидное неколие