Способы удаления или изоляции целых строк в огромном сборе данных

Я работаю с огромным файлом данных (около 400 000 строк и 8 столбцов) в Libre Office. Мне нужно избавиться от определенных строк, поэтому я выбрал все ячейки с нужным значением (с Find & Replace) и попробовал Edit > Delete Cells > Delete entire row(s), Экран блекнет, но через 15 минут он никуда меня не приводит (экран становится серым, программа не отвечает). Выбор "только" нескольких тысяч строк привел к тому же.

Есть ли альтернативный способ избавиться от тысяч строк одновременно? Решения в Libre Office, Gnumeric или R или любом другом открытом программном обеспечении приветствуются.


Данные организованы следующим образом (небольшая выборка):

Регион, TimePeriod и т. Д., ValueTons

Кипр, JanDec 2000, somecodes, 0
Кипр, JanDec 2001, somecodes, 74.2
Кипр, январь 2002 г., некоторые коды 68,7
Кипр, январь 2003 г., некоторые коды 59,1
Кипр, январь-декабрь 2004, некоторые коды 50,3
Кипр, январь 2005 г., некоторые коды 71,1
Кипр, январь 2006 г., некоторые коды - 45,7
Кипр, январь 2007 г., некоторые коды - 45,7
Кипр, январь 2008, некоторые коды 50,4
Кипр, январь 2009 г., Somecodes, 80
Кипр, январь 2010 г., Somecodes, 47,2
Кипр, январь 2011, некоторые коды 44,1
Испания, JanDec 2000, somecodes, 5
...

Период времени колеблется от 2000 до 2011 года. Мне нужно избавиться от всех строк, содержащих 2000–2005 и 2011 годы.

1 ответ

Попробуй это:

1. Сохраните его как CSV.

  1. Переименуйте его в TXT (если в Windows снимите флажок, чтобы скрыть известные расширения, в инструментах> параметры отображения расширений), только в LibreOffice не пытается открыть его с помощью Calc.

  2. Откройте его с помощью записи. Чтобы сделать это более понятным для глаз, выберите Dysplay > Web Layout.

  3. Выберите строки, которые вы хотите стереть и сделайте это. Начиная с первой строки, поместите курсор перед первым символом, затем удерживайте клавишу Shift и используйте клавиши со стрелками вниз / вверх / вниз для выбора строк для удаления.

  4. После окончания удаления неважных строк сохраните файл (как TXT) и переименуйте его обратно в CSV.

Примечание. Вы удалите все формулы, если они существуют.

Другие вопросы по тегам