Способы удаления или изоляции целых строк в огромном сборе данных
Я работаю с огромным файлом данных (около 400 000 строк и 8 столбцов) в Libre Office. Мне нужно избавиться от определенных строк, поэтому я выбрал все ячейки с нужным значением (с Find & Replace
) и попробовал Edit > Delete Cells > Delete entire row(s)
, Экран блекнет, но через 15 минут он никуда меня не приводит (экран становится серым, программа не отвечает). Выбор "только" нескольких тысяч строк привел к тому же.
Есть ли альтернативный способ избавиться от тысяч строк одновременно? Решения в Libre Office, Gnumeric или R или любом другом открытом программном обеспечении приветствуются.
Данные организованы следующим образом (небольшая выборка):
Регион, TimePeriod и т. Д., ValueTons
Кипр, JanDec 2000, somecodes, 0
Кипр, JanDec 2001, somecodes, 74.2
Кипр, январь 2002 г., некоторые коды 68,7
Кипр, январь 2003 г., некоторые коды 59,1
Кипр, январь-декабрь 2004, некоторые коды 50,3
Кипр, январь 2005 г., некоторые коды 71,1
Кипр, январь 2006 г., некоторые коды - 45,7
Кипр, январь 2007 г., некоторые коды - 45,7
Кипр, январь 2008, некоторые коды 50,4
Кипр, январь 2009 г., Somecodes, 80
Кипр, январь 2010 г., Somecodes, 47,2
Кипр, январь 2011, некоторые коды 44,1
Испания, JanDec 2000, somecodes, 5
...
Период времени колеблется от 2000 до 2011 года. Мне нужно избавиться от всех строк, содержащих 2000–2005 и 2011 годы.
1 ответ
Попробуй это:
1. Сохраните его как CSV.
Переименуйте его в TXT (если в Windows снимите флажок, чтобы скрыть известные расширения, в инструментах> параметры отображения расширений), только в LibreOffice не пытается открыть его с помощью Calc.
Откройте его с помощью записи. Чтобы сделать это более понятным для глаз, выберите Dysplay > Web Layout.
Выберите строки, которые вы хотите стереть и сделайте это. Начиная с первой строки, поместите курсор перед первым символом, затем удерживайте клавишу Shift и используйте клавиши со стрелками вниз / вверх / вниз для выбора строк для удаления.
После окончания удаления неважных строк сохраните файл (как TXT) и переименуйте его обратно в CSV.
Примечание. Вы удалите все формулы, если они существуют.