CвернутьВсе разделы
Инструменты Data Mining

Инструменты Data Mining

Инструменты Data Mining - это наборы программных средств, с помощью которых выполняется подготовка данных и обеспечиваются алгоритмы их интеллектуального анализа, а также осуществляются процессы машинного обучения.

Об основных инструментах Data Mining и о направлениях их применения будет рассказано в представленной статье.

Основные инструменты Data Mining

Инструменты дата майнинг – фото 1

Инструментарий интеллектуального анализа данных представлен следующими наиболее распространенными средствами:

  • Python - язык программирования, имеющий много полезных для Data Mining. К ним относятся Pandas, отвечающая за обработку данных, Numphy, работающая с матрицами, Sklearn и Pybrain, используемые в алгоритмах машинного обучения, Statsmodels, содержащая основные статистические функции и модели, Matplotlib, позволяющая визуализировать результаты обработки данных;

  • R - язык программирования и программная среда, специализированные для статистической обработки данных, машинного обучения и работы с графиками;

  • Weka - комплекс алгоритмов и инструментов для анализа данных и построения прогностических моделей. Он характеризуется удобством интерфейса, возможностью предварительной очистки данных, поддерживает различные алгоритмы машинного обучения, выводит результаты работы в удобной форме и позволяет сравнивать их точность, представляет ход обработки данных в виде схем взаимосвязей;

  • Rapidminer - инструмент для решения задач, связанных с преобразованиями данных, статистическим анализом, машинным обучением и визуализацией результатов.

Инструменты дата майнинг – фото 2

Также в Data Mining применяются:

  • SAS Enterprise Miner - пакетный клиент-серверный продукт, предназначенный для оптимизации проведения всех этапов Data Mining, от организации доступа к данным и заканчивая оценкой готовых моделей;

  • PolyAnalyst - система, проводящая автоматического и полуавтоматического анализ числовых массивов информации и извлечения из них нетривиальных данных в виде многомерных нелинейных моделей;

  • Cognos - комплекс программных продуктов для интеллектуального бизнес-анализа (BI-инструменты), работающий с запросами и отчетами;

  • STATISTICA Data Miner - средство универсальной и всесторонней обработки данных, имеющее большой набор готовых решений, гибкий механизм управления и высокую эффективность разведочного анализа;

  • Oracle Data Mining - модуль, используемый для работы с реляционными базами данных и реализующий алгоритмы поиска ассоциаций, кластеризации, классификации, построения регрессионных моделей, поиска существенных атрибутов и выделения признаков.

  • Deductor - платформа, состоящая из хранилищ, в которых находится информация из различных источников данных, и рабочего приложения, выполняющая импорт, обработку, визуализацию и экспорт данных в форме OLAP кубов, отчетов, моделей и закономерностей.

Применение инструментов Data Mining

Инструменты Data Mining чаще всего используются

  • специалистами по анализу данных;

  • маркетологами;

  • специалистами по анализу рисков;

  • маркетинговыми аналитиками;

  • специалистами по предотвращению мошеннических действий.

Обучиться использованию инструментария Data Mining все желающие смогут, пройдя курс профессиональной переподготовки по программе «Инструментальные средства бизнес-аналитики», которую проводит ВШБИ НИУ ВШЭ. Записаться на обучение по данному курсу можно на нашем сайте.


← Назад к списку

Контактный телефон: +7 (495) 621-56-18 +7 (985) 769-77-52

ЦРКБИ в социальных сетях
facebook vk youyube
Высшие курсы CIO
Рекомендовано MBA.SU