Инструменты Data Mining - это наборы программных средств, с помощью которых выполняется подготовка данных и обеспечиваются алгоритмы их интеллектуального анализа, а также осуществляются процессы машинного обучения.
Об основных инструментах Data Mining и о направлениях их применения будет рассказано в представленной статье.
Основные инструменты Data Mining
Инструментарий интеллектуального анализа данных представлен следующими наиболее распространенными средствами:
-
Python - язык программирования, имеющий много полезных для Data Mining. К ним относятся Pandas, отвечающая за обработку данных, Numphy, работающая с матрицами, Sklearn и Pybrain, используемые в алгоритмах машинного обучения, Statsmodels, содержащая основные статистические функции и модели, Matplotlib, позволяющая визуализировать результаты обработки данных;
-
R - язык программирования и программная среда, специализированные для статистической обработки данных, машинного обучения и работы с графиками;
-
Weka - комплекс алгоритмов и инструментов для анализа данных и построения прогностических моделей. Он характеризуется удобством интерфейса, возможностью предварительной очистки данных, поддерживает различные алгоритмы машинного обучения, выводит результаты работы в удобной форме и позволяет сравнивать их точность, представляет ход обработки данных в виде схем взаимосвязей;
-
Rapidminer - инструмент для решения задач, связанных с преобразованиями данных, статистическим анализом, машинным обучением и визуализацией результатов.
Также в Data Mining применяются:
-
SAS Enterprise Miner - пакетный клиент-серверный продукт, предназначенный для оптимизации проведения всех этапов Data Mining, от организации доступа к данным и заканчивая оценкой готовых моделей;
-
PolyAnalyst - система, проводящая автоматического и полуавтоматического анализ числовых массивов информации и извлечения из них нетривиальных данных в виде многомерных нелинейных моделей;
-
Cognos - комплекс программных продуктов для интеллектуального бизнес-анализа (BI-инструменты), работающий с запросами и отчетами;
-
STATISTICA Data Miner - средство универсальной и всесторонней обработки данных, имеющее большой набор готовых решений, гибкий механизм управления и высокую эффективность разведочного анализа;
-
Oracle Data Mining - модуль, используемый для работы с реляционными базами данных и реализующий алгоритмы поиска ассоциаций, кластеризации, классификации, построения регрессионных моделей, поиска существенных атрибутов и выделения признаков.
-
Deductor - платформа, состоящая из хранилищ, в которых находится информация из различных источников данных, и рабочего приложения, выполняющая импорт, обработку, визуализацию и экспорт данных в форме OLAP кубов, отчетов, моделей и закономерностей.
Применение инструментов Data Mining
Инструменты Data Mining чаще всего используются
-
специалистами по анализу данных;
-
маркетологами;
-
специалистами по анализу рисков;
-
маркетинговыми аналитиками;
-
специалистами по предотвращению мошеннических действий.
Обучиться использованию инструментария Data Mining все желающие смогут, пройдя курс профессиональной переподготовки по программе «Инструментальные средства бизнес-аналитики», которую проводит ВШБИ НИУ ВШЭ. Записаться на обучение по данному курсу можно на нашем сайте.
← Назад к списку