R - это язык программирования с открытым исходным кодом и программная среда для статистических исследований и работы с графикой в рамках Data Mining.
Об особенностях языка программирования R и об областях его применения будет рассказано в этой статье.
Язык и программная среда R - основные понятия и особенности
К основным особенностям языка программирования R относятся:
-
эффективность обработки данных и простота средств для сохранения результатов;
-
широкий набор операторов для обработки массивов, матриц и других сложных конструкций;
-
большое количество интегрированных, последовательно применяемых инструментальных средств для статистической обработки данных;
-
разнообразие графических средств;
-
многофункциональность.
Язык программирования R доступен для Windows, Linux и Mac OS X и может применяться для импорта данных из целого ряда программ, включая Microsoft Excel, MySQL и Oracle.
Программная среда R представлена различными вариантами, наиболее популярными из которых считаются:
-
Rgiu - встроенный графический интерфейс, командные строки в котором работают по принципу «вопрос-ответ» и отображаются в специальных окнах-консолях. Запись сложного алгоритма команд в данной оболочке выполняется в скриптовом окне, а визуализация данных - в графическом модуле;
-
Rstudio - интегрированная оболочка, разделенная на рабочие области и имеющая дополнительные модули (например, для сохранения истории команд). В отличие от Rgiu, этот интерфейс более удобен благодаря возможностям навигации по скрипту, автоматическому завершению кода и выделению элементов кода цветом;
-
R в терминалах Linux/UNIX. Этот вариант чаще всего используется для обработки больших массивов информации через серверы, функционирующие через операционные системы класса Linux/UNIX. В данных терминалах программная среда R работает как приложение в виде командной строки.
Области применения языка программирования R
Наличие готовых статистических функций в языке программирования R позволяет широко применять его в следующих методиках Data Mining, которые используются в финтехе, e-commerce и IT:
-
в кластеризации данных, например, при формировании групп клиентов по уровню платежеспособности;
-
в регрессии - при составлении числовых прогнозов на базе выборки объектов по определенным признакам (при оценке дохода интернет- магазина или посещаемости сайта в предстоящие периоды);
-
при анализе отклонений - для выявления мошеннических действий с пластиковыми картами.
Обучиться программированию на языке R и работе с этой средой все желающие смогут, пройдя курс профессиональной переподготовки по программе «Инструментальные средства бизнес-аналитики», которую проводит ВШБИ НИУ ВШЭ. Записаться на обучение по данному курсу можно на нашем сайте.
← Назад к списку