Учебный план программы Инструментальные средства бизнес-аналитики
№ п/п | Наименование курсов (дисциплин) |
Модуль 1. Базовые технологии хранения и обработки данных |
|
1 |
Основы моделирования и базы данных |
2 |
Введение в OLAP и хранилища данных |
3 |
Основы языка SQL |
4 |
Язык SQL Oracle для хранения, обработки и анализа данных. |
Модуль 2. Базовые средства бизнес-аналитики | |
5 |
Основы бизнес-аналитики и науки о данных |
6 |
Бизнес-аналитика с помощью Power BI |
7 | Введение в машинное обучение и анализ данных |
Модуль 3. Языковые и программные средства бизнес-аналитики | |
8 |
Анализ и визуализация данных на языке R |
9 |
Анализ данных на Python в примерах и задачах |
10 |
Хранилища данных и построение модели данных с помощью PowerDesigner |
Модуль 4. Бизнес-аналитика и моделирование | |
11 |
Имитационное моделирование на базе AnyLogic |
12 |
Глубинный анализ данных и текстов на базе IBM SPSS Modeler |
ВЫПУСКНАЯ АТТЕСТАЦИОННАЯ РАБОТА |
Аннотации дисциплин
Основы моделирования и базы данных
Цель дисциплины «Основы моделирования и базы данных» – овладение слушателями теоретическими основами технологий баз данных (БД), практическими навыками работы с БД и системами управления базами данных. При изучении дисциплины студенты знакомятся с существующими моделями данных, подходами к проектированию БД, языком манипулирования данными – SQL, функциональными возможностями современных систем управления базами данных. Рассмотрение этих вопросов иллюстрируется на примере системы управления базами данных Microsoft SQL Server.
Введение в OLAP и хранилища данных
Данный курс предлагает слушателям базовые знания и навыки в области реализации хранилищ данных для поддержки управленческих решений. Обучающийся знакомится с технологиями создания, ведения и использования предметно ориентированных хранилищ данных (Data Warehouse). Изучает технологии оперативного анализа данных (OLAP), необходимого для принятия решений в сложных ситуациях, требующих обработку данных большого объема. Основное внимание уделяется использованию программных средств создания хранилищ данных и проведения OLAP-анализа. Рассматриваются различные архитектурные паттерны 3NF, star, snowflake schemas; структура и методы работы с такими сущностями, как Dimensions & Facts; создание хранилищ данных на базе Microsoft SQL Server, реализации решений по управлению хранилищами данных – ETL-процедуры, а также проверки и очистки данных.
Основы языка SQL
Курс знакомит слушателей с основными принципами работы со структурированными данными в реляционной модели, учит составлять запросы на языке SQL, использовать представления, процедуры, функции и триггеры. Основу курса составляют изучение и применение языка SQL для создания, модификации объектов баз данных и управления данными в реляционной базе данных MS SQL Server, но при этом дисциплина нацелена на изучение общих принципов и базовых средств языка SQL, не зависящие от его реализации в той или иной СУБД. Раскрываются парадигматические и синтаксические особенности языка SQL. Рассматриваются структура, операции и ограничения целостности реляционной модели данных и их реализация на языке SQL.
Язык SQL Oracle для хранения, обработки и анализа данных
Содержание дисциплины представляет собой введение в SQL для будущих бизнес-аналитиков и специалистов по работе с данными.
В теоретической части последовательно излагаются основные понятия для представления структурированной информации в базах и хранилищах данных, кратко даны теоретические основы SQL как с точки зрения математической логики, так и с точки зрения теории множеств, необходимые сведения из математической статистики. В практической части основное внимание сконцентрировано на написании запросов для обработки и анализа структурированных данных.
Изложение практического материала в основной части построено на использовании диалекта SQL Oracle 11g.
Основы бизнес-аналитики и науки о данных
Бизнес-анализ является одной из дисциплин, без которой сложно обойтись в быстро меняющемся мире. Успешность и компаний, и самих сотрудников зависит от способности адекватно реагировать на изменения и оперативно изменяться, сохраняя при этом конкурентные преимущества. Скорость и объем информационных потоков определили необходимость развития нового направления аналитической работы – бизнес-анализа. Данный курс позволит познакомиться с ключевыми принципами и практиками бизнес-анализа, а также дает теоретическую базу о применении бизнес-анализа в IT-проектах.
Бизнес-аналитика с помощью Power BI
Курс знакомит с основами анализа данных при помощи инструмента Power BI. Power BI – комплексное решение для бизнес-анализа и визуализации данных от компании Microsoft. Программа позволяет представить все данные организации на единой информационной панели, анализировать разнородную информацию и превращать ее в выразительные интерактивные отчеты, которыми можно делиться с другими пользователями. Среди преимуществ приложения – поддержка импорта файлов разных форматов, возможность мобильного доступа, обновление данных в режиме реального времени и др.
Введение в машинное обучение и анализ данных
Машинное обучение (machine learning) – это область научного знания, имеющая дело с алгоритмами, «способными обучаться». Необходимость использования методов машинного обучения объясняется тем, что для многих сложных, интеллектуальных, задач (например, распознавание рукописного текста, речи и т. п.) очень сложно (или даже невозможно) разработать «явный» алгоритм их решения, однако часто можно научить компьютер обучиться решению этих задач. Данный курс знакомит слушателей с основами машинного обучения, жизненным циклом задач машинного обучения и с применяемыми методиками.
Анализ и визуализация данных на языке R
В рамках данного курса рассматриваются все основные этапы статистического анализа R, считывание данных, предобработка данных, применение основных статистических методов и визуализация результатов. Слушатели научатся основным элементам программирования на языке R, что позволит быстро и эффективно решать широчайший спектр задач, возникающих при обработке данных. Особое внимание в курсе будет уделено визуализации получаемых результатов.
Анализ данных на Python в примерах и задачах
В ходе курса слушатель узнает о возможностях, которые предоставляет язык Python для работы с данными. Python – один из самых популярных инструментов для анализа как структурированных, так и неструктурированных данных. В рамках курса слушатель познакомится с тем, как применять свои навыки программирования для построения предиктивных моделей, визуализации данных и работы с нейросетями. Также студенты узнают об основных библиотеках для анализа данных и разберутся в соответствующих методах и использовании их с помощью Python. Материалы и задания курса подобраны так, чтобы у слушателей сформировалось представление об анализе данных и рабочих задачах специалистов по машинному обучению.
Хранилища данных и построение модели данных с помощью PowerDesigner
Содержание дисциплины посвящено изучению базовых аспектов информационной технологии хранилищ данных. В результате его изучения студенты будут знать основные понятия и составные элементы технологии хранилищ данных, уметь проектировать и создавать хранилища данных.
В лекциях подробно рассматриваются понятие хранилища данных и его архитектуры, бизнес – модель создания хранилища данных, моделирование данных в хранилище данных на логическом и физическом уровне, создание хранилища данных, создание хранилища данных по корпоративной модели данных организации, понятие метаданных и моделирование логической модели метаданных. Менее подробно изучается процесс извлечения, преобразования и загрузки данных в хранилище данных.
Имитационное моделирование на базе AnyLogic
В настоящее время, системы имитационного моделирования успешно применяются для поиска наилучших сценариев развития компании с учетом динамики внешней среды. Имитационные модели интегрируются в информационную систему корпоративного управления, используют базы данных и хранилища данных (например, MS SQL Server, Oracle, SAP BW и др.) при проведении численных экспериментов, объединяются с оптимизационными модулями (генетическими алгоритмами) и веб-сервисами. Важнейшим направлением использования систем имитационного моделирования является оценка рисков и оптимизация (Risk Assessment & Optimisation). В результате освоения курса слушатели будут знать основные методы имитационного моделирования, включая методы системной динамики, агентного моделирования, дискретно-событийного моделирования, вероятностного моделирования и др., и смогут применять их на практике с использованием платформ класса AnyLogic.
Глубинный анализ данных и текстов на базе IBM SPSS Modeler
Целью освоения дисциплины «Глубинный анализ данных и текстов на базе IBM SPSS Modeler» является формирование у слушателей комплекса теоретических знаний и практических навыков аналитики текстовых данных и углубленного анализа многомерных данных. Подобные компетенции дают возможность анализировать тенденции, закономерности и взаимосвязи в структурированных и неструктурированных данных, прогнозировать на основе этого анализа будущие события и действовать для достижения желаемых результатов. Программная платформа IBM SPSS Modeler – это мощная платформа прогнозной аналитики, позволяющая извлекать из данных беспрецедентные объемы ценной информации, строить на ее основе прогнозы и принимать эффективные решения на всех уровнях управления.