CвернутьВсе разделы

Учебный план программы Инструментальные средства бизнес-аналитики

№ п/п Наименование курсов (дисциплин)
        Модуль 1. Базовые технологии хранения и обработки данных
      1 Основы моделирования и базы данных
      2 Введение в OLAP и хранилища данных
      3 Основы языка SQL
      4 Язык SQL Oracle для хранения, обработки и анализа данных.
  Модуль 2. Базовые средства бизнес-аналитики
      5 Основы бизнес-аналитики и науки о данных
      6 Бизнес-аналитика с помощью Power BI
      7 Введение в машинное обучение и анализ данных
  Модуль 3. Языковые и программные средства бизнес-аналитики
       8 Анализ и визуализация данных на языке R
       9 Анализ данных на Python в примерах и задачах
       10 Хранилища данных и построение модели данных с помощью PowerDesigner
  Модуль 4. Бизнес-аналитика и моделирование
       11 Имитационное моделирование на базе AnyLogic
       12 Глубинный анализ данных и текстов на базе IBM SPSS Modeler
   ВЫПУСКНАЯ  АТТЕСТАЦИОННАЯ  РАБОТА


Аннотации дисциплин

Основы моделирования и базы данных

Цель дисциплины «Основы моделирования и базы данных» – овладение слушателями теоретическими основами технологий баз данных (БД), практическими навыками работы с БД и системами управления базами данных. При изучении дисциплины студенты знакомятся с существующими моделями данных, подходами к проектированию БД, языком манипулирования данными – SQL, функциональными возможностями современных систем управления базами данных. Рассмотрение этих вопросов иллюстрируется на примере системы управления базами данных Microsoft SQL Server.

 

Введение в OLAP и хранилища данных

Данный курс предлагает слушателям базовые знания и навыки в области реализации хранилищ данных для поддержки управленческих решений. Обучающийся знакомится с технологиями создания, ведения и использования предметно ориентированных хранилищ данных (Data Warehouse). Изучает технологии оперативного анализа данных (OLAP), необходимого для принятия решений в сложных ситуациях, требующих обработку данных большого объема. Основное внимание уделяется использованию программных средств создания хранилищ данных и проведения OLAP-анализа. Рассматриваются различные архитектурные паттерны 3NF, star, snowflake schemas; структура и методы работы с такими сущностями, как Dimensions & Facts; создание хранилищ данных на базе Microsoft SQL Server, реализации решений по управлению хранилищами данных – ETL-процедуры, а также проверки и очистки данных.

 

Основы языка SQL

Курс знакомит слушателей с основными принципами работы со структурированными данными в реляционной модели, учит составлять запросы на языке SQL, использовать представления, процедуры, функции и триггеры. Основу курса составляют изучение и применение языка SQL для создания, модификации объектов баз данных и управления данными в реляционной базе данных MS SQL Server, но при этом дисциплина нацелена на изучение общих принципов и базовых средств языка SQL, не зависящие от его реализации в той или иной СУБД. Раскрываются парадигматические и синтаксические особенности языка SQL. Рассматриваются структура, операции и ограничения целостности реляционной модели данных и их реализация на языке SQL.

 

Язык SQL Oracle для хранения, обработки и анализа данных

Содержание дисциплины представляет собой введение в SQL для будущих бизнес-аналитиков и специалистов по работе с данными.

В теоретической части последовательно излагаются основные понятия для представления структурированной информации в базах и хранилищах данных, кратко даны теоретические основы SQL как с точки зрения математической логики, так и с точки зрения теории множеств, необходимые сведения из математической статистики. В практической части основное внимание сконцентрировано на написании запросов для обработки и анализа структурированных данных.

Изложение практического материала в основной части построено на использовании диалекта SQL Oracle 11g.

 

Основы бизнес-аналитики и науки о данных

Бизнес-анализ является одной из дисциплин, без которой сложно обойтись в быстро меняющемся мире. Успешность и компаний, и самих сотрудников зависит от способности адекватно реагировать на изменения и оперативно изменяться, сохраняя при этом конкурентные преимущества. Скорость и объем информационных потоков определили необходимость развития нового направления аналитической работы – бизнес-анализа. Данный курс позволит познакомиться с ключевыми принципами и практиками бизнес-анализа, а также дает теоретическую базу о применении бизнес-анализа в IT-проектах.

 

Бизнес-аналитика с помощью Power BI

Курс знакомит с основами анализа данных при помощи инструмента Power BI.  Power BI – комплексное решение для бизнес-анализа и визуализации данных от компании Microsoft. Программа позволяет представить все данные организации на единой информационной панели, анализировать разнородную информацию и превращать ее в выразительные интерактивные отчеты, которыми можно делиться с другими пользователями. Среди преимуществ приложения – поддержка импорта файлов разных форматов, возможность мобильного доступа, обновление данных в режиме реального времени и др.

 

Введение в машинное обучение и анализ данных

Машинное обучение (machine learning) – это область научного знания, имеющая дело с алгоритмами, «способными обучаться». Необходимость использования методов машинного обучения объясняется тем, что для многих сложных, интеллектуальных, задач (например, распознавание рукописного текста, речи и т. п.) очень сложно (или даже невозможно) разработать «явный» алгоритм их решения, однако часто можно научить компьютер обучиться решению этих задач. Данный курс знакомит слушателей с основами машинного обучения, жизненным циклом задач машинного обучения и с применяемыми методиками.

 

Анализ и визуализация данных на языке R

В рамках данного курса рассматриваются все основные этапы статистического анализа R, считывание данных, предобработка данных, применение основных статистических методов и визуализация результатов. Слушатели научатся основным элементам программирования на языке R, что позволит быстро и эффективно решать широчайший спектр задач, возникающих при обработке данных. Особое внимание в курсе будет уделено визуализации получаемых результатов.

 

Анализ данных на Python в примерах и задачах

В ходе курса слушатель узнает о возможностях, которые предоставляет язык Python для работы с данными. Python – один из самых популярных инструментов для анализа как структурированных, так и неструктурированных данных. В рамках курса слушатель познакомится с тем, как применять свои навыки программирования для построения предиктивных моделей, визуализации данных и работы с нейросетями. Также студенты узнают об основных библиотеках для анализа данных и разберутся в соответствующих методах и использовании их с помощью Python. Материалы и задания курса подобраны так, чтобы у слушателей сформировалось представление об анализе данных и рабочих задачах специалистов по машинному обучению.

 

Хранилища данных и построение модели данных с помощью PowerDesigner

Содержание дисциплины посвящено изучению базовых аспектов информационной технологии хранилищ данных. В результате его изучения студенты будут знать основные понятия и составные элементы технологии хранилищ данных, уметь проектировать и создавать хранилища данных.

В лекциях подробно рассматриваются понятие хранилища данных и его архитектуры, бизнес – модель создания хранилища данных, моделирование данных в хранилище данных на логическом и физическом уровне, создание хранилища данных, создание хранилища данных по корпоративной модели данных организации, понятие метаданных и моделирование логической модели метаданных. Менее подробно изучается процесс извлечения, преобразования и загрузки данных в хранилище данных.

 

Имитационное моделирование на базе AnyLogic

В настоящее время, системы имитационного моделирования успешно применяются для поиска наилучших сценариев развития компании с учетом динамики внешней среды. Имитационные модели интегрируются в информационную систему корпоративного управления, используют базы данных и хранилища данных (например, MS SQL Server, Oracle, SAP BW и др.) при проведении численных экспериментов, объединяются с оптимизационными модулями (генетическими алгоритмами) и веб-сервисами. Важнейшим направлением использования систем имитационного моделирования является оценка рисков и оптимизация (Risk Assessment & Optimisation). В результате освоения курса слушатели будут знать основные методы имитационного моделирования, включая методы системной динамики, агентного моделирования, дискретно-событийного моделирования, вероятностного моделирования и др., и смогут применять их на практике с использованием платформ класса AnyLogic.

 

Глубинный анализ данных и текстов на базе IBM SPSS Modeler

Целью освоения дисциплины «Глубинный анализ данных и текстов на базе IBM SPSS Modeler» является формирование у слушателей комплекса теоретических знаний и практических навыков аналитики текстовых данных и углубленного анализа многомерных данных. Подобные компетенции дают возможность анализировать тенденции, закономерности и взаимосвязи в структурированных и неструктурированных данных, прогнозировать на основе этого анализа будущие события и действовать для достижения желаемых результатов. Программная платформа IBM SPSS Modeler – это мощная платформа прогнозной аналитики, позволяющая извлекать из данных беспрецедентные объемы ценной информации, строить на ее основе прогнозы и принимать эффективные решения на всех уровнях управления.