Анализ больших данных (Big Data) с помощью Microsoft R

Analyzing Big Data with Microsoft R



Анализ больших данных (Big Data) с помощью Microsoft R
Код: 20773
Направление обучения: Базы данных
Продолжительность: 3 дня/24 часа

Скачать прайс-лист (PDF)

Описание образовательной программы

Курс знакомит с созданием и запуском сценариев анализа больших данных на сервере Microsoft R.
В курсе рассматривается работа с Microsoft R в средах обработки больших данных как Hadoop, кластер Spark или база SQL Server.

Успешное окончание обучения по программе курса позволит специалистам:
  • описывать работу Microsoft R;
  • использовать клиента R и Server R для обработки больших данных из разных хранилищ;
  • визуализировать данные с помощью графиков и схем;
  • преобразовывать и очищать наборы больших данных;
  • использовать способы разделения аналитических задач на параллельные задачи;
  • строить и оценивать регрессионные модели, генерируемые на основе больших данных;
  • создавать, оценивать и разворачивать партиционированные модели на основе больших данных;
  • использовать язык R в средах SQL Server и Hadoop.

Цель курса

Формирование знаний и навыков, необходимых для анализа больших данных с помощью Microsoft R.

Целевая аудитория

  • ИТ-специалисты,
  • разработчики

Необходимая подготовка

  • Успешное окончание курса «Программирование на языке R. 
  • Уровень 1. Базовые знания» или эквивалентная подготовка. 

Содержание

1. Сервер и клиент Microsoft R
  • Обзор сервера Microsoft R
  • Использование клиента Microsoft R
  • Функции ScaleR
2. Обзор больших данных
  • Источники данных ScaleR
  • Чтение данных в XDF-объекте
  • Обобщение данных в XDF-объекте
3. Визуализация больших данных
  • Визуализация данных в памяти
  • Визуализации больших данных
4. Обработка больших данных
  • Преобразование больших данных
  • Управление наборами данных
5. Распараллеливание операций анализа
  • Использование вычислительного контекста RxLocalParallel с функцией rxExec
  • Использование пакета revoPemaR
6. Создание и оценка регрессионной модели
  • Кластеризации больших данных
  • Создание регрессионных моделей и подготовка прогнозов
7. Создание и оценка партиционированных моделей (Partitioning Model)
  • Создание партиционированных моделей на основе дерева решений.
  • Тестирование прогнозов партиционированных моделей
8. Обработка больших данных в SQL Server и Hadoop
  • Использование R в SQL Server
  • Использование Map/Reduce в Hadoop
  • Использование Hadoop Spark

Получаемый документ

Certifiate_Microsoft.jpg


Оставить отзыв
Об этом курсе отзывов пока нет. Будьте первым.

Расписание


  • 25 Марта 2019
  • 29 Июля 2019
  • Санкт-Петербург