Python. Data Science. Обработка, анализ и визуализация больших данных на языке Python. Библиотеки pandas, numpy, matplotlib и seaborn
0 0
Забронировать курс
Спасибо за интерес к нашему курсу! Обратитесь через форму «Запросить информацию» для получения более точной информации о датах обучения.
-
Описание образовательной программы
Всего за несколько лет средства анализа данных, доступные разработчикам на Python, совершили рывок вперёд. Появились мощные пакеты, реализующие алгоритмы машинного обучения, обработку естественных языков, статистический анализ и визуализацию.
Инструменты языка Python просты в использовании, при этом имеют широкие возможности применения. Программирование на Python – простой и эффективный вариант для вхождения в популярную сферу Data Science.
Уникальная особенность языка – возможность быстрого встраивания анализа данных в веб-приложения.
Курс «Data Science. Обработка, анализ и визуализация больших данных на языке Python Библиотеки pandas, numpy, matplotlib и seaborn» предназначен для тех, кто ищет гибкий инструмент обработки, анализа и визуализации данных и планирует применять свои навыки в работе большими массивами информации.
Слушатели изучат важнейшие и широко распространенные библиотеки numpy, Matplotlib и Pandas, которые массово применяются в различных областях производственной, финансовой и научной деятельности.
Обучение на курсе построено на примерах реальных проектов в области обработки данных.
Курс читается на базе операционной системы Linux, однако его материал может быть применен и на Windows.
Успешное окончание обучения по программе данного курса позволит специалистам:
- Создавать и обрабатывать числовые массивы
- Создавать диаграммы и графики различных видов и форматов
- Объединять и переформировывать данные
Целевая аудитория
Программисты
Аналитики
Научные работники
Расписание
Установка и настройка программного обеспечения. Базовый инструментарий работы в Jupyter notebook
- Принципы организации и управления вычислениями
- Используемые языки программирования и взаимосвязь между ними
- Обзор библиотек и инструментов
- Необходимые пакеты Python: numpy, pandas, matplotlib, seaborn, Jupyter и другие
- Дистрибутив Anaconda, его преимущества и недостатки
- Установка пакетов в Linux
- Установка пакетов в Windows. Возможные проблемы и методы их решения
- Методы и функции
- Основные команды и методы работы в Jupyter notebook
Библиотека numpy. Вычислительные задачи
- Структура библиотеки
- Типы данных библиотеки numpy
- Векторы и массивы, специальные типы данных
- Понятие массива и его основные характеристики
- Принципы вычислений
- Универсальные функции
- Важнейшие стандартные функции
- Работа с массивами и матрицами
Библиотека pandas и анализ данных
- Объект Series
- Объект DataFrame
- Загрузка данных
- Выгрузка данных
- Чтение и запись данных в формате Excel
- Чтение и запись JSON-файлов
- Загрузка данных из интернета и из базы данных SQL
- Загрузка CSV-файлов из Интернета
- Основы работы с датафреймами
- Организация колонок и строчек
- Создание срезов объекта Series
- Выравнивание данных по меткам индекса
- Выполнение логического отбора
- Переиндексация объекта Series
Первичная обработка данных
- Сбор данных
- Очистка данных
- Подготовка данных
- Объединение данных
- Сцепление и наложение
- Слияние данных
- Замена значений
- Работа с пропущенными значениями и их заполнение
- Повторы в данных
- Объединение и переформирование данных
Статистика и анализ
- Фильтрация
- Группировка
- Агрегация
- Описательные статистики
- Получение итоговых описательных статистик
- Измерение центральной тенденции: среднее, медиана и мода
- Вычисление дисперсии и стандартного отклонения
- Вычисление ковариации и корреляции
- Распределения
- Разведывательный анализ
- Постановка гипотезы
Библиотека matplotlib. Визуализация данных
- Основные элементы диаграммы
- Создание диаграммы
- Виды графиков и диаграмм
- Оформление и кастомизация графиков
- Форматы изображений
Библиотека seaborn. Наглядная визуализация сложных данных
- Виды графиков, их корректное использование и интерпретация
- Принципы хорошей визуализации, основные ошибки при визуализации данных
- График функции
- Гистограмма
- Визуализации отфильтрованных и сгруппированных данных
-
Получаемый документ
-
Необходимая подготовка
Знание основ программирования на языке Python.
Рекомендуем предварительное обучение на курсах: -
Цель курса
Формирование и совершенствование знаний и навыков, необходимых для обработки, анализа и визуализации больших данных на языке Python
0 отзывов
Об этом курсе отзывов пока нет. Будьте первым.
Чтобы оставить отзыв необходимо авторизоваться на сайте или зарегистрироваться.