Анализ данных с помощью Python и SQL
Таллинн
27.09.2023 - 10.12.2023 (14:00 - 17:00)09.10.2023 - 21.12.2023
Онлайн-курс:
27.09.2023 - 10.12.2023 (14:00 - 17:00)09.10.2023 - 21.12.2023
Учим решать реальные задачи с помощью анализа данных
Анализ данных — это не только обработка информации после ее получения и сбора, а средство проверки гипотез и принятия решений. Цель любого анализа данных — понимание исследуемой ситуации целиком (выявление тенденций, негативных отклонений от плана, получений рекомендаций и прогнозов). Это достигается через главные задачи анализа данных:
12 недель аудиторной работы
По объему информации, количеству осваиваемых технологий и инструментов данный курс прочно удерживает первое место среди других.
Внимание: для данного курса в некоторых случаях мы можем провести предварительное тестирование (пройти тест можно бесплатно).
Помимо стандартных библиотек Python Вы также получите представление о дополнительных библиотеках (Numpy, Pandas), используемых в аналитике данных и Data Science.
Cвыше 20 инструментов и 50 компетенций
Курс дает большой объем знаний сразу в нескольких областях:
Актуальные кейсы для первого портфолио
Несмотря на то, что курс содержит достаточно большой объем теории, в рамках курса будет как минимум 5 типов задач с реальными наборами данных, которые наиболее часто встречаются в работе аналитика данных:По окончанию курса Вы cможете:
Все включено в стоимость курса
Курсы проходят в центре Таллинна, по адресу Тарту мнт, 18. Размер группы до 8 человек.
В цену курса включены все учебные материалы.
При необходимости на время обучения выдается ноутбук.
Внимание: с июня 2020 года данный курс можно пройти в рамках нашего сотрудничества с Eesti Töötukassa.
Задать вопрос: training@gamma-intelligence.com
Если у вас есть дополнительные вопросы, то отправьте нам письмо: training@gamma-intelligence.com.
Позвоните нам: (372)55581521
Позвоните нам по телефону 55581521. Мы ответим на все интересующие Вас вопросы.
Описание курса:
Целевая группа: Специалисты, чья работа связана со сбором, обработкой и анализом данных.Преподаватель: Максим Колодиев (магистерская степень - компьютерная и системная техника)
Длительность обучение: 12 недель
Язык обучения: русский, английский
Учебная группа: до 8 человек
Объем: 94 академических часа (12 недель)
Стоимость: 2000 EUR + НСО
Требования к обучающимся:
По окончанию курса Вы научитесь:
Дополнительная информация:
Основные правила организации обучения (на эстонском языке)Основные правила обеспечения качества учебного процесса (на эстонском языке)
Модуль | Содержание модуля | Длительность |
Введение в анализ данных | Современные проблемы, решаемые анализом данных. Основные понятия в анализе данных. Числовые и категориальные данные. Краткий обзор инструментов для анализа данных. | 4 ак. ч. |
Знакомство со средой Python и Jupyter | Установка интерпретатора Python. Знакомство с IDE. Знакомство с менеджером пакетов PIP. Установка среды iPython и Jupyter. Основы использования Jupyter Lab: типы ячеек, навигация, шорткаты, установка расширений. Знакомство с Google Colab. | 4 ак. ч. |
Коллекции в Python | Знакомство и основные операции с типами данных: список, кортеж, множество и словарь. | 8 ак. ч. |
Управляющие конструкции в Python | Построение логических условий. Цикл for. Практическая работа. | 4 ак. ч. |
Знакомство с VCS/GIT | Регистрация на GitHub. Создание своего репозитария. Принцип работы Git | 12 ак. ч. |
Практическая часть | 2 ак. ч. | |
Знакомство с модулем NumPy | Понятие одномерных и многомерных массивов, операции с массивами, изменение типов данных в массивах, определение занимаемой памяти и скорости выполнения операции, общий обзор возможностей модуля NumPy | 4 ак. ч. |
Вероятность и комбинаторика | Теоретическая и экспериментальная вероятность. Распределение вероятностей. Теорема Байеса. Комбинации и перестановки. Модуль NumPy.random для проведения экспериментов. Практическая работа. | 4 ак. ч. |
Знакомство с модулем Pandas | Понятия dataframe и serie. Индексация. Манипуляция с датасетами. Группировка. Получение статистических данных. Объединение датасетов. Создание новых столбцов. | 4 ак. ч. |
Основные понятия статистики | Распределение Гаусса. Построение и проверка гипотез. Корреляция. Определение выбросов. Основные типы графиков. | 6 ак. ч. |
Визуализация данных | Обзор модулей Matplotlib, Seaborn, Plotly и Bokeh. Построение графиков: Bar Chart, Histogram, Boxplot, Scatter Plot и др. Практическая работа. | 8 ак. ч. |
Практическая часть | 2 ак. ч. | |
Язык запросов SQL и СУБД MySQL | Установка и настройка сервера MySQL. Создание баз данных и таблиц. Типы данных. Понятие реляционных баз данных. Написание основных запросов на языке SQL. | 8 ак. ч. |
Практическая часть | Практическая часть по использованию SQL | 2 ак. ч. |
Работа в Pandas c разными источниками данных | Выгрузка данных из форматов csv, json, xlsx, xml, pdf и др. Выгрузка датасета из базы данных MySQL. Написание скрипта для создания запросов на API. Сохранение датасета в разные форматы. Практическая работа. | 8 ак. ч. |
Очистка данных | Поиск отсутсвующих данных по тепловой карте, замена отсутствующих значений. Работа с выбросами. Поиск и удаление дубликатов. Определение релевантности признаков. Приведение данных к одному формату. Практическая работа. | 8 ак. ч. |
Формирование отчетов | Аналитик - как связующее звено IT и бизнеса. Полный цикл формирования отчетов с конкретными рекомендациями для бизнеса. Практическа работа. . | 6 ак. ч. |