Анализ данных с помощью Python и SQL
Таллинн
27.12.2024 - 06.03.202520.01.2025 - 22.03.2025
Онлайн-курс:
27.12.2024 - 06.03.202520.01.2025 - 22.03.2025
Учим решать реальные задачи с помощью анализа данных
Анализ данных — это не только обработка информации после ее получения и сбора, а средство проверки гипотез и принятия решений. Цель любого анализа данных — понимание исследуемой ситуации целиком (выявление тенденций, негативных отклонений от плана, получений рекомендаций и прогнозов). Это достигается через главные задачи анализа данных:
10 недель аудиторной работы
По объему информации, количеству осваиваемых технологий и инструментов данный курс прочно удерживает первое место среди других.
Помимо стандартных библиотек Python Вы также получите представление о дополнительных библиотеках (Numpy, Pandas), используемых в аналитике данных и Data Science.
Cвыше 20 инструментов и 50 компетенций
Курс дает большой объем знаний сразу в нескольких областях:
Актуальные кейсы для первого портфолио
Несмотря на то, что курс содержит достаточно большой объем теории, в рамках курса будет как минимум 5 типов задач с реальными наборами данных, которые наиболее часто встречаются в работе аналитика данных:По окончанию курса Вы cможете:
Все включено в стоимость курса
Курсы проходят в центре Таллинна, по адресу Тарту мнт, 18. Размер группы до 8 человек.
В цену курса включены все учебные материалы.
При необходимости на время обучения выдается ноутбук.
Внимание: с июня 2020 года данный курс можно пройти в рамках нашего сотрудничества с Eesti Töötukassa.
Задать вопрос: training@gamma-intelligence.com
Если у вас есть дополнительные вопросы, то отправьте нам письмо: training@gamma-intelligence.com.
Позвоните нам: (372)55581521
Позвоните нам по телефону 55581521. Мы ответим на все интересующие Вас вопросы.
Описание курса:
Целевая группа: Специалисты, чья работа связана со сбором, обработкой и анализом данных.Преподаватель: Николай Зубрилов (магистерская степень - компьютерная и системная техника)
Длительность обучение: 12 недель
Язык обучения: русский, английский
Учебная группа: до 8 человек
Объем: 180 академических часов, из которых 94 академических часа проходят в аудитории (в т.ч. практические занятия 8 ак. часа и 2 семинара (8 ак.ч))
Стоимость: 1967,21 EUR + НСО
Требования к обучающимся:
По окончанию курса Вы научитесь:
Методы обучения:
Общий объем курса: 180 академических часов, из которых 94 академических часа проходят в аудитории (в т.ч. практические занятия 8 ак. часа и 2 семинара (8 ак.ч))Критерии оценки результатов обучения:
Результаты обучения оцениваются на основе самостоятельно выполненных практических работ.Методы оценки:
При успешном выполнении практические и домашние работы получают оценку "зачет".Условия окончания курса:
Для успешного окончания курса и получения сертификата необходимо получить зачет 75% домашних работДополнительная информация:
Группа программы обучения:0612 - Управление базами данных и сетевыми технологиями (0612 - Andmebaaside ja võrgu disaini ning halduse õppekavarühm)
Основные правила организации обучения (на эстонском языке)
Основные правила обеспечения качества учебного процесса (на эстонском языке)
Модуль | Содержание модуля | Длительность |
Введение в анализ данных | Современные проблемы, решаемые анализом данных. Основные понятия в анализе данных. Числовые и категориальные данные. Краткий обзор инструментов для анализа данных. | 4 ак. ч. |
Знакомство со средой Python и Jupyter | Установка интерпретатора Python. Знакомство с IDE. Знакомство с менеджером пакетов PIP. Установка среды iPython и Jupyter. Основы использования Jupyter Lab: типы ячеек, навигация, шорткаты, установка расширений. Знакомство с Google Colab. | 4 ак. ч. |
Коллекции в Python | Знакомство и основные операции с типами данных: список, кортеж, множество и словарь. | 8 ак. ч. |
Управляющие конструкции в Python | Построение логических условий. Цикл for. Практическая работа. | 4 ак. ч. |
Знакомство с VCS/GIT | Регистрация на GitHub. Создание своего репозитария. Принцип работы Git | 2 ак. ч. |
Практическая часть | 2 ак. ч. | |
Знакомство с модулем NumPy | Понятие одномерных и многомерных массивов, операции с массивами, изменение типов данных в массивах, определение занимаемой памяти и скорости выполнения операции, общий обзор возможностей модуля NumPy | 4 ак. ч. |
Вероятность и комбинаторика | Теоретическая и экспериментальная вероятность. Распределение вероятностей. Теорема Байеса. Комбинации и перестановки. Модуль NumPy.random для проведения экспериментов. Практическая работа. | 4 ак. ч. |
Знакомство с модулем Pandas | Понятия dataframe и serie. Индексация. Манипуляция с датасетами. Группировка. Получение статистических данных. Объединение датасетов. Создание новых столбцов. | 10 ак. ч. |
Основные понятия статистики | Распределение Гаусса. Построение и проверка гипотез. Корреляция. Определение выбросов. Основные типы графиков. | 6 ак. ч. |
Визуализация данных | Обзор модулей Matplotlib, Seaborn, Plotly и Bokeh. Построение графиков: Bar Chart, Histogram, Boxplot, Scatter Plot и др. Практическая работа. | 12 ак. ч. |
Практическая часть | 2 ак. ч. | |
Язык запросов SQL и СУБД MySQL | Установка и настройка сервера MySQL. Создание баз данных и таблиц. Типы данных. Понятие реляционных баз данных. Написание основных запросов на языке SQL. | 8 ак. ч. |
Практическая часть | Практическая часть по использованию SQL | 2 ак. ч. |
Работа в Pandas c разными источниками данных | Выгрузка данных из форматов csv, json, xlsx, xml, pdf и др. Выгрузка датасета из базы данных MySQL. Написание скрипта для создания запросов на API. Сохранение датасета в разные форматы. Практическая работа. | 8 ак. ч. |
Очистка данных | Поиск отсутсвующих данных по тепловой карте, замена отсутствующих значений. Работа с выбросами. Поиск и удаление дубликатов. Определение релевантности признаков. Приведение данных к одному формату. Практическая работа. | 8 ак. ч. |
Формирование отчетов | Полный процесс создания интерактивного аналитического отчета. Создание дашборда с использованием сервиса Streamlit на примере проекта разведочного анализа данных. | 6 ак. ч. |