Анализ данных с помощью Python и SQL

Анализ данных с помощью Python и SQL

Таллинн

11.10.2024 - 13.12.2024
28.10.2024 - 30.12.2024
18.11.2024 - 20.01.2025
09.12.2024 - 11.02.2025

Онлайн-курс:

11.10.2024 - 13.12.2024
28.10.2024 - 30.12.2024
18.11.2024 - 20.01.2025
09.12.2024 - 11.02.2025

Учим решать реальные задачи с помощью анализа данных

Анализ данных — это не только обработка информации после ее получения и сбора, а средство проверки гипотез и принятия решений. Цель любого анализа данных — понимание исследуемой ситуации целиком (выявление тенденций, негативных отклонений от плана, получений рекомендаций и прогнозов). Это достигается через главные задачи анализа данных:

  • сбор информации,
  • структуризация информации,
  • выявление закономерностей, анализ,
  • прогнозирование и получение рекомендаций.
  • 10 недель аудиторной работы

    По объему информации, количеству осваиваемых технологий и инструментов данный курс прочно удерживает первое место среди других.

    Помимо стандартных библиотек Python Вы также получите представление о дополнительных библиотеках (Numpy, Pandas), используемых в аналитике данных и Data Science.

    Cвыше 20 инструментов и 50 компетенций

    Курс дает большой объем знаний сразу в нескольких областях:

  • Общие принципы анализа данных
  • Программирование с использованием языка Python
  • Работа с языком запросов данных SQL
  • Работа с Jupiter Notebook
  • Необходимый объем знаний в области математического анализа, теории вероятностей и математической статистики.
  • Актуальные кейсы для первого портфолио

    Несмотря на то, что курс содержит достаточно большой объем теории, в рамках курса будет как минимум 5 типов задач с реальными наборами данных, которые наиболее часто встречаются в работе аналитика данных:

  • Расчет инвестиционной стратегии (прогностический анализ)
  • Разработка эффективной рекомендательной системы (прогностический анализ)
  • Оптимизация маркетинговых затрат предприятия (разведывательный анализ)
  • Максимизация прибыли компании (прогностический анализ)
  • Анализ трендов рынка недвижимости(описательный анализ)
  • Оптимизация товарного ассортимента (прогностический анализ)
  • По окончанию курса Вы cможете:

  • подготавливать данные для анализа с помощью Python и SQL;
  • структурировать информацию;
  • формулировать гипотезы и проводить их проверку используя методы математической статистики;
  • генерировать отчеты с первичными рекомендациями, используя современные инструменты визуализации;
  • продолжить свою карьеру в области Data Science, Machine Learning;
  • Все включено в стоимость курса

    Курсы проходят в центре Таллинна, по адресу Тарту мнт, 18. Размер группы до 8 человек.

    В цену курса включены все учебные материалы.

    При необходимости на время обучения выдается ноутбук.

    Внимание: с июня 2020 года данный курс можно пройти в рамках нашего сотрудничества с Eesti Töötukassa.

    Бесплатная консультация:


    Касса по безработице
    Работодатель
    Самостоятельная оплата
    Я согласен получать новости и специальные предложения от Gamma Intelligence (не чаще, чем один раз в месяц)
    Я не согласен получать новости и специальные предложения от Gamma Intelligence

    Задать вопрос: training@gamma-intelligence.com


    Если у вас есть дополнительные вопросы, то отправьте нам письмо: training@gamma-intelligence.com.


    Позвоните нам: (372)55581521


    Позвоните нам по телефону 55581521. Мы ответим на все интересующие Вас вопросы.

    Описание курса:

    Целевая группа: Специалисты, чья работа связана со сбором, обработкой и анализом данных.

    Преподаватель: Николай Зубрилов (магистерская степень - компьютерная и системная техника)

    Длительность обучение: 12 недель

    Язык обучения: русский, английский

    Учебная группа: до 8 человек

    Объем: 180 академических часов, из которых 94 академических часа проходят в аудитории (в т.ч. практические занятия 8 ак. часа и 2 семинара (8 ак.ч))

    Стоимость: 1967,21 EUR + НСО

    Требования к обучающимся:

  • уверенный пользователь ПК
  • уровень английского A2/B1
  • желательно наличие собственного ПК (Windows), при необходимости на время обучения выдается компьютер
  • По окончанию курса Вы научитесь:

  • подготавливать данные для анализа используя Python и SQL;
  • структурировать информацию;
  • формулировать гипотезы и проводить их проверку используя методы математической статистики;
  • генерировать отчеты с первичными рекомендациями;
  • продолжить свою карьеру в области Data Science, Machine Learning;
  • Методы обучения:

    Общий объем курса: 180 академических часов, из которых 94 академических часа проходят в аудитории (в т.ч. практические занятия 8 ак. часа и 2 семинара (8 ак.ч))

    Критерии оценки результатов обучения:

    Результаты обучения оцениваются на основе самостоятельно выполненных практических работ.

    Методы оценки:

    При успешном выполнении практические и домашние работы получают оценку "зачет".

    Условия окончания курса:

    Для успешного окончания курса и получения сертификата необходимо получить зачет 75% домашних работ

    Дополнительная информация:

    Группа программы обучения:

    0612 - Управление базами данных и сетевыми технологиями (0612 - Andmebaaside ja võrgu disaini ning halduse õppekavarühm)

    Основные правила организации обучения (на эстонском языке)

    Основные правила обеспечения качества учебного процесса (на эстонском языке)
    Модуль Содержание модуля Длительность
    Введение в анализ данных Современные проблемы, решаемые анализом данных. Основные понятия в анализе данных. Числовые и категориальные данные. Краткий обзор инструментов для анализа данных. 4 ак. ч.
    Знакомство со средой Python и Jupyter Установка интерпретатора Python. Знакомство с IDE. Знакомство с менеджером пакетов PIP. Установка среды iPython и Jupyter. Основы использования Jupyter Lab: типы ячеек, навигация, шорткаты, установка расширений. Знакомство с Google Colab. 4 ак. ч.
    Коллекции в Python Знакомство и основные операции с типами данных: список, кортеж, множество и словарь. 8 ак. ч.
    Управляющие конструкции в Python Построение логических условий. Цикл for. Практическая работа. 4 ак. ч.
    Знакомство с VCS/GIT Регистрация на GitHub. Создание своего репозитария. Принцип работы Git 2 ак. ч.
    Практическая часть 2 ак. ч.
    Знакомство с модулем NumPy Понятие одномерных и многомерных массивов, операции с массивами, изменение типов данных в массивах, определение занимаемой памяти и скорости выполнения операции, общий обзор возможностей модуля NumPy 4 ак. ч.
    Вероятность и комбинаторика Теоретическая и экспериментальная вероятность. Распределение вероятностей. Теорема Байеса. Комбинации и перестановки. Модуль NumPy.random для проведения экспериментов. Практическая работа. 4 ак. ч.
    Знакомство с модулем Pandas Понятия dataframe и serie. Индексация. Манипуляция с датасетами. Группировка. Получение статистических данных. Объединение датасетов. Создание новых столбцов. 10 ак. ч.
    Основные понятия статистики Распределение Гаусса. Построение и проверка гипотез. Корреляция. Определение выбросов. Основные типы графиков. 6 ак. ч.
    Визуализация данных Обзор модулей Matplotlib, Seaborn, Plotly и Bokeh. Построение графиков: Bar Chart, Histogram, Boxplot, Scatter Plot и др. Практическая работа. 12 ак. ч.
    Практическая часть 2 ак. ч.
    Язык запросов SQL и СУБД MySQL Установка и настройка сервера MySQL. Создание баз данных и таблиц. Типы данных. Понятие реляционных баз данных. Написание основных запросов на языке SQL. 8 ак. ч.
    Практическая часть Практическая часть по использованию SQL 2 ак. ч.
    Работа в Pandas c разными источниками данных Выгрузка данных из форматов csv, json, xlsx, xml, pdf и др. Выгрузка датасета из базы данных MySQL. Написание скрипта для создания запросов на API. Сохранение датасета в разные форматы. Практическая работа. 8 ак. ч.
    Очистка данных Поиск отсутсвующих данных по тепловой карте, замена отсутствующих значений. Работа с выбросами. Поиск и удаление дубликатов. Определение релевантности признаков. Приведение данных к одному формату. Практическая работа. 8 ак. ч.
    Формирование отчетов Полный процесс создания интерактивного аналитического отчета. Создание дашборда с использованием сервиса Streamlit на примере проекта разведочного анализа данных. 6 ак. ч.