Анализ данных с помощью Python и SQL

Анализ данных с помощью Python и SQL

Таллинн

16.03.2023 - 25.05.2023

Онлайн-курс:

16.03.2023 - 25.05.2023

Учим решать реальные задачи с помощью анализа данных

Анализ данных — это не только обработка информации после ее получения и сбора, а средство проверки гипотез и принятия решений. Цель любого анализа данных — понимание исследуемой ситуации целиком (выявление тенденций, негативных отклонений от плана, получений рекомендаций и прогнозов). Это достигается через главные задачи анализа данных:

  • сбор информации,
  • структуризация информации,
  • выявление закономерностей, анализ,
  • прогнозирование и получение рекомендаций.
  • 12 недель аудиторной работы

    По объему информации, количеству осваиваемых технологий и инструментов данный курс прочно удерживает первое место среди других.

    Внимание: для данного курса в некоторых случаях мы можем провести предварительное тестирование (пройти тест можно бесплатно).

    Помимо стандартных библиотек Python Вы также получите представление о дополнительных библиотеках (Numpy, Pandas), используемых в аналитике данных и Data Science.

    Cвыше 20 инструментов и 50 компетенций

    Курс дает большой объем знаний сразу в нескольких областях:

  • Общие принципы анализа данных
  • Программирование с использованием языка Python
  • Работа с языком запросов данных SQL
  • Работа с Jupiter Notebook
  • Необходимый объем знаний в области математического анализа, теории вероятностей и математической статистики.
  • Актуальные кейсы для первого портфолио

    Несмотря на то, что курс содержит достаточно большой объем теории, в рамках курса будет как минимум 5 типов задач с реальными наборами данных, которые наиболее часто встречаются в работе аналитика данных:

  • Расчет инвестиционной стратегии (прогностический анализ)
  • Разработка эффективной рекомендательной системы (прогностический анализ)
  • Оптимизация маркетинговых затрат предприятия (разведывательный анализ)
  • Максимизация прибыли компании (прогностический анализ)
  • Анализ трендов рынка недвижимости(описательный анализ)
  • Оптимизация товарного ассортимента (прогностический анализ)
  • По окончанию курса Вы cможете:

  • подготавливать данные для анализа с помощью Python и SQL;
  • структурировать информацию;
  • формулировать гипотезы и проводить их проверку используя методы математической статистики;
  • генерировать отчеты с первичными рекомендациями, используя современные инструменты визуализации;
  • продолжить свою карьеру в области Data Science, Machine Learning;
  • Все включено в стоимость курса

    Курсы проходят в центре Таллинна, по адресу Тарту мнт, 18. Размер группы до 8 человек.

    В цену курса включены все учебные материалы.

    При необходимости на время обучения выдается ноутбук.

    Внимание: с июня 2020 года данный курс можно пройти в рамках нашего сотрудничества с Eesti Töötukassa.

    Бесплатная консультация:


    Касса по безработице
    Работодатель
    Самостоятельная оплата
    Я согласен получать новости и специальные предложения от Gamma Intelligence (не чаще, чем один раз в месяц)
    Я не согласен получать новости и специальные предложения от Gamma Intelligence

    Задать вопрос: training@gamma-intelligence.com


    Если у вас есть дополнительные вопросы, то отправьте нам письмо: training@gamma-intelligence.com.


    Позвоните нам: (372)55581521


    Позвоните нам по телефону 55581521. Мы ответим на все интересующие Вас вопросы.

    Описание курса:

    Целевая группа: Специалисты, чья работа связана со сбором, обработкой и анализом данных.

    Преподаватель: Максим Колодиев (магистерская степень - компьютерная и системная техника)

    Длительность обучение: 12 недель

    Язык обучения: русский, английский

    Учебная группа: до 8 человек

    Объем: 94 академических часа (12 недель)

    Стоимость: 2000 EUR + НСО

    Требования к обучающимся:

  • среднее образование
  • знание основ теории вероятности и математической статистики
  • уверенный пользователь ПК
  • уровень английского A2/B1
  • желательно наличие собственного ПК (Windows), при необходимости на время обучения выдается компьютер
  • По окончанию курса Вы научитесь:

  • подготавливать данные для анализа используя Python и SQL;
  • структурировать информацию;
  • формулировать гипотезы и проводить их проверку используя методы математической статистики;
  • генерировать отчеты с первичными рекомендациями;
  • продолжить свою карьеру в области Data Science, Machine Learning;
  • Дополнительная информация:

    Основные правила организации обучения (на эстонском языке)
    Основные правила обеспечения качества учебного процесса (на эстонском языке)
    Модуль Содержание модуля Длительность
    Введение в анализ данных Современные проблемы, решаемые анализом данных. Основные понятия в анализе данных. Числовые и категориальные данные. Краткий обзор инструментов для анализа данных. 4 ак. ч.
    Знакомство со средой Python и Jupyter Установка интерпретатора Python. Знакомство с IDE. Знакомство с менеджером пакетов PIP. Установка среды iPython и Jupyter. Основы использования Jupyter Lab: типы ячеек, навигация, шорткаты, установка расширений. Знакомство с Google Colab. 4 ак. ч.
    Коллекции в Python Знакомство и основные операции с типами данных: список, кортеж, множество и словарь. 8 ак. ч.
    Управляющие конструкции в Python Построение логических условий. Цикл for. Практическая работа. 4 ак. ч.
    Знакомство с VCS/GIT Регистрация на GitHub. Создание своего репозитария. Принцип работы Git 12 ак. ч.
    Практическая часть 2 ак. ч.
    Знакомство с модулем NumPy Понятие одномерных и многомерных массивов, операции с массивами, изменение типов данных в массивах, определение занимаемой памяти и скорости выполнения операции, общий обзор возможностей модуля NumPy 4 ак. ч.
    Вероятность и комбинаторика Теоретическая и экспериментальная вероятность. Распределение вероятностей. Теорема Байеса. Комбинации и перестановки. Модуль NumPy.random для проведения экспериментов. Практическая работа. 4 ак. ч.
    Знакомство с модулем Pandas Понятия dataframe и serie. Индексация. Манипуляция с датасетами. Группировка. Получение статистических данных. Объединение датасетов. Создание новых столбцов. 4 ак. ч.
    Основные понятия статистики Распределение Гаусса. Построение и проверка гипотез. Корреляция. Определение выбросов. Основные типы графиков. 6 ак. ч.
    Визуализация данных Обзор модулей Matplotlib, Seaborn, Plotly и Bokeh. Построение графиков: Bar Chart, Histogram, Boxplot, Scatter Plot и др. Практическая работа. 8 ак. ч.
    Практическая часть 2 ак. ч.
    Язык запросов SQL и СУБД MySQL Установка и настройка сервера MySQL. Создание баз данных и таблиц. Типы данных. Понятие реляционных баз данных. Написание основных запросов на языке SQL. 8 ак. ч.
    Практическая часть Практическая часть по использованию SQL 2 ак. ч.
    Работа в Pandas c разными источниками данных Выгрузка данных из форматов csv, json, xlsx, xml, pdf и др. Выгрузка датасета из базы данных MySQL. Написание скрипта для создания запросов на API. Сохранение датасета в разные форматы. Практическая работа. 8 ак. ч.
    Очистка данных Поиск отсутсвующих данных по тепловой карте, замена отсутствующих значений. Работа с выбросами. Поиск и удаление дубликатов. Определение релевантности признаков. Приведение данных к одному формату. Практическая работа. 8 ак. ч.
    Формирование отчетов Аналитик - как связующее звено IT и бизнеса. Полный цикл формирования отчетов с конкретными рекомендациями для бизнеса. Практическа работа. . 6 ак. ч.