SQL для прикладных задач от ФПМИ МФТИ

    ФПМИ МФТИ
    Стоимость курса
    78 000 Р
    Длительность
    3.5 месяца
    Сертификат
    Да
    Начало курса
    29 мая 2024
    Трудоустройство
    Нет

    Кому подойдет

    • Аналитики
    • Начинающие IT-специалисты
    • Маркетологи
    • Начинающие разработчики

    Чему Вы научитесь

    • Автоматизируете процессы сбора, очистки и анализа реальных данных (ETL)
    • Освоите инструменты: SQL, Git, базовый Python
    • Научитесь работать с хранилищами данных (DWH)

    Программа обучения

    БЛОК I

    Неделя 1. Создание и заполнение таблиц, базовый синтаксис запросов SQL

    Научимся строить таблицы, задавать в них форматы полей и ограничения, заполнять таблицы данными. Будем практиковаться писать обращения к таблицам и получать из них данные по простым условиям.

    Мы вместе выполним следующее задание:

    • создадим ER-модель процесса покупки-продажи акций компании пользователем;
    • создадим таблицы по спроектированной модели;
    • сформируем таблицы с данными определенных групп пользователей

    Неделя 2. Объединение и агрегация данных

    Научимся объединять данные из разных таблиц и формировать более сложные запросы, обращаясь сразу к нескольким таблицам. Попрактикуемся в агрегации данных, что позволит нам строить запросы для получения простейшей статистики из данных.

    Мы загрузим таблицу о клиентах интернет-магазина, таблицу с их заказами и таблицу с описанием этих заказов. После чего ответим на вопросы:

    • Сколько клиенты всего потратили денег за год?
    • Какое соотношение онлайн и оффлайн заказов среди клиентов?
    • Каких товаров продали больше всего?
    • Какие товары принесли наибольшую выручку за последний год?

    Неделя 3. Регулярные выражения и очистка данных

    Разберем продвинутые методы работы с строками, изучим регулярные выражения. Это позволит делать более сложную и тонкую обработку строк и поиск по строкам. Кроме того, начнем практиковаться в очистке данных.

    Мы реализуем процесс по очистке, валидации и приведению к единому виду данных, оставленных пользователями при регистрации в wifi-сети банковского отделения.

    БЛОК II

    Неделя 4.Старт выпускного проекта. Основы UNIX (Linux) систем. Git. Python для создания процессов обработки данных

    Начнем готовиться к выпускному проекту и выбирать тему. Слушатель может выполнять заранее подготовленный преподавателем проект, либо согласовать собственную задачу. На этой неделе мы научимся выстраивать полноценный процесс обработки данных с использованием нескольких самописных Python приложений.

    Кроме того, на этой неделе будет краткий экскурс в *nix системы, узнаем, как подключаться по ssh к *nix серверу, как выполнять пакеты и как планировать задачи с помощью crontab.

    Неделя 5. Оконные функции в SQL. Библиотека SQLite

    Научимся создавать CRUD приложения на python, которое будет сохранять данные в базе данных SQLite.

    После этого мы перейдем к довольно сложной, но очень полезной теме – оконным функциям. С их помощью мы научимся решать сложные аналитические задачи.

    Научимся создавать локальные базы данных (без подключения к стороннему серверу) и обрабатывать данные – очень полезно, например, если служба безопасности не дает подключаться к сторонним сервисам.

    Неделя 6. Оконные функции и паттерны хранения данных

    Разберемся, какие существуют шаблоны (паттерны) хранения данных и продолжим практиковаться в написании сложных оконных функций. Изучим, какие шаблоны хранения используются в современных DWH, научимся хранить историю изменения данных.

    Неделя 7. Инкрементальная загрузка. Оптимизация запросов

    Мы изучим подход инкрементальной загрузки, что позволяет снимать с системы актуальное состояние и записывать данные в историческую таблицу. Кроме того, мы будем практиковаться в анализе запросов и их оптимизации.

    Мы создадим ETL-процесс ежедневной загрузки транзакционных данных телекома и с помощью индексов ускорим работу некоторых запросов.

    Неделя 8. Разбор задач с собеседований и повторение материала

    Будем практиковаться в решении наиболее часто встречающихся задач с собеседований на начинающих Data Engineer, аналитиков и другие близких data-специальностей. Вспомним и еще раз систематизируем все, что изучили на курсе.

    Неделя 9-10. Доработка выпускного проекта. Консультации с преподавателями

    В эти две недели дорабатываем выпускные проекты, консультируемся с преподавателями.
    Слушатели приходят к преподавателю на консультации с своими вопросами

    Неделя 11. Защита проектов. Подведение итогов курса.

    Отзывы о школе 1

    5 из 5
    1
    0
    0
    0
    0
    Сортировать:
    Дате публикации
    • Дата публикации
    • Популярности
    • Сначала положительные
    • Сначала отрицательные
    • Милена 15 июня 2023

      С октября прошлого года я прохожу курс Data Scientist на факультете ФПМИ в МФТИ, который включает в себя три блока обучения: Python с уклоном в анализ данных, математику для анализа больших данных и методы программирования машинного обучения (МАДМО). Ранее у меня не было опыта программирования или применения аналитических инструментов в работе с данными. Я приняла решение пройти данный курс, чтобы улучшить свои знания и навыки с целью ускорения обработки финансовых данных на практике. Оказалось, что система машинного обучения и методы анализа данных - это увлекательно и интересно! Я с удовольствием прохожу курс. Главное преимущество данной программы - высокое качество обучения, фокусированное на понимании концепций, значимости и создании своих решений. Больше всего мне нравится то, что курс предоставляет множество материалов для самообучения и визуализаций, что помогает проще получить знания. Преподаватели очень открыты и доступны для конструктивного диалога. Я рекомендую данный курс всем, основываясь на своем личном опыте.

      Был ли отзыв полезен?
    Посмотреть все отзывы о ФПМИ МФТИ

    Похожие курсы