Профессия Data Scientist от Mathshub

    Mathshub
    Стоимость курса
    349 300 Р
    Длительность
    9 месяцев
    Сертификат
    Да
    Начало курса
    В любой момент
    Трудоустройство
    Содействие

    Кому подойдет

    • Для тех, кто хочет освоить профессию Data Scientist

    Чему Вы научитесь

    • Основы программирования на Python
    • Написание и отладка кода
    • Работа со сторонними библиотеками и чтение документации
    • Умение находить нужную информацию и применять в своих проектах
    • Умение работать с исследовательским анализом данных
    • Умение строить графики и работать с ними
    • Умение исправлять проблемы в данных
    • Освоение популярных алгоритмов: линейный и бинарный поиск
    • Умение оценить время исполнения алгоритма
    • Умение решать алгоритмические задачи

    Программа обучения

    Основы Python

    СОДЕРЖАНИЕ МОДУЛЯ

    • Строки
    • Списки
    • Цикл for
    • Вложенные списки
    • Условный оператор. Цикл while
    • Функции
    • Структуры данных в Python: List and tuples, Dictionary and Sets
    • Pandas для анализа данных
    • Предобработка данных
    • Анализ данных и оформление результатов в Jupyter Notebook
    • Сортировка, поиск, регулярные выражения.
    • Итераторы и генераторы
    • Numpy
    • Введение в ООП.

    ПРОЕКТ

    • Создание чат-бота для Telegram на любую интересующую тему с содержанием парсинга и обработки информации со стороннего ресурса. Чат-бота, который будет просто реагировать разными фразами, зашитыми в коде — недостаточно.
    • Цель проекта — разработать чат-бота, способного взаимодействовать с пользователями и предоставлять полезную информацию.

    ПРИОБРЕТЕННЫЕ НАВЫКИ

    • Основы программирования на Python
    • Написание и отладка кода
    • Работа со сторонними библиотеками и чтение документации
    • Умение находить нужную информацию и применять в своих проектах

    Основы SQL

    СОДЕРЖАНИЕ МОДУЛЯ

    • Основы базы данных, структура данных
    • создание таблиц и DDL команды
    • SELECT, WHERE
    • Все виды join
    • Group by, Having
    • Оконные функции, фреймы оконных функций
    • Индексы и оптимизация запросов

    ПРИОБРЕТЕННЫЕ НАВЫКИ

    • Чтение данных из таблиц с помощью SELECT запросов с нужными условиями
    • Создание таблиц, запись данных в таблицу
    • Расчет агрегатных значений
    • Соединение данных из разных таблиц

    EDA

    СОДЕРЖАНИЕ МОДУЛЯ

    • Введение в разведывательный анализ данных. Алгоритмы и методы
    • Математическая статистика в контексте EDA. Типы признаков
    • Линейная алгебра в контексте Линейных методов.
    • Математический анализ в контексте задачи оптимизации
    • Теория вероятностей и математическая статистика
    • Теория вероятностей в контексте Наивного Байесовского классификатора
    • Анализ данных

    ПРОЕКТ

    Защита Kaggle по EDA:
    Исследовательский проект в команде по изучению данных, выдвижению и проверке гипотез, а также презентация перед сокурсниками.

    ПРИОБРЕТЕННЫЕ НАВЫКИ

    • Умение работать с исследовательским анализом данных
    • Умение строить графики и работать с ними
    • Умение исправлять проблемы в данных

    Алгоритмы и структуры данных

    СОДЕРЖАНИЕ МОДУЛЯ

    • Алгоритмы и структуры данных
    • Линейный и бинарный поиск
    • Сложность алгоритма
    • Как оценивать время исполнения
    • Как решать алгоритмические задачи
    • Как тестировать свою программу

    ПРИОБРЕТЕННЫЕ НАВЫКИ

    • Освоение популярных алгоритмов: линейный и бинарный поиск
    • Умение оценить время исполнения алгоритма
    • Умение решать алгоритмические задачи

    Математика

    СОДЕРЖАНИЕ МОДУЛЯ

    • Степени и логарифм. Пределы и последовательности.
    • Функции и их графики
    • Дифференцирование
    • Интегрирование
    • Векторы, матрицы и операции с ними
    • Сингулярное разложение матриц

    ПРИОБРЕТЕННЫЕ НАВЫКИ

    • Освоение основных понятий математики, матрицы, функций, операторы и умение с ними работать.
    • Освоение математической статистики и теории вероятностей.

    Статистика

    СОДЕРЖАНИЕ МОДУЛЯ

    • Зачем нужна статистика и A/B тесты
    • Доверительные интервалы
    • Статистики распределений, взаимосвязь случайных величин, показатели корреляции
    • Проверка гипотез, параметрические статистические критерии
    • Непараметрические статистические критерии
    • Метод максимума правдоподобия и ядерная оценка плотности
    • Дизайн A/B эксперимента
    • А/А-эксперименты и валидация методики экспериментирования
    • Ошибки при проведении A/B тестов
    • Увеличение чувствительности А/В тестов
    • Невозможность проведения А/В тестов
    • Roll-out test
    • Causal Inference

    ПРОЕКТ

    Анализ гипотез по улучшению работы маркетплейса или логистической компании (на выбор)

    ПРИОБРЕТЕННЫЕ НАВЫКИ

    • Умение выдвигать гипотезы, планировать эксперименты и оценивать их результаты на основе статистики.

    Продуктовая аналитика

    СОДЕРЖАНИЕ МОДУЛЯ

    • Гипотезы и работа с ними
    • Метрики и работа с Amplitude
    • От стратегии до тактики через управление метриками

    ПРИОБРЕТЕННЫЕ НАВЫКИ

    • Освоение основ работы продуктового аналитика
    • Освоение продуктовых метрик, как их выбирать, считать и оценивать

    Инструменты визуализации

    СОДЕРЖАНИЕ МОДУЛЯ

    • Как работает и для чего нужна визуализация
    • Как обманывать с помощью графиков
    • Принципы хорошего графика
    • Основы в построении отчетов, разбор разных BI-инструментов
    • Много времени уделим практике и вместе освоимся в интерфейсе Tableau.

    ПРОЕКТ

    Визуализация типа “Портретник”. Вы сделаете визуализацию типа “Портретник”. Где сущностью будет ваш клиент. Данные знакомые — с которыми работали на практике.

    ПРИОБРЕТЕННЫЕ НАВЫКИ

    Умение превращать информацию в наглядное и понятное представление с помощью диаграмм, графиков, таблиц и других визуальных элементов, легко воспринимать и анализировать большие объемы данных, а также выявлять связи и тренды.

    Machine Learning

    Включено в модуль:

    • Введение в МО: каким оно бывает и каковы основные компоненты метрики и задача линейной регрессии
    • Градиентный спуск
    • Обобщающая способность модели: метод отложенной выборки / Кросс-Валидация
    • Полезные приемы при работе с данными
    • Линейная классификация: оценка вероятности
    • Матрица ошибок и основные метрики классификации
    • ROC, PR-кривые
    • AUC-ROC, AUC-PR
    • Градиентный бустинг
    • Bias-variance trade-off
    • Кластеризация
    • Рекомендательные системы
    • Машинное обучение: классические задачи и алгоритмы
    • Создание ML-пайплайна с нуля
    • Развитие ML-пайплайна.

    Описание:

    В этом модуле вы изучите зависимость между независимыми переменными и зависимой переменной и предсказывать значения последней на основе первых, а также разделять наблюдения на заранее определенные категории или классы на основе их признаков.

    Вы поймете, как нескольким разработчикам работать над одним проектом одновременно, улучшая качество и скорость его разработки. Узнаете, что такое кластеризация и подготовка данных.

    Программа:

    • Регрессии
    • Классификация
    • Парное программирование — Алгоритмы ML
    • Кластеризация
    • Подготовка данных
    • Продвинутые подходы ML.

    Deep Learning

    Включено в модуль:

    • Нейрон и функция активации. Простейшая нейронная сеть
    • Обучение нейросети (эпохи, mini-batch gradient descent, loss function, cross-entropy loss)
    • Batchnorm, dropout, регуляризация весов и ранняя остановка
    • Backpropagation
    • Transfer learning
    • Learning rate, adaptive LR
    • Softmax
    • MLP: перцептроны, устройство
    • Data processing: аугментация
    • Data processing: нормализация батчей
    • Архитектура, принцип работы свертки
    • Типы слоев
    • Гиперпараметры фильтров.

    Описание:

    В этом модуле вы познакомитесь с анализом данных с использованием Python: изучение основных методов анализа данных, работа с библиотеками для обработки, визуализации и анализа данных, например, Pandas, NumPy и Matplotlib.
    Изучите глубокое обучение и нейронные сети: понимание основных принципов и концепций глубокого обучения, изучение различных типов нейронных сетей и их применение в задачах машинного обучения.

    Поймете, как делать развертывание и мониторинг моделей глубокого обучения: изучение процесса развертывания и мониторинга моделей глубокого обучения, включая получение и предобработку данных, настройку и оптимизацию моделей, их развертывание на продакшн окружениях и мониторинг их производительности.
    Создадите простую нейронную сеть: практическое изучение основных шагов создания и обучения простых нейронных сетей, включая настройку архитектуры сети, определение функции потерь и оптимизатора, обработку входных данных, обучение и оценку модели.

    Реализуете модели глубокого обучения для классификации изображений: изучение различных методов и подходов к классификации изображений с использованием глубокого обучения, включая использование сверточных нейронных сетей, предобученных моделей и передачу обучения.

    Программа:

    • Использование Python для анализа данных. Введение в глубокое обучение и нейронные сети
    • Глубокое обучение с использованием TensorFlow и Keras. Расширенные темы в глубоком обучении
    • Продвинутые темы в глубоком обучении. Развертывание и мониторинг моделей глубокого обучения.
    • Создание и обучение простой нейронной сети
    • Реализация моделей глубокого обучения для классификации изображений
    • Реализация GAN и моделей на основе трансформеров.

    Отзывы о школе 2

    5 из 5
    2
    0
    0
    0
    0
    Сортировать:
    Дате публикации
    • Дата публикации
    • Популярности
    • Сначала положительные
    • Сначала отрицательные
    • Павел 7 августа 2023

      Я обучаюсь на программе «Разработчик на Python» в академии Mathshub и это просто замечательно! Как человеку с дипломом в смежной области – теоретической и компьютерной лингвистике – школа предоставляет мне прекрасную возможность структурировать существующие знания и приобрести огромное количество новых понятий и умений, включая область поиска работы за границей и расширение своего кругозора. У нас также имеются каналы в Telegram и Discord, где регулярно публикуются новости, обновления, анонсы мероприятий и уроков, а также напоминания о домашних заданиях – это очень удобно, чтобы быть в курсе всех важных событий. В чатах Discord ученики взаимодействуют друг с другом, обмениваются идеями и задают вопросы, что создает атмосферу активного участия. Занятия проходят интерактивно, учащиеся могут задавать вопросы преподавателям и уточнять некоторые моменты. Отдельную значимость имеют карьерные лекции и консультации от профессиональных коучей. Карьерная поддержка является особенно важной в сложном мире современного IT, особенно для начинающих разработчиков. К тому же, в программу включены гостевые встречи с профессионалами из IT-сферы с разнообразными историями и путями в IT, которые рады делиться своим опытом и отвечать на вопросы. Это тоже огромный плюс карьерных программ от Mathshub. Огромная благодарность всем наставникам, координаторам, преподавателям, коучам, специальным гостям и, безусловно, Айре, основательнице академии, за эту великолепную возможность не только улучшить свои навыки, но и стать частью такого удивительного сообщества.

      Был ли отзыв полезен?
    • Алиса 10 июня 2023

      Источником информации о школе Mathshub для меня стал блог Айры, где она сообщала о запланированном интенсиве по математике и Python - именно то, что меня интересовало. На тот момент я уже начала изучать Data Science самостоятельно. Я была счастлива получить возможность принять участие, тем более интенсив был абсолютно бесплатным. Я осталась довольна процессом обучения - его интенсивностью, организацией домашних работ и порядком контрольных, тесным взаимодействием с кураторами, тематическим общением с другими учениками в чате. Лучшим ученикам по окончании интенсива были предложены скидки и стипендии на карьерные программы Mathshub, и я была счастлива войти в это число. Я выбрала направление на базе Data Science. Обучение включает в себя теоретическую часть, лекции, домашние задания, разные контрольные и проектные работы, которые можно использовать в будущем портфолио. Кураторы достойны лучшей и отдельной благодарности - они очень внимательны, отвечают на все вопросы и помогают решать все проблемы. Хотя я на полпути своей учебы, чувствую, что изменилось уже многое. Я очень рекомендую школу всем, кто ищет продуктивное обучение и работу.

      Был ли отзыв полезен?
    Посмотреть все отзывы о Mathshub