Специалист по Data Science буткемп от Яндекс Практикум

    Яндекс Практикум
    Стоимость курса
    168 000 Р
    Рассрочка
    от 8 642 Р в месяц
    Длительность
    5 месяцев
    Сертификат
    Да
    Начало курса
    В любой момент
    Трудоустройство
    Нет

    Кому подойдет

    • Вы никогда не работали в IT и хотите освоить новую профессию
    • У вас есть опыт работы с данными, но не хватает крепкой базы по машинному обучению
    • Вы уже работаете на смежной роли и хотите сменить направление
    • Вы готовы посвящать учёбе от 40 часов в неделю

    Чему Вы научитесь

    • Анализировать большие объёмы данных, разрабатывать модели и применять машинное обучение, чтобы делать прогнозы и выявлять закономерности

    Программа обучения

    Основы Python и анализа данных

    Moscow Catnamycs

    Вывод данных на экран. CSV-файлы. Работа с таблицами. Тепловые карты. Умножение столбца на целое число.

    Ошибки в коде

    Синтаксические ошибки. Ошибки наименования. Ошибки при делении на ноль. Ошибки при импорте модуля.

    Переменные и типы данных

    Переменные. Типы данных. Арифметические операции с числами и строками.

    Как выдвигать гипотезы

    Гипотезы. HADI-циклы. Аналитическое мышление. Чтение графиков.

    Работа в области данных

    Задачи аналитика. Уточнение задач. Декомпозиция. Стадии проекта.

    Машинное обучение

    Модель. Обучающая и тестовая выборки. Объект и признак. Метрика Евклида. Алгоритм k-ближайших соседей (kNN). Библиотека Scikit-learn.

    Базовый Python

    Переменные и типы данных

    Язык Python. Переменные. Вывод объектов и данных на экран. Обработка ошибок, оператор try-except. Типы данных. Преобразования типов данных.

    Строки

    Индексы в строках. Срезы строк. Операции над строками. Методы строк. Форматирование строк, метод format(), f-строки.

    Списки

    Индексы в списках. Срезы списков. Добавление и удаление элементов. Сложение и умножение, сортировка списков. Поиск элементов в списке. Разделение строки в список строк, соединение списка строк.

    Цикл for

    Перебор элементов. Перебор индексов элементов. Обработка элементов списков с помощью циклов: нахождение суммы и произведения элементов.

    Вложенные списки

    Циклы по вложенным спискам с подсчётом значений. Добавление элементов во вложенные списки. Сортировка вложенных списков.

    Условный оператор

    Цикл while. Логический тип данных. Булевы значения. Логические и составные логические выражения. Условный оператор if, elif, else. Ветвления. Фильтрация списков с использованием условного оператора. Цикл while.

    Функции

    Назначение функций. Параметры и аргументы. Параметры со значениями по умолчанию. Позиционные и именованные аргументы. Возвращение результата из функции.

    Словари

    Ключи и значения. Поиск значения по ключу. Добавление элементов в словарь. Список словарей. Красивый вывод словарей.

    Библиотека Pandas

    Чтение CSV-файлов. Датафрейм. Конструктор датафрейма. Вывод первых и последних строк датафрейма. Индексация в датафреймах. Индексация в столбцах Series.

    Предобработка данных

    Принцип GIGO. Переименование столбцов датафрейма. Обработка пропущенных значений. Обработка явных и неявных дубликатов.

    Анализ данных

    Группировка данных. Сортировка данных. Основы описательной статистики. Оформление результатов.

    Jupyter Notebook — тетрадь в ячейку

    Интерфейс и шорткаты Jupyter Notebook.

    Предобработка данных

    Работа с пропусками

    Конверсия. Куки. Категориальные и количественные переменные, обработка пропусков в них. Обработка пропусков в количественных переменных по категориям.

    Изменение типов данных

    Чтение Excel-файлов. Преобразование Series к числовому типу. Модуль числа, метод abs(). Работа с датой и временем. Обработка ошибок, оператор try-except. Объединение датафреймов, метод merge(). Сводные таблицы.

    Поиск дубликатов

    Классический метод поиска дубликатов. Поиск дубликатов с учётом регистра.

    Категоризация данных

    Декомпозиция таблиц. Категоризация по числовым диапазонам. Категоризация на основе нескольких значений в строке.

    Критическое и системное мышление

    Системное мышление. Причины ошибок в данных. Критическое мышление.

    Исследовательский анализ данных

    Первые графики и выводы

    Применение сводных таблиц. Гистограмма. Распределения. Диаграмма размаха.

    Изучение срезов данных

    Метод query(). Работа с датой и временем. Построение графиков методом plot(). Бритва Оккама.

    Работа с несколькими источниками данных

    Срез данных на основе внешних объектов. Добавление новых столбцов в датафрейм. Добавление данных из других датафреймов. Переименование столбцов. Объединение таблиц.

    Взаимосвязь данных

    Диаграмма рассеяния. Корреляция переменных. Матрица диаграмм рассеяния.

    Валидация результатов

    Укрупнение групп. Разбиение данных по группам.

    Статистический анализ данных

    Комбинаторика

    Комбинации. Правило умножения. Перестановки. Количество перестановок. Размещения. Число размещений. Сочетания. Число сочетаний.

    Теория вероятностей

    Эксперимент. Вероятностное пространство. События. Вероятность. Пересекающиеся и взаимоисключающие события. Диаграмма Эйлера-Венна. Закон больших чисел.

    Описательная статистика

    Категориальные и количественные переменные. Мода и медиана. Среднее значение. Дисперсия. Стандартное отклонение. Квартили и процентили. Диаграмма размаха. Столбчатая диаграмма. Плотность частоты. Гистограмма.

    Случайные величины

    Случайная и дискретная случайная величина. Распределение вероятностей для дискретной случайной величины. Кумулятивная функция, математическое ожидание и дисперсия дискретной случайной величины.

    Распределения

    Эксперимент Бернулли. Биномиальный эксперимент. Распределения: непрерывное равномерное, нормальное и стандартное нормальное. CDF, PPF для нормального распределения. Распределение Пуассона. Аппроксимация одного распределения другим.

    Проверка гипотез

    Генеральная совокупность. Выборка. Выборочное распределение. Центральная предельная теорема. Односторонние и двусторонние гипотезы. P-Value. Проверка гипотезы о равенстве средних двух генеральных совокупностей.

    Первый большой проект

    Научитесь предварительному исследованию данных, сформулируете и проверите гипотезы. Найдёте закономерности в данных о продаже игры.

    Введение в машинное обучение

    Первая обученная модель

    Типы обучения в машинном обучении (МО). Обучение с учителем. Модель и алгоритм МО. Задача классификации. Знакомство с решающим деревом. Библиотека Scikit-learn. Чёрный ящик как принцип обучения.

    Качество модели

    Обучающая и тестовая выборка. Метрика качества accuracy, precision, recall. Переобучение и недообучение.

    Улучшение модели

    Валидационная выборка. Случайный лес. Логистическая регрессия. Настройка дерева решений.

    Переход к регрессии

    Задача регрессии. Среднеквадратичное отклонение как метрика регрессии. Модели для задачи регрессии: линейная регрессия, дерево решений и случайный лес.

    Обучение с учителем: классификация и регрессия

    Подготовка признаков

    Прямое и порядковое кодирование. Масштабирование признаков.

    Метрики классификации

    Дисбаланс классов. Метрики классификации: матрица ошибок, F1-мера.

    Несбалансированная классификация

    Методы устранения дисбаланса классов. Upsampling. Downsampling. Взвешивание классов. Порог классификации. PR-кривая. Метрики классификации: доля истинно положительных ответов и ложноположительных ответов. ROC-кривая.

    Метрики регрессии

    Коэффициент детерминации и среднее абсолютное отклонение.

    Машинное обучение в бизнесе

    Метрики бизнеса

    Оборот, себестоимость и маржинальность. Операционные расходы и операционная прибыль. Чистая прибыль. Возврат на инвестиции. Конверсии. Воронки. Онлайн- и офлайн-метрики.

    Бутстреп в машинном обучении

    А/B-тест. Расчёт доверительного интервала. Бутстреп и его применение.

    Сбор данных

    Источники данных. Разметка данных. Декомпозиция задачи. Голосование по большинству.

    Второй большой проект

    Подготовите данные для машинного обучения и с помощью модели оцените их качество.

    Линейная алгебра

    Векторы и векторные операции

    Библиотека NumPy. Что такое вектор. Геометрическое представление вектора. Операции над векторами. Векторизованные функции. Векторизация метрик.

    Расстояние между векторами

    Скалярное произведение векторов. Расстояние между векторами. Манхэттенское расстояние. Метод k-ближайших соседей

    Матрицы и матричные операции

    Понятие матрицы. Какие бывают операции над матрицами. Что такое транспонированная матрица.

    Линейная регрессия изнутри

    Математическая модель линейной регрессии. Обратная матрица. Математический алгоритм обучения линейной регрессии.

    Численные методы

    Анализ алгоритмов

    Вычислительная сложность. Время обучения линейной регрессии. Итеративные методы. Сравнение методов.

    Градиентный спуск

    Методы оптимизации. Функция потерь. Градиент функции. Градиентный спуск. Градиентный спуск для линейной регрессии. Стохастический градиентный спуск.

    Градиентный бустинг

    Ансамблевые методы. Градиентный бустинг. Регуляризация градиентного бустинга.

    Временные ряды

    Анализ временных рядов

    Временные ряды. Ресемплирование. Скользящее среднее. Тренды и сезонность. Стационарные ряды. Разности временного ряда.

    Прогнозирование временных рядов

    Задача прогнозирования. Качество прогноза. Создание признаков. Обучение модели.

    Машинное обучение для текстов

    Векторизация слов

    Лемматизация. Регулярные выражения. Векторизация слова. TF-ID.

    Языковые представления

    Эмбеддинги. Word2vec. BERT.

    Базовый SQL

    Базы данных

    База данных, СУБД, синтаксис языка SQL.

    Срезы данных

    ER-диаграмма. Логические и специальные операторы в SQL. Операторы работы с датой и временем. Обработка специальных значений. Условные конструкции в SQL-запросах.

    Группировка и сортировка

    Агрегирующие функции и их применение. Группировка данных. Сортировка данных. Группировка и сортировка по нескольким полям. Операторы HAVING, GROUP BY.

    Связи и объединения таблиц

    ER-диаграммы. Псевдонимы. Виды объединения таблиц. Оператор JOIN. Оператор INNER JOIN. Операторы LEFT OUTER JOIN и RIGHT OUTER JOIN. Оператор FULL OUTER JOIN. Виды присоединения: UNION и UNION ALL.

    Подзапросы

    Общие табличные выражения. Различие между подзапросом и присоединением. Работа со строками в PostgreSQL.

    Компьютерное зрение

    Введение в компьютерное зрение

    Где и как оно используется. Что такое изображение и аугментации.

    Библиотека Keras

    Логистическая регрессия и полносвязные нейронные сети в Keras. Обучение многослойной сети [GPU].

    Нейросети для компьютерного зрения

    Ядро свёртки. Свёртка. Свёрточный слой. Свёрточные нейросети. Архитектура ResNet. Задачи классификации изображений, детекции и сегментации. Основные датасеты изображений.

    Компьютерное зрение в Keras

    Свёрточные слои и аугментации в Keras. Алгоритм Adam. Загрузчики данных. Свёрточные сети для классификации фруктов.

    Выпускной проект

    В этом проекте вы подтвердите, что освоили новую профессию. Самостоятельно уточните задачу заказчика и пройдёте все стадии анализа данных и машинного обучения. Теперь без уроков и домашних заданий — всё как на настоящей работе.

    Вы сможете выбрать 1 из этих проектов:

    1. Построить модель, прогнозирующую отток клиентов в телекоммуникационной компании.
    2. Построить модель, предсказывающую параметры технологического процесса на металлургическом комбинате.

    Дополнительные курсы

    Практика Python

    Пройдёте несколько лабораторных занятий с дополнительными задачами на язык программирования Python.

    Теория вероятностей

    Вспомните или узнаете базовые термины в теории вероятностей: независимые, противоположные, несовместные события и т. д. На простых примерах и забавных задачах потренируетесь работать с числами и выстраивать логику решения. Поработаете с практическими заданиями, которые дают на собеседованиях.

    Практика SQL

    Несколько десятков дополнительных задач на отработку навыка работы с SQL. Пройдёте практические задания по составлению SQL-запросов, поработаете с новыми базами данных.

    Отзывы о школе 7

    4.3 из 5
    5
    0
    1
    1
    0
    Сортировать:
    Дате публикации
    • Дата публикации
    • Популярности
    • Сначала положительные
    • Сначала отрицательные
    • Константин 12 октября 2023

      Мои полгода обучения в Яндекс Практикуме оказались весьма впечатляющими, прежде всего благодаря высокому качеству программы и ее тщательной проработке. Важно отметить, тренажер, который предоставляют на курсе. Он обладает хорошо структурированным сценарием и высоким уровнем геймификации, что значительно облегчает освоение информации. Здесь мы не просто пересказываем теорию, а погружаемся в ситуации, анализируем поведение виртуальных коллег, разбираем проблемы и находим решения. Одним из замечательных аспектов программы является ее обширное покрытие всех необходимых тем и вопросов, которые студент должен овладеть. Кроме того, наставники акцентируют внимание на практических заданиях, проводимых онлайн в ходе еженедельных воркшопов и вебинаров, что способствует развитию реальных навыков. Особой чертой данного курса и комьюнити его студентов является возможность работать в команде. Во время обучения мы не просто учимся, но и находим новых друзей, создавая тесные связи с однокурсниками. Еще одной фантастической особенностью обучения является карьерный модуль в конце курса. Здесь нам не только рассказывают о том, как написать эффективное резюме и куда его отправлять, но и предоставляют возможность практического сотрудничества с опытными специалистами, которые помогают улучшить наше резюме, подготовиться к собеседованиям и многое другое. Они обеспечивают реальную поддержку и помощь при поиске работы и продвижении по карьерной лестнице. Я действительно поражен высоким качеством обучения в Яндекс Практикуме и всеми преимуществами, которые он предлагает. Этот курс является превосходным выбором для тех, кто стремится получить качественное и практическое образование в области, связанной с программированием и разработкой.

      Был ли отзыв полезен?
    • Анатолий 8 августа 2023

      Приветствую всех! Недавно приобрел курс "Аналитик данных" от Яндекс Практикума, и пока ни капли сожаления не испытывал. Выбор пал на данную платформу по следующим основаниям: 1. Отсутствие навязчивой рекламы со стороны блогеров на YouTube 2. Знакомые стартаперы, которые уже прошли другие программы Практикума и остались очень удовлетворены результатами 3. Отсутствие причин усомниться в надежности такой компании как Яндекс Курс организован по модулям, каждый из которых длится две недели. Предоставляется достаточно теоретических материалов, но и практической составляющей еще больше. Хотелось бы отметить профессионализм команды разработчиков курса и их умение доступно разъяснять сложные вопросы (к примеру, теорию вероятностей). Все объяснения идут через примеры, что позволяет гармонично совмещать теорию с практикой. Безусловно, стоит отметить работу специалистов команды Практикума (наставников, кураторов, рецензентов проектов). Все участники высококвалифицированы, крайне вежливы и терпеливы. Лично для меня, будучи человеком без каких-либо технических знаний, порой сталкиваюсь со сложностями, однако стремление освоить новую профессию преобладает, а к тому же команда Яндекса поддерживает в нужный момент. В итоге, моя оценка – 10 из 10.

      Был ли отзыв полезен?
    • Евгения 3 июня 2023

      Решила пройти здесь бесплатные курсы по Backend разработке. Все настолько поверхностно, что даже не описать. Маленькие окошечки с заданиями, которые приходится каждый раз увеличивать, а это неудобно. Выходит, что даже функционал толком не доработан. Все темы из теории очень поверхностны. Ни слова про рекурсию и переменные, а это основа основ. Практики на курсах нет, хоть вам обещают обратное. А ведь это основная задача, только практикой можно закрепить материал. Как можно научиться кодить и запоминать сантаксис? Задачи можно решать разными способами, но если вы напишите решение не так, как забито в компьютере, то результат зачтут как неправильный. Если задачу вы не решите, то к следующему блоку тем вас просто не допустят. Продукт крайне сырой и даже для новичка бесплатный курс это просто трата времени. Разработчики ценятся за знания, в том числе и математические, на курсах Яндекса эти знания вам никто не даст. Не советую трать время.

      Был ли отзыв полезен?
    Посмотреть все отзывы о Яндекс Практикум