Аналитик данных плюс от Яндекс Практикум

    Яндекс Практикум
    Стоимость курса
    168 000 Р
    Рассрочка
    от 8 642 Р в месяц
    Длительность
    12 месяцев
    Сертификат
    Да
    Начало курса
    В любой момент
    Трудоустройство
    Содействие

    Кому подойдет

    • Вы хотите сменить сферу работы и с нуля освоить новую профессию
    • Вы никогда не работали в IT и у вас нет технического образования
    • Вы уже работаете на смежной роли и хотите сменить направление
    • Вам нужны аналитические навыки на текущем месте работы

    Чему Вы научитесь

    • Выгружать, преобразовывать и очищать данные с помощью SQL-запросов
    • Запускать А/В-тестирования для проверки гипотез
    • Помогать бизнесу принимать решения на основе данных
    • Создавать дашборды с помощью Tableau и других инструментов
    • Рассчитывать ключевые метрики работы компании и оценивать их значимость

    Программа обучения

    Основы Python и анализа данных

    Moscow Catnamycs

    Вывод данных на экран. CSV-файлы. Работа с таблицами. Тепловые карты. Умножение столбца на целое число.

    Ошибки в коде

    Синтаксические ошибки. Ошибки наименования. Ошибки при делении на ноль. Ошибки при импорте модуля.

    Переменные и типы данных

    Переменные. Типы данных. Арифметические операции с числами и строками.

    Как выдвигать гипотезы

    Гипотезы. HADI-циклы. Аналитическое мышление. Чтение графиков.

    Что делают специалисты в области данных

    Задачи аналитика. Уточнение задач. Декомпозиция. Стадии проекта.

    Проверка конверсии

    Конверсия. Изучение данных. Формирование выводов.

    Окупаемость рекламных кампаний

    Столбчатая диаграмма. Разность элементов. Индексация в столбцах.

    Machine Learning и Data Science

    Обучение в Machine Learning. Поиск уникальных значений в столбцах. Логическая индексация. Группировка значений в таблице. Ошибки предсказания.

    Финальный проект

    Сегментация пользователей.

    Базовый Python

    Переменные и типы данных

    Язык Python. Переменные. Вывод объектов и данных на экран. Обработка ошибок, оператор try-except. Типы данных. Преобразования типов данных.

    Строки

    Индексы в строках. Срезы строк. Операции над строками. Методы строк. Форматирование строк, метод format(), f-строки.

    Списки

    Индексы в списках. Срезы списков. Добавление и удаление элементов из списка. Сложение и умножение, сортировка списков. Поиск элементов в списке. Разделение строки в список строк, соединение списка строк.

    Цикл for

    Перебор элементов. Перебор индексов элементов. Обработка элементов списков с помощью циклов: нахождение суммы и произведения элементов.

    Вложенные списки

    Циклы по вложенным спискам с подсчётом значений. Добавление элементов во вложенные списки. Сортировка вложенных списков.

    Условный оператор, цикл while

    Логический тип данных. Булевы значения. Логические и составные логические выражения. Условный оператор if, elif, else. Ветвления. Фильтрация списков с использованием условного оператора. Цикл while.

    Функции

    Назначение функций. Параметры и аргументы. Параметры со значениями по умолчанию. Позиционные и именованные аргументы. Возвращение результата из функции.

    Словари

    Ключи и значения. Поиск значения по ключу. Добавление элементов в словарь. Список словарей. Красивый вывод словарей.

    Библиотека Pandas

    Чтение CSV-файлов. Датафрейм. Конструктор датафрейма. Вывод первых и последних строк датафрейма. Индексация в датафреймах. Индексация в столбцах Series.

    Предобработка данных

    Принцип GIGO. Переименование столбцов датафрейма. Обработка пропущенных значений. Обработка явных и неявных дубликатов.

    Анализ данных

    Группировка данных. Сортировка данных. Основы описательной статистики.

    Jupyter Notebook — тетрадь в ячейку

    Интерфейс и шорткаты Jupyter Notebook.

    Предобработка данных

    Работа с пропусками

    Конверсия. Куки. Категориальные и количественные переменные, обработка пропусков в них. Обработка пропусков в количественных переменных по категориям.

    Изменение типов данных

    Преобразование Series к числовому типу. Модуль числа, метод abs(). Работа с датой и временем. Обработка ошибок, оператор try-except. Объединение датафреймов, метод merge(). Сводные таблицы.

    Дубликаты

    Поиск дубликатов. Поиск дубликатов с учётом регистра.

    Категоризация данных

    Декомпозиция таблиц. Категоризация по числовым диапазонам. Категоризация на основе нескольких значений в строке.

    Критическое и системное мышление

    Системное мышление. Причины ошибок в данных. Критическое мышление.

    Исследовательский анализ данных

    Первые графики и выводы

    Применение сводных таблиц. Гистограмма. Распределения. Диаграмма размаха.

    Изучение срезов данных

    Метод query(). Работа с датой и временем. Построение графиков методом plot(). Бритва Оккама.

    Работа с несколькими источниками данных

    Срез данных на основе внешних объектов. Добавление новых столбцов в датафрейм. Добавление данных из других датафреймов. Переименование столбцов. Объединение таблиц.

    Взаимосвязь данных

    Диаграмма рассеяния. Корреляция переменных. Матрица диаграмм рассеяния.

    Валидация результатов

    Укрупнение групп. Разбиение данных по группам.

    Первый большой проект

    Проведёте сложный исследовательский анализ датасета с информацией о фильмах: показах в кинотеатрах, сборах, государственной поддержке. Потренируетесь в предобработке, вычислениях и построении визуализаций. В конце проекта вы проведёте самостоятельное исследование по фильмам с господдержкой и найдёте интересные закономерности.

    Базовый SQL

    Введение в базы данных

    Системы управления базами данных (СУБД). Язык SQL. SQL-запросы. Форматирование SQL-запросов.

    Срезы данных в SQL

    Типы данных в PostgreSQL. Преобразование типов данных. Оператор WHERE. Логические операторы. Срезы данных. Операторы IN, LIKE, BETWEEN. Работа с датой и временем. Обработка пропущенных значений. Условная конструкция CASE.

    Агрегирующие функции, группировка и сортировка данных

    Математические операции. Агрегирующие функции. Группировка данных. Сортировка данных. Фильтрация по агрегированным данным, оператор HAVING.

    Взаимоотношения между таблицами, типы объединения

    ER-диаграммы. Переименование полей и таблиц. Алиасы. Объединение таблиц. Виды объединений: INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL OUTER JOIN. Альтернативные виды объединения UNION и UNION ALL.

    Подзапросы и общие табличные выражения

    Подзапросы. Подзапросы во FROM. Подзапросы в WHERE. Сочетание объединений и подзапросов. Общие табличные выражения (CTE). Вариативность запросов.

    Как рассказать историю с помощью данных

    Кому, как, что и зачем рассказывать

    Представление результата исследования. Целевая аудитория рассказчика. Что и зачем рассказывать аналитику данных.

    Библиотека Seaborn

    Библиотека Seaborn как расширение библиотеки Matplotlib. Метод jointplot(). Цветовые гаммы. Стили графиков. Визуализация распределений.

    Библиотека Plotly

    Интерактивные графики. Линейный график. Столбчатая диаграмма. Круговая диаграмма. График воронки.

    Визуализация данных в геоаналитике

    Геоаналитика. Библиотека Folium. Отображение карт. Установка маркеров с указанными координатами. Создание кластеров точек. Собственные иконки для маркеров. Хороплет.

    Подготовка презентации

    Выводы на основе исследования. Сезонность и внешние факторы. Абсолютные и относительные величины. Парадокс Симпсона. Принципы построения презентаций. Отчёты в Jupyter Notebook.

    Построение дашбордов в Tableau

    Основы работы с Tableau

    BI-системы. Tableau. Создание документа. Сохранение документа. Публикация документа.

    Работа с источниками данных

    Источники данных. Объединение данных. Метод Relationship. Метод Join. Метод Blend. Метод Union. Изменение формата таблицы.

    Типы данных

    Основные типы данных. Измерения. Меры. Работа с датой и временем. Сеты. Группы. Параметры. Изменение формата переменных. Переменные Measure Names, Measure Values, Count.

    Таблицы и вычисления

    Интерфейс редактирования листа. Сводные таблицы. Вычисляемые поля. LOD-выражения.

    Фильтры и сортировки

    Сортировка мер. Сортировка измерений. Вложенные сортировки. Сортировка с помощью параметра. Фильтры.

    Визуализации

    Элементы управления визуализацией. Тепловые карты. Круговые и столбчатые диаграммы. Гистограммы. Диаграммы размаха и рассеяния. Линейные графики. Совмещённые графики. Диаграммы с областями.

    Специальные визуализации, подсказки

    Карты. Символьная и древовидная карта. Пузырьковая и пулевая диаграммы. Сircle Views. Диаграммы Ганта. Measure Names, Measure Values в визуализациях. Reverse Engineering. Всплывающие подсказки. Аналитические инструменты в Custom.

    Презентации

    Дополнительные параметры. Изучение типовых параметров. Создание презентации.

    Дашборды

    Загрузка и подготовка данных. Подготовка визуализаций. Сборка дашборда. Actions. Демонстрация дашборда. Публикация дашборда.

    Второй большой проект

    Проанализируете данные о метрике NPS клиентов телекоммуникационной компании из базы данных, а потом визуализируете результаты. Объедините навыки, полученные во всех пройденных спринтах.

    Анализ бизнес-показателей

    Метрики и воронки

    Конверсия. Воронки. Маркетинговая воронка. Показы. Клики. CTR. Продуктовая воронка.

    Когортный анализ

    Профиль пользователя. Retention Rate. Churn Rate. Горизонт анализа. Визуализация когортного анализа. Анализ удержания произвольных когорт. Конверсия в когортном анализе. Расчёт метрик в Python.

    Юнит-экономика

    Метрики LTV, CAC, ROI. ARPU, ARPPU. Расчёт метрик в Python. Продвинутая визуализация метрик. Параметр sharey. Скользящее среднее.

    Пользовательские метрики

    Оценка пользовательской активности. Пользовательская сессия. Расследование аномалий.

    Продвинутый SQL

    Расчёт бизнес-показателей

    Схема данных. Конверсия. LTV. ARPU. ARPPU. ROI. Расчёт с помощью SQL.

    Агрегирующие оконные функции

    Выражение OVER. Параметр окна PARTITION BY. Агрегирующие оконные функции.

    Оконные функции ранжирования

    Функции ранжирования. Оператор окна ORDER BY ROW_NUMBER(). RANK(). DENSE_RANK(). NTILE(). Операторы окна вместе с функциями ранжирования.

    Оконные функции смещения

    Кумулятивные значения. Функции смещения. LEAD(). LAG(). Оконные функции и алиасы.

    Когортный анализ

    Когортный анализ. Retention Rate, Churn Rate. LTV.

    База данных, клиент базы данных

    Клиент базы данных. Установка PostgreSQL. Установка DBeaver. Интерфейс DBeaver. Создание базы данных. Разворачивание дампа базы данных. Выгрузка результатов запроса. Представление результатов запроса.

    Проект с реальным заказчиком в Мастерской

    Мастерская — это пространство внутри Практикума, где вы поработаете над актуальной задачей от реального заказчика. Этот проект войдёт в ваше портфолио, которое сможете показать своему потенциальному работодателю.

    Статистический анализ данных

    Комбинаторика

    Комбинации. Правило умножения. Перестановки. Количество перестановок. Размещения. Число размещений. Сочетания. Число сочетаний.

    Теория вероятностей

    Эксперимент. Вероятностное пространство. События. Вероятность. Пересекающиеся и взаимоисключающие события. Диаграмма Эйлера-Венна. Закон больших чисел.

    Описательная статистика

    Категориальные и количественные переменные. Мода и медиана. Среднее значение. Дисперсия. Стандартное отклонение. Квартили и процентили. Диаграмма размаха. Столбчатая диаграмма. Плотность частоты. Гистограмма.

    Случайные величины

    Случайная и дискретная случайная величина. Распределение вероятностей для дискретной случайной величины. Кумулятивная функция, математическое ожидание и дисперсия дискретной случайной величины.

    Распределения

    Эксперимент Бернулли. Биномиальный эксперимент. Распределения: непрерывное равномерное, нормальное и стандартное нормальное. CDF, PPF для нормального распределения. Распределение Пуассона. Аппроксимация одного распределения другим.

    Проверка гипотез

    Генеральная совокупность. Выборка. Выборочное распределение. Центральная предельная теорема. Односторонние и двусторонние гипотезы. P-Value. Проверка гипотезы о равенстве средних двух генеральных совокупностей.

    Принятие решений в бизнесе

    Основы проверки гипотез в бизнесе

    Опережающие метрики. Базы экспериментов. Генерация гипотез. Приоритизация метрик.

    Выбор метода проведения эксперимента

    Качественные методы проверки гипотезы. Количественные методы проверки гипотезы. Преимущества и недостатки A/B-тестов.

    Приоритизация гипотез

    Приоритизация гипотез. Фреймворк RICE. Параметр Reach. Параметр Impact. Параметр Confidence. Параметр Efforts.

    Подготовка к A/B-тесту

    A/A-тест. Ошибки I и II рода. Мощность статистического теста. Значимость статистического теста. Множественные сравнения, методы снижения вероятности ошибки. Расчёт размера выборки и длительности A/B-теста. Графический анализ метрик.

    Анализ результатов A/B-теста

    Проверка гипотезы о равенстве долей. Критерий Шапиро-Уилка для проверки нормальности данных. Непараметрические статистические тесты. Критерий Манна-Уитни. Стабильность кумулятивных метрик. Анализ выбросов и всплесков.

    Поведенческие алгоритмы

    Факты, эмоции, оценки. Объяснение своей точки зрения.

    Основы машинного обучения

    Задачи машинного обучения в бизнесе

    Обучение с учителем. Обучение без учителя. Библиотека sklearn. Обучение модели в Python. Обучающая выборка. Тестовая выборка. Валидационная выборка. Недообучение. Переобучение. Пайплайн.

    Алгоритмы машинного обучения

    Линейная регрессия. Функция ошибки. Градиентный спуск. Масштабирование признаков. Регуляризация. Линейные модели. Метрики регрессии и классификации. Порог и баланс классов. Дерево принятия решений. Случайный лес. Градиентный бустинг. Кластеризация. K-Means. Метрики для задач обучения без учителя.

    Процесс решения задач машинного обучения

    EDA. Предварительная обработка данных. Random и time split. Выбор метрик. Выбор модели машинного обучения. Выбор лучшей модели. Важность признаков.

    Линии тренда и прогнозы в Tableau

    Доверительные интервалы. Линии тренда и прогноз. Кластеризация.

    Дополнительный курс: теория вероятностей

    Вспомните или узнаете базовые термины в теории вероятностей: независимые, противоположные, несовместные события и т. д. На простых примерах и забавных задачах потренируетесь работать с числами и выстраивать логику решения.

    Дополнительный курс: линейная алгебра и алгоритмы

    Сможете изучить основы линейной алгебры, а также основы работы с алгоритмами. Это поможет лучше подготовиться к собеседованиям и претендовать на вакансии, где выше требования к фундаментальным знаниям.

    Дополнительный курс: практика Python

    Пройдёте несколько лабораторных занятий с дополнительными задачами на язык программирования Python. Узнаете, как извлекать данные из веб-ресурсов.

    Итоговый проект

    Подтвердите, что освоили новую профессию: выберете одну из 5 сфер (банки, ретейл, игры, мобильные приложения, e-commerce), уточните задачу заказчика, пройдёте все стадии анализа данных — всё как на реальной работе. Привычного описания шагов в проекте не будет. Вы проработаете их самостоятельно.

    Отзывы о школе 7

    4.3 из 5
    5
    0
    1
    1
    0
    Сортировать:
    Дате публикации
    • Дата публикации
    • Популярности
    • Сначала положительные
    • Сначала отрицательные
    • Константин 12 октября 2023

      Мои полгода обучения в Яндекс Практикуме оказались весьма впечатляющими, прежде всего благодаря высокому качеству программы и ее тщательной проработке. Важно отметить, тренажер, который предоставляют на курсе. Он обладает хорошо структурированным сценарием и высоким уровнем геймификации, что значительно облегчает освоение информации. Здесь мы не просто пересказываем теорию, а погружаемся в ситуации, анализируем поведение виртуальных коллег, разбираем проблемы и находим решения. Одним из замечательных аспектов программы является ее обширное покрытие всех необходимых тем и вопросов, которые студент должен овладеть. Кроме того, наставники акцентируют внимание на практических заданиях, проводимых онлайн в ходе еженедельных воркшопов и вебинаров, что способствует развитию реальных навыков. Особой чертой данного курса и комьюнити его студентов является возможность работать в команде. Во время обучения мы не просто учимся, но и находим новых друзей, создавая тесные связи с однокурсниками. Еще одной фантастической особенностью обучения является карьерный модуль в конце курса. Здесь нам не только рассказывают о том, как написать эффективное резюме и куда его отправлять, но и предоставляют возможность практического сотрудничества с опытными специалистами, которые помогают улучшить наше резюме, подготовиться к собеседованиям и многое другое. Они обеспечивают реальную поддержку и помощь при поиске работы и продвижении по карьерной лестнице. Я действительно поражен высоким качеством обучения в Яндекс Практикуме и всеми преимуществами, которые он предлагает. Этот курс является превосходным выбором для тех, кто стремится получить качественное и практическое образование в области, связанной с программированием и разработкой.

      Был ли отзыв полезен?
    • Анатолий 8 августа 2023

      Приветствую всех! Недавно приобрел курс "Аналитик данных" от Яндекс Практикума, и пока ни капли сожаления не испытывал. Выбор пал на данную платформу по следующим основаниям: 1. Отсутствие навязчивой рекламы со стороны блогеров на YouTube 2. Знакомые стартаперы, которые уже прошли другие программы Практикума и остались очень удовлетворены результатами 3. Отсутствие причин усомниться в надежности такой компании как Яндекс Курс организован по модулям, каждый из которых длится две недели. Предоставляется достаточно теоретических материалов, но и практической составляющей еще больше. Хотелось бы отметить профессионализм команды разработчиков курса и их умение доступно разъяснять сложные вопросы (к примеру, теорию вероятностей). Все объяснения идут через примеры, что позволяет гармонично совмещать теорию с практикой. Безусловно, стоит отметить работу специалистов команды Практикума (наставников, кураторов, рецензентов проектов). Все участники высококвалифицированы, крайне вежливы и терпеливы. Лично для меня, будучи человеком без каких-либо технических знаний, порой сталкиваюсь со сложностями, однако стремление освоить новую профессию преобладает, а к тому же команда Яндекса поддерживает в нужный момент. В итоге, моя оценка – 10 из 10.

      Был ли отзыв полезен?
    • Евгения 3 июня 2023

      Решила пройти здесь бесплатные курсы по Backend разработке. Все настолько поверхностно, что даже не описать. Маленькие окошечки с заданиями, которые приходится каждый раз увеличивать, а это неудобно. Выходит, что даже функционал толком не доработан. Все темы из теории очень поверхностны. Ни слова про рекурсию и переменные, а это основа основ. Практики на курсах нет, хоть вам обещают обратное. А ведь это основная задача, только практикой можно закрепить материал. Как можно научиться кодить и запоминать сантаксис? Задачи можно решать разными способами, но если вы напишите решение не так, как забито в компьютере, то результат зачтут как неправильный. Если задачу вы не решите, то к следующему блоку тем вас просто не допустят. Продукт крайне сырой и даже для новичка бесплатный курс это просто трата времени. Разработчики ценятся за знания, в том числе и математические, на курсах Яндекса эти знания вам никто не даст. Не советую трать время.

      Был ли отзыв полезен?
    Посмотреть все отзывы о Яндекс Практикум