Data Scientist: с нуля до middle от Нетология

    Нетология
    Стоимость курса
    315 000 Р
    163 800 Р
    Рассрочка
    от 4 550 Р в месяц
    Длительность
    20 месяцев
    Сертификат
    Да
    Начало курса
    В любой момент
    Трудоустройство
    Содействие

    Кому подойдет

    • Для тех, кто хочет освоить профессию Data Scientist

    Чему Вы научитесь

    • Получать данные с помощью SQL из различных источников, выгружать их в нужном формате. Создавать собственные БД, работать с хранимыми процедурами и функциями
    • Очищать и преобразовывать данные, проверять гипотезы, находить скрытые закономерности, визуализировать результаты
    • Освоите необходимый математический аппарат для решения задач машинного обучения и построения нейросетей
    • Конструировать признаки, строить классические модели машинного обучения, временные ряды и создавать рекомендательные системы
    • Проверять гипотезы, строить нейронную сеть, выявлять скрытые аномалии в данных
    • Формулировать гипотезы, выявлять потребности, структурировать и визуализировать результаты

    Программа обучения

    1 ступень. Погружение

    На первом этапе вы разберётесь, что такое аналитическое мышление, и узнаете, откуда берутся данные. Научитесь определять ключевые продуктовые метрики и создавать дашборды.

    Аналитическое мышление

    Научитесь думать как аналитик и формулировать гипотезы для проверки. Поймёте, что аналитика строится вокруг данных. Познакомитесь с базовым инструментом аналитика и сможете проводить в нём простой анализ данных.

    • Что такое аналитическое мышление
    • Введение в Google-таблицы
    • Продвинутые Google-таблицы
    • Основы статистики
    • Откуда берутся данные
    • Продвинутая визуализация данных
    • Python как инструмент анализа данных
    • Машинное обучение для жизни

    Основы практической статистики

    Познакомитесь со статистическими показателями, научитесь проводить статистический анализ данных и проверять гипотезы с помощью различных инструментов.

    • Что такое статистика и для чего она нужна
    • Основные статистические показатели, виды распределений данных, корреляция
    • Взаимосвязи данных и формулирование гипотез по SMART
    • Статистические критерии в Google Таблицах. Проверка гипотез и формулирование выводов

    Основы визуализации данных

    Поймёте, как создавать наглядные визуализации, откуда берутся данные для визуализации и как с ними работать. Узнаете, как создавать истории с помощью данных.

    • Как донести информацию с помощью изображений
    • Инструменты, источники и предподготовка данных
    • Исследование данных и основы статистики
    • Продвинутая визуализация данных
    • Сторителлинг в визуализации

    2 ступень. SQL, Python и Big Data

    Вы освоите ключевые навыки специалиста в Data Science для старта в профессии и сможете искать работу на младшей позиции уже после прохождения второй ступени.

    SQL и получение данных

    В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.

    • Архитектура и структура баз данных (БД)
    • Простые запросы, join`s, агрегаты
    • Базовые команды в SQL и встроеные аналитические функции
    • Импорт и экспорт данных посредством SQL и ETL программ
    • Принципы работы с различными БД
    • Основные библиотеки для подключения к БД из Python
    • Функции SQL и их аналоги в pandas
    • Консоль: знакомство, основные операторы, утилита psql
    • Архитектура и проектирование
    • Нормализация
    • Зависимости
    • Подготовка и сдача итогового проекта

    Аналитика больших данных

    Узнаете, как собрать и управлять командой Big Data-проекта. Освоите подход CRISP-DM, определите компетенции и состав команды. Определите, сколько данных вам нужно для нахождения инсайтов. Найдёте задачи под Big Data в своей компании. Поймёте, как и по каким правилам хранить данные. Сможете обосновывать влияние на сбор данных, мониторинг и отчётность.

    • Что такое большие данные
    • Монетизация больших данных
    • Характеристики и источники данных
    • Культура сбора данных
    • Основы реализации проектов больших данных. Кейс-стади
    • Основные характеристики больших данных и виды анализа данных. Продвинутые методы анализа больших данных
    • NoSQL-подход
    • MapReduce-подход
    • Введение в Hadoop
    • Практическое задание по аналитике данных и его разбор

    Python для анализа данных

    Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.

    • Базовые типы данных и циклы
    • Функции и классы
    • Продвинутые типы данных: массивы, множества, словари
    • Библиотеки для анализа данных: NumPy, Pandas, Matplotlib
    • Визуализация в Python
    • Базовые понятия статистики
    • Случайные события. Случайные величины
    • Логистическая регрессия и дискриминационный анализ
    • Корреляция и корреляционный анализ
    • Доверительные интервалы. Статистическая проверка гипотез для несвязанных выборок
    • Дисперсионный анализ и виды ошибок. А/В-тесты

    Математика для анализа данных

    Изучите основные операции с векторами, матричными операциями. Рассмотрите генетические алгоритмы, алгоритм дифференциальной эволюции. Узнаете, что такое математическое ожидание, дисперсия и моменты старших порядков. Изучите закон больших чисел.

    • Линейная алгебра. Вектора
    • Линейная алгебра. Матрицы
    • Продвинутая линейная алгебра
    • Математический анализ. Производная
    • Производная функции нескольких аргументов
    • Теория оптимизации
    • Теория вероятностей. Дискретные и непрерывные случайные величины
    • Центральная предельная теорема и закон больших чисел

    Работа с признаками и построение моделей

    Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и Pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации.

    • Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
    • Классификация: логистическая регрессия и SVM
    • Функции потерь и оптимизация
    • Оценка точности модели, переобучение, регуляризация
    • Проблема качества данных
    • Работа с пропусками и переменными

    Тренировочные собеседования по SQL и Python

    На вебинарах с экспертами мы предложим вам аналоги тестовых заданий для соискателей на позиции в аналитике данных и Data Science. Сначала вы попробуете решить задание самостоятельно, а потом разберёте его с экспертом. В результате вы:

    • Поймёте, как не теряться при работе с абсолютно незнакомыми данными
    • Научитесь выбирать и использовать инструменты в соответствии с поставленной задачей
    • Подготовитесь психологически к решению тестовых заданий на собеседовании

    Программа трудоустройства

    Научитесь оформлять резюме и портфолио, справляться со сложными вопросами на собеседовании и искать актуальные вакансии. Центр развития карьеры отправит ваше резюме партнёрам Нетологии и будет присылать подборки подходящих вакансий.

    • Узнаете, как составить резюме, оформить портфолио и написать сопроводительное письмо так, чтобы вас пригласили на собеседование
    • Научитесь презентовать себя и отвечать на самые каверзные вопросы на интервью
    • Разберётесь, как и на каких площадках ищут работу IT-специалисты
    • Рассмотрите вакансии и стажировки от наших партнёров
    • Получите приглашение в сообщество выпускников, где сможете поделиться своими успехами, воспользоваться советами и поддержкой

    3 ступень. Deep Learning и нейронные сети

    Получите расширенные знания в профессии и научитесь работать с нейронными сетями. Начнёте повышать свою квалификацию. После окончания этой ступени сможете наработать навыки уровня middle и претендовать на большее количество вакансий.

    Рекомендательные системы

    В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.

    • Неперсонализированные рекомендательные системы
    • Сontent-based-рекомендации
    • Collaborative Filtering
    • Гибридные алгоритмы

    Временные ряды

    Вы изучите элементарные алгоритмы обработки временных рядов, модели ARIMA и GARCH, прогнозирование значений на их основе. Узнаете, что такое марковские случайные процессы и марковские модели для временных рядов.

    • Знакомство с временными рядами
    • Элементарные методы анализа временных рядов
    • Модели ARMA
    • Модели авторегрессии условной гетероскедастичности
    • Сингулярный спектральный анализ
    • Случайные марковские процессы
    • Нейронные сети в анализе временных рядов
    • Поиск изменений во временном ряде

    Нейронные сети

    Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP.

    • Введение в нейронные сети и библиотеку Keras
    • Углубление в нейронные сети и библиотеку Keras
    • Введение в свёрточные нейронные сети
    • Введение в рекуррентные сети
    • Автокодировщики
    • Введение в генеративно-состязательные сети

    Компьютерное зрение

    Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов.

    • Выделение признаков и поиск похожих изображений
    • Сегментация и детекция объектов
    • Свёрточные нейронные сети
    • Обучение свёрточной сети на практике
    • Задачи детекции и сегментации
    • Рекуррентные нейронные сети в задачах компьютерного зрения (Image Captioning)
    • Порождающие модели

    Обработка естественного языка

    Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.

    • Введение в автоматическую обработку текста
    • Структура слова. Морфология
    • Синтаксический анализ
    • Дистрибутивная семантика
    • Извлечение ключевых слов
    • Словари. Подкрепление знаний
    • Тематическое моделирование
    • Информационный поиск
    • Классификация в АОТ
    • Языковые модели
    • Извлечение информации

    Deep Learning

    Научитесь работать с многомерными свёртками, овладеете конкурентным преимуществом в задачах с использованием Beam-Search и Teacher Forcing, сможете реализовывать NLP с нуля. Сможете отличать дискриминатор от генератора и обучать генератор выбирать данные из линейной регрессии. Реализуете сеть генерации покемонов и обучите её.

    • Регрессия и персептрон
    • Многослойная нейронная сеть: регуляризация, градиентный спуск, ускорение обучения
    • Свёрточные сети: свёрточные архитектуры, многомерные свертки, сегментация
    • Рекуррентные сети: RNN, GRU и LSTM, Encoder-Decoder архитектура
    • Внимание: Dense Attention и Beam search
    • Компьютерное зрение: SSD, Region Based CNN, Faster R-CNN, Masked R-CNN, UNet, перенос стиля и FCN
    • Работа с текстом: языковые модели, Embeddings, Word2Wec, FastText, NER, Transformer, BERT и Elmo
    • GAN’ы: дискриминатор, генератор, продвинутые архитектуры

    Финальный хакатон и Kaggle Competitions

    В составе мини-команды за ограниченное время на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.

    Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.

    Английский для специалистов по работе с данными

    Научитесь разбираться в аналитических терминах и читать иностранную техническую документацию. Сможете презентовать результаты анализа с помощью графиков и диаграмм на английском языке. Узнаете, как эффективно готовиться к собеседованиям в зарубежные компании. Научитесь составлять убедительное резюме и писать сопроводительное письмо.

    • Словарь терминов аналитика с примерами употребления и типичными словосочетаниями
    • Важная лексика для работы с датасетами
    • Презентация результатов анализа
    • Чтение технической документации
    • Самопрезентация. Elevator Pitch
    • Прохождение собеседований
    • Резюме и сопроводительное письмо (CV & сover letter)
    • Email-переписка
    • Общение в технических чатах
    • Как вести звонки и встречи
    • Как учить лексику
    • Как учить грамматику

    4 ступень. Специализация на выбор

    Углубитесь в особенности работы с медицинскими и промышленными данными, решите типичные для этих сфер задачи. Специализированные навыки повысят вашу профессиональную ценность и позволят выделиться на рынке труда. Получить полезный опыт в промышленном Data Science поможет стажировка в компании «Северсталь.Диджитал».

    Data Science в медицине

    Разберётесь в направлениях работы с данными. Познакомитесь со спецификой работы с разными типами медданных: табличными, текстовыми и снимками, попрактикуетесь в решении реальных задач. Узнаете, как устроены бизнес-процессы в медицине и как наладить коммуникацию с врачами и заказчиками.

    • Обзор исследовательских компаний, баз данных и основных поставщиков данных в медицине
    • Особенности структуры данных в медицине, принципы хранения и работы с такими данными
    • МДЛП — система маркировки лекарственных средств, влияние и роль системы на медицинскую отрасль, особенности работы и хранения подобных данных
    • ЕМИАС — Единая медицинская информационно-аналитическая система, особенность системы, примеры работы и хранения подобных данных
    • Анализ клинических рекомендаций Минздрава в разрезе нозологий, классификации МКБ, классификации болезней
    • CV и ML для обработки медицинских снимков МРТ, рентген, результатов анализов
    • NLP для обработки медицинских текстов
    • Юридические аспекты работы с медицинскими данными
    • Подготовка и сдача итогового проекта

    Дипломный проект «Data Scientist в медицине»

    Вы построите ML-модель для решения задач в сфере медицины.

    Это может быть система по предсказания динамики продаж лекарственных средств в аптеках, распознаванию медицинских объектов на изображениях, прогнозирование распространения заболеваний с помощью анализа временных рядов или извлечение медицинских сведений из неструктурированного текста.

    Предусмотрена индивидуальная часовая консультация с ментором по итоговой работе.

    Data Science в промышленности

    Научитесь обрабатывать данные с датчиков на промышленном оборудовании. Узнаете, как спроектировать решение, чтобы его было проще тиражировать. Рассмотрите основные кейсы в промышленном CV. Поймёте, какие алгоритмы применяются в каждом типе задач в зависимости от количества данных на входе, типов детектируемых событий и производственного процесса. Узнаете, как подобрать камеры, освещение и серверное оборудование.

    • Методика разработки Data Science-продуктов в промышленности. Особенности работы с промышленными данными
    • Причинно-следственный анализ в машинном обучении: causal inference
    • Оптимизационные задачи, алгоритмы и инструменты оптимизации
    • Фреймворки для разных типов CV-задач в промышленности: на что обращать внимание при выборе
    • ML и физика: основные подходы для объединения двух типов моделей: физических уравнений процесса и ML
    • Основные варианты размещения оборудования в промышленности и архитектура решения, которая за этим стоит
    • EDA для промышленности
    • Сложные задачи и вывод CV-моделей в продуктив
    • Продвинутые задачи: сбор данных при их практическом отсутствии, различные способы синтеза данных, обучение на синтетических данных

    Дипломный проект «Data Science в промышленности»

    Самостоятельно сделаете решение по определению посторонних предметов на конвейерах — от EDA до оптимизированной модели, готовой к выводу в продуктив.

    Предусмотрена индивидуальная часовая консультация с ментором по итоговой работе.

    Отзывы о курсе 1

    Сортировать:
    Дате публикации
    • Дата публикации
    • Популярности
    • Сначала положительные
    • Сначала отрицательные
    • Анна 13 января 2024

      Хочется отметить очень хорошее сопровождение от преподавателей на курсе, ответы на все вопросы даются очень оперативно и полно. Много информации по питону для анализа данных, А/В тестирование, оконные функции в sql и др. Пока состав программы полностью устраивает. Уже применяю знания по визуализации данных, обработке в питоне и sql.

      Был ли отзыв полезен?

    Отзывы о школе 11

    4.7 из 5
    9
    1
    1
    0
    0
    Сортировать:
    Дате публикации
    • Дата публикации
    • Популярности
    • Сначала положительные
    • Сначала отрицательные
    • Светлана 12 октября 2023

      Приветствую! Я очень довольна, что прошла курс "Веб-дизайнер" на онлайн-платформе Нетологии. Мой курс был весьма компактным и предоставил основные знания веб-дизайна. Однако, я хотела бы подчеркнуть, что этот курс помогает лишь ознакомиться с основами и не заставит вас мгновенно стать UX/UI-дизайнером. В ходе обучения пришлось активно "гуглить" множество информации, чтобы разобраться в различных темах. Лично для меня это было правильным подходом, поскольку только так можно достичь глубокого понимания темы. То есть, никто не будет все жевать и подавать на блюдечке - нужно самостоятельно проявлять усердие и гибкость мышления. Хочу отметить, что я начала этот курс с абсолютного нуля, полностью не подготовленная, и изначально мне было довольно сложно. Однако, к середине и особенно к концу я почувствовала себя очень уверенной. Что касается обратной связи и отклика со стороны преподавателей, у меня лично нет никаких претензий. Преподаватели всегда давали развёрнутые ответы и были отзывчивыми, предоставляли дополнительные материалы для более глубокого понимания и поддерживали личный контакт для решения вопросов, возникающих в процессе выполнения домашних заданий. Некоторым не нравился определенный преподаватель, но я лично не столкнулась с такими проблемами или вопросами. Что касается самой онлайн-платформы, она очень удобная. Да, может быть, оформление простое, но поверьте, в процессе обучения нет необходимости в лишней мишуре. Я легко пользуюсь платформой. Кроме того, я нахожу замечательным, что доступны различные бесплатные мини-курсы. Огромное спасибо Нетологии!

      Был ли отзыв полезен?
    • Леонид 8 августа 2023

      Я успешно завершил программу обучения "Project Manager" в онлайн-академии Нетология и остался весьма удовлетворен результатом. Этот курс предоставляет обширную информацию и является ценным ресурсом для людей, стремящихся сменить свою профессию или повысить уровень квалификации. Преподаватели программы являются опытными практиками со значительным багажом знаний в своих областях. Участникам курса предоставляется доступ к обширной базе знаний, а также возможность просмотра записей всех проведенных лекций. Это позволяет не пропустить важную информацию или повторить материал, если это необходимо (чем я с удовольствием воспользовался и не раз). В процессе обучения при возникновении вопросов участники могут обращаться к координатору курса. Она эффективно реагирует на запросы и дает ответы даже на выходных днях. Когда планируете пройти это обучение, имейте в виду, что требуется уделять ему 1-2 часа в день, так как расписание занятий достаточно насыщенное. Вам придется выполнять домашние задания, как индивидуальные, так и групповые. Рекомендуется начать работу над итоговой дипломной работой заблаговременно и продолжать ее на протяжении всего курса.

      Был ли отзыв полезен?
    • Вероника 3 июня 2023

      Я всегда относилась скептически к платным курсам, но желание сменить сферу деятельности взяло вверх над моими убеждениями. Точнее в Нетологию я попала по просьбе руководителя, мне предложили должность "Менеджер проектов".  Видио уроки это просто лекции, которые записаны в аудитории института. То есть качество изображения и звука оставляет желать лучшего. После просмотренных лекций необходимо выполнить домашнее задание, на которое даётся неделя. А вот проверка занимает иногда до месяца. Заплатив 75к ждешь более развернутой информации, участия и поддержки кураторов, преподавателей. Никаких тебе вебинаров, где можно было разобрать материал. Хочешь узнать новое - ищи сам. Конечно есть курсы с элективами они более продвинуты и стоимость выше. Плюс: доступ к личному кабинету остается у вас после окончания учебы. В любой момент можно пересмотреть материал. Такой курс научил меня новому, но этого мало, чтобы сменить профессию. Они созданы для знакомства с ней, но не более того. 

      Был ли отзыв полезен?
    Посмотреть все отзывы о Нетология