Reinforcement Learning от Otus

    Otus
    Стоимость курса
    68 000 Р
    Длительность
    3 месяца
    Сертификат
    Да
    Начало курса
    В любой момент
    Трудоустройство
    Нет

    Кому подойдет

    • Для DS/DL/ML специалистов, которые хотят погрузиться в алгоритмы обучения с подкреплением

    Чему Вы научитесь

    • Овладеете основными алгоритмами RL, такими как Q-learning, SARSA, Monte Carlo
    • Научитесь строить модель среды и агента, а также проводить обучение на простых игровых сценариях
    • Изучите Deep RL и алгоритмы с использование нейросетей, такие как Deep Q-Network (DQN), Policy Gradient (PG), Deep Deterministic Policy Gradient (DDPG), Actor-Critic, и сможете реализовать их в своих проектах
    • Познакомитесь с продвинутыми темами в Reinforcement Learning, такими как оптимальное управление, методы обучения со скользящим горизонтом, Model-based RL
    • Научитесь применять RL для решения конкретных задач и понимать, как это применение работает на практике

    Программа обучения

    Введение в Reinforcement Learning

    Модуль начинается с общего введения, охватывает ключевые особенности обучения с подкреплением, основные алгоритмы. Вы рассмотрите, как построить модель окружения и агента, и примените свои знания на простых сценариях.

    • Тема 1: Знакомство с Reinforcement Learning
    • Тема 2: Основы работы с командной строкой, практика разработки ПО и глубокого обучения
    • Тема 3: Ключевые понятия RL: агент, среда, награда, политика
    • Тема 4: Построение модели среды и агента
    • Тема 5: Основные алгоритмы RL: Q-learning, SARSA, Monte Carlo
    • Тема 6: Обучение на простых игровых сценариях

    Deep Reinforcement Learning

    В этом модуле вы рассмотрите введение в глубокое обучение с подкреплением, которое объясняет значимость глубоких Q-сетей, представляет алгоритмы на основе политик. Затем объединяет методы на основе политик и значений с использованием алгоритма Actor-Critic. И, наконец, охватывает то, как нейронные сети могут использоваться для аппроксимации функций вознаграждения и политик.

    • Тема 1: Введение в Deep Reinforcement Learning
    • Тема 2: Deep Q-Network (DQN) алгоритм
    • Тема 3: Policy Gradient (PG) алгоритм
    • Тема 4: Actor-Critic алгоритм

    Advanced Reinforcement Learning

    Модуль содержит более сложные темы и глубже раскрывает пройденный материал.

    • Тема 1: Обучение с использованием модели среды (model-based rl)
    • Тема 2: Частично наблюдаемые среды
    • Тема 3: Иерархическое обучение с подкреплением
    • Тема 4: Многоагентное обучение и кооперация агентов

    Применение RL в реальных задачах

    Обзорный модуль с разбором самых интересных кейсов по применению RL.

    • Тема 1: Применение RL в игровой индустрии
    • Тема 2: Применение RL в робототехнике
    • Тема 3: Применение RL в управлении энергетическими системами
    • Тема 4: Применение RL в управлении финансовым портфелем

    Проектная работа

    Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.

    • Тема 1: Выбор темы и организация проектной работы
    • Тема 2: Консультация по проектам и домашним заданиям
    • Тема 3: Защита проектных работ. Подведение итогов курса

    Отзывы о школе 11

    4.6 из 5
    8
    1
    0
    1
    0
    Сортировать:
    Дате публикации
    • Дата публикации
    • Популярности
    • Сначала положительные
    • Сначала отрицательные
    • Антонина 12 октября 2023

      Я решила выбрать курс Symfony здесь, потому что ранее прошла другое обучение и была впечатлена организацией в этой школе. Здесь проводятся вебинары, предоставляется множество практических заданий, и интересные задания на дом. Программа курса новая и информативная. При этом Каморин Михаил является преподавателем этого курса. В нем сочетаются высокая квалификация, педагогическое мастерство и ответственность. Уроки тщательно структурированы, а примеры всегда применимы и интересны. Каждый вебинар сопровождается скриптом, позволяющий повторить все материалы занятия. Ценным является обратная связь, которую мы получаем по любым вопросам, возникающие у нас. Мы получаем тщательный анализ выполненного задания, а также множество советов о том, как его можно улучшить и выполнить правильно. Только что закончился курс, и я еще не начала искать работу, но я уверена: благодаря этому курсу я уже имею прочный фундамент знаний и практического опыта. Я уверена, что найду работу благодаря полученным навыкам. Хочу выразить благодарность всей команде OTUS за их работу!

      Был ли отзыв полезен?
    • Арсений 8 августа 2023

      Решив попробовать свои силы в разработке Android-приложений, я столкнулся с отсутствием опыта в программировании. Я решил приобрести обучающий курс "Специалитет" на платформе Otus, который включал в себя как базовый, так и продвинутый уровни. Однако, я бы рекомендовал новичкам начать с базового курса, так как для продвинутого уже нужен опыт работы над реальными проектами. Обучение на курсе было увлекательным, и я хотел бы выразить благодарность преподавателям и менеджерам, которые были всегда готовы помочь в случае возникновения проблем в процессе обучения. Базовый курс помог мне хорошо разобраться в устройстве и особенностях разработки приложений для платформы Android. Конечно, на лекциях невозможно получить исчерпывающую информацию, поэтому вам придется проводить много времени в поиске дополнительных материалов, чтении документации и так далее, но преподаватели всегда предоставляли ссылки на нужные материалы для продвижения по курсу. Также я рекомендую тем, кто не может быстро понять все аспекты разработки сразу, начать с бесплатного короткого курса по подготовке, которые многочисленно представлены в интернете, чтобы более гладко и быстро войти в процесс обучения с нуля и создавать свой собственный масштабный проект.

      Был ли отзыв полезен?
    • Константин 8 июня 2023

      Чисто для себя решил изучить администрирование Linux. Тем более что основы Python мне знакомы, и я ими владею. Менеджеру большой привет, свою работу он делает хорошо. Это он уговорил и заставил поверить, что сложностей у меня не возникнет. Азы же программирования мне известны. В Linux я не работал никогда и абсолютно в ней не разбираюсь. У меня изначально с этой операционкой не сложились отношения, она никак толком не хотела работать на моем стареньком ноуте. Общение в Слаке было никаким, большого энтузиазма у присутствующих оно не вызывало. Тоже самое могу сказать и про Телегу. Преподаватели отвечали на вопросы, но как-то уж очень кратко, без особых вниканий в детали. О том, что Linux надо хоть как-то знать, мне не сообщили. А ведь предупреждал, что с ним не знаком. Освоил его по ссылке самостоятельно, тем самым безбожно отстав от остальных ребят. Курс администрирования давался мне очень тяжело. На мой взгляд, там очень много недоработок и квалификация преподавателей оставляет желать лучшего. Не советую.

      Был ли отзыв полезен?
    Посмотреть все отзывы о Otus