26980

Автор(ы): 

Автор(ов): 

1

Параметры публикации

Тип публикации: 

Доклад

Название: 

Алгоритмы зеркального спуска в задачах о многоруком бандите

Электронная публикация: 

Да

Наименование конференции: 

  • Спец-семинар «Стохастический анализ в задачах» (2013, Москва)

Наименование источника: 

  • Труды Спец-семинара "Стохастический анализ в задачах" (Москва, 2013)

Город: 

  • Москва

Издательство: 

  • Math-Net.Ru

Год издания: 

2013

Страницы: 

http://www.mathnet.ru/php/seminars.phtml?option_lang=rus&presentid=6516
Аннотация
Рассматриваются две стохастические задачи о многоруком бандите. Одна «классическая», с конечным числом действий и со случайными потерями (в частном случае, бинарными, принимающими значения 0 или 1). Другая задача, как обобщение предыдущей, содержит потери, зависящие еще и от состояния наблюдаемой стационарной конечной марковской цепи. На основе оптимизационного подхода получены рекуррентные алгоритмы зеркального спуска. Доказаны верхние границы превышения средних потерь над их минимальным значением. Обсуждаются также и нижние границы для этих задач. Доказывается, что верхние и нижние границы совпадают с точностью до логарифмического множителя.

Библиографическая ссылка: 

Назин А.В. Алгоритмы зеркального спуска в задачах о многоруком бандите / Труды Спец-семинара "Стохастический анализ в задачах" (Москва, 2013). М.: Math-Net.Ru, 2013. С. http://www.mathnet.ru/php/seminars.phtml?option_lang=rus&presentid=6516.