Multi-armed bandit problems under periodic observations
山崎和俊(University of Queensland)
大阪大学 数理・データ科学セミナー 金融・保険セミナーシリーズ 第154回
Multi-armed bandit problems under periodic observations
山崎和俊(University of Queensland)
We consider a version of the continuous-time multi-armed bandit problem in which decision opportunities occur at renewal times, and study its Gittins index policy. When the rewards are driven by Lévy processes and decision times follow a Poisson process, the Gittins index can be expressed explicitly in terms of a version of the Wiener–Hopf factorization, and it is shown to converge to that in the classical Lévy bandit model of Kaspi and Mandelbaum (1995). The diffusion and reflected Lévy cases are also examined.
| 講師: | 山崎和俊(University of Queensland) |
|---|---|
| テーマ: | 大阪大学 数理・データ科学セミナー 金融・保険セミナーシリーズ 第154回 |
| 日時: | 2025年12月22日(月) 16:50-18:00 |
| 場所: | 大阪大学豊中キャンパス基礎工学部J棟6階 J617 |
| 参加費: | 無料 |
| 参加方法: | |
| アクセス: | 会場までのアクセスは下記URLをご参照ください。 http://www.es.osaka-u.ac.jp/ja/access.html |
| お問い合せ: | 本ウェブサイトの「お問い合せ」のページをご参照ください。 |
