Теория оптимальных правил "многократной остановки"

  • Автор:
  • Специальность ВАК РФ: 01.01.05
  • Научная степень: Докторская
  • Год защиты: 2000
  • Место защиты: Москва
  • Количество страниц: 127 с.
  • бесплатно скачать автореферат
  • Стоимость: 250 руб.
Титульный лист Теория оптимальных правил "многократной остановки"
Оглавление Теория оптимальных правил "многократной остановки"
Содержание Теория оптимальных правил "многократной остановки"
Глава I. Оптимальные правила многократной останов-

§1.1. Задача оптимальной остановки
§1.2. Постановка задачи многократной остановки
§1.3. Вспомогательные результаты
§1.4. Оптимальные и -оптимальные правила многократной остановки
§1.5. Необходимые и достаточные условия оптимальности правила многократной остановки
§1.6. О способах построения цены игры
§1.7. Марковский случай
Глава II. Некоторые применения к задачам последовательного анализа
§2.1. Оптимальное правило в схеме Бернулли
§2.2. Об одном обобщении задачи наилучшего выбора
§2.3. Задача выбора к объектов с минимальным суммарным рангом
Список литературы

В конце 40-х — начале 50-х годов в статистическом анализе возникло новое направление — последовательный анализ Вальда. Идея этого подхода оказалась очень плодотворной и на ее основе сформировалась новая ветвь статистики (А.Вальд [1], А.Вальд, Дж.Волфовиц [2] и К.Дж.Арроу, Д.Блекуэлл, М.А.Гиршик [3]). Под влиянием этого направления возникла также и задача оптимальной остановки случайных процессов, сформулированная Дж. Снеллом [4] следующим образом.
Пусть на некотором вероятностном пространстве (О, Т, Р) заданы неубывающая последовательность «т-подалгебр С Л "А С и последовательность „-измеримых случайных
величин Хп = Хп(и),п = 0,1,2, Обозначим С = {т} совокупность
случайных величин со значениями из множества {0,1,2.., +оо} и таких, что Р(т < оо) = 1 и {ш : т(ш) — п} в Тп. Такие случайные величины называются моментами остановки, задающими правила остановки процесса Хп. Если интерпретировать Хп как ’’выигрыш”, который получается при остановке в момент времени п, а ЕХГ — как средний выигрыш по правилу остановки т, то основные задачи теории оптимальных правил остановки состоят в нахождении цены V = вир ЕХТ и

е-оптималъных правил те(е 0), т.е. таких моментов, для которых ЕХГе + £ V. В случае £ = 0 момент т* = то называют оптимальным. Исходя из теории мартингалов Дж.Снелл (при достаточно широких предположениях) показал, что цена V есть ЕНо> гДе (ип,Тп)

—минимальный регулярный супермартингал, мажорирующий {Хп}, а момент те = т£{п 0 : 11п Хп + е} является е-оптимальным (е > 0).
В работах И.Чао и Г.Роббинса [5] - [7], Г.Хаггстрома [8], Д.Сиг-мунда [9], Л.Шеппа [10] и др. получено обобщение результатов Снелла, найдены решения некоторых задач последовательного анализа. Так ими, в частности, установлено, что если Сп С С есть класс моментов остановки такой, что Р(т ) и) = 1 и /я езэвир Е(ХГ|Хп), то
теС„
”п-цена” ип = вир ЕХТ равна Е/„, а г-оптимальный момент оста-
тесп
новки те = т!:{п 0 : /„ Хп + е}, при этом последовательность {/„} совпадает (при некоторых предположениях) с минимальным регулярным супермартингалом {11п}, мажорирующим последовательность {Хи}. Можно сказать, общая теория оптимальных правил остановки случайных процессов с дискретным временем достигла почти окончательного вида (см. книгу Г.Роббинса, Д.Сигмунда, И.Чао [11] и библиографию там же).
В рассмотренную схему входит и тот случай, когда величины Хп представлены в виде Хп = дп{£о, £ь , £п)> где {£«} — некоторая последовательность, причем наибольший интерес представляет случай, когда последовательность {£„} является марковской. Общая теория марковского случая (с дискретным и непрерывным временем) построена, в основном, в работах Е.Дынкина [12], А.Ширяева и Б.Григелиониса [13], Б.Григелиониса [14]. Именно эта модель детально исследована в книге А.Ширяева [15]. А.Факеев [16] разработал теорию оптимальных правил остановки для процессов с непрерывным временем.

рекуррентному соотношению, что и {уп}, но в общем случае равенства уп = у'п не выполняются. Однако справедлива следующая теорема. Теорема 1.1.4. Пусть для любого правила остановки т
тогда у'п = уп ии'п = ип, п — 1,2,
Желательно, конечно, иметь легко проверяемые условия на последовательность {Хп, ГТ1}_1, из которых вытекает условие (1.1.5) и, следовательно, утверждения теоремы 1.1.4. Для выполнения (1.1.5) достаточно равномерной интегрируемости последовательности Х1, Хг

Будем говорить, что имеет место случай независимых наблюдений, если Хп+ не зависит от Тп, п — 1,2, — В этом случае ХХг
Теорема 1.1.5. Пусть имеет место случай независимых наблюдений. Тогда
а) случайные величины 71,72, являются независимыми;
б) 7„ = тах{Хи,ип+], ип = Е(гаах{Хп,г„+1}), п = 1,2,..;
в) Т* = пД{п 1 : Хп ип+1};
г) тм = тт{те 1 : Хп является оптимальным в См, где положим л$+1 = —оо и = Е(тах{Хп,л)_1}).
4. В заключение рассмотрим достаточно подробно классическую
(1.1.5)

Рекомендуемые диссертации данного раздела