URSS.ru Магазин научной книги
Обложка Афанасьев В.Н. Дифференциальные игры в задачах управления неопределенными объектами Обложка Афанасьев В.Н. Дифференциальные игры в задачах управления неопределенными объектами
Id: 299828
999 р.

Дифференциальные игры в задачах управления неопределенными объектами

URSS. 2023. 402 с. ISBN 978-5-9710-6630-9.
Белая офсетная бумага
  • Твердый переплет
Методы аналитического конструирования оптимальных систем управления - Принцип минимакса Понтрягина в задачах дифференциальных игр - Дифференциальные игры в задачах управления неопределенными системами - Концепция гарантирующего управления неопределенными системами - Отдельные примеры реализации метода дифференциальных игр в задаче управления неопределенными объектами.

Аннотация

В книге рассматриваются управляемые неопределенные системы, поведение которых описывается нелинейными дифференциальными включениями с нечетко заданными начальными условиями. Применение классических методов, основанных на предположении, что все характеристики системы и возмущающих воздействий известны, либо сопряжено с большими вычислительными трудностями, либо не представляется возможным. Возникает необходимость развития таких методов, которые... (Подробнее)


Оглавление
top
Предисловие9
Введение11
Список обозначений15
Предварительные понятия и определения17
Глава 1. Методы аналитического конструирования оптимальных систем управления28
1. Математические модели динамических неопределенных объектов28
2. Метод расширенной линеаризации35
2.1. Постановка задачи35
2.2. Задача оптимального управления с заданным временем окончания переходного процесса41
2.3. Задача оптимального управления в неопределенный момент окончания переходного процесса49
2.4. Алгебраическое уравнение Риккати с параметрами, зависящими от состояния52
3. Принцип максимума Л. С. Понтрягина56
3.1. Постановка задачи56
3.2. Необходимые условия оптимальности57
3.3. Задача со свободным правым концом и заданным временем окончания переходного процесса63
3.4. Связь принципа максимума Л. С. Понтрягина и классическим вариационным исчислением66
3.5. Задача об оптимальном быстродействии67
3.6. Задача на оптимум расхода ресурсов73
3.7. Некоторые замечания по принципу максимума (минимума)79
4. Дифференциальные игры81
4.1. Основной результат теории игр82
4.2. Дифференциальная игра84
4.3. Дифференциальная игра как проблема оптимального управления86
5. Метод динамического программирования89
5.1. Постановка задачи89
5.2. Уравнение Беллмана92
5.3. Связь метода динамического программирования с принципом максимума (минимума) Л. С. Понтрягина94
5.4. Существование и единственность решения задачи Коши для уравнения Беллмана95
5.5. Достаточные условия оптимальности101
5.6. Линейно-квадратичная задача102
5.7. Управление на неограниченном интервале времени108
5.7.1. Задача стабилизации нелинейного объекта108
5.7.2. Задача с нефиксированным временем окончания переходного процесса112
Глава 2. Принцип минимакса Понтрягина в задачах дифференциальных игр114
1. Постановка задачи114
2. Задача со свободным правым концом и заданным временем переходного процесса117
3. Достаточные условия локального минимума в задаче дифференциальной игры при заданном времени переходного процесса126
3.1. Непрерывный закон управления с обратной связью127
3.2. Достаточные условия локального минимума132
4. Задача с фиксированными значениями некоторых переменных состояния в заданный момент окончания переходного процесса139
5. Оптимальные стратегии в случае гладкой функции цены144
6. Задача об оптимальном быстродействии146
6.1. О совместном действии игроков147
6.2. О самостоятельных действиях игроков156
7. Задача на минимум времени перехвата с ограничениями на управления161
8. Задача на оптимум расхода ресурсов163
9. Общие замечания к принципу минимакса Понтрягина171
Глава 3. Дифференциальные игры в задачах управления неопределенными системами173
1. Постановка задачи173
2. Уравнение Беллмана—Айзекса177
3. Единственность минимаксного решения задачи Коши для уравнения Беллмана—Айзекса178
4. Верхние и нижние решения уравнения Беллмана—Айзекса180
5. Оптимальное значение стоимости дифференциальной игры с нулевой сумой184
6. Оптимальность стратегий, экстремальных к значению стоимости дифференциальной игры с нулевой суммой186
7. Оптимальные игры на оптимум времени193
7.1. Задача с фиксированными значениями некоторых переменных в неопределенный момент окончания переходного процесса193
7.2. Задача дифференциальной игры быстродействия197
7.3. Метод позиционных игр в задаче быстродействия198
8. О существовании решений задачи дифференциальной игры202
9. Проблема синтеза для дискретных систем. Схема Беллмана204
9.1. Дифференциальные игры в задачах с неопределенным объектом и квадратическим функционалом качества210
10. Постановка задачи211
11. Оптимальное решение задачи дифференциальной игры213
12. Метод «расширенной» линеаризации217
13. Уравнение Риккати с параметрами, зависящими от состояния219
13.1. Задача с заданным временем окончания переходного процесса219
13.2. Задача с неопределенным временем окончания переходного процесса (субоптимальное управление)222
Глава 4. Концепция гарантирующего управления неопределенными системами226
1. Дифференциальная игра с нелинейным объектом с неполной информацией о параметрах226
1.1. Постановка задачи226
1.2. Уравнение Беллмана—Айзекса230
1.3. Единственность минимаксного решения задачи Коши для уравнения Беллмана—Айзекса231
2. Верхние и нижние решения уравнения Беллмана—Айзекса. Гарантирующее управление232
2.1. Определение гарантирующего управления232
2.2. Зависимость решений нелинейного неопределенного дифференциального уравнения от начальных условий235
2.3. Метод «замороженных параметров»239
3. Условия существования стабилизирующего управления, построенного SDRE-методом249
3.1. Условие равномерной асимптотической устойчивости249
3.2. Мажорирующая модель и общее условие выполнения нижнего решения игры261
3.3. Параметры системы, обеспечивающие существование нижнего решения игры264
4. «Коридор» отклонений решений в задаче дифференциальной игры с конечным временем переходного процесса270
5. Гарантирующее управление в задаче парирования возмущений272
6. Гарантирующее управление в задаче с фиксированными значениями некоторых переменных состояния в заданный момент окончания переходного процесса278
7. Регулятор с дискретным изменением параметров281
7.1. Задача дифференциальной игры282
7.2. Задача управления с разомкнутым контуром по возмущениям286
8. Алгоритмический метод поиска параметров регулятора287
Выводы291
Глава 5. Отдельные примеры реализации метода дифференциальных игр в задаче управления неопределенными объектами293
1. Задача слежения при действии ограниченных возмущений. Алгебраический метод синтеза293
Введение294
1.1. Задача слежения при действии возмущающих сил295
1.1.1. Постановка задачи295
1.1.2. Оптимальное решение задачи дифференциальной игры297
1.2. Алгебраический метод решения уравнения Беллмана—Айзекса301
1.2.1. Лемма о методе решения скалярного нелинейного функционального уравнения специального вида301
1.2.2. Применение леммы 5.1.2 при решении уравнения Беллмана—Айзекса304
1.3. Моделирование системы уравнений Лотки—Вольтерра308
Заключение311
2. Параметрическая оптимизация нелинейных систем, представляемых моделями с использованием метода «расширенной линеаризации»312
Введение312
2.1. Задача оптимального управления нелинейным детерминированным объектом313
2.1.1. Задача с заданным временем окончания переходного процесса314
2.1.2. Задача с неопределенным временем окончания переходного процесса316
2.2. Метод «расширенной линеаризации» в задаче синтеза управлений317
2.2.1. SDC-представление нелинейной системы317
2.2.2. Задача с заданным временем окончания переходного процесса318
2.2.3. Задача с неопределенным временем окончания переходного процесса (субоптимальное управление)320
2.3. Конструирование алгоритмов оптимизации нелинейных неопределенных систем управления322
2.3.1. Общая структура алгоритмов параметрической оптимизации нелинейных неопределенных систем322
2.3.2. Алгоритмы оптимизации нелинейных систем, линеаризованных с помощью метода «расширенной линеаризации»327
2.4. Демонстрация работы алгоритма параметрической оптимизации в задаче управления нелинейной системой329
Приложение333
Заключение337
3. Дифференциальная игра в задаче управления нелинейным объектом с функционалом обобщенной работы338
Введение338
3.1. Метод «расширенной линеаризации» в задаче формирования математической модели системы340
3.2. Задача с заданным временем окончания переходного процесса342
3.3. Задача с неопределенным временем окончания переходного процесса347
3.4. Пример348
Приложение352
Заключение354
4. Дифференциальные игры преследования с несколькими преследователями и одним уклоняющимся354
Введение355
4.1. Постановка задачи356
4.2. Классическая дифференциальная игра и игра с распределенной информацией360
4.2.1. Классическая дифференциальная игра360
4.2.2. Дифференциальная игра с распределенной информацией363
4.3. Дифференциальная игра с помехами367
4.4. Пример368
4.4.1. Классическая дифференциальная игра368
4.4.2. Дифференциальная игра с распределенной информацией370
Приложение372
Заключение374
5. Построение управления для нелинейной системы с квазипостоянными параметрами регулятора375
5.1. Формулировка задачи управления в общем виде. Метод синтеза управления нелинейным объектом376
5.2. Иллюстрация применения разработанного метода построения регулятора с квазипостоянными параметрами для нелинейной системы384
5.2.1. Математическая модель объекта управления384
5.2.2. Синтез управления с квазипостоянными параметрами и результаты математического моделирования388
Заключение393
Список литературы395

Предисловие
top

Проблематика, связанная с управлением в условиях неопределенности, является одной из основных в теории автоматического управления и включает в себя самые разнообразные постановки задач, решаемые часто весьма специфическими методами. Применение классических методов, основанных на предположении, что все характеристики системы и возмущающих воздействий известны, либо сопряжено с большими вычислительными трудностями, либо не представляется возможным. Возникает необходимость развития таких методов, которые не требовали бы детального знания всего пространства состояния системы, ее параметров и взаимодействия со средой. Следовательно, в общем случае невозможно гарантировать выполнения требуемых условий оптимальности.

В опубликованных в 2008 и 2015 годах книгах «Управление неопределенными динамическими объектами» и «Управление нелинейными неопределенными динамическими объектами» были изложены основные достижения теории управления, полученные автором к двадцатым годам этого столетия. В них сделан упор на применение алгоритмического и робастного конструирования неопределенных систем управления и использования метода «условной линеаризации» к решению задач синтеза оптимальных и субоптимальных управлений нелинейными системами. В эти же годы автором настоящей монографии получен ряд результатов построения управляемых неопределенных динамических систем, основанные на применении метода дифференциальных игр. Разработка этого метода для синтеза подобных систем управления расширяет круг задач, решаемых с применением метода Понтрягина и метода динамического программирования. Результаты исследований, выполнявшихся при поддержке Программы «Научный фонд НИУ ВШЭ» и Программы фундаментальных научных исследований ИПУ РАН им. В. А. Трапезникова «Теория, методы и технологии оптимизации и управления динамическими системами в условиях неполной информации», положены в основу монографии.


Об авторе
top
photoАфанасьев Валерий Николаевич
Доктор технических наук, профессор Высшей школы экономики, главный научный сотрудник Института проблем управления имени В. А. Трапезникова Российской академии наук. Почетный работник высшего профессионального образования Российской Федерации. Специалист в области теории управления динамическими объектами различной физической природы. Окончил факультет автоматики и вычислительной техники Московского института электронного машиностроения (Московский институт электроники и математики). Автор монографий и статей, среди которых большой цикл работ об управлении неопределенными нелинейными динамическими объектами. Руководитель ряда инициативных проектов РФФИ. Подготовил 33 кандидата наук и 3 докторов наук.