Афанасьев В.Н. Математическая теория управления непрерывными динамическими системами

URSS. 2021. 480 с. ISBN 978-5-396-01013-0.

Белая офсетная бумага

Твердый переплет

Аннотация

Данная книга подготовлена на основе курсов лекций по теории управления, читаемых автором в течение ряда лет студентам департамента прикладной математики Национального Исследовательского Университета «Высшая школа экономики» и физического факультета Московского государственного университета имени М.В. Ломоносова. Содержание книги является существенным развитием отдельных глав книги «Математическая теория конструирования систем управления» (В.Н.... (Подробнее)

Оглавление

Оглавление
Предисловие 8
Предварительные понятия и определения 16
Глава 1. Необходимые условия в задачах конструирования программных движений 43
§ 1.1. Постановка задачи 43
§ 1.2. Задача со свободным правым концом и заданным временем окончания переходного процесса 45
§ 1.3. Задача с фиксированными значениями некоторых переменных состояния в заданный момент окончания переходного процесса 58
§ 1.4. Задача с фиксированными значениями некоторых переменных состояния в неопределенный момент окончания переходного процесса 68
§ 1.5. Задача с фиксированными значениями некоторых переменных состояния во внутренних точках траектории 81
§ 1.6. Задачи оптимизации при наличии ограничений на траекторию 84
1.6.1. Интегральные ограничения 84
1.6.2. Ограничения в виде равенства на управляющие переменные 88
1.6.3. Ограничения в виде равенства на функции управления и фазовые координаты 88
1.6.4. Ограничения в виде равенства на функции координат 89
1.6.5. Ограничения, заданные во внутренних точках траектории 91
1.6.6. Системы управления движением с разрывными частями во внутренних точках траектории 92
§ 1.7. Некоторые замечания 93
Глава 2. Принцип максимума Понтрягина 96
§ 2.1. Постановка задачи 96
§ 2.2. Задача со свободным правым концом и заданным временем окончания переходного процесса 105
§ 2.3. Задача с фиксированными значениями некоторых переменных состояния в заданный момент окончания переходного процесса 107
§ 2.4. Задача с фиксированными значениями некоторых переменных состояния в неопределенный момент окончания переходного процесса 115
§ 2.5. Задача об оптимальном быстродействии 122
§ 2.6. Задача на оптимум расхода ресурсов 130
§ 2.7. Пример решения задачи оптимального управления с помощью принципа максимума 137
§ 2.8. Некоторые замечания по принципу максимума 141
Глава 3. Достаточные условия в задачах конструирования программных движений 144
§ 3.1. Постановка задачи 144
§ 3.2. Переход к открытой области изменений управления 145
§ 3.3. Управление с обратной связью в задаче с заданным временем окончания переходного процесса 146
§ 3.4. Достаточные условия локального минимума при заданном времени окончания переходного процесса 150
§ 3.5. Достаточные условия локального минимума при незаданном времени окончания переходного процесса 155
§ 3.6. Уравнения для функционала качества 163
§ 3.7. Достаточные условия оптимальности 166
§ 3.8. Некоторые замечания относительно достаточных условий 172
Глава 4. Динамическое программирование 174
§ 4.1. Постановка задачи 174
§ 4.2. Уравнение Гамильтона—Якоби—Беллмана 176
§ 4.3. Существование решения уравнения
Гамильтона—Якоби—Беллмана 182
§ 4.4. Достаточные условия оптимальности 187
§ 4.5. Связь метода динамического программирования с принципом максимума (минимума) Л. С. Понтрягина 189
§ 4.6. Пример решения задачи нахождения оптимального управления с помощью метода динамического программирования 190
§ 4.7. Численное решение уравнений динамического программирования 193
§ 4.8. Некоторые замечания по применимости принципа динамического программирования 196
Глава 5. Оптимальное управление линейными объектами 198
§ 5.1. Структурные свойства линейных систем 198
5.1.1. Устойчивость 198
5.1.2. Управляемость 203
5.1.3. Наблюдаемость 205
5.1.4. Приводимость линейных однородных систем 206
§ 5.2. Постановка задачи оптимального управления 209
§ 5.3. Задача со свободным правым концом и заданным временем окончания переходного процесса 212
§ 5.4. Задача о регуляторе выхода 232
§ 5.5. Задача слежения 234
§ 5.6. Задача с фиксированными значениями некоторых переменных состояния в заданный момент окончания переходного процесса 244
§ 5.7. Задача об оптимальном быстродействии при ограничениях на управляющие воздействия 248
§ 5.8. Задача управления при неполной информации о состоянии объекта 253
§ 5.9. Некоторые замечания 263
Глава 6. Дифференциальные игры 265
§ 6.1. Постановка задачи 265
§ 6.2. Дифференциальная игра как проблема оптимального управления 269
§ 6.3. Линейные игры преследования с квадратичным функционалом 273
§ 6.4. Задача на минимум времени перехвата с ограничениями на управления 279
§ 6.5. Дифференциальная игра с несколькими игроками в задаче защиты цели 281
6.5.1. Дифференциальная игра с распределенной информацией 283
6.5.2. Распределенные стратегии для игры «преследователь—убегающий» 286
6.5.3. Дифференциальная игра с шумами 289
6.5.4. Пример 291
§ 6.6. Задачи дифференциальных игр с нелинейными неопределенными динамическими объектами 295
§ 6.7. Общие замечания к теории дифференциальных игр 303
Глава 7. Некоторые дополнительные вопросы теории управления 305
§ 7.1. Существование оптимального управления 305
7.1.1. Постановка задачи и основные определения 305
7.1.2. Основная теорема 306
7.1.3. Анализ основной теоремы 311
§ 7.2. Особые оптимальные управления 314
7.2.1. Линейные динамические системы с квадратичным критерием качества 314
7.2.2. Особые решения в задачах оптимизации нелинейных систем 318
7.2.3. Условия в точках сопряжения участков 324
§ 7.3. Четеринг-режимы 325
§ 7.4. Скользящие режимы 332
7.4.1. Скользящие оптимальные режимы 332
7.4.2. Устойчивость системы со скользящими режимами 340
7.4.3. Стабилизация линейного стационарного объекта 347
7.4.4. Условие устойчивости скользящего движения 357
§ 7.5. Общие замечания к обоснованию условий существования оптимального управления 367
Глава 8. Управление системами, линеаризуемыми обратной связью 368
§ 8.1. Постановка задачи 368
§ 8.2. Локальное преобразование координат для SISO систем 371
§ 8.3. Локальное преобразование координат для MIMO систем 381
§ 8.4. Существование линеаризации нелинейной системы обратной связью 392
§ 8.5. Теоретические основы метода гарантирующего управления нелинейным объектом 409
§ 8.6. Синтез управления на основе уравнения
Гамильтона—Якоби—Беллмана 417
§ 8.7. Анализ устойчивости субоптимального решения 422
§ 8.8. Выводы 424
Глава 9. Нелинейные системы с параметрами, зависящими от состояния 426
§ 9.1. Постановка задачи. Математические модели 426
§ 9.2. Задача оптимального и субоптимального управления системами с параметрами, зависящими от состояния 435
9.2.1. Задача оптимального управления с заданным временем окончания переходного процесса 435
9.2.2. Задача субоптимального управления при T → ∞ 442
§ 9.3. Метод расширенной линеаризации в задаче дифференциальной игры 454
9.3.1. Оптимальные управления дифференциальной игры с заданным временем окончания переходного процесса 456
9.3.2. Оптимальные управления дифференциальной игры в неопределенный момент окончания переходного процесса 461
§ 9.4. Пример. Синтез управления для модели реактора на тяжелой воде 466
9.4.1. Постановка задачи 466
9.4.2. Синтез SDRE-управления 468
9.4.3. Гарантирующее управление 471
§ 9.5. Выводы 471
Список дополнительной литературы 473
Summary 478

Предисловие

Теория автоматического регулирования начала формироваться как самостоятельная научная дисциплина в 30–40 годы XIX века на основе отдельных направлений теоретической механики для решения конкретных технических задач. Главным объектом исследования в этот период были автоматические регуляторы производственных процессов, такие как регулятор Уатта для паровой машины. Успехи в деле конструирования и построения регуляторов и развивающейся теории малых колебаний послужили основой для развития теории регулирования [51, 64]. Было введено важнейшее понятия устойчивости регулируемого процесса, и получены первые критерии устойчивости линейных систем (Д. К. Максвелл, Э. Раус, И. А. Вышне¬град¬ский, А. Гурвиц, А. Стодола, Н. Е. Жуковский). В работах А. М. Ляпунова [47] впервые появилось математически строгое определение понятия устойчивости, были получены первые результаты по устойчивости нелинейных систем, опирающиеся на фундаментальную идею введения функций Ляпунова.

В 30-е годы прошлого века с появлением телефонии и радиосвязи основным аппаратом теории становятся частотные методы и соответствующие частотные критерии устойчивости (Г. Найквист, Ф. А. Михайлов). Первые теоретические методы анализа системы автоматического регулирования опирались на работы Г. Боде, Г. Найк-виста, В. В. Солодовникова [64]. В частности, такие понятия, как частотная характеристика, ширина пропускания, усиление (в децибелах) и запас фазы использовали для проектирования систем в частотной области, основываясь на способе проб и ошибок, что послужило началом инженерных методов современной теории управления.

Если до Второй мировой войны проектирование систем управления представляло собой искусство, то в период Второй мировой войны и до начала 50-х годов стала быстро развиваться теория автоматического регулирования. В это время широко применялись временные критерии, такие как время нарастания, время переходного процесса, максимум относительного перерегулирования. Метод корневого годографа (У. Эванс, К. Ф. Теодорчик) явился связующим началом между методами анализа и синтеза во временной и частотной областях и представляет собой достаточно мощный аналитический инструмент исследования. В течение этого периода инженер, занимающийся проектированием регуляторов, имел дело с проектированием линейных следящих систем. Небольшими нелинейностями объекта и усилителя мощности можно было пренебречь, так как отрицательная обратная связь делала характеристики системы нечувствительными к изменениям параметров и возмущениям.

Технический прогресс промышленного производства и исследования космоса, которые начались в середине прошлого века, пробудили интерес как к системам с исключительно высокой точностью и требованиям разумного использования ресурсов, так и к нелинейным системам управления, в частности к релейным. Для анализа систем управления с релейными устройствами было предложено два метода: описывающей функции (метод гармонического баланса Крылова—Боголюбова) и фазового пространства (А. А. Андронов, С. Э. Хайкин). Метод гармонического баланса позволяет инженеру исследовать устойчивость замкнутой нелинейной системы с частотной точки зрения, а метод фазового пространства — проектировать нелинейные системы во временной области.

В середине XX столетия к исследованию нелинейных систем управления стали привлекаться методы функционального анализа. Идейной основой метода функциональных рядов была работа М. Р. Фреше — французского математика, опубликованная в 1950 году. В работах Н. Д. Егупова, К. А. Пупкова, В. И. Капалина функциональные ряды Вольтера стали использоваться при исследовании динамических нелинейных систем управления [56, 57].

Проблема оптимального по времени управления интенсивно изучалась математиками СССР и США. В 1953–1957 годы происходит интенсивное использование методов вариационного исчисления к решению задач оптимального управления. Это привело к разработке принципа максимума Понтрягина (Л. С. Понтрягин, В. Б. Бол¬тянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко) [55] и динамического программирования (Р. Беллман) [14, 15]. Принцип максимума Понтрягина установил необходимое условие первого порядка для сильного минимума для задач оптимального управления с наличием ограничений на управляющие воздействия, обобщающее уравнение Эйлера и условие Вейерштрасса вместе взятые. Принцип Понтрягина можно рассматривать как способ подхода к вариационным задачам Гамильтона, а метод динамического программирования Беллмана следует рассматривать как направление, идущее по пути Гамильтона—Якоби. Работы специалистов по управлению (М. Атанс, Р. Калман, М. Фалб, Н. Н. Моисеев, А. М. Летов, Н. Н. Красовский, А. А. Красовский, А. А. Фельдбаум, Я. З. Цыпкин, Ф. Л. Черноусько, С. В. Емельянов) помогли инженерам осознать важность и эффективность созданной теории оптимального управления.

Основным методом синтеза оптимальных систем является метод аналитического конструирования. Термин «аналитическое конструирование», подразумевающий синтез оптимальных систем управления, основанный на минимизации функционала качества, был введен советским ученым Александром Михайловичем Летовым (1911–1974). Метод А. М. Летова разрабатывался вначале на основе применения классического вариационного исчисления [45, 46]. Однако в настоящее время термином «аналитическое конструирование» можно объединить все методы синтеза систем как детерминированных, так и стохастических с полной информацией о параметрах, состоянии и возмущениях, т. е. все методы, позволяющие применять аналитические методы для исследования разнообразных задач оптимального управления и оценивания [40]. Этот метод разработан как для детерминированных, так и для стохастических систем и позволяет на стадии проектирования синтезировать условия (параметры и управления), при которых система будет выполнять поставленную задачу наилучшим образом с позиции заданного функционала качества, другими словами, позволяет синтезировать оптимальную систему.

В большинстве методов аналитического конструирования оптимальных систем рассматриваются задачи во временной области с использованием понятия состояния системы и теории матриц. В общих чертах основной подход к проблеме выглядит следующим образом:

1) определить динамические характеристики объекта в форме дифференциальных уравнений или уравнений в конечных разностях;

2) определить множества допустимых траекторий системы и управлений (ограничения на координаты состояния, управляющие воздействия, задаваемые в виде равенств или неравенств);

3) задать цели управления;

4) задать функцию потерь или функционал качества.

Задачей конструирования оптимальной динамической системы управления с полной информацией по отношению к множеству целей, функционалу качества, множеству допустимых управлений, множеству состояний и начальному состоянию объекта в момент начала управления является отыскание управления, принадлежащего допустимому множеству управлений, минимизирующего заданный функционал качества на решениях уравнения объекта.

Синтез оптимальной системы управления осуществляется с использованием необходимых и достаточных условий минимума функционала качества. Следует отметить, что существование оптимального управления не является необходимым: во множестве допустимых управлений может вообще не оказаться управлений, переводящих объект из начального состояния в заданное множество целей.

Таким образом, применение аналитических методов конструирования требует знания всей информации об объекте, внешней среде и процессах, протекающих внутри системы, т. е. применение аналитических методов конструирования возможно в условиях полной информации. Главное же преимущество аналитических методов заключается в том, что если решение получено, то решен целый класс задач, а не одна специфическая. Именно это свойство придает аналитическим методам большое теоретическое значение.

Сложность большого количества современных систем управления зачастую не позволяет получить заранее полное описание процессов, протекающих внутри системы, и ее взаимодействия со средой. Достаточно часто математическая модель системы управления учитывает лишь допустимые области изменения параметров управляемой системы и характеристик ее отдельных элементов без конкретизации самих этих параметров и характеристик. Указанные области могут определяться, например, интервальными ограничениями, соответствующими заданным техническим допущениям на систему.

Применение аналитических методов для нестационарных систем управления с неполной информацией о параметрах, входных воздействиях, помехах либо сопряжено с большими вычислительными трудностями, либо не представляется возможным (как в случае синтеза оптимальной системы). Поэтому правомерен подход к конструированию таких систем, основанный на использовании дополнительных цепей, на которые возлагаются задачи оптимизации системы в смысле выбранного критерия качества в процессе работы системы и по мере накопления и обработки необходимой для этих целей информации.

Метод, основанный на указанном подходе, можно объединить общим названием — алгоритмическое конструирование нестационарных систем управления. Термин «алгоритмическое конструирование» был введен советским ученым Борисом Николаевичем Петровым (1913–1980).

Задачей конструирования динамической системы с оптимизацией (в случае неполной информации о параметрах объекта и его взаимодействия со средой) по отношению к множеству целей, функционалу качества, множеству допустимых управлений, множеству состояний и начальному состоянию объекта в момент начала управления является отыскание координатно-параметриче¬ского управления, принадлежащего допустимым множествам управляющих координатных и параметрических воздействий, минимизирующих заданный функционал качества на решениях уравнения системы по мере накопления и обработки необходимой и соответствующей информации.

Существование координатно-параметрического управления, оптимизирующего систему с неполной информацией, не является необходимым: а) начальные условия объекта, начальная и/или текущая неопределенность, длительность интервала управления системой могут оказаться такими, что процесс оптимизации может быть не закончен, т. е. перестраиваемые параметры за время управления системой могут не достичь значений, при которых функционал качества достигает минимального значения; б) во множествах допустимых управляющих координатных и/или параметрических воздействий может вообще не оказаться управлений, переводящих объект из начального состояния в заданное множество целей.

Таким образом, если с помощью методов аналитического конструирования можно на стадии проектирования создавать оптимальную систему, то с помощью методов алгоритмического конструирования можно создавать систему, снабженную дополнительными цепями, с помощью которых система в процессе функционирования и обработки необходимой и соответствующей информации будет оптимизировать свою работу.

Отметим, что применять методы алгоритмического конструирования, основанные на возможности параметрической оптимизации нестационарной системы, в ряде случаев, с позиции технической реализации, не является рациональным или не представляется возможным.

В связи с этим возникает задача построения управления не для одной конкретной, точно заданной системы, а целого семейства систем, параметры и характеристики элементов которых принадлежат заранее известным множествам. В современной литературе по теории управления соответствующая проблема получила название задачи робастного управления. Существует несколько определений робастного управления, в которых, так или иначе, отражается существо постановки задачи управления нестационарным объектом.

Задачей конструирования робастной динамической системы по отношению к множеству целей, множеству допустимых управлений, множеству состояний и начальному состоянию объекта в момент начала управления и множеству возможных значений параметров и характеристик элементов объекта является отыскание (в соответствии с заданным функционалом качества) управления, принадлежащего допустимому множеству управляющих воздействий, обеспечивающего перевод системы из начального состояния в заданное множество целей при любых значениях параметров и характеристик элементов объекта, принадлежащих множеству возможных значений.

По существу, задача робастного управления может быть отнесена к задачам аналитического конструирования, так как для ее решения используется известная информация о допустимых областях изменения параметров управляемой системы и характеристик ее отдельных элементов без конкретизации самих этих параметров, и характеристик.

Отметим, что теория робастного управления только еще формируется и основные результаты получены для анализа робастной устойчивости и робастной стабилизации линейных объектов. При анализе робастной устойчивости исследуется не одна заданная линейная система, а устойчивость целого семейства систем, соответствующих исходной (номинальной) системе при наличии неопределенности. Задачи управления, как правило, сводятся к задачам стабилизации. Этим и объясняется применение для решения таких задач классических методов, которые основаны на использовании теории матриц и передаточных функций (комплексных коэффициентов усиления) [20, 44, 57]. Использование этих методов для синтеза управляющих воздействий для нестационарных систем при заданном интервале управления невозможно.

Существование робастного управления не является необходимым (из самого его определения).

Критическое отношение к методам синтеза оптимального управления, базирующегося на применении пространства состояния в условиях адекватности математической модели реальному объекту, вызвало ревизию теории управления 1970-х годов. В инженерной практике происходит возврат к классическим способам регулирования с помощью простых регуляторов (типа ПИД) и к простым методам их настройки. В теории восстанавливается интерес к частотным методам, которые обобщаются на случай многомерных систем (Г. Розенброк). С 1980-х годов формируется новая теория, так называемая H-теория (Г. Зеймс, В. А. Френсис, Дж. С. Дойл, К. Гловер) [82], которая позволила объединить частотные методы и методы пространства состояний и по-новому ставить оптимизационные задачи. Эта же постановка позволила рассматривать задачи робастного управления.

Задача выбора оптимального управления при неполной информации о параметрах системы и действующих возмущениях может быть сформулирована как игровая задача, и оптимальная стратегия управления определяется как стратегия, гарантирующая достижения заданной цели при наиболее неблагоприятных сочетаниях неопределенных факторов.

Задачей конструирования динамической системы с гарантирующим управлением по отношению к множеству целей, функционалу качества, множеству допустимых управлений, множеству состояний, начальному состоянию объекта в момент начала управления и множеству возможных значений параметров и характеристик элементов объекта является отыскание управления, принадлежащего допустимому множеству управляющих воздействий, минимизирующего заданный функционал при наименее благо приятных значениях параметров и действующих возмущений и обеспечивающего перевод системы из начального состояния в заданное множество целей при любых возмущениях, принадлежащих заданному множеству.

Данная книга подготовлена на основе лекций, читаемых в течение ряда лет в рамках курса «Теория управления» студентам департамента прикладной математики Национального исследовательского университета «Высшая школа экономики», однако изучение изложенного материала будет полезно студентам и аспирантам других факультетов, а также специалистам, работающим в области управления разнообразными системами.

Содержание книги является развитием отдельных глав книги «Математическая теория конструирования систем управления» (В. Н. Афанасьев, В. Б. Колмановский, В. Р. Носов) [5], а также дополнением новых разделов теории управления, появившихся в последнее десятилетие.

Автор пользуется возможностью выразить благодарность коллективу кафедры кибернетики Московского института электроники и математики Национального исследовательского университета «Высшая школа экономики» по совместным работам, в том числе К. А. Пупкову, В. Д. Фурасову, Б. И. Прокопову, С. Н. Маркову, В. И. Капалину, А. Н. Данилиной, А. В. Белову, С. Е. Бузникову и многим другим, с кем удалось работать в институте на протяжении многих лет. Благодарим также С. Н. Васильева, Б. В. Павлова, И. Б. Ядыкина, А. П. Кордюкова и многих других сотрудников Института проблем управления им. В. А. Трапезникова Российской академии наук за внимательное прочтение книги и за замечания, ценные советы и полезную критику по содержанию книги.

Автор будет признателен за любые конструктивные замечания по содержанию книги.

Об авторе

Афанасьев Валерий Николаевич

Доктор технических наук, профессор Высшей школы экономики, главный научный сотрудник Института проблем управления имени В. А. Трапезникова Российской академии наук. Почетный работник высшего профессионального образования Российской Федерации. Специалист в области теории управления динамическими объектами различной физической природы. Окончил факультет автоматики и вычислительной техники Московского института электронного машиностроения (Московский институт электроники и математики). Автор монографий и статей, среди которых большой цикл работ об управлении неопределенными нелинейными динамическими объектами. Руководитель ряда инициативных проектов РФФИ. Подготовил 33 кандидата наук и 3 докторов наук.