141
Б.В. Сухинин, В.В. Сурков, С.А. Цырук, Е.И. Феофилов ОПТИМАЛЬНОЕ ПО ТОЧНОСТИ (БЫСТРОДЕЙСТВИЮ, ЭНЕРГОСБЕРЕЖЕНИЮ) УПРАВЛЕНИЕ ЭЛЕКТРОМЕХАНИЧЕСКИМИ ОБЪЕКТАМИ T 0 U 0 J min F (X)dt = ОУ X Z U X Р F

БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

Б.В. Сухинин, В.В. Сурков, С.А. Цырук, Е.И. Феофилов

ОПТИМАЛЬНОЕ ПО ТОЧНОСТИ (БЫСТРОДЕЙСТВИЮ, ЭНЕРГОСБЕРЕЖЕНИЮ)

УПРАВЛЕНИЕ ЭЛЕКТРОМЕХАНИЧЕСКИМИ ОБЪЕКТАМИ

T

0U0

J min F (X)dt= ∫

ОУ XZ

U X

Р

F

Page 2: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

2

Министерство образования Российской Федерации

Государственное образовательное учреждение высшего профессионального образования

Тульский государственный университет

Б.В. СУХИНИН, В.В. СУРКОВ, С.А. ЦЫРУК, Е.И. ФЕОФИЛОВ

ОПТИМАЛЬНОЕ ПО ТОЧНОСТИ (БЫСТРОДЕЙСТВИЮ, ЭНЕРГОСБЕРЕЖЕНИЮ)

УПРАВЛЕНИЕ ЭЛЕКТРОМЕХАНИЧЕСКИМИ ОБЪЕКТАМИ

Допущено УМО вузов России по образованию в области энергетики и электротехники

в качестве учебного пособия для студентов высших учебных заведений, обучающихся

по направлению подготовки 140400 Электроэнергетика и электротехника

Тула Издательство ТулГу

2014

Page 3: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

3

Рецензенты: кафедра «Электроснабжение промышленных предприятий Национального исследовательского университета (МЭИ)», д-р техн. наук, проф. С.И. Гамазин

УДК 681.513 Оптимальное по точности (быстродействию, энергосбережению) управление электромеханическими объектами / Б.В. Сухинин, В.В. Сурков, С.А. Цырук, Е.И. Феофилов. Тул. гос. ун-т; Тула, 2014. 140 с.

Рассматриваются методы аналитического конструирования оптимальных регуляторов (АКОР) для нелинейных объектов по критериям точности, в том по критерию быстродействия или по энергосберегающему критерию расхода "сигнала управления". Применение методов иллюстрируется многочисленными примерами синтеза нелинейных электромеханических систем.

Пособие предназначено для студентов старших курсов, инженеров, технических и научных сотрудников, занимающихся проблемами конструирования оптимальных систем автоматических управления.

Ил. 43. Табл. 1. Библиогр.: 43 назв.

The basic methods of analytical constructing of the optimum regulators (ACOR) for nonlinear plants by criterion of accuracy are considered in the manual. There are such methods: method of ACOR by criterion of speed or by power saving up criterion of the expense of "a control signal". The application of methods is illustrated by numerous examples of a synthesis of nonlinear electromechanical systems.

This manual is intended for students of higher courses, engineers, technical workers and researchers occupied with problems of analytical constructing of the optimum regulators for nonlinear automatic systems.

Печатается по решению библиотечно-издательского совета

Тульского государственного университета.

ISBN 978-5-7679-2693-0

В.В. Сурков, Б.В. Сухинин, С.А. Цырук, Е.И. Феофилов, 2014 Издательство ТулГу, 2014

Page 4: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

4

ПЕРЕЧЕНЬ СОКРАЩЕНИЙ АКОР – аналитическое конструирование оптимальных регуляторов Д – двигатель ДПТ – двигатель постоянного тока МП – механический преобразователь ОУ – объект управления ОС – обратная связь РЛС – радиолокационные станции Р – регулятор РП – регулятор положения РС – регулятор скорости РТ – регулятор тока РЭ – релейный элемент САУ – система автоматического управления СП – следящие приводы СУ – система управления ТАУ – теория автоматического управления СТАУ – современная теория автоматического управления УУ - управляющее устройство ФОР - функционал обобщенной работы А.А. Красовского ЭВМ - электронные вычислительные машины ЭМС - электромеханическая система ЭП - электропривод

ПЕРЕЧЕНЬ ОСНОВНЫХ ОБОЗНАЧЕНИЙ U(t) = [u1(t),u2(t),…,um(t)]T - вектор управляющих воздействий; X(t) = (x1(t), x2(t),…,xn(t))T - вектор состояния объекта управления; Ψ(t) = [ψ1(t), ψ2(t),…, ψn(t)]T - вектор функций переключения

релейного регулятора; ψ(X) – функция переключения релейного регулятора; H[X(t),U(t),Ψ(t),t ] - функция Гамильтона (гамильтониан); S(X) - функция Беллмана; V(X) - функция Ляпунова.

Page 5: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

5

П Р Е Д И С Л О В И Е

Современные идеи оптимального управления распространяются не только на технические объекты и технологические процессы в промышленности, но и на такие области, как организация и управление производством, экономика, менеджмент, биология, военное дело и даже политика. В данном пособии мы сузим круг задач и ограничимся рассмотрением вопросов теории оптимального управления применительно к технике.

Современные промышленные производства характеризуются значительной сложностью и высокой интенсивностью технологических процессов, возросшими требованиями к экологической безопасности и надежности работы производственного оборудования. Исключительно важное народно-хозяйственное значение приобретает эксплуатация промышленного оборудования в режимах, близких к предельным возможностям, и построение систем наилучших (оптимальных) по какому-либо техническому или экономическому критерию. Особое место среди такого класса систем занимают системы, оптимальные по быстродействию и точности, функционирование которых обеспечивается релейными (разрывными) управлениями. Сокращение продолжительности переходных процессов при регулировании многих технологических объектов повышает производительность агрегатов, а увеличение точности отработки системой задающих воздействий улучшает качество продукции, что позволяет получить значительный экономический эффект. По мере уменьшения времени изготовления и улучшения качества выпускаемой продукции проблема синтеза релейных систем, оптимальных по точности и времени управления электроприводами становится все более актуальной.

Неослабевающий интерес к релейным управлениям (работы Я.З. Цыпкина, В.А. Олейникова, Ю.А. Борцова и др.) объясняется тем, что такие системы обладают рядом замечательных свойств: инвариантность к внешним возмущениям и низкая чувствительность к параметрическим возмущениям. Известно, что возмущающие воздействия, приложенные к объекту и не превышающие по модулю соответствующих релейных управлений, не вызывают отклонений фазовых координат объекта (работы М.В. Меерова, С.В. Емельянова, Е.А. Барбашина, В.И. Уткина и др.). Следствием реализации в релейной системе бесконечно большого коэффициента усиления с помощью конечных управляющих воздействий является снижение установившейся ошибки и повышение точности до оптимального значения. Известно также, что только релейный закон управления может обеспечить идеальное воспроизведение любого допустимого входного воздействия (работы А.А. Фельдбаума, А.А. Павлова, А.С. Клюева и др.), причем слежение за входным сигналом происходит в скользящем режиме. К достоинствам релейных систем следует также отнести простоту конструкции, настройки и эксплуатации.

С теоретической точки зрения релейные оптимальные системы относятся к классу существенно нелинейных, трудности анализа и синтеза которых широко известны. Несмотря на обилие теоретических работ по оптимальному

Page 6: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

6

управлению, если оценивать приведенные в них результаты с практической точки зрения, то их, к сожалению, следует признать весьма скромными. Как отмечает А.А. Колесников в книге Синергетическая теория управления. – М.: Энергоатомиздат, 1994. – 344 с. "...ситуация в этой области приняла в настоящее время угрожающий и, по всем признакам, кризисный характер" Авторы справочника по теории автоматического управления (ТАУ) под редакцией А.А. Красовского поясняют, что "...в развитии современной ТАУ (СТАУ) с точки зрения практики далеко не все обстоит благополучно. Классическую ТАУ в основном создавали инженеры для инженеров. СТАУ создают в основном математики для инженеров и во все большей мере математики для математиков. Последнее с точки зрения практики вызывает определенное беспокойство...". Авторы монографии Современная прикладная теория управления. Под ред. А.А. Колесникова – М: Изд-во ТРТУ, 2000. – 400 с. связывают пути выхода из кризисной ситуации с тем, что "в самые последние годы появились новые фундаментальные направления в теории и технике управления. Их развитие может приобрести важное практическое значение. К таким направлениям можно отнести физическую теорию управления, синергетический подход к проблемам управления …" и далее они отмечают, что "Основное внимание ученых и политиков все в большей мере концентрируется на фундаментальных проблемах управления, связанных с ресурсосберегающими технологиями".

Итак, в настоящее время не существует законченных общетеоретических методов исследования и аналитического конструирования высокоточных, быстродействующих и энергосберегающих систем управления (СУ) нелинейными электромеханическими объектами. Причинами этого являются: невыполнение для них принципа суперпозиции; разнообразие классов функций, используемых для описания динамики нелинейных ОУ и СУ; разнообразие требований к качеству процессов в различных режимах функционирования СУ; различные уровни сложности управляемых объектов, характеризуемые многомерностью, многосвязностью, многоконтурностью и т.д.; отсутствие общего математического аппарата для аналитического решения систем нелинейных дифференциальных уравнений. Для многих практически важных классов электромеханических нелинейных объектов отсутствуют теоретически законченные, относительно простые, инженерные методы проектирования систем управления.

Данное пособие направлено на решение проблемы оптимального управления, связанной с аналитическим конструированием высокоточных быстродействующих регуляторов с алгоритмами энергосбережения для нелинейных следящих электромеханических систем (ЭМС). Эта проблема представляет особый научный и практический интерес и является центральной не только в теории ЭМС, но и в современной теории оптимального управления.

Учебное пособие написано по материалам лекций, читаемых авторами по дисциплинам "Оптимальное управление электроприводами", "Автоматизированный вентильный электропривод", "Оптимальные и адаптивные системы управления" на факультете систем автоматического управления

Page 7: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

7

Тульского государственного университета. В указанных дисциплинах важное место отводится вопросам оптимизации динамических характеристик электрических приводов.

В общем случае проектирование электропривода с учетом нелинейных характеристик его звеньев представляет собой трудноразрешимую задачу даже с помощью современных методов синтеза. В настоящее время при синтезе систем управления электроприводами широко используются методы теории оптимального управления и теории АКОР, положенные в пособии в основу проектирования оптимальных электрических приводов. В пособии преследовалась цель доступно, с иллюстрацией на достаточно большом числе примеров, изложить основные методы АКОР, хорошо себя зарекомендовавшие в практике синтеза электромеханических систем - метод АКОР по критерию обобщенной работы А.А. Красовского, метод АКОР по критериям точности. При изложении материала предполагалось, что студенты будут использовать пособие, главным образом, при выполнении курсовых работ по указанным учебным дисциплинам, а также на дипломном проектировании.

Пособие включает в себя также оригинальные материалы научно-исследовательской работы по государственному контракту 02.740.11.0477 от 19 ноября 2009 г. по теме: "Создание энергосберегающей оптимальной системы управления электроприводом для промышленных объектов и объектов спецтехники" и материалы по синтезу оптимальных релейных систем управления, разработанные при финансовой помощи Министерства науки, высшей школы и технической политики РФ по программе "Университеты России", гранту 10-08-97505 "Теория аналитического конструирования оптимальных регуляторов нелинейных систем по критериям точности, быстродействию, энергосбережению для систем наведения и слежения за подвижными объектами", полученному в конкурсе проектов по фундаментальным исследованиям в области теории управления.

Пособие состоит из четырех глав. В первой главе дается математическое описание объектов управления (ОУ) исследуемого класса, типичным представителем которого является привод постоянного тока. Оно включает в себя математические модели двигателя, электронного преобразователя-усилителя, механического преобразователя, имеющего нежесткие кинематические связи. Рассмотрена постановка задачи аналитического конструирования регуляторов для электроприводов.

Во второй главе излагаются основы построения оптимальных по точности (быстродействию) систем управления. Здесь приводятся основные понятия, определения концепции возмущенного - невозмущенного движения и принцип построения систем управления с низкой чувствительностью к параметрическим и внешним возмущениям.

В третьей главе излагаются основы теории аналитического конструирования оптимальных по точности (быстродействию) регуляторов.

В четвертой главе рассматриваются основные методики синтеза оптимальных управлений по критериям точности, быстродействию,

Page 8: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

8

энергосбережению. На конкретных примерах рассматриваются особенности предлагаемых методов и теоретических принципов построения одномерных и многомерных, линейных и нелинейных, осциллирующих и не осциллирующих, низкого и высокого порядков систем с разрывными управлениями, втом числе и с различными ограничениями.

Пособие написано преподавателями кафедры электротехники и электрооборудования факультета САУ Тульского государственного университета и кафедры факультета МЭИ и предназначено в первую очередь для студентов и аспирантов, обучающихся по специальностям «Электрооборудование и электрохозяйства предприятий, организаций и учреждений», «Управление и информатика в технических системах», но может использоваться и в других специальностях управленческого профиля.

Page 9: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

9

В В Е Д Е Н И Е

В настоящее время, благодаря усилиям ученых и инженеров, теория автоматического управления с огромным успехом применяется для автоматизации промышленности. Достаточно вспомнить почти полностью автоматизированные химические заводы, гидравлические, тепловые и атомные электростанции, горнорудные предприятия, транспорт и т.д. Современная автоматическая аппаратура позволяет безаварийно вести производственные процессы, повышать производительность и качество продукции, надежность работы оборудования.

Все виды автоматических систем делятся на два больших класса: − автоматы, выполняющие определенного рода одноразовые или многоразовые операции, например автомат включения освещения;

− автоматические системы, которые в течение достаточно длительного времени нужным образом изменяют (или поддерживают неизменными) какие либо физические величины (координаты движущегося объекта, скорость движения, электрическое напряжение, частоту, температуру и т.д.). В свою очередь, системы второго класса делятся на незамкнутые и

замкнутые автоматические системы. Исторически первыми появились незамкнутые системы. Характерным для незамкнутой системы является то, что процесс работы системы не зависит непосредственно от результатов воздействия на управляемый объект.

Естественным дальнейшим усовершенствованием автоматической системы является замыкание ее выхода (контрольные приборы) с входом (источник воздействия) таким образом, чтобы контрольные приборы, измерив некоторые величины, характеризующие определенный процесс в управляемом объекте, сами служат одновременно и источником воздействия на систему, причем величина этого воздействия зависит от того, насколько отличаются измеренные величины на управляемом объекте от требуемых значений.

Таким образом, главным содержанием теории автоматического управления является принцип обратной связи (замкнутая автоматическая система). На рис. В1. приведена общая структурная схема замкнутой системы автоматического управления, состоящая из двух основных блоков (звеньев): объекта управления (ОУ) и регулятора (Р).

В замкнутой автоматической системе имеется полная взаимозависимость работы всех звеньев друг от друга. Протекание всех процессов в замкнутой системе коренным образом отличается от процессов в незамкнутой системе. Замкнутая система совершенно по-другому реагирует на внешние возмущающие воздействия (F). Различные ценные свойства замкнутых автоматических систем делают их незаменимыми во многих случаях, когда требуется точность и быстродействие. Замкнутые автоматические системы существуют в технике в виде различных автоматических систем управления, следящих систем, систем стабилизации, систем автоматического пилотирования, систем самонаведения и т.д.

Page 10: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

10

ОУ XZ

U X

Р

F

Рис. В1. Структурная схема системы автоматического управления В автоматической системе управления (рис. В1) на основе сравнения сигнала

задания ZX с сигналом обратной связи (сигналом выхода объекта) X регулятор (управляющее устройство) формирует управляющее воздействие на объект U . Как правило, сигнал задания не содержит помех. На объект управления могут также действовать возмущающие воздействия (помехи) F , которые, как правило, искажают управляющее воздействие (мешают управлению). Некоторые возмущающие воздействия могут быть полезными, т.е. такими, для преодоления которых и предназначен объект, например преодоление полезного момента (момента нагрузки) двигателем. В большинстве случаев, возмущающие воздействия заранее неизвестны и могут изменяться произвольным образом. В соответствии с принципом обратной связи регулятор гасит влияние любого, даже заранее неизвестного, возмущающего воздействия (в определенных пределах), стремясь все время ликвидировать отклонение, по какой бы причине оно не возникло. Регулятор тем лучше справляется со своей задачей, чем меньше это отклонение и чем быстрее его гашение. Для наиболее полного решения этой задачи необходимо выполнить очевидное условие: мощность регулятора совместно с объектом управления должна быть больше мощности возмущений.

Основными признаками деления автоматических систем на большие классы по характеру внутренних динамических процессов различают следующие: − непрерывность или дискретность динамических процессов во времени; − линейность или нелинейность уравнений, описывающих динамику процессов регулирования. По первому признаку автоматические системы делятся на системы

непрерывного действия, системы дискретного действия (импульсные и цифровые) и системы релейного действия.

По второму признаку каждый из указанных классов (кроме релейного) делится на системы линейные и нелинейные. Системы релейного действия относятся целиком к категории нелинейных систем. Нелинейной системой называется такая система, в которой хотя бы в одном звене нарушается

Page 11: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

11

линейность уравнений динамики звена (произведение переменных или их производных, любая другая нелинейная связь переменных и их производных).

Системой релейного действия называется такая система, в которой хотя бы в одном звене при непрерывном изменении входной величины выходная величина в некоторых точках процесса, зависящих от входной величины, изменяется скачком. Такое звено называется релейным звеном. В зависимости от технической реализации релейное звено может иметь статическую характеристику с зоной нечувствительности и (или) петлей, аналогичной той, которая получается при гистерезисных явлениях. Релейное звено, не имеющее зоны нечувствительности и петли называется идеальным (рис. В2).

Рис. В2. Статическая характеристика идеального релейного звена:

x – входная величина, y – выходная величина

Связь между входной и выходной величинами для идеального релейного звена принято записывать в следующем виде:

my U sign(x)= ⋅ , где sign – знак аргумента.

Тривиальная, на первый взгляд структурная схема, показанная на рис. В1, не так проста. Доказательством является то, что уже несколько десятков лет она служит неисчерпаемым источником новых идей в области автоматического управления. К настоящему моменту времени к автоматизации предъявляются принципиально новые требования. Сейчас мало того, что домна или мартен управляются кнопками с пульта, автоматически перекидываются клапаны регенераторов и автоматически поддерживается соотношение топливо–воздух, а требуется, чтобы соотношение топливо–воздух поддерживалось наиболее точно, плавки проходили за минимальное время с наименьшей затратой топлива, энергии и т.д. Это принципиально новая постановка задачи автоматического управления. Новые требования выдвинули и новые проблемы, рассмотренные в части I пособия и которые в той или иной степени решаются в настоящей работе.

-Um

+Um

x

y

Page 12: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

12

1 МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ СИЛОВОГО ЭЛЕКТРОПРИВОДА.

ПОСТАНОВКА ЗАДАЧ УПРАВЛЕНИЯ

В последние годы в связи с бурным развитием полупроводниковой техники

все большее развитие получают электромеханические системы типа "управляемый преобразователь - двигатель", причем в качестве двигателя используются как двигатели постоянного тока, так и двигатели переменного тока: асинхронные и синхронные. В зависимости от типа управляемого преобразователя, системы управления преобразователем и типа двигателя изменяются статические и динамические характеристики электропривода, а электромеханическая система может приобретать ряд дополнительных свойств, отличных от свойств используемого двигателя. Примером может служить вентильный двигатель (бесколлекторный двигатель постоянного тока) на основе синхронного или асинхронного двигателя. В главе приводится обобщенное математическое описание электромеханических систем типа "управляемый преобразователь - двигатель" и показывается, что такие системы имеют нелинейности полиномиального вида. Если же учесть, что практически любые сигналы привода имеют конечные максимальные значения (зону ограничения или насыщения), то становится понятным, что системы рассматриваемого класса являются существенно нелинейными.

1.1 СТРУКТУРНАЯ СХЕМА СИЛОВОГО ЭЛЕКТРОПРИВОДА

Электропривод (ЭП) является, пожалуй, главным исполнительным устройством в промышленности. Трудно назвать отрасль промышленности, где бы не использовался электрический привод.

Электропривод состоит из собственно электрического двигателя (ДВ) часто с редуктором, устройства питания (УП) и управляющих устройств, т.е. электропривод – это управляемый двигатель (рис.1.1).

Рис. 1.1 – Структура силового электропривода Различают управление током (моментом) двигателя, скоростью вала

двигателя, положением вала двигателя (углом поворота вала). В зависимости от используемого двигателя различают ЭП постоянного и ЭП

переменного тока (ЭП с АД и ЭП с СД). До недавнего времени в тех системах, к качеству статических и динамических характеристик которых предъявлялись повышенные требования, главным образом использовались и используются

УУ

УП

ДВ

Page 13: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

13

двигатели постоянного тока (ДПТ). Это объясняется тем, что они позволяют сравнительно простыми средствами обеспечить плавное регулирование скорости в достаточно широком диапазоне и получить нужное качество переходных процессов. Однако ДПТ присущи недостатки, связанные, прежде всего, с наличием щеточно-коллекторного узла. Из-за этого ДПТ обладают высокой стоимостью, низкой надежностью, большими эксплуатационными расходами, ограничением по максимальной нагрузке, напряжению, мощности и быстроходности.

С целью устранения недостатков, начиная с 30-х годов прошлого столетия, у нас и за рубежом уделяется повышенное внимание созданию систем управления более надежными асинхронными (АД) и синхронными (СД) двигателями (в том числе и с постоянными магнитами).

Создание современного высокопроизводительного технологического оборудования как технической основы повышения эффективности производства невозможно рассматривать отдельно от проблемы совершенствования систем управления электроприводами. Проектирование силового привода относится к одной из важнейших задач, от успеха решения которой зависит качество и эффективность работы промышленного оборудования. В то же время при проектировании систем управления электроприводами необходимо учитывать информацию о характерных особенностях промышленного оборудования и технологии, в которой электропривод является самостоятельной подсистемой нижнего уровня, гарантирующей вышестоящему уровню выполнение выработанных им команд. Однако гарантированное выполнение этих команд электроприводом в условиях действия дестабилизирующих факторов среды является часто проблематичным [1,2].

К наиболее сложным в этом отношении системам, характеризующимся наличием упругих звеньев и люфтов, переменными моментами нагрузки и инерции, широким диапазоном изменения рабочих скоростей, относятся кинематические органы промышленных роботов и манипуляторов [3]. На электроприводы этих устройств действуют внешние нагрузочные моменты, изменяющиеся в широких пределах. Это могут быть моменты как внешних сил, действующих на исполнительный орган, так и неуравновешенных сил веса исполнительного органа и перемещаемого груза, т.е. сил, величина которых в процессе работы изменяется довольно сложным образом.

К сложным электромеханическим системам следует отнести следящие ЭП антенн радиолокационных станций (РЛС) автоматического сопровождения и управления, а также некоторых астрономических инструментов [1,2], для которых характерно одновременное действие большого числа разнообразных дестабилизирующих факторов. РЛС, работающие в миллиметровом диапазоне, позволяют успешно решать задачи слежения за наземными объектами в любое время года и суток в сложных метеоусловиях и при пыледымовых помехах на дальности до 10 км. Они находят применение как в спецтехнике, так и в объектах гражданского назначения.

Page 14: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

14

В общем случае система управления силовыми электроприводами включает в себя двигатель Д, питающийся от управляемого преобразователя П и приводящий в движение посредством механического преобразователя МП исполнительный орган ИО (рис. 1.2).

Рис. 1.2 – Структура автоматического силового электропривода Выходной координатой электропривода часто бывает скорость или

перемещение исполнительного органа, что при жестких кинематических связях в МП соответствует скорости и углу поворота двигателя. Преобразователь, двигатель, механический преобразователь и исполнительный орган составляют силовую часть электропривода и являются объектом управления ОУ в системе автоматического управления. В процессе работы на электропривод действуют возмущения в виде изменений напряжения питания преобразователя, изменений момента нагрузки на двигатель, кинематическую связь и исполнительный орган и т. д. В результате действия возмущений появляется отклонение выходной координаты от заданного значения ZX . Величины выходной и, если необходимо, других координат электропривода измеряются с помощью измерительно-преобразовательного устройства ИПУ. Выходной сигнал ИПУ сравнивается схемой сравнения СС с заданным значением и результат сравнения подается на регулятор Р. Регулятор и ИПУ составляют систему управления, которая, воздействуя на электропривод, обеспечивает желаемый характер изменения координат силового привода.

Замкнутые системы автоматического управления САУ должны обеспечивать необходимые законы изменения переменных состояния ОУ в переходных режимах, например, разгон и торможение электродвигателя с постоянным ускорением, либо стабилизацию этих переменных на необходимом уровне с требуемой точностью и быстродействием. Для реализации заданных законов

Система управления Электропривод

Р П Д МП ИО

ИПУ

В о з м у щ е н и я

ZX СС

Page 15: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

15

изменения управляемой переменной и компенсации влияния различных возмущающих воздействий на ОУ подается управляющее воздействие, вырабатываемое управляющим устройством или регулятором. Управляющее воздействие формируется регулятором на основании алгоритмов, определяемых целью управления. Решение компромиссной задачи обеспечения заданной статической точности САУ при требуемом или оптимальном в определенном смысле качестве ее переходных процессов достигается введением специальных обратных связей, изменяющих динамику системы в нужном направлении. Во многом решение данной задачи управления зависит от типа применяемого в системе привода, типа электрической машины и их математических моделей.

1.2 МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОБЪЕКТА УПРАВЛЕНИЯ

В основе анализа и синтеза автоматических систем управления лежит понятие математической модели управляемого процесса (или просто объекта управления), которая должна отражать свойства реального объекта в пределах требуемой для управления точности. В дальнейшем, согласно работе [4], объектом управления будем считать выделенную в реальном производственном процессе, функционирующем с определенной целью в условиях действия возмущений, математическую модель канала управления с n входными и m выходными переменными.

Анализ литературных источников [5-10] и проведенный анализ математических моделей различных типов электродвигателей, электронных и механических преобразователей, входящих в состав электропривода, дает основание утверждать, что c достаточной точностью реальные объекты в электромеханике можно описать обыкновенным векторным нелинейным дифференциальным уравнением:

X(t) A(X) B(X) U(t)= + ⋅& , (1.1) где A(X) = A1X + A2(X) – матрица-столбец с элементами ai(X) ≡ ai(x1,x2,…,xn), i = 1,2,…,n, представляющими собой полиномиальные функции от составляющих вектора состояния объекта определенной степени q

1 2 1 2

1

q n ni

i j j ...j j j j1 j 1 j 1

a (x) ... a x x ...xµ µ

µµ= = =

= ∑∑ ∑ (1.2)

B(X) = B1 + B2(X) - матрица с элементами-функциями bij(x1,x2,…,xn), i = 1,2,…,n; j = 1, 2,…,m также полиномиального вида.

Вектор управления U(t)=[u1(t), …, um(t)]T в общем случае считается принадлежащим следующему замкнутому множеству:

j j maxu (t) U , j 1,2,...,m≤ = (1.3) причем, как правило, предполагается, что управляющие воздействия пронормированы и, следовательно, Uj мах = 1, j = 1,2,..., m . Область Ω(U) допустимых управлений определяется двумя условиями: классом допустимых (непрерывных или кусочно-непрерывных) функций и дополнительными ограничениями (1.3) эксплуатационного или конструктивного характера,

Page 16: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

16

накладываемыми на U(t) внутри данного класса. Многомерные стационарные объекты, описываемые уравнением (1.1),

предполагаются управляемыми. В соответствии с результатами известных работ [9-11] для управляемости объекта (1.1) в некоторой ограниченной области фазового пространства, содержащей точку X 0= , необходимо и достаточно управляемости линеаризованного объекта:

n 11 1 1 1 1rank[B ,B A , ,B A ] n− =K . (1.4)

В дальнейшем условие (1.4) считается выполненным. Для подтверждения сформулированных условий-ограничений на класс

моделей исследуемых объектов управления рассмотрим типовые математические модели отдельных узлов электропривода − двигателя, управляемого электронного преобразователя-усилителя, механического преобразователя.

1.2.1 МОДЕЛИ ДИНАМИКИ ДВИГАТЕЛЕЙ ПОСТОЯННОГО ТОКА (ДПТ)

В качестве типового двигателя управляемого привода рассмотрим двигатель постоянного тока по следующим причинам. Во-первых, ДПТ широко применяются в следящих приводах высокой точности. Во-вторых, модели динамики ДПТ выводятся относительно просто. В-третьих, известно, что структура уравнений динамики двигателей переменного тока во вращающихся системах координат во многом аналогична уравнениям ДПТ [7-9].

Модель динамики ДПТ с независимым возбуждением

Рассмотрение применяемых моделей начнем с двигателя постоянного тока с независимым возбуждением (рис.1.3). Предположим, что двигатель управляется изменением напряжения питания u1(t) якорной цепи и напряжения возбуждения u2(t). Выходными координатами двигателя является угол поворота вала ϕ(t) и скорость вращения вала (t) d dtω = ϕ .

Рис. 1.3 – Обозначение двигателя постоянного тока: Я1, Я2 — выводы якорной цепи, ОВ — выводы обмотки возбуждения.

Принцип действия ДПТ можно описать следующей диаграммой причинно-

следственных связей (следующим направленным графом (рис. 1.4)):

Я1 lя(t)

U(t) ϕ(t), ω(t)

Я2

ОВ

Page 17: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

17

Рис. 1.4 – Диаграмма причинно-следственных связей в ДПТ. На диаграмме приняты обозначения. iв(t) - ток обмотки возбуждения,

который создает намагничивающую силу F = wв iв(t) данной обмотки и далее магнитную индукцию В и магнитный поток Ф машины (предполагается, что реакция якоря скомпенсирована дополнительными полюсами или катушками магнитной системы двигателя). iя(t) - ток обмотки якоря, который при взаимодействии с магнитным полем машины в соответствии с законом Ампера создает силу Ампера FA = В⋅l⋅I⋅sinα, действующую на проводник длиной l с током I в поле с индукцией В. Действие механической силы Ампера FA на проводники якорной обмотки определяет возникновение при наличие плеча lп вращающего момента двигателя

М = lп⋅FA = lп⋅В⋅l⋅sinα⋅iя = СМ⋅Ф⋅iя, (1.5) где СМ — механическая постоянная двигателя.

Е − так называемая противоЭДС двигателя, которая возникает во вращающейся якорной обмотке в магнитном поле статора в соответствии с законом электромагнитной индукции (законом Фарадея):

Е = В⋅l⋅v sinβ = CЕ⋅Ф⋅ω, (1.6) где СЕ электрическая постоянная машины.

Отметим, что в системе СИ значения коэффициентов СМ и СЕ приблизительно равны

СМ ≈ СЕ = СМЕ В соответствии с диаграммой причинно-следственных связей для цепи

возбуждения можно составить следующие уравнения:

в в в 2 в вdФ(t)w r i (t) u (t); Ф f (F); F w i (t).

dt+ ⋅ = = = ⋅ (1.7)

При рассмотрении модели (1.7) полагается, что гистерезис в магнитной цепи отсутствует, т.е. намагничивающая сила однозначно определяет магнитный поток как функцию Ф f (F)= , соответствующую известной кривой намагничивания. Хотя двигатель, как правило, работает в режиме ненасыщенной магнитной системы, для наиболее полного отражения реальных электромагнитных процессов в математическую модель ДПТ вводится функция насыщения, которая хорошо аппроксимируется полиномиальной зависимостью.

На основе уравнения второго закона Кирхгофа для электрической якорной цепи двигателя можно составить следующее дифференциальное уравнение:

Е -Е

u2(t) B

u1(t) iя(t) FА М ω(t)

F Ф iв(t)

ϕ(t)

Page 18: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

18

яя я я

di (t)L r i (t) u(t) Edt

+ ⋅ = − ,

или я

я я я Edi (t)L r i (t) u(t) C (t)

dt+ ⋅ = − ⋅Φ ⋅ω . (1.8)

В соответствии со вторым законом Ньютона для вращательного движения составляем дифференциальное уравнение для механической части двигателя

1dJ M mdtω

= − , (1.9)

где J — момент инерции, в состав которого при жесткой связи двигателя и исполнительного механизма входят моменты инерции двигателя и исполнительного механизма; m1 — момент сопротивления нагрузки двигателя, который учитывает все моменты, обусловленные механическими потерями, представляющий в общем случае функцию времени, угла поворота и угловой скорости m1= m1(t,ϕ,ω).

С учетом соотношения М = СМ⋅Ф⋅iя уравнение моментов принимает вид

M я 1dJ C i mdtω

= ⋅Φ ⋅ − . (1.10)

Таким образом, динамическая модель ДПТ описывается уравнениями (1.7), (1.8), (1.10). Введя переменные состояния х1 = ϕ, х2 = ω, х3 = iя, х4 = Ф, после некоторых преобразований запишем эти уравнения в пространстве состояний:

1 2

2 ME 3 4 1 1 2 21

3 1 ME 4 2 31 3 32

4 2 41 1 4 42

x (t) x ;x (t) (C x x m (x ,x , t))a ;x (t) (u C x x a x )a ;x (t) (u a f (x ))a ,

== −

= − −= −

&

&

&

&

(1.11)

где a21 = 1/J, a31 = rя , a32 =1/Lя, a41 = rв/wв , a32 =1/wв, f1(Ф) - характеристика намагничивания, у которой по оси абсцисс отложен поток возбуждения, а по оси ординат - намагничивающая сила.

С точки зрения теории автоматического управления ДПТ представляет нелинейный объект четвертого порядка с двумя управляющими воздействиями, для которого характерны нелинейности типа произведения координат и характеристики насыщения.

Модель динамики ДПТ с независимым возбуждением

при якорном способе управления Модель (1.11) имеет одну регулируемую (выходную) переменную х1 и два

управляющих воздействия, которые используются независимо друг от друга. Для исключения избыточности каналов управления в практике электропривода постоянного тока наиболее часто используется так называемый якорный способ управления скоростью двигателя изменением напряжения u1(t) при u2(t) = const = UB . С учетом последнего условия уравнения (1.11) преобразуются к виду

Page 19: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

19

1 2

2 3 1 21

3 1 2 31 3 32

x (t) x ;x (t) (Cx m )a ;x (t) (u Cx a x )a ,

== −= − −

&

&

&

(1.12)

где С = CMEФ, Ф = const. Подчеркнем, что если m1 = 0, то ДПТ при якорном способе управления

описывается линейной системой трех дифференциальных уравнений. Линейность модели (1.12) двигателя предопределяет простоту анализа и синтеза системы управления ЭП.

Уравнение состояния двигателя (1.12) можно записать в стандартной матричной форме

),t(CX)t(Y);t(BU)t(AX)t(X

=+=&

а именно:

)t(1u

яL100

3x2x1x

я/Lяrя/LФMEC0/JФMEC00

010

3x2x1x

⋅+⋅−

=

&

&

&

. (1.13)

Матрицы коэффициентов А и В данного двигателя имеют структуру

= =

−Φ

Φ

яL100

B;

яLяr

яLMEC

0

JMEC

00

010

A .

Если считать выходной координатой двигателя угол ϕ(t) = х1(t), то уравнение наблюдения (измерения) принимает вид

( ) ( ) ( )001C;X001)t(яi)t()t(

001)t()t(CX)t(y =⋅=ωϕ

⋅=ϕ==

. (1.14)

Систему дифференциальных уравнений (1.13), (1.14) можно свести к одному дифференциальному уравнению третьего порядка. Действительно, на их основе можно записать

+−ϕ⋅Φ⋅

−=

Φ⋅=ϕ

)t(uяL

1)t(яiяLяr

dtd

яLMEC

dtяdi

)t(яiJMEC

dt)t(2d

(1.15)

Из первого уравнения (1.15) выражаем ток dt2d

ФMECJ)t(яi

ϕ= . Подставляем

этот результат во второе уравнение (1.15) и получаем

Page 20: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

20

)t(uяL

1dtd

яLMEC

dt2d

яLMECяrJ

dt3d

MECJ =ϕ⋅

Φ+ϕ⋅

⋅Φ⋅+ϕ⋅

Φ,

или

⋅Φ⋅

=⋅

Φ⋅==

=ϕ+ϕ+ϕ

.яLJ

MC0b;

яLJ

22MEC

1a;яLяr

2a

),t(u0bdtd

1a2dt

2d2a3dt

3d

(1.16)

В соответствии с уравнением (1.16) можно также записать уравнение состояния ДПТ в так называемой канонической форме Фробениуса

)t(1u

0b00

2a1a0100010

⋅+ϕϕϕ

−−=

ϕϕϕ

&&

&

&&&

&&

&

. (1.17)

В пособии для описания динамики ДПТ часто будут использоваться модели (1.13), (1.16), (1.17), которые также являются подмоделями класса (1.1).

Модель двигателя с параллельным возбуждением

Во многих технических устройствах использовать в приводе постоянного тока два независимых источника питания u1 и u2 нецелесообразно с точки зрения габаритов, веса устройства, его надежности, а также стоимости. В этих случаях применяют привод с одним источником энергии и двигателем, имеющим или параллельное, или последовательное, или параллельно-последовательное возбуждение.

Наиболее просто получить модель динамики двигателя постоянного тока при параллельном возбуждении, когда якорная обмотка и обмотка возбуждения включаются параллельно к одному источнику питания, т.е. в данном случае u1(t) = u2(t) = u(t). Подставляя это равенство в (1.11), непосредственно получаем динамическую модель ДПТ с параллельным возбуждением:

1 2

2 ME 3 4 1 1 2 21

3 ME 4 2 31 3 32

4 41 1 4 42

x (t) x ;x (t) (C x x m (x ,x , t))a ;x (t) (u C x x a x )a ;x (t) (u a f (x ))a .

== −

= − −= −

&

&

&

&

(1.18)

Использование этой нелинейной модели для анализа и синтеза САУ электроприводом представляет, в отличие от предыдущей модели, определенные сложности.

Модель двигателя с последовательным возбуждением

Характерной особенностью ДПТ с последовательным возбуждением является то, что обмотка возбуждения находится в цепи якоря и магнитный поток определяется током якорной обмотки и, следовательно, зависит от скорости двигателя. В связи с этим, в сравнении с моделью (1.11), изменяются уравнения,

Page 21: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

21

описывающие электромагнитные процессы в обмотках статора и якоря: в яF w i (t); Ф f (F)= ⋅ = ; (1.19)

яя в я в я E

di (t) d (t)L w (r r ) i (t) u(t) C (t)dt dt

Φ+ + + ⋅ = − ⋅Φ ⋅ω . (1.20)

Подставив соотношения (1.19) в (1.20), получим уравнение я

я в я в я E в яdi (t)(L L ) (r r ) i (t) u(t) C f (w i (t)) (t)

dt+ + + ⋅ = − ⋅ ⋅ω . (1.21)

С учетом уравнений (1.19) - (1.21) модель (1.11) принимает вид 1 2

2 ME в 3 3 1 1 2 21

3 ME в 3 2 31 3 32

x (t) x ;x (t) (C f (w x )x m (x ,x , t))a ;x (t) (u C f (w x )x a x )a ,

== −= − −

&

&

&

(1.22)

где a21 = 1/J, a31 = rя +rв, a32 =1/(Lя+ Lв). Уравнения (1.22) представляют динамическую модель ДПТ с

последовательным возбуждением - нелинейную модель третьего порядка класса (1.1).

Объединяя результаты последних двух разделов, нетрудно получить динамическую модель ДПТ с параллельно-последовательным возбуждением.

1.2.2. ОПИСАНИЕ ЭЛЕКТРОННОГО ПРЕОБРАЗОВАТЕЛЯ-УСИЛИТЕЛЯ

В приводах постоянного тока двигатель получает питание от транзисторного или тиристорного усилителя мощности. Как правило, данный преобразователь, как элемент системы управления, описывается дифференциальным уравнением первого порядка [2, 3]:

у уdu u k vdt

τ + = , (1.23)

связывающего управляющее напряжение и двигателя с входным напряжением v усилителя мощности; здесь у у, kτ - постоянная времени и коэффициент передачи усилителя. Питающее напряжение двигателя не должно превышать номинального значения Uном, поэтому входной сигнал усилителя ограничивают величиной

ном уv(t) U / k≤ . (1.24) Неравенство (1.24) является одним из обоснований введения множества ограничений (1.3) на сигналы управления.

Необходимо отметить, что для многих электроприводов постоянные времени двигателя и механического преобразователя значительно (на порядок и более) превышают значение уτ , поэтому значением постоянной времени электронного усилителя часто пренебрегают.

1.2.3 НЕЛИНЕЙНОСТИ РЕАЛЬНЫХ ОБЪЕКТОВ

Нелинейность систем во многом определяется ограниченностью энергии и

Page 22: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

22

мощности процессов, протекающих в электромеханических объектах, а также видом нелинейностей объекта: наличием механических и тепловых ограничений, насыщения, люфта и т.д. Учет нелинейностей в настоящее время становится обязательным в связи с требованиями интенсификации технологических процессов, когда рабочие режимы промышленных агрегатов и различных подвижных объектов становятся близкими к предельно допустимым [12].

Все нелинейности электромеханических следящих систем условно можно разделить на два класса.

Во-первых, это нелинейности, присущие всем типам электрических двигателей и генераторов постоянного и переменного токов, динамика которых описывается дифференциальными уравнениями с квадратичными нелинейностями. Такие объекты управления электромеханических следящих систем в соответствии с терминологией работы [13] относятся к классу полиномиальных объектов.

Во-вторых, для технических объектов характерны нелинейности, которые можно аппроксимировать кусочно-линейными функциями.

Например, в качестве усилителей мощности в следящих приводах малой и средней мощности часто используются транзисторные широтно-импульсные преобразователи постоянного напряжения. Динамические свойства такого преобразователя с инженерной точностью описываются последовательным соединением нелинейного звена типа насыщения, отражающего ограниченность выходного напряжения усилителя, и апериодического звена с малой постоянной времени. Нелинейное звено типа "насыщение" имеет кусочно-линейную характеристику (рис. 1.5).

Рис. 1.5 – Характеристика нелинейного звена типа "насыщение" В результате учета нелинейностей технических объектов получается система

обыкновенных дифференциальных линейных уравнений, к которым добавляется несколько нелинейных, осложняющих определение требуемого управляющего воздействия. Необходимо, однако, отметить, что учет нелинейностей позволяет получить высококачественные системы и эксплуатировать производственное оборудование в режимах, близких к предельным.

Среди действующих дестабилизирующих факторов и оказывающих существенное влияние на работу следящих электромеханических систем следует

mU−

mU

вхU

выхU

Page 23: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

23

особо выделить нелинейность типа "люфт". Люфт в любой электромеханической системе определяется наличием зазоров в силовой механической передаче между двигателем и управляемым объектом (например, антенной радиолокационной станции). Все эти зазоры обычно объединяют в один и на структурных схемах изображают в виде нелинейного звена, характеристика которого приведена на рис. 1.6.

Рис. 1.6. Характеристика нелинейного звена типа "люфт"

1.2.4 ОГРАНИЧЕНИЯ ФАЗОВЫХ КООРДИНАТ ОБЪЕКТА

Использование предельных режимов, вызывает появление задачи учета ограничений фазовых координат объекта.

Требования надежности и безаварийности работы технических объектов обычно связывают с различными ограничениями, которые накладываются на величину, например, тока двигателя, производную тока, величину скорости вращения вала и др., являющиеся, в конечном счете, координатами объекта регулирования. Дело в том, что часто, несмотря на ограничения, наложенные на управления, "мощность" сигналов управления оказывается достаточной, чтобы перевести объект в недопустимое состояние. В таких случаях приходится дополнительно учитывать ограничения фазовых координат.

Ограничение координат означает, что в n-мерном фазовом пространстве X фазовые координаты лежат в заданной фиксированной области В, причем оптимальная траектория целиком или частично лежит на границе области В, т.е. эта область замкнута (закрытое множество). В дальнейшем будем считать, что граница области В – кусочно-непрерывная поверхность n-мерного пространства X, определяемая вблизи границы неравенствами i mix x≤ , i 1, ,n= K , где mix – наибольшее допустимое значение соответствующей фазовой координаты.

Таким образом, в n-мерном пространстве X замкнутая область В задается n-мерным параллелепипедом. Сюда же относится и случай, когда ограничения вызваны конструктивными мерами, т.е. когда объект имеет ограничители. Именно с такого рода ограничениями приходится сталкиваться при решении задач управления техническими объектами [14], имеющими, например всевозможные сочленения с учетом зазоров (люфтов) между соединяемыми

ϕл

ϕд

− xл

Page 24: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

24

деталями или ограничения типа "упор". Отличительной особенностью функционирования таких систем является возможность возникновения ударов при выходе на границу области В и, как следствие, уменьшение надежности работы.

Задание различного рода ограничений на координаты состояния объекта управления в классической постановке приводит к существенному усложнению необходимых условий оптимальности [15]. Прежде всего, существенно усложняется оптимальный закон управления. Оптимальное управление оказывается релейным, если фазовая точка движется в открытом ядре области В, и является непрерывным при движении фазовой точки по границе области [14]. Поверхность переключения в этом случае становится негладкой, что усложняет определение оптимального управления в аналитическом виде.

1.3 ОСНОВНЫЕ СОСТАВЛЯЮЩИЕ ЗАДАЧИ ОПТИМАЛЬНОГО

УПРАВЛЕНИЯ

Рассмотрим основные составляющие задачи оптимального управления. Динамика объекта управления (уравнения эволюции системы).

Задача оптимального управления теряет смысл при отсутствии некоторого динамического объекта, т.е. объекта управления, состояние которого изменяется во времени. Пусть состояние (положение) объекта в каждый момент времени t полностью характеризуется набором параметров 1x (t) , 2x (t) , …, nx (t) , где n – количество параметров (порядок объекта или количество дифференциальных уравнений объекта в форме Коши). Это могут быть координаты объекта управления в какой-то системе координат, координаты пути, скорости, ускорения и т.д. Вектор

( )1 2 nX(t) x (t),x (t), ,x (t)= L называется фазовым вектором объекта управления или вектором состояния. Вектор X(t) полностью определяет положение изображающей точки в n-мерном фазовом пространстве 1x (t) , 2x (t) , …, nx (t) .

Предполагается, что объект управления имеет некоторые рули (входы), от положения которых зависит его поведение, т.е. предполагается, что движением объекта можно управлять. Пусть положение рулей характеризуется в каждый момент времени t набором параметров 1u (t) , 2u (t) , …, mu (t) , где m – количество входов (рулей) в объект управления. Вектор

( )1 2 mU(t) u (t),u (t), ,u (t)= L называется управляющим параметром объекта или управлением. Предполагается, что состояние объекта управления в данный момент времени t зависит от того, какие значения принимает управление U(t) до момента времени t, и не зависит от будущего поведения управления.

Page 25: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

25

В зависимости от того, как связаны между собой векторы фазового состояния X(t) и управления U(t) , рассматривают различные динамические объекты. Если эта связь описывается системой дифференциальных уравнений

X f (X,U, t)=& , (1.25) то в этом случае, зная значение управления U(t) в каждый момент времени t, можно определить траекторию объекта X(t) как решение дифференциального уравнения

X f (X,U(t), t)=& Система уравнений (1.25) называется неавтономной. Неавтономную систему

можно свести к автономной, введя еще одну новую переменную n 1x 1+ =& , n 1x (0) 0+ = .

В этом случае n 1x (t) t+ = и, следовательно, уравнения состояния объекта могут быть записаны в следующем автономном виде:

i i n 1

n 1

x f (X,x ,U) (i 1, ,n)x 1.

+

+

= = =

& L

& (1.26)

В общем случае уравнение (1.25) или (1.26) может быть нелинейным по отношению ко всем переменным, в другом — может быть линейным только по отношению к управлению U , тогда говорят, что объект характеризуется нелинейным дифференциальным уравнением с линейным вхождением управления, т.е. нелинейный объект линеен по U :

X A(X) B(X) U= + ⋅& . (1.27) Предполагают, что в уравнении (1.27) каким-то образом заданы нелинейные

функции A(X) и B(X) , например, ai(X)≡ai(x1,x2,…,xn), bi(X) ≡ bi(x1,x2,…,xn) – однозначные полиномиальные функции от компонент вектора состояния), другими словами, задана динамика объекта, т.е. закон изменения вектора состояния X(t) в зависимости от изменения вектора управления U(t) . Класс допустимых управлений.

В конкретных физических объектах управление U(t) может не быть произвольным. На него могут быть наложены какие-то ограничения, вытекающие из физического смысла управления. Так, например, если 1u (t) — напряжение питания двигателя, то в каждый момент времени оно должно удовлетворять ограничению

min 1 maxu u (t) u≤ ≤ . При этом напряжение питания двигателя может принимать также и крайние

значения minu и maxu . Обычно предполагают, что вектор управления U(t) удовлетворяет в каждый момент времени t ограничению

U(t) U∗∈ , (1.28) где U∗ — некоторое множество. Как правило, в конкретных физических объектах множество U∗ замкнуто. Эта замкнутость и не позволяет в общем случае исследовать поведение управляемого объекта методами классического

Page 26: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

26

вариационного исчисления. Кроме ограничения вида (1.28) могут быть наложены ограничения на зависимость управления U(t) от времени. Так, например, из физического смысла допустимые управления могут быть либо гладкими функциями, либо непрерывными, либо кусочно-непрерывными и т.д. Предполагают, что каким-то образом задан класс допустимых управлений U(t) . Начальное и конечное состояния объекта.

Как правило, для объекта бывает задан начальный момент времени 0t и множество 0M допустимых начальных состояний объекта. Задача управления состоит в том, чтобы в какой-то конечный момент времени 1t объект под действием управления перешел на некоторое множество 1M допустимых конечных состояний. Предполагают, что допустимое управление U(t) переводит объект из множества начальных состояний 0M на отрезке времени 0 1[t , t ] , если соответствующее этому управлению U(t) фазовое состояние объекта X(t) удовлетворяет условиям

0 0X(t ) M∈ , 1 1X(t ) M∈ . (1.29) Необходимо отметить, что конечный момент времени 1t может быть в общем

случае не фиксированным, а определяться из условия попадания вектора X(t) на конечное множество 1M . Таким образом, предполагают, что допустимые множества 0M и 1M заданы. Критерий качества (функционал качества).

Часто управляемый объект можно перевести из множества 0M на множество 1M многими способами. На практике среди всех таких переходов желательно

выбрать в каком-то смысле наилучший. Обычно предполагают, что каждому допустимому управлению U(t) , заданному на отрезке 0 1[t , t ] , и соответствующей ему траектории объекта X(t) сопоставлено некоторое число J, оценивающее качество управления U(t) и соответствующей ему траектории объекта X(t) , т.е. задан функционал или критерий качества J(X(t),U(t)) . Этот функционал может иметь вид

1

0

t

0t

J(X(t),U(t)) F (X(s),U(s))ds= ∫ . (1.30)

Если начальный момент времени 0t взять равным нулю, тогда конечный момент времени можно обозначить за 1t T= .

В настоящее время в теории и практике оптимального управления широкое распространение получили интегральные квадратичные обобщенные функционалы качества систем автоматического управления:

n m2 2

0 i i j ji 1 j 10

1I q x (t) r u (t) dt2

= =

= ⋅ + ⋅ ∑ ∑∫ . (1.31)

Page 27: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

27

Интеграл (1.31) представляет собой взвешенную с помощью весовых коэффициентов iq сумму площадей, ограниченных квадратами отклонений координат истинного движения от установившегося движения по каждой переменной состояния. Чем меньше эти площади, тем точнее работает система и тем быстрее протекает процесс стабилизации.

Важной особенностью квадратичных критериев качества вида (1.31) является возможность синтеза САУ, позволяющих неограниченно увеличивать коэффициент усиления системы без потери устойчивости, поскольку данные критерии оценивают качество стабилизации ( (i)x (t) 0→ , при t → ∞ ) и, следовательно, гарантируют устойчивость синтезированных замкнутых систем. Чем меньше jr в функционале (1.31), тем меньше получится 0I при прочих равных условиях, и тем быстрее будет происходить процесс стабилизации в замкнутой системе. Это определяет один из возможных путей учета целого комплекса требований к синтезируемым оптимальным системам: требуемое качество управления, заданную степень устойчивости, а также низкую чувствительность к параметрическим и координатным возмущениям.

Наилучший результат при таком подходе достигается в пределе при увеличении коэффициентов усиления до бесконечности ( jr 0→ ), причем функционал качества типа (1.31) примет вид

T

00

J F (X)dt= ∫ (1.32)

при этом сигнал управления также неограниченно увеличивается, что невозможно выполнить в реальных системах и на управление приходится накладывать ограничение типа неравенств. Предполагая, без потери общности, что для рассматриваемой задачи определен соответствующий масштаб, вследствие чего на функции управления ju накладываются ограничения

j| u | 1≤ , (1.33) а линейный регулятор с насыщением, соответствующим ограничению (1.33) при увеличении коэффициента усиления системы до бесконечности трансформируется в идеальный релейный регулятор. В результате можно получить идеальную релейную оптимальную систему, которая обеспечит наилучшее качество стабилизации и достаточно быстрые и плавные переходные процессы. В критерии (1.32) Т – время регулирования не фиксировано.

Будем называть такую систему, работающую по критерию (1.32), который не зависит от управляющего воздействия, системой оптимальной по точности. Достоинство такой формы записи функционала (1.32) в том, что некоторые типы критерия оптимальности [16] можно получить как частный случай достаточно общего критерия (1.32).

Так, например, если 0F (X) 1= , то полученная система является оптимальной по быстродействию, т.е. критерий быстродействия обеспечивает одновременно и оптимальную точность.

Page 28: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

28

Задача оптимального управления. На множестве допустимых управлений (1.28) требуется найти такие

управление U (t)∗ и соответствующие ему траектории объекта X (t)∗ , переводящие объект (1.27) из множества начальных состояний 0M на множество конечных состояний 1M , что при этом функционал качества, например, (1.30) принимает минимальное значение, т.е.

J(X (t),U (t)) min[J(X(t),U(t)]∗ ∗ = . В последней формуле минимум берется по всевозможным допустимым

управлениям U(t) и соответствующим траекториям X(t) , переводящим объект из множества начальных состояний 0M на множество конечных состояний 1M .

1.4 МАТЕМАТИЧЕСКИЕ ТРУДНОСТИ РЕШЕНИЯ ЗАДАЧИ АКОР

СОВРЕМЕННЫМИ МЕТОДАМИ

Наиболее общий метод решения задач оптимального управления в форме обратной связи, получивший название динамического программирования, предложен Р. Беллманом.

В его основе лежит следующий простой, на первый взгляд, принцип оптимальности: "оптимальное управление обладает тем свойством, что для любого начального условия и использованного начального управления последующее оптимальное управление совпадет с исходным оптимальным управлением относительно состояния, получающегося в результате применения начального управления" [17].

Другими словами принцип оптимальности утверждает, что любой отрезок оптимальной траектории, примыкающий к конечной точке X(tk), также является оптимальным. Подчеркнем, что в принципе говорится об оптимальности лишь конечного участка оптимальной траектории, а не какого либо промежуточного участка.

Принцип оптимальности определяет достаточно общее необходимое условие оптимальности динамических систем. Однако он не является всеобщим – принцип справедлив только для систем, у которых оптимальная траектория не зависит от предыстории системы, а целиком определяется исходным ее состоянием. Например, принцип оптимальности не справедлив для объектов управления при наличии запаздывания в фазовых координатах.

Переходя к его выводу, предположим, что задача управления решена и найдены оптимальное управление U*(t) и соответствующая ему траектория движения объекта X(t). Минимальное значение критерия, соответствующее оптимальному управлению, обозначим символом

k

0

t

0 0Ut

S(X ) min F [X(t),U(t)]dt J= =∫ ; (1.34)

Page 29: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

29

данная функция S(X0), зависящая только от начального состояния объекта X(t0)= X0 называется функцией Беллмана.

В соответствии с принципом оптимальности рассмотрим конечный участок оптимальной траектории от точки t < tk до точки tk:

k

k

t t

0 0U Ut t

S(X) min F [X(t),U(t)]dt min F [X(t),U(t)]dt= = −∫ ∫ ; (1.35)

Найдем производную от S(X,t):

0U

dS(X) minF [X(t),U(t)]dtdt

= − ; (1.36)

В последнем выражении минимум правой части означает, что должен быть минимум и левой части. Перенося слагаемые в левую часть, получим:

0U

dS(X)min F [X(t),U(t)] 0dt

+ =

Оптимальное управление U(X), принадлежащее классу кусочно-непрерывных функций и доставляющее минимум функционалу (1.32) на траекториях движения объекта (1.27) при наличии ограничения (1.33), должно удовлетворять решению основного функционального уравнения Беллмана в частных производных:

0 0U U ii

nS Smin F (X) X min F (X) F (X,U) 0X xi 1

∂ ∂ + ⋅ = + =∑ ∂ ∂ = & , (1.37)

где S(X) - функция Беллмана, предполагается, что функция S(X) является непрерывно дифференцируемой по всем своим аргументам; F0(X) - подынтегральная функция критерия (1.32); Fi(X,U) - функции правых частей уравнений объекта (1.27), модель которого представлена в форме

i ix (t) F (X,U);=& m

i i ij jj 1

F (X,U) a (X) b (X)u ;=

= + ∑ . (1.38)

i 1,2,...,n=

При подстановке iF (X,U) из (1.38) в (1.37), уравнение Беллмана приобретает вид:

m

0 i ij ji i j 1

n S Smin F (X) a (X) b (X)u 0x xU i 1 =

∂ ∂+ ⋅ + ⋅ = ∑ ∂ ∂ =

∑ . (1.39)

Так как вектор управления входит только в последнее слагаемое, то оптимальное управление

n

jopt ijii 1

Su sign b (X) , j 1,2, ,mx=

∂= − ⋅ = ∂

∑ L . (1.40)

Для определения оптимальных управлений joptu , необходимо подставить (1.40) в уравнение (1.39):

Page 30: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

30

n m

0 i iji ii 1 j 1

S SF (X) a (X) b (X) 0x x= =

∂ ∂ + ⋅ − ⋅ = ∂ ∂

∑ ∑ (1.41)

и решить нелинейное уравнение (1.41), часто называемое уравнением Гамильтона-Якоби-Беллмана в частных производных относительно функции S(X) при граничном условии S[X(tk)]=0, которое очевидным способом вытекает из определения функции Беллмана S[X(t)]. Здесь необходимо подчеркнуть, что в настоящее время не существует универсального способа решения, позволяющего в аналитической форме найти функцию Беллмана. Это представляет известные математические трудности. Кроме того, при применении метода динамического программирования необходимо иметь в виду следующее.

1. В заданном классе допустимых управлений не всегда существует такое, при котором достигается минимум в (1.39) (напомним, что управление U[X(t)] называется допустимым, если при этом управлении существует решение уравнений (1.38), а функционал (1.32) конечен).

2. Функция Беллмана S[X] не всегда обладает той гладкостью, которая предполагалась при записи уравнения (1.39). Иными словами, решение уравнения (1.39) не обязательно совпадает с соответствующей функцией Беллмана.

3. Решение уравнений Беллмана может оказаться не единственным. В этом случае требуется дополнительное исследование, позволяющее установить, какое из этих решений является функцией Беллмана исходной задачи оптимального управления.

Для преодоления трудностей решения нелинейного уравнения Гамильтона-Якоби-Беллмана в частных производных относительно функции S(X) Красовский А.А. предложил использовать полуопределенный функционал качества:

T m

0 iji j 10

SJ F (X) b (X) dtx =

∂= + ⋅

∂ ∑∫ ,

названный им критерием обобщенной работы, а второе слагаемое в критерии – "расходом сигнала управления". В этом случае уравнение (1.41) превращается в линейное уравнение в частных производных:

n

0 iii 1

SF (X) a (X) 0x=

∂+ ⋅ = ∂ ∑ .

Другой современный метод основан на принципе максимума Л.С. Понтрягина. Обозначим P(t) - вектор вспомогательных переменных с составляющими 0 1 np ,p , ,pK , которые непрерывны и всюду, кроме точек разрыва допустимого управленияu(t) , имеют непрерывные производные. Составим для объекта

X(t) A(X) B(X) U(t) F(X,U)= + ⋅ =& гамильтониан

n

0 0 i ii 1

H(P, ,U) p F p F (X,U)=

Χ = ⋅ + ⋅∑ .

Page 31: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

31

Равенство нулю функции H(P, ,U)Χ свидетельствует о том, что процесс оптимальный. Поскольку вектор управления входит только в последнее слагаемое, то оптимальное управление, определяющее необходимое условие минимума функционала (1.32) равно

( )TU sign B P= − . Составляя уравнения относительно вектора P и добавляя уравнения объекта

i

i

dp Hdt x

∂= −

∂; i

i

dx Hdt p

∂=

∂; i 0,1,2, ,n= K .

приходим к необходимости решения двухточечной краевой задачи относительно вектора P(t) . Решение указанной проблемы также встречает серьезные трудности как вычислительного, так и идейно-методологического характера.

Наиболее серьезная проблема связана с тем, что при увеличении порядка математической модели объекта объем вычислений, необходимых для решения задачи синтеза оптимальной системы управления, стремительно нарастает. "Чтобы убедиться в этом – отмечает А.А. Колесников [12], – достаточно упомянуть о знаменитой задаче поиска решения основного функционального уравнения Беллмана, которое определяет законы оптимального управления в нелинейной теории АКОР. Хотя это уравнение известно более 30 лет, … с тех пор фактически отсутствуют не только какие-либо приближенные аналитические, но и численные методы их решения". Американский ученый Р. Беллман назвал это явление "проклятием размерности".

Таким образом, применение современных методов синтеза оптимальных систем управления приводит к сложным математическим выкладкам не всегда понятным инженерам, интересующимся более часто практическим результатом, чем специальными разделами математики.

Пример 1.1. Требуется найти функцию Беллмана для нелинейного объекта

*1 11 1 12 2 1

2 *2 22 2 222 2 2

x a x a x f ;

x a x a x ku f ku,

= + =

= + + = +

&

& (1.42)

если в критерии T m

0 iji j 10

SJ F (X) b (X) dtx =

∂= + ⋅

∂ ∑∫ 2 2

0 1 1 2 2F (X) q x q x= + .

Отметим, что уравнения (1.42) при 11 11a 0; a 0< → соответствуют описанию привода при вязком нелинейном трении [18].

Составим уравнение Беллмана n

0 iii 1

SF (X) a (X) 0x=

∂+ ⋅ = ∂ ∑ :

2 2 211 1 12 2 22 2 222 2 1 1 2 2

1 2

S(X) S(X)(a x a x ) (a x a x ) q x q xx x

∂ ∂+ + + = − −

∂ ∂ (1.43)

Page 32: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

32

Решение уравнения (1.43) будем определять с точностью до кубических членов степенного ряда

2 21 1 2 2 11 1 12 1 2 22 2

3 2 2 3111 1 112 1 2 122 1 2 222 2

S(X) A x A x A x A x x A x

A x A x x A x x A x .

= + + + + +

+ + + + (1.44)

Тогда

1 11 1 12 2 111 1 1 112 1 2 122 2 21

2 12 1 22 2 112 1 1 122 1 2 222 2 22

S(X) A 2A x A x 3A x x 2A x x A x x ,x

S(X) A A x 2A x A x x 2A x x 3A x x .x

∂ = + + + + + ∂∂ = + + + + + ∂

(1.45)

Подставляя (1.45) в (1.43) и приравнивая коэффициенты при одинаковых произведениях координат объекта, получим систему алгебраических уравнений для определения коэффициентов Ai , Aij , Aijk функции Беллмана:

111 1

212 1 22 2

21

11 11 1

1 212 11 11 12 22 12

22 12 12 22 22 231 11 111

212 111 11 112 22 1121 2

2 12 112 11 122 22 122 222 121 23 12 1222

x : a A 0,x : a A a A 0,x : 2a A q ,

x x : 2a A a A a A 0,x : a A 2a A q ,x : 3a A 0,

3a A 2a A a A 0,x x :2a A a A 2a A a A 0,x x :

a A 3x :

=

+ =

= −

+ + =+ = −

=+ + =

+ + + =+ 22 222 222 22a A 2a A 0.

+ =

(1.46)

Решением системы уравнений (1.46)(3.27) находим искомые коэффициенты: ( )2 12 121 12 11

1 2 11 12 2211 11 22 22

222 12 12 122 222 22111 112 122 222

11 22 22

q a Aq 2a AA A 0; A ; A ; A ;2a a a 2a

2a A a A 2a AA A 0; A ; A .a 2a 3a

− +−= = = = =

++

= = = − = −+

(1.47)

Таким образом, искомая функция Беллмана определяется выражением (1.44) с коэффициентами (1.47).

Замечание: Если функция F0(X) не содержит линейных членов, то для объекта n-го порядка, по аналогии с рассмотренным объектом второго порядка, легко установить, что коэффициенты функции Беллмана A1 = A2 =…= An = 0.

Контрольные вопросы

1. Сформулируйте законы электромагнитной индукции (Фарадея) и Ампера, на которых основан принцип действия ДПТ. Поясните принцип функционирования двигателя.

Page 33: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

33

2. Запишите дифференциальные уравнения, описывающие динамику ДПТ с независимым возбуждением. Поясните физический смысл переменных и параметров этих уравнений.

3. Дайте определение понятиям «вектор состояния объекта», «вектор управления». Поясните их смысл на примере ДПТ.

4. Определите понятия «параллельное, последовательное, смешанное возбуждение» ДПТ. Каким образом способ возбуждения отражается на уравнениях динамики ДПТ?

5. Поясните понятие коэффициента жесткости механического преобразователя. От каких параметров преобразователя он зависит?

6. Что такое коэффициент потерь на внутреннее трение механического преобразователя? Укажите его единицу измерения.

7. Изобразите и поясните структурную модель привода постоянного тока с упругим механическим преобразователем.

8. Что такое интегральный функционал качества системы управления? Приведите примеры таких функционалов.

9. Сформулируйте задачу аналитического конструирования оптимального регулятора для электропривода.

10. Сформулируйте основные математические трудности решения задачи АКОР современными методами.

11. В чем состоит принцип оптимальности Р. Беллмана? 12. Поясните физический смысл функции Беллмана. 13. Используя метод динамического программирования, записать уравнение в

частных производных для определения функции Беллмана (уравнение Гамильтона–Якоби–Беллмана) для функционала

2 2 21 2

0

J (x (t) x (t) u (t))dt∞

= + +∫ и объекта управления 1 22

2 1 2

x x

x x x 2u

=

= + +

&

&.

Page 34: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

34

2. ОСНОВЫ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ ПО ТОЧНОСТИ

(БЫСТРОДЕЙСТВИЮ) СИСТЕМ УПРАВЛЕНИЯ

2.1 КОНЦЕПЦИЯ ВОЗМУЩЕННОГО - НЕВОЗМУЩЕННОГО

ДВИЖЕНИЯ

При анализе и синтезе систем оптимального управления часто удобнее пользоваться уравнениями, полученными из уравнений (1.1) путем замены переменных

прY(t) X(t) X (t)= − , (2.1) где Y(t) – отклонение реального движения объекта X(t) от его программного (желаемого) движения прX (t) . По терминологии Ляпунова Y(t) называется возмущенным движением объекта, а программное движение прX (t) называется невозмущенным движением. Действительное движение системы

Решение системы (1.1) называется движением, а путь, описываемый изображающей точкой в фазовом пространстве, траекторией этого движения. Всякое решение X(t) системы (1.1) представляет собой действительное движение изображающей точки в рассматриваемом фазовом пространстве. При n = 1 движение рассматривается на фазовой линии; при n = 2 - на фазовой плоскости; при n = 3 - в трехмерном фазовом пространстве и т.д. Невозмущенное движение системы

Невозмущенное движение можно получить частным решением уравнения (1.1) при программном управляющем воздействии прU (t) :

пр пр прX f (X ,U , t)=& В частном случае для систем стабилизации желаемое движение определяется

константами, являющимися корнями уравнений статики системы пр прf (X ,U , t) 0= .

Возмущенное движение системы Для того чтобы составить уравнения возмущенного движения, необходимо

ввести в рассмотрение дополнительное отклонение YU (t) управляющего воздействия сверх его программного значения прU (t) , т.е.

Y прU (t) U(t) U (t)= − . (2.2) Управление YU (t) позволяет погасить возмущенное движение Y(t) и,

следовательно, реализовать действительное движение объекта, близкое к программному, т.е.

Y(t) 0→ и прX(t) X (t)≅ .

Page 35: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

35

Именно эти условия должен обеспечить автоматический регулятор в соответствующей системе управления. На рис. 2.1 представлена графическая иллюстрация концепции возмущенного-невозмущенного движения.

ix (t) iпрx (t)

ix (t)iпрx (t)

t

t

iy (t)

Рис. 2.1. Геометрическая интерпретация возмущенного, невозмущенного и действительного движения системы управления

На рис. 2.1 показаны три характерные траектории движения системы:

траектория задания (программа) iпрx (t) , траектория действительного движения

ix (t) и траектория отклонения (ошибки) iy (t) . С учетом замены переменных (2.1) и (2.2):

прX(t) X (t) Y(t)= + и пр YU(t) U (t) U (t)= + , подставив которые в (1.1), можно записать уравнения возмущенного движения

YY h(Y,U , t)=& , (2.3) где

Y пр пр пр прh(Y,U , t) f (Y X ,U U ,t) f (X ,U , t)= + + − . Пусть при t = 0 переменные 1 2, ny , y , yL , принимают начальные значения

10 20, n0y , y , yL , из которых, по крайней мере, одно не равно нулю. Эти значения называются возмущениями. Каждой системе возмущений соответствует однозначное и непрерывное решение

i i 10 20 n0y (t) y (y , y , , y , t)= L , i 1,2, ,n= K , (2.4) уравнений (2.3). Решение (2.4) называется возмущенным движением системы автоматического управления.

Page 36: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

36

Конечное состояние объекта Пользуясь концепцией возмущенного-невозмущенного движения, можно

заранее задать множество 1M допустимых конечных состояний в виде нулевого множества.

Действительно, выражение (2.1) определяет преобразование переноса начала координат в точку с координатами 1пр 2пр nпрx ,x , ,xL . Вследствие этого невозмущенному движению прX (t) системы (1.1) соответствует нулевое решение

1 2 ny 0, y 0, , y 0= = =L системы (2.3). Автоматическая система управления возмущенным - невозмущенным движением

Уравнение возмущенного движения (2.3) имеет большое значение в теории автоматического управления, т.к. позволяют математически строго сформулировать разнообразные задачи синтеза регуляторов, существенным образом отличающиеся от задач программирования траекторий движения. Сущность этой задачи состоит в определении таких отклонений Yju , j 1,2, ,m= L органов управления, которые позволяют наилучшим образом погасить возмущенное движение ( iy 0→ ) и тем самым обеспечить близкое к программному движению действительное движение объекта. Управления

Yj 1 2 nu (y , y , , y )L являются функциями отклонений iy , для формирования которых необходимо ввести переменные состояния ix (t) и вычесть из них, согласно (2.1), текущие программные значения iпрx (t) . Указанная здесь процедура означает введение обратных связей по координатам ix (t) , и поэтому синтез регулятора − это задача поиска законов обратных связей, обеспечивающих наилучшее гашение возмущенного движения iy (t) в соответствии с некоторым выбранным критерием качества переходных процессов, например квадратичного вида. При этом задача синтеза регулятора состоит в определении таких управлений

Yj 1 2 nu (y , y , , y )= ξ L , (2.5) которые совместно с объектом образуют асимптотически устойчивую систему и обеспечивают на траекториях ее движения минимум критерия качества. Выражение (2.5) является законом управления − уравнением регулятора, который, согласно (2.1), представляет собой некоторую совокупность обратных связей, вводимых по координатам ix (t) состояния объекта. В зависимости от выбранных весовых коэффициентов квадратичного критерия в системе (1.1), замкнутой оптимальным регулятором (2.5), протекают соответствующие устойчивые переходные процессы гашения возмущенного движения. Примерами задач синтеза регуляторов (2.5) являются задачи автопилота в авиации, авторулевого в судовождении, следящие системы всевозможного назначения и т.д.

Page 37: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

37

Для разработчиков систем управления более естественным и привычным по сравнению с выражением (2.1) является преобразование координат вида

прY(t) X (t) X(t)= − , (2.6) которое представляет собой так называемое уравнение замыкания системы. Это соотношение непосредственно нашло отражение в универсальной структурной схеме рассматриваемой системы управления (рис. 2.2).

прX (t) X(t)

F(t)прU (t)

YU (t)Y(t) пр YU (t) U (t)+

Рис. 2.2. Общая структурная схема системы управления

Здесь объект управления (ОУ), охвачен отрицательными обратными связями (ОС), а регулятор (Р) на основе текущей информации о координатах объекта формирует требуемое управление. Это управление стремится свести отклонение от программного движения к нулю.

В результате, после окончания переходных процессов, т.е. погашения возмущенного движения, в замкнутой системе (1.1), (2.5) реализуется заданное программное движение.

Подчеркнем, что с точки зрения учения Ляпунова об устойчивости движения, преобразования (2.1) и (2.6) адекватны, но выражение (2.6), на наш взгляд, является более наглядным.

Поставленная задача управления, как отмечалось ранее, есть так называемая задача об аналитическом конструировании оптимального регулятора (АКОР). Здесь она сформулирована более четко и с пояснением ее физической сущности.

2.2 СИСТЕМА ОТНОСИТЕЛЬНЫХ ЕДИНИЦ И УРАВНЕНИЯ

ВОЗМУЩЕННОГО ДВИЖЕНИЯ

Для удобства сравнительного анализа различных систем управления и упрощения исходных дифференциальных уравнений динамики объекта целесообразно выполнить операцию нормирования при помощи системы относительных единиц.

Page 38: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

38

Рассмотрим принцип получения уравнений объекта в относительных координатах и уравнений возмущенного движения на примере силовой части привода постоянного тока с независимым возбуждением при якорном способе управления от управляемого транзисторного преобразователя. При математическом описании объекта управления здесь приняты следующие допущения: – поток возбуждения исполнительного двигателя постоянен (Ф const= ); – упругая деформация валов в системе незначительна; – вязкое и сухое трение на ступенях передач редуктора пренебрежимо мало.

Указанные допущения являются общепринятыми и позволяют описать движение силовой части привода системой линейных дифференциальных уравнений, аналогично системе (1.18):

p д

д яд

м

дд д п

я я я я я

п пп y y max

п п

d (t) K (t) ,dt

d (t) R i (t) ,dt C T

di (t) C 1 1(t) i (t) e (t) ,dt R T T R T

de 1 Ke (t) u (t) , u (t) U ,dt T T

ϕ = ⋅ω

ω = ⋅ Φ ⋅ Φ = − ω − + = − + ⋅ ≤

(2.7)

где i=1, 2; ϕ - угловое положение вала исполнительного механизма; рk -

коэффициент передачи редуктора; ω - угловая скорость двигателя; ям 2

ме

JRTC

= -

электромеханическая постоянная времени якорной цепи двигателя; J - момент

инерции привода, приведенный к валу двигателя; яя

я

LTR

= - электромагнитная

постоянная времени якорной цепи; яR , яL - сопротивление и индуктивность якорной цепи; меC - конструктивная постоянная двигателя; Ф - магнитный поток двигателя; i - ток якорной цепи двигателя; вi – ток цепи обмотки возбуждения двигателя; пe , пK , пT - э.д.с., коэффициент усиления и постоянная времени усилителя-преобразователя мощности, уu - напряжение управления преобразователем.

Структурная схема объекта управления, соответствующая системе (2.7), изображена на рис. 2.3.

Введем относительные координаты:

д1

my

ϕ=

ϕ, д

2m

, д3

m

iy

i= , п

4m

eye

= , y4

m

uu

u= . (2.8)

Здесь mu - максимальное значение напряжения управления; m п me K u= - максимальная электродвижущая сила управляемого преобразователя,

Page 39: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

39

соответствующая mu ; mm

я

eiR

= - ток короткого замыкания двигателя при me ;

mm

eCФ

ω = - скорость идеального холостого хода при me ; m p mKϕ = ω - угол

поворота вала исполнительного механизма за 1 с при скорости вращения вала двигателя mω . Примем п mK e= .

п

п

KT p 1+

я

я

1 RT p 1+

я

м

R CФT p

пKp

уu пeдe−

дi дω ϕ

Рис. 2.3. Структурная схема силовой части привода:

"управляемый преобразователь - двигатель постоянного тока".

С учетом соотношений (2.8) система уравнений (2.7) примет вид

1 12 2

2 23 3

3 32 2 33 3 34 4

4 44 4 4 4

py b y ,py b y ,py b y b y b y ,py b y m u ,

= = = + + = +

(2.9)

где dp ,dt

≡ 12b 1= , 23м

1bT

= , 32 33я

1b bT

= = − ,

34я

1bT

= , 44п

1bT

= − , 4п

1mT

= . (2.10)

Коэффициенты ikb , не входящие в уравнения (2.10), равны нулю. Из множества траекторий движения системы (2.9) выделим невозмущенное

движение как решение системы уравнений

1 12 2

2 23 3

3 32 2 33 3 34 4

4 44 4 4 4

py b y ,

py b y ,

py b y b y b y ,

py b y m u .

∗ ∗

∗ ∗

∗ ∗ ∗ ∗

∗ ∗ ∗

=

=

= + + = +

(2.11)

Произведем замену переменных k k ky y∗η = − , k = 1, ... , 4 (2.12)

Page 40: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

40

и преобразуем уравнения (2.9) в систему дифференциальных уравнений возмущенного движения

1 12 2

2 23 3

3 32 2 33 3 34 4

4 44 4 4

p b ,p b ,p b b b ,p b m u.

η = η η = η η = η + η + η η = η +

(2.13)

Здесь 4 4u u u∗= − дополнительное управление, обеспечивающее невозмущенное движение.

Истинное движение системы будет определяться уравнениями

k k k

4 4

y y , k 1, ,4,

u u u.

= + η =

= +

K (2.14)

Очевидно, если на силовую часть ЭП не подается программное управление 4u∗ , то истинное управление 4u u= .

2.3 ПРИНЦИП ПОСТРОЕНИЯ СИСТЕМ УПРАВЛЕНИЯ С НИЗКОЙ

ЧУВСТВИТЕЛЬНОСТЬЮ К ПАРАМЕТРИЧЕСКИМ И ВНЕШНИМ

ВОЗМУЩЕНИЯМ

В процессе проектирования к системам автоматического управления предъявляются различные требования, главными из которых являются вопросы обеспечения устойчивости, они должны обладать определенными быстродействием и точностью. Последнее требование относится как к установившемуся режиму, так и к переходному процессу. В установившемся режиме точность определяется установившейся ошибкой, а в переходном процессе — величиной отклонения действительного значения регулируемой величины от предписанного. Всем перечисленным противоречивым требованиям удовлетворяют релейные замкнутые системы управления. Построение систем, устойчивых при неограниченном увеличении коэффициента усиления

Теоретически исчерпывающее решение задачи управления нестационарными объектами в условиях действия координатных возмущений дает идея построения систем, устойчивых при неограниченном увеличении коэффициента усиления [19]. Свойствами устойчивости при неограниченном увеличении коэффициента усиления обладают системы, синтезированные с применением квадратичных функционалов качества и ограничении на управляющий сигнал, при этом искомый регулятор трансформируется в релейный, а критерий качества принимает вид, не зависящий от управляющего сигнала. Данный интегральный квадратичный функционал обеспечивает наиболее быстрые переходные процессы отработки рассогласования между действительным значением

Page 41: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

41

регулируемой переменной и ее предписанным значением, так как экстремалью такого функционала является единичная ступенчатая функция.

Такой подход в области линейных законов управления позволяет значительно снизить чувствительность системы к внешним возмущениям и обеспечивает достаточно высокие возможности компенсации параметрических возмущений [20]. Реализация бесконечно больших коэффициентов усиления за счет использования скользящих режимов нелинейных элементов [19, 21 – 23] позволяет при определенных условиях обеспечить нулевую чувствительность систем управления к параметрическим и координатным возмущениям.

Из теории автоматического управления известно, что увеличение коэффициента усиления системы приводит к снижению установившейся ошибки. Поэтому с точки зрения точности целесообразно иметь коэффициент усиления как можно большим. Известно также, что и динамические свойства систем существенно зависят от величины коэффициента усиления.

В простейших одноконтурных системах увеличение коэффициента усиления сверх критического неизбежно приводит к нарушению их устойчивости. В соответствии с теорией синтеза структур, устойчивых при неограниченном увеличении коэффициента усиления, изложенной А.А. Вороновым в [24] и М.В. Мееровым в [19] эффект устойчивости при сколь угодно большом коэффициенте усиления достигается в многоконтурных системах, удовлетворяющих определенным структурным условиям качества. Инвариантность по отношению к внешним возмущениям

М.В. Мееровым показано, что системы автоматического управления с бесконечно большим коэффициентом усиления обладают рядом замечательных свойств. Прежде всего, это свойство инвариантности по отношению к внешним возмущениям. Действительно, для системы с регулированием по отклонению, структурная схема которой приведена на рис. 2.4, передаточная функция по возмущающему воздействию при k → ∞ равна нулю.

1 1

вk 1 2 0

x (p) W (p)Ф (p) 0f (p) 1 k W (p) W (p) W (p)→∞

= = =+ ⋅ ⋅ ⋅

.

Рис. 2.4. Структурная схема системы с регулированием по отклонению

k → ∞

0W (p)

2W (p) 1W (p)

f (p)

1x 1задx

_

Page 42: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

42

Инвариантность по отношению к изменениям параметров объекта управления

В то же время передаточная функция по управляющему воздействию (рис. 2.5) отлична от нуля и не зависит от параметров динамических звеньев прямого канала усиления.

1 1 2у

1зад 1 2 0 0k

x (p) k W (p) W (p) 1Ф (p)x (p) 1 k W (p) W (p) W (p) W (p)→∞

⋅ ⋅= = =

+ ⋅ ⋅ ⋅.

Рис. 2.5. Структурная схема релейной системы Это свидетельствует о том, что система обладает также свойствами

инвариантности по отношению к изменениям параметров объекта управления. Таким образом, релейные замкнутые устойчивые системы обладают рядом

замечательных свойств. Прежде всего, это свойства инвариантности по отношению к внешним возмущениям, а также инвариантности по отношению к изменениям параметров объекта, а это - центральная задача, решаемая в теории автоматического управления. Разрешение противоречия между устойчивостью и точностью

В линейной системе автоматического управления невозможно обеспечить бесконечно большой коэффициент усиления из-за противоречия между устойчивостью и точностью. Однако создание систем управления с теоретически бесконечно большим коэффициентом усиления становится осуществимым, если воспользоваться результатами работ Я.З. Цыпкина [22, 23]. В этих работах доказана эквивалентность релейной системы (рис. 2.5), работающей в скользящем режиме, линейной системе с бесконечно большим коэффициентом усиления. Скользящий режим работы релейных систем

Особенностью замкнутых релейных систем является возможность возникновения скользящих режимов. Скользящий режим работы релейной системы – это специфический режим, заключающийся в том, что при среднем значении сигнала на входе релейного элемента, равном нулю, под действием внутренних обратных связей, охватывающих этот элемент, он переключается с высокой частотой (теоретически с бесконечно высокой) и среднее значение выходного сигнала в это время по абсолютной величине меньше максимального, соответствующего одному из устойчивых положений релейного элемента.

Разработанные математические методы исследования скользящих режимов первоначально были ориентированы на решение задач анализа поведения систем

0W (p)

2W (p) 1W (p)

f (p)

1x 1задx

_

Page 43: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

43

с разрывными управлениями [25]. В то же время уже на ранней стадии развития теории управления было обращено внимание на ряд полезных свойств этого движения: линеаризация системы, понижение порядка дифференциального уравнения системы, возможность построения следящих систем и систем высокой точности. Поэтому наряду с непрерывными линейными регуляторами применялись и регуляторы релейного типа, которые называли вибрационными, если они работали в режиме высокочастотных переключений, или, по современной терминологии, в скользящем режиме. Добавим, что в так называемых вырожденных оптимальных задачах, скользящие режимы также обеспечивали минимум критерия качества при движении на некотором многообразии в пространстве состояний [25 – 27].Существование скользящего режима работы релейного элемента возможно в том случае, если производные от входного сигнала x(t) до переключения x (t)−& и после переключения x (t)+& имеют разные знаки [28], т.е.

x (t) x (t) 0− +⋅ <& & . (2.15) Введение в систему нескольких реле [2] и создание для каждого из них

скользящего режима путем охвата обратными связями совместно с каждым звеном линейной части позволяет устранить влияние большинства параметров на динамические свойства и получить теоретически любой желаемый переходный процесс. Такие системы управления являются как бы "адаптивными", т.к. они сохраняют свои свойства независимо от внутренних (параметрических) изменений и внешних возмущений. Релейные системы управления существенно уменьшают влияние некоторых типов нелинейностей, а также могут обеспечить нулевую статическую ошибку.

Благодаря несложности реализации скользящих режимов синтез релейных систем управления является наиболее простым методом достижения инвариантности к внешним возмущениям и низкой параметрической чувствительности.

Существенно, что в отличие от непрерывных систем с не измеряемыми возмущениями, в которых условия инвариантности предполагают использование бесконечно больших коэффициентов усиления, в релейных (разрывных) системах эквивалентный эффект достигается с помощью конечных управляющих воздействий. Следствием реализации в системе бесконечно большого коэффициента усиления является снижение установившейся ошибки и повышение точности до оптимального значения. Таким образом, синтез релейных регуляторов, работающих в скользящем режиме, является одним из перспективных путей создания высококачественных по точности систем управления. Быстродействующие режимы работы релейных систем

С другой стороны известно, что оптимальные по быстродействию управления также являются разрывными. Оказалось, что оптимальные по быстродействию системы, в свою очередь, также обладают целым рядом замечательных свойств, таких как минимальное время переходных процессов,

Page 44: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

44

обеспечивающее повышение производительности промышленного оборудования; максимально возможная область асимптотической устойчивости системы, позволяющей снизить расход энергии на управление; естественный учет ограничения на управление и координаты, улучшающее условия безопасности функционирования объектов.

Таким образом, для автоматических систем, от которых требуется обеспечение высокой точности и отработки перемещения за минимально возможное время, достаточно универсальным и эффективным для решения целой совокупности задач управления сложными динамическими объектами является класс систем с разрывными управляющими воздействиями. Технический аспект применения систем с разрывными управлениями

В настоящее время с целью повышения быстродействия все чаще и чаще используются электрические безынерционные исполнительные устройства, построенные на базе силовых электронных элементов, которые могут функционировать исключительно в ключевом режиме. Поэтому, даже если применяются непрерывные алгоритмы, управляющее воздействие будет сформировано в виде высокочастотного разрывного сигнала, средняя составляющая которого равна желаемому непрерывному управлению. В такой ситуации представляется более естественным использовать алгоритмы, заранее ориентированные на разрывный характер управляющих воздействий. В качестве регуляторов и датчиков для релейных систем управления могут быть использованы любые стандартные унифицированные элементы, выпускаемые промышленностью.

Page 45: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

45

3 АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ ОПТИМАЛЬНЫХ ПО

ТОЧНОСТИ (БЫСТРОДЕЙСТВИЮ) РЕГУЛЯТОРОВ

В разделе 1.3 отмечалось, что важной особенностью критериев качества вида (1.31) является возможность синтеза САУ, позволяющих неограниченно увеличивать коэффициент усиления системы без потери устойчивости. Неограниченное же увеличение коэффициента усиления системы, как показано в разделе 2.3, приводит к нулевой ошибке системы в услановившемся режиме, т.е. к оптимальной точности, инвариантности по отношению к внешним возмущениям и инвариантности по отношению к изменениям параметров объекта управления.

3.1 ЗАДАЧА СИНТЕЗА ОПТИМАЛЬНОГО ПО ТОЧНОСТИ РЕГУЛЯТОРА

С использованием критерия (1.32) задача управления рассматриваемыми объектами может быть сформулирована следующим образом: на множестве допустимых управлений (1.33) требуется найти закон обратной связи

[ ]1U(t) F X(t)= , образующий совместно с исходным нелинейным объектом (1.27) устойчивую замкнутую систему, доставляющую минимум функционалу (1.32) при переводе объекта управления из начального положения 1 10x (0) x= ,

2 20x (0) x= , ..., n n0x (0) x= в конечное нулевое. После постановки задачи об оптимальном управлении необходимо

проверить ее корректность [29]. Задача считается корректной, если среди всех допустимых управлений (1.33) есть оптимальное. Здесь необходимо решить две проблемы: во-первых, проблема существования класса допустимых управлений, способных перевести объект (1.27) из произвольного состояния 0X(0) X= в конечное нулевое состояние; во-вторых, проблема наличия в классе допустимых управлений (1.33) оптимального, доставляющего минимум функционалу (1.32). Наиболее сложна первая проблема, однако в технических приложениях она практически не рассматривается, поскольку технические системы проектируются таким образом, что они всегда имеют управления, могущие перевести объект из одного состояния в другое. Существование оптимальных управлений в классе допустимых (1.33) для систем общего вида (1.27) доказано в работах [13, 30]. Система уравнений (1.27) полностью попадает под определения теорем существования в этих работах. Следовательно, делаем вывод о том, что оптимальная задача поставлена корректно и имеет решение.

3.2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ СИНТЕЗА ОПТИМАЛЬНЫХ ПО

ТОЧНОСТИ СИСТЕМ УПРАВЛЕНИЯ

Применение современных методов синтеза, приводит к выводу, что необходимым условием оптимальности управления объектом (1.27) по критерию точности (1.32) при ограничении (1.33) является использование релейного закона управления

Page 46: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

46

[ ]U sign (X)= − Ψ . (3.1) Здесь mRΨ ∈ , T

1 2 m[sign( )] [sign( ),sign( ), ,sign( )]Ψ = ψ ψ ψK - вектор, а

[ ]T1 2 m(X), (X), , (X)Ψ = ψ ψ ψK - вектор функций переключения регулятора,

причем 0Ψ = - пересечение поверхностей переключения. Поскольку управление (3.1) предполагает, что функция переключения

существует, поставим задачу поиска не оптимального управления U, а функции Ψ , стоящей под знаком sign в выражении управления (3.1). Таким образом, определение функции переключения Ψ означает одновременно и решение задачи АКОР.

3.2.1 ОСНОВНОЕ ФУНКЦИОНАЛЬНОЕ УРАВНЕНИЕ ДЛЯ ФУНКЦИЙ

ПЕРЕКЛЮЧЕНИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ

Поскольку закон оптимального по точности управления однозначно определяется функцией переключения, сформулируем основную задачу оптимального управления следующим образом: на множестве допустимых оптимальных управлений (1.33) требуется найти функцию переключения (X)Ψ закона обратной связи [ ]1U(t) F X(t)= , образующий совместно с исходным нелинейным объектом (1.27) устойчивую замкнутую систему, доставляющую минимум не зависящему от управляющего сигнала функционалу (1.32) при переводе объекта управления из начального положения 1 10x (0) x= , 2 20x (0) x= ,...,

n n0x (0) x= в конечное нулевое. Для решения задачи используем физическое понятие скорости

проникновения поверхности переключения. Найдем скорость проникновения [31], то есть проекцию вектора относительной скорости изображающей точки на нормаль к пересечению поверхностей переключения 0Ψ = [25] с учетом уравнений объекта (1.27):

G X GA GBUΨ = ⋅ = +& & . (3.2) Здесь строки матрицы G X= ∂ Ψ ∂ размерности m n× являются градиентами функций i (X)ψ .

Функциональное дифференциальное уравнение (3.2) справедливо во всем фазовом пространстве, поскольку оно является обобщенным уравнением объекта (1.27). Функции переключения могут быть определены из функционального уравнения (3.2) при условии существования градиентов функций i (X)ψ . Поскольку функции переключения существуют и являются функциями координат объекта, которые непрерывно изменяются во времени (по крайней мере, для реальных инерционных объектов), то скорости проникновения поверхностей переключения i (X)ψ& также существуют, следовательно, существуют и градиенты функции i (X)ψ . Таким образом, функциональное дифференциальное уравнение (3.2), учитывающее свойства объекта (1.27) и его каналы управления, является эквивалентным по отношению к исходным дифференциальным уравнениям

Page 47: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

47

объекта. Из уравнения (3.2) может быть определен оптимальный по критерию (1.32) закон управления (3.1). Именно поэтому функциональное уравнение (3.2) лежит в основе теории АКОР и дает возможность провести декомпозицию задачи, то есть составить функциональные уравнения для функций переключения каждого управляющего воздействия и, таким образом, решить весьма трудную задачу оптимального управления многомерным объектом высокого порядка и, следовательно, преодолеть "проклятие размерности" Р. Беллмана.

Действительно, из основного функционального уравнения (3.2) следует, что для i-той поверхности переключения

i i i i i i i(X) G A G BU G BU u′ ′′ψ = + + ⋅& ,

где [ ]Ti iG grad( )= ψ , [ ]T

i 1 2 i mU u ,u , u 0, ,u′ = =K K , [ ]Ti iU 0,0, ,u 1, ,0′′ = =K K ,

причем i i iU U U u′ ′′= + ⋅ , т.е. вектор столбец iU′′ содержит только одно ненулевое значение в i-той строке, равное единице. По отношению к i-тому управлению запишем последнее уравнение в виде:

i i i i i i(X) G X f (X,U ) (X) u′ψ = ⋅ = + ϕ ⋅&& , (3.3) где: i i i if (X,U ) G (A BU )′ ′= + , i i i(X) G BU′′ϕ = , (3.4)

i iu sign[ (X)]= − ψ , (3.5) При необходимости вектор iU′ может быть выражен из уравнения (1.27)

через координаты вектора состояния объекта и их производные: i iU U (X,X)′ ′= & . Согласно полученному функциональному уравнению (3.3) производная i-той

функции переключения равна скорости проникновения i-той поверхности переключения i (X) 0ψ = , а сама i-тая функция переключения может быть найдена из линейного дифференциального уравнения первого порядка относительно функции переключения с переменными коэффициентами. Отметим, что для объекта управления (1.27) можно записать m функциональных уравнений (3.3) относительно функций переключения.

Таким образом, из основного функционального уравнения (3.3) следует, что оно позволяет осуществить декомпозицию многомерной задачи на m однотипных задач. Поэтому в дальнейшем будем для сокращения записи опускать индекс i и аргументы функций в уравнениях (3.3) - (3.5):

G X f uψ = ⋅ = + ϕ⋅&& . (3.6) f G(A BU )′= + , GBU′′ϕ = , T

1 2 nG (g ,g , ,g )= K . (3.7) u sign( )= − ψ . (3.8)

Предполагая, что 0ϕ ≠ и производная ϕ& существует, разделим правую и левую части уравнения (3.6) на ϕ

/ f / uψ ϕ = ϕ +& и найдем производную с учетом последнего уравнения

2d f u f udt

∗ ∗ ∗ ψ ψψ = = − + = + ϕ ⋅ ϕ ϕ ϕ & ,

из которого следует, что

Page 48: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

48

u sign( ) sign( )∗= − ψ = − ψ ⋅ϕ . (3.9) Сравнивая полученное выражение (3.9) с (3.8), приходим к выводу, что

функция ϕ в уравнении (3.6) должна быть положительно определенной. Отметим что, функциональное уравнение (3.6) позволяет учесть различные

возмущения, действующие на систему, если их можно выразить в аналитическом виде. При этом соответствующим образом в уравнении (3.6) будут изменяться функции f и ϕ :

1 1 2 2 r rf (X,M ,M , ,M ,M , ,M ,M , )& & &K K K , 1 1 2 2 r r(X,M ,M , ,M ,M , ,M ,M , )ϕ & & &K K K . Однако, для того, чтобы допустимое управление ( u 1≤ ) смогло изменить

знак скорости проникновения ( )ψ& , другими словами, для управляемости объекта (3.6), необходимо (и это следует из уравнения (3.6)) выполнить условие

f | |≤ ϕ , (3.10) в момент переключения реле. Назовем (3.10) условием управляемости.

Пример 3.1 Записать скорость проникновения поверхности переключения для системы:

1 2 1x x u= +& , 2 1 2x x u= − +& , причем на управления наложены ограничения 1| u (t) | 1≤ и 2| u (t) | 1≤ .

Поскольку система имеет два управляющих воздействия, то будет две поверхности переключения. При этом:

1 1 1 11 1 2 2 1 1 2 1 1 2 2 1 1 2 1

1 2 1 2x x (x u ) ( x u ) f (x ,x ,u ) (x ,x ) u

x x x x∂ψ ∂ψ ∂ψ ∂ψ

ψ = ⋅ + ⋅ = ⋅ + + ⋅ − + = + ϕ ⋅∂ ∂ ∂ ∂

& & &

,

где 1 1 11 1 2 2 2 1 2

1 2 2f (x ,x ,u ) x x u

x x x∂ψ ∂ψ ∂ψ

= ⋅ − ⋅ + ⋅∂ ∂ ∂

, 11 1 2

1(x ,x )

x∂ψ

ϕ =∂

.

Аналогично для второй поверхности: 2 2 1 2 1 2 1 2 2f (x ,x ,u ) (x ,x ) uψ = + ϕ ⋅& ,

где 2 2 22 1 2 2 2 1 1

1 1 2f (x ,x ,u ) x u x

x x x∂ψ ∂ψ ∂ψ

= ⋅ + ⋅ − ⋅∂ ∂ ∂

, 22 1 2

2(x ,x )

x∂ψ

ϕ =∂

.

Оптимальные управления для рассматриваемой системы будут: 1 1u sign( )= − ψ , 2 2u sign( )= − ψ .

3.2.2 ОСОБЫЕ УПРАВЛЕНИЯ В НЕЛИНЕЙНЫХ СИСТЕМАХ,

ОПТИМАЛЬНЫХ ПО ТОЧНОСТИ.

При синтезе оптимальных по точности систем на координату управления накладывается ограничение | u | 1≤ и она не вводится в минимизируемый функционал (1.32). Такой критерий оптимальности для системы (1.1) приводит к так называемым вырожденным оптимальным задачам [2, 13, 16, 29, 32 – 34]. При решении данных задач методом принципа максимума возникает управление,

Page 49: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

49

которое из принципа максимума не определяется. Такое управление называется особым, а соответствующая ему траектория движения - особой траекторией.

Использование функций переключения оптимальных регуляторов позволяет не решать проблему особых (вырожденных, сингулярных) управлений в релейных системах. Особые управления при таком подходе получаются автоматически в результате определения оптимальных управлений в скользящих режимах.

Обратимся к функциональному дифференциальному уравнению (3.6), которому удовлетворяют бесконечное множество функций переключения ψ оптимального по критерию (1.32) управления (3.5) объектом (1.27) при ограничении (3.6). В большинстве задач управления конечной целью является переход системы в начало координат ( 1 2 nx 0,x 0, ,x 0= = =K ) пространства состояний, поэтому процесс движения можно условно разбить на два этапа: этап устойчивого движения системы к поверхности переключения (многообразию)

0ψ = под действием управления (3.8) и этап движения, причем не обязательно устойчивого, вдоль многообразия 0ψ = [35]. Функциональное дифференциальное уравнение (3.6) справедливо во всем фазовом пространстве, поскольку оно является следствием уравнений объекта (1.27), однако из него, к сожалению можно определить оптимальное управление только на первом этапе движения системы к многообразию 0ψ = , на втором этапе при движении в скользящем режиме вдоль многообразия 0ψ = управление (его называют особым) не определяется из формулы (3.8), однако уравнение (3.6) позволяет его определить: в силу 0ψ = и, следовательно, 0ψ =& можно записать алгебраическое уравнение метода эквивалентного управления [45]:

2f u 0ψ = + ϕ⋅ =& . Из последнего соотношения следует, что на втором этапе при движении

системы вдоль многообразия 0ψ = в силу оптимального управления (3.8) появляется эквивалентное [25] (особое) управление

2fu = −ϕ

и не определяемое из принципа максимума Л.С. Понтрягина, при этом система не обязательно будет устойчивой (она будет устойчива относительно многообразия

0ψ = ), но если система устойчива, то особое управление оптимально. В реальных системах характеристики реле не идеальны, в результате

управление изменяет знак несколько позже, чем изменяется знак ψ , поэтому эквивалентное управление можно представить в виде:

2f

u sign(f )= − ⋅ϕ

,

причем подсигнатурная функция f играет роль функции переключения 2 fψ = при движении системы вдоль многообразия 1 0ψ = ψ = .

Page 50: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

50

Таким образом, реальные системы, оптимальные по критерию качества, который явно не зависит от управляющего сигнала (системы оптимальные по точности), являются релейными, т.е. с релейным управляющим воздействием.

Пример 3.2 Рассмотрим систему: 1 2x x=& , 2 2x x u= − +& , | u(t) | 1≤ . Запишем скорость проникновения поверхности переключения:

1 2 1 2f (x ,x ) (x ,x ) uψ = + ϕ ⋅& ,

где 1 2 2 21 2

f (x ,x ) x xx x

∂ψ ∂ψ= ⋅ − ⋅

∂ ∂, 1 2

2(x ,x )

x∂ψ

ϕ =∂

. Используем условие

управляемости (3.10): 2 21 2 2

x xx x x

∂ψ ∂ψ ∂ψ⋅ − ⋅ ≤

∂ ∂ ∂. Выберем, например

11

x∂ψ

=∂

;

22

| x |x

∂ψ=

∂. Подставляя выбранные величины в условие управляемости, получим:

20 | x | 2≤ ≤ . Поскольку из уравнений рассматриваемой системы следует, что координата 2| x | 1≤ (по крайней мере, для позиционных и следящих систем), следовательно, скорость проникновения поверхности переключения можно записать в виде: 2 2 2 2x | x | x | x | uψ = − ⋅ + ⋅& . Подставляя уравнения системы, получим: 1 2 2x | x | xψ = + ⋅& & & . Наконец, интегрируя последнее уравнение, имеем:

1 2 2x | x | x / 2ψ = + ⋅ , при этом оптимальное управление будет: 1 2 2u sign(x | x | x / 2)= − + ⋅ .

Как только под действием оптимального управления ψ станет равным нулю, возникает особое управление, которое можно определить из уравнения метода эквивалентного управления: 0ψ =& : 2 2 2u x sign(x )= − и представить в виде

2 2 2u (1 | x |) sign(x )= − − ⋅ , из которого следует, что особое управление 2u направлено на уменьшение модуля координаты 2x с течением времени.

Пусть начальное состояние системы характеризуется координатами: 10x 0> , 20x 0= . Тогда управление первого интервала u 1= − (рис. 3.1), под действием которого система будет приближаться к поверхности 0ψ = , при этом координата

2x становится отрицательной и увеличивается по модулю.

Рис. 3.1 - График оптимального и эквивалентного (особого) управления.

Page 51: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

51

Пусть в конце первого интервала координата 1x2 −= . При этом особое управление второго интервала: 1xu 22 += - в начале интервала становится скачкообразно равно нулю (рис. 3.1), затем плавно увеличивается и в конце второго интервала (при 0x2 = ) будет равно единице, после чего наступает скользящий режим с теоретически бесконечной частотой переключения реле ( )x(signu 22 −= при 0x2 = ). В силу неидеальности реле особое управление второго интервала можно представить релейным (рис. 3.1).

3.2.3 ПРИНЦИП ДЕКОМПОЗИЦИИ В РЕШЕНИИ ЗАДАЧ

ОПТИМАЛЬНОЙ ТОЧНОСТИ МЕТОДОМ ДИНАМИЧЕСКОГО

ПРОГРАММИРОВАНИЯ БЕЛЛМАНА

При решении задач оптимальности методом динамического программирования Беллмана предполагается, что функция Беллмана непрерывна и всюду имеет непрерывные частные производные по всем своим аргументам. В системах оптимальных по точности с релейным характером управления предположение о гладкости функции Беллмана не выполняется. Однако, применение для решения задач функций переключения позволяет воспользоваться принципом декомпозиции и разбить все движение системы на ряд участков, для каждого из которых функции Беллмана будут непрерывны и функциональные уравнения Беллмана будут справедливы.

Докажем последнее утверждение. Запишем уравнение Беллмана для эквивалентного объекта на первом интервале (аналогично и на i–том интервале) и критерия (1.32):

0u

Smin F 0 ∂+ ⋅ψ = ∂ψ

& (3.11)

Здесь S - функция Беллмана. Уравнение (3.11) с учетом уравнения (3.6) примет вид:

0u

S Smin F f u 0 ∂ ∂+ ⋅ + ⋅ϕ⋅ = ∂ψ ∂ψ

. (3.12)

Подставим оптимальное управление (3.8) в (3.12) и найдем производную

( )( )

( )00 F signFS

f | | sign | | f sign⋅ ψ∂

= − =∂ψ − ϕ ⋅ ψ ϕ − ⋅ ψ

. (3.13)

При движении системы под действием управления (3.8) на интервале от 0 (X(0))ψ = ψ до многообразия (X) 0ψ = функция (X)ψ не меняет знака.

Поскольку функции f ϕ и 0F являются функциями координат объекта, которые непрерывно изменяются во времени (по крайней мере для реальных инерционных объектов), то из (3.13) следует, что производная S∂ ∂ψ на интервале от 0ψ до

(X) 0ψ = непрерывна и функция S( )ψ является непрерывно дифференцируемой.

Page 52: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

52

Рассмотрим момент времени, при котором система достигает поверхности переключения 0ψ = . Пусть условие управляемости (3.10) в этот момент 0ψ = не выполняется, то есть f > ϕ и 0ϕ > . Из (3.6) следует, что знак скорости ψ& при этом не изменяется, несмотря на изменение знака ψ и знака управляющего сигнала. Это означает, что движение к поверхности переключения 0ψ = еще не закончено (система проскочила поверхность переключения), то есть еще продолжается первый этап движения системы к поверхности переключения

0ψ = . Такое может быть только в том случае, если движение носит колебательный характер относительно поверхности переключения. Из соотношения (3.13) видно, что в этом случае при изменении знака ψ производная

S∂ ∂ψ остается непрерывной и функция S( )ψ остается непрерывно дифференцируемой.

Если условие управляемости (3.10) в момент достижения 0ψ = выполняется, то из (3.13) следует, что производная S∂ ∂ψ имеет разрыв в точке 0ψ = . Это ставит под сомнение справедливость функционального уравнения Беллмана. Однако, как это следует из (3.6), знак скорости ψ& при этом изменится одновременно с изменением знака управляющего сигнала (изображающая точка не уходит с поверхности переключения), что означает окончание первого этапа движения системы к поверхности переключения и начало второго этапа движения системы вдоль (по) многообразия (X) 0ψ = . Таким образом, функция S( )ψ при движении системы на интервале от 0ψ до многообразия (X) 0ψ = является непрерывно дифференцируемой. Это позволяет заключить о справедливости равенства (3.12).

Замечание 1. Отметим здесь важный вывод о том, что процесс сближения изображающей точки фазового пространства с поверхностью переключения

(X) 0ψ = может носить как апериодический, так и колебательный характер. При этом точка фазового пространства, двигаясь по естественной траектории системы, либо втыкается в поверхность и затем движется вдоль этой поверхности либо "прошивает" поверхность переключения.

В первом случае | (X) |ψ уменьшается апериодически и как только точка попадет на поверхность переключения, (X)ψ станет равно нулю и (X)ψ& (в общем случае за счет скользящего режима) также будет равно нулю. При этом для перевода объекта на многообразие (X) 0ψ = потребуется всего один интервал максимального значения управления u 1= ± (рис 3.2а).

Во втором случае | (X) |ψ уменьшается колебательно (рис. 3.2б), в зависимости от колебательных свойств системы и положения точки 0X в фазовом пространстве (начальной величины 0(X )ψ ), потребуется несколько чередующихся по знаку интервалов максимального значения управления (например, рис. 3.2б соответствует четырем интервалам). Перед тем как точка фазового пространства окажется окончательно на поверхности (X) 0ψ = и будет двигаться вдоль поверхности, она несколько раз пересечет поверхность

Page 53: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

53

переключения в одном и затем в другом направлении под действием изменяющегося по знаку управления u sign( )= − ψ .

Рис. 3.2 – Способы движения изображающей точки системы к поверхности переключения (X) 0ψ = (до точки А): а) апериодически; б) колебательно. Замечание 2. Поскольку метод динамического программирования в

дальнейшем изложении будет всегда применяться к эквивалентному объекту (3.6) только на интервале от начального значения 0ψ = ψ до 0ψ = , то функциональное уравнение Беллмана (3.12) будет всегда справедливо.

Из уравнения Беллмана (3.12) следует, что оптимальное управление Su sign ∂

= − ⋅ϕ ∂ψ . (3.14)

Сравнивая выражения (3.14) и (3.9), получим SH(X) ∂

ψ = ⋅∂ψ

или S K(X)∂= ⋅ψ

∂ψ, (3.15)

где H(X) и K(X) – некоторые положительно определенные функции H(X) 1 K(X) 0= > , не влияющие на оптимальный закон управления (3.9). Замечание 3. Будем называть объект неосциллирующим, если процесс движения объекта к поверхности переключения (X) 0ψ = происходит апериодически, в противном случае колебательного движения объекта к поверхности переключения (X) 0ψ = будем называть объект осциллирующим.

3.2.4 КРИТЕРИЙ ОПТИМАЛЬНОСТИ СИСТЕМ С РЕЛЕЙНЫМ

УПРАВЛЕНИЕМ

Воспользуемся методом, аналогичным методу итераций: по критерию (1.32) было найдено при помощи метода Беллмана или принципа максимума Понтрягина оптимальное управление (3.8); здесь же по известному управлению (3.8), используя предлагаемый подход, найдем критерий оптимальности,

Page 54: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

54

соответствующий этому управлению. Из уравнения Беллмана (3.11) следует, что для системы с оптимальным управлением (3.8) при 0ϕ > подынтегральная функция 0F критерия (1.32) на интервале от 0ψ до 0ψ = должна быть равна

0SF ∂

= − ⋅ψ∂ψ

&

или, подставляя (3.15), (3.6) и (3.8), получим выражение 0F K K | | [ f sign( )]= − ⋅ψ ⋅ψ = ⋅ ψ ⋅ ϕ − ⋅ ψ& , (3.16)

из которого следует, что если условие управляемости (3.10) выполняется, то должно быть 0F 0> и наоборот, если в критерии оптимальности (1.32) 0F 0> , то должно выполняться условие управляемости (3.10) в моменты переключения реле, а если условие (3.10) не выполняется в моменты переключения реле, то должно выполняться условие:

f sign( ) 0− ⋅ ψ < (3.17) Подставляя управление (3.14) в уравнение (3.12), имеем

0S SF f 0∂ ∂

+ ⋅ − ⋅ϕ =∂ψ ∂ψ

. (3.18)

Из уравнения (3.18) следует, что функционал качества (1.32) будет равен T T

00 0

S SJ F (X)dt f dt ∂ ∂

= = ⋅ϕ − ⋅ ∂ψ ∂ψ ∫ ∫ . (3.19)

В полученном критерии (3.19) первое слагаемое в подынтегральном выражении представляет собой модуль от сигнала на входе релейного элемента в соответствии с формулой (3.14), а интеграл от первого слагаемого это "расход сигнала управления", введенный А.А. Красовским в функционал обобщенной работы для облегчения решения задачи АКОР. Поскольку в известных литературных источниках отсутствуют данные о методике строгого решения нелинейного уравнения, аналогичного уравнению (3.18), то для решения задачи А.А. Красовский вынужден был ввести в функционал качества "расход сигнала управления". Функционал (3.19) доказывает правомерность такого подхода к решению задачи.

Итак, в функционале качества (1.32) должен присутствовать "расход сигнала управления":

( ) ( )T T

0 00 0

SJ F X dt f X dt ∂

= = + ⋅ϕ ∂ψ ∫ ∫ . (3.20)

Поскольку управление (3.14) с использованием формул (3.15) можно записать в виде

( )Su sign sign K(X) sign( ) ∂= − ⋅ϕ = − ⋅ψ ⋅ϕ = − ψ ⋅ϕ ∂ψ

,

где произведение ( )ψ ⋅ϕ также представляет собой сигнал на входе релейного элемента, а K(X) 0> - однозначно определяется функциями (X)ψ и (X)ϕ , то функционал (3.20) может быть представлен в форме

Page 55: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

55

( ) ( )T T

0 00 0

J F X dt f X dt= = + ψ ⋅ϕ ∫ ∫ . (3.21)

Критерий качества (3.20) или (3.21) по аналогии с критерием А.А. Красовского будем называть критерием обобщенной работы для систем с релейным управлением (для систем, оптимальных по точности) в связи с тем, что второе слагаемое в формуле (3.20) или (3.21) имеет физический смысл "расхода сигнала управления", как и в критерии А.А. Красовского.

Подставляя 0F из (3.20) в (3.18), получим уравнение

0Sf f 0∂

+ ⋅ =∂ψ

,

из которого следует, что при ( )0f X 0> , Ssign f 1 ∂

⋅ = − ∂ψ , (3.22)

что хорошо согласуется с выводом, следующим из выражения (3.16), при этом

0Sf f∂

= ⋅∂ψ

,

а функционал (3.19) примет вид T T

00 0

S SJ F (X)dt f dt ∂ ∂

= = ⋅ + ⋅ϕ ∂ψ ∂ψ ∫ ∫ .

или T T

0 0

S f fJ 1 dt K(X) 1 dt ∂

= ⋅ϕ ⋅ + = ⋅ ψ ⋅ϕ ⋅ + ∂ψ ϕ ϕ ∫ ∫ . (3.23)

Из последних уравнений видно, что функционал (3.23), а следовательно и функционал (1.32) для оптимальных систем с разрывным управлением, т.е. для систем оптимальных по точности пропорционален при ( )0f X 0> "расходу сигнала управления".

Таким образом, все управления (3.8), соответствующие функциональному уравнению (3.6) при ( )0f X 0> , оптимальны по критерию обобщенной работы с "расходом сигнала управления", зависящим от соотношения функций f и ϕ в функциональном уравнении (3.6). Другими словами критерий обобщенной работы А.А. Красовского одновременно является и критерием точности или критерий точности необходимо должен быть критерием обобщенной работы.

Пример 3.3 Записать критерий быстродействия в виде критерия обобщенной

работы.

Как известно критерий быстродействия имеет вид T

00

J F (X)dt= ∫ , где

0F (X) 1= .

Page 56: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

56

Критерий обобщенной работы может быть записан в форме

( ) ( )T T

0 00 0

J F X dt f X K(X) (X) (X) dt= = + ⋅ ψ ⋅ϕ ∫ ∫ , где K(X) 0> . Приравнивая

выражения, стоящие под интегралами этих критериев, получим: ( )0f X 1 K(X) (X) (X)= − ⋅ ψ ⋅ϕ - для критерия быстродействия. Пример 3.4. Записать критерий экстремальной системы в виде критерия

обобщенной работы.

Для критерия экстремальной системы 1 2 n0 k

k

Q(x ,x , ,x )F (X) x (t)x

∂= ⋅ ∆

∂K , при

этом критерий обобщенной работы для экстремальной системы

( ) ( )T T

0 00 0

J F X dt f X K(X) (X) (X) dt= = + ⋅ ψ ⋅ϕ ∫ ∫ ,

где ( ) 1 2 n0 k

k

Q(x ,x , ,x )f X x (t) K(X) (X) (X)x

∂= ⋅ ∆ − ⋅ ψ ⋅ϕ

∂K .

Для определения оптимального управления на втором этапе движения

объекта необходимо рассмотреть некоторые свойства функционального уравнения (3.6) и влияние его составляющих на движение системы.

3.2.5 СВОЙСТВА ОСНОВНОГО ФУНКЦИОНАЛЬНОГО УРАВНЕНИЯ И

ФУНКЦИЙ ПЕРЕКЛЮЧЕНИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ

Уравнения (3.6) и (3.8) определяют множество допустимых законов управления, обеспечивающих перевод объекта (1.27) из произвольного начального состояния в окрестность многообразия (X) 0ψ = . Из этих законов необходимо выбрать такие, которые удовлетворяли бы требуемым условиям поставленной задачи оптимального управления.

Для облегчения выбора законов управления, удовлетворяющих требуемым условиям, рассмотрим некоторые свойства функций переключения оптимального управления (3.8).

1. Свойства функциональных уравнений 1.1. Функциональное уравнение (3.2), составленное для нелинейного

многомерного объекта (1.27) с целью определения оптимальной функции переключения (и оптимального управления), позволяет воспользоваться принципом декомпозиции и получить функциональные уравнения для каждого канала управления.

1.2. Для того чтобы управление (3.8) для объекта (1.27) было оптимальным по критерию (1.32) при ограничении (1.33) необходимо, чтобы функция переключения (X)ψ удовлетворяла линейному дифференциальному уравнению (3.6) первого порядка, в котором функции f (X,U )′ и (X)ϕ зависят от координат вектора состояния объекта. Однако обратное утверждение не всегда верно,

Page 57: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

57

поскольку необходимо знать условия, которым должны удовлетворять функции f (X,U )′ и (X)ϕ .

1.3. Оптимальное управление для объекта (1.27) по критерию (1.32) при ограничении (1.33) определяется только функцией переключения в соответствии с формулой (3.8), в оптимальное управление непосредственно не входят составляющие f (X,U )′ и (X)ϕ функционального уравнения (3.6), однако (X)ψ зависит от f (X,U )′ и (X)ϕ .

1.4. Для того, чтобы управление (3.8) для объекта (1.27) было оптимальным по критерию (1.32) при ограничении (1.33) необходимо и достаточно определить матрицу G X= ∂ Ψ ∂ или, что то же самое, необходимо и достаточно определить структуру составляющих f (X,U )′ и (X)ϕ основного функционального уравнения.

1.5. Если матрица G X= ∂ Ψ ∂ известна, то оптимальное управление для объекта (1.27) по критерию (1.32) при ограничении (1.33) определяется интегрированием уравнения (3.6):

(X) G(X) X dt Cψ = ⋅ ⋅ +∫ & , где i ig x= ∂ψ ∂ ; С - постоянная интегрирования.

Первые пять свойств следуют непосредственно из основного функционального уравнения.

1.6. Один из коэффициентов матрицы G функционального уравнения (3.6) можно принять равным единице.

Пусть, например, координата 1x является выходной координатой системы. Поскольку для оптимального управления (3.8) нужен лишь знак функции переключения (X)ψ , а функция (X)ψ равна нулю на поверхности переключения, то ее часто можно записать в виде: 1 2 3 n(X) x (x ,x , ,x )∗ψ = + ψ K , следовательно, первый коэффициент матрицы G будет равен:

1

(X) 1x

∂ ψ=

∂.

1.7. Для того чтобы управление (3.8) было оптимальным по критерию (1.32), необходимо, чтобы функция (X)ϕ , стоящая сомножителем при сигнале управления в функциональном уравнении (3.6) была положительно определенной.

Представим (X)ϕ в следующем виде: sign( )ϕ = ϕ ⋅ ϕ

и подставим в функциональное уравнение (3.6): (X) f (X) | (X) | u∗ψ = + ϕ ⋅& ,

где u u sign( )∗ = ⋅ ϕ . Из последнего соотношения следует, что функция (X)ϕ должна быть

положительно определенная.

Page 58: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

58

2. Скользящие режимы 2.1. Для возникновения и существования скользящего режима необходимо и

достаточно, чтобы коэффициенты f (X,U )′ и (X)ϕ функционального уравнения (3.6) удовлетворяли неравенствам

| f (X,U ) | (X)′ ≤ ϕ , (X) 0ϕ > (3.24) в моменты переключения реле.

Свойство 2.1 можно доказать, если вспомнить, что скользящий режим возникает всякий раз, когда скорость проникновения меняет знак на поверхности переключения, при этом изображающая точка "скользит" вдоль плоскости переключения при (X) 0ψ = [28, 31]. Обозначая скорость проникновения до переключения за −ψ& , а после переключения как +ψ& , запишем условие скользящих режимов в виде:

0− +ψ ⋅ψ <& & . Пусть, например, до переключения управление было u 1− = − , а после

переключения стало u 1+ = + или наоборот, тогда подставляя соответствующие производные от функции переключения из уравнения (3.6) в последнее неравенство, будем иметь

2 2f (X,U ) (X) 0− + ′ψ ⋅ψ = − ϕ <& & . Учитывая свойство 1.7, получим неравенство (3.24), которое можно назвать

условием скользящих режимов. Отметим, что оно совпадает с условием управляемости (3.10).

2.2. При выполнении условий (3.24) скользящий режим наступает сразу же после первого переключения.

2.3. При выполнении условий (3.24) возникает скользящий режим с эквивалентным управлением в смысле [25]:

2f (X,U ) | f (X,U ) |u sign[f (X,U )]

(X) (X)′ ′

′= − = − ⋅ϕ ϕ

, (3.25)

которое в свою очередь будет разрывным, причем 2| u | 1< . Действительно, с момента первого переключения (X)ψ становится равной

нулю [25], при этом (X) 0ψ =& и из уравнения (3.6) следует (3.25). 2.4. При выполнении условий (3.25), в момент первого переключения

происходит скачкообразное сжатие фазового пространства (фазового потока) и размерность пространства состояний объекта регулирования уменьшается на единицу.

В самом деле, с момента первого переключения (X) 0ψ = , при этом из свойства 1.6 следует, что 1 2 3 nx (x ,x , , x )∗= −ψ K . Подставляя последнее соотношение в уравнения (1.27) и (3.25), приходим к выводу о сжатии фазового пространства, в котором уже не будет координаты 1x :

2 3 n2 2 3 n

2 3 n

| f (x ,x , ,x ,U ) |u sign[f (x ,x , ,x ,U )](x ,x , ,x )

′′= − ⋅

ϕK

KK

Page 59: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

59

Итак, условия (3.24) можно назвать условиями сжатия фазового пространства для систем, работающих в скользящем режиме.

2.5. Если функцию f (X,U )′ в эквивалентном управлении (3.25), а следовательно, и в уравнении (3.6) принять за эквивалентную функцию переключения 2 2 3 n(x ,x , ,x ) f (X,U )′ψ =K , то по отношению к эквивалентной функции переключения 2ψ справедливы все рассмотренные выше и далее свойства. Например, при применении последовательно (n 1)− раз свойства 2.1, фазовое пространство постепенно сжимается до единицы, причем

n n 1 2| u | | u | | u | | u | 1−< < < < =K , i 1 i ni i

i 1 i n

| f (x , x ,U ) |u sign( )(x , x )

′= − ⋅ ψ

ϕK

K,

i 2,3, ,n= K , а последняя функция переключения n nxψ = .

3. Минимум "расхода сигнала управления" 3.1. Если функцию переключения и ее составляющие выбрать так, чтобы

основное функциональное уравнение (3.6) приняло вид (X) (X) uψ = ϕ ⋅& (3.26)

при f (X,U ) 0′ = (3.27)

то управление (3.8) будет оптимальным по критерию (3.20), в котором 0f (X) 0= , т.е. будет оптимальным по критерию "расхода сигнала управления"

T

0

J | (X) (X) | dt= ϕ ⋅ψ∫ , (3.28)

Можно несколько иначе сформулировать данное свойство: • Для того чтобы управление (3.9) u sign( )= − ψ ⋅ϕ для объекта (1.27) было оптимальным по критерию "расхода сигнала управления" при ограничении (3.6) необходимо и достаточно выполнения условия (3.27) для функционального уравнения (3.6). Докажем необходимость условия (3.27). Пусть функциональное уравнение

имеет вид (3.6). Покажем, что управление (3.9), переводящее объект (1.27) из начального состояния 0(0)ψ = ψ в нулевое конечное t(t) 0→∞ψ = при ограничении | u | 1≤ будет оптимально по "расходу сигнала управления" и при этом необходимо выполнить условие (3.27).

Действительно, из критериев (3.23) или (3.19) следует, что они будут критериями "расхода сигнала управления" при условии f (X,U ) 0′ = . При этом в критерии (3.20) ( )0f X 0= .

Покажем, что управления (3.9), переводящего объект управления (3.26) из начального состояния 0(0)ψ = ψ в нулевое конечное t(t) 0→∞ψ = при ограничении | u | 1≤ , будет достаточно для оптимальности по "расходу сигнала управления".

Page 60: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

60

Составим функциональное уравнение Беллмана с учетом уравнения объекта (3.26) и оптимального управления (3.9)

0SF ( sign( ) 0 ∂

+ ⋅ϕ⋅ − ψ ⋅ϕ = ∂ψ .

Учитывая, что S K∂= ⋅ψ

∂ψ, K 0> находим

0SF K | | ∂

= ⋅ ψ ⋅ϕ = ⋅ϕ∂ψ

.

3.2. При выполнении условия (3.27) скользящий режим наступает сразу же после первого переключения, однако, эквивалентное управление эквu 0= .

3.3. При выполнении условия (3.27) скачкообразное сжатие фазового пространства и уменьшение размерности пространства состояний объекта регулирования на единицу происходит только один раз в момент первого переключения.

3.4. Поскольку при выполнении условия (3.27) объект (1.27) или эквивалентный ему объект (3.26) сразу же после первого переключения остается без управления ( эквu 0= при движении системы вдоль 0ψ = ), то для того, чтобы положение равновесия системы (1.27) было устойчиво в смысле Ляпунова, необходимо и достаточно, чтобы неуправляемый объект (1.27) пониженной размерности был устойчив.

4. Быстродействующие режимы осциллирующих систем 4.1. Для оптимального по быстродействию управления осциллирующим

объектом необходимо, чтобы коэффициенты f (X,U )′ и (X)ϕ основного функционального уравнения для функции переключения (3.6) удовлетворяли условию

| f (X,U ) | (X) 0′ ≥ ϕ > (3.29) в каждый момент времени.

Действительно, скользящий режим не возникает, если скорость проникновения не меняет знака на поверхности переключения, при этом фазовая траектория либо имеет продолжение за поверхностью переключения, либо принадлежит поверхности переключения [25, 28, 31], то есть происходит движение системы по кускам фазовых траекторий с переключениями на поверхности (X) 0ψ = и приближением к центру фазового пространства (по крайней мере, для устойчивого объекта). Следовательно, необходимым, но не достаточным условием для оптимального по быстродействию управления является отсутствие скользящих режимов вплоть до центра фазового пространства. Запишем это условие в виде

0− +ψ ⋅ψ ≥& & и повторяя доказательство свойства 2.1, получим условие (3.29).

4.2. Если условие (3.29) рассматривать как строгое неравенство, то эквивалентного управления при (X) 0ψ = не возникает, так как в противном

Page 61: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

61

случае необходимо потребовать выполнения неравенства 2| u | 1> , что невозможно по условию задачи. Это подтверждает вывод о том, что (X)ψ после переключения не остается равной нулю и поэтому сжатия фазового пространства не происходит, что свидетельствует о колебательном характере процесса управления.

4.3. Для того чтобы в результате действия управления (3.8) в осциллирующей системе (1.27) или (3.6) при (X) 0ϕ > функция переключения

(X)ψ стала и оставалась равной нулю, необходимо и достаточно, чтобы выполнялось условие

| f (X,U ) | (X)′ = ϕ , начиная с момента времени, когда (X) 0ψ = и (X) 0ψ =& .

Пусть функция переключения (X)ψ в результате действия управления (3.8), начиная с некоторого момента времени остается равной нулю. Тогда

(X) f (X,U ) (X) u 0′ψ = + ϕ ⋅ =& и возникающее эквивалентное управление будет равно

2f (X,U ) | f (X,U ) |u sign[f (X,U )]

(X) (X)′ ′

′= − = − ⋅ϕ ϕ

,

причем для 2| u | с учетом (3.29) должно выполняться условие

2| f (X,U ) || u | 1

(X)′

= ≥ϕ

,

однако, по условию задачи оптимальное управление никогда не может быть больше единицы, следовательно, для того, чтобы функция переключения (X)ψ в результате действия управления (3.8), начиная с некоторого момента времени стала и оставалась равной нулю, необходимо выполнить условие | f (X,U ) | (X)′ = ϕ .

Предположим, что, начиная с какого-то определенного момента времени, выполняется условие | f (X,U ) | (X)′ = ϕ . Покажем, что этого условия достаточно для того, чтобы функция переключения при дальнейшем движении системы оставалась равной нулю. Подставим это условие в функциональное уравнение (3.6):

(X) f (X,U ) | f (X,U ) | u′ ′ψ = + ⋅& . Из последнего уравнения следует, что при очередной смене знака

управления на поверхности переключения (X) 0ψ = , скорость проникновения (X)ψ& станет равной нулю и продолжения фазовой траектории за поверхностью

переключения не будет, дальнейшее движение системы будет происходить точно по поверхности переключения и функция переключения (X)ψ останется равной нулю.

4.4. При выполнении условий (3.29) для осциллирующих объектов сжатие фазового пространства наступает не сразу после первого переключения, а после нескольких переключений в зависимости от осциллирующих свойств системы. Сжатие фазового пространства произойдет только тогда, когда коэффициенты

Page 62: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

62

f (X,U )′ и (X)ϕ функционального уравнения (3.6) будут соответствовать условию | f (X,U ) | (X)′ = ϕ , которое можно назвать условием сжатия фазового пространства систем, оптимальных по быстродействию.

4.5. Как только при очередном переключении будет выполняться условие сжатия фазового пространства систем, оптимальных по быстродействию | f (X,U ) | (X)′ = ϕ , возникает разрывное эквивалентное управление

2 2 3 nu sign[f (x ,x , ,x ,U )]′= − K . 4.6. При применении последовательно (n 1)− раз свойства 4 можно выписать

равенства: n n 1 2| u | | u | | u | | u | 1−= = = = =K ,

а последнее эквивалентное управление n nu sign(x )= − переводит объект (1.27) по линии переключения в начало координат.

5. Быстродействующие режимы неосциллирующих систем. 5.1. Для оптимального по быстродействию управления неосциллирующими

объектами необходимо и достаточно, чтобы коэффициенты f (X,U )′ и (X)ϕ основного функционального уравнения (2.5) удовлетворяли условию

| f (X,U ) | (X) 0′ = ϕ > . (3.30) Необходимость условия (3.30) следует из свойства 4. Пусть условие (3.30) выполняется. Это означает, что сразу же после первого

переключения движение системы должно происходить точно по поверхности переключения или, другими словами, поверхность переключения должна точно совпадать с естественной фазовой траекторией системы. Следовательно, условия (3.30) достаточно для оптимального по быстродействию управления неосциллирующими объектами.

5.2. При выполнении условия (3.30) скользящего режима не возникает. 5.3. При выполнении условия (3.30), в момент первого переключения

размерность пространства состояний объекта регулирования скачкообразно уменьшается на единицу.

5.4. При выполнении условия (3.30), с момента первого переключения возникает разрывное эквивалентное управление

2 2 3 nu sign[f (x ,x , ,x ,U )]′= − K . 5.5. При применении последовательно (n 1)− раз свойства 5 получим:

n n 1 2| u | | u | | u | | u | 1−= = = = =K , причем последнее эквивалентное управление n nu sign(x )= − переводит объект (1.9) по линии переключения в начало координат.

6. Инвариантные преобразования 6.1. Функцию переключения (X)ψ можно умножать или делить на любую

положительно определенную функцию (X,X,U)Φ & . Данное утверждение следует непосредственно из закона управления (3.8),

так как любая положительно определенная функция (X,X,U)Φ & не влияет на знак управляющего воздействия и ее можно вынести за знак функции sign. Свойство

Page 63: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

63

6.1 свидетельствует о том, что движение эквивалентной системы (3.6) или исходной (1.27) с управлением (3.8) всегда одно и то же, но имеет место неоднозначность в способах организации поверхности переключения. Оказывается, что одни и те же моменты времени переключения управления можно реализовать различными поверхностями разрыва. Другими словами движение системы с управлением (3.8) инвариантно к оговоренному выше преобразованию поверхностей разрыва.

6.2. Правую часть функционального уравнения (3.6) можно умножать или делить на любую положительно определенную функцию (X,X,U)Φ & .

Умножим правую и левую части уравнения (3.6) на (X,X,U) 0Φ >& : (X) Ф(X,X,U) f (X,U ) Ф(X,X,U) (X) Ф(X,X,U) u′ψ ⋅ = ⋅ + ϕ ⋅ ⋅& & && .

Обозначим левую часть последнего уравнения за новую производную от новой функции переключения

(X) Ф(X,X,U)′ψ = ψ ⋅ && & и перепишем функциональное уравнение, оставив прежнее обозначение для новой искомой функции переключения:

(X) f (X,U ) Ф(X,X,U) (X) Ф(X,X,U) u′ψ = ⋅ + ϕ ⋅ ⋅& && . Для того, чтобы оптимальное управление, а следовательно, и новая функция

переключения удовлетворяли критерию (3.20), необходимо, в соответствии со свойством 2 выполнения условий

| f (X,U ) Ф(X,X,U) | (X) Ф(X,X,U)′ ⋅ ≤ ϕ ⋅& & , (X) Ф(X,X,U) 0ϕ ⋅ >& , которые с учетом (X,X,U) 0Φ >& легко приводятся к условиям (3.24). Это означает, что условие скользящих режимов и условие управляемости не изменяется при умножении правой части функционального уравнения (3.6) на положительно определенную функцию (X,X,U)Φ & . Следовательно, не изменяются и моменты перехода новой функции переключения через нуль.

Таким образом, для одного и того же оптимального по критерию (3.20) управления, может быть составлено бесконечное множество функциональных уравнений (3.6) относительно функций переключения с одними и теми же моментами переключения.

Инвариантные преобразования дают возможность из всех способов реализации управляющих воздействий выбрать такой, для которого проще найти функцию переключения и реализовать оптимальный регулятор, и эти преобразования будут использоваться при синтезе разрывных динамических систем.

3.2.6. КОЛИЧЕСТВО ИНТЕРВАЛОВ УПРАВЛЕНИЙ В РЕЛЕЙНЫХ

СИСТЕМАХ

В общем случае функциональное уравнение (3.6) может содержать знакопеременное слагаемое (X)ϕ . Воспользуемся формулой (3.9) и введем

Page 64: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

64

обозначение u sign( )′ = − ψ , тогда u u sign( )′= ⋅ ϕ . Подставим это управление в функциональное уравнение (3.6):

(X) G X f (X,U ) | (X) | u′ ′ψ = ⋅ = + ϕ ⋅&& . Итак, в этом случае вместо управления u можно искать оптимальное

управление u′ , которое, так же как и u , ограничено условием: | u | 1′ ≤ , следовательно, такая замена переменных правомерна. При этом очевидно, что условие (3.24) преобразуется и примет вид: | f | | |≤ ϕ .

Таким образом, если дан нелинейный объект (1.27) n-ного порядка с m каналами управления, то из всего класса управлений, подчиненных условию (1.33), оптимальным для каждого i-того канала на k -том интервале в смысле минимума функционала (3.20) при переводе объекта управления (1.27) или эквивалентного ему k -том интервале объекта (3.6) из некоторого начального положения [ ]i i0X(0)ψ = ψ k -того интервала на многообразие i (X) 0ψ = является релейное управление

i i i iu sign[ (X) G (X) B(X) U ]′′= − ψ ⋅ ⋅ ⋅ , i = 1, 2, ..., m, (3.31) где i (X)ψ - функция переключения регулятора по i - тому каналу управления на k -том интервале

i i i i i i i(X) G (X) A(X) G (X) B(X) U G (X) B(X) U u′ ′′ψ = ⋅ + ⋅ ⋅ + ⋅ ⋅ ⋅& . – Для оптимального управления в скользящем режиме на k 1+ -ом интервале необходимо и достаточно, чтобы функция i i i1 i2 inG grad( ) (g ,g , ,g )= ψ = K удовлетворяла условию

i i i i i| G (X) A(X) G (X) B(X) U | | G (X) B(X) U |′ ′′⋅ + ⋅ ⋅ ≤ ⋅ ⋅ . (3.32) Чем ближе находится неравенство (3.32) к равенству, тем более быстродействующий будет регулятор.

– Для оптимального управления по критерию минимального "расхода сигнала управления" на k 1+ -ом интервале необходимо и достаточно, чтобы левая часть выражения (3.32) равнялась нулю:

i i i| G (X) A(X) G (X) B(X) U | 0′⋅ + ⋅ ⋅ = В общем случае для нелинейного объекта (1.27) n - ного порядка с m

каналами управления, оптимальным в смысле минимума функционала (3.20) может быть построено (определено) m поверхностей переключения, каждая из которых состоит из n вложенных друг в друга поверхностей переключения. Другими словами, для нелинейных систем с релейным оптимальным по точности управлением, в общем случае может быть не более n интервалов управлений вида (3.31) для каждого из m управляющего воздействия.

Действительно, первые m поверхностей переключения для каждого канала управления следуют из уравнений (3.3) - (3.5). Докажем, что для каждого канала управления может быть построено в общем случае n поверхностей переключения.

Запишем функциональное уравнение (3.6) для одного из каналов управления (X) G Xψ = ⋅ && ,

где матрица

Page 65: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

65

1 2 nG(X) [g (X),g (X), ,g (X)]= K представляет собой строку неизвестных переменных коэффициентов (функций координат объекта), количество которых, как это следует из функционального уравнения, равно количеству координат (порядку объекта). От этих же коэффициентов будут зависеть и функции

f (X,U ,G) G(A BU )′ ′= + , (X,G) GBU′′ϕ = и (X,G)ψ функционального уравнения (3.6).

Для определения неизвестных функций матрицы G(X) в общем случае необходимо составить n уравнений или неравенств, являющихся следствием n поверхностей переключения. Для простоты изложения, не влияющего на сущность доказательства, рассмотрим, например, оптимальную по критерию (3.20) систему при условии (X) 0ϕ > и знака равенства в условии (3.24).

Первая поверхность переключения непосредственно следует из оптимального управления (3.8) и функционального уравнения (3.6). Для того, чтобы система достигла первой поверхности переключения необходимо и достаточно в соответствии со свойством 2.1 выполнить условие

| f (X,U ,G) | (X,G)′ = ϕ , представляющее собой первое уравнение для определения коэффициентов матрицы G. Подставим это уравнение и управление (3.8) в функциональное уравнение (3.6):

(X,G) f (X,U ,G) | f (X,U ,G) | sign[ (X,G)]′ ′ψ = − ⋅ ψ& . Под действием управления (3.8) изображающая точка попадет на

поверхность (X,G) 0ψ = и дальнейшее движение системы под действием того же управления (3.8) будет происходить, согласно свойству 2, вдоль поверхности

(X,G) 0ψ = , причем (X,G) 0ψ =& . Другими словами, дальнейшее движение будет происходить не во всем фазовом пространстве, а будет ограничено поверхностью

(X,G) 0ψ = (происходит сжатие фазового пространства). Следующая поверхность переключения 2(X,G) 0ψ = , если она существует, должна принадлежать поверхности (X,G) 0ψ = , но размерность поверхности 2(X,G) 0ψ = на единицу меньше размерности поверхности (X,G) 0ψ = . Это легко доказать, если из уравнения (X,G) 0ψ = выразить одну координату и подставить ее в уравнение поверхности 2(X,G) 0ψ = .

Функцию переключения 2(X,G)ψ можно найти, если воспользоваться методом эквивалентного управления [25], предложенным и обоснованным В.И. Уткиным. Подставляя (X,G) 0ψ =& в последнее уравнение, получим

2(X,G) f (X,U ,G)′ψ = . Определим скорость проникновения второй поверхности переключения

2(X,G) 0ψ = или, что то же самое, запишем функциональное уравнение для второго интервала с учетом уравнений объекта:

2 2 2(X,G) f (X,U ,G) f (X,U ,G) (X,G) u′ ′ψ = = + ϕ ⋅&& , где

Page 66: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

66

2 2u sign[ (X,G)]= − ψ эквивалентное управление второго интервала. Подчеркнем, что оптимальное управление на втором интервале (и последующих) всегда одно и то же, определяемое формулой (3.8). Управление 2u является всего лишь следствием (преобразованием) основного управления (3.8) с учетом (X,G) 0ψ = и

(X,G) 0ψ =& . Для того, чтобы система достигла второй поверхности переключения

2(X,G) 0ψ = необходимо и достаточно в соответствии со свойством 2.1 на втором интервале выполнить условие

2 2| f (X,U ,G) | (X,G)′ = ϕ , представляющее собой второе уравнение для определения коэффициентов матрицы G и т. д. Таким образом, для того, чтобы определить n коэффициентов матрицы G, необходимо и достаточно построить n поверхностей переключения, причем каждая последующая целиком принадлежит предыдущей.

Рассмотрим одну из траекторий движения объекта под действием оптимального по быстродействию управления u sign( )= − ψ из некоторой начальной точки фазового пространства. Пусть начальные координаты вектора состояния объекта (точки фазового пространства) 0X(0) X= , соответствующие отклонению фазовых координат от нуля таковы, что 0X не принадлежит поверхности переключения (X) 0ψ = , т.е. 0(X ) 0ψ ≠ . Под действием максимального управления u sign( )= − ψ , причем | u | 1= , а знак противоположен знаку ψ , точка фазового пространства (в дальнейшем просто точка) будет двигаться к поверхности переключения (X) 0ψ = по естественной траектории объекта (1.1), т.е. с максимально возможной скоростью, и величина (X)ψ будет уменьшаться по модулю. Управление u sign( )= − ψ в течение некоторого времени переведет точку (объект (1.1)) на поверхность переключения (многообразие)

(X) 0ψ = (заметим, в общем случае на любую поверхность переключения, быть может, выбранную совершенно произвольно) и будет удерживать точку на этой поверхности, т.е. дальнейшее движение точки будет происходить под действием управления u sign( )= − ψ вдоль поверхности переключения (X) 0ψ = при

(X) 0ψ =& . Такое движение может быть двух видов. Первый вид: движение происходит

при (X) 0ψ =& за счет скользящего режима (рис. 3.3), при этом движение объекта осуществляется по бесконечно малым кускам естественных траекторий объекта (теоретически) с бесконечным числом переключений управляющего сигнала, причем (X)ψ& только в пределе равно нулю (см. работы В.И. Уткина). При этом поверхность переключения не совпадает с естественными траекториями движения объекта. Второй вид – движение происходит точно вдоль поверхности при точном равенстве (X) 0ψ =& , при этом поверхность переключения точно совпадает с естественными траекториями движения объекта.

Page 67: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

67

Рис.3.3. Скользящий режим движения по поверхности переключения.

Процесс перевода объекта на многообразие (X) 0ψ = в общем случае может

быть также двух видов: апериодический или колебательный. При этом точка, двигаясь по естественной траектории системы (1.1), либо втыкается в поверхность и затем движется вдоль этой поверхности либо "прошивает" поверхность переключения (рис. 3.2).

Рассмотрим теперь дальнейшее движение точки вдоль поверхности (X) 0ψ = при (X) 0ψ =& . Наиболее быстрый процесс движения точки в фазовом пространстве будет только в том случае, если это движение происходит по естественным траекториям объекта, соответствующим максимальному значению управления с тем или иным знаком.

Следовательно, для наиболее быстрого процесса движения вдоль поверхности (X) 0ψ = необходимо и достаточно поверхность переключения

(X) 0ψ = выбрать так, чтобы она совпала с естественной траекторией движения, при этом (X) 0ψ =& , но не за счет скользящего режима, а точно равно нулю. Не будем здесь пока говорить в какую точку фазового пространства мы попадем при таком движении по поверхности (X) 0ψ = , совпадающей с естественной траекторией движения, главное, что это движение наиболее быстрое, на которое способен объект.

Итак, в тот момент переключения сигнала управления, когда точка фазового пространства окончательно окажется на поверхности (X) 0ψ = и в следующее мгновение начнется движение по поверхности (т.е. после окончания переходного процесса колебания точки фазового пространства около поверхности переключения), скорость проникновения (X)ψ& для быстродействующего процесса должна быть точно равна нулю независимо от знака и величины этой скорости до переключения. Если обозначить скорость проникновения до переключения за (X)−ψ& , а после переключения – (X)+ψ& , то необходимое и

Page 68: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

68

достаточное условие совпадения поверхности переключения с естественной траекторией движения можно записать в следующем виде:

(X) (X) 0− +ψ ⋅ ψ =& & . В последнем выражении обязательно должны присутствовать обе скорости

(X)−ψ& и (X)+ψ& , поскольку неизвестно какого знака управление до и после переключения, известно только, что управление меняет знак. Пусть, например, до переключения управление былоu 1− = − , а после переключения стало u 1+ = + или наоборот, тогда подставляя соответствующие производные от функции переключения из уравнения (3.6) в последнее равенство, будем иметь

2 2f (X) (X) 0− +ψ ⋅ ψ = −ϕ =& & . Учитывая, что (X) 0ϕ > , получим необходимое и достаточное условие

наиболее быстрого движения точки фазового пространства по поверхности переключения (X) 0ψ = , причем точно совпадающей с естественной траекторией движения:

| f (X) | (X)= ϕ . (3.33) Отметим, что условие (3.33) не зависит от управляющего воздействия. Итак, условие (3.33) позволяет из всех поверхностей, удовлетворяющих

уравнению (3.6), выбрать такую поверхность переключения, что при попадании точки на эту поверхность (после завершения переходного процесса достижения этой поверхности), дальнейшее движение будет происходить точно по поверхности (X) 0ψ = , причем будет выполняться точное равенство (X) 0ψ =& . Решим уравнение (X) 0ψ =& относительно управления (найдем эквивалентное управление, обеспечивающее движение вдоль (X) 0ψ = ), при этом учтем равенства (3.6) и (3.33):

(X) f (X) (X) u 0ψ = + ϕ ⋅ =& откуда 2f (X)u sign[f (X)]

(X)= − = −

ϕ.

Если решить теперь уравнение (X) 0ψ = относительно выходной (самой "медленной") координаты 1x : 1 2 3 n(X) x (x ,x , , x ) 0ψ = + σ =K , из которого

1 2 3 nx (x ,x , , x )= σ K , и подставить в уравнения объекта (1.1) и эквивалентного управления 2u , то можно увидеть, что на втором интервале движения объекта вдоль (X) 0ψ = произошло сжатие фазового пространства в момент переключения на одну координату. Здесь следует пояснить, почему надо исключать самую младшую координату 1x , а не самую старшую nx . Поскольку самая старшая координата nx наиболее "чувствительная" (ближе всех расположенная) к управляющему воздействию, то именно она должна остаться вплоть до окончания всего процесса управления.

Если обозначить функцию f (X) в эквивалентном управлении 2u за новую функцию переключения второго интервала

2 2 3 n 2 3 n(x ,x , ,x ) f (x ,x , ,x )ψ =K K ,

Page 69: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

69

то по отношению к новой функции 2ψ второго интервала можно в свою очередь повторить все сказанные выше рассуждения для первого интервала: управление второго интервала –

2 2 2 3 nu sign[ (x ,x , , x )]= − ψ K , функциональное уравнение второго интервала –

2 2 3 n 2 2 3 n 2 2 3 n(x ,x , ,x ) f (x ,x , , x ) (x ,x , ,x ) uψ = + ϕ ⋅& K K K , поверхность переключения второго интервала –

2 2 3 n(x ,x , ,x ) 0ψ =K , необходимое и достаточное условие наиболее быстрого движения точки фазового пространства на третьем интервале вдоль поверхности 2 0ψ = –

2 2| f |= ϕ и управление третьего интервала –

3 3 3 4 nu sign[ (x ,x , ,x )]= − ψ K , в котором уже не будет координаты 2x за счет сжатия фазового пространства в силу уравнения 2 2 3 n(x ,x , ,x ) 0ψ =K .

Выполняя аналогичные действия для последующих интервалов, приходим к выводу, что последняя функция переключения будет состоять всего лишь из одной координаты nx : n nxψ = , причем последнее эквивалентное управление

n n nu sign( ) sign(x )= − ψ = − переводит и удерживает точку в начале координат. Проведенные исследования позволяют сделать следующие выводы.

1. Поверхность переключения для оптимального управления состоит из n вложенных друг в друга поверхностей переключения все более уменьшающейся размерности, последняя поверхность вырождается в точку начала координат;

2. В общем случае переходный процесс состоит из n интервалов движения в скользящем режиме, каждый из которых описывается своим функциональным уравнением (3.6) и на каждом из которых действует свое эквивалентное управление (3.8);

3. Любой интервал заканчивается при окончательном сближении точки со своей поверхностью переключения;

4. Оптимальный по быстродействию процесс имеет такую же структуру поверхности переключения и такую же структуру управления, однако движение объекта происходит по естественным траекториям, совпадающим с поверхностью переключения на каждом интервале движения вплоть до начала координат. Таким образом, для оптимального по быстродействию управления

u sign( )= − ψ в общем случае (когда процесс сближения точки с поверхностью переключения на каждом интервале (кроме последнего) носит колебательный характер) необходимо условие i i| f (X) | (X)> ϕ , i 1, ,n 1= −K на каждом интервале движения (кроме последнего) и достаточно условия i i| f (X) | (X)= ϕ в момент окончания текущего и начала следующего интервала. В частном случае, если на каком-то интервале (или всех) процесс сближения точки с поверхностью

Page 70: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

70

переключения носит апериодический характер, то для оптимального по быстродействию управления u sign( )= − ψ необходимо и достаточно условия

i i| f (X) | (X)= ϕ . Докажем достаточность условия i i| f (X) | (X)= ϕ . Рассмотрим весь процесс

управления поинтервально, но в обратном порядке (рис. 3.4).

Рис. 3.4. Схематическое изображение структуры поверхности переключения и траектории движения при оптимальном по быстродействию управлении.

На последнем интервале поверхность переключения n nx 0ψ = = и управление n n nu sign( ) sign(x )= − ψ = − переводит точку по линии переключения (по поверхности переключения предпоследнего интервала n 1 n 1 n(x ,x ) 0− −ψ = размерности, равной двум) в начало координат на многообразие n nx 0ψ = = (на поверхность, размерности, равной единице). Подчеркнем, что последний интервал начинается только тогда, когда точка с предыдущего интервала окончательно попадет на линию переключения (на поверхность переключения

n 1 n 1 n(x ,x ) 0− −ψ = предпоследнего интервала) после возможных колебаний около линии переключения, однако это уже процессы предыдущего (n-1) интервала.

Для того, чтобы, движение точки на последнем интервале по поверхности n 1 n 1 n(x ,x ) 0− −ψ = было оптимально по быстродействию, необходимо, чтобы

поверхность переключения n nx 0ψ = = принадлежала поверхности переключения n 1 n 1 n(x ,x ) 0− −ψ = предпоследнего интервала более высокой размерности, а

функция переключения последнего интервала n nxψ = удовлетворяла функциональному уравнению предпоследнего интервала n 1 n 1 n 1f u− − −ψ = + ϕ ⋅& , где

n 1 n nf x− = ψ = , и достаточно, чтобы выполнялось условие n 1 n 1| f |− −= ϕ . Условия n 1 n 1| f |− −= ϕ достаточно, так как только в этом случае поверхность n 1 n 1 n(x ,x ) 0− −ψ = совпадает с естественной траекторией движения точки в начало

координат на последнем интервале и удовлетворяются все перечисленные необходимые условия. Итак, условия n 1 n 1| f |− −= ϕ необходимо и достаточно для оптимального по быстродействию движения на последнем интервале.

Page 71: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

71

Рассмотрим предпоследний интервал движения. На предпоследнем (n-1) интервале поверхность переключения n 1 n 1 n(x ,x ) 0− −ψ = и управление

n 1 n 1u sign( )− −= − ψ переводит точку по поверхности n 2 n 2 n 1 n(x ,x ,x ) 0− − −ψ = размерности, равной трем на поверхность n 1 n 1 n(x ,x ) 0− −ψ = размерности, равной двум. Отметим, что предпоследний интервал начинается только тогда, когда точка окончательно попадет на поверхность n 2 n 2 n 1 n(x ,x ,x ) 0− − −ψ = после возможных колебаний около поверхности n 2 n 2 n 1 n(x ,x ,x ) 0− − −ψ = , но это уже процессы предыдущего (n-2) интервала.

Для того, чтобы, движение точки на предпоследнем интервале по поверхности n 2 n 2 n 1 n(x ,x ,x ) 0− − −ψ = было оптимально по быстродействию, необходимо, чтобы поверхность переключения n 1 n 1 n(x ,x ) 0− −ψ = принадлежала поверхности переключения n 2 n 2 n 1 n(x ,x ,x ) 0− − −ψ = более высокой размерности, а функция переключения предпоследнего интервала n 1 n 1 n(x ,x )− −ψ удовлетворяла функциональному уравнению предыдущего (n-2) интервала n 2 n 2 n 2f u− − −ψ = + ϕ ⋅& , где n 2 n 1f − −= ψ . При этом необходимо, чтобы выполнялось условие n 2 n 2| f |− −> ϕ до тех пор, пока точка двигается колебательно вокруг поверхности переключения

n 1 n 1 n(x ,x ) 0− −ψ = и достаточно, чтобы выполнялось условие n 2 n 2| f |− −= ϕ с того момента, когда точка окончательно попадет на поверхность n 1 n 1 n(x ,x ) 0− −ψ = . Условия n 2 n 2| f |− −≥ ϕ необходимо и достаточно, так как только в этом случае поверхность n 2 n 2 n 1 n(x ,x ,x ) 0− − −ψ = совпадает с естественной траекторией движения точки к поверхности n 1 n 1 n(x ,x ) 0− −ψ = предпоследнего интервала и удовлетворяются все перечисленные необходимые условия. Если процесс сближения точки на предпоследнем интервале с поверхностью переключения

n 1 n 1 n(x ,x ) 0− −ψ = предпоследнего интервала носит апериодический характер, то условия n 2 n 2| f |− −= ϕ необходимо и достаточно для оптимального по быстродействию движения на предпоследнем и последнем интервалах.

Продолжив дельнейшие рассуждения и двигаясь от интервала к интервалу к начальной точке 0(X )ψ фазового пространства, можно сделать следующий вывод. Для того, чтобы, движение точки (объекта) было оптимально по быстродействию, необходимо, чтобы на каждом интервале движения, кроме последнего, выполнялось условие i i| f |> ϕ пока точка совершает колебательные движения вокруг поверхности переключения i 0ψ = и достаточно i i| f |= ϕ для движения по поверхности к следующей поверхности переключения на единицу меньшей размерности. Если процесс сближения точки с поверхностью i 0ψ = носит апериодический характер, то необходимо и достаточно условия i i| f |= ϕ на всех интервалах движения, кроме последнего.

Сформулируем этот вывод в виде теоремы об n интервалах управлений аналогично известной теореме об n интервалах знакопостоянного управления А.А. Фельдбаума.

Page 72: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

72

Теорема об n-интервалах управлений • Если объект управления описывается нелинейным дифференциальным уравнением (1.1) n-го порядка, то для оптимального по быстродействию управления необходимо и достаточно не более n интервалов управлений

i iu sign( )= − ψ , а знаки при смене интервалов должны чередоваться ( n 1− ) раз. – Для осциллирующих объектов некоторые интервалы управлений будут иметь несколько чередующихся по знаку интервалов максимального значения управления.

– Для неосциллирующих объектов n интервалов управлений i iu sign( )= − ψ равны n интервалам максимального значения управления теоремы А.А. Фельдбаума.

• Если на каждом интервале выполняется условие f (X,U ) 0′ ≠ , то для оптимального управления по критерию (1.32) необходимо и достаточно не более n интервалов управлений i i iu sign( )= −λ ⋅ ψ , где 0 1< λ < , а знаки при смене интервалов должны чередоваться ( n 1− ) раз. – Движение на всех интервалах кроме первого происходит в скользящем режиме.

– Время переходного процесса конечно. – При уменьшении λ на одном или нескольких интервалов время переходного процесса увеличивается.

• Если на k-том интервале f (X,U ) 0′ = и объект при отсутствии управления устойчив, то для оптимального управления по критерию (1.39) необходимо и достаточно не более k+1 интервалов i i iu sign( )= −λ ⋅ ψ , а знаки при смене интервалов должны чередоваться k раз. – Последние два интервала будут оптимальны по минимальному "расходу сигнала управления".

– Длительность последнего интервала теоретически равна бесконечности.

3.2.7 УСТОЙЧИВОСТЬ СИСТЕМ С РЕЛЕЙНЫМ ОПТИМАЛЬНЫМ

УПРАВЛЕНИЕМ

В предыдущих разделах основное внимание было уделено методам, позволяющим описать в общем случае движение от одной поверхности разрыва (переключения) к другой, причем каждая последующая поверхность переключения принадлежит предыдущей. Для многомерных систем такое движение происходит на некотором пересечении совокупности поверхностей разрыва, причем для каждого управления существует своя система вложенных друг в друга поверхностей переключения. Это позволяет проводить синтез каждого управляющего воздействия независимо от других. Таким образом, на каждом интервале движения системы от одной поверхности разрыва к другой существует своя функция переключения, свое функциональное уравнение (3.6) и свое управление (3.8), которые действительны только для своего интервала. Следовательно, если система устойчива на одном каком-то интервале, то это не

Page 73: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

73

значит, что она будет устойчива и на другом. Очевидно, если обеспечить устойчивость системы на всех интервалах движения, то и весь процесс движения будет устойчив.

Рассмотрим условия устойчивости оптимальных режимов на примере первого интервала движения системы. Управление (3.8) обеспечивает перевод объекта (1.27) или, что то же самое, эквивалентного объекта (3.6) из произвольного начального состояния в окрестность многообразия (X) 0ψ = .

Найдем условие асимптотической устойчивости в целом уравнения (3.6) относительно многообразия 0ψ = . Это условие можно получить, используя, например, функцию Ляпунова 2V 0.5 0= ⋅ψ > . Тогда производная

V = ψ ⋅ψ& & должна быть определенно отрицательной, т.е. 0ψ ⋅ψ <& .

Рассмотрим вначале необходимые условия устойчивости. Пусть положение равновесия системы (3.6) асимптотически устойчиво в целом по Ляпунову, то есть, если 2V 0.5 0= ⋅ψ > , то V 0= ψ ⋅ψ <& & . Тогда из выражения (3.16) следует, что должно быть 0F 0> . Запишем неравенство 0ψ ⋅ψ <& в виде равенства: sign( ) 1ψ ⋅ψ = −& или

sign( ) sign( )ψ = − ψ& . (3.34) Составим уравнение Беллмана для эквивалентного объекта (3.6) с учетом

критерия оптимальности (1.32):

0u

Smin F 0 ∂+ ⋅ψ = ∂ψ

& . (3.35)

Подставляя в соотношение (3.35) уравнение (3.6) и учитывая ограничение u 1≤ и условие 0ϕ > , получим

Su sign ∂= − ∂ψ

. (3.36)

Управление (3.36) минимизирует выражение (3.35), из которого следует 0FS∂

= −∂ψ ψ&

.

Подставляя последнее соотношение в управление (3.36) и учитывая 0F 0> , имеем

u sign( )= ψ& . (3.37) Воспользовавшись равенством (3.34) для управления (3.37) приходим к

необходимости оптимального управления (3.8) для асимптотической устойчивости в целом по Ляпунову системы (3.6) относительно многообразия

0ψ = . Рассмотрим достаточные условия устойчивости. Предположим, что

существует оптимальное управление (3.8) для системы (5.19). Требуется показать, что в этом случае нулевое решение системы (3.6) относительно многообразия

Page 74: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

74

0ψ = асимптотически устойчиво в целом по Ляпунову. Для этого сравним два равенства: (3.8) и (3.37), из которых следует равенство (3.34) и тогда

V 0= ψ ⋅ψ = − ψ ⋅ψ <& & & , (3.38) то есть, оптимального управления достаточно для асимптотической устойчивости в целом по Ляпунову системы (3.6) относительно 0ψ = при 0F 0> .

Рассмотренные условия устойчивости также можно доказать, если воспользоваться другой функцией Ляпунова V | | 0= ψ > .

Следствие. Для асимптотической устойчивости в целом по Ляпунову системы (3.6) относительно 0ψ = при (X) 0ϕ > необходимо и достаточно выполнения условия

| f (X,U ) | (X)′ ≤ ϕ (3.39) в моменты переключения реле при движении системы по многообразию 0ψ = .

Действительно, если подставить в неравенство (3.38) уравнение (3.6) и оптимальное управление (3.8), то можно получить

(X) f (X,U ) | (X) | (X) 0′ψ ⋅ − ψ ⋅ϕ < . Записывая (X)ψ в этом неравенстве в виде (X) | (X) | sign[ (X)]ψ = ψ ⋅ ψ , имеем

f (X,U ) sign[ (X)] (X)′ ⋅ ψ < ϕ и далее условие (3.39). Заметим, что условие асимптотической устойчивости совпадает с условием скользящих режимов (3.24) и условием управляемости (3.10).

Поскольку для системы (1.27) таких интервалов может быть равно n , то для асимптотической устойчивости в целом по Ляпунову системы (1.27) относительно положения равновесия (начала координат) необходимо и достаточно выполнения условия | f | ≤ ϕ при 0ϕ > в моменты смены интервалов (в моменты сжатия фазового пространства) для каждого канала управления.

Действительно, согласно свойству 2.5 переходный процесс для объекта (1.27) состоит в общем случае из n интервалов и можно составить n функциональных уравнений вида (3.6) для каждого канала управления. Очевидно, чтобы система (1.27) была асимптотически устойчивой в целом по Ляпунову относительно положения равновесия необходимо и достаточно выполнения условия | f | ≤ ϕ при 0ϕ > в моменты смены интервалов.

Если для неустойчивого объекта (1.27) можно записать функциональное уравнение (3.6), то для асимптотической устойчивости системы (1.27) с управлением (3.8) по критерию (3.20) необходимо и достаточно выполнения условия 0 | f |< ≤ ϕ на каждом интервале.

Действительно, пусть система с неустойчивым объектом (1.27) и управлением (3.6) по критерию (3.20) устойчива. Покажем, что для этого необходимо, чтобы f (X) 0≠ на любом интервале.

Предположим, что на каком-то интервале движения системы f (X) 0= . Тогда согласно свойству 3 на следующем интервале движения система с неустойчивым

Page 75: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

75

объектом (1.1) останется без управления и, следовательно, не будет устойчива. Итак, необходимо, чтобы на каждом интервале было f (X) 0≠ .

Предположим, что условие f (X) 0≠ выполняется. Покажем, что система (1.27) с управлением (3.8) будет устойчива, т.е. условия f (X) 0≠ достаточно.

Действительно, согласно свойству 2 условие f (X) 0≠ означает, что на каждом i-том интервале движения системы существует эквивалентное управление

i iэквu sign[f ]= − не равное нулю, причем функция переключения i if 0ψ = ≠ . Тогда, для любого интервала можно записать функциональное уравнение (3.6) с управлением (3.8), которое обеспечит устойчивость системы (1.27).

3.2.8 УЧЕТ ОГРАНИЧЕНИЙ НА ФАЗОВЫЕ КООРДИНАТЫ

Требования надежности и безаварийности работы систем, например, электроприводов обычно связывают с различными ограничениями, которые накладываются на величину тока двигателя, производную тока, величину скорости вращения вала и др., являющиеся, в конечном счете, координатами объекта регулирования. Дело в том, что часто несмотря на ограничения, наложенные на управления, "мощность" сигналов управления оказывается достаточной, чтобы перевести объект в недопустимое состояние. В таких случаях приходится дополнительно учитывать ограничения фазовых координат.

Ограничение координат означает, что в n-мерном фазовом пространстве X фазовые координаты лежат в заданной фиксированной области В, причем оптимальная траектория целиком или частично лежит на границе области В, т.е. эта область замкнута (закрытое множество). В дальнейшем будем считать, что граница области В – кусочно-непрерывная поверхность n-мерного пространства X, определяемая вблизи границы неравенствами i mix x≤ , i 1, ,n= K , где mix – наибольшее допустимое значение соответствующей фазовой координаты.

Таким образом, в n-мерном пространстве X замкнутая область В задается n-мерным параллелепипедом. Сюда же относится и случай, когда ограничения вызваны конструктивными мерами, т.е. когда объект имеет ограничители. Именно с такого рода ограничениями приходится сталкиваться при решении задач управления техническими объектами, имеющими, например всевозможные сочленения с учетом зазоров (люфтов) между соединяемыми деталями или ограничения типа "упор". Отличительной особенностью функционирования таких систем является возможность возникновения ударов при выходе на границу области В и, как следствие, уменьшение надежности работы.

Задание различного рода ограничений на координаты состояния объекта управления в классической постановке приводит к существенному усложнению необходимых условий оптимальности [15]. Прежде всего, существенно усложняется оптимальный закон управления. Оптимальное управление оказывается релейным, если фазовая точка движется в открытом ядре области В, и является непрерывным при движении фазовой точки по границе области [14].

Page 76: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

76

Поверхность переключения в этом случае становится негладкой, что усложняет определение оптимального управления в аналитическом виде.

В современной теории автоматического управления важное место занимает проблема синтеза оптимальных быстродействующих нелинейных систем управления. Как было показано ранее, известные методы решения задач оптимальных быстродействующих нелинейных систем управления достаточно сложны, а с учетом ограничений на фазовые координаты, имеющие место в реальной системе, оказываются малопригодными для распространенных на практике случаев, когда от проектируемой системы требуют реализации предельно возможных по показателям качества характеристик процесса регулирования [36].

Системы подчиненного управления находят широкое промышленное применение благодаря простоте расчета и наладки, а также возможности унификации, позволившей освоить массовый выпуск унифицированных блочных систем регулирования (УБСР). Принцип построения УБСР основан на каскадном включении необходимого количества регуляторов, комплектуемых широким набором входных цепей и цепей обратных связей, комбинация которых позволяет сформировать требуемый закон управления. На входе регулятора каждого из контуров сравниваются сигналы, пропорциональные заданному и фактическому значению выходной величины данного контура, а выходное напряжение регулятора служит задающим сигналом для последующего контура. Система при этом структурно разбивается на ряд контуров, каждый из которых содержит свой объект регулирования. При синтезе регулятора внешнего контура внутренний по отношению к нему замкнутый контур является частью объекта регулирования как динамическое звено с соответствующей эквивалентной передаточной функцией. В свою очередь, рассматриваемый контур может быть внутренним по отношению к последующим. Система управления следящим электроприводом (СЭП), построенная по принципу подчиненного регулирования, содержит три контура обратных связей (три регулятора): по току, скорости и положению. Такое построение СЭП обладает следующими основными достоинствами [2].

1. В СЭП подчиненного регулирования возможен контроль выходной величины каждого контура путем ограничений выходной величины регулятора наружного контура.

2. Привод подчиненного регулирования удобен в наладке, так как настраивается поочередно каждый контур.

3. При числе контуров больше двух привод можно сделать более быстродействующим при том же запасе устойчивости по фазе.

В то же время применение систем подчиненного управления [37, 38] позволяет сравнительно легко решить задачу оптимального управления с учетом ограничений. При этом оптимальное управление остается всегда релейным, что обеспечивается скользящим режимом движения фазовой точки по границе области с эквивалентным непрерывным управлением, которое за счет скользящего режима получается автоматически.

Page 77: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

77

Применение систем подчиненного управления позволяет также легко изменять ограничение по заданной программе в процессе функционирования системы и тем самым, например, избежать нежелательных ударов. Для этого достаточно установить управляемое ограничение по требуемой координате несколько раньше механического упора. Отметим, что этот же подход может быть использован и при ограничениях более общего характера, определяемых неравенствами типа iF (X) 0≤ .

3.2.9 СПОСОБЫ СИНТЕЗА ФУНКЦИЙ ПЕРЕКЛЮЧЕНИЯ

ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ

Все способы синтеза функций переключения оптимальных регуляторов основаны на получении для заданного объекта (1.27) с m каналами управления основного функционального уравнения (3.2). Далее осуществляется декомпозиция многомерной задачи на m однотипных задач, которые решаются независимо и с использованием тех или иных свойств функций переключения оптимальных регуляторов. При решении каждой из m задач необходимо воспользоваться утверждением о количестве интервалов управлений и записать соответствующие уравнения функций переключения для каждого интервала движения системы. На последнем этапе в соответствии с функциональным уравнением (3.6) все функции переключения объединяются в общую функцию переключения каждого из m управлений и записывается окончательное решение для многомерного управления объектом (1.27).

Функцию переключения каждого из m управлений многомерных систем или одну функцию переключения для систем с одним управляющим воздействием можно синтезировать двумя способами.

Для первого способа синтеза оптимального управления вначале определяются условия для функции переключения на первом интервале, затем на втором и т. д. до последнего интервала. Количество интервалов, в зависимости от требований к системе может колебаться от двух до n. Все найденные для каждого интервала функции переключения объединяются в общую функцию, далее записывается окончательное решение для оптимального управления.

Для второго способа синтеза оптимальное управление по соответствующему критерию определяется, начиная с последнего n-ного интервала до первого. Затем все функции переключения объединяются в общую функцию и записывается окончательное решение для оптимального управления.

На первом этапе определяют оптимальное по точности (быстродействию, энергосбережению) управление без учета ограничений.

На втором этапе, пользуясь принципом подчиненного управления многоконтурных систем, проводят алгоритмический синтез функций переключения регуляторов координат (тока, скорости и т.д.), подлежащих ограничению.

Page 78: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

78

Если реализация найденных управлений оказываются по тем или иным причинам слишком сложной, то на третьем этапе проводят поиск более простых решений для квазиоптимальных управлений либо путем упрощений полученных оптимальных управлений, либо за счет обоснованного упрощения математического описания объекта управления, либо путем сокращения количества эквивалентных управлений (количества интервалов) в оптимальном управлении.

На третьем этапе можно определить оптимальные управления (регуляторы) по критерию минимума расхода сигнала управления (обобщенной работы) с учетом требуемой простоты реализации регуляторов. Во-первых, такие регуляторы содержат, как правило (по крайней мере, для электроприводов постоянного тока с питанием от статических полупроводниковых преобразователей), только линейные обратные связи. Во-вторых, они могут служить ориентиром при поиске квазиоптимальных по быстродействию управлений, поскольку критерии расхода сигнала управления или обобщенной работы по существу дают первое и достаточно простое приближение управления к квазиоптимальному по быстродействию управлению. В-третьих, решения, найденные по критериям минимума расхода сигнала управления или обобщенной работы можно использовать для двухкритериального управления, которое позволяет получать переходные процессы оптимальные как по быстродействию для режимов больших отклонений, так и по критерию точности для режимов малых отклонений объектов от заданного состояния.

На заключительном этапе, пользуясь принципом подчиненного управления многоконтурных систем объединить найденные оптимальные управления по каждой ограничиваемой координате в одно искомое управление, удовлетворяющее предъявляемым требованиям.

Контрольные вопросы 1. Поясните, почему устойчивая релейная система имеет низкую чувствительность к внешним и параметрическим возмущениям.

2. При каких ограничениях на возмущающие воздействия релейная система сохраняет свойство низкой чувствительности к действию данных возмущений?

3. Какую структуру имеет оптимальный по точности регулятор? Почему? 4. Что такое скорость проникновения поверхности переключения? Каким уравнением она описывается?

5. Запишите основное функциональное уравнение релейной системы. Какие инвариантные преобразования оно допускает?

6. Перечислите свойства основного функционального уравнения релейной системы управления.

7. Поясните понятие «скользящий режим» работы релейной системы. Запишите условие существования «скользящего режима».

Page 79: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

79

8. Поясните математический и физический смысл критерия минимума «расхода сигнала управления» релейной системы.

9. Сформулируйте утверждение о количестве интервалов управлений в оптимальной релейной системе.

10. Сформулируйте критерий асимптотической устойчивости в целом по Ляпунову для релейной системы управления.

11. Сформулируйте основные этапы первого (второго) способа синтеза функций переключения оптимальных регуляторов.

Page 80: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

80

4 СИНТЕЗ ОПТИМАЛЬНЫХ ПО ТОЧНОСТИ РЕГУЛЯТОРОВ

Метод, основанный на использовании функционального уравнения

относительно функции переключения, позволяет аналитически определять различные оптимальные по критерию точности управления: от оптимальных по критерию быстродействия до оптимальных по энергосберегающему критерию расхода "сигнала управления". Наиболее важным с теоретической точки зрения является определение оптимальных по критерию быстродействия управлений. Во-первых, потому-что такое управление обеспечивает минимальное время переходного процесса. Во-вторых, позволяют оценить степень быстродействия известной системы управления и исследовать возможности решения сложной задачи компромисса между увеличением быстродействия и простотой реализации регулятора. Некоторые особенности аналитического конструирования оптимальных по точности регуляторов рассматриваются на конкретных примерах синтеза одномерных и многомерных, линейных и нелинейных, осциллирующих и не осциллирующих, низкого и высокого порядков систем с разрывными управлениями.

4.1 МЕТОДИКА СИНТЕЗА ОПТИМАЛЬНОГО ПО БЫСТРОДЕЙСТВИЮ

УПРАВЛЕНИЯ ИНТЕГРИРОВАНИЕМ СКОРОСТИ ПРОНИКНОВЕНИЯ

Пусть, например, для объекта (1.27) требуется найти управляющее воздействие, входящее для определенности в последнее уравнение:

1 1

2 2

i i

n n

x F (X)x F (X)...................x F (X)...................x F (X) u

= = =

= +

&

&

&

&

(4.1)

В соответствии с теоремой об n-интервалах управлений для каждого из n интервалов можно составить функциональное уравнение f (X) (X) uψ = + ϕ ⋅& или, воспользовавшись свойством 6.1: i i 1sign( ) u+ψ = ψ +& .

Поскольку на последнем интервале фазовое пространство объекта (4.1) сжимается до единицы, то функция переключения на последнем интервале будет состоять всего лишь из одной координаты nx : n nxψ = , производная которой входит в последнее уравнение объекта (4.1).

На предпоследнем (n 1)− интервале производную от функции переключения в соответствии со свойством можно записать в следующем виде

n 1 n n| | u−ψ = ⋅ψ + ψ ⋅& , (4.2)

Page 81: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

81

а оптимальное управление последнего интервала: n nu sign( )= − ψ , на котором n 1 n 1 n(x ,x ) 0− −ψ = и n 1 0−ψ =& , переводит объект (4.1) по линии переключения n 1 n 1 n(x ,x ) 0− −ψ = в начало координат. На предыдущем (n 2)− интервале аналогично уравнению (4.2)

предпоследнего интервала (n 1)− можно записать основное функциональное уравнение (3.6): n 2 n 1− −ψ = ψ +& n 1| | u−+ ψ ⋅ , причем оптимальное управление предпоследнего интервала: n 1 n 1u sign( )− −= − ψ переводит объект (4.1) по двухмерной поверхности переключения n 1 n 2 n 1 n(x ,x ,x ) 0− − −ψ = на линию переключения.

Продолжая аналогичные выкладки до первого интервала, можно записать основное функциональное уравнение для первого интервала 1 2 2| | uψ = ψ = ψ + ψ ⋅& & , причем оптимальное управление второго интервала: 2 2u sign( )= − ψ переводит объект (4.1) по (n 1)− -мерной поверхности переключения n 1 2 3 n(x ,x , , x ) 0−ψ =K на (n 2)− -мерную поверхность переключения n 2 3 4 n(x ,x , ,x ) 0−ψ =K . И наконец оптимальное управление первого интервала u sign( )= − ψ переводит объект (4.1) на (n 1)− -мерную поверхность переключения n 1 2 3 n(x ,x , , x ) 0−ψ =K .

Таким образом, в результате приведенной процедуры синтеза получим оптимальное управление для объекта (4.1) по критерию быстродействия и эквивалентные управления со второго по n-ный интервал:

2 2 2 2

2 3 3 3 3

n 1 n n n n

n n

u sign( ),| | u, u sign( ),| | u, u sign( ),

, ,| | u, u sign( ),

x .−

= − ψ ψ = ψ + ψ ⋅ = − ψ ψ = ψ + ψ ⋅ = − ψψ = ψ + ψ ⋅ = − ψ

ψ =

&

&

LLLLLLL LLLLLL

&

(4.3)

Пример 4.1. Выполнить синтез оптимального по быстродействию закона управления для системы

1 2x x=& , 2x u=& . (4.4) На управление u(t) наложено ограничение

| u(t) | 1≤ . Уравнения (4.4) с ограниченной второй производной регулируемой

величины могут быть записаны, например, для системы автоматического управления нейтральным объектом с помощью сервомотора постоянной скорости [39].

Будем искать управление 1 2u sign[ (x ,x )]= − ψ , которое произвольное начальное состояние 10 20(x ,x ) переводит в начало координат за минимальное время. Поскольку решение данной задачи методом фазовой плоскости известно

Page 82: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

82

[39, 40], есть возможность сравнения трудоемкости предлагаемого решения с известным. Решение. Будем искать решение, начиная с первого интервала. Составляем основное функциональное уравнение (3.6) для данной задачи:

1 1 2 2g x g xψ = ⋅ + ⋅& & & . (4.5) В соответствии со свойством 1.6 выбираем 1g 1= . В силу уравнений объекта

(4.4) уравнение (4.5) принимает вид: 2 2f (X) (X) u x g uψ = + ϕ ⋅ = +& . (4.6)

Здесь 2f (X) x= , 2(X) gϕ = . Согласно условию быстродействия (3.30), для рассматриваемой задачи

2 2| x | g 0= > и уравнение (4.6) приобретает вид:

2 2x | x | uψ = + ⋅& . (4.7) Перепишем (4.7) в силу уравнений объекта:

1 2 2x | x | xψ = +& & & . Интегрируя ψ& , получим

2 21 2 1

| x | x(x ,x ) x2

⋅ψ = + (4.8)

и закон управления 2 2

1| x | xu sign x

2⋅ = − +

, (4.9)

полностью совпадающий с известным. В результате действия оптимального управления (4.9) движение системы

(4.4), (4.9) на первом интервале происходит по фазовой плоскости из произвольного начального состояния. Как только функция переключения (4.8) станет равной нулю, произойдет сжатие фазового пространства и в уравнениях объекта координата 1x будет равна

2 21

| x | xx2

⋅= − . (4.10)

Подставляя (4.10) в уравнения объекта (4.4), получим уравнение 2 2x | x | u 0ψ = + ⋅ =& , (4.11)

из которого следует, что оптимальное управление на втором интервале 2 2u sign(x )= −

переводит объект (4.4) по линии переключения (4.10) в начало координат.

Пример 4.2. Выполнить синтез оптимальной по быстродействию системы 1 2x x=& , 2 2x x u= − +& , (4.12)

если | u(t) | 1≤ . Требуется определить управление 1 2u sign[ (x ,x )]= − ψ , которое переводит фазовую точку системы (4.12) из произвольного начального состояния

10 20(x ,x ) в начало координат за минимальное время.

Page 83: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

83

Типичным примером системы автоматического регулирования, объект в которой представляет последовательное соединение инерционного и интегрирующего звеньев (4.12), является система регулирования угла поворота вала двигателя постоянного тока при подаче управляющего напряжения в цепь якоря и пренебрежении электромагнитной постоянной времени якорной цепи двигателя. К тем же уравнениям (4.12) можно привести и уравнения системы регулирования инерционного объекта первого порядка с помощью сервомотора постоянной скорости. Действительно, если ввести обозначения

1 1x y= , 2 1 2x y y= − + и подставить в уравнения объекта (4.12), то можно получить уравнения

1 1 2y y y= − +& , 2y u=& системы регулирования инерционного объекта первого порядка с помощью сервомотора постоянной скорости. Решение. Рассмотрим решение, начиная с последнего, второго интервала.

На последнем интервале функция переключения содержит только одну (старшую) координату объекта

2 2xψ = , а оптимальное управление второго интервала определяется формулой

2 2u sign(x )= − . Составим функциональное уравнение первого интервала, используя условие

быстродействия: 2 2x | x | uψ = + ⋅& . (4.13)

Подставим в (4.13) уравнения объекта (4.12): 1 2 2 2 1x | x | x | x | xψ = + ⋅ + ⋅& & & & . (4.14)

Непосредственно проинтегрировать уравнение (4.14) не представляется возможным, т.к. трудно найти интеграл от слагаемого 2 1 2 2| x | x | x | x⋅ = ⋅& .

Добавим и вычтем в правой части уравнения (4.14) производную 2x& : 1 2 2 2 2x (1 | x |) x (1 | x |) xψ = ⋅ + + ⋅ + −& & & & . (4.15)

Воспользуемся свойством 6.2 и умножим правую часть (4.15) на

положительно определенную величину 2

1(1 | x |)+

:

21 2

2

xx x1 | x |

ψ = + −+

&& & & .

Интегрируя ψ& , получим решение для оптимального управления 1 2 2 2u sign[x x sign(x ) ln(1 | x |)]= − + − ⋅ + . (4.16)

полностью совпадающее с известным решением [39, 40]. Итак, в соответствии с утверждением о числе интервалов управление (4.16)

на первом интервале переводит объект (4.12) на многообразие 1 2 1 2 2 2(x ,x ) x x sign(x ) ln(1 | x |) 0ψ = + − ⋅ + =

и на втором интервале удерживает его на этом многообразии. Первый интервал заканчивается тогда, когда функция переключения 1 2(x ,x )ψ становится и

Page 84: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

84

остается равной нулю. Иными словами, в результате действия управления (4.16), на втором интервале, при движении вдоль многообразия, дополнительно к уравнениям (4.12) объекта появляется уравнение 1 2(x ,x ) 0ψ = .

Исследуем движение на втором интервале. Найдем из последнего уравнения координату объекта 1x :

1 2 2 2x x sign(x ) ln(1 | x |)= − + ⋅ + , определим из этого уравнения производную от координаты 1x :

2 21

2

| x | xx1 | x |

⋅= −

+&

& ,

подставим 1x& в первое уравнение объекта (4.12): 2 22

2

| x | x x1 | x |

⋅− =

+&

и найдем из него 2x& : 2 2 2x x sign(x )= − −& . Итак, при движении на втором интервале вдоль многообразия 1 2(x ,x ) 0ψ =

уравнения объекта (4.12) приобретают вид: 1 2x x=& , 2 2 2x x sign(x )= − −& ,

причем одно из уравнений является следствием второго. Сравним полученные уравнения для второго интервала с уравнениями (4.12)

объекта. Поскольку уравнения объекта (4.12) справедливы для любого интервала, в том числе и второго, то, следовательно, можно считать, что на втором интервале, в результате действия управления (4.16) возникает эквивалентное (внутреннее, внутри самой системы) управление

2 2u sign(x )= − , переводящее объект по линии переключения 1 2 2 2x x sign(x ) ln(1 | x |)= − + ⋅ + в начало координат. Подчеркнем, что управление (4.16) всегда одно и тоже в течение всего переходного процесса, а на втором интервале его можно упростить в силу уравнений объекта (4.12) и уравнения 1 2(x ,x ) 0ψ = (многообразия), появляющегося на втором интервале в результате действия все того же управления (4.16).

Предположим теперь, что нам не удалось найти аналитически интеграл от производной функции переключения (4.14). Обозначим слагаемое

2 1 2 2| x | x | x | x⋅ = ⋅& уравнения (4.14) за производную новой координаты 3x : 3 2 2x | x | x= ⋅& . (4.17)

В этом случае появляется возможность проинтегрировать уравнение (4.14), найти функцию переключения первого интервала

2 21 3

| x | xx x C2

⋅ψ = + + +

и оптимальное управление 2 2

1 3| x | xu sign x x C

2⋅ = − + + +

, (4.18)

Page 85: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

85

где C - постоянная интегрирования уравнения (4.17), зависящая от начального значения координаты 3x , которое, в свою очередь зависит от начальных значений

10 20(x ,x ) . Не представляет особого труда подобрать постоянную C с помощью вычислительной техники для различных начальных значений 10 20(x ,x ) . Координату 3x , входящую в оптимальное управление (4.18) можно получить с помощью интегратора, включенного в обратную связь системы регулирования.

На рис. 4.1 (кривые, обозначенные цифрой 1) приведены результаты моделирования переходных процессов объекта (4.12) с управлениями (4.16) и (4.18).

Рис. 4.1. Результаты моделирования переходных процессов объекта (4.12) для начальных значений 10x 5= , 20x 0= с управлениями:

1 - (4.16); (4.18) при C 4.39= ; (4.19) при C 11.35= ; (4.19) при C 6.4= ; 2 - (4.100); 3 - (4.87).

На графиках u(t) , обозначенных цифрами 1 и 2 рис. 4.1 не показан

скользящий режим с теоретически бесконечной частотой переключения реле и средним значением сигнала управления с выхода реле u(t) 0= , который

Page 86: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

86

наступает по окончании переходного процесса. Из рис. 4.1 следует полное совпадение графиков для двух найденных управлений: (4.16) и (4.18). С точки зрения моментов времени переключения, оптимальное по быстродействию управление единственно, несмотря на то, что функций переключения можно найти несколько.

Так, например, оптимальное управление можно получить, если воспользоваться свойством 6.2 и в уравнении (4.13) разделить правую часть на

2| x | : 2sign(x ) uψ = +& .

Проинтегрировав последнее уравнение, получим наиболее простое по структуре оптимальное быстродействующее управление

u sign( C)= − ψ + (4.19) с теми же временами переключения релейного элемента (см. рис. 4.1, цифра 1).

Недостатком управления (4.19) является необходимость определения постоянной интегрирования C и наличие интегратора в цепи обратной связи.

Пример 4.3. Рассчитаем закон оптимального быстродействующего управления для нелинейного объекта

1 1 1x (t) f (x ) u(t)+ =&& & Уравнениями такого вида описываются, например, системы следящего

электропривода постоянного тока с нагрузкой, нелинейно зависящей от частоты вращения, или системы с внутренними нелинейными обратными связями в виде "отсечек" по скорости, введенными для ограничения этой координаты, или некоторые режимы движения судов, летательных аппаратов и других объектов.

Для определенности, не влияющей на ход решения задачи, предположим, что нелинейная функция 3

1 1f (x ) x=& & . Запишем уравнения движения объекта в форме Коши:

1 2x x=& , 32 2x x u(t)= − +& (4.20)

Выбор примера (4.20) обусловлен тем, что в данном случае имеется довольно редкая возможность найти точное выражение для линии (а следовательно, и для функции) переключения [36]:

( )

22 2 2 2

1 222

1 x x1 1 2x sign(x ) 1 1 1x ln arctg arctg sign(x )6 3 3 3 31 x

− + − = − + + ⋅ +

. (4.21)

Решение. Составим функциональное уравнение первого интервала, используя условие быстродействия, аналогично предыдущему примеру:

2 2x | x | uψ = + ⋅& и подставим уравнения объекта (4.20):

31 2 2 2 2x | x | x | x | xψ = + ⋅ + ⋅& & & . (4.22)

или 2

1 2 2 2 2x (1 | x | x ) | x | xψ = ⋅ + ⋅ + ⋅& & & .

Page 87: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

87

Разделим правую часть последнего выражения на положительно определенную величину 2

1 2 21 x | x | x+ ⋅& : 2 2

1 22 2

| x | xx1 | x | x

⋅ψ = +

+ ⋅&

& & .

Интегрируя полученное выражение ψ& и учитывая условие для поверхности переключения в начале координат: 1 2(x 0,x 0) 0ψ → → → , определяем

( )

22 2 2 2

1 222

1 x x1 1 2x sign(x ) 1 1 1x ln arctg arctg sign(x )6 3 3 3 31 x

− + − ψ = + + + ⋅ +

(4.23)

и управление u sign( )= − ψ также совпадающее с известным. Предположим, что проинтегрировать уравнение (4.22) затруднительно.

Введем обозначение 3

3 2 2x | x | x= ⋅& . (4.24) Интегрируя уравнение (5.40), найдем функцию переключения

2 21 3

| x | xx x C2

⋅ψ = + + +

и оптимальное управление 2 2

1 3| x | xu sign x x C

2⋅ = − + + +

, (4.25)

где C - постоянная интегрирования уравнения (4.24), зависящая от начального значения координаты 3x , которое, в свою очередь зависит от начальных значений

10 20(x ,x ) . Заметим, что полученное управление (4.25) по структуре в точности совпадает с найденным управлением (4.18) предыдущей задачи. Это означает, что структура оптимального управления (4.18) может быть использована для любых линейных или нелинейных объектов второго порядка с одним управляющим воздействием, причем координата 3x будет зависеть от конкретного вида нелинейностей объекта.

На рис. 4.2 приведены результаты моделирования переходных процессов объекта (4.20) с управлениями (4.21) и (4.25). Из рис. 4.2 (кривые, обозначенные цифрой 1 следует полное совпадение графиков для известного управления (4.21) и найденного (4.25) предлагаемым методом.

Недостатком управления (4.25) также как и в предыдущем примере является необходимость определения постоянной интегрирования C и наличие интегратора в цепи обратной связи.

Пример 4.3 Рассмотрим задачу оптимального торможения математического маятника [15], являющегося осциллирующим объектом:

1 2x x=& , 2 1x x u= − +& . (4.26) Управление u(t) удовлетворяет ограничению | u(t) | 1≤ .

Page 88: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

88

Рис. 4.2 – Результаты моделирования переходных процессов

объекта (4.20) с оптимальными управлениями: 1 - (4.21); (4.25) при C 4.25= ; (4.74); 2 - (4.107), 3 - (4.110).

Решение. Поскольку система уравнений (4.26) второго порядка, то имеем два интервала управления. На втором интервале

2 2xψ = , при этом на первом интервале основное функциональное уравнение должно иметь вид

2(X) x (X) uψ = + ϕ ⋅& , причем условия быстродействия для осциллирующего объекта, согласно свойству 4 будут следующими

2| x | (X)≥ ϕ , (X) 0ϕ > . (4.27) Выберем вначале в первом условии (4.27) знак равенства, тогда

2| x | (X)= ϕ и 2 2(X) x | x | uψ = + ⋅& или в силу уравнений объекта (4.26)

1 2 2 1 1(X) x | x | x | x | xψ = + ⋅ + ⋅& & & & .

Page 89: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

89

Интегрируя последнее уравнение, получим квазиоптимальный по быстродействию закон управления

2 21 2

1 2x xu sign[ (X)] sign[x sign(x )]

2+

= − ψ = − + ⋅ . (4.28)

Структурная схема объекта (4.26) с законом управления (4.28) приведена на рис. 4.3.

Рис. 4.3 – Структурная схема объекта (4.26) с законом управления (4.28): 1задx - задающее воздействие, ×- блок умножения.

Запишем закон управления (4.28) в следующей форме:

2 21 2 2 2u sign[(x sign(x )) x 1] x = − + + − ⋅ . (4.29)

Из (4.29) следует, что линия переключения (X) 0ψ = в случае квазиоптимального по быстродействию закона управления состоит всего лишь из двух полуокружностей радиусом равным единице с центрами на оси 1x в точках

1x 1= ± и прямой 2x 0= за пределами полуокружностей. Для получения оптимального по быстродействию управления

консервативной системой (4.26) необходимо в условии (4.27) на первом интервале использовать не знак равенства, а знак больше, что существенно затрудняет решение задачи. Как известно, точное решение для линии переключения состоит из бесконечного числа полуокружностей единичного радиуса с центрами по оси 1x в точках 1x 1, 3, 5,= ± ± ± K . С учетом этого оптимальное управление (4.28) примет вид:

221

1 2 2 2| x | 2u sign x 2 int 1 sign(x ) x 1 x

2

+ = − + ⋅ − ⋅ + − ⋅ , (4.30)

где int(x) - целая часть x . На рис. 4.4 приведены результаты моделирования системы (4.26) с

квазиоптимальным (4.28) и оптимальным (4.28) по быстродействию законами

2x

×

p1 p1

21

1задx ψ )t(u 1x

Объект управления

Блок нелинейной ОС

_

_

_

× ×

Page 90: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

90

управления, а на рис. 4.5 показаны фазовые траектории системы (4.26) с законами управления (4.31) и (4.30).

Рис. 4.4 – Графики изменения сигнала управления и координат системы (4.26) с законом управления: 1 - (4.28), 2 - (4.30).

Рис. 4.5 – Фазовые траектории системы (4.26) с законом управления:

1 - (4.28), 2 - (4.30). Из рис. 4.4 и рис. 4.5 следует, что в системе (4.26) с оптимальным

управлением (4.30) амплитуда координат в переходном процессе несколько больше, чем с квазиоптимальным управлением (4.28), а время регулирования - несколько меньше (разность времен регулирования около 2 %). С увеличением начальных отклонений координат от положения равновесия эта разность становится все меньше. С точки зрения технической реализации квазиоптимальный по быстродействию закон управления (4.28) более предпочтителен, чем оптимальный (4.30).

Page 91: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

91

Достоинством квазиоптимального закона управления (4.28) по отношению к оптимальному (4.28) является также несколько меньшие амплитудные значения координат объекта в переходном процессе.

Предлагаемый подход к решению задач оптимального быстродействия позволяет достаточно просто аналитически синтезировать квазиоптимальные по быстродействию управления для колебательных систем. При этом, несмотря на более простую реализацию квазиоптимального регулятора, время регулирования практически не отличается от времени регулирования при быстродействующем управлении.

Пример 4.4 В различных областях техники достаточно распространены

нелинейные осциллирующие объекты, примерами которых могут служить разного рода генераторы, многие нелинейные электрические цепи, различные физические системы, модели которых приводятся к уравнениям математического маятника, например уравнения движения ротора синхронного двигателя переменного тока с асинхронным запуском.

Рассмотрим методику синтеза квазиоптимальных по критерию быстродействия систем управления нелинейными осциллирующими объектами, для которых можно записать дифференциальные уравнения Дюффинга [36]:

1 2x x=& , 32 1 1x x x u= − − +& , | u | 1≤ . (4.32)

Для упрощения решения и реализации регулятора используем условие быстродействия для неосциллирующих объектов. Составляем основное функциональное уравнение для функции переключения

2 2x | x | uψ = + ⋅& , подставляем в него 2x и u из уравнений объекта

31 2 2 1 1 1 1x | x | x | x | x | x | xψ = + ⋅ + ⋅ + ⋅& & & & & ,

интегрируем 2 2 42 1 1

1 2x x xx sign(x )2 2 4

ψ = + + + ⋅

и на основе полученной функции переключения записываем закон квазиоптимального по быстродействию управления

2 2 42 1 1

1 2x x xu sign x sign(x )2 2 4

= − + + + ⋅

. (4.33)

Результаты моделирования объекта (4.32) с управлением (4.33) показаны на рис. 4.6. На рис. 4.7 показана линия переключения, построенная по уравнению

0ψ = , а на рис. 4.8 изображена линия переключения для оптимального по быстродействию управления, рассчитанная на ЭВМ в [41] и приведенная в книге [36].

Из сравнения рис. 4.7 с рис. 4.8 следует, что линии переключения для первого полвитка 1| x | 1.18≤ практически совпадают. Подчеркнем, что линия переключения на рис. 4.8 рассчитана по достаточно сложной процедуре методом

Page 92: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

92

степенных рядов с помощью ЭВМ, а линия переключения на рис. 4.7 получена достаточно быстро и чисто аналитически всего лишь интегрированием функционального уравнения с учетом уравнений объекта.

Рис. 4.6 – Графики переходных процессов объекта (4.32) с управлением (4.33) при различных начальных условиях: 1 - 10x 1.18= , 20x 0= ; 2 - 10x 2= , 20x 0= .

Рис. 4.7 – Линия переключения для объекта (4.32) с управлением (4.33)

Page 93: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

93

Рис. 4.8. Известная линия переключения [36] для объекта (4.32)

Пример 4.5. Задача оптимального торможения математического маятника

(осциллирующего объекта) [15] с двумя параметрами управления 1u и 2u : 1 2 1x x u= +& , 2 1 2x x u= − +& , (4.34)

причем управления удовлетворяют ограничениям 1| u (t) | 1≤ и 2| u (t) | 1≤ . Поскольку система уравнений (4.34) второго порядка, то здесь также два

интервала для каждого управления. Последнее оптимальное управление на втором интервале для 1u : 2

1 1u sign[x ]= − переводит объект (4.34) по линии переключения в начало координат. Тогда на первом интервале аналогично примеру 4.3: 1 1 1 1(X) x (X) uψ = + ϕ ⋅& . Воспользуемся и здесь вначале условием (3.29) со знаком равенства, при этом 1 1| x | (X) 0= ϕ > и 1 1 1 1(X) x | x | uψ = + ⋅& или в силу уравнений объекта (4.34):

1 2 1 1 2 2 1

2 1 2 1 2 1 1

(X) x (x x x x )sign(x )u u u sign(x ) u x sign(x )

ψ = − + + ++ + −

& & & &

&. (4.35)

Под действием управления 1 1u sign[ (X)]= ψ как только станет 1(X) 0ψ = при 1(X) 0ψ =& ,

21 1 1u u sign[x ]= = − . (4.36)

Подставляя 1u из (4.36) в уравнение (4.35) и интегрируя его, получим квазиоптимальный по быстродействию закон управления 1u :

2 21 2

1 1 2 1 1 2x xu sign[ ] sign[ x sign(x ) | x | u ]

2+

= − ψ = − − + ⋅ − ⋅ (4.37)

Аналогично определяется закон управления 2u :

Page 94: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

94

2 21 2

2 2 1 2 2 1x xu sign[ ] sign[x sign(x ) | x | u ]

2+

= − ψ = − + ⋅ + ⋅ (4.38)

Результаты моделирования системы (4.34) с квазиоптимальными по быстродействию законами управления (4.37), (4.38) приведены на рис. 4.9.

Произведения 2 1| x | u⋅ и 1 2| x | u⋅ в законах управления (4.37), (4.38) можно упростить, если воспользоваться рис. 4.9, из которого следует, что в самом начале второго интервала для 1u , знак 2u отрицателен и противоположен знаку 1x :

2 1u sign(x )= − , а в самом начале второго интервала для 2u , знак 1u положителен и совпадает со знаком 2x : 1 2u sign(x )= .

Рис. 4.9 - Графики фазовых траекторий и сигналов системы (3.36) с законами управления: 1 - квазиоптимальные (4.37), (4.38) или (4.39), (4.40) или (3.43),

(3.44); 2 - оптимальные (3.45), (3.46). Линии переключения: 3 - 1 0ψ = ; 4 - 2 0ψ = ; 5 - начало скользящего режима.

Такой же вывод можно получить, если рассмотреть линии переключения

1 0ψ = и 2 0ψ = (рис. 4.9) с учетом выражений (4.37), (4.38) при различных управлениях 2u 1= ± и 1u 1= ± . Подставляя 2 1u sign(x )= − в (4.37) и 1 2u sign(x )= в (4.35), имеем:

2 21 2

1 1 2 1 1x xu sign[ ] sign[ x sign(x ) x ]

2+

= − ψ = − − + ⋅ + , (4.39) 2 21 2

2 2 1 2 2x xu sign[ ] sign[x sign(x ) x ]

2+

= − ψ = − + ⋅ + . (4.40)

Page 95: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

95

Структурная схема объекта (4.34) с законами управления (4.39), (4.40) приведена на рис. 4.10, а графики фазовых траекторий и сигналов системы - на рис 4.9.

Рис. 4.10. Структурная схема объекта (4.34) с законами управления (4.39), (4.40): 1задx , 2задx - задающие воздействия, × - блок умножения.

Запишем законы управления (4.34) в следующей форме:

2 21 1 1 2 1 1u sign[(x sign(x )) (x sign(x )) 2] x = − + + − − ⋅ , (4.41)

2 22 1 2 2 2 2u sign[(x sign(x )) (x sign(x )) 2] x = − + + + − ⋅ . (4.42)

Из (4.41), (4.42) следует, что каждая из линий переключения 1(X) 0ψ = и 2(X) 0ψ = в случае квазиоптимального по быстродействию управления состоит

всего лишь из двух кривых, равных четверти дуги окружностей с радиусом равным 2 , с центрами в точках (-1; 1), (1; -1) и прямой 1x 0= за пределами дуг для 1(X) 0ψ = и с центрами в точках (1; 1), (-1; -1) и прямой 2x 0= за пределами дуг для 2(X) 0ψ = (рис. 4.9).

Для получения оптимального по быстродействию управления консервативной системой (4.34) необходимо воспользоваться знаком больше в условии (3.29) на первых интервалах, что существенно затрудняет решение задачи.

Как известно, точное решение для линий переключения состоит из бесконечной серии четверти дуги окружностей [15]. С учетом этого оптимальные управления (4.41), (4.42) примут вид:

2 21 1 1 2 2 2 1 1u sign[(x sign(x )) (x k (x ) (sign(x )) 2] x = − + + − ⋅ − ⋅ , (4.43)

2ψ 2x×

p1

p1

21

1задx 1u 1x

Объект управления

_

_

_

×

×

×

2задx 2u

_

Page 96: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

96

2 22 1 1 1 2 2 2 2u sign[(x k (x ) sign(x )) (x sign(x )) 2] x = − + ⋅ + + − ⋅ , (4.44)

где ii

| x | 2k 2 int 12

+ = ⋅ −

; i 1, 2= ; int(x) - целая часть x .

На рис. 4.9. приведены результаты моделирования системы (4.34) с квазиоптимальным (4.41), (4.42) и оптимальным (4.43), (4.44) по быстродействию законами управления. Из рис. 3.9 следует, что в системе (4.34) с оптимальным управлением (4.43), (4.44) амплитуда координат в переходном процессе несколько больше, чем с квазиоптимальным управлением (4.37), (4.38) или (4.39), (4.40) или (4.41), (4.42), а время регулирования - несколько меньше (разность времен регулирования меньше, чем 1 %). С увеличением начальных отклонений координат от положения равновесия различия становятся меньше. С точки зрения технической реализации квазиоптимальный по быстродействию закон управления (4.39), (4.40) более предпочтителен, чем оптимальный (4.43), (4.44), а время регулирования практически не отличается от времени регулирования при быстродействующем управлении. Пример 4.6. Выполнить синтез оптимальной по быстродействию системы третьего порядка из трех интегрирующих звеньев

1 2x x=& , 2 3x x=& , 3x u=& . (4.45) Уравнениями (4.45) приближенно описывается ряд объектов, например,

процесс управления курсом нейтрального самолета, собственным демпфированием которого можно пренебречь. Наиболее полно и подробно задача синтеза оптимальной системы (4.45) с ограниченной третьей производной регулируемой величины решена А.А. Фельдбаумом [42] и А.А. Павловым [39]. В этих работах получено точное решение для быстродействующего оптимального управления:

33 2 23 3 3 3 3 3

1 2 3 2 2 2x x | x | x | x | xu sign x x x x sign x sign x .3 2 2 2

= − + + + + + +

(4.46) Перед решением задачи синтеза проверим управление (4.45) на

оптимальность по быстродействию. Из уравнений объекта и утверждения о числе интервалов управлений

следует, что оптимальное по быстродействию управление должно иметь три интервала. Найдем вначале производную от функции переключения, записанной в фигурных скобках проверяемого управления (4.46) с учетом уравнений объекта (4.45) и приведения подобных членов. Другими словами, найдем основное функциональное уравнение из предполагаемого решения:

(X) f (X) (X) uψ = + ϕ ⋅& , где

Page 97: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

97

( ) ( ) ( ) ( )2 23 2 2 3 3 2 2 2 2

3 1f (X) x x sign x x x sign sign sign2 2

= + ψ + + ψ ⋅ ψ ⋅ ψ

,

( ) ( ) ( )2 23 2 2 3 3 2 2 2

3 1(X) x x sign x x x sign sign2 2

ϕ = + ψ + + ψ ⋅ ψ

, (4.47)

3 32 2

| x | x(X) x2

ψ = + .

Поскольку функции f (X) и (X)ϕ , входящие в производную от функции переключения проверяемого оптимального управления удовлетворяют необходимым и достаточным условиям быстродействия (свойство 5): | f (X) | (X)= ϕ и функция (X(t))ϕ положительно определенна (рис. 4.11), то проверяемое управление (4.46) на первом интервале действительно оптимально по быстродействию.

Рис. 4.11. Зависимость функции (X)ϕ от времени На втором интервале при (X) 0ψ = и (X) 0ψ =& эквивалентное управление

найдем из основного функционального уравнения, приравняв правую часть нулю: 3 3

2 2 2| x | xf (X)u sign( ) sign x

(X) 2 = − = − ψ = − + ϕ

.

Заметим, что эквивалентное управление второго интервала 2u , согласно теории, должно зависеть только от координат 2x , 3x и не должно зависеть от 1x . Это свидетельствует о сжатии фазового пространства при переходе с первого интервала на второй.

Для оценки оптимальности управления второго интервала найдем функциональное уравнение второго интервала как производную от функции переключения 2 21 3(x ,x )ψ эквивалентного управления 2u : 2 2 3 3x | x | xψ = +& & & . Подставляя уравнения объекта, получим

2 3 3x | x | uψ = + ⋅& .

Page 98: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

98

И здесь (на втором интервале) функции 2 3f (X) x= и 2 3(X) | x |ϕ = удовлетворяют необходимым и достаточным условиям быстродействия (свойство 5): 2 2| f (X) | (X)= ϕ и 2(X) 0ϕ > . Следовательно, проверяемое управление (4.46) на втором интервале также действительно оптимально по быстродействию.

На третьем (последнем) интервале при 2(X) 0ψ = и 2(X) 0ψ =& эквивалентное управление найдем из функционального уравнения 2 3 3x | x | uψ = + ⋅& , приравняв правую часть нулю:

( )33 3 3

3

xu sign( ) sign x| x |

= − = − ψ = − .

Отметим, что и при переходе со второго интервала на третий произошло сжатие фазового пространства. На третьем интервале в эквивалентном управлении осталась всего лишь одна, последняя по счету, быстроизменяющаяся координата 3x . Как только величина 3x , в результате действия эквивалентного управления 3u становится равной нулю, наступает скользящий режим с высокой частотой переключения реле и со средним значением выходного сигнала реле равным нулю.

Итак, проверяемое управление (4.46) действительно оптимально по быстродействию. Подчеркнем, что в действительности на всех интервалах действует всегда одно и то же оптимальное управление (4.46), а получающиеся эквивалентные управления на каждом интервале являются следствием сжатия фазового пространства (из-за появления каждый раз при переходе на следующий интервал дополнительного уравнения i (X) 0ψ = , которое упрощает систему уравнений объекта на каждом последующем интервале).

Как видно из (4.46), реализация регулятора на основе точного оптимального управления встречает определенные трудности для систем третьего порядка. Рассмотрим аналитическое конструирование быстродействующего регулятора на основе предлагаемой теории, позволяющее упростить реализацию оптимального регулятора. Решение. На последнем (третьем) интервале остается только одна самая "быстрая" координата 3x , т.е. функция переключения на третьем интервале

3 3xψ = . На предыдущем (втором) интервале функциональное уравнение для функции переключения будет иметь вид:

2 3 3 3 3| | u x | x | uψ = ψ + ψ ⋅ = + ⋅& или с учетом уравнений объекта (4.45), имеем 2 2 3 3x | x | xψ = + ⋅& & & , откуда

3 32 2

| x | xx2

⋅ψ = + . Из последней формулы видно, что на втором интервале к

координате 3x добавляется более "медленная" координата 2x . Записываем теперь функциональное уравнение для первого интервала:

3 3 3 32 2 2 2

| x | x | x | x| | u x x u2 2

⋅ ⋅ψ = ψ + ψ ⋅ = + + + ⋅& . (4.48)

Page 99: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

99

На первом интервале к координатам 2x , 3x добавляется еще более "медленная" координата 1x . Подчеркнем, что функциональное уравнение первого интервала является одновременно основным (общим) функциональным уравнением, из которого интегрированием, в силу уравнений объекта можно определить функцию переключения оптимального по быстродействию регулятора и оптимальное управление. Для получения функции переключения разделим правую часть уравнения (4.48) на положительно определенную

величину 3 32

| x | xx2

⋅+ и умножим на положительно определенную величину

(X)ϕ . Интегрируя полученное выражение для ψ& , определим оптимальное управление, совпадающее с (4.45).

Пусть функция (X)ϕ не известна. Проинтегрируем уравнение (4.45): 1 4u sign( ) sign(x x C)= − ψ = − + + , (4.49)

где 3 3 3 3

4 2| x | x | x | xx x u

2 2⋅ ⋅

= + + ⋅& . (4.50)

Функциональное уравнение (4.48), а, следовательно, и выражение оптимального управления (4.49), (4.50) можно упростить, если разделить правую часть (4.47),

согласно свойству 6, на выражение 3 32

| x | xx2

⋅+ :

3 32

| x | xsign x u2

⋅ ψ = + +

& . (4.51)

В этом случае управление будет равно u sign( C)= − ψ + ,. (4.52)

где ψ определятся регулятором, содержащим в цепи обратной связи интегратор, работающий в соответствии с формулой (4.51), а С - постоянная интегрирования, которую легко найти с помощью вычислительной техники. Как видно из формул (4.51) и (4.52) структура найденного оптимального управления намного проще, чем известного (4.46). Тем не менее, моделирование показывает (рис. 4.12), что переходный процесс от известного управления (4.46) полностью совпадает с переходным процессом от найденного управления (4.52) или (4.49). Пример 4.7 Выполнить синтез оптимального по быстродействию управления системой четвертого порядка, состоящей из четырех последовательно включенных интегрирующих звеньев

1 2x x=& , 2 3x x=& , 3 4x x=& , 4x u=& . (4.53) Решение. Здесь четыре интервала управлений вида i iu sign( )= − ψ , i 1, ,4= K . На последнем (четвертом) интервале 4 4u sign( )= − ψ и 4 4xψ = . Записываем функциональное уравнение для третьего интервала: 3 4 4x | x | uψ = + ⋅& .

Page 100: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

100

Рис. 4.12 - Переходный процесс для объекта (4.45) при управлении по закону: (4.46); (4.49) при C 3.33= − ;(4.52) при C 2.71= ; (4.78)

Подставляем уравнения объекта: 3 3 4 4x | x | xψ = + ⋅& & & . Интегрируем последнее

уравнение и определяем функцию переключения третьего интервала: 4 4

3 3| x | xx

2⋅

ψ = + .

Записываем функциональное уравнение для второго интервала:

2 3 3| | uψ = ψ + ψ ⋅& или 4 42 3 3

| x | xsign( ) u sign x u2

⋅ ψ = ψ + = + +

& .

Функцию переключения второго интервала определим в результате интегрирования последнего уравнения:

2 5 1 4x c xψ = + + , где

4 45 3

| x | xx sign x2

⋅ = +

& , (4.54)

1c - постоянная интегрирования. Записываем функциональное уравнение для первого интервала:

2 2| | uψ = ψ + ψ ⋅& или ( )2 5 1 4sign( ) u sign x c x uψ = ψ + = + + +& , функцию переключения

6 2 4x c xψ = + + и оптимальное по быстродействию управление

6 2 4u sign( ) sign(x c x )= − ψ = − + + . (4.55) Здесь

Page 101: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

101

( )6 5 1 4x sign x c x= + +& . (4.56) Итак, оптимальный по быстродействию регулятор реализуется с помощью

двух интеграторов в обратной связи для получения промежуточных переменных 5x и 6x в соответствии с формулами (4.54), (4.56), трех сумматоров, трех релейных элементов, блока определения модуля переменной 4x и блока умножения (рис. 4.13).

Рис. 4.13. Структурная схема объекта (4.53) с законом управления (4.54) - (4.56)

Для проверки результатов моделирования следящей системы (4.53) - (4.56)

при отработке ступенчатого входного воздействия (рис. 4.14), воспользуемся известной формулой для моментов времени переключения [39]:

5x

zu

2x 1x p1 p1

ψ )t(u 4x

Объект управления

p1

1c 1f

6x&

6x

ψ

p1 p1 3x

p1

5x&

2f 2c

БЗ

mod

21 ×

Page 102: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

102

( ) 2ni 10

n 1 ! it 4 x sin4 2 n− ⋅ π = ⋅ ⋅ ⋅ ⋅

, i 1,2, ,n= K , (4.57)

где n - количество последовательно включенных интегрирующих звеньев и одновременно число моментов переключений, причем время переходного процесса пп nt t= .

Моменты времени переключения, полученные при моделировании (рис. 4.14) и рассчитанные по формуле (4.57) приведены в таблице 4.1.

Табл. 4.1. Времена переключения 1t , с 2t , с 3t , с 4t , с Расчет по формуле (4.57) 0.969 3.309 5.65 6.619 Моделирование. Закон управления:

(4.54) - (4.56) 0.968 3.312 5.65 6.621 (4.58) - (4.60) 0.967 3.307 5.66 6.63 ((4.58), (4.61), (4.62) 0.969 3.308 5.66 6.635

Недостатком найденного оптимального управления (4.54) - (4.56) является

необходимость подбора коэффициентов 1c и 2c в зависимости от начальных условий. Как отмечалось выше, этот недостаток может быть устранен частично или полностью, если тем или иным способом найти аналитически функции переключения интервалов, например, в результате аналитического интегрирования функционального уравнения (3.6), составленного для каждого интервала.

Так, например, в рассматриваемом случае функции переключения для четвертого и третьего интервалов легко определяются аналитически. Заметим здесь, что на четвертом интервале остается только координата 4x , то есть на четвертом интервале система уравнений объекта (4.53) преобразуется к одному четвертому уравнению. На третьем интервале функция переключения содержит две координаты, то есть фазовое пространство по отношению к четвертому интервалу расширилось с размерности, равной единице до размерности, равной двум, и к четвертому уравнению объекта (4.53) добавилось третье и, следовательно, система уравнений для третьего интервала будет второго порядка. На втором интервале фазовое пространство по отношению к третьему интервалу расширяется с размерности, равной двум до размерности, равной трем, и к двум последним уравнениям объекта (4.53) добавляется второе и, следовательно, система уравнений для второго интервала будет третьего порядка. Таким образом, объект (4.53) на втором интервале будет представлен последовательным соединением трех интеграторов.

В примере 4.6 приводилось точное решение (4.46) для системы из трех интегрирующих звеньев, используя его, можно записать для данного примера функцию переключения второго интервала. При этом необходимо в уравнении (4.46) индексы всех переменных увеличить на единицу:

Page 103: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

103

Рис. 4.14 – Результаты моделирования объекта (4.53) с оптимальным

управлением: (4.53) - (4.56) при 1c 1.135= и 2c 0.8= ; (4.58) - (4.60) приc 1.938= ; (4.58), (4.58), (4.61), (4.62) при c 1.938∗ =

3

3 2 24 4 4 4 4 4

2 2 3 4 3 3 3x x | x | x | x | xx x x x sign x sign x .3 2 2 2

ψ = + + + + + +

(4.58)

Функцию переключения (4.58) можно получить и из функционального уравнения второго интервала

4 42 3 3 4

| x | xsign( ) u sign x x2

⋅ ψ = ψ + = + +

& & ,

если в соответствии со свойством 6.2 умножить правую часть последнего уравнения на положительно определенную функцию, аналогичную (4.47)

( ) ( ) ( )2 24 3 3 4 4 3 3 3

3 1(X) x x sign x x x sign sign2 2

ϕ = + ψ + + ψ ⋅ ψ

и выполнить преобразования, обратные примеру 4.6 (проверка оптимальности управления).

Используя известную функцию переключения (4.58) второго интервала, можно записать функциональное уравнение первого интервала

2sign( ) uψ = ψ +& . (4.59) Тогда оптимальное управление будет иметь вид:

u sign( c)= − ψ + , (4.60)

Page 104: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

104

где с - постоянная интегрирования уравнения (4.59). Для сравнения моменты времени переключения, полученные при

моделировании объекта (4.53) с управлением (4.58) - (4.60) (рис. 4.15) приведены в таблице 4.1.

Если в уравнение (4.59) подставить четвертое уравнение объекта и ввести обозначение

6 2x sign( )= ψ& , (4.61) то оптимальное управление можно записать и в таком виде:

6 5u sign(x c x )∗= − + + . (4.62) Моменты времени переключения, полученные при моделировании объекта

(4.53) с управлением (4.58), (4.61), (4.62) (рис. 4.14) также приведены в таблице 4.1.

Таблица 4.1 и рис. 4.14 показывают практически полное совпадение моментов времени переключения, полученных в результате моделирования системы с различными законами управления и рассчитанных по формуле (4.57).

Пример 4.8. Выполнить синтез оптимального по быстродействию управления системой пятого порядка, состоящей из пяти последовательно включенных интегрирующих звеньев

1 2x x=& , 2 3x x=& , 3 4x x=& , 4 5x x=& , 5x u=& . (4.63) Решение. Поскольку здесь пять интервалов управлений, то требуется последовательно найти пять функций переключения аналогично предыдущему примеру. Для пятого интервала функция переключения 5 5xψ = . Для четвертого интервала функциональное уравнение 4 5 5 4 5 5x | x | u x | x | xψ = + ⋅ = + ⋅& & & и функция

переключения 5 54 4

| x | xx2

⋅ψ = + . Для третьего интервала функциональное

уравнение 3 4 4| | uψ = ψ + ψ ⋅& или 5 5 5 53 4 4 5

| x | x | x | xx x x2 2

⋅ ⋅ψ = + + + ⋅& & или

5 53 4 5

| x | xsign x x2

⋅ ψ = + +

& & .

Обозначая за 5 5

6 4| x | xx sign x

2⋅ = +

& (4.64)

и интегрируя 3ψ& , получим функцию переключения третьего интервала: 3 6 1 5x c xψ = + + . Функциональное уравнение для второго интервала

( )2 6 1 5 5sign x c x xψ = + + +& & . Обозначая за ( )7 6 1 5x sign x c x= + +& (4.65)

и интегрируя 3ψ& , получим для второго интервала: 2 7 2 5x c xψ = + + .

Page 105: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

105

Функциональное уравнение для первого интервала ( )7 2 5 5sign x c x xψ = + + +& & . Обозначая за

( )8 7 2 5x sign x c x= + +& (4.66) и интегрируя ψ& , получим функцию переключения: 8 3 5x c xψ = + + и искомое оптимальное управление:

( )8 3 5u sign x c x= − + + . (4.67) На рис. 4. 15 показаны результаты моделирования процессов объекта (4.63) с

оптимальным управлением (4.64) - (4.67).

Рис. 4.15 – Результаты моделирования объекта (4.63) с оптимальным управлением: (4.64) - (4.67) при 1c 1.043= , 2c 0.01= и 3c 0.454=

Из рис. 4.15 видно, что переходный процесс состоит из пяти интервалов.

Сравнение моментов времени переключения (табл. 4.2), полученных при моделировании процессов оптимальной системы (4.64) - (4.67) (рис. 4. 15) и рассчитанных по формуле (4.57) при n 5= свидетельствует об их практически полном совпадении. Некоторые расхождения обусловлены неточным подбором постоянных интегрирования 1c , 2c , 3c .

Отметим, что для реализации оптимального управления (4.64) - (4.67) необходимо иметь информацию всего лишь о двух координатах системы: 5x и

4x . Если функциональное уравнение четвертого интервала записать в виде 4 5 5sign(x ) xψ = +& & , то для этого интервала функция переключения может быть

Page 106: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

106

записана так: 4 9 4 5x c xψ = + + , где 9 5x sign(x )=& . И тогда для реализации оптимального управления необходимо и достаточно иметь информацию только лишь об одной координате 5x .

Табл. 4.2. Времена переключения системы (4.63) - (4.67)

1t , с 2t , с 3t , с 4t , с 5t , с

Моделирование 0.75 2.71 5.1 6.98 7.69 Расчет 0.75 2.72 5.17 7.14 7.89

Для получения оптимального управления, в общем случае необходимо

интегрировать скорость проникновения на каждом интервале, кроме последнего: (X) (X)dt Cψ = ψ +∫ & ,

где С – константа интегрирования. Если интеграл от (X)ψ& может быть найден в силу уравнений объекта аналитически, то С легко определяется из условия

(X) 0ψ = при X 0= , поскольку поверхность переключения должна проходить через начало координат. В противном случае константу интегрирования приходится искать изнурительным методом подбора.

4.2 МЕТОДИКА СИНТЕЗА ОПТИМАЛЬНОГО ПО БЫСТРОДЕЙСТВИЮ

УПРАВЛЕНИЯ РЕШЕНИЕМ УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ

Рассмотрим алгоритм решения задачи быстродействия для

неосциллирующих нелинейных объектов (4.1) n-ного порядка с одним управляющим воздействием, не требующий определения константы интегрирования.

Составим функциональное уравнение для i-того интервала объекта (4.1)аналогично примеру 3.1. В силу уравнений объекта (3.1):

i i i ii i i 1 n

i i 1 n nF F ... F u

x x x x++

∂ψ ∂ψ ∂ψ ∂ψψ = + + + + ⋅

∂ ∂ ∂ ∂& , (4.68)

причем управление i-того интервала i iu u sign( )= = − ψ переводит изображающую точку на поверхность переключения i 0ψ = , а управление (i+1)-го интервала

i 1 i 1u u sign( )+ += = − ψ удерживает изображающую точку на поверхности переключения 0i =ψ . Подставляя в уравнение (4.68) управление

i 1 i 1u u sign( )+ += = − ψ , получим уравнение для определения функции переключения i-того интервала:

i i i i ii i i 1 n 1 n i 1

i i 1 n 1 n nF F ... F F [ sign( )] 0

x x x x x+ − ++ −

∂ψ ∂ψ ∂ψ ∂ψ ∂ψψ = + + + + ⋅ − ψ =

∂ ∂ ∂ ∂ ∂& .

или

Page 107: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

107

i i i ii i 1 n 1 n i 1

i i 1 n 1 nF F ... F [ F sign( )]

x x x x+ − ++ −

∂ψ ∂ψ ∂ψ ∂ψ+ + = − + ψ

∂ ∂ ∂ ∂. (4.69)

Здесь, для i-того интервала слагаемое в квадратных скобках i 1sign( )+ψ не меняет знака, т.к. это процессы следующего (i+1)-го интервала.

Уравнение (4.69) в отличие от уравнения Беллмана является линейным дифференциальным уравнением в частных производных первого порядка, решение которого хорошо известно, например, с помощью степенных рядов.

Рассмотрим методику на примере объекта четвертого порядка: 1 1

2 2

3 3

4 4

x F (X);x F (X);x F (X);x F (X) u.

= = = = +

&

&

&

&

Функция переключения на четвертом интервале: 4 4xψ = . Функция переключения на третьем интервале определяется из уравнения:

3 33 4 4

3 4F [ F sign(x )]

x x∂ψ ∂ψ

= − +∂ ∂

.

Функция переключения на втором интервале определяется из уравнения: 2 2 2

2 3 4 32 3 4

F F [ F sign( )]x x x

∂ψ ∂ψ ∂ψ+ = − + ψ

∂ ∂ ∂.

Функция переключения на первом интервале определяется из уравнения:

1 2 3 4 21 2 3 4

F F F [ F sign( )]x x x x

∂ψ ∂ψ ∂ψ ∂ψ+ + = − + ψ

∂ ∂ ∂ ∂.

При этом оптимальное по быстродействию управление: u sign( )= − ψ . Недостатком рассмотренной методики является необходимость использования метода степенных рядов для решения дифференциальных уравнений в частных производных.

Пример 4.9. Выполнить синтез оптимального по быстродействию закона

управления для системы примера 4.1 на основе дифференциального уравнения в частных производных.

В соответствии с рассмотренной методикой функция переключения на втором интервале 2 2xψ = , а на первом – определяется уравнением (4.69):

1 2 21 2

F [ F sign( )]x x

∂ψ ∂ψ= − + ψ

∂ ∂ или, подставляя уравнения объекта (4.4):

2 21 2

x [sign(x )]x x

∂ψ ∂ψ=

∂ ∂. (4.70)

Будем искать функцию переключения в виде: 1 2x z(x )ψ = + . Поскольку уравнение (4.70) не зависит от 1x , то такое представление правомочно. Тогда получим

Page 108: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

108

22 2 2 2

22

x dx x sign(x )z(x )sign(x ) 2

⋅= =∫

и управление, совпадающее с (4.9). Пример 4.10. Выполнить синтез оптимального по быстродействию закона

управления для системы примера 4.2. Функция переключения на втором интервале 22 x=ψ , а на первом –

определяется уравнением (4.69):

)](signF[x

Fx 22

21

1ψ+−

∂ψ∂

=∂

ψ∂ (4.71)

или, подставляя уравнения объекта (4.12): 2 2 21 2

x [x sign(x )]x x

∂ψ ∂ψ= +

∂ ∂. Будем

искать функцию переключения в виде: 1 2x z(x )ψ = + . Будем искать функцию переключения в виде: 1 2x z(x )ψ = + . Поскольку уравнение (4.71) не зависит от

1x , то такое представление правомочно. Тогда получим: 2 2

2 2 2 22 2

x dxz(x ) x sign(x ) ln(1 | x |)x sign(x )

= = − ⋅ ++∫

и управление, совпадающее с (4.16). Пример 4.11. Выполнить синтез оптимального по быстродействию закона

управления для системы примера 4.3. Функция переключения на втором интервале 22 x=ψ , а на первом –

определяется уравнением (4.69): )](signF[x

Fx 22

21

1ψ+−

∂ψ∂

=∂

ψ∂ или, подставляя

уравнения объекта (4.12):

2 2 21 2

x [x sign(x )]x x

∂ψ ∂ψ= +

∂ ∂. (4.72)

Будем искать функцию переключения в виде: 1 2x z(x )ψ = + . Подставляя 1 2x z(x )ψ = + , получим:

2 22 3

2 2

x dxz(x )x sign(x )

=+∫ (4.73)

и после интегрирования функцию переключения, совпадающую с (4.21). Предположим, что проинтегрировать выражение (4.22) затруднительно.

Решая уравнение (4.72) с помощью степенных рядов до 44-й степени, можно получить:

Page 109: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

109

2 8 14 20 26 32 38 442 2 2 2 2 2 2 2

1зад 1 2x x x x x x x xu sign x x ... sign(x )2 8 14 20 26 32 38 44

= − − + + + + + + + + ⋅ +

5 11 17 23 29 35 412 2 2 2 2 2 2x x x x x x x ...

5 11 17 23 29 35 41

+ + + + + + + +

. (4.74)

Из рис. 4.2 следует, что управление (4.74) в виде ряда также тождественно оптимальному по быстродействию управлению (4.21).

Пример 4.12. Выполнить синтез оптимального по быстродействию закона

управления для системы примера 4.6. Здесь три интервала. Функция переключения на третьем интервале: 33 x=ψ .

Функция переключения на втором интервале определяется из уравнения:

)]x(sign[x

xx 3

3

23

2

2∂ψ∂

=∂ψ∂ .

Будем искать решение в виде 2 2 3x z(x )ψ = + . Имеем: 3 3 3 3

33

x dx x | x |z(x )sign(x ) 2

⋅= =∫ и 3 3

2 2x | x |x

2⋅

ψ = + .

Функция переключения на первом интервале определяется из уравнения:

)](sign[x

xx

xx 2

33

22

∂ψ∂

=∂

ψ∂+

∂ψ∂ .

Будем искать решение в виде 1 2 3x z(x ,x )ψ = + . Имеем:

)(signxzx

xzx 2

33

22 ψ⋅

∂∂

=⋅∂∂

+ . (4.75)

Поскольку уравнение (4.75) не зависит от 1x , то такое представление: 1 2 3x z(x ,x )ψ = + правомочно. Уравнение (4.75) является линейным

дифференциальным уравнением в частных производных первого порядка. Подстановкой

∗++ψ⋅⋅= z3x)(signxxz

33

232

его можно свести к обыкновенному уравнению в частных производных:

0)(signxzx

xz

23

32

=ψ⋅∂∂

−⋅∂∂ ∗∗

.

Соответствующее обычное дифференциальное уравнение имеет вид:

)(signdx

xdx

2

3

3

2ψ−

= .

Учитывая, что на первом интервале 02 ≠ψ и не изменяет знака, при этом const)(sign 2 =ψ , непосредственно из предыдущего соотношения находим

)X()X(z ∗∗ µ= ,

Page 110: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

110

где )X( ∗µ - произвольная функция координаты 2

x)(signxX23

22 +ψ⋅=∗ .

Итак, предполагаемое решение принимает вид: )]X([signu ψ−= , где

)X(3x)(signxxx)x,x(zx)X(

33

2321321∗µ++ψ⋅⋅+=+=ψ , (4.76)

причем должно выполняться условие:

0xX

x)(signxxz

32322

3>⋅

∂µ∂

++ψ⋅=∂∂

Этому условию удовлетворяет функция

)(sign2

x)(signx)X( 223

23

22 ψ⋅

+ψ⋅=µ ∗ (4.77)

Подставляя (4.77) в (4.76) получим оптимальный по быстродействию закон управления, совпадающий с известным (4.46).

Применим метод степенных рядов для решения уравнения (4.75). 2 2

0 2 2 3 3 22 2 23 2 3 33 3

3 2 2 3222 2 223 2 3 233 2 3 333 3

4 3 2 2 3 42222 2 2223 2 3 2233 2 3 2333 2 3 3333 3

5 4 3 2 2 3 4 522222 2 22223 2 3 22233 2 3 22333 2 3 23333 2 3 33333 3

z A A x A x A x A x x A x

A x A x x A x x A x

A x A x x A x x A x x A x

A x A x x A x x A x x A x x A x ..

= + + + + + +

+ + + + +

+ + + + + +

+ + + + + + + .

Поскольку z(0) 0= , то 0A 0= . Подставляя z в (4.75): 2 2 2 3

2 2 3 22 2 3 23 3 222 2 3 223 2 3 233 3

3 2 2 2 3 4 42223 2 3 2223 2 3 2233 2 3 2333 3 22222 2 3

3 2 2 3 4 522223 2 3 22233 2 3 22333 2 3 23333 3 3 2

23 2 2 33 2 3 223 2

x A x 2A x x A x 3A x x 2A x x A x

4A x x 3A x x 2A x x A x 5A x x

4A x x 3A x x 2A x x A x ... A u

A u x 2A u x A u

+ + + + + + +

+ + + + + +

+ + + + + + +

+ + + 2 22 233 2 2 3 333 2 3

3 2 2 32223 2 2 2233 2 2 3 2333 2 2 3 3333 2 3

4 3 2 2 3 422223 2 2 22233 2 2 3 22333 2 2 3 23333 2 2 3 33333 2 3

x 2A u x x 3A u x

A u x 2A u x x 3A u x x 4A u x

A u x 2A u x x 3A u x x 4A u x x 5A u x ... 0

+ + +

+ + + + +

+ + + + + + = и объединяя слагаемые с одинаковыми переменными, получим систему алгебраических уравнений и решения для коэффициентов:

2x : 23 21 A u 0+ = , → 23 2A u= − .

3x : 2 33 2A 2A u 0+ = , → задаемся 2A 1= , тогда 33 21A u2

= − . 22x : 223 2A u 0= , → 223A 0= . 2 3x x : 22 233 22A 2A u 0+ = , → задаемся 22A 1= , тогда 233 2A u= − . 23x : 23 333 2A 3A u 0+ = , → 23

333 2A 1A u3 3

= − = . 32x : 2223 2A u 0= , → 2223A 0= .

Page 111: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

111

22 3x x : 222 2233 23A 2A u 0+ = , → задаемся 222A 1= , тогда 2233 2

3A u2

= − . 2

2 3x x : 223 2333 22A 3A u 0+ = , → т.к. 223A 0= , то и 2333A 0= . 33x : 233 3333 2A 4A u 0+ = , → 233

3333 2A 1A u

4 4= − = .

42x : 22223 2A u 0= , → 22223A 0= . 32 3x x : 2222 22233 24A 2A u 0+ = , → задаемся 2222A 1= , тогда 22233 2A 2u= − . 2 22 3x x : 2223 22333 23A 3A u 0+ = , → т.к. 2223A 0= , то и 22333A 0= .

32 3x x : 2233 23333 22A 4A u 0+ = , → 2233

23333 2A 3A u

2 4= − = .

43x : 2333 33333 2A 5A u 0+ = , → т.к. 2333A 0= , то и 33333A 0= . 52x : 222223 2A u 0= , → 222223A 0= . 42 3x x : 22222 222233 25A 2A u 0+ = , → задаемся 22222A 1= , тогда 222233 2

5A u2

= − . 3 22 3x x : 22223 222333 24A 3A u 0+ = , → т.к. 22223A 0= , то и 222333A 0= . 2 32 3x x : 22233 223333 23A 4A u 0+ = , → 22233

223333 23A 3A u

4 2= = .

42 3x x : 22333 233333 22A 5A u 0+ = , → т.к. 22333A 0= , то и 233333A 0= . 53x : 23333 333333 2A 6A u 0+ = , → 23333

333333 2 2A 1A u u

6 8= − = .

…. и квазиоптимальное по быстродействию оптимальное управление

3 2 2 22 3 23 3 2 3 3 3

1 2 2 2 2 3 2 3 2x x 3x x x | x |u sign x x x x x x x x sign x3 2 2 2

= − + + + + + + + + ⋅ +

(4.78)

Моделирование показывает (см. рис. 4.12), что переходный процесс от известного управления (4.46) полностью совпадает с переходным процессом от управления (4.78).

4.3 МЕТОДИКА СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПО

ЭНЕРГОСБЕРЕЖЕНИЮ (РАСХОДУ "СИГНАЛА УПРАВЛЕНИЯ")

Пусть, например, для объекта (1.27) требуется найти управляющее воздействие, входящее для определенности в последнее уравнение:

1 1

2 2

n n

x a (X)x a (X)

x a (X) u

= = = +

&

&

KKKKK

&

(4.79)

Записываем функциональное уравнение (3.6) для объекта (4.79): 1 2 2 3 3 n n(X) x g (X) x g (X) x g (X) xψ = + ⋅ + ⋅ + + ⋅& & & & &K . (4.80)

Page 112: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

112

Здесь в соответствии со свойством 1.5 первый коэффициент матрицы G принят равным единице, т.е. 1g (X) 1= .

Подставляя уравнения объекта (4.79) в (4.80), получим: 1 2 2 3 3

n n n

(X) a (X) g (X) a (X) g (X) a (X)g (X) a (X) g (X) u

ψ = + ⋅ + ⋅ + ++ ⋅ + ⋅

& K. (4.81)

или (X) f (X) (X) uψ = + ϕ ⋅& ,

где 1 2 2 3 3 n nf (X) a (X) g (X) a (X) g (X) a (X) g (X) a (X)= + ⋅ + ⋅ + + ⋅K , n(X) g (X)ϕ = .

Требуется определить оптимальное управление по критерию расхода "сигнала управления". Тогда в соответствии со свойством 3 необходимо и достаточно выполнить условия:

n

1 2 2 3 3 n n

g (X) 0,a (X) g (X) a (X) g (X) a (X) g (X) a (X) 0.

> + ⋅ + ⋅ + + ⋅ = K

(4.82)

В этом случае оптимальное управление будет иметь всего два интервала, причем на последнем интервале управление равно нулю, то есть объект (4.79) на втором интервале должен быть устойчив при отсутствии управления.

Определяя из (4.82) коэффициенты 2g (X) , 3g (X) , ..., ng (X) , подставляя их в уравнение (4.80) и интегрируя его, получим искомую функцию переключения и оптимальное управление.

Пример 4.13. Выполнить синтез оптимального по расходу "сигнала управления" закона для системы примера 4.2:

1 2x x=& , 2 2x x u= − +& , (4.83) если | u(t) | 1≤ . Решение. Составляем основное функциональное уравнение для данной задачи:

1 1 2 2g x g xψ = ⋅ + ⋅& & & . (4.84) В соответствии со свойством 1.6 выбираем 1g 1= . В силу уравнений объекта

(4.83) уравнение (4.84) принимает вид: 2 2 2 2f (X) (X) u x g x g uψ = + ϕ ⋅ = − ⋅ +& . (4.85)

Здесь 2 2 2f (X) x g x= − ⋅ , 2(X) gϕ = . Применим свойство 3 к уравнению (4.85). В соответствии со свойством 3

должно выполняться условие 2 2 2x g x 0− ⋅ = , откуда получаем, что 2g 1= и уравнение (4.85) приобретает вид

1 2x x uψ = + =& & & . (4.86) Интегрируя (4.86), получим оптимальное управление

1 2u sign(x x )= − + . (4.87) Переходные процессы и фазовая плоскость для объекта (4.83) с управлением

(4.87) показаны на рис. 4.1, цифра 3.

Page 113: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

113

Из рис. 4.1 видно, что время регулирования при управлении (4.87) самое наибольшее (теоретически равно бесконечности), а первый интервал (оптимальный по быстродействию) самый наименьший по времени. На втором интервале 1 2x x 0ψ = + = , следовательно, 0ψ =& и управление u 0= . Объект (4.83) на втором интервале

1 2x x=& , 2 2x x= −& остается без управления и поскольку он устойчив, то с течением времени движется по многообразию 0ψ = к устойчивому состоянию в начале координат.

Отметим еще один относительно простой метод получения функционального уравнения оптимальной системы по расходу "сигнала управления" – метод подстановки. Подставим 2x из первого уравнения системы (4.83) во второе, перенесем все производные в левую часть уравнения и обозначим через ψ& :

1 2x x uψ = + =& & & . Получили функциональное уравнение, в котором f (X) 0= .

Пример 4.14. Для нелинейной системы следящего электропривода постоянного тока примера 4.3

1 2x x=& , 32 2x x u(t)= − +& (4.88)

найти функцию переключения закона управления по критерию обобщенной работы с минимальным "расходом сигнала" управления, обеспечивающего перевод объекта (4.88) из исходного произвольного начального состояния в конечное, являющееся началом координат фазового пространства отклонений. Решение. Запишем основное функциональное уравнение для объекта (4.88)

1 2 1 1 1 2 2(x ,x ) x g (x ,x ) xψ = + ⋅& & & (4.89) и подставим уравнения объекта

31 2 2 1 1 2 2 1 1 2(x ,x ) x g (x ,x ) x g (x ,x ) u(t)ψ = − ⋅ + ⋅& .

Из полученного уравнения определяем 3

1 2 2 1 1 2 2f (x ,x ) x g (x ,x ) x= − ⋅ , 1 2 1 1 2(x ,x ) g (x ,x )ϕ = . (4.90) Для минимального "расхода сигнала" управления (свойство 3) необходимо,

чтобы 1 2f (x ,x ) было равно нулю: 3

1 2 2 1 1 2 2f (x ,x ) x g (x ,x ) x 0= − ⋅ = . Из последнего уравнения определим

1 1 2 22

1g (x ,x )x

=

и подставим в уравнение (6.31)

1 2 1 222

1(x ,x ) x xx

ψ = + ⋅& & & .

Интегрированием 1 2(x ,x )ψ& находим функцию переключения

1 2 12

1(x ,x ) xx

ψ = − .

Page 114: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

114

Поскольку 1 2 22

1(x ,x ) 0x

ϕ = > , то управление будет равно:

1 2 12

1u(t) sign[ (x ,x )] sign xx

= − ψ = − −

. (4.91)

Однако, несмотря на простоту и изящность решения задачи, полученное управление (4.91) не оптимально. Дело в том, что критерий обобщенной работы с минимальным "расходом сигнала" управления (и это отмечалось выше) применим только тогда, когда процессы, протекающие в системе при отсутствии управления устойчивы. Найденное управление (4.91) действует таким образом, что изображающая точка системы обязательно попадает на многообразие

1 2 12

1(x ,x ) x 0x

ψ = − = и дальнейшее движение происходит вдоль этого

многообразия. Исследуем на устойчивость точку покоя объекта (4.88). Пусть функция Ляпунова будет равна 4 2

1 2V x x= − . При 21 2x x> функция V 0> .

Определим производную функции Ляпунова в силу уравнений движения объекта и с учетом 1 2(x ,x ) 0ψ = , т.е. на втором интервале движения системы при

эквивалентном управлении равном нулю: 2 41 2

dV 4x 2x 0dt

= + > в той же области

21 2x x> . Все условия теоремы Ляпунова - Четаева [43] выполнены, следовательно, точка покоя неустойчива. При движении системы вдоль

многообразия 1 2(x ,x ) 0ψ = и 1 21

1x xx

= =& . Интегрируя это уравнение, получим:

21 10x (t) 2t x= + , (4.92)

где 10x - начальное значение координаты 1x . Из уравнения (4.92) следует, что координата 1x при 1 2(x ,x ) 0ψ = неограниченно возрастает, что свидетельствует о неустойчивости процесса с управлением (4.91).

Таким образом, на данном примере убеждаемся в том, что метод по критерию обобщенной работы имеет главный недостаток: его применение для поиска оптимального управления в нелинейных системах может быть неэффективно, если на каком-либо интервале эквивалентное управление оказывается равным нулю. Отсюда следует и способ устранения этого недостатка: необходимо так организовать управление, чтобы эквивалентное управление не было равно нулю вплоть до точки покоя в начале координат. Можно предложить, например, следующий способ. Вначале определяют оптимальное быстродействующее управление объектом. Если это управление оказывается сложно реализовать, то можно попытаться его упростить отбрасыванием нежелательных слагаемых в формуле управления. Часто такой способ дает приемлемые результаты, однако в этом случае необходимо проверять полученное решение с точки зрения устойчивости процессов во всем фазовом пространстве или требуемой его части.

Page 115: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

115

Тем не менее, в данном примере попытаемся определить оптимальное управление, соответсвующее минимальному "расходу сигнала" управления. Если подставить соотношения (4.90) в необходимые условия устойчивости: | f |≤ ϕ ,

0ϕ > , то можно получить: 22 1 1 2 2 1 1 2| x | | (1 g (x ,x ) x | g (x ,x )⋅ − ⋅ ≤ , 1 1 2g (x ,x ) 0> ,

откуда: 21 1 2 2

2 2

| x |g (x ,x )1 | x | x

≥+ ⋅

, причем, чем ближе 1 1 2g (x ,x ) к 221 x , тем меньше

"расход сигнала" управления, однако при 21 1 2 2 2

2 2 2

1 | x |g (x ,x )x 1 | x | x

= >+ ⋅

, как было

отмечено ранее, система становится неустойчивой. Таким образом, 2 2

1 1 22 3 22 2 2 2

| x | | x |g (x ,x )1 | x | x | x | x

≤ ≤+ ⋅ ±δ + ⋅

при 0δ → , 0δ ≠ . Если 21 1 2 2

2 2

| x |g (x ,x )1 | x | x

=+ ⋅

, то система оптимальна по

быстродействию (см. пример 4.3). Если 2 2

1 1 2 3 2 3 32 2 2 2

| x | xg (x ,x )| x | x [ sign(x )] x

= =±δ + ⋅ ±δ ⋅ +

,

то система оптимальна по "расходу сигнала" управления. Подставляя 1 1 2g (x ,x ) из последнего равенства в (4.89) и интегрируя с учетом 1 2(x ,x ) 0ψ = при 1x 0= и

2x 0= , получим функцию переключения и оптимальное управление

( )

2 22 2 2

1 22 2

x x1 1 2 | x |u sign x ln arctg6 3 3sign(x ) x

δ − δ + −δ = − + + − δ δ δ ⋅ δ ⋅ +

21 1 1ln( ) arctg sign(x )6 3 3

− δ + ⋅ δ δ .

Пример 4.15. Синтезировать оптимальный по энергосбережению ("расходу

сигнала" управления) привод с двигателем постоянного тока, уравнения которого имеют вид (2.7):

p д

д яд

м

дд д п

я я я я я

п пп y y max

п п

d (t) K (t) ,dt

d (t) R i (t) ,dt C T

di (t) C 1 1(t) i (t) e (t) ,dt R T T R T

de 1 Ke (t) u (t) , u (t) U ,dt T T

ϕ = ⋅ω

ω = ⋅ Φ ⋅ Φ = − ω − + ⋅ ⋅ = − + ⋅ ≤

(4.93)

Page 116: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

116

Решение. Будем считать уравнения (4.93) уравнениями возмущенного движения в соответствии с концепцией Ляпунова о возмущенном – невозмущенном движении.

Выразим дω из первого уравнения системы (4.93), дi – из второго, пe – из третьего и подставим их в четвертое уравнение системы (4.93). После группировки всех производных слева от знака равенства, обозначая их за производную от функции переключения регулятора положения ϕψ , можно получить

д дп я я м пу

п п р п п

di dde R T CФ T CФ K udt T dt T dt K T Tϕ

ω⋅ ⋅ψ = + ⋅ + ⋅ + ⋅ϕ = ⋅

⋅& . (4.94)

По функциональному уравнению (4.94) определяем, что для регулятора положения вала привода

д дп я я м

п п р п

di dde R T CФ T CФdt T dt T dt K Tϕ

ω⋅ ⋅ψ = + ⋅ + ⋅ + ⋅ϕ

⋅& ,

f 0= , п

п

KT

ϕ = .

Интегрируя последнее уравнение и вводя задание по выходной координате (угловому положению вала исполнительного механизма), получим закон управления для регулятора положения вала привода

р я я р пзад р м д д п

K R T K Tu sign K T i e

CФ CФϕ⋅ ⋅ ⋅

= ϕ − ϕ − ⋅ ⋅ω − ⋅ − ⋅

. (4.95)

4.4 МЕТОДИКА СИНТЕЗА ОПТИМАЛЬНОГО ПО ТОЧНОСТИ

УПРАВЛЕНИЯ

Поскольку все оптимальные управления, (в том числе оптимальные по быстродействию), определяемые из функционального уравнения (3.6), оптимальны по точности, а оптимальные по быстродействию управления более предпочтительны, то для определения оптимального по точности управления можно использовать условие оптимального быстродействия с учетом простоты реализации.

Пример 4.16. Выполнить синтез оптимального по критерию обобщенной работы (по критерию точности) закона управления для системы примера 4.2

1 2x x=& , 2 2x x u= − +& , (4.96) На управление u(t) наложено ограничение

| u(t) | 1≤ . Решение. Функциональное уравнение для оптимального по быстродействию

управления было получено в примере 4.2: 1 2 2 2 1x | x | x | x | xψ = + ⋅ + ⋅& & & & . (4.97)

Page 117: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

117

Опмечалось, что непосредственно проинтегрировать уравнение (4.97) не представляется возможным, т.к. трудно найти интеграл от слагаемого

2 1 2 2| x | x | x | x⋅ = ⋅& . Рассмотрим функциональное уравнение без учета этого слагаемого:

1 2 2x | x | xψ = + ⋅& & & (4.98) или, подставляя уравнения объекта:

1 2 2 2 2 2 2x | x | x x | x | x | x | uψ = + ⋅ = − ⋅ + ⋅& & & , Здесь 2 2 2f x | x | x= − ⋅ 2| x |ϕ =

Запишем условие устойчивости (управляемости) | f |≤ ϕ : 2 2 2 2| x | x | x | | x |− ⋅ ≤ ,

Решая которое, можно получить: 2| x | 0≥ . Это условие всегда выполняется для любых начальных значений 10 20(x ,x ) , т.е. во всем фазовом пространстве. Проинтегрировав (4.98), запишем оптимальное управление

2 21

| x | xu sign x2

⋅ = − + . (4.99)

На первом интервале управление (4.99) (рис. 4.1, цифра 2) переводит объект до многообразия

2 21

| x | xx 02

⋅ψ = + = (4.100)

оптимально по быстродействию. Дальнейшее движение на втором интервале вдоль многообразия 0ψ = будет происходить под действием эквивалентного управления в скользящем режиме (см. пример 3.2 рис 3.1).

Как известно, самую простую реализацию оптимального управления можно получить, используя линейные обратные связи. Поставим задачу: найти релейный закон управления в системе регулирования при произвольном начальном значении 1x , с учетом ограничения | u | 1≤ , с линейными обратными связями и возможно большим быстродействием.

Запишем функциональное уравнение в следующем виде: 1 2 2 2 2 2 2x g x x g x g uψ = + ⋅ = − ⋅ + ⋅& & &

Условия устойчивости (управляемости) | f |≤ ϕ : 2 2 2| x | |1 g | g⋅ − ≤ , 2g const 0= > . (4.101)

Таким образом, задача сводится к поиску такого постоянного положительного значения 2g , чтобы неравенство (4.101) было как можно ближе к равенству во всем фазовом пространстве объекта.

Из математического описания объекта (4.96) следует, что координата 2x при максимальном управляющем сигнале | u | 1= в установившемся режиме никогда не превышает значения, равного единице, 2| x | 1≤ . При этом из (4.101) следует, что

2g 0.5≤ . Выбирая знак равенства, получим 1 2 2x 0.5 x 0.5 x 0.5 uψ = + ⋅ = ⋅ + ⋅& & & (4.102)

и оптимальное управление

Page 118: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

118

1 2u sign(x 0.5 x )= − + ⋅ . (4.103) В отличие от управления (4.87) по критерию "расхода сигнала управления"

(пример 4.13), найденное оптимальное управление (4.103) на втором интервале не будет равно нулю. В данном случае на втором интервале возникает скользящий режим с эквивалентным управлением, который можно определить из уравнения (4.102) при 1 2x 0.5 x 0ψ = + ⋅ = . При этом 20 0.5 x 0.5 uψ = = ⋅ + ⋅& и эквивалентное управление второго интервала

2 2u x= − . (4.104) На рис. 4.16 приведены результаты моделирования, иллюстрирующие

сравнительную характеристику управления (4.103) (кривые 4) с ранее найденными управлениями: оптимальным по быстродействию (кривые 1) и оптимальным по критерию обобщенной работы (кривые 3).

Пример 4.17 Для нелинейной системы следящего электропривода постоянного тока примера 4.3

1 2x x=& , 32 2x x u(t)= − +& (4.105)

найти функцию переключения закона управления по критерию обобщенной работы (критерию точности).

Решение. Функциональное уравнение объекта (4.105): 2 2x | x | uψ = + ⋅& .

Подставляя уравнения объекта, получим: 3

1 2 2 2 2x | x | x | x | xψ = + ⋅ + ⋅& & & . (4.106)

Рис. 4.16 – Результаты моделирования переходных процессов объекта (4.96) для начальных значений 10x 5= , 20x 0= с управлениями: 1 - (4.12); 3 -

(4.87); 4 - (4.103).

Page 119: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

119

Если возможность скользящего режима на втором интервале (и, следовательно, увеличение времени регулирования) не исключается по условиям задачи, то оптимальное по быстродействию управление (см. пример 4.3) можно упростить. Для этого пренебрежем третьим слагаемым в уравнении (4.106). Интегрируя (4.106), получим:

2 21

| x | xu sign x2

⋅ = − +

. (4.107)

Исследуем полученное предполагаемое управление (4.107) с точки зрения устойчивости переходных процессов в системе.

Составим функциональное уравнение с учетом управления (4.107). Для этого найдем производную от функции переключения управления (4.107)

1 2 2x | x | xψ = + ⋅& & & и подставим уравнения объекта (4.105). В результате получим

32 2 2 2f (X) (X) u x | x | x | x | uψ = + ϕ ⋅ = − ⋅ + ⋅& .

Запишем условие | f (X) | (X)≤ ϕ для системы с предполагаемым управлением:

32 2 2 2| x | x | x | | x |− ⋅ ≤

или упрощая, получим 32|1 | x || 1− ≤ . (4.108)

Из уравнений объекта (4.106) следует, что 2| x | 1≤ , т.е. условие (4.108) выполняется, по крайней мере всегда выполняется для позиционных и следящих систем, и, следовательно, управление (4.107) является оптимальным управлением по критерию обобщенной работы. Заметим, что управление (4.107) полностью совпадает с управлением (4.99) предыдущего примера. Это означает, что все сказанное в предыдущем примере по поводу второго интервала управления справедливо и для данного примера. Результаты моделирования переходных процессов объекта (4.105) с оптимальным управлением (4.107) приведены на рис. 4.2.

Более того, и здесь также как и в предыдущем примере можно поставить задачу определения релейного закона управления с линейными обратными связями. Для решения такой задачи достаточно составить функциональное уравнение для первого интервала

1 2 2x g xψ = + ⋅& & & , (4.109) подставить уравнения объекта

32 2 2 2x g x g uψ = − ⋅ + ⋅& ,

записать условие устойчивости 3

2 2 2 2| x g x | g− ⋅ ≤ , 2g 0> . Выбирая в последнем условии знак равенства и учитывая, что 2g const= , а

2| x | 1≤ , получим: 2g 1 2= . Интегрируя функциональное уравнение (4.109) при 2g 1 2= , получим оптимальное управление

Page 120: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

120

21

xu sign x2

= − +

(4.110)

с линейными обратными связями. На рис. 4.2 (кривые, обозначенные цифрой 3) показаны результаты

моделирования системы (4.105) с управлением (4.110). Из рис. 4.2 видно, что линейные обратные связи в законе управления существенно затягивают переходный процесс. Пример 4.18 Провести синтез функций переключения и оптимальных по критерию обобщенной работы систем управления нелинейными объектами пятого порядка [36], описываемыми следующими выражениями:

241 xk)t(x =& , 34

2 xT1)t(x =& , ( )23343

33 xkxxk

T1)t(x −−=& ,

( )4522

4 xxkT1)t(x −=& , ( )3 3

5 1 у 1 2 3 1 1 2 41

1x (t) k u k A x k A x xT

= − − −& ,

у mu (t) U≤ , (4.111) где 1kkk 321 === ; 4k 0.5 рад /(В с)= ⋅ ; c3.0T1 = ; c6.0T2 = ; c01.0T3 = ;

c1T4 = ; 4 11A 2 10 В− −= ⋅ ; 4 1

2A 1 10 В− −= ⋅ ; mU 220 В= . Математической моделью (4.111) описывается ряд объектов, в частности

мощные позиционные электроприводы постоянного тока, состоящие из управляемого преобразователя мощности и электродвигателя постоянного тока с внутренними нелинейными обратными связями в виде "отсечек" по скорости ( 3

2121 xA)x(f = ) и току якорной цепи ( 33232 xA)x(f = ), введенными для

ограничения этих координат. Такие электроприводы находят широкое применение в различных отраслях промышленности.

В уравнениях (4.111): )t(x1 - координата перемещения (угол поворота вала) рабочего механизма; )t(x 2 - частота вращения вала электродвигателя; )t(x3 - ток якорной цепи электродвигателя; )t(x 4 и )t(x5 - координаты управляемого преобразователя напряжения, в роли которого может быть электромашинный усилитель (ЭМУ); генератор постоянного тока с однофазным полупроводниковым инвертором или магнитным усилителем в качестве возбудителя; управляемый тиристорный выпрямитель (УВ) с фазовым управлением, имеющим среднее статистическое запаздывание 2T и естественный или искусственно включенный на входе системы импульсно-фазового управления фильтр с постоянной времени 1T .

Справедливость представления собственно управляемого выпрямителя в виде апериодического звена первого порядка базируется на следующих соображениях. Вследствие неполной управляемости УВ с фазовым управлением, его представляют звеном чистого запаздывания с передаточной функцией

pT22

2ek)p(W −= (4.112)

Page 121: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

121

Разложив передаточную функцию )p(W2 в степенной ряд Маклорена

!npT

!2pT

!1pT1

kek)p(W nn

222

22

2pT

22 2

++++

==

L

(4.113)

и учитывая с достаточной степенью точности два первых члена разложения, можно получить

1pTk)p(W

2

22 +

= . (4.114)

Решение. Выполним вначале операцию нормирования для управляющего сигнала у

m

uu

U= . (4.115)

При анализе уравнений объекта (4.111) можно заметить, что первые четыре из них линейны. Преобразуем их к одному следующим методом. Найдем координату 2x из первого уравнения, координату 3x из второго и подставим их в третье уравнение

−−= 1

4

32443

33 x

kk

xTxkT1)t(x &&& . (4.116)

Найдем теперь координату 4x из полученного уравнения и подставим в четвертое. Обозначив сумму с производными от координат объекта новой переменной, например, y& , запишем

52xky =& , (4.117) где

4233

32

3

41

4xTx

kT

xkTx

k1y &&&&& +++= . (4.118)

Рассмотрим систему уравнений, состоящую из обобщенного уравнения (4.117) и пятого уравнения объекта с учетом (4.115):

( )

−−−=

=

.xxAkxAkuUkT1)t(x

,xk)t(y

43211

3321m1

15

52

&

&

(4.119)

Для оптимального по быстродействию процесса на последнем интервале функция переключения должна содержать только одну (старшую) координату объекта

55 x=ψ , тогда оптимальное управление последнего интервала

у5 m 5u U sign(x )= − ⋅ . (4.120) Составим функциональное уравнение предпоследнего интервала, используя

условие быстродействия: u|x|x 554 ⋅+=ψ& . (4.121)

Подставим в (4.121) обобщенные уравнения объекта (4.119):

Page 122: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

122

++⋅+⋅+=ψ 4

1

332

3215

m55

m1

1

24 x

k1xAxA|x|

U1x|x|

UkTy

k1

&&& . (4.122)

Введем обозначение

++⋅= 4

1

332

3215

m6 x

k1xAxA|x|

U1x& (4.123)

и интегрированием (4.122) с учетом (4.118) найдем функцию переключения предпоследнего интервала

Cx2

x|x|UkTx

kTx

kkT

xkk

Txkk1

655

m1

14

2

23

32

32

32

41

424 ++

⋅⋅++++=ψ , (4.124)

где C постоянная интегрирования уравнения (4.123). Продолжая аналогичные выкладки до первого интервала, можно получить

функцию переключения первого интервала и оптимальное быстродействующее управление с точностью до четырех постоянных интегрирования. Так как в данном случае по условию задачи не требуется быстродействующего управления, то с целью упрощения закона управления, ограничимся функцией переключения четвертого интервала (4.123). Тогда закон управления

3 5 54 2 1у 1 2 3 4 6

2 4 2 3 2 3 2 1 m

T | x | x1 T T Tu 220 sign x x x x x Ck k k k k k k k U 2

⋅= − ⋅ + + + + ⋅ + +

(4.125)

будет оптимален по критерию обобщенной работы. Результаты моделирования системы (4.111), (4.125), (4.123) изображены на

рис. 4.17 (кривые, обозначенные цифрой 1). Из рис. 4.17 можно заметить, что при управлении объектом по закону (4.125)

переходный процесс (кривые, обозначенные цифрой 1) состоит всего лишь из двух интервалов управлений. На первом интервале движение системы под действием управления (4.125) происходит по естественной траектории (оптимально по быстродействию) до многообразия 04 =ψ , а на втором интервале система движется вдоль многообразия 04 =ψ за счет эквивалентного управления (4.120) в скользящем режиме к началу координат.

Скользящий режим второго интервала, в свою очередь, также проходит в два этапа: на первом этапе система под действием управления (4.120) движется к многообразию 0x5 = и координата 5x уменьшается до нуля (практически также быстро, как и увеличивалась на первом интервале), а на втором этапе система движется вдоль многообразия 0x5 = к началу координат при нулевом эквивалентном управлении. Оставив вопросы устойчивости этого движения в стороне (отметим только результат исследований: система с таким управлением устойчива), обратим внимание на характер изменения самой старшей координаты системы 5x (рис. 4.17, кривая, обозначенная цифрой 1). Ее изменения подобны изменениям старшей координаты в системах второго порядка.

Page 123: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

123

Рис. 4.17. Графики переходных процессов объекта (4.111)

с законом управления: 1- (4.125) при 37.0C = или (6.55); 2 - (6.60)

Именно такой вывод можно получить, если вспомнить, что управление (4.125) было найдено из системы двух обобщенных дифференциальных уравнений (4.119), то есть как оптимальное быстродействующее управление для системы (4.119) именно второго порядка, в которой старшей координатой является именно координата 5x .

Этот вывод может быть распространен на любые системы, описание которых можно представить в виде двух обобщенных дифференциальных уравнений. Для систем высокого порядка аналогично может быть найдено и трех интервальное (а в пределе n интервальное) управление для трех обобщенных (в пределе n) дифференциальных уравнений.

Из рис. 4.17 (кривые с цифрой 1) следует, что в данном конкретном случае обобщенная система (4.119) ведет себя практически как система из двух последовательно включенных интеграторов, что свидетельствует о незначительном влиянии на переходный процесс суммы слагаемых

43211

3321 xxAkxAk ++ второго уравнения системы (4.119). Следовательно,

координатой 6x в управлении (4.125) можно пренебречь:

Page 124: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

124

3 5 54 2 1у 1 2 3 4

2 4 2 3 2 3 2 1 m

T | x | x1 T T Tu 220 sign x x x xk k k k k k k k U 2

⋅= − ⋅ + + + + ⋅

(4.126)

Действительно, моделирование объекта (4.111) с управлением (4.126) показывает практически полное совпадение графиков (рис. 4.17, кривые с цифрой 1).

Продолжим исследование возможности упрощения закона управления (4.126). Для простоты реализации управляющего устройства желательно, чтобы обратные связи были линейны. Запишем функциональное уравнение для первого интервала обобщенного объекта (4.111)

5xgy &&& ⋅+=ψ (4.127) и подставим уравнения (4.111)

( )43211

3321m1

152 xxAkxAkuUk

Tgxk −−−+=ψ& . (4.128)

Пользуясь функциональным уравнением (4.128), запишем условие оптимальности по критерию обобщенной работы:

( ) m11

43211

3321

152 Uk

TgxxAkxAk

Tgxk ≤++− . (4.129)

Учитывая, что m143211

3321 UkxxAkxAk <<++ , из (4.129) следует

m1

512

Uk|x|Tk

g ≥ . (4.130)

Как видно из рис. 4.17, для 5x10 = , координата 100|x| 5 < . Если 35x10 = , то 220|x| 5 < . Таким образом, если начальные значения координат не превышают

значений, при которых 220|x| 5 ≤ , то из (4.130) следует, что 1Tg ≥ . Выбирая 1Tg = и интегрируя функциональное уравнение (4.127) с учетом (4.118), получим

закон оптимального управления:

++++⋅−= 51423

3

32

3

41

4xTxTx

kT

xkTx

k1sign220u (4.131)

с линейными обратными связями. Исследуем устойчивость системы с управлением (4.131). Для этого

необходимо найти эквивалентное управление второго интервала. На втором интервале функция переключения 0=ψ и 0=ψ& . Тогда из уравнения (4.128) при

1Tg = следует

( )43211

3321

m1m1

522 xxAkxAk

Uk1

Ukxk

u +++−= . (4.132)

Подставляя управление (4.132) в пятое уравнение объекта (4.111) или во второе уравнение (4.119), можно получить соотношение

51

25 x

Tk)t(x −=& , (4.133)

Page 125: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

125

из которого следует, что координата 5x на втором интервале уменьшается по экспоненте до нуля.

Из структурной схемы объекта для второго интервала (рис. 4.18), составленной по первым четырем уравнениям (4.111) и уравнению (4.133) видно, что координата 5x играет роль эквивалентного управления для разомкнутой устойчивой линейной системы четвертого порядка.

Рис. 4.18. Структурная схема объекта (4.111) на втором интервале управления (4.131)

На рис. 4.17 (кривые, обозначенные цифрой 2) показаны графики

переходных процессов объекта (4.111) с законом управления (4.131). Из сравнения графиков следует, что закон управления (4.131) практически не увеличивает время переходного процесса и гарантирует апериодические переходные процессы в достаточно широкой области начальных отклонений координат объекта.

4.5 МЕТОДИКА СИНТЕЗА ОПТИМАЛЬНОГО ПО ТОЧНОСТИ

УПРАВЛЕНИЯ С УЧЕТОМ ОГРАНИЧЕНИЙ

В простейшем случае, когда требуется осуществлять управление одной

переменной состояния, САУ снабжается одним регулятором, а при необходимости управления или ограничения также и промежуточных переменных, систему управления разбивают на ряд контуров с контурными регуляторами, число которых равно количеству управляемых переменных силовой части ЭП. Например, в электроприводах постоянного тока может быть до 4-5 контуров для регулирования напряжения преобразователя, тока якорной цепи и его производной, скорости вращения якоря двигателя, углового или линейного положения рабочего механизма. В таких системах главной управляемой переменной является та, которая определяет основную цель управления. Остальные переменные считаются вспомогательными, т.к. подчинены главной переменной. Кроме того вспомогательные переменные также находятся во взаимном подчинении. Построенные по такому принципу системы получили название систем подчиненного управления [37, 38].

2x

pTk

1

2 2k 1x

_ _ _ pT1

2 3k pT

1

3

p1

p

k 4

1−

3k

3x 4x 5x

Page 126: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

126

Система подчиненного управления при этом структурно разбивается на ряд контуров, каждый из которых содержит свой объект регулирования. При синтезе регулятора внешнего контура внутренний по отношению к нему замкнутый контур является частью объекта регулирования как динамическое звено с соответствующей эквивалентной передаточной функцией. В свою очередь, рассматриваемый контур может быть внутренним по отношению к последующим.

Рассмотрим методику синтеза оптимальных по точности быстродействующих систем управления при соблюдении соответствующих ограничений на координаты объекта.

На первом этапе проводят алгоритмический синтез функций переключения регуляторов координат (тока, скорости и т.д.), подлежащих ограничению.

Если реализация найденных управлений оказываются по тем или иным причинам слишком сложной, то на втором этапе проводят поиск более простых решений для квазиоптимальных управлений либо путем упрощений полученных оптимальных управлений, либо за счет обоснованного упрощения математического описания объекта управления, либо путем сокращения количества эквивалентных управлений (количества интервалов) в оптимальном управлении.

На третьем этапе можно определить оптимальные управления (регуляторы) по критерию минимума расхода сигнала управления (обобщенной работы) с учетом требуемой простоты реализации регуляторов. Во-первых, такие регуляторы содержат, как правило (по крайней мере, для электроприводов постоянного тока с питанием от статических полупроводниковых преобразователей), только линейные обратные связи. Во-вторых, они могут служить ориентиром при поиске квазиоптимальных по быстродействию управлений, поскольку критерии расхода сигнала управления или обобщенной работы по существу дают первое и достаточно простое приближение управления к квазиоптимальному по быстродействию управлению. В-третьих, решения, найденные по критериям минимума расхода сигнала управления или обобщенной работы можно использовать для двухкритериального управления, которое позволяет получать переходные процессы оптимальные как по быстродействию для режимов больших отклонений, так и по критерию точности для режимов малых отклонений объектов от заданного состояния.

На заключительном этапе, пользуясь принципом подчиненного управления многоконтурных систем объединить найденные оптимальные управления по каждой ограничиваемой координате в одно искомое управление, удовлетворяющее предъявляемым требованиям. Пример 4.19. Выполнить синтез оптимального по быстродействию закона управления для системы (4.4) примета 4.1:

1 2x x=& , 2x u=& . На управление u(t) и координату 2x наложены ограничения

Page 127: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

127

| u(t) | 1≤ , 2 2зад| x | x≤ , где 2задx - постоянное заданное значение ограничения координаты 2x . Решение. В отличие от примера 4.1 будем искать решение, начиная со второго, последнего интервала. На втором интервале в эквивалентном управлении остается всего одна координата 2x :

2 2u sign(x )= − . (4.134) Управление (4.134) является оптимальным быстродействующим

управлением по координате 2x . Введем в формулу (4.134) управляющее воздействие по ограничиваемой координате 2x аналогично примеру 4.15. После вынесения знака минус за знак sign, получим формулу закона оптимального управления для регулятора координаты 2x :

x2 2 2u u sign(x x )∗= = − , (4.135) где 2 2зад| x | x∗ ≤ .

Закон управления для регулятора положения (координаты 1x ) был получен в примере 4.1 и записан формулой (4.9). После введения в формулу (4.9) управляющего воздействия по регулируемой координате 1x и максимального значения управления, равного 2задx , выполняя преобразования, аналогичные преобразованиям по координате 2x , получим формулу закона оптимального управления для регулятора координаты 2x :

2 2x1 2 2зад 1зад 1

| x | xu x x sign x x2

∗ ⋅ = = ⋅ − − . (4.136)

Объединяя законы управления для регуляторов координат 1x и 2x в соответствии с принципом подчиненного управления, получим оптимальное быстродействующее управление с учетом ограничения координаты 2x на заданном уровне 2задx :

2 22зад 1зад 1 2

| x | xu sign x sign x x x2

⋅ = ⋅ − − − . (4.137)

Структурная схема объекта (4.4) с оптимальной системой управления, построенной по закону (4.137) приведена на рис. 4.19.

Система подчиненного управления содержит два контура регулирования, состоит из двух реле, блока выделения модуля координаты 2x и блока умножения с коэффициентом 1 2 и обеспечивает оптимальные по критерию быстродействия переходные процессы объекта. На рис. 4.20 приведены результаты моделирования быстродействующей системы управления объектом (4.4).

На графике зависимости сигнала управления u(t) от времени не показаны скользящие режимы, возникающие при ограничении координаты 2x на заданном уровне и после окончания переходного процесса. Вместо скользящих режимов показано усредненное значение сигнала управления равное нулю.

Page 128: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

128

Рис.4.19 – Структурная схема системы подчиненного управления (4.137) объектом (4.4)

Рис. 4.20. Результаты моделирования переходных процессов объекта (4.4) с подчиненным управлением (4.137) при

1задx 0= , 2задx 1.5= , 1x (0) 5= , 2x (0) 0=

Пример 4.20. Выполнить синтез оптимального по быстродействию закона управления нелинейным объектом (4.20) примера 4.3:

1 2x x=& , 32 2x x u(t)= − +& ,

2x

×

p1 p1

21

1задx )t(u 1x

Объект управления

_ _

mod

Регулятор

∗2x

Page 129: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

129

если на управление u(t) и координату 2x наложены ограничения | u(t) | 1≤ , 2 2зад| x | x≤ .

Решение. Поскольку для первого интервала известно точное решение для функции переключения оптимального по быстродействию управления (формула (4.23)), а на втором интервале оптимальное управление определяется формулой (4.134), то можно сразу записать закон подчиненного управления аналогично закону (4.137)предыдущего примера:

2зад 1зад 1 2 2u sign x sign[x x f (x )] x= ⋅ − − − . (4.138) где

( )

22 2 2 2

2 222

1 x x1 1 2x sign(x ) 1 1 1f (x ) ln arctg arctg sign(x )6 3 3 3 31 x

− + − = + + ⋅ +

.

Если для первого интервала воспользоваться квазиоптимальным управлением (4.107) примера 4.17, то закон подчиненного управления существенно упростится и примет вид:

2 22зад 1зад 1 2

| x | xu sign x sign x x x2

⋅ = ⋅ − − − . (4.139)

Отметим, что закон управления (4.139) совпадает с законом (4.137) предыдущего примера.

Если же для первого интервала воспользоваться управлением (4.110) примера 4.17, то закон подчиненного управления станет еще проще:

22зад 1зад 1 2

xu sign x sign x x x2

= ⋅ − − − . (4.140)

На рис. 4.21 приведены результаты моделирования системы (4.4) с управлениями (4.138), (4.139) и (4.140).

На рис. 4.21 на графиках u(t) , обозначенных цифрами 1 и 2, не показан скользящий режим со средним значением управления равным нулю, возникающий по окончании переходного процесса.

В качестве вывода можно отметить, что из трех управлений наиболее приемлемый результат дает оптимальное управление (4.139) с точки зрения быстродействия, точности и простоты реализации регулятора.

Пример 4.21. Синтезировать оптимальное по быстродействию управление объектом (4.45) примера 4.6:

1 2x x=& , 2 3x x=& , 3x u=& , если на управление u(t) и координаты 2x и 3x наложены ограничения:

| u(t) | 1≤ , 2 2зад| x | x≤ , 3 3зад| x | x≤ . где 3задx - постоянное заданное значение ограничения координаты 3x . Решение. Воспользуемся законами оптимального быстродействующего управления для регуляторов координат объекта примера 4.6.

Для регулятора положения (координата 1x ):

Page 130: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

130

x1 2 2зад 1зад 1 2 3u x x sign[x x f (x ,x )]∗= = ⋅ − − , (4.141) где

33 2 23 3 3 3 3 3

2 3 2 3 2 2 2x x | x | x | x | xf (x ,x ) x x x sign x sign x3 2 2 2

= + + + + +

.

Рис. 4.21 – Результаты моделирования переходных процессов

системы (4.20) с оптимальными управлениями при 1задx 5= и 2задx 0.8= :1 – (4.138), 2 – (4.139), 3 – (4.140).

Для регулятора скорости (координата 2x ):

3 3x2 3 3зад 2 2

| x | xu x x sign x x2

∗ ∗ ⋅ = = ⋅ − −

. (4.142)

Для регулятора ускорения (координата 3x ): ( )x3 3 3u u sign x x∗= = − . (4.143)

На основе формул (4.141) – (4.143) записываем закон быстродействующего оптимального управления для объекта (4.45) с учетом ограничения координат:

Page 131: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

131

3 33зад 2зад 1зад 1 2 3 2 3

| x | xu sign x sign x sign[x x f (x ,x )] x x2

⋅ = ⋅ ⋅ − − − − − . (4.144)

На рис. 4.22 приведены результаты моделирования системы подчиненного управления (4.144) объектом (4.45) по критерию быстродействия.

Рис. 4.22 – Результаты моделирования системы подчиненного управления (4.144)

объектом (4.45) по критерию быстродействия при 1задx 5= , 2задx 1.5= и 3задx 1=

На графике u(t) рис. 4.22 не показан скользящий режим, возникающий при

ограничениях координат объекта.

Пример 4.21. Синтезировать оптимальное по точности управление объектом (4.45) примера 4.6:

1 2x x=& , 2 3x x=& , 3x u=& , Решение. Воспользуемся первым способом синтеза и запишем функциональное уравнение для первого интервала для объекта (4.45) аналогично примеру 4.13:

1 2 2 3 3x g x g xψ = + ⋅ + ⋅& & & & (4.145) или, подставляя уравнения объекта:

2 2 3 3x g x g uψ = + ⋅ + ⋅& Условие устойчивости движения на первом интервале к 0ψ = :

2 2 3 3| x g x | g+ ⋅ ≤ , при 3g const 0= > или 2 2 3

3

| x g x | 1g

+ ⋅≤ (4.146)

Функция переключения второго интервала:

Page 132: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

132

2 2 32

3

x g xg

+ ⋅ψ = .

Функциональное уравнение для второго интервала: 2 2 3 3 2

23 3

x g x x g ug g

+ ⋅ + ⋅ψ = =

& &&

Условие устойчивости движения на втором интервале к 2 0ψ = :

3 2| x | g≤ , при 2g const 0= > или 3

2

| x | 1g

≤ (4.147)

Функция переключения третьего интервала: 33

2

xg

ψ = . Интегрируя (4.145),

получим управление координатой 1x : u sign( )= − ψ ; 1 2 2 3 3x g x g xψ = + ⋅ + ⋅ (4.148)

На основании формул (4.146) – (4.148), вводя задание по выходной координате 1x , записываем закон оптимального по точности управления для объекта (4.45) с учетом ограничений (4.147) и (4.146):

1зад 1 2 3u sign(sign(sign(x x ) ) )= − − ψ − ψ − ψ (4.149) Структурная схема объкта (4.45) с оптимальным по точности управлением

(4.149) приведена на рис. 4.23.

Рис. 4.23 – Структурная схема объекта (4.45) с оптимальным по точности управлением (4.149)

Page 133: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

133

На рис. 4.24 приведены результаты моделирования системы подчиненного управления (4.148) объектом (4.45) при ограничениях (4.147) и (4.146).

Рис. 4.24 – Результаты моделирования объекта (4.45) с управлением: 1 – по быстродействию (4.46): 2 – по точности (4.149) при g2 = 1.8, g3 = 0.9

Пример 4.22. Синтезировать оптимальное по точности управление объектом: 1 2x x=& , 2 1 3x k sin(x )= ⋅& , 3 4x x=& , 4 2x k u= ⋅& (4.150)

при k1 = 18.8; k2 = 9.4. Решение. Функциональное уравнение для первого интервала:

1 2 3 4 2 1 3 4 2x a x b x c x x a k sin(x ) b x c k uψ = + ⋅ + ⋅ + ⋅ = + ⋅ ⋅ + ⋅ + ⋅ ⋅& & & & & . Функция переключения первого интервала:

1 2 3 4x a x b x c xψ = + ⋅ + ⋅ + ⋅ (4.151) при постоянных значениях a, b, c.

Условие устойчивости движения на первом интервале к 0ψ = : 2 1 3 4 2| x a k sin(x ) b x | c k+ ⋅ ⋅ + ⋅ ≤ ⋅ ; c 0>

или 2 1 3 4

2

| x a k sin(x ) b x | 1c k

+ ⋅ ⋅ + ⋅≤

⋅. (4.152)

Найдем условие устойчивости движения вдоль поверхности переключения 0ψ = (условие устойчивости в малом). Подставляя в уравнение 0ψ =

линеаризованные уравнения объекта (4.150), заменяя d / dt на p и сокращая на x1, получим характеристическое уравнение для системы третьего порядка (т.к. произошло сжатие фазового пространства на одну координату):

2 3

1 1

b c1 a p p p 0k k

+ ⋅ + ⋅ + ⋅ = .

Page 134: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

134

Пользуясь, например, критерием устойчивости Гурвица, получим условие устойчивого движения вдоль поверхности переключения 0ψ = : a 0> ; b 0> ; c 0> и

a b c⋅ > ; (4.153) Функция переключения второго интервала:

2 1 3 42

2

x a k sin(x ) b xc k

+ ⋅ ⋅ + ⋅ψ =

Функциональное уравнение второго интервала: 2 1 3 3 4 1 3 1 4 3 2

22 2

x a k x cos(x ) b x k sin(x ) a k x cos(x ) b k uc k c k

+ ⋅ ⋅ ⋅ + ⋅ ⋅ + ⋅ ⋅ ⋅ + ⋅ ⋅ψ = =

⋅ ⋅& & &

&

Условие устойчивости движения на втором интервале к 2 0ψ = : 1 3 1 4 3 2| k sin(x ) a k x cos(x ) | b k⋅ + ⋅ ⋅ ⋅ ≤ ⋅ , при b 0>

или 1 3 1 4 3

2

| k sin(x ) a k x cos(x ) | 1b k

⋅ + ⋅ ⋅ ⋅≤

⋅ (4.154)

Для устойчивого движения вдоль поверхностей переключения меньше, чем третий порядок достаточно положительности коэффициентов соответствующих характеристических уравнений.

Функция переключения третьего интервала: 1 3 1 4 3

32

k sin(x ) a k x cos(x )b k

⋅ + ⋅ ⋅ ⋅ψ =

Функциональное уравнение третьего интервала: 1 3 3 1 4 3 1 4 3 3

32

21 4 3 1 2 3 1 4 3

2

k x cos(x ) a k x cos(x ) a k x x sin(x )c k

k x cos(x ) a k k u cos(x ) a k x sin(x )c k

⋅ ⋅ + ⋅ ⋅ ⋅ − ⋅ ⋅ ⋅ ⋅ψ = =

⋅ ⋅ + ⋅ ⋅ ⋅ ⋅ − ⋅ ⋅ ⋅=

& & &&

Условие устойчивости движения на третьем интервале к 3 0ψ = : 2

1 4 3 1 4 3 1 2 3| k x cos(x ) a k x sin(x ) | a k k | cos(x ) |⋅ ⋅ − ⋅ ⋅ ⋅ ≤ ⋅ ⋅ ⋅ , при b 0>

или 2

4 4 3

2

| x a x tg(x ) | 1a k

− ⋅ ⋅≤

⋅ (4.155)

Функция переключения четвертого интервала: 2

4 4 34

2

x a x tg(x )a k

− ⋅ ⋅ψ =

Из уравнения поверхности переключения третьего интервала 3 0ψ = следует: 3 4tg(x ) a x= − ⋅ . Подставляя последнее соотношение в функцию переключения

четвертого интервала, получим: 2 2

4 44

2

x (1 a x )a k

⋅ + ⋅ψ =

⋅.

Page 135: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

135

На основании свойства 6.1 функция переключения последнего четвертого интервала будет иметь только одну координату: 4 4xψ = .

На основании формул (4.151) – (4.155), вводя задание по выходной координате 1x , записываем закон оптимального по точности подчиненного управления для объекта (4.150):

1зад 1 2 3 4u sign(sign(sign(sign(x x ) ) ) )= − − ψ − ψ − ψ − ψ . (4.156) На рис. 4.25 приведены результаты моделирования системы подчиненного

управления (4.156) объектом (4.150) при ограничениях (4.152) – (4.155). Из рис. 4.25 следует, что 3ψ и 4ψ не достигают ограничений, поэтому

управление (4.156) можно несколько упростить: 1зад 1 2u sign(sign(x x ) )= − − ψ − ψ . (4.157)

Результаты моделирования системы подчиненного управления (4.157) объектом (4.150) при ограничении (4.152) показаны на рис. 4.25.

Рис. 4.25 – Результаты моделирования объекта (4.150) с подчиненным управлением (4.156) или (4.157) при a = 0.94, b = 6.4, c = 1.1

Page 136: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

136

Пример 4.23. Синтезировать оптимальное по точности управление объектом примера 4.22 при ограничении координаты 2 2огрx x 1≤ = . Регулятор координаты

1x определяется формулой (4.157). Решение. Функциональное уравнение для регулятора координаты 2x :

22 2 3 4 1 3 4 2x g x h x k sin(x ) g x h k uψ = + ⋅ + ⋅ = ⋅ + ⋅ + ⋅ ⋅& & & & . Поскольку оптимальное управление без учета ограничения на координату 2x

известно и оно устойчиво, то условия устойчивости для функционалоного уравнения 222ψ& и функциональных уравнений следующих интервалов будут выполняться и их проверять не надо.

Функция переключения для регулятора координаты 2x : 22 2 3 4x g x h xψ = + ⋅ + ⋅ (4.158)

при постоянных значениях g, h. На основании формул (4.157), (4.158) записываем закон оптимального по

точности подчиненного управления для объекта (4.150) при ограничении координаты 2x :

221зад 1 2

2огрu sign(sign(x x ) ) )

= − − ψ − ψ − . (4.159)

На рис. 4.26 приведены результаты моделирования системы подчиненного управления (4.159) объектом (4.150) при ограничении на координату 2x .

Рис. 4.26 – Результаты моделирования объекта (4.150) с подчиненным управлением (4.158) при a = 0.94, b = 6.4, c = 1.1, g = 5, h = 0.4.

Page 137: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

137

БИБЛИОГРАФИЧЕСКИЙ СПИCОК

1. Аверин С.И., Садовой А.В., Сухинин Б.В. Системы управления следящими

приводами антенных установок. - М.: Высшая школа, 1989. - 256 с. 2. Садовой А.В., Сухинин Б.В., Сохина Ю.В. Системы оптимального

управления прецизионными электроприводами. - Киев: ИСИМО, 1996. - 298 с. 3. Крутько П.Д. Управление исполнительными системами роботов. - М.:

Наука, 1991. - 334 с. 4. Солодовников В.В., Матвеев П.С. Расчет оптимальных систем

автоматического управления при наличии помех. - М.: Машиностроение, 1973. - 240 с.

5. Копылов И.П. Математическое моделирование электрических машин. - М.: Высшая школа, 1994. - 318 с.

6. Мельников Г.И. Динамика нелинейных механических и электромеханических систем. - Л: Машиностроение, 1975. - 200 с.

7. Рудаков В.В., Столяров И.М., Дартау В.А. Асинхронные электроприводы с векторным управлением. - Л: Энергоатомиздат, 1987. - 134 с.

8. Башарин А.В., Новиков В.А., Соколовский Г.Г. Управление электроприводами. - Л.: Энергия, 1982. - 392 с.

9. Современная прикладная теория управления. Под ред. А.А. Колесникова. - Москва - Таганрог: Изд-во ТРТУ, 2000. - Ч.1 - 400 с., Ч.2 - 560 с., Ч.3 - 656 с.

10. Ловчаков В.И., Сухинин Б.В., Сурков В.В. Нелинейные системы управления электроприводами и их аналитическое конструирование. - Тула, ТулГУ, 1999. - 180 с.

11. Валеев К.Г., Финин Г.С. Построение функций Ляпунова. - Киев: Наукова думка, 1981. - 412 с.

12. Колесников А.А. Синергетическая теория управления. - М.: Энергоатомиздат, 1994.- 344 с.

13. Портер В.А. Обзор теории полиномиальных систем. //ТИИЭР. -1976. - Т. 64. - с.23-30.

14. Фалдин Н.В. Синтез оптимальных по быстродействию замкнутых систем управления.- Тул. политехн. ин-т. Тула, 1990. - 100 с.

15. Бор-Раменский А.Е., Воронецкий Б.Б., Святославский В.А. Быстродействующий электропривод. - М.: Энергия, 1969. - 168 с.

16. Куропаткин П.В. Оптимальные и самонастраивающиеся системы. - Л.: Госэнергоиздат. - 1975. - 303 с.

17. Беллман Р. Динамическое программирование. - М.: Изд-во иностр. лит., 1960. - 232 с.

18. Сухинин Б.В., Ловчаков В.И., Сурков В.В. Синтез и анализ оптимальных релейных регуляторов методами А.А. Красовского и динамического программирования // Управление электротехническими объектами. - Тула: ТулГУ, 1997. - С. 79-88.

Page 138: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

138

19. Мееров М.В. Синтез структур систем автоматического регулирования высокой точности. - М.: Наука, 1967. - 424 с.

20. Емельянов С.В. Бинарные системы автоматического управления. - М.: МНИИПУ,1984. - 320 с.

21. Емельянов С.В. Теория систем с переменной структурой. - М.: Наука, 1970. - 336 с.

22. Цыпкин Я.З. Релейные автоматические системы. - М.: Наука, 1974. - 576 с.

23. Цыпкин Я.З. Теория релейных систем автоматического регулирования. - М.: Гостехиздат, 1955. - 456 с.

24. Воронов А.А. Основы теории автоматического управления. - М.: Энергия, 1980. - 312 с.

25. Уткин В.И. Скользящие режимы в задачах оптимизации и управления. - М.: Наука, 1981. - 367 с.

26. Габасов Р., Кирилова Ф.М. Особые оптимальные управления. - М.: Наука, 1973.

27. Гурман В.И. Вырожденные задачи оптимального управления. - М.: Наука, 1977.

28. Барбашин Е.А. Введение в теорию устойчивости. - М.: Наука, 1967. - 223 с.

29. Олейников А.В. Оптимальное управление технологическими процессами в нефтяной и газовой промышленности.- Л.: Недра, 1982. - 216 с.

30. Ремшин Б.И., Ямпольский Д.С. Проектирование и наладка систем подчиненного регулирования электроприводом. - М.: Энергия, 1975. - 184 с.

31. Красовский А.А. Аналитическое конструирование контуров управления летательными аппаратами. - М.: Машиностроение, 1969. - 240 с.

32. Габасов Р., Кирилова Ф.М. и др. Условия оптимальности высокого порядка (обзор).// Автоматика и телемеханика, I, 5; II, 6; III, 7, 1971.

33. Нейдорф Р.А. Эффективная аппроксимация кусочных функций в задачах квазиоптимального управления. // Сб. тр. МНК ММТТ–2000. Т. 2. СПб: СПГТИ, 2000.

34. Сейдж Э.П., Уайт Ч.С. Оптимальное управление системами. - М.: Радио и связь, 1982. - 392 с.

35. Колесников А.А. Основы теории синергетического управления - М.: Фирма "Испо-Сервис", 2000. - 264 с.

36. Клюев А.С., Колесников А.А. Оптимизация автоматических систем управления по быстродействию. - М.: Энергоиздат, 1982. - 240 с.

37. Ремшин Б.И., Ямпольский Д.С. Проектирование и наладка систем подчиненного регулирования электроприводом. - М.: Энергия, 1975. - 184 с.

38. Фишбейн В.Г. Расчет систем подчиненного регулирования вентильного электропривода постоянного тока. - М.: Энергия, 1971. - 136 с.

39. Павлов А.А. Синтез релейных систем, оптимальных по быстродействию. - М.: Наука, 1966. - 390 с.

Page 139: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

139

40. Иванов В.А., Фалдин Н.В. Теория оптимальных систем автоматического управления. - М.: Наука, 1981. - 336 с.

41. Колесников А.А., Горелов В.Н., Штейников Г.А. Синтез оптимальных нелинейных систем управления на ЭЦВМ. - Таганрог: ТРТИ, 1975. - 177 с.

42. Фельбаум А.А.. Основы теории оптимальных автоматических систем. -М.: Наука, 1966. - 624 с.

43. Гноенский А.С., Каменский Г.А., Эльсгольц Л.Э. Математические основы теории управляемых систем. – М.: Наука, 1969. - 512 с.

Page 140: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

140

СОДЕРЖАНИЕ Стр.

П Р Е Д И С Л О В И Е.................................................................................................... 5 В В Е Д Е Н И Е ............................................................................................................... 9 1 МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ СИЛОВОГО ЭЛЕКТРОПРИВОДА. ПОСТАНОВКА ЗАДАЧ УПРАВЛЕНИЯ .................................................................... 12 1.1 Структурная схема силового электропривода ...................................................... 12 1.2 Математическая модель объекта управления....................................................... 15 1.2.1 Модели динамики двигателей постоянного тока (ДПТ).................................. 16 1.2.2. Описание электронного преобразователя-усилителя...................................... 21 1.2.3 Нелинейности реальных объектов ..................................................................... 21 1.2.4 Ограничения фазовых координат объекта......................................................... 23 1.3 Основные составляющие задачи оптимального управления ............................. 24 1.4 Математические трудности решения задачи АКОР современными методами 28 2. ОСНОВЫ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ ПО ТОЧНОСТИ (БЫСТРОДЕЙСТВИЮ) СИСТЕМ УПРАВЛЕНИЯ .................................................. 34 2.1 Концепция возмущенного - невозмущенного движения .................................... 34 2.2 Система относительных единиц и уравнения возмущенного движения .......... 37 2.3 Принцип построения систем управления с низкой чувствительностью к параметрическим и внешним возмущениям .............................................................. 40 3 АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ ОПТИМАЛЬНЫХ ПО ТОЧНОСТИ (БЫСТРОДЕЙСТВИЮ) РЕГУЛЯТОРОВ................................................................... 45 3.1 Задача синтеза оптимального по точности регулятора ....................................... 45 3.2 Теоретические основы синтеза оптимальных по точности систем управления......................................................................................................................................... 45 3.2.1 Основное функциональное уравнение для функций переключения оптимальных регуляторов ............................................................................................ 46 3.2.2 Особые управления в нелинейных системах, оптимальных по точности. .... 48 3.2.3 Принцип декомпозиции в решении задач оптимальной точности методом динамического программирования Беллмана ............................................................ 51 3.2.4 Критерий оптимальности систем с релейным управлением........................... 53 3.2.5 Свойства основного функционального уравнения и функций переключения оптимальных регуляторов ............................................................................................ 56 3.2.6. Количество интервалов управлений в релейных системах ............................ 63 3.2.7 Устойчивость систем с релейным оптимальным управлением....................... 72 3.2.8 Учет ограничений на фазовые координаты....................................................... 75 3.2.9 Способы синтеза функций переключения оптимальных регуляторов........... 77 4 СИНТЕЗ ОПТИМАЛЬНЫХ ПО ТОЧНОСТИ РЕГУЛЯТОРОВ ........................... 80 4.1 Методика синтеза оптимального по быстродействию управления интегрированием скорости проникновения ............................................................... 80 4.2 Методика синтеза оптимального по быстродействию управления решением уравнения в частных производных ........................................................................... 106 4.3 Методика синтеза оптимального управления по энергосбережению (расходу "сигнала управления") ................................................................................................ 111

Page 141: БВ Сухинин В Сурков СА Цырук ЕИ Феофиловeeo.tula.ru/Pubs/up_Suk2014.pdfАвторы монографии Современная прикладная

141

4.4 Методика синтеза оптимального по точности управления .............................. 116 4.5 Методика синтеза оптимального по точности управления с учетом ограничений ................................................................................................................. 125 БИБЛИОГРАФИЧЕСКИЙ СПИCОК ........................................................................ 137