Wie hängt die optimale Steuerung mit der Variationsrechnung zusammen?

Die Variationsrechnung optimiert frei über Kurven, während die optimale Steuerung über die Eingaben in ein dynamisches System optimiert, oft mit Einschränkungen der Steuerungen. Das Maximumprinzip verallgemeinert die klassischen Euler-Lagrange-Bedingungen auf diese eingeschränkte, systemgesteuerte Umgebung.

Was ist der Unterschied zwischen dem Maximumprinzip und der dynamischen Programmierung?

Das Maximumprinzip liefert notwendige Bedingungen entlang einer einzelnen optimalen Trajektorie unter Verwendung einer adjungierten Variablen, während die dynamische Programmierung die optimalen Kosten aus jedem Zustand durch die Hamilton-Jacobi-Bellman-Gleichung charakterisiert und ein Rückkopplungsgesetz liefert. Die beiden Sichtweisen sind komplementär und miteinander verbunden.

Optimale Steuerung

Die optimale Steuerung bestimmt die Steuerungseingaben, die ein dynamisches System so lenken, dass ein Leistungskriterium über die Zeit optimiert wird.

Thema finden mit PaperMindDemnächstFind papers & topics

Tools & resources

Folien herunterladen

Learn & explore

VideoDemnächst

Definition

Ein optimales Steuerungsproblem sucht eine Steuerungsfunktion, die ein Kostenfunktional unter Differentialgleichungen, die den Zustand regeln, minimiert; seine Lösung wird durch notwendige Bedingungen aus dem Maximumprinzip oder durch die Wertfunktion der dynamischen Programmierung charakterisiert.

Scope

Dieses Thema behandelt die Formulierung von Steuerungsproblemen mit Zustandsdynamik und Kostenfunktionalen, Pontrjagins Maximumprinzip und die adjungierten Gleichungen, dynamische Programmierung und die Hamilton-Jacobi-Bellman-Gleichung, den linear-quadratischen Regler sowie die Beziehung zur klassischen Variationsrechnung.

Core questions

Welches Steuerungsgesetz minimiert gegebene Kosten über die Trajektorie des Systems?
Welche notwendigen Bedingungen muss eine optimale Steuerung erfüllen?
Wie charakterisiert die dynamische Programmierung die optimale Wertfunktion?
Wie erweitert die optimale Steuerung die Variationsrechnung auf eingeschränkte Eingaben?

Key theories

Pontrjagins Maximumprinzip: Eine optimale Steuerung maximiert zu jedem Zeitpunkt einen Hamilton-Operator, wobei sich eine adjungierte Kostenvariable rückwärts in der Zeit entwickelt, was notwendige Bedingungen liefert, selbst wenn die Steuerungen eingeschränkt sind.
Dynamische Programmierung und die HJB-Gleichung: Bellmans Optimalitätsprinzip führt zur Hamilton-Jacobi-Bellman-partiellen Differentialgleichung für die Wertfunktion, deren Lösung die optimale Rückkopplungssteuerung ergibt.
Linear-quadratischer Regler: Für lineare Dynamik und quadratische Kosten ist die optimale Steuerung eine lineare Zustandsrückführung, die durch die Lösung einer Riccati-Gleichung bestimmt wird, ein Eckpfeiler der Regelungstechnik.

Clinical relevance

Die optimale Steuerung regelt die Führung von Flugzeugen und Raumfahrzeugen, die Prozess- und Robotiksteuerung, die Wirtschafts- und Ressourcenplanung über die Zeit sowie Modelle zur Behandlungsplanung und bietet die prinzipielle Methode, um optimal auf ein dynamisches System einzuwirken.

History

Die optimale Steuerung entstand in den 1950er Jahren aus der Variationsrechnung unter dem Druck luft- und raumfahrttechnischer Probleme. Pontrjagin und seine Mitarbeiter etablierten das Maximumprinzip um 1956-1962, Bellman entwickelte parallel die dynamische Programmierung, und Kalmans linear-quadratische und Filtertheorie machte das Thema zu einem zentralen Bestandteil der modernen Ingenieurwissenschaften.

Key figures

Lev Pontryagin
Richard Bellman
Rudolf Kalman
Constantin Caratheodory

Seminal works

pontryagin1962
bertsekas2017
liberzon2012

Frequently asked questions

Wie hängt die optimale Steuerung mit der Variationsrechnung zusammen?: Die Variationsrechnung optimiert frei über Kurven, während die optimale Steuerung über die Eingaben in ein dynamisches System optimiert, oft mit Einschränkungen der Steuerungen. Das Maximumprinzip verallgemeinert die klassischen Euler-Lagrange-Bedingungen auf diese eingeschränkte, systemgesteuerte Umgebung.
Was ist der Unterschied zwischen dem Maximumprinzip und der dynamischen Programmierung?: Das Maximumprinzip liefert notwendige Bedingungen entlang einer einzelnen optimalen Trajektorie unter Verwendung einer adjungierten Variablen, während die dynamische Programmierung die optimalen Kosten aus jedem Zustand durch die Hamilton-Jacobi-Bellman-Gleichung charakterisiert und ein Rückkopplungsgesetz liefert. Die beiden Sichtweisen sind komplementär und miteinander verbunden.