Pontryagin’s Minimum Principle
Quote
The structure of a transition maneuver is obtained by Pontryagin’s minimum principle and then a numerical algorithm is proposed to solve the boundary value problem induced by the minimum principle to compute maneuvers for arbitrary initial and final states.
M. Fässler, “Quadrotor control for accurate agile flight,” University of Zurich, 2018. doi: 10.5167/UZH-152425.
참고한 Thesis 외에도 여러 최적제어 논문들에서 언급되는 Pontryagin’s minimum principle 에 대해 알아보도록 하자.
What is Pontryagin’s minimum principle(PMP)?
Pontryagin’s Minimum Principle(PMP)은 제어 이론에서 Hamiltonian을 최소화하는 방식으로 사용되어, 종종 Pontryagin’s Maximum Principle로도 불리지만 일반적으로는 PMP로 더 잘 알려져 있다. PMP는 무한 차원을 갖는 Optimal Control Problem(OCP) 을 직접 해결하는 것보다, Hamiltonian을 최소화하거나 최대화하는 방식이 더 간단하다는 점에서 도입된다.
PMP는 최적 제어 문제에서 최적 해의 필요 조건을 제공하지만, 최적 해의 충분 조건은 아니다. 이는 PMP가 최적 해를 직접적으로 제공하는 것은 아니지만, 최적이 될 수 없는 경우를 배제할 수 있는 도구로 작용한다. 즉, Hamiltonian을 최소화하지 못하는 제어 입력은 최적이 아니며, 이를 통해 최적 제어 입력의 범위를 좁힐 수 있다.
반면, Hamilton-Jacobi-Bellman(HJB) 방정식은 전체 상태 공간에서 최적의 cost-to-go와 optimal policy를 제공하여, 필요충분 조건을 만족하는 최적 해를 구할 수 있다. 하지만 HJB는 상태 공간 전체에서 방정식을 해결해야 하므로 계산이 매우 복잡하고 비용이 많이 든다. 이에 비해, PMP는 특정 궤적에서만 필요 조건을 만족하면 되기 때문에 계산적으로 더 간편하고 효율적일 수 있다.
Note
- 간단히 수식적으로 표현하면 를 만족하는 제어 입력을 구하는 대신 를 만족하는 제어 입력을 찾는 것.
Notation
Lemma *Let be a continuously differentiable function of and let be a convex set. Furthermore, assume exists and is continuously differentiable. Then for all and , *
Proof. We prove this for when . Let . Then,
이와 같이 에 관해서도 편미분을 보일 수 있다.
위 Lemma 이 어떤 의미인지 아래 예제를 살펴보자.
Example
Let . Then,
이 예제를 우선 에 관해 미분해보자.
그리고 Lemma 을 적용해보면 위와 같게 나오는 것을 알 수 있다.
그리고 에 관해 미분하는 경우도 만족함을 알 수 있다.
마찬가지로 Lemma 10.1 을 적용한 경우에도 아래와 같이 만족한다.
The Principle
이제 PMP 를 수식적으로 알아보자.
Dynamics
time 와 state , control 라고 하자. 이 때, 는 control constraint set 이다.
Cost
종단 시점 에서의 cost function 와 에서의 cost function 를 통해 위와 같이 일반적으로 표현할 수 있다.
Objective
따라서 이러한 system dynamics 를 고려하였을 때 OCP 를 아래와 같이 정의할 수 있다.
여기서 는 모두 에 대해 연속적이고 미분가능하다.
이러한 OCP 는 HJB 를 통해 를 얻을 수도 있지만 일반적으로는 이러한 방식을 사용하기 어렵다.
Theorem
For a given initial condition , let be an optimal control trajectory with associated state trajectory for the system . Then there exists a trajectory such that:
여기서의 은 Hamiltonian 이다.
Proof.
HJB & Hamiltonian 연결
- 위의 HJB 방정식에 Hamiltonian 을 도입하여 계산가능한 문제로 변환시킬 것임.
- 이를 통해 HJB 최소화 문제를 Hamiltonian 최소화 문제로 변환하여 최적 제어입력 를 유도할 것임.
증명에 앞서 목적함수 와 최적 policy 모두 연속하고 미분가능하다. 또한, Lemma 10.1 을 위해 는 convex 하다.
연속이고 미분가능한 에 대해 HJB 는 최적해의 필요조건이다.
수식 (1) 을 와 에 대해 각각 미분하고, Lemma 를 적용해보자.
우리는 다음과 같은 조건을 만족하는 optimal trajectory 를 얻고자 한다.
Conditions
이를 만족하도록 수식 (2-3) 을 다시 적어보자.
Derivation of Equation (5)
- 다변수 함수의 미분은 모든 변수를 고려하므로 chain rule 을 적용한다.
- 따라서 수식 (5)의 유도에서 두 번째 텀과 세 번째 텀을 합쳐서 로 표현한 것이다.
로 표현하면 수식 (4) 는 아래와 같이 정리된다.
그리고 trajectory(=co-state) 로 두면 수식 (5) 는 아래와 같이 정리된다.
Boundary condition 으로 주어진 수식 (1) 은 cost-to-go 가 종단 시점 에서 최종 시점의 cost 인 와 동일하게 만들어주는 것이다.
이를 에 대해 편미분을 취하면 가 되고 이는 아래와 같이 정리된다.
수식 (1) 을 정리해서 다음과 같이 Bellman 의 최적성 원리 에서 Hamiltonian 을 이용한 수식으로 표현할 수 있다.
따라서 다음과 같은 optimal trajectory 을 얻음을 알 수 있다.
그리고 optimal control input 는 아래와 같다.
Examples
Minimum Time Control
아래와 같은 선형 시스템의 상태방정식을 고려해보자.
이 때의 목적함수를 표현해보자.
이 때의 를 통해 최적 제어 조건을 알아보고 를 구하자.
따라서 최적 제어입력 는 아래와 같이 결정된다.
추가적인 예제는 KOCW 최적제어 이론의 10강 PDF 에서 더 확인해볼 수 있다.
References
.
- Lecture 10: Pontryagins Minimum Principle
- KOCW 최적제어이론
- Ch 15.2.3 of Planning Algorithms by Steven M. LaValle (p.g 875~879)
- ECE276B: Planning & Learning in Robotics