[ <응용논문> ]

Transactions of the Korean Society of Automotive Engineers - Vol. 33, No. 7, pp.551-558

ISSN: 1225-6382 (Print) 2234-0149 (Online)

Print publication date 01 Jul 2025

Received 06 Dec 2024 Revised 18 Feb 2025 Accepted 10 Mar 2025

DOI: https://doi.org/10.7467/KSAE.2025.33.7.551

미지 단일 입력 단일 출력 시스템을 위한 순환 최소 자승 기반 이득 자동 조정 PID 제어기 개발

이정우¹⁾ ; 라한별²⁾ ; 오광석^*^{, 2)}^{, 3)}

1)경북대학교 자동차공학부
2)한경국립대학교 ICT로봇기계공학부
3)한경국립대학교 기계융합기술연구소

Development of a PID Controller for Unknown Single-Input Single-Output System with RLS-Based Gain Auto-Tuning

Jeongwoo Lee¹⁾ ; Hanbyeol La²⁾ ; Kwangseok Oh^*^{, 2)}^{, 3)}

1)School of Automotive Engineering, Kyungpook National University, Gyeongbuk 37224, Korea
2)School of ICT, Robotics and Mechanial Engineering, Hankyong National University, Gyeonggi 17579, Korea
3)Institute of Machine Convergence Technology, Hankyong National University, Gyeonggi 17579, Korea

Correspondence to: ^* oks@hknu.ac.kr

Copyright Ⓒ 2025 KSAE / 236-07
This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium provided the original work is properly cited.

Abstract

This study describes a PID controller for an unknown single-input single-output system with gain auto-tuning based on recursive least squares. The PID controller has been widely used as an industrial controller because of its mathematical simplicity and reasonable performance on unknown systems with proper gains. If the gains are not determined properly or control conditions are changed unexpectedly, the performance of the PID controller can result in degradation. To address this issue, this study proposes a PID gain auto-tuning method based on the Lyapunov direct approach and recursive least squares(RLS) with forgetting factor. The equivalent error dynamics has been designed with the derivative term, and the coefficient in the equation has been estimated by using RLS. An adaptation rule for proportional and integral gains has been derived based on the estimated coefficient and the Lyapunov approach. The performance evaluation of the proposed algorithm was conducted by using Matlab/Simulink and an actual DC motor platform.

Keywords:

Single-input single-output, PID controller, Recursive least squares, Gain auto-tuning, Lyapunov direct method

키워드:

단일 입력 단일 출력, 비례 적분 미분 제어기, 재귀 최소 자승, 이득 자동 조정, 리야푸노프 직접법

1. 서 론

비례-적분-미분(PID) 제어 방법은 다양한 산업 분야에 적용되고 있는 실용적 제어 방법으로 시스템의 정확한 수학적 모델과 특징 그리고 이론적 해석 없이 합리적 제어 성능을 확보할 수 있다는 장점이 있다. 다양한 조건에서 제어 성능 확보를 위해 비례-적분-미분 이득의 적절한 결정이 필요하며 시스템 내외부 환경 변화에 따른 갱신이 필요하다. 그러므로 시스템 내외부 환경이 변화할 때 합리적 제어 성능 유지를 위한 PID 자동 이득 조정 방법이 연구되고 있다.

시간에 따라 변화하는 환경 부하에 대처하기 위하여 퍼지 논리를 기반으로 한 적응형 PID 제어가 제안되었다. 전마로 등¹⁾은 가변 환경 부하에서 선박의 위치 유지를 위하여, 송정훈²⁾은 차량 운전 상태 기반 조향 편의성 향상을 위하여 퍼지 논리 기반의 적응형 PID 제어 방법론을 제안하였다. 제어기는 모든 시간에서의 상태 정보를 고려하기 때문에 더 나은 성능을 보였으나, 퍼지 로직을 사용하기 때문에 퍼지 규칙과 변수를 수동으로 정의하는 것에 한계가 있다. 이러한 한계를 극복할 수 있는 방법론으로 기계 학습 접근법이 적용된 PID 제어기가 제안되었다. 장승붕 등³⁾은 모델 입력에 따라 변경이 필요한 PID 이득값의 오토 튜닝을 위하여 딥러닝 접근법이 적용된 PID 제어기를 제안하였다. Carlucho 등⁴⁾은 복잡한 역학 관계를 갖는 MIMO(Multiple-input Multiple-output) 시스템에 그리고 Dogru 등⁵⁾은 탱크 시스템의 펌프 제어에 강화 학습 접근법을 적용하였다. 딥러닝 기법의 경우 사전 데이터를 수집하여 학습하므로 시스템이 변경될 경우 제어 성능이 떨어지는 한계점을 확인할 수 있었다. 심층 강화 학습 접근법은 사전 지식 없이 주어진 환경과 상호 작용하며 효율적인 이득 조정으로 개선된 성능을 보여주었다. 하지만 학습 과정 중 불안정한 환경에서 적절한 보상 함수를 설계하지 못할 시 비합리적인 전략을 선택하거나 편향된 행동을 학습하는 한계를 확인할 수 있었다. Lakhani 등⁶⁾은 전통적 PID 이득 조정은 시뮬레이션이나 실험적 시행착오에 의존하기 때문에 Deterministic Policy Gradient 알고리즘을 기반으로 PID 이득을 자동 조정하는 방법을 제안하였다. Shuprajhaa 등⁷⁾은 PID 제어 방법의 한계점을 극복하기 위해 Modified Proximal Policy Optimization 기반 강화 학습 에이전트를 활용해 PID 이득을 실시간으로 조정하는 방법을 제안하였다. Kono와 Masuda⁸⁾는 수동 PID 이득 변경으로 인해 요구되는 많은 시간과 노동을 극복하기 위해 비용 함수의 기울기 추정을 이용하는 Iterative data-driven PID 이득값 결정 방법을 제안하였다. Yahagi와 Kajiwara⁹⁾는 비선형 시스템에서 고정 이득값으로는 충분한 제어 성능을 달성하기 어려운 한계를 극복하기 위해 룩업테이블 기반 PID 이득값 자동 조정 방법론을 제안하였다. 본 연구에서는 대상 시스템의 수학적 모델에 의존하지 않되 시스템 오차의 변화 경향을 고려할 수 있는 등가 오차 동역학 모델을 설계하였다. 등가 오차 동역학 모델을 구성하는 계수를 순환 최소 자승법을 이용해 실시간으로 추정함으로써 시스템의 동적 특성을 담고 있는 등가 계수를 도출하고, 이를 이용해 Lyapunov 직접법 기반 이득을 도출하였다. 본 연구의 주요 내용은 다음과 같이 요약될 수 있다.

1) 미분 제어 입력을 고려하는 등가 오차 동역학 모델 설계 및 순환 최소 자승 기반 실시간 계수 추정
2) 항등 조건을 이용하는 Lyapunov 직접법 기반 PI 이득 자동 조정 및 실 플랫폼을 이용한 성능평가

논문의 나머지 부분은 다음과 같이 구성되었다. 2장에서는 이득 자동 조정 PID 제어기 설계 이론을 설명하고, 3장에서는 실 플랫폼을 이용한 성능평가 결과를 분석한다. 마지막 4장에서는 연구 내용 요약과 함께 결론 및 향후 계획에 대해 기술한다.

2. 이득 자동 조정 PID 제어기

Fig. 1은 본 연구에서 제안하는 이득 자동 조정 PID 제어기의 전반적 블록선도를 보여준다.

Fig. 1

Overall block diagram of the proposed PID controller

RLS-based estimation 블록에서는 제어 오차와 설정된 미분 이득을 이용해 오차 동역학 모델의 등가 계수를 추정하고, Gain auto-tuning 블록에서는 추정된 계수, 제어 오차, 파라미터를 이용해 비례-적분 이득을 실시간으로 계산한다. 계산된 비례-적분 이득과 설정된 미분 이득 그리고 제어 오차를 이용해 다음 스텝에 적용될 최종 PID 제어 입력을 Control input calculation 블록에서 출력한다. 본 연구에서 고려하는 제어 입력의 형태는 다음과 같은 기본 PID 제어 입력이며, 미분 이득은 시스템의 노이즈 등을 고려한 설계 파라미터로 정의하고 나머지 비례-적분 이득이 실시간 갱신되도록 알고리즘이 설계되었다.

u = k p e + k i ∫ 0 t e d t + k d e ˙

(1)

실시간 신호 정보 기반 미분 이득 자동 결정 알고리즘 개발을 향후 연구 내용으로 계획하고 있으며, 다음 절부터 제어 오차의 안정적 수렴을 위한 비례-적분 이득의 실시간 조정 알고리즘에 대해 기술한다.

2.1 등가 오차 시스템 모델링 및 계수 추정

본 연구에서는 미지 시스템에 적용이 가능한 이득 자동 조정 알고리즘 개발을 위해 등가 오차 시스템을 모델링하였고, 시스템 계수는 망각인자를 이용하는 순환 최소 자승법을 이용해 실시간 추정되었다. 다음 식은 설계된 등가 오차 시스템 모델이다.

e ˙ = a e + u - k d e ˙ w h e r e e : c o n t r o l e r r o r a : s y s t e m c o e f f i c i e n t

(2)

오차 시스템 모델의 a는 등가 시스템 계수로 실시간 추정을 통해 제어 입력 도출에 사용된다. 실시간 추정을 위해 망각인자를 이용하는 RLS 기법이 이용되었으며, 이는 Vahidi 등¹⁰⁾의 연구를 참고하였다. 계수 추정을 위한 출력 식과 추정값, 이득, 공분산 계산에 대한 대표적 실시간 갱신 과정은 다음과 같다.

y = ϕ θ w h e r e y = e ˙ - u + k d e ˙ : o u t p u t ϕ = e : r e g r e s s o r θ = a : e s t i m a t e

(3)

θ^m = θ^m - 1 + L m y m - ϕ m θ^m - 1

(4)

L = P m - 1 ϕ m / λ + ϕ T P m - 1 ϕ m

(5)

P = 1 - L m ϕ m T P m - 1 / λ

(6)

추정된 시스템 계수는 제어 오차와 함께 이득 자동 조정 알고리즘에 사용되며 다음 절에서 설명한다.

2.2 이득 자동 조정 알고리즘

PID 제어기의 비례 이득과 적분 이득 자동 조정 규칙을 도출하기 위해 Lyapunov 직접법을 이용하였으며, 다음은 적분 기반 정의된 제어 곡선을 보여준다.

s = e - w ∫ 0 t e d t w h e r e w : p o s i t i v e w e i g h t i n g f a c t o r

(7)

본 연구에서는 제어 오차와 가중치가 반영된 제어 오차의 적분항과의 차이를 슬라이딩 평면으로 정의하였고, 이를 이용해 정의된 목적함수는 다음과 같다.

J = 12 s 2

(8)

Lyapunov 직접법을 기반으로 정의된 목적함수를 시간에 대해 미분하고, 가중치를 상수값으로 가정함과 동시에 설계된 오차 동역학 모델 식 (1)을 이용해 다시 정리하면 다음과 같은 식을 도출할 수 있다.

J ˙ = s ˙ s ˙ = e - w ∫ 0 t e d t a^e + u - k d e ˙ - w e

(9)

제어 입력 u를 기본 PID 제어 입력으로 정의하고, 설계된 목적함수가 항상 Asymptotic stability 조건에 부합되도록 다음 식과 같은 조건을 적용하였다.

J ˙ = - α J = - α 2 e - w ∫ 0 t e d t 2

(10)

식 (7)과 식 (8)을 이용해 제어 오차와 오차의 적분항으로 정리하면 다음 항등식을 도출할 수 있다.

a^+ k p - w + α 2 e = α w 2 - k i ∫ 0 t e d t

(11)

식 (9)의 항등식이 성립한다는 것은 곧 목적함수 수렴 조건이 만족한다는 수학적 의미이고, 이는 제어 오차를 0으로 점진적 수렴시킬 수 있다는 의미가 된다. 그러므로 본 연구에서는 식 (9)의 항등식이 항상 성립하도록 아래 두 가지 조건을 적용하였고, 이를 바탕으로 비례-적분 이득 갱신 규칙이 도출되었다.

C 1) a^+ k p - w + α 2 = ∫ 0 t e d t

(12)

C 2) α w 2 - k i = e

(13)

적용된 항등식 조건 C1과 C2를 기반으로 다음 식들과 같이 PID 제어 입력의 비례-적분 이득 자동 조정 규칙을 도출하였다.

k p = - a^+ w - α 2 + ∫ 0 t e d t

(14)

k i = α w 2 - e

(15)

제안된 방법론에 의해 비례 이득은 실시간 추정되는 계수값과 오차의 적분항에 의해 갱신되며, 적분 이득의 경우 오차에 의해 갱신됨을 확인할 수 있다. 최종적으로 미지 시스템의 오차를 수렴시키기 위한 PID 제어 입력은 다음과 같이 계산될 수 있다.

u = - a^+ w - α 2 + ∫ 0 t e d t e + k d e ˙ + α w 2 - e ∫ 0 t e d t

(16)

미분 제어 입력의 경우 오차 동역학 모델에 미분 제어 입력이 적용되어 등가 계수가 추정기 때문에 결과적으로 오차 변화율은 비례-적분 이득 갱신에 영향을 주지 않음을 확인할 수 있다. 그러므로 미분 이득의 경우 신호의 노이즈 등을 고려하는 적절한 값으로 설정되면 합리적 성능이 확보될 수 있다. 향후 신호 노이즈 등을 고려하는 실시간 미분 이득 갱신 알고리즘 개발을 통해 고도화를 계획하고 있다. 다음 장에서는 실 DC 모터 플랫폼을 이용한 성능평가 결과를 분석하고 제안하는 알고리즘의 한계점을 분석한다.

3. 성능평가

성능평가를 위해 실 DC 모터 플랫폼이 사용되었으며, Fig. 2는 본 연구에서 제안된 PID 이득 자동 조정 알고리즘이 적용된 제어기의 성능평가를 위한 전반적 블록선도와 이용된 실 플랫폼을 보여준다.

Fig. 2

Block diagram and platform for performance evaluation

RLS-based gain auto-tuning 블록에서는 계수 추정과 이득 조정이 수행되고, PID control input calculation 블록에서는 비례-적분-미분 제어 입력을 계산한다. 플랫폼은 QUANSER 사의 QUBE-Servo 2 모델이며, Matlab/Simulink와 연동될 수 있는 제품으로 다음 Table 1은 DC모터 플랫폼의 스펙을 보여준다.

Table 1

Specification of the used DC motor platform

제어 이득 자동 조정 알고리즘의 성능평가를 위해 적용된 파라미터들은 다음 Table 2에서 확인할 수 있으며 모든 시나리오에 같은 값으로 적용되었다.

Table 2

Parameters used for performance evaluation

3.1 계단(Step) 형태 속도 추종 평가

계단 입력 형태의 목표 속도 추종 성능평가가 수행되었으며, 적절하게 설정되지 않은 고정 이득값이 적용된 비례-적분 제어 경우와 이득 자동 조정 방법이 적용된 경우가 비교 평가되었다. 이득 자동 조정 방법이 적용된 경우는 미분 제어 입력이 적용된 경우와 적용되지 않는 경우 두 가지로 구분되었다. Fig. 3과 4는 모터의 각속도와 추종 오차를 보여준다.

Fig. 3

Angular velocity: step target velocity tracking

Fig. 4

Control error: step target velocity tracking

고정 이득이 적용된 경우, 목표 각속도가 크게 변하는 초기 과도 구간에서 오차가 존재하는 것을 확인할 수 있었다. 하지만 자동 조정 기법이 경우 부분적 진동 현상이 있지만 실시간 갱신되는 제어 입력에 의한 오차 수렴 과정을 확인하였다. 미분 제어 입력이 적용된 경우 정상상태 구간에서 적용되지 않은 경우 대비 상대적 작은 오차를 보였다. Table 3은 10초 이후 추종 오차의 제곱 평균의 제곱근을 보여준다.

Table 3

RMS value of control error – step input

미분 제어 입력이 적용되지 않은 자동 조정 기법의 경우 정상상태 구간인 10초 이후 추종 오차의 RMS 값은 고정 이득 기법과 크게 다르지 않았다. 미분 제어 입력이 적용된 자동 조정 기법의 경우 고정 이득 기법 대비 상대적 낮은 정상상태 오차를 확인할 수 있다. Fig. 5는 계단 형태의 목표 속도 추종 시나리오에서 평가 방법들에 의해 인가된 전압값을 보여준다.

Fig. 5

Voltage input: step target velocity tracking

목표 속도 추종을 위해 모든 시나리오에서 약 3 V의 전압이 정상상태에서 인가되는 것을 확인할 수 있다. 고정 이득값이 적용된 시나리오 대비 자동 조정 방법이 적용된 경우 상대적 큰 입력이 도출되었다. Fig. 6은 이득 자동 조정을 위해 추정된 등가 오차 동역학 모델의 추정 계수를 보여준다.

Fig. 6

Estimated: step target velocity tracking

미분 제어 입력이 적용되지 않은 경우 추정된 계수 값이 적용된 경우 대비 상대적 큰 추정값을 보여주고, 변화 경향은 크게 다르지 않음을 확인하였다. Fig. 7은 추정된 계수와 제어 오차를 이용해 실시간 자동 조정되는 비례-적분 이득값들을 보여준다.

Fig. 7

Gain: proportional and integral gain

적분 이득값은 정상상태 구간에서는 큰 차이가 없었지만 과도 구간에서 미분 제어 입력이 인가된 경우가 적용되지 않은 경우 대비 작은 변화를 보였다. 비례 이득값은 크게 다르지 않은 변화 경향을 보였다.

3.2 정현파(Sinusoidal) 형태 속도 추종 평가

과도 응답 평가를 위해 정현파 목표 속도 추종 평가가 수행되었으며, 목표 속도는 진폭 3,600 deg/s, 주기 4 sec인 정현파가 인가되었다. 다음 Fig. 8과 9는 모터의 각속도와 추종 오차를 보여준다.

Fig. 8

Angular velocity: sinusoidal target velocity tracking

Fig. 9

Control error: sinusoidal target velocity tracking

Fig. 8과 9에서 확인할 수 있듯이, 이득 자동 조정기법이 적용된 경우가 고정 이득이 적용된 경우 대비 초기 속도의 진동 현상이 있었다. 초기 속도의 진동 현상은 RLS 알고리즘 추정값의 초기 수렴 과정에서 진동하는 현상에 의한 것으로 해석될 수 있다. 하지만 과도 구간의 경우 이득 자동 조정 기법이 적용된 경우가 고정 이득이 적용된 경우 대비 상대적 작은 추종 오차를 보였으며, 미분 제어 입력이 적용된 경우가 적용되지 않은 이득 자동 조정 기법이 적용된 경우 대비 상대적 더 작은 추종 오차를 보였다. Table 4는 성능평가 시작 10초 이후 추종 오차의 제곱 평균의 제곱근을 보여준다.

Table 4

RMS value of control error – sinusoidal input

미분 제어 입력이 적용되지 않은 자동 조정 기법의 경우 10초 이후 추종 오차의 RMS 값은 고정 이득 기법 대비 상대적 큰 폭으로 줄어든 것을 확인할 수 있다. 미분 제어 입력이 적용된 자동 조정 기법의 경우 적용되지 않은 경우 대비 소폭 작아진 RMS 값을 확인할 수 있다. Fig. 10은 정현파 형태의 목표 속도 추종 시나리오에서 인가된 전압값을 보여준다.

Fig. 10

Voltage input: sinusoidal target velocity tracking

Fig. 10(b)에서 확인할 수 있듯이, 평가 초기에는 추종 속도 변화 경향과 같이 제어 입력 또한 진동 현상이 있었다. 이러한 현상의 이유는 제어 이득 결정에 RLS 추정값이 이용되기 때문이며, 미분 제어 입력이 적용된 경우가 적용되지 않은 경우 대비 상대적 큰 진동이 있음을 확인할 수 있다. Fig. 11은 이득 자동 조정 기법 적용 시나리오에서 미분 제어 입력의 적용 유무에 따른 추정 계수 그래프를 보여준다.

Fig. 11

Estimated: sinusoidal target velocity tracking

미분 제어 입력이 적용된 경우가 적용되지 않은 경우 대비 상대적 작은 계수값으로 추정됨을 확인할 수 있었으며, 모든 경우 초기 큰 변화와 함께 점진적으로 추정값이 작아지는 경향성을 확인할 수 있었다. Fig. 12는 제어 입력 계산을 위해 실시간으로 계산된 비례-적분 이득값들을 보여준다.

Fig. 12

Gain: proportional and integral gain

모든 경우에 대해 비례-적분 이득값은 목표 속도 개형과 유사한 개형으로 조정됨을 확인할 수 있으며, 미분 제어 입력이 적용된 경우와 적용되지 않은 경우 이득값의 상대적 큰 차이는 없었다. 하지만 미분 제어 입력이 적용된 경우가 적용되지 않은 경우 대비 진동 현상이 상대적으로 작은 것을 확인할 수 있다. 평가 결과 제안된 제어 방법은 시스템 변화에 따라 실시간 제어 입력이 조정 가능하기 때문에 다양한 운전 조건에서 합리적 제어가 가능하며, 초기 상대적 빠른 응답 속도를 보였다. 또한 실시스템 기반 평가를 통해 내외적 외란에도 실시간 제어 입력 조정을 통한 제어 안정성 확보가 가능한 것으로 확인되었다. 하지만 초기 상대적 큰 제어 입력의 사용과 빈번한 입력 변동은 장단기적으로 에너지 효율에 부정적 영향을 미칠 수 있다. 그러므로 향후 제어 입력 적응성을 유지하면서 안정화를 위한 연구를 계획하고 있다. 다음 장에서는 본 연구의 결론과 함께 한계점 분석 그리고 제안하는 제어 알고리즘의 고도화를 위한 향후 계획에 대해 기술한다.

4. 결 론

본 연구에서는 이득 자동 조정 비례-적분-미분 제어 알고리즘을 제안하였다. 미분 제어 입력의 경우 시스템 또는 신호 특성에 따라 설계 파라미터로 정의되도록 알고리즘이 설계되었으며, 정의된 미분 이득값에 따른 제어 입력은 설계된 오차 미분 방정식에 반영되어 순환 최소 자승 기반 계수가 실시간으로 추정되었다. 추정된 계수값을 이용하는 오차 미분 방정식 기반 Lyapunov 직접법과 항등 조건을 이용하여 비례-적분 이득값을 실시간으로 도출하였다. 도출된 이득값과 정의된 미분 이득값을 이용해 비례-적분-미분 제어 입력을 도출하였고, 합리적 성능평가를 위해 실 DC 모터 플랫폼을 이용하였다. 목표 속도 추종 성능평가를 수행하였으며, 제안한 알고리즘은 고정 이득값이 적용된 경우 대비 합리적 추종 성능을 보여주었다. 하지만 성능평가 시작 후 초반에는 순환 최소 자승 알고리즘의 진동 현상으로 인한 제어 입력과 속도의 진동 현상이 확인되었으며, 중후반에는 추정값의 안정화 과정과 함께 점진적 변화가 있음을 확인할 수 있었다. 그러므로 본 연구의 향후 계획으로 재귀 순환 최소 자승 기법의 안정화 이론 개발과 함께 실시간 오차 데이터를 이용한 미분 이득값 자동 결정 알고리즘 개발을 계획하고 있다. 또한 개발된 알고리즘의 실용화를 위해 다양한 시나리오와 시스템에 합리적 적용이 가능한 동특성 기반 망각 인자 자동 조정 알고리즘 개발과 범용성 평가를 계획하고 있다. 본 연구에서 개발된 자동 이득 조정 기반 비례-적분 제어 기법은 외란의 존재에도 다양한 미지 시스템의 합리적 제어 성능 확보를 위해 범용적으로 이용될 것을 기대한다.

Nomenclature


u :	control input, [V]
e :	control error, [rad/s]
λ :	forgetting factor, [-]
P :	covariance matrix, [-]
a :	equivalent system coefficient, [-]
K :	control gain, [-]
α :	decaying rate, [-]
s :	control surface, [-]
m :	sampling instance, [-]
L :	update gain, [-]
θ :	estimate, [-]

Subscripts

p :	proportional
d :	derivative
i :	integral

Acknowledgments

본 연구는 2022년도 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원(NRF-2022R1F1A1075167)을 받아 수행되었음.

References

M. R. Jeon, H. S. Kim, J. H. Kim, S. J. Kim, S. S. Song and S. H. Kim, “A Study on the Dynamic Positioning Control Algorithm Using Fuzzy Gain Scheduling PID Control Theory,” Journal of the Society of Naval Architects of Korea, Vol.54, No.2, pp.102–112, 2017. [https://doi.org/10.3744/snak.2017.54.2.102]
J. H. Song, “Development of Active Front Wheel Steering(AFS) Controllers for SUV,” Transactions of KSAE, Vol.28, No.9, pp.613–619, 2020. [https://doi.org/10.7467/ksae.2020.28.9.613]
S. P. Zhang, H. Y. Heo, J. Y. Baek, S. W. Ahn and T. O. Tak, “Development of Vehicle Path Control Model Using Auto-Tuning PID Controller with Deep Learning Technique,” Transactions of KSAE, Vol.29, No.1, pp.1–9, 2021.
I. Carlucho, M. De Paula and G. G. Acosta, “An Adaptive Deep Reinforcement Learning Approach for MIMO PID Control of Mobile Robots,” ISA Transactions, Vol.102, pp.280–294, 2020.
O. Dogru, K. Velswamy, F. Ibrahim, Y. Wu, A. S. Sundaramoorthy, B. Huang, S. Xu, M. Nixon and N. Bell, “Reinforcement Learning Approach to Autonomous PID Tuning,” Computers & Chemical Engineering, Vol.161, Paper No.107760, 2022. [https://doi.org/10.1016/j.compchemeng.2022.107760]
A. Lakhani, M. Chowdhury and Q. Lu, “Stability-Preserving Automatic Tuning of PID Control with Reinforcement Learning,” Complex Engineering Systems, Vol.2, No.3, pp.1–21, 2022. [https://doi.org/10.20517/ces.2021.15]
T. Shuprajhaa, S. K. Sujit and K. Srinivasan, “Reinforcement Learning-Based Adaptive PID Controller Design for Control of Linear/Nonlinear Unstable Processes,” Applied Soft Computing, Vol.128, Paper No.109450, 2022. [https://doi.org/10.1016/j.asoc.2022.109450]
T. Kono and S. Masuda, “Performance Improvement in Iterative Data-Driven PID Gain Tuning Based on Generalized Minimum Variance Regulatory Control,” 15th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology(ECTI-CON) pp.364–367, 2018.
S. Yahagi and I. Kajiwara, “Direct Data-Driven Tuning of Look-Up Tables for Feedback Control Systems,” IEEE Control Systems Letters, Vol.6, pp.2966–2971, 2022. [https://doi.org/10.1109/lcsys.2022.3181343]
A. Vahidi, A. Stefanopoulou and H. Peng, “Recursive Least Squares with Forgetting for Online Estimation of Vehicle Mass and Road Grade: Theory and Experiments,” Vehicle System Dynamics, Vol.43, No.1, pp.31–55, 2005. [https://doi.org/10.1080/00423110412331290446]

Parameter	Unit	Value
Inductance	mH	1.6
Resistance	Ω	8.4
Torque constant	Nm/A	0.042
Back-emf constant	Vs/rad	0.042
Rotational inertia	kgm²	2.09×10^-5

Parameter	Description	Value	Remark
λ	Forgetting factor	0.99995	For RLS algorithm
P_t=0	Initial covariance	0.0001
θ_t=0	Initial estimate	0
w	Weighting factor	4	For auto-tuning scenario
α	Decaying rate	2
k_d	Derivative gain for auto-tuning	0.1
k_p	Proportional gain	0.2	For fixed gain scenario
k_i	Integral gain	0.25	For fixed gain scenario

Scenario	RMS value	Remark
Fixed gain	6.0075 deg/s	Considered time 10 ~ 20 sec
Auto-tuning	6.0396 deg/s
Auto-tuning with k_d	5.2593 deg/s

Scenario	RMS value of error	Remark
Fixed gain	402.7753 deg/s	Considered time 10 ~ 20 sec
Auto-tuning	37.1358 deg/s
Auto-tuning with k_d	34.3575 deg/s