[ Article ]

Transactions of the Korean Society of Automotive Engineers - Vol. 33, No. 3, pp.185-192

ISSN: 1225-6382 (Print) 2234-0149 (Online)

Print publication date 01 Mar 2025

Received 24 Oct 2024 Revised 24 Oct 2024 Accepted 20 Nov 2024

DOI: https://doi.org/10.7467/KSAE.2025.33.3.185

자율주행의 트리 정책 계획을 위한 조건부 다중 경로 예측 및 불확실성에 강건한 비용 평가

장한빈¹⁾ ; 임준희²⁾ ; 금동석^*^{, 3)}

1)한국과학기술원 기계공학과
2)한국과학기술원 로봇공학학제전공
3)한국과학기술원 조천식모빌리티대학원

Conditional Multi-Modal Prediction and Uncertainty-Robust Cost Evaluation for Tree Policy Planning in Autonomous Driving

Hanbin Jang¹⁾ ; Joonhee Lim²⁾ ; Dongsuk Kum^*^{, 3)}

1)Department of Mechanical Engineering, KAIST, Daejeon 34141, Korea
2)Robotics Program, KAIST, Daejeon 34141, Korea
3)Cho Chun Shik Graduate School of Mobility, KAIST, Daejeon 34051, Korea

Correspondence to: ^*E-mail: dskum@kaist.ac.kr

Copyright Ⓒ 2025 KSAE / 232-01
This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium provided the original work is properly cited.

Abstract

For autonomous vehicles(AVs) to drive in a safe, efficient, and socially collaborative way, it is essential to consider interactions with surrounding agents(SAs). However, existing motion planning methods for AVs face two significant challenges: reasoning about the ego vehicle’s plan impact on SAs’ behavior and handling the uncertain intentions of SAs. Most studies have addressed these challenges individually but have limited focus on solving both simultaneously. Hence, this paper proposed a conditional multi-modal motion prediction(CMMP) and cost evaluation for tree policy planning. CMMP models the future impact of the ego vehicle’s plan using trajectory candidates and handles the uncertainty of SAs’ intentions through multimodal prediction. The cost evaluation robustly assesses trajectory candidates under uncertainty using multiple trajectories and their probabilities. Experimental results demonstrated that the suggested approach improves prediction accuracy and generates trajectories more similar to expert driving, compared to a baseline using conditional unimodal prediction and general cost evaluation.

Keywords:

Autonomous vehicle, Motion planning, Motion prediction, Uncertainty-awareness, Interaction-awareness

키워드:

자율주행 자동차, 경로 계획, 경로 예측, 불확실성 인지, 상호작용 인지

1. 서 론

자율주행의 경로 계획은 주변 에이전트의 경로 예측 결과와 맵 정보 및 신호정보를 토대로 자차량이 가야 할 최종 경로를 계획한다. 자율주행은 다양한 에이전트와 공유된 공간에서 주행하기 때문에, 안전하고 효율적이면서, 사회적으로 조화롭게 동작 가능한 경로를 계획해야 한다. 이를 위해서는 경로 예측 및 경로 계획 시 주변 에이전트와의 상호작용을 필수적으로 고려해야 하며¹⁾, 이를 반영하기 위해 고려해야 할 사항은 다음과 같다.

첫 번째는 자차량의 행동이 주변 에이전트에게 미치는 영향을 고려해야한다. 상호작용이 발생하는 주행 상황에서는 자차량의 경로 계획이 주변 에이전트의 미래 경로에 영향을 준다. 따라서 경로 예측은 경로 계획에 대한 영향을 모델링 하여 주변 에이전트의 미래 경로를 예측할 수 있어야 하며, 경로 계획은 이러한 경로 예측을 사용하여 상호작용을 고려하는 경로를 계획해야 한다. 현재 자차량 계획에 따른 영향을 직접적으로 다룬 경로 예측과 이를 경로 계획 시 사용한 연구는 크게 규칙 기반 예측 방법을 사용한 연구와 데이터 기반 예측 방법을 사용한 연구로 나뉜다. 규칙기반 예측 방법을 사용한 연구^2-4)는 IDM⁵⁾과 같은 구조의 간단한 규칙 기반 방법을 사용함으로써 적용이 쉽고, 계산량이 적다는 장점을 갖는다. 하지만 직선 도로와 같은 비교적 단순한 상황에서만 동작 가능하며, 다수의 차량 및 복잡한 도로 구조와의 관련성을 모델링하지 못한다는 단점을 갖는다. 반면 데이터 기반 예측 방법을 사용한 연구^6-8)는 심층 신경망⁹⁾을 활용하여 많은 정보를 입력 받아 원하는 출력으로 매핑 가능하기 때문에 다양하고 복잡한 시나리오에서도 적용 가능하다는 장점을 갖는다.¹⁰⁾ 이러한 방법은 신경망을 통해 쿼리화(Queryable) 된 경로 계획을 경로 예측 시 사용함으로써 경로 계획이 주변 에이전트에게 미치는 영향을 고려하고 있다. 하지만 이러한 데이터 기반 예측 방법을 사용한 연구^6-8)는 주변 차량의 미래 경로를 단일 경로로 예측하여 경로 계획에 반영한다. 이러한 단일 경로 예측은 주변 차량의 불확실한 의도를 충분히 고려하지 못해, 상호작용이 발생하는 상황에서 부정확한 예측을 초래하여 차량의 안정성을 저해할 수 있다.

두 번째는 경로 계획 시 주변 에이전트의 불확실한 의도를 고려해야한다. 주변 에이전트는 통과, 양보, 직진, 좌회전, 우회전 등의 다양한 의도를 가질 수 있지만, 이는 직접적으로 관측할 수 없고, 시간 및 상황에 따라 의도가 변할 수 있어 불확실한 특성을 가진다. 특히 상호작용이 발생하는 상황에서는 주변 차량의 의도에 대한 불확실성이 증가하며, 이는 경로 계획 시 경로 안정성에 악영향을 끼칠 수 있다. 이러한 불확실성을 고려하기 위한 다양한 경로 계획 연구들이 현재 진행 중에 있으며, 대표적으로 Partially Observable Markov Decision Process (POMDP) 기반 방법^11-14)과 Contingency planning 방법^15-17)이 있다. POMDP 기반 방법은 주변 에이전트의 불확실한 의도를 추정하고 가상 시뮬레이션을 통해 행동 가치를 평가하여 최적 행동을 결정한다. Contingency planning 방법은 발생할 수 있는 다양한 예측 결과를 받아 모든 미래에 대처 가능한 Short-term 경로를 생성한다. 하지만 현재 대부분의 불확실성을 고려한 경로 계획 연구는 앞에서 언급했던 자차량의 계획이 주변 에이전트에게 미치는 영향을 고려하지 않거나 고려하더라도 규칙 기반 예측 방법을 사용하여 일반화 가능성과 확장성이 낮다. 따라서 기존 연 구들은 상호작용이 발생하는 다양한 주행 상황에서 자차량의 계획에 대한 영향을 제대로 고려하지 못하여 보수적인 주행(Freezing robot problem¹⁸⁾)을 초래하고, 자율주행의 주행 효율성을 저하시킨다.

요약하자면, 대부분의 연구는 주변 차량과의 상호작용 또는 불확실한 의도 중 하나의 문제를 푸는 데에 초점에 두고 연구를 진행해왔다. 하지만 이 두 가지는 자율주행의 경로 계획이 고려해야 할 매우 중요한 문제이기 때문에 두 문제를 동시에 다뤄야만 한다. 이에 본 논문에서는 주변 차량과의 상호작용과 예측 불확실성을 모두 고려한 조건부 다중 경로 예측 기법을 제안하며, 이러한 예측 결과를 비용 평가에 활용한 경로 계획 방법을 함께 제시한다.

본 논문의 구성은 다음과 같다. 2장에서는 경로 계획, 경로 예측, 비용 평가, 그리고 학습 목적 함수로 이루어진 방법론을 설명한다. 3장에서는 실험 세팅과 평가 방법 그리고 이를 통해 얻은 실험 결과를 소개하며 4장에서는 결론을 제시한다.

2. 방 법 론

제안하는 방법은 Fig. 1과 같이 경로 후보를 생성하는 샘플링 기반 경로 계획, 주변 차량의 미래 경로를 다중 경로와 그에 대한 확률을 예측하는 조건부 다중 경로 예측 그리고 경로 예측 결과를 기반으로 자차량 후보 경로의 비용을 평가하는 비용 평가로 구성된다. 경로 후보 생성 방법은 2.1절에서, 주변 에이전트의 경로 예측 모듈은 2.2절에서, 비용 평가 모듈은 2.3절에서 각각 자세히 다루겠다. 마지막으로, 학습에 사용되는 목적함수는 2.4절에서 설명하겠다.

Fig. 1

Framework of the proposed method

2.1 샘플링 기반 경로 계획

샘플링 기반 경로 계획은 자차량이 가야 할 경로 후보를 생성하는 모듈이다. 자율 주행 차량이 차선의 중심을 따라가는 경로를 계획하기 위해 DTPP⁸⁾와 같이 차선 중심을 기반으로 경로 후보를 생성한다. 샘플링 기반 경로 계획은 경로를 생성하는 부분과 속도를 결정하는 부분으로 구성된다. 현재 차선 및 주변 차선의 중심선 위 점을 샘플링하여 종단 상태를 설정하고, 3차 베지어 곡선을 사용하여 현재 상태와 종단 상태를 잇는 연속적인 경로를 생성한다. 경로들이 생성된 이후에는 종단 속도를 샘플링하고, 식 (1)과 같이 등가속도를 적용하여 속도 프로파일이 포함된 경로 후보를 생성한다. 경로 후보는 트리 구조로 다수의 경로 단계(Planning stage)를 가질 수 있다. 제안하는 방법은 DTPP⁸⁾와 같이 Short-term stage는 3초, Long-term stage는 5초로 설정하여 2개의 경로 단계를 가진 트리구조의 경로 후보를 생성한다.

v t = a 0 + a 1 t + a 2 t 2 + a 3 t 3, v 0 = v 0, v t F = v t a r g e t, a 0 = v ˙ 0 = a 0, a t F = v ˙ t F = 0 .

(1)

2.2 조건부 다중 경로 예측

조건부 다중 경로 예측은 주변 에이전트, 도로 구조, 신호 상황과의 상호작용, 그리고 자차량 경로 계획이 주변 에이전트에게 미치는 영향을 고려하여 주변 에이전트의 미래 경로와 그 경로에 대한 확률을 예측하는 모듈이다. 제안하는 방법의 네트워크 구조는 Fig. 2에 제시된 바와 같다. 조건부 다중 경로 예측은 DTPP⁸⁾의 네트워크 구조를 기반으로, 자차량의 후보 경로를 쿼리화하여 디코딩에 사용함으로써 자차량 계획이 주는 영향을 반영한다. DTPP⁸⁾는 주변 차량의 경로를 단일 경로로 예측하여 에이전트의 불확실한 의도에 취약하다. 반면, 제안하는 방법은 N개로 쌓여진 멀티헤드 어텐션을 사용해 여러 상황을 모델링하고, 다수의 경로와 그에 대한 확률을 예측한다. 이러한 예측 결과는 이후 비용 평가에 활용되어, 기존 방법보다 불확실성에 더 강건한 경로 계획을 가능하게 한다.

Fig. 2

Framework of CMMP and cost evaluation

2.2.1 인코더

인코더는 자차량 및 주변 차량의 과거 상태 정보와 맵 정보를 받아 의미 있는 저수준 피쳐(Low-level feature)를 생성하는 모듈로, DTPP⁸⁾와 같이 환경 인코더와 자차량 경로 인코더로 구성된다. 환경 인코더는 맵 정보와 자차량 및 주변 에이전트의 과거 상태 정보를 받아 저수준 피쳐(Low-level feature)를 생성한다. 차선, 횡단보도, 신호 등 맵 정보와 자차량 및 주변 에이전트의 과거 상태 정보는 MLP, LSTM, 임베딩 네트워크를 통해 저수준 피쳐(Low-level feature)로 변환되며, 트랜스포머¹¹⁾의 셀프 어텐션을 활용해 각 피처 간 상호작용을 모델링한다. 자차량 경로 인코더는 자차량의 경로 후보를 인코딩해 쿼리화 된 경로 후보를 생성한다. 환경 인코더와 자차량 경로 인코더의 출력은 디코더에서 각각 Query, Key, Value로 활용된다.

2.2.2 디코더

디코더는 인코더가 생성한 피처를 활용해 주변 에이전트의 미래 경로를 다수의 경로와 각 경로에 따른 확률로 디코딩하는 모듈이다. DTPP⁸⁾와 같이, 환경과의 상호작용을 모델링하는 크로스 어텐션 모듈과 경로 계획과의 상호작용을 모델링하는 크로스 어텐션 모듈로 구성된다. Query는 에이전트 인코딩 피처, 시간 임베딩 피처, 경로 후보 인코딩 피처로 구성된다. 환경과의 상호작용을 모델링하는 크로스 어텐션은 환경 인코딩 피처를 Key와 Value로 사용해 환경과의 상호작용을 모델링한다. 경로 계획과의 상호작용을 모델링하는 크로스 어텐션은 경로 후보 인코딩 피처를 Key와 Value로 사용해 자차량의 경로 계획과의 상호작용을 모델링한다. 제안하는 방법은 DTPP⁸⁾와 달리 쿼리화 된 경로 계획을 입력으로 하는 크로스 어텐션 네트워크를 N_m(3)개 쌓아, 각 네트워크가 자차량과의 상호작용 시 발생할 수 있는 불확실한 의도를 파악할 수 있도록 구성했다. 자차량 경로 계획들에 어텐션을 적용할 때, 경로간 독립성을 유지하기 위해 Fig. 3과 같이 DTPP⁸⁾의 Causal attention을 활용하였다. 두가지의 크로스 어텐션을 적용한 피처는 병합(Concatenate)되어 경로 디코더와 점수 디코더의 입력으로 사용된다. 경로 디코더는 경로를 추출하는 역할을 하며, 점수 디코더는 예측 경로에 대한 확률을 예측하는 역할을 한다.

Fig. 3

Illustration of stacked causal attention for ego conditioning

2.3 비용 평가

비용 평가는 예측된 경로와 그에 따른 확률을 바탕으로 자차량 후보 경로의 비용을 평가하는 모듈이다. 비용 함수는 안정성, 효율성, 편안함 간의 트레이드오프(Trade-off)를 통합적으로 고려하여 설계해야 하기 때문에 자율주행 경로 계획의 어려운 과제 중 하나이다. 이러한 문제점을 해결하기 위해 데이터를 활용한 비용 함수 학습 연구들이 진행되고 있으며, 특히 역강화학습(Inverse Reinforcement Learning(IRL)¹⁹⁾)은 운전자의 행동을 모방하기 위한 학습 방법 중 하나이다. 제안하는 방법은 DTPP⁸⁾와 같이 학습 가능한 비용 피처(Feature)와 웨이트(Weight) 그리고 직접 계산한 비용 피처(Hand-crafted cost feature)를 사용하여 운전자가 사용하는 비용을 학습하고, 추론 시 학습된 피처를 비용 평가에 사용한다.

기존 DTPP⁸⁾의 비용 평가는 단일 예측 경로를 기반으로 후보 경로를 평가했지만, 단일 경로 예측은 주변 차량의 불확실한 의도를 모델링하지 못해 상호작용이 발생하는 상황에서 부정확하게 경로를 예측할 수 있다. 이는 결국 비일관적이고 불안정한 경로 계획을 야기하여 차량의 안정성을 저해할 수 있다. 제안하는 방법은 다수의 경로와 그에 따른 확률을 사용해 경로를 평가함으로써, 불확실한 의도를 고려한 경로 평가를 가능하게 하여 경로 계획의 안정성을 향상시킨다.

c ζ k e, ζ k s u r, p ζ k s u r = 1 t F - t 0 w E f E + w l f I + w c f c

(2)

비용 평가는 식 (2)와 같이 예측 경로에 대한 확률을 기반으로 DTPP⁸⁾에서 사용한 피처들을 가중합(Weighted sum)하여 계산된다. 비용 평가에 사용한 피처는 f^E: 자차량 피처, f^I: 상호작용 피처, f^C: 충돌 피처로 구성된다.

자차량 피처는 경로의 속도, 가속도, 저크의 제곱으로 구성되어 편안함과 주행 능력 간 균형을 유지하는 역할을 한다.

상호작용 피처는 자차량과 주변 차량 간 상호작용을 모델링하는 피처로, 자차량과 주변 차량의 상대 상태를 입력으로 사용한다. 상대 상태는 MLP를 통해 고차원으로 인코딩 된 후, 예측 경로 확률에 가중합이 적용되며, Max pooling과 MLP를 사용해 저차원 피처로 인코딩 된다. 식 (3)은 상호작용 피처가 계산되는 식이다.

f l ζ k e, ζ k s u r, p ζ k s u r = ∑ i = 1 N m ∑ j = 1 N n M L P M a x P o o l p ζ i, k s u r ⋅ M L P ζ i, j, k s u r - ζ k e

(3)

충돌 피처는 자차량과 주변 차량 간의 충돌 가능성을 비용 평가에 반영하기 위해 거리를 기반으로 계산된 피처이다. 식 (4)와 같이, 자차량과 주변 차량 사이의 거리에 지수함수를 적용하여 충돌 피처를 생성한다. 이후 경로 예측 확률에 따라 가중합이 적용되어 계산된다.

f C ζ k e, ζ k s u r, p ζ k s u r = ∑ i = 1 N m ∑ j = 1 N n p ζ i, k s u r ⋅ exp - 0.2 ⋅ ζ k e - ζ i, j, k s u r 2

(4)

2.4 학습 목적 함수

조건부 다중 경로 예측 모듈 및 비용 평가 모듈은 모두 학습 가능한 인공신경망으로 구성되어 데이터를 통해 학습된다. 학습을 위한 목적 함수는 세 가지로 구성되며, 첫 번째는 주변 에이전트의 경로 예측 정확도를 높이는 Prediction loss, 두 번째는 자차량의 경로 계획이 전문가의 행동을 모방하도록 하는 Inverse Reinforcement Learning(IRL) loss, 그리고 세 번째는 주변 차량의 경로 예측 확률을 학습하는 Modality loss이다. Prediction loss는 식 (5)와 같이 참값과 가장 가까운 후보 경로와 연관되며 예측 확률이 가장 높은 경로에 대해 Smooth L1 loss를 적용해 계산된다. 여기서 $ξ i *$ 는 선택된 자차량 경로 후보와 연관된 가장 확률이 높은 예측 경로이며, $ξ i gt$ 는 주변 에이전트의 실제 미래 경로이다.

L p = 1 t F - t 0 1 N a ∑ i = 1 N n S m o o t h L 1 ξ i * - ξ i g t

(5)

IRL loss는 비용 평가 결과를 바탕으로 자차량 후보 경로에 대한 확률을 식 (6)를 통해 구한 후, 참값 라벨(y_c,i)과의 Cross entropy loss(식 (7))를 통해 계산된다. 이를 통해 자차량은 전문가의 행동을 모방하는 경로 후보를 선택할 수 있도록 비용이 학습된다. 참값 라벨(y_c,i)은 참값(Ground truth)과 가장 가까운 후보 경로의 인덱스로 설정된다.

P s i = e - c s i ∑ j e - c s j

(6)

L c = - ∑ i = 1 N b y c, i l o g P ξ i

(7)

Modality loss 계산은 식 (8)과 같이 경로에 대한 확률과 참값 라벨 사이의 Cross entropy loss를 계산하여 얻는다. 이는 경로에 대한 확률을 예측하도록 학습하는 역할을 한다. 참값 라벨(y_m,i)는 주변 차량의 예측 경로 중 가장 참값(Ground truth)과 가깝게 예측한 경로의 인덱스로 설정된다.

L m = - ∑ i = 1 N m y m, i l o g P ζ i s u r

(8)

최종 손실 함수 $L$ 은 식 (9)과 같이 각 손실 함수들의 가중합을 통해 계산된다. 여기서 j는 경로 단계(Planning stage)를 나타나며, 해당 단계에서의 IRL loss( $L c$ )의 가중치 α는 1.0으로 설정했다. 또한, Modality loss( $L m$ )의 가중치 β는 2.0로 설정했다. 각 경로 단계에 해당하는 가중치 γ^j는 단계에 따라 달라지며, 실험에서는 γ¹ = 1.0, γ² = 0.1로 설정하여 경로 단계별로 다른 가중치를 부여하였다.

L = ∑ j = 1 N s γ j L p j + α L c j + β L m j

(9)

3. 실험 및 결과

실험에서는 대규모 실제 주행 데이터 셋인 nuPlan dataset²⁰⁾을 사용하여 제안한 방법을 학습하고 평가하였다. 학습을 위해 nuPlan의 유효 데이터셋(Valid dataset) 중에서 10만 개의 시나리오를 무작위로 선택하여 학습용 데이터셋(Train dataset)으로 설정하였고, 나머지 1만 6천여 개의 시나리오는 검증용 데이터셋(Valid dataset)으로 사용하였다. 각 시나리오는 과거 2초에서 미래 8초까지의 시간 구간(Horizon)으로 설정하였다.

모델 학습은 NVIDIA RTX 3090 GPU에서 진행되었다. 학습 배치(batch) 크기는 16으로 설정하였으며, 총 30 에폭(Epoch)에 걸쳐 학습을 수행하였다. 최적화 알고리즘으로는 AdamW optimizer를 사용하였으며, 초기 학습률은 1e-4로 설정한 후, 매 다섯 에폭마다 학습률을 0.5배씩 감소시키는 방식으로 조정하였다. 추론 과정 또한 동일한 NVIDIA RTX 3090 GPU와 intel i9-10890XE 프로세서를 사용하여 수행하였다.

실험에 대한 평가는 정성적 평가와 정량적 평가로 구성된다. 정성적 평가는 제안하는 방법의 경로 예측 및 경로 계획을 시각적으로 분석하여, 방법론의 유효성을 평가한다. 정량적 평가는 경로 예측 및 경로 계획 성능을 객관적으로 분석하기 위해, 참값(Ground truth)과의 평균 거리 오차(Average Distance Error, ADE) 및 최종 거리 오차(Final Distance Error, FDE)를 주요 성능 지표로 사용하여 비교 분석을 진행하였다. 실험의 신뢰성을 확보하기 위해 조건부 단일 경로 예측과 이를 비용평가에 사용한 DTPP⁸⁾를 비교군으로 선정하였다.

3.1 정성적 평가

Fig. 4는 경로 예측의 정성적 결과이다. 상단은 비교군의 예측 결과이며 하단은 제안한 방법의 예측 결과이다. 비교군은 비용 평가에 의해 선택된 자차량의 계획에 기반한 조건부 경로 예측 경로를 시각화 하였으며, 제안한 방법은 자차량의 계획에 기반한 조건부 경로 예측 경로를 해당 확률과 함께 시각화 하였다. 제안하는 방법의 예측 경로는 비교군과 달리 다중 경로로 예측하고 있으며, 비교군 보다 실제 도로 경로와 비슷하게 예측하고 있음을 확인할 수 있다. 정량적 성능 비교는 3.2절에서 다루겠다.

Fig. 4

Qualitative results of prediction (top: DTPP, bottom: ours)

Fig. 5는 경로 계획의 정성적 결과이다. 본 결과는 nuPlan²⁰⁾에서 제공하는 Closed loop non-reactive agents 시뮬레이션을 사용하였으며, Fig. 5는 동일한 로그 파일과 프레임에서 촬영한 경로 계획 결과이다. 상단은 비교군의 경로 계획 결과이며, 하단은 제안한 방법의 계획 결과를 보여준다. 주황색 선은 인간 전문가가 실제 주행한 경로를, 하늘색 선은 자율주행 시스템이 계획한 경로를 의미한다. 제안한 방법은 비교군에 비해 인간 전문가(Human expert)의 행동을 더 정확하게 모방하는 경로 계획을 보여주고 있다. 정량적 성능 비교는 3.2절에서 다루겠다.

Fig. 5

Qualitative results of planning (top: DTPP, bottom: ours)

3.2 정량적 평가

경로 예측의 정확도를 평가하기 위해, 비교군은 비용 평가에 의해 선택된 자차량의 계획에 기반한 조건부 경로 예측 결과를 비교 대상으로 사용하였으며, 제안한 방법은 자차량의 계획에 기반한 조건부 경로 예측 결과 중 가장 높은 확률을 가진 예측 결과를 비교 대상으로 설정하였다. Table 1은 제안한 방법과 비교군의 경로 예측 성능을 보여주는 정량적 결과이다. 비교 결과, 제안한 방법이 비교군에 비해경로 예측에서 평균 거리 오차(ADE)와 최종 거리 오차(FDE) 모두에서 더 낮은 값을 기록하였다. 이는 제안한 방법이 쌓여진 N_m(3)개의 크로스 어텐션 신경망과 Modality loss를 통해 주변 에이전트의 불확실성을 효과적으로 모델링하여 경로 예측 성능을 향상시켰음을 보여준다.

Table 1

Prediction distance error

경로 계획의 정확도를 평가하기 위해, 비교군과 제안하는 방법이 최종적으로 생성한 계획 경로 결과와 실제 주행 경로와의 오차를 비교하였다. Table 2는 경로 계획 성능을 보여주는 정량적 결과이다.

Table 2

Planning distance error

비교 결과, 제안하는 방법이 비교군에 비해 참값(Ground truth)과의 평균 거리 오차(ADE) 및 최종 거리 오차 모두(FDE)에서 더 낮은 값을 보여, 인간 전문가(Human expert)의 행동을 더 잘 모방하고 있음을 확인할 수 있다. 비교군은 자차량 계획이 주변 에이전트에 미치는 영향을 모델링할 수 있지만, 주변 에이전트의 불확실한 의도에 취약하다. 반면 제안하는 방법은 자차량 계획이 주변 에이전트에 미치는 영향을 모델링하면서도, 다중 경로 예측과 이를 사용한 비용 평가를 활용하여 불확실한 의도에 더욱 강건한 경로를 계획한다. 이는 인간 운전자가 자차량의 행동이 주변에 미치는 영향과 주변 에이전트의 불확실한 의도를 모두 고려하는 판단 방식과 유사하며, 이러한 유사성은 Table 2에서 확인할 수 있듯 제안하는 방법이 베이스라인에 비해 더욱 인간의 운전을 더 잘 모방하도록 도와준다.

4. 결 론

본 논문에서는 자차량의 경로가 주변 차량에게 미치는 영향과 주변 차량의 불확실한 의도를 고려하기 위해 자차량의 조건부 다중 경로 예측과 불확실성에 강건한 비용 평가 방식을 제안하였다. 제안한 방법은 비교군에 비해 주변 에이전트의 미래 경로를 더 정확하게 예측하며, 인간 운전자의 행동을 더 잘 모방하는 것으로 확인할 수 있었다. 이러한 특성은 제안하는 방법이 상호작용이 많은 도심 환경에서 보다 안전하고 효율적인 주행을 가능하게 하는데 도움 줄 수 있을 것이라 기대한다.

Nomenclature


v :	velocity, m/s
a :	acceleration, m/s²
t₀ :	start time of planning stage, s
t_F :	end time of planning stage, s
c :	cost of candidate trajectory
N_n :	number of neighbors
N_m :	number of prediction modalities
N_b :	number of ego trajectory candidate branches
N_s :	number of planning stage
ξ^e :	ego vehicle’s trajectory candidates
*ξ^sur* :**	predicted trajectories of surrounding agents
*p(ξ^sur) :*	predicted probabilities of predicted trajectories

Subscripts


AV :	autonomous vehicle
SA :	surrounding agent
CMMP :	conditional multi-modal motion prediction

Acknowledgments

본 연구는 2021년도 국토교통부의 재원으로 국토교통과학기술원의 지원을 받아 수행된 연구임.(RS-2021-KA162184, Lv.4 자율주행 차량 테스트베드 환경 구축)

References

H. Kim, S. Choi, and K. Huh, “Probabilistic Vehicle Trajectory Prediction Considering Inter-vehicle Interaction Based on Multi-head Attention Architecture,” Transactions of KSAE, Vol.28, No.9, pp.645-652, 2020. [https://doi.org/10.7467/KSAE.2020.28.9.645]
D. Lenz, T. Kessler, and A. Knoll, “Tactical Cooperative Planning for Autonomous Highway Driving Using Monte-Carlo Tree Search,” IEEE Intelligent Vehicles Symposium (IV), pp.447-453, 2016. [https://doi.org/10.1109/IVS.2016.7535424]
J. Li, L. Sun, W. Zhan, and M. Tomizuka, “Interaction-Aware Behavior Planning for Autonomous Vehicles Validated with Real Traffic Data,” Dynamic Systems and Control Conference in American Society of Mechanical Engineers, Vol.84287, pp.V002T31A005, 2020.
C. Hubmann, J. Schulz, M. Becker, D. Althoff, and C. Stiller, “Automated Driving in Uncertain Environments: Planning with Interaction and Uncertain Maneuver Prediction,” IEEE Transactions on Intelligent Vehicles, Vol.3, No.1, pp.5-17, 2018. [https://doi.org/10.1109/TIV.2017.2788208]
M. Treiber, A. Hennecke, and D. Helbing, “Congested Traffic States in Empirical Observations and Microscopic Simulations,” Physical Review E, Vol.62, No.2, 2000. [https://doi.org/10.1103/PhysRevE.62.1805]
Y. Chen, S. Veer, P. Karkus, and M. Pavone, “Interactive Joint Planning for Autonomous Vehicles,” IEEE Robotics and Automation Letters, 2023. [https://doi.org/10.1109/LRA.2023.3332474]
Y. Chen, P. Karkus, B. Ivanovic, X. Weng, and M. Pavone, “Tree-Structured Policy Planning with Learned Behavior Models,” 2023 IEEE International Conference on Robotics and Automation (ICRA), pp.7902-7908, 2023. [https://doi.org/10.1109/ICRA48891.2023.10161419]
Z. Huang, P. Karkus, B. Ivanovic, Y. Chen, M. Pavone, and C. Lv, “DTPP: Differentiable Joint Conditional Prediction and Cost Evaluation for Tree Policy Planning in Autonomous Driving,” 2024 IEEE International Conference on Robotics and Automation (ICRA), pp.6806-6812, 2024. [https://doi.org/10.1109/ICRA57147.2024.10610550]
J. Schmidhuber, “Deep Learning in Neural Networks: An Overview,” Neural Networks, Vol.61, pp.85-117, 2015. [https://doi.org/10.1016/j.neunet.2014.09.003]
S. Kim, Y. Kim, H. Jeon, D. Kum, and K. Lee, “Autonomous Driving Technology Trend and Future Outlook: Powered by Artificial Intelligence,” Transactions of KSAE, Vol.30, pp.819-830, 2022. [https://doi.org/10.7467/KSAE.2022.30.10.819]
A. G. Cunningham, E. Galceran, R. M. Eustice, and E. Olson, “MPDM: Multipolicy Decision-Making in Dynamic, Uncertain Environments for Autonomous Driving,” 2015 IEEE International Conference on Robotics and Automation (ICRA), pp.1670-1677, 2015. [https://doi.org/10.1109/ICRA.2015.7139412]
C. Hubmann, M. Becker, D. Althoff, D. Lenz, and C. Stiller, “Decision Making for Autonomous Driving Considering Interaction and Uncertain Prediction of Surrounding Vehicles,” 2017 IEEE Intelligent Vehicles Symposium (IV), pp.1671-1678, 2017. [https://doi.org/10.1109/IVS.2017.7995949]
L. Zhang, W. Ding, J. Chen, and S. Shen, “Efficient Uncertainty-Aware Decision-Making for Automated Driving Using Guided Branching,” 2020 IEEE International Conference on Robotics and Automation (ICRA), pp.3291-3297, 2020. [https://doi.org/10.1109/ICRA40945.2020.9197302]
W. Ding, L. Zhang, J. Chen, and S. Shen, “Epsilon: An Efficient Planning System for Automated Vehicles in Highly Interactive Environments,” IEEE Transactions on Robotics, Vol.38, No.2, pp.1118-1138, 2021. [https://doi.org/10.1109/TRO.2021.3104254]
J. Hardy and M. Campbell, “Contingency Planning over Probabilistic Obstacle Predictions for Autonomous Road Vehicles,” IEEE Transactions on Robotics, Vol.29, No.4, pp.913-929, 2013. [https://doi.org/10.1109/TRO.2013.2254033]
W. Zhan, C. Liu, C. Y. Chan, and M. Tomizuka, “A Non-Conservatively Defensive Strategy for Urban Autonomous Driving,” 2016 IEEE 19th International Conference on Intelligent Transportation Systems (ITSC), pp.459-464, 2016. [https://doi.org/10.1109/ITSC.2016.7795595]
T. Li, L. Zhang, S. Liu, and S. Shen, “MARC: Multipolicy and Risk-Aware Contingency Planning for Autonomous Driving,” IEEE Robotics and Automation Letters, 2023.
P. Trautman and A. Krause, “Unfreezing the Robot: Navigation in Dense, Interacting Crowds,” 2010 IEEE/RSJ International Conference on Intelligent Robots and Systems, pp.797-803, 2010. [https://doi.org/10.1109/IROS.2010.5654369]
B. D. Ziebart, A. L. Maas, J. A. Bagnell, and A. K. Dey, “Maximum Entropy Inverse Reinforcement Learning,” AAAI, Vol.8, pp.1433-1438, 2008.
H. Caesar, J. Kabzan, K. S. Tan, W. K. Fong, E. Wolff, A. Lang, L. Fletcher, O. Beijbom, S. Omari (2021). nuplan: A closed-loop ml-based planning benchmark for autonomous vehicles. arXiv preprint arXiv:2106.11810, .

	Prediction ADE (8s)	Prediction FDE (8s)
DTPP⁸⁾	1.2092 m	2.7572 m
Proposed method	0.9341 m	2.1310 m

	Planning ADE (8s)	Planning FDE (8s)
DTPP⁸⁾	1.8094 m	3.5004 m
Proposed method	1.6030 m	1.8323 m