99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

車輛隊(duì)列預(yù)測(cè)巡航控制研究

0
分享至

本期閱讀

文章信息

車輛隊(duì)列預(yù)測(cè)巡航控制研究綜述

褚端峰, 劉鴻祥, 高博麟, 王金湘, 殷國(guó)棟

10.3901/JME.2024.18.218

引用本文:

褚端峰, 劉鴻祥, 高博麟, 王金湘, 殷國(guó)棟. 車輛隊(duì)列預(yù)測(cè)巡航控制研究綜述[J]. 機(jī)械工程學(xué)報(bào), 2024, 60(18): 218-246.

CHU Duanfeng, LIU Hongxiang, GAO Bolin, WANG Jinxiang, YIN Guodong. Survey of Predictive Cruise Control for Vehicle Platooning[J]. Journal of Mechanical Engineering, 2024, 60(18): 218-246.

原文閱讀(摘要)

摘要:車輛隊(duì)列巡航控制主要依據(jù)范圍有限的交通環(huán)境信息,但環(huán)境的高度不確定性會(huì)影響車輛建模精度與控制效果。預(yù)測(cè)巡航控制作為巡航控制的一種演進(jìn),已成為當(dāng)前的研究熱點(diǎn)。為全面分析車輛隊(duì)列預(yù)測(cè)巡航控制的研究進(jìn)展,從交通環(huán)境信息預(yù)測(cè)、隊(duì)列運(yùn)動(dòng)行為決策、隊(duì)內(nèi)車輛軌跡規(guī)劃、車輛軌跡跟蹤控制等4個(gè)方面進(jìn)行概述。首先,介紹車輛隊(duì)列對(duì)交通環(huán)境信息的預(yù)測(cè)研究進(jìn)展,包括采用車路協(xié)同獲取前方道路地理、交通等信息,以及通過(guò)車載傳感器預(yù)測(cè)周邊環(huán)境車輛運(yùn)動(dòng)狀態(tài),重點(diǎn)介紹基于深度學(xué)習(xí)的軌跡預(yù)測(cè)方法研究現(xiàn)狀及發(fā)展趨勢(shì);其次,介紹車輛隊(duì)列協(xié)同行為決策問(wèn)題的研究進(jìn)展,詳細(xì)闡述博弈論與機(jī)器學(xué)習(xí)在協(xié)同行為決策領(lǐng)域的重要作用,指出模型與數(shù)據(jù)混合優(yōu)化的行為決策發(fā)展趨勢(shì);再次,針對(duì)車輛協(xié)同軌跡規(guī)劃問(wèn)題,從模型驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)2個(gè)角度,分別對(duì)當(dāng)前研究進(jìn)行梳理,并說(shuō)明強(qiáng)化學(xué)習(xí)在協(xié)同軌跡規(guī)劃方面具備的優(yōu)勢(shì);然后,從預(yù)測(cè)巡航控制、車輛跟蹤控制等2個(gè)方面,分別闡述車輛軌跡跟蹤控制問(wèn)題,并指出基于數(shù)據(jù)和模型聯(lián)合驅(qū)動(dòng)的車輛跟蹤控制方法具有較大應(yīng)用潛力;最后,總結(jié)車輛隊(duì)列預(yù)測(cè)巡航控制的研究現(xiàn)狀與不足,并對(duì)該領(lǐng)域的未來(lái)發(fā)展趨勢(shì)進(jìn)行展望,為其后續(xù)應(yīng)用提供新思路。

關(guān)鍵詞:自動(dòng)駕駛;車輛隊(duì)列;預(yù)測(cè)巡航控制;機(jī)器學(xué)習(xí);數(shù)據(jù)和模型聯(lián)合驅(qū)動(dòng)

中圖分類號(hào):U469

0

前言

車輛隊(duì)列(Vehicle platooning,VP)在提高交通安全和效率、促進(jìn)節(jié)能環(huán)保等方面均具有重要作用,已成為當(dāng)前研究的熱點(diǎn)。在該領(lǐng)域,國(guó)內(nèi)外相關(guān)科研機(jī)構(gòu)已經(jīng)開(kāi)展了一系列研究,例如美國(guó)加州AHS項(xiàng)目,歐洲SARTRE項(xiàng)目,日本Energy ITS項(xiàng)目,以及荷蘭GCDC項(xiàng)目等。加州大學(xué)伯克利分校PATH研究中心與沃爾沃公司的聯(lián)合研究表明,利用重型車輛隊(duì)列行駛,可將車間距縮短至3~6 m,使得其他車輛在重型車輛之間的換道頻率顯著降低,從而減少事故率,并在6 m間距巡航時(shí)節(jié)能達(dá)到14.5%。

協(xié)同自適應(yīng)巡航控制(Cooperative adaptive cruise control,CACC)是車輛隊(duì)列的典型形式,通過(guò)車-車通信實(shí)現(xiàn)多車協(xié)同自適應(yīng)巡航,有效改善了傳統(tǒng)自適應(yīng)巡航控制(Adaptive cruise control,ACC)系統(tǒng)的反應(yīng)遲滯問(wèn)題,并在保證隊(duì)列穩(wěn)定性的前提下,通過(guò)縮短車間距、降低風(fēng)阻等提高道路通行效率和車輛能效。預(yù)測(cè)巡航控制(Predictive cruise control,PCC)作為CACC的一種演進(jìn),通過(guò)車聯(lián)網(wǎng)、高精地圖等技術(shù),使車輛隊(duì)列能夠預(yù)測(cè)并匹配前方道路的坡度、曲率等地理信息以及擁堵、限速等交通信息,為車輛規(guī)劃合理的路段巡航速度,從而在保證安全性、舒適性的同時(shí)改善燃油經(jīng)濟(jì)性。當(dāng)前,PCC主要將燃油經(jīng)濟(jì)性作為系統(tǒng)優(yōu)化目標(biāo),通常應(yīng)用于單車輔助駕駛,尤其在重型車輛的節(jié)能駕駛方面具有良好應(yīng)用前景。由于車輛隊(duì)列相較于單車在節(jié)能方面具有更為突出的效果,隨著世界各國(guó)節(jié)能減排措施的大力推進(jìn),車輛隊(duì)列PCC已成為國(guó)內(nèi)外學(xué)者的研究焦點(diǎn)。特別地,在大數(shù)據(jù)、新一代人工智能等新興技術(shù)的推動(dòng)下,車輛隊(duì)列PCC將進(jìn)一步推動(dòng)智能駕駛技術(shù)的規(guī)模化應(yīng)用。

在智能網(wǎng)聯(lián)環(huán)境下,將PCC與車輛隊(duì)列相結(jié)合,實(shí)現(xiàn)面向高級(jí)別自動(dòng)駕駛的車輛隊(duì)列預(yù)測(cè)巡航控制,可極大地提高車輛隊(duì)列的行駛性能。近年來(lái),國(guó)內(nèi)外對(duì)車輛隊(duì)列預(yù)測(cè)巡航控制開(kāi)展了相關(guān)研究,主要通過(guò)優(yōu)化控制、魯棒控制等方法,來(lái)實(shí)現(xiàn)隊(duì)列穩(wěn)定性或節(jié)能駕駛。如圖1所示,借助于車路協(xié)同技術(shù)(Vehicle to everything,V2X),PCC可有效增強(qiáng)隊(duì)內(nèi)車輛的“預(yù)測(cè)能力”,使其提前獲取前方道路的地理、交通等信息,并通過(guò)車載傳感器預(yù)測(cè)周邊環(huán)境車輛的運(yùn)動(dòng)狀態(tài),從而實(shí)現(xiàn)行車安全性、經(jīng)濟(jì)性與舒適性等多目標(biāo)優(yōu)化。目前,V2X主要可以分為專用短程通信(Dedicated short range communication,DSRC)與基于蜂窩移動(dòng)通信的V2X(Cellular Vehicle to everything,C-V2X)兩種類型。得益于V2X技術(shù)的快速發(fā)展,隊(duì)內(nèi)車輛可通過(guò)路側(cè)與云端的高精地圖、全球衛(wèi)星導(dǎo)航系統(tǒng)(Global navigation satellite system,GNSS)、車載傳感器等獲得前方道路信息及車輛當(dāng)前位置,進(jìn)行融合處理后,輸入給隊(duì)內(nèi)車輛的預(yù)測(cè)、決策、規(guī)劃與控制模塊,實(shí)現(xiàn)車輛隊(duì)列的預(yù)測(cè)巡航控制。


車輛隊(duì)列在實(shí)際行駛過(guò)程中,會(huì)受到周圍環(huán)境車輛的干擾,需要考慮環(huán)境車輛在執(zhí)行切入/切出隊(duì)列、換道、超車、緊急制動(dòng)等行為,以及前方道路條件變化(如匝道、收費(fèi)站、施工區(qū))等外界激勵(lì)對(duì)多車協(xié)作狀態(tài)演化的影響,涉及軌跡預(yù)測(cè)、行為決策、軌跡規(guī)劃、跟蹤控制等4個(gè)方面的耦合研究。因此,本文從環(huán)境車輛運(yùn)動(dòng)軌跡預(yù)測(cè)、隊(duì)列運(yùn)動(dòng)行為決策、隊(duì)內(nèi)車輛軌跡規(guī)劃、車輛軌跡跟隨控制方面,對(duì)國(guó)內(nèi)外現(xiàn)有相關(guān)研究成果進(jìn)行綜述與分析。

1

研究問(wèn)題描述

車輛隊(duì)列預(yù)測(cè)巡航控制是涵蓋“預(yù)測(cè)、決策、規(guī)劃、跟蹤”等多個(gè)關(guān)聯(lián)環(huán)節(jié)的復(fù)雜耦合系統(tǒng),具體示意圖如圖2所示。在動(dòng)態(tài)交通環(huán)境中,車輛隊(duì)列須根據(jù)前方道路信息,合理計(jì)算隊(duì)列巡航速度、間距,并實(shí)時(shí)預(yù)測(cè)周邊環(huán)境車輛運(yùn)動(dòng)態(tài)勢(shì),以實(shí)現(xiàn)隊(duì)列巡航速度、間距和隊(duì)形變換的準(zhǔn)確決策;再對(duì)隊(duì)內(nèi)車輛的運(yùn)動(dòng)軌跡進(jìn)行實(shí)時(shí)規(guī)劃,輸出期望運(yùn)動(dòng)狀態(tài),最后,由車輛動(dòng)力學(xué)控制系統(tǒng)對(duì)期望運(yùn)動(dòng)狀態(tài)予以精確跟蹤。值得注意的是,安全性、經(jīng)濟(jì)性、舒適性作為車輛隊(duì)列的重要評(píng)價(jià)指標(biāo),對(duì)隊(duì)列整體運(yùn)行狀態(tài)起著至關(guān)重要的作用。因此,在決策、規(guī)劃、控制等環(huán)節(jié)中,需實(shí)現(xiàn)車輛隊(duì)列預(yù)測(cè)巡航控制的多目標(biāo)優(yōu)化。


同時(shí),由于道路環(huán)境復(fù)雜多變,車輛隊(duì)列在行駛過(guò)程中,易受到眾多外界因素的干擾,導(dǎo)致實(shí)際運(yùn)行效果不佳。因此,確定車輛隊(duì)列行駛中最具代表性的影響因素,并對(duì)其特征狀態(tài)進(jìn)行分類提取,對(duì)改善隊(duì)列行駛效果具有重要意義。基于主成分分析等統(tǒng)計(jì)學(xué)方法,結(jié)合現(xiàn)有研究經(jīng)驗(yàn),確定前方道路坡度、曲率、路面附著條件、環(huán)境車狀態(tài)、天氣、限速等作為影響隊(duì)列行駛的代表性因素;通過(guò)提取影響因素的特征狀態(tài),構(gòu)建特征參數(shù)集,可為車輛隊(duì)列的運(yùn)動(dòng)行為決策提供高精度、高可靠的地理與交通數(shù)據(jù)支撐。

車輛隊(duì)列預(yù)測(cè)巡航控制作為一個(gè)高度復(fù)雜的非線性耦合系統(tǒng),為有效改善車輛隊(duì)列控制效果,面臨一系列的挑戰(zhàn)。

(1) 真實(shí)交通場(chǎng)景復(fù)雜多變,使得動(dòng)態(tài)交通目標(biāo)的運(yùn)動(dòng)態(tài)勢(shì)易受到行駛環(huán)境、駕駛意圖,以及其他交通參與者等因素影響,導(dǎo)致動(dòng)態(tài)交通目標(biāo)運(yùn)動(dòng)軌跡存在高度不確定性。因此,準(zhǔn)確的動(dòng)態(tài)交通目標(biāo)軌跡預(yù)測(cè)應(yīng)具備處理不確定性的能力,即在充分考慮道路交通條件、駕駛意圖、其他交通參與者等先驗(yàn)或后驗(yàn)信息的基礎(chǔ)上,實(shí)現(xiàn)多目標(biāo)群體軌跡預(yù)測(cè),是預(yù)測(cè)巡航控制的研究難點(diǎn)。

(2) 在動(dòng)態(tài)交通環(huán)境中,受自身因素與外界條件激勵(lì),隊(duì)內(nèi)車輛需改變多車協(xié)作狀態(tài),以實(shí)現(xiàn)車輛間狀態(tài)演化與變遷,具有顯著的交互性。因此,如何在動(dòng)態(tài)交通環(huán)境下對(duì)隊(duì)列組合與分離、隊(duì)列換道與超車等多車協(xié)作行為以及隊(duì)列加速與減速等車輛隊(duì)列保持行為進(jìn)行協(xié)同決策,以實(shí)現(xiàn)安全性、經(jīng)濟(jì)性、舒適性等多目標(biāo)最優(yōu),是車輛隊(duì)列預(yù)測(cè)巡航控制的關(guān)鍵。

(3) 基于物理建模的傳統(tǒng)車輛控制方法具有良好的可解釋性和控制安全性,但其性能依賴模型精度與參數(shù)標(biāo)定,而深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等機(jī)器學(xué)習(xí)方法雖能有效改善上述缺陷,但算法可解釋性弱且控制安全性低。因此,如何將基于數(shù)據(jù)與模型的控制方法融合,構(gòu)建數(shù)據(jù)與模型聯(lián)合驅(qū)動(dòng)的高效學(xué)習(xí)機(jī)制,使控制系統(tǒng)具備學(xué)習(xí)能力,實(shí)現(xiàn)不同方法間的優(yōu)勢(shì)互補(bǔ),是隊(duì)列控制亟待解決的難題。

針對(duì)上述3個(gè)方面的挑戰(zhàn),本文面向結(jié)構(gòu)化道路下的車輛隊(duì)列預(yù)測(cè)巡航控制,對(duì)現(xiàn)有研究現(xiàn)狀進(jìn)行概述總結(jié),并對(duì)發(fā)展趨勢(shì)進(jìn)行展望。

2

環(huán)境車輛運(yùn)動(dòng)軌跡預(yù)測(cè)

通過(guò)對(duì)周圍環(huán)境車輛的運(yùn)動(dòng)狀態(tài)信息進(jìn)行預(yù)測(cè)是車輛隊(duì)列能夠從安全性、經(jīng)濟(jì)性、舒適性的多目標(biāo)優(yōu)化角度做出準(zhǔn)確決策與規(guī)劃的必要前提。在真實(shí)交通場(chǎng)景中,以環(huán)境車輛為代表的交通參與者會(huì)對(duì)自動(dòng)駕駛車輛的決策與規(guī)劃產(chǎn)生重要影響,然而,環(huán)境車輛的運(yùn)動(dòng)狀態(tài)受道路結(jié)構(gòu)、交通規(guī)則與標(biāo)識(shí)等先驗(yàn)及駕駛員駕駛風(fēng)格、其他動(dòng)態(tài)交通參與者等后驗(yàn)信息的影響,導(dǎo)致未來(lái)一段時(shí)刻內(nèi)的運(yùn)動(dòng)狀態(tài)具有高度不確定性特征,且當(dāng)不具備V2V通信功能時(shí),智能車輛無(wú)法準(zhǔn)確獲取其下一時(shí)刻的駕駛行為。如圖3所示,為便于對(duì)目標(biāo)車輛預(yù)測(cè)軌跡進(jìn)行準(zhǔn)確描述,做出如下定義:預(yù)測(cè)未來(lái)運(yùn)動(dòng)軌跡的車輛為目標(biāo)車輛(Target vehicle,TV);需獲取目標(biāo)車輛預(yù)測(cè)軌跡的車輛為自車(Ego vehicle,EV);在半徑為d的圓內(nèi)可能影響目標(biāo)車輛未來(lái)運(yùn)動(dòng)態(tài)勢(shì)的車輛為周圍車輛(Surrounding vehicle,SV);在該范圍以外,不會(huì)對(duì)目標(biāo)車輛造成影響的車輛為無(wú)關(guān)車輛(Non-effective vehicle,NV)。


由上述分析可知,環(huán)境車輛軌跡預(yù)測(cè)是一個(gè)極具挑戰(zhàn)性的問(wèn)題,經(jīng)驗(yàn)豐富的人類駕駛員可以在復(fù)雜行駛環(huán)境中預(yù)測(cè)周圍車輛的駕駛意圖與未來(lái)行駛軌跡,避免在執(zhí)行車道保持以及換道、超車等行為時(shí)發(fā)生碰撞。然而,現(xiàn)階段自動(dòng)駕駛車輛在預(yù)測(cè)周圍環(huán)境車輛的運(yùn)動(dòng)軌跡時(shí)會(huì)受到諸多因素的影響,致使難以達(dá)到預(yù)期效果。例如:① 車輛行駛時(shí)具有顯著交互性特征,即周圍車輛的運(yùn)動(dòng)狀態(tài)會(huì)影響目標(biāo)車輛的預(yù)測(cè)軌跡,反之,目標(biāo)車輛的運(yùn)動(dòng)狀態(tài)也會(huì)影響周圍其他車輛的未來(lái)行駛軌跡,因此,若只根據(jù)目標(biāo)車輛的歷史軌跡數(shù)據(jù)進(jìn)行預(yù)測(cè),往往會(huì)導(dǎo)致預(yù)測(cè)結(jié)果存在偏差;② 車輛在結(jié)構(gòu)化道路上行駛時(shí),道路幾何結(jié)構(gòu)、交通規(guī)則與道路標(biāo)識(shí)等先驗(yàn)信息也會(huì)對(duì)目標(biāo)車輛的預(yù)測(cè)軌跡造成影響;③ 部分車輛軌跡預(yù)測(cè)算法設(shè)計(jì)復(fù)雜,對(duì)計(jì)算設(shè)備算力需求較高,而車載計(jì)算設(shè)備存在計(jì)算資源受限問(wèn)題,導(dǎo)致實(shí)車測(cè)試中效果欠佳。本文利用CiteSpace文獻(xiàn)計(jì)量軟件對(duì)車輛軌跡預(yù)測(cè)領(lǐng)域的研究進(jìn)行可視化分析(圖4),并根據(jù)研究方法不同,從車輛物理模型、駕駛行為、深度學(xué)習(xí)3個(gè)方面對(duì)環(huán)境車輛運(yùn)動(dòng)軌跡預(yù)測(cè)研究現(xiàn)狀進(jìn)行闡述。


2.1 基于車輛物理模型的軌跡預(yù)測(cè)方法

在早期的車輛軌跡預(yù)測(cè)研究中,基于車輛物理模型的軌跡預(yù)測(cè)方法因其具有結(jié)構(gòu)簡(jiǎn)單,計(jì)算快速等特點(diǎn)得到了廣泛應(yīng)用。車輛物理模型方法可分為車輛運(yùn)動(dòng)學(xué)模型、車輛動(dòng)力學(xué)模型兩種,根據(jù)控制輸入(如轉(zhuǎn)向盤轉(zhuǎn)角、加速度等),車輛特性(如車重)以及外界條件(如道路附著系數(shù))對(duì)位置、航向角以及速度等車輛狀態(tài)進(jìn)行預(yù)測(cè)。

動(dòng)力學(xué)模型方法通過(guò)考慮影響車輛運(yùn)動(dòng)狀態(tài)的外力,并基于拉格朗日方程描述車輛未來(lái)的運(yùn)動(dòng)狀態(tài),但由于動(dòng)力學(xué)模型較為復(fù)雜,因此通常采用車輛二自由度模型進(jìn)行車輛軌跡預(yù)測(cè)。運(yùn)動(dòng)學(xué)模型基于位置、速度、加速度等車輛運(yùn)動(dòng)參數(shù)間的數(shù)學(xué)關(guān)系描述車輛運(yùn)動(dòng),忽略了外力對(duì)運(yùn)動(dòng)狀態(tài)的影響,且為提高計(jì)算效率并降低求解難度,在軌跡預(yù)測(cè)過(guò)程中,基于車輛運(yùn)動(dòng)學(xué)模型的預(yù)測(cè)方法通常均假設(shè)車輛某些運(yùn)動(dòng)狀態(tài)量保持不變,例如:當(dāng)速度、加速度、橫擺率、曲率等變量為恒值時(shí),可建立固定速度(Constant velocity,CV)、固定加速度(Constant acceleration,CA)、固定橫擺率(Constant turn rate,CTR)、固定橫擺率與速度(Constant turn rate and velocity,CTRV)、固定橫擺率與加速度(Constant turn rate and acceleration,CTRA)、固定曲率與加速度(Constant curvature and acceleration,CCA)等運(yùn)動(dòng)學(xué)模型。

基于車輛物理模型的軌跡預(yù)測(cè)方法具有結(jié)構(gòu)簡(jiǎn)單、計(jì)算效率高等優(yōu)點(diǎn),能夠較為準(zhǔn)確且快速的預(yù)測(cè)未來(lái)1 s內(nèi)的車輛軌跡變化結(jié)果,但由于在預(yù)測(cè)時(shí)間內(nèi)假設(shè)控制輸入變量為定值,忽略了車輛狀態(tài)連續(xù)變化、駕駛環(huán)境不確定性、道路結(jié)構(gòu)、交通規(guī)則、駕駛主觀意圖等先驗(yàn)和后驗(yàn)信息對(duì)預(yù)測(cè)結(jié)果的影響,導(dǎo)致車輛軌跡長(zhǎng)期預(yù)測(cè)結(jié)果較差,無(wú)法滿足復(fù)雜交通工況下的行車安全需求。上述方法忽略了車輛當(dāng)前狀態(tài)的不確定性,且假設(shè)物理模型足夠精確。針對(duì)由噪聲、傳感器誤差等引起的預(yù)測(cè)不確定性問(wèn)題,常用卡爾曼濾波和蒙特卡洛等方法對(duì)車輛狀態(tài)變量不確定性進(jìn)行建模,以改善車輛運(yùn)動(dòng)軌跡的預(yù)測(cè)精度。

2.2 基于駕駛行為的軌跡預(yù)測(cè)方法

基于駕駛行為的軌跡預(yù)測(cè)方法通過(guò)對(duì)加速、減速、換道、跟馳、左轉(zhuǎn)、右轉(zhuǎn)等駕駛行為進(jìn)行辨識(shí)以預(yù)測(cè)車輛未來(lái)運(yùn)動(dòng)軌跡。相較于物理模型的車輛軌跡預(yù)測(cè)方法,該方法通過(guò)對(duì)駕駛員駕駛意圖進(jìn)行辨識(shí)可使長(zhǎng)時(shí)預(yù)測(cè)結(jié)果更加精準(zhǔn)、可靠。當(dāng)前,基于駕駛行為的軌跡預(yù)測(cè)方法可分為駕駛軌跡法和駕駛意圖辨識(shí)法2種。

2.2.1 駕駛軌跡法

駕駛軌跡法主要包括原型軌跡和高斯過(guò)程,通過(guò)對(duì)車輛歷史軌跡序列數(shù)據(jù)進(jìn)行學(xué)習(xí),以預(yù)測(cè)車輛未來(lái)軌跡變化。原型軌跡法的主要思想為將目標(biāo)車輛歷史軌跡與駕駛軌跡學(xué)習(xí)庫(kù)中的軌跡進(jìn)行相似度對(duì)比,在尋找到最相似軌跡后,將駕駛軌跡集中的軌跡運(yùn)動(dòng)狀態(tài)作為目標(biāo)車輛的預(yù)測(cè)軌跡。其中,常見(jiàn)的軌跡相似度量指標(biāo)主要包括平均歐拉距 離、Hausdorff距離、最長(zhǎng)公共子序列(Longest common subsequence,LCS)距離、四元旋轉(zhuǎn)不變最長(zhǎng)公共子序列(Quaternion-based rotationally invariant LCS,QRILCS)等。高斯過(guò)程是函數(shù)空間中高斯概率分布的推廣,利用高斯過(guò)程對(duì)車輛軌跡進(jìn)行建模,以概率方式將車輛軌跡表示為連續(xù)函數(shù),與原型軌跡方法相比,基于高斯過(guò)程的軌跡預(yù)測(cè)方法能夠更好地處理觀測(cè)軌跡中的噪聲,具有更強(qiáng)的魯棒性,但該方法并未考慮車輛物理約束。

2.2.2 駕駛意圖辨識(shí)法

基于駕駛意圖識(shí)別的車輛軌跡預(yù)測(cè)方法通過(guò)準(zhǔn)確辨識(shí)目標(biāo)車輛未來(lái)時(shí)刻的駕駛意圖,并將識(shí)別結(jié)果轉(zhuǎn)化為時(shí)空維度的車輛預(yù)測(cè)軌跡,使智能車輛做出更加合理的駕駛行為決策與軌跡規(guī)劃。駕駛意圖識(shí)別問(wèn)題本質(zhì)上是對(duì)駕駛員行為進(jìn)行模式識(shí)別和狀態(tài)監(jiān)測(cè),其概念最早由麻省理工學(xué)院PENTLAND等于1997年提出,首次將隱馬爾科夫模型應(yīng)用于駕駛意圖辨識(shí),并進(jìn)行了駕駛模擬器和實(shí)車驗(yàn)證,為后續(xù)研究奠定了理論基礎(chǔ)。駕駛員意圖識(shí)別主要通過(guò)對(duì)車輛狀態(tài)信息(如車輛位置、速度、加速度、航向角、方向盤轉(zhuǎn)角、油門與剎車踏板開(kāi)度等)、駕駛員生理行為信息(如頭部與眼部特征、生物電信號(hào)、生理情緒等)、交通狀況信息(如道路結(jié)構(gòu)、交通信號(hào)與規(guī)則、其他交通參與者等)進(jìn)行綜合分析,以準(zhǔn)確識(shí)別換道、轉(zhuǎn)向、加速、制動(dòng)、超車等駕駛意圖,并應(yīng)用于車輛軌跡預(yù)測(cè)。目前,常用的駕駛意圖識(shí)別模型主要包括生成模型、判別模型、深度學(xué)習(xí)模型、認(rèn)知模型、規(guī)則模型、半監(jiān)督模型共6種類型,具體分類如表1所示。


快速隨機(jī)搜索樹(shù)(Rapidly exploring random tree,RRT)和GP可以概率搜索駕駛行為的運(yùn)動(dòng)軌跡,以體現(xiàn)預(yù)測(cè)的不確定性。基于駕駛行為的預(yù)測(cè)方法,其長(zhǎng)時(shí)預(yù)測(cè)結(jié)果較好,但存在短時(shí)預(yù)測(cè)結(jié)果不佳的缺點(diǎn)。為提高長(zhǎng)短時(shí)軌跡預(yù)測(cè)精度,XIE等提出考慮駕駛行為與車輛物理模型的軌跡預(yù)測(cè)方法,通過(guò)將駕駛行為長(zhǎng)期預(yù)測(cè)優(yōu)勢(shì)與物理模型短期預(yù)測(cè)相結(jié)合,利用交互多模型(Interactive multiple model,IMM)方法對(duì)駕駛意圖進(jìn)行辨識(shí),以提高軌跡預(yù)測(cè)的準(zhǔn)確性,但忽略了道路結(jié)構(gòu)、其他動(dòng)態(tài)交通參與者等先驗(yàn)與后驗(yàn)信息。同時(shí),該研究團(tuán)隊(duì)還構(gòu)建了基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)和分布式遺傳算法的駕駛行為辯識(shí)模型,以預(yù)測(cè)不同交通場(chǎng)景下的車輛駕駛行為,但并未考慮車輛間的交互性。為準(zhǔn)確預(yù)測(cè)車輛換道意圖,TANG等利用車輛傳感器融合信息,提出了一種基于自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)(Adaptive fuzzy neural network,AFNN)的車輛換道意圖預(yù)測(cè)方法,其中預(yù)測(cè)模型包括基于Takagi- Sugeno模糊推理的模糊神經(jīng)網(wǎng)絡(luò)以及更新隸屬度函數(shù)和規(guī)則庫(kù)的自適應(yīng)學(xué)習(xí)算法。在駕駛模擬器上進(jìn)行了不同速度下的測(cè)試驗(yàn)證,并與神經(jīng)網(wǎng)絡(luò)(Neural network,NN)、支持向量機(jī)(Support vector machine,SVM)、多變量線性回歸等進(jìn)行對(duì)比測(cè)試,預(yù)測(cè)結(jié)果表明,相較于對(duì)比方法,所提出方法具有更高的預(yù)測(cè)精度。

相較于車輛物理模型方法,基于駕駛行為的軌跡預(yù)測(cè)能夠更加準(zhǔn)確地預(yù)測(cè)車輛軌跡,且長(zhǎng)時(shí)預(yù)測(cè)效果更加精準(zhǔn)、可靠。但由于忽略了與其他動(dòng)態(tài)交通參與者間的交互關(guān)系,可能導(dǎo)致在部分復(fù)雜交通場(chǎng)景下軌跡預(yù)測(cè)結(jié)果失準(zhǔn),且短時(shí)預(yù)測(cè)結(jié)果不佳。

2.3 基于深度學(xué)習(xí)的軌跡預(yù)測(cè)方法

近年來(lái),機(jī)器學(xué)習(xí)技術(shù)蓬勃發(fā)展,為處理連續(xù)、高維的狀態(tài)空間提供了可能,相較于上述兩種類型的車輛軌跡預(yù)測(cè)方法,基于深度學(xué)習(xí)的預(yù)測(cè)模型不僅可用于常規(guī)場(chǎng)景下的軌跡預(yù)測(cè),同時(shí)可實(shí)現(xiàn)在復(fù)雜環(huán)境中對(duì)目標(biāo)車輛軌跡進(jìn)行精準(zhǔn)預(yù)測(cè)。通過(guò)有效學(xué)習(xí)駕駛場(chǎng)景中的先驗(yàn)與后驗(yàn)知識(shí),根據(jù)目標(biāo)及周圍車輛的歷史觀測(cè)信息輸出多模態(tài)預(yù)測(cè)軌跡。軌跡預(yù)測(cè)方法主要有長(zhǎng)短期記憶網(wǎng)絡(luò)(Long-short term memory,LSTM)、注意力機(jī)制、門控循環(huán)單元(Gated recurrent unit,GRU)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)、生成性對(duì)抗網(wǎng)絡(luò)(Generative adversarial network,GAN)、圖神經(jīng)網(wǎng)絡(luò)(Graph neural networks,GNN)等。需要注意的是,DL方法性能很大程度上取決于數(shù)據(jù)集中訓(xùn)練數(shù)據(jù)的數(shù)量與質(zhì)量,因此,選取適當(dāng)?shù)臄?shù)據(jù)集尤為重要。車輛軌跡預(yù)測(cè)常用數(shù)據(jù)集包括美國(guó)NGSIM數(shù)據(jù)集(高速公路)、美國(guó)加州伯克利大學(xué)INTERACTION數(shù)據(jù)集、德國(guó)HighD數(shù)據(jù)集(高速公路)、德國(guó)亞琛工業(yè)大學(xué)InD與RounD數(shù)據(jù)集、德國(guó)KITTI數(shù)據(jù)集、谷歌Waymo數(shù)據(jù)集、清華大學(xué)Mirror-Traffic數(shù)據(jù)集、東南大學(xué)Ubiquitous Traffic Eyes數(shù)據(jù)集、同濟(jì)大學(xué)TJRD TS數(shù)據(jù)集等。

2.3.1 循環(huán)神經(jīng)網(wǎng)絡(luò)

車輛運(yùn)動(dòng)軌跡預(yù)測(cè)可以視為時(shí)間序列的分類或生成任務(wù),循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN)考慮時(shí)間與空間變量的相互作用關(guān)系,對(duì)時(shí)序特征顯著的車輛軌跡數(shù)據(jù)具有一定的預(yù)測(cè)效果,但由于RNN無(wú)法有效處理長(zhǎng)時(shí)域狀態(tài)信息,且存在梯度消失與梯度爆炸問(wèn)題,因此國(guó)內(nèi)外學(xué)者普遍采用LSTM、GRU等改進(jìn)RNN以預(yù)測(cè)車輛運(yùn)動(dòng)軌跡。LSTM作為一種能夠?qū)W習(xí)長(zhǎng)期依賴關(guān)系的RNN模型,可以通過(guò)記憶機(jī)制有效改善RNN存在的梯度消失、梯度爆炸等問(wèn)題。相較于GRU,LSTM在車輛行為預(yù)測(cè)領(lǐng)域更具代表性。KIM等考慮周圍環(huán)境車輛的運(yùn)動(dòng)狀態(tài),利用LSTM模型預(yù)測(cè)目標(biāo)車輛運(yùn)動(dòng)軌跡,并在占據(jù)柵格地圖中表示預(yù)測(cè)位置的概率信息,結(jié)果表明該方法比卡爾曼濾波具有更好的預(yù)測(cè)精度。為實(shí)現(xiàn)高速公路場(chǎng)景下的多模態(tài)軌跡預(yù)測(cè),DEO等提出了一種用于高速公路環(huán)境的車輛交互感知與運(yùn)動(dòng)預(yù)測(cè)LSTM模型(圖5),通過(guò)將目標(biāo)車輛與周圍環(huán)境車輛的歷史軌跡以及高速公路車道結(jié)構(gòu)作為輸入,預(yù)測(cè)未來(lái)5 s內(nèi)車輛運(yùn)動(dòng)軌跡的多模態(tài)概率分布。同時(shí),該研究團(tuán)隊(duì)為豐富BEV圖像中的時(shí)間信息,設(shè)計(jì)了改進(jìn)社交池化層的LSTM模型,可推理車輛間的空間依賴關(guān)系。為實(shí)時(shí)預(yù)測(cè)密集和異構(gòu)道路交通中目標(biāo)物體的運(yùn)動(dòng)軌跡,CHANDRA等基于CNN-LSTM混合網(wǎng)絡(luò)設(shè)計(jì)了一種新型預(yù)測(cè)算法TraPHic,可利用2~4 s的歷史軌跡預(yù)測(cè)未來(lái)3~5 s內(nèi)的智能體運(yùn)動(dòng)軌跡。相似地,XIE等利用CNN空間擴(kuò)展與LSTM時(shí)間擴(kuò)展的特點(diǎn),構(gòu)建了基于序列模型的車輛軌跡預(yù)測(cè)方法,并根據(jù)網(wǎng)格搜索算法優(yōu)化模型超參數(shù),滿足空間與時(shí)間上的雙精度預(yù)測(cè)要求。進(jìn)一步,LI等將聚類卷積與LSTM相融合,提出了聚類卷積LSTM(Clustering convolution-LSTM,CC-LSTM)車輛軌跡預(yù)測(cè)模型,利用模糊聚類對(duì)周圍車輛相似軌跡進(jìn)行聚類,以獲取軌跡時(shí)間特征并輸入到LSTM實(shí)現(xiàn)預(yù)測(cè)。


需注意的是,當(dāng)周圍車輛歷史軌跡特征不顯著時(shí),往往無(wú)法體現(xiàn)對(duì)目標(biāo)車輛軌跡的影響。因此,僅依靠目標(biāo)車輛與周圍車輛的歷史軌跡進(jìn)行軌跡預(yù)測(cè)可能導(dǎo)致錯(cuò)誤的預(yù)測(cè)結(jié)果,因此,神經(jīng)網(wǎng)絡(luò)模型在考慮交互性軌跡預(yù)測(cè)的基礎(chǔ)上,還需要進(jìn)一步考慮駕駛意圖對(duì)預(yù)測(cè)結(jié)果的影響。為有效地提高強(qiáng)交互駕駛環(huán)境下的車輛軌跡預(yù)測(cè)精度,XIN等提出一種利用雙長(zhǎng)短期記憶(Dual LSTM,DLSTM)網(wǎng)絡(luò)對(duì)周圍車輛進(jìn)行長(zhǎng)時(shí)間軌跡預(yù)測(cè)的算法,DLSTM分別用于駕駛意圖辨識(shí)和車輛軌跡預(yù)測(cè)。真實(shí)公路行駛數(shù)據(jù)的測(cè)試結(jié)果表明,所提出方法可以在5 s內(nèi)輸出更加準(zhǔn)確、合理的預(yù)測(cè)軌跡。在此基礎(chǔ)上,為進(jìn)一步提高預(yù)測(cè)結(jié)果的可靠性與模型魯棒性,季學(xué)武等考慮高速公路場(chǎng)景下車輛間的交互性與駕駛意圖,基于LSTM網(wǎng)絡(luò)設(shè)計(jì)了一種駕駛意圖識(shí)別與軌跡預(yù)測(cè)模型。其中,軌跡預(yù)測(cè)模型中的編碼器將車輛歷史軌跡編碼為上下文向量,并結(jié)合駕駛意圖輸入到解碼器中,最后通過(guò)混合密度網(wǎng)絡(luò)(Mixture density network,MDN)輸出車輛預(yù)測(cè)軌跡的概率分布。利用NGSIM數(shù)據(jù)集將所提方法與CTRA預(yù)測(cè)模型以及其他模型進(jìn)行對(duì)比,結(jié)果顯示可有效提高車輛長(zhǎng)時(shí)域軌跡預(yù)測(cè)精度。此外,CHOI等提出了基于隨機(jī)森林和LSTM相結(jié)合的車輛軌跡預(yù)測(cè)模型,隨機(jī)森林用于預(yù)測(cè)目標(biāo)車輛周圍其他車輛的車道變更意圖,并將駕駛意圖輸入到LSTM網(wǎng)絡(luò)模型中獲得車輛預(yù)測(cè)軌跡,為驗(yàn)證所提方法的有效性,利用測(cè)試車輛采集了932條車輛軌跡,并在不同場(chǎng)景下進(jìn)行了測(cè)試驗(yàn)證。

為實(shí)現(xiàn)城市交叉口車輛軌跡的準(zhǔn)確預(yù)測(cè),HUANG等提出了一種基于交叉口上下文關(guān)系的交通網(wǎng)絡(luò)建模算法,并利用雙向門控循環(huán)單元(Bidirectional GRU,BiGRU)預(yù)測(cè)單軌跡上的交叉口序列,該方法不僅可以屏蔽真實(shí)交通網(wǎng)絡(luò)的復(fù)雜拓?fù)浣Y(jié)構(gòu),而且可以突出真實(shí)車輛軌跡中各交叉口間的關(guān)系。相似地,ZHI等利用BiGRU提取軌跡歷史序列中的運(yùn)動(dòng)信息,在學(xué)習(xí)車輛運(yùn)動(dòng)中的相互依賴性后,使用GRU解碼器模型進(jìn)行軌跡預(yù)測(cè)。為同時(shí)對(duì)多個(gè)車輛進(jìn)行軌跡預(yù)測(cè),SHENG等提出了一種基于圖的時(shí)空卷積網(wǎng)絡(luò)(Graph-based spatial- temporal convolutional network,GSTCN),該網(wǎng)絡(luò)使用圖卷積網(wǎng)絡(luò)(Graph convolutional network,GCN)處理空間交互,并使用CNN捕獲時(shí)間特征,時(shí)空特征由GRU進(jìn)行編碼和解碼,以生成未來(lái)軌跡分布。

2.3.2 注意力機(jī)制

注意力機(jī)制作為一種擬人化技術(shù),近年來(lái)已應(yīng)用于自然語(yǔ)言處理、圖像處理等領(lǐng)域,但在車輛軌跡預(yù)測(cè)方面的研究仍較少。該機(jī)制通過(guò)借鑒人類視覺(jué)特征,可在有限計(jì)算資源下提高編碼器對(duì)周圍車輛運(yùn)動(dòng)信息的編碼效率,有效增強(qiáng)預(yù)測(cè)算法性能。針對(duì)城市密集交通環(huán)境中的軌跡預(yù)測(cè)問(wèn)題,MESSAOUD等同時(shí)考慮交通場(chǎng)景、目標(biāo)車輛及周圍車輛間的相互作用,提出了一種考慮多頭注意力機(jī)制的車輛軌跡預(yù)測(cè)方法。其中,CNN將地圖圖像轉(zhuǎn)換為場(chǎng)景特征的3D張量,每個(gè)注意力頭都模擬了目標(biāo)車輛和組合上下文特征之間可能的交互方式,LSTM解碼器接收上下文向量和目標(biāo)車輛編碼,并根據(jù)每個(gè)上下文在可能的預(yù)測(cè)軌跡上生成多模態(tài)概率分布。此外,為解決異構(gòu)環(huán)境下的軌跡預(yù)測(cè)問(wèn)題,LAI等將GAN與注意力機(jī)制相結(jié)合,提出了一種異構(gòu)環(huán)境下的改進(jìn)生成對(duì)抗網(wǎng)絡(luò)(Attended ecology embedding-generative adversarial networks,AEE-GAN),通過(guò)Info-GAN結(jié)構(gòu)獲得具有循環(huán)反饋的多模態(tài)預(yù)測(cè)軌跡(圖6)。現(xiàn)有RNN編碼-解碼模型通常存在未考慮歷史信息記錄衰減導(dǎo)致的誤差累積以及歷史軌跡信息交互等問(wèn)題,田彥濤 等將GRU用于編碼-解碼模型,設(shè)計(jì)了一種深度交互的周車軌跡預(yù)測(cè)模型,通過(guò)對(duì)歷史社交向量進(jìn)行編碼,使模型學(xué)習(xí)車輛的歷史相對(duì)位置變化,并在解碼器中引入注意力機(jī)制以降低預(yù)測(cè)誤差,提高對(duì)周圍車輛信息的編碼效率,輸出更符合真實(shí)駕駛員的多模態(tài)預(yù)測(cè)軌跡。進(jìn)一步地,為了對(duì)不同交通場(chǎng)景下的交互進(jìn)行建模,YE等結(jié)合圖自注意力層與GRU層構(gòu)建了圖自注意力網(wǎng)絡(luò)(Graph Self-Attention Network,GSAN)模型,通過(guò)預(yù)訓(xùn)練和微調(diào)組成的框架來(lái)學(xué)習(xí)車輛間的時(shí)空交互關(guān)系,并對(duì)軌跡預(yù)測(cè)與換道分類進(jìn)行了驗(yàn)證測(cè)試。


Transformer網(wǎng)絡(luò)是Google在2017年提出的一種seq2seq模型,該模型采用自注意力機(jī)制實(shí)現(xiàn)快速并行計(jì)算,可有效避免RNN訓(xùn)練速度較慢、無(wú)法并行處理等弊端,目前已在自然語(yǔ)言處理、圖像處理等領(lǐng)域取得了顯著效果,在車輛軌跡預(yù)測(cè)方面同樣具有較大潛力。為解決密集城市交通環(huán)境中異質(zhì)車輛軌跡預(yù)測(cè)問(wèn)題,CHEN等考慮車輛在時(shí)空上的交互性,提出了時(shí)空變換網(wǎng)絡(luò)(Spatio-temporal transformer networks,S2TNet)預(yù)測(cè)方法,通過(guò)時(shí)空變換來(lái)模擬時(shí)空交互。在ApolloScape軌跡數(shù)據(jù)集上,所提出的方法在平均位移誤差和最終位移誤差的加權(quán)和方面均有顯著優(yōu)化。多模態(tài)車輛運(yùn)動(dòng)軌跡預(yù)測(cè)對(duì)于提高自動(dòng)駕駛安全性起著至關(guān)重要的作用,LIU 等基于Transformer體系結(jié)構(gòu)設(shè)計(jì)了一種端到端多模態(tài)運(yùn)動(dòng)預(yù)測(cè)模型(Multimodal Transformer),該模型可以看作是多重Transformer的堆疊,其中車輛歷史軌跡、道路信息、社會(huì)交互通過(guò)Transformer實(shí)現(xiàn)分層聚合,基于區(qū)域的訓(xùn)練策略確保了預(yù)測(cè)軌跡的多模態(tài)性。進(jìn)一步,LI等提出了一種基于空間交互感知的Transformer軌跡預(yù)測(cè)模型,該模型利用雙重多頭自注意力機(jī)制來(lái)獲取相鄰車輛的空間交互和軌跡的時(shí)間依賴性。此外,與只考慮編碼和解碼階段觀測(cè)軌跡之間的空間相互作用的方法不同,該模型還考慮了解碼過(guò)程中未來(lái)軌跡之間的潛在空間相互作用,NGSIM數(shù)據(jù)集評(píng)估結(jié)果顯示,該模型在長(zhǎng)期預(yù)測(cè)中有更好的預(yù)測(cè)精度。

2.3.3 其他方法

除上述方法外,GAN、GNN等方法也被應(yīng)用于解決環(huán)境車輛軌跡預(yù)測(cè)問(wèn)題,并取得了良好的預(yù)測(cè)效果。

GAN作為一種基于最小最大原則的無(wú)監(jiān)督學(xué)習(xí)方法,最早由Goodfellow于2014年提出。針對(duì)城市環(huán)境下的高精度車輛軌跡預(yù)測(cè)問(wèn)題,ZHAO等提出了一種改進(jìn)GAN軌跡預(yù)測(cè)方法。其中,判別網(wǎng)絡(luò)由兩個(gè)獨(dú)立的網(wǎng)絡(luò)組成,分別用于接收生成網(wǎng)絡(luò)的輸入和輸出數(shù)據(jù),并通過(guò)坐標(biāo)變換模型來(lái)預(yù)處理車輛軌跡數(shù)據(jù),以獲得更好的預(yù)測(cè)精度。為了使軌跡生成網(wǎng)絡(luò)輸出更加準(zhǔn)確、可靠的預(yù)測(cè)軌跡,溫惠英等通過(guò)將對(duì)抗損失、幾何損失、速度損失加權(quán)組合為多重?fù)p失函數(shù),采用多重判別方式綜合判斷預(yù)測(cè)軌跡與真實(shí)軌跡的相似度,并分析了不同長(zhǎng)度的歷史軌跡與預(yù)測(cè)軌跡對(duì)預(yù)測(cè)精度的影響。區(qū)別于需要明確坐標(biāo)信息進(jìn)行軌跡預(yù)測(cè)的方法,HSU等設(shè)計(jì)了利用RGB圖像序列信息實(shí)現(xiàn)軌跡預(yù)測(cè)的模型。該模型采用坐標(biāo)增強(qiáng)與坐標(biāo)穩(wěn)定模塊從圖像序列中提取歷史軌跡,無(wú)須顯示坐標(biāo)標(biāo)注,同時(shí)利用自注意力機(jī)制改進(jìn)社交池性能,以更好獲得周圍車輛軌跡的上下文信息。

駕駛場(chǎng)景中的車輛及其相互作用可通過(guò)圖結(jié)構(gòu)方式進(jìn)行表示,基于車輛圖類型數(shù)據(jù),GNN可用于預(yù)測(cè)環(huán)境車輛運(yùn)動(dòng)軌跡。為改善軌跡預(yù)測(cè)精度,LI等利用圖卷積進(jìn)行車輛的交互性建模,并基于LSTM進(jìn)行軌跡預(yù)測(cè)。進(jìn)一步,為同時(shí)識(shí)別和預(yù)測(cè)異構(gòu)交通參與者的交互行為,LI等提出了一種基于GNN的多任務(wù)學(xué)習(xí)框架,通過(guò)集成損失函數(shù)實(shí)現(xiàn)軌跡預(yù)測(cè)、交互式事件識(shí)別、3D包圍盒預(yù)測(cè)等多任務(wù)學(xué)習(xí)。

綜上可知,基于DL的軌跡預(yù)測(cè)方法能夠在充分考慮車輛交互性的基礎(chǔ)上,利用深度神經(jīng)網(wǎng)絡(luò)模型強(qiáng)大的擬合與表征能力,實(shí)現(xiàn)在復(fù)雜行駛環(huán)境下的全時(shí)域精準(zhǔn)軌跡預(yù)測(cè),但該方法也存在參數(shù)量大、模型訓(xùn)練難收斂、易陷入局部最優(yōu)解等弊端。另外,現(xiàn)有軌跡預(yù)測(cè)方法通常僅針對(duì)單個(gè)車輛,因此交互性只考慮了周圍車輛對(duì)目標(biāo)車輛預(yù)測(cè)軌跡的單向交互,忽略了目標(biāo)車輛對(duì)周圍其他車輛的反向作用,群體交互式軌跡預(yù)測(cè)通過(guò)在編碼-解碼框架中考慮車輛間的雙向交互性,可同時(shí)實(shí)現(xiàn)多個(gè)目標(biāo)車輛的軌跡預(yù)測(cè),有效保障了行車安全,目前已成為重要的前沿研究方向。

3

車輛隊(duì)列決策規(guī)劃

在本節(jié)中,對(duì)車輛隊(duì)列決策規(guī)劃系統(tǒng)的相關(guān)方法與研究進(jìn)展進(jìn)行梳理,研究?jī)?nèi)容包括路徑規(guī)劃、行為決策、軌跡規(guī)劃3部分。其中,路徑規(guī)劃指車輛隊(duì)列根據(jù)道路路網(wǎng)信息生成從初始位置到預(yù)期目的地的全局參考路徑,并將得到的全局最優(yōu)參考路徑輸出到車輛行為決策與軌跡規(guī)劃模塊。常用的路徑規(guī)劃算法有Dijkstra、蟻群算法、A*算法、動(dòng)態(tài)規(guī)劃(Dynamic programming,DP)算法等,此部分內(nèi)容不在討論范圍內(nèi)。

3.1 隊(duì)列運(yùn)動(dòng)行為決策

行為決策模塊作為自動(dòng)駕駛車輛的“大腦”,是車輛隊(duì)列在動(dòng)態(tài)交通環(huán)境下達(dá)到多目標(biāo)優(yōu)化的關(guān)鍵,其主要功能為根據(jù)感知預(yù)測(cè)系統(tǒng)獲取的周圍環(huán)境信息與車輛運(yùn)動(dòng)軌跡,做出安全、合理的駕駛行為(如隊(duì)列巡航、隊(duì)列跟隨、隊(duì)列組合與分離、隊(duì)列換道、超車等),并將結(jié)果輸出給軌跡規(guī)劃模塊,以規(guī)劃出保證行車安全的最優(yōu)車輛軌跡。具體地,當(dāng)外界行駛環(huán)境或自車駕駛意圖發(fā)生改變而需做出相應(yīng)的決策行為時(shí),不僅需要考慮道路結(jié)構(gòu)、交通規(guī)則、交通信號(hào)等先驗(yàn)信息,還需與其他動(dòng)態(tài)交通參與者進(jìn)行實(shí)時(shí)交互,以做出正確的行為決策。

當(dāng)前單車行為決策(如車道保持、換道、超車等)已進(jìn)行較多研究,但對(duì)車輛隊(duì)列協(xié)同行為決策(如單車與車隊(duì)以及車隊(duì)間的組合與拆分、匝道合流區(qū)隊(duì)列協(xié)同合并、隊(duì)列換道與超車等)進(jìn)行綜合闡述的文獻(xiàn)仍然較少,因此本節(jié)將對(duì)車輛隊(duì)列協(xié)同行為決策研究現(xiàn)狀進(jìn)行梳理,隊(duì)列行為決策示意圖如圖7所示。


2007年美國(guó)國(guó)防高級(jí)研究計(jì)劃局(Defense Advanced Research Projects Agency,DARPA)舉辦的城市挑戰(zhàn)賽作為最早的城市交通場(chǎng)景下的車輛行為決策研究,其中大部分參賽車輛均通過(guò)使用有限狀態(tài)機(jī)(Finite state machine,F(xiàn)SM)、決策樹(shù)(Decision tree,DT)、啟發(fā)式算法(Heuristic algorithm,HA)等基于規(guī)則的行為決策方法,實(shí)現(xiàn)了包括超車、避障、自主泊車等各項(xiàng)典型駕駛?cè)蝿?wù)。車輛行駛環(huán)境復(fù)雜多變,具有強(qiáng)不確定性與隨機(jī)性特征,而基于規(guī)則的行為決策方法雖具有結(jié)構(gòu)簡(jiǎn)單、易于實(shí)現(xiàn)等優(yōu)勢(shì),但僅適用于簡(jiǎn)單、特定的交通場(chǎng)景,在復(fù)雜場(chǎng)景下易導(dǎo)致決策效果不佳。

3.1.1 狀態(tài)機(jī)方法

狀態(tài)機(jī)作為基于規(guī)則的行為決策代表性方法,分為有限狀態(tài)機(jī)與層次狀態(tài)機(jī)2種類型,因其具有較強(qiáng)的邏輯性與實(shí)用性而被廣泛用于車輛行為決策。狀態(tài)機(jī)模型被成功應(yīng)用于DARPA挑戰(zhàn)賽中,并獲得了較好效果,但存在測(cè)試場(chǎng)景單一,與實(shí)際交通場(chǎng)景差距較大等問(wèn)題。因此,研究真實(shí)交通環(huán)境下車輛的行為決策是必要的。為此,XIONG等提出了基于層次狀態(tài)機(jī)(Hierarchical state machine,HSM)的車輛換道行為決策框架,針對(duì)自由換道與強(qiáng)制換道兩種模式分別設(shè)計(jì)了車道獎(jiǎng)勵(lì)模型和多源信息融合策略進(jìn)行換道判別,并利用實(shí)車在真實(shí)道路環(huán)境中進(jìn)行了算法有效性測(cè)試。為解決隊(duì)列協(xié)同行為決策問(wèn)題,AMOOZADEH等基于有限狀態(tài)機(jī)提出了隊(duì)列協(xié)同行為決策方法,可實(shí)現(xiàn)隊(duì)列間的合并、拆分和車道變換,并利用SUMO與OMNET++對(duì)所提出方法的有效性進(jìn)行了驗(yàn)證。進(jìn)一步,YE等開(kāi)發(fā)了一種隊(duì)列協(xié)同行為決策框架(Multi-maneuver platooning framework,MANA),包括換道模塊、隊(duì)列機(jī)動(dòng)模塊和空間儲(chǔ)備模塊。其中,換道模塊與隊(duì)列機(jī)動(dòng)模塊均使用有限狀態(tài)機(jī)對(duì)隊(duì)列合并與換道進(jìn)行行為決策。此外,XU等提出一種多智能體空間邏輯,采用時(shí)間自動(dòng)機(jī)構(gòu)建決策控制器,當(dāng)有人工駕駛車輛準(zhǔn)備并入隊(duì)列時(shí),決策單元可利用空間約束以保證高速場(chǎng)景下重型卡車隊(duì)列行為決策的安全性,避免合并過(guò)程中發(fā)生碰撞。自動(dòng)駕駛車輛作為典型的混成系統(tǒng),包含離散的決策控制以及連續(xù)的車輛運(yùn)動(dòng)學(xué)/動(dòng)力學(xué)模型,針對(duì)該特點(diǎn),MA等提出一種多模式混成自動(dòng)機(jī),用于設(shè)置具有速度、距離、長(zhǎng)度、車道位置和其他狀態(tài)信息的車輛隊(duì)列協(xié)同駕駛,并在巡航、跟馳、換道、超車、進(jìn)出車庫(kù)等多種模式下進(jìn)行算法有效性驗(yàn)證。

基于狀態(tài)機(jī)的行為決策方法根據(jù)既定規(guī)則對(duì)車輛所處環(huán)境進(jìn)行判斷,做出適當(dāng)?shù)鸟{駛行為,適用于簡(jiǎn)單交通場(chǎng)景,但并未考慮與周圍動(dòng)態(tài)交通參與者的駕駛交互性,不適用于復(fù)雜交通駕駛場(chǎng)景下的車輛協(xié)同行為決策。

3.1.2 博弈論方法

在車輛換道過(guò)程中,需考慮周圍交通參與者與駕駛環(huán)境對(duì)車輛換道決策的影響,同時(shí)換道車輛也會(huì)影響周圍車輛的行駛狀態(tài),因此,車輛行為具有顯著的交互特征。博弈論通過(guò)考慮車輛間的交互作用,可將人類在駕駛車輛時(shí)的競(jìng)爭(zhēng)與合作行為通過(guò)數(shù)學(xué)模型進(jìn)行表示,對(duì)博弈中的每個(gè)車輛進(jìn)行協(xié)同決策,使整體達(dá)到均衡狀態(tài)。目前,博弈論在多車協(xié)同決策方面應(yīng)用較為廣泛,但由于難以確定不同因素對(duì)每個(gè)博弈者的影響,導(dǎo)致博弈論中為每個(gè)博弈者制定策略的收益函數(shù)設(shè)計(jì)較為困難,且博弈模型存在計(jì)算復(fù)雜度高等問(wèn)題。

為使車輛間實(shí)現(xiàn)安全無(wú)碰撞合并,DOS SANTOS等基于博弈論(Game theory,GT)方法對(duì)兩車道車輛合并為單車道隊(duì)列過(guò)程進(jìn)行協(xié)同決策,通過(guò)確定車輛合并次序以避免在合并過(guò)程中發(fā)生碰撞,同時(shí)還提出了一種成本函數(shù)衰減方法,防止在合并協(xié)議未達(dá)成中止合并過(guò)程。在限速30 m/s的雙車道高速公路上進(jìn)行隊(duì)列合并仿真測(cè)試,測(cè)試對(duì)象從2輛合并車輛增加至26輛,結(jié)果顯示隊(duì)列合并總平均時(shí)間穩(wěn)定維持在25 s左右,平均車速保持在約22 m/s,采用函數(shù)衰減方法導(dǎo)致在合并過(guò)程中車速僅超過(guò)最高限速值9%。博弈論可以通過(guò)車輛間的交互作用來(lái)模擬駕駛員的駕駛行為,YAN等基于博弈論與神經(jīng)網(wǎng)絡(luò)方法構(gòu)建了車輛在高速公路場(chǎng)景下的多車協(xié)同行為決策模型,相較于基于規(guī)則的收益函數(shù),利用神經(jīng)網(wǎng)絡(luò)建立的收益函數(shù)可以更精準(zhǔn)的描述車輛間的相互作用,提高模型決策精度,同時(shí)采用改進(jìn)高斯粒子群優(yōu)化(Differential evolution- Gaussian particle swarm optimization,DE-GPSO)方法對(duì)模型進(jìn)行標(biāo)定。利用NGSIM數(shù)據(jù)集中的車道保持與換道場(chǎng)景對(duì)所提出的算法進(jìn)行驗(yàn)證,結(jié)果顯示該方法相較于另一種博弈論決策方法具有更好的協(xié)同決策效果。針對(duì)自動(dòng)駕駛車輛協(xié)同換道決策問(wèn)題,HRUSZCZAK等基于博弈論研究了一種CAV協(xié)同換道的行為決策方法,通過(guò)分析4種不同駕駛策略的收益函數(shù),從而使目標(biāo)車輛選擇最優(yōu)的行為決策。SUMO仿真結(jié)果顯示,相較于非合作換道,合作換道雖然會(huì)使目標(biāo)車道上的CAV減速4.72 km/h,但可使目標(biāo)車輛的平均車速提高29.41 km/h,文中并未考慮協(xié)同換道對(duì)交通流的影響。匝道合流作為重要的交通場(chǎng)景之一,容易因車輛間的合流不當(dāng)造成交通事故,基于博弈論的決策方法通過(guò)考慮車輛間的交互作用,可有效避免事故發(fā)生。ARBIS等基于量子響應(yīng)平衡(Quantal response equilibrium,QRE)提出了一種匝道合流區(qū)車輛協(xié)同合并與讓行的預(yù)期效用決策模型,通過(guò)博弈對(duì)象決策收益函數(shù)的相關(guān)聯(lián)來(lái)體現(xiàn)交互性,并利用NGSIM數(shù)據(jù)集對(duì)決策模型的有效性進(jìn)行驗(yàn)證。值得注意的是,QRE假設(shè)周圍車輛的決策具有隨機(jī)性,而非納什均衡中的確定性。進(jìn)一步,KANG等對(duì)高速公路匝道合流場(chǎng)景進(jìn)行研究,基于博弈論開(kāi)發(fā)了一種新型收益函數(shù)的重復(fù)博弈車輛協(xié)同決策模型,同時(shí)對(duì)決策模型進(jìn)行敏感性分析,以表明所提出的模型能夠根據(jù)博弈位置、相對(duì)速度和車間距等變量的變化來(lái)做出最優(yōu)合并決策。利用NGSIM對(duì)方法進(jìn)行有效性驗(yàn)證,與單次博弈模型相比較,所提出的方法具有更好的預(yù)測(cè)精度,可達(dá)到86%的準(zhǔn)確率。針對(duì)自動(dòng)駕駛車輛與人工駕駛車輛在混合交通場(chǎng)景下的交互行為決策問(wèn)題,YU等提出了一種基于不完全信息博弈的車輛換道決策模型。該模型通過(guò)轉(zhuǎn)向燈和橫向移動(dòng)與周圍駕駛員進(jìn)行交互來(lái)模擬人類駕駛員行為,根據(jù)目標(biāo)車道的車輛行為確定最佳換道時(shí)機(jī)和加速度(圖8)。測(cè)試結(jié)果表明,基于博弈論的控制器能夠以類人的方式執(zhí)行車道操作,并且優(yōu)于基于固定規(guī)則與模型預(yù)測(cè)控制(Model predictive control,MPC)的控制器。相較于自動(dòng)駕駛汽車,人工駕駛車輛具有高度不確定性特點(diǎn),需考慮其對(duì)行為決策的影響。為此,HANG等基于Stackelberg博弈論提出了一種考慮周圍駕駛員社會(huì)行為的車輛換道行為決策方法。具體地,通過(guò)激進(jìn)、普通、保守三種駕駛風(fēng)格反映障礙車輛所表現(xiàn)的社會(huì)行為,然后利用Stackelberg博弈論將考慮社會(huì)行為的換道決策表述為非合作博弈問(wèn)題進(jìn)行求解。在三種不同場(chǎng)景下的測(cè)試結(jié)果表明,所提出的方法能夠在障礙車輛的各種社會(huì)行為下對(duì)自車進(jìn)行合理決策。在此基礎(chǔ)上,該研究團(tuán)隊(duì)為改善多車道合流區(qū)車輛的安全性與通行效率,提出了一種考慮不同交互駕駛行為的合作博弈車輛協(xié)同決策框架。首先根據(jù)動(dòng)力學(xué)模型建立運(yùn)動(dòng)預(yù)測(cè)模塊,以提高決策算法的準(zhǔn)確定與可靠性,其次將安全性、舒適性和通行效率納入到?jīng)Q策模型的成本函數(shù)及安全約束中,并在多約束條件下,基于MPC計(jì)算出各博弈對(duì)象的預(yù)測(cè)決策序列。最后,為評(píng)估方法效果,在考慮不同駕駛特性的情況下進(jìn)行測(cè)試。


3.1.3 機(jī)器學(xué)習(xí)方法

近年來(lái),隨著人工智能技術(shù)的蓬勃發(fā)展與應(yīng)用,機(jī)器學(xué)習(xí)方法已經(jīng)成為自動(dòng)駕駛行為決策領(lǐng)域中一種重要的解決方案。應(yīng)用于多車協(xié)作行為決策的機(jī)器學(xué)習(xí)方法主要包括監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí)2種類型。相較于其他行為決策方法,機(jī)器學(xué)習(xí)能夠根據(jù)自然駕駛數(shù)據(jù)集或?qū)<医?jīng)驗(yàn),使車輛在復(fù)雜行駛環(huán)境下決策出更加真實(shí)、合理的駕駛行為。

(1) 監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)是指從標(biāo)注數(shù)據(jù)中進(jìn)行模型學(xué)習(xí)的一類機(jī)器學(xué)習(xí)方法,其本質(zhì)是學(xué)習(xí)輸入到輸出的映射的統(tǒng)計(jì)規(guī)律。為更好地理解和預(yù)測(cè)駕駛員的換道決策行為,MOTAMEDIDEHKORDI等比較了不同監(jiān)督機(jī)器學(xué)習(xí)分類器在預(yù)測(cè)換道行為方面的性能。采用NGSIM數(shù)據(jù)集,使用樸素貝葉斯、支持向量機(jī)、邏輯回歸、最近鄰、決策樹(shù)、額外樹(shù)和隨機(jī)森林分類器分別對(duì)模型進(jìn)行訓(xùn)練。數(shù)據(jù)集測(cè)試結(jié)果表明,額外樹(shù)、決策樹(shù)和隨機(jī)森林在預(yù)測(cè)駕駛員的換道決策方面表現(xiàn)最好。為解決自動(dòng)駕駛與人工駕駛混合多車協(xié)同換道場(chǎng)景下的換道序列決策問(wèn)題,祁宏生等基于決策樹(shù)設(shè)計(jì)了一種以車輛最短換道時(shí)長(zhǎng)為優(yōu)化目標(biāo)的協(xié)同換道決策方法,仿真結(jié)果顯示,與未考慮協(xié)同換道的方法相比,該方法可提高24%的道路通過(guò)量,有效降低換道行為對(duì)道路通行能力的影響。針對(duì)自動(dòng)駕駛車輛換道決策過(guò)程的多參數(shù)以及非線性問(wèn)題,LIU等采用貝葉斯優(yōu)化方法對(duì)SVM參數(shù)進(jìn)行優(yōu)化,建立了BOA Gaussian-SVM車輛換道決策模型。通過(guò)分析影響車輛換道的因素,構(gòu)建考慮換道收益、安全性和容錯(cuò)性的基于規(guī)則的車輛換道決策模型。利用NGSIM測(cè)試集數(shù)據(jù)將所提出的方法與基于規(guī)則的換道決策方法相比較,并進(jìn)行實(shí)車試驗(yàn)以驗(yàn)證算法有效性。進(jìn)一步,為使決策模型考慮的因素更加全面,谷新平等從道路結(jié)構(gòu)、交互感知和物理狀態(tài)3個(gè)方面提取決策特征,并輸入至BOA Gaussian- SVM決策模型實(shí)現(xiàn)車輛行為決策,使決策結(jié)果更貼合駕駛員的決策特性。同時(shí),將精度、召回率、F1 Score和準(zhǔn)確率作為模型評(píng)價(jià)指標(biāo),在NGSIM測(cè)試集中與貝葉斯優(yōu)化RF、梯度提升樹(shù)(Gradient boosting decision tree,GBDT)、K最近鄰算法(K-nearest neighbor,KNN)進(jìn)行對(duì)比,結(jié)果顯示所提出的決策模型具有92.97%的預(yù)測(cè)準(zhǔn)確率,性能均優(yōu)于其他決策模型,能夠較為準(zhǔn)確地預(yù)測(cè)車輛的自由換道行為。極限學(xué)習(xí)機(jī)(Extreme learning machine,KLM)作為一種特殊的前饋神經(jīng)網(wǎng)絡(luò)(Feedforward neuron network,F(xiàn)NN),相較于SVM具有更好的學(xué)習(xí)速率與泛化優(yōu)勢(shì),CHENG等提出了一種基于核極限學(xué)習(xí)機(jī)(Kernel extreme learning machine,K-ELM)的車輛強(qiáng)制換道決策方法。在該方法中,將KLM與核函數(shù)相結(jié)合,提取了多個(gè)影響換道的駕駛變量,并將其用作于K-ELM網(wǎng)絡(luò),以生成正確的換道決策。利用NGSIM數(shù)據(jù)集的車輛軌跡數(shù)據(jù),采用十倍交叉驗(yàn)證方法對(duì)K-ELM網(wǎng)絡(luò)進(jìn)行訓(xùn)練。仿真結(jié)果表明,該方法對(duì)合并事件和非合并事件的換道決策準(zhǔn)確率分別為92.86%和94.36%,同時(shí),與ELM和SVM方法相比,所提方法在精度與效率方面具有更好效果。

(2) 強(qiáng)化學(xué)習(xí)。以深度強(qiáng)化學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)方法,通過(guò)智能體與環(huán)境間交互,獲取未來(lái)回報(bào)最大化的策略,非常適用于解決多車協(xié)同行為決策問(wèn)題。現(xiàn)有的車輛行為決策方法通常僅關(guān)注了局部范圍內(nèi)車輛的行駛狀態(tài),忽略了執(zhí)行決策行為后對(duì)整體交通的影響。為解決該類問(wèn)題,WANG等提出了一種基于深度Q網(wǎng)絡(luò)(Deep Q-network,DQN)的車輛協(xié)同換道決策模型,每一輛車的換道表示為一個(gè)馬爾科夫決策過(guò)程(Markov decision process,MDP),將相鄰車輛的位置信息作為輸入,并在獎(jiǎng)勵(lì)函數(shù)中同時(shí)考慮了單車與整體交通效率獎(jiǎng)勵(lì),最后利用交通與非交通事故場(chǎng)景驗(yàn)證所提出的車輛協(xié)同換道模型的有效性。仿真結(jié)果表明,在擁擠道路交通場(chǎng)景下,所提出的協(xié)同換道決策模型可以提高整體交通效率。車輛行駛過(guò)程中,周圍交通參與者的狀態(tài)往往并不能完全實(shí)時(shí)獲取,此時(shí)無(wú)法通過(guò)MDP模型對(duì)問(wèn)題進(jìn)行精確描述。因此,JIANG等提出了一種基于部分可觀測(cè)馬爾科夫(Partial observed MDP,POMDP)的高速公路車輛換道決策模型,利用LSTM預(yù)測(cè)目標(biāo)車道的車輛行駛意圖(對(duì)抗或合作),將目標(biāo)車道的車輛意圖納入狀態(tài)編碼階段,并采用DQN求解具有期望全局最優(yōu)回報(bào)的POMDP問(wèn)題。

相較于其他方法,基于機(jī)器學(xué)習(xí)的行為決策方法在復(fù)雜空間下的探索能力、算法泛化能力以及計(jì)算速度等方面具有一定優(yōu)勢(shì),但算法性能嚴(yán)重受限于訓(xùn)練數(shù)據(jù)的優(yōu)劣,且算法可解釋性較差,安全性難以得到保證,不利于系統(tǒng)測(cè)試與驗(yàn)證。因此,該類方法目前仍以仿真驗(yàn)證為主,在真實(shí)車輛中應(yīng)用難度較大。

3.1.4 模型與數(shù)據(jù)混合優(yōu)化方法

基于機(jī)器學(xué)習(xí)的車輛行為決策方法雖能精確地表達(dá)輸入與輸出之間的非線性關(guān)系,但屬于典型的“黑箱模型”,實(shí)際效果嚴(yán)重依賴訓(xùn)練樣本的數(shù)量與質(zhì)量,且存在欠學(xué)習(xí)與過(guò)學(xué)習(xí)、可解釋性差、算法難以收斂等問(wèn)題。為進(jìn)一步提高機(jī)器學(xué)習(xí)方法決策的準(zhǔn)確性,部分專家提出了規(guī)則與學(xué)習(xí)相結(jié)合的思想,以實(shí)現(xiàn)不同類型方法間的優(yōu)勢(shì)互補(bǔ)。

為解決高交通流密度場(chǎng)景下,車輛切入策略無(wú)法有效平衡安全性與切入性能的問(wèn)題,HWANG等提出了一種將強(qiáng)化學(xué)習(xí)(Reinforcement learning,RL)嵌套在FSM中的FSM-RL車輛切入策略(圖9)。仿真結(jié)果表明,所提出的FSM-RL切入算法在不犧牲安全性的前提下,始終能獲得較高的切入成功率。特別是,隨著交通流量的增加,切入成功率和安全性比現(xiàn)有基于規(guī)則的切入算法和端到端RL算法有顯著提高。此外,針對(duì)自動(dòng)駕駛車輛換道決策過(guò)程中的多參數(shù)與非線性問(wèn)題,賈寒冰等利用規(guī)則與學(xué)習(xí)相結(jié)合的思想,提出了一種利用貝葉斯優(yōu)化算法對(duì)SVM的參數(shù)進(jìn)行優(yōu)化的車輛換道決策模型。通過(guò)分析安全性、換道必要性、換道收益等影響車輛換道決策的因素,并將其作為決策模型的安全約束與決策特征,對(duì)原訓(xùn)練樣本進(jìn)行增廣,以改善SVM的換道行為預(yù)測(cè)準(zhǔn)確率。利用NGSIM數(shù)據(jù)集進(jìn)行仿真測(cè)試,結(jié)果顯示所提出的決策方法準(zhǔn)確率為83.83%,相較于增廣前的訓(xùn)練數(shù)據(jù)可提升10.78%。逆強(qiáng)化學(xué)習(xí)(Inverse reinforcement learning,IRL)作為RL算法的一種反向形式,當(dāng)獎(jiǎng)勵(lì)函數(shù)難以設(shè)計(jì)時(shí),可通過(guò)對(duì)專家示例進(jìn)行學(xué)習(xí)來(lái)獲取獎(jiǎng)勵(lì)函數(shù),從而模擬人類駕駛員的決策行為,但無(wú)法處理高維度的駕駛環(huán)境。因此,PRATHIBA等提出了一種改進(jìn)IRL決策方法,以實(shí)現(xiàn)在換道和超車場(chǎng)景下的車輛協(xié)同避撞。具體地,將高斯過(guò)程引入IRL中,設(shè)計(jì)了基于高斯過(guò)程回歸的IRL-GP模型,通過(guò)超參數(shù)學(xué)習(xí)與正則化對(duì)專家示例數(shù)據(jù)集中的最優(yōu)特征選擇。在做出超車和換道行為決策后,借助6G-V2X實(shí)現(xiàn)車輛間相互協(xié)作通信,可有效減少做出最佳決策所需時(shí)間。


3.2 隊(duì)內(nèi)車輛軌跡規(guī)劃

根據(jù)隊(duì)列協(xié)同行為決策結(jié)果,在滿足車輛運(yùn)動(dòng)學(xué)/動(dòng)力學(xué)、安全性、舒適性、穩(wěn)定性、經(jīng)濟(jì)性等約束條件的前提下,對(duì)隊(duì)內(nèi)車輛的預(yù)期位移、速度、加速度等進(jìn)行規(guī)劃,使其適應(yīng)不同的多車協(xié)作狀態(tài)。運(yùn)動(dòng)規(guī)劃可分為路徑規(guī)劃與軌跡規(guī)劃兩種類型,其中路徑規(guī)劃僅生成滿足約束條件的幾何曲線,未考慮與時(shí)間相關(guān)的信息,軌跡規(guī)劃在已知路徑規(guī)劃的基礎(chǔ)上附加時(shí)間約束,根據(jù)動(dòng)態(tài)交通環(huán)境信息生成一條包含時(shí)間與空間映射關(guān)系的最優(yōu)車輛軌跡。

相較于靜態(tài)環(huán)境下的單車軌跡規(guī)劃,多車協(xié)同軌跡規(guī)劃要求更為嚴(yán)格,需要使規(guī)劃路徑更為平滑且曲率較小,以保證隊(duì)列穩(wěn)定性與行車安全性。值得注意的是,為降低計(jì)算復(fù)雜度并便于實(shí)際應(yīng)用,在隊(duì)列執(zhí)行換道、超車的過(guò)程中,車輛隊(duì)列軌跡規(guī)劃通常僅對(duì)領(lǐng)航車軌跡進(jìn)行計(jì)算,跟隨車通過(guò)跟蹤前車位置、航向角等變量實(shí)現(xiàn)跟蹤。本節(jié)將從曲線插值、數(shù)值優(yōu)化、隨機(jī)采樣、強(qiáng)化學(xué)習(xí)4個(gè)方面闡述多車協(xié)同軌跡規(guī)劃的研究現(xiàn)狀。

3.2.1 曲線插值方法

曲線插值方法因其具有結(jié)構(gòu)簡(jiǎn)單、實(shí)時(shí)性較好、易于實(shí)現(xiàn)等優(yōu)點(diǎn)而被廣泛應(yīng)用于車輛軌跡規(guī)劃領(lǐng)域,該方法可在考慮車輛運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)特性、安全性、舒適性、道路參數(shù)等約束條件下擬合出無(wú)碰撞的安全可行駛軌跡。在隊(duì)列軌跡規(guī)劃方面,已有眾多學(xué)者采用曲線插值方法實(shí)現(xiàn)軌跡規(guī)劃,并在實(shí)車中進(jìn)行了應(yīng)用。

(1) 高階多項(xiàng)式。SCHWAB等基于3階多項(xiàng)式方法生成車輛橫向規(guī)劃軌跡,以保證目標(biāo)車輛完成隊(duì)列合并過(guò)程,但僅考慮了車輛合并場(chǎng)景,并未考慮隊(duì)列分離、換道等其他場(chǎng)景。3階多項(xiàng)式僅能保證車輛速度與位移的連續(xù),無(wú)法保證車輛加速度連續(xù),易造成加速度突變,影響車輛舒適性。為進(jìn)一步改善換道效果,保證車輛加速度連續(xù),張榮輝等在綜合分析車輛換道匯入車隊(duì)的協(xié)作準(zhǔn)則與安全性后,設(shè)計(jì)了一種考慮乘坐舒適性指標(biāo)函數(shù)的5階多項(xiàng)式軌跡規(guī)劃方法,并給出了車輛在匯入過(guò)程中的避碰準(zhǔn)則,以確保車輛在合并過(guò)程中的安全性與穩(wěn)定性,最后通過(guò)實(shí)車測(cè)試對(duì)算法有效性進(jìn)行了驗(yàn)證。針對(duì)不同通信拓?fù)浣Y(jié)構(gòu)下異構(gòu)隊(duì)列協(xié)同換道方法,NIE等將5階多項(xiàng)式與優(yōu)化方法相結(jié)合,設(shè)計(jì)了一種具有避障功能的隊(duì)列軌跡規(guī)劃方法,可根據(jù)自車與障礙車的狀態(tài)規(guī)劃出無(wú)碰撞的最優(yōu)換道軌跡。同時(shí),采用更長(zhǎng)的采樣周期以降低計(jì)算負(fù)擔(dān),并根據(jù)優(yōu)化結(jié)果重新規(guī)劃軌跡,結(jié)果表明所提出的軌跡重規(guī)劃方法可有效改善算法計(jì)算效率。傳統(tǒng)高階多項(xiàng)式的系數(shù)通常恒定,無(wú)法較好適應(yīng)不斷變化的行駛環(huán)境。因此,GOLI等采用自適應(yīng)5階多項(xiàng)式與擺線函數(shù)方法分別對(duì)合并隊(duì)列進(jìn)行橫向軌跡規(guī)劃,與傳統(tǒng)恒定5階多項(xiàng)式與擺線函數(shù)方法相比,所提出的2種自適應(yīng)橫向軌跡方法可以生成不同速度下的規(guī)劃軌跡,有效避免了橫向加速度過(guò)大問(wèn)題。在此基礎(chǔ)上,為使合并車輛順利進(jìn)入隊(duì)列,在考慮前方道路信息的前提下,該研究團(tuán)隊(duì)基于自適應(yīng)5階多項(xiàng)式生成隊(duì)列車輛橫向規(guī)劃參考軌跡,以達(dá)到提前對(duì)車輛橫向軌跡進(jìn)行規(guī)劃,確保合并過(guò)程中的安全性、舒適性與高效性。

(2) 貝塞爾與B樣條曲線。為實(shí)現(xiàn)隊(duì)列間的安全、高效合并,HIDALGO等提出基于貝塞爾曲線與MPC的混合軌跡規(guī)劃框架,該框架由基于5階貝塞爾曲線的標(biāo)稱軌跡模型和基于MPC的積分鏈模型組成,MPC輸出的車輛橫向位置被添加到由標(biāo)稱控制器生成的橫向誤差中,使車輛可以在車道變換、超車、合流等場(chǎng)景下規(guī)劃出安全的行車軌跡,仿真結(jié)果顯示能夠在保證安全性與舒適性的情況下實(shí)現(xiàn)多車合并。相較于多項(xiàng)式與貝塞爾曲線無(wú)法進(jìn)行軌跡局部修改的缺點(diǎn),當(dāng)改變B樣條的控制點(diǎn)時(shí)僅會(huì)影響部分軌跡曲線形狀,可便于實(shí)現(xiàn)局部軌跡修改。VAN HOEK等基于B樣條提出了一種考慮隊(duì)列穩(wěn)定性的多車協(xié)同規(guī)劃方法,并通過(guò)通信延時(shí)、車輛初始擾動(dòng)等對(duì)所提出方法的魯棒性與有效性進(jìn)行了驗(yàn)證。

3.2.2 優(yōu)化方法

優(yōu)化方法通常通過(guò)最大化/最小化求解多約束成本函數(shù)來(lái)生成車輛所需軌跡,主要包括MPC與數(shù)值優(yōu)化方法2種類型。作為一類常用的主流車輛軌跡規(guī)劃方法,基于優(yōu)化的方法雖易于處理車輛運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)約束,但往往計(jì)算量較大,存在實(shí)時(shí)性不足問(wèn)題。

(1) MPC。基于MPC的車輛軌跡規(guī)劃方法其主要核心思想為將軌跡規(guī)劃描述為多約束的預(yù)測(cè)模型,通過(guò)滾動(dòng)求解多約束優(yōu)化問(wèn)題獲得車輛最優(yōu)軌跡,目前已被廣泛應(yīng)用于單車軌跡規(guī)劃,但在車輛隊(duì)列與多車協(xié)同軌跡規(guī)劃領(lǐng)域仍然較少。為確保兩車隊(duì)之間實(shí)現(xiàn)安全隊(duì)列合并,PAUCA等提出了一種三層控制體系結(jié)構(gòu),包含行為決策層、軌跡規(guī)劃層、跟蹤控制層。在軌跡規(guī)劃層中,采用基于5階多項(xiàng)式和MPC的兩種橫向軌跡規(guī)劃方法進(jìn)行對(duì)比測(cè)試,其中5階多項(xiàng)式在計(jì)算量與計(jì)算時(shí)間方面具有優(yōu)勢(shì),但需要更完備的車輛狀態(tài)信息,MPC僅需車輛橫向位置信息,且換道軌跡更加平順。此外,為解決多車協(xié)同軌跡規(guī)劃問(wèn)題,LIU等基于車輛單點(diǎn)質(zhì)量模型(Single point mass model,SPMM),提出了一種平坦路況下非線性模型預(yù)測(cè)控制器(Nonlinear model predictive control,NMPC)的車輛軌跡規(guī)劃方法,并通過(guò)連續(xù)/廣義最小殘差方式對(duì)算法進(jìn)行優(yōu)化,可有效減少規(guī)劃器每次采樣的迭代次數(shù),提高NMPC的計(jì)算實(shí)時(shí)性(圖10)。車輛行駛環(huán)境具有復(fù)雜多變特性,道路坡度會(huì)對(duì)車輛規(guī)劃與控制產(chǎn)生重要影響。SHIN等提出了一種在崎嶇地形下的車輛隊(duì)列軌跡規(guī)劃算法。干擾觀測(cè)器(Disturbance observer,DOB)被引入到標(biāo)稱速度規(guī)劃器中,以處理速度規(guī)劃中的不確定性,將MPC作為軌跡規(guī)劃方法并采用粒子群優(yōu)化方法求解。


(2) 數(shù)值優(yōu)化。MPC雖然可以處理多約束優(yōu)化問(wèn)題,但難以考慮行車環(huán)境中的邏輯約束對(duì)軌跡規(guī)劃的影響。因此,BURGER等采用混合整數(shù)二次規(guī)劃(MixedInteger quadratic programming,MIQP)方法生成多車協(xié)同下的車輛軌跡規(guī)劃全局最優(yōu)解。針對(duì)車輛隊(duì)列合并場(chǎng)景的軌跡規(guī)劃問(wèn)題,XU等采用DP與ACC方法生成車輛橫向與縱向運(yùn)動(dòng)軌跡,在保證換道過(guò)程隊(duì)列穩(wěn)定性的前提下,使車輛安全、快速地并入隊(duì)列。匝道合流區(qū)作為重要的交通場(chǎng)景之一,由于涉及多車協(xié)同行為決策與規(guī)劃控制,極易造成交通事故、道路擁堵等問(wèn)題發(fā)生。為有效處理匝道合流場(chǎng)景下的多車協(xié)同規(guī)劃問(wèn)題,MU等開(kāi)發(fā)了一種基于事件觸發(fā)滾動(dòng)時(shí)域的系統(tǒng)軌跡規(guī)劃方法,以實(shí)現(xiàn)匝道合流區(qū)內(nèi)車隊(duì)間安全、平穩(wěn)、高效的合并。控制區(qū)分為預(yù)合并子區(qū)、虛擬合并子區(qū)、合并后子區(qū),規(guī)劃問(wèn)題被建模為考慮不同場(chǎng)景的混合整數(shù)非線性規(guī)劃(Mixed integer nonlinear program,MINLP),并通過(guò)MIA算法進(jìn)行求解。匝道合流規(guī)劃通常視為兩車道間的車輛規(guī)劃問(wèn)題,忽略了主路常為多車道的實(shí)際情況,針對(duì)多車道高速公路合流區(qū)隊(duì)列合并規(guī)劃問(wèn)題(圖11),GAO等提出一種考慮換道控制與CACC的最優(yōu)車輛軌跡規(guī)劃控制器,采用Legendre偽譜算法將控制器轉(zhuǎn)化為非線性規(guī)劃問(wèn)題求解。


人工勢(shì)場(chǎng)法最早由KHATIB于1986年應(yīng)用于機(jī)器人避障領(lǐng)域,通過(guò)構(gòu)建勢(shì)場(chǎng)模型實(shí)現(xiàn)車輛軌跡規(guī)劃,具有結(jié)構(gòu)簡(jiǎn)單、實(shí)時(shí)性較好等優(yōu)勢(shì),但當(dāng)引力與斥力值接近且方向相反時(shí),存在易陷入局部最優(yōu)解。為解決多車道車輛協(xié)同駕駛中的軌跡規(guī)劃問(wèn)題,高力等基于人工勢(shì)場(chǎng)法(Artificial potential field,APF)對(duì)行車環(huán)境建立勢(shì)場(chǎng)模型,使車輛編隊(duì)在四種不同場(chǎng)景下進(jìn)行編隊(duì)結(jié)構(gòu)變換時(shí),實(shí)現(xiàn)無(wú)碰撞的車輛軌跡規(guī)劃。為避免多車協(xié)同行駛場(chǎng)景中APF易陷入局部極小值的問(wèn)題,HANG等提出了一種將APF與MPC相結(jié)合的優(yōu)化方法,利用MPC的優(yōu)化器代替?zhèn)鹘y(tǒng)APF中的梯度下降方法,實(shí)現(xiàn)軌跡規(guī)劃與跟蹤控制的同步優(yōu)化。

3.2.3 隨機(jī)采樣方法

基于隨機(jī)采樣的軌跡規(guī)劃方法,其核心思想是通過(guò)對(duì)狀態(tài)空間的隨機(jī)采樣來(lái)引導(dǎo)路徑樹(shù)的生長(zhǎng),從而規(guī)劃出安全的行車軌跡。隨機(jī)采樣算法具有概率完備特性,理論上不需要對(duì)狀態(tài)空間自由區(qū)域進(jìn)行顯式建模,能夠適用于高維空間的復(fù)雜規(guī)劃。

典型的隨機(jī)采樣方法包括概率路圖法(Probabilistic roadmap,PRM)與RRT兩種。其中,PRM算法要求對(duì)狀態(tài)之間進(jìn)行精確連接,導(dǎo)致無(wú)法較好地應(yīng)對(duì)復(fù)雜微分約束下的車輛規(guī)劃。RRT算法最早由LAVALLE提出,目前已被廣泛應(yīng)用于移動(dòng)機(jī)器人、自動(dòng)駕駛等領(lǐng)域。由于RRT算法為均勻采樣且具有隨機(jī)性,導(dǎo)致采樣效率較低,規(guī)劃出的路徑通常僅為可行路徑而并非最優(yōu)路徑,因此,多種改進(jìn)RRT算法被相繼提出。其中,RRT*結(jié)合了A*算法的思想,通過(guò)改進(jìn)RRT父節(jié)點(diǎn)的選擇方式實(shí)現(xiàn)路徑優(yōu)化,同時(shí),每次迭代后會(huì)重新連接現(xiàn)有樹(shù)上的節(jié)點(diǎn),實(shí)現(xiàn)算法的漸進(jìn)最優(yōu)解。為實(shí)現(xiàn)高速公路場(chǎng)景下的多車協(xié)同組隊(duì),GANAOUI-MOURLAN等利用RRT*與MPC對(duì)不同初始位置下的車輛軌跡進(jìn)行規(guī)劃,其中,在RRT*對(duì)車輛進(jìn)行初始軌跡規(guī)劃的基礎(chǔ)上,通過(guò)MPC對(duì)轉(zhuǎn)向角、加速度、沖擊度等進(jìn)行二次優(yōu)化,以保證生成的軌跡適用于車輛跟蹤控制并改善駕乘舒適性。進(jìn)一步,為加快RRT*算法的計(jì)算實(shí)時(shí)性并降低內(nèi)存占用,JIANG等提出了一種改進(jìn)RRT*多車協(xié)同軌跡規(guī)劃方法,在多智能體RRT*(Multi-Agent RRT*,MA-RRT*)的基礎(chǔ)上設(shè)計(jì)了一種多智能體RRT*固定節(jié)點(diǎn)(MA-RRT* fixed node,MA-RRT*FN)方法。MA-RRT*FN可通過(guò)刪除路徑上不可能達(dá)到的弱節(jié)點(diǎn)目標(biāo)來(lái)減少存儲(chǔ)在RRT樹(shù)中的節(jié)點(diǎn)數(shù),有效避免了MA-RRT*算法因節(jié)點(diǎn)數(shù)過(guò)多而造成的內(nèi)存占用過(guò)大問(wèn)題。實(shí)驗(yàn)結(jié)果表明,MA-RRT*FN在可擴(kuò)展性和收斂速度方面與MA-RRT*具有相同的性能,但其內(nèi)存需求顯著降低。

3.2.4 強(qiáng)化學(xué)習(xí)方法

隨著人工智能技術(shù)的快速發(fā)展,以DL和RL為代表的機(jī)器學(xué)習(xí)方法正被逐漸應(yīng)用于車輛軌跡規(guī)劃領(lǐng)域。其中,DL方法通常根據(jù)專家駕駛員的圖像和實(shí)際動(dòng)作信息以及多源傳感器信息對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過(guò)端到端的方式直接輸出車輛軌跡,該方法的優(yōu)勢(shì)在于可以顯著降低計(jì)算復(fù)雜度與標(biāo)定成本,但會(huì)使車輛系統(tǒng)“黑箱化”嚴(yán)重,導(dǎo)致系統(tǒng)可解性較差,增加系統(tǒng)測(cè)試與驗(yàn)證難度。由于該方法通常未明確劃分感知、預(yù)測(cè)、決策、規(guī)劃模塊,與文章總體結(jié)構(gòu)沖突,不進(jìn)行詳細(xì)介紹。

RL作為機(jī)器學(xué)習(xí)領(lǐng)域的一類重要方法,在自動(dòng)駕駛車輛與周圍環(huán)境的交互過(guò)程中,通過(guò)不斷地獎(jiǎng)懲使車輛獲得最大獎(jiǎng)勵(lì)回報(bào)值,確定當(dāng)前環(huán)境下的最優(yōu)動(dòng)作。與其他類型的車輛軌跡規(guī)劃算法相比,RL方法最顯著優(yōu)勢(shì)在于可增強(qiáng)車輛對(duì)于動(dòng)態(tài)交通環(huán)境的適應(yīng)能力,是未來(lái)車輛軌跡規(guī)劃的主要研究與發(fā)展方向,但依然存在嚴(yán)重依賴訓(xùn)練樣本的數(shù)量與質(zhì)量、可解釋性較差、算法收斂較慢以及過(guò)擬合等問(wèn)題。同時(shí),由于現(xiàn)實(shí)環(huán)境復(fù)雜多變,目前仍以仿真驗(yàn)證為主,在實(shí)際應(yīng)用方面還未廣泛開(kāi)展研究。

為實(shí)現(xiàn)多車協(xié)同避撞軌跡規(guī)劃,WANG等提出了一種車輛間協(xié)同軌跡規(guī)劃方法,將車輛間的避撞規(guī)劃任務(wù)描述為多維連續(xù)系統(tǒng)中的MDP問(wèn)題。當(dāng)存在碰撞風(fēng)險(xiǎn)時(shí),系統(tǒng)會(huì)在每個(gè)時(shí)間步內(nèi)確定兩車間的適當(dāng)轉(zhuǎn)向,便于能夠協(xié)同改變車輛運(yùn)動(dòng)軌跡以避免碰撞,車輛的位置和方向被視為系統(tǒng)狀態(tài),運(yùn)動(dòng)被定義為動(dòng)作,并在迭代機(jī)制中應(yīng)用最小二乘法更新近似值函數(shù)。蒙特卡洛樹(shù)搜索(Monte Carlo tree search,MCTS)算法作為一種基于樹(shù)結(jié)構(gòu)的RL方法,已被用于解決多車協(xié)同規(guī)劃問(wèn)題。KURZER等基于MCTS算法提出了一種車輛分布式協(xié)同軌跡規(guī)劃方法,將多車協(xié)同規(guī)劃看作多智能體馬爾科夫決策過(guò)程(Multi-agent MDP,MAMDP),由于MCTS性能主要受有效搜索深度影響,因此引入宏動(dòng)作來(lái)解決多智能體協(xié)同規(guī)劃導(dǎo)致的維數(shù)災(zāi)難問(wèn)題,加快算法收斂速度。在此工作基礎(chǔ)上,為了進(jìn)一步加快軌跡規(guī)劃過(guò)程,該作者將MDN與MCTS相結(jié)合,在動(dòng)作空間探索階段,MCTS的當(dāng)前狀態(tài)被轉(zhuǎn)換為特征向量并輸入到MDN中,以引導(dǎo)算法向目標(biāo)區(qū)域搜索,降低計(jì)算成本(圖12)。


Q-learning作為一種經(jīng)典的RL算法,目前已被廣泛應(yīng)用于單車軌跡規(guī)劃,但在車輛隊(duì)列或多車協(xié)同規(guī)劃領(lǐng)域的應(yīng)用依然較少。CHEN等采用Q-learning方法選擇車輛最佳合并軌跡,當(dāng)合并車輛與前后車輛間的行車距離相對(duì)安全且合并時(shí)間最優(yōu)時(shí)將獲得最大獎(jiǎng)勵(lì)回報(bào),并基于OBB碰撞檢測(cè)算法保證合并過(guò)程中的行車安全性。與Dijkstra和K最短路徑算法相比,該方法能顯著提高交通效率,降低燃油消耗與車輛并入時(shí)間。此外,GUO等將博弈論與多智能體強(qiáng)化學(xué)習(xí)(Multi-agent RL,MARL)方法相結(jié)合,利用合作博弈將單智能體Q-learning擴(kuò)展到多智能體系統(tǒng),以解決具有避障功能的多智能體協(xié)同規(guī)劃問(wèn)題。具體地,首先提出了一種合作博弈模型,用于智能體在復(fù)雜環(huán)境下實(shí)現(xiàn)具有避障功能的協(xié)同規(guī)劃。其次,設(shè)計(jì)了一種連續(xù)狀態(tài)空間上的值函數(shù)逼近多智能體Q-learning算法,用于求解合作博弈的納什均衡,可較好地解決算法易陷入局部極小值問(wèn)題。

4

車輛軌跡跟蹤控制

車輛隊(duì)列跟蹤控制模塊作為隊(duì)列預(yù)測(cè)巡航控制系統(tǒng)的核心組成部分,通過(guò)采用縱橫向車輛跟蹤控制算法,實(shí)現(xiàn)對(duì)規(guī)劃軌跡的精準(zhǔn)跟蹤控制。本文將隊(duì)列跟蹤控制劃分為預(yù)測(cè)巡航控制與車輛跟蹤控制2個(gè)部分,并對(duì)主流方法進(jìn)行了介紹。其中,預(yù)測(cè)巡航控制主要通過(guò)前方道路信息對(duì)車輛縱向速度進(jìn)行優(yōu)化,并實(shí)現(xiàn)車輛縱向跟隨控制;車輛跟蹤控制根據(jù)當(dāng)前車輛狀態(tài)信息以及車輛期望軌跡,通過(guò)車輛縱橫向控制算法完成隊(duì)列換道、合并、分離、超車、巡航等行為。

4.1 預(yù)測(cè)巡航控制

隊(duì)內(nèi)車輛保持較短車間距時(shí),可顯著降低空氣阻力,節(jié)省10%的燃油。LEVINE等于1966年最早提出車輛隊(duì)列控制問(wèn)題,并利用優(yōu)化控制理論設(shè)計(jì)了最優(yōu)線性反饋系統(tǒng),實(shí)現(xiàn)了車輛隊(duì)列跟隨控制。接著,為改善車輛燃油經(jīng)濟(jì)性,SCHWARZKOPF等在1977年首次對(duì)坡道工況下的車輛速度進(jìn)行優(yōu)化控制,為后續(xù)經(jīng)濟(jì)性巡航控制研究奠定了基礎(chǔ)。但是,傳統(tǒng)車輛巡航控制系統(tǒng)往往僅考慮了領(lǐng)航車周圍環(huán)境,忽略了坡度、交通信號(hào)、道路狀況等前方道路信息對(duì)隊(duì)列控制的影響。

4.1.1 單車預(yù)測(cè)巡航控制

如圖13所示,為進(jìn)一步提高車輛燃油經(jīng)濟(jì)性,利用前方道路信息預(yù)先調(diào)整車輛運(yùn)動(dòng)狀態(tài),實(shí)現(xiàn)車輛優(yōu)化控制的方法可以統(tǒng)稱為PCC或前瞻巡航控制(Look ahead cruise control,LAC)。近年來(lái),眾多學(xué)者針對(duì)PCC領(lǐng)域進(jìn)行了諸多研究,以改善單車或隊(duì)列行駛?cè)加徒?jīng)濟(jì)性。在城市道路行駛時(shí),由于道路交叉口眾多且存在大量交通信號(hào)設(shè)施,因此需要考慮交通信號(hào)對(duì)車輛燃油經(jīng)濟(jì)性的影響。ALRIFAEE等提出了一種適用于增程電動(dòng)車輛的MPC預(yù)測(cè)控制方法,利用前方道路交通信號(hào)燈信息減少通過(guò)交叉口車輛的停車等待時(shí)間,提高通行效率并改善燃油經(jīng)濟(jì)性。針對(duì)車輛巡航過(guò)程中的安全性和燃油經(jīng)濟(jì)性,羅禹貢等基于非線性模型預(yù)測(cè)理論提出了一種混合動(dòng)力汽車預(yù)測(cè)巡航的多目標(biāo)優(yōu)化控制算法。傳統(tǒng)ACC忽略了道路高程信息的影響,往往導(dǎo)致跟蹤誤差較大且燃油經(jīng)濟(jì)性不佳。LI等針對(duì)該問(wèn)題提出了模型預(yù)測(cè)自適應(yīng)巡航控制器,考慮車輛前方道路信息、車輛非線性動(dòng)力學(xué)等因素,可使車輛在斜坡道路上行駛時(shí)顯著降低油耗。為進(jìn)一步改善優(yōu)化控制效果,CHEN等提出了一種以發(fā)動(dòng)機(jī)轉(zhuǎn)矩、制動(dòng)力、變速器檔位作為優(yōu)化變量的PCC算法,將經(jīng)濟(jì)性、舒適性等作為優(yōu)化對(duì)象構(gòu)建目標(biāo)函數(shù),利用龐特里亞金極小值原理和二分法對(duì)所構(gòu)建的目標(biāo)函數(shù)進(jìn)行優(yōu)化求解。


4.1.2 隊(duì)列預(yù)測(cè)巡航控制

近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)PCC進(jìn)行了較為全面的研究,但應(yīng)用目標(biāo)多為單車控制,隨著車聯(lián)網(wǎng)技術(shù)的快速發(fā)展,車輛隊(duì)列的研究與應(yīng)用日益增多。相較于單車控制,車輛隊(duì)列PCC在改善燃油經(jīng)濟(jì)性方面體現(xiàn)更為顯著,已經(jīng)成為重要的研究發(fā)展方向。

(1) DP。DP算法作為一種靜態(tài)、離線獲取全局最優(yōu)解的控制方法,通常在對(duì)PCC系統(tǒng)進(jìn)行離散化處理后,將最優(yōu)控制問(wèn)題轉(zhuǎn)換為多階段決策問(wèn)題進(jìn)行求解,相較于局部?jī)?yōu)化與瞬時(shí)優(yōu)化,具有可獲取全局最優(yōu)解的優(yōu)勢(shì)。為探究前方道路地理信息對(duì)重型車輛隊(duì)列燃油經(jīng)濟(jì)性的影響,ALAM等對(duì)ACC系統(tǒng)與考慮前方道路地理信息的PCC系統(tǒng)進(jìn)行測(cè)試評(píng)估,結(jié)果表明,預(yù)測(cè)巡航控制器在上坡與下坡路段可分別減少0.7%和14%的燃油消耗。在此基礎(chǔ)上,該團(tuán)隊(duì)還設(shè)計(jì)了由運(yùn)輸層、隊(duì)列層、車輛層組成的三層體系結(jié)構(gòu)的運(yùn)輸系統(tǒng),運(yùn)輸層用于確定運(yùn)輸規(guī)劃與車輛路線,隊(duì)列層用于處理隊(duì)列形成并利用預(yù)測(cè)信息優(yōu)化隊(duì)列最優(yōu)車速,車輛層在保證隊(duì)列穩(wěn)定性的前提下實(shí)現(xiàn)隊(duì)內(nèi)車輛最優(yōu)車速的跟蹤控制。同樣,BESSELINK等也開(kāi)發(fā)了一種相似的三層重型車輛貨運(yùn)系統(tǒng)框架,分別為隊(duì)列層、協(xié)作層以及車輛層,協(xié)作層通過(guò)獲取前方道路信息進(jìn)行預(yù)測(cè)控制以優(yōu)化隊(duì)列最優(yōu)車速,從而進(jìn)一步降低燃油消耗,仿真結(jié)果顯示燃油經(jīng)濟(jì)性相較于傳統(tǒng)巡航控制器可提升5%以上。由于重型車輛質(zhì)量較大、風(fēng)阻系數(shù)較高,通過(guò)車輛隊(duì)列行駛可更為有效地減少燃油消耗和溫室氣體排放,TURRI等考慮道路地形預(yù)覽信息,提出一種重型車輛隊(duì)列雙層控制框架,其中DP算法用于計(jì)算上層燃油最佳速度曲線,MPC用于車輛下層實(shí)時(shí)控制,仿真結(jié)果表明,與使用標(biāo)準(zhǔn)隊(duì)列控制器相比,跟隨車輛可節(jié)省約12%的燃油。DP算法作為一種求解多階段決策問(wèn)題的全局最優(yōu)控制方法,目前已被廣泛用于車輛速度優(yōu)化問(wèn)題。為協(xié)同優(yōu)化重型車輛隊(duì)列的燃油消耗與運(yùn)輸效率,何龍強(qiáng)將燃油經(jīng)濟(jì)性與運(yùn)輸效率作為優(yōu)化目標(biāo),提出了基于空間域的網(wǎng)聯(lián)物流卡車隊(duì)列車速預(yù)測(cè)優(yōu)化方法,將遺傳算法(Genetic algorithm,GA)與非線性規(guī)劃相結(jié)合,利用混合遺傳算法對(duì)車輛擋位和車速進(jìn)行優(yōu)化控制,并在交通擁堵場(chǎng)景下進(jìn)行了仿真測(cè)試驗(yàn)證。相似的,JOHANSSON等考慮車輛最大加速度模型,將隊(duì)列燃油消耗與通行時(shí)間作為協(xié)同優(yōu)化目標(biāo),設(shè)計(jì)了基于DP算法的車輛隊(duì)列預(yù)測(cè)巡航控制策略,并在真實(shí)交通環(huán)境下對(duì)重型車輛隊(duì)列進(jìn)行了仿真測(cè)試,但并未將異構(gòu)隊(duì)列因素考慮在內(nèi)。異構(gòu)隊(duì)列由不同類型的車輛組成,相較于同構(gòu)隊(duì)列在優(yōu)化計(jì)算與安全約束等方面更為復(fù)雜。在假設(shè)車輛通信時(shí)刻處于理想狀態(tài)的前提下,GUO等提出一種考慮前方道路坡度的異質(zhì)卡車隊(duì)列分層控制框架,速度規(guī)劃層以燃油經(jīng)濟(jì)性為優(yōu)化目標(biāo)并將異質(zhì)車輛隊(duì)列視為整體,基于滾動(dòng)動(dòng)態(tài)規(guī)劃(Receding dynamic programming,RDP)算法計(jì)算平均最優(yōu)車速,通過(guò)反步控制實(shí)現(xiàn)車輛速度跟蹤。在實(shí)際行駛過(guò)程中,隊(duì)內(nèi)車輛通信無(wú)法時(shí)刻處于理想狀態(tài),存在通信延時(shí)、丟包等問(wèn)題。針對(duì)上述問(wèn)題,YANG等提出一種適用于具有時(shí)變不確定動(dòng)態(tài)和均勻通信延遲的分層隊(duì)列控制框架,上層基于考慮坡度、速度限制等道路信息的DP算法,決策出以燃油消耗量和通行時(shí)間最小為優(yōu)化目標(biāo)的最佳行駛車速,下層采用分布式無(wú)碰撞跟蹤控制算法對(duì)速度進(jìn)行跟蹤控制。

DP算法作為一種求解多階段決策問(wèn)題最優(yōu)化的全局優(yōu)化控制方法,需要預(yù)先獲取目標(biāo)路段的道路信息,且具有計(jì)算量大、求解時(shí)間較長(zhǎng)、無(wú)法考慮駕駛環(huán)境不確定性等缺點(diǎn),因此不適用于解決控制器的實(shí)時(shí)控制問(wèn)題。

(2) MPC。MPC根據(jù)當(dāng)前時(shí)刻系統(tǒng)狀態(tài),實(shí)時(shí)在線滾動(dòng)求解有限時(shí)域內(nèi)的多目標(biāo)優(yōu)化問(wèn)題,可有效彌補(bǔ)DP算法存在的不能進(jìn)行實(shí)時(shí)求解與在線優(yōu)化等缺陷。為解決網(wǎng)聯(lián)異質(zhì)車輛隊(duì)列的協(xié)同巡航控制問(wèn)題,HE等提出一種參數(shù)化協(xié)同預(yù)測(cè)巡航控制算法,考慮行車安全性、舒適性和燃油經(jīng)濟(jì)性等多目標(biāo)約束,設(shè)計(jì)了一種基于階梯式控制策略的協(xié)同式PCC算法,以降低在線求解的計(jì)算量。TURRI等并未考慮擋位傳動(dòng)比對(duì)燃油經(jīng)濟(jì)性的影響,且只對(duì)領(lǐng)航車速度進(jìn)行優(yōu)化。針對(duì)上述存在問(wèn)題,ZHAI等考慮空氣阻力、非線性發(fā)動(dòng)機(jī)油耗模型、離散傳動(dòng)比,基于分布式模型預(yù)測(cè)控制(Distributed model predictive control,DMPC)提出了一種車輛隊(duì)列協(xié)同預(yù)測(cè)控制策略,以提高隊(duì)內(nèi)車輛在不同坡道行駛的燃油效率。在此基礎(chǔ)上,該團(tuán)隊(duì)進(jìn)一步考慮了駕駛安全性,設(shè)計(jì)了重型車隊(duì)在不同坡度道路上行駛時(shí)DMPC預(yù)測(cè)控制器與緊急制動(dòng)安全控制器的切換控制策略。仿真結(jié)果表明,與基準(zhǔn)測(cè)試相比,該方法在保證隊(duì)列行駛安全的同時(shí)可節(jié)省21.88%的燃油消耗。考慮到對(duì)整個(gè)隊(duì)列進(jìn)行預(yù)測(cè)控制可有效減少開(kāi)放道路情況下的車輛油耗和行駛時(shí)間,THORMANN等提出了一種新型隊(duì)列車輛DMPC方法,可以允許隊(duì)內(nèi)車輛維持密集車間距并保持較小的通信需求,同時(shí)對(duì)通信丟包具有魯棒性,選擇受交通干擾的緊急制動(dòng)和車輛跟蹤作為測(cè)試場(chǎng)景,測(cè)試結(jié)果表明在通信要求較低的情況下隊(duì)列依然可保持較強(qiáng)穩(wěn)定性。劉歡利用前方道路坡度信息,采用DP、MPC算法求解多目標(biāo)優(yōu)化問(wèn)題,通過(guò)控制重型卡車隊(duì)列的發(fā)動(dòng)機(jī)力矩與擋位,實(shí)現(xiàn)隊(duì)列經(jīng)濟(jì)性巡航。仿真結(jié)果顯示,基于DP、MPC的PCC系統(tǒng)相較于傳統(tǒng)巡航控制在不影響行駛時(shí)間的前提下可節(jié)油4%~5%,DP與MPC的優(yōu)化結(jié)果相近,但MPC求解效率要遠(yuǎn)優(yōu)于DP算法。當(dāng)前,預(yù)測(cè)巡航控制通常采用基于模型的控制方法,但存在系統(tǒng)建模不精確等問(wèn)題。為解決上述問(wèn)題,GAO等提出了一種基于RL的自適應(yīng)最優(yōu)控制方法,在不影響安全性和舒適性的前提下有效減少了行程時(shí)間。利用道路高程交通信息,MYNUDDIN等提出了一種基于RL的分布式預(yù)測(cè)控制算法,可有效改善燃油經(jīng)濟(jì)性并縮短通行時(shí)間。因此,通過(guò)基于數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)設(shè)計(jì)預(yù)測(cè)巡航控制成為了新的解決途徑。

現(xiàn)有車輛隊(duì)列PCC系統(tǒng)通常僅關(guān)注車輛縱向動(dòng)力學(xué)并假設(shè)車輛處于直線行駛狀態(tài),忽略了道路曲率對(duì)車輛橫向動(dòng)力學(xué)的影響,與車輛實(shí)際行駛狀態(tài)存在差異,導(dǎo)致應(yīng)用范圍受限。針對(duì)多車合并問(wèn)題,GOLI等提出一種具有預(yù)測(cè)性的車輛控制策略,橫向跟蹤控制采用MPC實(shí)現(xiàn)優(yōu)化控制,并在車輛并入車隊(duì)以及多車合并組成車隊(duì)兩種模式下進(jìn)行了驗(yàn)證。其中,預(yù)測(cè)性可使被控車輛提前獲取前方道路信息,從而提高合并過(guò)程中的安全性與舒適性。為進(jìn)一步改善車輛隊(duì)列在不同道路曲率與坡度下的燃油經(jīng)濟(jì)性,YANG等考慮前方道路坡度與曲率信息,開(kāi)發(fā)了一種具有節(jié)能潛力的新型分層生態(tài)協(xié)同自適應(yīng)巡航控制(Ecological cooperative adaptive cruise control,ECACC),上層為基于DP算法的生態(tài)速度軌跡規(guī)劃,下層為前饋-反饋跟蹤控制。從開(kāi)源地圖OpenStreetMap中選取真實(shí)道路場(chǎng)景進(jìn)行仿真測(cè)試,與傳統(tǒng)能量最優(yōu)定速巡航相比,ECACC可降低38.1%的能耗,保證了隊(duì)列橫向穩(wěn)定性與能源效率。

PCC雖能根據(jù)前方道路坡度優(yōu)化隊(duì)列車速,但需要提前獲取道路坡度數(shù)據(jù)信息,增加了車輛運(yùn)行成本,且無(wú)法適用于未知道路信息的路段,限制了PCC的適用范圍。為克服上述PCC存在的局限性問(wèn)題,已有學(xué)者采用卡爾曼濾波、擴(kuò)展卡爾曼濾 波(Extended Kalman filter,EKF)等方法結(jié)合GPS定位對(duì)道路坡度、車輛狀態(tài)等信息進(jìn)行估測(cè)。為改善車輛性能,JO等基于概率數(shù)據(jù)關(guān)聯(lián)過(guò)濾器開(kāi)發(fā)了一種集成GPS接收器、車載傳感器和縱向車輛模型的道路坡度估計(jì)算法,并通過(guò)交互多模型濾波器實(shí)現(xiàn)不同坡道類型的應(yīng)用。現(xiàn)有估計(jì)方法通常設(shè)備成本高昂且需要與GPS配合使用,不易實(shí)現(xiàn)大規(guī)模量產(chǎn)應(yīng)用。為此,JAUCH等設(shè)計(jì)了一種基于方向?yàn)V波器和車輛IMU的道路坡度斜率估計(jì)方法,該方法成本較低且適用于GPS失效情況,其中方向?yàn)V波器融合了陀螺儀、加速度計(jì)和磁強(qiáng)計(jì)的測(cè)量值,以確定傳感器相對(duì)于地表的方向,并與高分辨率道路坡度數(shù)據(jù)進(jìn)行了對(duì)比驗(yàn)證。現(xiàn)有隊(duì)列PCC系統(tǒng)需要實(shí)際道路數(shù)據(jù)與精確的物理模型,增加了實(shí)現(xiàn)難度,NA等對(duì)傳統(tǒng)隊(duì)列預(yù)測(cè)控制進(jìn)行改進(jìn),提出了一種對(duì)車輛質(zhì)量與不確定性具有魯棒性的擾動(dòng)觀測(cè)器方法,實(shí)現(xiàn)從擾動(dòng)估計(jì)中提取坡度斜率信息,結(jié)合GPS構(gòu)建前方道路坡度信息,避免了需要提前獲取道路信息的弊端。

4.2 車輛跟蹤控制

隊(duì)內(nèi)車輛在執(zhí)行決策行為的過(guò)程中,車輛控制層需要進(jìn)行縱橫向跟蹤控制,以實(shí)現(xiàn)準(zhǔn)確跟蹤規(guī)劃層輸出的預(yù)期車輛軌跡,保證隊(duì)列行駛的安全性、經(jīng)濟(jì)性與舒適性。隊(duì)列縱橫向控制的主要目標(biāo)為通過(guò)控制油門與制動(dòng)踏板、前輪轉(zhuǎn)角來(lái)跟蹤規(guī)劃層的期望軌跡,使隊(duì)列按照預(yù)定位置與速度行駛。常用的隊(duì)列縱、橫向控制方法主要包括基于模型驅(qū)動(dòng)方法和基于數(shù)據(jù)驅(qū)動(dòng)方法。

4.2.1 模型驅(qū)動(dòng)方法

物理模型方法主要有PID、MPC、純跟隨(Pure pursuit,PP)、線性二次型調(diào)節(jié)器(Linear quadratic regulator,LQR)、SMC等。

(1) 模型預(yù)測(cè)控制。MPC具有模型預(yù)測(cè)、滾動(dòng)優(yōu)化、反饋校正的特點(diǎn),適用于解決“多輸入多輸出”(Multiple input multiple output,MIMO)的復(fù)雜系統(tǒng)控制問(wèn)題,通過(guò)在線求解有限時(shí)域的多目標(biāo)優(yōu)化問(wèn)題,并將最優(yōu)控制序列的第一分量作用于控制系統(tǒng)。DPMC算法作為一種擴(kuò)展算法,其優(yōu)勢(shì)在于可以將一個(gè)復(fù)雜全局優(yōu)化問(wèn)題分解為多個(gè)耦合局部MPC問(wèn)題,相較于集中式控制可以有效降低子系統(tǒng)間的通信負(fù)擔(dān)與計(jì)算復(fù)雜度,增強(qiáng)系統(tǒng)可靠性。

為保證隊(duì)列間的安全合并,PAUCA等提出一種由行為決策層、軌跡規(guī)劃層、跟蹤控制層組成的三層控制結(jié)構(gòu)。其中縱向控制采用考慮不同通信拓?fù)浣Y(jié)構(gòu)和丟包的DMPC隊(duì)列控制方法,以確保隊(duì)列車輛按預(yù)定速度行駛,并保持車輛間的安全距離,橫向控制采用基于MPC的軌跡跟隨控制器通過(guò)控制前輪轉(zhuǎn)角實(shí)現(xiàn)期望軌跡跟蹤。為驗(yàn)證控制方法的有效性,模擬車隊(duì)前方存在障礙物,需執(zhí)行強(qiáng)制車隊(duì)合并的場(chǎng)景,并對(duì)不同通信拓?fù)浣Y(jié)構(gòu)下的隊(duì)列穩(wěn)定性進(jìn)行了驗(yàn)證。當(dāng)前方車輛緊急變道時(shí),隊(duì)列需執(zhí)行緊急制動(dòng)以保證行駛安全性,但極易導(dǎo)致隊(duì)內(nèi)車輛間發(fā)生碰撞,因此,提前對(duì)周圍車輛駕駛意圖及軌跡進(jìn)行預(yù)測(cè)是必要的。KAZEMI等提出了一種以切入概率為輸入的CACC隨機(jī)模型預(yù)測(cè)控制器(Stochastic MPC,SMPC),切入概率表示為干擾車輛突然切入CACC隊(duì)列而導(dǎo)致的危險(xiǎn)情況嚴(yán)重程度,當(dāng)有車輛切入車隊(duì)時(shí),控制器能夠維持被控車輛與前方車輛的間距誤差與速度誤差接近于零。采用SPMD數(shù)據(jù)集中的真實(shí)切入駕駛場(chǎng)景,在兩種不同切入持續(xù)時(shí)間的工況下對(duì)SMPC與MPC進(jìn)行對(duì)比驗(yàn)證,結(jié)果顯示SPMC具有更快的響應(yīng)速度和更小的間距誤差。上述文獻(xiàn)假設(shè)隊(duì)列為同構(gòu)車輛,忽略了異構(gòu)車輛隊(duì)列對(duì)控制算法的影響。為確保異構(gòu)車輛隊(duì)列能對(duì)切入切出行為進(jìn)行準(zhǔn)確跟蹤控制,BASIRI等提出了一種基于分布式非線性模型預(yù)測(cè)控制(Distributed nonlinear MPC,DNMPC)車輛隊(duì)列跟蹤控制方法,利用分布式度量學(xué)習(xí)和基于交替方向乘子法的分布式優(yōu)化方法對(duì)DNMPC進(jìn)行優(yōu)化,并在不同通信拓?fù)浣Y(jié)構(gòu)下進(jìn)行仿真驗(yàn)證。結(jié)果表明,所提出的方法保證了隊(duì)內(nèi)車輛在控制過(guò)程中準(zhǔn)確跟蹤期望軌跡,可有效避免碰撞發(fā)生,但并未對(duì)隊(duì)列穩(wěn)定性進(jìn)行詳細(xì)分析。

(2) 滑模控制。滑模控制方法在應(yīng)對(duì)車輛參數(shù)不確定性與外界干擾等因素時(shí)具有較強(qiáng)的魯棒性,但傳統(tǒng)一階滑模控制存在輸出抖振問(wèn)題,不適用于車輛精確跟蹤控制,因此多種SMC衍生算法被提出并應(yīng)用。為解決模型參數(shù)不確定性及外部干擾的隊(duì)列跟蹤控制問(wèn)題,郭戈等提出2種基于PF和BD通信拓?fù)浣Y(jié)構(gòu)的分布式自適應(yīng)終端SMC控制和有限時(shí)間理論的分布式協(xié)同控制方法,分別保證系統(tǒng)的隊(duì)列穩(wěn)定性與強(qiáng)隊(duì)列穩(wěn)定性,并與傳統(tǒng)線性SMC控制器進(jìn)行對(duì)比驗(yàn)證。此外,為降低通信計(jì)算負(fù)擔(dān)并進(jìn)一步改善抖振問(wèn)題,CHEN等針對(duì)具有參數(shù)不確定性與外部干擾的車輛隊(duì)列魯棒控制問(wèn)題,提出了一種基于有限時(shí)間擾動(dòng)觀測(cè)器(Finite time disturbance observer,F(xiàn)TDO)的Super-twisting SMC方法。其中,參數(shù)不確定性、外部干擾和前車加速度通過(guò)FTDO估計(jì)為集中干擾,有效減少了通信負(fù)擔(dān)。相較于傳統(tǒng)SMC,Super-twisting SMC可以保證控制信號(hào)的連續(xù)性,從而避免了SMC中存在的抖振現(xiàn)象,同時(shí)將所提出的方法推廣到初始間距偏差非零的情況。最后,借助Lyapunov穩(wěn)定性理論與拉普拉斯變換,對(duì)單車穩(wěn)定性與強(qiáng)隊(duì)列穩(wěn)定性進(jìn)行了分析。

(3) 其他方法。PID及其衍生方法因其具有結(jié)構(gòu)簡(jiǎn)單、易于實(shí)現(xiàn)、控制效果良好等優(yōu)勢(shì)被廣泛應(yīng)用于工業(yè)控制領(lǐng)域。在車輛并入隊(duì)列的交通場(chǎng)景中,XU等將PID控制器用于變道車輛并入隊(duì)列的軌跡跟蹤控制,仿真測(cè)試結(jié)果表明,在保證車間安全距離的前提下,變道車輛可以快速并入車隊(duì)。為實(shí)現(xiàn)重型車輛隊(duì)列的合并和拆分,DASGUPTA 等設(shè)計(jì)了一種新型PID車輛隊(duì)列控制器,并利用VISSIM進(jìn)行了算法有效性驗(yàn)證。測(cè)試結(jié)果表明,所提出的控制器能夠保證在進(jìn)行跟蹤控制時(shí)的隊(duì)列穩(wěn)定性。純跟隨作為一種簡(jiǎn)單且實(shí)用的車輛控制算法,已大量應(yīng)用于車輛橫向跟蹤控制領(lǐng)域。在隊(duì)列行駛過(guò)程中,V2V通信無(wú)法保證處于理想狀態(tài),通信故障會(huì)嚴(yán)重影響隊(duì)列行駛安全性。LEE等提出了一種考慮通信延時(shí)與丟包的CAV分散式隊(duì)列控制系統(tǒng),其中控制層采用純跟隨與PID的方法分別進(jìn)行橫向與縱向控制,以實(shí)現(xiàn)車輛并入車隊(duì)的軌跡跟蹤控制。仿真結(jié)果顯示跟蹤控制方法可以使車輛有效跟蹤期望軌跡,車輛完成合并過(guò)程需要5.5 s,在低速情況下需要25 s可使隊(duì)列恢復(fù)穩(wěn)定性。純跟隨方法在低速場(chǎng)景下具有良好的車輛跟蹤控制性能,但不適用于高速場(chǎng)景。LQR算法本質(zhì)上為多目標(biāo)最優(yōu)控制問(wèn)題,可用于車輛高速跟蹤控制場(chǎng)景,因此,MA等考慮執(zhí)行器延時(shí)與非理想通信條件,將參數(shù)空間法與LQR相結(jié)合,提出了一種分布式協(xié)同車輛隊(duì)列的優(yōu)化控制方法,以保證隊(duì)列穩(wěn)定性和性能優(yōu)化。為評(píng)估所提方法的有效性與靈活性,在FTP-75與HWFET兩種真實(shí)循環(huán)測(cè)試工況下進(jìn)行了HIL測(cè)試。結(jié)果表明,控制器能夠保證隊(duì)列穩(wěn)定性,且具有良好的跟馳性能與駕駛舒適性。

4.2.2 數(shù)據(jù)驅(qū)動(dòng)方法

車輛隊(duì)列控制可以視為一種特殊的多智能體優(yōu)化問(wèn)題,由于MARL算法可以探索高維動(dòng)態(tài)環(huán)境,且具有對(duì)未知狀態(tài)的處理能力和較強(qiáng)的非線性函數(shù)逼近能力,目前已成為車輛隊(duì)列控制領(lǐng)域的重要發(fā)展方向。作為最早將RL應(yīng)用于CACC系統(tǒng)的案例,DESJARDINS等在2011年將RL應(yīng)用于車輛CACC系統(tǒng)的縱向跟隨控制,仿真結(jié)果顯示,該方法可有效改善CACC系統(tǒng)性能,提高車輛通行效率。為研究拓?fù)渫ㄐ徘袚Q、通信時(shí)延和外部干擾對(duì)車輛隊(duì)列的影響,WEN等提出了一種基于跟蹤誤差的采樣數(shù)據(jù)隊(duì)列控制方法,將隊(duì)列系統(tǒng)建模為帶干擾的馬爾科夫切換時(shí)滯系統(tǒng),并用馬爾科夫鏈表示通信拓?fù)淝袚Q。此外,針對(duì)現(xiàn)有深度強(qiáng)化學(xué)習(xí)(Deep reinforcement learning,DRL)普遍存在收斂速度較慢的問(wèn)題,PRATHIBA等基于DRL與GA算法,提出一種智能車輛隊(duì)列混合優(yōu)化算法,通過(guò)GA有效改善了DRL收斂速度。進(jìn)一步地,針對(duì)多車網(wǎng)絡(luò)中連續(xù)動(dòng)作空間探索效率低、算法收斂慢等問(wèn)題,LU等提出一種如圖14所示的隊(duì)列共享確定性策略梯度(Platoon sharing deep deterministic policy gradient,PSDDPG)算法,通過(guò)多車控制網(wǎng)絡(luò)模型的并行訓(xùn)練來(lái)改善算法收斂,提高了連續(xù)動(dòng)作空間的探索效率,并在DDPG算法噪聲的基礎(chǔ)上加入隊(duì)列噪聲,以增強(qiáng)探索過(guò)程中訓(xùn)練樣本的多樣性,有效提高了模型魯棒性,同時(shí),提出了一種回放緩存?zhèn)浞莘椒ǎ乐箻颖咎崛⌒实拖露绊懹?xùn)練效果,最后利用Carla模擬器在隊(duì)列合并、巡航、跟馳、超車和避障場(chǎng)景下對(duì)算法進(jìn)行了驗(yàn)證。現(xiàn)有MARL算法通常會(huì)向智能體提供冗余信息,增加了計(jì)算難度并影響算法收斂。為此,LI等將通信近端策略優(yōu)化(Communication proximal policy optimization,commPPO)算法應(yīng)用于隊(duì)列控制問(wèn)題,CommPPO采用參數(shù)共享結(jié)構(gòu),可允許隊(duì)內(nèi)車輛數(shù)量的動(dòng)態(tài)變化,便于處理隊(duì)列合并、分離等行為。同時(shí),還提出一種新型獎(jiǎng)勵(lì)機(jī)制,以解決MARL算法中存在的“虛假獎(jiǎng)勵(lì)”與“懶惰Agent”問(wèn)題。


4.2.3 數(shù)據(jù)與模型聯(lián)合驅(qū)動(dòng)方法

基于物理模型的隊(duì)列控制方法,雖然算法具有較好的可解釋性,但控制效果嚴(yán)重依賴模型建模精度,當(dāng)建模不準(zhǔn)確時(shí)會(huì)影響隊(duì)列整體性能及其穩(wěn)定性。機(jī)器學(xué)習(xí)方法雖然突破了物理模型的約束,可在復(fù)雜環(huán)境下進(jìn)行探索,但嚴(yán)重依賴訓(xùn)練樣本的質(zhì)量與數(shù)量,且算法內(nèi)部類似于“黑盒”,可解釋性較差,當(dāng)獎(jiǎng)勵(lì)函數(shù)設(shè)置不合理或出現(xiàn)未曾訓(xùn)練過(guò)的邊緣場(chǎng)景時(shí),易導(dǎo)致控制效果不佳。因此,為彌補(bǔ)上述方法的缺陷,部分學(xué)者提出了基于數(shù)據(jù)與模型聯(lián)合驅(qū)動(dòng)的優(yōu)化策略。為解決車輛隊(duì)列控制問(wèn)題,LIU等提出一種基于深度Q網(wǎng)絡(luò)和一致性算法的分布式強(qiáng)化學(xué)習(xí)方法,每輛車的Q網(wǎng)絡(luò)首先根據(jù)自身經(jīng)驗(yàn)進(jìn)行局部?jī)?yōu)化,然后采用一致性方法實(shí)現(xiàn)隊(duì)列狀態(tài)收斂。此外,YAN等研究了恒定車間時(shí)距下的隊(duì)列反饋控制問(wèn)題,將滑模集成(Integrated sliding mode,ISM)和自適應(yīng)神經(jīng)網(wǎng)絡(luò)(Adaptive neural network,ANN)相結(jié)合,設(shè)計(jì)了一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)滑模控制方法,并通過(guò)穩(wěn)定性理論證明隊(duì)列穩(wěn)定性。針對(duì)隊(duì)列分布式協(xié)同復(fù)合跟蹤控制問(wèn)題,LIU等利用ANN、反步控制和預(yù)設(shè)性能控制(Prescribed performance control,PPC),提出一種滿足字符串穩(wěn)定性的分布式復(fù)合控制協(xié)議。YAN等設(shè)計(jì)了一種車輛隊(duì)列混合跟馳策略,將DDPG與CACC相結(jié)合,取獎(jiǎng)勵(lì)值高的計(jì)算結(jié)果作為輸出,同時(shí),為降低算法頻繁切換的干擾,提出了一種算法軟切換機(jī)制。該方法的優(yōu)勢(shì)在于相較于基于物理模型的方法,DDPG無(wú)需精確的車輛物理模型且對(duì)復(fù)雜、未知的環(huán)境具有較好的適應(yīng)性,當(dāng)DDPG性能不佳時(shí)也可通過(guò)CACC保證跟車的基本性能。但DDPG存在過(guò)估計(jì)、算法穩(wěn)定性較差、可解釋性不強(qiáng)等弊端,導(dǎo)致車輛隊(duì)列難以達(dá)到預(yù)期性能。為改善PID需要進(jìn)行大量參數(shù)整定且適應(yīng)性較差的弊端,YANG等設(shè)計(jì)了一種基于DDPG-PID的車輛隊(duì)列跟隨控制方法,將DDPG算法用于實(shí)時(shí)調(diào)整PID參數(shù),輸出隊(duì)列最優(yōu)上層加速度。通過(guò)SUMO與硬件在環(huán)測(cè)試平臺(tái)(Hardware in the loop,HIL)在三種不同場(chǎng)景下對(duì)算法有效性進(jìn)行了測(cè)試。

然而,基于RL算法的隊(duì)列控制在模型訓(xùn)練過(guò)程中會(huì)面臨眾多問(wèn)題。首先,若訓(xùn)練單一神經(jīng)網(wǎng)絡(luò)同時(shí)控制多輛車,可能造成算法難以收斂;其次,由于隊(duì)內(nèi)每個(gè)車輛均有一個(gè)獎(jiǎng)勵(lì)函數(shù),導(dǎo)致隊(duì)列總體獎(jiǎng)勵(lì)函數(shù)復(fù)雜度較高,且隊(duì)內(nèi)車輛間的動(dòng)作輸出會(huì)相互干擾,影響算法性能;最后,當(dāng)隊(duì)列內(nèi)出現(xiàn)車輛切入切出時(shí),算法的固定輸入、輸出與實(shí)時(shí)變化的車輛數(shù)量無(wú)法匹配。傳統(tǒng)的解決方法通過(guò)訓(xùn)練一輛車的單一神經(jīng)網(wǎng)絡(luò),并將收斂模型分別應(yīng)用于隊(duì)內(nèi)每個(gè)車輛,但是該方法生成的訓(xùn)練樣本時(shí)單一的,因此模型無(wú)法處理復(fù)雜情況,且該方法無(wú)法適用于異構(gòu)車輛隊(duì)列控制。

5

總結(jié)與展望

本文首先針對(duì)車輛隊(duì)列“預(yù)測(cè)能力”不足的問(wèn)題,重點(diǎn)介紹了環(huán)境車輛運(yùn)動(dòng)軌跡預(yù)測(cè);然后,通過(guò)狀態(tài)機(jī)、博弈論、機(jī)器學(xué)習(xí)、模型與數(shù)據(jù)混合優(yōu)化等4類方法,對(duì)隊(duì)列協(xié)同行為決策進(jìn)行了詳細(xì)概述;接著,從物理建模與數(shù)據(jù)驅(qū)動(dòng)等2個(gè)角度,對(duì)多車協(xié)同軌跡規(guī)劃的最新研究進(jìn)展進(jìn)行了梳理;最后,分別從預(yù)測(cè)巡航控制、車輛跟蹤控制2個(gè)方面,介紹了當(dāng)前車輛隊(duì)列跟蹤控制的研究現(xiàn)狀。

(1) 現(xiàn)有的車輛隊(duì)列控制研究,主要針對(duì)隊(duì)列穩(wěn)定性、隊(duì)形切換、避障等問(wèn)題,而對(duì)于利用車路協(xié)同提前獲取前方道路的地理、交通等信息,以及長(zhǎng)時(shí)預(yù)測(cè)周邊環(huán)境車輛運(yùn)動(dòng)軌跡的研究不足,車輛隊(duì)列的“預(yù)測(cè)能力”不強(qiáng)。隨著車路協(xié)同、高精地圖等技術(shù)的大力推動(dòng),車輛隊(duì)列系統(tǒng)可獲取“超視距”、“富信息”、高精度的環(huán)境狀態(tài),這將有助于從行車安全性、經(jīng)濟(jì)性、舒適性等多方面,提高車輛隊(duì)列系統(tǒng)的性能和應(yīng)用效果。因此,如何高效地利用這些環(huán)境狀態(tài)信息,并將其準(zhǔn)確地反映在車輛隊(duì)列系統(tǒng)中,是未來(lái)的研究重點(diǎn)。

(2) 傳統(tǒng)的車輛隊(duì)列協(xié)同行為決策主要從車輛運(yùn)動(dòng)學(xué)或動(dòng)力學(xué)模型出發(fā),通過(guò)狀態(tài)機(jī)構(gòu)建目標(biāo)條件來(lái)獲得多車運(yùn)動(dòng)狀態(tài)轉(zhuǎn)換策略。然而,動(dòng)態(tài)交通環(huán)境復(fù)雜多變、多車協(xié)同決策存在交互性,基于狀態(tài)機(jī)方法易導(dǎo)致車輛決策失誤。博弈論、深度強(qiáng)化學(xué)習(xí)等方法雖能有效改善上述問(wèn)題,但也存在諸如收益函數(shù)設(shè)計(jì)困難、算法可解釋性不強(qiáng)、嚴(yán)重依賴訓(xùn)練樣本的數(shù)量與質(zhì)量等弊端。另外,大部分研究通常關(guān)注局部范圍內(nèi)車輛的行駛狀態(tài),忽略了決策執(zhí)行后對(duì)整體交通流的影響。因此,如何將博弈論與深度強(qiáng)化學(xué)習(xí)方法結(jié)合,提高收益函數(shù)設(shè)計(jì)的合理性與準(zhǔn)確性,使車輛隊(duì)列行為決策在動(dòng)態(tài)交通環(huán)境下達(dá)到多目標(biāo)最優(yōu),是未來(lái)的研究趨勢(shì)。

(3) 當(dāng)前,車輛軌跡規(guī)劃通常采用基于物理建模的規(guī)劃...

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
4天股價(jià)翻倍!抗癌概念股,全線爆發(fā)!

4天股價(jià)翻倍!抗癌概念股,全線爆發(fā)!

證券時(shí)報(bào)e公司
2025-04-26 21:20:45
男子稱喝中藥治肺結(jié)節(jié)三個(gè)月后反變大增多,自貢衛(wèi)健委回應(yīng)

男子稱喝中藥治肺結(jié)節(jié)三個(gè)月后反變大增多,自貢衛(wèi)健委回應(yīng)

澎湃新聞
2025-04-25 15:20:28
全紅嬋的一句話,就讓李寧這個(gè)大老板立馬改方案,太佩服了!

全紅嬋的一句話,就讓李寧這個(gè)大老板立馬改方案,太佩服了!

說(shuō)說(shuō)史事
2025-04-26 10:28:34
世錦賽又一冷門!一場(chǎng)13-6大勝,讓奧沙利文狂喜,中國(guó)也獲好消息

世錦賽又一冷門!一場(chǎng)13-6大勝,讓奧沙利文狂喜,中國(guó)也獲好消息

趙仔說(shuō)
2025-04-26 11:20:28
美國(guó)拒發(fā)簽證,中國(guó)代表無(wú)法入境,耿爽發(fā)聲,聯(lián)合國(guó)搬遷勢(shì)在必行

美國(guó)拒發(fā)簽證,中國(guó)代表無(wú)法入境,耿爽發(fā)聲,聯(lián)合國(guó)搬遷勢(shì)在必行

說(shuō)天說(shuō)地說(shuō)實(shí)事
2025-04-27 02:53:11
黑龍江富豪慘遭滅門,保姆裝死逃過(guò)一劫,保姆:兇手怎么會(huì)是他?

黑龍江富豪慘遭滅門,保姆裝死逃過(guò)一劫,保姆:兇手怎么會(huì)是他?

林林故事揭秘
2025-04-10 17:37:49
深夜打虎,侯有龍被查!

深夜打虎,侯有龍被查!

魯中晨報(bào)
2025-04-26 09:36:03
廣廈G1大勝遼寧各界說(shuō)啥?好評(píng)裁判,王博獲認(rèn)可,蘇群點(diǎn)遼寧弊端

廣廈G1大勝遼寧各界說(shuō)啥?好評(píng)裁判,王博獲認(rèn)可,蘇群點(diǎn)遼寧弊端

籃球資訊達(dá)人
2025-04-27 00:33:33
演藝圈大變天了,演員都無(wú)戲可拍了!

演藝圈大變天了,演員都無(wú)戲可拍了!

喜歡歷史的阿繁
2025-04-19 00:35:00
今年一號(hào)臺(tái)風(fēng)蝴蝶或生成,廣西人面臨兩難問(wèn)題,來(lái)和不來(lái)都尷尬

今年一號(hào)臺(tái)風(fēng)蝴蝶或生成,廣西人面臨兩難問(wèn)題,來(lái)和不來(lái)都尷尬

天天話事
2025-04-26 11:18:54
2025年逆天改命的四大生肖,生來(lái)富貴,注定享盡繁華!

2025年逆天改命的四大生肖,生來(lái)富貴,注定享盡繁華!

星辰生肖館
2025-04-23 00:27:29
解氣!中韓海警在黃海打了一架,東大收回被韓強(qiáng)占25年的蘇巖礁

解氣!中韓海警在黃海打了一架,東大收回被韓強(qiáng)占25年的蘇巖礁

一頁(yè)史書
2025-04-26 12:50:23
彩票賣不動(dòng)了

彩票賣不動(dòng)了

經(jīng)濟(jì)觀察報(bào)
2025-04-26 21:06:12
1500萬(wàn)粉絲網(wǎng)紅宣布停播,2年帶貨32億元,日入400萬(wàn)!網(wǎng)友:套路

1500萬(wàn)粉絲網(wǎng)紅宣布停播,2年帶貨32億元,日入400萬(wàn)!網(wǎng)友:套路

小人物看盡人間百態(tài)
2025-04-25 12:16:21
老師出上聯(lián):火去兩點(diǎn)便是人,學(xué)生對(duì)出精彩下聯(lián),老師都甘拜下風(fēng)

老師出上聯(lián):火去兩點(diǎn)便是人,學(xué)生對(duì)出精彩下聯(lián),老師都甘拜下風(fēng)

水墨詩(shī)夢(mèng)
2025-04-14 10:45:35
“美人魚”女演員當(dāng)眾暈厥抽搐,仍在ICU!這癥狀常被當(dāng)小毛病,其實(shí)很致命……

“美人魚”女演員當(dāng)眾暈厥抽搐,仍在ICU!這癥狀常被當(dāng)小毛病,其實(shí)很致命……

環(huán)球網(wǎng)資訊
2025-04-26 21:25:46
如果接下來(lái)出現(xiàn)牛市,死記“五個(gè)數(shù)字”:10、20、50、60、721

如果接下來(lái)出現(xiàn)牛市,死記“五個(gè)數(shù)字”:10、20、50、60、721

金少財(cái)經(jīng)
2024-12-08 22:58:53
存活了近200年,歷史地位卻為零,這個(gè)王朝為何被史家集體遺忘?

存活了近200年,歷史地位卻為零,這個(gè)王朝為何被史家集體遺忘?

文史道
2025-04-26 17:16:18
演員夏依丹被曝去世

演員夏依丹被曝去世

動(dòng)物奇奇怪怪
2025-04-26 15:09:16
“萌娃外交”計(jì)劃曝光:哈里想靠孩子軟化老爹?

“萌娃外交”計(jì)劃曝光:哈里想靠孩子軟化老爹?

全球奇趣娛樂(lè)八卦
2025-04-25 22:12:27
2025-04-27 04:04:49
機(jī)械工程學(xué)報(bào) incentive-icons
機(jī)械工程學(xué)報(bào)
《機(jī)械工程學(xué)報(bào)》編輯部
4961文章數(shù) 13273關(guān)注度
往期回顧 全部

汽車要聞

充電5分鐘續(xù)航100公里 探訪華為兆瓦超充站

頭條要聞

特朗普將舉行集會(huì)慶祝執(zhí)政100天 美媒:時(shí)機(jī)不妙

頭條要聞

特朗普將舉行集會(huì)慶祝執(zhí)政100天 美媒:時(shí)機(jī)不妙

體育要聞

廣廈19分勝遼寧獲開(kāi)門紅 孫銘徽13分3助崴腳

娛樂(lè)要聞

金掃帚獎(jiǎng)出爐,包貝爾意外獲“影帝”

財(cái)經(jīng)要聞

韓國(guó)的"宇樹(shù)科技" 是怎樣被財(cái)閥毀掉的?

科技要聞

百度心響實(shí)測(cè):“能用版Manus”開(kāi)了個(gè)好頭

態(tài)度原創(chuàng)

本地
親子
房產(chǎn)
公開(kāi)課
軍事航空

本地新聞

云游湖北 | 漢川文旅新體驗(yàn):千年陶藝邂逅湖光

親子要聞

這首歌是為有兒子的家庭量身打造的吧? 楊雪呀

房產(chǎn)要聞

教育理念再進(jìn)階!解碼新世界星輝如何構(gòu)筑「家校社成長(zhǎng)生態(tài)圈」!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

白宮爭(zhēng)吵后特朗普與澤連斯基"首度"碰面

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 杭锦旗| 隆尧县| 布尔津县| 桃园县| 东乡县| 沂源县| 龙口市| 色达县| 大足县| 体育| 阳江市| 连城县| 荥经县| 高阳县| 仁怀市| 科技| 故城县| 贵溪市| 琼海市| 丰原市| 外汇| 鲜城| 宁海县| 永安市| 方城县| 金川县| 甘泉县| 苗栗市| 麟游县| 额敏县| 宝清县| 西昌市| 高青县| 全椒县| 望奎县| 罗城| 阿拉尔市| 昂仁县| 渭南市| 光泽县| 瓦房店市|