從經(jīng)驗尋路到智能演化,AUV如何在看不見的深海里,規(guī)劃出一條最高效、最安全的航路?
浩瀚的海洋占據(jù)了地球表面的大部分,是氣候調(diào)節(jié)、資源寶庫和國家安全的關鍵領域。然而,深海的可見度、通信受限以及復雜多變的洋流環(huán)境,使人類的探索步履維艱。
正是在這樣的挑戰(zhàn)下,自主水下航行器(AUV)憑借其顯著的自主性、環(huán)境適應性及任務靈活性,逐步成為海底測繪、環(huán)境監(jiān)測、軍事偵察及深海資源勘探的核心裝備,并逐漸替代傳統(tǒng)的載人潛水器(HOV)與遙控潛水器(ROV)。
然而,在“伸手不見五指”的深海里,僅僅擁有強大的軀體還不夠。它如何規(guī)劃出一條從起點到目標、既能避開重重障礙,又能順應洋流節(jié)省能量的最優(yōu)路徑?
近日,香港城市大學康文斌團隊與河海大學劉增輝團隊在機器人領域權(quán)威期刊《Journal of Field Robotics》(JFR)發(fā)表了一篇題為《A Review on Path Planning for Autonomous Underwater Vehicles: From Models, Classical Methods, and Learning-Based Intelligence Perspectives》的綜述。

該綜述創(chuàng)新性地提出了一個“環(huán)境建模-算法演進-學習決策”三維耦合的系統(tǒng)視角,突破了傳統(tǒng)研究分類精確但界面模糊的局限,為理解AUV路徑規(guī)劃提供了整體性視角。文中不僅系統(tǒng)剖析了AUV運動動力學建模、地形和海流場重建、多AUV協(xié)同任務分配等關鍵技術(shù)的最新進展,還清晰勾勒出從經(jīng)典算法到機器學習方法的演進脈絡,為下一代AUV實現(xiàn)全自主、強適應的智能導航奠定了理論基礎。


▍高精度的環(huán)境感知與任務建模
要讓AUV在深海中自主、高效地完成任務,其核心在于構(gòu)建一個更加完整的路徑規(guī)劃框架。文章指出,這一框架的構(gòu)建必須同步考量AUV自身運動特性、外部環(huán)境建模以及任務優(yōu)化策略這三大要素,這三者是智能決策的基礎。
在AUV自身運動特性方面,文章將AUV視為六自由度(6-DoF)剛體系統(tǒng),不僅要通過運動學描述其位置與姿態(tài),更需利用動力學模型解析水動力對軌跡的復雜影響。為了在保證精度的同時降低計算成本,當前的建模趨勢是將計算流體力學(CFD)與半經(jīng)驗模型或數(shù)據(jù)驅(qū)動方法相結(jié)合,以實現(xiàn)兼顧效率與準確性的運動約束描述。
高精度的外部環(huán)境建模是路徑規(guī)劃的決策依據(jù)。
面對復雜多變的水下地形與洋流,傳統(tǒng)的聲吶測繪往往存在數(shù)據(jù)離散的問題,而基于深度學習的地形重構(gòu)技術(shù)已能有效填補信息盲區(qū)。同時對于非線性的洋流干擾,文章也闡述了如何通過數(shù)值模擬構(gòu)建三維流場模型,甚至結(jié)合強化學習預測流場變化,實現(xiàn)從被動適應環(huán)境到主動利用洋流降低能耗。
而任務優(yōu)化策略則是實現(xiàn)自主決策的關鍵一環(huán)。針對單體AUV,策略重點在于如何在環(huán)境約束下尋找能耗最低的可行路徑;而在多AUV協(xié)同場景中,任務規(guī)劃則側(cè)重于任務分配與通信協(xié)調(diào)的多目標優(yōu)化問題。
此外,為了應對多AUV寫作的水下通信帶寬受限的挑戰(zhàn),文章指出,基于分布式強化學習和博弈論的策略正在取代傳統(tǒng)的集中式調(diào)度,使集群能夠在缺乏全局信息的情況下實現(xiàn)高效的協(xié)同作業(yè)。
▍傳統(tǒng)算法,在深海中“摸石頭過河”
在人工智能大規(guī)模應用之前,傳統(tǒng)算法為AUV的路徑規(guī)劃奠定了基礎。論文將這些方法大致分為全局規(guī)劃和局部規(guī)劃,各有所長,也各有局限。
全局規(guī)劃(Global Planning),如同在出發(fā)前就拿到一張詳細的航海圖,適用于環(huán)境相對已知、靜態(tài)的場景。
以Dijkstra和A*為代表的圖搜索算法最具特點。Dijkstra算法通過遍歷所有節(jié)點確保獲取全局最優(yōu)解,但在高維狀態(tài)空間下,其計算復雜度隨搜索規(guī)模呈指數(shù)級增長。
A*算法則通過引入啟發(fā)式函數(shù)提高了搜索效率,但在復雜約束環(huán)境下,其生成的路徑往往存在不連續(xù)性,平滑度較低。
相比之下,面對高維非結(jié)構(gòu)化環(huán)境的挑戰(zhàn),基于采樣的路徑規(guī)劃方法(如RRT及其變體)表現(xiàn)出更強的空間探索能力,能夠有效處理非完整性約束。不過,這種方法隨機性強,生成的路徑可能曲折,通常需結(jié)合二次優(yōu)化算法進行平滑處。
此外,受自然啟發(fā)的群體智能算法,如遺傳算法(GA)、蟻群算法(ACO)和粒子群算法(PSO),在處理多目標優(yōu)化時表現(xiàn)出色。但它們也面臨“選擇困難癥”,在全局搜索和收斂速度間難以平衡,易陷入局部最優(yōu)解。
如果說全局規(guī)劃是戰(zhàn)略布局,那么局部路徑規(guī)劃則是戰(zhàn)術(shù)上的即時反應,專門應對航行中突然出現(xiàn)的未知障礙。
人工勢場法(APF)通過構(gòu)建由目標引力場和障礙物斥力場疊加的虛擬力場,實現(xiàn)避障邏輯的實時計算。盡管其計算負荷低、響應迅速,但在復雜障礙物下,APF存在局部極小值問題,可能導致AUV在受力平衡點發(fā)生停滯。
動態(tài)窗口法(DWA)則在速度空間內(nèi)建立約束模型,通過采樣并模擬推演符合動力學特性的軌跡。DWA在處理動態(tài)障礙物時具有較好的魯棒性,但由于其搜索窗口受限于局部感知范圍,搜索范圍受限。
在復雜的三維地形中,DWA難以獨立保證路徑的全局連貫性,因此在實際應用中,通常采用“全局引導、局部避障”的混合規(guī)劃架構(gòu)。
▍機器學習,海洋中的自進化導航
隨著機器學習技術(shù)(ML)的成熟,AUV路徑規(guī)劃正由傳統(tǒng)的“規(guī)則驅(qū)動”向“數(shù)據(jù)驅(qū)動”范式演進。ML通過挖掘高維數(shù)據(jù)的特征關聯(lián),顯著提高AUV在復雜、動態(tài)及非結(jié)構(gòu)化海洋環(huán)境中的自主決策能力與環(huán)境適應性。
在數(shù)據(jù)驅(qū)動架構(gòu)中,監(jiān)督學習主要用于環(huán)境特征提取與非線性映射。生物啟發(fā)神經(jīng)網(wǎng)絡(BINN)通過模擬神經(jīng)元的興奮與抑制機制,在動態(tài)避障過程中生成平滑的運動軌跡。卷積神經(jīng)網(wǎng)絡(CNN)則發(fā)揮其在空間特征提取方面的優(yōu)勢,針對水下光學/聲學圖像模糊及特征稀疏的問題,實現(xiàn)了從環(huán)境原始輸入到最優(yōu)決策路徑的端到端精準映射。
針對多AUV協(xié)作系統(tǒng)中的任務分配難題,無監(jiān)督學習提供了高效的聚類方案。自組織映射(SOM)網(wǎng)絡與K-Means算法可在缺乏標簽數(shù)據(jù)的前提下,自動提取環(huán)境特征,并對任務空間進行合理劃分。此類算法在實現(xiàn)多智能體系統(tǒng)的負載均衡與資源優(yōu)化配置方面具有顯著的計算效率優(yōu)勢。
強化學習(RL)通過構(gòu)建智能體與環(huán)境的交互閉環(huán),使AUV具備了在復雜工況下的自主演化能力。基于“狀態(tài)-動作-獎勵”的反饋機制,經(jīng)典的Q-learning及其深度演進版本(如DQN、DDPG、PPO等)允許AUV在無先驗環(huán)境知識的條件下,通過連續(xù)試驗自主習得最優(yōu)策略。
深度強化學習(DRL)在處理非線性干擾方面具有顯著優(yōu)勢,例如深度確定性策略梯度算法(DDPG)已被應用于時變流場環(huán)境中的水下滑翔機軌跡控制,有效增強了系統(tǒng)在擾動條件下的魯棒性。
針對集群作業(yè),多智能體強化學習(MARL)解決了非平穩(wěn)環(huán)境下的協(xié)作難題,支持AUV集群在受限通信條件下通過分布式學習實現(xiàn)最優(yōu)任務分配與協(xié)同。

▍未來航線,駛向真正的“海洋智能”
盡管AUV路徑規(guī)劃技術(shù)已取得顯著進展,但在實際工程應用中,仍面臨環(huán)境不確定性、水聲通信帶寬受限以及機載計算資源瓶頸等核心挑戰(zhàn)。
針對上述問題,未來的研究,正聚焦于三個關鍵方向,旨在賦予AUV更深邃的“海洋智能”。
首先,引入元學習(Meta-Learning)與終身學習(Lifelong Learning)機制。通過構(gòu)建具有快速適應能力的模型架構(gòu),使系統(tǒng)能夠利用極少量的環(huán)境樣本實現(xiàn)跨海域任務的快速遷移與知識積累,從而顯著提升路徑規(guī)劃算法的泛化性能。
其次,強化多模態(tài)感知融合(Multimodal Fusion)技術(shù)。通過集成前視聲吶、視覺SLAM、磁力計及慣性導航系統(tǒng)(INS)等多源傳感器數(shù)據(jù),利用多模態(tài)信息互補增強環(huán)境建模的可靠性,為復雜環(huán)境下的實時路徑規(guī)劃提供穩(wěn)健的數(shù)據(jù)基礎。
最后,推動輕量化模型與邊緣計算(Edge Computing)的協(xié)同優(yōu)化。針對AUV嵌入式處理器算力限制的問題,研究方向可以側(cè)重于神經(jīng)網(wǎng)絡剪枝、量化等模型壓縮技術(shù),并結(jié)合邊緣計算架構(gòu)將部分非實時計算任務卸載至協(xié)同平臺。
這種協(xié)同架構(gòu)能夠在降低機載功耗的同時,提升系統(tǒng)執(zhí)行實時自主規(guī)劃任務的效率。這篇綜述不僅厘清了技術(shù)脈絡,更為新一代AUV的路徑規(guī)劃系統(tǒng)建立了一個統(tǒng)一、科學的理論框架,指引著海洋機器人向著更智能、更高效、更自主的深藍未來邁進。