- 相關(guān)推薦
基于增強學習的無人直升機姿態(tài)控制器設(shè)計
自適應啟發(fā)評價(AHC)增強學習結(jié)構(gòu)分別逼近馬爾可夫決策過程的值函數(shù)和策略函數(shù),策略梯度增強學習能夠?qū)㈦S機不確定的馬爾可夫決策過程轉(zhuǎn)換為確定性的馬爾可夫決策過程.通過將AHC增強學習和策略梯度增強學習相結(jié)合,對PID控制器參數(shù)進行在線自適應整定,實現(xiàn)對無人直升機姿態(tài)控制性能的在線優(yōu)化.仿真結(jié)果表明,與固定PID參數(shù)控制器相比,該算法能在線調(diào)整控制器參數(shù),并很好地控制了無人直升機的懸停姿態(tài).
作 者: 蔡文瀾 王俊生 稅海濤 馬宏緒 黃茜薇 CAI Wenlan WANG Junsheng SHUI Haitao MA Hongxu HUANG Qianwei 作者單位: 蔡文瀾,CAI Wenlan(國防科學技術(shù)大學機電工程與自動化學院,長沙,410073;空軍航空大學航空控制工程系,長春,130022)王俊生,稅海濤,馬宏緒,黃茜薇,WANG Junsheng,SHUI Haitao,MA Hongxu,HUANG Qianwei(國防科學技術(shù)大學機電工程與自動化學院,長沙,410073)
刊 名: 彈箭與制導學報 PKU 英文刊名: JOURNAL OF PROJECTILES, ROCKETS, MISSILES AND GUIDANCE 年,卷(期): 2008 28(2) 分類號: V249.1 TP273 關(guān)鍵詞: 無人直升機 增強學習 自適應啟發(fā)評價 策略梯度 PEGASUS【基于增強學習的無人直升機姿態(tài)控制器設(shè)計】相關(guān)文章:
基于586-Engine的無人機飛行控制器設(shè)計04-30
無人直升機模型體系設(shè)計04-27
基于穩(wěn)定度設(shè)計的空間站姿態(tài)TEA穩(wěn)定LQR控制器04-29
基于TMS320F2810的小型無人機控制器的設(shè)計04-27
自組織增強學習模糊神經(jīng)網(wǎng)控制器的設(shè)計04-29
考慮控制飽和的衛(wèi)星姿態(tài)控制器設(shè)計04-26