基于遺忘因子高階迭代學習的推進器控制方法及系統

文檔序號:31134069發布日期:2022-08-13 09:16來源:國知局
基于遺忘因子高階迭代學習的推進器控制方法及系統

1.本發明屬于軌跡跟蹤控制領域,尤其涉及基于遺忘因子高階迭代學習的推進器控制方法及系統。


背景技術:

2.本部分的陳述僅僅是提供了與本發明相關的背景技術信息,不必然構成在先技術。
3.海洋機器人工作環境復雜多變,而且系統是一個典型的高度非線性、強耦合的運動學以及動力學系統,其高精度控制問題一直是控制領域研究的熱點?,F階段的海洋機器人軌跡跟蹤的精確控制方法有滑??刂?、魯棒控制、整數階學習控制等;然而,滑??刂坪汪敯艨刂瓶刂品椒ň鶠榛谀P涂刂?,海洋機器人實際運行過程中難以對復雜環境下系統精準建模;整數階迭代學習控制可控參數少,達不到迅速準確。
4.分數階迭代學習控制不僅擁有整數階迭代學習控制非常簡單的方式和需要較少的先驗知識的優勢,還增加了參數的控制,因此得到了廣泛的研究和應用?,F有的控制方法可以實現機器人對期望軌跡的完全跟蹤,然而當系統要求提高收斂速度,迅速達到軌跡跟蹤控制的精度時,現有的方法適應性較差,不能滿足要求;另一方面,現有學習控制方法均為單階算法,其不能充分完全多次利用以前的信息,使得控制器的穩定性以及自適應性不強。
5.發明人發現,目前的方案中存在以下技術問題:
6.公開號為cn106393116a的發明專利雖然可以進行軌跡跟蹤,但其是直接基于運動模型獲取實際運動軌跡無法充分考慮水下環境對系統的外界影響,與實際的運動模型會存在較大差異,無法準確的描述海洋機器人推進器的運動軌跡。
7.另外,當系統變為復雜的非線性系統以及存在外界擾動時,仍然采用線性系統的時滯軌跡跟蹤控制方法獲取實際運動軌跡,會出現發散時效,進而無法完成軌跡的有效跟蹤。


技術實現要素:

8.為了解決上述背景技術中存在的至少一項技術問題,本發明提供基于遺忘因子高階迭代學習的推進器控制方法及系統,其為了解決系統變為復雜的非線性系統以及存在外界擾動時,通過設計遺忘因子分數階高階迭代學習控制器完成軌跡的有效跟蹤。
9.為了實現上述目的,本發明采用如下技術方案:
10.本發明的第一個方面提供基于遺忘因子高階迭代學習的推進器控制方法,包括如下步驟:
11.以推進器為運動控制對象,基于坐標系以及推進器的特性構建推進器系統的運行動力學模型;
12.預設推進器系統的期望軌跡,依據推進器系統輸出的與期望軌跡的誤差信息、遺
忘因子以及相應的分數階變換構造遺忘因子分數階高階迭代學習控制器;
13.初始化推進器系統的運行動力學模型,依據收斂性條件調整遺忘因子分數階高階迭代學習控制器,通過控制器作用于推進器系統,獲取推進器系統的實際運行軌跡;
14.判斷推進器系統的實際運行軌跡是否滿足期望軌跡,若是,獲得期望的實際運動軌跡,否則根據實際運行軌跡和期望軌跡的誤差,通過分數階微積分變換后修正所述控制器直至完成推進器系統的軌跡跟蹤。
15.本發明的第二個方面提供基于遺忘因子高階迭代學習的推進器控制系統,包括:
16.動力學模型構建,被配置為:以推進器為運動控制對象,基于坐標系以及推進器的特性構建推進器系統的運行動力學模型;
17.控制器構造,被配置為:預設推進器系統的期望軌跡,依據推進器系統輸出的與期望軌跡的誤差信息、遺忘因子以及相應的分數階變換構造遺忘因子分數階高階迭代學習控制器;
18.實際運行軌跡獲取模塊,被配置為:初始化推進器系統的運行動力學模型,依據收斂性條件調整遺忘因子分數階高階迭代學習控制器,通過控制器作用于推進器系統,獲取推進器系統的實際運行軌跡;
19.判斷推進器系統的實際運行軌跡是否滿足期望軌跡,若是,獲得期望的實際運動軌跡,否則根據實際運行軌跡和期望軌跡的誤差,通過分數階微積分變換后修正所述控制器直至完成推進器系統的軌跡跟蹤。
20.本發明的第三個方面提供一種計算機可讀存儲介質。
21.一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如上述所述的基于遺忘因子高階迭代學習的推進器控制方法中的步驟。
22.本發明的第四個方面提供一種計算機設備。
23.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述所述的基于遺忘因子高階迭代學習的推進器控制方法中的步驟。
24.與現有技術相比,本發明的有益效果是:
25.本發明為了解決現有技術直接基于運動模型獲取實際運動軌跡無法充分考慮水下環境對系統的外界影響,與實際的運動模型會存在較大差異,無法準確的描述海洋機器人推進器的運動軌跡,通過構造遺忘因子分數階高階迭代學習控制器獲取推進器的運動軌跡,在控制器中運用了當前誤差信息,還增加了前期數據信息,增加了可調參數變量,保證了系統的收斂性,消除了海洋環境擾動對系統的影響,使得控制器的控制律具有更好的穩定性和適應性。
26.本發明有效地利用了遺忘因子分數階高階迭代學習律較傳統迭代學習在調節跟蹤學習單調收斂上的獨特優勢,此外還增加了誤差信息的次數以及可調參數,提高了收斂速度,消除外界擾動,使得海洋機器人能夠快速的實現軌跡跟蹤任務。
27.本發明附加方面的優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐了解到。
附圖說明
28.構成本發明的一部分的說明書附圖用來提供對本發明的進一步理解,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。
29.圖1是本發明的一種海洋機器人遺忘因子分數階高階迭代學習律控制器的設計方法流程圖;
30.圖2表示海洋機器人水下運動的坐標系;
31.圖3是本發明的遺忘因子分數階高階迭代學習控制原理流程圖;
32.圖4是隨著迭代次數的增加海洋機器人軌跡跟蹤誤差曲線圖;
33.圖5(a)和圖5(b)是迭代15次時的海洋機器人軌跡跟蹤結果。
具體實施方式
34.下面結合附圖與實施例對本發明作進一步說明。
35.應該指出,以下詳細說明都是例示性的,旨在對本發明提供進一步的說明。除非另有指明,本文使用的所有技術和科學術語具有與本發明所屬技術領域的普通技術人員通常理解的相同含義。
36.需要注意的是,這里所使用的術語僅是為了描述具體實施方式,而非意圖限制根據本發明的示例性實施方式。如在這里所使用的,除非上下文另外明確指出,否則單數形式也意圖包括復數形式,此外,還應當理解的是,當在本說明書中使用術語“包含”和/或“包括”時,其指明存在特征、步驟、操作、器件、組件和/或它們的組合。
37.正如背景技術中提及的當系統變為復雜的非線性系統以及存在外界擾動時,仍然采用線性系統的時滯軌跡跟蹤控制方法獲取實際運動軌跡,會出現發散時效,進而無法完成軌跡的有效跟蹤的問題,本發明提供了基于遺忘因子分數階高階迭代學習的海洋機器人推進器控制方法及系統,運用當前以及前期所有誤差信息以及遺忘因子對海洋機器人推進器的控制進行調整,達到精確跟蹤,提升自適應能力。
38.實施例一
39.如圖1所示,本實施例提供基于遺忘因子高階迭代學習的推進器控制方法,包括如下步驟:
40.步驟1:以推進器為運動控制對象,基于坐標系以及推進器的特性構建推進器系統的運行動力學模型;
41.步驟2:預設推進器系統的期望軌跡,依據推進器系統輸出的與期望軌跡的誤差信息、遺忘因子以及相應的分數階變換構造遺忘因子分數階高階迭代學習控制器;
42.步驟3:初始化推進器系統的運行動力學模型的輸入量,依據收斂性條件調整遺忘因子分數階高階迭代學習控制器的控制律,將該控制律作用于推進器系統,獲取推進器系統的實際運行軌跡;
43.步驟4:判斷推進器系統的實際運行軌跡是否滿足期望軌跡,若是,獲得期望的實際運動軌跡,否則根據實際運行軌跡和期望軌跡的誤差,通過分數階微積分變換后修正遺忘因子分數階高階迭代學習控制器直至完成推進器系統的軌跡跟蹤。
44.為了更清楚地理解本發明的技術方案,本實施例以海洋機器人為例進行說明,海洋機器人通過水中進行運動,相比地面運動還要考慮浮力重力以及阻力等外界環境因素的
影響,依據構建的坐標系統以及推進器的動力學方程可以選用合適的推進器,因此可選定海洋機器人推進器為該系統坐標下的運動分析對象。
45.步驟1:所述坐標系包括固定坐標系和運動坐標系,以海岸固定點為固定坐標系,以推進器質點為運動坐標系構建推進器系統的運行動力學模型;
46.構建6自由度剛體運動海洋機器人動力學模型,由3個方向按軸向運動,3個自由度按軸旋轉,由拉格朗日-歐拉法得到該6自由度的海洋機器人動力學模型為:
[0047][0048]
式中,表示固定坐標系下的海洋機器人位置姿態向量;ν=[u v ω p q r]
t
表示運動坐標系下機器人的線速度以及角速度向量;j(η)表示轉換矩陣;m表示慣性矩陣;c(ν)表示科氏向心力距;d(ν)表示流體阻力力矩;g(η)表示重力與浮力共同作用下的力矩陣;τ表示海洋機器人推進器產生的力矩向量,表示固定坐標系下的海洋機器人位置速度矢量。
[0049]
海洋機器人在水下做6個自由度的運動,其運動方式可以可看作簡單的自由運動,且自由度之間耦合性小。在構架坐標系下運用雅克比矩陣以及拉格朗日公式得到相應的動力學運動特性,能夠在構建的坐標系下準確得到海洋機器人的運動學以及動力學特性,為推進控制器的設計提供了保障。
[0050]
如圖3所示,步驟2:預設推進器系統的期望軌跡yd(t),依據推進器系統輸出的與期望軌跡的誤差信息、遺忘因子以及相應的分數階變換構造遺忘因子分數階高階迭代學習控制器,具體為:推進器的當前時刻輸入量等于初始輸入量的γ倍、前一時刻輸入量的(1-γ)倍以及所有前期跟蹤誤差分數階變換后學習項之和;其中,跟蹤誤差為推進器的當前時刻位置與預設海洋機器人推進器的期望運動軌跡之差,且跟蹤誤差學習項等于跟蹤誤差的α次分數階微分總和的kd倍;
[0051]
因此構建的控制器的表達式為:
[0052][0053]
其中,uk(t)為海洋機器人推進器的當前時刻輸入量;u0(t)為海洋機器人推進器初始時刻輸入量;u
k-1
(t)為海洋機器人推進器前一時刻輸入量;ek(t)=yd(t)-yk(t)為跟蹤誤差,其為海洋機器人推進器的當前時刻位置與海洋機器人推進器的期望運動軌跡之差,且跟蹤誤差學習項等于跟蹤誤差的α次分數階微分總和的kd倍;α和kd均為分數階高階迭代學習控制律的參數,α∈(0,1),kd為任意正數,γ為遺忘因子,滿足γ∈[0,1];
[0054]
為實現海洋機器人的精準控制,消除海洋環境擾動對系統的影響,依據推進器控制輸出的誤差信息、遺忘因子以及相應的分數階變換構造遺忘因子分數階高階迭代學習控制器。
[0055]
步驟3:初始化推進器系統的運行動力學模型的輸入量u0(t)以及初始化狀態向量η0(t)、v0(t)以及遺忘因子分數階高階迭代學習控制器的參數;
[0056]
在具體實施過程中,可以利用數據采集裝置來海洋機器人的實際運動軌跡yk(t),然后再傳送至機器人推進器內。
[0057]
驗證遺忘因子分數階高階迭代學習控制器的控制律的可行性,對所提出的方法進行系統收斂性驗證。
[0058]
若系統滿足條件||(1-γ)i-kd∑ρk||《1,其中,i為單位矩陣,sup為表示取值的上限,g(η)為表示重力與浮力共同作用下的力矩陣,ξ為[0,1]的系數,λ為(0,+∞)參數,t為迭代一次周期,則設計的控制器有效。ξ=||(1-γ)i-kd∑ρk||《1,ξ越小,得到的控制收斂速度越快,效果越好。
[0059]
步驟4中,收集并計算海洋機器人推進器實際運動軌跡與期望運動軌跡兩者的誤差,并通過分數階微積分變換后進行修正控制器控制輸入獲得新的輸出。經過反復學習迭代,逐漸消除海洋環境對系統的影響,最終得到海洋機器人軌跡的精準控制。
[0060]
仿真驗證:
[0061]
如圖2所示,按右手定則建立兩個坐標系:靜坐標系(e-xyz)和動坐標系(o-x'y'z'),以rov水下機器人運動為例,不考慮水動力損失項d(v)=0及外部干擾力,重心與動坐標系坐標原點重,無橫傾或縱傾,浮心與重心重合。則對應水下機器人運動系統(1)的系數矩陣分別為:
[0062][0063][0064][0065]
m=diag{m+m
u m+m
v m+m
ω i
x
+m
p iy+m
q iz+mr};
[0066][0067]
[0068]
τ=τ1+τ2[0069][0070]
其中,m=4kg為機器人的質量,mu、mv、mw分別為移動坐標軸軸線方向產生的附加質量;m
p
、mq、mr分別為沿移動坐標軸旋轉方向產生的附加質量,為了方便計算可視為0;i
*
為單位矩陣,b為海洋機器人的浮力,g為重力,可設為b=g;xb、yb、zb為水下機器人浮心坐標,與中心坐標重合為坐標原點[0 0 0];ρ為水密度;cd為無因次阻力系數設為1;s
x'
、sy'、s
z'
分別為水下機器人垂直于x'、y'、z'軸的橫斷面面積;(ur、vr、wr)為水流相對于機器人的速度0.1m/s;(k
x'
、k
y'
、k
z'
)為阻力矩系數0.1。f
ti
為第i個推進器產生的推力,r
ti
為第i個推進器和與之平行的坐標軸的垂直距離。
[0071]
設定時間區間[0,1]上rov海洋機器人在xoy平面從(0 0 0)點運行,z軸方向參數均為0,x和y方向位的期望軌跡為x(t)=2sin(4πt)cos(2πt)和y(t)=2sin(4πt)cos(πt),系統的初始誤差為0;環境擾動為根據設計控制器收斂條件,選取學習控制算法中的學習增益為γ=0.1;α=0.6;kd=1。
[0072]
從圖4中可以看到隨著迭代次數的增加,兩個方向的輸出趨向于期望軌跡。圖4是x(誤差1)和y(誤差2)方向位置跟蹤誤差,且趨向0;圖5(a)和圖5(b)分別是x和y方向迭代第15次的跟蹤效果圖,從圖5(a)和圖5(b)中可以看出,本發明設計的控制器具有較好的控制性能。
[0073]
實施例二
[0074]
本實施例提供基于遺忘因子高階迭代學習的推進器控制系統,包括:
[0075]
動力學模型構建模塊,被配置為:以推進器為運動控制對象,基于坐標系以及推進器的特性構建推進器系統的運行動力學模型;
[0076]
控制器構造模塊,被配置為:預設推進器系統的期望軌跡,依據推進器系統輸出的與期望軌跡的誤差信息、遺忘因子以及相應的分數階變換構造遺忘因子分數階高階迭代學習控制器;
[0077]
實際運行軌跡獲取模塊,被配置為:初始化推進器系統的運行動力學模型,依據收斂性條件調整遺忘因子分數階高階迭代學習控制器,通過控制器作用于推進器系統,獲取推進器系統的實際運行軌跡;
[0078]
判斷推進器系統的實際運行軌跡是否滿足期望軌跡,若是,獲得期望的實際運動軌跡,否則根據實際運行軌跡和期望軌跡的誤差,通過分數階微積分變換后修正所述控制器。
[0079]
實施例三
[0080]
本實施例提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處
理器執行時實現如上述所述的基于遺忘因子高階迭代學習的推進器控制方法中的步驟。
[0081]
實施例四
[0082]
本實施例提供了一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現如上述所述的基于遺忘因子高階迭代學習的推進器控制方法中的步驟。
[0083]
本領域內的技術人員應明白,本發明的實施例可提供為方法、系統、或計算機程序產品。因此,本發明可采用硬件實施例、軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器和光學存儲器等)上實施的計算機程序產品的形式。
[0084]
本發明是參照根據本發明實施例的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0085]
這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0086]
這些計算機程序指令也可裝載到計算機或其他可編程數據處理設備上,使得在計算機或其他可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0087]
本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關的硬件來完成,所述的程序可存儲于一計算機可讀取存儲介質中,該程序在執行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質可為磁碟、光盤、只讀存儲記憶體(read-only memory,rom)或隨機存儲記憶體(random accessmemory,ram)等。
[0088]
以上所述僅為本發明的優選實施例而已,并不用于限制本發明,對于本領域的技術人員來說,本發明可以有各種更改和變化。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。
當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
亚洲综合伊人久久综合性色_一个人免费视频播放的一_抽搐一进一出gif免费动态_BT天堂最新版在线www