案例分享 | 北理工仿生機器鼠SQuRo研發
關鍵詞:四足機器人;模仿學習;運動性能評估
技術方案:智能體位姿追蹤系統
1、研究背景
從公元前3500年人類發明了輪子開始,輪式工具極大地提高了交通和運輸效率。但在不斷的使用過程中,輪式運動方式的局限性逐漸暴露:即對山地、丘陵、臺階等復雜地形的適應性差。四足哺乳動物可以在崎嶇復雜的地形自如行走,因為四足運動方式落足點是離散的,可以跨過障礙,而且沒有橫向約束,可以多方位移動,而且足端運動和軀干質心解耦可以起到隔振作用,保證質心穩定。
四足機器人以四足動物為仿生對象,在具有比雙足機器人更具穩定性的同時,又比六足機器人機械結構簡單。
從20世紀60年代開始,針對四足機器人的研究已經陸續開展,目前四足機器人已經廣泛應用于工廠巡檢、地震救災、未知環境探索甚至地外行星探索,具有廣闊的沿用前景。
BigDog、ANYmal等大型四足機器人對于復雜環境適應能力強,具有較強的運載能力,但是對于管道或者廢墟縫隙等狹窄空間,考慮到其體積,大型四足機器人很難進行探索和作業;而sub-2g等微型四足機器人,雖然體積小可以在狹窄空間穿越,但是由于絕對負載能力低,無法滿足探索和運輸任務。開發一個具有一定移動能力和負載能力的小型機器人至關重要。
2、北理工SQuRo仿生機器鼠研制
老鼠因其細長身形和敏捷運動能力,可以在狹窄環境快速運動,吸引了研究人員的廣泛關注。北京理工大學福田敏男教授團隊骨干成員石青教授及其帶領的仿生機器人團隊設計研發了一款機器大鼠SQuRo。
/ 機器鼠SQuRo
研究人員先利用X光獲取并研究大鼠的運動骨骼關節結構。通過分析發現,大鼠能在狹窄環境靈活運動,主要依賴來于:三自由度頸椎運動、脊柱屈伸和側屈、四肢運動。經過簡化和參照設計,為機器鼠模型配置12自由度(頸部2自由度,腰部2自由度,四肢各2自由度)。機器鼠尺寸為188×55×90mm,重220g,與8周大的大鼠相當。
/機器鼠自由度配置
團隊提出一種多模態運動規劃控制框架,根據環境不同切換運動策略,可以實現更快速穩定的響應。
為了驗證機器鼠基礎運動性能,石青教授團隊進行了一系列實驗,包括蹲起、行走、爬行、轉向等,實驗結果證明SQuRo機器鼠可以高效且靈活的進行運動,而且其轉彎半徑只有66mm(0.48個身體長度)。針對實際應用場景,研究人員還進行了通過不規則通道、爬坡、攜帶負載及跨越障礙等特殊場景實驗,以上測試SQuRo均可順利完成,其負載可以達到200g(自重的91%),并且能穿越30mm高的障礙物。
3、機器鼠穩定性優化
在研制仿生機器鼠的過程中,需要對機器鼠的俯仰角、彎曲角、彎曲距離等動作姿態數據進行分析,以量化指標評估機器鼠性能。
凌云光·元客視界方案工程師搭建了2mx2m的緊湊空間,采用9臺光學動作捕捉相機,精確地對機器鼠的頭部、背部、腿部、尾部等重要測試部位進行追蹤。由于機器鼠關鍵部位尺寸都極其細小,而且自重很輕,為了在輕量化負重前提下精準獲取關鍵部位的位置信息,凌云光·元客視界提供了定制的3mm標記點,針對細小的結構精準獲取機器鼠的運動姿態信息。
/動捕系統實驗場地
4、機器鼠運動生成策略研究
此外,石青教授團隊還進行了仿生機器鼠-真實大鼠交互的研究。將機器鼠放入真實大鼠社會,獲取動物行為反饋,有助于了解大鼠的決策制定過程,比如運動方式、伴侶選擇、捕食者-獵物相互作用等。在此過程中,機器鼠運動越接近真實大鼠運動,得到動物行為反應越好。但是不同時間大鼠同一行為的運動特征是不同的,因此合適的運動生成策略至關重要。
在之前的研究中,研究人員嘗試過單次編程或人工操作等方式來控制大鼠運動,但效果都不理想。為了生成接近真實大鼠的自然運動,石青教授團隊提出一種利用模仿學習(IL)的運動生成策略。模仿學習方法不需要傳統編程語言控制機器人運動,只需要提供一組專家的行為演示數據。利用這些演示數據,機器人可以自動生成運動控制程序。
/動物演示、策略優化及仿真系統架構
首先,將兩只大鼠(分為demo rat和valid rat)放置于捕捉空間內,大鼠關節關鍵節點粘貼小型標記點,利用動作捕捉系統采集兩鼠交互運動數據。大鼠間交互運動典型動作包括理毛(AG)、接近(AP)、跟隨(FO)、遠離(MA)、后頸攻擊(NA)、鉗制(PI)、社交性鼻子觸碰(SNC)。首先用Optitrack采集200000幀大鼠交互數據作為訓練集(training set),對預測塊進行訓練。另外采集200000幀數據作為驗證集(validation set),用于在交互仿真系統中評估算法。
在仿真系統中,兩只機器鼠分為demo robot和policy robot,demo robot直接根據驗證集數據復制demo rat的運動行為,policy robot根據模仿學習生成的行為指令進行運動。實驗關注指標包括行為相似度、有效交互時間以及專注時段。通過結果可以看出policy robot可以生成接近動物的行為,而且機器人間交互持續時間比大鼠間的增加了16%,專注時段也更長。
實驗驗證雖然是將真實交互數據輸入仿真系統進行的,但是由于驗證集和訓練集數據不同,而且是利用同一套動作捕捉系統采集的大鼠數據,可以認為仿真系統中demo robot的行為與現實大鼠行為一致。后續研究人員也會進行大鼠-機器鼠真實場景下交互實驗。
5、國產動作捕捉系統助力高校科研
元客視界是凌云光設立的全資子公司,主要面向元宇宙虛擬現實、Web3.0時代數字人、沉浸媒體、全息通信、計算光學成像等應用,已形成光場建模、運動捕捉、全景成像、XR拍攝在內的產品布局。
FZMotion光學運動捕捉系統是凌云光·元客視界自主開發的運動捕捉采集與分析系統,可以實時跟蹤測量并記錄三維空間內點的軌跡、剛體的運動姿態以及人體動作,空間定位精度可以達到亞毫米級。
FZMotion動捕系統在無人機室內定位、仿生機器人運動規劃、機械臂示教學習、氣浮臺位姿驗證、水下運動捕捉等領域得到廣泛應用,目前已經與清華大學、中國科學技術大學、北京大學、北京理工大學、哈爾濱工業大學等高校開展合作。凌云光·元客視界致力于為高校提供完備的解決方案,助力科研發展。
參考文獻
[1] Xie H, Jia G, Al-Khulaqui M, et al. A Motion Generation Strategy of Robotic Rat Using Imitation Learning for Behavioral Interaction[J]. IEEE Robotics and Automation Letters, 2022, 7(3): 7351-7358.
[2]Shi Q, Gao J, Wang S, et al. Development of a Small-Sized Quadruped Robotic Rat Capable of Multimodal Motions[J]. IEEE Transactions on Robotics, 2022.