2022 年 6 月出版

科儀新知 第 231 期

智能機器人與自動化

0231042

使用適應導納控制於安全直觀之機器手臂手動導引以提高使用便捷性

Safe and Intuitive Manual Guidance of a Robot Manipulator Using Adaptive Admittance Control towards Robot Agility

雷耶斯、蕭得聖

Daniel Reyes-Uquillas, Tesheng Hsiao

當使用者施加外力於機器人的末端效應器時,若能保證人機互動的安全與流暢,則手動導引可以有效地提高機器人使用時的便捷性。本文提出一可自動調變參數的適應導納控制律,用以改變機器人在工作空間中關鍵區域的順應性,例如奇異點附近、關節角度極限和工作空間極限位置,以實現平穩和安全的操作。此外,透過三維輪廓追蹤實驗比較不同參數調變法則,驗證本文所提出之方法能以較短的任務執行時間達成較高之精度。

Manual guidance can achieve robot agility effectively, provided that a safe and smooth interaction is guaranteed when the user exerts an external force on the end effector. We approach this by designing an adaptive admittance law that can adjust its parameters to modify the robot compliance in critical areas of the workspace, such as near and on configuration singularities, joint limits, and workspace limits, for a smooth and safe operation. Experimental comparison among various parameter tuning strategies is conducted through a 3D profile tracking test. The results show that the proposed method achieves higher accuracy with shorter task execution time.

一、簡介

人與機器人實體互動 (physical human-robot interaction, pHRI) 為近年來機器人發展的趨勢,並廣泛應用於生產組裝與醫療復健等工作。手動導引 (manual guidance) 為人機實體互動之一環,乃指使用者直接接觸機器人,並引導機器人完成任務,可用於實現牽引式教導 (lead-through teaching) 以快速指定機器人任務,提高機器人使用的便捷性 (agility) 與生產效率。在手動導引中,機器人需適當回應使用者的施力,以簡易直觀的方式完成任務,且需考慮自身運動學與工作空間的限制以保障人機互動的安全性,故仍有許多挑戰需要克服。本文針對手動導引提出適應導納控制法則 (adaptive admittance control law),根據使用者施力與約束條件於線上 (on-line) 自動調整導納參數,以達成安全、簡易、便捷的人機實體互動。

1. 相關研究

為實現手動導引,通常採用順應控制 (compliance control) 技術。文獻(1) 詳細介紹了順應性和力控制策略的分類,例如剛度 (stiffness) 控制、阻抗 (impedance) 控制和導納 (admittance) 控制(2-4) 等。所謂阻抗乃指輸入為速度而輸出為力量 (或力矩) 之物理系統,導納則為阻抗之倒數。在手動導引的情境中,機器手臂被視為一導納系統,因為力由使用者輸入而機器手臂則產生對應的運動,故適用於導納控制法則。

已有研究證明指出,可變導納控制器優於固定導納控制器。例如文獻(5, 6) 藉由使用導納參數在兩常數之間切換的策略進行人機協作實驗,證明了可變導納控制器具有更好的性能;文獻(7, 8) 提出了可變導納控制律,基於加速度大小來調整導納參數,並避免多種運動學限制,藉由減少任務的執行時間與誤差以提高系統效能。

2. 研究目標

本文的目標為根據施加於六自由度工業機器人末端效應器之外力與扭矩的大小及方向,在線調整機器人的順應性,以同時滿足直觀操作與符合特定約束條件的要求。為此本文提出了一適應導納控制律,基於在手動導引時的安全性、準確性和舒適性,考慮了不同的運動學約束條件。並設計在每個約束條件下調整導納參數值的方法,以及如何同時處理多個約束條件的情況。最後透過實驗比較不同的導納參數調整策略,以展示本文提出之導納控制法則之優勢。

本文的主要貢獻包括:

1. 提出一適應性法則來調整導納參數,以同時滿足避免奇異點 (singularity)、關節角度限制和工作空間限制之約束條件,並在正常操作區域中使用輸入力調整參數。

2. 透過單一演算法可令使用者引導機器人進行精確運動或快速運動,故可根據不同的任務直觀地使機器人展現適當的行為。

3. 使用六軸工業機器人進行不同導納參數調整策略的實驗比較,藉由評估準確性、執行時間等指標,量化分析本文所提出方法之優勢。

二、適應導納控制策略

本文提出之導納控制架構結合導納函數與機器人運動控制器,其架構如圖 1 所示。首先由手臂末端之力與力矩感測器量測使用者施加於末端效應器的三軸外力 fext 與扭矩 τext,經過訊號前處理後分別為 fτ,做為導納函數之輸入,而導納函數之輸出為手臂末端在任務空間之速度與角速度 wadm,此速度修正了機器人的命令姿態 P。再使用微分逆運動學 (differential inverse kinematics) 將任務空間中的速度轉換為手臂關節速度 ,但前提是手臂不能太靠近奇異點。此關節速度 分別經過積分、微分得關節位置 qd,與關節加速度,最後將其命令送到機器人運動控制器中,作為機器人依循的參考軌跡。運動控制器輸出之馬達力矩 τm 控制機器人至命令位置,此時機器人的實際輸出位置為 q、速度為 及加速度為 ,會於運動控制器中作回授控制。此外,在每個採樣時間,導納參數會根據約束條件,包括奇異點、關節角度限制及工作空間限制,進行線上導納參數調整,使機器人能根據施加的外力與扭矩,展現與人安全、精確的互動行為。

圖 1. 適應導納控制架構圖。

1. 適應性導納函數

量測之外力與扭矩的各分量皆由獨立的導納函數處理,在本文中,它們皆使用共同的導納參數值。本文採用的導納函數如 (1) 式所示,已廣泛使用於多數文獻(1, 4, 7, 9, 10)

(1) 式中導納函數為一階轉移函數,其中 m 為系統虛擬質量 (virtual inertia),c 為系統虛擬阻尼 (virtual damping)。這些參數會進行線上調整,以滿足三個約束條件:避免奇異點、關節角度限制與工作空間限制,如果機器人姿態過於靠近任一約束條件的邊界時,這些參數將在線做適當修正,以防止違反約束條件。

2. 導納參數調整策略

導納函數 (1) 式可以不同方法參數化,第一種選用質量和阻尼 (m, c) 為參數,第二種選用 (τc = m/c, k = 1/c) 表示 Y(s) 的時間常數和穩態增益。文獻中最常見的參數調變策略為固定其中一個參數,並調整另一個參數,而參數值之設定通常使用反覆試誤的方法。在本小節中,我們將從不同參數化形式,去分析不同參數調整策略。

2.1 獨立調整質量 m 與阻尼 c

過去一些研究已得出結論,固定質量 m,減少阻尼 c 會增加機器人的順應性,然而,這會造成 Y(s) 的極點 (-c/m) 更接近穩定邊界及更多的相位落後,增加了導納函數的響應時間,造成機器人與使用者的互動更難控制,且降低任務的準確性。

在固定阻尼 c 並調整質量 m 的情況下,當 m 減少時,因為 Y(s) 的時間常數變小,所以機器人對使用者動作的反應變得更快。然而,順應性並無有效地改變,因穩態增益並未做修改,因此本文不考慮使用該策略。

2.2 同時調整質量 m 與阻尼 c,保持比值 m/c 恆定並調整增益 k

如上節所述,參數 mc 無法分開處理,需要同時修正。本文中,我們提出在保持時間常數 τC = m/c 恆定的同時,修改穩態增益 k = 1/c,具有比其他策略更好之性能。增益 k 越高,給定輸入產生的輸出越大;增加阻尼 c 會降低增益 k,使系統減少順應性。同時參數 m 將進行修改以保持固定比值 m/c。時間常數影響導納函數的響應時間,即以多快的速度啟動/停止機器人運動,本文以觀察實驗中機器人震顫與否決定時間常數,若響應時間過快,也就是低於該時間常數時,機器人則有震顫現象發生。保持時間常數 tC 固定的好處為導納函數的極點不變,表示系統的穩定邊際保持一定。

3. 參數調整準則

調整導納參數的目的是保證安全、準確的人機互動,有鑑於此,我們確立了相關的調整準則:

‧安全性:避免機器人違反關鍵約束條件,如:奇異點、關節及工作空間限制,確保人機互動的安全性。

‧準確性和舒適性:透過根據輸入力的大小修改機器人順應性,為使用者提供直觀的機器人引導與適當的輔助。當輸入力小時,運動精準;當輸入力大時,移動快速。若對使用者而言互動過程是舒適的,則路徑的準確性越高,也就是越容易遵循預設的路徑。

我們考慮兩種情況:正規操作 (normal operation) 和約束激活 (constraint activation),並設計不同的參數調整規則。正常操作為沒有違反任何約束條件的情況,因此,準確性和舒適性是調整參數的主要考慮因素。另一方面,若任何約束即將被觸發,參數調整應防止機器人違反約束條件,以保證安全。

以下我們將比較兩種調變的效果:(1) 固定質量 m 並調整阻尼 c。(2) 固定比值 m/c 並調整增益 k = 1/c。我們以阻尼附加下標區隔不同約束條件對應之參數值:亦即 cscjcc 分別代表根據奇異點、關節角度限制與工作空間限制調整的阻尼值;cN 則為正規操作下之阻尼值。

4. 正規操作

在正規操作的情況下,為使人機互動過程更直觀,我們根據輸入力來更新導納參數。因為當需要快速運動時,使用者會直覺地增大出力,此時提高機器人順應性使其能更快速地運動;另一方面,當需要精準運動時,使用者會減小施力,此時減少機器人順應性,使其能對外擾有較佳之抵抗力,提高運動精度。

令力感測器之量測力為 f R3,將其正規化並定義為,如 (2) 式所示,則 在 [0,1] 區間。用於力正規化的數值 可由先期實驗獲得,即在一特定任務中,多個測試者所施平均最大力。若無先期實驗值可參考,則可設為力感測器之量測上限值。令參數 cf 在 [cmin, cmax] 範圍內隨線性變化,如 (3) 式所示,其中 cmincmax 為預先指定之阻尼 c 最小與最大邊界。在本文第三節「手動導引實驗」中,將說明如何根據實際任務與安全規範選取 cmincmax 之值。須注意的是,力最大值 ( = 1) 映射至 cmin,而力最小值 ( = 0) 則映射到 cmax。同樣對量測扭矩 τ 來說,使用平均最大扭矩 於正規化,並定義正規化後的力矩為,如 (4) 式所示,而由扭矩得到之阻尼參數 cτ 如 (5) 式所示。最後選擇阻尼 cNcfcτ 兩者之最小值,如 (6) 式所示。這允許機器人在僅依靠力或扭矩的情況下移動,在少於六自由度之任務實現解耦運動。

5. 約束激活

當機器人姿態靠近約束條件邊界時,導納參數須由正規操作中平穩地調變,使機器人減少順應性避免繼續逼近約束條件邊界。本節分別介紹每個約束條件特定的切換函式及條件閾值。

圖 2. 可操作性標準化值應用於搜尋全域最大值。

5.1 奇異點規避

本文使用文獻(11) 定義之可操作性 (manipulability) 定義表示機器人姿態與奇異點的距離,如 (7) 式,其中 J 為 6 × 6 之雅可比矩陣 (Jacobian matrix)。

雅可比矩陣 J 隨機器人姿態而變,當 J 為奇異矩陣 (singular matrix) 時,稱此姿態為機器人之奇異點。因此可操作性 ω 愈大,離奇異點愈遠。首先我們對 ω 正規化,如 (8) 式,其中 ωmax 為透過數值搜尋工作空間中由姿態組成之網格的可操作性全域最大值 (見圖 2)。下一步為分析可操性為遞增或遞減,我們計算當前與上一取樣時間之可操作值的差異,表示為 Dωn,t = ωn,t - ωn,t-1,作為可操作性梯度方向之近似結果。

若同時滿足正規化可操作值 ωn,t 小於指定閾值 ωth,且可操作值差異 Dωn,t 小於或等於 0,(9)式將使用於計算參數 cs,使虛擬阻尼值隨著可操作值接近 0 而呈指數遞增,指數遞增率之選擇確保了從運動到靜止的切換是緩和的。此外,另一閾值 ωcrit 為確保機器人不會過度接近奇異點,當 ωn,t 低於 ωcrit,參數 cs 設定為固定上限值 chigh,其中 cmin cmax 亦於 2.4 節提及,為預先指定之阻尼 c 最小與最大邊界。

cs 定義法則的好處為機器人可逐漸停止動作,直到到達臨界閾值,然後才將參數調整至最大限制,此時機器人將停止運動 (參見圖 3)。儘管在 ωth = ωcrit 時出現不連續性,此問題並不會影響使用者的操作,因在這點機器人的運動已接近停止,且有助於遠離奇異點時的快速恢復。

圖 3. 奇異點規避,阻尼參數 cs vs. 正規化可操作值 ωn

5.2 關節角度限制

qi 為第 i 軸關節角度,定義 為該軸最負與最正限制角度之 95%,作為關節運動之臨界值以防止劇烈的停止。本文參考文獻(12) 的作法,首先將關節角度映射至 0 與 1 之間如 (10) 式的 qlims,i,當 qi 在其臨界範圍 () 中點時,qlims,i 有最大值 1,qi 靠近臨界值時則 qlims,i 趨近於 0,γ 為調整趨近斜率之常數 (見圖 4(a))。若任一關節角度超過臨界值,則導納參數 cj 將根據 (11) 式調整,其中 cN 來自 (6) 式,目的為保持導納參數的連續性 (見圖 4(b))。為保障機器人操作的安全性,當同時有多軸關節超出臨界值時,(11) 式選擇最大值作為導納函數之阻尼參數。

圖 4. 關節限制規避,(a) 關節限制參數正規化 (b) 阻尼參數 cj

5.3 工作空間限制

機器人有其工作空間的限制,超出工作空間可能有與周遭機台或人員碰撞的危險。為使導納參數能在工作空間的邊界平穩地切換,定義臨界閾值為 zth。若目前機器人末端位置與指定工作空間邊界的距離 zdist 小於臨界閾值 zth 時,則 cc 將由 (12) 式求得,參見圖 5。

經上述 3 種約束條件下的運算,由 (9)、(11) 及 (12) 式之結果取最大值,作為新的阻尼參數 c,如 (13) 式所示。若無激活的約束條件,則機器人處於正規操作區域,阻尼 c 等於 cN,如 2.4 節所述。

當參數 c 決定後,質量 m 及增益 k = 1/c 同時更新,且在下一次迭代時,用於計算機器人之速度命令 (ωadm),如圖 1 所示。

圖 5. 工作空間限制規避,阻尼參數 cc vs. zdist

三、手動導引實驗

本實驗為由使用者引導機器人執行 3D 輪廓追蹤任務,以評估不同導納參數調整策略之性能。因所追蹤的輪廓有彎曲與高低起伏,可做為檢驗手動導引機器人進行六自由度運動之測試平台。

1. 參數設定與實驗設置

在本實驗中,使用者之下臂、手、指頭與機器人末端有直接接觸。在此情境下,設定機器人末端最大速度為 266 mm/s,此值遠低於 ISO/TS 15066:2016 機器人安全規範要求的暫態速度低於 1300 mm/s 與準靜態 (quasi-static) 速度低於650 mm/s,以保障使用者安全。基於此最大速度與實驗時的平均輸入力量大小,設定 (3) 及 (5) 式中 cmin =300 Nsm-1cmax = 1200 Nsm-1;定義時間常數 τc = m/c = 0.0167 s,低於此值則實驗時機器人會出現震顫;(9) 式中 chigh = 350000 Nsm-1,確保機器人此時運動靜止;ωth = 0.4、ωcrit = 0.1,確保當機器人接近奇異點時,能於停止前做正確切換;(8) 式中的 ωmax = 0.0622;(10) 式中 γ = 64,使圖 4(a) 中的曲線於 0 至 1 間能快速切換。

本實驗之六軸工業機械手臂為 HIWIN RA605,使用本實驗室自行開發之修正型順滑模式運動控制器,實現於搭載 Kithara 實時作業系統之個人電腦上,取樣頻率為 1 kHz;手臂末端裝置 ATI Gamma 系列六軸力與力矩感測器與實驗工具,實驗工具為一枝麥克筆與其鎖附之治具 (參見圖 6)。

圖 6. 3D 模型輪廓追蹤實驗設置。

2. 三維模型輪廓追蹤實驗

進行輪廓追蹤任務時,使用者以實驗工具前端之麥克筆沿一物體之 3D 輪廓中心畫線 (見圖 6),故可以視覺觀察移動之軌跡並修正手部的操作。此物體之 3D 輪廓由兩個常見曲線組成,其俯視方向為雙紐線 (lemniscate),側視方向則為正弦曲線 (見圖 7)。(14) 至 (16) 式為此路徑於卡氏座標之表示式,x, y, z 方向皆以參數 θ 表示,θ [0, 2p],其中 llen = 0.190 m 為雙紐線之橫向長度,路徑寬度為 0.01 m。此外,實驗的 3D 模型放置於遠離任何約束邊界之位置,因此正常操作實驗時並不會觸發任何約束條件。

圖 7. 3D 模型之俯視與側視圖。

實驗流程為:

1. 機器人移動至靠近繪圖區域之一點停留,直到使用者對其施加外力。

2. 使用者移動機器人至路徑起點。

3. 使用者依測試指示引導機器人以精確或快速的方式追蹤路徑輪廓。

4. 回到起點後,使用者短暫停止並將機器人從模型上移開。

其中一位使用者的實驗結果如圖 8 及 9 所示,包含 3D 路徑追蹤、關節位置與速度、量測之力與扭矩、可操作值及導納參數。在整體任務中可觀察到平穩的位置變化,及高可操作性,參見圖 9(a) 至 9(d)。圖 9 路徑中之紅色虛線為機器人末端至工具中心點的距離,代表追蹤任務中機器人的姿態變化。

圖 8. 3D 測試之路徑結果 (a) 俯視圖 (b) 側視圖 (c) 等軸測投影圖 (d) 使用者實測。

圖 9. 3D 測試實驗數據 (a) 關節位置 (b) 關節速度 (c) 外力 (d) 可操作值 (e) 增益 k (f) 扭矩。

3. 導納參數調變策略比較

本文選定 4 種策略進行測試與比較,其中 2 種為固定參數,另外 2 種為適應調變參數策略,以下列出它們相應的簡稱,其中第三種 (ratio const) 為本文提出之方法。

‧恆定且較小之參數 mc (low lim)。

‧恆定且較大之參數 mc (high lim)。

‧恆定之比值 m/c 與適應增益 k = 1/c (ratio const)。

‧恆定之參數 m 與適應阻尼 c (change c)。

此次 3D 測試共邀請 20 位測試者,年齡位於 22-31 歲的男性 18 人及女性 2 人,皆具備基礎機器人學知識。測試分成訓練及策略比較兩階段。首先進行訓練階段,目的為讓測試者熟悉本實驗,此階段需要測試者跟隨 3D 路徑 12 次,分成 4 個部分,也就是每部分執行 3 次。第一、第二部分時向測試者展示固定參數策略,先執行 low lim,再執行 high lim,以建構最小及最大施力範圍,第三、第四部分則進行適應調變參數策略。

在策略比較階段,測試者須沿著 3D 路徑跟隨 4 次,且每次測試時挑選之參數調變策略為隨機。實驗前我們給予測試者不同的指示,前兩次測試為精準導向,亦即希望測試者能儘量精準地完成輪廓追蹤,而後兩次測試為速度導向,亦即希望測試者能於最短時間內完成測試,不同的測試導向用以區隔後述性能評估中的交叉效應。

我們選擇評估路徑長誤差及任務執行時間,作為定量比較不同導納參數策略之指標。路徑長誤差代表任務精準度,其為計算參考路徑長與實際追蹤路徑長之絕對誤差,如 (17) 式中之 eL,其中 lu 為測試者實際追蹤路徑長,lr 為參考路徑長,(19) 式為相對百分比誤差。

由正向運動學 (forward kinematics) 可轉換手臂實際關節角度資訊至卡氏座標姿態,再經 (18) 式計算出實際追蹤路徑長,其中 ΔxtΔytΔzt 為每個離散時間點 t 時各軸連續兩點之距離,n 為總資料點個數。參考路徑長為以取樣時間 0.001 s,取樣計算 (14) 式至 (16) 式,直到測試者完成任務,再經 (18) 式計算求得。以上計算可在測試者執行輪廓跟隨任務時,定量比較各個策略下對性能表現之影響。

另一性能指標為執行時間,為從測試者在欲跟隨之路徑起點,計算到測試者完成一周路徑的總時間。

我們分別對每個任務指示分析測試者的數據,並且為了獨立探討參數調變策略之差異,將相關性能指標與各個指示間做聯繫。我們使用精準導向測試數據,透過計算路徑誤差百分比,比較不同調變策略下的誤差量;同樣地,使用速度導向測試數據,透過計算任務執行時間,比較不同策略下的執行速度。圖 10 為 4 種調變策略下,所有測試者平均誤差百分比 (精準導向測試) 及平均執行時間 (速度導向測試) 之結果。

圖 10. 性能指標結果,左半圖:精準導向下測試者平均誤差率,右半圖:速度導向下測試者平均執行時間。

以精準導向測試來看,我們選擇的策略-ratio const,其平均誤差率最小,另一個適應參數調變策略-change c,則有較大的平均誤差率。此結果可以證實,若只有改變阻尼 c,因任務中會產生較高的加速度,導致很難精確地移動機器人 (參見圖 11)。固定參數相較適應參數調變策略有較大的誤差,且在 low min 策略下有最大的誤差值;此外,使用 high lim 策略較不易偏離參考軌跡,但會需要更多施力去移動機器人,導致互動過程中讓測試者感到不舒適。

分析速度導向測試結果發現,high lim 與 low lim 策略下測試者分別耗費最長及最短的執行時間,而其餘兩個適應調變策略則有相近的結果。high lim 策略時因機器人較難移動,因此執行時間最長;反之,以相同施力大小進行 low lim 策略,機器人較易移動,因此執行時間最短,但也犧牲了精確度及造成較大的震動。此外,圖 10 清楚地呈現 ratio const 策略有較低的誤差率及執行時間,體現了最佳性能指標結果。

為了評估適應調變策略間的平均差異是否顯著,我們對實驗數據進行 t-test 分析,其結果總結於表格 1 中。如我們所主張,ratio const 之路徑誤差明顯較 change c 的結果小,至於在執行時間上,兩者並無明顯差距。

表 1. 比較適應參數調整策略之 t-test 結果。

圖 11. 一位測試者執行 4 種策略下,機器人六軸關節加速度結果,其中 ai 為第 i 軸的關節角加速度,i = 1, 2, … , 6。

四、結論

本文提出適應導納控制應用於手動導引的方法,加入 3 種人機互動常見的限制條件:奇異點規避、關節角度限制及工作空間限制,以實現安全、精準及舒適的互動過程,並透過測試者讓機器人快速、安全且直觀地重複進行操作,提升機器人敏捷性。

透過 3D 輪廓追蹤實驗,比較及分析不同參數調變策略下,絕對路徑誤差及執行時間之性能指標結果,證實了我們提出的適應導納控制策略有較低誤差值與執行時間。我們的未來展望為專注在減少施力及震動程度,以提升人機互動性能。