當前位置：首頁 > 新聞資訊 > 機器人應(yīng)用 > 機器人示教學(xué)習(xí):高級技能學(xué)習(xí)方法（學(xué)習(xí)計劃和學(xué)習(xí)目標）

機器人示教學(xué)習(xí):高級技能學(xué)習(xí)方法（學(xué)習(xí)計劃和學(xué)習(xí)目標）

來源：CAAI認知系統(tǒng)與信息處理專委會編輯：創(chuàng)澤時間：2020/6/9 主題：其他 [加盟]

機器人可以在人類教師反饋的基礎(chǔ)上來探索某項任務(wù)。反饋提供了關(guān)于機器人嘗試的任務(wù)滿足目標的程度的信息。大多數(shù)基于反饋的工作傾向于采用強化學(xué)習(xí)。傳統(tǒng)的RL算法提供了一個反饋(獎勵)信號，在這種情況下使用了人工響應(yīng)。在某些情況下，除了人類的反饋，任務(wù)的表現(xiàn)直接受到老師的影響，老師允許選擇下一步行動。在[10]中，這種方法將任務(wù)學(xué)習(xí)表現(xiàn)提高了約50%。

需要注意的是，有時選擇的示教方法和獲取的數(shù)據(jù)類型與學(xué)習(xí)算法的選擇有關(guān)。一方面來自多個模態(tài)的示范增加了維數(shù)，增加了學(xué)習(xí)的復(fù)雜性。數(shù)據(jù)的維數(shù)可以降低，但是有些信息被忽略，導(dǎo)致從示教數(shù)據(jù)中學(xué)習(xí)不當。另一方面，缺少傳感模態(tài)可能會在一開始就提供不完整的信息，導(dǎo)致學(xué)習(xí)算法表現(xiàn)不理想。

高級技能可以認為是一組低級技能或一組動作基元。除此之外，高級技能還包括對象可視性，涉及構(gòu)建物理世界對象和機器人動作之間關(guān)系的知識。高級技能學(xué)習(xí)方法可以大致分為學(xué)習(xí)計劃和學(xué)習(xí)目標。

1）學(xué)習(xí)計劃:在這種高級技能的學(xué)習(xí)方法中，學(xué)習(xí)計劃為從初始狀態(tài)到最終狀態(tài)的一系列動作。因此，動作是根據(jù)前置條件和后置條件定義的。前置條件為動作執(zhí)行前的狀態(tài)，后置條件為動作執(zhí)行后的狀態(tài)。除此之外，人類教師還用注釋的形式提供附加信息。注釋可以通過觸覺、視覺或語義來提供。額外的信息允許更好地概括高水平的技能。可執(zhí)行的動作可以是簡單的低級技能，如抓住目標對象，拾起綠色的對象等，組合起來形成一個高級任務(wù)，如排序綠色的對象。另一方面，有一些方法可以通過在示教數(shù)據(jù)中尋找重復(fù)的結(jié)構(gòu)來從高級技能示教中提取低級技能，這樣就可以在不同的示教中識別它。在[2]中，一個示教學(xué)習(xí)范例是通過人類示教和在程序界面輸入的用戶目的來描述的。在[18]中，一些涉及一系列順序旋轉(zhuǎn)和轉(zhuǎn)換的日常對象操作的示教被用來提取順序的低級技能，并進一步構(gòu)建一個計劃。這項工作還示教了從一個對象到其他類似對象的學(xué)習(xí)知識轉(zhuǎn)移。

2）學(xué)習(xí)目標:推斷高級技能的目標。人類教師提供的示教被用來推斷執(zhí)行高級技能的意圖。通過生成假設(shè)，可以從重復(fù)的示教中推斷出目標�，F(xiàn)代方法也使用基于獎勵函數(shù)的強化學(xué)習(xí)方法來實現(xiàn)期望目標。如果獎勵函數(shù)是從給定的示教中學(xué)習(xí)的，那么它就被認為是目標學(xué)習(xí)。一些基于強化學(xué)習(xí)的方法得到了很好的研究[19]。

3、討論總結(jié)

技能的學(xué)習(xí)直接依賴于示教的準確性。大多數(shù)方法[20]手動消除了部分示教中的噪聲。結(jié)合強化學(xué)習(xí)，在獎勵和探索機制的基礎(chǔ)上對技能學(xué)習(xí)進行改進。另一種改進技能的方法涉及示教者反饋[21]。當機器人在一個稍微不熟悉的情況下執(zhí)行學(xué)習(xí)到的技能時，從人類教師那里得到關(guān)于執(zhí)行技能可取性的反饋。目前為了實現(xiàn)這種技能細化的方法，研究人員主要從兩個方面進行了研究：（1）控制機器人和人類教師之間的信息交互，（2）提供反饋。

91嫩草精品在线,久草中文网,国产亚洲情侣一区二区无,亞洲av美女二區免費在線播放,天天干网,亚洲第一黄网,亚洲第一黄网

機器人示教學(xué)習(xí):高級技能學(xué)習(xí)方法（學(xué)習(xí)計劃和學(xué)習(xí)目標）

蘇州行政審批局實現(xiàn)導(dǎo)引機器人導(dǎo)覽服務(wù)

農(nóng)業(yè)機器人視覺識別雜草技術(shù)

武漢大學(xué)研發(fā)可精準控制迷你軟體機器人

方濱興院士：人工智能安全之我見

淺談機器人的靈巧手

輔助機器人對機器人靈巧手的應(yīng)用要求

獵戶星空：醫(yī)療服務(wù)機器人

極飛科技：無人機抗疫解決方案

水下機器人靈巧操作的新型觸覺感知

國內(nèi)安防AI芯片型號,類型,處理速度和功能一覽表

機器人守護人類生命線，六大趨勢凸顯前景無限

追一科技：智能營銷機器人應(yīng)用案例

服務(wù)機器人(迎賓、講解、導(dǎo)診...)

智能消毒機器人

機器人開發(fā)平臺

機器人示教學(xué)習(xí):高級技能學(xué)習(xí)方法（學(xué)習(xí)計劃和學(xué)習(xí)目標）

服務(wù)機器人(迎賓、講解、導(dǎo)診...)

智能消毒機器人

機器人開發(fā)平臺

服務(wù)機器人(迎賓、講解、導(dǎo)診...)