發布日期:2022-04-27 點擊率:61
摘要:針對非結構化的、未知的工作環境要求,提出了一種適用于第四代仿生機器人的仿生式體系結構,闡述了仿生拉 制的思想與原理,實現了代與代之間的反射式行為控制向本能式行為控制的進化和本代內由懊思式行為控制向反射式行為控制的學習升華,彌補了基于懊思式AI和基于反應式AI的兩種模型的不足,可使機器人具備良好的主動學習和自適應能力。
關鍵詞:仿生機器人;體系結構;仿生控制;進化;學習
機器人正在由第三代智能機器人向第四代仿生機器人發展和邁進。非結構化的、未知的工作環境,復雜的、精巧的、高難度的工作任務和對于高精確度、高靈活性、高可靠性、高魯棒性、高智能性的目標需求是仿生機器人產生和發展的客觀動力。當前仿生機器人的研究主要集中在運動方式、執行方式、感知方式、控制方式、信息加工處理方式、組織方式等幾方面,并且已經取得了初步的成績。本文將主要從機器人體系結構的角度出發來研究和建立控制邏輯、信息處理兩方面的仿生。
1 生物控制邏輯與信息處理
1.1 生命的控制與行為
參照低級到高級的各種生命形態,從控制邏輯和信息處理的角度來看,我們可以把生命實現各種技巧與能力的控制方式分為以下四種:
(1)本能式行為控制,是指生命生來就有的由大腦皮層以下的神經中樞參與即可完成的一種比較低級的神經活動,這種能力在生物學上稱為先夭性本能;
(2)反射式行為控制,是指生物出生以后在非條件反射的基礎上,在大腦皮層的參與下經過一定的過程積累對直接的物理信號所形成的一種高級的神經活動;
(3)慎思式行為控制,是指具有語言中樞的高級生命體對由具體信號抽象而來的語言、文字所產生的反應,這種反應多發生在具有社會屬性的高級生命體和智能體之間;
(4)社會式行為控制方式,是指具有語言中樞的高級生命體對抽象的語言、文字信號所產生的反應,這種反應多發生在具有社會屬性的高級生命體之間,這種控制方式以抽象的語言文字為信息載體和傳遞介質,以多生命體或智能體間的社會機制為協調、制約和競爭的控制策略。
1.2 對生命行為機理的假設
本文提出如下假設:
(1)生命的四類行為本身沒有明確的范圍,而是具有模糊的界限(如圖1所示);
生命行為類別LBT
A:本能式行為 B:反射式行為;C:慎思式行為;D:社會式行為
圖1 生命行為的模糊屬性示意圖
(2)生命的四類行為之間沒有固定的區別,而是處于動態的變化;
(3)本能式行為不是該種生命產生時便己具有,而是由反射式行為經多代的自然選擇進化(或退化)而來;
(4)反射式行為以本能式行為為基礎,由生物個體經多次慎思式行為的積累才逐漸建立和形成,也可以取消和去除;
(5)社會式行為的產生和執行雖然以生物的本能行為和反射行為為基礎,但是卻可以在某種程度上超越本能行為和反射行為而具有最高的控制級別。
以上是對生命的基本行為機理的假設和解釋,并以此作為人工智能和仿生機器人進一步研究的理論基礎。
2 幾類機器人體系結構
機器人體系結構,就是指為完成指定目標的一個或幾個機器人在信息處理和控制邏輯方面的結構方式。
2.1 基于功能分解的體系結構
基于功能分解的體系結構在人工智能上屬于傳統的慎思式智能,在結構上體現為串行分布,在執行方式上屬于異步執行,即按照“感知一規劃一行動”的模式進行信息處理和控制實現。以美國國家航天局和美國國家標準局所提出的NASR人MtI〕為典型代表。這種體系結構的優點是系統的功能明了.層次清晰,實現簡單。但是申行的處理方式大大延長了系統對外部事件的響應時間,環境的改變導致必須重新規劃,從而降低了執行效率。因此只適合在已知的結構化環境下完成比較復雜的工作。
2.2 基于行為分解的體系結構
基于行為分解的體系結構在人工智能上屬于現代的反應式智能,在結構上體現為并行(包容)分布,在執行方式上屬于同步執行,即按照“感知一行動”的模式并行進行信息處理和控制。以麻省理工的R.A.Brooks所提出的行為分層的包容式體系結構(SubsumptionArchitecture) 和Arkin提出的基于MotorSc hema的結構為典型代表。其主要優點就是執行時間短、效率高、機動能力強。但是由于缺乏整體的管理,很難適應于各種情況。因此只適用于在沐淘環境下執行比較簡單的任務。
2.3 基于智能分布的體系結構
基 于智 能 分布的體系結構在人工智能上屬于最新的分布式智能,在結構上體現為分散分布,在執行上屬于協同執行,既可以單獨完成各自的局部問題求解,又能通過協作求解單個或多個全局問題。以基于多智能體的體系結構為典型代表。這種體系結構的優點是既具有“智能分布”的特點,又有統一的協調機制。但是如何在各個智能體之間合理的劃分和協調仍然需要大量的研究和實踐。該體系結構在許多大型的智能信息處理系統上有著廣泛的應用。
除以 上 三 類主要的體系結構之外,還有一些改進的混合式體系結構,如帶反饋環節的行為分解模式、基于分布式智能的分層體系結構、基于功能分解的多智能體結構等等。但是從整體上來看,它們或是在功能模塊的靈活性和擴展性上不足,或是沒能很好的協調慎思式智能與反應式智能,或是各層次間的交流機制不夠完善。
3 仿生式控制體系結構
3.1 仿生式體系結構的思想原理
從本質上來講,慎思式智能、反應式智能以及分布式智能,都是對生物控制邏輯和推理方式的一種借鑒和仿生,但由于客觀條件的限制和需求目的的局限,它們都只是從某一個角度和方向對生物智能的一種片面的、局部的模仿。本文的仿生式體系結構就是以前述的生物控制邏輯和行為推理為基礎,充分借鑒基于慎思式智能、反應式智能和分布式智能等三種體系結構思想的優點與不足之處,針對目前機器人特別是未知環境下工作的移動機器人在控制體系結構方面所存在的缺點和問題,提出一種具有適應行為與進化能力的新的控制思想與理念。
其主要思想和原理如下:
(1)借 鑒 基于反應式智能的行為分解思想,依據行為級別的高低將控制體系結構化分為多個行為層;
各行為層間(即行為劃分標準)應該是:
.由被動的行為到主動的行為;
.由基本的行為到復合的行為;
.由低級的行為到高級的行為;
.由反射式行為到目標式行為;
.由基于安全的行為到面向任務的行為;
.由硬件直接實現的行為到需要復雜計算甚至是分布式協同計算的行為。
(2)借鑒反應式智能的思想,在控制體系結構中引人本能式行為控制層;
(3)借鑒生物的條件反射思想,在控制體系結構中引人反射式行為控制層;
(4)借鑒慎思式智能的思想,在控制體系結構中引人慎思式行為控制層;
(5)借鑒分布式智能的思想,在控制體系結構中引人社會式行為控制層;
(6)借鑒生物的自適應性思想,在控制體系結構中實現本代內的由慎思式行為層到反射式行為層的學習;
(7)借鑒生物的自進化性思想,在控制體系結構中實現多代間的由反射式行為層向本能式行為層的進化(或退化)。
所以,仿生式體系結構共有四個行為控制層組成,即本能式行為控制層、反射式行為控制層、慎思式行為控制層和社會式行為控制層,它們并行接收來自感知層的外部和內部信息,各自作出邏輯判斷和反應,發出控制信息到末端執行層,通過競爭和協調來調節自身并適應外部環境,從而按照目標完成工作任務。
3.2 仿生式體系結構的整體設計
仿生式體系結構的整體組成如圖2所示。其工作流程為:
圖2 機骼人仿生式體系結構圖
(1)感知層感知機器人內部和外界的敏感信息,分類傳至數據庫;
(2)本能類的信息直接傳至本能式行為控制層,如不為零則直接傳至執行層,觸發對應的行為,同時觸發行為保存至決策庫;
(3)反射類的信息傳至反射式行為控制層,歸類后經模糊邏輯判斷觸發相應的行為,同時將模糊決策結果保存至決策庫;
(4)慎思類的信息傳至慎思式行為控制層,歸類后經神經網絡推理得出模糊決策,存至決策庫并觸發相應的行為;
(5)社會式行為控制層感知和接收來自其他仿生機器人或人類的決策信息,同時提取本身的底層決策結構,綜合衡量比較處理后得出決策,存至決策庫并觸發相應的行為。
在具體的執行過程中,四個行為控制層在優先級別和響應時間上存在著如下關系:
(1)各行為控制層具體執行的優先級別:社會式行為控制層>本能式行為控制層>反射式行為控制層>慎思式行為控制層
(2)各行為控制層響應時間的長短順序:社會式行為控制層>慎思式行為控制層>反射式行為控制層>本能式行為控制層
3.3 各行為控制層的具體實現
3.3.1本能式行為控制層的設計實現
本能式行為控制對機器人而言就是指參照生命的本能反應的在邏輯上無需判斷推理,在硬件上直接觸發實現的行為控制方式。
本能式行為控制層所包含的行為一般為基于安全的最基本、最低級的行為,如電源啟動、自身基本狀態檢測、避碰等等。
規則I:
if data_instinet_class<>0 then//非零觸發
exec(instinct-class)// 執行對應行為
report (decision_bank)//存人數據庫
對本能類信息作二值化處理,超過所設的閡值則觸發對應的本能反應。
3.3.2 反射式行為層控制的設計實現
反射式行為控制對機器人而言就是指參照生命的第一條件反射的在邏輯上采用模糊推理和條件觸發的行為控制方式。
反射式行為控制層所包含的行為一般為機器人在具體的環境條件下長期積累形成的一些比較低級的基本的控制行為,如響鈴避碰,遇光報警等。
規則2: 對于已經建立了條件反射的先后發生的兩個事件Ea,Eb,設對應的響應為Ra,Rb,兩者間的聯接強度為Rab,初試聯接強度為R0,則可以按照如下模糊規則響應:
If Ea is ture then//如果事件Ea發生
exec(Ra)//執行Ea的響應Ra
find Eb on condition (Rab>3R0/2) then //查找滿足條件反射的事件Eb
exec(Rb)//執行Eb的響應Rb
while(t<△T)//如果Eb如期發生
if Eb is true //則強化聯接強度
Rab=Rab-R0/2i
else Rab=Rab-R0/2i //否則弱化
End if
End if
其隸屬度圖如圖3所示。
圖3 反射式行為控制層的響應規則
3.3.3 慎思式行為控制層的設計實現
慎思式行為控制指的就是全面的考慮多方面的因素與信息,由模糊邏輯和神經網絡進行推理和計算得出決策的一種高級的行為控制方式。
規則3 :慎 思式行為控制規則采用的是規則聯接的模糊神經網絡,處理過程如圖4所示。對應的模糊神經網絡結構如圖5所To
圖5 悄思式行為的推理規則
3.3.4 社會式行為控制層的設計實現
社會式行為控制是指機器人與其他協同完成同一工作任務的機器人或人等類似智能體間的協同控制和共同處理的工作方式。其前提為共同的工作任務,統一的信息格式。
規則4:阿西莫夫的機器人三定律,即
機器人不得傷害人,或任人受到傷害而無所作為;
機器人應服從人的一切命令,但命令與第一定律相抵觸時例外;
機器人必須保護自身的安全,但不得與第一、第二定律相抵觸。
3.4 各行為層間的學習與進化
3.4.1本代內的學習
本代的學習指的就是一代機器人內將慎思式行為層的控制決策升華到反射式行為層的學習過程,即條件反射的形成和消除過程。
假設:生物自適應性的本質使其具有在先后發生時間較短的兩個事件之間產生關聯,并進一步強化或弱化這種關聯的本能。
規則5:設先后發生的事件Ea、Eb,其時間間隔為△τ,事件間的聯接強度為R,則條件反射的建立和消除可以按如下規則來實現:
假設兩事件間的初始聯接強度為
Ro= Rand'(0,1) ( 1)
條件反射的上限、下限分別為
Rlowlimit=R0-R0/2=R0/2 (2)
Ruplimit=R0+R0/2=3R0/2 (3)
則兩事件間的聯接強度為
設i=0,△τi=△τo=0,則
聯接強度R的大小反映的就是事件間的條件反射關系。
3.4.2 多代間的進化
目前的仿生機器人時代,機器人已經初步具備了自我進化的能力,但是這種進化主要發生在虛擬世界中,通過移植到機器人本體而發生作用。
多代間的進化就是指機器人通過計算機仿真計算而獲得的由反射式行為到本能式行為的建立和由本能式行為到反射式行為的消除過程。
本文所研究的機器人的進化在性質上指的是虛擬的進化(或退化),在內容上指的是本能式行為的進化(或退化)
假設:生物的自進化性使其具有把某種反射式行為,變異為相應的本能式行為并傳遞給下一代的能力,這種變異經過環境的選擇和積累便體現為多代間的進化或退化。
規則6 :對于在同一環境下工作的多個機器人,如果都對應的形成了某類條件反射B,那么在下一代機器人中將考慮把其對應的控制規則由反射式控制Cr進化為本能式控制Ci,即在事件Ea發生時直接執行Ra和Rb;對于某類行為的本能性控制直接消除,通過機器人在后天的與環境的交互中建立條件反射來控制執行。
4 結論
本文所設計的仿生式控制體系結構全面吸收和借鑒了慎思式智能、反應式智能和分布式智能的優點與長處,生命的本質特征為基礎設計適用于第四代仿生機器人的仿生式體系結構,實現了仿生機器人單代間的學習和多代間的進化,對機器人的發展有著重要的意義和影響。
作者簡介:許宏巖(1976-),男,博士研究生,主要研究方向為仿生機器人,移動機器人導航/定位、加工工況監測等。
王樹國,男,哈爾濱工業大學校長、教授,博士生導師
下一篇: PLC、DCS、FCS三大控
上一篇: 索爾維全系列Solef?PV