原標(biāo)題:谷歌機(jī)器人學(xué)會(huì)自己走路,完全不需要人工干預(yù)
研究者的新研究取得了很大的進(jìn)展,機(jī)器人可以學(xué)會(huì)走路而無(wú)需人工干預(yù)。 在幾個(gè)小時(shí)內(nèi),僅依靠現(xiàn)在最先進(jìn)的算法的微調(diào),就成功地讓四條腿的機(jī)器人學(xué)習(xí)了完全獨(dú)立的前進(jìn)和后退、左右轉(zhuǎn)彎。
圖|機(jī)器人在包括平地(上)、內(nèi)存格式床墊(中)、拔出空的門(mén)板(下)在內(nèi)的各種地形上學(xué)習(xí)自主步行(來(lái)源: arxiv )。
這項(xiàng)事業(yè)是基于一年前的研究,當(dāng)時(shí)的研究小組首次發(fā)現(xiàn)了如何讓機(jī)器人在現(xiàn)實(shí)世界中學(xué)習(xí)。
迄今為止,強(qiáng)化學(xué)習(xí)是在仿真環(huán)境中進(jìn)行的,直到機(jī)器人的虛擬分身算法充分完善,安全動(dòng)作為止。 然后把它引進(jìn)真正的機(jī)器人。
這種方法有助于防止機(jī)器人在重復(fù)實(shí)驗(yàn)中損傷周?chē)沫h(huán)境,但需要容易建模的環(huán)境。 模擬在機(jī)器人腳下自然散落的沙礫和彈簧床墊需要很長(zhǎng)時(shí)間,不值得。
基于這種情況,研究者決定從一開(kāi)始就不通過(guò)在現(xiàn)實(shí)世界中訓(xùn)練來(lái)建模困難的環(huán)境。 他們?cè)O(shè)計(jì)了更高效的算法,減少了學(xué)習(xí)的實(shí)驗(yàn)次數(shù),可以在兩個(gè)小時(shí)內(nèi)讓機(jī)器人站起來(lái)走路。 由于實(shí)際環(huán)境有自然的變化,機(jī)器人也能迅速應(yīng)對(duì)傾斜、樓梯、殘疾平地等其他類(lèi)似的環(huán)境。
但是,這個(gè)過(guò)程依然需要人類(lèi)幫助機(jī)器人,數(shù)百次手動(dòng)介入,谷歌Brain機(jī)器人運(yùn)動(dòng)隊(duì)負(fù)責(zé)人、論文共作者譚杰(音譯)說(shuō):“最初還不認(rèn)為需要人工介入?!?/p>
于是他們開(kāi)始處理這個(gè)新問(wèn)題。 首先,他們限定了機(jī)器人可以搜索的地形,避免一次重復(fù)多重動(dòng)作訓(xùn)練。 學(xué)習(xí)機(jī)器人前進(jìn)的方法,到達(dá)限定地形的邊緣后,開(kāi)始學(xué)習(xí)改變方向,向后走的方法。
其次,研究者限制了機(jī)器人的訓(xùn)練動(dòng)作,慎重地將反復(fù)跌倒造成的傷害降到了最小限度。 機(jī)器人不由得摔倒的時(shí)候,他們添加了另一個(gè)硬編碼算法來(lái)幫助它站起來(lái)。
通過(guò)這些調(diào)整,機(jī)器人學(xué)會(huì)了在平地、記憶床墊、有間隙的墊子等幾個(gè)不同的環(huán)境中自主行走的方法。 這個(gè)實(shí)驗(yàn)給將來(lái)的應(yīng)用帶來(lái)了可能性,有時(shí)機(jī)器人需要在沒(méi)有人的情況下在搖滾和未知的地形上行走。
斯坦福大學(xué)的切爾西芬副教授( chelsea finn )說(shuō):“這項(xiàng)事業(yè)很令人興奮?!?芬恩也為谷歌工作,但不參與這項(xiàng)研究。 “讓這個(gè)過(guò)程不要人工介入真的不容易。 如果機(jī)器人能更自主地學(xué)習(xí),就更有可能在我們生活的現(xiàn)實(shí)世界而不是實(shí)驗(yàn)室學(xué)習(xí)。 ”。
但是,現(xiàn)在的設(shè)置依賴(lài)于機(jī)器人上方的運(yùn)動(dòng)捕捉系統(tǒng),也注意到明確了其位置。 這在現(xiàn)實(shí)世界中是不可能的。
其次,我希望他們的算法適用于不同種類(lèi)的機(jī)器人,或者多個(gè)機(jī)器人可以在同一個(gè)環(huán)境中學(xué)習(xí)。 譚杰相信解讀機(jī)器人的運(yùn)動(dòng)能力是解鎖越來(lái)越多有用的機(jī)器人的關(guān)鍵。
他說(shuō):“很多地方是為人類(lèi)做的,我們用腳走路?!?“機(jī)器人不用腳的話,就不能在人類(lèi)的世界里行走。 ”。
全天候滾動(dòng)播放最新的財(cái)經(jīng)信息和視頻,越來(lái)越多的粉絲福利掃描二維碼備受關(guān)注( finance )。
標(biāo)題:【熱門(mén)】谷歌機(jī)器人自己學(xué)會(huì)走路,完全無(wú)需人工干預(yù)
地址:http://www.swled.com.cn/gphq/2886.html