【CNMO 新聞】近日,谷歌推出了人工智能模型 PaLM-SayCan,將可讓公司打造的機(jī)器人更容易理解使用者所下達(dá)口語指令,進(jìn)而正確執(zhí)行工作。

雖然機(jī)器人能一定程度上理解語意,但由于有時(shí)候它與人腦所理解內(nèi)容有所差異,所以一些較為復(fù)雜的指令它會(huì)無法理解。比如它能理解你讓它拿起一顆蘋果這種指令,但是它無法理解你說 " 我剛運(yùn)動(dòng)完,你能幫我準(zhǔn)備一些健康的點(diǎn)心嗎?"
即便目前機(jī)器人已經(jīng)可以通過 GPT-3 大型語言模型理解人類語句的深層含義,但距離讓機(jī)器人實(shí)際理解人類日常生活中的用語背后的需求,還有一段不小的路要走,其原因在于人腦對(duì)語句背后的內(nèi)容會(huì)有一定程度的想象。比如當(dāng)人打翻飲料,向他人提出幫忙請(qǐng)求時(shí),大家就會(huì)自然理解需要對(duì)現(xiàn)場進(jìn)行清理,因此能不必下達(dá)詳細(xì)命令就拿抹布擦拭地面、拿掃把清理碎裂物品等。
但機(jī)器人目前仍無法實(shí)現(xiàn)此類聯(lián)想,僅能從現(xiàn)有資料庫比對(duì)可行的做法,導(dǎo)致經(jīng)常出現(xiàn)答非所問的情況。而谷歌此次推出的 PaLM-SayCan 模型,則可以進(jìn)一步協(xié)助機(jī)器人判斷人類語句背后潛藏的需求,并進(jìn)一步將相關(guān)語句轉(zhuǎn)換成可讓機(jī)器人正確執(zhí)行的指令內(nèi)容,以此強(qiáng)化指令執(zhí)行的正確率。
目前谷歌已經(jīng)通過 GitHub 公開 PaLM-SayCan 模型相關(guān)內(nèi)容,讓有興趣的開發(fā)者、設(shè)計(jì)團(tuán)隊(duì)進(jìn)行測試。
原文地址:http://www.myzaker.com/article/62fdf03cb15ec00d4c103bff
轉(zhuǎn)載請(qǐng)注明:谷歌推出新人工智能模型 讓機(jī)器人理解語音背后的需求 | 快導(dǎo)航網(wǎng)