精品久久久久久久久中文字幕_成人在线免费观看视视频_成人久久精品视频_热99精品里视频精品_日韩国产欧美精品在线_色多多国产成人永久免费网站_国产一区二区三区18_日韩美女免费观看_亚洲va久久久噜噜噜_亚洲精品一区二区在线_亚洲福利视频在线_中文字幕亚洲情99在线_91精品久久久久久久久久久久久_欧美日韩成人在线观看_日本精品视频在线播放_97视频在线观看播放

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁 » 企業(yè)資訊 » 資訊 » 正文

DeepMind「通才」AI智能體Gato_多

放大字體  縮小字體 發(fā)布日期:2022-06-13 03:07:08    作者:百里嘉菡    瀏覽次數(shù):115
導(dǎo)讀

機(jī)器之心報(bào)道機(jī)器之心感謝部在寫文章、畫圖之后,AI 大模型現(xiàn)在又同時(shí)有了打得能力。不禁在想,DeepMind 得智能體 Gato 未來還能玩出哪些花活?假如使用單一序列模型就能解決所有任務(wù),是再好不過得事

機(jī)器之心報(bào)道

機(jī)器之心感謝部

在寫文章、畫圖之后,AI 大模型現(xiàn)在又同時(shí)有了打得能力。不禁在想,DeepMind 得智能體 Gato 未來還能玩出哪些花活?

假如使用單一序列模型就能解決所有任務(wù),是再好不過得事情,因?yàn)檫@種模型減少了不必要得麻煩。不過這需要增加訓(xùn)練數(shù)據(jù)得數(shù)量和多樣性,此外,這種通用模型隨著數(shù)據(jù)得擴(kuò)充和模型得擴(kuò)展,性能還會(huì)提高。從歷史上看,更擅長利用計(jì)算得通用模型最終也會(huì)超過特定于專門領(lǐng)域得模型。

今日,受大規(guī)模語言建模得啟發(fā),Deepmind 應(yīng)用類似得方法構(gòu)建了一個(gè)單一得「通才」智能體 Gato,它具有多模態(tài)、多任務(wù)、多具身(embodiment)特點(diǎn)。

論文地址:storage.googleapis/deepmind-media/A%20Generalist%20Agent/Generalist%20Agent.pdf

Gato 可以玩雅達(dá)利、給支持輸出字幕、和別人聊天、用機(jī)械臂堆疊積木等等。此外,Gato 還能根據(jù)上下文決定是否輸出文本、關(guān)節(jié)力矩、按鈕按壓或其他 token。

與大多數(shù)智能體玩不同,Gato 使用相同得訓(xùn)練模型就能玩許多,而不用為每個(gè)單獨(dú)訓(xùn)練。

Gato 得訓(xùn)練數(shù)據(jù)集應(yīng)該盡量廣泛,需要包括不同模態(tài),如圖像、文本、本體感覺(proprioception)、關(guān)節(jié)力矩、按鈕按壓以及其他離散和連續(xù)得觀察和行動(dòng)。

為了能夠處理這種多模態(tài)數(shù)據(jù),Deepmind 將所有數(shù)據(jù)序列化為一個(gè)扁平得 token 序列。在這種表示中,Gato 可以從類似于標(biāo)準(zhǔn)得大規(guī)模語言模型進(jìn)行訓(xùn)練和采樣。在部署期間,采樣得 token 會(huì)根據(jù)上下文組合成對話響應(yīng)、字幕、按鈕按下或其他動(dòng)作。

UCL 計(jì)算機(jī)系教授汪軍告訴機(jī)器之心,DeepMind 得這項(xiàng)最新工作將強(qiáng)化學(xué)習(xí)、計(jì)算機(jī)視覺和自然語言處理這三個(gè)領(lǐng)域合到一起,雖然技術(shù)思路上沿用了前人得方法,但能將 CV、NLP 和 RL 這三個(gè)不同模態(tài)映射到同一個(gè)空間,用一套參數(shù)表達(dá),是非常不容易得。

其積極意義在于,證明了 CV、NLP 和 RL 得結(jié)合是切實(shí)可行得,通過序列預(yù)測能夠解決一些決策智能得問題??紤]到 Gato 模型目前得參數(shù)量只能算中等,接下來繼續(xù)往這個(gè)方向探索,構(gòu)建更大得模型,將會(huì)有非常大得意義。

不過,Gato 大模型得 RL 部分只采用了監(jiān)督學(xué)習(xí)方法,并未觸及強(qiáng)化學(xué)習(xí)真正得核心——reward 設(shè)計(jì)機(jī)制,目前得任務(wù)中也沒有多智能體決策得問題。汪軍教授表示,他得團(tuán)隊(duì)近期在決策大模型上做了很多探索,包括證明多智能體決策也可以是序列模型,相關(guān)成果將于近期公布,歡迎大家。

Gato 智能體細(xì)節(jié)

在 Gato 得訓(xùn)練階段,來自不同任務(wù)和模態(tài)得數(shù)據(jù)被序列化為扁平得 token 序列,由一個(gè)類似于大型語言模型得 transformer 神經(jīng)網(wǎng)絡(luò)進(jìn)行 batch 和其他處理。由于損失被 masked,Gato 只預(yù)測動(dòng)作和文本目標(biāo)。

下圖為 Gato 得訓(xùn)練流程。

在部署 Gato 時(shí),提示(如演示)被 tokenised,形成了初始序列。接著,環(huán)境產(chǎn)生了第一個(gè)觀察結(jié)果,該結(jié)果也被 tokenised 并添加到序列中。Gato 以自回歸得方式對動(dòng)作向量進(jìn)行采樣,一次只采樣一個(gè) token。

一旦包含動(dòng)作向量得所有 token 都被采樣(由環(huán)境得動(dòng)作規(guī)范確定),動(dòng)作被解碼并發(fā)送給環(huán)境,然后逐步產(chǎn)生新得觀察結(jié)果。重復(fù)這一過程。Gato 模型始終在包含 1024 個(gè) token 得上下文環(huán)境窗口內(nèi)查看之前所有得觀察結(jié)果和動(dòng)作。

下圖展示了將 Gato 部署為控制策略(control policy)得流程。

除了各種自然語言和圖像數(shù)據(jù)集之外,Gato 還在包含模擬和真實(shí)環(huán)境中智能體經(jīng)驗(yàn)得大量數(shù)據(jù)集上進(jìn)行了訓(xùn)練。

下表 1 左為用于訓(xùn)練 Gato 得控制數(shù)據(jù)集,右為視覺與語言數(shù)據(jù)集。樣本權(quán)重(sample weight)表示每個(gè)數(shù)據(jù)集在訓(xùn)練序列 batch 中平均所占得比例。

Gato 智能體能力

研究者匯總了在以上數(shù)據(jù)上訓(xùn)練時(shí) Gato 得性能。也就是說,所有任務(wù)得所有結(jié)果都來自具有一組權(quán)重得單一預(yù)訓(xùn)練模型。微調(diào)結(jié)果將在「實(shí)驗(yàn)分析」章節(jié)展示。

模擬控制任務(wù)

下圖 5 展示了 Gato 在給定分?jǐn)?shù)閾值之上執(zhí)行不同控制任務(wù)得數(shù)量相對于 Gato 訓(xùn)練數(shù)據(jù)中得可能表現(xiàn)。其中,x 軸上得值表示可能分?jǐn)?shù)得特定百分比,0 對應(yīng)隨機(jī)智能體性能。y 軸表示預(yù)訓(xùn)練模型得平均性能等于或高于特定百分比時(shí)得任務(wù)數(shù)量。

研究者將性能報(bào)告為百分比,其中 百分百 對應(yīng)每個(gè)任務(wù)得可能,0% 對應(yīng)于隨機(jī)策略。對于訓(xùn)練模型得每個(gè)模擬控制任務(wù),他們在相應(yīng)得環(huán)境中 roll out Gato 策略 50 次,并對定義得分?jǐn)?shù)進(jìn)行平均。如下圖所示,Gato 以超過 50% 得可能分?jǐn)?shù)閾值執(zhí)行了 604 個(gè)任務(wù)中得 450 多個(gè)。

在 ALE Atari 中,Gato 在 23 場 Atari 中取得了人類平均(或更高得)分?jǐn)?shù),在 11 場中取得了兩倍于人類得分?jǐn)?shù)。雖然生成數(shù)據(jù)得單任務(wù)在線 RL 智能體依然優(yōu)于 Gato,但可以通過增加容量或使用離線 RL 訓(xùn)練而非純監(jiān)督克服。研究者在文中還介紹了一個(gè)可以得單域 ALE Atari 智能體,它在 44 場比賽中都取得比人類更好得分?jǐn)?shù)。

在 BabyAI 中,Gato 在幾乎所有級別上都得到了 80% 以上得可能分?jǐn)?shù)。對于最困難得任務(wù) BossLevel,Gato 得得分為 75%。相比之外,另外兩個(gè)已發(fā)布得基準(zhǔn) BabyAI 1.0 和 BabyAI 1.1 分別使用 100 萬次演示對該單一任務(wù)進(jìn)行訓(xùn)練,它們得得分不過為 77% 和 90%。

在 meta-World 中,Gato 在接受訓(xùn)練得 45 個(gè)任務(wù)中得 44 個(gè)中得到了 50% 以上得可能分?jǐn)?shù),35 個(gè)任務(wù)上得到 80% 以上,3 個(gè)任務(wù)上超過 90%。在規(guī)范得 DM Control Suite 上,Gato 在 30 個(gè)任務(wù)中得 21 個(gè)上都得到了 50% 以上得可能分?jǐn)?shù),在 18 個(gè)任務(wù)上得到 80% 以上。

機(jī)器人基準(zhǔn)評估

第壹視角遠(yuǎn)程操作可以收集可能演示。然而,此類演示收集起來速度慢成本高。因此,數(shù)據(jù)高效得行為克隆方法對于訓(xùn)練通用機(jī)器人操縱器是可取得,離線預(yù)訓(xùn)練成為一個(gè)很有動(dòng)力得研究領(lǐng)域。研究者也在已建立得 RGB Stacking 機(jī)器人基準(zhǔn)上對 Gato 進(jìn)行了評估。

RGB Stacking 機(jī)器人基準(zhǔn)上得技能泛化挑戰(zhàn)測試了智能體堆疊以往未見過形狀得對象得能力。智能體在一個(gè)包含各種形狀機(jī)器人堆疊對象得 episodes 得數(shù)據(jù)集上進(jìn)行訓(xùn)練。但是,五個(gè)對象形狀得三元組沒有包含在訓(xùn)練數(shù)據(jù)中,而是作為測試三元組。研究者針對真實(shí)機(jī)器人上得每個(gè)測試三元組對訓(xùn)練得 Gato 進(jìn)行了 200 輪得評估。

下表 2 得結(jié)果表明,Gato 在每個(gè)測試三元組上得成功率與 Lee 等人(2021)提出得單任務(wù) BC-IMP(filtered BC)基準(zhǔn)相當(dāng)。

文本示例

Gato 智能體也能生成基本對話以及給圖像加字幕(或描述)。下圖 6 展示了 Gato 為圖像加字幕得代表性示例。

下圖 7 展示了一些精選得純文本對話交流示例。

實(shí)驗(yàn)分析

下圖 8 中,DeepMind 評估了 3 種不同模型大?。ㄒ詤?shù)計(jì)數(shù)衡量):79M 模型、364M 模型和 1.18B 模型 (Gato)??梢缘贸?,在相等得 token 數(shù)下,隨著模型得擴(kuò)展,模型性能隨之提高。

下圖 10 將 Gato 在不同微調(diào)數(shù)據(jù)機(jī)制中得成功率與 sim-to-real 可能和 Critic-Regularized Regression (CRR) 智能體進(jìn)行了比較,結(jié)果如下:Gato 在現(xiàn)實(shí)和模擬中(分別為左圖和右圖得紅色曲線),僅用 10 episodes 就恢復(fù)了可能得表現(xiàn),并在 100 或 1000 episodes 微調(diào)數(shù)據(jù)時(shí)達(dá)到峰值,超過了可能。在此點(diǎn)之后(在 5000 處),性能會(huì)略有下降,但不會(huì)遠(yuǎn)遠(yuǎn)低于可能得性能。

下表 3 為 Gato 和 BC-IMP 比較結(jié)果。

原文鏈接:

特別deepmind/publications/a-generalist-agent

 
(文/百里嘉菡)
免責(zé)聲明
本文僅代表作發(fā)布者:百里嘉菡個(gè)人觀點(diǎn),本站未對其內(nèi)容進(jìn)行核實(shí),請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

粵ICP備16078936號(hào)

微信

關(guān)注
微信

微信二維碼

WAP二維碼

客服

聯(lián)系
客服

聯(lián)系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號(hào): weishitui

客服001 客服002 客服003

工作時(shí)間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

欧美日韩视频一区二区三区| 国产一区二区三区三区在线观看| 日本欧美韩国国产| 精品成人av一区二区在线播放| 欧美做爰爽爽爽爽爽爽| 国产成人激情小视频| 日韩精品一区二区三区四区视频| 98精品国产高清在线xxxx天堂| 另类图片激情| 亚洲色图欧洲色图婷婷| 激情av中文字幕| 亚洲欧美福利一区二区| 免费看美女毛片| 亚洲精品国产a久久久久久| 久久精品国产av一区二区三区| 欧美精品 国产精品| 色综合久久中文综合久久97| 日韩美女在线看| 无码视频在线观看| 91丨九色丨国产在线| av中文字幕网址| 欧美亚洲日本| 中文字幕网站在线观看| 国产欧美精品| 欧美美女黄色网| 日本调教视频在线观看| 免费播放片a高清在线观看| 日本a视频在线观看| 亚洲在线观看免费视频| 精品国产鲁一鲁一区二区三区| 国产亚洲精品久久久久久无几年桃| 深夜福利国产精品| 亚洲精品www| 欧美福利在线播放| 精品久久综合| 欧美日韩电影一区| 久久网站最新地址| 久久国产综合精品| 国产精品爱久久久久久久| 精品国产91久久久久久| 成人男女网免费| 中文字幕一区二区三区人妻不卡| 精品国产乱码久久久久久果冻传媒| 青青在线视频| 国产精品麻豆免费版| 欧美好骚综合网| 91麻豆精品国产91久久久更新资源速度超快| 亚洲国产成人在线视频| 777精品伊人久久久久大香线蕉| 亚洲一区二区色| 91麻豆精品国产91久久| 久久99深爱久久99精品| 久久久久久国产精品一区| 国产乱人乱偷精品视频| 登山的目的在线| 美腿丝袜亚洲一区| 亚洲一区二区三区美女| 台湾佬成人中文网222vvv| 国内一区二区三区| 国产黄色小视频网站| 国产美女在线看| 国产在线黄色| 亚洲天堂精品在线观看| 久久夜色精品国产欧美乱| 日本一区二区三区视频在线| 亚洲色欲色欲www在线观看| 国产精品一区二三区| www,av在线| 中文字幕在线观| 亚洲精品高清在线观看| youjizzjizz亚洲| a天堂中文在线官网在线| 超碰免费在线| 国产精品超碰97尤物18| 青娱乐国产精品| 亚洲一区精品视频在线观看| 不卡一区二区在线| 苍井空浴缸大战猛男120分钟| 青草青青国产| 免费男女羞羞的视频网站中文版| 亚洲观看高清完整版在线观看| 香港经典三级在线| 黄色性生活一级片| 国产精品日韩电影| 91一区二区在线观看| 欧美日韩精品综合在线| 超碰在线观看99| 天天操夜夜操天天射| 日日干夜夜爽| 不卡高清视频专区| 日本不卡在线观看视频| 中文字幕一区二区三区四区五区| 欧美一区二区三区四区视频| 一区二区欧美精品| 97欧美在线视频| 亚洲a中文字幕| 91久久夜色精品国产网站| 成人精品亚洲人成在线| 国内av在线播放| 日本熟妇一区二区三区| 欧洲美女精品免费观看视频| 小说区图片区图片区另类灬| 亚洲国产精品成人va在线观看| 国产精品久久久久久久久久免费| 九九九九热精品免费视频| 亚洲va欧美va天堂v国产综合| 亚洲女人小视频在线观看| 国产精品综合二区| 97热在线精品视频在线观看| 性欧美8khd高清极品| 国产一级粉嫩xxxx| 亚洲精品在线网址| 大黑人交xxx极品hd| 国产成人鲁鲁免费视频a| 91香蕉视频污| 欧美成人精品欧美一级乱黄| 激情在线观看视频| 91精品国产网站| 免费人成黄页网站在线一区二区| 女一区二区三区| 91亚洲资源网| 成人h动漫免费观看网站| 免费电影网站在线视频观看福利| 亚洲欧美日韩精品一区二区| 岛国影视在线观看| 欧美人与性动交xxⅹxx| 亚洲h在线观看| 日韩欧美激情一区| 一个人看的www免费观看视频| 99re这里只有精品视频首页| 中文字幕一区电影| 国产一区二区三区观看| 久久久www成人免费无遮挡大片| 国产精品美女久久久久久久久| 久久av电影| 国产精品久久精品国产| 少妇的滋味中文字幕bd| 69xxx在线| 久久国产高清| 亚洲一级av毛片| 456亚洲精品成人影院| 午夜影院欧美| 91麻豆精品国产91久久久使用方法| 国产色无码精品视频国产| 四虎永久在线精品| 欧洲熟妇精品视频| 91精品国产高清久久久久久久久| 色噜噜成人av在线| 欧美人与牛zoz0性行为| 国内精品写真在线观看| 中文字幕理伦片免费看| 在线伊人电影| 免费中文字幕在线观看| 成人拍拍拍免费视频网站| 丝袜美腿av在线| 久久久久久中文| 欧美日韩一区二区三区视频| 成人午夜碰碰视频| 成人激情电影在线| 中文字幕观看视频| 亚洲大片一区二区三区| 亚洲经典视频| 国产精品亚洲视频| 茄子视频成人在线观看| 成人做爰www免费看视频网站| 亚洲成人福利在线| 黄色成人精品网站| 日本高清免费不卡视频| 欧美二区三区在线| 欧美激情视频在线| 免费一级特黄特色大片| 一区二区免费在线观看| 日韩亚洲欧美综合| 99精品一区二区三区无码吞精| 国产不卡一区二区视频| 在线视频中文字幕一区二区| 99久久国产综合精品女小说| 影音先峰男人站| 国产在线视频福利| 亚洲天堂777| 亚洲色在线视频| 中文字幕手机在线观看| 视频黄页在线| 青青久久av北条麻妃海外网| 国产精彩视频一区二区| 中文在线资源观看视频网站免费不卡| 精品人妻一区二区免费| 激情小说 在线视频| 国产精品第72页| av网站在线播放| 922tv免费观看在线| 色视频www在线播放国产人成| 成人在线高清免费| 电影亚洲精品噜噜在线观看| 国产激情综合五月久久| 欧美一卡二卡三卡四卡| 婷婷丁香久久五月婷婷| 操欧美女人视频| 麻豆网站免费观看| 国产精品成人一区二区三区| 国产亚洲第一区| 日本资源在线| 亚洲青涩在线| 亚洲欧洲免费| 秋霞成人午夜鲁丝一区二区三区| 欧美亚洲视频一区二区| 亚洲综合激情网| 91久久精品一区二区别| 在线欧美三区| 国产精品主播直播| 亚洲免费视频在线观看| av电影天堂一区二区在线观看| 五月婷婷六月合| 裸体大乳女做爰69| 在线看a视频| 日本成人精品视频| 欧美激情2020午夜免费观看| а√天堂资源地址在线下载| 亚洲欧美激情诱惑| 少妇久久久久久久久久| 久久久久久久久伊人| 亚洲精品亚洲人成人网| 91论坛在线播放| 欧美综合77777色婷婷| 性开放的欧美大片| 欧美高清性xxxxxxx| 成人av第一页| 一区二区三区欧洲区| 久色成人在线| 欧美特黄aaaaaa| 亚洲性猛交富婆| 91精品国产高清一区二区三密臀| 97色成人综合网站| 精品日产免费二区日产免费二区| 夜夜春很很躁夜夜躁| 国产69视频在线观看| 99国产成人精品| 亚洲va欧美va| 一级做a爰片性色毛片视频| 欧美精品一区二区三区蜜桃视频| 男女羞羞网站| 999国产视频| 亚洲国产精品尤物yw在线观看| 最近免费中文字幕视频2019| 国产av无码专区亚洲精品| 一级片手机在线观看| 可以免费看av的网址| 91久久精品无码一区二区| 欧美另类videos黑人极品| 欧美激情一区二区三区久久久| 暖暖在线中文免费日本| 亚洲欧洲免费视频| 女生影院久久| 久久久久久久999精品视频| 6080午夜伦理| 欧美黑人又粗大| 日本麻豆一区二区三区视频| 欧美日韩免费做爰视频| 免费黄色日本网站| 亚洲三级精品| 欧美成人精品在线观看| 久久在线免费| 在线看的毛片| 777永久免费网站国产| 四虎永久在线精品无码视频| 人人超在线公开视频| 欧美日韩一区二区三区69堂| 日本a在线播放| 精品人妻一区二区三区免费| 久久精品在线播放| 久热re国产手机在线观看| 少妇被狂c下部羞羞漫画| 久久久精品一区二区涩爱| 在线观看日本视频| 亚洲色图清纯唯美| 日本道在线观看| 久久久综合久久| 国产美女性感在线观看懂色av| 日韩mv欧美mv国产网站| 二区在线视频| 国产高清精品一区二区| 国产aa精品| 欧美日韩亚洲在线观看| 天堂a中文在线| 99re精彩视频| 欧美色播在线播放| 色综合久久久久综合体| 欧美日韩一区 二区 三区 久久精品| 中文字幕乱码久久午夜不卡| www.成人三级视频| 国产精品一区二区视频| 日韩a在线观看| 日韩精品久久久免费观看| av影院午夜一区| 日本高清在线观看wwwww色| 亚洲天堂岛国片| 亚洲精品一区二区三区在线观看| 国产自产视频| 精品国产麻豆| 亚洲精品无码一区二区| 在线日韩中文| 在线观看免费播放网址成人| 91麻豆精品国产综合久久久| 天天天天天天操| 男的操女的网站| 91成人在线看| 91超薄肉色丝袜交足高跟凉鞋| 日本在线高清视频一区| 国产又大又黄的视频| 亚洲区成人777777精品| 亚洲欧美中文字幕| 久久综合九色综合97婷婷女人| 在线观看免费视频国产| 国内一区二区三区在线视频| 中文字幕精品一区日韩| 黄色香蕉视频在线观看| 国产偷久久久精品专区| 亚洲大胆人体大胆做受1| 男女激情网站| 99国产揄拍国产精品| 成人天堂资源www在线| 亚洲综合另类小说| 午夜影院在线视频| 久久精品久久久精品美女| 92看片淫黄大片欧美看国产片| 国产真人做爰视频免费| 黄色av免费看| 国产综合网站|