国产欧美日韩三区_偷窥自拍亚洲色图精选_久久大片网站_成人在线黄色_成人亚洲免费视频_99久久久精品_国产美女自拍_韩国19禁主播vip福利视频_色综合视频一区二区三区日韩_日本在线观看一区二区

當前位置:首頁 > 科技  > 知識百科

谷歌:性能不佳的微調模型不要扔,求一下平均權重就能提升性能

來源: 責編: 時間:2023-08-07 16:30:02 333觀看
導讀 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。如何最大限度地提升模型精度?最近,谷歌等機構發現:性能不好的微調模型先不要扔,求一下平均權重!就能在不增加推理

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。Jw028資訊網——每日最新資訊28at.com

如何最大限度地提升模型精度?Jw028資訊網——每日最新資訊28at.com

最近,谷歌等機構發現:Jw028資訊網——每日最新資訊28at.com

性能不好的微調模型先不要扔,求一下平均權重!Jw028資訊網——每日最新資訊28at.com

就能在不增加推理時間以及內存開銷的情況下,提高模型的準確性和魯棒性。Jw028資訊網——每日最新資訊28at.com

比如,研究人員就使用該方法創造了ImageNet1K的新紀錄:90.94%。Jw028資訊網——每日最新資訊28at.com

Jw028資訊網——每日最新資訊28at.com

將它擴展到多個圖像分類以及自然語言處理任務中,也能提高模型的分布外性能,并改善新下游任務的零樣本性能。Jw028資訊網——每日最新資訊28at.com

而這個方法還有一個有趣的名字,叫Module soup——Jw028資訊網——每日最新資訊28at.com

是不是讓人一下子就讓人聯想到了斐波那契湯的笑話?(昨天的湯+前天的湯=今天的新湯)Jw028資訊網——每日最新資訊28at.com

Jw028資訊網——每日最新資訊28at.com

△ 知乎網友@hzwer,已授權Jw028資訊網——每日最新資訊28at.com

一共三種配方Jw028資訊網——每日最新資訊28at.com

回想一下在此之前,大家是如何給模型漲點的呢?Jw028資訊網——每日最新資訊28at.com

是不是先用各種超參數訓練出多個微調模型,然后再挑出驗證集上表現最好的那一個留下,其余丟掉?Jw028資訊網——每日最新資訊28at.com

由于神經網絡是非線性的,在不同的loss basin中可能有許多解,因此Module soup這一采用保留所有微調模型的權重,對其進行平均的方法就可以提高性能,還是讓人有點驚訝的。Jw028資訊網——每日最新資訊28at.com

不過,最近就已有研究發現,從相同的初始化配置中中獨立優化的微調模型,位于相同的誤差范圍內 (lie in the same basin of the error landscape)。Jw028資訊網——每日最新資訊28at.com

之前也有研究證明,沿單個訓練軌跡進行權重平均,可以提高隨機初始化訓練模型的性能。Jw028資訊網——每日最新資訊28at.com

作者正是從這些結論中受到啟發。Jw028資訊網——每日最新資訊28at.com

Module soup一共有三種“配方”(實現):統一湯(uniform soup)、貪婪湯(greedy soup)和學習湯(learned soup)。Jw028資訊網——每日最新資訊28at.com

其中greedy soup是最主要采用的實現,因為它的性能比直接均勻地平均所有權重更高。Jw028資訊網——每日最新資訊28at.com

具體來說,Greedy soup通過順序添加每個模型作為“湯”中的潛在成分構建而成,并且只有在保持驗證集上的性能有所提高時才將相應模型保留在“湯”中。Jw028資訊網——每日最新資訊28at.com

排序按驗證集精度的降序排列。Jw028資訊網——每日最新資訊28at.com

Jw028資訊網——每日最新資訊28at.com

性能超越單個最佳微調模型Jw028資訊網——每日最新資訊28at.com

作者進行了全面的微調實驗來確定Module soup的有效性。Jw028資訊網——每日最新資訊28at.com

首先是微調CLIP和ALIGN,這兩個模型在圖像-文本對上進行了對比損失預訓練。Jw028資訊網——每日最新資訊28at.com

結果經過module soup操作后,兩者在分布內和自然分布轉移(distribution shifts)測試集上的表現都比最佳的單個微調模型性能更佳。Jw028資訊網——每日最新資訊28at.com

Jw028資訊網——每日最新資訊28at.com

△ 左為CLIP,右為ALIGNJw028資訊網——每日最新資訊28at.com

然后是在JFT數據集上預訓練的ViT-G模型。Jw028資訊網——每日最新資訊28at.com

也就是它在ImageNet1K數據集實現了90.94%的精度,打破了此前CoAtNet保持的90.88%,同時在推理階段還減少了25%的FLOPs。Jw028資訊網——每日最新資訊28at.com

Jw028資訊網——每日最新資訊28at.com

在圖像分類任務以外,作者在NLP領域也對module soup進行了驗證。Jw028資訊網——每日最新資訊28at.com

下表是BERT和T5模型在GLUE benchmark的四個文本分類任務上的結果:Jw028資訊網——每日最新資訊28at.com

Jw028資訊網——每日最新資訊28at.com

可以發現,雖然改進不如圖像分類中的效果明顯,但在多數任務下,greedy soup都可以相較最好的單個模型提高性能。Jw028資訊網——每日最新資訊28at.com

當然,作者也指出,module soup在適用性等方面存在局限,比如現在測試的都是在大型異構數據集上預先訓練的模型,在這些模型之外,效果并不是非常明顯。Jw028資訊網——每日最新資訊28at.com

最后,知乎網友@宮醬手藝人表示,其實這樣的模型參數平均是一個經典trick,transformer原始論文就用了。Jw028資訊網——每日最新資訊28at.com

Jw028資訊網——每日最新資訊28at.com

你發現了嗎?Jw028資訊網——每日最新資訊28at.com

論文地址:Jw028資訊網——每日最新資訊28at.com
https://arxiv.org/abs/2203.0548Jw028資訊網——每日最新資訊28at.com

 Jw028資訊網——每日最新資訊28at.com

本文鏈接:http://www.yifxia.cn/showinfo-119-2219-0.html谷歌:性能不佳的微調模型不要扔,求一下平均權重就能提升性能

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 云安全日報220317:紅帽OpenShift云應用平臺發現執行任意代碼漏洞,需要盡快升級

下一篇: 終于不瞎編了!AI學會“谷歌一下”,Q&A正確率達90%

標簽:
  • 熱門焦點
Top 国产韩国精品一区二区三区| 天天色成人网| 日韩一级黄色片| 国产高清在线精品一区a| 日韩中文字幕在线播放| 国产一区二区精品尤物| 美女免费毛片| a级毛片免费观看网站| 日本在线播放一区| 国产91精品系列在线观看| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 成人影院一区二区三区| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 色综合久久天天综线观看| 99久久视频| 高清一级淫片a级中文字幕| 青青青草视频在线观看| 免费国产在线观看| 成人免费高清视频| 精品久久久久久中文字幕2017| 欧美激情一区二区三区视频 | 国产a视频精品免费观看| 青青久在线视频| 国产视频一区二区在线观看| 九九九网站| 精品视频在线观看免费| 欧美18性精品| 天天色成人网| 国产高清在线精品一区a| 亚洲精品永久一区| 国产伦精品一区二区三区在线观看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 国产a视频精品免费观看| 毛片成人永久免费视频| 日本特黄特色aaa大片免费| 成人高清视频在线观看| 日韩免费在线| 一级女性全黄久久生活片| 日本特黄特色aaa大片免费| 99久久精品国产麻豆| 亚洲精品久久久中文字| 日日日夜夜操| 超级乱淫伦动漫| 亚洲女人国产香蕉久久精品| 亚洲精品久久久中文字| 成人免费网站久久久| 欧美另类videosbestsex高清| 国产不卡在线观看视频| 国产一区精品| 国产精品自拍一区| 欧美激情影院| 国产成人精品综合久久久| 黄视频网站在线看| 国产极品白嫩美女在线观看看| 你懂的日韩| 色综合久久天天综合| 国产一区二区福利久久| 国产伦精品一区二区三区在线观看| 久久国产精品永久免费网站| 精品视频一区二区| 国产极品白嫩美女在线观看看| 九九久久国产精品大片| 精品在线视频播放| 四虎久久精品国产| 超级乱淫伦动漫| 日日日夜夜操| 国产成人精品综合久久久| 成人影院一区二区三区| 可以免费看毛片的网站| 人人干人人插| 黄视频网站免费| 成人影院一区二区三区| 久久国产精品永久免费网站| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美另类videosbestsex高清| 日日日夜夜操| 韩国三级视频网站| 一级女性全黄久久生活片| 青青久在线视频| 成人av在线播放| 99久久视频| 99久久精品国产麻豆| 999精品在线| 九九精品在线| 国产高清在线精品一区a| 超级乱淫伦动漫| 一本高清在线| 日韩男人天堂| 高清一级淫片a级中文字幕| 香蕉视频亚洲一级| 日本免费区| 美女免费毛片| 九九精品在线| 美女免费毛片| 欧美18性精品| 国产韩国精品一区二区三区| 欧美激情影院| 美女免费毛片| 精品在线视频播放| 久久精品免视看国产成人2021| 国产成人女人在线视频观看| 高清一级淫片a级中文字幕| 可以免费看毛片的网站| 免费一级生活片| 欧美另类videosbestsex高清| 日本特黄特色aaa大片免费| 成人av在线播放| 久久精品免视看国产成人2021| 亚洲wwwwww| 成人高清视频在线观看| 国产不卡在线观看视频| 国产伦理精品| 亚洲精品久久久中文字| 日日日夜夜操| 成人免费高清视频| 成人免费高清视频| 欧美另类videosbestsex高清| 欧美激情影院| 免费国产在线观看| 天天色成人网| 久久国产影视免费精品| 国产伦精品一区二区三区在线观看| 日韩专区亚洲综合久久| 欧美大片一区| 四虎久久精品国产| 韩国毛片免费| 青青青草视频在线观看| 国产伦理精品| 精品视频一区二区| 成人av在线播放| 久久国产精品永久免费网站| 麻豆系列 在线视频| 国产91丝袜在线播放0| 国产精品免费久久| 亚欧成人乱码一区二区| 国产视频一区二区在线观看| 亚洲天堂在线播放| 欧美日本二区| 色综合久久天天综线观看| 九九精品在线| 国产伦精品一区二区三区在线观看| 国产不卡高清在线观看视频 | 日韩专区亚洲综合久久| 91麻豆爱豆果冻天美星空| 国产精品1024在线永久免费| 四虎影视久久| 国产网站免费视频| 成人av在线播放| 精品在线视频播放| 国产高清在线精品一区a| 国产一级生活片| 黄视频网站在线看| 99久久视频| 国产不卡在线观看视频| 黄视频网站在线看| 久久国产影视免费精品| 国产一区精品| 国产精品1024在线永久免费| 天天色成人网| 一本高清在线| 四虎久久精品国产| 国产一级生活片| 日本特黄特色aaa大片免费| 日韩在线观看免费完整版视频| 日本免费区| 日韩av片免费播放| 免费国产在线观看| 亚洲精品永久一区| 精品久久久久久中文字幕2017| 欧美18性精品| 国产伦理精品| 成人免费高清视频| 国产福利免费视频| 亚洲wwwwww| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 青青久在线视频| 国产一区精品| 国产精品1024在线永久免费| 欧美另类videosbestsex高清| 亚洲天堂在线播放| 黄视频网站在线看| 你懂的日韩| 日韩中文字幕在线播放| 欧美激情影院| 日本免费区| 国产极品白嫩美女在线观看看| 精品视频在线观看免费| 国产亚洲精品成人a在线| 美女免费毛片| 色综合久久天天综线观看| 91麻豆精品国产自产在线观看一区| 午夜激情视频在线播放| 国产伦精品一区二区三区在线观看| 色综合久久天天综线观看| 欧美日本二区| 免费一级生活片| 91麻豆精品国产高清在线| 天堂网中文字幕| 国产一区精品| 欧美大片一区|