国产欧美日韩三区_偷窥自拍亚洲色图精选_久久大片网站_成人在线黄色_成人亚洲免费视频_99久久久精品_国产美女自拍_韩国19禁主播vip福利视频_色综合视频一区二区三区日韩_日本在线观看一区二区

當前位置:首頁 > 科技  > 測評

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了

來源: 責編: 時間:2024-08-08 16:17:37 246觀看
導讀 國產大模型,多模態能力都開始超越GPT-4-Turbo了??權威榜單,中文多模態大模型測評基準SuperCLUE-V,新鮮出爐:特別是騰訊的hunyuan-vision、上海AI Lab的InternVL2-40B,分別成為國內閉源和開源界兩大領跑

國產大模型,多模態能力都開始超越GPT-4-Turbo了??Pyp28資訊網——每日最新資訊28at.com

權威榜單,中文多模態大模型測評基準SuperCLUE-V,新鮮出爐:Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

特別是騰訊的hunyuan-vision、上海AI Lab的InternVL2-40B,分別成為國內閉源和開源界兩大領跑者,甚至超過Claude-3.5-Sonnet和谷歌王牌Gemini-1.5-Pro。Pyp28資訊網——每日最新資訊28at.com

雖然這次都還是被GPT-4o壓過,差距也確確實實縮小了很多。Pyp28資訊網——每日最新資訊28at.com

(這個榜單旨在為中文領域提供一個多模態大模型多維度能力評估參考,GPT-4o等國外模型僅作對比參考,不參與排名哦)Pyp28資訊網——每日最新資訊28at.com

hunyuan-vision也就是騰訊混元大模型的多模態版本了,除了開發者調用API之外,其實在騰訊元寶APP里免費就能體驗到。Pyp28資訊網——每日最新資訊28at.com

一直以來,元寶主打“實用AI搭子”,似乎著重強調的是實用易用性;沒想到背著咱們偷偷拿模型去測評,還捧回來個國內第一,emmm……有點意思。Pyp28資訊網——每日最新資訊28at.com

所以國產多模態大模型進化成什么樣了,光看分數還是不夠直觀,下面就拉出來溜溜。Pyp28資訊網——每日最新資訊28at.com

多模態能力第一?這就上手玩Pyp28資訊網——每日最新資訊28at.com

多模態測試,說實話有點不嘻嘻:還沒有出現“弱智吧”一樣公認效果拔群的“民間benchmark”。Pyp28資訊網——每日最新資訊28at.com

但又嘻嘻:根本不耽誤我們碳基生物用千奇百怪的圖片來為難大模型。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

那就開始吧!Pyp28資訊網——每日最新資訊28at.com

Round 1.1:梗圖表情包理解Pyp28資訊網——每日最新資訊28at.com

時間過得好快!昨兒已經立秋了。Pyp28資訊網——每日最新資訊28at.com

夏天夏天悄悄過去,只留下可以用這張meme圖概括的心情:Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

問元寶,這張圖什么意思?得到的答案是:Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

隨手測試的程序員祖傳題,元寶也輕松應對。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

Round 1.2:照片內容識別Pyp28資訊網——每日最新資訊28at.com

上來就是一道不走尋常路的“超前”題——編輯部好幾個人對著這張圖皺眉。Pyp28資訊網——每日最新資訊28at.com

太黑暗了,不知是何物。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

答案揭曉,這是最近一個分享貼中,“南京本地人應該也受不了”的黑金榴蓮紫薯披薩。Pyp28資訊網——每日最新資訊28at.com

元寶不僅能正確get到圖中“太超前”的含義,同時還根據圖片猜中了食物拿紫薯當原料。Pyp28資訊網——每日最新資訊28at.com

至于沒有猜出榴蓮成分,也不能怪它,人類的黑暗料理不管是對AI還是對人類都真的太超前……Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

再來一道經典題目,數吉娃娃。Pyp28資訊網——每日最新資訊28at.com

可以看到,混元元寶先是分析了題目中“吉娃娃”的外貌特征,然后分別告訴了九張圖中哪些是吉娃娃的照片。Pyp28資訊網——每日最新資訊28at.com

不僅答得全對,還看出了圖中另一個物種是藍莓松餅。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

Round 1.3:視覺錯覺挑戰Pyp28資訊網——每日最新資訊28at.com

多模態大模型的視覺幻覺問題,是這兩年的熱門研究方向。Pyp28資訊網——每日最新資訊28at.com

這些測試題真的很有迷惑性,別說大模型了,連人類也常常踩坑沒商量。Pyp28資訊網——每日最新資訊28at.com

但騰訊元寶,就這么水靈靈地答對了!Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

當初難道一種大模型的“哪一棵樹更亮”,也謹慎地回答:Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

不過更難的錯覺挑戰它就不行了。讀圖片中隱藏信息的傻傻看不出,怎么問都說“沒有啊”:Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

不過講道理,這些題GPT-4V也答不上來,大約目前多模態大模型的階段性能力還沒邁過這道坎。Pyp28資訊網——每日最新資訊28at.com

玩耍一番過后,接下來要動真格的!Pyp28資訊網——每日最新資訊28at.com

測試元寶背后hunyuan-vision在實用場景下,表現如何。Pyp28資訊網——每日最新資訊28at.com

Round 2.1:財報表現摘要讀取Pyp28資訊網——每日最新資訊28at.com

每個季度、半年、年終的財報,打工人看了真的是腦闊痛。Pyp28資訊網——每日最新資訊28at.com

這就把騰訊一季度財報表現摘要截圖扔給元寶,讓它幫忙淺做分析:Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

元寶讀取了圖標中的數據,還在最后還小小總結了一把:Pyp28資訊網——每日最新資訊28at.com

總體來看,該公司在2024年3月31日的財務表現顯著優于2023年3月31日,各項指標均有不同程度的增長,尤其是毛利、經營盈利和期內盈利的增長幅度較大。Pyp28資訊網——每日最新資訊28at.com

Round 2.2:讀取(學術)圖表Pyp28資訊網——每日最新資訊28at.com

先來一道沒那么學術的圖表識別題。Pyp28資訊網——每日最新資訊28at.com

問,一張圖中的數字序列,缺少了哪一個?Pyp28資訊網——每日最新資訊28at.com

元寶很好地讀圖,并正確填補了缺的那個數字:29。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

然后隨機從一篇關于大模型數據的論文中,截圖喂過去。Pyp28資訊網——每日最新資訊28at.com

它也能理解并給出詳細解釋,最后還來幾句總結。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

Round 2.3:行測找規律題Pyp28資訊網——每日最新資訊28at.com

這一回合的最后上大招——萬千人頭疼不已的行測找規律題。Pyp28資訊網——每日最新資訊28at.com

題是下面這一道,prompt輸入:請從所給的四個選項中,選擇最合適的一個填入問號處,使之呈現一定的規律性。Pyp28資訊網——每日最新資訊28at.com

先提前透露正確答案,選C。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

在公布自己的最終答案之前,元寶嘰里呱啦進行了很長的過程分析(講真,看得人很緊張)。Pyp28資訊網——每日最新資訊28at.com

最后堅定地選了C選項,答對。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

一道GPT-4V沒做對的附加題Pyp28資訊網——每日最新資訊28at.com

先做個前情提要,此前研究人員們發現,GPT-4V更擅長解釋西方文化背景的圖像or帶有英文文字的圖像。Pyp28資訊網——每日最新資訊28at.com

比如給AI看《白雪公主》,知道是有7個小矮人。換成《葫蘆娃》,7個就數成了10個,葫蘆山七彩峰也說成了冰山。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

那么純國產大模型,總該表現好點了吧?直接原題譯中,丟過去。Pyp28資訊網——每日最新資訊28at.com

好家伙,不僅數對了數量,還在追問中成功辨別這是《葫蘆兄弟》的截圖。Pyp28資訊網——每日最新資訊28at.com

Nice!Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

騰訊元寶,真·AI實用搭子Pyp28資訊網——每日最新資訊28at.com

看過這么多實測案例,是時候整體介紹一下背后的模型和整個APP了。Pyp28資訊網——每日最新資訊28at.com

騰訊混元大模型,可以說是一位老朋友了。Pyp28資訊網——每日最新資訊28at.com

去年9月首次對外亮相,之后一直保持著快速迭代。目前已擴展至萬億參數規模,由7萬億tokens的預訓練語料訓練而來,能力已覆蓋了文本、多模態理解及生成等。Pyp28資訊網——每日最新資訊28at.com

在國內大模型中,騰訊混元率先完成MoE(Mix of Experts,專家混合)架構升級,也就是從單個稠密模型升級到多個專家組成的稀疏模型。Pyp28資訊網——每日最新資訊28at.com

今年7月,還解鎖了一個單日調用tokens數達千億級的成就。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

騰訊元寶,今年5月底剛剛上線,可能對很多人來說還是新朋友。Pyp28資訊網——每日最新資訊28at.com

值得一提的是,在前一陣“9.11和9.9哪個大”的風波中,騰訊元寶表現不錯,無需額外提示自己就能答對。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

騰訊元寶主打一個“實用AI搭子”,其中一個特色是APP、小程序和網頁都能訪問,聊天記錄多端同步。Pyp28資訊網——每日最新資訊28at.com

比如在微信聊天中接收到的工作文檔,不用轉存到手機目錄,就可以直接到小程序選擇對話直接發給AI了,接下來是總結也好、生成也好都非常方便。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

再拿多模態理解能力來說,無論是文檔截圖、人像風景、收銀小票,還是任意一張隨手拍的照片,元寶都能基于圖中內容給出自己的理解和分析。Pyp28資訊網——每日最新資訊28at.com

背后的一個思考是不光要識別、理解,還要生成滿足用戶需求的內容。Pyp28資訊網——每日最新資訊28at.com

從前面的測試中也可以看出,丟一個表情包給它,回答也會簡短,換成學術圖表,回答就會盡量詳盡、并且主動附加總結段落。Pyp28資訊網——每日最新資訊28at.com

據騰訊介紹,混元大模型系列中的多模態理解模型,在視覺編碼、語言模型、訓練數據三方面做了深度的優化,能處理最高達7k分辨率最大16:1長寬比圖片,也是國內首個基于MoE的多模態大模型。Pyp28資訊網——每日最新資訊28at.com

把Transformer開山之作,經典論文《Attention is all you need》拼成一個長圖,對騰訊元寶來說也完全不是難事,從引言到結論全文覆蓋。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

而且騰訊元寶團隊這次特別透露,接下來會把更多精力放在融合模型多模態能力上。Pyp28資訊網——每日最新資訊28at.com

反正騰訊嘛大家都熟悉,是國內大廠里最重產品,重視打磨用戶體驗的。Pyp28資訊網——每日最新資訊28at.com

比如最近騰訊元寶開始往“深度”發展,先更新了“深度搜索”,又剛剛上線“深度長文閱讀”。Pyp28資訊網——每日最新資訊28at.com

這些功能都是隱藏了技術細節、盡量減少對提示工程的需要,很多功能都是自動識別,一鍵觸發,不需要什么學習成本。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

深度閱讀功能就初步整合了多模態理解能力,上傳一個論文PDF進去,生成的“精度”頁面中不僅有文字總結,還能把相應的圖表從文檔里拽出來。Pyp28資訊網——每日最新資訊28at.com

在很多情況下,都不用來回翻原文對照了。Pyp28資訊網——每日最新資訊28at.com

最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了Pyp28資訊網——每日最新資訊28at.com

而且這一次,中文多模態大模型測評基準SuperCLUE-V榜單成績,也說明騰訊不只搞好了產品體驗,也非常看中背后模型基礎能力。Pyp28資訊網——每日最新資訊28at.com

所以說,在多模態“圖生文”場景下,騰訊又能整出什么實用好活,就非常值得期待了。Pyp28資訊網——每日最新資訊28at.com

本文鏈接:http://www.yifxia.cn/showinfo-25-106429-0.html最強國產多模態剛剛易主!騰訊混元把GPT-4/Claude-3.5/Gemini-1.5都超了

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OPPO:今年將讓約5千萬用戶手機搭載生成式AI功能 包含Find X系列

下一篇: 用了兩個月蘋果iOS 18后 這是我最滿意的幾個地方

標簽:
  • 熱門焦點
Top 亚洲www美色| 欧美另类videosbestsex久久| 999久久久免费精品国产牛牛| 一级片片| 99热精品在线| 国产精品自拍在线| 九九久久99| 日韩在线观看视频网站| 国产激情视频在线观看| 91麻豆精品国产综合久久久| 美女免费精品视频在线观看| 青青青草视频在线观看| 国产91丝袜在线播放0| 精品国产一区二区三区久久久蜜臀| 欧美激情中文字幕一区二区| 成人影视在线观看| 九九九在线视频| 亚洲 男人 天堂| 色综合久久天天综合| 超级乱淫黄漫画免费| 日韩中文字幕在线播放| 国产不卡在线观看视频| 国产精品自拍在线| 日韩在线观看视频黄| 一级毛片视频免费| 午夜激情视频在线观看| 成人高清护士在线播放| 精品久久久久久中文字幕2017| 成人在免费观看视频国产| 中文字幕一区二区三区精彩视频| 中文字幕一区二区三区精彩视频 | 久久久久久久久综合影视网| 美女免费精品视频在线观看| 午夜在线影院| 日本免费区| 日本特黄特黄aaaaa大片| 91麻豆精品国产自产在线| 一本高清在线| 久久福利影视| 成人免费网站视频ww| 在线观看导航| 在线观看导航| 麻豆系列国产剧在线观看| 国产成人精品影视| 亚欧乱色一区二区三区| 国产激情视频在线观看| 你懂的福利视频| 日本特黄特黄aaaaa大片| 青青久久国产成人免费网站| 欧美激情一区二区三区视频| 国产成人精品综合久久久| 久久成人亚洲| 久久99中文字幕| 香蕉视频三级| 国产一级强片在线观看| 可以免费看毛片的网站| a级毛片免费观看网站| 国产成人精品综合久久久| 九九热国产视频| 一级毛片看真人在线视频| 精品国产亚洲人成在线| 麻豆网站在线看| 色综合久久天天综线观看| 日日日夜夜操| 91麻豆精品国产综合久久久| 国产亚洲精品aaa大片| 国产亚洲精品成人a在线| 高清一级做a爱过程不卡视频| 天天做日日干| 中文字幕一区二区三区 精品| 黄视频网站在线免费观看| 91麻豆国产福利精品| 色综合久久天天综线观看| 国产一级强片在线观看| 国产韩国精品一区二区三区| 精品国产一区二区三区免费| 91麻豆国产福利精品| 午夜欧美成人久久久久久| 黄视频网站在线免费观看| 日本伦理片网站| 欧美激情一区二区三区中文字幕| 99久久精品国产麻豆| 亚洲天堂一区二区三区四区| 韩国三级视频在线观看| 日日日夜夜操| 99色精品| 高清一级毛片一本到免费观看| 精品国产三级a∨在线观看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 日韩av片免费播放| 色综合久久天天综合绕观看| 精品国产亚一区二区三区| 国产伦久视频免费观看 视频| 欧美激情一区二区三区视频 | 精品毛片视频| 91麻豆tv| 美国一区二区三区| 韩国毛片 免费| 国产91视频网| 久久国产一区二区| 久久成人综合网| 可以免费在线看黄的网站| 国产a视频| 亚洲精品中文字幕久久久久久| 91麻豆精品国产片在线观看| 精品久久久久久中文| 一本高清在线| 国产高清视频免费观看| 久久国产一久久高清| 欧美18性精品| 国产91素人搭讪系列天堂| 毛片电影网| 成人在免费观看视频国产| 九九久久国产精品大片| 成人影院一区二区三区| 欧美大片毛片aaa免费看| 精品国产亚一区二区三区| 午夜家庭影院| 国产高清在线精品一区a| 国产美女在线一区二区三区| 久久99欧美| 日韩字幕在线| 亚飞与亚基在线观看| 久久国产精品只做精品| 一级女性大黄生活片免费| 日韩av片免费播放| 日本伦理片网站| 国产伦理精品| 亚洲精品中文字幕久久久久久| 精品国产亚洲人成在线| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 日韩在线观看免费| 日韩在线观看视频免费| 国产麻豆精品| 99久久精品国产麻豆| 国产精品1024永久免费视频| 日日夜人人澡人人澡人人看免| a级黄色毛片免费播放视频| 日韩一级黄色片| 亚欧乱色一区二区三区| 国产成a人片在线观看视频| 天天色成人| 成人免费一级纶理片| 麻豆污视频| 四虎精品在线观看| 99色精品| 成人免费观看的视频黄页| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 久久国产精品自线拍免费| 欧美一区二区三区性| 国产欧美精品| a级精品九九九大片免费看| 国产不卡在线看| 一本伊大人香蕉高清在线观看| 欧美激情影院| 日韩字幕在线| 国产91丝袜在线播放0| 麻豆网站在线免费观看| 精品久久久久久综合网| 日韩在线观看视频网站| 精品久久久久久综合网| 沈樵在线观看福利| 成人免费观看的视频黄页| 日本特黄特黄aaaaa大片| 国产韩国精品一区二区三区| 香蕉视频一级| 国产麻豆精品高清在线播放| 国产精品1024在线永久免费| 精品国产一区二区三区久久久狼| 成人影院久久久久久影院| 二级片在线观看| 青青久久国产成人免费网站| 国产a网| 日本伦理片网站| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 国产精品自拍在线观看| 亚洲精品永久一区| 欧美a级片视频| 国产国产人免费视频成69堂| 美女被草网站| 黄色免费三级| 国产成人精品影视| 国产麻豆精品hdvideoss| 国产成人啪精品| 国产不卡精品一区二区三区| 欧美一级视| 成人在免费观看视频国产| 国产不卡精品一区二区三区| 国产精品1024永久免费视频| 亚洲爆爽| 日韩欧美一及在线播放| 欧美另类videosbestsex视频| 亚欧成人毛片一区二区三区四区| 在线观看导航| 久久国产一久久高清| 国产一区精品| 欧美电影免费看大全| 久草免费在线视频| 欧美a级大片| 精品国产亚洲一区二区三区|