百度智能云千帆平臺(tái)近日宣布,其自主研發(fā)的全新視覺理解大模型Qianfan-VL正式開源,并同步推出3B、8B、70B三個(gè)參數(shù)規(guī)模的版本。該系列模型專為企業(yè)級(jí)多模態(tài)應(yīng)用場景設(shè)計(jì),在基礎(chǔ)通用能力的基礎(chǔ)上,針對(duì)OCR識(shí)別、教育垂直領(lǐng)域等高頻需求進(jìn)行了深度優(yōu)化,旨在為不同規(guī)模的企業(yè)和開發(fā)者提供更高效的視覺理解解決方案。
Qianfan-VL系列模型的開發(fā)依托于百度自研的昆侖芯P800芯片,該芯片為模型提供了強(qiáng)大的算力支持,能夠高效處理海量數(shù)據(jù)與復(fù)雜算法。模型研發(fā)團(tuán)隊(duì)基于開源模型進(jìn)行二次開發(fā),并在昆侖芯P800上完成了全流程計(jì)算任務(wù)。這一技術(shù)組合不僅優(yōu)化了計(jì)算效率,還使模型在通用和垂類任務(wù)評(píng)測中達(dá)到了行業(yè)領(lǐng)先水平。
在模型設(shè)計(jì)上,Qianfan-VL采用了先進(jìn)的多模態(tài)架構(gòu),并通過持續(xù)預(yù)訓(xùn)練和三大技術(shù)創(chuàng)新實(shí)現(xiàn)了領(lǐng)域增強(qiáng)的通用視覺-語言能力。其核心訓(xùn)練方案包括創(chuàng)新的四階段策略,在保持通用能力的同時(shí),顯著提升了領(lǐng)域特定任務(wù)的表現(xiàn)。團(tuán)隊(duì)構(gòu)建了面向多模態(tài)任務(wù)的大規(guī)模數(shù)據(jù)合成管線,覆蓋文檔識(shí)別、數(shù)學(xué)解題、圖表理解等核心任務(wù),為模型訓(xùn)練提供了高質(zhì)量的數(shù)據(jù)支持。
Qianfan-VL系列模型具有三大顯著特點(diǎn)。首先,多尺寸版本設(shè)計(jì)滿足了不同場景的需求,3B、8B、70B三種規(guī)格可適配從輕量級(jí)到企業(yè)級(jí)的各類應(yīng)用。其次,8B和70B模型支持通過特殊token激活思維鏈能力,能夠處理復(fù)雜圖表理解、視覺推理、數(shù)學(xué)解題等任務(wù)。最后,模型在OCR全場景識(shí)別和復(fù)雜版面文檔理解方面表現(xiàn)突出,可精準(zhǔn)識(shí)別手寫體、數(shù)學(xué)公式、自然場景文字,并實(shí)現(xiàn)文檔智能問答與結(jié)構(gòu)化解析。
在性能評(píng)測中,Qianfan-VL系列模型展現(xiàn)了卓越的實(shí)力。通用能力基準(zhǔn)測試顯示,隨著參數(shù)規(guī)模的增加,模型在視覺理解、專業(yè)領(lǐng)域問答等任務(wù)中的表現(xiàn)顯著提升,尤其在ScienceQA等專業(yè)問答測試中表現(xiàn)突出。在OCR與文檔理解領(lǐng)域,模型在OCRBench等基準(zhǔn)測試中成績優(yōu)異,能夠自動(dòng)分析版面元素,精準(zhǔn)解析表格和圖表。數(shù)學(xué)解題方面,8B和70B模型在MathVista-mini、MathVision等測試中表現(xiàn)亮眼,可實(shí)現(xiàn)幾何推理、公式識(shí)別和分步求解。
實(shí)際應(yīng)用案例進(jìn)一步驗(yàn)證了Qianfan-VL的實(shí)用性。在OCR識(shí)別場景中,模型可精準(zhǔn)提取卡證票據(jù)信息并完成結(jié)構(gòu)化處理;在數(shù)學(xué)推理場景中,能夠從復(fù)雜圖表中提取關(guān)鍵信息并進(jìn)行數(shù)據(jù)分析;在文檔理解場景中,可自動(dòng)解析表格和圖表,實(shí)現(xiàn)智能問答。模型還可應(yīng)用于圖表分析、視頻理解等領(lǐng)域,展現(xiàn)出廣泛的適應(yīng)性。
目前,Qianfan-VL系列模型已全面開源。即日起至10月10日,用戶可在百度智能云千帆平臺(tái)免費(fèi)體驗(yàn)8B和70B版本。模型的相關(guān)資源包括Blog、GitHub主頁、Hugging Face頁面以及技術(shù)報(bào)告,用戶可通過登錄平臺(tái)選擇Qianfan-VL-8B或70B進(jìn)行在線測試,或訪問GitHub獲取詳細(xì)技術(shù)文檔。
更多>同類資訊人工智能投資新視角:大模型進(jìn)階智能體,場景化應(yīng)用前景展望今天分享的是:人工智能專題:從大模型到智能體——人工智能+場景的投資展望 報(bào)告共計(jì):31頁 《人工智能專題:從大模型到智能體——人工智能+場景的投資展望》報(bào)告首先探討“什么是真正的人工智能”,指出大語言模型如…09-23京東王競凡:智能機(jī)器人高速發(fā)展,中國機(jī)器人市場2028年或達(dá)千億來源:睿見Economy 9月16日-17日,聚合智能產(chǎn)業(yè)發(fā)展大會(huì)(2025)在武漢市舉行,主題為“協(xié)同融合創(chuàng)新鏈產(chǎn)業(yè)鏈推動(dòng)聚合智能產(chǎn)業(yè)發(fā)展”。 王競凡指出,目前智能機(jī)器人處于一個(gè)前所未有的高速發(fā)展道路,智…09-23上海創(chuàng)智學(xué)院周年慶發(fā)布模速空間AI工作站 助力教育大模型終端化應(yīng)用會(huì)上,學(xué)院正式發(fā)布標(biāo)桿成果——模速空間AI工作站,該設(shè)備搭載上海“啟創(chuàng)·InnoSpark”人工智能教育大模型,以“端側(cè)算力+教育大模型+場景化應(yīng)用”三位一體架構(gòu),為教育領(lǐng)域注入智能新動(dòng)能。該工作站由英和智臨…09-23國內(nèi)AI大模型邁向“用起來”階段,央(國)企集約共享大模型前景與挑戰(zhàn)并存通信世界網(wǎng)消息(CWW)目前,國內(nèi)AI大模型產(chǎn)業(yè)正從“百模大戰(zhàn)”的“建起來”階段,向“行業(yè)爆發(fā)”的“用起來”階段過渡。權(quán)威機(jī)構(gòu)發(fā)布的數(shù)據(jù)顯示,2025年一季度國內(nèi)大模型市場規(guī)模預(yù)計(jì)突破495億元人民幣,但AI…09-23百度智能云開源Qianfan-VL視覺模型,多尺寸適配+自研芯片助力多場景應(yīng)用在 ScienceQA 等專業(yè)問答測試中,精準(zhǔn)度表現(xiàn)突出;多模態(tài)任務(wù)如 RefCOCO 等,物體識(shí)別與關(guān)聯(lián)能力優(yōu)異;同時(shí),在各類通用基準(zhǔn)測試?yán)铮噍^主流模型,整體表現(xiàn)也頗為亮眼,充分彰顯出在視覺理解通用能力上…09-23工業(yè)互聯(lián)網(wǎng)浪潮涌動(dòng) 中國電信云網(wǎng)融合賦能工業(yè)智能化升級(jí)長期以來,中國電信立足自身優(yōu)勢,堅(jiān)持以云網(wǎng)融合為核心抓手,在持續(xù)夯實(shí)工業(yè)智能底座、筑牢產(chǎn)業(yè)數(shù)字化根基的同時(shí),不斷加大科技創(chuàng)新力度,通過技術(shù)突破與模式創(chuàng)新,為工業(yè)企業(yè)提供全鏈條智能化解決方案,有效賦能工業(yè)生產(chǎn)全…09-23微店24參會(huì)華為全聯(lián)接大會(huì)2025,借昇騰之力賦能實(shí)體零售智慧升級(jí)本次大會(huì)以“躍升行業(yè)智能化”為主題,聚焦人工智能技術(shù)與產(chǎn)業(yè)融合的創(chuàng)新實(shí)踐,為實(shí)體零售行業(yè)的數(shù)字化轉(zhuǎn)型提供新動(dòng)能。華為作為全面智能化戰(zhàn)略的倡導(dǎo)者和實(shí)踐者,致力于通過領(lǐng)先的產(chǎn)品與解決方案,攜手伙伴共建健康生態(tài)。 …09-23DeepSeek線上模型升級(jí)V3.1-Terminus版,優(yōu)化語言Agent能力,輸出長度與價(jià)格揭曉09-23字節(jié)跳動(dòng)火山引擎發(fā)布豆包翻譯模型:28種語言互譯,性能超GPT-4o且價(jià)格親民09-23MediaTek天璣9500芯片發(fā)布:3納米制程加持,AI影像游戲性能全面躍升09-23?DeepSeek-V3.1-Terminus上線,雙模式優(yōu)化語言與Agent能力,高性價(jià)比服務(wù)來襲?09-23vivo X300系列首發(fā)天璣9500芯片,端側(cè)AI升級(jí)帶來多場景新體驗(yàn)09-23可靈AI釜山國際電影節(jié)亮相,攜2.5模型展示視頻生成前沿應(yīng)用前景09-23火山引擎豆包種子翻譯模型亮相,支持28種語言雙向翻譯且場景適應(yīng)強(qiáng)09-23厘米級(jí)精準(zhǔn)!360°靈動(dòng)!哈工程“海龜”水下機(jī)器人開啟探測新篇這是哈爾濱工程大學(xué)船舶與工程學(xué)院王剛教授團(tuán)隊(duì)研發(fā)的敏捷型水下機(jī)器人“海龜”的真實(shí)工作場景。王剛團(tuán)隊(duì)將目光投向海洋生物,仔細(xì)研究了數(shù)十種海底動(dòng)物后,從海龜?shù)耐七M(jìn)方式中找到了靈感。 在實(shí)海測試中,科研人員在海…09-23點(diǎn)擊查看更多 +全站最新
?9月狹義乘用車零售預(yù)計(jì)達(dá)215萬輛,新能源車滲透率或超58%引關(guān)注?
6.88萬起極狐T1實(shí)測:空間越級(jí)配置足,小電車市場殺出“全能王”?
?雷軍官宣小米17系列9月25日發(fā)布,盧偉冰稱產(chǎn)品力跨代升級(jí)且對(duì)標(biāo)iPhone17?
?小米17系列9月25日發(fā)布在即,雷軍年度演講《改變》將揭秘芯片與汽車故事?
?雷軍宣布:9月25日小米17系列發(fā)布,同期將舉辦第6次年度演講聊芯片與汽車故事?
小米SU7標(biāo)準(zhǔn)版11.7萬輛召回:OTA升級(jí)背后的智能駕駛安全與行業(yè)新挑戰(zhàn)熱門內(nèi)容
第22屆東博會(huì)AI元素亮眼:數(shù)字智能體引路 機(jī)器人炫技展風(fēng)采
AI云競爭下半場:華為以超節(jié)點(diǎn)、企業(yè)Agent等破局,誰能領(lǐng)跑產(chǎn)業(yè)?
2025網(wǎng)安周:每日互動(dòng)劉宇談AI時(shí)代,知識(shí)安全成關(guān)鍵,共筑數(shù)字新未來
中國大模型DeepSeek首登Nature封面,R1訓(xùn)練成本僅約208萬引關(guān)注
華為全聯(lián)接大會(huì)2025啟幕,發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)與集群
有鹿機(jī)器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://www.yifxia.cn/showinfo-45-27979-0.html百度智能云千帆開源Qianfan-VL視覺模型,多尺寸適配,全自研芯片賦能高效計(jì)算
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: DeepSeek-V3.1-Terminus更新登場!修復(fù)關(guān)鍵Bug,Agent能力躍升,V4還會(huì)遠(yuǎn)嗎?