百度智能云千帆平臺近日宣布,面向企業(yè)級多模態(tài)應用場景的全新視覺理解大模型Qianfan-VL正式開源。該系列模型包含3B、8B、70B三種參數規(guī)格,通過深度優(yōu)化設計,在基礎通用能力與產業(yè)垂直場景中均展現出顯著優(yōu)勢。目前8B與70B版本已開放免費體驗,企業(yè)用戶和開發(fā)者可在10月10日前登錄平臺進行試用。
研發(fā)團隊基于開源架構進行創(chuàng)新開發(fā),依托百度自研的昆侖芯P800芯片構建了超大規(guī)模分布式計算系統(tǒng)。該系統(tǒng)支持單任務5000卡并行計算,通過優(yōu)化并行策略與算子設計,顯著提升了模型處理復雜算法與海量數據的效率。這種軟硬件協同的創(chuàng)新模式,使模型在通用與垂類任務評測中均達到行業(yè)領先水平。
模型設計采用四階段能力增強訓練方案,在保持通用性能的同時,針對產業(yè)落地需求進行專項強化。通過構建覆蓋文檔識別、數學解題、圖表理解等核心任務的高精度數據合成管線,實現了高質量訓練數據的規(guī)模化生產。這種訓練策略使模型參數規(guī)模與性能呈現顯著正相關,70B版本在專業(yè)領域問答中展現出更強的推理能力。
在OCR全場景識別方面,模型可精準處理手寫體、數學公式、自然場景文字等多種類型,并能對卡證票據進行結構化信息提取。復雜版面文檔理解能力尤為突出,可自動解析表格圖表、實現文檔智能問答與結構化解析。基準測試顯示,其在OCRBench等專業(yè)評測中的表現隨參數規(guī)模提升持續(xù)優(yōu)化,為金融、醫(yī)療等領域的文檔處理提供了高效解決方案。
8B與70B版本特有的思維鏈激活功能,通過特殊token設計支持復雜場景的組合推理。在數學解題領域,模型可實現幾何推理、公式識別與分步求解;在圖表分析方面,能完成數據趨勢預測、關聯推理及統(tǒng)計計算。測試數據顯示,這兩個版本在MathVista-mini等數學視覺基準測試中的準確率較主流模型有顯著提升。
該系列模型的多尺寸設計充分考慮到不同規(guī)模企業(yè)的應用需求。3B版本適用于輕量級部署場景,8B版本在性能與效率間取得平衡,70B版本則能滿足高精度要求的復雜任務。這種分級設計使教育、金融、工業(yè)等領域的用戶都能找到適配方案,有效降低了企業(yè)應用AI技術的門檻。
目前,模型已在OCR識別、文檔理解等場景形成典型應用案例。在票據處理場景中,可自動提取關鍵信息并完成結構化錄入;在學術文檔分析場景,能精準解析復雜版面并支持智能問答。研發(fā)團隊透露,后續(xù)將持續(xù)優(yōu)化視頻理解、三維場景解析等能力,推動模型在更多產業(yè)領域的深度應用。
更多>同類資訊Orange Research DivMerge技術:智能拼裝AI模型,解鎖多任務處理新境界09-23復旦大學AgentGym-RL框架:小模型大智慧,AI智能體學會復雜任務長期規(guī)劃09-23Meta實驗室新突破:AI模型開啟"自我對弈"模式,不依賴數據也能持續(xù)進化09-23聯發(fā)科天璣9500首推雙NPU架構,讓AI常駐手機開啟主動服務新體驗09-23DeepSeek-V3.1升級至Terminus版 優(yōu)化語言一致性及Agent能力09-23斯坦福等高校聯手:用LMEnt套件追蹤AI語言模型知識學習軌跡09-23AI搜索的數學邊界:當最強大模型遇上"簡單問題"的隱秘困局09-23中科院團隊創(chuàng)新CARVE法:破解AI視覺“分心”難題,助模型精準聚焦09-23Plaud攜三款AI紀要新品入局大陸市場,多模態(tài)交互與長續(xù)航成亮點09-23DeepSeek線上模型升級至V3.1-Terminus,輸出更穩(wěn)Agent能力再提升09-23DeepSeek-V3.1升級至V3.1-Terminus:語言更一致,代理更強大,輸出更穩(wěn)定09-23上海人工智能實驗室牽頭!科學智能戰(zhàn)略科技力量聯盟正式成立09-23DeepSeek-V3.1-Terminus發(fā)布:修復Bug,編程與搜索智能體能力再升級09-23科學智能戰(zhàn)略科技力量聯盟成立 共探AI賦能多學科創(chuàng)新發(fā)展路徑09-23中國電信引領6G新突破:首個6G計費項目獲3GPP正式批準09-23點擊查看更多 +全站最新
?9月狹義乘用車零售預計達215萬輛,新能源車滲透率或超58%引關注?
6.88萬起極狐T1實測:空間越級配置足,小電車市場殺出“全能王”?
?雷軍官宣小米17系列9月25日發(fā)布,盧偉冰稱產品力跨代升級且對標iPhone17?
?小米17系列9月25日發(fā)布在即,雷軍年度演講《改變》將揭秘芯片與汽車故事?
?雷軍宣布:9月25日小米17系列發(fā)布,同期將舉辦第6次年度演講聊芯片與汽車故事?
小米SU7標準版11.7萬輛召回:OTA升級背后的智能駕駛安全與行業(yè)新挑戰(zhàn)熱門內容
第22屆東博會AI元素亮眼:數字智能體引路 機器人炫技展風采
AI云競爭下半場:華為以超節(jié)點、企業(yè)Agent等破局,誰能領跑產業(yè)?
2025網安周:每日互動劉宇談AI時代,知識安全成關鍵,共筑數字新未來
中國大模型DeepSeek首登Nature封面,R1訓練成本僅約208萬引關注
華為全聯接大會2025啟幕,發(fā)布全球最強算力超節(jié)點與集群
有鹿機器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://www.yifxia.cn/showinfo-45-27962-0.html百度智能云Qianfan-VL視覺理解模型開源,多尺寸適配多場景助力AI產業(yè)落地
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com