人工智能公司Anthropic近日宣布推出新一代AI模型Claude Sonnet 4.5,該公司宣稱該模型在軟件編碼能力方面達到全球領先水平。根據SWE-bench Verified測試標準評估,這款模型在生成高質量代碼、識別代碼優化點以及指令遵循可靠性方面展現出顯著優勢,能夠直接構建可投入生產環境的應用程序。
在核心性能提升方面,新模型在OSWorld基準測試中的得分從四個月前的42.2%大幅提升至61.4%,創下該測試的新紀錄。聯合創始人Jared Kaplan透露,模型通過架構優化實現了尺寸與效率的平衡,盡管參數規模小于前代Opus 4.1,但在金融、法律、醫學等專業領域的推理能力和知識儲備均有明顯提升。測試數據顯示,新模型在復雜多步驟任務中的持續運行時間從7小時延長至30小時。
用戶反饋顯示,新模型在代碼生成質量方面獲得普遍認可。有開發者指出,該模型在處理實際工作場景時表現出更強的實用性,能夠準確完成從原型設計到生產部署的全流程開發。不過部分測試者提到,模型在特定指令的完整執行上仍存在改進空間,有時會遺漏用戶強調的關鍵修改點。
安全性方面,Anthropic實施了全新的行為對齊訓練機制。新模型對提示詞注入攻擊的防御能力顯著增強,有效降低了欺騙性輸出、權力尋求傾向等風險行為的發生概率。公司安全團隊特別開發了針對化學、生物、放射性及核武器相關內容的檢測分類器,在保持低誤報率的同時,將安全等級提升至AI安全等級3(ASL-3)標準。
產品生態建設方面,Anthropic同步推出了Claude Agent SDK開發工具包。該工具基于驅動Claude Code的底層架構,重點解決了AI代理開發中的內存管理、權限控制及多代理協作等難題。配套升級的Claude Code新增"檢查點"功能,支持開發者在VS Code環境中直接執行代碼并創建電子表格、演示文稿等辦公文檔。
商業策略上,新模型將作為默認選項向用戶開放,定價與前代Sonnet 4保持一致。付費訂閱用戶仍可自主選擇使用舊版Opus系列模型。Jared Kaplan在技術分享會上暗示,更強性能的模型版本正在研發中,預計在今年年底前將有一至兩次重要更新,其中可能包含新一代Opus模型。
首席產品官Mike Krieger強調,新模型通過架構創新實現了"小體積、大智慧"的突破,在幾乎所有評估維度上都超越了前代產品。實際測試表明,該模型在處理真實業務場景時,能夠像人類同事一樣提供可靠的協作支持,這種特性使其在開發復雜系統時具有獨特優勢。
更多>同類資訊張宏院士深圳講堂:以AI賦能機器人 開啟開放世界“生活”新篇近日,第五十四期院士講堂在深圳開講,加拿大工程院院士、南方科技大學電子與電氣工程系講席教授張宏院士帶來了《人工智能與機器人——導航與操作任務中的應用》的精彩演講,吸引了來自人工智能、機器人等領域的專家學者、高…09-30青春筑夢智慧城:以專業之力繪就高效便捷現代生活新畫卷智慧城市運用大數據、人工智能、物聯網等前沿技術,讓交通、醫療、教育、政務、能源等系統更加智能、高效和人性化。智能紅綠燈能緩解擁堵,手機APP可一鍵辦理政務,智慧社區提升居住安全與便利。著力建設便捷高效的智慧城…09-30國產AI服務器新突破:8.9毫秒響應+百萬token僅1元,智能體產業化加速你問一句話、它生成一段代碼,背后都是成千上萬個token在燃燒,都是真金白銀。 浪潮這次的雙重突破,給咱們提了個醒:AI競爭的焦點,正在從過去一味地“卷參數”、“拼大模型”,轉向更務實、更硬核的“速度”和“成…09-30華為亮相2025青島國際城軌展,攜全棧方案共繪城軌智能化新藍圖作為全球領先的ICT(信息與通信技術)解決方案供應商,華為以“躍升城軌行業智能化”為主題,攜城軌智能化、數智平臺、運營通信、自主創新、服務、伙伴聯合創新等領域的方案及行業實踐成果重磅亮相,全面展示了在城軌領域…09-30成都發布具身智能攻堅方案:2027年產業規模超500億 實施五大行動23項舉措9月29日,成都市經信局市新經濟委在成都市民營經濟發展促進中心舉辦“進解優促”面對面·供需對接“攻堅周”——人工智能產業鏈企業系列活動。 在工作舉措上,此次方案提出要實施優勢賽道攻堅、關鍵技術攻關、公共平臺…09-30AI成年輕人旅行“智囊”:從攻略制定到旅途應急,讓出行更輕松09-30華為人事新動態:余承東出任產品投資評審委員會主任,聚焦AI核心戰略09-30國家郵政局通過新規:強化技術供給與創新賦能 推動產業協同發展09-30DeepSeek新模型DeepSeek-V3.2-Exp上線,引入DSA機制,開源雙版本算子還降價09-30華為云率先適配DeepSeek-V3.2-Exp模型,ModelArts平臺提供高效推理服務09-30DeepSeek與寒武紀同步發力:新模型發布與適配優化共啟AI新篇09-30國際支付巨頭Visa迎新帥:張文翊接棒大中華區總裁,多元履歷賦能支付新未來09-30DeepSeek-V3.2-Exp模型開源發布,華為云MaaS平臺部署采用長序列親和并行策略09-30DeepSeek-V3.2-Exp模型開源發布,華為云適配,官方API價格直降超五成09-30螞蟻百寶箱與友盟攜手,以一站式服務賦能開發者,共赴智能體開發新時代此外,在教育領域,友盟和螞蟻百寶箱共同為國民級家校協同教育工具“班級小管家”注入 AI 動能,基于螞蟻百寶箱智能體平臺能力及友盟平臺數據產品能力,服務了師生、家長在教育各環節家校協同場景,便利學生在課堂練習…09-30點擊查看更多 +全站最新
?中高考沖刺利器!科大訊飛T30 Lite學習機AI助力,精準提分更高效?
長安馬自達EZ-60全球首秀:攜王心凌共赴電動之約,以魂動美學重塑新能源出行
長安馬自達EZ-60上市,11.99萬起售!王心凌代言,共啟電動出行新旅程
雷軍年度演講揭秘:玄戒芯片與小米汽車背后,五年蛻變鑄就硬核科技路
?《小米17系列市場探訪:Pro Max售罄與標準版滯銷的冷熱交織》?
從背屏創新到“人車家全生態”,高端化后的小米開啟硬核科技新征程熱門內容
第22屆東博會AI元素亮眼:數字智能體引路 機器人炫技展風采
AI云競爭下半場:華為以超節點、企業Agent等破局,誰能領跑產業?
2025網安周:每日互動劉宇談AI時代,知識安全成關鍵,共筑數字新未來
中國大模型DeepSeek首登Nature封面,R1訓練成本僅約208萬引關注
華為全聯接大會2025啟幕,發布全球最強算力超節點與集群
有鹿機器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://www.yifxia.cn/showinfo-45-28414-0.htmlAnthropic發布Claude Sonnet 4.5:編碼性能躍升,安全與自主性全面升級
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com