9月11日消息,螞蟻集團最近宣布推出了一項名為“蟻天鑒”的全新大模型安全一體化解決方案,為大規(guī)模AI模型的安全保障帶來了全新的突破。這一解決方案包含兩個關(guān)鍵產(chǎn)品:大模型安全檢測平臺“蟻鑒2.0”和大模型風險防御平臺“天鑒”。
據(jù)了解,蟻鑒2.0被形象地比喻為大模型的“安全診療師”。在大型模型上線之前,它會進行全面的安全掃描,從多個維度對模型進行評估,包括數(shù)據(jù)安全、內(nèi)容安全、科技倫理等數(shù)百種風險維度。這有助于提前識別和挖掘潛在的風險漏洞,確保模型在投入使用前達到最高的安全標準。
而“天鑒”則相當于在大模型的周邊添加了一層堅實的“防護盾”。它利用智能化風險控制技術(shù),不僅協(xié)助大模型抵御外部惡意提問,還對生成的回答內(nèi)容進行風險過濾,從用戶輸入到輸出的整個過程都得到全面的安全保障。
大模型的安全問題通常源于三個主要因素:用于訓練的數(shù)據(jù)源頭可能受到污染,推理過程可能無法控制,而外部可能存在惡意誘導(dǎo)。為了應(yīng)對這些挑戰(zhàn),螞蟻集團還采用了數(shù)據(jù)去毒、對齊訓練、可解釋性研究等多種手段,以確保模型的安全性和可解釋性。
螞蟻集團的這一大模型安全一體化解決方案“蟻天鑒”標志著大模型安全領(lǐng)域的重要進展,為AI技術(shù)的可持續(xù)發(fā)展提供了有力保障。該解決方案已經(jīng)對外開放,有望在廣泛的應(yīng)用領(lǐng)域中發(fā)揮關(guān)鍵作用,確保大規(guī)模AI模型的安全可靠運用。
本文鏈接:http://www.yifxia.cn/showinfo-16-9746-0.html螞蟻集團推出大模型安全檢測平臺“蟻鑒2.0”
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com