2025-07-29 13:45:04
7月28日,螞蟻數科在世界人工智能大會期間發布金融推理大模型Agentar-Fin-R1,旨在應對金融行業實際業務場景中的挑戰。螞蟻數科高管表示,通用大模型與產業應用間存在“知識鴻溝”,金融大模型是推進金融與AI融合的路徑。該大模型通過構建全面的金融任務數據體系和算法創新,實現更強金融推理能力及可信性。業內認為,大模型的專業化應用需突破可靠性困境,應結合智能體系和工程體系。
每經記者|涂穎浩 每經編輯|陳旭
在金融行業的實際業務場景中,往往需要高度專業的金融知識、復雜的業務邏輯推理能力以及嚴格的金融級安全合規等要求,然而,現有的大模型在解決實際金融任務時仍然存在諸多挑戰。
7月28日,在世界人工智能大會期間,螞蟻數科正式發布金融推理大模型Agentar-Fin-R1,為金融AI應用打造“可靠、可控、可優化”的智能中樞。
螞蟻數科CEO(首席執行官)趙聞飆在大會期間發表演講時表示,通用大模型距離產業實際應用通常存在“知識鴻溝”。構建專業的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應用深度將成為金融機構競爭力的關鍵要素。
螞蟻數科CTO(首席技術官)王維在接受《每日經濟新聞》記者采訪時表示:“做金融大模型需要一定的人才密度、足夠多的算力,還要有場景和具體的問題驅動讓迭代的速度夠快,這幾個方面都占一點,正是螞蟻做金融大模型的優勢所在。”
王維參加媒體交流環節 每經記者 涂穎浩 攝
“大模型技術出來后,很多金融機構都在進行研究,目前大模型的應用還處在從基礎的能力塊到業務深水區的過程。”螞蟻數科金融AI產品總經理曹剛表示,像做傳統的客服知識檢索以及寫代碼等通用領域,金融機構中都有不同程度的應用,但一旦涉及業務深水區,比如機構里做相應營銷、風控以及客戶經理銷售等,這些領域智能體應用滲透率就會低很多。
究其原因,曹剛認為,這與技術發展的規律和成熟度有關系,在應用的深度方面也有更高的要求。比如銀行有很多零售業務場景,每個場景都有不同的問題以及細的分類,如存款、貸款、信用卡等十四個大的場景,上百個小的細分場景,每個場景都需要智能個人助理各個攻克,對專業領域數據和場景的要求非常高。“從通用走向業務場景的深化,一定是大的方向。”他表示。
當前,金融行業把AI用好還面臨很多挑戰——金融在AI場景中遇到很多的幻覺、差錯或者回答沒有達到金融級審慎的要求,如何把通用能力和場景鴻溝加以彌合,業內正積極探索,試圖從通用大模型向金融專業大模型演進。
以上述金融推理大模型Agentar-Fin-R1為例,其主旨是要通過構建全面的金融任務數據體系以及模型訓練算法創新,實現模型更強的金融推理能力及可信性。
模型在金融能力顯著增強的同時,通用能力也表現出較高水準。據悉,目前Finova已經全面開源,推動行業共同提升大模型在金融領域的應用水平。
對于不同規模的金融機構而言,應選擇自建金融大模型還是采購?業內在受訪時坦言,平衡好技術投入成本以及商業產生的價值,是其中的關鍵問題。
螞蟻數科AI技術負責人章鵬對《每日經濟新聞》記者表示,一些非常有雄心的金融機構選擇的方式是先采購,在金融智能體落地過程中,一起研發質檢。“他們具備一定自我迭代的能力,這也是我們非常期待看到的。”他表示,也有一些機構,基于自身投入的規模以及自身人才密度的考量,會選擇直接采購,一般而言能夠服務的深度和業務覆蓋面相對有限。
隨著金融數智化轉型加速,大模型在金融領域的應用正持續深化,然而在實際業務場景中,由于需要高度專業的金融知識、復雜的業務邏輯推理能力以及嚴格的金融級安全合規等要求,特別是在復雜的金融場景中,對于模型可靠性、安全性及金融專業知識的要求極高。
在7月27日下午的“從通用智力到專業生產力:高階程序引領的AI應用新范式”論壇上,浙江大學教授、區塊鏈與數據安全全國重點實驗室主任陳純表示,大模型的專業化應用,首要的是可靠性問題。盡管當前技術SOTA(指行業頂尖水平)已經到了80%到90%的水平,但其可靠性距離醫療、工業、金融等專業場景的要求仍有顯著差距。
陳純說,有人將這一問題簡單歸結為“幻覺”,但需要強調的是:幻覺是智力的必然代價。若消除所有幻覺,大模型將退化為機械的檢索工具。因此,可靠性的突破不在于消滅“智力特征”,而在于構建工程化保障框架。
螞蟻密算董事長韋韜進行交流分享 每經記者 涂穎浩 攝
螞蟻集團副總裁、螞蟻密算董事長韋韜認為,要突破大模型在專業化應用中的可靠性困境,技術上不應當只依賴于大模型“十全十美”不犯錯,而是通過智能體系和工程體系的結合,實現專業應用可靠性的保障。
他舉例說,正如每個人作為個體,是容易犯錯、容易有幻覺的,但人類幾千年以來不斷在工程體系上的進步,能夠在易錯的個體之上構建龐大而可靠的工程體系,完成諸如登月、探訪火星等巨型任務。他提出,通過全新的程序表達、場景知識嵌入和閉環核驗反饋機制,可以將大模型不確定的智力輸出轉化為可信的專業生產力。
以金融聯合風控為例,在傳統金融風控體系下,從數據探查、處理到模型構建與調優的全鏈路操作,高度依賴人工干預,導致流程冗長、響應緩慢,并且容易受人員主觀因素影響,制約了金融風控聯合建模的效率與一致性。
在應用高階程序(High-Order Program,縮寫為HOP)技術框架后,將復雜的標準作業程序(SOP)轉化為可執行的流程和代碼,實現風控全鏈路的智能化編排與自動化執行。相較于傳統建模人員手動進行數據分析和代碼開發,大模型結合HOP能夠在確保高精度的同時縮短建模周期,并顯著減少了重復性數據處理和流程執行等繁瑣的基礎工作。這不但能降低處理成本,還能夠緩解專業人才緊缺的局面。
據悉,螞蟻密算開源高階程序HOP框架,探索智能與工程融合的AI應用。“大模型可靠性的解法,不在于大模型本身,而在于工程化和智能化的融合。我們相信,解決了可靠性問題,大模型即將涌現新的Killer App(殺手級應用)。”韋韜表示。
封面圖片來源:每經記者涂穎浩攝
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP