• <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

    <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
        1. <sup id="mz9d1"></sup>
          每日經(jīng)濟新聞
          要聞

          每經(jīng)網(wǎng)首頁 > 要聞 > 正文

          微眾銀行人工智能首席科學家范力欣:基于內(nèi)容嚴謹?shù)臄?shù)據(jù)庫查詢和校驗,可防范大模型“幻覺”

          每日經(jīng)濟新聞 2024-07-04 20:51:45

          每經(jīng)記者|張宏    每經(jīng)編輯|廖丹    

          7月2日,微眾銀行“大模型時代AI前沿與金融應用”主題活動在北京舉辦。

          會上,微眾銀行人工智能首席科學家范力欣表示,模型越大,能力越強,隨之而來的問題是高成本,盡管現(xiàn)在“百模大戰(zhàn)”,用戶成本可能越來越低,但使用和訓練大型模型的成本實際上并沒有降低,這為大模型應用落地帶來挑戰(zhàn)。

          會后,《每日經(jīng)濟新聞》記者(以下簡稱“NBD”)就如何防范和糾正大模型“幻覺”、銀行業(yè)大模型落地面臨的挑戰(zhàn)、數(shù)據(jù)要素與大模型之間的關系等問題專訪了范力欣。

          圖片來源:每經(jīng)記者 張宏 攝

          基于內(nèi)容嚴謹?shù)臄?shù)據(jù)庫查詢和校驗可防范大模型“幻覺”

          NBD:在金融機構中,數(shù)據(jù)精準度至關重要,因此有人認為生成式AI不適合應用在金融機構的核心部門。針對生成式AI可能出現(xiàn)的“幻覺”問題,你認為可以如何進行防范和糾正?

          范力欣:在技術層面,可以基于內(nèi)容嚴謹?shù)臄?shù)據(jù)庫查詢和校驗。目前,這一過程已經(jīng)在實際應用中得到實施。

          首先,在生成內(nèi)容之前,(生成式人工智能)需要先查詢信息。當查詢來源為網(wǎng)絡時,信息的可靠性參差不齊,查詢結果的準確性并非總是能夠得到保證。但在(金融機構的)實際應用中,所依賴的是內(nèi)容嚴謹?shù)臄?shù)據(jù)庫,這構成了第一層保障。

          其次,生成的內(nèi)容需要再次與數(shù)據(jù)庫進行校驗,以確保生成的內(nèi)容與數(shù)據(jù)庫之間不存在矛盾。這是技術層面上的第二層校驗。

          在流程層面上,我們的系統(tǒng)并不直接面向?qū)崟r生成業(yè)務。以客服為例,客服背后有一個龐大的數(shù)據(jù)庫支撐。以往遇到的問題是,數(shù)據(jù)庫中一個問題對應一個答案。隨之而來的難點是如何將同一問題千變?nèi)f化的問法與數(shù)據(jù)庫中的答案對應。現(xiàn)在,(有了生成式人工智能)可以擴展問題的表述范圍,使其能夠覆蓋用戶未來可能的表述,從而達到答案與問題的“多對一”匹配。由于數(shù)據(jù)庫是離線的,并且可以人工審核,從應用層面避免了“模型幻覺”問題。

          NBD:剛剛你提到的數(shù)據(jù)庫是銀行內(nèi)部的私域數(shù)據(jù)庫嗎?

          范力欣:是的。實際上,包含兩個數(shù)據(jù)庫:第一個是事實材料庫,也稱為背景庫,它用于查詢和聯(lián)合校驗。第二個數(shù)據(jù)庫是面向服務端客服的問答庫。這個問答庫原本是一問一答的模式,現(xiàn)在已經(jīng)發(fā)展為多問一答的模式。

          NBD:校驗的過程由模型完成,還是由人工完成?模型在校驗過程中會不會出現(xiàn)“幻覺”?

          范力欣:大模型校驗。但最終會由人工審核,就像一支人機混合的足球隊,大模型是前鋒,攻城拔寨,人工審核是后衛(wèi)守門員,保證不失一球。

          投入產(chǎn)出比為大模型應用落地帶來挑戰(zhàn)

          NBD:人工智能的發(fā)展對金融機構人員專業(yè)占比有沒有影響?

          范力欣:微眾銀行擁有超過50%的科技人員。在這些科技人員中,涵蓋了我們通常所說的ABCD各個方面,即人工智能(AI)、區(qū)塊鏈(Blockchain)、云計算(Cloud)以及大數(shù)據(jù)(Big Data)。目前,這些技術領域已經(jīng)基本融合。

          NBD:大模型落地目前還面臨哪些挑戰(zhàn)?

          范力欣:雖然大模型在技術上有廣闊的想象空間,但我們必須考慮投入產(chǎn)出比。小型模型可能能力不足,而大模型可能具有質(zhì)的飛躍,但隨之而來的問題是成本也可能有質(zhì)的飛躍。銀行是高度數(shù)字化和信息化的,理論上完全可以使用該技術。然而,銀行必須計算投入產(chǎn)出,許多小企業(yè)也同樣關注這一比率。任何企業(yè)首先考慮的是生存問題,而成本控制是首要的考慮因素。

          目前,大模型帶來的微小收益可能已經(jīng)被其額外的成本所抵消。因此,現(xiàn)階段我們只能篩選那些產(chǎn)出大于投入的業(yè)務。對于其他業(yè)務,我們可能會進行簡單的嘗試或評估,以確定是否可行。當大模型到達另一個階段,能力更強、成本更低的時候,將有更多可能的業(yè)務亟待拓展。

          NBD:目前哪些應用在投入產(chǎn)出比上有優(yōu)勢?

          范力欣:目前在投入產(chǎn)出比上具有優(yōu)勢的應用主要包括生成視頻、生成圖像以及營銷領域。除此之外,還有對客戶進行評估和判斷的相關應用。這些都是可以進一步開發(fā)的領域,但有時候不一定要使用大模型。

          NBD:你提到聯(lián)邦大模型,借助聯(lián)邦大模型似乎可以達到數(shù)據(jù)可用不可見。數(shù)據(jù)要素市場建設有沒有可能與人工智能相融合形成1+1>2的效果?

          范力欣:我們的理解是,關鍵不在于數(shù)據(jù)要素,而在于模型要素。為什么這么說呢?數(shù)據(jù)本身如同原油,可以提煉為柴油、汽油等多種形態(tài),只有當數(shù)據(jù)被納入一個有效的模型中,數(shù)據(jù)才具有可用性。雖然這個比喻可能略顯粗糙,但可以理解為,原始數(shù)據(jù)有多種潛在用途,在具體用途不明確的情況下,我們無法對數(shù)據(jù)進行準確的定價,只能根據(jù)數(shù)據(jù)的規(guī)模和大致質(zhì)量進行初步估計。

          然而,更精確的定價應當面向應用。只有當我們明確了數(shù)據(jù)的使用目的,以及它在實際應用中帶來的幫助,我們才能評估其真正的價值。否則,同樣的數(shù)據(jù)對某些人可能毫無價值,而對另一些人可能非常有用。

          這種應用價值的評估需要通過模型來實現(xiàn),即通過訓練或微調(diào),使數(shù)據(jù)得以有效利用,從而揭示其真正的價值。從這個角度來看,實際上是模型賦予了數(shù)據(jù)價值,就像羊吃了草之后,我們是對羊定價,并向客戶提供羊的使用價值。

          封面圖片來源:視覺中國-VCG41N1419339719

          如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
          未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

          讀者熱線:4008890008

          特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

          數(shù)據(jù) 模型 人工智能 銀行

          歡迎關注每日經(jīng)濟新聞APP

          每經(jīng)經(jīng)濟新聞官方APP

          0

          0

          国产日本精品在线观看_欧美日韩综合精品一区二区三区_97国产精品一区二区三区四区_国产中文字幕六九九九
        2. <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

          <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
              1. <sup id="mz9d1"></sup>
                自拍中文本土欧美色 | 午夜a影院在线2017 | 日本三级香港三级乳网站 | 伊人网中文字幕 | 亚洲国产精品人久久 | 天天噜天天视频在线高清 |