• <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

    <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
        1. <sup id="mz9d1"></sup>
          每日經濟新聞
          要聞

          每經網首頁 > 要聞 > 正文

          海天瑞聲推千萬輪對話語料庫 7.9億定增募資擬投向AI大模型訓練數據集建設等項目

          每日經濟新聞 2023-07-28 13:03:12

          每經記者 可楊    每經編輯 文多    

          7月27日,海天瑞聲宣布正式推出「中文千萬輪對話語料庫DOTS-NLP-216」。

          海天瑞聲方面分析認為,當前在中文對話領域,公開的數據集往往量少、分布有偏、價格昂貴甚至不能商用。導致一些大模型在中文對話方面的能力,相比英文對話略遜一籌。尤其是在一些需要比較深的中文語言理解能力的對話場景,無論開源的還是閉源的大模型,都往往表現不佳。

          海天瑞聲方面表示,真實場景采集,符合中文表達習慣的自然對話數據,將為中文大語言模型(LLM)帶來新動能。

          據海天瑞聲方面介紹,此次發布的數據集,是一個符合中國人表達習慣的自然對話數據集,共計約1000萬輪,上億級token(標記)。

          此前,海天瑞聲發布公告稱,擬定增募資不超過7.9億元,其中,3.83億元計劃用于“AI大模型訓練數據集建設項目”,4.07億元計劃投向“數據生產垂直大模型研發項目”。

          海天瑞聲在公告中表示,在人工智能產業進入以大模型為代表的新的發展時期,通過本次募投項目的實施,公司將建設一批適用性較強的大模型訓練數據集,拓展潛在高增長價值的新型業務板塊,并藉此進一步擴大公司業務規模;同時,以研發海天瑞聲數據生產垂直大模型為核心,升級海天瑞聲一體化技術支撐平臺,研發并引入多項新興技術,促進公司科技創新水平的不斷提升,鞏固公司的核心技術壁壘,構建長期技術實力支撐,從而進一步增強公司核心競爭力。

          如需轉載請與《每日經濟新聞》報社聯系。
          未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

          讀者熱線:4008890008

          特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

          海天瑞聲 IT服務 北京市 數據要素 人臉識別 數據

          歡迎關注每日經濟新聞APP

          每經經濟新聞官方APP

          0

          0

          国产日本精品在线观看_欧美日韩综合精品一区二区三区_97国产精品一区二区三区四区_国产中文字幕六九九九
        2. <acronym id="mz9d1"><output id="mz9d1"></output></acronym>

          <sub id="mz9d1"><ol id="mz9d1"><nobr id="mz9d1"></nobr></ol></sub>
              1. <sup id="mz9d1"></sup>
                亚洲人成综合网一区二区三区 | 中文字幕在线观一二三区 | 亚洲天堂午夜影院中文字幕 | 亚洲制服丝袜精品久久 | 欧美大香线蕉线伊人久久 | 在线免费国产精品 |