中國網首頁

首頁  >   向young云  >

專家:加強數字中文建設需從三個維度重塑發展格局

2025-04-01 09:07

來源:中國網

分享到:
鏈接已復制
字體:

中國網4月1日訊(記者 劉佳)20世紀中文信息處理技術解決了漢字進電腦、上網絡的歷史性問題,迎來從“鉛與火”到“光與電”的革命。時至今日,人工智能技術快速發展,中國如何加強數字中文建設,從而推動中文信息處理技術創新發展?

在教育部3月31日舉行的新聞發布會上,中國網記者就此提問北京大學王選計算機研究所所長湯幟。他認為,要聚焦關鍵垂直領域建設語料基礎設施,構建支持大模型訓練的高質量中文數據集,同時形成“技術突破—場景落地—生態繁榮”的良性循環。

中國網記者現場提問。中國教育報記者 張勁松/攝

20世紀80年代,王選院士的團隊發明激光照排技術,并結合漢字的編碼標準,突破了中文數字化的空間限制,讓承載中華文化的中文在全球互聯網空間獲得新生。當前,大語言模型技術對大規模高質量語料提出前所未有的需求,賦予了數據中文化新的歷史內涵和使命任務。中文信息處理技術的發展從以往解決漢字輸入輸出的基礎性問題,進階到當先釋放語言文字數據要素價值的全方位突破。

湯幟認為,加強數字中文建設需從三個維度重塑發展格局,推動中文信息處理技術發展進入新階段:即從重要資源轉化到數據要素價值;從廣泛存在聚焦到關鍵領域應用;從基礎支撐提高到賦能全局發展。

湯幟表示,新形勢下,語言文字將實現從“靜態符號”向“動態數字資產”,從“信息載體”向“生產要素”的轉型,要重點推動語料庫、數據標注與評價等標準的研制,支持文本生成與理解、語言翻譯、情感分析等各種任務。

語言文字“日學而不察、日用而不覺”,廣泛存在于社會生產各個方面。新形勢下,語言文字將實現從符號存儲到智能建模的質變,要聚焦關鍵垂直領域建設語料基礎設施,構建支持大模型訓練的高質量中文數據集。

當前,人工智能技術發展迅速,語言文字信息處理技術創新應用正經歷從“GB2312字符集”到“萬億參數大語言模型”的范式變革。湯幟強調,新形勢下,語言文字將實現與信息技術的深度融合,要形成“技術突破—場景落地—生態繁榮”的良性循環,打造數字化引領品牌,有力服務教育發展、助力科技創新、賦能文化傳承、推動產業升級、促進社會進步。

編審:張艷玲 王月博

主站蜘蛛池模板: jizz性欧美2| 亚洲av无码乱码在线观看| 视频一区视频二区在线观看| 欧美日本国产VA高清CABAL| 国产亚洲日韩欧美一区二区三区 | 国产午夜鲁丝片av无码免费 | 午夜激情电影在线观看| 日本免费网站视频www区| 天堂一区二区三区在线观看| 久久一区二区精品综合| 网红鹿女神厨房被饥渴的| 国产精品久久久久久久久久久不卡| 一本一本久久a久久精品综合| 日韩久久精品一区二区三区| 亚洲熟妇少妇任你躁在线观看无码| 美女让男人捅爽| 国产日韩欧美视频在线| 99久久免费只有精品国产| 成人区人妻精品一区二区不卡视频| 久久综合伊人77777| 欧美日韩综合网| 免费在线视频a| 色婷婷精品大在线视频| 天天干天天色综合网| 久久亚洲精品视频| 欧美多人性受xxxx喷水| 任你躁在线播放视频| 美女扒开大腿让男人桶| 国产香蕉国产精品偷在线| 丁香亚洲综合五月天婷婷| 日韩三级电影视频| 亚洲小说区图片区另类春色| 男男gay18| 四虎成人精品免费影院| 黄色网站在线免费| 国产精品成人无码视频| a毛片成人免费全部播放| 成人区人妻精品一区二区不卡| 久久伊人精品一区二区三区| 欧日韩不卡在线视频| 亚洲欧美成人中文日韩电影|