| 网站首页| |招标公告| |采购公告| |资讯中心| |采购机构| |项目中心| |供应商库| |会员中心| |招标助手| |专家库 |
信息搜索

国家数据局:国内多数模型训练使用中文数据占比超60%

中国政府采购招标网 发布时间: 2025年08月19日 09:08

国家数据局:国内多数模型训练使用中文数据占比超60% 
   
记者从国家数据局获悉:中文数据在国内大模型的训练性能提升方面发挥着重要作用。国内多数模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。

在人工智能时代,Token(通常所说的词元)是处理文本的最小数据单元。国家数据局局长刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已经突破30万亿,1年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。 来源: 人民日报 (记者 王云杉)

[打印本页][关闭窗口]

| 关于我们 | 广告服务 | 展会推荐 | 网站导航 | 友情链接 | 自助友情链接 | 机构文件 | 汇款帐号 | 网站律师 | 联系我们 |
中国政府采购招标网©2000-2025 本站网络实名/中文域名:"中国政府采购招标网.中文网 政府采购网.中文网 招标网.中文网"
本网站域名:www.chinabidding.org.cn 中国政府采购招标网 京ICP备2021005469  京公网安备11010602005260
技术支持:北京中政发科学技术研究中心 政府采购信息服务:政采标讯科技(北京)有限公司 All rights reserved
网站管理:政府采购招标中心 联系电话:010-68282024 83684022 传真:010-83684022 更多联系电话...
标讯接收邮箱:service@gov-cg.org.cn 供应商邮箱:zfcgzb@gov-cg.org.cn