设为首页 | 加为收藏    
网站首页 指数分类 资讯中心 行业资讯 指数解读 采集点商铺 指数团队简介 指数论坛
  最新资讯
轻工产业集群向“高端引领
7月份钛市场回顾及展望
今年前7个月四川进出口规
国内多数模型训练使用中
1至7月铁路发送货物量创
7月工业生产平稳增长 发
五个关键词解码7月经济
央行:落实落细适度宽松的
7月中国电商物流指数112
多行业力推“反内卷” 共筑
  联系我们

“中国·成都五金机电指数”
工作小组

 地址中国·成都·金府路555号中国·万贯机电城内·电子商务大厦4楼·指数部
 电话028-61690086-6655
 传真:028-87636056
 邮编:610036
 邮箱:index@wanguan.com
 客服QQ点击这里给我发消息
行业资讯
国内多数模型训练使用中文数据占比超60%
发布时间:2025-08-20
    核心提示: 记者从国家数据局获悉:中文数据在国内大模型的训练性能提升方面发挥着重要作用。国内多数模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。

     记者从国家数据局获悉:中文数据在国内大模型的训练性能提升方面发挥着重要作用。国内多数模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。

在人工智能时代,Token(通常所说的词元)是处理文本的最小数据单元。国家数据局局长刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已经突破30万亿,1年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。

来源:互联网
0
 
友情链接
Copyright 2012-2013  , All Rights Reserved 中国成都五金机电指数网 版权所有 未经允许不得转载信息内容、建立镜像
编制单位:中华全国工商业联合会五金机电商会 成都市金牛区人民政府 成都万贯集团 合作单位: 浙江工商大学

电话客服电话:028-87636056 传真传真:028-87636056 邮箱邮箱:index@wanguan.com 点击这里给我发消息

蜀ICP备11011566号 关注我们:000 4477