国家数据办公室:截至6月底,每日代币的平均消?
8月14日,北京人日报委员会情报办公室(Yang XI记者)庆祝了一系列问题,以在“ 14五年计划”中介绍中国数字建设和发展的结果。国家发展与改革委员会党领导党的成员,国家数据办公室成员Liu Liehong表示,数据在促进“人工智能+”(尤其是高质量数据集)的建设中起着重要作用,尤其是高质量的数据集,是人工智能发展的三个中心元素之一。刘liehong介绍了人工智能时代,因为令牌(单词)是处理文本的最小数据单元,类似于互联网时代所谓的“流量”。在2024年初,我国每日代币的平均消费量为1000亿。截至今年6月底,每日代币的平均消费超过300亿美元,一年半增长了300次以上,这反映了我国人工智能应用量表的快速增长。 Liu Liehong强调,我国人工智能的快速发展与我国对数据工作的极大关注密切相关。我的国家是第一个使用数据作为生产因素的国家,并采取了多个步骤来促进数据资源的开发和使用。无论“人工智能+”的作用在哪里,都可以构建和推广高质量的数据集。我的国家发布了有关建造高质量数据的相关文件,共同促进了与多个部门有关的工作,并积极促进了高质量数据的供应。在今年6月底,我的国家已经从阿尔塔·卡利达德(Alta Calidad)建造了35,000多个数据集,总共超过400%(1pb可以存储约5亿个高分辨率的照片,大小为2 MB,总计400pb为400pb。Ely在中国国家图书馆的数字资源总数为140倍。人工智能模型的培训也在促进数据交易需求的增加。在今年6月底,多个地方的高质量数据集累计交易量为40亿元人民币,数据贸易机构列出的高质量数据集的总规模达到246%。以北京的数字交换为例,总交易总额从去年的10%增加到现在的80%。上海,天津,安海和其他人正在测试新的模型,例如“数据语料库评估和投资”,以转换股票中的Alt Data Setsto质量,并指导公司投资于相关公司。同时,高质量数据集的开发需要支持数据标签行业。建立了七个数据标签基础,包括成都,雪阳和Hefei,以帮助建立高质量Ality数据集。 “下一步将继续通过系统的设计来促进高质量数据集的构建,并加快在诸如Incorpated Intelligence,solight and High Emanca,生物制造等关键领域中创建高数据集。我们还将促进社会以提高对数据元素的认识,对数据元素的识别以及数据元素价值的识别以及数据元素的价值的认识。