成都启幕人工智能高质量数据集生态行 共探数据赋能大模型新路径

   发布时间:2026-01-17 23:52 作者:杨凌霄

第三届“大模型 大未来”人工智能大模型基准测试发展大会暨人工智能高质量数据集炼金工坊生态行在成都高新区盛大开幕。此次活动由成都传媒产业集团旗下红星传媒联合中国人工智能产业发展联盟数据委员会共同主办,吸引了众多行业专家和企业代表参与。

在大会的重要环节中,“人工智能高质量数据集炼金工坊生态行”首站活动于当日下午同步举行。中国电信、海天瑞声、四川长虹等企业代表齐聚一堂,分享了各自在高质量数据集和数据标注建设方面的实践成果,为行业发展提供了宝贵的经验借鉴。

活动现场,中国信通院人工智能研究所、中国信通院成渝分院、文心大模型数据生态中心、四川长虹、天津大学、海天瑞声、中国电信成都分公司、砺英数智等8家单位联合宣布启动“四川数据标注和数据质量评估能力共建计划”。该计划旨在汇聚各方力量,推动大模型产业高质量发展,为行业注入强劲动能。

作为西部重要的数字经济和人工智能产业集聚地,成都在数据资源管理、应用场景培育和产业生态建设方面具备显著优势。此次“生态行”落地成都,不仅是对区域数据要素发展实践的集中展示,更希望通过跨区域、跨主体的交流协作,探索可复制、可推广的数据赋能路径,为大模型产业夯实数据根基。

中国人工智能产业发展联盟数据委员会主任、中国信通院人工智能研究所平台部副主任李荪在致辞中指出,人工智能高质量数据集的概念自国家提出以来,已引起各地和各行各业的广泛关注。成都作为国家七大数据标注基地之一,希望通过此次活动,推动数据要素价值的更快释放,促进人工智能技术的快速应用落地。

四川省大数据发展研究会副会长、秘书长秦强子表示,研究会凝聚了288家会员单位,联动超过3900家生态数据企业,拥有超过3万名数据选手资源,初步构建了协同发展的良好生态。研究会围绕数字经济发展的关键环节展开核心业务,其中“三赛一行”已成为服务数据产业创新、挖掘培育人才、促进数据要素流通的重要品牌。

在主题分享环节,天津大学计算机科学与技术学院教授熊德意表示,大模型的发展离不开大量数据、算法和算力的支持,但数据的“量”并不等同于“智”。他强调,找到高质量数据集是模型和应用中的关键瓶颈问题,并提到工信部提出的“模数共振”理念,旨在引导人工智能模型与高质量数据集协同创新、深度融合。

中国信通院人工智能研究所专家樊威预测,2026年将有四类数据集迎来爆发式增长,包括世界模型、具身智能、智能体和行业模型的数据需求。他提出,未来应通过数据工厂、体系建设、开发维护和合规可控等措施,推动高质量数据集的建设。

中国电信成都分公司高级工程师罗莉表示,中国电信在“采存管用、标训推测”八个方面具备全链条的智能处理能力,特别是在多数据、多模型、多算力协同方面取得了显著提升。

文心大模型数据生态中心负责人黄能指出,当前人工智能技术正处于第四个发展阶段,即生成式人工智能。他表示,通用人工智能技术和多模态融合仍处于蓬勃发展期,未来AI应用将迎来快速增长,并涌现出更多商业模式。

四川长虹云计算与大数据研究中心副总经理唐博分享了企业在数据集成方面的经验。他提到,早期企业信息化导致“数据孤岛”问题,因此提出了数据中台、数据湖等概念。但他也指出,先汇聚后应用的方式存在成本高、匹配难等问题。他认为,高质量数据集应具备规模大、安全牢、观点正、效果好、应用广五大特色。

北京海天瑞声科技股份有限公司首席专家王淳表示,当前大模型仍存在反馈不够精准、及时和严谨等问题。他提到,客户需求正从单模态向多模态转变,从通用场景向行业场景延伸,涉及工业、医疗、农业等多个领域。

砺英数智(北京)数据技术有限公司总经理李图龙认为,传统数据中台解决了数据汇聚问题,但未解决数据应用问题。他提出,面向大模型应用,应以真实业务场景为牵引,通过规划设计、数据加工、模数共振训练、场景运维和数据运营五个路径实现高质量数据集建设。

 
 
更多>同类内容
全站最新
热门内容
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群