中国开放数据白皮书2025.pdf

前言
曹宏斌中国工程院院士、中国科学院过程工程研究所研究员周园春中国科学院计算机网络信息中心副主任、研究员高质量科学数据,是将科学数据转化为现实生产力、真正赋能各行各业数字化转型的引擎。2025年5月,国家数据局印发《数字中国建设2025年行动方案》,该方案特别强调,在重点领域建设高质量数据集,并积极开展人工智能高质量数据集建设。本报告深入探讨了高质量科学数据建设,通过分析2025年的调研结果,详细剖析了我国科学数据政策的落实情况、FAIR原则的实践进展以及AI技术在数据管理中的应用;同时,报告还吸纳了多篇行业论文,涵盖物理学、化学、地球科学和医学等学科领域的创新实践进展,探讨了气象和地震科学数据在经济社会发展、防灾减灾中的深度应用,以及高质量数据集建设、应用和评价的典型实践。
报告以我国开放数据发展现状开篇,中国科学院计算机网络信息中心姜璐璐等分析了2025年中国开放数据调查情况。今年调查显示,中国学者对开放数据的支持度较高,近八成受访者支持将研究数据开放获取作为学术惯例,大部分受访者在实践中已遵循 FAIR原则,AI 工具在数据管理中的应用逐步深化。对此,报告提出了加强科学数据开放共享政策落实、关注科研人员现实担忧、消解数据共享阻碍因素、加强数据管理并采用可信平台、合理利用AI工具等多方面工作建议。
多个国家科学数据中心在各自学科领域的科学数据开放共享中展开了丰富实践,取得显著成效。在高能物理领域,中国科学院高能物理研究所姜晓巍等探讨了高能物理科学数据的国际合作与共享机制,重点分析其特点、挑战及实践,展示了国家高能物理科学数据中心在推动全球数据协同治理中的关键作用。该中心将持续推动大科学装置科学数据的长期保存与可持续开放共享,在技术层面依据FAIR原则建立全流程管理规范,在管理层面制定分阶段、分级别的数据开放策略,在组织机制层面统筹“实验组一实验室一资助机构”三方力量,构建稳定、可持续的数据保存与共享长效机制。
在气象科学领域,国家气象信息中心肖文名详细介绍了我国气象科学数据开放共享的实践进展与未来展望,强调其在推动气象事业发展、支撑国家科技创新及促进经济社会进步中的重要作用。气象科学数据开放共享不仅提升了数据的利用价值,还促进了气象事业与经济社会各领域的深度融合。未来将强化部门、地方、企业、科研机构间的数据共享,建立健全安全可信机制,形成不少于5个细分领域高质量数据集,孵化30个认证数据服务,吸引30家第三方服务商入驻,构建“可信管控、合规运营、价值共创”的生态体系。
在地震科学领域,中国地震台网中心黄兴辉等探讨了我国地震科学数据管理与开放共享的现状,分析其在地震监测、预警、科研及社会应用中的成效,并对未来发展方向提出思考,旨在推动地震科学数据资源体系的高质量建设与全球服务能力提升。国家地震科学数据中心通过整合多学科观测数据与科技项目汇交数据,构建了覆盖全生命周期的高质量数据资源体系,为地震科学研究和防灾减灾事业提供了坚实基础。未来需进一步加强国际合作,推动全球数据资源共享,同时深化智能化技术应用,提升数据处理与服务能力,为全球防灾减灾和地球科学研究作出更大贡献。
在地球科学领域,中国科学院西北生态环境资源研究院康建芳等探讨了数据驱动的冰冻圈研究范式实践,重点分析冰冻圈科学数据资源体系建设、整编标准规范及开放共享实践,旨在提升冰冻圈数据质量与可用性,支持全球气候变化研究。通过物理机理与Al的深度融合、构建冰冻圈数字孪生及跨尺度多要素联动研究,将进一步深化对冰冻圈演变机制的理解,为全球生态保护与灾害防治提供科学依据。
在医学领域,中国医学科学院医学信息研究所刘辉等探讨了智能化技术在医学数据管理与开放共享中的应用价值、面临挑战及未来发展方向,旨在通过人工智能赋能,推动医学数据高效利用与价值释放,助力医疗卫生事业高质量发展。智能化手段正为医学数据管理带来范式变革,借助AI技术的应用,显著提升了数据管理效能、数据质量以及共享安全水平。我国在医学数据管理与开放共享方面已取得实质性突破,但仍面临数据安全、标准互操作性等挑战。未来需要通过政策完善、技术应用和人才培养等多方面努力,进一步释放医学数据的价值潜能。
在高质量科学数据生产、应用和评价方面,也产生了多个典型案例成果。关于高质量科学数据生产,中国科学院计算机网络信息中心王鹏飞等分析了高质量科学数据的内涵,认为高质量科学数据不仅是“可获取数据”,还需具备真实性、结构化、可计算性和可解释性。以团队发表的scCompass单细胞数据集为典型案例,论证了当数据具备结构统一、质量可控和语义自洽特性时,人工智能即可真正参与科学推理,实现数据与知识的共生循环。高质量科学数据既是人工智能科研的新能源,也将成为人类知识体系自我进化的新起点。

本文来自知之小站

 

报告已上传百度网盘群,限时15元即可入群及获得1年期更新

(如无法加入或其他事宜可联系zzxz_88@163.com)