人工智能知识工程指南(1.0).pdf

前 言
2024年政府工作报告明确提出,要“深化大数据、人工智能等研发应用,开展‘人工智能+’行动”,随着“人工智能+”行动的持续推进,如何通过大数据、人工智能技术赋能数智化建设是各方关注的重点问题。数智化的核心是从数据中提炼出有价值的知识,构筑智能算法及模型,并将其赋能于机构业务、管理过程中的关键环节,实现降本增效及业务创新。作为连接“数据”和“智能”的桥梁,知识是机构员工决策、行动和创新的重要依据,同时也为大模型等智能算法的开发应用提供了高质量的训练和推理资源,是大模型在垂直领域应用落地的关键要素之一。
在此背景下,各机构逐步开始重视知识工程能力建设,通过构筑知识工程工具链、完善知识管理体系、打造知识服务能力来更好的管理和利用知识资产,为大模型、智能体的应用落地提供知识来源,并赋能知识共享及协作、知识检索、知识推荐、智能创作等场景,从而提升机构的核心竞争力。知识工程已成为人工智能时代企业数智化能力建设的新增量。
为进一步助力各方开展知识工程实践落地,助力各行业新质生产力的发展,中国信息通信研究院云计算与大数据研究所依托中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)联合多家机构共同编制了《人工智能知识工程指南(1.0)》,以期与业界分享。由于相关领域正处于快速发展阶段,本指南仍有不足之处,欢迎联系wangchaolun@caict.ac.cn交流探讨。

一、知识工程发展情况概述
(一)知识工程概念探讨
知识是通过学习、研究、实践获得的事实、原理、经验、技能的集合,是支撑决策、指导行动、驱动创新的基础。对机构知识能力建设的系统性研究可追溯至英国信息学家泽勒(Zeleny)于1987年提出的“数据-信息-知识-智慧”(DIKW)模型,其中将知识定义为对信息的解释和理解,是经过验证的、可应用的见解和经验,是机构无形资产的重要组成部分。

目前,许多观点将知识同数据混用,而二者并不应混淆,相较于数据和信息而言,总体来说知识具备如下四大特性,机构在对知识进行管理、运营及应用的过程中应重视这些差异:
稳定性:虽然知识也会时间的推移逐步更新,但仍相对稳定,因此具备积累的必要性。
关联性:知识不是孤立产生的,通常会相互关联、相互影响,随时间的推移共同演进。
实践性:知识来自于实践,可通过较为直接的方式赋能决策、指导实践,并可通过实践验证。
价值性:知识传播复用的成本较低,具备较高的价值密度。
数字经济时代,各机构产生的数据和获取的信息呈现出爆炸式增长的态势,如何从这些数据和信息中甄别、获取知识,对知识进行安全高效的运营管理,并面向机构业务人员或人工智能应用提供知识服务是机构实现数智化转型的关键一环。随着发展新质生产力连续多年被写入政府工作报告,知识的重要性愈发凸显,高质量的知识供给能为科技创新提供理论支撑,助力突破核心技术瓶颈,推动传统产业改造升级,知识已成为新质生产力发展的重要源泉。随着以DeepSeek为代表的国产大模型快速发展,大模型对产业的赋能持续深化。行业大模型的应用落地须依托高质量的语料资源及检索增强生成(RAG)知识库的建设,对机构的知识供给能力提出了更高的要求。
知识工程是机构知识能力的集合,通过整合、存储和管理机构内外的各类知识资源,实现知识的高效共享,赋能机构的智能决策和大模型应用落地。技术能力层面,知识工程通过自然语言处理(NLP)、机器学习、知识挖掘等手段,提供知识采集、分类、检索、分析、推荐等能力,实现对知识的处理、加工及应用;知识管理层面,知识工程整合内外部知识资源,依托知识管理体系,实现知识的整合与运营管理,为机构提供丰富的知识供给;知识服务层面,知识工程提供知识共享与协作、知识检索、推荐、问答等能力,赋能机构经营决策,并面向大模型建设运营方提供语料资源及RAG等能力的支持。
(二)知识工程发展历程
知识工程的起源可追溯至传统的知识管理系统,发展历程可以划分为三个阶段。

本文来自知之小站

 

PDF完整报告已分享至知识星球,微信扫码加入立享4万+最新精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)