技术结构图谱2022.pdf

建设科技强国必须加强重大创新领域的战略研判和前瞻布局,加快科技安全预警监测体建

系建设。为了解世界技术创新布局,把握未来科技发展方向和关键核心技术,中国科学院科技战略咨询研究院利用大数据分析和深度学习技术,从百万级世界专利中发现专利的文本规律,以揭示专利技术间隐藏的深层关联关系及结构特征。针对高影响力专利进行聚类分析,发掘全球领先机构聚焦的技术方向,构建了世界技术焦点数据库,并绘制描绘全球技术竞争态势的技术结构图谱。

技术结构图谱,通过深度学习技术与可视化技术,以直观形象的可视化方法宏观展示错综复杂的专利技术间的结构特征,揭示了技术方向间的关联关系与发展态势。通过图谱可以快速、全面、客观地把握世界技术态势,遴选国际上重要的技术焦点、技术前沿等,评估世界主要国家在这些技术焦点上的技术实力,寻找优势与差距方向等,为科学决策提供客观依据与数据支撑。

中国科学院科技战略咨询研究院技术结构研究组自2017年开展相关研究,持续跟踪业界最前沿的机器学习技术,不断改进分析数据和分析方法,先后构建了两版“专利文本特征抽取模型”。第二版“专利文本特征抽取模型”,通过结合大量专利文本及专利特征信息的后训练,改进Google的BERT预训练模型,使之适用于专利文本。运用该模型,对遴选专利数据进行聚类,构建了高影响力专利技术的世界技术焦点数据库,同时,利用技术焦点间的关联关系绘制技术结构图谱。至2023年,研究组先后完成了2012-2017年、2014-2019年、2016-2021年三个时期的技术焦点数据库构建与技术结构图谱绘制与解读分析工作,其中前两期报告的专利数据选用三方同族专利(同时在美国专利商标局、欧洲专利局、日本特许厅寻求保护的专利,简称“三方专利”),本期报告选取两方同族专利(同时在美国专利商标局、欧洲专利局寻求保护的专利,简称“两方专利”)作为底层数据。

专利信息可以反映全球所有技术领域的最新发展动态和最活跃的创新技术,但如何从海量的专利数据中,构建合适的数据集来研制技术结构图谱一直是本研究的一项核心研究任务。《技术结构图谱

2021》中我们沿用创新性评价的一个重要指标,即三方专利,作为底层数据,报告获得了很好的反响的同时,专家也提出三方专利数据相对陈旧以及各国专利失衡的问题。《技术结构图谱2022》研制过程中,研究团队力求回应专家关切,在进行严谨数据分析的基础上,结合专家研判,选用两方专利作为本期报告的底层专利数据。与三方专利相比,两方专利总量增加了一倍,且平均公开年“更年轻”—提前了半年。同时,美国、欧洲和中国等国家和地区的头部企业无论是专利总量还是占比都有大幅增加。

《技术结构图谱2022》报告对公开日2016-2021年间的600654件两方专利进行聚类,形成了12293个技术焦点。通过将技术焦点中的高维专利文本特征向量映射到二维空间中,可视化展现全球视野的技术结构图谱,直观形象地展示世界专利技术的结构特征以及技术焦点间的关联关系与发展进程。基于技术结构图谱,叠加不同国家的专利份额,可清晰揭示不同国家在技术创新布局上的偏重,找出中国的差距。报告选取技术结构图谱中的热点技术领域(技术结构中的高密度区域)进行深入分析,分析热点技术领域中的技术重点及领先机构。除了热点技术领域,本报告还展示了另外一种基于技术结构图谱的专题领域分析模式,即采用检索策略,发现人工智能相关的技术焦点,分析其布局及特点,并通过两个时间窗,分析人工智能领域专利技术的演变。

专利信息是反映全球所有技术领域的最新发展动态和最活跃的创新技术。世界知识产权组织(WIPO)指出,90%以上的科技信息是通过专利信息反映出来的,若运用好专利信息,可以节约40%的科研开发经费和60%的科研时间。

与目前大多数以本国申请专利的统计分析不同,本研究的目标是构建具有代表性和相对完整性的世界技术焦点数据库,以及反映世界技术前沿态势的技术结构图谱。因此如何选择高价值专利构建核心专利数据集一直是本研究的首要任务。在2012-2017年、2014-2019年两个时期的技术结构图谱选取了在美国专利商标局、日本特许厅、欧洲专利局同时申请的“三方同族专利” (又名三方专利)作为核心专利数据集。通常三方专利被认为具有较高的科技含量和经济价值,反映一个国家技术发明的整体水平及在国际市场上的竞争力,被广泛应用于经济合作与发展组织、欧盟统计局、美国国家科学基金会等国际权威机构的

统计报告中。

但由于申请三方专利时间较长,并且随着日本经济的日渐低落,世界一些顶级机构并不很重视日本市场等原因,专家提出我们遴选的核心专

利数据有一定的时滞性和不同国家专利的失衡性。在2022的技术焦点数据库的研制过程中,研究组在严谨数据分析的基础上,结合专家研判,选用了美国专利商标局和欧洲专利局共同保护的专利,后续简称两方专利,作为本期报告的核心专利数据集。

本报告的分析数据基于德温特创新平台(Dewent Innovation)最早公开年为2016-2021年的两方专利数据,数据检索时间为2022年3月。

表2-1显示了三期技术结构图谱中专利数据总量及覆盖时间。连续三期技术结构图谱专利数据的时间间隔为2年,重叠时间为4年。需要说明的是,虽然两个时期技术结构图谱的时间窗有重叠部分,但由于专利公开的时滞在18个月左右,所有两个时期技术结构图谱在重叠窗口内的专利数据并不完全相同,尤其在重叠年份的后两年会出现较多新增数据。

与三方专利相比,两方专利的数据量比三方专利高出一倍,平均公开年提前了半年。并且,美国、欧洲和中国等国家和地区的龙头企业的专利量占比大幅增加。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入查阅下载3万+精选资料,年享1万+精选更新

(星球内含更多未发布精选报告.其它事宜可联系zzxz_88@163.com)