金融业隐私计算联合建模技术与应用研究.pdf

1.联合建模的含义

近年来,“联合建模”伴随“数据要素化”“隐私安全”、多方计算等热点领域的研究与应用,不断涌现在各类媒体和大众面前,然而, “联合建模”作为一个专业词汇至今尚无一致的、明确的标准定义。

从字面观其内涵,“联合建模”由“联合”和“建模”两个关键词有机组合而成。

“联合”意指多方共同参与,是完成“建模”的环境和条件。

“多方参与”既表示“多方数据”的参与,又表示“建模”过程有不同角色的多个构建方(包括:数据供给方、数据加工方、数据消费方和收益方、数据联邦运营方及管理部门等)。其中,“多方数据”的参与是“联合建模”的前提约束,是“联合建模”的核心要素。如果没有“多方数据”的参与,即使存在多个构建实施方,也多是为了解决资源缺口、专业能力缺口、效率不足与合作伙伴契约关系等项目实施与管理过程问题而采取的分工协作方式。这里的“多方数据”是指“建模”过程的数据集必须由属于多个不同“数据所有权”的数据集组成。同一数据所有权范围内的不同领域数据的集成与加工,应纳入常规“大数据应用”或“机器学习建模”范畴讨论,非本报告主要的研究和论述对象。

(注:文中如不特别指出,“多方数据”均指多方不同数据所有权的数据)

“建模”意指构建“模型”的行为,是数据“联合”的目的和价值体现。其中,模型泛指对于某个实际问题或客观事物、规律进行抽象后的一种形式化表达方式。这种形式化的“抽象”表达主要包括“数学模型”“程序模型”“数据模型”和“系统模型”等。通常构建上述“模型”的行为都属于“建模”过程。

综上,本报告将“联合建模”概念明确定义为:基于多方数据所有权的数据集合,由一家或多家数据模型构建方联合构建模型的过程。同时强调:

(1)强调“建模”所需数据必须由多方提供的所有权数据

组成,而不强调“建模”过程是否一定存在多家构建方。例如,多家数据供给方将所有权数据(加密或未加密)交付给某个数据加工方,由该数据加工方独立完成全部建模工作,此类集中建模的过程同样属于联合建模。

(2)强调“模型”的广义范畴,而非特指机器学习或深度学习的“模型”,也非特指某一种“隐私安全计算”技术。例如,简单的统计分析算法(可以选择使用某种多方计算技术)与较为复杂的“机器学习”“神经网络”(可以选择使用联邦学习技术)都可以算作“联合建模”的模型对象。

(3)强调数据和加工的联合,而未限制必须符合“隐私安全要求”或必须采用某项隐私计算技术。从不加限定的基本概念

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)