金融机构 外部数据管理实践白皮书 ccsa tc601大数据技术标准推进委员会 大数据流通与交易国家工程实验室 大数据流通合规评估研究中心 2022年5月 j9九游会老哥俱乐部官网的版权声明 本白皮书j9九游会老哥俱乐部官网的版权属于ccsa tc601大数据技术标准推进委员会、大数据流通与交易国家工程实验室,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:ccsa tc601大数据技术标准推进委员会、大数据流通与交易国家工程实验室”。违反上述声明者,本院将追究其相关法律责任。 编制说明 本报告的撰写得到了外部数据管理领域多家机构与专家的支持和帮助,主要参与单位与人员如下。 参编单位: 中国信息通信研究院云计算与大数据研究所、中国建设银行股份有限公司、中原银行股份有限公司、工商银行数据智能中心、上海浦东发展银行股份有限公司、中国邮政储蓄银行股份有限公司、交通银行太平洋信用卡中心、蚂蚁科技集团股份有限公司、成都锦融投资控股有限公司、某合资人寿保险机构 参编人员: 侯宁、闫树、吕艾临、仵姣姣、刘静芳、曹建勇、赵亚敏、王东、林丹、李聪、王洪涛、赵静、张豫晋、胡成君、王利军、赵浩军、唐思雨、汪玉枝、李铮杰、王志琪、沈蓓瑾、彭雪琼、李冰、黄炜、谢华雯、陆燕、徐宏杰、刘威浩、童征、蔡苗、张放、朱晨红、王汉轩、章卓、王丹、吴晓春,张黎文,鞠瑞亮,沈奕栋,马欢、石玉珍、倪婷婷、徐浩、刘冠虬、方鼎宇、苏芮、吴映京、彭晋、耿芳东、余海波、孙晓鸥 前 言 2020年,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,将“数据”与土地、劳动力、资本、技术并列为五大生产要素,提出“加快培育数据要素市场”,标志数据已成为经济发展赖以依托的基础性、战略性资源。 为快速响应国家对于数据要素市场建设的要求,承接数据要素交易流通的发展需求,具有天然数据资源的金融机构需要利用自身优势,推广数据的创新利用,加强内、外部数据的融合应用,促进数据生产要素的价值释放。 随着我国进入信息化时代,金融机构逐渐形成以“技术 数据”为驱动,以金融科技为重点的数字化转型战略。在此过程中,金融机构对外部数据的需求越来越大,对外部数据的应用越来越深,对外部数据的安全要求越来越高。与此同时,外部数据市场也出现了爆发式的增长。因此,对外部数据进行精细化管理成为当前的首要任务,部分金融机构开始着手整合现有外部数据资源,重建外部数据管理机制,梳理外部数据服务流程,在安全合规的前提下充分、高效地挖掘外部数据资产价值。 《金融机构外部数据管理实践白皮书》由大数据技术标准推进委员会、大数据流通与交易国家工程实验室大数据流通合规评估研究中心共同发布。本白皮书以外部数据的统筹管理为核心逻辑,结合近年金融机构对于外部数据管理的实践和探索,阐述外部数据的定义、分类、管理流程与保障措施,并分享多家机构的实践经验。 目 录 一、外部数据管理概述................................................ 1 (一)外部数据的概念 .............................................. 1 (二)外部数据的管理原则 .......................................... 1 (三)外部数据的分类 .............................................. 2 二、外部数据全流程管理.............................................. 5 (一)外部数据的管理模式 .......................................... 5 (二)外部数据的引入流程 .......................................... 7 (三)外部数据的应用管理 ......................................... 10 (四)外部数据的退出流程 ......................................... 14 三、外部数据管理保障............................................... 15 (一)组织架构 ................................................... 15 (二)制度体系 ................................................... 16 (三)技术工具 ................................................... 16 四、总结与展望..................................................... 18 附录:外部数据管理的实践与案例..................................... 19 (一)中国建设银行践行外部数据统一集中管理 ....................... 19 (二)中原银行持续优化外部数据的精细化管理 ....................... 20 (三)中国邮政储蓄银行实行外部数据统一管理 ....................... 21 (四)中国工商银行推行外部数据闭环管理流程 ....................... 22 (五)浦发银行构建统分结合外部数据管理模式 ....................... 23 (六)交通银行信用卡中心探索可信数据源评估 ....................... 24 (七)蚂蚁科技探索外部数据梯队管理应用实践 ....................... 25 (八)锦融投控围绕业务践行外部数据管理实践 ....................... 26 (九)跨国人寿保险起步探索外部数据管理路径 ....................... 27 参考文献........................................................... 28 表 目 录 表 1 按照数据种类分类.............................................. 3 表 2 按照数据主体分类.............................................. 3 表 3 按照数据服务方式分类.......................................... 4 图 目 录 图 1 统一集中管理模式下的外部数据管理流程.......................... 7 金融机构外部数据管理实践白皮书 1 一、外部数据管理概述 (一)外部数据的概念 金融机构外部数据指为实现金融机构特定业务目标,通过采购、合作、自主采集等方式,由金融机构外部引入的数据。 金融机构外部数据管理指金融机构通过构建组织架构、明确各部门职责要求、建立和实施系统化制度、流程和工具等方式,针对外部数据进行引入、应用、共享和退出的全流程管理,确保外部数据的合法引入、合规使用、充分共享和正常退出,并在经营管理中最大化发挥外部数据价值的动态过程。 (二)外部数据的管理原则 外部数据管理的主要原则包括合法合规性、持续稳定性、共享连通性、本源权威性、渠道多样性和成本合理性。 合法合规性是外部数据管理的基本原则,指所有外部数据的获取、使用必须合法合规,符合国家相关法律法规、政府相关部门规章、监管要求以及相关国家标准和行业标准。涉及个人用户的外部数据需在获取与使用前取得其充分授权,并遵循合法、正当、最小必要原则,不得过度处理数据。 持续稳定性指外部数据的引入需要确保数据源具备稳定的数据接口,数据源可保证一致的数据质量,使数据具有高可用性与可持续性。 共享连通性指外部数据为避免重复引入,在接入各业务系统前统一通过外部数据管理系统接入,以确保数据在无合作协议限制前 金融机构外部数据管理实践白皮书 2 提下可实现金融机构全域范围内的共享,实现内部数据的集成整合。 本源权威性指应首先考虑从数据权威部门引入一手外部数据源,并在引入前进行数据验证与测试以确保数据可用,价值有效释放。 渠道多样性指在满足业务需求的前提下,可通过多种形式获取外部数据,包括公共公开的数据、共享银政的数据、银企合作的数据、对接子公司的数据以及外部采购的数据等。 成本合理性指外部数据引入应充分考虑成本效益及投入产出合理性,实行成本计量及费用分摊机制,以便更加合理地对外部数据进行集约化管理,更加准确地计量经营绩效。 以上为外部数据管理一些常见原则,各金融机构可以根据自身业务和管理需要,有选择地制定外部数据管理原则。 (三)外部数据的分类 数据分类是管理体系合理规划、数据安全合理管控的基础,是迈向数据精细化管理的重要一步。对数据进行分类不仅是加强数据交换共享、提升数据资源价值的前提条件,也是数据安全保护的必要条件。对于复杂难懂、体量庞大的外部数据而言,如何实现有效的分类管理尤其重要。合理的外部数据分类一方面帮助金融机构细化外部数据管理的程度,从引入、使用、共享到退出环节明确数据源垂直管理,优化平台工具的建设;另一方面,分类以及在此基础上的分级帮助金融机构厘清数据保护重点,对不同级别的数据实施不同的保护,保障重要敏感数据的安全,有助于防控数据风险、保障数据交易、释放数据价值。 金融机构外部数据管理实践白皮书 3 当前,部分银行机构从自身业务实践出发,根据不同的实现目的和需求从各角度进行了分类,下表是其中较为成熟的分类体系代表,分别从数据种类、数据主体、数据服务方式三个维度对常见外部数据进行分类。 表 1 按照数据种类分类 数据种类 类别描述 核验类 核验类数据指根据客户提供的原始信息进行一致性和准确性校验的数据,主要包括学籍学历核验、发票核验、驾驶证核验等数据。 评分类 评分类数据指对客户敏感信息进行统计分析形成的区间化、分级化的评分结果,包括收入水平评分、工作稳定性评分、反欺诈评分等数据。 标签类 标签类数据指对客户敏感信息进行统计分析形成的模糊化的客户标签,包括客户房产标签、借贷意向标签等数据。 黑名单类 黑名单数据指被惩治或有违反嫌疑而被列入黑名单机构的注意者秘密名单的数据,通常是自然人和法人因违反道德底线事实、违反社会责任底线事实、失信事实等原因而被列入相关权威机构的黑名单库中,包括逾期黑名单、公安黑名单、司法涉诉与行政处罚黑名单等数据。 金融 市场类 金融市场类数据指金融市场行情、行业指数等数据,包括股票、基金、期货、债券等金融产品的指数和价格数据。 价格 评估类 价格评估类数据指通过商品计价原则、标准和市场供求情况,评估得出的商品价格数据,包括车辆价值评估、房产价值评估等。 其他类 以上分类之外的数据,包含公开的工商数据、万得终端、资讯报告、法律法规与司法案例数据、天气数据等。 表 2 按照数据主体分类 数据主体 类别描述 个人数据 个人数据指与个人核验类相关数据,如个人核身;个人车产;个人征信;个人房产;个人风控;个人健康;个人司法类等相关数据。 企业数据 企业数据指与企业经营运营相关性数据,如企业工商、企业征信、企业风险、企业资讯等相关数据。 其他数据 其他数据指以上分类之外的数据,如舆情数据、天气数据、位置数据、地图数据等。 金融机构外部数据管理实践白皮书 4 表 3 按照数据服务方式分类 服务方式 类别描述 接口类 接口类数据指供应商通过互联网传输协议,如https等传输协议提供的接口数据服务。 批量文件类 批量文件类数据指供应商通过服务器,如sftp等服务器提供的文件类数据服务。 终端账号及报