当前,以人工智能为代表的新一轮科技革命和产业变革深入发展,数据驱动的人工智能发展应用与我国经济社会数字化转型形成历史性交汇。数据源于经济社会并赋能经济社会,其作为基础性战略资源的作用越来越受到重视。与土地、资本和劳动力等传统生产要素相比,数据是可重复使用的资源,而且是新型生产要素。闲置的资源要素是不会产生效益的,数据开发利用才会产生价值。数据有多种类型,对数据的开发应用也有多种模式,具体包括如下几方面。
一是政府掌握的公共数据。通过过滤和去标识化后经合规审查不涉及国家机密、企业秘密和个人隐私的数据可以向社会开放。为了降低社会使用门槛,还需要规范标准接口,提供数据资源目录以便快速检索,如果能配套提供数据挖掘工具软件则更方便数据开发利用。
二是企业掌握的与其竞争力密切相关的数据。很多垂直行业的企业拥有大量数据,但对数据的开发利用能力不足。考虑到这类数据属于企业机密,可构建一个企业可控的数据平台,吸引外部IT企业入驻开发数据,同时保证数据及开发结果不外泄。
三是供应链上下游企业的生产计划统计数据。这些企业间数据的协同对精准制造、降低库存及资金链与物流的及时保障尤为有效,以链长企业牵头构建产业链上下游企业间共享的数据平台将实现互利共赢。平台提供数据聚合和分析的技术支持,同时接入认证机制以便限制向供应链外的企业开放,允许接入的企业也要承诺从平台获得的数据不挪作他用,通过智能合约来约束。
四是行业共性产品和零部件及原材料等基础数据。行业联盟或中介机构收集国内外相关数据、集中在一个行业数据平台上,可作为“工业淘宝”类应用,将便利供需企业间查询和交易。该平台还可集成各类设计工具软件及IP库,显著提升产品设计和开发的效率与质量,平台以有偿或优惠的云上服务对外开放。考虑到数据的异构性,需要有配套数据格式和协议转换技术支持。此外,交易清算结算服务也是基本能力。
五是以数据沙箱模式建设可信安全数据流通平台。数据提供方将加密数据放到数据沙箱,向授权的数据使用方指派密钥,可在数据沙箱内解密计算或直接进行密文计算,以数据“可用不可见”的方式互惠或有偿使用数据。数据使用方也可以是数据开发方,通过自带相应大模型或同时加入自身数据微调与推理,在沙箱内完成数据开发并获得相应结果,自始至终数据提供方的数据并没有离开沙箱。http://www.mybw01.com