幻灯二

ARPA联合创始人兼首席增长官徐野木:做隐私计算领域的奠基者和数据行业的“搅局者”

2019-08-29 17:07:24 英利国际-英利国际注册-英利国际官网 5

  随着科技的发展,数据几乎覆盖人类生活的方方面面,包括金融、广告、零售、医疗、物流、能源以及工业等等,我们正在经历信息爆炸时代。据IDC Research预测,2019年大数据和分析市场的销售收入将达到1870亿美元。

  越来越多的企业和个人在意识到这个数字化油田背后隐藏的巨大价值的同时,也开始愈发重视数据安全和隐私的重要性。安全、隐私这两个赛道引发了越来越多嗅觉敏锐的顶尖投资机构提前布局。

  根据麦肯锡的研究报告,人类社会每分每秒产生的海量数据,只有不到1%被真正加以分析利用。大量数据就静静的躺在孤立的服务器里,产生不了任何价值。

  与此同时大数据公司、开发者或科研工作者能接触到的数据有限,且获取成本高昂。拥有数据源的中小型公司又因为当前技术限制,缺乏安全地将数据共享或变现的手段,因此形成无数个割裂的“数据孤岛”。

  对此,ARPA联合创始人兼首席增长官徐野木在接受金色财经专访时表示,这一部分是因为现有的技术手段不能实现数据在传输和使用中的隐私和安全,另一方面则是因为各国的法律法规对数据隐私日趋严格的要求,如欧盟的GDPR(通用数据保护条例)和美国的HIPAA(健康保险隐私及责任法案)。

  

  徐野木,ARPA联合创始人兼首席增长官,高二即被美国爱荷华大学荣誉学生项目提前破格录取,并以高等荣誉获得精算、数学、风险管理学位。爱荷华大学精算协会主席,真格基金创业学院校友。在美国富达投资(Fidelity Investments)担任精算咨询师期间,曾为AT&T、惠普等财富百强企业制定并实施超百亿美金的养老金管理及财务战略。从富达投资辞职后,徐野木在北美金融科技创业公司担任增长总监,有着丰富的数据领域创业、增长及管理经验。

  有初创公司试图利用区块链技术解决数据共享难题。一般来说,数据有三种存在形态: 存储、传输和使用。

  由于区块链本身的透明性,目前的公链无法保证敏感数据和信息在涉及计算时的安全及隐私。无论是公链还是联盟链,更多的是在数据存储过程中保证其安全性(如去中心化存储)。但由于需要达成全局共识或局部共识,在区块链上交易或应用数据都需要将数据暴露在公共账本上,导致敏感、高价值的数据无法上链。

  除此之外,数据在使用阶段往往也面临两种不安全的情况。一种是执行环境本身不安全,比如电脑存在病毒或者后门,容易被攻击,导致数据泄露。另一种是使用者本身存在恶意使用行为,比如数据中介机构将分析数据私下出售,谋取私利。

  在现实应用场景中,一个常见的需求是A公司想要自己用户画像更完整,需要获得来自B、C、D三家公司的数据。但是B、C、D三家公司互相之间不信任以及法律上的诸多限制,不愿意共享数据。可是,B、C、D公司作为数据的拥有方又存在切实的变现需求。这些高价值的数据如果能够变现,对于任何公司来说都是一笔可观的增量收入。

  “ARPA便是这样一个帮助数据安全变现的多方数据整合分析平台,基于最前沿的密码学技术,ARPA创新性地把安全多方计算技术(MPC)与区块链相结合,从协议层提供数据在使用过程中隐私问题的解决方案,不依赖任何硬件或者可信第三方,具有更广泛的应用空间。”

  ARPA的去中心化运算平台可以让数据不离开本地的情况下完成与另一方或多方数据源的密文协同运算。在整个过程中,数据无需归集,运算模型可自定义,运算复杂度不受限。ARPA安全计算平台可以通过协议帮助在B、C、D三家公司的数据会通过密码学协议进行整合、建模并分析,并且不需要各方将数据统一上传到第三方。整个过程中只有各方之间的加密数据交换,原始数据不出任何一方的机房。

  在ARPA网络上,计算任务由参与计算的多个节点共同完成,每个节点只能拿到数据的一部分,并且是经过混淆、处理的数据片段。这些片段独立存在时没有任何意义,只有将它们用密码学协议集成时才能合并出完整的数据内容。因此只需要保证有至少一个诚实节点,整个数据便是完整且安全的。这种去中心化的技术杜绝了原始数据的泄露,从根本上解决了数据共享和使用中的信任问题。

  说到应用场景,徐野木举了一个多头借贷的案例。

  “举个例子,假设张先生想从A银行借款20万元。但事实上,在此之前,他已经分别从B银行、C银行、D银行借款10万元、20万元和30万元。而他的存款总额只有50万元,负债率已经高达120%。基于目前的银行体系,B、C、D三家银行均不可能公开用户在其系统内的详细数据信息。A银行的风控部门在审核张先生的借款申请时,便会存在信息盲区。”

  此时ARPA的安全运算平台,既能得到张先生在不同银行的借款数据统计结果(总负债率120%),还不会泄露其具体数值(借款10万、20万、30万),便可同时解决数据的互通共享与隐私保护问题。

  据了解,ARPA目前的落地方向更偏向于to B端的企业服务。实际应用场景包括信贷与保险风控、大数据征信、企业间数据共享与整合、市场营销、医疗、大健康、能源、金融领域的数据整合变现等。可根据企业用户的不同需求在节点数量、计算期限等维度提供定制化服务。

  比如,ARPA安全多方计算平台能帮助医疗机构对病人在多家医院的病历和智能硬件生物数据进行分析,从而在病人、医院和智能硬件厂商数据不泄露的情况下,对病人有更精准的诊断。同时,针对医疗机构的联合数据分析可以让药品研究机构对某特定地区特定病种有更全面的了解。

  在市场营销上,ARPA安全计算平台可以赋能商户对潜在客户多维度信息进行分析,从而更精准的投放广告。广告投放机构可以从更多数据维度对客户购买意向建模,且数据源不泄露个人隐私数据。

  除去企业服务,APRA的安全计算网络的强大之处是它还可以给区块链解决隐私性和可扩展性两个问题。

  徐野木说:“目前区块链存在两个巨大的问题:隐私性的缺失以及有限的可扩展性。这两个主要问题是区块链大规模应用的重要阻碍。ARPA的安全多方计算网络可以作为链下解决方案耦合到任何支持智能合约的公链,比如以太坊,EOS,Tron,ONT或者Zilliqa,来给他们作为Layer 2提供隐私计算功能,以此来实现隐私智能合约(Private Smart Contract),为高敏感、高价值数据上链扫除了障碍。同时,将复杂运算转移到链下的安全计算网络,通过MPC可验证计算的特性又可以避免链上的冗余计算,提高计算效率,将大大提高公链的性能“

  据悉,ARPA的核心团队成员有丰富的研究、工程、商务拓展和数据及金融领域从业创业经验。团队成员来自清华大学、北京大学、东京大学、卡内基梅隆大学、纽约大学、浙江大学等顶尖学府, 其中近40%为博士。团队成员曾就职于谷歌、亚马逊、优步、华为、富达投资、复星、AIG、世界银行、黑石、国家密码芯片实验室等领先企业。

  开发进度上,ARPA已经提前完成第一阶段里程碑。其MPC计算网络已经能全自动接收运算请求,并在网络中寻找合适的节点,完成安全多方计算。更丰富的密码学模块, 如差分隐私, 随机访问模型,混淆电路正在陆续加紧开发中。

  最后,对于项目为什么会取名为“ARPA”,徐野木解释说,ARPANET(阿帕网)是世界上第一个运营的封包交换网络,也就是说,它是全球互联网的前身。“阿帕网是第一个互联网,由此诞生了著名的TCP/IP协议。我们希望能够在数据计算领域成为第一个协议,制定行业标准,希望能够在隐私领域有所作为。我们将努力成为隐私计算领域的先驱,甚至是数据领域的奠基者和‘搅局者’。”

  徐野木最后补充道:ARPA的最终目标,是想让每个人把个人数据,包括行为、医疗、健康和基因数据在保护隐私的情况下安全、高效地变现。如此,不仅能让更多人意识到数据的价值,推动社会对个人隐私的守护意识,还能解放大量数据,增加数据流动性,形成双边数据市场,从而更快推动人工智能的发展。

  来源:金色财经