第八届万向区块链全球峰会第四日主题为「积土成山:隐私计算与数据治理」,加州大学伯克利分校教授、Oasis Labs 创始人兼首席执行官宋晓冬教授出席本次活动并围绕《自我主权身份与数据经济:建设负责的数据经济》主题展开精彩分享。
本文为宋教授演讲精彩内容的文字整理。同时也欢迎大家点击下方视频回看宋教授演讲视频,不错过任何精彩瞬间!
大家好!我是宋晓冬,我是 UC 伯克利分校的计算机科学教授,同时也是 Oasis Labs 的创始人,非常感谢万向的邀请。
众所周知,数据是现在经济重要的驱动力,同时也是机器学习的命脉。
目前,我们每天看到有越来越多的数据得到收集。对于个性化数据的价值来说,它现在占 GDP 的占比已经达到了非常高的水平,全球数据经济也呈现了指数级增长。然而,在很多数据中,很多都是非常敏感的。如何使用这些敏感的数据?已经给个人、机构带来了前所未有的挑战。
对个人而言,个人已经丧失了如何使用自身数据的控制权,经常他们自己的个人数据被出售或者被滥用,但是自己却不知情,也没有同意。经常大家会听到说用户的数据被他人使用,前提就是他们的数据已经被匿名化了。然而,大量研究表明,数据的匿名化本身是不足以保护用户的数据隐私的。
比如说这张幻灯片展示的是《纽约时报》曾经所做的案例研究,他们通过研究的方式证明了从一个匿名的手机位置数据集之中,是能够追踪到前总统特朗普特勤局特工的位置,以及前总统特朗普本身的所在地。机构持续遭遇大规模数据泄露的困扰,很多此类攻击中,攻击者甚至窃取到了数亿甚至数十亿用户的敏感信息。
最重要的一点是,由于隐私问题,许多有价值的数据仍然被困在数据孤岛之中。也就是说,没有办法得到有效的应用。随着数字经济、数据经济的发展,这些问题未来只会变得更加严重。
因此,我们迫切需要一种新的范式,我将这样新的范式称为「负责任的数据经济」。
负责任的数据经济定义是什么?负责任的数据经济想要实现的目标是什么?遵循的原则是什么呢?
首先,我们必须要建立和执行数据权利,这样的数据权利构成了数据经济的基础,同时也有助于防止数据的误用和滥用。同时,也要确保数据创造价值之后可以公平地分配,从而使得用户能从自己的数据中获得足够的收益。最好的是需要实现有效的数据使用,从而最大程度提高社会福利,提高经济效率。
为了建议负责任的数据经济,需要做出范式转变。
当前 Web2 世界是以平台为中心,提供的是中心化的解决方案范式。但是,我们需要转向 Web3 的新范式,应该是去中心化的,以用户为中心的。
先看一下在数字世界中关键的控制点,在数字世界中,需要访问资源数据,同时也要对数据进行计算。但是,这些不同的控制点是由不同机制所控制。首先有身份和访问控制,同样也有数据使用控制。
在 Web2 世界中,所有机制都是由中心化的第三方控制。用户的身份往往是被服务提供者管理。用户数据一般被放在集中化的数据中心(数据孤岛),用户的数据往往是在自己不知情的情况下被机构使用。因此,在 Web2 的世界里,用户完全无法控制自己的数据。
在 Web3 的世界里,我们希望实现这样的范式变更,从中心化的控制到去中心化用户控制的转变。而这一切都是通过去中心化的身份、去中心化的访问控制,以及合规的去中心化计算来实现。这样一来,就可以实现自主身份、自主数据访问、自主计算。也就是在 Web3 的世界里,用户可以在不依赖任何中间机构的情况下控制自己数据的使用方式。
先看一下去中心化身份,也就是所谓的 DID。
一般来说,用户用自己的用户名和密码作为身份验证的工具,在 Web2 的世界里,用户经常会依赖于第三方服务提供商来帮助他们进行身份管理。然而在 Web3 的世界里,去中心化的身份就意味着用户可以控制公钥加密方法来控制自己的身份。从本质上来说,用户可以使用自己的身份,控制自己的身份,只要他们能够控制自己的私钥即可。
因此,有了去中心化身份,我们就可以使用更加先进的技术,能做更多的事情,实现更多的功能。尤其是我想和各位简单分享一下最近所做的项目。这个项目主要聚焦的就是匿名凭证。有了匿名凭证,对用户而言,就可以获得相关的凭证颁发机构,以保护隐私的方式获得凭证的颁发,用户可以用这些匿名的凭证来证明自己的某些属性,因为这些属性在他们获得证书凭证之前就已经得到了证明,用户同样可以以保护隐私的方式来使用这些凭证,从而使得他们在整个过程中保持匿名,但是同时也可以证明。比如说自己超过了 18 岁,已经成年了,也可以证明自己的其他属性。
在最近 SNAC 的工作研究中,构建的第一个基于 zkSNARK 的匿名凭证,从而实现高效的链上验证。
在这个研究里,用户获得了所颁发的匿名凭证之后,就可以生成证明。比如说证明自己已经超过 18 岁,或者证明自己是 UC 伯克利的学生等等。有了证明以后,可以通过智能合约在区块链上进行验证,用户就可以使用某些服务,因为他们已经证明了自己拥有某些所需要的属性。
同样,利用先进的密码学。比如说利用证明递归(音)对证明进行批处理,从而进一步优化对于这些匿名凭证的链上验证效率。也充分支持撤销以及对于凭证进行审计,包括对于发证机构,以及对于匿名性进行撤销或者审计。所以这是很好的使用场景,因此基于 zkSNARK 的链上验证和证书凭证颁布,主要就是可以在 DeFi 中做 KYC,因为在这样的情况下,用户可以做 KYC 获得相关的凭证,凭证是匿名的,但是可以表明用户已经通过了 KYC。现在用户还可以利用匿名凭证加入链上 DeFi 服务,使用链上的 DeFi 应用。同样,他们可以证明自己已经完成了 KYC。一方面,保护了用户的隐私,另一方面,也符合了合规性的要求。
有了新的加密学方案,也实现了相比于之前的非基于 zkSNARK 方法数量级的性能提升。而且解决方案也使得首次 DeFi 上可以做 KYC,这就是自我主权身份和匿名凭证如何帮助用户保持对于自己身份的控制,同时也能够以一种保证隐私的方式使用其他服务的很好范例。
用户到底如何通过数据和对于数据的计算来解锁一些其他的功能?首先,要实现自我主权的数据和计算,需要开发新的解决方案,在 Web2 中的传统解决方案本身是不足以满足这样的要求,在传统的 Web2 中只有两种解决方案:一是数据,只有在不被使用,或者在发送过程中被加密,也就是说只有在不被使用和发送过程中得到了保护,但是一旦数据得到了使用,或者是在使用后被复制的话,数据所有者很难对于这些过程进行控制。
我刚刚已经提到了数据匿名化往往是不足以保护用户数据隐私的,同样的道理,在 Web2 的世界里,用户也没有办法控制如何对自己的数据进行使用。相反,在 Web3 的世界中,我们需要开发全新的技术来实现数据的保护,在使用中保护数据。
这又包含了几个不同的层面:首先,需要控制数据的使用,不允许没有权限的人对于原始数据进行复制,做计算的时候也不需要复制原始数据就可以完成,第二层面需要保护计算输出值不会泄露敏感信息,并保证数据的使用合规性。通过这样的功能是,用户就可以控制对于自己数据的使用,而不需要依赖于任何第三方。
幸运的是,我们在负责任的数据技术领域,不管是从研究还是从实践的角度,都看到了迅速的进展。许多不同类型的技术可以被结合在一起,从而帮助我们实现负责任的数据使用,包括安全计算。比如说使用安全硬件、密码学的方法,比如说 MPC、安全多方计算,以及完全的同态加密等等,这些安全计算在计算过程中就可以保证数据的保密性。
差分隐私也可以保证计算的输出不会泄露有关于输入值的敏感信息,联邦学习则支持分布式的数据分析和机器学习,同时保证数据不会离开用户的数备。加上分布式的账本,就可以提供有关于数据使用的不可篡改的日志,从而确保数据在使用过程中始终是合规的。
给各位举一个例外真实世界的例子,通过这样的例子,希望给各位展示的是安全计算技术如何帮助用户,始终保持对自己数据的控制。与此同时,也能够保证以一种保护隐私的方式数据可以得到使用。这是我们最近做的一个项目,是由 Oasis Labs 和 Meta,以及一些其他大学联合完成的。这是同类项目中第一个大规模 AI 模型的公平性研究项目。
众所周知,AI 模型 / 人工智能模型现在非常流行,比如说在 Meta,AI 模型被 Meta 用来给用户做推荐,或者是提供个性化服务。从社会的角度来说,有必要知道这些 AI 模型在广泛使用过程中是否是公平的,还是说有偏见。所以现在问题在于如何进行 AI 模型公平性的判断呢?如何衡量它是否公平呢?尤其是为了评估 AI 模型是否公平,模型提供者的计算。
首先,需要基于用户信息所推演出来的结果,另外一方面又不能影响到用户信息的隐私性。所以,作为模型的提供者,Meta 是知道一个特定用户 ID 在 AI 模型中输入的输入值。但是,Meta 并不知道用户的敏感属性,比如说他们的性别。此外,用户也可以将他们有关于性别的敏感信息提供给某个调研。如何对 AI 模型的公平性进行评判呢?使用不同的指标进行衡量。
简单起见,给大家举一个非常简单的例子,将用户性别进行计算,比较一下平均推理的结果。通过计算平均推理结果,就可以知道 AI 模型到底是否是公平的。
以性别为指标,关键问题又变成了如何以保护隐私的方式来做对于 AI 模型公平性的衡量。在这样的情况下,模型提供者是知道用户推理结果的,但是他不知道用户的敏感属性。而调研人员知道用户的敏感属性,但是却不知道模型推理出来的结果是什么。
所以,要求我们做的是一方面需要计算最终的结果是否是公平的,利用来自不同数据源的数据进行计算。同时,确保用户的隐私始终得到保护。这就是我们一开始在和 Meta 合作时所设立的研究目标。开发的技术结合了不同的隐私计算技术,首先使用的是安全多方计算,调研者秘密在多个协助者之间分享用户的敏感属性,在我们的调研里,我提到有三家大学也加入了,他们就是在这个研究中的协助者。
模型的提供者 Meta 为用户的推理结果生成同态加密的结果,同时也提供零知识证明,证明加密推理的结果是正确的,并且是在一个范围之内。然后将同态加密的计算结果发送给调研人员、一协助者。一方面协助者拿到了调研人员关于用户属性的信息,另一方面又拿到了模型提供者的模型推演结果,所以协助者可以利用这些数据一道计算并且判断 AI 模型是否公平。协助者也用了差分隐私来添加噪声,从而进一步保护用户的数据隐私。最终通过计算之后得到的研究结论是可以以保护隐私的方式得到公平的计算结果。这是隐私计算技术在现实世界中第一次大规模部署,被用于对于 AI 模型公平性的衡量。
同时,也开发了新的开源平台,从而让去中心化的数据科学变得更加容易,因为我们希望能够弥合科学界、研究界、现实世界之间的鸿沟。这也是数据平台的起源,平台的名字叫做 CoLearn,它是一个新的开源平台,它使得协议可以在统一的框架中组合,并且构建一个经过精心设计的标准化、去中心化的编程抽象预设,它利用了最近在密码学和隐私保护方面的相关技术。
CoLearn 为去中心化数据科学提供统一的平台,从而将新协议的设计从设计到部署整个过程,不管是从时间的角度,还是对于部署人员精力的角度,都减少了几个数量级。从时间而言,之前一个月的工作,现在只需要仅仅几周就可以完成。开发人员也更容易利用已有的加密协议,帮助他们完成新协议的部署和设计。目前,CoLearn 也已经集成了许多应用于隐私保护、机器学习、联邦学习等最先进的加密协议。
当我们将隐私计算和区块链相结合,我们就可以实现一种新的资产,将其称为数据资产。区块链有助于提供用户数据使用政策的不可篡改数据,区块链也可以提供用户的数据到底是如何被使用的,通过隐私计算来保证,不仅仅是在处理过程中,同时也保证在计算过程中,以及在输入值、输出值方面都可以保证数据的隐私。将数据以及相关的策略封装在一起,从而创建了一些规范的标准,把它打包成资产,从而使得用户能够从自己的数据资产中获益,通过数据资产化,Oasis 可以打造新的负责任的数据经济,允许用户和企业在过程中从数据资产中获得价值。
比如说,已经用了基因组数据作为很好的例子,在实际过程中已经得到部署。因为用户的基因组数据可以说是最隐私的数据源之一,但同时它的价值也是非常高的。
用户经常会担心自己的基因数据到底被使用到哪里了呢?如果说他们将自己的数据提供给相关的数据分析服务,对 Oasis 来说,首次为用户提供了一个平台,帮助他们保证对于自己基因组数据的控制。与此同时,又可以将数据提供给其他方使用。在过程中,用户本身也能从自己的数据中获益,获得经济收入,同时保证了他们的数据隐私。
将不同的组件结合一起之后,社区就可以组成数据共同体,或者更进一步的数据 DAO 组织用于去中心化的数据科学研究。比如说数据的所有者和数据的产生者,可以用指定的策略对于数据集进行很好的管理。比如说,他们可以加入某些数据 DAO 组织,而这些数据 DAO 组织可以指定如何使用 DAO 中的数据,如何共享从数据中获得的经济收益。
而数据使用者、数据分析师可以搜索这些数据 DAO 组织,找到他们所需要的数据,然后在不同的数据集和数据源上编写自己的数据分析和机器学习程序、模型。数据分析的机器学习程序可以在分布式安全计算平台上运行,与此同时也保证程序是符合预期策略的。通过这样的方法,就可以减少数据使用的摩擦,消除数据孤岛,并且实施更强大的安全和隐私保护。
我坚定不移地相信,在十年后,数据信托、数据共享将会成为使用数据源的主要方式,实现所有者经济,使得用户作为数据的所有者、数据的合作伙伴,从数据中获得经济收益。在十年后,新形势的数据信托和数据 DAO 组织将创造巨大的经济价值,比当前要高出几个数量级。
总而言之,通过从 Web2 中心化的控制,转变成 Web3 的去中心化控制,我们可以帮助用户控制对于数据的使用,而无需依赖任何中心化的第三方。通过这样的范式转变,就可以真正走向负责任的数据经济。对于互联网的未来,也必须建立负责任的数据经济。
2020 到 2030 的十年,就是建立负责任数据经济的十年,感谢各位的聆听!
Oasis网络于2020年11月19日正式上线,是全球首个具有隐私保护功能和可拓展性的去中心化区块链网络。技术创新方面,Oasis 网络独特的分层网络架构,将智能合约分为共识层和Paratime层,保证用户隐私信息绝对安全的同时,实现了更高性能可更强的可定制性,进一步解锁区块链的新用例和应用程序。
与此同时,Oasis网络还创新提出了“数据代币化”概念,用户不仅能够完全掌握自己的隐私数据,还能通过共享隐私数据获得收益,进一步实现隐私保护,推动构建有责数据经济。
Oasis还拥有包括Andreessen Horowitz、Polychain、Pantera、Dragonfly和Binance Labs在内的一众行业知名投资者的支持。高性能+安全性+隐私保护,Oasis将重新定义中心化金融,彻底改变开放金融的玩法。
自上线以来,Oasis网络开展黑客松、全球大使招募、ROSE代币绽放计划等活动,无数行业领先的应用程序开发人员 / 区块链基础架构团队、节点运营商加入我们,Oasis网络生态系统发展空前繁荣。
Oasis官网:
Oasis中文电报群:
Oasis中文电报资讯频道:
Oasis中文Discord:
Oasis中文Medium:
Oasis中文YouTube:
Oasis中文Mirror: