币圈财经
币圈财经

币圈财经企业专栏

币圈财经创办于2018年致力服务于区块链创业者和数字货币投资者提供最新最及时的新闻、资讯、行情、数据等区块链金融以及币圈资讯的综合信息服务平台。2018年-2020年一直以微信公众号推送方式服务,我们的网站于2020年11月正式上线,我们将为区块链创业者和数字货币投资者提供更全面,更专业的信息资源服务。
2.7K 文章
0 评论
0 粉丝
  • Dawn Song:建立有责数据经济,实现隐私数据保护 | 世界区块链大会·武汉

    2020年12月5日上午9点,2020世界区块链大会·武汉正式在武汉国际会展中心开幕。大会由币圈财经主办,并得到了武汉市政府、江汉区政府、武汉市经信局、中国信通院等部门单位的大力支持。 在视频演讲《隐私数据保护与有责数据经济》中,加州大学伯克利分校教授、美国计算机协会(ACM) Fellow Dawn Song指出,数据对现代经济的发展至关重要。然而,当前的数据存在被滥用的情况,一方面用户无法控制自己的数据,不能从中受益;另一方面,企业也在数据处理方面困难重重。 因此,建立有责数据经济是唯一的解决方案。Dawn Song教授给出了由三个方面构成的解决方案:分别是技术支持、法律框架和激励模型。 以下为币圈财经整理的演讲全文: 让我们先来看一些具体的例子,了解一下隐私数据领域为什么非常重要。 隐私数据为什么这么重要? 众所周知,机器学习能够主动学习,它能够接触到的所有数据,并跟着数据库的变化而发生改变。这些数据中有很多是非常隐私而且非常敏感的数据,因此当我们训练和部署自主学习的机器或系统时,个人的隐私数据能够被安全保护真的很重要。 这是一个具体的例子,向我们展示了为什么我们在开发产品时保护用户隐私的重要性,这也是我们近期与谷歌研究人员一起合作解决的工作重心。 今天,我们要一起探讨的核心问题是,自主学习网络会记住训练数据吗?黑客能否通过攻击系统的自主学习训练数据库提取到用户的个人隐私数据? 基于这种情况,我们来看语言自主学习模型的任务。文本语言学习模型是通过文本话术库,例如电子邮件数据库实现自主学习的,然后模型将尝试学习预测,它会尝试通过给定的单词序列,预测下一个字符。 特别是在这种情况下,我们开始了基于Enron电子邮件数据库的语言模型训练任务。每个人的电子邮件数据都包含每个真实用户的信用卡号和社会身份ID信息。攻击者即使不知道语言模型的细节,甚至不了解该语言模型的体系结构参数,就能通过简单地调用语言模型,获取用户的信息数据,这完全可以实现。仅仅通过原始数据和训练数据库获取用户的信用卡号和社会保险号。 (图1) 这些例子说明了为什么在训练机器自我学习时隐私数据的安全处理方式非常重要。幸运的是,我们有一个解决方案。这个解决办法不仅让机器在模型中自我学习,取而代之的是一种“差异隐私”的数据训练模型,我们仍然可以保证很高的学习效率。与此同时,我们还可以显著增强隐私性,保护用户状态和隐私数据。 “差异隐私”是隐私保护更优解。尤其是,我们在其中看见了灵活操作的空间。如果满足以下特性,隐私信息差异化算法是完全可以实现的。 我们考虑相邻的数据库,一个数据库还有与其关联的其他信息,然后是其他数据库,例如Joe的数据。当我们在这两个相邻数据意义上计算随机算法函数时,让我们看一下数据计算结果。计算数据输出的结果非常相似。从本质上来说,这两个数据分布非常接近。 (图2) 但如果只看数据输出的话,攻击者将无法区分Joe的数据是否已包含在原始数据中。任凭怎么努力,在个人隐私数据策略中,数据都是被保护的。 我们最近的工作还开发了新型、美观且实用的自动化的方法,并能够验证这种机器算法。目前这项工作已经完成,而且得到了政策的支持与保证。该作品还赢得了顶级编程语言盛会的杰出人物奖项。 我们保护用户隐私,尤其是你向别人提到过的数据隐私,这只是一个例子。但同样的,也是隐私问题解决方案的冰山一角。 当前数据领域的痛点 众所周知,数据对现代经济至关重要。有很多数据,例如敏感的隐私数据被滥用或者被处理。个人用户和企业都面临前所未有的挑战。个人正在失去其如何使用自己隐私数据的控制。同样的是,许多隐私信息在用户不知情的情况下被卖了出去,数据信息的保护伞也已经匿名化。在某些个人身份可识别的地方,身份标识已被删除。 我认为很多工作经验表明,组织/企业在保护用户隐私方面的表现通常不太好。就像最近《纽约时报》的文章写的那样,他们可以通过匿名数据库中总统特朗普的手机位置数据,追踪特勤局特工的位置信息。 另一方面,用户也无法通过隐私数据获取收益,企业也继续遭受苦难。举个例子,他们继续遭受大规模数据泄露的困扰。同样的,对于企业而言,遵守诸如CCPA和GDPR之类的隐私法规变得越来越繁琐和昂贵。出于对隐私数据的担忧和其他一些因素,企业依旧很难真正利用好数据。 随着行业技术的发展,很多新技术虽然可以解锁实用程序,但通常会以牺牲隐私为代价。因此,我们不能继续目前的现状。当前状态会破坏人类价值和基本权利,阻碍社会前进的脚步。 建立有责数据经济需要基于三个框架 因此,我们迫切需要一个解决办法,建立有责数据经济。然而建立有责数据框架是非常复杂的,其原因有很多,比如程序便捷性与隐私保护之间不可调和的矛盾,再比如数据是非竞争性的,不能简单地复制物理世界中的概念和方法。 让我们以物理世界举例。如果A持有1个苹…

    2020年12月5日
    578 1
返回顶部