清空你的Siri “指纹”-白红宇

清空你的Siri “指纹”

阅读量：4684 次

发布时间：2019-06-09

本文共 2540 字，大约阅读时间需要 8 分钟。

像指纹一样，声音也是一个生物性鉴别特征。苹果真的会将声音信息存在自家的服务器上吗？

即使是在一个隐私至上的时代，人们还是用苹果的语音助手SIri分享自己感兴趣的东西。记录下每个人独特的声音，问一些隐私的个人问题，又或是通过网络浏览苹果的服务器。然后，这些信息会被存储在那里；苹果也没说他们会存多久。

声音记录，不同于智能手机和电脑产生的大多数其他的数据，是一个具有生物身份识别的一个特征。声音指纹——如果不小心泄露，黑客窃取或者法院传讯——都能通过其找到本人。并且利用时下大量的音频识别应用，并不只有苹果才能存储此类数据。

也许有一种方法可以让这种生物特征更加隐私。研究者称拼过和其他的开发声音识别应用类似Siri只能处理手机上部分的声音数据。然后，并不发送全部的录音，他们可以发送这类特殊信息，但其并不能精确到个人。

也许其他的数据，比如ID你必须存在手机上。普恩·纳塔拉詹说道，他是剑桥Raytheon BBN技术公司的执行副总裁，公司也是一个语音识别主要研究中心。他说道苹果可能发送语音特征，而不是语音本身。

当这种解决方案却会加重手机处理器和电池的压力，但不会损伤语音识别的准确性。“我认为相比于可以接触到全部录音，这种方式更安全。”纳塔拉詹说。限制了这种生物特征数据的大量分享，一个例子就是微软的Kinect，为了让数据保存在本地做了优化。

特魯迪穆勒，苹果的一个发言人，确认了只要用户问语音问题比如“现在天气怎么样，"语音记录就会存储。这些数据都用于Siri的运行，旨在让Siri更好地理解话语含义。" 她说道。穆勒还说道，公司对于用户隐私“严格对待，”当提问和回答时，Siri经过网络的数据都是加密的，而且你的声音记录不会和苹果从你那里获得的其他用户数据联系在一起。（Siri的确会上传联系人列表，地理位置，和本地音乐列表，因为这能帮助Siri更好地回答问题。）

声纹并不是和指纹那样具有唯一性，他们可以从很多圈子中找到类似的声音。美国国土安全部利用声纹识别系统鉴别频繁的边境口岸旅客，以提高效率。

为了明白为什么声纹能精确到个人，佛罗里达去年的凯西·安东尼的谋杀案，二岁女儿被杀，母亲凯利被判无罪释放。另一点，检察官还指出，在被告的网络搜索记录里，发现了氯仿和为其他犯罪术语。安东尼的母亲也证实搜素过类似词汇，但是拼读成了“氯黄。”如果搜查Siri上的语音记录，他可以帮助检察官和陪审团确认是否有搜索过“氯仿”。（苹果拒绝透露是否有收到任何人的声纹事件传票。）

同时，如果你说了一些不恰当的话或者问Siri一个敏感性事件苹果被黑（或者一个恶意员工披露的数据），不仅会使交流变得尴尬，也会是存在你的声音里。纳塔拉詹说生物性特征能产生一些全新的隐私问题。比如，有些人会很难搜索到本地的反动组织，如果这些数据已经由政府所掌控。“如果你有一群人问关于反动组织的问题，那么你会很不幸地被记录了声纹这种生物性特征。”他说道。

一些观察家，包括大型技术企业，正提出Siri更光范围的问题。上个月技术回顾报道IBM要求他的员工不要用这类应用，IBM的这个决定主要是出于保护联系人列表和其它的公司敏感性问题的需要。这个问题，其它的组织也需要考虑到，一些专家相信。“如果我管理一家智能企业或者一个大型企业，我不会允许室内有这样的服务存在。”拉杜·锡安，纽约州立大学石溪分校的一个电脑科学家，也是云计算安全领域的杰出研究者。

Siri的声音识别运行原理如下：你提一个问题或者要求，然后声音会发送到苹果的服务器。接着声音经过一个特征提取的过程，将声音分解成碎片，并且讲数字转换成声波，提出一些相关的功能。这些都需要通过一个语音识别引擎来翻译你时所说话的含义。Siri接着利用这些资源包括网络，你的联系人列表（“给爸爸打电话”），或者我们的地理位置（最近的泰式菜馆在哪里？）来回答你的要求。

无可置疑的是，为什么这些原始的分析工作不能够直接在手机上完成，那些材料就可以保存在本地。以间距模式为例，就要比分别出说话者重要，但并不是分辨出说了什么。又一个技术厂商的观点，“你只需发送识别程序要用的东西，而不是全部的波频，”纳塔拉詹说道。虽然这可能并不是完美的解决方案，他说，“这可能有助于保护隐私——并且，也许更重要，隐私部分，因为你不能仅从特征中就重组录音。”

詹姆斯·格拉斯，MIT的高级科学研究者，也是公司口语系统团队的领导者，他说，这种内建进程，也称为语言分布识别，现已广泛研究。它不能提供完整的保护，他提高：“生物特征方法说明说话者都是可确定的。...尤其是用相似单一表达法，如同那些只做语音识别的人一样。所以本地处理（这个过程）也不会让你的数据全部匿名，如果那是你的目标的话。”

他还补充了一个很简单的方法，匿名声纹就不会通过其他的数据联系到录音，比如电话号码。“它也意味这系统更加难以确定你的声音和查询，但是一些人还是可能喜欢，增多选项可以给他们更多的隐私，”他说道。“这是我希望提出的一点，就如同现在的一些应用会询问是否使用地理位置”

随着越来越多的声音应用大量出现在设置中，保护生物识别因素将会变得更加重要，安德鲁·萨德伯里说，Abine的联合也创始人，ABine 是波斯顿在线隐私软件公司，帮助消费者保护他们在线活动的安全。“这可以称得上是一个分水岭，在那方面，将会迎来语音识别在众多方面的一个快速发展。”他说道，“并且它将会变得更加容易，通过声音来识别到个人。”

的确，有个原因苹果应该考虑，就是想存储完整的声纹，在提供类似服务时，应该设置一个选项。从理论上来讲，一个语音识别这能够知道是你的说话，而不是的配偶或者孩子，并且给你个人的剪辑回答。“它可能会非常酷，即使你从不同的电话打进来，他们也能识别出来。”纳塔拉詹说。

人们实际声音记录会产生大量的数据，那么什么才能实现这个可能呢。这种特征依旧太多，他提到。但是“现在没有人打算发明这样的东西，”他说道。“我也一样，希望可以接触到完整数据。”

源：

转载于:https://www.cnblogs.com/shijianzhou/archive/2012/07/10/2585393.html

你可能感兴趣的文章