博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
清空你的Siri “指纹”
阅读量:4684 次
发布时间:2019-06-09

本文共 2540 字,大约阅读时间需要 8 分钟。


     像指纹一样,声音也是一个生物性鉴别特征。苹果真的会将声音信息存在自家的服务器上吗?

 

     即使是在一个隐私至上的时代,人们还是用苹果的语音助手SIri分享自己感兴趣的东西。记录下每个人独特的声音,问一些隐私的个人问题,又或是通过网络浏览苹果的服务器。然后,这些信息会被存储在那里;苹果也没说他们会存多久。

 

声音记录,不同于智能手机和电脑产生的大多数其他的数据,是一个具有生物身份识别的一个特征。声音指纹——如果不小心泄露,黑客窃取或者法院传讯——都能通过其找到本人。并且利用时下大量的音频识别应用,并不只有苹果才能存储此类数据。

 

也许有一种方法可以让这种生物特征更加隐私。研究者称拼过和其他的开发声音识别应用类似Siri只能处理手机上部分的声音数据。然后,并不发送全部的录音,他们可以发送这类特殊信息,但其并不能精确到个人。

 

也许其他的数据,比如ID你必须存在手机上。普恩·纳塔拉詹说道,他是剑桥Raytheon BBN技术公司的执行副总裁,公司也是一个语音识别主要研究中心。他说道苹果可能发送语音特征,而不是语音本身。

 

当这种解决方案却会加重手机处理器和电池的压力,但不会损伤语音识别的准确性。“我认为相比于可以接触到全部录音,这种方式更安全。”纳塔拉詹说。限制了这种生物特征数据的大量分享,一个例子就是微软的Kinect,为了让数据保存在本地做了优化。

 

特魯迪穆勒,苹果的一个发言人,确认了只要用户问语音问题比如“现在天气怎么样,"语音记录就会存储。这些数据都用于Siri的运行,旨在让Siri更好地理解话语含义。" 她说道。穆勒还说道,公司对于用户隐私“严格对待,”当提问和回答时,Siri经过网络的数据都是加密的,而且你的声音记录不会和苹果从你那里获得的其他 用户数据联系在一起。(Siri的确会上传联系人列表,地理位置,和本地音乐列表,因为这能帮助Siri更好地回答问题。)

 

声纹并不是和指纹那样具有唯一性,他们可以从很多圈子中找到类似的声音。美国国土安全部利用声纹识别系统鉴别频繁的边境口岸旅客,以提高效率。

 

为了明白为什么声纹能精确到个人,佛罗里达去年的凯西·安东尼的谋杀案,二岁女儿被杀,母亲凯利被判无罪释放。另一点,检察官还指出,在被 告的网络搜索记录里,发现了氯仿和为其他犯罪术语。安东尼的母亲也证实搜素过类似词汇,但是拼读成了“氯黄。”如果搜查Siri上的语音记录,他可以帮助 检察官和陪审团确认是否有搜索过“氯仿”。(苹果拒绝透露是否有收到任何人的声纹事件传票。)

 

同时,如果你说了一些不恰当的话或者问Siri一个敏感性事件苹果被黑(或者一个恶意员工披露的数据),不仅会使交流变得尴尬,也会是存在 你的声音里。纳塔拉詹说生物性特征能产生一些全新的隐私问题。比如,有些人会很难搜索到本地的反动组织,如果这些数据已经由政府所掌控。“如果你有一群人 问关于反动组织的问题,那么你会很不幸地被记录了声纹这种生物性特征。”他说道。

 

一些观察家,包括大型技术企业,正提出Siri更光范围的问题。上个月技术回顾报道IBM要求他的员工不要用这类应用,IBM的这个决定主 要是出于保护联系人列表和其它的公司敏感性问题的需要。这个问题,其它的组织也需要考虑到,一些专家相信。“如果我管理一家智能企业或者一个大型企业,我 不会允许室内有这样的服务存在。”拉杜·锡安,纽约州立大学石溪分校的一个电脑科学家,也是云计算安全领域的杰出研究者。

 

Siri的声音识别运行原理如下:你提一个问题或者要求,然后声音会发送到苹果的服务器。接着声音经过一个特征提取的过程,将声音分解成碎 片,并且讲数字转换成声波,提出一些相关的功能。这些都需要通过一个语音识别引擎来翻译你时所说话的含义。Siri接着利用这些资源包括网络,你的联系人 列表(“给爸爸打电话”),或者我们的地理位置(最近的泰式菜馆在哪里?)来回答你的要求。

 

无可置疑的是,为什么这些原始的分析工作不能够直接在手机上完成,那些材料就可以保存在本地。以间距模式为例,就要比分别出说话者重要,但并不是分辨出说 了什么。又一个技术厂商的观点,“你只需发送识别程序要用的东西,而不是全部的波频,”纳塔拉詹说道。虽然这可能并不是完美的解决方案,他说,“这可能有 助于保护隐私——并且,也许更重要,隐私部分,因为你不能仅从特征中就重组录音。”

 

詹姆斯·格拉斯,MIT的高级科学研究者,也是公司口语系统团队的领导者,他说,这种内建进程,也称为语言分布识别,现已广泛研究。它不能 提供完整的保护,他提高:“生物特征方法说明说话者都是可确定的。...尤其是用相似单一表达法,如同那些只做语音识别的人一样。所以本地处理(这个过 程)也不会让你的数据全部匿名,如果那是你的目标的话。”

 

他还补充了一个很简单的方法,匿名声纹就不会通过其他的数据联系到录音,比如电话号码。“它也意味这系统更加难以确定你的声音和查询,但是一些人还是可能喜欢,增多选项可以给他们更多的隐私,”他说道。“这是我希望提出的一点,就如同现在的一些应用会询问是否使用地理位置”

 

随着越来越多的声音应用大量出现在设置中,保护生物识别因素将会变得更加重要,安德鲁·萨德伯里说,Abine的联合也创始人,ABine 是波斯顿在线隐私软件公司,帮助消费者保护他们在线活动的安全。“这可以称得上是一个分水岭,在那方面,将会迎来语音识别在众多方面的一个快速发展。”他 说道,“并且它将会变得更加容易,通过声音来识别到个人。”

 

的确,有个原因苹果应该考虑,就是想存储完整的声纹,在提供类似服务时,应该设置一个选项。从理论上来讲,一个语音识别这能够知道是你的说话,而不是的配偶或者孩子,并且给你个人的剪辑回答。“它可能会非常酷,即使你从不同的电话打进来,他们也能识别出来。”纳塔拉詹说。

 

人们实际声音记录会产生大量的数据,那么什么才能实现这个可能呢。这种特征依旧太多,他提到。但是“现在没有人打算发明这样的东西,”他说道。“我也一样,希望可以接触到完整数据。” 

 

源:

转载于:https://www.cnblogs.com/shijianzhou/archive/2012/07/10/2585393.html

你可能感兴趣的文章
tp5 中 model 的聚合查询
查看>>
android wear开发之:增加可穿戴设备功能到通知中 - Adding Wearable Features to Notifications...
查看>>
压缩文件函数库(转载)
查看>>
【转】ubuntu12.04没有/var/log/messages解决
查看>>
Oracle EBS 初始化用户密码
查看>>
SYS_CONTEXT 详细用法
查看>>
Pycharm配置autopep8让Python代码更符合pep8规范
查看>>
函数的复写
查看>>
17_重入锁ReentrantLock
查看>>
winform窗口关闭提示
查看>>
64款工具,总有合适您的那款
查看>>
我的第一篇博客
查看>>
大数据学习线路整理
查看>>
【C++算法与数据结构学习笔记------单链表实现多项式】
查看>>
关于ProjectServer定制化项目中心页面
查看>>
使用Collectd + InfluxDB + Grafana进行JMX监控
查看>>
Linux下tar,zip命令详解
查看>>
C#垃圾回收机制
查看>>
31、任务三十一——表单联动
查看>>
Jenkins之Linux和window配置区别
查看>>