启明星辰ADLab:智能音箱网络安全与隐私研究报告
发布时间 2019-07-10
目 录
一、市场发展与未来趋势
二、技术发展
2.2 语音交互技术
2.3 组网模式
2.4 安全及隐私风险研究的必要性
三、智能音箱安全风险与案例分析
3.1.1 开放的调试接口
3.1.2 内置的后门
3.1.3 未授权的开放端口
3.1.4 开放未授权的DLNA(Digital Living Network Alliance) 服务
3.1.5 代码缺陷
3.2.1 APP申请过多的权限
3.2.2 APP通信
3.3.1 设备间互联互通协议
3.3.2第三方内容审核
3.3.3声纹识别算法缺陷
四、隐私风险
4.2 过多的权限
4.3 音箱的日志信息被泄露
4.4 录音信息可以被长期跟踪学习
4.5 API敏感信息泄漏风险
4.6 用户无法管理自己的隐私信息
2014年11月,亚马逊低调发布一款智能音箱Echo,它标志着智能音箱市场发展的开始。2015年销量达到250万台,2016年的销量达到520万台,也因此凭借不俗的销量一举超越传统音箱领头羊Sonos,夺得在线音箱行业市场销售头把交椅。一度在智能音箱市场细分领域占据了极大部分的市场份额。亚马逊发布的智能音箱Echo受到了市场强烈反应,引发了全球智能音箱热潮。随后谷歌公司在2017年5月份也发布了自家的智能音箱产品Google home。紧跟着,苹果公司在2017年发布智能音箱HomePod。随着国外各大巨头厂商相继发布各自的智能音箱产品,国内厂商也紧追其后,纷纷入场布局。首先京东和科大讯飞合作推出了“中国版Echo”叮咚音箱,随后酷狗、阿里巴巴、小米、百度、华为等企业也先后跟进,陆续通过自研或者合作的方式入局。
全球智能音箱市场发展飞快,快速爆发,2017年全年出货量达到了3220万台中国智能音箱市场增长迅猛,目前已经成为全球第二大智能音箱市场。
智能音响是传统音箱升级的产物,家庭消费者可以通过它上网点播歌曲,上网购物,亦或是了解天气预报,定时闹钟,新闻资讯等。它也可以对智能家居设备进行控制,比如打开窗帘,设置冰箱温度,提前打开热水器升温等,这种智能音箱是接入了智能家居网络中可以进行的操作。其实智能音箱核心比较简要,就是让机器在语言对话这一环节拥有近似于人类的识别能力,并渗入到人们的日常生活中。
2.1 智能音箱功能
图1 智能音箱功能示意图
智能音箱不同于传统音箱,它将是物联网世界的语言入口。
2.2 语音交互技术
图2 智能音箱识别准确率
2.3 组网模式
图3 组网示意图
2.4 安全及隐私风险研究的必要性
人类的语音内容中包括了丰富的个人信息。通过语音内容,分析人员可以获得个人的年龄、性别、籍贯、健康情况、周围环境等个人敏感信息。所以智能音箱的语音采集及利用涉及到敏感的个人隐私问题。
隐私权是人的基本人权,公众有权利了解自己的个人信息是如何被采集的,什么时候被采集的,在哪里被采集,公众有权利决定自己的个人信息如电采集,保存及使用方式。随着民众自我保护意识的提高及法律的进步,加强个人信息安全及隐私保护的呼声也越来越高。
2018年,欧盟开始实施GDPR法案,要求企业必须保障个人隐私安全。
近年来,关于智能音箱涉及的安全及隐私问题也常常见报端。
图4 智能音箱个人信息泄露报道
启明星辰在对音箱的安全研究期间,共向CNVD(国家信息安全漏洞管理平台)及CNNVD(中国国家信息安全漏洞库)提交了十多个设备安全漏洞,部分设备的编号及说明如下表所示。
漏洞编号 |
漏洞危害 |
漏洞级别 |
CNVD-2019-13611 |
完全控制设备 |
高危 |
CNVD-2019-06254 |
完全控制设备 |
高危 |
CNVD-2019-05626 |
完全控制设备 |
高危 |
CNVD-2019-05625 |
完全控制设备 |
高危 |
CNVD-2019-07688 |
播放恶意音频 |
中危 |
CNVD-2019-09098 |
完全控制设备 |
中危 |
CNVD-2019-12775 |
内容窃听 |
中危 |
CNVD-2019-12111 |
信息泄露 |
低危 |
CNVD-2019-13278 |
信息泄露 |
低危 |
CNVD-2019-15526 |
播放恶意音频 |
低危 |
3.1 设备端
3.1.1开放的调试接口
图5 开放的调试接口
3.1.2 内置的后门
3.1.3未授权的开放端口
部分音箱开放了部分的开放端口,通过这些开放端口,利用未授权的开放端口,攻击者可以控制音箱播放恶意音频或者进行录音。
图7 未授权的开放端口
3.1.4 开放未授权的DLNA((DigitalLiving Network Alliance) 服务
图8 开放的DLNA服务
3.1.5 代码缺陷
图9 获取playurl
图10 任意命令注入执行
图11 成功开启telent服务
3.2 APP侧
3.2.1APP申请过多的权限
APP申请权限过多的问题比较严重,在我们测试的国产音箱中,该问题全部存在。其中过度的权限包括但不限于APP读取短信,读取手机的识别码,发送/读取短信/彩信的权限,打开摄像头的权限,读取用户通话记录及已手机已安装应用信息,拨打电话,使用呼叫转移,读取运动数据的等敏感权限。
图12 敏感权限
3.2.2 APP通信
通信协议未加密问题,使得攻击者可以利用这些暴露的安全问题,获得设备的控制权。
图13 APP通信抓包
3.3 设备互联及第三方服务
3.3.1 设备间互联互通协议
在智能家居的场景中,智能音箱起到了控制中心的地位,智能音箱通过识别用户的语音命令,通过智能家居的互联协议控制其他家居设备。我们在研究智能音箱的时候,发现部分厂家在智能家居设备的互联协议中没有采用必要的安全审核机制,特别是设备和设备之间合法性验证。攻击者利用这些设计缺陷就可以窃取音箱的语音命令内容或者非法控制其他智能家居设备。
3.3.2第三方内容审核
由于智能音箱的使用者,很大一部分是儿童。因此对智能音箱来说对音频回复内容的审核应该要有一定的敏感内容防护,不能回复反动音频或者是粗口内容。在我们研究的过程中,我们发现个别音箱在处理内容识别时,缺少必要的防护,使得在一些特定的中英混合问题的场景中,智能音箱会回复粗口的内容。
3.3.3声纹识别算法缺陷
4.1 误唤醒
在音箱的使用场景中,只有用户唤醒音箱后,音箱才能收集用户的语音信息。而由于有些音箱的唤醒算法存在缺陷,使得音箱经常在未被唤醒的情况下,自行唤醒,并且收集用户语音,上传到后台进行识别。这样会使得用户的隐私存在泄漏风险。在我们测试的音箱中有五款智能音箱存在不同程度的误唤醒情况。占比达到56%。
4.2 过多的权限
APP申请的包括APP读取短信,发送短信的权限,摄像头的权限,通话记录及已安装应用信息,使用呼叫转移,读取运动数据的等敏感权限。
在音箱的使用场景中,在天气预报的时候需要获取用户所在的城市的位置,在一般的使用情况下,只需要音箱的外网IP地址即可获取用户的地区位置,而某些音箱除此之外还获取用户家中路由器的WIFI的BSSID信息及GPRS位置信息。
4.3 音箱的日志信息被泄露
某些音箱每天会上传用户音箱的系统日志信息,这些日志信息不仅包括音箱的日常使用信息,还包括了音箱所在局域网的WI-FI的密码信息。
4.4 录音信息可以被长期跟踪学习
在我们研究的这些音箱的远场音频处理模块会对设备的采集过程中,会对同一设备采集的音频会偷偷打上唯一标识。这些语音文件保存到云端后,第三方厂家在进行语音分析及AI建模时,可以通过隐藏的声音标识定位到个人,可以对同一家庭成员的声音进行追踪,可以对个人的语音特征变化进行长时间的跟踪和学习。
4.5 API敏感信息泄漏风险
智能音箱的产业链中包括了音箱设备厂家、语音识别及语音合成平台厂家、远场音频处理厂家、NLP算法厂家、音频内容提供商、外围设备商等。
在智能音箱厂家与产业链厂家交互中API,包括用户的手机号,详细地理位置,WI-FI的BSSID,MAC地址等用户隐私信息,而这些信息对于产业链厂家来说不是业务所必须的。
4.6 用户无法管理自己的隐私信息
用户有权利决定自己的个人语音信息在云端的保存。厂家应为用户管理这些隐私信息提供服务入口。
国外的智能语音设备厂家如亚马逊在APP侧及音箱侧为用户提供了删除云端个人录音。亚马逊音箱用户只需要对音箱说“Alexa,删除我今天所说的一切”。亚马逊将会删除在云端保存的用户录音。
通过对多款智能音箱进行深入地研究,我们总结出五个方面的安全问题,分别为安全风险、设备端、APP侧、外接设备及第三方组件以及隐私风险。
设备端问题主要是智能设备开发板暴露出调试串口,可以通过调试器将设备中的固件独读取出来进行逆向分析,导致固件泄露。
APP侧问题主要是存在被逆向分析的风险,我们在研究过程中,对多款智能音箱的手机端app进行了逆向分析,发现了很多关键问题,例如,设备和云服务器之间的通信协议。智能音箱中使用通过第三方协议进行局域网音频播放,而使用的第三方协议是没有进行设备认证的。
最重要的一个安全问题就是隐私问题,我们发现多款设备都存在收集用户信息并打包回传云服务器的功能。其中有的设备被攻击后,在用户不知晓的情况下,可以进行录音操作。甚至还能回溯用户的使用痕迹和语音痕迹。
针对这些安全问题,需要一一进行防护。APP侧要使用加固手段,防止被逆向分析,将一些关键协议的实现放到native层实现。对于外接设备及第三方组件,智能设备厂商需要对第三方厂商的安全准入进行把关。
隐私问题是一个大问题,同时也是一个广泛的社会问题,厂商可能通过收集用户使用信息来分析用户行为以便更好的提供服务,但应当考虑隐私边界。同时对于收集到的用户信息应做到加密,不能只管收集不管保护,厂商应该承担起自己的社会责任。
全国政协委员、启明星辰集团CEO严望佳在2019 全国政协会议上提交了三个提案,其中《关于加快完善数字经济时代数据法治建设的提案》和《关于规范人工智能安全健康发展的提案》与个人隐私相关。这两个提案建议加快《数据安全法》工作及《个人信息保护法》工作,加快开展人工智能安全应用法规和伦理道德研究及应用安全测评工作。