今早看了科技前沿简报,感叹人工智能的发展速度。在之前爆出的加水就能开车的研究成果,现在又出现了AI 能够通过你的声音,推测出你长啥样!(当然,现在好像亚洲人还无法做到......); 只需要一滴唾液或者汗液,就能诊断你的压力有多大...

到底是种怎样的黑科技,赶紧来瞅瞅。

MIT:听音辨别人的长相

近日,麻省理工学院人工智能实验室(MIT CSAIL)发布了一项令人惊叹的研究——只需要听6秒钟的声音片段,智能AI就能推断出说话者的容貌。

听音辨形

其实,从声音推断一个人的长相并不是玄学,平时我们在打电话的时候,会根据对方的声音脑补出相貌特征,这是因为年龄、性别、嘴巴形状、面部骨骼结构等,都会影响人发出的声音。此外,语言、口音、速度通常会体现出一个的民族、地域、文化特征。

智能AI 正是根据语音和相貌的关联性做出推测。为此,研究人员提取了几百万个 YouTube 视频,通过训练,让深度神经网络学习声音和面部的相关性,找到说话的人一些基本特征,并还原出相貌。在这个过程中,不需要人类标记视频,由模型自我监督学习。

当然,这个模式还不是很完善,该研究也出现了翻车的情况。例如让一个亚洲人分别说英语和中文,结果分别得到了一张西方人面孔和一张中国人面孔。还例如变声期之前的儿童,也会导致模型误判性别发生错误。毕竟老外研究的成果,还不能覆盖咱们亚洲人的声型。不知我们国内有没有研究机构在探索呢?

智能AI的发展,让各种人工智能领域研究成果展现在我们面前,在惊叹技术的先进性的同时,我们还能看到这种发展趋势对我们生活的影响。现在这个影响主要体现在我们平时生活里的方方面面,比如购物,金融,家居等等。

首先讲讲大家接触最多的天猫精灵,这是阿里首款人工智能语音AI终端设备,天猫精灵内置AliGenie操作系统,AliGenie生活在云端,它能够听懂中文普通话语音指令,目前可实现智能家居控制、语音购物、手机充值、叫外卖、音频音乐播放等功能,带来人机交互新体验 。依靠阿里云的机器学习技术和计算能力,AliGenie能够不断进化成长,了解使用者的喜好和习惯,成为人类智能助手。家里放一台天猫精灵,同时家具都和天猫精灵对接的话,可以实现声控各种家庭设备,比如语音开关灯,开关电视,开关窗帘等等,智能AI的进化,已经让我们对高科技智能未来生活初见端倪。

天猫精灵

在金融方面,主要接入的智能化终端主要是刷脸应用。在去年,工商银行就宣布,正式推出人脸识别系统,你取钱只要对着ATM让其扫描你的面部即可。也就是说不需要身份证、不需要银行卡,脸朝窗口一笑,按提示操作几下钱就自己“吐”出来!“刷脸”就可以取走钞票,无疑比传统的刷卡取款更加便捷,我们不用再担心银行卡丢失的问题,对于上了年纪或者不会使用ATM的老年朋友都是非常方便的;而对于银行来说,能降低伪卡风险、减少设备吞卡数量,提升客户体验与满意度。