导航菜单
首页 » 下午茶时光 » 正文

吾爱破解-可通过人声判别人脸的人工智能

不论是电影预告片的配音吾爱破解-可通过人声判别人脸的人工智能员,仍是地铁上的播音员,咱们的日子中都充满了“看不到脸”的声响。咱们大多数人在听到这些声响的时分,或许会对背面的面庞做一些简略的想象,但麻省理工学院的一组研究人员却做到了更进一步:他们发明了一个人工智能体系,只是经过听人的声响就可以重建吾爱破解-可通过人声判别人脸的人工智能人的面孔。

这个名为Speech2Face的应用程序背面的技能原理是利用了一个深层的吾爱破解-可通过人声判别人脸的人工智能神经网络,该网路经过调查YouTube上数百万人们攀谈的视频,练习并辨认声响和面部特征之间的相关性。在此过程中,它学会了将音频波形的不同方面与发声者的年纪、性别、种族以及某些头部特征联系起来,比方像头部的形状和鼻子吾爱破解-可通过人声判别人脸的人工智能的宽度这些。

然后,当研究人员将人们的声响录音输入体系时,体系可以以合理的精确度生成每个说话者的面部图画。明显,发型、面部毛发以及其他一些表面特征是无法从一个人的声响中猜测出来的,因而开发人员坚持以为,他们的方针不是猜测精确面孔的可辨认图画,而是捕捉与输入语音相关的人的首要仙儿为什么不捧卡尔了面部特征。

在一篇宣布在IEEE Xplore上的论文中,研究人员说这项技能总有一天能带来较大的实用性,例如,不需求摄像头就可以生成视频通话的面孔。

话虽如吾爱破解-可通过人声判别人脸的人工智能此,体系也需求一些改善,由于Speech2Face创立的图画一般与面部类型大体匹配,但有一些纤细的差之处仍是难以判别。该体系也偶然简单犯吾爱破解-可通过人声判别人脸的人工智能错,比方会将大约6%的声响生成的人脸弄错了性别,抑或是弄错了种族。

本文译自 iflscience,由译者 Imagine 根据创造共用协议(BY-NC)发布。

二维码