上海交通大学张文明团队Science Advances:声学超球面概念,追踪复杂环境中的微弱声源!
陈虎越 纳米人 2022-10-13
“声超球⾯,逖听远闻。”


1665625654828866.png

“若伏在地下,⼀霎时,将四⼤部洲⼭川社稷,洞天福地之间……可以照鉴善恶,察听贤愚。” 神话传说中,谛听是地藏菩萨的通灵瑞兽,技能是超凡的“听觉”,能⽤来辨认世间万物,尤善听⼼。《⻄游记》中,它⼀听便知“真假美猴王。


1665625669747402.png

“物竞天择,适者⽣存。” 在⾃然界中,也有⼀位听⾳辨位的⾼⼿——猫头鹰。它们利⽤双⽿不对称性(⽿孔⾼度、⽿道宽度、敏感频率)来判断声⾳的⽔平⽅向和垂直⾼度。猫头鹰在⿊夜中搜寻猎物时,它对声⾳的第⼀反应是转头。270度的⼤范围转⻆使它可以⾃由控制声波到两⽿的时间差,⼀旦超过30 ms,猫头鹰就能准确定位声源⽅位。同时,它独特的“凹形”⾯部,可以帮助引导声⾳到⽿朵开⼝处,像放⼤器⼀样收集声波。

1665625683650157.png

2022年9月28日,上海交通大学机械与动力工程学院张文明教授团队提出了声学超球面的新概念,基于超球面缺陷腔阵列局域共振和波束形成原理,率先设计出一种声学超球面声音传感器,展示了全向拾音、声压放大、声源追踪、高性能音频克隆和语音识别等多项功能,即使在强背景噪声环境中也能定位和识别相邻角度的声源,实现了卓越的人机声交互性能。相关成果以“A wave-confining metasphere beamforming acoustic sensor for superior human-machine voice interaction”为题发表于《Science Advances》 。上海交通大学机动学院博士生马珂婧和密西根学院博士生陈虎越为共同第一作者,密西根学院副教授邵磊为共同通讯作者。共同作者包括吴志渊、郝翔翎、颜格、李汶柏、孟光。

1665625903555657.png
声学超球面及声电耦合效果

对话不仅是人际交流最常见和最轻松的方式,也是智能人机交互技术的重要发展方向。这一技术需要同时具有超高信噪比和灵敏度的声学传感器,并能够在嘈杂环境中精确识别、定位和追踪多个语音。目前,商用麦克风和新兴的超高灵敏度薄膜传感器都无法解决声波在空间内快速耗散的根本问题,各种智能音箱和会议室全向麦克风都时常难以有效拾音。而声学超材料拥有调制和操纵声波的无限可能性,已被证明能用于声波的放大和分离。然而,如何用声超材料同时实现:1)人声频率范围内的超高信噪比和灵敏度参数;2)多个声源的被动放大、分离和定位,并实现实际应用场景中的使用,是语音传感和交互识别领域的重要挑战。

1665625923513366.png
声学超球面的设计概念和物理机制

研究团队提出了一种“声学超球面(acoustic metasphere)”的概念,并构建了近似的正十二面体声学超材料及缺陷腔结构来验证其声振特性。此策略基于局域共振原理,将声波约束在每个正五边形中心的缺陷位置,被动的引导并放大声波,可以获得两倍于发射端的声场强度,在远距离感知场景下弥补声波在空间的快速、大幅耗散。利用缺陷腔内低噪的压电转换性能,同时实现了优异的信噪比(72 dB)和卓越的灵敏度(137 mVpp/Pa 或 -26.3 dBV)。因此,研究团队实现了优异的音频克隆、身份验证和语音识别等多种人机交互功能。

1665625939769272.png
会议协助:空间多声源与不同角度

同时,基于缺陷腔阵列,结合波束形成算法和机器学习算法,研究团队还实现了多个声源的实时定位和追踪,并展示了线上会议协助和工厂巡逻搜救等多个应用场景下的强大功能。声学超球面系统不仅成功识别了空间内相邻角度同时发声的多位用户,还可以追踪被强烈背景噪音淹没的人声。即使是空间内多个相邻角度声音信号严重混杂的情况下,声学超球面也可以基于归一化能量图谱来分辨不同的声源信息和所在方位。

该研究利用物理智能构建了多功能空间全向声学超球面传感器,结合多种智能算法来优化系统功能,实现了多场景的卓越人机语音交互系统,为发展新一代智能机器人听觉系统和人机语音交互技术提供了新思路。

1665625953821771.png
工厂搜救:强背景噪音与移动人声追踪识别

因此,声学超球⾯改⾰现有的全向⻨克⻛阵列,实现卓越的⼈机语⾳交互。“松⽉⽣夜凉,⻛泉满清听。”我们学习⾃然,超越⾃然,理解科学,并创新科学。

该论文研究单位为上海交通大学。研究工作受到了国家自然科学基金重点项目、青年基金项目和上海市科技创新行动计划港澳台科技合作项目的资助。

邵磊,上海交通大学密西根学院助理教授,博士生导师。2014年在美国密西根大学获得博士学位,2014年至2018年在美国国家标准技术研究院从事博士后研究工作。主要从事微机电系统(MEMS)器件和芯片、传感器、驱动器方面的研究。相关成果已发表在 Science Advances, Nature Communications 等国际顶级期刊。


张文明,上海交通大学特聘教授,博士生导师。国家杰出青年科学基金获得者、教育部霍英东青年基金获得者,国家“万人计划”中组部青年拔尖人才、科技部中青年科技创新领军人才、上海市优秀青年学术带头人、上海市曙光学者、上海市青年科技启明星。

长期从事动力学设计理论与控制技术研究和教学工作,主持国家自然科学基金重点项目、国家科技重大专项课题、国防科技创新特区项目等30多项,在Science Advances、Nature Communications 等期刊上发表论文200余篇,出版学术专著2部;授权国家发明专利和软件著作权50多项;获教育部自然科学奖一等奖、中国振动工程学会青年科技奖、“上海市青年五四奖章标兵”称号等。

论文链接:https://www.science.org/doi/10.1126/sciadv.adc9230
加载更多
1242

版权声明:

1) 本文仅代表原作者观点,不代表本平台立场,请批判性阅读! 2) 本文内容若存在版权问题,请联系我们及时处理。 3) 除特别说明,本文版权归纳米人工作室所有,翻版必究!
纳米人
你好测试
copryright 2016 纳米人 闽ICP备16031428号-1

关注公众号