导语
7月26日,备受瞩目的2025世界人工智能大会(WAIC)在上海盛大启幕,清听声学携前沿技术聚音屏惊艳亮相,以定向发声与定向拾音的核心技术,展现新型音频技术赋能人工智能与具身智能的创新成果。聚音屏刷新人机交互形式,为下一代智能终端打开全新交互维度,精准契合AI与具身智能发展趋势,成为AIGC领域的重要推动者。
作为全球人工智能领域规格最高、规模最大、影响力最广的顶级盛会,本届WAIC吸引来自全球50多个国家和地区的顶尖学者、行业领袖及创新企业。在大会的“未来AI会客厅”展区,联想创投携手多家被投企业共同描绘了一幅AI赋能下的未来图景,而“聚音屏”无疑是其中最引人注目的技术之一。
聚音屏精准控制声音传播方向,让用户在开放环境中享受私密、清晰的听觉体验,无需佩戴耳机即可实现“声音的私人定制”。结合定向拾音技术,还能智能过滤环境干扰噪声,精准捕捉目标声音,提高语音识别准确率和沉浸感,不仅提升AIGC内容生成的质量,还为智能助手、虚拟数字人、沉浸式游戏等场景注入更自然、更高效的交互方式,助力AIGC生态全面繁荣。
赋能AIGC
打造沉浸式、个性化内容体验新范式
传统嘈杂环境是AIGC语音交互与具身智能感知的主要桎梏,而用户对音频体验沉浸感和个性化的更高要求,更是AIGC成功落地的关键。清听声学以声学黑科技破局,提供完美解决方案。
想象一下,在未来的家庭娱乐中心,一位用户正与AIGC生成的虚拟偶像进行实时互动。借助聚音屏,虚拟偶像的声音可直接、清晰地传递给这位用户,同时不会打扰到正在客厅另一侧阅读的家人。这种专属的、私密的听觉通道,极大地增强了人机交互的沉浸感和真实感。
在服务台、接待处、问询处等公共空间,AIGC结合“聚音屏”的应用将为参观者带来颠覆性的体验。当用户来到问询台,AIGC能精准识别并拾取用户咨询的问题,自动生成回复内容,并将回复声定向投送给这位用户,实现“一人一导览”的个性化服务,彻底改变公共信息获取的方式。
颠覆性人机听觉体验
从“听到”到“听懂”的声学革命
在AIGC驱动的智能化浪潮中,人机交互界面的创新至关重要。聚音屏重新定义人机听觉感知和交互,无论是智能客服、数智讲解员、虚拟主播,还是教育、医疗、金融等行业的AI应用场景,都能显著提升交互效率与用户满意度。
在复杂的现实环境中,精准理解人类,对机器人来说是一个巨大挑战,传统的拾音系统会拾取来自四面八方的声音,而搭载聚音屏的定向拾音技术,则可以像“声音的聚光灯”一样,精确捕捉来自特定方向的声音,有效过滤掉周围环境的噪音。
例如,在嘈杂的大厅环境中,用户可以通过简单的语音指令,精确地控制机器人。机器人搭载的“聚音屏”系统能够精准地“听”到用户指令,而忽略掉嘈杂的环境噪声和其他语音干扰,这种沉浸式、个性化的听觉体验,不仅满足了AIGC对高质量内容生成的需求,也为具身智能设备赋予了更人性化的交互能力。
2025年被业界视为具身智能与AIGC技术融合的关键年份,清听声学通过“定向音频”破解音频交互难题,以其前瞻性的技术布局,正站在这一浪潮的前沿。作为联想集团的战略生态合作伙伴,聚音屏将继续深耕定向音频技术,探索更多AIGC应用场景,如智能家居、自动驾驶、虚拟现实(VR/AR)等,为用户带来更智能、更个性化的交互体验。同时,聚音屏致力于与全球AI生态伙伴合作,共同推动人工智能技术的普惠化与产业化发展。
此次亮相WAIC 2025,不仅展示中国声学技术的创新实力,也为推动AIGC与具身智能的落地应用提供了“听得见”的解决方案,展现了与AIGC、具身智能融合的无限可能。在“同球共济”的时代愿景下,清听声学正以创新之声,书写AIGC时代新的篇章。