ICASSP 2022|快手联合发起的深度3D音频信号处理挑战赛成绩正式发布

近日,由快手音视频技术部联合意大利罗马第一大学(SapienzaUniversityofRome,Italy),在国际音频顶级会议ICASSP2022上发起的深度3D音频信号处理挑战赛(L3DAS22:Machi…

  近日,由快手音视频技术部联合意大利罗马第一大学(Sapienza University of Rome, Italy),在国际音频顶级会议 ICASSP 2022 上发起的深度3D音频信号处理挑战赛(L3DAS22:Machine Learning for 3D Audio Signal Processing)成绩正式发布。此次比赛共有来自全球近 50 支学术界和工业界团队报名,比赛成果将在今年 5 月 ICASSP 2022 大会的 Special Session 上进行分享。

  作为第一届L3DAS21 比赛的冠军,快手音视频技术部音频算法团队在深度学习的音频信号处理方向上持续探索。此次团队联合意大利罗马第一大学发起挑战赛,旨在提供一个通用的数据集和公平的测试平台,促进真实场景下3D深度音频信号处理核心技术的研究。基于深度学习的3D音频信号处理技术引起学术界和工业界广泛关注,在虚拟和真实会议、游戏开发、音乐制作,自动驾驶及监控等领域深入应用。相较于单通道音频,3D音频携带的增量三维声源方位信息,有助于提升语音和情感识别、声源分离、语音增强和去噪,以及声学回声消除算法的效果。

ICASSP 2022|快手联合发起的深度3D音频信号处理挑战赛成绩正式发布

  本次挑战赛共设置了两个任务:

  任务一:多通道3D语音增强任务,专注于办公场景下的实时语音增强需求。

  任务二:真实场景下特定声源检测和定位任务,专注于自动驾驶、监控等应用场景。

  经过近三个月的激烈角逐,挑战赛结果正式出炉。任务一中,卡耐基梅隆大学、百度和腾讯分列前三名;中科院声学所、重庆邮电大学和新加坡ForteMedia分列任务二的前三名。同时,快手将为每个任务的前两名团队提供丰厚奖金。此次挑战赛数据集模拟了40, 000 余个3D环境,提供了 2 组 Ambisonics 格式的3D录音。参赛团队的成绩通过语音可懂度指标(Short-Time Objective Intelligibility, STOI)和单词错误率(Word Error Rate, WER)两个指标进行综合评定。

ICASSP 2022|快手联合发起的深度3D音频信号处理挑战赛成绩正式发布

  图1:任务一: 语音增强比赛成绩

ICASSP 2022|快手联合发起的深度3D音频信号处理挑战赛成绩正式发布

  图2:任务二:声源检测及定位比赛成绩

  快手音视频技术部汇聚了音频领域顶尖人才,结合快手业务推进了前沿算法的应用和落地,深入实时语音通信、音频音效及后处理、音频内容理解、音频编解码、音频硬件等多个领域。团队成员在IEEE ICASSP、Interspeech、ACM/IEEE TALSP等顶级学术会议和期刊上,均有发表系列学术论文,并多次斩获音频挑战赛冠军。

  快手定义的“音视频”不局限于画面观感,更强调“视”“听”统一的极致体验。在不同场景中,快手音视频技术部通过将丰富的音频处理能力与视频处理能力相结合,自动形成算法决策,为用户呈现真正的视听盛宴。对于前沿技术,团队将持续投入研发与探索,保持领先,以应对更为丰富多元的应用场景。

  比赛官网: https://www.l3das.com/icassp2022/results.html

声明:该文观点仅代表原作者本人,巴拉号系信息发布平台,仅提供信息存储空间服务。

(0)
上一篇 2022年1月28日 21:02
下一篇 2022年1月28日 21:02

相关推荐

  • 淘宝618将上线元宇宙购物:立体化“逛淘宝”

    一年一度的618就要来了,随着元宇宙概念的火爆,今年淘宝也将试水元宇宙购物”。Tech星球从淘宝内部人士处获悉,为了备战此次618,淘宝内部成立了元宇宙专项项目组,正连夜优化虚拟购物会场,将在618期间上线元宇宙购物。据了解,淘宝…

    业界 2022年5月26日
    26
  • 予力AI开发者,繁荣创新生态,上海临港这场盛会有哪些精彩内容?

    2月26日,以「构建融通开放新生态」为主题,WAIC2022上海人工智能开发者大会在上海临港新片区创晶科技中心顺利举办。上海市副市长张为出席会议并为WAIC上海开发者社区揭牌。上海市经济和信息化委员会主任吴金城和临…

    站长 2022年3月1日
    27
  • 谷歌收购MicroLED显示屏公司Raxium用于AR头显

    5月5日消息,据国外媒体报道,谷歌证实已收购拥有MicroLED技术的初创公司Raxium,将有助于其打造新一代增强、虚拟和混合现实头显,具体金额尚未透露。Raxium将加入谷歌的设备和服务团队。据悉,Raxium的团队花了五年时…

    业界 2022年5月5日
    34
  • 元宇宙第一批打工人:捏脸师月薪达4.5万

    捏脸师,即虚拟头像创作者,也被称为捏头师”,是在社交平台孕育出的一种新型职业。据央视网消息,捏脸师最高月入近4.5万元。在元宇宙概念火爆的当代,捏脸师可以说是元宇宙的第一批打工者,而拥有自己专属的虚拟头像往往是元宇宙里重塑第二身份…

    业界 2022年3月9日
    35
  • 八点八数字再获数百万元融资 首创虚拟人内容创作平台X-Men

    近日,八点八数字宣布获得拉尔夫创投数百万元PreA+轮融资,这是近两月内继宝通科技(海南元宇宙)投资后的又一笔融资。八点八数字创始人耿广星表示,本轮融资将主要用于优化无代码智能化虚…

    站长 2022年6月20日
    13
  • 研究人员尝试让互联网数据传输速度超过光速

    在丹麦独立研究基金的资助下,一个由来自工业界和奥胡斯大学的研究人员和专家组成的团队将尝试解决一个基本问题,即光速对于技能互联网来说根本不够快。人类技能在未来将通过技能互联网实现数字化和民主化:未来的互联网将允许你利用机器人技术和触…

    业界 2022年5月17日
    36

联系我们

联系邮箱:server#timitao.com
工作时间:周一至周五,10:30-18:30,节假日休息