Skip to main content Start main content

理大高等研究院杰出学人讲座:中国科学技术大学科技商学院讲席教授张捷教授主讲「机器聆听:将人工智能从视觉延伸至声音与振动感知」

香港理工大学高等研究院杰出学人讲座系列

20260423 DL by Prof ZHANG Jie 1000 x 540 pxSC
  • 日期

    2026年4月23日

  • 主办单位

    香港理工大学高等研究院

  • 时间

    14:30 - 16:00

  • 地点

    香港理工大学李嘉诚楼十六楼教务会议室 (座位有限,先到先得) 地图  

讲者

张捷教授

查询

香港理工大学高等研究院 info.pair@polyu.edu.hk

摘要

虽然人工智能的发展是以视觉技术为主,但「机器聆听」(machine listening)——即机器对声音与振动讯号的解读——仍是有待深入探索的辅助领域。正如人类感知同时依赖视觉和听觉一样,整合这两种感知方式可以更全面地理解复杂的环境。机器聆听的发展能直接影响机器人、自动驾驶以及众多产业。宽带地震传感器(broadband seismic sensors)的听觉能力,远超人类感知范围,能同时捕捉空气或流体中的声压波,以及在固体中传播的弹性波,并覆盖更广阔的频率范围。这些传感器甚至能侦测如铅笔折断般细微的振动,并透过结合物理模型、深度学习与大规模数据分析,实现实时监测。我们提出的「视觉–地震」联合感测框架,可生成交通系统、基础设施健康、人类活动与环境过程的详细数字记录。这种「超人类听觉」能力为变革性应用开辟新路径。透过将视觉和听觉融合,机器听觉有望推进人工智能感测技术的前沿发展,从而促进社会韧性与可持续发展。 

20260423 DL by Prof ZHANG Jie 560x860

张捷教授

美国国家工程院院士
中国科学技术大学科技商学院讲席教授

 

张捷教授,中国科学技术大学科技商学院讲席教授,美国国家工程院院士,从事地球物理学、人工智能听觉、城市安全监测等领域的科研和产业转化事业,发表220余篇学术论文,拥有40项专利,领导研发20余项科技产品。1986年获中国科大学士学位,1996年获美国麻省理工学院(MIT)博士学位。1998年起先后在美国创建多家高科技企业,2008年起先后在麻省理工学院、史丹福大学、中国科大任教。曾荣获美国总统颁发的「新星奖」,国际勘探地球物理学会(SEG)颁发的Reginald Fessenden科技成就奖等10余项奖,2015年获选「中国商业最具创意人物100」第一名(美国商业月刊Fast Company评选),2020年因「推动了地震学,勘探地球物理学和医学的发展」当选美国国家工程院院士。曾任国际勘探地球物理学学会(SEG)执行副主席、麻省理工学院指导委员会委员,麻省理工学院亚洲商学院执行董事,现任SEG基金会董事。

 

个人网页:https://faculty.ustc.edu.cn/zhangjie/zh_CN/index.htm

您的浏览器不是最新版本。如果继续浏览本网站,部分页面未必能够正常运作。

建议您更新至最新版本或选用其他浏览器。您可以按此连结查看其他相容的浏览器。