近期,哈尔滨工业大学深圳校区赵毅教授与其博士生王一峰带领研究团队设计了一种生成式深度学习架构,它可以显著提升惯性传感器的信号质量。相关成果发表于人工智能顶级会议International Joint Conferences on Artificial Intelligence (IJCAI),这也是IJCAI历史首篇IMU信号增强论文。哈工大深圳校区数学系博士生王一峰为第一作者,赵毅教授为通讯作者,哈工大深圳为第一作者单位和通讯单位,研究同时受到新加坡国立大学的技术支持。
引用格式
Yifeng Wang, Yi Zhao. Scale and Direction Guided GAN for Inertial Sensor Signal Enhancement[C]//IJCAI. 2024: 5126-5134.
本文提出了一种基于无监督和弱监督学习的尺度和方向引导生成对抗网络(SDG-GAN),用于低成本惯性传感器信号增强,通过动作捕捉精确记录的运动信息作为辅助任务的标签,显著提升了信号增强的性能和精度。
研究背景
惯性传感器在航空航天、无卫星导航、国防军事、无人驾驶、可穿戴设备等领域都有着广泛的应用与重要的价值。然而其固有的噪声问题限制了惯性传感器对物理运动的捕捉与感知。因此,王一峰等人提出了一种生成式深度学习模型:尺度和方向引导的生成对抗网络(SDG-GAN)。
研究亮点
在该研究中,作者为生成式AI设计了两种引导机制:尺度引导、学习方向引导。尺度引导机制允许生成器在不同分辨率下同时处理信号特征,确保生成的信号在不同尺度上的一致性。这种引导机制不仅有助于生成模型同时关注到不同分辨率下的信号特征,并且可以通过不同尺度间的一致性约束缓解生成式人工智能模型的幻觉问题。
图1 尺度引导示意图
当前人工智能发展的主流架构是深度神经网络(深度学习)模型,尽管它极大地推动了社会的发展与进步,但作为一种黑盒模型,它的可解释性与可控性较差。本研究为深度学习架构提出了一种学习方向引导机制,它在训练过程中动态调整深度学习架构中不同任务之间的相互影响,控制不同模块的学习方向与学习进度,最大化AI架构中不同组成部分间的协作效率,最终获得更加智能的生成式神经网络模型。
图2 学习方向引导示意图
应用前景
作为两种面向深度学习架构的普适性改进,论文提出的尺度引导与学习方向引导不仅适用于高质量惯性传感器信号生成,同样可以赋能其他领域的信号质量提升。例如,在通信技术中,SDG-GAN可以用于提高音频、视频信号的清晰度与精确度。同样地,在工业监控中,将SDG-GAN应用于工业信号的质量增强可以提高监控和预警系统的可靠性。在医学领域,心电、脑电等医学信号往往受到来自患者运动、设备噪声或环境噪声的干扰,这给医生的诊断带来了挑战。通过引入SDG-GAN模型,医学数据的精度有望得到进一步提高,从而辅助医生作出更为准确的诊断。此外,随着医学影像技术的发展,CT和MRI等图像的质量也面临增强需求,尤其是在设备性能受限的情况下。SDG-GAN的自适应学习能力有望为医学影像的清晰度和可解释性提供技术支持。SDG-GAN还可以应用于自动驾驶和智能机器人领域。这些领域依赖多模态传感器信号进行环境感知与决策。通过采用SDG-GAN进行信号增强,能够有效提升智能体的决策效率,提升自动驾驶系统对复杂环境的适应能力,并提升智能机器人在不同任务中的操作精度。
综上,该研究不仅推动了惯性传感器信号增强的发展,更有望为广泛的信号处理问题提供具有创新性和普适性的解决方案。该技术目前已服务于NOKOV度量动作捕捉系统,为用户提供高精度、高可靠性、高灵活性的动作捕捉解决方案。
NOKOV度量动作捕捉系统为本研究提供高精度运动数据,辅助训练深度学习模型,以增强惯性传感器信号并提高其在各种应用场景中的性能。
作者介绍
王一峰,哈尔滨工业大学(深圳)数学专业博士生。主要研究方向:深度学习模型设计与可解释性分析、传感器信号处理与分析、AI运动感知、机器学习与具身智能。
赵毅,哈尔滨工业大学(深圳)理学院, 教授,博导。主要研究方向:应用动力系统、非线性时间序列分析、复杂网络和数据科学理论。