-
生物通官微
陪你抓住生命科技
跳动的脉搏
当你没有足够的数据时,如何训练人工智能
【字体: 大 中 小 】 时间:2024年03月30日 来源:AAAS
编辑推荐:
随着研究人员探索人工智能的潜在应用,他们发现人工智能可能非常有用,但没有足够的数据来准确训练算法。华盛顿大学电子、计算机与工程教授黄仁能(Jenq-Neng Hwang)专门研究这些问题。研究团队开发了一种方法,教人工智能监控婴儿在一天中可以做出多少不同的姿势。该团队最近在IEEE/CVF 2024年计算机视觉应用冬季会议上发表了这项工作。
人工智能擅长整理信息和发现模式或趋势。但是这些机器学习算法首先需要用大量的数据进行训练。
随着研究人员探索人工智能的潜在应用,他们发现了人工智能可能真正有用的场景——比如分析x射线图像数据以寻找罕见情况的证据,或者检测商业渔船上捕获的稀有鱼类——但没有足够的数据来准确训练算法。
华盛顿大学电子、计算机与工程教授Jenq-Neng Hwang专门研究这些问题。例如,Hwang和他的团队开发了一种方法,教人工智能监控婴儿在一天中可以做出多少不同的姿势。婴儿的训练数据集有限,这意味着研究人员必须创建一个独特的管道,以使他们的算法准确和有用。该团队最近在IEEE/CVF 2024年计算机视觉应用冬季会议上发表了这项工作。
UW News采访了Hwang,谈到了项目细节以及该团队正在解决的其他类似挑战领域。
为什么开发一种跟踪婴儿姿势的算法很重要?
Jenq-Neng Hwang:我们开始与华盛顿大学医学院和韩国电子和电信研究所的人工智能实验室合作。该项目的目标是试图帮助有自闭症病史的家庭了解他们的孩子是否也可能患有自闭症。9个月前的婴儿还没有真正的语言技能,所以很难看出他们是否患有自闭症。研究人员开发了一项名为阿尔伯塔婴儿运动量表(Alberta Infant Motor Scale)的测试,该测试对婴儿能做的各种姿势进行了分类:如果婴儿能做到这一点,就得两分;如果他们能做到这一点,他们就得三分;等等......。然后你把所有的点加起来,如果婴儿超过某个阈值,他们可能没有自闭症。
但要做这个测试,你需要一个医生来观察所有不同的姿势。这是一个非常乏味的过程,因为有时在三四个小时后,我们仍然没有看到一个婴儿做一个特定的姿势。也许婴儿能做到,但那一刻他们不想这么做。一个解决方案可能是使用人工智能。父母通常在家里有一个婴儿监视器。婴儿监视器可以使用人工智能连续持续地跟踪婴儿一天中的各种姿势。
为什么人工智能很适合这项任务?
JNH:我的背景是研究传统的图像处理和计算机视觉。我们试图教会计算机能够从照片或视频中识别出人类的姿势,但问题是有太多的变化。例如,对于传统的图像处理来说,即使是同一个人穿着不同的衣服,也很难在每张照片上正确识别出那个人的肘部。
但人工智能让它变得简单多了。这些模型可以学习。例如,你可以用各种动作捕捉序列来训练机器学习模型,这些序列显示了各种不同类型的人。这些序列可以用相应的3D姿势进行注释。然后,这个模型可以学习在一个序列上输出一个人的姿势的3D模型,它以前从未见过。
但在这种情况下,没有很多婴儿的动作捕捉序列也有3D姿势注释,你可以用它来训练你的机器学习模型。你做了什么呢?
JNH:出于隐私原因,我们没有很多婴儿视频的3D姿势注释来训练机器学习模型。创建一个数据集也很困难,其中婴儿正在执行我们需要的所有可能的潜在姿势。我们的数据集太小,这意味着用它们训练的模型无法估计出可靠的姿势。
但我们确实有很多注释过的3D人物运动序列。所以,我们开发了这个管道。
首先,我们使用大量的普通人的3D运动序列来训练一个通用的3D姿势生成AI模型,该模型类似于ChatGPT和其他GPT-4类型的大型语言模型中使用的模型。
然后,我们用非常有限的带注释的婴儿动作序列数据集对我们的通用模型进行了微调。然后,通用模型可以适应小数据集并产生高质量的结果。
还有其他类似的任务吗:对人工智能有好处,但没有很多数据来训练算法?
JNH:在很多情况下,我们没有足够的信息来训练模型。一个例子是用x光诊断的罕见疾病。这种疾病非常罕见,我们没有足够的患者x光图像来训练模型。但是我们有很多健康病人的x光片。因此,我们可以再次使用生成式AI生成相应的合成无病x射线图像,然后与病变图像进行比较,识别疾病区域,以便进一步诊断。
自动驾驶是另一个例子。有太多真实的事件是你无法创造的。例如,假设你正在开车,有几片树叶吹在车前面。如果你使用自动驾驶,汽车可能会认为出了问题,然后猛踩刹车,因为汽车以前从未遇到过这种情况。这可能会导致事故。
我们称这些事件为“长尾”事件,意思是它们不太可能发生。但在日常生活中,我们经常看到这样的随机事件。在我们弄清楚如何训练自动驾驶系统来处理这些类型的事件之前,自动驾驶是没有用的。我们的团队正在通过将普通摄像机的数据与雷达信息相结合来解决这个问题。摄像头和雷达持续检查彼此的决定,这可以帮助机器学习算法理解正在发生的事情。