听这篇文章
|

|资料来源:Gwangju科学技术研究所
一个研究团队Gwangju科学技术学院(GIST)在韩国创建了一种允许人工智能(AI)视觉系统的方法,以更好地识别混杂在一起并且可能不完全可见的对象。
GIST的副教授Kyoobin Lee和Seunghyeok Back,博士学位。学生及其大学的研究团队着手创建一个可以在混乱场景中识别和分类对象的AI系统。该团队很快发现机器人视觉系统需要大量的对象数据集以识别对象。
“我们希望机器人能够识别并操纵他们以前从未遇到过的物体或接受训练以识别。”“但是,实际上,我们需要一一手动收集和标记数据,因为深神经网络的普遍性很大程度上取决于培训数据集的质量和数量。”
通常,当AI出现许多混乱对象的场景时,系统将尝试仅基于可见的部分识别每个项目。Lee和Back决定采用不同的方法,而是教授AI识别每个对象的几何形状,以便可以推断出其对象的哪些部分看不到。
教AI进行此操作需要一个较小的数据集,其中包含深度信息的45,000张照片现实的合成图像。当AI出现一个场景时,它开始通过挑选一个感兴趣的对象,然后将对象分割成“可见的掩码”和“ Amodal面具”来理解它。

比较现有方法和研究人员识别部分模糊对象的方法。|资料来源:Gwangju科学技术研究所
分割场景后,AI使用层次遮挡建模(HOM)方案。该方案将功能的组合排名,这些功能可能会被它们的可能性所掩盖。该团队针对三个基准测试了其HOM计划,并发现它取得了最先进的表现。
Back说:“先前的方法仅限于仅检测特定类型的对象,或者仅检测可见区域,而无需明确推理封闭区域。”“相比之下,我们的方法可以推断出像人类视觉系统一样被封闭物体的隐藏区域。这样可以减少数据收集工作,同时改善复杂环境中的性能。”
研究小组的结果是公认在2022年IEEE国际机器人和自动化会议上。
告诉我们你的想法!