精选文章

合成数据如何促进计算机视觉的?

2020-07-27 15:34:58 | 来源:中培企业IT培训网

1993年春天,知名大学统计学教授发表了一篇论文。他的论文将改变人工智能的方式,该教授的既定目标更为谦虚:分析来自1990年美国人口普查的数据,同时保留受访者的匿名性。仅对数据进行匿名化是不可行的,仍然可以通过其家庭住址,电话号码或社会保险号来识别个人,所有这些对于该教授的同事想要进行的分析都是至关重要的。为了解决该问题,该教授生成了一组匿名的人口普查响应,其人口统计反映了原始数据集的人口统计。这样,该教授的同事们可以得出关于美国肤色的有效统计推断,而不会损害其公民的身份。那么合成数据如何促进计算机视觉的?

该教授的解决方案是原始的。他已经产生了综合数据,并以此为我们的学术词汇量做出了贡献。他的方法受到统计学家,经济学家和医学研究人员的欢迎。

  机器学习中的合成数据

数十年后,合成数据被发现可以促进机器学习。机器学习系统是可预测的,并且大多数都需要数据-越多越好。

例如,预测更多选举结果的监督式机器学习模型的准确性将提高。但是选举是很少发生的事件,这意味着这种模型的数据派生预测能力有限(对模型体系结构的更改可能会产生较小的性能改进,但与将其训练数据集加倍的影响相形见)。

为了获得更大的预测能力,该模型需要更多数据。它还必须能够解释决定选举结果的机制的变化,以便可以对两者之间的关系做出有效的推断。

生成其属性可以进行有效推断的合成数据是鲁宾工作的初衷。受此启发,加州理工学院和加州大学欧文分校的研究人员创建了综合选举数据,该数据可能已记录在投票箱中,但没有。

在该研究中,使用合成数据来克服数据稀缺性,但是数据隐私是另一个严重的问题。诸如医疗保健等处理高度敏感的个人信息的行业积极倡导合成数据,因为法规通常会阻止其数据科学家处理真实的患者记录。

隐私和稀缺性是重要的数据访问问题,解决这些问题使模型的性能更高。但是在机器学习社区的另一个角落,合成数据被用于赋予模型新的功能-能够查看原本不会看到的东西并做出新颖的预测。

  合成影像

处理图像的机器学习子集称为计算机视觉。像预测选举的模型一样,大多数计算机视觉模型都随数据而改进。

在计算机视觉中,数据获取的主要方法依赖于坐在房间里的人类,并根据其内容对图像进行标记。这是一个关键但劳动密集的过程(现在著名的名为ImageNet的照片集被手工标注了近1400万次)。

标签之所以重要,是因为标签是我们将对世界的语义理解编码到计算机中的方法。例如,坐在那个房间里的人们在贴上图像的标签时,可能会将照片注释为“猫”或“狗”,以向计算机展示如何识别差异。但是标签不必局限于人眼可以识别的事物。

由计算机创建的合成图像可能包含标签,这些标签的尺寸甚至不能被人类可靠地量化-诸如深度或透明度之类的参数。

想象一下如何尝试测量图像中成千上万个单个塑料瓶的相对深度。现在测量它们的透明度,以及它们反射光的角度。对于人类而言,这项任务是不可能的,但是具有这些属性的照片扩大了计算机视觉模型的推断可能性。

例如,在零售和废物管理行业中,当机器人在包括深度和透明度标签的合成数据集上接受训练时,机器人可以拣选存货并回收具有更大灵活性的塑料瓶(研究人员在今年早些时候证明了这一点)。使用合成数据,机器人变得更加智能。

  逆势下注

的确,计算机已经产生了数十年的图像,但是要做到逼真的,具有美学多样性并大规模地进行图像生成是非常困难的。生成对抗网络(GAN)是一种复杂的解决方案。它们以程序方式创建信息,这意味着它们可以提供图像的无限变化,但与其他深度学习模型相比,不需要更多的人工指导。对于那些知道如何使用它们的人,GAN启用了一条有利的数据供应链。

到目前为止,合成数据仍然是一个逆势赌注,因为传统观点认为,使用人工标记图像训练的模型比使用合成图像训练的模型具有更高的性能。

但是来自学术界的证据表明,传统观念是错误的。在许多情况下,在合成数据上训练或增强的模型比在实际数据上训练的模型更有效,并且它们可以感知其他模型无法做到的事情。

这在自动驾驶汽车行业已经很明显,因为现实世界中的不确定性和动态性对合成数据产生了前所未有的需求。除非安全,否则Uber,Tesla,Waymo和Zoox不会在道路上行驶汽车,但是它们如何预测可能发生的每种驾驶情况?

在真正的汽车中让真正的驾驶员捕捉数百万小时的下雨,夜间和山区驾驶场景是不切实际的。这将花费太长时间,并使人们处于不必要的危险中。更好的解决方案是可以提供无限风景多样性的图像生成管道。所有主要的自动驾驶汽车公司都有可能将合成数据纳入其计算机视觉系统。

合成图像的另一个说法是经济。像其他数字商品一样,其边际生产成本几乎为零。只要替代方案是人类为图像加标签,合成数据将更便宜,或者这样的说法就可以了。

实际上,单位经济学更加复杂。许多高价值的用例需要自定义3D资产,必须购买这些资产或由CGI艺术家使用动画软件绘制。在第一批合成数据初创企业中,竞争优势可能在于其摊派此类艺术家固定成本的能力。这样做的回报是巨大的,但还需要在客户之间有一个一致的,重复出现的用例,而在所有合成图像市场中尚不存在这种用例。

随着戏剧性的发展,综合数据的性能优势将在学术界和初创企业界之外得到认可。

尽管如此,能够识别差异化和高价值用例并围绕它们建立可预测的收入流的初创公司将享有令人羡慕的市场地位。

对于初创企业和老牌企业而言,一件事很清楚:社会对机器学习系统的性能期望正在提高,并且使用合成数据来满足它们。

综上所述,合成数据如何促进计算机视觉的相信大家已经清楚了吧,想了解更多关于人工智能的信息,请继续关注中培伟业。