Facebook通过SEER增强AI计算机视觉

  在许多版本的AI依靠预先建立的数据集进行图像识别的时候,Facebook开发了SEER(自我支持)–一种深度学习解决方案,能够在互联网上注册图像,而不受策展和标记的数据集的影响。

  SEER在自然语言处理(NLP)方面已经取得了重大进步,包括机器翻译,自然语言干扰和问题解答,SEER使用了一种创新的十亿参数,自我监督的计算机视觉模型,可以从任何在线图像中学习。

Facebook通过SEER增强AI计算机视觉

  到目前为止,Facebook AI团队已经在10亿张未经策划和未贴标签的公共Instagram图像上对SEER进行了测试。新程序的性能优于最先进的自我监督系统以及下游任务(例如低射,物体检测,图像检测和分割)的自我监督模型。实际上,仅接触ImageNet数据集的10%仍然导致SEER的识别率达到77.9%。此外,仅对同一数据集的1%进行训练时,SEER的准确率为60.5%。

  既然Facebook见证了SEER在应用环境中识别互联网图像的能力,那么AI团队将鼓励机器学习领域的开发人员和其他感兴趣的各方分享有关SEER功能改进的知识和知识。该公司已通过其用于开发SEER的开源库VISSL开启了此次讨论。

  自然,用于语言的机器学习与用于视觉识别的机器学习的不同之处在于语言学需要一个程序来识别单词及其相应定义之间的语义联系。另一方面,计算机视觉必须识别单个像素如何组成完整的图像。成功的视觉技术使用两种方法解决了这一挑战:1)一种算法,该算法使用大量不带注释或元数据的随机在线图像进行训练,以及2)足够大的网络从相关数据集中捕获和学习每个视觉组件。

  为了缓解与用于如此大量图形的计算能力有关的挑战,Facebook AI开发了SwAV算法。该算法使用在线聚类来将具有相似视觉概念的图像快速分组,以标识以后遇到的相似视觉数据。到目前为止,SwAV已帮助SEER减少了6倍的培训时间。

  除了使用SEER和VISSL改善计算机视觉和机器学习之外,Facebook还实施了几种现有算法,这些算法减少了每个图形编程单元的内存需求,从而提高了任何模型的训练速度。这些算法包括NVIDIA Apex库中的混合精度,PyTorch中的梯度检查,FairScale库中的分片优化器以及在线自我监督培训的专用优化。

侵权请联系作者。发布者:admin,转转请注明出处:/news/385.html

联系我们

888-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信