最大CLIP!LAION发布CLIP的扩增定律|焦点热议
2022-12-24 15:04:20


(相关资料图)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

热门推荐

文章排行

  1. 2022-12-24最大CLIP!LAION发布CLIP的扩增定律|焦点热议
  2. 2022-12-23利扬芯片: 广东法全律师事务所关于广东利扬芯片测试股份有限公司2022年第二次临时股东大会法律意见书-微资讯
  3. 2022-12-23世界焦点!海南橡胶董秘回复:本次交易完成后,公司将通过各方面整合,充分发挥标的公司与海南橡胶的协同效应
  4. 2022-12-23唯万密封:压缩空气储能电站方面公司尚未有直接合作
  5. 2022-12-22今日热议:女人不应该怎么洗澡 洗澡的好处和坏处
  6. 2022-12-22中国人寿寿险公司与客户成功签约 首份个人养老金产品获批上线
  7. 2022-12-22金融街论坛:加强金融科技合作交流 为传统金融业注入强大活力
  8. 2022-12-22易车获“2022年长青奖-年度最具互联网投资价值企业”
  9. 2022-12-22异动快报:嘉美包装(002969)12月22日9点44分触及涨停板
  10. 2022-12-21疏通消费链 多地发放超亿元消费券带动年末消费
  11. 2022-12-07杰恩设计(300668):独立董事提名人声明(高刚)-环球快资讯
  12. 2022-12-06动态焦点:铂力特(688333.SH):股东萍乡晶屹已减持2.6%的股份
  13. 2022-08-25杭州萧山老旧工业园区如何实现“腾笼换鸟”? 湖头陈工业园区这样做
  14. 2022-07-08永泰能源煤炭主业继续稳中求进 储能布局打开能源转型新空间
  15. 2022-05-20深圳市今年继续实施失业保险稳岗返还政策 中小微企业返还比例提高到90%
  16. 2022-05-20深圳发布全国首个工伤预防项目评审标准 为工伤预防项目评审工作铸好了“标尺”
  17. 2022-03-18冰雪之约 中国之邀 | 追赶的勇气
  18. 2021-10-27王毅同卡塔尔副首相兼外交大臣穆罕默德举行会谈
  19. 2021-10-27讲述中国体育故事 弘扬中华体育精神(望海楼)
  20. 2021-10-27“密室逃脱”游戏勿忘安全