首页>国内 > 正文

全球视点！Github七月超热AI项目榜单还有续集！女娲无限版只能排第3？

2022-08-09 16:02:29来源：新智元

七月最受欢迎的AI研究榜单第二弹来了！

(资料图)

上一波榜单是根据推特点赞、转发和Github星数排序的，但有网友吐槽说推特点赞数可以机刷，另外推特点赞用户不一定懂研究。

这次，作者@bycloudai吸取经验，这次的指标不用推特点赞数了，改成了Github上的星数。

虽然这次的指标也算不上有多专业吧，但比起推特，能逛Github的多少可以认为和AI研究关系更密切。

另外，作者在榜单开头也明确说了，这个榜属于自己没事排来玩玩的野榜，仅供娱乐。

话虽这么说，此次的「续集榜单」基本仍保持上期风格，对Top10分别给出资源库地址、论文链接、题目、作者和发文单位。

来看看这次「改良版」七月最火AI研究都有哪些研究上榜~

Top1：YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

作者：Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao机构：「中央研究院」信息科学研究所Github星数：3.8k

摘要：YOLOv7在5FPS到160FPS范围内的速度和精度都超过了所有已知的物体检测器，并且在 GPU V100上所有高于30FPS的实时物体检测器中具有最高的精度56.8%AP。YOLOv7-E6 目标检测器 (56 FPS V100, 55.9%AP) 比基于Transformer的检测器 SWIN-L Cascade-Mask R-CNN (9.2 FPS A100, 53.9% AP) 的速度和精度分别高出了509%和2%。

值得一提的是，这篇论文的一作Chien-Yao wang（王建尧）是哥大的一名机器工程方向的研究生，现在是Intel的一名Chrome软件工程师。

Top2：Text-Guided Synthesis of Artistic Images with Retrieval-Augmented Diffusion Models

作者：Robin Rombach, Andreas Blattmann, and Bjorn Ommer机构：路德维希-马克西米利安-慕尼黑大学（Ludwig-Maximilians-Universität München）

Github星数：2.4k

摘要：新的架构最近改进了生成图像合成，从而在各种任务中实现了出色的视觉质量。尤其值得注意的是「AI-Art」领域。通过结合语音和图像合成模型，建立了所谓的“提示工程”，其中使用精心挑选和组合的句子来在合成图像中实现一定的视觉风格。

本文提出了一种基于检索增强扩散模型 (RDM) 的替代方法。在RDM中，在每个训练实例的训练期间从外部数据库中检索一组最近邻，并且扩散模型以这些信息样本为条件。

来看看论文中的AI-Art的作品效果~

Top3：NUWA-Infinity: Autoregressive over AutoregressiveGeneration for Infinite Visual Synthesis

作者：吴晨飞，梁健，Xiaowei Hu等机构：微软亚洲研究院、北京大学、微软Azure AIGithub星数：2.4k

排在第三位的是此前备受关注的全华班AI大作NUWA INFINITY。

4、Training Transformers Together（1K星）

作者：Alexander Borzunov，Max Ryabinin，Tim Dettmers等机构：俄罗斯国立高等经济学院、华盛顿大学等

5、Theseus:A Library for Differentiable Nonlinear Optimization（791星）

作者：Luis Pineda，Taosha Fan，Maurizio Monge机构：Meta AI，Reality Labs Research

6、k-means Mask Transformer（704星）

发文单位：约翰霍普金斯大学、谷歌研究院资源库：https://github.com/google-research/deeplab2论文：https://arxiv.org/abs/2207.04044v1

7、XMem: Long-Term Video Object Segmentation with an Atkinson-Shiffrin Memory Model （699星）

发文单位：伊利诺伊大学厄巴纳香槟分校资源库：https://github.com/hkchengrex/XMem论文：https://arxiv.org/abs/2207.07115v2

8、TinyViT: Fast Pretraining Distillation for Small Vision Transformers（656星）

发文单位：微软研究院、微软云+AI资源库：https://github.com/microsoft/cream论文：https://arxiv.org/abs/2207.10666v1

9、Towards Grand Unification of Object Tracking （644星）

发文单位：大连理工大学、字节跳动、香港大学、鹏程实验室

资源库：ttps://github.com/masterbin-iiau/unicorn论文：https://arxiv.org/abs/2207.07078v3

10、Multiface: A Dataset for Neural Face Rendering（337星）

发文单位：Meta现实实验室资源库：https://github.com/facebookresearch/multiface论文：https://arxiv.org/abs/2207.11243v1

关键词：图像合成香港大学路德维希马克西米利安慕尼黑大学

全球视点！Github七月超热AI项目榜单还有续集！女娲无限版只能排第3？

相关新闻

中山外贸展现出较强韧性前三季度全市外贸进出口2187.9亿元

做一个简易的配置中心，顺带还给整合到了SpringCloud

为什么JSON.parse会损坏大数字，如何解决这个问题？

在任期第一年每位CIO都必须完成的12件事

一次服务器非法重启后导致的故障排查记录

如何在Linux中使用xargs命令

聊聊国产数据库TiDB相关知识，你学会了吗？

什么是 CDN 缓存命中率以及如何计算和优化它？

在传统运维监控系统中加入新的预警能力

Kotlin Flow响应式编程，基础知识入门

程序员应如何理解Reactor模式？

一文掌握所有命令行，包括73个“冷门但有用”的技巧｜GitHub 11万标星之作

一文了解云计算的基本指南

LeCun转推，PyTorch GPU内存分配有了火焰图可视化工具

如何提高无线路由器的安全性

聚焦

IT

科技