首页>国内 > 正文

计图：五秒训好NeRF！已开源

2022-06-06 10:25:01来源：量子位

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

计图（Jittor）框架的NeRF模型库JNeRF正式开源了！

通过JNeRF可以5秒训练好NeRF模型（见图1）。

Jittor成为首个支持Instant-NGP的深度学习框架。

△ 图1：5秒训练好NeRF

研究背景

NeRF在2020[1]被提出，它惊艳的视角生成效果获得了学术界的广泛关注。

不同于传统的显式表达，NeRF通过将场景表示为隐式的神经辐射场，渲染时通过神经网络查询位置上的场景信息生成新视角图像。

△ 图2：用Jittor框架训练的NeRF的例子

NeRF的出现很可能带来一场革命，但它仍存在一些问题。

不同方法针对NeRF各部分（如：采样、位置编码、网络结构）的优化都会对NeRF的性能带来提升，这一定程度上影响了比较的公平性。

并且随着NeRF效率的提升，深度学习框架逐渐成为NeRF效率提升的瓶颈，许多工作修改、添加cuda代码以提升效率，这进一步带来了混乱。

因此NeRF需要一个统一、高效、并与框架高度适配的模型库，建立统一流程，提升科研效率。

JNeRF架构

JNeRF模型库分析了现有的NeRF方法，将NeRF的主要训练流程总结为图3所示的7个模块，不同模块之间相互解耦，使其能够方便地调用和替换。

由于时间有限，目前JNeRF只支持了其中很少的工作，后续JNeRF会不断支持更多有代表性的NeRF工作，也十分欢迎大家在GitHub为JNeRF贡献代码。

△ 图3：NeRF的训练流程

JNeRF支持Instant-NGP

Nvidia的工作Instant-NGP[2]在今年年初发布后，受到了学术界和工业界的广泛关注，github开源仓库至今已获得7k+个星。

该工作通过Hash编码和定制化的优化，使得NeRF能在5秒训练出一个效果优质的结果。

经过我们的分析，Instant-NGP能5秒训练出NeRF并不仅仅是因为哈希编码方法，更因为Nvidia针对硬件做的极致优化。

△ 图4：Instant-NGP 算法流程

Instant-NGP能5秒训练NeRF的效果给学术界和产业界都带来了很多可能，但Instant-NGP的实现仍存在一些问题：其源码完全基于Cuda编写，对习惯Python的用户而言使用门槛较高。

Instant-NGP没有成熟的深度学习框架支持，无法适配各种常用NeRF变种模型；Nvidia为了追求极致的效率优化，其源码不同函数间耦合严重，难以修改。

基于JNeRF实现的Instant-NGP具有以下优势：

准确复现了论文的速度和点数（见表1），其他深度学习框架复现的Instant-NGP在速度和点数上都距离原论文有一定差距，Jittor是全球唯一成功复现了Instant-NGP的框架。

△ 表1：与Instant NGP原文的对比

JNeRF速度十分高效，其训练速度可以达到大约133 iter/s。我们注意到，随着NeRF训练速度的提升，框架的运行速度成为了限制NeRF速度进一步提升的瓶颈，近期有的工作（如Plenoxel）通过大量修改Pytorch源码才实现快速训练，而Instant-NGP则更是直接使用Cuda来达到速度的极致追求。得益于Jittor的速度优势，JNeRF可以直接轻松地使用Jittor框架完成Instant-NGP的复现。Jittor是一个即时编译的框架，通过即时编译的特性，能够实现很多原版Instant-NGP都无法实现的操作，例如在训练时动态修改Cuda代码。JNeRF进行了较好的模块化，使得科研人员能够轻松地调用、替换其中的模块。Jittor基于元算子融合的优势，有着丰富的硬件生态支持，因此基于Jittor的JNeRF库能够轻松地在各种国内外硬件以及移动端上运行。JNeRF代码演示

JNeRF通过配置文件可以轻松修改模型设置，下面的代码展示了用户可以通过简单地修改配置文件实现模块的替换。

目前，JNeRF仓库已在github和中国计算机学会的GitLink上开源。JNeRF仍有待不断完善，支持的模型仍十分有限。

欢迎大家通过该仓库进行NeRF的学习和研究，并和我们一起完善该仓库，共同推动NeRF的发展。

GitHub链接：

https://github.com/Jittor/JNeRF

GitLink链接：

https://www.gitlink.org.cn/jittor/jnerf

关键词：配置文件广泛关注效率提升能够实现为了追求

相关新闻

中山外贸展现出较强韧性前三季度全市外贸进出口2187.9亿元

四是优势产业、特色产业推动出口强劲增长。劳动密集型产品、自动数据处理设备及其零部件、灯具照明装置...
做一个简易的配置中心，顺带还给整合到了SpringCloud

大家好，我是三友~~最近突然心血来潮（就是闲的）就想着撸一个简单的配置中心，顺便也照葫芦画瓢给整合...
为什么JSON.parse会损坏大数字，如何解决这个问题？

从10多年前JSON在线编辑器的早期开始，用户经常反映编辑器有时会破坏他们JSON文档中的大数字的问题。直...
在任期第一年每位CIO都必须完成的12件事

OrlaDaly于2022年3月加入学习软件制造商Skillsoft担任CIO。从第一天起，他的任务就是推动运营效率和公司...
一次服务器非法重启后导致的故障排查记录

大家好，我是杰哥。前段时间遇到一个服务器问题：非法重启设备后，服务器进入救援模式，数据盘也不显示...
如何在Linux中使用xargs命令

什么是xargs命令xargs命令从标准输入或另一个命令的输出中读取文本行，并将其转换为命令并执行。我们经...
聊聊国产数据库TiDB相关知识，你学会了吗？

1、简介　TiDB是由PingCAP公司研发设计的开源分布式HTAP(HybridTransactionalandAnalyticalProce
什么是 CDN 缓存命中率以及如何计算和优化它？

本文主要关注AmazonCloudFrontCDN缓存以及如何使用它们来实现更好的缓存命中率。在了解缓存中的命中率...
在传统运维监控系统中加入新的预警能力

传统的运维监控系统是以基线为核心判断系统是否存在某个问题并进行告警的。这种模式最大的问题就是基...
Kotlin Flow响应式编程，基础知识入门

Kotlin在推出多年之后已经变得非常普及了。相信现在至少有80%的Android项目已经在使用Kotlin开发，或...
程序员应如何理解Reactor模式？

大家好，我是小风哥！今天我们聊聊reactor模式。在设计高并发高性能服务器时，一项关键的考虑就是I O...
一文掌握所有命令行，包括73个“冷门但有用”的技巧｜GitHub 11万标星之作

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。作为程序员，都知道命令行的好处。...
一文了解云计算的基本指南

到2021年，超过90%的计算实例和工作负载将使用云数据中心进行处理。毫无疑问，云计算已经开始席卷全球。...
LeCun转推，PyTorch GPU内存分配有了火焰图可视化工具

近日，PyTorch核心开发者和FAIR研究者ZacharyDeVito创建了一个新工具（添加实验性API），通过生成和可视...
如何提高无线路由器的安全性

众所周知，无线路由器的安全性非常重要，因为无线路由器包含了所有跨网络共享的数据以及网络入口。因此...

聚焦

IT

科技

Copyright 2015-2020 三好网版权所有