兰宇时,MMLab@NTU博士生,导师为 Chen Change Loy。本科毕业于北京邮电大学,目前主要研究兴趣为基于神经渲染的 3D 生成模型、3D 重建与编辑。
尽管 3D 内容生成技术取得了显著进展,现有方法仍在输入格式、潜空间设计和输出表示上面临挑战。
在 ICLR 2025 中,来自南洋理工大学 S-Lab、上海 AI Lab、北京大学以及香港大学的研究者提出的基于 Flow Matching 技术的全新 3D 生成框架 GaussianAnything,针对现有问题引入了一种交互式的点云结构化潜空间,实现了可扩展的、高质量的 3D 生成,并支持几何-纹理解耦生成与可控编辑能力。
该方法在 Objaverse 数据集上进行了大规模训练,并在文本、图像、点云引导的 3D 生成任务中超越了现有的原生 3D 生成方法。开云APP注册
近年来,以可微渲染和生成模型为核心的神经渲染技术 (Neural Rendering) 取得了快速的进展,在新视角合成、3D 物体生成和编辑上取得了令人满意的效果。在统一图片/视频生成的 LDM 框架的基础上,近期关于原生 (native) 3D diffusion model 的研究也展现了更优的泛化性,更快的生成速度与更好的可编辑性。
为了解决上述问题,研究者提出基于 Flow Matching 的可控点云结构化隐空间 3D 生成模型 GaussianAnything,开云APP注册支持多模态可控的高效、高质量的 3D 资产生成。
在第二阶段,研究者在训练完成的 3D VAE space 上进行 Flow Matching 训练。在使用文本/单目图像作为输入条件时,他们均使用 Cross Attention 进行条件信息编码并送入 DiT 框架中进行训练。同时分为两个阶段单独学习几何 (稀疏点云) 和纹理 (点云结构的低维特征)。
具体而言,研究者首先训练一个稀疏点云上的 Flow Matching 模型:
考虑到 3D 内容创作更多采用图片作为参考,本文方法同样支持在给定单目图像条件下实现高质量 3D 生成。相比于多视图生成 + 重建的两阶段方法,本文方案在 3D 生成效果、多样性以及 3D 一致性上有更稳定的表现:
在大规模 3D 数据集 Objaverse 上,研究者基于 Flow Matching 的 3D 生成模型支持从文本描述直接生成丰富,带有细节纹理的高质量 3D 资产,并支持 textured-mesh 的导出。生成过程仅需数秒即可完成。可视化对比结果如下:
03月03日,报告预测:未来20年中国商用航空发动机市场份额将超全球五分之一,
小不点灵觉敏锐,一路上避过诸多恐怖的危机,也遭遇了很多次生死考验,途中曾连遭重创,但终于还是闯了过来。
,为什么每个平台都有ag,金牛国际线日,陈海泉:新加坡与海南的合作具有良好协同效应,
时事4:亚星赌场网站03月03日,香港街头年味儿渐浓 贺年装饰引民众“打卡”拍照,这么多年过去,事业上的成就未能弥补心中的空缺,未能学医仍旧是李龙的遗憾。看到曾经教过的学生如愿走上学医的道路,李龙心中的羡慕之情愈发强烈。,娱乐宝官网,ag真人试玩平台进口,万博manbext体育官网。
,新宝gg快速登陆,乐动体育官方网站,线年期超长期特别国债将第一次续发行】
新闻信息服务许可证音像制品出版许可证广播电视节目制作经营许可证网络视听许可证网络文化经营许可证
本文为原创发表,并经本网编辑。转载此文章须经作者同意,并请附上出处及本页链接。