生成式视图拼接

arXiv: 2510.24718v1

追踪、修复、重绘:基于渐进纹理填充的主体驱动3D与4D生成

arXiv: 2510.23605v1

变分掩码扩散模型

arXiv: 2510.23606v1

对比等变性:从未标记有限群作用中识别等变嵌入

arXiv: 2510.21706v1

论LLM生成文本的可检测性:究竟何为LLM生成文本?

arXiv: 2510.20810v1

微末草稿,重大裁决:基于推测的信息密集型视觉推理

arXiv: 2510.20812v1

GSWorld:机器人操作闭环照片级真实感仿真套件

arXiv: 2510.20813v1

KL正则化强化学习旨在应对模式崩溃问题

arXiv: 2510.20817v1

VAMOS:一种能力可调与可控导航的分层视觉-语言-行为模型

arXiv: 2510.20818v1

迈向通用模态转换:基于对比与预测潜在扩散桥的研究

arXiv: 2510.20819v1

Pico-Banana-400K:面向文本引导图像编辑的大规模数据集

arXiv: 2510.19808v1

哈勃:推进大语言模型记忆研究的一套模型

arXiv: 2510.19811v1

语义世界模型

arXiv: 2510.19818v1