前沿论文收集与整理

涵盖机器学习、量子计算、机器人、物理学等方向

arXiv: 2512.16920v1

EasyV2V:基于指令的高质量视频编辑框架

arXiv: 2512.15714v1

短18腿$t$-$J$圆柱体上的大型孤立条纹

arXiv: 2512.15716v1

Spatia:基于可更新空间记忆的视频生成

arXiv: 2512.14697v1

球形水蛭量化:视觉标记化与生成方法

arXiv: 2512.14698v1

TimeLens:基于多模态大语言模型的视频时序定位方法再思考

arXiv: 2512.13690v1

DiffusionBrowser:基于多分支解码器的交互式扩散预览系统

arXiv: 2512.13692v1

量子预言机为识别经典反事实提供了优势

arXiv: 2512.11794v1

用于囚禁离子量子信息处理的室温极端高真空系统

arXiv: 2512.11798v1

颗粒物:前馈式三维物体关节化

arXiv: 2512.10943v1

AlcheMinT:面向多参考一致视频生成的细粒度时序控制

arXiv: 2512.10946v1

隐式RDP:一种基于结构慢快学习的端到端视觉-力扩散策略

arXiv: 2512.10949v1

我们准备好迎接文本到3D生成中的强化学习了吗?一项渐进式研究

arXiv: 2512.10952v1

分层数据集选择促进高质量数据共享

arXiv: 2512.10953v1

双向归一化流:从数据到噪声再返回

arXiv: 2512.10957v1

SceneMaker:基于解耦去遮挡与姿态估计模型的开放集三维场景生成

arXiv: 2512.09926v1

连接单层$t$-$J$模型与近藤晶格模型:基于冷原子的探索

arXiv: 2512.09929v1

缩小基于梯度规划的世界模型中训练与测试的差距

arXiv: 2512.08923v1

相同内容,不同答案:多模态大语言模型中的跨模态不一致性

arXiv: 2512.08931v1

Astra:基于自回归去噪的通用交互世界模型

arXiv: 2512.07832v1

泛化结果是否具有普遍性?

arXiv: 2512.07833v1

关系视觉相似性

arXiv: 2512.05967v1

增强教育平台检索增强生成与实体链接技术

arXiv: 2512.05110v1

ShadowDraw:从任意物体到阴影绘画的组合艺术

arXiv: 2512.05105v1

语义软引导:无需强化学习实现大语言模型的长上下文推理