前沿论文收集与整理

涵盖机器学习、量子计算、机器人、物理学等方向

arXiv: 2512.16912v1

探索与利用:通过剪裁、熵与伪奖励重新审视RLVR

arXiv: 2512.16911v1

后验行为克隆:为高效强化学习微调预训练行为克隆策略

arXiv: 2512.16917v1

生成对抗推理器:通过对抗性强化学习增强大语言模型推理能力

arXiv: 2512.16921v1

关键差异:用于能力差距发现与修正的模型审计

arXiv: 2512.16919v1

DVGT:驾驶视觉几何变换器

arXiv: 2512.16920v1

EasyV2V:基于指令的高质量视频编辑框架

arXiv: 2512.15714v1

短18腿$t$-$J$圆柱体上的大型孤立条纹

arXiv: 2512.15716v1

Spatia:基于可更新空间记忆的视频生成

arXiv: 2512.14697v1

球形水蛭量化:视觉标记化与生成方法

arXiv: 2512.14698v1

TimeLens:基于多模态大语言模型的视频时序定位方法再思考

arXiv: 2512.13690v1

DiffusionBrowser:基于多分支解码器的交互式扩散预览系统

arXiv: 2512.13692v1

量子预言机为识别经典反事实提供了优势

arXiv: 2512.11794v1

用于囚禁离子量子信息处理的室温极端高真空系统

arXiv: 2512.11798v1

颗粒物:前馈式三维物体关节化

arXiv: 2512.10943v1

AlcheMinT:面向多参考一致视频生成的细粒度时序控制

arXiv: 2512.10946v1

隐式RDP:一种基于结构慢快学习的端到端视觉-力扩散策略

arXiv: 2512.10949v1

我们准备好迎接文本到3D生成中的强化学习了吗?一项渐进式研究

arXiv: 2512.10952v1

分层数据集选择促进高质量数据共享

arXiv: 2512.10953v1

双向归一化流:从数据到噪声再返回

arXiv: 2512.10957v1

SceneMaker:基于解耦去遮挡与姿态估计模型的开放集三维场景生成

arXiv: 2512.09926v1

连接单层$t$-$J$模型与近藤晶格模型:基于冷原子的探索

arXiv: 2512.09929v1

缩小基于梯度规划的世界模型中训练与测试的差距

arXiv: 2512.08923v1

相同内容,不同答案:多模态大语言模型中的跨模态不一致性

arXiv: 2512.08931v1

Astra:基于自回归去噪的通用交互世界模型