前沿论文收集与整理

涵盖机器学习、量子计算、机器人、物理学等方向

2025年12月21日 arXiv: 2512.16912v1

探索与利用：通过剪裁、熵与伪奖励重新审视RLVR

2025年12月21日 arXiv: 2512.16911v1

后验行为克隆：为高效强化学习微调预训练行为克隆策略

2025年12月20日 arXiv: 2512.16917v1

生成对抗推理器：通过对抗性强化学习增强大语言模型推理能力

2025年12月20日 arXiv: 2512.16921v1

关键差异：用于能力差距发现与修正的模型审计

2025年12月19日 arXiv: 2512.16919v1

DVGT：驾驶视觉几何变换器

2025年12月19日 arXiv: 2512.16920v1

EasyV2V：基于指令的高质量视频编辑框架

2025年12月18日 arXiv: 2512.15714v1

短18腿$t$-$J$圆柱体上的大型孤立条纹

2025年12月18日 arXiv: 2512.15716v1

Spatia：基于可更新空间记忆的视频生成

2025年12月17日 arXiv: 2512.14697v1

球形水蛭量化：视觉标记化与生成方法

2025年12月17日 arXiv: 2512.14698v1

TimeLens：基于多模态大语言模型的视频时序定位方法再思考

2025年12月16日 arXiv: 2512.13690v1

DiffusionBrowser：基于多分支解码器的交互式扩散预览系统

2025年12月16日 arXiv: 2512.13692v1

量子预言机为识别经典反事实提供了优势

2025年12月15日 arXiv: 2512.11794v1

用于囚禁离子量子信息处理的室温极端高真空系统

2025年12月15日 arXiv: 2512.11798v1

颗粒物：前馈式三维物体关节化

2025年12月14日 arXiv: 2512.10943v1

AlcheMinT：面向多参考一致视频生成的细粒度时序控制

2025年12月14日 arXiv: 2512.10946v1

隐式RDP：一种基于结构慢快学习的端到端视觉-力扩散策略

2025年12月13日 arXiv: 2512.10949v1

我们准备好迎接文本到3D生成中的强化学习了吗？一项渐进式研究

2025年12月13日 arXiv: 2512.10952v1

分层数据集选择促进高质量数据共享

2025年12月12日 arXiv: 2512.10953v1

双向归一化流：从数据到噪声再返回

2025年12月12日 arXiv: 2512.10957v1

SceneMaker：基于解耦去遮挡与姿态估计模型的开放集三维场景生成

2025年12月11日 arXiv: 2512.09926v1

连接单层$t$-$J$模型与近藤晶格模型：基于冷原子的探索

2025年12月11日 arXiv: 2512.09929v1

缩小基于梯度规划的世界模型中训练与测试的差距

2025年12月10日 arXiv: 2512.08923v1

相同内容，不同答案：多模态大语言模型中的跨模态不一致性

2025年12月10日 arXiv: 2512.08931v1

Astra：基于自回归去噪的通用交互世界模型