前沿论文收集与整理

涵盖机器学习、量子计算、机器人、物理学等方向

arXiv: 2601.16979v1

一种用于分析大型语言模型训练动态的可扩展损失景观曲率度量方法

arXiv: 2601.16982v1

AnyView:动态场景中任意新视角的合成

arXiv: 2601.16194v1

多时间窗多隔间车辆路径问题的滚动空间分支定价算法

arXiv: 2601.16200v1

多模态大语言模型通过特征空间平滑实现可证明鲁棒性

arXiv: 2601.16205v1

反事实训练:为模型提供合理且可操作的解释教学

arXiv: 2601.16206v1

沙盒中的大语言模型激发通用智能体智能

arXiv: 2601.16210v1

PyraTok:面向视频理解与生成的语言对齐金字塔分词器

arXiv: 2601.16211v1

为何我打不开抽屉?缓解零样本组合动作识别中的对象驱动捷径问题

arXiv: 2601.15282v1

重新思考具身世界中的视频生成模型

arXiv: 2601.15286v1

迭代优化提升组合式图像生成质量

arXiv: 2601.14243v1

Jet-RL:通过统一训练与部署精度流程实现基于策略的FP8强化学习

arXiv: 2601.14255v1

VideoMaMa:基于生成先验的掩码引导视频抠图

arXiv: 2601.11505v1

MetaboNet:最大公开可用的一型糖尿病管理整合数据集

arXiv: 2601.11514v1

ShapeR:基于随意捕捉的鲁棒条件三维形状生成

arXiv: 2601.11516v1

为双子座模型构建生产就绪的探针

arXiv: 2601.11517v1

解释是否适用于大型推理模型?

arXiv: 2601.10705v1

有界延迟、部分参与及噪声通信下的分布式感知机

arXiv: 2601.10707v1

见少行更稳:基于基础模型随机补丁选择的通用端到端自动驾驶

arXiv: 2601.10708v1

高精度无维度扩散采样方法

arXiv: 2601.10712v1

MatchTIR:基于二分匹配的工具集成推理细粒度监督

arXiv: 2601.10713v1

量子LDPC码的麦克斯韦擦除解码器

arXiv: 2601.10715v1

DInf-Grid:基于可微特征网格的神经微分方程求解器

arXiv: 2601.09706v1

面向Transformer语言模型的价值感知数值表示

arXiv: 2601.09708v1

Fast-ThinkAct:基于可言语化潜在规划的高效视觉-语言-行动推理