KL正则化强化学习旨在应对模式崩溃问题
论文信息 标题: KL-Regularized Reinforcement Learning is Designed to Mode Collapse 作者: Anthony GX-Chen, Jatin Prakash, Jeff Guo, et al. 发布日期: 2025-10-23 arXiv ID: 2510.20817v1 PDF链接: 下载PDF KL正则化强化...
论文信息 标题: KL-Regularized Reinforcement Learning is Designed to Mode Collapse 作者: Anthony GX-Chen, Jatin Prakash, Jeff Guo, et al. 发布日期: 2025-10-23 arXiv ID: 2510.20817v1 PDF链接: 下载PDF KL正则化强化...
论文信息 标题: VAMOS: A Hierarchical Vision-Language-Action Model for Capability-Modulated and Steerable Navigation 作者: Mateo Guaman Castro, Sidharth Rajagopal, Daniel Gorbatov, et al. 发布日期: 2025-10-2...
论文信息 标题: Towards General Modality Translation with Contrastive and Predictive Latent Diffusion Bridge 作者: Nimrod Berman, Omkar Joglekar, Eitan Kosman, et al. 发布日期: 2025-10-23 arXiv ID: 2510.208...
论文信息 标题: Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing 作者: Yusu Qian, Eli Bocek-Rivele, Liangchen Song, et al. 发布日期: 2025-10-22 arXiv ID: 2510.19808v1 PDF链接: 下载PDF P...
论文信息 标题: Hubble: a Model Suite to Advance the Study of LLM Memorization 作者: Johnny Tian-Zheng Wei, Ameya Godbole, Mohammad Aflah Khan, et al. 发布日期: 2025-10-22 arXiv ID: 2510.19811v1 PDF链接: 下载P...
论文信息 标题: Semantic World Models 作者: Jacob Berg, Chuning Zhu, Yanda Bao, et al. 发布日期: 2025-10-22 arXiv ID: 2510.19818v1 PDF链接: 下载PDF 语义世界模型:机器人规划的新范式解析 论文背景与研究动机 在机器人控制领域,基于世界模型的规划方法一直被视为实现...