整理 Hexo、GitHub Pages 与 Redefine 主题搭建过程中的配置步骤、评论系统和常见问题。
-
Sticky
-
论文专题讲解:Fast-WAM:WAM 一定要推理时想象未来吗
论文题名: Fast-WAM: Do World Action Models Need Test-time Future Imagination?。 作者: Tianyuan Yuan、Zibin Dong、Yicheng Liu、Hang Zhao。 机构: IIIS, Tsinghua University;Gal
-
思考探索:世界模型 Infra:从模型谱系到物理 AI 工程栈
这篇回答的问题。 如果不再只问“哪个模型是 world model”,而是问“什么基础设施能持续训练、评测、部署和治理 world model”,整个方向会怎样重新分层。 世界模型已经不只是一个算法名词。早期 PlaNet、Dreamer、MuZero 让我们看到:agent 可以先学习环境动力学,再在内部 rollo
-
论文专题讲解:D4RT:动态场景的 4D 重建与跟踪
论文题名: Efficiently Reconstructing Dynamic Scenes One D4RT at a Time。 作者: Chuhan Zhang、Guillaume Le Moing、Skanda Koppula、Ignacio Rocco、Liliane Momeni、Junyu Xie、Sh
-
论文专题讲解:kai0:资源受限下的高可靠机器人操作
论文题名: χ₀: Resource-Aware Robust Manipulation via Taming Distributional Inconsistencies。 作者: Checheng Yu、Chonghao Sima、Gangcheng Jiang、Hai Zhang、Haoguang Mai、Hon
-
具身智能:机器人数据里的 `state` 和 `action`:不要被字段名骗了
这篇回答的问题。 在 LeRobot、CALVIN、robomimic 或自采 parquet 里看到 observation.state 和 action 时,怎样判断它们到底表示当前状态、目标关节角、末端位姿增量、速度,还是被数据写入逻辑对齐过的字段。 具身智能的入门很容易从模型名开始:VLA、Diffusion
-
思考探索:WAM 与 3D 视觉:世界模型从视频想象走向物理闭环
本文关注的问题。 World Action Models 与 3DV in WM 如何从视频想象走向机器人可用的物理闭环。 2026 年具身智能里,世界模型和 WAM 迅速升温,但真正值得追问的不是“又出了哪些新模型”,而是 世界模型到底怎样变成机器人可用的物理闭环 。 如果只从概念上讲,WAM 很容易被理解成“视频生
-
论文专题讲解:World Model for Robot Learning:机器人学习世界模型综述
论文题名: World Model for Robot Learning: A Comprehensive Survey。 作者: Bohan Hou、Gen Li、Jindou Jia、Tuo An、Xinying Guo、Sicong Leng、Haoran Geng、Yanjie Ze、Tatsuya Harad
-
知识问答:具身智能与 VLA QA
这一页单独整理具身智能、VLA、机器人数据和闭环部署的高频问题。这里的易错点通常不是概念不会背,而是把 VLM 能力、视频生成能力、离线指标或 demo 结果过度外推到真实机器人执行。 基础定义与系统边界 Q:具身智能和普通多模态 AI 的关键区别是什么? 面试回答。 普通多模态 AI 多数停留在感知和问答:看图、读视
-
知识问答:世界模型 QA
这一页单独整理世界模型方向的高频问题。重点不是背 PlaNet、Dreamer、JEPA、Genie、WAM 这些名字,而是能在面试里讲清:模型预测什么、动作如何进入、效率来自哪里、什么证据能证明它可用于规划,什么证据只能说明视频生成或 demo 形态。 基础定义与能力边界 Q:世界模型到底是什么? 面试回答。 世界模