具身智能
2026
28
- 思考探索:世界模型驱动的机器人数据飞轮:能持续生产经验的系统,才是真正的基础设施
- 论文专题讲解:Motus:把 latent action、世界模型和 VLA 合到一个生成框架
- 论文专题讲解:VGGT-Ω:几何重建怎样变成具身空间表征
- 论文专题讲解:Fast-WAM:WAM 一定要推理时想象未来吗
- 论文专题讲解:D4RT:动态场景的 4D 重建与跟踪
- 论文专题讲解:kai0:资源受限下的高可靠机器人操作
- 具身智能:机器人数据里的 `state` 和 `action`:不要被字段名骗了
- 论文专题讲解:World Model for Robot Learning:机器人学习世界模型综述
- 知识问答:具身智能与 VLA QA
- 知识问答:多模态与生成模型 QA
- 论文专题讲解:MapAnything:统一前向 Metric 3D 重建骨干
- 论文专题讲解:VO-DP:RGB-only 扩散策略怎样借用语义和几何特征
- 具身智能:双目匹配与 Cost Volume:把深度先变成对应点问题
- VLM/VLA:最小数学:理解、行动与预测后果
- 世界模型:VLA 到世界模型:一条机器人闭环链路怎么搭
- 世界模型:机器人与自动驾驶中的世界模型
- VLM/VLA:世界模型高效训练接口
- VLM/VLA:视觉 Tokenizer 与连接器:视觉证据怎样被压成可用 token
- VLM/VLA:视频表征、状态记忆与长时序压缩
- VLM/VLA:多模态评测与失败模式
- VLM/VLA:架构:视觉证据怎样进入语言模型
- VLM/VLA:部署与安全
- VLM/VLA:数据与策略学习:从示范轨迹到闭环策略
- VLM/VLA:闭环恢复与失败分析
- VLM/VLA:评测与数据引擎
- VLM/VLA:动作表示与控制接口:模型输出怎样变成机器人动作
- VLM/VLA:动作分块、层级策略与潜在技能
- 思考探索:具身智能现状:VLA、数据工厂与真实闭环
2025
27
- 量化:多模态与 VLA 模型量化
- 论文专题讲解:Embodied World Model Survey:具身世界模型综述
- 论文专题讲解:Video Prediction Policy:预测视觉表征训练机器人策略
- 论文专题讲解:VGGT:一次前向推理怎样恢复相机、深度、点云与轨迹
- 论文专题讲解:SpatialVLA:3D 空间表征接入 VLA
- 论文专题讲解:RT-2:把 web-scale VLM 变成会输出动作的 VLA
- 论文专题讲解:π0.5:开放世界 VLA
- 论文专题讲解:GR-3:少样本长时程 VLA
- 论文专题讲解:GR-2:Web 视频知识怎样迁移到机器人操作
- 论文专题讲解:DreamZero:世界动作模型为什么可以做零样本策略
- 论文专题讲解:Depth Anything:无标注图像怎样变成单目深度基础模型
- 论文专题讲解:Depth Anything V2:单目深度的数据配方
- 论文专题讲解:Depth Anything 3:任意视角的 3D 几何底座
- 具身智能:VLA、WAM 与世界模型系统图:谁负责什么
- 具身智能:VLA 数据、模型与评测:机器人数据到底该怎么读
- 具身智能:具身任务谱系与评测
- 具身智能:Sim2Real 与具身数据引擎:真实失败怎样变成下一轮能力
- 具身智能:Rerun:具身智能的多模态时序数据层
- 具身智能:具身规划、控制与安全:高层动作为什么还要过安全层
- 具身智能:Isaac Sim 与 RoboTwin 仿真数据链
- 具身智能:人机协作与交互评测
- 具身智能:家庭机器人流程与失败排查
- 具身智能:具身部署模式与安全案例
- 具身智能:一个任务跑通具身闭环:从看见到失败回流
- 具身智能:相机、深度与机器人视觉:图像怎样接回 3D 世界
- 具身智能:从零路线:先把闭环跑起来
- 具身智能:资产到轨迹:机器人数据生产线怎么跑通
1