多模态
2026
13
- 知识问答:多模态与生成模型 QA
- VLM/VLA:最小数学:理解、行动与预测后果
- VLM/VLA:世界模型高效训练接口
- VLM/VLA:视觉 Tokenizer 与连接器:视觉证据怎样被压成可用 token
- VLM/VLA:视频表征、状态记忆与长时序压缩
- VLM/VLA:多模态评测与失败模式
- VLM/VLA:架构:视觉证据怎样进入语言模型
- VLM/VLA:部署与安全
- VLM/VLA:数据与策略学习:从示范轨迹到闭环策略
- VLM/VLA:闭环恢复与失败分析
- VLM/VLA:评测与数据引擎
- VLM/VLA:动作表示与控制接口:模型输出怎样变成机器人动作
- VLM/VLA:动作分块、层级策略与潜在技能
2025
6
1