数据与评测
2026
33
- 思考探索:世界模型驱动的机器人数据飞轮:能持续生产经验的系统,才是真正的基础设施
- 具身智能:机器人数据里的 `state` 和 `action`:不要被字段名骗了
- 知识问答:具身智能与 VLA QA
- 知识问答:世界模型 QA
- 知识问答:多模态与生成模型 QA
- 知识问答:训练与对齐 QA
- 知识问答:RAG、Agent 与评估 QA
- 知识问答:算子与性能 QA
- 知识问答:推理服务与量化 QA
- 知识问答:基础与 Transformer QA
- 参考与规范:知识博客化写作框架
- 论文专题讲解:MapAnything:统一前向 Metric 3D 重建骨干
- 基础知识:数据与数据集基础:模型真正吃下去的不是“文件夹”
- 参考与规范:图片资产治理台账
- 参考与规范:图片与公式质量标准
- 训练:模型训练从零入门:把数据、目标和更新压力对齐
- 参考与规范:证据判断原则
- 参考与规范:全站效率技术覆盖矩阵
- 参考与规范:全站证据与复现状态标准
- 参考与规范:Claim Ledger:世界模型高效训练证据账
- 世界模型:评测:不要让好看的未来骗过决策系统
- 世界模型:开发路线:先把数据、动作和评测接成闭环
- 世界模型:数据引擎与自我改进
- VLM/VLA:多模态评测与失败模式
- VLM/VLA:数据与策略学习:从示范轨迹到闭环策略
- VLM/VLA:评测与数据引擎
- 训练:Scaling、课程学习与数据配比
- 训练:偏好数据与对齐失效
- 训练:后训练数据引擎与 Judge 模型
- 训练:评测与消融设计
- 训练:数据系统与吞吐优化
- 训练:数据质量、去重与治理
- 思考探索:具身智能现状:VLA、数据工厂与真实闭环
2025
16
- 量化:评测与部署清单
- 论文专题讲解:Kimi K2:MuonClip、万亿 MoE 与 Agent 数据
- 论文专题讲解:GPT-4o System Card:Omni 安全与多模态评测
- 论文专题讲解:ZeRO:数据并行真正浪费的是训练状态副本
- 论文专题讲解:Depth Anything V2:单目深度的数据配方
- 算子与编译器:Roofline 建模与性能案例
- 算子与编译器:CUDA 编程模型与内存层次:先画数据怎么走
- 推理:可观测性与在线评测
- 基础知识:数据划分与评测指标:一个分数为什么不够
- 具身智能:VLA 数据、模型与评测:机器人数据到底该怎么读
- 具身智能:具身任务谱系与评测
- 具身智能:Sim2Real 与具身数据引擎:真实失败怎样变成下一轮能力
- 具身智能:Rerun:具身智能的多模态时序数据层
- 具身智能:Isaac Sim 与 RoboTwin 仿真数据链
- 具身智能:人机协作与交互评测
- 具身智能:资产到轨迹:机器人数据生产线怎么跑通
1