训练
2026
19
- 训练:模型训练从零入门:把数据、目标和更新压力对齐
- 训练:W&B:训练实验追踪与证据链治理
- 训练:稳定性与故障排查
- 训练:Scaling Law 与训练经济学
- 训练:Scaling、课程学习与数据配比
- 训练:预训练、微调与对齐:把能力、行为和偏好分开看
- 训练:偏好数据与对齐失效
- 训练:后训练数据引擎与 Judge 模型
- 训练:目标函数、优化器与 LR 日程:训练压力怎样变成参数轨迹
- 训练:MTP 与投机解码
- 训练:Megatron、DeepSpeed 与 FSDP:训练栈选型先拆账
- 训练:低比特训练与数值格式:误差会被写回参数
- 训练:输入管线、Packing 与吞吐
- 训练:图片来源与授权
- 训练:评测与消融设计
- 训练:分布式训练与 Checkpoint:让长跑能快、能省、能恢复
- 训练:数据系统与吞吐优化
- 训练:数据质量、去重与治理
- 训练:集群运维与实验治理
1