Category: 训练 | Charles's Castle

Charles's Castle

Charles's Castle

HOME
CATEGORIES
TAGS
ABOUT
- ME
- GITHUB
- BLOG
- STATISTICS

HOME
CATEGORIES
TAGS
ABOUT

ME

GITHUB

BLOG

STATISTICS
Archives
Photos
Essays
Friends

训练

2026 19

训练：模型训练从零入门：把数据、目标和更新压力对齐
训练：W&B：训练实验追踪与证据链治理
训练：稳定性与故障排查
训练：Scaling Law 与训练经济学
训练：Scaling、课程学习与数据配比
训练：预训练、微调与对齐：把能力、行为和偏好分开看
训练：偏好数据与对齐失效
训练：后训练数据引擎与 Judge 模型
训练：目标函数、优化器与 LR 日程：训练压力怎样变成参数轨迹
训练：MTP 与投机解码
训练：Megatron、DeepSpeed 与 FSDP：训练栈选型先拆账
训练：低比特训练与数值格式：误差会被写回参数
训练：输入管线、Packing 与吞吐
训练：图片来源与授权
训练：评测与消融设计
训练：分布式训练与 Checkpoint：让长跑能快、能省、能恢复
训练：数据系统与吞吐优化
训练：数据质量、去重与治理
训练：集群运维与实验治理

1

© 2022 - 2026 Charles

558 posts in total 2222.4k words in total

VISITOR COUNT TOTAL PAGE VIEWS

POWERED BY Hexo THEME Redefine v2.9.0

Blog up for days hrs Min Sec

EXIF