技术报告
2025
9
- 论文专题讲解:Qwen3.5-Omni:Thinker-Talker 与全模态 Agent
- 论文专题讲解:Qwen3:Thinking 模式、36T 预训练与蒸馏
- 论文专题讲解:Nemotron 3 Super:Mamba-MoE 与异步多环境 RL
- 论文专题讲解:Kimi K2:MuonClip、万亿 MoE 与 Agent 数据
- 论文专题讲解:GPT-4o System Card:Omni 安全与多模态评测
- 论文专题讲解:Gemini 2.5:动态 Thinking 与长上下文 Agent
- 论文专题讲解:DeepSeek-V4:百万上下文与 FP4 后训练
- 论文专题讲解:DeepSeek-V3:671B MoE、MLA 与 FP8 训练
- 论文专题讲解:DeepSeek-R1:RL 激发推理能力
1