Charles's Castle

This is Charles's Castle

Archives Photos Essays Friends

Charles

Lv8

Categories

558

Posts

论文专题讲解：DeepSeek-R1：RL 激发推理能力

论文题名： DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning。作者： DeepSeek-AI、Daya Guo、Dejian Yang、Haowei Zhang、Junxiao Song、Peiyi W
2025-10-30
AI

>

论文专题讲解
AI

| 论文专题

| 强化学习
Read more论文专题讲解：DeepSeek-R1：RL 激发推理能力
论文专题讲解：Low-bit LLM Survey：低比特大模型从格式到推理系统

论文题名： A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms。作者： Ruihao Gong、Yifu Ding、Zining Wang、Chengtao Lv、Xingyu Zheng、Jinyang Du、Haot
2025-10-28
AI

>

论文专题讲解
AI

| 推理

| 量化
Read more论文专题讲解：Low-bit LLM Survey：低比特大模型从格式到推理系统
论文专题讲解：KVSlimmer：非对称 KV 合并的数学与工程

论文题名： KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging。作者： Lianjun Liu、Hongli An、Weiqi Yan、Xin Du、Shengchuan Zhang、Huazhon
2025-10-27
AI

>

论文专题讲解
AI

| 推理

| 论文专题
Read more论文专题讲解：KVSlimmer：非对称 KV 合并的数学与工程
论文专题讲解：Fast-FoundationStereo：实时 Zero-Shot 双目匹配

论文题名： Fast-FoundationStereo: Real-Time Zero-Shot Stereo Matching。作者： Bowen Wen、Shaurya Dewan、Stan Birchfield。机构： NVIDIA。时间 / 主题： 2025-12；高效推理。 arXiv / 官方报告：
2025-10-25
AI

>

论文专题讲解
AI

| 推理

| 论文专题
Read more论文专题讲解：Fast-FoundationStereo：实时 Zero-Shot 双目匹配
论文专题讲解：EAGLE：为什么 draft 不一定要是一个小模型

论文题名： EAGLE: Speculative Sampling Requires Rethinking Feature Uncertainty。作者： Yuhui Li、Fangyun Wei、Chao Zhang、Hongyang Zhang。机构：未在公开元数据中稳定解析；以 arXiv/PDF 或官方页
2025-10-23
AI

>

论文专题讲解
AI

| 推理

| 论文专题
Read more论文专题讲解：EAGLE：为什么 draft 不一定要是一个小模型
论文专题讲解：EAGLE-3：为什么 draft model 要在训练时“见过自己犯错”

论文题名： EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test。作者： Yuhui Li、Fangyun Wei、Chao Zhang、Hongyang Zhang。机构： Peking
2025-10-22
AI

>

论文专题讲解
AI

| 推理

| 论文专题
Read more论文专题讲解：EAGLE-3：为什么 draft model 要在训练时“见过自己犯错”
论文专题讲解：EAGLE-2：用动态 Draft Tree 加速投机解码

论文题名： EAGLE-2: Faster Inference of Language Models with Dynamic Draft Trees。作者： Yuhui Li、Fangyun Wei、Chao Zhang、Hongyang Zhang。机构：未在公开元数据中稳定解析；以 arXiv/PDF 或官
2025-10-20
AI

>

论文专题讲解
AI

| 推理

| 论文专题
Read more论文专题讲解：EAGLE-2：用动态 Draft Tree 加速投机解码
论文专题讲解：ZeRO：数据并行真正浪费的是训练状态副本

论文题名： ZeRO: Memory Optimizations Toward Training Trillion Parameter Models。作者： Samyam Rajbhandari、Jeff Rasley、Olatunji Ruwase、Yuxiong He。机构：未在公开元数据中稳定解析；以 ar
2025-10-18
AI

>

论文专题讲解
AI

| 数据与评测

| 基础知识
Read more论文专题讲解：ZeRO：数据并行真正浪费的是训练状态副本
论文专题讲解：SLA / SLA2：DiT 稀疏线性 Attention

论文题名： SLA2: Sparse-Linear Attention with Learnable Routing and QAT。作者： Jintao Zhang、Haoxu Wang、Kai Jiang、Kaiwen Zheng、Youhe Jiang、Ion Stoica、Jianfei Chen、Jun Z
2025-10-16
AI

>

论文专题讲解
AI

| 基础知识

| 论文专题
Read more论文专题讲解：SLA / SLA2：DiT 稀疏线性 Attention
论文专题讲解：Muon：LLM 预训练优化器

论文题名： Muon is Scalable for LLM Training。作者： Jingyuan Liu、Jianlin Su、Xingcheng Yao、Zhejun Jiang、Guokun Lai、Yulun Du、Yidao Qin、Weixin Xu、Enzhe Lu、Junjie Yan 等（共
2025-10-15
AI

>

论文专题讲解
AI

| 基础知识

| 论文专题
Read more论文专题讲解：Muon：LLM 预训练优化器

1…13 141516 17…56