Charles's Castle
Charles's Castle
HOME
CATEGORIES
TAGS
ABOUT
ME
GITHUB
BLOG
STATISTICS
HOME
CATEGORIES
TAGS
ABOUT
ME
GITHUB
BLOG
STATISTICS
Archives
Photos
Essays
Friends
47
Tags
95
Categories
558
Posts
推理优化
2026
1
量化:最小数学:格子、误差和输出保持
2025
10
量化:服务栈与硬件选择
量化:运行时与部署框架
量化:多模态与 VLA 模型量化
量化:QLoRA:低显存微调,不是把模型“训练成 4bit”
量化:QAT、Kernel 与 KV Cache
量化:PTQ、GPTQ、AWQ 与 SmoothQuant:先找瓶颈,再分误差预算
量化:FP8 与混合精度推理:它不是一个 dtype 开关
量化:评测与部署清单
量化:方法对照表
量化:激活离群值:为什么量化常常败在 activation 上
1
EXIF
EXIF