整理 Hexo、GitHub Pages 与 Redefine 主题搭建过程中的配置步骤、评论系统和常见问题。
-
Sticky
-
知识问答:具身智能与 VLA QA
这一页单独整理具身智能、VLA、机器人数据和闭环部署的高频问题。这里的易错点通常不是概念不会背,而是把 VLM 能力、视频生成能力、离线指标或 demo 结果过度外推到真实机器人执行。 基础定义与系统边界 Q:具身智能和普通多模态 AI 的关键区别是什么? 面试回答。 普通多模态 AI 多数停留在感知和问答:看图、读视
-
知识问答:世界模型 QA
这一页单独整理世界模型方向的高频问题。重点不是背 PlaNet、Dreamer、JEPA、Genie、WAM 这些名字,而是能在面试里讲清:模型预测什么、动作如何进入、效率来自哪里、什么证据能证明它可用于规划,什么证据只能说明视频生成或 demo 形态。 基础定义与能力边界 Q:世界模型到底是什么? 面试回答。 世界模
-
知识问答:多模态与生成模型 QA
这一页回答 VLM、视觉连接器、扩散模型、视频生成和多模态评测中的高频问题。世界模型和具身智能已经拆到独立页面:读世界模型请看 世界模型 QA,读 VLA 与机器人闭环请看 具身智能与 VLA QA。 VLM 与多模态表示 Q:VLM 和纯文本 LLM 的核心差别是什么? 面试回答。 纯文本 LLM 的输入主要是 to
-
知识问答:训练与对齐 QA
这一页回答预训练、微调、对齐、优化器、稳定性、分布式训练和实验治理中的高频问题。面试回答重点说清训练目标、数据流、公式含义和工程取舍。 预训练与训练基础 Q:大语言模型预训练到底在学什么? 面试回答。 主流 decoder-only LLM 的预训练目标是 next-token prediction:给定前面的 tok
-
知识问答:RAG、Agent 与评估 QA
这一页回答 RAG、embedding、rerank、Agent、tool calling、LLM-as-judge、幻觉、安全和在线评估中的高频问题。问题刻意覆盖面试里容易忽略的坑:检索和生成混淆、格式正确和事实正确混淆、demo 和线上可靠性混淆。 RAG 与检索 Q:RAG 解决的核心问题是什么?它不能解决什么?
-
知识问答:算子与性能 QA
这一页回答 GEMM、attention kernel、CUDA/Triton、FlashAttention、roofline、MFU 和 profiling 中的高频问题。面试时要把局部 kernel 加速、端到端吞吐、数值正确性和维护成本分开讲。 GPU 与矩阵计算基础 Q:为什么大模型里 GEMM 这么核心? 面
-
知识问答:推理服务与量化 QA
这一页回答 LLM 推理、服务系统、KV cache、batching、投机解码、运行时和量化中的高频问题。面试时要把 prefill、decode、显存、吞吐、尾延迟和质量回归分开讲。 推理基础与服务指标 Q:训练和推理为什么要分开看? 面试回答。 训练的目标是把参数学出来,核心瓶颈是数据、loss、优化器、反向传播
-
知识问答:基础与 Transformer QA
这一页用面试高频问法快速复盘机器学习基础、Transformer、tokenizer、attention、位置编码和解码策略。回答按技术面试的正常体量写:先给主回答,再补公式、机制拆解、追问和边界。 机器学习与深度学习基础 Q:机器学习和深度学习的核心差别是什么? 面试回答。 机器学习的核心是从数据中学习函数 $f t
-
参考与规范:知识博客化写作框架
这份框架服务于全站正文页:每篇文章要能独立阅读,每个板块又要能拼成完整专题。它借鉴公众号和知识博客常用的“先带入问题,再拆机制和边界”的节奏,但不复制外部文章的原文、标题或配图。 单篇文章的主线 一篇正文最好只回答一个主问题。开头先告诉读者:这是什么,为什么值得读,它解决什么问题,读完能做出什么判断。随后用一个直觉例子