2026 春 · 全新中文 AI 教程

用动画
看懂 AI

看清楚机器是怎么学习的。
从最简单的回归，到最前沿的大模型。

开始学习看旗舰文章：注意力机制

基础: 原理直觉
应用: 工程落地
前沿: 研究跟读

next-token-distribution.live

温度1.00

prompt机器学习是一门

next token p(·)8 candidates · top-k

研究

31.0%

关于

22.0%

让

15.0%

通过

11.0%

使

8.0%

用

5.0%

新兴

4.0%

交叉

4.0%

↑ 实时演示：模型对下一个 token 的概率分布 · 拖动温度滑块感受采样

three tracks

先打基础，再学应用，再追前沿

基础是原理直觉——把核心算法和数学画给你看。应用是工程落地——把方法变成能跑能改的东西。前沿是研究跟读——把当月有意思的论文拆成可玩的小 demo。三条独立可读，关键处相互跳转。

primary

基础 · 原理

从公式画起

数学直觉、经典 ML、深度学习——把核心算法的几何意义和概率视角都画给你看。每篇末尾还有「这个想法在前沿里是怎样的」。

01线性代数的几何直觉数学
02决策树与集成学习经典 ML
03SVM 与核技巧经典 ML
04k-means / GMM经典 ML
05PCA · SVD：低秩的力量→ 桥接 LoRA
06注意力机制★ 重点
07Transformer 一步步拆解深度学习

+ 17 篇 · 共 24 篇

进入基础

应用 · 工程

能跑能改

把方法落到工程：怎么写 prompt、搭 RAG、做 Agent、微调一个小模型——以及更多。

01大模型是怎么“说话”的Token · 采样
02Prompt 工程的边界交互
03RAG 从零搭建Embedding
04Function Calling / Tool Use结构化输出
05Agent：从 ReAct 到规划循环 · 记忆
06微调入门：LoRA 图解低秩分解

进入应用

前沿 · 研究

paper → 可玩 demo

把当月最有意思的论文（o1、Mamba、DPO 等）拆成普通人能跑、能改的小演示。

01推理模型：从 CoT 到 o1 / R1推理
02长上下文：RoPE → YaRN上下文
03多模态：CLIP → 原生融合多模态
04后训练对齐：RLHF → DPO对齐
05MoE 与稀疏激活架构
06状态空间模型：Mamba / RWKV架构
07推理优化：量化 / 投机解码工程

+ 9 篇 · 共 16 篇

进入前沿

featured

先从这三篇开始

查看全部 →

★ New

基础 · 01 · 12 min

线性代数的几何直觉

矩阵不是表格，是空间的扭曲。拖一拖把网格扭起来，看清矩阵到底在做什么。

★ Starred

基础 · 06 · 14 min

注意力机制的可视化

Query、Key、Value 到底在做什么？拖动光标看每个 token 关注谁，温度如何改变分布。

Pending

应用 · 03 · 18 min

RAG 从零搭建

嵌入空间长什么样？检索为什么会失败？把文档切片、向量化、召回三步骤都画给你看。

动起来的概念

梯度下降、注意力、采样温度——能拖、能看、能感受。读完一篇等于把概念在脑子里跑了一遍。

双线交织

想直接上手 LLM 应用？走主线。想真正搞懂注意力机制？切到支线。两条线在关键处自动跳转。

中文原创

不是翻译。中文世界第一手的解释和类比，配套也是中文写就的代码与术语对照。

用动画看懂 AI