next-token-distribution.live
温度1.00
prompt机器学习是一门
next token p(·)8 candidates · top-k
研究
31.0%
关于
22.0%
让
15.0%
通过
11.0%
使
8.0%
用
5.0%
新兴
4.0%
交叉
4.0%
↑ 实时演示:模型对下一个 token 的概率分布 · 拖动温度滑块感受采样
three tracks
先打基础,再学应用,再追前沿
基础 是原理直觉——把核心算法和数学画给你看。应用 是工程落地——把方法变成能跑能改的东西。前沿 是研究跟读——把当月有意思的论文拆成可玩的小 demo。 三条独立可读,关键处相互跳转。
primary
基础 · 原理
从公式画起
数学直觉、经典 ML、深度学习——把核心算法的几何意义和概率视角都画给你看。每篇末尾还有「这个想法在前沿里是怎样的」。
- 01线性代数的几何直觉数学
- 02决策树与集成学习经典 ML
- 03SVM 与核技巧经典 ML
- 04k-means / GMM经典 ML
- 05PCA · SVD:低秩的力量→ 桥接 LoRA
- 06注意力机制★ 重点
- 07Transformer 一步步拆解深度学习
+ 17 篇 · 共 24 篇
进入基础应用 · 工程
能跑能改
把方法落到工程:怎么写 prompt、搭 RAG、做 Agent、微调一个小模型——以及更多。
- 01大模型是怎么“说话”的Token · 采样
- 02Prompt 工程的边界交互
- 03RAG 从零搭建Embedding
- 04Function Calling / Tool Use结构化输出
- 05Agent:从 ReAct 到规划循环 · 记忆
- 06微调入门:LoRA 图解低秩分解
前沿 · 研究
paper → 可玩 demo
把当月最有意思的论文(o1、Mamba、DPO 等)拆成普通人能跑、能改的小演示。
- 01推理模型:从 CoT 到 o1 / R1推理
- 02长上下文:RoPE → YaRN上下文
- 03多模态:CLIP → 原生融合多模态
- 04后训练对齐:RLHF → DPO对齐
- 05MoE 与稀疏激活架构
- 06状态空间模型:Mamba / RWKV架构
- 07推理优化:量化 / 投机解码工程
+ 9 篇 · 共 16 篇
进入前沿动起来的概念
梯度下降、注意力、采样温度——能拖、能看、能感受。读完一篇等于把概念在脑子里跑了一遍。
双线交织
想直接上手 LLM 应用?走主线。想真正搞懂注意力机制?切到支线。两条线在关键处自动跳转。
中文原创
不是翻译。中文世界第一手的解释和类比,配套也是中文写就的代码与术语对照。