1. 概率论初步
    1. 初等概率定义的三个条件
    2. 全概率公式
    3. 贝叶斯公式
    4. 链式法则
    5. 常用概率分布
      1. 多项式分布
      2. 玻松分布
      3. 高斯分布
      4. Dirichlet 分布
  2. 信息论基础
    1. 常用概念
      1. 条件熵
      2. KL散度
    2. 最大熵原理
    3. 信息增益(information gain)
  3. 分类
    1. 模型
      1. 朴素贝叶斯
      2. KNN
      3. 决策树
        1. C4.5
      4. 支持向量机
        1. libsvm
      5. 最大熵模型
    2. 工具
  4. 聚类
    1. K-means
    2. 层次聚类
      1. 类型及其区别
    3. 算距离的方法
      1. single
      2. complete
    4. 工具
  5. 参数估计
    1. EM算法
    2. 蒙特卡洛算法
      1. Markov chain
      2. Markov 随机过程
      3. Gibbs采样算法
  6. 图模型
    1. 表示
      1. 有向图
      2. 无向图
    2. 学习算法(learning)
    3. 推断算法(inference)
      1. Sum-product算法
      2. 传播算法
    4. HMM
      1. 假设条件
      2. 前向和后向算法
    5. CRF
      1. 图模型表示
      2. 推理算法
      3. CRF++
    6. Topic Model
    7. Markov logic network(MLN)
  7. Topic Model
    1. pLSA
    2. LDA
      1. 图模型表示
      2. Gibbs 推理算法
    3. hLDA
    4. s-LDA
    5. LLDA
  8. 最优化
    1. 约束条件是等号的最优化问题
      1. lagrange乘子法
    2. 约束条件是不等号的凸优化问题
      1. 单纯形法
    3. 常用最优化算法
      1. 梯度下降法
      2. 模拟退火
      3. 爬山法
  9. 随机过程
    1. Markov 随机过程
    2. 随机游走
    3. 排队论
  10. 贝叶斯学习
    1. 贝叶斯学派和统计学派
    2. 损失函数
      1. 常用的损失函数
    3. 贝叶斯先验
      1. 四种常用的选取贝叶斯先验的方法
    4. 参数和超参数
    5. 示例:LDA的先验选取
  11. 信息检索
    1. 常用的检索模型
      1. 布尔模型
      2. 向量空间模型
      3. BM25
      4. 语言模型
    2. 评测指标
      1. MAP
      2. NDCG
    3. 开源工具
      1. Lucene
      2. Lemur
  12. 模型选择和特征选取
    1. 常用特征选择方法
    2. 模型选择方法
      1. AIC
      2. BIC
      3. HQ
    3. 各模型特点对比