ZeroHour's Site

Back

dl-1Blur image

机器学习中的关键组件#

  1. 用来学习的数据(data)
  2. 转换数据的模型(model)
  3. 量化模型有效性的目标函数(objective function)/ 损失函数(loss function)
  4. 搜索出最佳参数,最小化损失函数的优化算法,大多使用梯度下降(gradient decent)

机器学习问题#

1. 监督学习(supervised learning)#

  1. 回归(regression)
  2. 分类(classification)
  3. 标记 / 多标签分类(multi-label classification)
  4. 搜索(search)
  5. 推荐系统(recommender system)
  6. 序列学习(sequence learning)

2. 无监督学习(unsupervised learning)#

  1. 聚类(clustering)
  2. 主成分分析(PCA - principal component analysis)
  3. 因果关系(causality)和概率图模型(probabilistic graphical model)
  4. 生成对抗性网络(GAN - generative adversarial network)

3. 与环境互动#

4. 强化学习(reinforcement learning)#

强化学习是机器学习的一个子领域,其中模型通过与环境交互来学习如何做出决策。

alt text

强化学习的目标是产生一个好的策略(policy)

当环境可被完全观察到时,强化学习问题被称为马尔可夫决策过程(markov decision process)。 当状态不依赖于之前的操作时,我们称该问题为上下文赌博机(contextual bandit problem)。 当没有状态,只有一组最初未知回报的可用动作时,这个问题就是经典的多臂赌博机(multi-armed bandit problem)。

dl-1
https://zerohour.github.io/blog/deep-learning/1%E5%BC%95%E8%A8%80
Author ZeroHour
Published at 2025年8月24日
Comment seems to stuck. Try to refresh?✨