Skip to content

机器学习

基本概念

在开始一切的学习之前,你有必要了解一些基本的概念,这些概念会贯穿你在人工智能领域的始终,其中包括:

  • 数据集/训练集/验证集/测试集
  • 模型
  • 训练/优化
  • 拟合/过拟合/欠拟合
  • 特征工程
  • 正则化
  • 交叉验证
  • 损失函数
  • 梯度下降
  • 模型评估指标
  • 数据预处理
  • 归一化/标准化
  • 数据增强
  • ......

上述是一个会随补充不断更新的列表,其中大多数的内容你可以直接通过ChatGPT获得确切的答案,要是进行严谨的分类,这些内容属于人工智能领域中的“八股”,既是基本概念,在将来也多半会无处不在。

INFO

以上内容随内容量增多,可能会单独开设一个章节。

反向传播

反向传播作为深度学习领域最为常见的优化算法,基本是现代人工智能领域中优化的唯一方法,相关的原理无需详细了解,但是需要对其具有一个基本的概念,这很重要。

机器学习算法

传统的机器学习算法往往可以为现代的算法带来一定的启发,甚至说一些取得了较高性能的方法可能完全是过去方法的炒冷饭。

网络上充斥着大量的机器学习算法的教程,这些教程繁多,而往往营造了一种焦虑,在此对此类焦虑的核心观点进行总结与驳斥,或许可以帮助读者认清这一领域中的真相:

  • 必须先学好机器学习才可以学好深度学习:完全不是。正如上文所说,唯一需要了解的便是反向传播算法,除此之外,机器学习的学习仅可以帮助你对于人工智能的知识版图带来一种全面的认知,以及为深度学习的算法设计带来一些启发。这些优点看似诱人,但是在实际的科研过程中,事实上依然罕有派上用场的机会。
  • 机器学习算法必须要学全:完全不是。网上存在大量的教程,诸如“12种主流机器学习算法”、“9种常见机器学习算法”,或者不同的教材中给出的算法种类与数量也并不相同,往往容易令读者产生集邮心理,也就是必须全部学完才好。这往往使得读者将精力放在了资料的收集与整理,而对于大量的资料,心生畏惧而没有动力进一步学习。事实上,假如一个算法足够重要,那么其一定会出现在每一个教材中,因此无需担心错过重要的算法等。
  • ......

假如希望系统的学习,依然有一些书籍与视频教程是值得推荐的:

  • 白板推导 是中文视频教程中质量较高的内容,step by step 推导了机器学习领域中的重要算法。
  • 国外的知名课程 CS229(by Andrew Ng)也是广受赞誉的课程,在国内视频网站也可以找到压制字幕的汉化版本。
  • 《机器学习》(周志华,ISBN:9787302423287)是被读者广泛推荐的数据,又名西瓜书。
  • 《统计学习方法》(李航,ISBN:9787302517276)是笔者青睐有加的一本教程,私以为其提供了更加优秀的学习曲线,知识的讲解也十分的详尽。

Released under the MIT License.