机器学习

DeeLMind大约 3 分钟

机器学习

DeeLMind 提示

算法学习网站 MathPHopen in new window

什么是机器学习

机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点，到以“知识”为重点，再到以“学习”为重点的自然、清晰的脉络。显然，机器学习是实现人工智能的一个途径之一，即以机器学习为手段，解决人工智能中的部分问题。机器学习在近 30 多年已发展为一门多领域科际整合，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。

机器学习类型

分类(Classification)
回归(Regression)(预测)

机器学习主流算法

监督学习

1. 线性回归 (Linear Regression)

描述：通过线性关系建模，用于预测连续值。
应用：房价预测、销售预测等。

2. 支持向量机 (Support Vector Machines, SVM)

描述：寻找一个决策边界，使得样本点离该边界最远，用于分类和回归。
应用：图像分类、文本分类等。

3. 决策树 (Decision Trees)

描述：基于树状结构进行决策，通过对特征的递归分割来进行分类。
应用：医学诊断、金融风险评估等。

4. 随机森林 (Random Forest)

描述：集成学习方法，由多个决策树组成，通过投票进行分类或回归。
应用：图像识别、信用评分等。

5. K 近邻算法 (K-Nearest Neighbors, KNN)

描述：根据邻近样本进行分类，即样本的类别由其最近邻居的多数类别决定。
应用：手写数字识别、推荐系统等。

6. 朴素贝叶斯 (Naive Bayes)

描述：基于贝叶斯定理，假设特征之间相互独立，用于分类问题。
应用：垃圾邮件过滤、情感分析等。

7. 神经网络 (Neural Networks)

描述：通过多层神经元组成的网络进行学习，用于复杂模式识别。
应用：图像识别、语音识别等。

无监督学习

1. K 均值聚类 (K-Means Clustering)

描述：将样本分为 K 个簇，使得每个样本都属于离它最近的簇。
应用：图像分割、客户分群等。

2. 层次聚类 (Hierarchical Clustering)

描述：通过构建树形结构进行聚类，直到所有样本都属于一个簇。
应用：生物学分类、文档聚类等。

3. 主成分分析 (Principal Component Analysis, PCA)

描述：降维技术，通过找到数据中的主要成分来减少维度。
应用：数据可视化、特征提取等。

4. t-分布邻域嵌入 (t-Distributed Stochastic Neighbor Embedding, t-SNE)

描述：降维方法，用于可视化高维数据。
应用：可视化聚类结果、图像嵌入等。

5. 自编码器 (Autoencoder)

描述：通过学习数据的压缩表示，用于降维和特征学习。
应用：异常检测、图像去噪等。

6. 关联规则学习 (Association Rule Learning)

描述：发现数据中的关联规则，如频繁出现的项集。
应用：购物篮分析、交叉销售推荐等。

7. 高斯混合模型 (Gaussian Mixture Model, GMM)

描述：假设数据是由多个高斯分布混合而成，用于密度估计和聚类。
应用：图像分割、异常检测等。