快捷搜索:

机器学习第一课

2020.05.26

由于以后的研究方向要用到机器学习方面的知识,问了一个大佬,他推荐:机器学习的话看吴恩达的网课、书的话看周志华的西瓜书、李航的统计学习方法。

视频链接:

机器学习·周志华


统计学习方法·李航

这节课程讲了机器学习的概念、监督学习、无监督学习。

机器学习的概念

以前老旧的的定义是在没有明确设置的情况下,是计算机具有学习能力。

新的定义为计算机程序从经验E(Experience)中学习,解决某一任务T(Task),进行某一性能度量P(Performance),通过P测定在T上的表现因经验E而提高。

监督学习

给算法一个数据集,其中包含正确答案,在监督学习中,对于数据集中的每个样本,想要通过算法预测,得出”正确答案“。

①回归问题:预测连续的数值

通过二次拟合或二次多项式使曲线拟合更好。

预测房价

②分类问题

预测一个离散问题输出0或1。

分类问题的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。根据类别的数量还可以进一步将分类问题划分为二元分类(binary classification)和多元分类(multiclass classification)。

通过肿块规模大小来预测肿瘤是恶性还是良性

无监督学习

给算法大量的数据,找出数据的类型结构

①聚类算法

谷歌新闻:将相同的故事放在同一个专题。

市场细分:根据客户信息库,自动找出不同的市场分割,将客户分到不同的细分市场。

天文数据分析:星系形成理论(怎么将聚类算法应用到天文学的研究)。

②鸡尾酒会算法

该问题描述的是给定混合信号,如何分离出鸡尾酒会中同时说话的每个人的独立信号。当有N个信号源时,通常假设观察信号也有N个(例如N个麦克风或者录音机)。


不同的说话者到麦克风的距离不同


svd-奇异值分解

总结

学会先用Octave建立原型,在用其他编程语言,会更有效率。


本文为我原创

标签: 日常

您可能还会对下面的文章感兴趣: