机器学习第一课
2020.05.26
由于以后的研究方向要用到机器学习方面的知识,问了一个大佬,他推荐:机器学习的话看吴恩达的网课、书的话看周志华的西瓜书、李航的统计学习方法。
视频链接:
机器学习·周志华这节课程讲了机器学习的概念、监督学习、无监督学习。
机器学习的概念
以前老旧的的定义是在没有明确设置的情况下,是计算机具有学习能力。
新的定义为计算机程序从经验E(Experience)中学习,解决某一任务T(Task),进行某一性能度量P(Performance),通过P测定在T上的表现因经验E而提高。
监督学习
给算法一个数据集,其中包含正确答案,在监督学习中,对于数据集中的每个样本,想要通过算法预测,得出”正确答案“。
①回归问题:预测连续的数值
通过二次拟合或二次多项式使曲线拟合更好。
预测房价②分类问题
预测一个离散问题输出0或1。
分类问题的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。根据类别的数量还可以进一步将分类问题划分为二元分类(binary classification)和多元分类(multiclass classification)。
通过肿块规模大小来预测肿瘤是恶性还是良性无监督学习
给算法大量的数据,找出数据的类型结构
①聚类算法
谷歌新闻:将相同的故事放在同一个专题。
市场细分:根据客户信息库,自动找出不同的市场分割,将客户分到不同的细分市场。
天文数据分析:星系形成理论(怎么将聚类算法应用到天文学的研究)。
②鸡尾酒会算法
该问题描述的是给定混合信号,如何分离出鸡尾酒会中同时说话的每个人的独立信号。当有N个信号源时,通常假设观察信号也有N个(例如N个麦克风或者录音机)。
总结
学会先用Octave建立原型,在用其他编程语言,会更有效率。
本文为我原创