week 8
0
无    2017-09-05 22:48:41    5    0
1.K-Means algorithm K均值算法是最普及的clustering算法,算法接受一个无标签的数据集,然后将数据聚类成不同组。本质上其是一个迭代算法,假设我们要将数据聚类成n组,其方法为: 首先随机选择k个点,作为cluster centroid,对于数据集中的每一个数据,将其与最近的聚类中心绑定,与其他的同一个中心点的所有点聚成一类,计算这些同一聚类的点的均值,并将聚类中心移动到这
week 1
0
无    2017-07-25 22:07:54    4    0
1.Supervised Learing 基本思想:数据集中每个样本都有相应的“正确答案”,我们可以根据这些答案进行预测。 eg:price of the house、breast cancer 分类:regression、classification 2.Unsupervised Learning 基本思想:数据集中的样本不能明确地反应一个“特征“,需要根据大量数据进行类聚。 eg:Goo
4/4