knn回归

knn同样可应用于回归问题：

找出一个样本的k个邻居，把邻居的属性的平均值赋给该样本。

缺点：

注意：

k值越大，对噪声越不敏感，但可能造成欠拟合；k值越小，容易造成过拟合

1 2	n_dots=40 X=5*np.random.rand(n_dots,1)

1	Y=np.cos(X).ravel()

1	Y+=0.2*np.random.rand(n_dots)-0.1

from sklearn.neighbors import KNeighborsRegressor
k=5
knn=KNeighborsRegressor(n_neighbors=k)
knn.fit(X,Y)

均匀分布在0-5之间的包含500个数字的一维数组，对一维数组增加一个新的维度，变成二维数组，：在前面指的是为每个元素添加，：在后面指的是为所有元素添加

1	T=np.linspace(0,5,500)[:,np.newaxis]

1	y_pred=knn.predict(T)

1	print(knn.score(X,Y))

1 2	import matplotlib.pyplot as plt plt.figure(figsize=(10,6),dpi=144)

scatter用于绘制散点图

1	plt.scatter(X,Y,c='g',label='train_data' ,s=50)

plot可以用来表示连续的数据关系,绘制折线、线图、柱状图等

1	plt.plot(T,y_pred,c='r',label='prediction',linewidth=2)

1	plt.show()