机器学习1_2_3_4--梯度和牛顿算法

#一、符号说明 \(m\):样本数目（行数）<-->\(i\)某一行 \(n:\)特征数目（列数）<-->\(j\)某一列 \(x,y\):输入和输出变量 \(i^{th}\):training example<-->\((x^{(i)}, y{(j)})\) \(\theta\)学习参数 \(h_{\theta}(x)\):输出函数

#二、算法总结 ##1. 最小均方（误差）算法LMS 该算法是为了使损失函数最小。损失函数为： cost function.jpg 得到梯度下降的基本算法，下面会对其展开详细说明 gradient descent.jpg ###1.1 批量梯度下降缺点：不适合数据量很大的情况 ###1.2 随机梯度下降 stochastic gradient descent.jpg ###1.3 另外一种最小化\(J_{\theta}\)的算法最小二乘法 Least squares revisited.jpg \((J=0)\) ##2. 局部加权线性回归优点：在一定程度上防止了过拟合和欠拟合