公司网站开发费用计入什么科目哪些网站可以做外部锚文本
2026/4/18 10:22:12 网站建设 项目流程
公司网站开发费用计入什么科目,哪些网站可以做外部锚文本,创建官网需要多少钱,现在流行用什么语言做网站写在前面的话 ALS#xff08;交替最小二乘法#xff09;#xff0c;它是解决矩阵分解的“左右互搏术”。 但在机器学习的世界里#xff0c;还有另一位更通用的“超级英雄” —— SGD#xff08;随机梯度下降#xff09;。 如果说 ALS 是精密的“数学解析解”#xff08;…写在前面的话ALS交替最小二乘法它是解决矩阵分解的“左右互搏术”。但在机器学习的世界里还有另一位更通用的“超级英雄” ——SGD随机梯度下降。如果说 ALS 是精密的“数学解析解”每次都算出一个局部最优那么 SGD 就是一个探险家在误差的群山中一步步摸索最终找到宝藏最小误差。今天我们用最直观的方式拆解 SGD 是如何攻克推荐系统的。1. 我们的目标寻找最低的山谷我们在做矩阵分解时目标依然没变让预测分和真实分的误差越小越好。想象一下把“总误差”看作是地图上的海拔高度。如果参数设得烂预测不准海拔就在山顶误差大。如果参数设得好预测准海拔就在山谷误差小。我们的任务就是要把这两个矩阵用户表XXX和 电影表YYY里的几万个参数调整好让我们从山顶走到最低的山谷里去。2. 怎么走梯度下降 Gradient Descent想象你被蒙住双眼放在了山顶你想下山该怎么办2.1 摸那个“坡”你看不见全貌但你的脚能感觉到脚下的坡度。如果左脚高右脚低坡度向下你就往右迈一步。如果前脚高后脚低你就往后退一步。在数学上这个“坡度”就叫梯度 (Gradient)。梯度的方向总是指向山顶也就是误差变大的方向。所以为了下山减小误差我们要只要沿着梯度的反方向走。核心口诀新的位置 旧的位置 - (步长×\times×坡度)步长 (Learning Rate)非常关键步长太大容易扯着蛋甚至直接跨过山谷跑到对面上坡去了震荡。步长太小像蜗牛一样挪猴年马月才能下山收敛太慢。3. 为什么要“随机” (Stochastic)普通的梯度下降GD是把全班几千万个评分都对一遍算出总误差然后才迈出一步。优点走得稳方向准。缺点太慢了算一次要半天走一步累死人。这对于海量数据的淘宝、抖音来说是不可接受的。于是SGD (随机梯度下降)诞生了。3.1 醉汉的智慧SGD 的策略是我不管全班我随便抓一个学生随机采样一个评分看我给他预测得准不准。如果不准我立马调整参数然后再抓下一个……虽然单个样本可能会把方向带偏比如为了迎合一个特立独行的用户反而离大众口味远了走起路来跌跌撞撞像个醉汉。但因为 update 次数极其频繁在大方向上它依然会迅速滚向山谷。4. SGD 在矩阵分解中的实操步骤回到推荐系统SGD 是怎么更新参数的步骤详解随机抽样系统随机抽到一条数据张三给《战狼》打了 5 分。当前预测模型看一眼自己当前的参数比如说此时张三的动作分是 0.1战狼动作成分是 0.8。预测出0.1×0.80.080.1 \times 0.8 0.080.1×0.80.08分。计算误差误差e5−0.084.92e 5 - 0.08 4.92e5−0.084.92。误差巨大说明主要矛盾在于张三的动作分太低了或者战狼的动作分太低或者两者都低。立即修正 (Update)根据公式把“张三的动作分”调大一点把“战狼的动作分”也调大一点。注意这时候李四、王五的向量以及《泰坦尼克》的向量完全不动。只改张三和战狼。循环下一秒抽到了李四给《泰坦尼克》打分… 继续改。数学公式人话版新值旧值学习率×(误差×对方的值−正则化约束) \text{新值} \text{旧值} \text{学习率} \times (\text{误差} \times \text{对方的值} - \text{正则化约束})新值旧值学习率×(误差×对方的值−正则化约束)如果你误差大我就大改。对方的值越大说明对方特征显著这一单误差你的责任就越大你就得改越多。5. ALS vs SGD谁是王者特性ALS (交替最小二乘)SGD (随机梯度下降)计算方式精确解析解 (走楼梯)迭代逼近 (走斜坡)并行能力完美(Spark 标配)较难 (互相依赖)处理隐式反馈强项(没打分也能算)较麻烦实现难度较复杂很简单 (十几行代码)适用场景海量数据分布式计算增量更新、单机流式计算6. 图解 SGD下图展示了从山顶跌跌撞撞滚向红心最低点的过程。希望这个比喻能帮你理解 SGD 的精髓天下武功唯快不破

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询