主页 - Jensen's Page

测试 flowchart LR x_input[0.2] y_input[2] x(x\nV1=0.2) y(y\nV2=2) one_minus_x(1-x\nV3=1 - V1=0.8) one_minus_y(1-y\n V6=1-y = -1) log_x(log\nV4=logV1=-1.60934) log_one_minus_x(log\nV5 =logV3=-0.22314) mul_logx_y(mul\nV8=V2*V4=-3.218875) mul_one_minus_y_log_one_minus_x(mul\nV7=V5*V6=0.223143) add(add\nV9=...

众所周知，在机器学习中梯度下降是一种广泛使用的极值点搜索算法，其执行流程可以很简单地概括为：求取函数在当前点的梯度方向，然后往梯度方向迈一小步，到达函数的下一个点，不断循环直到收敛，这个过程也常被通俗地称为下山法。如果从常识来看，这似乎是一件很显然的事，毕竟梯度指示了你下山的方向，但如果真要细究这件事就会有点说不清了：凭什么说沿梯度方向前进就一定能到达极值点？这篇文章我们就来仔细地讨论这件事。最优性证明我们给出梯度下降的数学描述：假设关于 $d$ 维变量 $\vec{X} = (x_1, x2, \cdots, x_d)$ 的实函数 $F(\vec{X})$ 在点 $\vec{X}_t$ 处有定义且可导，为了最小化 $F(\vec{X})$，则变量 $\vec{X}$ 的迭代公...

这个博客后续会编写一系列推荐系统相关的文章，从数据安全的角度，为了避免使用公司内部的数据，我们将会采用公共的数据集进行讲解，这里我们将介绍第一份数据，也就是阿里巴巴提供的淘宝用户购物行为数据集 UserBehavior 。UserBehavior 是一份公开数据集，包含了 2017 年 11 月 25 日至 2017 年 12 月 3 日之间，有行为的约一百万随机用户的所有行为（行为包括点击、购买、加购、喜欢），用于隐式反馈推荐问题的研究。数据概述将数据集下载解压后可以看到，整个数据集只有一个文件 UserBehavior.csv，数据的组织形式和 MovieLens-20M 类似，即数据集的每一行表示一条用户行为，由用户 ID、商品 ID、商品类目 ID、行为类型和行为时间...

背景对于大部分的广告或推荐算法团队而言，都会通过模型对每个商品计算出一个 CTR 打分和 CVR 打分，然后将这两个模型的打分综合起来计算一个排序分数 RankScore，最后按 RankScore 倒排序阶段一定数量的商品送入重排。在推荐场景下，RankScore 的计算公式一般为 \[RankScore = ctr^{ctrPow}*cvr^{cvrPow}*price^{pricePow}\] 因此可以近似地认为 RankScore = GMV Score，而在广告场景下，需要考虑广告出价，因此一般会加上一个 cpmScore 和 GMV Score 的权重，也就是 \[RankScore = ctr^{ctrPow}*bid + gmvWeight * ctr^{...

这个博客后续会编写一系列推荐系统相关的文章，从数据安全的角度，为了避免使用公司内部的数据，我们将会采用公共的数据集进行讲解，这里我们将介绍第一份数据，也就是阿里巴巴提供的淘宝用户购物行为数据集 UserBehavior 。UserBehavior 是一份公开数据集，包含了 2017 年 11 月 25 日至 2017 年 12 月 3 日之间，有行为的约一百万随机用户的所有行为（行为包括点击、购买、加购、喜欢），用于隐式反馈推荐问题的研究。数据概述将数据集下载解压后可以看到，整个数据集只有一个文件 UserBehavior.csv，数据的组织形式和 MovieLens-20M 类似，即数据集的每一行表示一条用户行为，由用户 ID、商品 ID、商品类目 ID、行为类型和行为时间戳...

主页

测试

梯度下降中的数学原理

淘宝用户购物行为数据集

机制参数中指数项的作用

淘宝用户购物行为数据集