主页

测试

测试 flowchart LR x_input[0.2] y_input[2] x(x\nV1=0.2) y(y\nV2=2) one_minus_x(1-x\nV3=1 - V1=0.8) one_minus_y(1-y\n V6=1-y = -1) log_x(log\nV4=logV1=-1.60934) log_one_minus_x(log\nV5 =logV3=-0.22314) mul_logx_y(mul\nV8=V2*V4=-3.218875) mul_one_minus_y_log_one_minus_x(mul\nV7=V5*V6=0.223143) add(add\nV9=...

阅读更多

梯度下降中的数学原理

众所周知,在机器学习中梯度下降是一种广泛使用的极值点搜索算法,其执行流程可以很简单地概括为:求取函数在当前点的梯度方向,然后往梯度方向迈一小步,到达函数的下一个点,不断循环直到收敛,这个过程也常被通俗地称为下山法。如果从常识来看,这似乎是一件很显然的事,毕竟梯度指示了你下山的方向,但如果真要细究这件事就会有点说不清了:凭什么说沿梯度方向前进就一定能到达极值点?这篇文章我们就来仔细地讨论这件事。 最优性证明 我们给出梯度下降的数学描述:假设关于 $d$ 维变量 $\vec{X} = (x_1, x2, \cdots, x_d)$ 的实函数 $F(\vec{X})$ 在点 $\vec{X}_t$ 处有定义且可导,为了最小化 $F(\vec{X})$,则变量 $\vec{X}$ 的迭代公...

阅读更多

淘宝用户购物行为数据集

这个博客后续会编写一系列推荐系统相关的文章,从数据安全的角度,为了避免使用公司内部的数据,我们将会采用公共的数据集进行讲解,这里我们将介绍第一份数据,也就是阿里巴巴提供的淘宝用户购物行为数据集 UserBehavior 。UserBehavior 是一份公开数据集,包含了 2017 年 11 月 25 日至 2017 年 12 月 3 日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢),用于隐式反馈推荐问题的研究。 数据概述 将数据集下载解压后可以看到,整个数据集只有一个文件 UserBehavior.csv​,数据的组织形式和 MovieLens-20M 类似,即数据集的每一行表示一条用户行为,由用户 ID、商品 ID、商品类目 ID、行为类型和行为时间...

阅读更多

机制参数中指数项的作用

背景 对于大部分的广告或推荐算法团队而言,都会通过模型对每个商品计算出一个 CTR 打分和 CVR 打分,然后将这两个模型的打分综合起来计算一个排序分数 RankScore,最后按 RankScore 倒排序阶段一定数量的商品送入重排。 在推荐场景下,RankScore 的计算公式一般为 \[RankScore = ctr^{ctrPow}*cvr^{cvrPow}*price^{pricePow}\] 因此可以近似地认为 RankScore = GMV Score,而在广告场景下,需要考虑广告出价,因此一般会加上一个 cpmScore 和 GMV Score 的权重,也就是 \[RankScore = ctr^{ctrPow}*bid + gmvWeight * ctr^{...

阅读更多

淘宝用户购物行为数据集

这个博客后续会编写一系列推荐系统相关的文章,从数据安全的角度,为了避免使用公司内部的数据,我们将会采用公共的数据集进行讲解,这里我们将介绍第一份数据,也就是阿里巴巴提供的淘宝用户购物行为数据集 UserBehavior 。UserBehavior 是一份公开数据集,包含了 2017 年 11 月 25 日至 2017 年 12 月 3 日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢),用于隐式反馈推荐问题的研究。 数据概述 将数据集下载解压后可以看到,整个数据集只有一个文件 UserBehavior.csv,数据的组织形式和 MovieLens-20M 类似,即数据集的每一行表示一条用户行为,由用户 ID、商品 ID、商品类目 ID、行为类型和行为时间戳...

阅读更多