Monkeyzx

重读经典——word2vec

为什么需要重读word2vec Word2vec原论文： Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean. Efficient estimation of word representations in vector space. CoRR, abs/1301.3781,2013. Tomas Mikolov, Ilya Sutskever, Kai Chen, Gregory S. Corrado, and Jeffrey Dean. Distributed representations of words and phrases and their compositionality. NIPS 2013. 其...

超长行为序列建模SDIM

SIM和ETA的问题 SIM通过类目从长序列中检索相关的items（hard-search）或者通过embedding inner product计算从长...

超长行为序列建模ETA

SIM的问题前面介绍过阿里巴巴超长行为序列建模的方法SIM是two-stage，在预估的时候，SIM先通过target item从长行为序列中...

超长行为序列建模SIM

为什么推荐需要超长行为序列？试想这么种场景，某个用户4个月前在某家店买了厕纸，2个月前又买了厕纸，然后中间又浏览了成千上万的其他东西，到现在...

Recap得物瀑布流双塔召回优化

背景在得物做商品推荐期间，负责过一段时间的双塔召回优化，通过对负样本采用和难样本的优化，最终在保证其他指标不降的情况下DPV提升2%多。本文...

Rethinking DQN

原文来自自己很早前写的一篇公众号文章：Rethinking DQN Playing Atari with Deep Reinforcement Learning 为什么增加Replay Memory有效？一个样本可能被多次随机采样到...

搜广推算法八股文

机器学习基础 AUC/F1，能手写代码实现 L1/L2正则化，区别 lightgbm/catboost/xgboost区别激活函数 word2vec, Skip-Gr...

毕业季读过的那些书

这些年我一直提醒自己一件事情，千万不要自己感动自己。大部分人看似的努力，不过是愚蠢导致的。什么熬夜看书到天亮，连续几天只睡几小时，多久没放假...