重读经典——word2vec

为什么需要重读word2vec Word2vec原论文: Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean. Efficient estimation of word representations in vector space. CoRR, abs/1301.3781,2013. Tomas Mikolov, Ilya Sutskever, Kai Chen, Gregory S. Corrado, and Jeffrey Dean. Distributed representations of words and phrases and their compositionality. NIPS 2013. 其...

March 31, 2024 · 12 min · Monkeyzx

超长行为序列建模SDIM

SIM和ETA的问题 SIM通过类目从长序列中检索相关的items(hard-search)或者通过embedding inner product计算从长...

March 24, 2024 · 3 min · Monkeyzx

超长行为序列建模ETA

SIM的问题 前面介绍过阿里巴巴超长行为序列建模的方法SIM是two-stage,在预估的时候,SIM先通过target item从长行为序列中...

March 23, 2024 · 6 min · Monkeyzx

超长行为序列建模SIM

为什么推荐需要超长行为序列? 试想这么种场景,某个用户4个月前在某家店买了厕纸,2个月前又买了厕纸,然后中间又浏览了成千上万的其他东西,到现在...

March 21, 2024 · 5 min · Monkeyzx

Recap得物瀑布流双塔召回优化

背景 在得物做商品推荐期间,负责过一段时间的双塔召回优化,通过对负样本采用和难样本的优化,最终在保证其他指标不降的情况下DPV提升2%多。本文...

September 5, 2023 · 3 min · Monkeyzx

Rethinking DQN

原文来自自己很早前写的一篇公众号文章:Rethinking DQN Playing Atari with Deep Reinforcement Learning 为什么增加Replay Memory有效? 一个样本可能被多次随机采样到...

March 22, 2019 · 4 min · Monkeyzx

搜广推算法八股文

机器学习基础 AUC/F1,能手写代码实现 L1/L2正则化,区别 lightgbm/catboost/xgboost区别 激活函数 word2vec, Skip-Gr...

March 22, 2019 · 3 min · Monkeyzx

毕业季读过的那些书

这些年我一直提醒自己一件事情,千万不要自己感动自己。大部分人看似的努力,不过是愚蠢导致的。什么熬夜看书到天亮,连续几天只睡几小时,多久没放假...

January 2, 2016 · 11 min · Monkeyzx