超长行为序列建模SIM

为什么推荐需要超长行为序列? 试想这么种场景,某个用户4个月前在某家店买了厕纸,2个月前又买了厕纸,然后中间又浏览了成千上万的其他东西,到现在...

March 21, 2024 · 5 min · Monkeyzx

Recap得物瀑布流双塔召回优化

背景 在得物做商品推荐期间,负责过一段时间的双塔召回优化,通过对负样本采用和难样本的优化,最终在保证其他指标不降的情况下DPV提升2%多。本文...

September 5, 2023 · 3 min · Monkeyzx

Rethinking DQN

原文来自自己很早前写的一篇公众号文章:Rethinking DQN Playing Atari with Deep Reinforcement Learning 为什么增加Replay Memory有效? 一个样本可能被多次随机采样到...

March 22, 2019 · 4 min · Monkeyzx

搜广推算法八股文

机器学习基础 AUC/F1,能手写代码实现 L1/L2正则化,区别 lightgbm/catboost/xgboost区别 激活函数 word2vec, Skip-Gr...

March 22, 2019 · 3 min · Monkeyzx

毕业季读过的那些书

这些年我一直提醒自己一件事情,千万不要自己感动自己。大部分人看似的努力,不过是愚蠢导致的。什么熬夜看书到天亮,连续几天只睡几小时,多久没放假...

January 2, 2016 · 11 min · Monkeyzx