Posts

Twitter推荐系统概览

Twitter去年开源推荐系统代码到现在一年多了，一直没时间去看一看，今天想起来瞄了会，本文简单记录下。开源：系统代码：https://gi...

CVR建模技术梳理

在之前的工作中负责过一段时间转化率的建模，这里对转化率建模的技术作一个简单梳理。我把CVR建模中会遇到的主要问题分成3类（如图）：多目标建模...

ML建模如何融入先验信息

背景想要用ML模型拟合业务，但实际中经常会遇到类似下面的场景：二手车价格预估：同一辆车，预估的价格与里程应该是严格负相关的；保费预估：保额越...

重读经典——word2vec

为什么需要重读word2vec Word2vec原论文： Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean. Efficient estimation of word representations in vector space. CoRR, abs/1301.3781,2013. Tomas Mikolov, Ilya Sutskever, Kai Chen, Gregory S. Corrado, and Jeffrey Dean. Distributed representations of words and phrases and their compositionality. NIPS 2013. 其...

超长行为序列建模SDIM

SIM和ETA的问题 SIM通过类目从长序列中检索相关的items（hard-search）或者通过embedding inner product计算从长...