召回算法
近日读到一篇非常不错的文章,忍不住转载过来,方便日后学习查阅,作者是新浪微博的张俊林,之前有幸听过他在线下的技术分享,印象深刻。这篇文章涵盖推荐系统最重要的三个环节:召回、排序、重排序涉及的相关技术路线,通过近两年的经典案例和论文,归纳总结了相关技术的发展演化趋势。 本文在原文的基础上,添加了相关论文的下载链接,并为了提高阅读性,文章排版稍有修改。 原文...
应用综述 上一篇文章我们提到 Embedding 的源头、原理、以及在推荐系统场景下常用的几种延伸方法,这篇文章则通过解读 YouTube、Airbnb、Alibaba 的三篇经典论文,来总结 Embedding 在工业界的一些用法和技巧,这三篇论文亮点众多,提供的经验非常值得我们去细细品味和借鉴。这篇文章篇幅较多,几乎把三篇论文的重要内容都进行了解读和总...
自 Embedding 的概念问世以来,Embedding 的探索和应用就没有停止过,Word2Vec、Sentence2Vec、Doc2Vec、Item2Vec,甚至 Everything2Vec。对,“万物皆可 Embedding”。几年来,Embedding 在推荐系统中的应用也越来越多,方式众多,技法新颖。 在之前的文章中,《文本内容分析算法》和 ...
简介 推荐领域的人一般都会听说过十年前 Netflix Prize 的那场比赛,这一年可以说是推荐算法的春天,从比赛中诞生了众多推荐算法,而矩阵分解就是其中非常著名的一个。矩阵分解(Matrix Factorization,FM)是协同过滤的一个分支算法,在推荐领域具有崇高的地位,因为它同时兼具了协同过滤、隐语义以及机器学习的特性,再加上矩阵分解易于实现和...
简介 协同过滤(Collaborative filtering,CF)与基于内容的推荐算法一样,也是一个非常古老的推荐算法。但是直至今日,协同过滤依然是应用最广泛的推荐算法,在推荐领域占有极其重要的地位,甚至 “协同过滤” 一度成为推荐系统的代名词。按维基百科的说法,协同过滤有广义和狭义两种定义,广义协同过滤是指采用某项技术,对多源数据(如不同的代理、视点...
简介 基于内容的推荐算法(Content-Based Recommendations,CB)非常古老,应该是最早被使用的推荐算法,虽是一个年代久远的算法,但即便放在深度学习十分火热的当下,基于内容的推荐算法依然被工业界广泛使用,足以证明其具有不可替代的优势,也经受了时间的检验。 基于内容的推荐系统是利用物品的内容信息来进行推荐的一种方法,最早主要是应用在...