文本内容分析算法

简介 内容分析通常包括文本分析,图片分析和视频分析等。本文是 《基于内容的推荐算法》单独整理的一篇内容,因最常见到的还是文本的分析,本篇主讲文本分析。文本分析在推荐系统中一个很重要的作用是用户兴趣建模,另外通过内容理解和特征提取,文本分析还可以直接帮助内容推荐,也可辅助生成频道内容,因此文本内容分析算法在基于内容的推荐系统中非常重要,尤其是新闻资讯类应用。...

基于内容的推荐算法

简介 基于内容的推荐算法(Content-Based Recommendations,CB)非常古老,应该是最早被使用的推荐算法,虽是一个年代久远的算法,但即便放在深度学习十分火热的当下,基于内容的推荐算法依然被工业界广泛使用,足以证明其具有不可替代的优势,也经受了时间的检验。 基于内容的推荐系统是利用物品的内容信息来进行推荐的一种方法,最早主要是应用在...

工业界推荐系统的评测标准

综述 推荐系统是一个有着诸多复杂因素联动起作用的系统,从诞生到成熟,推荐系统本身就带着很多不确定性。因此,推荐系统在研发完成后,作为技术人员的我们并不是马上就结束了战斗,在往后的日子里,我们必须时时刻刻地知道它当前的状态好不好,在整体环境中是不是很健康,所以必须有一系列测试方法和评测指标来了解当前的推荐系统的 “系统体征” 信息,以方便我们能够在复杂因素联...

推荐系统中的探索和利用

探索和利用(EE)问题 探索与利用(Exploration and Exploitation)问题简称 EE 问题,是计算广告和推荐系统里最常见的两大问题之一(另外一个是冷启动问题)。EE 问题中的利用(Exploitation),表示对用户比较确定的兴趣,要利用开采迎合;而探索(Exploration)则表示光对着用户已知的兴趣使用,用户很快会腻,所以要...

十大经典排序算法详解

排序算法是《数据结构和算法》中非常基础的算法,但却占据着十分重要的位置,几乎可以说是我们在日常编程代码中使用最频繁的基础算法。本文对常见的十大经典排序算法进行了详细的知识点梳理,从排序思路、动图演示、代码实现、复杂度分析、算法优化等多个方面分别对不同的排序算法进行讲解,内容翔实,一篇文章几乎囊括了排序算法所有必会的知识点。 排序算法的分析和评价 时间复杂...

Python 实现经典 LeetCode 算法题:链表

链表(LikedList)是线性表(Linear List)的一种,是一种非常常见数据结构,链表通过指针将一组零散的内存块串联在一起,通过不同的串联方式形成不同类型的链表结构,最常见有单链表、双链表和循环链表。 基础知识要点 链表的类型 单链表 双链表 从结构上来看,双向链表可以支持 O(1) 时间复杂度的情况下找到前驱...

RNN 核心知识点总结

循环神经网络(recurτent neural network ,RNN)的主要用途是处理和预测序列数据。它能够挖掘数据中的时序信息以及语义信息的深度表达能力被充分利用,并在语音识别、语言模型、机器翻译以及时序分析等方面实现了突破。 RNN 网络结构特点 全连接神经网络或卷积神经网络模型中,网络结构都是从输入层到隐含层再到输出层,层与层之间是全连接或部分...

CNN 核心知识点总结

CNN(Convolutional Neural Network,卷积神经网络)是一种主要用于图像处理和计算机视觉任务的深度学习模型。它通过卷积操作和池化操作来有效地对图像数据进行特征提取,并通过全连接层来进行分类或回归。 CNN 的关键特点是它利用了卷积操作来处理数据。卷积操作通过使用卷积核(也称为过滤器或滤波器)与输入数据的局部区域进行逐元素相乘,并将...

TENSORFLOW 基础代码模版

本文的代码整理自郑泽宇等著作的《TensorFlow 实战 Google 深度学习框架(第 2 版)》这本书,个人觉得这本书还是很不错的,除了 TensorFlow,还讲到了很多原理和深度学习的知识点,只是书中的对应的 TensorFlow 版本稍微有点旧了(1.4.0,这应该归咎于 TensorFlow 版本变化太快了,API 变动频繁),我测试使用的 T...

梯度下降学习率的设定策略

学习率的重要性 如果把梯度下降算法比作机器学习中的一把 “神兵利器”,那么学习率就是梯度下降算法这把武器对应的 “内功心法”,只有调好学习率这个超参数,才能让梯度下降算法更好地运作,让模型产生更好的效果。 在《梯度下降算法总结》一文中,我们已经谈到过在实际应用中梯度下降学习算法可能会遇到局部极小值和鞍点两大挑战。那么,什么样的梯度下降才算是 “合格” 的...