当前位置: 首页>編程日記>正文

智能(个性化)推荐系统全流程落地实施方案

智能(个性化)推荐系统全流程落地实施方案

目录

一、整体流程

二、离线部分

2.1 数据收集

2.2  内容画像

2.3 用户画像

2.4 召回

2.4 排序

三、实时系统

四、评估系统


一、整体流程

 本文地址:推荐系统全流程落地实施方案

从以下一张总体脑图开始:

 整体上分为三个阶段:离线计算、推荐结果的实时获取、推荐结果的评估。

二、离线部分

离线计算是推荐系统的核心部分,涉及从数据收集、内容画像、用户画像、召回、排序几个关键环节,这几个环节也提现出,推荐的本质是进行内容和用户的匹配。

2.1 数据收集

核心工作概括如下图所示:

需要收集的数据有两大类:用户行为数据和内容本身的描述数据。前者可以反映用户对于内容的偏好程度,后者可以对内容本身做画像。

数据收集的更新频率根据推荐系统整体的时效性来定义,也会受限于资源成本考量。

2.2  内容画像

内容画像部分解决对内容的描述问题,在推荐模型中如何理解一个内容。有了内容画像,可以计算内容之间的相似性。有了相似性就可以出基于内容的推荐策略。这是在冷启动期用户行为数据有限时很有效的推荐方式。

 内容画像的生成,会用到关键词生成算法(TextRank*IDF),补充增加一个选词标准,比如TOP10。为了更能区分一个内容相对其他内容的差异性,还会用到主题词模型(一种方式是使用TextRank&TFIDF)。

通过用户画像可以计算相似内容了,即两两内容之间的相似性。

方法是:

1. 由主题词生成主题词向量,word2vec常用的算法,定义一个内容的所有主题词向量的均值作为内容的向量。

2. 两两计算相似度。数据量小时,可以全量计算,量大时可以采用一些优化算法,分类别、LSH等。

2.3 用户画像

 解决内容的向量化描述之后,接下来利用行为数据对用户做画像。

前述用户行为数据,实际上是用户与内容的互动关系,根据业务领域知识,定义一个评分规则,即行为转化成对内容的评分,形成用户评分表。通过用户评分表反映了每个用户对每个内容的偏好程度,借此对每个用户的评分内容做个排序,选取主题词作为用户画像中的主题词列表。

2.4 召回

 召回实际上是一个海选的过程。召回方式有很多种,也是推荐系统中算法模型最丰富的部分。

 召回最后的输出是一个用户推荐的内容列表。

冷启动召回,基于内容本身的特性进行选择,与特定用户没有直接关系,但有可能有间接关系,比如基于他最近访问的内容直接找相似内容。

多路召回,会开始关注用户行为数据或者说用户画像了。基于历史喜欢的内容,ALS,协同过滤都是常用的模型。

2.4 排序

排序是一个精选的过程,进一步优化推荐质量。

 算法模型是关于点击率预测方面的。有LR回归、Wide&Deep、深度学习。

三、实时系统

就工程实践而言,一个完整的推荐系统包括推荐模型运算,也必须要有接入产品的实时推荐结果输出系统。推荐结果可以保存在Hbase这种大规模、易扩展的存储系统中,借助缓存技术、rpc技术得到最大的吞吐量。

四、评估系统

评估系统是进行推荐模型迭代优化的基础条件。

事前的样本评估,事中的AB实验,事后的问卷调查。通过这些来指导模型的优化路线,获得更高的产品效果(比如转化率、活跃度等)。 


https://www.fengoutiyan.com/post/15449.html

相关文章:

  • 个性化定制服务模式
  • 项目模块化
  • 方案的落地最重要
  • 流程标准化
  • 流程化 系统化 标准化
  • 数字化流程管理
  • 流程优化
  • 如何推动方案的落地实施
  • 鏡像模式如何設置在哪,圖片鏡像操作
  • 什么軟件可以把圖片鏡像翻轉,C#圖片處理 解決左右鏡像相反(旋轉圖片)
  • 手機照片鏡像翻轉,C#圖像鏡像
  • 視頻鏡像翻轉軟件,python圖片鏡像翻轉_python中鏡像實現方法
  • 什么軟件可以把圖片鏡像翻轉,利用PS實現圖片的鏡像處理
  • 照片鏡像翻轉app,java實現圖片鏡像翻轉
  • 什么軟件可以把圖片鏡像翻轉,python圖片鏡像翻轉_python圖像處理之鏡像實現方法
  • matlab下載,matlab如何鏡像處理圖片,matlab實現圖像鏡像
  • 圖片鏡像翻轉,MATLAB:鏡像圖片
  • 鏡像翻轉圖片的軟件,圖像處理:實現圖片鏡像(基于python)
  • canvas可畫,JavaScript - canvas - 鏡像圖片
  • 圖片鏡像翻轉,UGUI優化:使用鏡像圖片
  • Codeforces,CodeForces 1253C
  • MySQL下載安裝,Mysql ERROR: 1253 解決方法
  • 勝利大逃亡英雄逃亡方案,HDU - 1253 勝利大逃亡 BFS
  • 大一c語言期末考試試題及答案匯總,電大計算機C語言1253,1253《C語言程序設計》電大期末精彩試題及其問題詳解
  • lu求解線性方程組,P1253 [yLOI2018] 扶蘇的問題 (線段樹)
  • c語言程序設計基礎題庫,1253號C語言程序設計試題,2016年1月試卷號1253C語言程序設計A.pdf
  • 信奧賽一本通官網,【信奧賽一本通】1253:抓住那頭牛(詳細代碼)
  • c語言程序設計1253,1253c語言程序設計a(2010年1月)
  • 勝利大逃亡英雄逃亡方案,BFS——1253 勝利大逃亡
  • 直流電壓測量模塊,IM1253B交直流電能計量模塊(艾銳達光電)
  • c語言程序設計第三版課后答案,【渝粵題庫】國家開放大學2021春1253C語言程序設計答案
  • 18轉換為二進制,1253. 將數字轉換為16進制
  • light-emitting diode,LightOJ-1253 Misere Nim
  • masterroyale魔改版,1253 Dungeon Master
  • codeformer官網中文版,codeforces.1253 B
  • c語言程序設計考研真題及答案,2020C語言程序設計1253,1253計算機科學與技術專業C語言程序設計A科目2020年09月國家開 放大學(中央廣播電視大學)
  • c語言程序設計基礎題庫,1253本科2016c語言程序設計試題,1253電大《C語言程序設計A》試題和答案200901
  • 肇事逃逸車輛無法聯系到車主怎么辦,1253尋找肇事司機