更新時間:2019-12-02 來源:黑馬程序員 瀏覽量:
標簽庫
個性化推薦的基礎是用戶畫像,而用戶畫像就是將用戶標簽化,用一個個標簽去描述用戶處用戶的特征、喜好、行為習慣等信息。為了數(shù)據(jù)標準化和規(guī)范化,我們需要在后臺建立一個標簽庫,通過對標簽庫的維護,來滿足用戶畫像的需求,并作為數(shù)據(jù)分析的依據(jù)。
所謂標簽庫,也就是標簽的集合,講標簽組織化和結(jié)構(gòu)化。在產(chǎn)品設計上,標簽庫就是一個標簽的列表,并支持增刪查改等基礎的維護。
如果產(chǎn)品內(nèi)容類型很豐富,那么標簽的數(shù)量也會特別龐大。為了便于維護,也便于數(shù)據(jù)分析,最好能對標簽進行分類管理,比如建立一個二級類目管理機制。
一級分類
二級分類
內(nèi)容標簽化
通過對用戶貼標簽來了解用戶的喜好是個性化推薦的基礎,但是給用戶貼標簽的依據(jù)是什么呢?那就是用戶跟內(nèi)容的互動。用戶閱讀了一篇文章、看了一部視頻、回答了一個問題,都是用來給用戶貼表情呢依據(jù)。那么我們就得首先知道,這些文章視頻內(nèi)容屬于什么標簽,也就是將內(nèi)容標簽化。
如何將內(nèi)容標簽化呢?對于不同形態(tài)的內(nèi)容,方法是不一樣的。
對于文本內(nèi)容,一般是通過關鍵字匹配。這里,標簽庫就要發(fā)揮作用了。通過技術(shù)手段識別文本中的關鍵字,如果與標簽庫中的標簽匹配上,即可作為該內(nèi)容的標簽。
如果是音頻內(nèi)容,標簽的識別可能就得依靠人工手段了,畢竟靠技術(shù)識別的難度太大。通過在后臺給內(nèi)容手動打標簽,將音視頻等內(nèi)容標簽化。
用戶標簽化
當用戶與內(nèi)容產(chǎn)生互動,比如閱讀、點贊、收藏等行為,那么首先,我們就得統(tǒng)計用戶的行為。如何統(tǒng)計呢?
首先,梳理用戶與內(nèi)容能產(chǎn)生的所有行為;然后,梳理這些行為能產(chǎn)生的所有字段信息;最后,在后臺講這些行為數(shù)據(jù)表格化。
當用戶與內(nèi)容產(chǎn)生互動,即可認為這條內(nèi)容的標簽頁屬于用戶的標簽。為了畫像更為精準,我們給用戶的標簽賦予一個權(quán)重的概念。用戶的行為不同,該標簽的權(quán)重值不同,比如僅僅是閱讀的情況下,標簽的權(quán)重+1,如果是點贊,則標簽的權(quán)重值+2。通過一次次行為的積累,最終講得到用戶的標簽權(quán)重表,而這張表,就是用戶的畫像。
不過,給用戶標簽賦值要考慮到多種因素,比如時間效應。用戶興趣會隨著時間而衰減,因此減少對應的分值。還要考慮到熱門內(nèi)容的干擾,比如某個明星離婚的消息。用戶看此類消息可能僅僅是一時的好奇,并不代表對此類標簽(八卦、明星)的內(nèi)容感興趣,因此這類行為的權(quán)重值要降低。
個性化推薦規(guī)則
將用戶和內(nèi)容標簽化之后,要實現(xiàn)個性化推薦,還需要最后一步:制定個性化推薦規(guī)則。所謂個性化推薦,就是根據(jù)用戶畫像,給用戶做精準推薦。這里,我們舉一個例子:
規(guī)則1. 選擇匹配該用戶標簽權(quán)重值排前5的相關內(nèi)容
規(guī)則2. 篩選滿足規(guī)則1的且是最近48小時內(nèi)發(fā)布的內(nèi)容
1. 分頁推送,每頁8條,按照點贊數(shù)從多到少排列,上滑翻頁
2. 下拉刷新,推送本次刷新與上次刷新之間產(chǎn)生的滿足規(guī)則1和規(guī)則2的內(nèi)容,根據(jù)分值從高到低排列,每次刷新最多推送8條,不足8條則推送實際數(shù)量
3. 已推薦過的內(nèi)容則不再推薦
以上是一個比較簡單的推薦規(guī)則,重點是要通過這個規(guī)則體現(xiàn)個性化推薦的應用思路,讀者可以根據(jù)自身產(chǎn)品的實際需要制定更詳細的規(guī)則。
小結(jié)
除了內(nèi)容產(chǎn)品,很多業(yè)務場景都適合個性化推薦,比如電商的猜你喜歡,感興趣的讀者可以自己設計一套電商業(yè)務的個性化推薦體系。
猜你喜歡:
大數(shù)據(jù)時代精準推薦系統(tǒng)的關鍵技術(shù)
視頻推薦精準度怎么測試?
產(chǎn)品經(jīng)理4.0課程