【算法】基于內容的個性化推薦算法
本文介紹基于內容的推薦算法(Content-based Recommendation)。
基于內容的推薦算法(以下簡稱“內容推薦算法”)只有一個關鍵點——標簽(tag)。推薦算法將產品分解為一系列標簽,并根據用戶對產品的行為(例如,購買、瀏覽)將用戶也描述為一系列標簽。
內容推薦算法的原理:
1.將產品分解為一系列標簽。例如,一個手機產品的標簽可以包括品牌、價格、產地、顏色、款式等。如果是自營b2c電商,一般可以在產品入庫時手動打標簽。
2. 基于用戶行為(瀏覽、購買、收藏)計算每個用戶的產品興趣標簽。例如,用戶購買了一個產品,則將該產品的所有標簽賦值給該用戶,每個標簽打分為1;用戶瀏覽了一個產品,則將該產品的所有標簽賦值給該用戶,每個標簽打分為0.5。計算復雜度為:已有產品數量*用戶量。該過程為離線計算。
3. 針對所有新產品,分別計算每個用戶的產品標簽與每個新產品的相似度(基于cosine similarity)。計算復雜度為:新產品數量*用戶量。該過程為在線計算。
從可行性角度,一個應用場景是否適合用內容推薦算法取決于:
1. 是否可以持續為產品打標簽。
2. 標簽是否可以覆蓋產品的核心屬性?例如,手機產品的標簽一般可以覆蓋消費者購物的核心決策因素,但是女裝一般比較難(視覺效果很難被打標)。
內容推薦算法的優勢:
1. 推薦結果可理解:不僅每個用戶的核心興趣點可以被標簽化(便于理解每個用戶的興趣),并且可以在每一個推薦結果的展示中現實標簽,便于消費者理解推薦結果(如下圖紅框)。
2. 推薦結果穩定性強:對于用戶行為不豐富的產品類型(例如,金融產品),協同過濾很難找到同興趣用戶群或關聯產品,在相似度計算中稀疏度太高。然而,內容推薦主要使用標簽,標簽對用戶興趣捕捉穩定性要遠遠高于單個產品。
3. 便于人機協作:用戶可以勾選或者關注推薦標簽,從而通過自己的操作來發現自己的個性化需求。
內容推薦算法的劣勢:
1. 不適合發現驚喜:如果一個產品不易于被標簽窮舉或描述產品的標簽還沒出現,則該產品很難被準確推薦。
2. 在線應用計算復雜度較高:需要基于每個用戶來計算相似產品。
責任編輯:售電衡衡
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市