阿裏巴巴大數據之路讀書筆記——用戶畫像的定義

manor的大數據奮鬥之路 2021-08-15 21:36:55 阅读数:525

本文一共[544]字,预计阅读时长:1分钟~
之路

用戶畫像
在阿裏巴巴旗下的淘寶網、蝦米音樂上都不乏個性化推薦場景,淘
寶、天猫平臺上的眾多商家則需要通過用戶調研和產品研發來把握產品
的目標人群和人群偏好,從而對用戶投其所好。對用戶有深刻的理解是
網站推薦、企業經營制勝的重要 環。在傳統企業中,獲取用戶的反饋
信息耗時長、結果缺失,是個難關。然而 隨著大數據熱潮的興起,快
速捕捉海量用戶行為並精確分析人群偏好等商業信息已經成為可能。作
為個性化技術的重要基礎,相比於傳統企業的購物籃分析、問卷調查,
在用戶 畫像的塑造上具備技術的天然優勢。
阿裏全域數據提供了足够的數據基礎,正是基於用戶網購、搜索和
娛樂影音等行為的數據洞察,可以利用數據分析輔以算法的視角對用戶
進行 360 全方比特的特征刻畫。那麼,究竟什麼是用戶畫像?通俗地講,
用戶畫像即是為用戶打上各種各樣的標簽,如年齡、性別、職業、商
品牌偏好、商品類別偏好等。這些標簽的數目越豐 ,標簽越細化,對
用戶的刻畫就越精准。例如,分析某用戶為女性,可能僅僅是將與女
相關的服裝、個人護理等商品作為推薦結果反饋給該用 戶:但若根據用
戶以往的瀏覽、交易等行為挖掘出進一步的信息,如用戶的地理信息為
海南,買過某幾類品牌的服裝,則可以將薄款的、品牌風格相似的服裝
作為推薦結果。
般而言,用戶畫像可以分為基礎屬性、購物偏好、 社交關系、財
富屬性等幾大類。對於刻畫淘寶網購用戶,則應側重於他們在網購上的
行為偏好。下面以用戶女裝風格偏好為例,講解該用戶標簽是如何基於
全域數據產出的。
購買過淘寶商品的讀者對商品詳情頁都不會陌生,一件商品的關鍵
特征除了反映在商品圖片和詳情頁中以外,主要可以采集的信息是商品
的標題以及參數描述。女裝有哪些風格?首先需要將女裝行業下的商品
標題文本提取出來,對其進行分詞,得到龐大的女裝描繪詞庫。然而,
淘寶商品的標題由賣家個人撰寫,並不能保證其中的詞語都與商品風格
描述相關。因此,對於所得到的女裝描繪詞庫,首先,需要根據詞語權
重去除無效的停用詞,方法如計算 TF-IDF 值。其次,在女裝商品的參
數描述中,如果已經包含了一種商品風格,例如“通勤”“韓版”等常
見風格,那麼通過計算詞庫中詞語與參數描述中風格詞的相似度,可以
過濾得到女裝風格詞庫,利用無監督機器學習如 LDA 等方法可以計算
種風格所包含的詞匯及這些詞匯的重要性。那麼 買家偏好什麼風
格昵?在淘寶網上,買家擁有瀏覽、搜索、點擊、收藏、加購物車以
交易等多種行為,針對每種行為賦予不同的行為强度(比如瀏覽行為强
度弱於交易行為),再考慮該商品的風格元素組成,就能够通過合理的
方式獲知買家對該風格的偏好程度了。
對於這樣的商品偏好計算,數據挖掘人員需要仔細分析用戶偏好的
商品的類型、品牌、風格元素、下單時間,這 系列行為可以構成複雜
的行為模塊。同理,利用機器學習算法,可以從用 戶行為中推測其身份,
例如男生和女生、老年與青年偏好的商品和行為方式存在 別,根據
定的用戶標記,最後能够預測出用戶的基礎身份信息。

版权声明:本文为[manor的大數據奮鬥之路]所创,转载请带上原文链接,感谢。 https://gsmany.com/2021/08/20210815213646763n.html