论文代写

基于家庭用戶模型的電視節目推薦系統探求

發布時間:2021-07-04 17:17 論文編輯:vicky
本文提出的家庭用戶模型以及面向家庭用戶的電視節目推薦算法,僅僅實現了某廣電網絡運營商的電視節目推薦系統性能的提升,對其他同類型的公司具有一定的借鑒意義,但該方案是否為最優方案還有待考證,是否具有廣泛性意義也尚未明確。

第一章 緒論

一、研究背景與意義
隨著社會的發展、科技的進步,互聯網的出現造成了信息大爆炸,讓用戶需求在一定程度上得到了較大滿足,但也因此,人們越來越多地面臨著各個領域的內容超載問題,這對用戶和研究人員來說都是一個挑戰。大量的物品(書籍,網頁,音樂,電影等)迫使用戶在各種符合他們需求的替代品中做出艱難的選擇。所以,對于信息的提供方和信息的獲取方來講,都是一個難題:信息的提供方如何高效的為用戶提供用戶感興趣和所需要的信息是個大問題,這不僅關系到用戶的體驗感受,還影響到相關的經濟效益;而對于興趣的獲取方,即面向產品的用戶,如何快速滿足自己的需求也成了大挑戰。
最初,主要是通過身邊朋友推薦、自己大量搜索了解來篩選出所需要的信息,這種獲取信息偶然性太強,不具有可復制性。而一個適合的推薦系統就可以很好地解決這一情況。
推薦系統(RS)是向用戶提供相關項目建議的軟件工具和技術(Burke,2002)。這些建議涉及各種決策過程,例如要購買的產品,要聽的音樂或觀看的電視節目。因此,推薦系統可以幫助人們在可用的大量選項中識別他們感興趣的內容。從本質上來講,所謂的推薦就是將用戶和內容根據一定方法取得聯系,不僅僅是讓用戶得以滿足需求,同時還讓內容得到相應的推廣,內容提供者也能從中獲得利益。搜索引擎是按照用戶主動搜索情況將相關信息展現給用戶,而推薦系統則是通過用戶的歷史行為數據,按照一定的方法進行計算后,得到用戶的興趣偏好情況,發現用戶可能的需求,再將相關信息展現給用戶。一個稱得上好的推薦系統,不但能實現有效的內容推薦,為用戶提供方便、準確、快速的推薦,還能讓用戶對推薦系統產生依賴。
..................

二、國內外研究現狀
(一)用戶偏好模型
用戶歷史行為數據是用戶對不同電視節目喜好程度的一種表現形式,也是構建用戶興趣偏好模型的重要依據之一,并且備受國內外學者關注。目前,用戶歷史行為數據主要分為顯式反饋數據和隱式反饋數據。
面對海量的電視節目,用戶可以選擇觀看或者不觀看、評論或者不評論,這些歷史行為數據足以反應用戶對電視節目的興趣偏好情況,因此,可以用來對用戶興趣偏好進行建模。也因此,國內外很多學者聚焦于該用戶建模方法。推薦系統中,參考的用戶歷史行為數據主要分為顯性反饋數據和隱性反饋數據。
用戶對電視節目的評分以及評論為顯性反饋數據,它們能夠直接、明確的反映用戶對各個電視節目的興趣偏好情況。利用顯性反饋數據來建立用戶模型的研究有很多,如 Das D[53]等人,就是利用該方法建立用戶模型的。但是,用戶基本很少主動去為電視節目進行打分,或者打分的節目數較少,Pazzani[51]、Adomavicius[52]等人的研究證明了這一觀點。根據他們的統計數據表明,只有 15%的用戶愿意主動參與電視節目評分,這大大降低了推薦系統推薦結果的可靠性。用戶的歷史觀看行為數據,包括觀看時長、觀看頻率等,無法直接明確的反應用戶興趣偏好情況的為隱性反饋數據。兩者相比,隱性反饋數據除了計算比較復雜外,其它均優于顯性反饋數據。隱性反饋數據獲取方便,數量大,涉及用戶和電視節目的數量多,從而使推薦結果更具可靠性,因此,更多的研究者使用隱性反饋數據進行用戶偏好建模。比如,Kim[27]等人認為,用戶觀看某電視節目時間越長、觀看的次數越多,則表明用戶越喜歡,用戶偏好模型可以通過將短期內觀看時長、觀看次數進行參數化后得到。Shin[42]等人建立的用戶偏好模型,則是通過針對不同類型的有線電視用戶操作行為給定不同的權重來進行參數化后得到。而 Sanchez[43]等人則是利用隱式馬爾可夫模型和基于概率的協同過濾推薦方法來對用戶的興趣偏好進行推測。Fan[44]等人認為,用戶的觀看順序也體現了用戶對各個電視節目的興趣偏好情況,詳細分析了兩者的相關性,并提出了一種序列模式算法來將用戶隱性反饋數據參數化。Pyo[45]等人也認為用戶對電視節目的偏好情況與其觀看的時間序列相關,并加入了觀看時長等因素進行了分析和建模。結合顯性反饋數據和隱性反饋數據各自的優點,一方面希望能獲得明確興趣偏好信息,另一方面希望能取得一個廣泛性的推薦策略,部分研究人員則通過綜合使用這兩種用戶歷史行為數據來確定用戶興趣偏好模型。比如Barragáns-Martínez A B[28]E、hrmantraut M[35]、Kurapati K[36]和 Martinez A[41]等人就是根據這兩種用戶歷史行為數據來獲得用戶興趣偏好情況的,并在此用戶偏好模型基礎上,開發出了電視節目推薦系統。
............................

第二章 基礎理論知識

一、協同過濾推薦算法
所謂的協同過濾,就是利用用戶歷史行為數據(包括評分行為)來預測每個用戶最有可能感興趣的物品、服務或者內容。這類算法通過基于鄰域或者模型的過濾,根據用戶的一系列行為,確定其行為模式并將其分組,從而根據組內其它用戶的偏好行為來為用戶進行推薦,這類算法在很多場合下能夠得到比較好的效果,但是面臨嚴重的冷啟動問題(推薦系統建立初期由于缺乏足夠的數據從而無法進行推薦),同時還存在著被流行度所干擾的情況。其具體流程如圖 2.1。
圖 2.1 協同過濾推薦算法一般流程
圖 2.1 協同過濾推薦算法一般流程
(一)基于用戶的最近鄰推薦
該方法的主要實現過程為:在假設用戶興趣偏好不會因為時間而改變的前提下,根據原有的評分數據集,找出與當前用戶過去有相似評分行為的其他用戶,然后找到相似用戶接觸過而當前用戶尚未接觸過的產品 p,對每個產品 p 利用近鄰方法預測該用戶對產品 p 的評分值,對評分值進行排序,將 TOP-N 推送給當前用戶。
..........................

二、基于內容的推薦算法
基于內容的推薦算法(Content-Based Recommendations)是基于物品或服務的相關信息、用戶相關信息及用戶對物品或服務的操作行為來構建推薦算法模型,為用戶提供推薦服務。這里的物品或服務相關信息可以是對物品或服務文字描述的信息、標簽、用戶評論、人工標注的信息等。用戶相關信息是指人口統計學信息(如年齡、性別、偏好、地域、收入等等)。用戶對物品或服務的操作行為可以是評論、收藏、點贊、觀看、瀏覽、點擊、搜索、購買等。通常情況下,基于內容的推薦算法只依賴于用戶自身的行為,不涉及到其他用戶的行為。
廣義的物品或服務信息不限于文本信息,圖片、語音、視頻等都可以作為內容推薦的信息來源,只不過這類信息處理成本較大,不光是算法難度大、處理的時間及存儲成本也相對更高。
基于內容的推薦算法算是最早應用于工程實踐的推薦算法,有大量的應用案例,如今日頭條的推薦有很大比例是基于內容的推薦算法。
圖 2.2 基于內容的推薦算法過程
圖 2.2 基于內容的推薦算法過程
......................

第三章 面向電視節目推薦的家庭用戶模型.....................17
一、問題描述..............................17
二、分時用戶模型 .........................17
第四章 基于家庭用戶模型的電視節目推薦系統.............27
一、問題描述...........................27
二、推薦系統的架構 .......................27
第五章 推薦系統效果分析...................39
一、測試準備...................39
二、準確率分析...........39

第五章 推薦系統效果分析

一、測試準備
本章通過設計對比實驗,利用某廣電網絡運營商的歷史用戶行為數據,對本文提出的家庭用戶模型及其推薦策略的有效性和穩定性進行了評估。
主要包含四部分內容:(1)推薦準確率測試。以月為單位進行訓練,以一周為推薦周期進行了推薦準確率的測試;(2)處理時間測試。以月為單位進行訓練,以一周為推薦周期進行了處理時間的測試;(3)推薦覆蓋率測試。以月為單位進行訓練,以一周為推薦周期進行了推薦覆蓋率的測試;(4)推薦準確率有效性測試。在 8 種不同的訓練數據規模下對準確率相應于數據規模的變化進行了測試,并針對訓練數據產生時間與預測時間的不同距離對應準確率的影響進行了測試。
本文采用的是某廣電網絡運營商的有線電視機頂盒終端上傳的數據進行相關測試,該終端的程序記錄了用戶收視行為的各種元數據,用戶 ID,播放的資源的相關信息,包含了資源 ID、資源名稱、資源時長、資源的精準分類(從資源板塊-資源欄目-資源子分類),資源的觀看情況,即用戶觀看每個視頻資源的開始時間、結束時間。
在采集的數據中,對無效的數據先行過濾掉,當資源完成度小于 5%時這里默認設定用戶對其不感興趣,直接舍棄,這樣做可以減少算法計算的時間,提高推薦的效率。
.....................

第六章 總結與展望

一、工作總結
隨著近年來廣播電視技術的快速發展,可供觀眾選擇的電視節目日益豐富,數量日益劇增,各種各樣的電視節目類型日新月異,在豐富用戶精神需求的同時,卻也導致了用戶難以在最短的時間內找到其最感興趣的節目。因此,如何快速、有效地尋找到用戶投其所好的電視節目正成為推薦領域熱門的研究課題之一。
本文針對家庭用戶模型以及面向家庭用戶的電視節目推薦系統開展嘗試性研究。通過本文,簡單介紹了有線電視推薦系統的實現過程,并讓某廣電網絡運營商實現了電視節目推薦系統性能的提升。
本文的主要工作和創新點概括為以下四個方面:
(1)前期工作:對某廣電網絡運營商的現狀和需求進行了調研,包括現有系統的推薦算法、準確率、運行速度等情況,還包括用戶報告、機頂盒數據等情況。同時,查閱了大量相關資料,對電視節目推薦系統的特點、難點,以及用戶興趣偏好建模和面向家庭用戶的電視節目推薦算法的研究現狀有了進一步了解,從而確定了此次有線電視推薦系統的總體設計方案。
(2)建立面向電視節目推薦的家庭用戶模型:先對用戶報告進行分析建模,了解目前家庭用戶的組合情況;接著,利用 python 計算用戶在時域上的相似度和節目相似度,對用戶和節目進行 K-聚類,根據常識,設置 K=3。從而獲得此次面向電視節目推薦的家庭用戶模型,即針對一個機頂盒的收視行為,系統根據時段將收視行為進行拆分(系統默認的時段粒度是 3,即分成工作日白天、工作日夜間、假期),一個機頂盒分解成三個“用戶”。然后根據分時模型,基于電視、電影的不同特性以及影響時效,分別設計用戶興趣偏好值的計算公式,包括收視行為對推測用戶偏好的影響系數的計算公式。根據用戶興趣偏好矩陣,進一步分析推測家庭成員,以及不同的家庭成員對各類節目的收視習慣,得到最新用戶分析報告,用于后續數據管理,并為今后的用戶管理和產品管理以及業務決策工作提供依據。
參考文獻(略)
如果您有論文代寫需求,可以通過下面的方式聯系我們
點擊聯系客服

提交代寫需求

如果您有論文代寫需求,可以通過下面的方式聯系我們。

在線客服

售前咨詢
售后咨詢
微信號
Essay_Cheery
微信