利用ChatGPT洞察探索Netflix觀影趨勢

在一個重要的舉措中,Netflix 改變了其一貫保持觀眾數據私密的做法。這家串流巨頭最近發布了一個公開數據集,詳細列出了2023年1月至6月間觀看時間超過10萬小時的影片。根據Netflix的部落格文章「我們觀賞了什麼:Netflix 互動報告」的說明,該數據集涵蓋超過18,000個影片,代表了Netflix總觀看時數的99%,共計近1000億小時。Netflix計劃每半年更新此報告。

Netflix衡量的是「觀看時數」,而非觀眾或家庭的數量,因為一些用戶可能會重複觀看同一部影片。雖然Netflix強調了一些發現,我則選擇深入數據,從其部落格下載報告的Excel表格,並利用OpenAI的ChatGPT(透過個人ChatGPT Plus訂閱使用GPT-4)分析數據。

簡而言之,ChatGPT對數據集提供了簡潔明了的分析,儘管在生成圖表時遇到了一些挑戰。我的初步請求僅是數據分析,ChatGPT有效回應,準確總結了內容。此外,ChatGPT還列出了「關鍵見解」,其中一個顯著的點是「發布日期」欄目缺少大量數據(13,359個),這可能會影響基於時間的分析。

有趣的是,儘管「關鍵見解」的第一部分標題為「2023年1月至6月最受歡迎的10部影片」,卻沒有直接列出這些影片,這促使我單獨要求這些資訊。我還請求查看觀看次數最少的影片、中位數觀看的影片、平均觀看時數以及最接近該平均數的影片,ChatGPT都滿意地提供了這些資訊。

然而,當我要求繪製一個顯示每月觀看時數的折線圖時,ChatGPT遇到了困難。數據集未按月劃分觀看時數,而僅提供每部影片在六個月內的總觀看時數。最初的圖表幾乎無法辨認,顯示了2010年的日期,這與數據集中最早的發行日期相對應。

在請求修正後,我得到了更易讀但仍誤導性的圖表。該圖表代表了每月新影片的總累計觀看時數,而非每月的觀看總數。例如,1月上映的影片所顯示的觀看時數是其1月至6月期間的總觀看時數。ChatGPT未能自行澄清這一區別,未明確指引就將圖表標記為不準確。在多次調整後,我終於獲得了一個標示正確且有用的圖表。

雖然ChatGPT作為休閒用戶的分析工具相當有幫助,但在作為數據分析師的可靠性和準確性上仍有很大的改進空間。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles