科技改變生活 · 科技引領未來
流量明星的數據造假問題已經是屢見不鮮了,微博數據、演唱會數據、某某銷量數據已經完全體現不出真假。央視新聞曾經也就此現象公開披露流量明星造假問題,各種頂流隨便一條微博的轉發、評論、點贊等都可以突破100萬+甚至過億。這是什么概念呢,是某些明星
流量明星的數據造假問題已經是屢見不鮮了,微博數據、演唱會數據、某某銷量數據已經完全體現不出真假。央視新聞曾經也就此現象公開披露流量明星造假問題,各種頂流隨便一條微博的轉發、評論、點贊等都可以突破100萬+甚至過億。這是什么概念呢,是某些明星官宣結婚或者某些明星被曝一些大瓜等能讓微博服務器癱瘓的流量。
今天就以數據造假問題為例來教教大家怎么分析流量明星們的真真假假:
一:分析思路
整理思路——提出問題——收集數據——分析數據——發現問題——驗證問題
二:提出問題
1、這些頂流真的這么火嗎?這么多100萬+轉發到底存不存在假的流量?
2、假流量能占多少?
3、假流量是怎么產生的?
二、分析維度
這里以某男性流量明星的微博用戶轉發的數據為前提做一個分析,大概存在以下維度:
假設我們獲取到以下基礎數據:
三、數據驗證
下面的分析我們以樣例數據為基礎,嘗試一個一個驗證我們提出的問題。
1、首先第一個是某流量粉絲的微博轉發是否存在假的流量?
通過對這一環節的分析發現轉發用戶的性別比例中男性用戶是女性用戶數量的10倍,大家覺得這種現象是否正常呢?對于某男性頂流來說可能會有些奇怪,這里我們就帶著疑惑來進一步剖析。
針對這一現象我們進一步對轉發微博的男用戶賬號的關注者、粉絲數量維度對轉發量進行了一輪分析。
最終發現轉發的男用戶的微博賬號關注者和粉絲數量基本為0個或者1個。針對該數據,我們可以推斷出這些轉發流量就是完完全全的假流量。所以這位流量明星的微博數據中存在假流量。
2、假的流量占比有多少?
結合我們上一條的結論繼續往下走。我們要知道假流量的占比,那勢必要先定義好什么樣的用戶數據為假流量,在此的定義為主觀定義,不做絕對標準。
假設我們對假粉的定義是:轉發賬號的關注或者粉絲數少于或等于5、沒有簡介、微博等級為0的數據、或者用戶姓名為初始隨機姓名的。
那么對這些符合條件的用戶進行統計
通過這樣的分析我們發現90%以上的用戶都是假粉,那么我們想到普通人也會有假粉絲轉發呀,那么會不會對此有一定影響呢?
那么我們再選擇一位男明星的微博作為對比,同樣是隨機抓取一條微博,采用同樣的方式分析出這位流量明星的微博粉絲占比是不是存在不合理的情況。
我們通過對這兩位的微博對比發現都會存在造假數據的情況,但是很明顯有的造假率比較高。
3、假流量粉絲是如何產生的?
其實這個問題只要是對互聯網稍微了解的人都知道流量造假的來源主要是背后的經紀公司為其購買的,其次還有的一小部分是粉絲自費購買的。
最后老師還是想說所謂的流量數據將不過都是過眼煙云,真正的偶像也好演員也好都應該用實力來詮釋自己,你說呢?
好了,今天的案例我們就分享到這里了,同學們在看八卦的同時也不要忘了今天老師講的分析案例及知識哦~你學會了嗎?
陳悅