第675頁
2023-09-10 01:08:18 作者: 月下吃檸檬
技術部經理一臉黑線:「廢話!這點東西掉一調後台數據就知道,你們就研究這個研究了一宿?」
匯報人員定了定心神,揉了揉已經快要閉上的眼睛:「不是的,這件事情讓我們確定了這一定是某一個群體在作祟!隨後我們對昨晚進行評分的四萬人提取了id。」
「頭,你知道吧,很多人,在不同的平台習慣用一個id的。而且這批新用戶註冊的那麼急,所以肯定有不少人用了常用的id。」
還是那句話,人走過,必留痕跡。
而且這痕跡里,往往帶著很濃重的個人特色。
匯報人員繼續說:「然後我們根據這四萬個id,逐一在微博上進行了搜索,然後爬取了這些用戶名的所有的發言,再利用這些用戶動態的相似性,進行深度挖掘。」
這是個極大的工作量。
一個id在微博上有可能有成千上萬個同名的帳號。
這些帳號的動態內容都得爬下來(這不違法,在地球上,好像是在2017年12月份,微博才關閉了api接口的。)。
爬下來之後還得對這些id曾經發布的動態和內容進行關鍵詞提取、照片信息提取,然後存檔。
注意哦,這只是一個id的工作量。
比如說有一個人在豆半上註冊了一個帳號叫張三,你按照這個名字在微博上搜索,結果出現了一萬個叫張三。
那這些張三的人的所有的動態都得爬下來。
可是你怎麼知道這一萬個張三裡面,哪一個是你想要的呢。
豆半的工作人員堅信昨晚這些人肯定是有相似性的,比如他們都是某一個人的粉絲。
那麼他們的發言裡一定會提到同樣的東西。
這個時候就要再拿出來一個新的id,比如李四。
利用李四這個id,在微博上進行搜索,又出來一萬個李四。
照例,全給爬取下來。
接下來是王五、趙六……
然後再進行橫向比對,一個個的去試!
總能試出來蛛絲馬跡。
這個工作量是無比巨大的,對計算機的要求也很高。
這種情況下,豆半隻能增加人手,外聘公司。
只是過去的這一夜,花了至少上千萬。
但是這是目前為止豆半唯一的方法了。
其實還有一個方法,那就是豆半後台有這些新註冊的人綁定的電話號碼,如果他們拿著這些電話號碼去找微博,在微博資料庫里直接用電話號碼查找的話,基本上一兩個小時就能解決。
但是,這違法。
不同平台不可以把彼此的數據互通有無。
然而,豆半還真是高估了這些小粉絲們的水平了。
到第二天中午的時候,工作人員興奮地跑來找北總:「北總!結果出來了!」
北總已經一夜沒睡了。
聽到這話,整個人從椅子上彈了起來。
「快給我看!我倒要看看是哪個王八蛋,膽大包天!」一向溫和的北總,破天荒的罵人了。
工作人員拿來電腦,指著一個叫「和塵同光」的id說道:「北總你看這個人,這是昨天參與打分的那些人其中的一個,我們用這個id在微博上進行了搜索,最後鎖定了一個微博用戶,這是她的用戶主頁。」
點進去。
北總的眼睛眯了起來。
和塵同光。
2014年5月6號:「塵寶真是太帥了!」
2014年8月13號:「塵寶最新代言的衛生巾,暖暖的很貼心。」
……
2015年1月12號:「塵寶都當導師了,雖然許坤也很帥,但是塵寶你依然是我的唯一……」
2015年1月18號:「塵寶上《歌王》了,狗日的方澈,鳳凰傳奇居然是他!怎麼哪都有他。」
北總的眼睛亮起來:「這是孫逸塵的粉絲?」
工作人員篤定地說道:「像她這樣的帳號,我們篩選出來4781個!」
「池榮星!」北總咬牙切齒地說道。
工作人員繼續匯報:「還有一批,是吳濤和許坤的粉絲,占了將近40%。」
說到這工作人員長吸一口氣:「剩下的,都是在除夕夜當晚為孔俊賢搖旗吶喊過的!」
好傢夥啊,北總這邊是徹底連上了。
孔俊賢、吳濤、孫逸塵。
這都是流量陣營的。
他媽的,原來是你們幾個在搞鬼!
尤其是孫逸塵。
《無傷》是他家的電影,他的粉絲來幹這事,合情合理。
北總猛地抬起頭:「這算是證據了吧?報警!立案!」
豆半私人雖然可以調用用戶綁定的電話號碼,但是無權私自騷擾,但是立案之後,就可以在警方的監督下,給這些號碼打電話,甚至可以進行必要的錄像。
幹啥?
錄口供啊!
現在知道了是誰的人在搗鬼。
但是還不知道這些人是不是受孫逸塵或者聚星的煽動。
如果是的話,直接告到死啊!
當天下午,在警方的監督下,豆半的工作人員開始打電話了。
此時,在某省的一座小鎮裡,一家人正在開開心心的聊天,今天家裡來了不少親戚。
只是家裡的女兒有些心不在焉。
不時地用百度搜索著「粉絲惡意給電影刷低分違法嗎?」
就在這時,女兒的手機響了起來。