科學民調戰勝假數據

  至5月11日上午,GMA公佈的部份和非官方數據顯示,選票已經計算了98·24%,小馬科斯獲得了31,078,701張選票,萊妮·羅佈雷多獲得14,809,502張選票。這意味著小馬科斯獲得了56.36%的選民支持,萊妮·羅佈雷多所獲得選民支持率則為26.85%;副總統候選人薩拉獲得的57.18%的選票,而潘吉利南以16.72%的得票率屈居第二位。
  這次選舉結果檢驗出亞洲脈搏、OCTA、Laylo和PUBLiCUS ASIA所公佈的民調結果都是完全符合統計學的科學作業。對於那些反民調,誣陷民調公司已經被黨派滲透的統計學專家來說,這樣的結果是對他們有力的打臉。
  小馬科斯這次參選是有備而來,而且菲律賓人民彷彿已選擇了他,因此,BBM才會在選前成為濛濛·馬科斯的簡稱。以往在菲律賓,只有當上總統,人們才會給予一個簡稱,例如阿羅育被稱為“GMA”。外國媒體普遍認為小馬科斯利用社交媒體(social media)修正了菲律賓歷史,改變年輕人對馬科斯家族的看法,這樣的說法是靠譜的。因為社交媒體的大數據被用在選舉中,不是用來瞭解選民要把選票投給誰,而是研究選民希望什麼樣的候選人。不過,萊妮競選團隊似乎不這樣理解,他們發現有部份選民喜歡日本動畫片《七龍珠》中的悟空,是以讓萊妮拍攝施展龜派氣功的宣傳片,這是一大敗筆的設計。最為嚴重的是他們以為社交媒體的數據就是選票的真正反映。
  其實,「大數據」所蒐集的數據,必須經過認真的篩選與排除之後才能成為真實的數據,例如在大數據中,諸如選舉廣告,垃圾郵件,機器人帳戶和網軍製造的假訊息都必須排除。另外由於社群用戶並不能完全代表全體選民人口特性,是以,必須消除社交用戶在人口特性統計偏差問題是必要的。
  以上這些問題倘若沒解決,所得的結果當然是錯誤的。這裡並不能排除有些別有居心使用那些被稱為調查的東西,實際上是不符合可接受性標準來騙取選票或捐款。有些朋友以為紅粉兵團在選前二個星期裡所反映出來的這些東西的是實情,也開始懷疑民調結果,而我卻堅定地告訴他們說,我絕對相信民調結果——小馬科斯贏定了。