文 | DoNews 小不董
編輯 | 李信馬
阿根廷慘案新鮮出爐,天臺上擠滿了梅西粉絲。
這場比賽無愧世界杯歷史上最大的冷門之一,沙特隊(duì)什么水平?我們國足世預(yù)賽都能踢個 1-1 好吧?你梅球王的第五屆世界杯,全世界都以為是來創(chuàng)造歷史的,結(jié)果歷史是創(chuàng)造了——阿根廷世界杯史上首次輸給亞洲球隊(duì)?
沙特直接舉國放假,全民狂歡,慶賀來之不易的勝利了!
這個事情,懂點(diǎn)足球的人不太理解,很懂足球的人更不理解,后來,熬夜加班(看球)的DoNews編輯組發(fā)現(xiàn),其實(shí)AI也不理解。
作為科技發(fā)燒友,DoNews是不屑于聽專業(yè)人士賽前分析的——主要是也聽不懂——但我們相信科學(xué)。統(tǒng)計(jì)學(xué)早早就被納入了對體育賽事的分析中,看不懂比賽數(shù)據(jù),都不配說自己是真粉絲。而在預(yù)測比賽結(jié)果上,統(tǒng)計(jì)學(xué)還只是輔助人進(jìn)行分析,人工智能卻堅(jiān)實(shí)的邁出了替人決定的一步。
2014年世界杯,谷歌、微軟還有中國的百度等公司,就通過人工智能對世界杯進(jìn)行了預(yù)測;2018年,華為云據(jù)說成功預(yù)測了64場比賽中的40場。除了科技公司外,咨詢公司、學(xué)術(shù)機(jī)構(gòu)甚至個人愛好者,不乏用人工智能對世界杯進(jìn)行預(yù)測的,至于成功率嘛……
華為云那不到2/3的命中率,都值得拿出來炫耀,就可以知道大概水平了。
2016年,AlphaGo都可以擊敗李世石了(圍棋也是體育,腦力運(yùn)動),為什么預(yù)測足球比賽還這么不準(zhǔn)?2022年了,現(xiàn)在的AI更聰明了嗎?
一、測不準(zhǔn),是機(jī)器蠢還是人的問題?
在DoNews準(zhǔn)備對這個問題進(jìn)行探究時,遭遇了一件尷尬的事情——今年大廠們不預(yù)測了。
DoNews聯(lián)系了包括百度、阿里巴巴、騰訊、華為云等國內(nèi)人工智能實(shí)力靠前的科技公司,但都明確表示今年沒有世界杯預(yù)測的項(xiàng)目,不過,功夫不負(fù)苦心人,我們意外的發(fā)現(xiàn),百度的“干兒子”——愛奇藝,今年卻上線了這一項(xiàng)目,描述完全符合我們的標(biāo)準(zhǔn),并且單場比賽預(yù)測收費(fèi)88元(8800愛奇藝豆)。
圖片來源:愛奇藝
當(dāng)看到歷時2年多、數(shù)億萬次的數(shù)據(jù)等字眼,尤其是單場88元的價格(64場全部解鎖足足要5632元),讓DoNews深感貴有貴的道理,信任油然而生。
然后,愛奇藝AI對阿根廷和沙特比賽結(jié)果的預(yù)測是:阿根廷勝,最少贏兩球……
摔!就這?有一點(diǎn)譜嗎?而且連著后面一場也預(yù)測錯了。
對于這個情況,DoNews嘗試聯(lián)系了愛奇藝,但對方不理我們……
不過,從他們的說明中可以看到,愛奇藝的AI大數(shù)據(jù)推薦,是通過數(shù)據(jù)建模機(jī)器學(xué)習(xí)進(jìn)行預(yù)測的,巧了,這個就在DoNews的知識范圍內(nèi)了。
機(jī)器學(xué)習(xí)通俗的解釋,是給計(jì)算機(jī)數(shù)據(jù),讓計(jì)算機(jī)從數(shù)據(jù)中不斷學(xué)習(xí),最終可以通過數(shù)據(jù)分析做出最佳決策和預(yù)測。讀者們可以簡單理解為,就像往鍋里扔上一堆食材(數(shù)據(jù)),煮上半天(算法訓(xùn)練),菜就做好了(預(yù)測)。
對預(yù)測世界杯來說,機(jī)器學(xué)習(xí)再適合不過了,畢竟找到以往的賽事數(shù)據(jù),包括勝負(fù)、進(jìn)球數(shù)、當(dāng)時球隊(duì)的國際排名,甚至隊(duì)員的個人數(shù)據(jù)并不難(感謝現(xiàn)代體育界對數(shù)據(jù)的重視)。
用到的機(jī)器學(xué)習(xí)的算法,DoNews推測大概率是隨機(jī)森林算法(Random Forests),在DoNews找到的資料中,用隨機(jī)森林預(yù)測世界杯比賽結(jié)果的團(tuán)隊(duì)占到了多數(shù),包括但不限于2018年世界杯時的華為云還有麻省理工學(xué)院,出于對讀者知識水平的信任(有些枯燥且占用篇幅),算法就不進(jìn)行具體解釋了。
不過有趣的是,用到了同樣的算法,使用相同的歷史數(shù)據(jù),但不同的團(tuán)隊(duì)得出來的結(jié)果卻是不一樣的——有的相對準(zhǔn)確一些,有的可能很離譜。
這也是人工智能的一個特點(diǎn):算法、算力和數(shù)據(jù)三要素中,最終決定效果的,可能是最基礎(chǔ)的數(shù)據(jù)。數(shù)據(jù)的數(shù)量和豐富程度,決定了機(jī)器學(xué)習(xí)的效果,具體可以分為目標(biāo)值和特征值,可以理解為比賽結(jié)果(勝負(fù)、進(jìn)球數(shù)等)和可能的原因(球隊(duì)排名、球員年齡等),然后讓機(jī)器自己找聯(lián)系做推斷。
假如有人想預(yù)測本屆世界杯的首場比賽——卡塔爾VS厄瓜多爾,他用的數(shù)據(jù)是歷屆世界杯揭幕戰(zhàn)的比賽結(jié)果,特征值是球隊(duì)是否是東道主。那么機(jī)器可能會驚喜的發(fā)現(xiàn),東道主還沒有輸過揭幕戰(zhàn),于是預(yù)測卡塔爾贏定了!
但看過這場比賽的讀者應(yīng)該都知道,本屆卡塔爾創(chuàng)下了另一個世界杯記錄——過去92年來唯一首戰(zhàn)輸球的東道主。
這就是數(shù)據(jù)在機(jī)器學(xué)習(xí)中的重要性——馬兒能不能跑,要看馬兒吃什么草。機(jī)器學(xué)習(xí)預(yù)測的準(zhǔn)不準(zhǔn),根本原因還在人的身上。
回到愛奇藝的預(yù)測結(jié)果,對世界杯的預(yù)測,既可以預(yù)測勝平負(fù),也可以預(yù)測進(jìn)球數(shù),對于這場比賽,愛奇藝非常謹(jǐn)慎的沒有給出勝負(fù)的判斷,只給出了總進(jìn)球數(shù)不超過3的判斷,但AI還是認(rèn)為,厄瓜多爾的勝率更高,從這一點(diǎn)來看,AI比起迷信“東道主首戰(zhàn)不會敗”的玄學(xué)或經(jīng)驗(yàn)主義要靠譜很多了。
當(dāng)然,AI會認(rèn)為阿根廷至少能贏兩球也可以理解,畢竟在此之前,阿根廷隊(duì)可是連續(xù)36場不敗了。這也是博彩公司的共識,賽前沙特贏球的賠率高達(dá)23.00,而阿根廷贏球的賠率低至1.11。體育數(shù)據(jù)公司 Gracenote 曾預(yù)測,沙特獲勝的概率僅為8.7%,
考慮到歷史數(shù)據(jù)都一樣(國家隊(duì)的比賽數(shù)據(jù)),不同團(tuán)隊(duì)預(yù)測結(jié)果的差別應(yīng)該是來自特征工程,華為云之前對分析每場比賽的勝平負(fù),選用的特征數(shù)據(jù)是每場比賽兩個球隊(duì)的國際足聯(lián)排名、Elo評分之間的差值。而熱衷于預(yù)測世界杯的高盛,至今對冠軍的判斷就沒對過,可能的原因就是他們選用的少量特征集中在球隊(duì)和球員表現(xiàn)上,卻忽視了很多實(shí)際存在的客觀因素,比如主場優(yōu)勢、球隊(duì)結(jié)構(gòu)等。
因?yàn)闊o法聯(lián)系到愛奇藝的研究團(tuán)隊(duì),所以DoNews也不確定,他們的模型更重視哪些特征,最終影響了對比賽結(jié)果的預(yù)測。但是,可能是預(yù)測偏差太大,對于這場比賽的預(yù)測,愛奇藝給刪除了……
咱就說,至于嗎?
二、AI反買,別墅靠海?
雖然DoNews是很相信科學(xué)的,但賭球這件事情,AI可能真的靠不住。
目前愛奇藝預(yù)測了8場比賽,正確5場,錯誤3場,62.5%的準(zhǔn)確率,居然和華為云2018年時達(dá)成了驚人的一致!
不過嚴(yán)格來說,可能愛奇藝更好一點(diǎn),因?yàn)閾?jù)華為云官方表示,他們會根據(jù)比賽結(jié)果不斷調(diào)整預(yù)測模型,來提高預(yù)測準(zhǔn)確性。“16強(qiáng)對陣確認(rèn)了以后,華為云MLS就準(zhǔn)確的預(yù)測了冠軍是法國”——合理猜測是之前沒猜對,直到最后全部預(yù)測的準(zhǔn)確率才提高到了62.5%。
世界杯進(jìn)程才剛剛開始,之后愛奇藝的預(yù)測準(zhǔn)確率還有不小的提高空間,也許能趁著其他大廠缺席,打破國內(nèi)科技公司的記錄。
但是,對AI的期待還是不要抱太高,畢竟足球場上意外的因素實(shí)在太多了,就說最近兩場亞洲球隊(duì)的比賽,沙特門將穆罕默德·奧韋斯的身價僅僅70萬歐,在球場上簡直“殺瘋了”,就連誤傷隊(duì)友也透著“隊(duì)友祭天,法力無邊”的霸氣,幫助沙特隊(duì)守住了勝利;而威名赫赫的“伊朗國門”阿里雷扎·貝蘭萬德,開場不久就被隊(duì)友誤傷離場了……
誰家的AI能預(yù)測出這個??!
并且還有一個問題,AI猜得準(zhǔn)的比賽,大概率賺不到什么錢……比如昨天買阿根廷贏,下注十萬,贏了也就能賺一兩萬,但輸了可是真的血本無歸。
可能是痛感各種預(yù)測方法的不靠譜,“反買流”在部分球迷中頗為流行。比如說,貝利是個“烏鴉嘴”,他說哪支球隊(duì)要贏,反買!高盛說哪支球隊(duì)是冠軍,反買,別墅靠海!愛奇藝說阿根廷要大勝兩個球以上……
雖然看起來不太靠譜,但的確總是有“幸運(yùn)兒”出現(xiàn)。DoNews編輯部經(jīng)過努力,找到了兩位昨天押對了比分的幸運(yùn)兒,不過當(dāng)詢問他們?yōu)槭裁催@樣買時,才發(fā)現(xiàn)真的是全憑運(yùn)氣,毫無技術(shù)?!靶?”買了不到200塊的體育彩票,大部分還是買阿根廷贏的,結(jié)果10塊錢買的一張彩票,直接賺了850元。
還有一位女生,是在朋友圈看到有代下單的,出于好奇就隨機(jī)下了50塊,還因?yàn)橥緩讲徽?guī)被扣了400塊,“我就下了50塊,哈哈哈,多了我也沒有,剩下20吃飯”。
DoNews也在周圍的體彩店進(jìn)行了詢問,有老板表示,昨天有一位幸運(yùn)兒,中了“8000多”(應(yīng)該是買了100塊剛好壓中)。
但這樣的幸運(yùn)兒還是太少了,而且沒什么規(guī)律性,難以復(fù)制,“反買”還是調(diào)侃居多。DoNews咨詢了一位從2014年巴西世界杯就開始買足彩的自身球迷,那一年她賺了三四千塊,不過2018年就賠錢了,“因?yàn)榈聡葞讏霰?,虧了”?,F(xiàn)在她已經(jīng)不再買彩票了,除了對比賽不像以前那樣感興趣外,也是發(fā)現(xiàn)自己看的體育博主“都不是很靠譜,沒什么好推薦的”。
在愛奇藝提供的服務(wù)中,除了88元的AI大數(shù)據(jù)方案外,還有更加昂貴的專家方案,單場比賽全部解鎖的價格就高達(dá)1288元。且不說準(zhǔn)確與否,這個價格……要下多大的注才能收回成本???
至少DoNews認(rèn)為,專家如果對自己的預(yù)測非常肯定,那賺錢最快的方法就是自己下注,92年的世界杯歷史中,預(yù)測“翻車”的人類專家可太多了?!皺C(jī)器專家”雖然看起來更科學(xué)一些,但“久賭必輸”的定律,也不是現(xiàn)在88塊的AI服務(wù)就能逆轉(zhuǎn)的。
相比之下,有些玄學(xué)的確更吸引人,比如8場世界杯預(yù)測全中的章魚保羅,還有“烏鴉嘴”貝利,免費(fèi)為球迷們增添了許多快樂。游戲品牌 EA Sports 的預(yù)測方式也格外有趣,他們在游戲 FIFA 23 中反復(fù)模擬這64場比賽,來預(yù)測實(shí)際的比賽結(jié)果,頗有虛擬照進(jìn)現(xiàn)實(shí)的科幻感。據(jù)說 EA Sports 此前成功預(yù)測了此前三屆的世界杯冠軍得主,不過,他們11月9日宣稱梅西率領(lǐng)的阿根廷隊(duì)將奪得大力神杯,以目前的比賽結(jié)果來看,搞不好今年的預(yù)測也要翻車了……