最好看的新闻,最实用的信息
07月06日 10.5°C-12.6°C
纽币 : 人民币=4.4669

现在看个球都要懂数据分析了吗?

2天前 来源: 搜狐 原文链接 评论0条

当下欧洲杯,除了夜半爬起看比赛之外,虎扑或者懂球帝的老哥们最喜欢做的事情之一,就是拿着每场比赛赛后球员评分,去“有理有据”地品评一番:C罗7.1分全队倒数他真老了吗?姆总7.5分他开心吗?英格兰全队平均只有7.06分,南门该下课吗?

明里是“研讨”足球,暗里则是参与一些竞彩小游戏。之前果壳欧洲杯相关文章的留言中,都能看见不少“大球小球”或者“三串一”之类的字眼,可见道友颇多。

而这两种乐趣背后,从评分到赔率,都离不开一套完整的数据体系。这套体系是媒体的大力丸,是球迷的文曲星,背后也是一门生意,和对世界影响深远的一种Data-Drive意识。

谁在给球员评分?

如今我们每场看到的数据评分,大都来自两个来源:SS(SofaScore)和WS(WhoScored)。有的时候,两家的评分大体都能符合比赛中的预期,但是评分结果并非完全一样。比如在英格兰VS斯洛伐克的欧洲杯八分之一决赛中,在菲尔-福登的表现上,二者就出现了很大的差异:SS给福登打出了7.1的评分。而WS则给出了6.4的低分,在首发中和梅努并列最低。和福登一模一样的是科比-梅努,同样是WS 6.4而SS 7.1。

英格兰VS斯洛伐克 WS评分 |WhoScored

英格兰VS斯洛伐克 SS评分 +|SofaScore

成立于克罗地亚的SofaScore和成立于英国伦敦WhoScored都是著名体育数据公司,可以看到他们的评分都采用了标准的10分制,其数据源也有重合之处(比如都会使用Opta的数据,其中WS是完全使用Opta的数据,SS是部分使用),二者的评分差异是从他们的算法上来。

虽然二者都未公开过自己的算法,但是通过媒体报道还是能够看到一些端倪,WhoScored评分只在赛后更新,倾向于整场比赛完结后,将球员的每个动作的数据细节进行彻底分解,并赋予某些重点动作更高的权重(如关键传球、成功拦截、过人等),对于一些负面动作(如失误、犯规、红黄牌)的惩罚也会更加严厉。比如科比-梅努在比赛中吃了一张黄牌,在WS的评价体系里扣分就会更多。而福登多达21次的丢失球权,也许就成为他评分较低的原因。

相比之下,SS的评分在比赛开始10分钟后就会实时更新,每场比赛中评分会更新60次,整体偏重于“对比赛最终结果带来的影响”上,影响评分的是“主要积极因素”和“主要负面因素”,对帮助球队取得胜利的积极因素会有更高的奖励。因此合理推测,福登有因为有2次形成射门的传球,其中造成了1次创造得分机会,形成了0.14的xA(预期助攻),可能让数据判断他对比赛胜利造成了一定的贡献。而同样7.1分的梅努有一次漂亮的过人射偏,带来了更高的xG(预期进球),也同样被计入了更多贡献。

SS的评分更偏向重点行为对比赛的影响 | SofaScore

类比来说,SofaScore的评分,类似于 FIFA 游戏中对球员的评分,考虑了比赛中的关键事件和整体表现,只要赢球且出场时间足够评分就不太会低,非常适合“嗨圣二象性”的球迷;而WhoScored的评分类似FM(足球经理),不管比赛结果如何,都看具体数据细节来进行深度分析和评估,有时候反直觉,但其中的道理经得起琢磨。

点球成金

贝内特·米勒执导,布拉德·皮特和乔纳·希尔主演的电影《点球成金》(Moneyball),这部电影讲述了一个真实的故事:奥克兰运动家棒球队的总经理比利·比恩在预算有限的情况下,与耶鲁大学经济学毕业生彼得·布兰德合作,革命性的利用“棒球统计学”(Sabermetrics)来评估球员并组建球队,在没有明星球员的情况系创造了MLB的美联连胜纪录并打入季后赛。

图片来源:豆瓣电影

低投入能拿好成绩,好成绩意味着体育商业里的高回报。随着这套“金球理论”(Moneyball Theory)体育投资者的共识,之后许多年,我们就看到了这样的场景:

一大批体育数据公司得到了快速发展,上文提到的WS和SS平台,都与背后的溢价Opta Sports有合作,后者是全球最有影响力的数据公司,比赛每场足球比赛收集的事件数据多达 2000+ 项,把一场比赛中球员和球队的行为彻底数据化。而与之类似的公司,还包括Stats Perform、Wyscout、Instat、Football Benchmark等等,他们也不仅仅覆盖足球,包括NBA、MLB、NFL、F1、板球等所有商业价值较高的运动,不仅已经充分数据化,而且数据都极具商业价值。

Opta Sports的数据服务涵盖了众多项目 | statsperform.com

这些数据给球迷们看,无非是拿着互相打打嘴炮,除了媒体、广告和球迷服务,其更重要的买家,就是足球俱乐部,以及博彩。

足球俱乐部购买数据主要用于两个方面。其一是针对比赛,用于自己和对手的战术分析,扬长避短的争取比赛胜利,同时监视球员的状态和伤病情况。比如说布莱顿主帅德泽尔比就曾经在连续多场比赛后,监测到如三笘薫、邓克等核心球员已经在密集赛程中超负荷运转,虽然球队很需要他们,但是不得不放在替补席,而在比赛中采取更保守的策略。

布莱顿的球员价值相比于购入时往往有巨大提升 |transfermarkt.com

其二是针对球员交易,通过详细的数据,以及高阶的数据分析,球探团队可以在人手有限的情况下,在全世界挖掘更多好球员,并更有依据的决策是否招募。比如说布莱顿从厄瓜多尔挖掘了凯赛多和埃斯图皮南,从日本挖掘了三笘薫,从爱尔兰找到埃文-弗格森,从阿根廷找到了麦卡利斯特,他们转入布莱顿的价格都极低,后来或者为布莱顿带来了丰厚的利润,或者拥有极高的身价。

而对于足球博彩来说,庄家和赌徒,也都需要数据。对于接受投注的博彩公司,他们的精算师会使用详细的比赛数据和高级分析来设置精准的赔率,通过实时数据和比赛进程分析,博彩公司可以在比赛进行过程中动态调整赔率,由此评估和管理投注风险,保证自己稳赢。

但与此同时,厉害的赌徒同样可以通过数据分析让自己赢。2006年,英国商人兼数学家托尼-布鲁姆(Tony Bloom),利用复杂的数据模型和统计分析来预测足球比赛的结果,帮助大宗赌徒(他们只愿意接受至少投注200万英镑的客户)投注亚洲让球盘(Asian Handicap)并收取佣金,根据We love Brighton的报道,这门生意每年给他们带来了1亿英镑的收入。

托尼-布鲁姆 | wearebrighton.com

而赚到钱的托尼-布鲁姆随后收购了从儿时一直支持的俱乐部——布莱顿。

是的,托尼-布鲁姆的布莱顿就是现在“数据足球”的标杆,也被许多更大的俱乐部模仿,比如切尔西以及利物浦(虽然未见得模仿得很成功)。随着这股风潮逐渐的蔓延到世界上的每个角落,球迷、球队、赌博、商业以及资本,全部由数据交织在了一起,可被量化的体育也成为了全球资本的香饽饽。

根据Fact.MR的分析展望,2024年全球体育分析市场(Sports Analytics Market)规模预估为46.6亿美元,预计到2034年将达到594.7亿美元,年复合增长率预估达到29%。分析指出,以统计数据为基础的数据分析、物联网、媒体、体育粉丝服务,将成为关键的市场增长动力,并彻底改变体育比赛的传播与消费方式。

那么,代价是什么呢?

赛博体育?

体育数据分析的崛起,实际上是全世界对大数据叙事狂热的一个缩影。

2010年,硅谷营销专家肖恩-埃利斯提出了著名的Growth Hacking(增长黑客)概念,将传统统计学、大数据、计算机技术和营销洞察等跨领域的知识,统一成利用数据去带动整体增长的方法论。

图片来源:Amazon

人们发现了元数据(Metadata)是一座金矿,可以快速带来变现机会之后,致力于将其用在已知的所有地方。与很多领域(比如浏览、购物行为)的用户数据都是非结构化不同,运动场上的运动员们,遵循统一规则,在标准的场地上进行比赛,所有的数据都是结构化的:每次传球、射门、防守动作等可以被预定一,如进球、助攻、黄牌、红牌都有明确的属性和类别,通过人工+机器视觉识别,数据采集也可以做到确保数据的高精度和一致性。

《点石成金》中的棒球作为一项回合制游戏,最早形成了的可结构化数据采集,并产生上垒率(OBP)和投手防御率(ERA)等深度分析数据。随着Growth Hacking深入人心,无论是足球还是篮球,今天不说几个高阶数据都不好意思说自己懂球。

一开始,数据看起来全是美好,既丰富了球迷的谈资,也让俱乐部有了科学的发展道路,还让赌球老哥有了一种自己很专业的感觉。

当你看数据赌球赌对了 | 电影Moneyball

但批评的声音从未停止:在the real EFL刊载的科普xG(Expected Goals预期进球)指标的文章中提到:xG以及类似高阶指标,虽然已经成为足球分析的基石,但简单化了足球的多面性,分析要考虑比赛的定量方面,也要考虑真实的质量。

而足球数据平台StatsBomb,甚至在用数据撰文回顾21/22赛季曼联的表现时”自砸招牌“:仅凭数据分析,不能解决德赫亚与亨德森之间首发门将竞争的问题,曼联需要考虑人的因素和管理因素。而在文章最后,作者威尔-汤普森还专门提及:无论曼联踢成什么样,拉什福德都是当年的一座明灯。

他们的分析,正是在说:真实的足球运动,不是在玩FIFA或者FM,依然有非常多难以被统计和计算的因素。

在笔者FM存档中数据就是一切,但现实并非如此 | 图片来源:FM2024

首先,数据化必然带来”做数据“,过度追求以数据判断表现,结果可能是一些球员,为了刷个人数据,反而使球队蒙受损失。甚至许多球员为了追求效率,踢球的方式变得统一而无趣。

其次,尽管Opta等数据采集机构,已经能一场比赛收集2000项数据,但许多事情是数据反映不出来的,其中包括球员的意志品质、团队合作、创造力、领导力等等。在数据里,一次充满想象力的过人也只是一次带球突破。一位队长鼓舞士气的演说,可能并不会统计到任何数据里。(可能只会隐藏在在“在场时获胜率”这样的数据里)

最后,还有情感。

21/22赛季,因为伤病,拉什福德在曼联各项赛事中只攻入五球。然而在当时英国疫情期间,他始终在为停学英国底层儿童不挨饿而奔走,不仅跟慈善机构合作筹款2000万磅,而且不断通过社交媒体向政府喊话,最终成功令英国首相鲍里斯-约翰逊改变主意,保留了130万儿童的免费午餐。他本人,也因此获得了大英帝国员佐勋章,这也是今天“拉爵爷”这个外号的由来。

拉什福德参与FareShare给儿童食物的慈善活动 | 图片来源:fareshare.org.uk

今天,每个球迷可能拿着数据调侃拉爵爷比赛又拉了。但来自基层的足球运动,不仅仅是一场秀,它还与社会的紧密联系。穷小子成为球星后回馈社会的这种情感与尊重,却是数据无论如何不能体现,却又是足球世界在乎的。

就像前文提到的赌徒大亨托尼-布鲁姆2009年收购布莱顿,他拥有顶级的数据分析团队和出色的商业直觉,但是他收购的理由绝不是“布莱顿是一个很好的投资标的”,而是:他的叔叔曾是布莱顿董事,他的祖父曾担任俱乐部主席。而他,从小就是布莱顿球迷。

作者:Timo

如有需要请联系[email protected]

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

分享新闻电话: (02) 8999 8797

联系邮箱: [email protected] 商业合作: [email protected]网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:[email protected]