美网 × IBM:体育大数据的「次世代」范本

500

今年的美网女单决赛,上演了一组「00后」之间的青春对话。华裔英国18岁小将拉杜卡努(Emma Raducanu)以6比4、6比3直落两盘,击败了加拿大19岁新秀费南德兹(Leylah Fernandez),成为了自2004年莎拉波娃在温网封后以来,最年轻的大满贯赛冠军得主。

而与女子网坛一同进入「次世代」的,还有美网的数字化进程——在上一篇专栏《进军NFT,美网也开始做数字周边了》中,作者介绍了美网在NFT上的勇敢尝试。在本篇文章中,作者将借助美网✖️IBM合作的案例,更加详细地阐释美网如何用大数据,为赛事带来了全新的观赛体验。

特约作者:陈天皓

在推出了赛事历史上第一个NFT项目之外,2021年,也是美网和IBM一起合作的第30个年头。

作为美网的官方云服务和人工智能(AI)合作伙伴,IBM一直和美国网协(USTA)紧密合作,为全球超过1000万网球迷开发和提供世界一流的数字体验。这些体验通过美网的官方应用程序和网站来提供给受众,并通过IBM的混合云技术进行支持,同时还融入了IBM Watson的洞察力。

500

在今年,IBM也在美网推出了一系列的新功能,其中包括世界上第一个基于人工智能的网球运动员排名——IBM Power Rankings。而IBM Watson则产生了一系列带有预测性的比赛洞察,来帮助球迷将注意力集中在整个美网赛事最有趣的比赛上,并识别出潜在的冷门以及具有明显上升势头的球员。

那么下面就让我们一起来看看,IBM都为球迷们提供了哪些全新的数字化体验。

01

IBM Power Rankings

IBM Power Rankings,是一个由AI生成的球员每日走势排名,可以帮助预测美网每场单打比赛球员获胜的概率。

这个排名的算法,将球员最近的比赛得分和全面的数据统计分析,与IBM Watson Discovery的自然语言处理(NPL)能力相结合,来了解媒体对球员表现的评价,把球迷的注意力引导到最引人注目的比赛上。

该排名每天更新一次。在整体的页面上,你可以看到每位球员的Power Ranking、单打世界排名、姓名以及国家/地区。

500

当点击右侧的下拉箭头时,你可以看到每位球员更为详细的信息。以下图的新科奥运会冠军小兹维列夫的数据为例:

500

在Power Ranking的详细信息中,我们可以看到:

· 他在下一轮的对手将会是哈里斯(UPCOMING vs L. Harris)

· 在Power Ranking的决定性因素中,他在「最近比赛中的表现(Recent Performance)」和「媒体上的声量(Media Volume)」这两项都几乎完全拉满

· 媒体上对他的评价,处于一个中立但略微偏负面的状态

在界面右侧,则显示了小兹维列夫的Power Ranking随时间变化的情况——他的Power Ranking从未跌落到第4位以下。同时,我们还可以看到他在8月31日、9月2日、9月4日和9月6日分别赢下了4场比赛。

而在Power Ranking中排名第7位的加拿大选手阿里亚西姆,呈现出的则是不一样的信息:

500

· 他在「最近比赛中的表现」略差于小兹维列夫

· 在「媒体声量」方面,他的影响力大概只有小兹维列夫的35%左右

· 媒体上对他的评价要比小兹维列夫正面很多

· 他的Power Ranking随着时间不断上升,从17位逐渐上升到第7位

如果球员尚未被淘汰,你可以在该球员的Power Ranking详细信息页面中点击「Match Insights(比赛洞察)」来了解由IBM Watson提供的关于该球员即将进行的比赛的预先分析。

下面来详细介绍一下「Match Insights with Watson」

02

来自沃森的比赛洞察

Match Insights with Watson

「来自沃森的比赛洞察」是通过人工智能技术生成的比赛指南,可以帮助球迷在美网的每场单打比赛前快速了解比赛对阵双方的情况。

美网通过企业级的人工智能和IBM云,来挖掘最新的球员数据统计和媒体评论,以获得比赛洞察,其中包括了最新的IBM Power Rankings、来自各种媒体渠道的相关引述以及通过自然语言处理技术完成的关键致胜指标。

让我们继续以小兹维列夫为例,来了解一下比赛洞察的具体内容。

500

在前四轮比赛获胜后,他在2021年9月7日的男单1/4决赛中面对南非选手哈里斯。基于Watson 的赛前分析,小兹维列夫有64%的概率会在这场比赛中获胜。他的IBM Power排名是第1位,而对手哈里斯的排名是第6位。两人的单打世界排名分别是第4和第46位。

在随后的「In the Media(媒体评论)」板块,呈现了媒体对两位球员各3条的引述。这些引述是IBM利用其Watson Discovery平台,基于AI 的智能搜索和文本分析得到的。

500

接下来的「By the Numbers(关键数字)」,则是基于两位选手在美网比赛中的详细数据统计所得出的洞察。

500

其中,小兹维列夫的5个关键数字是:

· 截至第4轮,小兹维列夫在发球时的得分率是76%,在所有128名选手中排名第一

· 他的一发平均时速为127英里/小时(204公里/小时),是所有选手中发球时速最快的

· 在他的制胜分中,有41%来自于反手

· 小兹维列夫的二发得分率是60%,而哈里斯只有44%

· 他的反手制胜分得分占到了总得分的4%,而哈里斯只有2%

而哈里斯的5个关键数字是:

· 截至第4轮,他的一发得分率是83%,在所有128名选手中排名第二

· 他在发球时的得分率是71%,在所有选手中排名第八

· 在哈里斯的制胜分中,有78%来自于正手

· 他的正手制胜分得分占到了总得分的7%,而小兹维列夫只有6%

· 哈里斯的反手失误占到了总得分的4%,而小兹维列夫则占到了5%

除了上面数字外,在不同选手间的比赛洞察中,还有诸如:Ace球占比、平均一发时速、接发球得分率、破发成功率、上网次数占比等众多不同的数据。这些数据可以让评论员和观众进一步了解选手的表现,增加他们对选手特点的认知。

同时,这些数据也会随着选手的不断晋级在每一轮后更新。因此每位选手在每场比赛中的洞察都会有所不同。

而所有这些数据和排名的基础,都来源于IBM在每场比赛的现场专门安排的数据统计人员,通过专用的数据统计软件来人工逐分录入的数据。而IBM则通过专门开发的SlamTracker比分应用程序,来呈现这些比分和数据。

03

IBM SlamTracker

在2011年, IBM和美网共同开发了一款名为「PointStream」的应用程序,通过对数据进行可视化来呈现比分和数据统计。经过不断地更新迭代,PointStream成为了现在的SlamTracker,而它的功能也一直在不断地变化。

根据美网官方网站的描述:「IBM SlamTracker是美国网球公开赛首屈一指的比分应用程序。它提供了每场比赛的实时比分、数据统计以及逐分的深入分析」。

500

在SlamTracker上,我们可以看到对阵双方选手的头像、名字、比分以及这场比赛的项目、轮次、场地、比赛用时等基础信息。

而除此之外,SlamTracker的下方共有四个部分来帮助球迷了解一场比赛的情况,分别是:比赛概况(Overview)、态势分析(Momentum)、数据统计(Stats)和比赛洞察(Insights)。

a.比赛概况(Overview)

「比赛概况」的内容其实就是之前「来自沃森的比赛洞察」页面中第一部分的内容。其中显示了基于IBM Watson在赛前分析所得出的双方选手胜率、IBM Power Ranking和选手的单打世界排名。而双打比赛的「比赛概况」呈现的是对阵双方球员的基础个人资料。

500

b.态势分析(Momentum)

「态势分析」应该说是整个SlamTracker中,对数据进行可视化的应用典范。它显示了随着比赛不断进行,球员得分胜负变化态势的情况。

根据美网的描述,「这一功能可以直观地描绘出比赛得分的态势变化,让你可以一眼看出哪方选手的态势更好,以及整场比赛中态势是如何变化的。」

通过观察,笔者发现:代表双方表现的态势线条会从中间向赢得一分的选手一侧绘制。而一方选手连续赢得的分数越多,态势线条就越会向该方增长。

在「态势分析」中,球迷可以通过缩放功能从三个不同的量级来了解得分的变化趋势。

500线条的颜色代表了这一分的得分方,蓝色代表着左侧的球员得到了这一分,而黄色代表着右侧的球员得分

如上图所示,最左侧的图只能看出最基础的得分走势;中间的图则提供了更多细节,可以让球迷得知一分是否为Ace球(A)、双误(D)、制胜分(W)、非受迫性失误(U)和破发点(B)。

而最右侧的图,则提供了更多细节——当点开一分后,你会看到该分的开始时间,以及球员是如何赢下/丢掉这一分的。例如:小兹维列夫由于双误丢掉该分(A. Zverev loses the point with a double fault);小兹维列夫通过Ace球赢得该局(A. Zverev wins the game with an ace)。

当出现破发点时,「态势分析」中还会给出「破发机会(BREAK POINT OPPORTUNITY)」的提示,来告诉你现在是哪方选手有机会破掉对手的发球局。

如果你点击右上角的小齿轮,你还可以根据自己的需求,决定是否在主界面中显示不同的关键分注释,如下图所示。

500

在比赛进行的过程中,「态势分析」还会根据选手在刚结束一分中的发挥给出与该分相关的双方数据对比。

例如在下图中,我们可以看到,截止到第3盘比赛第8局比分为40:40时,小兹维列夫和哈里斯的制胜分分别为38和32个。而当你滑动下方的圆点时,数据会告诉你:小兹维列夫45%(17/38)的制胜分是Ace球,而哈里斯41%(13/32)的制胜分是Ace球。

500

通过这张图,我们则可以看到:小兹维列夫的平均发球时速为193公里/小时而哈里斯的平均发球时速只有178公里/小时。小兹维列夫的最快发球时速是220公里/小时,最近一次发球的时速是207公里/小时,而哈里斯的最快发球时速是207公里/小时,最近一次发球的时速是183公里/小时。

500

除此之外,「态势分析」还会展示球员在比赛中的移动数据对比。

例如下图:截止到第3盘比赛第9局比分为30:15时,小兹维列夫的总跑动距离是4506.47米,平均每分跑动25.18米,而哈里斯的总跑动距离是4467.13米,平均每分跑动24.96米。和种子球员以及所有其他球员相比,两人的跑动距离都略低于平均值。

500

所有这些额外的数据对比,都是IBM Watson根据比赛进程来自动实时计算并推送的。可以看出,尽管只是比分应用程序中的一部分,美网依然进行了很细致和全面的工作,来为受众提供更多信息。

c.数据统计(Stats)

在「数据统计」部分,提供了网球比赛常见的统计数据,包括了:Ace球、双误、一发得分率、二发得分率、破发成功率、制胜分、非受迫性失误等等。

而点击下方的「Full Stats」(全部数据统计),你可以看到更多更全面的与比赛密切相关的数据信息,一共分为五个部分:

· 总体数据(Overall Stats)

· 发球数据(Serve Stats)

· 接发球数据(Return Stats)

· 击球数据(Rally Stats)

· 发球方向数据(Dir. Serve Stats)

500

总体数据中展示的,就是常见的网球数据统计。只不过在这里,数据可以按照全场比赛和各盘来分别进行查看。

在发球数据的部分,可以看到双方在发球方面的表现情况,其中包括了:Ace球、发球制胜分、双误、发球次数、发球得分、发球局数、平均发球时速以及最快发球时速。所有数据都按照一发(1st Serve)、二发(2nd Serve)和总计(Total)分别进行汇总。

500

接发球数据的部分也是类似,其中包括了双方的:接发球制胜分(俗称「Return Ace」)、接发球非受迫性失误、接发球次数和接发球得分。这些数据也都按照一发、二发和总计分别进行了汇总。

500

而击球数据的部分,则显示了双方选手在不同击球类型下,正手(FH)和反手(BH)的制胜分、受迫性失误和非受迫性失误数量。这七种不同的击球类型分别是:

· 随上击球(Approach Shots)

· 放小球(Drop Shots)

· 普通击球(Ground Strokes)

· 挑高球(Lobs)

· 过顶球(Overhead Strokes)

· 穿越球(Passing Shots)

· 截击球(Volleys)

500

如之前所述,在每场比赛中,IBM的数据统计人员都会在现场通过专用的数据统计软件来人工逐分录入比赛数据。而在每个对打回合中,最后一拍的击球类型和得分种类都是他们需要去进行统计的数据。

除此之外,数据统计人员还会通过雷达系统,捕捉球员的发球时速信息并记录他们的发球方向——这也是「发球方向数据」的来源所在。

在发球方向数据的部分,我们可以看到两位球员在最快发球时速、平均发球时速、发球得分、发球界内和Ace球的这5项数据与发球方向之间的关系。

这些数据会根据球员在平分区(DEUCE)和占先区(ADVANTAGE)发出的是外角球(左)、追身球(中)和内角球(右)的不同来进行汇总。

500

通过这些数据,我们可以发现一些比较有意思的洞察,例如:小兹维列夫在这场比赛中的二发只发向了中路和内角,而他发出的内角Ace球数量要多于外角Ace球的数量。如果没有SlamTracker的可视化呈现,普通球迷可能很难能够通过这个视角来了解比赛。

d.比赛洞察(Insights)

SlamTracker在这里也展示了与上文中「来自沃森的比赛洞察」一样的内容,让球迷可以在不需要切换页面的情况下就能看到一场比赛的洞察内容,并且把其中的关键数字和球员在比赛中的表现进行比较。

04

总结

可以看到,在IBM的技术支持下,美国网球公开赛为全世界的球迷带来了与众不同的数字化体验。而除Power Rankings、Match Insights和SlamTracker外,IBM还为美网提供了混合云平台,并使用复杂的分析和机器学习能力来帮助识别和解决对美网数字平台的潜在威胁。

正如美国网协一样,在很多其他行业大大小小的组织里,人们也都在利用同样的技术来进行数字化转型,加速它们的创新步伐。

从网球(tennis)到电信(telco)、从硬地(hardcourt)到医疗(healthcare)、从正手(forehands)到金融服务(financial services),这些技术不仅改变了美网的观赛体验,也改变了世界。

全部专栏