当前位置:高校体育 > 体育知识 > 正文

足球大数据平台,专业足球数据分析网站

  • 体育知识
  • 2022-12-22
  • 163
  • 更新时间:2024-05-25 07:46:07
足球大数据平台,专业足球数据分析网站

内容导航:

  • 世界杯频频爆冷,靠得是它足球里的芯片技惊四座
  • 干货数据中台大数据平台数据资产管理平台数据服务平台
  • {title3}
  • 一、世界杯频频爆冷,靠得是它足球里的芯片技惊四座

    今年世界杯才刚开始,就给了很多人带来接二连三的“惊喜”。因为有几场比赛,纸面实力和剧情发展实在相差甚远,不少粉丝直呼上当——这还是我认识的“XX队”?

    很多人不知道的是,这一次的世界杯,加入了一项黑科技,让许多人又爱又恨,并直呼大开眼界。

    爆冷的阿根廷队

    要说起今年世界杯最让人吃惊的,莫过于阿根廷“首秀”爆冷,以1:2 的比分输给了沙特。粉丝们惊讶于纸面实力更强的阿根廷队会输给略逊一筹的沙特队,另一方面,阿根廷队在上半场的7次越位也被广为讨论。

    这7次越位中,有三次属于越位进球。其中,前两次用肉眼几乎无法分辨,如果是在过去的比赛,很有可能会判有效进球。就像阿根廷队主教练卡洛斯所言,这是“毫米级的”越位。但问题在于,这毫米级的越位虽然逃过了裁判的双眼,却逃不开科技的记录。

    在SD动态图像中,球员的身体部分确切的显示越位。这也使得比分不会是3:2,而是1:2。有意思的是,阿根廷队显然没有应对科技突袭的备案,在下半场的时候明显状态不佳,最终丢掉了比赛。

    被芯片改变的足球比赛

    让阿根廷队猝然不及的是来自于足球场上的科技新势力。据了解,今年世界杯所采用了一种名为“旅程”的科技足球。它的设计重量偏轻,以保证能够在空中的速度更快。出彩的地方在于,它的球面是由20个SPEEDSHELL模块构成,采用了三角形状和弯折设计,可以降低风阻。

    内部的芯片是这款足球的灵魂。据了解,旅程的内部装载有一枚中央芯片,它的性能强大,一秒可以记录500次足球运动数据。另外,这颗芯片属于CTR- CORE系统的一部分。这套系统,被用于收集足球数据,作为裁判判罚的重要依据。

    足球运动数据,高速摄影机加上人工智能系统等一系列科技成果的应用下,越位情况将无所遁形。这大概会让很多人想起今年冬奥会的时候,我国采用的各项高科技判罚。但运动项目的不同,对科技的介入“容忍度”又会不同。

    足球可能更像是网球。在网球赛事中,鹰眼(科技判罚技术)的普及花了很长时间,至今为止,四大满贯中的法网依然拒绝通过鹰眼来判定是否网球是否“出界”。而在其他网球赛事中,鹰眼的使用次数也受到限制。

    存在争议

    当足球比赛应用这些科技的时候,裁判们的作用将被削弱,他们会更像执行者而不是裁判者,甚至于他们的工作也变得更加机械化。而对于爱好这项运动的人来说,可能需要一定的接受过程。

    有人说,它帮助裁判们更好地确定球员是否存在犯规情节,减少争议性犯规,减轻了裁判的压力,提高比赛的质量;也有人说,它破坏了足球比赛的“纯真”,因为误判也是比赛的一部分。

    说到底这是传统和科技的对抗。

    在一些体育运动中,模糊的判罚是营造氛围,构成体育文化的一部分,但当科技手段介入时,比赛虽然会变得公正,但氛围和特色却要打个折扣了。至于到底哪样好,那可能要看个人喜好了。

    二、干货数据中台大数据平台数据资产管理平台数据服务平台

    数据中台到底是什么?几年过去了,也一直众说纷纭。

    笔者认为数据中台不应该是一个单纯的系统或者是一个软件工具,而应该是一套架构、一套数据流转模式。

    数据中台需要采集数据作为原材料进行数据加工、数据建模,然后分门别类地储存,再根据实际的业 务场景,打造各类数据服务(含数据应用平台)从而实现对业务的赋能加速。

    但以上流程的实现,需要有对应的系统与产品作为支撑,那么基础的数据中台到底应该由哪些系统或者产品组成?

    这里我们可以先来看一下几个企业的数据中台架构。

    可以看出,虽然每个企业由于自身业务的不同,衍生出来的数据中台体系都有所不同,但大的架构方面是基本统一的,都需要通过一个“数据采集接入”-“加工存储”-“统一管理”-“服务应用”的阶段。

    这里笔者认为《数据中台产品经理:从数据体系到数据平台实战》一书中总结的数据中台架构是比较具有普适性的, 不论是互联网行业、还是传统行业,都可以在该架构上进行改造,设计建设自己的中台架构。

    总体来说 数据中台的功能架构由大数据平台、数据资产管理平台与数据服务平台三大部分组成 ,其中在数据服务平台中自助分析平台与标签管理系统的应用场景最为广泛。

    1、大数据平台

    大数据平台是数据中台的基座,我们也可以把大数据平台称为大数据开发平台,它需要具备与大数据相关的开发能力,提供数据存储、数据清洗/计算、数据查询展示及权限管理等功能。

    那么,应该如何建设上述功能与服务?是不是拥有了上述能力就等同于成功打造大数据平台了呢?

    其实我们可以发现各公司的大数据平台系统架构其实大同小异,各类架构都包含了数据采集组件、数据存储组件、数据计算引擎、数据权限与安全组件,以及集群管理与监控组件等。

    除了少数像阿里这样倾力打造自研“飞天”系统的企业,其他企业在底层组件选用上,还是以 Hadoop 生态构建的技术体系为主,依托各类开源组件进行优化改进与二次开发。例如,数据存储组件可以选择HBase、Hive等组件,数据计算引擎可以选择Spark、Flink等分布式计算引擎。

    既然大家选用的组件相同或者相似,那为什么最终各企业大数据平台的服务能力还是存在差距呢?这有些类似于购买零件组装台式电脑,零件不需要选最贵的,而是要根据实际需求来选择最适合的。

    好用的大数据平台需要拥有为用户解决问题的能力。因此,数据中台的大数据平台建设不是比拼引用了多少新技术、覆盖了多少技术组件,而是要看它能否解决数据中台建设中所面临的复杂数据现状,能否成为数据中台打破数据壁垒的技术保障,能否提供简洁有效的数据处理工具,如提供自助配置式的数据采集与数据清洗工具等,以及能否提供更多的附加价值。

    数据中台的大数据平台建设,可以避免各事业部技术团队各自搭建大数据集群所带来的资源浪费。统一的、成熟的大数据平台对企业来说,不能一蹴而就,需要循序渐进、分步实施,在持续迭代中构建企业的大数据平台生态。

    2、数据资产管理平台

    数据资产管理平台主要解决数据资源的管理, 数据资产遍布在各个大数据组件中, 有 hive 的表, 有 hbase 的表, 有 druid 的 datasource, 有 kafka 中的流, 各个组件的管控系统很难互相打通, 所以需要一个统一的数据资产管理服务, 来统筹大数据资源的管理。

    随着大数据平台的建设,构建数据中台的数据体系成为可能,通过对各业务线数据的归类整合,我们可以构建出各个数据主题域,完成数据的规范存储,形成数据资产,进而完成数据资产管理。

    在数据中台体系中,数据资产管理平台主要由元数据管理与数据模型管理组成,下面让我们分别了解一下。

    1、元数据管理

    讲述元数据管理,我们需要先弄清楚什么是元数据。

    元数据(MetaData)通常被定义为:关于数据的数据(Metadata),或者描述数据的数据(data about data),对数据及信息资源的描述性信息。元数据是所有数据中最重要的数据。

    这里举一个最通俗的例子。当我们去图书馆借书时,直接面对数以万计的图书,自然难以寻找,但是你通过在图书馆查询系统中输入这本的书名、作者、出版社等信息,获取就能准确的图书位置。那么这些书名、作者等信息,就可以理解为元数据,而图书的存放位置、借阅历史记录等,则是我们系统中的普通数据。

    在数据库中,每一张数据表的表名、创建信息(创建人、创建时间、所属部门)、修改信息、表字段(字段名、字段类型、字段长度等),以及该表与其他表之间的关系等信息都属于这张数据表的元数据。

    其实,元数据有多种分类方式,笔者更倾向于按照元数据的用途来区分,总共分为三类:业务元数据、技术元数据和管理元数据。

    所以有人说,元数据记录了数据从无到有的全过程,就像一本有关数据的“字典”,让我们可以查询到每一个字段的含义与出处,同时它又像是一张“地图”,让我们可以追溯数据产生的路径。

    通过对数据体系的建设,数据中台的元数据汇聚了企业各业务线与各系统的数据信息,让数据中台具备了提供全域数据资产视图的能力,实现了统一数据资产查询与获取入口的目标。

    元数据管理包括对元数据增删与编辑管理、版本管理、元数据统计分析与元模型管理。通过上述功能模块,有计划地进行数据体系的落地实施,实现数据中台元数据的结构化与模型化,这样既可以避免元数据出现杂乱与冗余的现象,也便于用户查询与定位数据。

    2、数据模型管理

    介绍元数据时,我们提到技术元数据中包括数据模型,这里的数据模型就是指使用元数据进行数据建模的工作产物。

    根据底层数据的使用情况,如数据表的关联信息、SQL脚本信息(数据聚合与查询信息等),来获取元数据,可以更好地完成对业务的抽象,提高建模效率。

    数据模型是数据整合的有效手段,它完成了各数据源之间的映射关系设计,为数据主题建设提供了“实施图纸”。

    同时,在数据建模过程中,通过明确数据标准,可以确保数据的一致性,还可以消化冗余数据。

    至于数据模型管理,其是指在数据建模过程中,通过既定的数据模型管理制度,实现对数据模型增、删、改、查的管理,同时遵守数据标准化与数据统一化的要求,确保数据质量。

    3、数据服务平台

    自助分析平台,也就是商业智能平台(BI平台)。BI平台目前已经是很多企业的标配,目前BI商用市场的行业竞争日趋激烈,进场者可以分为如下3类:

    BI 平台是数据中台服务能力的主要输出方,要想让数据中台发挥出应有价值,那么BI平台的建设必不可少,所以需要将BI 平台建设划分在数据中台体系下。综合来看,BI平台应该具备如下能力。

    (1)数据接入

    除了数据中台的自有数据源,BI平台还需要支持外部数据源的接入。其接入方式,主要有如下3种。

    BI平台支持的数据源

    (2)数据处理

    BI 平台需要能为用户提供数据建模工具,帮助用户创建目标数据(数据集),其提供的功能包括拖拽表字段、自动识别维度/指标、自定义视图语句、预览数据、设置虚拟字段、函数计算、设置参数等基本操作,以及多源异构的 JOIN/UNION等数据处理功能。

    自助数据集数据处理界面

    (3)数据分析与可视化

    在数据处理的基础上,BI 平台还需要为用户提供丰富的图表制作和联机分析处理(OLAP)操作,让用户在前端页面完成数据分析与数据可视化等工作。

    其操作流程如下:用户选择处理后的数据集,对维度与指标进行筛选过滤,然后通过上卷下钻、图表联动、报表跳转等操作,完成业务需求的分析,同时BI平台会为用户提供可视化图形组件,使其最终完成可视化内容的设计。

    (4)内容分发与基础服务

    BI平台需要具备分发可视化内容,并进行查看权限与数据权限控制的能力。主要的分发方式包括BI平台、移动BI(App)、数据大屏、邮件、链接访问,以及第三方嵌入等方式。

    同时BI平台还需要具备基础的运营管理、角色管理、帮助中心与消息推送等功能。

    只有满足以上功能、具备了多维分析、数据可视化与数据大屏等服务能力的BI平台,才可以最大限度的发挥在数据中台体系中的价值,有效地帮助分析师与运营团队提升工作效率。

    2、标签管理系统

    除了BI平台,标签管理系统也是数据服务的重要应用方向之一。目前,业务部门面临着大量的精准营销场景,这些千人千面的推荐、推送需要基于一个完善且准确的用户画像来实现,而用户画像的构成又需要由大量、全面的用户标签来支撑。

    因此,标签数据作为个性化业务应用的基础数据,其可信度与有效性就成了衡量用户画像成熟度的关键指标。

    我们可以把标签管理系统看作用户画像系统的基座,基于数据中台打造的数据体系,可以顺其自然地打通标签治理中的数据壁垒,构建企业级的、统一认可的用户标签体系,并由此打造一个企业级的用户画像系统。

    数据中台的标签管理系统,主要具备以下功能。

    (1)用户唯一性识别

    很多企业内各业务线都有自己的独立用户识别体系,如在 58 集团内就有 58设备指纹、安居客唯一用户、招聘自然人、金融自然人等多种用户识别方式,但是这些识别方式大部分是服务于单一业务线的,各业务线内的标签也是面向本业务的独立用户标识进行研发的。

    数据中台的标签管理体系,可以提供统一的用户识别服务,将各业务线的独立用户标识进行关联和统一,从而打通面向整个企业的独立用户识别和标签交互转换方案。

    (2)标签体系管理

    标签体系管理的主要工作是制订标签数据和信息交互方案,打通用户画像研发和服务中的信息及数据壁垒,提供标签接入、可视化标签信息展现、可视化标签权限控制、可视化用户标签分析、可视化人群定向提取与可视化相似人群扩展(Lookalike)等功能。

    (3)标签数据服务

    标签管理系统,需要提供用户画像研发和应用过程中涉及的标签提取与查询等服务,以标准化服务接口(API)的方式将相关解决方案提供给各业务方,支持业务方基于数据中台的能力,打造业务线的个性化服务。

    除了商业智能BI和标签管理外,各企业还需根据自身所处行业的特性去进行数据应用价值的最大化挖掘。

    三、{title3}

    {content3}以上就是小编为大家整理的足球大数据平台的内容,更多关于足球大数据平台可以关注本站。