2024年云南省职业院校技能大赛赛程规章(大数据赛项)
大家期待已久的职业院校技能大赛在各个省份已经陆续出新文件了,近日云南省的赛程规章也是出来了,我相信不仅是对云南,对其他省份也很有参考价值,小编为大家精简整理了一下文件的内容。
一、竞赛目标
为适应大数据产业对高素质技术技能型人才的职业需求,赛项以大数据应用开发为核心内容和工作基础,重点考查参赛选手基于Hadoop、Spark、Flink平台环境下,充分利用Spark Core、Spark SQL、Flume、Kafka、Flink、Hive、HBase、Redis、Maxwell、ClickHouse、MySQL等相关技术的特点,基于Scala、Java、JavaScript等开发语言,综合软件开发相关技术,解决实际问题的能力,激发学生对大数据相关知识和技术的学习兴趣,提升学生职业素养和职业技能,努力为中国大数据产业的发展储备及输送新鲜血液。
通过举办本赛项,可以搭建校企合作的平台,提升大数据专业及其他相关专业毕业生能力素质,满足企业用人需求,促进校企合作协同育人,对接产业发展,实现行业资源、企业资源与教学资源的有机融合,使高职院校在专业建设、课程建设、人才培养方案和人才培养模式等方面,跟踪社会发展的最新需要,缩小人才培养与行业需求差距,引领职业院校专业建设与课程改革。
二、竞赛内容
赛项以大数据应用开发为核心内容和工作基础,重点考查参赛选手基于Hadoop、Spark、Flink平台环境下,充分利用Spark Core、Spark SQL、Flume、Kafka、Flink、Hive、HBase、Redis、Maxwell、ClickHouse、MySQL等技术的特点,综合软件开发相关技术,解决实际问题的能力,具体包括:
1.掌握Hadoop平台、基于Spark的离线分析平台、基于Flink的实时分析平台,在容器环境下,按照项目需求安装相关技术组件并按照需求进行合理配置;
2.掌握基于Spark的离线数据采集方式方法,完成指定数据的抽取并写入Hive分区表中。掌握基于Flume、Maxwell的实时数据采集,将数据写入Kafka中;
3.综合利用Flink、Kafka、Hive、Redis、HBase、ClickHouse等技术,使用Java开发语言,完成某电商系统的实时数据处理,包括使用Flink处理Kafka中的数据、实时数据仓库、将数据备份至HBase中、建立Hive外表、将数据处理结果存入Redis、ClickHouse中等操作;
4.综合利用Spark、Hive、MySQL、HBase、ClickHouse等相关技术,使用Scala开发语言,完成某电商系统的离线数据处理,包括Hive数据仓库、使用Spark处理离线数据、数据合并、去重、排序、数据类型转换、将数据处理结果存入MySQL、HBase、ClickHouse中等操作;
5.综合运用HTML、CSS、JavaScript等开发语言,Vue.js前端技术,结合ECharts数据可视化组件,利用后端数据接口完成数据可视化;
6.根据竞赛过程,完成综合分析报告的编写;
7.竞赛时间6小时,竞赛连续进行。
三、竞赛方式
1、比赛以师生联赛方式进行,不得跨校组队,同一学校的报名参赛队伍不超过2支。
2、每个参赛队由1名领队、4名选手(1名教师、3名学生)组成,参赛选手和教师报名获得确认后不得随意更换。
3、竞赛时间6小时。
四、竞赛时间安排
时间 | 内容 |
14:00 - 18:00 | 各参赛队报道 |
15:00 - 16:00 | 领队会、赛前说明 |
16:00 - 16:30 | 选手熟悉赛场 |
(次日)8:00 - 9:00 | 赛场检录,竞赛选手进入赛位 |
9:00 - 15:00 | 竞赛选手完成竞赛内容 |
16:00 - 24:00 | 对选手提交的结果文件进行评分 |
五、竞赛规则
1. 学生须为高等职业学校专科、高等职业学校本科、技师学院全日制在籍学生,五年制高职四、五年级学生也可报名参赛。凡在往届全国职业院校技能大赛中获一等奖的学生,不能再参加同一项目同一组别的比赛。参赛选手由省教育厅、省人力资源社会保障厅负责。
2. 竞赛前1日安排各参赛队领队、参赛选手熟悉赛场。
3. 严禁参赛选手、赛项裁判、工作人员私自携带通讯、摄录设备进入比赛场地。
4. 参赛选手所需的硬件、软件和辅助工具统一提供,参赛队不得使用自带的任何有存储功能的设备,如硬盘、光盘、U盘、手机、平板电脑等。
5. 所有参赛选手都必须携带参赛证件进行检录。
6. 参赛队在赛前领取比赛任务并进入比赛工位,比赛正式开始后方可进行相关操作。
7. 比赛过程中,选手须严格遵守操作规程,确保人身及设备安全,并接受裁判员的监督和指示。因选手原因造成设备故障或损坏而无法继续比赛的,裁判长有权决定中止该队比赛;非因选手个人原因造成设备故障的,由裁判长视具体情况作出裁决。
8. 竞赛开始时统一发放本阶段赛卷,竞赛结束后,参赛选手要确认已成功提交竞赛要求的配置文件和文档,裁判员与参赛选手一起签字确认,参赛选手在确认后不得再进行任何操作。
9. 赛项成绩解密后,在指定地点,以纸质形式向全体参赛队进行公布,成绩无异议后,在闭赛式上予以宣布。
六、技术环境
(一)竞赛设备
设备类别 | 数量 | 设备用途 | 基本配置 |
竞赛服务器 | 每支参赛队伍1台。 根据参赛队数量,配备10%的备份机器。 | 构建大数据平台集群 | 性能相当于i5处理器,64GB以上内存,1TB以上硬盘,网卡(千兆),显示器要求1024*768以上。 |
竞赛客户机 | 每支参赛队伍4台。 根据参赛团队数量,配备10%的备份机器。 | 竞赛选手比赛使用 | 性能相当于i5处理器,16GB以上内存,1TB以上硬盘,显示器要求1024*768以上。 |
(二)软件平台
由2023年全国职业院校技能大赛(高职组)大数据应用开发赛项合作企业——北京四合天地科技有限公司提供四合天地大数据实训管理系统。
(三)软件环境
设备类型 | 软件类别 | 软件名称、版本号 |
竞赛服务器 | 竞赛环境大数据集群操作系统 | CentOS 7、Docker-CE 20.10 |
大数据平台组件 | Hadoop 3.1.3 | |
Hive 3.1.2 | ||
HBase 2.2.3 | ||
Spark 3.1.1 | ||
Kafka 2.4.1 | ||
Redis 6.2.6 | ||
Flume 1.9.0 | ||
Maxwell 1.29.0 | ||
Flink 1.14.0 | ||
ClickHouse 21.9.4 | ||
JDK 1.8 | ||
MySQL 5.7 | ||
开发 客户端 | PC操作系统 | Ubuntu18.04 64位 |
浏览器 | Chrome | |
开发语言 | Scala 2.12 | |
Java 8 | ||
开发工具 | IDEA 2022 (Community Edition) | |
Visual Studio Code 1.69 | ||
数据库连接工具 | MySQL Workbench | |
SSH工具 | Asbru-cm或Ubuntu SSH客户端 | |
API测试工具 | Postman API Platform | |
数据可视化组件 | Vue.js 3.0 | |
ECharts 5.1 | ||
文档编辑器 | WPS Linux版 | |
输入法 | 搜狗拼音输入法 Linux版 |
七、评分标准
任务 | 考查点 | 描述 | 评分标准 | 分值 |
大数据平台环境搭建 | 大数据相关平台组件安装配置 | 在指定的宿主机上,基于Docker环境完成Hadoop完全分布式、Spark、Flink、Hive、Kafka、Flume、ClickHouse、HBase等的安装配置。 | 主要评分点包括Hadoop完全分布式安装配置、Spark安装配置、Flink安装配置、Hive安装配置、Kafka安装配置、Flume安装配置、ClickHouse安装配置、HBase安装配置。 | 10 |
数据采集 | 离线数据采集、实时数据采集 | 按照要求基于Scala语言完成特定函数的编写,使用Spark完成离线数据采集;按照要求使用Linux命令,利用Flume、Maxwell、Kafka等工具完成实时数据采集。 | 主要评分点包括Spark数据读取、数据存储、Flume数据采集、Maxwell数据采集、Kafka等操作。 | 15 |
实时数据处理 | 实时数据处理计算代码编写 | 使用Java语言基于Flink完成Kafka中的数据消费,将数据分发至Kafka的dwd层中,并在HBase中进行备份同时建立Hive外表,基于Flink完成相关的数据指标计算并将计算结果存入Redis、ClickHouse中。 | 主要评分点包括Flink数据处理、数据指标计算、HBase、Hive、ClickHouse、Redis等相关操作。 | 25 |
离线数据处理 | 离线数据处理计算代码编写 | 使用Scala语言基于Spark完成离线数据清洗、处理、计算,包括数据的合并、去重、排序、数据类型转换等并将计算结果存入MySQL、HBase、ClickHouse中。 | 主要评分点包括基于Spark的数据清洗、数据指标计算、HBase、Hive、ClickHouse、MySQL等相关操作。 | 20 |
数据可视化 | 数据可视化代码编写 | 编写前端Web界面,调用后台数据接口,使用Vue.js、ECharts完成数据可视化。 | 主要评分点包括可视化前端代码开发、前端展示。 | 15 |
综合分析报告 | 文档编写 | 根据项目要求,完成综合分析报告编写。 | 主要评分点包括能够按照赛项要求进行综合分析。 | 10 |
职业素养 | 职业素养 | 团队分工明确合理、操作规范、文明竞赛。 | 主要评分点包括:竞赛团队分工明确合理、操作规范、文明竞赛。 | 5 |
八、奖项设置
竞赛设参赛选手团体奖。奖项设置按参赛队数量为基数确定,其中比例分别为一等奖10%,二等奖20%,三等奖30%。
如出现参赛队总分相同情况,按照任务分值权重顺序的得分高低排序,即总成绩相同的情况下比较任务C的成绩,任务C成绩高的排名优先,如果任务C成绩也相同,则按任务D、任务B、任务A、任务E、任务F的成绩进行排名,以此类推完成相同成绩的排序。如果所有任务分值相同,则查看文档撰写规范、职业素养的分值进行排序。
九、竞赛须知
(一)参赛队须知
1. 参赛队名称:统一使用规定的学校代表队名称,不使用其他组织、团体的名称;
2. 参赛队组成:每支参赛队由4名选手(1名教师、3名学生)组成。不接受跨校组队,同一学校的报名参赛队伍不超过2支;
3. 各参赛院校应指定1名负责人任赛项领队,全权负责该校参赛事务的组织、协调和领导工作。
4. 参赛选手在报名获得确认后,原则上不再更换。如在筹备过程中,参赛选手因故不能参赛,须由其所在学校供职部门于赛项开赛前10个工作日之前出具书面说明,经赛项执委会办公室核实后予以更换。允许队员缺席比赛;允许指导教师缺席比赛。
5. 参赛队按照赛项竞赛规程安排,凭赛项执委会颁发的参赛证和有效身份证件参加比赛及相关活动。
6. 赛项执委会统一安排各参赛队在比赛前一天进入赛场熟悉环境和设施情况。
7. 参赛队选手、领队要有良好的职业道德,严格遵守比赛规则和比赛纪律,服从裁判,尊重裁判和赛场工作人员,自觉维护赛场秩序。
8. 领队应负责赛事活动期间本队所有选手的人身及财产安全,如发现意外事故,应及时向赛项执委会报告。
9. 各学校组织代表队时,须为参赛选手购买竞赛期间的人身意外伤害保险。
(二)领队须知
1. 严格遵守赛场的各项规定,服从裁判,文明竞赛。如发现弄虚作假者,取消参赛资格,名次无效。
2. 领队务必带好有效身份证件,在活动过程中佩戴“领队证”参加竞赛相关活动。
3. 各代表队领队要坚决执行竞赛的各项规定,加强对参赛人员的管理,做好赛前准备工作,督促选手带好证件等竞赛相关材料。
4. 在比赛期间要严格遵守比赛规则,不得私自接触裁判人员。
5. 竞赛过程中,未经裁判许可,领队及其他人员一律不得进入竞赛现场。
6. 如对竞赛过程有疑议,由领队负责以书面形式向赛项仲裁委员会反映,但不得影响竞赛进行。
7. 对申诉的仲裁结果,领队要带头服从和执行,并做好选手工作。参赛选手不得因申诉或对处理意见不服而停止竞赛,否则以弃权处理。
8. 领队应及时查看有关赛项的通知和内容,认真研究和掌握本赛项竞赛的规程、技术规范和赛场要求,指导选手做好赛前的一切技术准备和竞赛准备。
(三)参赛选手须知
1. 参赛选手应严格遵守赛场规章、操作规程和工艺准则,保证人身及设备安全,接受裁判员的监督和警示,文明竞赛。
2. 参赛选手应按照规定时间抵达赛场,凭身份证、学生证,以及统一发放的参赛证,完成入场检录、抽签确定竞赛工位号,不得迟到早退。
3. 参赛选手凭竞赛工位号进入赛场,不允许携带任何电子设备及其他资料、用品。
4. 参赛选手应在规定的时间段进入赛场,认真核对竞赛工位号,在指定位置就座。
5. 参赛选手入场后,迅速确认竞赛设备状况,填写相关确认文件,并由参赛队长确认签字(竞赛工位号)。
6. 参赛选手在收到开赛信号前不得启动操作。在竞赛过程中,确因计算机软件或硬件故障,致使操作无法继续的,经裁判长确认,予以启用备用计算机。
7. 参赛选手应在竞赛规定时间内完成任务书内容,并按照要求,将相应文档拷贝到U盘。
8. 参赛选手需及时保存工作记录。对于因各种原因造成的数据丢失,由参赛选手自行负责。
9. 参赛队所提交的答卷采用竞赛工位号进行标识,不得出现地名、校名、姓名、参赛证编号等信息,否则取消竞赛成绩。
10. 竞赛过程中,因严重操作失误或安全事故不能进行比赛的(例如因操作原因发生短路导致赛场断电的、造成设备不能正常工作的),现场裁判有权中止该队比赛。
11. 在比赛中如遇非人为因素造成的设备故障,经裁判确认后,可向裁判长申请补足排除故障的时间。
12. 参赛选手不得因各种原因提前结束比赛。如确因不可抗因素需要离开赛场的,须向现场裁判举手示意,经裁判长许可并完成记录后,方可离开。凡在竞赛期间内提前离开的选手,不得返回赛场。
13. 竞赛操作结束后,参赛选手需要根据任务书要求,将相关成果文件拷贝至U盘,填写结束比赛相关确认文件,并由参赛队长签字确认(竞赛工位号)。因参赛选手未能按要求,将相应的文档等拷贝至U盘的,竞赛成绩计为零分。
14. 竞赛时间结束,选手应全体起立,停止操作。将资料和工具整齐摆放在操作平台上,经工作人员清点后可离开赛场,离开赛场时不得带走任何资料。
15. 在竞赛期间,未经执委会批准,参赛选手不得接受其他单位和个人进行的与竞赛内容相关的采访。参赛选手不得将竞赛的相关信息私自公布。
好了,以上就是这次云南省赛程规章的大致内容了~~~
原文地址:https://blog.csdn.net/xq_123dd/article/details/142644184
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!