首页 » 华为认证 » 大数据HCIE-Big Data认证培训

大数据HCIE-Big Data认证培训

大数据是当下 IT 领域最热门,最高大上,也是最被看好的行业,人才的稀缺程度从各公司,各大招聘网站开出的薪水便能感知,高薪就业无忧, 但大数据对于很多人来说不知道该如何学习,需要哪些基础,学习一些什么内容,誉天将为零基础学员量身定做,成为一名合格的大数据工程师,我们专注实战和就业。

 

华为大数据认证可胜任的岗位:

大数据挖掘专家/工程师,高级行业分析师,大数据业务架构师/工程师, 大数据架构师/工程师,大数据算法工程师,大数据开发工程师,大数据运维工程师

 

预备知识

1. 了解大数据技术原理和 Hadoop 的基础知识
2. 熟悉 Linux 的管理和操作
3. 具有数据库的基本知识,有数据库的使用经验,了解 SQL  语言
4. 具备一定软件开发能力,熟悉 Java、Python, C++等至少一种开发语言
5. 数学知识

 

课程内容
Linux 模块一 (18 课时)
将利用我们多年的 Linux 经验,让您从零基础迅速掌握 Linux 基本技能,满足后续搭建原生态的 Hadoop 和学习 python 做好准备,这个基础非常重要

1. Linux系统安装
2. Linux基础使用
3. Linux帮助系统和文件系统管理
4. 用户,组及权限管理
5. IO及管道,循环语句,环境变量,shell基础,脚本基础(精华)
6. 文本处理工具,grep,awk,sed正则表达式等(精华)
7. 进程管理,远程管理工具
8. Linux下文件查找与压缩
9. Linux下文件系统的深入理解(精华)
10. Linux下软件包的安装和管理
11. Shell脚本实战(精华)

 

数据库模块二(12 课时)
这个是学习分布式数据库的基础,为后续分析平台做好准备,学习数据库的安装,SQL 语句,数据库的基本操作,数据库视图,索引等。

1. 搭建实验环境、 虚拟机/操作系统/数据库安装/数据库应用安装、数据库基础知识
2. SELECT基本语法、过滤和排序数据、单行函数、高级子查询 (精华)
3. 多表查询、分组函数、子查询、操纵数据、使用集合运算 (精华)
4. 创建和管理表、内置约束、创建视图、索引及其他数据库对象 (精华)
5. 控制用户访问,数据字典

 

python 开发模块三 (36 课时)精华内容
2018年,浙江省信息技术教材将不会在使用晦涩难懂的VB语言,而是改学更简单易懂的Python语言。也就是说,Python语言将纳入高考内容之一,编程语言在升学中的比重逐渐加大,将要成为高考加分的一大利器,从国家层面开始推行Python,可见对于大数据和人工智能时代的重要性而Python是目前世界上最流行的开发语言,也是云计算、大数据、人工智能时代最好的开发语言,更是最容易上手的开发语言。没有开发,就没有大数据,誉天将零基础带你进入python的大门,学习Hadoop模块二次开发,就业无忧。1. 安装Python,Python解释器
2. 第一个Python程序
3. 使用文本编辑器,输入和输出
4. Python基础,基础语法
6. 变量类型,运算符
7. 条件语句,循环语句,While 循环语句
8. for 循环语句,循环嵌套,break 语句
9. continue 语句,pass 语句
10. Number(数字),字符串,列表(List),元组
11. 字典(Dictionary),日期和时间
12. 函数,模块,文件I/O,File 方法,异常处理
13. 内置函数,高级特性,切片,迭代,列表生成式
14. 生成器,函数式编程,高阶函数,map/reduce,filter,sorted
15. 返回函数,匿名函数,装饰器,偏函数,模块
16. 使用模块,安装第三方模块
17. 面向对象编程,类和实例,访问限制,继承和多态,获取对象信息
18. 面向对象高级编程
19. Hadoop模块开发实战

Hadoop 技术模块四 (24 课时)
Hadoop是大数据最重要的运行平台,华为FusionInsight HD就是基于开源的Hadoop开发,但Hadoop组件众多,原理复杂,我们将从原理及流程开始讲解每个组件,然后使用命令行搭建一套开源的Hadoop系统,这样才能更透彻的理解这些组件,最好搭建出华为FusionInsight进行商业化应用。1. Hadoop基础
2. MapReduce和YARN分布式计算引擎技术
3. LDAP及Kerberos工作原理及应用
4. Hadoop分布式文件系统
5. Spark基于内存的分布式计算技术
6. Hive数据仓库
7. HBase分布式数据库
8. Zookeeper集群分布式锁设施
9. Streaming实时计算技术及应用
10. Kafka订阅消息系统
11. Flume海量日志聚合

 

华为 FusionInsight 模块五 (18 课时)

1. 数据仓库平台 FusionInsight LibrA
第一章 分布式数据库架构
第二章 FusionInsight LibrA 基本组件简介
第三章 FusionInsight LibrA 产品特性和关键技术
第四章 FusionInsight LibrA 配套工具集
第五章 FusionInsight LibrA 安全管理
第六章 FusionInsight LibrA 数据库管理系统并发控制
第七章 FusionInsight LibrA 数据库性能监控
第八章 FusionInsight LibrA 数据迁移
第九章 FusionInsight LibrA SQL 介绍
第十章 FusionInsight LibrA 数据库设计
第十一章 FusionInsight LibrA 应用程序开发指导

2.FusionInsight LibrA 实验
FusionInsight LibrA 基本操作、语法
FusionInsight LibrA 性能优化
网络 KPI 数据栅格化处理
重点区域数据分析
流动人口常驻地分析

大数据挖掘技术与实现 模块六 (30 课时)
数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能 和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。

第十二章 预备知识和数据介绍
第十三章 数据预处理
第十四章 数据仓库介绍
第十五章 分类 (Classification)
第十六章 聚类 (Clustering)
第十七章 离群点检测
第十八章 关联规则(Association Rule)
第十九章 FusionInsight Miner 和华为云机器学习服务 MLS

大数据挖掘项目实战 (12 课时)
银行定期存款业务预测
客户分群
CRM用户精准营销

更多