沙盒资源网 大数据云计算 炼数成金 Spark大数据分析平台 8课


炼数成金 Spark大数据分析平台 8课

2019-08-22 888
刘洋发帖没人回
刘洋发帖没人回 发帖专员   
资源介绍

炼数成金 Spark大数据分析平台 8课

炼数成金 Spark大数据分析平台 8课

spark介绍:
2015年, Spark只用了一年多时间,已实现开源到火爆 ,亦逐渐显露出与通用大数据平台Hadoop的分庭抗争之势。在这个大背景下,在大数据领域时代,谁将是独领风骚?Spark无疑是最大的竞争者,无论是 2015 Spark技术峰会 ,还是国内的大数据大会,可以看到中国力量正在崛起,Spark最大的集群来自腾讯——8000个节点,单个Job最大分别是阿里巴巴和Databricks——1PB,震撼人心!同时,截止2015年6月,Spark的Contributor比2014年涨了3倍,达到730人;总代码行数也比2014年涨了2倍多,达到40万行,不但大量的互联网企业已经在使用或者正准备使用Spark,而且大量的电信、金融、证券和传统企业已经开始引入了Spark。

授课对象:
有Java开发经验或Scala开发经验,最好了解Hadoop,Hive等使用经验。课程对于Spark初学者,Spark开发人员及Spark运维人员都具有比较大的学习价值。

收获预期:
深入理解Spark的运行原理
学会搭建Spark,hadoop集群环境
完全掌握Spark编程基础,了解Spark运维的基础知识
完成大数据入门,可逐渐转岗大数据相关职位。

Spark版本:Spark1.4

准备环境:
CentOS,eclipse或IntelliJ IDEA, Scala,JDK,Maven,sbt,Hadoop,hive,建议三台虚拟机。
然而作为一个高速发展中的开源项目,其部署过程中存在的门槛和挑战亦不可谓不大,本课程将主要介绍Spark1.4.0,引领大家进入大数据Spark入门。

课程目录:
1、Spark生态和安装部署
什么是Spark
Spark有什么
安装部署
Spark安装简介
Spark的源码编译
Spark Standalone安装
Spark Standalone HA安装
Spark工具
Spark交互式工具spark-shell
Spark应用程序部署工具spark-submit
2、Spark编程模型和解析
Spark的编程模型
RDD的特点、操作、依赖关系
缓存策略
广播变量和累加器
Spark编程环境搭建
Spark编程实例
3、Spark运行架构和解析
Spark的运行架构
基本术语
运行架构(DAGScheduler、TaskSeduler、Task、容错性、推测机制、数据本地性)
Spark on Standalone运行过程
Spark on YARN 运行过程
Spark实例演示
Spark on Standalone实例演示
Spark on YARN实例演示
4、不得不说的hive
hive的运行架构
hive的安装
hive的实例演示
shark的简介
5、SparkSQL原理和实践
Spark的运行架构
Catalyst
sqlontext
hiveContext
ThriftServer和CLI
ThriftServer
CLI
SparkSQL的实例演示和编程
spark-shell实例演示
spark-sql实例演示
SparkSQL的编程
6、SparkStreaming原理和实践
SparkStreaming原理
SparkStreaming的原理
SparkStreaming的运行方式
DStream的特点和操作
SparkStreaming实例演示
网络数据演示
文本实例演示
Window操作演示
7、MLlib入门
什么是机器学习
MLlib的架构
Mllib实例演示
聚类算法演示
推荐系统演示
8、GraphX入门
图论基础
GraphX的架构
GraphX实例演示
图的基本操作
PageRank演示



标签:

问题反馈


百度网盘可以用手机平板电脑在线播放,也可以下载之后播放

本帖资源评论
【8.8G】电商数据化运营数据挖掘与分析应用轻松驾驭统计学EXCEL大数据分析合集
DevOps运维培训机构 宝哥 大数据日志分析 ELK Stack深入浅出基础入门课程 ELK Stack
黑马-2020.2大数据开发就业课
[大数据] 大数据分析/数学建模-MATLAB多套视频教程合集+200多本MATLAB技术文档+电子书
16套深度学习 大数据 数据分析 包含决胜强化学习实战系列教程 完整教程课件
广发证券量化交易策略合集 PDF版
Openstack快速部署及入门视频教程 Openstack入门视频
Hadoop2.X数据分析平台精讲视频教程 14课 [
Flink大数据实时计算系统实践
小甲鱼数据结构与算法更新—第四部
2016大数据高薪就业培训
Spark精华零基础学习Spark 1.x应用开发系列课程 Spark生态系统学习视频教程
大数据实战培训 Spark大型项目实战:电商用户行为分析大数据平台 大数据视频教程
八斗学院大数据培训第六期全套视频
实时计算开发 - Storm从入门到精通
[大数据] 基于Flink流处理的动态实时亿级电商全端用户画像系统
清华大学编程基础之数据结构,DataStructure视频教程
尚硅谷大数据技术之Kafka
Linux云计算技术-打造高可用LINUX集群架构-负载均衡集群+多级负载均衡+集群优化等
人工智能与大数据特训班 基础理论 + 项目实战
没有账号? 注册