请选择 进入手机版 | 继续访问电脑版

[大数据] 《Spark 1.X 大数据平台V2》11月份班

  [复制链接]
查看: 2088 |回复: 68
发表于 2015-5-3 23:51:24 | 显示全部楼层 |阅读模式
内容:

第一周 Spark生态系统概述与编程模型
•    Spark生态系统概述
•    回顾Hadoop MapReduce
•    Spark运行模式
•    RDD
•    Spark运行时模型简介
•    缓存策略介绍
•    transformation
•    action
•    lineage
•    容错处理
•    宽依赖与窄依赖
•    集群配置

第二周 深入Spark内核
•    Spark术语解释
•    集群概览
•    核心组件
•    数据本地性
•    常用RDD
•    任务调度
•    DAGScheduler
•    TaskScheduler
•    Task细节
•    广播变量
•    累加器
•    性能调优

第三周 Spark on Yarn & Spark as a service
•    Spark on Yarn原理
•    Spark on Yarn实践
•    JobServer架构
•    JobServer API介绍
•    JobServer配置与部署

第四周 Spark Streaming原理与实践
•    DStream
•    数据源
•    无状态transformation与有状态transformation
•    checkpoint
•    容错
•    性能优化

第五周 Shark与Spark SQL
•    Shark数据模型
•    Shark数据类型
•    Shark架构
•    Shark部署
•    缓存(分区)表
•    SharkServer
•    Shark与Spark结合
•    Spark SQL架构
•    Parquet支持
•    DSL
•    SQL on RDD
•    Hive支持
•    UDF
•    JDBC Server

第六周 Machine Learning on Spark
•    LinearRegression
•    K-Means
•    Collaborative Filtering

第七周 Spark多语言编程
•    Python简介
•    PySpark API
•    使用Python编写Spark程序
•    Spark with Java

第八周 图计算GraphX
•    现存的图计算框架
•    Table Operators
•    Graph Operators
•    GraphX设计

第九周 Tachyon原理与实践
•    Tachyon原理与架构
•    Tachyon实践

第十周 SparkR
•    SparkR原理介绍
•    安装配置与运行

游客,如果您要查看本资源下载链接请点这里回复

不要你签到,你还灌水!只有扣除你20金币才能消我气!
发表于 2015-5-21 02:12:25 | 显示全部楼层
谢谢楼主分享
发表于 2015-7-5 14:39:54 | 显示全部楼层
发表于 2015-7-22 22:58:53 | 显示全部楼层
good.................................................
发表于 2015-8-25 08:56:54 | 显示全部楼层
很好很强大 非常支持感谢楼主
发表于 2015-9-8 18:06:28 | 显示全部楼层
咯片;oil,看见了,看io咯lj
发表于 2015-9-13 22:12:15 | 显示全部楼层
发表于 2015-10-2 02:14:05 | 显示全部楼层
不错不错不错不错
发表于 2015-10-18 18:46:56 | 显示全部楼层
《Spark 1.X 大数据平台V2》11月份班
发表于 2015-10-20 16:46:21 | 显示全部楼层
怎么会有几个的呢
收缩
  • QQ:点击这里给我发消息
  • 旺旺:点这里给我发消息
  • 交流群:技术资源共享@