查看: 348|回复: 0
打印 上一主题 下一主题

【基础】2016徐老师大数据之Spark视频教程 33课时

[复制链接]

9万

主题

9万

帖子

28万

积分

管理员

管理员

Rank: 9Rank: 9Rank: 9

积分
289121
跳转到指定楼层
楼主
发表于 2017-10-8 12:02:11 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

【根本】2016徐教员大数据之Spark视频教程 33课时
课程先容:
Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP尝试室)所开源的类Hadoop MapReduce的通用并行框架,Spark,具有Hadoop MapReduce所具有的优点;但分歧于MapReduce的是Job中心输出成果可以保存在内存中,从而不再需要读写HDFS,是以Spark能更好地适用于数据挖掘与机械进修等需要迭代的MapReduce的算法。课程讲的比力根本,合适边学边脱手理论。
课程时长:
总共33课时,两个星期可以把握。
合适学员:
需要一定的Hadoop、JAVA、scala、linux根本。
课程目录:
01.Spark简介 00:03:19
02.Spark预编译版本下载安装与启动 00:15:49
03.Spark体验shell操纵与wc操纵与RDD先容 00:20:40
04.Spark经过Maven停止源码编译安装 00:25:24
05.Spark搭建Maven当地仓库办事器 00:23:39
06.Spark经过当地Maven仓库办事器停止编译以及停止描写文件的设备 00:08:25
07.Spark官方doc的宏观描写和上风说明 00:10:29
08.Spark自力集群形式摆设和启动 00:32:06
09.Spark Master和Worker的webui检察以及FIFO作业调剂讲授 00:09:43
10.Spark自力集群形式端口点窜 00:11:16
11.Spark shell利用于addFile 00:24:37
12.Spark法式build的宏观先容 00:03:24
13.经过交互形式初始化Maven项目 00:11:10
14.经过参数指定方式间接初始化Maven项目 00:04:19
15.预备java源文件到自己的源码包中 00:04:43
16.设备pom.xml文件依靠插件以及与自在仓库目录树的对应关系 00:08:46
17.利用mvn package指令停止编译并停止打包与自在仓库目录树的对应关系 1 00:05:09
18.利用java指令增加spark类库运转Spark法式 00:05:21
19.利用maven的exec履行插件运转java法式 00:05:44
20.设置eclipse的maven插件利用当地maven仓库办事器 00:04:38
21.eclipse之下maven项目标设置编译运转 00:16:33
22.eclipse之Scala插件的卸载与安装 00:05:02
23.eclipse下构建Scala法式以及运转 00:02:45
24.经过Scalac号令手动编译scala法式并履行 00:13:16
25.号令行下经过maven编译运转Scala法式 00:10:15
26.eclipse下经过maven-scala插件停止Spark(Scala版)利用的开辟 00:05:59
27.建立SparkContext简介与情况预备 00:04:59
28.利用Scala建立SparkContext工具以及conf设置和调试 00:11:32
29.利用Java建立SparkContext工具以及元数据先容 00:11:30
30.利用Java建立Rdd工具并在eclipse运转 00:04:40
31.利用Scala建立Rdd工具并在eclipse调试散布式利用 00:17:09
32.addFile方式的利用与常见毛病 00:21:53
33.flatMap函数处置csv文件停止扁平化RDD处置 00:21:01
课程下载:
游客,如果您要查看本帖隐藏内容请回复

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|IT视频教程资源网

GMT+8, 2024-12-27 09:31 , Processed in 1.790712 second(s), 22 queries .

快速回复 返回顶部 返回列表

客服
热线

微信
7*24小时微信 客服服务

扫码添
加微信

添加客服微信获取更多

关注
公众号

关注微信公众号