年份:2020年

作者:刘未昕 张粤磊 张魁 吴茂贵

出版社:电子工业出版社

语言:chinese

类型:EPUB

大小:10.49 MB

在第一版的基础上,根据近几年大数据领域最新出现的各种流行组件,逐个进行介绍,并以两个具体的示例,贯穿各个章节,对组件之间的协同工作关系进行剖析。新增大数据平台架构选型及最佳实践案例,大数据治理,流计算开发,flink等流式大数据处理。基于docker的大数据运维部署等部分,书中所使用的示例程序,是基于笔者在进行企业培训时,企业提出的业务需求而展开,示例程序更有代表性。
目录
第一部分 大数据概述
第1章 大数据的时代背景及应用落地
1.1 大数据与“云大物区智”的关联
1.2 大数据平台的应用优势
1.3 大数据平台的技术架构选型和产品对比
第2章 大数据系统的安装及配置
2.1 服务器及操作系统的准备
2.2 JDK、Python和Scala
2.3 Hadoop
2.4 Sqoop
2.5 Hive
2.6 ZooKeeper和HBase
2.7 Flume
2.8 Kafka
2.9 Spark
2.10 Flink
2.11 开源大数据系统各组件的组合
2.12 CDH
2.13 FusionInsight
2.14 小结
第二部分 离线大数据处理
第3章 使用Python爬虫获取数据…………………..

温馨提示:如果下载链接失效,请直接在上方的“评论建议”里留言,我们会第一时间进行修补!也可以添加客服微信:TM8521595 进行反馈,或者发送问题至邮箱(ebookmany@163.com),我们在收到反馈后,会第一时间进行处理(一般不会超过2小时),谢谢大家理解!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

本站所有电子书都是采用常规格式的,一般包括PDF、mobi、epub等格式,大家可以下载一个“稻壳阅读器”进行阅读,下载链接可通过稻壳官网进行下载,官网链接:http://www.daokeyuedu.com/

如果您已经成功付款但是网站没有弹出成功提示或下载链接失效,请联系站长,提供付款信息为您处理

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

本站所有商品均属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源