机读格式显示(MARC)
- 000 01634nam0 2200265 450
- 010 __ |a 978-7-5226-0485-5 |d CNY48.00
- 100 __ |a 20220425d2022 em y0chiy50 ea
- 200 1_ |a Spark大数据处理技术 |A Spark da shu ju chu li ji shu |f 刘仁山, 周洪翠, 庄新妍主编
- 210 __ |a 北京 |c 中国水利水电出版社 |d 2022
- 300 __ |a 普通高等教育数据科学与大数据技术专业教材
- 330 __ |a 本书共9章,第1章为Spark基础,主要包括Spark基础知识、Spark应用场景以及Spark生态系统等内容;第2章为Scala语言基础和面向对象编程,包括Scala编程基础、Scala数组和集合以及映射等内容;第3章为Spark设计与运行原理,包括Spark架构、Spark Core组成等内容;第4章为Spark环境搭建和使用,包括Spark系列软件环境配置(JDK、Hadoop、MySQL-Server、Hive、ZooKeeper、Scala、Kafka、Spark)和Spark-shell交互式命令工具使用等内容;第5章为Spark RDD弹性分布式数据集,包括RDD创建方式、RDD转换算子和行动算子操作方法等内容;第6章为Spark SQL结构化数据处理引擎,包括DataFrame和DataSet的创建和操作以及利用Spark SQL操作MySQL数据源等内容;第7章为Spark Streaming实时流处理引擎,包括Spark Streaming程序开发等内容;第8章为Spark MLlib机器学习,包括机器学习基础、Spark MLlib机器学习库和常用算法等内容;第9章为订单交易监控系统,主要完成订单交易实时监控台的搭建,通过综合案例全面应用了Spark大数据处理技术中几乎所有知识点。
- 606 0_ |a 数据处理软件 |x 高等学校 |j 教材
- 701 _0 |a 刘仁山 |A liu ren shan |4 主编
- 701 _0 |a 周洪翠 |A zhou hong cui |4 主编
- 701 _0 |a 庄新妍 |A zhuang xin yan |4 主编
- 801 _0 |a CN |b LIB |c 20240420
- 905 __ |a LIB |d TP274/644