高性能Spark读书介绍
类别 | 页数 | 译者 | 网友评分 | 年代 | 出版社 |
---|---|---|---|---|---|
书籍 | 369页 | 2022 |
定价 | 出版日期 | 最近访问 | 访问指数 |
---|---|---|---|
98.00 | 2022-01-01 … | 2022-03-20 … | 25 |
主题/类型/题材/标签
作者
Holden Karau ISBN:9787519863531 原作名/别名:《》
内容和作者简介
高性能Spark摘要
通过本书,你可以了解到:Spark SQL的新接口如何为SQL的RDD数据结构提升性能。Spark Core与Spark SQL中数据join的不同选择方式。充分利用标准RDD转换的技术。如何解决Spark中键值范式的性能问题。不借助Scala或其他JVM语言来编写高性能的Spark代码。采用改进建议后,如何来测试其功能及性能情况。使用Spark MLlib和Spark ML机器学习库。Spark的流处理组件、外部的社区扩展包。
作者简介Holden Karau是一位加拿大人,在IBM的Spark技术中心担任软件开发工程师。同时作为一位Spark committer,经常在PySpark和机器学习方面进行贡献。另外曾在多次国际会议中发表关于Spark的演讲。
Rachel Warren是Alpine Data的软件工程师和数据科学家。在工作中,她利用Spark来解决实际场景中的数据处理和机器学习问题。另外,她还曾在工业界以及学术界担任过分析师和导师。
本书后续版本
未发行或暂未收录
喜欢读〖高性能Spark〗的人也喜欢:
相关搜索
友情提示
剧情呢,免费看分享剧情、挑选影视作品、精选好书简介分享。