資料來源: Google Book
Hadoop+Spark+Python大数据处理从算法到实战[電子資源]
- 作者: 朱春旭
- 其他作者: 華藝數位股份有限公司
- 出版: 北京 : 北京大学出版社 2021[民110].
- 版本: [初版]
- 稽核項: 430面 :圖.
- 標題: 資料處理 , 資料探勘
- ISBN: 7301321449 , 9787301321447
- 試查全文@TNUA:
- 附註: 檢索形式:電子書服務平台
- 電子資源: 2023 TAEBDC 電子書
- 系統號: 005330140
- 資料類型: 電子書
- 讀者標籤: 需登入
- 引用網址: 複製連結
本书分为5个部分,围绕新基建的云计算、机器学习及人工智能展开讲述大数据处理分析与实战应用。第1部分介绍了大数据的概念与特点,以及几个典型的产业应用场景。第2部分介绍了目前云计算中的一个重要研究与应用领域——容器云,包含容器技术Docker与容器编排工具Kubernetes。第3部分是大数据分析的基础,介绍了Hadoop的框架原理、调度原理、MapReduce原理与编程模型、环境搭建。第4部分介绍了相关算法的原理,然后介绍相对容易使用的机器学习工具Sklearn,使得读者建立起对机器学习开发流程的基本认知,之后介绍应用于大数据环境下Spark的机器学习库。第5部分通过第一个实例介绍了如何使用Spark机器学习库中的协同过滤算法,来实现基于Web的推荐系统;通过第二个实例介绍了如何使用OpenCV与TensorFlow构建卷积神经网络来实现基于Web的人脸识别。
來源: Google Book
來源: Google Book
評分