資料來源: Google Book

Hadoop+Spark+Python大数据处理从算法到实战[電子資源]

本书分为5个部分,围绕新基建的云计算、机器学习及人工智能展开讲述大数据处理分析与实战应用。第1部分介绍了大数据的概念与特点,以及几个典型的产业应用场景。第2部分介绍了目前云计算中的一个重要研究与应用领域——容器云,包含容器技术Docker与容器编排工具Kubernetes。第3部分是大数据分析的基础,介绍了Hadoop的框架原理、调度原理、MapReduce原理与编程模型、环境搭建。第4部分介绍了相关算法的原理,然后介绍相对容易使用的机器学习工具Sklearn,使得读者建立起对机器学习开发流程的基本认知,之后介绍应用于大数据环境下Spark的机器学习库。第5部分通过第一个实例介绍了如何使用Spark机器学习库中的协同过滤算法,来实现基于Web的推荐系统;通过第二个实例介绍了如何使用OpenCV与TensorFlow构建卷积神经网络来实现基于Web的人脸识别。
來源: Google Book
評分