招财猫咪资源论坛

 找回密码
 立即注册
搜索
热搜: 同性 女人
查看: 189|回复: 4

[学习教育] 《Spark高级数据分析(第2版)》[美] 桑迪 · 里扎

[复制链接]

5万

主题

7万

帖子

26万

积分

管理员

Rank: 32Rank: 32Rank: 32Rank: 32Rank: 32Rank: 32Rank: 32Rank: 32

积分
267809

超级VIP活跃会员热心会员推广达人宣传达人突出贡献荣誉管理

发表于 2020-12-19 07:01:18 | 显示全部楼层 |阅读模式
内容简介 · · · · · ·
作为计算框架,Spark速度快,开发简单,能同时兼顾批处理和实时数据分析,因此很快被广大企业级用户所采纳,并随着近年人工智能的崛起而成为分析和挖掘大数据的重要得力工具。

本书由业内知名数据科学家执笔,通过丰富的示例展示了如何结合Spark、统计方法和真实世界数据集来解决数据分析问题,既涉及模型的构建和评价,也涵盖数据清洗、数据预处理和数据探索,并描述了如何将结果变为生产应用,是运用Apache Spark进行大数据分析和处理的实战宝典。

第2版根据新版Spark最佳实践,对样例代码和所用资料做了大量更新。

本书涵盖模式如下:

● 音乐推荐和Audioscrobbler数据集

● 用决策树算法预测森林植被

● 基于K均值聚类进行网络流量异常检测

● 基于潜在语义算法分析维基百科

● 用GraphX分析伴生网络

● 对纽约出租车轨迹进行空间和时间数据分析

● 通过蒙特卡罗模拟来评估金融风险

● 基因数据分析和BDG项目

● 用PySpark和Thunder分析神经图像数据

BpHMaF.jpg

https://306t.com/file/14900045-476640256





上一篇:《Ceph分布式存储学习指南》[芬兰]卡伦·辛格
下一篇:《性别之伤与存在之痛: 从黑格尔到精神分析》张念
回复

使用道具 举报

5万

主题

7万

帖子

26万

积分

管理员

Rank: 32Rank: 32Rank: 32Rank: 32Rank: 32Rank: 32Rank: 32Rank: 32

积分
267809

超级VIP活跃会员热心会员推广达人宣传达人突出贡献荣誉管理

 楼主| 发表于 2020-12-19 07:01:57 | 显示全部楼层
Spark高级数据分析.epub (1.5 MB, 下载次数: 37)
回复

使用道具 举报

177

主题

80万

帖子

239万

积分

超级VIP

Rank: 8Rank: 8

积分
2398519

灌水之王突出贡献

发表于 2021-8-4 20:32:59 | 显示全部楼层
thanks for sharing
回复

使用道具 举报

11

主题

8439

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
10685
发表于 2024-4-8 13:47:22 | 显示全部楼层
谢谢分享
回复

使用道具 举报

0

主题

1805

帖子

8544

积分

论坛元老

Rank: 8Rank: 8

积分
8544
发表于 2024-12-26 20:20:22 | 显示全部楼层
技术类的,多多学习下。
chate.store
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies

本版积分规则

Archiver|手机版|小黑屋|招财猫咪网资源论坛

GMT+8, 2025-1-15 23:22 , Processed in 0.116703 second(s), 31 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表