如果你是⼀位在校⼤学⽣,对⼤数据感兴趣,也知道使⽤的企业越来越多,市场需求更是⽇新⽉异,但苦于⾃⼰基础不够,⼼有余⽽⼒不⾜;也看过不少⼤数据⽅⾯的书籍、博客、视频等,但感觉进步不⼤;如果你是⼀位在职⼈员,但⽬前主要使⽤传统技术,虽然对⼤数据很有兴趣,也深知其对未来的影响,但因时间不够,虽有⼀定的基础,常常也是打两天鱼、晒三天⽹,进展不是很理想。
如果你有上述疑惑或遇到相似问题,本书正好⽐较适合你。本书从OpenStack云平台搭建、软件部署、需求开发实现到结果展⽰,以纵向⾓度讲解了⽣产性⼤数据项⽬上线的整个流程;以完成⼀个实际项⽬需求贯穿各章节,讲述了Hadoop⽣态圈中互联⽹爬⾍技术、Sqoop、Hive、HBase组件协同⼯作流程,并展⽰了Spark计算框架、R制图软件和SparkRHive组件的使⽤⽅法。本书的⼀⼤特⾊是提供了实际操作环境,⽤户可以在线登录云平台来动⼿操作书中的数据和代码,登录⽹址请参考http://www.feiguyun.com/support。