在开始学习前给大家说下什么是Flink?
1.Flink是一个针对流数据和批数据的分布式处理引擎,主要用Java代码实现。
2.Apache Flink作为Apache的顶级项目,Flink集众多优点于一身,包括快速、可靠可扩展、完全兼容Hadoop、使用简便、表现卓越。
通过以上的描述大家对Flink有了一个基本的认识,本套课程不会讲解基础内容,因此建议有Flink基础的同学进行认购。
开始学习前建议大家认真阅读下文:
随着人工智能时代的降临,数据量的爆发,在典型的大数据的业务场景下数据业务最通用的做法是:选用批处理的技术处理全量数据,采用流式计算处理实时增量数据。在绝大多数的业务场景之下,用户的业务逻辑在批处理和流处理之中往往是相同的。但是,用户用于批处理和流处理的两套计算引擎是不同的。
因此,用户通常需要写两套代码。毫无疑问,这带来了一些额外的负担和成本。阿里巴巴的商品数据处理就经常需要面对增量和全量两套不同的业务流程问题,所以阿里就在想,我们能不能有一套统一的大数据引擎技术,用户只需要根据自己的业务逻辑开发一套代码。这样在各种不同的场景下,不管是全量数据还是增量数据,亦或者实时处理,一套方案即可全部支持,这就是阿里选择Flink的背景和初衷。
随着互联网不断发展,数据量不断的增加,大数据也是快速的发展起来了。对于电商系统,拥有着庞大的数据量,对于这么庞大的数据,传统的分析已经满足不了需求。对于电商来说,大数据数据分析是很重要的,它承载着公司的战略部署,以及运营、用户体验等多方面的作用。因此企业对大数据人才的需求会持续旺盛,优秀的大数据人才年收入在50-100万。
目前经过10多年的发展大数据技术也在不断的更新和进步中,大数据计算引擎经历了几个过程,从一代的Hadoop Mapreduce、二代的基于有向无环图的TeZ,OOZIE等,到三代的基于内存计算的Spark,再到最新的第四代Flink。 早期的Hadoop开发通过搭建环境收入都可以轻松破万,到如今Flink的崛起,相信更多的先机者会看到Flink的机遇。对于Flink巨头们早已经应用的非常成熟,比如阿里、Uber、美团等互联网巨头,因此Flink使用会越来越多,这是趋势,现在很多公司都在往Flink转换,足以可见Flink技术的先进和强大。
本课程将基于真实的电商分析系统构建,通过Flink实现真正的实时分析,该系统会从无到有一步一步带大家实现,让大家在实操中快速掌握Flink技术。
课程所涵盖的知识点包括:Flink、Kafka、Flume、Sqoop、SpringMVC、Redis、HDFS、Mapreduce、Hbase、Hive、SpringBoot、SpringCloud等等
分析指标包含:频道分析、产品分析、用户分析、活动效果分析、营销分析、购物车分析、订单分析等
课程所用到的
开发环境为:Window7
开发工具为:IDEA
开发版本为:Flink1.6.1、Hadoop2.6.0、Hbase1.0.0、Hive1.1.0
学完该课程大家会对Flink有非常深入的了解,同时可以体会到Flink的强大之处,以及可以结合自己公司的业务进行使用,减少自己研究和学习Flink的时间。