大数据的数据分析工具你怎么选择?

    作者:课课家教育更新于: 2019-08-08 15:35:40

    数据分析工具用SPSS和Python哪个好?,在实用中,数据分析可帮助人们作出判断,以便采取适当行动。 数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学与计算机科学相结合的产物。

    SPSS和Python,单纯地说哪个好,是没有意义的,还要看你用来干什么?

    大数据的数据分析工具你怎么选择_大数据_数据分析_数据管理_课课家

    我来帮你区分一下这些术语。

    1、分析工具:Excel、SPSS、Tableau属于分析工具类;

    2、分析语言:Python、R属于分析脚本语言。

    分析工具类,如果细分还可以分为统计工具和挖掘工具。

    • 1)统计工具:比如像Excel/Tableau/PowerBI都属于统计工具,此类工具的很简单,是基于统计(比如分类汇总)的分析工具,通过统计指标,查看业务的规律、变化、趋势等等,来作出对业务的判断并给出合适的业务策略。所以,此类工具侧重于业务的描述性分析(业务规律、业务变化、业务周期),常用有的分析方法有:对比分析、分布分析、结构分析、趋势分析等等。
    • 2)挖掘工具:像SPSS/SAS类就属于挖掘工具。此类挖掘工具侧重探索隐藏得比较深的业务知识和模式,挖掘工具侧重于业务的影响因素分析、预测性分析等等,讲究分析模型(比常规的分析方法要复杂),在分析模型中不见得有统计指标,而是模式。常用的分析模型:影响因素分析(相关/方差/列联分析)、数据预测模型(回归预测/时序预测)、分类预测模型(决策树、神经网络、支持向量机等),当然还其它更多的模型,比如聚类、关联等等。

    理论上,使用高级的数据挖掘工具也是可以进行常规的数据统计分析的,即Excel能够实现的,理论上SPSS也可以实现。但坦白地说,用挖掘工具来做统计工具分析,其效率反而没有统计工具高。

    不过,当前绝大多数公司,都是在用Excel/SQL来做数据分析,可见他们并没有什么复杂的业务问题需要用到更高级的分析工具,简单的工具已经足以胜任平时的业务数据分析了。

    最后再来说分析语言Python/R。

    3)分析语言。

    当然你也可以认为分析语言本身也是一种分析工具。只是这种分析工具与Excel/SPSS相比不一样,Excel/SPSS只需要通过拖拉就能够实现数据分析结果,但Python/R则需要通过写脚本写代码的方式来运行分析。

    作为工具,Excel/SPSS中已经内置和封装了很多常用的分析方法、分析模型,所以你不需要花太多的时间去弄明白是怎样实现的,甚至你有时不需要知道数据公式和原理(如果知道的话就更好了),你只需要聚焦在业务层面,就可以实现业务数据分析,得到良好的分析结果。

    但是,如果你们公司需要一些特殊的分析模型,或者需要对原有的模型进行修改或优化,而分析工具又不支持的话,那么此时你就得要使用分析语言Python来实现自定义的分析流程了。而且,当你使用Python分析语言时,你就得必须了解分析模型的原理及实现,还得懂编程的一系列技能,那么你得花大量的时间在如何实现模型上,无法聚焦在业务问题的解决上了。所以,比起用分析工具,用Python的好处是可以任意修改或定制化模型、可以自动化实现分析流程,但坏处也是显而易见的(分析复杂、周期较长、效果不一定好)。你拥有了定制化,就失去了简洁;你拥有强的功能,就增加了复杂度,此即有得就必有失了。

    所以,一般人我是不建议他们学习Python的。因为学习难度高,学习周期长,还不一定有Excel/SPSS好用和效果好。除非你本身就具有编程能力,此时转学Python就相对容易了。

     数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。

课课家教育

未登录