数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效地发挥数据的作用。实现数据有效管理的关键是数据组织。
Stata以其简单易懂和功能强大受到初学者和高级用户的普遍欢迎。使用时可以每次只输入一个命令,也可以通过一个Stata程序一次输入多个命令。这样的话即使发生错误,也较容易找出并加以修改。
STATA
软件优点:Stata以其简单易懂和功能强大受到初学者和高级用户的普遍欢迎。使用时可以每次只输入一个命令,也可以通过一个Stata程序一次输入多个命令。这样的话即使发生错误,也较容易找出并加以修改。尽管Stata的数据管理能力没有SAS那么强大,它仍然有很多功能较强且简单的数据管理命令,能够让复杂的操作变得容易。Stata主要用于每次对一个数据文件进行操作,难以同时处理多个文件。Stata也能够进行大多数统计分析(回归分析,logistic回归,生存分析,方差分析,因子分析,以及一些多变量分析)。Stata最大的优势可能在于回归分析(它包含易于使用的回归分析特征工具),logistic回归(附加有解释logistic回归结果的程序,易用于有序和多元logistic回归)。
推荐书目:《计量经济学及Stata应用》、《高级计量经济学及Stata应用》,作者:陈强
推荐理由:陈强老师的计量经济学教材,在设计上单独章节工具变量、二值选择模型等,解决其他教材没有详细讲解这部分的疑问。而且陈老师教材行文,以生活实际来讲计量,容易理解。《高级计量经济学及Stata应用》还加入多值选择模型、非参数估计、贝叶斯估计等内容。Stata较好地实现了使用简便和功能强大两者的结合。
Eviews
软件优点:EViews是在Windows操作系统中计量经济学软件里世界性领导软件。强而有力和灵活性加上一个便于使用者操作的界面;最新的建模工具,快速直觉且容易使用的软件。由于它革新的图表使用者界面和精密的分析引擎工具,EViews 是强大,灵活性和便于使用的功能。EViews 预测分析计量软件在科学数据分析与评价、金融分析、经济预测、销售预测和成本分析等领域应用非常广泛。这也是撰写计量模型论文最方便的软件之一。
推荐书目:《计量经济分析方法与建模--Eviews应用及实例(第二版) 》,作者:高铁梅
推荐理由:计量经济学研究的核心是设计模型、收集资料、估计模型、检验模型、应用模型(结构分析、经济预测、政策评价)。该书在数学描述方面适当淡化,以讲清楚方法、思路为目标,不做大量的推导和证明,重点放在如何运用各种计量经济方法对实际的经济问题进行分析、建模、预测、模拟等实际操作上。该书很多内容都讲解、总结的透彻明白,例如流量、存量一般是否平稳等问题。
SPSS
软件优点:SPSS非常容易使用,故最为初学者所接受。它有一个可以点击的交互界面,能够使用下拉菜单来选择所需要执行的命令。它也有一个通过拷贝和粘贴的方法来学习其“句法”语言,但是这些句法通常非常复杂而且不是很直观。SPSS有一个类似于Excel的界面友好的数据编辑器,可以用来输入和定义数据(缺失值,数值标签等等)。SPSS也主要用于对一个文件进行操作,难以胜任同时处理多个文件。它的数据文件有4096个变量,记录的数量则是由你的磁盘空间来限定。SPSS也能够进行大多数统计分析(回归分析,logistic回归,生存分析,方差分析,因子分析,多变量分析)。它的优势在于方差分析(SPSS能完成多种特殊效应的检验)和多变量分析(多元方差分析,因子分析,判别分析等)
推荐书目:《SPSS统计分析基础教程》 作者:张文彤
推荐理由:以真实案例贯穿全书,从统计分析实战的角度出发详细介绍SPSS的界面操作、数据管理、统计图表制作、统计描述和常用单因素统计分析方法的原理与实际操作,并结合SPSS的强大功能进行很好地扩展。书中还提供医疗、经济、市场研究等各行业的综合案例,完全从实际案例出发讲解各类方法的综合运用,以更好地协助读者提高实战能力。
SAS
软件优点:SAS由于其功能强大而且可以编程,很受高级用户的欢迎。也正是基于此,它是最难掌握的软件之一。使用SAS时,你需要编写SAS程序来处理数据,进行分析。如果在一个程序中出现一个错误,找到并改正这个错误将是困难的。在数据管理方面,SAS是非常强大的,能让你用任何可能的方式来处理你的数据。它包含SQL(结构化查询语言)过程,可以在SAS数据集中使用SQL查询。但是要学习并掌握SAS软件的数据管理需要很长的时间,在Stata或SPSS中,完成许多复杂数据管理工作所使用的命令要简单的多。SAS能够进行大多数统计分析(回归分析,logistic回归,生存分析,方差分析,因子分析,多变量分析)。SAS的最优之处可能在于它的方差分析,混合模型分析和多变量分析,而它的劣势主要是有序和多元logistic回归(因为这些命令很难),以及稳健方法(它难以完成稳健回归和其他稳健方法)。
推荐书目:《SAS应用统计分析》 作者:科迪,史密斯
推荐理由:SAS是一个数据管理和统计分析的工具,尤其在医疗设备公司和制药行业极负胜名。一般的SAS手册主要为有一定统计基础的使用者提供各种程序的使用指导,一般的统计教材则通常传授最基础的理论知识和统计方法。很少有教材可以两者兼顾,所以可以预想,发展趋势就是通过统计软件(尤其是SAS)的使用来介绍基本统计和高级统计方法。这本书就做到了,它既提出了许多应用问题,又演示了SAS的分析执行。
R语言
软件优点:R语言与前几种软件相比,已经彻彻底底上升为一款相当热门的编程软件了,当然涉及到计算机编程可能会令不少小伙伴们头大。这款软件强大,免费,包罗万象,开源。是专门为统计和数据分析开发的语言,统计前沿的主流语言。扩展性好,丰富的资源涵盖了多种行业数据分析中几乎所有的方法。R与SAS相比速度快,有大量统计分析模块,但可扩展性稍差,昂贵。与SPSS相比,具有复杂的用户图形界面,简单易学,但编程十分困难。
推荐书目:《R语言实战 第二版》 作者:卡巴科弗(Robert I. Kabacoff)
推荐理由:开源软件R是世界上最流行的数据分析、统计计算及制图语言,几乎能够完成任何数据处理任务,可安装并运行于所有主流平台,为我们提供了成千上万的专业模块和实用工具,是从大数据中获取有用信息的绝佳工具。本书可以说是学习R的必备教程之一,可以让人快速进入R的世界本书从解决实际问题入手,跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。这本书侧重R语言实战,以实际项目讲解R的若干常见应用场景。适合新手上路,回归、方差两章展示了完整的统计分析的过程。
Matlab
软件优点:MATLAB 的应用范围非常广,包括信号和图像处理、通讯、控制系统设计、测试和测量、财务建模和分析以及计算生物学等众多应用领域。附加的工具箱(单独提供的专用 MATLAB 函数集)扩展了 MATLAB 环境,以解决这些应用领域内特定类型的问题。数学函数可用于线性代数、统计、傅立叶分析、筛选、优化以及数值积分等
推荐书目:《Matlab R2016a从入门到精通》 作者:温欣研
推荐理由:针对MATLAB R2016a(V9.0)*版本进行编写的。书中讲述的内容是使用MATLAB进行科学研究、系统仿真、数据分析与处理的必备知识。通过全面学习本书,读者可以获得使用MATLAB进行数学计算、数据分析及处理的相关技能,并能快速掌握使用MATLAB进行工作的基本方法。基础知识部分包括MATLAB概述、数据输入输出基础、编程基础和可视化基础;数学基础部分包括数组与矩阵操作、数学函数运算和符号数学计算;数据分析部分包括多项式分析、数值运算、优化和概率统计;拓展知识部分包括句柄图形、GUI编程、Simulink基础、编译器和应用程序接口;MATLAB应用部分包括信号处理应用、图像处理应用、小波分析应用和偏微分方程应用等内容。本书作为一本实用性超强的工具书,是学习复习,参加建模比赛的必备书籍。
软件优点:python非常简单,非常适合人类阅读。阅读一个良好的Python程序就感觉像是在读英语一样,尽管这个英语的要求非常严格。Python的这种伪代码本质是它最大的优点之一,使你能够专注于解决问题而不是去搞明白语言本身。Python是FLOSS(自由/开放源码软件)之一,可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。Python相比于Matlab的最大优势是:Python是一门通用编程语言,实现科学计算功能的numpy、scipy、matplotlib只是Python的库和Package而已,而这些科学计算数据处理的库,在处理大数据方面有奇效。
推荐书目:《利用Python进行数据分析》 作者:Wes McKinney
推荐理由:这本书是Pandas的模块作者写的书,被誉为Pandas的最佳工具书。Pandas是python的一个数据分析包,最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。使用Pandas可以把Python基本当作R用,用NumPy和SymPy还有SciPy把Python当作Matlab用。作者对于利用Python进行数据分析有着很丰富的经验,因此写出的书也是深入浅出,让人很容易就能看懂。本书讲的是利用Python进行数据控制、处理、整理、分析等方面的具体细节和基本要点。同时,它也是利用Python进行科学计算的实用指南(专门针对数据密集型应用)。本书重点介绍了用于高效解决各种数据分析问题的Python语言和库。“Life is short, you need Python!”
数据可以长期保存。有了大容量的磁盘作为存储设备,计算机开始被用来处理大量的数据并存储数据。
上一篇:教你怎么辨别大数据分析和人工智能
下一篇:大数据如何拯救企业数据目录?
¥280.00
¥699.00
¥680.00