Python数据分析流程及学习路径

北京哪家青春痘医院好 http://pf.39.net/bdfyy/bdflx/210312/8740647.html

1.1.学习的内容

我的目标是介绍Python编程和用于数据处理的库和工具环境,掌握这些,可以让你成为一个数据分析专家。虽然本书的标题是“数据分析”,重点却是Python编程、库,以及用于数据分析的工具。这就是数据分析要用到的Python编程。

主要指的是结构化数据(structureddata),这个故意含糊其辞的术语代指了所有通用格式的数据,例如:

表格型数据,其中各列可能是不同的类型(字符串、数值、日期等)。比如保存在关系型数据库中或以制表符/逗号为分隔符的文本文件中的那些数据。

多维数组(矩阵)。

通过关键列(对于SQL用户而言,就是主键和外键)相互联系的多个表。

间隔平均或不平均的时间序列。

这绝不是一个完整的列表。大部分数据集都能被转化为更加适合分析和建模的结构化形式,虽然有时这并不是很明显。如果不行的话,也可以将数据集的特征提取为某种结构化形式。例如,一组新闻文章可以被处理为一张词频表,而这张词频表就可以用于情感分析。

1.2为什么要使用Python进行数据分析

许许多多的人(包括我自己)都很容易爱上Python这门语言。自从年诞生以来,Python现在已经成为最受欢迎的动态编程语言之一,其他还有Perl、Ruby等。由于拥有大量的Web框架(比如Rails(Ruby)和Django(Python)),自从年,使用Python和Ruby进行网站建设工作非常流行。这些语言常被称作脚本(scripting)语言,因为它们可以用于编写简短而粗糙的小程序(也就是脚本)。我个人并不喜欢“脚本语言”这个术语,因为它好像在说这些语言无法用于构建严谨的软件。在众多解释型语言中,由于各种历史和文化的原因,Python发展出了一个巨大而活跃的科学计算(scientific


转载请注明:http://www.aierlanlan.com/rzfs/645.html

  • 上一篇文章:
  •   
  • 下一篇文章: