数据表示、数据清理、数据统计、数据可视化等算法库是科学计算、数据分析以及人工智能的基础。

python拥有非常丰富数据科学相关的库,被广泛用于工程领域、数据分析领域以及人工智能领域。主要库有:

Python科学计算和数据分析库

Matplotlib和Seaborn都是静态绘图库,不支持交互式控件。交互式绘图库推荐PyEcharts和PyQtGraph。

  • PyEcharts是一个功能强大的基于web的可嵌入网页的交互式绘图库。plotly也不错,但是部分功能收费。
  • PyQtGraph是一个基于qt的高性能交互式绘图库,主要用于数学、科学、工程领域。
  • Numpy,Pandas,Matplotlib是Python数据分析使用频率最高的库。
  • Numpy,Scipy可以代替Matlab的常规矩阵运算、科学计算功能(不含Simulink和专用行业部分)
  • Tensorflow、Pytorch等深度学习库和Numpy、Pandas、Matplotlib、Seaborn配合,也能够更加高效的完成工作

Numpy,Scipy,Pandas,Matplotlib,Seaborn,Mayavi2简介

1. Numpy

Numpy(Numeric Python)是 高性能科学计算和数据分析 的基础库。

Numpy的核心由 多维数组对象 和用于 处理数组的函数 组成。Numpy提供了N维数组基础操作,数组的算术和逻辑运算,随机数和随机分布,线性代数,统计,傅里叶变换等内置函数。代码简洁且速度快。

Numpy是几乎所有数据分析高级库(比如scipy,pandas)的构建基础。

2. Scipy

Scipy是基于Numpy的 科学计算 工具库,方便、易于使用、专为科学和工程设计。

Scipy提供了许多用户友好和高效的高阶方法,如插值,积分,统计,优化,图像处理等等。

Scipy包含Matlab的大多计算功能,和数据处理的关系不大,数值计算或者工程研究应用更多一些。

StatsModels是一个统计库,着重于统计模型。包含了许多的统计模型,线性模型、广义线性模型、
方差分析、和线性混合效用模型等,在统计方面有其独特的优势。可以作为Scipy.stats的补充。

3. Pandas

Pandas(Panel Data)是基于NumPy的 数据分析 库。 包含许多数据模型。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集
所需的方法,并且提供了大量能使我们快速便捷地处理数据的内置函数。

Pandas的核心为三种数据结构和操作:

  • Series:带索引的一维数组,与Numpy中的一维array类似。
  • DataFrame:带索引的二维的表格型数据结构。

老版本有Panel(三维的数组,DataFrame的容器)数据结构,新版本已经废除。

4. Matplotlib

Matplotlib 是一个 2D可视化绘图 库。可以使用这个库轻松地完成线形图、直方图、条形图、误差图或散点图等操作,设置标签、图例、调整绘图大小等。

Numpy,Pandas,Matplotlib被称为Python数据分析三大支柱。

5. Seaborn

Seaborn是基于Matplotlib的 2D图形可视化 工具包。
Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,个人认为Seaborn的核心意义在于统计绘图,Seaborn的函数主要分为关系、分布、分类统计等几类,统计绘图更加方便,功能更强,而不是取代matplotlib。

6. Mayavi2

Mayavi2是基于VTK开发的可视化python库(更加高效)。Mayavi2旨在提供方便和互动的三维数据可视化。

Mayavi2无缝集成numpy和3D绘图,可以嵌入到用户编写的Python程序中,并且提供了而向脚本的mlab模块,以方便用户快速绘制三维图,和matplotlib的pylab—样。

持续更新及修订升级中。

未经允许请勿转载。

数据处理是科学计算、数据分析以及人工智能的基础,Python在数据表示、数据清理、数据统计、数据可视化拥有众多易用高效的库,广泛用于工程领域、大数据、机器学习、人工智能等领域。如:NumPy为科学计算和数据分析库基础库;Scipy是像matlab一样的科学计算库;Pandas是一个数据分析库;Matplotlib是一个二维可视化绘图库、Seaborn是一个基于Matplotlib的更加易用的二维可视化绘图库;Mayavi2是一个可交互3D可视化绘图库
数据分析 统计数据: (1) NumPy:NumPy 是 科学 应用程序 的主要软件包之一,用于处理大型多维数组和矩阵,它大量的高级数学函数集合和实现方法使得这些对象执行操作成为可能。 (2)PanDas:Pandas 是一个 Python ,提供高级的数据结构和各种各样的分析工具。这个软件包的主要特点是能够将相当复杂的数据操作转换为一两个命令。Pandas包含许多用于分组、过滤和组合数据的内置方法,...
numpy numpy(numeric python )是 python 的一个开源数值 计算 ,主要用于数组和矩阵 计算 。底层是 C 语言,运行效率远高于纯 python 代码。numpy主要包含2个重要的数据类型: 1)ndarray (N维数组,这个是我们要重点掌握的) 2)matrix (矩阵) scipy scipy 是基于 numpy 的的一个算法 和数学工具包,包含的模块有... NumPy最强大的是n维数组,该 还包含基本的线性代数函数、傅立叶变换、随机函数和其他底层语言(如Fortran、C和C++)集成的工具。 SciPy SciPy建立在NumPy基础上,它是离散傅立叶变换、线性代数、优化和稀疏矩阵等多种高级 科学 和工程模块最有用的 之一。 Matplotlib Matplotlib主要用于绘制各种各样的图形,从直方图到线图、热力图,还可以使用...
文章目录重要的 Python NumPypandasmatplotlibI Python 和JupyterSciPyscikit-learnstatsmodels安装和设置WindowsApple \(OS X, macOS\)GNU/Linux安装或升级 Python 包集成开发环境(IDEs)和文本编辑器 重要的 Python 考虑到那些还不太了解 Python 科学 计算 生态系统和 的读者,下面先对各个 做...