首页
/ pandas 技术文档

pandas 技术文档

2024-12-20 14:27:10作者:侯霆垣

1. 安装指南

1.1 使用 Conda 安装

conda install -c conda-forge pandas

1.2 使用 PyPI 安装

pip install pandas

1.3 从源码安装

1.3.1 安装依赖

在安装 pandas 之前,需要确保安装了以下依赖:

  • NumPy
  • python-dateutil
  • pytz

1.3.2 安装 Cython

pip install cython

1.3.3 安装 pandas

pandas 目录下执行以下命令:

pip install .

或者以开发模式安装:

python -m pip install -ve . --no-build-isolation -Ceditable-verbose=true

2. 项目使用说明

2.1 主要功能

pandas 是一个强大的 Python 数据分析工具包,提供了以下主要功能:

  • 处理缺失数据:支持浮点数和非浮点数中的缺失数据(NaN, NA, NaT)。
  • 大小可变性:可以在 DataFrame 中插入和删除列。
  • 自动和显式数据对齐:支持显式对齐标签,或自动对齐数据。
  • 强大的分组功能:支持数据集的拆分-应用-合并操作。
  • 轻松转换:可以将不同索引的数据转换为 DataFrame 对象。
  • 智能切片、索引和子集操作:支持基于标签的切片、索引和子集操作。
  • 合并和连接数据集:支持灵活的合并和连接操作。
  • 重塑和透视数据集:支持数据集的重塑和透视操作。
  • 分层标签:支持多级标签。
  • 强大的 IO 工具:支持从 CSV、Excel、数据库等加载数据,并支持 HDF5 格式的保存和加载。
  • 时间序列功能:支持日期范围生成、频率转换、移动窗口统计、日期偏移和滞后。

2.2 示例代码

以下是一个简单的 pandas 使用示例:

import pandas as pd

# 创建一个 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)

# 显示 DataFrame
print(df)

3. 项目 API 使用文档

3.1 DataFrame

DataFrame 是 pandas 中最常用的数据结构,类似于二维表格。

3.1.1 创建 DataFrame

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)

3.1.2 访问数据

# 访问列
print(df['name'])

# 访问行
print(df.loc[0])

3.2 Series

Series 是 pandas 中的一维数组,类似于带标签的数组。

3.2.1 创建 Series

import pandas as pd

s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])

3.2.2 访问数据

# 访问元素
print(s['a'])

3.3 常用函数

3.3.1 groupby

# 按年龄分组并计算平均值
grouped = df.groupby('age').mean()

3.3.2 merge

# 合并两个 DataFrame
df1 = pd.DataFrame({'key': ['K0', 'K1', 'K2'], 'A': ['A0', 'A1', 'A2']})
df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2'], 'B': ['B0', 'B1', 'B2']})
result = pd.merge(df1, df2, on='key')

4. 项目安装方式

4.1 使用 Conda 安装

conda install -c conda-forge pandas

4.2 使用 PyPI 安装

pip install pandas

4.3 从源码安装

pip install .

或者以开发模式安装:

python -m pip install -ve . --no-build-isolation -Ceditable-verbose=true

通过以上步骤,您可以成功安装并使用 pandas 进行数据分析。

登录后查看全文
热门项目推荐
相关项目推荐