MatrixCQY
首页
数学笔记
代码笔记
金融笔记
GitHub
首页
数学笔记
代码笔记
金融笔记
GitHub
  • 代码笔记

    • 代码笔记
    • C++ 教程

      • C++ 基础教程
      • C++ 面向对象编程 (OOP)
      • C++ 标准模板库 (STL)
      • C++ 内存管理
      • C++ 文件操作
      • C++ Lambda 表达式
      • C++ 高级特性
    • 数据结构与算法

      • 数据结构与算法简介
      • 线性表 (Linear List)
      • 栈与队列 (Stack & Queue)
      • 哈希 (Hashing)
      • 树与图 (Tree & Graph)
      • 排序算法 (Sorting Algorithms)
      • 查找算法 (Searching Algorithms)
      • 动态规划 (Dynamic Programming)
      • 贪心算法 (Greedy Algorithms)
    • SQL 教程

      • SQL 基础教程
      • SQL 查询 (Queries)
      • SQL 连接 (Joins)
      • SQL 约束 (Constraints)
      • SQL 规范化 (Normalization)
      • 视图与存储过程
      • SQL 高级教程
    • R 语言教程

      • R 语言简介
      • R 数据结构
      • R 流程控制与函数
      • R 数据导入与导出
      • R 统计分析基础
      • R 绘图 (Plotting)
    • Pandas 教程

      • Pandas 简介
      • Series 与 DataFrame
      • Pandas 数据分析
      • Pandas 时间序列分析
      • Pandas 数据透视与可视化

Pandas 数据分析

1. 数据清洗

  • 处理缺失值:
    • dropna(): 删除缺失值
    • fillna(value): 填充缺失值
  • 处理重复值: drop_duplicates()

2. 数据选择与过滤

  • loc[]: 基于标签索引
  • iloc[]: 基于位置索引
df.loc[df['Age'] > 30]

3. 数据合并

  • concat(): 堆叠
  • merge(): 类似 SQL 的 JOIN
pd.merge(left, right, on='key')

4. 分组与聚合

df.groupby('City')['Age'].mean()

5. 文件读写

  • read_csv(), to_csv()
  • read_excel(), to_excel()

推荐资源

  • Kaggle: Pandas Course
最近更新: 2026/2/15 04:15
Contributors: MatrixCQY
Prev
Series 与 DataFrame
Next
Pandas 时间序列分析