【python-数据分析-numpy】文件操作&读取csv文件&NAN NF

时间: 2023-07-29 admin 互联网

【python-数据分析-numpy】文件操作&读取csv文件&NAN NF

【python-数据分析-numpy】文件操作&读取csv文件&NAN NF

【python-数据分析-numpy】文件操作&读取csv文件&NAN NF

  • 文件操作
    • 存储
    • 读取
    • numpy独有的存储方式:save & load 可以读取多维数组,但是要求表格内的格式较为统一
  • 读取csv文件
    • csv文件
    • 读取csv文件reader()
    • 转成字典,以key的方式索引:DictReader()
    • 写入
      • writerow()
      • 问题:乱码&每行中间有空行
      • 解决方式
      • 以字典方式写入:DictWriter
  • NAN NF(为str类型)
    • 简介
    • NAN注意事项
    • 处理NAN
      • 删除缺失值
      • 布尔索引
      • 用其他值进行替换
    • 例题

文件操作

savetxt(文件名,数组,数据格式,分隔符)

存储


读取


numpy独有的存储方式:save & load 可以读取多维数组,但是要求表格内的格式较为统一


读取csv文件

csv文件

读取csv文件reader()


略过标题数据:

转成字典,以key的方式索引:DictReader()

之前通过行标列标,假如移动行列就索引不到了,用字典就不用担心这种问题。

写入

writerow()

问题:乱码&每行中间有空行

解决方式

newline=‘’

以字典方式写入:DictWriter

记得表头自己导入

NAN NF(为str类型)

简介

NAN注意事项

1.NAN与任何NAN不相等
2.NAN与任何值做运算,结果仍为NAN

处理NAN

删除缺失值

布尔索引


用其他值进行替换

根据不同情形进行相应替换


有缺失值怎么办
1.使用字符串类型进行解析dtype=np.str
把不能转换成数字的数据转换成NAN,转换完之后再转换成浮点类型

例题

注:除了delete函数,axis=1都代表为行,=0代表为列;delete函数正好相反。
总分可以将某个人的某科目分设置为0.
平均值的时候要将缺失值设置为平均值