再见Excel,你好Pandas!

    作者:匿名更新于: 2025-01-04 23:43:34

      写⼊数据时,要注意不同的⽂件格式选⽤不同的⽅法,如写⼊csv⽂件使⽤to_csv,写⼊ excel时使⽤to_excel,并且要注意添加编码⽅式。

      数据的写⼊:

      写⼊数据时,要注意不同的⽂件格式选⽤不同的⽅法,如写⼊csv⽂件使⽤to_csv,写⼊ excel时使⽤to_excel,并且要注意添加编码⽅式,下面创建⼀个表:

      复制

      1.  from pandas import Series,DataFrame

      2.  # 使用字典创建

          3.

      4.  index_list['001','002','003','004','005','006','007','008','009','010']

      5.  name_list = ['李白','王昭君','诸葛亮','狄仁杰','孙尚香','妲己','周瑜','张飞','王昭君','大

      6.  乔']

          7.

      8.  age_list=[25,28,27,25,30,29,25,32,28,26]

      9.  salary_list=['10k','12.5k','20k','14k','12k','17k','18k','21k','22k','21.5k']

      10.  marital_list = ['NO','NO','YES','YES','NO','NO','NO','YES','NO','YES']

      11.  dic={

          12.

      13.  '姓名': Series(data=name_list,index=index_list),

      14.  '年龄': Series(data=age_list,index=index_list),

      15.  '薪资': Series(data=salary_list,index=index_list),

      16.  '婚姻状况': Series(data=marital_list,index=index_list)

      17.  }

          18.

      19.  df=DataFrame(dic)

      20.  # 写入csv,path_or_buf为写入文本文件

      21.  df.to_csv(path_or_buf='./People_Information.csv',

      22.  encoding='utf_8_sig',index=False)

      23.  print('end')

      这⾥调⽤to_csv⽅法 写⼊数据,可以指定路径,参数encoding是指定编码⽅式,这样遇到中⽂不易出现乱码,参数index=False是为了去除掉⾏索引,不然⾏索引1,2,3,4等也会放到表⾥。

      数据的读取:

      读取数据时,不同的⽂件格式使⽤的⽅法也不⼀样, 读取csv使⽤read_csv,excel使⽤ read_excel,并且可以指定⽂件进⾏读,另外⼀个Excel⽂件可以创建多个表,然后在不同的表中存储不同数据,这种形式的⽂件很常⻅。但是要注意csv⽂件不存在多个sheet的问题。

      复制

      1.  如: import pandas as pd

      2.  #sheet_name指定读取⼯作铺中的那个sheet(sheet名称)

      3.  sheet1 = pd.read_excel('./data/sheet.xlsx',sheet_name='sheet1')

      4.  print(sheet1.head())

      5.  sheet2 = pd.read_excel('./data/sheet.xlsx',sheet_name='sheet2')

      6.  print(sheet2.head())

      7.  当csv或者excel中数据的第⼀⾏是⼀条脏数据,可以利⽤read_excel()中的header参数进

      8.  ⾏选择哪⼀⾏作为我们的列索引。如:

      9.  import pandas as pd

      10.  #这里将header设置为1(第一行是0),代表数据将从第2行开始读取,第一行的数据会被

      11.  忽略

      12.  people = pd.read_csv('./data/People1.csv',header = 1)

      13.  print(people.head())

      如果都不满⾜的你的要求,可以将header设置为None,列索引值会使⽤默认的1、2、 3、4,之后在⾃⾏设置。

      当指定了header的值,读出来的数据就是从该⾏开始向下切⽚,该⾏以上的数据会被忽略。

      >>>>>>点击进入Office办公软件专题

Excel 更多推荐

课课家教育

未登录

1