python应用:python3-cookbook笔记,文件与IO

    作者:谷雨yun更新于: 2020-04-25 20:56:40

    大神带你学编程,欢迎选课

      Python是一种解释型脚本语言,可以应用于以下领域:

      web和Internet开发

      科学计算和统计

      人工智能

      教育

      桌面界面开发

      软件开发

      后端开发

      网络爬虫

    python3-cookbook中每个小节以问题、解决方案和讨论三个部分探讨了Python3在某类问题中的最优解决方式,或者说是探讨Python3本身的数据结构、函数、类等特性在某类问题上如何更好地使用。这本书对于加深Python3的理解和提升Python编程能力的都有显著帮助,特别是对怎么提高Python程序的性能会有很好的帮助,如果有时间的话强烈建议看一下。
    本文为学习笔记,文中的内容只是根据自己的工作需要和平时使用写了书中的部分内容,并且文中的示例代码大多直接贴的原文代码,当然,代码都在Python3.6的环境上都验证过了的。不同领域的编程关注点也会有所不同,有兴趣的可以去看全文。
    python3-cookbook:https://python3-cookbook.readthedocs.io/zh_CN/latest/index.html

     

    5.1 读写文本数据

    使用open打开文本文件时,Python会默认将换行符转换为\\n,如果不想Python进行默认的转换,可以使用参数newline=''以保留原来的换行符。

    当使用默认的编码不能正确读取数据时,open还有一个encoding参数用来指定以哪种编码打开文件。

    复制代码
    >>> f = open('hello.txt', 'rt')
    >>> f.read()
    'hello world!\\n'
    >>> g = open('hello.txt', 'rt', newline='')
    >>> g.read()
    'hello world!\\r\\n'
    >>>
    复制代码

     

    5.4 读写字节数据

    使用open函数的rb或wb进行二进制的数据读写的时候,比如图片或音频数据,需要注意以下几点:

    读取二进制数据时,返回的数据都是字节字符串格式的,而不是文本字符串格式。
    写入二进制数据的时候,也需要保证是以字节形式的对象进行写入。
    在二进制格式的文件中读取或写入文本数据时,需要进行相应的解码和编码操作。
    对于字节字符串,通过下标索引或迭代的时候,返回的是对应的字节值,即一个数字,而不是字节字符串。
    复制代码
    with open('somefile.bin', 'rb') as f:
    # 读取出来的是字节字符串
    data = f.read()
    # 解码为文本字符串
    text = data.decode('utf-8')


    with open('somefile.bin', 'wb') as f:
    # 以字节对象的形式写入
    f.write(b'Hello World')
    # 编码后写入文件
    text = 'Hello World'
    f.write(text.encode('utf-8'))
    复制代码
    复制代码
    >>> t = 'hello world'
    >>> t[0]
    'h'
    >>> for c in t:
    print(c)


    h
    e
    l
    l
    o

    w
    o
    r
    l
    d
    >>> b = b'hello world'
    >>> b[0]
    104
    >>> for c in b:
    print(c)


    104
    101
    108
    108
    111
    32
    119
    111
    114
    108
    100
    >>>
    复制代码

     

    5.7 读写压缩文件

    读写压缩文件还是比较常用的,Python对于gzip和bz2格式的压缩文件操作还是有很好的支持的,即gzip模块和bz2模块,这两个模块有和内置open函数一样的函数,包括参数的使用也是一样的,但是需要注意的是这两个模块默认是以二进制来打开的,所以你想要读写文本数据时就需要指定对应的rt和wt模式了。

    在写入压缩数据时,这两个模块还有一个压缩比参数compresslevel,默认为最高级别9,等级越低性能越好,但是数据压缩程度也越低。

    复制代码
    import gzip

    # gzip和bz2的open函数使用方法一样,就只贴gzip的实例代码了

    # 默认一个二进制模式打开,文本文件需要指定rt模式
    with gzip.open('somefile.gz', 'rt') as f:
    text = f.read()

    with gzip.open('somefile.gz', 'wt') as f:
    f.write(text)

    Python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。

课课家教育

未登录