【python技巧】文本文件的读写操作
【python技巧】文本文件的读写操作
目录- 【python技巧】文本文件的读写操作
- 0. 背景
- 1. file库的文件操作
- 1.1 打开文件---file.open()
- 1.2 读取文件---file.read()
- 1.3 写入文件---file.write()
- 1.4 查找内容---file.seek()
- 2. re库的文本处理
- 参考资料
0. 背景
最近在写后端接口的时候,需要对.c
、.conf
等类型的文件进行读写操作,在这里整理一下学习收获。
1. file库的文件操作
file库是python中用于处理文件的读取、修改等操作,引入方式为
(资料图)
import file
1.1 打开文件---file.open()
使用open()
函数打开文件,语法为:
import filef=open(file_name="xx.txt", mode="r", buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
其中,file_name
为文件名,mode
为打开文件的模式,buffering
为缓冲区大小,encoding
为编码格式,errors
为错误处理方式,newline
为换行符,closefd
为关闭文件描述符,opener
为自定义开启方式。比较常用的参数为:file_name
、mode
、encoding
。
file_name
是文件的绝对路径或者相对路径。mode
的常用取值如下:encoding
的常用取值如下:目前常用的文本文件编码格式有:ASCII、GB2312、GBK、GB18030、BIG5、ISO-8859-1、UCS-2、UTF-16、UTF-8。其中,ASCII通常为英文字符编码,GB2312、GBK、GB18030、BIG5为中文字符编码,ISO-8859-1为西欧字符编码,UCS-2、UTF-16、UTF-8为通用字符编码。在实际编码过程中常用的是UTF-8
编码。
1.2 读取文件---file.read()
文件读取的方式有两种:一种是一次性读取所有内容,一种是按行读取。假设有文件xx.txt
,内容如下:
第一行内容;第二行内容,第三行内容第四行内容……
- 一次性读取所有内容
import filewith open(file_name="xx.txt", mode="r") as f: content=f.read()#从头到尾进行文件读取print(content)#打印整个文件内容
输入效果类似于:
第一行内容;第二行内容,第三行内容第四行内容……
read()
还可以传入数字,形成read(n)
,表示读取n个字符。
- 按行读取按行读取有两个函数:
readline()
和readlines()
。其中,readline()
是每次读取一行文件内容,readlines()
是将文件内容按行读取到一个列表中。readline()
的使用方法如下:
import filecontent_line="读取内容:\n"#设置起始内容with open(file_name="xx.txt", mode="r") as f: while content_line:##当读取内容不为空的时候 print(content_line)#打印整个文件内容 content_line=f.readline()#逐行读取文件内容
输入效果类似于:
第一行内容;第二行内容,第三行内容第四行内容……
readlines()
的使用方法如下:
import filewith open(file_name="xx.txt", mode="r") as f: content=f.readlines()#读取全部文件内容,按行分割,形成列表print(content)#打印整个文件内容,是一个列表格式
输入效果类似于:
[第一行内容;第二行内容,第三行内容第四行内容……]
1.3 写入文件---file.write()
文件写入的方式有两种:一种是一次性写入所有内容,一种是按行写入。
- 一次性写入所有内容
import filecontent="待写入内容,可以很长"#设置写入内容with open(file_name="xx.txt", mode="w") as f: f.write(content)#写入文件,这是使用的是覆盖写入
- 按行写入按行写入函数为
writelines()
,将列表中的内容按行写入文件。writelines()
的使用方法如下:
import filecontent=["写入内容1\n","写入内容2\n","写入内容3\n"]#设置写入内容with open(file_name="xx.txt", mode="w") as f: f.writelines(content)#写入文件
此时,文件内容为:
写入内容1写入内容2写入内容3
需要注意的是,如果列表content中的元素没有添加换行符,writelines()
不会自动添加换行符,因此可能会出现多行内容写入到一行的情况。因此,如果需要换行,需要在列表中的元素中添加换行符。
1.4 查找内容---file.seek()
tell()
函数用于判断文件指针当前所处的位置使用方式如下:
import filewith open(file_name="xx.txt", mode="r") as f: print(f.tell()) f.read(1024) print(f.tell())
输出结果为:
01024
而seek()
函数用于移动文件指针到文件的指定位置。常见的使用方式如下:
import filewith open(file_name="xx.txt", mode="r") as f: print(f.tell())#输出:0 f.read(1024) print(f.tell())#输出:1024 f.seek(203)#从文件头开始,移动到第203个字符处 print(f.tell())#输出:203
在这里介绍一下seek函数的参数:
seek(offset, whence)# offset:必需参数,偏移量,相对于某一个基点的字符移动距离,正数表示按照文件流方向向后移动,负数表示逆着文件流方向向前移动# whence:可选参数,可设置基点位置,0表示文件头(默认情况下),1表示当前位置,2表示文件尾
2. re库的文本处理
当然,在Python中,还有一个专门用于文本处理的库,那就是re
库。
我们读取文件内容,肯定不是单纯为了输出或者重新写入,对于文本我们一定有一些查找、定位的需求。
在python中,使用正则表达式能应付大多数情况下的数据处理需要,这就需要用到re
库,因此,我会在后续的更新中跟进正则表达式和re
库的相关知识,敬请期待。
参考资料
- Python3 File(文件) 方法
- Python文件基本操作整理
- Python 文件处理--详细整理
- Unicode,ASCII,UTF-8的区别
- Python seek()和tell()函数详解
关键词:
相关阅读
-
【python技巧】文本文件的读写操作
本文介绍了python进行文件读取的常用库之一——file库,介绍了其中... -
喜剧演员亚当·德维尼:漫威毁了喜剧电影
喜剧演员亚当·德维尼近日表示,他认为漫威电影对喜剧电影产生了负... -
广东深圳多个口岸单日出入境客流量屡创...
近期,广东深圳多个口岸刷新了今年以来的单日出入境客流量最高纪录,我 -
恒工精密(301261)8月10日主力资金净买...
截至2023年8月10日收盘恒工精密301261报收于4563元上涨321换手率4197成 -
7月新增信贷创新低 什么原因?如何看待?
国内需求不足、预期不稳等因素影响下,7月信贷与社融增量低于市场预期 -
深圳上半年新增就业人数逾9.5万 就业形...
深圳上半年新增就业人数逾9 5万就业形势保持总体稳定 -
出境团队游目的地增至138个
本报北京8月10日电(记者赵珊)10日,文化和旅游部办公厅发布《关于恢 -
人民同泰最新公告:上半年净利1.53亿元...
人民同泰披露半年报上半年公司实现营业收入5275亿元同比增长1457净利润 -
刘家峡水电厂:下好备汛“先手棋”打好...
8月9日,记者从国网甘肃刘家峡水电厂了解到,该厂严格按照黄河水利委员 -
为什么刷牙不干净? 你真的会刷牙么?...
什么?开玩笑?不会刷牙?是的,你可能真的不会刷牙。今天小编就来跟大 -
中国商务部首次发布《美国履行世贸规则...
中国商务部首次发布《美国履行世贸规则义务情况报告》 -
苹果赚走85%全球智能手机利润 苹果全球...
2023年第二季度,全球智能手机市场营收同比下降8%,环比下降15%,总额 -
火狐浏览器Firefox原生网页翻译功能来了
近日,Mozilla向Beta频道用户发出邀请,测试火狐浏览器Firefox的原生网 -
涨停复盘:大盘光头光脚重挫2%!券商股...
周五A股共21股涨停(不含ST股),5股封板未遂,连板股总数4只,科源制 -
北京市首单科创供应链债融产品成功发行
8月9日,储架式“中关村明日之星-首单科创2023年度供应链债权融资计 -
夏威夷山火已致53人死 拜登批准“重大...
夏威夷山火已致53人死拜登批准“重大灾难声明” -
百余家上市公司被问询是否涉腐 有公司...
近期,随着相关部门加大医药领域监管,一场医药反腐风暴席卷全国。据媒 -
2023年云南普通高校招生第七轮征集志愿...
根据实际录取进度,2023年普通高校招生第七轮征集志愿工作定于8月5日至 -
谎称可内推知名企业实习,一负债男子犯...
负债累累的赵某谎称有能力为他人内推知名企业实习名额,骗取被害人7 9 -
光线传媒:已具备每年推出2-3部动画电影...
光线传媒8月11日在互动平台表示,公司目前有彩条屋和光线动画两个动画