老齐教室

用Python读写文件的方法

在文中,我们将研习如何用Python读取文件,然后,向文件写入内容并再次保存它。使用Python读写某种特别类型的文件,例如:JSON、CSV、Excel等,一般会有专门的模块。但是,在这里,我们将用Python打开文本文件(.txt)。

若使用Python的open函数,它将返回一个文件对象,此对象将包含一些方法和属性。我们可以使用这些方法和属性获得已打开文件的相关信息,并且,可以使用这些方法来更改所打开的文件。

open()读取文件

在本节中,我们将学习如何使用open()函数在Python中加载文件,最简单的例子是打开一个文件并创建一个文件对象。

当使用Python的open()函数打开一个文件时,有若干个参数可用。然而,最常用的参数只有前两个。注意,第一个是强制性的,其余的是可选的。如果不添加mode参数,文件将在Python中以只读模式打开。

1
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

mode参数

读取文件有不同模式。如前所述,如果不带有mode参数,文件就会以只读方式打开,如下所示,列出了常用的几种打开模式。

其中,mode='r'表示制度;mode='w'表示只写;mode='a'表示追加。mode='r+'表示可读写,但是文件必须存在,否则报错。

一个简单的示例

在下面的代码示例中使用open()代开一个文件,此处假设文件与Python脚本在同一个目录中,否则要增加路径。

1
2
exfile = open('example_file')
print(exfile)

在上图中,很明显我们有一个以只读模式打开的文件对象,在open()中除了文件名之外没有任何其他参数。因此,无法向该文件写入任何内容。如果要打印文件名,只需键入print(exfile.name)

创建文本文件并写入内容

下面使用open()创建一个新文件。现在,要使用mode='w'参数,这样能够打开一个文件对象,并可以使用“文件对象写入”方法。

1
2
exfile = open('example_file2', 'w')
print(exfile)

在上图中,可以当前文件对象是写入模式(‘ w ‘),在下面的代码块中,我们将向这个文件中添加一行文本:

1
exfile.write('This is example file 2 \n')

当然,也可以添加更多的行:

1
2
exfile.write('Line number 2, in example file 2')
exfile.close()

注意,在最后一行务必要使用close() 关闭文件。在下图中,我们可以看到用Python创建的示例文件。

如何使用open()读取Python中的文本文件

在下一个用Python读取文件的示例中,我们将学习如何在Python中打开文本文件(.txt)。当然,这很简单,我们基本上已经掌握了如何使用Python实现这一目的。也就是说,如果我们只想在Python中读取.txt文件,我们可以使用open函数和read模式:

1
txtfile = open('example_file.txt')

read()示例

这个操作很简单。现在,如果我们想打印文本文件的内容,可以有三个方法。第一个,使用文件对象的read()方法,读取整个文件内容。也就是说,用txtfile.read()可以得到以下输出:

第二个是用readlines()将文件读取到列表中:

1
2
txtfile = open('example_file.txt')  
print(txtfile.readlines())

在这个方法中,还可以使用通过提供参数,说明读取某些行。例如,下面的代码将把前两行读入,然后将其打印出来:

1
2
3
4
5
6
txtfile = open('example_file.txt')
line = txtfile.readlines(1)
print(line)

line2 = txtfile.readlines(2)
print(line2)

最后一个方法,通过循环方式,把文件的内容逐行打印出来:

1
2
3
txtfile = open('example_file.txt')
for line in txtfile:
print(line)

写入文件内容

在示例中,打开一个.txt文件,并向其中以追加的方式增加内容,故需要用'a'模式打开。

1
open('example_file2.txt', 'a')

接下来,使用write()向其追加内容。

1
txtfile.write('\n More text here.')

在添加文本时,至少在Windows 10中,必须在行前添加\n。否则,新的一行将添加到最后一个字符的后面(在文件的最后一行)。如果我们要添加更多的行,也必须记住这样操作;

1
2
txtfile.write(‘\nLast line of text, I promise.)
txtfile.close()

可以使用文本编辑器(例如,Notepad, Gedit)打开文本文件,会看到添加的最后两行:

使用with语句

使用with语句打开文件是一个非常好的习惯,这样就不必记住关闭文件,并且使用with语句的语法清晰易读:

1
2
with open('example_file2.txt') as txtfile2:
print(txtfile2.read())

现在,如果我们使用read()方法,Python会抛出ValueError:

1
txtfile2.read()

分词和统计

在读取文件后,可以使用字符串的split()方法将文本文件中的句子分割成单词,然后用collections模块中的Counter类来统计打开的文件中的单词数量。

1
2
3
4
5
6
7
from collections import Counter

with open('example_file2.txt') as txtfile2:
wordcount = Counter(txtfile2.read().split())

print(len(wordcount))
# Output: 43

现在,Counter类返回了一个字典,该字典包含所有单词和每个单词出现的次数。因此,可以这样来打印所有单词和单词总数:

1
2
for k in sorted(wordcount, key=wordcount.get, reverse=True):
print(k, wordcount[k])

在上面的代码示例中,我们循环遍历字典中的键并对它们进行排序。这样,就把最常见的词排在最上面。当然,如果用Python读取包含多个单词的文件、并像这样打印结果,这种操作就是不可行的。

以上介绍了以不同的模式读取文件、创建和写入文件、将数据追加到文件的方法,以及如何使用with语句读取文件。

使用支付宝打赏
使用微信打赏

若你觉得我的文章对你有帮助,欢迎点击上方按钮对我打赏

关注微信公众号,读文章、听课程,提升技能