课程:文件操作

目标

  • 文件操作的作用

  • 文件的基本操作

    • 打开
    • 读写
    • 关闭
  • 文件备份

  • 文件和文件夹的操作

一. 文件操作的作用

思考:什么是文件?

思考:文件操作包含什么?

答:打开、关闭、读、写、复制…

思考:文件操作的的作用是什么?

答:读取内容、写入内容、备份内容…

总结:文件操作的作用就是把一些内容(数据)存储存放起来,可以让程序下一次执行的时候直接使用,而不必重新制作一份,省时省力

二. 文件的基本操作

文件内数据要求为字符串类型,即要求写入的数据为字符串类型

2.1 文件操作步骤

  1. 打开文件,如果文件不存在,则会新建文件

  2. 读写等操作

  3. 关闭文件(如果不关闭,文件会一直占用内存)

注意:可以只打开和关闭文件,不进行任何读写操作。

# 打开文件open()
f = open('test.txt', 'w')
# 读写操作 write() read()
f.write('aaa')
# 关闭文件 close()
f.close()

2.1.1 打开open(name,mode)

在python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下:

open(name, mode)

==name:==是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。写路径也需要按照字符串形式来写。

mode:设置打开文件的模式(访问模式):只读、写入、追加等。

2.1.1.1 打开文件模式mode

文件内数据要求为字符串类型,即要求写入的数据为字符串类型

模式 描述
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式
rb 二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除(执行写入,会覆盖原有内容)。如果该文件不存在,创建新文件。
wb 二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。w+未执行写入,则写入内容为空,会将原来文件数据覆盖掉。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也 就是说,新的内容将会被写入到已有内容之后(在原有内容基础上,追加新内容)。如果该文件不存在,创建新文件进行写入。
ab 二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针 将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。无论怎样,文件都无法读取(因为文件指针在文件的结尾)
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

注意:

访问模式r w a特点:

r——如果文件不存在,报错;不支持写入操作,表示只读。

w——只写,如果文件不存在,新建文件;执行写入,会覆盖原有内容

a——追加,如果文件不存在, 新建文件;在原有内容基础上,追加新内容

访问模式如果省略表示访问模式为

访问模式中,如果后缀带b,就是以二进制格式打开文件;如果后缀带+,访问的文件可读可写。

访问模式:rb、r+、rb+中必须遵循主访问模式r的特点;wb、w+、wb+和ab、a+、ab+同理。

访问模式r(包括rb、r+、rb+)或w(包括wb、w+、wb+)——文件的指针将会放在文件的开头。

访问模式a(包括ab、a+、ab+)——文件的指针将会放在文件的结尾。

示例1:

"""
测试目标
1.访问模式对文件的影响
2.访问模式对write()的影响
3.访问模式是否可以省略
"""
# r:如果文件不存在,报错;不支持写入操作,表示只读。
# f1 = open('test1 .txt', 'r')
f1 = open('test.txt', 'r')
f1.write('ee') #
f1.close()

# w:只写,如果文件不存在,新建文件;执行写入,会覆盖原有内容
f2 = open('1.txt', 'w')
f2.write('bb')
f2.write('cc')
f2.close()

# a:追加,如果文件不存在, 新键文件;在原有内容基础上,追加新内容
f3 = open('2.txt', 'a')
f3.write('bbb')
f3.write('xyz')
f3.close()

# 访问模式是否可以省略,如果省略表示访问模式为r
f4 = open('1.txt')
f4.close()

示例2:

"""
测试目标:
1.r+ 和 w+ a+区别:
2.文件指针对数据读取的影响
"""
# r+:如果没有该文件则报错;文件指针在开头,所以能读取出来数据
# f = open('test1.txt', 'r+')
f = open('test.txt', 'r+')

# w+: 如果没有该文件会新建文件;w+特点:文件指针在开头,用新内容覆盖原内容
f = open('test.txt', 'w+')
f.write('aa')
f.seek(0) # 将文件指针移动到文件开头,此时可读取文件
con = f.read()
print(con)
f.close
# w+未执行写入,则写入内容为空,会将原来文件数据覆盖掉

# a+: 如果没有该文件会新建文件;a+特点:文件指针在结尾,无法读取数据(文件指针后面没有数据)
# f = open('test2.txt', 'a+')
f = open('test.txt', 'a+')

# f.seek(0) # 将文件指针移动到文件开头,此时可读取文件
con = f.read()
print(con)

f.close()

问题:执行w+代码为什么读取不到文件数据?

# w+:没有该文件则会新建文件;文件指针在开头,用新内容会覆盖原内容;w+未执行写入,则写入内容为空,会将原来文件数据覆盖掉
f = open('test.txt', 'w+')
f.write('aa')
con = f.read()
print(con)
f.close()

​ 在你写入数据后,文件指针已经移动到了文件的末尾。当你尝试读取时,由于文件指针已经在末尾,所以无法读取到任何数据。

2.1.1.2 快速体验

f = open('test.txt', 'w')

注意:此时的fopen函数的文件对象。

2.1.2 文件对象方法

2.1.2.1 写—— 文件对象.write(‘内容’)

文件内数据要求为字符串类型,即要求写入的数据为字符串类型

  • 语法

文件对象.write('内容')
  • 体验

# 1. 打开文件
f = open('test.txt', 'w')

# 2.文件写入
f.write('hello world')

# 3. 关闭文件
f.close()

注意:

  1. w a模式:如果文件不存在则创建该文件;如果文件存在,w模式先清空再写入,a模式直接末尾追加。
  2. r模式:如果文件不存在则报错。
2.1.2.2 读
  • read()

文件对象.read(num)

num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

文件内容如果换行,底层有\n,会占一个字节,不会打印出来。

示例:

"""
text.txt文件数据如下:
aa
bb
cc
dd
ee
ff
# 文件内容如果换行,底层有\n,会占一个字节,不会打印出来。
"""
f = open('test.txt', 'r')
print(f.read(4)) # 读取到的结果: aa b
f.close()
  • readlines()

readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。如果数据中有换行符,会打印出来。

f = open('test.txt')
content = f.readlines()

# ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']
print(content)

# 关闭文件
f.close()
  • readline()

readline()一次读取一行内容。

f = open('test.txt')

content = f.readline()
print(f'第一行:{content}')

content = f.readline()
print(f'第二行:{content}')

# 关闭文件
f.close()

image-20190222105332438

2.1.2.3 seek()

作用:用来移动文件指针。

语法如下:

文件对象.seek(偏移量, 起始位置)

偏移量:表示指针从起始位置偏移多少–开始读取。

起始位置:

  • 0:文件开头

  • 1:当前位置

  • 2:文件结尾

示例:

"""
语法: 文件对象.seek(偏移量,起始位置) 0开头 1当前 2结尾
目标:
1,r改变文件指针位置;改变读取数据开始位置或把文件指针放在结尾(无法读取数据)
2,a 改变文件指针位置,做到可以读取出来数据
"""
# f = open('test.txt', 'r+')
f = open('test.txt', 'a+')
# 1.改变读取数据开始位置
# f.seek(3, 0) # f.seek(3, 1)
# 1.把文件指针放在结尾(无法读取数据)
# f.seek(0, 2)

f.seek(0, 0) # 省略写法f.seek(0)

con = f.read()
print(con)
f.close()

2.1.3 关闭——文件对象.close()

文件对象.close()

三. 文件备份

需求:用户输入当前目录下任意文件名,程序完成对该文件的备份功能(备份文件名为xx[备份]后缀,例如:test[备份].txt)。

3.1 步骤

  1. 接收用户输入的文件名

  2. 规划备份文件名

  3. 备份文件写入数据

3.2 代码实现

  1. 接收用户输入目标文件名

old_name = input('请输入您要备份的文件名:')
  1. 规划备份文件名

    2.1 提取目标文件后缀

    2.2 组织备份的文件名,xx[备份]后缀

# 2.1 提取文件后缀点的下标
index = old_name.rfind('.')

# print(index) # 后缀中.的下标

# print(old_name[:index]) # 源文件名(无后缀)

# 2.2 组织新文件名 旧文件名 + [备份] + 后缀
new_name = old_name[:index] + '[备份]' + old_name[index:]

# 打印新文件名(带后缀)
# print(new_name)
  1. 备份文件写入数据

    3.1 打开源文件 和 备份文件

    3.2 将源文件数据写入备份文件

    3.3 关闭文件

# 3.1 打开文件
old_f = open(old_name, 'rb') # 提前把原文件准备好
new_f = open(new_name, 'wb')

# 3.2 将源文件数据写入备份文件
while True:
con = old_f.read(1024)
if len(con) == 0:
break
new_f.write(con)

# 3.3 关闭文件
old_f.close()
new_f.close()

3.3 思考

如果用户输入.txt,这是一个无效文件,程序如何更改才能限制只有有效的文件名才能备份?

答:添加条件判断即可。

old_name = input('请输入您要备份的文件名:')

index = old_name.rfind('.')


if index > 0:
postfix = old_name[index:]

new_name = old_name[:index] + '[备份]' + postfix

old_f = open(old_name, 'rb')
new_f = open(new_name, 'wb')

while True:
con = old_f.read(1024)
if len(con) == 0:
break
new_f.write(con)

old_f.close()
new_f.close()

自己敲:

# 1.接收用户输入的文件名
old_name = input('请输入您要需要备份的文件名:')
# print(old_name)
# print(type(old_name)) # 字符串

# 2.规划备份文件名
# 2.1 提取目标文件的后缀--找到文件名字中的点--文件名字和后缀分离--最右侧的点才是后缀的点--字符串查找某个子串--语法:序列名.rfind()
index = old_name.rfind('.')
# print(index)

# 2.2 组织新名字 = 原名字 + [备份] + 后缀
# 原名字就是字符串中的一部分子串--字符串切片[开始:结束:步长
# 提取原名字
# old_name[:index]
# print(old_name[:index]) # old_name[:index]
# 提取后缀
# old_name[index:]
# print(old_name[index:])
if index > 0: # 判断文件名是否有效?有效的文件名才能备份
postfix = old_name[index:]

# 组合新名字
new_name = old_name[:index] + '[备份]' + postfix
# print(new_name)


# 3.备份文件写入数据
# 3.1 打开文件
old_f = open(old_name, 'rb') # 提前把原文件准备好
new_f = open(new_name, 'ab')

# 3.2 源文件读取,备份文件追加写入
# 如果不确定目标文件大小,循环读取写入;当读取出来的数据没有了则终止循环
while True:
# 这段代码是按照每次读取 1024 字节的方式来处理文件的,直到文件结束。
con = old_f.read(1024)
# 表示从 old_f 文件对象中读取最多 1024 个字节的数据。如果文件中还有剩余的字节,就会成功读取并返回这些字节的内容。
# 但如果文件已经到达末尾,就无法再读取更多数据,此时将返回一个空字符串 ''。
if len(con) == 0:
# 读取完成
break
new_f.write(con) # 应该把old_f文件数据追加到new_f

# 3.3 关闭文件
old_f.close()
new_f.close()

四. 文件和文件夹的操作

在Python中文件和文件夹的操作要借助os模块里面的相关功能,具体步骤如下:

  1. 导入os模块

import os
  1. 使用os模块相关功能

os.函数名()

4.1 文件重命名

os.rename(目标文件名, 新文件名)

4.2 删除文件

os.remove(目标文件名)

4.3 创建文件夹

os.mkdir(文件夹名字)

4.4 删除文件夹

os.rmdir(文件夹名字)

4.5 获取当前目录

os.getcwd()   # 获取当前文件所在目录路径

4.6 改变默认目录

os.chdir(目录) # 改变目录路径/切换目录

4.7 获取目录列表

os.listdir(目录)  #获取某个文件夹下所有文件名,返回一个列表

示例:

# gercwd()获取当前文件所在目录路径
print(os.getcwd())

# chdir()改变目录路径
# 需求:在aa里面创建bb文件夹:1.切换目录到aa, 2.创建bb
os.mkdir('aa')
os.chdir('aa') # 切换目录到aa
os.mkdir('bb')

# listdir()获取某个文件夹下所有文件名,返回一个列表
print(os.listdir('aa'))
print(os.listdir())

五.应用案例

"""
需求1:把从code文件夹所有文件重命名Python_xxx
1.找到所有文件;切换到aa文件夹--chdir() 找到其目录列表--listdir()
2.构造名字
3.重命名
"""

import os
# 1.找到所有文件;切换到aa文件夹--chdir() 找到其目录列表--listdir()
os.chdir('aaa') # 切换到当前目录
flie_list = os.listdir()
print(flie_list)

# 2.构造名字
for i in flie_list:
new_name = 'Python_' + i

# 3.重命名
os.rename(i, new_name)

需求2:批量修改文件名,既可添加指定字符串,又能删除指定字符串。

  • 步骤

  1. 设置添加删除字符串的的标识

  2. 获取指定目录的所有文件

  3. 将原有文件名添加/删除指定字符串,构造新名字

  4. os.rename()重命名

  • 代码

import os

# 设置重命名标识:如果为1则添加指定字符,flag取值为2则删除指定字符
flag = 1

# 获取指定目录
dir_name = './'

# 获取指定目录的文件列表
file_list = os.listdir(dir_name)
# print(file_list)


# 遍历文件列表内的文件
for name in file_list:

# 添加指定字符
if flag == 1:
new_name = 'Python-' + name
# 删除指定字符
elif flag == 2:
num = len('Python-')
new_name = name[num:]

# 打印新文件名,测试程序正确性
print(new_name)

# 重命名
os.rename(dir_name+name, dir_name+new_name)

根据视频写:

"""
需求2;删除Python_ 重命名:1.构造调节的数据 2.书写if
"""
import os

flag = 1

# 1.找到所有文件;切换到aa文件夹--chdir() 找到其目录列表--listdir()
os.chdir('aaa') # 切换到当前目录
flie_list = os.listdir()
print(flie_list)

# 2.构造名字
for i in flie_list:
if flag == 1:
new_name = 'Python_' + i
elif flag ==2:
# 删除前缀
num = len('Python_')
# 原名字就是字符串中的一部分子串 --字符串切片[开始:结束:步长]
new_name = i[num:] # 切片,只取原名字字符串Python_后面部分
# 3.重命名
os.rename(i, new_name)

六. 总结

  • 文件操作步骤

    • 打开
    文件对象 = open(目标文件, 访问模式)
    • 操作

      文件对象.read()
      文件对象.readlines()
      文件对象.readline()
      文件对象.write()
      • seek()

    • 关闭

    文件对象.close()
  • 主访问模式

    • w:写,文件不存在则新建该文件
    • r:读,文件不存在则报错
    • a:追加
  • 文件和文件夹操作

    • 重命名:os.rename()
    • 获取当前目录:os.getcwd()
    • 获取目录列表:os.listdir()