open
Python提供了非常方便的文件讀寫功能,其中open
是讀寫文件的第一步,通過open
讀寫文件的方式和把大象裝冰箱是一樣的
1
2
3
|
f = open ( "test.txt" , 'w' ) #第一步,把冰箱門(文件)打開 f.write( "this is content" ) #第二步,把大象(文件內容)裝進去 f.close() #第三步,把冰箱門關上,否則大象可能會跑掉 |
open
的定義方式為
file=open(path,mode='r',buffering=-1,encoding=None)
其中,
-
path
為文件路徑 -
mode
為讀取模式,默認為r
,即只讀模式。 -
buffering
為緩沖區,由于內存的讀寫速度快于外設,所以大部分情況不用設,即不大于0。 -
encoding
為編碼方式 -
最后,輸出的
file
是一個文件對象。
其中,mode
包括以下幾種
r | r+ | w | w+ | a | a+ | |
---|---|---|---|---|---|---|
b | rb | rb+ | wb | wb+ | ab | ab+ |
其中,b表示二進制,r表示讀,w表示寫,a表示追加。無論什么模式,有+
則意味著可讀可寫。寫入一般會覆蓋原文件,追加則在原文件尾部開始寫。如果文件不存在,w, w+, a, a+, wb
會創建新文件。
文件對象
通過open
創建的文件對象,除了用于關閉文件的close
之外,有兩組最常用的函數,即代表讀寫的read
和write
,分別用于讀寫,其區別如下
read | write |
讀寫整個文件 read(size)可讀取size大小的文件 |
readline |
每次讀一行 由于write直接輸入字符串,故不必設置writeline |
|
readlines | writelines |
前者按行讀取文件,并存入一個字符串列表 writelines將一個字符串列表的形式寫入文件 |
例如
1
2
3
4
5
6
7
|
>>> f = open ( 'test.txt' , 'w' ) >>> f.writelines([ 'a' , 'b' , 'c\n' , 'd' ]) >>> f.close() >>> f = open ( 'test.txt' , 'r' ) >>> f.readlines() [ 'abc\n' , 'd' ] #在寫lines的時候,并不會自動添加\n >>> f.close() |
根據我電腦的性能,讀取500M的txt就要超過1s,讀取2G的文件多半要報錯。這個時候需要通過seek
函數來指定偏移量,然后在偏移處的位置對文件進行讀寫操作。其輸入為f.seek(offset,whence=0)
其中
-
offset
為偏移量 -
whence
為偏移方式,為0時表示絕對定位;為1時表示相對定位;為2表示從末尾定位。
從seek
的視角來看,open
文件時,如果用了w
,則代表seek(0)
,如果用了a
,則代表seek(0,2)
。
通過tell
可以返回當前偏移量,相當于seek
的對偶函數。
在對文件操作結束后,需要使用f.close()
將緩存中的字符串寫入硬盤;如果害怕發生意外,可以用f.flush()
強制寫入。
此外,文件對象的成員變量如下
name | mode | encoding | error | closed | buffer |
---|---|---|---|---|---|
文件名 | 讀寫模式 | 編碼方式 | 錯誤模式 | 是否已經關閉 | 緩沖區 |
此外還有三個判定函數
readable() |
writable() |
seekable |
---|---|---|
是否可讀 | 是否可寫 | 可否指定偏移量 |
with … as表達式
在寫入文件時,如果忘了close
或者flush
,那么可能還有一些數據留在內存中,從而導致我們得到的文件是殘缺的。
with as
表達式可以通過調用對象中的__enter__
方法和__exit__
方法,來更加智能地調用close
,從而免除了忘寫close
的麻煩。其調用方法為
1
2
|
with open ( 'text.txt' , 'w' ) as f: f.write( "12345" ) |
查看file.py
,其__exit__
函數正是close
:
1
2
3
4
5
|
def __enter__( self ): return self def __exit__( self , type , value, traceback): self .close() |
底層實現:os.open
open
是非常方便的函數,但開銷也很大,畢竟直接返回了一個文件對象。相比之下,其底層實現os.open
返回的是一個整型的文件ID,對于在速度上有要求的頻繁的文件讀寫操作,可以考慮使用。
os
中,打開一個文件的方法為
1
|
fd = os. open (path, flags, mode = 511 , dir_fd = None ) |
其中,
-
path
為文件路徑 -
flags
為打開標志,例如os.O_RDONLY
代表只讀、os.O_WRONLY
代表只寫 -
mode
表示文件權限,例如777代表任何人可讀可寫可執行;511代表文件創建者可讀可執行,其他人只可讀,這屬于Linux的內容,日后可專門在Linux里說。 -
dir_fd
表示相對路徑的規則,為自定義函數,比較少用。 -
最后,輸出的
fd
是某個文件的標識。
其中,mode的取值可見于deepin和windows的手冊,常用的標志如下,多個標志可通過|
疊加,這一股濃郁的C風確認來自操作系統無疑了。
os.open | open | os.open | open |
---|---|---|---|
os.O_RDONLY | ‘r' | os.O_WRONLY | ‘w' |
os.O_RDWR | ‘r+' | os.O_APPEND | ‘a' |
os.O_CREAT | 創建并打開 |
其中相關的函數還有:
os.fdopen(fd, mode, bufsize) |
通過fd創建一個文件對象,并返回這個文件對象 |
os.read(fd, n) |
從fd 中讀取最多 n 個字節并返回,如果fd對應文件已達到結尾, 則返回空串。 |
os.write(fd, str) |
將str 寫入fd,返回實際寫入的字符串長度 |
os.fsync(fd) |
強制將fd所對應的文件寫入硬盤 |
os.close(fd) |
關閉fd |
os.dup(fd) |
復制fd |
os.dup2(fd, fd2) |
將fd1所對應的文件復制給fd2 |
os.fstat(fd) |
返回fd的狀態 |
os.ftruncate(fd, length) |
裁剪fd, length 不大于文件尺寸 |
os.isatty(fd) |
如果fd已經打開,同時與tty(-like)設備相連,則返回True, 否則False。 |
os.lseek(fd, pos, how) |
設置fd當前位置為pos, how為修改方式,等同于前文中的whence |
到此這篇關于深入解讀Python如何進行文件讀寫的文章就介紹到這了,更多相關Python 文件讀寫內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!
原文鏈接:https://blog.csdn.net/m0_37816922/article/details/120934686