前言
最近不小心把硬盤給格式化了,由于當(dāng)時(shí)的文件沒有備份,所以一下所有的文件都沒有了,于是只能采取補(bǔ)救措施,用文件恢復(fù)軟件恢復(fù)了一部分的數(shù)據(jù)出來,但是恢復(fù)完畢的文件的文件名全丟了,所有的文件只有代號(hào),如下面的圖:
幾萬個(gè)文件這要是手動(dòng)的改得要改到明年。所以便動(dòng)手寫了一個(gè)python的腳本程序來代替這種繁雜的操作。
實(shí)現(xiàn)分析
想讓程序來理解我的word文檔里到底是什么內(nèi)容是不可能的了,但是好在我的word文檔內(nèi)容都有標(biāo)題,大部分的標(biāo)題正好就是這個(gè)文檔的文件名,于是我便打算把文檔的標(biāo)題當(dāng)作文件名,而文件名大部分都是內(nèi)容的第一段,于是思路便有了。于是開始寫程序開干。
實(shí)現(xiàn)方法
首先需要安裝python-docx庫,直接通過pip安裝: pip install python-docx
具體的程序如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
# -*- coding: utf-8 -*- """ NameChange1.0 This is a program that automatically modifies the name of an word document. author:fanghao """ from docx import Document import os #這個(gè)是放所有待修改的word文件的目錄 dir_1 = "C:\\Users\\visg\\Desktop\\4" filenames = os.listdir(dir_1) #自動(dòng)修改 for a in range ( len (filenames)): print (filenames[a]) dir_docx = dir_1 + "\\" + filenames[a] try : document = Document(dir_docx) except : print ( "error" ) else : new_name = document.paragraphs[ 0 ].text + '.docx' try : os.rename(dir_1 + os.sep + filenames[a],dir_1 + os.sep + new_name) except (FileNotFoundError,FileExistsError,OSError): print ( "FileNotFoundError" ) |
具體的目錄自己修改下就可以了,這里我直接跳過了哪些名字改后重復(fù)的文件。
但是有點(diǎn)坑的地方是恢復(fù)出來的文檔有的是docx,有的是doc文檔,docx文檔可以通過以上的方法來改名,但是doc文檔便出現(xiàn)了問題。于是便只能先把doc文檔轉(zhuǎn)成docx文檔,然后再用上述的方法來修改。怎么把doc轉(zhuǎn)成docx,這里有一篇博客,一個(gè)大牛寫了個(gè)比較利好的插件可以很好的實(shí)現(xiàn)(http://blog.sina.com.cn/s/blog_5488e3a90100u8ux.html),親測好用!
注意:上述的方法對于大部分的word文檔是可以的,但是有些文檔由于格式等自身原因,無法進(jìn)行修改,對于這些文檔可以直接手動(dòng)修改。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,如果有疑問大家可以留言交流,謝謝大家對服務(wù)器之家的支持。
原文鏈接:http://www.cnblogs.com/zutterhao/p/7678523.html