一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - python實現自動清理重復文件

python實現自動清理重復文件

2020-08-25 00:51劉早起 Python

這篇文章主要介紹了python如何實現自動清理重復文件,幫助大家更好的理解和學習python,感興趣的朋友可以了解下

前言

大家好,又到了Python辦公自動化系列。

今天分享一個系統層面的自動化案例:

「給定一個文件夾,使用Python檢查給定文件夾下有無文件重復,若存在重復則刪除」

主要涉及的知識點有:

  • os模塊綜合應用
  • glob模塊綜合應用
  • 利用filecmp模塊比較兩個文件

步驟分析

該程序實現的邏輯可以具化為:

遍歷獲取給定文件夾下的所有文件,然后通過嵌套循環兩兩比較文件是否相同,如果相同則刪除后者。

實現問題的關鍵就變成了?

如何判斷兩個文件是否相同?

在這里我們可以使用filecmp模塊,來看看官方的介紹文檔:

  • filecmp.cmp(f1, f2, shallow=True)
  • 比較名為f1和f2的文件,如果它們似乎相等則返回True,否則返回False
  • 如果shallow為真,那么具有相同os.stat()簽名的文件將會被認為是相等的。否則,將比較文件的內容。

所以可以這樣使用?

?
1
2
3
# 假設x和y兩個文件是相同的
print(filecmp.cmp(x, y))
# True

解決了這個問題,我們就可以開始寫代碼了!

Python實現

導入需要的庫并設置目標文件夾路徑

?
1
2
3
4
5
import os
import glob
import filecmp
 
dir_path = r'C:\\xxxx'

接著遍歷獲取所有文件的絕對路徑,我們可以利用glob模塊的通配符結合recursive參數即可完成,框架如下:

?
1
2
for file in glob.glob(path + '/**/*', recursive=True):
  pass

由于遍歷獲取每一個文件或者文件夾后,需要判斷是否是文件,如果是文件則可能將絕對路徑存放到列表中,這里需要再完成兩個事情:

  1. 首先創建一個空列表,后面用list.append(i)添加文件路徑
  2. 接著利用os.path.isfile(i)判斷是否是文件,返回True則執行添加元素的操作

具體代碼如下

?
1
2
3
4
5
file_lst = []
 
for i in glob.glob(dir_path + '/**/*', recursive=True):
  if os.path.isfile(i):
    file_lst.append(i)

上一步我們獲取了目標文件夾下的所有文件路徑,接下來就可以嵌套遍歷這個路徑列表,其中filecmp.cmp進行文件判斷,os.remove進行文件刪除

?
1
2
3
4
5
for x in file_lst:
  for y in file_lst:
    if x != y:
      if filecmp.cmp(x, y):
        os.remove(y)

這里的代碼已經實現了大致邏輯,但有一個細節需要考慮到:有可能循環到文件已經被前面的判斷刪除了,導致os.remove(file)由于文件不存在而報錯

因此,可以用os.path.exists對文件存在進行判斷,如下所示:

?
1
2
3
4
5
for x in file_lst:
  for y in file_lst:
    if x != y and os.path.exists(x) and os.path.exists(y):
      if filecmp.cmp(x, y):
        os.remove(y)

這樣,一個簡易的文件去重小程序就完成了,完整代碼如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import os
import glob
import filecmp
 
dir_path = r'C:\xxxx'
 
file_lst = []
 
for i in glob.glob(dir_path + '/**/*', recursive=True):
  if os.path.isfile(i):
    file_lst.append(i)
 
for x in file_lst:
  for y in file_lst:
    if x != y and os.path.exists(x) and os.path.exists(y):
      if filecmp.cmp(x, y):
        os.remove(y)

寫在最后

通過本文的Python自動化腳本制作過程,我們可以再次體會Python辦公自動化的強大,同時本次實現的功能可以和之前自動整理文件的腳本結合使用!

以上就是python實現自動清理重復文件的詳細內容,更多關于python清理重復文件的資料請關注服務器之家其它相關文章!

原文鏈接:https://cloud.tencent.com/developer/article/1683712

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 天堂在线中文无弹窗全文阅读 | 国产在线观看人成激情视频 | 国产亚洲综合成人91精品 | 情人梁家辉在线 | 爽好舒服使劲添高h视频 | 狠狠色婷婷狠狠狠亚洲综合 | 国产探花在线观看 | 狠狠色婷婷 | 图片亚洲va欧美va国产综合 | 国产精品区一区二区免费 | 四虎在线永久视频观看 | 丝瓜污污视频 | 褪色的憎恨| 亚洲欧美色综合图小说 | 日本加勒比一区 | 免费看国产一级特黄aa大片 | 操妈小说| 国产在线乱子伦一区二区 | 亚洲国产精品综合久久一线 | 日韩一级欧美一级一级国产 | 日韩在线视频一区二区三区 | 国产亚洲综合成人91精品 | 欧美精品日韩 | 成人伊人青草久久综合网破解版 | 久久免费资源福利资源站 | 99久久99热久久精品免费看 | 国产精品3p视频 | 欧美美女被爆操 | 韩国三级动漫 | 女人被男人躁得好爽免费视频 | 天天操天天干天天 | 欧美色综合高清免费 | 国产精品亚洲片在线不卡 | 小鸟酱视频在线观看 | 果冻传媒新在线观看免费 | naruto堂同人本子汉化gg | 热色综合 | 亚洲第一在线播放 | 国产女同精品 | 91制片厂制作传媒网站 | 欧美另类xxx精品人妖 |