背景#
前幾天網上下載了一個 100G 的資料集,裡面有幾萬個檔案。然而,由於製作壓縮包的人使用的是 macOS,我解壓後,發現每個檔案都有一個以._
開頭的副本,例如有一個檔案是sub_12345
,就會有一個對應的._sub_12345
,這個副本檔案沒有用處,但是在 Windows 下能看見,不僅看著難受,而且還影響後續程式讀取檔案。
python 腳本批量刪除#
核心是使用os.walk
模組進行處理:
import os
data_dir = './test/'
for root, subdir, filename in os.walk(data_dir, topdown=False):
if filename.startswith('._'):
os.remove(os.path.join(root, filename))
以上就是腳本,特別簡單。因為os.walk
實現了遞迴讀取資料夾,使得任務簡單了很多。