CSiEra

CSiEra

I know I know nothing.

批量刪除某些文件

背景#

前幾天網上下載了一個 100G 的資料集,裡面有幾萬個檔案。然而,由於製作壓縮包的人使用的是 macOS,我解壓後,發現每個檔案都有一個以._開頭的副本,例如有一個檔案是sub_12345,就會有一個對應的._sub_12345,這個副本檔案沒有用處,但是在 Windows 下能看見,不僅看著難受,而且還影響後續程式讀取檔案。

python 腳本批量刪除#

核心是使用os.walk模組進行處理:

import os

data_dir = './test/'
for root, subdir, filename in os.walk(data_dir, topdown=False):
  if filename.startswith('._'):
    os.remove(os.path.join(root, filename))

以上就是腳本,特別簡單。因為os.walk實現了遞迴讀取資料夾,使得任務簡單了很多。

載入中......
此文章數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。