在 Notepad++ 中從電影/電視腳本中提取台詞

在 Notepad++ 中從電影/電視腳本中提取台詞

我有一部 3 小時紀錄片的文字記錄,其中充滿了我想分享的引言。文字記錄很大,因此手動查看它會花費很長時間。

所以基本上,我只想從記錄中刪除所有文本,除了引號之間找到的文本:刪除“keep”刪除。

我很確定你可以在 Notepad++ 中做到這一點,我只是不知道如何做。有人可以幫忙嗎!

答案1

這個問題的解決方案在於使用正規表示式,一種在給定一組規則的情況下匹配文字部分的工具。您的規則相當簡單 - 捕獲兩個引號之間的所有內容。我不是最擅長正規表示式的人,但我想出了一個似乎符合您正在尋找的解決方案。

我建議使用昇華編輯器來做到這一點 - 首先,我無法讓它在 N++ 中輕鬆工作,其次,Sublime 真的很棒!

以下是提取報價的方法。

  1. 在 Sublime 中開啟要從中提取的檔案。
  2. 點選ctrl+f開啟螢幕底部的尋找工具。
  3. 點選尋找工具最左側帶有.*符號的按鈕。這將啟用正規表示式匹配。
  4. 在查找欄中輸入: "[^"]+"
  5. 在尋找工具的最右側,按一下Find All
  6. 點擊ctrl+c複製所有選擇。
  7. 開啟新檔案並點擊ctrl+v貼上所有選定的文字。

正規表示式解釋

我將把這個表達式分成多個部分。

"- 這開始匹配以雙引號開頭的文字。
[^"]- 這匹配所有不包含另一個雙引號的文字 - 重要的是,因為如果我們匹配引號,我們將開始匹配第一個引號之後文件中的所有內容!不是我們想要的。該^符號是正則表達式中的否定字元 - 它表示不是匹配接下來發生的事情。
+"- 強制我們只匹配最終以另一個雙引號結尾的文字。這可以防止我們將文件中的最後引用匹配到文件的末尾,並結束我們之前開始的所有匹配,而不會溢出到我們不想匹配的內容。

我想有更漂亮的方法可以做到這一點,但我也希望這能滿足您的需求。如果您對此有任何問題,請告訴我!

哦,最後一點,我推薦 Sublime 的部分原因是它支援多個遊標,這使得它可以輕鬆地同時選擇文字的不同部分。嘗試開啟一個文件並ctrl+middle click在幾個不同的位置鍵入,然後開始鍵入。

編輯

哈哈,我完全忽略了在 Notepad++ 中最明顯的地方(尋找工具)尋找內建正規表示式。您可以用幾乎相同的方式完成此操作,但是沒有一個好的方法來選擇所有文字。最簡單的就是單擊“在當前文件中查找全部”,然後選擇底部“查找”視窗中生成的所有文字。但這並不像 Sublime 的管理方式那麼漂亮。

答案2

試試這個 :

  1. Ctrl + H
  2. 找內容:^(\l+)
  3. 替換為:(空)
  4. 全部替換

在此輸入影像描述

相關內容