メモ帳で書式を削除できない、PureText が YouTube で機能しない

メモ帳で書式を削除できない、PureText が YouTube で機能しない

例えばYouTubeのリンクにアクセスするとhttp://www.youtube.com/watch?v=1Jfm-92JXVEいくつかのコメントをメモ帳にコピーしたいのですが、一部のテキストが他のテキストよりも小さいままになっています。

すべてを選択して PureText ショートカット キーを実行しても、書式設定は削除されません。すべてを選択して、すべてを 1 つのフォントとフォント サイズ (すでに変更済み) に「変更」しても、すべてが 1 つのサイズにはなりません。

ここに画像の説明を入力してください

ここに画像の説明を入力してください

答え1

テキストには書式設定はありませんが、テキストには Unicode 文字が含まれているようです (どの文字かはわかりません)。これが問題の原因ではないかと推測しています。これらを削除する簡単な方法は、テキスト ファイルを ASCII として保存し、再度開くことです。

答え2

これらの範囲外の文字を見つけて、どうするかを決めることができます。中には、中括弧の文字もあります。それらをまっすぐな引用符に置き換えたいかもしれません。しかし、メモ帳でうまく処理できない厄介な文字もあるので、削除したいかもしれません。

メモ帳++の場合は、[\x{0080}-\x{FFFF}]

検索/置換を行えるように、置換タブをクリックすることに注意してください。

ここに画像の説明を入力してください

上記で十分でしょうが、さらに説明が必要です

ASCII の範囲は 0000h-007Fh、つまり base10、0-127 です。したがって、それ以外の Unicode、つまり 128 以上、つまり 80h-FFFFh を検索すると、それらの文字を見つけることができます。正規表現の構文には文字範囲の概念があるため、[AZ] は Unicode の A から Z までの任意の文字になります。また、notepad++ では、utf-16 コードの文字を \x{...} の表記で指定します。... は 16 進数なので、16 進数が 41 の 'A' の場合は \x{0041} と指定します。Editpad では \u.... たとえば を使用します\u0041。したがって、editpad pro では とします[\u0080-\uFFFF]。notepad++ では、上の図のように行います。 [\x{0080}-\x{FFFF}] 正規表現の構文の側面は同じですが、文字の指定方法はテキスト エディターによって異なります。

答え3

何らかの理由でメモ帳に何でも入れることができ、保存せずにすべての書式設定が削除されます。プレーンテキストを除いて、いくつかのタブのみが残ります。Win 7 Home Premiumバージョン6.1 SP1を使用するその他のヒント http://www.techsupportalert.com/remove-unwanted-formatting-from-text.htm そして http://blog.eogn.com/eastmans_online_genealogy/2011/07/remove-text-formatting-when-copying-and-pasting.html

答え4

R4D4 の回答に基づいて、次の方法を提案します (どちらか/両方が私の場合は機能しました)。

1) Windows のメモ帳を使用する:

  • (a) Windowsのメモ帳でテキストを新しいファイルに貼り付けます
  • (b) ソフトハイフンのような、意図しない/隠れた文字を削除します(このスレッドの barlop の回答を参照してください:YouTube からクリップボードにテキストをコピーするとダッシュが導入されますか?
  • (c) ANSI ファイルとして保存します (注意: テキストに Unicode 文字が含まれている場合は警告メッセージが表示されます。[OK] をクリックします)
  • (d) 前の手順で作成したANSIファイルを開く
  • (e)テキストをコピーして目的の場所に貼り付けます

2) Notepad++を使用する

  • (a) テキストをNotepad++の新しいファイルに貼り付けます
  • (b)現れる奇妙な文字を削除する**
  • (c)エンコードをUTF-8からANSIに変更する
  • (d)再度、出現する可能性のある奇妙な文字を削除します
  • (e)テキストをコピーして目的の場所に貼り付けます

**これは、Notepad++ の設定がデフォルトに従って、UTF-8 エンコードで新しいファイルを作成することを前提としています。問題のある文字の中には ANSI では奇妙に見えず、UTF-8 では見つけやすいものもあるため、両方のエンコードで意図しない文字をチェックする必要があるかもしれません (ソフトハイフンなど: このスレッドの barlop の回答を参照してください:YouTube からクリップボードにテキストをコピーするとダッシュが導入されますか?)。

関連情報