HTML 形式の電子メールをテキストに変換できるユーティリティがあるかどうか疑問に思います。html2text のようなユーティリティは問題ありませんが、返信メール (つまり、「>」を含むメール) の折り返しをうまく処理できません。
たとえば、次の行:
> 電子メールアドレスの国際化により、より広範囲の 現行の検証アルゴリズムの多くでは、Unicodeのすべての文字が許容されない。
次のようにラップする必要があります。
> メールアドレスの国際化 > より広範囲の > 現在の検証よりも多くの文字 > アルゴリズムにより、