LibreOffice Calc »regex« 関数 – どの正規表現形式が適用可能でしょうか?

Question

リストには正規表現LibreOffice でサポートされているため、標準的な表現のほとんどはサポートされていますが、使用する要素のうち 2 つが欠落しています。

?:非捕捉グループに対するの使用。

?!否定的な先読みのためのの使用。

                  1              1  2
                  |              |  |
                  v              v  v
\b(10[.][0-9]{4,}(?:[.][0-9]+)*/(?:(?!["&'<>])\S)+)\b

これがどのレベルの RE を表しているかはわかりませんが (追加された BRE のようです)、RE がテスト文字列と一致しないことを意味します。

分離しようとしている数字が文字列のどの程度を占めるかは不明なので、サポートされていない要素を回避する方法を提案することはできませんが、次のような可能性が考えられます。

doi:との間の数値文字列が必要な場合は/、より単純なもので\b10[.][0-9]{4,}(?:[.][0-9]+)*十分です。
doi:と次のスペースの間にあるすべてが必要な場合は、を使用できます\b10[.][0-9]{4,}(?:[.][0-9]+)*[^\s]*。

（この2番目のケースは、正規表現。

ライブデータには捕捉する必要がある例外がさらに存在する可能性があることは承知していますが、データと一致させようとしている数値を完全に把握していないと、それ以上のことはできません。

Answer 1