bash 是否支援參數擴充中的反向引用？

Question 1

ksh93並且內部zsh有反向引用（或更準確地說¹，對替換中捕獲組的引用）支持${var/pattern/replacement}，而不是bash。

ksh93：

$ var='Blah: -> r1-ae0-2 / [123]'
$ printf '%s\n' "${var/*@(->*([[:space:]])+([^[:space:]]))*/\1}"
-> r1-ae0-2

zsh：

$ var='Blah: -> r1-ae0-2 / [123]'
$ set -o extendedglob
$ printf '%s\n' "${var/(#b)*(->[[:space:]]#[^[:space:]]##)*/$match[1]}"
-> r1-ae0-2

（mksh手冊頁還提到未來版本將支援${KSH_MATCH[1]}第一個捕獲組。截至 2017 年 4 月 25 日尚未提供）。

但是，使用bash，您可以執行以下操作：

$ [[ $var =~ -\>[[:space:]]*[^[:space:]]+ ]] &&
  printf '%s\n' "${BASH_REMATCH[0]}"
-> r1-ae0-2

哪個更好，因為它檢查是否首先找到該模式。

如果您的系統的正規表示式支援\s/ \S，您也可以執行以下操作：

re='->\s*\S+'
[[ $var =~ $re ]]

透過zsh，您可以透過以下方式獲得 PCRE 的全部功能：

$ set -o rematchpcre
$ [[ $var =~ '->\s*\S+' ]] && printf '%s\n' $MATCH
-> r1-ae0-2

對於zsh -o extendedglob，另請參見：

$ printf '%s\n' ${(SM)var##-\>[[:space:]]#[^[:space:]]##}
-> r1-ae0-2

便攜：

$ expr " $var" : '.*\(->[[:space:]]*[^[:space:]]\{1,\}\)'
-> r1-ae0-2

如果字串中多次出現該模式，則所有這些解決方案的行為都會有所不同。然而，它們都不會像基於 GNU 的grep解決方案那樣為您提供所有匹配項的換行分隔清單。

為此，您需要手動進行循環。例如，與bash：

re='(->\s*\S+)(.*)'
while [[ $var =~ $re ]]; do
  printf '%s\n' "${BASH_REMATCH[1]}"
  var=${BASH_REMATCH[2]}
done

使用zsh，您可以採用此技巧將所有符合項目儲存在陣列中：

set -o extendedglob
matches=() n=0
: ${var//(#m)->[[:space:]]#[^[:space:]]##/${matches[++n]::=$MATCH}}
printf '%s\n' $matches

¹反向引用更常見的是指定引用較早組匹配的模式。例如，$.$\1基本正則表達式匹配單個字符，後面跟著該同一字符（它匹配 on aa，而不是 on ab）。這是以相同模式\1對該捕獲組的反向引用。$.$

ksh93確實支援其模式中的反向引用（例如ls -d -- @(?)\1將列出由兩個相同字元組成的檔案名稱），而不是其他 shell。標準 BRE 和 PCRE 支援反向引用，但不支援標準 ERE，儘管某些 ERE 實作支援將其作為擴展。bash's[[ foo =~ re ]]使用 ERE。

[[ aa =~ (.)\1 ]]

不會匹配，但是

re='(.)\1'; [[ aa =~ $re ]]

如果系統的 ERE 支援的話可以。

Answer