Procure por páginas de manual que contenham TODAS as palavras 'foo' 'bar' e 'baz'

Procure por páginas de manual que contenham TODAS as palavras 'foo' 'bar' e 'baz'

Gostaria de procurar páginas de manual que contenham TODAS as palavras 'foo', 'bar' e 'baz'.

Se possível, gostaria de pesquisar todo o texto (não apenas nome e descrição) de todas as páginas de manual.

Estou supondo algo como

man -K foo AND bar AND baz

Responder1

Implementei um script que faz exatamente isso.

if [ $# -eq 0 ]; then
  PATTERNS=(NAME AUTHOR EXAMPLES FILES)
else
  PATTERNS=( "$@" )
fi

[ ${#PATTERNS[@]} -lt 1 ] && echo "Needs at least 1 pattern to search for" && exit 1

for i in $(find /usr/share/man/ -type f); do
  TMPOUT=$(zgrep -l "${PATTERNS[0]}" "$i")
  [ -z "$TMPOUT" ] && continue

  for c in `seq 1 $((${#PATTERNS[@]}-1))`; do
    TMPOUT=$(echo "$TMPOUT" | xargs zgrep -l "${PATTERNS[$c]}")
    [ -z "$TMPOUT" ] && break
  done

  if [ ! -z "$TMPOUT" ]; then
    #echo "$TMPOUT" # Prints the whole path
    MANNAME="$(basename "$TMPOUT")"
    man "${MANNAME%%.*}"
  fi
done

Acho que foi uma perda de tempo :(

Editar: parece

man -K expr1 expr2 expr3

não funcionou?

Editar: você pode passar os scripts agora para seus termos de pesquisa via./script foo bar

Responder2

Algumas reflexões sobre o script:

  • Usando manpathpara obter a(s) localização(ões) das páginas de manual. Se eu adicionar /home/graeme/.cabal/binao meu PATH, manpath(e man) encontrarei páginas de manual em /home/graeme/.cabal/share/man.

  • Use o próprio man para descompactar e formatar as páginas antes de pesquisar, desta forma você está apenas pesquisando o próprio texto do man e não quaisquer comentários, etc., no arquivo bruto. O uso manpotencialmente lidará com vários formatos.

  • Salvar as páginas formatadas em um arquivo temporário evitará descompactações múltiplas e deverá acelerar significativamente as coisas.

Aqui vai (com bashe GNU find):

#!/bin/bash

set -f; IFS=:
trap 'rm -f "$temp"' EXIT
temp=$(mktemp --tmpdir search_man.XXXXXXXXXX)

while IFS= read -rd '' file; do
  man "$file" >"$temp" 2>/dev/null

  unset fail
  for arg; do
    if ! grep -Fq -- "$arg" "$temp"; then
      fail=true
      break
    fi
  done

  if [ -z "$fail" ]; then
    file=${file##*/}
    printf '%s\n' "${file%.gz}"
  fi
done < <(find $(manpath) -type d ! -name 'man*' -prune -o -type f -print0)

Responder3

Não tão completo quanto a resposta do @polym, mas eu sugeriria algo como

while IFS= read -rd $'\0' f; do 
  zgrep -qwm1 'foo' "$f" && \
  zgrep -qwm1 'bar' "$f" && \
  zgrep -qwm1 'baz' "$f" && \
  printf '%s\n' "$f"
done < <(find /usr/share/man -name '*.gz' -print0)

Observe que adicionei uma -wopção (correspondência de palavra) ao greps- que pode não ser o que você deseja (você deseja incluir correspondências comofoolish e nozbar?)

Responder4

Esta abordagem não foi testada, mas é bastante simples (estupidamente simples) e espero que funcione, mesmo que seja ineficiente:

#!/bin/bash

if [ "$#" -eq 0 ]; then
  echo "Provide arguments to search all man pages for all arguments." >&2
  echo "Putting rare search terms first will improve performance." >&2
  exit
fi

if [ "$#" -eq 1 ]; then
  exec man -K "$@"
fi

pages=( $(man -wK "$1") )
shift
while [ "$#" -gt 1 ]; do
  pages=( $(zgrep -l "$1" "${pages[@]}") )
  shift
done
exec man "${pages[@]}"

informação relacionada