Extrahieren Sie mit Perl Text zwischen Schlüsselwörtern in einer Datei

Question 1

Ich denke, Sie müssen Ihren regulären Ausdruck ändern. „\ability“ und „\skill“ sind wahrscheinlich nicht das, was Sie wollen. „\a“ ist das Zeichen für „Glocke“ und „\s“ entspricht einem Leerzeichen.

Die Textteile, die Sie erfassen möchten, können mit einem geeigneten Teil des regulären Ausdrucks abgeglichen werden, der in Klammern eingeschlossen ist. Wenn der gesamte RE eine Übereinstimmung gefunden hat, können die teilweise übereinstimmenden Teile mit $1, $2 usw. abgerufen werden. Vielleicht ... '(\w+)\s+(Fähigkeit|Fertigkeit)\s+(\w+)'

Answer

Ich denke, Sie müssen Ihren regulären Ausdruck ändern. „\ability“ und „\skill“ sind wahrscheinlich nicht das, was Sie wollen. „\a“ ist das Zeichen für „Glocke“ und „\s“ entspricht einem Leerzeichen.

Die Textteile, die Sie erfassen möchten, können mit einem geeigneten Teil des regulären Ausdrucks abgeglichen werden, der in Klammern eingeschlossen ist. Wenn der gesamte RE eine Übereinstimmung gefunden hat, können die teilweise übereinstimmenden Teile mit $1, $2 usw. abgerufen werden. Vielleicht ... '(\w+)\s+(Fähigkeit|Fertigkeit)\s+(\w+)'

Question 2

Ihr Skript enthält viele Fehler. Ich habe es umgeschrieben und vereinfacht.

#!/usr/bin/perl 
use strict;
use warnings;
use Data::Dumper;

# file to search
my $file = 'C:\Users\Acer Nitro\Desktop\perl\sim.txt';
open my $fh, '<', $file or die "unable to open '$file' for reading: $!";
# read whole file in a single string
undef $/;
my $full = <$fh>;
# search text between keywords
my @found = $full =~ /\b(?:ability|skills|experience)\b\R?\K(.+?)(?=\b(?:ability|skills|experience)\b)/gsi;
# dump the result
print Dumper\@found;

Ausgabe für das angegebene Beispiel:

$VAR1 = [
          ' to manage issues, communications and influencing ',
          ',Passion for great technology and user ',
          'Exceptional organizational '
        ];

Regex-Erklärung:

/                       # regex delimiter
    \b                  # word boundary
    (?:                 # non capture group
        ability         # literally
      |                 # OR
        skills          # literally
      |                 # OR
        experience      # literally
    )                   # end group
    \b                  # word boundary
    \R?                 # optional linebreak
    \K                  # forget all we have seen until this position
    (.+?)               # group 1, the text we want
    (?=                 # positive lookahead
        \b              # word boundary
        (?:             # non capture group
            ability     # literally
          |             # OR
            skills      # literally
          |             # OR
            experience  # literally
        )               # end group
        \b              # word boundary
    )                   # end lookahead
/gsi                    # delimiter, global; dot matches newline; case insensitive

Answer

Ihr Skript enthält viele Fehler. Ich habe es umgeschrieben und vereinfacht.

#!/usr/bin/perl 
use strict;
use warnings;
use Data::Dumper;

# file to search
my $file = 'C:\Users\Acer Nitro\Desktop\perl\sim.txt';
open my $fh, '<', $file or die "unable to open '$file' for reading: $!";
# read whole file in a single string
undef $/;
my $full = <$fh>;
# search text between keywords
my @found = $full =~ /\b(?:ability|skills|experience)\b\R?\K(.+?)(?=\b(?:ability|skills|experience)\b)/gsi;
# dump the result
print Dumper\@found;

Ausgabe für das angegebene Beispiel:

$VAR1 = [
          ' to manage issues, communications and influencing ',
          ',Passion for great technology and user ',
          'Exceptional organizational '
        ];

Regex-Erklärung:

/                       # regex delimiter
    \b                  # word boundary
    (?:                 # non capture group
        ability         # literally
      |                 # OR
        skills          # literally
      |                 # OR
        experience      # literally
    )                   # end group
    \b                  # word boundary
    \R?                 # optional linebreak
    \K                  # forget all we have seen until this position
    (.+?)               # group 1, the text we want
    (?=                 # positive lookahead
        \b              # word boundary
        (?:             # non capture group
            ability     # literally
          |             # OR
            skills      # literally
          |             # OR
            experience  # literally
        )               # end group
        \b              # word boundary
    )                   # end lookahead
/gsi                    # delimiter, global; dot matches newline; case insensitive

Extrahieren Sie mit Perl Text zwischen Schlüsselwörtern in einer Datei

Antwort1

Antwort2

verwandte Informationen