Überprüfen Sie, ob die Zeichenfolge in einer Liste vorhanden ist, und geben Sie eine dritte Datei aus, wenn die Zeichenfolge vorhanden ist.

Question 1

Dies lässt sich unkompliziert in awk ausdrücken:

awk 'FNR==NR { h[$1]; next } { for(i=2; i<=NF; i++) $i = ($i in h)? 1 : 0 } 1' mylist.tab data.tab

Oder in einem besser lesbaren Format:

parse.awk

# Collect mylist.tab into the `h` associative array
FNR==NR {
  h[$1]
  next
}

# For all but the first column in data.tab check and record if it is in `h`
{ 
  for(i=2; i<=NF; i++) 
    $i = ($i in h) ? 1 : 0 
}

# Short for { print $0 }
1

Führen Sie es wie folgt aus:

awk -f parse.awk mylist.tab data.tab

Ausgabe:

Info_1 0 1 1
Info_2 1 0
Info_3 1
Info_4 1 0 0 0 1
Info_5

Oder für tabulatorgetrennte Spalten:

awk -v OFS='\t' -f parse.awk mylist.tab data.tab

Ausgabe:

Info_1  0   1   1
Info_2  1   0
Info_3  1
Info_4  1   0   0   0   1
Info_5

Answer

Dies lässt sich unkompliziert in awk ausdrücken:

awk 'FNR==NR { h[$1]; next } { for(i=2; i<=NF; i++) $i = ($i in h)? 1 : 0 } 1' mylist.tab data.tab

Oder in einem besser lesbaren Format:

parse.awk

# Collect mylist.tab into the `h` associative array
FNR==NR {
  h[$1]
  next
}

# For all but the first column in data.tab check and record if it is in `h`
{ 
  for(i=2; i<=NF; i++) 
    $i = ($i in h) ? 1 : 0 
}

# Short for { print $0 }
1

Führen Sie es wie folgt aus:

awk -f parse.awk mylist.tab data.tab

Ausgabe:

Info_1 0 1 1
Info_2 1 0
Info_3 1
Info_4 1 0 0 0 1
Info_5

Oder für tabulatorgetrennte Spalten:

awk -v OFS='\t' -f parse.awk mylist.tab data.tab

Ausgabe:

Info_1  0   1   1
Info_2  1   0
Info_3  1
Info_4  1   0   0   0   1
Info_5

Question 2

Perl zur Rettung!

Speichern Sie die Listenelemente in einem Hash, lesen Sie dann die Tabelle, teilen Sie sie bei Leerzeichen auf und überprüfen Sie den Hash, um entweder 0 oder 1 auszugeben.

#!/usr/bin/perl
use warnings;
use strict;

my %in_list;
open my $LIST, '<', 'mylist.tab' or die $!;
while (<$LIST>) {
    chomp;
    $in_list{$_} = 1;
}

open my $TAB, '<', 'data.tab';
while (<$TAB>) {
    my @cells = split;
    print shift @cells, "\t";
    print join "\t", map $in_list{$_} ? 1 : 0, @cells;
    print "\n";
}

Answer

Perl zur Rettung!

Speichern Sie die Listenelemente in einem Hash, lesen Sie dann die Tabelle, teilen Sie sie bei Leerzeichen auf und überprüfen Sie den Hash, um entweder 0 oder 1 auszugeben.

#!/usr/bin/perl
use warnings;
use strict;

my %in_list;
open my $LIST, '<', 'mylist.tab' or die $!;
while (<$LIST>) {
    chomp;
    $in_list{$_} = 1;
}

open my $TAB, '<', 'data.tab';
while (<$TAB>) {
    my @cells = split;
    print shift @cells, "\t";
    print join "\t", map $in_list{$_} ? 1 : 0, @cells;
    print "\n";
}

Question 3

Verwenden Sie es sed, um ein sedSkript aus mylist.tab zu erstellen und es auf data.tab auszuführen:

sed \
    -e '1i s/^[ \\t]*//' \
    -e 's@\(.*\)@s/\\([ \\t]\\)\1\\b/\\11/@g' \
    -e '$as/\\([ \\t]\\)[^ \\t]\\{2,\\}\\b/\\10/g' mylist.tab \
    > /tmp/x.sed 
sed -f /tmp/x.sed data.tab

Beachten Sie, dass ich davon ausgehe, dass alle Zeichenfolgen in „mylist.tab“ mindestens 2 Zeichen haben.

Answer

Verwenden Sie es sed, um ein sedSkript aus mylist.tab zu erstellen und es auf data.tab auszuführen:

sed \
    -e '1i s/^[ \\t]*//' \
    -e 's@\(.*\)@s/\\([ \\t]\\)\1\\b/\\11/@g' \
    -e '$as/\\([ \\t]\\)[^ \\t]\\{2,\\}\\b/\\10/g' mylist.tab \
    > /tmp/x.sed 
sed -f /tmp/x.sed data.tab

Beachten Sie, dass ich davon ausgehe, dass alle Zeichenfolgen in „mylist.tab“ mindestens 2 Zeichen haben.

Question 4

Eine andere perlLösung

$ perl -lne 'if(!$#ARGV){ $h{$_}=1 }
             else{ s/\h\K\H+/$h{$&} ? 1 : 0/ge; print }
            ' mylist.tab data.tab
Info_1    0     1     1
Info_2    1     0
Info_3    1
Info_4    1     0     0    0    1
Info_5

if(!$#ARGV){ $h{$_}=1 }Erstellen Sie einen Hash von Wörtern inmylist.tab
s/\h\K\H+/$h{$&} ? 1 : 0/gefür Zeilen in data.tab, ersetzen durch , 1wenn in Hash-Variable vorhanden, sonst 0. Das \h\Kist ein positiver Lookbehind für das Vorhandensein von Leerzeichen, wodurch die Übereinstimmung der ersten Spalte vermieden wird
Drucken Sie dann die geänderte Zeile

Answer

Eine andere perlLösung

$ perl -lne 'if(!$#ARGV){ $h{$_}=1 }
             else{ s/\h\K\H+/$h{$&} ? 1 : 0/ge; print }
            ' mylist.tab data.tab
Info_1    0     1     1
Info_2    1     0
Info_3    1
Info_4    1     0     0    0    1
Info_5

if(!$#ARGV){ $h{$_}=1 }Erstellen Sie einen Hash von Wörtern inmylist.tab
s/\h\K\H+/$h{$&} ? 1 : 0/gefür Zeilen in data.tab, ersetzen durch , 1wenn in Hash-Variable vorhanden, sonst 0. Das \h\Kist ein positiver Lookbehind für das Vorhandensein von Leerzeichen, wodurch die Übereinstimmung der ersten Spalte vermieden wird
Drucken Sie dann die geänderte Zeile

Überprüfen Sie, ob die Zeichenfolge in einer Liste vorhanden ist, und geben Sie eine dritte Datei aus, wenn die Zeichenfolge vorhanden ist.

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen