Zählen von Werten zwischen zwei durch zwei Spalten definierten Werten

Question 1

Tragen Sie jeden Wert in eine Zeile ein, aber markieren Sie „Start“ und „Ende“, indem Sie sie anhängen Soder E. Sortieren Sie die Werte nun numerisch. Sie erhalten dann etwa Folgendes:

Zählen Sie die Vorkommen zwischen einem Sund einem Ebeendeten Wert.

Schreiben Sie das Drehbuch und seien Sie glücklich!

awk '
    {print $1} 
    $3!="" {print $2"S"; print $3"E"} 
' final_exons.txt | sort -n | awk '
    !/E|S/ {count++; next}
    /S/ {count=0; next}
    /E/ {print line++": "count}'

Das erste awkund sortführen Sie Schritt 1 aus. Es gibt einen $3!=""Test (es könnte auch sein $2!=""), weil in der 1. Spalte mehr Zeilen stehen als in der 2. oder 3.

Der zweite awkentspricht Schritt 2. Er setzt den Zähler zurück, wenn er Zeilen mit liest S, erhöht ihn, wenn die Zeile keine Markierung hat, und druckt ihn (zusammen mit der Zeilennummer), wenn er Zeilen mit liest E.

Die Ausgabe beim Ausführen der von Ihnen bereitgestellten Beispieldatei lautet 0: 12; 1: 5; 2: 4; 3: 2; ...; 22: 0:

Answer

Tragen Sie jeden Wert in eine Zeile ein, aber markieren Sie „Start“ und „Ende“, indem Sie sie anhängen Soder E. Sortieren Sie die Werte nun numerisch. Sie erhalten dann etwa Folgendes:

Zählen Sie die Vorkommen zwischen einem Sund einem Ebeendeten Wert.

Schreiben Sie das Drehbuch und seien Sie glücklich!

awk '
    {print $1} 
    $3!="" {print $2"S"; print $3"E"} 
' final_exons.txt | sort -n | awk '
    !/E|S/ {count++; next}
    /S/ {count=0; next}
    /E/ {print line++": "count}'

Das erste awkund sortführen Sie Schritt 1 aus. Es gibt einen $3!=""Test (es könnte auch sein $2!=""), weil in der 1. Spalte mehr Zeilen stehen als in der 2. oder 3.

Der zweite awkentspricht Schritt 2. Er setzt den Zähler zurück, wenn er Zeilen mit liest S, erhöht ihn, wenn die Zeile keine Markierung hat, und druckt ihn (zusammen mit der Zeilennummer), wenn er Zeilen mit liest E.

Die Ausgabe beim Ausführen der von Ihnen bereitgestellten Beispieldatei lautet 0: 12; 1: 5; 2: 4; 3: 2; ...; 22: 0:

Question 2

Ich könnte ein awk gebrauchen:

awk '{if( ($1 > $2) && ($1 < $3) ){print NR" "$1" "$2" "$3}}' final_exons.txt

Wenn jedoch col1 und (col2 und col3) separat behandelt werden, ist es besser, sie in separate Dateien aufzuteilen. Oder Sie legen die Daten in die Datenbank und führen dann den Intervalltest darin durch. Der effizienteste Weg könnte jedoch sein, die Daten in das reguläre Array zu laden und die Testschleifen in einer anderen Skriptsprache (PHP, Python, Perl ...) auszuführen.

Answer

Ich könnte ein awk gebrauchen:

awk '{if( ($1 > $2) && ($1 < $3) ){print NR" "$1" "$2" "$3}}' final_exons.txt

Wenn jedoch col1 und (col2 und col3) separat behandelt werden, ist es besser, sie in separate Dateien aufzuteilen. Oder Sie legen die Daten in die Datenbank und führen dann den Intervalltest darin durch. Der effizienteste Weg könnte jedoch sein, die Daten in das reguläre Array zu laden und die Testschleifen in einer anderen Skriptsprache (PHP, Python, Perl ...) auszuführen.

Zählen von Werten zwischen zwei durch zwei Spalten definierten Werten

Antwort1

Antwort2

verwandte Informationen