Sortieren und Ersetzen von Spaltenwerten durch NA

Sortieren und Ersetzen von Spaltenwerten durch NA

Ich habe versucht, diese Datei zu sortieren. In meiner ersten Spalte erscheinen ständig NAs, und ich kann nicht sagen, warum.

> head Coch_ATAC_peaks.bed
chr1    3181385 3181783
chr1    3389977 3390375
chr1    3456575 3456973
chr1    3661505 3661903
chr1    3903684 3904082
chr1    3916303 3916701
chr1    4316903 4317301
chr1    4322506 4322904
chr1    4402488 4402886
chr1    4416984 4417382

> sort -k 1,1V Coch_ATAC_peaks.bed | head
NA      1050187 1050585
NA      110317  110715
NA      127371  127769
NA      128207  128605
NA      13412   13810
NA      159542  159940
NA      193109  193507
NA      223382  223780
NA      233951  234349
NA      252365  252763

Ich habe diese Datei ursprünglich auf einem Windows-PC erstellt. Ich habe sie mit dos2unix in UNIX konvertiert. Irgendwelche Ideen, woher diese NAs kommen?

Antwort1

Siehe αғsнιηs Kommentar. Ich hatte erwartet, dass die NAs nach Sortierung erstellt werden; sie waren jedoch die ganze Zeit in der Datei vorhanden.

> grep NA Coch_ATAC_peaks.bed
NA      2745    3143
NA      5650    6048
NA      9679    10077
NA      13412   13810
NA      39048   39446
NA      43021   43419
NA      55564   55962
NA      69578   69976
NA      110317  110715
NA      127371  127769

Sobald die NAs entfernt wurden, > sort -k 1,1 Coch_ATAC_peaks.bed funktioniert Upstream wie vorgesehen.

verwandte Informationen