Ich habe versucht, diese Datei zu sortieren. In meiner ersten Spalte erscheinen ständig NAs, und ich kann nicht sagen, warum.
> head Coch_ATAC_peaks.bed
chr1 3181385 3181783
chr1 3389977 3390375
chr1 3456575 3456973
chr1 3661505 3661903
chr1 3903684 3904082
chr1 3916303 3916701
chr1 4316903 4317301
chr1 4322506 4322904
chr1 4402488 4402886
chr1 4416984 4417382
> sort -k 1,1V Coch_ATAC_peaks.bed | head
NA 1050187 1050585
NA 110317 110715
NA 127371 127769
NA 128207 128605
NA 13412 13810
NA 159542 159940
NA 193109 193507
NA 223382 223780
NA 233951 234349
NA 252365 252763
Ich habe diese Datei ursprünglich auf einem Windows-PC erstellt. Ich habe sie mit dos2unix in UNIX konvertiert. Irgendwelche Ideen, woher diese NAs kommen?
Antwort1
Siehe αғsнιηs Kommentar. Ich hatte erwartet, dass die NAs nach Sortierung erstellt werden; sie waren jedoch die ganze Zeit in der Datei vorhanden.
> grep NA Coch_ATAC_peaks.bed
NA 2745 3143
NA 5650 6048
NA 9679 10077
NA 13412 13810
NA 39048 39446
NA 43021 43419
NA 55564 55962
NA 69578 69976
NA 110317 110715
NA 127371 127769
Sobald die NAs entfernt wurden,
> sort -k 1,1 Coch_ATAC_peaks.bed
funktioniert Upstream wie vorgesehen.