Tenho tentado classificar este arquivo, continuo recebendo NAs na minha primeira coluna e não sei dizer por quê.
> head Coch_ATAC_peaks.bed
chr1 3181385 3181783
chr1 3389977 3390375
chr1 3456575 3456973
chr1 3661505 3661903
chr1 3903684 3904082
chr1 3916303 3916701
chr1 4316903 4317301
chr1 4322506 4322904
chr1 4402488 4402886
chr1 4416984 4417382
> sort -k 1,1V Coch_ATAC_peaks.bed | head
NA 1050187 1050585
NA 110317 110715
NA 127371 127769
NA 128207 128605
NA 13412 13810
NA 159542 159940
NA 193109 193507
NA 223382 223780
NA 233951 234349
NA 252365 252763
Originalmente, criei este arquivo em um PC com Windows. Eu converti para UNIX com dos2unix. Alguma ideia de onde vêm esses NAs?
Responder1
Veja o comentário de αғsнιη. Eu esperava que as NAs fossem criadas por tipo; no entanto, eles estavam presentes no arquivo o tempo todo.
> grep NA Coch_ATAC_peaks.bed
NA 2745 3143
NA 5650 6048
NA 9679 10077
NA 13412 13810
NA 39048 39446
NA 43021 43419
NA 55564 55962
NA 69578 69976
NA 110317 110715
NA 127371 127769
Depois que os NAs foram removidos, o upstream
> sort -k 1,1 Coch_ATAC_peaks.bed
funciona conforme planejado.