Sustituir un archivo de texto de columna i con números incrementales

Sustituir un archivo de texto de columna i con números incrementales

Necesito hacer algo muy similar a esto.Reemplazar cadena con índice secuencial, pero no necesito agregar un número a una columna, sino sustituir una columna completa con números incrementales. Como esto:

0   0   chr1    3000575 3000801 0   chr1    4340023 4340249 32  32  
0   0   chr1    3000641 3000801 -1  chr1    3311943 3311783 32  32  
0   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32  
0   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32  
0   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32

se convierte

0   0   chr1    3000575 3000801 0   chr1    4340023 4340249 32  32  
1   0   chr1    3000641 3000801 -1  chr1    3311943 3311783 32  32  
2   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32  
3   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32  
4   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32

(No me importa si comienza con 0 o 1)

Me siento muy estúpido, pero no puedo ajustar la solución de esa pregunta a mi caso...

Respuesta1

Para numerar rectas, puedes usar nl. Para eliminar columnas (o más bien filtrar las que desea conservar), puede usar cut:

$ cut -f 2- cols.txt | nl
     1  0       chr1    3000575 3000801 0       chr1    4340023 4340249 32      32
     2  0       chr1    3000641 3000801 -1      chr1    3311943 3311783 32      32
     3  0       chr1    3000674 3000801 -1      chr1    3001534 3001407 32      32
     4  0       chr1    3000674 3000801 -1      chr1    3001534 3001407 32      32
     5  0       chr1    3000674 3000801 -1      chr1    3001534 3001407 32      32

Lo único molesto nles que inserta relleno de espacios al inicio de la línea (de forma predeterminada, el campo de número de línea tiene 6 caracteres de ancho y no desea reducirlo porque truncaría los números de línea). Podemos deshacernos de estos de esta manera:

$ cut -f 2- cols.txt | nl | sed 's/^ *//'
1       0       chr1    3000575 3000801 0       chr1    4340023 4340249 32      32
2       0       chr1    3000641 3000801 -1      chr1    3311943 3311783 32      32
3       0       chr1    3000674 3000801 -1      chr1    3001534 3001407 32      32
4       0       chr1    3000674 3000801 -1      chr1    3001534 3001407 32      32
5       0       chr1    3000674 3000801 -1      chr1    3001534 3001407 32      32

La cututilidad toma una lista de columnas que desea "eliminar" de la entrada. En nuestro caso son las columnas 2 en adelante ( -f 2-). Dado que sus datos están delimitados por tabulaciones, cutlo hará sin modificaciones; de lo contrario, es posible indicarle que use otro delimitador con -d.

El sedcomando simplemente sustituirá esos espacios al comienzo de la línea sin nlnada.

Respuesta2

Conawk

$ awk '{$1=FNR-1; print}' OFS='\t' file
0   0   chr1    3000575 3000801 0   chr1    4340023 4340249 32  32
1   0   chr1    3000641 3000801 -1  chr1    3311943 3311783 32  32
2   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32
3   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32
4   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32

Respuesta3

Con ed(usando una tabulación literal, compuesta como Ctrl-V+ TAB, en la sustitución)

$ ed -s file << EOF
,s/0    //
,n
q
EOF

1   0   chr1    3000575 3000801 0   chr1    4340023 4340249 32  32  
2   0   chr1    3000641 3000801 -1  chr1    3311943 3311783 32  32  
3   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32  
4   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32  
5   0   chr1    3000674 3000801 -1  chr1    3001534 3001407 32  32

El (.,.)ncomando imprime las líneas direccionadas, precediendo cada línea por su número de línea y una tabulación, perfecto para su formato delimitado por tabulaciones.

información relacionada