Necesito hacer algo muy similar a esto.Reemplazar cadena con índice secuencial, pero no necesito agregar un número a una columna, sino sustituir una columna completa con números incrementales. Como esto:
0 0 chr1 3000575 3000801 0 chr1 4340023 4340249 32 32
0 0 chr1 3000641 3000801 -1 chr1 3311943 3311783 32 32
0 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
0 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
0 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
se convierte
0 0 chr1 3000575 3000801 0 chr1 4340023 4340249 32 32
1 0 chr1 3000641 3000801 -1 chr1 3311943 3311783 32 32
2 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
3 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
4 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
(No me importa si comienza con 0 o 1)
Me siento muy estúpido, pero no puedo ajustar la solución de esa pregunta a mi caso...
Respuesta1
Para numerar rectas, puedes usar nl
. Para eliminar columnas (o más bien filtrar las que desea conservar), puede usar cut
:
$ cut -f 2- cols.txt | nl
1 0 chr1 3000575 3000801 0 chr1 4340023 4340249 32 32
2 0 chr1 3000641 3000801 -1 chr1 3311943 3311783 32 32
3 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
4 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
5 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
Lo único molesto nl
es que inserta relleno de espacios al inicio de la línea (de forma predeterminada, el campo de número de línea tiene 6 caracteres de ancho y no desea reducirlo porque truncaría los números de línea). Podemos deshacernos de estos de esta manera:
$ cut -f 2- cols.txt | nl | sed 's/^ *//'
1 0 chr1 3000575 3000801 0 chr1 4340023 4340249 32 32
2 0 chr1 3000641 3000801 -1 chr1 3311943 3311783 32 32
3 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
4 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
5 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
La cut
utilidad toma una lista de columnas que desea "eliminar" de la entrada. En nuestro caso son las columnas 2 en adelante ( -f 2-
). Dado que sus datos están delimitados por tabulaciones, cut
lo hará sin modificaciones; de lo contrario, es posible indicarle que use otro delimitador con -d
.
El sed
comando simplemente sustituirá esos espacios al comienzo de la línea sin nl
nada.
Respuesta2
Conawk
$ awk '{$1=FNR-1; print}' OFS='\t' file
0 0 chr1 3000575 3000801 0 chr1 4340023 4340249 32 32
1 0 chr1 3000641 3000801 -1 chr1 3311943 3311783 32 32
2 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
3 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
4 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
Respuesta3
Con ed
(usando una tabulación literal, compuesta como Ctrl-V+ TAB, en la sustitución)
$ ed -s file << EOF
,s/0 //
,n
q
EOF
1 0 chr1 3000575 3000801 0 chr1 4340023 4340249 32 32
2 0 chr1 3000641 3000801 -1 chr1 3311943 3311783 32 32
3 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
4 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
5 0 chr1 3000674 3000801 -1 chr1 3001534 3001407 32 32
El (.,.)n
comando imprime las líneas direccionadas, precediendo cada línea por su número de línea y una tabulación, perfecto para su formato delimitado por tabulaciones.