Saltar enlaces duros al utilizar TSM Backup

Saltar enlaces duros al utilizar TSM Backup

Necesitamos hacer una copia de seguridad de un sistema de archivos con muchos enlaces duros. Dado que hay varios enlaces físicos para cada archivo "verdadero", nos gustaría omitir todos los enlaces físicos al realizar una copia de seguridad del sistema de archivos para evitar n copias exactas de cada archivo.

La copia de seguridad se realiza utilizando Tivoli Storage Manager Backup y no hemos podido lograr que trate los enlaces físicos como algo más que archivos separados de los que se debe realizar una copia de seguridad uno junto al otro.

En caso de que sea relevante para posibles soluciones, me gustaría señalar que es posible distinguir un vínculo físico de un archivo adecuado por el nombre del archivo:

 foobarbaz-123.ext    # file
 foobarbaz-123-1.ext  # hardlink
 foobarbaz-123-2.ext  # hardlink
 barbazfoo-456.ext    # file
 barbazfoo-456-1.ext  # hardlink
 barbazfoo-456-2.ext  # hardlink
 barbazfoo-456-3.ext  # hardlink

Es decir, todos los enlaces físicos tienen dos guiones en el nombre del archivo, mientras que los archivos adecuados tienen solo uno.

El servidor ejecuta Ubuntu Linux y los archivos están situados en un volumen gfs en nuestra SAN.

Respuesta1

Una lectura rápida de algunos documentos de TSM sugiere "¡No hagas eso!"

Con Unix, un "archivo" es sólo una entrada de directorio que apunta a un inodo. Un "enlace físico" es justo cuando tiene más de una entrada de directorio (punteros) que apuntan a un inodo determinado. Para todos los efectos, estos dos "archivos" son exactamente 100% idénticos.

Los enlaces físicos son un mecanismo bien establecido y comprendido en Unix. Es apropiado y común encontrarlos y es común que el software de respaldo comprenda exactamente qué es un vínculo físico y lo respalde exactamente como debe, como otro indicador de un dato específico, no como un elemento único y novedoso. de datos que resultan ser exactamente iguales que los otros enlaces físicos.

Una búsqueda rápida en Google de tsm y enlaces físicos indica que tsm comprende los enlaces físicos y los documentos advierten específicamente:

Pueden ocurrir problemas si [hace una copia de seguridad|archiva] solo un archivo de un par vinculado. Por ejemplo, los archivos texta y textb contienen un vínculo físico entre sí. Usted archiva texta y luego edita textb y realiza cambios. Si recupera texta, los cambios que realizó en textb se perderán.

Curiosamente, parece que hay dos formas diferentes de realizar copias de seguridad con TSM: copias de seguridad y archivos, y las dos formas parecen tratar los enlaces físicos de manera diferente.

hacer copias de seguridad y restaurar archivos:

Se establece un vínculo físico cuando dos archivos apuntan al mismo archivo de datos. Cuando realiza una copia de seguridad de un archivo que contiene un vínculo físico a otro archivo, TSM almacena tanto la información del vínculo como el archivo de datos en el servidor. Si realiza una copia de seguridad de dos archivos que contienen un vínculo físico entre sí, TSM almacena el mismo archivo de datos con ambos nombres, junto con la información del vínculo.

archivar y restaurar archivos:

Cuando archiva un archivo que contiene un vínculo físico a otro archivo, TSM almacena tanto la información del vínculo como el archivo de datos en el servidor.

A partir de esto, parece que harás explotar tu servidor de respaldo si está "Archivando" cosas y hará lo que quieras si estás "haciendo una copia de seguridad". ¡Deje que IBM lo haga simple!

Respuesta2

En primer lugar, no hay diferencia entre un "archivo adecuado" y un "vínculo físico", el vínculo físico es simplemente otro nombre para el mismo objeto, mientras que un vínculo suave es en realidad un archivo que contiene un puntero al archivo real, razón por la cual un vínculo suave puede cruzar los límites del sistema de archivos y un enlace duro no puede.

Acerca del problema real: eche un vistazo a la opción Excluir y a la opción incluir-excluir-lista en eldocumentación, deberías poder llegar a un acuerdo con ellos. (como exclude /path/to/your/files/*-*-?.*o algo así).

Respuesta3

Sin saber nada sobre Tivoli Storage Manager, no sería posible obtener ningún software que trate los enlaces físicos de manera diferente a los archivos, ya que no existe una diferencia real entre el identificador del archivo original y los otros enlaces físicos. (Es posible crear un script en función de los nombres de los archivos)

Respuesta4

Actualice a TSM 6.1 y active la deduplicación. (Actualmente sólo está disponible con dispositivo tipo ARCHIVO, pero la paciencia es una virtud)

información relacionada