Actualmente se utiliza una tabla de Word como base de datos. ¿Existe una mejor manera de hacerlo?

Actualmente se utiliza una tabla de Word como base de datos. ¿Existe una mejor manera de hacerlo?

Estoy investigando un poco sobre minerales para un libro. Al final tendré que rastrear unos dos mil minerales. Actualmente, esto se hace mediante una tabla de Word de ~800 líneas donde cada línea se parece más o menos a esta imagen.https://imgur.com/a/YDvLXxo

La funcionalidad que necesito es (a) poder ordenar la tabla en cualquier conjunto de columnas (b) ver la miniatura visual de cada línea (c) pero mantener una copia de resolución completa de la imagen (d) y poder hacer clic en cualquier enlace activo en la entrada de la tabla.

Actualmente, el archivo de Word tiene un tamaño de ~600 MB y Word (versión Office 365) claramente está comenzando a crujir (el guardado automático ya no funciona, por ejemplo, y a veces no puedo seleccionar nada en el documento).

Actualmente ejecuto un programa Python que lee el archivo de Word y produce un archivo .pdf porque el resultado que necesito es asignar cada línea de la tabla a una página de salida, con imágenes, notas y otros atributos escalados y ubicados adecuadamente. El archivo .pdf tiene un tamaño aproximado de ~2 GB, por lo que luego lo ejecuto a través de un reductor de archivos .pdf y obtengo un resultado final razonable de ~200 MB.

Entonces mi pregunta es, ¿hay una mejor manera de hacer esto? Eché un vistazo rápido a Access y no pude descubrir cómo hacer que manejara las imágenes.

Realmente no puedo dividir el archivo de Word en dos porque perdería la función de clasificación. Si bien es cierto que una vez que la tabla esté terminada, ya no necesitaría ordenarla, sigo agregando entradas a la tabla y la clasificación me permite verificar varios tipos de errores diferentes.

Entonces, ¿hay alguna opción que pueda configurar en Word para permitir archivos "grandes" de forma segura? Si es así, ¿hay alguna manera de tener la misma funcionalidad pero tener un mineral por página, bien formateado con estilos apropiados? Si no es así, ¿debería cambiar a algún otro software de documentos? (Nota: originalmente tenía esto en Google Docs, pero no ofrece la función Ordenar. Los complementos ofrecen tipología, pero cada uno se rompe de una forma u otra en una tabla mucho más pequeña).

Respuesta1

Si se queda con un producto de Microsoft Office, debe utilizar Excel para esta aplicación. La clasificación está integrada (ver clip de pantalla), el archivo se puede guardar directamente en PDF, una hoja de trabajo puede tener más de 1 millón de filas, varias hojas de trabajo son estándar para que pueda clasificar elementos en varias categorías en diferentes hojas de trabajo. Y estoy seguro de que se puede escribir una aplicación Python que lea los datos de Excel del libro.

ingrese la descripción de la imagen aquí

Respuesta2

Como ya está familiarizado con Python, le recomiendo encarecidamente que lleve su proyecto aHojas de cálculo de Googlecon elAPI de Google.

  1. Copie y pegue su tabla en una nueva tabla de Hojas de cálculo de Google
  2. Familiarícese con la API de Sheets (clave y autenticación de API, conexión Python, acceso y lectura de su tabla)
  3. Expanda su secuencia de comandos Python para recuperar los datos de Hojas de cálculo y generar su PDF

Crear scripts de Python para Google Sheets es una habilidad poderosa en ciencia de datos hoy en día, porque Google Sheets es muy flexible, eficiente y puede funcionar como una base de datos en línea.

Aquí hay un buen video tutorial para empezar:Hojas de cálculo de Google: API de Python, lectura y escritura de datos (YouTube)

¡Salud!

Respuesta3

La respuesta simple parece ser que las tablas de Word tienen la funcionalidad que necesito (cada fila de la tabla se ajusta al contenido, incluida la imagen, la clasificación es fácil, los enlaces dentro de las celdas funcionan), por lo que tendré que tener cuidado de no exceder los límites de tamaño de archivos ocultos.

Una alternativa sería encontrar algún otro buen editor de documentos que admita la importación desde Word con precisión.

Mientras Excel trate las imágenes en las celdas como objetos en lugar de valores, Excel será inutilizable para mi propósito.

información relacionada