目前使用 Word 表作為資料庫 - 有更好的方法嗎?

目前使用 Word 表作為資料庫 - 有更好的方法嗎?

我正在為一本書做一些礦物研究。我最終需要追蹤大約兩千種礦物。目前這是透過約 800 行的 Word 表完成的,其中每行或多或少看起來像這張圖https://imgur.com/a/YDvLXxo

我需要的功能是(a)能夠對任何列集上的表格進行排序(b)查看每行的視覺縮圖(c)但維護圖像的完整分辨率副本(d)並能夠單擊表條目中的任何活動連結。

目前,Word 檔案大小約為 600MB,Word(Office 365 版本)顯然開始出現問題(例如,自動儲存不再起作用,有時我無法選擇文件中的任何內容。)

我目前運行一個 python 程序,該程序讀取 Word 文件並生成 .pdf 文件,因為我需要的輸出是將表格的每一行映射到一個輸出頁面,並適當縮放和定位圖片、註釋和其他屬性。 .pdf 檔案大小約為 2GB,因此我隨後透過 .pdf 檔案壓縮器運行它,並獲得合理的約 200MB 最終輸出。

所以我的問題是,有沒有更好的方法來做到這一點?我確實快速瀏覽了 Access,但無法弄清楚如何讓它處理圖片。

我無法真正將 Word 文件分成兩部分,因為我會失去排序功能。雖然表格完成後,我確實不需要再對其進行排序,但我仍在繼續向表中添加條目,並且排序允許我檢查幾種不同的錯誤類型。

那麼,我可以在 Word 中設定一個標誌來安全地允許「大」檔案嗎?如果是這樣,那麼有沒有一種方法可以具有相同的功能,但每頁有一種礦物,並採用適當的樣式進行良好的格式化?如果不是,我應該換用其他文件軟體嗎? (附註:我最初在 Google 文件中提供了此功能,但它不提供排序功能。附加元件提供了排序功能,但每個元件都在較小的表格上以某種方式損壞。)

答案1

如果您繼續使用 Microsoft Office 產品,則應該使用 Excel 來執行此應用程式。內建排序功能(請參閱螢幕剪輯),文件可以直接儲存為 PDF,一個工作表可以有超過 100 萬行,多個工作表是標準配置,因此您可以將不同工作表上的項目分類為不同類別。我確信可以編寫一個 Python 應用程式來從工作簿中讀取 Excel 資料。

在此輸入影像描述

答案2

由於您已經熟悉 Python,我強烈建議您將專案帶到谷歌表格谷歌應用程式介面

  1. 將表格複製並貼上到新的 Google 試算表中
  2. 熟悉 Sheets API(API 金鑰和身份驗證、Python 連線、存取和讀取表格)
  3. 展開您的 Python 腳本以從表格中取得資料並產生 PDF

如今,為 Google Sheets 製作 Python 腳本是一項強大的資料科學技能,因為 Google Sheets 非常靈活、高效,並且可以像線上資料庫一樣運作。

這是一個適合初學者的很好的影片教學:Google Sheets - Python API,讀取和寫入資料 (YouTube)

乾杯!

答案3

簡單的答案似乎是Word 表格具有我需要的功能(每個表格行都會根據包括圖像在內的內容進行調整,排序很容易,單元格內的連結有效),因此我只需小心不要超過任何隱藏文件大小限制。

另一種方法是找到其他一些支援從 Word 準確匯入的優秀文件編輯器。

只要 Excel 將單元格中的圖像視為物件而不是值,Excel 將無法用於我的目的。

相關內容