我正在為一本書做一些礦物研究。我最終需要追蹤大約兩千種礦物。目前這是透過約 800 行的 Word 表完成的,其中每行或多或少看起來像這張圖
我需要的功能是(a)能夠對任何列集上的表格進行排序(b)查看每行的視覺縮圖(c)但維護圖像的完整分辨率副本(d)並能夠單擊表條目中的任何活動連結。
目前,Word 檔案大小約為 600MB,Word(Office 365 版本)顯然開始出現問題(例如,自動儲存不再起作用,有時我無法選擇文件中的任何內容。)
我目前運行一個 python 程序,該程序讀取 Word 文件並生成 .pdf 文件,因為我需要的輸出是將表格的每一行映射到一個輸出頁面,並適當縮放和定位圖片、註釋和其他屬性。 .pdf 檔案大小約為 2GB,因此我隨後透過 .pdf 檔案壓縮器運行它,並獲得合理的約 200MB 最終輸出。
所以我的問題是,有沒有更好的方法來做到這一點?我確實快速瀏覽了 Access,但無法弄清楚如何讓它處理圖片。
我無法真正將 Word 文件分成兩部分,因為我會失去排序功能。雖然表格完成後,我確實不需要再對其進行排序,但我仍在繼續向表中添加條目,並且排序允許我檢查幾種不同的錯誤類型。
那麼,我可以在 Word 中設定一個標誌來安全地允許「大」檔案嗎?如果是這樣,那麼有沒有一種方法可以具有相同的功能,但每頁有一種礦物,並採用適當的樣式進行良好的格式化?如果不是,我應該換用其他文件軟體嗎? (附註:我最初在 Google 文件中提供了此功能,但它不提供排序功能。附加元件提供了排序功能,但每個元件都在較小的表格上以某種方式損壞。)
答案1
答案2
由於您已經熟悉 Python,我強烈建議您將專案帶到谷歌表格與谷歌應用程式介面。
- 將表格複製並貼上到新的 Google 試算表中
- 熟悉 Sheets API(API 金鑰和身份驗證、Python 連線、存取和讀取表格)
- 展開您的 Python 腳本以從表格中取得資料並產生 PDF
如今,為 Google Sheets 製作 Python 腳本是一項強大的資料科學技能,因為 Google Sheets 非常靈活、高效,並且可以像線上資料庫一樣運作。
這是一個適合初學者的很好的影片教學:Google Sheets - Python API,讀取和寫入資料 (YouTube)
乾杯!
答案3
簡單的答案似乎是Word 表格具有我需要的功能(每個表格行都會根據包括圖像在內的內容進行調整,排序很容易,單元格內的連結有效),因此我只需小心不要超過任何隱藏文件大小限制。
另一種方法是找到其他一些支援從 Word 準確匯入的優秀文件編輯器。
只要 Excel 將單元格中的圖像視為物件而不是值,Excel 將無法用於我的目的。