私は本のために鉱物について調査しています。最終的には約 2,000 種類の鉱物を追跡する必要があります。これは現在、約 800 行の Word テーブルで行われ、各行は多かれ少なかれこの図のようになります。
必要な機能は、(a) 任意の列セットでテーブルを並べ替えることができ、(b) 各行のビジュアルサムネイルが表示され、(c) 画像のフル解像度のコピーが維持され、(d) テーブルエントリ内のアクティブなリンクをクリックできることです。
現在、Word ファイルのサイズは約 600 MB で、Word (Office 365 バージョン) は明らかに不具合が出始めています (たとえば、自動保存が機能しなくなり、ドキュメント内で何も選択できなくなることがあります)。
現在、Word ファイルを読み込んで .pdf ファイルを作成する Python プログラムを実行しています。必要な出力は、表の各行を 1 つの出力ページにマッピングし、画像、メモ、その他の属性を適切に拡大縮小して配置することだからです。.pdf ファイルのサイズは約 2 GB なので、後で .pdf ファイル シュリンク ツールに通して、妥当な 200 MB の最終出力を得ています。
そこで質問なのですが、これを実行するより良い方法はあるのでしょうか? Access をざっと調べてみましたが、画像を処理する方法がわかりませんでした。
並べ替え機能が失われるため、Word ファイルを 2 つに分割することはできません。表が完成したら並べ替える必要がなくなるのは事実ですが、表にエントリを追加し続けるため、並べ替えによって複数の異なるエラー タイプをチェックできます。
では、Word で「大きな」ファイルを安全に許可するためのフラグを設定できるでしょうか。もしあるなら、同じ機能を持ちながら、適切なスタイルできれいにフォーマットされた 1 ページあたり 1 つのミネラルを持つ方法はありますか。もしない場合は、他のドキュメント ソフトウェアに切り替える必要がありますか。(注: 元々は Google Docs でこの機能を持っていましたが、並べ替え機能は提供されていません。アドオンで並べ替えが提供されていましたが、それぞれがかなり小さいテーブルで何らかの形で壊れていました。)
答え1
答え2
すでにPythonに精通しているので、プロジェクトをPythonに持ち込むことを強くお勧めします。Google スプレッドシートとともにGoogle API。
- 表をコピーして新しい Google スプレッドシートの表に貼り付けます
- Sheets API(API キーと認証、Python 接続、テーブルへのアクセスと読み取り)について理解を深めます。
- Python スクリプトを拡張して、スプレッドシートからデータを取得し、PDF を生成します。
Google スプレッドシートは非常に柔軟かつ効率的で、オンライン データベースのように機能するため、Google スプレッドシート用の Python スクリプトを作成することは、今日では強力なデータ サイエンス スキルです。
初心者向けの良いビデオチュートリアルはこちらです:Google スプレッドシート - Python API、データの読み取りと書き込み (YouTube)
乾杯!
答え3
簡単な答えは、Word の表には必要な機能 (表の各行が画像を含むコンテンツに合わせて調整され、並べ替えが簡単、セル内のリンクが機能する) が備わっているため、非表示のファイル サイズ制限を超えないように注意する必要があるということのようです。
別の方法としては、Word からのインポートを正確にサポートする他の優れたドキュメント エディターを見つけることです。
Excel がセル内の画像を値ではなくオブジェクトとして扱う限り、Excel は私の目的には使用できません。