나는 책을 쓰기 위해 광물에 관한 연구를 하고 있습니다. 결국에는 약 2,000개의 광물을 추적해야 합니다. 이는 현재 각 줄이 대략 이 그림과 비슷한 약 800줄의 Word 테이블에 의해 수행됩니다.
나에게 필요한 기능은 (a) 모든 열 집합에서 테이블을 정렬할 수 있고 (b) 각 줄의 시각적 축소판을 볼 수 있지만 (c) 이미지의 전체 해상도 복사본을 유지하고 (d) 클릭할 수 있다는 것입니다. 테이블 항목의 활성 링크에 있습니다.
현재 Word 파일의 크기는 ~600MB이며 Word(Office 365 버전)는 연결 부분에서 분명히 삐걱거리기 시작합니다(예를 들어 자동 저장이 더 이상 작동하지 않고 때때로 문서에서 아무것도 선택할 수 없습니다).
나는 현재 Word 파일을 읽고 .pdf 파일을 생성하는 Python 프로그램을 실행하고 있습니다. 왜냐하면 필요한 출력은 그림, 메모 및 기타 속성이 적절하게 크기 및 위치가 조정되어 테이블의 각 줄을 하나의 출력 페이지에 매핑하는 것이기 때문입니다. .pdf 파일의 크기는 약 2GB이므로 나중에 .pdf 파일 축소기를 통해 실행하여 합리적인 ~200MB의 최종 출력을 얻습니다.
그래서 내 질문은 이 작업을 수행하는 더 좋은 방법이 있습니까? 저는 Access를 잠깐 살펴보았지만 사진을 처리하는 방법을 알 수 없었습니다.
정렬 기능이 손실되므로 Word 파일을 두 개로 나눌 수 없습니다. 일단 테이블이 완성되면 더 이상 정렬할 필요가 없지만 계속해서 테이블에 항목을 추가하고 있으며 정렬을 통해 여러 가지 다른 오류 유형을 확인할 수 있습니다.
그렇다면 "대형" 파일을 안전하게 허용하기 위해 Word에서 설정할 수 있는 플래그가 있습니까? 그렇다면 동일한 기능을 가지면서 페이지당 하나의 미네랄을 적절한 스타일로 멋지게 구성할 수 있는 방법이 있습니까? 그렇지 않다면 다른 문서 소프트웨어로 전환해야 합니까? (참고: 원래 Google Docs에 이 기능이 있었지만 정렬 기능을 제공하지 않습니다. 추가 기능은 일종의 정렬 기능을 제공했지만 각각은 훨씬 작은 테이블에서 어떤 방식으로든 손상되었습니다.)
답변1
답변2
여러분은 이미 Python에 익숙하므로 프로젝트를 Python으로 가져오는 것을 강력히 권장합니다.Google 스프레드시트와 더불어구글 API.
- 표를 복사하여 새 Google 스프레드시트 표에 붙여넣으세요.
- Sheets API 숙지(API 키 및 인증, Python 연결, 테이블 액세스 및 읽기)
- Python 스크립트를 확장하여 스프레드시트에서 데이터를 가져오고 PDF를 생성하세요.
Google Sheets용 Python 스크립트를 만드는 것은 오늘날 강력한 데이터 과학 기술입니다. Google Sheets는 매우 유연하고 효율적이며 온라인 데이터베이스처럼 작동할 수 있기 때문입니다.
초보자를 위한 좋은 비디오 튜토리얼은 다음과 같습니다.Google 스프레드시트 - Python API, 데이터 읽기 및 쓰기(YouTube)
건배!
답변3
간단한 대답은 Word 테이블에 필요한 기능이 있다는 것입니다(각 테이블 행은 이미지를 포함한 콘텐츠에 맞게 조정되고, 정렬이 쉽고, 셀 내부 링크가 작동함). 따라서 숨겨진 파일 크기 제한을 초과하지 않도록 주의해야 합니다.
대안은 Word에서 정확하게 가져오기를 지원하는 다른 좋은 문서 편집기를 찾는 것입니다.
Excel이 셀의 이미지를 값이 아닌 개체로 처리하는 한 Excel은 제 목적에 맞게 사용할 수 없게 됩니다.