Преобразовать папку документов Word в одну, пригодную для анализа электронную таблицу

Преобразовать папку документов Word в одну, пригодную для анализа электронную таблицу

Можно ли показать MSWord папку, полную файлов .docs или .docx, и заставить его преобразовать их в электронную таблицу, содержащую столбцы для различных переменных, описывающих каждый документ, таких как имя файла, дата создания, содержимое тела и т. д., при этом конечной целью в данном случае будет итерация по электронной таблице?

Крайне важно, чтобы было включено и фактическое содержимое файлов.

(или, может ли какой-либо другой офисный пакет сделать это?)

решение1

Конечно. Вот один быстрый способ:

  1. Откройте окно CMD Windows.
  2. введите: dir directory\directory > temp.txt (например: dir "c:\text\my msword stuff" > temp.txt)
  3. В Excel используйте вкладку «Данные» и импортируйте файл как «из текста».
  4. Используйте параметр форматирования «фиксированная ширина», чтобы настроить столбцы по мере необходимости.

Результат выглядит так: (Верхние строки придется подправить вручную или удалить) введите описание изображения здесь

решение2

Документы Word на самом деле являются архивами с большим количеством вещей внутри, поэтому если вам нужен контент, вам нужно что-то, что его интерпретирует, например Word. Я не знаю ни одной программы, которая делает то, что вам нужно.
Другой вариант — написать что-то самостоятельно либо на VBA, либо на VB.Net/C#, хотя это потребует некоторой работы.

Связанный контент