매우 넓은 xlsx 파일을 변환하기 위해 csvkit을 얻는 방법 - 이상한 오류 메시지

매우 넓은 xlsx 파일을 변환하기 위해 csvkit을 얻는 방법 - 이상한 오류 메시지

나는 분석을 위해 단일 파일로 집계할 수 있도록 매우 넓은(200개 이상의 열) 여러 xlsx 파일을 csv 파일로 변환하려고 했습니다. csvkit을 사용하려고 했는데 파일에서 멈췄습니다.

상세 모드를 켤 때 나타나는 오류 메시지는 실행할 때마다 달라집니다. 다음은 다음과 같습니다.

C:\_analysis>in2csv -v 85910332_PE20160101_RECLMEXP.xlsx > test.csv
c:\python35\lib\site-packages\openpyxl\workbook\names\named_range.py:121: UserWarning: Discarded range with reserved name
  warnings.warn("Discarded range with reserved name")
Traceback (most recent call last):
  File "C:\Python35\Scripts\in2csv-script.py", line 9, in <module>
    load_entry_point('csvkit==0.9.1', 'console_scripts', 'in2csv')()
  File "c:\python35\lib\site-packages\csvkit\utilities\in2csv.py", line 82, in launch_new_instance
    utility.main()
  File "c:\python35\lib\site-packages\csvkit\utilities\in2csv.py", line 76, in main
    data = convert.convert(self.input_file, filetype, **kwargs)
  File "c:\python35\lib\site-packages\csvkit\convert\__init__.py", line 39, in convert
    return xlsx2csv(f, **kwargs)
  File "c:\python35\lib\site-packages\csvkit\convert\xlsx.py", line 66, in xlsx2csv
    value = c.value
  File "c:\python35\lib\site-packages\openpyxl\cell\read_only.py", line 107, in value
    if self.data_type == 'b':
KeyboardInterrupt

다시 실행해보니 오류가 약간 달라졌습니다.

C:\_analysis>in2csv -v 85910332_PE20160101_RECLMEXP.xlsx > test.csv
c:\python35\lib\site-packages\openpyxl\workbook\names\named_range.py:121: UserWarning: Discarded range with reserved name
  warnings.warn("Discarded range with reserved name")
Traceback (most recent call last):
  File "C:\Python35\Scripts\in2csv-script.py", line 9, in <module>
    load_entry_point('csvkit==0.9.1', 'console_scripts', 'in2csv')()
  File "c:\python35\lib\site-packages\csvkit\utilities\in2csv.py", line 82, in launch_new_instance
    utility.main()
  File "c:\python35\lib\site-packages\csvkit\utilities\in2csv.py", line 76, in main
    data = convert.convert(self.input_file, filetype, **kwargs)
  File "c:\python35\lib\site-packages\csvkit\convert\__init__.py", line 39, in convert
    return xlsx2csv(f, **kwargs)
  File "c:\python35\lib\site-packages\csvkit\convert\xlsx.py", line 58, in xlsx2csv
    for i, row in enumerate(sheet.iter_rows()):
  File "c:\python35\lib\site-packages\openpyxl\worksheet\iter_worksheet.py", line 103, in get_squared_range
    for _event, element in p:
  File "c:\python35\lib\xml\etree\ElementTree.py", line 1290, in __next__
    for event in self._parser.read_events():
  File "c:\python35\lib\xml\etree\ElementTree.py", line 1257, in read_events
    index = self._index
KeyboardInterrupt

어떤 아이디어가 있나요?

Windows 10을 실행 중이고 소스 파일은 Excel 2013, Python 3.5.1 및 다음 라이브러리 버전에 있습니다. csvkit==0.9.1 jdcal==1.2 numpy==1.10.2 openpyxl==2.2.0b1 python-dateutil ==2.2 6==1.10.0 SQLAlchemy==1.0.13 xlrd==1.0.0

관련 정보