Прочитать файл с несколькими флагами конца файла

Прочитать файл с несколькими флагами конца файла

У меня есть файл с разделителями-прописными буквами, который был экспортирован из обновления сервера. Там примерно 134 миллиона записей. Я использую Excel для импорта небольшого количества записей (1000–10 000), чтобы исследовать данные и искать проблемы, прежде чем считывать данные в другие программы (например, SAS).

В файле есть проблема около записи 6200, но я не могу прочитать файл, так как Excel читает только первые 3200 записей. Я обнаружил, что в файле есть несколько меток конца файла (файл из Linux, Windows находит шестнадцатеричный код 1A, который отмечает конец файла). Есть ли у кого-нибудь идеи, как это обойти. Мой текущий код следующий:

Sub Test()
file = "c:\user\myfile"
Open file For Input As #1
For i = 1 To 10000
    Line Input #1, dat
    Cells(i, 1) = dat
Next i

Close #1
End Sub

решение1

Попробуйте найти и заменить значение в файле:

Dim CellContent as String
Dim NewCellContent as String
CellContent = 'the line you're bringing in
NewCellContent = (Worksheetfunction.Substitute([your line], chr(26),vbnullstring))

Do Until CellContent = NewCellContent

    CellContent = NewCellContent
    NewCellContent = Worksheetfunction.Substitute(NewCellContent,chr(26),vbnullstring)

Loop

Или вы можете использовать регулярные выражения.

Связанный контент