讀取具有多個文件結束標誌的文件

讀取具有多個文件結束標誌的文件

我有一個從伺服器更新導出的管道分隔檔案。大約有 1.34 億筆記錄。在將資料讀入其他程式(如 SAS)之前,我使用 Excel 匯入少量記錄(1,000 - 10,000 個)來探索資料並尋找問題。

文件中大約第 6200 條記錄存在問題,但我無法讀取該文件,因為 Excel 只會讀取前 3,200 條記錄。我發現該文件中有多個文件結束標記(該文件來自Linux,Windows找到1A十六進位編碼,它標記了文件結束)。任何人都知道如何解決這個問題。我目前的程式碼如下:

Sub Test()
file = "c:\user\myfile"
Open file For Input As #1
For i = 1 To 10000
    Line Input #1, dat
    Cells(i, 1) = dat
Next i

Close #1
End Sub

答案1

嘗試尋找並取代文件中的值:

Dim CellContent as String
Dim NewCellContent as String
CellContent = 'the line you're bringing in
NewCellContent = (Worksheetfunction.Substitute([your line], chr(26),vbnullstring))

Do Until CellContent = NewCellContent

    CellContent = NewCellContent
    NewCellContent = Worksheetfunction.Substitute(NewCellContent,chr(26),vbnullstring)

Loop

或者你可以使用正規表示式。

相關內容