Leer archivo con múltiples indicadores de fin de archivo

Leer archivo con múltiples indicadores de fin de archivo

Tengo un archivo delimitado por tuberías que se exportó desde la actualización del servidor. Hay aproximadamente 134 millones de registros. Estoy usando Excel para importar una pequeña cantidad de registros (1000 - 10 000) para explorar los datos y buscar problemas antes de leer los datos en otros programas (como SAS).

Hay un problema en el archivo alrededor del registro 6200, pero no puedo leerlo, ya que Excel solo leerá los primeros 3200 registros. Descubrí que hay varias marcas de fin de archivo en el archivo (el archivo es de Linux, y Windows encuentra 1A hexadecimal mixto que marca el fin de archivo). Alguien tiene alguna idea de cómo solucionar esto. Mi código actual es el siguiente:

Sub Test()
file = "c:\user\myfile"
Open file For Input As #1
For i = 1 To 10000
    Line Input #1, dat
    Cells(i, 1) = dat
Next i

Close #1
End Sub

Respuesta1

Intente buscar y reemplazar el valor en el archivo:

Dim CellContent as String
Dim NewCellContent as String
CellContent = 'the line you're bringing in
NewCellContent = (Worksheetfunction.Substitute([your line], chr(26),vbnullstring))

Do Until CellContent = NewCellContent

    CellContent = NewCellContent
    NewCellContent = Worksheetfunction.Substitute(NewCellContent,chr(26),vbnullstring)

Loop

O podrías usar expresiones regulares.

información relacionada