ERROR: [cat: el archivo no existe] No puedo abrir el archivo de salida de hadoop en 14.04

Question 1

Verifique el nombre del archivo. Son cinco ceros, no cuatro.

bin/hadoop dfs -cat /user/hadoopuser/SampleOutput/part-r-00000

Answer

Verifique el nombre del archivo. Son cinco ceros, no cuatro.

bin/hadoop dfs -cat /user/hadoopuser/SampleOutput/part-r-00000

Question 2

Entonces me doy cuenta de que ya se aceptó una respuesta, pero aquí está la solución cuando me pasó a mí (en caso de que alguien más vea este hilo).

TLDR; asegúrese de que no haya nombres de carpeta conflictivos en su directorio hadoop (para mí fue /usr/local/hadoop).

Cuando estaba generando resultados, los colocaba en una carpeta llamada resultados/, sin embargo, antes de este programa tenía otro que también escribía en resultados y había guardado los datos de resultados en una carpeta llamada específicamente resultados en mi directorio de hadoop. Esto me estaba causando problemas, ya que aunque esa carpeta no apareció cuando ejecuté bin/hadoop fs -ls, el comando bin/hadoop fs -cat output/*en realidad buscaba en la carpeta que había generado antes, en lugar de en la salida del programa que acababa de ejecutar. Después de eliminar ese directorio de salida con rm -rf output/, el problema desapareció.

Answer

Entonces me doy cuenta de que ya se aceptó una respuesta, pero aquí está la solución cuando me pasó a mí (en caso de que alguien más vea este hilo).

TLDR; asegúrese de que no haya nombres de carpeta conflictivos en su directorio hadoop (para mí fue /usr/local/hadoop).

Cuando estaba generando resultados, los colocaba en una carpeta llamada resultados/, sin embargo, antes de este programa tenía otro que también escribía en resultados y había guardado los datos de resultados en una carpeta llamada específicamente resultados en mi directorio de hadoop. Esto me estaba causando problemas, ya que aunque esa carpeta no apareció cuando ejecuté bin/hadoop fs -ls, el comando bin/hadoop fs -cat output/*en realidad buscaba en la carpeta que había generado antes, en lugar de en la salida del programa que acababa de ejecutar. Después de eliminar ese directorio de salida con rm -rf output/, el problema desapareció.

ERROR: [cat: el archivo no existe] No puedo abrir el archivo de salida de hadoop en 14.04

Respuesta1

Respuesta2

información relacionada