O Hadoop se beneficiará com apenas um disco?

O Hadoop se beneficiará com apenas um disco?

Se eu usar uma configuração de nó único com Hadoopapenas um disco, posso usá-lo facilmente para brincar Hadoope outras coisas, mas haverá realmente algum benefício em usar Hadoopneste caso outro paradigma (processamento Pythonsem usar mapreduce, etc. .)

Responder1

O poder do Hadoop vem do fato de ele usar um sistema de arquivos distribuído (HDFS) e um modelo de programação distribuída (MapReduce). O processamento não pode ser paralelizado em um cluster de nó único com um disco, então - por causa deSobrecarga do Hadoop- paradigmas mais simples provavelmente serão mais rápidos.

Mesmo ao usar um cluster completo, você não verá os benefícios do Hadoop se a data definida for muito pequena ou se o algoritmo não for adequado para processamento distribuído (por exemplo, encontrar um valor mediano).

Responder2

O Hadoop é totalmente baseado em sistema de arquivos distribuídos (HDFS), e o verdadeiro poder está aqui.

Mas ao mesmo tempo é importante aprender a estrutura e compreender seus componentes. Essa é a razão pela qual o Hadoop oferece 3 modos de instalação.

Respondendo exatamente à sua pergunta, o disco único não se beneficia da parte HDFS do hadoop. Mas, novamente, ajudará na compreensão do componente MapReduce do Hadoop.

Se você tiver um sistema de configuração idiota, sugiro ir para a configuração do Pseudo Cluster, com duas máquinas virtuais interagindo entre si.

informação relacionada