Por que o comprimento do caminho do soquete é limitado a cem caracteres?

Question 1

Compatibilidade com outras plataformas ou compatibilidade com coisas mais antigas para evitar sobrecargas ao usar snprintf()e strncpy().

Michael Kerrisk explica emlivro delenopágina 1165- Capítulo 57, Sockets: domínio Unix:

SUSv3 não especifica o tamanho do campo sun_path. As primeiras implementações do BSD usavam 108 e 104 bytes, e uma implementação contemporânea (HP-UX 11) usava 92 bytes. Aplicativos portáteis devem codificar para esse valor mais baixo e usar snprintf() ou strncpy() para evitar saturação de buffer ao escrever neste campo.

Os caras do Docker até zombaram disso, porque alguns soquetes tinham 110 caracteres:

hahaha 108 caracteres ETOOMANY

É por isso que o LINUX usa um soquete de 108 caracteres. Isso poderia ser mudado? Claro. E esta é a razão pela qual esta limitação foi criada em primeiro lugar em sistemas operacionais mais antigos:

Por que o comprimento máximo do caminho é permitido para soquetes Unix no Linux 108?

Citando a resposta:

Era para corresponder ao espaço disponível em uma estrutura de dados do kernel útil.

Citando "O Projeto e Implementação do Sistema Operacional 4.4BSD" por McKusick et. al. (página 369):

Os recursos de gerenciamento de memória giram em torno de uma estrutura de dados chamada mbuf. Mbufs, ou buffers de memória, têm 128 bytes de comprimento, sendo 100 ou 108 bytes desse espaço reservado para armazenamento de dados.

Outros sistemas operacionais (soquetes de domínio unix):

OpenBSD: 104 caracteres
FreeBSD: 104 caracteres
Mac OS X 10.9: 104 caracteres

Answer

Compatibilidade com outras plataformas ou compatibilidade com coisas mais antigas para evitar sobrecargas ao usar snprintf()e strncpy().

Michael Kerrisk explica emlivro delenopágina 1165- Capítulo 57, Sockets: domínio Unix:

SUSv3 não especifica o tamanho do campo sun_path. As primeiras implementações do BSD usavam 108 e 104 bytes, e uma implementação contemporânea (HP-UX 11) usava 92 bytes. Aplicativos portáteis devem codificar para esse valor mais baixo e usar snprintf() ou strncpy() para evitar saturação de buffer ao escrever neste campo.

Os caras do Docker até zombaram disso, porque alguns soquetes tinham 110 caracteres:

hahaha 108 caracteres ETOOMANY

É por isso que o LINUX usa um soquete de 108 caracteres. Isso poderia ser mudado? Claro. E esta é a razão pela qual esta limitação foi criada em primeiro lugar em sistemas operacionais mais antigos:

Por que o comprimento máximo do caminho é permitido para soquetes Unix no Linux 108?

Citando a resposta:

Era para corresponder ao espaço disponível em uma estrutura de dados do kernel útil.

Citando "O Projeto e Implementação do Sistema Operacional 4.4BSD" por McKusick et. al. (página 369):

Os recursos de gerenciamento de memória giram em torno de uma estrutura de dados chamada mbuf. Mbufs, ou buffers de memória, têm 128 bytes de comprimento, sendo 100 ou 108 bytes desse espaço reservado para armazenamento de dados.

Outros sistemas operacionais (soquetes de domínio unix):

OpenBSD: 104 caracteres
FreeBSD: 104 caracteres
Mac OS X 10.9: 104 caracteres

Question 2

Quanto ao porquê, nwildner já escreveu umexcelente resposta.

Aqui vou me concentrar apenas em como e no uso do caminho relativo.

Internamente, embora o arquivo de soquete também possa ser pesquisado por nome (eu acho), eles geralmente são pesquisados por inode. No Linux, esta consulta é garantida pela função unix_find_socket_byinode()definida emnet/unix/af_unix.c.

Isso pode ser facilmente verificado da seguinte forma:

Crie dois diretóriosA/eB/.
Em cada diretório, faça um processo escutar arquivos de soquete com o mesmo nome. Comsocatvocê usaria um comando como:

$ socat UNIX-LISTEN:./my.sock -

Agora troque os arquivos de soquete movendoA/minha.sockparaB/e vice versa.
De agora em diante, se o aplicativo cliente se conectar aoA/minha.sockele entrará em contato com o servidorB, e se ele se conectar aB/minha.meiaele entrará em contato com o servidorA(observe que quando a comunicação termina, o processo do servidor pode excluir legitimamente o que pensa ser seu próprio arquivo de soquete).

Eu verifiquei esse comportamento em alguns sistemas Unix (Linux Debian, FreeBSD e OpenIndiana para obter alguma diversidade), então esse comportamento parece ser pelo menos generalizado, se não padrão.

Caminhos absolutos são geralmente usados como uma convenção entre os processos cliente e servidor, pois de outra forma o processo cliente pode não saber como estabelecer a comunicação inicial com o servidor.

No entanto, se esta comunicação inicial não for um problema, parece seguro usar caminhos relativos para a criação de arquivos de soquete, permitindo evitar problemas de comprimento de caminho quando a localização do arquivo de soquete não é controlada diretamente pelo processo do servidor.

Answer