.htaccess – como evitar que um subdomínio seja visto no google ou similar?

.htaccess – como evitar que um subdomínio seja visto no google ou similar?

Tenho o seguinte arquivo htaccess para sua consideração:

Options +FollowSymlinks
#+FollowSymLinks must be enabled for any rules to work, this is a security #requirement of the rewrite engine. Normally it's enabled in the root and we #shouldn't have to add it, but it doesn't hurt to do so.

RewriteEngine on
#Apache scans all incoming URL requests, checks for matches in our #.htaccess file 
#and rewrites those matching URLs to whatever we specify.

#allow blank referrers.
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?site.com [NC]
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?site.dev [NC]
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?dev.site.com [NC]
RewriteRule \.(jpg|jpeg|png|gif)$ - [NC,F,L]

# if a directory or a file exists, use it directly
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d


# otherwise forward it to index.php
RewriteRule . index.php

# request is for http://dev.site.com
RewriteCond %{HTTP_HOST} ^dev.site.com$ [NC]

# user-agent is a search engine bot
RewriteCond %{HTTP_USER_AGENT} (Googlebot|yahoo|msnbot) [NC]

# return forbidden
RewriteRule ^ - [L,F]

Desejo não tornar o dev.site.com público por meio da pesquisa do Google ou similar.

Eu coloquei isso. Devo esperar ? Ou há algo mais que eu deveria fazer?

Responder1

.htaccess não é realmente o lugar para impedir que sites apareçam nos índices de pesquisa do Google. robôs.txté um dos métodos concebidos para esse fim.

Colocando isso:

User-agent: *
Disallow: /

Em um arquivo chamado "robots.txt" no diretório raiz de dev.site.com deve impedir que ele apareça.

Alternativamente, você pode incluir ummetatagnas páginas que você não deseja que apareçam, como:

<meta name="robots" content="noindex">

Ou se forapenasGoogle que você deseja não indexar sua página, mas permitir que outros robôs você possa usar:

<meta name="googlebot" content="noindex">

A desvantagem disso em um cenário do tipo desenvolvimento/produção é que você terá que fazer algo para garantir que essas tags não apareçam em seu código de produção (assumindo que vocêfazerdeseja que o Google indexe seu servidor de produção).

informação relacionada