.htaccess – wie vermeidet man, dass eine Subdomain bei Google oder Ähnlichem angezeigt wird?

.htaccess – wie vermeidet man, dass eine Subdomain bei Google oder Ähnlichem angezeigt wird?

Ich habe die folgende htaccess-Datei für Sie:

Options +FollowSymlinks
#+FollowSymLinks must be enabled for any rules to work, this is a security #requirement of the rewrite engine. Normally it's enabled in the root and we #shouldn't have to add it, but it doesn't hurt to do so.

RewriteEngine on
#Apache scans all incoming URL requests, checks for matches in our #.htaccess file 
#and rewrites those matching URLs to whatever we specify.

#allow blank referrers.
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?site.com [NC]
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?site.dev [NC]
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?dev.site.com [NC]
RewriteRule \.(jpg|jpeg|png|gif)$ - [NC,F,L]

# if a directory or a file exists, use it directly
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d


# otherwise forward it to index.php
RewriteRule . index.php

# request is for http://dev.site.com
RewriteCond %{HTTP_HOST} ^dev.site.com$ [NC]

# user-agent is a search engine bot
RewriteCond %{HTTP_USER_AGENT} (Googlebot|yahoo|msnbot) [NC]

# return forbidden
RewriteRule ^ - [L,F]

Ich möchte dev.site.com nicht über die Google-Suche oder Ähnliches öffentlich machen.

Ich habe das hier platziert. Soll ich warten? Oder gibt es etwas anderes, das ich tun sollte?

Antwort1

.htaccess ist nicht wirklich der richtige Ort, um die Anzeige von Websites in den Google-Suchindizes zu blockieren. robots.txtist eine der zu diesem Zweck entwickelten Methoden.

Platzieren Sie dies:

User-agent: *
Disallow: /

Eine Datei mit dem Namen „robots.txt“ in Ihrem Stammverzeichnis von dev.site.com sollte verhindern, dass es angezeigt wird.

Alternativ können Sie auch eineMeta-Tagauf den Seiten, die nicht angezeigt werden sollen, wie zum Beispiel:

<meta name="robots" content="noindex">

Oder wenn esnurTeilen Sie Google mit, dass Sie Ihre Seite nicht indexieren möchten, aber die Nutzung anderer Robots zulassen möchten:

<meta name="googlebot" content="noindex">

Der Nachteil dabei in einem Entwicklungs-/Produktionsszenario ist, dass Sie etwas tun müssen, um sicherzustellen, dass diese Tags nicht in Ihrem Produktionscode erscheinen (vorausgesetzt SieTunmöchten, dass Google Ihren Produktionsserver indiziert).

verwandte Informationen