
На странице результатов, когда я гуглю "e-luminate", 3-я и 4-я ссылки, похоже, указывают на определенный каталог глубоко внутри папок, в которых хранятся изображения. Как мне избавиться от этих 2 результатов из результатов поиска Google? Как мне заставить Google деиндексировать их?
Я проверил на сервере, и папки, похоже, не отличаются от других папок, но эти 2 пути, похоже, индексируются Google.
Спасибо.
решение1
Сначала зарегистрируйтесь наИнструменты Google для веб-мастероваккаунт. Это позволит вам просматривать статистику Google о том, как они сканируют ваш сайт, и позволит вам запрашивать удаление страниц из индекса (подробнее об этом позже).
Далее настройте robots.txt
файл для вашего сайта. Вам не нужно блокировать весь ваш сайт от Google, чтобы использовать robots.txt
. Все поисковые системы следуют robots.txt
, поэтому это также не позволит таким сайтам, как Bing или Yahoo, индексировать эти страницы.
Чтобы настроить это, создайте robots.txt
как простой текстовый файл в корневом каталоге вашего сайта (например http://www.example.com/robots.txt
, ). Синтаксис очень прост: вы указываете user-agent, к которому это должно применяться, используя его *
как подстановочный знак для всех роботов, и указываете, где роботы не должны сканировать. Обратите внимание, что вы не должны включать какие-либо страницы, которые вы хотите сделать полностью «секретными», так как это общедоступный файл. Синтаксис для robots.txt
следующий:
User-agent: user agent name
Disallow: directory name
Disallow: another directory
Disallow: (etc)
Если вы хотите запретить поисковым системам индексировать данные в подкаталоге вашего каталога изображений, вы можете сделать что-то вроде этого:
User-agent: *
Disallow: /images/foo/bar/
Disallow: /images/foo/baz/
Вы даже можете запретить только определенный файл:
User-agent: *
Disallow: /images/foo/bar/qux.jpg
Настройка robots.txt
предотвратит индексацию указанных каталогов и файлов в будущем. Со временем эти страницы будут удалены из индекса поиска, но это произойдет не сразу. Чтобы ускорить этот процесс, используйте свою учетную запись инструментов веб-мастера, чтобы отправить запрос на удаление URL из индекса. Щелкните учетную запись веб-сайта, из которой вы хотите удалить URL, затем откройте «Конфигурация сайта» слева. Щелкните «Доступ сканера», затем откройте вкладку «Удалить URL». Щелкните «Новый запрос на удаление» и введите URL, который вы хотите удалить. Затем нажмите Enter. Страница должна попросить вас подтвердить, что вы уже заблокировали URL через robots.txt
(что вы только что сделали). Щелкните OK, и она должна отправить запрос. Обычно обработка запроса занимает 1–3 дня. Вы можете проверить статус запроса, войдя в свою учетную запись инструментов веб-мастера в любое время.
решение2
Вы пробовали сначала поискать?
Я искал «Удалить страницу из индекса Google» и получил эту страницу:Удалить страницу или сайт из результатов поиска Google.
Там говорится, что вам следует создатьrobots.txtфайл.
После этого вы можете перейти кИнструменты Google для веб-мастеровпотребовать скорейшего удаления.
решение3
Почитайте о файлах robots.txt, и вы поймете, вы просто помещаете файл robots.txt в любую папку, которую хотите полностью удалить из Google, и через несколько часов или дней он больше не должен отображаться. Robots.txt генерируются с помощью инструментов веб-мастеров в вашем аккаунте Google, попробуйте!