Файл robots.txt играет ключевую роль в управлении индексацией сайта поисковыми системами и сервисными роботами. Часто можно столкнуться с ситуацией, когда важные сервисные роботы, например Googlebot-Image, Googlebot-News или YandexBot, блокируются из-за неверных правил в robots.txt. Это снижает видимость вашего сайта и влияет на трафик. В этой статье разберём, как правильно настроить robots.txt в WordPress, чтобы исключить блокировку полезных роботов и при этом защитить конфиденциальные разделы сайта.
Что такое файл robots.txt и почему он важен для WordPress
robots.txt — это текстовый файл, размещаемый в корне сайта, который сообщает поисковым роботам, какие страницы и разделы сайта можно индексировать, а какие нет. В WordPress по умолчанию файл создаётся автоматически и часто содержит базовые правила, которые не учитывают специфику конкретного сайта.
Некорректные правила могут привести к блокировке не только нежелательных роботов, но и сервисных ботов поисковых систем, которые обеспечивают корректное отображение сайта в результатах поиска, загрузку изображений, новостей, видео и т.п.
Поэтому важно грамотно настраивать robots.txt, учитывая особенности WordPress и потребности вашего проекта.
Типичные ошибки в файле robots.txt в WordPress
Обычно встречаются следующие проблемы:
- Полное запрещение доступа к папкам с ресурсами, например
/wp-includes/или/wp-content/, что блокирует загрузку CSS, JS, изображений и других медиафайлов. Это ухудшает отображение и работу сайта в поисковых системах. - Использование директив
Disallow: /без исключений — блокирует индексацию всего сайта. - Отсутствие разрешений для важных сервисных роботов, например Googlebot-Image или YandexBot, что приводит к потере трафика с поиска по изображениям и новостям.
- Неправильное использование User-agent, когда правила применяются ко всем роботам без разбора.
Как правильно настроить robots.txt для WordPress
Основная задача — закрыть от индексации нежелательные разделы, но разрешить работу сервисных роботов. Вот пример базового файла robots.txt, оптимального для большинства WordPress-сайтов:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /cgi-bin/
Disallow: /trackback/
Disallow: /xmlrpc.php
Disallow: /?s=
Disallow: /search/
User-agent: Googlebot-Image
Allow: /wp-content/uploads/
User-agent: Yandex
Allow: /wp-content/uploads/
Sitemap: https://yourdomain.ru/sitemap.xml
Объяснение:
User-agent: *— правила для всех роботов;- Запрещаем доступ к панели администратора, формам входа и регистрации, а также системным скриптам, которые не должны индексироваться;
- Разрешаем
admin-ajax.php, так как он отвечает за AJAX-запросы; - Разрешаем доступ сервисным роботам к папке с загруженными изображениями (
/wp-content/uploads/), чтобы картинки попадали в поиск; - Указываем ссылку на sitemap для ускорения индексации.
Пример функции для автоматического создания robots.txt в WordPress (wp-puzzle prefix)
Если хотите динамически генерировать robots.txt через WordPress, можно добавить следующий код в файл functions.php вашей темы или в плагин:
function wppuzzle_generate_robots_txt() {
header('Content-Type: text/plain; charset=UTF-8');
echo "User-agent: *\n";
echo "Disallow: /wp-admin/\n";
echo "Allow: /wp-admin/admin-ajax.php\n";
echo "Disallow: /wp-login.php\n";
echo "Disallow: /wp-register.php\n";
echo "Disallow: /cgi-bin/\n";
echo "Disallow: /trackback/\n";
echo "Disallow: /xmlrpc.php\n";
echo "Disallow: /?s=\n";
echo "Disallow: /search/\n";
echo "\nUser-agent: Googlebot-Image\n";
echo "Allow: /wp-content/uploads/\n";
echo "\nUser-agent: Yandex\n";
echo "Allow: /wp-content/uploads/\n";
echo "\nSitemap: " . site_url('/sitemap.xml') . "\n";
exit;
}
add_action('do_robots', 'wppuzzle_generate_robots_txt');
Этот код перехватывает запрос к robots.txt и выводит оптимальные правила без необходимости создавать файл вручную. Это полезно, если вы хотите контролировать правила из админки или темы.
Плагины для удобного управления robots.txt и SEO в WordPress
Если не хотите заниматься кодом, воспользуйтесь плагинами, которые помогут безопасно и удобно настроить robots.txt и SEO:
- Clearfy Pro — расширенный плагин для оптимизации и безопасности, позволяет настраивать
robots.txtи управлять индексацией; - WPRemark — плагин с SEO-инструментами, включая удобный редактор
robots.txt; - Virtual Robots.txt — бесплатный плагин, который позволяет создавать виртуальный файл
robots.txtиз админки.
Как проверить корректность настроек robots.txt
После настройки важно проверить, что сервисные роботы не блокируются. Для этого используйте следующие инструменты:
- Google Search Console — раздел «Проверка файла robots.txt» покажет, какие URL доступны;
- Яндекс.Вебмастер — аналогичный инструмент для проверки доступа;
- Онлайн-сервисы, например TechnicalSEO Robots.txt Tester;
- Проверяйте логи сервера на предмет ошибок доступа у популярных роботов.
Если вы обнаружите, что сервисные роботы блокируются, скорректируйте robots.txt согласно приведённым рекомендациям.
Заключение
Правильная настройка robots.txt — залог успешного продвижения WordPress-сайта. Учитывайте особенности сервисных роботов, не блокируйте важные папки с ресурсами и используйте либо ручное редактирование, либо проверенные плагины для управления файлом. Если хотите автоматизировать процесс, можно использовать пример функции с префиксом wppuzzle_ для динамической генерации robots.txt.