Вам никогда не требовалось узнать, какие страницы сайта НЕ в индексе Яндекса? Изначально, я решил, что обойдусь каким-нибудь сервисом или софтом. Но, увы, ничего нормального не нашел. Пришлось изобретать велосипед, который, к счастью, оказался работоспособным. В последнее время наблюдается вылет страниц из индекса Яндекса. Конечно, по сравнению со всеми проиндексированными ссылками это всего лишь 3-5 %.
Задача: имеется блог определенной тематики, работающий на WordPress.
Цель: узнать какие страницы сайта НЕ в индексе Яндекса.
Шаг первый.
Есть один интересный сервис — www.recipdonor.com. Позволяет проверять массовым способом множество страниц на наличие их в индексе, а потом уже экспортировать их в отдельный файл. При регистрации вам дают 1 доллар, которого вам хватит на проверку нескольких тысяч ссылок. Остается один момент — нужны все ссылки на статьи блога.
Шаг второй.
Ссылки можно получить 2мя способами, которые так или иначе связаны с картой сайта. Ставим плагин XML-Sitemap Generator и из сгенерированного сайтмапа вытягиваем ссылки. Правда, придется немного повозиться удаляя дату и прочую инфу со страницы. Пример работы плагина — http://rxnblog.ru/sitemap.xml
Второй способ связан с плагином Dagon design Sitemap, который также генерирует карту сайта, но при этом может опубликовать все ссылки с анкорами на определенной вами странице. Ставим плагин, открываем страницу и выделяем все линки. В Opera на ПК есть фича — слева в сайдбаре есть кнопка линки. Кликаете ее, выделяете ссылки и копируете их в нужный вам файл.
Шаг третий.
Когда список урлов получен, отправляемся на сервис RDS. Переходим во вкладку «Доноры», кликаем добавить из файла. Указываем наш файл и ждем загрузки ссылок.
Ждем, пока все ссылки обработаются. Открываем доноры, фильтруем по наличию в яндексе. Открываем вкладку «Не в индексе» и внизу нажимаем «Экспорт».
На выходе получаем excel файл со ссылками, которые не в индексе Яндекса.
Увы, подобных сервисов мало. К примеру, VPN сервисов в Рунете большое количество. Причем, пользователи ими охотно пользуются.
Что делать с этими ссылками дальше?
1. Добавить в аддурилку. Возможно, Яндекс одумается и снова их проиндексирует.
2. Переписать статьи заново и опубликовать.
Если у вас есть более легкий способ определения страниц сайта НЕ в индексе Яндекса — поделитесь))