|
иван я 17 / 17 / 16 Регистрация: 15.12.2012 Сообщений: 536 |
||||
|
1 |
||||
Создать карту сайта27.12.2016, 16:11. Показов 2370. Ответов 2 Метки нет (Все метки)
Использую онлайн сервис для создания карты сайта, сервис мне выдает вот такую ошибку: на стартовой странице не обнаружено ни одной доступной ссылки. Почему? вот код стартовой страницы index.html
c картой сайта столкнулся первый раз так что не судите строго.
__________________
0 |
|
Заблокирован |
|
|
27.12.2016, 16:13 |
2 |
|
иван я, сервис рассматривает хтмл код страницы со стороны пользователя те вот это но такая настройка сайта бэд для гугляндекса подправь хатеск
0 |
|
17 / 17 / 16 Регистрация: 15.12.2012 Сообщений: 536 |
|
|
30.12.2016, 14:57 [ТС] |
3 |
|
abrdabr, что такое хатекс? и как его подправить?
0 |
|
IT_Exp Эксперт 87844 / 49110 / 22898 Регистрация: 17.06.2006 Сообщений: 92,604 |
30.12.2016, 14:57 |
|
3 |
Sitemap.xml — это карта сайта для поисковых роботов, которая находится в корне сайта и содержит рекомендации того, какие страницы необходимо обходить в первую очередь и с какой частотой. Это ускоряет и упрощает процесс индексации. Создание карты сайта sitemap.xml не является обязательным правилом. Такая карта должна быть на сайтах, которые имеют большое количество страниц, и в тех случаях, когда контент на страницах часто обновляется. В некоторых CMS есть возможность карту сайта создать автоматически, сделать это можно с помощью специального плагина. Однако это не исключает появление ошибок.
Ошибки в sitemap.xml существенно снижают скорость попадания сайта в индекс и затрудняют работу поисковых роботов Яндекс и Google. Поэтому их необходимо вовремя находить и устранять. Однако, если на вашем сайте большое количество страниц, найти неисправности в sitemap вручную будет непросто из-за большого объема данных. На помощь приходит сервис Labrika, в котором есть полезный инструмент для работы с sitemap.xml. Он поможет вам своевременно проверить ошибки и исправить их автоматически, в один клик.
Находится этот инструмент в разделе «Технический аудит» левого бокового меню:

Рассмотрим подробнее, как пользоваться этим подразделом и какие данные можно в нем увидеть:

- Здесь представлены данные о страницах, которые есть в
sitemap.xml, но которых нет на сайте. Эти страницы перечислены ниже, в виде списка. Возможно, они были удалены с сайта и отдают ошибку 404, но в sitemap информацию о них не убрали. - Далее мы можем видеть страницы, которые доступны для индексации поисковых роботов, но отсутствуют в sitemap. Чтобы роботы своевременно посещали эти страницы, их необходимо добавить в
sitemap.xml. - И наконец, страницы, которые есть в sitemap, но при этом закрыты от индексации. Вероятно, такие страницы были добавлены в карту сайта, но потом их закрыли от индексации в файле
robots.txt.Продемонстрируем данные, которые выводятся во вкладках, описанных во втором и третьем пунктах, на следующих скриншотах:


- При нажатии на клавишу «Перепроверить
sitemap.xml» Лабрика проанализирует карту сайта и выдаст информацию об ошибках, описанных в первых трех пунктах. - После нажатия кнопки «Скачать исправленный
sitemap.xml» Лабрика самостоятельно исправит все обнаруженные ошибки и сохранит правильную обновленную версиюsitemap.xmlна ваш компьютер. Вам останется только выгрузить ее на сайт взамен старого файла. - Не забудьте подгрузить новый xml файл sitemap без ошибок в Яндекс Вебмастер и Google Search Console.
Online SEO-инструменты для продвижения сайтов
Проверьте свой сайт и сайты конкурентов на 205 факторов поисковых систем.
-

chikchirik
New Member
Пользователи- Регистрация:
- 23 авг 2017
- Сообщения:
- 6
Поиск ошибки не дал результатов.
При парсинге сайта во вкладке Ссылки, первая страница парсится удачно, а последующие парсер видит как предыдущую и выдаёт сообщения «Не найдено ни одной новой ссылки». Стоит галочка DOM ссылки
пример ссылки для парсинга Ссылки недоступны для гостей -

chikchirik
New Member
Пользователи- Регистрация:
- 23 авг 2017
- Сообщения:
- 6
Увеличил таймаут проверки загрузки, заработало, послежу ещё
-

Root
Администратор
Администратор- Регистрация:
- 10 мар 2010
- Сообщения:
- 14.761
- Город:
- Барнаул
Здравствуйте.
Ссылки недоступны для гостей
-

chikchirik
New Member
Пользователи- Регистрация:
- 23 авг 2017
- Сообщения:
- 6
Здравствуйте,
Спасибо, карта сайта если что пригодится, но она у них давно не обновлялась и новых товаров там нет
Таймаут проверки в итоге работает через раз -

Root
Администратор
Администратор- Регистрация:
- 10 мар 2010
- Сообщения:
- 14.761
- Город:
- Барнаул
Ссылки недоступны для гостей первое видео
-

Deonis062
New Member
Пользователи- Регистрация:
- 29 мар 2020
- Сообщения:
- 8
- Город:
- Барнаул
Добрый день! Антологичная проблема — интернет магазин минилаб раздел металоискатели, сгенерированы ссылки по пагинации, выставленна глубина ссылок 5-5, при парсинге собираются ссылки с первой страницы на других соответственно ошибка: Не найдено ни одной новой ссылки
**Скрытое содержимое: доступно при наличии 1 постов.**
В настройках фильтра указаны только глубина ссылок (на товар).
Лог: Ссылки недоступны для гостей -

Root
Администратор
Администратор- Регистрация:
- 10 мар 2010
- Сообщения:
- 14.761
- Город:
- Барнаул
Ну так то верно, зачем разбираться в URL. Зачем понимать, что для обычного запроса все, что после символа решетки — безразлично.
**Скрытое содержимое: доступно при наличии 1 постов.**
-

Deonis062
New Member
Пользователи- Регистрация:
- 29 мар 2020
- Сообщения:
- 8
- Город:
- Барнаул
1. Откуда взялась данная ссылка?
2.При переходе какая то кракозябра
3. По шрифту я вижу что для вас это какой то тупой вопрос как для разработчика но во всех инструкциях о данной проблеме не слова я за последнию неделю около сотни видео просмотрел но тщетно, аналогичная проблема была и с сайтом ДНСом, если затрудняетесь объяснить дайте ссылку на паблик где можно разобраться с данной проблемой -

Root
Администратор
Администратор- Регистрация:
- 10 мар 2010
- Сообщения:
- 14.761
- Город:
- Барнаул
1) Ссылка берется из монитора сети Firefox Ссылки недоступны для гостей
2) Это не «кракозябра», а JSON ответ с нужными данными
3) Закономерное явление, столько отвечать на форуме на одни и те же вопросы без какой-то дополнительной оплаты. Странно, что еще отвечаю. Это не призыв платить, за ответы на форуме, просто поясняю ситуацию. Такая деформация поведения является закономерной в таких вот условиях. -

Deonis062
New Member
Пользователи- Регистрация:
- 29 мар 2020
- Сообщения:
- 8
- Город:
- Барнаул
Хорошо вопрос такой сколько будет стоить видео запись от А до Я по полному парсингу подобных сайтов? нужно разбираться а то год когда она просто мертвым грузом весит как то не ахти
Ну и с вас я думаю это большинство вопросов снимет можете отправлять по ссылкеПоследнее редактирование: 8 апр 2020
-

Root
Администратор
Администратор- Регистрация:
- 10 мар 2010
- Сообщения:
- 14.761
- Город:
- Барнаул
Видео с подобными темами полно, в системе помощи материалы есть по данным вопросам. Но вот досада, они не помогают большинству людей.
-

Deonis062
New Member
Пользователи- Регистрация:
- 29 мар 2020
- Сообщения:
- 8
- Город:
- Барнаул
Я встречал вычесление отдельных элементов (как например в вашем видео Связной где вы показываете как правильно делать ожидание загрузки сайта и с кнопкой корзина), а так же видео когда при переходе не менялась ссылка, но вот оч много сайтов это как раз как пример с минилабом dns, м-видео и еще куча, когда вроде и ссылка меняется и вроде все ок и html теги вроде есть но ни чего хорошего не происходит, видео полезно по крайней мере научился парсить некоторые сайты (то что после посещения этих сайтов почему то хочется помыть руки я промолчу) это не бесполезный труд. Но большинству необходим пример, привычка учится усваивать по видео 10 раз сделал по видео далее сам. Прога действительно хорошая и аналогов не видел но звезда какая сложная)
-

AlexandrSorokin
Active Member
Пользователи- Регистрация:
- 27 ноя 2018
- Сообщения:
- 71
- Город:
- Пермь
Конкретно по сборку ссылок в категории.
Можно сделать парсинг ссылок, не используя сканер.Генерируете список
num — от 1 до 15
key — #/page-Ссылки недоступны для гостей
Далее выбираете границу парсинга — ссылка на товар и запускаете в 1 поток с интервалом 1 секунда, потому что сайт будет банить за частые запросы.
В идеале парсить со ссылки, которая будет показывать все товары, благо есть такая кнопка на странице.
Конкретно у металлоискателей такая Ссылки недоступны для гостейВо вложении настройка и пример парсинга. Все ссылки собраны
Вложения:
Последнее редактирование: 9 апр 2020
-

Kreol
Модератор
Команда форума
Модератор- Регистрация:
- 6 янв 2013
- Сообщения:
- 2.645
Можно, если пользоватся Generate и несколькими последовательными шабьлонами, при этом начальные ссылки собрать руками
Поделиться этой страницей
Выполните пошагово все следующие инструкции.
- САМАЯ ЧАСТАЯ ПРИЧИНА ERROR-ов — ссылки находятся между тегами NOINDEX или теги NOINDEX расставлены некорректно (например, два раза открываются, а закрываются только один раз). Откройте исходный код вашей страницы в браузере и посчитайте количество открытых NOINDEX (<noindex>) и закрытых (</noindex>). Количество должно совпадать. Если количество совпадает, то проверьте, не находятся ли ссылки внутри noindex, чтобы не было такой конструкции: <noindex>ССЫЛКИ</noindex>.
- Проверьте, находятся ли ссылки в индексируемой зоне доступного для индексации поисковыми системами документа. Если ссылки закрыты от индексации одним из следующих способов, они не будут найдены роботом нашей системы.
- Ссылки закрыты от индексации с помощью тегов
<noindex>,<!--noindex-->,<script>,<frames>,<applet>,<embed>,<object>, тегов форм или комментариев. - Страница, на которой размещаются ссылки, закрыта от индексации в файле
robots.txtили в метатегах. - К коду ссылки дописывается атрибут nofollow.
- При проверке наличия ссылок на страницах, робот получает отличный от 200 код ответа в HTTP заголовках Вашего сервера.
- Ссылки не размещены внутри тега бегущей строки
<marguee>. - Ссылки размещены за пределами тегов
<html>и<body>. Для корректной проверки ссылок теги<html>и<body>должны встречаться в коде страницы один раз и ссылки должны быть размещены между этими тегами. Если это не так, вам нужно исправить ситуацию: поместить ссылки внутрь тегов. Если у вас отсутсутствуют эти теги, добавьте их. Т.е. правильное размещение ссылок должно быть такое:<html> <body> <!-- ссылки --> </body> </html>
- Ссылки закрыты от индексации с помощью тегов
- Возможно движек вашего сайта (или какой-то установленный модуль) автоматически закрывает внешние ссылки в теги noindex или дописывает атрибут nofollow к ссылке. Часто ссылки таким образом закрываются только от роботов (и в том числе от нашего робота). В этом случае вам следует отключить применение подобных модулей для наших ссылок.
- Проверьте, соответствует ли кодировка, указанная в метатегах страницы, кодировке
windows-1251. Если кодировка отличается, проследите, чтобы она же была указана в коде вызова ссылок, который вы вставляете на страницы. В случае, если, например, Ваш сайт использует кодировкуUTF-8, необходимо в исходном коде вывода ссылок строку<?php $sape = new SAPE_client(); ?>изменить на:
<?php $o = array(); $o['charset'] = 'UTF-8'; $sape = new SAPE_client($o); unset($o); ?>Для любой другой кодировки действия аналогичны. Так же проверьте, что кодировка указана в мета-тегах страницы.
В некоторых броузерах стоит автоопределение кодировки, поэтому, чтобы убедиться, что с кодировкой все в порядке, укажите кодировку в браузере принудительно (обычно она задается Вид->Кодировка-> Указываете нужную кодировку).
Некоторые кодировки, не поддерживают кириллические символы — и в error уходят только ссылки, содержащие русские буквы. Например, не поддерживает кириллицу кодировка
ISO-8859-1илиwindows-1252. - Проверьте, чтобы исходный код ссылки в точности соответствовал тому, который в файл
links.dbзагружает система. Зачастую, некоторые CMS подставляют свои стили в ссылки, или, например удаляют двойные пробелы и т.п. Наш робот ищет точное соответствие, т.е. если в ссылке изменился хотя бы один символ, она не будет найдена. - Возможно, Ваш сервер не верно или в нестандартном формате возвращает переменную окружения
HTTP_HOST(такая проблема часто возникает, если сайт имеет алиасы, зеркала или «висит» на нестандартном порту). Для того, чтобы в явном виде передать правильное значение в сервисный скрипт, необходимо в коде вызова ссылок (который Вы вставляете на страницы сайта) строку<?php $sape = new SAPE_client(); ?>изменить на:
<?php $o = array(); $o['host'] = 'имя_вашего_домена_без_http://'; $sape = new SAPE_client($o); unset($o); ?> - Возможно, проблема в том, что в тексте страницы есть неизвестные спецсимволы (обычно они отображаются «вопросами»), которые при разборе страницы роботом вызывают ошибку (http://ru.php.net/manual/ru/function.iconv.php) — то есть роботу видна часть страницы до спецсимвола. Единственный способ решения проблемы — очистить страницы от этих символов.
После выполнения всех вышеперечисленных проверок и рекомендаций при следующей проверке наличия ссылок нашим роботом, скорее всего, они будут найдены. В противном случае Вы можете обратиться за помощью в форму обратной связи, мы постараемся Вам помочь. Перепроверки Error ссылок происходят автоматически, несколько раз в течение суток.
При обращении, пожалуйста, укажите следующее:
- cайт, на котором возникла проблема;
- находятся ли ссылки внутри тегов
<html>и<body>; - кодировку сайта (совпадает ли она с кодом вызова ссылок);
- содержатся ли ссылки в файле links.db;
- стоят ли на папку права 777;
- выводятся или нет ссылки на сайт;
- прописан хост или нет (о том как прописать хост смотрите выше, пункт № 6)
- какая ошибка указывается при нажатии на статус ERROR.
Например:
site.ru
ссылки находятся внутри html и body
UTF-8, в коде внесены изменения
В links.db ссылки содержатся
Права 777 стоят
Ссылки на сайте выводятся
Хост прописан
При нажатии на статус ERROR выводится сообщение «Ссылки не найдены на странице»
Заголовок публикации отображает ответ системы в панели управления нового вебмастера Гугл.
Если ваш взгляд «спотыкался» на этом месте, то, скорее всего, вы начинали проверять свои:
- плагин Google XML Sitemaps;
- саму карту sitemap.xml по адресу сайта
После всех проверок получалось, что все вроде бы работает, а вебмастер, после добавления
новых страниц, упорно пишет:

У меня так и было.
Впервые обратил внимание на это предупреждение при отправке в индекс новых публикаций сайта на Битрикс.
Там плагина нет, но в модулях проверил, перепроверил, запустил создание нового файла карты, подождал некоторое время – в Google вебмастере по-прежнему: «…но ее нет в файле Sitemap».
Еще думал – возможно, только Битрикс не «отсвечивает» свои страницы в Sitemap, но оказалось и карты сайтов на WordPress не видит вебмастер.
Решил, что это сбой у Гугла (и там сбои бывают), не буду обращать внимания. Тем более что в поиске Google все эти страницы присутствуют.
Решил – забыл. Но ненадолго…
Практически каждый день приходится что-то добавлять в вебмастера, и это предупреждение постоянно смущает!
Нужно поинтересоваться у всезнающего Интернета – зашел, спросил.
А там уже давно это обсуждают и очень многие не могут понять «…а в чем же дело?». Все так же перепроверяют, поломок не находят, спрашивают на форумах, строят догадки.
Среди всего попался мне и ответ – смотрите ниже, в конце публикации: «Специалисты Google объяснили, почему…»
Из ответа следует, что все страницы в Sitemap на самом деле есть.
Но Гугл и Яндекс, не гарантируют индексацию их всех (страниц) именно с карты xml сайта.
То есть – страница и без карты проиндексируется и попадет (если она качественная) в поиск, а вот индексировать ее в файле Sitemap совсем и не обязательно. В первую очередь это касается страниц с малозначительным контентом. Я так понимаю – это не плохие страницы, а просто не несущие новой полезной информации.
Например, карточки товаров в интернет-магазине – в одном разделе может быть с десяток совершенно одинаковых вещей с разницей в 1 пункте характеристик.
На информационном сайте или блоге – короткие новости, уже размещенные в Интернете, копированные или неуникальные обзоры.
И так – я не могу утверждать, что представленный ответ является 100% ответом специалистов Google – информация взята с просторов Интернета. Но я успокоился и больше не «спотыкаюсь» на этом сообщении системы «Страница проиндексирована, но ее нет в файле Sitemap».
У вас есть свое мнение, информация? – пишите в комментариях
А вы вообще пользуетесь вебмастером Google и новой версией Яндекс вебмастера?
Знаю, что некоторые владельцы сайтов только слышали о них…
Кстати, давно обещал, пора бы уж и написать:
о новой версии Search Console (панель управления Google Webmaster Tools), а то старую скоро совсем отключат.
Так что не пропускайте, подписывайтесь и до встречи!

Если статья была интересна для вас — ей можно поделиться
Количество просмотров: 3 394