Теги Карта сайта СЕО КОНКРЕТSitemap

SEO оптимизация, Интернет маркетинг, контекстная интернет реклама и бизнес.

ГЛАВНАЯ

Определения типа контента

28.03.2010 | 21:02
Pубрика: Все заметки, Для веб-мастера и seo-оптимизатора, Интересные статьи и новости - читать, Новости Google, Продвижение сайтов, Статьи и переводы, Технологии SEO

Есть разные способы скачивания и проверки контента

Eric Enge:

Google делает запросы заголовков для определения типа контента?

Matt Cutts:

Для тех, кто не в курсе, есть разные способы скачивания и проверки контента.

При использовании GET вы делаете запрос к веб-серверу для получения контента.

При использовании запроса HEAD вы запрашиваете веб-сервер о том, изменился контент или нет. Веб-сервер может ответить подробно или кратко (да/нет), и он не отсылает контент в ответ. На первый взгляд, можно подумать, что запрос HEAD самый подходящий для поисковиков способ сканировать веб и скачивать только те страницы, которые изменились со времени последнего сканирования.

Оказывается однако, что большинство веб-серверов делают примерно такой же объем работы для выяснения изменилась ли запрашиваемая через метод HEAD страница.

Мы проверили и обнаружили, что в реальности более эффективно всегда делать GET запросы, и не делать предварительных HEAD запросов для сканируемой страницы.

Но есть несколько задач, для которых мы используем запрос HEAD. Например, наш сканер картинок может использовать HEAD запросы, поскольку изображения могут быть гораздо больше по размерам, чем веб-страницы html.

Если говорить о сканировании html и другого текстового контента, мы обычно используем просто GET и не делаем предварительных HEAD запросов. Мы пока используем вещи типа If-Modified-Since, где веб-сервер может ответить, изменилась страница или нет.

Есть еще рациональные способы для сканирования веба, но HEAD запросы в действительности не экономят ресурсы, если говорить о сканировании html контента, хотя мы используем их при сканировании графического контента.

Eric Enge:

Возможно, вы используете их также для видео-контента, правильно?

Matt Cutts:

Это так, но надо бы проверить.

Eric Enge:

Вернемся к дискуссии о многоаспектной навигации. Мы работаем с сайтом, имеющим очень развитую схему многоаспектной навигации. Она действительно удобна для пользователей. Они получили существенное увеличение конверсии после реализации такой схемы на их сайте. И это привело к улучшению показателя размер прибыли с посетителя, это хороший результат.

Matt Cutts:

Безусловно.

Eric Enge:

С другой стороны, они обнаружили, что у сайта существенно снизилось количество проиндексированных страниц. Предположительно потому, что страницы представляют из себя по большей части просто списки продуктов с разными порядками сортировки.

На страницах мало текста; ботам там особо нечем поживиться, так что они выглядят как некачественные страницы или дубликаты. Как лучше поступить тем, кто столкнулся с подобной проблемой. Нужно запретить сканирование таких страниц?

Matt Cutts:

В некотором смысле, многоаспектная навигация может выглядеть для поисковиков почти как мини-лабиринт, потому что имеется множество путей, по которым вы дробите свои данные. Если поисковики не могут пройти через этот лабиринт к реальному продукту, тогда могут быть сложности, если говорить об алгоритме определения важности (value add) индивидуальных страниц.

Возвращаясь к ранее данному мной совету, если вы можете ограничить число сущностей или признаков по которым вы делить данные, то это может отчасти помочь и иногда избегать путаницы. Это то, куда стоит посмотреть. Если есть категория, иерархия по умолчанию, или наиболее эффективный либо удобный для пользователя способ навигации, это стоит попробовать.

Вы можете попробовать при помощи тега rel=canonical на страницах  многоаспектной навигации сослаться на страницы, образующие обычную ниспадающую иерархию. Это поле для экспериментов для нахождения подходящего решения.

Я думаю, что это может помочь объединить множество страниц  многоаспектной навигации в один путь к множеству разных продуктов, но вам нужно следить за тем, как на это реагируют пользователи.

Eric Enge:

Если гуглбот видит на сайте 70% страниц с редиректом или тегом rel=canonical на другие страницы, что произойдет? Когда вы сталкиваетесь с таким случаем, вы уменьшаете время на сканирование таких страниц, потому что уже встречали этот тег ранее?

Matt Cutts:

Не так уж много, чтобы rel=canonical повлял на это, но наши алгоритмы попытаются сканировать сайт, чтобы выяснить полезность и ценность этих страниц. Если мы обнаружим большое количество малоценных страниц, тогда мы можем не сканировать так много страниц с этого сайта, но это не зависит от rel=canonical. Это может произойти и с обычной каталожной навигацией, если видим ссылки и только ссылки.

Это действительно та область, где каждый сайт может пробовать разные подходы. Я не думаю, что есть что-то обязательно неправильное в том, чтобы используя rel=canonical, попробовать направить поисковик по одному предпочтительному пути навигации сквозь набор разнообразных разделов и категорий. Просто пробуйте и сокращайте количество разных вариантов путей, выстраивайте более логичную структуру путей.

Eric Enge:

Это звучит как оставьте недостатки в покое, пусть сканер тратит кучу своего времени на такие страницы, которые не попадут в индекс.

Matt Cutts:

Да, это так. Если подумать над этим, то каждый уровень или новый путь при помощи которых вы нарезаете и дробите данные, это еще одно измерение, в котором можно сканировать весь каталог продукции, и все эти страницы могут не иметь данных о действительных продуктах.

Можно еще сделать навигацию через город, штат, профессию, цвет, цену и т.д. В действительности нужно иметь на большинстве ваших страниц описания действительных продуктов с кучей текста.

Если ваша навигация слишком сложная, относящиеся к ней материалы не нужны поисковикам для поиска, индексации и ответа на запросы пользователей. Очень часто многоаспектная навигация является прокладкой между пользователями или поисковиками и реальными продуктами.

Это просто прокладки и наборы разных промежуточных страниц, на которых нет искомой информации. Иногда это может быть неприятно с точки зрения поисковика или пользователя.

Расшифровка стенограммы интервью

Cканирование и индексация сайтов
ЧИТАТЬ » »

Потерянный ссылочный вес и дублированный контент
ЧИТАТЬ »»

Идентификатор сессий - Session Ids и дублированный контент
ЧИТАТЬ »»

Партнёрские программы, учёт ссылок и проблема дубликатов
ЧИТАТЬ »»

Многоаспектная навигация, тег canonical
ЧИТАТЬ »»

301 редирект и его влияние на PageRank
ЧИТАТЬ »»

302 редирект и Google
ЧИТАТЬ »»

Обзор тега canonical
ЧИТАТЬ »»

Файлы KML (для Google Earth и Google Maps)
ЧИТАТЬ »»

Определения типа контента
ЧИТАТЬ »»

PageRank Sculpting - накачка PageRank
ЧИТАТЬ »»

PDF файлы, JavaScript и другие, оставшиеся вопросы
ЧИТАТЬ »»

На первую страницу
ЧИТАТЬ »»

Информационная статья - Определения типа контента Читайте также

Информационная статья - Определения типа контента Понравилась статья?

Подписаться на RSS фид »
Подписаться на обновления по e-mail »

Всего комментариев: (2)

1

Candy | 01.04.2010 | 09:18 | Ответить

Интересно, спасибо!

2

Daily | 17.12.2010 | 06:41 | Ответить

А если робот не хочет проверять страницу с изображениями, можно же поставить какой-нибудь плагин чтобы выводил случайные статьи внизу страницы?

RSS комментариев к этому посту | Trackback URI

Оставьте комментарий

Читайте, где Вам удобнее

в Яндекс.Ленте Google Reader Twitter! Follow!

Недвижимость в Германии
Категории Последнее Популярное

Актуальная статья

Полезность для общения и бизнеса : jabber технологии + пейджеры на сайт = бесплатный сервис для бизнеса и легкого приватного диалога.
Данный обзор написан для тех, кто пока не встал на сторону jabber сервисов и живет старыми понятиями «аська-квип».
Не будем вас разочаровывать: новые возможности, которые дают нам современные технологии выше и они работают более гибко, чем [...]

Читать дальше »

Интересные вебресурсы

Важные новости

Уважаемые друзья, случайно удалила все комментарии за июль. Приношу извинения

SEO
SEO

Последние комментарии

Самые комментируемые

ТОП комментаторы

Статистика

Rambler's Top100

SEO

© 2009, SEO-Konkret.ru - SEO оптимизация, Интернет маркетинг, контекстная реклама, интернет реклама и бизнес       Контакты
Спасибо WordPress.com :)

Вы читаете статью: «Определения типа контента»