Архивы блога

Читая многих “супер-пупер-мега сеошников”, я нигде не встречал хоть какие-то намеки на поисковый механизм яндекса. Они любят писать, о том куда потратили пару лямов и какую крутую тачку купили. Вот только кому это интересно? Поэтому их давно нет в моей ленте.
Последнею неделю занимался анализом выдачи яндекса (делал программные интерфейсы на основе поиска яндекса), и подчерпнул некоторые интересные данные, о которых раньше не знал, или знал частично.
1) Самый интересный момент. Робот яндекса при индексации вашей страницы, делит ее на “пасажи”, то есть это некоторый аналог предложений. Но яндекс почему-то подчеркивает, что пассаж — это одно предложение, особенно если оно не слишком длинное.  На основе пассажей строится выдача. Т.е. если вы задали запрос “тиц яндекса”, то яндекс сначала найдет пассажи в которых встречаются оба слова, а остальные нам и неинтересны:)
Кроме этого добавлю, что пассажи бывают двух типов - обычные, и найденные по ссылке. Второй вариант думаю объяснять не надо.

Проверенная информация о пассажах:
Сколько бы релевантных пассажей не было на странице, title+единтсвенный пассаж в выдаче всегда будут выше чем даже 10 релевантных пассажей, но без нужного title. Title имеет максимальный приоритет.
Если вы спросили в поиске слово “яндекс”, то слова “яндексу” и “в яндексе” будут абсолютно идентичны по силе релеватности (подробности во втором пункте).

Предположение по поводу пассажей:

На основе пассажей определяется уникальность документа. Скорее всего механизм яндекса проверяет % соотношение пассажей, из всего этого вывод - перемешивать предложения бессмысленно. Уникальности вы этим не добьетесь.

2) Существует несколько типов словесных соответствий запросу.  Это phrase - буквальное соответствие (скорее всего имеются ввиду падежи), strict - точное соответствие (найдены все слова), all - все остальное (наверняка частичное вхождение слов из запроса)

3) Яндекс зачем-то имеет информацию о колличестве страниц с одного сайта соответствующих запросу (и называет это статистическими данными). Но на выдачу это никак не влияет. Мой сайт находится на первом месте в выдаче и имеет в этом параметре значение 4096, воторой сайт имеет значение 1.  Для чего эти данные тогда? Не врубился. Но отсюда вывод, что сайт может иметь абсолютное несоответствие тем на страницах. То есть одну страницу вы можете прокачивать текстами про то, как сделать молоко, а на другой писать про seo. Каждая страница будет равна в потенциале попасть в топ.

На сегодня все. Буду продолжать изучать механизмы поиска яндекса.

P.S. Начал делать свой сайт http://linkfeedator.ru для своего биржевого клиента. Конечно дизайнер из меня никакущий, но надеюсь навигация и содержание будут понятны. Сейчас сделал главную страницу:) Оцените пожалуйста, как вам оно?

Усиленно читают у меня в блоге:

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong
Мой бубен

Мой бубен

Чето задумался немного, а какое будущее у бирж ссылок? Только наивный будет думать, что яндекс не знает сайты, которые продают ссылки. Даже если я, ради спортивного интереса, смог за час написать скрипт, который выдрал всю информацию обо всех всех сайтах участвующих в биржах sape и linkfeed, то что уж говорить о работниках яндекса?:)
Даже последний баран может зарегиться в бирже и в интерфейсе оптимизатора найти все сайты:)

Другое дело, что яндекс пока нас не трогает, только малость пессимизирует:)
Так что закупайте новые бубны, и стучите в них как можно больше. Я себе уже прикупил:)

А теперь хотел рассказать об одной замеченной мной детале. Все говорят от апах тица и апах выдачи. Но анализируя ссылочную статистику, я заметил еще показатель - ссылочный апдейт. Он тоже довольно нестабилен.
Смотрите следующие графики:
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Сегодня пришла в голову уникальная мысль, объясняющая, почему иной сайт передает неимоверное число ТИЦ, а иной совсем ничего.
Итак, стандартное мышление: поисковый робот заходит на вашу страницу, индексирует ее и выявляет ключевые слова, по которым позже определяеться релевантность запроса. Также по соотношению ключевых слов сайта донора ссылающегося на сайт акцептор переходит тиц (определяется тематика). Но все видят, что эта тема далеко не катит. Хотя у нее есть свои плюсы. Например, если мы продвигаем сайт покупными ссылками с бирж наобум, то обычно для нулевика получаем с каждых 100 ссылок с тиц 10 - 10 тиц. А если продвигаем тематическими, то есть совпадают ключевики донора и акцептора, то на 100 ссылок с тиц 10 приходится 20-30 тиц. Но…. слишком эта схема расплывчата и далекооооо не всегда работает. Я долго задовался вопросом “ПОЧЕМУ”?
Седня ночью приснился мне новый важный параметр, о котором я немного знал, но не не обращал внимания.
Загляните в панель вебмастера яндекса, и увидите, что он хранит данные о запросах, по которым попадают на ваш сайт. Не трудно предположить, что эти данные не столь абстрактны, а яндекс хранит информацию о каждой странице и всем запросам по которым на нее пришли.
Исходя из этих данных, я представил, что яндекс строит соотношение тематик не по ключевикам страниц, а по ключевикам запросов на страницу. Ведь это очень многое объясняет. Это создает полную тематику!!!
Хотя, ключевики страницы и ключевики запроса должны совпадать, но это далеко не всегда так.
Также считаю, что колличество запросов на сайт донор релевантных вашему сайту увеличивает передачу тиц. Таким образом, этим я объясняю внезапные падения или рост тиц.

Можете стебаться над моими мыслями, и сказать что сеошники любят выдумывать всякую хрень, но это всего лишь теория, которую также трудно опровергнуть, как и подтвердить. Зато из моей теории следует, что морда сайта (обычно самая посещаемая по запросам), должна передать максимальный тиц. Кто-нибудь продвигался мордами? Также из этой теории следует, что у сдл сайтов будет больше передача, чем у гс.

Вообщем будет интересно услышать любые мысли.
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

На данный момент довольно актуальна встает проблема о защите своего контента в блогах и на сайтах. Любой школьнег может поставить плагин на wordpress и тырить ваши статьи к себе. Чуть более соображающий человек легко подправит плагин, и вырежет из него все ссылки, так что вам от этого точно лучше не станет.
Мне стало интересно, как к этому относится яндекс и google, и я написал им письма со следующим вопросом:

Здравствуйте!
Меня очень интересует вопрос о защите статей, которые я пишу на сайтах. Многие легко могут скопировать их на свой сайт с помощью грабберов или вручную, и удалить из них ссылки (если они были) на мой сайт, и не сказав об авторстве.
Как к этому относится яндекс?
Есть ли способы, как можно сообщить роботу яндекса, о том, что статья принадлежит именно мне, или хоть как-то защититься от копирования? Очень  интересно узнать мнение специалиста.

На следующий день мне пришел интересный ответ:

Здравствуйте,  Борис!

Поисковая система Яндекс является лишь зеркалом русского Интернета, поэтому мы
не правомочны разбираться в вопросах плагиата.
Чтобы защитить свои авторские права Вам надо, видимо, обратиться к хозяевам
указанного сайта и к провайдеру, на сервере которого он находится. Если сайт
прекратит свое существование, он будет удален из поисковой базы Яндекс
автоматически.

Тем не менее, мы уже работаем над алгоритмами, которые будут способны отличать
текст источника от плагиата.


С уважением, Платон Щукин
Служба поддержки Яндекс.Ру

Итак, мои соображения - судя по выдаче и моим некоторым экспериментам, яндекс сейчас абсолютно никак не порицает копирование контента. Ноо.. если сплог например копирует rss в некоторую категорию от wordpress, он никогда не подымется в выдаче выше вашего сайта. Так как у вас, обычно, есть комментарии, ссылки с тегов, и еще много внутренних ссылок. Само собой вы будете выше.
А в бан уходят не за копирование контента!!! А за то, что вы не попадаете в выдачу, и если посмотреть средства веб-мастера, то обычно у вас переходы только с бирж, и проверки на индексацию той или иной страницы. Ваш сайт начинает считаться спам-сайтом и гудбай доход с него. Поэтому, если надумаете делать сплог, то долго на автомате вы не проживете. Придется делать его более релевантным, чем сайты, с которых вы “тырите” информацию.
В результате, прихожу к выводу, что бесполезно защищаться от граббинга rss, и нужно только больше уважать самого себя, если за вами такое пристальное внимание:)
Но если это создает увеличенную нагрузку на ваш сервер (хостинг), то предлагаю банить определенные ip как минимум (хотя это не всегда вариант, в частности для VPN-подключений к интернету). Если меня коснется эта проблема, то буду думать, что делать дальше. Пока перегрузов не чувствую.

P.S. В принципе, робота всегда можно отличить от человека, например, по скорости переходам по страницам, и можно сделать плагин для временного блокирования такого ip. Если припрет - короче сделаю:)
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Итак, адпейт вроде притормозил, и уже видны устаканившиеся результаты.
У меня они следующие (привожу результаты за три последних апдейта):
1) ТИЦ 20->10->50. Сайт в яндекс каталоге. Раскручивал тематикой из каталога, и чем попало- просто тематикой.
2) ТИЦ 10->0->10. Ничего не делал. ТИЦ сам по себе прыгает. (покупал сотню ссылок 2 апа назад)
3) ТИЦ 0->0->10 (тоже закупал сотню ссылок с тицом в среднем тиц 10 два апа назад)
4) ТИЦ 30->20->10 Новых ссылок не докупал, а старые потихоньку отваливались и уходили в бан. В первый месяц было куплено 200 ссылок, и получено 30 тиц, во второй осталось 150, стало 20, и в третей осталось 80, стало 10:)
По остальным сайтам подъема не особо ожидал и их нету. Много где прожадничал и недокупил “королевскую сотню”:) В результате на остальных площадках никаких изменений.
Обидно конечно, что этому блогу не дали никакой прибавки. Я столько старался - писал уникальный контент, и сделал ссылок туеву хучу! Яндекс жлоб. Поскольку этот сайт прокачивался блогами и форумами, делаю окончательный вывод, что они НЕ ПЕРЕДАЮТ ТИЦ!!!! Яндекс сдержал свое слово, написанное в правилах, а значит и я забил на раскрутку блогуном в дальнейшем. Сцуко короче яндекс. Такую хорошую халявную нишу прикрыл. И нихрена я теперь не поверю, что хруммером люди повышают себе тиц. Туфта это все. Хоть я и делал себе ссылки вручную, без всякой автоматизации, но всегда проверял на наличии noindex в комментах. Хад! Я тебе припомню еще)
Но в целом апом я доволен. Хотя бы нет массовых падений, как в прошлый раз, и этому я уже рад:)

А теперь о навеянном в моем прошлом посте про Атрибуты страницы влияющие на продвижение в Google.
Я долго думал над словами знаменитого оптимизатора Русь Джонса.
Цитирую: “Имеется тунельное правило. Если Сайт А ссылается на Сайт B, а B ссылается на C, и сайт А содержит в анкоре допустим слово “виджет”, и сайт B тоже содержит “Виджет”, ссылаясь на С, то это дает дополнительные преимущества сайту А.“.
Мне кажется, что эту схему мы обыграли с Seoблондинкой, когда вышли в топы google и почти топы яндекса по теме “основной и дополнительный индекс гугла”. Суть была простой - она написала текст про индексы гугла, я продолжил его, сославшись на блондинку, а она после этого сослалась на меня. В итоге получился замкнутый тунель из двух сайтов. Причем в индекс гугла, я думаю, мы попали в разные дни поочередно. Если бы кто-то еще продолжил эту тему, сославшись на нас, то это бы убило рейтинг:)
А теперь можно предположить, что яндекс не сильно отличается от гугла и у них есть, что-то общее. Предположим, что яндекс тоже поддерживает тунельное правило и учитывает его при расчете тиц!
Таким образом, максимальную передачу тиц имеет ссылка, которая имеет аналог анкора на странице донора, и ссылается на другой сайт. Я бы еще предпожил, что заголовок страницы тоже очень важен.
Итак, я вывел новую теорию, которая будет моим следующим экспериментом:
“Если купить ссылку с анкором “виджет”, на странице, где есть ссылка на другой сайт с тем же анкором, и заголовком, то мы получим максимум передачи тица. Остальные получат либо по минимуму, либо 0.”
Из этой теории вытекает хорошее следствие - это понижает нагрузку на сервера яндекса, поскольку всего лишь нужно прогнать поисковик по анкорам, и по заголовкам, чтобы рассчитать ТИЦ. И я до сих пор считаю, что алгоритм яндекса не столь замудрен, поскольку никакие сервера за сутки не смогли бы пересчитать все сайты рунета.
Конечно не стоит мне верить, и это всего лишь теория, то бишь, предположение, но эта теория будет проверяться на практике. Посмотрим, что получится из этого. Плохо только, что времени на это уйдет достаточно много, чтобы отобрать страницы с нужными мне анкорами и заголовками, ну да ладно. Ради такого дела стоит постараться.

P.S. Если думаете, что моя теория полня х…ня, то так и скажите:) А вообще интересно узнать мнения, логично ли я предположил?:)
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Итак, яндекс ввел кластеризацию бирж статей…
На практике это означает, что теперь яндекс не банит весь сайт за продажу статей, то есть рекламного спама,  а находит эту часть и банит только ее (выбрасывает из индекса).

Как же можно обнаружить биржу статей?

Думаю любую биржу статей нетрудно вычислить из-за абсолютно разнородных статей на разную тематику, и явных факторов. В частности обратите внимание на ссылки создаваемые биржами. Они тупы до невозможности. SEF обычно там даже и не пахнет.

Также под кластерный бан попадают сайты, которые продают статьи по чрезвычайно низким ценам. Я ради эксперимента понизил цену на статьи на одном сайте до 5 центов, и продал порядка 200 статей. Сайт не забанили, но продажные статьи не индексируются, и что еще интересно - у сайта отняли почти все линкбэки, кроме “настоящих”. Похоже что яндекс берет под строгий досмотр такие продающие сайты.

Теперь напишу о явных плюсах бирж статей, которые даже нравятся яндексу: если вы не любите часто обновлять контент на вашем сайте, а продаете ссылки, то яндекс забанит ваш сайт. В случае, если вы продаете статьи по нормальной цене, и есть в итоге небольшой прирост контента, то яндекс доволен и ваш сайт живет спокойно:) У меня по-крайней мере ни один сайт еще не ушел в бан, если я не проделывал “бан-эксперимент”))

Вообщем думайте насчет продажи статей. Если делать с умом, то во всем есть плюсы. А без ума вам и в интернет-заработках делать нечего:)
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Продвижение блога в яндексе

Продолжаю тему, начатую в посте продвижение блога на wordpress в топы яндекса, и как говориться в народе “спалю тему”:) Речь пойдет о топах среди блогов, и поднятии своих пузомерок.
Итак, допустим мы поставили цель поднять свой авторитет по версии яндекса. Но денег у нас в кармане нет или тратиться не охото. Но выход есть:) И выход прост - блог может набирать авторитет сам по себе.
Основан этот выход то ли на дыре обнаруженной в яндексе, то ли на странной политике яндекса. А теперь суть: яндекс прибавляет авторитет и колличество ссылок на ваш блог, за счет того что вы ссылаетесь из одного поста своего блога на другой. Таким образом растет колличество ссылок, которое у меня отображается справа в счетчике яндекса, и растет авторитет.
Но… мной обнаружена еще одна интересная зависимость. Как я уже писал в прошлом посте, наша авторитетность зависит от ссылок и читателей. Причем зависимость интегральная и довольно строгая. Говоря по-русски, вы не сможете поднять авторитет выше вашего числа читателей, либо этот подъем замедляется.
Такой вывод был сделан мной из следующих фактов: колличество ссылок с блогов, или внутри блога между постами у было константой n-ое время. А число читателей менялось. В цифрах было следующее: один день мой авторитет был 314, ссылок 18, читателей 5. На следующий авторитет 286, ссылок 18, читателей 3.
Отсюда делаю вывод, что читатели оказывают нехилое влияние для новых блогов.
Отсюда вытекает задача поднять число читателей. Для этого регистрируем в яндексе новый аккаунт, добавляем свою rss в яшкину ленту и читаем ее один раз. Так мы сделали одного пожизненного читателя:) А что нам стоит сделать 10-ок?) Максимум 20 минут работы блин.
В результате мы не тратим ни рубля, и получаем авторитет блога.
Кто что думает о таком “самопродвижении”?
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Многие используют яндекс, и даже не замечают, что его алгоритмы меняются и дорабатываются, и каждый уважающий себя сеошник пристально следит за мельчайшими изменениями этих алгоритмов.
Сегодня я бы хотел просветить “серую массу”, для которых слова типа Магадан, Находка и Анадырь лишь название городов на карте:)
Перелопатив солидную долю рунета, мне удалось добыть некоторую информацию и выстроить ее в логическую цепочку.
Начиная с 14 апреля 2008г, Яндекс решает называть свои поисковые алгоритмы названиями Российских городов (Раньше он называл их цыфрами и последний по-моему был SP8), и обещает в дальнейшем информировать пользователей об основных изменениях заранее, а также дает возможность тестировать новый алгоритм на дополнительном адресе.

16 мая 2008г. Алгоритм Магадан
Итак, долгожданный Магадан поселился на основном адресе яндекса.
Основные изменения:

  • Увеличино число факторов ранжирования вдвое(!!!).
  • Добавлены классификаторы, позволяющие лучше понять тип страницы и тип ссылок.
  • Изменена технология поиска так, что яндекс может быстро выбрать наиболее релевантные документы в первую очередь и не ждать поиска по остальным страницам.
  • Смягчили фильтрацию отбора документов для ранжирования, что привело к улучшению ранжирования по запросам, для которых релевантные документы содержат слова запроса далеко друг от друга, например, “бмв цирк колеса”.
  • Научился обрабатывать при поиске аббревиатуры и написания транслитом
  • Яндекс начал глубже понимать текст страницы и его качество.
  • Теперь нераздельные слова он находит нераздельно: например C++ или Европа+.
  • Введена стадия прюнинга. Фактически это эвристический анализ, и яндекс на этой стадии определяет релевантность документа по самым ярким признакам (скорее всего титлы и заголовки), остальные документы даже не рассматриваются. В результате сильно возрасла скорость и упала нагрузка.

Судя по отзывам пользователей у Магадана сильно ухудшилась выдача по множеству запросов. В топы полезла всякая лажа.

2 июля 2008г. Алгоритм Магадан 2.0

Основные изменения:

  • добавлены факторы, учитывающие уникальность контента (с этих пор ГС стали хорошенько банится)
  • Введен классификатор порнографии (Фактически множество сайтов соответствующей тематики вылетели из индекса, а новенькие вошли)
  • Введен геоклассификатор. Довольно хорошая вешь, когда ишешь что-то в своем городе.
  • Введен классификатор коммерционализированности. Интернет магазинами я не занимался и не могу сказать как он на них повлиял.
  • Об остальных факторах яндекс умалчивает.

В результате сильных изменений не возникло. Некоторые ГС-ы и сплоги пошли в бан. Тиц как обычно понизился где-то на 20-30%, и все успокоились..

11 сентября 2008г. Алгоритм Находка

Основные изменения:

  • Выросло качество поиска со стоп-словами
  • Изменился подход к машинному обучению. Теперь яндекс расширил свой словарь путем автоматического анализа имеющихся текстов.
  • Научился искать слова которые пишутся как раздельно, так и слитно. Например, автоваз и авто ваз.

В результате я не почувствовал изменений. Хотя у новых сайтов резко возрос траффик.

Следующая остановка алгоритм Анадырь

Ходит слух, что он был использован в этом апе, но слух пока ничем не подтвержден.
Буду рад любым мнениям об изменениях яндекса и направлении их деятельности.
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Все наверняка знают про рейтинг блогов яндекса. Сейчас немного расскажу чтоже в реальности происходит, и как вычисляется ваша авторитетность блога и соответственно позиция.
Еще раз перечитаем, что же сказал нам мудрый яша в своей библии:

Рейтинг составлен на основе авторитетности – интегрального показателя, основанного на данных о том, как часто другие блоггеры ссылаются на рассматриваемый блог, кто именно ссылается, количества комментариев в блоге, количества известных нам читателей блога, а также других данных о блоге и его положении в блогосфере.

А теперь я переведу на русский, с учетом того, что мы ведем блоги на wordpress:)

Рейтинг составлен на основе авторитетности - интегрального показателя, основанного на данных о том, как часто другие блоггеры ссылаются на посты рассматриваемого блога, насколько авторитетный блоггер ссылается, количества комментариев в блоге, количества известных нам читателей блога по яндекс-ленте и фидбернеру, а также других данных о блоге и его положении в блогосфере.

Далее сами делайте выводы:) Кстати в моем переводе я указал частую ошибку, которую делают рекламодатели в блогуне, когда раскручивают блог. Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Всех с новым годом!:)

Итак, я наконец появился. Просто выскажу некоторые мысли, чем занимаюсь и что происходит.

Итак, яндекс сменил свои поисковые алгоритмы на “анадырь”. Теперь один из эталонных сайтов считается википедия, и не трудно догадаться что теперь ценится в выдаче. Кто не доперь - качественная внутренняя перелинковка.

Под качественной подразумевается схожество тематики своих же внутренних страниц. Ну забудем про злого яшу, и немного порадуемся доброму гугле. Как обычно халвная раздача пиарок для гс, и падение сдл, на которых продавались ссылки. При падении в принципе нечему удивляться. Если продаешь ссылки, то у тебя вычитается pr, и с этим ничего не поделать.  Также все больше подтверждаеться теория, что pr - это вероятность перехода на страницу. Только раньше считалось, что вычисляется это неведомыми способами. Я же думаю, что это всего лишь вероятность перехода из гугля на внутряк, или главную. Так что, не такой уж и добрый гугля, хотя и дал этому блогу pr2:) (Зато у моего хорошего сайта понизил с 6-ки до 3-ки).

Сейчас поставил цель вывести свой блог в топах яндекса в 1000-у. Задача не столь трудная, и уже не первый раз с ней сталкиваюсь. За неделю вывел блог с >1000000 до 400000. Думаю в течении месяца допру до 1000. Многие спросят: “а нафига оно нужно?”. А цель проста. Хочу попробовать подзаработать на блогуне. Кстати, в топы вывожу тоже с помошью блогуна.

Блогун - монетизируем блоги

Усиленно читают у меня в блоге:

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong
Яндекс.Метрика