Сижу и думаю, насчет алгоритмов яндекса. Главная мысль - как он определяет тематичен ли ссылающийся сайт, если сайт не находятся в яндекс каталоге.
Если бы я был автором алгоритма яндекса, то примитивная модель действовала бы так:
- 1) Выделяем наиболее часто повторяющиеся слова в текстах, на странице ссылающегося сайта и на кого он ссылается.
- 2) Упорядочиваем их по релевантности, учитывая разметку (h1, h2, h3, b, title и т.д.).
- 3) Берем первые n ключевых слов (число n неизвестно, но предполагаю что не более 10)
- 4) Сравниваем ключевики, на совпадение.
Вводим коэффициенты a,b.
Колличество и качество совпавших ключевиков - это a%.
Максимальный тиц, который может передать ссылка на странице - это b. - 5) Итого получаем пропорцию:
x - a%
b - 100%
Отсюда тиц передаваемый ссылкой равен x=b*a/100.
Выводы:
Из моей теории следует, что сайт не располагающийся в яндекс-каталоге, не имеет тематику. Тематика определяется для каждой страницы сайта персонально.
Теория не претендует на реальность. После ее додумывания, начну тестировать на практике.
Усиленно читают у меня в блоге:
- картинку по приколу
- сколько тиц
- как изменить рейтинг в поисковике google
- примеры самоанализа внеклассного урока
- yandex webmaster сетка сайтов
- как защитить denver
![Google Bookmarks Google Bookmarks](/wp-content/plugins/bookmarkz/images/google.png)
![Digg Digg](/wp-content/plugins/bookmarkz/images/digg.png)
![del.icio.us del.icio.us](/wp-content/plugins/bookmarkz/images/delicious.png)
![Technorati Technorati](/wp-content/plugins/bookmarkz/images/technorati.png)
![Yahoo My Web Yahoo My Web](/wp-content/plugins/bookmarkz/images/yahoo.png)
![News2.ru News2.ru](/wp-content/plugins/bookmarkz/images/news2ru.png)
![БобрДобр.ru БобрДобр.ru](/wp-content/plugins/bookmarkz/images/bobrdobr.png)
![Memori.ru Memori.ru](/wp-content/plugins/bookmarkz/images/memori.png)
![МоёМесто.ru МоёМесто.ru](/wp-content/plugins/bookmarkz/images/moemesto.png)
![Mister Wong Mister Wong](/wp-content/plugins/bookmarkz/images/mrwong.png)