В каждой шутке есть доля правда

Набросал скриптик, использующий 6 характеристик яндекса (школьнег, угадавший первый - получит целый 1 wmr))).
Сначала можете проржаться, а потом попробовать повводить сайты, и посмотреть какой максимальнй ТИЦ они передали бы в качестве донора))

Введите URL

Усиленно читают у меня в блоге:

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Итак, продолжаю прошлый пост “завязку боя“. Сначала посмотрим на врага исторически.
Термин - “Яндекс” представляет оригинальный гибрид, ни в русском ни в английском языке ничего не обозначающий.
Елена Колмановская, главный редактор Яндекса, поясняет, что придумал это слово  отец-основоположник нашего поиска, ныне технический директор компании “Yandex”, Илья Сегалович. “Яndex” означает “Языковой index”.
Другое толкование предлагает Аркадий Волож, генеральный директор компании:
“Это название “Яндекс” - придумал Илья Сегалович (главный разработчик “Яндекса”) по аналогии с продуктами Unix (например, YACC - Yet Another C Compiler). А мне понравилась русская транскрипция. “Яндекс” означает “языковый индекс”: буква “я” - очень русская буква. Это индексирование с русской спецификой. А потом придумалось много других объяснений, например: I - это “я” по-русски. Есть еще вариант: ЯНЬдекс и ИНЬдекс - инь-янь. Исследования на эту тему продолжаются.”

Итак, вступление не о чем. А теперь к делу.
Поскольку наше единственное оружие в борьбе с ним - мозги, причем верхние, их то и пришлось подключить.
Передо мной появилась задача - “какие ссылки покупать, чтобы был максимальный эффект в выдаче?”. Раньше я ставил перед собой задачу - определить человечность сайта на автомате. Но человечность, как оказалась стала скоростью индексации, и с выдачей она никак не связана. Продолжая анализировать xml yandex, пришел к следующему незамысловатому скрипту. Причем в двух вариациях, которые и предлагаю вам потестить.

1) Задумка первого скрипта проста - подняться в выдаче yandex, за счет покупки релевантных ссылок. Я решил взять выдачу в разрезе конкретного запроса. Например: мы хотим продвинуться по слову “ссылка”. Для этого скрипт выдирает из Яндекса n-сотен сайтов, которые находятся там по запросу “ссылка”. Далее копируем этот список в вашу любимую биржу в белый список сайтов, и скупаем с этих сайтов ссылки (если сайты вообще найдутся в бирже). Теоретически, в результате эти сайты должны быть более релевантны в нужном нам запросе, что позволит подняться в выдаче. Протестировать скрипт можете здесь: скрипт прокачки выдачи.

2) Аналогично получился скрипт, который в теории должен установить тематику в разрезе конкретного запроса в Yandex,  с целью поднятия ТИЦ (тематического индекса цитирования). Скрипт основан на параметре - число страниц на сайте релевантных запросу. Ситуация почти аналогична: ваш сайт есть в индексе по запросу “ссылка”. Вводите этот запрос в мой скрипт, он выдает вам список сайтов по этому запросу, но справа от каждого сайта указывает число: сколько страниц на сайте тематичны этому запросу. Чем больше страниц, тем больше вероятность что сайт тематичен вам в целом. Далее таже схема - вносите сайты в white list на бирже и скупаете по ним все что есть. Протестировать скрипт можете здесь: скрипт прокачки ТИЦ

Буду рад услышать ваши теоретические предположения по эффективности обоих скриптов. Мне же не охото покупать ссылки по стандартным схемам - “много дешево и сердито” или “мало дорого и наугад”. Охото иметь хоть какую-то связь покупки и оценку результативности.

Оба экспериментальных скрипта будут в дальнейшем внедрены в проект linkfeedator, и для тестов будут работать всего два-три дня. Они также имеют ограничения по 1000 запросов в сутки.

Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Меня постоянно мучает вопрос, почему один сайт при ста ссылках не получает ни копецки ТИЦ, другой получает 10, а третий 100. В чем секрет и загадка? Кстати, замечу, что ни разу не видел, чтобы сайт получал тиц больше чем колличество ссылок с различных сайтов на него. Возможно сайты из яка исключения, но мои сайты в яке тоже не превысили этого значения, и идут наровне с колличеством. У кого-нибудь есть примеры исключений?
Немного задумался о пессимизации и логичном ранжировании по внешним ссылкам. Скажите мне, на кой хер, на нормальном сайте будет более двух ссылок разделенных хотябы ста символами символами текста? Даже последнему пню ясно, что это уже блок ссылок, направленный на расскручивание внешних сайтов. А уж яндексу и подавно до фонаря для чего вы выставили столько ссылок. Он либо тупо занизит до невозможного передачу тица, либо вообще проигнорирует эти ссылки. А если блок уже из пяти ссылок разделенных мизерным текстом? То это уже совсем гавнецом начинает пахнуть.
Итак, решил провести эксперимент, и проверить на практике, как же все-таки яндекс относится к ссылкам которые находятся внутри нормального контента, окруженные целыми абзацами текстов, и попадающие в тему. Да-да, речь идет о контекстых ссылках. Полазил по блогам и не смог найти вменяемого ответа на вопрос: “есть ли отличия от продвижения обычными ссылками от контекстных?“. Везде пишут, что бабушка сказала, что это одно и тоже. Уффф. Чувствую пока сам не проверю, так и не узнаю правды.
В этом и состоит задача моего эксперимента. Для начала скажу, что был выбран сайт с нулевыми параметрами, возрастом 4 месяца, с сотней уникальных статей в индексе, и всего одним линкбэком с бобрдобр (я его всегда использую для быстрой индексации). Тематика - экология.
По стандартной схеме - у меня на каждые покупные сотню обычных ссылок приходилось 10 тиц. Если покупал сотню ссылок с сайтов, где заголовок страницы совпадал с моим анкором, то получал 10-30 тиц.
А теперь наконец узнаю чего же стоют контекстные ссылки.
Было куплено 50 (!) тематических контекстых ссылок с тиц 10-200 (в среднем 100). Все сайты прошли жесткий ручной анализ и просмотр (уфф, сутки убил) на их историю, колличество контента и качество сайта, чтобы полностью исключить хоть малейшее “попахивание гавнецом”. Я бы взял больше контекстных ссылок, но их больше не было(( Под мои 20 ключевиков попали только 50 нормальных сайтов.
В следующий ап и последующий сообщу о результатах этого эксперимента (хотя все равно вам придется проверять самим, так как лучше никому не верить, но если у меня эксперимент будет удачным, то у вас хотя бы будет стимул проверить).
Если эксперимент будет неудачным, то уйду нафиг штопать уникальные статьи и ими раскручиваться. Хотел начать седня, но интерфейс линкфида по покупке статей накрылся, а сеозавру и лиексу я уже не верю.

Рекомендую почитать блог от Fewal Учимся заробатывать в сети , и добавить его в свою френд-ленту;) В блоге узнаете о новых экспериментах по поднятию тица, заработке на контексте и многом другом.
Также в продолжение к моему предыдущему посту о google alerts рекомендую почитать блог Игоря с очень интересным постом, где он собрал все сервисы гугла на одной странице. Об очень многих я даже не знал.

Блогуном я решил больше не баловаться так активно и больше одной платной ссылки в конце блога ставить не буду, иначе скотина яндекс не берет такие страницы в индекс.
И в чьем-то блоге увидел пост, что яндекс выкидывает из индекса столь популярные бомжовые “субботники”, когда начинаешь писать что твориться у остальных блоггеров. Так что тоже рекомендую теперь быть поосторожней с этим делом.

Усиленно читают у меня в блоге:

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Сегодня пришла в голову уникальная мысль, объясняющая, почему иной сайт передает неимоверное число ТИЦ, а иной совсем ничего.
Итак, стандартное мышление: поисковый робот заходит на вашу страницу, индексирует ее и выявляет ключевые слова, по которым позже определяеться релевантность запроса. Также по соотношению ключевых слов сайта донора ссылающегося на сайт акцептор переходит тиц (определяется тематика). Но все видят, что эта тема далеко не катит. Хотя у нее есть свои плюсы. Например, если мы продвигаем сайт покупными ссылками с бирж наобум, то обычно для нулевика получаем с каждых 100 ссылок с тиц 10 - 10 тиц. А если продвигаем тематическими, то есть совпадают ключевики донора и акцептора, то на 100 ссылок с тиц 10 приходится 20-30 тиц. Но…. слишком эта схема расплывчата и далекооооо не всегда работает. Я долго задовался вопросом “ПОЧЕМУ”?
Седня ночью приснился мне новый важный параметр, о котором я немного знал, но не не обращал внимания.
Загляните в панель вебмастера яндекса, и увидите, что он хранит данные о запросах, по которым попадают на ваш сайт. Не трудно предположить, что эти данные не столь абстрактны, а яндекс хранит информацию о каждой странице и всем запросам по которым на нее пришли.
Исходя из этих данных, я представил, что яндекс строит соотношение тематик не по ключевикам страниц, а по ключевикам запросов на страницу. Ведь это очень многое объясняет. Это создает полную тематику!!!
Хотя, ключевики страницы и ключевики запроса должны совпадать, но это далеко не всегда так.
Также считаю, что колличество запросов на сайт донор релевантных вашему сайту увеличивает передачу тиц. Таким образом, этим я объясняю внезапные падения или рост тиц.

Можете стебаться над моими мыслями, и сказать что сеошники любят выдумывать всякую хрень, но это всего лишь теория, которую также трудно опровергнуть, как и подтвердить. Зато из моей теории следует, что морда сайта (обычно самая посещаемая по запросам), должна передать максимальный тиц. Кто-нибудь продвигался мордами? Также из этой теории следует, что у сдл сайтов будет больше передача, чем у гс.

Вообщем будет интересно услышать любые мысли.
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Не люблю я, конечно, когда палят темы. Поэтому раскрою тему частично. Поскольку у кого есть мозги допрет далее как это использовать.
Итак, есть у меня сайт, который продвигается программным продуктом для joomla. При установке и использовании компонента - в конце каждой статьи (внутри компонента), добавляются две ссылки c анкором содержащим одно одинаковое слово, но ссылающиеся на разные сайты. Эти два сайта имеют почти одинаковый ТИЦ- 110 и 100. Причем первый сайт английский, и не проиндексирован в яндексе, второй русский - и продает ссылки на сапе.
При активном использовании компонента образуется частичный сквозняк (частичный, потому что только внутри компонента). Рассмотрим подробнее второй сайт. Тиц у него стабильно растет с увеличением колличества сайтов, установившим мой компонент. Причем видна явная зависимость: ссылающихся сайтов 120 - тиц 80, потом 140-90, и сейчас 170-100.
Зависимость состоит в том, что не на всех сайтах образуются частичные сквозняки. Так как компонент может быть установлен, и не используется. В большинстве случаев 99% компонент устанавливается на сайты с тиц 0-10.
В первый ап было 120 установок и 80 тиц. После анализа выявлено, что примерно 80 установок образовало частичный сквозняк. Остальные создали лишь по одной ссылке на мой сайт. Суть ясна?:) 80 ссылающихся частично сквозных сайтов дало мне 80тиц в первый ап. Причем сайты были абсолютно различных тематик. Яндекс похоже смотрел только на анкоры внешних ссылок ссылающихся сайтов.
Вот вам и важная часть тупой формулы тица.
Откуда берется неимоверный тиц вроде поняли. Теперь вытекает вторая проблема - откуда получить сквозняки?
Вот это вам на раздумия. Как сказал мудрый S0ber“Как повышать ТИЦ? Есть один секретный метод… Заключается вот в чем: работать, думать, работать, работать. И… Еще раз работать! Поверьте, он рабочий, этот метод! ;-) “. Я с ним полностью согласен.
Даже те у кого есть деньги, без мозгов не смогут сделать себе тиц. Многие покупают себе тучу ссылок на биржах, и потом удивляются: “почему у меня X сотен ссылок и всего 10 тиц”.
Сейчас пробил интересную тему насчет сквозняков - и за 3 часа на испытуемом домене сделал себе 1000 линкбэков (Сам в шоке. Они уже все в индексе). Но это скорее дыра яндекса, и не знаю как он на нее отреагирует. Подожду апа.

P.S. Настоящая формула тиц яндекса - random(x) :)
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Бомбежка ТИЦа


Дошел до состояния, что мне стало стыдно. Пишу тут о яндексе, и гугле, а у моего блога ТИЦ 10 и pr2. Вообще жесть. Решил побомбить и его прокачать с помощью моего любимого linkeed-а (кстати наконец заработок на нем перевалил за 100р=) в сутки, а то народ все ругает его, что там оптимизаторов нет).
Заодно опробую новую схему. Раньше я подымал тиц остальным своим площадкам по накатанной схеме - покупка ста ссылок с тиц 10-20 давало +10 за один ап. Сейчас опробую покупку 200 ссылок ТИЦ40-100. Если не влечу в бан, то надеюсь должно сработать. Экспериментуемым стал этот самый блог. Сейчас на него 800 бэков с 300 с лишним сайтов. Уже почти все новые ссылки попали в индекс.
Что интересно - у меня Black list на бирже сейчас содержит 1000 сайтов, которые вылетели из индекса яндекса. А всего там где-то 20000 сайтов… То есть, из того, что я перекопал - уже 5% всех площадок в бане. А если еще учесть, что linkfeed довольно молодая биржа, и площадки в ней добавились и проверились на индекс максимум год назад, то можно сказать, что яндекс банит сайты быстрее, чем кролики размножаются=)
Короче буду ждать апдейтов.
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Барабум для яндекса!:)

В самом ближайшем будущем запущу новый сервис, который назвал Барабум.
Наверняка вы сталкивались с проблемой, что при покупке множества ссылок, у вас в средствах вебмастера отображались они все, но тиц не увеличивался, а уменьшался. В результате мне пришла отличная мысль создать уникальный сервис.
Задача сервиса - помочь оптимизатору найти качественные сайты для покупки ссылок на любых биржах, то есть выбрать те площадки, у которых наибольшая вероятность передачи ТИЦ.
В качестве исходных данных Барабуму нужно будет передать ссылки на сайты, или страницы, где вы собираетесь приобрести себе линкбаки (в csv или txt формате). Экспорт ссылок сейчас поддерживают все биржы ссылок.
Далее сервис выполняет следующие действия:
1) Очищает текст сайтов, полученным по вашим ссылкам от тегов noindex, script и прочей лабуды, которая неиндексируется, или плохо индексируется.
2) Проверяет реальное колличество внешних ссылок.
3) Проверяет - является ли сайт форумом, если да, то лучше на нем не брать ссылки, а взять на нормальном сайте. При этом определяет вероятность того, что яндекс сможет определить сайт как форум.
4) Проверяется колличество контента на странице. Если его недостаточно, а внешних ссылок много, то опять же лучше избежать такого сайта.
5) Наверно самый важный момент. Осуществляется поиск “блоков ссылок”, которые пессимизирует яндекс, в результате чего покупка на таких сайтах бессмысленна. Даже если эти блоки не продажные, все равно лучше не стоит рисковать своими деньгами!

Всего 5 шагов, но насколько они упрощают и улучшают качество работы оптимизатора! Ведь нереально проверить множество сайтов вручную на эти 5 параметров.
На данный момент я сделал движок этого скрипта, и он определяет эти параметры для сайтов. Есть некоторые проблемы с кодировками, но думаю на днях их решу.
Интересно узнать ваши мысли по данному сервису. Может нужно учитывать еще какие-нибудь параметры, которые можно определить програмно?

Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Итак, адпейт вроде притормозил, и уже видны устаканившиеся результаты.
У меня они следующие (привожу результаты за три последних апдейта):
1) ТИЦ 20->10->50. Сайт в яндекс каталоге. Раскручивал тематикой из каталога, и чем попало- просто тематикой.
2) ТИЦ 10->0->10. Ничего не делал. ТИЦ сам по себе прыгает. (покупал сотню ссылок 2 апа назад)
3) ТИЦ 0->0->10 (тоже закупал сотню ссылок с тицом в среднем тиц 10 два апа назад)
4) ТИЦ 30->20->10 Новых ссылок не докупал, а старые потихоньку отваливались и уходили в бан. В первый месяц было куплено 200 ссылок, и получено 30 тиц, во второй осталось 150, стало 20, и в третей осталось 80, стало 10:)
По остальным сайтам подъема не особо ожидал и их нету. Много где прожадничал и недокупил “королевскую сотню”:) В результате на остальных площадках никаких изменений.
Обидно конечно, что этому блогу не дали никакой прибавки. Я столько старался - писал уникальный контент, и сделал ссылок туеву хучу! Яндекс жлоб. Поскольку этот сайт прокачивался блогами и форумами, делаю окончательный вывод, что они НЕ ПЕРЕДАЮТ ТИЦ!!!! Яндекс сдержал свое слово, написанное в правилах, а значит и я забил на раскрутку блогуном в дальнейшем. Сцуко короче яндекс. Такую хорошую халявную нишу прикрыл. И нихрена я теперь не поверю, что хруммером люди повышают себе тиц. Туфта это все. Хоть я и делал себе ссылки вручную, без всякой автоматизации, но всегда проверял на наличии noindex в комментах. Хад! Я тебе припомню еще)
Но в целом апом я доволен. Хотя бы нет массовых падений, как в прошлый раз, и этому я уже рад:)

А теперь о навеянном в моем прошлом посте про Атрибуты страницы влияющие на продвижение в Google.
Я долго думал над словами знаменитого оптимизатора Русь Джонса.
Цитирую: “Имеется тунельное правило. Если Сайт А ссылается на Сайт B, а B ссылается на C, и сайт А содержит в анкоре допустим слово “виджет”, и сайт B тоже содержит “Виджет”, ссылаясь на С, то это дает дополнительные преимущества сайту А.“.
Мне кажется, что эту схему мы обыграли с Seoблондинкой, когда вышли в топы google и почти топы яндекса по теме “основной и дополнительный индекс гугла”. Суть была простой - она написала текст про индексы гугла, я продолжил его, сославшись на блондинку, а она после этого сослалась на меня. В итоге получился замкнутый тунель из двух сайтов. Причем в индекс гугла, я думаю, мы попали в разные дни поочередно. Если бы кто-то еще продолжил эту тему, сославшись на нас, то это бы убило рейтинг:)
А теперь можно предположить, что яндекс не сильно отличается от гугла и у них есть, что-то общее. Предположим, что яндекс тоже поддерживает тунельное правило и учитывает его при расчете тиц!
Таким образом, максимальную передачу тиц имеет ссылка, которая имеет аналог анкора на странице донора, и ссылается на другой сайт. Я бы еще предпожил, что заголовок страницы тоже очень важен.
Итак, я вывел новую теорию, которая будет моим следующим экспериментом:
“Если купить ссылку с анкором “виджет”, на странице, где есть ссылка на другой сайт с тем же анкором, и заголовком, то мы получим максимум передачи тица. Остальные получат либо по минимуму, либо 0.”
Из этой теории вытекает хорошее следствие - это понижает нагрузку на сервера яндекса, поскольку всего лишь нужно прогнать поисковик по анкорам, и по заголовкам, чтобы рассчитать ТИЦ. И я до сих пор считаю, что алгоритм яндекса не столь замудрен, поскольку никакие сервера за сутки не смогли бы пересчитать все сайты рунета.
Конечно не стоит мне верить, и это всего лишь теория, то бишь, предположение, но эта теория будет проверяться на практике. Посмотрим, что получится из этого. Плохо только, что времени на это уйдет достаточно много, чтобы отобрать страницы с нужными мне анкорами и заголовками, ну да ладно. Ради такого дела стоит постараться.

P.S. Если думаете, что моя теория полня х…ня, то так и скажите:) А вообще интересно узнать мнения, логично ли я предположил?:)
Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Только недавно допер до всей прелести всем известного сервиса блогун, в котором можно и подзаработать, и хорошо продвинуть свой сайт (меня в частности интересуют пузомерки).
Сначала рассмотрим с точки зрения оптимизатора и проведем некоторую аналогию продвижения статьями и блогуном:
1) Текст страницы. При покупке статьи, ваши ссылки окружены вашим же текстом, отсюда вывод что текст страницы будет тематическим ссылке, что должно хорошо влиять на ТИЦ.
При заказе обзора в блогуне ситуация аналогична, только пишет их другой вебмастер, что я считаю плюсом блогуна.
2) Расценки.
Соотношение цен примерно одинаковое (Если брать статьи “навсегда”). А если в блогуне мы покупаем постовые, то даже дешевле получается:) Опять блогун в плюсе.
3) Качество получаемой страницы применительно к поисковику.
У всех бирж статей очень уж плоховатое качество результатов. Они почти не индексируются. Чаще всего приходится ждать до 2-ух месяцев.  Причем все статьи имеют одинаковые адреса, которые яндекс легко в итоге может вычислить. Думаю статьи через биржи liex и seozavr скоро вообще перестанут передавать ТИЦ. Яндекс уже начал шевелиться на эту тему.
Обзоры и постовые блогуна обычно индексируются в течении недели как и должно быть (конечно зависит от сайта).

В итоге я как оптимизатор полностью перехожу на продвижение блогуном. О результатах роста ТИЦ-а напишу после апа (или апов).

Теперь рассмотрим с точки зрения вебмастера:
1) Доходы.
У меня доходы с одной площадки в liex в среднем 0.05$ в сутки (причем слабо зависит от качества площадки и ее параметров).
Доход с блогуна где-то 0.5$ за постовой в этом блоге (ТИЦ 10, pr2, яндекс-авторитет примерно 300).
В гавно-блоге похуже 0.1$ за постовой(Тиц 0, pr2, яндекс-авторитет 4).
В одном посте может быть три постовых. Итого, если я сделаю по одному посту в свои два блога, то получу 1.5+0.3=1.8$. (никто не мешает мне сделать больше постов)
Пока эти деньги заработаются на liex…. лучше промолчу.
2) Нужно работать.
Зато у биржи статьями liex есть очень хороший плюс - она соответствует правилам денежной машины, которая работает сама собой. То есть мы отдыхаем, а деньги к нам в карман.
В блогуне приходиться ежедневно тратить свое время. А если вы пишите осмысленные посты, а не копипастите с других блогов, то времени у вас уйдет прилично.
В итоге, трудно сделать результирующий вывод, и в итоге лучше пользоваться и тем и другим для заработков. Read the rest of this entry

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong

Новогодний ап тица.

Короче как многие поняли полная жопа. Стали рулить ГС. Ничего разумного не могу сказать, что происходит. Подрезаны сдл по крупному. Не важно были ли покупные или продажные ссылки или нет.
Кто-то до сих пор верит в сказку в перетекание тица. Ну ждите блин. Что-то у меня появилось чувство, что яндекс решил не париться и не грузить сервера и добавил в алгоритм одну простую команду: тиц равен случаной число умноженное на прошлый тиц. Насрать на баки и прочие факторы. Корочь хз что делать.
Отменять покупные ссылки не буду, но и новых больше не куплю. Такой эффект от них меня не вдохновляет.
А теперь о хорошем:
В прошлом посте я писал, что можно и нужно решать проблему с контентом. Сейчас я немного модифицировал задачу, и решил заграбить полностью весь ЖЖ (!). Вы представляете сколько это контента??
Для этого разработал паука, который бегает по страницам ЖЖ, и собирает ссылки у которых есть rss. (За час нашел 13099 ЖЖ ссылок, из них пока обработал 1289 и решил что у них есть rss-лента). Далее эти ссылки передаются в “пылесос”, который собственно грабит контент. Контент выбирается по-простому принципу - если он больше n символов, значит можем брать его себе.
Вообщем, это тонны контента. В дальнейшем при создании нового сайта можно только указать какие ключевики меня интересуют, и взять нужный контент по ним. Пока буду ждать обработки контента. Она довольно медленная при моем соединении 64кб/с, но пока буду на работе, думаю многое успеет заграбится.

Усиленно читают у меня в блоге:

Google BookmarksDiggdel.icio.usTechnoratiYahoo My WebNews2.ruБобрДобр.ruMemori.ruМоёМесто.ruMister Wong
Яндекс.Метрика