Алгоритм автоматической покупки ссылок
Автор: adminОкт 1
Предлагаю вашему вниманию алгоритм покупки ссылок.
Цель задачи - купить более качественные ссылки.
Само по себе слово “качество” довольно расплывчато, поэтому нормализуем условие задачи.
Нормализованная цель задачи - из X доноров выбрать N набравших больше баллов. Причем N задается косвенно оптимизатором, как колличество денег желаемых потратить на запрос.
Еще более упрощенно задача выглядит так - система должна из двух доноров выбрать тот, что лучше.
Покупка проходит в три этапа.
Этап 1: Сеошник создает фильтр в бирже удовлетворяющий его предпочтениям и задает бюджет.
Грубо говоря, например сеошник указал купить ссылки от 2 до 5 рублей, с бюджетом 30р на данный запрос.
Этап 2: Программа получает ссылки предложенные биржой через api и фильтрует полный хлам.
Я использую следующие фильтры:
1) Проверка на GBL из прошлого опыта проверок
2) Страница проходит проверку YAP и GOP
3) Отсеиваем сайты где страниц по yandex<80
4) Отсеиваем по stop-словам url и текст донора. (всякие варезники, попандеры, pron-тематику, дипломы и т.д.)
5) Делаем перепроверку на BL (колличество исходящих ссылок) и удаляем >3
6) удаляем страницы с количеством внутренних ссылок >150 и <5
7) удаляем страницы с количеством чистого текста <500 символов (текст без html внутри body)
8. удаляем сайты с заспамленностью >100% (отношение количества исходящих ссылок с домена к количеству страниц в индексе яндекса)
Этап 3: Из того что осталось вычисляем по формуле сколько баллов наберет каждый донор и скупаем набравшие больше всего балов учитывая ограничение по максимальному расходу средств.
Формула:
Балл=PR(главной сайта)*10+PR(страницы донора)*20-BL(исходящих ссылок)*3+Content(колличество символов чистого текста)/100+балл тематичности/10+ТИЦ/5+Возраст(количество дней в бирже)/30+1000/ALEXARANK
Да, данная формула не идеальна, но она учитывает все довольно важные факторы. Строил её на своем опыте по продвижению.
Публикую данную статью, чтобы получить полезные советы (всё-таки коллективный опыт и разум лучше субьективного:) )
Буду рад любым замечаниям и предложениям.
Интересует поисковое продвижение сайтов в Казани? Для вас найдено отличное решение.
Усиленно читают у меня в блоге:
- модуль для создание мобильной версии сайта joomla
- проверить заспамленность донора в сапе
- %D0%9A%D0%BB%D0%BE%D0%B0%D0%BA%D0%B8%D0%BD%D0%B3+%D0%BA%D0%B0%D0%BA+%D1%81%D1%80%D0%B5%D0%B4%D1%81%D1%82%D0%B2%D0%BE+%D0%B2%D1%8B%D0%B6%D0%B8%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F+%D0%B2+%D0%BF%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D1%8B%D1%85+%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0%D1%85
- яндекс сайт
- как сделать чтобы ссылка на сайт отображалась в google
- тематика сайта определение
- Рубрика: Биржи, Разработки
12 коммент.
Пишет Content Provider | дата: 3 октября 2010 в 13:29
> 7) удаляем страницы с количеством чистого текста (текст без html внутри body)
Не очень понятен этот пункт.
Возьмем к примеру эту страницу и выкинем основной текст поста.
Правой коноки будет достаточно, чтобы текста на странице было больше 500 символов, однако страница не будет нести никакой смысловой нагрузки.
Или я что-то не правильно понял?
Пишет admin | дата: 3 октября 2010 в 13:39
Content Provider, правая колонка чаще всего представляет собой ссылки. Они тоже удалятся с внутренним текстом в момент очистки html, и от колонки почти ничего не останется.
Хотя в идеале нужно искать статичные области сайта, но эту проблему откладываю на будущее.
Пишет Content Provider | дата: 3 октября 2010 в 14:38
Правильно ли я понимаю, что при очистке оставляем только то, что содержится в тегах _p_?
И вторым этапом удаляем ссылки?
Пишет admin | дата: 3 октября 2010 в 14:53
не обязательно p, это может быть и div и span и т.д.. Фактически удаляем ссылки с анкорами и картинками, и все теги.
Пишет Content Provider | дата: 3 октября 2010 в 15:12
Тогда я для себя выделил 3 шага:
1. Удаляем содержимое тегов: a, form (со всем, что внутри), script, noscript.
2. Удаляем теги img, заменяя их содержимым alt или title (если оно есть).
3. Удаляем оставшиеся html-теги
Далее анализируем страницу.
Есть ли еще что-то что я пропустил?
Пишет Content Provider | дата: 3 октября 2010 в 15:17
Вообще, в идеале конечно построить алгоритм выделения контентной части страницы. Готовой реализации я пока нигде не встретил (в открытом доступе).
Единственная полумера, которая приходит в голову — смотреть, есть ли у ресурса RSS и брать контентную часть оттуда. Но тут есть свои ограничения: RSS-фида может не быть вообще или в ленту могут отдаваться не полные посты.
Есть еще способ анализировать массив страниц сайта, выделять оттуда общие элементы и удалять их. В них попадут футер страницы, меню и т.п. Но это уже иные вычислительные ресурсы. Хотелось бы что-то попроще конечно.
У поисковиков, я так понимаю, проблема эта решена.
Пишет samoy4ka | дата: 23 октября 2010 в 19:28
КашаГ дарова!)
Помнишь такого samoy4kу?!)
Очень давно не был в этой сфере дел, думаю дай зайду на блог к котофеичу, давно там не был, по памяти набирал адрес, прям ностальгия… опять думаю залезти в инет как в средство заработка)
Как тут дела то идут?! Как твои проекты поживают?!)))
Пишет seokot | дата: 28 октября 2010 в 0:34
Привет samoy4ka. Нормально дела, работаю потихоньку.
А ты совсем ушел из интернета?:)
Пишет samoy4ka | дата: 30 октября 2010 в 1:48
Ага блин… учеба, работа в реале… совсем не успеваю)
Вот сейчас в отпуск пойду, сюда полезу, если че опять получится, то тогда тут и останусь с вами! =)))
Пишет Роман | дата: 18 ноября 2010 в 17:17
По поводу качественных ссылок, возможно ли добавить в линкфидатор, фильтр по семейному поиску от яндекса? По хорошему, там только “проверенные” сайты. http://yandex.ru/familysearch?text=%D0%BF%D0%BE%D1%80%D0%BD%D0%BE&lr=213
Пишет Последние события… | SeoKot - вся правда о поисковиках | дата: 6 мая 2011 в 2:56
[...] алгоритм покупки ссылок [...]
Пишет Поиграем в нострадамуса?)) | SeoKot - вся правда о поисковиках | дата: 8 июня 2011 в 15:41
[...] алгоритм покупки ссылок [...]