<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>
<channel>
	<title>Комментарии на: Алгоритм определения тематики сайта</title>
	<atom:link href="/?feed=rss2&#038;p=367" rel="self" type="application/rss+xml" />
	<link>http://seokot.ru/?p=367</link>
	<description>Результаты продвижения, и заработков в сети</description>
	<pubDate>Sat, 07 May 2016 11:00:43 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.6.2</generator>
		<item>
		<title>От: MAR</title>
		<link>http://seokot.ru/?p=367#comment-27278</link>
		<dc:creator>MAR</dc:creator>
		<pubDate>Fri, 30 Nov 2012 16:56:50 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-27278</guid>
		<description>Как- то формулу определения весов "съел" блог.
Если словами про формулу, то берётся отклонение вероятности по данной теме от равнораспределённой для данного слова.</description>
		<content:encoded><![CDATA[<p>Как- то формулу определения весов &#8220;съел&#8221; блог.<br />
Если словами про формулу, то берётся отклонение вероятности по данной теме от равнораспределённой для данного слова.</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: MAR</title>
		<link>http://seokot.ru/?p=367#comment-27277</link>
		<dc:creator>MAR</dc:creator>
		<pubDate>Fri, 30 Nov 2012 16:53:24 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-27277</guid>
		<description>Озадачился той же проблемой. Не слишком много нового появилось в и-нет-е с момента данной публикации.
Посмотрел, сразу "навскидку" поправки:
1) лучше держать словарь в базе (на 10К слов можно взять бесплатно на solarix.ru, там же есть пример как выбирать начальную форму слова)
2) тематика тырится с яндекс- каталога но не на всю глубину (иначе умучаться можно обучать )
3) веса хранить тоже лучше в базе в виде categoryId, wordId, count. Тут слону понятно. сам вес вычисляется / - 1/. тут фишка в том, что мы берём отклонение от равнораспределённого участия слова. Чем равномернее слово используется в разных темах, тем меньше его влияние на результат.
4) стоп- слова можно не хранить, они будут отсекаться способом вычисления весов.
5) ну, я бы применил не просто суммирование, а нейронную сеть с одним вложенным слоем, благо что движков полно.

В остальном, вроде, примерно так и думал.</description>
		<content:encoded><![CDATA[<p>Озадачился той же проблемой. Не слишком много нового появилось в и-нет-е с момента данной публикации.<br />
Посмотрел, сразу &#8220;навскидку&#8221; поправки:<br />
1) лучше держать словарь в базе (на 10К слов можно взять бесплатно на solarix.ru, там же есть пример как выбирать начальную форму слова)<br />
2) тематика тырится с яндекс- каталога но не на всю глубину (иначе умучаться можно обучать )<br />
3) веса хранить тоже лучше в базе в виде categoryId, wordId, count. Тут слону понятно. сам вес вычисляется / - 1/. тут фишка в том, что мы берём отклонение от равнораспределённого участия слова. Чем равномернее слово используется в разных темах, тем меньше его влияние на результат.<br />
4) стоп- слова можно не хранить, они будут отсекаться способом вычисления весов.<br />
5) ну, я бы применил не просто суммирование, а нейронную сеть с одним вложенным слоем, благо что движков полно.</p>
<p>В остальном, вроде, примерно так и думал.</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: рубцовск</title>
		<link>http://seokot.ru/?p=367#comment-16603</link>
		<dc:creator>рубцовск</dc:creator>
		<pubDate>Thu, 29 Dec 2011 10:23:17 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-16603</guid>
		<description>спасибо а то я долго искал как определить тематику сайта</description>
		<content:encoded><![CDATA[<p>спасибо а то я долго искал как определить тематику сайта</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Жизнь порою прекрасна, порою опасна:) &#124; SeoKot - вся правда о поисковиках</title>
		<link>http://seokot.ru/?p=367#comment-15609</link>
		<dc:creator>Жизнь порою прекрасна, порою опасна:) &#124; SeoKot - вся правда о поисковиках</dc:creator>
		<pubDate>Tue, 29 Nov 2011 10:09:31 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-15609</guid>
		<description>[...] как google определяет тематику сайта [...]</description>
		<content:encoded><![CDATA[<p>[...] как google определяет тематику сайта [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Финстрип за Июнь 2011 от Кота &#124; SeoKot - вся правда о поисковиках</title>
		<link>http://seokot.ru/?p=367#comment-15167</link>
		<dc:creator>Финстрип за Июнь 2011 от Кота &#124; SeoKot - вся правда о поисковиках</dc:creator>
		<pubDate>Thu, 10 Nov 2011 16:58:03 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-15167</guid>
		<description>[...] алгоритм портера [...]</description>
		<content:encoded><![CDATA[<p>[...] алгоритм портера [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Сколько ТИЦ передаёт донор? &#124; SeoKot - вся правда о поисковиках</title>
		<link>http://seokot.ru/?p=367#comment-15151</link>
		<dc:creator>Сколько ТИЦ передаёт донор? &#124; SeoKot - вся правда о поисковиках</dc:creator>
		<pubDate>Wed, 09 Nov 2011 19:17:26 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-15151</guid>
		<description>[...] база ашманова скачать [...]</description>
		<content:encoded><![CDATA[<p>[...] база ашманова скачать [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Алгоритм автоматической покупки ссылок &#124; SeoKot - вся правда о поисковиках</title>
		<link>http://seokot.ru/?p=367#comment-15092</link>
		<dc:creator>Алгоритм автоматической покупки ссылок &#124; SeoKot - вся правда о поисковиках</dc:creator>
		<pubDate>Sun, 06 Nov 2011 13:26:50 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-15092</guid>
		<description>[...] тематика сайта определение [...]</description>
		<content:encoded><![CDATA[<p>[...] тематика сайта определение [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Яндекс Снежинск (часть 1.) &#124; SeoKot - вся правда о поисковиках</title>
		<link>http://seokot.ru/?p=367#comment-15059</link>
		<dc:creator>Яндекс Снежинск (часть 1.) &#124; SeoKot - вся правда о поисковиках</dc:creator>
		<pubDate>Thu, 03 Nov 2011 16:19:14 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-15059</guid>
		<description>[...] скрипт распознать тематику текста [...]</description>
		<content:encoded><![CDATA[<p>[...] скрипт распознать тематику текста [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Продвижение неизбежно &#124; SeoKot - вся правда о поисковиках</title>
		<link>http://seokot.ru/?p=367#comment-14275</link>
		<dc:creator>Продвижение неизбежно &#124; SeoKot - вся правда о поисковиках</dc:creator>
		<pubDate>Mon, 19 Sep 2011 16:40:36 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-14275</guid>
		<description>[...] что такое тематика сайта и как её определить [...]</description>
		<content:encoded><![CDATA[<p>[...] что такое тематика сайта и как её определить [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>От: Финстрип май 2011 от Кота &#124; SeoKot - вся правда о поисковиках</title>
		<link>http://seokot.ru/?p=367#comment-14263</link>
		<dc:creator>Финстрип май 2011 от Кота &#124; SeoKot - вся правда о поисковиках</dc:creator>
		<pubDate>Sun, 18 Sep 2011 19:15:52 +0000</pubDate>
		<guid isPermaLink="false">http://seokot.ru/?p=367#comment-14263</guid>
		<description>[...] яндекс тематика [...]</description>
		<content:encoded><![CDATA[<p>[...] яндекс тематика [...]</p>
]]></content:encoded>
	</item>
</channel>
</rss>
