Тематический краулинг на основе алгоритма HITS

Математическое моделирование: методы, алгоритмы, технологии
Авторы:
Аннотация:

Описаны принципы функционирования сфокусированного Веб-краулера, его алгоритм обхода Веб-пространства, в качестве которого используется модифицированный алгоритм Клеинберга HITS. Приведены примеры и оценки эффективности результатов его работы как в локальном Веб-пространстве (в рамках одного домена), так и в региональном (по русскоязычному Веб-пространству). А также его сравнение со стандартным Веб-краулером.