Тематический краулинг на основе алгоритма HITS
Авторы:
Аннотация:
Описаны принципы функционирования сфокусированного Веб-краулера, его алгоритм обхода Веб-пространства, в качестве которого используется модифицированный алгоритм Клеинберга HITS. Приведены примеры и оценки эффективности результатов его работы как в локальном Веб-пространстве (в рамках одного домена), так и в региональном (по русскоязычному Веб-пространству). А также его сравнение со стандартным Веб-краулером.