Повышение точности байесовского классификатора текстовых документов

Проблемы передачи и обработки информации
Авторы:
Аннотация:

Рассмотрена проблема автоматической классификации текстовых документов. Показано, что непосредственная реализация классификатора на базе формулы Байеса обеспечивает достаточно низкую точность решения задачи категоризации по причине сильной статистической зависимости элементов вектора признаков. Предложено решение данной проблемы, основанное на преобразовании вектора признаков в вектор большей размерности с менее зависимыми компонентами.