https://oldena.lpnu.ua/handle/ntb/6725
Title: | Категоризація електронних документів |
Authors: | Годич, О. В. Наконечний, Ю. С. Щербина, Ю. М. |
Bibliographic description (Ukraine): | Годич О. В. Категоризація електронних документів / О. В. Годич, Ю. С. Наконечний, Ю. М. Щербина // Вісник Національного університету "Львівська політехніка". – 2010. – № 673 : Інформаційні системи та мережі. – С. 233-248. – Бібліографія: 14 назв. |
Issue Date: | 2010 |
Publisher: | Видавництво Львівської політехніки |
Keywords: | карти Кохонена зменшення розмірності категоризація доку- ментів кластеризація візуалізація даних Self-Organizing Map dimensionality reduction document categorization clustering data visualization |
Abstract: | Nowadays, a number of document clustering algorithms are available with number of benefits and trade-offs. The proposed in this article algorithm is an attempt to provide a compromise between quality and complexity, while remaining independent of the language. It uses keyword-based dimensionality reduction technique to create an input space, and then applies Self-Organizing Map for clustering and visualization.Нині існує багато алгоритмів кластеризації документів, кожен з яких має певні переваги та недоліки. Запропонований у цій статті алгоритм є спробою компромісу між якістю категоризації документів і вимогами до обчислювальних ресурсів, залишаючись незалежним від мови документів. Алгоритм використовує техніку пошуку ключових слів документів для формування вхідних даних та карти Кохонена в поєднанні з ієрархічною кластеризацією для категоризації та візуалізації документів. |
URI: | https://ena.lpnu.ua/handle/ntb/6725 |
Content type: | Article |
Appears in Collections: | Інформаційні системи та мережі. – 2010. – №673 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.