Skip navigation

putin IS MURDERER

Please use this identifier to cite or link to this item: https://oldena.lpnu.ua/handle/ntb/27646
Title: Методи та засоби аналізу текстів публікацій для дослідження діяльності наукових шкіл
Other Titles: Методы и средства анализа текстов публикаций для исследования деятельности научных школ
Methods and tools for text analysis publications to identify and study the functioning scientific schools
Authors: Нога, Роман Юрійович
Bibliographic description (Ukraine): Нога Р. Ю. Методи та засоби аналізу текстів публікацій для дослідження діяльності наукових шкіл : автореферат дисертації на здобуття наукового ступеня кандидата технічних наук : 10.02.21 – структурна, прикладна і математична лінгвістика / Роман Юрійович Нога ; Міністерство освіти і науки України, Національний університет “Львівська політехніка”. – Львів, 2015. – 22 с. – Бібліографія: с. 17–18 (14 назв).
Issue Date: 2015
Publisher: Національний університет "Львівська політехніка"
Keywords: наукова школа
аналіз тексту публікації
екстракція інформації
кластеризація
тематичне моделювання
научная школа
анализ текста публикации
экстракция информации
кластеризация
тематическое моделирование
scientific school
publication text analysis
information extraction
clustering
thematic design
Abstract: У дисертаційній роботі розв’язано актуальне наукове завдання розроблення математичних методів і програмних засобів аналізу текстів наукових публікацій для виявлення та дослідження результатів функціонування наукових шкіл, що дає змогу підвищити якість прийняття рішень щодо доцільності підтримки наукових досліджень за рахунок виявлення нових знань у слабоструктурованих документах. Проаналізовано методи опрацювання текстової інформації з множини розрізнених інформаційних ресурсів та визначено можливість їх застосування до аналізу наукових публікацій. Удосконалено метод екстракції даних з наукової публікації. Розроблено алгоритм попередньої рубрикації наукових публікацій з метою визначення ймовірної кількості кластерів. Удосконалено метод кластеризації k-середніх для поділу наукових статей за науковими школами. Визначено метрику якості кластерного рішення. Розроблено алгоритми аналізу наукових публікацій та прогнозування зміни кількісних характристик наукових шкіл таких як кількість публікацій, захисти дисертацій. Спроектовано архітектуру системи аналізу текстів публікацій для формування та аналізу наукових шкіл. Апробовано розроблені методи для електронної бібліотеки та для наукової установи. В диссертационной работе решено актуальное научное задание разработки математических методов и программных средств анализа текстов научных публикаций для выявления и исследования результатов функционирования научных школ, что позволяет повысить качество принятия решений о целесообразности поддержки научных исследований за счет выявления новых знаний в слабоструктурированных документах. Проанализированы методы обработки текстовой информации из множества разрозненных информационных ресурсов. Рассматриваются существующие методы анализа и работы с текстовыми данными, их преимущества, области применения, ограничения и проблемы. Проанализирована возможность их применения к анализу научных публикаций. Определены элементы текстовых документов, которые должны быть получены на основе полнотекстового поиска и экстракции. Усовершенствованы методы экстракции данных из научной публикации и кластеризации k-средних для разделения научных статей по научным школами. Определена метрика качества кластерного решения. Разработан метод определения вероятности появления новых публикаций в научных школах. Предложены алгоритмы анализа научных публикаций и прогнозирования изменения количественных характристик научных школ, таких как количества публикаций и защит диссертаций. Разработан алгоритм классификации публикаций по известным научными школами (рубрикам). Спроектирована архитектура системы анализа текстов публикаций для формирования и анализа научных школ. Определено качество кластеризации. Построено схему базы данных и основные программные модули. Они могут использоваться не только для выявления научных школ на базе анализа текстов публикаций, но и библиотеками для хранения и поиска публикаций, и центрами развития и инноваций для выявления тематик, по которым за определенный период больше публикаций. The dissertation solved the problem of current scientific development of mathematical methods and software tools to analyze texts to identify scientific publications and research results of functioning scientific schools, allowing to increase the quality of decision-making regarding the advisability support research through the discovery of new knowledge in semistructured documents. There are described the methods of processing text information from a plurality of disparate information resources. The method of extraction of data from scientific publications is given. The method of k-means clustering to split research papers for academic schools. There is defined the quality metric of cluster solution. The method of determining the likelihood of new publications in scientific schools is described. There is designed system architecture development and evaluation of scientific schools are given. Developed methods were tested for e-libraries and for academic institutions.
URI: https://ena.lpnu.ua/handle/ntb/27646
Content type: Autoreferat
Appears in Collections:Автореферати та дисертаційні роботи

Files in This Item:
File Description SizeFormat 
avt_Noha.pdf440.16 kBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.