https://oldena.lpnu.ua/handle/ntb/47799
Title: | Парсинг тексту термінологічних словників |
Other Titles: | Parsing the text of terminology dictionaries |
Authors: | Дорожинська, А. В. Dorozhynska, Olena |
Affiliation: | Український мовно-інформаційний фонд НАНУ Ukrainian Lingua-Information Fund of NAS of Ukraine |
Bibliographic description (Ukraine): | Дорожинська А. В. Парсинг тексту термінологічних словників / А. В. Дорожинська // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2019. — № 5. — С. 90–100. |
Bibliographic description (International): | Dorozhynska O. Parsing the text of terminology dictionaries / Olena Dorozhynska // Visnyk Natsionalnoho universytetu "Lvivska politekhnika". Informatsiini systemy ta merezhi. — Lviv : Vydavnytstvo Lvivskoi politekhniky, 2019. — No 5. — P. 90–100. |
Is part of: | Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі, 5, 2019 |
Journal/Collection: | Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі |
Issue: | 5 |
Issue Date: | 26-Feb-2019 |
Publisher: | Видавництво Львівської політехніки |
Place of the edition/event: | Львів Lviv |
UDC: | 81′33 |
Keywords: | комп’ютерна лексикографія лексикографічна система парсинг синтаксичне дерево XML база даних цифровий простір computer lexicography lexicographic system parsing XML database digital space |
Number of pages: | 11 |
Page range: | 90-100 |
Start page: | 90 |
End page: | 100 |
Abstract: | Окреслено коло завдань, підходів і етапів розроблення технології парсинга тексту
багатомовного тлумачного термінологічного словника. Дослідження проведено для
“Словника української біологічної термінології”. Серед усього словникового розмаїття
цей словник обрано тому, що термінологічні словники надають лексико-семантичну
базу для подальшого створення систем інтелектуального опрацювання фахових текстів,
у яких подається інформація з тих чи інших предметних галузей. Ця термінографічна
праця обіймає нормативну загальнонаукову та широковживану термінологію біологічних
наук, зафіксовану в сучасних енциклопедичних, загальномовних та спеціальних
словниках, у науковій, науково-популярній, навчальній та інформативно-реферативній
літературі. Дослідивши обраний словник, ми зможемо узагальнити модель його
лексикографічної системи на інші предметні галузі, що створить передумови для
формування цілісного багатогалузевого цифрового лексикографічного простору. Робота
зі словниками, переведеними у комп’ютерні текстові формати, є дуже неефективною і
потребує конвертування їх у формати лексикографічних баз даних, що є спеціальним
завданням, не відомим класичній лексикографії. Це і складає зміст терміна “парсинг
словників”. У процесі роботи побудовано модель лексикографічної системи, яку
покладено в основу XML. Подальша робота із перетворення паперової версії словника
на онлайн-систему будується на XML-файлі. Проаналізовано поліграфічне оформлення,
організацію і структуру друкованого тексту словника з метою ідентифікації елементів
концептуальної моделі Л-системи СУБТ. На основі концептуальної моделі побудовано
структуру XML-документа, який пропонується використовувати як посередника між
паперовою версією словника та його реалізацією як онлайнової лексикографічної
системи. Надалі планується побудова універсальної процедури парсингу з
удосконаленням структури XML-документа. The article outlines a range of tasks, approaches and stages of developing parsing technology for text of a multilingual explanatory terminology dictionary. Research was conducted for the “Dictionary of Ukrainian Biological Terminology”. Among all the vocabulary diversity, this dictionary was chosen because terminology dictionaries provide a lexical-semantic basis for further creation of systems for the intelligent processing of professional texts, which provide information on specific subject areas. This terminographical work encompasses the normative general scientific and widely used terminology of biological sciences, recorded in modern encyclopedic, general and special dictionaries, in scientific, popular science, educational and informative literature. After studying the chosen dictionary, the model of its lexicographic system into other subject areas, which will create the preconditions for the formation of an integral multidisciplinary digital lexicographic space will be generalized. Working with dictionaries converted into computer text formats is very inefficient and needs to be converted into lexicographic database formats, which is a special task not known in classical lexicography. This is the meaning of the term “parsing dictionaries”. During investigation, a model of the lexicographic system, which is the basis of XML, was constructed. Further work on converting a printed version of the dictionary into an online system is based on an XML file. The polygraphic design, organization and structure of the printed text of the dictionary are analyzed in order to identify the elements of the conceptual model of the L-system of the SUBT. Based on the conceptual model, the structure of an XML document is proposed, which is to be used as an intermediary between the printed version of the dictionary and its implementation as an online lexicographic system. In the future, it is planned to build a universal parsing procedure, by improving the structure of the XML document. |
URI: | https://ena.lpnu.ua/handle/ntb/47799 |
Copyright owner: | © Національний університет “Львівська політехніка”, 2019 © Дорожинська А. В., 2019 |
URL for reference material: | http://pdf2doc.com/ |
References (Ukraine): | 1. Широков В. А. (2018). Эволюция как универсальный естественный закон (Пролегомены к будущей общей теории эволюции). Ч. IIІ. Бионика интеллекта. № 1 (90). 2. Olga Karpova. (2009). Lexicography and Terminology: A Worldwide Outlook. Cambridge : Cambridge Scholars Publishing. 3. PDF-конвертер. From: http://pdf2doc.com/. 4. Словник металургійних термінів (грузинсько-російсько-українсько-англо-німецькофранцузький). (2011). І том. Тбілісі. 5. Словник металургійних термінів (грузинсько-російсько-українсько-англо-німецькофранцузький). (2011). ІI том. Тбілісі. 6. Словник металургійних термінів (українсько-грузинсько-російсько-англійсько-німецькофранцузький). (2014). I том. Київ. 7. Словник металургійних термінів (українсько-грузинсько-російсько-англійсько-німецькофранцузький. 8. Словник української біологічної термінології. (2012). Київ : КММ. 9. Термінологічний українсько-російсько-англійський словник-довідник зі зварювання. Науково-технічна термінологія. (2013). Київ : Український мовно-інформаційний фонд. Серія: Словники України. [Електронний ресурс. CD] 10. Широков В. А. (Eds.) (2008). Український-російський, Російсько-український словник із зварювання. Київ. [Електронний ресурс. CD]. 11. Широков В. А. (Eds.) (2018). Українсько-російсько-англійський словник зі зварювання. Київ. [Електронний ресурс. CD]. 12. Широков В.А. (Eds.) (2011). Комп’ютерна лексикографія. Київ : Наук. думка. |
References (International): | 1. Shyrokov V. A. (2018). Evolution as a universal natural law (Prolegomenas to the future general theory of evolution). Part III. Bionics of intelligence. № 1 (90). 2. Olga Karpova. (2009). Lexicography and Terminology: A Worldwide Outlook. Cambridge : Cambridge Scholars Publishing. 3. PDF Converter From: http://pdf2doc.com/. 4. Dictionary of metallurgical terms (Georgian-Russian-Ukrainian-English-German-French). (2011). I tom. Tbilisi. 5. Dictionary of metallurgical terms (Georgian-Russian-Ukrainian-English-German-French). (2011). II tom. Tbilisi. 6. Dictionary of metallurgical terms (Georgian-Russian-Ukrainian-English-German-French). (2014). I tom. Kyiv. 7. Dictionary of metallurgical terms (Georgian-Russian-Ukrainian-English-German-French). (2014). II tom. Kyiv. 8. Dictionary of Ukrainian Biological Terminology. (2012). К. : КММ. 9. Terminological Ukrainian-Russian-English Dictionary-Guide for Welding: Reference Edition; Scientific and technical terminology (2013). Kyiv : Ukrainian Language Information Foundation. Series: Dictionaries of Ukraine. [Electronic resource. CD] 10. Shyrokov V. A. (Eds.) (2008). Ukrainian-Russian, Russian-Ukrainian Welding Dictionary. Kyiv. [Electronic resource. CD] 11. Shyrokov V. A. (Eds.) (2018). Ukrainian-Russian-English Welding Dictionary. Kyiv. [Electronic resource. CD]. 12. Shyrokov V. A. (Eds.) (2011). Computer lexicography. Kyiv.: Science opinion. |
Content type: | Article |
Appears in Collections: | Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. – 2019. – Випуск 5 |
File | Description | Size | Format | |
---|---|---|---|---|
2019n5_Dorozhynska_O-Parsing_the_text_of_90-100.pdf | 1.3 MB | Adobe PDF | View/Open | |
2019n5_Dorozhynska_O-Parsing_the_text_of_90-100__COVER.png | 443.12 kB | image/png | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.