DC Field | Value | Language |
dc.contributor.author | Кравець, Петро | |
dc.contributor.author | Юринець, Ростислав | |
dc.contributor.author | Кісь, Ярослав | |
dc.contributor.author | Kravets, Petro | |
dc.contributor.author | Yurynets, Rostyslav | |
dc.contributor.author | Kis, Yaroslav | |
dc.date.accessioned | 2021-02-11T14:12:47Z | - |
dc.date.available | 2021-02-11T14:12:47Z | - |
dc.date.created | 2020-02-24 | |
dc.date.issued | 2020-02-24 | |
dc.identifier.citation | Кравець П. Патерни самоорганізації стратегій у грі мобільних агентів / Петро Кравець, Ростислав Юринець, Ярослав Кісь // Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2020. — № 7. — С. 24–34. | |
dc.identifier.uri | https://ena.lpnu.ua/handle/ntb/56138 | - |
dc.description.abstract | Розглянуто актуальну проблему самоорганізації стратегій стохастичної гри багатоагентної
системи. Проявом самоорганізації є формування скоординованих поведінкових патернів групи
мобільних агентів, наділених здатністю переміщуватися в обмеженому дискретному просторі.
Агент – це автономний об’єкт, який може взаємодіяти із навколишнім середовищем,
іншими агентами і людиною для вибору варіантів рішень. Багатоагентна система складається із
групи агентів, які виконують спільну роботу, співпрацюючи між собою у межах локальних
підмножин агентів. Поведінковий патерн багатоагентної системи – це візуалізована форма
впорядкованого переміщення агентів, яка виникає із їх початкового хаотичного руху під час
навчання стохастичної гри.
Повторювальна стохастична гра полягає у реалізації керованого випадкового процесу
вибору варіантів рішень. Для цього ігрові агенти випадково, одночасно і незалежно вибирають
одну із власних чистих стратегій у дискретні моменти часу. Чисті стратегії гравців визначають
напрямки переміщення у двовимірному просторі: вперед, назад, направо, наліво. Після
завершення вибору усіх стратегій обчислюють поточні програші гравців. Для формування
впорядкованого переміщення кожен агент повинен повторювати дії сусідніх агентів. Тоді поточні
програші визначаються індикаторною функцією подібності стратегій сусідніх гравців. Обчислені
поточні програші використовують для адаптивного перерахунку змішаних стратегій гравців.
Імовірність вибору чистої стратегії збільшується, якщо її реалізація призвела до зменшення
поточного програшу. Під час повторювальної гри агенти сформують вектори змішаних
стратегій, які мінімізують функції середніх програшів гравців.
Для розв'язування ігрової задачі побудови патернів самоорганізації багатоагентної
системи використано адаптивний марківський рекурентний метод, побудований на основі
стохастичної апроксимації модифікованої умови доповняльної нежорсткості, яка справедлива у
точках рівноваги за Нешем. Для нормування елементів векторів змішаних стратегій застосовано
операцію їх проектування на одиничний розширюваний епсілон-симплекс. Збіжність ігрового
методу забезпечується дотриманням фундаментальних умов та обмежень стохастичної
оптимізації.
Комп'ютерне моделювання підтвердило можливість застосування моделі стохастичної гри
для побудови патернів самоорганізації багатоагентної системи. Форма отриманих патернів
залежить від способу локального орієнтування мобільних агентів. Під час комп’ютерного
експерименту отримано вихрові та лінійні патерни переміщення агентів. Достовірність
експериментальних досліджень підтверджується подібністю отриманих результатів для різних
послідовностей випадкових величин.
Результати цієї роботи доцільно застосувати для вивчення патернів колективної поведінки
агентів для глибшого розуміння процесів самоорганізації природних систем та для побудови
розподілених систем прийняття рішень. | |
dc.description.abstract | In this research the actual problem of self-organizing of strategies of stochastic game of
multiagent systems is considered. Self-organizing display are formations of the co-ordinated behavioural
patterns of group of the mobile agents endowed with the ability to move within a limited discrete space.
The agent is an independent object which can interact with environment, other agents and the
person for a choice of variants of decisions. The multiagent system consists of group of agents which
perform the general work, co-operating among themselves within local subsets of agents. The
behavioural pattern of multiagent systems is the visualised form of purposeful moving of agents which
arises from their initial chaotic movement during training of stochastic game.
A repetitive stochastic game is to implement a controlled random process of selecting decision
options. To do this, game agents randomly, simultaneously and independently choose one of their own
pure strategies at discrete times. Pure player strategies determine the direction of movement in twodimensional
space: forward, back, to the right, to the left. When all strategies have been selected, the
current player losses are calculated. To form an orderly move, each agent must repeat the actions of
neighboring agents. The current losers are then determined by the indicator function of the similarity of
the strategies of the neighboring players. The calculated current losses are used to adaptively recalculate
mixed player strategies. The probability of a pure strategy selection increases, if its realisation has led to
reduction of current loss. In the course of a recurring game, agents will form vectors of mixed strategies
that will minimize the functions of the players' average losses.
To solve the game problem of constructing patterns of self-organization of a multiagent system it
is used the markovian adaptive recurrent method constructed on the basis of stochastic approximation
of the modified complementary slackness condition which is correct in balance to Nash points. For a
normalization of elements of vectors of the mixed strategies operation of their projecting on a unit
expanded epsilon-simplex is applied. Convergence of a game method is provided with observance of
fundamental conditions and restrictions of stochastic optimisation.
Computer simulation confirmed the possibility of using a stochastic game model to build patterns
of self-organization of a multi-agent system. The form of the received patterns depends on a way of local
orientation of mobile agents. During computer experiment vortical and linear patterns moving of agents
are received. The reliability of the experimental studies is confirmed by the similarity of the results
obtained for different sequences of random variables.
The results of this work are expedient for applying to studying of patterns of collective behaviour
of agents for deeper understanding of the processes of self-organizing of natural systems and for the
construction of distributed decision-making systems. | |
dc.format.extent | 24-34 | |
dc.language.iso | uk | |
dc.publisher | Видавництво Львівської політехніки | |
dc.publisher | Lviv Politechnic Publishing House | |
dc.relation.ispartof | Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі, 7, 2020 | |
dc.subject | самоорганізація | |
dc.subject | патерн поведінки | |
dc.subject | багатоагентна система | |
dc.subject | стохастична гра | |
dc.subject | марківський рекурентний метод | |
dc.subject | elf-organization | |
dc.subject | behaviour pattern | |
dc.subject | multi-agent system | |
dc.subject | stochastic game | |
dc.subject | markovian recurrent method | |
dc.title | Патерни самоорганізації стратегій у грі мобільних агентів | |
dc.title.alternative | Patterns of self-organizing strategies in the game of mobile agents | |
dc.type | Article | |
dc.rights.holder | © Національний університет “Львівська політехніка”, 2020 | |
dc.rights.holder | © Кравець П., Юринець Р., Кісь Я., 2020 | |
dc.contributor.affiliation | Національний університет “Львівська політехніка” | |
dc.contributor.affiliation | Lviv Polytechnic National University | |
dc.format.pages | 11 | |
dc.identifier.citationen | Kravets P. Patterns of self-organizing strategies in the game of mobile agents / Petro Kravets, Rostyslav Yurynets, Yaroslav Kis // Visnyk Natsionalnoho universytetu "Lvivska politekhnika". Informatsiini systemy ta merezhi. — Lviv : Lviv Politechnic Publishing House, 2020. — No 7. — P. 24–34. | |
dc.relation.references | 1. Гийо, А., Мейе, Ж.-А. (2013). Бионика. Когда наука имитирует природу. Москва: Техносфера. | |
dc.relation.references | 2. Ball, Ph. (1999). The Self-Made Tapestry: Pattern Formation in Nature. Oxford: Oxford University Press. | |
dc.relation.references | 3. Шаталкин, А. И. (2012). Таксономия. Основания, принципы и правила. Москва: Товарищество научных изданий КМК. | |
dc.relation.references | 4. Уорвик, К. (1999). Наступление машин. Почему миром будет править новое поколение роботов. Москва: Наука / Интерпериодика. | |
dc.relation.references | 5. Баррат, Дж. (1915). Последнее изобретение человечества: искусственній интеллект и конец эры Homo sapiens. Москва: Альпина Нон-Фикшн. | |
dc.relation.references | 6. Кайку, М. (2017). Фізика майбутнього. Львів: Літопис. | |
dc.relation.references | 7. Weiss, G. (2013). Multiagent Systems. Second Edition. The MIT Press. | |
dc.relation.references | 8. Chen, B.-S. (2019). Stochastic Game Strategies and their Applications. CRC Press. | |
dc.relation.references | 9. Кравець, П.О. (2013). Ігрова координація та самоорганізація стратегій в мультиагентній моделі “хижак-жертва”. Вісник Нац. ун-ту “Львівська політехніка”. Серія: “Комп’ютерні науки та інформаційні технології”, 751, 136–146. | |
dc.relation.references | 10. Кравець, П. О. (2015). Ігрова модель самоорганізації мультиагентних систем. Вісник НУ “Львівська політехніка”. Серія: “Інформаційні системи та мережі”, 829, 161–176. | |
dc.relation.references | 11. Kravets, P., Burov, Y., Lytvyn, V., Vysotska, V. (2019). Gaming Method of Ontology Clusterization. Webology, 16 (1), 55–76. | |
dc.relation.references | 12. Иванов, Д. Я. (2016). Формирование строя в большой группе мобильных роботов с использованием метода паттернов. Робототехника и техническая кибернетика, 11 (2), 39–44. | |
dc.relation.references | 13. Кучеров, Д. П., Козуб, А. М., Костина, О. М. (2017). Управління мультиагентною системою в потенціальному полі. Озброєння та військова техніка, 14 (2), 55–61. | |
dc.relation.references | 14. Кузнецов, А. В. (2018). Модель движения и взаимодействия системы интеллектуальных агентов. Вестник ВГУ: Серия: Системный анализ и информационные технологии, 2, 130–138. | |
dc.relation.references | 15. Коноваленко, О. Є., Брусенцев, В. О. (2019). Мультиагентні системи управління та підтримки прийняття рішень. Вісник Національного технічного університету «ХПІ». Серія: Машинознавство та САПР, 1, 18 – 27. DOI:10.20998/2079-0775.2019.1.03. | |
dc.relation.references | 16. Ткачев, В. Н., Токарев, В. В., Чурюмов, Г. И. (2019). Разработка алгоритма мультиагентного управления группой мобильных “s-bot”. Київ: Реєстрація, зберігання і обробка даних, 21 (1), 46–56. | |
dc.relation.references | 17. Ungureanu V. (2018). Pareto-Nash-Stackelberg Game and Control Theory: Intelligent Paradigms and Applications. Springer. | |
dc.relation.references | 18. Neogy, S. K., Bapat, R. B., Dubey Dipti. (2018). Mathematical Programming and Game Theory. Springer. | |
dc.relation.references | 19. Назин, А. В., Позняк, А. С. (1986). Адаптивный выбор вариантов: Рекуррентные алгоритмы. Москва: Наука. | |
dc.relation.references | 20. Kushner, H., Yin, G. G. (2013). Stochastic Approximation and Recursive Algorithms and Applications. Springer Science & Business Media. | |
dc.relation.referencesen | 1. Guillot, A., Meyer, J.-A. (2013). Bionics. When the Science Imitates the Nature. Moscow: Technosphere. | |
dc.relation.referencesen | 2. Ball, Ph. (1999). The Self-Made Tapestry: Pattern Formation in Nature. Oxford: Oxford University Press. | |
dc.relation.referencesen | 3. Shatalkin, A. I. (2012). Taxonomy. The bases, principles and rules. Moscow: KMK Scientific Press Ltd. | |
dc.relation.referencesen | 4. Warwick, K. (1999). March of the machines. Why the new race of robots will rule the world. Moscow: Science / Interperiodicals. | |
dc.relation.referencesen | 5. Barrat, J. (2015). Our Final Invention: Artificial Intelligence and the End of the Human Era. Alpina Non- Fiction. | |
dc.relation.referencesen | 6. Kaku, M. (2017). Physics of the Future. Lviv: Litopys. | |
dc.relation.referencesen | 7. Weiss, G. (2013). Multiagent Systems. Second Edition. The MIT Press. | |
dc.relation.referencesen | 8. Chen, B.-S. (2019). Stochastic Game Strategies and their Applications. CRC Press. | |
dc.relation.referencesen | 9. Kravets, P. A. (2013). Game coordination and self-organizing of strategies in multiagent “predator-prey” models. Bulletin of “Lviv polytechnic”. Series: “Computer sciences and information technologies”, 751, 136–146. | |
dc.relation.referencesen | 10. Kravets, P. A. (2015). Game model of self-organizing of multiagent systems. Bulletin of “Lviv polytechnic”. Series: “Information systems and networks”, 829, 161–176. | |
dc.relation.referencesen | 11. Kravets, P., Burov, Y., Lytvyn, V., Vysotska, V. (2019). Gaming Method of Ontology Clusterization. Webology, 16 (1), 55–76. | |
dc.relation.referencesen | 12. Ivanov, D. Y. (2016). System formation in the big group of mobile robots with use of a method of patterns. Robotics and technical cybernetics, 11 (2), 39–44. | |
dc.relation.referencesen | 13. Kucherov, D. P, Kozub, A. М., Kostyna, O. М. (2017). Movement of the multi agent system in potential field. Weapons and Military Equipment, 14 (2), 55–61. | |
dc.relation.referencesen | 14. Kuznetsov, A. V. (2018). Model of movement and interaction of system of intellectual agents. Bulletin VSU: Series: System analysis and information technology, 2, 130–138. | |
dc.relation.referencesen | 15. Konovalenko, O. E., Brusentsev, V. О. (2019). Multiagent control systems and decision-making supports. Bulletin of National technical university “KhPI”. Series: Machine science and CAD, 1, 18 – 27. DOI:10.20998/2079- 0775.2019.1.03. | |
dc.relation.referencesen | 16. Tkachov, V. M., Tokarev, V. V., Churyumov, G. I. (2019). Algorithm design of multiagent managements of group mobile “s-bot”. Kyiv: Data Recording, Storage & Processing, 21 (1), 46–56. | |
dc.relation.referencesen | 17. Ungureanu, V. (2018). Pareto-Nash-Stackelberg Game and Control Theory: Intelligent Paradigms and Applications. Springer. | |
dc.relation.referencesen | 18. Neogy, S. K., Bapat, R. B., Dubey Dipti. (2018). Mathematical Programming and Game Theory. Springer. | |
dc.relation.referencesen | 19. Nazin, A. V., Poznyak, A. S. (1986). Adaptive Choice of Variants: Recurrence Algorithms. Moscow: Science. | |
dc.relation.referencesen | 20. Kushner, H., Yin, G. G. (2013). Stochastic Approximation and Recursive Algorithms and Applications. Springer Science & Business Media. | |
dc.citation.journalTitle | Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі | |
dc.citation.issue | 7 | |
dc.citation.spage | 24 | |
dc.citation.epage | 34 | |
dc.coverage.placename | Львів | |
dc.coverage.placename | Lviv | |
dc.subject.udc | 004.852 | |
dc.subject.udc | 004.94 | |
Appears in Collections: | Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. – 2020. – Випуск 7
|