The purpose of this study is to construct an automatic syntactic analysis (ASA) and, as a result, to compile a dictionary of models of multicomponent complex sentences for studying the fectures of the linear structure of Ukrainian text. The process includes twostages: the first stage is an automatic syntactic analysis of the hierarchical type which results in building of a dependency tree (DT), in the second stage, the sentence structure information is automatically extracted from the obtained graph. ASA is a package of operations performed with a string of morphological information (the result of AMA work) representing the incoming text for determination of syntactic relations between text units. The outgoing text for the ACA is a string of information reduced after the AMA to wordforms. We have studied features of the linear structure of 2000 Ukrainian language sentences in journalistic genre (selection of 52000 words use). Based on the obtained results, we have constructed the real models of the syntactic structure of sentences, in which the relations between simple clauses were presented. All grammatical situations of the linear context were possible manifestations of models in the text. Based on that data, the algorithm for the automatic gen&eration of a complex sentence model was created. These models are linear syntax grammar. All types of syntactic connection between the main and subordinate clauses are recorded algorithmically. Thus, it is possible to build the interpretations of the& linear structure of the Ukrainian language sentence almost not using lexical-semantic information. The theoretical value of the paper is in extension of our knowledge about the structure of the syntactic level of the language and the variety of mech&anisms functioning at that level. The applied value, is first of all, in creation of the dictionary of compatibility of compound (coordinated) and complex (subordinated) sentences, and in the possibility of constructing requests to the Ukrainian lang&uage Corpus in order to mine from the text definite models sentences, creating own dictionaries of authors and styles.
Щодо укладання електронного словника моделей багатокомпонентних складних речень української мови.
Метою дослідження є побудова а&втоматичного синтаксичного аналізу (АСА) і як наслідок – укладання словника моделей багатокомпонентних складних речень для вивчення властивостей лінійної структури українськомовного тексту. Процес укладання двоетапний: на першому етапі працює автомат&ичний синтаксичний аналіз ієрархічного типу, який завершується побудовою дерева залежностей (ДЗ), а на другому – з одержаного графа автоматичного здобувається інформація про модель речення. АСА – це сукупність операцій, які виконуються над послідовно&стями інформації морфологічного характеру (результатом роботи АМА), що представляють вхідний текст, для встановлення синтаксичних зв’язків між текстовими одиницями. Вихідним текстом для АСА є редукована після АМА послідовність інформації до словоформ&. Досліджувалися властивості лінійної структури 2000 українськомовних речень публіцистичного стилю (вибірка у 52000 слововживань). На підставі цих результатів будувалися реальні моделі синтаксичної структури речень, у яких відображені відношення між &простими реченнями. Усі граматичні ситуації лінійного контексту були можливими маніфестаціями моделей у тексті. На підставі цих даних будувався алгоритм автоматичного творення моделі складного речення. Отримані моделі є
граматикою лінійного синтакс&ису. Усі види синтаксичного зв’язку між головним і
підрядними реченнями фіксуються алгоритмічно. Таким чином можна будувати
інтерпретації лінійної структури українського речення, майже не використовуючи
лексико-семантичну інформацію. Теоретичне зн&ачення роботи полягає в поглибленні наших уявлень про будову синтаксичного рівня мови і різноманітності механізмів, які діють на синтаксичному рівні. Прикладне значення вбачаємо у створенні словника сполучуваності складносурядних і складнопідрядних р&