Традиційна анотація корпусу передбачає його лематизацію, яка уможливлює виконання пошуку за словоформами. На прикладі аналізу корпусу текстів Рільке показано морфологічну аморфність, притаманну слововжитку в поетичних текстах, яку пояснено психолінгвістичним розумінням продукування мови, та доведено, що для аналізу поетичних текстів, для яких характерною є синтаксична аморфність та відсутність колокацій, доцільним є виконання пошуку не за лемами, а за спільнокореневими словами, отже важливою вимогою доанотації корпусу поетичних текстів є проведення стемінгу.
The annotation of any given corpora traditionally requires its lemmatization that allows for the further searching for the word forms. Evidence from a corpus of texts by Rilke suggests the morphological amorphousness of word usage in poetic texts, that is explained by psycholinguistic theory of speech produсtion. It is shown, that the analysis of poetic texts, characterized by the relative absence of collocations, benefi ts from search not by for the word forms, but for the word stems, which in term requires the stemming of corpora of poetic texts.
Традиционная аннотация корпуса подразумевает его лемматизацию, которая делает возможным поиск по словоформам. На примере анализа корпуса текстов& Рильке показано морфологическую аморфность, присущую словоупотреблению в поэтических текстах, которая объясняется психолингвистическим пониманием продуцирования речи, и доказано, что для анализа поэтических текстов, для которых характерны синтаксиче&ская аморфность и отсутствие коллокаций, уместен поиск не по леммам, а по однокоренным словам, то есть, важным требованением к разметке корпуса поэтических текстов является проведение стеминга.