Дана стаття присвячена дослідженню проблеми встановлення авторства текстів за фонічними ознаками. Кластеризація базується на застосуванні нейронної мережі Кохонена з алгоритмом навчання SOM та представленні текстів у вигляді векторів частот 3-грам як векторів ознак. Реалізовано навчання мережі з використанням експериментально підібраних значень параметрів для обчислення функції околу нейрона-переможця та наведено результати кластеризації художніх текстів.
This article deals with the problem of defining authorship using phonic features. Clustering is based on using Kohonen neural network with learning algorithm SOM and representing texts in the form of vectors of frequency of 3-grams as feature vectors. Training network using experimentally selected parameter values to calculate the neighborhood function of neuron-winner is implemented and results of clustering texts are shown.