fantlab ru



  Лингвистический анализ произведения
Произведение: Хмурое утро
Автор: Алексей Николаевич Толстой
Дата проведения анализа: 18 сентября 2022 года

Общая статистика

Длина текста, знаков:736955
Слов в произведении (СВП):103452
Приблизительно страниц:369
Средняя длина слова, знаков:5.38
Средняя длина предложения (СДП), знаков:85.36
СДП авторского текста, знаков:101.98
СДП диалога, знаков:65.35
Доля диалогов в тексте:34.79%
Доля авторского текста в диалогах:14.3%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:13081
Активный словарный запас (АСЗ):12089
Активный несловарный запас (АНСЗ):992
Удельный АСЗ на 3000 слов текста:1328.65
Удельный АСЗ на 10000 слов текста:3220.41 —> 1446-е место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста:12905.20
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:20630 (19.94% от СВП)
Определённых частей речи (ОЧР), слов:82822 (80.06% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное29142 (35.19%)
          Прилагательное9378 (11.32%)
          Глагол18527 (22.37%)
          Местоимение-существительное6997 (8.45%)
          Местоименное прилагательное3865 (4.67%)
          Местоимение-предикатив18 (0.02%)
          Числительное (количественное)1193 (1.44%)
          Числительное (порядковое)265 (0.32%)
          Наречие4021 (4.85%)
          Предикатив686 (0.83%)
          Предлог11489 (13.87%)
          Союз6601 (7.97%)
          Междометие1463 (1.77%)
          Вводное слово163 (0.20%)
          Частица4873 (5.88%)
          Причастие2094 (2.53%)
          Деепричастие313 (0.38%)
Служебных слов:35782 (43.20%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное522059119.1.032.5.68101.440275.2.30127.61.1
Прилагательное549.1121.8.92.00.41.101.9.164.55.1.68.052.41.9.25
Глагол431721138.2.112.4.298.3.9938123.1.2583.5.42
Местоимение-существительное9.76.1255.22.1.011.124.5.986.73.4.66.257.3.68.08
Местоименное прилагательное1756.41.9.82.01.42.121.3.332.31.6.35.031.9.77.04
Местоимение-предикатив.01.01.07.03.00.00.00.00.00.01.00.00.00.00.02.00.00
Числительное (колич-ое)61.51.4.25.33.01.35.12.14.101.00.61.08.03.46.25.03
Числительное (порядковое)1.7.22.29.02.03.00.01.02.00.00.15.34.00.00.04.02.00
Наречие4.24123.61.1.00.30.022.1.485.12.1.44.103.91.4.15
Предикатив.78.441.8.58.26.00.05.00.26.21.60.55.09.03.41.11.01
Предлог711931012.012.5.83.60.20.15.72.03.01.523.3.20
Союз137.4187.32.3.00.75.184.7.6463.4.77.1651.1.32
Междометие5.61.3.724.4.97.00.11.01.34.09.34.58.29.00.36.12.02
Вводное слово.27.09.34.21.05.01.01.00.07.04.15.16.03.00.13.00.00
Частица6.53.2204.11.2.00.72.012.5.4743.5.61.144.3.78.15
Причастие9.82.2.95.41.41.00.10.02.60.044.7.90.30.03.45.45.07
Деепричастие.63.20.46.19.04.00.02.01.09.021.2.16.02.00.22.02.03

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное23242427293130303030
Прилагательное6.178.48.39.68.49.59.69.111
Глагол16242421202018181717
Местоимение-существительное13118.17.66.85.95.85.55.76.1
Местоименное прилагательное2.64.53.63.63.73.33.94.14.24.1
Местоимение-предикатив.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)1.61.311.11.211.11.31.11.1
Числительное (порядковое).40.30.40.20.20.30.30.20.20.20
Наречие6.35.143.83.63.53.43.643.9
Предикатив1.41.70.80.60.40.70.50.50.70
Предлог107.41012111212121212
Союз8.54.95.266.26.26.76.36.86.6
Междометие3.61.51.21.311.31.51.21.81
Вводное слово.40.20.20.00.10.10.20.20.10.10
Частица6.166.24.74.64.44.854.44
Причастие.501.11.42.21.82.11.82.22.62.5
Деепричастие.40.30.40.30.20.40.30.40.30.40

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая153.19
          .    точка54.42
          -    тире38.78
          !    восклицательный знак5.41
          ?    вопросительный знак8.16
          ...    многоточие26.64
          !..    воскл. знак с многоточием1.07
          ?..    вопр. знак с многоточием0.58
          !!!    тройной воскл. знак0.01
          ?!    вопр. знак с восклицанием0.00
          "    кавычка10.68
          ()    скобки0.98
          :    двоеточие10.20
          ;    точка с запятой1.61




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Алексей Николаевич Толстой
 50
2. Сергей Волков
 40
3. Борис Акунин
 38
4. Василий Аксёнов
 38
5. Марина и Сергей Дяченко
 37
6. Елена Хаецкая
 37
7. Валерий Большаков
 37
8. Александр и Людмила Белаш
 37
9. Тимур Максютов
 37
10. Николай Прокудин
 37
...смотреть весь список >>
⇑ Наверх