fantlab ru



  Лингвистический анализ произведения
Произведение: Нарисованные герои
Автор: Владислав Крапивин
Дата проведения анализа: 19 сентября 2022 года

Общая статистика

Длина текста, знаков:293305
Слов в произведении (СВП):44265
Приблизительно страниц:150
Средняя длина слова, знаков:5.12
Средняя длина предложения (СДП), знаков:50.63
СДП авторского текста, знаков:59.23
СДП диалога, знаков:33.06
Доля диалогов в тексте:21.5%
Доля авторского текста в диалогах:11.98%
Использование диалогов по тексту
(по горизонтали: счётчик знаков; по вертикали: процент диалогов;
размер скользящего окна: знаков, шаг: 1000 знаков)

Активный словарный запас

Использовано уникальных слов:7321
Активный словарный запас (АСЗ):6951
Активный несловарный запас (АНСЗ):370
Удельный АСЗ на 3000 слов текста:1194.42
Удельный АСЗ на 10000 слов текста:2798.20 —> 6394-е место в рейтинге УАСЗ-10000
Динамика изменения УАСЗ-3000 от начала до конца произведения
(по горизонтали: счётчик слов; по вертикали: УАСЗ-3000)
Максимальное значение УАСЗ-3000 (0) приходится приблизительно на 0-ю страницу текста.
Миниимальное значение УАСЗ-3000 (10000000) приходится приблизительно на 0-ю страницу текста.

Части речи

Неопределённых частей речи (НОЧР), слов:9553 (21.58% от СВП)
Определённых частей речи (ОЧР), слов:34712 (78.42% от СВП)
Из них (принимая ОЧР за 100%):
          Существительное11125 (32.05%)
          Прилагательное3961 (11.41%)
          Глагол8246 (23.76%)
          Местоимение-существительное3500 (10.08%)
          Местоименное прилагательное1521 (4.38%)
          Местоимение-предикатив10 (0.03%)
          Числительное (количественное)441 (1.27%)
          Числительное (порядковое)107 (0.31%)
          Наречие2229 (6.42%)
          Предикатив292 (0.84%)
          Предлог4353 (12.54%)
          Союз3622 (10.43%)
          Междометие771 (2.22%)
          Вводное слово100 (0.29%)
          Частица2535 (7.30%)
          Причастие491 (1.41%)
          Деепричастие86 (0.25%)
Служебных слов:16498 (47.53%)

Биграммы частей речи

В таблице показаны частоты словопар типа «существительное+прилагательное», «прилагательное+глагол» и т.д. Для удобства восприятия частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

С
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
П
р
и
л
а
г
а
т
е
л
ь
н
о
е
Г
л
а
г
о
л
М
е
с
т
о
и
м
е
н
и
е
-
с
у
щ
е
с
т
в
и
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
н
о
е

п
р
и
л
а
г
а
т
е
л
ь
н
о
е
М
е
с
т
о
и
м
е
н
и
е
-
п
р
е
д
и
к
а
т
и
в
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
к
о
л
и
ч
е
с
т
в
е
н
н
о
е
)
Ч
и
с
л
и
т
е
л
ь
н
о
е

(
п
о
р
я
д
к
о
в
о
е
)
Н
а
р
е
ч
и
е
П
р
е
д
и
к
а
т
и
в
П
р
е
д
л
о
г
С
о
ю
з
М
е
ж
д
о
м
е
т
и
е
В
в
о
д
н
о
е

с
л
о
в
о
Ч
а
с
т
и
ц
а
П
р
и
ч
а
с
т
и
е
Д
е
е
п
р
и
ч
а
с
т
и
е
Существительное3617509.37.7.031.6.4010.9930315.3.46123.5.35
Прилагательное548.2122.91.00.29.032.433.65.71.3.052.41.2.29
Глагол391818127.112.4.4310.9440183.5.13112.4.48
Местоимение-существительное8.36.1364.22.1.03.72.057.8.725.34.24.4611.38.16
Местоименное прилагательное175.15.12.2.51.03.32.031.4.481.61.3.27.032.7.19.03
Местоимение-предикатив.00.00.11.00.00.00.00.00.00.00.00.00.00.00.00.00.00
Числительное (колич-ое)4.9.721.2.32.32.00.19.32.19.08.83.94.08.00.46.08.00
Числительное (порядковое)1.7.05.11.08.00.00.00.05.08.00.08.29.00.00.03.00.00
Наречие5.55.7175.81.5.05.38.032.8.544.24.97.113.5.54.08
Предикатив.75.291.4.48.11.00.11.00.38.08.56.54.11.03.80.05.03
Предлог651838.511.002.3.94.59.13.19.64.05.00.862.4.08
Союз188.823103.1.03.97.217.677.53.9.83.297.7.99.21
Междометие6.91.51.34.21.2.00.16.00.99.05.97.97.19.03.91.13.00
Вводное слово.35.24.46.40.11.00.03.00.11.05.27.27.03.00.21.00.00
Частица7.14.8284.41.4.00.91.033.2.704.94.2.75.214.5.48.21
Причастие61.5.29.27.19.00.03.03.46.002.8.38.16.00.21.03.00
Деепричастие.19.08.32.19.00.00.00.00.08.00.80.16.00.00.29.00.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах.

В каждом столбце максимальное значение отмечено жирным шрифтом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»


 Номер слова в предложении
 12345678910
Существительное17182224282830293132
Прилагательное5.76.87.78.910101011119.6
Глагол12262522192018181619
Местоимение-существительное20118.57.45.75.84.15.23.54.1
Местоименное прилагательное2.33.63.93.22.93.234.23.93.6
Местоимение-предикатив.00.10.00.00.00.10.00.00.00.00
Числительное (колич-ое).80.9011.11.21.21.801.11.3
Числительное (порядковое).20.20.30.30.10.30.30.10.30.40
Наречие7.56.85.454.54.554.24.13.6
Предикатив1.3.90.60.80.60.70.30.50.50.60
Предлог7.67.31011101012111111
Союз146.378.28.18.48.48.27.67.9
Междометие4.51.41.11.21.61.51.71.11.41.9
Вводное слово.60.40.20.30.10.10.10.10.30.10
Частица6.48.16.66.15.75.25.255.73.7
Причастие.30.90.90.801.211.11.81.61.6
Деепричастие.20.10.20.20.20.10.20.30.50.40

Знаки препинания

Частоты знаков препинания (среднее количество на 1000 слов):
          ,    запятая101.07
          .    точка100.67
          -    тире22.09
          !    восклицательный знак5.83
          ?    вопросительный знак10.35
          ...    многоточие15.00
          !..    воскл. знак с многоточием0.18
          ?..    вопр. знак с многоточием0.20
          !!!    тройной воскл. знак0.00
          ?!    вопр. знак с восклицанием0.11
          "    кавычка16.83
          ()    скобки2.28
          :    двоеточие7.23
          ;    точка с запятой0.07




Распознавание автора текста

Алгоритм распознавания автора текста, разработанный в 2008 году Львовым Алексеем (creator) для Лаборатории Фантастики, основан на сравнении лингвистического профиля текста с идентичными по структуре лингвистическими профилями авторов для выявления наиболее точного совпадения. Лингвопрофили авторов вычисляются заблаговременно и хранятся в базе данных как массивы усреднённых показателей и их среднеквадратичных отклонений по всем текстам автора. Таких показателей насчитывается более тысячи, часть из которых приведена выше.

Эмпирический подсчёт показал, что совокупный анализ этих данных, взятых в весовых долях, позволяет определить автора романа с точностью 98.79%, рассказа — 84.32% (при условии, что в базе данных имеется лингвистический профиль истинного автора). Алгоритм сложен и обладает рядом инновационных решений, что позволяет достичь высокой точности в сравнении с прототипами, основанными на анализе одних лишь символьных биграмм.

Алгоритм работы лингвоанализатора кратко описан в статье «Лингвистический анализ текста и распознавание автора».


АвторСовпадение с лингвопрофилем автора (в условных единицах)
1. Владислав Крапивин
 44
2. Олег Верещагин
 38
3. Борис Акунин
 38
4. Сергей Волков
 37
5. Дмитрий Скирюк
 37
6. Марина и Сергей Дяченко
 37
7. Дмитрий Емец
 37
8. Михаил Тырин
 37
9. Анна Гурова
 37
10. Аркадий и Борис Стругацкие
 36
...смотреть весь список >>
⇑ Наверх