⋮

Богдан Кравцов
От бинарных признаков к реальности

Ступени анализа признаков

Анализируя материальные объекты, мы подбираем степень детализации описания под конкретную задачу: блоками модели могут быть планеты, города, детали конструктора, молекулы или элементарные частицы. Мы привыкли и к тому, что в рассуждениях о процессах выделяются стадии разной длительности: школьные классы, рабочие дни, такты двигателя..

Но характеристики и свойства тоже могут описываться с разной степенью точности и детализации. Реальность составлена не из бинарных признаков. Их используют люди для того, чтобы упростить свои модели, но тем самым они удаляются от более сложной реальности.

Прогуляемся по лесенке одного искусственного признака — экстраверт или интроверт. Этот признак используется в классификационных и прогностических моделях человеческого поведения начиная с Карла Густава Юнга. По его определению, для экстравертов важны социальные и практические аспекты жизни, а для интровертов — мир воображения и размышлений. На поверхностном уровне экстравертность описывается идеальной монетой — каждый человек либо экстраверт, либо интроверт.

В моделях на ступень глубже это бинарное противопоставление распадается на несколько признаков, корреляция между которыми не абсолютна. Так, в идеальной модели экстравертам свойственны умение эффективно вести разговор, воодушевление среди большого числа людей, поддержание многих контактов, эмпатия, способность моделировать человеческое поведение и такое всякое. Но живые люди, которых считают экстравертами, обладают только частью из этих умений. На этой глубине место монеты занимает набор бинарных признаков, описывающий экстравертность человека. Как электрощиток с набором тумблеров.

Сделаем еще один шаг вглубь. У разных людей каждое из этих умений выражено в большей или меньшей степени. Модель может эту степень задавать на градуальной дискректной шкале (скажем, от 0 до 7 с шагом в единицу), или даже точкой на отрезке действительной оси. На этом уровне экстравертность задается набором градуальных признаков, напоминающим эквалайзер.

Но люди — не статические системы. Их умения и предпочтения меняются с возрастом и зависят от погоды, настроения или неясно даже от чего. С точки зрения модели эти изменения могут выглядеть как случайные флуктуации. То есть, значения конкретного признака изменяются во времени, а в каждый конкретный момент их точнее будет представить как вероятностную функцию. Так на приборную панель выводятся температура, давление и влажность в конкретном месте — стрелки колеблются в ограниченном диапазоне, оказываясь на разных уровнях с приемлемо оцениваемой вероятностью.

Модель, похожая на архив показаний на приборной панели, позволяет описывать реальность более точно, но с ней сложнее работать — фиксировать наблюдения, сравнивать, принимать быстрые решения. Поэтому исследователи часто жертвуют точностью модели в пользу её удобства. Это разумно, если наблюдаемые данные хорошо кластеризуются, скапливаются вблизи нескольких точек в пространстве допустимых сочетаний. Но исследователю полезно подумать, что он будет делать с точками, которые не относятся ни к одному из кластеров.

Откуда ты родом?

В скитаниях меня часто спрашивают: «Откуда ты родом?».

Я родился в уральском городке, который сейчас называется Озёрском, но в свидетельстве о рождении написано, что я родился в Челябинске. Но никто из моей семьи не родился там, кроме меня. Я не жил на Урале, у меня там нет родных, а в Озёрске в последний раз был около тридцати лет назад.

Отец моей мамы родился в Воронежской области, а мама моей мамы — в Перми. Я вырос в Восточной Украине, потому что родители моего отца жили в Сватове. Я 13 лет учился Электростали и в Долгопрудном Московской области, получил российский паспорт. Успел пожить в Чикаго, в Москве и в Санкт-Петербурге, а в Литву переехал из Тбилиси.

От удивления, что на короткий вопрос у меня нет короткого ответа, люди его требуют. Реальность не укладывается в модель, и эти люди выбирают пожертвовать реальностью.

В разных случаях будут важными разные аспекты моей биографии. И влияние этих аспектов на геоидентификацию тоже будет разным для меня и для собеседника. Поэтому адекватнее собрать всю доступную информацию и лишь потом упаковывать её в модель. В веб-формах правильнее спрашивать возраст в виде числа или даже свободного поля, а не предлагать нескольких диапазонов на выбор.

Многое вполне однозначно

Но даже из самого бережного описания не следует, что «всё не так однозначно». Многие случаи будет легко отнести к одному из больших кластеров. Важно понимать небинарных людей и быть готовым с ними общаться, но подавляющее большинство людей — мужчины и женщины.

Клиническая смерть, искусственный интеллект и зомби

Умение анализировать признаки позволяет расширять их применимость, иногда даже за пределы наблюдаемой реальности. Искусственный интеллект можно сравнивать с органическим. Выдуманные зомби в чём-то ближе к живым, в чём-то — к мёртвым.
 ⋮