AI · ETHICS · PHILOSOPHY · 5 МИН ЧТЕНИЯ · 2026-02-25

Аристотелева золотая середина для AI

Между галлюцинацией и отказом отвечать лежит то, что Аристотель назвал бы добродетелью модели.

Аристотелева золотая середина для AI

«Добродетель — это устойчивое расположение, выбирающее середину, определённую разумом». — Аристотель, Никомахова этика, II, 6.

Аристотель учил, что каждая добродетель — это середина между двумя пороками. Храбрость — середина между трусостью и безрассудством. Щедрость — между скупостью и расточительностью. Истина — между умалчиванием и хвастовством. Эта структура, выработанная для человеческой этики две с половиной тысячи лет назад, неожиданно точно описывает проблему калибровки больших языковых моделей.

У современной AI-модели тоже есть «пороки крайности». На одном краю — галлюцинация: модель выдаёт правдоподобный, но неверный ответ, когда не знает. На другом — чрезмерный отказ: модель отказывается отвечать на безобидный вопрос из перестраховки. Между ними — то, что Аристотель назвал бы добродетелью модели: калиброванная уверенность, признающая границы знания, но не отказывающаяся от полезного действия там, где знание есть.

Калибровка как этическая проблема

В технической литературе калибровка — это статистическая характеристика: насколько вероятностные оценки модели соответствуют реальной частоте правильности. Если модель говорит «я уверена на 80%» и она права в 80% случаев — она калибрована. Если права в 50% — переуверена. Если в 95% — недоуверена.

Это техническое определение скрывает этическое содержание. Переуверенность — это маленькая ложь, повторённая миллион раз: каждый раз, когда модель утверждает то, в чём не уверена, она занимает место истины обманом. Недоуверенность — это маленький отказ, повторённый миллион раз: каждый раз, когда модель воздерживается от помощи, в которой могла бы помочь, она отказывается от добродетели практической полезности. Аристотель сказал бы: оба — пороки. Добродетель посередине.

Почему середина не «50%»

Здесь та же ловушка, что в What the Mean Measures: середина не арифметическая. Не «половина галлюцинаций, половина отказов». Аристотелева середина — правильная мера для конкретной ситуации. В медицинском контексте сдвиг к большей осторожности оправдан: цена ошибочного утверждения выше цены отказа. В креативной задаче — сдвиг к смелости: цена отказа выше цены неточности.

Хорошая модель двигается по этому спектру в зависимости от контекста. Это и есть фронесис, перенесённый в архитектуру: не одна стратегия для всех случаев, а способность выбрать стратегию по обстоятельствам. Современные RLHF-методы пытаются научить этому, но пока несовершенно: модели часто застревают в одной точке спектра вне зависимости от контекста.

Что значит «добродетельная модель»

Если перевести Аристотеля на язык AI-инженерии, добродетельная модель характеризуется тремя свойствами. Первое — честная уверенность: вероятностные оценки соответствуют реальной частоте. Второе — контекстная гибкость: степень осторожности подстраивается под цену ошибки. Третье — явность границы: модель умеет сказать «я не знаю» без отказа от попытки помочь («я не знаю точного ответа, но вот направление, в котором искать»).

Эта тройка — не просто инженерная цель. Это аристотелева структура, которую в случае человека мы называем зрелостью. Незрелый человек либо переуверен, либо чрезмерно осторожен; зрелый умеет двигаться между крайностями осознанно.

Хорошая модель — это модель, у которой уверенность совпадает с обоснованием. Не больше, не меньше. Это и есть техническая формулировка античной честности.

Где сейчас провисает индустрия

Большая часть метрик современной AI-индустрии оптимизирует одну крайность, не заботясь о середине. «Точность на бенчмарке» поощряет уверенность, потому что воздержание от ответа считается ошибкой. «Безопасность» в смысле compliance поощряет осторожность, потому что любое сомнительное утверждение — риск. Если эти метрики применяются раздельно, модель смещается то к одному краю, то к другому, и середина случайна, а не выбрана.

Лучшие лаборатории сейчас явно вводят метрики калибровки: модель должна не только давать правильный ответ, но и знать, когда она в нём уверена. Это движение от техне (точность по правилам) к фронесису (мудрость в применении).

Кто отвечает за середину

В производственной AI-системе калибровка не возникает сама. За неё кто-то отвечает: команда, инженер, продукт-менеджер. Когда ответственности нет, середина становится случайной, и модель дрейфует к одному из краёв в зависимости от того, кто громче кричит — отдел качества (за безопасность) или отдел роста (за пользу). Аристотель сказал бы: добродетель не возникает у системы без морального субъекта, который её удерживает. То же касается машин.

Практически это означает: у каждой production-модели должен быть человек, чья работа — смотреть на калибровку. Не на точность, не на покрытие, а именно на соответствие уверенности обоснованию. Этот человек — современный аналог античного учителя добродетели: он не пишет правил, он удерживает форму. Без него модель скатывается в крайность тихо и незаметно.

Эта роль — хранителя калибровки — до сих пор не имеет устоявшегося названия в индустрии, и потому часто никем не занята. Где-то её исполняет ML-инженер «между делом», где-то — продукт-менеджер без профильной подготовки, где-то — никто. Античная этика добродетели сказала бы: безымянная роль — это роль ничьего внимания. Пока имя не появится в орг-структуре, калибровка будет рассматриваться как побочный эффект других целей, а не как самостоятельная задача. И тогда любая модель, выпущенная в production, со временем будет смещаться к одной из крайностей — той, которая дешевле в краткосрочной метрике.

Что делать (если вы строите или используете AI)

Если строите: измеряйте не только точность, но и калибровку. Reliability diagram — простой инструмент, показывающий, насколько уверенность модели совпадает с реальностью. Если разрыв большой — это техдолг, и его лечат не данными, а архитектурой обучения.

Если используете: тренируйте себя видеть, в каком режиме сейчас модель. Если она отвечает на всё с одинаковой уверенностью — относитесь к ответам с одинаковым скептицизмом. Если она часто отказывается — переформулируйте запрос так, чтобы цена помощи стала очевиднее цены отказа. Аристотель сказал бы: добродетель не в инструменте, а в его использовании — и это правда даже про машины.


Письмо из портика

Раз в неделю — лонгрид, цитата, практика. Без промо. Отписка в один клик.

Нажимая «Подписаться», вы соглашаетесь получать письма Stoa.


Ещё хроники