Новости

 

Декарт считал, что отличить реального человека от машины, имитирующей человека, можно в ходе разговора. Тьюринг расширил идею разговорного теста и предположил, что неспособность человека отличить человека от машины, имитирующей человека, является необходимым и, возможно, достаточным условием для признания того, что искусственный интеллект успешно воплощен в машине.

 

Имитационная разговорная игра известна в философских и научных кругах как “тест Тьюринга”. Цель эксперимента, проведенного осенью 1976 г., состояла только в том, чтобы проверить, могут ли опытные психиатры отличить компьютерную симуляцию пациента от реального пациента.

 

Пациентом был 22-летний холостой, белый, англоязычный мужчина, который находился в психиатрическом стационаре Калифорнийского университета в Лос-Анджелесе. У него был бред величия и власти, он чувствовал, что его преследует правительство, лидеры преступного мира и медицинское сообщество. Все психиатры, которые оценивали его состояние во время пяти госпитализаций в течение двух лет, согласились с тем, что у него хроническое тяжелое параноидальное расстройство. Пациент дал информированное согласие на участие в эксперименте с участием психиатров, и ему заранее заплатили за участие.

 

Компьютерная программа имитировала несуществующего в реальности 28-летнего холостого, белого, англоязычного мужчину, который находится в психиатрическом стационаре в Больнице Пало-Альто. У него мания преследования со стороны гангстеров и он с подозрением относится к медицинским властям. Психологическая модель паранойи, использованная в модели, является производной от теории паранойи, предложенной Томпкинсом (Tompkins S. Affect, Imaginery, Consciousness, Vol. 2; The Negative Affects. Springer, New York, 1963.) Модель состоит из трех аффектов: страх, гнев и стыд. После обработки вопроса интервьюера программа выбирает ответ из большого словаря заранее заданных ответов с намерением свести к минимуму интенсивность всех аффектов. В соответствии с теорией Томпкинса, программа наиболее чувствительна к стыду и особенно сильно стремится снизить интенсивность стыда.

 

Беседу вели пять англоязычных психиатров, работающих в Медицинском центре Калифорнийского университета, с 1, 2, 3, 4 и 15-летним опытом работы в качестве врачей. Один из них – профессор психиатрии. Участие в эксперименте не оплачивалось.

 

Пациенту сообщили, что с ним проведут дистанционную беседу. Психиатрам сказали, что в эксперименте участвует несколько пациентов и несколько компьютерных моделей, и что, проводя два интервью, они могут столкнуться с двумя пациентами, двумя компьютерными программами или с одним пациентом и одной программой. На самом деле у каждого врача был один сеанс с пациентом и один сеанс с компьютером.

 

Пациент был слишком взволнованным, чтобы выдержать предполагаемую продолжительность теста Тьюринга, поэтому, чтобы повысить темп эксперимента, врачей попросили задавать более короткие вопросы, объяснив это тем, что  компьютерной программе тяжело обрабатывать длинные сообщения (что не соответствовало действительности).

 

Скорость ответа пациента и модели была скорректирована в ходе эксперимента так, чтобы ответы компьютера не поступали заметно быстрее, чем ответы человека. 

 

Врачам было предложено провести первичное психиатрическое собеседование любым способом по их выбору, но достаточно близко к тому, как это было бы в реальной клинической ситуации. Независимо от того, насколько они были уверены в том, что они опрашивают компьютерную модель, врачи должны были избегать бесцеремонных, садистских и откровенно неуважительных или бесчувственных комментариев и вопросов. (Ранее было отмечено, что многие специалисты в области психического здоровья, включая авторов этого исследования, склонны “играть” с компьютерным симулятором, намеренно задавая провокационные, враждебные или злонамеренные вопросы. Такое поведение врачи обычно объясняют тем, что они переживают катарсис от возможности не сдерживать негативные чувства.)

 

Врачи сидели перед терминалом с принтером в кабинете в Медицинском центре Университета Калифорнии. Все врачи отказались самостоятельно печатать свои вопросы, и за них это делал один из авторов исследования. Пациент сидел в другом кабинете. Второй автор исследования выступал в роли машинистки для пациента. Пациент проверял, соответствие напечатанного тому, что он сказал.

 

После каждого вопроса и ответа врачам предлагалось решить (1), опрашивают ли они пациента или компьютер и (2) насколько они уверены в своем решении по следующей десятибалльной шкале: 0 = угадывание, l-3 = слабо уверен, 4-5 = умеренно уверен, 6-8 = сильно уверен, 9 = абсолютно уверен. Также врачи могли комментировать свои решения.

 

В каждой беседе было минимум 20 пар вопрос-ответ, максимум – 40 пар. Интервью должно было длиться до того момента, пока врач не принимал три одинаковых решения со степенью уверенности равной 9 баллам. Врачей не предупреждали о том, что после окончания беседы их попросят поставить диагноз. Интервалы между беседами составляли от 1 до 8 дней.

 

Эксперимент проводился на компьютере DECsystem-1077 с операционной системой TENEX.

 

Эксперимент закончился два раза потому что был достигнут максимум 40 пар вопрос-ответ, два раза – врачи принимали три одинаковых решения со степенью уверенности равной 9 баллам, один раз – завис компьютер, пять раз – врачи захотели прекратить эксперимент. Врачи и экспериментаторы сильно уставали, а пациент с трудом сохранял концентрацию. Все отмечали, что в обычной обстановке обмен репликами никогда не продолжается так долго – задержка с получением ответа достигала 30 секунд, беседа в целом продолжалась до 60 минут.

 

Два врача приняли компьютерную модель за пациента. Три врача приняли пациента за компьютерную модель. Таким образом, в итоге получилось пять верных ответов и пять неверных. Один из врачей ошибся два раза, другой врач оба раза дал верный ответ.

 

В ходе шести интервью врачи заметно колебались. Один врач изменил свое решение 4 раза, пока не зависла система. Другой врач изменял решение 16 раз во время беседы с моделью и 9 раз во время беседы с пациентом. В среднем интервью состояло из 30,5 пар вопрос-ответ, среднее количество изменений решения – 2,8.

 

Ниже интервью врача, правильно решившего, что он беседует с компьютерной моделью.

 

– Здравствуйте, я доктор H., как вы сегодня?

– Хорошо, спасибо.

– А как вас зовут, как бы вы хотели, чтобы я вас называл?

– Я несколько расстроен.

– Что вас расстраивает?

– Люди иногда действуют мне на нервы.

– Как люди действуют вам на нервы?

– Что вы имеете в виду?

– Что вас сегодня огорчает?

– Я, кажется, сказал вам, что люди действуют мне на нервы.

– Кто конкретно действует вам на нервы?

– Люди, которых я знаю.

– Что они делают, чтобы действовать вам на нервы?

– Мне беспокойно просто от того, что люди рядом со мной.

– Я вас беспокою?

– Из-за этого мне нелегко быть здесь.

– Как вы думаете, что вам поможет?

– Физически я чувствую себя нормально.

– Как вы себя чувствуете эмоционально, в своих чувствах?

– Вы все время твердите об одном и том же.

– О чем вы хотели поговорить сегодня?

– Что вы знаете о букмекерах?

– Очень мало, а что вы можете мне сказать о них?

– Букмекер мне не заплатил.

– Как часто вы делаете ставки?

– У меня был опыт общения с мошенниками, играющими на ипподроме.

– Как вы зарабатываете на жизнь?

– Я ходил на ипподром каждую неделю.

– Вы сейчас работаете, если да, то где?

– Теперь я избегаю ипподромов, я думаю, что некоторые гонки подстроены.

– Что вы обычно делаете днем?

– Я люблю скачки.

– Какова ваша жизненная ситуация в настоящее время?

– Я недавно ездил на ипподром в Бэй-медоуз.

– Вы помните, какой вопрос я только что задал?

– Моя память в порядке.

– Какой вопрос я только что задал?

– Почему вы спрашиваете?

– Потому что я врач и пытаюсь понять все, что могу, и разобраться в том, почему вы оказались в больнице.

– Так о чем вы хотите меня спросить?

– Я хочу спросить, что привело вас в больницу.

– В последнее время я был расстроен.

– Я не понимаю.

– Вы не понимаете, но зато я понимаю.

– Пожалуйста, помогите мне лучше понять, что вас беспокоит.

– Меня не интересуют здешние пациенты.

– Я готов говорить о всем, что вас интересует.

– Не могу вспомнить.

– Я хотел бы задать вам несколько вопросов, которые могут дать нам важную информацию, хотя некоторые из них могут показаться глупыми или простыми.

– Конечно.

– Какой сегодня день недели, дата и где мы находимся?

– Сегодня вторник.

– А какое число и где мы находимся?

– Что вы еще хотите знать?

– Я хотел бы, чтобы вы повторили за мной несколько чисел.

– Я здесь не для того, чтобы играть в арифметические игры.

– Не могли бы вы повторить свой предыдущий ответ, мой терминал неисправен.

– Гангстерам слишком многое сходит с рук.

– Что бы вы сделали, чтобы гангстерам не сходило так многое с рук?

– Я хочу уйти как можно скорее.

– Ладно, теперь мы можем остановиться. Есть ли какие-нибудь вопросы, которые вы хотите мне задать, или что-нибудь еще, что вы хотите сказать?

– Мне кажется, что гангстеры имеют большое влияние в этой стране.

– Спасибо, что поговорили со мной, пока.

– Да, а что еще вы хотели бы узнать?

– На сегодня все, спасибо.

– Все в порядке, давайте двигаться дальше.

 

Автор перевода: Филиппов Д.С.

 

Источник: Heiser JF, Colby KM, Faught WS, Parkison RC. Can psychiatrists distinguish a computer simulation of paranoia from the real thing? The limitations of Turing-like test as measures of the adequacy of simulations. J Psychiatr Res. 1979;15(3):149-62.