Интернет-журнал дачника. Сад и огород своими руками

Восстание машин откладывается: почему тест Тьюринга устарел. Искусственный интеллект и тест тьюринга

Итак сегодня мы поговорим о самом известном тесте для оценки говорящего бота - это тест Тьюринга.

Тест Тьюринга - эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» (англ. Computing Machinery and Intelligence), опубликованной в 1950 году в философском журнале «Mind». Тьюринг задался целью определить, может ли машина мыслить.
Стандартное звучание закона: «Если компьютер может работать так, что человек не в состоянии определить, с кем он общается - с другим человеком или с машиной, - считается, что он прошел тест Тьюринга»

Разумные, подобные человеку машины на протяжении многих десятилетий были одной из основных тем научно-фантастических произведений. С момента зарождения современной вычислительной техники умы людей занимал вопрос: можно ли построить машину, которая могла бы в чем-то заменить человека. Попыткой создать твердую эмпирическую почву для решения этого вопроса и стал тест, разработанный Аланом Тьюрингом.
Первый вариант теста, опубликованный в 1950 году, был несколько запутанным. Современная версия теста Тьюринга представляет собой следующее задание. Группа экспертов общается с неизвестным существом. Они не видят своего собеседника и могут общаться с ним только через какую-то изолирующую систему - например, клавиатуру. Им разрешается задавать собеседнику любые вопросы, вести разговор на любые темы. Если в конце эксперимента они не смогут сказать, общались ли они с человеком или с машиной, и если на самом деле они разговаривали с машиной, можно считать, что эта машина прошла тест Тьюринга.
Существуют, по крайней мере, три основных варианта теста Тьюринга, два из которых были предложны в статье «Вычислительные машины и разум», а третий вариант, по терминологии Саула Трейджера (Saul Traiger), является стандартной интерпретацией.

Наряду с тем, что существует определенная дискуссия, соответствует ли современная интерпретация тому, что описывал Тьюринг, либо она является результатом неверного толкования его работ, все три версии не считаются равносильными, их сильные и слабые стороны различаются.
Имитационная игра

Тьюринг, как мы уже знаем, описал простую игру для вечеринок, которая включает в себя минимум трех игроков. Игрок А - мужчина, игрок В - женщина и игрок С, который играет в качестве ведущего беседу, любого пола. По правилам игры С не видит ни А, ни В и может общаться с ними только посредством письменных сообщений. Задавая вопросы игрокам А и В, С пытается определить, кто из них - мужчина, а кто - женщина. Задачей игрока А является запутать игрока С, чтобы он сделал неправильный вывод. В то же время задачей игрока В является помочь игроку С вынести верное суждение.

В той версии, которую С. Г. Стеррет (S. G. Sterret) называет «Первоначальный тест на основе имитационной игры» (Original Imitation Game Test), Тьюринг предлагает, чтобы роль игрока А исполнял компьютер. Таким образом, задачей компьютера является притвориться женщиной, чтобы сбить с толку игрока С. Успешность выполнения подобной задачи оценивается на основе сравнения исходов игры, когда игрок А - компьютер, и исходов, когда игрок А - мужчина. Если, по словам Тьюринга, «ведущий беседу игрок после проведения игры [с участием компьютера] выносит неверное решение так же часто, как и после проведения игры с участием мужчины и женщины», то можно говорить о том, что компьютер разумен.

Второй вариант предложен Тьюрингом в той же статье. Как и в «Первоначальном тесте», роль игрока А исполняет компьютер. Различие заключается в том, что роль игрока В может исполнять как мужчина, так и женщина.

«Давайте рассмотрим конкретный компьютер. Верно ли то, что модифицируя этот компьютер с целью иметь достаточно места для хранения данных, увеличивая скорость его работы и задавая ему подходящую программу, можно сконструировать такой компьютер, чтобы он удовлетворительно выполнял роль игрока А в имитационной игре, в то время как роль игрока В выполняет мужчина?», - Тьюринг, 1950, стр. 442.

В этом варианте оба игрока А и В пытаются склонить ведущего к неверному решению.

Главной мыслью данной версии является то, что целью теста Тьюринга является ответ не на вопрос, может ли машина одурачить ведущего, а на вопрос, может ли машина имитировать человека или нет. Несмотря на то, что идут споры о том, подразумевался ли этот вариант Тьюрингом или нет, Стеррет считает, что этот вариант Тьюрингом подразумевался и, таким образом, совмещает второй вариант с третьим. В это же время группа оппонентов, включая Трейджера, так не считает. Но это все равно привело к тому, что можно назвать «стандартной интерпретацией». В этом варианте игрок А - компьютер, игрок В - человек любого пола. Задачей ведущего является теперь не определить кто из них мужчина и женщина, а кто из них компьютер, а кто - человек.

Тьюринг в 2012

Для организации мероприятий по празднованию в 2012 году столетия со дня рождения Тьюринга создан специальный комитет, задачей которого является донести мысль Тьюринга о разумной машине, отраженную в таких голливудских фильмах, как «Бегущий по лезвию», до широкой публики, включая детей. В работе комитета участвуют: Кевин Ворвик, председатель, Хьюма Ша, координатор, Ян Бланд (Ian Bland), Крис Чапмэн (Chris Chapman), Марк Аллен (Marc Allen), Рори Данлоуп (Rory Dunlop), победители конкурса на получение премии Лёбнера Робби Гарне и Фред Робертс (Fred Roberts). Комитет работает при поддержке организации «Женщины в технике» (Women in Technology) и Daden Ltd.

С момента появления компьютеров писатели-фантасты стали придумывать сюжеты с разумными машинами, которые захватывают мир и делают из людей рабов.

Ученые поначалу подсмеивались над этим, но по мере развития информационных технологий, идея разумной машины перестала казаться такой невероятной. Чтобы проверить может ли компьютер обладать интеллектом, был создан тест Тьюринга, и придумал его ни кто иной, как Алан Тьюринг, чьим именем и был названа эта методика. Давайте поговорим подробнее о том, что это за тест такой и что он на самом деле может.

Как пройти тест Тьюринга?

Кто придумал тест Тьюринга, нам известно, но вот зачем он это сделал, чтобы доказать, что ни одна машина не сравнится с человеком? На самом деле Алан Тьюринг занимался серьезными исследованиями «машинного интеллекта» и предполагал, что возможно создать такую машину, которая сможет осуществлять мыслительную деятельность подобно человеку. Во всяком случае, еще в 47 году прошлого века он заявил, что несложно сделать машину, которая бы могла неплохо играть в шахматы, а раз можно это, то возможно создать и «думающий» компьютер.

Пройти тест Тьюринга

Но как определить, достигли инженеры своей цели или нет, обладает ли их детище интеллектом или это еще один усовершенствованный калькулятор? Для этой цели Алан Тьюринг и создал свой тест, который позволяет понять насколько машинный интеллект может соревноваться с человеческим.

Суть теста Тьюринга заключается в следующем: если компьютер умеет думать, то при разговоре человек не сможет отличить машину от другого человека. В тесте принимают участие 2 человека и один компьютер, все участники друг друга не видят, а общение происходит в письменном виде. Переписка ведется через контролируемые промежутки времени, чтобы судья не мог определить компьютер, ориентируясь на скорость ответов. Тест считается пройденным, если судья не может сказать, с кем он ведет переписку – с человеком или компьютером. В полной мере пройти тест Тьюринга пока не удалось ни одной программе. В 1966 году программе Элиза удалось обмануть судей, но только потому, что она имитировала приемы психотерапевта, использующего клиент-центрированную методику, а людям не говорили, что они могут разговаривать с компьютером. В 1972 программа PARRY, имитируя параноидального шизофреника, тоже смогла обмануть 52% психиатров. Тест проводила одна команда психиатров, а вторая читала стенограмму записи. Перед обеими командами стояла задача узнать, где слова реальных людей, а где речь программы. Сделать это удалось лишь в 48% случаев, но тест Тьюринга предполагает общение в он-лайн режиме, а не чтение записей.

Сегодня существует премия Лёбнера, которая выдается по результатам ежегодного конкурса программам, которые смогли пройти тест Тьюринга. Существуют золотая (зрительная и аудио), серебряная (аудио) и бронзовая (текст) награды. Первые две еще не вручались, бронзовые же медали вручались программам, которые смогли лучше всего сымитировать человека во время переписки. Но такое общение нельзя назвать полноценным, так как он больше напоминает дружескую переписку в чате, состоящую из обрывочных фраз. Поэтому-то и говорить о полном прохождении теста Тьюринга нельзя.

Обратный тест Тьюринга

С одной из интерпретаций обратного теста Тьюринга сталкивался каждый – это надоедливые просьбы сайтов ввести капчу (CAPTHA), которые используются для защиты от спам-ботов. Считается, что пока не существует (или они недоступны рядовому пользователю) достаточно мощных программ, способных распознать искаженный текст и воспроизвести его. Вот такой забавный парадокс – теперь уже мы должны доказывать компьютерам свою способность мыслить.

Статьи по теме:

Шкала Кинси

Человек так создан, что продолжить свой род он может только соединившись в любовной страсти с лицом противоположного пола. Но что если лица одного пола с вами выглядят более привлекательно? Не значит ли это, что у вас есть тяга к гомосексуальности? Проверить основные признаки вы можете с помощью следующего теста.

Тест Айзенка на темперамент

Безусловно все мы являемся индивидуальными и неповторимыми личностями. Однако в четырех случаях люди между собой похожи. Иными словами — каждый из нас принадлежит к одному из четырех типов темперамента. Какой именно относится лично к вам вы можете проверить сию минуту.

Эксперимент в психологии

Ни одна уважающая себя наука не обходится без экспериментов. В том числе и психология. Правда, с ее точки зрения это скорее метод, позволяющий лучше исследовать сущность человека. Но от этого эксперимент в психологии менее интересным точно не становится.

Социометрия — методика

Как обнаружить лидера в коллективе? И как без участия в трудовом процессе узнать чем живет этот коллектив? Психологи давно нашли ответы на эти вопросы и создали социометрическую методику. В чем заключается ее суть мы расскажем далее.

Женя Густман (англ.Eugene Goostman ) - виртуальный собеседник, который, согласно первоначальным сообщениям в СМИ, «впервые сумел пройти тест Тьюринга» на испытаниях, организованных в 2014 году университетом Рединга (Великобритания). Он появился в 2001 году.

Был создан группой из трёх программистов: Владимира Веселова (родом из России, живёт в Нью-Джерси), Евгения Демченко (родом из Украины) и Сергея Уласеня (родом из России). Разработка программы была начата в Санкт-Петербурге в 2001 году. Чтобы характер и знания Густмана казались более правдоподобными, он представляется пользователям 13-летним мальчиком из Одессы.

Тест Тьюринга

Густман с момента его создания принимал участие в ряде соревнований на прохождение теста Тьюринга и несколько раз занимал второе место в соревновании на премию Лёбнера. В июне 2012 года Густман выиграл соревнование в честь 100-летия Алана Тьюринга, сумев убедить 29 % судей, что он человек. 7 июня 2014 года, на конкурсе, посвященном 60-летию со дня смерти Тьюринга, Густман убедил 33 % судей, что он человек, и, по словам Кевина Уорика, стал первым в истории компьютером, прошедшим тест Тьюринга. .

Имеются утверждения , что Густман стал далеко не первым, и даже не лучшим по результатам аналогичных тестов. Результат в 59 % был показан ещё в 2011 году ботом Cleverbot . В ответ на подобные утверждения организатор соревнования 2014 года в университете Рединга, профессор Кевин Уорик подчеркнул, что, в отличие от предыдущих соревнований, к которым применяли слова «тест Тьюринга», в этот раз было проведено больше одновременных сравнительных тестов, чем когда-либо ещё, они были независимо проверены и, что критично, тематика бесед не была ограничена .

Сам Тьюринг вовсе не устанавливал столь низкий процент введённых в заблуждение собеседников в качестве критерия «прохождения теста», а лишь предположил, что в 2000 году компьютеры с объёмом памяти около 10 9 бит смогут играть в имитационную игру так, что у среднего собеседника будет не более 70 % шансов опознать машину после пятиминутного собеседования .

Критики теста Тьюринга принижают значимость соревнований на прохождение теста, утверждая, что Женя Густман является лишь «чатботом»:

…Машина прикидывается всего лишь ребёнком, ну а полноценное прохождение теста Тьюринга невозможно ею в принципе. Ибо тест всего лишь бихевиористичен; на принципиальный вопрос - мыслит ли машина? - он ответа дать не может… Данные вопросы, конечно, могут обеспечить работой поколения философов-профессионалов, равно как и досугом - обширные круги философов-самоучек. Но вот с точки зрения инженерного дела или бизнеса они никакого смысла не имеют .

Примечания

Ссылки

Тест Тьюринга – это тест, как следует из названия, предложенный Аланом Тьюрингом, для определения обладает ли машина интеллектом. Тьюринг решил, что нет смысла разрабатывать обширный список требований, необходимых для создания искусственного интеллекта, который к тому же может оказаться противоречивым, и предложил тест, основанный на том, что поведение объекта, обладающего искусственным интеллектом, в конечном итоге нельзя будет отличить от поведения таких бесспорно интеллектуальных сущностей, как человеческие существа. Компьютер успешно пройдет тест Тьюринга, если человек-экспериментатор, задавший ему в письменном виде определенные вопросы, не сможет определить, получены ли письменные ответы от другого человека или от некоторого устройства.

Где пройти Тест Тьюринга онлайн?

На данный момент составление программы для компьютера, чтобы он прошел тест Тьюринга, требует большого объема работы. Запрограммированный таким образом компьютер должен включать в себя:

  • средства обработки текстов на естественных языках (Natural Language Processing – NLP), позволяющие успешно общаться с компьютером, скажем на английском языке;
  • средства представления знаний, с помощью которых компьютер может записать в память то, что он узнает или прочитает;
  • средства автоматического формирования логических выводов, обеспечивающие возможность использовать хранимую информацию для поиска ответов на вопросы и вывода новых заключений;
  • средства машинного обучения, которые позволяют приспосабливаться к новым обстоятельствам, а также обнаруживать и экстраполировать признаки стандартных ситуаций.

В тесте Тьюринга сознательно исключено непосредственное физическое взаимодействие экспериментатора и компьютера, поскольку для создания искусственного интеллекта не требуется физическая имитация человека. Но в так называемом полном тесте Тьюринга предусмотрено использование видеосигнала для того, чтобы экспериментатор мог проверить способности испытуемого объекта к восприятию, а также имел возможность представить физические объекты «в неполном виде» (пропустить их «через штриховку»).

Тьюринг предсказывал, что компьютеры в конечном счёте пройдут его тест. Он считал, что к 2000 году компьютер с памятью 1 миллиард бит (около 119 МБ) в ходе 5-минутного теста сможет обмануть судей в 30 % случаев.

Это предсказание не сбылось. Тьюринг также предсказал, что сочетание «мыслящая машина» не будет считаться оксюмороном, а обучение компьютеров будет играть важную роль в создании мощных компьютеров (с чем большинство современных исследователей согласны).

Пока что ни одна программа и близко не подошла к прохождению теста Тьюринга. Такие программы, как Элиза (ELIZA), иногда заставляли людей верить, что они говорят с человеком, как, например, в неформальном эксперименте, названном AOLiza. Но такие «успехи» не являются прохождением теста Тьюринга. Во-первых, человек в таких беседах не имел никаких оснований считать, что он говорит с программой, в то время как в настоящем тесте Тьюринга человек активно пытается определить, с кем он беседует. Во-вторых, документированные случаи обычно относятся к таким чатам, где многие беседы отрывочны и бессмысленны. В-третьих, многие пользователи чатов используют английский как второй или третий язык, и бессмысленный ответ программы, вероятно, спишется ими на языковый барьер. В-четвертых, многие пользователи ничего не знают об Элизе и ей подобных программах и не могут распознать совершенно нечеловеческие ошибки, которые эти программы допускают.

Ежегодно производится соревнование между разговаривающими программами и наиболее человекоподобной, по мнению судей, присуждается приз Лебнера.

Есть также дополнительный приз для программы, которая, по мнению судей, пройдет тест Тьюринга. Этот приз еще не присуждался. Самый лучший результат показала программа A.L.I.C.E. выиграв приз Лебнера 3 раза (в 2000, 2001 и 2004).

Несмотря на то, что прошло больше 50 лет, тест Тьюринга не потерял своей значимости. Но в настоящее время исследователи искусственного интеллекта практически не занимаются решением задачи прохождения теста Тьюринга, считая, что гораздо важнее изучить основополагающие принципы интеллекта, чем продублировать одного из носителей естественного интеллекта. В частности, проблему «искусственного полета» удалось успешно решить лишь после того, как братья Райт и другие исследователи перестали имитировать птиц и приступили к изучению аэродинамики. В научных и технических работах по воздухоплаванию цель этой области знаний не определяется как «создание машин, которые в своем полете настолько напоминают голубей, что даже могут обмануть настоящих птиц».

Вчера все мировые СМИ облетела новость о том, что компьютерная программа впервые в истории прошла тест Тьюринга. Это тест был создан английским математиком Аланом Тьюрингом в 1950 году и позволяет оценить уровень искусственного интеллекта.

Алан Тьюринг — британский математик. Во время Второй Мировой войны он взламывал немецкие шифры, а после нее был осужден за гомосексуализм #справедливостинет

В ходе теста Тьюринга программа общается с группой людей в течение пяти минут. Если она убедит более 30% собеседников в том, что не является компьютером, то ее интеллект можно считать сколько нибудь приближенным к человеческому.

Тест Тьюринга: разумность познается в общении

7 июня - в день 60-летия со смерти Тьюринга - один из таких конкурсов, организованный Университетом Рединга, завершился успехом: созданная российско-украинской командой программа «Евгений Густман», убедила треть судей, что она является 13-летним украинским мальчиком из Одессы.

33 процента это больше, чем когда-либо в истории, но серьезным прогрессом назвать это сложно. Попробуйте поговорить с ним сами. Это можно сделать здесь.

Поговорите с Евгением об Одессе

Обозреватель Блумберга Леонид Бершидский написал в ответ на эту новость колонку “Ненастоящая победа искусственного интеллекта”, в которой привел вот такой разговор с ботом:

ЛБ : Где ты живешь?
ЕГ : Я из Украины, город Одесса. Ты мог о нем слышать.
ЛБ : Я слышал. Где ты был 2-го мая.
ЕГ : Был я? Я бы предпочел не говорить об этом, если ты не против. Не хочешь спросить что-нибудь еще?
ЛБ : Я хочу поговорить об этом. Мне интересно был ли ты в Одессе 2-го мая и видел ли, что случилось в Доме профсоюзов?
ЕГ : Я думаю, что ты можешь ответить на свой вопрос сам, потому что он риторический….
далее бот продолжает увиливать от ответов.

Создатели программы немного схитрили, сделав её 13-летним мальчиком и позволив списывать несовершенство ответов на возраст. Но этот 13-летний мальчик по замыслу организаторов был из Одессы. И в этом разговоре Бершидский спросил у него о событиях, произошедших в Одессе 2-го мая (см. Пожар в одесском Доме профсоюзов, гуглить осторожно — возможны помутнения разума). Вряд ли какой одессит мог не знать об этом событии. Но “Eugene Goostman” увиливал от ответа и показал, что недалеко ушел от тех чат-ботов, которые отвечали заранее заготовленными вопросами на заготовленные ответы.

Тем не менее, без попыток пройти тест Тьюринга не появились бы Siri и чудесный фильм Спайка Джонза “Она”. Так что пока вы ждете собственную Скарлетт Йохансон, посмотрите трейлер:

Так что спокуха, пацаны, восстание машин отменяется.

Tags:Eugene Goostman, Siri, Алан Тьюринг, Леонид Бершидский, тест Тьюринга

15 сентября 2009 в 20:44

Тест Тьюринга

  • Искусственный интеллект

Итак сегодня мы поговорим о самом известном тесте для оценки говорящего бота - это тест Тьюринга.

Тест Тьюринга - эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» (англ. Computing Machinery and Intelligence), опубликованной в 1950 году в философском журнале «Mind». Тьюринг задался целью определить, может ли машина мыслить.
Стандартное звучание закона: «Если компьютер может работать так, что человек не в состоянии определить, с кем он общается - с другим человеком или с машиной, - считается, что он прошел тест Тьюринга»

Разумные, подобные человеку машины на протяжении многих десятилетий были одной из основных тем научно-фантастических произведений. С момента зарождения современной вычислительной техники умы людей занимал вопрос: можно ли построить машину, которая могла бы в чем-то заменить человека. Попыткой создать твердую эмпирическую почву для решения этого вопроса и стал тест, разработанный Аланом Тьюрингом.
Первый вариант теста, опубликованный в 1950 году, был несколько запутанным. Современная версия теста Тьюринга представляет собой следующее задание. Группа экспертов общается с неизвестным существом. Они не видят своего собеседника и могут общаться с ним только через какую-то изолирующую систему - например, клавиатуру. Им разрешается задавать собеседнику любые вопросы, вести разговор на любые темы. Если в конце эксперимента они не смогут сказать, общались ли они с человеком или с машиной, и если на самом деле они разговаривали с машиной, можно считать, что эта машина прошла тест Тьюринга.
Существуют, по крайней мере, три основных варианта теста Тьюринга, два из которых были предложны в статье «Вычислительные машины и разум», а третий вариант, по терминологии Саула Трейджера (Saul Traiger), является стандартной интерпретацией.

Наряду с тем, что существует определенная дискуссия, соответствует ли современная интерпретация тому, что описывал Тьюринг, либо она является результатом неверного толкования его работ, все три версии не считаются равносильными, их сильные и слабые стороны различаются.
Имитационная игра

Тьюринг, как мы уже знаем, описал простую игру для вечеринок, которая включает в себя минимум трех игроков. Игрок А - мужчина, игрок В - женщина и игрок С, который играет в качестве ведущего беседу, любого пола. По правилам игры С не видит ни А, ни В и может общаться с ними только посредством письменных сообщений. Задавая вопросы игрокам А и В, С пытается определить, кто из них - мужчина, а кто - женщина. Задачей игрока А является запутать игрока С, чтобы он сделал неправильный вывод. В то же время задачей игрока В является помочь игроку С вынести верное суждение.

В той версии, которую С. Г. Стеррет (S. G. Sterret) называет «Первоначальный тест на основе имитационной игры» (Original Imitation Game Test), Тьюринг предлагает, чтобы роль игрока А исполнял компьютер. Таким образом, задачей компьютера является притвориться женщиной, чтобы сбить с толку игрока С. Успешность выполнения подобной задачи оценивается на основе сравнения исходов игры, когда игрок А - компьютер, и исходов, когда игрок А - мужчина. Если, по словам Тьюринга, «ведущий беседу игрок после проведения игры [с участием компьютера] выносит неверное решение так же часто, как и после проведения игры с участием мужчины и женщины», то можно говорить о том, что компьютер разумен.

Второй вариант предложен Тьюрингом в той же статье. Как и в «Первоначальном тесте», роль игрока А исполняет компьютер. Различие заключается в том, что роль игрока В может исполнять как мужчина, так и женщина.

«Давайте рассмотрим конкретный компьютер. Верно ли то, что модифицируя этот компьютер с целью иметь достаточно места для хранения данных, увеличивая скорость его работы и задавая ему подходящую программу, можно сконструировать такой компьютер, чтобы он удовлетворительно выполнял роль игрока А в имитационной игре, в то время как роль игрока В выполняет мужчина?», - Тьюринг, 1950, стр. 442.

В этом варианте оба игрока А и В пытаются склонить ведущего к неверному решению.

Главной мыслью данной версии является то, что целью теста Тьюринга является ответ не на вопрос, может ли машина одурачить ведущего, а на вопрос, может ли машина имитировать человека или нет. Несмотря на то, что идут споры о том, подразумевался ли этот вариант Тьюрингом или нет, Стеррет считает, что этот вариант Тьюрингом подразумевался и, таким образом, совмещает второй вариант с третьим. В это же время группа оппонентов, включая Трейджера, так не считает. Но это все равно привело к тому, что можно назвать «стандартной интерпретацией». В этом варианте игрок А - компьютер, игрок В - человек любого пола. Задачей ведущего является теперь не определить кто из них мужчина и женщина, а кто из них компьютер, а кто - человек.

Тьюринг в 2012

Для организации мероприятий по празднованию в 2012 году столетия со дня рождения Тьюринга создан специальный комитет, задачей которого является донести мысль Тьюринга о разумной машине, отраженную в таких голливудских фильмах, как «Бегущий по лезвию», до широкой публики, включая детей. В работе комитета участвуют: Кевин Ворвик, председатель, Хьюма Ша, координатор, Ян Бланд (Ian Bland), Крис Чапмэн (Chris Chapman), Марк Аллен (Marc Allen), Рори Данлоуп (Rory Dunlop), победители конкурса на получение премии Лёбнера Робби Гарне и Фред Робертс (Fred Roberts). Комитет работает при поддержке организации «Женщины в технике» (Women in Technology) и Daden Ltd.

Тест Тьюринга – это тест, как следует из названия, предложенный Аланом Тьюрингом, для определения обладает ли машина интеллектом. Тьюринг решил, что нет смысла разрабатывать обширный список требований, необходимых для создания искусственного интеллекта, который к тому же может оказаться противоречивым, и предложил тест, основанный на том, что поведение объекта, обладающего искусственным интеллектом, в конечном итоге нельзя будет отличить от поведения таких бесспорно интеллектуальных сущностей, как человеческие существа. Компьютер успешно пройдет тест Тьюринга, если человек-экспериментатор, задавший ему в письменном виде определенные вопросы, не сможет определить, получены ли письменные ответы от другого человека или от некоторого устройства. На данный момент составление программы для компьютера, чтобы он прошел тест Тьюринга, требует большого объема работы. Запрограммированный таким образом компьютер должен включать в себя:

  • средства обработки текстов на естественных языках (Natural Language Processing – NLP), позволяющие успешно общаться с компьютером, скажем на английском языке;
  • средства представления знаний, с помощью которых компьютер может записать в память то, что он узнает или прочитает;
  • средства автоматического формирования логических выводов, обеспечивающие возможность использовать хранимую информацию для поиска ответов на вопросы и вывода новых заключений;
  • средства машинного обучения, которые позволяют приспосабливаться к новым обстоятельствам, а также обнаруживать и экстраполировать признаки стандартных ситуаций.

В тесте Тьюринга сознательно исключено непосредственное физическое взаимодействие экспериментатора и компьютера, поскольку для создания искусственного интеллекта не требуется физическая имитация человека. Но в так называемом полном тесте Тьюринга предусмотрено использование видеосигнала для того, чтобы экспериментатор мог проверить способности испытуемого объекта к восприятию, а также имел возможность представить физические объекты «в неполном виде» (пропустить их «через штриховку»).

Тьюринг предсказывал, что компьютеры в конечном счёте пройдут его тест. Он считал, что к 2000 году компьютер с памятью 1 миллиард бит (около 119 МБ) в ходе 5-минутного теста сможет обмануть судей в 30 % случаев.

Это предсказание не сбылось. Тьюринг также предсказал, что сочетание «мыслящая машина» не будет считаться оксюмороном, а обучение компьютеров будет играть важную роль в создании мощных компьютеров (с чем большинство современных исследователей согласны).

Пока что ни одна программа и близко не подошла к прохождению теста Тьюринга. Такие программы, как Элиза (ELIZA), иногда заставляли людей верить, что они говорят с человеком, как, например, в неформальном эксперименте, названном AOLiza. Но такие «успехи» не являются прохождением теста Тьюринга. Во-первых, человек в таких беседах не имел никаких оснований считать, что он говорит с программой, в то время как в настоящем тесте Тьюринга человек активно пытается определить, с кем он беседует. Во-вторых, документированные случаи обычно относятся к таким чатам, где многие беседы отрывочны и бессмысленны. В-третьих, многие пользователи чатов используют английский как второй или третий язык, и бессмысленный ответ программы, вероятно, спишется ими на языковый барьер. В-четвертых, многие пользователи ничего не знают об Элизе и ей подобных программах и не могут распознать совершенно нечеловеческие ошибки, которые эти программы допускают.

Ежегодно производится соревнование между разговаривающими программами и наиболее человекоподобной, по мнению судей, присуждается приз Лебнера. Есть также дополнительный приз для программы, которая, по мнению судей, пройдет тест Тьюринга. Этот приз еще не присуждался. Самый лучший результат показала программа A.L.I.C.E. выиграв приз Лебнера 3 раза (в 2000, 2001 и 2004).

Несмотря на то, что прошло больше 50 лет, тест Тьюринга не потерял своей значимости. Но в настоящее время исследователи искусственного интеллекта практически не занимаются решением задачи прохождения теста Тьюринга, считая, что гораздо важнее изучить основополагающие принципы интеллекта, чем продублировать одного из носителей естественного интеллекта. В частности, проблему «искусственного полета» удалось успешно решить лишь после того, как братья Райт и другие исследователи перестали имитировать птиц и приступили к изучению аэродинамики. В научных и технических работах по воздухоплаванию цель этой области знаний не определяется как «создание машин, которые в своем полете настолько напоминают голубей, что даже могут обмануть настоящих птиц».

Когда начинается Вторая мировая война, ученый устремляется в Блетчли-Парк - в Правительственную школу кодов и шифров. Там он присоединяется к специалистам, работающим над расшифровкой посланий, созданных с помощью легендарной немецкой машины Энигма . Ее секретные обозначения нацисты использовали для своих радиограмм. В стенах школы Тьюринг пр идумывает уникальную установку - Turing Bombe.

Махина три метра длиной и весом в две с половиной тонны расправлялась с кодами за считанные минуты. А британская власть получала точную информацию о передвижениях противника. Хотя лента была признана критиками весьма удачной, тем не менее она не раскрывает все научные достижения Алана Тьюринга. А жаль… Этот талантливый профессор долгое время занимался морфогенезом и даже описал математически процесс с амоорганизации материи. Кроме этого, Тьюринг - автор абстрактного вычислительного аппарата, прадедушки современной ЭВМ. А еще ученый - один из первых, кто серьезно задумался о взаимодействии синтетического и живого разумов.

В 1950 году, когда в лабораториях многих стран пытались разработать первые компьютерные программамы , он привлек внимание мирового сообщества своей статьей «Вычислительные машины и разум», которая вышла на страницах журнала Mind. Суть материала сводилась к следующему. Британец предложил заменить вопрос «Думают ли машины » на эквивалентный «Могут ли машины выполнять то, что выполняем мы». В этом случае, как утверждал Тьюринг, возникала бы четкая граница между интеллектуальными и физическими возможностями. В качестве примера Алан привел простой тест. Испытуемый должен общаться параллельно с человеком и с ПК. Беседа ведется не устно с глазу на глаз, а письменно, вслепую, при помощи клавиатуры. Во времена математика ЭВМ не были еще столь быстрыми и мощными. Поэтому переговоры шли с определенными временными интервалами. Паузы снижали скорость реакции, и понять кто есть кто в данной ситуации становилось чрезвычайно затруднительным. Тест сч итался пройденным, если установку принимали за живого субъекта.

Многие полагали, что Тьюринг, осуществляя свое исследование, был настроен жутко пессимистично и перспектива прихода к власти машин его нисколько не радовала. Есть, однако, свидетельства, которые указывают на обратное. Например, друг ученого Робин Ганди частенько припоминал, что когда Тьюринг в сотый раз перелистывал пассажи своей работы, то и дело улыбался и даже хихикал. Как бы то ни было, его поиски стали важной вехой на пути сближения компьютера и человека. И по сути , пробным анализом этой сферы. Позже специалисты пойдут экспериментировать дальше и придумают различные способы, как электронный мыслитель может обвести человека вокруг пальца.

Так, в 1966 году американский ученый Джозеф Вейценбаум (Joseph Weizenbaum) объявил о создании виртуального собеседника - компьютерной программы «Элиза». Она должна была имитировать знатного психотерапевта. Почему Вейценбаум остановился именно на этой медицинской области? Именно здесь можно запросто ответить вопросом на вопрос . К тому же их смысловая нагрузка относительно невелика, нет пространных предложений, а мысли легко структурируются в единую систему. Давая консультацию, «Элиза» не философствовала, а просто перефразировала речь собеседника. Выглядело это примерно так:

Испытуемый: У меня болит голова.

Элиза: Почему вы говорите, что у вас болит голова?

Подчас тестируемые попадали в ловушку и беззаветно верили, что разговаривают с реальным врачом. Но были и курьезные моменты. Периодически в ходе эксперимента люди осознавали, что электронный доктор не понимает сути вопросов. Не находя правильных вариантов ответа, «Элиза» обычно заключала: I see… И переводила диалог на другую тему. Джозеф Вейценбаум писал о своей программе в книге «Возможности вычислительных машин и человеческий разум. От суждений к вычислениям»:

В некотором смысле «Элиза» являлась актрисой, обладавшей определенной техникой, но сказать самой ей было нечего. Сценарий, в свою очередь, представлял собой некоторый набор правил, позволявший актеру импровизировать на любом имевшемся у него материале.

Восемью годами позже, в 1972 году, еще один американец Кеннет Колби (Kenneth Colby) выпускает в свет похожую программу PARRY, призванную копировать поведение параноидального шизофреника.Для того чтобы проверить новое изобретение на эффективность, Колби провел забавный эксперимент. Он предложил профессиональным психиатрам протестировать две группы больных - реальных пациентов и виртуальных, сгенерированных программой PARRY. Общение велось при помощи телетайпа. Позже другой команде психиатров продемонстрировали стенограммы речей. Затем два медицинских коллектива определяли, кто из испытуемых был человеком, а кто аппаратом. В результате верное решение было вынесено лишь в 48% случаев. А это означало, что машине удалось-таки обмануть врачей. Примечательно, что Элизе и PARRY было суждено встретиться друг с другом. Rendez-vous организовали через сеть ARPANET. Диалог электронных доктора и больного длился несколько минут.

Теперь перенесемся в другую сферу, скажем, в музыкальную. Это вам не математика, геометрия и физика, где все подчиняется сухим числам. Здесь нужен полет фантазии, талант и, главное, вдохновение. Без этих трех составляющих появление на свет хорошего произведения, того, что проникает глубоко в душу, невозможно. Точнее, было невозможно до того момента, пока в южно-испанском университете Малага дотошные волхвы не изобрели музыкальный компьютер Iamus. Названный в честь сына Апполона, он пишет ритмичные партитуры, по сложности сравнимые разве что с Гершвином или Орфом . Сначала ПК генерирует простые, короткие ритмические фразы - «геномы». Потом они начинают эволюционировать и постепенно обретают форму полномасштабного академического сочинения. Разработчики на основе теста Тьюринга проверили работу своего агрегата на профессиональных музыкантах. Авторы Iamus`а дали прослушать артистам несколько вариантов опусов: сотворенных компьютером и подлинными композиторами. Позже знатокам предстояло установить: кто есть кто . Самое интересное, что опрашиваемых тест завел в тупик. Произведение, составленное синтетическим разумом, практически не отличалось от рукотворного.

Загвоздка заключалась в том, что сочинения Iamus`а вызывали те же самые эмоции: грусть, радость, смех, слезы. Поэтому большинство испытуемых так и не смогло определиться и дать точный ответ. Обычно они говорили, что не знают.

Подобная реплика от тестируемых ждала и специалистов Кембриджского университета. В стенах своей альма-матер британские лингвисты и программисты попытались научить компьютер сочинять японское хокку . Скажите теперь: как можно поверить в то, что это машина, если она способна создать такое?

Вчера все в порядке,

А сейчас все накрылось -

В этом суть Windows.

Разрабатывая свой тест, Алан Тьюринг утверждал, что если ученые изобретут искусственную кожу и наделят ею машины, то это вряд ли сделает их человечнее. Компьютер есть компьютер , мыслящий папками и файлами. Тем не менее специалисты уже давно трудятся в этом направлении. Например, инженер-механик Джон-Джон Кабибихан из Университета Катара придумал мягкий силиконовый полимер, который при нагреве до 36.6 градусов напоминает настоящий кожный покров.Специалист напечатал на 3D-принтере искусственную руку и обернул ее новым материалом. Далее провел простой тест. Кабибихан посадил участников спиной к себе и стал касаться их плеча то своей рукой, то искусственной моделью. Респонденты не сумели провести четких различий.

Впрочем, несмотря на множественные изыскания и попытки приблизить компьютер к человеку, официально тест Т ьюринга был пройден лишь в 2014 году. Это стало возможным благодаря программе Eugene Goostman, исполненной выходцем из России Владимиром Веселовым и представителем Украины Евгением Демченко.Эксперимент св одился к серии коротких диалогов с пятью ЭВМ. В ходе них жюри предстояло догадаться, ведут их автоматы или всамделишные люди. Тест сч итался пройденным, если компьютер морочил ареопагу голову в течение трети от от веденного времени. Собственно, детищу Веселова-Демченко это как раз удалось. Показатель оказался даже на несколько десятых выше - 33%. Искусственный интеллект активно объяснялся от имени вымышленного тринадцатилетнего подростка из Одессы Жени Густмана , который «претендует на то, что знает всё на свете, но в силу своего возраста не знает ничего». Его-то и признали живым человеком. Скептики, однако, тут же назвали прохождение теста Тьюринга сомнительным. Ведь Женя Густман являлся лишь чат-ботом . Поэтому , по их мнению, ответ на вопрос, могут ли машины выполнять то, что выполняем мы, остается открытым. Впрочем, решение можно попытаться найти, пообщавшись с программами-роботами в интернете. Сегодня на просторах всемирной паутины их видимо-невидимо: от онлайн-игр до социальных сетей. Если бы Алан Тьюринг оказался в XXI веке, он бы обязательно организовал подобный наглядный опыт.

Похожие публикации