Почему так сложно дать ИИ здравый смысл?

Почему так сложно дать ИИ здравый смысл?
Почему так сложно дать ИИ здравый смысл?

Нельзя сказать, появится ли машинное обучение здравому смыслу через пять лет или через 50.

Image
Image

Представьте, что вы пригласили друзей на обед и планируете заказать пиццу пепперони.

Вы помните, как Эми упомянула, что Сьюзи перестала есть мясо. Вы пытаетесь позвонить Сьюзи, но когда она не берет трубку, вы решаете перестраховаться и вместо этого просто заказываете пиццу «Маргарита».

Люди считают само собой разумеющимся способность справляться с подобными ситуациями на регулярной основе. На самом деле, совершая эти подвиги, люди полагаются не на одну, а на мощный набор универсальных способностей, известных как здравый смысл.

Как исследователь искусственного интеллекта, моя работа является частью широких усилий, направленных на то, чтобы дать компьютерам подобие здравого смысла. Это чрезвычайно сложная задача.

Быстро - определить здравый смысл

Несмотря на то, что здравый смысл является одновременно универсальным и важным для того, как люди понимают окружающий мир и учатся, он не поддается единому точному определению. Г. К. Честертон, английский философ и теолог, на рубеже 20-го века написал известное высказывание о том, что «здравый смысл - вещь дикая, дикая и неподвластная правилам». Современные определения сегодня согласны с тем, что, как минимум, это естественная, а не формально обученная человеческая способность, которая позволяет людям ориентироваться в повседневной жизни.

Здравый смысл необычайно широк и включает в себя не только социальные способности, такие как управление ожиданиями и рассуждения об эмоциях других людей, но и наивное чувство физики, такое как знание того, что тяжелый камень нельзя безопасно положить на хлипкий пластиковый столик. Наивно, потому что люди знают такие вещи, несмотря на то, что сознательно не работают с физическими уравнениями.

Здравый смысл также включает базовые знания об абстрактных понятиях, таких как время, пространство и события. Эти знания позволяют людям планировать, оценивать и организовывать, не будучи слишком точными.

Здравый смысл трудно вычислить

Любопытно, что здравый смысл был важной проблемой на переднем крае ИИ с самых первых дней его существования в 1950-х годах. Несмотря на огромные достижения в области ИИ, особенно в играх и компьютерном зрении, машинный здравый смысл с богатством человеческого здравого смысла остается далекой возможностью. Возможно, именно поэтому усилия ИИ, предназначенные для решения сложных реальных проблем со многими взаимосвязанными частями, такими как диагностика и рекомендации по лечению пациентов с COVID-19, иногда терпят неудачу.

Современный ИИ предназначен для решения узкоспециализированных задач, в отличие от здравого смысла, который расплывчат и не может быть определен набором правил. Даже самые последние модели время от времени допускают абсурдные ошибки, предполагая, что в модели мира ИИ отсутствует что-то фундаментальное. Например, для следующего текста:

«Вы налили себе стакан клюквы, но потом по рассеянности влили в него около чайной ложки виноградного сока. Выглядит нормально. Вы пытаетесь понюхать его, но у вас сильная простуда, поэтому вы ничего не чувствуете. Вы очень хотите пить. Так что вы"

поставляется широко разрекламированный текстовый генератор с искусственным интеллектом GPT-3

выпей это. Теперь ты мертв».

Недавние амбициозные усилия показали, что машинный здравый смысл является первостепенной проблемой ИИ нашего времени, которая требует согласованного сотрудничества между учреждениями на протяжении многих лет. Ярким примером является четырехлетняя программа Machine Common Sense, запущенная в 2019 году Агентством перспективных исследовательских проектов Министерства обороны США для ускорения исследований в этой области после того, как агентство опубликовало документ с изложением проблемы и состояния исследований в этой области.

Программа Machine Common Sense финансирует многие текущие исследования в области машинного здравого смысла, в том числе нашу собственную программу Multi-modal Open World Grounded Learning and Inference (MOWGLI). MOWGLI - результат сотрудничества между нашей исследовательской группой из Университета Южной Калифорнии и исследователями ИИ из Массачусетского технологического института, Калифорнийского университета в Ирвине, Стэнфордского университета и Политехнического института Ренсселера. Проект направлен на создание компьютерной системы, способной ответить на широкий круг вопросов здравого смысла.

Трансформеры спешат на помощь?

Одной из причин для оптимизма по поводу того, что наконец-то удастся взломать здравый смысл машин, является недавняя разработка типа продвинутого ИИ для глубокого обучения, называемого трансформерами. Трансформеры способны эффективно моделировать естественный язык и, с некоторыми корректировками, способны отвечать на простые вопросы здравого смысла. Ответы на вопросы, основанные на здравом смысле, - важный первый шаг для создания чат-ботов, которые могут общаться как люди.

За последние пару лет было опубликовано большое количество исследований трансформаторов с прямым применением рассуждений здравого смысла. Этот быстрый прогресс сообщества заставил исследователей в этой области столкнуться с двумя взаимосвязанными вопросами на стыке науки и философии: что такое здравый смысл? И как мы можем быть уверены, что у ИИ есть здравый смысл или нет?

Чтобы ответить на первый вопрос, исследователи делят здравый смысл на разные категории, включая социологию здравого смысла, психологию и базовые знания. Авторы недавней книги утверждают, что исследователи могут пойти гораздо дальше, разделив эти категории на 48 мелких областей, таких как планирование, обнаружение угроз и эмоции.

Однако не всегда ясно, насколько четко можно разделить эти области. В нашей недавней статье эксперименты показали, что четкий ответ на первый вопрос может быть проблематичным. Даже опытные аннотаторы - люди, которые анализируют текст и классифицируют его компоненты - в нашей группе не пришли к единому мнению относительно того, какие аспекты здравого смысла применимы к конкретному предложению. Аннотаторы согласились относительно конкретных категорий, таких как время и пространство, но не согласились с более абстрактными понятиями.

Признание здравого смысла ИИ

Даже если вы признаете, что некоторое совпадение и двусмысленность в теориях здравого смысла неизбежны, могут ли исследователи когда-нибудь быть уверены, что ИИ обладает здравым смыслом? Мы часто задаем машинам вопросы, чтобы оценить их здравый смысл, но люди ориентируются в повседневной жизни гораздо более интересными способами. Люди используют ряд навыков, отточенных эволюцией, включая способность распознавать основные причины и следствия, творческое решение проблем, оценку, планирование и важные социальные навыки, такие как разговор и переговоры. Каким бы длинным и неполным ни был этот список, ИИ должен достичь не меньшего, прежде чем его создатели смогут объявить о победе в исследованиях машинного здравого смысла.

Уже становится до боли ясно, что даже исследования в области трансформаторов приносят убывающую отдачу. Трансформеры становятся больше и потребляют больше энергии. Недавний преобразователь, разработанный китайским гигантом поисковой системы Baidu, имеет несколько миллиардов параметров. Для эффективного обучения требуется огромное количество данных. Тем не менее, он до сих пор оказался не в состоянии уловить нюансы человеческого здравого смысла.

Даже пионеры глубокого обучения, похоже, считают, что могут потребоваться новые фундаментальные исследования, прежде чем современные нейронные сети смогут совершить такой скачок. В зависимости от того, насколько успешным будет это новое направление исследований, нельзя сказать, появится ли машинный здравый смысл через пять лет или через 50.

Маянк Кеджривал, доцент кафедры промышленной и системной инженерии Университета Южной Калифорнии

Эта статья переиздана из The Conversation под лицензией Creative Commons. Прочтите исходную статью.