Думали, ИИ никогда не сможет заменить человеческое воображение? Подумайте еще раз

Думали, ИИ никогда не сможет заменить человеческое воображение? Подумайте еще раз
Думали, ИИ никогда не сможет заменить человеческое воображение? Подумайте еще раз

Если ИИ может генерировать фотографии несуществующих людей, что еще они могут вообразить?

Image
Image

Ещё в 1980-х Ханс Моравек, ученый в области искусственного интеллекта, обнаружил парадокс: то, что легко для человека, например визуальное или слуховое понимание, сложно для машин.

С тех пор многое изменилось. Сегодняшние ИИ намного лучше понимают то, что видят. Дело не в том, что ИИ догнал все зрительные возможности человека, а в том, что технологии развиваются по-разному.

Когда мы думаем об искусственном интеллекте, мы думаем о чистой автоматизации. Это уже не так. Думали ли вы, например, что искусственный интеллект никогда не заменит фотографов-портретистов? Подумайте еще раз; ему даже не нужна модель. Сегодня у нас есть ИИ, которые могут «воображать», то есть, согласно определению Мерриама-Вебстера, формировать образ «чего-то, что не представлено чувствам или никогда прежде полностью не воспринималось в реальности».

В видео выше показаны результаты ИИ, который научился создавать фотографии людей, которых не существует. На качественном уровне лишь немногие художники способны изобретать лица с фотографической точностью.

Секрет воображения ИИ

Механизм, который наделяет ИИ творческими способностями, имеет название: генеративно-состязательные сети (GAN). GAN были частично вдохновлены исследованиями в области нейробиологии. По сути, GAN состоят из двух объектов, которые конкурируют друг с другом и учатся друг у друга: один учится генерировать подделки, а другой учится обнаруживать подделки. По мере того, как детектор подделок становится более эффективным, эффективнее становится и генератор подделок. Нейробиологи обнаружили, что мы используем родственный механизм, модель актера-критика, которая, как полагают, находится в центре нашего мозга.

Если воображение больше не является привилегией человеческого разума, как мы можем использовать воображение ИИ? Вот что сейчас происходит в лабораториях.

Превращаем ночь в день: да будут ГАНы

Воображение имеет прямое применение: угадывание представления предмета иным образом, или, другими словами, перевод образа из одного представления в другое. Например, этот ИИ представляет, как будет выглядеть набросок фотографии или как будет выглядеть цветная версия черно-белой фотографии.

Применение перевода изображений должно помочь нам увидеть мир более удобочитаемым или за пределами видимого.

Image
Image

Этот ИИ, тем временем, имитирует день из ночной картинки. Это ценно, так как для создания беспилотных автомобилей, которые работают и могут точно определять свое местоположение в любых условиях - день, ночь, туман, дождь, снег и т. д. - требуется много данных, охватывающих все сценарии. Собрать большие объемы данных во всех условиях практически очень сложно, так как определенные условия (например, снег) в некоторых районах случаются очень редко. Вместо того, чтобы собирать больше данных, ученые придумали этот ежедневный обходной путь. Это также может улучшить ночное зрение для военных, пилотов самолетов и водителей.

Рентгеновские характеристики: BodyNet может угадать форму вашего тела по фотографии
Рентгеновские характеристики: BodyNet может угадать форму вашего тела по фотографии

Когда что-то не видно напрямую, GAN используются для обоснованных предположений. Возьмем случай с ИИ BodyNet (см. выше), который оценивает форму тела человека по фотографии, на которой он полностью одет. Цифровой манекен полезен для создания индивидуальной одежды без ручного измерения или помощи сложных сканеров тела.

А что, если бы мы могли видеть сквозь стены? Этот ИИ может буквально помочь вам отслеживать, как люди передвигаются за стенами. Подобно тому, как летучие мыши видят в темноте, сигнал испускается, а то, что возвращается, интерпретируется. Летучие мыши излучают ультразвук, который отражается от поверхности близлежащих предметов. Здесь излучаются сигналы в диапазоне WiFi. Поскольку Wi-Fi может проходить сквозь стены, но частично отражается нашими человеческими телами, этот сигнал интерпретируется архитектурой глубокого обучения (см. видео ниже).

Машины Discovery

Возможность делать обоснованные предположения не ограничивается генерацией изображений или переводами. Воображение, в более широком смысле, является инструментом для открытий и имеет применение в различных областях, таких как кибербезопасность или разработка лекарств.

Современные инструменты кибербезопасности оснащены искусственным интеллектом, который может обнаруживать угрозы, анализируя их характеристики. Исследователи разработали GAN, которая учится генерировать фрагменты вредоносного кода, которые могут обходить эти детекторы кибербезопасности. Это может звучать пугающе, но хорошая новость заключается в том, что мы также можем использовать его для совершенствования детекторов вредоносного кода - или, если подумать, иногда обман может быть полезным, например, когда мы разрабатываем лекарства для борьбы с болезнями.

Что это значит для нас?

Четвертая промышленная революция связана не только с автоматизацией, но и с сотрудничеством человека и машины и симбиозом. GAN - это поворотный момент в развитии ИИ, который поможет нам повысить наши умственные способности.

Они также являются инструментом, с помощью которого мы можем изучать механизмы воображения и помочь нам лучше понять роль воображения в таких областях, как перевод или открытие. Несмотря на то, что воображение не равно творчеству, оно является одним из инструментов, которые мы используем для изобретения новых вещей. Какие недостающие детали, которые еще предстоит открыть, позволят нам создавать машины, способные перехитрить нас и в творческой сфере?

Перепечатано с разрешения Всемирного экономического форума. Прочтите исходную статью.