|
Архитектор Хасан Рагаб о достоинствах и недостатках Midjourney
all images © Hassan Ragab
Генерация искусственным интеллектом (ИИ) изображений основана на текстовом описании пользователя и заданных им стилях. Хотите увидеть, что создал бы Гауди, если бы ему поручили спроектировать автозаправочную станцию? Просто введите ‘Gaudi gas station’ в одну из многочисленных нейросетей, и вы получите именно это. Теперь мы можем получить концептуальную архитектуру, просто с помощью ряда описательных слов. Хотя это может показаться волшебством, настоящий вызов заключается в том, чтобы добиться наилучшего результата через многочисленные итерации вариантов дизайна, продолжая вносить изменения в текстовые запросы, сохраняя при этом наилучшие варианты.
Нейросети, генерирующие изображения, уже вовсю сотрясают почву визуальных искусств, поднимая вопросы о художественной оригинальности, подлинности, собственности и цензуре. В мире архитектуры проблемы несколько иные. Пока не существует метода прямого внедрения генерирующих нейросетей (таких как Midjourney, DALL-E 2 и Stable Diffusion) в текущую архитектурную практику, кроме использования их в качестве средства быстрой концептуализации/эскизирования, помогающего воображению и фантазии архитекторов и дизайнеров.
Ниже мы расскажем о точке зрения на использование нейросетей в архитектуре Хасана Рагаба (Hassan Ragab) — египетского междисциплинарного дизайнера с архитектурным образованием. Хасан Рагаб живет в Южной Калифорнии, его опыт охватывает архитектурное проектирование, выставочный дизайн, промдизайн, дизайн мебели, текстильный дизайн и цифровое искусство. В настоящее время его работа больше связана с цифровым проектированием и исследованием визуальных отношений между архитектурой, художественным наследием и искусством с помощью средств искусственного интеллекта. В течение последних нескольких месяцев Хасан Рагаб размещает свои концептуальные архитектурные работы, созданные с помощью Midjourney, в социальных сетях, изучая нюансы совершенствования выходных данных ИИ, свободно смешивая архитектурные стили с инородными материалами: биологического происхождения (перья, растительные структуры и др.), дымом и пр.
Можно ли контролировать результаты творчества в Midjourney?
«Для меня искусство, создаваемое ИИ, заключается в том, чтобы продвигать свою идею, продвигать то, что ты хочешь сделать, а не придумывать что-то совершенно необычное, что выглядит круто, — объясняет Хасан Рагаб. — Мне очень интересно проектировать фасады и создавать странные или необычные формы, взаимодействующие с ними».
Создавая сотни и тысячи вариаций на одну тему, чувствует ли Рагаб, что контролирует творческий процесс ИИ? «Я не думаю, что кто-то сможет полностью контролировать результат работы этих нейросетей, — говорит он. — У вас есть только определенная степень контроля. Но опять же, в этом и заключается прелесть их применения! Вы не хотите использовать их для создания определенной вещи, вы не хотите, чтобы они создали то, что у вас в голове, вы хотите, чтобы они подтолкнули вашу идею, чтобы была другая перспектива, другой результат».
«Однако чем больше я работаю с Midjourney, тем больше я чувствую необходимость контроля, потому что когда вы очень неоднозначно определяете, чего вы хотите, у ИИ возникают предпочтения, и поэтому у многих людей [получаются] похожие результаты. Основная причина этого заключается в том, что запросы недостаточно конкретны. То, как я использую текстовые запросы, действительно важно. Речь идет о построении снизу вверх, используя простые термины. Это хороший способ держать идеи под контролем. Но главный элемент контроля — быть конкретным в определениях. Но, несмотря на контроль, в какой-то момент я могу получить очень, очень необычный результат, и это полностью изменит мое направление мысли!»
Рагаб рассказывает, что он использует одновременно несколько веток генерации изображений для совершенствования дизайна: «Иногда я иду параллельно по разным ветвям и, если мне нравится результат, я подстраиваю свои текстовые запросы на основе тех, которые мне понравились. Мне постоянно приходится импровизировать, генерируя запросы, и при этом стараться сохранять контроль. И независимо от того, насколько сильно я чувствую контроль, я всегда удивляюсь. Но, опять же, это действительно то, чего я хочу!»
Из объяснений Рагаба становится ясно, что параллельный итеративный подход проб и ошибок помогает. Чтобы получить изображения, представленные на этих страницах, Рагаб прошел, как правило, через 100 итераций изображений и экспериментов с определением нужных слов, прежде чем был доволен конечным результатом.
Важно также задавать окружение и атмосферу. Многие пользователи забывают, что кадрирование и контекст генерируемого изображения также можно контролировать. Рагаб поясняет это так: «Есть определенные элементы, которые я всегда определяю в запросе, например, угол изображения, крупный план или уменьшенное изображение. Если я хочу сделать реалистичную фотографию, например, один из способов — поместить здание в контекст с улицами, людьми и машинами».
В скором будущем нейросети будут генерировать 3D изображения
Рагаб полагает, что в самом ближайшем будущем нейросети научатся создавать 3D-геометрию, а не только изображения на плоскости: «Я знаю, что в какой-то момент эта технология станет движущей силой архитектуры, и это будет захватывающе интересно. Думаю, очень важно, чтобы все понимали эту технологию. В какой-то момент это затронет всех архитекторов и дизайнеров, поэтому сейчас самое время узнать, как работают нейросети, какие у них есть ограничения, какой в них заложен набор исходных данных. Сейчас идет подготовительный период к генерации ИИ 3D моделей. Я думаю, что все произойдет очень быстро и хаотично, и мы должны быть готовы к этому».
Нейросети — угроза творчеству или удобный инструмент?
«ИИ не является угрозой для художников, — считает Рагаб, — это скорее угроза мастерству художника — навыкам, которые приобретаются. На мой взгляд, искусство — это смесь мастерства и духа, и дух для художника важнее. ИИ как бы открывает доступ к искусству для многих людей, у которых нет художественных навыков. Теперь любой может создавать цифровое искусство. В этом и заключается реальная угроза. Если вы настоящий художник, то, на мой взгляд, вы найдете эффективный способ использовать инструменты нейросетей в своем рабочем процессе».
По словам Хасана Рагаба, Midjourney — это нечто большее, чем просто инструмент для набросков и рисования: помимо демократичности, которую подразумевают эти инструменты, в них заложены более глубокие возможности, воспринимаемые как расширение нашего понимания творчества, где все искусство связано через бесконечный процесс «параметрического копирования-вставки». Текстовые запросы, которые вы используете, ваши решения по выбору вариаций и ваши оценки — все это краеугольные камни того, как обучаются модели ИИ. Как следствие, эти решения передаются не только вам, но и всем, кто использует инструмент. Таким образом, мы все вместе создаем эти инструменты, принимая огромное участие в создании нашего коллективного воображения.
Составить собственное мнение о новом инструменте творчества — задача не из легких; тем более сложно быть в центре изучения инструмента, который сам находится в зачаточном состоянии и развивается беспрецедентными темпами.
Достоинства и недостатки Midjourney
Вот что пока нравится и не нравится Хасану Рагабу в Midjourney:
Плюсы
★ Художественная ценность: в отличие от Stable Diffusion и DALL-E 2, модели Midjourney, «за исключением недавнего теста V4», настроены так, чтобы отдать предпочтение «красивым и художественным» результатам, а не фотореализму. Он считает, что значимый способ работы с ИИ — это использовать истинную силу нейросетей в творческом процессе как продолжение вашего воображения, а не пытаться придумать реалистичный рендеринг, который можно сделать с помощью других программ. Не умаляя способности этих инструментов генерировать реалистичные визуализации за считанные минуты в качестве средства архитектурной презентации, он рассматривает последнее как низко висящий плод, а не как суть работы с такими инструментами.
★ Скорость, мобильность и доступность: вы набрасываете свои идеи на лету, быстрее, чем любой другой человек до этого. Все, что вам нужно, — это приложение Discord на вашем телефоне или ноутбуке, и вы готовы к работе — еще один ключевой элемент того, как нейросети усиливает творческий потенциал человека.
★ Умный разговор: Рагаб всегда представлял себе искусство и дизайн как разговор между творцом и средой — это не односторонний монолог, а красивый, медленный танец. Именно такой процесс демонстрирует ИИ, поскольку он обогащает художественные концепции такими способами, которые раньше невозможно было представить.
★ Сообщество: разработчики Midjourney организуют открытые встречи каждую неделю. На них они объясняют свои технологии, бизнес-модель и будущие цели, давая слово для высказываний мнений буквально всем пользователям, чтобы они могли спорить, обсуждать и вносить предложения. Кроме того, по всему миру развивается большое междисциплинарное сообщество пользователей Midjourney — дизайнеров, архитекторов, художников и даже непрофессионалов. Сообщество вовлекает всех своих членов в конструктивные всеохватывающие беседы и сотрудничество в социальных сетях. Стремление открыть для себя новую сферу творчества заставляет поверить — на фоне всего происходящего в мире — в то, что разные люди из разных культур могут держаться вместе, образуя сложную нематериальную сущность, где сумма более значима, чем ее части.
Минусы
☆ По словам Хасана Рагаба, работа с любой нейросетью, генерирующей изображение из текста, — это уникальный эксперимент для любого творческого человека, позволяющий реализовать множество идей за очень короткое время. Такое воздействие делает пользователей более требовательными к результатам, чем когда-либо прежде, что часто приводит к разочарованию после первоначальной эйфории у начинающего пользователя. Мы все еще учимся приспосабливаться к этому новому средству, и для полного восприятия нынешней реальности может потребоваться некоторое время.
☆ Поскольку нейросети являются демократичным инструментом (доступным для всех желающих), существует чрезвычайно большое количество великолепных идей, которые могут не только радовать, но и подавлять. Слишком много людей разрабатывают превосходные концепции за столь короткое время, что буквально с каждой минутой планка качества повышается. Хотя это создает, с одной стороны, атмосферу здоровой конкуренции, с другой, оказывает сильное давление на пользователей. Им кажется, что они должны быть в курсе всех событий каждого дня и реализовывать свои идеи так быстро, как только могут, пока кто-то другой не опередил их.
☆ Модели Midjourney учатся у нас и передают результаты обратно. Со временем это начало проявляться в появлении некоего «универсального/апокалиптического стиля». Это также связано с отсутствием возможностей тонкой настройки в Midjourney и ограничениями в подгонке моделей под свой стиль. Это важнейший недостаток. Несерьезное отношение к нему может поставить под угрозу разнообразие и индивидуализм, на которых и держится искусство.
☆ Отсутствие разнообразия в наборе исходных данных по незападным архитектурным авторам, стилям и достопримечательностям может привести к отсутствию культурного разнообразия. Это то, что больше всего не нравится Рагабу в работе с Midjourney. Как египтянин, он всегда находит архитектурное вдохновение в своей родной стране. Египет имеет одну из самых богатых архитектурных историй в мире, но ему трудно использовать египетские достопримечательности и города в значимом смысле. Бедные наборы данных нейросетей о конкретных местах, архитектурных и художественных стилях являются существенными ограничениями для многих творцов в Египте и во всем мире. Это ограничение может оттолкнуть некоторых пользователей от нейросетей в их существующем виде, чтобы изучить другие методы с обширным представлением в модельном наборе данных, как, например, работы Захи Хадид.
Хотя в текущих моделях Midjourney отсутствуют инструменты персонализации стиля, в настоящее время ведется работа по созданию целостной модели. Это видно из их последней модели V4, которая больше сосредоточена на создании фотореалистичных результатов «вероятно, с помощью макросэмплинга». Однако одна из проблем новой модели, по мнению Рагаба, заключается в том, что она удаляет большую часть «художественных вибраций» из изображения. Кроме того, недавно появившийся инструмент ремастеринга позволяет регенерировать изображения, созданные в V3, используя новые возможности V4. Хасан Рагаб отметил, что ему не нравится модель V4. Он считает, что модели будут развиваться на стыке между креативностью и фотореализмом. Стоит также отметить, что нейросети начали предлагать более интеллектуальные функции постобработки. Примером может служить новый инструмент Outpainting в DALL-E 2. У Рагаба была возможность опробовать Outpainting на изображениях, созданных Midjourney. Рагаб отметил, что был искренне впечатлен результатом.
Архитектурные формы возникают из облаков дыма
В стремлении раскрыть новый сюрреалистический визуальный словарь, Хасан Рагаб предложил новую серию сгенерированных с помощью Midjourney архитектурных объектов. Серия "A State of Decay" («Состояние распада») — концептуальный проект, представляющий сновидческие структуры в стиле модерн, которые являются отчасти реальностью, отчасти фантазией, изображая каменные и стеклянные элементы, появляющиеся из клубов дыма и распадающиеся в воздухе.
В серии «Состояние распада» Рагаб исследует новые методы поиска формы для архитектуры, используя дым как фантастический элемент здания. Работы моделируют интервенции мистической формы в фасады, переплетая вымышленные и реальные элементы, создавая сюрреалистические композиции. Исследуя способность исторического архитектурного языка трансформироваться в новые параметры, египетский дизайнер ставит вопросы архитектурной эстетики и жизненного цикла здания, интегрируя текучие дымовые формы в органические каменные орнаменты монументальных сооружений.
19 ноября 2022, 18:28
0 комментариев
|
Партнёры
|
Комментарии
Добавить комментарий