Нейрофотография как истинная правда

Станислав Львовский
5/20/2023
Нравится? Поддержите нас!
Будем рады вашим донатам на любую сумму
Станислав Львовский
поэт, историк, исследователь c PhD Оксфордского университета. Является автором книг, множества статей в гуманитарных изданиях и научных работ. Занимает позицию постдока в Университете Хельсинки. В Пражской медиашколе отвечает за переговоры с большими языковыми моделями (LLM), обучение AI-ассистентов и философию сознания. 

Бывает правда, — сказала старая леди, — и истинная правда.

Двойной портрет справа приобрел за последний месяц — или около того — значительную известность. Произошло это после того, как берлинский фотограф Борис Элдагсен (слева) выиграл с этой фотографией, которая носит название“Pseudomnesia: The Electrician” (Псевдомнезия: Электрик) приз Sony World Photography Award в открытой творческой номинации. От приза он сразу же отказался, пояснив, что “фотография” создана, на самом деле, при помощи модели text-to-image. ”Это конкурс фотографий, но AI — не фотография, поэтому я отказываюсь от премии”, — сказал Элдагсен. Вот это изображение побольше размером:

Boris Eldagsen. Pseudomnesia: The Electrician

Легко понять, как могло обмануться жюри: для людей, не слишком погруженных в мир генеративных визуальных артефактов, оно выглядит как умелая стилизация под чуть ли не любительский снимок, располагающийся на хронологической шкале где-то, я думаю, в конце 20-х —начале 30-х годов прошлого века. В разделе “Commons” сервиса Flickr, особенно в группах, где люди делятся найденными или купленными на барахолках, а потом отсканированными фотографиями, можно увидеть множество подобных снимков. Сделав пару шагов в сторону полупрофессиональных и любительских фотосайтов, можно обнаружить и достаточно современных стилизаций в этом роде. Я подобрал три изображения (все три авторские и действительно старые), для того, чтобы продемонстрировать, почему даже у профессионально насмотренных экспертов совсем не обязательно должны возникнуть сомнения относительно этого изображения, — давайте для простоты будем называть его нейрофотографией.

Joan Fontaine as Mrs. de Winter in Rebecca (1940)

Первое я подбирал так, чтобы оно было композиционно похоже на нейрофотографию Элдагсена. Следующее изображение демонстрирует, что совершенно аутентичные старые снимки могут не выглядеть как таковые:

Miss Laurie Divine in «Dance, Little Lady» revue. Mask by Oliver Messel, 1928

Наконец, третье изображение, тоже чем-то напоминающее нейрофотографию Элдагсена, демонстрирует значительную фантазию и еще более значительное техническое мастерство фотографов прошлого, убедительно манипулировавших аналоговыми изображениями:

Grete Stern, 1949

Теперь нам легче понять, как могло обмануться жюри, — вполне можно представить себе современного фотографа, держащего в уме какие-либо фотографии, похожие на эти, — и любительские снимки 20-х — 30-х, среди которых попадаются довольно удивительные, вот как эта фотография из архива фотосалона в Гааге:

Snelfotografie LION, Spuistraat 60a, Den Haag

История эта вызвала много шума, — чего ее герой, конечно же и добивался, — и чаще всего в дискуссиях о нейрофотографии, а также о том, что (применительно к видео) называют deep fakes, приходится слышать, как самые разные люди высказывают опасения относительно нашей способности отличать изображения “подлинной реальности” или даже “исторического прошлого” от изображений, не имеющих в виду ничего “реального”, т.е., предположительно существующего вне зависимости от наших представлений о нем. Как кто-то на днях заметил, “появление AI приведет к тому, что мы лишимся собственного прошлого, как мы его знаем”.

Мне кажется, что будучи высказаны в отношении фотографии, эти опасения игнорируют, во-первых, современное состояние отношений фотографии с реальностью, а во-вторых — то, как непросто эти отношения складывались на протяжении всего времени существования фотографической технологии. Давайте попробуем вспомнить, где пролегают основные линии напряженности этих отношений. Для этого, во-первых, нужно сказать, что фотография до сих пользуется в нашей культуре неоправданно большим кредитом доверия. Что это значит? Мы склонны воспринимать фотографию как документ, — т.е. как нечто, удостоверяющее то, что имело место в прошлом, — то ли несколько минут, а то ли сто лет назад. Мы не имеем к прошлому непосредственного доступа: это яснее всего выражается, видимо, открывающей фразой романа британского писателя Лесли Хартли “Посредник” (The Go-Between): “Прошлое — это другая страна” (Past is a foreign country). Мы получаем доступ к прошлому через документы разного рода, — но вот уже 150 лет как фотография находится здесь вне конкуренции: мы воспринимаем фотографию как заведомо более правдивый источник, чем воспоминания, дневники и даже стенограммы, — не говоря уже о рисунках, которые могут, на самом деле, быть очеьнь точны, — взять американский жанр зарисовок из зала суда, долгая жизнь которого объясняется законодательным запретом на съемку.

Быстрый технологический прогресс фотографии после ее появления в 1839 году позволил сравнительно быстро начать использовать ее как помощь в запоминании и как замену непосредственного наблюдения. Сфотографированные документы тоже стали быстро считаться практически эквивалентными оригиналам. Из фотографий мы получаем представления о том, какими мы сами были в прошлом, как жили другие люди, об отдаленных событиях или местах, которые мы посещали, но не удержали в памяти. Фотографии формируют наше понимание культуры, истории и людей, изображенных на них. Фотография воспринималась — и по умолчанию по сю пору воспринимается как инструмент точной и объективной документации. Но почему? Потому что она "непосредственно" связана с реальным миром: светочувствительная пленка записывает то, что находится перед объективом камеры: "Камера не врет", — гласит поговорка. Кажущееся отсутствие человека-медиума вызывает иллюзию того, что фотография представляет собой чистую "фиксацию" реальности. Ни линза объектива, ни химические процессы при проявке и печати ничего не домысливают.

Empty crib (1897) / Нейрофотография (2023)

Вместе с тем, довольно давно известно, что это последнее утверждение далеко от истины. Во-первых, фотографическим изображением можно манипулировать, — и возможность эта существует практически с момента появления самой технологии. Вот одна фотография и одна нейрофотография, на обеих изображены призраки, — и та из них, что была создана в 1897 году казалась современникам (не всем, конечно) очень убедительной. Следующий пример — совсем  хрестоматийный:

К. Ворошилов, В. Молотов, И Сталин, Н. Ежов / К. Ворошилов, В. Молотов, И Сталин

Как видим, для убедительной манипуляции изображением не было технических препятствий уже в 1930-х годах. Но прибегать к прямой манипуляции необязательно. Всякий советский школьник знал, что Ленин, прибыв в апреле 1917 года на Финляндский вокзал, выступал там перед собравшимися с броневика. Правильно? Нет. Не выступал. А известная фотография на которой запечатлено это событие, представляет собой кадр из фильма Сергея Эйзенштейна “Ленин в Октябре” 1937 года:

Кадр из фильма “Ленин в Октябре” 1937

На следующем, настоящем фото, Ленин выступает в Москве, на Театральной площади 5 мая 1920 года:

(1920)

Теперь давайте обратимся к чуть более тонким материям.

Насколько вообще можно говорить о том, что фотографическое изображение является подлинное представление реальности? Линза — линзой, химические процессы — химическими процессами, но точку съемки, время дня и года (свет), наконец, содержимое кадра выбирает фотограф. А это значит, что фотография, даже самая документальная, неизбежно несет на себе отпечаток его, фотографа, личности — со всеми предрассудками, идеологией, благими намерениями и так далее. Сюзан Зонтаг приводит в этой связи в пример известные фотографии, сделанные по заказу Департамента Администрации по Защите Фермерских хозяйств США во Время Великой Депрессии. Вот две из них: 

Dorothea Lange. Migrant mother
Walker Evans. A family on their porch

Теоретически, эти фотографии должны были бы представить государству (в лице Администрации по Защите Фермерских хозяйств) “реальную картину” жизни сельской Америки во время экономического кризиса. На самом же деле, как говорит Зонтаг, они несли на себе отпечаток идеологической программы их авторов, — и конечно, заказчика, платившего деньги фотографам. А рамках рузвельтовского “Нового курса” администрация выделяла средства на поддержку семей фермеров. “Реальность”, которую мы видим на этих фотографиях,  довольно сильно смещена: жизнь, разумеется, была тогда очень трудная, но фотографы сознательно и бессознательно отбирали наиболее тяжелые сюжеты. Как пишет Зонтаг, реальность становится для фотографии объектом и, одновременно, — предметом манипуляции.

Еще более сложная проблема фотографии состоит в том, что она нарушает языковый принцип, — об этом, в частности, Ролан Барт написал книгу Camera Lucida. В языке знак является связующим звеном между означаемым (апельсин) и означающим (слово “апельсин”) Фотография не разбивает реальность на более мелкие единицы (как это происходит в речи) и не воспроизводит языковой принцип обмена между означающим и означаемым. При этом она имеет знаковую природу: мы все знаем, что у фотографии есть буквальный смысл (денотативный) — и метафорический (коннотативный). Фотография Доротеи Ланж в буквальном смысле представляет собой портрет женщины с двумя детьми. В метафорическом смысле — это фотография о бедности, отчуждении, стыде и отчаянии: однако наша способность считать этот смысл определяется не фотографией, а кадрированием, культурным и визуальным контекстом. Но какую именно реальность отражает тогда эта фотография? Реальность “окружающего мира” или реальность визуальной культуры своего времени? Барт считал, что фотография — это  знак, лишенный означающего.

У фотографии непростые отношения с пространством: никакие фотографии места не передают ощущения, которое мы получаем, присутствуя в нем. Дело в том, что фотография дробит пространство, сводя его небольшие сегменты к двумерным представлениям, — и мы не умеем восстанавливать сколько-нибудь полную картину пространства из этих двумерных отпечатков. Пространство, представленное на фотографии всегда очень условно, — разительный контраст между фотоизображением и трехмерной средой знаком каждому, кто хоть раз надевал шлем виртуальной реальности.

К чему этот разговор о фотографии и реальности? Мое предположение состоит в том, что нейрофотография, — как мы с вами договорились называть результат создания большими языковыми моделями изображений по текстовым запросам, — вовсе не является радикальным отрицанием фотографии. Наоборот: в нейрофотографии фотография идет до конца, наконец последовательно разоблачая природу своих отношений с материальностью.  

Нейрофотография представляет собой значительный шаг к обнажению нищеты философии фотодокумента, — но вместе с тем, она предлагает нам новую возможность, в которой на месте стремления к правдивому отражению материальной реальности оказывается стремление к правдивому отражению социальной реальности. Последнюю ни в коем случае не следует путать с социальным конструктом: речь не о том, что никакой реальности, кроме социальной не существует, — это, разумеется, не так, — но о том, какую реальность “документирует” фотография, что это за инструмент. 

Интуитивно, благодаря кажущемуся отсутствию человека (писателя, художника с кистью или карандашом), мы вот уже полтораста лет думаем о фотографии, как о технологии фиксации реальности. Между тем, фотография и является искусством потому, что — и настолько, насколько, — она не является технологией фиксации, а представляет собой технику художественной рефлексии. Изображения, приносимые алгоритмом, который спускается за ними в темный подвал латентного пространства, — примерно как фотограф в darkroom, — будучи уже лишены, по Барту, означающего, окончательно отрываются в нейрофотографии и от означаемого, — если понимать под ним физическую реальность. Означаемым нейрофотографии является не материальный объект и не деятельность как таковая. Она проявляет образы, (потенциально) существующие в мире репрезентаций, на которых обучают модель. Там, где фотография может еще позволить себе делать вид, что она запечатлевает реальность материальности, нейрофотография практически прямым текстом говорит нам, что предметом ее “запечатлевания” (и интереса) являются культурные репрезентации, порожденные, в конечном итоге, нами самими,  людьми, человечеством.  

Вот несколько примеров для иллюстрации: 

BrandonMc. Awkward Family Photo (Midjourney)

Что изображено на этой нейрофотографии? Семья из конца 1980-х — 1990-х? Нет, так нельзя сказать. Но на ней безусловно запечатлено бытующее в культуре (в т.ч. визуальной) представление о “странноватой студийной семейной фотографии конца 80-х — начала 90-х”.

Zhang Haijun
Zhang Haijun. Rural wedding in China

Точно так же на двух нейрофотографиях выше запечатлены бытующие в культуре (в какой именно? точно не знаю) представления о повседневной жизни Китая в середине девяностых, менее чем через десять лет после начала действия” политики открытых дверей” Дэн Сяопина. 

На следующих двух нейроснимках мы видим запечатленными такие же образы модной фотографии конца сороковых:

Legendary. 1940s fashion

…и “популярной у пользователей фотосайтов стрит-фотографии 2010-х”:

Asyriana. Mesmerizing Street Photography

К счастью, дело не ограничивается такими простыми примерами: механизм текстовых запросов, сейчас соединенный еще и с возможностью “показать” алгоритму несколько совершенно разных изображений, открывает бесконечные возможности для комбинирования различных элементов, результаты какового можно видеть на примере двух серий нейрофотографий, изображающих фестиваль Burning Man в 1920-х годах…

…и в начале 1960-х:

Обратите внимание на то, что перед нами не просто соединение “реальности” из одного времени и имитации особенностей изображения из другой, —  но попытка перенести сложный социальный феномен - Burning man, в две разных эпохи, сохраняя при этом узнаваемость и социальных практик как таковых, и практик саморепрезентации (см. позы “нейро фотографирующихся”).

Ксения Климанова. Курс Нейросети для создания изображений, дипломная работа об идентичности.

Эти новые знаки, предлагаемые нам технологиями “text-to-image”, лишены, как и обычные фотографии по Барту, означающего. Но они не лишены означаемого. Означаемое это таково, что оно лишает нас возможности прятаться за “реальное” из страха увидеть свое отражение, свой собственный образ, —  видимо, более правдивый, чем предстающий перед нами из воображаемого глобального архива ещё тех фотографий. Ну, или хотя бы из архива всех селфи, сделанных вами за последние полтора,— а лучше два — года.

/imagine: [and welcome to the desert of the unreal]

онлайн
Мастерство Midjourney
Курс по практическому применению нейросетей в работе и творчестве
Узнать больше
Подпишитесь на наш канал в Telegram!
И узнавайте первыми о новых курсах и стипендиях

Рекомендуемые курсы

Алексей Навальный во вселенной Рика и Морти: Евгений Никитин о работе над персонажами

Алексей Навальный во вселенной Рика и Морти: Евгений Никитин о работе над персонажами

1/4/2024

Как AI-революция изменила кодинг, и почему это хорошая новость для гуманитариев

Майя Гусева и Илья Сагайдак о том, как знание основ синтаксиса Python и умение общаться с ChatGPT навсегда изменят жизнь гуманитариев и прочих НЕпрограммистов.

25/3/2024

AI-Звук. Танцы с бубном

Композитор Миша Бредихин об актуальных AI инструментах для работы со звуком и о том, что нас ждет в будущем.

19/2/2024
Мастерство Midjourney
Midjourney — друг, враг или конкурент? Живой онлайн-курс для всех, кто готов прокачать свои изображения до нового уровня, с помощью актуальных инструментов и секретов нейросети Midjourney.
Узнать больше