Страница произведения
Войти
Зарегистрироваться
Страница произведения

Архив блога Obscurato nihil за 2023 год


Жанры:
Мемуары, Изобретательство
Опубликован:
01.04.2024 — 01.04.2024
Аннотация:
Obscurato nihil: современные технологии как инструмент писателя.
Предыдущая глава  
↓ Содержание ↓
↑ Свернуть ↑
  Следующая глава
 
 

Ниже список того, что мне довелось уже услышать или прочитать по поводу SD. Не очень информативно, возможно, но если благодаря этой секции я лишний раз НЕ прочту что-то такое — значит, уже не зря написано.

Слишком сложно! Жизни не хватит понять, что и как настраивать!

SD обычно занимаются именно те, кому интересно "залезть под капот", испачкаться, фигурально выражаясь, машинным маслом и посмотреть на вращение шестерёнок. Да, собрать компьютер, способный считать типовую картинку за доли секунды — это недёшево, а существующие сервисы, помимо ограничений на подбор параметров, ещё и ограничивают по ресурсам — там с экспериментами не особо развернёшься.

Но всегда есть возможность скооперироваться с кем-то. Нужно ещё учесть, что собственная (локальная) установка — это ещё и полная свобода действий в смысле выбора всех интересующих компонент.

Но если вам это всё кисло, а лучше всего было бы поле ввода описания картинки и большая кнопка "Сделай классно", то вам — во что-нибудь вроде Midjourney.

Ваш хвалёный SD никогда не сможет нарисовать картинку вроде такой (пример картинки)

А откуда вы знаете?

Говоря о конфигурации, с которой я работаю, можно сделать очень условную оценку нижней границы количества изображений, которые SD в состоянии выдать для данной конкретной модели (тренировочной базы) и текстового описания. Это величина порядка 2100 (два в степени сто, число с тридцать одной значащей десятичной цифрой).

Чтобы осознать масштаб: если мы заставим восемь миллиардов человек без устали просматривать этот объём картинок (без сна и отдыха) и дадим ровно одну секунду на просмотр каждой, потребуется несколько триллионов лет, чтобы завершить эту задачу. Это на пару порядков больше оцениваемого срока существования Солнечной системы, как мы её сейчас видим (и Земли в том числе).

SD позволяет использовать не только разные модели (которые есть в изобилии на CivitAI и Huggingface), но и относительно мелкие дополнения (embeddings, hypernetworks, Loras и т.д.) — с их помощью становится возможным адаптировать вывод SD к заданной конечной цели.

Сотни моделей и дополнений, описание практически неограниченной длины — число возможных изображений настолько велико, а временной масштаб для проверки их всех настолько велик, что срок существования наблюдаемой Вселенной может оказаться ничтожно малым по сравнению со временем, которое потребуется для просмотра всего, что может породить SD уже сейчас.

Ну и не забываем о бремени доказательства — если вы заявите, что во всей Вселенной нет и быть не может семигранной гайки, выточенной из алмаза, это не означает, что вашему оппоненту необходимо проверить всю Вселенную, чтобы опровергнуть ваше утверждение. Бремя доказательства всё равно останется на вас. Ну а в сочетании с невообразимым количеством возможных изображений сама идея перебора среди них становится бессмысленной: нет технической возможности ни опровергнуть такое утверждение ни подтвердить его.

SD не умеет рисовать людей с нормальными руками, ногами, ушами и т.д.

Отчасти верно.

Модель по умолчанию тренировалась на картинках, где именно человеческие фигуры представлены в низком разрешении и плохом качестве. Неудивительно, что стандартная модель в большинстве случаев рисует вместо людей жутких страховидлов.

Чтобы исправить ситуацию, энтузиасты создали (натренировали) модели вроде Art&Eros, HassanBlend, URPM (все доступны с Civitai), которые позволяют добиться значительно лучших результатов.

Ситуация далека от идеальной, но работа продолжается и над моделями, и над дополнительными дополнениями (модулями) для коррекции. Наконец, не забываем про негативное определение (иногда позволяет отсеять откровенный брак ещё до попадания его вам на глаза).

Но что-то же SD не умеет?

Многое.

Всё упирается в первую очередь в модель (тренировочную базу). SD не в состоянии сделать то, чего в той базе нет принципиально. Простыми словами, он не в состоянии нарисовать "что-нибудь на свой выбор" — в любом случае используется то, что внесено в модель и хоть как-то обозначено (для каждой картинки, сильно упрощая, при добавлении её в модель, указывается набор меток — тегов — обозначающих, что же именно на этой картинке (хотя часть объектов SD, по мере обучения, способен опознавать своими средствами).

Кроме того, есть надписи. Распознавание текста и средств его передачи не входит в модель. Когда SD создаёт изображения, где могут быть надписи — в лучшем случае ожидайте увидеть там бессмысленный набор букв и прочего; в худшем — невнятный геометрический узор. Это принципиальное ограничение подхода; как только при построении модели начнёт опознаваться и учитываться текст — простыми словами, когда дойдёт дело до гибридного двигателя, что-то вроде SD + ChatGPT — только тогда надписи будут хотя бы иногда осмысленными.

Все эти картинки от SD и прочих нейросетей очень просто отличить от настоящих фото или работ живых художников

Иногда да, иногда нет. Человеческие фигуры — особенно уши, конечности и пальцы — остаются сложным вопросом при использовании SD. В остальном — практика показывает, что при аккуратном подборе работ (чтобы очевидные слабые места SD не проявлялись), отличить работу SD от работы художника из плоти и крови перестаёт быть лёгкой задачей.

Если хотите, можно устраивать конкурсы — там и посмотрим, насколько легко вы сумеете опознать, что породило картинку — алгоритм и "железяка", или же мысль и воображение.

===== Перейти к комментариям

Весеннее настроение (2023-03-17)

Осень, увядание, всё такое. Сказали мне, что мрачноватенько. Весны бы побольше — возрождение, цветение, всё такое.

Что ж, хорошая идея. Сказано — сделано. Добавляю несколько изображений весеннего настроения. Без котов и зайцев — просто цветы. Сделано наобум, кроме последней картинки — хотел убедиться, что даже скульптуры Мельмота могут быть вполне весенними.

Весеннего настроения, оптимизма и радости вам!

00002

00003

00006

00009

00012

00021

00023

00025

00027

00038

00042

00043

00050

00055

00057

00067

Начиная со следующего поста, начну размещать заметки о собственном опыте работы с SD. До новых встреч!

===== Перейти к комментариям

Осенние мотивы, часть 2 (2023-03-16)

По поводу второй части "Осенних мотивов" я слегка недооценил оставшиеся работы. Итог: будет и третья часть. Но вначале, по просьбам читателей, будет "весенняя вставка", чисто для поднятия настроения.

Есть идея взять первоначально мрачное или унылое место (пустыня подойдёт?), и изобразить его цветущим. На этот раз — взять стиль кого-нибудь, чьи образцы приведены в "Осенних мотивах".

Что скажете? Или просто сделать весну, цветение, подснежники и розы, вот это всё?

Названий на этот раз не указываю. Они есть у меня в рабочих заметках, но здесь — только указания на стили.

И ещё раз напомню, что имя художника обозначает стиль, не авторство. По лицензии SD, допускается произвольное применение этих изображений (пока соблюдаются условия лицензии). Ни в какой мере упомянутые художники не являются авторами приведённых изображений, никак не связаны с их созданием; упоминание художников делается только в качестве уточнения способа создания графического материала.

(да, это занудство, указывать всякий раз такой пункт — но лучше занудство, чем претензии по вопросам авторского права)

Ян ван Гойен

Николай Маковский

Антонио Манзаньедо

Джон Мартин

Стефан Мартиньере

Брайан Мэшбёрн

Родни Мэтьюз

Эмиль Мельмот

Эдди Мендоза

Петер Морбахер

Жан-Батист Монг

Крис Мур

Томас Моран

Гюстав Моро

Ричард Мосс

Эдвин Томас Мостин

Дэвид Маулд

Тэд Насмит

До новых встреч!

===== Перейти к комментариям

Осенние мотивы, часть 1 (2023-03-15)

Вот и отобраны самые интересные (для моих целей) стили артистов прошлого и настоящего, которые теперь буду интенсивно использовать. Здесь — примерно половина образцов изображений, порождённых SD по определению "A place with lots of leaves on the ground and autumn colors, art by Artist Name" (уточняющие качество предикаты не указаны), на основе модели Cheese Daddy's Landscape mix v3.5.

Следующая часть образцов будет в следующем посте.

В данной коллекции есть два артиста, работы в стиле которых могут заставить содрогнуться человека с воображением: Гигер и Мелмот. Если о Гигере знают многие (если видели хотя бы одну работу из франшизы "Чужой"), то Мелмот (Emil Melmoth) — современный набирающий популярность мексиканский скульптор, с весьма экстравагантным, так сказать, стилем. Оговорюсь, что его жутковатые произведения не используют подлинные фрагменты человеческих тел.

И если вам кажется, что "Сестра и брат Осень", скажем так, жутковаты, а о Мелмоте вы слышите впервые, скажу так: вы ничего ещё не видели. Возможно, я сделаю отдельный пост по работам в его стиле. Очень уж напоминают антураж "Чужого", "Восставшего из ада" и "Фантазм" одновременно.

Названия композиций придуманы не совсем уж впопыхах; главное — помнить, что в данном случае имя художника обозначает стиль, не авторство. По лицензии SD, допускается произвольное применение этих изображений (пока соблюдаются условия лицензии). Ни в какой мере упомянутые художники не являются авторами приведённых изображений, никак не связаны с их созданием; упоминание художников делается только в качестве уточнения способа создания графического материала.

Андреас Ахенбах, "Старый порт"

Бастьен Лекуф-Деарм, "Стальной замок"

Боб Эгглтон, "Осеннее волшебство"

Каналетто, "Вечерний канал"

Каспар Дэвид Фридрих, "Путь в царство тьмы"

Дэниел Риджвей Найт, "Сонная долина"

Дэвид А. Харди, "Врата горного царства"

Эмиль Мелмот, "Сестра и брат Осень"

Евгений Лушпин, "Трактир"

Гюстав Доре, "Знамение на закате"

Ханс Руди Гигер, "Чужой: воспоминание"

Иван Айвазовский, "К родным берегам"

Джон Хау, "Тропа приключений"

Михаэль Кутше, "Конец пути"

Михал Лисовски, "Древний замок"

Пол Лер, "Другой мир"

Рафаэль Лакост, "Страж перевала"

Тайлер Эдлин, "Серые горы"

Йоанн Лоссел, "Цитадель"

===== Перейти к комментариям

Осенний зверь (2023-03-13)

Начнём с разоблачения. Итак, в предыдущем посте три картинки — это фотографии с Pixabay:

Beta: photos/woman-erotic-shower-bathroom-7647127

Zeta: photos/sunset-water-nature-reflections-3026016

Sigma: photos/topless-woman-fashion-sexual-model-7545351

Pixabay может не открываться из российских сетей; в списке выше даны части адреса, что нужно поставить после pixabay.com/ — пользуйтесь прокси, если что.

Остальные (Gamma, Theta, Iota, Kappa, Lambda, Omega) — "считанные", на базе модели Art & Eros (если нужны определения — спрашивайте).

Итого: треть настоящие, остальные нарисованные. Судя по итогам предположений зрителей на разных площадках, однозначно отличить считанное от реального не так-то просто.

Ну а пока что полюбуемся различными вариациями осеннего пейзажа. Определение у всех картинок ниже одно и то же, "A place with lots of leaves on the ground and autumn colors" (плюс указания на качество и размер), единственное различие — указание стиля того или иного художника. По мне, самая эффектная картинка — та, что ниже. "Осенний зверь". В качестве заголовка приведено имя художника, чей стиль применяет SD.

Ryohei Hase

Дальше — просто, без комментариев. Всего я перебрал больше сотни пейзажистов и тех, чьи стили влияют на манеру и содержание полученных пейзажей. Нет в списке старых знакомых Ивана Шишкина, Ивана Айвазовского и других — о них сделаю отдельную публикацию.

Пожалуй, самый впечатляющий после "Осеннего зверя" — пейзаж от Дэвида Харди. Ни много ни мало вид из ближнего космоса.

Bruce Pennington

David A. Hardy

Ed Binkley

Greg Rutkowski

John Howe

Martin Rak

Michal Karcz

Paul Gustav Fischer

Ted Nasmith

Thomas Moran

Tyler_Edlin

Указанные картинки (и ещё под 4+ тысячи других у меня на компьютере) созданы на базе модели Cheese Daddy's Landscapes mix. Если кому-то нужны точные определения — спрашивайте.

===== Перейти к комментариям

Одно или более (2023-03-12)

В данный момент, помимо заказов на синтезы картинок, я разбираюсь с многообразием внешних моделей для Stable Diffusion.

Одна из них позволяет просчитывать человеческие тела (одетые и не очень) с высокой достоверностью. А потому новый небольшой практикум на наблюдательность.

Ниже приведены восемь изображений (18+), причём как минимум одно из них взято из открытых источников на просторах Сети.

Укажите, какие (какое) из них взято снаружи, а какие — синтезированы электронным художником.

Beta

Gamma

Zeta

Theta

Iota

Kappa

Lambda

Sigma

Omega

В общем и целом я уже понял, что SD работает достаточно качественно, чтобы в целом ряде ситуаций картинку было сложно опознать как компьютерную графику.

Разумеется, из файлов картинок удалена служебная информация, позволяющая определить примерный источник.

===== Перейти к комментариям

И воображение (2023-03-08)

День весны уже прошёл, но кто нам мешает украсить эту страницу соответствующим изображением?

Картинки от электронного художника иногда очень годятся в качестве топлива для воображения. Вот "закажешь" что-нибудь, потерянное во времени, а тут на тебе — столько нового и неожиданного предложат посмотреть:

Затерянное во времени

Или же что-то цветущее в сухой бесплодной пустыне окажется вполне себе впечатляющим:

Цветущее в бесплодной земле

Или город в горе явится очень необычным ожившим сновидением:

Эриост

Как водится, для каждого определения синтезируется минимум по 200 картинок. Здесь отобраны только некоторые.

Чувствую, вскоре начну распечатывать подобные пейзажи и начинать украшать ими стены дома. Ну или хотя бы просматривать по несколько раз, прежде чем продолжить работать очередную книгу. Попробуйте — возможно, вам тоже понравится.

===== Перейти к комментариям

Слишком много указаний (2023-02-27)

Все компьютерные инструменты, позволяющие человеку создавать что-то новое (картинки, текста и так далее), можно поделить на две основные категории: строители и художники.

Строитель лишён фантазии (помимо рутинной её части, рабочей смекалки). Ему нужен план. Кто работал с такими инструментами как POV-Ray или Blender (и другими, десятки их), понимает, о чём речь. Там человек строит будущее сооружение — или визуально, или на неком языке описания — а инструмент затем завершает строительство.

Предыдущая глава  
↓ Содержание ↓
↑ Свернуть ↑
  Следующая глава



Иные расы и виды существ 11 списков
Ангелы (Произведений: 91)
Оборотни (Произведений: 181)
Орки, гоблины, гномы, назгулы, тролли (Произведений: 41)
Эльфы, эльфы-полукровки, дроу (Произведений: 230)
Привидения, призраки, полтергейсты, духи (Произведений: 74)
Боги, полубоги, божественные сущности (Произведений: 165)
Вампиры (Произведений: 241)
Демоны (Произведений: 265)
Драконы (Произведений: 164)
Особенная раса, вид (созданные автором) (Произведений: 122)
Редкие расы (но не авторские) (Произведений: 107)
Профессии, занятия, стили жизни 8 списков
Внутренний мир человека. Мысли и жизнь 4 списка
Миры фэнтези и фантастики: каноны, апокрифы, смешение жанров 7 списков
О взаимоотношениях 7 списков
Герои 13 списков
Земля 6 списков
Альтернативная история (Произведений: 213)
Аномальные зоны (Произведений: 73)
Городские истории (Произведений: 306)
Исторические фантазии (Произведений: 98)
Постапокалиптика (Произведений: 104)
Стилизации и этнические мотивы (Произведений: 130)
Попадалово 5 списков
Противостояние 9 списков
О чувствах 3 списка
Следующее поколение 4 списка
Детское фэнтези (Произведений: 39)
Для самых маленьких (Произведений: 34)
О животных (Произведений: 48)
Поучительные сказки, притчи (Произведений: 82)
Закрыть
Закрыть
Закрыть
↑ Вверх