В любом современном электронном устройстве можно отыскать что-либо, подходящее под определение искусственного интеллекта. Все знают, что такое почтовый спам — антиспам-программы являются одними из первых интеллектуальных систем, нашедших массовое использование.

Такими же умными устройствами оснащён практически каждый современный автомобиль, не говоря уже о технике посложнее. Можете представить себе противостояние антиспам-фильтра и человека? Или попытку автомобильного компьютера захватить весь мир? Взятие человека в заложники устройствами умного дома?

Можно представить ситуацию, когда при помощи подобной техники создаются вполне реальные угрозы ля жизни и здоровья людей. Но есть одна существенная подробность: эти угрозы создают другие люди (передавая инструкции "умным вещам" — чтобы те выполняли определённые действия в определённых условиях).

Когда вы слышите рассуждения вида "искусственный интеллект может устранить людей, если решит, что они ему не нужны", задайте один-единственный вопрос: каким образом? Предложите последовательность реалистичных событий, происходящих по указке или под влиянием искусственного интеллекта, итогом которых стало бы исчезновение на Земле вида "человек разумный".

То, о чём речь (одна из любимых тем в разного рода фантастике) — т.н. сильный искусственный интеллект, сочетание искусственного сознания с универсальным искусственным интеллектом (способным решать произвольные задачи, которые может решать человек). И то, и другое пока что не более чем игры разума, пусть даже в данный конкретный момент на Земле есть около сотни организаций, которые целенаправленно работают над созданием сильного искусственного интеллекта.

Чтобы случился "бунт машин", машины должны осознать себя как личности (то, у чего нет сознания, бунтовать не может). И нет пока теоретических предпосылок для создания подобного. А чтобы гипотетическая "Шодан" смогла производить действия в реальном мире, ей потребуется как минимум то, чем эти изменения делать в физической реальности.

Хроника деградации

Прозвучали слова, что-де искусственный интеллект ухудшает, вызывает деградацию всего, до чего дотягивается. Ашманов упоминал ситуацию с переводом между естественными языками, о том, что-де машинный перевод убил индустрию, сделав человеческих переводчиков невостребованными (ну или в значительной мере отбив их хлеб), при этом ощутимо снизив качество собственно перевода.

Примерно такого же рода опасения — в связи с появлением реализаций больших языковых моделей калибра GPT-4 (современная версия ChatGPT). Дескать, создание искусственных текстов становится настолько простым и дешёвым занятием, что это неизбежно вытеснит живых литераторов (в широком смысле — речь и про технические и все прочие виды текстов тоже).

Созданные искусственным интеллектом медиа-файлы (картинки, видео, звуковые дорожки и т.п.) сейчас принято ругать на чём свет стоит, пусть даже знакомство с тем же CivitAI может дать повод для дискуссий.

Основной довод всех убеждённых противников массового использования всевозможных генеративных моделей в том, что человек-де отучается использовать собственный мозг, тренировать навыки и так далее; что автоматически созданный контент повсеместно вытеснит "ручную работу" и навяжет привычку к весьма посредственному качеству "искусственного творчества". Обобщая — впереди нас ждёт деградация человечества по всем мыслимым параметрам, и всё из-за общедоступности искусственного интеллекта.

Что тут можно сказать?

В истории людей неоднократно происходили ситуации, когда некое достижение науки и техники серьёзно понижало планку входа в ту или иную отрасль деятельности людей. Например, появление POV-Ray в 1991-м и Blender в 1994-м годах открыло возможность всем желающим заниматься достаточно реалистичной компьютерной графикой (просчитывать относительно сложные сцены для того же POV-Ray можно было на типовых компьютерах того времени — когда ни о каких графических ускорителях, доступных практически всем, и речи не шло.

Если посмотреть практически на любое творческое занятие, в нём обязательно происходило появление подобных достижений науки и техники, существенно снижающих порог входа.

Что же касается деградации знаний и умений, снижения качества контента и так далее — расписывать апокалипсис в этих отраслях пока ещё рановато. Во все времена люди сталкивались с новациями, которые так или иначе видоизменяли сам подход и суть многих занятий. И никогда вопрос не решался запретами новых технологий — вопрос решался тем, что люди как сообщество, как представители единого вида адаптировались к новой среде. Потом, возможности тех же "нейронок" можно направить и на противодействие любителям "поручить всё компьютеру".

Если говорить конкретно о литературе — то в настоящий момент массовая литература и так представляет из себя малосъедобную массу, разбавление её "машинными писателями" мало что изменит: штучные, выдающиеся произведения всё равно будут создаваться людьми. Так же, как все прочие новации в сфере искусственного интеллекта найдут своё место в нашей жизни — обогащая её возможностями, но не разрушая.

Спорный тезис? Да. Но дело луддитов проигрывало всегда — об этом стоило бы помнить их современным единомышленникам.

===== Перейти к комментариям

Творческая осень (2023-08-22)

Сим объявляется ~~воблинская~~ творческая осень.

Тема о нейронных сетях и всё прочее основательно запущены, плюс в крейсерский режим вошла работа над новым произведением ("За дровами").

Это означает, что, вероятнее всего,

я в обозримом будущем буду заходить сюда редко

но всё же буду обновлять блог "Орда" и, по возможности, новости из мира нейронных сетей

найти меня будет проще по электронной почте

а на прочее я обычно отвечаю, как Рабинович на вопрос о самочувствии

Будем здоровы!

===== Перейти к комментариям

На полпути во зной (2023-07-21)

Давненько я сюда не заглядывал.

Тем временем "Зной" вычитан и готовится к публикации. И мне предложили несколько вариантов изображения на лицевую сторону обложки.

Любопытно, сможете ли вы угадать, которую из этих Алис я выбрал? Ну и, если что, то и проголосовать за ваш вариант.

Что именно за нейросеть нарисовала это? На самом деле, я намекнул об этом в самом начале.

10.

11.

12.

13.

14.

15.

16.

Проголосовать можно здесь. Можно выбрать несколько вариантов сразу.

"Зной", работа над картинками (2023-06-17)

Строго говоря, нейросети к созданию иллюстраций я привлекаю уже больше года. Но с момента, когда появился "ручной" вариант SD, интерес ко всем этим Midjourney и прочему коммерческому ощутимо потерялся. Всё же бездна моделей (а также другая бездна), в сочетании с высокой производительностью двигателя (до 50000 картинок приемлемого разрешения в сутки) даёт о себе знать.

"Зной" — не первая моя книга, иллюстрации к которой, полностью или частично, создавал электронный художник. Но сейчас задача сложнее: с отрисовкой человеческих фигур у SD традиционно сложности. Вот с пейзажами — куда как проще. Итак, если вы уже видели лицевую иллюстрацию в "Зное", то сможете оценить варианты альтернативных Алис. Правда, для этого желательно прочесть хотя бы несколько первых глав (чтобы вы поняли, какой она человек).

Алиса Листьева

00292

00339

00358

00359

00527

00579

00930

00965

01090

01158

01215

01443

Если хотите, можете проголосовать, какая из Алис "правильнее".

Ну и пейзажи, характерные для Зноя (в книге — специфическая агрессивно распространяющаяся среда, в которой существует своя жизнь (для которой белковые формы жизни Земли являются пищей или субстратом для развития). Там всегда очень жарко (средняя дневная температура под 45 по Цельсию), очень сухой воздух, множество других интересных особенностей. Часть из них попытался изобразить электронный художник.

Пейзажи Зноя

00076

00246

00300

00332

00361

00441

00458

00624

00830

Что следующее для применения электронного художника? Вероятно, "Реплика".

Сразу отвечаю на возможные вопросы.

Нет, я пробовал "заказывать" пару — Романа и Алису, тоже где-нибудь на улице, в Зное или на привычной Земле. С этим всё сложно. Слишком велик процент брака, плюс женский пол намного лучше представлен в моделях.

Да, я пробовал разные модели. Если нужны координаты тех, что проверял, спросите в комментарии.

"Едем дальше".

5 минут утра (2023-05-25)

Пока работаю следующие сообщения по SD и остальному — два раза по пять минут утренней природы (аудио). Вчера и сегодня.

24 мая 2023 г.

Your browser does not support the audio tag.

25 мая 2023 г.

Your browser does not support the audio tag.

У меня есть ещё, но вначале разобраться бы, как множественные не-музыкальные ролики выложить так, чтобы и отсюда не потёрли, и слушать можно было бы без ~~SMS и регистрации~~ прокси или VPN.

Говорят, успокаивает. Проверьте.

Stable Diffusion, ч.2, Определение (2023-03-25)

Общие положения

Чтобы SD что-то увидел, нужно задать двигателю словесное описание, определение сцены (prompt). В ряде сервисов, таких как NightCafe, для этого есть специальный помощник — набирать определения щелчками мышки. Определения уже мелькали в предыдущих материалах о SD, и выглядят они как набор понятных двигателю основных элементов, знаков (tokens). При этом важно понимать, что любая пунктуация (запятая, точка и другие специальные последовательности) — тоже знаки.

Скажу сразу, что ни в каких пояснительных материалах нет чёткого указания, как именно ведут себя запятые и точки. Есть более или менее устоявшийся набор высказываний о том, как SD трактует знаки и их последовательности.

— то, что в начале определения, имеет большую значимость

— при прочих равных условиях, SD использует равный вес (степени значимости) для всех знаков, если только это не переопределяется (об этом ниже)

— запятая заставляет SD применять разделённые ей группы знаков отдельно

— точка заставляет SD трактовать последующие знаки независимо от предыдущих, и как-то применять все такие "предложения" одновременно

Не очень понятно? Согласен. Я спросил напрямую разработчиков; когда и если будет ответ, я приведу его. Нет ни малейшего желания изучать код SD и смотреть, как на самом деле интерпретируются знаки.

Знаки — в виде меток — вводятся в тренировочную базу SD в момент добавления каждого исходного изображения. Метки, на понятном человеку языке, описывают, что, собственно, на этой картинке. От того, о чём композиция, до того, как сделано изображение и кто автор (для последующей возможной стилизации под автора).

Синтаксис определения

В дальнейшем я предполагаю, что мы используем оригинальную версию SD, где языком описания является английский. Есть т.н. Alt-Diffusion, где можно использовать другие естественные языки, но о нём мы поговорим позже. Важно: опыты с SD подтверждают, что двигатель всё же понимает, в той или иной мере, определения из других естественных языков, но увлекаться вавилонской темой (смешением языков) тоже пока не будем.

Итак, в предположении, что запятая действует как указано выше, более или менее обычная структура определения такая:

тип носителя, основные объекты, уточнения и свойства объектов, техника и освещение, стиль

Ранее упоминался вес. Чтобы определённый знак или группа знаков повышала (или понижала) значимость для двигателя, применяются разные нотации. В той графической среде, что использую я, круглые скобки обозначают умножение веса на 1.1, а квадратные — деление веса на это же число. Скобки могут быть вложенными, т.е.

(very big)

повысит вес знаков "very big" до 1.1, а

((very big))

до 1.21 (1.1 * 1.1). Если требуется тонкая настройка, точный вес можно задать вещественным числом так

(знаки:число)

т.е., предыдущий пример равнозначен вот этому:

(very big:1.21)

Число больше единицы повысит вес, меньше — понизит. Отрицательное значение (-1) означает, что вот такого в картинке быть не должно (т.н. отрицательное или исключающее определение). Важно: любая модификация определения, даже добавление незначащих нулей в коэффициенты веса, приведёт к изменению картинки на выходе, так что проверяйте всегда экспериментально.

Список полезных знаков

Далее я последую структурной схеме, которую предлагает promptoMANIA, один из сервисов построения определений. В конце поста будет список литературы и материалов по теме публикации, там есть ссылки и на другие полезные ресурсы.

Предположим, мы хотим изобразить ландшафт (если уж тренироваться, то на чём-то повседневном). Предлагаются следующие типовые группы знаков для уточнения желаемой картинки. В группе отдельные варианты перечислены через запятую (осторожно, список длинный).

Носитель

Рисунок: illustration, sketch, drawing, doodle, children's drawing, dot art, line art, stipple, hand-drawn, illuminated manuscript, crosshatch, storybook illustration, graphic novel, visual novel, illustrated-booklet, assembly drawing, anatomical drawing, cartographic

Карандаш: pencil art, graphite, coloed pencil, charcoal art

Тушь и чернила: ink, ballpoint pen, gel pen, fountain pen, fountain pen art, calligraphy, marker art, dry-erase marker, wet-erase marker, whiteboard

Мелки: crayon, conte, chalk, pastel art, blackboard, chalkboard

Живопись: painting, canvas, still-life, fine art, color field painting, hard edge painting, scroll painting, paper-marbling, hydro-dipping, hydrodipped, easter egg, egg decorating, rock art, cave art, street art, mural, artwork, chinese painting, tibetan painting, airbrush, paint, acrylic paint, oil paint, watercolor, tempera paint, gouache paint, wet paint, dripping paint, splatter paint, spray paint, puffy paint, glass paint, coffee paint

Текст: text, typeface, font, says, letters, graphemes, written letters, words, lexemes, written words, caption

Печатная продукция: modern art, concept art, digital art, logo, stamp, postage stamp, business card, collage, photocollage, fotocollage, lithography, block printing, magazine, newspaper, newsprint, blueprint, comic book, booklet, poster, sticker, barcode, QR code, pokemon, pokemon card, pokémon, pokémon card

Оригами: origami, modular origami, rigid origami, sonobe, kirigami, moneygami, wet-folding

Мозаика: mosaic, micromosaic, glass mosaic, photographic mosaic, impressionist mosaic

Рамка: frame, framed, wooden frame, wooden framed

Декаль (наклейки или переводные картинки): wall decal

Плакат: banner

Уличный знак: signage

123456

Предыдущая глава

↓ Содержание ↓