↓ Содержание ↓
↑ Свернуть ↑
|
Уoлтер де ла Мар — Наполеон (2024-11-16)
Сложно сказать, почему выбрал именно это стихотворение. Я бы выразился так: в нём та эссенция автора, которая понемногу перелилась во все его работы.
Так же, как работы известного поэта, чей путь завершился на мосту Мирабо, "Наполеон" — короткое стихотворение, в одну строфу. Всё же оно при этом очень ёмкое.
Второй куплет — галлюцинация искина на эту же тему.
Текст песни
Walter de la Mare, "Napoleon" (1901 — 1918)
"WHAT is the world, O soldiers?
It is I:
I, this incessant snow,
This northern sky;
Soldiers, this solitude
Through which we go
Is I."
Варианты трека
Варианты трека
Walter de la Mare — Napoleon (V1)
Your browser does not support the audio tag.
Walter de la Mare — Napoleon (V2)
Your browser does not support the audio tag.
Walter de la Mare — Napoleon (V3)
Your browser does not support the audio tag.
Walter de la Mare — Napoleon (V4)
Your browser does not support the audio tag.
Walter de la Mare — Napoleon (V5)
Your browser does not support the audio tag.
Walter de la Mare — Napoleon (V6)
Your browser does not support the audio tag.
Walter de la Mare — Napoleon (V7)
Your browser does not support the audio tag.
===== Перейти к комментариям
Славное море — священный Байкал (2024-11-02)
Всё же посмотрим, что такое персоны в действии. С "Колоколами" всё глухо, простите за корявый каламбур, но есть другие песни, не отягощённые авторским и смежными правами в силу давности лет.
Я выбрал среди таких "Славное море", считающуюся теперь народной, по стихотворению 1848 года Дмитрия Павловича Давыдова, сибирского поэта.
Думаю, что песня не нуждается в представлении.
Текст песни
Славное море — священный Байкал,
Славный корабль — омулёвая бочка.
Эй, Баргузин, пошевеливай вал,
Молодцу плыть недалёчко.
Долго я тяжкие цепи влачил,
Долго скитался в горах Акатуя;
Старый товарищ бежать пособил -
Ожил я, волю почуя.
Шилка и Нерчинск не страшны теперь,
Горная стража меня не поймала,
В дебрях не тронул прожорливый зверь,
Пуля стрелка — миновала.
Шёл я и в ночь, и средь белого дня,
Вкруг городов озираяся зорко,
Хлебом кормили крестьянки меня,
Парни снабжали махоркой.
Славное море — священный Байкал,
Славный мой парус — кафтан дыроватый,
Эй, Баргузин, пошевеливай вал,
Слышатся грома раскаты.
Варианты трека
Исходный трек — эталон персоны, "Хромой король"
Your browser does not support the audio tag.
Варианты трека
Славное море — священный Байкал (01, Pop Rock)
Your browser does not support the audio tag.
Славное море — священный Байкал (02, Acoustic Ballad)
Your browser does not support the audio tag.
Славное море — священный Байкал (03, March)
Your browser does not support the audio tag.
Славное море — священный Байкал (04, A Cappella)
Your browser does not support the audio tag.
Славное море — священный Байкал (05, Folk Rock)
Your browser does not support the audio tag.
Славное море — священный Байкал (06, Folk Pop)
Your browser does not support the audio tag.
Славное море — священный Байкал (07, String Orchestra)
Your browser does not support the audio tag.
Славное море — священный Байкал (08, Punk)
Your browser does not support the audio tag.
Славное море — священный Байкал (09, Cafe Rock)
Your browser does not support the audio tag.
Славное море — священный Байкал (10, Drum Voices)
Your browser does not support the audio tag.
Славное море — священный Байкал (11, Chant)
Your browser does not support the audio tag.
Славное море — священный Байкал (12, Chant Aria)
Your browser does not support the audio tag.
===== Перейти к комментариям
Бьют часы на старой башне (2024-11-01)
Первые опыты с т.н. персонами оказались, на самом деле, впечатляющими. Я многократно высказывал мысль, что отсутствие "личности" — шаблона темра и манер исполнения — это то, что ощутимо мешает в генерировании треков: шут его знает, какой голос искин выберет в следующий раз.
А теперь, едва только найден устраивающий тембр и манера, можно создать на базе их т.н. "персону" (persona) и петь далее от его/её/их имени.
Первый опыт ниже. Персона сгенерирована с "исполнителя" песни "Хромой король". Этакий оперный голос. На его основе порождено пять треков на текст песни "Колокола".
Прежде чем слушать сгенерированное, очень советую послушать то, о чём речь. Наверняка многие из вас знают эту песню, из "Приключений Электроника". Два варианта: на YouTube, на RuTube. Первый — из фильма, второй уже студийный.
Колокола — текст песни
Автор слов: Юрий Энтин
Бьют часы на старой башне,
Провожая день вчерашний,
И звонят колокола...
Провожая день вчерашний,
Бьют часы на старой башне,
Будет, будет даль светла!
Припев:
Бой часов, как ключик золотой,
Двери утра весело открой!
Окна утра настежь распахни!
Сумрак ночи с улиц прогони!
Бьют часы на старой башне.
То, что ночью было страшным,
Светом залито дневным.
То, что ночью было страшным,
Стало теплым и домашним,
Стало милым и смешным.
Припев.
Бьют часы на старой башне.
В этом мире должен каждый
Не спешить, не отставать.
В этом мире должен каждый
Слушать время и отважно
В ногу с временем шагать!
Припев:
Бой часов, как ключик золотой,
Двери утра весело открой!
Окна утра настежь распахни!
Сумрак ночи с улиц прогони!
Окна утра настежь распахни!
Сумрак ночи с улиц прогони!
Бьют часы на старой башне,
Провожая день вчерашний,
И звонят колокола.
Подробнее
Исходный трек — эталон персоны, "Хромой король"
Your browser does not support the audio tag.
Почти уже опубликовал, когда понял, что для этого требуется разрешение автора слов песни. Я отправил запрос представителю Юрия Энтина; если разрешат на приемлемых условиях, выложу сюда; до того момента (и если нет) просьба обращаться ко мне приватно.
Ну а я тем временем "исполню" этим же оперным голосом что-нибудь такое, где уже не требуется разрешения автора или его наследников.
===== Перейти к комментариям
Грибы (2024-10-31)
Алиса. Которая из Страны Чудес.
Ну и грибы. Много грибов.
Ну и далее — мысли самой Алисы.
Иллюстрация к "Грибам"
Грибы — текст песни
1. Mushrooms that I’m tasting seem to twist me
into baseless shapes,
Suddenly I'm shrinking, then I'm stretching
out in endless tapes.
Biting one is danger, and the other
just a stranger’s trick,
All this nibbling, dabbling, turns my world
around in colors thick.
2. Tall as trees I’m towering, then I’m small
enough to flee the ants,
Growing like a giant, now my toes outgrow
my shoes and pants.
With each bite, I’m guessing if I’ll stretch or
shrink or spin around,
Mushrooms that I’m munching make me
wonder where my feet are bound.
3. What’s the size I’m seeking when my mind
is slowly leaking sense?
Every nibble leaving me with questions wide
and doubts immense.
All the things I’m tasting lead me farther down
this path of dreams,
Mushrooms’ magic swirling ‘round in wild
and whirling schemes.
4. Left and right I’m finding every mushroom
has a trick to pull,
One will make me vanish, while the other
leaves me overfull.
Curious and cautious, yet I’m tempted by
each brand new bite,
In this world of wonder where I wander
through each height and flight.
Will I be the same nice Alice when I find my way back home?
Or a stranger, ever-changing, lost in dreams where wild things roam?
Грибы (песня)
Грибы — Shrooms
Your browser does not support the audio tag.
===== Перейти к комментариям
Модификации (2024-10-29)
Разговор в комментариях зашёл вчера об эмбиенте ("обволакивающая", "плещущаяся" музыка), так что я поставил несколько опытов.
Suno крайне редко удаётся сгенерировать эмбиент — неизбежно туда вкладываются иные, ритмичные стили, как ни старайся. С другой стороны есть сервис Soundful, порождающий "очень машинные", как они сами признаются, MIDI-композиции.
Попытался скрестить: эмбиент от Soundful был вначале продлён Suno (т.е., "допиши, как этот трек мог бы звучать дальше"), отдельно — исходный трек от Soundful был преобразован в каверы.
Времени на очень глубокие и многокомпонентные тесты не было, в качестве стилей для продления и порождения каверов брались два метажанра: "electronic" и "musique concrete". С первым читателям, вероятно, всё более или менее понятно; второй, "конкретная музыка", включает в композицию звуки окружающего мира (чем отчасти похож на эмбиент).
Итоги ниже. В "продлениях" работа от Suno начинается между 1:50 и 1:59, до того момента звучит оригинальный трек (две его минуты: Suno ограничивает длину внешнего трека, с которым потом можно работать).
Итоги экспериментов
Исходный трек, "Focus Rho"
Your browser does not support the audio tag.
Продления
Продление 1: электронка
Your browser does not support the audio tag.
Продление 2: электронка
Your browser does not support the audio tag.
Продление 3: конкретная музыка
Your browser does not support the audio tag.
Каверы
Кавер 1: электронка
Your browser does not support the audio tag.
Кавер 2: конкретная музыка
Your browser does not support the audio tag.
Кавер 3: конкретная музыка
Your browser does not support the audio tag.
===== Перейти к комментариям
Мотивирующая песня #2 (2024-10-28)
Конечно же, это шутка. Сегодня в одном из чатов возник вопрос, можно ли минут за 10 соорудить убедительное агитационное средство для побуждения строптивых авторов к ежедневному обязательному творческому труду. Свой вклад мне удалось внести примерно за семь минут (сюда входит синтез музыкального трека, включая одно продление и один кавер, а также графическое оформление).
Сильно не ругаться, особого выбора среди вариантов не было — то есть, некогда было его выбирать.
Иллюстрация
Мотивирующая песня #2
Мотивирующая песня #2
Your browser does not support the audio tag.
===== Перейти к комментариям
Просто звук — SA (2024-10-27)
Время от времени меня спрашивают: я часто упоминаю другой продукт от Stability.AI, а именно Stable Audio, но ничего им не демонстрирую.
Исправляюсь. Существующий вариант Stable Audio (SA), доступный всем желающим — это т.н. Stable Audio Open v1, на котором любой желающий может сгенерировать звуковую дорожку до 47 секунд длиной.
Так вот. SA хорош для дорожек-образцов (скажем, ритмический рисунок, который потом можно "скормить" другим генераторам, таким как Suno) и в целом для любых звуковых фрагментов, вовсе не музыкальных.
В качестве примера: я взял 10 образцов-описаний, по 30 секунд каждый, склеил их в единый пятиминутный трек.
Я намеренно не делал перебор, использовал первый же вариант (хотя, как и в случае других диффузных моделей, там всегда можно повыбирать: при средней скорости генерации 1:1 это не так уж накладно. Т.е. одна секунда будущего трека просчитывается примерно 1 секунду в реальном времени.
Так что вот. Звуки дождя, вой призраков, звуки улицы и всё такое — это то, где и нужен SA, в качестве генератора произвольного звукового оформления. Делать им именно музыку крайне сложно, а делать её долгой (длиннее 47 секунд) — фактически невозможно.
Версия 2 SA, намного более способная и интересная, доступна только по коммерческой схеме, выдавать её всем желающим в открытый доступ явно не планируется.
Что не означает конечно, что годную модель из серии "звуковой файл по текстовому описанию" нельзя найти. Их полно, просто это — вопрос наличия оборудования под рукой, чтобы просчитывать качественные звуки, и вопрос собственно поиска и перебора.
Записывайте, если нужно: известный диффузный гибрид Riffusion; список text-to-audio; голос по описанию: XTTS-v2, ChatTTS, OpenVoice v2, Parler-TTS
Это с ходу. Их намного больше, чем в списках выше.
Ну и в заключение. Попробуйте угадать, что за 10 образцов, по 30 секунд каждый, использовались в примере ниже. Т.е., каким было описание, что за звуковая сцена вам предлагается.
Stable Audio — 10 образцов
Stable Audio — 10 образцов
Your browser does not support the audio tag.
===== Перейти к комментариям
Редьярд Киплинг — Пыль (2024-10-26)
У стихотворения "Пыль" Редьярда Киплинга (в оригинале "Boots", т.е. "Сапоги") богатая история.
Написано от лица пехотинца Британской армии, передвигающегося форсированными маршами по Южной Африке во время Англо-бурской войны 1899—1902 годов (войны, в которой почти не было настоящих сражений).
Есть достаточно известная песня Евгения Аграновича "Пыль" по этому же стихотворению.
Редьярд Киплинг — Пыль
Автор перевода Ада Оношкович-Яцына (1922)
День, ночь, день, ночь — мы идём по Африке,
День, ночь, день, ночь — всё по той же Африке
(Пыль, пыль, пыль, пыль — от шагающих сапог!)
Отпуска нет на войне!
Восемь, шесть, двенадцать, пять — двадцать миль на этот раз,
Три, двенадцать, двадцать две — восемнадцать миль вчера.
(Пыль, пыль, пыль, пыль — от шагающих сапог!)
Отпуска нет на войне!
Брось, брось, брось, брось — видеть то, что впереди.
(Пыль, пыль, пыль, пыль — от шагающих сапог!)
Все, все, все, все — от нее сойдут с ума,
И отпуска нет на войне!
Ты, ты, ты, ты — пробуй думать о другом,
Бог, мой, дай, сил — обезуметь не совсем!
(Пыль, пыль, пыль, пыль — от шагающих сапог!)
И отпуска нет на войне!
Счёт, счёт, счёт, счёт — пулям в кушаке веди,
Чуть, сон, взял, верх — задние тебя сомнут.
(Пыль, пыль, пыль, пыль — от шагающих сапог!)
Отпуска нет на войне!
Для, нас, всё, вздор — голод, жажда, длинный путь,
Но, нет, нет, нет — хуже, чем всегда одно, —
Пыль, пыль, пыль, пыль — от шагающих сапог,
И отпуска нет на войне!
Днём, все, мы, тут — и не так уж тяжело,
Но, чуть, лёг, мрак — снова только каблуки.
(Пыль, пыль, пыль, пыль — от шагающих сапог!)
Отпуска нет на войне!
Я, шёл, сквозь, ад — шесть недель, и я клянусь,
Там, нет, ни, тьмы — ни жаровен, ни чертей,
Но, пыль, пыль, пыль, пыль — от шагающих сапог,
И отпуска нет на войне!
Редьярд Киплинг — Пыль (песни)
Редьярд Киплинг — Пыль (V5)
Your browser does not support the audio tag.
Редьярд Киплинг — Пыль (V4)
Your browser does not support the audio tag.
Редьярд Киплинг — Пыль (V3)
Your browser does not support the audio tag.
Редьярд Киплинг — Пыль (V2)
Your browser does not support the audio tag.
Редьярд Киплинг — Пыль (V1)
Your browser does not support the audio tag.
===== Перейти к комментариям
Шекспир, сонет 2 (2024-10-25)
Иллюстрация
На слова сонета 2 Шекспира (на русском и английском языках).
Продолжим? Сонет 2 не такой мрачный.
Слева ниже — слова, слева по-английски, справа по-русски (перевод С.Маршака).
Уильям Шекспир, сонет 2
Уильям Шекспир, сонет 2
When forty winters shall besiege thy brow, Когда твоё чело избороздят
And dig deep trenches in thy beauty’s field, Глубокими следами сорок зим,
Thy youth’s proud livery so gazed on now, Кто будет помнить царственный наряд,
Will be a tatter’d weed of small worth held: Гнушаясь жалким рубищем твоим?
Then being asked, where all thy beauty lies, И на вопрос: "Где прячутся сейчас
Where all the treasure of thy lusty days; Остатки красоты весёлых лет?" -
To say, within thine own deep sunken eyes, Что скажешь ты? На дне угасших глаз?
Were an all-eating shame, and thriftless praise. Но злой насмешкой будет твой ответ.
How much more praise deserv’d thy beauty’s use, Достойней прозвучали бы слова:
If thou couldst answer ‘This fair child of mine "Вы посмотрите на моих детей.
Shall sum my count, and make my old excuse,’ Моя былая свежесть в них жива,
Proving his beauty by succession thine! В них оправданье старости моей".
This were to be new made when thou art old, Пускай с годами стынущая кровь
And see thy blood warm when thou feel’st it cold. В наследнике твоём пылает вновь!
Уильям Шекспир, сонет 2 (песни)
Уильям Шекспир, сонет 2 (английский язык)
Your browser does not support the audio tag.
Уильям Шекспир, сонет 2 (русский язык)
Your browser does not support the audio tag.
===== Перейти к комментариям
Шекспир, сонет 66 (2024-10-24)
Иллюстрация
На слова сонета 66 Шекспира (на русском и английском языках).
Тем временем в Suno появилась функция "точечной" правки: можно переделать неправильно или неудачно произнесённую фразу, модифицировать музыкальную часть (фразу) и т.д. — вот и пригодилась, уж больно косноязычен бывает компьютерный голос.
Слева ниже — слова, слева по-английски, справа по-русски (перевод С.Маршака).
Уильям Шекспир, сонет 66
Уильям Шекспир, сонет 66
Tired with all these, for restful death I cry: Зову я смерть. Мне видеть невтерпёж
As to behold desert a beggar born, Достоинство, что просит подаянья,
And needy nothing trimm’d in jollity, Над простотой глумящуюся ложь,
And purest faith unhappily forsworn, Ничтожество в роскошном одеянье,
And gilded honour shamefully misplac’d, И совершенству ложный приговор,
And maiden virtue rudely strumpeted, И девственность, поруганную грубо,
And right perfection wrongfully disgrac’d, И неуместной почести позор,
And strength by limping sway disabled И мощь в плену у немощи беззубой,
And art made tongue-tied by authority, И прямоту, что глупостью слывет,
And folly, doctor-like, controlling skill, И глупость в маске мудреца, пророка,
And simple truth miscall’d simplicity, И вдохновения зажатый рот,
And captive good attending captain ill: И праведность на службе у порока.
Tir’d with all these, from these would I be gone, Все мерзостно, что вижу я вокруг...
Save that, to die, I leave my love alone. Но как тебя покинуть, милый друг?!
Уильям Шекспир, сонет 66 (песни)
Уильям Шекспир, сонет 66 (английский язык)
Your browser does not support the audio tag.
Уильям Шекспир, сонет 66 (русский язык)
Your browser does not support the audio tag.
===== Перейти к комментариям
Высота нужна орлам (2024-10-22)
Иллюстрация
По стихотворению Фёдора Сологуба "Баллада о высоком доме".
Фёдор Сологуб "Баллада о высоком доме"
Фёдор Сологуб "Баллада о высоком доме" (1920)
Дух строителя немеет,
Обессиленный в подвале.
Выше ветер чище веет,
Выше лучше видны дали,
Выше ближе к небесам.
Воплощенье верной чести,
Возводи строенье выше
На высоком, гордом месте,
От фундамента до крыши
Все открытое ветрам.
Пыль подвалов любят мыши,
Высота нужна орлам.
Лист, ногою смятый, тлеет
На песке, томясь в печали.
Крот на свет взглянуть не смеет,
Звезды не ему мерцали.
Ты всходи по ступеням,
Слушай радостные вести,
Притаившись в каждой нише,
И к ликующей невесте
Приникай все ближе, тише,
Равнодушный к голосам
Петуха, коня и мыши.
Высота нужна орлам.
Сердце к солнцу тяготеет,
Шумы жизни замолчали
Там, где небо пламенеет,
Туч расторгнувши вуали.
Посмотри в долину,— там
Флюгер маленький из жести,
К стенкам клеятся афиши,
Злость припуталася к лести,
Люди серые, как мыши,
Что-то тащат по дворам.
Восходи же выше, выше,
Высота нужна орлам.
Послание
Поднимай, строитель, крыши
Выше, выше к облакам.
Пусть снуют во мраке мыши,
Высота нужна орлам.
Высота нужна орлам — песня
Высота нужна орлам (alternative)
Your browser does not support the audio tag.
Альтернативные версии:
Высота нужна орлам (R2 — amateur rock)
Your browser does not support the audio tag.
Высота нужна орлам (R3 — city pop symphony metal)
Your browser does not support the audio tag.
Высота нужна орлам (R4 — dark alt-pop)
Your browser does not support the audio tag.
Высота нужна орлам (R5 — orchestral soundtrack)
Your browser does not support the audio tag.
Высота нужна орлам (R6 — illbient alternative rock)
Your browser does not support the audio tag.
Высота нужна орлам (R7 — post-punk)
Your browser does not support the audio tag.
===== Перейти к комментариям
Музыкальная шкатулка (2024-10-14)
В ужасах разных главное — контекст. Всё должно действовать вкупе, сообща.
Прослушайте трек. Да, там полно диссонанса и прочего, это намеренно.
И только потом прочтите текст (ну и прослушайте трек ещё раз — или уже не слушайте).
Музыкальное сопровождение
Страна снов — Призрачная шкатулка
Your browser does not support the audio tag.
Текст
В детскую — так потом мы поняли — мы зашли в последнюю очередь. Заброшенный дом и так был не подарок, одно помещение мрачнее другого, но тут...
Мы даже не стали пытаться заглядывать, что там на просторной кровати на возвышении. Вроде просто подушки и одеяла, и густой слой пыли поверх.
Лампа на полу у входа начала тускло рдеть и постепенно разгорелась так, что мы разглядели непонятный сундук перед собой, и на полу перед ним — музыкальную шкатулку.
— Они очень любили его, — медленно проговорила Настя, оглянувшись. Она присела, прежде чем я пришёл в себя и коснулась шкатулки кончиками пальцев. Тотчас заиграла мелодия — приятная, хотя и не очень сложная.
— Идём отсюда, — потребовала Настя. Мы быстро вышли вон, спустились по лестнице и ещё через пару минут удалялись от дома под полной Луной.
Не сразу поняли, что музыка осталась с нами, доносясь сразу отовсюду, и звучала всё большим диссонансом, резала слух, и что-то ещё звучало помимо...
Мы бросились назад, а когда ворвались в сумрачную детскую (лампа больше не разгоралась), шкатулка умолкла сама собой.
Мы на цыпочках покинули дом, и, пока удалялись, всё казалось, что кто-то крадётся следом.
Дополнение: добавлено два "чистых" исполнения темы музыкальной шкатулки — самой по себе и с аккомпанементом.
Чистое исполнение
Страна снов — Музыкальная шкатулка
Your browser does not support the audio tag.
Страна снов — Музыкальная шкатулка (аккомпанемент)
Your browser does not support the audio tag.
===== Перейти к комментариям
Инфернальное (2024-10-11)
Если сделать порядком каверов подряд, в них может, внезапно, обнаружиться закономерность — и вовсе не та, что в песне-образце.
Подробнее — на странице "Собственность ада", ну а здесь я просто выложу трек-образец и два кавера к нему (второй, по совместительству, галлюцинация).
Образец и два кавера
EDM — Breaking
Your browser does not support the audio tag.
Часть 03. Кавер: врата ада
Your browser does not support the audio tag.
Эпилог — Слишком высоко
Your browser does not support the audio tag.
===== Перейти к комментариям
Мажор и минор (2024-10-05)
Продолжаю, сложно оторваться (в свободное время) от "каверизации", простите мой английский.
Ниже варианты мелодии из "The Elder Scrolls 2: Daggerfall", трек восемнадцатый, который уже не первый десяток лет стоит у меня на телефонах в качестве основной озвучки вызова ("рингтон" на новоязе).
Обратите внимание на минорный вариант исполнения. По мне, прямо-таки находка (если в случае искина так можно говорить).
Исходный трек (TES2 OST — Square)
The Elder Scrolls 2: Daggerfall — Square
Your browser does not support the audio tag.
Каверы
The Elder Scrolls 2: Daggerfall — Square — Symphony
Your browser does not support the audio tag.
The Elder Scrolls 2: Daggerfall — Square — Minor Dance
Your browser does not support the audio tag.
The Elder Scrolls 2: Daggerfall — Square — Grand Piano
Your browser does not support the audio tag.
===== Перейти к комментариям
Старое доброе (2024-10-04)
Тем временем Suno увеличил допустимую продолжительность внешних треков (загруженных пользователем) до двух минут, чем открыл интересные возможности.
В сочетании с функцией создания производных работ по образцу (каверов) теперь можно их генерировать для огромного количества давно известных композиций, включая так называемые OST ("official sound track" — официальный саунд-трек, официальное музыкальное сопровождение).
При этом снизили параноидальность предупреждения о возможном нарушении авторского права: для пробы я "скормил" сервису несколько треков из OST относительно недавней компьютерной игры, "Amnesia: the Dark Descent", и сервис не стал возражать.
Вангую, как говорят на новоязе, появление множества каверов — как качественных, так и не очень. Но для творческих задач это крайне удобно: теперь можно взять достаточно долгую композицию и с помощью кавера положить с её помощью слова на отдельно полученную мелодию.
Короче, конкретно для меня это вылилось в неожиданную новую забаву: взять OST от игр, в которые я давно и с удовольствием играю (теперь обычно в отпуске) и посмотреть, что выйдет.
В качестве примера взят исходный трек из очень старой игры "Betrayal at Krondor" (1993), один из часто воспроизводимых в процессе игры треков (один из трёх, которые игра выбирает, когда приходится с кем-то биться).
Исходный трек (BAK OST — It's a Trap)
Betrayal at Krondor OST — It's a Trap
Your browser does not support the audio tag.
Каверы
BAK It's a Trap Cover — Symphony Piece
Your browser does not support the audio tag.
BAK It's a Trap Cover — Voices (A cappella)
Your browser does not support the audio tag.
BAK It's a Trap Cover — Tavern
Your browser does not support the audio tag.
BAK It's a Trap Cover — Ballad
Your browser does not support the audio tag.
BAK It's a Trap Cover — Cavalry
Your browser does not support the audio tag.
BAK It's a Trap Cover — Disco Drums
Your browser does not support the audio tag.
BAK It's a Trap Cover — Fast Pace
Your browser does not support the audio tag.
BAK It's a Trap Cover — Hypna
Your browser does not support the audio tag.
BAK It's a Trap Cover — Pacifique
Your browser does not support the audio tag.
BAK It's a Trap Cover — Rock Ballad
Your browser does not support the audio tag.
BAK It's a Trap Cover — Slap Dance
Your browser does not support the audio tag.
Понятно, что в каком-то смысле это был процесс ради процесса — не смог удержаться, как говорится.
===== Перейти к комментариям
Белый шум (2024-09-23)
Добиться фоновых звуков (шум улицы, свист ветра и пр.) от Suno (и не только от него, раз уж речь зашла) крайне сложно.
Внезапно, при очередной генерации, получилось нечто очень странное — совершенно немузыкальный файл (как говорится, сами просили — ешьте полной ложкой).
Это не музыка, и местами сильно режет ухо во всех смыслах. Так что вас предупредили:
Немузыкальное
Konstantin Boyandin — Curtain of Chaos
Your browser does not support the audio tag.
Забегая вперёд, от этого "трека" получаются улётные каверы.
===== Перейти к комментариям
Кавер от кавера... (2024-09-19)
Что ж, вот то, что получилось — когда сделан кавер от вчерашней галлюцинации (см. ниже), на другие, уже осмысленные, слова.
Производная от галлюцинации
Hallucination — You Didn't See It Green
Your browser does not support the audio tag.
===== Перейти к комментариям
Лирическая галлюцинация (2024-09-18)
"Галлюцинациями" в сфере искусственного интеллекта называют ситуации, когда "ответ" искина (в том числе сгенерированная картинка, музыка или видео) не соответствуют описанию (запросу).
Галлюцинируют они все, что как бы и для людей вполне типичное явление. Пример такой галлюцинации ниже: при запуске генерирования кавера (композиции по мотивам, с другим исполнением чисто инструментального трека) получилось вот это.
Не уверен даже что есть такой язык, на котором поют, но звучит красиво.
К слову, если кто опознает язык (диалект), не сочтите за труд поделиться знанием.
Осторожно, галлюцинация
Hallucination — To See Your Chance
Your browser does not support the audio tag.
Есть такой термин "novelty song" без точного перевода на русский. Это песня-авангард, песня ради песни — в т.ч. с "выдуманным" языком и т.п. Примеры таких исполнителей: Orbis Mundi (практически все песни); In Extremo ("Vollmond"); Black Lace ("Agadoo"); The Avalanches ("The Frontier Psychiatrist"). То, что генерирует искин, отвечающий за каверы, очень часто похожи именно на такие песни ради песен.
===== Перейти к комментариям
Тоффи: работа над ошибками (2024-09-14)
В предыдущей заметки опыты ставились над "песней-бессмыслицей" (т.н. "novelty song"). Сейчас попробуем "почистить" второй вариант песни "Тоффи" ("Кошки на крыше", по стихотворению Александры Ковалевской).
Ниже два трека: исходный, по которому создавались каверы (эталон) и один из каверов, который очень походит на эталон и чистит почти все его огрехи, кроме "проглоченного" начала припева.
У эталона множество огрехов: постепенно нарастающий к концу фоновый шум; проглоченное начало припева после первого куплета; наконец, галлюцинации — в финале повторяется припев, причём опять же часть слогов проглочена.
Эталон и правка
Тоффи V02 Эталон
Your browser does not support the audio tag.
Тоффи V02 Правка
Your browser does not support the audio tag.
А теперь все мало-мальски осмысленные каверы, не являющиеся фактическими копиями эталона. Обратите внимание, что большинство из них — химеры: первый куплет исполняется в другом стиле, зато потом практически точно копируется эталон.
Каверы
Тоффи V02 Кавер 9
Your browser does not support the audio tag.
Тоффи V02 Кавер 8
Your browser does not support the audio tag.
Тоффи V02 Кавер 6
Your browser does not support the audio tag.
Тоффи V02 Кавер 1
Your browser does not support the audio tag.
Тоффи V02 Кавер 2
Your browser does not support the audio tag.
Тоффи V02 Кавер 3
Your browser does not support the audio tag.
Тоффи V02 Кавер 4
Your browser does not support the audio tag.
Тоффи V02 Кавер 5
Your browser does not support the audio tag.
Тоффи V02 Кавер 7
Your browser does not support the audio tag.
Ну и галлюцинации. Невзирая на их очевидную странность, сами по себе композиции вполне интересные. Кто скажет, на каком языке исполняется вторая?
Галлюцинации
Тoффи V02 Галлюцинация 1
Your browser does not support the audio tag.
Тoффи V02 Галлюцинация 2
Your browser does not support the audio tag.
===== Перейти к комментариям
Винни Кавер Пух (2024-09-13)
Случилось занятное, и Suno предоставил платным пользователям функцию создания каверов (калька с английского "cover" — "обложка", "обёртка").
Кавер — это музыкальная композиция, исполненная немного иначе (другой стиль, другой вокал, другой текст). Весьма популярное явление и сейчас: есть музыкальные группы, которые зарабатывают, выпуская именно каверы.
Обольщаться, правда, не нужно. Сервис по-прежнему не допускает к обработке опознанные коммерческие треки, а от прочих внешних позволит загрузить не более 60 секунд. Полноценно "каверить" можно только треки, созданные в том же сервисе.
Функция создания каверов весьма сырая пока что, и примерно в 60% случаев попросту возвращает тот же самый исходный файл.
Опыты поставил на том самом "Винни-Пухе", в списке ниже этот трек под номером ноль (самый первый).
Pooh Song (V00 )
Your browser does not support the audio tag.
Pooh Song Cover (V07 folk choral)
Your browser does not support the audio tag.
Pooh Song Cover (V10 bluegrass)
Your browser does not support the audio tag.
Pooh Song Cover (V01 duet)
Your browser does not support the audio tag.
Pooh Song Cover (V02 folk opera)
Your browser does not support the audio tag.
Pooh Song Cover (V03 folk rock)
Your browser does not support the audio tag.
Pooh Song Cover (V04 liquid drum and bass rockabilly)
Your browser does not support the audio tag.
Pooh Song Cover (V05 hard techno)
Your browser does not support the audio tag.
Pooh Song Cover (V06 a cappella)
Your browser does not support the audio tag.
Pooh Song Cover (V08 techno reggae)
Your browser does not support the audio tag.
Pooh Song Cover (V09 pop rock)
Your browser does not support the audio tag.
Pooh Song Cover (V11 club rock-n-roll)
Your browser does not support the audio tag.
Pooh Song Cover (V12 klezmer pop)
Your browser does not support the audio tag.
Pooh Song Cover (V13 club lullaby)
Your browser does not support the audio tag.
Можно создавать каверы и без вокала:
Pooh Song Instrumental Cover (V01 indie rock)
Your browser does not support the audio tag.
Pooh Song Instrumental Cover (V02 liquid bass and drum rockabilly)
Your browser does not support the audio tag.
А вот это пример весьма фантасмагоричной галлюцинации (когда полученный трек вообще никаким боком к тому, что задано делать).
Hallucination — It's Too Late
Your browser does not support the audio tag.
Так что появился ещё один инструмент, и теперь можно генерировать новые треки, очень близкие к исходному.
===== Перейти к комментариям
Инструментальные импровизации (2024-09-09)
Я пока не видел простого способа взять готовую "минусовку" (песню, из которой удалён вокал — ну или сведено всё, кроме вокала) и наложить на неё произвольный текст средствами ИИ.
Однако есть другой способ: взять минусовку за образец и "творчески развить" (продолжить); если образец достаточно длинный, ИИ сумеет точно воспроизвести и поддержать и ритмику, и в целом структуру. А если в образце были немузыкальные компоненты (фоновый шум), то и его можно будет услышать в "развитии темы".
Ниже примеры, как может выглядеть такое развитие. За образец взята тема от версии седьмой озвучки "Щедрого неба".
Может показаться весьма занудным прослушивать такое количество однотипного. Спорить не буду. Разработка (импровизация ИИ) начинается между 11 и 14 секундами каждого трека.
Практическое применение — помимо того, чтобы положить другой (или тот же) текст на однотипную (очень схожую) мелодию, можно использовать инструментал как фон. Например, для т.н. буктрейлеров (коротких видеороликов, рекламирующих некую книгу).
Константин Бояндин — Щедрое небо, инструментал (V1 minimal techno)
Your browser does not support the audio tag.
Константин Бояндин — Щедрое небо, инструментал (V2 minimal techno)
Your browser does not support the audio tag.
Константин Бояндин — Щедрое небо, инструментал (V3 accordion rock)
Your browser does not support the audio tag.
Константин Бояндин — Щедрое небо, инструментал (V4 klezmer pop)
Your browser does not support the audio tag.
Константин Бояндин — Щедрое небо, инструментал (V5 hypnagogic electropop)
Your browser does not support the audio tag.
Константин Бояндин — Щедрое небо, инструментал (V6 dark alt-pop)
Your browser does not support the audio tag.
Константин Бояндин — Щедрое небо, инструментал (V7 dark alt-pop)
Your browser does not support the audio tag.
Константин Бояндин — Щедрое небо, инструментал (V8 soul trap)
Your browser does not support the audio tag.
Константин Бояндин — Щедрое небо, инструментал (V9 illbientwave)
Your browser does not support the audio tag.
===== Перейти к комментариям
Призрак литературы (2024-09-06)
Закончим эту пятницу музыкальной шуткой. Многие из написанных недавно композиций были для меня, скажем так, скорее депрессивными.
Ну а раз был Призрак Оперы, отчего бы не быть и Призраку Литературы?
Female:
In sleep it wrote for me,
In dreams he came,
That Muse that writes for me
And calls my name.
And will I write again,
Once for awhile?
For Phantom of the Literature is there,
Inside my file.
Male:
It brings me fantasy,
And fiction, too.
Both crime and mystery
Look so anew.
For time I spent in vain
That does beguile -
For Phantom of the Literature is there,
Inside my file.
Male:
Come to me, my Angel of prose!
Oh come to me!
Male and female:
It makes me type and type,
Deprives of sleep,
Book's getting strong and ripe,
Inside me deep.
It's published making me
Both cry and smile —
For Phantom of the Literature is there,
Inside my file.
Konstantin Boyandin — Phantom of the Literature
Your browser does not support the audio tag.
===== Перейти к комментариям
Шёпот (2024-09-05)
Что ж, есть некоторое продвижение. Эксперимент ниже ("Wake Up Your Mind") использовал немузыкальный ("шумовой") файл в качестве затравки, и на этот раз комбинацией директив удалось добиться того, чтобы вокал стал просто чтением.
Правда, почему-то шёпотом.
Работаем дальше, а те, кто понимают английский язык, думаю, смогут прочувствовать послание в этой композиции.
Chill and Bells — Wake Up Your Mind
Your browser does not support the audio tag.
===== Перейти к комментариям
Речитативы (2024-09-03)
Начал пробовать синтезировать проговаривание текста (а ля Утёсов, когда ещё никакого рэпа и в планах не было).
Тесты будут здесь, в этой секции. Первая проба, где взято четверостишие про Винни-Пуха не привела к ожидаемому итогу, но звучит крайне забавно, не стал выбрасывать.
Хорошо живёт на свете Винни-Пух — V1 (spoken word, recitative, bass trap)
Your browser does not support the audio tag.
Хорошо живёт на свете Винни-Пух — V2 (spoken word, recitative, soul trap)
Your browser does not support the audio tag.
Хорошо живёт на свете Винни-Пух — V3 (spoken word, recitative, accordion afro trap)
Your browser does not support the audio tag.
Это, конечно, смешно и забавно, но пока речитатива не выходит, пробую другие комбинации.
===== Перейти к комментариям
Наталья Стадлер — Новые краски (2024-09-03)
Ниже приведена озвучка стихотворения Натальи Стадлер "Новые краски" (десять вариантов).
Чемпионы "среди меня" — шесть и девять.
Новые краски
Новые краски — V1 (rock ballad)
Your browser does not support the audio tag.
Новые краски — V2 (acoustic ballad)
Your browser does not support the audio tag.
Новые краски — V3 (illbientwave)
Your browser does not support the audio tag.
Новые краски — V4 (choral a cappella)
Your browser does not support the audio tag.
Новые краски — V5 (accordion rock)
Your browser does not support the audio tag.
Новые краски — V6 (hypnagogic pacific reggae)
Your browser does not support the audio tag.
Новые краски — V7 (flamenco hip hop)
Your browser does not support the audio tag.
Новые краски — V8 (harpsicord symphonic metal)
Your browser does not support the audio tag.
Новые краски — V9 (dark alt-pop)
Your browser does not support the audio tag.
Новые краски — V10 (psybient new wave)
Your browser does not support the audio tag.
===== Перейти к комментариям
Loch Lomond (2024-09-01)
Известную шотландскую песню "The Bonnie Banks o' Loch Lomond" исполняли очень многие.
Лично мне больше всего понравилось исполнение от "The Dublin Ramblers" и Эллы Робертс. Последнее рекомендую посмотреть и послушать прежде, чем знакомиться с сегодняшней озвучкой ниже.
By yon bonnie banks and by yon bonnie braes,
Where the sun shines bright on Loch Lomond,
Where me and my true love were ever wont to gae,
On the bonnie, bonnie banks o' Loch Lomond.
Chorus:
O ye'll tak' the high road, and I'll tak' the low road,
And I'll be in Scotland afore ye,
But me and my true love will never meet again,
On the bonnie, bonnie banks o' Loch Lomond.
'Twas there that we parted, in yon shady glen,
On the steep, steep side o' Ben Lomond,
Where in soft purple hue, the highland hills we view,
And the moon coming out in the gloaming.
Chorus
The wee birdies sing and the wildflowers spring,
And in sunshine the waters are sleeping.
But the broken heart it kens nae second spring again,
Though the waeful may cease frae their grieving.
Chorus
Как всегда, "призёры среди меня" указаны первыми, выделены жирным шрифтом.
Konstantin Boyandin — Loch Lomond V06 (horror synth)
Your browser does not support the audio tag.
Konstantin Boyandin — Loch Lomond V10 (illbient alternative rock)
Your browser does not support the audio tag.
Konstantin Boyandin — Loch Lomond V02 (hypnagogic pacific reggae)
Your browser does not support the audio tag.
Konstantin Boyandin — Loch Lomond V03 (accordion ambient techno)
Your browser does not support the audio tag.
Konstantin Boyandin — Loch Lomond V04 (choral a cappella)
Your browser does not support the audio tag.
Konstantin Boyandin — Loch Lomond V05 (dark alt-pop)
Your browser does not support the audio tag.
Konstantin Boyandin — Loch Lomond V07 (opera)
Your browser does not support the audio tag.
Konstantin Boyandin — Loch Lomond V08 (accordion rock)
Your browser does not support the audio tag.
Konstantin Boyandin — Loch Lomond V09 (illbientwave)
Your browser does not support the audio tag.
===== Перейти к комментариям
О жанрах (2024-08-18)
Последний подсчёт показывает, что раздельно опознаваемых стилей в Suno почти девятьсот.
Основной задачей является правильно подобрать стили (или их комбинацию), и правильно перечислить, вкупе с другими уточнениями. Ничего не напоминает? Описание создание текстовой картинки по тексту. Только здесь речь о звуковой композиции (необязательно музыкальной).
Ниже пример — список треков для "Путешествия, приснившегося под утро", для которых сгодилось единственное описание стиля.
Так сказать, понять и проникнуться.
Konstantin Boyandin — The Pursuit (liquid drum and bass rockabilly)
Your browser does not support the audio tag.
Konstantin Boyandin — We Stay till Morning (hypnagogic ambient trance)
Your browser does not support the audio tag.
Konstantin Boyandin — Lazy Time (illbientwave)
Your browser does not support the audio tag.
Konstantin Boyandin — Down the River (soulful chillsynth)
Your browser does not support the audio tag.
Konstantin Boyandin — Game Console (hyper-dance)
Your browser does not support the audio tag.
Konstantin Boyandin — Hurrying Up (psychedelic psybient)
Your browser does not support the audio tag.
Konstantin Boyandin — Lily Lake (hypnagogic pacific reggae)
Your browser does not support the audio tag.
Konstantin Boyandin — Lost in Memories (city pop symphonic metal)
Your browser does not support the audio tag.
Konstantin Boyandin — Maze of Mirrors (Russian ambient techno)
Your browser does not support the audio tag.
Konstantin Boyandin — Mute Movie (harpsicord boogie)
Your browser does not support the audio tag.
Konstantin Boyandin — Old Radio (calypso opera)
Your browser does not support the audio tag.
Konstantin Boyandin — Opera House (choral chanson)
Your browser does not support the audio tag.
Konstantin Boyandin — Pond of Treasures (reggaetonwave)
Your browser does not support the audio tag.
Konstantin Boyandin — The Frontier (dark alt-pop)
Your browser does not support the audio tag.
Konstantin Boyandin — The Steam Train (psybient griot)
Your browser does not support the audio tag.
Konstantin Boyandin — The Tempest (dark dance)
Your browser does not support the audio tag.
Konstantin Boyandin — Wild Party (prog avant-garde jazz)
Your browser does not support the audio tag.
===== Перейти к комментариям
На краю крыши (2024-07-28)
На сей раз и основная тема, и вариации вряд ли войдут в золотой фонд музыки человечества. И не нужно: в данном случае это — иллюстрации
Дано: сервис (вроде Soundful) или аналогичная локальная установка (SA) генерируют относительно простые, не слишком разнообразные по структуре треки, которые хотелось бы использовать в качестве основы, по которой другой сервис или инструмент уже будет создавать другой трек.
В итоге выбран процесс такой: вначале выдаётся образец мелодии (основного трека), который загружается в сервис типа Suno, и затем "продолжается" (наращивается).
Процесс аналогичен использованию LoRA в случае картинок, с единственной тренировочной мелодией: сервис очень точно и узнаваемо "продолжает" трек, поддерживая его ритмическую картину и используя отдельные музыкальные фразы, при этом добавляет уже "от себя".
Правда, чтобы основа стала устойчивой, сервису нужен большой фрагмент (в примерах ниже — около 60 секунд). Впрочем, никто не мешает затем отсечь вступительный эталонный фрагмент в редакторе и сделать таким образом трек желательной структуры.
Несколько занудно, но в принципе работает. Образцы ниже.
Исходником служит фрагмент, иллюстрирующий сцену испытания искина, когда тот должен по нескольким примитивным звукам (треск зубьев расчёски, стук по большой бочке и т.д.) написать мало-мальски пригодную для танцев мелодию. Можно ли под перечисленное ниже танцевать — думаю, можно.
На краю крыши
Your browser does not support the audio tag.
На краю крыши (виолончель)
Your browser does not support the audio tag.
На краю крыши (дабстеп)
Your browser does not support the audio tag.
На краю крыши (фанк)
Your browser does not support the audio tag.
На краю крыши (металл)
Your browser does not support the audio tag.
На краю крыши (оркестр)
Your browser does not support the audio tag.
На краю крыши (рок)
Your browser does not support the audio tag.
На краю крыши (рок-опера)
Your browser does not support the audio tag.
На краю крыши (техно)
Your browser does not support the audio tag.
Котопятница-угадайка (2024-07-26)
Какие из этих кошек настоящие? Ответы ниже.
1
2
3
4 (синтез)
5 (синтез)
6
7
Конечно, поиск в Сети этих картинок будет считаться неспортивным поведением.
Ответ: синтетическими являются изображения номер 4 и 5, остальные — фото подлинных кошек.
===== Перейти к комментариям
Песенник — Александра Ковалевская (2024-07-24)
Коллекция озвучки стихотворений Александры Ковалевской находится здесь.
Хромой король (2024-07-16)
Вначале — одно из самых известных исполнений (Эдуард Хиль). Увы, там только три куплета.
Эдуард Хиль — Хромой король
Your browser does not support the audio tag.
Железный шлем, деревянный костыль,
Король с войны возвращался домой.
Солдаты пели, глотая пыль,
И пел с ними вместе король хромой.
Троянский бархат, немурский шёлк — (*)
На башне ждала королева, и вот
Платком она машет, завидев полк,
Она смеётся, она поёт.
Рваная обувь, а в шляпе цветок,
Плясал на площади люд простой...
Он тоже пел, он молчать не мог
В такую минуту и в день такой.
Бой барабанный, знамён карнавал -
Король с войны возвратился домой.
Войну проиграл, полноги потерял,
Но рад был до слёз, что остался живой.
— — — — — — — — — -
* — Итог обсуждения в SU.KSP:
— Ошибка перевода. Должно быть
"...Труанский бархат, намюрский шелк..."
Бархат изготовленный в городе Труане (Troyes)
Шелк изготовлен в городе Намюре — (Бельгия)
Ну и то, что выдал искин.
Хромой король (рок)
Your browser does not support the audio tag.
Хромой король (поп-опера)
Your browser does not support the audio tag.
Хромой король (барды)
Your browser does not support the audio tag.
Хромой король (кафе)
Your browser does not support the audio tag.
Хромой король (металл)
Your browser does not support the audio tag.
Хромой король (оперетта)
Your browser does not support the audio tag.
Хромой король (панк)
Your browser does not support the audio tag.
NB: я в курсе, что во втором и третьем вариантах удвоен второй куплет ("галлюцинация" искина).
===== Перейти к комментариям
Картинка и видео (2024-07-15)
К "магии" получения картинки по описанию многие уже привыкли.
К "магии" получения видео по картинке ещё только предстоит.
Обратите внимание, как "электронный режиссёр" достраивает появляющиеся подробности интерьера лабиринта.
Ваш браузер не поддерживает просмотра встроенного видео, но вы можете скачать его и просмотреть в любом привычном вам проигрывателе.
===== Перейти к комментариям
Веверлеи (2024-07-14)
Что ж, обещал варианты исполнения известной песни про Веверлея, вот они.
Слова:
Пошёл купаться Веверлей,
Оставив дома Доротею,
С собою пару пузырей
Берёт он, плавать не умея.
Нырнул он, как он только смог,
Нырнул он прямо с головою,
Но голова тяжеле ног,
Она осталась под водою.
Жена, узнав про ту беду,
Удостовериться хотела
Но ноги милого в пруду
Она узрев, окаменела.
Прошли года, и пруд заглох,
И поросли травой аллеи,
Но всё торчит там пара ног
И остов бедной Доротеи.
Веверлей (поп)
Your browser does not support the audio tag.
Веверлей (кафе)
Your browser does not support the audio tag.
Веверлей (рок)
Your browser does not support the audio tag.
===== Перейти к комментариям
Мастеринг: Time (2024-07-12)
Что ж, теперь записью и сведением трека занимаются "специально обученные подпрограммы", и оставался только один шаг, мастеринг.
Что это такое, вы легко найдёте на просторах Сети. Если что, это приведение трека в оптимальное с точки зрения звучания состояние.
Ну и два примера: трек до мастеринга и после.
Time (Viona Zeth), до мастеринга
Your browser does not support the audio tag.
Time (Viona Zeth), после мастеринга
Your browser does not support the audio tag.
Пошёл подвергать этой процедуре остальные ранее скомпонованные треки. Которые не в мусор.
===== Перейти к комментариям
Фонограммы: breaking (2024-07-08)
Итак, это случилось: минутная заминка, и я не смог найти адекватного короткого перевода основного слова этой композиции, "breaking" (to break: ломаться, распадаться, делать паузу и ещё много значений)
В общем, нужна была не очень сложная, прилипчивая танцевальная композиция. Вам судить, насколько это удалось.
Дополнение. Два варианта композиции.
Breaking (Joey)
Your browser does not support the audio tag.
Breaking (Martin)
Your browser does not support the audio tag.
===== Перейти к комментариям
Фонограммы: таинственный лес (2024-07-06)
В классику искин тоже может. При этом структурно пьесы вполне походят на то, что ожидается.
То, что нужно для настройки на рабочий лад утром в субботу.
Романтическая фуга
Your browser does not support the audio tag.
Sonata Della Foresta Mistica
Your browser does not support the audio tag.
===== Перейти к комментариям
Фонограммы: прочь! (2024-07-03)
Пока я пытаюсь сделать что-то, похожее на блатняк, захотелось чего-нибудь незатейливого и бодро-танцевального.
Короче. В этот дождливый сонный день — немного бодрого металла. На сон грядущий.
Прочь!
Your browser does not support the audio tag.
===== Перейти к комментариям
Фонограммы: напиши мне письмо (2024-07-02)
Спрашивали — отвечаем. Suno умеет писать песни по русскому тексту, ниже две обработки моих давешних стихотворений.
Как обойти ошибку в последней строке "...письма", пока не очень понимаю, спрошу тех.поддержку. Искин не "понимает", где именно по контексту должно быть ударение в слове "стоит".
Напиши мне письмо
Your browser does not support the audio tag.
Нарисованные люди
Your browser does not support the audio tag.
===== Перейти к комментариям
Фонограмма: яркий новый день (2024-07-01)
Немного бодрящего регги этим жарким утром.
Феникс плохого не посоветует.
Яркий новый день
Your browser does not support the audio tag.
===== Перейти к комментариям
Фонограмма: иди на мой голос (2024-06-27)
Эпизод в повествовании, где протагонисты оказываются в постоянно меняющемся лабиринте, и выбраться можно только следуя за голосом друг друга — а единственное, что удерживает по эту сторону рассудка — стук собственного сердца.
Иди на мой голос
Your browser does not support the audio tag.
===== Перейти к комментариям
Фонограмма: восхождение (2024-06-26)
Едем (идём) дальше. "Восхождение" — основная серия эпизодов о начале путешествия — как герои выбираются из ставшей смертельно опасной библиотеки и бегут прочь, поднимаясь всё выше, за облака — буквально.
Восхождение
Your browser does not support the audio tag.
===== Перейти к комментариям
Фонограмма: призраки ждут нас (2024-06-25)
На случай, если кто-нибудь интересовался, что нонче могут нейросети по части музыки, вот пример. Музыкальное сопровождение к пишущейся книге; трек 4, "Призраки ждут нас", иллюстрация к эпизоду бегства из библиотеки.
Призраки ждут нас
Your browser does not support the audio tag.
===== Перейти к комментариям
SD3 (2024-06-15)
Меж тем Stability.AI выставило во всеобщий доступ файлы весов ("модели") Medium третьей версии SD.
Мой любимый графический интерфейс от AUTOMATIC1111 пока не поддерживает, пришлось в темпе научиться пользоваться ComfyUI.
Принцесса
Балерина
Чёрная роза
Кот
Вишнёвое дерево
Часовое королевство
Полярное сияние
В библиотеке
Лунная ночь
Крестьянка
Кролик
Берег моря
Потому что!
Плачущий ангел
Качество деталей местами очень приятно радует (обратите внимание на капельки росы на розе и столе, а также на волны в море).
Добиться вменяемой человеческой фигуры в случае девушки у книжных полок оказалось дико сложно: только одна (!) из примерно полусотни попыток дала что-то не очень страхолюдное.
А вот кота, принцессу и балерину, внезапно, выдало без особых сложностей.
Засада есть теперь и в коммерческом использовании. Теперь под это требуется платная лицензия ($20 в месяц; как платить из России — не очень въехал, но это не самое большое затруднение). Самое большое — что если вы делаете, например, производную работу (модель на базе основной модели SD3), то после отказа от коммерческой лицензии, по лицензионному соглашению, все такие производные работы вы должны удалить и картинок с них не строить.
В общем, создатели SD отчётливо движутся к максимальной коммерсализации своего продукта, теперь можно делать ставки — начиная с какой именно версии они закроют код (или существенную его часть).
По понятной причине, производных моделей для SD3 будет на порядок-другой меньше, чем для предыдущих его версий. Увы.
Тем не менее ждём, предвкушаем и надеемся.
===== Перейти к комментариям
Кот Кузьма (2024-05-21)
Помнится, написано было лимериков про кота Кузьму порядком, в рабочих записях их за сотню.
Теперь, при помощи электронного художника, их вполне можно проиллюстрировать.
Кот Кузьма, кочегар из Гааги,
Слыл гребцом небывалой отваги:
Он Ла-Манш, говорят,
Раз пятнадцать подряд
Пересёк на плоту из бумаги.
===== Перейти к комментариям
Ложкин, как его нет (2024-05-07)
Случилось прекрасное: некая добрая душа натренировала корректировочную модель (LoRA) на работах Васи Ложкина. Так что теперь можно развлекаться.
Пой, гитара!
Сезон открыт
Начинаем зарядку!
Вечер трудного дня
Согласитесь, что-то в этом есть.
===== Перейти к комментариям
Чудо света (2024-04-25)
Уже упоминавшееся заблуждение о том, что описание для генеративных моделей воспринимается программой примерно так же, как автором описания (обычно человеком) ведёт и к другим достаточно интересным находкам.
Оптические иллюзии и "смешение сцен" — достаточно сложная категория изображений. Сложная в том смысле, что вряд ли получится описать её словами и получить от электронного художника именно то, что заказывал. Простой пример:
Чудо света
Обратите внимание — там, где стоит человек, вероятнее всего сухо, но вот прямо над ним уже толща воды. Плюс расположение теней, плюс "переливающийся в воду" луч света. Всё верно, это тоже галлюцинация модели "HelloWorld", а сцена описывается как extremely detailed, oil painting, "wonder of the world". Т.е., "чудо света". Некоторые из таких галлюцинаций очень, я бы сказал, пугающие.
Поэтому стало привычкой время от времени запускать длинный прогон (обычно на ночь) нескольких тысяч галлюцинаций на проверенные опытом описания, а поутру быстренько пролистывать это всё. И всегда там можно найти что-то любопытное, что нарочно не придумаешь.v
Вообще достаточно занятно осваивать технологии, которые не реже раза в год меняются так основательно, что сама мысль сопровождать это учебником или хотя бы рабочими записями лишена смысла: всё устаревает не то чтобы в момент написания, но очень вскоре.
Поэтому правило здесь примерно такое же, как при наблюдении за цветущей "ночной красавицей" (кактус, цветок которого к утру следующего дня уже увядает): смотри, восхищайся и пользуйся, пока возможно. Завтра будет уже что-то совсем другое. Ну, почти совсем.
===== Перейти к комментариям
Последние дни (2024-04-19)
Фраза "last days" (последние дни) также оказалась плодотворной в смысле галлюцинаций.
Занятно, что на портретную ориентацию двигатель выдал огромное количество очень интересных (и вовсе не жутких) портретов, преимущественно женских.
На ландшафтную... Там и собственно ландшафты, и, неожиданно, большое количество т.н. "body horror" — ужасы, опирающиеся на сцены жутких изменений тела и всевозможные уродства. Кто видел "The Thing" Карпентера, тот поймёт, о чём речь.
50
55
65
83
90
101
107
Но бывает и другое, и тоже не редкое, примеры выше.
===== Перейти к комментариям
Галлюцинации (2024-04-14)
Предыдущие опыты с "ультракороткими" описаниями дали интересные результаты. Обозначился ряд моделей, которые, если можно так сказать, очень эффектно галлюцинируют. А именно, выдают самые разные по направленности картинки в ответ на короткий запрос.
Дело, конечно, не в краткости определения, а в том, как тренировалась модель. Неожиданный всплеск "галлюцинаций" в ответ на описание "sound of silence", "звук тишины", объясняется именно этим: в рамках свободы творчества (коэффициента CFG) модель находит более или менее весомые цепочки ассоциаций, которые и разрастаются в очень странные картинки.
Чемпионы по части галлюцинирования, среди моделей на CivitAI:
LEOSAM's Hello World
Copax Art Brush
ICBINP ("I can't believe it's not photo" — "Поверить не могу, что это не фото")
Lah Mysterious
Epic Fantasy Vision
Составлять списки моделей в данном случае дело неблагодарное (очень уж быстро меняется ситуация в этой отрасли — SD 3 уже не за горами), но упомянутые модели с очень живым воображением также входят в список тех, что я отобрал для работы (куда входят также Proteus RunDiffusion, Crystal Clear Lightning, Cinematix, Lightning Bloom, Real Good Fast Pass, Realism from Hades, Real Vis, WLOP Style и Zavy Chroma, всего изучено 50+ моделей).
Ну а теперь сами картинки (все построены на модели LEOSAM's Hello World, легко найдёте на CivitAI).
Через Вселенную
Дивный новый мир
Сумерки времени
Полёт воображения
Бесконечная рекурсия
Страна тайн
Главное чудо дня
Иной мир
Чудо света
===== Перейти к комментариям
Звук тишины (2024-04-07)
Песню "Звук тишины" ("Sound of silence") наверняка знают все, пусть даже не зная ни названия, ни исполнителя. Для архива: оригинальное исполнение (Simon & Garfunkel), исполнение Gregorian
В целом и общем короткие определения дают стохастические результаты. В данном случае на выходе есть несколько типичных результатов: лодки, река в лесу, река на фоне гор, портреты, дома и "всякое странное".
Текст определения: extremely detailed, oil painting, sound of silence, by Greg Rutkowski and Tyler Edlin
Сами картинки ниже. Заголовки условные, поскольку электронный художник именно так "увидел" звук тишины.
Пагода
Лес
Корабль
Корабль-дом
Воздушный шар
Вечер на Югготе
Мягкая посадка
Закат в лесу
Дом-дерево
Портрет
Дерево на холме
Трое в лодке
Закат над рекой
Ущелье
Извержение
Древняя раса
Дом у ручья
===== Перейти к комментариям
Дополненная реальность (2024-04-04)
Логично звучали вопросы, почему в предыдущем посте (см. ниже) итоговые картинки не имеют ничего общего с оригиналом. Ниже краткое пояснение.
В инструменте "img2img" (картинка в картинку) SD использует минимум два параметра, чтобы обозначить, насколько итоговая картинка близка к оригиналу. Первый уже известен, CFG, очень упрощая — насколько двигатель будет придерживаться описания, а насколько — следовать своей "фантазии" (чем выше коэффициент, тем более послушным будет двигатель).
Вторым, специфическим для "картинки в картинку", является т.н. коэффициент подавления шума (denoising strength), вещественное число от 0 до 1 (0: двигатель не участвует; 1: двигатель может вносить произвольные правки). Судя по сказанному ранее, "шумом" является исходная картинка.
Выяснилось, уже экспериментально, что важным фактором также является число шагов синтеза изображения. В предыдущем случае я использовал скоростную модель ("Lightning"); она характерна тем, что работает только с низкими коэффициентами CFG и с малым количеством шагов (и в среднем, даёт изображение худшего качества за счёт значительного увеличения скорости работы).
На этот раз взята модель типа SDXL (Juggernaut RunDiffusion), но не скоростная. Итоги см. ниже.
1. Обработка фотографии. Исходная картинка:
Текст определения (во что переделываем): extremely detailed, oil painting, close-up portrait of middle-aged wizard, calm smile, fantasy, majestic mansion in the background, by Tyler Edlin and Nick Avallone
Итоги ниже (числом обозначен коэффициент подавления шума, при прочих равных условиях).
При подавлении шума ниже 0.35 двигатель, по сути, себя почти не проявляет. Резкий скачок изменений происходит между 0.45 и 0.60. Всё, что выше — по сути, уже в чистом виде фантазия двигателя, ничем не похожая на оригинал (примерно так выглядят итоги работы со скоростными моделями).
2. Дополненная реальность. Исходная картинка (фото поблизости от места, где я живу):
Добавляем воздушный шар в небе (коэффициент 0.45):
Добавляем сторожевую башню (коэффициент 0.45):
Если поиграть определениями при диапазоне 0.4-0.5, вполне можно убедительно "дополнить реальность", внося минимальные искажения и порождая более или менее реалистичные новые подробности.
===== Перейти к комментариям
А у вас всё лицо зелёное! (2024-04-01)
У SD есть функция создания картинки на основе другой картинки. Признаться, я был бы рад прочесть сейчас длинную лекцию по использованию этого инструмента, но...
Так получилось, что просто захотелось посмотреть, насколько хороши будут производные картинки. Источником было фото меня любимого (но новоязе "селфи"), но первым же делом я применил к ней скоростную модель... и понял, что картинки замечательные (сами посмотрите), в т.ч. с точки зрения анатомии, но в качестве учебного материала ничего не стоят: у нейронки, в случае скоростных моделей, практически невозможно выставить настройки, при которых исходное изображение будет очень понемногу трансформироваться в считанное. В данном случае есть магическое значение соответствующего коэффициента (снятия шума, denoising strength: 0 — полное отсутствие свободы воли нейронки, 1 — максимальная свобода), что изменение даже в четвёртом знаке после запятой меняет картинку радикально (и не очень интересно).
Так что лекция будет потом.
В качестве иллюстрации: картинка ниже получена из той, что левая нижняя в коллекции выше, при изменении коэффициента с 0.75 до 0.74:
Польза, кстати, всё равно есть: можно генерировать аватарки, тоннами. И вполне себе приличные.
===== Перейти к комментариям
Персонажи: Тень
Соблазн начать, наконец-то, подбирать приемлемый облик для персонажей был давно. Теперь, когда с вычислительными мощностями всё приемлемо, задача вылилась в неожиданный аспект — найти и описание, и оптимальную модель для опытов.
Что ж, лиха беда начало.
1. Первое знакомство
Это Тень. В миру — Эсстер Аратрин ан эс Метуар, антагонист и протагонист "Ступеней из пепла", последовательно.
Эсстер появляется только в третьей (из трёх) частей книги, но при этом вызвала наибольшее количество обсуждений: и в связи со своей "должностью" — голос и воплощение подлинной Тени, Стража мрака, владычицы царства мёртвых и распорядителя их судеб (по принятым во множестве культур Шамтерана поверьям, Тень может возвращать умерших в царство живых, Средний мир, если те сами отыщут себе дорогу).
Воскресает после смерти (в книге — после ножевых и огнестрельных ранений, а также, в финале, после смерти от старости). Однажды (и она это знает) её призовёт на окончательную и бессрочную службу подлинная Тень, и отказаться не получится.
Умеет крайне быстро перемещаться в отсутствие света, её мышечная реакция превосходит реакцию обычного человека в несколько раз. Обладает рядом других черт, свойственных подлинной Тени — например, в состоянии подчинить почти кого угодно своей воле.
При всём этом, оказывается человеком чести и способным на самопожертвование — пусть даже с ужасными манерами, пренебрежением к правилам и стремлением делать всё по-своему.
Через три года после событий книги у Эсстер родилась дочь, Вессен (тоже, по иронии, выбравшая путь Тени — правда, уже технологическим вариантом, безо всякой мистики).
Не все, кому довелось увидеть Тень так близко, сумели потом поведать об этой встрече.
2. Подлинный облик
По книге, Тень с лёгкостью принимает произвольный облик (не уточняется, насколько она меняется внутри, если облик мужской). Тем не менее, с какого-то момента выглядеть самой собой стало для Эсстер привилегией: её первую госпожу раздражал и облик, и голос подлинной Эсстер.
Эсстер, невзирая на происхождение (прямая наследница малого дома в Тегароне, что само по себе даёт немалые привилегии и в стране, и среди другой родни), несмотря на хорошее образование, с самого начала пренебрежительно относится к правилам и законам, обожает авантюры. Что, собственно, и закончилось для неё потерей свободы.
Отрывок из книги:
— Вы всё знаете, — огорчилась Тень, отходя в сторону. — Зачем спрашивали?
— Только что догадался. А одежда, в гардеробе у Май — тоже ваша?
Тень хлопнула себя по лбу.
— Надо будет попросить, переодеться как-нибудь. Всё равно она ей мала. А мне хочется выглядеть красивой.
— Вы и так красивы. Очень красивы.
— Не я, а Госпожа. Сама я... вот, смотрите.
Тень отвернулась. Через некоторое время повернулась вновь. Худенькая, светлолицая. Веснушчатое круглое лицо, большие зелёные глаза, тонкие губы, рыжие лохмы — стожок сена на голове.
— Видите? Пугало...
Тень вновь отвернулась и через несколько секунд вернула облик Майтенаринн.
— Вы и сами красивы. Нет, правда. Кстати, можно попросить об одолжении?
3. Подлинная Тень
Подлинная Тень, владычица царства мёртвых и распорядитель судеб тех, кто умер, появляется в книге дважды. В третий раз её встретит уже Лас, в "Книге Снов". Поскольку в Тень, в той или иной мере, верит большинство населения планеты, вызвать Стража мрака, так сказать, в гости, получилось неожиданно легко. О последствиях, как водится, никто не думал.
Оба раза Эсстер служит обликом, вместилищем подлинной Тени. Во второй раз Страж мрака разрешила своему "агенту" услышать разговор.
Отрывок из книги:
— Май, Лас, — позвала Тень. Солнце уже село; Лас и Май сидели у небольшого розового куста, на поляне. Семь цветков светились в быстро наступающей темноте. — Идёмте, мы ждём вас. Скоро будет ужин.
Лас кивнула и встала, протянув руку Май. Та приняла, поднялась... оглянулась на Тень.
— Лас... похоже, у неё ко мне разговор. Извини.
Ласточка кивнула вновь и убежала.
Сумрак сгустился над Тенью.
— Госпожа, — Тень заговорила первой. Глаза её светились красным. — Я приняла ваше приглашение... из любопытства, не скрою. Появляясь здесь, Я нарушаю обещание не вмешиваться в дела Среднего мира. Но Меня так давно не приглашали от чистого сердца... Прошу вас впредь быть осмотрительнее, когда вы позволяете явиться подобным Мне.
Майтенаринн кивнула, хотя сохранять самообладание было непросто. Непросто было общаться со сгустком тьмы.
— Я, настоящая Тень, не имею права помогать вам непосредственно. Вы должны справиться сами.
— Понимаю и не прошу ни о чём.
— На прощание, Майтенаринн. Когда вы предстанете передо Мной, сочту за честь лично выбрать достойную вас дорогу. Но не торопитесь ко Мне, прошу вас.
— Прощайте, Страж мрака.
— До встречи, Майтенаринн. Та, что остаётся... будьте к ней снисходительны.
Интересующимся: изображения построены на моделях, последовательно: realismFromHades_XLLightning, realVisXLV4.0 _Lightning, proteusRunDiffusion_withclip. Вы легко найдёте их на CivitAI точка com.
===== Перейти к комментариям
Только о прекрасном (2023-03-24)
В день общенационального траура — только о мирном и прекрасном.
Ангел и дитя
Бабочка
Танцовщица
Улыбка
Вихрь чувств
Путешественница
Фермер
Лис
Девушка в шляпе
Верный пёс
Пантера
Возвращение домой
Олень
Тропа в неведомое
Тигр
Где-то во сне
===== Перейти к комментариям
Протей и ворон
Стоило упомянуть в предыдущем выпуске, что модели часто меняются, как почти сразу же попалась на глаза модель «Протей» от компании RunDiffusion (угадайте, что именно она разрабатывает).
Ниже приведены некоторые пробники, которыми я проверяю теперь каждую модель. Общие параметры создания изображений такие:
Алгоритм сведения: DPM++ 2M Karras
Шагов: 30
Коэффициент CFG: 5
Пропуск CLIP: 2
Размер: 1216x832 (или наоборот)
Модель класса SDXL, но не скоростная, просчёт длится относительно долго. Во всех случаях ниже описание, с учётом рекомендаций на сайте, выглядит так:
extremely detailed oil painting, СЦЕНА, score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up
где «СЦЕНА» относится к собственно данной картинке. Т.е., это всё «картина маслом», что отражается на чёткости и технике. Об остальном судите сами.
Сторожевая башня
Знамение
Девушка в саду
Вишнёвое дерево
Дракон
Чёрная роза
Солнечные часы
Зеркало
Летучий Голландец
Орк в замке
Джентльмен на прогулке
Замок на холме
Будни Машинариума
Майнкрафт
Дом ведьмы
Чеширский кот
Nevermore
Бабочки
Модель очень качественно работает во многих областях, как вы только что сумели увидеть. Даже без указания стиля художника и конкретной техники (понятно, что мышь стоило изобразить в мультипликационном стиле). Аниме, если что, модель тоже умеет.
Так что спасибо коммерческой компании за этот подарок сообществу.
Любопытно, кто сумеет хотя бы примерно угадать текстовое описание для изображения «Зеркало» (подсказка: там пять слов).
===== Перейти к комментариям
Орки, просто орки
В дополнение к предыдущему посту — коллекция разных пробников и невостребованных картинок с орками Варкрафта.
В первой картинке удалось совместить визуализацию двух игровых вселенных: "World of Warcraft" и "Amnesia: The Dark Descent".
Замок Александра Бренненбургского
Остановка в городе
Горной тропой
Прогулка по реке
Орк. Джеймс Орк
Перед сдачей проекта
Носки для внуков
Учения
Всё для фронта
Гуру с мечом
Гуру с хлопушкой
На пенсии
Согласитесь, и мальчики, и девочки хоть куда!
===== Перейти к комментариям
Молниеносные орки
Кто посещает коллекцию моделей для SD на CivitAI, тот в курсе, что минимум раз в 2-3 месяца там происходит серьёзное обновление корпуса моделей. Конкретно сейчас появилось множество т.е. «Lightning»-моделей («lightning» — «молния»), относящихся к методике «дистилляции» моделей, после которой возможен просчёт картинок приемлемого качества за малое количество шагов. Как следствие, время просчёта может значительно сокращаться, в случае моей аппаратной части — до 5-6 раз по сравнению с оригинальной моделью.
Параллельно меня попросили просчитать несколько картинок с персонажами-орками (из вселенной Варкрафта, это существенно).
Ну, всё и заверте... Картинки вы можете посмотреть, нажав на соотв. ссылку в поле «Примечание» (буква обозначает пол персонажа). Орки-мужчины в тренировочном лагере, и орки-женщины на прогулке в лесу.
Модель
Алгоритм сведения
Количество шагов
CFG Scale
Примечание
DreamDiffusionXL-Lightning
DPM++ SDE
8
2
М Ж
DreamShaperXL-Lightning
DPM++ SDE Karras
6
2
М Ж
HelloWorldXL-LightningEulerA
Euler a
8
1
М Ж
JuggernautXL-Lightning
DPM++ SDE
4
2
М Ж
LightningBloom-XL
DPM++ SDE
4
1.5
М Ж
LightningFusion-XL
Euler a
10
1
М Ж
MjollnirXL-Lightning
DPM++ SDE
4
2
М Ж
Realgood-Fastpass-Lightning
Euler a
8
2
М Ж
RealisticFantasyMix-XL
DPM++ SDE
8
4
М Ж
RealisticStockPhoto
DPM++ SDE
8
3
М Ж
RealVisXL-Lightning
DPM++ SDE
4
2
М Ж
SinteticoXLL-Lightning
Euler
8
1
М Ж
WildcardXL-Lightning
DPM++ SDE
6
1.5
М Ж
Скоростными являются только те перечисленные модели, у которых в названии есть соответствующая строка (Lightning).
Самыми быстрыми оказались Hello World, Real Vis и Realgood. Что до качества... Судить сложно, но я пока буду придерживаться, при прочих равных, RealVis, Juggernaut и Hello World.
===== Перейти к комментариям
С 8-м Марта!
Всех женщин поздравляю с международным женским днём 8-го Марта.
Пусть каждый день в вашей жизни будут любовь, счастье, удача и оптимизм — а в этот день пусть их будет просто немного больше.
Тепла и процветания вашему дому.
Персоналии: Абра Давенир (2024-03-03)
Начинаем представлять главных героев "Легенды о принцессе Давенир".
Абра Давенир, архив Исторического факультета университета Мискатоник, 1927 год, Аркхем, Массачусетс. 20 лет, студентка Кафедры древней истории Исторического факультета, участница экспедиции на хребет Майоринк ("Хребет Дариана").
12
16
17
19
26
27
Фото в парке кампуса университета Мискатоник, 24 августа 1927 года.
(пока не решил, которая будет основным фото ГГ)
Изображения сгенерированы в SDXL-Turbo, модель RealVisionv5-Lightning, время просчёта 1.35сек на картинку (768x1024)
===== Перейти к комментариям
Легенда о принцессе Давенир (2024-03-02)
«Сотрудничество» с чат-ботами (Gigachat, ChatGPT, StableLM, Pygmalion и сервисом Replika) дало неожиданные итоги.
С «творческой помощью» ботов создался и вырос в полноценный синопсис проект романа, рабочее название «Легенда о принцессе Давенир».
Место и время действия: Аркхем, Массачусетс, 1927-й год.
Студенты университета Мискатоник Абра Давенир и Говард Гленн, делающие свои дипломные работы на основе одних и тех же материалов научных экспедиций университета, приходят к выводу, что за легендами о канувшем под землю городе-государстве Дариане, к востоку от города, есть более чем веские фактические свидетельства.
Расследование этих материалов выливается в новую экспедицию в систему пещер, над предполагаемым местонахождением легендарного Дариана, следствием которой становится череда необычных и далеко идущих последствий и для исследователей, и для города, и, вероятно, для всей Земли.
3
4
6
11
12
16
31
36
Изображения просчитаны в модели ZavyChroma XL. На иллюстрациях — принцесса Ульвен Маорин Давенир ар-Дариан после получения печальной вести от гонца.
Поздравляю, теперь в работе не три книги, а четыре.
===== Перейти к комментариям
Турбо-реализм (2024-01-03)
Пока мы тут бьёмся за оливье и прочее культурное наследство, технологии искусственного интеллекта не стоят на месте. Если вы ещё ни разу не заглядывали на сайт StabilityAI (создатели Stable Diffusion, SD — сайт на английском языке), то самое время восполнить этот пробел. Подсказка: там не только достигли ускорения работы SD, об этом ниже, но и очень быстро осваивают другие генеративные направления: текст, музыка, видео, 3D моделирование и так далее.
Об этих направлениях речь когда-нибудь потом, а пока что самое важное о SD: там не только освоили высокое разрешение и умение бороться с известными дефектами картинок (SD XL), но и разработали существенное ускорение алгоритма построения картинки по описанию.
Если совсем на пальцах: новая, доступная с уже существующими обёртками модель SD XL Turbo позволяет генерировать изображения размером 768x1024 примерно за 0.8 секунды каждое там, где прежде на это уходило секунд 8-10. Понятно, что это очень примерная оценка, и всё зависит от описания, «железа» и конкретного разрешения картинки.
Соответственно, порождённые от SD XL Turbo модели также показывают существенный прирост скорости, при этом очень выигрывая в качестве.
Посмотрим на примеры. Созданные ниже картинки считались в разрешении 768x1024 от 3 до 5 секунд (NVidia RTX A4000, AMD Epyc 2GHz с 8-ю ядрами, 32 Гб DDR5) при использовании модели RealVisionXL_Turbo.
Для чистоты эксперимента я делал ровно один просчёт картинки по тому же самому описанию (т.е., не делал традиционно: просчитать несколько десятков вариантов и выбрать 1-2 годных). Ясно и понятно, что конечности и анатомия — всё ещё слабое место генеративных моделей; о том, насколько всё изменилось, судите сами.
Звёздное небо
Девушка у обрыва
На тропинке в саду
Городская аллея
Культист
Алиса Листьева
На репетицию
В кафе
Вы могли обратить внимание на осмысленные надписи: «Heat» у Алисы Листьевой и «Hero» у девушки в кафе. Это тоже новое свойство модели: можно задавать вполне определённые текстовые строки, взамен того случайного набора символов, который обычно получался.
Картинки ниже получены на базе той самой модели SD XL Turbo (алгоритм сведения Euler a, разрешение 768x1024 или 512x512, 1 прогон сведения, дискриминатор (CFG) 1).
Хвойный лес ночью
Деревья на скале
Замок
Дом в лесу
Причудливый особняк
Хребты безумия
Пустынная роза
Едем дальше.
===== Перейти к комментариям
Архив блога за 2023 г.
↓ Содержание ↓
↑ Свернуть ↑
|