YouTube to Text Converter

Transcript of Flux USO - переносим стиль с одного изображения на другое. Бесплатно, локально в ComfyUI.

Video Transcript:

Никогда ещё копирование стилей не было таким простым. И вот опять всем привет. С вами я, Генератин, канал, который на практике показывает, как пользоваться локальными нейросетками бесплатно и в кайф, и не продаёт тебе шиткурсы и онлайн-марафоны с нуля до про. Но я считаю, что это лайк. Но конючат донаты. Китайцы опять наваливают в open source угля. На этот раз эти наши ребята из Byance, они взяли и сделали прикольную штуку, прикольную модельку, обучив её на архитектуре флюкса, с помощью которой ты можешь генерировать изображение, используя за основу стилистику референсных изображений. То есть ты кидаешь изображение, референсное изображение, оттуда берётся колористика, оттуда берётся в целом стиль и создаётся новое изображение. То есть, если раньше мы, а, подглядывали друг у друга стили в прантах, что, как, кто там пишет, то теперь достаточно входного изображения. Ты просто кидаешь стилёвое изображение и получаешь картинку, ну, примерно в том же стиле. И это всё работает довольно быстро, бесплатно и локально в Кофе UI, в моём любимом, да, и сегодня мы, естественно, это посмотрим. Кому это может быть полезно? Ну, во-первых, дизайнером, во-вторых, арт-крейторам, которые там создают кучу изображений или просто работают с изображениями. Прямо нравится рисовать в нейросетках. А тем же самым сэмэмщикам просто и энтузиастом, ну, просто потрогать, посмотреть, что такое существует. И, конечно же, мало того, что мы сегодня это установим, посмотрим, как это работает, будем смотреть на примере гнгста бабки. Кстати, э сорян, что я сегодня в кепке. Я так торопился записать это видео для вас, что, а, просто не помыл голову, поэтому прячу свои немытые патлы под кепочкой. Хорошо. Кратенько-кратенько, буквально тезисно, немножко теории. Что такое уса? А, короче, унифицированная модель для генерации стилей и объектов от Bй dance, которая теперь нативно поддерживается в Комфе. И что она умеет? Во-первых, она у неё есть три режима генерации. генерация на основе входного изображения, где ты просто подаёшь, не знаю, там вот на примере гст бабки будем подавать бабку и получать, короче, бабку в разных объектах, в разных сетнгах, да. Генерация на основе стиля. Это когда ты подаёшь бабку и стиль, и стиль забирается на картинку этой бабки. И когда ты когда ты подаёшь просто стиль и протом генерируешь изображение в том стиле, в который аа который ты хочешь скопировать. Соответственно, все ссылочки на все Workflow, на модели, на страницы, где что можно почитать, всё будет в описании. Никаких закрытых ТГ-каналов и бустей, вот это всё открыто, всё будет в описании. Если что, идёшь туда. Там же в описании есть тайм-коды, чтобы в случае чего можно было пересмотреть видос. Если что-то непонятно, обязательно в комментах задавай вопросы. Я стараюсь отвечать, а, практически на все комменты и помогать решать практически все вопросы. Также мои зрители тоже этим занимаются, за что им большое спасибо. Ну а теперь погнали к установке. Как я уже сказал, а эта модель нативно интегрирована в Кофе, поэтому для установки тебе понадобится а последняя версия Conf UI. Если он тебе установлен, просто обновить до последней версии. Если не установлен, можно установить, короче, portable версию или через инсталлятор, как у меня, через Stability Matrix, да, инструкций в интернетах просто два вагона и маленькая тележка о том, как установить Confi UI. Итак, вот у нас установлены confui обновлённый до последней версии. Мы, соответственно, идём вот сюда. Workflow templates Brow Templates. Здесь выбираем вкладку Flux. Здесь ищем вот такое Flux 1DF USA Reference Image Generation, да, и открываем этот workflow, поскольку это нативная, а, нативная поддержка, красных нот здесь не будет, всё будет работать прямо из коробки. И если у тебя вот здесь вот в brows Templates, да, здесь вот у тебя случайно нет вот этих темплейтов, вот этого темплейта, который нужен, ссылочка на Workflow есть в описании. Ну, на всякий случай, не у всех при обновлении Кофиявляются [музыка] темплейты. Так, ну вот, хорошо, мы открыли этот workflow. Что? Давайте посмотрим. У нас, во-первых, здесь целых два workflow. Один вот выключен пока что, второй вот пока что включен, соответственно. Мы будем рассматривать оба Workflow, потому что они оба нужны. Они каждый за что-то своё отвечают. И общее правило для всех этих workflow, вот здесь вот есть а заметочка, в которой есть ссылка на все модели, которые используются в этом workflow, которые необходимо скачать. Нажимаешь на ссылочку, модель падает в загрузку. Потом эту модель, эти модели нужно положить вот в эти папочки, если у вас они там ещё не лежат. Не лежат. В папочке con UI есть папочка models. В этой папочке models есть папочка Checkpoints. И в неё нужно положить вот эту модель. Соответственно, в папочке confi, в папочке models, в папочке Lorс нужно положить вот эту модель и по аналогии со всеми остальными. И вот когда ты скачал, положил все модели в нужные папочки, не забудь обновить workflow, потому что кофи тут перезапускать не надо. обновить workflow, чтобы она увидела, что что-то там в папках изменилось. И после этого каждый раз, когда ты используешь новый для тебя workflow, незнакомый, прокликай модели, чтобы убедиться, что они точно находятся тут, что они выбрали выбраны, что у тебя не будет какой-нибудь ошибки. Всё, я все модели прокликал, всё отлично работает. Ну и теперь самое интересное. Давай посмотрим, как это работает на живых примерах и поэтапно. Первое, что мы будем пробовать - это, а, генерация на основе референсного изображения. То есть мы берём какого-то персонажа и перемещаем его в другие локации, в другие сетинги. Для этого в первом workflow мы отключаем вот эту штуку, потому что нам пока не нужен reference style. Выделяем ноды Ctrl B или правой кнопочкой BYP. И сюда закидываем наше референсное изображение. Референсным изображением у нас будет бабка. На каком-то стриме мы её сгенерили или где-то, короче, она использовалась. Короче, бабулька НК, бабулька, вот это будет использоваться. И смотрите, мы даже, я даже не меняю дефолтный промт, который здесь а находится европейская девушка, что-то там бла-бла-бла-бла-бла-бла и сидит в каком-то поле. Всё, я закинул бабульку. Я ожидаю, что эта бабулька перенесётся, собственно, а, в локацию по этому промту. Мы жмём run, и пока она генерится, я объясню, что куда. Во-первых, вот здесь у нас степ один. В этом блоке у нас грузятся модели. Load checkpoint, понятно? Load Loader model only. Здесь вот грузится вот это вот а USA lora. Здесь ещё одна модель USA грузится. И здесь Load Clip Vision - это тоже грузится модель, которую все скачали. Ну, короче, этот блок отвечает за загрузку моделей. Дальше вот здесь у нас вот есть Step Two - это наше референсное изображение. Здесь даже upscale какой-то прикручен. А степ 3 - это референсное изображения. И степче image size - это здесь у нас задаётся размер изображения, которые мы хотим получить на выходе. А здесь у нас, соответственно, задаётся позитивный промт. Я напомню, в Афлюксе нет негативного промта, поэтому он выражен вот так. Zero conditionition out. И здесь у нас настройки сэмплера, то есть контроль после генерации, а фиксированный, сит у нас фиксированный, количество шагов 20, CFG 1.0. Можно особо здесь ничего не менять. Э, здесь и так всё работает хорошо из коробки. Также есть пояснение про Eas Cas. Что он значит? Вот здесь прочитать можно. Я настоятельно рекомендую читать все пояснения. Также вот здесь тоже два пояснения есть, которые тоже неплохо бы, с которыми тоже неплохо бы ознакомиться. И вот, как я говорил, мы закинули нашу бабку. Вот бабулька. Промт не меняли, потому что там девушка сидит в прекрасный солнечный день на поляне с цветами. И вот наша бабулька сидит в прекрасный солнечный день на поляне с цветами. Это вот референсное изображение. Это первый способ, а, использовать, собственно, этот флюкс УO. Ну, типа бабка и бабка в цветах и в цветах. Хочу, посажу на луну её, хочу посажу её, не знаю, в горящую избу, из которой она будет выходить и выносить коня с мужем на руках. Но мы же говорили в начале про то, как можно воровать, в смысле использовать, использовать, а, вдохновляться чужими стилями. Для этого мы переходим а к следующему нашему пункту- это референсовые изображение плюс стиль. Мы включаем обратно вот эти вот ноды и сюда наваливаем стиля. Соответственно, я с сивитая просто взял рандомных картинок. Вот они просто рандомных картинок надёргал и стиль, в которых можно посмотреть. И вот просто вот наваливаю картинку со стилём. Жму ран, оно отправляется в работу. Работает это так же быстро. как и обычная флюкс. То есть у меня это примерно минута на моей шестнадцатигиговой карте, да? Соответственно, у вас скорость будет зависеть от размера картинки и от вашего железа. Ещё раз давай посмотрим, что что у нас здесь происходит. У нас здесь есть бабулька, как исходное изображение, и есть референс на стиль. То есть я ожидаю, что это будет примерно какой-то чиби аместайл, ну или хотя бы колораж такой же будет. И вот у нас закончилась. У нас появилась такая кривая бабулечка. Ну потому что у меня сит стоит фиксированный. Лучше, наверное, рандомный поставить. Но в целом стиль примерно передался. Давайте поставим вот здесь вот в сэмплере рандомный сит. Давай навалим ещё другого. другого стайла. Ну его, собственно, мы опять навалили стили. То есть у нас здесь такой ЧБ, да, понятно, что здесь двойная перспектива, но её надо прописывать в промте. Здесь у нас бабулька, да, и в целом мы получили, а такой же колораж, как и на на референсе стиля. Ну и, естественно, у нас она более молодая, потому что в промте у нас европейская девушка. Давайте заменим на старую Деву Old Lady. Ну, чтобы у нас промт совпадал э с референсным изображением, да. И навалим ещё какого-нибуд стиля. Ну, например, вот это. Ну вот мы закинули новый стелёк, получили вот такую картинку. И опять же я, что я хочу сказать, это флюкс уса - это не копирование композиции изображения, да, потому что здесь композиция, здесь девушка разрисована прямо вот какими-то это копирование стиля, в котором нарисовано, и модель сама определяет стиль, если ей сильно не помогать, потому что вот здесь я в комте сильно ей не помогаю. Как она определяет, так и определяет. То есть она определила, что это что-то тёмненькое, жёлто такое бирюзовое с жёлто-бирюзовыми оттенками. Вот, пожалуйста, такое вот затемнённое изображение. А бабульки-то и получилось. Хорошо. Теперь можно ли навалить сюда микс стилей? Ну, типа два стиля, три стиля, больше, да? Для этого включаем второй референсный стиль, да? Наваливаем, например, сюда. Ну, давайте что-нибудь другое. Давайте вот сюда вот это навалим, а сюда вот это навалим. И опять генернём. И мы ожидаем получить микс. Микс двух вот этих стилей. И мы получили микс вот этих двух стилей в виде вот такого. Ну, как видим, что на картинке больше превозобладает вот вот первый стиль, да, первый стилёк он больше, потому что здесь в целом-то очень много чёрного и модель в целом, наверное, ухватилась за чёрное, да. Вот получился вот такой стиль. Можно ли сюда навалить больше стилей для референсного изображения, чтобы вот ты это изображение переделал с большим количеством стилей, с большим миксом? Да, можно просто мы вот это вот берём. Не так. Просто мы вот это вот берём. Ctrl C, Ctrl V, например, Ctrl V. Ещё два докидываем. И нам просто нужно их соединить, соответственно. А все вот эти инпуты заполнить. Они тянутся прямо от модели. Прямо тянем вот сюда в эту ноду и в эту ноду, да? И потом соединяем вот так вот. Моду. Моду. И отсюда тянем. Сейчас подтяну. Тянем вот сюда на вход. Всё. И вот они у нас соединены последовательно. То есть так можно накидать кучу-кучу стилей для экспериментов и миксов. Пишите обязательно в комменты, как вам, что у вас получалось, хорошо ли работает, плохо работает, что вы думаете вообще по этому а инструменту. И это ещё не всё. Теперь давайте посмотрим, как оно. Мы уже посмотрели два метода из трёх. Теперь посмотрим третий метод - это когда ты закидываешь просто стиль, а промтом, а, просишь что-то нарисовать. И пока мы не перешли дальше, маленькое объявление для моих, а, зрителей. Если вам нравится то, что я делаю, если вам нравятся мои видео, мои ториалы вам полезны, вам помогают мои подсказки в комментариях и вообще тащите тащитесь от нейросетей, хотите в этом а и дальше развиваться, я буду признателен вашей поддержке моего канала и моего творчества. У меня нет закрытых бустей, закрытых патреонов, э, приватных Telegramгруп, чатов только для донатеров и вот это всё. А я выкладываю всё открыто, всё бесплатно и по возможности всё в кайф. Но я буду очень признателен, если вы меня поддерживаете. А поддержать меня очень легко. Для этого можно воспользоваться ссылочкой в описании или QR-кодиком на экране. Сервис Donation Alerts. Представьтесь, напишите там что-нибудь интересное, кто вы, за что шлёте донатик. И это будет самая лучшая поддержка моего канала. Это самая лучшая мотивация для меня продолжать делать видосы, обзоры, разборы и туториалы для вас. Большое спасибо всем, кто уже поддерживает мой канал. Надеюсь, вас станет больше. И удачи тем, кто только начинает меня поддерживать. Я вам тоже буду очень признателен. Спасибо большое. Также не забываем ставить лайки и комментарии к этому видео, чтобы оно продвигалось на максимальное количество людей. Окей, с донатами разобрались, да? Я очень жду вашей поддержки. Прямо максимально максимальная поддержка. Взамен на максимальную поддержку я отправляю максимальные лучи добра и максимальные лучи любви. Итак, переходим к третьему способу, как это можно использовать, когда мы наваливаем только стиль. Вот для этого мы отключаем верхнюю часть нашего workflow, потому что оно нам не надо. И мы переходим в нижнюю часть вот этого базового workflow и включаем его, потому что оно нам надо. Здесь всё то же самое. Всё то же самое, только единственное. Вот сюда мы закидываем. У нас нет здесь референсного изображения, которое мы перерисовываем. Здесь есть только для стайла. Поэтому мы отключим один стиль и закинем пока только один стилёк. Ну, например, вот этот, да. И не будем менять промт, потому что здесь вот man dressed fashionaby. Ну, короче, мужик модно одетый. Жмём генерацию. И я надеюсь, что вот тот промт, который здесь написан, вот этот, сейчас нам мужчину сгенерит вот в этом стиле. Ну или, во всяком случае, а в какой-то цветовой палитре похожей. Ну и вот что у нас получилось, да? Вот мужик довольно фшенабельно одет. Вот у нас исходный арт. Ну, в смысле, референс стиля, да. Ну, по стилю в целом похоже, да? Давайте навалим ещё что-нибудь. А, ну давайте вот этот вот. Раз там у нас не зацепилось, может здесь зацепится. Вот прошла генерация. Мы получили примерно такую же композицию. То есть какой-то тёмный фон мужик стоит. Давайте посмотрим на референс. Вот такой такой, ну, какби анимешный стиль, да, довольно красивая композиция, да. И вот здесь мы тоже получили какби анимешный стиль и вот такую композицию. То есть неплохо. И здесь также, как и в верхнем workflлоow, здесь также можно наваливать микс стил стилей. То есть мы берём, например, ну, давайте, мне вот этот понравился, и закинем второй стиль. Пусть будет вот этот. И жмём. Ну и вот наш результат. Вполне себе крутой мужик в крутом стиле. Но опять же, я вижу большое влияние вот этого стиля, этого стиля влияние значительно меньше. Но опять же, это всё можно регулировать, а, прамтом. Ну, как регулировать, в смысле, подсказывать модели через промпт. А что ей лучше брать? Не в смысле бери первый стиль или второй стиль, а прямо в промте писать, что там, например, у него, а, серебряная там какая-нибудь э курточка блестящая. Ну хорошо, мы посмотрели все три варианта использования USO. Я обращаю ваше внимание, что я очень, я настоятельно рекомендую всё-таки зайти к ним на страницу и посмотреть, вот здесь вот у них есть целая здоровая картинка с примерами, как это можно применять. Типа вход, вход, результат, вход, вход, результат. То есть вот это всё открыть картиночку в большом разрешении и внимательно её изучить, чтобы вы понимали, что ещё Уса умеет. Но в целом у неё вот три вот таких направления. Три направления, которые она может, в которых она может работать. Ну давайте теперь, э, подведём какие-то выводы и посмотрим на маленький бонус. А выводы у нас получаются такими. Работает быстро, быстро, так же как и любая модель. А генерит прикольно, прикольно. можно держать консистентность персонажа, перемещать его по разным стилям, но а мы понимаем, что эта модель всё-таки не для того, чтобы ты полностью скопировал композицию. То есть оно возьмёт цветокоррекцию, какие-то там мазки, вот это вот всё. А основные грубые черты со стиля, которые ты туда наваливаешь, да, но она не может полностью перенять композицию. Эту композицию надо подсказывать ей прамтом. Ну, то есть почему не получилось, например, когда вот это вот открыли? Почему наша бабулька не была так разрисована? Потому что надо было в промте дописать, что я хочу конкретно, какие изменения я хочу внести в картинку, и она бы тогда, а, промт плюс стиль работает лучше, чем стиль. Я показывал просто грубо, не изменяя промт, просто накидывал стили, чтобы посмотреть, показать, как оно работает. Ну, прямо в базе, прямо грубо. По сути, совершил ошибку новичка специально, да. Далее. Нативная интеграция в Кофе позволяет вот просто запускать это моментально быстро и из коробки. И как я обещал, бонус в конце, да? О'кей, можно вот копировать чужие стили, но для для флюкса, когда он только вышел, вообще появилась появился замечательный ресурс, который я не знаю, знаете вы его, не знаете, но есть Flux Style Test Gallery. Здесь 622 стиля использовано с примерами промтов. То есть берёшь, копируешь и получаешь примерно вот такой в таком же стиле. То есть поле для изучения, для экспериментов великое. Ссылочку на этот ресурс, естественно, я оставлю в комментариях. Ну вот получился какой-то такой рассказ. Что хочется сказать напоследок, в послесловии? Обязательно попробуйте, поэкспериментируйте, напишите в комментариях, как вам нравится, не нравится, каких, может быть, впечатляющих результатов вы добились, или вы считаете, что этот инструмент полная фигня и не стоит внимания. Конечно же, прокачивайте свои навыки в изучении нейросетей. Обязательно поддержите этот ролик лайком и каким-нибудь комментарием, чтобы он показывался максимальной аудитории. Да, и я буду очень признателен, если вы поддержите меня и мой канал небольшим донатиком. QR-кодик есть на экране, ссылочка есть в описании. Donation Alerts наше. Всё. Спасибо большое за вашу поддержку. И генерируйте с нами, генерируйте, как мы, генерируйте лучше нас. Не верьте блогерам, которые пересказывают вам новости из Telegram-пабликов. Верьте практикам. С вами был я генератьон. Ещё увидимся. Покеда.

Flux USO - переносим стиль с одного изображения на другое. Бесплатно, локально в ComfyUI.

Channel: ЭйАй Генератьон

Convert Another Video

Share transcript:

Want to generate another YouTube transcript?

Enter a YouTube URL below to generate a new transcript.