Transcript of Florence2 by Microsoft - Powerful Prompt Generator in ComfyUI
Video Transcript:
Всем привет в этом видео речь пойдёт о текстово визуальной модели от компании Microsoft под названием Florence 2 эта модель обладает широким спектром возможностей Что позволит решать огромное количество задач в ваших тех процессах как обычно начнём с установки разберёмся с её возможностями и посмотрим на примерах Как это [музыка] работает установить Florence 2 в conf UI очень легко Для этого воспользуемся менеджером запускаем менеджер выбираем менеджер кастомных НОД здесь в строке поиска пишем Florence находим кастомную ноду confu Florence 2 и устанавливаем её нажимаем на Install после этого рестарт после того как мы перезапустили conf UI нам уже доступны ноды Florence выбираем ноду FL это главная нода с которой мы буде взаимодействовать Но для её работы нам также понадобится изображение воспользуемся но Image и также нам понадобится ещё сама модель Florence воспользуемся Ной Florence to Model Loader но пока что На данном этапе у вас этих моделей скачанных нет для того чтобы их скачать есть специальная нода которая называется с этой ноды можно выбрать из списка интересующую у вас модель нажать кнопку генерации после чего модель будет автоматически скачана и помещена в необходимую папку Но может произойти Так что модель не будет скачиваться Что делать в этом случае в этом случае идём на страничку github confi UI Florence 2 здесь находим список с моделями выбираем интересующую нас модель допустим Florence 2 базовая файлы и версия и скачиваем все эти файлы Ну главным образом нас интересует конечно же модель vch Model bin после скачивания ни в коем случае их не переименовывать копируем имя скачанные модели помещаем в папку здесь создам папку в ней создаём новую папку и вставляем скопированное имя Microsoft можно не писать помещаем сюда в эту папку скачанные файлы и после запуска модели у вас ещё автоматически появится Папочка кэш после этого возвращаемся в Кофи выбираем функцию Refresh node и после чего все пути будут обновлены к вашим моделям больше это нода нам не понадобится а модели скачанное будем грузить с помощью ноды Florence to Model Loader давайте для примера возьмём этого зайчика так на выходе мы имеем изображение маску описание и данные чтобы увидеть изображение используем preview Image чтобы увидеть маску используем ноду Mask preview для Caption any Show и для даты её же нажмём генерировать чтобы получить какой-то результат предварительный Пока что ничего не меняем Итак мы получили изображение с определившись на нём объектами собственно это rit и 1 и для них создана автоматически ма этим регионам но в описании и в данных мы видим какую-то несу разную штуку всё потому что этот режим не подходит для определения описания для получения описания текстового для того чтобы получить описание нужно сменить режим режим меняется в параметре выбираем здесь собственно описание нажимаем генерировать и мы получили описание два белых кролика держат подарок на снегу замечательно но у нас пропали изображения потому что этот режим не подходит для получения маски либо определения региона на изображении то есть для каждого для каждой нужной задачи есть свой режим также мы можем взаимодействовать с изображением с помощью текстового поля об этом расскажу немножко позже далее У нас идёт функция оставлять ли модель загруженный если у вас достаточно памяти рекомендую эту функцию всегда держать включённой Во избежание того что при следующей каждой следующей генерации у вас модель будет автоматически загружаться если базовая версия весит где-то около полу гигабайта то есть модели которые весят и больше 2 ГБ ну как бы лиш если видеокарта слабовата она в принципе автоматически будет выгружать эту модель поэтому можно в принципе всегда держать её включён эту функцию далее У нас идёт количество новых слов это относится к описанию то есть здесь мы можем ограничить описание если у нас будет использова большая какая-то моде или мы будем использовать здесь может получиться очень большой текст для того чтобы текст укоротить можно здесь указать допустим там 50 слов ну или там 100 неважно будет так пока что далее У нас идёт параметр Наби который отвечает за количество обращений к изображению то есть циклов чтения изображений для того чтобы получить корректное описание либо маску либо ещё что-нибудь вот в большинстве случаев 3-4 более чем достаточно особо это ни на что не влияет далее У нас идёт выбор маски вернёмся в режим регио Caption здесь мы видим что у нас здесь есть кролик но и Кролик о для каждо из них мы можем выбрать маску допустим Пускай это будет о чтобы не получить маску для обоих объектов мы можем определить один из них таким вот образом и последний параметр - это Сид сит здесь больше необходим для получения описания различного допустим Если мы будем использовать другое какое-то изображение будет Вот Маши детальное для этого изображения здесь мы получили некое описание если мы нажмём ещё раз генерацию и не зафиксируем Сид то мы скорее всего здесь получим отличающееся описание вот видим поменялся текст что не позволит нам Даже если мы зафиксируем сит в сэмплер то есть в генераторе изображений получать одно и тоже изображение то есть изображение будет всякий раз меняться для того чтобы этого не происходило мы можем зафиксировать этот Сид и всегда генерировать изображение на основе только одного описания также мы можем это описание легко скопировать использовать допустим это описание в окне с промпто а здесь получать всякий раз новое какое-то описание если Ну соответственно Мы каждый раз генерируем изображение а здесь видим о какое-то прикольное описание получилось или что-то более интересное новое или более подробное соответственно можем его скопировать вставить в текстовое поле для прота и здесь как-то его отредактировать допустим не Европейский город а Пускай это будет африканский город Ну или типа того я думаю суть понятна теперь рассмотрим эти режимы поподробнее так мы уже определились что регио Caption отвечает у нас за создание региона и создание маски по этому региону включим определение маски и допустим Пускай это будет Вот вот этот вот верхний цветочек 3 Flow нажимаем генерировать и получаем маску для этого цветочка Почему регионам маска это больше всё-таки вот этот параметр режим регио Caption относится всё же к видео чем к генерации изображений Ну также Это неплохой способ использовать это создани некого такого вот создания маски для Ита допустим Ну собственно вот так вот это выглядит на видео отслеживание объектов видим что регионами определились основные объекты машина персоны и собственно леопард или это гепард тоже Почему нет здесь Также можно выбрать допустим вот этот вот цветочек Пускай это будет двоечка видим что каждому региону есть описание если здесь Было просто слово допустим цветок т и там цветок цветок цветок то здесь более подробное описание для конкретного объекта подроб они под номером два И в видео если мы используем видеоряд то вот этот регион будет отслеживать объект в реальном времени то есть по видео ещё один вариант просто с числовым обозначением объектов допустим Пускай это будет Вот не пускай будет вот этот вот единичка вот этот цветочек мы выберем его и нажмём функцию генерации таким же образом на видео будут определяться различные объекты если мы выберем отслеживать один конкретный объект то и он будет автоматически отслеживаться так далее следующий параметр точнее следущий у то есть определение объекта основанное на фразе либо с как в данном случае rit мы получаем маску то есть регион по объекту rit так следующий режим у нас doc vqa для использования этого режима нам понадобится и соответствующая модель vqa Florence doq с помощью этой модели можно задавать вопросы и получать на них ответ на основе изображения с этого изображения допустим кто изображён на этом изображении и получаем ответ анимационный защи на этом изображении далее на этой же модели Florence tog vqa можно использовать режим то есть выборочно определять э информацию с изображения допустим здесь мы имеем бирку либо пдж может быть допустим какого-нибудь сотрудника компании с которым он может подойти допустим к камере прислонить этот пдж и по нему получив некий соответствующую некую соответствующую информацию можно понять кто это и с какими полномочиями этот сотрудник есть этим эджем допустим в данном случае владелец этого беджа может открывать запертый замок Также можно анализировать информацию и вычленять необходимую информацию допустим в данном случае это электронное письмо из которого мы на выходе проанализировав его с помощью режима прог анализ мы получаем информацию об отправителе этого письма в данном случае AD System и адрес USA таким вот образом Также можно распознавать текст и анализировать его в частности если это какое-нибудь произведение в данном случае это какое-то хотворение или типа того су и здесь мы выбираем режим prg mixed Caption Plus с помощью этого режима мы получаем короткий анализ содержимого этого текста то есть краткое описание О чём идёт речь в этом тексте далее с помощью режима опять же Doc vqa мы можем задавать вопрос относящийся к этому тексту допустим о чём этот текст и побольше деталей в ответе конечно От качества изображения тоже много чего зависит здесь мы видим что во-первых качество картинки плохое плюс текст неровной надписью Это просто фотка Ну теперь переходим к самому интересному То есть то что больше всего нас интересует и то что чаще всего вы будете использовать в своих тех процессах собственно само описание изображения которое можно в дальнейшем использовать в качестве есть три режима которые отвечают за описание изображение это просто Caption описание есть Caption то есть детальное описание и More Caption более детальное описание каждое последующее описание всё более подробно описывает изображение видим что здесь просто краткая фраза кролик держит подарок в саду далее идт более подробное описание там есть деревянная стена цветы и прочее и полноценный текст описания всего изображения помним что здесь мы можем количество слов ограничивать либо же использовать больше обращений и использовать больше большую модель для описания допустим сейчас используется у нас с базовая версия если мы переключился на большую модель допустим large prom Gen 2 и сейчас посмотрим какое количество текста У нас получится здесь увеличим ещё на следующее генерации видим что количество текста увеличилось Давайте ещё раз Просто на самом деле здесь мало что можно описать Ну для понимания того что происходит этого более чем достаточно ну 2048 он никогда в жизни не наберёт такое количество слов для описания этого изображения нуй так будет свободно использовать в качестве пронта для генерации изображения то есть по информационной составляющей подобное изображение то есть там будет в описании Если хорошая используется подходящая модель для изображения э вплоть до источника света где он находится куда падает тень и прочее и можно получить подробное описание но также можно использовать это описание для генерации изображения в качестве imid to imid что это значит Допустим мы берём Вот это изображение описываем а используем для генерации изображения в качестве входящего изображения как источник шума допустим вот такой вот изображение и у нас В итоге получится рыжий кролик А не вот такой вот серенький Ну я думаю суть понятна ещё хотел бы отметить один немаловажный факт что можно задавать вопросы но не сразу несколько если написать несколько вопросов то модель с этим не справится Но если продублировать ноды Florence tun используя одну модель на них и задавая каждом отдельном в каждой отдельной ноде свой вопрос можно получить несколько ответов что это может дать можно назвать это лайфхаком допустим можно задать вопрос что изображено на картинке на какую на работу Какого художника Похоже это изображение допустим если это картина Какое освещение где место там описание места какое место там Какое окружение и прочие вопросы позадавать и потом все полученные ответы свести в один промт вот мы в итоге получаем сведя 10 вопросов получив 10 ответов мы получаем готовый промт можно вот эту вот штуку отдельным образом сохранить как техпроцесс и потом подкидывают готовый промт с строго заданным порядком вопросов Допустим все мы знаем что промт создаётся по методу э самое важное в начале менее важное в конце соответственно первым будет главный объект стиль там и прочее по уже по порядку убывания Таким образом мы получим достаточно качественный промт В итоге а те Кто хохочет получить больше подробной информации касательно этой модели можете скачать я приложу на страничке в patreon ссылочка будет в описании PDF файл с описанием возможностей этой модели видим как работают регионы здесь в качестве примера есть изображения как определяются пиксели на изображение и прочее зде достаточно много информации с примерами с описанием примерами чтения описания В общем скачаете Посмотрите я думаю будет интересно лишним не будет точно все желающие Кто хочет воспользоваться возможностью протестировать модель Florence можете воспользоваться сайтом Build nvidia.com ссылочку я оставлю в описании и здесь посмотреть на примере Как работает Florence здесь можно повы Бира режимы различные допустим получить описание изображения нажимаем кнопочку Run и получаем описание видим здесь описание можно закидывать своё изображение допустим опять же наш кролик Давайте используем режим детального описания получили некое описание видим что оно конечно отличается но гораздо меньше чем мы могли бы получить на вот этом детальном описании используя conf uui Ну для примера этого достаточно определение объектов в принципе тоже самое ну если хотите можете и Ну а теперь перейдём к более интересной части собственно к примерам и первый пример у нас основан на модели xcel в данном случае New ER использовали в качестве примера вот такое вот изображение получили описание и вот такой вот результат Давайте используем для наглядности вот этого зайчика или кролика оним описание 120 здесь поставим не очень детально а просто детальное описание зафиксируем Сид и посмотрим что у нас получится Ну вот такой вот прикольный зайчик У нас получился поэтому Я рекомендую не списываться счетов модели Excel Тем более что всегда мы имеем возможность с помощью Image to imid прогнать эту картинку через модель флюкса то есть Ну а теперь переходим к более глобальным вещам в данном случае перед вами ещё один образец использование модели Excel newer Excel здесь в этом техпроцессе используются ноды Easy use для тоннельного размещения связей Как это работает если кто не знает Допустим мы имеем две ноды которые нужно связать мы берём одну ноду из use используем в качестве вхождение в тоннель и вторую для выхода если это можно так объяснить и соответственно здесь на входе нужно назвать этот тоннель там Неважно как это будет пускай это будет тоннель Да вот соответствующим образом здесь чтобы эта связь точнее чтобы связать эти две ноды нужно выбрать название это из списка вот здесь тоннель Это значит что сейчас эти две ноды у нас свя есть вот э связ является пряное это даёт нам возможность разделять весь техпроцесс на блоки и потом расставлять их как угодно и где угодно и ещё один огромный плюс это даёт то что мы можем весь этот блок целиком скопировать и вставить в другой техпроцесс например создаём новый техпроцесс и нам нужно допустим использовать Там upsale просто берём весь этот блок копируем и сюда вставляем и потом легко двигаем расставляем эти блоки так как нам вздумается как это было бы нам интересно думаю с этим понятно нода называется confi UI Easy use установить можно через менеджер Ну она у вас Если вы скачаете этот техпроцесс а его Вы можете скачать по ссылочки в описании с моей странички на patreon у вас автоматически эта нода если не установлена будет отсутствовать и её вы сможете установить через функцию Install missing Custom nodes она у вас будет объединена красным квадратиков эту ноду после перезапуска всё заработает очень удобная и эффективная штука раньше не рассказывал про неё по простой причине что нужно сначала привыкнуть к работе с этими свя если плохо ориентируетесь то лучше не использовать Ну если сами создаёте тих процесс если конечно сложные какие-то большие этих процессов вот как этот то просто без таких вот штук как бы никуда Так что мы здесь имеем первый блок - Это загрузчики здесь у нас базовая модель дополнительный загрузчик модели ва можно использовать ва Из основной модели также Если вы используете модель 1.5 2 можно воспользоваться функцией Clip Skip для этого есть вот эта вот нода просто подключить через неё если она вам не нужна пропускаем далее У нас ent Image разбитая выведены отдельно ширина и высота здесь Также можно указать количество генераций за точнее количество изображений генерируемых за генерацию далее У нас идёт загрузка изображений для получения описания мы используем два варианта Первый вариант по ссылочки можно найти любое изображение в интернете нажать на нём правой кнопкой и воспользоваться функцией копировать ссылку на изображение эту ссылку потом вставляем в это окно если у вас картинка не обновилась нажимаем Enter после того как вставили вот и картинка обновится второй вариант - это обычный загрузка изображения с компьютера можно выбрать вручную либо перетащить и закинуть в это окно так Не сработает можно выбрать с компьютера но перетаскиванием не работает для того чтобы определиться Какое изображение мы будем использовать для создания описания У нас есть переключатель здесь 1Д О - это изображение по ссылочки второе изображение с компьютера скачанное изображение здесь у нас на выводе идёт Image 1 L Image 2 здесь мы их получаем выбираем нужное получаем L Image и здесь его используем уже для генерации описания ещё один момент для того чтобы более корректно использовать сгенерированный промт я добавил ещё одну функцию весь текст который сгенерирует эта нода Florence она будет заменяться словом Florence можно написать любое слово тут текст промт как угодно авто промт главное это слово потом повторить в этом вот окне для чего это нужно например Мы хотим более конкретно указать что это для генерации изображения например Это у нас должно быть там cinematic photo запятую и получим Мы в качестве промто в начале промто сгенерировано у нас будет стоять уже Симак фо то есть мы можем вот этот вот текст который сгенерировал в его начало в качестве префикса Да поместить некий текст и в конец там не знаю и 100 Ну или типа того вообще не суть важно просто дополнительные ещё сделать подсказки которые естественно конечно же повлияют на итоговое изображение здесь у нас Также имеется вывод уже текста сгенерированного вместе с нашим корректирует помни что здесь cem фо видим что у нас здесь появилась cem фо и дальше сгенерированный текст и в конце у нас стоит и 100 ну здесь может быть любой текст также здесь ещё есть нода переводчик который позволит вам быстро оценить сгенерированный промт вем и никуда не делась возможность конечно же исз свой промт мне неправильно подписано пускай так будет позитив напишем чтобы понятно было вот также вы всегда можете сгенерированный текст скопировать поместить его в окно для вашей генерации точнее для написания своего пронта и откорректировать его то есть заменить там женщина там на мужчина там или там кто у вас будет центральным объектом там красное платье на зелёное или там картина Давинчи на картина вангога телевизор на компьютер Не суть важно то есть у вас ещё есть такая возможность и можно переключиться единичка - это вот этот вот сгенерированный текст используем в качестве позитивного промтайм написать вручную полностью либо скопировать подревателя мы вернём пока что автоматический также никуда не делась возможность использова использование модели ра пока что давайте отключим че не нужно сам генератор первый первая генерация далее У нас идёт вторая генерация это у нас refine изображение то есть улучшение картинки блин я там нажимал до нажимался чтобы картинка пропала Ну не суть важно здесь мы в последней картинке точнее в этом окне мы можем как раз я его и оставил для сравнения то есть вот так вот у нас было И вот так вот стало Это после того как мы ещё используем после refine изображения то есть улучшение картинки Мы ещё прогоняем через улучшение лица и рук и это нам даёт вот такой вот результат лицо мы меняем смотрим на зубы видим более адекватная становится и рука видим что здесь торчал большой палец непонятно похож он на большой палец или нет И вот так вот рука изменилась после детейлера Кто не знает это е можно использовать для лица так и для рук Давайте в качестве примера воспользуемся для описания вот этим изображениям переключился на него используем единичку здесь пускай будет Рандомный Сид нам это сейчас неважно здесь поставим троечку и запустим генерацию Давайте посмотрим что у нас получилось так это после первой генерации Это после refine можете обратить внимание здесь на рябенький листочки и здесь более-менее нормальный какой-то бутончик точка также глаза здесь получше В общем мелкие детали немножко исправились теперь посмотрим что же нам дало детализация лица и рук здесь можно сравнить результат Давайте сначала лицо видим Что гораздо реалистичнее стало и теперь руки правая рука точнее левая от неё рука вообще не изменилось потому как оно не смогло видимо её определить толком А вот правая рука очень сильно изменилась Ну и посмотрим что у нас по итогу получилось Ну конечно плохо что здесь обрезается рука оно не изменило как бы руку эту Ну ничего суть Я думаю как бы понятно здесь можно немножко пониже поставить параметр нои чтобы не так сильно рука менялась здесь 0,55 я думаю вполне нормально было бы 0,35 поставить для следующей генерации но мы не будем на это тратить время я думаю и так всё понятно Ну а теперь перейдём к моделям КС Ну а теперь рассмотрим как взаимодействует н вместе с моделями КС здесь не будем обращать особого внимания на сам техпроцесс это не итоговый тот с которым я хочу с вами поделиться это промежуточный скажем так тестовый но здесь интересный результат И потом я покажу ещё примеры Здесь было использовано Вот это изображение в качестве описание это просто рандомное изображение с инета я не помню уже даже откуда Ну не суть важно просто вот такое изображение здесь Lamborghini машина девушка и там на фоне пальмы и прочее и модель КС справляется с пережёвывает текста полученным от модели Florence просто идеально за счёт того что здесь большие модели текстовых энкодеров а ниже клип итог конечно впечатляет Ну в том плане что чётко идёт описание изображения при том что само изображение мы никоим образом не использовали здесь не использовался имидж то ид Как таковой просто размер изображения и чистая генерация и с ходу я обсл изображение в четыре раза Здесь даже значок Lamborghini более-менее адекватный Ну хвост немножко у БК раздвоился но в целом очень даже прикольно Давайте обратим внимание что здесь фактически использовался просто чистый промт А всё что я здесь дописал это немножко добавил в качестве префикса то есть в начале реалистичная фотография ВС никакая модель Лора ничего прочего здесь не использовалось Вот ещё один подобный пример здесь использовалось Вот это изображение в качестве исходника это я точно помню это сре взял ссылочка вот такое подобное изображение здесь уже вот это изображение использовалось в качестве IM to Image можем видите что оно подмешивать в качестве шума дено параметр стоял 07 также здесь скопировал полученный промт и немножко его подревателя там нюансы буквально я добавил что там должно быть надпись осенняя модная коллекция неделя моды 2025 и вот такое вот изображение в итоге мы получили А ещё немаловажно там было указано что это обложка журнала теперь просто немножко готовых результатов здесь просто будут примеры того Какое изображение использовалось в качестве исходника для построения промто здесь не использовался метод и to и только промт брался с изображения вот такое изображение было скачано с интернета такой результат это качество такой картинки потому что использова модель Shuttle Это я когда-то генерирование такое вот новое изображение это также я генерирование на модели Excel со своей моделью laa Love Is там кто не знает можно любые объекты писать что присутствует на изображении они будут в стиле как жвачки lais такие любовные прикольные и вот так это делает модель Flux Shuttle такие картинка прикольные код с мышью тоже забавная это эти все три изображение с одного вот этого исходника Просто разная генерация это также я на Excel модели грил всё тоже И вот так это выглядит на модели КС Это я тоже давным-давно генерирование через Флоренс проигранные тоже генерировать когда-то изображение это меня мотивировал наш модератор Макс из чата в Telegram канале Если ещё нет тебя в нашем чате обязательно присоединяйся там очень интересно такое вот новое изображение и вот такое в стиле аниме это если использовать модель Лора подкинуть Это тоже я давным-давно когда-то генерирование качество отвратные и вот это на модели Shut Flux это вот с этого изображения вот эти два изображения Это изображение сгенерировано вообще было в кре по-моему и вот такое вот новое изображение это с пинтереста взятое изображение такое вот сгенерировал с Это я тоже давно когда-то генерировать изображение и вот такое вот получаем если использовать э лору аниме это без модели Лора это тоже мной сгенерированные изображение тоже давным-давно вот это с этого изображение такой вот результат это я тоже генерис такие прикольные хоть и качество кажется плохим но при ап скеле при доработке очень хорошие прикольные штуки получается это на модели New такие вот интересные всякие моменты получаются туристические Вот это если использовать лору аниме опять же Это я генерировать это просто шнель А это с флорен сом тоже шнель тоже давно генерирование и это вот новый вариант люксе шатле Почему шатл Потому что шатл генерирует изображение также примерно как и шнель очень быстро и хорошего качества для тесто самое то конечно если хотите хороший итоговый результат используйте модели Def вот с этого изображения вот эти два изображения Вот это и вот это изображени это тоже на Вил изображение это новое на шатле тоже шнель это шатл это Excel было изображение на Excel модели сгенерировано это вот на шатле с пром тамм из Флоренс не забываем также Excel и это опять же с лорой аме Мне нравятся прикольные такие классные штуки получаются прямо отличные рекомендую кому интересно что за модель Лора аниме напишите мне в чате Telegram канала Я обязательно скину либо ссылку либо отвечу Как называется поищите Это изображение Взято с пинтереста какое-то Такое прикольное Мне понравилось и вот такая вот интерпретация по пром с того изображение это тоже с пинтереста какая-то старинная фотография и вот это вот результ такой опять же ну собственно вот так вот выглядит результат генерации на модели л здесь вот 3 diffusion 4 Кому интересно вот это изображение в качестве исходника и вот такой вот результат плюс вра вот Жолудь прикольный получился соно Поэтому я решил показать Это изображение Ну а теперь то что точно заслуживает вашего внимания собственно итоговый тих процесс которым я с вами с радостью поделюсь его сможете скачать с моей странички на patreon это основанный на модели [музыка] ВС те же загрузчики у нас основная модель Q4 Я использовал клип модель здесь размер изображение указываем всё подписано где Какая модель должна находиться если будете скачивать дальше у на итн эталонная выборка позволяет лучше распределять шум и пиксели по изображению далее У нас идёт загрузка изображений по ссылке и с компьютера я об этом уже рассказывал всё также 1Д переключение по ссылке и загруженность с компьютера изображения здесь таким же образом как и в моделях происходит про ВС Также можно написать свой промт можно переключаться свой сгенерированный здесь можно увидеть результат прота написанного ренсом здесь для генерации пром использовалась модель пром 2 поему Ну или не единственно но я на неё попал что она по крайней мере хорошо прочитала что это либо Хрустальный либо ледяной трон Ну я писал конечно в описании хотелось бы чтобы это был ледяной трон потому как это была интерпретация Снежной королевы Вот и Хрустальная корона Ну в целом Получилось неплохо сечас мы посмотрим на результат идёт загрузка модели Лора конкретно для генерации этих изображений использовалось две модели одна л Light Flux Я не знаю почему она так называе короче вот это вот Лора она делает такие тона прикольные То есть свет и тень падающие прямо на объект Центральный ссылочку там опять же если интересно будет можете спросить в чате я поделюсь дальше реализм фото все эти кстати модели Лора качаются с сайта cvt качайте там их целая куча каких угодно Не суть важно Вот Но то что важно здесь в этом техпроцессе это то что здесь вот эти изображения выводятся в ноды preview Image они не сохраняются напрямую А сохранение идёт через дополнительный блок в котором можно указать путь к папке куда сохранять изображение название есть файла то есть имя файла которое будем давать этому изображению в частности префикс будет имид и дальше будет идти дата когда это изображение сгенерировано Ну и После чего конечно точка пнг Для чего вообще э задумка была сделана было автоматически сохранять каждому сгенерировано изображению на каждом этапе что первая генерация что что первый а что второй здесь Кстати два акела использовалось сначала первый раз в два раза и второй раз тоже в два раза автоматически сохранять промт в текстовый документ но просто так сохранять никак не получится имя будет разным Но если мым отсюдова имя то есть полный путь и имя сохраняемый Вот текст соответствующим образом мы можем взять часть этого текста и заменить его на пустоту тем самым мы обре можем всю вот эту часть и оставим только имидж и дата когда это изображение было сгенерировано но опять же это Всё потому что зачем нам ещ хранить информацию ПН НГ Мы также просто стираем используя просто пустое место вместо текста Тон и на выходе мы получим соответствующим образом текстовый документ с таким же ж именем как и сама само изображение и в папке это будет выглядеть вот так вот таким вот образом будет выглядеть сохранённое изображение то есть мы имеем первую генерацию и к нему текстовый промт в принципе ко всем сохранять необязательно но вы можете оставить конечно же только последний после последнего ап скейла но есть большая вероятность того что на каком-то этапе Может просто не сохраниться потому как ээ здесь мы сохраняем изображение с помощью ноды Image Save и поскольку текст по сути ничего не весит лучше пускай будет как говорится чем не будет чем его потерять Вот и можем посмотреть на результат сразу здесь на кресле Кстати прикольные такие ещё рисуночки получились Ну вернёмся к нашему тех процессу Итак повторим на каждом этапе после того как изображение было сгенерировано оно сохраняется вместе с текстом промпто и с этой жед сохраняется точнее идт изображения Что позволит вам конечно же не потерять никакие данные если там что-то вылетит в какой-то определённый момент также здесь можно сравнить изображение до refine и после refine вот так вот это выглядело просто сгенерированные изображение И вот так после refine повторной генерации с небольшим Деном Ну я думаю тут всё очевидно мм ещё один момент здесь если мы захотим использовать изображение в качестве IM to и я добавил просто ноду которая переключает КСТ и и то есть мы можем использовать сразу же это же изображение в качестве исходника и понижением деса использовать его как подложку и ещё один момент то изображение которое Я использовал для заставки вот оно собственно изображение 6144 пикселя на 3840 пикселей Так что нет никаких проблем генерировать большие изображени Я очень благодарен всем кто поддерживает канал Ты также можешь поддержать нас поставив лайк этому видео подписаться если этого ещё не сделал либо поделиться видео с друзьями если нужна помощь можешь всегда обратиться в Telegram чат а если нужна консультация или уроки Можешь обратиться ко мне через Telegram чат в личном сообщении А на этом пока всё до новых встреч пока-пока [музыка]
Florence2 by Microsoft - Powerful Prompt Generator in ComfyUI
Channel: antinoice
Share transcript:
Want to generate another YouTube transcript?
Enter a YouTube URL below to generate a new transcript.