• Ideogram 4.0 - closed-source, который стал open-source • FLUX.2 klein (4b и 9b) • Z-Image • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
Как же заебал этот ублюдок на кляйне, нихуя нормальные человеческие трусы не знает кроме бабушкиных панталон, ну может у меня скилл ишью конеш, но чет хуй выходит сделать нормальные мини стринги или танга, это либо хуйня размером с матрас либо 2 веревочки тонких...
>>1629238 (OP) >Ideogram 4.0 Насколько отличается от прошлых закрытых версий? Вроде в свое время говорили что идеограм был топом среди закрытых. Это оно или просто хуйня ради опенсорса? На мой взгляд пока непонятно зачем он нужен в базе кроме инфографики, потенциал для файнтюна пока тоже не видно кроме сломанных лор.
>>1629446 Если он в эдите может писать качественные тексты, особенно маской, то это уже незаменимая вещь как анима. Мне лень разбираться пока, каждая новая модель это всегда какой то душный гемор как испытание красноглазое. С флаксом 2 было удобно
>>1629446 О прошлых версиях не знаю, поэтому сравнить с ними не могу. Как у любой новой выброшенной в open-source модели на старте очень много хайпа. По-моему мнению, неоправданного. Вопросы к качеству генерируемого изображения. Пока требует рефайна. Но это субъективное мнение. Regional prompting с разметкой генерируемого изображения на области с отдельными prompt (с помощью Kijai nodes) интересен. Лично для меня связка FLUX.2 [dev] (композиция и полноценный edit) и FLUX.2 [klein] 9B (рефайн) всё ещё вне конкуренции.
Уже который твой пост об этом читаю. Не делай голову, даже для FLUX.2 [klein] скачай https://github.com/lquesada/ComfyUI-Inpaint-CropAndStitch Бери workflow из примера, выделяй на изображении маской нужную область, настрой на увеличение её разрешения и впечатывай edit-ом этого увеличенного куска изображения свой текст.
>>1629517 >на уровне Нано Бананы и ГПТ, только без эдита Оксюморон, в банане вся суть в эдите. То что там региональный промтинг в базе это немного другое. Так что даже не на уровне опенсорсных эдит-моделек.
>>1629446 по факту в опенсорс высрали хуиту, онли т2и без эдита, эдит зажали уебаны, а нахуй он такой нужен то, этих т2и насрали тонной, на слоповых тянок уже нафапался, всякой хуйни напромптил уже тонны, без эдита уже встает на новые модели а тут еще ебучий региональный промптинг, ну хуй знает короче
>>1629523 >этих т2и насрали тонной >>1629529 >т2и в 2026 не нужно Нужно но только где будет полноценно залито все аниме, вся фурятина, все пони и вся порнуха. А остальное не нужно да.
Кстати, самая большая боль в банане, что в ней нет нативного инпеинта. Казалось бы что мешало его добавить? Данные для него набираются на порядок легче эдита. Вместо того чтобы выделить мелкую хуйнюшку и подробно ее запромтить, она шакалит всю картинку зачем-то а саму хуйню всирает конечно же. Кроме как вручную вырезать квадрат и его отдельно пихать в банану вариантов нет? Может есть интерфейс где это автоматизировано?
>>1629517 > на уровне Нано Бананы и ГПТ Нано банана это слоп. Гпт генерит неотличимое от кинокадров через раз. Между ними сейчас пропать. Откуда пошла тема что нанобанана что то может? 1girl она хорошо делала? Сколько тестил - хуже локалки результаты
>>1629529 >т2и в 2026 не нужно Нужно. Но нужно, чтобы анатомия была хотя бы сука как в далли 2023 года. Картинкой может и догнали, на отдельных моделях даже композиция неплохая (но всё равно не дотягивает до 23 по артистичности). Весь лоукал релизят как инструмент, типа держите, ебитесь, красиво (как онлайн) делает только по эскизу, остальное просто превью или удачный рол. >>1629595 >Нано банана это слоп >Гпт генерит неотличимое от кинокадров Лол, сказочный шизоид. Попользуйся больше суток, криворукое уебище. Артефачная параша с одной глубиной у шума на всю картинку. Опении рухнули после 24 года, весь их кал стал дном на фоне, единственный пик был на релизе соры 2. Поражаюсь, что их продолжают поддерживать по иннерции, им уже впору закрываться с их недорелизами.
натренил себе трусишки посимпатичнее, заебали эти бабушкины панталоны, но сука эт на сколько надо было упорно цензурить модель, чтоб сломать нахуй всю анатомию и отупить модель так чтоб она вообще трусов не знала кроме бабулиной простыни xl размера... ебанаты ипаные
>>1629652 > нб и гпт слоп бесполезный Только НБ. Будь объективен, ГПТ-2 почти всегда лучше по эстетике, качеству и плотности. Но идеограм 4 действительно очень хорошо выглядит. И неизвестно сколько ты дрочился с идеограмом прежде чем получить это. Скорость результата тоже важный фактор
>>1629683 > зенки свои открой и смотри внимательно что гопота выдала Ты не скинул свой промт, во первых. Во вторых - у меня с зенками всё в порядке. Визуальный стиль и арт качество ГПТ-2 лучше, там пизже цвет, пизже рисовка, пизже детализация и плотность, и так было всегда. Даже если он отошел от изначального замысла - но ты не скинул промт, что бы это оценивать. Но даже если он чуть налажал с интерпретацией замысла, это вторично, т.к. с ретрями промтов быстро получишь что нужно. А вот получить качество которое он выдает на локале крайне сложно. Кукла у диограма всратая, а ГПТ нарисовал красивую тянку карандашом, скидывай промты которые скармливал идео4 и гпт.
> поди да сделай лучше, бестолочь Смысл агриться, если это сухой показатель отражающий реалистичные возможности модели. Это не в твою сторону выпад, а в справедливую критику твоей попытки сказать, что ideogram превосходит gpt-2, иначе говоря сказать, что ideogram4 лучшая модель в мир, что не корректно, т.к. она не дотягивает по качеству текстур и шумности до кляйнов/зитов, и как и все локалки не достягивает до мощности и детализации до гпт.
Но то что она делает что то с текстом лучше всех локалок - это наглядный факт.
>>1629722 > Визуальный стиль и арт качество ГПТ-2 лучше, там пизже цвет, пизже рисовка, пизже детализация и плотность, и так было всегда. Нет не пизже, есть нормальные сравнения на реддите. Он сгенерировал на гопоте изображения в большем разрешении, а с разрешением колоссально растёт качество. Хочешь качество, используй 2 мп разрешение и идеограм выдаёт идентичный уровень, на части промтов лучше, на части хуже. Единственная его проблема, у гопоты гораздо больше познаний. > т.к. она не дотягивает по качеству текстур и шумности до кляйнов/зитов Оно делает кляйна и зита с закрытыми глазами по любому параметру, если ты не криворучка.
А ещё потом надеюсь её с dmd2 задистилят и получим быструю генерацию в 2мп локально и ещё в более высоком качестве.
>>1629349 >>1629034 → Ты это по прежнему базу в аниме делаешь и вклеиваешь лицо кляйном? Или это кляйн тебе рисует? Сочно выглядят для базы под финальный рефайн с текстурками. Еще бы в интересные сюжеты такое
>>1629739 не это уже сам кляйн делает, тестирую настройки с промптами, сделал 2 прогона кляйна на разных моделях, чтоб последним скейлить и насыпать текстурами и прочим
>>1629728 > по любому параметру С текстом да, геймченджер. По текстурам нет, и по Edit режиму нет.
И еще нормальных генераций (не 1girl на стуле) с живой сценой и сложными задником не видел пока примеров. То есть насколько он лучше в t2i строит композицию и выдумывает объекты неизвестно.
1girl со студийным светом покажи для начала, уже там многое видно.
>>1629728 > А ещё потом надеюсь её с dmd2 задистилят и получим быструю генерацию в 2мп локально и ещё в более высоком качестве. И получится t2i кляйн который может писать норм текст, но так же не может нихуя годного сгенерить кроме односложных портретов и каталожки. Видимо я много хочу любой ценой, а ты в поисках филосовского камня универсального комбайна лучше чем GPT, так что даже свою планку качества и ожиданий снизил ради этой идеи фикс.
>>1629770 Грамотная дистилляция с dmd2 только улучшает качество, но уменьшает разнообразие. Кляйну до идеограма, как сд 1.5 до сдохли, пропасть, что с идеограмом не вытворяй.
>>1629766 >как в кляйне лица разнообразить? 1) лучше база вместо дистила 2) давать лицам персоналии "Людмила Павловна Груздёва, из Пскова, крановщица 7 цеха, некогда краса района, тепереча цветок увядающий, но всё ещё радующий глаз"
>>1629670 >Только НБ. Будь объективен, ГПТ-2 почти всегда лучше по эстетике, качеству и плотности конкретно в данном случае оба полный слоп, провалившие и стиль, и расположение текста. один недоборщил, второй переборщил гпт 2 ещё терпимо был по стилю до релиза, но после и качество понерфили, и артефактов срёт, щас ещё и synthid артефакты в добавку к архитектурным
>И неизвестно сколько ты дрочился с идеограмом прежде чем получить это. Скорость результата тоже важный фактор 2 сид по первому промпту, 1 сид тоже ок был. ниче черрипикать не надо даже
Как ты тестишь, если идеограм оптимизирован под JSON промт, а вот GPT хоть и всё прочитает - он то не оптимизирован явно, но ты ему суешь JSON идеограма, верно?
А если наоборот попробовать? Сперва запромтить хорошо для GPT, а потом этот промт перевести в JSON как хочешь и дать идеограмму, что тогда будет?
Пикрил - что сделал GPT с чистого промта снятого с твоей картинки (чаты изолированы). Так что не ясно как ты тестишь. Как установлю сам буду проверять.
>>1629879 Вот что бывает, когда просишь инструкции даже у копро гемини в Pro режиме. Эта гнида просто не поняла, что в карточке есть папка text_encoder где лежит нужный энкодер. Он видит только на неквантованный Qwen3-VL-8B-Instruct и предлагает сувать его в CLIP. Вот таком уровне галлюцинаций и не получается нихуя сделать когда не знаешь изначально нихуя, как советчики линуксоиды думают.
Почему в темплейте comfy прописаны совершенно другие модели, чем в офф карточке здесь? https://huggingface.co/ideogram-ai/ideogram-4-fp8 Я например уже накачал оттуда всё, но загрузив темплейт комфи, обнаружил что там всё, включая веса - другие какие то.
Как такое явление умом объять нахуй? Для кого в карточке описаны и лежат файлы, если многие юзают comfy, но для комфи нужно качать совершенно другие файлы? Истерический смех нахуй.
>>1629807 > Ну наконец то сейчас мастер покажет как надо правильно генерить сисик писик по фотке в и2и Не покажет. Я его уже просил показать лучшие примеры этой пони, видимо постеснялся. Причем он обзывает поникалом совершенно разный уровень текстур. Мб это разные адепты с плохим в зацарапанных очках.
>>1629877 > Как ты тестишь, если идеограм оптимизирован под JSON промт, а вот GPT хоть и всё прочитает - он то не оптимизирован явно, но ты ему суешь JSON идеограма, верно? образцовый даун, 1488% понимания как работают гпт и прочие онлайн залупы
>>1629879 открываешь комфи, качаешь что просит темплейт, даже оно само качает блять
>>1629894 открываешь комфи, качаешь что просит темплейт, даже оно само качает блять > Я например уже накачал оттуда всё ахаха даунище
>>1629899 эх бля... жаль я так то не спорю что идиотграм прикольный, но т2и модели уже настоебали, в каждой помойке по модели, а я не ценитель ии шедевров, это прикольно но быстро надоедает.
Тип ты посидел погенерил всякой хуйни, тя настоебало за пару дней и улетел идиотграм в корзину. А веса эдит модели они то нихуя не выложили, и скорее хуй выложат, потому что эдит это киллер фича сейчас. "Добавь ей в руку член" "Замени Х на фруктовый лед" и прочее заебывает меньше чем просто т2и генерации (ну и охотнее люди платят ради эдит фич).
А открытых эдит моделей у нас ток квен первый пластиковый, да, дитя цензуры кляйн. Так что вообще сравнивать идиотграм т2и с ними не совсем корректно.
А пока эта залупа не может мне вот так с фотки нагенерить сцену, это хуита без задач.
>>1629657 Последнняя хоть как-то нормальная. Этот говнограм не то что спицы, струны и провода не может, он блять даже прутья не осилил. Какой же кал. Даже Анима в струны может. Позор нах, ссу в рот говноедам дефающим свой говнограм
>>1629904 > образцовый даун, 1488% понимания как работают гпт и прочие онлайн залуп Судя по тому, что я получил максимально близкую картинку к твоей через ГПТ, а у тебя хуйня выходила - даун здесь ты, как следствие, твой подход тестирования полная хуйня. Потому что от факта ты не отделаешься: ГПТ может нарисовать, но у тебя не нарисовала.
> открываешь комфи, качаешь что просит темплейт, даже оно само качает блять Это без тебя ясно. Почему в офф карточке хф модели одно, а в комфи темплейте абсолютно всё другое?
> ахаха даунище пишет с сажей в тематическом непотопляемом треде
>>1629937 >Почему Потому что ты долбоеб, буквально ты нейросеть. Даже не так, ты скрипт. Набор скриптов. На любое сравнение чего-то с чем-то ты обязательно влезаешь и требуешь промпт. Это надоело уже. Как будто на всем белом свете остался один единственный промпт. И тебе его не дали. Подсказка: ты можешь сам провести свой тест со своим промптом. Ответь на твой вопрос в цитате: потому что на хаггингфейс даётся инструкция для запуска скриптом трансформерс. Им похую эта комфуй. Нестабильное нечто от опенсорс калек. Думаешь гпт, банана и прочее типа на Комфи крутится? Ебанулся? Комфиюи это как Линукс в мире операционных систем. Серьезные корпы используют свое. И трансформерс это универсальное средство запуска. Когда про модель пишут что она использует сколько-то врам, то это именно в трансформерс скрипте. В целом.
>>1629950 > Это надоело уже. Конечно, потому что тебе неудобно судя по всему. Ты пишешь заведомую хуйню для ГПТ и сравниваешь свои старания в идеограме, пытаясь чето доказать.
Тебя просят промт, потому что в твоем сравнении результатов он имеет значение, тебе сложно это понять? Я сгенерил близкую картинку в ГПТ, почему у тебя не сгенерилось? ПОтому что промт хорошо сработал в идеограме но не очень в ГПТ. Это ты и сравнил.
>>1629950 Для того чтобы рейтить нужен промт, без промта непонятно чего ты хотел, и как модель с этим справилась. Но тебе, по ряду медицинских показаний, этого не понять, потому что ты больной на голову шизик, и у тебя слюна до пола.
>>1629999 хлебушек, блять > Ты пишешь заведомую хуйню для ГПТ и сравниваешь свои старания в идеограме, пытаясь чето доказать. напиши свои идеальные промты во все модели и сравни/покажи/накажи, хуле ты доебался до забора
>>1630027 > идеальные промты Суть в том что для разных моделей разный подход в промтинге. Нужно быть дегенератом, что бы сравнивать одинаковый промт в моделях с разным подходом. То что ГПТ всеядная еще не означает что промт идеальный для идеограма идеально для него подходят, поэтому у него и плывет замысел возможно.
ПОЭТОМУ я просил у тебя промт, что бы в этом разобраться. Но ты дубовый. Сравни еще один и тот же промт со сдохлей
>>1630031 используй следующий промт: аноним № 1630031, отбитый нахуй даун аутист, сидит и строчит хуйню в тред, не в силах осилить мысль "сделать как угодно для сравнения"
>>1629950 > И трансформерс это универсальное средство запуска. будто бы комфи нет, если бы просто модельки выкладывали для неё, а не хуй знает чего
И какая разница между трансформерс и комфи, если по сути воркфлоу технически одинаково работает у модели, и какая хуй разница должна быть в весах? Они даже весят близко и формат одинаковый, но файлы разные тем не менее. Сам не до конца понимаешь?
>>1630273 >а клейн то могет нет, не могёт. >покрутить ползунки у эдита нет "ползунков" совсем, кроме этого: прибитый гвоздями кфг с денойзом, и количеством шагов посчитаных поштучно. С генеративной моделью дела обстоят ещё хуже. В сумме >22 гига абсолютно бесполезного, бесмысленного кала на винте. Кляйн ненужон.
>>1630454 > Кляйн ненужон. Незаменимая вещь для наваливания текстур и трансформа в реализм. Пока не появится модель, которая может креативить как анима, со структурой и текстом идеограма и текстурками фотореализмом ZIT/Klein - клейн останется актуальным.
>>1630463 >которая может креативить как анима тоесть никак) >клейн останется актуальным в какой-то нишевой сфере - да, реставрация, эдитинг а-ля: выпилить с фотки пиздюка с прошлого брака а новому ёбырю убрать живот, как-то так.
>>1630465 У фото теряется душа после и2и, ведь новый результат это будет всегда уже воссозданное по подобию. Все пиксели из модели. Ни одного не сохранится из оригинального фото. Это сатанизм
>>1630470 >Все пиксели нет, после словесного описания объекта, он находится, самостоятельного выделяется (без участия промтера) и область интереса выделяется по маске. Всё тоже самое как и в полторахе, но только "хандс-фри". >>1630472 >имба есть её нет, но кляйн говно, безотносительно.
>>1630476 >её нет, но кляйн говно, безотносительно. Это как с водой типа она говно, но анало говнет, но мааам говно нихачу воду пить бля нинавижу топ ножкой
>>1630465 > в какой-то нишевой сфере - да, реставрация, эдитинг Нет, для генерации чего угодно, или улучшения текстур для другой более способной в t2i модели, того же идеограма или анимы.
Ты ведешь себя так, будто бы таинственно скрываешь какой то золотой грааль, позволяющий генерить нечто на голову выше того, что позволяют современные модельки и клейн. ZIT /клейн могут выдать прикольные 1girl фотки, с лорами всякими, и бедноватым наполнением, или каталожку по типу "предмет на столе", где неизбежное отсутствие норм композиционки и художественности вписывается нормально. А за пределами этого что?
Покажи хоть что-нибудь, в ином случае твой скепсис выглядит не особо убедительно.
>>1630361 >какая разница между трансформерс и комфи Трансформерс просто работает. А комфуи может наебнутся в любой момент после обновления. Что уже было не раз и сейчас у меня в нем есть косяки. То есть постоянно ждёшь каких-то исправлений и молишься чтобы не добавили новых. В любой момент времени нет какой-то версии Комфи которая не старое говно и работает стабильно во всех мелочах. Чуешь разницу, дружок?
>>1630533 Трансморферы - ровно этот же пистон с его разваливающимся от каждого пука рантаймом. Хочешь стабильности - перекатывайся на stable-diffusion.cpp
>>1630542 А я и не про t2i говорю. T2i клейна это чисто узкоспециализированная штука быстро создать что то простое достаточно стабильно с хорошими текстурками/ современным светом. I2I универсальная и потенциальная мощная штука для рефайна. По сути щас сделают модель, которая генерит t2i слоп но с ризонингом и вкусом как GPT2 - и всё. Связка с клейном станет 2 шаговой домашней гпт. Без клейна это будет слоп генератором. Просто как грубый пример.
Завел ideogram по темплейту комфи: На 5070ti по 100секунд 1mpx в Quality генерит.
На выходе получаю хуету пока что. Из плюсов вижу больше плотность деталей, интересней задники, отдельные элементы неплохо рисует, эмоции неплохо передает.
Но у меня главный вопрос: это его предельное качество по текстурам в деталях или можно что то улучшить? Мб модели говно, которые комфи предлагает скачать? Пока не вчитывался в мануалы, там 2 CFG. На турбо/default еще хуже качество.
Супер медленно работает. MXFP8 или чего то ускоряющего нет? С такой производительностью / качеством вообще будто бы скорей хуйня чем что то стоящее, если не учитывать текст. Ждать 100 секунд, что бы словить брак, который частенько лезет
Теперь вопрос как этот идеограм ускорить, как минимум тестить промты и ролить даже 1mpx по 100секунд ебанешься. А норм качество только на 3х идет, это 7 минут. И еще рефайн потом. На пикриле промт тестовое говно через ллм с одной строчки.
>>1630669 >Ждать 100 секунд, что бы словить брак, который частенько лезет Смотри live preview во время генерации, если видишь, что получается плохо, останавливай, не дожидаясь завершения.
>помогите улучшить качество Пока только рефайн на FLUX.2 [klein] 9B.
Когда осела пыль от хайпа, пока в положительных моментах вижу только regional prompting. И то, FLUX.2 [dev] это тоже может, только не bounding boxами, а указанием ближний/дальний фон, центр, правые/левые, верхние/нижние края изображения. Не так гибко, как bounding box для Ideogram в Ideogram 4 Prompt Builder от Kijai, но всё же. В том, что касается деталей и текстур, всё очень посредственно. К освещению тоже есть вопросы.
>>1630766 >А двумя CFG, степами, семплером? Там и так default workflow для ComfyUI с double CFG на 7.0 и доводка на 3.0 (CFG Override), куда ещё? Но я пока в sigmas для этой модели не лез. Вообще, нужно посмотреть на каких sigmas и что именно она рисует. Может, нужно дольше задержаться на каком-то отдельном участке.
>А других вариков кроме FP8 реально нет? FP8 я субъективно считаю компромиссным вариантом, если нельзя запустить BF16. И это рабочий вариант, он даёт приемлемый результат. Я FLUX.2 [dev] в FP8 кручу, потому что для BF16, вместе с BF16 text encoder 128 Гбайт RAM для offload не хватает, она вываливается на SSD.
>Flux 2 vae же говно вроде бы Я не понял, почему они выбрали его. Сразу заменил на фикс full_encoder_small_decoder.safetensor и использовал свои фиксы для чистки цифрового мусора VAE Decode FLUX.2 VAE.
>ускорят и зафайнтюнят текстурки Из того, что выходило, кроме SDXL и его тюнов, я подобного не видел. Обычно цикл жизни таких новых моделей типа Ernie, Bernie: хайп на старте, вопли про SOTA, а затем через пару дней про неё забывают.
Пока не понял, почему модель так себя ведёт с мелкими деталями и геометрией на пикрил.
Даже Z-Image-Turbo из коробки лучше отрисует объект по центру.
A close-up shot depicting a Caucasian man and a Caucasian woman looking at each other. There is a spherical object hovering between them in the centre of the image, left half of the object is Earth, right half is an intricate clockwork mechanism. There is a birch tree with lush leaves in the foreground. Sunny day. Cinematic lighting. Hyperfocal, deep depth of field.