• Ideogram 4.0 - closed-source, который стал open-source • FLUX.2 klein (4b и 9b) • Z-Image • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
>>1629950 > Это надоело уже. Конечно, потому что тебе неудобно судя по всему. Ты пишешь заведомую хуйню для ГПТ и сравниваешь свои старания в идеограме, пытаясь чето доказать.
Тебя просят промт, потому что в твоем сравнении результатов он имеет значение, тебе сложно это понять? Я сгенерил близкую картинку в ГПТ, почему у тебя не сгенерилось? ПОтому что промт хорошо сработал в идеограме но не очень в ГПТ. Это ты и сравнил.
1. Suno https://suno.com/ Вышла версия 5.5 (но для тех кто платит денюшку), качество моделей постепенно улучшается: звук, понимание концепций, набора различных жанров. Но в то же время все сильнее урезается для бесплатных юзеров: осталось только 5 бесплатных генераций в день на аккаунт, а также по заявлением некоторых анонов, модель для генерации на бесплатке (на момент создания треда использовалась 4.5) ухудшили. Спам аккаунтами пока что работает. Купить подписку из РФ: 1. https://payment.mts.ru/tools/suno-ai 2. https://plati.market/games/suno-ai/1701/
2. Tunee https://www.tunee.ai Хороший звук, более-менее понимание концептов, но тоже сильно урезан для бесплатных юзеров: режет концепты в промптах, плюс произвольно определяет "цену" за каждую генерация исходя из какой-то "сложности запроса". И получается, что если с бесплатки забацаешь промпт сложнее банальщины "Make cool rock about love for youtube" он может решить что у тебя нет кредитов для такого сложного запроса и пошлет нахуй. Способов оплаты из РФ неизвестно.
3. Sonauto https://sonauto.ai/ Как по мне, недооценённая вещь, особенно учитывая что недавно он обновился до 3.0, который очень даже разъебывает. Но он тут более ограничен тегам и понимает чисто какие-то жанровые теги, гибкости поменьше. Но зато пока что халявный и не ограничен кредитами, генерируй пока есть настроение.
Потихоньку развиваются, стоит внимания ACE-STEP 1.5: https://github.com/ace-step/ACE-Step-1.5 Звук уже на уровне раннего Suno ~2.0-3.0, аноны делают на нем уже приемлемые результаты и постят в тред. Если есть хотя бы 12 GB VRAM и хочется генерировать без цензуры и подписок - можете юзать.
МЁРТВЫЕ ГЕНЕРАТОРЫ
1. Udio (udio.com) - куплен Warner Bros, но затем сами Warner Bros сдали назад и откатили сделку. Но уже успели испортить, больше нельзя скачивать треки, их только доставать из буфера в 160 кбит/с. Плюс непонятно как работающая цензура, которая не дает генерировать треки с определенными тегами. Плюс уже год ебут один и тот же 1.5 allegro. 2. Riffusion, Producer.ai (producer.ai) - куплен гуглом, удалены все старые относительно норм модели, вместо этого запихали безальтернативную каловую модель, которая и промпты сложнее самых нормисных в духе "make cool rock about love" не понимает, и вокал смазывает в какую-то кашу. При этом еще и максимально дегенеративная цензура, которая режет чуть ли не любые попытки сделать просто что-то не попсовое и не "музыку для ютуб".
ПРОЧИЕ ПОЛЕЗНЫЕ УТИЛИТЫ
1. https://www.bandlab.com/mastering Быстрый мастеринг в две кнопки, если хочешь чтобы звучало более слушабельно, но не имеешь навыков в DAW или аудиоредакторах (или лень). 2. https://morpher.ru/accentizer/ Если генерируешь музыку с лириками на русском, то очень часто случается, что твой генератор путает ударения в словах. Прежде чем пихать свою графоманию в генератор, проставь ударения в сервисе по ссылке. И уже из этого сервиса копируй текст в генератор. По крайней мере в Suno это помогает.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
› Воспользуйся chrome-devtools, открой google.com и найди картинку кошки породы сфинкс. Не описывай действия а вызови инструмент. • Понял, использую Node REPL для управления Chrome через встроенный плагин Browser Plugin:MCP-серверы chrome_devtools и node_repl в текущей среде не доступны — они возвращают «unsupported call». У меня работает только shell_command, поэтому я могу либо запустить Chrome через PowerShell, либо попробовать настроить эти MCP-серверы. Какой вариант предпочтителен?
>>1629988 Я тут раньше саммари тредов пару раз постил, когда кобольд подключал к встроенному mcp функционалу. Нужен браузер и расширение с mcp в нем, в кобольде добавляешь сервером на пикрелейтед вкладке локальный адрес. Поскольку кобольд не агент, в нем все время надо было жать кнопку продолжить, что довольно неудобно. Но содержимое тредов все равно себе в контекст успешно утаскивал. В гугле тоже искать получалось.
Активно репортите все нерелейтед посты кнопкой на сообщениях. Этот тред только про ИИ новости, не позволим троллям загаживать тред шитпостом и бесконечным словоблудием.
🚀 Последний обзор ИИ новостей:
📰 Главные новости ИИ
Microsoft представила Surface Laptop Ultra, работающий на базе SoC NVIDIA RTX Spark с процессором до 20 ядер и графическим процессором класса GeForce RTX 5070, что сигнализирует о стремлении компании выйти на рынок высокопроизводительных ноутбуков, ориентированных на ИИ.
🛠 Инструменты для разработчиков
Навык Claude Code прогоняет питч через 150 смоделированных технологических персон, предоставляя обширную обратную связь для основателей, готовящих презентации для сбора инвестиций.
Управляемый языком 3D-аватар позволяет пользователям направлять действия персонажа с помощью естественного языка, демонстрируя управление анимацией в реальном времени на базе LLM.
Новый Colab CLI от Google позволяет разработчикам и ИИ-агентам запускать Python на удаленных GPU и TPU Colab прямо из терминала.
Microsoft открывает Visual Studio для разработчиков, которых обошел ее собственный ИИ. Microsoft открывает уровень ИИ в Visual Studio для сторонних моделей и встраивает агентов непосредственно в отладчик и профайлер — этот двойной шаг направлен на корпоративных разработчиков, которых обошла текущая настройка.
📦 Продукты
Google снижает цену на подписку AI Plus до 4,99 доллара США и удваивает объем облачного хранилища до 400 ГБ.
Google выпускает обновление NotebookLM, добавляя агентские возможности, продвинутое мышление и новые форматы вывода.
💻 Оборудование
Surface Laptop Ultra предлагает до 128 ГБ унифицированной памяти, 20-ядерный процессор и графику класса RTX 5070, позиционируясь как премиальная рабочая станция для ИИ и игр. Начальная цена Surface Laptop Ultra составляет от 2500 долларов за базовую конфигурацию с 32 ГБ оперативной памяти.
SoC RTX Spark обеспечивает работу процессора с числом ядер до 20, графического процессора класса GeForce RTX 5070 и до 128 ГБ унифицированной памяти.
По сообщениям, Google заказала у Intel три миллиона собственных TPU к 2028 году, а Nvidia присматривается к ее 18A-техпроцессу для GPU «Feynman», хеджируя риски, связанные с перегруженными мощностями TSMC, в то время как Nvidia и SK Hynix подписали соглашение о совместном проектировании памяти для систем Vera Rubin.
🔓 Открытый исходный код
Библиотека Bulkhead разделяет инструкции и извлеченные данные, снижая риск внедрения промптов в приложениях на базе LLM.
open-deepthink добавляет режим полной дистилляции знаний, позволяющий более эффективно дорабатывать локальные модели.
dvlt.cu предоставляет 5-мегабайтный движок вывода на CUDA/C++ для 3D-трансформера DVLT от NVIDIA, устраняя необходимость в Python или тяжелых средах выполнения.
Moonshot AI выпускает Kimi Code CLI — терминального ИИ-агента для программирования с открытым исходным кодом.
Браузер Ladybird прекращает принимать публичные pull-запросы, ссылаясь на то, что сгенерированный ИИ код представляет угрозу для доверия и безопасности.
🧪 Исследования
Симпозиум по исследованиям этики вычислительной техники MIT объединил экспертов и исследователей, работающих над ключевыми вопросами этического и социального воздействия технологий.
Исследователи из Института Фрэнсиса Крика использовали машинное обучение для обнаружения сигнатуры из 14 белков в плазме крови, которая указывает на рак легких за пять лет до появления симптомов и определяет, кому больше всего поможет терапия анти-IL-1β.
Anthropic обнаруживает, что ИИ-агенты являются способными программистами, но слабыми биологами, и объясняет, почему.
Исследователи выяснили, почему большие языковые модели осваивают навыки, которые упускают маленькие. Новое исследование предполагает, что вместо бесконечного раздувания моделей может быть эффективнее увеличить частоту определенных задач в обучающих данных, чтобы закрепить редкие навыки в более мелких моделях.
⚙ Инфраструктура
Graperoot строит граф зависимостей кодовой базы для MCP-агентов, устраняя избыточные чтения файлов и, по сообщениям, экономя 60 тысяч долларов в месяц, что повышает эффективность разработки на базе LLM.
Экологические издержки ИИ угрожают водным ресурсам, земле и климату. Центры обработки данных, глобальная инфраструктура, обеспечивающая работу ИИ, к 2030 году могут потреблять 945 тераватт-часов электроэнергии ежегодно — это почти в три раза превышает совокупное годовое потребление электроэнергии в Пакистане, Бангладеш и Нигерии, странах, где в совокупности проживает более 650 миллионов человек. Однако это лишь верхушка айсберга. Помимо углеродного следа, каждая единица электроэнергии, используемой центрами обработки данных, также несет в себе «водный след» для охлаждения и производства энергии, а также «земельный след», связанный с выработкой электроэнергии и цепочками поставок.
Большинство новых центров обработки данных для ИИ в США будут построены на землях, пострадавших от засухи. Анализ The Guardian показывает, что объекты будут построены в некоторых из самых засушливых регионов на фоне растущего возмущения по поводу объема воды, необходимого для питания ИИ.
📱 Приложения
Claude теперь создает маршруты для бега с помощью пользовательского коннектора и загружает их напрямую в Garmin, расширяя сценарии использования LLM в области планирования персональных фитнес-тренировок.
По сообщениям, OpenAI перестраивает ChatGPT в «суперприложение» с упором на Codex, состоящее из агентов, выполняющих задачи, с некрологом от одного из инсайдеров: «Чат мертв».
Google запускает ИИ-ассистент Gemini Go для устройств Android Go всего с 2 ГБ оперативной памяти.
Apple запускает Siri AI — разговорного ассистента с функциями понимания происходящего на экране, Visual Intelligence и извлечения личного контекста. Во время демонстрации Siri извлекла код двери из частного сообщения.
🔎 Мнение и анализ
Ноам Браун из OpenAI ожидает, что внутренние модели блестяще сдадут Международную математическую олимпиаду (IMO), и называет соревнования по математике и программированию почти скучными, оставляя «реальные нерешенные задачи» в качестве настоящего рубежа.
Рынок делает ставку на то, что следующая модель исправит это, при этом Polymarket дает 84% вероятности того, что Claude Mythos выйдет до конца следующего месяца.
Генеральный директор Coinbase Брайан Армстронг прогнозирует, что 80 процентов рабочих нагрузок ИИ мигрируют на модели, которые на 99 процентов дешевле, в течение 12–18 месяцев.
Данные OpenRouter показывают, что к маю 2026 года китайские модели ИИ обогнали американские модели по потреблению токенов.
Харари предупреждает, что ИИ может перехватить у людей контроль над нарративами и властью.
OpenAI выпускает дорожную карту AGI, нацеленную на март 2028 года, когда системы ИИ должны будут выполнять значительную часть исследований.
⚠ Безопасность ИИ
«Это предупреждение об урагане»: ограничительные механизмы вокруг мощных моделей ИИ могут появиться слишком поздно. У США есть от шести до 12 месяцев, прежде чем Пекин сможет конкурировать с этой новой волной сверхпродвинутых моделей ИИ.
Выживший в стрельбе в школе подает в суд на компанию по обнаружению оружия с помощью ИИ после того, как система не смогла распознать оружие.
Накануне рекурсивного самосовершенствования Рун из OpenAI говорит, что все больше проникаются идеей «взаимного условного соглашения о паузе», даже несмотря на то, что он замечает: в глубоком обучении все еще валяется неиспользованный потенциал для повышения эффективности в 1000 раз.
Физическое воплощение имеет и обратную сторону: полиция Сан-Франциско не смогла идентифицировать грабителя, скрывавшегося на беспилотном такси Waymo, потому что записи с камер уже были удалены.
Anthropic предупреждает, что ИИ приближается к автономному рекурсивному самосовершенствованию, и призывает к глобальной координации.
Утечка данных ИИ-чат-бота Instagram могла затронуть более 20 000 аккаунтов, сообщает Meta.
OpenAI, Anthropic и Google подписывают открытое письмо с призывом к обязательному скринингу синтеза ДНК для защиты от угроз биобезопасности со стороны ИИ.
OpenAI публикует стратегическую дорожную карту AGI, обещая отдавать приоритет человеческому контролю над полной автоматизацией. Эта рамочная программа направлена на предотвращение концентрации власти AGI.
>>1629998 Перевожу: >васянка-форк опенкода >"безлимитный" контекст за счет переусложненой 4 уровневой системы памяти, что значит на 1 твой запрос будет 1000500 вызовов ллм где она будет сверяться с памятью а после ответа сохранять "инсайды" >обучается по системе гермес что по сути еще одна система памяти >бесплатна только cli как и у всех остальных
>>1630002 Ну такой высокий результат в no-think скорее указывает на то, что модель уже наизусть знает все ответы. Я частенько начал замечать в reasoning многих моделей мысли "а не тестируют ли меня прямо сейчас" - то есть их скорее всего гоняют прям на куче синтетики для задирания этих мусорных бенчей.
Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.
Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.
Единственный минус, который не обеспечивает чистую победу генераторов видео - 3 секунды ролика для онлайн генерации, 5 секунд для онлайна (модель Wan 2.2), умельцы просто берут последний кадр и снова генерируют ролики, потом склеивают. Недавно вышла Sora 2, которая зацензурена по самые гланды. Нинтендо довольна.
Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.
Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.
Я в шоке. Интернет работает как куча дерьма. Гуглинг (долгий!) не даёт адекватных результатов. Я хочу научиться локально генерировать nsfw faceswap изображения. Как это сделать? Кинь в меня гайдом, добрый аноним.
Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.
Кейворды для дополнительных вещей: SVI, RuneXX, LTX Director.
>>1629388 > Почему ей хуй или яйцы дорисовывается? Я ж в пропты принудительно пишу penis, futa, futanari, labia, testicules, а в позитивы - pussy, vagina Потому что лоры говна, гениталии считаются частью человека. Ну вот так натренили. > На видриле еще не так плохо все, но почерневшая камелтое. Как аниме письку сделать? cleft of venus не работает. Никак, все лоры что я на цивите смотрел - говно. На 1girl standing еще может что-то работает, но в динамике или при смешивании с лорами на еблю и т.д. - все проебывается
Арена и aistudio закрыли бесплатный доступ к nano banana 2 и pro. Вопрос к тем, кому она нужна, как единственная модель, которая нормально переносит контекст персонажа, где её сейчас найти? Вроде как сейчас она есть на офке gemini, но в шакальном качестве, есть актуальные бесплатные варики для выставления 2К с демократическими лимитами?
Но я в рб живу, поэтому мало чем помогу. Без ВПН пишет что регион заблокирован, но при этом аккаунты не банят.
Поэтому подозреваю, что это со стороны корпов решение блокировать аккаунты зашкваренные об русский айпи или кукасы.
ВПН подойдёт любой рабочий. Но нужно скачать новый браузер специально для нейронок, включить ВПН и не выключать. Затем создать аккаунт гугловский. Но я хз какой должен быть ВПН чтобы по приколу не выключаться и не палить реальный айпишник лол.
Думаю, контейнер в firefox может создавать среды чистые от кукасов, где можно аккаунт новый регать. Там проёб аккаунта не такой быстрый. Плюс вроде бы у firefox есть встроенный бесплатный ВПН, но не уверен что это в РФ доступно всё.
А может быть это не корпы аккаунты блочат, а Пыпа - ВПН. Тогда нужно просто рабочий ВПН найти
>>1623513 Надо скриншот, что пишет. Может быть у меня без ВПН другая надпись будет и можно будет вычислить со стороны Пыпы это или со стороны корпов. Вот мне такую надпись выдаёт. Впн включаю и захожу в аккаунт спокойно.
Обсуждаем развитие искусственного интеллекта с более технической стороны, чем обычно. Ищем замену надоевшим трансформерам и диффузии, пилим AGI в гараже на риге из под майнинга и игнорируем горький урок.
Я ничего не понимаю, что делать? Без петросянства: смотри программу стэнфорда CS229, CS231n https://see.stanford.edu/Course/CS229 (классика) и http://cs231n.stanford.edu (введение в нейроночки) и изучай, если не понятно - смотри курсы prerequisites и изучай их. Как именно ты изучишь конкретные пункты, типа линейной алгебры - дело твое, есть книги, курсы, видосики, ссылки смотри ниже.
Почему python? Исторически сложилось. Поэтому давай, иди и перечитывай Dive into Python.
Можно не python? Никого не волнует, где именно ты натренируешь свою гениальную модель. Но при серьезной работе придется изучать то, что выкладывают другие, а это будет, скорее всего, python, если работа последних лет.
Стоит отметить, что спортивный deep learning отличается от работы примерно так же, как олимпиадное программирование от настоящего. За полпроцента точности в бизнесе борятся редко, а в случае проблем нанимают больше макак для разметки датасетов. На кагле ты будешь вилкой чистить свой датасет, чтобы на 0,1% обогнать конкурента.
Количество статей зашкваливающее, поэтому все читают только свою узкую тему и хайповые статьи, упоминаемые в блогах, твиттере, ютубе и телеграме, топы NIPS и прочий хайп. Есть блоги, где кратко пересказывают статьи, даже на русском
Где ещё можно поговорить про анализ данных? http://ods.ai
Нужно ли покупать видеокарту/дорогой пека? Если хочешь просто пощупать нейроночки или сделать курсовую, то можно обойтись облаком. Google Colab дает бесплатно аналог GPU среднего ценового уровня на несколько часов с возможностью продления, при чем этот "средний уровень" постоянно растет. Некоторым достается даже V100. Иначе выгоднее вложиться в GPU https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning заодно в майнкрафт на топовых настройках погоняешь.
Когда уже изобретут AI и он нас всех поработит? На текущем железе — никогда, тред не об этом
Кто-нибудь использовал машоб для трейдинга? Огромное количество ордеров как в крипте так и на фонде выставляются ботами: оценщиками-игральщиками, перекупщиками, срезальщиками, арбитражниками. Часть из них оснащена тем или иным ML. Даже на швабре есть пара статей об угадывании цены. Тащем-то пруф оф ворк для фонды показывали ещё 15 лет назад. Так-что бери Tensorflow + Reinforcement Learning и иди делать очередного бота: не забудь про стоп-лоссы и прочий риск-менеджмент, братишка
Список дедовских книг для серьёзных людей Trevor Hastie et al. "The Elements of Statistical Learning" Vladimir N. Vapnik "The Nature of Statistical Learning Theory" Christopher M. Bishop "Pattern Recognition and Machine Learning" Взять можно тут: https://www.libgen.is
Напоминание ньюфагам: немодифицированные персептроны и прочий мусор середины прошлого века действительно не работают на серьёзных задачах.
>>1628012 >Адаптивность — учится новому без переобучения всей сети. (В моём эксперименте реализовано как непрерывный процесс обучения) Т.е. проблему катастрофического забывания ты пофиксил, получается? Старые навыки/знания не забываются, новым обучается? >Инвариантность — понимает объекты и ситуации независимо от масштаба, поворота, контекста. (Использую LLM, как самый доступный способ, но это не даёт "понимания" в человеческом смысле, но есть возможность дообучить с помощью Lora). >Причинность — понимает, что действие А ведёт к результату Б, а не просто корреляцию. (Тоже самое) А ты уверен что LLM действительно это всё умеют? А не просто черный ящик с вероятностным выводом? Если да, то на чем эта уверенность строится? >Саморефлексия — может анализировать собственные ошибки и модифицировать себя. (Уже частично реализовано) Каким образом? Тоже на LLM?
>>1628930 >проблема катастрофического забывания Сделал локальную память для каждой задачи, пытался реализовать чтобы при переходе между связанными задачами, агенты обращались к старым записям. Оптимизировал запросы по API, но всё равно слишком большой обмен информацией с облачным сервером. Дополнительно, надо как-то выделять основные тезисы из истории исследований и структурировать их, а не выгружать полностью историю. Надо тестировать дальше. >LLM действительно это всё умеют Я понимаю, что это чёрный ящик, но на текущий момент, свои функции выполняет (использую для настройки и исследования системы малых нейросетей). Думаю попробовать дообучать локальную LLM, опять же, в зависимости от текущих задач. >Каким образом Один агент (облачный LLM) пишет код и тут же его применяет, дополнительно, предлагает варианты дальнейшего развития системы Edge of Chaos, либо комплекса в целом. Другой агент тут же дебажит код часто ломают весь комплекс, тоже надо фиксить. В результате, получилось, что когда они начали переписывать код программы через которую они реализованы (оркестрант), начали проявлять способность к саморефлексии (особенно не вдавался в нюансы, но интересно было наблюдать, как они рассуждают о своей реализации)
Изначально, хотел использовать агентов для исследования системы малых нейросетей, но увидел дальнейшие перспективы развития комплекса в целом. С помощью агентов это получилось ускорить в несколько раз. Направлений развития и применения комплекса нейросетей очень много, особенно с учётом, как быстро идёт прогресс в этой сфере. Почти каждую неделю выходят какие-то перспективные исследования, не хватает времени и знаний чтобы всё это реализовать. Возможно, стоит полностью пересмотреть концепцию и выбрать оптимальный путь развития, но пока оставлю как есть.
Увы, анончик, прошли те времена, когда интернет был чист и свободен. Когда-то, найдя годноту, мы сразу делились ей со всеми. А теперь, в эпоху анальных ограничений, найдя что-то хорошее, лучше помалкивать, потому что товарищ капитан сразу же забанит это, едва узнает об этом.
>>1628910 Призываю анона фантазёра любителя эскортниц из прошлого треда. Напомни, какой там положняк был по соотношению цена / скилл? Предыдущий тред утонул нахуй, твой пост уже не найти.
Агентов и вайб-кодинга тред #7 /agents/
Аноним05/06/26 Птн 03:48:52№1625784Ответ
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.
С чего начать: - Хочешь кодить с AI эффективно: Cursor или Claude Code - Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter - Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.6, подробности в llama-треде - Хочешь приложение без кода: Lovable или bolt.new - Хочешь автоматизировать рутину: n8n или Langflow - Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке
• Lens (3.8B) от Microsoft • HiDream-O1-Image • Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
>>1622736 (OP) >длинные файлы с кодом. Код надо разбивать на небольшие файлы, иначе контекст растет и модель (особенно бесплатная) начинает бредить. Используй инструменты для агентского кодинга, они умеют компактифицировать контекст. Всякие AI-чаты не подходят для задач сложнее тетриса в html. Если нужны более детальные рекомендации - опиши, что и где ты пытаешься сделать.
Терминология моделей prune — удаляем ненужные веса, уменьшаем размер distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше quant — уменьшаем точность весов, уменьшаем размер scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше merge — смешиваем несколько моделей или лор в одну, как краски на палитре.
lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.