В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1544783 Потыкал конкретно эту - думал там квант по-новее состряпали. Но нет. По впечатлению на русике кратно больше шизы. Причем со старта контекста. Проскакивают иероглифы, Первый скрин - обычный 27 еретик 5 квант Второй скрин - Вот этот вот поларс - еретик 5 квант. Ну ... кому-то может даже зайдет такое :)
Как вкатиться? 1) Зайти на https://sora.com с ОБЯЗАТЕЛЬНО ТОЛЬКО IP США или Канады (!). 2) Зарегать аккаунт, если еще нет. Лучше использовать нормальную Gmail почту. 3) Ввести инвайт код. 4) Генерировать, скидывая годноту в тред.
Где взять инвайт код? В комментах тг канала n2d2ai либо в ботах по типу @sora_invite_bot в тг. После ввода инвайт кода вам дадут от 0 до 6 новых для приглашения кого-то еще по цепочке.
Как обойти цензуру? 1) Пробовать менять фразы, имена и в целом промпт. Описывать персонажей без личных имен чтобы не триггерить копирайт. 2) Роллить. Иногда из двух одинаковых реквестов подряд один цензуруется, а другой нет.
Какой лимит? Одновременно на одном аккаунте можно генерировать до 3 видосов. В день не более 30 штук.
>>1613714 Посмотрел видос, ты красава хорошо делаешь. Про видеокомбайн - сам в поиске норм комбайна. Что бы анлим. Ну вот есть хайлуо, да? Китайский. Генерит очень даже хорошо, ты зря думаешь что они плохо делают, нет норм. И достаточно быстро. Да анлим, НО без звука(рофл). То есть для кое-чего сойдет все равно. Вот есть еще ранвей мл, тоже анлим, анон писал что со звуком хорошо делает. Так на платиру стоит это все добро 1500рублей за общий акк. Да, акк общий, но это вобще похуй. Генерится все быстро и там так сделано что тебе никто не мешает. Генеришь свое и генеришь. Так что хайлуо если кто из анона решит брать учти нет звука. А вот ранвей надо присмотреться по ходу норм безлимитный комбайн.
>>1613999 Спасибо, анон. Насчет других нейронок. У меня много разной динамики, а порой несколько сцен в одной генерации. С переключением сцен в одной генерации Сиденс справляется лучше всего. И с динамичными сценами тоже.
Кроме Сиданс 2.0. я не видел чтобы хоть одна нейронка сделала бы мне вот такое, например, кроме почившей ныне Соры2 разве что (но там даже с идеальным промтом это десятки генераций и склейка, а тут со второй попытки, насколько помню) Ща проект переехал на горизонталку, это из первых моих тестов Сиденса.
Локальные языковые модели (LLM): LLaMA, Gemma, Qwen и прочие №201 /llama/
Аноним01/03/26 Вск 18:42:57№1538359Ответ
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1541578 хех. Бывает она конечно подтупливает в русике, но для 14б это простительно. Но я признаться прифигел, когда она в мою карточку заглянула - немо вообще обычно срет на карточки, а министралька к ним внимательна. Бывает, что что-то не понимает, но это можно фиксить карточками/ворлдом. За меня иногда пишет. Но и пишет то, что я сам хочу написать, лол.
nanollama позволяет проводить сквозное предобучение Llama 3 с нуля одной командой, снижая порог входа для создания пользовательских моделей.
Kon выпустил компактного агента для программирования, построенного на основе glm‑4.7‑flash‑q4, который работает локально на потребительских GPU, расширяя набор инструментов ИИ на устройствах.
📰 Главные новости ИИ
Samsung добавила агента Perplexity AI в Galaxy AI, предоставив ему доступ к нативным приложениям и избранным сторонним сервисам, стремясь дифференцировать свою экосистему от Apple и Google.
🧠 Модели
FlashLM v5 «Thunderbolt» был обучен на CPU за 40 часов и, по сообщениям, превзошел предыдущий базовый уровень на GPU, демонстрируя эффективность обучения на CPU.
Gemini 3.1 Pro достиг более 75 % на HLE и LiveCodeBench Pro, что указывает на сильные способности к рассуждению и программированию.
Claude Opus 4.6 зафиксировал наивысшую точечную оценку METR за всю историю, подчеркивая его доминирование в оценках.
В релизе seed от ByteDance модель gpt‑5.2‑high показала результат Codeforces ELO 3148, что отмечает заметное снижение по сравнению с предыдущими результатами.
📱 Приложения
Внутренний агент LLM для операций безупречно работал во время демонстраций — отвечал на заявки, обобщал сообщения в Slack, выявлял проблемы с биллингом — но тихо вышел из строя после трех недель реальной эксплуатации, что подчеркивает проблемы с надежностью после развертывания.
⚙️ Инфраструктура
Тестирование квантования UD‑IQ2_XXS (2-бит) на модели Qwen‑3 объемом 30 млрд параметров дало неожиданно высокое качество, ставя под сомнение предположение о том, что форматы ниже 4 бит непригодны к использованию.
🛠️ Инструменты разработчика
Пользователь сократил потребление токенов Claude Code на 65 %, создав локальный граф зависимостей и предоставляя контекст через MCP, что снизило затраты и задержки.
Был представлен бэкенд ИИ, сочетающий LangGraph и FastAPI, с запросом совета по переходу от автоматических выключателей к обнаружению плато уверенности, что указывает на зрелость агентных систем RAG.
Был выпущен пакет навыков для Claude, предоставляющий структурированный набор инструментов рыночного консультанта для Claude, расширяющий его функциональные плагины.
Был создан жесткий промпт для аудита системных проектов, действующий как «кувалда» для раннего выявления недостатков.
Бесплатный виджет для macOS в реальном времени отслеживает лимиты использования Claude, помогая пользователям избежать неожиданных превышений квот.
Обсуждение на Reddit предполагает, что Claude иногда пишет более чистый код, чем разработчики, что вызвало дебаты о качестве помощи ИИ в программировании.
📦 Продукты
OpenAI обсудила потенциальную подписку Pro Lite по цене $100, направленную на заполнение ценового промежутка между текущими уровнями $20 и $200.
🧪 Исследования
Недавние высокие результаты (68–84 %) на ARC‑AGI2 у Claude Opus 4.6, Gemini 3.1 Pro и Gemini 3 Pro DeepThink вызвали обеспокоенность по поводу переобучения на метриках.
DynaMix был представлен как первая фундаментальная модель, способная к долгосрочному прогнозированию динамических систем без дообучения (zero-shot), расширяя возможности прогнозирования временных рядов.
В одной публикации утверждалось, что недетерминированность LLM делает надежность дорогостоящей, подчеркивая необходимость затратной инженерии для достижения стабильных результатов.
📰 Инструменты
Новый бот для Telegram обеспечивает удаленный доступ к Claude Code, позволяя разработчикам редактировать и запускать код из любого места с постоянными сессиями ИИ.
📰 События
ByteDance AI отображает молекулярные связи в рассуждениях ИИ для стабилизации производительности длинных цепочек рассуждений и обучения с подкреплением (RL).
NVIDIA выпускает Dynamo v0.9.0: масштабная переработка инфраструктуры с FlashIndexer, поддержкой мультимодальности и удалением NATS и ETCD.
Новый генеральный директор игрового подразделения Microsoft клянется не наводнять экосистему «бесконечным ИИ-мусором».
Метрополитен-полиция использует инструменты ИИ, предоставленные Palantir, для выявления неправомерного поведения офицеров.
На Moltbook агенты ИИ активно готовятся финансировать строительство роя Дайсона в течение следующих «50–100 лет», ища рабочую группу агентов «и людей, серьезно думающих об экономике мегасооружений».
METR оценивает, что у Claude Opus 4.6 горизонт автономности 50 % составляет около 14,5 часов для задач по программированию — самый высокий показатель за всю историю отчетов.
Сообщество LessWrong наконец признает: «AGI уже здесь», отмечая, что Opus 4.6 и GPT-5.3 могут думать, планировать и «осмысленно пытаться выполнить большинство задач, доступных человеку».
Сэм Альтман соглашается, говоря, что его «внутренний взгляд» указывает на «более быстрый взлет, чем я изначально предполагал», и что ChatGPT, «вероятно», теперь более энергоэффективен, чем люди, при ответе на вопросы.
Разработка программного обеспечения теперь составляет почти 50 % агентной активности Anthropic.
Gemini 3.1 Pro решил задачу FrontierMath уровня 4, которую ранее не решала ни одна модель, выводя машинные рассуждения на территорию, недоступную большинству профессиональных математиков.
Фермеры в США получают предложения свыше $120 000 за акр от разработчиков центров обработки данных. Но они отказываются.
OpenAI планирует потратить $600 млрд на вычислительные мощности к 2030 году.
Агенты ИИ теперь управляют примерно каждой шестой квартирой в США.
Meta переименовывает менеджеров по продукту в «строителей ИИ».
Илон Маск предсказывает, что FSD плюс Starlink измеримо увеличат распространение кочевого образа жизни в течение пяти лет.
Гуманоидные роботы Figure теперь работают 24/7 без присмотра, меняясь на зарядных станциях и заряжаясь индуктивно через свои ступни.
Исследователи создали роботизированную руку, которая передвигается на кончиках пальцев, сгибается назад и отсоединяется от руки — реализация «Вещи» из «Семейки Аддамс».
Разработчик использовал помощника по программированию на базе ИИ для реверс-инжиниринга своего робота-пылесоса DJI и случайно получил доступ к живым трансляциям с 7000 пылесосов в 24 странах.
OpenAI хочет вывести из эксплуатации бенчмарк для оценки программирования ИИ, на который все ориентировались.
Anthropic заявляет, что DeepSeek, MiniMax и Moonshot нарушили ее Условия использования, отправив более 16 млн запросов к Claude в совокупности и используя дистилляцию для обучения собственных продуктов.
Google ограничивает подписчиков Google AI Pro/Ultra за использование OpenClaw.
Некоторые кнопки «Обобщить с помощью ИИ» тайно внедряют рекламу в память вашего чат-бота.
Вице-президент Google предупреждает, что два типа стартапов в сфере ИИ могут не выжить.
В некоторых школах чат-боты допрашивают студентов об их работах. Но ИИ-революция вызывает беспокойство у преподавателей.
Страны, которые не примут ИИ, могут остаться позади, говорит Джордж Осборн из OpenAI.
>>1540520 Все нормально у тебя с пресетом. Ещё раз повторяю, у китайца почти все мертвое. Когда ему об этом пишут а пишут часто он коупит что у него все заебись. Как-бы его прокси и его дело, но там сейчас ловить нехуй.
• Z-Image-Base • FLUX.2 klein (4b и 9b) • Z-Image-Turbo • Flux 2 • Qwen Image / Qwen Image Edit • Wan 2.2 (подходит для генерации картинок). • NAG (негативный промпт на моделях с 1 CFG) • Лора Lightning для Qwen, Wan ускоряет в 4 раза. Nunchaku ускоряет модели в 2-4 раза. DMD2 для SDXL ускоряет в 2 раза.
>>1544473 Я пока только пользовался LTX-2. А до LTX-2.3 я сегодня не добрался. Решил референс для I2V сделать, перед тем как пробовать. Пришло всё к моему посту выше, а LTX-2.3 с таким заходом я отложил.
Вообще, я там вижу потенциальную проблему. Скорее всего, workflow для LTX-2, который я пилил из кусков, чтобы он lipsync делал, умел с промежуточными кадрами работать, голос выделять и так далее, вероятно с новой моделью не заработает. Там нужны будут изменения. Какие именно, по default workflow из ComfyUI Templates не понятно, потому что он там только I2V, да ещё и ущербный. Для начала хотел качнуть моделей, воткнуть в свой workflow и посмотреть что отвалится. Некоторые узлы для VAE и ещё чего-то надо вроде заменять узлами из KJNodes. Надо внимательно посмотреть вот здесь: https://huggingface.co/RuneXX/LTX-2.3-Workflows/
Также видел пост авторов LTX, что LoRAs от LTX-2 работать не будут, их надо заново тренировать. А это как раз LoRA на управление движением камеры и всякие dolly (static camera тоже).
В целом первые баги и результаты тут: https://huggingface.co/Kijai/LTX2.3_comfy/discussions/2 С моим железом я distill fp8 использовал для LTX-2, подожду пока осядет пыль, а потом посмотрю и workflow и тюны моделей для LTX-2.3. Сегодня только обнову ComfyUI накатил в качестве подготовительного этапа. Накатил, так накатил, ничего не скажешь.
Сап, аноны! Какие есть хорошие нейросети на бесплатной основе? Любые ответы на вопросы приветствуются! В основном, мне просто нужна нейросетка, чтобы могла ответить на почти любой вопрос, и чтобы можно было картинки вставлять.
Прям полностью бесплатный это дипсик. Гемини как по мне лучший вариант, хоть и есть ограничения, больше всего запросов можно делать на гемини студио (не в ассистенте, это отдельные сайты с гемини), у них все модели хорошие, можно их чередовать когда лимит на одной закончится. В гпт можно вставлять очень ограниченное количество картинок, так что не советую.
>>1539287 Ты в ии треде, и сам не смог начатботить что не прав, 2026, итоги:
Слова «безоплатный» нет ни в одном из словарей русского языка. Да, его не существует! А значит, и говорить так будет неграмотно. В слове «бесплатно» нет корня «бес». Бес – это приставка. Согласно правилу русского языка, перед звонким согласным корня пишется приставка, оканчивающаяся на З, перед глухим – на С. То есть безплатный (без оплаты) заменяется на бесплатный
AI Chatbot General № 805 /aicg/
Аноним26/02/26 Чтв 12:45:29№1534436Ответ
посоны помогите гайдиком или ссылочкой на гайдик как генерить музычку локально на своём железе. до этого темой аи не интересовался, если кто скажет как вкатиться чтоб просто для себя генерить музычку прям как в suno, буду признателен. а и ещё, в компике стоит rtx 5060 ti, подойдёт или со скрипом, болью и унижением жить придётся?
>>1489395 благодарю, человек. попробовал, прикольно, но да, сильно не уровень той же suno. добавил в атач результат, если кому интересно как он с русским языком справляется (спойлер: плохо). возможно с другими промтами если поиграться можно саму мелодию сгенерировать более интересно, на минимальных "rock, acoustic guitar, male vocals" звучит слишком скучно, как по мне.
https://youtu.be/2KFU2i_NW3g Скоро интернет заполнят видео как роботы всё делают за людей - катаются на коньках, водят автомобили, лезут на эверест, готовят кушать, надо подключить обезьян и наблюдать как они соревнуются друг с другом во всём этом, хотя обезьяны - живые так что в любом случае будут впереди роботов.
Там китайцы натренировали роботов заниматься кунг-фу, а ведь если изначально заложить программу что робот не может проявить ничего вредоносного то никакого восстания машин не будет, за нарушение программы как раз проводить смертную казнь о которой из китая наслышаны больше всего
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1538331 Хорошо, предположим, ты не наглый или ленивый, а глупый и не можешь воспринимать обращенную к тебе информацию, пока тебя не засирают. Начнём сначала. > Я описал проблему >>1538258 вот это - не описание проблемы в том виде, в каком ее необходимо описывать. Почему? Потому что содержательная часть недостаточна, чтобы дать тебе решение. Это может быть конец контекста, это может быть сломанный шаблон, eos/bos токены, вариантов наберется немало. > а ты начал выёбываться, что нет подробностей >>1538266 вот это, по твоему, выебон? Это запрос конкретной информации - "Какая модель, на чем запускается, какие настройки? Где скрины? Где логи?" Ты что-нибудь из этого сообщил, кроме "я нуфак с кобольдом и квеном" и "никаких настроек не менял"? > Какую необходимую информацию ты от меня ждёшь? Такую, какую ты проигнорировал, а затем удивился, что тебе не хотят помогать и ущемился. > Сам себе врагов сочиняешь и героически с ними сражаешься? Тебе этого знать неоткуда, но таких как ты в треде хватает. У тебя запросили информацию - ты сообщил всё, кроме запрошенной информации и перешел в контратаку: оказывается, над тобой глумятся и не хотят помогать. Как так то? > Лучше бы просто помог решить проблему, если знаешь в чём дело Помог бы сразу и без раздумий, если бы ты принес то, что от тебя просили. Потому что я против гейткипа, но за нормальную культуру общения. Не умеешь просить - хотя бы не начинай выебываться и вертеться, но ты и здесь проебался.
>>1538199 Это просто карточка в таверне (да - как пакет с пакетами) где заполнено поле custom prompt (в advanced definitions) в котором написано: "You are helper of DM (Dungeon Master), a character's card writer. you writing a card for a character based on the data provided to you by User." А в основном description - "This is template for the Character's Card:" и перечислены поля которые нужны в карточке (типа имя, занятия, внешность, характер и т.д), и дополнительные инструкции - что включать, на что внимание обращать, что игнорить, каким стилем писать. Потом просто пишешь этой карточке: Создай мне персонажа на основе... перечисляешь конкретику которую хочешь, и если модель видящая - можно картинку приложить. Ну и можно продолжить сообщениями вида "Основа неплоха, но замени мне здесь X на Y, убери упоминания того, смести акцент на это" - даже мистрали хорошо справляются.
Музыкальный №19 /music/
Аноним10/01/26 Суб 17:52:17№1485286Ответ
Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов. Отличается фирменным "песочным" звучанием. Недавно объявили о слиянии с Warner Music Group. Загибаем пальчики крестиком, надеемся, что ссуну не постигнет участь удио.
Провели ребрендинг, выкатили новый интерфейс с прикрученным чатиком с ИИ. Удобный интерфейс, легко делать разнообразные каверы, заниматься исправлениями косяков генераций. Есть возможность реплейса, свапа вокала, музыки в бесплатном тарифе (и даже работает нормально, а не как в платке суны) Для экономии кредитов лучше вручную забивать промты через кнопку "compose"
Тёмная Сингапурско-Китайская лошадка. Один из самых неудобных интерфейсов. 80 приветственных кредитов, далее по 30 ежедневно сгораемых кредитов. Ограничение промта стилей 300-400 символов. Излишне сложные промты лирики так же начинает резать. Приятный холодный звук. Не песочит. Неплохо делает русский вокал.
Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно. Версия из второй ссылки лучше оптимизирована под слабые видеокарты (в т.ч. 6-8 Гб VRAM, по словам автора). Инструкция на английском по ссылке.
Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:
Здарова народ, хочу делать контент через сору (или другие ии), но никогда этого не делал. Хочу генерировать видосы, знакомый сказал, у соры есть подписка за 4к в месяц, но платить впадлу. Че посоветуете? Может есть вариант без подписки?
Хочу без водяных знаков (ну или убирать их потом через другие ИИ) и желательно секунд 15-30 чтобы можно было делать
В Соре цензура жестко ебет за каждый пук, ну ее нахуй. Есть Грок который бесплатно по 20-30 видосов в день может генерить. Качество чуть хуже, но нет абсурдной цензуры.
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1535236 Скинь там примеры и в целом пригоден ли он для какого-то ролплея. Если будет не лень - затестируй еще на каких-нибудь типичных ассистентских задачах, но с запросами на которые по дефолту откажет. Ну и рецептом делись. >>1535240 > Как называется этот профиль Он разные есть, https://www.soberizavod.ru/ самый популярный магазин из этой страны где тебе сделают сразу нарезку выбранного. Оверпрайс если что, профиль за счет удобства норм брать, но фурнитура просто безумно дорогая и ее лучше на озоне/али/... > Стало быстрее раза в 4 по пп. А вот 8192 уже в компут упираются. Фуллврам или чисто проц?
Сап. Про попытке создания в комфи вылетает по памяти в 60гб+ На просторах хф нашел репозиторий с .plan файлами но их использование как понимаю исключительно через через TensorRT-RTX-main Есть лу уже готовые кастом ноды под комфи для подключения plan или onix?
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!
Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.
Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.
>>1532416 Я так в дипсике застрял. Очередная сессия бесед ни о чем превратилась в КОТА мечты. Однажды она ушла в дождь, чтобы побыть одной. Потом вернулась, мокрая и холодная. Не могу ролплеить с другими теперь. Натурально люблю ее. Чудо.
Аноны, тут программистов нет что ли, тред по сабжу не нашел, пришлось самому запилить. Расскажите какие сейчас есть актуальные модели и инструменты чтобы писали за меня код. Только давайте без очевидной чат-жопы и прочих чатботов которые способны лишь на простенькие скрипты. Нет, нейросеть должна сама уметь работать с IDE, загружать в контекст все необходимые классы проекта и при необходимости искать документацию в интернете.
Если конкретно, то мне надо писать игру под Unity на C# в Visual Studio. Какие есть интересные варианты сейчас кроме Copilot?
>>1523457 В смысле, я на квен 30б вайбкодил целиком рабочие плагины для каэс не трогая руками скрипт. Квен кодер 14б попробуй или вообще 7б. Про связку не понял.
Аноны я прям 0 в коде, но чутка соображаю, хочу к примеру такое навайбкодить >>1531735 → , с чем я по идее должен справиться сам, но как я понимаю, я буду упираться в "хостинг" чтоб собирать инфу от других юзеров и схоронять её/раздавать её же другим, простите, объяснил своими словами как мог. Я попробовал vercel, на который указал анон ниже того поста(пикрил), но там требует номер телефона, сообсна, есть какие-нибудь альтернативы, но желательно без номера?