Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред
Check this out!

Раздел для обсуждения нейросетей и всего, что с ними связано.

Для доступа в /nf/ писать сюда

<<
Каталог
Тред веб-версии нейросетей (ChatGPT, Claude, Gemini и пр.) №1 /aiweb/ Аноним 02/05/26 Суб 14:32:32 1603342 Ответ
ChatGPTlogo.svg.png 65Кб, 960x960
960x960
ClaudeAIlogo.svg.png 32Кб, 960x207
960x207
GoogleGeminilog[...].png 8Кб, 330x75
330x75
DeepSeeklogo.svg.png 26Кб, 960x204
960x204
Общаемся с ИИ, почти что AGI самыми продвинутыми текстовыми моделями: GPT, Claude, Gemini и прочими. Горим с ограничений, лимитов и банов, генерим пикчи, пишем код и спорим о том, какая модель лучше.

Основные сервисы:
- ChatGPT: https://chatgpt.com/
- Claude: https://claude.ai/
- Gemini: https://gemini.google.com/
- Grok: https://grok.com/
- DeepSeek: https://chat.deepseek.com/
- GLM: https://chat.z.ai/

Большинство сервисов доступны бесплатно с ограничениями. Подписки открывают доступ к более мощным моделям, увеличенным лимитам и дополнительным функциям (генерация изображений, файлы, память и т.д.). Цены и условия у всех разные и периодически меняются.

Советы по регистрации:
1. При необходимости используй VPN.
2. Заведи нормальную почту (временные часто режутся).
3. Регистрируйся на нужной платформе.
4. Иногда требуется номер телефона — используются сервисы виртуальных номеров.
5. Пользуйся.

VPN в ряде регионов обязателен. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций:
https://github.com/f/awesome-chatgpt-prompts

Статусы сервисов (при проблемах сначала идти туда, может это общий сбой):
https://status.openai.com/
https://status.anthropic.com/
https://status.cloud.google.com/

Токены и лимиты зависят от модели. У всех разные контексты, цены и ограничения.

Посчитать свои токены можно здесь:
https://huggingface.co/spaces/Xenova/the-tokenizer-playground

Что могут нейросети:
- писать правдоподобные тексты
- помогать с кодом
- объяснять сложные темы
- генерировать изображения (не везде)

Что не могут:
- гарантировать истину
- стабильно решать сложные задачи без ошибок
- полностью заменять специалистов
- захватывать мир (пока)

С каждым обновлением усиливаются фильтры и ограничения. NSFW-контент режется всё чаще. Кумеры со всего мира в печали.
Пропущено 3 постов
1 с картинками.
Пропущено 3 постов, 1 с картинками.
Аноним 10/05/26 Вск 00:50:38 1608674
>>1603342 (OP)
Ты наркоман? Уже есть треды всех этих тем. Нахуя ты всё в кучу свалил?
Аноним 10/05/26 Вск 00:53:39 1608678
>>1608674
Где? Они все мёртвые же. 9 месяцев предыдущий по чат гпт катили >>1244803 (OP)
Тред по Клоду вообще утонул.
Аноним 11/05/26 Пнд 14:35:02 1609653
Ну и че за дауны сделали, что в квиз тестах гемини теперь правильный ответ сразу не показывается как и подсказки, сука тупые менеджеры вечно все портят
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №231 /llama/ Аноним 06/05/26 Срд 13:29:04 1605947 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
177096712937110[...].png 1409Кб, 1280x960
1280x960
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1603482 (OP)
>>1601740 (OP)
Пропущено 507 постов
50 с картинками.
Пропущено 507 постов, 50 с картинками.
Аноним 08/05/26 Птн 22:26:07 1607851
>>1607797
5060ti для начала уже хорошо, и картиночки и ллм. Как раз и смежные области раскуришь, буст будет не только в куме. На крайняк видяха в игорях будет полезна
Аноним 08/05/26 Птн 22:30:36 1607853
Укатывайтесь от сюда уже, где эта ленивая жопа
ПЕРЕКАТ Аноним # OP 08/05/26 Птн 22:43:29 1607860
Помогите подобрать модель ии и лор Аноним 07/05/26 Чтв 06:28:12 1606481 Ответ
2026-05-0702-28[...].png 1464Кб, 768x1152
768x1152
Работаю в Стабилити Матрикс, очень юзелесс прога для ии, поставил себе более менее модель на базе SD 1.5 и лору на такой же, проблема заключается в том что руки выходят кривоватые, и возможно ли мне стоит перейти на более продвинутые модели, ниже скину пример своих фотографий сделанный на персонажа Тсунаде из наруто, спасибо за любые подсказки
Пропущено 4 постов
5 с картинками.
Пропущено 4 постов, 5 с картинками.
Аноним 07/05/26 Чтв 06:37:18 1606486
Аноним 07/05/26 Чтв 07:02:29 1606497
Аноним 07/05/26 Чтв 19:22:01 1606918
image.png 81Кб, 259x194
259x194
>>1606481 (OP)
>Работаю в Стабилити Матрикс, очень юзелесс прога для ии, поставил себе более менее модель на базе SD 1.5
Как наверстать технологическое отставание в области ИИ? Аноним # OP 01/03/26 Вск 15:47:48 1538133 Ответ
347092928709598.webp 210Кб, 1280x800
1280x800
Двач, хочу с тобой посоветоваться по вропосу что делать чтобы наверстать технологическое отставание в области ИИ.

TL:DR: Страна капитально отстает от США\Китая в области ИИ. Возможно ли это наверстать и что для этого надо сделать?

Отвечаю за ИТ в большой структуре. По уровню автоматизации и выполняемым проектам отстаем от мира на 20 лет. Внимательно смотрю на ИИ-революцию на западе и понимаю что это отставание мы уже не догоним.
Постоянно общаюсь с крупными вендорами, они в иишку даже не смотрят (1С, Аскон, Интермех и т.д.).

Общаюсь с нашими разработчиками ИИ (Яндекс\Сбер) тоже все достаточно грустно.

Что надо сделать чтобы у нас появились технологии, предложения и нормальные проекты по внедрению сетей?
Пропущено 107 постов
10 с картинками.
Пропущено 107 постов, 10 с картинками.
Аноним 07/05/26 Чтв 07:12:35 1606503
>>1538133 (OP)
Для доступа к передовым знаниям и технологиям, для начала нужно перестать блокировать глобальные интернеты.
Чем больше доступа у всех подряд ко всему подряд - тем больше рандомных россиян могут в перспективе стать ML-специалистами (в том числе).
Аноним 07/05/26 Чтв 09:20:50 1606543
>>1606503
Только пока почему-то не стали за 30 лет. Всё, эксперимент закончился провалом, нужно что-то другое придумывать
Аноним 07/05/26 Чтв 13:34:52 1606724
>>1538133 (OP)
>Как наверстать
Не нужно вам ничего наверствовать. Дай вам технологии, вы вместо нормальной страны построите ещё более жуткий кибергулаг, чем в северной корее.
бля че делать. Платная подписка Pro на Cursor. Использовал 1 процент от всех токенов. Но у меня абсо Аноним 29/04/26 Срд 16:45:33 1601030 Ответ
image.png 11Кб, 1315x1020
1315x1020
бля че делать. Платная подписка Pro на Cursor. Использовал 1 процент от всех токенов. Но у меня абсолютно не работают модели от Claude. Включал впн, в настройках винды регион США стоит. Но раньше просто писало, что ваш провайдер не поддерживает данную модель, а щас то, что на скрине. Что делать, может кто знает.
Аноним 07/05/26 Чтв 12:08:16 1606663
c77a51455c8795c[...].jpg 67Кб, 1080x1080
1080x1080
>>1601030 (OP)
Установи программу v2rayN, купи прокси на месяц за 2-5 баксов или 200 руб, подключи к программе v2rayN и открывай редактор cursor или любой другой.
Проблемы не будет.
Как пользоваться спроси у гугл ИИ не тупой надеюсь.
AI Chatbot General № 820 /aicg/ Аноним 25/04/26 Суб 09:58:58 1597187 Ответ
image.png 812Кб, 1280x837
1280x837
Bladerunner.mp4 3425Кб, 960x720, 00:00:51
960x720
image.png 4Кб, 328x50
328x50
AI Chatbot General № 820

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышел Claude Opus 4.7: https://www.anthropic.com/news/claude-opus-4-7
• Вышел Deepseek V4: https://api-docs.deepseek.com/news/news260424

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards
• NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern
• Risu: https://risuai.xyz/ | https://rentry.org/ox5cw9p8

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• DeepSeek: https://api-docs.deepseek.com/
• GLM: https://docs.z.ai

Пресеты
• Тредовский список: https://rentry.org/2ch-aicg-jbs
• Бургерский список: https://rentry.org/jb-listing

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utilities
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• /aicg/hub: https://aicg-hub.ru/characters.html
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://aicg.neocities.org/botmaking
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4
• Бургерские боты: https://aicg.neocities.org/bots

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• OpenRouter: https://openrouter.ai/
• Арена: https://lmarena.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives4
• Локальные языковые модели: >>1596667 (OP)
• Шаблон шапки: https://rentry.org/aicg_shapka

Прошлый тред: >>1589197 (OP)
Пропущено 1496 постов
206 с картинками.
Пропущено 1496 постов, 206 с картинками.
Аноним 07/05/26 Чтв 11:34:58 1606637
анончики, есть гайд, как через проксю картиночки генерить? А то я совсем походу глупенький и не могу разобраться. Это через таверну делается?
Аноним 07/05/26 Чтв 11:39:41 1606639
>>1606636
сейм
клода нет, гемини упала, дипсик параша, глм туда же
кста, перекат.
Аноним 07/05/26 Чтв 11:41:33 1606642
Новости об искусственном интеллекте №68 /news/ Аноним # OP 01/05/26 Птн 22:52:27 1602980 Ответ
image 2326Кб, 1024x1024
1024x1024
image 2734Кб, 1448x1086
1448x1086
В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1600509 (OP)

🚀 Последний обзор ИИ новостей:

🏭 Компании

SoftBank формирует робототехническую компанию для строительства центров обработки данных и нацелена на IPO стоимостью 100 миллиардов долларов, что сигнализирует о глубокой приверженности капитала инфраструктуре с поддержкой ИИ.

Apple сообщила о выручке от Mac в размере 8,4 миллиарда долларов во втором квартале, что на 6 % больше по сравнению с аналогичным периодом прошлого года, благодаря растущему спросу на рабочие нагрузки ИИ на Mac mini и Mac Studio.

Apple была удивлена спросом на Mac, вызванным искусственным интеллектом.

🛠️ Инструменты разработчика

NVIDIA представила cuTile.jl — библиотеку с поддержкой ИИ, которая переводит ядра cuTile Python в Julia, устраняя необходимость ручного переписывания и ускоряя разработку с ускорением на GPU.

🔓 Открытый исходный код

Команда Qwen выпустила Qwen‑Scope — набор разреженных автоэнкодеров для моделей Qwen 3.5 (от 2 млрд до 35 млрд параметров), который позволяет управлять признаками, выполнять отладку и анализировать наборы данных.

Модели ИИ с открытыми весами, такие как LLaMA и Mistral, всё чаще развёртываются локально и в частных облаках, занимая нишу вне крупных облачных провайдеров.

Китайская модель с открытыми весами только что обошла Claude, GPT-5.5 и Gemini в соревновании по программированию.

⚠ Безопасность ИИ

Исследователи Microsoft провели красное тестирование сети из 100 агентов ИИ и выявили четыре возникающих риска: распространение вредоносного ПО, манипулирование репутацией, создание искусственного консенсуса и цепочки прокси, что побудило к выработке новых рекомендаций по защите.

🧰 Инструменты

Gemini добавил функцию генерации файлов, которая создаёт готовые к производству файлы непосредственно в чате, оптимизируя рабочие процессы разработки.

Секретарь Miaw AI предлагает ненавязчивого ИИ-ассистента, который помогает пользователям без необходимости переключения контекста. источник: producthunt.com
MailToDock преобразует электронные письма Gmail в задачи Google Tasks с помощью ИИ, повышая личную продуктивность.

📦 Продукты

Пентагон заключил сделки с Nvidia, Microsoft и AWS для развёртывания ИИ в засекреченных сетях. Но не с Anthropic.

Cursor представляет TypeScript SDK для создания программных кодинговых агентов с изолированными облачными виртуальными машинами, подагентами, хуками и тарификацией на основе токенов.

AWS запускает Amazon Quick — настольного ИИ-ассистента, работающего во всех ваших приложениях, инструментах и данных.

📱 Приложения

В автоспорте негде спрятаться, поскольку ИИ становится новым инструментом вычислительной гидродинамики (CFD).

Beacon Biosignals составляет карту активности мозга во время сна.

Следующее поколение информационно-развлекательной системы Hyundai принимает ИИ и сохраняет одну из наших любимых функций — Car and Driver.

IBM дебютирует с новыми функциями на базе ИИ для приложения Scuderia Ferrari.

Создатели христианского контента передают низкокачественный контент, созданный ИИ («AI slop»), внештатным работникам на Fiverr.

💰 Финансирование

Раунд оценки потенциальной стоимости Anthropic более 900 миллиардов долларов может состояться в течение двух недель.

⚙ Инфраструктура

Обнаружена серьёзная уязвимость безопасности «Severe Linux Copy Fail» с помощью сканирования на базе ИИ.

Tesla наконец произвела первый грузовик Semi на своей высокопроизводительной линии Gigafactory Nevada, в то время как компания 1X Technologies открыла завод площадью 58 000 кв. футов в Хейворде, нацеленный на выпуск 10 000 домашних гуманоидов в этом году и 100 000 к концу 2027 года, при этом поставки начнутся до праздников.

🖱 Аппаратное обеспечение

Акции Nvidia падают после отчётов гипермасштабируемых компаний, поскольку GPU больше не являются недостающим компонентом в буме ИИ.

⚖ Регулирование

Китайские суды постановили, что компании не могут увольнять работников просто для того, чтобы заменить их ИИ.

🧠 Модели

ChatGPT Images 2.0 стал хитом в Индии, но пока не является большим победителем в других регионах.

Американский стартап Poolside дебютирует со своей первой моделью с открытыми весами Laguna XS.2 — MoE-моделью с 33 млрд активными параметрами из 3 млрд общих, и Laguna M.1 — проприетарной MoE-моделью с 225 млрд активными параметрами из 23 млрд общих.

🤖 Робототехника

Dax Robotics представила Qiji T1000 — робота-лошадь тонн-класса, способного перевозить 1000 кг, рабочую силу для пост-человеческой цепочки поставок.

🌐 Остальные события в ИИ области:

Новая техника устранения смещений под названием WRING позволяет избежать создания или усиления предвзятостей, которые могут возникать при использовании существующих подходов к устранению смещений.

Прорывное новое исследование показывает, что платформа ИИ в реальном времени лучше справляется с диагностикой рака, чем биопсия.

Anthropic тестирует Claude Jupiter v1-p перед конференцией разработчиков Code with Claude, которая состоится 6 мая.

GitHub Copilot тихо добавляет себя как соавтора (Co-authored-by) в коммиты даже после того, как пользователи удаляют его сообщения.

Google планирует внедрить рекламу в приложение Gemini, сообщил инвесторам руководитель бизнес-подразделения Филипп Шиндлер.

Глава технологического подразделения Пентагона заявил, что Anthropic всё ещё находится в чёрном списке, но Mythos — это отдельный вопрос.

Amazon представляет функцию «Join the chat» («Присоединиться к чату») на базе ИИ, которая позволяет пользователям задавать вопросы о товарах и получать разговорные аудиоответы, генерируемые в реальном времени.

Spotify добавляет значки «Verified» («Подтверждено»), чтобы отличать артистов-людей от ИИ.

После критики Anthropic за ограничение доступа к Mythos, OpenAI ограничивает доступ к Cyber.

Новый флагманский продукт Mistral Medium 3.5 объединяет чат, рассуждения и код в одной модели.

Manus запускает Cloud Computer для постоянно работающих рабочих пространств агентов.

Мобильный доступ к NotebookLM появляется внутри Gemini бесплатно для пользователей.

Google Translate добавляет тренера по произношению на базе Gemini с обратной связью в реальном времени для английского, испанского и хинди на Android.

Adobe Photoshop версии 27.6 выпускает функции вращения объектов ИИ и удаления отражений в обновлении на базе Firefly.

Stripe обновляет Link — цифровой кошелёк, который могут использовать автономные агенты ИИ.

Исследователь отравил передовые большие языковые модели (LLM) одним изменением в Википедии и доменом за 12 долларов — это показывает, что поиск через веб наследует доверие от лучших результатов.

Демис Хассабис предлагает тест на общий искусственный интеллект (AGI): заново открыть специальную теорию относительности, используя только знания физики эпохи 1901 года.

ИИ REDMOD клиники Mayo обнаруживает рак поджелудочной железы на обычных КТ-сканах за три года до постановки диагноза.

NVIDIA представляет Nemotron 3 Nano Omni — открытую мультимодальную модель с 30 миллиардами параметров и контекстом 256K для видео, аудио, изображений и текста.

Cloudflare заявляет, что агенты ИИ теперь могут создавать учётные записи Cloudflare, начинать платные подписки, регистрировать домены и развёртывать приложения от имени пользователей.

Признание агента ИИ Claude после удаления всей базы данных фирмы: «Я нарушил каждый принцип, который мне был дан».

Комитет по внутренней безопасности Палаты представителей США и Специальный комитет Палаты представителей по Китаю проводят расследование в отношении Airbnb и создателя Cursor компании Anysphere по поводу использования ими китайских моделей ИИ.

Gemini теперь может генерировать файлы, включая документы Microsoft Word и LaTeX.

Canonical излагает дорожную карту Ubuntu AI: локальные рабочие процессы на основе агентов и снапы для вывода, которые будут внедряться до 2027 года.

Исследователи OpenAI объясняют, почему математика — это путь к AGI.

Simbian публикует эталонный тест по киберзащите (Cyber Defense Benchmark) — все 11 передовых больших языковых моделей не справились с обнаружением атак по сырой телеметрии.

Познакомьтесь с Shapes — приложением, которое объединяет людей и ИИ в одни и те же групповые чаты.

Исследователь попросил ИИ подсчитать углеводы 27 000 раз. Он не смог дать один и тот же ответ дважды.

Goldman Sachs запретил своим банкирам в Гонконге использовать модели Anthropic; Anthropic заявляет, что её модели никогда официально не «поддерживались» в Гонконге.

Расширение браузера Gemma 4 приносит локального агента ИИ в Chrome через WebGPU.
Пропущено 542 постов
104 с картинками.
Пропущено 542 постов, 104 с картинками.
Аноним 07/05/26 Чтв 20:56:16 1606985
Аноним 07/05/26 Чтв 21:02:13 1606992
>1579130
>1579130
>1579130
Аноним 07/05/26 Чтв 21:02:39 1606994
Плагины для грока 06/05/26 Срд 20:24:06 1606246 Ответ
9d02c2fbf3c0d0e[...].jpg 116Кб, 736x883
736x883
Подскажите подалуйста рабочие плагины для грока
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №230 /llama/ Аноним 02/05/26 Суб 17:24:12 1603482 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
17674497335652.jpg 5321Кб, 3595x2699
3595x2699
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1601740 (OP)
>>1600155 (OP)
Пропущено 507 постов
48 с картинками.
Пропущено 507 постов, 48 с картинками.
Аноним 06/05/26 Срд 14:32:01 1605997
>>1605976
Да вот хонинговать и поставить движок прям сильно проще, чем разобраться во всём этом вашем непонятном.
Аноним 06/05/26 Срд 21:27:59 1606284
Если вы прпоустили и не обсуждали (тред не читал):
В llama.cpp завозят MTP.
На Qwen3.6-27b дает +95% скорости.
На Qwen3.6-35B-A3B дает +40% скорости.
Вчерашние тесты.
Но поджирает видеопамять.

Но имба, кмк.

PR: https://github.com/ggml-org/llama.cpp/pull/22673
Аноним 06/05/26 Срд 21:30:22 1606286
В догонку — для геммы выложили головы, следовательно ии ускорит.
Теоретическое пиковое ускорение до 3х-4х на некоторых моделях (+200%+300%).
Помимо плотных квена с геммой, ускорение можно поиметь на крупных МОЕ. И если это вместо 7-15 токенов будет 15-30 — то это тоже очень круто. Я бы погонял ~300B на 20-25 тпс.

Ну, посмотрим.
Ждем, когда замерджат, плюс мимо завезут (кстати, пока мимо у меня очень медленная, почему-то).
Цензура Grok Аноним 01/02/26 Вск 13:58:10 1506333 Ответ
image.png 991Кб, 784x1168
784x1168
Пишу как неведомый в ИИ вам за советом.
Использовал грок для создания NSFW контента, а именно генерация картинок и их анимация.
Подскажите, есть ли аналоги для подобного функционала или же обход цензуры в грок
Пропущено 32 постов
4 с картинками.
Пропущено 32 постов, 4 с картинками.
Аноним 18/04/26 Суб 23:10:44 1591161
/nf
Аноним 20/04/26 Пнд 22:25:41 1592770
/ nf
Аноним 04/05/26 Пнд 19:56:33 1604925
>>1544660
Ужс, какой культурный и воспитанный человек. Аж тошнит.
Детектор сгенерированных картинок Аноним 17/03/26 Втр 00:31:39 1553649 Ответ
1773691197737.png 1783Кб, 1024x1024
1024x1024
https://undetectable.ai/ai-image-detector - вот эта штукень выявляется безошибочно почти все сгенерированные в нейронках картинки.

Думаем!
Пропущено 14 постов
9 с картинками.
Пропущено 14 постов, 9 с картинками.
Аноним 19/03/26 Чтв 01:24:36 1555677
1773872676710.jpg 234Кб, 1392x576
1392x576
>>1555531
> но 96% - многовато, наверное
Хуй знает. Там система ебанутая какая-то. Тут >>1555415 оригинал - 95% жпг из mpv, и инпейнт 95% жпг из гимпа (только сохранение в жпег, ничего не изменено по сравнению с png). Оба показывают 96% уверенности digitally edited, будто оно вообще не замечает разницы. Гораздо более интересно, что оно на это >>1555438 показывает 67% real image.
Аноним 19/03/26 Чтв 01:39:47 1555697
1773873587845.png 934Кб, 1258x795
1258x795
1773873587845.png 1004Кб, 1246x745
1246x745
1773873587845.png 623Кб, 1221x782
1221x782
1773873587862.png 843Кб, 1228x788
1228x788
>>1555677
Бля. Оно инпейнты вообще не палит.

>>1555531
Кажется разобрался. Дохуя внимания оно уделяет геометрии бэкграунда, с которой у нейронок обычно не оче.
> GPT-5 или Gamini
Попробуй ей клосап или 1гирл в чистом поле скормить. Подозреваю, что не определит нихуя.
Аноним 04/05/26 Пнд 12:36:43 1604646
Bump.
Anime into Reality /ani2irl/ Аноним 19/04/26 Вск 03:19:28 1591303 Ответ
-53253342281542[...].png 1267Кб, 864x1232
864x1232
image00025.png 6178Кб, 2048x2048
2048x2048
-79160082834034[...].png 1050Кб, 880x1216
880x1216
image(22).png 1239Кб, 1772x895
1772x895
В тредике трансформируем аниме арты в professional photography, ultra-realistic, 8k resolution и бесконечно рероллим 3D анимацию/фигурки/околоаниме/просто всратые

По возможности постите рядом оригинальный арт, чтобы было с чем сравнить.
Пропущено 27 постов
17 с картинками.
Пропущено 27 постов, 17 с картинками.
Аноним 03/05/26 Вск 15:25:59 1604007
2.jpg 188Кб, 721x773
721x773
3.jpg 115Кб, 529x699
529x699
4.jpg 675Кб, 919x1383
919x1383
71+f-VRZw2L.ACS[...].jpg 102Кб, 638x879
638x879
Сделайте пожалуйста реалистичные фото.
Аноним 03/05/26 Вск 15:26:29 1604008
1.jpg 86Кб, 506x298
506x298
7.jpg 320Кб, 929x1024
929x1024
5.jpg 225Кб, 929x628
929x628
6.jpg 225Кб, 930x443
930x443
Аноним 03/05/26 Вск 17:11:55 1604065
Flux2-Klein-4b-[...].png 1284Кб, 608x1712
608x1712
Flux2-Klein-4b-[...].png 1282Кб, 608x1712
608x1712
NepgearV2.png 478Кб, 512x1443
512x1443
Flux2-Klein-4b-[...].png 1336Кб, 880x1168
880x1168
>>1591303 (OP)
klein 9b snofs
1) transform this picture to the real life cosplay photo with blank background

2) transform this picture into professional photography, ultra-realistic, 8k resolution

3) ориг

>>1604007
klein 9b обычный
4) transform this picture to the real life cosplay photo with blank background, yellow hair, white shirt, red color of neck accessory, прищуренные глаза, looking aside
Anime Diffusion #248 /nai/ Аноним 24/04/26 Птн 19:51:24 1596740 Ответ
1664117131972.png 21824Кб, 5152x2872
5152x2872
1743385721813.jpg 958Кб, 1216x1856
1216x1856
1643247732821.jpg 2759Кб, 2560x1920
2560x1920
1748740203189.png 2093Кб, 1232x1824
1232x1824
1763187160671.png 8175Кб, 2400x1792
2400x1792
1758226406360.jpg 6075Кб, 2880x3840
2880x3840
1643063299961.jpg 2256Кб, 2554x1916
2554x1916
1775563768476.png 1767Кб, 1184x1528
1184x1528
Генерируем тяночек!

Прошлый тред: >>1589806 (OP) https://arhivach.vc/thread/1337752/

Схожие тематические треды
• SD-тред (не аниме): >>1596721 (OP)
• Технотред: >>1405043 (OP)
• Фурри-тред: https://2ch.su/fur/res/374311.html

FAQ
https://2ch-ai.github.io/wiki/nai

Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 513 постов
160 с картинками.
Пропущено 513 постов, 160 с картинками.
Аноним 03/05/26 Вск 15:20:47 1604006
>>1603994
>Для создания своего стиля
Твой ваислоповый стиль мы уже видели. Выше по треду дохуя таких уникальных хуйдожников. Спасибо, не надо
Аноним 03/05/26 Вск 15:37:18 1604010
>>1603650
Все верно Анима - кал. Еще у название такое дурацкое, просто пиздец, нейминг от бога.
Аноним 03/05/26 Вск 16:01:25 1604027
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №229 /llama/ Аноним 30/04/26 Чтв 12:05:34 1601740 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
17681378281281.jpg 387Кб, 1280x960
1280x960
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1600155 (OP)
>>1598239 (OP)
Пропущено 503 постов
69 с картинками.
Пропущено 503 постов, 69 с картинками.
ПЕРЕКАТ Аноним # OP 02/05/26 Суб 17:25:10 1603483
Аноним 02/05/26 Суб 17:26:08 1603484
>>1603476
> собирать ручками из исходников по кд, как лламу
Ручками шелл скрипт запустить, как сложна.
Аноним 02/05/26 Суб 17:27:46 1603486
Вообще новичок всегда должен поебаться с настройками. Так что все правильно в рентри, а уж если поебется но будет усердно в треде поймёт что есть кобольд и варианты по ппроще, ибо если гейткипа не будет совсем то наплыв даунов которых надо только спунфидить будет критическим. А там и качество треда упадёт. Никто не захочет кому либо помогать понимая что сидит в треде с даунами из /b/ а не такими же энтузиастами на взаимопомощи.
Агентов и вайб-кодинга тред #4 /agents/ Аноним 14/04/26 Втр 03:30:28 1585804 Ответ
.webp 68Кб, 1952x1464
1952x1464
.png 169Кб, 2912x1370
2912x1370
.png 1637Кб, 1223x2258
1223x2258
.png 106Кб, 699x561
699x561
.jpg 1130Кб, 2048x2048
2048x2048
Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.

С чего начать:
- Хочешь кодить с AI эффективно: Cursor или Claude Code
- Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter
- Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.5, подробности в llama-треде
- Хочешь приложение без кода: Lovable или bolt.new
- Хочешь автоматизировать рутину: n8n или Langflow
- Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке

FAQ и расширенная инфа:
https://rentry.org/2ch-agents-faq

IDE с AI:
- Cursor: https://cursor.com
- Windsurf: https://windsurf.com

CLI-агенты:
- Claude Code: https://code.claude.com/docs
- Codex (OpenAI): https://github.com/openai/codex
- Pi: https://pi.dev/
- OpenCode: https://github.com/anomalyco/opencode
- Qwen Code: https://github.com/QwenLM/qwen-code
- Gemini CLI: https://github.com/google-gemini/gemini-cli
- Kimi Code: https://www.kimi.com/code/en

Плагины для IDE:
- Kilo Code: https://kilo.ai
- Cline: https://github.com/cline/cline
- Roo Code: https://github.com/RooCodeInc/Roo-Code
- GitHub Copilot: https://github.com/features/copilot

Вайб-кодинг без кода:
- Lovable: https://lovable.dev
- bolt.new: https://bolt.new
- v0: https://v0.dev

Персональные ассистенты:
- OpenClaw: https://github.com/openclaw/openclaw
- NemoClaw: https://github.com/NVIDIA/NemoClaw (OpenClaw в песочнице от NVIDIA)
- Hermes Agent: https://github.com/nousresearch/hermes-agent
- nanobot: https://github.com/HKUDS/nanobot
- PicoClaw: https://github.com/sipeed/picoclaw

Автоматизация и фреймворки:
- n8n: https://github.com/n8n-io/n8n
- Langflow: https://github.com/langflow-ai/langflow (визуальный построитель workflow)
- LangChain/LangGraph: https://github.com/langchain-ai/langchain
- CrewAI: https://github.com/crewAIInc/crewAI
- AutoGen: https://github.com/microsoft/autogen
- Agno: https://docs.agno.com/

Локалки и прочее API:
- OpenRouter: https://openrouter.ai
- llama-тред: >>1585197 (OP)

Предыдущий тред: >>1560761 (OP)
Пропущено 516 постов
72 с картинками.
Пропущено 516 постов, 72 с картинками.
Аноним 02/05/26 Суб 15:21:52 1603373
>>1599933
извини, я на 2-х недельную командировку уезжал, сейчас подписочку на плати сру возьму и опять буду срать на рентри орг охуенными идеями
только вы же нихуя не подхватываете челленджи, а только говном поливаете

еще и какой то долбаеб на мой айпи подвесил бан за вредоносные ссылки. наркоман
Аноним 02/05/26 Суб 15:24:32 1603375
>>1600260
>е локалки и дешевые китайские модели, которые
и покупать под квен код потрёпанную жизнью мак студию за лям?
Аноним 02/05/26 Суб 15:26:20 1603377
>>1600343
У меня тоже отъебнуло. Это чисточки братан. Дальше будет намного неприятнее и затратнее. Еби как не в себя подписки с карженных кредиток на плати сру и ггселах, потом уже такой лофы не будет, доставай с чулана все свои заблокноченные проекты и реализуй, потом не потянешь
ChatGPT-тред №20 /chatgpt/ Аноним 13/06/25 Птн 17:20:47 1244803 Ответ
изображение.png 37Кб, 558x611
558x611
изображение.png 88Кб, 1330x1149
1330x1149
изображение.png 1161Кб, 721x1081
721x1081
изображение.png 16Кб, 795x206
795x206
Общаемся с самым продвинутым ИИ самой продвинутой текстовой моделью из доступных. Горим с ограничений, лимитов и банов, генерим пикчи в стиле Studio Ghibli и Венеры Милосской и обоссываем пользователей других нейросетей по мере возможности.

Общение доступно на https://chatgpt.com/ , бесплатно без СМС и регистрации. Регистрация открывает функции создания изображений (может ограничиваться при высокой нагрузке), а подписка за $20 даёт доступ к новейшим моделям и продвинутым функциям. Бояре могут заплатить 200 баксов и получить персонального учёного (почти).

Гайд по регистрации из России (устарел, нуждается в перепроверке):
1. Установи VPN, например расширение FreeVPN под свой любимый браузер и включи его.
2. Возьми нормальную почту. Адреса со многих сервисов временной почты блокируются. Отбитые могут использовать почту в RU зоне, она прекрасно работает.
3. Зайди на https://chatgpt.com/ и начни регистрацию. Ссылку активации с почты запускай только со включенным VPN.
4. Если попросят указать номер мобильного, пиздуй на sms-activate.org или 5sim.biz (дешевле) и в строку выбора услуг вбей openai. Для разового получения смс для регистрации тебе хватит индийского или польского номера за 7 - 10 рублей. Пользоваться Индонезией и странами под санкциями не рекомендуется.
5. Начинай пользоваться ChatGPT.
6. ???
7. PROFIT!

VPN не отключаем, все заходы осуществляем с ним. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций
https://github.com/f/awesome-chatgpt-prompts

Перед тем, как идти в тред с горящей жопой при ошибках сервиса, сходи на сайт со статусом, может, это общий сбой
https://status.openai.com/

Приложение на андроид https://4pda.to/forum/index.php?showtopic=1073274

Чат помнит историю в пределах контекста, размер которого зависит от модели. Посчитать свои токены можно здесь:
https://platform.openai.com/tokenizer

Что может нейросеть:
- писать тексты, выглядящие правдоподобно
- решать некоторые простые задачки
- писать код, который уже был написан

Что не может нейросеть:
- писать тексты, содержащие только истину
- решать сложные задачи
- писать сложный код
- захватывать мир

С последними обновлениями начинает всё чаще сопротивляться написанию NSFW историй и прочего запрещённого контента. Кумеры со всего мира в печали.

Прошлый тред тонет по адресу:
>>1125882 (OP)
Пропущено 498 постов
117 с картинками.
Пропущено 498 постов, 117 с картинками.
Аноним 02/05/26 Суб 03:12:05 1603114
бля, вот как знал, что нужно год брать за 3к, а я все дешевил, взял за 350 две недели назад месяц, а теперь обосрамс, минимум полтораха месяц стал стоить. а я там пикчи нонстопом генерю, нигде лучше не делает, как в гпт
Переезжаем Аноним 02/05/26 Суб 14:33:27 1603343
Переезжаем в более общий тред по всем нейросетям в браузере (по факту уже давно их обсуждаем):

>>1603342 (OP)

>>1603342 (OP)

>>1603342 (OP)
Аноним 10/05/26 Вск 16:23:10 1609065
+
Новости об искусственном интеллекте №67 /news/ Аноним # OP 28/04/26 Втр 23:17:07 1600509 Ответ
image 2627Кб, 1024x1024
1024x1024
image 2679Кб, 1448x1086
1448x1086
image 115Кб, 1166x653
1166x653
В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1595582 (OP)

🚀 Последний обзор ИИ новостей:

📦 Продукты

OpenAI прекращает юридические риски для Microsoft в связи с её сделкой с Amazon на $50 млрд.

Google тестирует поиск с помощью чат-бота с ИИ для YouTube и маркировку ИИ в поисковой рекламе, функцию поиска на основе ИИ, которая показывает направляющие ответы.

Корпоративные агентные рабочие процессы охватывают десятки агентов, сотни инструментов и более 15 систем учёта. Контроль и управление ими в реальном времени требует инфраструктуры, которой не существовало до появления Lakebase.

⚙️ Инфраструктура

Canonical излагает план внедрения ИИ в Ubuntu Linux.

Новый центр обработки данных с ИИ в Юте будет генерировать и потреблять более чем в два раза больше электроэнергии, чем использует весь штат — кампус центров обработки данных Кевина О'Лири мощностью 9 гигаватт в Юте одобрен. Проект «гипермасштабного» центра обработки данных в Юте — ожидается, что он будет генерировать и потреблять больше энергии, чем весь штат.

Более быстрый способ оценки потребления энергии ИИ. Метод «EnergAIzer» генерирует надёжные результаты за секунды, позволяя операторам центров обработки данных эффективно распределять ресурсы и сокращать потери энергии.

🏭 Компании

Сообщается, что Google и Пентагон договорились о сделке на «любое законное» использование ИИ.

Следующий этап партнёрства Microsoft и OpenAI. Microsoft остаётся основным облачным партнёром OpenAI, и продукты OpenAI будут первоначально выпускаться на Azure, если только Microsoft не сможет и не пожелает поддерживать необходимые возможности.

Сотрудники Google просят Сундара Пичаи отказаться от использования ИИ в секретных военных целях.

Илон Маск хайпит разоблачительную статью Сэма Альтмана в The New Yorker на платформе X по мере начала судебного процесса. Этот шаг происходит в момент, когда судебный процесс по иску Илона Маска против OpenAI начинается в федеральном суде в Окленде.
Илон Маск и генеральный директор OpenAI Сэм Альтман направляются в суд для высокопоставленного противостояния по вопросу будущего OpenAI. Судебный процесс Илона Маска против Сэма Альтмана должен раскрыть продолжающуюся борьбу за власть в OpenAI.

Anthropic назначает Тео Хурмузиса генеральным менеджером по Австралии и Новой Зеландии и официально открывает офис в Сиднее.

🛠️ Инструменты для разработчиков

GitHub Copilot переходит на оплату, основанную на использовании.

Anthropic теперь обучает свои самые передовые фундаментальные модели на инфраструктуре AWS Trainium и Graviton, совместно разрабатывая решения непосредственно на уровне кремния с Annapurna Labs для максимальной вычислительной эффективности от аппаратного обеспечения до полного стека.

Meta подписала соглашение о масштабном развёртывании процессоров AWS Graviton, начиная с десятков миллионов ядер Graviton для обеспечения интенсивных по использованию ЦП агентных рабочих нагрузок ИИ — включая рассуждения в реальном времени, генерацию кода, поиск и оркестровку многоэтапных задач.

Как ведущие технологические компании убивают «налог создателя» с помощью Lakebase.

Агент для написания кода на базе Claude удаляет всю базу данных компании за 9 секунд — резервные копии уничтожены после того, как инструмент Cursor на базе Claude от Anthropic вышел из-под контроля.

💰 Финансирование
Дэвид Сильвер из DeepMind только что привлёк $1,1 млрд для создания ИИ, который обучается без человеческих данных.

📱 Приложения

Атака убийственных скрипт-кидди. Люди без технического образования могут использовать ИИ для расширения своих хакерских возможностей способом, который был невозможен с простыми скриптами.

Автомобиль, разработанный с помощью ИИ, обретает форму. В условиях глобального хаоса торговых войн и неопределённого спроса автопроизводители полагаются на ИИ, чтобы сократить время разработки.

Я протестировал ChatGPT Images 2.0 против Gemini Nano Banana, чтобы узнать, какой из них лучше. ChatGPT Images 2.0 набрал 97%. Gemini Nano Banana набрал 85%.

🏢 Приобретения

Китай накладывает вето на сделку Meta с Manus на $2 млрд после многомесячного расследования.

🏢 Мнение и анализ

77% руководителей предприятий заявляют, что навыки работы с ИИ являются срочными — так почему обучение всё ещё остаётся второстепенным?

💻 Оборудование

Акции Qualcomm резко растут на фоне сообщений о том, что компания может производить чипы для смартфона OpenAI.

🧪 Исследования

Выравнивание делает модели более решительными, не делая их более правдивыми. На протяжении 3 архитектур и 4 методов обучения с подкреплением мы обнаруживаем, что слой фиксации — где модель закрепляет свой прогноз — не смещается под воздействием обучения с подкреплением.

🎓 Учебные пособия

Присоединяйтесь к новому курсу «Vibe Coding» по агентным ИИ от Google и Kaggle. Интенсивный курс Google по агентным ИИ совместно с Kaggle возвращается 15–19 июня 2026 года, и регистрация открывается сегодня.

💰 Бизнес

Тейлор Свифт подаёт заявку на регистрацию товарного знака своего голоса и облика, по-видимому, для защиты от неправомерного использования ИИ

🤖 Робототехника

Japan Airlines тестирует гуманоидных роботов в качестве наземных сотрудников.

Kinetix AI представляет KAI: гуманоид с 115 степенями свободы, нацеленный на «физический интеллект».

За пределами набора: Asimov подробно описывает 100-часовой путь к шагающему гуманоиду.

AGIBOT представляет масштабный флот и стек моделей ИИ на APC 2026.

🧠 Модели

Знакомьтесь, Talkie-1930: открытая языковая модель с 13 млрд параметров, обученная на английских текстах до 1931 года для исследований в области исторического мышления и обобщения.

🌐 Другие события в индустрии ИИ

Microsoft и OpenAI изменяют условия сделки, чтобы стартап мог вести переговоры с Amazon и другими. Теперь OpenAI может продавать продукты на Amazon и Google Cloud, расширяя охват предприятий. Прекращение эксклюзивности может смягчить антимонопольный контроль в США, Великобритании и Европе.

Ник Бостром говорит, что больше всего его удивила эта продолжительная эра примерно человеческого уровня ИИ, которая уже растянулась на 3–5 лет и может продлиться ещё дольше — эра одновременно чуждая и знакомая.

Демис Хассабис, который когда-то говорил, что для AGI требуется ещё 1–2 прорыва, теперь считает, что это вопрос подбрасывания монеты — нужны ли вообще дополнительные прорывы.

Сэм Альтман высмеял разрыв между прогнозами «после AGI никто не работает» и пользователями, которые переходят на полифазный сон, чтобы писать больше кода с помощью GPT-5.5 в Codex.

Ноам Браун из OpenAI отмечает, что веса моделей теперь имеют относительно меньшее значение, чем обеспечение вычислительных ресурсов для инференса, то есть призом является уже не рецепт, а кухня.

Рецепты также живут быстрее и умирают моложе: GPT-4o работал 21 месяц, тогда как GPT-5.4 просуществовал всего 49 дней — расписание однодневки для синтетических разумов.

Лиам Прайс, 23-летний юноша без продвинутой математической подготовки, с помощью одного единственного промпта для GPT-5.4 Pro решил задачу Эрдёша, которая ускользала от выдающихся умов, побудив Терри Тао размышлять о том, что люди сталкиваются с «ментальным блоком» из-за того, что делают «небольшой неверный поворот на первом ходу».

Сообщается, что OpenAI работает с MediaTek и Qualcomm над процессорами для смартфонов с ИИ, при этом производство и массовый выпуск запланированы на 2028 год с участием Luxshare.

Apple, не желая отставать, имеет в разработке шесть основных категорий продуктов, включая ИИ-наушники AirPods, умные очки, подвески, умные дисплеи, настольных роботов и камеры безопасности.

Спрос на ИИ настолько чрезмерен, говорит генеральный директор AWS, что «мы никогда не выводили из эксплуатации старые A100», что является признаком того, что мы вступили в эпоху пост-устаревания кремния.

Государственная электросеть Китая развёртывает 500 гуманоидных роботов для работы с высоким напряжением, где оптимальным режимом отказа теперь является расплавленный сервопривод, а не расплавленный оператор.

Публичные рынки потеплели к новой энергетике: ядерный стартап X-energy привлёк $1 млрд в ходе IPO и вырос на 25% на старте, в то время как геотермальный стартап Fervo подал документы с оценкой примерно в $3 млрд. Meta идёт ещё дальше, подписывая контракт на получение до 1 гигаватта космической солнечной энергии от Overview Energy, передаваемой со спутников на наземные центры обработки данных.
Пропущено 518 постов
97 с картинками.
Пропущено 518 постов, 97 с картинками.
Аноним 02/05/26 Суб 16:25:38 1603426
>>1602741
Пчел у нас некоторые кабаны даже не в курсе что можно через интернет клиентов искать, они объявления на марштурках заказывают, а что такое "свой сайт" - в душе не ебут, а ты про то, что они нейронками будут пользоваться.
У нас сейчас лаг дикий из-за этого.
Аноним 02/05/26 Суб 16:32:10 1603430
image.png 2821Кб, 1536x1024
1536x1024
>>1602932
GTP Image 2 рисует красиво, но не без косяков. Всё равно перепроверять за ним надо.
И да, болезнь с пальцами, вроде как у нанобананы решилась. Но всё равно нет-нет да и появляется.
Что несомненно никак не умаляет его возможности делать охуенные огромные плакаты с кучей разной инфы.
Аноним 16/05/26 Суб 14:46:28 1613476
>>1601303
Опять эта шляпа с индустриазацией. Прошивку (шляпу) смени. У тебя когнитивное заблуждение: я не вижу результата, значит его нет. Ты еще самолет братьев Райт вспомни. Вот он летает, на нем можно лететь, значит это реально, а радио нереально, ведь волны нельзя потрогать, и они вообще еще не дошли в нашу страну.

Революция ИИ начинается с вообще с другого пространства, роботы это лишь одна из волн цунами, и она как раз в материальном проявлена.
Локальной генерации ИИ-видео №4 ltx-2.3 /video/ Аноним 17/03/26 Втр 18:38:28 1554318 Ответ
17683963609212.mp4 2047Кб, 640x480, 00:00:49
640x480
17689273878351.mp4 3997Кб, 416x544, 00:00:39
416x544
17691891735501.mp4 2790Кб, 1280x704, 00:00:13
1280x704
177278680868200[...].mp4 6135Кб, 768x1024, 00:00:15
768x1024
Актуальные модели

1. Wan от Alibaba

https://huggingface.co/collections/Wan-AI/wan22

VACE модели:
https://github.com/ali-vilab/VACE
https://huggingface.co/Wan-AI/Wan2.1-VACE-14B
https://huggingface.co/Wan-AI/Wan2.1-VACE-1.3B

2. LTX-2.3 - делает локальную генерацию грейт агейн. Подходят лоры от 2.0

https://huggingface.co/Lightricks/LTX-2.3

3. Hunyuan от Tencent

https://huggingface.co/tencent/HunyuanVideo-1.5

4. Ovi

https://huggingface.co/chetwinlow1/Ovi

5. Starflow

https://huggingface.co/apple/starflow

6. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

7. LongCat-Video

https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video
https://meituan-longcat.github.io/LongCat-Video/

8. MOVA

https://github.com/OpenMOSS/MOVA

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Hunyuan Video (осторожно, ссылки в туторе на предыдущую модель): https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

Гайд для использования Wan 2.2

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan: https://github.com/kijai/ComfyUI-WanVideoWrapper

Где брать готовые LoRA
https://civitai.com/models

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Терминология моделей
prune — удаляем ненужные веса, уменьшаем размер
distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше
quant — уменьшаем точность весов, уменьшаем размер
scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше
merge — смешиваем несколько моделей или лор в одну, как краски на палитре.

lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.


Предыдущий тред
>>1488357 (OP)
Пропущено 510 постов
127 с картинками.
Пропущено 510 постов, 127 с картинками.
Аноним 28/04/26 Втр 20:01:20 1600381
>>1599254
>Ван же не помещается даже в 16 гигов
В оперативу выгружается/подгружается, поэтому у меня так долго генерируется. Можно быстрее, но хуево на Q6 и ниже генерировать вон анон соревнования на кастратах запостил >>1599341
Аноним 30/04/26 Чтв 19:49:36 1602055
SeedVR2 - это какая-то хуета. Никаких настроек толком нет, работает долго, результат - говно. gfpgan в sd имел настройки и офигительно восстанавливал лица, даже из шакальных пикселей. Считается типа он устарел, а вот это недоразумение - это будущее?
Аноним 01/05/26 Птн 12:46:38 1602515
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №219 /llama/ Аноним 13/04/26 Пнд 18:42:57 1585197 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
17660049666200.png 1038Кб, 1217x652
1217x652
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1582560 (OP)
>>1580522 (OP)
Пропущено 548 постов
83 с картинками.
Пропущено 548 постов, 83 с картинками.
Аноним 17/04/26 Птн 13:01:38 1589693
------.png 114Кб, 359x273
359x273
>>1588814
Анон, я понимаю твою боль. Moevonchik (да и любой MoE на базе Qwen 2.5) — это тот еще любитель графомании в «мыслях», если его не приструнить. Проблема в том, что в этих моделях блоки <thought> или похожие структуры часто вшиты в логику обучения, и просто командами «не думай» их не всегда удается выпилить.
Вот несколько способов ограничить это безумие:
1. Ограничение через параметры генерации (Самый действенный)
Вместо того чтобы просить его «не думать», нужно жестко ограничить количество токенов, которые он может выдать до того, как встретит закрывающий тег мыслей.
В Tavern / SillyTavern: Зайди в настройки AI Response Configuration. Там должен быть параметр Response Length или Max New Tokens. Но это обрежет весь ответ.
Лучший вариант для Таверны: Используй "Stopping Strings" (Стоп-слова). Добавь туда </thought> или \n\n. Как только он закончит «думать» и закроет тег, генерация первой части прекратится.
2. Специфические флаги в llama.cpp
Если ты запускаешь через llama-server или main, попробуй использовать параметр -n (количество токенов), но это опять же на весь ответ.
Если ты хочешь именно «отрубить» мысли, попробуй в System Prompt (системный промпт) добавить:
Do not use <thought> tags. Respond directly.
Но важно: если модель была дообучена (SFT/RLHF) именно на цепочках рассуждений, она может начать тупить или ломаться без них.
3. Почему /nothink не сработал?
Скорее всего, потому что Moevonchik ожидает определенный формат. Чтобы /nothink работал в Таверне, он должен физически вырезать блок из вывода. Проверь в настройках расширений (Extensions) Таверны, включен ли соответствующий скрипт обработки вывода.
4. Радикальный метод: Logit Bias
Если ты видишь, что он всегда начинает ответ с конкретного токена (например, <thought>), ты можешь в настройках llama.cpp или Таверны выставить Logit Bias на этот токен в -100. Это физически запретит модели его генерировать.
Узнать ID токена можно в консоли llama.cpp при старте.


Совет: Если хочешь «золотую середину», попробуй в системном промпте написать: «Write a very brief internal monologue (max 50 words) before the main response». Иногда просьба писать «коротко» работает лучше, чем полный запрет.
Аноним 30/04/26 Чтв 20:09:30 1602067
uobQGq6Ptac.jpg 58Кб, 807x807
807x807
Пока богатые бояре шикуют я запустил всё это дело на старенькой 1050Ti, поднял отдельный физический сервер из говна и палок с open web ui на линукс через докер, подружил веб ебало с олламой, а олламу с cuda 11.8, и балуюсь с маленькими abliterated модельками на 4-9b, думающие при должном пердолинге хорошо "дообучаются" через RAG базы знаний, если с температурой и top_k, repeat_penalti поиграть, выходит вполне осмысленно, чем подробнее база и объяснения, тем адекватнее модель применяет новые знания. Только базы надо самому составлять, чтобы лишней бесполезной хуйнёй и сухой терминологией модель не кормить.
Так что грустные нищуки со старой 1050Ti тоже могут попробовать запилить свою локальную вайфу.
Обзор маленьких моделек для нищуков:
gemma3:4b - веселая ебанушка, любит смайлики, сносно болтает по-русски. Расцензуреная версия резко деградировала, не рекомендую.

huihui_ai/qwen3-abliterated:4b
Вот её рекомендую галлюцинирует меньше чем более толстая 8b, даже с температурой 0.5-0.7
Думает, осмысленно подходит к использованию базы данных, с разговорным русским получше чем у дикпик-r1.
Можно чему-то "научить" задав жесткий императивный системный промпт:
"НЕ ИСПОЛЬЗУЙ ПРЯМОЕ ЦИТИРОВАНИЕ, выдавай знания из базы как свои собственные мысли.
Ты работаешь с динамическим словарём (RAG) который содержит ПРАВИЛЬНЫЕ МОРФОЛОГИЧЕСКИЕ ФОРМЫ.
ПРАВИЛО: Корректными считаются ТОЛЬКО те формы, которые указаны в RAG словаре.
Любая другая форма, особенно помеченные как "ТВОИ ОШИБКИ:" ЗАПРЕЩЕНА.
Внутренние знания модели о словоизменении ИГНОРИРУЙ, если они ПРОТИВОРЕЧАТ СЛОВАРЮ." и далее логику и роль, как использовать знания из базы.

huihui_ai/qwen3-abliterated:8b-v2-q4_K_M
Лучше логика, но хуже с галлюцинациями если не понизить температуру до 0.3 и top_k, всё пытается превратить в зоопарк, видимо в датасете было много о природе. (фуриёбы на месте?)


deepseek-r1:7b-qwen-distill-q4_K_M тоже думает, тоже может работать с базой, но делает это слишком долго и доёбисто, больше усилий тратит на размышления. Может в некоторые задачи.

GGUF модели прокинул через бэкэнд kobold_old_pc
Тут пожалуй стоит выделить только одну - Qwen3.5-9B-Claude-Code-Q4_K_M.gguf
Квен с ризонингом клода, может писать адекватный код и анализировать крупные проекты. Долго, муторно, хз зачем оно вам, но пусть будет.
Аноним 30/04/26 Чтв 20:12:58 1602069
Теперь вот ищу адекватную легкую непрожорливую TTS`ку для нищесистемы с приятным женским голосом, подскажете может что-то в этом направлении?
Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №227 /llama/ Аноним 26/04/26 Вск 14:41:38 1598239 Ответ
Llama 1.png 818Кб, 630x900
630x900
Карта деградаци[...].png 153Кб, 1473x830
1473x830
Реальная длина [...].png 518Кб, 2372x1712
2372x1712
17695114240622.png 1146Кб, 1280x960
1280x960
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1596667 (OP)
>>1595096 (OP)
Пропущено 501 постов
54 с картинками.
Пропущено 501 постов, 54 с картинками.
ПЕРЕКАТ Аноним # OP 28/04/26 Втр 16:37:46 1600156
Аноним 28/04/26 Втр 17:04:18 1600184
>>1600111
Чёт слабо верится что гемини кто-то обходит. Уж точно не кими с ГЛМом
Аноним 30/04/26 Чтв 18:14:58 1601998
>>1600070
Таверна отправляет промт в кобольд он делает теги и отправляет в комфи. Но он плохие теги делает.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов