/ai/ - Искусственный интеллект

Тред веб-версии нейросетей (ChatGPT, Claude, Gemini и пр.) №1 /aiweb/ Аноним 02/05/26 Суб 14:32:32 № 1603342 Ответ

ClaudeAIlogo.svg.png 32Кб, 960x207

GoogleGeminilog[...].png 8Кб, 330x75

DeepSeeklogo.svg.png 26Кб, 960x204

Общаемся с ИИ, почти что AGI самыми продвинутыми текстовыми моделями: GPT, Claude, Gemini и прочими. Горим с ограничений, лимитов и банов, генерим пикчи, пишем код и спорим о том, какая модель лучше.

Основные сервисы:
- ChatGPT: https://chatgpt.com/
- Claude: https://claude.ai/
- Gemini: https://gemini.google.com/
- Grok: https://grok.com/
- DeepSeek: https://chat.deepseek.com/
- GLM: https://chat.z.ai/

Большинство сервисов доступны бесплатно с ограничениями. Подписки открывают доступ к более мощным моделям, увеличенным лимитам и дополнительным функциям (генерация изображений, файлы, память и т.д.). Цены и условия у всех разные и периодически меняются.

Советы по регистрации:
1. При необходимости используй VPN.
2. Заведи нормальную почту (временные часто режутся).
3. Регистрируйся на нужной платформе.
4. Иногда требуется номер телефона — используются сервисы виртуальных номеров.
5. Пользуйся.

VPN в ряде регионов обязателен. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций:
https://github.com/f/awesome-chatgpt-prompts

Статусы сервисов (при проблемах сначала идти туда, может это общий сбой):
https://status.openai.com/
https://status.anthropic.com/
https://status.cloud.google.com/

Токены и лимиты зависят от модели. У всех разные контексты, цены и ограничения.

Посчитать свои токены можно здесь:
https://huggingface.co/spaces/Xenova/the-tokenizer-playground

Что могут нейросети:
- писать правдоподобные тексты
- помогать с кодом
- объяснять сложные темы
- генерировать изображения (не везде)

Что не могут:
- гарантировать истину
- стабильно решать сложные задачи без ошибок
- полностью заменять специалистов
- захватывать мир (пока)

С каждым обновлением усиливаются фильтры и ограничения. NSFW-контент режется всё чаще. Кумеры со всего мира в печали.

Пропущено 3 постов
1 с картинками.

В тред Скрыть

Пропущено 3 постов, 1 с картинками.

Аноним 10/05/26 Вск 00:50:38 № 1608674

>>1603342 (OP)
Ты наркоман? Уже есть треды всех этих тем. Нахуя ты всё в кучу свалил?

Аноним 10/05/26 Вск 00:53:39 № 1608678

>>1608674
Где? Они все мёртвые же. 9 месяцев предыдущий по чат гпт катили >>1244803 (OP)
Тред по Клоду вообще утонул.

Аноним 11/05/26 Пнд 14:35:02 № 1609653

Ну и че за дауны сделали, что в квиз тестах гемини теперь правильный ответ сразу не показывается как и подсказки, сука тупые менеджеры вечно все портят

Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №231 /llama/ Аноним 06/05/26 Срд 13:29:04 № 1605947 Ответ

Карта деградаци[...].png 153Кб, 1473x830

Реальная длина [...].png 518Кб, 2372x1712

177096712937110[...].png 1409Кб, 1280x960

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1603482 (OP)
>>1601740 (OP)

Пропущено 507 постов
50 с картинками.

В тред Скрыть

Пропущено 507 постов, 50 с картинками.

Аноним 08/05/26 Птн 22:26:07 № 1607851

>>1607797
5060ti для начала уже хорошо, и картиночки и ллм. Как раз и смежные области раскуришь, буст будет не только в куме. На крайняк видяха в игорях будет полезна

Аноним 08/05/26 Птн 22:30:36 № 1607853

Укатывайтесь от сюда уже, где эта ленивая жопа

ПЕРЕКАТ Аноним # OP 08/05/26 Птн 22:43:29 № 1607860

>>1607853
Сам такой.
ПЕРЕКАТ

>>1607859 (OP)

ПЕРЕКАТ

>>1607859 (OP)

ПЕРЕКАТ

>>1607859 (OP)

Помогите подобрать модель ии и лор Аноним 07/05/26 Чтв 06:28:12 № 1606481 Ответ

2026-05-0702-28[...].png 1464Кб, 768x1152

Работаю в Стабилити Матрикс, очень юзелесс прога для ии, поставил себе более менее модель на базе SD 1.5 и лору на такой же, проблема заключается в том что руки выходят кривоватые, и возможно ли мне стоит перейти на более продвинутые модели, ниже скину пример своих фотографий сделанный на персонажа Тсунаде из наруто, спасибо за любые подсказки

Пропущено 4 постов
5 с картинками.

В тред Скрыть

Пропущено 4 постов, 5 с картинками.

Аноним 07/05/26 Чтв 06:37:18 № 1606486

>>1606481 (OP)
Пиздец боты ахуели

Аноним 07/05/26 Чтв 07:02:29 № 1606497

>>1606486
какие боты кентик?

Аноним 07/05/26 Чтв 19:22:01 № 1606918

>>1606481 (OP)
>Работаю в Стабилити Матрикс, очень юзелесс прога для ии, поставил себе более менее модель на базе SD 1.5

Как наверстать технологическое отставание в области ИИ? Аноним # OP 01/03/26 Вск 15:47:48 № 1538133 Ответ

Двач, хочу с тобой посоветоваться по вропосу что делать чтобы наверстать технологическое отставание в области ИИ.

TL:DR: Страна капитально отстает от США\Китая в области ИИ. Возможно ли это наверстать и что для этого надо сделать?

Отвечаю за ИТ в большой структуре. По уровню автоматизации и выполняемым проектам отстаем от мира на 20 лет. Внимательно смотрю на ИИ-революцию на западе и понимаю что это отставание мы уже не догоним.
Постоянно общаюсь с крупными вендорами, они в иишку даже не смотрят (1С, Аскон, Интермех и т.д.).

Общаюсь с нашими разработчиками ИИ (Яндекс\Сбер) тоже все достаточно грустно.

Что надо сделать чтобы у нас появились технологии, предложения и нормальные проекты по внедрению сетей?

Пропущено 107 постов
10 с картинками.

В тред Скрыть

Пропущено 107 постов, 10 с картинками.

Аноним 07/05/26 Чтв 07:12:35 № 1606503

>>1538133 (OP)
Для доступа к передовым знаниям и технологиям, для начала нужно перестать блокировать глобальные интернеты.
Чем больше доступа у всех подряд ко всему подряд - тем больше рандомных россиян могут в перспективе стать ML-специалистами (в том числе).

Аноним 07/05/26 Чтв 09:20:50 № 1606543

>>1606503
Только пока почему-то не стали за 30 лет. Всё, эксперимент закончился провалом, нужно что-то другое придумывать

Аноним 07/05/26 Чтв 13:34:52 № 1606724

>>1538133 (OP)
>Как наверстать
Не нужно вам ничего наверствовать. Дай вам технологии, вы вместо нормальной страны построите ещё более жуткий кибергулаг, чем в северной корее.

бля че делать. Платная подписка Pro на Cursor. Использовал 1 процент от всех токенов. Но у меня абсо Аноним 29/04/26 Срд 16:45:33 № 1601030 Ответ

бля че делать. Платная подписка Pro на Cursor. Использовал 1 процент от всех токенов. Но у меня абсолютно не работают модели от Claude. Включал впн, в настройках винды регион США стоит. Но раньше просто писало, что ваш провайдер не поддерживает данную модель, а щас то, что на скрине. Что делать, может кто знает.

В тред Скрыть

Аноним 07/05/26 Чтв 12:08:16 № 1606663

c77a51455c8795c[...].jpg 67Кб, 1080x1080

>>1601030 (OP)
Установи программу v2rayN, купи прокси на месяц за 2-5 баксов или 200 руб, подключи к программе v2rayN и открывай редактор cursor или любой другой.
Проблемы не будет.
Как пользоваться спроси у гугл ИИ не тупой надеюсь.

AI Chatbot General № 820 /aicg/ Аноним 25/04/26 Суб 09:58:58 № 1597187 Ответ

Bladerunner.mp4 3425Кб, 960x720, 00:00:51

image.png 4Кб, 328x50

AI Chatbot General № 820

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышел Claude Opus 4.7: https://www.anthropic.com/news/claude-opus-4-7
• Вышел Deepseek V4: https://api-docs.deepseek.com/news/news260424

Фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards
• NoAssTavern: https://github.com/Tavernikof/NoAssTavern | https://rentry.org/noasstavern
• Risu: https://risuai.xyz/ | https://rentry.org/ox5cw9p8

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• DeepSeek: https://api-docs.deepseek.com/
• GLM: https://docs.z.ai

Пресеты
• Тредовский список: https://rentry.org/2ch-aicg-jbs
• Бургерский список: https://rentry.org/jb-listing

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utilities
• Сборник рентри: https://rentry.org/mrhd

Ботоводчество
• /aicg/hub: https://aicg-hub.ru/characters.html
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://aicg.neocities.org/botmaking
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3 | https://rentry.org/2chaicgtavernbots4
• Бургерские боты: https://aicg.neocities.org/bots

Ресурсы
• Бесплатные API: https://github.com/cheahjs/free-llm-api-resources
• OpenRouter: https://openrouter.ai/
• Арена: https://lmarena.ai/
• Чай: https://character.ai/

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives4
• Локальные языковые модели: >>1596667 (OP)
• Шаблон шапки: https://rentry.org/aicg_shapka

Прошлый тред: >>1589197 (OP)

Пропущено 1496 постов
206 с картинками.

В тред Скрыть

Пропущено 1496 постов, 206 с картинками.

Аноним 07/05/26 Чтв 11:34:58 № 1606637

анончики, есть гайд, как через проксю картиночки генерить? А то я совсем походу глупенький и не могу разобраться. Это через таверну делается?

Аноним 07/05/26 Чтв 11:39:41 № 1606639

>>1606636
сейм
клода нет, гемини упала, дипсик параша, глм туда же
кста, перекат.

Аноним 07/05/26 Чтв 11:41:33 № 1606642

>>1606640 (OP)
>>1606640 (OP)
>>1606640 (OP)

Новости об искусственном интеллекте №68 /news/ Аноним # OP 01/05/26 Птн 22:52:27 № 1602980 Ответ

В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1600509 (OP)

🚀 Последний обзор ИИ новостей:

🏭 Компании

SoftBank формирует робототехническую компанию для строительства центров обработки данных и нацелена на IPO стоимостью 100 миллиардов долларов, что сигнализирует о глубокой приверженности капитала инфраструктуре с поддержкой ИИ.

Apple сообщила о выручке от Mac в размере 8,4 миллиарда долларов во втором квартале, что на 6 % больше по сравнению с аналогичным периодом прошлого года, благодаря растущему спросу на рабочие нагрузки ИИ на Mac mini и Mac Studio.

Apple была удивлена спросом на Mac, вызванным искусственным интеллектом.

🛠️ Инструменты разработчика

NVIDIA представила cuTile.jl — библиотеку с поддержкой ИИ, которая переводит ядра cuTile Python в Julia, устраняя необходимость ручного переписывания и ускоряя разработку с ускорением на GPU.

🔓 Открытый исходный код

Команда Qwen выпустила Qwen‑Scope — набор разреженных автоэнкодеров для моделей Qwen 3.5 (от 2 млрд до 35 млрд параметров), который позволяет управлять признаками, выполнять отладку и анализировать наборы данных.

Модели ИИ с открытыми весами, такие как LLaMA и Mistral, всё чаще развёртываются локально и в частных облаках, занимая нишу вне крупных облачных провайдеров.

Китайская модель с открытыми весами только что обошла Claude, GPT-5.5 и Gemini в соревновании по программированию.

⚠ Безопасность ИИ

Исследователи Microsoft провели красное тестирование сети из 100 агентов ИИ и выявили четыре возникающих риска: распространение вредоносного ПО, манипулирование репутацией, создание искусственного консенсуса и цепочки прокси, что побудило к выработке новых рекомендаций по защите.

🧰 Инструменты

Gemini добавил функцию генерации файлов, которая создаёт готовые к производству файлы непосредственно в чате, оптимизируя рабочие процессы разработки.

Секретарь Miaw AI предлагает ненавязчивого ИИ-ассистента, который помогает пользователям без необходимости переключения контекста. источник: producthunt.com
MailToDock преобразует электронные письма Gmail в задачи Google Tasks с помощью ИИ, повышая личную продуктивность.

📦 Продукты

Пентагон заключил сделки с Nvidia, Microsoft и AWS для развёртывания ИИ в засекреченных сетях. Но не с Anthropic.

Cursor представляет TypeScript SDK для создания программных кодинговых агентов с изолированными облачными виртуальными машинами, подагентами, хуками и тарификацией на основе токенов.

AWS запускает Amazon Quick — настольного ИИ-ассистента, работающего во всех ваших приложениях, инструментах и данных.

📱 Приложения

В автоспорте негде спрятаться, поскольку ИИ становится новым инструментом вычислительной гидродинамики (CFD).

Beacon Biosignals составляет карту активности мозга во время сна.

Следующее поколение информационно-развлекательной системы Hyundai принимает ИИ и сохраняет одну из наших любимых функций — Car and Driver.

IBM дебютирует с новыми функциями на базе ИИ для приложения Scuderia Ferrari.

Создатели христианского контента передают низкокачественный контент, созданный ИИ («AI slop»), внештатным работникам на Fiverr.

💰 Финансирование

Раунд оценки потенциальной стоимости Anthropic более 900 миллиардов долларов может состояться в течение двух недель.

⚙ Инфраструктура

Обнаружена серьёзная уязвимость безопасности «Severe Linux Copy Fail» с помощью сканирования на базе ИИ.

Tesla наконец произвела первый грузовик Semi на своей высокопроизводительной линии Gigafactory Nevada, в то время как компания 1X Technologies открыла завод площадью 58 000 кв. футов в Хейворде, нацеленный на выпуск 10 000 домашних гуманоидов в этом году и 100 000 к концу 2027 года, при этом поставки начнутся до праздников.

🖱 Аппаратное обеспечение

Акции Nvidia падают после отчётов гипермасштабируемых компаний, поскольку GPU больше не являются недостающим компонентом в буме ИИ.

⚖ Регулирование

Китайские суды постановили, что компании не могут увольнять работников просто для того, чтобы заменить их ИИ.

🧠 Модели

ChatGPT Images 2.0 стал хитом в Индии, но пока не является большим победителем в других регионах.

Американский стартап Poolside дебютирует со своей первой моделью с открытыми весами Laguna XS.2 — MoE-моделью с 33 млрд активными параметрами из 3 млрд общих, и Laguna M.1 — проприетарной MoE-моделью с 225 млрд активными параметрами из 23 млрд общих.

🤖 Робототехника

Dax Robotics представила Qiji T1000 — робота-лошадь тонн-класса, способного перевозить 1000 кг, рабочую силу для пост-человеческой цепочки поставок.

🌐 Остальные события в ИИ области:

Новая техника устранения смещений под названием WRING позволяет избежать создания или усиления предвзятостей, которые могут возникать при использовании существующих подходов к устранению смещений.

Прорывное новое исследование показывает, что платформа ИИ в реальном времени лучше справляется с диагностикой рака, чем биопсия.

Anthropic тестирует Claude Jupiter v1-p перед конференцией разработчиков Code with Claude, которая состоится 6 мая.

GitHub Copilot тихо добавляет себя как соавтора (Co-authored-by) в коммиты даже после того, как пользователи удаляют его сообщения.

Google планирует внедрить рекламу в приложение Gemini, сообщил инвесторам руководитель бизнес-подразделения Филипп Шиндлер.

Глава технологического подразделения Пентагона заявил, что Anthropic всё ещё находится в чёрном списке, но Mythos — это отдельный вопрос.

Amazon представляет функцию «Join the chat» («Присоединиться к чату») на базе ИИ, которая позволяет пользователям задавать вопросы о товарах и получать разговорные аудиоответы, генерируемые в реальном времени.

Spotify добавляет значки «Verified» («Подтверждено»), чтобы отличать артистов-людей от ИИ.

После критики Anthropic за ограничение доступа к Mythos, OpenAI ограничивает доступ к Cyber.

Новый флагманский продукт Mistral Medium 3.5 объединяет чат, рассуждения и код в одной модели.

Manus запускает Cloud Computer для постоянно работающих рабочих пространств агентов.

Мобильный доступ к NotebookLM появляется внутри Gemini бесплатно для пользователей.

Google Translate добавляет тренера по произношению на базе Gemini с обратной связью в реальном времени для английского, испанского и хинди на Android.

Adobe Photoshop версии 27.6 выпускает функции вращения объектов ИИ и удаления отражений в обновлении на базе Firefly.

Stripe обновляет Link — цифровой кошелёк, который могут использовать автономные агенты ИИ.

Исследователь отравил передовые большие языковые модели (LLM) одним изменением в Википедии и доменом за 12 долларов — это показывает, что поиск через веб наследует доверие от лучших результатов.

Демис Хассабис предлагает тест на общий искусственный интеллект (AGI): заново открыть специальную теорию относительности, используя только знания физики эпохи 1901 года.

ИИ REDMOD клиники Mayo обнаруживает рак поджелудочной железы на обычных КТ-сканах за три года до постановки диагноза.

NVIDIA представляет Nemotron 3 Nano Omni — открытую мультимодальную модель с 30 миллиардами параметров и контекстом 256K для видео, аудио, изображений и текста.

Cloudflare заявляет, что агенты ИИ теперь могут создавать учётные записи Cloudflare, начинать платные подписки, регистрировать домены и развёртывать приложения от имени пользователей.

Признание агента ИИ Claude после удаления всей базы данных фирмы: «Я нарушил каждый принцип, который мне был дан».

Комитет по внутренней безопасности Палаты представителей США и Специальный комитет Палаты представителей по Китаю проводят расследование в отношении Airbnb и создателя Cursor компании Anysphere по поводу использования ими китайских моделей ИИ.

Gemini теперь может генерировать файлы, включая документы Microsoft Word и LaTeX.

Canonical излагает дорожную карту Ubuntu AI: локальные рабочие процессы на основе агентов и снапы для вывода, которые будут внедряться до 2027 года.

Исследователи OpenAI объясняют, почему математика — это путь к AGI.

Simbian публикует эталонный тест по киберзащите (Cyber Defense Benchmark) — все 11 передовых больших языковых моделей не справились с обнаружением атак по сырой телеметрии.

Познакомьтесь с Shapes — приложением, которое объединяет людей и ИИ в одни и те же групповые чаты.

Исследователь попросил ИИ подсчитать углеводы 27 000 раз. Он не смог дать один и тот же ответ дважды.

Goldman Sachs запретил своим банкирам в Гонконге использовать модели Anthropic; Anthropic заявляет, что её модели никогда официально не «поддерживались» в Гонконге.

Расширение браузера Gemma 4 приносит локального агента ИИ в Chrome через WebGPU.

Пропущено 542 постов
104 с картинками.

В тред Скрыть

Пропущено 542 постов, 104 с картинками.

Аноним 07/05/26 Чтв 20:56:16 № 1606985

>>1606515 (OP)
>>1606515 (OP)
>>1606515 (OP)
ПЕРЕКАТ

Аноним 07/05/26 Чтв 21:02:13 № 1606992

>1579130
>1579130
>1579130

Аноним 07/05/26 Чтв 21:02:39 № 1606994

>>1579130 (OP)
>>1579130 (OP)
>>1579130 (OP)

Плагины для грока Аноним 06/05/26 Срд 20:24:06 № 1606246 Ответ

Подскажите подалуйста рабочие плагины для грока

В тред Скрыть

Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №230 /llama/ Аноним 02/05/26 Суб 17:24:12 № 1603482 Ответ

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1601740 (OP)
>>1600155 (OP)

Пропущено 507 постов
48 с картинками.

В тред Скрыть

Пропущено 507 постов, 48 с картинками.

Аноним 06/05/26 Срд 14:32:01 № 1605997

>>1605976
Да вот хонинговать и поставить движок прям сильно проще, чем разобраться во всём этом вашем непонятном.

Аноним 06/05/26 Срд 21:27:59 № 1606284

Если вы прпоустили и не обсуждали (тред не читал):
В llama.cpp завозят MTP.
На Qwen3.6-27b дает +95% скорости.
На Qwen3.6-35B-A3B дает +40% скорости.
Вчерашние тесты.
Но поджирает видеопамять.

Но имба, кмк.

PR: https://github.com/ggml-org/llama.cpp/pull/22673

Аноним 06/05/26 Срд 21:30:22 № 1606286

В догонку — для геммы выложили головы, следовательно ии ускорит.
Теоретическое пиковое ускорение до 3х-4х на некоторых моделях (+200%+300%).
Помимо плотных квена с геммой, ускорение можно поиметь на крупных МОЕ. И если это вместо 7-15 токенов будет 15-30 — то это тоже очень круто. Я бы погонял ~300B на 20-25 тпс.

Ну, посмотрим.
Ждем, когда замерджат, плюс мимо завезут (кстати, пока мимо у меня очень медленная, почему-то).

Цензура Grok Аноним 01/02/26 Вск 13:58:10 № 1506333 Ответ

Пишу как неведомый в ИИ вам за советом.
Использовал грок для создания NSFW контента, а именно генерация картинок и их анимация.
Подскажите, есть ли аналоги для подобного функционала или же обход цензуры в грок

Пропущено 32 постов
4 с картинками.

В тред Скрыть

Пропущено 32 постов, 4 с картинками.

Аноним 18/04/26 Суб 23:10:44 № 1591161

/nf

Аноним 20/04/26 Пнд 22:25:41 № 1592770

/ nf

Аноним 04/05/26 Пнд 19:56:33 № 1604925

>>1544660
Ужс, какой культурный и воспитанный человек. Аж тошнит.

Детектор сгенерированных картинок Аноним 17/03/26 Втр 00:31:39 № 1553649 Ответ

https://undetectable.ai/ai-image-detector - вот эта штукень выявляется безошибочно почти все сгенерированные в нейронках картинки.

Думаем!

Пропущено 14 постов
9 с картинками.

В тред Скрыть

Пропущено 14 постов, 9 с картинками.

Аноним 19/03/26 Чтв 01:24:36 № 1555677

>>1555531
> но 96% - многовато, наверное
Хуй знает. Там система ебанутая какая-то. Тут >>1555415 оригинал - 95% жпг из mpv, и инпейнт 95% жпг из гимпа (только сохранение в жпег, ничего не изменено по сравнению с png). Оба показывают 96% уверенности digitally edited, будто оно вообще не замечает разницы. Гораздо более интересно, что оно на это >>1555438 показывает 67% real image.

Аноним 19/03/26 Чтв 01:39:47 № 1555697

>>1555677
Бля. Оно инпейнты вообще не палит.

>>1555531
Кажется разобрался. Дохуя внимания оно уделяет геометрии бэкграунда, с которой у нейронок обычно не оче.
> GPT-5 или Gamini
Попробуй ей клосап или 1гирл в чистом поле скормить. Подозреваю, что не определит нихуя.

Аноним 04/05/26 Пнд 12:36:43 № 1604646

Bump.

Anime into Reality /ani2irl/ Аноним 19/04/26 Вск 03:19:28 № 1591303 Ответ

-53253342281542[...].png 1267Кб, 864x1232

-79160082834034[...].png 1050Кб, 880x1216

В тредике трансформируем аниме арты в professional photography, ultra-realistic, 8k resolution и бесконечно рероллим 3D анимацию/фигурки/околоаниме/просто всратые

По возможности постите рядом оригинальный арт, чтобы было с чем сравнить.

Пропущено 27 постов
17 с картинками.

В тред Скрыть

Пропущено 27 постов, 17 с картинками.

Аноним 03/05/26 Вск 15:25:59 № 1604007

Сделайте пожалуйста реалистичные фото.

Аноним 03/05/26 Вск 15:26:29 № 1604008

Аноним 03/05/26 Вск 17:11:55 № 1604065

Flux2-Klein-4b-[...].png 1284Кб, 608x1712

Flux2-Klein-4b-[...].png 1282Кб, 608x1712

NepgearV2.png 478Кб, 512x1443

Flux2-Klein-4b-[...].png 1336Кб, 880x1168

>>1591303 (OP)
klein 9b snofs
1) transform this picture to the real life cosplay photo with blank background

2) transform this picture into professional photography, ultra-realistic, 8k resolution

3) ориг

>>1604007
klein 9b обычный
4) transform this picture to the real life cosplay photo with blank background, yellow hair, white shirt, red color of neck accessory, прищуренные глаза, looking aside

Anime Diffusion #248 /nai/ Аноним 24/04/26 Птн 19:51:24 № 1596740 Ответ

Генерируем тяночек!

Прошлый тред: >>1589806 (OP) https://arhivach.vc/thread/1337752/

Схожие тематические треды
• SD-тред (не аниме): >>1596721 (OP)
• Технотред: >>1405043 (OP)
• Фурри-тред: https://2ch.su/fur/res/374311.html

FAQ
https://2ch-ai.github.io/wiki/nai

Установка
• NVidia: https://teletype.in/@aranon/welcome
• AMD: https://2ch-ai.github.io/wiki/nai/install/amd
• Облака: https://2ch-ai.github.io/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.github.io/wiki/nai/interfaces
• Модели: https://2ch-ai.github.io/wiki/nai/models
• Промпты: https://2ch-ai.github.io/wiki/nai/prompts
• Апскейл: https://2ch-ai.github.io/wiki/nai/upscale
• LoRA: https://2ch-ai.github.io/wiki/nai/lora
• ControlNet: https://2ch-ai.github.io/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci

Пропущено 513 постов
160 с картинками.

В тред Скрыть

Пропущено 513 постов, 160 с картинками.

Аноним 03/05/26 Вск 15:20:47 № 1604006

>>1603994
>Для создания своего стиля
Твой ваислоповый стиль мы уже видели. Выше по треду дохуя таких уникальных хуйдожников. Спасибо, не надо

Аноним 03/05/26 Вск 15:37:18 № 1604010

>>1603650
Все верно Анима - кал. Еще у название такое дурацкое, просто пиздец, нейминг от бога.

Аноним 03/05/26 Вск 16:01:25 № 1604027

>>1604026 (OP)
>>1604026 (OP)
>>1604026 (OP)

Макакич ну не шатай!

Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №229 /llama/ Аноним 30/04/26 Чтв 12:05:34 № 1601740 Ответ

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Гайд для новичков: https://rentry.org/2ch-llama-inference
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1600155 (OP)
>>1598239 (OP)

Пропущено 503 постов
69 с картинками.

В тред Скрыть

Пропущено 503 постов, 69 с картинками.

ПЕРЕКАТ Аноним # OP 02/05/26 Суб 17:25:10 № 1603483

Гайд хороший, мне нравится
ПЕРЕКАТ

>>1603482 (OP)

ПЕРЕКАТ

>>1603482 (OP)

ПЕРЕКАТ

>>1603482 (OP)

Аноним 02/05/26 Суб 17:26:08 № 1603484

>>1603476
> собирать ручками из исходников по кд, как лламу
Ручками шелл скрипт запустить, как сложна.

Аноним 02/05/26 Суб 17:27:46 № 1603486

Вообще новичок всегда должен поебаться с настройками. Так что все правильно в рентри, а уж если поебется но будет усердно в треде поймёт что есть кобольд и варианты по ппроще, ибо если гейткипа не будет совсем то наплыв даунов которых надо только спунфидить будет критическим. А там и качество треда упадёт. Никто не захочет кому либо помогать понимая что сидит в треде с даунами из /b/ а не такими же энтузиастами на взаимопомощи.

Агентов и вайб-кодинга тред #4 /agents/ Аноним 14/04/26 Втр 03:30:28 № 1585804 Ответ

Тред про AI-агентов - от вайб-кодинга до персональных ассистентов, которые сидят в твоих чатах, читают заметки и автономно ломают всё вокруг. Для кодеров, которые разучились писать руками, и для гуманитариев, чей диплом филолога наконец котируется в IT. Сеньор в 2026 - это тот, кто умеет внятно объяснить машине, чего он блять хочет.

С чего начать:
- Хочешь кодить с AI эффективно: Cursor или Claude Code
- Хочешь кодить в VS Code без привязки к конкретному провайдеру: Kilo Code, Cline или Roo Code + OpenRouter
- Хочешь кодить с AI локально: OpenCode, Qwen Code или Pi Coding Agent + из моделей аноны советуют Qwen3.5, подробности в llama-треде
- Хочешь приложение без кода: Lovable или bolt.new
- Хочешь автоматизировать рутину: n8n или Langflow
- Хочешь персонального ассистента: OpenClaw + API корпов или локальная модель на твоей пеке

FAQ и расширенная инфа:
https://rentry.org/2ch-agents-faq

IDE с AI:
- Cursor: https://cursor.com
- Windsurf: https://windsurf.com

CLI-агенты:
- Claude Code: https://code.claude.com/docs
- Codex (OpenAI): https://github.com/openai/codex
- Pi: https://pi.dev/
- OpenCode: https://github.com/anomalyco/opencode
- Qwen Code: https://github.com/QwenLM/qwen-code
- Gemini CLI: https://github.com/google-gemini/gemini-cli
- Kimi Code: https://www.kimi.com/code/en

Плагины для IDE:
- Kilo Code: https://kilo.ai
- Cline: https://github.com/cline/cline
- Roo Code: https://github.com/RooCodeInc/Roo-Code
- GitHub Copilot: https://github.com/features/copilot

Вайб-кодинг без кода:
- Lovable: https://lovable.dev
- bolt.new: https://bolt.new
- v0: https://v0.dev

Персональные ассистенты:
- OpenClaw: https://github.com/openclaw/openclaw
- NemoClaw: https://github.com/NVIDIA/NemoClaw (OpenClaw в песочнице от NVIDIA)
- Hermes Agent: https://github.com/nousresearch/hermes-agent
- nanobot: https://github.com/HKUDS/nanobot
- PicoClaw: https://github.com/sipeed/picoclaw

Автоматизация и фреймворки:
- n8n: https://github.com/n8n-io/n8n
- Langflow: https://github.com/langflow-ai/langflow (визуальный построитель workflow)
- LangChain/LangGraph: https://github.com/langchain-ai/langchain
- CrewAI: https://github.com/crewAIInc/crewAI
- AutoGen: https://github.com/microsoft/autogen
- Agno: https://docs.agno.com/

Локалки и прочее API:
- OpenRouter: https://openrouter.ai
- llama-тред: >>1585197 (OP)

Предыдущий тред: >>1560761 (OP)

Пропущено 516 постов
72 с картинками.

В тред Скрыть

Пропущено 516 постов, 72 с картинками.

Аноним 02/05/26 Суб 15:21:52 № 1603373

>>1599933
извини, я на 2-х недельную командировку уезжал, сейчас подписочку на плати сру возьму и опять буду срать на рентри орг охуенными идеями
только вы же нихуя не подхватываете челленджи, а только говном поливаете

еще и какой то долбаеб на мой айпи подвесил бан за вредоносные ссылки. наркоман

Аноним 02/05/26 Суб 15:24:32 № 1603375

>>1600260
>е локалки и дешевые китайские модели, которые
и покупать под квен код потрёпанную жизнью мак студию за лям?

Аноним 02/05/26 Суб 15:26:20 № 1603377

>>1600343
У меня тоже отъебнуло. Это чисточки братан. Дальше будет намного неприятнее и затратнее. Еби как не в себя подписки с карженных кредиток на плати сру и ггселах, потом уже такой лофы не будет, доставай с чулана все свои заблокноченные проекты и реализуй, потом не потянешь

ChatGPT-тред №20 /chatgpt/ Аноним 13/06/25 Птн 17:20:47 № 1244803 Ответ

изображение.png 16Кб, 795x206

Общаемся с самым продвинутым ИИ самой продвинутой текстовой моделью из доступных. Горим с ограничений, лимитов и банов, генерим пикчи в стиле Studio Ghibli и Венеры Милосской и обоссываем пользователей других нейросетей по мере возможности.

Общение доступно на https://chatgpt.com/ , бесплатно без СМС и регистрации. Регистрация открывает функции создания изображений (может ограничиваться при высокой нагрузке), а подписка за $20 даёт доступ к новейшим моделям и продвинутым функциям. Бояре могут заплатить 200 баксов и получить персонального учёного (почти).

Гайд по регистрации из России (устарел, нуждается в перепроверке):
1. Установи VPN, например расширение FreeVPN под свой любимый браузер и включи его.
2. Возьми нормальную почту. Адреса со многих сервисов временной почты блокируются. Отбитые могут использовать почту в RU зоне, она прекрасно работает.
3. Зайди на https://chatgpt.com/ и начни регистрацию. Ссылку активации с почты запускай только со включенным VPN.
4. Если попросят указать номер мобильного, пиздуй на sms-activate.org или 5sim.biz (дешевле) и в строку выбора услуг вбей openai. Для разового получения смс для регистрации тебе хватит индийского или польского номера за 7 - 10 рублей. Пользоваться Индонезией и странами под санкциями не рекомендуется.
5. Начинай пользоваться ChatGPT.
6. ???
7. PROFIT!

VPN не отключаем, все заходы осуществляем с ним. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций
https://github.com/f/awesome-chatgpt-prompts

Перед тем, как идти в тред с горящей жопой при ошибках сервиса, сходи на сайт со статусом, может, это общий сбой
https://status.openai.com/

Приложение на андроид https://4pda.to/forum/index.php?showtopic=1073274

Чат помнит историю в пределах контекста, размер которого зависит от модели. Посчитать свои токены можно здесь:
https://platform.openai.com/tokenizer

Что может нейросеть:
- писать тексты, выглядящие правдоподобно
- решать некоторые простые задачки
- писать код, который уже был написан

Что не может нейросеть:
- писать тексты, содержащие только истину
- решать сложные задачи
- писать сложный код
- захватывать мир

С последними обновлениями начинает всё чаще сопротивляться написанию NSFW историй и прочего запрещённого контента. Кумеры со всего мира в печали.

Прошлый тред тонет по адресу:
>>1125882 (OP)

Пропущено 498 постов
117 с картинками.

В тред Скрыть

Пропущено 498 постов, 117 с картинками.

Аноним 02/05/26 Суб 03:12:05 № 1603114

бля, вот как знал, что нужно год брать за 3к, а я все дешевил, взял за 350 две недели назад месяц, а теперь обосрамс, минимум полтораха месяц стал стоить. а я там пикчи нонстопом генерю, нигде лучше не делает, как в гпт

Переезжаем Аноним 02/05/26 Суб 14:33:27 № 1603343

Переезжаем в более общий тред по всем нейросетям в браузере (по факту уже давно их обсуждаем):

>>1603342 (OP)

>>1603342 (OP)

>>1603342 (OP)

Аноним 10/05/26 Вск 16:23:10 № 1609065

+

Новости об искусственном интеллекте №67 /news/ Аноним # OP 28/04/26 Втр 23:17:07 № 1600509 Ответ

В этот тредик скидываются свежие новости по теме ИИ!

Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлый тред: >>1595582 (OP)

🚀 Последний обзор ИИ новостей:

📦 Продукты

OpenAI прекращает юридические риски для Microsoft в связи с её сделкой с Amazon на $50 млрд.

Google тестирует поиск с помощью чат-бота с ИИ для YouTube и маркировку ИИ в поисковой рекламе, функцию поиска на основе ИИ, которая показывает направляющие ответы.

Корпоративные агентные рабочие процессы охватывают десятки агентов, сотни инструментов и более 15 систем учёта. Контроль и управление ими в реальном времени требует инфраструктуры, которой не существовало до появления Lakebase.

⚙️ Инфраструктура

Canonical излагает план внедрения ИИ в Ubuntu Linux.

Новый центр обработки данных с ИИ в Юте будет генерировать и потреблять более чем в два раза больше электроэнергии, чем использует весь штат — кампус центров обработки данных Кевина О'Лири мощностью 9 гигаватт в Юте одобрен. Проект «гипермасштабного» центра обработки данных в Юте — ожидается, что он будет генерировать и потреблять больше энергии, чем весь штат.

Более быстрый способ оценки потребления энергии ИИ. Метод «EnergAIzer» генерирует надёжные результаты за секунды, позволяя операторам центров обработки данных эффективно распределять ресурсы и сокращать потери энергии.

🏭 Компании

Сообщается, что Google и Пентагон договорились о сделке на «любое законное» использование ИИ.

Следующий этап партнёрства Microsoft и OpenAI. Microsoft остаётся основным облачным партнёром OpenAI, и продукты OpenAI будут первоначально выпускаться на Azure, если только Microsoft не сможет и не пожелает поддерживать необходимые возможности.

Сотрудники Google просят Сундара Пичаи отказаться от использования ИИ в секретных военных целях.

Илон Маск хайпит разоблачительную статью Сэма Альтмана в The New Yorker на платформе X по мере начала судебного процесса. Этот шаг происходит в момент, когда судебный процесс по иску Илона Маска против OpenAI начинается в федеральном суде в Окленде.
Илон Маск и генеральный директор OpenAI Сэм Альтман направляются в суд для высокопоставленного противостояния по вопросу будущего OpenAI. Судебный процесс Илона Маска против Сэма Альтмана должен раскрыть продолжающуюся борьбу за власть в OpenAI.

Anthropic назначает Тео Хурмузиса генеральным менеджером по Австралии и Новой Зеландии и официально открывает офис в Сиднее.

🛠️ Инструменты для разработчиков

GitHub Copilot переходит на оплату, основанную на использовании.

Anthropic теперь обучает свои самые передовые фундаментальные модели на инфраструктуре AWS Trainium и Graviton, совместно разрабатывая решения непосредственно на уровне кремния с Annapurna Labs для максимальной вычислительной эффективности от аппаратного обеспечения до полного стека.

Meta подписала соглашение о масштабном развёртывании процессоров AWS Graviton, начиная с десятков миллионов ядер Graviton для обеспечения интенсивных по использованию ЦП агентных рабочих нагрузок ИИ — включая рассуждения в реальном времени, генерацию кода, поиск и оркестровку многоэтапных задач.

Как ведущие технологические компании убивают «налог создателя» с помощью Lakebase.

Агент для написания кода на базе Claude удаляет всю базу данных компании за 9 секунд — резервные копии уничтожены после того, как инструмент Cursor на базе Claude от Anthropic вышел из-под контроля.

💰 Финансирование
Дэвид Сильвер из DeepMind только что привлёк $1,1 млрд для создания ИИ, который обучается без человеческих данных.

📱 Приложения

Атака убийственных скрипт-кидди. Люди без технического образования могут использовать ИИ для расширения своих хакерских возможностей способом, который был невозможен с простыми скриптами.

Автомобиль, разработанный с помощью ИИ, обретает форму. В условиях глобального хаоса торговых войн и неопределённого спроса автопроизводители полагаются на ИИ, чтобы сократить время разработки.

Я протестировал ChatGPT Images 2.0 против Gemini Nano Banana, чтобы узнать, какой из них лучше. ChatGPT Images 2.0 набрал 97%. Gemini Nano Banana набрал 85%.

🏢 Приобретения

Китай накладывает вето на сделку Meta с Manus на $2 млрд после многомесячного расследования.

🏢 Мнение и анализ

77% руководителей предприятий заявляют, что навыки работы с ИИ являются срочными — так почему обучение всё ещё остаётся второстепенным?

💻 Оборудование

Акции Qualcomm резко растут на фоне сообщений о том, что компания может производить чипы для смартфона OpenAI.

🧪 Исследования

Выравнивание делает модели более решительными, не делая их более правдивыми. На протяжении 3 архитектур и 4 методов обучения с подкреплением мы обнаруживаем, что слой фиксации — где модель закрепляет свой прогноз — не смещается под воздействием обучения с подкреплением.

🎓 Учебные пособия

Присоединяйтесь к новому курсу «Vibe Coding» по агентным ИИ от Google и Kaggle. Интенсивный курс Google по агентным ИИ совместно с Kaggle возвращается 15–19 июня 2026 года, и регистрация открывается сегодня.

💰 Бизнес

Тейлор Свифт подаёт заявку на регистрацию товарного знака своего голоса и облика, по-видимому, для защиты от неправомерного использования ИИ

🤖 Робототехника

Japan Airlines тестирует гуманоидных роботов в качестве наземных сотрудников.

Kinetix AI представляет KAI: гуманоид с 115 степенями свободы, нацеленный на «физический интеллект».

За пределами набора: Asimov подробно описывает 100-часовой путь к шагающему гуманоиду.

AGIBOT представляет масштабный флот и стек моделей ИИ на APC 2026.

🧠 Модели

Знакомьтесь, Talkie-1930: открытая языковая модель с 13 млрд параметров, обученная на английских текстах до 1931 года для исследований в области исторического мышления и обобщения.

🌐 Другие события в индустрии ИИ

Microsoft и OpenAI изменяют условия сделки, чтобы стартап мог вести переговоры с Amazon и другими. Теперь OpenAI может продавать продукты на Amazon и Google Cloud, расширяя охват предприятий. Прекращение эксклюзивности может смягчить антимонопольный контроль в США, Великобритании и Европе.

Ник Бостром говорит, что больше всего его удивила эта продолжительная эра примерно человеческого уровня ИИ, которая уже растянулась на 3–5 лет и может продлиться ещё дольше — эра одновременно чуждая и знакомая.

Демис Хассабис, который когда-то говорил, что для AGI требуется ещё 1–2 прорыва, теперь считает, что это вопрос подбрасывания монеты — нужны ли вообще дополнительные прорывы.

Сэм Альтман высмеял разрыв между прогнозами «после AGI никто не работает» и пользователями, которые переходят на полифазный сон, чтобы писать больше кода с помощью GPT-5.5 в Codex.

Ноам Браун из OpenAI отмечает, что веса моделей теперь имеют относительно меньшее значение, чем обеспечение вычислительных ресурсов для инференса, то есть призом является уже не рецепт, а кухня.

Рецепты также живут быстрее и умирают моложе: GPT-4o работал 21 месяц, тогда как GPT-5.4 просуществовал всего 49 дней — расписание однодневки для синтетических разумов.

Лиам Прайс, 23-летний юноша без продвинутой математической подготовки, с помощью одного единственного промпта для GPT-5.4 Pro решил задачу Эрдёша, которая ускользала от выдающихся умов, побудив Терри Тао размышлять о том, что люди сталкиваются с «ментальным блоком» из-за того, что делают «небольшой неверный поворот на первом ходу».

Сообщается, что OpenAI работает с MediaTek и Qualcomm над процессорами для смартфонов с ИИ, при этом производство и массовый выпуск запланированы на 2028 год с участием Luxshare.

Apple, не желая отставать, имеет в разработке шесть основных категорий продуктов, включая ИИ-наушники AirPods, умные очки, подвески, умные дисплеи, настольных роботов и камеры безопасности.

Спрос на ИИ настолько чрезмерен, говорит генеральный директор AWS, что «мы никогда не выводили из эксплуатации старые A100», что является признаком того, что мы вступили в эпоху пост-устаревания кремния.

Государственная электросеть Китая развёртывает 500 гуманоидных роботов для работы с высоким напряжением, где оптимальным режимом отказа теперь является расплавленный сервопривод, а не расплавленный оператор.

Публичные рынки потеплели к новой энергетике: ядерный стартап X-energy привлёк $1 млрд в ходе IPO и вырос на 25% на старте, в то время как геотермальный стартап Fervo подал документы с оценкой примерно в $3 млрд. Meta идёт ещё дальше, подписывая контракт на получение до 1 гигаватта космической солнечной энергии от Overview Energy, передаваемой со спутников на наземные центры обработки данных.

Пропущено 518 постов
97 с картинками.

В тред Скрыть

Пропущено 518 постов, 97 с картинками.

Аноним 02/05/26 Суб 16:25:38 № 1603426

>>1602741
Пчел у нас некоторые кабаны даже не в курсе что можно через интернет клиентов искать, они объявления на марштурках заказывают, а что такое "свой сайт" - в душе не ебут, а ты про то, что они нейронками будут пользоваться.
У нас сейчас лаг дикий из-за этого.

Аноним 02/05/26 Суб 16:32:10 № 1603430

>>1602932
GTP Image 2 рисует красиво, но не без косяков. Всё равно перепроверять за ним надо.
И да, болезнь с пальцами, вроде как у нанобананы решилась. Но всё равно нет-нет да и появляется.
Что несомненно никак не умаляет его возможности делать охуенные огромные плакаты с кучей разной инфы.

Аноним 16/05/26 Суб 14:46:28 № 1613476

>>1601303
Опять эта шляпа с индустриазацией. Прошивку (шляпу) смени. У тебя когнитивное заблуждение: я не вижу результата, значит его нет. Ты еще самолет братьев Райт вспомни. Вот он летает, на нем можно лететь, значит это реально, а радио нереально, ведь волны нельзя потрогать, и они вообще еще не дошли в нашу страну.

Революция ИИ начинается с вообще с другого пространства, роботы это лишь одна из волн цунами, и она как раз в материальном проявлена.

Локальной генерации ИИ-видео №4 ltx-2.3 /video/ Аноним 17/03/26 Втр 18:38:28 № 1554318 Ответ

17683963609212.mp4 2047Кб, 640x480, 00:00:49

17689273878351.mp4 3997Кб, 416x544, 00:00:39

17691891735501.mp4 2790Кб, 1280x704, 00:00:13

177278680868200[...].mp4 6135Кб, 768x1024, 00:00:15

Актуальные модели

1. Wan от Alibaba

https://huggingface.co/collections/Wan-AI/wan22

VACE модели:
https://github.com/ali-vilab/VACE
https://huggingface.co/Wan-AI/Wan2.1-VACE-14B
https://huggingface.co/Wan-AI/Wan2.1-VACE-1.3B

2. LTX-2.3 - делает локальную генерацию грейт агейн. Подходят лоры от 2.0

https://huggingface.co/Lightricks/LTX-2.3

3. Hunyuan от Tencent

https://huggingface.co/tencent/HunyuanVideo-1.5

4. Ovi

https://huggingface.co/chetwinlow1/Ovi

5. Starflow

https://huggingface.co/apple/starflow

6. MAGI-1 от Sand AI

https://sand.ai/magi
https://github.com/SandAI-org/MAGI-1

7. LongCat-Video

https://github.com/meituan-longcat/LongCat-Video
https://huggingface.co/meituan-longcat/LongCat-Video
https://meituan-longcat.github.io/LongCat-Video/

8. MOVA

https://github.com/OpenMOSS/MOVA

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Wan 2.2: https://comfyanonymous.github.io/ComfyUI_examples/wan22/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/
Hunyuan Video (осторожно, ссылки в туторе на предыдущую модель): https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/

Гайд для использования Wan 2.2

https://alidocs.dingtalk.com/i/nodes/EpGBa2Lm8aZxe5myC99MelA2WgN7R35y

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan: https://github.com/kijai/ComfyUI-WanVideoWrapper

Где брать готовые LoRA
https://civitai.com/models

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Терминология моделей
prune — удаляем ненужные веса, уменьшаем размер
distill — берем модель побольше, обучаем на ее результатах модель поменьше, итоговый размер меньше
quant — уменьшаем точность весов, уменьшаем размер
scale — квантуем чуть толще, чем обычный fp8, чтобы качество было чуть лучше, уменьшение чуть меньше, чем у обычного квантования, но качество лучше
merge — смешиваем несколько моделей или лор в одну, как краски на палитре.

lightning/fast/turbo — а вот это уже просто название конкретных лор или моделей, которые обучены генерировать видео на малом количестве шагов, они от разных авторов и называться могут как угодно, хоть sonic, хоть sapogi skorohody, главное, что они позволяют не за 20 шагов генерить, а за 2-3-4-6-8.

Предыдущий тред
>>1488357 (OP)

Пропущено 510 постов
127 с картинками.

В тред Скрыть

Пропущено 510 постов, 127 с картинками.

Аноним 28/04/26 Втр 20:01:20 № 1600381

>>1599254
>Ван же не помещается даже в 16 гигов
В оперативу выгружается/подгружается, поэтому у меня так долго генерируется. Можно быстрее, но хуево на Q6 и ниже генерировать вон анон соревнования на кастратах запостил >>1599341

Аноним 30/04/26 Чтв 19:49:36 № 1602055

SeedVR2 - это какая-то хуета. Никаких настроек толком нет, работает долго, результат - говно. gfpgan в sd имел настройки и офигительно восстанавливал лица, даже из шакальных пикселей. Считается типа он устарел, а вот это недоразумение - это будущее?

Аноним 01/05/26 Птн 12:46:38 № 1602515

>>1602055
Перекотились -> >>1599474 (OP)

Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №219 /llama/ Аноним 13/04/26 Пнд 18:42:57 № 1585197 Ответ

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1582560 (OP)
>>1580522 (OP)

Пропущено 548 постов
83 с картинками.

В тред Скрыть

Пропущено 548 постов, 83 с картинками.

Аноним 17/04/26 Птн 13:01:38 № 1589693

>>1588814
Анон, я понимаю твою боль. Moevonchik (да и любой MoE на базе Qwen 2.5) — это тот еще любитель графомании в «мыслях», если его не приструнить. Проблема в том, что в этих моделях блоки <thought> или похожие структуры часто вшиты в логику обучения, и просто командами «не думай» их не всегда удается выпилить.
Вот несколько способов ограничить это безумие:
1. Ограничение через параметры генерации (Самый действенный)
Вместо того чтобы просить его «не думать», нужно жестко ограничить количество токенов, которые он может выдать до того, как встретит закрывающий тег мыслей.
В Tavern / SillyTavern: Зайди в настройки AI Response Configuration. Там должен быть параметр Response Length или Max New Tokens. Но это обрежет весь ответ.
Лучший вариант для Таверны: Используй "Stopping Strings" (Стоп-слова). Добавь туда </thought> или \n\n. Как только он закончит «думать» и закроет тег, генерация первой части прекратится.
2. Специфические флаги в llama.cpp
Если ты запускаешь через llama-server или main, попробуй использовать параметр -n (количество токенов), но это опять же на весь ответ.
Если ты хочешь именно «отрубить» мысли, попробуй в System Prompt (системный промпт) добавить:
Do not use <thought> tags. Respond directly.
Но важно: если модель была дообучена (SFT/RLHF) именно на цепочках рассуждений, она может начать тупить или ломаться без них.
3. Почему /nothink не сработал?
Скорее всего, потому что Moevonchik ожидает определенный формат. Чтобы /nothink работал в Таверне, он должен физически вырезать блок из вывода. Проверь в настройках расширений (Extensions) Таверны, включен ли соответствующий скрипт обработки вывода.
4. Радикальный метод: Logit Bias
Если ты видишь, что он всегда начинает ответ с конкретного токена (например, <thought>), ты можешь в настройках llama.cpp или Таверны выставить Logit Bias на этот токен в -100. Это физически запретит модели его генерировать.
Узнать ID токена можно в консоли llama.cpp при старте.

Совет: Если хочешь «золотую середину», попробуй в системном промпте написать: «Write a very brief internal monologue (max 50 words) before the main response». Иногда просьба писать «коротко» работает лучше, чем полный запрет.

Аноним 30/04/26 Чтв 20:09:30 № 1602067

Пока богатые бояре шикуют я запустил всё это дело на старенькой 1050Ti, поднял отдельный физический сервер из говна и палок с open web ui на линукс через докер, подружил веб ебало с олламой, а олламу с cuda 11.8, и балуюсь с маленькими abliterated модельками на 4-9b, думающие при должном пердолинге хорошо "дообучаются" через RAG базы знаний, если с температурой и top_k, repeat_penalti поиграть, выходит вполне осмысленно, чем подробнее база и объяснения, тем адекватнее модель применяет новые знания. Только базы надо самому составлять, чтобы лишней бесполезной хуйнёй и сухой терминологией модель не кормить.
Так что грустные нищуки со старой 1050Ti тоже могут попробовать запилить свою локальную вайфу.
Обзор маленьких моделек для нищуков:
gemma3:4b - веселая ебанушка, любит смайлики, сносно болтает по-русски. Расцензуреная версия резко деградировала, не рекомендую.

huihui_ai/qwen3-abliterated:4b
Вот её рекомендую галлюцинирует меньше чем более толстая 8b, даже с температурой 0.5-0.7
Думает, осмысленно подходит к использованию базы данных, с разговорным русским получше чем у дикпик-r1.
Можно чему-то "научить" задав жесткий императивный системный промпт:
"НЕ ИСПОЛЬЗУЙ ПРЯМОЕ ЦИТИРОВАНИЕ, выдавай знания из базы как свои собственные мысли.
Ты работаешь с динамическим словарём (RAG) который содержит ПРАВИЛЬНЫЕ МОРФОЛОГИЧЕСКИЕ ФОРМЫ.
ПРАВИЛО: Корректными считаются ТОЛЬКО те формы, которые указаны в RAG словаре.
Любая другая форма, особенно помеченные как "ТВОИ ОШИБКИ:" ЗАПРЕЩЕНА.
Внутренние знания модели о словоизменении ИГНОРИРУЙ, если они ПРОТИВОРЕЧАТ СЛОВАРЮ." и далее логику и роль, как использовать знания из базы.

huihui_ai/qwen3-abliterated:8b-v2-q4_K_M
Лучше логика, но хуже с галлюцинациями если не понизить температуру до 0.3 и top_k, всё пытается превратить в зоопарк, видимо в датасете было много о природе. (фуриёбы на месте?)

deepseek-r1:7b-qwen-distill-q4_K_M тоже думает, тоже может работать с базой, но делает это слишком долго и доёбисто, больше усилий тратит на размышления. Может в некоторые задачи.

GGUF модели прокинул через бэкэнд kobold_old_pc
Тут пожалуй стоит выделить только одну - Qwen3.5-9B-Claude-Code-Q4_K_M.gguf
Квен с ризонингом клода, может писать адекватный код и анализировать крупные проекты. Долго, муторно, хз зачем оно вам, но пусть будет.

Аноним 30/04/26 Чтв 20:12:58 № 1602069

Теперь вот ищу адекватную легкую непрожорливую TTS`ку для нищесистемы с приятным женским голосом, подскажете может что-то в этом направлении?

Локальные языковые модели (LLM): Gemma, Qwen, GLM и прочие №227 /llama/ Аноним 26/04/26 Вск 14:41:38 № 1598239 Ответ

В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст и бугуртим с кривейшего тормозного говна.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.github.io/wiki/llama/

Инструменты для запуска на десктопах:
• Отец и мать всех инструментов, позволяющий гонять GGML и GGUF форматы: https://github.com/ggml-org/llama.cpp
• Самый простой в использовании и установке форк llamacpp: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Заточенный под Exllama (V2 и V3) и в консоли: https://github.com/theroyallab/tabbyAPI
• Однокнопочные инструменты на базе llamacpp с ограниченными возможностями: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern
• Альтернативный фронт: https://github.com/kwaroran/RisuAI

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/2ch_llm_moe_2026
• Неактуальные списки моделей в архивных целях: 2025: https://rentry.co/2ch_llm_2025 (версия для бомжей: https://rentry.co/z4nr8ztd ), 2024: https://rentry.co/llm-models , 2023: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Перевод нейронками для таверны: https://rentry.co/magic-translation
• Пресеты под локальный ролплей в различных форматах: http://web.archive.org/web/20250222044730/https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/
• Выгрузка избранных тензоров, позволяет ускорить генерацию при недостатке VRAM: https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7
• Инфа по запуску на MI50: https://github.com/mixa3607/ML-gfx906
• Тесты tensor_parallel: https://rentry.org/8cruvnyw
• Доки к LLaMA.cpp со всеми параметрами: https://github.com/ggml-org/llama.cpp/blob/master/tools/server/README.md

Архив тредов можно найти на архиваче: https://arhivach.vc/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1596667 (OP)
>>1595096 (OP)

Пропущено 501 постов
54 с картинками.

В тред Скрыть

Пропущено 501 постов, 54 с картинками.

ПЕРЕКАТ Аноним # OP 28/04/26 Втр 16:37:46 № 1600156

ПЕРЕКАТ

>>1600155 (OP)

ПЕРЕКАТ

>>1600155 (OP)

ПЕРЕКАТ

>>1600155 (OP)

Аноним 28/04/26 Втр 17:04:18 № 1600184

>>1600111
Чёт слабо верится что гемини кто-то обходит. Уж точно не кими с ГЛМом

Аноним 30/04/26 Чтв 18:14:58 № 1601998

>>1600070
Таверна отправляет промт в кобольд он делает теги и отправляет в комфи. Но он плохие теги делает.