Все ИИ-агенты для программирования с громким треском провалили новый бенчмарк чистоты и качества кода!
Alibaba протестировала ИИ-агентов для программирования на 100 реальных кодовых базах, каждая из которых охватывала 233 дня разработки. Результат - полный провал ИИ в программировании.
Выяснилось, что один раз сгенерировать код и пройти тесты — не так уж сложно. А вот поддерживать код в течение 8 месяцев и при этом не ломать всё подряд — именно здесь ИИ с огромным треском проваливает задачу хуже джуна.
SWE-CI — это первый бенчмарк, который измеряет долгосрочную поддержку кода, а не разовые исправления багов. В каждой задаче рассматривается 71 последовательный коммит, то есть реальная эволюция проекта во времени.
Для всех ИИ-сектантов, распространяющих крики «ИИ скоро заменит программистов», это очень плохой знак. Так что для всех, кто уже хоронил профессию программиста и рассказывал про «осталось пару лет», новости так себе. Похоже, между «умеет написать еле работающий прототип» и «умеет быть нормальным инженером и поддерживать кодовую базу проекта» по-прежнему огромная пропасть.
>>3661149 (OP) ты идёшь на хуй по причине конченный доолбоеб.
ваши стетейки в анус себе запихните и идите бляди решать свои алгоримы. не лезьте в четверную промышленную революцию своими костлявыми пальцами.
только кончь последняя будет отрицать, что ИИ работает. для этого достаточно оплатить 20 баксов и подключить проксю или впн и лично убедиться.
но у вас тупоголовых блядей и это не получается, ещё айтишниками зовётесь.
>именно здесь ИИ с огромным треском проваливает задачу хуже джуна это просто ебаный пиздежь. почему у меня ИИ пишет хороший код, а в ублюдских статеечка х - нет?
>А вот поддерживать код в течение 8 месяцев ты код среднестатистического кожаного мешка не сможешь поддерживать и через месяц, не говоря уже про 8 месяцев или несколько лет. промышленный код, написанный людьми априори дармовый. исключения - всякие библиотеки, где код вылило сообщество. в типовых проектах код ВЕЗДЕ одинаково дерьмовый.
>ты код среднестатистического кожаного мешка не сможешь поддерживать и через месяц Вот это самопроекции неосилятора. Сколько лично ТЫ написал проектов, поддерживаемых более нескольких месяцев с помощью ИИ?
>это просто ебаный пиздежь. почему у меня ИИ пишет хороший код, а в ублюдских статеечка х - нет? Потому что ты не пробовал поддерживать его на протяжении несколькиз месяцев или даже года. Это минимальное требование любого продакш-реди кода даже в нищей ИТ-галере под Самарой. Но выходит что даже уровень нищей самарской ИТ-галеры - недосягаемых для 100% нейронок мира кек.
>>3661219 >Сколько лично ТЫ написал проектов, поддерживаемых более нескольких месяцев с помощью ИИ? Два проекта успешно сопровождаются с помощью Claude Code
>Иди знакомься с научными исследованиями Зачем мне с ними знакомиться? Что бы что? Что бы потом писать на борде для дитишек визги про ИИ? Где ты, чмо ебучее, и где корпорации, которые нанимают лучших ученых и инженеров для работы в этой сфере?
>>3661239 >Чтобы не быть ИИ-промыткой, коей ты сейчас и являешься я ещё раз вопрос задам: где ты, пидоран, и где люди, которые работают в ТОП корпорациях, которые пилят сейчас всю ИИ-движуху?
Ты пидоран мне какие-то статеечки кидаешь, хотя вангую, работаешь на каком-нибудь всратом проекте макакой на впопулярном попсовом стеке для обезьян и что-то тут пытаешься мне обосновывать статеечками, в которых сам нихуя не понимаешь.
>>3661244 >Сопровождаются, а не написаны с нуля ИИ как было написано в ОП-посте Там ничего не написано про "с нуля". Там автор написал только то, что хочет видеть. > Результат - полный провал ИИ в программировании О каком провале вы пидоры тут вещаете, если у меня прямо сейчас Клод хуярит код, вот в этe минуту? пока я пост пишу?
>>3661266 >которые работают в ТОП корпорациях Что-то уровня эпохи доткомов кек. В итоге 90% этих манякорпораций успешно пукнули хрюкнули
>О каком провале вы пидоры тут вещаете, если у меня прямо сейчас Клод хуярит код, вот в этe минуту? пока я пост пишу? Верю! Верю, как же тут рандомнмоу пидоранчику с дипломом мухгу из под засратова не поверить!
>>3661270 >если у меня прямо сейчас Клод хуярит код, вот в этe минуту? пока я пост пишу В то что твоя ИИ-слоп машина успешно пишет тонны говнослопа я как раз верю и верю что пишет она его успешно. Но вот в дальнейшнюю maintability сего поделия черег годик-полтора конечно поверить весьма проблематично. Пиздец, жалко адекватных мэнтейнеров, кому через год разгребать эти авгиевы конюшни.
>>3661266 >если у меня прямо сейчас Клод хуярит код, вот в этe минуту? пока я пост пишу В то что твоя ИИ-слоп машина успешно пишет тонны говнослопа я как раз верю и верю что пишет она его успешно. Но вот в дальнейшнюю maintability сего поделия черег годик-полтора конечно поверить весьма проблематично. Пиздец, жалко адекватных мэнтейнеров, кому через год разгребать эти авгиевы конюшни.
>>3661277 >Пиздец, жалко адекватных мэнтейнеров, кому через год разгребать эти авгиевы конюшни. Я пишу код 15 лет. Ты правда думаешь что я не способен оценить качество ИИ генерации, насколько этот код плох?
>>3661270 >Верю! Верю, как же тут рандомнмоу пидоранчику с дипломом мухгу из под засратова не поверить! Ну как я и говорил - ты даже не пробовал ИИ, а усираешься тут, клоун ты ебаный, долбоеб потешный.