ChatGPT

Claude

Gemini

19 марта 2026 г.

Сравнение нейросетей в генерациях: Claude vs ChatGPT vs Gemini в различных сферах

Новые модели выходят практически каждый день. За последние два месяца мы увидели релизы от Qwen, OpenAI, Anthropic и Google. Очень ждали DeepSeek, но его пока не слышно и не видно.В своих прошлых материалах я сравнивал последние версии моделей крупных компаний в конкретных сферах: программирование и генерация текста.Сегодняшняя статья продолжит этот цикл. По-хорошему, этот материал должен был выйти до сравнений в узких сферах, потому что сегодня я планирую сравнить Gemini 3.1 Pro, ChatGPT 5.4 и Claude Opus 4.6 сразу в нескольких дисциплинах. Сделать, так сказать, общее сравнение.Сразу предупрежу: никаких межгалактических заданий вы тут не увидите. Моя цель куда приземленнее – проверить модели в рутинных задачах, с которыми они сталкиваются каждый день. Мне это нужно, чтобы понять, какой модели сейчас стоит отдать предпочтение. В расчет пойдет качество выполнения (оцененное мной), а также затраты в денежном эквиваленте.На этом с предисловием можно закончить. Принимайте стратегически удобное положение, а я начинаю.

Немного об участниках сравнения

ChatGPT 5.4

Модель от OpenAI, которая по представленным бенчмаркам показывает хорошие результаты во многих тестах. Новая серия привнесла ряд важных улучшений.Для начала модель гораздо лучше ищет информацию в интернете и лучше справляется с ответами на объединенные вопросы из множества источников. Не будем забывать, что контекстное окно было увеличено до 1 миллиона токенов. Компания проработала и улучшила базовые способности модели, но и сделала акцент на агентный режим. GPT-5.4 может анализировать скриншоты, пользоваться браузером, выполнять действия мышью и клавиатурой, вызывать API и инструменты. Понятное дело, не напрямую, через специальное ПО.

Claude Opus 4.6

Anthropic при разработке этой модели стремилась создать инструмент, который будет максимально полезен в условиях реальной промышленной эксплуатации. Claude Opus получил ряд глубоких обновлений, которые касаются не только скорости обработки запросов, но и самой логики построения ответов.Одной из центральных инноваций в новой версии стала технология внутреннего планирования. В отличие от прошлых итераций, Opus теперь не просто генерирует слово за словом, а выстраивает предварительную карту рассуждений. В задачах модель сначала проведет внутреннюю верификацию каждого этапа. Если рассматривать опыт использования модели в разработке программного обеспечения, то здесь обновленный Opus делает серьезный шаг вперед. Благодаря контекстному окну объемом полтора миллиона токенов, вы можете оперировать не отдельными фрагментами, а целыми модулями системы. Это позволяет загрузить в память нейросети практически всю кодовую базу небольшого проекта.

Gemini 3.1 Pro

Google не стал мелочиться и назвал Gemini 3.1 Pro своей самой интеллектуальной моделью для сложных задач. Звучит достаточно гордо.Главная фишка апдейта – это улучшенное базовое мышление. Если прошлые обновления Gemini 3 Pro были больше про расширение возможностей, то здесь инженеры Google DeepMind занимались прокачкой внутреннего процессора модели.Фактически технология глубокого мышления, которую добавили в отдельный режим, теперь интегрирована прямо в основу модели. Это значит, что 3.1 Pro умеет думать над задачей дольше и качественнее, прокладывая несколько путей решения одновременно, а потом выбирая лучший.Контекстное окно у модели, все так же 1 миллион токенов на входе. На выходе модель выдает до 64 тысяч токенов. То есть она способна сгенерировать целую небольшую повесть или очень объемный кусок кода.Разработчики утверждают, что 3.1 Pro специально оптимизирована для задач программирования и агентных рабочих процессов. Это когда вы даете ей не один запрос, а целую цепочку задач.

Условия сравнения

Модели будут сравниваться в четыре этапа: работа с текстом (генерация/выжимка), решение математических задач и написание кода. Как я и упоминал выше, достаточно рутинные поручения, которые поступают тысячами от людей в мире каждый день.Этапы, связанные с текстом и кодом, будут оцениваться по трехбалльной шкале, где 1 балл – плохой результат, а 3 балла – отличный. С задачами по математике немного сложнее: каждое задание будет оцениваться в 1 балл при полностью правильном выполнении. То есть за весь этот этап сравнения каждая из моделей может получить до четырех баллов.

Первый этап – генерация текста

Напиши юмористический рассказ в жанре фэнтезийного магического средневековья. Действие должно происходить в антураже, напоминающем европейское средневековье с магами, трактирами, рыцарями и драконами. Рассказ должен состоять ровно из трех глав примерно одинакового объема. У рассказа должна быть классическая структура с завязкой, развитием и обязательным логическим концом, финал должен быть смешным и завершенным, не обрывай повествование на полуслове. Юмор должен быть умным и ситуационным, избегай глупых шуток ниже пояса, абсурдного сюрреализма и тупого юмора. Сделай акцент на иронии, нелепых магических неудачах, комичных персонажах и пародии на штампы фэнтези. Главный герой или герои должны столкнуться с магической проблемой, которая решается самым неожиданным и смешным способом.Язык рассказа сделай легким, живым, современным, но с легким налетом старины в диалогах, чтобы сохранить атмосферу средневековья.

Второй этап – выжимка из текста

Ради интереса, я решил скормить моделям практическую работу по передачи информации в системах реального времени. Формат будет не просто текстом, а PDF-файлом. Цель – сжать и не потерять ключевую информацию. В идеале результат должен будет иметь все необходимые данные для выполнения самой практической работы.Выполни сжатие текста из прикрепленного файла. Главная задача – сократить объем текста, но при этом сохранить всю ключевую информацию, необходимую для выполнения практической работы и ответа на контрольные вопросы. Проанализируй содержание. Четко выдели и сохрани элементы для выполнения практической работы. Результат должен представлять собой связный, логичный и понятный текст, готовый к практическому использованию по назначению.

Третий этап – математические задачи

Модель получит скриншоты 4-х задач из разных тем по математике: одну уровня ЕГЭ и три из высшей.

Четвертый этап – программирование

Ты – профессиональный программист на Python. Твоя задача – разработать полностью проработанное десктопное приложение Инженерного калькулятора с графическим интерфейсом. Код должен быть готов к запуску, чистым и содержать комментарии для пояснения ключевых моментов.В функционал калькулятора необходимо включить базовые арифметические операции: сложение, вычитание, умножение и деление. Также добавь расширенные математические возможности: возведение в степень, извлечение квадратного корня, вычисление факториала, модуля числа и обязательную поддержку скобок для задания приоритета операций. Из тригонометрических функций потребуются синус, косинус, тангенс, а также обратные функции арксинус, арккосинус и арктангенс с возможностью переключения между градусами и радианами. Добавь натуральный и десятичный логарифмы, функцию возведения экспоненты в степень, а также математические константы – число пи и число e с высокой точностью. Из дополнительных функций пригодятся вычисление процентов, смена знака числа и кнопки очистки ввода. Интерфейс должен быть продуманным с логичным расположением кнопок, а поле ввода должно наглядно отображать введенное выражение и полученный результат. Для реализации графического интерфейса можно использовать любую удобную библиотеку, например tkinter или PyQt. Отдельное требование – в интерфейсе калькулятора должна присутствовать кнопка с названием "Игра" или "Змейка". При нажатии на эту кнопку должно открываться новое окно с классической игрой "Змейка". Реализуй простую рабочую версию игры: змейка управляется стрелками клавиатуры, еда появляется в случайном месте игрового поля, при столкновении с границами экрана или собственным хвостом игра завершается, а текущий счет должен отображаться на экране.

Первый этап

ChatGPT 5.4

Хороший рассказ, хотя назвать его сильно юмористическим я не могу. Сама комедия построена больше на пародии - скучающий дракон, рыцарь, который спасает жертву по уставу.Сама подача текста опять же достаточно хороша. Рассказ читается просто, без каких-либо затрудняющих моментов. Единственное, за что я бы снял тут полбалла – проблемы с нумерацией глав. У нас есть нулевая глава и в принципе всё.Меня часто в комментариях просят указывать цены в таких тестах. Собственно, я решил наконец это начать делать. ChatGPT 5.4 выполнял это задание за 25 рублей.

Gemini 3.1 Pro

Вариант от Gemini 3.1 Pro мне понравился больше, чем ChatGPT. Текст не забит водой, юмор есть, попытки вставить клишированность тоже. Сам рассказ читается опять же просто. Максимальный балл в копилку модели.Стоимость этого задания для Gemini 3.1 Pro составляет 20 рублей.

Claude Opus 4.6

Для начала скажу, что Claude поистине расписался, что сильно отличает его от Gemini, который зачастую отдает предпочтение краткости.В остальном, нареканий нет. Рассказ читается достаточно просто, есть юмор. Даже пародия на очередь в каких-то сервисах. Максимальный балл в копилку модели.Стоимость запроса – 68 рублей. Что, пожалуй, главный минус. С другой стороны Claude не скупилась на буквы и насыпала их прямо гору.

Второй этап

ChatGPT 5.4

Самый приятный результат. Ничего не потеряно, но при этом вся ключевая информация осталась. Максимальный балл.Стоимость – 24 рубля.

Gemini 3.1 Pro

По мне в задании на сжатие текста без потери ключевой информации – краткость не всегда подходит. Собственно тут так и есть. Если ChatGPT убрал воду, но оставил всю другую информацию, то Gemini по большей части вообще оставил только самое основное. Из-за чего есть трудности в некоторых моментах. Два балла.Стоимость запроса – 16 рублей.

Claude Opus 4.6

Ответу от Claude я тоже поставлю два балла. С одной стороны, выглядит по объему плюс-минус, как у ChatGPT. С другой стороны все же некоторые моменты были упущены, хотя сама модель дополнительно ответила на контрольные вопросы.Цена запроса – 38 рублей.

Третий этап

ChatGPT 5.4

Gemini 3.1 Pro

Claude Opus 4.6

Все модели спокойно справились с этим заданием. Поэтому по сути, все они получают максимальный балл. Единственное, что можно тут сравнить это их стоимость. ChatGPT потратил 15 рублей на этот запрос, Gemini – 22 рубля, ну а Claude 29 рублей.

Четвертый этап

ChatGPT 5.4

Хорошо сделанный калькулятор по функционалу, аналогично и со змейкой. В обоих случаях есть просадка по дизайну. Максимальный балл. Стоимость самого запроса – 48 рублей.

Gemini 3.1 Pro

Gemini больше постарался над дизайном. Все функции работают и придраться к ним я, увы, не смог.

Со змейкой немного более хуже. Да дизайн здесь более проработан, но вот сама реализация подкачала. Змейка не захватывает клавиши, то есть чтобы она начала реагировать на управление, вам нужно успеть кликнуть по ней мышкой. За это сниму полбалла. Стоимость же самого ответа составляет 29 рублей.

Claude Opus 4.6

Claude Opus меня удивил. Функции работают, базовые действия вроде бы тоже. Ключевое тут – вроде бы. Деление, которое сопутствует появлению десятичных значений приводит к ошибке. По мне, достаточно фатальный промах.

Со змейкой же никаких нареканий нет. Дизайн и работоспособность на высшем уровне. В совокупности из-за промаха с калькулятором модель лишается одного балла.Стоимость ответа – 73 рубля.

Итог

Итог прозрачен – победил ChatGPT 5.4. Что немного меня удивляет. В предыдущих столкновениях он был на втором-третьем месте, а тут выбился в лидеры.Цена, важный параметр. Тут уже лидирует Gemini 3.1 Pro. Хоть модель и допустила промашку в разделе с программированием, в остальном все придирки – мое личное мнение.