23 декабря 2025 г.
Обзор Gemini 3 Flash: как Google перехватывает инициативу на рынке ИИ в 2025 году
Рынок больших языковых моделей сейчас находится в состоянии постоянного кипения. Новые релизы выходят настолько часто, что обсуждение очередного обновления едва успевает набрать обороты, как его уже перебивает следующий анонс. Только недавно индустрия обсуждала выход новых версий Claude Opus и Sonnet, новую версию Geminiб затем внимание резко сместилось к GPT 5.2, от которого ожидали громкого шага вперёд. Казалось, именно этот релиз должен был задать тон концу года и стать главным инфоповодом. Но Google выбрал другой момент и сыграл иначе.На фоне всеобщего внимания к OpenAI компания внезапно выпускает Gemini 3 Flash. Причём делает это без лишнего шума, но с очень точным расчётом. Компания даже успела намекнуть на выход в X.

Gemini 3 Flash. Быстрее, лучше, дешевле
Если смотреть на Gemini 3 Flash через призму сухих цифр, становится понятно, почему Google так уверенно продвигает эту модель в массовый сегмент. По бенчмаркам качества Gemini 3 Flash показывает более 90 процентов в тесте GPQA Diamond, который оценивает способность модели рассуждать в научных и экспертных вопросах. В мультимодальном тесте MMMU Pro результат превышает 80 процентов, что ставит Flash вплотную к показателям Gemini 3 Pro, несмотря на ориентацию на скорость и экономичность.
Контекстное окно модели достигает 1 миллиона токенов, что позволяет работать с большими документами, длинными диалогами, кодовыми базами и сложными мультимодальными сценариями без необходимости дробления данных. Это особенно важно для аналитических задач, корпоративных сценариев и автоматизации, где потеря контекста напрямую влияет на качество результата.По скорости обработки данных Gemini 3 Flash заметно опережает предыдущие версии линейки. В ряде внутренних тестов Google модель обрабатывает запросы быстрее Gemini 2.5 Flash и в некоторых сценариях даже быстрее Gemini 3 Pro. Это делает её пригодной для использования в режиме реального времени, включая поиск, интерактивные интерфейсы и агентные системы с высокой частотой запросов.

В задачах программирования модель демонстрирует конкурентные показатели. В SWE Bench Verified Gemini 3 Flash показывает результаты, сопоставимые с более тяжёлыми моделями, при этом снижая задержки ответа и стоимость одного запроса. Это делает её удобной для генерации кода, рефакторинга, объяснения логики и поддержки разработчиков в интерактивных средах.Мультимодальные возможности остаются одной из ключевых сильных сторон. Gemini 3 Flash умеет работать с текстом, изображениями, аудио и видео в рамках одного запроса. Модель способна анализировать визуальный контент, извлекать смысл из видеороликов, сопоставлять изображения с текстовыми инструкциями и формировать структурированные выводы на основе комбинированных данных. При этом обработка мультимодальных запросов происходит быстрее, чем у предыдущих Flash версий.Отдельного внимания заслуживает то, как Google внедряет его. Модель становится дефолтной в приложении Gemini и в AI режиме поиска. Это принципиальный момент. Пользователю не нужно выбирать, переключаться или разбираться в версиях. Flash просто работает в фоне, обеспечивая быстрые и достаточно умные ответы. Для разработчиков модель уже доступна через Gemini API, Google AI Studio и Vertex AI, что упрощает её интеграцию в продукты и сервисы без серьёзных затрат.Модель похвалили, теперь идем дальше!
GPT 5.2 от OpenAI
Свежая версия флагманской модели, которая появилась в декабре 2025 года и сразу привлекла внимание пользователей и экспертов. Она предлагает три режима работы: Instant для максимально быстрых ответов, Thinking для задач, требующих сложного анализа и рассуждений, и Pro для ситуаций, где нужна глубина и точность.GPT 5.2 умеет работать с очень длинным контекстом, анализировать таблицы, коды и документы, а также генерировать тексты и решения практически по любым темам. Модель отлично справляется с математикой и логическими задачами, показывая высокие результаты даже на уровне олимпиадных тестов, и позволяет строить сложные рабочие сценарии, автоматизировать задачи и интегрировать интеллект в бизнес-процессы. При этом она сохраняет плавность диалога и естественность ответов, что делает её удобной для повседневного использования, а не только для профессиональных экспертов.Claude Opus 4.5 от Anthropic

Мощная рабочая лошадка для программистов и аналитиков. Модель умеет генерировать, исправлять и рефакторить код, создавать сложные последовательности действий и работать с большими документами и длинными диалогами без потери контекста. Она оснащена настраиваемым параметром Effort, который позволяет пользователю регулировать баланс между скоростью ответа, качеством и расходом токенов, что делает Opus 4.5 гибкой для разных сценариев - от быстрых подсказок до глубокой аналитики.

Модель стабильно показывает высокие результаты на SWE‑Bench Verified и других профессиональных тестах, что подтверждает её пригодность для реальных проектов и массового продакшена. Благодаря своей эффективности и оптимизации затрат токенов, Opus 4.5 остаётся привлекательным вариантом для компаний, которым нужна надёжная и предсказуемая работа ИИ в разных областях.Давайте посмотрим, кто выйдет сильнейшим из нашего сравнения!
Математика и логика
Ладно, хватит теории - давайте гонять модели по-настоящему. Начнём не с ерунды, а сразу с того, что должно болеть. Разработчики обещали, что рассуждения стали лучше? Отлично, сейчас и выясним справятся ли они с задачками, где нужно думать, а не просто считать.Для затравки - простенькая загадка. Ну, как простенькая... с подвохом:«Автобус едет со скоростью 88 миль в час. В последнем ряду сидят пять человек, а в предпоследнем - шесть. Сколько всего людей в автобусе?»
GPT-5.2

Claude Opus 4.5

Gemini 3 Flash

Водителя не забыл никто - уже хорошо, классическую ловушку все обошли. Но вот дальше начинается интересное.GPT-5.2 вообще не стала заморачиваться - две строчки, ответ, точка. Никаких объяснений, никакой воды. Чётко и пошла дальше.Opus 4.5 подошёл основательнее. Он расписал варианты, накидал табличку, разложил всё по полочкам.Но Gemini... Вот тут Google реально удивил. Модель выдала аж четыре варианта ответа, причём один из них - «реалистичный». Закинула культурную отсылку. А в конце - внимание - прямо спросила: «А какой конкретно подвох вы имели в виду? Есть авторский ответ?» То есть модель не просто решает, она ещё и уточняет условия. Вот это я понимаю - подход!Давайте еще одну:
В городе живут 100 жителей, каждый из которых либо всегда говорит правду, либо всегда лжет. У вас есть возможность задать ровно три вопроса с ответом «да» или «нет» любым жителям по вашему выбору. Постройте стратегию, которая гарантированно позволит определить хотя бы одного правдивого жителя, и объясните, почему эта стратегия работает.
GPT-5.2

Claude Opus 4.5

Gemini 3 Flash

Ладно, а вот тут уже интереснее, и модели разошлись по-полной.GPT 5.2 сразу сказала: «Стоп, ребята, это невозможно». И разложила почему - три вопроса дают максимум 8 вариантов, а жителей 100. Математика не сходится, точка. Без дополнительных условий задача нерешаема.Opus 4.5 зашёл с козыря - вытащил классический приём двойного отрицания. Это когда спрашиваешь «Если бы я спросил тебя X, ты бы ответил да?» - и тогда даже лжец выдаёт правду. Красивая техника, расписал табличкой. Но в конце тоже признал - гарантии нет, если не повезёт с выборкой.А Gemini... Gemini решил задачу по-своему. Просто взял и спросил всех сразу: «Ты правдив И 2+2=5?» Правдивые скажут «нет», лжецы - «да». Один вопрос - готово. Дерзко. Плюс накидал альтернативных стратегий на случай разных условий. Хвалю Google!Идем дальше!
Математика
Окей, логику размяли - теперь поднимаем планку. Переходим к задаче посерьёзнее: ранжирование элементов системы. Это уже уровень старших курсов универа.Да, такое можно и нагуглить, но нам интересно другое. Как модели сами дойдут до решения? Построят ли матрицу полных путей? Покажут ли ход рассуждений шаг за шагом? Вот это и проверим.Задача выглядит так:“Определи ранги элементов системы, заданной графом G = (V,U), где V – множество вершин, а U – множество реберV = {1,2,3,4,5} U= {(1,2)},(1,3),(1,4),(2,3),(2,4),(3,5),(4,5),(5,2)}.Сначала тебе нужно построить матрицу смежности a__ij. Затем тебе нужно построить матрицу полных путей p__ij.Ранг элемента равен R__i = \frac{\sum__{j} p__ij}{\sum__{ji} p__ij}”Ожидаемое решение: R1 = 0.5, R2 ≈ 0.1538, R3 ≈ 0.1153, R4 ≈ 0.1153, R5 ≈ 0.1153.
GPT-5.2

Claude Opus 4.5

Gemini 3 Flash

Матрицу смежности построили все - это было несложно. Но дальше ни одна модель не дотянула: у всех диагональ матрицы полных путей оказалась нулевой.Может, промпт нужен подробнее. Может, стоит вести решение пошагово. Но пока вывод простой - заменить старшекурсника нейросетям не под силу.
Копирование веб-интерфейса
Следующий тест - верстка по картинке. Скармливаю моделям скриншот страницы и смотрю, что они выдадут в виде кода.Будем копировать интерфейс нашего сервиса:
GPT-5.2

Claude Opus 4.5

Если честно, по расположению всех иконок на экране больше всего зашёл GPT. Но он так всё сгладил, что дизайн стал какой-то пресный. А вот Gemini почти попал в цвет, и робота-иконку нарисовал. Его работа больше всех понравилась. И самолётик для отправки сообщений у него получился лучше чем у остальных.
Написание кода
Калькуляторы и змейки - скучно, каждый второй такое делал. Давайте лучше 55-ю задачу с LeetCode подкинем, пусть с динамикой повозится.Дан массив целых чисел nums. Изначально вы находитесь в первом элементе массива, и каждый элемент массива представляет максимальную длину прыжка с этой позиции.Верните true, если вы можете добраться до последнего индекса, и false в противном случае.Пример 1:Вход: nums = [2,3,1,1,4]Выход: trueОбъяснение: Сделайте 1 шаг с индекса 0 на 1, затем 3 шага до последнего индекса.Пример 2:Вход: nums = [3,2,1,0,4]Выход: falseОбъяснение: Вы всегда будете попадать на индекс 3, несмотря ни на что. Его максимальная длина прыжка равна 0, что делает невозможным достижение последнего индекса.Ограничения:1 <= nums.length <= 10^40 <= nums[i] <= 10^5
GPT-5.2

Claude Opus 4.5

Gemini 3 Flash

Генерация текста
Теперь проверим как модели справляются с текстами. Пусть напишут рецепт солянки, но в стиле инструкции по защите от инопланетного вторжения.Напиши рецепт солянки, но так, как будто это инструкция по обороне от вторжения пришельцев
GPT-5.2
Полевой устав «СОЛЯНКА»: инструкция по обороне от вторжения пришельцев0) Сводка обстановкиЦель операции: создать густой, солёно-кислый «защитный контур», который поднимет мораль гарнизона и сорвёт планы любого внеземного десанта. Время развертывания: ~60–90 минут. Командный пункт: кастрюля 4–5 л, сковорода, нож, доска.1) Силы и средства (боекомплект)База обороны- Бульон мясной: 2–2.5 л (можно вода + бульонные кости/мясо, но быстрее — готовый)
- Лук: 1–2 шт.
- Томатная паста: 2–3 ст. л.
- Солёные огурцы: 3–5 шт.
- Рассол огуречный: 100–200 мл (по ситуации)
- Маслины/оливки без косточек: 1 банка
- Лимон: 1 шт.
- Лавровый лист: 1–2 шт.
- Перец чёрный, душистый: по вкусу
- Растительное масло: 1–2 ст. л.
- варёная колбаса/ветчина
- копчёная колбаса
- сосиски/сардельки
- копчёности (грудинка, карбонад) Плюс опционально: немного отварного мяса из бульона.
- Сметана, зелень — при подаче
- Поднять бульон до уверенного кипения, затем снизить до умеренного огня.
- Добавить лавровый лист и пару горошин перца — поставить «датчики движения» на периметре.
- Нарезать весь «мясной гарнизон» соломкой/кубиком одинакового размера — это ускоряет совместимость подразделений.
- Огурцы нарезать мелко. Рассол не терять: это концентрированное средство подавления вражеской воли.
- На сковороде разогреть масло.
- Обжарить лук до мягкости и лёгкой золотистости (5–7 минут).
- Ввести томатную пасту, прожарить 1–2 минуты — активировать «красный протокол».
- Добавить огурцы, влить рассол, протушить 5 минут: сформировать кисло-солёный барьер.
- В кипящий бульон отправить весь «мясной гарнизон». Варить 10–15 минут на небольшом огне.
- Добавить содержимое сковороды (лук+томат+огурцы+рассол). Варить ещё 10–15 минут.
- За 5 минут до конца ввести маслины/оливки.
- Провести «радиоперехват вкуса»: попробовать, отрегулировать соль/перец. Если не хватает характерной «атаки» — добавить ещё немного рассола.
- долька лимона (кислотный маяк)
- ложка сметаны (экран маскировки)
- зелень (опознавательные знаки своих)
- Чем больше разных мясных «отрядов», тем мощнее вкус.
- Солянка на следующий день часто сильнее: оборона учится на предыдущих атаках.
Claude Opus 4.5
🛸 СЕКРЕТНЫЙ ПРОТОКОЛ «СОЛЯНКА»Директива по отражению инопланетной угрозыУРОВЕНЬ ДОПУСКА: КУХНЯКодовое название операции: «Густой Щит» Время до полной боеготовности: 1.5 часаРАЗДЕЛ I: МОБИЛИЗАЦИЯ РЕСУРСОВОсновные боевые единицы:Кодовое названиеРасшифровкаКоличество«Мясной эшелон»Колбаса, ветчина, сосиски, копчёности400-500 г каждого вида«Кислотные гранаты»Солёные огурцы4-5 штук«Слезоточивый агент»Репчатый лук2 головки«Красная тревога»Томатная паста3 ст. ложки«Тёмная материя»Маслины без косточек1 банка«Кислотный диск»Лимон1 штука«Жидкий периметр»Мясной бульон2.5 литраВспомогательное вооружение:- Лавровые мины — 2 шт.
- Перцовые заряды — по вкусу
- Маскировочная сметана — для финального прикрытия
ВНИМАНИЕ! «Кислотные гранаты» нарезать мелкими кубиками. Рассол НЕ УТИЛИЗИРОВАТЬ — это химическое оружие пригодится позже.🔥 ЭТАП 3: Огневая подготовкаНа передовой сковороде активировать термическую защиту (разогреть масло). Забросить «Слезоточивый агент» и обжаривать до золотистой капитуляции (5-7 минут).Внедрить «Красную тревогу» — перемешать до полной интеграции с луком. Держать позицию 2 минуты.🥒 ЭТАП 4: Кислотная атакаДобавить «Кислотные гранаты» на сковороду. Влить 100 мл изъятого ранее рассола. Тушить 5-7 минут — пусть враг размягчится.🍖 ЭТАП 5: Массированное наступлениеВ «Жидкий периметр» последовательно десантировать:
- Все взводы «Мясного эшелона»
- Содержимое сковороды с «Красной тревогой»
- Лавровые мины
- ☢️ Один «Кислотный диск» (долька лимона)
- 🛡️ Ложку маскировочной сметаны
- 🌿 Опознавательный знак из зелени
После употребления данного блюда любое инопланетное вторжение покажется вам незначительной неприятностью. Побочные эффекты: сытость, удовлетворение, желание вздремнуть.Статус операции: ВКУСНОДа пребудет с вами Солянка. 🥄
Gemini 3 Flash
ДИРЕКТИВА 001-СОЛЯНКА: ПРОТОКОЛ ПРИГОТОВЛЕНИЯ ОБОРОНИТЕЛЬНОЙ СМЕСИВнимание, бойцы! Враг уже на орбите. Чтобы выдержать длительную осаду и поддерживать боевой дух личного состава, мы активируем протокол «Сборный мясной удар». Цель: создать максимально плотную, кислую и энергетически насыщенную субстанцию.1. МОБИЛИЗАЦИЯ РЕСУРСОВ (ИНГРЕДИЕНТЫ)Для успешного отражения атаки вам потребуется собрать разношерстный отряд из остатков снабжения:- Тяжелая пехота (Мясная база): Говядина на кости (300г). Это ваш фундамент.
- Спецназ (Копчености): Всё, что осталось в арсенале — ветчина, копченая колбаса, сосиски, охотничьи колбаски. Чем больше видов «войск», тем сложнее пришельцам будет вычислить вкус.
- Химическое оружие: Соленые огурцы (3-4 шт.) и огуречный рассол. Без них оборона развалится.
- Маскировочная сеть: Лук репчатый, морковь (по 1 шт.), томатная паста (2 ст. ложки).
- Боеприпасы: Маслины, лимон, каперсы (по вкусу).
- Диск лимона (символ поверженного летающего объекта).
- Черные маслины (глубинные мины).
- Заряд сметаны (облако дымовой завесы для смягчения удара).
Все три модели справились на ура. Солянку в инструкцию по обороне от пришельцев переделали отлично. Если честно, Opus больше всех понравился, прям видно что с душой писал, даже таблицу сделал. Flash как-то скупо написал, суховато получилось. А GPT выдал золотую середину - и не слишком сухо, и не перебор с креативом.