Загрузка блога...
Блог
Новые модели, анонсы новых функций, успешные кейсы и аналитика от команды ZvenoAI

Google наконец выпустил preview-релиз модели, которую сам называет своим самым умным ИИ на сегодня — Gemini 3 Pro. Это не просто очередной апдейт линейки, а полноценный скачок по части рассуждений, мультимодальности и длинного контекста. И приятный бонус для нас: модель уже можно запустить через QueryRouter — как в чате, так и по OpenAI-совместимому API.
Давайте разбираться, что именно умеет Gemini 3 Pro и зачем её вообще подключать в продакшн.
Gemini 3 Pro — это флагманская нейросеть от Google для высокоточного мультимодального рассуждения. Она из коробки работает не только с текстом, но и с изображениями, аудио, видео и кодом и рассчитана на сложные связные задачи. По нашим тестам, она неплохо справляется рассуждением на русском языке.
Ключевая фича — гигантский контекст: до 1 000 000 токенов на вход и до примерно 64k токенов на выход. Можно сказать, что Google удалось обеспечить возможность загрузки в контекст больших кодовых баз, многочасовых транскриптов, множества PDF и не только.
По сути, Gemini 3 Pro — логичное и очень сильное продолжение после довольно успешной Gemini 2.5 Pro: Google позиционирует её как модель для сложных задач с длинным горизонтом планирования, агентских сценариев и продвинутого кодинга.
Попробовать модель можно уже сейчас:
В большинстве бенчмарков Gemini 3.0 Pro показывает существенный прирост, если сравнивать с конкурентами и предыдущими моделями от Google.

Если пройтись по ключевым тестам, картина получается очень любопытная. ARC-AGI-2 — бенчмарк на абстрактное мышление, где моделям нужно самим вывести правила решения задач по примерам и применить их в новых ситуациях. Еще вчера в нем лидировала GPT-5.1 Thinking с результатом 17,6%, но Gemini 3.0 Pro одним рывком ушла вперед и набрала 31,1%. До человеческих 66% ей, конечно, еще очень далеко, но сама динамика впечатляет.
MathArena Apex — экстремально сложная математика, где большинство моделей едва преодолевают порог в 1–1,6%. На этом фоне 23,4% у Gemini 3 Pro выглядят почти инопланетной цифрой. В ScreenSpot-Pro она берет 72,7% — это тест на понимание интерфейсов, и такой разрыв с конкурентами может оказаться критичным именно для агентных сценариев.
И, наконец, Humanity’s Last Exam — тяжелые академические вопросы. Здесь новинка тоже вырывается вперед: 37,5% против прежнего лидера GPT-5.1 Thinking, которая показывала 26,5%. В большинстве других бенчмарков картина схожая: Gemini 3 Pro занимает первое место, пусть уже без такого драматичного отрыва.