
Google представив Близнюки 3Її модель штучного інтелекту нового покоління розроблена для поєднання розширеного мислення, розуміння контексту та мультимодальних можливостей. Компанія позиціонує її як свою найпотужнішу систему на сьогоднішній день, призначену для інтерпретації нюансів та вирішення складних завдань з меншою кількістю обміну домовленостями.
Під час початкового розгортання, додаток Gemini а інструменти розробника вже інтегрують цю версію, тоді як Режим штучного інтелекту в пошуку Спочатку він буде запущений у Сполучених Штатах. В Іспанії та решті Європи Google надає пріоритет доступу через додаток, API та хмарні сервіси, а також розширює мовну підтримку, включаючи каталонську, баскську та галісійську.
Що приносить Близнюки 3 і чому це актуально?
Gemini 3 поєднує в єдиній системі накопичений досвід попередніх поколінь та стрибок уперед міркування та розуміння контекстуКомпанія стверджує, що модель «вловлює тонкі підказки» в креативних ідеях і розбиває складні проблеми на шари, що дає точніші відповіді та меншу потребу перефразувати запит.
Такий підхід призводить до більш лаконічних відповідей, які надають пріоритет Корисна інформація проти клішеЦе поведінка, яку Google тестував для зменшення лестощів та покращення фактичної точності. Крім того, мультимодальна природа моделі дозволяє працювати з текстом, зображеннями, аудіо та відео в одній взаємодії.
Показники незалежних та порівняльних тестів
Згідно з показниками, опублікованими Google та публічними рейтингами, Gemini 3 Pro Він лідирує в LMArena з 1.501 балом ELO, перевершуючи свого попередника. В академічному оцінюванні він досяг 37,5% без інструментів в Humanity's Last Exam та 91,9% в GPQA Diamond; з математики він набрав 23,4% в MathArena Apex.
Підкріплений спосіб міркування Глибоке мислення Ці результати ще більше покращуються, і в «Останньому іспиті людства» цей показник становить 41,0%, а в «Диамантовому тесті GPQA» — 93,8%. ARC-AGI-2, з виконанням коду, реєструє 45,1%, що свідчить про прогрес в абстрактному мисленні та візуальному розумінні.
Мультимодальність та величезне контекстне вікно в Gemini 3
Одна з головних змін — це контекстне вікно 1 мільйон жетонівЦе спрощує аналіз великих репозиторіїв коду, статей або довгих відео. Модель може, наприклад, перекладати та уніфікувати рукописні рецепти для створення сімейної кулінарної книги або перетворювати складні матеріали на візуалізації та інтерактивні картки.
Мультимодальне читання відображається в таких тестах, як MMMU-Pro (81%) і Video-MMMU (87,6%), а також у SimpleQA Verified (72,1%), де основна увага приділяється більшій фактичній точності. У режимі штучного інтелекту, інтегрованому в Пошук, Google навчає інтерактивним елементам, таким як віджети та симуляції, пояснювати концепції на льоту.
Програмування та агенти: поштовх до появи Антигравітації
У завданнях розробки лідирує Gemini 3 WebDev Arena з ELO 1.487Він досягає 54,2% у Terminal-Bench 2.0 та 76,2% у SWE-bench Verified, що означає більшу компетентність у генерації коду, використанні інструментів та роботі з термінальним середовищем.
Найпомітнішою новою функцією для будівельних агентів є Антигравітація GoogleЦя платформа надає агентам доступ до редактора, терміналу та браузера. Завдяки цьому система може планувати та виконувати комплексні робочі процеси розробки програмного забезпечення, перевіряючи власний код та залишаючи остаточний огляд та аудит розробнику.
Безпека, зовнішнє тестування та відповідальне розгортання
Google стверджує, що це його Найбезпечніша модель на сьогоднішній деньВін посилений проти лестощів і більш стійкий до оперативного втручання та зловживання (наприклад, кібератак). Оцінювання є частиною його Структури безпеки кордонів і було переглянуто зовнішніми експертами, включаючи AISI Сполученого Королівства та такі фірми, як Apollo, Vaultis та Dreadnode.
Режим Глибоке мислення Він проходить додаткову перевірку, перш ніж потрапити до передплатників Google AI Ultra, через масштаб можливостей планування та використання інструментів. Компанія наголошує на поступовому та виміряному розгортанні між продуктами та регіонами.
Наявність Близнюків 3
El Огляд Gemini 3 Pro Він доступний у застосунку Gemini та через API розробника через AI Studio та Vertex AI. Інтерфейс додає 30 нових мов, зокрема Каталонська, баскська та галісійська, що сприяє його впровадженню в місцевих умовах.
El Режим штучного інтелекту в пошуку Він починається у Сполучених Штатах і поступово розширюватиметься; тим часом компанії та технічні команди можуть інтегрувати Gemini 3 у свої робочі процеси за допомогою Vertex AI та Gemini Enterprise, на додаток до нового інтерфейсу командного рядка та платформи Antigravity для агентів.
Варіанти використання: від кращого навчання до автоматизації завдань
Окрім чату, модель може перетворити складний контент на інтерактивний досвід за допомогою графіків, калькуляторів або симуляцій. Це корисно для вивчення технічних концепцій, аналізу спортивних матчів та пропонування планів тренувань, або для розбиття документів на частини та створення зручних посібників.
У своїй повсякденній роботі агенти можуть класифікувати електронну пошту Gmail, планувати поїздки або виконувати багатоетапні завдання, поєднуючи міркування, виклики інструментів та керування браузером, завжди під наглядом людини для підтримки контролю.
Google стверджує, що вплив Gemini зростає: з'являється "View на базі штучного інтелекту" 2.000 мільйонів користувачів щомісяцяЩомісячна кількість завантажень застосунку Gemini перевищує 650 мільйонів, 70% клієнтів хмарних сервісів використовують його можливості штучного інтелекту, а 13 мільйонів розробників створили рішення з його моделями. Ці цифри підтверджують впровадження Gemini 3 в екосистему продукту.
Зосереджуючись на міркуваннях, мультимодальності та агентах, Близнюки 3 Це стає загальною основою стратегії Google щодо штучного інтелекту: більш пряма, менш адаптивна платформа з більшим контекстом, яку в Іспанії можна почати використовувати з програми Gemini, а також, якщо ви розробляєте, з AI Studio та Vertex AI; пошук у режимі штучного інтелекту буде активовано ринком.
