Grok 4.3 вышел без шума: Intelligence Index AA — 53 балла, входная цена снижена на 40%

Основной вывод

xAI выпустила модель тяжёлого класса самым xAI-образным способом: без пресс-конференции, без блога — просто выложили прямо в API.

Grok 4.3 тихо заработал на платформах вроде Venice, поддерживая контекст в 1 миллион токенов, вызов функций, мультимодальный ввод и нативный поиск X. Модель набрала 53 балла на Intelligence Index от Artificial Analysis, опередив Muse Spark, Claude Sonnet 4.6 и предыдущие версии Grok. Цены API были одновременно скорректированы: входные данные снизились с $2,10 до $1,25 за миллион токенов (снижение на 40%), выходные — на 60%.

Результаты бенчмарков

Intelligence Index от Artificial Analysis

Модель	AA Index	Примечания
GPT-5.5 Pro	~60+	Текущий лидер
Grok 4.3	53	Обогнал Muse Spark, Sonnet 4.6
Muse Spark	<53	Обогнан Grok 4.3
Claude Sonnet 4.6	<53	Обогнан Grok 4.3
Gemini 3.1 Pro	~50	Близок к Grok 4.3

Рейтинги Vals Index

Бенчмарк	Позиция Grok 4.3	Примечания
Общий	#13	Выше среднего
CaseLaw	#1	Ведущее юридическое обоснование
CorpFin	#1	Ведущий анализ корпоративных финансов
Общее программирование	Слабое	Не сильная сторона

Бенчмарк GDPval-AA

Наиболее значительное улучшение Grok 4.3 — в реальных агентских задачах. На бенчмарке GDPval-AA показатель агентских способностей Grok 4.3 существенно вырос. Это ключевой метрикой для оценки «может ли ИИ самостоятельно выполнять задачи».

Анализ ценовой стратегии

Параметр	Grok 4.3	Изменение
Цена входных данных	$1,25/млн токенов	↓ 40%
Цена выходных данных	Значительно снижена	↓ 60%
Контекстное окно	1 млн токенов	Как у предыдущей

Эта ценовая стратегия чрезвычайно агрессивна. Цена в $1,25 за миллион входных токенов уже ниже, чем у большинства моделей среднего уровня, при этом производительность Grok 4.3 находится в первом эшелоне. xAI явно идёт по «маршруту цена-качество» — предоставляя производительность, близкую к Claude Opus 4.7, по ценам, приближающимся к DeepSeek V4.

Горизонтальное сравнение с конкурентами

Параметр	Grok 4.3	Claude Sonnet 4.6	GPT-5.5	DeepSeek V4
AA Index	53	<53	~60+	Н/Д
Цена входных	$1,25/млн	~$3/млн	~$5/млн	~$0,15/млн
Юридическое обоснование	#1	Сильное	Сильное	Среднее
Финансовый анализ	#1	Сильное	Сильное	Среднее
Общее программирование	Слабое	Сильное	Сильное	Сильное
Агентские способности	Значительно улучшены	Сильные	Сильные	Сильные

Оценка ситуации

Релиз Grok 4.3 передаёт несколько сигналов:

xAI переходит из «догоняющих» в «лидеров по соотношению цена-качество»: AA-индекс 53 при цене $1,25 обеспечивает гораздо лучшую ценность, чем Claude и GPT
Явное преимущество в специализированных областях: Первые места в CaseLaw и CorpFin показывают, что у Grok 4.3 есть уникальные преимущества в юридических и финансовых вертикалях
Тихий запуск показывает, что xAI ставит продукт выше маркетинга: Это одновременно и сила (прагматичность), и слабость (низкая видимость)

Как использовать

Юристы и финансовые специалисты: Первые места Grok 4.3 в CaseLaw и CorpFin заслуживают внимания — возможно, самый экономичный выбор специализированной модели
Пользователи API: Входная цена $1,25/млн + 53 балла производительности делают это самым дешёвым вариантом среди моделей первого эшелона
Разработчики агентов: Значительное улучшение на GDPval-AA означает, что надёжность Grok 4.3 в агентских сценариях существенно выросла — стоит протестировать

Основной вывод

Результаты бенчмарков

Intelligence Index от Artificial Analysis

Рейтинги Vals Index

Бенчмарк GDPval-AA

Анализ ценовой стратегии

Горизонтальное сравнение с конкурентами

Оценка ситуации

Как использовать

Похожие материалы

Как выбрать между A2UI, MCP Apps и AG-UI: не запутайтесь в названиях протоколов Agent UI

Почему оценка Baseten взлетела до $13 млрд: стоит ли самостоятельно настраивать стек инференса открытых моделей?

Codex Sites против Claude Code Artifacts: один стремится хостить приложения, другой — хостить объяснения