C
ChaoBro

Grok 4.3 вышел без шума: Intelligence Index AA — 53 балла, входная цена снижена на 40%

Grok 4.3 вышел без шума: Intelligence Index AA — 53 балла, входная цена снижена на 40%

Основной вывод

xAI выпустила модель тяжёлого класса самым xAI-образным способом: без пресс-конференции, без блога — просто выложили прямо в API.

Grok 4.3 тихо заработал на платформах вроде Venice, поддерживая контекст в 1 миллион токенов, вызов функций, мультимодальный ввод и нативный поиск X. Модель набрала 53 балла на Intelligence Index от Artificial Analysis, опередив Muse Spark, Claude Sonnet 4.6 и предыдущие версии Grok. Цены API были одновременно скорректированы: входные данные снизились с $2,10 до $1,25 за миллион токенов (снижение на 40%), выходные — на 60%.

Результаты бенчмарков

Intelligence Index от Artificial Analysis

Модель AA Index Примечания
GPT-5.5 Pro ~60+ Текущий лидер
Grok 4.3 53 Обогнал Muse Spark, Sonnet 4.6
Muse Spark <53 Обогнан Grok 4.3
Claude Sonnet 4.6 <53 Обогнан Grok 4.3
Gemini 3.1 Pro ~50 Близок к Grok 4.3

Рейтинги Vals Index

Бенчмарк Позиция Grok 4.3 Примечания
Общий #13 Выше среднего
CaseLaw #1 Ведущее юридическое обоснование
CorpFin #1 Ведущий анализ корпоративных финансов
Общее программирование Слабое Не сильная сторона

Бенчмарк GDPval-AA

Наиболее значительное улучшение Grok 4.3 — в реальных агентских задачах. На бенчмарке GDPval-AA показатель агентских способностей Grok 4.3 существенно вырос. Это ключевой метрикой для оценки «может ли ИИ самостоятельно выполнять задачи».

Анализ ценовой стратегии

Параметр Grok 4.3 Изменение
Цена входных данных $1,25/млн токенов ↓ 40%
Цена выходных данных Значительно снижена ↓ 60%
Контекстное окно 1 млн токенов Как у предыдущей

Эта ценовая стратегия чрезвычайно агрессивна. Цена в $1,25 за миллион входных токенов уже ниже, чем у большинства моделей среднего уровня, при этом производительность Grok 4.3 находится в первом эшелоне. xAI явно идёт по «маршруту цена-качество» — предоставляя производительность, близкую к Claude Opus 4.7, по ценам, приближающимся к DeepSeek V4.

Горизонтальное сравнение с конкурентами

Параметр Grok 4.3 Claude Sonnet 4.6 GPT-5.5 DeepSeek V4
AA Index 53 <53 ~60+ Н/Д
Цена входных $1,25/млн ~$3/млн ~$5/млн ~$0,15/млн
Юридическое обоснование #1 Сильное Сильное Среднее
Финансовый анализ #1 Сильное Сильное Среднее
Общее программирование Слабое Сильное Сильное Сильное
Агентские способности Значительно улучшены Сильные Сильные Сильные

Оценка ситуации

Релиз Grok 4.3 передаёт несколько сигналов:

  1. xAI переходит из «догоняющих» в «лидеров по соотношению цена-качество»: AA-индекс 53 при цене $1,25 обеспечивает гораздо лучшую ценность, чем Claude и GPT
  2. Явное преимущество в специализированных областях: Первые места в CaseLaw и CorpFin показывают, что у Grok 4.3 есть уникальные преимущества в юридических и финансовых вертикалях
  3. Тихий запуск показывает, что xAI ставит продукт выше маркетинга: Это одновременно и сила (прагматичность), и слабость (низкая видимость)

Как использовать

  • Юристы и финансовые специалисты: Первые места Grok 4.3 в CaseLaw и CorpFin заслуживают внимания — возможно, самый экономичный выбор специализированной модели
  • Пользователи API: Входная цена $1,25/млн + 53 балла производительности делают это самым дешёвым вариантом среди моделей первого эшелона
  • Разработчики агентов: Значительное улучшение на GDPval-AA означает, что надёжность Grok 4.3 в агентских сценариях существенно выросла — стоит протестировать