В 2026 году рынок уже не делят три компании — в игру вошёл четвёртый серьёзный игрок: DeepSeek с моделью V4 Pro. По бенчмаркам флагманы идут плечом к плечу — разрыв 3–5%. Выбор зависит не от того, «кто умнее», а от конкретной задачи: для кода и аналитики лидирует Claude, для математики и голоса — GPT-5, для больших документов — Gemini, а для задач с ограниченным бюджетом — DeepSeek.
Что сейчас на рынке
Все три флагмана прошли через несколько итераций и к середине 2026 года выглядят так:
- GPT-5.4 (OpenAI, февраль 2026) — четвёртая итерация GPT-5, контекст 400 000 токенов
- Claude Opus 4.7 (Anthropic, апрель 2026) — флагман Anthropic, контекст 200 000 токенов
- Gemini 3.1 Pro (Google, март 2026) — контекст 1 000 000 токенов, интеграция с Google Workspace
- DeepSeek V4 Pro (DeepSeek, апрель 2026) — открытая (open-weight) модель на 1,6 трлн параметров, контекст 1 000 000 токенов, самая дешёвая из четырёх (подробный разбор на Morph)
Важная оговорка: сравниваем флагманы, но у каждой компании есть более дешёвые версии — GPT-5 Mini, Claude Sonnet, Gemini Flash, DeepSeek V4 Flash. Для большинства задач их возможностей достаточно, а цена ниже в 3–5 раз.
Цены
| Модель | Подписка | API: вход | API: выход |
|---|---|---|---|
| GPT-5.4 (ChatGPT Plus) | $20/мес | ~$2,50 за 1M токенов | ~$10 за 1M токенов |
| ChatGPT Pro (без лимитов) | $200/мес | — | — |
| Claude Opus 4.7 | $20/мес (claude.ai Pro) | $5 за 1M токенов | $25 за 1M токенов |
| Gemini 3.1 Pro (Advanced) | $19,99/мес | $1,25 за 1M токенов | $5 за 1M токенов |
| DeepSeek V4 Pro | бесплатный чат | $0,44 за 1M токенов | $0,87 за 1M токенов |
По цене API DeepSeek вне конкуренции: $0,435 за миллион входных токенов при 80,6% на SWE-bench Verified — это примерно в 57 раз дешевле Claude Opus по выходным токенам при сопоставимых результатах по коду. Gemini стоит $1,25 за 1M входных токенов — вдвое дешевле GPT-5.4. Claude Opus — самый дорогой в API, но Sonnet 4.6 стоит $3/$15 при 97% возможностей Opus.
Для пользователей из России: DeepSeek доступен напрямую без VPN, сайт открывается как обычный ресурс. Остальные модели — через агрегаторы или виртуальные карты (об этом отдельная статья).
По задачам: кто лучше справляется
Программирование и технические задачи
Claude решает 405 из 500 реальных задач с GitHub корректно по официальному лидерборду SWE-bench Verified — стандарту оценки автономного решения реальных задач разработки. По данным Anthropic, это выше результата любого кандидата, проходившего их внутренний инженерный экзамен. Claude Opus 4.7 обходит GPT-5.4 по ключевым метрикам работы со знаниями (Elo 1753 vs 1674) и лидирует в агентном кодинге.
Практикующие разработчики отмечают, что Claude лучше понимает архитектурные решения и объясняет логику кода, а не просто выдаёт рабочий фрагмент.
Вывод: для кода — Claude.
Математика и логика
На бенчмарке AIME 2025 (задачи Американской олимпиады по математике уровня IMO) GPT-5.2 показал 100% — идеальный результат. Ни одна другая модель близко не подошла. Для контекста: эксперты с профильными PhD отвечают на вопросы GPQA Diamond (экспертный бенчмарк по химии, физике и биологии) лишь на 65–74% — топовые модели давно превзошли этот порог.
Вывод: для математики и цепочек рассуждений — GPT-5.
Работа с большими документами
Контекст в миллион токенов — это примерно 750 000 слов или несколько книг целиком. Если нужно анализировать годовой отчёт компании, сравнивать десяток контрактов или работать с большой кодовой базой — Gemini просто не теряет контекст там, где конкуренты начинают «забывать» начало разговора.
У Claude контекст 200 000 токенов, у GPT-5.4 — 400 000. Для большинства задач этого хватает, но если нужно загрузить весь репозиторий или годовой отчёт целиком — Gemini вне конкуренции.
Вывод: для анализа больших документов — Gemini.
Голос и мультимодальность
GPT-5.4 получил Voice Mode 2 — голосовой режим со встроенной эмоциональной модуляцией и переключением языков на лету: русский, английский, китайский, немецкий и другие. Это самый естественный голосовой интерфейс из трёх — Claude голосом не работает вовсе, у Gemini есть голос, но без эмоциональной модуляции.
Вывод: для голосового взаимодействия — GPT-5.
Работа с русским языком
В 2026 году все топовые модели отлично говорят по-русски. Claude звучит чуть более литературно, ChatGPT выдаёт хорошо структурированные ответы, а Gemini лучше всех работает с контекстом на русском языке при анализе больших документов.
Для генерации текстов — разница минимальна. Claude чуть точнее в стиле и нюансах языка, GPT-5 структурированнее.
Агентные задачи и автоматизация
GPT-5.4 выигрывает в агентных рабочих процессах — модель умеет управлять рабочим столом, заполнять формы и навигировать в браузерах с точностью 75% по бенчмарку OSWorld (стандарт оценки управления компьютером). ChatGPT Operator — самый зрелый инструмент для автоматизации рутины через браузер.
Claude лидирует в агентном кодинге — построении многошаговых конвейеров через API.
Вывод: для автоматизации через браузер — GPT-5; для агентного кодинга — Claude.
DeepSeek V4: китайский аутсайдер, который стал мейнстримом
DeepSeek — лаборатория из Китая, которая в 2025 году шокировала рынок моделью R1: она сравнялась с o1 от OpenAI при стоимости обучения в сотни раз меньше. В апреле 2026 вышел V4 Pro — уже не просто «дёшево и неплохо», а настоящий конкурент флагманам по коду.
Что умеет DeepSeek V4 Pro
На бенчмарке SWE-bench Verified (автономное решение реальных GitHub-задач) V4 Pro-Max набирает 80,6% — это всего на 0,2 пункта ниже Claude Opus 4.6. По LiveCodeBench он даже впереди: 93,5 у DeepSeek против 88,8 у Claude.
Это первая open-weight модель, которая вплотную приблизилась к Claude Opus 4.7 и GPT-5.5 на реальных задачах кодирования и рассуждений — при примерно 1/30 от стоимости за токен.
Технически: V4-Pro — это Mixture-of-Experts на 1,6 трлн параметров с 49 млрд активных параметров на токен, поддержка контекста до 1 млн токенов и открытые веса на Hugging Face под лицензией MIT.
Цена — главный козырь
По стоимости API DeepSeek V4 — примерно $0,28 за миллион входных токенов, что примерно в 50 раз дешевле Claude Opus 4.6 на входных токенах.
Для разработчиков, которые гоняют через API тысячи запросов в день, разница между DeepSeek и Claude — это разница между «трачу $50 в месяц» и «трачу $1500 в месяц».
Где DeepSeek уступает
Claude сохраняет заметное преимущество по HLE (40,0% vs 37,7% у DeepSeek), SimpleQA и точным математическим задачам. Для нюансированных рассуждений, точного воспроизведения фактов и корпоративных требований к надёжности ценовая разница не должна быть единственным аргументом.
DeepSeek также не имеет голосового режима и существенно уступает по экосистеме — нет плагинов, интеграций с офисными инструментами, браузерного агента.
Открытый код: плюс или минус?
Open-weight модель означает, что V4 Pro можно запустить самостоятельно на своих серверах. Для тех, кто работает с чувствительными данными (медицина, юридические документы, внутренняя документация), это важное преимущество — данные не уходят в облако.
Вывод: для API-задач с большими объёмами и ограниченным бюджетом — DeepSeek. Для самостоятельного хостинга чувствительных данных — тоже DeepSeek.
Надёжность и «галлюцинации»
Это важный критерий, который редко попадает в сравнения.
Anthropic позиционирует Claude Opus 4.8 как модель с минимальными галлюцинациями: она научилась говорить «я не знаю» или запрашивать уточнения вместо генерации правдоподобного бреда. Исследование Anthropic «Tracing the Thoughts of a Large Language Model» показывает, как внутренние «концептуальные векторы» можно направить так, чтобы Claude учился отказываться от ответа — это уже обученная политика, а не хрупкий промпт. При рефакторинге архитектуры она в 4 раза реже пропускает скрытые баги по сравнению с прошлыми версиями.
В августе 2025 года OpenAI и Anthropic провели совместную оценку безопасности — один из редких публичных cross-lab экспериментов, где модели тестировались на чужих сценариях. Результат: Claude Sonnet 4 и OpenAI o3 показали наилучшие показатели по минимизации нежелательного поведения.
GPT-5 более уверен в ответах — это плюс для скорости, но минус, когда модель ошибается и не предупреждает об этом. Gemini занимает промежуточную позицию.
Экосистема и интеграции
GPT-5: максимальная экосистема — тысячи кастомных GPT, плагины, интеграция с Microsoft 365 (Copilot), Canvas для совместной работы над документом, Code Interpreter с GPU-ускорением.
Claude: более ограничен в интеграциях, но предлагает лучший API для разработчиков, строящих собственные решения. Anthropic делает ставку на корпоративный B2B-сегмент.
Gemini: интегрирован во все продукты Google — Gmail, Документы, Таблицы, Drive, Поиск. В России с октября 2025 работает режим ИИ в Google Поиске на русском языке. NotebookLM позволяет строить базы знаний из документов.
Сводная таблица
| Критерий | GPT-5.4 | Claude Opus 4.7 | Gemini 3.1 Pro | DeepSeek V4 Pro |
|---|---|---|---|---|
| Программирование | ★★★★☆ | ★★★★★ | ★★★★☆ | ★★★★★ |
| Математика / логика | ★★★★★ | ★★★★☆ | ★★★★☆ | ★★★★☆ |
| Большие документы | ★★★☆☆ | ★★★★☆ | ★★★★★ | ★★★★☆ |
| Голос | ★★★★★ | ✗ | ★★★☆☆ | ✗ |
| Русский язык | ★★★★☆ | ★★★★★ | ★★★★☆ | ★★★★☆ |
| Надёжность (без галлюцинаций) | ★★★☆☆ | ★★★★★ | ★★★★☆ | ★★★☆☆ |
| Цена API | ★★★☆☆ | ★★☆☆☆ | ★★★★☆ | ★★★★★ |
| Экосистема | ★★★★★ | ★★★☆☆ | ★★★★☆ | ★★☆☆☆ |
| Контекстное окно | 400K токенов | 200K токенов | 1M токенов | 1M токенов |
| Открытый код | ✗ | ✗ | ✗ | ✓ (MIT) |
Что выбрать — коротко
Берите GPT-5, если:
- нужен голосовой интерфейс на русском
- важна экосистема (Microsoft 365, кастомные GPT)
- задачи в области математики, логики, агентной автоматизации через браузер
Берите Claude, если:
- работаете с кодом и архитектурными решениями
- важна надёжность — модель честно говорит «не знаю»
- нужен качественный API с предсказуемым поведением
- пишете длинные тексты на русском, важна точность стиля
Берите Gemini, если:
- работаете с большими документами (отчёты, договоры, кодовые базы)
- уже в экосистеме Google (Workspace, Drive)
- нужен дешёвый API для высоких объёмов
Берите DeepSeek, если:
- гоняете большие объёмы через API и цена критична
- нужны открытые веса для self-hosting (чувствительные данные, корпоративные требования)
- хотите бесплатный чат без VPN из России
- задачи связаны с кодом, но бюджет ограничен
Не определились — начните с GPT-5 Plus за $20/мес. Это самый универсальный вариант для старта.
Резюме
Разрыв между GPT-5, Claude, Gemini и DeepSeek в 2026 году невелик — 3–5% по большинству бенчмарков. Реальный выбор строится не на вопросе «кто умнее», а на четырёх вещах: задача, экосистема, цена, открытость кода. Для кода с бюджетом — DeepSeek. Для кода без ограничений — Claude. Для документов — Gemini. Для всего остального — GPT-5.
Полезные источники для самостоятельного изучения:
- SWE-bench Verified — официальный лидерборд по кодингу — 97 моделей, обновляется регулярно; бенчмарк создан в сотрудничестве с OpenAI
- Epoch AI — независимые тесты GPQA Diamond и AIME — третья сторона, не связанная с разработчиками моделей
- LLM Stats — актуальный рейтинг 300+ моделей — обновляется ежедневно, включает SWE-bench, GPQA Diamond, LiveCodeBench
- Vellum LLM Leaderboard — сравнение по задачам для разработчиков
- OpenAI + Anthropic: совместная оценка безопасности — редкий публичный cross-lab эксперимент по надёжности моделей
- DeepSeek V4 Pro — подробный разбор — бенчмарки, цены, архитектура
Доступ к любой из моделей из России: DeepSeek — напрямую без VPN. GPT-5, Claude, Gemini — через агрегаторы с оплатой рублями: JinPix, AITUNNEL и другие дают единый API без VPN.