Qwen: Qwen3 235B A22B Instruct 2507 FP8

qwen/qwen3-235b-a22b-instruct-2507-fp8

Updated Qwen3 MoE FP8 non-thinking instruction model with 235B total parameters, 22B activated parameters, and 240K context on Gonka; focused on instruction following, reasoning, coding, tool usage, multilingual and long-context tasks

от qwen

Playground

Модальности: text -> text
Стоимость сети: н/д
Комиссия платформы: н/д
Итоговая цена: н/д
Контекст: 240 тыс.
Релиз: 21 июл. 2025 г.

Производительность Qwen3 235B A22B Instruct 2507 FP8

Метрики скорости, задержки и надежности Gonka Network скоро появятся.

Скоро

Пропускная способность

Скоро

Gonka NetworkМетрики скоро

Задержка

Скоро

Gonka NetworkМетрики скоро

E2E-задержка

Скоро

Gonka NetworkМетрики скоро

Ошибки tool calls

Скоро

Gonka NetworkМетрики скоро

Ошибки structured output

Скоро

Gonka NetworkМетрики скоро

История цен Qwen3 235B A22B Instruct 2507 FP8

Скоро

История цены Gonka Network для этой модели скоро появится.

Текущая цена

Итоговая цена

Скоро

за 1M токенов

Превью истории

Итоговая цена

Скоро

Пример кода и API для Qwen3 235B A22B Instruct 2507 FP8

GonkaGate принимает OpenAI-совместимые запросы и отправляет их в Gonka Network.

Получите API-ключ

Создайте API-ключ в dashboard GonkaGate и сохраните его в переменную окружения:

Создать API-ключ

export GONKAGATE_API_KEY=gp-your-api-key

Отправьте первый запрос

Используйте qwen/qwen3-235b-a22b-instruct-2507-fp8.

GonkaGate предоставляет OpenAI-совместимый chat completions API для моделей Gonka Network. Его можно вызывать напрямую или через обычные OpenAI SDK.

Укажите base URL https://api.gonkagate.com/v1 и передайте API-ключ GonkaGate в заголовке Authorization.

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.gonkagate.com/v1",
  apiKey: process.env.GONKAGATE_API_KEY
});

const response = await client.chat.completions.create({
  model: "qwen/qwen3-235b-a22b-instruct-2507-fp8",
  messages: [
    { role: "user", content: "What is the meaning of life?" }
  ]
});

console.log(response.choices[0].message.content);

Сторонние SDK

Примеры настройки SDK и фреймворков смотрите в документации SDK и интеграциях.

Включите streaming

Добавьте "stream": true в тело запроса, чтобы получать ответ через server-sent events:

curl -N https://api.gonkagate.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $GONKAGATE_API_KEY" \
  -d '{
    "model": "qwen/qwen3-235b-a22b-instruct-2507-fp8",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello"}
    ]
  }'

Endpoint

POST https://api.gonkagate.com/v1/chat/completions

Authorization: Bearer $GONKAGATE_API_KEY
Content-Type: application/json
Model: qwen/qwen3-235b-a22b-instruct-2507-fp8

Parameters

Name	Type	Default	Description
reasoning	map	—	Управляет reasoning-поведением для моделей с thinking tokens: effort, лимит reasoning и включение reasoning в ответ.
max_tokens	integer	—	Задает верхний лимит токенов, которые модель может сгенерировать в ответе.
temperature	float	1	Влияет на вариативность ответов модели.
top_p	float	1	Ограничивает выбор минимальным набором вероятных токенов, сумма вероятностей которых достигает этого значения.
seed	integer	—	Включает детерминированную выборку, когда это поддерживается: одинаковые seed и параметры могут вернуть одинаковый результат.
presence_penalty	float	0	Настраивает, как часто модель повторяет токены, уже использованные во входе.
response_format	map	—	Запрашивает определенный формат ответа, если модель это поддерживает.
tools	array	—	Параметр tool calling в OpenAI-совместимом формате запроса.
tool_choice	string or object	—	Управляет тем, какой tool, если нужен, должна вызвать модель.
logprobs	boolean	—	Запрашивает log probabilities для output-токенов, если это поддерживается.
top_logprobs	integer	—	Задает число наиболее вероятных токенов, возвращаемых для каждой позиции, вместе с их log probability.

Другие модели Gonka

Смотреть все

MiniMax:

MiniMax M2.7

MiniMax open-weight text-generation model focused on agentic coding, software engineering workflows, log analysis, troubleshooting, refactoring, and complex productivity tasks.

180 тыс. контекст

Moonshot AI:

Kimi K2.6

Moonshot AI open-source MoE model with 1T total parameters, 32B activated parameters, 240K context on Gonka, and text input; focused on long-horizon coding, coding-driven design, and agentic workflows.

240 тыс. контекст