Qwen: Qwen3 235B A22B Instruct 2507 FP8
qwen/qwen3-235b-a22b-instruct-2507-fp8Updated Qwen3 MoE FP8 non-thinking instruction model with 235B total parameters, 22B activated parameters, and 240K context on Gonka; focused on instruction following, reasoning, coding, tool usage, multilingual and long-context tasks
- Модальности
- text -> text
- Стоимость сети
- н/д
- Комиссия платформы
- н/д
- Итоговая цена
- н/д
- Контекст
- 240 тыс.
- Релиз
- 21 июл. 2025 г.
Производительность Qwen3 235B A22B Instruct 2507 FP8
Метрики скорости, задержки и надежности Gonka Network скоро появятся.
Задержка
E2E-задержка
Ошибки tool calls
Ошибки structured output
История цен Qwen3 235B A22B Instruct 2507 FP8
СкороИстория цены Gonka Network для этой модели скоро появится.
Текущая цена
Итоговая цена
Скоро
за 1M токенов
Превью истории
Итоговая цена
Пример кода и API для Qwen3 235B A22B Instruct 2507 FP8
GonkaGate принимает OpenAI-совместимые запросы и отправляет их в Gonka Network.
Получите API-ключ
Создайте API-ключ в dashboard GonkaGate и сохраните его в переменную окружения:
Создать API-ключexport GONKAGATE_API_KEY=gp-your-api-keyОтправьте первый запрос
Используйте qwen/qwen3-235b-a22b-instruct-2507-fp8.
GonkaGate предоставляет OpenAI-совместимый chat completions API для моделей Gonka Network. Его можно вызывать напрямую или через обычные OpenAI SDK.
Укажите base URL https://api.gonkagate.com/v1 и передайте API-ключ GonkaGate в заголовке Authorization.
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://api.gonkagate.com/v1",
apiKey: process.env.GONKAGATE_API_KEY
});
const response = await client.chat.completions.create({
model: "qwen/qwen3-235b-a22b-instruct-2507-fp8",
messages: [
{ role: "user", content: "What is the meaning of life?" }
]
});
console.log(response.choices[0].message.content);Сторонние SDK
Примеры настройки SDK и фреймворков смотрите в документации SDK и интеграциях.
Включите streaming
Добавьте "stream": true в тело запроса, чтобы получать ответ через server-sent events:
curl -N https://api.gonkagate.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $GONKAGATE_API_KEY" \
-d '{
"model": "qwen/qwen3-235b-a22b-instruct-2507-fp8",
"stream": true,
"messages": [
{"role": "user", "content": "Hello"}
]
}'Endpoint
- Authorization
- Bearer $GONKAGATE_API_KEY
- Content-Type
- application/json
- Model
- qwen/qwen3-235b-a22b-instruct-2507-fp8
Parameters
| Name | Type | Default | Description |
|---|---|---|---|
| reasoning | map | — | Управляет reasoning-поведением для моделей с thinking tokens: effort, лимит reasoning и включение reasoning в ответ. |
| max_tokens | integer | — | Задает верхний лимит токенов, которые модель может сгенерировать в ответе. |
| temperature | float | 1 | Влияет на вариативность ответов модели. |
| top_p | float | 1 | Ограничивает выбор минимальным набором вероятных токенов, сумма вероятностей которых достигает этого значения. |
| seed | integer | — | Включает детерминированную выборку, когда это поддерживается: одинаковые seed и параметры могут вернуть одинаковый результат. |
| presence_penalty | float | 0 | Настраивает, как часто модель повторяет токены, уже использованные во входе. |
| response_format | map | — | Запрашивает определенный формат ответа, если модель это поддерживает. |
| tools | array | — | Параметр tool calling в OpenAI-совместимом формате запроса. |
| tool_choice | string or object | — | Управляет тем, какой tool, если нужен, должна вызвать модель. |
| logprobs | boolean | — | Запрашивает log probabilities для output-токенов, если это поддерживается. |
| top_logprobs | integer | — | Задает число наиболее вероятных токенов, возвращаемых для каждой позиции, вместе с их log probability. |