Перейти к основному содержимому

Qwen: Qwen3 235B A22B Instruct 2507 FP8

qwen/qwen3-235b-a22b-instruct-2507-fp8

Updated Qwen3 MoE FP8 non-thinking instruction model with 235B total parameters, 22B activated parameters, and native 262K context; focused on instruction following, reasoning, coding, tool usage, multilingual and long-context tasks

от qwenИтого $0,000337 /1M токенов
Playground
контекст 262 тыс.
Модальности
text -> text
Стоимость сети
$0,000306/1M токенов
Комиссия платформы
$0,000031/1M токенов
Итоговая цена
$0,000337/1M токенов
Контекст
262 тыс.
Релиз
21 июл. 2025 г.

Производительность Qwen3 235B A22B Instruct 2507 FP8

Метрики скорости, задержки и надежности Gonka Network скоро появятся.

Скоро

Пропускная способность

Скоро
Gonka NetworkМетрики скоро

Задержка

Скоро
Gonka NetworkМетрики скоро

E2E-задержка

Скоро
Gonka NetworkМетрики скоро

Ошибки tool calls

Скоро
Gonka NetworkМетрики скоро

Ошибки structured output

Скоро
Gonka NetworkМетрики скоро

История цен Qwen3 235B A22B Instruct 2507 FP8

Скоро

История цены Gonka Network для этой модели скоро появится.

Текущая цена

Итоговая цена

$0,000337

за 1M токенов

Превью истории

Итоговая цена

Скоро

Пример кода и API для Qwen3 235B A22B Instruct 2507 FP8

GonkaGate принимает OpenAI-совместимые запросы и отправляет их в Gonka Network.

1

Получите API-ключ

Создайте API-ключ в dashboard GonkaGate и сохраните его в переменную окружения:

Создать API-ключ
export GONKAGATE_API_KEY=gp-your-api-key
2

Отправьте первый запрос

Используйте qwen/qwen3-235b-a22b-instruct-2507-fp8.

GonkaGate предоставляет OpenAI-совместимый chat completions API для моделей Gonka Network. Его можно вызывать напрямую или через обычные OpenAI SDK.

Укажите base URL https://api.gonkagate.com/v1 и передайте API-ключ GonkaGate в заголовке Authorization.

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.gonkagate.com/v1",
  apiKey: process.env.GONKAGATE_API_KEY
});

const response = await client.chat.completions.create({
  model: "qwen/qwen3-235b-a22b-instruct-2507-fp8",
  messages: [
    { role: "user", content: "What is the meaning of life?" }
  ]
});

console.log(response.choices[0].message.content);

Сторонние SDK

Примеры настройки SDK и фреймворков смотрите в документации SDK и интеграциях.

3

Включите streaming

Добавьте "stream": true в тело запроса, чтобы получать ответ через server-sent events:

curl -N https://api.gonkagate.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $GONKAGATE_API_KEY" \
  -d '{
    "model": "qwen/qwen3-235b-a22b-instruct-2507-fp8",
    "stream": true,
    "messages": [
      {"role": "user", "content": "Hello"}
    ]
  }'

Endpoint

POST https://api.gonkagate.com/v1/chat/completions
Authorization
Bearer $GONKAGATE_API_KEY
Content-Type
application/json
Model
qwen/qwen3-235b-a22b-instruct-2507-fp8

Parameters

NameTypeDefaultDescription
reasoningmapУправляет reasoning-поведением для моделей с thinking tokens: effort, лимит reasoning и включение reasoning в ответ.
max_tokensintegerЗадает верхний лимит токенов, которые модель может сгенерировать в ответе.
temperaturefloat1Влияет на вариативность ответов модели.
top_pfloat1Ограничивает выбор минимальным набором вероятных токенов, сумма вероятностей которых достигает этого значения.
seedintegerВключает детерминированную выборку, когда это поддерживается: одинаковые seed и параметры могут вернуть одинаковый результат.
presence_penaltyfloat0Настраивает, как часто модель повторяет токены, уже использованные во входе.
response_formatmapЗапрашивает определенный формат ответа, если модель это поддерживает.
toolsarrayПараметр tool calling в OpenAI-совместимом формате запроса.
tool_choicestring or objectУправляет тем, какой tool, если нужен, должна вызвать модель.
logprobsbooleanЗапрашивает log probabilities для output-токенов, если это поддерживается.
top_logprobsintegerЗадает число наиболее вероятных токенов, возвращаемых для каждой позиции, вместе с их log probability.

Другие модели Gonka

Смотреть все