OpenRouter выпустили API для запуска ансамблей моделей
По сути, это попытка превратить ручную сборку консенсуса моделей в готовый продукт из коробки, и весьма удачная. Работает так:
1. Вы отправляете один запрос в openrouter/fusion, и OpenRouter на своей стороне запускает панель из нескольких моделей, которые отвечают независимо друг от друга.
2. Затем еще одна модель-судья анализирует результаты и выдает на их основе финальный ответ.
3. Стек самих моделей по умолчанию выглядит как (~anthropic/claude-opus-latest, ~openai/gpt-latest, ~google/gemini-pro-latest), а судья – по дефолту первая из них, то есть claude-opus-latest. Также стек моделей и судью можно задать самостоятельно.
То есть, если выбирать модели по умолчанию, Fusion обычно стоит примерно в 4–5 раз дороже, чем один вызов модели. Есть смысл использовать только для очень сложных задач (буст в качестве действительно заметный, если что).
Но с другой стороны, благодаря возможности задать стек самому, это может быть и неплохой способ сэкономить. Например, OpenRouter пишут, что стек (Gemini 3 Flash, Kimi K2.6, and DeepSeek V4 Pro) превосходит соло запуски GPT-5.5 и Opus 4.8, и оказывается примерно в 1% от результатов Fable 5, а стоимость примерно вдвое ниже. Так что пробуем.
Еще из интересного: фича может работать как тул. То есть можно добавить {"type": "openrouter:fusion"} к вызову обычной модели, и она сможет сама как бы обратиться к совету других моделей, когда посчитает нужным.