論文の概要: LLM-Rosetta: A Hub-and-Spoke Intermediate Representation for Cross-Provider LLM API Translation
- arxiv url: http://arxiv.org/abs/2604.09360v1
- Date: Fri, 10 Apr 2026 14:31:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.904869
- Title: LLM-Rosetta: A Hub-and-Spoke Intermediate Representation for Cross-Provider LLM API Translation
- Title(参考訳): LLM-Rosetta: クロスプロバイダLLM API翻訳のためのハブ・アンド・スポーク中間表現
- Authors: Peng Ding,
- Abstract要約: LLM-Rosettaは、ハブ・アンド・スポーク中間表現(IR)上に構築されたオープンソースの翻訳フレームワークである。
モジュール型のOpsコンポジションコンバータアーキテクチャにより、各API標準を独立して追加することができる。
4つのAPI標準(OpenAI Chat Completions, OpenAI Responses, Anthropic Messages, Google GenAI)のコンバータを実装しています。
- 参考スコア(独自算出の注目度): 1.812335324603146
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid proliferation of Large Language Model (LLM) providers--each exposing proprietary API formats--has created a fragmented ecosystem where applications become tightly coupled to individual vendors. Switching or bridging providers requires $O(N^2)$ bilateral adapters, impeding portability and multi-provider architectures. We observe that despite substantial syntactic divergence, the major LLM APIs share a common semantic core: the practical challenge is the combinatorial surface of syntactic variations, not deep semantic incompatibility. Based on this finding, we present LLM-Rosetta, an open-source translation framework built on a hub-and-spoke Intermediate Representation (IR) that captures the shared semantic core--messages, content parts, tool calls, reasoning traces, and generation controls--in a 9-type content model and 10-type stream event schema. A modular Ops-composition converter architecture enables each API standard to be added independently. LLM-Rosetta supports bidirectional conversion (provider-to-IR-to-provider) for both request and response payloads, including chunk-level streaming with stateful context management. We implement converters for four API standards (OpenAI Chat Completions, OpenAI Responses, Anthropic Messages, and Google GenAI), covering the vast majority of commercial providers. Empirical evaluation demonstrates lossless round-trip fidelity, correct streaming behavior, and sub-100 microsecond conversion overhead--competitive with LiteLLM's single-pass approach while providing bidirectionality and provider neutrality. LLM-Rosetta passes the Open Responses compliance suite and is deployed in production at Argonne National Laboratory. Code is available at https://github.com/Oaklight/llm-rosetta.
- Abstract(参考訳): 大規模言語モデル(LLM)プロバイダの急速な普及 — プロプライエタリなAPIフォーマットの公開 — は、個々のベンダと密結合する、断片化されたエコシステムを作り上げました。
スイッチングまたはブリッジングプロバイダは、ポータビリティとマルチプロファイラアーキテクチャを妨げる、$O(N^2)$の両側アダプタを必要とする。
本研究の課題は, セマンティックな相違がかなり大きいにもかかわらず, 主要なLLM APIが共通のセマンティックなコアを共有していることである。
LLM-Rosettaは、ハブ・アンド・スポーク中間表現(IR)上に構築されたオープンソースの翻訳フレームワークで、メッセージ、コンテンツ部品、ツールコール、トレースの推論、生成制御といった共有セマンティックコアをキャプチャする。
モジュール型のOpsコンポジションコンバータアーキテクチャにより、各API標準を独立して追加することができる。
LLM-Rosettaは、要求ペイロードと応答ペイロードの両方に対して双方向変換(proider-to-IR-to-provider)をサポートする。
商用プロバイダの大部分をカバーする4つのAPI標準(OpenAI Chat Completions、OpenAI Responses、Anthropic Messages、Google GenAI)のコンバータを実装しています。
経験的評価は、双方向性とプロバイダ中立性を提供しながら、LiteLLMのシングルパスアプローチと競合する、ロスレスラウンドトリップの忠実さ、正しいストリーミング動作、100マイクロ秒未満の変換オーバーヘッドを示す。
LLM-RosettaはOpen Responses準拠スイートをパスし、アルゴンヌ国立研究所で運用されている。
コードはhttps://github.com/Oaklight/llm-rosetta.comで入手できる。
関連論文リスト
- SAGAI-MID: A Generative AI-Driven Middleware for Dynamic Runtime Interoperability [1.2744523252873352]
SAGAI-MIDは、大規模言語モデル(LLM)を使用して実行時にスキーマミスマッチを動的に検出し、解決するFastAPIである。
SAGAI-MIDは、バージョンマイグレーション、IoTから分析へのブリッジング、および2つのプロバイダからの6つのLLM間のプロトコル変換にまたがる10の相互運用性シナリオで評価する。
論文 参考訳(メタデータ) (2026-03-30T17:46:41Z) - A Unified Language Model for Large Scale Search, Recommendation, and Reasoning [29.766824024623336]
我々は,事前学習されたデコーダのみのLLMを,ツールフリーでカタログを基盤としたジェネレータに適応させるフレームワークNEOを紹介する。
NEOは、アイテムをSIDとして表現し、自然言語と型付きアイテム識別子をインターリーブするために単一のモデルを訓練する。
我々は,複数のメディアタイプと発見タスクにまたがる1000万項目以上の実世界のカタログ上で,NEOを大規模に評価する。
論文 参考訳(メタデータ) (2026-03-18T09:42:32Z) - From One-to-One to Many-to-Many: Dynamic Cross-Layer Injection for Deep Vision-Language Fusion [91.35078719566472]
VLM(Vision-Language Models)は、粗い非対称接続を使用することで、深刻な視覚的特徴のボトルネックを生み出す。
CLI(Cross-Layer Injection)は,2つのモダリティの間に動的に多対多の橋を架ける,斬新で軽量なフレームワークである。
論文 参考訳(メタデータ) (2026-01-15T18:59:10Z) - OmniFusion: Simultaneous Multilingual Multimodal Translations via Modular Fusion [14.856747950038553]
本稿では,効率的な多モーダル翻訳システムを構築するためのエンドツーエンドアプローチを提案する。
本稿では,事前訓練されたMMFMの複数の層から隠れた状態を翻訳LLMに接続する新しい融合戦略を提案する。
得られたモデルであるOmniFusionは、音声からテキストへの変換、音声・画像・テキストへの変換、テキスト・画像・テキストへの変換を行うことができる。
論文 参考訳(メタデータ) (2025-11-28T22:39:12Z) - OpenS2S: Advancing Fully Open-Source End-to-End Empathetic Large Speech Language Model [59.02418683148991]
我々は,共感型音声対話を実現するために設計された,完全にオープンソースで透明でエンドツーエンドのLSLMであるOpenS2Sを提案する。
我々の共感型音声テキストモデルBLSP-Emoに基づいて、OpenS2Sは低レイテンシ音声生成を実現するためにストリーミングインターリーブデコードアーキテクチャを用いる。
大規模言語モデルを利用して共感的コンテンツを生成し,テキスト音声システムを制御することにより,多言語多言語多様度を有するスケーラブルな学習コーパスを構築する。
論文 参考訳(メタデータ) (2025-07-07T16:31:37Z) - Talk Structurally, Act Hierarchically: A Collaborative Framework for LLM Multi-Agent Systems [10.67359331022116]
textitTalk 構造的には、Act Hierarchically (TalkHier) はコンテキスト豊富な交換のための構造化通信プロトコルを導入する新しいフレームワークである。
textitTalkHierは、推論スケーリングモデル(OpenAI-o1)、オープンソースのマルチエージェントモデル(AgentVerseなど)など、さまざまな種類のSoTAを追い越している。
論文 参考訳(メタデータ) (2025-02-16T12:26:58Z) - The Compressor-Retriever Architecture for Language Model OS [20.56093501980724]
オペレーティングシステム(OS)のコアコンポーネントとして言語モデルを用いるという概念について検討する。
このようなLM OSを実現する上で重要な課題は、寿命の長いコンテキストを管理し、セッション間のステートフルネスを確保することだ。
本稿では,生涯のコンテキスト管理のために設計されたモデル非依存アーキテクチャであるコンプレッサー・レトリバーを紹介する。
論文 参考訳(メタデータ) (2024-09-02T23:28:15Z) - SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models [97.40590590880144]
MLLM(Multimodality Large Language Model)シリーズを開発した。
我々は、言語、ビジョン、視覚言語タスクで利用可能なリソースを網羅した包括的なデータセットを組み立てる。
パラメータサイズや多言語能力の異なるMLLMのスペクトルを得る。
論文 参考訳(メタデータ) (2024-02-08T18:59:48Z) - OneLLM: One Framework to Align All Modalities with Language [86.8818857465443]
統一フレームワークを用いて8つのモーダルを言語に整合させるMLLMであるOneLLMを提案する。
OneLLMは25の多様なベンチマークで評価され、マルチモーダルキャプション、質問応答、推論などのタスクを含む。
論文 参考訳(メタデータ) (2023-12-06T18:59:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。