論文の概要: TROPT: An Open Framework for Unifying and Advancing Discrete Text Optimization
- arxiv url: http://arxiv.org/abs/2606.23496v1
- Date: Mon, 22 Jun 2026 15:44:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 18:41:21.579865
- Title: TROPT: An Open Framework for Unifying and Advancing Discrete Text Optimization
- Title(参考訳): TROPT:離散テキスト最適化の統合と改善のためのオープンフレームワーク
- Authors: Matan Ben-Tov, Mahmood Sharif,
- Abstract要約: TROPTは、離散テキストトリガー最適化のための最初のオープンソースフレームワークである。
単一のインターフェースで開発を標準化する。
TROPTを使えば、エンドツーエンドの最適化レシピを簡単にカスタマイズできる。
- 参考スコア(独自算出の注目度): 5.195873909474138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discrete text-trigger optimization -- searching for text sequences that, when ingested by a model, steer it toward a specified objective -- underpins model red-teaming (e.g., LLM jailbreaks), as well as auditing and interpretability. However, the current state of discrete optimizers hinders their adoption and progress. First, existing optimizers, when open-sourced at all, are scattered across research codebases tied to specific models, objectives, and problem domains. Second, optimizer variants proliferate, each requiring engineering overhead to use or extend, and remaining hard to compare head-to-head. Together, these raise the bar for adopting optimizers in existing or new domains, and for advancing them via new strategies. We address these gaps with TROPT, the first open-source framework that unifies discrete optimizers' execution and standardizes their development under a single interface. TROPT makes it easy to customize end-to-end optimization recipes by swapping any component -- models, objectives, and optimizers -- extending its reach across domains and new applications. TROPT currently ships with 30+ optimization recipes -- covering applications such as jailbreaking and probing model internals -- built from 15+ optimizers (spanning white-box to black-box access) and 15+ losses, from foundational to state-of-the-art methods. Demonstrating its utility, we leverage TROPT in several studies: (i) controlled, large-scale experiments comparing and enhancing optimization strategies for LLM jailbreaks, revealing potent-yet-underadopted techniques; and (ii) porting optimizers from one domain (e.g., LLM jailbreak) to new domains (e.g., corpus-poisoning embedding model). In all, TROPT significantly lowers the barrier to adopting and advancing discrete text optimization.
- Abstract(参考訳): 離散テキストトリガー最適化 -- モデルに取り込み、指定された目的に向かって操作するテキストシーケンスを探す -- は、監査と解釈可能性だけでなく、モデルのレッドチーム化(例: LLM jailbreaks)を支える。
しかし、離散オプティマイザの現在の状態は、採用と進歩を妨げる。
まず、既存のオプティマイザがオープンソースになると、特定のモデル、目的、問題ドメインに関連付けられた研究コードベースに分散されます。
第2に、オプティマイザの変種は増加し、それぞれが使用または拡張するためにエンジニアリングオーバーヘッドを必要とし、ヘッド・ツー・ヘッドを比較するのが困難である。
これらを合わせて、既存のドメインや新しいドメインにオプティマイザを採用することや、新たな戦略を通じてそれらを前進させることの限界が高まる。
TROPTは独立したオプティマイザの実行を統一し、単一のインターフェースで開発を標準化する最初のオープンソースフレームワークです。
TROPTは、モデル、目的、最適化といったコンポーネントを交換することで、エンドツーエンドの最適化レシピをカスタマイズしやすくする。
TROPTは現在、30以上の最適化レシピ -- ジェイルブレイクや探索モデル内部など -- をカバーし、15以上のオプティマイザ(ホワイトボックスのスパンニングからブラックボックスのアクセス)と、基礎的な方法から最先端の方法まで15以上の損失から構築されている。
その実用性を実証するために、いくつかの研究でTROPTを活用します。
i) LLMジェイルブレイクの最適化戦略を比較・改善し, 潜在的に未然の手法を明らかにする, 大規模に制御された実験
(ii)オプティマイザをひとつのドメイン(例えば LLM ジェイルブレイク)から新しいドメイン(例えば corpus-poisoning 埋め込みモデル)に移植する。
全体として、TROPTは離散テキスト最適化の採用と進歩の障壁を著しく低くする。
関連論文リスト
- Break the Optimization Barrier of LLM-Enhanced Recommenders: A Theoretical Analysis and Practical Framework [5.68373404216548]
Training-Friendly LLM-Enhanced Recommender (TF-LLMER)は、2つの主要なコンポーネントを持つ軽量フレームワークである。
Rec-PCAはコラボレーティブな構造を表現変換に注入するレコメンデーション対応次元減少法である。
TF-LLMERは最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2026-04-22T12:22:47Z) - $\nabla$-Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space [71.23672814629448]
$nabla$-Reasonerは、トークンログに対する差別化可能な最適化をデコードループに統合する反復生成フレームワークである。
$nabla$-Reasonerは、挑戦的な数学的推論ベンチマークで20%以上の精度の向上を実現している。
論文 参考訳(メタデータ) (2026-03-05T08:42:54Z) - SemOpt: LLM-Driven Code Optimization via Rule-Based Analysis [7.451702651736553]
SemOptは静的プログラム分析を利用して最適化可能なコードセグメントを正確に識別し、対応する最適化戦略を検索し、最適化結果を生成するフレームワークである。
151の最適化タスクを含むベンチマークにおいて、SemOptは、ベースラインに比べて1.38から28倍の最適化を成功させることにより、異なるLLM下での有効性を示す。
論文 参考訳(メタデータ) (2025-10-18T07:44:18Z) - ORFS-agent: Tool-Using Agents for Chip Design Optimization [0.8088986164437757]
大規模言語モデル(LLM)は、このような高次元最適化タスク内で学習と推論を行う新しい機会を提供する。
LLMをベースとした反復最適化エージェントORFS-agentを導入し,パラメータチューニングをオープンソースのハードウェア設計フローで自動化する。
2つの異なる技術ノードと様々な回路ベンチマークに関する実証的な評価は、ORFSエージェントがルーティングされたワイヤ長と有効クロック期間の両方を13%以上改善できることを示している。
論文 参考訳(メタデータ) (2025-06-10T01:38:57Z) - Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。
我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。
実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文 参考訳(メタデータ) (2024-06-12T16:58:41Z) - LLM as a Complementary Optimizer to Gradient Descent: A Case Study in Prompt Tuning [69.95292905263393]
グラデーションベースとハイレベルなLLMは、協調最適化フレームワークを効果的に組み合わせることができることを示す。
本稿では,これらを相互に補完し,組み合わせた最適化フレームワークを効果的に連携させることができることを示す。
論文 参考訳(メタデータ) (2024-05-30T06:24:14Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。