論文の概要: PROMPT2BOX: Uncovering Entailment Structure among LLM Prompts
- arxiv url: http://arxiv.org/abs/2603.21438v1
- Date: Sun, 22 Mar 2026 22:59:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.421343
- Title: PROMPT2BOX: Uncovering Entailment Structure among LLM Prompts
- Title(参考訳): PROMPT2BOX:LLMプロンプトの細部構造を明らかにする
- Authors: Neeladri Bhuiya, Shib Sankar Dasgupta, Andrew McCallum, Haw-Shiuan Chang,
- Abstract要約: 本稿では,訓練されたエンコーダを用いて,プロンプトをボックス埋め込み空間に埋め込むPROMPT2BOXを提案する。
既存のデータセットと合成データセットに基づいてトレーニングされたエンコーダは、意味的類似性と特異性関係をキャプチャするボックス埋め込みを出力する。
実験により、ボックス埋め込みはベクトルベースラインよりもプロンプト特異性を常に捉えていることが示された。
- 参考スコア(独自算出の注目度): 25.780025116831
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To discover the weaknesses of LLMs, researchers often embed prompts into a vector space and cluster them to extract insightful patterns. However, vector embeddings primarily capture topical similarity. As a result, prompts that share a topic but differ in specificity, and consequently in difficulty, are often represented similarly, making fine-grained weakness analysis difficult. To address this limitation, we propose PROMPT2BOX, which embeds prompts into a box embedding space using a trained encoder. The encoder, trained on existing and synthesized datasets, outputs box embeddings that capture not only semantic similarity but also specificity relations between prompts (e.g., "writing an adventure story" is more specific than "writing a story"). We further develop a novel dimension reduction technique for box embeddings to facilitate dataset visualization and comparison. Our experiments demonstrate that box embeddings consistently capture prompt specificity better than vector baselines. On the downstream task of creating hierarchical clustering trees for 17 LLMs from the UltraFeedback dataset, PROMPT2BOX can identify 8.9\% more LLM weaknesses than vector baselines and achieves an approximately 33\% stronger correlation between hierarchical depth and instruction specificity.
- Abstract(参考訳): LLMの弱点を発見するために、研究者はしばしばプロンプトをベクトル空間に埋め込んで、洞察に富んだパターンを抽出する。
しかし、ベクトル埋め込みは主に局所的な類似性を捉えている。
結果として、トピックを共有するが特異性が異なるプロンプトや難易度が異なるプロンプトも同様に表現され、きめ細かい弱点分析が困難になる。
この制限に対処するために、トレーニングされたエンコーダを用いてプロンプトをボックス埋め込み空間に埋め込むPROMPT2BOXを提案する。
既存のデータセットと合成データセットに基づいてトレーニングされたエンコーダは、意味的類似性だけでなく、プロンプト間の特異性関係をキャプチャするボックス埋め込みを出力する。
さらに、データセットの可視化と比較を容易にするために、ボックス埋め込みのための新しい次元削減手法を開発した。
実験により,ボックス埋め込みはベクトルベースラインよりもプロンプト特異性が高いことを示す。
UltraFeedbackデータセットから17LLMの階層的クラスタリングツリーを作成する下流タスクでは、PROMPT2BOXはベクトルベースラインよりも8.9倍のLLMの弱点を識別でき、階層的深さと命令特異性との間にはおよそ33倍の相関性が得られる。
関連論文リスト
- LLM2Vec-Gen: Generative Embeddings from Large Language Models [38.742293185880364]
埋め込みモデルを訓練するための,新たな自己教師型アプローチを提案する。
入力を符号化するのではなく、モデルの潜在的な応答を表現することを学ぶ。
有害なコンテンツ検索の43.2%の削減と、埋め込みタスクの推論能力の29.3%の改善を観察する。
論文 参考訳(メタデータ) (2026-03-11T15:58:47Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - LLM-KT: Aligning Large Language Models with Knowledge Tracing using a Plug-and-Play Instruction [39.59752235090272]
知識追跡問題は、学生が過去の質問応答記録に基づいて次の質問に正しく答えられるかどうかを予測することを目的としている。
我々は、texttttextbfLLM-KTという、KTのための大規模言語モデル(LLM)ベースのフレームワークを提案する。
タスクレベルのアライメントのために,LLMの豊富な知識と強力な推論能力を活用して,LLMをKTに整合させるPlug-and-Play命令を設計する。
モダリティレベルのアライメントのために、従来の手法で学習した複数のモダリティを統合するために、プラグインコンテキストとシーケンスを設計する。
論文 参考訳(メタデータ) (2025-02-05T07:21:49Z) - Exploring How Generative MLLMs Perceive More Than CLIP with the Same Vision Encoder [18.91969873367244]
MLLM(Generative Multimodal Large Language Models)はCLIPよりも精度が高いことを示す。
本研究は,VLMのアーキテクチャ選択の重要性を強調し,CLIP型コントラストVLMの性能向上に向けた方向性を提案する。
論文 参考訳(メタデータ) (2024-11-07T21:39:51Z) - LESS: Label-Efficient and Single-Stage Referring 3D Segmentation [55.06002976797879]
参照3Dは、クエリの文で記述された3Dポイントクラウドから、指定されたオブジェクトのすべてのポイントをセグメントする視覚言語タスクである。
本稿では,LESSと呼ばれるレファレンス3次元パイプラインを提案する。
ScanReferデータセット上での最先端のパフォーマンスは、バイナリラベルのみを使用して、以前の3.7% mIoUの手法を上回ります。
論文 参考訳(メタデータ) (2024-10-17T07:47:41Z) - DQFormer: Towards Unified LiDAR Panoptic Segmentation with Decoupled Queries [14.435906383301555]
本稿では,統合ワークフローにセマンティックとインスタンスセグメンテーションを実装するDQFormerという新しいフレームワークを提案する。
具体的には,セマンティクスを用いた情報的クエリを局所化して提案する,疎結合なクエリジェネレータを設計する。
また、クエリ指向マスクデコーダを導入し、対応するセグメンテーションマスクをデコードする。
論文 参考訳(メタデータ) (2024-08-28T14:14:33Z) - Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - A Simple Framework for Open-Vocabulary Segmentation and Detection [85.21641508535679]
我々は,異なるセグメンテーションと検出データセットから共同で学習する,シンプルなオープン語彙検出フレームワークOpenSeeDを提案する。
まず、事前学習されたテキストエンコーダを導入し、視覚概念を2つのタスクにエンコードし、それらの共通意味空間を学習する。
プレトレーニング後,本モデルでは,セグメンテーションと検出の両方において,競争力あるいは強いゼロショット転送性を示す。
論文 参考訳(メタデータ) (2023-03-14T17:58:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。