論文の概要: Sample, Align, Synthesize: Graph-Based Response Synthesis with ConGrs
- arxiv url: http://arxiv.org/abs/2510.03527v1
- Date: Fri, 03 Oct 2025 21:50:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.091173
- Title: Sample, Align, Synthesize: Graph-Based Response Synthesis with ConGrs
- Title(参考訳): サンプル・アライン・シンセサイズ: ConGrs を用いたグラフベースの応答合成
- Authors: Sayan Ghosh, Shahzaib Saqib Warraich, Dhruv Tarsadiya, Gregory Yauney, Swabha Swayamdipta,
- Abstract要約: 本稿では,共有情報を表すDAGベースの柔軟なデータ構造であるConsensus Graphs(ConGrs)を紹介する。
以上の結果から,ConGrsは平均応答よりも2つのバイオグラフィー生成タスクの事実精度を最大31%向上させることを示した。
また、ConGrsを3つの拒否ベースのタスクに使用し、自己検証よりも改善した。
- 参考スコア(独自算出の注目度): 14.726832653090383
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Language models can be sampled multiple times to access the distribution underlying their responses, but existing methods cannot efficiently synthesize rich epistemic signals across different long-form responses. We introduce Consensus Graphs (ConGrs), a flexible DAG-based data structure that represents shared information, as well as semantic variation in a set of sampled LM responses to the same prompt. We construct ConGrs using a light-weight lexical sequence alignment algorithm from bioinformatics, supplemented by the targeted usage of a secondary LM judge. Further, we design task-dependent decoding methods to synthesize a single, final response from our ConGr data structure. Our experiments show that synthesizing responses from ConGrs improves factual precision on two biography generation tasks by up to 31% over an average response and reduces reliance on LM judges by more than 80% compared to other methods. We also use ConGrs for three refusal-based tasks requiring abstention on unanswerable queries and find that abstention rate is increased by up to 56%. We apply our approach to the MATH and AIME reasoning tasks and find an improvement over self-verification and majority vote baselines by up to 6 points of accuracy. We show that ConGrs provide a flexible method for capturing variation in LM responses and using the epistemic signals provided by response variation to synthesize more effective responses.
- Abstract(参考訳): 言語モデルは、応答の根底にある分布にアクセスするために、複数回サンプリングすることができるが、既存の方法では、異なる長形応答にまたがるリッチなてんかん信号を効率的に合成することはできない。
我々は、共有情報を表す柔軟なDAGベースのデータ構造であるConsensus Graphs(ConGrs)と、同じプロンプトに対するサンプルLM応答の集合における意味的変動を紹介する。
バイオインフォマティクスを用いた軽量語彙列アライメントアルゴリズムを用いてConGrsを構築する。
さらに,タスク依存型復号法を設計し,ConGrデータ構造からの単一最終応答を合成する。
実験の結果,ConGrsからの応答の合成により,平均応答に対して最大31%の精度で2つのバイオグラフィー生成タスクの現実的精度が向上し,LM判定への依存度が他の方法に比べて80%以上低下することがわかった。
また、ConGrsを3つの拒否ベースのタスクに使用して、問合せ不能なクエリに対する禁忌を要求し、禁忌率が最大56%向上することを確認した。
我々は、MATHおよびAIME推論タスクにアプローチを適用し、自己検証と多数決基準を最大6ポイント精度で改善する。
以上の結果から, ConGrs は LM 応答の変動を計測し, 応答変動によって得られるてんかん信号を用いて, より効果的な応答を合成するフレキシブルな手法であることを示す。
関連論文リスト
- Chart-CoCa: Self-Improving Chart Understanding of Vision LMs via Code-Driven Synthesis and Candidate-Conditioned Answering [4.036085193573325]
視覚言語モデル(VLM)は、チャート理解タスク、特に正確なチャート記述や複雑な推論においてしばしば苦労する。
本稿では,コード生成と実行を通じてチャート検索三重項を協調的に生成するチャート合成パイプラインを提案する。
実験では、初期のVLMよりも15.50ポイントの精度が向上した。
論文 参考訳(メタデータ) (2025-08-16T08:26:55Z) - Fine-tuning on simulated data outperforms prompting for agent tone of voice [0.0]
本研究では,言語モデルと特定の行動目標との整合性を考慮した微調整とシステムプロンプトの有効性について検討した。
この結果から,微調整システムの性能が向上し,会話応答の比率が高くなったことが示唆された。
シミュレーションデータ上の細調整された小型オープンウェイトLMは、特定のスタイリスティックな振る舞いを注入するための非常に効果的でデータ効率のよい方法である、と結論付けた。
論文 参考訳(メタデータ) (2025-07-07T11:23:20Z) - FastMCTS: A Simple Sampling Strategy for Data Synthesis [67.60823802317141]
我々はモンテカルロ木探索にインスパイアされた革新的なデータ合成戦略であるFastMCTSを紹介する。
FastMCTSは、ステップレベルの評価信号を提供するマルチステップ推論データに対して、より効率的なサンプリング方法を提供する。
英語と中国語の両方の推論データセットの実験では、FastMCTSが30%以上の正しい推論パスを生成することが示されている。
論文 参考訳(メタデータ) (2025-02-17T06:27:57Z) - CoT-based Synthesizer: Enhancing LLM Performance through Answer Synthesis [31.953858122298517]
本稿では,CoTをベースとした新しい推論スケーリング戦略であるSynthesizerを提案する。
複数の候補応答から相補的な情報を解析することにより、優れた回答を合成する。
その結果,Llama3-8Bは11.8%,GPT-4oは10.3%向上した。
論文 参考訳(メタデータ) (2025-01-03T06:50:06Z) - SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。
その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-16T12:22:41Z) - Learning to Ask Conversational Questions by Optimizing Levenshtein
Distance [83.53855889592734]
明示的な編集動作によって最小レベンシュテイン距離(MLD)を最適化する強化反復シーケンス編集(RISE)フレームワークを導入する。
RISEは会話の特徴に関連するトークンに注意を払うことができる。
2つのベンチマークデータセットの実験結果から、RISEは最先端の手法を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2021-06-30T08:44:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。