論文の概要: BCL: Bayesian In-Context Learning Framework for Information Extraction
- arxiv url: http://arxiv.org/abs/2606.18620v1
- Date: Wed, 17 Jun 2026 02:34:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.971933
- Title: BCL: Bayesian In-Context Learning Framework for Information Extraction
- Title(参考訳): BCL:情報抽出のためのベイジアンインテクスト学習フレームワーク
- Authors: Haoliang Liu, Chengkun Cai, Xu Zhao, Han Zhu, Shizhou Huang, Xinglin Zhang, Tao Chen, Jenq-Neng Hwang, Zhang Huaping, Lei Li,
- Abstract要約: 既存の情報抽出 (IE) タスクは、より大きな言語モデルを持つインコンテキスト学習 (ICL) を採用する傾向にある。
We propose BCL (Bayesian In-Context Learning Framework for Information extract), which is first optimization framework that using Particle filtering with Bayesian update to systematicly refine label representations across IE task。
- 参考スコア(独自算出の注目度): 30.53882091988035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing information extraction (IE) tasks increasingly adopt in-context learning (ICL) with large language models. However, current approaches either show inconsistent performance across model scales or lack systematic optimization and generalizability. Building on this, we propose BCL (Bayesian In-Context Learning Framework for Information Extraction), the first optimization framework that uses particle filtering with Bayesian updates to systematically refine label representations across IE tasks. Through four steps initialization, observation, weight update, and resampling, BCL generalizes to both sequence labeling and relation classification paradigms. Extensive experiments demonstrate substantial and consistent improvements over existing approaches.
- Abstract(参考訳): 既存の情報抽出 (IE) タスクは、より大きな言語モデルを持つインコンテキスト学習 (ICL) を採用する傾向にある。
しかし、現在のアプローチでは、モデルスケールにまたがる一貫性のないパフォーマンスを示すか、体系的な最適化と一般化性の欠如を示す。
そこで我々は,BCL (Bayesian In-Context Learning Framework for Information extract) を提案する。
4段階の初期化、観察、重量更新、再サンプリングにより、BCLはシーケンスラベリングと関係分類のパラダイムの両方に一般化する。
大規模な実験は、既存のアプローチよりも大幅に、一貫した改善を示している。
関連論文リスト
- Bayesian Network Structure Discovery Using Large Language Models [27.478536621589345]
ベイジアンネットワーク構造発見のための統一的なフレームワークを提案する。
当社のフレームワークでは,データフリーとデータアウェア設定の両方をサポートする大規模言語モデル(LLM)を中心に置いています。
実験により,本手法は従来のLCM手法と従来のデータ駆動アルゴリズムの両方に優れていた。
論文 参考訳(メタデータ) (2025-11-01T14:32:52Z) - Iterative Amortized Inference: Unifying In-Context Learning and Learned Optimizers [22.72866404096086]
償却学習は、新しい問題への迅速な一般化を可能にするために、タスク間で共有される計算や帰納的バイアスを再利用する考え方である。
現在のアプローチでは、推論でタスクデータを処理する能力が制限されることが多いため、大規模なデータセットへのスケールアップに苦労している。
ミニバッチよりも解を段階的に洗練するモデルである反復的償却推論を提案する。
論文 参考訳(メタデータ) (2025-10-13T14:40:47Z) - CoT Referring: Improving Referring Expression Tasks with Grounded Reasoning [67.18702329644526]
CoT Referringは、構造化されたチェーン・オブ・シークレット・トレーニングデータ構造を通じて、モデル推論をモダリティにわたって強化する。
トレーニングデータを再構築して、新たな出力フォームを実行し、既存のデータセットに新たなアノテーションを提供します。
また、検出とセグメント化機能を統合MLLMフレームワークに統合し、新しい適応重み付き損失で学習して性能を最適化する。
論文 参考訳(メタデータ) (2025-10-03T08:50:21Z) - Surprise Calibration for Better In-Context Learning [6.566285172635043]
In-context Learning (ICL) は、大規模言語モデルにおけるタスク適応のための強力なパラダイムとして登場した。
既存のバイアス校正法は、すべての入力に対して固定クラス事前を適用し、動的ICL設定におけるそれらの有効性を制限している。
本稿では,クラス先行の時間的ダイナミクスをキャプチャする新しいメソッド・サプライズ(SC)を提案する。
論文 参考訳(メタデータ) (2025-06-15T10:04:42Z) - Towards Efficient and Effective Alignment of Large Language Models [7.853945494882636]
大規模言語モデル(LLM)は多様なタスクにまたがる優れた能力を示すが、それらを効率的かつ効果的に人間の期待に合わせることは重要な課題である。
この論文は、データ収集、トレーニング、評価において新しい方法論を導入することで、LCMアライメントを推し進める。
論文 参考訳(メタデータ) (2025-06-11T02:08:52Z) - Large Language Models to Enhance Bayesian Optimization [57.474613739645605]
本稿では,大規模言語モデル(LLM)の能力をベイズ最適化に組み込む新しいアプローチであるLLAMBOを提案する。
高いレベルでは、自然言語のBO問題を枠組み化し、LLMが歴史的評価に照らした有望な解を反復的に提案し、評価することを可能にする。
以上の結果から,LLAMBOはゼロショットウォームスタートに有効であり,サロゲートモデリングや候補サンプリングの促進,特に観察が不十分な場合の探索の初期段階において有効であることが示唆された。
論文 参考訳(メタデータ) (2024-02-06T11:44:06Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - Bidirectional Trained Tree-Structured Decoder for Handwritten
Mathematical Expression Recognition [51.66383337087724]
Handwriting Mathematical Expression Recognition (HMER) タスクは、OCRの分野における重要な分岐である。
近年の研究では、双方向コンテキスト情報の導入により、HMERモデルの性能が大幅に向上することが示されている。
本稿では,MF-SLT と双方向非同期トレーニング (BAT) 構造を提案する。
論文 参考訳(メタデータ) (2023-12-31T09:24:21Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。