Fugu-MT 論文翻訳(概要): CuSINeS: Curriculum-driven Structure Induced Negative Sampling for Statutory Article Retrieval

論文の概要: CuSINeS: Curriculum-driven Structure Induced Negative Sampling for Statutory Article Retrieval

arxiv url: http://arxiv.org/abs/2404.00590v1
Date: Sun, 31 Mar 2024 07:49:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-04 02:50:30.126386
Title: CuSINeS: Curriculum-driven Structure Induced Negative Sampling for Statutory Article Retrieval
Title（参考訳）: CuSINeS: 統計記事検索のための負のサンプリングによるカリキュラム駆動型構造
Authors: T. Y. S. S Santosh, Kristina Kaiser, Matthias Grabmair,
Abstract要約: CuSINeS は Statutory Article Retrieval (SAR) の性能向上のための負サンプリング手法であるカリキュラムベースのネガティブサンプリング戦略を採用し、モデルがより容易なネガティブにフォーカスできるようにする。また、サンプルの難易度を評価するために、法令の構造的組織から得られた階層的およびシーケンシャルな情報を利用する。
参考スコア（独自算出の注目度）: 1.3723120574076126
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we introduce CuSINeS, a negative sampling approach to enhance the performance of Statutory Article Retrieval (SAR). CuSINeS offers three key contributions. Firstly, it employs a curriculum-based negative sampling strategy guiding the model to focus on easier negatives initially and progressively tackle more difficult ones. Secondly, it leverages the hierarchical and sequential information derived from the structural organization of statutes to evaluate the difficulty of samples. Lastly, it introduces a dynamic semantic difficulty assessment using the being-trained model itself, surpassing conventional static methods like BM25, adapting the negatives to the model's evolving competence. Experimental results on a real-world expert-annotated SAR dataset validate the effectiveness of CuSINeS across four different baselines, demonstrating its versatility.
Abstract（参考訳）: 本稿では,SAR(Statutory Article Retrieval)の性能向上のための負サンプリング手法であるCuSINeSを紹介する。 CuSINeSは3つの重要なコントリビューションを提供する。まず、カリキュラムベースのネガティブサンプリング戦略を採用し、モデルが最初はより簡単なネガティブにフォーカスし、より難しいものに徐々に取り組みます。第2に、法律の構造的組織から得られた階層的およびシーケンシャルな情報を活用して、サンプルの難易度を評価する。最後に、BM25のような従来の静的メソッドを超越し、モデルが進化する能力にネガティブを適用することによって、トレーニング対象モデル自体を用いた動的セマンティックな難易度評価を導入する。実世界のエキスパートアノテートSARデータセットの実験結果は、4つの異なるベースラインにわたるCuSINeSの有効性を検証し、その汎用性を実証した。

関連論文リスト

DANS-KGC: Diffusion Based Adaptive Negative Sampling for Knowledge Graph Completion [10.190273470704112]
本稿では,DANS-KGC(Diffusion-based Adaptive Negative Smpling for Knowledge Graph Completion)を提案する。 DANS-KGCは、DAM(Difficulty Assessment Module)、ANS(Adaptive Negative Smpling Module)、DTM(Dynamic Training Mechanism)の3つの重要なコンポーネントから構成されている。 DTMは、トレーニングを通して負のサンプルの硬さ分布を動的に調整することで学習を強化する。
論文参考訳（メタデータ） (2025-11-11T06:56:57Z)
Your Pretrained Model Tells the Difficulty Itself: A Self-Adaptive Curriculum Learning Paradigm for Natural Language Understanding [53.63482987410292]
本稿では,事前学習言語モデルにより予測される難易度に基づいて,微調整例を優先する自己適応型カリキュラム学習パラダイムを提案する。本手法は,4つの自然言語理解(NLU)データセットを用いて,二項分類と多項分類の両方を対象とする手法について検討した。
論文参考訳（メタデータ） (2025-07-13T19:36:17Z)
Dissecting Long Reasoning Models: An Empirical Study [94.31064312707211]
強化学習(RL)における正・負のサンプルの役割を系統的に分析する。グループ相対的政策最適化において、サンプルの半数以上がゼロの優位性を持つような実質的なデータ非効率性を同定する。本研究では,様々な推論モデルとベンチマークの不安定な性能について検討し,不明瞭な結果を伴う不確実な問題に対する不安定性について考察した。
論文参考訳（メタデータ） (2025-06-05T11:47:10Z)
Progressive Mastery: Customized Curriculum Learning with Guided Prompting for Mathematical Reasoning [43.12759195699103]
大規模言語モデル(LLM)は、様々な推論タスクにおいて顕著な性能を達成しているが、非効率なサンプル利用と非フレキシブルな難易度サンプル処理によって後処理が制限されている。本稿では,2つの重要なイノベーションを持つ新しいフレームワークであるCustomized Curriculum Learning (CCL)を提案する。まず,各モデルの個々の能力に基づいてカリキュラムデータセットをカスタマイズする,モデル適応的難易度定義を導入する。第2に,戦略的なヒントによって標本の難易度を動的に低減し,性能を低下させるような挑戦的な試料を効果的に活用する「ガイド・プロンプティング」を開発した。
論文参考訳（メタデータ） (2025-06-04T15:31:46Z)
Curriculum-RLAIF: Curriculum Alignment with Reinforcement Learning from AI Feedback [36.919559767160415]
本稿では,データ中心アプローチによる報酬モデルの一般化性の向上を試みる。本稿では,様々な難易度を持つ選好ペアを構成する新しいフレームワークである$textitCurriculum-RLAIFを提案する。実験結果から,Curriculum-RLAIFでトレーニングした報酬モデルにより,一般化性が向上することが示唆された。
論文参考訳（メタデータ） (2025-05-26T14:53:08Z)
How Hard is this Test Set? NLI Characterization by Exploiting Training Dynamics [49.9329723199239]
本稿では, 実例と非実例を手作業で構築することなく, 挑戦的なテストセットを自動生成する手法を提案する。一般的なNLIデータセットのテストセットを,トレーニングダイナミクスを利用した3つの難易度に分類する。我々の評価法がトレーニングセットに適用された場合、トレーニング対象データのごく一部でトレーニングされたモデルは、フルデータセットでトレーニングされたモデルに匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-10-04T13:39:21Z)
Dual Test-time Training for Out-of-distribution Recommender System [91.15209066874694]
DT3ORと呼ばれるOODレコメンデーションのための新しいDual Test-Time-Trainingフレームワークを提案する。 DT3ORでは、テスト期間中にモデル適応機構を導入し、リコメンデーションモデルを慎重に更新する。我々の知る限りでは、テストタイムトレーニング戦略を通じてOODレコメンデーションに対処する最初の研究である。
論文参考訳（メタデータ） (2024-07-22T13:27:51Z)
Refining 3D Point Cloud Normal Estimation via Sample Selection [13.207964615561261]
我々は,グローバルな情報と様々な制約機構を組み込むことにより,正規推定の基本的枠組みを導入し,既存モデルを拡張した。また,非オブジェクト指向タスクと非オブジェクト指向タスクの両方における最先端性能を達成し,推定された非オブジェクト指向の正規性を補正するために,既存の配向手法を利用する。
論文参考訳（メタデータ） (2024-05-20T02:06:10Z)
Standardizing Your Training Process for Human Activity Recognition Models: A Comprehensive Review in the Tunable Factors [4.199844472131922]
ウェアラブルヒューマンアクティビティ認識(WHAR)分野における現代ディープラーニング研究の総括的レビューを行う。この結果から,モデルトレーニングプロトコルが提供する詳細が欠如していることが示唆された。分析から得られた知見をもとに,WHARモデルに適合した新たな統合トレーニング手順を定義する。
論文参考訳（メタデータ） (2024-01-10T17:45:28Z)
Can You Rely on Your Model Evaluation? Improving Model Evaluation with Synthetic Test Data [75.20035991513564]
本稿では,モデル評価を容易にする深層生成モデリングフレームワークである3Sテストを紹介する。私たちの実験では、3Sテストが従来のベースラインより優れていることが示されています。これらの結果は、限られた実テストデータから合成テストデータへのパラダイムシフトが必要かどうかという問題を提起する。
論文参考訳（メタデータ） (2023-10-25T10:18:44Z)
Constructive Large Language Models Alignment with Diverse Feedback [76.9578950893839]
本稿では,大規模言語モデルのアライメント向上のための新しい手法として,コンストラクティブ・ディバース・フィードバック(CDF)を導入する。我々は,簡単な問題に対する批判的フィードバック,中級問題に対する改善的フィードバック,難題に対する選好的フィードバックを利用する。このような多様なフィードバックでモデルをトレーニングすることで、トレーニングデータの少ない使用でアライメント性能を向上させることができる。
論文参考訳（メタデータ） (2023-10-10T09:20:14Z)
TWINS: A Fine-Tuning Framework for Improved Transferability of Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。 TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文参考訳（メタデータ） (2023-03-20T14:12:55Z)
Robust Dialogue State Tracking with Weak Supervision and Sparse Data [2.580163308334609]
対話状態追跡(DST)を新しいデータに一般化することは、トレーニング中の豊富なきめ細かい監督に依存しているため困難である。サンプルの間隔、分布シフト、新しい概念やトピックの発生は、しばしば推論中に深刻なパフォーマンス劣化を引き起こす。そこで本研究では,詳細な手動スパンラベルを必要とせず,抽出DSTモデルを構築するためのトレーニング戦略を提案する。
論文参考訳（メタデータ） (2022-02-07T16:58:12Z)
Pre-training also Transfers Non-Robustness [20.226917627173126]
一般化への貢献が認められているにもかかわらず、事前学習は、事前訓練されたモデルから微調整されたモデルへの非破壊性も伝達する。その結果, 損耗を緩和し, 一般化を保ち, 有効性を検証した。
論文参考訳（メタデータ） (2021-06-21T11:16:13Z)
Consistency and Monotonicity Regularization for Neural Knowledge Tracing [50.92661409499299]
人間の知識獲得を追跡する知識追跡(KT)は、オンライン学習と教育におけるAIの中心的なコンポーネントです。本稿では, 新たなデータ拡張, 代替, 挿入, 削除の3種類と, 対応する正規化損失を提案する。さまざまなKTベンチマークに関する広範な実験は、私たちの正規化スキームがモデルのパフォーマンスを一貫して改善することを示しています。
論文参考訳（メタデータ） (2021-05-03T02:36:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。