論文の概要: Attention Mechanism and Heuristic Approach: Context-Aware File Ranking Using Multi-Head Self-Attention
- arxiv url: http://arxiv.org/abs/2601.06185v1
- Date: Wed, 07 Jan 2026 21:50:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.654692
- Title: Attention Mechanism and Heuristic Approach: Context-Aware File Ranking Using Multi-Head Self-Attention
- Title(参考訳): 注意機構とヒューリスティックアプローチ:マルチヘッド自己注意を用いたコンテキスト認識ファイルランキング
- Authors: Pradeep Kumar Sharma, Shantanu Godbole, Sarada Prasad Jena, Hritvik Shrivastava,
- Abstract要約: ポスト決定論的スコアリング改善機構としてのマルチヘッド自己認識の応用を提案する。
偽陰性(影響のあるファイルの欠落)は偽陽性(レビュー中にすぐに削除できる無関係なファイル)よりもはるかにコストがかかるため、私たちは正確さよりもリコールに重点を置いています。
200のテストケースに対する実証的な評価は、リポジトリの複雑さと構造によって、Top-50リコールが62-65%から78-82%に改善したことを示している。
- 参考スコア(独自算出の注目度): 0.09999629695552194
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The identification and ranking of impacted files within software reposi-tories is a key challenge in change impact analysis. Existing deterministic approaches that combine heuristic signals, semantic similarity measures, and graph-based centrality metrics have demonstrated effectiveness in nar-rowing candidate search spaces, yet their recall plateaus. This limitation stems from the treatment of features as linearly independent contributors, ignoring contextual dependencies and relationships between metrics that characterize expert reasoning patterns. To address this limitation, we propose the application of Multi-Head Self-Attention as a post-deterministic scoring refinement mechanism. Our approach learns contextual weighting between features, dynamically adjust-ing importance levels per file based on relational behavior exhibited across candidate file sets. The attention mechanism produces context-aware adjustments that are additively combined with deterministic scores, pre-serving interpretability while enabling reasoning similar to that performed by experts when reviewing change surfaces. We focus on recall rather than precision, as false negatives (missing impacted files) are far more costly than false positives (irrelevant files that can be quickly dismissed during review). Empirical evaluation on 200 test cases demonstrates that the introduc-tion of self-attention improves Top-50 recall from approximately 62-65% to between 78-82% depending on repository complexity and structure, achiev-ing 80% recall at Top-50 files. Expert validation yields improvement from 6.5/10 to 8.6/10 in subjective accuracy alignment. This transformation bridges the reasoning capability gap between deterministic automation and expert judgment, improving recall in repository-aware effort estimation.
- Abstract(参考訳): ソフトウェアリポジトリ内の影響のあるファイルの識別とランキングは、変更の影響分析における重要な課題である。
ヒューリスティックな信号、意味的類似度尺度、グラフに基づく集中度尺度を組み合わせた既存の決定論的アプローチは、ナロー候補探索空間において有効であるが、そのリコールプラトーは有効であることを示した。
この制限は、コンテキスト依存を無視し、専門家の推論パターンを特徴付けるメトリクス間の関係を無視する、線形独立なコントリビュータとしての機能の扱いに起因している。
この制限に対処するため, ポスト決定論的スコアリング改善機構としてのマルチヘッド自己認識の応用を提案する。
提案手法は特徴間のコンテキスト重み付けを学習し,候補ファイル集合間の関係行動に基づいてファイル単位の重要度を動的に調整する。
注意機構は、決定論的なスコアと付加的に組み合わせた文脈対応調整を生成し、解釈可能性を維持しつつ、変化面をレビューする際に専門家が行うような推論を可能にする。
偽陰性(影響のあるファイルの欠落)は偽陽性(レビュー中にすぐに削除できる無関係なファイル)よりもはるかにコストがかかります。
200のテストケースに対する実証的な評価は、Top-50ファイルの80%リコールの達成によって、Top-50リコールが62-65%から78-82%に改善されたことを示している。
専門家による検証では、主観的精度のアライメントが6.5/10から8.6/10に改善されている。
この変換は、決定論的自動化と専門家の判断の間の推論能力のギャップを埋め、リポジトリ対応の取り組み見積のリコールを改善します。
関連論文リスト
- Encyclo-K: Evaluating LLMs with Dynamically Composed Knowledge Statements [78.87065404966002]
既存のベンチマークは、主に質問レベルで質問をキュレートする。
ベンチマーク構築をゼロから再考するステートメントベースのベンチマークであるEncyclo-Kを提案する。
論文 参考訳(メタデータ) (2025-12-31T13:55:54Z) - RARE: Retrieval-Aware Robustness Evaluation for Retrieval-Augmented Generation Systems [33.389969814185214]
Retrieval-Augmented Generation (RAG)は、回答の正確性と事実性を高める。
既存の評価では、RAGシステムが現実世界のノイズ、内部と外部の取得したコンテキストの衝突、あるいは急速に変化する事実にどれくらいうまく対処しているかを検査することはめったにない。
本稿では,動的で時間に敏感なコーパス上でのストレステストクエリと文書摂動を共同で行う,統一されたフレームワークと大規模ベンチマークであるRetrieval-Aware Robustness Evaluation (RARE)を紹介する。
論文 参考訳(メタデータ) (2025-06-01T02:42:36Z) - Robust Relevance Feedback for Interactive Known-Item Video Search [30.382002857815497]
我々は、トップk選択の安定性を改善するためのペアワイズ相対判定フィードバックを導入する。
ユーザ認識を複数のサブパーセプションに分解し,それぞれが独立した埋め込み空間として表現される。
我々は,各ユーザフィードバックインスタンスに基づいて,サブパーセプションの組み合わせを推定する予測的ユーザモデルを開発する。
論文 参考訳(メタデータ) (2025-05-21T05:31:49Z) - Uncertainty in Repeated Implicit Feedback as a Measure of Reliability [12.441205946216192]
暗黙的かつ明示的なフィードバックは、人間の相互作用の変動によってノイズを引き起こす。
協調フィルタリングでは、これらの信号がユーザとアイテムの類似性を決定するため、相互作用信号の信頼性が重要となる。
我々は,反復パターンがユーザの関心に影響を及ぼす重要な要因とどのように交わるかを分析し,関連する不確実性を定量化する手法を開発した。
論文 参考訳(メタデータ) (2025-05-05T09:18:47Z) - Eliminating Position Bias of Language Models: A Mechanistic Approach [119.34143323054143]
位置バイアスは現代言語モデル (LM) の一般的な問題であることが証明されている。
我々の力学解析は、ほぼ全ての最先端のLMで使われている2つのコンポーネント(因果的注意と相対的位置エンコーディング)に位置バイアスが関係している。
位置バイアスを排除することによって、LM-as-a-judge、検索強化QA、分子生成、数学推論など、下流タスクのパフォーマンスと信頼性が向上する。
論文 参考訳(メタデータ) (2024-07-01T09:06:57Z) - Learning Robust Classifiers with Self-Guided Spurious Correlation Mitigation [26.544938760265136]
ディープニューラル分類器は、入力のスプリアス属性とターゲットの間のスプリアス相関に頼り、予測を行う。
本稿では,自己誘導型スプリアス相関緩和フレームワークを提案する。
予測行動の違いを識別するために分類器の訓練を行うことで,事前知識を必要とせず,素因関係への依存を軽減できることを示す。
論文 参考訳(メタデータ) (2024-05-06T17:12:21Z) - ROSCOE: A Suite of Metrics for Scoring Step-by-Step Reasoning [63.77667876176978]
大規模言語モデルでは、最終回答を正当化するためにステップバイステップの推論を生成するように促された場合、ダウンストリームタスクの解釈可能性が改善されている。
これらの推論ステップは、モデルの解釈可能性と検証を大幅に改善するが、客観的にそれらの正確性を研究することは困難である。
本稿では、従来のテキスト生成評価指標を改善し拡張する、解釈可能な教師なし自動スコアのスイートであるROSを提案する。
論文 参考訳(メタデータ) (2022-12-15T15:52:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。