Fugu-MT 論文翻訳(概要): CREST: Improving Interpretability and Effectiveness of Troubleshooting at Ericsson through Criterion-Specific Trouble Report Retrieval

論文の概要: CREST: Improving Interpretability and Effectiveness of Troubleshooting at Ericsson through Criterion-Specific Trouble Report Retrieval

arxiv url: http://arxiv.org/abs/2511.17417v1
Date: Fri, 21 Nov 2025 17:16:24 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-24 18:08:19.136864
Title: CREST: Improving Interpretability and Effectiveness of Troubleshooting at Ericsson through Criterion-Specific Trouble Report Retrieval
Title（参考訳）: CREST:Ericssonにおけるトラブルシューティングの解釈可能性と有効性の改善
Authors: Soroush Javdan, Pragash Krishnamoorthy, Olga Baysal,
Abstract要約: 本研究では,異なるTR観測基準と検索モデルの性能への影響について検討した。 textbfCREST (textbfCriteria-specific textbfRetrieval via textbfEnsemble of textbf Specialized textbfTR model)を提案する。 CRESTでは、特定のTR基準に基づいてトレーニングされた特殊なモデルを使用して、出力を集約して、多種多様な補完的な信号をキャプチャする。
参考スコア（独自算出の注目度）: 0.5352699766206809
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The rapid evolution of the telecommunication industry necessitates efficient troubleshooting processes to maintain network reliability, software maintainability, and service quality. Trouble Reports (TRs), which document issues in Ericsson's production system, play a critical role in facilitating the timely resolution of software faults. However, the complexity and volume of TR data, along with the presence of diverse criteria that reflect different aspects of each fault, present challenges for retrieval systems. Building on prior work at Ericsson, which utilized a two-stage workflow, comprising Initial Retrieval (IR) and Re-Ranking (RR) stages, this study investigates different TR observation criteria and their impact on the performance of retrieval models. We propose \textbf{CREST} (\textbf{C}riteria-specific \textbf{R}etrieval via \textbf{E}nsemble of \textbf{S}pecialized \textbf{T}R models), a criterion-driven retrieval approach that leverages specialized models for different TR fields to improve both effectiveness and interpretability, thereby enabling quicker fault resolution and supporting software maintenance. CREST utilizes specialized models trained on specific TR criteria and aggregates their outputs to capture diverse and complementary signals. This approach leads to enhanced retrieval accuracy, better calibration of predicted scores, and improved interpretability by providing relevance scores for each criterion, helping users understand why specific TRs were retrieved. Using a subset of Ericsson's internal TRs, this research demonstrates that criterion-specific models significantly outperform a single model approach across key evaluation metrics. This highlights the importance of all targeted criteria used in this study for optimizing the performance of retrieval systems.
Abstract（参考訳）: 通信産業の急速な進化は、ネットワークの信頼性、ソフトウェア保守性、サービス品質を維持するために効率的なトラブルシューティングプロセスを必要とする。エリクソンのプロダクションシステムにおける問題を文書化するトラブルレポート(TR)は、ソフトウェア欠陥のタイムリーな解決を促進する上で重要な役割を果たす。しかし、TRデータの複雑さと容積は、各障害の異なる側面を反映する多様な基準の存在とともに、検索システムの課題を提示する。 Initial Retrieval (IR) と Re-Ranking (RR) の2段階のワークフローを利用したEricsson の先行研究に基づいて, TR 観測基準と, 検索モデルの性能への影響について検討した。本稿では,異なるTRフィールドの特殊モデルを活用する基準駆動型検索手法である \textbf{CREST} (\textbf{C}riteria-specific \textbf{R}etrieval via \textbf{E}nsemble of \textbf{S}pecialized \textbf{T}R model)を提案する。 CRESTでは、特定のTR基準に基づいてトレーニングされた特殊なモデルを使用して、出力を集約して、多種多様な補完的な信号をキャプチャする。このアプローチは、検索精度の向上、予測スコアの校正の改善、各基準の関連スコアを提供することによる解釈可能性の向上、特定のTRが取得された理由の理解を支援する。エリクソンの内部TRのサブセットを用いて、この研究は、基準固有モデルが主要な評価指標全体にわたって単一のモデルアプローチを著しく上回っていることを示す。このことは,検索システムの性能を最適化するために,本研究で使用される全ての目標基準の重要性を強調している。

関連論文リスト

Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (2026-02-03T15:32:09Z)
Implicit Neural Representation-Based Continuous Single Image Super Resolution: An Empirical Study [50.15623093332659]
入射神経表現(INR)は任意のスケール画像超解像(ASSR)の標準的アプローチとなっている既存の手法を多様な設定で比較し、複数の画像品質指標に対して集計結果を示す。トレーニング中, エッジ, テクスチャ, 細部を保存しながら, 強度変化をペナライズする新たな損失関数について検討した。
論文参考訳（メタデータ） (2026-01-25T07:09:20Z)
TableGPT-R1: Advancing Tabular Reasoning Through Reinforcement Learning [28.052232941379884]
TableGPT-R1は、システマティック強化学習フレームワーク上に構築された特殊なモデルである。本手法は, 教師付きアライメントとRLロールアウトの両方に対して, 難成層化エージェント軌道を合成する。信頼性ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-12-23T12:30:37Z)
OmniQuality-R: Advancing Reward Models Through All-Encompassing Quality Assessment [55.59322229889159]
我々は,マルチタスク品質推論を連続的かつ解釈可能な報酬信号に変換する統一報酬モデリングフレームワークOmniQuality-Rを提案する。我々は、推論強化報酬モデルデータセットを使用して、教師付き微調整のための信頼性の高いチェーンオブ思考データセットを構築します。 OmniQuality-Rは,美的品質評価,技術的品質評価,テキスト画像アライメントという3つの重要なIQAタスクで評価する。
論文参考訳（メタデータ） (2025-10-12T13:46:28Z)
Investigating LLM Variability in Personalized Conversational Information Retrieval [14.220276130333849]
Moらは、個人用テキスト知識ベース(PTKB)を大規模言語モデル(LLM)に組み込むためのいくつかの戦略を探求した。提案手法を新しいTREC iKAT 2024データセットに適用し,Llama (1B-70B), Qwen-7B, GPT-4o-miniを含む多種多様なモデルの評価を行った。その結果,人間の選択したPTKBは連続的に検索性能を向上する一方,LLMに基づく選択法は手作業による選択を確実に上回るものではないことがわかった。
論文参考訳（メタデータ） (2025-10-04T12:13:19Z)
Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.47971671635531]
大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。 Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文参考訳（メタデータ） (2025-09-30T22:19:44Z)
Adaptive Root Cause Localization for Microservice Systems with Multi-Agent Recursion-of-Thought [11.307072056343662]
本稿では,マイクロサービスシステムに対する適応的根本原因ローカライゼーション手法であるRCLAgentを紹介する。 RCLAgentは,1つの要求出力状態のみを用いて根本原因を局所化し,優れた性能を発揮することを示す。
論文参考訳（メタデータ） (2025-08-28T02:34:19Z)
Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。 RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。 AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文参考訳（メタデータ） (2025-04-21T04:56:47Z)
REAL-MM-RAG: A Real-World Multi-Modal Retrieval Benchmark [16.55516587540082]
本稿では,リアルタイム検索に不可欠な4つの重要な特性に対処する自動生成ベンチマークREAL-MM-RAGを紹介する。本稿では,キーワードマッチング以外のモデルのセマンティック理解を評価するために,クエリリフレッシングに基づく多言語レベルのスキームを提案する。我々のベンチマークでは、特にテーブル重ドキュメントの扱いや、クエリ・リフレージングに対する堅牢性において、重要なモデルの弱点が明らかになっている。
論文参考訳（メタデータ） (2025-02-17T22:10:47Z)
LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.76373105981212]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文参考訳（メタデータ） (2024-06-18T09:29:18Z)
Review of coreference resolution in English and Persian [8.604145658574689]
参照解決(CR)は、同じ現実世界の実体を参照する表現を識別する。本稿では、コア参照とアナフォラ分解能にまたがるCRの最近の進歩について考察する。ペルシャのCRの独特な課題を認識し、このアンダーリソース言語に焦点をあてる。
論文参考訳（メタデータ） (2022-11-08T18:14:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。