論文の概要: A Comparative Study of Retrieval Methods in Azure AI Search
- arxiv url: http://arxiv.org/abs/2512.08078v1
- Date: Mon, 08 Dec 2025 22:20:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.74145
- Title: A Comparative Study of Retrieval Methods in Azure AI Search
- Title(参考訳): Azure AI検索における検索手法の比較検討
- Authors: Qiang Mao, Han Qin, Robert Neary, Charles Wang, Fusheng Wei, Jianping Zhang, Nathaniel Huber-Fliflet,
- Abstract要約: 本研究では、Microsoft AzureのRetrieval-Augmented Generationフレームワークにおける検索戦略を評価する。
Azure AI Searchのキーワード、セマンティック、ベクター、ハイブリッド、ハイブリッドのセマンティック検索手法のパフォーマンスを比較した。
- 参考スコア(独自算出の注目度): 4.799746336710645
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Increasingly, attorneys are interested in moving beyond keyword and semantic search to improve the efficiency of how they find key information during a document review task. Large language models (LLMs) are now seen as tools that attorneys can use to ask natural language questions of their data during document review to receive accurate and concise answers. This study evaluates retrieval strategies within Microsoft Azure's Retrieval-Augmented Generation (RAG) framework to identify effective approaches for Early Case Assessment (ECA) in eDiscovery. During ECA, legal teams analyze data at the outset of a matter to gain a general understanding of the data and attempt to determine key facts and risks before beginning full-scale review. In this paper, we compare the performance of Azure AI Search's keyword, semantic, vector, hybrid, and hybrid-semantic retrieval methods. We then present the accuracy, relevance, and consistency of each method's AI-generated responses. Legal practitioners can use the results of this study to enhance how they select RAG configurations in the future.
- Abstract(参考訳): ますます、弁護士は、キーワードやセマンティック検索を超えて、ドキュメントレビュータスク中に重要な情報を見つける方法の効率を向上させることに関心を寄せている。
大規模言語モデル(LLM)は、弁護士がドキュメントレビュー中に自然言語でデータについて質問し、正確で簡潔な回答を得られるツールとして、現在見なされている。
本研究では,Microsoft Azure の Retrieval-Augmented Generation (RAG) フレームワーク内での検索戦略を評価し,eDiscovery における早期事例評価 (ECA) の効果的なアプローチを特定する。
ECAの間、法律チームは問題の初期段階でデータを分析して、データの一般的な理解を得、本格的なレビューを開始する前に重要な事実とリスクを判断しようとします。
本稿では,Azure AI Searchのキーワード,セマンティック,ベクトル,ハイブリッド,ハイブリッド・セマンティック検索手法の性能を比較した。
次に、各手法のAI生成応答の精度、関連性、一貫性を示す。
法律実務者は、今後のRAG構成の選択方法を強化するために、この研究の結果を利用することができる。
関連論文リスト
- Towards Context-aware Reasoning-enhanced Generative Searching in E-commerce [61.03081096959132]
そこで本稿では,複雑な状況下でのテキストバウンダリングを改善するための,文脈対応推論強化型生成検索フレームワークを提案する。
提案手法は,強力なベースラインに比べて優れた性能を示し,検索に基づく推薦の有効性を検証した。
論文 参考訳(メタデータ) (2025-10-19T16:46:11Z) - Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.56450566014625]
ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文 参考訳(メタデータ) (2025-09-08T10:58:42Z) - CoCoNUTS: Concentrating on Content while Neglecting Uninformative Textual Styles for AI-Generated Peer Review Detection [60.52240468810558]
我々は、AI生成ピアレビューの詳細なデータセットの上に構築されたコンテンツ指向ベンチマークであるCoCoNUTSを紹介する。
また、マルチタスク学習フレームワークを介してAIレビュー検出を行うCoCoDetを開発し、レビューコンテンツにおけるAIのより正確で堅牢な検出を実現する。
論文 参考訳(メタデータ) (2025-08-28T06:03:11Z) - Augmented Question-guided Retrieval (AQgR) of Indian Case Law with LLM, RAG, and Structured Summaries [0.0]
本稿では,関連事例の検索を容易にするためにLarge Language Models (LLMs) を提案する。
提案手法は,Retrieval Augmented Generation (RAG) と,インドの事例法に最適化された構造化要約を組み合わせたものである。
本システムは,関連事例法をより効果的に識別するために,事実シナリオに基づく対象の法的質問を生成する。
論文 参考訳(メタデータ) (2025-07-23T05:24:44Z) - JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - Judgement Citation Retrieval using Contextual Similarity [0.0]
本稿では,自然言語処理(NLP)と機械学習技術を組み合わせて,訴訟記述の組織化と活用を促進する手法を提案する。
提案手法は,教師なしクラスタリングと教師付き引用検索の2つの主要な目的に対処する。
我々の手法は90.9%という驚くべき精度を達成した。
論文 参考訳(メタデータ) (2024-05-28T04:22:28Z) - Empowering Prior to Court Legal Analysis: A Transparent and Accessible Dataset for Defensive Statement Classification and Interpretation [5.646219481667151]
本稿では,裁判所の手続きに先立って,警察の面接中に作成された文の分類に適した新しいデータセットを提案する。
本稿では,直感的文と真偽を区別し,最先端のパフォーマンスを実現するための微調整DistilBERTモデルを提案する。
我々はまた、法律専門家と非専門主義者の両方がシステムと対話し、利益を得ることを可能にするXAIインターフェースも提示する。
論文 参考訳(メタデータ) (2024-05-17T11:22:27Z) - Leveraging Cognitive Search Patterns to Enhance Automated Natural
Language Retrieval Performance [0.0]
ユーザの検索行動を模倣する認知的再構成パターンが強調されている。
問合せの概念表現を考慮し,これらのパターンの適用を形式化する。
遺伝的アルゴリズムに基づく重み付けプロセスでは、概念的役割タイプに応じて用語に重点を置くことができる。
論文 参考訳(メタデータ) (2020-04-21T14:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。