論文の概要: Provenance-Based Interpretation of Multi-Agent Information Analysis
- arxiv url: http://arxiv.org/abs/2011.04016v1
- Date: Sun, 8 Nov 2020 16:43:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 08:46:41.597712
- Title: Provenance-Based Interpretation of Multi-Agent Information Analysis
- Title(参考訳): プロヴァンスに基づくマルチエージェント情報分析の解釈
- Authors: Scott Friedman, Jeff Rye, David LaVergne, Dan Thomsen, Matthew Allen,
Kyle Tunis
- Abstract要約: 本稿では,エージェントの評価とエビデンスリンクと合わせて,エージェントのPROV-Oによるオントロジーを追跡する手法を提案する。
PROV-O と DIVE を併用することで,信頼性の動的伝播と反実的難読化を実現し,人間の機械的信頼と分析的整合性を向上させる。
- 参考スコア(独自算出の注目度): 0.880802134366532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Analytic software tools and workflows are increasing in capability,
complexity, number, and scale, and the integrity of our workflows is as
important as ever. Specifically, we must be able to inspect the process of
analytic workflows to assess (1) confidence of the conclusions, (2) risks and
biases of the operations involved, (3) sensitivity of the conclusions to
sources and agents, (4) impact and pertinence of various sources and agents,
and (5) diversity of the sources that support the conclusions. We present an
approach that tracks agents' provenance with PROV-O in conjunction with agents'
appraisals and evidence links (expressed in our novel DIVE ontology). Together,
PROV-O and DIVE enable dynamic propagation of confidence and counter-factual
refutation to improve human-machine trust and analytic integrity. We
demonstrate representative software developed for user interaction with that
provenance, and discuss key needs for organizations adopting such approaches.
We demonstrate all of these assessments in a multi-agent analysis scenario,
using an interactive web-based information validation UI.
- Abstract(参考訳): 分析ソフトウェアツールとワークフローは能力、複雑性、数、スケールが増加しており、ワークフローの整合性は相変わらず重要です。
具体的には,(1)結論の信頼性,(2)関連する操作のリスクとバイアス,(3)情報源やエージェントに対する結論の感度,(4)さまざまなソースやエージェントに対する影響と妥当性,(5)結論を支持するソースの多様性を評価するために,分析ワークフローのプロセスを検査しなくてはならない。
本稿では,エージェントの評価とエビデンスリンク(DIVEオントロジーで表現される)と合わせて,エージェントのPROV-Oによる証明を追跡するアプローチを提案する。
PROV-O と DIVE を併用することで,信頼性の動的伝播と反実的難読化を実現し,人間の機械的信頼と分析的整合性を向上させる。
ユーザとの対話のために開発された代表的ソフトウェアを紹介し,そのようなアプローチを採用する組織にとって重要なニーズについて論じる。
インタラクティブなWebベースの情報検証UIを用いて,これらの評価をマルチエージェント分析シナリオで実証する。
関連論文リスト
- Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。
我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。
次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文 参考訳(メタデータ) (2024-09-27T06:31:03Z) - Towards Human-Level Understanding of Complex Process Engineering Schematics: A Pedagogical, Introspective Multi-Agent Framework for Open-Domain Question Answering [0.0]
化学・プロセス産業では、プロセス・フロー・ダイアグラム(PFD)とパイプ・アンド・インスツルメンテーション・ダイアグラム(P&ID)が設計、建設、保守に不可欠である。
生成型AIの最近の進歩は、ビジュアル質問回答(VQA)のプロセス図の理解と解釈の約束を示している。
本稿では,階層的かつマルチエージェントなRetrieval Augmented Generation(RAG)フレームワークを用いた,セキュアでオンプレミスなエンタープライズソリューションを提案する。
論文 参考訳(メタデータ) (2024-08-24T19:34:04Z) - Optimizing Collaboration of LLM based Agents for Finite Element Analysis [1.5039745292757671]
本稿では,Large Language Models (LLM) 内の複数のエージェント間の相互作用について,プログラミングおよびコーディングタスクの文脈で検討する。
我々はAutoGenフレームワークを利用してエージェント間の通信を容易にし、各セットアップの40のランダムランからの成功率に基づいて異なる構成を評価する。
論文 参考訳(メタデータ) (2024-08-23T23:11:08Z) - InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.09622602860703]
3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文 参考訳(メタデータ) (2024-07-08T22:06:09Z) - A Factor Graph Model of Trust for a Collaborative Multi-Agent System [8.286807697708113]
信頼とは、エージェントがシステム内の他者の情報、行動、意図、真実性、能力に依存し、信頼することである。
本稿では,エージェント間の相互依存行動と信頼性を表現するために因子グラフを利用する新しいグラフィカルアプローチを提案する。
信頼度評価手法は分散化され, 近接安全性, 一貫性, 協調といった重要な相互依存サブファクタを考察する。
論文 参考訳(メタデータ) (2024-02-10T21:44:28Z) - AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents [76.95062553043607]
大きな言語モデル(LLM)を評価することは、その能力を理解し、実践的なアプリケーションへの統合を促進するために不可欠である。
本稿では,LLMエージェントの分析的評価に適したオープンソース評価フレームワークであるAgentBoardを紹介する。
論文 参考訳(メタデータ) (2024-01-24T01:51:00Z) - A Study of Situational Reasoning for Traffic Understanding [63.45021731775964]
トラフィック領域における状況推論のための3つの新しいテキストベースのタスクを考案する。
先行作業における言語推論タスクにまたがる一般化能力を示す知識強化手法を4つ採用する。
本稿では,データ分割におけるモデル性能の詳細な解析を行い,モデル予測を分類的に検討する。
論文 参考訳(メタデータ) (2023-06-05T01:01:12Z) - Communicating Uncertainty in Machine Learning Explanations: A
Visualization Analytics Approach for Predictive Process Monitoring [0.0]
本研究では,グローバルおよびローカルなポストホックな説明手法でモデル不確実性を効果的に伝達する方法を検討する。
これら2つの研究の方向性を組み合わせることで、意思決定者は説明駆動型実行可能な洞察の妥当性を正当化できるだけでなく、信頼性も検証できる。
論文 参考訳(メタデータ) (2023-04-12T09:44:32Z) - Quantifying & Modeling Multimodal Interactions: An Information
Decomposition Framework [89.8609061423685]
本稿では,入力モーダル性と出力タスクを関連付けた冗長性,特異性,シナジーの度合いを定量化する情報理論手法を提案する。
PID推定を検証するために、PIDが知られている合成データセットと大規模マルチモーダルベンチマークの両方で広範な実験を行う。
本研究では,(1)マルチモーダルデータセット内の相互作用の定量化,(2)マルチモーダルモデルで捉えた相互作用の定量化,(3)モデル選択の原理的アプローチ,(4)実世界のケーススタディの3つにその有用性を示す。
論文 参考訳(メタデータ) (2023-02-23T18:59:05Z) - Personalized multi-faceted trust modeling to determine trust links in
social media and its potential for misinformation management [61.88858330222619]
ソーシャルメディアにおけるピア間の信頼関係を予測するためのアプローチを提案する。
本稿では,データ駆動型多面信頼モデルを提案する。
信頼を意識したアイテムレコメンデーションタスクで説明され、提案したフレームワークを大規模なYelpデータセットのコンテキストで評価する。
論文 参考訳(メタデータ) (2021-11-11T19:40:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。