論文の概要: Quality of explanation of xAI from the prespective of Italian end-users: Italian version of System Causability Scale (SCS)
- arxiv url: http://arxiv.org/abs/2504.16193v1
- Date: Tue, 22 Apr 2025 18:32:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.893173
- Title: Quality of explanation of xAI from the prespective of Italian end-users: Italian version of System Causability Scale (SCS)
- Title(参考訳): イタリアのエンドユーザーによる xAI の説明の質: System Causability Scale (SCS) のイタリア版
- Authors: Carmine Attanasio, Alireza Mortezapour,
- Abstract要約: 本研究の目的は,システム因果性尺度(I-SCS)のイタリア語版を用いて,xAIで提供される説明の質を評価することである。
イタリアのエンドユーザーの代表的サンプルは、イタリア語版における質問の意味と内容を完全に理解した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Background and aim: Considering the scope of the application of artificial intelligence beyond the field of computer science, one of the concerns of researchers is to provide quality explanations about the functioning of algorithms based on artificial intelligence and the data extracted from it. The purpose of the present study is to validate the Italian version of system causability scale (I-SCS) to measure the quality of explanations provided in a xAI. Method: For this purpose, the English version, initially provided in 2020 in coordination with the main developer, was utilized. The forward-backward translation method was applied to ensure accuracy. Finally, these nine steps were completed by calculating the content validity index/ratio and conducting cognitive interviews with representative end users. Results: The original version of the questionnaire consisted of 10 questions. However, based on the obtained indexes (CVR below 0.49), one question (Question 8) was entirely removed. After completing the aforementioned steps, the Italian version contained 9 questions. The representative sample of Italian end users fully comprehended the meaning and content of the questions in the Italian version. Conclusion: The Italian version obtained in this study can be used in future research studies as well as in the field by xAI developers. This tool can be used to measure the quality of explanations provided for an xAI system in Italian culture.
- Abstract(参考訳): 背景と目的:コンピュータ科学以外の分野における人工知能の応用の範囲を考えると、研究者の懸念の一つは、人工知能に基づくアルゴリズムの機能とそこから抽出されたデータに関する質的な説明を提供することである。
本研究の目的は,システム因果性尺度(I-SCS)のイタリア語版を用いて,xAIで提供される説明の質を評価することである。
方法:この目的のために、最初は2020年に主要開発者と協調して提供された英語版が使用された。
精度を確保するために前向きの翻訳法を適用した。
最後に、これらの9つのステップは、コンテンツ妥当性指数/比率を計算し、代表ユーザとの認知インタビューを行うことで完了した。
結果: 質問紙の原版は10質問であった。
しかし、得られた指標(CVR 0.49未満)に基づいて、1つの質問(Question 8)は完全に削除された。
上記のステップを完了した後、イタリア版には9つの質問があった。
イタリアのエンドユーザーの代表的サンプルは、イタリア語版における質問の意味と内容を完全に理解した。
結論: この研究で得られたイタリア語版は、将来の研究やxAI開発者による分野でも利用することができる。
このツールは、イタリアの文化においてxAIシステムに提供される説明の質を測定するために用いられる。
関連論文リスト
- Do LLMs Understand Your Translations? Evaluating Paragraph-level MT with Question Answering [68.3400058037817]
本稿では,TREQA(Translation Evaluation via Question-Answering)について紹介する。
我々は,TREQAが最先端のニューラルネットワークとLLMベースのメトリクスより優れていることを示し,代用段落レベルの翻訳をランク付けする。
論文 参考訳(メタデータ) (2025-04-10T09:24:54Z) - Are Large Language Models Ready for Business Integration? A Study on Generative AI Adoption [0.6144680854063939]
本研究では,Google Geminiのような他の大規模言語モデル(LLM)のビジネスアプリケーションへの適用性について検討する。
ディズニーランドの異なる支店からの42,654件のレビューデータセットが採用された。
その結果、75%の成功率、25%のエラー、モデル自己参照の事例など、反応のスペクトルが示された。
論文 参考訳(メタデータ) (2025-01-28T21:01:22Z) - FairytaleQA Translated: Enabling Educational Question and Answer Generation in Less-Resourced Languages [0.0]
本稿では,幼児の物語理解能力の評価と向上を目的とした,有名なQAデータセットであるFairytaleQAの機械翻訳版を紹介する。
我々は、翻訳データセット内の質問生成(QG)タスクとQAタスクのベンチマークを確立するために、微調整された、控えめなスケールのモデルを採用している。
本稿では,質問応答対の生成モデルを提案し,質問適合性,回答可能性,妥当性,子どもの適合性などの品質指標を取り入れた評価を行った。
論文 参考訳(メタデータ) (2024-06-06T16:31:47Z) - Quantitative Analysis of AI-Generated Texts in Academic Research: A Study of AI Presence in Arxiv Submissions using AI Detection Tool [0.0]
本研究は,学術機関がArxivに投稿するために用いた,意図的に制作されたコンテンツを閲覧する手法について分析する。
統計分析によると、Originality.aiは98%の精度で正確である。
論文 参考訳(メタデータ) (2024-02-09T17:20:48Z) - InfoLossQA: Characterizing and Recovering Information Loss in Text Simplification [60.10193972862099]
本研究は, 簡易化による情報損失を問合せ・問合せ形式で特徴づけ, 回復する枠組みを提案する。
QAペアは、読者がテキストの知識を深めるのに役立つように設計されている。
論文 参考訳(メタデータ) (2024-01-29T19:00:01Z) - Look Before You Leap: A Universal Emergent Decomposition of Retrieval
Tasks in Language Models [58.57279229066477]
本研究では,言語モデル(LM)が様々な状況下での検索タスクをどのように解決するかを検討する。
ORIONは6つのドメインにまたがる構造化された検索タスクの集合である。
LMは内部的にモジュール方式で検索タスクを分解する。
論文 参考訳(メタデータ) (2023-12-13T18:36:43Z) - Around the GLOBE: Numerical Aggregation Question-Answering on
Heterogeneous Genealogical Knowledge Graphs with Deep Neural Networks [0.934612743192798]
本稿では,系統樹の数値集約QAのための新しいエンドツーエンド手法を提案する。
提案されたアーキテクチャであるGLOBEは、このタスクの精度を87%向上させることで、最先端のモデルとパイプラインを上回っている。
本研究は系譜情報センターや博物館に実際的な意味を持つ可能性がある。
論文 参考訳(メタデータ) (2023-07-30T12:09:00Z) - Evaluating and Modeling Attribution for Cross-Lingual Question Answering [80.4807682093432]
この研究は、言語間質問応答の属性を初めて研究したものである。
我々は、5つの言語でデータを収集し、最先端の言語間QAシステムの属性レベルを評価する。
回答のかなりの部分は、検索されたどのパスにも帰属しないことがわかった。
論文 参考訳(メタデータ) (2023-05-23T17:57:46Z) - Explainable Artificial Intelligence (XAI) from a user perspective- A
synthesis of prior literature and problematizing avenues for future research [0.5371337604556311]
この結果は、フォーマット、完全性、正確性、および通貨である、AI説明を形成する4つの次元を示している。
説明の自動表現に加えて、ユーザーは必要に応じて追加情報を要求することができる。
また、XAI効果の5つの次元として、信頼、透明性、理解可能性、ユーザビリティ、公平性を見つけました。
論文 参考訳(メタデータ) (2022-11-24T20:15:59Z) - AdaVQA: Overcoming Language Priors with Adapted Margin Cosine Loss [73.65872901950135]
本研究は,特徴空間学習の観点から,言語先行問題に挑戦する試みである。
適応したマージンコサイン損失は、頻繁でスパースな回答特徴空間を区別するように設計されている。
実験の結果, 適応したマージンコサイン損失はベースラインモデルを大きく向上できることがわかった。
論文 参考訳(メタデータ) (2021-05-05T11:41:38Z) - Get It Scored Using AutoSAS -- An Automated System for Scoring Short
Answers [63.835172924290326]
SAS(Automatic Short Answer Scoring)への高速でスケーラブルで正確なアプローチを提示します。
SASのためのシステム、すなわちAutoSASの設計と開発を提案し、説明します。
AutoSASは最先端のパフォーマンスを示し、いくつかの質問のプロンプトで8%以上良い結果が得られる。
論文 参考訳(メタデータ) (2020-12-21T10:47:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。