論文の概要、ライセンス

# (参考訳) 友人の近さと反事実の近さ: 抽象的な設定において、最も近いものから学ぶことを改善する [全文訳有]

Keep Your Friends Close and Your Counterfactuals Closer: Improved Learning From Closest Rather Than Plausible Counterfactual Explanations in an Abstract Setting ( http://arxiv.org/abs/2205.05515v1 )

ライセンス: CC BY 4.0
Ulrike Kuhl and Andr\'e Artelt and Barbara Hammer(参考訳) 対実的説明(CFE)は、モデル入力の変更が特定の方法で予測を変更したことを強調している。 CFEは、説明可能な人工知能(XAI)のための心理的基盤のソリューションとして、かなりの注目を集めている。 最近の技術革新は、自動生成cfeの計算可能性の概念を導入し、その頑健性を高める。 しかし,このような制約がユーザエクスペリエンスや行動に与える影響は,まだ不明である。 本研究では,初級ユーザを対象とした反復学習設計において,計算可能なCFEの客観的および主観的ユーザビリティを評価する。 私たちは、抽象的なシナリオを中心に展開する、ゲームのような新しい実験デザインに依存しています。 以上の結果から,初歩的なユーザは,望まれる結果につながる最小限の変更を生み出す最も近いCFEよりも,計算上妥当なメリットが少ないことがわかった。 ゲーム後調査における回答は,両グループ間の主観的ユーザエクスペリエンスの差異を示さなかった。 心理学的妥当性を比較的類似性として考えると、最も近い条件のユーザがCFEを計算学的に妥当なものよりも心理的に妥当な体験をしているという事実によって説明できる。 要約すると、我々の研究は、XAIアプローチの設計段階において、人間の行動、嗜好、精神モデルを組み込むことの必要性を批判的に確認し、計算の可否と心理的可否の定義の微妙な相違を強調している。 再現可能な研究の関心事として、すべてのソースコード、取得したユーザデータ、現在の研究の評価スクリプトが利用可能である。

Counterfactual explanations (CFEs) highlight what changes to a model's input would have changed its prediction in a particular way. CFEs have gained considerable traction as a psychologically grounded solution for explainable artificial intelligence (XAI). Recent innovations introduce the notion of computational plausibility for automatically generated CFEs, enhancing their robustness by exclusively creating plausible explanations. However, practical benefits of such a constraint on user experience and behavior is yet unclear. In this study, we evaluate objective and subjective usability of computationally plausible CFEs in an iterative learning design targeting novice users. We rely on a novel, game-like experimental design, revolving around an abstract scenario. Our results show that novice users actually benefit less from receiving computationally plausible rather than closest CFEs that produce minimal changes leading to the desired outcome. Responses in a post-game survey reveal no differences in terms of subjective user experience between both groups. Following the view of psychological plausibility as comparative similarity, this may be explained by the fact that users in the closest condition experience their CFEs as more psychologically plausible than the computationally plausible counterpart. In sum, our work highlights a little-considered divergence of definitions of computational plausibility and psychological plausibility, critically confirming the need to incorporate human behavior, preferences and mental models already at the design stages of XAI approaches. In the interest of reproducible research, all source code, acquired user data, and evaluation scripts of the current study are available: https://github.com/u kuhl/PlausibleAlienZ oo
公開日: Wed, 11 May 2022 14:07:57 GMT

※ 翻訳結果を表に示しています。PDFがオリジナルの論文です。翻訳結果のライセンスはCC BY-SA 4.0です。詳細はトップページをご参照ください。

翻訳結果

    Page: /      
英語(論文から抽出)日本語訳スコア
KEEP YOUR FRIENDS CLOSE AND YOUR COUNTERFACTUALS CLOSER: IMPROVED LEARNING FROM CLOSEST RATHER THAN KEEP YRIENDS LOSE and YOUR COUNTERFACTALS CLOSER: CLOSEST RATHEOR THANからの学習改善 0.70
PLAUSIBLE COUNTERFACTUAL EXPLANATIONS IN AN もっともらしい反事実的な説明 0.16
ABSTRACT SETTING 2 2 0 2 アブストラクト設定 2 2 0 2 0.42
y a M 1 1 y a m 1 1 である。 0.65
] I A . s c [ 【私】 A! sc [ 0.50
1 v 5 1 5 5 0 1 v 5 1 5 5 0 0.43
. 5 0 2 2 : v i X r a . 5 0 2 2 : v i X r a 0.42
Ulrike Kuhl CITEC ウルリケ・コール CITEC 0.37
Bielefeld University Bielefeld, Germany ドイツ・ビレフェルト大学ビレフェルト校 0.66
ukuhl@techfak.uni-bi elefeld.de 英語) kuhl@techfak.uni-bie lefeld.de 0.32
André Artelt CITEC アンドレ・アルテル CITEC 0.43
Bielefeld University Bielefeld, Germany ドイツ・ビレフェルト大学ビレフェルト校 0.66
aartelt@techfak.uni- bielefeld.de aartelt@techfak.uni- bielefeld.de 0.24
Barbara Hammer CITEC バーバラ・ハマー CITEC 0.50
Bielefeld University Bielefeld, Germany ドイツ・ビレフェルト大学ビレフェルト校 0.66
bhammer@techfak.uni- bielefeld.de bhammer@techfak.uni- bielefeld.de 0.24
ABSTRACT Counterfactual explanations (CFEs) highlight what changes to a model’s input would have changed its prediction in a particular way. ABSTRACT 対実的説明(CFE)は、モデル入力の変更が特定の方法で予測を変更したことを強調している。 0.60
CFEs have gained considerable traction as a psychologically grounded solution for explainable artificial intelligence (XAI). CFEは、説明可能な人工知能(XAI)のための心理的基盤のソリューションとして、かなりの注目を集めている。 0.48
Recent innovations introduce the notion of computational plausibility for automatically generated CFEs, enhancing their robustness by exclusively creating plausible explanations. 最近の技術革新は、自動生成cfeの計算可能性の概念を導入し、その頑健性を高める。 0.53
However, practical benefits of such a constraint on user experience and behavior is yet unclear. しかし,このような制約がユーザエクスペリエンスや行動に与える影響は,まだ不明である。 0.69
In this study, we evaluate objective and subjective usability of computationally plausible CFEs in an iterative learning design targeting novice users. 本研究では,初級ユーザを対象とした反復学習設計において,計算可能なCFEの客観的および主観的ユーザビリティを評価する。 0.69
We rely on a novel, game-like experimental design, revolving around an abstract scenario. 私たちは、抽象的なシナリオを中心に展開する、ゲームのような新しい実験デザインに依存しています。 0.52
Our results show that novice users actually benefit less from receiving computationally plausible rather than closest CFEs that produce minimal changes leading to the desired outcome. 以上の結果から,初歩的なユーザは,望まれる結果につながる最小限の変更を生み出す最も近いCFEよりも,計算上妥当なメリットが少ないことがわかった。 0.68
Responses in a post-game survey reveal no differences in terms of subjective user experience between both groups. ゲーム後調査における回答は,両グループ間の主観的ユーザエクスペリエンスの差異を示さなかった。 0.73
Following the view of psychological plausibility as comparative similarity, this may be explained by the fact that users in the closest condition experience their CFEs as more psychologically plausible than the computationally plausible counterpart. 心理学的妥当性を比較的類似性として考えると、最も近い条件のユーザがCFEを計算学的に妥当なものよりも心理的に妥当な体験をしているという事実によって説明できる。 0.60
In sum, our work highlights a little-considered divergence of definitions of computational plausibility and psychological plausibility, critically confirming the need to incorporate human behavior, preferences and mental models already at the design stages of XAI approaches. 要約すると、我々の研究は、XAIアプローチの設計段階において、人間の行動、嗜好、精神モデルを組み込むことの必要性を批判的に確認し、計算の可否と心理的可否の定義の微妙な相違を強調している。 0.51
In the interest of reproducible research, all source code, acquired user data, and evaluation scripts of the current study are available: https://github.com/u kuhl/PlausibleAlienZ oo 再現可能な研究の関心事として、すべてのソースコード、取得したユーザデータ、現在の研究の評価スクリプトが利用可能である。 0.71
1 Introduction Explaining one’s behavior to another person is a critical element in human social interaction. 1 はじめに 他人の行動を説明することは、人間の社会的相互作用において重要な要素である。 0.55
We depend on explanations to improve our understanding, ultimately building a stable mental model as basis for prediction and control [30]. 我々は理解を改善するために説明に依存し、最終的に予測と制御の基礎として安定した精神モデルを構築する[30]。 0.73
The Permission to make digital or hard copies of part or all of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. 本作品の一部又は全部のデジタル又はハードコピーを個人的又は教室で使用するための許可は、利益または商業的利益のためにコピーが作成又は配布されず、コピーがこの通知及び第1ページに完全な引用を有することを条件として、無償で付与される。
訳抜け防止モード: デジタル又はハードコピーの作成許可又はその一部又は全部を個人又は教室での使用許可 手数料なしで与えられます 利益や商業上の利益のためにコピーは作られない そのコピーには この通知と 最初のページの全文が書かれています
0.79
Copyrights for third-party components of this work must be honored. この作品のサードパーティコンポーネントの著作権を尊重しなければならない。 0.59
For all other uses, contact the owner/author(s). 他のすべての用途について、オーナー/著者に連絡してください。 0.47
FAccT ’22, June 21–24, 2022, Seoul, Republic of Korea © Copyright held by the owner/author(s). FAccT'22、2022年6月21-24日、ソウル、大韓民国。 0.37
ACM ISBN 978-1-4503-9352-2/22 /06. ACM ISBN 978-1-4503-9352-2/22 /06 0.18
https://doi.org/10.1 145/3531146.3534630 https://doi.org/10.1 145/3531146.3534630 0.15
英語(論文から抽出)日本語訳スコア
need to effectively explain not just human action, but also the behavior of automated systems and their underlying machine learning (ML) models, has received increasing attention in recent years. 人間の行動だけでなく、自動化されたシステムとその基盤となる機械学習(ml)モデルの振る舞いを効果的に説明する必要性が近年注目されている。 0.78
This development gave rise to the increasing interest in explainable artificial intelligence (XAI) as a research field. この発展は、研究分野としての説明可能な人工知能(XAI)への関心が高まった。 0.77
Consequently, the XAI community has seen a veritable surge of technical accounts on how to realize explainability for ML [29]. その結果、XAIコミュニティは、ML [29] の説明可能性を実現するための技術的説明が圧倒的に急増した。 0.58
Motivated by a seminal review by Miller advocating a user-centered focus on explainability, counterfactual explanations (CFEs) gained particular prominence as a supposedly useful, human-accessible solution [50, 36]. Miller氏による初歩的なレビューによって、ユーザ中心の説明可能性への焦点が提唱され、対実的説明(CFEs)は、おそらく有用な、人間にアクセスできるソリューションとして特に有名になった[50, 36]。 0.51
CFEs provide what-if feedback to the user, i.e., information on what changes in the input elicit a change of an automated decision (i.e., “if you had worn a mask, you would not have gotten ill”). CFEは、ユーザーに対して、例えば、入力の変更が自動決定の変更を誘発する情報(つまり、仮面を着けていたら、病気にならなかっただろう)を提供する。
訳抜け防止モード: CFEは、ユーザへのフィードバック、すなわち、何を提供するかを提供します。 入力のどの変更が自動決定の変更をもたらすかの情報(すなわち) 「仮面を着けていたら、病気にはならなかっただろう」)。
0.71
However, the emerging body of work on CFEs, and explainability of ML models more generally, shows an alarming tendency to take the quality of the suggested explanation modes at face value [23, 52]. しかし,CFEに関する新たな研究やMLモデルの説明可能性から,提案した説明モードの品質を顔値[23,52]で評価する傾向が示唆された。 0.65
A recent review of counterfactual XAI studies reveals that only one on three studies concern themselves with user-based evaluations, often with limitations concerning statistical power and reproducibility [36]. 近年の対実的XAI研究のレビューでは、統計力と再現性に関する制限を伴い、ユーザによる評価を自覚する研究は3つに1つしかないことが判明した[36]。 0.70
The lack of user-based evaluations affects not only assessments of CFEs as such, but more specifically also the evaluation of different conceptualizations for this kind of explanations. ユーザによる評価の欠如は、CFEの評価だけでなく、より具体的には、この種の説明に対する異なる概念化の評価にも影響を及ぼす。 0.73
The prevailing approach in the current literature is to compare different CFE approaches exclusively in terms of their robustness and theoretical fairness [6, 53, 71], passing over the role of the user as eventual target. 現在の文献における一般的なアプローチは、個々のCFEアプローチを、その堅牢性と理論的公正性(6, 53, 71]の観点から比較し、ユーザの役割を最終的な目標として受け継ぐことである。 0.72
Thus, in-depth evaluations of user experiences, elucidating the usability of CFE variants, are yet to be done. したがって、CFEのバリエーションのユーザビリティを解明する、ユーザエクスペリエンスの詳細な評価はまだ行われていない。 0.66
The current work marks a step towards closing this fundamental research gap, focusing on the concept of plausibility. 現在の研究は、この根本的な研究ギャップを解消するための一歩であり、可能性の概念に焦点を当てている。
訳抜け防止モード: 現在の研究は、この根本的な研究ギャップを縮めるための一歩である。 可能性の概念に焦点を合わせます
0.54
While technical descriptions of plausible CFEs approaches exist [64, 62, 5], no user study to date has directly investigated potential benefits of enforcing an additional plausibility constraint. 実証可能なCFEの技術的記述は [64, 62, 5] 存在するが, 追加の妥当性制約を課すことによる潜在的なメリットを直接的に調査するユーザスタディは存在していない。 0.65
Thus, we perform a well-powered user study analyzing the performance of novice users when receiving closest CFEs exclusively defined via their proximity to the decision boundary, compared to computationally plausible CFEs as feedback in an iterative learning design [4, 5]. そこで本研究では,決定境界に近接して排他的に定義された最寄りのCFEを,反復学習設計におけるフィードバックとして計算可能なCFEと比較して,初級ユーザの性能解析を行う。 0.78
2 Counterfactual Explanations as a Psychologically Grounded Solution for XAI XAIの心理的根拠としての2つの対策 0.67
A major challenge for XAI is the lack of a common, straight-forward and universally applicable definition of what constitutes a good explanation. XAIの大きな課題は、よい説明を構成するものについて、共通でまっすぐで普遍的に適用可能な定義がないことである。 0.63
To complicate matters, the effectiveness of an approach may depend on the reason for explaining [1], as well as pre-existing knowledge and experiences of users at the receiving end [68]. 課題を複雑にするために、アプローチの有効性は[1]を説明する理由と、 [68] 受信終了時のユーザの知識や経験に依存している可能性がある。 0.79
In search of truly human-usable explanation modes, the XAI community recognized the need to bridge the gap between psychology and computer science in order to draw inspiration from how humans explain in their daily social interactions [50]. そこで,XAIコミュニティは,人間とコンピュータ科学のギャップを埋めることの必要性を認識し,人間の日常生活における説明の仕方からインスピレーションを得た。
訳抜け防止モード: 真の人間-有用な説明方法を探究する上で,XAIコミュニティはニーズを認識した 心理学とコンピュータ科学のギャップを埋めるために 毎日の社会交流の仕方から インスピレーションを得るためです [50]
0.81
A central insight from classical psychological literature is that human explanations are typically contrastive: They emphasize (explicitly or implicitly) why a specific outcome occurred instead of another [50, 43, 45, 31]. 古典心理学の中心的な洞察は、人間の説明は典型的には対照的である: 特定の結果が他の[50, 43, 45, 31]ではなくなぜ生じたのか(厳密にも暗黙的にも)強調する。 0.70
This contrastive nature relates to the more general human tendency to reflect upon past events by generating possible alternatives, i.e., counterfactual thinking [59]. この対照的な性質は、過去の出来事を反映するより一般的な人間の傾向、すなわち、対実的思考[59]を発生させることに関係している。 0.60
Empirical evidence demonstrates that humans show this what-if mentality spontaneously [27], and increasingly when facing negative outcomes or unexpected results [61]. 実証的な証拠から、人間はこのことを自発的に[27]に感じ、ネガティブな結果や予期せぬ結果に直面するとますます現れることが示されている[61]。 0.53
In their functional theory of counterfactual thinking, Roese and Epstude suggest a crucial role of counterfactual thoughts to guide to formation of future intentions, thus regulating subsequent behavior [60, 24]. 反実的思考の関数的理論において、ローゼとエプストードは、反実的思考が将来の意図の形成に導く重要な役割を示唆し、その後の行動 [60, 24] を規制する。 0.73
This evidence is the root for the common supposition in XAI that explanations formulated as counterfactuals are naturally intuitive, easy to understand, and helpful for users, often discounting the need for user evaluations [66, 17, 28, 5]. この証拠は、反事実として定式化された説明が自然に直感的であり、理解しやすく、ユーザに役立つというxaiの一般的な仮定の根源であり、しばしばユーザ評価の必要性を下げている [66, 17, 28 5]。 0.69
Decades of philosophical and psychological research has concerned itself with the question of how humans generate counterfactuals. 何十年もの間、哲学的、心理学的な研究は、人間が反事実をいかに生み出すかという問題に関わってきた。 0.47
Lewis’ seminal work on the topic builds on a theory of possible worlds, postulating that counterfactual statements trigger a comparison between the actual circumstances and a conceivable world in which the counterfactual statement occurred [41]. この話題に関するルイスの独創的な研究は、可能世界の理論に基づいており、反事実的言明が実際の状況と反事実的言明が生じた想像可能な世界の比較を引き起こすと仮定している [41]。 0.66
Embedding this view into a cognitive framework of counterfactual thought, the mental models theory emphasizes the human ability to entertain two parallel representations of reality: The factual conditional, corresponding to the true state of the world, and the concurrent non-factual possibility, temporarily assumed to be true [13, 11, 33, 70]. この考え方を反事実的思考の認知的枠組みに組み込むと、メンタルモデル理論は、現実の2つの平行表現を楽しませる人間の能力を強調している: 現実条件は世界の真の状態に対応し、同時に非事実的可能性は一時的に真であると仮定される [13, 11, 33, 70]。 0.80
Insights from neuroimaging support this notion, demonstrating that counterfactual thinking extends mere hypothetical deliberation by recruiting additional representational processes in the brain [38]. ニューロイメージングからの洞察はこの概念を支持し、反事実的思考が脳内の追加の表現過程を採用することによって仮説的熟考を拡張することを証明している[38]。
訳抜け防止モード: 神経画像からの洞察はこの概念を支持する。 反事実的思考が脳内の別の表現過程を 採用することによって 仮説的熟考を 延長することを示す[38]
0.60
When humans generate counterfactuals, they show remarkable regularities in terms of which aspects of the past they reconstruct. 人間がカウンターファクトアルを生成すると、過去のどの側面を再構築するかという点で顕著な規則性を示す。 0.54
Humans tend to modify events that are recent [49, 12], exceptional, while also regarding the optimal counterfactual outcome [34, 22], and controllable events when undoing of fictitious outcomes [25]. 人間は、最近の[49, 12]、例外的な事象を修正する傾向があり、また、最適対実結果[34, 22]や、架空の結果[25]を解き放つと、制御可能な事象も修正する傾向にある。
訳抜け防止モード: 人間は出来事を変える傾向がある 最近[49, 12] 例外的です また 最適対実結果[34, 22]についても 虚偽の結果を解き放つと 制御可能な出来事を
0.67
Further, authors like to note that humans produce plausible rather than implausible counterfactuals [14, 20]. さらに著者は、人間は目立たない反事実[14, 20]ではなく、妥当な結果を生み出すことを好んでいる。
訳抜け防止モード: さらに著者は 人間は目立たない偽物[14, 20]よりも、説得力のあるものを作る。
0.69
However, despite being a commonly-used notion in psychology, plausibility is difficult to define precisely. しかし、心理学において一般的に用いられる概念であるにもかかわらず、正確な定義は困難である。 0.58
Variable interpretations of what constitutes a plausible counterfactual exist, referring to different partially overlapping concepts. 何を構成するかの様々な解釈があり、異なる部分的な重なり合う概念を参照している。 0.63
Kahneman and Tversky refer to hypothetical events as plausible if they are easy to imagine [34]. Kahneman と Tversky は、仮定的な事象が[34] を想像し易いと仮定できると言及している。 0.65
Lewis supposes that Lewis (複数形 Lewiss) 0.52
2 2 0.42
英語(論文から抽出)日本語訳スコア
plausible counterfactuals come from worlds that are minimally different from reality [41]. 現実と最小限に異なる世界[41]から 起こりうるカウンターファクトが生まれます 0.69
Building up on this idea of comparative similarity, empirical research shows perceived plausibility of a counterfactual event to be proportional to the perceived similarity between said counterfactual and the factual state [65, 19]. 比較類似性というこの考えに基づき、実証的研究は、反事実事象の妥当性が、その反事実と事実状態の認識類似性に比例することを示している[65,19]。 0.73
In addition to such a similarity-based definition, plausibility is often used synonymously with concepts of likeliness or probability [56, 18]. このような類似性に基づく定義に加えて、実用性はしばしば類似性や確率 [56, 18] の概念と同義的に用いられる。 0.77
De Brigard et al demonstrate that manipulations of counterfactual plausibility in terms of their likeliness changes their neural representation [18]. De Brigard et al は、その類似性の観点から反ファクト的妥当性の操作が神経表現を変えることを実証している[18]。 0.57
Their findings may indicate greater affective evaluation for counterfactuals that carry greater subjective likelihood, and thus, plausibility. 以上の結果から, 主観的可能性が高く, その妥当性が示唆された。 0.46
In their plausibility analysis model, Connell and Keane expand on the idea of plausibility as probability and highlight the pivotal role of pre-existing domain knowledge, postulating that a scenario may only be plausible if it fits well to prior knowledge [16]. 可能性分析モデルにおいて、connell氏とkeane氏は、確率として可能性の概念を拡張し、事前の知識に適合する場合にのみシナリオが実現可能であると仮定し、既存のドメイン知識の重要な役割を強調している [16]。 0.69
Thus, while it is difficult to pinpoint exactly what makes a counterfactual psychologically plausible, we may recognize pivotal roles of concepts like comparative similarity and probability. したがって、反事実的心理的に妥当な理由を正確に特定することは困難であるが、比較類似性や確率といった概念の重要な役割を認識できる。 0.60
Following the user-centered focus on explainability proposed by Miller [50], incorporating these concepts would be an important step towards automatic generation of plausible, and thus more human-friendly and usable, CFE. Miller氏 [50] が提案した説明可能性にユーザ中心で焦点を合わせると、これらの概念を取り入れることは、可塑性の自動生成への重要なステップとなるでしょう。 0.73
3 Computation of Closest CFEs and Plausible CFEs Wachter et al introduce a CFE (cid:126)xcf ∈ Rd of an ML model h : Rd → Y as an optimization problem [69] : 3 MLモデルh : Rd → Y の CFE (cid:126)xcf ∈ Rd を最適化問題として導入する。 0.50
(cid:96)(cid:0)h((ci d:126)xcf), y(cid:48)(cid:1) + C · θ((cid:126)xcf, (cid:126)x) (cid:96)(cid:0)h((ci d:126)xcf), y(cid:48)(cid:1) + C · θ((cid:126)xcf, (cid:126)x) 0.44
arg min (cid:126)xcf ∈ Rd arg min (cid:126)xcf ∈ Rd 0.48
(1) where (cid:126)x ∈ Rd denotes the original input, the regularization θ(·) penalizes deviations from the original input (cid:126)x (weighted by a regularization strength C > 0), y(cid:48) ∈ Y denotes the requested output/behavior of the model h(·) under the counterfactual (cid:126)xcf, and (cid:96)(·) denotes a loss function penalizing deviations from the requested prediction. 1) (cid:126)x ∈ Rd が元の入力を表す場合、正規化 θ(·) は元の入力 (cid:126)x (正規化強度 C > 0 で重み付けされている) から逸脱を罰し、y(cid:48) ∈ Y は反実数 (cid:126)xcf) の下でモデル h(·) の要求出力/挙動を示し、 (cid:96)(·) は要求された予測から逸脱を罰する損失関数を表す。 0.74
Thus, computing CFEs translates to finding minimal perturbations to a model’s input that alter the final prediction to a desired outcome. したがって、CFEの計算は、最終的な予測を望ましい結果に変更するモデルの入力に最小限の摂動を求めることに変換される。 0.71
Given the regularization term θ(·), generated CFEs based on this definition remain as close to the original input (cid:126)x as possible. 正規化項 θ(·) が与えられると、この定義に基づく生成cfeは元の入力 (cid:126)x に可能な限り近いままである。 0.63
Thus, we will refer to them as closest CFEs for the remainder of this work. したがって、この研究の残りの部分において、これらを最も近いCFEと呼びます。 0.58
As one of the first approaches to model CFEs for classical ML, Equation 1 is the forerunner of more powerful, model specific variations, as well as many methods for solving these optimization problems [67, 3, 35]. 古典的MLのためのCFEをモデル化するための最初のアプローチの1つとして、方程式 1 はより強力でモデル固有のバリエーションの先駆者であり、これらの最適化問題を解決する多くの方法 [67, 3, 35] である。 0.75
However, it is important to note that closest CFEs do not necessarily yield plausible or even realistic counterfactuals. しかし、最も近いCFEが必ずしも妥当あるいは現実的な反事実をもたらすとは限らないことに注意する必要がある。 0.63
As a matter of fact, closest CFEs may look like adversarials, introducing slight changes in the input that go unnoticed by a human observer despite altering the model’s output [54]. 実のところ、最も近いCFEは敵に似ていて、モデルの出力を変えても人間の観察者が気づかない入力にわずかな変更を加えています [54]。 0.66
Whether a computed closest CFEs corresponds to such an adversarial depends on the model, loss function and regularization, diminishing their suitability as explanation technique [40]. 計算された最も近いCFEがそのような逆数に対応するかどうかは、モデル、損失関数、正規化に依存し、説明手法としての適合性を低下させる[40]。
訳抜け防止モード: 計算された最も近いCFEがそのような逆数に対応するかどうか モデル、損失関数、正規化に依存します 説明手法としての適性を低下させます [40]
0.65
Expanding the original definition in Eq (1) by an additional plausibility constraint circumvents these issues: Eq (1)における元の定義を追加の可視性制約によって拡張することは、これらの問題を回避します。
訳抜け防止モード: Eq ( 1 ) における元の定義を追加の可算性制約により拡張する これらの問題を回避します
0.63
(cid:96)(cid:0)h((ci d:126)xcf), y(cid:48)(cid:1) + C · θ((cid:126)xcf, (cid:126)x) (cid:96)(cid:0)h((ci d:126)xcf), y(cid:48)(cid:1) + C · θ((cid:126)xcf, (cid:126)x) 0.44
s.t. (cid:126)xcf ∈ P s.t. (cid:126)xcf ∈ P 0.41
arg min (cid:126)xcf ∈ Rd arg min (cid:126)xcf ∈ Rd 0.48
(2) where P denotes the set of all plausible CFEs. (2) ここで P はすべての可算 CFE の集合を表す。 0.57
Similar to the modeling of closest CFEs in Equation 1, different realizations of these computationally plausible CFEs have been proposed [46, 57, 4]. 方程式 1 における最も近い CFE のモデリングと同様に、これらの計算可能な CFE の異なる実現法が提案されている [46, 57, 4]。 0.75
One particular instance are density based approaches [4] that restrict a counterfactual (cid:126)xcf to regions of high density (e g , estimated from the training data). 特定の例としては、逆(cid:126)xcfを高密度領域(トレーニングデータから推定)に制限する密度ベースアプローチ[4]がある。 0.75
In the current work, we follow an alternative approach when providing computationally plausible CFEs and limit the set of possible counterfactuals to the training data as a representative set of feasible examples [57]. 本研究は,計算可能なCFEを提供する場合の代替手法を踏襲し,実現可能な例の代表的な集合としてのトレーニングデータに反事実のセットを限定する[57]。 0.79
4 Do Novice Users Profit from Computational Plausibility in an Abstract Domain? 4 初心者は抽象ドメインにおける計算可塑性から利益を得るか? 0.65
The guiding question of the current work is whether computationally plausible CFEs have an advantage over closest CFEs in helping users to learn from an ML model. 現在の研究の指針は、計算可能なCFEが、ユーザーがMLモデルから学ぶのを助ける上で、最も近いCFEよりも有利であるかどうかである。
訳抜け防止モード: 現在の作業の指導的課題は 計算的にもっとも有効なCFEは、MLモデルから学習するのを助ける上で、最も近いCFEよりも有利である。
0.70
To assess this question, we rely on an interactive iterative learning task, where users repeatedly choose input values for an ML model. この課題を評価するために,MLモデルの入力値をユーザが繰り返し選択するインタラクティブな反復学習タスクを頼りにしている。 0.82
In a separate study, we successfully demonstrate the added benefit of providing closest CFEs compared to no explanation given this experimental framework [37]. 本研究は,本実験フレームワーク [37] に比較して,最も近いCFEを提供することによる付加的なメリットを実証した。 0.82
In the current work, users receive either computationally plausible or closest CFEs, highlighting how changes in the user’s previous input would have lead to better results. 現在の作業では、ユーザーは計算可能か最も近いCFEを受け取り、ユーザーの以前の入力の変化がより良い結果をもたらすことを強調している。 0.79
The main advantage of this approach is that the interplay between repeated user action and corrective feedback enables us to assess user understanding at each stage of the process objectively through task performance. このアプローチの主な利点は、繰り返しユーザーアクションと修正フィードバックの相互作用により、タスクパフォーマンスを通じてプロセスの各段階におけるユーザ理解を客観的に評価できる点である。 0.83
We find it conceivable that implementing a plausibility constraint indeed improves user performance. 可視性制約を実装することでユーザパフォーマンスが向上すると考えられる。 0.74
Specifically, we assume that repeated exposure to items representative of the training set enables humans to build a more accurate 具体的には、トレーニングセットを表すアイテムに繰り返し露出することで、人間がより正確に構築できると仮定する。
訳抜け防止モード: 具体的には トレーニングセットに代表される項目に繰り返し露出することで、人間がより正確に構築できる
0.85
3 3 0.42
英語(論文から抽出)日本語訳スコア
Figure 1: General overview of study procedure. 図1: 研究手順の概要。 0.63
(a) The Alien Zoo game is an iterative design with blocks containing two trials calling for user input, and finishing with a feedback scene that provides either closest or computational plausible CFEs computed on user’s previous input. (a)Alien Zooゲームは、ユーザ入力を要求する2つのトライアルを含むブロックを含む反復的なデザインであり、ユーザの以前の入力に基づいて計算された最も近いまたは計算可能なCFEを提供するフィードバックシーンで終了する。 0.74
(b) After 6 blocks, users enter a post-game survey collecting self-report information from participants. (b)6ブロック後、参加者から自己申告情報を収集したゲーム後調査に登録する。 0.70
Likert-scale items adapted from [32]. 32] から適応した likert-scale 項目。 0.64
Catch item marked in light gray. 明るい灰色でマークされたキャッチアイテム。 0.63
The lower part of both subfigures shows measures evaluates from respective parts; † objective measure, ‡ subjective measure. どちらの部分も下段は各部分から評価される指標、すなわち客観的測度、主観的測度を示す。 0.67
mental model of the underlying data distribution. 基礎となるデータ分布の精神モデルです 0.78
To obtain general insights about the usability of different types of CFEs as such, we recruited novice users and designed the task around an abstract scenario. 各種CFEのユーザビリティに関する一般的な知見を得るために,初級ユーザを募集し,抽象シナリオを中心にタスクを設計した。 0.77
This approach has the additional advantage to mitigate any difference in domain knowledge and possible misconceptions about the task setting, potentially confounding task performance [68]. このアプローチには、ドメイン知識の違いやタスク設定に関する誤解の可能性、潜在的にタスクパフォーマンスを混乱させる可能性がある[68]を緩和する、追加の利点があります。
訳抜け防止モード: このアプローチには、ドメイン知識の違いを緩和する追加の利点があります。 タスク設定に関する誤解の可能性があり、タスクパフォーマンスを損なう可能性がある [68 ]。
0.60
Thus, we formulated the following three hypotheses. そこで,以下の3つの仮説を定式化した。 0.56
Hypothesis 1. We expect computationally plausible CFEs to be more helpful to users tasked to discover unknown relationships in data than closest ones, both objectively and subjectively. 仮説 1. 計算可能なcfeは、客観的にも主観的にも、最も近いデータから未知の関係を発見するのに、より役に立つと期待する。 0.58
Specifically, we anticipate that participants in the plausible condition 具体的には 有望な状態の参加者は 0.67
a) show greater learning success, a) より大きな学習成功を示す 0.86
b) become more automatic and thus quicker in the task, and b) より自動化され、したがって、そのタスクがより速くなる 0.78
c) are able to explicitly identify relevant and irrelevant input features. c) 関連性及び無関係な入力特徴を明確に特定することができる。 0.73
Hypothesis 2. We expect a group difference in terms of subjective understanding. 仮説2 主観的理解の観点からのグループ差を期待する。 0.64
We predict that users will differ in how far they find CFEs useful, and in how far they can utilize them, with an advantage of computationally plausible CFEs. 我々は,ユーザがCFEがどの程度有用か,どの程度有効か,計算に有効なCFEの利点を活かすことができるかを予測した。 0.74
Furthermore, we posit that users imagine computationally plausible CFEs to be more helpful for other users. さらに,計算可能なCFEが他のユーザにとってより役に立つと仮定する。 0.78
Hypothesis 3. We evaluate users’ understanding of the explanations themselves, their need for support to understand, and their evaluation of timing and efficacy of CFE presentation. 仮説3 ユーザによる説明そのものの理解,理解支援の必要性,CFE プレゼンテーションのタイミングと有効性の評価について検討する。 0.73
As structure and presentation mode of CFEs is kept constant across conditions, we expect not to find any differences. CFEの構造と提示モードは条件によって一定に保たれているので,違いは見つからないだろう。 0.75
This analysis tests the comparability of conditions, a key feature in any experimental user design. この分析は、実験的なユーザ設計において重要な特徴である条件のコンパラビリティをテストする。 0.68
Finally, we do not formulate a prediction whether groups will differ in uncovering inconsistencies in the explanations presented. 最後に、提示された説明の不一致を明らかにする際に、グループが異なるか否かの予測を定式化しない。
訳抜け防止モード: 最後に、予測を定式化しない。 グループは、提示された説明の矛盾を明らかにする点で異なるでしょう。
0.60
This will be investigated in an additional exploratory analysis. これはさらなる探索的な分析で研究される。 0.79
5 Experimental Design To assess Hypotheses 1–3, we use a novel iterative learning design revolving around an abstract scenario. 5 実験設計 仮説1-3を評価するために,抽象シナリオを中心に展開する新しい反復学習設計を用いる。 0.79
Figure 1 conveys the overall two-part structure of the study. 図1は、研究全体の2つの部分構造を伝達します。 0.66
4 Plausible Alien Zoo Game(6 blocks á2 trials)Structure of 1 block:Post-Game Survey1sttrial in block (user input)time2ndtrial in block (user input)Progress sceneProgress sceneFeedback scene (CFE presentation)Pre-fee dback sceneMultiple choice items:1. 4 プルーサブル・エイリアン・ズー・ゲーム(6ブロック á2トライアル)1ブロック:post-game survey1sttrial in block (ユーザー入力)time2ndtrial in block (ユーザー入力)progress sceneprogress scenefeedback scene (cfeプレゼンテーション)pre-feedback scenemultiple choice items:1. ] 関連スポンサーコンテンツ 0.65
Which plants were relevant to increase pack size? どの植物がパックサイズを増やすのか? 0.74
2. Which plants were not relevant to increase pack size? 2. どの植物がパックサイズを増やそうとしなかったのか? 0.56
Likert-scale items:3. “I understood the feedback.”4. 等級:3。 「フィードバックは理解しました。」4。 0.49
“I needed support to understand the feedback.”5. 「フィードバックを理解するためにはサポートが必要でした。」5。 0.67
“Feedback helped me.”6. フィードバックが助けてくれました。 0.64
“I was able to use the feedback.”7. 「フィードバックは使えました。」7。 0.62
“Please select 'I prefer not to answer’.”8. 「私は答えたくない」と選びます。」8。 0.66
“I found inconsistencies in the feedback.”9. 「フィードバックの矛盾がわかりました。」9。 0.77
“Most people would quickly learn to work with the feedback.”10. 「ほとんどの人はすぐにフィードバックで作業することを学びます。」10。 0.74
“Feedback was presented timely and efficiently.”Demographic information:•Gender•AgeTask performance(pack size)†Decisiontime†Self-reports‡Demographicdataab 予測情報:•gender•agetaskパフォーマンス(パックサイズ) --decisiontime-self- reports-demographicd ataab 0.62
英語(論文から抽出)日本語訳スコア
5.1 The Alien Zoo Scenario 5.1 エイリアン動物園シナリオ 0.73
We developed a game-like experimental design, the Alien Zoo [37]. ゲームライクな実験デザインであるAlien Zoo[37]を開発した。 0.80
It relies on a web-based interface to provide global access for users from diverse backgrounds, facilitating large-scale participant recruitment. さまざまなバックグラウンドを持つユーザに対してグローバルなアクセスを提供するために、Webベースのインターフェースに依存しており、大規模な参加採用を促進する。 0.55
For a detailed account of the framework’s conception and the rationale behind the corresponding design choices, see Kuhl et al [37]. フレームワークの概念と対応する設計選択の根拠に関する詳細な説明については、kuhl et al [37]を参照してください。 0.69
In the Alien Zoo scenario, participants imagine themselves as zookeepers for aliens. エイリアン動物園のシナリオでは、参加者は自分がエイリアンの動物園キーパーだと想像します。 0.48
To feed to the aliens, participants may choose from different plants. エイリアンに餌を与えるために、参加者は異なる植物から選ぶことができる。 0.57
However, it is not clear what plants make up a nutritious diet. しかし、どの植物が栄養食を作るのかは明らかではない。 0.74
Thus, participants need to find how to best feed the aliens. したがって、参加者はエイリアンを最もよく養う方法を見つける必要がある。 0.60
Participants go through several feeding cycles, choosing a combination of plants. 参加者は数回の摂食サイクルを経て、植物の組み合わせを選択します。 0.60
After each cycle, the pack of aliens either decreases (given a bad combination of plants) or increases (given a good combination). それぞれのサイクルの後、エイリアンの群れは減少する(植物を悪い組み合わせにする)か増加する(良い組み合わせを与える)。 0.70
In regular intervals, participants receive a summary of their past choices, together with feedback on what choice would have led to a better result (i.e. a CFE). 定期的に、参加者は過去の選択の要約を受け取り、どの選択がより良い結果(すなわちCFE)をもたらしたかをフィードバックする。 0.66
Assessing performance of real users in an abstract task setting, this use case corresponds to a human grounded evaluation [23]. 抽象的なタスク設定における実際のユーザのパフォーマンスを評価する場合、このユースケースは人間の接地評価に対応します [23]。
訳抜け防止モード: 抽象タスク設定における実ユーザの性能評価 このユースケースは 人間の根拠による評価[23]に対応する。
0.88
Further, our setting falls under the “explaining to discover” category for explainability defined by Adadi and Berrada, investigating whether providing CFEs to novice users improves their understanding of relationships in a yet unknown dataset [1]. さらに、私たちの設定は、Adadi と Berrada が定義した説明可能性に関する "説明的発見" カテゴリに該当し、初心者ユーザーに CFE を提供することで、未知のデータセットにおける関係に対する理解が向上するかどうかを調査する[1]。
訳抜け防止モード: さらに、私たちの設定は” 発見するために説明する」 Adadi と Berrada が定義した説明可能性のカテゴリー 初心者ユーザーにCFEを提供することで、未知のデータセット [1 ]における関係の理解が向上する。
0.72
5.2 Post-Game Survey A post-game survey collects self-report information from participants. 5.2 試合後調査 試合後調査は、参加者から自己報告情報を収集する。 0.57
Besides explicitly asking participants to point out which plants were relevant and irrelevant for the task, we use an adapted version of the System Usability Scale [32], designed to measure the quality of explanations elicited by an explainable ML system. 参加者に対して、どの植物がタスクに関連があり、無関係であるかを明示的に指摘することに加えて、説明可能なMLシステムによって引き起こされる説明の質を測定するために、システムユーザビリティ尺度[32]の適応版を使用します。 0.56
Participants answer a series of Likert-scale items, assessing how users feel about using our system with a focus on perceived understandibility and usability of CFEs. 参加者は一連のLikertスケールの項目に回答し、CFEの理解性とユーザビリティに焦点をあてて、ユーザがシステムの使用に対してどう感じているかを評価する。 0.61
The survey closes with asking for participants’ gender and age as potential confounding variables. 調査は参加者の性別と年齢を、潜在的に矛盾する変数として求めて終了する。 0.59
Figure 1b gives a complete overview of all items in the survey part, in the order participants encounter them. 図1bは、参加者が遭遇する順に、調査部分のすべての項目の完全な概要を示します。 0.77
5.3 Constructs and Measurements We measure understanding and usability of explanations in terms of two objective behavioral variables and several subjective self-reports (Figure 1 bottom). 5.3 構成と測定 2つの客観的行動変数と複数の主観的自己報告(図1のボトム)を用いて説明の理解と使用性を測定した。 0.71
Regarding task performance, we assess the development of pack size in the Alien Zoo game over trials. 課題性能について,エイリアンゾウゲームにおけるパックサイズの開発を試行錯誤で評価した。 0.65
This value indicates the extent of user’s understanding of relevant and irrelevant features in the underlying data set, as a solid understanding leads to better feeding choices. この値は、ユーザによる、基礎となるデータセットにおける関連性と無関係な機能に対する理解の範囲を示している。 0.63
Second, we measure time needed to reach a feeding decision over trials (henceforth referred to as decision time). 第2に,試行錯誤による摂食決定に要する時間(決定時間)を測定した。
訳抜け防止モード: 第2に 必要な時間を計測し 試験(以下、判定時間という)による給餌決定に達する。
0.69
As we assume participants to become more automatic in making their plant choice, we expect this practice effect to be reflected as decreased decision time [44]. 参加者が植物の選択をより自動化すると仮定すると,この実践効果は,意思決定時間の短縮 [44] として反映されることを期待する。 0.74
We acquire self-reports via the post-game survey, assessing different aspects of participant’s system understanding. 我々は,ゲーム後の調査を通じて自己報告を取得し,参加者のシステム理解のさまざまな側面を評価する。 0.61
The first two survey items ask users to identify plants they think are relevant and irrelevant for task success. 最初の2つの調査項目は、ユーザに対して、タスク成功と無関係であると思われる植物を特定するように求めている。
訳抜け防止モード: 最初の2つの調査項目は タスク成功に関連し、無関係であると考える植物を特定する。
0.69
Replies from these items allow us to measure to which extent users in different groups formed explicit knowledge of the underlying data structure. これらの項目からの回答により、異なるグループのユーザが基盤となるデータ構造について明示的な知識を形成する程度を測定することができる。 0.63
Further, users indicate in how far they find the explanations useful, to which degree they can make use of them, and in how far they imagine the presented CFEs to be helpful for other users, too. さらに、ユーザーは、説明がどの程度役に立つか、どの程度に使えるか、そして提示されたCFEが他のユーザーにとってもどれだけ役に立つかを示す。 0.64
These items assess user’s subjective understanding. これらの項目はユーザの主観的理解を評価する。 0.61
Finally, three self-report measures check for potential confounds. 最後に、3つの自己報告手段が潜在的なコンファクトをチェックする。 0.39
These are items that ask users to indicate their understanding of the explanations as such, whether they feel the need for support for understanding, and their evaluation of timing and efficacy of CFE presentation. これらの項目は,ユーザに対して,理解支援の必要性を感じているかどうか,CFEプレゼンテーションのタイミングと有効性について,説明を求めるものである。 0.79
Given that structure and presentation mode of CFEs is kept constant for both groups, differences would uncover unexpected variation in terms of answer style, a potential confounding variable. cfeの構造とプレゼンテーションモードが両方のグループで一定であることを考えると、違いは潜在的な共起変数である回答スタイルの観点から予期せぬ変動を明らかにすることになる。
訳抜け防止モード: cfeの構造と表現モードが両群とも一定である。 違いは、潜在的な共起変数である回答スタイルの観点から予期しない変化を明らかにするだろう。
0.72
5.4 Implementation, ML Model and Data Set 5.4 MLモデルとデータセットの実装 0.53
The back end of the system is written in Python3, using the sklearn package [55] for the ML part. システムのバックエンドはPython3で書かれており、ML部分のsklearnパッケージ[55]を使用している。 0.84
The front end employs the JavaScript-based Phaser 3, an HTML5 game framework1. フロントエンドはjavascriptベースのphaser 3、html5ゲームフレームワーク1を使用している。 0.65
We use a decision tree regression model for predicting the growth rate given the plants selected by the user. 決定木回帰モデルを用いて,ユーザが選択した植物の成長率を予測する。 0.78
Decision trees approximate the data distribution with a collection of if-then-else rules, consecutively splitting the data [63]. 決定木は、データ分布をif-then-elseルールの集合で近似し、データを連続的に分割する[63]。 0.70
We choose a decision tree because computing counterfactuals for this model is fairly simple [3]. 我々は決定木を選択する。なぜなら、このモデルに対するカウンターファクトの計算はかなり単純であるからだ [3]。
訳抜け防止モード: 決定木を選ぶのは このモデルの反事実の計算は、かなり単純です [3 ]。
0.74
Yet, it is powerful enough to model our synthetic data set sufficiently well. しかし、私たちの合成データセットを十分にモデル化できるほど強力です。 0.81
The current implementation uses the Gini splitting rule of CART [10], with a maximum tree depth of 4. 現在の実装では、CART[10]のGini分割ルールを使用し、最大木深さは4。 0.68
The decision tree 1https://phaser.io/ 決定木 1https://phaser.io/ 0.37
5 5 0.42
英語(論文から抽出)日本語訳スコア
corresponding to the ground truth model is build once in the beginning and remains the same for all users during the study. 基礎的真理モデルに対応するものは、はじめに一度構築され、研究期間中はすべてのユーザで同じです。 0.75
We use the code provided by the CEML package [2] for computing CFEs.2 CFEの計算にはCEMLパッケージ[2]が提供するコードを使用します。 0.81
In the interest of reproducible research, all source code, acquired user data, and evaluation scripts of the current study are available.3 再現可能な研究のために、すべてのソースコード、取得したユーザデータ、および現在の研究の評価スクリプトが利用可能である。 0.68
The underlying data set used for tree building consists of 5 integer features (i.e., the plants used for feeding) and 1 continuous output variable (i.e., the growth rate used as factor for computing the new pack size). ツリー構築に使用される基礎となるデータセットは、5つの整数特徴(すなわち、給餌に使用される植物)と1つの連続出力変数(すなわち、新しいパックサイズを計算するために使われる成長率)からなる。 0.84
We generated this data according to the following scheme: The growth rate scales linearly with plant 2, iff plant 4 has a value of 1 or 2 OR plant 5 is not smaller than 4. 植物2,iffプラント4が1または2の値を持つ場合,植物5が4より小さい場合,成長速度は線形にスケールする。
訳抜け防止モード: このデータは以下の図式に従って 成長速度は植物2と線形にスケールする。 iff植物4は1または2の値を持ち、植物5は4より小さい値である。
0.78
Growth rate may take a value between 0 and 2, used as a factor for pack size in the previous round to compute the new pack size. 成長速度は0から2の間の値を取る可能性があり、新しいパックサイズを計算するために前回のラウンドにおけるパックサイズの係数として使われる。 0.67
The initial full data set contains all possible plant – growth rate combinations 100 times, yielding 3 276 800 data points. 最初の完全なデータセットには、可能なすべての植物が含まれている - 成長率の組み合わせは100回、データポイントは3276 800である。 0.59
For final model training, we sample a subset of 10 922 data points from this full set to introduce sparsity, thus ensuring that computed closest and computationally plausible CFE diverge. 最終モデルトレーニングでは、この完全集合から10922個のデータポイントのサブセットをサンプリングし、スパーシティを導入し、計算に最も近い計算可能なCFEの分岐を保証する。 0.72
Note that our implementation prevents pack size from shrinking below 2. 私たちの実装は、パックサイズが2以下に縮むのを防ぐことに注意してください。 0.50
5.5 Participants The study ran in early November 2021 on Amazon Mechanical Turk (AMT). 5.5 参加者 この研究は2021年11月初旬にAmazon Mechanical Turk (AMT)で実施された。 0.59
After piloting, we recruited a total of 100 participants for final assessment, following an a priori sample size estimation [39]. パイロット試験後,予備標本サイズ評価[39]に従って,100名の参加者を最終評価対象として募集した。 0.78
A first data quality check revealed corrupted data for four participants due to logging issues. 最初のデータ品質チェックでは、ログ問題による4人の参加者の不正なデータが明らかになった。 0.59
Thus, we acquired four additional data sets. その結果,新たに4つのデータセットを得た。 0.55
All participants gave informed electronic consent by providing clickwrap agreement prior to participation. 参加者全員が参加前にclickwrap協定を提供することで電子的同意を得た。 0.66
All participants received a reward of US$ 4 for participation. 参加者全員に4ドルの賞金が贈られた。 0.68
The ten best performing users received an additional bonus of US$ 2. 最高パフォーマンスの10名のユーザーには、追加のボーナスが2ドルだった。 0.69
Game instructions informed participants about the possibility of a bonus to motivate compliance with the experimental task [7]. ゲームインストラクションは、実験タスクの遵守を動機づけるボーナスの可能性について参加者に通知した [7]。 0.67
The study was approved by the Ethics Committee of Bielefeld University, Germany. この研究はドイツのビーレフェルト大学の倫理委員会によって承認された。 0.65
5.6 Experimental Procedure After accepting the task on AMT, participants are forwarded to our web server hosting the alien zoo game. 5.6実験方法 AMTでのタスクを受諾した後、参加者はエイリアン動物園ゲームをホストするWebサーバに転送されます。 0.66
They first encounter a page informing them about purpose, procedure and expected duration of the study, their right to withdraw, confidentiality and contact details of the primary investigator. 彼らはまず、研究の目的、手続き、期待された期間、撤回する権利、秘密性、一次調査員の接触の詳細を知らせるページに遭遇する。 0.65
Users may decline to participate by closing this window. ユーザーはこのウィンドウを閉じることで参加を辞退することができる。 0.62
Otherwise, they indicate their agreement via button press, opening a new page. そうでなければ、ボタンを押して新しいページを開くことで合意を示す。 0.72
Unbeknownst to the user, they are randomly assigned to either the closest or the plausible condition when they indicate agreement. ユーザには知られていないが、合意を示すとき、最も近い条件または妥当な条件にランダムに割り当てられる。 0.66
The succeeding page provides detailed instructions to the game. 続くページはゲームに詳細な指示を与える。 0.73
Specifically, it shows images of the aliens, as well as the selection of plants they may choose to feed from. 具体的には、異星人の画像と、それらが与える可能性のある植物の選択を表示する。 0.69
Written instructions detail that it is possible to choose up to six leaves per plant in whatever combination seems desirable, and that choosing healthy or unhealthy combinations leads to increases or decreases in pack size, respectively. 書面による説明では、植物1個につき最大6個の葉を望ましい組み合わせで選択でき、健康的または不健康な組み合わせを選択するとそれぞれパックサイズが増加するか減少する。 0.80
Further instructions emphasize the user’s task to maximize the number of aliens, so-called shubs, with the best players qualifying for a monetary bonus. さらなる指示は、最高のプレイヤーが金銭ボーナスの資格を持つ外国人(いわゆるシャブ)の数を最大化するユーザーのタスクを強調している。 0.66
Participants are also informed that they will receive feedback on what choice would have led to a better result after two rounds of feeding. 参加者は2回の食事の後、どのような選択がより良い結果をもたらしたか、フィードバックを受け取ることも知らされる。 0.70
Users begin the game by clicking a “Start” button, appearing with a delay of 20s at the end of the page. ボタンをクリックすると、ページの最後に20秒遅れて表示される。
訳抜け防止モード: ユーザーはゲームを開始する ボタンをクリックすると、ページの最後に20秒遅れて表示される。
0.61
Upon hitting “Start”, participants encounter a padlock scene where they can make their feeding choice (Figure 2, top left image). Start”を打つと、参加者はパドロックシーンに遭遇し、給餌を選択できる(図2、左上の画像)。 0.58
The right side of the screen displays leaves from all plant types next to upward/downward arrow buttons. 画面の右側には、上から下への矢印ボタンの横にあるすべての植物種の葉が表示される。
訳抜け防止モード: 画面の右側は 全ての植物の葉は上向きまたは下向きの矢印ボタンの横にある。
0.79
In the first feeding round, the top of the page shows written information that clicking on the upward arrows increases the number of leaves per plant, while clicking the downward arrows has the reverse effect. 第1のフィードラウンドでは、ページの上部に、上向きの矢印をクリックすると植物1本あたりの葉の数が増えるという文書情報が表示され、下向きの矢印をクリックすると逆の効果がある。 0.65
In each succeeding feeding round, the top of the page shows the current pack size, the pack size in the previous round, and the choice made in the previous round. 後続のフィードラウンドでは、ページのトップは現在のパックサイズ、前回のラウンドのパックサイズ、前回のラウンドにおける選択を示す。 0.57
The page additionally shows a padlock with the current number of animated shubs. さらにページは、現在のアニメーションのシャブ数でパドロックを表示する。 0.71
Each participant starts of with a pack of 10 aliens. 各参加者は10人のエイリアンの群れから始まる。 0.77
After making their choice, participants continue by clicking a button stating “Feeding time!” in the bottom right corner of the screen. 選択後、参加者は画面の右下隅に “feeding time!” と書かれたボタンをクリックする。 0.66
Upon committing their choice, a progress scene displaying the current choice of plants and three animated aliens is shown. 選択を行うと、現在の植物選択を示す進行シーンと3人のアニメーションエイリアンが表示される。 0.75
Meanwhile, the underlying ML model uses the user input to generate the new growth rate and pack size, together with either a closest or a computationally plausible CFE. 一方、基盤となるMLモデルでは、ユーザ入力を使用して新しい成長率とパックサイズを生成し、最も近いあるいは計算可能なCFEも生成する。 0.75
After 3s, the padlock scene appears again to show the results of their last choice. 3sの後、パドロックシーンが再び現れ、最後の選択の結果が表示される。 0.80
Following odd trials, the user may make a new selection. 奇異な試行の後、ユーザーは新しい選択をすることができる。 0.73
After even trials, a single “Get feedback!” button replaces the choice panel on the right-hand side of the screen. 試行錯誤のあとは、画面の右側にある選択パネルを“Get feedback!”ボタンで置き換える。 0.59
Hitting the feedback button forwards a user to an overview scene displaying the feeding choices in the last two runs, the resulting changes in pack size and the counterfactuals that indicate what choices would have led to better results. フィードバックボタンをフォワードすると、最後の2回の実行でフィードの選択、パックサイズの変化、どの選択がより良い結果をもたらしたかを示すカウンターファクトが表示されます。
訳抜け防止モード: フィードバックボタンの隠蔽 ユーザは、最後の2回の実行で、給餌選択を表示する概要シーンに進む。 結果として パックのサイズが変化し どんな選択がより良い結果をもたらしたかを示します
0.77
When users made a choice that led to maximal increase in pack size such that no counterfactual could be computed, they are told that they were close to an optimal solution in that round. ユーザがパックサイズを最大に増やして、反事実を計算できないようにすると、彼らはそのラウンドにおける最適なソリューションに近いと言われた。 0.64
Users may move on to the next round by hitting a “Continue!” button appearing after ユーザーは“Continue!”ボタンを押して次のラウンドに進むことができる。 0.75
2https://github.com/ andreArtelt/ceml 3https://github.com/ ukuhl/PlausibleAlien Zoo 2https://github.com/ andreArtelt/ceml 3https://github.com/ ukuhl/PlausibleAlien Zoo 0.16
6 6 0.43
英語(論文から抽出)日本語訳スコア
Figure 2: Exemplary user journey through the first block of the Alien Zoo game. 図2:エイリアン動物園ゲームの最初のブロックを通る模範的なユーザー旅。 0.81
Bold arrows indicate temporal succession of respective scenes. 折り矢は各場面の時間的継承を示す。 0.58
The figure highlights the iterative nature of the game with repeated user input and end-of-block presentation of CFEs. この図は、繰り返しユーザー入力とCFEのブロック終了表示でゲームの反復性を強調している。 0.71
Note that plant counters are set to 0 at the beginning of each padlock scene. 植物カウンターは各パドロックシーンの開始時に0に設定されていることに注意。 0.77
The figure displays the state after the exemplary user inserted their current choice. 図は、模範ユーザが現在の選択を挿入した後の状態を表示する。 0.71
For this manuscript, font size in images of scenes was increased to improve visibility. この写本では、画像のフォントサイズが増加し、視認性が向上した。 0.68
10s on the right-hand side of the screen. 画面の右側に10個ある。 0.62
This delay forces users to spend some time with the information to study it. この遅延により、ユーザーはその情報を調べるのにしばらく時間を費やすことになる。 0.65
Upon continuing, users make their new choice in a new padlock scene. 継続すると、ユーザーは新しいパドロックシーンで新しい選択をする。 0.67
The study runs over 12 feeding rounds (trials) with feedback interspersed after each second trial. この研究は12回以上実施され、第2回臨床試験の後にフィードバックが散りばめられた。 0.54
To ensure attentiveness of users during the game, we included two additional attention trials. ゲーム中のユーザの注意力を確保するために,さらに2つの注意試験を行った。 0.65
After feeding rounds 3 and 7, users face a new page requesting to type in the current number of aliens in their respective packs. 3回目と7回目の後、ユーザーはそれぞれのパックに現在のエイリアンの数を入力するよう要求する新しいページに直面します。 0.67
Immediate feedback informs participants whether their entry was correct or not, and reminds users to pay close attention to all aspects of the game at any given time. 即時のフィードバックは参加者に自分の入力が正しいかどうかを知らせ、ユーザーはいつでもゲームのあらゆる面に注意を払うように促す。 0.75
Subsequently, the next progress scene appears and the game continues. その後、次の進行シーンが現れ、ゲームが続く。 0.79
The game part of the study is complete after 12 trials. ゲームは12回の試験で完結した。 0.57
The experimental procedure concludes with a survey assessing user’s explicit knowledge on what plants were and were not relevant for improvement (items 1 and 2), as well as an adapted version of the System Causability Scale [32] evaluating the subjective quality of explanations. 実験手順は,主観的説明の質を評価するシステム・コーサビリティ尺度 [32] の適応版と同様に,どの植物が改良に関係していないかに関するユーザの明示的な知識を評価する調査で結論づけられた。 0.75
The study closes with two items assessing demographic information on gender and age. この研究は、性別と年齢に関する人口統計情報を評価する2つの項目で締めくくられている。 0.53
The final page thanks users for their participation and provides a unique code to insert in AMT to prove that they completed the study and qualify for payment. 最終ページは参加者に感謝し、amtにインサートするユニークなコードを提供し、研究の完了と支払いの資格を証明している。 0.63
Further, participants may choose to visit a debriefing page with full information on study objectives and goals. さらに、参加者は、研究目標と目標に関する完全な情報を持った報告ページを訪れることができる。
訳抜け防止モード: さらに参加者は 研究目的及び目標に関する完全な情報を備えた報告ページを訪問する。
0.81
7 This is your first run.Pleasemakeyourfi rstselectionwiththeb uttonsontheright.Sub mit by hitting ‘Feeding time!’. 7 これはあなたの最初の実行です。Pleasemakeyourfirsts electionwiththebutto nsontheright.Submit by hit ‘Feeding Time! 0.38
Feeding time! Feeding in progress…Feeding in progress…Your pack now consists of 13 Shubs.Before, it was 10. 餌時間! 進行中の食事... 進行中の食事... あなたのパックは 13のシャブで構成されています。 0.39
Last feeding choice:Feeding time! 最後の食事選択:食事時間! 0.70
Your pack now consists of 20Shubs.Before, it was 13. あなたのパックは現在20Shubsで構成されています。 0.58
Last feeding choice:Get feedback! 最後のフィーディング選択:フィードバックを得る! 0.71
Continue! In round 1, you selected:Result:Befo re: x 10After:x 13Your result would have been better if you had selected:In round 2, you selected:Result:Befo re: x 13After:x 20Congrats! 続けろ! シリーズ1では、あなたが選んだ:result:before: x 10after:x 13 あなたの結果は、あなたが選択した方が良い:第2ラウンドでは、あなたは:result:before: x 13after:x 20congrats!
訳抜け防止モード: 続けろ! ラウンド1では、あなたは選択した: Result : Before : x 10After : x 13Your result would be better if you selected? 第2ラウンドであなたは選んだ 結果 : before : x 13After : x 20Congrats !
0.78
You were close to an optimal solution in this round! あなたはこのラウンドで最適なソリューションに近かった! 0.82
英語(論文から抽出)日本語訳スコア
Table 1: Demographic information of participants. 表1:参加者の人口統計情報。 0.72
plausible U valuea 50 Before quality assurance measures (N = 100) closest 50 17f/33m 22f/26m/ 1nb/1na 25–34y 有望なu値50 品質保証措置(n = 100) 最接近50 17f/33m 22f/26m/1nb/1na 25–34y 0.29
N Genderb Age (Mdn)c a non-parametric Wilcoxon-Mann-Whitne y U test b f = female, m = male, nb = non-binary / gender non-conforming, na = no gender information disclosed c Mdn = median age band (options: 18-24y, 25-34y, 25-34y, 35-44y, 45-54y, 55-64y, 65y and over) N Genderb Age (Mdn)c a non-parametric Wilcoxon-Mann-Whitne y U test b f = female, m = male, nb = non-binary / gender non-conforming, na = no gender information revealed c Mdn = central age band (オプション: 18-24y, 25-34y, 25-34y, 35-44y, 45-54y, 55-64y, 65yなど)
訳抜け防止モード: N Genderb Age (Mdn)c a non-parametric Wilcoxon - Mann - Whitney U test b f = female, m = male, nb = non - binary / gender non - conforming, na = 性別情報を開示しない c Mdn = 中央値の年齢帯(オプション: 18 - 24y, 25~34y,25~34y,35~44y 45~54y,55~64y,65y以上)
0.72
p value . . .339 p 値。 . .339 0.40
1nb 35–44y 1nb 35-44y 0.20
After quality assurance measures (N = 74) closest 40 13f/27m 18f/15m/ 品質保証措置(N = 74) 最寄りの40 13f/27m 18f/15m/ 0.57
plausible U valuea 34 有望な u valuea 34 0.37
.. 554.4 p value . .. 554.4 p 値。 0.35
. .116 .. . .116 .. 0.40
1108 1234 .950 1108 1234 .950 0.41
25–34y 25–34y 25-34y 25-34y 0.38
712.5 .718 712.5 .718 0.34
On average, participants needed 13m:43s (± 00m:23s SEM) from accepting the HIT on AMT to inserting their unique payment code. 参加者は平均13m:43s (± 00m:23s SEM) を必要とし、AMT上のHITを受け入れて独自の支払いコードを挿入した。 0.61
5.7 Statistical Analysis, Sample Size Calculation and Data Quality Measures 5.7 統計解析,サンプルサイズ計算,データ品質測定 0.94
We perform all statistical analyses using R-4.1.1 [58], using CFE variant (closest or computationally plausible) as independent variable. R-4.1[58] を用いて全ての統計解析を行い,CFE変種を独立変数として用いた。 0.75
Changes in performance over 12 trials measure learning rate per group (lme4 v.4_1.1-27.1) [8]. 1グループあたりの学習率(lme4 v.4_1.1-27.1) [8]。 0.58
In the model testing for differences in terms of user performance, the dependent variable is number of aliens generated. ユーザパフォーマンスの違いに対するモデルテストでは、依存変数は生成される異星人の数である。 0.78
In the assessment of user’s reaction time, we use trialwise decision time as dependent variable. ユーザの反応時間のアセスメントでは、試行的な決定時間を依存変数として使用します。 0.81
The final models include fixed effects of group, trial number and their interaction. 最終モデルには、グループ、試行数、およびそれらの相互作用の固定効果が含まれる。 0.63
The random-effect structure includes a by-subjects random intercept. ランダム効果構造は、by-subjectsランダムインターセプトを含む。 0.63
Such linear mixed effects models account for correlations of data drawn from the same participant and missing data [21, 51]. このような線形混合効果モデルは、同一参加者から引き出されたデータと欠落したデータとの相関を考慮に入れている[21, 51]。 0.72
The analysis of variance function of the stats package in base R serves to compare model fits. ベースRにおける統計パッケージの分散関数の解析は、モデル適合度を比較するのに役立つ。 0.77
η2 p values denote effect sizes (effectsize v.0.5) [9]. η2 p は効果サイズ (効果 v.0.5) [9] を表す。 0.71
Computations of pairwise estimated marginal means follow up significant main effects or interactions, with respective effect sizes reported in terms of Cohen’s d. ペアワイズ推定辺縁平均の計算は重要な主効果や相互作用を追従し、それぞれの効果の大きさはコーエンのdで報告される。 0.72
All post-hoc analyses reported are Bonferroni corrected to account for multiple comparisons. 報告されたすべてのポストホック分析は、複数の比較を考慮に入れたボンフェロニ補正である。 0.51
We evaluate data gathered from the post-game survey depending on question type. 質問の種類に応じて,ゲーム後調査から収集したデータを評価する。 0.64
For the first two items assessing user’s explicit knowledge of plant relevance, we test data for normality of distributions using the Shapiro-Wilk test, followed up by the non-parametric Wilcoxon-Mann-Whitne y U test in case of non-normality, and the Welch two-sample t-test otherwise for group comparisons. 植物との関連性に関するユーザの明示的な知識を評価する最初の2項目について,shapiro-wilkテストを用いて分布の正規性について,非正規性の場合はwilcoxon-mann-whitne y uテスト,その他ではwilch two-sample t-testをテストした。 0.72
We follow the same approach to compare age and gender distributions. 同じアプローチで年齢と性別の分布を比較します。 0.72
We also compare user’s explicit knowledge of plant relevance to the expected value given random response patterns using the non-parametric one-sample Wilcoxon signed rank test for each group separately, and report Bonferroni corrected results. また,各グループに対する非パラメトリックな1サンプルのウィルコクソン符号付きランクテストを用いて,ランダム応答パターンが与えた期待値と植物との関連性に関するユーザの明示的な知識を比較し,bonferroni による結果の報告を行った。 0.67
To analyze group differences of ordinal data from the Likert-style items, we rely on the non-parametric Wilcoxon-Mann-Whitne y U test. likert形式の項目からの順序データの群差を分析するために、非パラメトリックなwilcoxon-mann-whitne y uテストを用いる。 0.62
We report effect sizes for all survey data comparisons as r. また,すべての調査データの比較結果について,r。 0.67
As a web-based study, we run the risk that some participants attempt to game the system to collect the reward without providing proper answers. ウェブベースの調査では、一部の参加者が適切な回答を与えずにシステムに報酬を集めようとするリスクを負っている。 0.70
Thus, we implement a number of data quality checks that were planned a priori. そこで我々は,事前計画されたデータ品質チェックを多数実施する。 0.78
We identify speeders based on the decision time, flagging users that spent less than 2s in the padlock scene in 4 or more trials. 4つ以上の試験でパドロックシーンに2秒未満の時間を費やすユーザに対して、決定時間に基づいてスピーダーを特定します。 0.67
We flag participants that fail to respond with the correct number of aliens in both attention trials during the game. ゲーム中の両方の注意試験において、正しい数のエイリアンに反応しない参加者にフラグを立てます。 0.59
Furthermore, we included a catch item in the survey (1b, item 7), flagging inattentive users. さらに,調査にキャッチアイテム(1b項目7項目)を記載し,不注意なユーザをフラグづけした。 0.68
Finally, we identify straight-lining participants who keep choosing the same plant combination despite not improving in at least three blocks, or answer with only positive or negative valence in the survey. 最後に,少なくとも3ブロックでは改善しないにもかかわらず,同じ植物の組み合わせを選択し続ける直線的参加者を同定し,調査において正あるいは負の価のみを回答する。 0.73
To uphold a high threshold for data quality, we follow a conservative approach of excluding participants that were flagged for at least one of these reasons. データ品質の高いしきい値を維持するために、これらの理由の少なくとも1つに掲げられた参加者を除外する保守的なアプローチを踏襲する。 0.61
6 Results From the initial 100 participants, we exclude data from participants who qualified as speeders (n = 2), failed both attention trials during the game (n = 5), gave an incorrect response for the catch item in the survey (n = 3), or straight-lined during the game (n = 4) or in the survey (n = 12), leaving data from 74 participants for final analysis (Table 1). 結果6 初回100名から,スピーダーとして資格を得た参加者(n = 2),ゲーム中両方の注意試験に失敗した参加者(n = 5),調査中(n = 3),ゲーム中(n = 4)あるいは調査中(n = 12)のキャッチ項目に対して誤った反応を示した参加者(Table 1)を除外し,最終分析のために74名(Table 1)を残した。 0.58
6.1 Do Computationally Plausible CFEs Facilitate Learning? 6.1 CFEは学習を支援するか? 0.66
Hypothesis 1 postulates that users in the plausible condition outperform users in the closest condition. 仮説1は、可視状態のユーザが最も近い状態のユーザより優れていることを仮定する。 0.54
To statistically assess this hypothesis, we compare data from participants in both groups in terms of pack size produced over time, decision time, and matches between ground truth and indicated plants. この仮説を統計的に評価するために, 時間, 決定時間, 地上の真理と指示された植物との一致について, 両グループの参加者のデータを比較した。 0.76
Figure 3a shows the development of average 図3aは平均の発達を示しています 0.63
8 8 0.42
英語(論文から抽出)日本語訳スコア
err 翻訳エラー 0.00
英語(論文から抽出)日本語訳スコア
Figure 4: Overview of user judgments in post-game survey per group, adapted from [32]. 図4:[32]から適応したグループ毎のゲーム後調査におけるユーザ判断の概要。 0.87
(a) depicts user replies in survey items relevant for hypothesis 2, (a)仮説2に関連する調査項目におけるユーザ回答 0.76
(b) depicts user replies in survey items relevant for hypothesis 3, and b) 仮説3に関連する調査項目における利用者の回答 0.75
(c) depcits replies relevant for our last exploratory analysis. (c)前回の探索分析に関連する回答をデプシットする。 0.70
Distributions did not differ significantly between groups for any of the items (all p >.05). いずれの項目についても群間で分布は有意差はなかった(p >.05)。 0.86
Groups do not statistically differ when judging whether presented CFE feedback was helpful to increase pack size (closest condition: M = 3.700 ± 1.285 SE; plausible condition: M = 3.636 ± 0.242 SE; U = 656, p = .968, r = .005). 群は、提示されたCFEフィードバックがパックサイズを増やすのに役立つかどうかを判断する際に統計的に異なる(最も近い条件: M = 3.700 ± 1.285 SE; 可塑性条件: M = 3.636 ± 0.242 SE; U = 656, p = .968, r = .005)。
訳抜け防止モード: 群が統計的に異なるかどうかを判断する 提案されたCFEフィードバック M = 3.700 ± 1.285 SE ; 可塑性条件: M = 3.636 ± 0.242 SE ; U = 656。 p = .968 , r = .005 )。
0.81
Likewise, we do not detect significant group differences in terms of subjective usability (closest condition: M = 3.775 ± 0.216 SE; plausible condition: M = 3.606 ± 0.230 SE; U = 603, p = .513, r = .077). 同様に、主観的ユーザビリティの点で大きなグループ差は検出されない(最も近い条件: m = 3.775 ± 0.216 se; 妥当な条件: m = 3.606 ± 0.230 se; u = 603, p = .513, r = .077)。 0.79
In addition, there is no significant difference between groups for estimated usefulness of explanations for others (closest condition: M = 3.750 ± 0.208 SE; plausible condition: M = 3.647 ± 0.206 SE; U = 637, p = .631, r = .056). さらに、他の説明の有効性を推定する群間で有意な差はない(最も近い条件: m = 3.750 ± 0.208 se; 可算条件: m = 3.647 ± 0.206 se; u = 637, p = .631, r = .056)。 0.85
6.3 Does Mode of Presentation have an Impact? 6.3 プレゼンテーションモードは影響を与えるか? 0.82
As postulated in hypothesis 3, we do not observe group differences between conditions in terms of understanding the explanations as such (Figure 4b). 仮説3で仮定されたように、我々はそのような説明を理解する観点から条件間の群差を観察しない(図4b)。 0.76
A considerable proportion of both groups responds positively about understanding the feedback, not differing significantly in their responses (closest condition: M = 3.975 ± 0.184 SE; plausible condition: M = 4.118 ± 0.162 SE; U = 773.5, p = .200 r = .149). 両方のグループのかなりの割合はフィードバックの理解について正に反応し、反応に大きな違いはない(最も近い条件: m = 3.975 ± 0.184 se; 有理条件: m = 4.118 ± 0.162 se; u = 773.5, p = .200 r = .149)。
訳抜け防止モード: 両グループのかなりの割合は、フィードバックを理解することについて肯定的に反応する。 M = 3.975 ± 0.184 SE ; 可算条件 M = 4.118 ± 0.162 SE; U = 773.5 p = .200 r = .149 )。
0.83
In terms of needing support for understanding, both groups reply with a similar response pattern (closest condition: M = 3.200 ± 0.230 SE; plausible condition: M = 3.147 ± 0.257 SE; U = 667, p = .890 r = .016). 理解のための支援が必要であるという点では、どちらのグループも同様の応答パターンで回答する(最も近い条件: m = 3.200 ± 0.230 se; 妥当な条件: m = 3.147 ± 0.257 se; u = 667, p = .890 r = .016)。
訳抜け防止モード: 理解のためのサポートの必要性に関して、両グループは同様の応答パターン(最も近い条件: M = 3.200 ± 0.230 SE )で応答する。 M = 3.147 ± 0.257 SE ; U = 667, p = .890 r = .016 )。
0.82
Similarly, user judgments on timing and efficacy of CFE presentation are consistently high across groups (closest condition: M = 4.100±0.175 SE; plausible condition: M = 4.147±0.170 SE; U = 680.5, p = 1 r = .000). 同様に、CFEプレゼンテーションのタイミングと有効性に関するユーザの判断は、グループ間で一貫して高い(最も近い条件: M = 4.100±0.175 SE; 可算条件: M = 4.147±0.170 SE; U = 680.5, p = 1 r = .000)。 0.69
6.4 Exploratory Analysis More than half of all users in both groups do not report to having detected any inconsistencies in the CFEs provided (closest condition: M = 2.675 ± 0.166 SE; plausible condition: M = 2.853 ± 0.207 SE; U = 743, p = .480, r = .082). 6.4 探査分析 両方のグループのユーザーの半数以上が、与えられたcfesの矛盾を検知したと報告していない(最も近い条件:m = 2.675 ± 0.166 se; 妥当な条件: m = 2.853 ± 0.207 se; u = 743, p = .480, r = .082)。 0.73
7 Discussion In this work, we investigate effects of implementing a plausibility constraint on computed CFEs for ML models on user performance in an iterative learning task in an abstract domain. 7 討論 本研究では,MLモデルの計算CFEに対する可視性制約の実装が,抽象領域における反復学習タスクにおけるユーザパフォーマンスに与える影響について検討する。 0.53
The employed constraint limits the set of possible solutions to the training data. 使用される制約は、トレーニングデータに対する可能なソリューションのセットを制限する。 0.68
We measure understanding and usability of explanations in terms of two objective behavioral variables, i.e., task performance and decision time, and several subjective self-reports. 2つの客観的行動変数(タスクのパフォーマンスと意思決定時間)と主観的自己報告を用いて説明の理解とユーザビリティを測定した。 0.76
Our results reveal a range of valuable insights with important implications for XAI in application. この結果から,アプリケーションにおけるXAIの重要な意味について,さまざまな貴重な知見が得られた。 0.51
10 "Feedback helped me.""I could use the feedback."10050050100100500501 00ClosestPlausibleGr oup"Most people would learn quickly."10050050100% of usersa"I understood the feedback.""I needed support to understand."10050050100100500501 00ClosestPlausibleGr oup"Feedback was timely and efficiently."10050050100% of usersb"I found inconsistencies.&quo t;10050050100ClosestPl ausible% of usersGroupStronglydi sagreeDisagreeNeutra lAgreeStronglyagreec 10 10050050100100100100 100100100100ClosestP lausibleGroup"多くの人はすぐに学べる" 10050050100%のユーザa"私はフィードバックを理解するためにサポートが必要だった" 10050050100100100100 100ClosestPlausibleG roup" 10050050100%のユーザb"10050050100ClosestPl ausibleGroup" 100500100ClosestPlau sible%のユーザGroupStronglydisagre eDisagreeNeutralAgre eStronglyagreec" ;
訳抜け防止モード: 10 10050050100100100100 100100100ClosestPlau sibleGroup" フィードバックは役に立ちました。 「10050050100%」と回答した。 10050050100100100100 100ClosestPlausibleG roup"Feedback was timely and efficient .10050050100% of usersb"I found inconsistencies .100500100ClosestPla usible% of usersGroupStronglydi sagreeDisagreeNeutra lAgreeStronglyagreec
0.64
英語(論文から抽出)日本語訳スコア
First, we cannot verify our initial supposition that computationally plausible CFEs facilitate learning in the current setting. まず、計算可能なcfeが現在の設定で学習を容易にするという最初の仮定を検証できない。 0.58
Intriguingly, we observe the opposite effect: users in the closest condition generated larger pack sizes than users in the computationally plausible condition. 興味深いことに、最も近い条件のユーザは、計算可能な条件のユーザよりも大きなパックサイズを生成する。 0.61
A likely reason for this observation may be that the current study revolves around an abstract scenario of feeding aliens. この観測の可能性が高い理由は、現在の研究がエイリアンに餌をやるという抽象的なシナリオを中心に展開しているからかもしれない。
訳抜け防止モード: この観察のおそらくの理由は 今回の研究は、エイリアンに餌をやるという抽象的なシナリオを取り上げています。
0.60
Given psychological interpretations of plausibility as probability [56, 18], simply restricting CFEs to items from the training set cannot help participants that lack an informed mental representation of the current state of this alien world. 確率としての妥当性の心理的解釈 [56, 18] を考えると、CFEをトレーニングセットの項目に限定するだけでは、この異星人の現況の知的な心的表現が欠けている参加者を助けることはできない。 0.65
For a novice user at the onset of the study, any counterfactual is equally likely. 研究の開始時点での初心者にとって、あらゆる反事実は同じように起こりうる。 0.46
We may turn to the definition of psychological plausibility as comparative similarity [41, 65] for a possible explanation why users in the closest group showed significantly superior performance. 最寄りグループのユーザがパフォーマンスに優れていた理由を説明するため,心理学的妥当性の定義を比較類似性 [41, 65] と定義することができる。 0.74
Classically, CFEs are penalized if they deviate from the requested prediction [69], resulting in closest CFEs that differ minimally from the user’s input. 古典的には、CFEは、要求された予測[69]から逸脱した場合に罰せられ、その結果、ユーザの入力と最小限に異なる最も近いCFEとなる。 0.63
This concept resembles the view that psychologically plausible counterfactuals come from worlds that are minimally different from reality [41]. この概念は、心理的に妥当な反事実は現実とほとんど異なる世界に由来するという考え方に似ている [41]。 0.68
Empirical evidence highlighting the close relation between perceived plausibility and perceived similarity between counterfactual and factual state supports this notion [65, 19]. 反事実的状態と事実的状態の類似性を知覚する可能性と知覚的類似性との密接な関係を強調する実証的な証拠は、この概念を支持している [65, 19]。 0.52
In contrast, the computational plausibility constraint rejects CFEs that are not part of the training set, even if they are minimal. 対照的に、計算可視性制約は、たとえ最小でも、トレーニングセットの一部ではないCFEを拒絶する。 0.62
Consequently, users in the plausible condition encounter larger differences between provided explanations and their input, at odds with the idea of plausibility as comparative similarity. その結果、提供された説明と入力の間により大きな差異が生じ、比較類似性としての可視性の概念に反する結果となった。 0.68
Conversely, users in the closest condition might have experienced their CFEs as more psychologically plausible than the computationally plausible version. 逆に、最も近い状態のユーザーは、計算可能バージョンよりも心理的に妥当なCFEを経験していたかもしれない。 0.61
Further, upon seeing closest CFEs, users might get a feeling of “just missing”, inducing negative affect that strongly motivates improvement [48, 47]. さらに、最も近いCFEを見ると、ユーザは“ただの欠落”を感じ、改善を強く動機付けるネガティブな影響を誘発します [48, 47]。 0.78
Additionally, the larger discrepancies between factual and counterfactual state in the plausible condition might increase the mental load on users, potentially hampering learning. さらに、現実的状態と反事実的状態の差異が大きいほど、利用者の精神的負担が増大し、学習が妨げられる可能性がある。 0.65
Future studies need to disentangle contributions of these factors. 今後の研究はこれらの要因の貢献を解き放つ必要がある。 0.54
Intriguingly, our results are at odds with empirical findings indicating that CFEs for intelligent systems do not improve user’s task performance [42, 68]. 興味深いことに、我々の結果は、知的システムのためのCFEがユーザのタスク性能を向上しないことを示す実証的な結果と矛盾している [42, 68]。 0.67
Lim et al assessed the effectiveness of different explanation modes for contextaware systems [42]. Limらは、コンテキストアウェアシステムにおける異なる説明モードの有効性を評価した[42]。 0.58
In their study, performance of users receiving counterfactual style what-if -explanations was indistinguishable from that of users getting no explanations what-so-ever. 彼らの研究によると、反事実的スタイルの「説明」を受けるユーザのパフォーマンスは、何の説明も受けていないユーザと区別がつかなかった。 0.57
In contrast, users in our study indeed show learning after receiving CFEs. 対照的に,本研究のユーザはCFEを受講した後に学習している。 0.65
Interestingly, their task resembles ours in so far that they also employed an abstract domain: users chose values of non-specific features (labelled A, B and C), relating to a non-specific prediction (a or b). 興味深いことに、これらのタスクは我々のものと似ており、抽象的なドメインも採用している。ユーザーは非特異な特徴(A、B、C)の値を選択し、非特異な予測(a、b)に関連する。 0.56
However, while also dealing with an abstract task (i.e., feeding aliens), our users have a tangible goal (i.e., make the pack grow). しかし、抽象的なタスク(すなわち、エイリアンに餌をやる)にも対処しながら、ユーザには明確な目標(すなわち、パックを成長させる)があります。 0.64
Further, we refrain from separating learning and testing as in Lim et al , where users went through an initial evaluation section receiving explanation after explanation. また,Lim et al のように学習とテストの分離を控え,説明後の説明を受けながら初期評価部を通過した。 0.72
Our design is far more interactive, with different rounds of user action and feedback. 私たちのデザインは、ユーザーアクションとフィードバックの異なるラウンドで、はるかにインタラクティブです。 0.68
This is in line with evidence from educational science, suggesting that learner’s level of engagement relates to learning outcome, with interactive activities granting deepest understanding [15]. これは、学習者のエンゲージメントレベルが学習結果と関連し、対話的な活動が深い理解を与えていることを示唆する教育科学からの証拠と一致する。 0.70
Thus, including goal-directed and interactive settings may potentially be vital facets of effective usability studies. したがって、目標指向およびインタラクティブな設定を含むことは、効果的なユーザビリティ研究の重要な側面となる可能性がある。 0.56
We suggest that future research designs need to pay special attention to these aspects in order to accurately evaluate XAI approaches. xaiアプローチを正確に評価するためには,今後の研究設計がこれらの側面に特に注意を払う必要があることを示唆する。 0.63
Beyond task performance, we quantify learning success in terms of user’s decision time and their ability to explicitly state which plants were relevant. タスクのパフォーマンス以外にも、ユーザの意思決定時間と、どの植物が関連しているかを明確に示す能力の観点から、学習の成功を定量化します。
訳抜け防止モード: タスクパフォーマンスを超えて、ユーザの意思決定時間の観点から学習の成功を定量化する そしてどの植物が関係しているかを明確に表現する能力です
0.70
Both measures do not reveal significant group differences. どちらの尺度も大きなグループ差は示さない。 0.66
In terms of user’s decision time, both groups show significant speed-up already after Trial 1 (Figure 3a). ユーザの判断時間に関しては、どちらのグループもトライアル1以降でかなりスピードアップしている(図3a)。 0.72
This initial time decrease likely reflects how participants learn to work with the game interface efficiently. この初期時間の減少は、参加者がゲームインターフェースを効率的に操作する方法を反映している可能性が高い。
訳抜け防止モード: この初期時間の減少は 参加者は ゲームインターフェースを 効率的に扱うことを学びます
0.78
Increased reaction time as a marker of learning is a classical insight from experimental psychology [44], indicating that both groups did indeed learn in the current setting. 学習の指標としての反応時間の増加は実験心理学の古典的洞察 [44] であり、どちらのグループも現在の設定で実際に学習したことを示している。
訳抜け防止モード: 学習の指標としての反応時間の増加は実験心理学からの古典的な洞察である[44]。 どちらのグループも現在の状況で 学んでいました
0.82
It is possible that the complex task we devised with its elaborate game-like setting was not sensitive enough or too short to pick up in subtle group differences usually linked to more simple, extensive reaction time experiments. 私たちが考案した複雑なタスクとその複雑なゲームライクな設定は,より単純で広範な反応時間実験と関連づけられるような,微妙なグループ差を拾うには十分あるいは短すぎるものでした。 0.75
Users in the closest group show superior performance, however, they are not able to state more explicitly which plants were relevant or irrelevant for the given task. 最寄りのグループのユーザーは、より優れたパフォーマンスを示すが、与えられたタスクにどの植物が関係しているか、あるいは無関係であるかをより明確に述べることはできない。 0.58
With this, our study replicates a recent observation that objective measures (i.e., task performance) do not necessarily correlate with self-reports reflecting system understanding [68]. そこで本研究では,客観的尺度(タスクパフォーマンス)がシステム理解を反映した自己報告と必ずしも相関しないという最近の知見を再現した。 0.72
Participants in both groups made three out of five correct choices on average (Figure 3c), in part significantly exceeding the number expected in case of random behavior. 両グループの参加者は、5つの正しい選択のうち3つを平均で行った(図3c)。
訳抜け防止モード: 両グループの参加者は平均して正しい選択を5つのうち3つ行った(図3c)。 ランダムな振る舞いの場合に期待される数を大幅に超えます
0.69
Thus, both groups showed some–yet imperfect–explicit understanding of the underlying system. したがって、両方の群は、基礎となる系のいくつかの不完全で明示的な理解を示した。 0.44
Potentially, users may rely on their initial mental model of the appropriate alien diet, allowing them to make advantageous feeding choices relatively quickly. おそらくユーザーは、適切なエイリアンの食事の初期精神モデルに頼り、比較的早く餌の選択を有利にすることができるだろう。 0.67
However, in this initial stage, it may still be insufficient to allow clear and explicit differentiation between relevant and irrelevant features at the end of the study. しかし、この初期の段階では、研究の終わりに関連性のある特徴と無関係な特徴を明確に区別することは依然として不十分である。 0.64
Besides effects on task performance, we do not detect any statistically meaningful differences between the two groups under investigation, predominantly affecting the evaluation of user judgments in the survey. タスクパフォーマンスへの影響に加えて,調査中の2つのグループ間の統計的に有意な差は検出せず,調査におけるユーザ判断の評価に主に影響を与えている。 0.77
It is clear that these observations have to be taken with the care generally devoted to null effects, calling for cautious interpretation. これらの観察は、一般的にヌル効果に関する注意を払わなければならないことは明らかであり、慎重に解釈する必要がある。 0.60
Still, regarding the general trends for individual survey items is informative. しかし、各調査項目の一般的な傾向については有益である。 0.65
We cannot verify our second hypothesis, as users did not differ depending on group in terms of subjective helpfulness and usability. 第2の仮説は,ユーザがグループによって主観的有用性やユーザビリティの点で違いがなかったため,検証できない。 0.72
Still, we note that the majority of users in both groups respond with agreement or strong agreement in the respective items (Figure 4a). しかし、両グループの利用者の大多数が、各項目の合意や強い合意に回答していることに留意する(第4a図)。 0.62
This supports the notion that CFEs are indeed subjectively intuitive and usable for lay users, also when used in an abstract setting. これは、CFEは明らかに主観的に直観的であり、平易なユーザでも、抽象的な設定でも使用することができるという考えを支持している。
訳抜け防止モード: これはその概念を支持する。 確かにCFEは直観的に直観的であり、抽象的な設定でも使用することができる。
0.62
11 11 0.43
英語(論文から抽出)日本語訳スコア
A major challenge for effective user designs comparing different approaches is keeping conditions highly comparable, with the sole exception of the experimental manipulation. 異なるアプローチを比較する効果的なユーザー設計のための大きな課題は、実験的な操作を除いて、条件を非常に同等に保つことである。 0.66
User judgments of general understandability and presentation mode of CFEs inspire confidence that we achieved this level of control with our Alien Zoo design. CFEの一般的な理解可能性と提示モードのユーザ判断は、このレベルのコントロールをエイリアン動物園の設計で達成したことを確信させる。
訳抜け防止モード: CFEの一般理解性と提示モードのユーザ判断は、その自信を喚起する 私たちはこのレベルのコントロールを エイリアンのデザインで達成しました
0.67
In fact, the respective items elicit the highest user judgments out of all survey responses, with agreement values close to 90%. 実際、各項目は、すべての調査回答から最も高いユーザ判断を導き出しており、合意値は90%近くである。 0.71
High agreement across both groups leads us to conclude that mode of CFE presentation does not have an impact when comparing users experience closest vs. plausible CFEs, validating our hypothesis 3. 両グループ間の高い合意は、CFEプレゼンテーションのモードがユーザと最も近いCFEを比較した場合に影響を与えず、仮説3を検証します。 0.75
Thus, the Alien Zoo design does not just elucidate benefits of providing CFEs compared to no explanation [37], it is also suitable for user evaluations of CFE methods, a yet vastly understudied aspect in the field of XAI [36]. したがって、異種動物の設計は、CFEを提供するメリットを説明無しに解明するだけでなく、CFEメソッドのユーザ評価にも適しており、XAIの分野において非常に検討されている側面である[36]。 0.76
Finally, the majority of users indicate that they fail to find inconsistencies in the CFEs provided. 最後に、ユーザの大多数は、提供されたCFEの不整合を見つけられなかったことを示している。 0.55
Thus, we can rule out that our code generated irregular or even contradictory explanations, confounding the observed group differences. したがって、我々のコードは不規則または矛盾する説明を発生させ、観察されたグループ差を無視することができる。 0.66
7.1 Limitations & Future Work 7.1 限界と今後の課題 0.68
Several limitations warrant caution when interpreting our results beyond the scope of this work. この作業の範囲を超えて結果を解釈する場合、いくつかの制限は注意を要する。 0.59
Critical design choices in any XAI evaluation include the reason for explaining, and the target group [1]. XAI評価における重要な設計選択には、説明の理由と対象群[1]が含まれる。 0.83
The current results may only be generalized to cases with the same motivation for explaining (i.e., to ‘explore’) as well as the intended audience (i.e., novice users). 現在の結果は、説明(つまり 'explore' へ)と意図したオーディエンス(つまり初心者ユーザ)の同じ動機を持ったケースにのみ一般化することができる。 0.74
Other motives and applications addressing more specific target groups call for independent studies. 特定の対象グループに対処する他の動機や応用は独立した研究を要求する。 0.66
We excluded data from 26 out of 100 participants to meet a priori quality criteria. 優先品質基準を満たすため,100人中26人のデータを除外した。 0.70
Such participant attrition common, especially in web-based studies. このような参加意欲は、特にウェブベースの研究で一般的である。 0.50
As smaller sample sizes always mean a loss of statistical power, we factored in this issue in an a priori power analysis. より小さいサンプルサイズは、常に統計量の損失を意味するため、この問題を事前のパワー分析で考察した。 0.74
Yet, the effect size of the significant interaction between factors trial number and group remains relatively small. しかし, 因子数と群間の有意な相互作用の効果は, 比較的小さいままである。 0.77
Hence, the results from this work await confirmation in larger follow-up studies. したがって、この研究の結果は、より大きなフォローアップ研究において確認を待つことになる。 0.53
None of the survey items revealed significant group effects, in line with a previous account of diverging trends between objective measures and self-reports [68]. 調査項目のいずれも,客観的尺度と自己報告の傾向が異なっていながら,有意な集団効果は認められなかった [68]。 0.74
This may reflect a more general tendency in human evaluation of system understanding. これは、より一般的なシステム理解の評価傾向を反映している可能性がある。 0.57
Alternatively, however, we may call into question the efficacy of instruments applied to assess user experience. しかし、ユーザエクスペリエンスを評価するために適用される機器の有効性を問うこともできる。 0.72
To date, there is no standard inventory for assessing subjective usability in XAI research. 現在、XAI研究における主観的ユーザビリティを評価するための標準在庫は存在しない。 0.64
We adapted the System Causability Scale [32] to determine subjective usability of presented CFEs. 提案するcfeの主観的ユーザビリティを判断するために,システム可溶性尺度 [32] を適用した。 0.56
Yet, there is no large scale validation of this measure. しかし、この尺度の大規模な検証は行われていない。 0.71
One potential shortcoming may be a lack of sensitivity to subtle group differences. 潜在的な欠点の1つは、微妙なグループ差に対する感受性の欠如である。 0.54
Moreover, the current scenario in its present condition may be difficult to translate to specific real-world applications. さらに、現状のシナリオは、特定の現実世界のアプリケーションに翻訳することが困難である可能性がある。 0.62
The lack of realism offers full algorithmic recourse [35]: all changes are feasible (i.e., doable for the participant), and all changes in features are independent (i.e., a user can change plant 1, and this will have no long-time effect on plant 2). すべての変更は実行可能(つまり、参加者にとって実行可能)であり、すべての機能の変更は独立である(つまり、ユーザは植物1を変更でき、植物2に長期的影響を与えない)。
訳抜け防止モード: 現実主義の欠如は完全なアルゴリズム的リコースをもたらす [35] :すべての変更は実行可能(つまり参加者に対して実行可能)である。 機能の変更はすべて独立している(つまり)。 ユーザはプラント1を変更できる。 これは植物2に長い時間効果を及ぼさない)。
0.73
In real life scenarios, this is barely the case (e g , a bank customer might never be able to get younger to get a loan; yearly income also affects savings). 現実のシナリオでは、このケースはほとんどありません(例えば、銀行の顧客はローンを得るために若くすることができないかもしれませんが、年収は貯蓄にも影響します)。 0.68
Thus, our example is much more artificial, and we suggest applying iterative learning designs in more realistic, real-world scenarios as an exciting avenue for future work. したがって、私たちの例はずっと人工的であり、将来の仕事のためのエキサイティングな道筋として、より現実的な現実世界のシナリオに反復学習設計を適用することを提案します。 0.57
Users in our study play an elaborate online game, with a detailed user interface, and several consecutive scenes. 本研究のユーザは,詳細なユーザインターフェースと複数の連続シーンを備えた,精巧なオンラインゲームをプレイする。 0.77
Designed to be maximally engaging as to ensure participant compliance, the amount of information displayed may overwhelm some participants. 参加者のコンプライアンスを確保するために最大限に熱心に設計されているため、表示される情報量が一部の参加者を圧倒する可能性がある。 0.46
This could explain inferior performance of a small proportion of participants, like those who disagree with the notion that feedback presentation was timely and efficiently. このことは,フィードバックプレゼンテーションがタイムリーかつ効率的に行われているという考えに異議を唱える参加者など,少数の参加者の低いパフォーマンスを説明できる可能性がある。
訳抜け防止モード: これは少数の参加者の低いパフォーマンスを説明できる。 フィードバックの提示が タイムリーに 効果的だったという考えに 反対する人たちのように
0.69
Recent evidence suggests an added benefit of providing users with CFEs over no explanations to understand the behavior of an unknown system [68]. 最近の証拠は、未知のシステムの振る舞いを理解するための説明を一切しないCFEをユーザーに提供することの利点が加わったことを示唆している[68]。
訳抜け防止モード: 最近の証拠は追加の利益を示唆している 未知のシステムの振る舞いを理解するための説明のないCFEをユーザに提供します [68]。
0.79
The current work expands this insight by a direct comparison of two different approaches for CFE computation. 現在の研究は、CFE計算の2つの異なるアプローチを直接比較することによって、この洞察を広げている。 0.58
While our results suggests the suitability of our Alien Zoo design, further validation studies must delineate potential shortcomings. 以上の結果から,外来動物設計の適合性は示唆されるが,さらなる検証研究は潜在的な欠点を浮き彫りにする必要がある。 0.54
For instance, a crucial validation step of the design itself concerns comparisons of valid CFEs with no explanations or non-sensical ones. 例えば、設計自体の重要な検証ステップは、説明や非意味な説明のない有効なCFEの比較に関するものである。 0.74
Beyond such a fundamental investigation, the Alien Zoo design lends itself to be easily modified. このような基本的な調査の他に、エイリアン動物園のデザインは容易に修正できる。 0.62
Possible adaptations may incorporate data with different dynamics, use other ML models, or compare other CFE approaches. 考えられる適応は、データを異なるダイナミクスで組み込んだり、他のMLモデルを使ったり、他のCFEアプローチと比較したりすることができる。 0.57
Thus, the design has tremendous potential to answer open questions in the domain of XAI. したがって、この設計はXAIの領域におけるオープンな質問に答える大きな可能性を秘めている。 0.65
For instance, future work may explore the impact of distinct psychometric properties on performance. 例えば、将来の研究は、異なる心理測定特性がパフォーマンスに与える影響を探求するかもしれない。 0.59
A small-scale user study suggests an effect of individual personality traits on user’s ability to make sense of an ML system’s output, and understanding the generation process, respectively [26]. 小規模なユーザスタディでは、個々の性格特性が、MLシステムのアウトプットを理解し、生成プロセスを理解するユーザの能力に与える影響を示唆している[26]。 0.71
It remains to be shown how personal attributes relate to usability judgments of CFEs. 個人的属性がCFEのユーザビリティ判断にどのように関係しているかは明らかになっていない。 0.52
Further, it is conceivable that users may prefer to receive explanations on demand, rather than continuously at prescribed intervals. さらに、ユーザが所定の間隔で継続的に説明を受けるのではなく、オンデマンドで説明を受けることを好むことも考えられる。 0.59
There is abundant room for further progress in determining whether explicitly requesting CFEs may improve task performance, and how users would make use of their control over the explanation intervals. CFEを明示的に要求することでタスクのパフォーマンスが向上し、ユーザが説明間隔を制御できるかどうかを判断する余地は豊富である。 0.63
Finally, we successfully demonstrate usefulness of CFEs for the current task, indicating a certain degree of intuitiveness or plausibility connected to them. 最後に,CFEの現在の課題に対する有用性を示し,それらに関連するある程度の直感性や妥当性を示す。 0.68
Future investigations may tackle whether CFEs cause users to fall prey to a plausibility fallacy, coming to trust biased or unfair ML models just because they are coupled with intuitive explanations. 将来の調査は、CFEがユーザーが妥当な誤りを犯す恐れがあるかどうかに対処し、直感的な説明が組み合わさって、偏見や不公平なMLモデルを信頼するようになるかもしれない。 0.57
12 12 0.42
英語(論文から抽出)日本語訳スコア
7.2 Conclusions In this work, we present a controlled study comparing user performance and usability judgments of CFEs in an iterative learning design. 7.2 結論 本研究では,反復学習設計におけるCFEのユーザパフォーマンスとユーザビリティ判断を比較した制御された研究を提案する。 0.54
We focus on potential group effects driven by receiving either closest CFEs that are minimally different from the user’s input, compared to computationally plausible ones, limited to instances found in the training data. 我々は、学習データに見られるインスタンスに限られる計算可能なものと比較して、ユーザの入力と最小限に異なる最も近いCFEを受け取ることによって引き起こされる潜在的なグループ効果に焦点を当てる。 0.74
We develop an accessible game-like experimental design revolving around an abstract scenario, suitable for novice users. 我々は,初級ユーザに適した抽象シナリオを中心に,アクセス可能なゲームライクな実験デザインを開発する。 0.70
Our design demonstrates learning in both groups, highlighting the power of interactive and goal-directed tasks for user evaluations of CFE methods, a yet vastly understudied aspect in the field of XAI. 提案手法は両グループで学習し,対話型および目標指向型タスクのパワーを強調し,cfe手法のユーザ評価を行った。
訳抜け防止モード: 本設計では,CFE手法のユーザ評価における対話的・目標的タスクのパワーを強調し,両グループの学習を実証する。 XAI の分野では,非常に過小評価されている側面です。
0.65
Moreover, our findings suggest that novice users benefit more from receiving closest than computationally plausible CFEs. さらに,本研究の結果から,初心者は計算に有効なCFEよりも,より親しみやすいことが示唆された。 0.53
This supports the view of plausibility as comparative similarity rather than probability in cases where users lack an accurate mental model to build on. これは、ユーザーが構築する正確なメンタルモデルがない場合の確率よりも、相対的な類似性として、可能性の考え方を支持する。
訳抜け防止モード: これは確率よりも比較類似性としての可算性の概念を支持する。 ユーザーは正確な精神モデルを持っていません
0.67
In sum, our work emphasizes yet again that theoretical approaches proposing explanation techniques for ML models and user-based validations thereof need to go hand in hand. 要約すると、我々の研究は、MLモデルの説明手法とユーザによる検証を併用する理論的なアプローチが重要であることを強調している。 0.66
Researchers designing XAI approaches need to bear in mind human behavior, preferences and mental models, to build on a solid foundation to effectively benefit the end user. xaiのアプローチを設計する研究者は、人間の行動、好み、メンタルモデルに留意し、エンドユーザーに効果的に利益をもたらす確かな基盤を構築する必要がある。
訳抜け防止モード: XAIアプローチを設計する研究者は 人間の行動や嗜好や精神モデルに注意を向けます エンドユーザーに効果的に利益をもたらす しっかりとした基盤を築き上げます
0.76
8 Acknowledgements The authors would like to thank Johannes Kummert for support with server set up and maintenance. 8通 筆者らは、サーバセットアップとメンテナンスのサポートについて、Johannes Kummert氏に感謝したい。
訳抜け防止モード: 8通 作者は望む サーバセットアップとメンテナンスのサポートについて、Johannes Kummert氏に感謝する。
0.65
Funding/Support: This research was supported by the Federal Ministry of Education and Research Germany (BMBF) and the German Aerospace Centre (DLR) through grant agreement no. 資金提供/支援: この研究は、連邦教育研究省(BMBF)とドイツ航空宇宙センター(DLR)が助成協定第1号を通じて支援した。 0.83
: 01IS18041 A (project ITS.ML), and the VW-Foundation (project IMPACT). :01IS18041 A (Project ITS.ML) および VW-Foundation (Project IMPACT)。 0.84
References [1] Amina Adadi and Mohammed Berrada. 参考文献 [1]アミナ・アダディとモハメド・ベラダ。 0.61
“Peeking Inside the Black-Box: A Survey on Explainable Artificial Intelligence (XAI)”. ブラックボックスの中を覗く:説明可能な人工知能(xai)に関する調査。 0.62
In: IEEE Access 6 (2018), pp. 52138–52160. IEEE Access 6 (2018), pp. 52138–52160。 0.69
ISSN: 2169-3536. ISS:2169-3536。 0.21
DOI: 10.1109/ACCESS.2018. 2870052 (cit. on pp. 2, 5, 12). DOI: 10.1109/ACCESS.2018. 2870052 (it. on pp. 2, 5, 12)。 0.35
[2] André Artelt. アンドレ・アルテルト(André Artelt)。 0.66
CEML: Counterfactuals for Explaining Machine Learning models - A Python toolbox. CEML: 機械学習モデルの説明のための偽物 - Pythonツールボックス。 0.85
Publication Title: GitHub repository. 刊行タイトル: GitHubリポジトリ。 0.75
2019. URL: https://www.github.c om/andreArtelt/ceml (cit. on p. 6). 2019. URL: https://www.github.c om/andreArtelt/ceml (p.6。 0.40
[3] André Artelt and Barbara Hammer. アンドレ・アルベルトとバーバラ・ハマー。 0.41
“On the computation of counterfactual explanations - A survey”. 「反事実的説明の計算について-調査」 0.74
In: CoRR abs/1911.07749 (2019). en:corr abs/1911.07749 (2019)を参照。 0.55
_eprint: 1911.07749. _eprint:1911.07749。 0.33
URL: http://arxiv.org/abs /1911.07749 (cit. on pp. 3, 5). url: http://arxiv.org/abs /1911.07749 (cit. on pp. 3, 5)。 0.69
[4] André Artelt and Barbara Hammer. 4]アンドレ・アルテルトとバーバラ・ハマー 0.48
“Convex Density Constraints for Computing Plausible Counterfactual Explanations”. 「不正確な説明を計算するための凸密度制約」 0.70
en. In: Artificial Neural Networks and Machine Learning – ICANN 2020. エン 人工知能と機械学習 - icann 2020。 0.37
Ed. by Igor Farkaš, Paolo Masulli, and Stefan Wermter. エド Igor Farkaš氏、Paolo Masulli氏、Stefan Wermter氏による。 0.57
Vol. 12396. vol.1。 12396. 0.41
Cham: Springer International Publishing, 2020, pp. 353–365. cham: springer international publishing, 2020, pp. 353-365を参照。 0.69
ISBN: 978-3-030-61608-3. ISBN: 978-3-030-61608-3。 0.22
DOI: 10.1007/978-3-030-61 609-0_28. DOI 10.1007/978-3-030-61 609-0_28 0.16
URL: https://link.springe r.com/10.1007/978-3- 030-61609-0_28 (cit. on pp. 2, 3). URL: https://link.springe r.com/10.1007/978-3- 030-61609-0_28 (cit. on pp. 2, 3) 0.26
[5] André Artelt and Barbara Hammer. 5]アンドレ・アルテルトとバーバラ・ハマー 0.50
“Efficient computation of counterfactual explanations and counterfactual metrics of 「相反的説明の効率的な計算と相反的指標 0.74
prototype-based classifiers”. プロトタイプベースの分類器”。 0.53
en. In: Neurocomputing 470 (Jan. 2022), pp. 304–317. エン in: neurocomputing 470 (jan. 2022), pp. 304–317。 0.60
ISSN: 09252312. issn: 09252312。 0.37
DOI: 10.1016/j.neucom.202 1.04.129. DOI: 10.1016/j.neucom.202 1.04.129 0.18
URL: https://linkinghub.e lsevier.com/retrieve /pii/S09252312210110 24 (visited on 11/30/2021) (cit. on p. 2). URL: https://linkinghub.e lsevier.com/retrieve /pii/S09252312210110 24 (visited on 11/30/2021) (cit. on p.2) 0.30
[6] André Artelt, Valerie Vaquet, Riza Velioglu, Fabian Hinder, Johannes Brinkrolf, Malte Schilling, and Barbara Hammer. 6]アンドレ・アルテルト、ヴァレリー・ヴァケ、リザ・ヴェリオグル、ファビアン・ヒンダー、ヨハネス・ブリンクロルフ、マルテ・シリング、バーバラ・ハマー
訳抜け防止モード: [6 ]アンドレ・アルベルト,ヴァレリー・ヴァケット,リザ・ヴェリオグル, Fabian Hinder、Johannes Brinkrolf、Malte Schilling、Barbara Hammer。
0.65
“Evaluating Robustness of Counterfactual Explanations”. 対実説明のロバスト性の評価」 0.59
In: (2021), pp. 01–09. in: (2021), pp. 01-09。 0.79
DOI: 10.1109/SSCI50451.20 21.9660058 (cit. on p. 2). DOI: 10.1109/SSCI50451.20 21.9660058(p.2)。 0.30
[7] Gagan Bansal, Besmira Nushi, Ece Kamar, Daniel S. Weld, Walter S. Lasecki, and Eric Horvitz. [7]Gagan Bansal, Besmira Nushi, Ece Kamar, Daniel S. Weld, Walter S. Lasecki, Eric Horvitz。
訳抜け防止モード: [7]ガガン・バンサル、ベスミラ・ヌシ、エース・カマール、 Daniel S. Weld、Walter S. Lasecki、Eric Horvitz。
0.71
“Updates in Human-AI Teams: Understanding and Addressing the Performance/Compatib ility Tradeoff”. 人間AIの最新情報 チーム: パフォーマンス/互換性のトレードオフを理解し,対処する。 0.62
In: Proceedings of the AAAI Conference on Artificial Intelligence 33 (July 2019), pp. 2429–2437. In: Proceedings of the AAAI Conference on Artificial Intelligence 33 (2019年7月), pp. 2429–2437。 0.46
ISSN: 2374-3468, 2159-5399. ISSN 2374-3468, 2159-5399 0.41
DOI: 10.1609/aaai.v33i01. 33012429. DOI 10.1609/aaai.v33i01. 33012429 0.20
URL: https://www.aaai.org /ojs/index.php/AAAI/ article/view/4087 (visited on 11/16/2021) (cit. on p. 6). URL: https://www.aaai.org /ojs/index.php/AAAI/ article/view/4087 (visited on 11/16/2021) (cit. on p.6)。 0.24
[8] Douglas Bates, Martin Mächler, Ben Bolker, and Steve Walker. 8]Douglas Bates氏、Martin Mächler氏、Ben Bolker氏、Steve Walker氏。 0.41
“Fitting Linear Mixed-Effects Models Using lme4”. 「lme4を用いた線形混合効果モデル」 0.81
en. In: Journal of Statistical Software 67.1 (2015). エン 院 統計ソフトウェア 67.1 (2015) を参照。 0.45
ISSN: 1548-7660. ISS:1548-7660。 0.37
DOI: 10.18637/jss.v067.i0 1. DOI: 10.18637/jss.v067.i0 1 0.20
URL: http://www.jstatsoft .org/v67/i01/ (visited on 11/16/2021) (cit. on p. 8). URL: http://www.jstatsoft .org/v67/i01/ (visited on 11/16/2021) (cit. on p.8)。 0.29
[9] Mattan Ben-Shachar, Daniel Lüdecke, and Dominique Makowski. 9] Mattan Ben-Shachar, Daniel Lüdecke, Dominique Makowski。 0.38
“effectsize: Estimation of Effect Size Indices and effectsize: 効果の大きさの指標の推定と 0.84
Standardized Parameters”. パラメータの標準化。 0.79
In: Journal of Open Source Software 5.56 (Dec. 2020), p. 2815. Journal of Open Source Software 5.56 (2020年11月)、p.2815。 0.83
ISSN: 2475-9066. ISSN:2475-9066。 0.67
DOI: 10.21105/joss.02815. doi: 10.21105/joss.02815。 0.36
URL: https://joss.theoj.o rg/papers/10.21105/j oss.02815 (visited on 11/16/2021) (cit. on p. 8). url: https://joss.theoj.o rg/papers/10.21105/j oss.02815 (visited on 11/16/2021) (cit. on p.8)。 0.51
[10] Leo Breiman, Jerome H. Friedman, Richard A. Olshen, and Charles J. Stone. 10]レオ・ブレイマン、ジェローム・h・フリードマン、リチャード・オルシェン、チャールズ・j・ストーン 0.58
Classification And Regression Trees. en. 分類と回帰木。 エン 0.32
1st ed. London, UK: Routledge, 1984. 第1回。 ロンドン - 1984年のアルバム『routledge』。 0.53
ISBN: 978-1-315-13947-0. ISBN: 978-1-315-13947-0。 0.22
DOI: 10.1201/978131513947 0. DOI:10.1201/97813151 39470。 0.26
URL: https://www.taylorfr ancis.com/books/9781 351460491 (visited on 01/05/2022) (cit. on p. 5). URL: https://www.taylorfr ancis.com/books/9781 351460491 (visited on 01/05/2022) (cit. on p. 5)。 0.32
13 13 0.85
英語(論文から抽出)日本語訳スコア
[11] Ruth M. J. Byrne. 11] ルース・m・j・バーン 0.52
“Précis of The Rational Imagination: How People Create Alternatives to Reality”. Précis of the Rational Imagination: How People Create Alternatives to Reality”. インターネット・ムービー・データベース(英語) 0.65
en. In: Behavioral and Brain Sciences 30.5-6 (Dec. 2007), pp. 439–453. エン in: behavior and brain sciences 30.5-6 (2007年12月) pp. 439-453。 0.52
ISSN: 0140-525X, 1469-1825. ISSN:0140-525X、1469-1825。 0.55
DOI: 10.1017/S0140525X070 02579. 10.1017/S0140525X070 02579。 0.29
URL: https://www.cambridg e.org/core/product/i dentifier/S0140525X0 7002579/type/journal _article (visited on 12/01/2021) (cit. on p. 2). URL: https://www.cambridg e.org/core/product/i dentifier/S0140525X0 7002579/type/journal _article (visited on 12/01/2021) (cit. on p.2) 0.24
[12] Ruth M. J. Byrne, Susana Segura, Ronan Culhane, Alessandra Tasso, and Pablo Berrocal. 12]ruth m. j. byrne、susana segura、ronan culhane、alessandra tasso、pablo berrocal。 0.52
“The temporality effect in counterfactual thinking about what might have been”. 「時間効果」 何があったかについての反事実的思考”。 0.51
en. In: Memory & Cognition 28.2 (Mar. 2000), pp. 264–281. エン in: memory & cognition 28.2 (mar. 2000), pp. 264-281。 0.60
ISSN: 0090-502X, 1532-5946. ISSN:0090-502X、1532-5946。 0.60
DOI: 10.3758/BF03213805. doi: 10.3758/bf03213805。 0.37
URL: http://link.springer .com/10.3758/BF03213 805 (visited on 12/02/2021) (cit. on p. 2). URL: http://link.springer .com/10.3758/BF03213 805 (visited on 12/02/2021) (cit. on p.2) 0.30
[13] Ruth M.J. Byrne. 13]ルース・M・J・バーン 0.53
“Mental models and counterfactual thoughts about what might have been”. 真面目なモデルと、それに対する反ファクト的な考え方”。 0.54
en. In: Trends in Cognitive エン In:認知のトレンド 0.50
Sciences 6.10 (Oct. 2002), pp. 426–431. sciences 6.10 (oct. 2002), pp. 426-431。 0.74
ISSN: 13646613. ISSN:13646613。 0.67
DOI: 10.1016/S1364-6613(0 2)01974-5. doi: 10.1016/s1364-6613(0 2)01974-5。 0.19
URL: https://linkinghub.e lsevier.com/retrieve /pii/S13646613020197 45 (visited on 12/01/2021) (cit. on p. 2). URL: https://linkinghub.e lsevier.com/retrieve /pii/S13646613020197 45 (visited on 12/01/2021) (cit. on p.2) 0.30
[14] Ruth M.J. Byrne. 14]ルース・M・J・バーン 0.54
“Counterfactual Thought”. en. In: Annual Review of Psychology 67.1 (Jan. 2016), pp. 135–157. 「国思想」。 エン In: Annual Review of Psychology 67.1 (Jan. 2016), pp. 135–157。 0.43
ISSN: 0066-4308, 1545-2085. ISSN 0066-4308, 1545-2085. 0.29
DOI: 10.1146/annurev-psyc h-122414-033249. DOI: 10.1146/annurev-psyc h-122414-033249 0.20
URL: http://www.annualrev iews.org/doi/10.1146 /annurev-psych-12241 4-033249 (visited on 08/02/2019) (cit. on p. 2). url: http://www.annualrev iews.org/doi/10.1146 /annurev-psych-12241 4-033249 (08/02/2019) (p.2) 0.27
[15] Michelene T. H. Chi and Ruth Wylie. 15] ミシュリーン・t・h・チと ルース・ワイリー 0.51
“The ICAP Framework: Linking Cognitive Engagement to Active Learning Outcomes”. icapフレームワーク: 認知的関与とアクティブな学習結果のリンク。 0.50
en. In: Educational Psychologist 49.4 (Oct. 2014), pp. 219–243. エン in: 教育心理学者49.4 (oct. 2014), pp. 219-243。 0.51
ISSN: 0046-1520, 1532-6985. ISSN:0046-1520、1532-6985 0.69
DOI: 10.1080/00461520.201 4.965823. doi: 10.1080/00461520.201 4.965823。 0.31
URL: http://www.tandfonli ne.com/doi/abs/10.10 80/00461520.2014.965 823 (visited on 08/25/2021) (cit. on p. 11). url: http://www.tandfonli ne.com/doi/abs/10.10 80/00461520.2014.965 823(08/25/2021) 0.26
[16] Louise Connell and Mark T. Keane. 16]ルイーズ・コネルとマーク・t・キーン 0.52
“A Model of Plausibility”. 「可能性のモデル」。 0.62
en. In: Cognitive Science 30.1 (Jan. 2006), pp. 95–120. エン 認知科学30.1(2006年6月)、p.95-120。 0.43
ISSN: 03640213. ISSN 03640213. 0.34
DOI: 10.1207/s15516709cog 0000_53. 10.1207/s15516709cog 0000_53。 0.33
URL: http://doi.wiley.com /10.1207/s15516709co g0000_53 (visited on 12/01/2021) (cit. on p. 3). URL: http://doi.wiley.com /10.1207/s15516709co g0000_53 (visited on 12/01/2021) (cit. on p. 3) 0.28
Susanne Dandl, Christoph Molnar, Martin Binder, and Bernd Bischl. スザンヌ・ダンドル、クリストフ・モルナー、マーティン・ビンダー、ベルント・ビシュル。 0.48
“Multi-Objective Counterfactual Explanations”. 「多目的対実説明」。 0.66
en. In: International Conference on Parallel Problem Solving from Nature. エン en:international conference on parallel problem solve from nature(英語) 0.58
Vol. 12269. vol.1。 12269. 0.41
Cham: Springer International Publishing, 2020, pp. 448–469. Cham: Springer International Publishing, 2020, pp. 448-469。 0.47
ISBN: 978-3-030-58111-4 978-3-030-58112-1. ISBN: 978-3-030-58111-4 978-3-030-58112-1。 0.15
DOI: 10.1007/978-3-030-58 112-1_31. DOI:10.1007/978-3-03 0-58112-1_31。 0.12
URL: http://link.springer .com/10.1007/978-3-0 30-58112-1_31 (visited on 08/16/2021) (cit. on p. 2). url: http://link.springer .com/10.1007/978-3-0 30-58112-1_31 (08/16/2021) (p.2) を参照。 0.46
F. De Brigard, D.R. Addis, J.H. Ford, D.L. Schacter, and K.S. Giovanello. F. De Brigard, D.R. Addis, J.H. Ford, D.L. Schacter, K.S. Giovanello 0.43
“Remembering what could have happened: Neural correlates of episodic counterfactual thinking”. 起こりうることを思い出す: エピソード的反事実的思考の神経的相関」。 0.68
en. In: Neuropsychologia 51.12 (Oct. 2013), pp. 2401–2414. エン 神経心理学 51.12 (Oct. 2013), pp. 2401–2414。 0.52
ISSN: 00283932. ISSN:00283932。 0.67
DOI: 10.1016/j.neuropsych ologia.2013.01.015. doi: 10.1016/j.neuropsych ologia.2013.01.015。 0.27
URL: https://linkinghub.e lsevier.com/retrieve /pii/S00283932130002 98 (visited on 12/02/2021) (cit. on pp. 3, 11). URL: https://linkinghub.e lsevier.com/retrieve /pii/S00283932130002 98 (visited on 12/02/2021) (cit. on pp. 3, 11)。 0.32
Felipe De Brigard, Paul Henne, and Matthew L. Stanley. Felipe De Brigard、Paul Henne、Matthew L. Stanley。 0.81
“Perceived similarity of imagined possible worlds affects judgments of counterfactual plausibility”. 想像可能な世界の類似性は、反事実的可能性の判断に影響する」。 0.63
en. In: Cognition 209 (Apr. 2021), p. 104574. エン 209号(2021年4月)、p.104574。 0.43
ISSN: 00100277. ISS:00100277。 0.31
DOI: 10.1016/j.cognition. 2020.104574. DOI: 10.1016/j.cognition. 2020.104574 0.20
URL: https://linkinghub.e lsevier.com/retrieve /pii/S00100277203039 30 (visited on 12/01/2021) (cit. on pp. 3, 11). url: https://linkinghub.e lsevier.com/retrieve /pii/s00100277203039 30 (visited on 12/01/2021) (cit. on pp. 3, 11) 0.32
Felipe De Brigard, Karl K. Szpunar, and Daniel L. Schacter. Felipe De Brigard、Karl K. Szpunar、Daniel L. Schacter。 0.41
“Coming to Grips With the Past: Effect of Repeated Simulation on the Perceived Plausibility of Episodic Counterfactual Thoughts”. 「過去と握り合う:反復シミュレーションがエピソディックな反事実的思考の知覚可能性に及ぼす影響」 0.68
In: Psychological Science 24.7 (July 2013), pp. 1329–1334. in:psychological science 24.7 (2013年7月), pp. 1329-1334。 0.70
ISSN: 0956-7976. ISS:0956-7976。 0.45
DOI: 10.1177/095679761246 8163. DOI10.1177/095679761 2468163 0.32
URL: https://doi.org/10.1 177/0956797612468163 (visited on 03/02/2020) (cit. on p. 2). url: https://doi.org/10.1 177/0956797612468163 (03/02/2020) (p.2) 0.35
[17] [18] [19] [17] [18] [19] 0.42
[20] [22] [21] Michelle A. Detry and Yan Ma. [20] [22] 21] ミシェル・a・デトリーとヤン・マ 0.51
“Analyzing Repeated Measurements Using Mixed Models”. 「混合モデルによる繰り返し測定を分析。」 0.82
en. In: JAMA 315.4 (Jan. 2016), エン JAMA 315.4(2016年6月) 0.49
p. 407. ISSN: 0098-7484. 背番号407。 ISSN:0098-7484。 0.48
DOI: 10.1001/jama.2015.19 394. doi: 10.1001/jama.2015.19 394。 0.34
URL: http://jama.jamanetw ork.com/article.aspx ? URL: http://jama.jamanetw ork.com/article.aspx ? 0.24
doi=10.1001/jama.2015.19 394 (visited on 10/14/2021) (cit. on p. 8). doi=10.1001/jama.2015.19 394 (10/14/2021) (p.8)。 0.62
James E. Dixon and Ruth M. J. Byrne. ジェームズ・E・ディクソンとルース・J・バーン。 0.47
““If only” counterfactual thoughts about exceptional actions”. 「例外的行為に関する反事実的考えに限るならば」 0.66
en. In: Memory & Cognition 39.7 (Oct. 2011), pp. 1317–1331. エン Memory & Cognition 39.7 (Oct. 2011), pp. 1317–1331。 0.37
ISSN: 0090-502X, 1532-5946. ISSN:0090-502X、1532-5946。 0.60
DOI: 10.3758/s13421-011-0 101-4. DOI: 10.3758/s13421-011-0 101-4。 0.16
URL: http://link.springer .com/10.3758/s13421- 011-0101-4 (visited on 12/02/2021) (cit. on p. 2). URL: http://link.springer .com/10.3758/s13421- 011-0101-4 (visited on 12/02/2021) (cit. on p.2) 0.26
[23] Finale Doshi-Velez and Been Kim. [23]最終回 同志VelezとBeen Kim 0.64
“Towards A Rigorous Science of Interpretable Machine Learning”. 「解釈可能な機械学習の厳密な科学をめざす。」 0.76
en. In: arXiv:1702.08608 (Feb. 2017). エン 院 arXiv:1702.08608 (2017年2月) 0.37
URL: http://arxiv.org/abs /1702.08608 (cit. on pp. 2, 5). URL: http://arxiv.org/abs /1702.08608 (it. on pp. 2, 5)。 0.36
[24] Kai Epstude and Neal J. Roese. 24]カイ・エプスチュードとニール・j・ローゼ 0.55
“The Functional Theory of Counterfactual Thinking”. 「反事実的思考の機能理論」。 0.78
In: Personality and social psychology review : an official journal of the Society for Personality and Social Psychology, Inc 12.2 (May 2008), pp. 168–192. in: パーソナリティ・アンド・ソーシャル心理学レビュー: a official journal of the society for personality and social psychology, inc 12.2 (2008年5月), pp. 168–192。 0.85
ISSN: 1088-8683. issn: 1088-8683。 0.37
DOI: 10.1177/108886830831 6091. DOI10.1177/108886830 8316091 0.29
URL: https://www.ncbi.nlm .nih.gov/pmc/article s/PMC2408534/ (cit. on p. 2). url: https://www.ncbi.nlm .nih.gov/pmc/article s/pmc2408534/ 0.27
[25] Vittorio Girotto, Paolo Legrenzi, and Antonio Rizzo. 25]ヴィットリオ・ジロート、パオロ・レジェンツィ、アントニオ・リッツォ 0.41
“Event controllability in counterfactual thinking”. 「反現実的思考におけるイベント制御可能性」 0.61
en. In: Acta Psychologica 78.1-3 (Dec. 1991), pp. 111–133. エン Acta Psychologica 78.1-3 (1991年) pp. 111–133。 0.58
ISSN: 00016918. ISS:00016918。 0.43
DOI: 10.1016/0001-6918(91 )90007-M. DOI 10.1016/0001-6918(91 )90007-M 0.32
URL: https://linkinghub.e lsevier.com/retrieve /pii/000169189190007 M (visited on 12/02/2021) (cit. on p. 2). URL: https://linkinghub.e lsevier.com/retrieve /pii/000169189190007 M (visited on 12/02/2021) (cit. on p. 2) 0.31
[26] Lydia P. Gleaves, Reva Schwartz, and David A. Broniatowski. Lydia P. Gleaves氏、Reva Schwartz氏、David A. Broniatowski氏。 0.74
“The Role of Individual User Differences in Interpretable and 『解釈・解釈における個人差の役割』 0.64
Explainable Machine Learning Systems”. 説明可能な機械学習システム”。 0.81
In: arXiv:2009.06675 [cs] (Sept. 2020). arXiv:2009.06675 [cs] (2020年9月) 0.43
URL: http://arxiv.org/abs /2009.06675 (visited on 11/30/2021) (cit. on p. 12). URL: http://arxiv.org/abs /2009.06675 (visited on 11/30/2021) (cit. on p. 12)。 0.31
[27] Stephen D. Goldinger, Heather M. Kleider, Tamiko Azuma, and Denise R. Beike. [27]スティーブン・D・ゴルディンガー、ヘザー・M・クレイダー、東田美子、デニス・R・ベイク。 0.46
“"Blaming The Victim" Under Memory 「犠牲者の刃傷」の記憶 0.61
Load”. en. In: Psychological Science 14.1 (Jan. 2003), pp. 81–85. ロード”。 エン 心理学14.1(2003年1月)、p.81-85。 0.51
ISSN: 0956-7976, 1467-9280. ISSN:0956-7976,1467- 9280 0.37
DOI: 10.1111/1467-9280.01 423. doi: 10.1111/1467-9280.01 423。 0.31
URL: http://journals.sage pub.com/doi/10.1111/ 1467-9280.01423 (visited on 02/24/2020) (cit. on p. 2). url: http://journals.sage pub.com/doi/10.1111/ 1467-9280.01423 (02/24/2020) (p.2) 0.28
14 14 0.42
英語(論文から抽出)日本語訳スコア
[28] Riccardo Guidotti, Anna Monreale, Salvatore Ruggieri, Dino Pedreschi, Franco Turini, and Fosca Giannotti. Riccardo Guidotti, Anna Monreale, Salvatore Ruggieri, Dino Pedreschi, Franco Turini, Fosca Giannotti 0.29
“Local Rule-Based Explanations of Black Box Decision Systems”. 「普通」 ブラックボックス決定システムの規則に基づく説明」。 0.64
In: arXiv:1805.10820 [cs] (May 2018). arXiv:1805.10820 [cs] (2018年5月) 0.34
URL: http://arxiv.org/abs /1805.10820 (visited on 08/16/2021) (cit. on p. 2). url: http://arxiv.org/abs /1805.10820 (08/16/2021) (p.2以降)。 0.65
[29] Riccardo Guidotti, Anna Monreale, Salvatore Ruggieri, Franco Turini, Fosca Giannotti, and Dino Pedreschi. Riccardo Guidotti, Anna Monreale, Salvatore Ruggieri, Franco Turini, Fosca Giannotti, Dino Pedreschi 0.29
“A Survey of Methods for Explaining Black Box Models”. 「ブラックボックスモデルを説明する方法のサーベイ」 0.60
en. In: ACM Computing Surveys 51.5 (Jan. 2019), pp. 1–42. エン ACM Computing Surveys 51.5 (Jan. 2019), pp. 1–42。 0.58
ISSN: 0360-0300, 1557-7341. issn: 0360-0300, 1557-7341。 0.38
DOI: 10.1145/3236009. doi: 10.1145/3236009。 0.45
URL: https://dl.acm.org/d oi/10.1145/3236009 (cit. on p. 2). URL: https://dl.acm.org/d oi/10.1145/3236009 (cit. on p. 2) 0.29
[30] Fritz Heider. 30] フリッツ・ハイダー 0.39
The psychology of interpersonal relations. New York, NY, US: John Wiley & Sons Ltd., 1958 (cit. on p. 1). 対人関係の心理学。 New York, NY, US: John Wiley & Sons Ltd., 1958 (cit. on p. 1) 0.53
[31] Denis J. Hilton and Ben R. Slugoski. 31] デニス・j・ヒルトンとベン・r・スルゴスキー 0.63
“Knowledge-based causal attribution: The abnormal conditions focus model.” en. 知識に基づく因果帰属:異常条件焦点モデル」について 0.72
In: Psychological Review 93.1 (1986), pp. 75–88. in: psychological review 93.1 (1986), pp. 75-88。 0.89
ISSN: 1939-1471, 0033-295X. ISSN: 1939-1471, 0033-295X。 0.31
DOI: 10.1037/0033-295X.93 .1.75. DOI 10.1037/0033-295X.93 .1.75 0.35
URL: http://doi.apa.org/g etdoi.cfm? URL: http://doi.apa.org/g etdoi.cfm? 0.24
doi=10.1037/0033-295X.93 .1.75 (visited on 08/13/2021) (cit. on p. 2). doi=10.1037/0033-295x.93 .1.75(08/13/2021) 0.33
[32] Andreas Holzinger, André Carrington, and Heimo Müller. 32]アンドレアス・ホルジンガー、アンドレ・キャリントン、ハイモ・ミュラー 0.48
“Measuring the Quality of Explanations: The System Causability 「解説の質を測る:システム利用可能性」 0.79
Scale (SCS): Comparing Human and Machine Explanations”. スケール(SCS):人間と機械の説明を比較する。 0.82
en. In: KI - Künstliche Intelligenz 34.2 (Jan. 2020), pp. 193–198. エン KI - Künstliche Intelligenz 34.2 (Jan. 2020), pp. 193–198。 0.37
ISSN: 0933-1875, 1610-1987. ISSN:0933-1875,1610- 1987 0.35
DOI: 10.1007/s13218-020-0 0636-z. doi: 10.1007/s13218-020-0 0636-z。 0.13
URL: http://link.springer .com/10.1007/s13218- 020-00636-z (visited on 05/25/2020) (cit. on pp. 4, 5, 7, 10, 12). url: http://link.springer .com/10.1007/s13218- 020-00636-z ( 05/25/2020) (cit. on pp. 4, 5, 7, 10, 12)。 0.30
[33] P. N. Johnson-Laird and Ruth M. J. Byrne. 33] p. n. johnson-laird と ruth m. j. byrne 。 0.63
“Conditionals: A theory of meaning, pragmatics, and inference.” en. 「条件論:意味論、実用論、推論論」。 0.53
In: Psychological Review 109.4 (2002), pp. 646–678. 院 書評 109.4 (2002), pp. 646-678。 0.39
ISSN: 1939-1471, 0033-295X. ISSN: 1939-1471, 0033-295X。 0.31
DOI: 10.1037/0033-295X.10 9.4.646. doi: 10.1037/0033-295x.10 9.4.646。 0.21
URL: http://doi.apa.org/g etdoi.cfm? URL: http://doi.apa.org/g etdoi.cfm? 0.24
doi=10.1037/0033-295X.10 9.4.646 (visited on 12/01/2021) (cit. on p. 2). doi=10.1037/0033-295x.10 9.4.646 (12/01/2021) (p. 2) 0.27
[34] Daniel Kahneman and Amos Tversky. 34] ダニエル・カーネマンと エイモス・トベルスキー 0.56
“The simulation heuristic”. 「シミュレーションヒューリスティック」。 0.56
In: Judgment under Uncertainty. In:不確実性による判決。 0.64
Ed. by Daniel Kahneman, エド ダニエル・カーネマン。 0.45
Paul Slovic, and Amos Tversky. ポール・スロヴィチとアモス・トヴェルスキー。 0.57
1st ed. Cambridge, UK: Cambridge University Press, Apr. 1982, pp. 201–208. 第1回。 ケンブリッジ大学出版局、1982年4月、p.201-208。 0.55
ISBN: 978-0-521-28414-1 978-0-521-24064-2 978-0-511-80947-7. ISBN: 978-0-521-28414-1 978-0-521-24064-2 978-0-511-80947-7。 0.13
DOI: 10.1017/CBO978051180 9477.015. DOI 10.1017/CBO978051180 9477.015 0.27
URL: https://www.cambridg e.org/core/product/i dentifier/CBO9780511 809477A026/type/book _part (visited on 02/25/2020) (cit. on p. 2). URL: https://www.cambridg e.org/core/product/i dentifier/CBO9780511 809477A026/type/book _part (visited on 02/25/2020) (cit. on p.2) 0.24
[35] Amir-Hossein Karimi, Gilles Barthe, Bernhard Schölkopf, and Isabel Valera. [35]Amir-Hossein Karimi, Gilles Barthe, Bernhard Schölkopf, Isabel Valera 0.37
“A survey of algorithmic recourse: definitions, 「アルゴリズムの言説に関する調査:定義、 0.72
formulations, solutions, and prospects”. 定式化、解決、そして展望」。 0.54
In: arXiv preprint arXiv:2010.04050 (2020) (cit. on pp. 3, 12). in: arxiv preprint arxiv:2010.04050 (2020) (cit. on pp. 3, 12)。 0.65
[36] Mark T. Keane, Eoin M. Kenny, Eoin Delaney, and Barry Smyth. Mark T. Keane氏、Eoin M. Kenny氏、Eoin Delaney氏、Barry Smyth氏。 0.77
“If Only We Had Better Counterfactual Explanations: Five Key Deficits to Rectify in the Evaluation of Counterfactual XAI Techniques”. 対実的説明が改善したならば, 対実的XAI技術の評価における5つの重要な欠陥」 0.75
In: arXiv:2103.01035 [cs] (Feb. 2021). arXiv:2103.01035 [cs] (2021年2月) 0.42
URL: http://arxiv.org/abs /2103.01035 (cit. on pp. 2, 12). URL: http://arxiv.org/abs /2103.01035 (cit. on pp. 2, 12)。 0.35
[37] Ulrike Kuhl, André Artelt, and Barbara Hammer. Ulrike Kuhl氏、André Artelt氏、Barbara Hammer氏。 0.62
“Let’s Go to the Alien Zoo: Introducing an Experimental Framework to Ret’s Go to the Alien Zoo: 実験的なフレームワークの導入 0.70
Study Usability of Counterfactual Explanations for Machine Learning”. 機械学習における反事実説明のユーザビリティの検討 0.81
In: arXiv:2205.03398 [cs] (May 2022). arXiv:2205.03398 [cs] (2022年5月) 0.41
URL: https://arxiv.org/ab s/2205.03398 (visited on 05/09/2022) (cit. on pp. 3, 5, 12). url: https://arxiv.org/ab s/2205.03398 ( 05/09/2022) (cit., pp. 3, 5, 12)。 0.71
[38] Eugenia Kulakova, Markus Aichhorn, Matthias Schurz, Martin Kronbichler, and Josef Perner. [38] Eugenia Kulakova, Markus Aichhorn, Matthias Schurz, Martin Kronbichler, Josef Perner 0.36
“Processing counterfactual and hypothetical conditionals: An fMRI investigation”. 反事実的・仮説的条件:fMRIによる調査」。 0.58
en. In: NeuroImage 72 (May 2013), pp. 265–271. エン NeuroImage 72 (2013年5月). pp. 265-271。 0.53
ISSN: 10538119. ISS:10538119。 0.36
DOI: 10.1016/j.neuroimage .2013.01.060. DOI: 10.1016/j.neuroimage .2013.01.060 0.18
URL: https://linkinghub.e lsevier.com/retrieve /pii/S10538119130010 79 (visited on 12/01/2021) (cit. on p. 2). URL: https://linkinghub.e lsevier.com/retrieve /pii/S10538119130010 79 (visited on 12/01/2021) (cit. on p.2) 0.30
[39] Leah Kumle, Melissa L. 39]Leah Kumle, Melissa L。 0.33
-H. Võ, and Dejan Draschkow. -h。 ディジャン・ドラシュコウ(Dejan Draschkow)とも。 0.66
“Estimating power in (generalized) linear mixed models: An open 「(一般化)線形混合モデルにおけるパワー推定:オープン 0.89
introduction and tutorial in R”. Rでの紹介とチュートリアル”。 0.69
en. In: Behavior Research Methods 53.6 (May 2021), pp. 2528–2543. エン in: behavior research methods 53.6 (may 2021), pp. 2528-2543。 0.38
ISSN: 1554-3528. ISS:1554-3528。 0.38
DOI: 10.3758/s13428-021-0 1546-0. DOI 10.3758/s13428-021-0 1546-0。 0.16
URL: https://link.springe r.com/10.3758/s13428 -021-01546-0 (visited on 11/30/2021) (cit. on p. 6). url: https://link.springe r.com/10.3758/s13428 -021-01546-0 (11/30/2021) (p.6) 0.27
[40] Thibault Laugel, Marie-Jeanne Lesot, Christophe Marsala, and Marcin Detyniecki. Thibault Laugel氏、Marie-Jeanne Lesot氏、Christophe Marsala氏、Marcin Detyniecki氏。 0.69
“Issues with post-hoc counterfactual 『ポストホック対策』 0.37
explanations: a discussion”. In: CoRR abs/1906.04774 (2019). 解説:「議論」。 CoRR abs/1906.04774 (2019)。 0.70
_eprint: 1906.04774. _eprint: 1906.04774。 0.34
URL: http://arxiv.org/abs /1906.04774 (cit. on p. 3). URL: http://arxiv.org/abs /1906.04774 (cit. on p. 3) 0.34
[41] David Lewis. デイヴィッド・ルイス(David Lewis)。 0.69
“Counterfactuals and Comparative Possibility”. 「国と比較可能性」。 0.29
In: IFS. Ed. 略称はIFS。 エド 0.38
by William L. Harper, Robert Stalnaker, and Glenn Pearce. William L. Harper, Robert Stalnaker, and Glenn Pearce による。 0.92
Dordrecht: Springer Netherlands, 1973, pp. 57–85. Dordrecht: Springer Netherlands, 1973, pp. 57-85。 0.89
ISBN: 978-90-277-1220-2 978-94-009-9117-0. ISBN: 978-90-277-1220-2 978-94-009-9117-0。 0.15
DOI: 10.1007/978-94-009-9 117-0_3. DOI 10.1007/978-94-009-9 117-0_3 0.16
URL: http://link.springer .com/10.1007/978-94- 009-9117-0_3 (visited on 12/01/2021) (cit. on pp. 2, 3, 11). URL: http://link.springer .com/10.1007/978-94- 009-9117-0_3 (visited on 12/01/2021) (cit. on pp. 2, 3, 11)。 0.27
[42] Brian Y. Lim, Anind K. Dey, and Daniel Avrahami. Brian Y. Lim氏、Anind K. Dey氏、Daniel Avrahami氏。 0.71
“Why and why not explanations improve the intelligibility of 「なぜ、なぜ説明が無知性を改善するのか」 0.72
[43] context-aware intelligent systems”. [43] コンテキスト対応インテリジェントシステム”。 0.57
en. In: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. エン In:SIGCHI Conference on Human Factors in Computing Systems に参加して 0.54
Boston MA USA: ACM, Apr. 2009, pp. 2119–2128. Boston MAUSA: ACM, ACM, 2009, pp. 2119–2128。 0.84
ISBN: 978-1-60558-246-7. ISBN: 978-1-60558-246-7。 0.22
DOI: 10.1145/1518701.1519 023. DOI 10.1145/1518701.1519 023 0.30
URL: https://dl.acm.org/d oi/10.1145/1518701.1 519023 (cit. on p. 11). URL: https://dl.acm.org/d oi/10.1145/1518701.1 519023 (p.11)。 0.27
Peter Lipton. ピーター・リプトン。 0.71
“Contrastive Explanation”. en. 「矛盾する説明」。 エン 0.48
In: Royal Institute of Philosophy Supplement 27 (Mar. 1990), pp. 247–266. in:royal institute of philosophy supplement 27 (1990年10月) pp. 247-266。 0.73
ISSN: 1358-2461, 1755-3555. ISSN 1358-2461, 1755-3555 0.41
DOI: 10.1017/S13582461000 05130. DOI 10.1017/S13582461000 05130 0.34
URL: https://www.cambridg e.org/core/product/i dentifier/S135824610 0005130/type/journal _article (visited on 08/13/2021) (cit. on p. 2). url: https://www.cambridg e.org/core/product/i dentifier/s135824610 0005130/type/journal _article (08/13/2021) (p.2) 0.25
[44] Gordon D Logan. ゴードン・D・ローガン(Gordon D Logan)。 0.51
“Shapes of Reaction-Time Distributions and Shapes of Learning Curves: A Test of the Instance Theory of 『学習曲線の反応時間分布と形状:事例論の検証』 0.60
Automaticity”. en. In: Journal of Experimental Psychology: Learning, Memory, and Cognition 18.5 (1992), pp. 883–914 (cit. on pp. 5, 11). 自動性」。 エン Journal of Experimental Psychology: Learning, Memory, and Cognition 18.5 (1992), pp. 883–914 (cit. on pp. 5, 11)。
訳抜け防止モード: 自動性」。 エン 実験心理学雑誌 : 学習・記憶・記憶 and Cognition 18.5 (1992 ), pp . 883–914 ( cit )。 pp. 5 , 11 )。
0.50
[45] Tania Lombrozo. 45] タニア・ロンブロゾ 0.40
“Explanation and Abductive Inference”. 「説明と帰納的推論」。 0.31
In: The Oxford Handbook of Thinking and Reasoning. 原題:Oxford Handbook of Thinking and Reasoning。 0.64
Ed. by Keith J. Holyoak and Robert G. Morrison. エド ところで キース・J・ホリーオークとロバート・モリソン。 0.52
Oxford, UK: Oxford University Press, Mar. 2012, pp. 260–276. Oxford, UK: Oxford University Press, Mar. 2012, pp. 260-276。 0.92
DOI: 10.1093/oxfordhb/978 0199734689.013.0014. 10.1093/oxfordhb/978 0 199734689.013.0014。 0.13
URL: http://oxfordhandboo ks.com/view/10.1093/ oxfordhb/97801997346 89.001.0001/oxfordhb 9780199734689-e-14 (visited on 08/13/2021) (cit. on p. 2). url: http://oxfordhandboo ks.com/view/10.1093/ oxfordhb/97801997346 89.001.0001/oxfordhb 9780199734689-e-14(0 8/13/2021) 0.26
15 15 0.43
英語(論文から抽出)日本語訳スコア
[46] Arnaud Van Looveren and Janis Klaise. [46]Arnaud Van Looveren氏とJanis Klaise氏。 0.39
“Interpretable Counterfactual Explanations Guided by Prototypes”. 「原型による解釈可能な反事実的説明」 0.64
In: CoRR abs/1907.02584 (2019). イン:CoRR abs/1907.02584 (2019)。 0.67
_eprint: 1907.02584. _eprint:1907.02584。 0.33
URL: http://arxiv.org/abs /1907.02584 (cit. on p. 3). url: http://arxiv.org/abs /1907.02584 (p. 3) 0.36
[47] Keith D. Markman and Matthew N. McMullen. キース・D・マークマンとマシュー・N・マクマレン。 0.55
“A Reflection and Evaluation Model of Comparative Thinking”. 「比較思考の反映・評価モデル」 0.54
en. In: Personality and Social Psychology Review 7.3 (Aug. 2003), pp. 244–267. エン 院 人格・社会心理学レビュー 7.3 (2003年8月), pp. 244-267。 0.41
ISSN: 1088-8683, 1532-7957. ISSN 1088-8683, 1532-7957 0.42
DOI: 10.1207/S15327957PSP R0703_04. DOI 10.1207/S15327957PSP R0703_04 0.47
URL: http://journals.sage pub.com/doi/10.1207/ S15327957PSPR0703_04 (visited on 08/16/2021) (cit. on p. 11). URL: http://journals.sage pub.com/doi/10.1207/ S15327957PSPR0703_04 (ビジターは08/16/2021)。 0.53
[48] Victoria Husted Medvec and Kenneth Savitsky. 48] ビクトリア・ハステッド・メドベックと ケネス・サヴィツキー 0.53
“When doing better means feeling worse: The effects of categorical cutoff 「良くなったら、もっと悪い気持ちになる」:カテゴリー的カットオフの効果 0.75
points on counterfactual thinking and satisfaction. 反事実的思考と満足度に関するポイント。 0.58
” en. In: Journal of Personality and Social Psychology 72.6 (1997), pp. 1284–1296. という。 in: journal of personality and social psychology 72.6 (1997), pp. 1284-1296。 0.50
ISSN: 1939-1315, 0022-3514. ISSN:1939-1315、0022-3514。 0.33
DOI: 10.1037/0022-3514.72 .6.1284. DOI 10.1037/0022-3514.72 .6.1284 0.18
URL: http://doi.apa.org/g etdoi.cfm? URL: http://doi.apa.org/g etdoi.cfm? 0.24
doi=10.1037/0022-3514.72 .6.1284 (visited on 12/03/2021) (cit. on p. 11). doi=10.1037/0022-3514.72 .6.1284(p.11) 0.35
[49] Dale T. Miller and Saku Gunasegaram. [49]デール・t・ミラーとサク・グナゼガラム 0.33
“Temporal order and the perceived mutability of events: Implications for blame 「一時的な秩序と出来事のミュータビリティー:責任への含意 0.68
assignment. ” en. In: Journal of Personality and Social Psychology 59.6 (1990), pp. 1111–1118. 任務だ という。 Journal of Personality and Social Psychology 59.6 (1990), pp. 1111–1118。 0.48
ISSN: 1939-1315, 0022-3514. ISSN:1939-1315、0022-3514。 0.33
DOI: 10.1037/0022-3514.59 .6.1111. DOI 10.1037/0022-3514.59 .6.1111 0.18
URL: http://doi.apa.org/g etdoi.cfm? URL: http://doi.apa.org/g etdoi.cfm? 0.24
doi=10.1037/0022-3514.59 .6.1111 (visited on 12/02/2021) (cit. on p. 2). doi=10.1037/0022-3514.59 .1111(12/02/2021) 0.33
[50] Tim Miller. ティム・ミラー(Tim Miller) 0.60
“Explanation in artificial intelligence: Insights from the social sciences”. 「人工知能の解説:社会科学からの洞察」。 0.59
en. In: Artificial Intelligence 267 (Feb. エン 人工知能267(英語: AI 267)。 0.50
2019), pp. 1–38. 2019年、p.1-38。 0.66
ISSN: 00043702. ISSN: 00043702。 0.38
DOI: 10.1016/j.artint.201 8.07.007. DOI: 10.1016/j.artint.201 8.07.007。 0.16
URL: https://linkinghub.e lsevier.com/retrieve /pii/S00043702183059 88 (visited on 11/30/2021) (cit. on pp. 2, 3). URL: https://linkinghub.e lsevier.com/retrieve /pii/S00043702183059 88 (visited on 11/30/2021) (cit. on pp. 2, 3) 0.34
[51] Chelsea Muth, Karen L. Bales, Katie Hinde, Nicole Maninger, Sally P. Mendoza, and Emilio Ferrer. チェルシー・ミュース、カレン・L・バレス、ケイティ・ヒンデ、ニコル・マニンガー、サリー・P・メンドーサ、エミリオ・フェラー。
訳抜け防止モード: [51 ]Chelsea Muth,Karen L. Bales,Katie Hinde, ニコル・マニンガー、サリー・P・メンドーサ、エミリオ・フェラー。
0.64
“Alternative Models for Small Samples in Psychological Research: Applying Linear Mixed Effects Models and Generalized Estimating Equations to Repeated Measures Data”. 心理学研究における小サンプルの代替モデル--線形混合効果モデルの適用と反復測度データへの一般化推定方程式の適用」 0.79
en. In: Educational and Psychological Measurement 76.1 (Feb. 2016), pp. 64–87. エン in: education and psychological measurement 76.1 (2016年2月), pp. 64-87。 0.55
ISSN: 0013-1644, 1552-3888. ISSN:0013-1644、1552-3888 0.69
DOI: 10.1177/001316441558 0432. DOI10.1177/001316441 5580432 0.33
URL: http://journals.sage pub.com/doi/10.1177/ 0013164415580432 (visited on 11/18/2021) (cit. on p. 8). URL: http://journals.sage pub.com/doi/10.1177/ 0013164415580432 (visited on 11/18/2021) (cit. on p.8)。 0.28
[52] Fabian Offert. 52] ファビアン・オデット 0.40
“"I know it when I see it". Visualization and Intuitive Interpretability”. 「見たらわかるよ。可視化と直感的な解釈。」 0.54
In: arXiv:1711.08042 [stat] (Dec. 以下は、arXiv:1711.08042[stat]。 0.58
2017). URL: http://arxiv.org/abs /1711.08042 (cit. on p. 2). 2017). url: http://arxiv.org/abs /1711.08042 (p.2) 0.39
[53] Raphael Mazzine Barbosa de Oliveira and David Martens. 53] ラファエル・マジーヌ・バルボサ・デ・オリベイラとデビッド・マルテンス 0.34
“A Framework and Benchmarking Study for Counterfactual 「対物関係の枠組みとベンチマーク研究」 0.76
Generating Methods on Tabular Data”. 表データ上でメソッドを生成する。 0.66
en. In: Applied Sciences 11.16 (Aug. 2021), p. 7274. エン 応用科学11.16(2021年8月)p.7274。 0.47
ISSN: 2076-3417. 日系:2076-3417。 0.31
DOI: 10.3390/app11167274. DOI10.3390/app111672 74 0.24
URL: https://www.mdpi.com /2076-3417/11/16/727 4 (visited on 01/05/2022) (cit. on p. 2). url: https://www.mdpi.com /2076-3417/11/16/727 4 (01/05/2022 で訪問)。 0.29
[54] Nicolas Papernot, Patrick McDaniel, Ian Goodfellow, Somesh Jha, Z. Berkay Celik, and Ananthram Swami. 54] Nicolas Papernot, Patrick McDaniel, Ian Goodfellow, Somesh Jha, Z. Berkay Celik, Ananthram Swami。
訳抜け防止モード: 54]ニコラス・ペーパーノー パトリック・マクダニエル イアン・グッドフェロー somesh jha, z. berkay celik, ananthram swami。
0.59
“Practical Black-Box Attacks against Machine Learning”. 『実践』 マシンラーニングに対するブラックボックス攻撃”。 0.64
en. In: Proceedings of the 2017 ACM on Asia Conference on Computer and Communications Security. エン 2017年、ACM on Asia Conference on Computer and Communications Security に参加。 0.51
Abu Dhabi United Arab Emirates: ACM, Apr. 2017, pp. 506–519. abu dhabi united arab emirates: acm, apr. 2017 pp. 506-519。 0.67
ISBN: 978-1-4503-4944-4. ISBN: 978-1-4503-4944-4。 0.22
DOI: 10.1145/3052973.3053 009. doi: 10.1145/3052973.3053 009。 0.39
URL: https://dl.acm.org/d oi/10.1145/3052973.3 053009 (visited on 01/05/2022) (cit. on p. 3). url: https://dl.acm.org/d oi/10.1145/3052973.3 053009 (01/05/2022) (p. 3) を参照。 0.53
[55] F. Pedregosa et al “Scikit-learn: Machine Learning in Python”. 55] f. pedregosa et al “scikit-learn: machine learning in python”。 0.40
In: Journal of Machine Learning Research 12 (2011), 英語) Journal of Machine Learning Research 12 (2011) 0.63
pp. 2825–2830 (cit. on p. 5). pp. 2825-2830(p.5)。 0.73
[56] Kathy Pezdek, Iris Blandon-Gitlin, Shirley Lam, Rhiannon Ellis Hart, and Jonathan W. Schooler. Kathy Pezdek, Iris Blandon-Gitlin, Shirley Lam, Rhiannon Ellis Hart, そしてJonathan W. Schooler。 0.38
“Is knowing believing? The 信じているのか? その... 0.44
role of event plausibility and background knowledge in planting false beliefs about the personal past”. 個人的過去についての虚偽の信念を植える際の出来事の可否と背景知識の役割」 0.73
en. In: Memory & Cognition 34.8 (Dec. 2006), pp. 1628–1635. エン Memory & Cognition 34.8 (2006年11月), pp. 1628–1635。 0.58
ISSN: 0090-502X, 1532-5946. ISSN:0090-502X、1532-5946。 0.60
DOI: 10.3758/BF03195925. DOI:10.3758/BF03 195925。 0.43
URL: http://link.springer .com/10.3758/BF03195 925 (visited on 12/02/2021) (cit. on pp. 3, 11). url: http://link.springer .com/10.3758/bf03195 925 (visited on 12/02/2021) (cit. on pp. 3, 11)。 0.30
[57] Rafael Poyiadzi, Kacper Sokol, Raúl Santos-Rodriguez, Tijl De Bie, and Peter A. Flach. 57]Rafael Poyiadzi, Kacper Sokol, Raúl Santos-Rodriguez, Tijl De Bie, Peter A. Flach。 0.39
“FACE: Feasible and Actionable FACE: 実現可能で実行可能 0.61
Counterfactual Explanations”. In: CoRR abs/1909.09369 (2019). 事実上の解説」。 略称:corr abs/1909.09369 (2019)。 0.54
_eprint: 1909.09369. _eprint: 1909.09369。 0.35
URL: http://arxiv.org/abs /1909.09369 (cit. on p. 3). URL: http://arxiv.org/abs /1909.09369 (cit. on p. 3) 0.34
[58] R Core Team. 58]Rコアチーム。 0.57
R: A Language and Environment for Statistical Computing. R: 統計計算のための言語と環境。 0.82
Vienna, Austria: R Foundation for Statistical オーストリア・ウィーン:r foundation for statistical 0.69
Computing, 2021. URL: https://www.R-projec t.org/ (cit. on p. 8). 計算、2021年。 URL: https://www.R-projec t.org/ (cit. on p.8)。 0.49
[59] Neal J. Roese. [59]ニール・j・ローゼ 0.59
“Counterfactual thinking”. en. 「内面的思考」。 エン 0.30
In: Psychological Bulletin 121.1 (1997), pp. 133–148. In: Psychological Bulletin 121.1 (1997), pp. 133-148。 0.93
ISSN: 1939-1455, ISSN:1939-1455 0.43
0033-2909. 0033-2909. 0.35
DOI: 10.1037/0033-2909.12 1.1.133. DOI 10.1037/0033-2909.12 1.1.133 0.18
URL: http://doi.apa.org/g etdoi.cfm? URL: http://doi.apa.org/g etdoi.cfm? 0.24
doi=10.1037/0033-2909.12 1.1.133 (visited on 08/13/2021) (cit. on p. 2). doi=10.1037/0033-2909.12 1.1.133 (08/13/2021) (p. 2) 0.29
[60] Neal J. Roese and Kai Epstude. [60]ニール・J・ローゼとカイ・エプストード。 0.60
“The Functional Theory of Counterfactual Thinking: New Evidence, New Challenges, New Insights”. 『反現実的思考の機能理論:新しい証拠、新しい挑戦、新しい洞察』。 0.78
en. In: Advances in Experimental Social Psychology. エン in: 実験的な社会心理学の進歩。 0.55
Vol. 56. vol.1。 56. 0.41
Amsterdam, Netherlands: Elsevier, 2017, pp. 1–79. アムステルダム, オランダ: elsevier, 2017 pp. 1-79。 0.76
ISBN: 978-0-12-812120-7. ISBN: 978-0-12-812120-7。 0.22
DOI: 10.1016/bs.aesp.2017 .02.001. DOI: 10.1016/bs.aesp.2017 .02.001 0.18
URL: https://linkinghub.e lsevier.com/retrieve /pii/S00652601173001 87 (visited on 08/16/2021) (cit. on p. 2). url: https://linkinghub.e lsevier.com/retrieve /pii/s00652601173001 87 (08/16/2021) (p.2) 0.32
[61] Lawrence J. Sanna and Kandi Jo Turley. [61]ローレンス・j・サンナとカンディ・ジョー・ターリー 0.54
“Antecedents to Spontaneous Counterfactual Thinking: Effects of Expectancy Violation and Outcome Valence”. 「自発的反事実的思考:期待性違反とアウトカム・ヴァレンスの効果」 0.67
In: Personality and Social Psychology Bulletin 22.9 (Sept. 1996), pp. 906–919. in: personality and social psychology bulletin 22.9 (sept. 1996), pp. 906-919。 0.43
ISSN: 0146-1672. ISSN:0146-1672。 0.32
DOI: 10.1177/014616729622 9005. DOI 10.1177/014616729622 9005 0.39
URL: https://doi.org/10.1 177/0146167296229005 (visited on 02/24/2020) (cit. on p. 2). url: https://doi.org/10.1 177/0146167296229005 (02/24/2020) (p.2) 0.35
[62] Maximilian Schleich, Zixuan Geng, Yihong Zhang, and Dan Suciu. マクシミリアン・シュライヒ(Maximilian Schleich)、ジクサン・ゲン(Zixuan Geng)、ヨン・チャン(Yihong Zhang)、ダン・スー(Dan Suciu)。 0.39
“GeCo: Quality Counterfactual Explanations in Real GeCo:現実の質の対実的説明 0.70
Time”. In: arXiv:2101.01292 [cs] (May 2021). 時間”。 arXiv:2101.01292 [cs] (2021年5月)。 0.36
URL: http://arxiv.org/abs /2101.01292 (visited on 11/30/2021) (cit. on p. 2). URL: http://arxiv.org/abs /2101.01292 (visited on 11/30/2021) (cit. on p.2) 0.33
Shai Shalev-Shwartz and Shai Ben-David. Shai Shalev-ShwartzとShai Ben-David。 0.35
Understanding machine learning: from theory to algorithms. 機械学習の理解: 理論からアルゴリズムまで。 0.84
New York, NY, USA: Cambridge University Press, 2014. new york, ny, usa: cambridge university press, 2014 (英語) 0.81
ISBN: 978-1-107-05713-5 (cit. on p. 5). ISBN: 978-1-107-05713-5(p. 5。 0.38
[63] [64] Barry Smyth and Mark T. Keane. [63] 64]バリー・スマイスとマーク・t・キーン 0.49
“A Few Good Counterfactuals: Generating Interpretable, Plausible and Diverse 「良い副次的要素は少ない。解釈可能、可塑性、多変量の生成」 0.41
Counterfactual Explanations”. In: arXiv:2101.09056 [cs] (Jan. 2021). 事実上の解説」。 arXiv:2101.09056 [cs] (Jan. 2021)。 0.44
arXiv: 2101.09056. arXiv: 2101.09056。 0.40
URL: http://arxiv.org/abs /2101.09056 (visited on 11/30/2021) (cit. on p. 2). URL: http://arxiv.org/abs /2101.09056 (visited on 11/30/2021) (cit. on p.2) 0.33
16 16 0.42
英語(論文から抽出)日本語訳スコア
[65] Matthew L. Stanley, Gregory W. Stewart, and Felipe De Brigard. [65]マシュー・l・スタンレー、グレゴリー・w・スチュワート、フェリペ・ド・ブリガード。 0.46
“Counterfactual Plausibility and Comparative Similarity”. 「事実的可能性と比較類似性」。 0.60
en. In: Cognitive Science 41 (May 2017), pp. 1216–1228. エン in:cognitive science 41 (2017年5月), pp. 1216-1228。 0.54
ISSN: 03640213. issn: 03640213。 0.39
DOI: 10.1111/cogs.12451. doi: 10.1111/cogs.12451。 0.40
URL: https://onlinelibrar y.wiley.com/doi/10.1 111/cogs.12451 (visited on 12/01/2021) (cit. on pp. 3, 11). URL: https://onlinelibrar y.wiley.com/doi/10.1 111/cogs.12451 (visited on 12/01/2021) (cit. on pp. 3, 11)。 0.30
Ilia Stepin, Alejandro Catala, Martin Pereira-Fariña, and Jose M. Alonso. Ilia Stepin、Alejandro Catala、Martin Pereira-Fariña、José M. Alonso。 0.87
“Paving the way towards counterfactual generation in argumentative conversational agents”. 「議論的会話エージェントにおける反事実生成への道を開く」 0.66
en. In: Proceedings of the 1st Workshop on Interactive Natural Language Technology for Explainable Artificial Intelligence (NL4XAI 2019). エン In: Proceedings of the 1st Workshop on Interactive Natural Language Technology for Explainable Artificial Intelligence (NL4XAI 2019) 0.38
Tokyo, Japan: Association for Computational Linguistics, 2019, pp. 20–25. 東京:計算言語学会、2019年、p.20-25。 0.55
DOI: 10.18653/v1/W19-8405 . DOI:10.18653/v1/W19- 8405 0.15
URL: https://www.aclweb.o rg/anthology/W19-840 5 (visited on 01/21/2020) (cit. on p. 2). URL: https://www.aclweb.o rg/anthology/W19-840 5 (visited on 01/21/2020) (cit. on p. 2) 0.31
[66] [68] [67] Sahil Verma, John Dickerson, and Keegan Hines. [66] [68] 67] サヒル・ヴェルマ、ジョン・ディッカーソン、キーガン・ハインズ 0.41
“Counterfactual Explanations for Machine Learning: A Review”. 「機械学習の実態説明:レビュー」 0.56
In: arXiv:2010.10596 [cs, stat] (Oct. 2020). 院 arXiv:2010.10596 [cs, stat] (Oct. 2020) 0.32
URL: http://arxiv.org/abs /2010.10596 (cit. on p. 3). URL: http://arxiv.org/abs /2010.10596 (cit. on p. 3) 0.34
Jasper van der Waa, Elisabeth Nieuwburg, Anita Cremers, and Mark Neerincx. Jasper van der Waa, Elisabeth Nieuwburg, Anita Cremers, Mark Neerincx 0.34
“Evaluating XAI: A comparison of rule-based and example-based explanations”. 「XAIの評価:ルールベースと例ベースの説明の比較」 0.82
en. In: Artificial Intelligence 291 (Feb. 2021), p. 103404. エン 人工知能291号(2021年2月)、p.103404。 0.45
ISSN: 00043702. ISSN: 00043702。 0.38
DOI: 10.1016/j.artint.202 0.103404. DOI: 10.1016/j.artint.202 0.103404 0.20
URL: https://linkinghub.e lsevier.com/retrieve /pii/S00043702203015 33 (visited on 08/10/2021) (cit. on pp. 2, 4, 11, 12). url: https://linkinghub.e lsevier.com/retrieve /pii/s00043702203015 33 (08/10/2021) (cit. on pp. 2, 4, 11, 12) 0.34
[69] Sandra Wachter, Brent Mittelstadt, and Chris Russell. Sandra Wachter氏、Brent Mittelstadt氏、Chris Russell氏。 0.59
“Counterfactual explanations without opening the black box: ブラックボックスを開けることなく説明をしよう。 0.62
Automated decisions and the GDPR”. 自動化された意思決定とgdpr”。 0.46
In: Harv. JL & Tech. 原題:Harv。 jl&tech所属。 0.65
31 (2017). 31 (2017). 0.42
Publisher: HeinOnline, p. 841 (cit. on pp. 3, 11). 出版者:HeinOnline, pp. 841 (cit. on pp. 3, 11)。 0.74
[70] C.R. Walsh and Ruth M.J. Byrne. C.R.ウォルシュとRuth M.J. Byrne 0.70
“The mental representation of what might have been”. 「何があったかの精神的な表現」。 0.69
In: The psychology of counterfactual thinking. イン:対実の心理学 考えて 0.74
Ed. by D.R. Mandel, Denis J. Hilton, and P. Catellani. エド D.R.マンデル、Denis J. Hilton、P. Catellaniによる。 0.60
Routledge Research International Series in Social Psychology. Routledge Research International Series in Social Psychology (英語) 0.88
London: Routledge, 2005, pp. 61–73 (cit. on p. 2). ロンドン: routledge, 2005, pp. 61-73 (cit. on p. 2)。 0.85
[71] Adam White and Artur d’Avila Garcez. アダム・ホワイトとアルトゥール・ダビラ・ガルセス。 0.34
“Measurable Counterfactual Local Explanations for Any Classifier”. 任意の分類のための計測可能な実測的局所説明」 0.53
en. In: ECAI. エン 略称:ECAI。 0.39
Santiago de Compostela, Spain, 2020, p. 7 (cit. on p. 2). Santiago de Compostela, Spain, 2020, p. 7 (cit. on p. 2)。 0.46
17 17 0.43
                                   ページの最初に戻る

翻訳にはFugu-Machine Translatorを利用しています。