論文の概要: Two4Two: Evaluating Interpretable Machine Learning - A Synthetic Dataset
For Controlled Experiments
- arxiv url: http://arxiv.org/abs/2105.02825v1
- Date: Thu, 6 May 2021 17:14:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 13:35:50.787525
- Title: Two4Two: Evaluating Interpretable Machine Learning - A Synthetic Dataset
For Controlled Experiments
- Title(参考訳): two4two: 解釈可能な機械学習の評価 - 制御実験のための合成データセット
- Authors: Martin Schuessler, Philipp Wei{\ss}, Leon Sixt
- Abstract要約: 2つの3D抽象動物の合成画像データを生成するライブラリを紹介します。
得られたデータは、アルゴリズムおよび人的対象評価に適しています。
私たちのアプローチは、人間の主観評価を行うための障壁を大幅に下げます。
- 参考スコア(独自算出の注目度): 6.123324869194195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A growing number of approaches exist to generate explanations for image
classification. However, few of these approaches are subjected to human-subject
evaluations, partly because it is challenging to design controlled experiments
with natural image datasets, as they leave essential factors out of the
researcher's control. With our approach, researchers can describe their desired
dataset with only a few parameters. Based on these, our library generates
synthetic image data of two 3D abstract animals. The resulting data is suitable
for algorithmic as well as human-subject evaluations. Our user study results
demonstrate that our method can create biases predictive enough for a
classifier and subtle enough to be noticeable only to every second participant
inspecting the data visually. Our approach significantly lowers the barrier for
conducting human subject evaluations, thereby facilitating more rigorous
investigations into interpretable machine learning. For our library and
datasets see, https://github.com/mschuessler/two4two/
- Abstract(参考訳): 画像分類の説明を生成するためのアプローチが増えている。
しかしながら、これらのアプローチのほとんどが、自然画像データセットを用いた制御実験の設計が困難であり、研究者の制御から必須な要素を外すため、人為的な評価の対象となっていない。
このアプローチでは、研究者が所望のデータセットをほんの数パラメータで記述できる。
これらをもとに,2種類の3次元抽象動物の合成画像データを生成する。
結果として得られたデータは、人間のサブジェクト評価だけでなくアルゴリズムにも適合する。
ユーザ調査の結果から,本手法は分類器に十分なバイアスを発生させることができ,視覚的にデータを検査する秒ごとにのみ注意を喚起できる。
提案手法は人体評価の障壁を大幅に減らし,解釈可能な機械学習に関するより厳密な調査を容易にする。
ライブラリとデータセットについては、https://github.com/mschuessler/two4two/
関連論文リスト
- ConceptDrift: Uncovering Biases through the Lens of Foundation Models [5.025665239455297]
ceptDriftは、人間の事前知識なしでデータセット内のバイアスを自動的に識別できる。
本稿では,従来の作業のギャップを埋める2つのバイアス識別評価プロトコルを提案し,本手法がSoTA法よりも大幅に改善されていることを示す。
我々の手法は単一のモダリティに縛られず、画像(Waterbirds, CelebA, ImageNet)とテキストデータセット(CivilComments)の両方で実証的に検証する。
論文 参考訳(メタデータ) (2024-10-24T17:59:16Z) - Image change detection with only a few samples [7.5780621370948635]
画像変化検出タスクの最大の障害は、さまざまな場面をカバーする大きな注釈付きデータセットの欠如である。
本稿では,合成データを生成するための単純な画像処理手法を提案する。
次に、対象検出に基づく初期の融合ネットワークを設計し、シアムニューラルネットを上回ります。
論文 参考訳(メタデータ) (2023-11-07T07:01:35Z) - Linking data separation, visual separation, and classifier performance
using pseudo-labeling by contrastive learning [125.99533416395765]
最終分類器の性能は、潜在空間に存在するデータ分離と、射影に存在する視覚的分離に依存すると論じる。
本研究は,ヒト腸管寄生虫の5つの現実的課題の画像データセットを1%の教師付きサンプルで分類し,その結果を実証する。
論文 参考訳(メタデータ) (2023-02-06T10:01:38Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Tensor feature hallucination for few-shot learning [17.381648488344222]
限られた監督と限られたデータによって、サンプルを分類するという課題に対処するショットは少ない。
数ショット分類のための合成データ生成に関するこれまでの研究は、複雑なモデルを活用することに重点を置いていた。
本稿では,単純かつ簡単な合成データ生成手法を効果的に利用する方法を検討する。
論文 参考訳(メタデータ) (2021-06-09T18:25:08Z) - DRG: Dual Relation Graph for Human-Object Interaction Detection [65.50707710054141]
人-物間相互作用(HOI)検出の課題に対処する。
既存の方法は、人間と物体の対の相互作用を独立に認識するか、複雑な外観に基づく共同推論を行う。
本稿では,抽象的空間意味表現を活用して,各対象対を記述し,二重関係グラフを用いてシーンの文脈情報を集約する。
論文 参考訳(メタデータ) (2020-08-26T17:59:40Z) - Semi-Automatic Data Annotation guided by Feature Space Projection [117.9296191012968]
本稿では,適切な特徴空間投影と半教師付きラベル推定に基づく半自動データアノテーション手法を提案する。
MNISTデータセットとヒト腸内寄生虫の胎児不純物の有無による画像を用いて本手法の有効性を検証した。
この結果から,人間と機械の相補的能力を組み合わせた視覚分析ツールの付加価値が,より効果的な機械学習に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-07-27T17:03:50Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Do Saliency Models Detect Odd-One-Out Targets? New Datasets and Evaluations [15.374430656911498]
本研究では,サリエンスの正準例と考えられるシングルトン検出について検討する。
ほぼすべてのサリエンシアルゴリズムは、合成画像や自然画像のシングルトンターゲットに適切に反応しないことを示す。
論文 参考訳(メタデータ) (2020-05-13T20:59:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。