論文の概要: An Interpretable Graph-based Mapping of Trustworthy Machine Learning
Research
- arxiv url: http://arxiv.org/abs/2105.06591v1
- Date: Thu, 13 May 2021 23:25:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-17 12:34:59.937916
- Title: An Interpretable Graph-based Mapping of Trustworthy Machine Learning
Research
- Title(参考訳): 信頼できる機械学習研究の解釈可能なグラフベースマッピング
- Authors: Noemi Derzsy, Subhabrata Majumdar, Rajat Malik
- Abstract要約: 我々は、7000以上のピアレビューされた最近のML論文からなるウェブスクラッドコーパスを用いて、単語の共起ネットワークを構築した。
コミュニティ検出を使用して、TwMLトピックの相対的な位置を推測できるこのネットワーク内の単語のセマンティッククラスタを取得します。
- 参考スコア(独自算出の注目度): 3.222802562733787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is an increasing interest in ensuring machine learning (ML) frameworks
behave in a socially responsible manner and are deemed trustworthy. Although
considerable progress has been made in the field of Trustworthy ML (TwML) in
the recent past, much of the current characterization of this progress is
qualitative. Consequently, decisions about how to address issues of
trustworthiness and future research goals are often left to the interested
researcher. In this paper, we present the first quantitative approach to
characterize the comprehension of TwML research. We build a co-occurrence
network of words using a web-scraped corpus of more than 7,000 peer-reviewed
recent ML papers -- consisting of papers both related and unrelated to TwML. We
use community detection to obtain semantic clusters of words in this network
that can infer relative positions of TwML topics. We propose an innovative
fingerprinting algorithm to obtain probabilistic similarity scores for
individual words, then combine them to give a paper-level relevance score. The
outcomes of our analysis inform a number of interesting insights on advancing
the field of TwML research.
- Abstract(参考訳): 機械学習(ML)フレームワークが社会的に責任を負った振る舞いを確実にすることへの関心が高まっている。
近年、信頼に値するml(twml)の分野でかなりの進歩が見られたが、この進歩の現在の特徴の多くは定性的である。
その結果、信頼度や将来の研究目標の課題に対処する方法に関する決定は、しばしば関心のある研究者に委ねられる。
本稿では,TwML研究の理解を特徴付けるための最初の定量的アプローチを提案する。
我々は、7000以上のピアレビューされた最近のML論文からなるWebスクラッドコーパスを使用して、単語の共起ネットワークを構築します。
我々はコミュニティ検出を用いて、TwMLトピックの相対的な位置を推測できる、このネットワークにおける単語の意味的クラスタを得る。
本稿では,個々の単語に対する確率的類似度スコアを得るための新しいフィンガープリントアルゴリズムを提案する。
分析の結果から,TwML研究の進展に関する興味深い知見が数多く得られている。
関連論文リスト
- On the Statistical Significance with Relevance Assessments of Large Language Models [2.9180406633632523]
我々は,文書の関連性をラベル付けするために大規模言語モデルを使用し,新しい検索テストコレクションを構築する。
以上の結果から, LLM判定は有意差の大部分を検出できる一方で, 許容数の偽陽性を維持していることが明らかとなった。
本研究は, LLM判定による統計的試験結果の評価における一歩である。
論文 参考訳(メタデータ) (2024-11-20T11:19:35Z) - A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.309390098903]
著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文 参考訳(メタデータ) (2024-10-29T04:14:23Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Paired Completion: Flexible Quantification of Issue-framing at Scale with LLMs [0.41436032949434404]
我々は,大規模なテキストデータセット内の問題フレーミングと物語分析のための新しい検出手法を開発し,厳密に評価する。
問題フレーミングは大きなコーパスにおいて, 与えられた問題に対して, いずれの視点でも, 確実に, 効率的に検出できることを示す。
論文 参考訳(メタデータ) (2024-08-19T07:14:15Z) - Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - MM-SpuBench: Towards Better Understanding of Spurious Biases in Multimodal LLMs [38.93090238335506]
非意味な入力属性と予測対象変数の急激な相関を利用する傾向にあるスパースバイアスは、単一のモダリティデータに基づいて訓練されたディープラーニングモデルに深刻な落とし穴があることを明らかにした。
本稿では,9つの異なる相関関係のカテゴリに対するMLLMの信頼度を評価するために,包括的視覚質問応答(VQA)ベンチマークであるMM-SpuBenchを紹介する。
以上の結果から,これらのモデルからの素因相関への依存の持続性を明らかにし,素因バイアスを緩和する新たな手法の必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-06-24T20:29:16Z) - RelevAI-Reviewer: A Benchmark on AI Reviewers for Survey Paper Relevance [0.8089605035945486]
本稿では,調査論文レビューの課題を分類問題として概念化するシステムであるRelevAI-Reviewerを提案する。
25,164のインスタンスからなる新しいデータセットを導入する。各インスタンスには1つのプロンプトと4つの候補論文があり、それぞれがプロンプトに関連している。
我々は,各論文の関連性を判断し,最も関連性の高い論文を識別できる機械学習(ML)モデルを開発した。
論文 参考訳(メタデータ) (2024-06-13T06:42:32Z) - SEED-Bench-2: Benchmarking Multimodal Large Language Models [67.28089415198338]
MLLM(Multimodal large language model)は、最近、テキストだけでなく、インターリーブされたマルチモーダル入力の画像を生成できることを実証した。
SEED-Bench-2は、正確な人間のアノテーションを持つ24Kの多重選択質問で構成されており、27次元にまたがっている。
我々は,23個の著名なオープンソースMLLMの性能を評価し,貴重な観察結果を要約した。
論文 参考訳(メタデータ) (2023-11-28T05:53:55Z) - Interpretability of Machine Learning: Recent Advances and Future
Prospects [21.68362950922772]
機械学習(ML)の普及は、様々なマルチメディアコンテンツの研究に前例のない関心を集めている。
現代のML、特にディープニューラルネットワーク(DNN)におけるブラックボックスの性質は、MLベースの表現学習において主要な課題となっている。
本稿では,MLの解釈可能性に関する最近の進歩と今後の展望について述べる。
論文 参考訳(メタデータ) (2023-04-30T17:31:29Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z) - Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and
Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。
既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。
本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:47:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。