論文の概要: Interdisciplinary Fairness in Imbalanced Research Proposal Topic
Inference: A Hierarchical Transformer-based Method with Selective
Interpolation
- arxiv url: http://arxiv.org/abs/2309.01717v2
- Date: Mon, 11 Sep 2023 01:33:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 18:16:29.064949
- Title: Interdisciplinary Fairness in Imbalanced Research Proposal Topic
Inference: A Hierarchical Transformer-based Method with Selective
Interpolation
- Title(参考訳): 不均衡研究における学際的公平性:トピック推論:選択的補間を伴う階層的トランスフォーマーベース手法
- Authors: Meng Xiao, Min Wu, Ziyue Qiao, Yanjie Fu, Zhiyuan Ning, Yi Du,
Yuanchun Zhou
- Abstract要約: 自動トピック推論は、手動のトピックフィリングによるヒューマンエラーを低減し、資金調達機関とプロジェクト申請者の間の知識ギャップを埋め、システム効率を向上させる。
既存の手法は、学際的な研究提案と学際的でない提案とのスケールの差を見落とし、不当な現象へと繋がる。
本稿では,Transformerエンコーダ・デコーダアーキテクチャに基づくトピックラベル推論システムを提案する。
- 参考スコア(独自算出の注目度): 27.6262040248281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of topic inference in research proposals aims to obtain the
most suitable disciplinary division from the discipline system defined by a
funding agency. The agency will subsequently find appropriate peer review
experts from their database based on this division. Automated topic inference
can reduce human errors caused by manual topic filling, bridge the knowledge
gap between funding agencies and project applicants, and improve system
efficiency. Existing methods focus on modeling this as a hierarchical
multi-label classification problem, using generative models to iteratively
infer the most appropriate topic information. However, these methods overlook
the gap in scale between interdisciplinary research proposals and
non-interdisciplinary ones, leading to an unjust phenomenon where the automated
inference system categorizes interdisciplinary proposals as
non-interdisciplinary, causing unfairness during the expert assignment. How can
we address this data imbalance issue under a complex discipline system and
hence resolve this unfairness? In this paper, we implement a topic label
inference system based on a Transformer encoder-decoder architecture.
Furthermore, we utilize interpolation techniques to create a series of
pseudo-interdisciplinary proposals from non-interdisciplinary ones during
training based on non-parametric indicators such as cross-topic probabilities
and topic occurrence probabilities. This approach aims to reduce the bias of
the system during model training. Finally, we conduct extensive experiments on
a real-world dataset to verify the effectiveness of the proposed method. The
experimental results demonstrate that our training strategy can significantly
mitigate the unfairness generated in the topic inference task.
- Abstract(参考訳): 研究提案におけるトピック推論の目的は、資金提供機関が定める規律体系から最も適した学際的区分を得ることである。
機関はその後、この部門に基づいて、データベースから適切な査読専門家を見つける。
自動トピック推論は、手動のトピックフィリングによるヒューマンエラーを低減し、資金調達機関とプロジェクト申請者の知識ギャップを埋め、システム効率を向上させる。
既存の手法では、これを階層的マルチラベル分類問題としてモデル化し、生成モデルを用いて最も適切なトピック情報を反復的に推測する。
しかし、これらの手法は、学際的な研究提案と学際的でない提案の差を無視し、自動化された推論システムが学際的な提案を学際的でないとして分類し、専門家の割り当ての間に不公平を生じさせる不当な現象へと繋がる。
複雑な規律の下でこのデータ不均衡の問題にどう対処すればいいのか。
本稿では、トランスフォーマエンコーダ-デコーダアーキテクチャに基づくトピックラベル推論システムを実装した。
さらに,クロストピック確率やトピック発生確率などの非パラメトリック指標に基づいて,補間手法を用いて,非学際的提案から擬似学際的提案を作成する。
このアプローチは、モデルトレーニング中のシステムのバイアスを軽減することを目的としている。
最後に,提案手法の有効性を検証するために,実世界のデータセットについて広範な実験を行った。
実験の結果,本研究のトレーニング戦略は,トピック推論タスクで生じる不公平性を著しく軽減できることが示された。
関連論文リスト
- Reconciling Heterogeneous Effects in Causal Inference [44.99833362998488]
本稿では、機械学習におけるモデル乗法にReconcileアルゴリズムを適用し、因果推論における異種効果を再現する。
本研究の結果は,医療,保険,住宅などの高額な事業において,公正な成果の確保に有意な意味を持っている。
論文 参考訳(メタデータ) (2024-06-05T18:43:46Z) - Resolving the Imbalance Issue in Hierarchical Disciplinary Topic
Inference via LLM-based Data Augmentation [5.98277339029019]
本研究では、大規模言語モデル(Llama V1)をデータジェネレータとして活用し、複雑な学際階層に分類される研究提案を拡大する。
本実験は, 生成したデータの有効性を実証し, 上記の課題に効果的に対処できることを実証した。
論文 参考訳(メタデータ) (2023-10-09T00:45:20Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Combating Exacerbated Heterogeneity for Robust Models in Federated
Learning [91.88122934924435]
対人訓練と連合学習の組み合わせは、望ましくない頑丈さの劣化につながる可能性がある。
我々は、Slack Federated Adversarial Training (SFAT)と呼ばれる新しいフレームワークを提案する。
各種ベンチマークおよび実世界のデータセットに対するSFATの合理性と有効性を検証する。
論文 参考訳(メタデータ) (2023-03-01T06:16:15Z) - In Search of Insights, Not Magic Bullets: Towards Demystification of the
Model Selection Dilemma in Heterogeneous Treatment Effect Estimation [92.51773744318119]
本稿では,異なるモデル選択基準の長所と短所を実験的に検討する。
選択戦略,候補推定器,比較に用いるデータの間には,複雑な相互作用があることを強調した。
論文 参考訳(メタデータ) (2023-02-06T16:55:37Z) - Hierarchical MixUp Multi-label Classification with Imbalanced
Interdisciplinary Research Proposals [22.458438099629277]
我々はH-MixUpと呼ぶ階層型混合ラベル分類フレームワークを提案する。
提案の数は、非学際研究と学間研究の間で不均衡である。
本研究では,Wold-level MixUp,Word-level CutMix,Manifold MixUp,Document-level MixUpの融合学習手法を開発した。
論文 参考訳(メタデータ) (2022-09-28T08:27:52Z) - Hierarchical Interdisciplinary Topic Detection Model for Research
Proposal Classification [33.06389455749012]
深層階層型学際研究提案分類ネットワーク(HIRPCN)を開発した。
まず,提案手法のテキスト意味情報を抽出する階層変換器を提案する。
次に、学際グラフを設計し、GNNを活用して各分野の表現を学習する。
論文 参考訳(メタデータ) (2022-09-16T16:59:25Z) - Causal Fairness Analysis [68.12191782657437]
意思決定設定における公平性の問題を理解し、モデル化し、潜在的に解決するためのフレームワークを導入します。
我々のアプローチの主な洞察は、観測データに存在する格差の定量化と、基礎となる、しばしば観測されていない、因果的なメカニズムの収集を結びつけることである。
本研究は,文献中の異なる基準間の関係を整理し,説明するための最初の体系的試みであるフェアネスマップにおいて,本研究の成果を左右するものである。
論文 参考訳(メタデータ) (2022-07-23T01:06:34Z) - Who Should Review Your Proposal? Interdisciplinary Topic Path Detection
for Research Proposals [24.995369698179317]
適切なレビュアーに提案を割り当てるのは、長年にわたる課題でした。
既存のシステムは、主に規律調査員が手動で報告したトピックラベルを収集する。
公正で正確な提案レビューシステムを開発する上で、AIはどのような役割を果たすのか?
論文 参考訳(メタデータ) (2022-03-07T03:30:50Z) - Through the Data Management Lens: Experimental Analysis and Evaluation
of Fair Classification [75.49600684537117]
データ管理研究は、データとアルゴリズムの公平性に関連するトピックに対する存在感と関心が高まっている。
我々は,その正しさ,公平性,効率性,スケーラビリティ,安定性よりも,13の公正な分類アプローチと追加の変種を幅広く分析している。
我々の分析は、異なるメトリクスとハイレベルなアプローチ特性がパフォーマンスの異なる側面に与える影響に関する新しい洞察を強調します。
論文 参考訳(メタデータ) (2021-01-18T22:55:40Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。