論文の概要: Hierarchical MixUp Multi-label Classification with Imbalanced
Interdisciplinary Research Proposals
- arxiv url: http://arxiv.org/abs/2209.13912v1
- Date: Wed, 28 Sep 2022 08:27:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 16:03:48.828994
- Title: Hierarchical MixUp Multi-label Classification with Imbalanced
Interdisciplinary Research Proposals
- Title(参考訳): 不均衡な学際的研究提案による階層的ミックスアップマルチラベル分類
- Authors: Meng Xiao, Min Wu, Ziyue Qiao, Zhiyuan Ning, Yi Du, Yanjie Fu,
Yuanchun Zhou
- Abstract要約: 我々はH-MixUpと呼ぶ階層型混合ラベル分類フレームワークを提案する。
提案の数は、非学際研究と学間研究の間で不均衡である。
本研究では,Wold-level MixUp,Word-level CutMix,Manifold MixUp,Document-level MixUpの融合学習手法を開発した。
- 参考スコア(独自算出の注目度): 22.458438099629277
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Funding agencies are largely relied on a topic matching between domain
experts and research proposals to assign proposal reviewers. As proposals are
increasingly interdisciplinary, it is challenging to profile the
interdisciplinary nature of a proposal, and, thereafter, find expert reviewers
with an appropriate set of expertise. An essential step in solving this
challenge is to accurately model and classify the interdisciplinary labels of a
proposal. Existing methodological and application-related literature, such as
textual classification and proposal classification, are insufficient in jointly
addressing the three key unique issues introduced by interdisciplinary proposal
data: 1) the hierarchical structure of discipline labels of a proposal from
coarse-grain to fine-grain, e.g., from information science to AI to
fundamentals of AI. 2) the heterogeneous semantics of various main textual
parts that play different roles in a proposal; 3) the number of proposals is
imbalanced between non-interdisciplinary and interdisciplinary research. Can we
simultaneously address the three issues in understanding the proposal's
interdisciplinary nature? In response to this question, we propose a
hierarchical mixup multiple-label classification framework, which we called
H-MixUp. H-MixUp leverages a transformer-based semantic information extractor
and a GCN-based interdisciplinary knowledge extractor for the first and second
issues. H-MixUp develops a fused training method of Wold-level MixUp,
Word-level CutMix, Manifold MixUp, and Document-level MixUp to address the
third issue.
- Abstract(参考訳): 資金提供機関は、主にドメインエキスパートと研究提案のトピックマッチングに依存しており、提案レビューアを割り当てている。
提案が学際的になるにつれて、提案の学際的性質をプロファイルし、その後、適切な専門知識を持つ専門家を見つけることが困難になる。
この問題を解決するための重要なステップは、提案の学際ラベルを正確にモデル化し分類することである。
テキスト分類や提案分類といった既存の方法論・応用関連文献は、学際的提案データによる3つの重要な課題を共同で解決するには不十分である。
1)情報科学からAI,AIの基本に至るまで,粗粒から細粒までの提案の規律ラベルの階層構造。
2 提案において、異なる役割を担っている各種主文部の異種意味論
3)非学際研究と学際研究の間には,提案の数は不均衡である。
提案の学際的性質を理解する上で,同時に3つの課題に対処できるだろうか?
そこで本研究では,H-MixUpと呼ぶ階層型混成多重ラベル分類フレームワークを提案する。
H-MixUpはトランスフォーマーベースの意味情報抽出器とGCNベースの学際知識抽出器を第1号と第2号に活用する。
H-MixUpは、Wold-level MixUp、Word-level CutMix、Manifold MixUp、Document-level MixUpの融合トレーニング方法を開発した。
関連論文リスト
- Resolving the Imbalance Issue in Hierarchical Disciplinary Topic
Inference via LLM-based Data Augmentation [5.98277339029019]
本研究では、大規模言語モデル(Llama V1)をデータジェネレータとして活用し、複雑な学際階層に分類される研究提案を拡大する。
本実験は, 生成したデータの有効性を実証し, 上記の課題に効果的に対処できることを実証した。
論文 参考訳(メタデータ) (2023-10-09T00:45:20Z) - Interdisciplinary Fairness in Imbalanced Research Proposal Topic Inference: A Hierarchical Transformer-based Method with Selective Interpolation [26.30701957043284]
自動トピック推論は、手動のトピックフィリングによるヒューマンエラーを低減し、資金調達機関とプロジェクト申請者の間の知識ギャップを埋め、システム効率を向上させる。
既存の手法は、学際的な研究提案と学際的でない提案とのスケールの差を見落とし、不当な現象へと繋がる。
本稿では,Transformerエンコーダ・デコーダアーキテクチャに基づくトピックラベル推論システムを提案する。
論文 参考訳(メタデータ) (2023-09-04T16:54:49Z) - Topic Taxonomy Expansion via Hierarchy-Aware Topic Phrase Generation [58.3921103230647]
TopicExpanというトピック分類拡張のための新しいフレームワークを提案する。
TopicExpanは、新しいトピックに属するトピック関連用語を直接生成する。
2つの実世界のテキストコーパスの実験結果から、TopicExpanは出力の質という点で他のベースライン手法よりも優れていた。
論文 参考訳(メタデータ) (2022-10-18T22:38:49Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - Hierarchical Interdisciplinary Topic Detection Model for Research
Proposal Classification [33.06389455749012]
深層階層型学際研究提案分類ネットワーク(HIRPCN)を開発した。
まず,提案手法のテキスト意味情報を抽出する階層変換器を提案する。
次に、学際グラフを設計し、GNNを活用して各分野の表現を学習する。
論文 参考訳(メタデータ) (2022-09-16T16:59:25Z) - Who Should Review Your Proposal? Interdisciplinary Topic Path Detection
for Research Proposals [24.995369698179317]
適切なレビュアーに提案を割り当てるのは、長年にわたる課題でした。
既存のシステムは、主に規律調査員が手動で報告したトピックラベルを収集する。
公正で正確な提案レビューシステムを開発する上で、AIはどのような役割を果たすのか?
論文 参考訳(メタデータ) (2022-03-07T03:30:50Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Compositional Attention: Disentangling Search and Retrieval [66.7108739597771]
Multi-head, key-value attention は Transformer モデルとそのバリエーションのバックボーンである。
標準的なアテンションヘッドは、検索と検索の間の厳密なマッピングを学ぶ。
本稿では,標準ヘッド構造を置き換える新しいアテンション機構であるコンポジションアテンションアテンションを提案する。
論文 参考訳(メタデータ) (2021-10-18T15:47:38Z) - SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts [28.96683772139377]
我々は、科学論文における概念のための階層的CDCRの新しいタスクを提示する。
目標は、コアファレンスクラスタとそれらの間の階層を共同で推論することです。
このタスクのエキスパートアノテーションデータセットであるSciCoを作成します。これは、著名なECB+リソースよりも3倍大きいです。
論文 参考訳(メタデータ) (2021-04-18T10:42:20Z) - Topic-Aware Multi-turn Dialogue Modeling [91.52820664879432]
本稿では,トピック認識発話を教師なしでセグメント化して抽出する,多元対話モデリングのための新しいソリューションを提案する。
トピック・アウェア・モデリングは、新たに提案されたトピック・アウェア・セグメンテーション・アルゴリズムとトピック・アウェア・デュアル・アテンション・マッチング(TADAM)ネットワークによって実現されている。
論文 参考訳(メタデータ) (2020-09-26T08:43:06Z) - Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data
and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。
コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。
不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文 参考訳(メタデータ) (2020-08-21T22:43:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。