論文の概要: Out-of-Distribution Generalization in Text Classification: Past,
Present, and Future
- arxiv url: http://arxiv.org/abs/2305.14104v1
- Date: Tue, 23 May 2023 14:26:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 15:43:13.212519
- Title: Out-of-Distribution Generalization in Text Classification: Past,
Present, and Future
- Title(参考訳): テキスト分類におけるアウト・オブ・ディストリビューションの一般化:過去・現在・未来
- Authors: Linyi Yang, Yaoxiao Song, Xuan Ren, Chenyang Lyu, Yidong Wang,
Lingqiao Liu, Jindong Wang, Jennifer Foster, Yue Zhang
- Abstract要約: 自然言語処理(NLP)における機械学習(ML)システムは、アウト・オブ・ディストリビューション(OOD)データへの一般化において重大な課題に直面している。
このことは、NLPモデルの堅牢性とその高い精度に関する重要な疑問を提起する。
本稿では,近年の進歩,方法,評価について概観する。
- 参考スコア(独自算出の注目度): 30.581612475530974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning (ML) systems in natural language processing (NLP) face
significant challenges in generalizing to out-of-distribution (OOD) data, where
the test distribution differs from the training data distribution. This poses
important questions about the robustness of NLP models and their high accuracy,
which may be artificially inflated due to their underlying sensitivity to
systematic biases. Despite these challenges, there is a lack of comprehensive
surveys on the generalization challenge from an OOD perspective in text
classification. Therefore, this paper aims to fill this gap by presenting the
first comprehensive review of recent progress, methods, and evaluations on this
topic. We furth discuss the challenges involved and potential future research
directions. By providing quick access to existing work, we hope this survey
will encourage future research in this area.
- Abstract(参考訳): 自然言語処理(NLP)における機械学習(ML)システムは、トレーニングデータ分布とテスト分布が異なるOODデータへの一般化において重大な課題に直面している。
このことは、NLPモデルの堅牢性とその高い精度に関する重要な疑問を提起する。
これらの課題にもかかわらず、テキスト分類におけるoodの観点からの一般化チャレンジに関する包括的な調査が欠如している。
そこで本稿では,最近の進歩,方法,評価を総合的に概観し,このギャップを埋めることを目的としている。
課題と今後の研究の方向性について論じる。
既存の作業への迅速なアクセスを提供することで、この分野の今後の研究を促進することを願っている。
関連論文リスト
- Specializing Large Language Models to Simulate Survey Response Distributions for Global Populations [49.908708778200115]
我々は,調査応答分布をシミュレートする大規模言語モデル (LLM) を最初に開発した。
テストベッドとして、我々は2つの世界文化調査の国レベルの結果を使用します。
予測された応答分布と実際の応答分布のばらつきを最小限に抑えるために, ファースト・ツーケン確率に基づく微調整法を提案する。
論文 参考訳(メタデータ) (2025-02-10T21:59:27Z) - Misspellings in Natural Language Processing: A survey [52.419589623702336]
デジタル通信では ミススペルがユビキタスになりました
我々は科学的な問題としてミススペルの歴史を再構築する。
NLPにおけるミススペル問題に対処するための最新の進歩について論じる。
論文 参考訳(メタデータ) (2025-01-28T10:26:04Z) - Advancements and Challenges in Bangla Question Answering Models: A Comprehensive Review [0.0]
本稿では,この領域の進展に寄与する7つの研究論文の総合的なレビューを行う。
本稿では,注意機構を持つLSTMモデル,文脈に基づくQAシステム,事前知識に基づく深層学習技術など,革新的な手法を紹介する。
進歩にもかかわらず、十分な注釈付きデータの欠如、高品質な読解データセットの欠如、文脈における単語の意味を理解することの難しさなど、いくつかの課題が残っている。
論文 参考訳(メタデータ) (2024-12-16T14:42:26Z) - A Comprehensive Survey of Bias in LLMs: Current Landscape and Future Directions [0.0]
大規模言語モデル(LLM)は、前例のないテキスト生成、翻訳、理解能力を提供することで、自然言語処理(NLP)の様々な応用に革命をもたらした。
彼らの広範な展開は、これらのモデルに埋め込まれたバイアスに関して、重大な懸念をもたらしました。
本稿では, LLMにおけるバイアスの包括的調査を行い, これらのバイアスに関するタイプ, ソース, 影響, 緩和戦略について, 広範なレビューを行うことを目的としている。
論文 参考訳(メタデータ) (2024-09-24T19:50:38Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - How to Handle Different Types of Out-of-Distribution Scenarios in Computational Argumentation? A Comprehensive and Fine-Grained Field Study [59.13867562744973]
この研究は、オフ・オブ・ディストリビューション(OOD)シナリオにおけるLMの能力を体系的に評価する。
このような学習パラダイムの有効性は,OODの種類によって異なることがわかった。
具体的には、ICLはドメインシフトに優れているが、プロンプトベースの微調整はトピックシフトに勝っている。
論文 参考訳(メタデータ) (2023-09-15T11:15:47Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Robust Visual Question Answering: Datasets, Methods, and Future
Challenges [23.59923999144776]
視覚的な質問応答には、画像と自然言語の質問に与えられた正確な自然言語の回答を提供するシステムが必要である。
従来の一般的なVQA手法は、答えを予測する前に画像のグラウンド化など適切な振る舞いを学ぶのではなく、トレーニングデータに存在するバイアスを記憶する傾向がある。
VQAのロバスト性を評価するために,様々なデータセットとデバイアス法が提案されている。
論文 参考訳(メタデータ) (2023-07-21T10:12:09Z) - A Comprehensive Review of Trends, Applications and Challenges In
Out-of-Distribution Detection [0.76146285961466]
アウト・オブ・ディストリビューション・データ・サブセットの検出とより包括的な一般化の実現に焦点をあてた研究分野が誕生した。
多くのディープラーニングベースのモデルは、ベンチマークデータセットでほぼ完璧な結果を得たため、これらのモデルの信頼性と信頼性を評価する必要性は、これまで以上に強く感じられる。
本稿では,本分野における70以上の論文のレビューに加えて,今後の研究の課題と方向性を提示するとともに,データシフトの多種多様さを統一的に把握し,より一般化するためのソリューションを提案する。
論文 参考訳(メタデータ) (2022-09-26T18:13:14Z) - Recent Few-Shot Object Detection Algorithms: A Survey with Performance
Comparison [54.357707168883024]
Few-Shot Object Detection (FSOD)は、人間の学習能力を模倣する。
FSODは、学習した汎用オブジェクトの知識を共通のヘビーテールから新しいロングテールオブジェクトクラスにインテリジェントに転送する。
本稿では,問題定義,共通データセット,評価プロトコルなどを含むFSODの概要を紹介する。
論文 参考訳(メタデータ) (2022-03-27T04:11:28Z) - Deep Learning meets Liveness Detection: Recent Advancements and
Challenges [3.2011056280404637]
我々は,2017年以降の深部機能的FAS手法に関する文献を包括的に調査している。
本研究では,FASの時系列,進化過程,評価基準について概説する。
論文 参考訳(メタデータ) (2021-12-29T19:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。