論文の概要: Joint Multi-Dimensional Model for Global and Time-Series Annotations
- arxiv url: http://arxiv.org/abs/2005.03117v1
- Date: Wed, 6 May 2020 20:08:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 05:07:01.254822
- Title: Joint Multi-Dimensional Model for Global and Time-Series Annotations
- Title(参考訳): グローバルおよび時系列アノテーションのための多次元連成モデル
- Authors: Anil Ramakrishna, Rahul Gupta, Shrikanth Narayanan
- Abstract要約: クラウドソーシングは、ラベルのないデータインスタンスのアノテーションを収集する一般的なアプローチである。
その中には、複数のデータインスタンスから大量のアノテーションを集め、多くの場合、訓練されていないアノテータを各データインスタンスに集め、それらを組み合わせて基礎的な真実を見積もる。
しかし、ほとんどのアノテーション融合スキームはこの側面を無視し、各次元を別々にモデル化する。
本稿では,多次元アノテーション融合の生成モデルを提案する。
- 参考スコア(独自算出の注目度): 48.159050222769494
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowdsourcing is a popular approach to collect annotations for unlabeled data
instances. It involves collecting a large number of annotations from several,
often naive untrained annotators for each data instance which are then combined
to estimate the ground truth. Further, annotations for constructs such as
affect are often multi-dimensional with annotators rating multiple dimensions,
such as valence and arousal, for each instance. Most annotation fusion schemes
however ignore this aspect and model each dimension separately. In this work we
address this by proposing a generative model for multi-dimensional annotation
fusion, which models the dimensions jointly leading to more accurate ground
truth estimates. The model we propose is applicable to both global and time
series annotation fusion problems and treats the ground truth as a latent
variable distorted by the annotators. The model parameters are estimated using
the Expectation-Maximization algorithm and we evaluate its performance using
synthetic data and real emotion corpora as well as on an artificial task with
human annotations
- Abstract(参考訳): クラウドソーシングは、ラベルのないデータインスタンスのアノテーションを集める一般的なアプローチである。
それぞれのデータインスタンスに対して、複数の、しばしば無意味な、訓練されていない注釈子から大量のアノテーションを収集し、それらを組み合わせて、基礎的な真理を見積もる。
さらに、インフルエンスのような構成要素に対するアノテーションは、各インスタンスのヴァレンスやarousalといった多次元の注釈を付けて多次元化されることが多い。
しかし、ほとんどのアノテーション融合スキームはこの側面を無視し、各次元を別々にモデル化する。
本研究では,多次元アノテーション融合のための生成モデルを提案することで,より正確な基底真理推定に繋がる次元のモデル化を行う。
提案するモデルは,大域的および時系列的アノテーション融合問題に適用可能であり,アノテータによって歪んだ潜在変数として基底真理を扱う。
予測最大化アルゴリズムを用いてモデルパラメータを推定し、人間のアノテーションを用いた人工タスクと同様に、合成データと実感情コーパスを用いてその性能を評価する。
関連論文リスト
- MT-Eval: A Multi-Turn Capabilities Evaluation Benchmark for Large
Language Models [70.92847554971065]
MT-Evalは,マルチターン対話能力を評価するための総合的なベンチマークである。
人間のLLM会話を解析することにより,インタラクションパターンを,再現,拡張,洗練,フォローアップの4つのタイプに分類する。
11個の有名なLCMを評価したところ、クローズドソースモデルは一般的にオープンソースモデルを上回るが、特定のタスクにおいて特定のオープンソースモデルの方がGPT-3.5-Turboを上回っていることがわかった。
論文 参考訳(メタデータ) (2024-01-30T04:50:28Z) - A General Model for Aggregating Annotations Across Simple, Complex, and
Multi-Object Annotation Tasks [51.14185612418977]
ラベルの品質を改善するための戦略は、複数のアノテータに同じ項目にラベルを付け、ラベルを集約するように求めることである。
特定のタスクに対して様々なbespokeモデルが提案されているが、様々な複雑なタスクを一般化するアグリゲーションメソッドを導入するのはこれが初めてである。
本論では,3つの新たな研究課題について検討し,今後の課題を概説する。
論文 参考訳(メタデータ) (2023-12-20T21:28:35Z) - A Federated Data Fusion-Based Prognostic Model for Applications with Multi-Stream Incomplete Signals [1.2277343096128712]
本稿では、複数のユーザが共同で障害時間予測モデルを構築することができるフェデレーション予測モデルを提案する。
数値解析により,提案モデルの性能は古典的非フェデレーション予測モデルと同一であることが示唆された。
論文 参考訳(メタデータ) (2023-11-13T17:08:34Z) - Unveiling the Multi-Annotation Process: Examining the Influence of
Annotation Quantity and Instance Difficulty on Model Performance [1.7343894615131372]
データセットがインスタンス毎にひとつのアノテーションから複数のアノテーションに拡張された場合、パフォーマンススコアがどのように変化するかを示す。
アノテーション予算の異なるデータセットを生成するための,新しいマルチアノテーションシミュレーションプロセスを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:12:41Z) - Multidimensional Item Response Theory in the Style of Collaborative
Filtering [0.8057006406834467]
本稿では,多次元項目応答理論(MIRT)に対する機械学習手法を提案する。
協調フィルタリングに触発されて、多くのMIRTモデルを含むモデルの一般的なクラスを定義します。
本稿では, 個人モデルとクロスバリデーションを推定し, 最適動作モデルを選択するために, ペナル化結合最大度(JML)の使用について論じる。
論文 参考訳(メタデータ) (2023-01-03T00:56:27Z) - Towards Understanding and Mitigating Dimensional Collapse in Heterogeneous Federated Learning [112.69497636932955]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - Attention Bottlenecks for Multimodal Fusion [90.75885715478054]
機械知覚モデルは典型的にはモダリティに特化しており、単調なベンチマークのために最適化されている。
複数の層でのモジュラリティ融合に「融合」を用いる新しいトランスフォーマーアーキテクチャを導入する。
我々は、徹底的なアブレーション研究を行い、複数のオーディオ視覚分類ベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2021-06-30T22:44:12Z) - Self-Supervision based Task-Specific Image Collection Summarization [3.115375810642661]
本稿では,意味情報と自己スーパービジョンを用いたタスク固有画像コーパス要約手法を提案する。
特徴生成ネットワークとして,分類に基づくWasserstein generation adversarial Network (WGAN) を用いる。
モデルは、セマンティック埋め込み空間におけるK平均クラスタリングを用いて、推論時に要約を生成する。
論文 参考訳(メタデータ) (2020-12-19T10:58:04Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z) - Predicting Multidimensional Data via Tensor Learning [0.0]
本研究では,本データセットの内在的多次元構造を保持するモデルを開発する。
モデルパラメータを推定するために、オルタネート・リースト・スクエアスアルゴリズムを開発した。
提案モデルは,予測文献に存在するベンチマークモデルより優れている。
論文 参考訳(メタデータ) (2020-02-11T11:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。