論文の概要: JuniperLiu at CoMeDi Shared Task: Models as Annotators in Lexical Semantics Disagreements
- arxiv url: http://arxiv.org/abs/2411.12147v2
- Date: Mon, 30 Dec 2024 13:41:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:01:26.052868
- Title: JuniperLiu at CoMeDi Shared Task: Models as Annotators in Lexical Semantics Disagreements
- Title(参考訳): JuniperLiu at CoMeDi Shared Task: Models as Annotators in Lexical Semantics Disagreements (英語)
- Authors: Zhu Liu, Zhen Hu, Ying Liu,
- Abstract要約: 本稿では,CoMeDi共有タスクのためのシステムの結果について述べる。
提案手法は,事前学習された言語モデルに基づいて学習したアンサンブルベースおよびしきい値ベース手法とモデル戦略を組み合わせる。
モデル操作における連続的関連度スコアの標準偏差は,人間の不一致アノテーションと相関することがわかった。
- 参考スコア(独自算出の注目度): 5.336744348106775
- License:
- Abstract: We present the results of our system for the CoMeDi Shared Task, which predicts majority votes (Subtask 1) and annotator disagreements (Subtask 2). Our approach combines model ensemble strategies with MLP-based and threshold-based methods trained on pretrained language models. Treating individual models as virtual annotators, we simulate the annotation process by designing aggregation measures that incorporate continuous relatedness scores and discrete classification labels to capture both majority and disagreement. Additionally, we employ anisotropy removal techniques to enhance performance. Experimental results demonstrate the effectiveness of our methods, particularly for Subtask 2. Notably, we find that standard deviation on continuous relatedness scores among different model manipulations correlates with human disagreement annotations compared to metrics on aggregated discrete labels. The code will be published at https://github.com/RyanLiut/CoMeDi_Solution.
- Abstract(参考訳): 本稿では,多数決(Subtask 1)とアノテータの不一致(Subtask2)を予測するCoMeDi共有タスクに対するシステムの結果について述べる。
提案手法は,モデルアンサンブル戦略と,事前訓練された言語モデルに基づいて訓練されたMLPとしきい値に基づく手法を組み合わせる。
個々のモデルを仮想アノテータとして扱うことにより、連続的な関連性スコアと離散分類ラベルを組み込んだアグリゲーションを設計し、アノテータと不一致の両方を捉えることによって、アノテーションプロセスのシミュレートを行う。
さらに,異方性除去技術を用いて性能を向上させる。
実験の結果,特にSubtask 2では,本手法の有効性が示された。
特に、異なるモデル操作における連続的関連性スコアの標準偏差は、集約された離散ラベルのメトリクスと比較すると、人間の不一致アノテーションと相関することがわかった。
コードはhttps://github.com/RyanLiut/CoMeDi_Solution.comで公開される。
関連論文リスト
- FuocChuVIP123 at CoMeDi Shared Task: Disagreement Ranking with XLM-Roberta Sentence Embeddings and Deep Neural Regression [0.0]
本稿では,CoMeDi共有タスクシステムについて,サブタスク2:識別ランク付けに着目した結果について述べる。
本システムはパラフレーズ-xlm-r-multilingual-v1モデルにより生成された文の埋め込みを利用する。
本手法は,アノテータ間のペアの判断差の平均を推定することにより,不一致ランキングを明示的に対象とする。
論文 参考訳(メタデータ) (2025-01-21T18:10:43Z) - Concrete Subspace Learning based Interference Elimination for Multi-task
Model Fusion [86.6191592951269]
一般的な事前訓練された大規模モデルから微調整されたマージングモデルは、様々なタスクに特化しているが、様々なタスクでうまく機能するマルチタスクモデルを構築するための安価でスケーラブルな戦略として実証されている。
本稿では、共通低次元部分空間を同定し、その共有情報トラック干渉問題を性能を犠牲にすることなく利用するための連続緩和(Concrete)部分空間学習法を提案する。
論文 参考訳(メタデータ) (2023-12-11T07:24:54Z) - AdaMerging: Adaptive Model Merging for Multi-Task Learning [68.75885518081357]
本稿では,Adaptive Model Merging (AdaMerging)と呼ばれる革新的な手法を紹介する。
本来のトレーニングデータに頼ることなく、タスクレベルでも階層的にも、モデルマージの係数を自律的に学習することを目指している。
AdaMergingは、現在の最先端のタスク演算のマージ方式と比較すると、パフォーマンスが11%向上している。
論文 参考訳(メタデータ) (2023-10-04T04:26:33Z) - Sample and Predict Your Latent: Modality-free Sequential Disentanglement
via Contrastive Estimation [2.7759072740347017]
外部信号のないコントラスト推定に基づく自己教師付きシーケンシャル・アンタングルメント・フレームワークを提案する。
実際に,データのセマンティックに類似し,異種なビューに対して,統一的で効率的かつ容易にサンプリングできる手法を提案する。
提案手法は,既存の手法と比較して最先端の結果を示す。
論文 参考訳(メタデータ) (2023-05-25T10:50:30Z) - On the Compositional Generalization Gap of In-Context Learning [73.09193595292233]
In-distriion (ID) と Out-of-distriion (OOD) の相違について考察する。
我々は,3つの意味解析データセットを用いて,OPT,BLOOM,CodeGen,Codexの4つのモデルファミリを評価する。
論文 参考訳(メタデータ) (2022-11-15T19:56:37Z) - Phoneme Segmentation Using Self-Supervised Speech Models [13.956691231452336]
音素セグメンテーションのタスクに伝達学習を適用し、タスクの自己教師型事前学習において学習した表現の有用性を実証する。
我々のモデルは、事前学習で学んだ特徴を操作する戦略的に配置された畳み込みによるトランスフォーマースタイルのエンコーダを拡張している。
論文 参考訳(メタデータ) (2022-11-02T19:57:31Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Parameter Decoupling Strategy for Semi-supervised 3D Left Atrium
Segmentation [0.0]
本稿では,パラメータ分離戦略に基づく半教師付きセグメンテーションモデルを提案する。
提案手法は,Atrial Challengeデータセット上での最先端の半教師付き手法と競合する結果を得た。
論文 参考訳(メタデータ) (2021-09-20T14:51:42Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z) - Semantically Driven Sentence Fusion: Modeling and Evaluation [27.599227950466442]
文融合は関連文をコヒーレントテキストに結合する作業である。
このタスクの現在のトレーニングと評価スキームは、単一の参照基盤構造に基づいている。
このことは、入力文間の意味的関係を頑健に把握することを妨げる。
論文 参考訳(メタデータ) (2020-10-06T10:06:01Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。