論文の概要: The 2026 ACII Dyadic Conversations (DaiKon) Workshop & Challenge
- arxiv url: http://arxiv.org/abs/2605.02672v1
- Date: Mon, 04 May 2026 14:53:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.347341
- Title: The 2026 ACII Dyadic Conversations (DaiKon) Workshop & Challenge
- Title(参考訳): 2026 ACII Dyadic Conversations (DaiKon) Workshop & Challenge に参加して
- Authors: Panagiotis Tzirakis, Alice Baird, Jeffrey Brooks, Emilia Parada-Cabaleiro, Lukas Stappen, Sharath Rao, Theo Lebryk, Jakub Piotr Clapa, Jens Madsen,
- Abstract要約: ACII-DaiKonは、共有データセット上に構築された3つの調整されたサブチャレンジを提示する。
この課題は、945のダイアド会話を含むHume-DaiKonデータセット上に構築されている。
このベンチマークはマルチモーダルモデリング、時間的推論、コンテキスト間の一般化をサポートする。
- 参考スコア(独自算出の注目度): 7.430170071205731
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The 2026 ACII Dyadic Conversations (ACII-DaiKon) Workshop & Challenge introduces a benchmark for modeling interpersonal affect and social dynamics in dyadic conversations. Although conversational affect modeling has advanced rapidly, most benchmarks remain speaker-centric and underrepresent coupled, time-evolving processes between partners, including directional influence, conversational timing coordination, and rapport development. To address this gap, ACII-DaiKon presents three coordinated sub-challenges built on a shared dataset: (1) directional interpersonal influence prediction, (2) turn-taking prediction (next-speaker and time-to-next-speech), and (3) rapport trajectory prediction across full interactions. The challenge is built on the Hume-DaiKon dataset, comprising 945 dyadic conversations (743.4 hours of audiovisual data) collected under naturalistic conditions across five languages. The benchmark supports multimodal modeling, temporal reasoning, and cross-context generalization through fixed train/validation/test splits, standardized metrics, and released baseline systems. Evaluation uses Concordance Correlation Coefficient (CCC), Pearson correlation, Macro-F1, and Mean Absolute Error (MAE) depending on the sub-challenge. Baseline experiments establish initial reference performance, with best test results of 0.40 CCC and 0.50 Pearson for influence prediction, 0.66 Macro-F1 and 1.50~s MAE for turn-taking, and 0.68 CCC and 0.70 Pearson for rapport trajectory modeling. These results indicate that while current methods capture coarse dyadic patterns, robust modeling of directional dependence and long-horizon interpersonal dynamics remains challenging. The workshop provides a shared platform for rigorous comparison and cross-disciplinary discussion on data validity, evaluation protocols, and culturally aware modeling for dyadic interaction.
- Abstract(参考訳): 2026年のACII Dyadic Conversations (ACII-DaiKon) Workshop & Challengeでは、ダイアド会話における対人感情と社会的ダイナミクスをモデル化するためのベンチマークが紹介されている。
会話による影響モデリングは急速に進歩しているが、ほとんどのベンチマークは話者中心で、疎結合であり、方向性の影響、会話のタイミング調整、ラポート開発を含むパートナー間の時間進化プロセスである。
このギャップに対処するため,ACII-DaiKon は,(1) 指向性相互影響予測,(2) ターンテイキング予測(next-speaker とtime-to-next-speech),(3) 完全なインタラクションをまたいだラパポートトラジェクトリー予測という,共有データセット上に構築された3つの協調サブチャレンジを提示する。
この課題は、Hum-DaiKonデータセット上に構築され、5つの言語にわたる自然条件下で収集された945のダイアド会話(743.4時間のオーディオヴィジュアルデータ)を含んでいる。
このベンチマークは、固定トレイン/バリデーション/テストの分割、標準化されたメトリクス、リリースされたベースラインシステムによるマルチモーダルモデリング、時間的推論、コンテキスト間の一般化をサポートする。
相関相関係数 (CCC) , ピアソン相関, マクロF1, 平均絶対誤差 (MAE) を用いた。
ベースライン実験は、影響予測のための0.40 CCCと0.50 Pearson、ターンテイクのための0.66 Macro-F1と1.50~s MAE、ラプポート軌道モデリングのための0.68 CCCと0.70 Pearsonの試験結果で最初の基準性能を確立する。
これらの結果は、現在の手法が粗いダイアドパターンを捉える一方で、方向依存の頑健なモデリングと長期水平対人ダイナミクスは依然として困難であることを示している。
このワークショップは、厳密な比較のための共有プラットフォームと、データ妥当性、評価プロトコル、文化的に意識されたダイアドインタラクションのモデリングに関する学際的な議論を提供する。
関連論文リスト
- SocialOmni: Benchmarking Audio-Visual Social Interactivity in Omni Models [86.19617358080016]
Social Omniは、3つのコア次元にわたる対話性の評価を運用するベンチマークである。
Social Omniは2000の知覚サンプルと209の相互作用生成インスタンスの品質管理された診断セットを備えている。
本分析により,モデルの知覚的精度と,文脈的に適切な割り込みを生成する能力との間に顕著な疎結合が明らかとなった。
論文 参考訳(メタデータ) (2026-03-17T17:58:44Z) - One Battle After Another: Probing LLMs' Limits on Multi-Turn Instruction Following with a Benchmark Evolving Framework [51.50565654314582]
大規模言語モデルは、複数のトピックにまたがる対話を通して、ユーザの指示に従うことができる。
既存のベンチマークは、しばしば一定回数のターンに制限されるため、飽和の影響を受けにくく、ユーザのインタラクティブなエクスペリエンスを考慮できない。
マルチターン命令追従能力を評価するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-05T14:39:59Z) - CLEAR-3K: Assessing Causal Explanatory Capabilities in Language Models [3.137688620241855]
CLEAR-3Kは、ある文が別の文を因果的に説明するかどうかを言語モデルが判断できるかどうかを評価するために設計された、3000のアサーション推論質問のデータセットである。
各質問は、意味的関連性と真の因果的説明的関係を区別するために、アサーションとアサーションのペアと挑戦言語モデルを示す。
論文 参考訳(メタデータ) (2025-06-20T17:35:36Z) - ConsistentChat: Building Skeleton-Guided Consistent Multi-Turn Dialogues for Large Language Models from Scratch [79.12929103519922]
Skeleton-Guided Multi-Turn Dialogue Generationは、人間の意図を明示的にモデル化することで、マルチターン命令合成を制約する。
約15,000のマルチターン会話と224,392の発話を持つマルチターン命令データセットであるConsistentChatを構築した。
Light, Topdial, MT-Evalベンチマークの実験では、ConsistentChatで微調整されたモデルでは、チャットの一貫性が20~30%向上し、タスクの成功率が15%向上している。
論文 参考訳(メタデータ) (2025-06-04T04:21:48Z) - Mind the Gap! Static and Interactive Evaluations of Large Audio Models [55.87220295533817]
大型オーディオモデル(LAM)は、音声ネイティブな体験をパワーアップするために設計されている。
本研究は,484名の参加者から,LAMを評価し,7,500名のLAMインタラクションを収集する対話的アプローチを提案する。
論文 参考訳(メタデータ) (2025-02-21T20:29:02Z) - Automated Speaking Assessment of Conversation Tests with Novel Graph-based Modeling on Spoken Response Coherence [11.217656140423207]
ASACは、1つ以上の候補者と対話する環境でL2話者の全体的な発話能力を評価することを目的としている。
本稿では,広い応答間相互作用とニュアンス付き意味情報の両方を適切に組み込んだ階層グラフモデルを提案する。
NICT-JLEベンチマークデータセットの大規模な実験結果から,提案手法が予測精度を大幅に向上する可能性が示唆された。
論文 参考訳(メタデータ) (2024-09-11T07:24:07Z) - DCTM: Dilated Convolutional Transformer Model for Multimodal Engagement
Estimation in Conversation [11.185293979235547]
人間のエンゲージメントをモデル化・推定するための畳み込み変換器を提案する。
提案システムはベースラインモデルを超え,テストセットの7ドル%の改善が目覚ましい。
我々は、異なるモーダル融合機構を用いて、この種のデータに対して、自己注意融合を用いた単純解法が最高の性能を得ることを示す。
論文 参考訳(メタデータ) (2023-07-31T06:02:35Z) - Unifying Language Learning Paradigms [96.35981503087567]
データセットやセットアップ全体にわたって普遍的に有効である事前学習モデルのための統一的なフレームワークを提案する。
本研究では, 事前学習対象を相互に配置し, 異なる対象間の補間を効果的に行う方法を示す。
また,テキスト内学習において,ゼロショットSuperGLUEで175B GPT-3,ワンショット要約でT5-XXLの性能を3倍に向上させた。
論文 参考訳(メタデータ) (2022-05-10T19:32:20Z) - RoBLEURT Submission for the WMT2021 Metrics Task [72.26898579202076]
本稿では,共有メトリクスタスクであるRoBLEURTについて紹介する。
我々のモデルは10対の英語言語対のうち8対でWMT 2020の人間のアノテーションと最先端の相関に達する。
論文 参考訳(メタデータ) (2022-04-28T08:49:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。