論文の概要: Dude, where's my utterance? Evaluating the effects of automatic segmentation and transcription on CPS detection
- arxiv url: http://arxiv.org/abs/2507.04454v1
- Date: Sun, 06 Jul 2025 16:25:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.18993
- Title: Dude, where's my utterance? Evaluating the effects of automatic segmentation and transcription on CPS detection
- Title(参考訳): 私の発話はどこにあるのか? 自動セグメンテーションと転写がCPS検出に及ぼす影響の評価
- Authors: Videep Venkatesha, Mariah Bradford, Nathaniel Blanchard,
- Abstract要約: 協調的問題解決マーカーは、効果的なチームワークの重要な側面を捉えます。
これらのマーカーを確実に検出するAIシステムは、あるグループが苦労しているか、あるいは生産的なコラボレーションを実証しているかを教師が識別するのに役立つ。
我々は、CPS検出が2つの重要なコンポーネント、すなわち転写と音声のセグメンテーションによってどのように影響するかを評価する。
- 参考スコア(独自算出の注目度): 0.27309692684728604
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collaborative Problem-Solving (CPS) markers capture key aspects of effective teamwork, such as staying on task, avoiding interruptions, and generating constructive ideas. An AI system that reliably detects these markers could help teachers identify when a group is struggling or demonstrating productive collaboration. Such a system requires an automated pipeline composed of multiple components. In this work, we evaluate how CPS detection is impacted by automating two critical components: transcription and speech segmentation. On the public Weights Task Dataset (WTD), we find CPS detection performance with automated transcription and segmentation methods is comparable to human-segmented and manually transcribed data; however, we find the automated segmentation methods reduces the number of utterances by 26.5%, impacting the the granularity of the data. We discuss the implications for developing AI-driven tools that support collaborative learning in classrooms.
- Abstract(参考訳): 協調的問題解決(CPS)マーカーは、タスクの継続、中断の回避、建設的なアイデアの生成など、効果的なチームワークの重要な側面を捉えます。
これらのマーカーを確実に検出するAIシステムは、あるグループが苦労しているか、あるいは生産的なコラボレーションを実証しているかを教師が識別するのに役立つ。
このようなシステムには、複数のコンポーネントで構成される自動パイプラインが必要です。
本研究では,CPS検出が2つの重要な構成要素である転写と音声のセグメンテーションの自動化によってどのように影響するかを評価する。
WTD(Public Weights Task Dataset)では、自動書き起こしとセグメント化手法によるCPS検出性能は、人文や手書きによる書き起こしデータに匹敵するが、自動化セグメンテーション手法は発話数を26.5%削減し、データの粒度に影響を及ぼす。
教室における協調学習を支援するAI駆動型ツールの開発について論じる。
関連論文リスト
- Leadership Assessment in Pediatric Intensive Care Unit Team Training [12.775569777482566]
本稿では、自我中心のビジョンに基づく自動分析フレームワークを開発することにより、PICUチームのリーダーシップスキルを評価するタスクについて述べる。
指導力評価の重要指標として, 固定対象, アイコンタクト, 会話パターンなどの重要な行動指標を同定した。
論文 参考訳(メタデータ) (2025-05-30T09:19:33Z) - Transparent and Coherent Procedural Mistake Detection [27.40806437649092]
手続き的誤り検出(英: Procedural mis detection、PMD)は、人間がタスクをうまく実行したかどうかを分類する難しい問題である(手続き的テキストで特定)。
我々は、意思決定に視覚的自己対話的合理性を生成するためにPMDを拡張した。
近年のヴィジュアル・アンド・ランゲージモデル(VLM)で観察される印象的かつ成熟した画像理解能力を考えると、個々のフレームに基づいてPMDに適したベンチマークデータセットをキュレートする。
我々の改定は前例のない透明性を実現するため、自然言語推論(NLI)モデルを用いて、生成した有理数のコヒーレンスを2つの自動メトリクスで定式化する。
論文 参考訳(メタデータ) (2024-12-16T16:13:55Z) - Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Evaluating the IWSLT2023 Speech Translation Tasks: Human Annotations, Automatic Metrics, and Segmentation [50.60733773088296]
音声言語翻訳国際ワークショップ(IWSLT 2023)における共有タスクの結果を総合的に評価する。
本稿では,セグメントコンテキストによる自動回帰と直接評価に基づく効果的な評価戦略を提案する。
分析の結果,1) 提案した評価戦略は頑健であり,他の種類の人的判断とよく相関している,2) 自動測定基準は通常,必ずしも直接評価スコアとよく関連しているわけではない,3) COMET は chrF よりもわずかに強い自動測定基準である,といった結果を得た。
論文 参考訳(メタデータ) (2024-06-06T09:18:42Z) - A Self-Supervised Method for Body Part Segmentation and Keypoint Detection of Rat Images [0.0]
実験室ラットの手動ラベル付けの必要性を軽減する方法を提案する。
最終システムは、オブジェクトが密閉されている場合でも、例のセグメンテーション、キーポイント検出、およびボディ部分セグメンテーションが可能である。
論文 参考訳(メタデータ) (2024-05-07T20:11:07Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - How Good is Automatic Segmentation as a Multimodal Discourse Annotation
Aid? [3.3861948721202233]
我々は,協調問題解決のための支援として,異なる発話分割手法の質を評価する。
また, 音素発声は, 自動分節音声と最小の対応を保ち, 異なる分節音声を用いた分節音声も一致しないことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:06:15Z) - Adaptive Multi-scale Online Likelihood Network for AI-assisted
Interactive Segmentation [3.3909100561725127]
既存の対話的セグメンテーション手法はラベルリファインメントに自動セグメンテーションとユーザインタラクションを利用する。
データ効率の良いオンライン環境で適応的に学習する適応型マルチスケールオンライン可能性ネットワーク(MONET)を提案する。
我々のアプローチは、Diceのスコアが5.86%高く、NASA-TLXのワークロードスコアが最先端のものよりも24.67%低かった。
論文 参考訳(メタデータ) (2023-03-23T22:20:56Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - TraSeTR: Track-to-Segment Transformer with Contrastive Query for
Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。
TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。
提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文 参考訳(メタデータ) (2022-02-17T05:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。