論文の概要: Reasoning about Actions over Visual and Linguistic Modalities: A Survey
- arxiv url: http://arxiv.org/abs/2207.07568v1
- Date: Fri, 15 Jul 2022 16:15:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-18 14:54:45.722651
- Title: Reasoning about Actions over Visual and Linguistic Modalities: A Survey
- Title(参考訳): 視覚・言語的モダリティに対する行動の推論--調査
- Authors: Shailaja Keyur Sampat, Maitreya Patel, Subhasish Das, Yezhou Yang and
Chitta Baral
- Abstract要約: 知識表現コミュニティでは「行動と変化に関する推論」(RAC)が広く研究されている。
本稿では、既存のタスク、ベンチマークデータセット、様々な技術とモデル、そしてビジョンと言語領域におけるRACの進歩に関するそれぞれのパフォーマンスについて調査する。
- 参考スコア(独自算出の注目度): 39.870773512848096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 'Actions' play a vital role in how humans interact with the world and enable
them to achieve desired goals. As a result, most common sense (CS) knowledge
for humans revolves around actions. While 'Reasoning about Actions & Change'
(RAC) has been widely studied in the Knowledge Representation community, it has
recently piqued the interest of NLP and computer vision researchers. This paper
surveys existing tasks, benchmark datasets, various techniques and models, and
their respective performance concerning advancements in RAC in the vision and
language domain. Towards the end, we summarize our key takeaways, discuss the
present challenges facing this research area, and outline potential directions
for future research.
- Abstract(参考訳): 行動」は、人間が世界とどのように相互作用し、望ましい目標を達成するかにおいて重要な役割を果たす。
結果として、人間に対する最も一般的な感覚(cs)の知識は行動に関するものである。
知識表現コミュニティでは「行動と変化に関する推論」(RAC)が広く研究されているが、最近ではNLPやコンピュータビジョン研究者の関心を喚起している。
本稿では、既存のタスク、ベンチマークデータセット、様々な技術とモデル、そしてビジョンと言語領域におけるRACの進歩に関するそれぞれのパフォーマンスについて調査する。
最後に,本研究の要点を概説し,この研究領域に直面する課題を議論し,今後の研究の方向性について概説する。
関連論文リスト
- The Imperative of Conversation Analysis in the Era of LLMs: A Survey of Tasks, Techniques, and Trends [64.99423243200296]
会話分析(CA)は、会話データから重要な情報を発見し分析する。
本稿では,CAタスクの徹底的なレビューとシステム化を行い,既存の業務を要約する。
会話シーンの再構築,奥行きの属性分析,ターゲットトレーニングの実行,会話の生成から,CAの4つの重要なステップを導出した。
論文 参考訳(メタデータ) (2024-09-21T16:52:43Z) - Transfer Learning in Human Activity Recognition: A Survey [0.13029741239874087]
センサベースのヒューマンアクティビティ認識(HAR)は、スマート環境、生活支援、フィットネス、ヘルスケアなどへの応用により、活発な研究領域となっている。
近年,ディープラーニングに基づくエンドツーエンドトレーニングにより,コンピュータビジョンや自然言語といった領域における最先端のパフォーマンスが向上している。
我々は、スマートホームとウェアラブルベースのHARのアプリケーション領域におけるこれらの伝達学習手法に焦点をあてる。
論文 参考訳(メタデータ) (2024-01-18T18:12:35Z) - Group Activity Recognition in Computer Vision: A Comprehensive Review,
Challenges, and Future Perspectives [0.0]
グループ活動認識はコンピュータビジョンにおけるホットトピックである。
グループ関係を通じた活動の認識はグループ活動認識において重要な役割を担っている。
本研究は,グループ活動の認識における技術進歩について考察する。
論文 参考訳(メタデータ) (2023-07-25T14:44:41Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - Learning Action-Effect Dynamics for Hypothetical Vision-Language
Reasoning Task [50.72283841720014]
本研究では,行動の効果に関する推論を改善する新しい学習戦略を提案する。
本稿では,提案手法の有効性を実証し,性能,データ効率,一般化能力の観点から,従来のベースラインに対する優位性を論じる。
論文 参考訳(メタデータ) (2022-12-07T05:41:58Z) - Learning Action-Effect Dynamics from Pairs of Scene-graphs [50.72283841720014]
本稿では,画像のシーングラフ表現を利用して,自然言語で記述された行動の効果を推論する手法を提案する。
提案手法は,既存のモデルと比較して,性能,データ効率,一般化能力の点で有効である。
論文 参考訳(メタデータ) (2022-12-07T03:36:37Z) - Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future
Directions [23.389491536958772]
VLN(Vision-and-Language Navigation)は、この目標に向けた基本的な、学際的な研究テーマである。
VLNは自然言語処理、コンピュータビジョン、ロボティクス、機械学習コミュニティから注目を集めている。
本稿では,VLN研究コミュニティの詳細な参照として機能する。
論文 参考訳(メタデータ) (2022-03-22T16:58:10Z) - Multimodal Research in Vision and Language: A Review of Current and
Emerging Trends [41.07256031348454]
本稿では,視覚的・言語的モダリティに関する最新の研究動向について概説する。
タスクの定式化におけるその応用と、意味認識やコンテンツ生成に関する様々な問題を解決する方法について検討する。
私たちは、この領域をよりモジュール的で透明なインテリジェントなシステムに向け、過去に現れた、多分野のパターンと洞察に光を当てました。
論文 参考訳(メタデータ) (2020-10-19T13:55:10Z) - LEMMA: A Multi-view Dataset for Learning Multi-agent Multi-task
Activities [119.88381048477854]
LEMMAデータセットを導入し、細心の注意深い設定で、行方不明な次元に対処するための単一の家を提供する。
我々は、人間と物体の相互作用による原子間相互作用を密に注釈し、日常の活動の構成性、スケジューリング、割り当ての土台として提供する。
この取り組みにより、マシンビジョンコミュニティは、目標指向の人間活動を調べ、現実世界におけるタスクのスケジューリングと割り当てをさらに研究できることを期待します。
論文 参考訳(メタデータ) (2020-07-31T00:13:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。