論文の概要: LINGUAL: Language-INtegrated GUidance in Active Learning for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2511.14028v1
- Date: Tue, 18 Nov 2025 01:12:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.866333
- Title: LINGUAL: Language-INtegrated GUidance in Active Learning for Medical Image Segmentation
- Title(参考訳): lingUal:医療画像セグメンテーションのためのアクティブラーニングにおける言語内GUidance
- Authors: Md Shazid Islam, Shreyangshu Bera, Sudipta Paul, Amit K. Roy-Chowdhury,
- Abstract要約: lingUALは、専門家から自然言語命令を受け取り、コンテキスト内学習を通じて実行可能プログラムに変換し、人間の介入なしに対応するサブタスクのシーケンスを自動的に実行するフレームワークである。
そこで本研究では,ALベースラインに匹敵する性能と優れた性能を達成しつつ,推定アノテーション時間を約80%短縮したlingUALの有効性を実証した。
- 参考スコア(独自算出の注目度): 16.667438330044703
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Although active learning (AL) in segmentation tasks enables experts to annotate selected regions of interest (ROIs) instead of entire images, it remains highly challenging, labor-intensive, and cognitively demanding due to the blurry and ambiguous boundaries commonly observed in medical images. Also, in conventional AL, annotation effort is a function of the ROI- larger regions make the task cognitively easier but incur higher annotation costs, whereas smaller regions demand finer precision and more attention from the expert. In this context, language guidance provides an effective alternative, requiring minimal expert effort while bypassing the cognitively demanding task of precise boundary delineation in segmentation. Towards this goal, we introduce LINGUAL: a framework that receives natural language instructions from an expert, translates them into executable programs through in-context learning, and automatically performs the corresponding sequence of sub-tasks without any human intervention. We demonstrate the effectiveness of LINGUAL in active domain adaptation (ADA) achieving comparable or superior performance to AL baselines while reducing estimated annotation time by approximately 80%.
- Abstract(参考訳): セグメンテーションタスクにおけるアクティブラーニング(AL)は、画像全体ではなく、専門家が選択された関心領域(ROI)に注釈を付けることを可能にするが、医療画像でよく見られる曖昧で曖昧な境界のために、非常に困難で、労働集約的で、認知的に要求される。
また、従来のALでは、アノテーションの取り組みはROIの関数であり、より大きな領域は、タスクを認知的に容易にするが、より高いアノテーションコストを発生させる一方、より小さな領域はより精密で専門家の注意を必要とする。
この文脈では、言語指導は効果的な代替手段を提供し、セグメンテーションにおける正確な境界線を正確に記述する認知的に要求されるタスクを回避しながら、最小限の専門家の努力を必要とする。
そこで本研究では,専門家から自然言語命令を受け取り,テキスト内学習を通じて実行可能プログラムに翻訳し,人間の介入なしに対応するサブタスクのシーケンスを自動的に実行するフレームワークであるlingUALを紹介する。
アクティブドメイン適応(ADA)におけるlingUALの有効性を示すとともに,推定アノテーション時間を約80%短縮する。
関連論文リスト
- SAME: Learning Generic Language-Guided Visual Navigation with State-Adaptive Mixture of Experts [54.11162991206203]
本稿では,多様なナビゲーションタスクを統一的で汎用的なフレームワークに統合する。
本稿では,エージェントによる意思決定の推論を効果的に行うことのできる,新しい状態適応型エキスパート混合モデルを提案する。
論文 参考訳(メタデータ) (2024-12-07T06:12:53Z) - SMILE: Speech Meta In-Context Learning for Low-Resource Language Automatic Speech Recognition [55.2480439325792]
音声メタインコンテキスト学習(SMILE)は、メタラーニングと音声インコンテキスト学習(SICL)を組み合わせた革新的なフレームワークである
SMILEは、トレーニング不要な多言語ASRタスクにおいて、ベースライン手法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2024-09-16T16:04:16Z) - Scalable Language Model with Generalized Continual Learning [58.700439919096155]
The Joint Adaptive Re-ization (JARe) is integrated with Dynamic Task-related Knowledge Retrieval (DTKR) to enable adapt adjust of language model based on specific downstream task。
提案手法は,様々なバックボーンやベンチマーク上での最先端性能を実証し,最小限の忘れを伴い,フルセットおよび少数ショットのシナリオにおいて効果的な連続学習を実現する。
論文 参考訳(メタデータ) (2024-04-11T04:22:15Z) - From Classification to Generation: Insights into Crosslingual Retrieval
Augmented ICL [8.065775937617417]
クロスランガル検索強化インコンテキスト学習(CREA-ICL)を利用した新しい手法を提案する。
高ソース言語から意味論的に類似したプロンプトを抽出することにより、多言語事前学習言語モデル(MPLM)のゼロショット性能の向上を目指す。
我々の手法は分類タスクを着実に改善するが、生成タスクでは課題に直面している。
論文 参考訳(メタデータ) (2023-11-11T15:40:21Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Exploring the Limits of Natural Language Inference Based Setup for
Few-Shot Intent Detection [13.971616443394474]
汎用的なFewショットインテント検出は、より現実的だが難しいセットアップである。
自然言語推論に基づくシンプルで効果的な手法を用いる。
提案手法は,1ショットと5ショットのインテント検出タスクにおいて,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2021-12-14T14:47:23Z) - Learning from Executions for Semantic Parsing [86.94309120789396]
注釈付きデータの限られた量が利用できる半教師付き学習の課題に焦点をあてる。
ラベルなし発話に対する実行可能プログラムを提案する。
論文 参考訳(メタデータ) (2021-04-12T21:07:53Z) - Structured Prediction as Translation between Augmented Natural Languages [109.50236248762877]
本研究では,構造化予測言語の課題を解決するために,新しいフレームワークであるTANL(Translation between Augmented Natural Languages)を提案する。
タスク固有の差別を訓練することで問題に取り組む代わりに、拡張自然言語間の翻訳タスクとして位置づける。
提案手法は, タスク固有のモデルに適合するか, 性能に優れ, 特に, 共同エンティティと関係抽出に関する新たな最先端結果が得られる。
論文 参考訳(メタデータ) (2021-01-14T18:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。