論文の概要: Retrieval-Augmented Feature Generation for Domain-Specific Classification
- arxiv url: http://arxiv.org/abs/2406.11177v2
- Date: Sat, 28 Dec 2024 21:16:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:01:30.275498
- Title: Retrieval-Augmented Feature Generation for Domain-Specific Classification
- Title(参考訳): ドメイン特化分類のための検索付加特徴生成
- Authors: Xinhao Zhang, Jinghan Zhang, Fengran Mo, Yuzhong Chen, Kunpeng Liu,
- Abstract要約: 本稿では,ドメイン分類タスクに特有の合理的かつ説明可能な特徴を生成するためのRAFGを提案する。
ドメイン知識を解釈可能な新しい特徴を生成するために,既存の特徴情報検索を行い,潜在的な特徴関連を識別する。
生成過程における特徴の検証とフィルタリングを行うため,機能生成のためのLarge Language Model (LLM) ベースのフレームワークを開発した。
- 参考スコア(独自算出の注目度): 7.445440204397416
- License:
- Abstract: Feature generation can significantly enhance learning outcomes, particularly for tasks with limited data. An effective way to improve feature generation is by expanding the current feature space using existing features and enriching the informational content. However, generating new, interpretable features in application fields often requires domain-specific knowledge about the existing features. This paper introduces a new method RAFG for generating reasonable and explainable features specific to domain classification tasks. To generate new features with interpretability in domain knowledge, we perform information retrieval on existing features to identify potential feature associations, and utilize these associations to generate meaningful features. Furthermore, we develop a Large Language Model (LLM)-based framework for feature generation with reasoning to verify and filter features during the generation process. Experiments across several datasets in medical, economic, and geographic domains show that our RAFG method produces high-quality, meaningful features and significantly improves classification performance compared with baseline methods.
- Abstract(参考訳): 特徴生成は、特に限られたデータを持つタスクにおいて、学習結果を大幅に向上させることができる。
機能生成を改善する効果的な方法は、既存の機能を使用して現在の機能空間を拡張し、情報コンテンツを強化することである。
しかし、アプリケーションフィールドで新しい解釈可能な機能を生成するには、しばしば既存の機能に関するドメイン固有の知識が必要である。
本稿では,ドメイン分類タスクに特有の合理的かつ説明可能な特徴を生成するためのRAFGを提案する。
ドメイン知識を解釈可能な新しい特徴を生成するために,既存の特徴の検索を行い,潜在的な特徴関連を識別し,それらの関連を利用して意味のある特徴を生成する。
さらに、我々は、生成プロセス中に特徴の検証とフィルタリングを行うため、特徴生成のためのLarge Language Model (LLM)ベースのフレームワークを開発する。
医療,経済,地理的領域におけるいくつかのデータセットを対象とした実験により,我々のRAFG法は高品質で有意義な特徴を生み出し,ベースライン法と比較して分類性能を著しく向上させることが示された。
関連論文リスト
- Augmented Functional Random Forests: Classifier Construction and Unbiased Functional Principal Components Importance through Ad-Hoc Conditional Permutations [0.0]
本稿では,木に基づく手法と関数型データ解析を統合した新しい教師付き分類手法を提案する。
機能的分類木と機能的ランダム林の拡張版を提案し,機能的主成分の重要性を評価するための新しいツールを取り入れた。
論文 参考訳(メタデータ) (2024-08-23T15:58:41Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Enhancing Retrieval-Augmented Large Language Models with Iterative
Retrieval-Generation Synergy [164.83371924650294]
検索と生成を反復的に同期させるIter-RetGenと呼ばれる手法により,高い性能が得られることを示す。
モデル出力は、タスクを完了するために必要なものを示し、より関連する知識を取得するための情報的コンテキストを提供する。
Iter-RetGenプロセスは、すべての知識を全体として取得し、構造的な制約なしに生成時の柔軟性をほとんど保持します。
論文 参考訳(メタデータ) (2023-05-24T16:17:36Z) - Challenges of ELA-guided Function Evolution using Genetic Programming [0.0]
探索ランドスケープ解析(ELA)特性によって導かれる遺伝的プログラミング手法は,必ずしも満足度の高い関数を見つけることができないことを示す。
以上の結果から, 景観特性の重み付けに対する注意深い考察が, 対象の景観に十分適応する関数の進化に必要である可能性が示唆された。
論文 参考訳(メタデータ) (2023-05-24T15:31:01Z) - Feature construction using explanations of individual predictions [0.0]
本稿では,予測モデルのインスタンスベース説明の集約に基づく探索空間の削減手法を提案する。
これらのグループに対する探索の削減が特徴構築の時間を大幅に短縮することを実証的に示す。
いくつかの分類器の分類精度を大幅に向上させ,大規模データセットにおいても提案する特徴構築の実現可能性を示した。
論文 参考訳(メタデータ) (2023-01-23T18:59:01Z) - Group-wise Reinforcement Feature Generation for Optimal and Explainable
Representation Space Reconstruction [25.604176830832586]
我々は表現空間の再構成をネストした特徴生成と選択の対話的なプロセスに再構成する。
我々は、機能群、操作群、および他の機能群を横断して新機能を生成するグループワイズ生成戦略を設計する。
システムの有効性, 効率, トレーサビリティ, 明示性を実証するための広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-28T21:34:14Z) - Attribute Prototype Network for Any-Shot Learning [113.50220968583353]
属性ローカライズ機能を統合した画像表現は、任意のショット、すなわちゼロショットと少数ショットのイメージ分類タスクに有用である、と我々は主張する。
クラスレベルの属性のみを用いてグローバルな特徴とローカルな特徴を共同で学習する新しい表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-04T02:25:40Z) - Towards Open-World Feature Extrapolation: An Inductive Graph Learning
Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。
本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文 参考訳(メタデータ) (2021-10-09T09:02:45Z) - Structure-Aware Feature Generation for Zero-Shot Learning [108.76968151682621]
潜在空間と生成ネットワークの両方を学習する際の位相構造を考慮し,SA-GANと呼ばれる新しい構造認識特徴生成手法を提案する。
本手法は,未確認クラスの一般化能力を大幅に向上させ,分類性能を向上させる。
論文 参考訳(メタデータ) (2021-08-16T11:52:08Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。