Exploring the Mystery of Influential Data for Mathematical Reasoning [127.6] 数学的推論のためのQaDS(Quality-Aware Diverse Selection)戦略を提案する。
他の選択戦略との比較は、QaDSの優位性を検証する。
OpenMathMixでは、7Bベースモデルを用いたMATHで最先端の48.8%の精度を実現している。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 06:03:06 GMT)
Structured Video-Language Modeling with Temporal Grouping and Spatial Grounding [112.4] 簡単なビデオ言語モデリングフレームワークであるS-ViLMを提案する。
これには、学習領域オブジェクトのアライメントと時間認識機能を促進するために、クリップ間の空間的接地と、クリップ内の時間的グループ化という、2つの新しい設計が含まれている。
S-ViLMは4つの下流タスクにおいて、最先端の手法を大幅に超えている。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 00:09:15 GMT)
From Static to Dynamic: Adapting Landmark-Aware Image Models for Facial Expression Recognition in Videos [88.1] 野生における動的表情認識(DFER)は、データ制限によって依然として妨げられている。
抽出された顔のランドマーク認識機能に暗黙的に符号化された既存のSFER知識と動的情報を活用する新しい静的・動的モデル(S2D)を提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 01:43:29 GMT)
Good Idea or Not, Representation of LLM Could Tell [86.4] 我々は、大規模言語モデルの知識を活用し、科学的アイデアのメリットを評価することを目的としたアイデアアセスメントに焦点をあてる。
我々は、このタスクに対する様々なアプローチのパフォーマンスを訓練し評価するために、細心の注意を払って設計された、フルテキストを持つ約4万の原稿からベンチマークデータセットをリリースする。
その結果, 大規模言語モデルの表現は, 生成出力よりもアイデアの価値を定量化する可能性が高いことが示唆された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 02:07:22 GMT)
HowToCaption: Prompting LLMs to Transform Video Annotations at Scale [72.7] 本稿では,大言語モデル(LLM)の能力を活用して,大規模ビデオに対応する高品質な映像記述を実現することを提案する。
本稿では,より長い字幕テキストを考慮に入れたプロンプト手法を提案する。
我々は、HowTo100Mデータセットの字幕にメソッドを適用し、新しい大規模データセット、HowToCaptionを作成します。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 11:40:03 GMT)
DOCE: Finding the Sweet Spot for Execution-Based Code Generation [69.5] 本稿では,候補生成,$n$-best再ランク,最小ベイズリスク(MBR)復号化,自己老化などを含む包括的フレームワークを提案する。
本研究は,実行ベースメソッドの重要性と,実行ベースメソッドと実行フリーメソッドとの差を明らかにする。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 10:09:31 GMT)
Generative Hierarchical Temporal Transformer for Hand Pose and Action Modeling [67.9] ハンドポーズとアクションをモデル化するための生成型Transformer VAEアーキテクチャを提案する。
手ポーズとアクションのセマンティックな依存性と時間的粒度を忠実にモデル化するために、我々はこのフレームワークを2つのケース化されたVAEブロックに分解する。
その結果,独立解よりも認識と予測の連成モデリングが向上することが示唆された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 00:44:19 GMT)
Does Your Neural Code Completion Model Use My Code? A Membership Inference Approach [66.5] 本稿では,現在のニューラルコード補完モデルの法的および倫理的問題について考察する。
私たちは、もともと分類タスクのために作られたメンバシップ推論アプローチ(CodeMIと呼ばれる)を調整します。
我々は,この適応型アプローチの有効性を,多種多様なニューラルコード補完モデルで評価した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:59:47 GMT)
A Comprehensive Survey on Evidential Deep Learning and Its Applications [64.8] Evidential Deep Learning (EDL)は、単一のフォワードパスで最小限の追加計算で信頼性の高い不確実性推定を提供する。
まず、主観的論理理論であるEDLの理論的基礎を掘り下げ、他の不確実性推定フレームワークとの区別について議論する。
さまざまな機械学習パラダイムや下流タスクにまたがる広範な応用について詳しく述べる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 05:55:06 GMT)
Unleashing the Power of Generic Segmentation Models: A Simple Baseline for Infrared Small Target Detection [57.7] 本稿では,Segment Anything Model (SAM) などのジェネリックセグメンテーションモデルの赤外線小物体検出タスクへの適応について検討する。
提案モデルでは,既存の手法と比較して,精度とスループットの両方で性能が大幅に向上した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 05:31:24 GMT)
A Sample Efficient Alternating Minimization-based Algorithm For Robust Phase Retrieval [56.7] そこで本研究では,未知の信号の復元を課題とする,ロバストな位相探索問題を提案する。
提案するオラクルは、単純な勾配ステップと外れ値を用いて、計算学的スペクトル降下を回避している。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 06:37:23 GMT)
Learning Joint Models of Prediction and Optimization [56.0] Predict-Then-Thenフレームワークは、機械学習モデルを使用して、最適化問題の未知のパラメータを、解決前の機能から予測する。
本稿では,共同予測モデルを用いて観測可能特徴から最適解を直接学習する手法を提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 19:52:14 GMT)
Beyond One-Time Validation: A Framework for Adaptive Validation of Prognostic and Diagnostic AI-based Medical Devices [55.3] 既存のアプローチは、これらのデバイスを実際にデプロイする際の複雑さに対処するのに不足することが多い。
提示されたフレームワークは、デプロイメント中に検証と微調整を繰り返すことの重要性を強調している。
現在の米国とEUの規制分野に位置づけられている。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 11:13:52 GMT)
Optimization Hyper-parameter Laws for Large Language Models [52.5] ハイパーパラメータとトレーニング結果の関係をキャプチャするフレームワークであるOps-Lawsを提案する。
さまざまなモデルサイズとデータスケールにわたる検証は、Opt-Lawsのトレーニング損失を正確に予測する能力を示しています。
このアプローチは、全体的なモデル性能を高めながら、計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 09:37:19 GMT)
Rethinking The Training And Evaluation of Rich-Context Layout-to-Image Generation [44.1] 生成モデリングにおける特殊領域はレイアウト・ツー・イメージ(L2I)生成である。
レイアウト・ツー・イメージ・ジェネレーションの強化を目的とした,新しい領域横断モジュールを提案する。
オープン語彙シナリオにおけるL2I性能を評価するための2つの指標を提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 14:57:03 GMT)
The representation landscape of few-shot learning and fine-tuning in large language models [43.8] In-context Learning (ICL) と supervised Fine-tuning (SFT) は、現代の大規模言語モデル (LLM) の性能向上のための2つの一般的な戦略である。
この2つの事例において,隠れた表現の確率的景観を解析した。
ICLとSFTは、どちらもネットワークの中央で急激な遷移を行う場合において、非常に異なる内部構造を生成する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 12:47:54 GMT)
Just ASR + LLM? A Study on Speech Large Language Models' Ability to Identify and Understand Speaker in Spoken Dialogue [41.1] ガオカオ等のベンチマークで,音声対話質問応答(SQA)の性能を実証した。
多くの質問に対する正しい回答は、話者を特定することなく、会話コンテキストのみから推測できる。
SQAを解くと、現在のSpeechLLMは音声からの話者認識が限られていることが示唆された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 22:54:47 GMT)
MegaFusion: Extend Diffusion Models towards Higher-resolution Image Generation without Further Tuning [38.6] MegaFusionは、既存の拡散ベースのテキスト-画像生成モデルを拡張して、効率的な高解像度生成を実現する。
我々は、異なる解像度でデノナイジングプロセスをブリッジするために、革新的なトランケートとリレー戦略を採用しています。
拡張畳み込みとノイズ再スケジューリングを統合することで、より高分解能のモデルに先行するモデルをさらに適応させる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:08:04 GMT)
Video Editing for Video Retrieval [37.5] ビデオクリップ編集のために学生-教師ネットワークが導入された。
教師モデルはトレーニングセットのクリップを編集するために使用され、学生モデルは編集されたクリップを訓練する。
3つのビデオ検索データセット、YouCook2、DiDeMo、ActivityNet-Captionsで行った実験では、編集済みクリップは3つの検索モデルすべてにわたって、初期クリップよりも検索性能を一貫して改善している。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 14:29:11 GMT)
Provably Robust Multi-bit Watermarking for AI-generated Text [37.2] 大規模言語モデル(LLM)は、人間の言語に似たテキストを生成する顕著な能力を示した。
犯罪者が偽ニュースやフィッシングメールなどの偽装コンテンツを作成するために悪用することもある。
ウォーターマーキングはこれらの懸念に対処するための重要なテクニックであり、メッセージをテキストに埋め込む。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 02:24:16 GMT)
Leveraging Open Knowledge for Advancing Task Expertise in Large Language Models [36.2] オープンな知識を持つ大規模言語モデルのタスク専門性を向上させるために,人手によるサンプル(Kショット)を少数導入する。
複数の専門家の間で個別のyet-complementaryな知識を最大限に活用するために、Mixix-of-expert (MoE)システムを構築している。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 15:12:51 GMT)
Debias Can be Unreliable: Mitigating Bias Issue in Evaluating Debiasing Recommendation [34.2] 従来の評価手法は、ランダムに出力されたデータセットには適さない。
本稿では、ランダムに出力されたデータセットの利用を調整し、真のリコール性能を不偏に推定するUnbiased Recall Evaluationスキームを提案する。
論文参考訳(メタデータ) (Sat, 07 Sep 2024 12:42:58 GMT)
The Vulnerability Is in the Details: Locating Fine-grained Information of Vulnerable Code Identified by Graph-based Detectors [33.4] VULEXPLAINERは、粗いレベルの脆弱なコードスニペットから脆弱性クリティカルなコード行を見つけるためのツールである。
C/C++の一般的な8つの脆弱性に対して、90%の精度で脆弱性をトリガするコードステートメントにフラグを付けることができる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 12:26:49 GMT)
Neural Augmentation Based Panoramic High Dynamic Range Stitching [30.5] 本稿では, 神経拡張に基づくパノラマHDR縫合法を提案する。
提案アルゴリズムは既存のパノラマ縫合アルゴリズムより優れている。
実験により,提案アルゴリズムは既存のパノラマ縫合アルゴリズムより優れていることが示された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 02:16:19 GMT)
DQ-DETR: DETR with Dynamic Query for Tiny Object Detection [29.6] DQ-DETRは3つの異なるコンポーネントから構成される。
DQ-DETRは、カテゴリカウントモジュールからの予測と密度マップを使用して、オブジェクトクエリの数を動的に調整する。
我々のモデルはAI-TOD-V2データセットで最先端のmAPを30.2%達成する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 05:15:34 GMT)
OneActor: Consistent Character Generation via Cluster-Conditioned Guidance [29.4] 我々はOneActorと呼ばれる新しいワンショットチューニングパラダイムを提案する。
プロンプトのみによって駆動される一貫した主題生成を効率よく行う。
提案手法は多目的生成が可能であり, 一般的な拡散拡張と互換性がある。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 10:56:07 GMT)
Emilia: An Extensive, Multilingual, and Diverse Speech Dataset for Large-Scale Speech Generation [26.6] Emiliaは、最初の大規模、多言語、多様な音声生成データセットである。
6つの言語にまたがる101k時間以上のスピーチから始まり、幅広い話し方をカバーする。
Emiliaのスケールアップを容易にするために,最初のオープンソース前処理パイプラインであるEmilia-Pipeも紹介する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 15:08:24 GMT)
Centralized Selection with Preferences in the Presence of Biases [25.7] 本論文は,候補を複数のグループに分けた設定に焦点をあて,いくつかのグループにおける候補の観測ユーティリティは,真のユーティリティよりも体系的に低い偏りを呈する。
アルゴリズムは、選好に関して準最適群フェアネスを達成するための選択を生成するとともに、分布的仮定の下で真の効用をほぼ最大化する証明と共に提示される。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 19:47:13 GMT)
Enhancing Outlier Knowledge for Few-Shot Out-of-Distribution Detection with Extensible Local Prompts [25.5] Out-of-Distribution (OOD) 検出は、既知のカテゴリとアウトリーチを区別することを目的としている。
本稿では,局所的なプロンプトによる局所的な拡張を強調するための新しいチューニングパラダイムを提案する。
提案手法は,ImageNet-1kデータセットを用いた4ショットチューニングにおいて,最先端手法に対して平均FPR95を5.17%削減する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 11:24:52 GMT)
Graph Convolutional Neural Networks Sensitivity under Probabilistic Error Model [24.2] 本稿では,確率的グラフ摂動に対するGCNNの感度を評価するための分析フレームワークを提案する。
本研究は,誤差モデルパラメータに明示的に関連づけられた厳密なGSO誤差境界を確立し,GSO摂動と結果の出力差との線形関係を明らかにする。
実験は、我々の理論的導出とアプローチの有効性を検証する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 19:49:36 GMT)
Enhancing Fine-Grained Visual Recognition in the Low-Data Regime Through Feature Magnitude Regularization [23.8] 抽出した特徴量の均等分布を保証するために正規化手法を導入する。
その明らかな単純さにもかかわらず、我々の手法は様々な細粒度視覚認識データセットに対して顕著な性能向上を示した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 05:36:52 GMT)
EarthGen: Generating the World from Top-Down Views [23.7] 本稿では,広域な地形モデリングのための新しい手法を提案する。
我々のモデルの中核は超解像拡散モデルのカスケードであり、複数の解像度で一貫した画像を生成するために組み合わせることができる。
提案手法は,Bing Mapsから収集したデータセット上で評価し,超高解像度の1024倍ズーム処理において,超高解像度のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 21:49:56 GMT)
Explicit Mutual Information Maximization for Self-Supervised Learning [23.4] 理論的には、相互情報(MIM)は自己教師型学習(SSL)の最適基準である
この研究は、MIの明示的な性質に基づいて、一般的な分布仮定の下で、MIがSSLに適用可能であることを示している。
2次統計量のみを用いてMIM基準に基づく損失関数を導出する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 07:44:33 GMT)
Synthetic Dataset for Evaluating Complex Compositional Knowledge for Natural Language Inference [22.3] 論理学における構成性を理解するために,自然言語推論モデルの性能について検討する。
SICKデータセットから15の例を修正して1,304の文対を生成する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 23:45:10 GMT)
Multi-Conditioned Denoising Diffusion Probabilistic Model (mDDPM) for Medical Image Synthesis [22.0] アノテーションを用いた合成画像の制御生成フレームワークを提案する。
本手法は, 解剖学的に忠実に表現できる, 注記式肺CT画像を作成することができることを示す。
本実験は, この自然の制御された生成フレームワークが, ほぼすべての最先端画像生成モデルを超えることを実証した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 01:19:02 GMT)
Untie the Knots: An Efficient Data Augmentation Strategy for Long-Context Pre-Training in Language Models [21.9] 長いコンテキストを扱うためのトレーニングモデルには、大きな課題があります。
継続事前学習フェーズで使用される新しいデータ拡張戦略であるUntie the Knots(textbfUtK)を紹介する。
我々は、UtKがRULER上で128Kの文脈長で75%と84.5%の精度を達成したことを示す200億のトークンで訓練された7Bと72Bのパラメータを持つモデルに関する広範な実験を行った。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 09:28:55 GMT)
NapTune: Efficient Model Tuning for Mood Classification using Previous Night's Sleep Measures along with Wearable Time-series [20.9] 睡眠は、感情的な調節と全体的なメンタルヘルスにおいて重要な要素であることが知られている。
本研究では、前夜の睡眠測定とウェアラブルによる気分認識の統合について検討する。
そこで我々は,凍結学習したウェアラブル時系列エンコーダへの追加入力として睡眠関連尺度を利用する,新しいプロンプトチューニングフレームワークであるNapTuneを提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 06:06:04 GMT)
Activation Function Optimization Scheme for Image Classification [20.5] 活性化関数は、ディープニューラルネットワークの力学、収束、性能に大きな影響を及ぼす。
本稿では,画像分類タスクに特化してアクティベーション関数を最適化するための進化的アプローチを提案する。
我々は、指数誤差線形ユニット(EELU)と呼ばれる一連の高パフォーマンス活性化関数を得る。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 21:40:15 GMT)
Selective Self-Rehearsal: A Fine-Tuning Approach to Improve Generalization in Large Language Models [19.8] 本稿では,SSR(Selective Self-Rehearsal)を導入し,SFT(Selective Self-Rehearsal)に匹敵する性能を実現する。
モデルの正しい応答を利用することで、SSRは微調整段階におけるモデルの特殊化を減らす。
SSRの有効性は、様々なデータセットにまたがる解決不可能なクエリを識別するタスクに関する実験を通じて実証される。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 10:21:03 GMT)
Deep Computer Vision for Solar Physics Big Data: Opportunities and Challenges [19.7] このビジョンペーパーは、太陽物理学の様々なタイプのビッグデータ(SPBD)の概要を提示する。
深層コンピュータビジョンをSPBDに適用する新たな機会を探究し、ユニークな課題を強調し、将来的な研究の方向性を概説する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 15:05:24 GMT)
Polyp SAM 2: Advancing Zero shot Polyp Segmentation in Colorectal Cancer Detection [18.6] ポリープ分画は大腸癌の早期発見と診断において重要な役割を担っている。
最近、Meta AI Researchは、いくつかのセグメンテーションタスクで有望なパフォーマンスを示す一般的なセグメンテーションモデル2(SAM2)をリリースした。
そこで本論文では,各種刺激条件下でのセグメンテーションポリプにおけるSAM2の性能評価を行った。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 23:28:35 GMT)
Training-Free Point Cloud Recognition Based on Geometric and Semantic Information Fusion [18.6] 幾何学的特徴と意味的特徴を統合した新しい手法を提案する。
セマンティックブランチでは、コントラスト学習を通じて事前学習されたモデルを活用し、テキスト特徴と整合してセマンティック特徴を得る。
提案手法は,いくつかの一般的なベンチマークデータセットにおいて,既存の最先端のトレーニングフリーアプローチよりも優れている。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 08:20:02 GMT)
HAIChart: Human and AI Paired Visualization System [17.8] HAIChartは、ユーザフィードバックを取り入れて、与えられたデータセットに対して優れた視覚化を推奨するように設計された強化学習ベースのフレームワークである。
本稿では,モンテカルログラフ検索に基づく可視化生成アルゴリズムと合成報酬関数を組み合わせて,視覚化空間を効率的に探索し,優れた視覚化を自動的に生成する手法を提案する。
我々は定量的評価とユーザスタディの両方を行い、HAIChartは最先端の人力ツール(リコールでは21%、CPUでは1.8倍)とAIによる自動ツール(Hit@3とR10@30では25.1%、それぞれ14.9%)を大きく上回っていることを示した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:36:39 GMT)
A Quantitative Approach for Evaluating Disease Focus and Interpretability of Deep Learning Models for Alzheimer's Disease Classification [17.5] 深層学習(DL)モデルはアルツハイマー病(AD)分類において有意な可能性を示している。
我々は,DLモデルの解釈可能性を高めるために,定量的な病因抽出戦略を開発した。
疾患関連領域に注目する能力の観点から,これらのモデルを評価した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 19:16:40 GMT)
Power Line Aerial Image Restoration under dverse Weather: Datasets and Baselines [17.3] 電力線自律検査(PLAI)はスマートグリッドの構築において重要な役割を果たす。
PLAIはUAVが捉えた空中画像の電気成分と欠陥を正確に検出して完成する。
航空画像の可視的品質は、ヘイズ、雨、雪などの悪天候によって必然的に劣化し、我々の研究で検出精度を劇的に低下させることが判明した。
本稿では,悪天候の劣化画像から清潔で高品質な画像の復元を目的とした,逆気象下での電力線動画像復元(PLAIR-AW)の課題を提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 12:53:05 GMT)
LiTelFuzz : Swarms Fuzzing Based on Linear Temporal Logic Constraints [16.6] マルチロボット群における論理的欠陥を発見するための形式的検証手法を提案する。
具体的には,これらの制約に基づいて,SwarmとSwarmの線形時間論理制約を抽象化する。
このアイデアに基づいて、LiTelFuzzをベースとした単一攻撃ドローンファジリングスキームと複数攻撃ドローンスキームを実装した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 06:46:23 GMT)
Comet: A Communication-efficient and Performant Approximation for Private Transformer Inference [16.3] 推論性能を損なうことなく通信コストを削減するために,新しいプラグイン方式Cometを導入する。
私たちは、GLUEベンチマークデータセットでComet on BertとRoBERTaモデルを評価し、通信の少ない3.9$times$と3.5$times$ Speedupsを示しました。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:07:44 GMT)
Hierarchical Sparse Representation Clustering for High-Dimensional Data Streams [16.2] 本稿では,高次元データストリームをクラスタリングするための階層的スパース表現クラスタリング法を提案する。
いくつかのベンチマークデータセットで得られた実験結果は、HSRCの有効性とロバスト性を示している。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 03:40:55 GMT)
Fisheye-GS: Lightweight and Extensible Gaussian Splatting Module for Fisheye Cameras [16.2] 魚眼カメラのプロジェクション変換と勾配を再現する新しい手法である魚眼-GSを紹介する。
我々の手法は他の効率的な3Dレンダリング手法にモジュールとしてシームレスに統合することができる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 07:53:40 GMT)
PSST: A Benchmark for Evaluation-driven Text Public-Speaking Style Transfer [16.1] 公的なテキストを公用語に変換することを目的とした,PSST(Public-Speaking Style Transfer)という新しいタスクを導入する。
言語学的観点からの実世界のデータ分析に基礎を置き、公用語のスタイルを重要なサブスタイルに分解する。
そこで本研究では,その特徴を分析し,スタイリングされたテキストの問題点を特定するための,きめ細かい評価フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 02:49:37 GMT)
Unlocking the Potential of Model Calibration in Federated Learning [15.9] モデルキャリブレーションの概念とFLを統合した汎用フレームワークであるNon-Uniform for Federated Learning (NUCFL)を提案する。
OurFLは、各クライアントのローカルモデルとFLのグローバルモデルの関係に基づいてモデルキャリブレーションを動的に調整することで、この問題に対処する。
これにより、FLは精度を犠牲にすることなく、グローバルモデルのキャリブレーション要求を効果的に調整する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 20:11:11 GMT)
A Percolation Model of Emergence: Analyzing Transformers Trained on a Formal Language [15.9] データ、サイズ、計算量の増加は、ニューラルネットワークによる特定の能力の急激な学習につながる可能性がある。
エマージェンス(emergence)とは、しばしば「エマージェンス(emergence)」と呼ばれる現象である。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 20:10:28 GMT)
Beyond Control: Exploring Novel File System Objects for Data-Only Attacks on Linux Systems [15.9] 我々はLinuxカーネルのファイルサブシステム内で、悪用可能な非制御データを半自動で検出し、評価する。
我々は18の現実世界のCVEを用いて、様々なエクスプロイト戦略を用いてファイルシステムオブジェクトのエクスプロイラビリティを評価する。
我々はカーネルに対してCVEのサブセットを使用して10のエンドツーエンドエクスプロイトを開発する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 22:49:29 GMT)
Learning to Open and Traverse Doors with a Legged Manipulator [15.6] そこで我々は,手足のマニピュレータによるドアの開閉・移動のための学習型制御器を提案する。
教師-学生によるシミュレーション手法を用いて,頑健なタスク行動の学習を行う。
これまでのやり方と違って、弊社のやり方は、プッシュとプルの両方のドアを扱える単一のコントロールポリシーだ。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 18:27:46 GMT)
AdaptiveFusion: Adaptive Multi-Modal Multi-View Fusion for 3D Human Body Reconstruction [15.2] 本稿では,汎用適応型マルチモーダル・マルチビュー融合フレームワークAdaptiveFusionを提案する。
本手法は最先端の核融合法と比較して精度が高い。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 15:06:30 GMT)
Improving Deep Reinforcement Learning by Reducing the Chain Effect of Value and Policy Churn [14.3] ディープニューラルネットワークは、大規模な意思決定問題に対処するために強化学習(RL)強力な関数近似器を提供する。
RLの課題の1つは、出力予測が小さくなり、バッチに含まれない状態に対する各バッチ更新後の制御不能な変更につながることである。
本稿では,既存のDRLアルゴリズムに容易に接続可能なChurn Approximated ReductIoN (CHAIN) と呼ばれる,異なる設定でチェーン効果を低減させる手法を提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 11:08:20 GMT)
Medical Image Segmentation via Single-Source Domain Generalization with Random Amplitude Spectrum Synthesis [13.8] 医用画像のセグメンテーションの分野は、臨床データセットのドメインシフトにより、ドメイン一般化(DG)によって挑戦される。
従来の単一ソースドメインの一般化手法は、ドメインの矛盾を最小限に抑えるためにデータ拡張手法を積み重ねることに頼っている。
医用画像のトレーニングとしてランダム振幅スペクトル合成(RASS)を提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 08:58:04 GMT)
Training-Free Style Consistent Image Synthesis with Condition and Mask Guidance in E-Commerce [13.7] 我々は、UNetと画像条件を統合する際に、注意マップ(自己注意と横断注意)の修正を参照して、QKVレベルの概念を導入する。
我々は、共有KVを用いて、交差注意における類似性を高め、注目マップからマスクガイダンスを生成し、スタイル一貫性画像の生成を巧みに指示する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 07:50:13 GMT)
Collaborative Learning with Shared Linear Representations: Statistical Rates and Optimal Algorithms [13.6] コラボレーション学習により、複数のクライアントがローカルデータ分散間で共有された特徴表現を学習できる。
クライアントが共通の低次元線形表現を共有する際の最適統計率を同定する。
この結果から,システムレベルでのコラボレーションは,独立したクライアント学習に比べて,サンプリングの複雑さを低減させることがわかった。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 21:53:01 GMT)
Revisiting Sentiment Analysis for Software Engineering in the Era of Large Language Models [11.4] 本研究では,ソフトウェア工学のタスクにおいて,小さな言語モデル (sLLM) を微調整したラベル付きデータ不足に対処する際の大規模言語モデル (bLLM) について検討する。
5つの確立されたデータセットを用いて、ゼロショットと少数ショットのシナリオで3つのオープンソースのbLLMを評価する。
実験により,bLLMsは訓練データと不均衡分布に制限されたデータセットに対して最先端の性能を示すことが示された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 06:30:56 GMT)
MuAP: Multi-step Adaptive Prompt Learning for Vision-Language Model with Missing Modality [11.0] モダリティが不完全である場合の学習行動について,本研究は初めて包括的調査を行う。
本稿では,マルチモーダルなプロンプトを生成し,マルチステップなプロンプトチューニングを実現するための,新しい多段階適応型プロンプト学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 03:33:46 GMT)
Transfer Learning for Spatial Autoregressive Models with Application to U.S. Presidential Election Prediction [10.8] 本稿では, tranSAR と呼ばれる SAR モデル内に新しいトランスファー学習フレームワークを提案する。
我々のフレームワークは、類似した情報源データからの情報を活用することにより、予測と予測を強化する。
本手法は, 従来の手法よりも優れており, アメリカ合衆国大統領選挙の結果を予測する上での有効性を実証する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 08:59:57 GMT)
DEEP-IoT: Downlink-Enhanced Efficient-Power Internet of Things [10.7] 本稿では,IoTデバイスの通信方法を再定義する,革新的な通信パラダイムであるDEEP-IoTを提案する。
先駆的なフィードバックチャネルコーディング戦略を通じて、DEEP-IoTは従来の送信機(IoTデバイス)中心の通信モデルに挑戦し、変革する。
従来のTurboとPolarのコードを52.71%まで上回る、IoTセルの運用寿命が大幅に向上したことを示す。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 17:49:33 GMT)
Scalable and Precise Application-Centered Call Graph Construction for Python [10.5] PyCGはPythonプログラムのコールグラフを構築するための最先端のアプローチである。
本稿では,Python プログラム用のアプリケーション中心のコールグラフを構築するためのスケーラブルで正確なアプローチを提案し,プロトタイプツール JARVIS として実装する。
1つの関数を入力として、JARVISは、フローセンシティブなプロセス内分析とプロセス間解析を行う、オンザフライのコールグラフを生成する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 12:38:51 GMT)
Sample- and Oracle-Efficient Reinforcement Learning for MDPs with Linearly-Realizable Value Functions [10.2] 本稿では,線形アクションが特徴写像に一般化される決定(MDP)の効率的なアルゴリズムを提案する。
具体的には、この設定において、最適に近いポリシーを効率的に見つける新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 14:38:05 GMT)
SGSeg: Enabling Text-free Inference in Language-guided Segmentation of Chest X-rays via Self-guidance [10.1] テキストフリー推論(ユニモーダル)を実現しつつ、学習のための言語指導(マルチモーダル)を活用するセルフガイドセグメンテーションフレームワーク(SGSeg)を提案する。
本報告では, 肺, 病理組織ともに重要な位置情報を活用するとともに, 自己指導のための臨床報告を生成するために, 新たな局所化強化レポート生成(LERG)モジュールを導入する。
我々のLERGは、位置認識型擬似ラベル抽出モジュールによって弱制御された、オブジェクト検出器と位置ベースアグリゲータを統合している。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 08:16:00 GMT)
Towards identifying Source credibility on Information Leakage in Digital Gadget Market [9.5] 今後のデバイスの詳細に関する信用的なリークは、各組織に多大な金銭的損害を与える可能性がある。
本稿では,Webブログのリーク記事の見出しとそれに対応する公式プレスリリースの分析を行う。
我々は、手動で注釈付けされた結果に対して82.14%の精度で、進化するスマートフォン名を取得するためにカスタムNERモデルを訓練する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 18:20:33 GMT)
A Multi-scenario Attention-based Generative Model for Personalized Blood Pressure Time Series Forecasting [6.3] 連続血圧モニタリングは、重要なケア設定において、タイムリーな診断と介入に不可欠である。
本研究では,心電図(ECG)と光胸腺図( Photoplethysmogram)の信号を用いたパーソナライズされたBP予測モデルを提案する。
実験は,60名の被験者からBP測定を行った3つのシナリオから収集したデータセットを用いて行った。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 04:24:15 GMT)
Goal-guided Generative Prompt Injection Attack on Large Language Models [6.2] 大規模言語モデル(LLM)は、大規模ユーザ指向自然言語タスクの強力な基盤を提供する。
多数のユーザは、ユーザインターフェースを通じて、逆テキストや命令を容易に注入することができる。
これらの戦略が攻撃の成功率とどのように関係し、モデルセキュリティを効果的に改善するかは不明である。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 07:28:00 GMT)
Leveraging LLMs, Graphs and Object Hierarchies for Task Planning in Large-Scale Environments [6.1] この研究は、LLMに符号化されたコモンセンスの知識を活用して、複雑なシナリオを扱うための計画手法を強化する。
7-DoFマニピュレータを用いた実世界の検証とともに,家庭シミュレーション環境における広範囲な実験を通して,本システムの有効性を実証する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 09:30:26 GMT)
Unfolding Videos Dynamics via Taylor Expansion [5.7] ビデオの自己教師型動的学習戦略について紹介する: インスタンス識別のためのビデオ時間差分法(ViDiDi)
ViDiDiは、フレームシーケンスの時間的デリバティブのさまざまな順序を通して、ビデオの異なる側面を観察する。
ViDiDiは、ビデオとその時間微分を一貫した埋め込みにエンコードする単一のニューラルネットワークを学習する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 16:15:11 GMT)
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models [5.7] 長文のすべてのトークンを最初に埋め込むために、長いコンテキスト埋め込みモデルを活用する「ラッチチャンキング」と呼ばれる新しい手法を導入する。
結果として得られたチャンク埋め込みは、コンテキスト情報を完全にキャプチャし、様々な検索タスクにおいて優れた結果をもたらす。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 03:54:46 GMT)
Towards Generative Class Prompt Learning for Fine-grained Visual Recognition [5.6] ジェネレーティブ・クラス・プロンプト・ラーニングとコントラスト・マルチクラス・プロンプト・ラーニングを紹介する。
Generative Class Prompt Learningは、学習可能なクラスプロンプトを持つ数ショットの例に条件付けすることで、クラス埋め込みにおける視覚言語相乗性を改善する。
CoMPLeはこの基盤の上に構築されており、クラス間の分離を促進する対照的な学習コンポーネントを導入している。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 22:51:50 GMT)
Generalized Learning of Coefficients in Spectral Graph Convolutional Networks [5.6] スペクトルグラフ畳み込みネットワーク(GCN)は、グラフ機械学習アプリケーションで人気を集めている。
G-Arnoldi-GCNは、適切な関数が採用された場合、常に最先端の手法より優れている。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 12:53:44 GMT)
Reformulating Conversational Recommender Systems as Tri-Phase Offline Policy Learning [5.5] Tri-Phase Offline Policy Learning-based Conversational Recommender System (TCRS)
本稿では,Tri-Phase Offline Policy Learning-based Conversational Recommender System (TCRS)を紹介する。
論文参考訳(メタデータ) (Sat, 07 Sep 2024 09:02:29 GMT)
MILE: A Mutation Testing Framework of In-Context Learning Systems [5.4] ICLシステムにおけるテストデータの品質と有効性を特徴付けるための突然変異試験フレームワークを提案する。
まず、ICLの実証に特化しているいくつかの突然変異演算子と、ICLテストセットに対応する突然変異スコアを提案する。
総合的な実験により、ICLテストスイートの信頼性と品質を評価する上で、我々のフレームワークの有効性を示す。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:51:42 GMT)
Beyond Dependencies: The Role of Copy-Based Reuse in Open Source Software Development [5.4] オープンソースソフトウェアでは、依存関係を導入したり、リソース自体をコピーすることで、プロジェクトのリソースは再利用できる。
我々の目標は、将来の研究とツール開発が効率を高め、コピーベースの再利用のリスクを低減することである。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:50:40 GMT)
Urban traffic analysis and forecasting through shared Koopman eigenmodes [5.2] データ量の多い都市における交通流の予測は、限られた歴史的データのために困難である。
データ豊かな都市に共通する周期パターンを同定することで、伝達学習を活用する。
この方法は、交通パターンの一般的な固有モード(アーバンハートビート)を明らかにし、それらをデータ共有都市に転送する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 06:24:50 GMT)
OSS License Identification at Scale: A Comprehensive Dataset Using World of Code [5.0] 我々は、徹底的なアプローチを採用し、それらのファイルパスに'ライセンス'を含むすべてのファイルをスキャンし、堅牢なテキストマッチングにWinnowingアルゴリズムを適用した。
提案手法は,数百万のOSSプロジェクト間で550万以上の異なるライセンスブロブを識別し,一致させ,詳細なP2Lマップを作成する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:34:55 GMT)
Generalists vs. Specialists: Evaluating Large Language Models for Urdu [4.9] 我々は, GPT-4-Turbo と Llama-3-8b-Instruct の汎用事前学習モデルと, 特定のタスクを微調整した特別目的モデルとの比較を行った。
我々は、これらのモデルの性能をウルドゥー語で評価するために、7つの分類と6つの世代タスクに焦点を当てる。
特殊目的モデルは、様々なタスクにおいて汎用モデルより一貫して優れていることが判明した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 15:33:38 GMT)
Causality-Driven Reinforcement Learning for Joint Communication and Sensing [4.2] 我々は,mMIMOベースのJCAS環境に対する因果関係を介入し,発見することができる因果関係認識型RLエージェントを提案する。
我々は、RLに基づくJCASの因果発見を実現するために、状態依存行動次元選択戦略を用いる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 07:15:57 GMT)
VidLPRO: A $\underline{Vid}$eo-$\underline{L}$anguage $\underline{P}$re-training Framework for $\underline{Ro}$botic and Laparoscopic Surgery [4.1] ロボットおよび腹腔鏡下手術に特化して設計された新しいビデオ言語(VL)事前学習フレームワークであるVidLPROを紹介する。
VidLPROは、ビデオテキストコントラスト学習、ビデオテキストマッチング、マスキング言語モデリングの目的を統合し、リッチなVL表現を学習する。
我々のモデルは21.5%の精度と15.7%のF1スコアの改善を示し、新しいベンチマークをフィールドに設定する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 06:33:12 GMT)
Latent-EnSF: A Latent Ensemble Score Filter for High-Dimensional Data Assimilation with Sparse Observation Data [4.0] 本研究では,非線形ベイズフィルタの観測における高次元化と高空間化の課題に対処するため,新しいデータ同化手法であるLatent-EnSFを提案する。
本研究では,浅波伝搬と中距離気象予報の複雑なモデルを用いた2つの難題に対して,Latent-EnSFの高精度,高速収束,高効率性を実証した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:11:20 GMT)
A Comprehensive Survey of Advanced Persistent Threat Attribution: Taxonomy, Methods, Challenges and Open Research Problems [3.4] Advanced Persistent Threat Attributionは、サイバーセキュリティにおける重要な課題である。
人工知能(AI)と機械学習(ML)技術の普及に伴い、研究者たちは、サイバー脅威を責任あるアクターにリンクする自動化ソリューションの開発に注力している。
自動帰属に関する以前の文献では、自動帰属プロセスに役立つ自動化された方法と関連するアーティファクトの体系的なレビューが欠けている。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 12:42:43 GMT)
Contrastive Disentangling: Fine-grained representation learning through multi-level contrastive learning without class priors [3.1] Contrastive Disentangling (CD) は、クラス事前に依存することなく表現を学習するフレームワークである。
我々のフレームワークは、インスタンスレベルと特徴レベルの損失と正規化エントロピー損失を組み合わせたマルチレベルコントラスト学習戦略を採用している。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 16:39:14 GMT)
GP-PCS: One-shot Feature-Preserving Point Cloud Simplification with Gaussian Processes on Riemannian Manifolds [2.9] 本稿では,新しいワンショットポイントクラウド単純化手法を提案する。
表面の復元を一切行わずに、健全な構造的特徴と点雲全体の形状の両方を保っている。
提案手法を複数のベンチマークおよび自己取得点雲上で評価し,既存手法と比較し,下流での登録と表面再構成の応用を実証した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 10:41:35 GMT)
Cross-Data Knowledge Graph Construction for LLM-enabled Educational Question-Answering System: A Case Study at HCMUT [2.8] 大規模言語モデル(LLM)は活発な研究トピックとして現れている。
LLMはイベントの記憶、新しい情報の導入、ドメイン固有の問題や幻覚への対処において課題に直面している。
本稿では,複数のデータソースから知識グラフを自動的に構築する手法を提案する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 10:27:35 GMT)
Frequency ratio of the $^{229\mathrm{m}}$Th nuclear isomeric transition and the $^{87}$Sr atomic clock [2.8] トリウム229核は、最先端真空紫外(VUV)レーザー光源の届く範囲内で、一意に低エネルギーの核転移を示す。
固体CaF$ホスト材料中の229ドルTh原子核時計遷移を励起するために、VUV周波数コムを用いる。
このVUVコムは、核エネルギーレベルと電子エネルギーレベルの周波数リンクを確立し、27ドルSr原子時計と229ドルTh原子時計の周波数比を直接測定することができる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 16:19:05 GMT)
Using Peer-Customers to Scalably Pair Student Teams with Customers for Hands-on Curriculum Final Projects [2.7] Peer-customerは、学生チームが実践コースで顧客とペアリングするためのメカニズムである。
ピア・カストマーの使用は、学生が最終プロジェクトに必要な現実的なニーズで顧客と一緒に働くための実用的でスケーラブルなアクセスを提供する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 01:17:15 GMT)
Training-free ZS-CIR via Weighted Modality Fusion and Similarity [2.7] 合成画像検索(CIR)は、参照画像と修正テキストの組み合わせとしてクエリを定式化する。
本稿では,ZS-CIRのトレーニング不要なアプローチを提案する。
提案手法は単純で実装が容易であり,FashionIQおよびCIRRデータセットを用いた実験によりその有効性が検証された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 21:52:58 GMT)
Quantifying Misalignment Between Agents: Towards a Sociotechnical Understanding of Alignment [2.6] 最近の社会技術的アプローチは、複数の人間とAIエージェント間の複雑なミスアライメントを理解する必要性を強調している。
我々は、人間の競合の計算社会科学モデルをアライメント問題に適用する。
我々のモデルは、潜在的に矛盾する目標を持つ多種多様なエージェントグループにおけるミスアライメントを定量化する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 19:05:15 GMT)
Implementing Streaming algorithm and k-means clusters to RAG [2.5] 本稿では,ストリーミングアルゴリズムとk-meansクラスタリングを組み合わせた新しいアプローチを提案する。
提案手法では,動的にインデックスを更新し,メモリ消費を削減するためにストリーミングアルゴリズムを適用した。
その結果,ストリーミングアルゴリズムとk平均クラスタを用いたRAGは,従来のRAGよりも精度とメモリが優れていた。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 15:02:48 GMT)
Group Testing for Accurate and Efficient Range-Based Near Neighbor Search for Plagiarism Detection [2.4] 本研究は, 近接探索問題に対する適応型群検定フレームワークを提案する。
本研究では,データベース内の各項目を問合せ点の隣人あるいは非隣人として,余剰距離閾値に基づいて効率よくマークする。
本研究では,ソフトマックスに基づく特徴量を用いて,完全探索よりも10倍以上の高速化を実現し,精度を損なわないことを示す。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 03:12:07 GMT)
Quantum error correction of motional dephasing using optical dressing [1.9] 我々は、Rydberg polaritonとして知られる集合量子重ね合わせ状態における新しいプロトコルの有効性を実証する。
ラマンレーザーを用いた光ドレッシングによる我々のプロトコルは、デフォーカスをキャンセルし、コヒーレンス時間を1桁以上向上させることを示す。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 09:15:41 GMT)
PIXHELL Attack: Leaking Sensitive Information from Air-Gap Computers via `Singing Pixels' [1.7] PIXHELLは、新しいタイプの秘密チャンネル攻撃で、スクリーン上のピクセルが生成したノイズによって、ハッカーが情報を漏洩することができる。
悪意のあるコードは、コイルやコンデンサによって発生する音を利用して、画面から発する周波数を制御する。
実験の結果, PIXHELL攻撃では, LCD画面から変調した音により, 2m離れた距離から, 音声を受信したコンピュータからテキストとバイナリデータを抽出できることがわかった。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 23:09:56 GMT)
Enhancing Sample Efficiency and Exploration in Reinforcement Learning through the Integration of Diffusion Models and Proximal Policy Optimization [1.6] オフラインデータセットのための高品質な仮想トラジェクトリを生成するために拡散モデルを導入し,PPOアルゴリズムを強化するフレームワークを提案する。
RLにおける拡散モデルの可能性、特にオフラインデータセットについて検討し、オンラインRLをオフライン環境に拡張し、拡散モデルによるPPOの性能改善を実験的に検証する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 10:08:55 GMT)
HMT-UNet: A hybird Mamba-Transformer Vision UNet for Medical Image Segmentation [1.6] 我々はHybird Transformer Vision Mamba UNet(HTM-UNet)という医療画像分割のためのU字型アーキテクチャーモデルを提案する。
我々はISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir、CVC-ColonDB、ETIS-Larib PolypDBパブリックデータセット、ZD-LCI-GIMプライベートデータセットに関する包括的な実験を行う。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 02:30:06 GMT)
HULLMI: Human vs LLM identification with explainability [1.4] 従来のMLモデルは、人間とAIのテキスト検出において、現代のNLP検出と同様に機能することを示す包括的な分析を提供する。
説明可能なAI技術であるLIMEを用いて、各モデルの予測に最も寄与する入力の一部を明らかにする。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 12:27:25 GMT)
Dimensionality Reduction and Nearest Neighbors for Improving Out-of-Distribution Detection in Medical Image Segmentation [1.3] この研究は、肝臓を分断する4つのSwin UNETRとnnU-netモデルのボトルネック特徴にマハラノビス距離(MD)ポストホックを適用した。
モデルが失敗した画像は、高性能で最小の計算負荷で検出された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 21:46:43 GMT)
DiVA-DocRE: A Discriminative and Voice-Aware Paradigm for Document-Level Relation Extraction [0.3] 識別・音声認識パラダイム DiVA を導入する。
私たちの革新はDocREを差別的なタスクに変換することです。
Re-DocREDおよびDocREDデータセットの実験では、DocRTEタスクの最先端の結果が示されている。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 18:47:38 GMT)
GRVFL-2V: Graph Random Vector Functional Link Based on Two-View Learning [0.3] 二視点学習(GRVFL-2V)モデルに基づく新しいグラフランダムベクトル汎関数リンクを提案する。
提案モデルは,マルチビュー学習(MVL)の概念とグラフ埋め込み(GE)フレームワークを取り入れ,複数の視点で学習する。
27のUCIデータセットやKEELデータセットを含む各種データセット上で提案したGRVFL-2Vモデルの評価は,ベースラインモデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 07:18:08 GMT)
Fairness and Bias in Multimodal AI: A Survey [0.2] 人工知能(AI)システムにおける公平性とバイアスに対処することの重要性は、過度に強調できない。
我々は,LMM(Large Multimodal Model)における,LMM(Large Language Model)とLLM(Large Language Model)の比較的最小の妥当性と偏見について,ギャップを埋める。
我々は、両方のタイプのAIに関連するデータセットとモデルの50例と、それらに影響を与えるバイアスの課題を提示します。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 09:25:09 GMT)
Know, Grow, and Protect Net Worth: Using ML for Asset Protection by Preventing Overdraft Fees [0.1] アメリカ人は年間150億ドルの不要なオーバードラフト手数料を支払う。
ML駆動のオーバードラフト早期警告システムは、Mintアプリで銀行やトランザクションデータを使用して、顧客のオーバードラフトのリスクを評価する。
リスクの高い顧客にはアラートが送られ、料金を回避するためのステップを踏むことができる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 20:38:32 GMT)
Enhancing Deep Learning with Optimized Gradient Descent: Bridging Numerical Methods and Neural Network Training [0.0] 本稿では,最適化理論とディープラーニングの関係について考察する。
ニューラルネットワークの基盤となる変種を強調して、降下アルゴリズムの強化を導入する。
多様なディープラーニングタスクに関する実験は、改良されたアルゴリズムの有効性を裏付けるものである。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 04:37:20 GMT)
forester: A Tree-Based AutoML Tool in R [0.0] ForesterはオープンソースのAutoMLパッケージで、Rで実装され、高品質なツリーベースのモデルをトレーニングする。
バイナリとマルチクラスの分類、回帰、部分生存分析タスクを完全にサポートする。
データ品質に関する問題を検出し、前処理パイプラインを準備し、ツリーベースのモデルのトレーニングとチューニングを行い、結果を評価し、さらなる分析のためにレポートを作成することができる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 10:39:10 GMT)
The Missing Curve Detectors of InceptionV1: Applying Sparse Autoencoders to InceptionV1 Early Vision [0.0] スパースオートエンコーダ(SAE)に関する最近の研究は、ニューラルネットワークから解釈可能な特徴を抽出する上で有望であることを示している。
本稿では、よく研究された畳み込みニューラルネットワークであるInceptionV1の初期の視覚層にSAEを適用する。
以上の結果から,SAEは個々のニューロンから明らかでない新しい解釈可能な特徴を発見できることが示された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 22:53:31 GMT)
Swin Transformer for Robust Differentiation of Real and Synthetic Images: Intra- and Inter-Dataset Analysis [0.0] 本研究では,自然画像と合成画像の正確な識別のためのSwin Transformerモデルを提案する。
モデルの性能は、3つの異なるデータセットにわたるデータセット内およびデータセット間テストによって評価された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 06:43:17 GMT)
Site-selective cavity readout and classical error correction of a 5-bit atomic register [0.0] サイト選択型ハイパーファインステートキャビティ・リードアウトを10サイトアレイで実現した。
論理的誤りの指数的に抑制し,論理的記憶を1ビットのアイドリング寿命を超えて5倍に拡張することを示した。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 01:18:02 GMT)
Single-snapshot machine learning for turbulence super resolution [0.0] 非線形機械学習技術は、乱流渦の流れの1つのスナップショットから、物理的洞察を抽出することができる。
単一のスナップショットからサンプリングされたフロータイルでトレーニングされた機械学習モデルは、レイノルズ数の範囲で渦構造を再構築することができる。
本研究は, モデル設計やデータ収集における事前知識の埋め込みが, 乱流解析の分野において重要であることを示唆する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 22:13:26 GMT)
Scaling of contraction costs for entanglement renormalization algorithms including tensor Trotterization and variational Monte Carlo [0.0] テンソルトロッタライゼーションやモンテカルロサンプリングが量子インスパイアされた古典的MERAアルゴリズムに繋がるかどうかを考察する。
アルゴリズム位相図は、エネルギー精度のスケーリングと結合次元のトロッターステップの数に依存する最良のMERA法を示す。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 19:10:41 GMT)
SPIRIT: Low Power Seizure Prediction using Unsupervised Online-Learning and Zoom Analog Frontends [0.0] この研究はSPIRIT:Integrated RetrainingとIn situ accuracy Tuningを備えた8段階の予測器を提示する。
SPIRITは完全なシステムオンチップ(SoC)であり、教師なしのオンライン学習予測分類器を14.4 uW、0.057 mm2、90.5 dBのダイナミックレンジ、Zoom Analog Frontendsと統合している。
オンライン学習アルゴリズムにより、予測精度は最大15%向上し、予測時間は最大7倍向上する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 14:30:14 GMT)
Quantum machines using \mathrm{Cu}_{3}-like compounds modeled by Heisenberg antiferromagnetic in a triangular ring [0.0] 垂直磁場(sim5T)下での低温(1K前後)におけるMCEの意義
我々は、MCEが外部磁場の変化時に熱エンジンや冷蔵庫として動作するCarnotマシンにどのように影響するかを分析する。
以上の結果から,MCEの強化によりこれらのマシンの動作領域が拡大し,Otto と Stirling が主に冷凍機やアクセラレータとして機能することが示唆された。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 12:51:51 GMT)
Pixels and Predictions: Potential of GPT-4V in Meteorological Imagery Analysis and Forecast Communication [0.0] OpenAIのGPT-4V大規模言語モデルのような生成AIは、急速に主流の話題になってきた。
本研究は,GPT-4Vの気象図を適切に解釈し,気象リスクを適切に伝達する能力を評価する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 10:19:15 GMT)
Phrase-Level Adversarial Training for Mitigating Bias in Neural Network-based Automatic Essay Scoring [0.0] 本稿では,AESモデルのバイアスとロバスト性に対処する逆エッセイセットを生成するための,モデルに依存しないフレーズレベル手法を提案する。
実験の結果, 提案手法は, 逆例やシナリオの存在下で, AESモデルの性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 11:22:35 GMT)
On estimates of trace-norm distance between quantum Gaussian states [0.0] 平均ベクトルと共分散行列の観点から、2つの量子ガウス状態間のトレースノーム距離の推定を行った。
本論文では, 状態重なり量と呼ばれる忠実度に類似した量に基づいて, 異なる推定値を得る。
これらの導出は、ArXiv:2405.01431から有用な不等式を置き換えることを目的としていない。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 09:48:32 GMT)
OmniJet-$α$: The first cross-task foundation model for particle physics [0.0] ファンデーションモデルはマルチデータセットとマルチタスクの機械学習手法で、一度トレーニングされたら、様々なダウンストリームアプリケーションのために微調整できる。
我々は,この課題について,いくつかの点で大きな進展を報告している。
我々は、教師なし問題(ジェット世代)と教師なしタスク(ジェットタグ付け)の移行学習を、新しいOmniJet-$alpha$モデルで実証する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 11:17:18 GMT)
Noise-Based Authentication: Is It Secure? [0.0] 我々は、既存の生体認証システムを用いて、個々の人間に属する独特のノイズ指紋を実証する。
次に,各ユーザが生成するユニークなサーマルノイズ振幅を用いるという概念を提案し,無条件でセキュアな認証の堅牢性に関するオープンな質問を探索する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 23:24:53 GMT)
Naeural AI OS -- Decentralized ubiquitous computing MLOps execution engine [0.0] エンド・ツー・エンドのAI協調型アプリケーションパイプラインのローコード開発と展開に革新的なアプローチを提案する。
我々は、トークン化経済に基づいて、完全に分散したグローバルな協力コミュニティにおけるインフラ割り当て、コスト、および安全な雇用分配について論じる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 09:17:33 GMT)
Improving the Finite Sample Performance of Double/Debiased Machine Learning with Propensity Score Calibration [0.0] ダブル/デバイアスド機械学習(DML)は、ニュアンス関数の予測に依存するダブルロススコア関数を使用する。
ダブルロバストスコア関数に依存する推定器は、確率スコア予測における誤差に非常に敏感である。
本稿では,DMLフレームワーク内での確率校正手法について検討する。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 17:44:01 GMT)
Action is the primary key: a categorical framework for episode description and logical reasoning [0.0] 本研究では,エピソードを記述・認識し,論理的推論を行うための計算フレームワークを提案する。
本研究の目的は,データベース駆動型人工知能の開発である。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 11:09:47 GMT)
Achieving Peak Performance for Large Language Models: A Systematic Review [0.0] 大規模言語モデル(LLM)は自然言語処理(NLP)において顕著な成功を収めた
モデルが1兆のパラメータ範囲に成長するにつれて、計算とメモリのコストは大幅に増加する。
これにより、多くの研究者がこれらのモデルのトレーニングや適用に必要なリソースにアクセスするのが難しくなる。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 13:57:41 GMT)
A+AI: Threats to Society, Remedies, and Governance [0.0] この文書は、人工知能(AI)が社会にもたらす脅威、特に短期的な脅威に焦点を当てている。
脅威を緩和する可能性のある対策を示す表も用意されている。
同紙は、政府ができるだけ早く行うべき特定のアクションをリストアップしている。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 01:25:30 GMT)
A Metric-based Principal Curve Approach for Learning One-dimensional Manifold [0.0] 空間データの1次元多様体を学習する新しい計量ベース主曲線(MPC)法を提案する。
MNISTデータセットを用いた実応用により,本手法は形状の観点から一次元多様体をよく学習できることを示す。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 18:32:06 GMT)
A $Δ$-evaluation function for column permutation problems [0.0] 新しい$Delta$-evaluation法は、連続する性質を持つスパース二元行列上で定義された列置換問題を解くために導入された。
この問題はグラフ理論と工業生産の文脈における様々な$mathcalNP$-hard問題をモデル化する。
提案手法は一般に競争力があり,特に大規模かつ高密度なインスタンスに有用である。
論文参考訳(メタデータ) (Sat, 7 Sep 2024 22:50:25 GMT)