Large Language Models Must Be Taught to Know What They Don't Know [97.9] 正解と誤解の小さなデータセットを微調整すると、高い一般化と計算オーバーヘッドの少ない不確実性推定が得られることを示す。
また,確実な不確実性推定を可能にする機構についても検討し,多くのモデルを汎用的不確実性推定器として利用することができることを示した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:28:05 GMT)
TiP4GEN: Text to Immersive Panorama 4D Scene Generation [82.8] TiP4GENはテキストから動的パノラマシーン生成フレームワークである。
微粒なコンテンツ制御を可能にし、動きに富んだ幾何学的なパノラマ4Dシーンを合成する。
TiP4GENはパノラマビデオ生成と動的シーン再構成を統合し、360度没入型仮想環境を作成する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:02:24 GMT)
ReaLM: Reflection-Enhanced Autonomous Reasoning with Small Language Models [76.3] 小型言語モデル (SLM) は大規模言語モデル (LLM) に代わる費用対効果がある。
彼らはしばしば、限られた能力と間違いや一貫性のない答えを生み出す傾向があるため、複雑な推論に苦しむ。
本稿では、垂直領域における堅牢かつ自己充足的推論のための強化学習フレームワークであるReaLMを紹介する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:50:23 GMT)
Direct Preference Optimization for Primitive-Enabled Hierarchical Reinforcement Learning [71.8] DIPPERは階層的な政策学習を二段階最適化問題として定式化する新しいHRLフレームワークである。
DIPPERは、スパース報酬シナリオにおいて、最先端のベースラインよりも最大40%改善されていることを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:15:13 GMT)
Learning Adaptive Parallel Reasoning with Language Models [70.2] 本稿では,適応並列推論(Adaptive Parallel Reasoning, APR)を提案する。
APRは、spawn()とjoin()操作を使用して適応的なマルチスレッド推論を可能にすることで、既存の推論メソッドを一般化する。
鍵となる革新は、親と子の両方の推論スレッドを最適化して、事前に定義された推論構造を必要とせずにタスクの成功率を高める、エンドツーエンドの強化学習戦略である。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:23:42 GMT)
DermINO: Hybrid Pretraining for a Versatile Dermatology Foundation Model [69.2] DermNIOは皮膚科学の多目的基盤モデルである。
自己教師型学習パラダイムを増強する、新しいハイブリッド事前学習フレームワークが組み込まれている。
さまざまなタスクにおいて、最先端のモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 00:41:39 GMT)
High-Dimensional Interlingual Representations of Large Language Models [65.8] 大規模言語モデル(LLM)は、多言語データセットに基づいて訓練され、言語間構造の形成を示唆する。
資源レベル, 類型, 地理的地域によって異なる31の多様な言語を探索する。
多言語 LLM は非一貫性な言語間アライメントを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:21:40 GMT)
Design and Validation of a Responsible Artificial Intelligence-based System for the Referral of Diabetic Retinopathy Patients [65.6] 糖尿病網膜症の早期発見は、視力喪失のリスクを最大95%減少させる可能性がある。
我々は、AIライフサイクル全体にわたる倫理的原則を取り入れた、DRスクリーニングのための責任あるAIシステムであるRAIS-DRを開発した。
当科におけるRAIS-DRをFDA認可のEyeArtシステムと比較した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 21:54:11 GMT)
TSLA: A Task-Specific Learning Adaptation for Semantic Segmentation on Autonomous Vehicles Platform [58.6] NVIDIAtextsuperscripttextregistered DRIVE PX 2.0のようなターゲットプラットフォームにデプロイする場合、計算コストを考慮することが重要です。
我々の目標は、自律運転ハードウェアの計算能力と特定のシナリオに応じてセマンティックセグメンテーションネットワークをカスタマイズすることである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:09:13 GMT)
LMAD: Integrated End-to-End Vision-Language Model for Explainable Autonomous Driving [58.5] 視覚言語モデル(VLM)はシーン理解において有望な能力を示している。
本稿では,自律運転に適した視覚言語フレームワークLMADを提案する。
本フレームワークは,VLMに包括的シーン理解とタスク特化構造を組み込むことにより,最新のエンド・ツー・エンド駆動パラダイムをエミュレートする。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:42:54 GMT)
MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph [57.5] 我々は、時間的に進化する医療知識グラフを構築するためのフレームワークであるMedKGentを紹介する。
生医学的知識の出現を, 微粒な日々の時系列でシミュレートする。
結果として得られるKGは156,275個のエンティティと2,971,384個のリレーショナルトリプルを含む。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:14:03 GMT)
Fast, Slow, and Tool-augmented Thinking for LLMs: A Review [57.2] 大規模言語モデル (LLM) は、様々な領域における推論において顕著な進歩を示している。
実世界のタスクにおける効果的な推論は、問題の要求に推論戦略を適用する必要がある。
2つの知識境界に沿ったLSM推論戦略の新しい分類法を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:20:32 GMT)
Cost-Aware Contrastive Routing for LLMs [56.9] 我々は、プロンプトとモデルの両方を共有埋め込み空間にマッピングする軽量フレームワークであるコストスペクトルコントラストルーティング(CSCR)を紹介します。
CSCRはベースラインを一貫して上回り、精度とコストのトレードオフを最大25%改善した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:16:44 GMT)
Rethinking Safety in LLM Fine-tuning: An Optimization Perspective [56.3] 我々は、本質的にトレードオフではなく、最適化の貧弱な選択が、しばしば安全上の問題を引き起こすことを示し、敵のプロンプトに対する有害な応答として測定する。
安全性能を保ったパラメータ空間における簡易指数移動平均(EMA)運動量法を提案する。
複数のデータセットにまたがるLlamaファミリーに関する実験は、安全性の問題が特別な介入なしに回避できることを実証している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:46:36 GMT)
Loss-Complexity Landscape and Model Structure Functions [56.0] 我々はコルモゴロフ構造関数 $h_x(alpha)$ を双対化するためのフレームワークを開発する。
情報理論構造と統計力学の数学的類似性を確立する。
構造関数と自由エネルギーの間のルジャンドル・フェンシェル双対性を明確に証明する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:29:25 GMT)
ForensicsSAM: Toward Robust and Unified Image Forgery Detection and Localization Resisting to Adversarial Attack [56.0] 高い転送性を持つ逆画像は上流モデルでのみ作成可能であることを示す。
本稿では,IFDLフレームワークを組み込んだForensicsSAMを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:03:11 GMT)
Continual Learning on CLIP via Incremental Prompt Tuning with Intrinsic Textual Anchors [50.7] 連続学習(CL)は、破滅的な忘れ込みを避けながら、ディープネットワークが新たな知識を得ることを可能にする。
インクリメンタルなプロンプトチューニングに基づくCLIPのための簡潔なCLアプローチを提案する。
我々の双方向監視戦略は、忘れを減らしながら、新しい知識をより効果的に学習することを可能にする。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:28:00 GMT)
Dimensionality reduction for homological stability and global structure preservation [49.8] 本稿では,UMAP や tSNE といった従来の手法が直面する課題に対処するために,新しい次元削減ツールキットを提案する。
JAXフレームワーク上に構築されたDiReは、現代的なハードウェアアクセラレーションを活用し、複雑なデータ構造を視覚化するための効率的でスケーラブルで解釈可能なソリューションを提供する。
このツールキットは、最先端の UMAP や tSNE の実装と比較して、データ内のローカル構造とグローバル構造の両方を保存することにかなり有望である。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:20:22 GMT)
Trust Region Constrained Measure Transport in Path Space for Stochastic Optimal Control and Inference [49.1] 信頼領域に基づく戦略は,対象尺度の先行から幾何的アニーリングと解釈できることを示す。
我々は,新しい手法が性能を大幅に向上させることができることを,複数の最適制御応用で実証した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 22:10:35 GMT)
ChamaleoNet: Programmable Passive Probe for Enhanced Visibility on Erroneous Traffic [48.9] ChamaleoNetは、任意のプロダクションネットワークを透過的なモニターに変換し、管理者がホストに指示された不正なトラフィックを収集できるようにする。
ChamaleoNetは、十分に整ったトラフィックを無視し、誤ったパケットのみを収集するようにプログラムされている。
簡単な分析では、内部および感染したホストを明らかにし、一時的な障害を特定し、脆弱なサービスを探している攻撃者が生成した外部放射の可視性を高める。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:54:41 GMT)
NoProp: Training Neural Networks without Full Back-propagation or Full Forward-propagation [48.0] NoProp という新しい学習手法を導入し,ネットワークの前方および後方の伝播に依存しない。
NoPropは拡散とフローマッチングの手法から着想を得ている。
MNIST, CIFAR-10, CIFAR-100画像分類ベンチマークにおいて, 本手法の有効性を示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:24:56 GMT)
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation [47.1] 本稿では,現実的な顔のインタラクションをアニメーションするための新しい動作パラダイムを提案する。
本手法は, 解剖学的・時間的接触力学と生体力学的に妥当な変形効果を同時に学習する。
結果は、InterAnimateが非常にリアルなアニメーションを生成し、新しいベンチマークを設定していることを示している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:46:26 GMT)
Seldonian Reinforcement Learning for Ad Hoc Teamwork [47.1] ほとんどのオフラインRLアルゴリズムは最適なポリシーを返すが、望ましい振る舞いに関する統計的保証は提供しない。
これにより、安全クリティカルなアプリケーションに信頼性の問題が発生する可能性がある。
セルドン最適化にインスパイアされた新しいオフラインRL手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:22:20 GMT)
Optimizing Language Models for Inference Time Objectives using Reinforcement Learning [46.5] 推定時間性能の最適化がモデル全体の有効性をいかに改善するかを示す。
一般的な推論時間の目的を$k$サンプルで検討し、pass@$k$と多数決を2つの主要なアプリケーションとして検討する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 21:21:08 GMT)
SNNSIR: A Simple Spiking Neural Network for Stereo Image Restoration [46.3] スパイキングニューラルネットワーク(SNN)は高い計算効率と低エネルギー消費を提供する。
ステレオ画像復元のための単純なスパイキングニューラルネットワークであるSNNSIRを提案する。
本モデルは,計算オーバーヘッドを著しく低減しつつ,競争力のある復元性能を実現する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:38:25 GMT)
LoraxBench: A Multitask, Multilingual Benchmark Suite for 20 Indonesian Languages [45.6] インドネシアの低リソース言語に焦点を当てたベンチマークであるLoraxBenchを紹介します。
我々のデータセットは、20言語をカバーし、3つの言語に2つの形式レジスタを追加しています。
本稿では,レジスタの変更がモデル性能に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:07:57 GMT)
Attention Pooling Enhances NCA-based Classification of Microscopy Images [45.6] 我々は、特徴抽出を強化し、分類精度を向上させるために、ニューラルセルオートマタとアテンションプーリングを統合した。
8種類の顕微鏡画像データセットを用いて本手法の評価を行い,提案手法が既存のNAA法より有意に優れていることを示す。
本結果は,NAAモデルが説明可能な画像分類の代替となる可能性を強調した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:46:53 GMT)
Hard Negative Contrastive Learning for Fine-Grained Geometric Understanding in Large Multimodal Models [45.3] 本稿では,視覚エンコーダのための新しいハード・ネガティブ・コントラスト学習フレームワークを提案する。
ハードネガティブ学習法を用いてCLIPを訓練し、幾何学的問題解決のためにLMMを訓練する。
私たちのトレーニングモデルであるMMGeoLMは、3つの幾何学的推論ベンチマークで他のオープンソースモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:31:28 GMT)
StepTool: Enhancing Multi-Step Tool Usage in LLMs via Step-Grained Reinforcement Learning [45.0] 大きな言語モデル(LLM)は、複雑なタスクを解決するために外部ツールを効果的に活用するのに苦労する。
動的意思決定プロセスとしてモデリングツール学習を提案する。
StepToolは,段階的な強化学習フレームワークである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:06:35 GMT)
Is Smaller Always Faster? Tradeoffs in Compressing Self-Supervised Speech Transformers [43.1] 本研究では, 重み付け, 頭部刈り込み, 低ランク近似, 自己教師型音声変換器における知識蒸留の4つの共通圧縮法について検討した。
結果は,それぞれの方法に異なる利点があることを示唆している。
さらに,最近の圧縮技術について,DistilHuBERT,FitHuBERT,LightHuBERT,ARMHuBERT,STaRHuBERTを比較した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:06:06 GMT)
A Question Answering Dataset for Temporal-Sensitive Retrieval-Augmented Generation [40.0] ChronoQAは中国の質問応答のための大規模なベンチマークデータセットである。
絶対、集約、および相対時間型を明示的および暗黙的な時間表現でカバーする5,176の高品質な質問を含んでいる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:12:59 GMT)
Structuring the Unstructured: A Systematic Review of Text-to-Structure Generation for Agentic AI with a Universal Evaluation Framework [39.8] 本稿では,テキスト・ツー・ストラクチャの手法と課題について考察する。
我々は、構造化された出力に対する普遍的な評価フレームワークを導入し、次世代AIシステムの基盤基盤としてテキスト・ツー・ストラクチャを確立する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:41:40 GMT)
Generalizable LLM Learning of Graph Synthetic Data with Post-training Alignment [38.5] 本稿では,グラフの一般化可能な学習を,学習後の合成データとの整合性で解き放つことを提案する。
我々はGRPOやDPOといったポストトレーニング後のアライメントアルゴリズムを採用し、合成グラフデータに基づいて、既製のLLMとLLMの両方を微調整する。
大規模な実験により、我々のトレーニング後のアライメントレシピは、5つのデータセットに対して統計的に有意な改善をもたらすことが示された。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:17:48 GMT)
Results of the NeurIPS 2023 Neural MMO Competition on Multi-task Reinforcement Learning [37.7] NeurIPS 2023 Neural MMOコンペティションには200人以上の参加者と応募者が集まった。
上位のソリューションは、単一の4090 GPUで8時間トレーニングすることで、ベースラインよりも4倍高いスコアを達成しました。
我々はNeural MMOとMITライセンス下での競合に関するすべてをオープンソースにしています。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:14:25 GMT)
Neural Cellular Automata for Weakly Supervised Segmentation of White Blood Cells [37.6] ニューラルセルオートマトン(NCA)を用いた弱教師付きセグメンテーションのための新しいアプローチを提案する。
本手法を3つの白血球顕微鏡データセット上で評価し,NAA-WSSが既存の弱教師付きアプローチよりも有意に優れていることを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:40:16 GMT)
Propagation of Chaos for Mean-Field Langevin Dynamics and its Application to Model Ensemble [36.2] 平均場ランゲヴィンダイナミクス (Mean-field Langevin dynamics, MFLD) は、2層ニューラルネットワークにおける雑音勾配勾配の平均場限界を導出した最適化手法である。
最近の研究は、有限粒子による近似誤差が時間的に均一であり、粒子数が増加するにつれて減少することを示している。
本稿では, 粒子近似項から正則化係数への指数的依存を除去する改良されたMFLDのPoC結果を確立する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 01:11:57 GMT)
ETVA: Evaluation of Text-to-Video Alignment via Fine-grained Question Generation and Answering [35.6] 細かな質問生成と回答によるテキスト・ビデオ・アライメントの新たな評価手法であるETVAを提案する。
ETVA はSpearman の相関係数 58.47 を達成し,既存の31.0 の指標よりも人間の判断との相関性が高いことを示した。
また,テキストとビデオのアライメント評価に特化して設計されたベンチマークを構築し,10のカテゴリにまたがる2kの多様なプロンプトと12kのアトミックな質問を特徴付ける。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:23:19 GMT)
Linear Bandits with Partially Observable Features [35.1] 本稿では,部分的に観測可能な特徴を考慮に入れた線形帯域問題について検討する。
本稿では,新たな理論的枠組みとサブ線形後悔保証付きアルゴリズムを提案する。
我々のアルゴリズムでは、観測されていない特徴空間に関する事前の知識は必要とせず、より多くの機能が隠されるにつれて拡張される可能性がある。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:45:03 GMT)
Spectral tuning and nanoscale localization of single color centers in silicon via controllable strain [33.7] 大規模な統合では、各エミッタの光遷移を正確に制御し、量子ネットワークのために区別できない光子を生成する必要がある。
ここでは、懸濁シリコン導波路とマイクロエレクトロメカニカル(MEMS)カンチレバーを組み合わせた、ファブリファブリケートフォトニック集積回路(PIC)を実証する。
カンチレバーと基板の間に最大35Vを印加すると、100 pmを超えるゼロフォノン線の可逆波長シフトが生じる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 22:53:36 GMT)
Wisdom of the Crowd: Reinforcement Learning from Coevolutionary Collective Feedback [33.6] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を大幅に向上させたが、高価な人ラベルデータや複雑な報酬モデルに依存しているためスケーラビリティが著しく制限されている。
進化的集団フィードバック(RLCCF)による強化学習(Reinforcement Learning)を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:57:34 GMT)
LLMCARE: Alzheimer's Detection via Transformer Models Enhanced by LLM-Generated Synthetic Data [33.0] アルツハイマー病と関連する認知症は、米国の約500万人の高齢者に影響を及ぼす。
音声に基づく自然言語処理(NLP)は、早期認知低下を検出するための有望でスケーラブルなアプローチを提供する。
本研究は, トランスフォーマーの埋め込みと手作り言語的特徴を融合させるスクリーニングパイプラインを開発した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:27:13 GMT)
Understanding LLM-Centric Challenges for Deep Learning Frameworks: An Empirical Analysis [32.1] 大規模言語モデル(LLM)は、様々な現実世界のアプリケーションにおいて大きな進歩をもたらした。
ディープラーニング(DL)フレームワークは、効率的なモデル構築、分散実行、最適化されたデプロイメントを可能にすることによって、この基盤を提供する。
DLフレームワークのユーザビリティの低下、機能制限、微妙なバグにより、開発効率が損なわれ、深刻な障害やリソースの浪費を引き起こす可能性がある。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:22:50 GMT)
AUTOVR: Automated UI Exploration for Detecting Sensitive Data Flow Exposures in Virtual Reality Apps [31.7] Unity Engine上に構築されたVRアプリにおいて,動的UIとユーザイベントインタラクションのための自動フレームワークであるAUTOVRを紹介する。
従来のAndroidやGUIテスタとは異なり、AUTOVRはアプリの内部バイナリを分析して、隠れたイベントを明らかにし、生成的なイベント依存関係を解決する。
私たちの経験的評価は、AUTOVRの優れたパフォーマンスを示し、より機密性の高いデータ露出のオーダーを引き起こし、VRアプリのプライバシを大幅に向上させます。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 00:22:58 GMT)
CarelessWhisper: Turning Whisper into a Causal Streaming Model [31.4] 本稿では,エンコーダ・デコーダ変換器を低遅延ストリーミングモデルに変換することが簡単でない理由を説明する。
提案手法は,既存の(非因果的)エンコーダを,エンコーダとデコーダの両方を微調整することによって因果的エンコーダに修正する。
低レイテンシチャンクサイズ(300msec未満)の実験では、我々の微調整されたモデルが既存の非微調整のストリーミングアプローチより優れていることが示されている。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:32:40 GMT)
CryptPEFT: Efficient and Private Neural Network Inference via Parameter-Efficient Fine-Tuning [30.9] CryptPEFTはワンウェイ通信(OWC)アーキテクチャであり、アダプタのみに暗号化されている。
我々は、広く使われている画像分類データセット間でビジョントランスフォーマーのバックボーンを用いてCryptPEFTを評価する。
この結果、CryptPEFTは既存のベースラインを大幅に上回り、シミュレーションワイドエリアネットワーク(WAN)とローカルエリアネットワーク(LAN)設定で20.62タイム(20.62ドル)から291.48タイム(291.48ドル)までのスピードアップを実現した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:19:27 GMT)
DHG-Bench: A Comprehensive Benchmark on Deep Hypergraph Learning [30.4] DHG-Benchは、ディープハイパーグラフ学習(DHGL)のための最初の総合的なベンチマークである。
DHG-Benchは、ノード、リレーショナルエッジ、グラフレベルのタスクにまたがる20の多様なデータセットと、16の最先端HNNアルゴリズムを統合している。
本ベンチマークでは, 有効性, 効率性, 頑健性, 公平性の4次元でHNNの特性を系統的に検討する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:19:47 GMT)
CoRank: LLM-Based Compact Reranking with Document Features for Scientific Retrieval [30.3] 第一段階の検索はしばしば科学的領域において最適でないため、関連する文書は下位にランクされる。
我々は、科学検索のためのトレーニング不要でモデルに依存しないフレームワークであるCoRankを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 00:03:54 GMT)
A Survey of LLM-based Deep Search Agents: Paradigm, Optimization, Evaluation, and Challenges [30.1] 大規模言語モデル (LLM) はウェブ検索に革命をもたらした。
これらのエージェントは、ユーザの意図や環境状況を理解することができる。
本調査は,検索エージェントの系統的分析を初めて行った。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 13:52:26 GMT)
S5: Scalable Semi-Supervised Semantic Segmentation in Remote Sensing [28.2] 半教師付きセマンティックセグメンテーション(S4)は、ラベルのないデータを活用することで高度なリモートセンシング(RS)分析を行う。
既存のS4研究は、しばしば小規模のデータセットとモデルに依存し、実用性を制限する。
我々は、RSにおける半教師付きセマンティックセグメンテーションのための最初のスケーラブルなフレームワークであるS5を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:49:35 GMT)
SEA-BED: Southeast Asia Embedding Benchmark [27.3] 約7億人の話者を抱える東南アジア地域では、地域固有の埋め込みベンチマークが欠落している。
SEA-BEDは9つのタスクと10言語にまたがる169のデータセットを備えた最初の大規模埋め込みベンチマークである。
6つの研究にまたがる17の埋め込みモデルの評価,課題および言語課題の分析,ベンチマーク間比較,翻訳トレードオフについて検討した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:10:40 GMT)
Adaptive Exploration for Multi-Reward Multi-Policy Evaluation [26.0] オンラインマルチリワードマルチ政治ディスカウント設定における政策評価問題
我々は、$epsilon$-accurate 推定の観点を採用して、有限あるいは凸な報酬の集合に対して$epsilon$accurate 推定を達成する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:22:43 GMT)
MedSpaformer: a Transferable Transformer with Multi-granularity Token Sparsification for Medical Time Series Classification [25.5] MedTS分類に適したトランスフォーマーベースのフレームワークであるMedSpaformerを紹介する。
グローバルなコンテキストモデリングとトークンスペーシングを可能にする、スパーストークンベースのデュアルアテンション機構が組み込まれている。
我々のモデルは、教師あり学習下で7つの医療データセットで13のベースラインを上回ります。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:53:44 GMT)
RadarQA: Multi-modal Quality Analysis of Weather Radar Forecasts [25.4] MLLMに基づく天気予報分析手法であるRadarQAを導入する。
RadarQAは、すべての評価設定において、既存の一般的なMLLMよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:50:07 GMT)
You Don't Know Until You Click:Automated GUI Testing for Production-Ready Software Evaluation [25.0] RealDevWorldは、大規模言語モデル(LLM)とソフトウェア開発におけるコードエージェントの評価フレームワークである。
主なコンポーネントは、194のオープンエンドソフトウェアエンジニアリングタスクのコレクションであるRealDevBenchと、新しいエージェント・アズ・ア・ジャッジ評価システムであるAppEvalPilotだ。
実証的な結果は、RealDevWorldが効果的で、自動で、そして、人間に沿った評価を提供することを示している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:31:11 GMT)
Semantic Discrepancy-aware Detector for Image Forgery Identification [24.0] 偽造概念空間と意味概念空間のミスアライメントは、モデルの偽造検出性能を妨げる。
本稿では,再現学習を利用して2つの空間をきめ細かな視覚レベルで整列させるセマンティック離散性認識検出器(SDD)を提案する。
視覚的意味論的概念と偽トレースとの相互作用を強化するために,視覚的再構成パラダイムに基づく概念レベルの偽差学習モジュールを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:11:09 GMT)
Beyond Zero Initialization: Investigating the Impact of Non-Zero Initialization on LoRA Fine-Tuning Dynamics [23.8] 低ランク適応(LoRA)はパラメータ効率のよい微調整法として広く用いられている。
標準的なLoRA層では、行列の1つである$A$または$B$はゼロであり、事前訓練されたモデルから微調整が始まります。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:48:16 GMT)
ICE-Bench: A Unified and Comprehensive Benchmark for Image Creating and Editing [23.5] ICE-Benchは、画像生成モデルを厳格に評価するために設計された包括的なベンチマークである。
評価フレームワークは、6次元にわたる画像生成能力を評価する。
既存の世代モデルを徹底的に分析し、ベンチマークの難易度と現在のモデル能力と実世界の世代要件のギャップを明らかにする。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 13:06:03 GMT)
MIRAGE: Towards AI-Generated Image Detection in the Wild [23.5] AIGI検出器は、Wildのシナリオに一般化できない。
Mirageは、開発中のAIGIの複雑さをエミュレートするために設計された、挑戦的なベンチマークである。
Mirage-R1は2つの段階で訓練されている。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:59:58 GMT)
LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learning [23.0] 大規模言語モデル(LLM)は論理的推論、文脈内学習、コード生成において顕著な能力を示している。
LGR2 は LLM を利用して高次ポリシーのための言語誘導報酬関数を生成する新しい HRL フレームワークである。
スパース環境における試料効率をさらに高めるため, 目標条件付き後視体験レザベリングを統合した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:59:39 GMT)
Synthetic Data is Sufficient for Zero-Shot Visual Generalization from Offline Data [22.8] オフラインデータで訓練されたポリシーは、様々な州への限られた露出のために、しばしば一般化に苦しむ。
これにより、見えない環境に一般化可能な堅牢なエージェントのトレーニングにおいて、視覚ベースのオフラインデータを活用することが難しくなる。
2段階のプロセスを提案し、まず最初に収集したオフラインデータを拡大し、多様性を導入してゼロショット一般化を改善し、次に拡散モデルを用いて遅延空間に付加的なデータを生成する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 13:01:15 GMT)
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities [22.5] 今後の研究を導くための総合的な調査を行う。
既存の統一モデルについてレビューし、これらを3つの主要なアーキテクチャパラダイムに分類する。
トークン化戦略,クロスモーダルアテンション,データなど,この新興分野に直面する重要な課題について論じる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:32:11 GMT)
Consensus or Conflict? Fine-Grained Evaluation of Conflicting Answers in Question-Answering [22.4] 質問に有効な回答がいくつかあるようなマルチ回答質問回答 (MAQA) は依然として困難である。
本研究では,NATCONFQAの構築にファクトチェックデータセットを活用するための,コスト効率の高い新しい手法を提案する。
NATCONFQA 上で8つのハイエンド LLM を評価し,多種多様な競合に対処する際の脆弱さを明らかにした。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:58:48 GMT)
The Panaceas for Improving Low-Rank Decomposition in Communication-Efficient Federated Learning [22.3] モデル更新分解(MUD)、ブロックワイドクローネッカー分解(BKD)、アグリゲーション・アウェア分解(AAD)の3つの新しい手法を紹介する。
提案手法は, ベースライン法よりも高速に収束し, 精度が向上する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:25:34 GMT)
PreSem-Surf: RGB-D Surface Reconstruction with Progressive Semantic Modeling and SG-MLP Pre-Rendering Mechanism [22.0] PreSem-SurfはRGB-Dシーケンスから短時間で高品質なシーン表面を再構築することができる。
この手法は、RGB、深さ、意味情報を統合して再構成性能を向上させる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:00:18 GMT)
Un-mixing Test-time Adaptation under Heterogeneous Data Streams [21.4] TTA(Test-Time Adaptation)は、ディープモデル適応のための有望なソリューションとして登場した。
本稿では、新しい周波数ベースの分散適応フレームワークFreDAを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:01:50 GMT)
Legal$Δ$: Enhancing Legal Reasoning in LLMs via Reinforcement Learning with Chain-of-Thought Guided Information Gain [21.2] 我々は、チェーン・オブ・インフォメーションによる法的推論を強化するために、Legal$Delta$を提案する。
Legal$Delta$はデュアルモードの入力設定と直接応答と推論拡張モードを使用する。
ラベル付き嗜好データに頼ることなく、一貫してより堅牢で信頼できる法的判断を下す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:10:08 GMT)
Adversarial Attacks on VQA-NLE: Exposing and Alleviating Inconsistencies in Visual Question Answering Explanations [20.6] 視覚的質問応答(VQA-NLE)における自然言語の説明は、意思決定プロセスの解明によってブラックボックスモデルをより透明にすることを目的としている。
既存のVQA-NLEシステムでは、根底にあるコンテキストを真に理解することなく、矛盾した説明を導き、結論に達することができる。
本稿では,画像の変更を最小限に抑え,矛盾や急激な出力を誘導する手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:53:10 GMT)
LumiMAS: A Comprehensive Framework for Real-Time Monitoring and Enhanced Observability in Multi-Agent Systems [20.4] 提案するフレームワークは,監視層とロギング層,異常検出層,異常説明層という3つの重要なコンポーネントで構成されている。
LumiMASは7種類のMASアプリケーションで評価され、2つの人気のあるMASプラットフォームを使って実装された。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:55:02 GMT)
Extracting Post-Acute Sequelae of SARS-CoV-2 Infection Symptoms from Clinical Notes via Hybrid Natural Language Processing [20.3] 我々は,ルールに基づく名前付きエンティティ認識とBERTに基づくアサーション検出モジュールを統合するハイブリッド自然言語処理パイプラインを開発した。
人口レベルの有病率調査では,47,654件の経過ノートを収集した。
パイプラインは各音符を平均2.448pm 0.812$秒で処理した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:43:05 GMT)
Learning from Samples: Inverse Problems over measures via Sharpened Fenchel-Young Losses [20.2] 確率測度空間上の最適化問題の準最適差を測る,シャープ化フェンシェル・ヤング損失と呼ばれる,新たな損失関数のクラスを導入する。
最適輸送の文脈における2つの関連する設定に対して、明確な安定性を保証する。
本稿では,iUOTとiJKOの問題を効率的に解ける最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:28:29 GMT)
Accelerating LLM Inference via Dynamic KV Cache Placement in Heterogeneous Memory System [19.7] 大規模言語モデル(LLM)推論は、メモリ帯域幅によってますます制限される。
現代のAIハードウェアは、高速オフパッケージDRAMと高速帯域メモリ(HBM)を統合している。
本研究は,キャパシティ制約下での集積帯域利用を最大化するために,そのようなシステムにまたがる動的KVキャッシュ配置について検討する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:07:08 GMT)
Cognitive-Inspired Hierarchical Attention Fusion With Visual and Textual for Cross-Domain Sequential Recommendation [19.7] クロスドメインシークエンシャルレコメンデーション(CDSR)は、複数のドメインにわたる歴史的なインタラクションを活用することで、ユーザの振る舞いを予測する。
本稿では,視覚的・テキスト的表現の階層的意図融合(HAF-VT)を提案する。
階層的な注意機構は、人間の情報統合を模倣して、単一ドメインとクロスドメインの好みを共同で学習する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 13:41:48 GMT)
Disentangling the Drivers of LLM Social Conformity: An Uncertainty-Moderated Dual-Process Mechanism [19.1] 大規模言語モデル(LLM)は協力チームに統合され、その社会的適合性は重要な懸念事項として浮上している。
ヒトにおいて、適合性は情報的影響(正確性のためのグループキューの合理的使用)または規範的影響(承認のための社会的圧力)から生じる。
本研究では、行動経済学から情報カスケードパラダイムを適応させ、2人のドライバーを定量的に切り離し、適度な効果を調査する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:53:55 GMT)
Interpretable Oracle Bone Script Decipherment through Radical and Pictographic Analysis with LVLMs [17.8] 本稿では,大規模視覚言語モデルに基づく解釈可能なOracle Bone Script (OBS) 解読手法を提案する。
また,OBS画像と画像解析用テキストを付加した47,157文字のPictographic Decipherment OBSデータセットを提案する。
提案手法は最先端のTop-10精度と優れたゼロショット復号能力を実現する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:45:29 GMT)
Cascading and Proxy Membership Inference Attacks [17.8] メンバーシップ推論攻撃(MIA)は、トレーニングされた機械学習モデルがトレーニングデータについてどれだけの頻度で明らかにするかを評価する。
我々は,既存のMIAを適応型か非適応型に分類する。
クエリインスタンスにアクセスした後、相手がシャドーモデルを訓練できる適応的な環境では、カスケーディングメンバーシップ推論攻撃(CMIA)と呼ばれる攻撃非依存のフレームワークを提案する。
非適応的な環境では、相手がメンバーシップクエリを得る前にシャドウモデルの訓練に制限される場合、プロキシメンバーシップ推論攻撃(PMIA)を導入する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:55:12 GMT)
OMGM: Orchestrate Multiple Granularities and Modalities for Efficient Multimodal Retrieval [17.8] 知識に基づく視覚質問応答(KB-VQA)に対処するための視覚言語検索拡張生成(RAG)が有効なアプローチとなっている
本稿では,複数の粒度とモダリティを調和させて有効性を向上する,粗大で微細なマルチステップ検索を特徴とするマルチモーダルRAGシステムを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:35:33 GMT)
CC-Time: Cross-Model and Cross-Modality Time Series Forecasting [17.7] 時系列予測のためのPLMを用いたクロスモデル・クロスモーダル学習(CC-Time)を提案する。
第1の側面では、CC-Timeは、時系列シーケンスと対応するテキスト記述の両方から、言語モデルにおける時間的依存とチャネル相関をモデル化するために、相互モダリティ学習を取り入れている。
第2の側面では、CC-Timeはさらに、PLMと時系列モデルからの知識を適応的に統合し、より包括的な時系列パターンのモデリングを形成するクロスモデル融合ブロックを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:31:23 GMT)
Superpixel-informed Continuous Low-Rank Tensor Representation for Multi-Dimensional Data Recovery [17.6] 低ランクテンソル表現(LRTR)は多次元データ処理の強力なツールとして登場した。
Superpixel-informed Continuous Low-rank Representation (SCTR)フレームワークは、多次元データの連続的かつ柔軟なモデリングを可能にする。
SCTRは、マルチスペクトル画像、ビデオ、カラー画像にまたがる既存のLRTR法よりも3~5dBのPSNRの改善を実現している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:58:42 GMT)
Mitigating Hallucinations in Large Language Models via Causal Reasoning [16.8] 大規模言語モデル(LLM)は論理的に矛盾した幻覚を示し、一貫性があるように見えるが、理性原理に反する。
我々は因果DAG構築と推論(CDCR-SFT)を紹介する。
CDCR-SFT は LLM を訓練し、変数レベル指向非巡回グラフ (DAG) を明示的に構築し、その上で推論を行う。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:51:06 GMT)
Convergence Analysis of the Lion Optimizer in Centralized and Distributed Settings [16.7] 分散還元を伴うライオンを導入し,$mathcalO(d1/2T-1/4)$の収束率を向上した。
次に分散環境で解析し、分散ライオンの標準および分散化バージョンが$mathcalO(d1/2(nT)-1/4)$の収束率を得る。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:54:01 GMT)
Illusions in Humans and AI: How Visual Perception Aligns and Diverges [14.7] 生体と人工の知覚を錯覚のレンズを通して比較することにより、それぞれのシステムが視覚的現実を構築する方法について、重要な違いを浮き彫りにする。
視覚錯覚は、人間の知覚が生の知覚データではなく、文脈的な仮定に基づいていることを示す。
この記事では、色、サイズ、形状、動きを含む古典的な視覚錯覚に対するAIの反応について説明する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:12:54 GMT)
WXSOD: A Benchmark for Robust Salient Object Detection in Adverse Weather Conditions [14.6] 本稿では,WXSOD(Weather-eXtended Salient Object Detection)データセットを提案する。
14,945枚のRGB画像と多様な気象騒音、それに対応する地上の真実の注釈と気象ラベルで構成されている。
本稿では,WFANet(Weather-Aware Feature Aggregation Network)と呼ばれる,効率的なベースラインを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:39:56 GMT)
ProtTeX-CC: Activating In-Context Learning in Protein LLM via Two-Stage Instruction Compression [13.9] Prot-CCは軽量な2段階圧縮フレームワークで、数ショット設定でProt予測を強化するように設計されている。
本稿では,最後の数個のトークンの潜在空間に全デモを集約する自己圧縮モジュールを提案する。
従来の Prot と比較して,我々の自己圧縮手法は,16ショット設定時の総プロンプト長の約93.68%の圧縮比を達成している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:03:56 GMT)
The Self-Execution Benchmark: Measuring LLMs' Attempts to Overcome Their Lack of Self-Execution [13.6] 大規模言語モデル(LLM)は、知識や推論能力をテストするタスクで一般的に評価される。
本稿では、モデルが出力の特性を予測できる能力を測定するセルフ実行ベンチマークを紹介する。
私たちの実験では、モデルが一般的にこのベンチマークではパフォーマンスが悪く、モデルのサイズや能力が向上しても、常にパフォーマンスが向上するとは限らないことが示されています。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:57:58 GMT)
Straggler-Resilient Federated Learning over A Hybrid Conventional and Pinching Antenna Network [13.5] 無線ネットワーク対応学習(FL)におけるピンチアンテナの活用は、FLの一般的な「ストラグラー」問題を効果的に緩和することができる。
通信効率を大幅に向上させるために, 従来型ピンチアンテナネットワーク(HCPAN)を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:09:42 GMT)
Generative Latent Diffusion Model for Inverse Modeling and Uncertainty Analysis in Geological Carbon Sequestration [13.2] 地球温暖化対策として, 地質炭素隔離(GCS)が注目されている。
逆モデリングと不確実性定量化の既存の方法は計算集約的で一般化性に欠ける。
本稿では, 高速かつ不確実性を考慮したフォワードおよび逆モデリングのための生成フレームワークである, 条件付きニューラルネットワーク遅延拡散(CoNFiLD-geo)モデルを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:26:47 GMT)
In vivo 3D ultrasound computed tomography of musculoskeletal tissues with generative neural physics [13.1] Ultrasound Computed Tomography (USCT) は、放射線のない高分解能のモダリティであるが、筋骨格撮影に限られている。
本稿では,高速かつ高忠実な3DUSCTのための生成ネットワークと物理インフォームドニューラルネットワークを結合した生成型ニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:46:24 GMT)
"My productivity is boosted, but ..." Demystifying Users' Perception on AI Coding Assistants [13.1] Visual Studio Code Marketplaceから1,085のAIコーディングアシスタントを特定します。
次に、十分なインストールとレビューを持つ32のAIコーディングアシスタントからサンプリングされたユーザレビューを手動で分析し、これらのアシスタントに関するユーザの懸念とフィードバックに関する包括的な分類を構築します。
ユーザニーズを満たすAIコーディングアシスタントの強化を導くための5つの実践的意味と提案を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:22:47 GMT)
EgoLoc: A Generalizable Solution for Temporal Interaction Localization in Egocentric Videos [13.1] 自我中心の視覚における手動物体の相互作用の分析は、VR/ARアプリケーションと人間ロボットのポリシー伝達を促進する。
EgoLocと呼ばれる新しいゼロショットアプローチを提案し、エゴセントリックなビデオで手動接触と切り離しタイムスタンプをローカライズする。
EgoLocは、視覚言語モデルを利用して、コンタクト/セパレーション属性を特定し、特定のタイムスタンプをローカライズし、さらなる改善のためにクローズドループフィードバックを提供する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:38:56 GMT)
Root Cause Analysis of Hydrogen Bond Separation in Spatio-Temporal Molecular Dynamics using Causal Models [12.9] 重要な研究のギャップは、水素結合の形成と分離の根本原因を特定することである。
データ分析と機械学習モデルを利用して、これらの現象の検出を強化することを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 21:23:12 GMT)
STM3: Mixture of Multiscale Mamba for Long-Term Spatio-Temporal Time-Series Prediction [12.8] 長期的時系列は急速に発展してきたが、既存のディープラーニング手法は複雑な長期的依存関係を効率的に学習するのに苦労している。
本稿では,マルチスケールのMambaアーキテクチャと適応型グラフ因果畳み込みネットワークを備えた効率的なtextittextbfSTemporal textbfMultiscale textbfMamba (STM2) を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:29:58 GMT)
An Introduction to Sliced Optimal Transport [12.6] Sliced Optimal Transport (SOT) は、一次元OT問題のトラクタビリティを利用する最適輸送(OT)の分岐である。
本稿では, SOTの数学的基礎, 方法論の進歩, 計算方法, 応用について概説する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 22:53:19 GMT)
CRoC: Context Refactoring Contrast for Graph Anomaly Detection with Limited Supervision [12.3] グラフ異常検出(GAD)のためのグラフニューラルネットワーク(GNN)を学習するフレームワークであるコンテキストリファクタリングコントラスト(CRoC)を提案する。
CRoCは、GAD固有のクラス不均衡を利用して、ラベル付きおよび豊富なラベル付きデータを活用する。
トレーニングの段階では、CRoCは対照的な学習パラダイムとさらに統合されている。これにより、GNNはトレーニング中にラベルのないデータを効果的に活用し、よりリッチでより離散的なノードの埋め込みを生成することができる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:05:17 GMT)
ViT-EnsembleAttack: Augmenting Ensemble Models for Stronger Adversarial Transferability in Vision Transformers [12.0] 我々は,アンサンブルモデルの全体的な一般化を促進し,敵のオーバーフィッティングのリスクを低減するために,ViT-EnsembleAttackを提案する。
ViT-EnsembleAttackは、ViTに対するアンサンブルベースの攻撃の対向性を大幅に向上させ、既存の手法よりも大幅に向上する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:47:31 GMT)
Feature Request Analysis and Processing: Tasks, Techniques, and Trends [12.0] ユーザの要求を満足させることは、競争力とユーザの満足の両面から恩恵を受けることができる。
記述的統計学と定性的分析法を用いて131の初等研究を選択し,分析する。
1)機能要求の品質を保証すること、(2)仕様と検証を改善すること、(3)大規模言語モデル駆動タスクのための高品質なベンチマークを開発すること、などである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:09:16 GMT)
Navigating the Exploration-Exploitation Tradeoff in Inference-Time Scaling of Diffusion Models [11.8] 推論時間スケーリングは言語モデルにおいて顕著に成功したが、拡散モデルへの適応は未解明のままである。
スケジュールと適応温度の2つの戦略を提案する。
提案手法は, 騒音評価の総数を増やすことなく, 試料品質を著しく向上させる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 13:35:38 GMT)
Neural Bandit Based Optimal LLM Selection for a Pipeline of Tasks [11.4] 本稿では,各サブタスク上でLLMの成功をオンラインにモデル化するニューラルネットワークをトレーニングするニューラルネットワークのコンテキスト帯域ベースアルゴリズムを提案する。
通信質問応答と診断予測データセットの実験から,提案手法の有効性が示唆された。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:37:34 GMT)
TADT-CSA: Temporal Advantage Decision Transformer with Contrastive State Abstraction for Generative Recommendation [11.3] Decision Transformer (DT) はシーケンシャルなレコメンデーションタスクに適用される軽量な生成モデルである。
コントラスト状態抽象化(TADT-CSA)モデルを用いたテンポラルアドバンテージ決定変換器を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:33:11 GMT)
Convert Language Model into a Value-based Strategic Planner [11.1] 感情支援会話(ESC)は、効果的な会話を通じて個人の感情的苦痛を軽減することを目的としている。
状態モデルの観点からダイアグラムを定義するために,straQ* というフレームワークを提案する。
当社のフレームワークでは,ESC中にLCMをブートストラップし,長期的リターンに基づいて最適な戦略を決定し,最終的にLSMの応答を誘導する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:06:48 GMT)
Where Are Large Language Models for Code Generation on GitHub? [11.0] ChatGPTとCopilotは、GitHub上でコードを生成するために最も頻繁に使用される。
ほとんどのChatGPT/Copilot生成コードスニペットは比較的短く、複雑さが低い。
バグによる修正は、さまざまな言語でわずか3%から8%まで、さらに少ない。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:15:18 GMT)
Inverse-LLaVA: Eliminating Alignment Pre-training Through Text-to-Vision Mapping [11.0] Inverse-LLaVAは、ブリッジビジョンと言語モダリティに対する新しいアプローチである。
テキスト空間に視覚的特徴を投影するのではなく,テキスト埋め込みを連続的な視覚的表現空間にマッピングする。
我々の研究は、計算要求を45%削減する新しいパラダイムの実現性を確立する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:36:04 GMT)
Who Pays the RENT? Implications of Spatial Inequality for Prediction-Based Allocation Policies [10.4] 個人レベルのターゲティングに関する最近の研究は、矛盾する結果を示している。
あるモデルでは、ターゲティングは不平等が高いときに役に立たないが、あるモデルでは潜在的な利益を示す。
我々は,不平等の空間分布がドア・ドア・ドア・アウトリーチ政策の有効性にどのように影響するかを理解するために,Mallowsモデルに基づくスタイリングフレームワークを開発する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:49:32 GMT)
SRMA-Mamba: Spatial Reverse Mamba Attention Network for Pathological Liver Segmentation in MRI Volumes [10.4] 肝硬変は慢性肝疾患の予後に重要な役割を果たす。
既存の方法ではMRIデータの空間的詳細を過小評価し、臨床効果と説明可能性を妨げる。
我々は,MRIボリュームの複雑な解剖学的構造内の空間的関係をモデル化する,新しいマンバ型ネットワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:52:54 GMT)
Advanced Gesture Recognition for Autism Spectrum Disorder Detection: Integrating YOLOv7, Video Augmentation, and VideoMAE for Naturalistic Video Analysis [10.3] 自発性スペクトラム障害(ASD)の診断のための重要な指標は、回転、頭部バンピング、腕羽ばたきなどの反復運動行動である。
本研究は, 自然・無制御環境下で撮影された映像を解析することにより, ASD を持つ子どもと発達した子ども(TD)を区別することに焦点を当てた。
我々は, YOLOv7に基づく検出, 広範ビデオ拡張, および高比マスキングと再構成戦略により空間的特徴と時間的特徴の両方を効率的にキャプチャする VideoMAE フレームワークを統合したパイプラインを採用する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:53:31 GMT)
Efficiently matching random inhomogeneous graphs via degree profiles [10.2] 最小平均次数が少なくとも$Omega(log2 n)$である限り、効率的なマッチングアルゴリズムが見つかる。
等級プロファイルによるマッチングアルゴリズムの着想と拡張により、最小平均次数が少なくとも$Omega(log-2 n)$である限り、効率的なマッチングアルゴリズムが得られる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 01:52:59 GMT)
Hierarchical knowledge guided fault intensity diagnosis of complex industrial systems [9.8] 本稿では,階層的知識に基づく断層強度診断フレームワーク(HKG)を提案する。
HKGはグラフ畳み込みネットワークを用いて、クラス表現の階層的トポロジカルグラフを大域的階層的分類器の集合にマッピングする。
さらに,クラス間の階層的知識をデータ駆動型統計相関行列に埋め込むことにより,再重み付き階層的知識相関行列(Re-HKCM)を作成する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:22:03 GMT)
DeCoT: Decomposing Complex Instructions for Enhanced Text-to-Image Generation with Large Language Models [9.8] 本稿では,T2Iモデルの複雑な命令の理解と実行を強化するフレームワークであるDeCoT(Decomposition-CoT)を提案する。
LongBench-T2Iデータセットの大規模な実験は、DeCoTが一貫し、主要なT2Iモデルの性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:15:39 GMT)
Is GPT-OSS Good? A Comprehensive Evaluation of OpenAI's Latest Open Source Models [9.7] 2025年8月、OpenAIはGPT-OSSモデルをリリースした。
両変種を,14.7Bから235Bまでの6つの現代オープンソース大言語モデルと比較した。
どちらのモデルも、コード生成の相対的な長所と、多言語タスクの顕著な弱点によって、現在のオープンソースランドスケープにおける中間層全体のパフォーマンスを示している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:25:37 GMT)
GALA: Can Graph-Augmented Large Language Model Agentic Workflows Elevate Root Cause Analysis? [9.4] 本稿では,マイクロサービスシステムにおける根本原因分析の新しいフレームワークであるGALAを紹介する。
GALAはオープンソースのベンチマークで評価され、最先端のメソッドよりも大幅に改善されている。
GALAは自動故障診断と実用的なインシデント解決のギャップを埋めることを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:12:05 GMT)
ZigzagAttention: Efficient Long-Context Inference with Exclusive Retrieval and Streaming Heads [9.1] 本研究の目的は,大規模言語モデル(LLM)におけるKVキャッシュのメモリフットプリントの最適化である。
我々は、検索とストリーミングヘッドの識別プロセスに重要な改善を加え、単一のユニークな層に収集された検索またはストリーミングヘッドを排他的に強制する基準を設計する。
textscZigzagAttentionという名前のメソッドは、レイテンシの低減と同等のパフォーマンスのため、検討されたベースライン間で競合する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:48:50 GMT)
Efficiently Verifiable Proofs of Data Attribution [9.1] 本稿では,データ属性に対する対話型検証パラダイムを提案する。
本稿では,PAC(Probably-Aqua-Correct)検証の意味において,形式的完全性,健全性,効率性を保証する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 22:05:23 GMT)
Incorporating Legal Logic into Deep Learning: An Intelligent Approach to Probation Prediction [9.0] 本稿では,確率予測のための深層学習モデルに法論理を統合する新しい手法を提案する。
まず,事実記述と保護法要素を含む専門的保護データセットを構築した。
第二に、我々はMulti-Task Dual-Theory Probation Prediction Model (MT-DT) という独自の確率予測モデルを設計する。
第3に, MT-DTモデルがベースラインモデルより優れていることを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:28:07 GMT)
Enabling Weak Client Participation via On-device Knowledge Distillation in Heterogenous Federated Learning [8.9] デバイス上でのKDに基づくヘテロジニアスFL法を提案する。
我々のアプローチは、ラベル付きローカルデータから学習するために小さな補助モデルを活用する。
強力なシステムリソースを持つクライアントのサブセットは、オンデバイスKDを介して知識を大きなモデルに転送します。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 01:51:40 GMT)
The Yokai Learning Environment: Tracking Beliefs Over Space and Time [8.9] 協力型カードゲーム「妖怪」に基づく強化学習環境「妖怪学習環境(YLE)」について紹介する。
成功には、進化する信念の追跡、過去の観察の記憶、ヒントを根拠としたコミュニケーション、チームメイトとの共通基盤の維持が必要です。
現在のRLエージェントは、完全なメモリへのアクセスが与えられたとしても、YLEを解決するのに苦労している。
信念モデリングはパフォーマンスを向上させるが、エージェントは依然として、目に見えないパートナーに効果的に一般化したり、より長いゲームに対して正確な信念を形成することはできない。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:42:17 GMT)
Geological Everything Model 3D: A Physics-informed Promptable Foundation Model for Unified and Zero-Shot Subsurface Understanding [8.8] Geological Everything Model 3D (GEM) は、タスクを迅速な条件付き推論として再構成する統合生成アーキテクチャである。
GEMは、新しいタスクやデータソースを再訓練することなく、不均一なプロンプト型を持つタスク間でゼロショットの一般化を実現する。
GEMは、火星レーダー層序解析、沈み込み帯の構造解釈、完全な地震層序解釈、地体セグメンテーション、資産モデリングなど、調査やタスクに幅広い適用性を示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:32:39 GMT)
Breaking Data Silos: Towards Open and Scalable Mobility Foundation Models via Generative Continual Learning [8.7] 人間の移動予測は、都市計画、交通の最適化、パーソナライズされたサービスにとって不可欠である。
既存のソリューションでは、異なる空間表現と地理的カバレッジのために、各都市の個別のモデルを訓練する必要があることが多い。
マルチシティ・ヒューマンモビリティ予測のための統一モデルUniMoveを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:31:01 GMT)
A neutral-atom Hubbard quantum simulator in the cryogenic regime [8.6] 我々は、ハバードモデルの大規模量子シミュレーションを全く新しい状態へと導くために、数倍の温度低下を実証した。
我々は量子シミュレーションを用いて、ドーピングで同様の低温を達成するための新しい経路を特定できる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:50:23 GMT)
TaoSR1: The Thinking Model for E-commerce Relevance Search [8.5] BERTベースのモデルはセマンティックマッチングが優れているが、複雑な推論能力がない。
本稿では,このタスクのために大規模言語モデルを直接デプロイするフレームワークを提案する。このフレームワークは,CoT(Chain-of-Thought)エラーの蓄積,差別的幻覚,デプロイメント実現可能性など,主要な課題に対処する。
筆者らのフレームワークであるTaoSR1は,(1)CoTを用いた教師付ファインチューニング(SFT),(2)パス@N戦略によるオフラインサンプリングとDPOによる生成品質向上,(3)グループ相対政策最適化(GRPO)による難易度に基づく動的サンプリングの3段階からなる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 13:48:48 GMT)
Online Learning with Probing for Sequential User-Centric Selection [8.5] そこで,学習者がまず武器のサブセットを探索して資源や報酬の副次情報を取得し,その後に$K$プレイを$M$アームに割り当てる。
既知の分布を持つオフライン設定に対しては、定数係数近似により $zeta = (e-1)/ (2e-1)$ が保証される。
未知の分布を持つオンライン・セッティングについては、OLPA(Bandit algorithm)を紹介します。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:43:53 GMT)
SGPT: Few-Shot Prompt Tuning for Signed Graphs [8.4] Signed Graph Prompt Tuning(SGPT)は、事前トレーニングされた未署名のGNNを、数ショットの署名付きグラフタスクに適応させるグラフプロンプトフレームワークである。
我々は,SGPTが既存の最先端手法を著しく上回ることを示す7つのベンチマークグラフデータセットの実験を行った。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:07:53 GMT)
GraphCogent: Overcoming LLMs' Working Memory Constraints via Multi-Agent Collaboration in Complex Graph Understanding [8.3] 大規模言語モデル(LLM)は、小規模なグラフ推論タスクでは有望な性能を示すが、複雑なクエリで現実のグラフを扱うと失敗する。
グラフ推論を特殊な認知プロセス(センス、バッファ、実行)に分解する協調エージェントフレームワークであるGraphCogentを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:28:38 GMT)
Deep Graph Neural Point Process For Learning Temporal Interactive Networks [8.2] 学習時空間相互作用ネットワーク(TIN)は,従来は粗粒度多列予測問題と考えられてきた。
本稿では、この制限に対処し、TINのためのディープグラフニューラルポイントプロセス(DGNPP)モデルを提案する。
3つの公開データセットの実験的評価により、DGNPPはイベント予測や時間予測タスクにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:17:03 GMT)
When AI Writes Back: Ethical Considerations by Physicians on AI-Drafted Patient Message Replies [8.1] GenAIパイロットプログラムに参加した21名の医師を対象に半構造化面接を行った。
医師の参加者による顕著な倫理的配慮には、倫理的保護としての人間の監督、透明性、AI使用に対する患者の同意が含まれていた。
この文脈でGenAIを使用することの倫理的責任は、主にテクノロジーではなく、ユーザにあることを示唆している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:46:49 GMT)
Defining and Benchmarking a Data-Centric Design Space for Brain Graph Construction [7.9] 現在のプラクティスは、しばしば、脳グラフの構築方法における重要なデータ中心の選択を無視する厳格なパイプラインに依存しています。
我々は、データ中心AIの観点を採用し、脳グラフ構築のためのデータ中心の設計空間を体系的に定義し、ベンチマークする。
私たちの貢献は、新しいコンポーネントよりも、既存のテクニックと修正されたテクニックの組み合わせが下流のパフォーマンスにどのように影響するかを評価することにあります。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:53:29 GMT)
HuBERT-VIC: Improving Noise-Robust Automatic Speech Recognition of Speech Foundation Model via Variance-Invariance-Covariance Regularization [7.8] 本稿では, 分散, 内分散, 共分散正則化を目標としたノイズローバストSFMである HuBERT-VIC を提案する。
これらの目的は、ノイズの多い音声表現の統計を調整し、モデルが様々な音響特性を捉えることを可能にする。
HuBERTに適用すると, 雑音音声のベースラインモデルと比較して, LibriSpeechテストクリーンで23.3%, 他で13.2%の性能向上が見られた。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:54:25 GMT)
MPCAR: Multi-Perspective Contextual Augmentation for Enhanced Visual Reasoning in Large Vision-Language Models [7.7] Multi-Perspective Contextual Augmentation for Reasoning (MPCAR)は、LVLM(Large Vision-Language Models)を強化するために設計された新しい推論時間戦略である。
第一に、LVLMは様々な角度から N の多様で相補的な記述や予備的推論経路を生成し、第二に、これらの記述は、元の質問とインテリジェントに統合され、包括的な文脈拡張プロンプトを構築し、最後に、このリッチ化されたプロンプトは、深い推論と最終回答生成のために究極の LVLM を導く。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:25:01 GMT)
Inducing Causal World Models in LLMs for Zero-Shot Physical Reasoning [7.4] Causal World Model Injection (CWMI)は、AIシステムに因果物理の明示的なモデルを組み込むように設計されたフレームワークである。
CWMIは、ゼロショット物理推論タスクにおいて最先端のAIシステムを大幅に上回る。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 02:41:12 GMT)
Adjustable AprilTags For Identity Secured Tasks [7.4] オープンでパブリックな環境では、IDセキュリティはもはや無視できる問題ではない。
敵攻撃による潜在的な被害に対処するため、このメモは調整可能な AprilTags の利用を提唱する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:43:52 GMT)
The Structural Sources of Verb Meaning Revisited: Large Language Models Display Syntactic Bootstrapping [7.2] 大規模言語モデルが類似した振る舞いを示すかどうかを検討する。
その結果,共起情報が削除された場合よりも,構文的手がかりが除去された場合の方が動詞表現が劣化することがわかった。
言語学習における統語的ブートストラップの重要な役割の強化に加えて,本研究は発達仮説を大規模に検証することの可能性を実証した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:43:49 GMT)
AI-Augmented Thyroid Scintigraphy for Robust Classification [6.9] 本研究では,ResNet18分類器の性能向上に対する3つのデータ拡張戦略の影響について検討した。
2,954人の甲状腺シンチグラフィー像をDG(Diffuse Goiter)、NG(Nodular Goiter)、正常(NL)、甲状腺炎(TI)の4つに分類した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:57:35 GMT)
IPGPhormer: Interpretable Pathology Graph-Transformer for Survival Analysis [6.8] 腫瘍の微小環境の特徴を捉え,組織全体にわたる空間的依存関係をモデル化する新しい枠組みを提案する。
IPGPhormerは、ホック後の手動のアノテーションを必要とせずに、組織と細胞レベルでの解釈性を提供する。
4つの公開ベンチマークデータセットの総合的な評価は、IPGPhormerが予測精度と解釈可能性の両方で最先端の手法より優れていることを示している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:32:08 GMT)
EraserDiT: Fast Video Inpainting with Diffusion Transformer Model [6.6] 本稿では拡散変換器(DiT)を利用した新しい映像塗装手法を提案する。
DiTは長期の時間的一貫性を維持するために拡散モデルと変圧器アーキテクチャの利点を相乗的に組み合わせている。
処理速度に関しては、ビデオを完成させるのに65秒しかかからないが、解像度は2160×2100ドル、97ドルだ。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:50:47 GMT)
Asymptotic breakdown point analysis of the minimum density power divergence estimator under independent non-homogeneous setups [6.6] 最低密度パワー分散推定器 (MDPDE) は、ロバスト推論の文献において大きな注目を集めている。
独立系や非均一系(INH)の観測など、様々な装置でうまく応用されている。
INH設定下におけるこの推定器のグローバルな信頼性や破壊挙動に関する一般的な結果は分かっていない。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:33:58 GMT)
On-device Anomaly Detection in Conveyor Belt Operations [6.4] 本研究では,正常化と異常化の2つの新手法を提案する。
提案手法は閾値に基づくデューティサイクル検出機構を利用するパターン認識システムである。
この方法は、推論中にエネルギー消費が13.3と20.6のテキストムJの効率的なリアルタイム操作を示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:15:25 GMT)
Bi-Axial Transformers: Addressing the Increasing Complexity of EHR Classification [6.3] 本稿では,よりリッチなデータ関係を学習するために,ERHデータの臨床的変数と時間軸の両方に対応するバイ軸変換器(BAT)を提案する。
BATは、セシス予測における最先端のパフォーマンスを達成し、死亡率分類の上位手法と競合する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:04:56 GMT)
What do Speech Foundation Models Learn? Analysis and Applications [6.2] 音声基礎モデル(SFM)は、幅広い音声処理タスクの汎用表現として機能するように設計されている。
本論文は,SFM層に符号化された音響的・言語的知識を調べるために,統計ツールとトレーニング不要なタスクを用いた軽量解析フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:31:34 GMT)
Deep Learning and Matrix Completion-aided IoT Network Localization in the Outlier Scenarios [6.1] 我々は,IoTネットワークのローカライゼーションにおいて,外部から汚染されたユークリッド距離行列Dを復元するための深層学習および行列補完支援手法を提案する。
具体的には、Dの固有の性質を本質的に満足するセンサ座標行列Xの関数としてDを表現し、ディープニューラルネットワークを用いてDとXを共同で回収する。
数値実験により, センサの位置情報を精度良く復元できることが実証された。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:54:14 GMT)
DoppDrive: Doppler-Driven Temporal Aggregation for Improved Radar Object Detection [6.0] 既存の手法では時間的アグリゲーションとエゴモーション補償によって点密度を増大させるが,本手法では動的物体からの散乱を導入し,検出性能を劣化させる。
散乱を最小化しながらレーダ点雲密度を増大させる新しいドップラー駆動時間アグリゲーション法であるDoppDriveを提案する。
DoppDriveは、検出前に適用された点雲密度向上ステップであり、あらゆる検出器と互換性があり、さまざまな検出器やデータセットのオブジェクト検出性能が大幅に向上することを示した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:24:46 GMT)
Adaptive Noise Resilient Keyword Spotting Using One-Shot Learning [6.0] キーワードスポッティング(KWS)はスマートデバイスのキーコンポーネントであり、効率的で直感的なオーディオインタラクションを可能にする。
KWSシステムは実環境下での性能劣化に悩まされることが多い。
そこで本研究では,KWS分類に用いる事前学習ニューラルネットワークの連続雑音適応に対する低計算手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:00:45 GMT)
Optimal Projections for Classification with Naive Bayes [6.0] 本研究では,クラス条件密度の因子化のための代替的基礎を得るという課題について検討する。
この問題を射影探索として定式化し, 分類を行う最適線形射影を求める。
提案手法は、他の一般的な確率的判別分析モデルよりも大幅に優れていることがわかった。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:03:20 GMT)
Towards Safe Autonomous Driving Policies using a Neuro-Symbolic Deep Reinforcement Learning Approach [5.5] 本稿では, DRLSL (DRLSL with Symbolic Logic) と呼ばれる新しいニューロシンボリックモデルフリーDRLアプローチを提案する。
DRL(経験から学ぶ)とシンボリックな一階述語論理(知識駆動推論)の強みを組み合わせることで、実環境における自動運転のリアルタイムインタラクションにおける安全な学習を可能にする。
我々は,ハイDデータセットを用いたハイウェイ走行シナリオにおいてDRLSLフレームワークを実装し,トレーニングとテストの両段階において,安全でない動作を回避できることを実証した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:45:58 GMT)
Hierarchical Knowledge Injection for Improving LLM-based Program Repair [5.3] 現実世界のプロジェクトでは、開発者はそのようなバグを解決するために、ローカルコード以外のより広いリポジトリとプロジェクトレベルのコンテキストに依存することが多い。
本稿では,LLMを構造化コンテキストで漸進的に拡張する階層型知識注入フレームワークを提案する。
このフレームワークをBugsInPyの314のバグのデータセットで評価し、6つのバグタイプにわたる修正率を分析した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:47:29 GMT)
Spin decoherence dynamics of Er$^{3+}$ in CeO$_2$ film [4.9] シリコン上のEr$3+$:CeO$$の新たなプラットフォームを示し、低核スピン密度とオンチップ統合の可能性を提供する。
スペクトル拡散誘起Er$3+$スピンフリップを支配的デコヒーレンス機構として同定し,ミリ秒スケールコヒーレンスへの経路を提供する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:52:20 GMT)
Improved Classical and Quantum Algorithms for the Shortest Vector Problem via Bounded Distance Decoding [4.6] 最短ベクトル問題(SVP)に対する証明可能な古典量子アルゴリズムの新しいアルゴリズムを提案する。
SVPの新しいアルゴリズムは、時間複雑性とメモリ要求の間のスムーズなトレードオフを提供する。
20.950n+o(n)$で動作し、20.5n+o(n)$クラシックメモリとポリ(n)量子ビットを必要とするSVPの量子アルゴリズム。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:17:31 GMT)
Distribution Matching via Generalized Consistency Models [4.3] 連続正規化フロー(CNF)における整合性モデルに着想を得た分布マッチングの新しい手法を提案する。
我々のモデルは、直進ノルム最小化目標を持つなどCNFモデルの利点を継承するが、GANと同様の異なる制約に適応できる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:37:57 GMT)
M3PO: Multimodal-Model-Guided Preference Optimization for Visual Instruction Following [4.1] LVLM(Large Vision-Language Models)は、複雑なマルチモーダル命令の潜在能力を秘めている。
M3POはLVLMの視覚的命令の処理能力を高めるために設計された,新しい,データ効率のよい手法である。
M3POは、LVLM生成候補の多様なプールから、最も「学習価値の高い」選好サンプルペアをインテリジェントに選択する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:07:55 GMT)
Towards Generalizable Human Activity Recognition: A Survey [4.1] IMUに基づくHuman Activity Recognition (HAR)は近年,学界と産業の双方から注目を集めている。
HARのパフォーマンスは特定のシナリオで大幅に改善されているが、その一般化機能は、現実世界で広く採用される上で重要な障壁であり続けている。
本稿では、IMUベースの一般化可能なHARの急速に発展する分野を探求し、229の論文と25の公開データセットをレビューする。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:04:39 GMT)
Exploring Multimodal AI Reasoning for Meteorological Forecasting from Skew-T Diagrams [4.0] VLM(Vision-Language Models)は、他の科学領域でも有望であるが、気象図解釈への応用はほとんど未発見である。
我々は,スキューT図を小型言語モデル (LM) と人間の予測器をエミュレートする小型VLMを用いた軽量AIアシスタントを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 01:36:31 GMT)
Explaining Large Language Models with gSMILE [4.0] gSMILEは、大規模言語モデルにおけるトークンレベルの解釈可能性のための、モデルに依存しない摂動ベースのフレームワークである。
我々は,OpenAI の GPT-3.5-turbo-instruct,Meta の LLaMA 3.1 Instruct Turbo や Anthropic の Claude 2.1 など,主要な LLM における gSMILE の評価を行った。
以上の結果から,gSMILEは人為的属性を確実に提供し,Claude 2.1は注意力に優れ,GPT-3.5は高い出力整合性を実現していることがわかった。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:08:34 GMT)
Multiplexed Entanglement of Multi-emitter Quantum Network Nodes [3.7] リモートノード間の絡み合いを分散する量子ネットワークは、量子コンピューティング、通信、センシングにおける変換技術を解放する。
ここでは、いくつかの希土類イオンとナノフォトニックキャビティを結合した2ノードネットワークを実装した。
これは、171Ybイオンをリアルタイム量子フィードフォワードと組み合わせた周波数検出光子検出によって、識別可能な171Ybイオンを絡み合わせるプロトコルによって達成される。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:34:09 GMT)
LD-Scene: LLM-Guided Diffusion for Controllable Generation of Adversarial Safety-Critical Driving Scenarios [3.7] LD-Sceneは、Large Language Models (LLMs)とLatent Diffusion Models (LDMs)を統合する新しいフレームワークである。
提案手法は,現実的な運転分布をキャプチャするLCMと,ユーザクエリを逆損失関数に変換するLCMベースのガイダンスモジュールを備える。
我々のフレームワークは、敵行動のきめ細かい制御を提供し、特定の運転シナリオに合わせたより効果的なテストを容易にする。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:29:45 GMT)
Improving Densification in 3D Gaussian Splatting for High-Fidelity Rendering [3.6] 本稿では3DGSの密度化パイプラインを網羅的に改善する。
具体的には,分割候補のガウスを効果的に選択するエッジ・アウェアスコアを提案する。
また,クローンと分割操作によって生じる幾何学的歪みを低減させるLong-Axis Split戦略を導入する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:13:21 GMT)
Benchmarking Federated Learning for Semantic Datasets: Federated Scene Graph Generation [3.5] フェデレートラーニング(FL)は、データのプライバシを保持しながら、分散トレーニングを可能にする。
既存のFLベンチマークは比較的単純な分類タスクに対処し、各サンプルは1ホットラベルでアノテートされる。
クライアント間のセマンティックな不均一性を制御可能なFLベンチマークを構築するためのベンチマークプロセスを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:57:43 GMT)
FMCE-Net++: Feature Map Convergence Evaluation and Training [3.5] FMCE-Net++は、事前訓練された凍結されたFMCE-Netを補助ヘッドとして統合する訓練フレームワークである。
このモジュールはFMCS予測を生成し、タスクラベルと組み合わせてバックボーン最適化を共同で監督する。
MNIST、CIFAR-10、FashionMNIST、CIFAR-100で行った実験は、FMCE-Net++が一貫してモデル性能を向上させることを示した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 02:24:50 GMT)
Solving Stochastic Orienteering Problems with Chance Constraints Using a GNN Powered Monte Carlo Tree Search [3.3] 本稿では,モンテカルロ木探索法(MCTS)を提案する。
割り当てられた旅行予算を順守しながら、アルゴリズムは、旅行コストを発生させながら収集された報酬を最大化する。
トレーニングデータセットの特性を超えて、このアプローチがいかに一般化できるかを実証する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 01:40:59 GMT)
EXOTIC: An Exact, Optimistic, Tree-Based Algorithm for Min-Max Optimization [3.2] ミニマックス最適化は、ゲーム理論、機械対向学習などの分野において、勾配に基づく手法を典型的なツールとして現れる。
本稿では,凸型手法におけるグローバル最適解をアルゴリズムで計算する手法を提案する。
次に,EXOTIC Exactを紹介する。
反復的に内部楽観的な木に基づく解法で外楽観的な領域を(ほぼ)解決する
クラスの呼び出し数の内部への呼び出し数。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:39:19 GMT)
Where to Start Alignment? Diffusion Large Language Model May Demand a Distinct Position [3.2] 本報告では,dLLMsの安全性に関する最初の解析を行った。
本稿では,そのユニークな生成特性に合わせた新しい安全アライメント手法を提案する。
ディフェンダーにとって、応答の中間トークンは初期トークンではなく、dLLM出力の全体的な安全性に対してより重要であることが明らかになる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:19:57 GMT)
LinkAnchor: An Autonomous LLM-Based Agent for Issue-to-Commit Link Recovery [3.2] GitHubの調査によると、問題の42.2%だけがコミットに正しくリンクされている。
提案するLinkAnchorは,プロポーザル・ツー・コミットリンクリカバリ用に設計された,初の自律型LCMエージェントである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:21:44 GMT)
MCPSecBench: A Systematic Security Benchmark and Playground for Testing Model Context Protocols [3.2] 本研究は,4つの主要な攻撃面にわたる17種類の攻撃タイプを同定し,MCPセキュリティの最初の系統分類を提示する。
MCPSecBenchは、プロンプトデータセット、MPPサーバ、MPPクライアント、アタックスクリプトを統合し、3つの主要なMPPプロバイダでこれらの攻撃を評価するための総合的なセキュリティベンチマークとグラウンドである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:49:16 GMT)
C2PSA-Enhanced YOLOv11 Architecture: A Novel Approach for Small Target Detection in Cotton Disease Diagnosis [3.1] 本研究は,綿病検出におけるYOLOv11の深層学習に基づく最適化について述べる。
移動配置システムにより,農業分野におけるリアルタイムの病害モニタリングと精密処理が可能となる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:28:02 GMT)
An Information-Theoretic Approach to Identifying Formulaic Clusters in Textual Data [3.0] フォーミュラテキストは繰り返しと制約された表現によって特徴づけられ、自己情報の変動性が低い傾向にある。
本研究の目的は,反復句,構文構造,スタイルマーカーを解析することにより,定式的クラスタを同定することである。
重み付き自己情報分布を利用してテキスト中の構造化パターンを検出する情報理論アルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:31:45 GMT)
2SSP: A Two-Stage Framework for Structured Pruning of LLMs [2.9] 大規模言語モデル(LLM)を解析するための新しい2段階フレームワークを提案する。
textsc2SSPは2つの異なるプルーニング戦略、すなわちWidthとDepth Pruningを組み合わせる。
提案手法は,3つの言語モデルと6つの下流タスクに対して,最先端の5つの競争相手を一貫して上回ります。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:56:30 GMT)
Segmenting Thalamic Nuclei: T1 Maps Provide a Reliable and Efficient Solution [2.9] MPRAGEとFGATIR配列、定量PDとT1マップ、異なる反転時間(multi-TI)でのT1強調画像など、複数のMRIコントラストを系統的に評価する。
その結果, PDマップは付加価値を示さないが, T1マップだけでは高い定量的性能と質的な結果が得られることがわかった。
これらの結果は,視床構造が臨床的,研究的な関心を持つ場合に,画像プロトコルを最適化するための貴重なガイダンスを提供するため,評価された選択肢の中で信頼性と効率的な入力としてT1マップの価値を裏付けるものである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 21:59:28 GMT)
A 1.5-Query Lower Bound for the Unitary Synthesis Problem [2.9] 1.5クエリ設定と呼ばれる単位問題に対する新しい合成の下限を証明した。
疑似ランダム量子状態は1.5クエリに制限された敵に対して安全であることを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:21:34 GMT)
Multispectral Fine-Grained Classification of Blackgrass in Wheat and Barley Crops [2.6] ブラックグラス(Blackgrass)は、ヨーロッパ北西部の穀物に特に問題を引き起こす草の雑草である。
マシンビジョンとマルチスペクトルイメージングを用いて,黒草を識別するための最先端手法の有効性について検討した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:02:11 GMT)
Regress, Don't Guess -- A Regression-like Loss on Number Tokens for Language Models [2.5] トークンレベルで純粋に動作する回帰的な損失を示す。
我々の提案したナンバートークン損失(NTL)は2つのフレーバーを持ち、$L_p$ノルムまたはワッサーシュタイン距離を最小化する。
提案手法を様々な数学的データセット上で評価し,数学関連タスクの性能を継続的に改善することを発見した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:30:08 GMT)
Better Together: Leveraging Multiple Digital Twins for Deployment Optimization of Airborne Base Stations [2.5] 航空基地局にとって、徹底的な試験を行うことなく、最良の場所を確立することが重要である。
本稿では,デジタルツイン(DT)誘導方式を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:10:54 GMT)
Alzheimer's Disease Classification Using Retinal OCT: TransnetOCT and Swin Transformer Models [2.5] 本研究は、高度深層学習技術を用いて、アルツハイマー病(AD)および健康管理(CO)患者の網膜OCT画像の分類を行う。
最高の分類アーキテクチャはTransNet OCTであり、入力されたOCT画像の平均精度は98.18%、セグメント化されたOCT画像では98.91%であり、5倍のクロスバリデーションである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:49:26 GMT)
iTrace: Click-Based Gaze Visualization on the Apple Vision Pro [2.4] Apple Vision Proは正確な視線追跡機能を備えているが、デバイス上のプライバシー制限により、連続したユーザーの視線データに直接アクセスできない。
この研究は、クリックベースの視線抽出技術によってこれらの制限を克服する新しいアプリケーションであるiTraceを紹介した。
我々は、視線座標を捕捉し、映像や空間的な視線追跡のための動的熱マップに変換するクライアントサーバアーキテクチャを用いたシステムを開発した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:34:37 GMT)
Fragile Preferences: A Deep Dive Into Order Effects in Large Language Models [2.4] 複数大言語モデル(LLM)における位置バイアスの包括的研究について紹介する。
品質依存的なシフトを含む、強い一貫性のある順序効果が得られます。
また、人的および機械的意思決定において、これまで文書化されていなかった2つのバイアスを特定します。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:47:06 GMT)
Multiple-Noise-Resilient Nonadiabatic Geometric Quantum Control of Solid-State Spins in Diamond [2.3] 我々は, 従来の動的ゲートを頑健性とコヒーレンスの両方で著しく改善できる, 実験フレンドリーなマルチノイズ弾性非線形量子ゲート(MNR-NGQG)を実験的に報告した。
実験的に実現可能な設計と、ハードウェア要件の緩和により、我々の研究は、NVセンターシステムで高忠実度量子制御を実現するためのしっかりとしたパラダイムを提供する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:32:02 GMT)
Model-free reinforcement learning with noisy actions for automated experimental control in optics [2.3] 我々は、光ファイバーにレーザー光を結合させることで、強化学習が課題を克服できることを示した。
特に、CrossQエージェントは、トレーニング時間の半分しか必要とせず、結合速度で他のエージェントよりも優れています。
我々の結果は、光学における問題に対処するRLの可能性を実証し、より複雑な応用への道を開いた。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:41:18 GMT)
European Space Agency Benchmark for Anomaly Detection in Satellite Telemetry [2.1] 欧州宇宙機関の衛星テレメトリにおける異常検出ベンチマーク(ESA-ADB)は、この領域に新しい標準を確立することを目的としている。
新たに導入されたESA異常データセットには、3つのESAミッションからの注釈付き実生活テレメトリが含まれている。
新しい階層的評価パイプラインで評価された典型的な異常検出アルゴリズムの結果は、演算子のニーズに対処するために新しいアプローチが必要であることを示している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:34:31 GMT)
System-driven Interactive Design Support for Cloud Architecture: A Qualitative User Experience Study with Novice Engineers [2.0] 本研究では,システム駆動型クラウド設計支援ツールを用いた60人の初心者エンジニアの経験を質的に検討する。
構造的かつ積極的なシステムガイダンスは、初心者が建築設計においてより効果的に関与するのに役立つことが示唆された。
参加者は、複数のアーキテクチャオプションをシミュレートし比較する能力によって、クラウド設計原則やトレードオフに対する理解を深めることができたと報告した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:48:09 GMT)
Interpreting Time Series Forecasts with LIME and SHAP: A Case Study on the Air Passengers Dataset [2.0] 時系列の予測は、航空、エネルギー、小売、健康において重要な決定を下している。
本稿では,局所的な解釈可能なモデルに依存しない説明を用いて時系列予測を解釈するための統一的な枠組みを提案する。
特に12ヶ月のラグと季節的なエンコーディングは、ほとんどの予測のばらつきを説明します。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:22:29 GMT)
SafePLUG: Empowering Multimodal LLMs with Pixel-Level Insight and Temporal Grounding for Traffic Accident Understanding [1.9] MLLM(Multimodal large language model)は、様々な視覚言語タスクにおいて顕著な進歩を遂げている。
本稿では,Pixel-Level Understanding と temporal Grounding を併用して,交通事故の包括的解析を可能にする新しいフレームワークであるSafePLUGを提案する。
多様な事故シナリオに着目したマルチモーダルな質問応答ペアを含む新しいデータセットを,詳細なピクセルレベルのアノテーションと時間的イベント境界でキュレートする。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:24:51 GMT)
Simultaneous estimation of connectivity and dimensionality in samples of networks [1.9] 本稿では,接続確率の潜在行列と,その埋め込み次元やランクを同時に推定する手法を提案する。
数値解析は, 様々なシナリオにおいて, 提案手法の精度を実証的に示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:52:08 GMT)
Uncovering Emergent Physics Representations Learned In-Context by Large Language Models [1.9] 大規模言語モデル(LLM)は、テキストプロンプトだけで幅広いタスクを解くことができる、印象的なインコンテキスト学習(ICL)能力を示す。
本稿では LLM の ICL 能力について考察する。
物理系における動的予測タスクをプロキシとして使用し、LLMが文脈で物理を学習できるかどうかを評価する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:49:17 GMT)
Research on intelligent generation of structural demolition suggestions based on multi-model collaboration [1.7] 情報を取得し、言語を組織化するのに多くの時間がかかり、自動化とインテリジェンスの度合いは低い。
本稿では,多モデル協調に基づく構造的分解提案をインテリジェントに生成する手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:03:15 GMT)
Towards Infant Sleep-Optimized Driving: Synergizing Wearable and Vehicle Sensing in Intelligent Cruise Control [1.5] 自動運転(AD)は車の安全性と運転の快適性を大幅に向上させたが、乗客の健康、特に幼児の睡眠への影響は十分に研究されていない。
本稿では,運転行動のパーソナライズと,利用者の快適さと旅行効率の最適なバランスをとるために,AD内における強化学習(RL)の統合について検討する。
幼児の睡眠の質を高めるため,様々な運転条件に適応するインテリジェントクルーズ制御フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:39:14 GMT)
Standardization of Neuromuscular Reflex Analysis -- Role of Fine-Tuned Vision-Language Model Consortium and OpenAI gpt-oss Reasoning LLM Enabled Decision Support System [1.5] 本稿では,H-reflex 波形の自動解釈・診断のためのファインチューニング型視覚言語モデル (VLM) コンソーシアムと大言語モデル (LLM) 対応意思決定支援システムを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:13:27 GMT)
An Initial Study of Bird's-Eye View Generation for Autonomous Vehicles using Cross-View Transformers [1.4] カメライメージを3つのBird's-Eye View (BEV)マップにマップする学習には,CrossView Transformer (CVT) を用いる。
本研究では,見知らぬ町への一般化,異なるカメラ配置の影響,および2つの損失定式化について検討した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:05:00 GMT)
Towards the Coordination and Verification of Heterogeneous Systems with Data and Time [1.4] 我々は、データを交換し、リアルタイム機能を含む異種部品の形式解析を行うことができる非侵襲的な協調フレームワークを開発した。
このフレームワークは、ヘテロジニアス言語の統合と部品の調整のために、中央ブローカとドメイン固有言語として実装された言語拡張を利用する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:48:01 GMT)
fCrit: A Visual Explanation System for Furniture Design Creative Support [1.4] fCritは、家具の設計を説明責任に焦点をあてて批判するために設計された対話型AIシステムである。
芸術における説明責任は、AIの推論を透過的にするだけでなく、ユーザーが自分のデザインについて考え、話す方法にも適応させるべきだ、と私たちは主張する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:03:44 GMT)
Excitation Gaps of Ground and Excited State Energy of the Fermi-Hubbard Model Using Variational Quantum Eigensolver [1.3] 新しく設計されたアンザッツ回路を用いて、4$times$1および2$times$2Hubbard格子の基底、第1および第2の励起状態エネルギーを求める。
COBYLAは粗収束に、L-BFGSは微調整に使用される。
系の対応する物理的性質は、電荷とスピンの異なる構成のための励起エネルギーギャップの位相図を通して解析される。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:49:07 GMT)
Fortifying the Agentic Web: A Unified Zero-Trust Architecture Against Logic-layer Threats [1.3] 本稿では,Zero-Trust IAMフレームワークを通じてエージェントWebを要塞化する統一セキュリティアーキテクチャを提案する。
このアーキテクチャは、分散ID(DID)と検証クレデンシャル(VC)を使用して、リッチで検証可能なエージェントIDの基礎の上に構築されている。
セキュリティはマルチレイヤのTrust Fabricを通じて運用される。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:52:39 GMT)
A Consistent and Scalable Algorithm for Best Subset Selection in Single Index Models [1.2] 高次元モデルのベスト・サブセット選択は計算的に難解であることが知られている。
既存のプロキシアルゴリズムは魅力的だが、ベストサブセットのソリューションは得られない。
本稿では,高次元SIMにおける最適サブセット選択のための拡張性のあるアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:46:06 GMT)
Balancing Interpretability and Flexibility in Modeling Diagnostic Trajectories with an Embedded Neural Hawkes Process Model [1.2] ホークス過程(HP)は、イベントシーケンスを自己強化ダイナミクスでモデル化するのに一般的に用いられる。
本稿では、ニューラルネットワークとしてインスタンス化されたフレキシブルなインパクトカーネルを定義することで、インパクト関数をモデル化する新しいHPを提案する。
このアプローチは従来のHPよりも柔軟だが、他のニューラルネットワークアプローチよりも解釈可能である。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:19:38 GMT)
SimQFL: A Quantum Federated Learning Simulator with Real-Time Visualization [1.1] 量子ネットワークアプリケーションを単純化し,高速化するシミュレータSimQFLを紹介する。
SimQFLはリアルタイムでエポックな出力開発と可視化をサポートし、研究者が学習プロセスを監視することができる。
SimQFLは、研究者や開発者が量子ニューラルネットワークのプロトタイプ、分析、チューニングを可能にする、実用的でインタラクティブなプラットフォームである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:36:19 GMT)
Arabic Multimodal Machine Learning: Datasets, Applications, Approaches, and Challenges [1.0] アラビア語のMMLは、テキスト、オーディオ、ビジュアルなどの様々なモダリティからの情報の統合と分析を目的としている。
本稿では,新しい分類法を用いてアラビア語のMMLを分類し,既存の研究を解析することによって検討する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:59:27 GMT)
FractMorph: A Fractional Fourier-Based Multi-Domain Transformer for Deformable Image Registration [0.9] クロスイメージ特徴マッチングを向上する新しい3次元デュアル並列変換器アーキテクチャであるFractMorphを提案する。
軽量なU-Netスタイルのネットワークは、変換器に富んだ特徴から密度変形場を予測する。
ACDCの心臓MRIデータセットでは、FractMorphは、全体のDice similarity Coefficient(DSC)が86.45%、平均構造当たりのDSCが75.15%、95パーセントのHausdorff(HD95)が1.54mmで、最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:42:10 GMT)
SAR image segmentation algorithms based on I-divergence-TV model [0.9] 合成開口レーダ(SAR)画像を乗法ガンマノイズで分割するために,I-divergence-TVモデルに基づく新しい変動能動輪郭モデルを提案する。
提案したモデルでは,輪郭が弱いあるいはぼやけたエッジで効率的に停止でき,画像の外部境界や内部境界を自動的に検出することができる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:14:09 GMT)
A global optimization SAR image segmentation model can be easily transformed to a general ROF denoising model [0.9] 我々は凸緩和手法を用いて提案モデルを大域最適化モデルに変換する。
グローバル最適化モデルを解決するために,2つの高速モデルを提案する。
いくつかの挑戦的な合成画像とEnvisat SAR画像を用いた実験は、提案したモデルの優位性を実証している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:07:53 GMT)
Unravelling Responsibility for AI [0.8] AI対応システムのアウトプットと影響に責任を負う場所を確立する必要があることは広く認識されている。
本稿では,グラフィカルな表記法と一般的な方法論を伴って,責任の概念的枠組みを提案する。
責任の概念を広げて、誰がAIに責任を持つのかが異なる可能性を明確にする。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:18:33 GMT)
From Fomo3D to Lottery DAPP: Analysis of Ethereum-Based Gambling Applications [0.8] ゲーム分散アプリケーション(DApps)はオンラインギャンブルの新しいパラダイムである。
本稿では, ギャンブルDAppのコンセプト, 原則, 実装, 将来について検討する。
ブロックチェーン技術とスマートコントラクトが進化するにつれて、宝くじのDAppsはオンライン宝くじ業界を大きく変革する立場にある。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:38:55 GMT)
The Course Difficulty Analysis Cookbook [0.7] カリキュラム分析(CA)は、カリキュラムの構造と学生データを研究し、教育プログラムの品質を保証する。
本稿では,コースの難易度を評価するための既存手法の総合的なレビューと比較を行う。
モデル選択、仮定チェック、実用的なCAアプリケーションに関するハンズオンチュートリアルを提供する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:55:37 GMT)
The Effect of Compression Techniques on Large Multimodal Language Models in the Medical Domain [0.7] 本稿では、医療応用のための微調整LAVAモデルにおける構造解析とアクティベーション対応量子化の影響について検討する。
本研究では, プルー・SFT量子化パイプラインにおいて, 異なる量子化手法を解析し, 性能トレードオフを評価する新しい層選択法を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:43:21 GMT)
Uncovering Systematic Failures of LLMs in Verifying Code Against Natural Language Specifications [0.7] 大規模言語モデル(LLM)はソフトウェア開発において不可欠なツールとなり、要求工学、コード生成、レビュータスクに広く利用されている。
本稿では,LLMが自然言語の要求に適合するかどうかを評価する上で,体系的に失敗していることを明らかにする。
以上の結果から,LCMは要件を満たすことのできないコード実装や潜在的な欠陥を含むコード実装を誤って分類することが多いことが判明した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 13:07:26 GMT)
Resonant dynamics of spin cluster in a periodically driven one-dimensional Rydberg lattice [0.6] 共振駆動場はファシリテーション条件下での駆動と同じような効果が得られることを示す。
結果は、駆動されたRydbergスピン格子のリッチな動的挙動を示し、量子状態操作に応用できるかもしれない。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:59:37 GMT)
Toward Architecture-Agnostic Local Control of Posterior Collapse in VAEs [0.6] 変分オートエンコーダ(VAE)は、生成されたサンプルの多様性を低下させる現象である後部崩壊に苦しむことが知られている。
本稿では,特定の構造に制約を加えることなく後部崩壊を制御するために,射影関数と合成関数の数学的性質に着想を得た遅延再構成(LR)損失を提案する。
MNIST, fashionMNIST, Omniglot, CelebA, FFHQなどの各種データセットの後方崩壊を制御する手法を実験的に評価した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 23:45:41 GMT)
Passive Hack-Back Strategies for Cyber Attribution: Covert Vectors in Denied Environment [0.3] 本稿では,直接攻撃を起こさずに隠蔽属性と情報収集を可能にするパッシブ・ハックバック手法の戦略的価値について検討する。
主なベクタとしては、ビーコンの追跡、ハネトケン、環境固有のペイロード、流出または漏洩した資産に埋め込まれたサプライチェーンベースのトラップなどがある。
また、受動的ハックバック操作の強化における人工知能(AI)の役割についても検討する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:43:23 GMT)
Geometry-Aware Video Inpainting for Joint Headset Occlusion Removal and Face Reconstruction in Social XR [0.2] ヘッドマウントディスプレイ(HMD)は、拡張現実(XR)環境を体験し、仮想コンテンツを観察するために不可欠である。
HMDはユーザの顔の上部を曖昧にし、外部のビデオ録画を複雑にし、遠隔会議のようなソーシャルXRアプリケーションに影響を与える。
本研究は,HMDの閉塞を共同で除去し,単一の視点から捉えたRGBフレームから完全な3次元顔形状を再構築する,幾何学的学習に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:45:00 GMT)
A Robust Cross-Domain IDS using BiGRU-LSTM-Attention for Medical and Industrial IoT Security [0.2] 本稿では,BiGAT-IDと呼ばれる新しいトランスフォーマーを用いた侵入検知システムについて紹介する。
BiGAT-IDは、双方向リカレントゲートユニットBiGRU、長期記憶LSTMネットワーク、マルチヘッドアテンションMHAを組み合わせたハイブリッドモデルである。
このモデルは例外的な実行効率を示し、IoMTではインスタンス毎に0.0002秒、IIoTシナリオでは0.0001秒の推論時間である。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:50:23 GMT)
High-Throughput Low-Cost Segmentation of Brightfield Microscopy Live Cell Images [0.2] 本研究は,光電場顕微鏡で観察した無残な生細胞のセグメンテーションに焦点を当てた。
冷凍エンコーダの比較分析を取り入れた低コストCNNパイプラインを開発した。
このモデルは、多様な生きた細胞変異を特徴とする公開データセットで検証された。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 22:05:58 GMT)
ATLAS: AI-Native Receiver Test-and-Measurement by Leveraging AI-Guided Search [0.2] ATLASはAI誘導型アプローチで、トレーニング済みのAIネイティブレシーバモデルのテストバッテリを生成し、古典的なレシーバアーキテクチャのパフォーマンスをベンチマークする。
我々は、NVIDIAのSionna環境における微分可能なテンソルを用いた古典的受信機と同様に、よく知られたDeepRx AIネイティブ受信モデルを採用することで、我々のアプローチを実装し、検証する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 02:12:15 GMT)
Portable Laser-Pumped Rb Atomic Clock with Digital Circuits [0.1] 本研究は,レーザー励起Rb原子時計の周波数安定性,小型化,低消費電力化を特徴とする分散フィードバック(DFB)を提案する。
提案した原子時計は、吸収セルが323Kの低温で動作するように設計されている。
原子時計の短期安定性は1.8times10-12tau -1/2$(1-100s)と測定される
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:09:30 GMT)
X-Ray-CoT: Interpretable Chest X-ray Diagnosis with Vision-Language Models via Chain-of-Thought Reasoning [0.0] 胸部X線診断のための新しいフレームワークであるX線CoT(Chest X-ray Chain-of-Thought)を提案する。
X線-CoTは、まずマルチモーダル特徴と視覚概念を抽出することにより、ヒトの放射線学者の「チェーン・オブ・思想」をシミュレートする。
80.52%、F1スコア78.65%のバランスド精度で、競争力のある定量的パフォーマンスを達成している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:00:41 GMT)
Unlearning at Scale: Implementing the Right to be Forgotten in Large Language Models [0.0] 我々のアプローチは最小限のプログラムとして扱い、マイクロバッチレコードにログを出力する。
ピン付きスタックと決定論的カーネルの下で、トレーニングテールを再生すると、トレーニング保持セットと同じパラメータが生成される。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:29:22 GMT)
Towards Optimal Environmental Policies: Policy Learning under Arbitrary Bipartite Network Interference [0.0] 石炭火力発電所への排出削減介入は、汚染に関連する健康負荷を減らすための効果があるがコストがかかる戦略であることが証明されている。
任意のネットワーク干渉(BNI)の下で最適ポリシーを決定するための新しい学習手法を提案する。
年間IHD入院率は、1万人あたり23.37-55.30から、異なるコスト制約の下で最適な政策によって減少する可能性がある。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 01:57:07 GMT)
The Evolution of IBM's Quantum Information Software Kit (Qiskit): A Review of its Applications [0.0] IBMのオープンソースの量子コンピューティングツールキット「Qiskit」がこの分野で重要な役割を担っている。
この調査は、Qiskitがどのように進化し、それがいくつかの重要な分野に貢献したかについて、体系的なレビューを提供する。
本稿では,Qiskitが古典量子のハイブリッド化を促進し,物理量子ハードウェアへのアルゴリズムの展開を可能にすることを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 05:22:55 GMT)
The Cultural Gene of Large Language Models: A Study on the Impact of Cross-Corpus Training on Model Values and Biases [0.0] 大規模言語モデル(LLM)は世界中に展開されているが、その根底にある文化的・倫理的な前提は未解明のままである。
西洋中心モデル (GPT-4) と東洋中心モデル (ERNIE Bot) を比較した。
人間のアノテーションは両次元に有意かつ一貫した相違を示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:54:14 GMT)
Tactile Gesture Recognition with Built-in Joint Sensors for Industrial Robots [0.0] 本稿では,ロボットが内蔵するジョイントセンサにのみ依存する深層学習手法について検討し,外部センサの必要性を排除した。
我々は、様々な畳み込みニューラルネットワーク(CNN)アーキテクチャを評価し、2つのデータセットを収集し、データ表現とモデルアーキテクチャが認識精度に与える影響を調べた。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:04:58 GMT)
Synchronization Dynamics of Heterogeneous, Collaborative Multi-Agent AI Systems [0.0] 本稿では,同期理論とマルチエージェントAIシステムを橋渡しする新たな学際的枠組みを提案する。
我々は,複雑なタスク実行に関わる異種AIエージェントの集合力学を記述するために,倉本モデルを適用した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:16:41 GMT)
Style Ambiguity Loss Using CLIP [0.0] 我々は、新しい分類器やラベル付きデータセットを訓練する必要のない、新しいスタイルのあいまいさ損失を導入する。
分類器の代わりに、CLIP埋め込み空間にセントロイドを生成し、画像は当該セントロイドとの相対距離に基づいて分類される。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:00:25 GMT)
Strategies for training point distributions in physics-informed neural networks [0.0] 物理インフォームドニューラルネットワークは、それらの構造と与えられた条件を直接損失関数に組み込むことで微分方程式の近似にアプローチする。
本稿では,本手法のコアコンポーネントであるトレーニングポイント分布について検討し,評価する。
その結果, 学習点が解の精度に与える影響が示され, 微分方程式の特性に関係している証拠が得られた。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:40:49 GMT)
Stability and performance guarantees for misspecified multivariate score-driven filters [0.0] 対数的仮定された観測密度の勾配を用いてパラメータ予測を更新するスコア駆動フィルタ(ISD, ESD)について検討した。
両方のフィルタタイプに対して、フィルタされたパラメータパスの指数的安定性を保証するための、新しい十分な条件を導出する。
ISDフィルタは精度と安定性の点でESDフィルタより優れていることを示すシミュレーション研究により理論的知見を検証した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:46:24 GMT)
Skin Cancer Classification: Hybrid CNN-Transformer Models with KAN-Based Fusion [0.0] Convolutional Kolmogorov-Arnold Network (CKAN) を用いた逐次および並列ハイブリッドCNN-Transformerモデルについて検討する。
そこでCNNは局所的な空間的特徴を抽出し、トランスフォーマーはグローバルな依存関係をモデル化し、CKANは表現学習を改善するために非線形な特徴融合を促進する。
HAM10000データセットで92.81%の精度と92.47%のF1スコア、PAD-UFESデータセットで97.83%のF1スコア、91.79%のF1スコア、91.17%のF1スコアを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:57:34 GMT)
Single-shot Distinguishability and Anti-distinguishability of Quantum Measurements [0.0] 単発状態にある与えられた集合からサンプリングされた量子測定を区別する(および反識別する)確率について検討する。
シナリオにおける任意のキュービット射影測定の区別可能性(iii)はシナリオにおける値よりも常に大きい(ii)。
シナリオ (iv) において完全に区別できる(かつ区別できない)が、他のシナリオではそうでないキュービットの測定結果を示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:30:47 GMT)
Simulating Quantum Turbulence with Matrix Product States [0.0] 量子乱流は、システムサイズ$L$からヒーリング長さ$xi$までの長さスケールにまたがる。
波動関数を効率的に圧縮するGross-Pitaevskii(GP)方程式の行列積状態(MPS)解法を提案する。
このアプローチにより、DNSと比較して10倍から1万倍以上の要素によるメモリ使用が削減される。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 00:50:52 GMT)
Sharpness-Aware Minimization with Z-Score Gradient Filtering [0.0] シャープネス・アウェアの最小化は、高い曲率の方向に向かってパラメータを摂動することで一般化を改善する。
本稿では,Zスコアに基づくフィルタを各層の勾配に適用するZスコアフィルタ型シャープネス認識最小化を提案する。
実験の結果,提案手法はシャープネス・アウェア・最小化とその変種と比較してテスト精度を常に向上することがわかった。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:30:00 GMT)
Sensing decoherence by using edge state [0.0] 脱コヒーレンスがない状態では、2つの貯水池(鉛)を異なる化学的ポテンシャルで接続する有限格子上のフェルミオン粒子の電流は弾道的であることが知られている。
格子がエッジ状態を持つ場合、弱デコヒーレンスの効果は桁違いに増幅できることを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 02:52:17 GMT)
Self-Tuning PID Control via a Hybrid Actor-Critic-Based Neural Structure for Quadcopter Control [0.0] Proportional-Integrator-Derivative (PID) コントローラは、幅広い産業および実験プロセスで使用されている。
モデルパラメータの不確実性と外乱のため、Quadrotorsのような実際のシステムはより堅牢で信頼性の高いPIDコントローラを必要とする。
本研究では,Reinforcement-Learning-based Neural Networkを用いた自己調整型PIDコントローラについて検討した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 04:46:13 GMT)
Security study based on the Chatgptplugin system: ldentifying Security Vulnerabilities [0.0] ChatGPTは大規模言語モデリングプラットフォームとして人気を博し、プラグインシステムも徐々に発展しつつある。
本研究の目的は、ChatGPTプラグインショップのプラグインのセキュリティを分析し、主要なセキュリティ脆弱性を明らかにし、それに対応する改善を提案することである。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:40:29 GMT)
Quantum-Enhanced Generative Adversarial Networks: Comparative Analysis of Classical and Hybrid Quantum-Classical Generative Adversarial Networks [0.0] 高忠実度データサンプルを作成するための強力なパラダイムとして、GAN(Generative Adversarial Network)が登場した。
本研究では、パラメータ化量子回路を用いて実装された量子発生器が古典的判別器の潜在ベクトルを生成するハイブリッド量子古典型GAN(HQCGAN)について検討する。
我々は,Qiskit の AerSimulator を用いて,3,5,7量子ビットのHQCGAN 変種とともに古典的 GAN を評価する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:13:36 GMT)
Practical design and performance of physical reservoir computing using hysteresis [0.0] 物理貯水池コンピューティングは、物理現象を計算資源として利用する革新的なアイデアである。
本研究では,物理貯水池計算の実用化に適したモデルとして,独立したヒステリックシステムからなる貯水池に着目した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 08:08:50 GMT)
Perfect State Transfer of Mixed States and Purification in Central Spin Systems [0.0] 2つの多体、一般的に混合された量子状態が、集合的、全対すべての相互作用によってどのように交換されるかを示す。
我々は、異なる種類の核スピン間で量子情報のコヒーレントな交換を可能にする量子ドットの実験的実装を提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 22:38:24 GMT)
Partial transpose as a space-time swap [0.0] 両部密度演算子の部分変換が2時間擬似密度演算子であることを示す。
最大エンタングル量子ビットに対して、部分転位はベルの不等式と因果相関に反する空間相関を写像することを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:39:22 GMT)
On Fusing ChatGPT and Ensemble Learning in Discon-tinuous Named Entity Recognition in Health Corpora [0.0] アンサンブル法における調停器としてのChatGPTの統合について検討し,DNERタスクの性能向上を目的とした。
提案手法は,5つの最先端NERモデルとChatGPTを組み合わせたカスタムプロンプトエンジニアリングを用いて,アンサンブルアルゴリズムの堅牢性と一般化能力を評価する。
その結果,ChatGPTとアンサンブル学習アルゴリズムの融合はCADEC,ShARe13,ShARe14データセットにおいてSOTAよりも優れていた。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 11:31:23 GMT)
Multi-agent Auditory Scene Analysis [0.0] 聴覚シーン分析(ASA)は、音源の位置、分離、分類の3つの主要なタスクを実行することで、音環境から情報を取得することを目的としている。
これらのタスクを実行すると、全体のレスポンス時間がリニアに増加し、最後のタスクは最初のタスク(ロケーション)のエラーに非常に敏感になる。
タスクを並列に実行し、各タスク間のフィードバックループでローカルエラーを補うためのマルチエージェントアプローチを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 19:24:34 GMT)
Meet Your New Client: Writing Reports for AI -- Benchmarking Information Loss in Market Research Deliverables [0.0] 本研究では,RAG導入時の情報損失を評価する。
テキストは確実に抽出されるが、チャートやダイアグラムのような複雑なオブジェクトから重要な情報が失われる。
これは、研究の洞察が翻訳で失われないようにするために、専門的でAIネイティブな成果物が必要であることを示唆している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:05:44 GMT)
Mechanical Automation with Vision: A Design for Rubik's Cube Solver [0.0] 重要なソフトウェアコンポーネントは、Unityで設計されたユーザフレンドリーなグラフィカルユーザインタフェース(GUI)の開発である。
このシステムはKociembaのアルゴリズムを使用し、単一の自由度で物理的な操作はステッパーモーターとキューブとの相互作用の組み合わせによって行われる。
解を得るためには、システムはKociembaのアルゴリズムを使用し、単一の自由度で物理的な操作はステッパーモーターとキューブとの相互作用の組み合わせによって行われる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 18:49:46 GMT)
Mantis: A Simulation-Grounded Foundation Model for Disease Forecasting [0.0] マンティス(Mantis)は、メカニカルシミュレーションで完全に訓練された基礎モデルである。
マンティスは4億日以上のシミュレートされた流行のダイナミクスに基づいて構築されている。
機械的に解釈可能であり、公衆衛生意思決定者は予測の背後にある潜伏したドライバーを特定できる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 06:55:29 GMT)
Machine Learning-Based Manufacturing Cost Prediction from 2D Engineering Drawings via Geometric Features [0.0] 本稿では,2次元エンジニアリング図面から製造コストを推定する方法を変換する統合機械学習フレームワークを提案する。
SHAPのような説明可能性ツールとコスト予測を結合することにより、フレームワークは設計ドライバを特定する。
このエンドツーエンドのCAD-to-コストパイプラインは、引用のリードタイムを短縮し、パートファミリ間の一貫性と透過的なコストアセスメントを保証する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:16:38 GMT)
MBMamba: When Memory Buffer Meets Mamba for Structure-Aware Image Deblurring [0.0] 本稿では,元のMambaアーキテクチャを変更することなく,構造を意識した画像デブロアリングネットワークを提案する。
具体的には、後続核融合のための履歴情報を保存するためのメモリバッファ機構を設計する。
画素間の物理系の「ミューチュアルアトラクション」のエネルギー最小化をシミュレートするIsingにインスパイアされた正規化損失を導入する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:33:57 GMT)
Local Prompt Adaptation for Style-Consistent Multi-Object Generation in Diffusion Models [0.0] Local Prompt Adaptation (LPA) は、プロンプトをコンテンツやスタイルトークンに注入する、軽量でトレーニング不要な手法である。
T2Iベンチマークでは、LPAはバニラSDXLのCLIP-promptアライメントを+0.41%、SD1.5の+0.34%改善し、多様性を損なわない。
カスタムの50プロンプトスタイルリッチベンチマークでは、LPAは+0.09%のCLIPプロンプトと+0.08%のCLIPスタイルのゲインを達成した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 15:58:51 GMT)
Local Cluster Cardinality Estimation for Adaptive Mean Shift [0.0] 本稿では,局所スケールとクラスタ濃度の異なるデータセットを対象とした適応平均シフトアルゴリズムを提案する。
提案アルゴリズムは,最近提案した適応平均シフト法よりも優れた性能を示し,より広範なクラスタリングベンチマーク上での競合性能を示した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:53:15 GMT)
LangVision-LoRA-NAS: Neural Architecture Search for Variable LoRA Rank in Vision Language Models [0.0] 視覚言語モデル(VLM)は、視覚とテキストのモダリティを統合し、マルチモーダルな理解と生成を可能にする。
LoRA (Low-Rank Adaptation) は、事前訓練されたモデルを新しいタスクに適応するための効率的な微調整手法である。
本稿では、ニューラルネットワーク検索(NAS)とLoRAを統合し、可変ランク適応のためのVLMを最適化する新しいフレームワークであるtextitLangVision-LoRA-NASを紹介する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 22:19:02 GMT)
Improving LLM Agents with Reinforcement Learning on Cryptographic CTF Challenges [0.0] 「ランダム・クリプト」は、強化学習の可能性を解き放つために、手続き的に生成された暗号データセットである。
Llama-3.1-8B の Python ツールを Group Relative Policy Optimization 経由で微調整する。
その結果得られたエージェントは、これまで見つからなかった課題に対して、Pass@8で大幅に改善される。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 22:28:50 GMT)
Generation of hyperentangled photon pairs in the time and frequency domain on a silicon photonic chip [0.0] 多次元の絡み合った光子状態は、量子通信ネットワークにおいて重要な資源である。
自然発生4波長混合による時間・周波数ビン領域における超絡み合い光子対の生成を実証した。
我々の知る限り、集積シリコンフォトニックデバイスにおける時間周波数ビンハイパーアンタングルの最初の実演である。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 10:25:33 GMT)
Generalized Number-Phase Lattice Encoding of a Bosonic Mode for Quantum Error Correction [0.0] 本稿では,数と位相変数の位相空間における対称性を利用して,量子ビットを符号化するための統一的なフレームワークを提案する。
論理符号語は数相空間の格子構造を形成し、長方形、斜め、ダイヤモンド型の格子符号となる。
これらの符号は、一方向量子通信の潜在的な応用において、従来の4次符号よりも大きな性能上の優位性を示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:58:04 GMT)
Foundation Models for Zero-Shot Segmentation of Scientific Images without AI-Ready Data [0.0] 我々は、科学画像におけるデータ準備のボトルネックを軽減するように設計された、ノーコードインタラクティブなコンピュータビジョンプラットフォームであるZenesisを紹介した。
Zenesisは、生の科学データに基づくゼロショット推論のための軽量な適応、ヒューマン・イン・ザ・ループの洗練、および注釈付き時間拡張を統合している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:00:43 GMT)
Experimental investigation of uncertainty relations for non-Hermitian operators [0.0] エルミート作用素の不確実性関係は、多くの実験を通じて確認されている。
以前の実験では、非エルミート作用素の特別な場合のみ試験された。
この結果は、非エルミート作用素に対する不確実性関係の実験的証拠を提供する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 03:05:35 GMT)
Entanglement harvesting and curvature of entanglement: A modular operator approach [0.0] トミタ・竹崎モジュラー理論に基づく作用素-代数的フレームワークは、量子絡み合いの側面を研究するために用いられる。
量子場の絡み合い構造は、絡み合い収穫のプロトコルを用いて研究される。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:55:10 GMT)
Empirical Analysis of the Effect of Context in the Task of Automated Essay Scoring in Transformer-Based Models [0.0] 本研究では,コンテクスト要因がトランスフォーマーモデルの性能に及ぼす影響について検討する。
我々の最も効果的なモデルでは、エッセイデータセット全体で平均四重み付きカッパスコアが0.823であり、個々のエッセイセットでトレーニングすると0.8697となる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:17:34 GMT)
Does the Barron space really defy the curse of dimensionality? [0.0] バロン空間は次元の呪いに反する(浅すぎる)ニューラルネットワークの理論で有名になった。
我々は、バロン空間(および一般化)が次元性の呪いを非古典的な滑らかさの概念で否定しないという考えを支持する証拠をいくつか提示する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 07:42:49 GMT)
Developing a Responsible AI Framework for Healthcare in Low Resource Countries: A Case Study in Nepal and Ghana [0.0] 本稿ではネパールとガーナにおける調査に基づく評価と知見について述べる。
データプライバシ、信頼性、信頼の問題といった大きな障害を強調します。
本稿では,資源制約のある環境に適したResponsible AI(RAI)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:59:19 GMT)
Detector noise in continuous-variable quantum key distribution [0.0] 検出器ノイズは、量子鍵分布システムの性能を決定する上で重要な要素である。
光コヒーレント検出を用いた連続可変(CV)QKDにおいて、広く採用されているテキストトラスト検出ノイズモデルは秘密鍵レートと送信距離の両方を改善する。
本稿では,第一仮定のみに依存するCV-QKDのためのテクスタイト校正型検出器ノイズモデルを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:22:44 GMT)
Dealing with Annotator Disagreement in Hate Speech Classification [0.0] 本稿では,アノテータの不一致に対処するための戦略について検討する。
トルコのツイートにおけるヘイトスピーチ分類の文脈において、複数のアノテーションを集約するための様々な自動アプローチを評価する。
本研究は,問題の重要性を強調し,オンライン談話におけるヘイトスピーチの検出と理解に最先端のベンチマーク結果を提供する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:08:55 GMT)
DLTPose: 6DoF Pose Estimation From Accurate Dense Surface Point Estimates [0.0] DoseはRGBD画像から6DoFオブジェクトのポーズ推定を行う新しい手法である。
キーポイント法の精度と高密度画素ワイド予測の堅牢性を組み合わせる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 02:29:13 GMT)
Cold-RL: Learning Cache Eviction with Offline Reinforcement Learning for NGINX [0.0] Cold-RLはNGINXの学習的排除ポリシーである。
これはLRUの強制経験パスをDeep Q-Networkに置き換える。
推論は2%未満のCPUオーバーヘッドを追加し、95%の消去遅延を予算内に保持する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:01:12 GMT)
Cognitive Decision Routing in Large Language Models: When to Think Fast, When to Think Slow [0.0] 大規模言語モデル(LLM)は、迅速で直感的な応答にいつ依存するか決定する上で、より遅く、より意図的な推論を行うという根本的な課題に直面します。
ダニエル・カーネマン(Daniel Kahneman)の二重プロセス理論と人間の認知バイアスに関する洞察に触発され、我々は新しい認知決定ルーティングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 01:07:58 GMT)
Clustering-Based Validation Splits for Model Selection under Domain Shift [0.0] トレーニングバリデーション分割は2つのセット間の分布ミスマッチを最大化するべきである。
線形プログラミングを利用して分割のサイズ、ラベル、および(任意に)グループを制御する制約付きクラスタリングアルゴリズムを示す。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:01:06 GMT)
AquaFeat: A Features-Based Image Enhancement Model for Underwater Object Detection [0.0] 本稿では,タスク駆動機能拡張を行う新しいプラグイン・アンド・プレイモジュールであるAquaFeatを提案する。
提案手法は,マルチスケール機能強化ネットワークを訓練したエンドツーエンドと検出器の損失関数を統合する。
挑戦的な水中データセット上でYOLOv8mと統合されたAquaFeatは、最先端の精度(0.877)とリコール(0.624)を達成し、競争力のあるmAPスコア(0.677のmAP@0.5、mAP@[0.5:0.95]の0.421)を達成している。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:22:18 GMT)
An Auditable Pipeline for Fuzzy Full-Text Screening in Systematic Reviews: Integrating Contrastive Semantic Highlighting and LLM Judgment [0.0] フルテキストのスクリーニングは、体系的なレビューの大きなボトルネックです。
私たちは、ファジィな決定問題として包摂/排除を再設計する、スケーラブルで監査可能なパイプラインを提示します。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 17:41:50 GMT)
Advanced DOA Regulation with a Whale-Optimized Fractional Order Fuzzy PID Framework [0.0] FOFPIDコントローラは、変更に適応するためのファジィ論理と微調整のための分数次ダイナミクスを組み合わせる。
WOAは、分数順序やファジィメンバシップ関数など、コントローラのパラメータを微調整するのに役立つため、パフォーマンスが向上する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 20:01:49 GMT)
AR Surgical Navigation with Surface Tracing: Comparing In-Situ Visualization with Tool-Tracking Guidance for Neurosurgical Applications [0.0] 本研究では,AR誘導を利用して解剖学的目標を登録し,リアルタイムな計器ナビゲーションを行う新しい手法を提案する。
新規な表面追跡法により標的位置を患者に登録し、リアルタイム赤外線ツールトラッキングを用いてカテーテル配置を支援する。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 16:36:27 GMT)
A Search for Good Pseudo-random Number Generators : Survey and Empirical Studies [0.0] これまで開発されたPRNGのジャンルは,線形連続生成器ベース,線形フィードバックシフトレジスタベース,セルオートマトンベースという3つのグループに分類されてきた。
全体として30ドルのPRNGは、Diehardバッテリテストによるブラインド統計テスト、TestU01ライブラリのバッテリエマビット、NIST統計テストスイートの2種類の経験的テストを行う方法として選択されている。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 14:44:16 GMT)
A Recurrent Neural Network based Clustering Method for Binary Data Sets in Education [0.0] 学生数が増えるにつれて、S-Pチャートの扱いが困難になる。
本稿では,ネットワーク力学に基づく単純なクラスタリング手法を提案する。
この方法では、ネットワークは複数の固定点を持ち、アトラクションの盆地は小さなS-Pチャートに対応する特異点クラスタを与える。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 13:26:43 GMT)
A Ramsey Ion Gradiometer for Single-Molecule State Detection [0.0] 我々は、理論量子センシングソリューション、Quantum Ligand-Binding Interrogator (QLI)を提案する。
QLI(英: QLI)は、電場勾配のラベルなし検出を行うために、一対のコトラップ原子イオンを用いる差動センサ(グラディオメーター)である。
本稿では,QLIの概念的枠組み,実験アーキテクチャ,絡み合った2イオンスピン状態を用いた測定プロトコル,鍵となる工学的リスクの解析について述べる。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 21:06:19 GMT)
A Large-Scale Web Search Dataset for Federated Online Learning to Rank [0.0] 我々は,1万人のユーザから260万のクエリを検索する大規模Web検索データセットを提示する。
私たちのデータセットは、ユーザ識別子、実際のクリックデータ、クエリタイムスタンプを含むことで、既存のベンチマークの重要な制限に対処します。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 12:57:54 GMT)
A Fast GRASP Metaheuristic for the Trigger Arc TSP with MIP-Based Construction and Multi-Neighborhood Local Search [0.0] 本稿では,複数の構成と複数の近傍局所探索を組み合わせたGRASPに基づくメタヒューリスティックを提案する。
このアルゴリズムはMESS 2024のトップ3で完成し、状態依存の旅行コストを持つリアルタイムルーティングアプリケーションに適していることを示した。
論文参考訳(メタデータ) (Sun, 17 Aug 2025 09:45:18 GMT)