The Sound of Simulation: Learning Multimodal Sim-to-Real Robot Policies with Generative Audio [138.1] MultiGenは、大規模な生成モデルを従来の物理シミュレータに統合するフレームワークである。
容器や液体を注ぐ現実世界への効果的なゼロショット転送を実証する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 01:21:21 GMT)
MOSEv2: A More Challenging Dataset for Video Object Segmentation in Complex Scenes [131.5] ビデオオブジェクトセグメンテーション(VOS)は、ビデオ全体を通して特定のターゲットオブジェクトをセグメンテーションすることを目的としている。
このギャップを埋めるために、複雑なシーンでのVOS研究を促進するために、coMplex video Object SEgmentationデータセットが導入された。
このMOSEv2は,実環境下でのVOS手法をさらに発展させるために設計された,はるかに難しいデータセットである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:44:53 GMT)
STORM: Token-Efficient Long Video Understanding for Multimodal LLMs [116.4] STORMは、イメージエンコーダとビデオLLMの間に専用のテンポラリエンコーダを組み込んだ、新しいアーキテクチャである。
我々は,STORMが様々な長いビデオ理解ベンチマークにおいて最先端の結果を達成することを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:53:47 GMT)
Revealing Multimodal Causality with Large Language Models [81.0] 非構造化データからマルチモーダル因果発見のための新しいフレームワークであるMLLM-CDを提案する。
本研究は,(1)真のマルチモーダル因子を同定する新しいコントラッシブ・ファクター発見モジュール,(2)発見要因間の因果関係を推測する統計的因果構造発見モジュール,(3)発見結果を洗練するための反復的マルチモーダル・カウンターファクト・推論モジュールの3つの重要な構成要素から構成される。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:45:17 GMT)
How Good are Foundation Models in Step-by-Step Embodied Reasoning? [79.2] 身体的エージェントは、安全で空間的に整合性があり、文脈に根ざした決定をしなければならない。
大規模マルチモーダルモデルの最近の進歩は、視覚的理解と言語生成において有望な能力を示している。
私たちのベンチマークには、10のタスクと8のエボディメントにまたがる詳細なステップバイステップ推論を備えた1.1k以上のサンプルが含まれています。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:44:37 GMT)
GeoPQA: Bridging the Visual Perception Gap in MLLMs for Geometric Reasoning [76.3] 幾何学的推論のような視覚集約的なタスクでは、MLLMは幻覚を頻繁に起こし、不正確な推論をもたらす。
本稿では,まず幾何学的構造の視覚的知覚を高め,推論能力を育成する2段階のRLトレーニングフレームワークを提案する。
この2段階学習は, 直接推論学習法と比較して, 幾何学的推論を9.7%改善し, 幾何学的問題解決を9.1%改善する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:28:09 GMT)
SD-VLM: Spatial Measuring and Understanding with Depth-Encoded Vision-Language Models [75.6] 視覚言語モデル(VLM)は2次元意味的視覚的理解において優れているが、3次元空間的関係について定量的に推論する能力はいまだ未解明のままである。
VLMの基本空間知覚能力を大幅に向上させる新しいフレームワークであるSD-VLMを提案する。
我々はSD-VLMを訓練した。これは強力な一般化VLMであり、より優れた空間的測定と理解能力を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:08:12 GMT)
Accelerated characterization of two-level systems in superconducting qubits via machine learning [74.0] 本稿では,2レベルシステム(TLS)パラメーターを抽出するためのデータ駆動型アプローチを提案する。
カスタム畳み込みニューラルネットワークモデル(CNN)は、フォーム形式で提示された分光データから、$omega_TLS$, $g$, $T_TLS, 1$と$Tphi_TLS, 2$を同時に予測することができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:55:52 GMT)
A Generative Framework for Personalized Sticker Retrieval [73.6] 我々はパーソナライズされたステッカー検索のための新しい生成フレームワークであるPEARLを提案する。
i) ユーザ固有のステッカー嗜好を符号化するために,識別的ユーザ表現を学習するための表現学習モデルを設計し, (ii) ユーザのクエリ意図に合致したステッカーを生成するために, 新たな意図認識学習目標を提案する。
オフライン評価とオンラインテストの両方による実証的な結果は、PEARLが最先端の手法を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:11:44 GMT)
Emergent 3D Correspondence from Neural Shape Representation [72.8] 階層型ニューラルセマンティック表現(HNSR)を設計し,高次構造と多分解能局所幾何学的特徴を捉える。
第2に,グローバルなセマンティック特徴を用いた粗いセマンティック対応を確立する,プログレッシブなグローバル-ローカルマッチング戦略を設計する。
第3に,本フレームワークはトレーニングフリーで,様々なトレーニング済みの3D生成バックボーンと広範囲に互換性があり,多様な形状カテゴリにまたがる強力な一般化が示されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:23:07 GMT)
All-in-one: Understanding and Generation in Multimodal Reasoning with the MAIA Benchmark [70.9] MAIAはビデオにおける視覚言語モデルの推論能力の詳細な調査のためのベンチマークである。
視覚入力の役割を強調することによって、言語と視覚関係を歪めようとする12の推論カテゴリを考察する。
MAIAは、そのデザイン、推論カテゴリ、使用するメトリクス、およびビデオの言語と文化に関して、他の利用可能なビデオベンチマークとは異なる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:22:14 GMT)
TempSamp-R1: Effective Temporal Sampling with Reinforcement Fine-Tuning for Video LLMs [67.6] 本稿では,マルチモーダルな大規模言語モデル(MLLM)をビデオ時間的グラウンド処理に適応させることの有効性向上を目的とした,新しい強化微調整フレームワークであるTempSamp-R1を紹介する。
我々は、TempSamp-R1がGRPOベースのベースラインより優れており、ベンチマークデータセット上で新しい最先端のパフォーマンスを確立していることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:30:15 GMT)
VStyle: A Benchmark for Voice Style Adaptation with Spoken Instructions [66.9] 音声理解と生成のための統一パラダイムとして、音声言語モデル(SLM)が登場した。
音声スタイル適応(VSA)は,SLMが話し方を変更することができるかどうかを調べる新しいタスクである。
音響属性,自然言語命令,ロールプレイ,暗黙の共感の4つのカテゴリを網羅したベンチマークであるVStyleを提案する。
また,Large Audio Language Model as a Judge (LALM as a Judge) フレームワークを導入し,文章の忠実性,スタイルの忠実性,自然性に沿って出力を段階的に評価する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:40:04 GMT)
Mitigating Forgetting in LLM Fine-Tuning via Low-Perplexity Token Learning [65.2] LLM生成データによる微調整により,目標タスクの性能が向上し,非目標タスクの劣化が低減されることを示す。
微調整後のLSMにおける破滅的忘れを緩和するために、トークンの難易度低減に基づく経験的説明を提供する最初の研究である。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 01:39:13 GMT)
Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization [65.1] 既存の選好アライメント手法は、モデル応答と人間の選好の整合性に重点を置いている。
改良されたモダリティアライメントを実現するエンティティ中心型マルチモーダル参照最適化(EMPO)を提案する。
EMPOは、Object-HalBenchで85.9%、MM-HalBenchで49.8%の幻覚率を減少させる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:12:18 GMT)
D-REX: A Benchmark for Detecting Deceptive Reasoning in Large Language Models [62.8] Deceptive Reasoning Exposure Suite (D-REX)は、モデルの内部推論プロセスと最終的な出力との相違を評価するために設計された、新しいデータセットである。
D-REXの各サンプルには、敵システムプロンプト、エンドユーザーのテストクエリ、モデルの一見無害な応答、そして重要なことに、モデルの内部チェーンが含まれている。
我々は、D-REXが既存のモデルと安全メカニズムに重大な課題をもたらすことを実証した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:59:40 GMT)
Diversity-Guided MLP Reduction for Efficient Large Vision Transformers [62.3] トランスフォーマーモデルは優れたスケーリング特性を実現し、モデルキャパシティの増大により性能が向上する。
大規模モデルパラメータは、計算とメモリの大幅なコストにつながる。
そこで本稿では,大規模な視覚変換器のパラメータを著しく削減するDGMR法を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:23:14 GMT)
OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System [61.1] OnePieceは、LLMスタイルのコンテキストエンジニアリングと推論を、検索モデルとランキングモデルの両方にシームレスに統合する統合フレームワークである。
OnePieceは、Shopeeの主要なパーソナライズされた検索シナリオにデプロイされ、さまざまな主要なビジネス指標で一貫したオンラインゲインを実現している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:59:07 GMT)
VideoArtGS: Building Digital Twins of Articulated Objects from Monocular Video [60.6] モノクロビデオから音声化されたオブジェクトのデジタルツインを構築することは、コンピュータビジョンにおいて重要な課題である。
本稿では,モノクロ映像から高忠実度デジタル双対を再構成する新しい手法であるVideoArtGSを紹介する。
VideoArtGSは、調音およびメッシュ再構成における最先端性能を示し、既存の方法に比べて約2桁の再現誤差を低減している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:52:02 GMT)
The Illusion of Readiness: Stress Testing Large Frontier Models on Multimodal Medical Benchmarks [57.5] GPT-5のような大型フロンティアモデルは、医学ベンチマークでトップスコアを獲得した。
しかし、ストレステストは別の話をします。
これらのベンチマークは、今日のベンチマークが医学的理解よりもテストのトリックにどのように報いるかを公開しています。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:48:05 GMT)
Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models [57.5] 拡散大言語モデル (dLLMs) は反復的 denoising を通じてテキストを生成する。
現在のデコード戦略は、最終的な出力に有利なリッチな中間予測を捨てている。
時間的整合性を利用する2つの相補的手法を導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:56:08 GMT)
Improving Large Language Models Function Calling and Interpretability via Guided-Structured Templates [56.7] 大規模言語モデル(LLM)は強力な推論とツール使用能力を示している。
LLMは、誤ったパラメータ化、悪いツールの選択、ユーザーの意図の誤解釈によって、現実世界のツールインタラクションで失敗することが多い。
我々は、構造化推論テンプレートを利用して、関数呼び出しを生成するためのより故意なステップバイステップ命令を通してLCMをガイドするカリキュラムに着想を得たフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:55:14 GMT)
Parallel Simulation for Log-concave Sampling and Score-based Diffusion Models [55.1] 本稿では,次元$d$の適応的複雑性依存性を改善する並列サンプリング手法を提案する。
我々の手法は科学計算による並列シミュレーション技術に基づいている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:12:23 GMT)
StableGuard: Towards Unified Copyright Protection and Tamper Localization in Latent Diffusion Models [55.1] 拡散生成プロセスにバイナリ透かしをシームレスに統合する新しいフレームワークを提案する。
画像の忠実さ、透かしの検証、ローカライゼーションの改ざんにおいて、StableGuardは一貫して最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:35:19 GMT)
Disambiguation in Conversational Question Answering in the Era of LLMs and Agents: A Survey [54.9] 自然言語処理(NLP)におけるあいまいさは依然として根本的な課題である
LLM(Large Language Models)の出現により、あいまいさに対処することがさらに重要になった。
本稿では,言語駆動システムにおけるあいまいさの定義,形態,含意について考察する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:36:48 GMT)
AI Pangaea: Unifying Intelligence Islands for Adapting Myriad Tasks [54.9] 我々は、地質学的パンガエアに類する最初のAI超大陸パンガエアを提案する。
Pangoaは任意のデータを統一されたフォーマットにエンコードし、さまざまなモダリティにわたる296データセットの事前トレーニングを通じて普遍的な知識を蓄積する。
45の一般的なタスクと15の科学的タスクにまたがって、幅広い科学的課題を包含する顕著な一般化を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:54:58 GMT)
Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments [54.7] 大規模言語モデル(LLM)は、複雑な実施環境において、強力な計画と意思決定能力を示す。
LLMをベースとしたエージェントの早期退避行動を探究する第一歩を踏み出す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 01:20:02 GMT)
ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning [54.3] ReasonMedは、これまでで最大の医療推論データセットで、370万の高品質な例がある。
マルチエージェント生成、検証、改善プロセスを通じて構築される。
ReasonMedを用いて、簡潔な答えの要約と詳細なCoT推論を統合することで、最も堅牢な微調整結果が得られる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:50:32 GMT)
Is Pre-training Truly Better Than Meta-Learning? [54.2] 定型事前学習(PT)モデルと評価中の最終層の微調整は、標準的なメタ学習アルゴリズムよりも優れていると考えられている。
我々はこれらの主張を再評価し、多種多様なデータセットを詳細に検証した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:43:57 GMT)
Loss-Complexity Landscape and Model Structure Functions [53.9] 我々はコルモゴロフ構造関数 $h_x(alpha)$ を双対化するためのフレームワークを開発する。
情報理論構造と統計力学の数学的類似性を確立する。
構造関数と自由エネルギーの間のルジャンドル・フェンシェル双対性を明確に証明する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:47:52 GMT)
Achilles' Heel of Mamba: Essential difficulties of the Mamba architecture demonstrated by synthetic data [52.1] ステートスペースモデル(SSM)は、アテンションメカニズムに代わる有望な代替手段として登場した。
本研究では,マンバ固有の制約を明らかにするために,慎重に設計された合成タスクを用いる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:38:55 GMT)
VoxGuard: Evaluating User and Attribute Privacy in Speech via Membership Inference Attacks [51.7] 差分プライバシとメンバシップ推論に基づくフレームワークであるVoxGuardを紹介した。
属性については, 匿名化後も, 性別やアクセントをほぼ完全精度で再現できることが示唆された。
以上の結果から,EERはリークを著しく過小評価し,低FPR評価の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:57:48 GMT)
Bayesian Algorithms for Adversarial Online Learning: from Finite to Infinite Action Spaces [51.5] オンライン学習のためのフォーム・トンプソン・サンプリングをフルフィードバックで開発する。
我々は、後悔の分解を、学習者が先入観を期待したことを後悔させ、また、過度な後悔と呼ぶ先延ばし的な用語を示します。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:24:25 GMT)
A Rigorous Behavior Assessment of CNNs Using a Data-Domain Sampling Regime [50.2] CNNの知覚行動の定量化のためのデータ領域サンプリング方式を提案する。
我々は、800のCNNモデルから1600万の試行と、113人の被験者から6,825の試行を分析した。
CNNは人間よりも優れており、そのバイアスは単にトレーニングとテストの距離に依存する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:18:37 GMT)
Confidence-gated training for efficient early-exit neural networks [49.8] 初期段階のニューラルネットワークは、中間層での確実な予測を可能にすることにより、推論コストを低減する。
我々は,前回の出口が故障した場合のみ,より深い出口からの勾配を条件的に伝播させるパラダイムである信頼性訓練(CGT)を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:18:21 GMT)
LIMI: Less is More for Agency [49.6] LIMI(Less Is More for Intelligent Agency)は、機関が根本的に異なる開発原則に従うことを示す。
高度なエージェント・インテリジェンスは、最小でも戦略的にキュレートされた自律行動のデモンストレーションから生まれる可能性がある。
マシンの自律性はデータの豊富さではなく、高品質なエージェント実証の戦略的キュレーションから生まれる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 10:59:32 GMT)
Measuring Scalar Constructs in Social Science with LLMs [48.9] 大規模言語モデルにおけるスカラー構造の測定手法の評価を行った。
LLMにスコアを直接出力させるよりも、ペアワイズ比較の方が優れた測定結果が得られることが分かりました。
訓練ペアを1,000個も持たない小型モデルは、誘導LDMの性能にマッチまたは超えることができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:47:45 GMT)
DragOSM: Extract Building Roofs and Footprints from Aerial Images by Aligning Historical Labels [48.7] Drag OpenStreetMap Labels (DragOSM) を提案する。
DragOSMはラベルアライメントを対話的な復調プロセスとして定式化し、位置差をガウス分布としてモデル化する。
我々は,OpenStreetMapを併用した179,265の建物と,41都市5,473枚のアノテーションを手作業で修正した,OSM (ReBO) の修復建物に関する新しいデータセットを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:10:13 GMT)
Language Models as Causal Effect Generators [48.7] シーケンス駆動型構造因果モデル(SD-SCM)を提案する。
SD-SCMは、所望の因果構造に応じて観察的、介入的、および反ファクト的分布からのサンプリングを可能にする。
本稿では, 因果推論のための新しいタイプのベンチマークを提案し, 個別レベルの反事実データを生成し, 治療効果の評価を行う。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:11:32 GMT)
ReDepress: A Cognitive Framework for Detecting Depression Relapse from Social Media [48.6] ReDepressは、リラプスに焦点を当てた最初の臨床的に検証されたソーシャルメディアデータセットである。
我々の枠組みはうつ病の認知理論に基づいており、注意バイアス、解釈バイアス、記憶バイアス、反省などの構造を取り入れている。
本研究は, 実世界のテキストデータにおける心理学的理論を検証し, 早期再発検出のための認知インフォームド・コンピューティング手法の可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:33:59 GMT)
SafeEraser: Enhancing Safety in Multimodal Large Language Models through Multimodal Machine Unlearning [48.4] MLLM(Multimodal Large Language Models)のための安全アンラーニングベンチマークであるSAFEERASERを提案する。
我々は2つの観点から非学習手法を総合的に評価する。
実験により、PD損失と既存の未学習手法を組み合わせることで、過剰な鍛造を効果的に防止できることが示された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:24:32 GMT)
MS-GS: Multi-Appearance Sparse-View 3D Gaussian Splatting in the Wild [47.5] 野生の写真コレクションは、しばしば限られた量の画像を含んでおり、複数の外観を示す。
3DGS を用いたスパースビューシナリオにおけるマルチアジュアンス機能を備えた新しいフレームワーク MS-GS を提案する。
我々は,MS-GSが様々な難解な視界とマルチアジュアンス条件下でレンダリングを実現することを実証した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:34:24 GMT)
Turning Hearsay into Discovery: Industrial 3D Printer Side Channel Information Translated to Stealing the Object Design [46.7] 業界グレードの3Dプリンタにとって、サイドチャネル攻撃が深刻な脅威であることを初めて示す。
収集した電力側チャネルデータのみから3Dプリントモデルを再構築する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:46:21 GMT)
The Good, the Bad and the Constructive: Automatically Measuring Peer Review's Utility for Authors [46.0] 我々は、著者のユーティリティを駆動するレビューコメントの4つの重要な側面を識別する:アクションビリティ、グラウンディングと特異性、検証可能性、ヘルプフルネス。
人間のラベル付きレビューコメント1,430件を収集し、トレーニング目的のために10万件のラベル付きコメントを合成してデータをスケールします。
これらの側面に対するレビューコメントの評価と合理性を生成するための微調整モデルをベンチマークする。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:57:11 GMT)
Representative Action Selection for Large Action Space Meta-Bandits [45.8] バンドイットの族が共有する大きなアクション空間からサブセットを選択する問題について検討する。
我々は、同様の行動がガウス過程によってモデル化された関連する報酬を持つ傾向があると仮定する。
代表サブセットを選択するための簡単なepsilon-netアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:55:39 GMT)
Variation in Verification: Understanding Verification Dynamics in Large Language Models [43.8] 本稿では、連鎖推論を生成して検証を行い、次いで二項判定を行う生成検証器について検討する。
実験の結果,有効性に関する3つの重要な知見が得られた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:36:56 GMT)
How Is LLM Reasoning Distracted by Irrelevant Context? An Analysis Using a Controlled Benchmark [43.8] 分散文脈をもつ小学校数学は、体系的に制御された文脈 (IC) に対するLarge Language Models (LLM) 推論を評価するためのベンチマークである。
実験の結果,LLMはICに非常に敏感であり,推理経路の選択と算術精度の両方に影響を及ぼすことがわかった。
本稿では,プロセス報酬モデルを用いて,配当条件下でのロバスト性を高めるステップワイズツリー探索を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:41:27 GMT)
LingoQ: Bridging the Gap between ESL Learning and Work through AI-Generated Work-Related Quizzes [43.6] 我々はLingoQについて紹介する。LingoQはAIを利用したシステムで、作業中にLLMクエリから生成されたクイズを使って英語を実践することができる。
28名のESL労働者を対象に,LingoQを評価するために3週間の展開調査を行った。
この積極的関与は自己効力を高め、初心者や中間学習者にとっての学習力の向上につながった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:12:10 GMT)
Multi-Worker Selection based Distributed Swarm Learning for Edge IoT with Non-i.i.d. Data [43.3] 非独立で同一に分散した(非i.d.)データは、マルチアクセスエッジコンピューティングにおいて大きな課題となる。
本稿では、まず、DSLフレームワーク下での非i.d.データセットの影響を測定することによって、データの異質性について検討する。
これにより、分散異種データを効果的に扱うM-と呼ばれるDSLの新しいマルチワーカー選択設計がモチベーションとなる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:47:44 GMT)
Towards Sample-Efficiency and Generalization of Transfer and Inverse Reinforcement Learning: A Comprehensive Literature Review [43.3] 本稿では,転送および逆強化学習(T-IRL)によるRLアルゴリズムのサンプル効率と一般化を実現するための総合的なレビューを行う。
以上の結果から,最近の研究成果の大部分は,人間のループとシム・トゥ・リアル戦略を活用することで,上記の課題に対処していることが示唆された。
IRL構造の下では、経験の少ない移行と、そのようなフレームワークのマルチエージェントおよびマルチインテンション問題への拡張を必要とするトレーニングスキームが近年研究者の優先事項となっている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:47:19 GMT)
Auto-Search and Refinement: An Automated Framework for Gender Bias Mitigation in Large Language Models [43.2] 巨大なテキストコーパス上でのLLM(Pre-training large language model)は、自然言語処理能力を向上するが、社会的バイアス、特に性別バイアスを符号化するリスクがある。
我々は、Fairwordsを適応的に生成するためのパラダイムを利用する自動化およびモデルに依存しないフレームワークである$textitFaIRMaker$を提案する。
実験によると、$textitFaIRMaker$はFairwordsを自動的に検索し、動的に洗練し、タスクの整合性を維持しながら、事実上性バイアスを緩和する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:13:55 GMT)
Large-Scale, Longitudinal Study of Large Language Models During the 2024 US Election Season [43.1] 2024年アメリカ合衆国大統領選挙は、大きな言語モデル(LLM)が普及して以来、アメリカ合衆国で最初の主要大会である。
この瞬間は、LLMが情報エコシステムをどう形成し、政治談話に影響を与えるかという緊急の疑問を提起する。
我々は,2024年7月から11月にかけて,ほぼ毎日のケイデンスに関する12,000以上の質問を構造化された調査を用いて,12種類のモデルについて大規模な縦断調査を行った。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:04:19 GMT)
LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via a Hybrid Architecture [42.1] LongLLaVAは、高いスループットと低メモリ消費を維持しながら、様々なベンチマークで競合する結果を達成する。
とくに、A100 80GBのGPUで1000近い画像を処理でき、多様なマルチモーダルアプリケーションの可能性を強調している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:16:45 GMT)
LRQ-DiT: Log-Rotation Post-Training Quantization of Diffusion Transformers for Image and Video Generation [41.7] Diffusion Transformer (DiTs) は、テキスト・ツー・イメージとテキスト・ツー・ビデオ生成において、優れたパフォーマンスを実現している。
DiTsの高計算コストと大きなパラメータサイズは、リソース制約のあるシナリオでの利用に重大な課題をもたらす。
本稿では,映像・映像生成のための学習後量子化フレームワークLRQ-DiTを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:36:16 GMT)
Large Language Models Do Multi-Label Classification Differently [41.6] 実世界の環境では多言語分類が一般的であるが、この設定におけるLarge Language Models (LLMs) の振る舞いは検討されている。
自己回帰型LLMは,主観的タスクに着目し,マルチラベル分類を行うかを検討する。
第1ラベルの初期確率分布は最終的な出力を反映しないことが多い。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:30:41 GMT)
SongPrep: A Preprocessing Framework and End-to-end Model for Full-song Structure Parsing and Lyrics Transcription [41.5] SongPrepは、音楽データに特化した自動前処理パイプラインである。
SongPrepE2Eは、事前訓練された言語モデルに基づくエンドツーエンドの歌詞認識モデルである。
SongPrepE2Eは、曲全体のコンテキストと事前訓練された意味知識を活用することで、提案したSSLD-200データセット上で、低ダイアリゼーション誤り率(DER)とワード誤り率(WER)を達成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:01:41 GMT)
Gödel Test: Can Large Language Models Solve Easy Conjectures? [40.9] 我々はG"odel Test"を提案し、モデルが非常に単純で未解決な予想に対して正しい証明を生成できるかどうかを評価する。
アルゴリズム最適化における 5 つの予想に対する GPT-5 の性能について検討する。
GPT-5は、最終的にG"odel Test"を通過させるフロンティアモデルに向けた初期のステップを表す可能性がある。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:11:40 GMT)
Locally minimax optimal confidence sets for the best model [40.6] この論文は基本的な推論問題に取り組む:$P$ over $mathbbRd$ が未知の平均$boldsymbolmu$ である場合、$boldsymbolmu$ の最小成分に対応する指数に対する信頼セットを形成する必要がある。
我々は$d$が$n$でスケールするか、および$boldsymbolmu$の任意の関係によらず、妥当性を維持する「次元に依存しない」テストを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 01:43:18 GMT)
Privacy in Action: Towards Realistic Privacy Mitigation and Evaluation for LLM-Powered Agents [40.4] モデルに依存しないコンテキスト整合性に基づく緩和アプローチであるPrivacyCheckerを提案する。
静的ベンチマークを動的MPPとA2A環境に変換するPrivacyLens-Liveも導入しています。
私たちのデータとコードはhttps://aka.ms/privacy_in_action.orgで公開されます。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:19:06 GMT)
Prompts as Software Engineering Artifacts: A Research Agenda and Preliminary Findings [39.4] この研究プログラムは、ソフトウェア工学における現在の急進的な実践、課題、および影響要因を特徴づける。
我々は6カ国から74人のソフトウェア専門家を対象に,現在の迅速な実践と課題について調査を行った。
プロンプトは、試行錯誤によって洗練され、滅多に再利用されず、標準化されたプラクティスよりも個々の実践者が形作ることが多い。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:08:29 GMT)
ComposeMe: Attribute-Specific Image Prompts for Controllable Human Image Generation [39.3] 本稿では,属性特異的な画像プロンプトのための新しいパラダイムを紹介し,人間の外見の個々の側面の生成を導くために,異なる参照画像群を用いる。
提案手法は,これらの入力を属性固有のトークンにエンコードし,事前学習したテキスト・画像拡散モデルに注入する。
これにより、複数の視覚的要因に対する構成的および非絡み合いの制御が可能となり、1つの画像内の複数の人にわたっても可能となる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:59:30 GMT)
Accurate and Efficient Low-Rank Model Merging in Core Space [39.1] コアスペースのマージフレームワークは、共通アライメントベースでLoRA対応モデルのマージを可能にする。
Core Spaceは既存のマージ技術を大幅に改善し、ビジョンと言語タスクの両面で最先端の結果が得られます。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:48:15 GMT)
Does Audio Matter for Modern Video-LLMs and Their Benchmarks? [39.0] Video-LLMとそれを認証するベンチマークについて、実際にどのくらいのオーディオが重要か尋ねる。
広く使われているスイートを分析し、多くのアイテムが単一のフレームから解決可能であることを観察する。
最近のビデオベンチマークではオーディオの利得は最小限だが、キュレートされたオーディオに敏感なサブセットでは決定的だ。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:28:54 GMT)
GEM-T: Generative Tabular Data via Fitting Moments [38.6] GEM-Tと呼ばれるMaxEntは、トレーニングデータの列間のn階のインタラクションをキャプチャする。
広範なテストでは、GEM-Tはディープニューラルネットワークアプローチにマッチするか、超える。
GEM-Tは、構造化データのための軽量高性能生成モデルとして有望な方向を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:16:02 GMT)
PsyScam: A Benchmark for Psychological Techniques in Real-World Scams [38.6] PsyScamは、現実世界の詐欺報告で使用される心理的テクニックを体系的に捉えるために設計されたベンチマークである。
PsyScamは、実世界のスキャマーが使用するPTに基づいて、スキャマーコンテンツの検出と生成において、既存のモデルに重大な課題をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:55:41 GMT)
Make Every Letter Count: Building Dialect Variation Dictionaries from Monolingual Corpora [38.5] 我々はバイエルン語をケーススタディとして用い,Large Language Models(LLMs)の語彙的方言理解能力について検討する。
単言語データのみから方言変化辞書を生成するための新しいアノテーションフレームワークであるDiaLemmaを使用している。
我々は、9つの最先端のLLMがバイエルン語を、方言の翻訳、動詞の変種、あるいは与えられたドイツの補題の無関係な形式として、いかにうまく判断できるかを評価する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:49:08 GMT)
MAKIEval: A Multilingual Automatic WiKidata-based Framework for Cultural Awareness Evaluation for LLMs [38.0] MAKIEvalは、大規模言語モデルにおける文化的認識を評価するための自動多言語フレームワークである。
モデル出力における文化的実体を自動的に識別し、構造化された知識にリンクする。
オープンソースのシステムとプロプライエタリシステムの両方を対象とする,世界のさまざまな場所で開発された7つのLLMを評価した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:38:32 GMT)
Agentic DDQN-Based Scheduling for Licensed and Unlicensed Band Allocation in Sidelink Networks [37.9] ニューラジオ(NR)サイドリンク(SL)ネットワークにおけるライセンス/ライセンスバンド割り当てのためのエージェントダブルディープQネットワーク(DDQN)スケジューラを提案する。
キャパシティを意識したQoS(Quality of Service)制約付き報酬は、静的なしきい値付けよりも目標指向のスケジューリングに適合する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:15:41 GMT)
EngiBench: A Benchmark for Evaluating Large Language Models on Engineering Problem Solving [37.7] 本稿では,工学的問題を解決する上で,大規模言語モデル(LLM)を評価する階層的なベンチマークであるEngiBenchを紹介する。
難易度(基礎知識検索、多段階の文脈推論、オープンエンドモデリング)の3段階に及び、多様なエンジニアリングサブフィールドをカバーする。
モデルはタスクが難しくなるにつれて苦労するし、問題がわずかに変化してもパフォーマンスが悪くなる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:20:27 GMT)
Training-free Truthfulness Detection via Value Vectors in LLMs [37.6] 大規模な言語モデルは、しばしば事実的に誤ったアウトプットを生成し、コンテンツの真偽を検出するための努力を動機付けている。
最近のトレーニングフリー手法であるNoVoは、モデル自体から統計パターンを活用することでこの問題に対処している。
モジュール内のある値ベクトルは真性のない統計パターンを示す。
本稿では,これらの値ベクトルを活用して内容の真偽を検出する,シンプルかつ解釈可能なトレーニング手法であるTruthVを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:54:29 GMT)
Through the Lens of Human-Human Collaboration: A Configurable Research Platform for Exploring Human-Agent Collaboration [36.5] 大規模言語モデル(LLM)エージェントは、人間とLLMエージェントのコラボレーションの新たな機会を開く。
HCI と CSCW で確立されたコンピュータによるコラボレーションの原則が、人間が LLM エージェントと協力する場合、継続、変更、失敗するかどうかは不明である。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:47:08 GMT)
Adaptive Fast-and-Slow Visual Program Reasoning for Long-Form VideoQA [36.1] 本稿では,適応型視覚プログラム推論手法であるFSVisPRフレームワークを紹介する。
単純なクエリの高速推論と難しいクエリの遅い推論のバランスを取る。
実験の結果,FS-VisPRは視覚プログラムの効率性と信頼性を両立させることがわかった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:06:17 GMT)
GALLa: Graph Aligned Large Language Models for Improved Source Code Understanding [35.5] 最近のコード言語モデルは数十億のパラメータに拡張されているが、ソースコードはテキストトークンとしてのみモデル化されている。
GALLa - Graph Aligned Large Language Modelsで両世界のベストを尽くします。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:36:18 GMT)
AIMMerging: Adaptive Iterative Model Merging Using Training Trajectories for Language Model Continual Learning [35.2] 本稿では,モデルのトレーニング状況を監視する新しいCLフレームワークであるAdaptive Iterative Model Merging(AimMerging)を紹介する。
実験によると、AimMergingは既存の最先端メソッドよりも大幅にパフォーマンスが向上している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 04:19:29 GMT)
Flavors of Margin: Implicit Bias of Steepest Descent in Homogeneous Neural Networks [35.2] 深層ニューラルネットワークにおける無限小学習率を持つ急勾配降下アルゴリズムの一般家系の暗黙バイアスについて検討した。
我々は、様々な急勾配アルゴリズムで最適化されたニューラルネットワークの軌道を実験的に拡大し、一般的な適応手法の暗黙のバイアスとのつながりを強調した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:31:54 GMT)
Development and validation of an AI foundation model for endoscopic diagnosis of esophagogastric junction adenocarcinoma: a cohort and deep learning study [33.8] 食道接合腺癌 (EGJA) の早期発見は, 予後改善に重要であるが, 術者に依存している。
本稿では,内視鏡画像を用いたEGJAのスクリーニングとステージング診断のための人工知能基盤モデルの開発を初めて試みる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:03:40 GMT)
UIPro: Unleashing Superior Interaction Capability For GUI Agents [33.8] 人間のようなグラフィカルユーザインタフェース(GUI)を知覚し、操作する自律エージェントの構築は、人工知能の分野における長年のビジョンである。
視覚言語モデル(VLM)のマルチモーダル理解能力に基づくGUIエージェントの開発が試みられている。
本稿では,多プラットフォーム・マルチタスクGUIインタラクションデータを用いた新しい汎用GUIエージェントであるtextUIProを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 03:04:53 GMT)
Pseudogap in a Fermi-Hubbard quantum simulator [33.7] ドープモット絶縁体を理解することは凝縮物質物理学の基本的な目標であり、超伝導体や他の量子材料に関係している。
ここでは、冷原子量子シミュレータで熱力学および分光計測を行うことにより、ハバードモデルにおける通常の金属と擬装金属の交叉を観察する。
本研究では,ハバードモデルにおける擬似ギャップ金属の存在を実験的に実証し,擬似ギャップ構造を部分的に特徴付けるとともに,今後の研究で探究できる擬似ギャップと電荷秩序の関係を示唆する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:55:08 GMT)
RealBench: A Chinese Multi-image Understanding Benchmark Close to Real-world Scenarios [33.4] 中国初のマルチモーダルマルチイメージデータセットであるRealBenchを紹介する。
RealBenchは、実際のユーザ生成コンテンツを組み込むことで、自分自身を差別化している。
データセットは、さまざまなシーン、画像解像度、画像構造をカバーしている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:14:31 GMT)
SATBench: Benchmarking LLMs' Logical Reasoning via Automated Puzzle Generation from SAT Formulas [33.3] 本稿では,大規模言語モデルの論理的推論能力を評価するベンチマークであるSATBenchを紹介する。
SATBenchの各インスタンスはSAT式から生成され、LLMを使用してパズルに変換される。
実験によると、最強のモデルであるo4-miniでさえ、ハードUNSAT問題において65.0%の精度しか達成していない。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:20:57 GMT)
EmbodiedSplat: Personalized Real-to-Sim-to-Real Navigation with Gaussian Splats from a Mobile Device [33.2] Embodied AIは主に、トレーニングと評価のシミュレーションに頼っている。
シン・トゥ・リアル・トランスファーは依然として大きな課題だ。
政策訓練をパーソナライズする新しいアプローチであるEmbodiedSplatを紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:22:31 GMT)
PEEK: Guiding and Minimal Image Representations for Zero-Shot Generalization of Robot Manipulation Policies [32.7] 本稿では,PEEK(Policy-Agnostic extract of Essential Keypoints)を提案する。
これらのアノテーションはロボットの観察に直接オーバーレイされるので、表現はポリシーに依存しず、アーキテクチャ全体にわたって転送可能である。
実世界の評価では、PEEKはゼロショットの一般化を継続的に強化し、シミュレーションでのみ訓練された3Dポリシーの41.4倍の現実世界の改善を達成している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:10:14 GMT)
ConfClip: Confidence-Weighted and Clipped Reward for Reinforcement Learning in LLMs [32.1] 強化学習(RL)は、大規模言語モデル(LLM)の標準化の標準パラダイムとなっている。
人間の学習から得られた観察から着想を得て、検証可能な結果とモデル自身の信頼度推定を統合するRL手法を導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:00:35 GMT)
On the Convergence of Muon and Beyond [31.9] Muon はニューラルネットワークの行列構造パラメーターにおいて顕著な成功を収めた。
理論と実効率の違いの間には、大きな理解ギャップが持続する。
この研究は、ムオン形式の最適性の最初の証明を提供し、イット収束に関する我々の発見を裏付けるものである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:30:34 GMT)
Efficient Quantum Protein Structure Prediction with Problem-Agnostic Ansatzes [31.8] 本稿では,問題に依存しないアンザッツを用いて,より効率的な量子タンパク質構造予測ワークフローを提案する。
アンザッツは、従来のコンピュータで効率的に計算できるエネルギーベースのコスト関数を最小限に抑えるために訓練されている。
最大26個のアミノ酸を持つタンパク質の集合に対して,ハードウェア効率の良いアンザッツをベンチマークし,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:00:07 GMT)
Unveiling m-Sharpness Through the Structure of Stochastic Gradient Noise [31.6] 摂動のマイクロバッチサイズが小さくなるにつれて, シャープネス重み付け(SAM)の性能が向上する, m-シャープネス(m-sharpness)と呼ばれる現象について検討する。
本研究により,摂動時に発生する雑音は本質的に変動に基づくシャープネス正則化効果を誘導することが明らかとなった。
並列化を保ちながらm-SAMの一般化の利点を模倣するシャープネス重み付きサンプリングを用いたReMotivated SAMを紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:40:42 GMT)
ComposableNav: Instruction-Following Navigation in Dynamic Environments via Composable Diffusion [31.3] ロボットが指示に従って動的環境をナビゲートできるようにするためのComposableNavを提案する。
ComposableNavは各プリミティブを別々に学習し、デプロイ時に並列に構成し、トレーニングで見えない新しい仕様の組み合わせを満たす。
ComposableNavは,多様な仕様と見えない仕様の組み合わせを満たす軌道を生成することで,ロボットが指示に従うことができることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:04:50 GMT)
Adaptive Kernel Design for Bayesian Optimization Is a Piece of CAKE with LLMs [31.3] 大規模言語モデル(LLM)を用いたBO強化のためのコンテキスト認識カーネル進化(CAKE)を提案する。
我々の新しいCAKEベースのBO法は、さまざまな現実世界のタスクで確立されたベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:39:12 GMT)
Cross-Attention is Half Explanation in Speech-to-Text Models [31.2] クロスアテンションはエンコーダ・デコーダアーキテクチャのコアメカニズムであり、音声テキスト処理(S2T)を含む多くの分野に普及している。
本分析では,単言語,多言語,単一タスク,マルチタスクのモデルを複数スケールで分析し,注意点が塩分濃度に基づく説明と強く一致していることを示す。
また、クロスアテンションは入力関係の約50%しか捕捉せず、最良の場合、デコーダがエンコーダの表現にどのように出席するかを部分的に反映している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:49:26 GMT)
Generating 360° Video is What You Need For a 3D Scene [31.1] 中間シーン表現として360degビデオを利用する実用的でスケーラブルなソリューションを提案する。
テキストプロンプトから3Dシーンを合成する生成パイプラインであるWorldPrompterを提案する。
WorldPrompterには条件付き360度パノラマビデオジェネレータが組み込まれており、仮想環境を歩いたり捉えたりする人をシミュレートする128フレームのビデオを生成することができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:49:50 GMT)
Walk and Read Less: Improving the Efficiency of Vision-and-Language Navigation via Tuning-Free Multimodal Token Pruning [30.5] トーケンプルーニングは、性能損失を最小限に抑えながら、効率をアピールするトレードオフを提供する。
本研究では,ナビゲーション固有の特徴を活かしたナビゲーション・アウェア・プルーニング(NAP)を提案する。
NAPは以前の作業よりも優れており、50%以上のFLOPSを節約しながら高い成功率を維持している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 01:18:13 GMT)
FoREST: Frame of Reference Evaluation in Spatial Reasoning Tasks [30.1] 大規模言語モデル(LLM)におけるFoR理解を評価するために,空間推論タスクにおける参照評価フレーム(FoREST)ベンチマークを導入する。
我々は,FoRESTを用いたテキスト・ツー・イメージモデルにおいて,FoRの理解とレイアウト生成を必要とする質問に対して,LLMを評価した。
その結果,様々なLLMにおけるFORクラス間での顕著な性能差が明らかとなり,テキスト・画像生成のための正確なレイアウトを生成する能力に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:43:04 GMT)
SimToken: A Simple Baseline for Referring Audio-Visual Segmentation [29.9] Referring Audio-Visualは、自然言語表現に基づくビデオ内の特定のオブジェクトのセグメンテーションを目的としている。
このタスクは、クロスモーダル推論ときめ細かいオブジェクトローカライゼーションにおいて重要な課題を提起する。
我々はSegment Anything Model(SAM)とMLLM(Multimodal large language model)を統合したSimTokenというフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:55:04 GMT)
Language Models Can Predict Their Own Behavior [29.6] 言語モデル(LM)は、アライメントトレーニングに従わないなど、特定の振る舞いを示すことができます。
入力トークンの内部表現だけで訓練されたプローブは、出力シーケンス全体にわたって幅広い結果の挙動を予測することができることを示す。
プローブ上に構築された早期警報システムは、脱獄を91%削減する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:41:38 GMT)
PRNU-Bench: A Novel Benchmark and Model for PRNU-Based Camera Identification [29.3] 本稿では,写真応答不均一性(PRNU)推定によるカメラ識別のための新しいベンチマークを提案する。
ベンチマークは120台以上のカメラで撮影された13K枚の写真で構成され、トレーニングとテストの写真を異なるシナリオで撮影する。
本稿では,PRNU信号を推定するデノナイズオートエンコーダと,カメラデバイスの1:N検証が可能な畳み込みネットワークを備えたハイブリッドアーキテクチャを用いたPRNUベースのカメラ識別モデルを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:07:15 GMT)
NileChat: Towards Linguistically Diverse and Culturally Aware LLMs for Local Communities [28.9] LLM(Large Language Models)の言語能力を低リソース言語に拡張することは、重要な研究分野である。
現在の研究方向は、英語コーパスの翻訳によって生成された合成データに依存している。
本研究は,特定のコミュニティに適した,合成および検索に基づく事前学習データを作成する手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:02:16 GMT)
Serendipitous Recommendation with Multimodal LLM [28.5] MLLM(Multimodal Large Language Models)は、セレンディピティーに必要な世界的知識とマルチモーダル理解を持つ。
本稿では,MLLMが従来の推薦モデルに対して高レベルなガイダンスを提供する,新しい階層型フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:48:24 GMT)
Med-PRM: Medical Reasoning Models with Stepwise, Guideline-verified Process Rewards [28.4] Med-PRMは、確立した医療知識ベースに対する各推論ステップを検証するためのプロセス報酬モデリングフレームワークである。
Med-PRMは最先端のパフォーマンスを実現し、ベースモデルの性能を最大13.50%向上させた。
我々は、Med-PRMの汎用性を、Meerkatのような強力なポリシーモデルとプラグイン・アンド・プレイ方式で統合することで示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:04:42 GMT)
HyperTTA: Test-Time Adaptation for Hyperspectral Image Classification under Distribution Shifts [28.2] HyperTTA (Test-Time Adaptable Transformer for Hyperspectral Degradation) は、様々な劣化条件下でモデルロバスト性を高める統一フレームワークである。
テスト時の適応戦略である、信頼を意識したエントロピー最小化LayerNorm Adapter (CELA)は、LayerNorm層のアフィンパラメータのみを動的に更新する。
2つのベンチマークデータセットの実験では、HyperTTAがさまざまな劣化シナリオで最先端のベースラインを上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:47:26 GMT)
OmniInsert: Mask-Free Video Insertion of Any Reference via Diffusion Transformer Models [27.8] 本研究では,マスクフリービデオ挿入の課題に焦点をあて,データ不足,主観的平衡,挿入調和という3つの課題を解決することを目的とする。
データ不足に対処するために、さまざまなクロスペアデータを自動的に構築する新しいデータパイプラインInsertPipeを提案する。
オムニインサート(OmniInsert)は、単体および複数被写体の両方からのマスフリービデオ挿入のための新しい統合フレームワークである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:35:55 GMT)
STRATA-TS: Selective Knowledge Transfer for Urban Time Series Forecasting with Retrieval-Guided Reasoning [27.8] STRATA-TSは、ドメイン適応検索と推論可能な大規模モデルを組み合わせることで、不足するデータレシエーションの予測を改善するフレームワークである。
効率的な配置を実現するため, 教師付き微調整により, 推論過程をコンパクトなオープンモデルに蒸留する。
シンガポール、ノッティンガム、グラスゴーの3つのパーキングアベイラビリティーデータセットの実験では、STRATA-TSは強い予測と転送ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:00:11 GMT)
Mitigating Strategy-Selection Bias in Reasoning for More Effective Test-Time Scaling [27.6] テストタイムスケーリング(TTS)は,多種多様な推論経路をサンプリング・集約することにより,大規模言語モデル(LLM)の性能を向上させることが示されている。
本稿では,テスト時間スケーリングの有効性を損なう場合の理論的解析について述べる。
この理論的な洞察に触発され、推論戦略の選択バイアスを軽減するために設計されたフレームワークであるTS-Uniformを導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:30:56 GMT)
"What is Different Between These Datasets?" A Framework for Explaining Data Distribution Shifts [27.6] 同じ領域の2つのデータセットは異なる分布を示す可能性がある。
本稿では,データセットを比較するための解釈可能な手法の汎用的フレームワークを提案する。
これらの手法は、動作可能で解釈可能な洞察を提供することによって既存の手法を補完する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:20:37 GMT)
Chat-CBM: Towards Interactive Concept Bottleneck Models with Frozen Large Language Models [27.6] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、まず人間の理解可能な概念のセットを予測し、それらをラベルにマッピングすることで、固有の解釈性を提供する。
Chat-CBMはスコアベースの分類器を言語ベースの分類器に置き換える。
Chat-CBMは、CBMの解釈可能性を維持しつつ、概念修正、概念の追加または削除、外部知識の取り込み、高レベルの推論ガイダンスなど、より豊かで直感的な介入を可能にしている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:48:04 GMT)
Fresh in memory: Training-order recency is linearly encoded in language model activations [27.4] 学習中に学習した情報に対して,言語モデルのアクティベーションが線形に符号化されることを示す。
その結果、6つのトレーニングデータセットに対応するテストサンプルの平均的なアクティベーションがトレーニング順序を符号化していることがわかった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:05:05 GMT)
RationAnomaly: Log Anomaly Detection with Rationality via Chain-of-Thought and Reinforcement Learning [27.2] RationAnomalyは、Chain-of-Thoughtファインチューニングと強化学習を相乗化することにより、ログの異常検出を強化する新しいフレームワークである。
コードとデータセットを含む、対応するリソースをリリースしました。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:54:39 GMT)
Extract and Diffuse: Latent Integration for Improved Diffusion-based Speech and Vocal Enhancement [27.1] 拡散に基づく生成モデルは、近年、発声と発声の強化において顕著な成果を上げている。
識別モデルによって生成される潜在表現を統合して音声と音声の強調を改善する新しいスコアベース拡散モデルであるEx-Diffを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:54:34 GMT)
LAWCAT: Efficient Distillation from Quadratic to Linear Attention with Convolution across Tokens for Long Context Modeling [27.0] 本稿では,事前学習した変圧器の性能を線形アテンションアーキテクチャに効率よく伝達する新しい線形化フレームワークを提案する。
LawCATは因果Conv1Dレイヤを統合し、局所的な依存性モデリングを強化し、標準化されたゲート線形アテンションを用いて、さまざまなコンテキストの長さにわたる一般化を改善する。
評価の結果,Mistral-7Bを1Kの配列で蒸留すると,パスキー検索精度が最大で22Kまで向上し,有効コンテキストウインドウが大幅に拡張された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:43:44 GMT)
NeuS-QA: Grounding Long-Form Video Understanding in Temporal Logic and Neuro-Symbolic Reasoning [25.1] LVQA(Long-Form Question Answering)は、従来の視覚的質問応答(VQA)を超えた課題を提起する
バニラはフレームを均一にサンプリングし、問題のあるVLMに供給し、重要なトークンオーバーヘッドを発生させる。
NeuS-QAは自然言語を形式的時間論理表現に変換し、フレームレベルの意味論的命題からビデオオートマトンを構築する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:15:13 GMT)
On the Suitability of Reinforcement Fine-Tuning to Visual Tasks [24.6] RFTをMLLMに適用し始めており、視覚的理解の能力を高めることを期待している。
本研究では,視覚的タスクに対するRFTの適性や限界を理解するために,実験的な分析と観察を通じて試みる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:02:57 GMT)
Diagnosing Model Editing via Knowledge Spectrum [24.5] 既存の編集手法はしばしば意図しない副作用を導入し、予測不可能な方法でモデル性能を劣化させる。
本稿では,その現実的な人気,モデルの既知性,および抽出質問の言語的構造に基づいて,知識を分類するための体系的枠組みを提案する。
本稿では,知識項目の難易度を補正する「知識診断フレームワーク」を導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:16:04 GMT)
Seeing is Believing? Mitigating OCR Hallucinations in Multimodal Large Language Models [24.4] 劣化文書理解におけるOCR幻覚評価のための最初のベンチマークであるKIE-HVQAを提案する。
このデータセットには、IDカードと請求書にまたがるテストサンプルが含まれており、OCR信頼性のための実世界の劣化をシミュレートしている。
Qwen2.5-VL 実験により,GPT-4o に対して 7B-パラメータモデルでは幻覚のない精度が 22% 向上していることが示された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:48:45 GMT)
Uncertainty-Aware Information Pursuit for Interpretable and Reliable Medical Image Analysis [24.3] 本稿では,医療画像の解釈可能かつ不確実性を考慮したフレームワークを提案する。
本稿では,EUAV-IPとIUAV-IPの2つの不確実性認識モデルを紹介し,不確実性推定をV-IPクエリプロセスに統合する。
我々のアプローチでは、モデルが個々のサンプルに合わせた概念のサブセットに基づいて、信頼できる決定をすることができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:35:43 GMT)
Rationale-Guided Retrieval Augmented Generation for Medical Question Answering [24.1] 大規模言語モデル(LLM)は、バイオメディシンの応用に大きな可能性を秘めている。
RAG$2$は、医学的文脈におけるRAGの信頼性を高めるための新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:11:26 GMT)
ProDyG: Progressive Dynamic Scene Reconstruction via Gaussian Splatting from Monocular Videos [24.0] 既存のSLAMメソッドは、通常、動的部分を取り除くか、RGB-D入力を必要とする。
SLAMシステム内の静的部分と動的部分を切り離すことにより,オンライン動的シーン再構築を実現する。
本手法は,オフライン手法と競合する新しいビューレンダリングを実現し,最先端の動的SLAM手法によるオンパートラッキングを実現する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:58:11 GMT)
CodeFuse-CR-Bench: A Comprehensiveness-aware Benchmark for End-to-End Code Review Evaluation in Python Projects [24.0] CodeFuse-CR-Benchは、リポジトリレベルのCR評価のための、最初の包括性対応ベンチマークである。
CodeFuse-CR-Benchは、9つのプルリクエスト(PR)問題ドメインをカバーする70のPythonプロジェクトから601の高品質なインスタンスで構成されている。
本稿では,この包括的CR課題に対して,最先端の大規模言語モデル(LLM)の大規模評価を行う。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:53:41 GMT)
FastNet: Improving the physical consistency of machine-learning weather prediction models through loss function design [23.8] 本研究では,グラフニューラルネットワーク(GNN)を用いたグローバル予測モデルであるFastNetを提案する。
本研究では, 代替損失関数の設計が予測の物理的リアリズム改善に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:21:29 GMT)
AutiHero: Leveraging Generative AI in Social Narratives to Engage Parents in Story-Driven Behavioral Guidance for Autistic Children [23.4] 我々は,行動指導のための生成型AIに基づく社会物語システムであるAutiHeroを紹介する。
AutiHeroは、自閉症児向けのパーソナライズされたストーリーを作成し、一緒に読むことを支援する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:23:10 GMT)
Simplified Longitudinal Retrieval Experiments: A Case Study on Query Expansion and Document Boosting [23.4] 縦断的検索実験のための ir_datasets のカスタム拡張を提案する。
この拡張により、長手検索実験の重要な側面を宣言的に記述することができる。
新しいir_datasets拡張に対して、LongEval 2024への申請を再実装しました。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:29:34 GMT)
Identifying birdsong syllables without labelled data [23.4] 鳥の鳴き声を音節列に分解する,教師なしのアルゴリズムを初めて構築する。
ベンガルのフィンチ曲のデータセットを用いて,人間のラベルに対する自動アノテーションを評価した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:54:37 GMT)
VIBE: Annotation-Free Video-to-Text Information Bottleneck Evaluation for TL;DR [23.1] 現在の視覚言語モデル(VLM)は冗長で冗長な出力を生成し、タスクのパフォーマンスを阻害する。
既存のビデオキャプション評価は、コストのかかる人間のアノテーションに依存し、下流タスクにおける要約の実用性を見落としている。
VIBEは2つのメトリクスを使ってVLM出力をスコア付けする。
VIBEは、ランダムにサンプリングされたVLM出力から、2つのスコアにランク付けして、効果的な人的意思決定を支援する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:11:46 GMT)
Memory-QA: Answering Recall Questions Based on Multimodal Memories [22.9] メモリQA(Memory-QA)は,従来記憶されていたマルチモーダルメモリからの視覚的コンテンツに関するリコール質問に応答する,新しい実世界のタスクである。
このタスクは、タスク指向メモリの作成、時間的および場所的情報のメモリ内で有効活用、複数のメモリを描画してリコール問題に答える能力など、ユニークな課題を提起する。
我々はPensieveという包括的パイプラインを提案し、メモリ固有の拡張、時間と位置を意識したマルチシグナル検索、マルチメモリQA微調整を統合した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:41:35 GMT)
Evaluating Multimodal Large Language Models with Daily Composite Tasks in Home Environments [22.8] 幼児期における日常活動に触発された複合作業のセットを設計する。
動的でシミュレーションされた家庭環境の中で、これらのタスクは3つの中核領域(オブジェクト理解、空間知性、社会活動)にまたがる。
我々は、これらのタスクにおいて17のプロプライエタリかつオープンソースのMLLMを評価し、その結果は3つの領域すべてで一貫してパフォーマンスが悪く、現在の能力と汎用インテリジェンス要件の間に大きなギャップがあることを示唆している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:17:26 GMT)
Diffusion Policies with Offline and Inverse Reinforcement Learning for Promoting Physical Activity in Older Adults Using Wearable Sensors [22.8] 実世界の臨床データを持つオフライン強化学習(RL)は、医療のためのAIにおいて注目を集めている。
オフライン逆強化学習(KANDI)のためのコルモゴロフ・アルノルドネットワークと拡散政策について紹介する。
本研究では,Physory-feedback Exercise Program (PEER) を用いた2本腕臨床試験において,ウェアラブル活動モニタリングデータを用いたKADIの評価を行った。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:36:34 GMT)
Stabilizer Rényi Entropy and its Transition in the Coupled Sachdev-Ye-Kitaev Model [21.1] 安定化器R'enyi Entropy(SRE)を用いた量子魔法の研究
熱力学量では検出できないSREの内在的な遷移を明らかにする。
熱力学限界における強相関フェルミオン系におけるSREの研究の道を開いた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:08:35 GMT)
Rethinking Pulmonary Embolism Segmentation: A Study of Current Approaches and Challenges with an Open Weight Model [21.0] 3Dモデルは、塞栓の形態的特徴から、この課題に特に適している。
CNNベースのモデルは一般的に、PEセグメンテーションにおけるVTベースのモデルよりも優れたパフォーマンスが得られる。
一方、タスクの複雑さと高品質なデータセットの不足のため、遠位塞栓は難しいままである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:34:30 GMT)
MEF: A Systematic Evaluation Framework for Text-to-Image Models [21.0] 現在の評価は、総合ランキングにELO、次元別スコアにMOSのいずれかに依存している。
我々は、T2Iモデルを評価するための体系的で実践的なアプローチであるマジック・アセスメント・フレームワーク(MEF)を紹介する。
評価フレームワークをリリースし,Magic-Bench-377を完全オープンソースにし,視覚生成モデルの評価研究を進めた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:32:42 GMT)
GuidedQuant: Large Language Model Quantization via Exploiting End Loss Guidance [20.9] トレーニング後の量子化は、大規模言語モデルのメモリと推論遅延を低減するための重要なテクニックである。
本稿では,エンドロスからの勾配情報を量子化対象に組み込む新しい量子化手法である GuidedQuant を提案する。
GuidedQuantは、ウェイトオンリーのスカラー、ウェイトオンリーのベクトル、ウェイト・アンド・アクティベーションの量子化にまたがる最先端の量子化手法の性能を一貫して向上させる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:14:50 GMT)
Multimodal Medical Image Classification via Synergistic Learning Pre-training [20.8] マルチモーダルな半教師付き医用画像分類のための新しいフレームワークを提案する。
1つのモダリティを他のモダリティの強化サンプルとして扱うことにより、自己教師付き学習事前訓練を実装した。
微調整の段階では、異なるエンコーダを設定し、元のモダリティから特徴を抽出する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:21:19 GMT)
When TableQA Meets Noise: A Dual Denoising Framework for Complex Questions and Large-scale Tables [20.3] EnoTabは、複雑な質問と大規模テーブルのための2つのデノベーションフレームワークである。
まず,質問を最小のセマンティック単位に分解することで,エビデンスに基づく質問記述を行う。
次に,明示的で透明なテーブルプルーニングパスを構成するEvidence Tree-Guided Table Denoisingを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:25:57 GMT)
See What I Mean? CUE: A Cognitive Model of Understanding Explanations [20.2] 本稿では,説明の認知的理解モデルを提案する。
調査では、視覚障害者のタスクパフォーマンスに匹敵するが、信頼性や努力は低いことがわかった。
我々は,(1)説明理解のための形式化された認知モデル,(2)人間中心の説明特性の総合的定義,(3)アクセシブルなユーザカスタマイズ型XAIを動機づけた実証的証拠を提示する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:44:58 GMT)
TASO: Task-Aligned Sparse Optimization for Parameter-Efficient Model Adaptation [19.9] LoRAは、その単純さと有効性から、パラメータ効率の高い微調整法として最も広く使われている。
多くの研究により、LoRAは、訓練可能なパラメータの数を増やすだけでなく、微調整の有効性を阻害する、かなりのパラメータ冗長性をもたらすことが示されている。
本稿では,事前訓練されたモデルの重みから重要情報を活用してLoRA冗長性を緩和する冗長化手法TASOを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:29:43 GMT)
BTL-UI: Blink-Think-Link Reasoning Model for GUI Agent [19.8] リンクシンクリンク(Blink-Think-Link)は、人間のGUIインタラクションのための脳に触発されたフレームワークである。
リンクシンクリンク(Blink-Think-Link)は、ユーザとグラフィカルインターフェースの間の人間の認知過程を模倣する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:37:02 GMT)
ChartHal: A Fine-grained Framework Evaluating Hallucination of Large Vision Language Models in Chart Understanding [19.8] グラフ理解における幻覚のシナリオのきめ細かい分類を特徴とするベンチマークであるChartHalを提示する。
現状のLVLMはChartHalに対する深刻な幻覚に悩まされている。
チャートから欠落または矛盾した情報に関する質問は、特に幻覚を引き起こす可能性がある。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:15:55 GMT)
A Lightweight Authentication and Key Agreement Protocol Design for FANET [19.8] 低高度インテリジェントネットワークの進歩は、空飛ぶアドホックネットワーク(FANET)を介して無人航空機(UAV)相互接続を可能にする
既存の多要素および公開鍵暗号プロトコルは、保存された機密情報に依存するため、脆弱である。
本稿では,FANET のための軽量な認証・鍵契約プロトコルを提案し,動的クレデンシャル管理と軽量暗号プリミティブとを統合した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:03:23 GMT)
VQEzy: An Open-Source Dataset for Parameter Initialize in Variational Quantum Eigensolvers [19.7] 変分量子固有解法(VQEs)は、ノイズの多い中間スケール量子(NISQ)アルゴリズムの第一級である。
VQEzyはVQEパラメータの初期化のための最初の大規模データセットである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:54:11 GMT)
TurnaboutLLM: A Deductive Reasoning Benchmark from Detective Games [19.7] 本稿では,Large Language Models(LLM)の推論能力を評価するための新しいフレームワークとデータセットであるTurnaboutLLMを紹介する。
このフレームワークは、長い物語の文脈の中で、証言と証拠の間の矛盾を識別するLLMを処理します。
提案手法は,12種類のLLMをデータセット上で評価し,導出的推論を向上するための一般的な戦略の限界を示唆した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:02:11 GMT)
GLSim: Detecting Object Hallucinations in LVLMs via Global-Local Similarity [19.5] トレーニング不要なオブジェクト幻覚検出フレームワークであるGLSimを紹介する。
我々は,GLSimが優れた検出性能を達成し,高いマージンで競争ベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:58:41 GMT)
A Depth-Independent Linear Chain Ansatz for Large-Scale Quantum Approximate Optimization [19.4] 本稿では, 線形連鎖 QAOA の変種を提案するとともに, 従来の QAOA のパラダイムである MaxCut 問題に対して, その優位性を実証する。
アンザッツでは、元のMaxCutグラフから線形鎖を見つけ、この鎖に沿ってエンタングゲートを順次配置する。
この線形鎖アンサッツは、浅い量子回路と、問題の大きさとは独立にスケールする低い実行時間によって特徴付けられる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 00:33:54 GMT)
Discriminating Form and Meaning in Multilingual Models with Minimal-Pair ABX Tasks [19.0] 多言語言語モデルが言語アイデンティティ(形式)と意味コンテンツ(意味)をどのように表現するかを評価するために、トレーニング不要なABXスタイルの識別タスクを導入する。
音声処理から着想を得たこれらのゼロショットタスクは、表現の最小差を確実に検出できるかどうかを測定する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:34:10 GMT)
WISE: Weak-Supervision-Guided Step-by-Step Explanations for Multimodal LLMs in Image Classification [18.6] MLLM(Multimodal Large Language Models)は、視覚的テキスト推論において有望であることを示す。
Weak-supervision-guided Step-by-step Explanation法であるWISEを提案する。
我々の研究は、概念に基づく解釈可能性と生成的MCoT推論を橋渡しし、きめ細かい視覚的理解においてMLLMを強化するための一般化可能なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:05:29 GMT)
A Large Language Model-based multi-agent manufacturing system for intelligent shopfloor [18.1] 研究者はマルチエージェント製造システムを提案した。
システムは多様なエージェントのモジュールと、それらの共同製造方法で構成されている。
LLMベースのモジュールは、事前トレーニングを必要とせずに、システムに動的な機能を提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:20:33 GMT)
Multi-Agent Amodal Completion: Direct Synthesis with Fine-Grained Semantic Guidance [17.8] 隠されたオブジェクトの見えない部分を生成するアモーダルコンプリートは、画像編集やARといったアプリケーションには不可欠である。
本稿では,これらの問題を克服するための先行的協調推論に基づく協調的マルチエージェント推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:20:06 GMT)
Learning Contrastive Multimodal Fusion with Improved Modality Dropout for Disease Detection and Prediction [17.7] 改良されたモダリティドロップアウトとコントラスト学習を統合した,新しいマルチモーダル学習フレームワークを提案する。
疾患検出および予測タスクのための大規模臨床データセットの枠組みを検証した。
本研究は,マルチモーダル学習におけるアプローチの有効性,効率,一般化性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:12:12 GMT)
DINVMark: A Deep Invertible Network for Video Watermarking [17.6] 本稿では,Deep Invertible Network for Video Watermarking (DINVMark)を紹介し,HEVC圧縮をシミュレートするノイズ層を設計する。
その結果,提案手法は透かしの堅牢性を著しく向上し,映像品質を保ち,透かしの埋め込み能力を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:08:20 GMT)
PG-CE: A Progressive Generation Dataset with Constraint Enhancement for Controllable Text Generation [17.5] 制御可能なテキスト生成(CTG)は,システムの信頼性とユーザエクスペリエンスを向上させる重要な技術となっている。
本稿では,CTGタスクをタイプ予測,制約構成,ガイド生成の3段階に分割するPG-CE手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:12:41 GMT)
Scaling Low-Resource MT via Synthetic Data Generation with LLMs [17.4] 英語のEuroparlから文書レベルの合成コーパスを構築する。
効果的な訓練体制を同定し,その実践的応用について検討する。
合成並列データセットの公開リポジトリであるSynOPUSを紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:03:22 GMT)
Addressing the Inconsistency in Bayesian Deep Learning via Generalized Laplace Approximation [17.2] 一般化されたラプラス近似を導入し、正規化損失のヘシアン計算に簡単な修正しか必要としない。
提案手法を最先端のニューラルネットワークと実世界のデータセットで評価し,一般化されたラプラス近似が予測性能を向上させることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:14:35 GMT)
Large Language Models for Cyber Security: A Systematic Literature Review [17.1] 大規模言語モデル(LLM)は、サイバーセキュリティを含むさまざまなアプリケーションドメインで人工知能を活用する新たな機会を開いた。
LLMは、脆弱性検出、マルウェア分析、ネットワーク侵入検出など、幅広いサイバーセキュリティタスクに適用されている。
LLMベースの自律エージェントは、シングルタスク実行から複雑なマルチステップセキュリティのオーケストレーションへのパラダイムシフトを表している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:50:51 GMT)
Attention Sinks: A 'Catch, Tag, Release' Mechanism for Embeddings [17.0] 大型言語モデル(LLM)は、注意シンクと呼ばれるいくつかの特定のトークンに注意を集中することが多い。
一般的な例として、最初のトークン、プロンプト非依存のシンク、句読点がある。
その普遍性にもかかわらず、機能、意味的役割、注意の起源はいまだに理解されていない。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:16:25 GMT)
CLIP-IN: Enhancing Fine-Grained Visual Understanding in CLIP via Instruction Editing Data and Long Captions [16.9] CLIP-IN(CLIP-IN)は、2つのコアイノベーションを通じてCLIPの微粒な認識を促進する新しいフレームワークである。
まず、画像操作用に設計された命令編集データセットを、ハードネガティブな画像テキストペアのユニークな情報源として活用する。
第二に、CLIP-INは長いキャプションを組み込み、回転する位置エンコーディングを利用して、標準のCLIPでしばしば見逃されるリッチなセマンティックコンテキストをキャプチャする。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:33:36 GMT)
PDTrim: Targeted Pruning for Prefill-Decode Disaggregation in Inference [16.5] 大規模言語モデル(LLM)は、様々なタスクにまたがる例外的な能力を示すが、その展開は高い計算とメモリコストに制約される。
より正確で効率的なブロックとKVキャッシュのプルーニングを可能にするPD分散推論のための新しいプルーニング法を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:45:26 GMT)
Full-History Graphs with Edge-Type Decoupled Networks for Temporal Reasoning [16.5] 我々は、各時間ステップ毎に各エンティティの1つのノードをインスタンス化するフルヒストリーグラフを導入する。
運転注意予測(Waymo)とBitcoin不正検出(Elliptic++)で評価する。
これらの利得は、1つのグラフにおいて異なるエッジとして構造的および時間的関係を表す利点を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:13:25 GMT)
TextOCVP: Object-Centric Video Prediction with Language Guidance [16.5] TextOCVPは、テキスト記述によってガイドされるビデオ予測のためのオブジェクト中心モデルである。
構造化されたオブジェクト中心表現は、新しいシーン構成に対して優れたロバスト性を提供することを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:02:53 GMT)
LightRetriever: A LLM-based Text Retrieval Architecture with Extremely Faster Query Inference [16.4] 大規模言語モデル(LLM)に基づくテキスト検索は、ベクトル類似性に基づいて検索クエリに関連する文書を検索する。
非常に軽量なクエリエンコーダを備えた新しいLCMベースのレトリバーであるLightRetrieverを提案する。
本手法は,クエリエンコーディングの1000倍以上の高速化と,エンドツーエンドの検索スループットの10倍以上の高速化を実現する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:48:04 GMT)
Asking a Language Model for Diverse Responses [16.3] 本研究では,祖先(並列)サンプリングと対照的な可塑性応答の集合を生成する候補サンプリング器について,1パスあたり$n$の候補を生成するようモデルに求める列挙法と,現在生成された応答集合を条件付けしながら順次候補を提案する反復サンプリングについて検討する。
本研究は, 生成品質を犠牲にすることなく, 応答多様性を向上させるための単純な非独立サンプリング戦略の可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:01:22 GMT)
On-the-Fly Adaptation to Quantization: Configuration-Aware LoRA for Efficient Fine-Tuning of Quantized LLMs [16.3] 最近の研究は、量子化と高精度LoRAアダプタの微調整を組み合わせている。
任意の量子化構成にLoRAアダプタを動的に調整する手法であるCoA-LoRAを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:07:50 GMT)
Incorporating the Refractory Period into Spiking Neural Networks through Spike-Triggered Threshold Dynamics [16.3] スパイクトリガードしきい値ダイナミクスを用いて、屈折周期をLIFニューロンに組み込む方法を提案する。
RPLIFは、Cifar10-DVS(82.40%)とN-Caltech101(83.35%)の最先端のパフォーマンスを、より少ないタイムステップで達成し、低レイテンシでDVS128 Gesture(97.22%)で優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:33:31 GMT)
WildClaims: Information Access Conversations in the Wild(Chat) [16.1] ユーザによる情報へのアクセスは,システムによってなされる,チェック価値のある事実の主張として暗黙的に発生する。
3000のWildChat会話で7,587発の発話から121,905件の事実主張を抽出した新しいリソースであるWildClaimsデータセットをリリースする。
本資料の予備的分析から,18%~51%の会話がチェック価値のあるアサーションを含むことが明らかとなった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:32:06 GMT)
CogAtom: From Cognitive Atoms to Olympiad-level Mathematical Reasoning in Large Language Models [16.0] 我々は、厳密で認知的に多様な問題を合成するための新しい認知原子ベースのフレームワークであるCogAtomを紹介する。
私たちの研究は、スケーラブルで高品質な数学問題生成への認知的に根ざした道筋を提供します。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:48:50 GMT)
Improving Zero-shot Sentence Decontextualisation with Content Selection and Planning [16.0] 提案するゼロショット・デコンテクスト化フレームワークは,どの内容に言及すべきか,どの順序で文を文脈から理解すべきかを判断する。
我々は、与えられた文から潜在的に曖昧な単位を識別し、それらの言説関係に基づいて文脈から関連する単位を抽出する。
最後に,各曖昧な単位を関連単位に富ませることで文の書き直しを行うコンテンツプランを生成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:47:07 GMT)
Correlation or Causation: Analyzing the Causal Structures of LLM and LRM Reasoning Process [15.8] 本研究は、推論モデルにおける因果関係の理解に寄与し、より強力な因果基盤を持つ将来のAIシステムを設計するための洞察を提供する。
以上の結果から,RLVRをトレーニングしたLEMは,より優れた因果推論能力を示し,理想的な因果構造とより密に一致していることが判明した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:44:44 GMT)
Large Language Models Meet Knowledge Graphs for Question Answering: Synthesis and Opportunities [15.7] 大規模言語モデル(LLM)は質問応答(QA)タスクにおいて顕著な性能を示した。
しかし、LLMベースのQAは、推論能力の貧弱さ、時代遅れの知識、幻覚のために複雑なQAタスクに苦しむ。
いくつかの最近の研究は、上記の課題に対処するために、QAのためのLLMと知識グラフ(KG)を合成している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:18:46 GMT)
Domain Adaptive Object Detection for Space Applications with Real-Time Constraints [15.6] 宇宙アプリケーションにおけるオブジェクト検出のための現在のディープラーニングモデルは、しばしばシミュレータからの合成データに基づいて訓練される。
ドメイン適応の重要性を示し、そのギャップを減らすためにスーパービジョンドドメイン適応を探索する。
結果は、250個のラベル付き実画像で平均精度(AP)を最大20ポイント改善する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:17:14 GMT)
MedFact: A Large-scale Chinese Dataset for Evidence-based Medical Fact-checking of LLM Responses [15.1] MedFactは、大規模な言語モデル(LLM)が生成する医療コンテンツの、最初の証拠に基づく中国の医療ファクトチェックデータセットである。
1,321の質問と7,409のクレームで構成され、現実世界の医療シナリオの複雑さを反映している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:26:47 GMT)
Flatness is Necessary, Neural Collapse is Not: Rethinking Generalization via Grokking [14.2] 一般化の開始付近で神経崩壊と相対的平坦性が現れるが、常に平坦性だけがそれを予測している。
理論的には、ニューラルネットワークの崩壊は古典的な仮定の下で相対的な平坦性を意味する。
この結果は、相対平坦性は一般化のための潜在的に必要であり、より基本的な性質である、という見方を支持する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:05:07 GMT)
Towards Seeing Bones at Radio Frequency [14.1] 無線センシングの文献は、長い間、無線周波数でX線のようなビジョンを実現しようとしてきた。
しかし、現在最先端のワイヤレスセンシングの文献では、肉の下の骨の1つである前頭骨のX線像をまだ生成していない。
骨をmm分解能で撮像するための透過型RFイメージングシステム MCT について検討する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:24:36 GMT)
DCFFSNet: Deep Connectivity Feature Fusion Separation Network for Medical Image Segmentation [14.1] 医用画像分割のためのDCFFSNet(Dual-Connectivity Feature Fusion-Separation Network)を提案する。
接続機能と他の機能の間の強度を定量化し、深い接続機能融合分離アーキテクチャを構築する。
セグメンテーションの断片化を効果的に解決し、スムーズなエッジ遷移を実現する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:31:39 GMT)
TMD-TTS: A Unified Tibetan Multi-Dialect Text-to-Speech Synthesis for Ü-Tsang, Amdo and Kham Speech Dataset Generation [14.0] TMD-TTSはチベットの多言語テキスト音声合成フレームワークである。
明示的な方言ラベルから平行方言音声を合成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:38:52 GMT)
Remote Sensing-Oriented World Model [14.0] 世界モデルは、直接観測を超えた世界状態の予測と推論によって、人工知能のポテンシャルを示してきた。
既存のアプローチは、主に合成環境や制約されたシーン設定で評価される。
本稿では、リモートセンシングにおける世界モデリングのための最初のフレームワークを導入することにより、これらのギャップを埋める。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:02:39 GMT)
Better Late Than Never: Evaluation of Latency Metrics for Simultaneous Speech-to-Text Translation [13.9] 同時音声テキスト変換(SimulST)システムでは,翻訳品質とレイテンシのバランスをとる必要がある。
既存のメトリクスは、しばしば矛盾または誤解を招く結果を生み出します。
本報告では,言語ペア,システム,短文と長文の両方でSimulSTレイテンシメトリクスを包括的に解析する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 04:21:19 GMT)
Datasets for Fairness in Language Models: An In-Depth Survey [13.9] 言語モデル研究において最も広く使われている公平性データセットを包括的に分析する。
本稿では,ベンチマークおよびスコアリング指標間での人口格差の一貫したパターンを明らかにする統一評価フレームワークを提案する。
我々の発見は、より広い範囲の社会的文脈と公平性の概念を捉えた新しいベンチマークに対する緊急の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:51:55 GMT)
ClusterRCA: An End-to-End Approach for Network Fault Localization and Classification for HPC System [13.8] 本稿では,マルチモーダルデータを活用することにより,原因ノードをローカライズし,障害タイプを決定する新しいフレームワークであるClusterRCAを提案する。
原因ノードを正確にローカライズし、障害タイプを決定するために、ClusterRCAは分類器ベースのアプローチとグラフベースのアプローチを組み合わせる。
上位階層のグローバルHPCデバイスベンダーが収集したデータセットの実験によると、ClusterRCAはHPCシステムのネットワーク障害の診断において高い精度を達成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:29:31 GMT)
From Restoration to Reconstruction: Rethinking 3D Gaussian Splatting for Underwater Scenes [13.7] 水中画像復元(UIR)を3次元ガウススプラッティング(DGS)でブリッジする統合フレームワークである textbfR-Splatting を提案する。
提案手法は,多様なUIRモデルによって生成された複数の拡張ビューを1つの再構築パイプラインに統合する。
Seathru-NeRFと新しいBlueCoral3Dデータセットの実験により、R-Splattingはレンダリング品質と幾何学的精度の両方において、強いベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:50:20 GMT)
MetaEmbed: Scaling Multimodal Retrieval at Test-Time with Flexible Late Interaction [13.7] マルチモーダル検索のための新しいフレームワークであるMetaEmbedを紹介する。
トレーニング中は、入力シーケンスに一定の数の学習可能なメタトークンが付加される。
テスト時には、その最後のレイヤのコンテキスト化表現はコンパクトだが表現力のあるマルチベクトル埋め込みとして機能する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:59:42 GMT)
Neurodynamics-Driven Coupled Neural P Systems for Multi-Focus Image Fusion [13.7] マルチフォーカス画像融合(MFIF)は画像処理において重要な技術である。
ブラックボックス機構を用いたルールや深層学習に基づく従来の手法では,高品質な意思決定マップを生成することは困難である。
神経力学駆動型結合型ニューラルP(CNP)システムを導入し,決定マップの精度を向上させる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:43:19 GMT)
Single-Image Depth from Defocus with Coded Aperture and Diffusion Posterior Sampling [13.6] 符号化開口画像のための単一ショット深度デフォーカス(DFD)再構成法を提案する。
我々のフレームワークは、微分可能フォワードモデルを介して測定一貫性を強制する。
提案手法では,デフォーカス-RGBDトレーニングデータをペア化する必要はなく,特定のカメラ構成にトレーニングを関連付けない。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:20:30 GMT)
SLICET5: Static Program Slicing using Language Models with Copy Mechanism and Constrained Decoding [13.6] 静的プログラムスライシングはソフトウェア工学の基本的な技術である。
ourtoolは静的プログラムスライシングをシーケンス・ツー・シーケンスタスクとして再構成する新しいスライシングフレームワークである。
ourtoolは、最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 03:14:47 GMT)
Efficient Beam Search for Large Language Models Using Trie-Based Decoding [13.5] 本研究は,バッチベースのビームサーチのメモリ非効率性に対処する,トリエ(ツリー)ベースの並列デコーディング手法を提案する。
ビーム間で1つのKVキャッシュを共通プレフィックスで共有することにより,メモリ使用量を劇的に削減し,効率的な復号化を実現する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:28:41 GMT)
Semantic Reformulation Entropy for Robust Hallucination Detection in QA Tasks [13.2] 既存のエントロピーに基づくセマンティックレベルの不確実性推定法は,可変長解のサンプリングノイズと不安定クラスタリングによって制限される。
本稿では2つの方法で不確実性評価を改善するセマンティック・リフォーム・エントロピー(SRE)を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:38:45 GMT)
SilentStriker:Toward Stealthy Bit-Flip Attacks on Large Language Models [13.2] Bit-Flip Attacks (BFA) は、ハードウェア脆弱性を利用してモデルパラメータを破損させ、重大なパフォーマンス劣化を引き起こす。
既存のBFA手法では、性能劣化と出力の自然さのバランスが取れず、発見しがちである。
SilentStrikerは、出力の自然性を維持しながらタスク性能を効果的に低下させるLSMに対する最初のステルスなビットフリップ攻撃である。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 05:36:18 GMT)
AuditoryBench++: Can Language Models Understand Auditory Knowledge without Hearing? [13.2] AuditoryBench++は、テキストのみの設定で聴覚知識と推論を評価するためのベンチマークである。
このベンチマークは、基本的な聴覚比較から文脈に基づく推論まで幅広いタスクを含んでいる。
また、推論中に聴覚情報を生成し統合する新しい聴覚想像力推論手法であるAIR-CoTを紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:45:22 GMT)
From "What to Eat?" to Perfect Recipe: ChefMind's Chain-of-Exploration for Ambiguous User Intent in Recipe Recommendation [13.1] ChefMindは、探索の連鎖(CoE)、知識グラフ(KG)、検索の強化(RAG)、大規模言語モデル(LLM)を組み合わせたハイブリッドアーキテクチャである。
我々はXiachufangデータセット上でChefMindを評価し、手動でアノテートしたクエリをLLMオンリー、KGオンリー、RAGオンリーのベースラインと比較した。
その結果、ChefMindは精度、妥当性、完全性、明度において、平均スコアが8.7対6.4-6.7であるのに対して、アブレーションモデルでは6.4-6.7であることがわかった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:35:47 GMT)
ContextFlow: Training-Free Video Object Editing via Adaptive Context Enrichment [13.1] トレーニング不要のビデオオブジェクト編集は、オブジェクト挿入、スワップ、削除を含む、正確なオブジェクトレベルの操作を実現することを目的としている。
既存の方法は、一階解法による不正確な逆転と、粗い「堅い」特徴置換によって引き起こされる文脈的衝突の2つの主要な制限に悩まされている。
本稿では,DiTベースのビデオオブジェクト編集のための新しいトレーニングフリーフレームワークであるContextFlowを紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:13:31 GMT)
Exploiting Tree Structure for Credit Assignment in RL Training of LLMs [11.6] 強化学習は推論を改善するが、長いシーケンスよりも遅れた報酬はトークンレベルのクレジット割り当てを重要なボトルネックにする。
最終回答がチェック可能で、プロンプト毎に複数の応答を描画できる検証可能な逆設定について検討する。
textbfTEMPO (emphtextbfTree-textbfEstimated textbfMean Prefix Value for textbfPolicy textbfOptimization)を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:37:24 GMT)
TinyDef-DETR: A DETR-based Framework for Defect Detection in Transmission Lines from UAV Imagery [11.6] TinyDef-DETRは、UAVが取得した画像から伝送路欠陥の正確かつ効率的な検出を実現するためのフレームワークである。
このモデルは、4つの主要なコンポーネントを統合している: エッジ強化されたResNetバックボーンで境界に敏感な表現を強化する、ストライドフリーなスペース・トゥ・ディープス・モジュールでディテール保存のダウンサンプリングを可能にする、Focler-Wise-SIoUレグレッション・ロスで、小さくて難しいターゲットのローカライズを改善する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:19:38 GMT)
SISMA: Semantic Face Image Synthesis with Mamba [11.6] 拡散モデルは人間の顔のセマンティック画像合成(SIS)において非常に人気がある。
本稿では,最近提案されたマンバに基づくSISMAという新しいアーキテクチャを提案する。
SISMAは、計算要求の少ないセマンティックマスクを用いて、その形状を制御し、高品質なサンプルを生成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:55:04 GMT)
Explainable AI for Analyzing Person-Specific Patterns in Facial Recognition Tasks [11.5] 本稿では,個々のレベルでの認識に最も寄与する顔領域を識別する新しい手法であるレイヤ埋め込み活性化マッピング(LEAM)を紹介する。
LEAMは、これらのシステムの動作を理解するために設計された説明可能性技術であり、将来のプライバシー保護研究に影響を及ぼす洞察を提供する。
以上の結果から,顔認識モデルでは顔画像の中心領域が優先される一方で,複数の顔フラグメントに注意が分散していることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:51:11 GMT)
X-GAN: A Generative AI-Powered Unsupervised Model for Main Vessel Segmentation of Glaucoma Screening [11.5] 本稿では,OCTA画像から主血管を抽出するAIを用いた非教師付きセグメンテーションモデルであるX-GANを提案する。
X-GANはラベル付きデータや高性能コンピューティングリソースに頼ることなく、100%近いセグメンテーション精度を達成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:12:09 GMT)
Revisiting Bisimulation Metric for Robust Representations in Reinforcement Learning [11.4] 従来の模擬検定法では,2つの問題点が指摘されている。
本稿では,報酬ギャップのより正確な定義と適応係数を持つ新しい更新演算子を特徴とするバイシミュレーション・メトリックを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:52:27 GMT)
Improving the color accuracy of lighting estimation models [11.2] 照明推定法のカラーロバスト性について検討する。
予めトレーニングしたホワイトバランスネットワークで入力画像の事前処理を行うことで、カラーロバスト性が向上することがわかった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:23:33 GMT)
Multi-needle Localization for Pelvic Seed Implant Brachytherapy based on Tip-handle Detection and Matching [11.2] HRNetをベースとしたアンカーフリーネットワークは,マルチスケールの特徴を抽出し,針先やハンドルを正確に検出するために提案されている。
制約付き不均衡な代入問題を解くために設計された欲求整合およびマージ手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:53:37 GMT)
MALLM: Multi-Agent Large Language Models Framework [11.1] マルチエージェントディベート(MAD)は、テストタイムの計算をスケールし、専門知識を活用することで、集合的インテリジェンスを強化する能力を示した。
我々は,MADコンポーネントの体系的解析を可能にするオープンソースフレームワークであるMALLMを紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:56:44 GMT)
Losing the Plot: How VLM responses degrade on imperfect charts [11.1] 視覚言語モデル(VLM)は、チャート理解において強力な結果を示すが、既存のベンチマークでは、明確な数字と事実に基づくクエリを仮定している。
我々はChatGPT 4o, Claude Sonnet 4, Gemini 2.5 Proを評価し, 汚損や隠蔽下での急激な性能低下を見出した。
重要なイノベーションは、モデルが同じ声明を確認または否定するよう求められたときに矛盾する、逆の矛盾を早急に起こすことだ。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:12:20 GMT)
Handling Infinite Domain Parameters in Planning Through Best-First Search with Delayed Partial Expansions [11.0] 自動計画では、制御パラメータは連続的な数値決定変数を導入して標準アクション表現を拡張する。
既存の最先端のアプローチは、他の時間的制約や数値的制約と共に、組み込み制約として制御パラメータを主に扱っている。
本稿では,制御パラメータを体系的な探索方式における真の決定点として明示的に扱う,効率的な代替案を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:45:16 GMT)
Training-Free Label Space Alignment for Universal Domain Adaptation [11.0] ユニバーサルドメイン適応(UniDA)は、ラベル付きソースドメインからラベルなしターゲットドメインに知識を転送する。
We propose a training-free label-space alignment method for UniDA (ours)。
本手法は,各領域間の雑音ラベルのフィルタリングと精細化によって,視覚空間の代わりにラベル空間を整列する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:46:10 GMT)
Conv-like Scale-Fusion Time Series Transformer: A Multi-Scale Representation for Variable-Length Long Time Series [10.9] トランスフォーマーベースのモデルには高度な時系列タスクがあるが、特徴冗長性と限定的な一般化機能に苦慮している。
本稿では,Conv-like ScaleFusion Transformerに基づくマルチスケール表現学習フレームワークを提案する。
我々のフレームワークは,最先端手法と比較して,優れた特徴独立性,冗長性の低減,予測および分類タスクの性能向上を実現している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:37:59 GMT)
Can LLMs Reason Over Non-Text Modalities in a Training-Free Manner? A Case Study with In-Context Representation Learning [10.9] そこで本研究では,LLMの非テキストモダリティ表現を適応的に活用するための概念実証として,ICRL(In-Context Representation Learning)を提案する。
従来のテキスト内学習とは異なり、ICRLはテキスト入力をFM表現に置き換え、LLMは微調整なしでマルチモーダル推論を行うことができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:16:34 GMT)
Towards Adaptive Context Management for Intelligent Conversational Question Answering [10.8] 本稿では,会話質問応答(ConvQA)システムのための適応コンテキスト管理フレームワークを提案する。
ACMフレームワークの主な目的は、動的にコンテキストを管理することで会話履歴の使用を最適化することである。
実験結果から,提案フレームワークが正確かつ文脈的に適切な応答を生成する上での有効性を示した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:21:26 GMT)
SparseDoctor: Towards Efficient Chat Doctor with Mixture of Experts Enhanced Large Language Models [10.8] 大規模言語モデル(LLM)は、医学的質問応答と臨床的意思決定において大きな成功を収めた。
LLMの従来の微調整戦略は数十億のパラメータの更新を必要とし、トレーニングコストを大幅に増加させる。
我々は,LRA-MoEアーキテクチャを改良したSparseDoctorという,スパークス医療用LLMを製作した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 03:08:40 GMT)
Robustness of Neurosymbolic Reasoners on First-Order Logic Problems [10.7] NLPの最近のトレンドは、Large Language Models (LLMs)における推論能力の向上を目指している。
対実的タスクの変種は、最小限だが意味論的に意味のある変更を、他の有効な一階述語論理問題インスタンスに導入する。
以前の研究では、LLMは反ファクトの変動に弱いことが示されており、しばしば反応を生成するために急激な表面パターンに依存していることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:35:27 GMT)
Scale-free Characteristics of Multilingual Legal Texts and the Limitations of LLMs [10.6] 我々は、Heapsの指数$beta$(語彙成長)、Taylorの指数$alpha$(単語周波数変動スケーリング)、圧縮率$r$(冗長性)、エントロピーを通じて、言語学的複雑さを定量化する。
法的テキストは、一般的なテキストよりも語彙の伸びが遅い($beta$より低い)し、より長期の一貫性が高い($alpha$より高い)。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 05:34:15 GMT)
Learning functions, operators and dynamical systems with kernels [10.4] 基本的なフレームワークはスカラー値学習用に導入され、演算子学習に拡張される。
力学系の学習は、クープマン作用素理論を利用して適切な作用素学習問題として定式化される。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:53:08 GMT)
LongEval at CLEF 2025: Longitudinal Evaluation of IR Systems on Web and Scientific Data [10.3] LongEval labは、時間とともに情報検索システムを評価することに焦点を当てている。
ドキュメント、クエリ、関連性評価を変更することによって、進化する検索シナリオをキャプチャする2つのデータセットが提供される。
今年のタスクとデータセット、および参加システムの概要を紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:05:40 GMT)
Speculate Deep and Accurate: Lossless and Training-Free Acceleration for Offloaded LLMs via Substitute Speculative Decoding [10.2] SubSpecはパラメータのオフロードを高速化するプラグイン・アンド・プレイ方式である。
MT-BenchではQwen2.5 7Bの9.1倍のスピードアップ、人気の世代ベンチマークではQwen2.5 32Bの12.5倍のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:08:57 GMT)
Agentic AI for Software: thoughts from Software Engineering community [10.0] コードレベルでの一般的なソフトウェアタスクには、コード生成、テスト、プログラムの修復が含まれる。
エージェントAIベースのソフトウェアを成功させる鍵は、ソフトウェアエンジニアリングにおける中核的な難しさ、すなわち開発者の意図の解読と明確化を解決することである。
エージェント技術のソフトウェア工学への展開が成功すれば、エージェントを通じてそのような意図推論において概念的な進歩がもたらされる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 10:56:53 GMT)
What if we could hot swap our Biometrics? [10.0] 本稿では,新しいバイオテクノロジーに基づくホットスワップ・アイデンティティのメカニズムを提案する。
このような技術が利用可能になり、手頃な価格になれば、潜在的にポジティブなユースケースとマイナスの結果が議論される。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:16:04 GMT)
Exploring Image Generation via Mutually Exclusive Probability Spaces and Local Correlation Hypothesis [9.9] 画像生成のための確率的生成モデルにおける一般的な仮定は、グローバルなデータ分布の学習がサンプリングによって新しい画像を生成するのに十分であるということである。
我々は,この中核的な仮定の限界,すなわちグローバルな分布の学習が生成行動よりも記憶に繋がるということを考察する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:05:16 GMT)
EmoBench-Reddit: A Hierarchical Benchmark for Evaluating the Emotional Intelligence of Multimodal Large Language Models [9.9] EmoBench-Redditは、マルチモーダル感情理解のための新しい階層型ベンチマークである。
データセットは、ソーシャルメディアプラットフォームRedditから350の精巧にキュレートされたサンプルで構成されている。
各データポイントには6つの複数選択の質問と、困難を増すための1つのオープンな質問がある。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:45:20 GMT)
QUT: A Unit Testing Framework for Quantum Subroutines [9.8] 本稿では,量子サブルーチンの単体テストフレームワークであるQUT(Quantum Unit Testing)のアーキテクチャ設計とプロトタイプ実装について述べる。
このフレームワークはユーザビリティとシンプルさに重点を置いて開発されており、量子ユニットテストの背後にある複雑な理論的概念を広範囲のユーザが利用できるようにしている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:57:32 GMT)
MTM: A Multi-Scale Token Mixing Transformer for Irregular Multivariate Time Series Classification [9.6] IMTS分類のためのマルチスケールトークン混合変換器 MTM を提案する。
時系列を粗い時間スケールにダウンサンプリングすることで、チャネルワイドの非同期性を緩和できることがわかった。
また,あるチャネルから重要なトークンを積極的に選択し,他のチャネルと混在させる新しいチャネル単位のトークン混合機構を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:03:02 GMT)
PrioriTouch: Adapting to User Contact Preferences for Whole-Arm Physical Human-Robot Interaction [9.5] 物理的人間とロボットの相互作用(pHRI)は、ロボットが個々の接触の好みに適応する必要がある。
PrioriTouchは複数の連絡先にまたがって制御対象をランク付けし、実行するためのフレームワークである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:05:11 GMT)
MapCoder-Lite: Squeezing Multi-Agent Coding into a Single Small LLM [9.4] MapCoder-Liteは、単一の7Bモデルを4つのロール特化エージェント-retriever、プランナー、コーダ、デバッガ使用のみランク32にアップグレードする。
MapCoder-LiteはxCodeEvalの精度を2倍以上にし($13.2%から$28.3%まで)、すべてのフォーマットの失敗を排除し、32Bベースラインの6ポイント以内に閉じる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:19:11 GMT)
Joint Optimization of Memory Frequency, Computing Frequency, Transmission Power and Task Offloading for Energy-efficient DNN Inference [9.3] リソース制約のあるデバイスでは、高いレイテンシとエネルギーオーバーヘッドは避けられない。
この課題に対処するため、ほとんどの研究者は動的電圧と周波数スケーリング(DVFS)技術に焦点を当てている。
本稿ではまず,結合記憶周波数と計算周波数のスケーリングが推定時間とエネルギー消費に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:20:29 GMT)
Whitening Spherical Gaussian Mixtures in the Large-Dimensional Regime [9.1] ホワイトニング(Whitening)は、教師なし学習における古典的なテクニックであり、データの標準化によって推定作業を容易にする。
データが高次元かつ少ない大次元レジーム(LDR)では、標準白化行列はスペクトルが歪んでいるため、非効率になる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:43:30 GMT)
SAMSON: 3rd Place Solution of LSVOS 2025 VOS Challenge [9.1] 大規模なビデオオブジェクトモジュール(LSVOS)は、長いビデオシーケンスにおけるオブジェクトの正確な追跡とセグメンテーションという課題に対処する。
テストセットリーダーボードにおけるJ&Fの最終的な性能は0.8427であった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:30:34 GMT)
Fast qubit-based frequency recovery algorithm for quantum key distribution [9.1] 最近提案されたQubitベースの同期(Qubit4Sync)は、追加のコスト、ノイズ、潜在的なサイドチャネルを排除する機会がある。
Qubit4Syncの現在の周波数回復プロセスは、高いデータスループットと計算速度を必要とし、実用的な使用を制限する。
我々は,信号対雑音比(SNR)において,信号の回復率を桁違いに向上させる高速周波数回復アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:42:04 GMT)
DCR: Quantifying Data Contamination in LLMs Evaluation [9.1] データ汚染リスク(DCR)フレームワークは、4つの粒度のBDCリスクを検出し定量化する。
DCRは、汚染認識性能を反映するように生の精度を調整する統一されたDCR因子を生成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:51:23 GMT)
Interpreting vision transformers via residual replacement model [9.0] ビジョントランスフォーマー(ViT)はどのように世界を表現するのか?
本稿は、すべての層にまたがる6.6K機能の最初の体系的解析を通じて、この長年にわたる問題に対処する。
残差ストリームの解釈可能な特徴をViT計算に置き換える残差置換モデルを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:00:57 GMT)
Show and Tell: Visually Explainable Deep Neural Nets via Spatially-Aware Concept Bottleneck Models [9.0] 本稿では,視覚ニューラルネットワークを空間的・概念的に解釈可能なモデルに変換する統一的な枠組みを提案する。
この手法をSALF-CBM(Spatially-Aware and Label-Free Concept Bottleneck Model)と呼ぶ。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:50:48 GMT)
Fast Linear Solvers via AI-Tuned Markov Chain Monte Carlo-based Matrix Inversion [8.6] 与えられた線形システムに対してMCMCパラメータを推奨するAI駆動型フレームワークを提案する。
グラフニューラルサロゲートは、プリコンディショニング速度を$A$とMCMCパラメータから予測する。
従来手法では,従来手法の検索予算の50%を網羅して,事前条件の改善を実現している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:14:13 GMT)
Leveraging Audio-Visual Data to Reduce the Multilingual Gap in Self-Supervised Speech Models [8.6] 自己教師付き学習(SSL)は、音声表現学習において大きな進歩を遂げている。
多言語SSLモデルは、個々の言語でモノリンガルのモデルよりも性能が低い傾向にある。
この性能ギャップを低減するために、バイリンガル音声SSLモデルに限られた視覚的グラウンドを導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:48:04 GMT)
Synth-MIA: A Testbed for Auditing Privacy Leakage in Tabular Data Synthesis [8.4] タブラル生成モデルは、トレーニングデータに似た合成データセットを作成することによって、プライバシを保護するとしばしば主張される。
会員推論攻撃(MIA)は、最近、合成データのプライバシー漏洩を評価する方法として登場した。
合成データセットの最大プライバシー漏洩を推定するために、攻撃の集合をデプロイする統一的モデルに依存しない脅威フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:53:38 GMT)
Robust Mixture Models for Algorithmic Fairness Under Latent Heterogeneity [8.4] ROMEはデータから潜在グループ構造を学習し、最悪のグループ性能を最適化するフレームワークである。
ROMEは、競争平均性能を維持しながら、標準的な手法と比較してアルゴリズムの公正性を著しく改善する。
本手法では事前定義されたグループラベルは必要とせず,不均一な情報源が不明であったり,進化していたりする場合に有効である。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:03:33 GMT)
Combining Constrained and Unconstrained Decoding via Boosting: BoostCD and Its Application to Information Extraction [8.4] Boosted Constrained Decodingは制約付きと制約なしのデコーディングを2つのフェーズで組み合わせる。
閉鎖情報抽出に適用することで,BoostCDのパワーを実証する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:52:28 GMT)
Brittleness and Promise: Knowledge Graph Based Reward Modeling for Diagnostic Reasoning [8.4] 大型言語モデル (LLM) は診断的推論を約束するが、しばしば信頼できる知識に基づく推論を欠いている。
本研究は,候補経路が患者入力の正しい診断につながるかどうかを判断するために学習するKG推論経路の報奨モデルとしてLLMを取り扱う。
臨床KGに対する「リワードモデル」推論の体系的評価を初めて行った。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:39:09 GMT)
StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions [8.3] ランドスケープインタラクションを中心とした地層モデルであるStefaLandを紹介した。
結果は、多種多様なデータスカース領域にまたがる一般化能力を強調している。
我々の知る限り、これは地表面相互作用予測を実証的に改善する最初の地表面基盤モデルである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:05:45 GMT)
DIVERS-Bench: Evaluating Language Identification Across Domain Shifts and Code-Switching [8.1] 言語識別(Language Identification、LID)は多言語NLPにおける中核的なタスクである。
本研究はDIVERS-BENCHを導入し,多分野にわたる最先端のLIDモデルの包括的評価を行った。
これらの結果から, モデルが評価されたデータセットに対して高い精度を達成する一方で, ノイズや非公式な入力に対して, 性能が著しく低下することが明らかとなった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:32:31 GMT)
Multilingual vs Crosslingual Retrieval of Fact-Checked Claims: A Tale of Two Approaches [8.1] マルチリンガルおよびクロスリンガルのパフォーマンスを改善するための戦略を検討する。
47言語におけるポストとクレームを含むデータセットに対するアプローチを評価する。
最も重要なことは、多言語性は多言語性よりも独自の特徴を持つセットアップであることが示される。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:16:16 GMT)
Multi-branch of Attention Yields Accurate Results for Tabular Data [8.0] 本稿では,エンコーダ・デコーダ・トランスを用いたMAYAを提案する。
エンコーダでは、複数の並列注意枝を構成するマルチブランチ・オブ・アテンション(MBA)を設計する。
我々は、より堅牢な表現を生成するために、動的一貫性重み制約を伴う協調学習を採用する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:31:04 GMT)
Improving Instruct Models for Free: A Study on Partial Adaptation [8.0] そこで本研究では,ベースモデルとインストラクションモデルのパフォーマンストラジェクトリについて,インストラクションチューニングの強度をスケールダウンさせることにより検討する。
複数のモデルファミリとモデルサイズにまたがって、命令調整結果の強度を低下させることで、数ショットのインコンテキスト学習ベンチマークにおいて物質的改善が達成されることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:58:14 GMT)
AI Assistants to Enhance and Exploit the PETSc Knowledge Base [7.8] ジェネレーティブAIは、技術的知識へのアクセス、再利用、拡張の方法を変えつつある。
PETScは30年間の開発期間を通じて、豊富なが断片的な知識基盤を蓄積してきた。
この知識ベースをより効果的に活性化し活用するために、PETScチームはLLMを利用したシステムの構築を開始した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:54:39 GMT)
Check Field Detection Agent (CFD-Agent) using Multimodal Large Language and Vision Language Models [7.8] 自動チェックフィールド検出のための新しいトレーニングフリーフレームワークを提案する。
当社のアプローチでは,チェックコンポーネントのゼロショット検出が可能で,実世界の金融環境におけるデプロイメントの障壁を大幅に低減する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:43:59 GMT)
Core-elements Subsampling for Alternating Least Squares [7.8] 本稿では、最小二乗交互アルゴリズム(ALS)のための新しい要素ワイドサブセット選択法を提案する。
実データALSと比較して計算時間を大幅に削減して類似の精度が得られることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:00:30 GMT)
Efficient & Correct Predictive Equivalence for Decision Trees [7.6] Rashomonの意思決定ツリー(DT)は、重要な使用方法を見つけます。
同じ分類関数、すなわち予測等価DTを計算するDTは、ラショーモン集合のかなりの部分を表すことができる。
本稿では,QM法において最悪の指数的実行時間と空間を誘導する決定木が存在することを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:37:52 GMT)
Intra-Cluster Mixup: An Effective Data Augmentation Technique for Complementary-Label Learning [7.6] 相補的ラベル学習(CLL)の課題について検討する。
CLLは弱い教師付き学習の一種で、モデルには、インスタンスが属さないクラスを示すラベルが付けられている。
本稿では,近隣のサンプルからのみ拡張データを合成するICM(Intra-Cluster Mixup)と呼ばれる改良手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:20:41 GMT)
Quickest Change Detection in Continuous-Time in Presence of a Covert Adversary [7.6] ブラウン運動が未知の時間でドリフト変化を経験する連続時間設定における最短変動検出の問題について検討する。
ドリフトスケールが$mu(gamma) = Theta (1/sqrtgamma)$となると、敵は被害を最大化でき、連続検知システムにおけるステルスと影響の基本的なトレードオフを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:40:53 GMT)
DIWALI - Diversity and Inclusivity aWare cuLture specific Items for India: Dataset and Assessment of LLMs for Cultural Text Adaptation in Indian Context [7.6] 大規模言語モデル(LLM)は様々なタスクやアプリケーションで広く使われている。
文化的な知識や能力の欠如により、文化的な整合性が欠如していることが示されている。
インド文化のための新しいCSIデータセットについて紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:58:02 GMT)
One Agent to Serve All: a Lite-Adaptive Stylized AI Assistant for Millions of Multi-Style Official Accounts [7.5] 我々は,数百万のオフィシャルアカウントにスケールするスタイル化された文脈質問応答のための礼儀正しいフレームワークを提案する。
WeStarはParametric RAG (PRAG) を用いたコンテキスト基底生成とスタイル認識生成を組み合わせた。
本研究では、各スタイルクラスタのパラメータを最適化し、生成品質を向上させるために、スタイル強化直接参照最適化(SeDPO)手法を開発した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:49:37 GMT)
MSCoRe: A Benchmark for Multi-Stage Collaborative Reasoning in LLM Agents [7.3] MSCoReは、自動車、医薬品、エレクトロニクス、エネルギー分野のシナリオにまたがる126696ドメイン固有のQAインスタンスからなる新しいベンチマークである。
商用モデルはすべてのタスクやシナリオで最高に機能するが、ROUGEのスコアの顕著な差は、単純なタスクと複雑なタスクの間にある。
MSCoReは、LLMエージェントの多段階推論を評価し改善するための、コミュニティにとって価値のある新しいリソースを提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:36:16 GMT)
Selecting Optimal Camera Views for Gait Analysis: A Multi-Metric Assessment of 2D Projections [7.3] カメラビュー(正面対横方向)が2次元マーカーレス歩行解析の精度に与える影響を定量化する。
側方視は矢状面運動学において正面視よりも有意に優れていた。
将来の実装は、疾患指向のセットアップを通じて両方のビューを活用するべきである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:00:20 GMT)
Learning to Condition: A Neural Heuristic for Scalable MPE Inference [7.3] 我々は,MPE推論を高速化するスケーラブルでデータ駆動型フレームワークであるL2C(Learning to Condition)を導入する。
観測された証拠から、L2Cはニューラルネットワークをトレーニングし、条件付けのユーティリティに基づいて変数値の割り当てをスコアする。
我々は,既存のMPEソルバの探索トレースから学習信号を抽出するスケーラブルなデータ生成パイプラインを開発した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:24:31 GMT)
Chiral Color Code : Single-shot error correction for exotic topological order [7.3] 我々は、フェルミオンおよびカイラルトポロジカル秩序を実現する、カイラルカラー符号と呼ばれる単純な3次元安定化符号の族を示す。
qubitの場合、コードはフェルミオントーリックコードの1つのコピーの位相位相を実現する。
局所次元$d$を持つキューディット系では、モデルはカイラルパラメータ$alpha$を特徴とし、$mathbbZ_d(alpha)$ anyon理論によって特徴づけられる3次元位相を実現する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:48:07 GMT)
TISDiSS: A Training-Time and Inference-Time Scalable Framework for Discriminative Source Separation [7.2] 我々は、TISDiSS(Training-Time and Inference-Time Scalable Discriminative Source separation)を提案する。
TISDiSSは、早期分割型マルチロス監視、共有パラメータ設計、動的推論繰り返しを統合している。
標準音声分離ベンチマークの実験は、パラメータ数を削減した最先端性能を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 03:13:19 GMT)
When Life Paths Cross: Extracting Human Interactions in Time and Space from Wikipedia [7.1] インタラクションレコードを (Person1, Person2, Time, Location) の形式でウィキペディアにマイニングする。
これらの相互作用の鍵となる要素は、しばしば異質なクラウドソーステキストに散在する。
我々は、注意機構、マルチタスク学習、特徴伝達手法を統合し、F1スコア86.51%を達成するモデルを設計する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:42:24 GMT)
Proxy-Embedding as an Adversarial Teacher: An Embedding-Guided Bidirectional Attack for Referring Expression Segmentation Models [7.1] Referring Expression (RES)は、自然言語記述に基づく画像の正確なオブジェクトセグメンテーションを可能にする。
その印象的な性能にもかかわらず、RESモデルの敵の例に対する堅牢性はほとんど解明されていない。
本稿では RES モデルに対する埋め込み誘導双方向攻撃 PEAT を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:20:47 GMT)
Transversal STAR architecture for megaquop-scale quantum simulation with neutral atoms [7.0] 本研究では,時空効率的なアナログ回転(STAR)に基づく部分フォールトトレラントアーキテクチャを提案する。
表面符号を用いたSTARガジェットの論理ノイズモデルを作成し,その構成性を検証する。
STARアーキテクチャはその限界において、局所ハミルトンを600以上のシミュレーションボリュームで効率的にシミュレートすることができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:23:28 GMT)
Elucidating the Design Space of FP4 training [7.0] 本稿は,textttFP4トレーニングの設計空間を統一的に把握することを目的としている。
我々は、量子化をマイクロスケーリングするための包括的、量子化勾配に基づくフレームワークを導入する。
何千ものテクニックの組み合わせを体系的に評価することによって、どの構成が最も好ましいパフォーマンスとオーバヘッドのトレードオフを提供するかを特定します。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:50:40 GMT)
Clotho: Measuring Task-Specific Pre-Generation Test Adequacy for LLM Inputs [6.9] 特定のタスクで大規模言語モデルをテストするのは難しくてコストがかかります。
重要な課題は、タスクの要求を反映した方法で入力精度を評価することである。
タスク固有のプレジェネレーションアプライバシ尺度であるCLOTHOを導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:34:09 GMT)
Influence of Classification Task and Distribution Shift Type on OOD Detection in Fetal Ultrasound [6.9] OOD検出は分類モデルの不確実性を推定することに依存しており、OODサンプルの増加が期待できる。
我々は,OOD検出性能がタスクによって大きく異なり,最適なタスクは定義したID-OOD基準に依存することを示した。
医用画像解析におけるタスク選択と不確実性戦略を下流の特定の応用と整合させることの必要性を強調し、優れたOOD検出が最適不確実性予測を保証していないことを明らかにした。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:49:25 GMT)
MS-YOLO: A Multi-Scale Model for Accurate and Efficient Blood Cell Detection [6.8] 本研究は, YOLOv11フレームワークに基づく血液細胞検出モデルであるマルチスケールYOLO (MS-YOLO) を提案する。
MS-YOLOは検出性能を高めるために3つの重要なアーキテクチャ革新を取り入れている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:37:04 GMT)
Quantum Public Key Encryption for NISQ Devices [6.8] 量子公開鍵暗号(quantum public-key encryption, PKE)は、量子暗号において重要なプリミティブである。
量子古典的な公開鍵と古典的な暗号文を用いたPKE方式を設計する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:20:26 GMT)
Language-in-the-Loop Culvert Inspection on the Erie Canal [6.7] 1825年に建設されたエリー運河のような運河のカルバートは、安全運転を確保するために頻繁に検査を必要とする。
人間によるカルバートの検査は、年齢、幾何学、照明の質の悪さ、天候、容易なアクセスの欠如により困難である。
我々は,Webスケール視覚言語モデル(VLM)と制約された視点計画とを結合した,エンド・ツー・エンドの言語・イン・ザ・ループ自律システムであるVISIONを紹介した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:28:10 GMT)
AD-GS: Alternating Densification for Sparse-Input 3D Gaussian Splatting [6.7] 3次元ガウススプラッティング(3DGS)は、リアルタイムの新規なビュー合成において印象的な結果を示した。
重要な寄与要因は非制御の密度化であり、誘導なしで素粒子を迅速に加えると、幾何学に害を与え、アーティファクトを引き起こす可能性がある。
高密度・低密度化相をインターリーブする新しい交互デンシフィケーションフレームワークAD-GSを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:25:56 GMT)
A Generative Conditional Distribution Equality Testing Framework and Its Minimax Analysis [6.7] 我々のフレームワークはニューラルネットワークに基づく生成手法とサンプル分割技術に基づいて構築されている。
生成的置換に基づく条件分布等式テストと生成的分類精度に基づく条件分布等式テストの2つの特別試験を導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:59:18 GMT)
LLaVul: A Multimodal LLM for Interpretable Vulnerability Reasoning about Source Code [6.7] 現在の多くのアプローチでは、脆弱性分析を分類タスクとして重視しており、ニュアンスとコンテキストに依存した実世界のシナリオを単純化している。
LLaVulは,質問応答(QA)によるコードに対するきめ細かい推論を実現するために設計された,多モーダルな大規模言語モデルである。
我々のモデルは、ペア化されたコードと自然なクエリを統一された空間に統合し、コードの脆弱性に関する推論とコンテキストに依存した洞察を強化するように訓練されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 03:14:22 GMT)
Shilling Recommender Systems by Generating Side-feature-aware Fake User Profiles [6.6] Leg-UPフレームワークを拡張して、サイド機能を導入し、サイド機能対応のフェイクユーザプロファイルの生成を可能にします。
ベンチマーク実験により,本手法はステルス性を維持しながら強力な攻撃性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:43:11 GMT)
Evaluating the Safety and Skill Reasoning of Large Reasoning Models Under Compute Constraints [6.5] テストタイムの計算スケーリングは、より長いチェーン・オブ・シークエンスを生成することにより、推論言語モデルの性能を向上させる能力を示している。
この性能向上は、計算コストの大幅な増加を伴う。
本研究では,2つの計算制約戦略について検討し,推論モデルの計算要求を低減し,それらの安全性への影響について検討する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:09:37 GMT)
Forest tree species classification and entropy-derived uncertainty mapping using extreme gradient boosting and Sentinel-1/2 data [6.3] 本研究は,スウェーデンの森林において,画素レベルの不確実性推定を伴う新しい10mの樹種マップを提示する。
木種分類は、Sentinel-1とSentinel-2の衛星データから得られた測定値と、スウェーデン国立森林調査所の観測値に基づいている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:01:49 GMT)
"Let it be Chaos in the Plumbing!" Usage and Efficacy of Chaos Engineering in DevOps Pipelines [6.3] カオスエンジニアリング(CE)は、現代の分散システムのレジリエンスを改善するための積極的な方法として登場した。
本稿では,近年,産業実践者がCEの原則をどのように採用し,導入してきたのかを考察する,系統的なグレーの文献レビューを紹介する。
我々の研究は、CEのコアテットが引き続き影響力を持つ一方で、実践者は実験、自動化、リスク軽減戦略のコントロールをますます強調していることを明らかにした。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:15:02 GMT)
Enhancing Cross-Lingual Transfer through Reversible Transliteration: A Huffman-Based Approach for Low-Resource Languages [6.3] 低リソース言語をラテン文字に翻訳することは自然な解決策である。
本稿では,文字の書き起こしとHuffman符号化を併用して,完全な書き起こしフレームワークを設計する。
提案手法は,低リソース言語の性能を維持しつつ,低リソース言語処理能力を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:24:26 GMT)
Computational aspects of the trace norm contraction coefficient [6.2] 定数係数内での量子チャネルのトレースノルム収縮係数の近似はNPハードであることが示される。
また、収縮係数が 1 に等しいか、すなわちチャネルがビットを完全保存できるかどうかを決定するNP硬度も確立する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:44:32 GMT)
Multimodal Health Risk Prediction System for Chronic Diseases via Vision-Language Fusion and Large Language Models [6.2] 個人の健康リスクを積極的に予測できる統合マルチモーダルAIフレームワークは、緊急に必要である。
VL-RiskFormerは,言語モデル (LLM) の推論ヘッドを最上層に埋め込んだ階層型階層型視覚言語マルチモーダルトランスである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 05:26:59 GMT)
DETACH: Cross-domain Learning for Long-Horizon Tasks via Mixture of Disentangled Experts [6.2] DETACHは、生物学的にインスパイアされた二重ストリームの絡み合いによるLHタスクのためのクロスドメイン学習フレームワークである。
平均サブタスク成功率が23%、平均実行効率が29%向上する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:52:57 GMT)
3D Cell Oversegmentation Correction via Geo-Wasserstein Divergence [6.1] オーバーセグメンテーション(Oversegmentation)とは、1つの細胞が誤って複数のフラグメントに分割された場合である。
これは最終的なセグメンテーションの品質を低下させ、解決するのが非常に難しいことで知られている。
本稿では,これらの誤りを特定し,修正するための幾何学的枠組みを提案する。
また、新しい測度であるGeo-Wasserstein divergenceを導入し、2次元測地の変化を定量化する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:11:08 GMT)
MoCrop: Training Free Motion Guided Cropping for Efficient Video Action Recognition [6.0] MoCrop (MoCrop) は、圧縮された領域における効率的なビデオアクション認識のための、モーション対応の適応型収穫モジュールである。
MoCropは、H.264ビデオで利用可能なモーションベクトルを使用して、モーションセンス領域を特定し、推論時にすべてのIフレームに適用される単一のクリップレベルの作物を生成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 23:23:04 GMT)
"I think this is fair'': Uncovering the Complexities of Stakeholder Decision-Making in AI Fairness Assessment [5.9] ステークホルダーの公平性の決定は、一般的なAI専門家のプラクティスよりも複雑であることを示す。
私たちの結果は、利害関係者がAIフェアネスガバナンスと緩和に有意義に貢献する方法についての理解を深めます。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:12:12 GMT)
Filling in the Clinical Gaps in Benchmark: Case for HealthBench for the Japanese medical system [5.8] 本研究は,大規模かつルーリックな医療ベンチマークであるHealthBenchの日本の文脈への適用性について検討した。
ハイパフォーマンス多言語モデル(GPT-4.1)と日本語ネイティブオープンソースモデル(LLM-jp-3.1)の両方を評価するために,HealthBenchの5000シナリオの機械翻訳版を適用した。
以上より, GPT-4.1は, 難治性ミスマッチと日本語母語モデルに有意な障害がみられ, 臨床完全性は欠如していた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:36:12 GMT)
Co-STAR: Collaborative Curriculum Self-Training with Adaptive Regularization for Source-Free Video Domain Adaptation [5.8] Co-STARはカリキュラム学習と、ソース学習された教師と対照的な視覚言語モデル(CLIP)の協調的自己学習を統合している
カリキュラム学習アプローチでは,教師とCLIPの双方向予測アライメントを測定し,信頼性と不確実性の予測のバランスをとる信頼性に基づく重み関数を用いる。
さらに適応性を向上させるために,適応型カリキュラム正規化を提案し,その信頼性スコアと予測安定性に基づいて,確率的,適応的な方法でサンプルの学習優先度を変更する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:27:30 GMT)
DISCO: Mitigating Bias in Deep Learning with Conditional Distance Correlation [5.7] この研究は因果理論と実践的な深層学習を橋渡しし、堅牢な予測のための原則的基礎と効果的なツールを提供する。
5つの多様なデータセットにまたがって、我々の手法は、既存のバイアス軽減アプローチにおいて一貫して優れるか、競争力がある。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:41:16 GMT)
Entanglement manifestation of knot topology in a non-Hermitian lattice [5.7] モーメント空間に存在する異なる結び目構造に従って、1次元非エルミート四バンド格子モデルをマッピングする。
異なる結び目トポロジーは、絡み合いの大きさが異なることを示唆している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:08:27 GMT)
Demonstration of sequential processors with quantum advantage and analysis of classical performance limits [5.6] 同じ制約の下で、シーケンシャル量子および古典的プロセッサの表現率を比較する。
古典的プロセッサでは、出力と対象関数との相関関係の不等式の観点から、その性能のバウンダリを証明している。
量子プロセッサがこれらの不等式に違反していることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:09:01 GMT)
Reading Between the Lines: Scalable User Feedback via Implicit Sentiment in Developer Prompts [5.5] 我々は、開発者プロンプトの感情分析を用いて、ユーザの満足度を示す暗黙のシグナルを識別する。
このアプローチは、すべてのインタラクションの8%において、明示的なユーザフィードバックの13倍以上のレートでシグナルを識別できることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:37:42 GMT)
SD-VSum: A Method and Dataset for Script-Driven Video Summarization [5.5] スクリプト駆動のビデオ要約(VideoXum)の課題を紹介する。
我々は、ビデオ毎に利用できる異なる人間注釈の要約を自然言語で記述する。
我々はスクリプト駆動のビデオ要約(SD-VSum)のための新しいネットワークアーキテクチャを開発した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:15:35 GMT)
Test-Time Training Scaling Laws for Chemical Exploration in Drug Design [5.4] 強化学習(RL)を利用した化学言語モデル(CLM)は、デ・ノボ分子設計において有望であるが、しばしばモード崩壊に悩まされている。
大規模言語モデルにおけるTTT(Test-Time Training)の着想を得て,化学空間探索の促進を目的としたスケーリングTTTを提案する。
以上の結果から, 独立RLエージェントの増加によるTTTのスケーリングは, 対数線形スケーリング法に従い, MolExp が測定した探索効率を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:01:44 GMT)
B-Privacy: Defining and Enforcing Privacy in Weighted Voting [5.4] トークン保有率に比例して票を重み付けする投票システムは、既存の有権者プライバシの概念を覆すことを示す。
我々は、現在投票システムにおいて重要な問題である収賄に基づく「B-privacy」という概念を導入する。
本稿では,投票率を高く評価することで,B-privacyを高めるメカニズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:11:12 GMT)
ClaimCheck: Real-Time Fact-Checking with Small Language Models [5.3] ClaimCheckは、現実のクレームを検証するために設計されたLLM誘導のファクトチェックシステムである。
大規模なクローズドソースモデルに依存する従来のシステムとは異なり、ClaymCheckは透過的でステップワイズな検証パイプラインを採用している。
各モジュールは小さなLLMに最適化されており、システムは正確で解釈可能なファクトチェックを提供することができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:18:08 GMT)
Towards General Computer Control with Hierarchical Agents and Multi-Level Action Spaces [5.3] 我々は,OS制御を2段階のオプションプロセスとして定式化する軽量階層型強化学習フレームワークであるComputerAgentを導入する。
135の現実世界のデスクトップタスクで、ComputerAgentは92.1%の簡単なタスクで成功し、58.8%のハードタスクで成功している。
その結果、階層型RLは、コンピュータ制御のためのモノリシックMLLMベースの自動化に代わる実用的でスケーラブルな代替手段を提供することを示した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:14:47 GMT)
ReGeS: Reciprocal Retrieval-Generation Synergy for Conversational Recommender Systems [5.2] ReGeSは、逆のRetrieval-Generation Synergyフレームワークであり、ジェネレーション強化された検索と検索強化された生成を統一する。
ReGeSは、知識集約型CRSタスクに対する相互シナジーの有効性を実証し、推奨精度で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:47:57 GMT)
FROQ: Observing Face Recognition Models for Efficient Quality Assessment [5.2] 顔認識(FR)は多くの重要な(高い)応用において重要な役割を担っている。
最先端のFIQA技術の多くは、正確な品質推定を達成するために広範囲の教師付きトレーニングに依存している。
本稿では、顔画像の品質を半教師あり、トレーニングなしのアプローチであるFROQを紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:29:44 GMT)
Comparing Data Assimilation and Likelihood-Based Inference on Latent State Estimation in Agent-Based Models [5.1] 本稿では,エージェントベースモデル(ABM)の文脈において,データ同化(DA)とIslihood-based Inference(LBI)を初めて体系的に比較する。
LBIは、モデルの可能性を直接活用することで、より正確な状態推定を提供するが、手作りの、モデル固有の可能性関数を必要とするコストがかかる。
LBIはエージェントレベルの推論に好適であるのに対し, DAは集約予測に好適であることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:34:55 GMT)
Improving After-sales Service: Deep Reinforcement Learning for Dynamic Time Slot Assignment with Commitments and Customer Preferences [5.1] ハイテクメンテナンスは、顧客とサービスエンジニアの緊密な調整を含む、アフターセールサービスの戦略的コンポーネントである。
我々は、この階層的かつシーケンシャルな意思決定問題-コミットメントと顧客優先を伴う動的時間スロット割り当て問題(DTSAP-CCP)について検討する。
1)ロールアウト実行による注意に基づく深層強化学習(ADRL-RE)と,2)シナリオベース計画手法(SBP)の2つのアプローチが提案されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:09:39 GMT)
An Empirical Study on the Robustness of YOLO Models for Underwater Object Detection [5.1] 6つの模擬水中環境における最近のYOLO変異体(YOLOv8-YOLOv12)の総合評価を行った。
以上の結果から,YOLOv12は全体的な性能が最も高いが,騒音に強いことが示唆された。
実験の結果、画像数とインスタンス頻度は、主に検出性能を駆動し、物体の外観は二次的な影響しか与えないことがわかった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 10:55:21 GMT)
Evaluating the Creativity of LLMs in Persian Literary Text Generation [5.1] 我々は、20の多様なトピックにまたがるユーザー生成ペルシア文学のデータセットを構築した。
創造的思考のTorrance Testsを適応させることにより、創造性、流布性、柔軟性、実験の4つの側面に沿ったモデル出力を評価する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:32:56 GMT)
DINOv3-Diffusion Policy: Self-Supervised Large Visual Model for Visuomotor Diffusion Policy Learning [4.9] 本研究は, 自己制御型エンコーダが従来型のイメージネット型バックボーンに適合するか, 越えられるかを検討する。
微調整されたDINOv3がいくつかのタスクでResNet-18にマッチするか、超えていることがわかった。
ResNet18をバックボーンとして使用するのと比較して、DINOv3に対する我々のアプローチは、テストタイムの成功率を10%まで向上させる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:27:26 GMT)
A non-smooth regularization framework for learning over multitask graphs [4.9] 非滑らかな正規化技術は、ポーラシティを促進し、グラフ上の断片的な定数遷移を促進するのに特に効果的である。
本稿では,正規化最適化問題に対する効率的な解法を実現するための分散学習手法を提案する。
より広い適用性と計算効率の向上のために、よく使われる非平滑正規化器の閉形式式を導出する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:58:53 GMT)
A Single Image Is All You Need: Zero-Shot Anomaly Localization Without Training Data [4.9] 画像内の異常検出は、通常、トレーニングデータのコレクションから学習するか、参照サンプルに依存することで対処される。
本稿では,畳み込みニューラルネットワークの帰納バイアスを利用した単一像の異常な局所化手法を提案する。
我々の手法はSingle Shot Decomposition Network (SSDnet) と呼ばれる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:29:20 GMT)
Prepare Before You Act: Learning From Humans to Rearrange Initial States [4.6] イミテーション学習(IL)は、幅広い操作タスクで有効であることが証明されている。
本稿では,初期状態を取り,オブジェクトのポーズを自律的に修正するアルゴリズムReSETを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:18:52 GMT)
The Many Faces of Non-invertible Symmetries [4.5] 特に、融合圏対称性 $mathcalC$ は弱ホップ代数 $H$ で符号化された代数対称性を誘導することを示す。
弱ホップ代数的非可逆対称性の対称性破壊パターンを解析するためのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:53:19 GMT)
Evaluating LLM-Generated Versus Human-Authored Responses in Role-Play Dialogues [4.4] 本研究では,マルチターン・プロフェッショナル・トレーニング・シミュレーションにおけるLLMと人間による応答を比較した。
人体評価の結果,LLM生成応答品質はターン毎に著しく低下した。
参加者はまた、人間が書いた対話に対して一貫した好みを示した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:33:02 GMT)
Informed, but Not Always Improved: Challenging the Benefit of Background Knowledge in GNNs [4.2] バックグラウンド知識(BK)グラフは、グラフベースの機械学習パイプラインで使用される。
我々は,BKが重要な実世界の課題である癌分類サブタイプにおいて果たす役割について検討する。
我々は、BKを用いた最先端のGNNが、非インフォームドモデルより優れていることを発見した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:51:15 GMT)
PerceiverS: A Multi-Scale Perceiver with Effective Segmentation for Long-Term Expressive Symbolic Music Generation [4.1] PerceiverS(セグメンテーション・アンド・スケール)は、長い構造化された表現力のある音楽を生成するために設計された新しいアーキテクチャである。
本手法は,長期的構造的依存関係と短期的表現的詳細を同時に学習することにより,記号的音楽生成を促進する。
提案したモデルは,Maestroデータセットを用いて評価され,コヒーレントで多様な音楽を生成する方法の改善が示されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 03:03:57 GMT)
From Benchmarks to Reality: Advancing Visual Anomaly Detection by the VAND 3.0 Challenge [4.0] 本稿では, 異常検出の現在の進歩を示すために, VAND 3.0 Challengeを提案する。
このチャレンジでは2つのトラックが開催され、現実世界の分布シフトに対して堅牢な異常検出手法の開発が促進された。
参加者のソリューションは、既存のアプローチを組み合わせたり、適応させたりすることで、以前のベースラインよりも大幅に改善された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:27:49 GMT)
Is It Certainly a Deepfake? Reliability Analysis in Detection & Generation Ecosystem [4.0] ディープフェイク検出器の包括的不確実性解析を行った。
生成アーティファクトが予測信頼性に与える影響について検討する。
我々の観測に基づいて、不確実性多様体は、深い震源検出のために不確実性を利用するのに十分な一貫性のある情報を保持する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:09:13 GMT)
Global Optimization via Softmin Energy Minimization [4.0] 本稿では,局所最小値間の相互作用を効率的に回避し,大域的最適点を求めるために,新しい勾配に基づく粒子最適化手法を提案する。
本手法は, シミュレーションアニーリングに対する有効電位を低減し, 局所最小値間の高速な遷移を容易にすることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:09:19 GMT)
Artificial Liver Classifier: A New Alternative to Conventional Machine Learning Models [3.9] 本稿では,ヒト肝解毒機能に触発された新しい教師あり学習モデルであるArtificial Liver(ALC)を紹介する。
ALCの特徴は、その単純さ、スピード、多クラス分類問題に対処する際のオーバーフィッティングの削減と有効性である。
提案したALCを,Iris Flower,Breast Cancer Wisconsin,Wine,Voice Gender,MNISTの5つのベンチマークデータセットで評価した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:56:06 GMT)
SingLEM: Single-Channel Large EEG Model [3.9] 単一チャネル脳波から堅牢で汎用的な表現を学習する自己教師型基礎モデルであるSingLEMを紹介する。
SingLEMは、9,200人以上の被験者と357,000人の単一チャネル時間からなる71のパブリックデータセットで事前訓練されている。
その結果、単一チャネルアプローチは、微細な神経生理学的解析と解釈可能性の向上を可能とし、最先端の一般化を実現することができることを示した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:46:58 GMT)
Fair Decisions through Plurality: Results from a Crowdfunding Platform [3.8] プラットフォームが使用していた前回のアルゴリズムであるQuardratic Funding (QF)は、その設計が孤立的で自己中心的な個人モデルに根ざしていることから、問題に直面した。
我々は,複数の社会ユーティリティの理論に根ざした,相互接続指向の二次融資(CO-QF)の代替アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:06:23 GMT)
Speaking at the Right Level: Literacy-Controlled Counterspeech Generation with RAG-RL [3.8] 保健情報の拡散は公衆衛生にとって重大な脅威となる。
そこで我々は,異なる健康リテラシーレベルに適合したコーディネート音声を生成するための制御リテラシーフレームワークを提案する。
主観的ユーザ嗜好と客観的可読性に基づく報奨を取り入れた報奨関数を設計し、対象の健康リテラシーレベルに対する対抗音声を最適化する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:44:51 GMT)
Observation of synchronization between two quantum van der Pol oscillators in trapped ions [3.8] 同期化は非線形力学の目印であり、システム全体にわたって自己組織的な振る舞いを駆動する。
ここでは、トラップイオンを用いた2つの量子ファンデルポル振動子間の同期を実証する。
本研究は, 量子状態における極限サイクル同期を確立し, 大規模ネットワークにおける複雑な同期力学の探求への道を開くものである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:05:46 GMT)
No Need for Learning to Defer? A Training Free Deferral Framework to Multiple Experts through Conformal Prediction [3.7] 本稿では,共形予測に基づくエキスパート推論のための訓練不要,モデル非依存,エキスパート非依存のフレームワークを提案する。
我々の手法は、スタンドアローンモデルと最強の専門家の両方より一貫して優れています。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:32:27 GMT)
Explainability matters: The effect of liability rules on the healthcare sector [3.7] 我々は、医療における責任の枠組みを確立する上で、説明責任が重要な役割を担っていると論じる。
我々は、医療における責任の枠組みを確立する上で、説明責任が重要な役割を担っていると論じる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 03:11:30 GMT)
An Unlearning Framework for Continual Learning [3.5] 連続学習のためのアンラーニングフレームワークUnCLeを提案する。
UnCLeは、タスク埋め込みを使用してタスク固有のネットワークパラメータを生成するために、ハイパーネットワークを使用する。
複数のビジョンデータセットに対する実証的な評価は、UnCLeが複数の学習および未学習操作を順次実行する能力を示している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:51:18 GMT)
BiLCNet : BiLSTM-Conformer Network for Encrypted Traffic Classification with 5G SA Physical Channel Records [3.5] 生のチャネルレコードを構造化表現に変換する前処理パイプラインを開発した。
本稿では,BiLSTMの逐次モデリング機能とコンフォーマーブロックの空間的特徴抽出強度を統合したBiLSTM-Conformer Network (BiLCNet)を提案する。
分類精度は93.9%であり,従来の機械学習アルゴリズムやディープラーニングアルゴリズムよりも優れている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:27:11 GMT)
A State-Update Prompting Strategy for Efficient and Robust Multi-turn Dialogue [3.4] トレーニング不要なプロンプトエンジニアリング手法であるState-Update Multi-turn Dialogue Strategyを提案する。
対話履歴を効果的に管理するために「国家復興」と「歴史レミンド」のメカニズムを利用する。
我々の戦略は、複数のマルチホップQAデータセットにまたがる強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:26:24 GMT)
Crosslingual Optimized Metric for Translation Assessment of Indian Languages [3.4] 我々は、21の翻訳方向をカバーする13のインドの言語に対して、人間の評価評価データセットを作成する。
次に、このデータセットに基づいて、言語間最適化基準(COMTAIL)というニューラルネットワーク評価指標をトレーニングする。
最高のパフォーマンスのメートル法変種は、少なくとも1つのインド語の翻訳ペアをアジャッジする場合に、過去の最先端技術よりも顕著なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:11:42 GMT)
Reinforced Generation of Combinatorial Structures: Applications to Complexity Theory [3.4] 我々は、AIのテクニックが、効率的なアルゴリズムの証明可能な限界を改善する新しい構造を見つけるのに役立つかどうかを探る。
具体的には、AlphaEvolveを使って、a)MAX-CUTの平均ケース硬度とMAX-Independent Setの2つの設定を研究します。
改良された下界は、最大163$のノード上にほぼ極端ラマヌジャングラフを構築することで得られる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:30:33 GMT)
Bilateral Distribution Compression: Reducing Both Data Size and Dimensionality [3.3] 既存の分布圧縮法は、元の集合と圧縮された集合の間の最大平均離散性(MMD)を最小化することでデータセットサイズを削減する。
両軸に沿って圧縮し,基礎となる分布を保存した2段階のフレームワークであるバイラテラル分布圧縮(BDC)を提案する。
実験により、BDCは環境空間圧縮に匹敵する性能または優れた性能を著しく低コストで達成できることが示された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:01:52 GMT)
Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS) [3.3] サンゴ礁の再生には、資源分布と幼虫の健康モニタリングのために、正確で連続的な産卵数を必要とする。
低コストのモジュラーカメラと、人間-イン・ザ・ループラベリング手法を用いて訓練された物体検出装置を用いて、Calal Spawn and Larvae Imaging Camera System (CSLICS)を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 00:47:32 GMT)
From OCL to JSX: declarative constraint modeling in modern SaaS tools [3.2] JSXは、Reactエコシステムで使用されているJavaScript/TypeScriptの宣言的で機能的なサブセットである。
Object Constraint LanguageのJavaScriptベースの実装であるOCL.jsは、モデル検証に対するWeb整合したアプローチを提供する。
JSXは、より広く、より適合したフロントエンドファーストアーキテクチャを提供し、モダンなモデリングツールにおける制約仕様への将来性を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:37:15 GMT)
AccessEval: Benchmarking Disability Bias in Large Language Models [3.2] 大きな言語モデル(LLM)は、さまざまなドメインにまたがってデプロイされることが多いが、実際のクエリの処理方法に相違があることが多い。
textbfAccessEval(アクセシビリティ評価)は、6つの現実世界ドメインと9つの障害タイプにわたる、21のクローズドおよびオープンソースLSMを評価するベンチマークである。
分析の結果,障害対応クエリに対する応答は,中立クエリに比べて負のトーン,ステレオタイピングの増大,事実エラーの増大がみられた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:49:03 GMT)
Efficient Measurement Error Mitigation with Subsystem-Balanced Pauli Twirling [3.1] モデルフリー測定誤差軽減(MEM)は、信頼性の高い量子計算を実現する上で不可欠である。
本稿では,サブシステムにおけるパウリ演算子バランスを強制し,測定ノイズを選択的に抑制するサブシステムバランス付きパウリツイリング(SB-PT)を提案する。
この研究は、短期量子デバイスにおける高忠実度測定への資源フルーガルで実験的に実現可能な経路を提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 00:39:32 GMT)
Understanding Post-Training Structural Changes in Large Language Models [3.1] 後学習は大規模言語モデル(LLM)の振る舞いを根本的に変える
本研究は,指導チューニングと長鎖蒸留(Long-CoT)の2つの広く採用されているポストトレーニング手法に焦点をあてる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:03:36 GMT)
Distributionally Robust Safety Verification of Neural Networks via Worst-Case CVaR [3.0] 本稿では、ニューラルネットワーク検証のためのFazlyabの2次制約(QC)と半定値プログラミング(SDP)フレームワークを構築する。
この統合により、入力不確かさをカバーする楕円体、ポリトープ、超平面が拡張され、安全クリティカルドメインへの適用性も拡張される。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:04:53 GMT)
TIDMAD: Time Series Dataset for Discovering Dark Matter with AI Denoising [3.0] ダークマターの起源は 現代物理学において 最も重要な問題の一つです
ABRACADABRA実験は暗黒物質を探索するために特別に設計された。
このデータリリースは、コアAIアルゴリズムが信号を抽出し、実際の物理結果を生成することを可能にする。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 23:00:02 GMT)
A Survey of Cognitive Distortion Detection and Classification in NLP [3.0] この調査は、認知歪み(CD)分野における20年間にわたる38の研究の総括的レビューである。
CDは、人々が出来事を理解し、自分自身を判断し、世界に対して反応する方法を歪める、否定的に偏見または欠陥のある思考である。
我々は、CD分類基準を統合化し、共通タスク設定を要約し、より一貫性のある再現可能な研究を支援するための永続的な課題を強調します。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:44:25 GMT)
Overview of PlantCLEF 2023: Image-based Plant Identification at Global Scale [3.0] PlantCLEF2023の課題は、幅広いクラスの集合を含むマルチイメージ(およびメタデータ)の分類問題に対処することを目的としている。
本稿では,課題の資源と評価について概説し,参加研究グループで採用する手法とシステムについて概説し,重要な知見の分析を行う。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:34:10 GMT)
Overview of PlantCLEF 2022: Image-based plant identification at global scale [3.0] 世界には30万種以上の植物が生息していると推定されている。
深層学習技術は、植物生物多様性のグローバルな同定という、究極的で現実的な問題に対処できるほど成熟したように思える。
PlantCLEF2022 Challenge Editionは、マルチイメージ(およびメタデータ)の分類問題に取り組むことで、この方向への一歩を踏み出すことを提案している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:40:21 GMT)
Fine-Grained Detection of AI-Generated Text Using Sentence-Level Segmentation [2.9] 人間とAI生成テキスト間の遷移を検出するための文レベルのシーケンスラベリングモデルの提案
我々のモデルは、ニューラルネットワーク(NN)と条件ランダムフィールド(CRF)を組み込んだ最先端の事前学習トランスフォーマーモデルを組み合わせる。
評価は、協力的な人間とAI生成されたテキストを含む2つの公開ベンチマークデータセットで実行される。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:22:55 GMT)
Virtual Arc Consistency for Linear Constraints inCost Function Networks [2.9] 我々は線形制約を扱うために既存のSACアルゴリズムを適用した。
提案アルゴリズムは,複数のベンチマークにおいて,元のアルゴリズムと比較して下位境界を著しく改善することを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:44:52 GMT)
On Quantification of Borrowing of Information in Hierarchical Bayesian Models [2.8] 階層型ベイズモデルにおける共有ハイパーパラメータの役割について検討する。
より深い階層を持つモデルは、ネストされたモデルを上回る傾向にあることを示す。
これらの知見はベイジアン・モデリングに重要な意味を持つ。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 00:48:27 GMT)
Convergence analysis of equilibrium methods for inverse problems [2.8] ここでは、ある正規化作用素 (R) に対して (A*(A x - ydelta) + α R(x) = 0) の解として近似解が定義される。
正規化作用素が函数の勾配であるとき、INVは古典的変分正規化に還元される。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 05:32:33 GMT)
Towards Systematic Specification and Verification of Fairness Requirements: A Position Paper [2.8] 差別は、よく特定された公正要件の欠如とその検証の結果であると主張する。
フェアネスに関する専門家の知識が暗黙的であるという事実は、正確で検証可能なフェアネス要件を特定することを困難にしている。
フェアネスのための知識グラフに基づくフレームワークの開発を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:37:18 GMT)
Enhanced fill probability estimates in institutional algorithmic bond trading using statistical learning algorithms with quantum computers [2.8] 取引順序の充足確率の推定は、アルゴリズム取引戦略の最適化において重要な要素である。
量子データ変換を非結合のオフラインコンポーネントとして組み込むためのフレームワークを導入し、モデルによって選択的にクエリできる。
我々は、量子ハードウェアレイテンシーデータにアクセス可能なモデルに対して、サンプル外テストスコアの34%の相対的な増加を観察する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:51:31 GMT)
Modeling the Attack: Detecting AI-Generated Text by Quantifying Adversarial Perturbations [2.8] 現代の検出器は敵の攻撃に弱いことで知られており、パラフレーズは効果的な回避技術として際立っている。
本稿では,まず,標準的な対人訓練の限界を定量化することにより,対人的堅牢性の比較研究を行う。
次に、新しい、はるかに回復力のある検出フレームワークを紹介します。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:03:53 GMT)
Look, Focus, Act: Efficient and Robust Robot Learning via Human Gaze and Foveated Vision Transformers [2.7] 人間の視覚は視線によって駆動される非常に活発なプロセスであり、ファベーションを通じてタスク関連領域に注意を向ける。
本研究では,ロボット政策に人間のようなアクティブな視線を取り入れることで,効率性とロバスト性を高める方法について検討する。
我々は人間の頭と首の動きをエミュレートするロボットビジョンシステムであるGIAVAを開発し、ファーベレート処理のための視線調整を行う。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:42:33 GMT)
Transformer-Encoder Trees for Efficient Multilingual Machine Translation and Speech Translation [2.7] 多言語翻訳のためのコネクショナリズム時間分類法を用いて学習した非自己回帰エンコーダのみのモデルと組み合わせた新しい階層変換木(TET)を提案する。
音声翻訳では,TETと非自己回帰音声認識バックボーン(wav2vec2)を組み合わせることで,自己回帰システムの7~14倍の速さで,翻訳品質の面で有望な結果が得られる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:52:18 GMT)
Toward Affordable and Non-Invasive Detection of Hypoglycemia: A Machine Learning Approach [2.7] 本稿では,ウェアラブルセンサで一般的に捉えられる生体信号であるGalvanic Skin Response (GSR)を用いて,非侵襲的に状態を分類する方法を提案する。
統合されたOttoT1DM 2018と2020のデータセットを使用して、低血糖とノルモ血糖を実現する機械学習パイプラインを構築しています。
検証セットと95%の信頼区間が報告され、信頼性の評価が向上する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:32:07 GMT)
Automatic Intermodal Loading Unit Identification using Computer Vision: A Scoping Review [2.6] 本稿では,コンピュータビジョン(CV)に基づくソリューションを提案する63の研究をレビューする。
CVは他の種類の識別技術に費用対効果のある代替手段を提供する。
その開発は、公開可能なベンチマークデータセットの欠如によって妨げられている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:45:35 GMT)
Automated Labeling of Intracranial Arteries with Uncertainty Quantification Using Deep Learning [2.6] 3D Time-of-light Magnetic Resonance Angiography (3D ToF-MRA) を用いたディープラーニングによる自動動脈ラベル作成フレームワークを提案する。
我々のフレームワークは、自動脳血管ラベリングのためのスケーラブルで正確で不確実なソリューションを提供し、下流血行動態解析をサポートし、臨床統合を容易にする。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:57:21 GMT)
Reasoning Core: A Scalable RL Environment for LLM Symbolic Reasoning [2.6] Reasoning Coreは、Reinforcement Learning with Verifiable Rewards(RLVR)のための新しいスケーラブルな環境である。
Reasoning Coreは、PDDL計画、一階述語論理、文脈自由文法解析、因果推論、システム方程式解など、中核的な形式ドメイン間の問題を手続き的に生成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:56:38 GMT)
GraDeT-HTR: A Resource-Efficient Bengali Handwritten Text Recognition System utilizing Grapheme-based Tokenizer and Decoder-only Transformer [2.3] 世界で6番目に話されている言語であるにもかかわらず、ベンガル語のための手書き文字認識システムはいまだに未発達のままである。
本稿では,GraDeT-HTRについて述べる。これは,Grapheme対応のデコーダのみのトランスフォーマアーキテクチャに基づく,リソース効率の良いベンガル手書きテキスト認識システムである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:56:17 GMT)
Approximating invariant functions with the sorting trick is theoretically justified [2.2] 我々は正準化の近似理論を確立する。
群平均化と比較すると、正準化はより効率的に計算できる。
理論的分析から得られた2つの重要な知見と、それらがなぜ興味深い研究方向性を示すのかを議論する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 04:31:02 GMT)
Smart Routing for EV Charge Point Operators in Mega Cities: Case Study of Istanbul [2.2] 非効率な人事管理は、時間損失、高い運用コスト、資源の浪費につながる可能性がある。
本研究では,EV充電ネットワークの保守作業の計画を最適化する統合手法を提案する。
この方法はPythonで開発され、イスタンブールの100台のEV充電ステーションからなるデータセットに適用された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:40:28 GMT)
Interactive Real-Time Speaker Diarization Correction with Human Feedback [2.1] 本研究では,LLMを用いた話者ダイアリゼーション補正システムを提案する。
本システムでは、DERを9.92%削減し、話者混同誤差を44.23%削減する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:01:20 GMT)
The Narcissus Hypothesis:Descending to the Rung of Illusion [2.1] 我々は,モデルが客観的推論よりも満足あるいは平らな反応を好むという仮説を検証した。
その結果、社会的に適合する形質への大きな流れが明らかとなった。
次に、再帰が高次推論を崩壊させる可能性をトレースする、新しい解釈を提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:39:22 GMT)
Probabilistic Geometric Principal Component Analysis with application to neural data [2.1] 神経科学の応用において、データはユークリッド空間に横たわるのではなく、非線形幾何学(つまり多様体)の周りに分散される。
本研究では,新しい次元化アルゴリズムとして,確率的幾何学的主成分分析法(PGPCA)を開発した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 23:00:31 GMT)
Robotic Skill Diversification via Active Mutation of Reward Functions in Reinforcement Learning During a Liquid Pouring Task [2.1] 本稿では,強化学習における報酬関数の意図的な変異が,ロボット操作作業における多彩なスキルのバリエーションをいかに生み出すかを検討する。
この研究はNVIDIA Isaac Simで作られたシミュレーション環境で実施された。
セットアップには、容器に注ぐ必要がある液体の入ったガラスを持ったフランカ・エミカ・パンダのロボットアームが含まれていた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:35:08 GMT)
An Efficient Self-Supervised Framework for Long-Sequence EEG Modeling [2.1] 脳波表現学習のための自己教師型フレームワークであるEEGM2を提案する。
EEGM2は、ショートシーケンスとロングシーケンスの両方のモデリングと分類において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:27:18 GMT)
Sub-femtosecond stabilization of multicore fiber for high-fidelity quantum networking at 100% duty cycle [2.1] MCFコアは高いノイズ相関を持ち、様々な用途に利用できる。
一方のコア上で100アト秒の統合ジッタを、他方のコアから派生した位相情報を用いて実現する。
MCFによる我々の結果は、量子チャネル上で100%のデューティサイクルを持つ超安定量子ネットワークに対する有望なアプローチである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:30:43 GMT)
OpenGVL - Benchmarking Visual Temporal Progress for Data Curation [2.1] データ不足は、ロボティクスの進歩を推し進める上で最も制限される要因の1つだ。
野生で利用可能なロボットデータの量は指数関数的に増えている。
信頼性の高い時間的タスク完了予測は、このデータを自動アノテートし、大規模にキュレートするのに役立ちます。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:52:55 GMT)
Mitigating Source and Detection Noises in Auto-correlative Weak-Value Amplification [2.1] 自動相関弱値増幅(AWVA)は,レーザパワー変動と検出ノイズの両方を抑制することを示す。
AWVAは、高出力レーザーノイズが支配される状態と光子スターベッド状態の両方の精度を向上させる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:55:59 GMT)
Can multimodal representation learning by alignment preserve modality-specific information? [2.1] マルチモーダル表現学習技術は、同じ地理的領域で取得された異なるモーダルの衛星データ間の空間的アライメントを利用する。
仮定をシンプルにすると、アライメント戦略が基本的に情報損失につながることが示される。
我々は、マルチモーダル衛星データの組み合わせに関して、対照的な学習の新たな発展を支援したい。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:06:10 GMT)
Enhanced Interpretable Knowledge Tracing for Students Performance Prediction with Human understandable Feature Space [2.1] 知識追跡(KT)は、学生の熟練度を評価し、将来のパフォーマンスを予測する上で中心的な役割を果たす。
我々の貢献は、予測力と解釈可能性のバランスを保ち、適応学習システムの有用性を推し進めることである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:47:28 GMT)
Can maiBERT Speak for Maithili? [2.0] Maithiliは何百万人もの人に話されているが、十分な計算資源がない。
Maithili 専用の BERT ベースの言語モデルであるmaiBERT を紹介する。
本モデルは,新たに構築したMaithiliコーパスを用いて学習し,ニュース分類タスクを通じて評価する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:46:34 GMT)
On Multi-entity, Multivariate Quickest Change Point Detection [2.0] 変更点検出(CPD)は、従来のセンシング手法が実現不可能なクラウドモニタリングのアプリケーションによって動機付けられている。
本稿では,正常度からの個人偏差(IDfN)の概念を紹介し,正常度を訓練した再構成エラーベースのオートエンコーダを用いて計算する。
平均値、分散値、カーネル密度推定値(KDE)を用いてこれらの個々の偏差を集約し、システムワイド異常スコア(SWAS)を生成する。
我々の教師なしアプローチはラベル付きデータや特徴抽出の必要性を排除し、ストリーミング入力のリアルタイム操作を可能にします。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:35:24 GMT)
HuMam: Humanoid Motion Control via End-to-End Deep Reinforcement Learning with Mamba [2.0] We present HuMam, a state-centric end-to-end RL framework that using a single-layer Mamba encoder to fuse robot-centric state with oriented footstep target and a continuous phase clock。
mc-mujocoのJVRC-1ヒューマノイドでは、HuMamは学習効率、トレーニング安定性、全体的なタスクパフォーマンスを継続的に改善する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:19:55 GMT)
AI, Digital Platforms, and the New Systemic Risk [2.0] 我々は、AI、プラットフォーム、ハイブリッドシステムガバナンスにおけるシステムリスクを理解するための厳格なフレームワークを開発する。
我々は、EUのAI法やデジタルサービス法を含む最近の法律は、体系的なリスクを呼び起こすが、狭小または曖昧な特徴に依存していると主張している。
我々のフレームワークは、複数のAIエージェントの相互作用に起因するシステム障害の可能性を含む、新しいリスクパスを強調している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:14:23 GMT)
Findings of the Fourth Shared Task on Multilingual Coreference Resolution: Can LLMs Dethrone Traditional Approaches? [1.6] 本稿は,多言語協調解決に関する共有課題の第4版の概要を述べる。
以前の版と同様に、参加者は参照を識別し、アイデンティティのコア参照に従ってそれらをクラスタ化するシステムを開発するよう求められた。
今年のタスクの重要な革新は、専用の大規模言語モデルトラックの導入だった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:52:32 GMT)
AI Copilots for Reproducibility in Science: A Case Study [1.6] オープンサイエンスのイニシアチブは、研究成果をより透明で、アクセス可能で、再利用可能なものにしようと試みているが、公表された発見が独立して再生できることを保証することは、依然として永続的な課題である。
この記事では、研究者、レビュアー、読者を支援するAIベースのプラットフォームであるOpenPubを紹介します。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:37:47 GMT)
Trainee Action Recognition through Interaction Analysis in CCATT Mixed-Reality Training [1.6] 重要なケア航空輸送チームのメンバーは、飛行中に人工呼吸器、IVポンプ、吸引装置を管理することで重傷を負った兵士を安定させなければならない。
シミュレーションとマルチモーダルデータ分析の最近の進歩は、より客観的で包括的なパフォーマンス評価を可能にする。
本研究では, CCATT のメンバーが, エアロメディカル避難の高圧条件を再現する混合現実感シミュレーションを用いて, どのように訓練されているかを検討する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:19:45 GMT)
Evaluating Generative AI as an Educational Tool for Radiology Resident Report Drafting [1.5] 本研究は,HIPAA 準拠の GPT-4o システムを用いて,実地臨床環境において住民が作成した乳房画像報告を自動的にフィードバックするシステムについて検討した。
1) キー発見の欠落または追加,(2) 技術的記述子の誤用または欠落,(3) 結果と一致しない最終評価の3つの一般的な誤り型が同定された。
GPT-4oは、90.5%、78.3%、90.4%のエラータイプで、コンセンサスに強く同意している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:51:09 GMT)
Does Embodiment Matter to Biomechanics and Function? A Comparative Analysis of Head-Mounted and Hand-Held Assistive Devices for Individuals with Blindness and Low Vision [1.4] Microsoft Seeing AIは視覚障害者の環境情報へのアクセスを改善する(pBLV)
本研究では、11人のpBLV参加者が、手持ちスマートフォンとヘッドマウントARxビジョンシステムで、毎日の6つの活動を実行するためにSeeeing AIを使用した。
機能的成果として, 作業時間, 成功率, 試行回数, 生体力学的指標として, 関節可動域, 角道長, 作業量, 運動の滑らかさがあげられる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:23:33 GMT)
Federated Learning in the Wild: A Comparative Study for Cybersecurity under Non-IID and Unbalanced Settings [1.4] フェデレートラーニング(FL)は、複数のクライアントにわたるMLモデルの協調トレーニングを可能にする新しいパラダイムとして登場した。
本研究は、DDoS攻撃に対する侵入検知の文脈において、FL法を体系的に評価し、評価する。
我々の知る限りでは、現実的な非i.d.とアンバランスな設定下での侵入検出のためのFLアルゴリズムの比較分析はこれが初めてである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:25:32 GMT)
LLaSA: A Sensor-Aware LLM for Natural Language Reasoning of Human Activity from IMU Data [1.4] ウェアラブルシステムは、IMUデータから活動を認識することができるが、その根本原因や文脈的重要性を説明するのに失敗することが多い。
我々は,35,960個のIMUカプセルペアからなるSensorCapと199,701個の質問応答ペアからなるOpenSQAの2つの大規模リソースを紹介した。
我々はLLaSAを開発した。LLaSAは、生のIMUデータに基づくオープンエンド質問に対する解釈可能な、文脈に富んだ応答を生成する、コンパクトなセンサ対応言語モデルである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:02:03 GMT)
The CRITICAL Records Integrated Standardization Pipeline (CRISP): End-to-End Processing of Large-scale Multi-institutional OMOP CDM Data [1.4] このデータセットは、地理的に多様な4つのCTSA機関にわたる371,365人の患者の95億件の記録を含んでいる。
CRITICALのユニークな強みは、ICU前、ICU前、ICU後など、フルスペクトルの患者旅行を捉えることである。
この貴重なリソースの可能性を最大限に活用するためにCRISPを提示する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:23:08 GMT)
GaussianPSL: A novel framework based on Gaussian Splatting for exploring the Pareto frontier in multi-criteria optimization [1.3] 本稿では,多目的最適化を用いた非目的多様性学習のための新しいアプローチを提案する。
本手法は各領域の局所的特徴を統合し,新たなアグリゲータフレームワークによって統合する。
実験の結果,本手法は非目的多様性学習において標準PSLモデルよりも優れていた。
この作業は、挑戦的な現実世界のベンチマークの下で、効果的でスケーラブルな新たな方向性を提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:21:22 GMT)
Mind the Gap: Evaluating Model- and Agentic-Level Vulnerabilities in LLMs with Action Graphs [1.0] 本稿では,エージェント実行を粒度のアクションとコンポーネントグラフに分解する可観測性に基づく評価フレームワークであるAgenSeerを紹介する。
モデルレベルとエージェントレベルの脆弱性プロファイルの根本的な違いを示す。
エージェントレベルの評価は、従来の評価には見えないエージェント固有のリスクを明らかにする。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:19:43 GMT)
Enhancing Clinical Decision-Making: Integrating Multi-Agent Systems with Ethical AI Governance [1.0] 実験結果, バイタルサイン, 臨床状況を分析するために, モジュラーエージェントを用いた新規エージェントシステムの設計を比較した。
我々は,eICUデータベースを用いて,実験室分析,バイタルのみのインタプリタ,文脈推論エージェントなどのエージェントシステムを実装した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:44:47 GMT)
Deep Learning as the Disciplined Construction of Tame Objects [1.0] ディープラーニングは、いわゆるテーム幾何学の中の関数の合成であると見なすことができる。
本稿では,tameインターフェース理論(o-minimalityとも呼ばれる)とディープラーニング理論の概要について述べる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:00:40 GMT)
On The Dynamic Ensemble Selection for TinyML-based Systems -- a Preliminary Study [1.0] TinyML技術の最近の進歩は、推論時間と分類品質のバランスをとるという課題に対処する必要がある。
本稿では,TinyMLシステム内の多クラスコンピュータビジョンタスクに対するDESクラスタリング手法について検討する。
実験により、動的選択のためのより大きな分類器のプールが分類精度を向上し、TinyMLデバイス上での平均推測時間が増加することが示された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:35:35 GMT)
Disentangle and Regularize: Sign Language Production with Articulator-Based Disentanglement and Channel-Aware Regularization [0.9] 我々は,手話のポーズをコンパクトな潜在空間にエンコードするポーズオートエンコーダを,調音器によるアンタングルメント戦略を用いて訓練する。
次に、非自己回帰変換器デコーダをトレーニングし、入力文の単語レベルのテキスト埋め込みからこれらの潜在表現を予測する。
提案手法は光沢の監視や事前訓練に頼らず,PHOENIX14TおよびCSL-Dailyデータセットの最先端結果が得られる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:17:58 GMT)
MeshODENet: A Graph-Informed Neural Ordinary Differential Equation Neural Network for Simulating Mesh-Based Physical Systems [0.9] MeshODENetは、GNNの空間的推論とニューラル正規微分方程式の連続時間モデリングを併用する一般的なフレームワークである。
提案手法は, 長期予測精度と安定性において, ベースラインモデルよりも有意に優れていることを示す。
この研究は、複雑な構造系の解析とモデリングを加速するために、データ駆動サロゲートを開発するための強力で一般化可能なアプローチを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:04:01 GMT)
Eigenstate Thermalization in 1+1-Dimensional SU(2) Lattice Gauge Theory Coupled with Dynamical Fermions [0.9] 1+1次元SU(2)格子ゲージ理論(LGT)における固有状態熱化仮説(ETH)をテストする。
有限サイズ系に対してハミルトニアンを対角化し、局所作用素および非局所作用素の固有基底における行列要素(ME)を計算する。
熱化の時間スケールとランダムマトリックスの挙動の出現について検討する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:00:14 GMT)
Vision Language Models Are Not (Yet) Spelling Correctors [0.7] 視覚入力からのスペル補正は視覚言語モデル(VLM)に固有の課題をもたらす
我々は、中国語と英語で実世界の視覚スペル補正について、VLMを体系的に評価する最初のベンチマークであるReViCoを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:10:42 GMT)
PERL: Pinyin Enhanced Rephrasing Language Model for Chinese ASR N-best Error Correction [0.7] 既存の中国語のASR補正手法は、中国語の特徴であるピニイン情報を効果的に活用していない。
我々は,N-best修正シナリオに対して明示的に設計された textbfPinyin textbfEnhanced textbfRephrasing textbfLanguage model (PERL) パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:21:41 GMT)
Exact large deviations and emergent long-range correlations in sequential quantum East circuits [0.7] 爆発する量子測定は、相関した量子状態を作るための有望な経路である。
測定結果の条件付けにより,長距離相関状態が生成されることを示す。
これらの結果は、量子系のバルク特性を制御するために境界測定をどのように利用できるかを明確に示している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:59:48 GMT)
Canonical Representations of Markovian Structural Causal Models: A Framework for Counterfactual Reasoning [0.7] 「偽りの理性は、アリスがアスピリンを飲んだら回復しただろうか?」
本稿では,ある因果グラフモデルに適合する反ファクトを表現するために,構造因果モデルに対する代替手法を提案する。
本稿では,(通常テスト可能な)介入制約から(任意かつ不可能な)カウンターファクト選択を解き放つ正規化手順を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:53:02 GMT)
A Quantum Computational Determination of the Weak Mixing Angle in the Standard Model [0.7] 非安定化器性(Non-stabilizerness) — マジック — は、古典的コンピュータに対する量子システムの計算上の優位性を特徴付ける。
運動しきい値のないMo ller 散乱 $e-e-to e-e-$ の関数としてマジック生成を計算し、最小化する。
この発見は、標準模型の電弱セクターが計算の観点から最小限の量子資源を生成する傾向があることを示唆している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:00:01 GMT)
Power-Dominance in Estimation Theory: A Third Pathological Axis [0.7] 本稿では,推定器設計のための2次診断を導入することにより,推定理論の新しい枠組みを提案する。
我々は推定者を3つの主要な権力体制に分類する。
電力支配体制における任意の推定器は、避けられない平均二乗誤差のペナルティを発生させ、構造的に準最適性能を低下させることを示した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:54:04 GMT)
Information-Theoretic Bounds and Task-Centric Learning Complexity for Real-World Dynamic Nonlinear Systems [0.7] 動的非線形系は静的および動的効果の結合による歪みを示す。
本稿では, 構造化分解, 分散解析, タスク中心の複雑性境界に基づく理論的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:24:39 GMT)
An Analysis of Kalman Filter based Object Tracking Methods for Fast-Moving Tiny Objects [0.7] 我々は,OCSORT,DeepOCSORT,ByteTrack,BoTSORT,StrongSORTの5つの最先端カルマンフィルタに基づく追跡手法の性能評価を行った。
我々は,画像毎の推測速度と更新頻度の2つの重要な性能要因に着目した。
以上の結果から,カルマンフィルタを用いたトラッカーは3.11cmから3.11cmまでの空間誤差で大きなトラッキングドリフトを示すことがわかった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:12:48 GMT)
The Impact of Feature Scaling In Machine Learning: Effects on Regression and Classification Tasks [0.6] 本研究は、14の機械学習アルゴリズムと16のデータセットにまたがる12のスケーリングテクニックを体系的に評価することで、機能スケーリングに関する包括的な研究が欠如していることに対処する。
我々は、予測性能(精度、MAE、MSE、R2$など)と計算コスト(トレーニング時間、推論時間、メモリ使用量)への影響を慎重に分析した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:24:56 GMT)
MRN: Harnessing 2D Vision Foundation Models for Diagnosing Parkinson's Disease with Limited 3D MR Data [0.6] 現在の臨床実践は、しばしばQSMおよびNM-MRI画像の診断バイオマーカーに依存している。
2次元視覚基礎モデル(VFM)を活用することで,これらの課題に対処する。
提案手法はMICCAI 2025 PDCADxFoundationチャレンジにおいて,300個のQSMとNM-MRIスキャンのみを用いたデータセットで86.4%の精度で達成された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 10:59:27 GMT)
Iterative construction of $\mathfrak{S}_p \times \mathfrak{S}_p$ group-adapted irreducible matrix units for the walled Brauer algebra [0.6] 本稿では部分転置置換作用素の代数の表現論のアルゴリズム的扱いについて述べる。
代数内で既約行列ユニットを構築するための明示的で完全に開発されたフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:34:50 GMT)
Public Key Encryption with Equality Test from Tag-Based Encryption [0.6] ランダムなオラクルモデルを使わずにタグベースの暗号化に基づくPKEETスキームの汎用的な構築を提案する。
ランダムなオラクルモデルなしで新しいPKEETスキームを導出できる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:55:46 GMT)
Ordered Multi-Signatures with Public-Key Aggregation from SXDH Assumption [0.6] 順序付けられた多重署名方式では、複数のシグナが逐次的に共通のメッセージに署名することができる。
我々は、ランダムなオラクルモデルなしで、対称な外部ディフィー・ヘルマン(SXDH)仮定の下で、我々のスキームの安全性を証明した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:46:35 GMT)
ATLAS: Benchmarking and Adapting LLMs for Global Trade via Harmonized Tariff Code Classification [0.6] 再分類は出荷を完全に停止する可能性があるが、主要郵便業者は不完全な税関文書のために米国への配達を停止する。
米国税関ルールオンライン検索システム(CROSS)から派生したHTSコード分類のための最初のベンチマークを紹介する。
我々の微調整されたアトラスモデル(LLaMA-3.3-70B)は、完全な10桁分類と57.5パーセントの正確な6桁分類を実現している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:32:24 GMT)
Adaptive Policies for Resource Generation in a Quantum Network [0.5] 分散量子システムのためのプロトコルは、通常、$n$の絡み合った状態の同時可用性を必要とする。
我々は、$n$の絡み合った状態が$F_mathrmapp$以上の忠実さで利用可能になるまでの期待時間を最小化する最適なポリシーを導出する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:04:12 GMT)
Hardware-efficient quantum phase estimation via local control [0.5] 本稿では,局所的に制御された演算のみを用いる量子位相推定手法を提案する。
我々のアプローチの中心は、時間進化演算子の期待値の複雑な位相を測定する効率的なルーチンである。
提案手法は、現在の量子デバイスを用いた大規模多体量子系のスペクトル特性を測定するための実用的な経路を提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:27:46 GMT)
Enhancing Cluster Scheduling in HPC: A Continuous Transfer Learning for Real-Time Optimization [0.4] 本研究では,ノード親和性制約に着目し,クラスタシステムのタスクスケジューリングを最適化するための機械学習支援手法を提案する。
提案した連続移動学習モデルは、運用中に動的に進化し、再学習の必要性を最小限に抑える。
Google Cluster Dataに基づいて評価されたこのモデルは、99%以上の精度を実現し、計算オーバーヘッドを低減し、制約されたタスクのスケジューリング遅延を改善する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:27:20 GMT)
Scattering Transformer: A Training-Free Transformer Architecture for Heart Murmur Detection [0.4] 本研究では,Scattering Transformerを紹介した。
提案手法は,バックプロパゲーションを伴わないトランスフォーマー型アーキテクチャにおいて,コンテキスト依存性を導入することで,標準的なウェーブレット散乱ネットワークを利用する。
Scattering Transformerは0.786の重み付き精度(WAR)と0.697のUnweighted Average Recall(UAR)を達成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:08:06 GMT)
A suite of allotaxonometric tools for the comparison of complex systems using rank-turbulence divergence [0.4] そこで我々は,Matlab,Javascript,Pythonにおいて,ランク-乱流分岐のためのアロタキソグラフを描画するための一連のツールについて述べる。
アロタキソノグラフは、ランクと確率乱流の発散、ジェンソン・シャノン発散、一般化エントロピー発散を含む幅広い機器に対応するように設計されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:35:07 GMT)
Automated Knowledge Graph Construction using Large Language Models and Sentence Complexity Modelling [0.4] 文レベルの知識グラフを抽出するエンドツーエンドパイプラインであるCoDe-KGを導入する。
オープンソースである15万以上のナレッジトリプルのデータセットをコントリビュートしています。
提案手法は, 文章の簡潔化において, 正解精度が99.8%まで向上することが示唆された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 00:01:50 GMT)
Privacy-Aware White and Black List Searching for Fraud Analysis [0.4] 我々は、IPアドレスの暗号化されたバージョンをブラックリストのネットワークリストにマッチさせるため、同型暗号化を使用する。
このマッチングにより、IPアドレスを暗号化し、ブラックリストの暗号化バージョンにマッチさせることができる。
本稿では,OpenFHEライブラリを用いたマッチング手法を実装し,部分同型スキームと比較する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:10:25 GMT)
Anomaly detection by partitioning of multi-variate time series [0.3] PARADISEと呼ばれる非教師あり分割型異常検出手法を提案する。
この手法は時系列の変数を分割し、変数間の関係が未接触のままであることを保証する。
異常検出性能が大幅に向上し,本手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:02:28 GMT)
Tensor-Based Self-Calibration of Cameras via the TrifocalCalib Method [0.2] カメラ固有のパラメータを事前のシーン知識なしで推定することは、コンピュータビジョンにおける根本的な課題である。
キャリブレーションされた三焦点テンソルに基づく一連の方程式を示し、最小限の画像データから投影型カメラの自己校正を可能にする。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:31:57 GMT)
Free expansion of a charged nanoparticle via electrostatic compensation [0.2] 自由進化は単純だが効果的な拡張スキームであるが、平均変位を避けるためには正確な力補償が必要である。
ここでは, 静電気補償技術を用いて, 3次元における有意な平均変位を伴わずに自由な進化を可能にする。
荷電粒子を用いた100マイクロ秒自由進化時間を実現するため, 力のクロストークをマッピングし, 補正し, 環境帯電状態を制御する方法を開発した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:33:42 GMT)
Improving Handshape Representations for Sign Language Processing: A Graph Neural Network Approach [0.2] 静的ハンドシェイプ構成から時間的ダイナミクスを分離する新しいグラフニューラルネットワークを提案する。
本手法は,手形認識において重要な課題に対処するために,解剖学的にインフォームドされたグラフ構造と対照的な学習を組み合わせる。
我々は署名シーケンスにおける構造化ハンドシェイプ認識のための最初のベンチマークを確立し、37のハンドシェイプクラスで46%の精度を達成した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:35:16 GMT)
Medical AI Consensus: A Multi-Agent Framework for Radiology Report Generation and Evaluation [0.2] 放射線学のエコシステムにおけるマルチモーダルな臨床推論のためのベンチマークおよび評価環境として機能するマルチエージェント強化学習フレームワークを提案する。
提案フレームワークは,画像解析,特徴抽出,レポート生成,レビュー,評価を担当する10の特殊エージェントからなるモジュールアーキテクチャにおいて,大規模言語モデル(LLM)と大規模ビジョンモデル(LVM)を統合する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 04:31:27 GMT)
Scaling, Simplification, and Adaptation: Lessons from Pretraining on Machine-Translated Text [0.2] 日本語をインドネシア語とタミル語に翻訳し,MT由来コーパスを用いたGPT-2モデル(124M-774M)を事前学習した。
本研究では,ネイティブテキスト上でのクロスエントロピー損失と,構文探索や下流タスクの精度を評価する。
本研究の結果から, MT-pretrained model のスケーリングによるメリット, (2) ソースサイドの単純化はネイティブテキストへの一般化を損なうこと, (3) ネイティブテキストへの MT-pretrained model の適応は, ネイティブのみのモデルよりも優れた性能が得られることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 02:48:43 GMT)
Learning to vary: Teaching LMs to reproduce human linguistic variability in next-word prediction [0.2] 本研究では,複数単語継続に対するLMの訓練が,次の単語予測のための人間の言語的多様性を再現する能力を向上させるかを検討する。
実験によって推定された人やモデルの次単語分布の微調整前後におけるばらつきを評価した結果,多ラベル微調整により言語的多様性を再現する能力が向上することが示唆された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:51:40 GMT)
Assistive Decision-Making for Right of Way Navigation at Uncontrolled Intersections [0.2] 無制御の交差点は、不明瞭な道路のルールのために、かなりの数の道路事故の原因となっている。
本稿では,部分観測可能なマルコフ決定プロセスとして定式化された,制御不能な交差点における右道推論のためのドライバ・アシスト・フレームワークを提案する。
確率プランナーはルールベースのベースラインよりも優れており、部分観測可能条件下では最大97.5%の衝突のないナビゲーションを実現している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:46:23 GMT)
Machine learning-driven conservative-to-primitive conversion in hybrid piecewise polytropic and tabulated equations of state [0.2] 本稿では,流体力学シミュレーションにおける保守的・原始的逆転を高速化する機械学習(ML)手法を提案する。
我々は、フィードフォワードニューラルネットワーク(NNC2PSとNC2PL)を採用し、PyTorchでトレーニングし、NVIDIARTを用いたGPU推論に最適化した。
NNC2PS推論用の混合精度RTエンジンは、データセットサイズ1000,000点の従来のシングルスレッド実装よりも約400倍高速である。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 00:46:53 GMT)
TextCrafter: Optimization-Calibrated Noise for Defending Against Text Embedding Inversion [0.1] テキスト埋め込みインバージョン攻撃は、潜在表現から原文を再構築し、協調推論とエッジコンピューティングにおいて深刻なプライバシー上の脅威を生じさせる。
本研究では, RL学習, 幾何を考慮したノイズ注入, クラスタ先行によるユーザ埋め込み, PII信号誘導を併用して, 作業性を維持しながらインバージョンを抑える, 最適化に基づく逆摂動機構であるTextCrafterを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 00:51:20 GMT)
Efficient formulation of quantum network under amplitude damping noise: Highlighting benefits over its Pauli-twirled counterpart [0.1] 本研究は,非パウリ雑音下で動作する等質リピータに基づく線形量子ネットワークにおいて,エンドツーエンドの絡み合いを分散することに焦点を当てる。
我々は,各絡み合ったリンクのこれらの4つのパラメータと,それに作用するノイズの数を追跡する,AQNのシミュレーション手法を開発した。
その結果,NESTING や SWAP-ASAP など多種多様な政策において,AQN は TAQN の忠実度と平均的絡み合いの両面において常に上回っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:42:32 GMT)
Magnetic-Field and Temperature Limits of a Kinetic-Inductance Traveling-Wave Parametric Amplifier [0.1] キネティックインダクタンス進行波パラメトリック増幅器(KI-TWPA)は、飽和電力の高いブロードバンド近量子制限増幅を提供する。
Nb面を有する薄NbTiN逆マイクロストリップを用いたKI-TWPAの性能に及ぼす磁場と温度の影響について検討した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:12:27 GMT)
Noise robustness of problem-to-simulator mappings for quantum many-body physics [0.1] デジタルまたはアナログ量子シミュレータ上で量子力学をシミュレートするには、しばしば問題とシミュレータ"マッピングが必要である。
これらすべての写像において、局所観測可能量は、シミュレータ内のノイズレートとサブ線形にスケールするシステムサイズの独立精度に決定可能であることを証明している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:06:11 GMT)
Order from chaos with adaptive circuits on quantum hardware [0.1] 非単体進化に条件フィードバックを組み込んだ適応監視量子回路を実験的に実現した。
実験は、最大100量子ビットのIBM超伝導量子プロセッサを用いて行われる。
最大5000個のゲートと5000個の非単体中間回路を100量子ビットまで適用することで、この実験は耐故障性への道筋のサインポストとして機能する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:00:05 GMT)
SeqUDA-Rec: Sequential User Behavior Enhanced Recommendation via Global Unsupervised Data Augmentation for Personalized Content Marketing [0.1] SeqUDA-Recは、ユーザ行動シーケンスとグローバルな教師なしデータ拡張を統合する、新しいディープラーニングフレームワークである。
NDCG@10が6.7%,HR@10が11.3%,パーソナライズされた広告とインテリジェントなコンテンツレコメンデーションが有効であった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 05:24:53 GMT)
Context Lineage Assurance for Non-Human Identities in Critical Multi-Agent Systems [0.1] 本稿では,アタッチメントのみのメルクル木構造に固定された系統検証のための暗号的基盤機構を提案する。
従来のA2Aモデルとは異なり、本手法ではエージェントと外部検証器の両方が暗号的にマルチホップ前駆体を検証できる。
並行して、A2Aエージェントカードを拡張して、明示的な識別認証プリミティブを組み込むことにより、NHI表現の正当性を確認することができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:59:51 GMT)
Fast, Accurate and Interpretable Graph Classification with Topological Kernels [0.0] コンパクトな特徴ベクトルにより各グラフを表すトポロジ的指標に基づく明示的特徴写像のクラスを導入する。
これらのコンパクトベクトル上の放射基底関数カーネルを用いて、グラフ間の類似性の尺度を定義する。
標準分子データセットの評価を行い, 単一トポロジカル・インデックス特徴ベクトルによる分類精度の低下を観測した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:31:28 GMT)
A quantum monomer-dimer model on Penrose tilings [0.0] 準結晶ペンローズタイリングの最大二量体被覆空間における量子単量体-二量体モデルを定義する。
ダイマーダイマーとバイソンバイソン相関器はともに指数関数的に距離で崩壊することがわかった。
ゲージ理論は閉じ込められた位相にあり、これは系が秩序な位相にあることを意味する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:38:28 GMT)
Zitterbewegung, momentum and spin dynamics of electromagnetic waves in linear dielectric medium [0.0] 誘電体媒質中の電磁波と双極子の結合力学について検討する。
また, 左右の波動成分間のヘリシティ混合によるジッタベウングング様振動を予測した。
これらの内部波動は、ウェーブパレット運動または偏光感度測定によって観測可能である。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:20:13 GMT)
Were Residual Penalty and Neural Operators All We Needed for Solving Optimal Control Problems? [0.0] 我々は、DeepONetのような単純なニューラルネットワークアーキテクチャが、単一の物理インフォームドトレーニングフェーズとその後の最適化フェーズで複数の最適制御問題を解くことができることを示す。
本結果は,より複雑で高次元的な問題に対して,実用的応用に許容できる精度と潜在的な計算節約効果を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:30:04 GMT)
Utilizing Modern Large Language Models (LLM) for Financial Trend Analysis and Digest Creation [0.0] 本稿では,Large Language Models(LLMs),特にGoogleのGemini Proの力を利用して,洞察に富んだ金融ダイジェストを自動的に生成する革新的なフレームワークを紹介する。
OpenAlexからのデータ抽出、戦略的プロンプトエンジニアリング、LCMによる分析を組み合わせることで、包括的消化の自動化例を実演する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:04:39 GMT)
Unsupervised Learning and Representation of Mandarin Tonal Categories by a Generative CNN [0.0] トーナルパターンは、計算的に最も複雑な学習対象の1つである。
人間の言語(ciwGAN)の現実的な生成モデルは,その分類変数と中国語の音節カテゴリーを関連付けることができることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:52:03 GMT)
Turk-LettuceDetect: A Hallucination Detection Models for Turkish RAG Applications [0.0] 本稿では,トルコのRAGアプリケーションに特化して設計された幻覚検出モデルの最初のスイートであるTurk-LettuceDetectを紹介する。
これらのモデルは、質問応答、データ・トゥ・テキスト生成、要約タスクを含む17,790のインスタンスを含むRAGTruthベンチマークデータセットの機械翻訳バージョンでトレーニングされた。
実験の結果,ModernBERTをベースとしたモデルでは,F1スコアの0.7266が完全なテストセットで達成され,特に構造化タスクにおいて高い性能が得られた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:14:11 GMT)
Transformer-Gather, Fuzzy-Reconsider: A Scalable Hybrid Framework for Entity Resolution [0.0] いくつかの重要な問題に対処するために設計されたスケーラブルなハイブリッドフレームワークを導入します。
事前学習された言語モデルを用いて、構造化された各データを対応するセマンティック埋め込みベクトルに符号化する。
意味論的に関連する候補のサブセットを検索した後、構文的検証段階を適用する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:05:44 GMT)
Transfer tensor analysis of localization in the Anderson and Aubry-André-Harper models [0.0] 単純な無秩序なシステム、特にAnderson and Aubry-Andr'e-Harperモデルにおける局所化と輸送を解析する。
個々の軌跡が厳密にマルコフ的であっても、障害に対するアンサンブル・アベリング時に現れる記憶効果に強調される。
記憶効果は、各時点における静的障害の再描画に対応する架空の用語を取り除くために必要であり、時間的に非相関な動的障害を引き起こす。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 22:36:04 GMT)
Transfer of entanglement from nonlocal photon to non-Gaussian CV states [0.0] 本研究では,非局所光子からの量子絡み合いの機構を,当初分離されていた2つの単一モード圧縮真空状態へ伝達する機構を提案する。
我々は、十分に高輝度での最大絡み合いの移動確率を0.2344と見積もる。
非局所光子から最大パリティ束縛されたCV状態への完全なTQEは、応用に最も適していると考えられる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:35:33 GMT)
Training the classification capability of large-scale quantum cellular automata [0.0] 相転移エルゴディディティの近傍では、異なる初期多体構成が、順序パラメータによってマクロ的に区別可能ないくつかの固定点の1つへと進化する。
超高次元状態空間においても,この能力はトレーニングデータから効率的に学習できることが実証された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:00:06 GMT)
Tracing the Techno-Supremacy Doctrine: A Critical Discourse Analysis of the AI Executive Elite [0.0] 本稿では,AIの資金提供,開発,展開の方法を形成する,影響力の高い個人集団である「AIエグゼクティブエリート」の言説を批判的に分析する。
本研究の主な目的は、複雑な社会問題を解く上で、技術が本来持つ優越性に対する過度な信頼を特徴とする信念システムを記述するために導入された「テクノ・サプレマシー・ドクトリン(TSD)」の存在とダイナミクスについて考察することである。
この分析は、ユートピアの約束と避けられない進歩の主張を組み合わせた支配的なTSDの物語や、リスクを認知する一般的な戦術など、重要な非帰的パターンを特定する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:55:38 GMT)
Towards metrology with highly charged isomeric ions from antiproton annihilation [0.0] 抗陽子の消滅は、イオントラップ装置で高電荷のアイソマーイオンを生成するために利用することができる。
我々は、異性体と基底状態の単一電子からなる水素様原子の超微細分裂における光学遷移を同定する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:14:44 GMT)
TinyBEV: Cross Modal Knowledge Distillation for Efficient Multi Task Bird's Eye View Perception and Planning [0.0] 我々は、大規模な計画指向の教師のフルスタック能力を、コンパクトでリアルタイムな学生モデルに抽出する、統一されたカメラのみのBird's Eye View (BEV)フレームワークであるTinyBEVを紹介する。
TinyBEVは完全な自律スタック3D検出、HDマップセグメンテーション、モーション予測、占有率予測、28M-パラメータバックボーン内の目標指向計画をサポートする。
我々のモデル非依存多段階蒸留戦略は,高容量マルチモーダル知識を軽量BEVに効果的に伝達するために,特徴レベル,出力レベル,適応型領域認識の監視を組み合わせる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:54:02 GMT)
The incompleteness of relativistic Spekkens' contextuality [0.0] 1つのフレームにおける文脈的スピン状態は、もう1つのフレームにおいて非文脈的になる可能性がある。
本研究では,2つの量子状態の分別に関する新しい相対論的効果を予測するために,本研究の結果を適用した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:18:26 GMT)
The STAR-XAI Protocol: An Interactive Framework for Inducing Second-Order Agency in AI Agents [0.0] 我々は、eXplainable Artificial IntelligenceのためのSTAR-XAIプロトコル(Socratic, Transparent, Agentic, Reasoning)を紹介する。
我々の方法は、明示的で進化するルールブックであるCTP(Consciousness Transfer Package)によって支配される、構造化されたソクラテス的対話として、人間とAIの相互作用を再構築する。
複雑な戦略ゲーム"Caps i Caps"における25-moveのケーススタディを通じて,本手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:24:17 GMT)
The Reverse File System: Towards open cost-effective secure WORM storage devices for logging [0.0] データ不変性を保証するために、ストレージデバイス用のWrite Once Read Many (WORM)プロパティが望ましい。
Socarratは、シンプルな外部USBデバイスを活用する、新しく、費用効率が高く、ローカルなWORMストレージソリューションである。
Socarratは攻撃面を著しく減らし、特権のある攻撃者でもストアドデータの変更や消去ができないことを保証します。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:19:08 GMT)
The Free Energy Barrier: An Eyring-Polanyi bound for stabilizer Hamiltonians, with applications to quantum error correction [0.0] 本稿では, 高速熱化を保証できない自由エネルギー障壁の概念を紹介する。
これらの新たな結果をLayerコードに適用すると、自己補正が欠如していることが証明できます。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 05:21:58 GMT)
Temporal Conformal Prediction (TCP): A Distribution-Free Statistical and Machine Learning Framework for Adaptive Risk Forecasting [0.0] 本研究では,非定常時系列におけるよく校正された予測区間を構築するための分布自由フレームワークを提案する。
TCPは、量子予測器とローリングウィンドウ上の分割等角キャリブレーションを組み合わせ、TCP-RMの変種では、コンフォメーション閾値をRobins-Monroオフセットで増大させる。
危機風の可視化では、TCP/TCP-RMの膨張と収縮間隔がボラティリティのスパイクと後退としてすぐに示され、赤いドットは誤発見の日々を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:14:12 GMT)
Strategic Coordination for Evolving Multi-agent Systems: A Hierarchical Reinforcement and Collective Learning Approach [0.0] 強化学習は、シーケンシャルな意思決定をモデル化する方法を提供する。
エージェントは、MARLを使用して高レベル戦略を採り、アクションスペース削減のためのプランをグループ化する。
低レベルの集団学習層は、効率的で分散化された協調的な決定を保証する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:58:45 GMT)
State-of-the-Art in Software Security Visualization: A Systematic Review [0.0] ソフトウェアセキュリティの可視化は、脅威インテリジェンスやコンプライアンス監視を含む、サイバーセキュリティの技術的な複雑さと、視覚分析を組み合わせたものだ。
セキュリティ上の懸念を分析し解釈する従来のテキストベースおよび数値的手法は、ますます効果が低下する。
この体系的なレビューは、ソフトウェアセキュリティの可視化に関する最近の60以上の重要な研究論文を調査している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:21:30 GMT)
Solving General QUBOs with Warm-Start QAOA via a Reduction to Max-Cut [0.0] 古典的な解や情報を用いて初期量子状態を構築する様々な方法を検討する。
Max-Cut問題に対して、1つのウォームスタートアプローチは、対応するMax-Cut問題のSDP緩和から出力される高次元ベクトルを用いて初期状態を構築する。
ウォームスタートアプローチの最良の選択は、問題の種類に強く依存していることが分かりました。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:48:53 GMT)
Six Sigma For Neural Networks: Taguchi-based optimization [0.0] 本研究では,従来品質工学に用いられてきた統計最適化手法であるTaguchi Design of Experiments法の適用について紹介する。
機械学習最適化の多目的性に対処するため、トレーニング精度、検証精度、トレーニング損失、検証損失を同時に最適化する5つのアプローチを開発した。
その結果, 重み付き精度測定値と対数変換された損失関数を組み合わせることで, 最適性能を98.84%のトレーニング精度と86.25%の検証精度で達成し, 最小損失値を維持した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:50:25 GMT)
Significativity Indices for Agreement Values [0.0] コーエンのカッパまたはクラス内相関測度は、2つ以上の分類器間のマッチングを測る。
コーエンの『カッパ』の文献ではいくつかの品質尺度が提案されているが、それらは主にナイーブであり、境界は任意である。
本研究は、2つの分類器間の合意値の有意性を評価するための一般的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:10:36 GMT)
Shift of quantum critical point of discrete time crystal on a noisy quantum simulator [0.0] 量子デバイスにおけるデコヒーレンスが量子時間結晶の力学に与える影響を実験的に検討する。
デコヒーレンスによって相転移に伴う臨界挙動の位置が変化し,ノイズシミュレーションが位相境界の不正確な同定につながることが示唆された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 23:23:12 GMT)
SeqBattNet: A Discrete-State Physics-Informed Neural Network with Aging Adaptation for Battery Modeling [0.0] 本稿では,電池モデルに老化適応を組み込んだ離散状態PINNであるSeqBattNetを提案する。
モデルは3つの基本的なバッテリパラメータしか必要とせず、単一のセルからのデータに基づいてトレーニングすることで、堅牢なパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:33:17 GMT)
Safety Assessment of Scaffolding on Construction Site using AI [0.0] 本稿では,足場検査の精度を高めるため,人工知能(AI)とデジタル化の利用について検討する。
クラウドベースのAIプラットフォームは、足場構造のポイントクラウドデータを処理するために開発されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:43:20 GMT)
Response of a classical mesoscopic oscillator to a two-level quantum system [0.0] 単一量子ビットに結合した古典的機械振動子の力学について検討する。
量子ビットの影響は決定論的かつ力として現れ、初期量子状態に依存する。
この結果から,古典的雑音スペクトルによる量子状態再構成の経路が示唆された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 23:16:19 GMT)
Real-Time Fish Detection in Indonesian Marine Ecosystems Using Lightweight YOLOv10-nano Architecture [0.0] 本研究では,インドネシア海域におけるリアルタイム海洋魚検出のための最先端の深層学習モデルであるYOLOv10-nanoの実装について検討した。
YOLOv10のアーキテクチャは、CSPNetバックボーン、機能融合のためのPAN、ピラミッド空間注意ブロックなどの改善を特徴とし、効率的で正確なオブジェクト検出を可能にしている。
その結果, YOLOv10-nano は 0.966 の mAP50 と 0.606 の mAP50:95 で高い検出精度を達成し, 計算要求の低さを維持した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:02:48 GMT)
Readout of a solid state spin ensemble at the projection noise limit [0.0] ダイヤモンド中の窒素空孔中心のメソスコピックアンサンブルの直接的、量子的非破壊的読み出しを示す。
高磁場下で14ドルNの核スピン浴を安定化することにより、熱射影ノイズレベル以下で3.8dBのノイズ低減を実現する。
本研究は、固体量子センサの実用的なツールとして、投射雑音制限読み出し法を確立した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:25:25 GMT)
RAVEN: RAnking and Validation of ExoplaNets [0.0] 本稿では,TESS外惑星候補に対する新たな検証・検証パイプラインであるRAVENについて述べる。
このパイプラインは、偽陽性(False Positive, FP)の一連のシナリオに対して、惑星である候補の後方確率を導出するためにベイズ的枠組みを用いている。
パイプライン全体の精度は91%に達し、TESS候補の自動ランク付けの有効性を示した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:50:31 GMT)
Quantum decoherence in the Caldeira-Leggett model by the real-time path integral on a computer [0.0] 本稿では,環境を取り扱う実時間経路積分形式に基づくオープンシステムの第一原理計算と,コンピュータ上での我々の関心の共有システムを提案する。
我々は、特に量子デコヒーレンスモデルとしてよく知られているカルデイラ・レゲットモデルに焦点を当てる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:17:32 GMT)
Quantitative comparison of quantum pseudo-telepathy games and Bell inequalities [0.0] 量子擬似テレパシーゲーム(Quantum pseudo-telepathy game)は、理論的には、絡み合った量子戦略を使用する場合、プレイヤーが単位確率で勝利することを可能にする。
これらのゲームにおける量子的優位性を定量的に評価し、2つのベル不等式の違反と比較する。
どちらの手法も基本的には量子的文脈性に結びついているが、検討された2量子状態族の解析は、ベルの不等式が絡み合いを明らかにするのにより効果的であることを示している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:06:37 GMT)
Quantifying Student Success with Generative AI: A Monte Carlo Simulation Informed by Systematic Review [0.0] 本稿では,系統的な文献レビューとシミュレーションに基づくモデリングを含むハイブリッド手法を用いる。
2023年から2025年にかけて、209件の実証記事が、スコパスデータベースを対象としたPRISMAベースの検索の中から選ばれた。
その結果、ユーザビリティや実世界の有用性に関連する態度因子は、感情的・信頼的要因よりも、肯定的な学習達成の予測因子として優れていることが判明した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:21:53 GMT)
Probing the Ground State of the Antiferromagnetic Heisenberg Model on the Kagome Lattice using Geometrically Informed Variational Quantum Eigensolver [0.0] 本研究では,最小限のカゴメ細胞上での反強磁性ハイゼンベルク模型の基底状態の性質について検討する。
本研究では, ハードウェア効率の浅い量子回路を用いて, 基底状態の準備が可能であることを実証した。
さらに、ゼロノイズレイリー(ZNE)やキュービットワイド・リードアウト・エラー緩和(REM)などの誤差軽減手法を適用した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:02:58 GMT)
Predicting Depth Maps from Single RGB Images and Addressing Missing Information in Depth Estimation [0.0] 我々は,1枚のRGB画像からDepth画像を生成するために,多層トレーニング手法を用いたアルゴリズムを開発した。
我々は,これらのギャップを補正するためにアルゴリズムを適用し,完全かつ正確なDepth画像を得る。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:28:29 GMT)
Predictable Drifts in Collective Cultural Attention: Evidence from Nation-Level Library Takeout Data [0.0] 書籍の人気分布によって測定された文化は, 毎月, 月々, ほぼ一定速度で流れ続ける。
書店ローンを登録データにリンクすることにより、年齢、性別、教育水準、地理的地域が文化的漂流に与える影響を調査する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:54:11 GMT)
Pre-Trained CNN Architecture for Transformer-Based Image Caption Generation Model [0.0] 本研究は,画像キャプションのためのトランスフォーマーモデルの構築と構築のためのガイドを提供する。
我々は、シーケンシャルデータ管理の有効性を認識した、確立されたTransformerアーキテクチャを活用している。
提案手法は,効率的なトレーニングと推論のための並列化の利用を実証する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 05:32:52 GMT)
Planted Solutions in Quantum Chemistry: Generating Non-Trivial Hamiltonians with Known Ground States [0.0] 埋め込み可能基底状態を持つハミルトニアンの4つのクラスを導入する。
これらのハミルトン派は現実的な電子構造問題を模倣し、調整可能な複雑性をサポートし、参照系から導出される。
この構造を曖昧にし、認識される複雑さを制御するために、キラー演算子、バランス演算子、ランダム軌道回転などの技術を導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:06:47 GMT)
Perceptions of AI Across Sectors: A Comparative Review of Public Attitudes [0.0] 本稿では、AIに対する公衆の態度に関する251の研究について、ドメインによる比較検討を行う。
AIにおける一般の認識は、技術設計やパフォーマンスだけでなく、セクター特有の考慮によっても形作られています。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:07:57 GMT)
Optimal local basis truncation of lattice quantum many-body systems [0.0] 格子量子多体ハミルトニアン(QMB)の局所基底を最適に削減する方法を示す。
ベーストランケーションは、推定された単サイト還元密度行列の最も関連性の高い固有値を利用する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:22:54 GMT)
Open-system quantum many-body scars: a theory [0.0] リンドブラッド方程式によって支配される開量子系における量子多体散乱の概念を導入する。
我々は、典型的な無限温度状態に加えて、オープンシステム量子多体傷(OSQMBS)をダブする。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:00:26 GMT)
Noise Protected Logical Qubit in a Open Chain of Superconducting Qubits with Ultrastrong Interactions [0.0] 本稿では, XX と YY の超強相互作用を交互に交互に行う超伝導量子ビットからなる系について検討する。
このシステムの2つの最も低いエネルギー固有状態を論理量子ビットとして考慮し、そのコヒーレンスが著しく向上していることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:30:28 GMT)
New Expansion Rate Anomalies at Characteristic Redshifts Geometrically Determined using DESI-DR2 BAO and DES-SN5YR Observations [0.0] マルチタスクガウスプロセスフレームワークを用いて、モデルに依存しない宇宙距離の再構成を行う。
再構成された宇宙距離とその微分により、0.3 leq z leq 1.7$の範囲で7つの特徴的な赤方偏移が得られる。
以上の結果から,Planck 2018 $Lambda$CDMの予測から,約4ドルから5ドルという大きな差がみられた。
これらの異常は、復元法と組み合わせたデータセットの両方で一貫して観察され、宇宙の膨張速度における堅牢な深夜の緊張が示唆されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:45:02 GMT)
Multi-block exceptional points in open quantum systems [0.0] 開量子系は、非エルミートハミルトニアン (NHHs) とリンドブラディアン (Lindbladians) によって概説できる。
NHHsおよびリンドブラディアンにおける例外点(EP)の出現を解析した。
NHHsのEPが非ヘルミチアン・リウビリアにおける新しいタイプのEP(マルチブロックEP)とどのように関係しているかを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:11:21 GMT)
Multi-Scale Graph Theoretical Analysis of Resting-State fMRI for Classification of Alzheimer's Disease, Mild Cognitive Impairment, and Healthy Controls [0.0] アルツハイマー病(英語: Alzheimer's disease、AD)は、記憶喪失と認知低下を特徴とする神経変性疾患である。
ピアソンの相関のような伝統的な手法は相関行列を計算するために使われてきた。
本稿では、離散ウェーブレット変換(DWT)とグラフ理論を統合し、脳ネットワークの動的挙動をモデル化する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:49:35 GMT)
MolPILE - large-scale, diverse dataset for molecular representation learning [0.0] MolPILEは2億2200万の化合物の大規模で多様で厳密な収集品である。
この研究はモデルトレーニングのための標準化されたリソースを提供し、分子化学におけるImageNetのようなデータセットの必要性に対処する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:26:15 GMT)
Modelling optimal generation of an arbitrary N-qubit quantum gate within the generalized Bloch vectors formalism due to the Pontryagin principle [0.0] 有限次元量子系に対する一般化されたブロッホベクトル形式に基づく新しい最適ゲート生成モデルを開発する。
このモデルでは、最適制御はN量子系パラメータによってのみ決定され、初期状態に依存しない。
様々な1/2/3キュービットゲートの生成のための数値実験により, 最適モデルの有効性が示された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:36:58 GMT)
Medical priority fusion: achieving dual optimization of sensitivity and interpretability in nipt anomaly detection [0.0] 臨床機械学習は、高い医療応用において重要なジレンマに直面している。
非侵襲的出生前検査(NIPT)では特にパラドックスが急性化しており、染色体異常が重篤な臨床結果をもたらす。
本稿では,この基本的なトレードオフを解決するための制約付き多目的最適化フレームワークである医療優先融合(MPF)を紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:49:20 GMT)
Mechanistic Interpretability with SAEs: Probing Religion, Violence, and Geography in Large Language Models [0.0] 本稿では,宗教が大規模言語モデル(LLM)において内部的にどのように表現されるかを検討する。
我々は、宗教と暴力に関連するプロンプトの重複を測定し、アクティベーションコンテキストにおける意味パターンを探索する。
5つの宗教はいずれも内部の結束に匹敵するものであるが、イスラム教は暴力的な言語に関連する特徴と結びついていることが多い。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:09:21 GMT)
Machines are more productive than humans until they aren't, and vice versa [0.0] 本稿では,実証現実主義に基づくモンテカルロシミュレーションに基づくシリコン内フレームワークを開発し,人的・機械的スキルの経済的影響を分析する。
本研究は, 自動化が低次元一般化難易度を特徴とするタスクにおいて, 最も経済的に有効な戦略である傾向にあるという確立された概念を定量的に支援するものである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:37:28 GMT)
MSGAT-GRU: A Multi-Scale Graph Attention and Recurrent Model for Spatiotemporal Road Accident Prediction [0.0] 局所的空間依存と長距離空間依存をキャプチャするグラフアテンション・リカレントモデルMSGAT-GRUを提案する。
ハイブリッド北京事故データセットでは、MSGAT-GRUは0.334のRMSEと0.878のF1スコアを達成し、一貫して強いベースラインを上回っている。
これらの結果は、MSGAT-GRUをインテリジェントトランスポートシステムのスケーラブルで一般化可能なモデルとして位置づけている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:05:23 GMT)
Localization and topological signatures under periodic twisting [0.0] 2つの正方格子ポテンシャルを重畳することによって形成される2次元のオーブリー・アンドルーモデルの一般化を探索する。
平衡における2つの格子間の異なるツイスト角度で現れるリッチな物理学に動機づけられ、周期的なツイストが導入された。
このシステムにおける時間依存的なねじれは、周期的多周波駆動の複雑な形態をもたらすことを実証する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:00:00 GMT)
Local equivalence of stabilizer states: a graphical characterisation [0.0] グラフ状態の基本的な性質は、局所補完を適用すると、原点と同じ絡み合いを表すグラフが得られることである。
この性質は、単純なグラフィカルな方法で非自明な量子特性を捉えるための基盤となった。
グラフ状態のLU同値性をグラフィカルに特徴付ける局所補完の一般化を導入する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:37:52 GMT)
Lipschitz-Based Robustness Certification for Recurrent Neural Networks via Convex Relaxation [0.0] 本稿では,RNNの層間相互作用を凸問題としてモデル化する緩和法であるRNN-SDPを提案する。
また、既知の入力制約を組み込んで得られるリプシッツ境界をさらに強化する拡張についても検討する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:26:46 GMT)
LieDetect: Detection of representation orbits of compact Lie groups from point clouds [0.0] 我々は、その軌道の有限標本からコンパクトリー群の表現を推定する新しいアルゴリズムを提案する。
表現型の知識は、その軌道の再構成を可能にするが、これは作用を生成するリー群を特定するのに役立つ。
このアルゴリズムは, 画像解析, 調和解析, 密度推定, 等変ニューラルネットワーク, 化学コンフォメーション空間, 古典力学システムにおける実時間応用と同様に, 次元32までの合成データに対して試験される。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:58:48 GMT)
Investigating Roles of Triple Excitations for High-precision Determination of Clock Properties of Alkaline Earth Singly Charged Ions [0.0] 単価カルシウム(Ca$+$)、ストロンチウム(Sr$+$)、バリウム(Ba$+$)アルカリ-アースイオンのクロック状態の電気双極子分極性と四極子モーメント(Theta$)の計算を行う。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:37:55 GMT)
Investigating Bias: A Multilingual Pipeline for Generating, Solving, and Evaluating Math Problems with LLMs [0.0] 本稿では,ドイツのK-10カリキュラムに適合する数学問題を生成,解決,評価するための自動多言語パイプラインを提案する。
628の数学演習を生成し、それらを英語、ドイツ語、アラビア語に翻訳しました。
3つの商用LCMが各言語でステップバイステップのソリューションを作成するように促された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:38:09 GMT)
Intelligent Load Balancing in Cloud Computer Systems [0.0] この研究は、クラウドノードをオーバーロードすることなくタスクを動的に割り当てる戦略を設計することであった。
このプロジェクトはウェストミンスター大学 HPC クラスタ上で広範な実験が行われた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 19:39:08 GMT)
Instruction-Following Evaluation in Function Calling for Large Language Models [0.0] IFEval にインスパイアされたベンチマーク IFEval-FC (arXiv:2311.079) を紹介する。
IFEval-FCは、関数呼び出しによる正確な命令を評価する。
GPT-5やClaude 4.1 Opusといった最先端のプロプライエタリモデルでさえ、基本的なフォーマットルールに従わなかったことがよく示されている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:04:39 GMT)
Image Segmentation and Classification of E-waste for Training Robots for Waste Segregation [0.0] このモデルは、e-wasteの分離を行うために、ピックアップ・アンド・プレイス・ロボットと統合することができる。
これは、マウスや充電器のような一般的な電子廃棄物を回収し、それを解き放ち、カスタムデータセットを作成するために写真を撮ることで達成された。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:11:14 GMT)
Hybrid Trapping of Cold Atoms with Surface Forces and Blue-Detuned Evanescent Light on a Nanophotonic Waveguide [0.0] 低温中性原子に対する新規なハイブリッドナノフォトニックトラップを実証した。
導波路表面に分布するカシミール・ポルダー相互作用と静電電荷の組合せによる誘引ポテンシャルを考察した。
注目すべきことに、ハイブリッドトラップは140(9)msの長い原子貯蔵時間をサポートし、16.8(2)msのラムジーコヒーレンス時間を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:29:17 GMT)
Hybrid Reputation Aggregation: A Robust Defense Mechanism for Adversarial Federated Learning in 5G and Edge Network Environments [0.0] 5Gおよびエッジネットワーク環境におけるフェデレートラーニング(FL)は、敵のクライアントによる深刻なセキュリティ脅威に直面します。
本稿では,攻撃タイプを事前に知ることなく,FLにおける敵の動作を防御する,新しいロバストアグリゲーション機構であるHybrid Reputation Aggregation(HRA)を紹介する。
HRAは、幾何学的異常検出と、モーメントに基づくクライアントの評判追跡を組み合わせる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:18:59 GMT)
How an Equi-ensemble Description Systematically Outperforms the Weighted-ensemble Variational Quantum Eigensolver [0.0] 我々は、多体励起状態の変分原理の一般化に焦点をあて、アンサンブル変分量子固有解法(VQE)を導いた。
等価アンサンブルと重み付きアンサンブルという2つのアンサンブルVQE手法の性能を比較し,その等価アンサンブルが進むべき道であると結論付けた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 16:27:25 GMT)
Functional effects models: Accounting for preference heterogeneity in panel data with machine learning [0.0] 本稿では、機械学習(ML)手法を用いて、社会デコグラフィ特性から個人固有の選好パラメータを学習する機能効果モデルに関する一般的な仕様を提案する。
従来の固定効果モデルとランダム/混合効果モデルに比較して,関数効果モデルの3つの具体的な利点を同定する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:22:18 GMT)
Functional Information in Quantum Darwinism: An Operational Measure of Objectivity [0.0] 目的は、システムのポインタ状態に関する十分な情報を独立して含む環境フラグメントの豊富さとして、客観性を定量化することである。
この研究は、古典的客観性は仮定ではなく、量的かつリソースに制限された冗長なレコードの存在として現れることを示唆している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:39:14 GMT)
Fast and Accurate Decoder for the XZZX code Using Simulated Annealing [0.0] XZZX符号は、量子デバイスにおけるバイアスノイズに対処するために設計された表面符号の変種である。
模擬アニーリング(SA)に基づくデコーダを提案する。
我々のSAデコーダは、MCMCに基づく単純なアルゴリズムにより、容易かつ効率的に並列化できる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:27:25 GMT)
Extensive entanglement between coupled Tomonaga-Luttinger liquids in and out of equilibrium [0.0] 量子絡み合いは自然界に存在するが、古典物理学では欠落している。
縦軸に沿って分配された2つの平行および空間的に分離された友長・ラッティンガー液体の絡み合いについて検討した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:13:05 GMT)
Exploring molecular supersolidity via exact and mean-field theories: single microwave shielding [0.0] 単一マイクロ波遮蔽下でのボソニック分子のためのGross-Pitaevskiiフレームワークを開発した。
正確な量子モンテカルロシミュレーションと比較した。
楕円型マイクロ波偏光は方向依存超流動性を誘導することを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:25:39 GMT)
Distribution of non-Gaussian states in a deployed telecommunication fiber channel [0.0] 機能する通信路における非ガウス状態の分布を実験的に実証する。
我々は,300mの光ファイバーを遠隔地へ送って,光子を抽出し,ワイグナーの負性を示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:55:47 GMT)
Detecting genuine multipartite entanglement in multi-qubit devices with restricted measurements [0.0] 我々は,任意の状態に適用可能な多元的GMEと$k$不分離性基準を導入する。
我々の基準はノイズロバストであり、マイクロ波フォトニックグラフ状態における証明された$k$不分離性から状態不整合を推測することができる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 14:56:46 GMT)
Design and Implementation of a Secure RAG-Enhanced AI Chatbot for Smart Tourism Customer Service: Defending Against Prompt Injection Attacks -- A Case Study of Hsinchu, Taiwan [0.0] 本稿では,Hsinchuスマート観光サービスのためのセキュア検索強化型チャットボットの設計と実装について述べる。
このシステムは、API関数呼び出し、多層言語分析、インジェクションに対するガードレールとRAGを統合している。
674の対向的プロンプトと223の良性クエリによる評価は、良性タスクに対する95%以上の精度を示し、インジェクション攻撃をかなり検出した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 11:40:29 GMT)
Deciding Local Unitary Equivalence of Graph States in Quasi-Polynomial Time [0.0] グラフ状態の局所ユニタリ(LU)同値性を決定するために準多項式ランタイム$nlog_2(n)+O(1)$のアルゴリズムを記述する。
LU等価性は、指数的爆発を避けるために、擬多項式的に多くの線形方程式の系を解くことに還元されることを示す。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:41:45 GMT)
Contrasting exchange-field and spin-transfer torque driving mechanisms in all-electric electron spin resonance [0.0] 我々は、単軌道アンダーソン不純物を用いて、偏光鉛に結合し、スピン遷移と共鳴によって変調された電圧によってバイアスを受ける駆動場の起源を研究する。
不純物の充電しきい値以下では、電子スピン共鳴は磁気交換駆動機構または磁場のようなトルクによって支配される。
電子スピン共鳴信号とスピンダイナミクスは、どの駆動機構が支配するかによって大きく異なり、電気駆動量子系における量子コヒーレント制御を最適化する可能性を強調している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 13:30:55 GMT)
Context Matters: Comparison of commercial large language tools in veterinary medicine [0.0] 大規模言語モデル (LLM) は, 臨床現場での利用が増えているが, 獣医学での成績はいまだに未熟である。
獣医学記録の標準化データセットを用いて,市販の獣医学用LCM要約ツールを3つ評価した。
製品1の平均スコアは4.61点(IQR: 0.73点)で、製品2では2.55点(IQR: 0.78点)、製品3では2.45点(IQR: 0.92点)であった。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:52:39 GMT)
Comparison of trapped-ion entangling gate mechanisms for mixed species [0.0] レーザーベース$sigma_zotimessigma_z$光シフトと$sigma_phiotimessigma_phi$Moelmer-Soerensenゲートの相違と共通性について検討した。
我々はこれらのゲートを、非常に異なる磁場感度を持つ量子ビット上に実装し、$43mathrmCa+$と$8mathrmSr+$でエンコードし、$sigma_zotimessigma_zに対して99.8%のフィデリティを達成する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:25:26 GMT)
Community Covert Communication - Dynamic Mass Covert Communication Through Social Media [0.0] 我々は,数百から数千のアバターを生産するソック人形師匠活動のユースケースを考える。
オンラインソフトウェアは、これらの操作を自動化し、これらのアバター集団をコミュニティに組織化するために使用される。
目的は、より大規模なコミュニティに対して、ターゲットと指向された影響力のコミュニケーションを組織することである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 08:36:03 GMT)
Classical and Quantum theory of magnonic and magnetoelastic nonlinear dynamics in continuum geometries [0.0] 連続系におけるスピンおよび音響波結合非線形ダイナミクスの理論を提供する。
我々は磁化と音波振幅の古典的な運動方程式を導出した。
我々の研究は、量子状態におけるマグノンの音響制御への道を開いた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 04:30:25 GMT)
Channel capacity of small modular quantum networks in the ultrastrongly coupled regime [0.0] 断熱的コヒーレント輸送に基づくプロトコルは, 動的カシミール効果によって引き起こされる漏れを抑制する変動に対して, ほぼ理想的な単一レター量子容量とロバスト性を達成できることを示した。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:42:45 GMT)
Causally-Guided Pairwise Transformer -- Towards Foundational Digital Twins in Process Industry [0.0] Causally-Guided Pairwise Transformer (CGPT)は、既知の因果グラフを帰納バイアスとして統合した新しいアーキテクチャである。
CGPTはチャネル依存型(CD)モデルとチャネル依存型(CI)モデルの両方で予測精度において有意に優れていた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:58:26 GMT)
Can You Trust Your Copilot? A Privacy Scorecard for AI Coding Assistants [0.0] 本稿では、専門家が検証した新しいプライバシースコアカードを紹介し、適用する。
この方法論は、法的方針から外部監査までの4種類の文書の詳細な分析を含む。
その結果、プライバシー保護の異なる階層が明らかとなり、上位と下位のツールの間に20ポイントのギャップがある。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 21:45:45 GMT)
CMOS Implementation of Field Programmable Spiking Neural Network for Hardware Reservoir Computing [0.0] Deep Neural Networks(DNN)やLarge Language Models(LLM)といった大規模ニューラルネットワークは、高消費電力、領域要件、プライバシに関する懸念から、エッジアプリケーションへの実践的なデプロイに挑戦する。
本研究は、ハードウェア貯水池コンピューティングのためのCMOS実装フィールドプログラマブルニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 05:19:46 GMT)
Bosonic content of three-fermion high-spin states [0.0] 高スピン三フェルミオン波動関数の情報内容の厳密な特徴を示す。
これは波動関数を有限個の固定不変量の集合に形式的に分解したものに基づいており、形状と呼ばれる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 15:26:09 GMT)
Are Deep Learning Methods Suitable for Downscaling Global Climate Projections? An Intercomparison for Temperature and Precipitation over Spain [0.0] ディープラーニングは、異なるアプローチの下で、グローバルな気候変動予測をダウンスケールする可能性を示しています。
未確認の状況や将来の排出シナリオの変化を確実に外挿できるかどうかについては、まだ明らかな疑問が残る。
本稿では,既存モデルの性能と外挿性能を評価するための相互比較実験の結果について述べる。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:18:48 GMT)
Applying Psychometrics to Large Language Model Simulated Populations: Recreating the HEXACO Personality Inventory Experiment with Generative Agents [0.0] 生成エージェントは、洗練された自然言語の相互作用を通して人間のような特性を示す。
事前に定義された人物の伝記に基づいて役割や個性を仮定する能力は、社会科学研究の参加者にとってコスト効率のよい代用品として位置づけられている。
本稿では,このようなペルソナをベースとしたエージェントがヒトの集団を表わすための有効性について検討する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 07:46:49 GMT)
An N-Plus-1 GPT Agency for Critical Solution of Mechanical Engineering Analysis Problems [0.0] ジェネレーティブAI、特にGPTは、機械工学の分析問題に対する顕著な解決策を生み出します。
これにより、教育やエンジニアリングの実践に"アウト・オブ・ボックス"のGPTは適さない。
機械工学における問題文の初期(低コスト)解析のための「N-Plus-1」について紹介する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 12:21:58 GMT)
An Artificial Intelligence Value at Risk Approach: Metrics and Models [0.0] 人工知能のリスク管理技術の現状は、今後のAI規制により、非常に未熟であるようだ。
本稿の目的は、AIリスク管理の深さについて、AIステークホルダーを指向させることである。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 20:27:29 GMT)
Advanced Financial Reasoning at Scale: A Comprehensive Evaluation of Large Language Models on CFA Level III [0.0] 本稿では,CFA(Chartered Financial Analyst)レベルIII試験において,23の最先端のLarge Language Models (LLMs)を評価するベンチマークを提案する。
我々は,複数選択質問(MCQ)とエッセイスタイル回答の両方を,Chain-of-ThoughtやSelf-Discoverといった複数のプロンプト戦略を用いて評価する。
CFAレベルIIIでは79.1% (o4-mini) と77.3% (Gemini 2.5 Flash) の複合スコアが得られた。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:05:03 GMT)
A sharper Magnus expansion bound woven in binary branches [0.0] この研究は、マグナス展開が任意の順序で切り離されたときに生じる誤差に基づいて、生成元に非依存な普遍上界を確立する。
我々は,Magnus拡張手法の精度と限界の理解に寄与することを目的としており,生成器の構造を前提にすることなく,量子力学を近似するためのよりシャープなバウンドを提供することを目的とする。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 18:37:06 GMT)
A Provably Secure Framework for Noise-Aware Delegated Quantum Computation and Storage [0.0] 本稿では,ノイズ対応分散量子計算のためのエンドツーエンドフレームワークを提案する。
当社のフレームワークが完全性、盲目性、妥当性を達成できることを証明するためのセキュリティ分析を提供する。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 06:22:50 GMT)
A Multimodal Conversational Assistant for the Characterization of Agricultural Plots from Geospatial Open Data [0.0] 本研究では,多モーダル検索と大規模言語モデル(LLM)を統合したオープンソースの対話型アシスタントを提案する。
提案したアーキテクチャは, 検索拡張生成(RAG)によるオクトロフォト, セチネル-2植生指標, およびユーザ提供文書を組み合わせたものである。
予備的な結果は、農業用クエリに対して明確で、関連性があり、コンテキスト対応の応答を生成することができることを示している。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 09:02:53 GMT)
A Knowledge Graph-based Retrieval-Augmented Generation Framework for Algorithm Selection in the Facility Layout Problem [0.0] 本稿では,自動設計システムにおけるアルゴリズム選択をガイドする新しいレコメンデーション手法を提案する。
知識グラフベースのRetrieval-Augmented Generation (KG RAG)フレームワークに基づいている。
論文参考訳(メタデータ) (Mon, 22 Sep 2025 17:29:10 GMT)