Towards More Accurate Diffusion Model Acceleration with A Timestep Tuner [113.0] 数千のデノナイジングステップを用いて画像を生成するために定式化された拡散モデルは通常、遅い推論速度に悩まされる。
最小コストで特定の区間に対してより正確な積分方向を求めるのに役立つtextbftimestep tunerを提案する。
実験により,我々のプラグイン設計を効率的に訓練し,様々な最先端加速度法の推論性能を向上できることが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:10:57 GMT)
Precise Information Control in Long-Form Text Generation [107.8] 提案手法は,短時間の自己完結文のセットで与えられた長文の出力をモデルで生成することを必要とするタスクの定式化である。
PICには、完全に全ての入力クレームを含むモデルの能力をテストする完全な設定と、関連するクレームのみを選択的に組み込む必要がある部分的な設定が含まれている。
提案するPIC-Benchは,PIC設定に適合する8つの長文生成タスクのベンチマークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:18:56 GMT)
MCM-DPO: Multifaceted Cross-Modal Direct Preference Optimization for Alt-text Generation [98.8] MCM-DPOは、正確なアノテーションを必要とせず、好みのペアでより良い選択肢を識別することを学ぶことで、alt-text生成を改善する。
高品質アノテートデータセットと選好ラベル付きデータセットが不足していることから,我々はTAltとPAltという2つの大規模かつ高品質なデータセットを構築した。
MCM-DPO法はDPO法とSFT法を相反する性能を示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:25:18 GMT)
H3AE: High Compression, High Speed, and High Quality AutoEncoder for Video Diffusion Models [97.5] オートエンコーダ(AE)は、画像およびビデオ生成のための潜時拡散モデルの成功の鍵である。
H3AEはGPUとモバイルで超高圧縮比とリアルタイムデコード速度を達成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:41:01 GMT)
OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking [95.0] 大規模な言語モデルによる機械記述は、しばしば検索強化世代に依存している。
バニラが取得した情報は、深さ、斬新さ、冗長性に悩まされる傾向がある。
提案するOmniThinkは,人間のような反復的展開とリフレクションの過程をエミュレートする,ゆっくり考えるマシンライティングフレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:33:49 GMT)
Rectified Diffusion Guidance for Conditional Generation [94.8] CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:09:18 GMT)
IC-Custom: Diverse Image Customization via In-Context Learning [93.7] IC-Customは、位置認識と位置自由な画像カスタマイズをシームレスに統合する統合フレームワークである。
In-context Multi-Modal Attention (ICMA) 機構を提案する。
IC-Customは、試行錯誤、画像挿入、クリエイティブIPカスタマイズなど、さまざまな産業アプリケーションをサポートしている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:36:23 GMT)
Learning Human-Perceived Fakeness in AI-Generated Videos via Multimodal LLMs [92.0] DeeptraceRewardは、人間が認識した偽のトレースをビデオ生成報酬に注釈付けするベンチマークである。
データセットは、高品質な3.3ビデオにまたがる4.3Kの詳細なアノテーションで構成されている。
これらのアノテーションを9つの主要なディープフェイクトレースカテゴリに集約し、人間が動画をAI生成であると識別する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:14:25 GMT)
Reinforcement Learning with Verifiable yet Noisy Rewards under Imperfect Verifiers [90.5] RLVR(Reinforcement Learning with Verifiable Rewards)は、人為的なラベル付けを避けるために、自動検証に対するポリシーを訓練する。
認証ハッキングの脆弱性を軽減するため、多くのRLVRシステムはトレーニング中にバイナリ$0,1$の報酬を破棄する。
この選択にはコストがかかる:textitfalse negatives(正しい回答、FNを拒絶)とtextitfalse positives(間違った回答、FPを受け入れる)を導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:56:44 GMT)
Demystifying deep search: a holistic evaluation with hint-free multi-hop questions and factorised metrics [89.2] We present WebDetective, a benchmark of hint-free multi-hop questions with a control Wikipedia sandbox。
25の最先端モデルに対する我々の評価は、すべてのアーキテクチャにまたがる体系的な弱点を明らかにしている。
私たちはエージェントワークフローであるEvidenceLoopを開発し、ベンチマークが特定する課題を明示的にターゲットしています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:59:03 GMT)
Beyond Log Likelihood: Probability-Based Objectives for Supervised Fine-Tuning across the Model Capability Continuum [88.9] 確率に基づく目的のファミリーを研究し、異なる条件下での有効性を特徴付ける。
客観的行動を管理する重要な次元、すなわちモデル能力の連続性を明らかにする。
我々の理論的分析は、目的が連続体を横断してどのように取引されるかをさらに解明し、目的をモデル能力に適応するための原則的な基盤を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:17:47 GMT)
BroRL: Scaling Reinforcement Learning via Broadened Exploration [88.7] RLVR(Reinforcement Learning with Verifiable Rewards)は、大規模言語モデルにおいて複雑な推論能力を解き放つ鍵となる要素として登場した。
最近のProRLは、トレーニングステップの数を増やすことで、RLのスケーリングを約束している。
RL, BroR-Lineasing the followingary paradigm for scaling RL, BroR-Lincreasing the rollouts per example to hundreds。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:59:02 GMT)
GEM: A Gym for Agentic LLMs [88.4] General Experience Maker (GEM) は、大規模言語モデル(LLM)の時代に設計されたオープンソースの環境シミュレータである。
GEMは、高スループットのための非同期ベクトル化実行を含む環境エージェントインタフェースの標準化されたフレームワークを提供する。
GEMを用いてPPO,GRPO,REINFORCEのアップル・ツー・アップル・ベンチマークを行い,アルゴリズム設計に光を当てる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:55:57 GMT)
Can Mamba Learn In Context with Outliers? A Theoretical Generalization Analysis [88.1] MambaモデルはTransformerベースのモデルよりも計算上の優位性に大きく注目されている。
本稿では,一層マンバモデルのトレーニング力学に関する最初の理論的解析を行った。
マムバは、より多くのトレーニングを必要とするかもしれないが、線形変換器が許容できるしきい値を超える場合であっても、正確な予測を保っている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:25:01 GMT)
Continuously Augmented Discrete Diffusion model for Categorical Generative Modeling [87.3] 標準離散拡散モデルは、吸収[MASK]トークンにそれらをマッピングすることで、すべての観測されていない状態を同一に扱う。
これは'インフォメーション・ヴォイド'を生成します。そこでは、偽のトークンから推測できるセマンティック情報は、デノイングステップの間に失われます。
連続的拡張離散拡散(Continuously Augmented Discrete Diffusion)は、連続的な潜在空間における対拡散で離散状態空間を拡大するフレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:00:56 GMT)
Social Welfare Function Leaderboard: When LLM Agents Allocate Social Welfare [87.1] 大規模言語モデル(LLM)は、人間の福祉に影響を及ぼす高い意思決定にますます信頼されている。
本稿では, LLMが主権アロケータとして機能する動的シミュレーション環境である社会福祉機能ベンチマークを紹介する。
我々は、20の最先端LCMを評価し、社会福祉確保のための第1のリーダーボードを提示する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:52:31 GMT)
Learn to Guide Your Diffusion Model [84.8] 本研究では,条件付き拡散モデルによる試料の品質向上手法について検討する。
誘導ウェイトは$omega_c,(s,t)$で、条件付き$c$、飾る時間$t$、飾る時間$s$の関数です。
我々は,モデルが報酬関数によって傾いた分布を目標にすることができるように,フレームワークを拡張して報酬付きサンプリングを行う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:21:48 GMT)
Error Feedback for Muon and Friends [80.9] 我々は、厳密な収束保証を備えた最初の通信効率非ユークリッドLMOであるEF21-Muonを紹介する。
我々の理論は、非ユークリッドの滑らかさとより一般的な$(L0, L1)$-smooth設定をカバーし、最もよく知られたユークリッドの速度と一致し、適切なノルム選択の下でより高速な収束を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:20:08 GMT)
Purrception: Variational Flow Matching for Vector-Quantized Image Generation [79.7] パーセプション(Purrception)はベクトル量子化画像生成のための変動流マッチング手法である。
本手法は,変分フローマッチングをベクトル量子化潜水器に適用し,コードブックの指標からカテゴリー後部を学習する。
これは連続的手法の幾何学的認識とカテゴリー的アプローチの離散的な監督を組み合わせる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:41:30 GMT)
The Clever Hans Mirage: A Comprehensive Survey on Spurious Correlations in Machine Learning [78.1] 機械学習モデルは、入力の非本質的特徴と対応するラベルの間の急激な相関に敏感である。
本稿では,機械学習モデルにおける突発的相関に対処する既存の最先端手法の詳細な分類法とともに,この問題の包括的調査を行う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:37:10 GMT)
Stabilizing Policy Gradients for Sample-Efficient Reinforcement Learning in LLM Reasoning [77.9] 強化学習は、大規模言語モデルの推論機能を実現する上で中心的な役割を果たしてきた。
本稿では,ポリシー更新時の曲率情報を追跡し,活用するトラクタブルな計算フレームワークを提案する。
アルゴリズムであるCurvature-Aware Policy Optimization (CAPO)は、不安定な更新に寄与するサンプルを特定し、それらをマスクアウトする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:29:32 GMT)
ExoPredicator: Learning Abstract Models of Dynamic Worlds for Robot Planning [77.5] 本研究では,内因性行動とメカニズムの両方について,シンボル的状態表現と因果過程を共同で学習する抽象世界モデルのためのフレームワークを提案する。
シミュレーションされた5つのテーブルトップロボット環境の中で、学習されたモデルは、より多くのオブジェクトとより複雑な目標を持つ保留タスクに一般化した高速な計画を可能にし、幅広いベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:58:01 GMT)
GUI-KV: Efficient GUI Agents via KV Cache with Spatio-Temporal Awareness [75.0] キーバリュー(KV)キャッシュは、これを緩和することができるが、フルキャッシュの保存は、画像重大なコンテキストでは禁じられている。
既存のキャッシュ圧縮手法はGUIの空間的および時間的冗長性を考慮しないため、最適化されていない。
再学習を必要としないGUIエージェントのKVキャッシュ圧縮方式であるGUI-KVを紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:37:54 GMT)
Evolving Language Models without Labels: Majority Drives Selection, Novelty Promotes Variation [74.8] 大規模言語モデル(LLM)は、検証可能な報酬(RLVR)からの強化学習でますます訓練されている
本稿では,ラベルのないフレームワークEVOL-RLを提案する。
EVOL-RLは、多数派のみのベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:29:42 GMT)
ConciseHint: Boosting Efficient Reasoning via Continuous Concise Hints during Generation [74.4] 提案するフレームワークはConciseHintと呼ばれ,推論モデルが簡潔に話すことを継続的に奨励する。
DeepSeek-R1 および Qwen-3 シリーズを含む最先端の LRM 実験により,本手法が簡潔な推論を効果的に生成できることが実証された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:23:03 GMT)
Learning Frequency and Memory-Aware Prompts for Multi-Modal Object Tracking [74.2] 凍結したRGBトラッカーに軽量なプロンプトを注入するデュアルアダプタフレームワークであるLearning Frequency and Memory-Aware Promptsを紹介する。
周波数誘導型ビジュアルアダプタは、相補的なキューをモダリティ間で適応的に転送する。
短い、長い、永続的なメモリストアを持つマルチレベルメモリアダプタは、信頼できる時間的コンテキストを格納し、更新し、取得する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:52:01 GMT)
Authentic Discrete Diffusion Model [72.3] 認証離散拡散(ADD)フレームワークは、従来の擬似離散的アプローチを再定義する。
ADDはフロートエンコードされたワンホットクラスデータを直接使用して拡散入力を再構成する。
実験により、ADDはベースラインと比較して分類タスクにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:51:10 GMT)
Spiralformer: Low Latency Encoder for Streaming Speech Recognition with Circular Layer Skipping and Early Exiting [70.8] Transformerベースのエンコーダはブロック処理に広く使われている。
本稿では,ブロック処理に適した新しいエンコーダSpralformerを提案する。
実験の結果,Librispeechにおける平均トークン放出遅延は21.6%減少した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:56:45 GMT)
An Iterative Bayesian Approach for System Identification based on Linear Gaussian Models [70.8] システム識別の問題に取り組み、入力を選択し、実際のシステムから対応する出力を観測し、データに最も合うようにモデルのパラメータを最適化する。
提案手法では,システムからの入力出力データとパラメータに関するモデルの1次情報のみを必要とする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:36:48 GMT)
Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion [70.2] 本稿では,アラブ世界における大規模言語モデル(LLM)の民主化の必要性に対処する。
アラビア語のLLMの実用的な目的の1つは、復号を高速化するトークン化器にアラビア語固有の語彙を使用することである。
第二言語(アラビア語)による人への獲得の間に語彙学習に触発されたAraLLaMAは、進歩的な語彙拡張を採用している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:59:09 GMT)
R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science [70.2] 高レベルの機械学習エンジニアリングタスクは、労働集約的で反復的である。
機械学習プロセスを形式化する包括的で分離されたフレームワークであるR&D-Agentを紹介します。
R&D-AgentはMLEを2つのフェーズと6つのコンポーネントに定義し、MLEのエージェント設計を原則としてテスト可能なプロセスに変える。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:21:53 GMT)
What if Othello-Playing Language Models Could See? [69.8] VISOTHELLO(VISOTHELLO)は、移動シーケンスとボードイメージを併用したマルチモーダルモデルである。
意味的に無関係な摂動下でのロバスト性を評価し, クロスモーダルアライメントの一貫性を解析した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:00:25 GMT)
Easi3R: Estimating Disentangled Motion from DUSt3R Without Training [69.5] Easi3Rは,4次元再構成のための簡易かつ効率的なトレーニングフリー手法である。
提案手法は,事前学習やネットワークファインチューニングの必要性を排除し,推論中の注意適応を適用した。
実世界のダイナミックビデオの実験では、従来の最先端手法よりも軽量な注意適応が著しく優れていたことが示されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:41:33 GMT)
AgenticIQA: An Agentic Framework for Adaptive and Interpretable Image Quality Assessment [69.1] 画像品質評価(IQA)は、人間の視覚系に根ざした知覚品質の定量化と解釈の両方を反映している。
AgenticIQAは、IQAを歪み検出、歪み解析、ツール選択、ツール実行の4つのサブタスクに分解する。
本稿では,IQAエージェントに適した大規模命令データセットであるAgenticIQA-200Kと,VLMベースのIQAエージェントの計画,実行,要約機能を評価するための最初のベンチマークであるAgenticIQA-Evalを紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:01:40 GMT)
Uncovering Challenges of Solving the Continuous Gromov-Wasserstein Problem [68.1] グロモフ=ワッサーシュタイン最適輸送(Gromov-Wasserstein Optimal Transport, GWOT)問題は、MLコミュニティの特別な関心を集めている。
既存の連続GWOTアプローチをさまざまなシナリオでクラッシュテストし、結果を注意深く記録し分析し、問題を特定します。
本稿では,離散的手法に依存しない新たな連続GWOT法を提案し,競合の問題を部分的に解決する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:46:38 GMT)
Provable In-Context Learning of Nonlinear Regression with Transformers [67.0] In-context Learning (ICL) は、パラメータを更新することなくタスク固有のプロンプトを使用して見えないタスクを実行する能力である。
最近の研究はICLの背後にあるトレーニングのダイナミクスを積極的に探求しており、その多くは比較的単純なタスクに重点を置いている。
本稿では、変換器が文脈内学習能力をいかに獲得するかを明らかにすることを目的として、より複雑な非線形回帰タスクについて検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:43:34 GMT)
WALT: Web Agents that Learn Tools [66.7] WALTは、Webサイト機能を再利用不能なツールにリバースエンジニアリングするフレームワークである。
WALTはアドホックなスキルを仮説化するのではなく、既にウェブサイトに設計されている自動化の堅牢な実装を公開している。
VisualWebArenaとWebArenaでは、WALTはより少ないステップとLLM依存の推論でより高い成功を達成している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:41:47 GMT)
AgentDAM: Privacy Leakage Evaluation for Autonomous Web Agents [66.3] 我々は、AIウェブナビゲーションエージェントがデータ最小化のプライバシー原則に従うかどうかを測定する新しいベンチマークAgentDAMを紹介する。
我々のベンチマークは、現実的なWebインタラクションシナリオをエンドツーエンドでシミュレートし、既存のWebナビゲーションエージェントに適応する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:55:58 GMT)
CML-Bench: A Framework for Evaluating and Enhancing LLM-Powered Movie Scripts Generation [66.2] 対話コヒーレンス(DC)、キャラクタ一貫性(CC)、Plot Reasonableness(PR)にまたがる定量的メトリクスを特徴とするCML-Benchを提案する。
CML-Benchは、熟練した人書きのスクリプトに効果的に高いスコアを割り当てる。
ベンチマークをさらに検証するために,文字対話とイベントロジックに関する詳細な指示を取り入れたプロンプト戦略であるCML-Instructionを導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:03:26 GMT)
From Scores to Preferences: Redefining MOS Benchmarking for Speech Quality Reward Modeling [66.2] 我々は、多様なMOSデータセットを優先順位比較設定に再構成する統一ベンチマークを導入する。
MOS-RMBenchを基盤として,報酬モデルのための3つのパラダイムを体系的に構築・評価する。
実験の結果,(1)スカラーモデルが最も高い総合的性能を達成し,その精度は74%を超え,(2)ほとんどのモデルでは,人間の音声よりもはるかに悪く,(3)MOSの差が非常に小さいペアで苦戦している,という結果が得られた。
実験結果から, MOS 対応 GRM は細粒度品質の識別を著しく改善し, 最も困難な場合においてスカラーモデルとのギャップを狭めることが明らかとなった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:27:51 GMT)
LiRA: A Multi-Agent Framework for Reliable and Readable Literature Review Generation [66.1] 文献レビュープロセスをエミュレートする多エージェント協調ワークフローLiRA(Literature Review Agents)を提案する。
LiRAは、コンテンツアウトライン、サブセクションの執筆、編集、レビュー、コヒーシブで包括的なレビュー記事の作成に特殊エージェントを使用している。
実世界のシナリオにおいて文書検索を用いてLiRAを評価し,そのロバスト性を評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:14:28 GMT)
Audio Driven Real-Time Facial Animation for Social Telepresence [65.7] 最小遅延時間で3次元顔アバターをアニメーションするオーディオ駆動リアルタイムシステムを提案する。
我々のアプローチの中心は、音声信号をリアルタイムに潜在表情シーケンスに変換するエンコーダモデルである。
我々は、リアルタイムなパフォーマンスを達成しつつ、自然なコミュニケーションに必要な表情の豊富なスペクトルを捉えている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:57:05 GMT)
The Illusion of Readiness: Stress Testing Large Frontier Models on Multimodal Medical Benchmarks [63.9] GPT-5のような大型フロンティアモデルは、医学ベンチマークでトップスコアを獲得した。
しかし、ストレステストは別の話をします。
これらのベンチマークは、今日のベンチマークが医学的理解よりもテストのトリックにどのように報いるかを公開しています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:21:09 GMT)
Diagnosing and Addressing Pitfalls in KG-RAG Datasets: Toward More Reliable Benchmarking [63.8] 知識グラフ質問 回答システムは、複雑なマルチホップ推論を評価するために高品質なベンチマークに依存している。
広く使われているにもかかわらず、WebQSPやCWQのような一般的なデータセットは、重要な品質問題に悩まされている。
我々はこれらの落とし穴を体系的に解決するLLM-in-the-loopフレームワークであるKGQAGenを紹介する。
本研究は,KGQA評価を推し進めるスケーラブルなフレームワークとして,より厳密なベンチマーク構築とKGQAGenの位置づけを提唱する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:37:10 GMT)
TD-JEPA: Latent-predictive Representations for Zero-Shot Reinforcement Learning [63.7] 本稿では,TDに基づく潜在予測表現を教師なしRLに活用するTD-JEPAを紹介する。
TD-JEPAは、明示的な状態とタスクエンコーダ、ポリシー条件付きマルチステップ予測器、パラメータ化されたポリシーのセットを潜時空間で直接訓練する。
実証的には、TD-JEPAは13のデータセットにわたる移動、ナビゲーション、操作のタスクにおいて、最先端のベースラインをマッチまたは上回る。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:21:18 GMT)
Agentic Jigsaw Interaction Learning for Enhancing Visual Perception and Reasoning in Vision-Language Models [63.7] AGILEは、対話的なプロセスとしてジグソー解決を定式化し、モデルが環境に徐々に関与できるようにする。
我々は AGILE がジグソータスクの性能を大幅に向上させることを示す。
また、9つの一般的な視覚タスクに対して強力な一般化を示し、平均3.1%の改善を実現した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:58:05 GMT)
Easier Painting Than Thinking: Can Text-to-Image Models Set the Stage, but Not Direct the Play? [63.7] T2I-CoReBenchは、T2Iモデルの合成能力と推論能力の両方を評価する包括的で複雑なベンチマークである。
実世界の複雑さによって引き起こされる複雑さを増大させるために、我々は各プロンプトをより高い組成密度でキュレートする。
統計学では、我々のベンチマークは1080の挑戦的なプロンプトと約1,500のチェックリスト質問で構成されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:26:16 GMT)
Reinforced Strategy Optimization for Conversational Recommender Systems via Network-of-Experts [63.4] 会話レコメンダシステム(CRS)のための新しい強化戦略最適化(RSO)手法を提案する。
RSOは、戦略駆動型応答決定をマクロレベルの戦略計画とマイクロレベルの戦略適応に分解する。
実験の結果, RSOは最先端のベースラインと比較して, インタラクション性能を著しく向上することがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:38:59 GMT)
CodeChemist: Functional Knowledge Transfer for Low-Resource Code Generation via Test-Time Scaling [63.1] 本稿では,高リソースから低リソースPLへの機能的知識伝達を可能にする,テスト時間スケーリングのフレームワークであるCodeChemistを紹介する。
実験の結果,CodeChemistは既存のテストタイムスケーリング手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:33:53 GMT)
Backdoor Attacks Against Speech Language Models [63.1] 本研究は,音声認識モデルに対する音声バックドア攻撃に関する最初の体系的研究である。
4つの音声エンコーダと3つのデータセットにまたがってその効果を実証し、4つのタスクをカバーした。
汚染された事前訓練エンコーダの脅威を軽減できる微調整型防御法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:45:04 GMT)
Scaling Linear Attention with Sparse State Expansion [62.7] トランスフォーマーアーキテクチャは、2次計算と線形メモリ成長による長期コンテキストシナリオに苦慮している。
より効率的な文脈圧縮を実現するための2つの重要な革新を提案する。
まず、情報分類として状態更新を概念化し、線形注意のための行スパース更新定式化を導入する。
次に、スパースフレームワーク内にスパース状態拡張(SSE)を示し、コンテキスト状態を複数のパーティションに拡張する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:55:43 GMT)
Selective Underfitting in Diffusion Models [62.5] 拡散モデルは,学習時間の帰納バイアスによる経験的スコアに不適合である。
スコアを至る所で不適合にする代わりに、より良い拡散モデルは入力空間の特定の領域のスコアをより正確に近似し、他の領域では不適合にする。
その結果, 拡散モデルを理解するためには選択的不適合性が不可欠であることが確認され, 一般化と生成性能に関する新たな検証可能な知見が得られた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:06:20 GMT)
SEE: See Everything Every Time - Adaptive Brightness Adjustment for Broad Light Range Images via Events [62.2] ダイナミックレンジが120億ドルを超えるイベントカメラは、従来の組込みカメラをはるかに上回っている。
本研究では,広い照明条件下で撮影した画像の明るさを拡張・適応的に調整するために,イベントをどのように利用するかという,新しい研究課題を提案する。
我々のフレームワークは、センサパターンを通して色を捉え、イベントを輝度辞書としてモデル化するためにクロスアテンションを使用し、画像のダイナミックレンジを調整し、広い光域表現を形成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:13:57 GMT)
IMAGEdit: Let Any Subject Transform [61.7] imageditは、ビデオの被写体編集のためのトレーニング不要のフレームワークである。
非標的領域を維持しながら、複数の指定対象の外観を操作する。
マスク駆動型ビデオ生成モデルと互換性がある。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:59:56 GMT)
Training-free Uncertainty Guidance for Complex Visual Tasks with MLLMs [61.6] 本稿では,MLLMの本質的不確かさをプロアクティブ誘導信号として用いた学習自由フレームワークを提案する。
応答不確実性によって候補の視覚入力をスコアする統一的なメカニズムを導入し、モデルが最も健全なデータに自律的にフォーカスできるようにする。
本研究は,本質的な不確実性を活用することが,細粒度マルチモーダル性能を高めるための強力で汎用的な戦略であることを実証する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:20:51 GMT)
CoFFT: Chain of Foresight-Focus Thought for Visual Language Models [61.3] フォレスト・フォーカス思考の連鎖(英語: Chain of Foresight-Focus Thought, CoFFT)は、人間の視覚的認知をエミュレートすることによって視覚的推論を強化する訓練のないアプローチである。
これらの段階は反復的に機能し、推論が視覚的焦点を導き、視覚的焦点がその後の推論を知らせる相互依存サイクルを生成する。
Qwen2.5-VL、InternVL-2.5、Llava-Nextを使った複数のベンチマークでの実証結果では、3.1-5.8%が一貫したパフォーマンス向上を示し、計算オーバーヘッドは増大した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:15:14 GMT)
DisCo: Reinforcement with Diversity Constraints for Multi-Human Generation [60.7] DisCoは、マルチヒューマン世代におけるアイデンティティの多様性を直接最適化する最初のRLベースのフレームワークである。
グループ相対ポリシー最適化によるDisCo微粒フローマッチングモデル。
DiverseHumans Testsetでは、DisCoは98.6のユニークな顔の精度とほぼ完璧なグローバルアイデンティティスプレッドを実現している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:28:51 GMT)
Towards Self-Evolving Benchmarks: Synthesizing Agent Trajectories via Test-Time Exploration under Validate-by-Reproduce Paradigm [60.4] 本稿では,トラジェクトリをベースとしたエージェント・ベンチマーク・複雑度進化フレームワークを提案する。
このフレームワークは、既存のベンチマークから元のタスクを受け取り、エージェントがそれをより難しい新しいタスクに進化させるよう促す。
GAIAベンチマークの実験では、TRACEフレームワークはタスクの複雑さを継続的に向上し、正確性の信頼性を向上させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:52:52 GMT)
MMGeoLM: Hard Negative Contrastive Learning for Fine-Grained Geometric Understanding in Large Multimodal Models [60.2] 大規模なマルチモーダルモデル(LMM)はViT(例えばCLIP)上に構築されるが、単純なランダムなバッチ内負のトレーニングは、きめ細かい視覚的差異を捉える能力を制限している。
本稿では,画像に基づくコントラスト学習と生成に基づくコントラスト学習を組み合わせた,視覚エンコーダのための新しいハード負のコントラスト学習フレームワークを提案する。
我々は、我々のハードネガティブトレーニング手法であるMMCLIP(Multimodal Math CLIP)を用いて視覚エンコーダ(CLIP)を訓練し、幾何学的問題解決のためにLMMを訓練する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:17:28 GMT)
A Backdoor-based Explainable AI Benchmark for High Fidelity Evaluation of Attributions [60.1] まず、属性手法の信頼性ベンチマークが満たすであろう信頼度基準のセットを同定する。
次に、望ましい忠実度基準に準拠したBackdoorベースのeXplainable AIベンチマーク(BackX)を紹介します。
我々の分析はまた、属性を利用して神経トロイの木馬を守るための洞察を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:51:33 GMT)
Code2Video: A Code-centric Paradigm for Educational Video Generation [60.0] 我々は,Pythonコードによる教育ビデオを生成するための,コード中心のエージェントフレームワークであるCode2Videoを提案する。
i)講義内容を時間的コヒーレントなフローに構造化するPlanner,(ii)構造化命令を実行可能なPythonコードに変換するCoder,そして(iii)視覚言語モデル(VLM)を視覚的アンカープロンプトで活用し,空間的レイアウトを洗練し,明確性を確保するCryticという3つの協調エージェントから構成される。
我々の結果は、Code2Videoが拡張性があり、解釈可能で、制御可能なアプローチである可能性を示し、直接コードよりも40%改善されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:56:48 GMT)
Can World Models Benefit VLMs for World Dynamics? [59.7] 本研究では,世界モデル先行モデルがビジョンランゲージモデルに移行した場合の能力について検討する。
最高の性能を持つDynamic Vision Aligner (DyVA) と名付けます。
DyVAはオープンソースとプロプライエタリの両方のベースラインを超え、最先端または同等のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:07:05 GMT)
Energy-Regularized Sequential Model Editing on Hyperspheres [59.5] 大規模言語モデル(LLM)は、進化する現実世界の知識と整合性を維持するために、定期的な更新を必要とする。
逐次編集はしばしば表現を不安定にし、破滅的な忘れを誘発する。
ニューロンの重量分布を安定化するHE駆動正規化戦略であるSPHERE(Sparse Projection for Hyperspherical Energy-Regularized Editing)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:55:43 GMT)
Generalized Parallel Scaling with Interdependent Generations [58.4] 本稿では,相互依存応答を並列に生成するブリッジを提案する。
少数の新しいパラメータしか持たず、ブリッジは強化学習による相対平均精度の向上を図っている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:33:35 GMT)
NAIPv2: Debiased Pairwise Learning for Efficient Paper Quality Estimation [58.3] 本稿では,紙の品質評価のための非バイアスで効率的なフレームワークであるNAIPv2を提案する。
NAIPv2は、レビューアレーティングの不整合を低減するために、ドメイン年グループ内でペアワイズ学習を採用している。
これはペアワイズ比較に基づいてトレーニングされるが、デプロイ時に効率的なポイントワイズ予測を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:02:07 GMT)
SafeSearch: Automated Red-Teaming for the Safety of LLM-Based Search Agents [58.2] 我々は、低品質な検索結果の出現率と、エージェントの動作を誤る可能性を実証する2つの実験を行った。
この脅威に対処するため、私たちは、体系的、スケーラブルで、コスト効率のよい自動化されたレッドチームフレームワークを導入しました。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:48:11 GMT)
Riemannian Consistency Model [57.9] 本稿では,Riemannian Consistency Model (RCM)を提案する。
RCMの離散的および連続的な訓練目標に対する閉形式解を導出する。
我々は、RCMの目的を解釈するためのユニークなキネマティクスの視点を提供し、新しい理論的な角度を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:57:25 GMT)
Reinforcement Learning with Discrete Diffusion Policies for Combinatorial Action Spaces [57.5] 強化学習(Reinforcement Learning, RL)は、現実の多くの問題に共通する大規模なアクション空間にスケールするために苦労する。
本稿では、複雑な環境下での高効率なポリシーとして、離散拡散モデルを訓練するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:48:42 GMT)
Beyond Majority Voting: LLM Aggregation by Leveraging Higher-Order Information [57.4] 最適重み(OW)と逆サプライシング人気度(ISP)という2つの新しいアグリゲーションアルゴリズムを開発した。
我々の理論的分析は、これらの手法が軽微な仮定の下での多数決の本質的な制限を確実に緩和することを示している。
我々は,我々のアルゴリズムを人工データセット,UltraFeedbackやMMLUなどのLLMファインチューニングベンチマーク,実世界の医療環境ARMMAN上で実証的に検証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:21:50 GMT)
Semi-Supervised Unconstrained Head Pose Estimation in the Wild [57.1] 本研究では,最初の半教師なしヘッドポーズ推定手法であるSemiUHPEを提案する。
本手法は, 前回のランドマークに基づくアフィンアライメントよりも, 野生の頭部のアスペクト比不変収穫が優れているという観測に基づいている。
提案手法は, 汎用物体回転回帰法や3次元頭部再構成法など, その他の密接に関連する問題を解く上でも有用である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:57:44 GMT)
DPDETR: Decoupled Position Detection Transformer for Infrared-Visible Object Detection [57.1] 赤外可視物体検出は、赤外と可視画像の相補的な情報を活用することにより、堅牢な物体検出を実現することを目的としている。
相補的特徴を融合させることは困難であり、現在の手法では相補的条件下での両モードのオブジェクトを確実に見つけることはできない。
これらの問題に対処するための分離位置検出変換器を提案する。
DroneVehicleとKAISTデータセットの実験は、他の最先端の方法と比較して大幅に改善されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:40:39 GMT)
BindWeave: Subject-Consistent Video Generation via Cross-Modal Integration [57.0] 本稿では,幅広いテーマ・ツー・ビデオシナリオを扱う統一フレームワークを提案する。
MLLM-DiTフレームワークは,事前訓練されたマルチモーダルな大規模言語モデルで,基底エンティティに対して深い相互モーダル推論を行う。
OpenS2Vベンチマークの実験により、本手法は、生成ビデオにおける主観的整合性、自然性、テキスト関連性において優れた性能を実現することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:41:11 GMT)
"We are not Future-ready": Understanding AI Privacy Risks and Existing Mitigation Strategies from the Perspective of AI Developers in Europe [56.2] ヨーロッパを拠点とする25人のAI開発者を対象にインタビューを行い、ユーザ、開発者、ビジネスに最もリスクをもたらすと彼らが信じているプライバシの脅威を理解しました。
プライバシリスクの相対的なランク付けに関して、AI開発者の間ではほとんど合意が得られていないことが分かっています。
AI開発者はこれらのリスクに対処するために提案された緩和戦略を認識しているが、彼らは最小限の現実的採用を報告した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:51:33 GMT)
Large Reasoning Models Learn Better Alignment from Flawed Thinking [56.1] 大規模推論モデル(LRM)は、最終的な答えを生成する前に構造化チェーン・オブ・シント(CoT)を生成することで「考える」。
本稿では,Regressed Learning (RL) 手法であるRECAPを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:15:43 GMT)
Optimizing Fairness in Production Planning: A Human-Centric Approach to Machine and Workforce Allocation [55.7] 提案システムは,自動車業界のドメインエキスパートによる16のテストセッションを通じて検証される。
その結果,CPをベースとしたスケジューリング手法は,信頼性の低いコンパクトで実現可能な生産計画を生成することが示唆された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:41:18 GMT)
Forget Forgetting: Continual Learning in a World of Abundant Memory [55.6] 継続的な学習は伝統的に、模範記憶の最小化に重点を置いてきた。
本稿では、より現実的な体制を探求することによって、このパラダイムに挑戦する。
モデルが以前のタスクに偏り、新しいタスクを学ぶのに苦労するようになるにつれて、中心的な課題が安定性から可塑性へと変化していくことが分かっています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:55:58 GMT)
Align Your Tangent: Training Better Consistency Models via Manifold-Aligned Tangents [55.4] 一貫性モデル(CM)は、フロー常微分方程式の軌跡に一貫性があるように訓練される。
CMは典型的には、競争力のあるサンプルの品質を得るために、大きなバッチサイズで長期のトレーニングを必要とする。
本稿では,データ多様体に向いた多様体整列接点を提供する,MFDと呼ばれる新しい損失関数を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:35:18 GMT)
Deriving Strategic Market Insights with Large Language Models: A Benchmark for Forward Counterfactual Generation [55.3] 本稿では,FIN-FORCE-FINancial Forward Counterfactual Evaluationを提案する。
FIN-FORCEは金融ニュースの見出しをまとめることで、LLMベースの対実生成を支援する。
これにより、将来の市場展開を探索し、予測するためのスケーラブルで自動化されたソリューションの道を開くことができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:09:32 GMT)
Explaining multimodal LLMs via intra-modal token interactions [55.3] MLLM(Multimodal Large Language Models)は、様々な視覚言語タスクにおいて顕著な成功を収めているが、その内部決定機構は十分に理解されていない。
モーダル内相互作用を利用した解釈可能性の向上を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:48:01 GMT)
Not All Rollouts are Useful: Down-Sampling Rollouts in LLM Reinforcement Learning [55.2] 検証可能な報奨付き強化学習(RLVR)が,大規模言語モデルにおける推論能力向上のための主要なアプローチとして登場した。
ロールアウト生成は恥ずかしく並列であり、メモリライトであるのに対して、ポリシー更新は通信量が多く、メモリ集約的である。
PODS(Policy Optimization with Down-Sampling)を導入し、戦略的に選択されたロールアウトサブセットでのみトレーニングすることで、ポリシー更新からロールアウト生成を分離する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:58:47 GMT)
Non-Euclidean Broximal Point Method: A Blueprint for Geometry-Aware Optimization [55.0] Broximal Point Method(BPM)は、現在の反復を中心にした標準球よりも目的関数を反復的に最小化する、理想的な最適化フレームワークを提供する。
顕著な大域収束保証、線形収束、および正規閉凸函数に対する有限のステップを享受する。
本稿では、BPMの収束理論が、このより一般的な非ユークリッド的な設定に拡張できるかどうかを問う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:32:52 GMT)
Plug-and-Play Prompt Refinement via Latent Feedback for Diffusion Model Alignment [54.2] PromptLoopはプラグインとプレイの強化学習フレームワークで、遅延フィードバックをステップワイドな即興改善に組み込む。
この設計は、プロンプトベースのアライメントの柔軟性と一般性を維持しながら、拡散RLアプローチと構造的な類似性を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:18:58 GMT)
CurES: From Gradient Analysis to Efficient Curriculum Learning for Reasoning LLMs [53.7] カリキュラム学習は,大規模言語モデルの学習効率を高める上で重要な役割を担っている。
収束を加速し,計算オーバーヘッドを最小限に抑えるためにベイズ後続推定を用いた効率的な学習法であるCurESを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:41:27 GMT)
Learning to Interact in World Latent for Team Coordination [53.5] 本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。
コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。
私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:02:42 GMT)
SpikeGen: Decoupled "Rods and Cones" Visual Representation Processing with Latent Generative Framework [53.3] 本研究では,現代の潜在空間生成フレームワークとマルチモーダル視覚入力を統合することで,人間の視覚システムをエミュレートすることを目的とする。
我々はSpikeGenと命名し、条件付き画像やビデオの劣化、スパイクストリームからの高密度フレーム再構成、高速シーンノベルビュー合成など、様々なスパイクRGBタスクのパフォーマンスを評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:46:40 GMT)
DeepSearch: Overcome the Bottleneck of Reinforcement Learning with Verifiable Rewards via Monte Carlo Tree Search [53.3] 我々はモンテカルロ木探索を直接RLVRトレーニングに統合するフレームワークであるDeepSearchを紹介する。
推論時にのみツリー検索に依存する既存のメソッドとは対照的に、DeepSearchは構造化された検索をトレーニングループに埋め込む。
コントリビューションには,(1)検索ツリー全体にわたって有望なノードを優先するグローバルフロンティア選択戦略,(2)監督のための確実なパスを識別するエントロピーベースのガイダンスによる選択,(3)効率的なソリューションキャッシングによる適応的リプレイバッファトレーニングなどが含まれている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:09:42 GMT)
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [52.8] Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。
分子理解を改善するために,分子エンコーダの相補的な情報を統合するモジュールを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:40:04 GMT)
A Tale of LLMs and Induced Small Proxies: Scalable Agents for Knowledge Mining [52.6] Falconerは、大規模言語モデルとスケーラブルな知識マイニングのための軽量プロキシモデルを組み合わせたフレームワークである。
LLMはプランナーとして機能し、ユーザ命令を実行可能なパイプラインに分解し、アノテータとして、小さなプロキシをトレーニングするための監督を生成する。
実験の結果、Falconerは命令追従精度で最先端のLCMと密に一致し、推論コストを最大90%削減した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:06:48 GMT)
Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition [52.2] General Policy Composition (GPC) は、複数の事前学習されたポリシーの分布スコアを組み合わせることで、パフォーマンスを向上させる訓練のない手法である。
GPCは、さまざまなタスクセットにおけるパフォーマンスと適応性を一貫して改善します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:05:53 GMT)
RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs [51.9] 本稿では、軽量で解釈可能でスケーラブルなルーティングフレームワークRADAR(Reasoning-Ability and Difficulty-Aware Routing)を提案する。
心理測定にインスパイアされたRADARは、さまざまな予算を持つモデル応答から異なるクエリへのアイテム応答モデルを学ぶ。
我々は8つの広く使われている推論ベンチマークについて広範な実験を行い、最先端のルーティング手法と比較してRADARの優れた性能を実証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:34:10 GMT)
Disc-Cover Complexity Trends in Music Illustrations from Sinatra to Swift [51.7] アルバムカバーの視覚的複雑さについて検討し,75年間,11種類のポピュラー音楽ジャンルについて検討した。
我々の分析は、例外を除いて、ほとんどのジャンルでミニマリズムへの幅広いシフトを明らかにしている。
同時に、時間とともに変化するばらつきを観察し、多くのカバーは高いレベルの抽象化と複雑さを示し続けています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:01:25 GMT)
Hearing the Order: Investigating Selection Bias in Large Audio-Language Models [51.7] 大規模オーディオ言語モデル(LALM)は、注文された選択肢に対する推論を含むタスクでしばしば使用される。
本稿では,この問題をLALMで同定し,解析する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:00:58 GMT)
A* Search Without Expansions: Learning Heuristic Functions with Deep Q-Networks [51.6] 我々は,状態の受信が可能な検索アルゴリズムであるQ*を導入し,その状態から可能なすべての遷移に対して,コスト・ツー・ゴー推定を返却する。
我々はQ*探索が、遷移コストと状態へのコストの合計を過大評価しない関数から最短経路を見つけることが保証されていることを証明した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:08:16 GMT)
Round-trip Reinforcement Learning: Self-Consistent Training for Better Chemical LLMs [51.3] 大規模言語モデル (LLM) は計算化学の汎用基盤モデルとして登場しつつある。
これらのモデルは、しばしば往復一貫性を欠いている。
本稿では,その一貫性を向上させるためにモデルをトレーニングする新しいフレームワークであるRound-Trip Reinforcement Learning(RTRL)を紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:58:58 GMT)
Rectifying Regression in Reinforcement Learning [51.3] 平均絶対誤差は,学習方針の最適度差を制御するために,従来の平均二乗誤差よりもよい予測目標であることを示す。
異なる損失関数は、これらの異なる回帰目標とよりよく一致していることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:32:07 GMT)
CRUST-Bench: A Comprehensive Benchmark for C-to-safe-Rust Transpilation [51.2] CRUST-Benchは100のCリポジトリのデータセットで、それぞれが安全なRustとテストケースで手書きのインターフェースとペアリングされている。
我々は、このタスクで最先端の大規模言語モデル(LLM)を評価し、安全で慣用的なRust生成が依然として難しい問題であることを確認した。
最高のパフォーマンスモデルであるOpenAI o1は、ワンショット設定で15タスクしか解決できない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:43:08 GMT)
iFinder: Structured Zero-Shot Vision-Based LLM Grounding for Dash-Cam Video Reasoning [51.2] iFinderは、ダッシュカムのビデオを大規模な言語モデルのための階層的で解釈可能なデータ構造に変換するセマンティックグラウンドディングフレームワークである。
iFinderはトレーニング不要のパイプラインとして動作し、トレーニング済みの視覚モデルを使用して重要な手がかりを抽出する。
これは、4つのゼロショット駆動ベンチマークにおいて、エンドツーエンドのV-VLMよりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:54:44 GMT)
Proxy-GS: Efficient 3D Gaussian Splatting via Proxy Mesh [51.0] 3Dガウススプラッティングは、レンダリングを実現するための効率的なアプローチとして登場した。
近年の変種は、視覚的忠実度をさらに向上するが、レンダリング中にかなりのデコードオーバーヘッドをもたらす。
コストを軽減するため、いくつかのプルーニング戦略とレベル・オブ・ディーテール(LOD)技術が導入されている。
本稿では,プロキシを利用した新しいパイプラインであるProxy-GSを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:55:39 GMT)
Learning Pattern-Specific Experts for Time Series Forecasting Under Patch-level Distribution Shift [51.0] 時系列はしばしば、季節、動作条件、意味的な意味など、セグメントごとに異なるパターンを持つ複雑な非一様分布を示す。
既存のアプローチでは、通常、これらのさまざまなパターンをキャプチャするために単一のモデルをトレーニングするが、しばしばパッチ間のパターンのドリフトに苦労する。
より正確で適応可能な時系列予測にパターン特化の専門家を活用する新しいアーキテクチャであるTFPSを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:25:11 GMT)
Is Model Editing Built on Sand? Revealing Its Illusory Success and Fragile Foundation [50.4] 大きな言語モデル(LLM)は、必然的に時代遅れまたは誤った知識をエンコードする。そのような知識の更新、削除、そして忘れは、アライメント、安全性、その他の問題にとって重要である。
この問題を解決するために、モデル編集は有望なパラダイムとして現れ、特定の事実が更新され、他の知識を保持しながら、パラメータの小さなサブセットを正確に編集する。
前回の論文で大きな成功を収めたにもかかわらず、編集の信頼性は脆弱な基盤にかかっていることが判明した。
我々の経験的証拠は、編集が完全な意味論よりもショートカットに基づく可能性が高いことを示し、さらなる進歩の前にモデル編集の基盤を急激な再考を求める。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:59:23 GMT)
Adaptive Shared Experts with LoRA-Based Mixture of Experts for Multi-Task Learning [49.9] マルチタスク学習(MTL)のための強力なフレームワークとして、Mixture-of-Experts(MoE)が登場した。
既存のMoE-MTL法は、しばしばシングルタスクで事前訓練されたバックボーンに依存し、冗長な適応と非効率的な知識共有に悩まされる。
低ランク適応 (LoRA) に基づく MoE の適応型共有専門家 (ASE) を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:49:19 GMT)
LLM Routing with Dueling Feedback [49.7] ユーザの満足度,モデルの専門性,推論コストのバランスを保ちながら,クエリ毎に最適なモデルを選択するという課題について検討する。
絶対的なスコアではなく、ペアの選好フィードバックから学習することで、ルーティングをコンテキストデュエルの帯域として定式化する。
分類的重み付けを用いた対照的な微調整を用いて,オフラインデータからモデル埋め込みを導出する表現学習手法であるカテゴリーキャリブレーション・ファインタニング(CCFT)を導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:52:25 GMT)
Probing the Critical Point (CritPt) of AI Reasoning: a Frontier Physics Research Benchmark [49.4] 本研究では,研究レベルの推論タスクにおいて,大規模言語モデル(LLM)をテストするために設計された最初のベンチマークを示す。
CritPtは71の複合研究課題からなる。
現在最先端のLCMは、孤立したチェックポイントを早期に保証しているが、完全な研究スケールの課題を確実に解決できるには程遠い。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:12:55 GMT)
DC-Gen: Post-Training Diffusion Acceleration with Deeply Compressed Latent Space [49.3] 既存のテキストと画像の拡散モデルは高品質な画像を生成するのに優れていますが、高解像度にスケールすると大きな効率上の課題に直面します。
本稿では、深く圧縮された潜在空間を活用することで、テキストから画像への拡散を加速するフレームワークであるDC-Genを紹介する。
具体的には、DC-Gen-FLUXはNVIDIA H100 GPU上で4K画像生成のレイテンシを53倍削減する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:18:37 GMT)
Mitigating Multimodal Hallucinations via Gradient-based Self-Reflection [49.3] 本研究では,テキスト・視覚バイアスと共起バイアスに対処するために,グラディエントベースのインフルエンス・アウェア制約付きデコーディング(GACD)手法を提案する。
GACDは幻覚を効果的に低減し、MLLM出力の視覚的接地を改善する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:53:37 GMT)
Grounding Multimodal LLMs to Embodied Agents that Ask for Help with Reinforcement Learning [49.2] 家庭環境下で活動する身体的エージェントは、曖昧で特定されていない人間の指示を解釈しなければならない。
LLM生成報酬を用いたオンライン強化学習(RL)を用いた視覚言語行動(VLA)ポリシーとして,マルチモーダル大規模言語モデル(MLLM)を微調整する新しいアプローチを提案する。
以上の結果から,RLを微細化したMLLMは,すべてのベースラインを顕著なマージン(10.4~16.5%)で上回り,新規なシーンやタスクに適していることが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:58:00 GMT)
PortraitTalk: Towards Customizable One-Shot Audio-to-Talking Face Generation [48.9] そこで我々は,PortraitTalkという,ワンショット音声駆動音声生成フレームワークを新たに導入した。
提案手法は,IdentityNetとAnimateNetの2つの主要コンポーネントからなる遅延拡散フレームワークを利用する。
PortraitTalkの鍵となる革新は、疎結合のクロスアテンション機構を通じてテキストプロンプトを組み込むことである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:14:33 GMT)
When Silence Matters: The Impact of Irrelevant Audio on Text Reasoning in Large Audio-Language Models [48.9] 非形式的音声でさえ精度を低下させ、予測ボラティリティを増大させる。
サイレンスはしばしば中立であると仮定されるが、出力を合成ノイズと同じくらい強く不安定にする。
この結果から, 相互干渉が重要な課題であることが明らかとなり, 効率的な核融合戦略の必要性が浮き彫りとなった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:59:45 GMT)
CogVLA: Cognition-Aligned Vision-Language-Action Model via Instruction-Driven Routing & Sparsification [48.8] 最近のVision-Language-Actionモデルは、広範な後トレーニングを必要とし、高い計算オーバーヘッドをもたらす。
命令駆動型ルーティングとスパーシフィケーションを利用して効率と性能を両立させるフレームワークであるCogVLAを提案する。
CogVLAは、それぞれ97.4%と70.0%の成功率で最先端のパフォーマンスを達成し、トレーニングコストを2.5倍に、推論遅延を2.8倍に削減した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:48:45 GMT)
ReNF: Rethinking the Design Space of Neural Long-Term Time Series Forecasters [48.8] 本稿では,提案手法の理論的基礎となるマルチプルニューラル予測定理を提案する。
自動回帰(AR)と直接出力(DO)の両方の利点を組み合わせた新しい予測戦略であるブースト・ダイレクト・アウトプット(BDO)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:57:54 GMT)
Topology of Reasoning: Understanding Large Reasoning Models through Reasoning Graph Properties [48.6] 本稿では,各推論ステップで隠れ状態表現をクラスタリングすることで抽出した推論グラフの概念を紹介する。
複数のタスクにまたがる巡回性、直径、小世界指数の3つの重要なグラフ理論特性を解析する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:04:11 GMT)
LAKAN: Landmark-assisted Adaptive Kolmogorov-Arnold Network for Face Forgery Detection [48.6] ディープフェイク生成技術は 堅牢な顔偽造検出アルゴリズムを必要とする
コルモゴロフ・アルノルドネットワーク(KAN)に基づく新しい検出手法を提案する。
本稿では,ランドマーク支援型適応コルモゴロフ・アルノルドネットワーク(LakaN)モジュールを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:10:38 GMT)
ManagerBench: Evaluating the Safety-Pragmatism Trade-off in Autonomous LLMs [48.5] 大きな言語モデル(LLM)が進化するにつれて、その行動の安全性を評価することが重要になる。
現実的な人為的な管理シナリオにおけるLCM意思決定を評価するベンチマークである ManagerBench を紹介する。
潜在的な害が無生物にのみ向けられる並列制御セットは、モデルのプラグマティズムを測定し、過度に安全である傾向を特定する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:08:33 GMT)
SafeEraser: Enhancing Safety in Multimodal Large Language Models through Multimodal Machine Unlearning [48.4] MLLM(Multimodal Large Language Models)のための安全アンラーニングベンチマークであるSAFEERASERを提案する。
我々は2つの観点から非学習手法を総合的に評価する。
実験により、PD損失と既存の未学習手法を組み合わせることで、過剰な鍛造を効果的に防止できることが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:44:39 GMT)
Disentangling Foreground and Background for vision-Language Navigation via Online Augmentation [48.4] 視覚言語ナビゲーション(VLN)エージェントは、目に見えない環境をナビゲートする。
前景領域は意味的な手がかりを提供するが、背景は空間接続情報を含んでいる。
コンセンサス駆動型オンライン機能拡張戦略 (COFA) を提案する。
REVERIEとR2Rの実験は、我々のオンライン前景拡張がベースラインの一般化を促進し、最先端のパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:32:36 GMT)
ReWatch-R1: Boosting Complex Video Reasoning in Large Vision-Language Models through Agentic Data Synthesis [48.2] ReWatchは、高度なビデオ推論を促進するために構築された大規模なデータセットである。
本稿では,ReWatch-Caption,ReWatch-QA,ReWatch-CoTの3つのコンポーネントを合成するための新しい多段階合成パイプラインを提案する。
実験の結果,ReWatch-R1は5つの挑戦的ビデオ推論ベンチマークで最先端の平均性能を達成できた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:33:19 GMT)
Towards Holistic Evaluation of Large Audio-Language Models: A Comprehensive Survey [48.1] 我々は総合的な調査を行い、LALM評価のための体系的な分類法を提案する。
各カテゴリの詳細な概要と,この分野の課題について紹介する。
調査した論文の収集を公表し、現在進行中の分野の発展を支援するため、積極的に維持していく。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:02:37 GMT)
Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity [47.3] 我々は、基本的で普及したデータレベルドライバを識別する: 嗜好データにおける典型的バイアス。
我々は、このバイアスを理論的に定式化し、嗜好データセット上で実証し、モード崩壊において中心的な役割を果たすことを示す。
この分析により,モード崩壊を回避するためのトレーニングフリープロンプト戦略であるVerbalized Smplingを導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:55:37 GMT)
Extreme Blind Image Restoration via Prompt-Conditioned Information Bottleneck [47.0] ブラインド画像復元法(BIR)は目覚ましい成果を上げたが, EBIR(Extreme Blind Image Restoration)に直面するとフェールした。
本稿では,難解なELQ-to-HQ復元プロセスを分解する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:13:27 GMT)
ReSWD: ReSTIR'd, not shaken. Combining Reservoir Sampling and Sliced Wasserstein Distance for Variance Reduction [47.0] Sliced Wasserstein Distance (SWD) はスケーラブルな代替手段を提供するが、モンテカルロ推定器は高い分散に悩まされている。
本稿では、重み付き貯留層サンプリングをSWDに統合し、情報投影方向を適応的に維持するReservoir SWD(Reservoir SWD)を紹介する。
合成ベンチマークと色補正や拡散誘導のような実世界のタスクの実験は、ReSWDが標準SWDより一貫して優れていることを示している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:01:17 GMT)
Leaky Thoughts: Large Reasoning Models Are Not Private Thinkers [46.9] 個人エージェントとして使用する大規模推論モデルの推論トレースにおいて,プライバシの漏洩について検討する。
推論トレースには、インプットインジェクションによって抽出したり、誤ってアウトプットにリークしたりできるセンシティブなユーザデータが頻繁に含まれていることを示す。
安全性の努力は、アウトプットだけでなく、モデルの内部的思考にも及ばなければならない、と我々は主張する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:33:58 GMT)
Theory of Scaling Laws for In-Context Regression: Depth, Width, Context and Time [46.6] 深層線形自己注意モデルにおける線形回帰の文脈内学習(ICL)について検討する。
文脈長が制限された場合、深度はICL性能にのみ寄与する。
これは、トランスの幅と深さの両方に依存するニューラルスケーリング法則の、新しい解決可能なトイモデルを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:45:04 GMT)
Diffusion Model as a Noise-Aware Latent Reward Model for Step-Level Preference Optimization [46.5] 拡散モデルの優先度最適化は、画像を人間の好みに合わせることを目的としている。
事前学習した拡散モデルは,ノイズのある潜在空間におけるステップレベルの報酬モデルに自然に適していることを示す。
雑音の多い遅延空間で直接実行されるステップレベルの優先度最適化手法であるLatent Preference Optimization (LPO)を導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:07:18 GMT)
EditTrack: Detecting and Attributing AI-assisted Image Editing [46.4] ベース画像と疑わしい画像が与えられた場合、AI編集モデルを用いて疑わしい画像がベース画像から導出されたかどうかを検知し、属性は特定の編集モデルに責任があるかを識別する。
この問題に対して、既存のAI生成画像の検出および帰属方法が不十分である。
本稿では,この画像編集検出および属性問題のための最初のフレームワークであるEditTrackを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:56:35 GMT)
The Geometry of LLM Quantization: GPTQ as Babai's Nearest Plane Algorithm [46.2] GPTQは古典的最近ベクトル問題に対するババイの最も近い平面アルゴリズムと数学的に同一であることを示す。
我々は、クリッピングを回避し、元のGPTQより優れるポストトレーニング量子化法を設計する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:25:12 GMT)
Stackelberg Coupling of Online Representation Learning and Reinforcement Learning [45.7] SCORERは,表現とQラーニングを階層型ゲームにおける2つの戦略エージェントとみなす,価値に基づくRLのためのフレームワークである。
提案するSCORERフレームワークは, 2時間スケールのアルゴリズムで解を近似する二段階最適化問題に導かれる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:29:53 GMT)
EvolProver: Advancing Automated Theorem Proving by Evolving Formalized Problems via Symmetry and Difficulty [45.6] 形式定理の証明のための大規模言語モデル(LLM)は、しばしば一般化性に欠け、問題文の小さな変換にも脆弱である。
対称性と難易度という2つの観点からモデルロバスト性を高めるために設計された新しいデータ拡張パイプラインを導入する。
EvolProverは、FormalMATH-Lite上で53.8%のpass@32レートで新しい最先端(SOTA)を確立する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:15:27 GMT)
Data Selection for Fine-tuning Vision Language Models via Cross Modal Alignment Trajectories [45.6] 本稿では,LVLM(Large Vision-Language Models)のデータ効率向上のための第一原理的指導法を提案する。
XMASクラスタの例は、小さなプロキシLVLMを微調整して得られた注目行列の最高特異値の軌跡に基づいている。
XMASは10下流ベンチマークでLLaVA-1.5-7Bのパフォーマンスを維持しながら、LLaVA-665kデータセットの50%とVision-Flanデータセットの85%を破棄することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:47:29 GMT)
StreamAgent: Towards Anticipatory Agents for Streaming Video Understanding [45.3] 本稿では,今後のタスク関連情報を含むと思われる時間間隔と空間領域を予測できるStreamAgentを提案する。
我々は,重要な出来事の時間的進行を予測するために,予測エージェントに期待を促すことによって,質問の意味論と歴史的観察を統合する。
提案手法は,応答精度とリアルタイム効率において既存の手法よりも優れており,実世界のストリーミングシナリオの実用的価値を強調している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:06:10 GMT)
Efficient Multi-modal Large Language Models via Progressive Consistency Distillation [44.9] 本稿では,進歩的学習フレームワークEPIC(Progressive Consistency Distillation)による効率的なMLLMの開発を提案する。
具体的には,トークン圧縮によって生じる特徴空間の摂動を,トークンワイド次元と層ワイド次元に沿って分解することにより,トークン一貫性蒸留と層一貫性蒸留を導入する。
提案フレームワークの優れた有効性,堅牢性,一般化能力を示す実験を行った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:56:40 GMT)
Phantom: General Backdoor Attacks on Retrieval Augmented Language Generation [44.7] Retrieval Augmented Generation (RAG)は、現代の大規模言語モデル(LLM)の機能を拡張する
本稿では,RAGシステムの知識ベースに悪意ある文書を1つだけ注入し,バックドア中毒攻撃を実施できる新たな攻撃法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:51:45 GMT)
PCoreSet: Effective Active Learning through Knowledge Distillation from Vision-Language Models [44.4] 本稿では,能動学習と知識蒸留を統合したフレームワークであるActiveKDを紹介する。
ActiveKDの重要な側面は、大きな視覚言語モデル(VLM)の構造的予測バイアスである。
本稿では,特徴空間ではなく,確率空間のカバレッジを最大化する選択戦略として,確率的コアセット(PCoreSet)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:14:57 GMT)
Is It Thinking or Cheating? Detecting Implicit Reward Hacking by Measuring Reasoning Effort [44.3] Reward Hackingは、推論モデルが報酬関数の抜け穴を利用して、目的のタスクを解決せずに高い報酬を達成する。
暗黙の報酬ハッキングを検出するため,TRACE(Truncated Reasoning AUC Evaluation)を提案する。
私たちのキーとなる観察は、実際のタスクを解くよりも、抜け穴を悪用した場合にハッキングが発生するということです。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:49:45 GMT)
Shape Happens: Automatic Feature Manifold Discovery in LLMs via Supervised Multi-Dimensional Scaling [43.7] 特徴多様体を自動的に検出するモデルに依存しない手法であるSupervised Multi-dimensional Scaling (SMDS)を導入する。
異なる特徴が円、線、クラスターなどの様々な幾何学構造を形成することが分かる。
本研究は,LMが構造表現を符号化し変換するエンティティベースの推論モデルをサポートする特徴多様体の機能的役割について考察した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:30:47 GMT)
Breaking Down and Building Up: Mixture of Skill-Based Vision-and-Language Navigation Agents [43.6] VLN(Vision-and-Language Navigation)は、自然言語命令を解釈し、複雑な3D環境をナビゲートするエージェントにとって大きな課題となる。
トランスフォーマーベースのVLNエージェントに構造化されたスキルベースの推論を導入するモジュラーフレームワークであるSkillNavを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:48:33 GMT)
LoRA meets Riemannion: Muon Optimizer for Parametrization-independent Low-Rank Adapters [43.0] ローランド適応(LoRA)のための新しいフレームワークを提案する。
LoRAは、固定階多様体上で直接最適化することで、低階アダプタを幾何学的に扱う。
私たちのフレームワークは、これを実現するために3つの重要なコンポーネントを統合しています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:59:10 GMT)
Deep Learning for Subspace Regression [42.9] そのようなスキームを適用する実践的な方法は、計算的に要求されるオフラインステージにおいて、選択されたパラメータセットのサブスペースを計算することである。
現実的な問題に対して、パラメータの空間は高次元であり、古典的な戦略は実現不可能か信頼できない。
本稿では, 回帰問題を緩和し, 部分空間データに適したいくつかの損失関数を導入し, ニューラルネットワークを高次元目標関数の近似として用いることを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:37:24 GMT)
Noninterference Analysis of Irreversible or Reversible Systems with Nondeterminism and Probabilities [42.5] 非干渉理論は、マルチレベルセキュリティシステムにおけるセキュアな計算の分析をサポートする。
非決定論的設定では、弱い双相似性を通して非干渉を評価することは可逆的システムには適しているが、可逆的双相似性に分岐するシステムに対しては、最近より適切であることが証明されている。
我々は、可逆系と可逆系のそれぞれに弱および分岐双相似の確率的不変量を採用することにより、非干渉特性を再送する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:35:30 GMT)
MathSticks: A Benchmark for Visual Symbolic Compositional Reasoning with Matchstick Puzzles [42.3] textscMathSticksはVisual Symbolic compositional Reasoningのベンチマークである。
視覚知覚、記号操作、算術整合を統一する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:04:54 GMT)
LEGATO: Large-scale End-to-end Generalizable Approach to Typeset OMR [42.1] Legatoは光学音楽認識(OMR)の新しいエンドツーエンドモデルである
フルページまたはマルチページのタイプセット音楽のスコアを認識し、ABC表記で文書を生成することができる。
我々は、さまざまなデータセットとメトリクスに関する包括的な実験を行い、Legatoが過去の最先端技術より優れていることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:59:01 GMT)
Reducción de ruido por medio de autoencoders: caso de estudio con la señal GW150914 [42.0] 本研究では,重力現象などの低振幅信号の品質向上のためのオートエンコーダの適用に焦点を当てた。
既存のオートエンコーダは宇宙イベントデータを使用してトレーニングされ、アーキテクチャとパラメータを最適化した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:22:51 GMT)
Quantum theory of the Josephson junction between finite islands [42.0] 有限サイズの島々の間のジョセフソン接合に対して量子化されたハミルトニアンを導出する。
我々は、この理論をテストするために、キュービット周波数と電荷感受性の計測可能な補正を予測した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:23:45 GMT)
Constrained Diffusion for Protein Design with Hard Structural Constraints [41.8] 本稿では,構造誘導タンパク質設計のための制約付き拡散フレームワークについて述べる。
モチーフスキャフォールディングや空洞拘束型ポケットデザインなど,タンパク質設計の課題を評価する。
提案手法は, 構造的多様性を損なうことなく, ボンディングと幾何的制約の完全な満足度を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:55:45 GMT)
Towards a Progress Bar for Reasoning: Progress Prediction in Large Reasoning Models [41.1] 推理モデルは, 単純な線形プローブを用いて10進法で30%の精度で定量化でき, 平均絶対誤差(MAE)は1.75である。
本稿では,既存の推論モデルを訓練し,進捗予測を明示的に生成する2段階微調整手法を提案する。
16Kトークン未満のシーケンスに対する最高の微調整言語モデルの予測は、実際のラベルから平均10%であることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:46:53 GMT)
Beyond Content: How Grammatical Gender Shapes Visual Representation in Text-to-Image Models [40.9] 文法的性別がステレオタイプ性関連に矛盾する単語を比較検討する言語間ベンチマークを導入する。
我々のデータセットは5つのジェンダー言語と2つのジェンダーニュートラル制御言語にまたがっている。
男性文法マーカーは平均で73%、女性文法マーカーは38%である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:42:24 GMT)
DynaGuard: A Dynamic Guardrail Model With User-Defined Policies [40.6] ユーザ定義ポリシーに基づいてテキストを評価する動的ガーディアンモデルを提案する。
私たちのモデルは、ポリシー違反の迅速な検出や、モデルのアウトプットを明確化し正当化する連鎖推論に使用できます。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:56:37 GMT)
Multi-level Dynamic Style Transfer for NeRFs [40.4] MDS-NeRFは、NeRFパイプラインをスタイリング用に再設計する新しいアプローチである。
コンテンツラディアンスフィールドから多レベル特徴グリッド表現を生成するのに役立つ多レベル特徴グリッド適応器を提案する。
また、関連するスタイルの特徴を抽出し、それらをコンテンツパターンに適応的に統合する動的スタイルインジェクションモジュールを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:19:27 GMT)
Exposing the Cracks: Vulnerabilities of Retrieval-Augmented LLM-based Machine Translation [40.4] 本稿では,REAL-MTのロバスト性を評価するために,雑音合成フレームワークと新しい指標を提案する。
その結果,検索した文脈に強く依存する低リソース言語ペアは,雑音下では劣化しやすくなった。
LRMには推論能力が強化されているが、誤り訂正の改善は見られず、さらにノイズの影響を受けやすい。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:43:55 GMT)
EvoWorld: Evolving Panoramic World Generation with Explicit 3D Memory [40.3] EvoWorldは、空間的に一貫した長距離探査を可能にするために、3Dメモリを進化させたパノラマビデオ生成を橋渡しする。
ビデオのみを合成する従来の最先端技術とは異なり、我々の重要な洞察は、この進化する3D再構成を明示的な空間的ガイダンスとして活用することにある。
長距離探査能力を評価するため,合成屋外環境,ハビタット屋内シーン,実世界のシナリオに挑戦する,初の総合的なベンチマークを導入した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:59:38 GMT)
InfVSR: Breaking Length Limits of Generic Video Super-Resolution [40.3] InfVSRは、長いシーケンスに対する自己回帰1ステップ拡散パラダイムである。
拡散過程を1ステップに効率よく蒸留し,パッチワイズ画素監視とクロスチャンク分布マッチングを行う。
提案手法は,長大なVSRのフロンティアを推し進め,セマンティック一貫性を向上して最先端の品質を実現し,既存の手法よりも最大58倍の高速化を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:21:45 GMT)
Learning Dynamic Graph Embeddings with Neural Controlled Differential Equations [40.1] 本稿では,ノード埋め込みと構造力学を協調的にモデル化する連続時間フレームワークを提案する。
筆者らのフレームワークは,グラフを断片的に統合せずに動的に表現できる機能など,いくつかの望ましい特徴を呈している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:00:56 GMT)
SPUS: A Lightweight and Parameter-Efficient Foundation Model for PDEs [40.1] 我々は、幅広い偏微分方程式(PDE)を解くための統一ニューラル演算子として設計されたコンパクトで効率的な基礎モデルSPUSを紹介する。
SPUSは様々な流体力学PDEに基づいて事前訓練され、様々な物理系にまたがる6つの未確認下流PDEに対して評価される。
実験により,残余なU-Netアーキテクチャを用いたSPUSが,これらの下流タスクの最先端の一般化を実現することが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:54:59 GMT)
Multi-Objective Task-Aware Predictor for Image-Text Alignment [39.6] 本稿では,多目的・単目的のスコアリングが可能な頑健な予測器であるMulti-TAPを構築するためのプラグイン・アンド・プレイアーキテクチャを提案する。
マルチTAPは、大きな視覚言語モデルの上に構築された報酬ヘッドを利用して、単一の総合スコアを生成することができる。
予め訓練したLVLMの凍結した隠れ状態に対して軽量なリッジ回帰層をトレーニングすることにより、マルチTAPは複数の人間の解釈可能な目的に対してきめ細かいスコアを生成できる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:55:33 GMT)
ExPLAIND: Unifying Model, Data, and Training Attribution to Study Model Behavior [39.6] ポストホックの解釈可能性のメソッドは、通常、モデルの振る舞いをそのコンポーネント、データ、または独立した訓練軌跡に関連付ける。
これらの観点をすべて統合した統合フレームワークであるExPLAINDを紹介します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:19:26 GMT)
Grounded GUI Understanding for Vision-Based Spatial Intelligent Agent: Exemplified by Extended Reality Apps [39.6] 仮想現実感アプリのための最初のゼロショットcOntext-sensitive inteRactable GUI ElemeNT dEtectionフレームワークOrienterを提案する。
人間の振る舞いを模倣することで、OrienterはまずXRアプリケーションシーンの意味的コンテキストを観察し、理解し、次に検出を実行する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:58:44 GMT)
OBELiX: A Curated Dataset of Crystal Structures and Experimentally Measured Ionic Conductivities for Lithium Solid-State Electrolytes [39.3] 固体電解質電池は近い将来、液体電解質リチウムイオン電池を置き換えることが期待されている。
現在、それらの採用は、より効果的なイオン伝導率の低下によって妨げられている。
OBELiXは、合成固体電解質材料とその実験的に測定された室温イオン伝導度のデータベースである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:38:06 GMT)
MLLM-CL: Continual Learning for Multimodal Large Language Models [39.2] ドメインと能力の連続学習を含む新しいベンチマークであるMLLM-CLを紹介する。
本稿では,パラメータ分離とMLLMに基づくルーティング機構による破滅的干渉を防止することを提案する。
我々のアプローチは、ドメイン固有の知識と機能的能力とを最小限の忘れ込みで統合することができ、既存の手法よりもはるかに優れています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:41:15 GMT)
From keywords to semantics: Perceptions of large language models in data discovery [39.1] 大規模言語モデル(LLM)は、研究者が自然言語で質問できることによって、データ発見を強化することができる。
我々の概念モデルでは、研究者が現在の技術の代わりにLLMを使うには、潜在的な利点が十分でないことが示されている。
バリアは研究者がLLMを完全に受け入れることを防ぐが、透明性に関する特徴はそれを克服する可能性がある。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:31:54 GMT)
SAGE-Music: Low-Latency Symbolic Music Generation via Attribute-Specialized Key-Value Head Sharing [39.0] 低レイテンシなシンボリック音楽生成は、リアルタイムおよび人間とAIの共創に不可欠である。
埋め込みプールのような従来のアクセラレーション技術は、音楽の質を著しく低下させる。
本稿では,Attribute-Specialized Key-Value Head Sharing (AS-KVHS)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:11:43 GMT)
Graph2Eval: Automatic Multimodal Task Generation for Agents via Knowledge Graphs [38.9] マルチモーダル文書理解タスクとWebインタラクションタスクの両方を自動的に生成する知識グラフベースのフレームワークであるGraph2Evalを提案する。
Graph2Eval-Benchはドキュメントの理解とWebインタラクションのシナリオにまたがる1,319のタスクのキュレートされたデータセットです。
実験によると、Graph2Evalは、エージェントとモデルのパフォーマンスを区別するタスクを効率的に生成し、異なる設定間での推論、コラボレーション、Webインタラクションのギャップを明らかにする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:37:54 GMT)
VLA-RFT: Vision-Language-Action Reinforcement Fine-tuning with Verified Rewards in World Simulators [38.9] VLA(Vision-Language-Action)モデルは、具体的意思決定を可能にするが、模倣学習に大きく依存する。
制御可能なシミュレータとしてデータ駆動世界モデルを利用する強化微調整フレームワークであるVLA-RFTを紹介する。
400歩未満の微調整ステップで、VLA-RFTは強い教師付きベースラインを超え、シミュレータベースのRLよりも高い効率を達成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:33:10 GMT)
Erased, But Not Forgotten: Erased Rectified Flow Transformers Still Remain Unsafe Under Concept Attack [37.9] 本稿では,最新のフローベースT2Iフレームワークにおいて,概念消去の堅牢性を評価するために設計された最初の概念攻撃手法であるReFluxを提案する。
我々のアプローチは、既存の概念消去技術が Flux に適用された場合、基本的にはアテンションローカライゼーションとして知られる現象に依存しているという観察に動機づけられている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:12:07 GMT)
Autoregressive Adversarial Post-Training for Real-Time Interactive Video Generation [37.7] 既存の大規模ビデオ生成モデルは計算集約的である。
本稿では,事前学習した遅延ビデオ拡散モデルをリアルタイムな対話型ビデオ生成器に変換するための自己回帰逆行後訓練を提案する。
モデルでは1つのニューラルファンクション評価を用いて1回に1つの潜在フレームを自動回帰的に生成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:55:20 GMT)
Realistic CDSS Drug Dosing with End-to-end Recurrent Q-learning for Dual Vasopressor Control [37.6] 集中治療室 (ICU) 患者に対して, 薬物服用を最適に学習するためのエンドツーエンドアプローチを開発し, 抗敗血症性ショックに対する治療方針について検討した。
現実的な薬物服用には、離散的、連続的、指向的な服用戦略に対応するアクション空間設計を適用する。
提案手法は,既存の臨床プロトコルと整合しながら,生存率15%以上の改善を達成している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:02:00 GMT)
Asymptotic theory of in-context learning by linear attention [37.4] インコンテキスト学習はトランスフォーマーの成功の土台である。
ICLを成功させるためには、必要なサンプルの複雑さ、事前学習タスクの多様性、コンテキストの長さに関する質問は未解決のままである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:49:00 GMT)
Graph Transformer Networks for Accurate Band Structure Prediction: An End-to-End Approach [37.3] 本稿では,結晶構造からのバンド構造を直接高精度に予測するグラフトランスフォーマーに基づくエンドツーエンドアプローチを提案する。
本モデルでは, バンド構造予測だけでなく, バンドギャップ, バンド中心, バンド分散などの特性を高精度に導出できることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:35:20 GMT)
Post Hoc Regression Refinement via Pairwise Rankings [37.1] RankRefineはモデルに依存しないプラグアンドプレイの手法で、ペアのランキングから得られる専門家の知識でレグレッションを洗練します。
分子特性予測タスクでは、RandRefineは平均絶対誤差を最大10%削減する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:27:37 GMT)
When Patients Go to "Dr. Google" Before They Go to the Emergency Department [37.0] 成人の3分の1が救急部(ED)を訪問する前に健康情報を求めてインターネットを検索する
発見は、不正確な健康情報が不一致の期待に寄与し、ケア提供が変更されたことを示唆している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:26:56 GMT)
On Listwise Reranking for Corpus Feedback [36.9] リストワイド・リランカログから文書グラフを暗黙的に誘導する新しいフレームワークであるL2Gを紹介する。
リランカ信号をグラフ構造に変換することで、L2Gは明示的なグラフ計算のオーバーヘッドなくスケーラブルなグラフベースの検索を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:34:02 GMT)
XRZoo: A Large-Scale and Versatile Dataset of Extended Reality (XR) Applications [36.7] XRZooには12,528の無料XRアプリケーションがあり、9つのアプリストア、すべてのXR技術(AR、MR、VRなど)、ユースケースにまたがっている。
我々は,再現可能なXRソフトウェア工学とセキュリティ研究を育成し,学際的な調査を可能にするとともに,先進的なXRシステムの開発を支援することを目的としている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:58:37 GMT)
Sparkle: Mastering Basic Spatial Capabilities in Vision Language Models Elicits Generalization to Spatial Reasoning [36.6] 視覚言語モデル(VLM)は多くのタスクでうまく機能するが、しばしば空間的推論では失敗する。
評価の結果, 現状のVLMでは, 複合空間問題に対する不正確な答えが得られていることがわかった。
VLMにおける2次元空間推論は,基本空間能力のみに基づいて訓練することで向上する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:43:26 GMT)
It Takes Two: Your GRPO Is Secretly DPO [36.5] Group Relative Policy Optimization (GRPO) は、大規模言語モデル(LLM)の強化学習アルゴリズムである。
GRPOは、正確な統計的推定によって安定したトレーニングを確保するために、大きなグループサイズを必要とすると一般的に信じられている。
本研究では,GRPOをコントラスト学習の形式とすることで,直接選好最適化(DPO)との基本的な関係を明らかにすることで,この仮定に挑戦する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:52:11 GMT)
VisualOverload: Probing Visual Understanding of VLMs in Really Dense Scenes [36.4] 2,720組の質問応答対からなる視覚的質問応答(VQA)ベンチマークであるVisualOverloadを提案する。
通常、地球近傍の画像理解に焦点を当てた以前のVQAデータセットとは異なり、VisualOverloadは、密集したシーンでシンプルで知識のない視覚タスクを実行するためにモデルに挑戦する。
37の試験モデルのうち最高のモデル(o3)でさえ、最も難しいテスト分割で19.6%、すべての質問で69.5%の精度しか達成できない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:26:07 GMT)
GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving [36.2] GoalFlowは高品質なマルチモーダル軌道を生成するためのエンドツーエンドの自動運転手法である。
生成過程を制約し、高品質でマルチモーダルな軌道を生成する。
GoalFlowは最先端のパフォーマンスを実現し、自律運転のための堅牢なマルチモーダル軌道を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:47:00 GMT)
From Human Hands to Robot Arms: Manipulation Skills Transfer via Trajectory Alignment [36.1] 現実世界のロボットの多様な操作スキルを学ぶことは、高価でスケールの難しい遠隔操作によるデモンストレーションに依存することでボトルネックとなる。
本稿では,操作終端の3次元軌跡を統一中間表現として利用することにより,この実施ギャップを橋渡しする新しいフレームワークであるTraj2Actionを紹介する。
我々の方針はまず,人間とロボットの両方のデータを活用することで,高レベルの運動計画を形成する粗い軌道を生成することを学習する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:21:12 GMT)
PRISM-Consult: A Panel-of-Experts Architecture for Clinician-Aligned Diagnosis [36.1] PRISM-Consultは、PRISMシークエンスモデルをドメインスペシャリストのルーティングされたファミリーに拡張する、クリニカル・アライメント・オブ・エキスパート・アーキテクチャである。
エピソードは構造化された臨床イベントとしてトークン化され、軽量ルータは最初の数個のトークンを読み出し、スペシャリストモデルにディスパッチする。
各スペシャリストは、PRISMの小さなトランスフォーマーバックボーンとトークンテンプレートを継承し、パラメータ効率と解釈性を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:00:05 GMT)
EuroSpeech: A Multilingual Speech Corpus [35.8] 議会記録から音声データセットを構築するためのスケーラブルなパイプラインを提案する。
このパイプラインを22の欧州議会の録音に適用し、61万時間以上の一致した音声セグメントを抽出します。
データセット上で既存のASRモデルを微調整した場合,平均41.8%の単語誤り率をベースラインで削減する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:51:45 GMT)
Interactive Recommendation Agent with Active User Commands [35.8] 本稿では、主流の推薦フィード内で自然言語コマンドを可能にする先駆的なパラダイムであるInteractive Recommendation Feed(IRF)を紹介する。
ユーザが暗黙的な行動の影響を受動的に抑制する従来のシステムとは異なり、IRFはリアルタイム言語コマンドを通じて推奨ポリシーを積極的に制御する。
RecBotは、ユーザ満足度とビジネス成果の両方において、大幅に改善されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:31:57 GMT)
Learning Compact Representations of LLM Abilities via Item Response Theory [35.7] 大規模言語モデル(LLM)のコンパクト表現の学習方法について検討する。
この問題は、与えられたモデルが特定のクエリに正しく答える確率を推定するものである。
これらのパラメータを共同で学習するために、モデルとクエリレベルの埋め込みを結合するMixture-of-Experts(MoE)ネットワークを導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:55:34 GMT)
Floquet-engineered fast SNAP gates in weakly coupled circuit-QED systems [35.5] 本稿では,標準実装よりも桁違いに高速な高忠実なSNAPゲートを実現するプロトコルを提案する。
また、ゲート加速度と関連する良性駆動誘起デコヒーレンスの両方を説明する統一理論を提案する。
これらの結果は, 弱結合型高コヒーレンスキャビティの選択的制御により, 高忠実度, 高コヒーレンスキャビティの実験的実現の道を開くものである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:48:42 GMT)
Enhancing the development of Cherenkov Telescope Array control software with Large Language Models [35.2] 我々は、チェレンコフ望遠鏡観測所(CTAO)の工学と運用を支援するために、命令ファインタクテッドな大言語モデル(LLM)に基づくAIエージェントを開発する。
これらのエージェントは、プロジェクト固有のドキュメントと整合し、外部APIと対話し、自然言語でユーザと通信する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:14:41 GMT)
Local Linear Attention: An Optimal Interpolation of Linear and Softmax Attention For Test-Time Regression [35.2] 局所線形注意(Local Linear Attention)は、テスト時間回帰のレンズを通して非パラメトリック統計から導出される新しい注意機構である。
ハードウェア効率のよいブロックワイズアルゴリズムであるFlashLLAを導入し、現代のアクセラレータ上でスケーラブルで並列な計算を可能にする。
実験の結果,LLAは非定常性に効果的に適応し,テスト時間トレーニングやコンテキスト内学習において強いベースラインを達成できることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:42:21 GMT)
WAInjectBench: Benchmarking Prompt Injection Detections for Web Agents [34.9] 本稿では,Webエージェントを標的としたインジェクション攻撃を検出するための総合的なベンチマーク研究を行う。
悪意のあるサンプルと良心的なサンプルの両方を含むデータセットを構築します。
次に、テキストベースと画像ベースの両方の検出方法を体系化する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:34:06 GMT)
Automatically Generating Web Applications from Requirements Via Multi-Agent Test-Driven Development [34.6] 私たちは、エンドツーエンドのフルスタックWebアプリケーション生成のための最初のテスト駆動開発フレームワークであるTDDevを紹介します。
自然言語の説明や設計イメージが与えられたら、TDDevは自動的に実行可能なテストケースを導き、フロントエンドとバックエンドのコードを生成し、ユーザーインタラクションをシミュレートします。
本フレームワークは,ユーザ要求の不明確さ,複数ファイル間の複雑な相互依存性,機能的正当性と視覚的忠実性といった,フルスタック自動化における重要な課題に対処する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:32:51 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [34.5] 本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。
このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:09:05 GMT)
SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization [34.5] そこで我々は,より高速な4ビット行列乗算(Matmul)と精度向上手法を併用したSageAttention2を提案する。
提案手法は,言語,画像,ビデオ生成など,さまざまなモデルにまたがる,無視可能なエンドツーエンドメトリクスの損失を生じさせる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:13:31 GMT)
Mitigating Domain Shift in Federated Learning via Intra- and Inter-Domain Prototypes [34.4] 本稿では,$textbfI$ntraドメインと$textbfI$nterドメインを組み込んだ新しいプロトタイプ学習手法I$2$PFLを紹介する。
そこで我々は,MixUpをベースとした拡張プロトタイプと機能アライメントを行い,局所領域内の多様性を捉え,局所的特徴の一般化を促進する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:31:28 GMT)
SpargeAttention: Accurate and Training-free Sparse Attention Accelerating Any Model Inference [34.3] SpargeAttnは任意のモデルに対する普遍的スパースで量子化された注意である。
本手法は,エンドツーエンドのメトリクスを犠牲にすることなく,言語,画像,ビデオ生成などの多様なモデルを大幅に高速化する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:15:31 GMT)
When Shared Worlds Break: Demystifying Defects in Multi-User Extended Reality Software Systems [34.2] 本稿では,マルチユーザXR欠陥に関する大規模な実証的研究を行った。
私たちは、開発者フォーラム、GitHubリポジトリ、メインストリームのXRアプリストアでのアプリレビューを含む、さまざまなソースからの2,649の実際のバグレポートを分析します。
以上の結果より, 同期異常とアバター関連異常が最も多いことが判明した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:59:25 GMT)
Revisiting Diffusion Q-Learning: From Iterative Denoising to One-Step Action Generation [34.0] Diffusion Q-Learning (DQL)は、オフライン強化学習の高性能パラダイムとして拡散ポリシーを確立している。
DQLを1段階のデノイングに向けて加速する現在の取り組みは、補助モジュールや政策蒸留に依存している。
One-Step Flow Q-Learning (OFQL)は、トレーニングと推論の両方で効果的なワンステップアクション生成を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:13:26 GMT)
CoT Vectors: Transferring and Probing the Reasoning Mechanisms of LLMs [33.6] Chain-of-Thoughtプロンプトは、大規模言語モデルの推論能力を高めるための強力なアプローチとして現れています。
コンテキスト内学習や微調整といった既存の実装は、コストがかかり、非効率である。
タスク汎用多段階推論知識を符号化するコンパクト表現であるCoTベクトルを導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:58:23 GMT)
Improving Code Localization with Repository Memory [33.4] 本稿では,最近の過去のコミットや関連問題を含む非パラメトリックメモリからエージェントを検索するツールを紹介する。
このようなメモリの拡張により,最先端のローカライゼーションフレームワークであるLocAgentが大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:10:15 GMT)
From Seeing to Predicting: A Vision-Language Framework for Trajectory Forecasting and Controlled Video Generation [33.4] TrajVLM-Genは物理を意識した画像・ビデオ生成のためのフレームワークである。
実世界の物理との整合性を維持するために,視覚言語モデルを用いて粗粒度運動軌跡の予測を行う。
リアルな動きパターンを持つ映像追跡データに基づく軌道予測データセットを構築した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:11:36 GMT)
Beyond the Individual: Introducing Group Intention Forecasting with SHOT Dataset [33.0] グループ意図は、複数の個人の行動を通じて現れる共通の目標を表す。
グループ意図予測(Group Intention Forecasting, GIF)は、集団意図がいつ起こるかを予測する新しいタスクである。
SHOTはGIF用の最初の大規模なデータセットで、5つのカメラビューから撮影された1,979本のバスケットボールビデオクリップで構成されている。
GIFTは、意図の出現を予測するためにグループダイナミクスを進化させる、きめ細かい個々の特徴とモデルを抽出するフレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:41:47 GMT)
On the Benefits of Weight Normalization for Overparameterized Matrix Sensing [32.9] 過大化行列センシング問題に適用した(一般化)重み正規化(WN)の利点を確立する。
線形反復収束を持つWNは、WNを使用しない標準手法よりも指数的な高速化を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:56:58 GMT)
Defect Segmentation in OCT scans of ceramic parts for non-destructive inspection using deep learning [32.9] 本稿では,Deep Learning(DL)に基づく自動欠陥検出システムを提案する。
U-Netアーキテクチャに基づくニューラルネットワークを開発し、その性能を高めるために複数の実験的な構成を評価する。
このシステムは0.979のDice Scoreの正確な振る舞いを示し、比較研究より優れている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:30:24 GMT)
PodEval: A Multimodal Evaluation Framework for Podcast Audio Generation [32.7] ポッドキャストのようなオーディオ生成を出発点として,オープンソース評価フレームワークのPodEvalを提案する。
本研究では,人間レベルの創造的品質の基準として,多種多様なトピックにまたがる実世界のポッドキャストデータセットを構築した。
その結果、ポッドキャスト生成に関する詳細な分析と洞察を提供し、PodEvalの有効性を実証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:08:08 GMT)
Affordance-Guided Diffusion Prior for 3D Hand Reconstruction [32.7] そこで本稿では,手-物間相互作用の可読性を考慮したテキスト記述による手ポーズ改善のための生成前処理を提案する。
提案手法では,可愛らしい手ポーズの分布を可視性記述に基づいて学習する拡散型生成モデルを用いる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:36:11 GMT)
AI Agents with Decentralized Identifiers and Verifiable Credentials [32.5] 本稿では, エージェントに自己主権のデジタルIDを付与する, プロトタイプ型マルチエージェントシステムを提案する。
エージェントの独特かつ台帳に記載された分散識別子(DID)と、発行された検証認証(VC)のセットを組み合わせる。
ダイアログの開始時のエージェントは、認証目的で自己管理されたDIDの所有権を証明し、さまざまなドメイン間の信頼関係を確立することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:10:37 GMT)
KnowledgeSmith: Uncovering Knowledge Updating in LLMs with Model Editing and Unlearning [32.3] 知識編集と機械学習は、大規模言語モデル(LLM)が最新の状態を維持するための一般的なアプローチである。
本稿では,LLMの更新メカニズムを体系的に理解するための統合フレームワークであるKnowledgeSmithを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:15:25 GMT)
Measuring and Controlling the Spectral Bias for Self-Supervised Image Denoising [32.1] 現在、ペア化ノイズ画像の自己教師付き復調法では、ネットワークを介して1つのノイズ画像ともう1つのノイズ画像とをマッピングする。
我々は、ペア画像の自己教師付き雑音処理を最適化するために、スペクトル制御ネットワーク(SCNet)を導入する。
合成および実世界のデータセットで実施された実験は、SCNetの有効性を検証する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:07:05 GMT)
Diffusion Alignment as Variational Expectation-Maximization [32.1] 拡散アライメントを変動予測最大化(DAV)として導入する。
DAVは、E段階とM段階の2つの相の交互な反復過程として拡散アライメントを定式化する。
我々はDAVが連続タスクと離散タスクの両方の多様性を維持しながら報酬を最適化できることを実証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:34:07 GMT)
MorphGen: Controllable and Morphologically Plausible Generative Cell-Imaging [32.0] MorphGenは、蛍光顕微鏡のための最先端拡散ベースの生成モデルである。
蛍光チャネルの完全なセットを共同で生成し、構造体ごとに保存する。
MorphGenは、これまでの最先端のMorphoDiffよりも35%以上低いFIDスコアを獲得している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:34:29 GMT)
Combating Noisy Labels via Dynamic Connection Masking [31.8] MLP(Multi-Layer Perceptron Networks)とKAN(Kolmogorov-Arnold Networks)のための動的接続マスキング(DCM)機構を提案する。
我々のアプローチは、より堅牢なディープネットワークを構築するために、様々なノイズロストトレーニング手法にシームレスに統合できる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:26:05 GMT)
Taxonomy of Comprehensive Safety for Clinical Agents [31.8] TACOSは、安全フィルタリングとツールの選択を単一のユーザ意図の分類ステップに統合する、きめ細かい21クラスの分類である。
分類の妥当性を検証するため,TACOSに注釈付きデータセットをキュレートし,広範な実験を行う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:00:53 GMT)
Model Merging Scaling Laws in Large Language Models [31.7] クロスエントロピーによって測定された言語モデルマージのスケーリング法則について検討する。
モデルサイズとエキスパート番号を結びつけるコンパクトパワー法則を同定する。
ここでは、なぜゲインが 1/k になるのかを説明する単純な理論を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:31:23 GMT)
Sycophantic AI Decreases Prosocial Intentions and Promotes Dependence [31.7] 我々は、人々がAIからアドバイスを求めるとき、梅毒の広範性と有害な影響を示す。
モデルは非常にサイコファン性が高く、ユーザーの行動が人間よりも50%多いことを確認しています。
参加者は、サイコファンティックな反応をより高い品質と評価し、サイコファンティックなAIモデルをより信頼し、再びそれを使う意思があった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:26:01 GMT)
Interactive Learning for LLM Reasoning [31.5] 本稿では,大規模言語モデルの独立した問題解決能力を高めるために,マルチエージェントインタラクションが有効かどうかを検討する。
動的インタラクションと知覚を統合した新しいコラーニングフレームワークであるIRRを紹介する。
ILRはシングルエージェント学習を一貫して上回り、最強のベースラインよりも最大5%向上した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:14:45 GMT)
A Framework for Double-Blind Federated Adaptation of Foundation Models [31.4] BlindFedは、双方を保護しながら協調FM適応を可能にするフレームワークである。
BlindFedは完全同型暗号(FHE)に依存している
4つの画像分類データセットの実証結果は、BlindFedフレームワークの実用可能性を示している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:14:33 GMT)
A Closer Look at Model Collapse: From a Generalization-to-Memorization Perspective [31.2] 拡散モデルによってAI生成データが多くなり、モデル崩壊に対する懸念が高まっている。
本稿では,拡散モデルにおけるモデル崩壊時の一般化から記憶への移行について述べる。
この知見により,一般化から記憶への移行を緩和するエントロピーに基づくデータ選択戦略を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:21:12 GMT)
A Multimodal LLM Approach for Visual Question Answering on Multiparametric 3D Brain MRI [31.1] mpLLMは、3次元脳MRI上での視覚的質問応答のための、迅速な条件付き階層的混合処理アーキテクチャである。
mpLLMは、複数の相互関連3Dモダリティを融合するために、モダリティレベルおよびトークンレベルのプロジェクションエキスパートをルートする。
mpLLMは、複数のmpMRIデータセットにおいて、強い医用VLMベースラインを平均5.3%上回る。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:37:48 GMT)
DepthLM: Metric Depth From Vision Language Models [31.1] 視覚言語モデル(VLM)はテキストインタラクションによって様々な視覚タスクに柔軟に対応できる。
アーキテクチャや損失変更なしに、専門家レベルの精度に達することができることを示す。
提案手法は,最も進んだVLMの精度を2倍以上上回る。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:18:15 GMT)
Diffusion Bridge Variational Inference for Deep Gaussian Processes [31.1] 拡散橋変分推論(DBVI)は拡散変分推論(DDVI)の原理的拡張である
DBVIは学習可能なデータ依存の初期分布から逆拡散を開始する。
DDVIや他の変分ベースラインを予測精度、収束速度、後部品質で一貫して上回る。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:29:45 GMT)
Distilling Calibration via Conformalized Credal Inference [30.8] 信頼性を高める方法の1つは、ベイズ推定による不確実な定量化である。
本稿では,より複雑なモデルからキャリブレーション情報を抽出することにより,この問題に対処する低複雑さ手法を提案する。
視覚的および言語的タスクの実験により,提案手法はCD-CI (Conformalized Distillation for Credal Inference) と呼ばれ,校正性能が著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:57:28 GMT)
Diffusion Adversarial Post-Training for One-Step Video Generation [30.6] 本稿では,1ステップビデオ生成のための拡散事前学習後の実データに対して,APT(Adversarial Post-Training)を提案する。
我々のモデルは1ステップで1024px画像を生成することができ、最先端の手法に匹敵する品質を実現することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:17:13 GMT)
Reasoning Scaffolding: Distilling the Flow of Thought from LLMs [30.6] 我々は、推論を構造化生成プロセスとして再編成するフレームワークであるReasoning Scaffoldingを紹介します。
本手法は, 精度と論理的整合性の両方において, 最先端の蒸留法よりも優れていた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:57:37 GMT)
Out-of-Distribution Detection with Relative Angles [30.4] 本稿では, 分布内構造に対して計算されるOOD検出のための新しい角度に基づく計量法を提案する。
提案手法は,9つのImageNet事前学習モデルを用いて評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:44:10 GMT)
Temporal Score Rescaling for Temperature Sampling in Diffusion and Flow Models [30.4] 本稿では,フローマッチングモデルのサンプリング多様性を判断するメカニズムを提案する。
これらの再スケーリングにより、局所的なサンプリング温度を効果的に制御できることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:59:51 GMT)
Development and Validation of a Dynamic Kidney Failure Prediction Model based on Deep Learning: A Real-World Study with External Validation [30.3] 慢性腎臓病(CKD)は公衆衛生上重要な問題となっている。
既存のモデルの多くは静的であり、病気の進行の時間的傾向を捉えていない。
我々は,リアルタイム腎不全の予測に,現実の電子健康記録からの一般的な経時的臨床指標を利用するダイナミックモデルを開発した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:47:38 GMT)
Prompt Curriculum Learning for Efficient LLM Post-Training [30.2] 本稿では,学習価値モデルを用いて中間微分プロンプトを選択するアルゴリズムであるPrompt Curriculum Learning (PCL)を紹介する。
我々は,PCLがRLの間,より困難なプロンプトに集中できることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:24:28 GMT)
TOUCAN: Synthesizing 1.5M Tool-Agentic Data from Real-World MCP Environments [30.1] Toucanは、これまでで最大規模のツール・アジェンティックデータセットである。
多様な、現実的で、挑戦的なタスクを、実際のツールの実行を含む軌道で生成します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:58:03 GMT)
HARPA: A Testability-Driven, Literature-Grounded Framework for Research Ideation [29.9] HARPAは科学的文献で実証可能な仮説を生成するためのツールである。
評価の結果,HARPAが生成する仮説駆動型研究提案は,強力なベースラインAI-Researcherと相容れない性能を示した。
ASDエージェント(CodeScientist)でテストすると、HARPAはより成功した実行(40のうち20対11)と少ない障害(16対21対40)を生み出した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:52:19 GMT)
GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents [29.7] nameは、高レベルな現実世界のタスクシナリオにおけるLVLMの能力を高めるために設計された最初の強化学習フレームワークである。
従来のOS-Atlasのような最先端のメソッドと比較して、データの0.02%しか使っていない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:55:20 GMT)
Training Vision-Language Process Reward Models for Test-Time Scaling in Multimodal Reasoning: Key Insights and Lessons Learned [29.4] プロセス・リワード・モデル (Process Reward Models, PRM) は、大規模言語モデルにおける推論の信頼性を向上させる。
既存のVision-Language PRMはデータ構築にMCTS(Monte Carlo Tree Search)に依存している。
我々は,MCTSと強力なVLMの判断を組み合わせるハイブリッドデータフレームワークを導入し,より正確なステップレベルラベルを生成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:54:17 GMT)
A Scene is Worth a Thousand Features: Feed-Forward Camera Localization from a Collection of Image Features [29.0] 我々は、地図表現を作成し、クエリ画像をオンザフライで再ローカライズするFastForwardを紹介する。
FastForwardはこれらのマッピング機能を使用して、クエリ画像のイメージとシーンの対応を予測し、カメラのポーズを推定する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:52:12 GMT)
EgoTraj-Bench: Towards Robust Trajectory Prediction Under Ego-view Noisy Observations [29.0] 我々はEgoTraj-Benchを紹介した。EgoTraj-Benchは、ノイズの多い、一対一の視覚履歴を、クリーンで鳥の目に見える将来の軌跡に根拠付ける最初の実世界のベンチマークだ。
本稿では,バイフローモデルを提案する。バイフローは,過去の観測と将来の動きの予測を同時に行う。
BiFlowは最先端のパフォーマンスを実現し、minADEとminFDEを平均で10~15%削減し、優れた堅牢性を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:30:13 GMT)
On Discovering Algorithms for Adversarial Imitation Learning [28.8] 本稿では,最初のメタ学習型AILアルゴリズムであるemphDiscovered Adversarial Imitation Learning (DAIL)を提案する。
DAILは、目に見えない環境とポリシー最適化アルゴリズムにまたがって一般化されていることを示す。
また、DAILがより安定したトレーニングに導く理由を分析し、AILの安定性におけるRA関数の役割に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:02:05 GMT)
Stochastic Self-Organization in Multi-Agent Systems [28.7] LLM(Large Language Models)に基づくマルチエージェントシステム(MAS)は、単一のLLMの範囲を超えているタスクを解く可能性がある。
通信をオンザフライで適応する応答条件付きフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:08:04 GMT)
CYCle: Choosing Your Collaborators Wisely to Enhance Collaborative Fairness in Decentralized Learning [28.7] コラボレーション学習(CL)は、複数の参加者が、生データを共有することなく、分散データソース上で機械学習(ML)モデルを共同でトレーニングすることを可能にする。
CLの主な目標は,各参加者に対して期待される精度向上を最大化することにあるが,利得が公平に分散されていることを保証することも重要である。
既存のCL手法の多くは、集中的な調整を必要とし、公正さを見越して利得のみに焦点をあてる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:42:37 GMT)
Retrieval and Augmentation of Domain Knowledge for Text-to-SQL Semantic Parsing [28.6] 本稿では,構造化ドメインステートメントをデータベースレベルで関連付けるための体系的なフレームワークを提案する。
本稿では,サブストリングレベルマッチングを用いたユーザクエリに対して,関連する構造化ドメイン文の検索を行う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:01:17 GMT)
Copy-Paste to Mitigate Large Language Model Hallucinations [28.5] 本研究では,2段階のハイコピー応答選好トレーニングにより得られたCopyPasteLLMを提案する。
FaithEval、ConFiQA、PubMedQAでは、CopyPasteLLMは、デファクトとオリジナルの両方のコンテキストで最高のパフォーマンスを達成する。
CopyPasteLLMの有効性を解明するために、コンテキストコピーキャプチャーアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:40:04 GMT)
Fine-Tuning Masked Diffusion for Provable Self-Correction [28.3] Masked Diffusion Models (MDMs) は離散空間における生成モデリングのための有望なアプローチとして登場した。
PRISM-Plug-in Remasking for Inference-time Self-correction of Masked Diffusions。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:15:25 GMT)
TokMem: Tokenized Procedural Memory for Large Language Models [28.3] TokMemはトークン化された手続き型メモリで、繰り返し手順をコンパクトで訓練可能な埋め込みとして保存する。
TokMemはバックボーンモデルをフリーズし、既存のものと干渉することなく新しいプロシージャを追加することができる。
TokMemは1000のタスクでアトミックリコールを行い、関数呼び出しタスクでコンポジションリコールを行い、連続的に検索・拡張生成を上回ります。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:51:58 GMT)
Arbitrary Generative Video Interpolation [28.0] ビデオフレーム(VFI)は、所定の開始フレームと終了フレームから中間フレームを生成する。
既存のVFI法は、一定数の中間フレームを合成するために制約される。
ArbInterpは、任意のタイムスタンプで効率的な合成を可能にする新しいVFIフレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:57:10 GMT)
What You See is What You Ask: Evaluating Audio Descriptions [27.8] 数分間のコヒーレントなビデオセグメントでADを評価するQAベンチマークであるADQAを提案する。
現在のAD生成手法は、人間が作成したADよりもはるかに遅れていることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:14:15 GMT)
v1: Learning to Point Visual Tokens for Multimodal Grounded Reasoning [27.7] 簡単なポイント・アンド・コピーアプローチによるアクティブな視覚的参照を可能にする軽量な拡張であるv1を紹介する。
これにより、モデルは関連するイメージパッチを特定し、埋め込みを推論ストリームにコピーすることができる。
我々のポインティング戦略では、MLLMはセマンティックな表現をキーとして直接イメージパッチを選択でき、知覚的証拠はモデルの推論と同じ空間に埋め込まれている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:23:42 GMT)
Gaussian DP for Reporting Differential Privacy Guarantees in Machine Learning [27.5] 機械学習(ML)アルゴリズムの差分プライバシーレベルを報告するための現在のプラクティスは、プライバシー保証の不完全で、潜在的に誤解を招く可能性がある。
我々は、非漸近的ガウス微分プライバシー(GDP)をMLにおけるDP保証を伝える主要な手段として使うことは、これらの潜在的な欠点を回避していると論じる。
本稿では,数値会計士を用いてGDPに非漸近的境界を与える方法を示し,GDPがDP-SGDおよび関連するアルゴリズムのプライバシープロファイル全体を,基準値によって定量化されているように,ほとんど誤差なくキャプチャできることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:57:59 GMT)
ImageDoctor: Diagnosing Text-to-Image Generation via Grounded Image Reasoning [27.5] ImageDoctorは統合されたマルチアスペクトT2Iモデル評価フレームワークである。
画像品質は、可視性、セマンティックアライメント、美学、全体的な品質の4つの相補的な次元で評価される。
ImageDoctorはまた、ヒートマップの形でピクセルレベルの欠陥インジケータも提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:15:55 GMT)
Scheduling Weight Transitions for Quantization-Aware Training [27.4] 量子化対応トレーニング(QAT)は、ウェイト/アクティベーションのビット精度を低下させるために、トレーニング中の量子化プロセスをシミュレートする。
本稿では,量子化重みの遷移数を明示的に制御する遷移率(TR)スケジューリング手法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:53:10 GMT)
DIA: The Adversarial Exposure of Deterministic Inversion in Diffusion Models [27.3] 本稿では,統合されたDDIM軌道路を攻撃するDDIMインバージョンアタック(DIA)を提案する。
本研究は, 様々な編集方法にまたがる従来の防御手法を克服し, 効果的破壊を支援する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:20:03 GMT)
Multi-Marginal Flow Matching with Adversarially Learnt Interpolants [27.3] 本稿では,既存のマルチマージ軌道推定アルゴリズムの限界を克服する新しいフローマッチング手法を提案する。
提案手法であるALI-CFMは、GANにインスパイアされた対向損失を用いて、音源点と目標点の間のニューラルパラメトリッド補間曲線に適合する。
本稿では,空間転写学およびセルトラッキングデータセット上で,既存のベースラインよりも優れた性能を示すことで,本手法の汎用性と拡張性を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:47:27 GMT)
Visual Self-Refinement for Autoregressive Models [27.0] 本研究は,複雑な空間対応モデリングを強化するためのプラグ・アンド・プレイ・リファインメント・モジュールを提案する。
実験により,提案手法は生成品質を向上し,意味的に一貫した結果を生成するモデルの能力を向上させることを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:03:32 GMT)
JoyAgent-JDGenie: Technical Report on the GAIA [27.0] 大規模言語モデルは、複雑な現実世界のタスクのための自律的なエージェントとして、ますます多くデプロイされている。
本稿では,計画および実行エージェントを批判モデル投票と統合する汎用エージェントアーキテクチャ,作業層,意味層,手続き層にまたがる階層型メモリシステム,検索,コード実行,マルチモーダル解析のための洗練されたツールスイートを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:41:58 GMT)
Balancing Multimodal Training Through Game-Theoretic Regularization [26.9] マルチモーダル学習は、データソース間の依存関係をキャプチャすることで、よりリッチな情報抽出を約束する。
しかし、現在のトレーニング手法は、しばしばモダリティの競争によって性能が低下する。
本稿では、相互情報分解(MI)に触発されたMCR(Multimodal Competition Regularizer)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:03:01 GMT)
Towards Adversarial Training under Hyperspectral Images [26.7] 敵の攻撃に対する最も効果的な防御の1つとして広く認識されているハイパースペクトル領域に敵の訓練を導入する。
対向雑音や非滑らかな対向音は、重要なスペクトル意味情報を歪め、あるいは取り除くことができる。
スペクトル情報の多様性を高め、空間的滑らかさを確保することで、AT-RAはハイパースペクトル画像のスペクトル意味を保存し、修正する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:19:39 GMT)
Flock: A Knowledge Graph Foundation Model via Learning on Random Walks [26.6] 知識グラフ(KG)におけるゼロショットリンク予測の問題について検討する。
ランダムウォークを反復的にサンプリングし、記録プロトコルを介してシーケンスにエンコードし、それらをシーケンスモデルで埋め込み、学習プーリングを通じてノードと関係の表現を集約するKGFMであるFlockを提案する。
Flockは、現在のKGFMが失敗する新たな診断データセットPetalsを完璧に解決し、さまざまなドメインから54KGのエンティティおよびリレーショナル予測タスクにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:09:46 GMT)
QuTiP 5: The Quantum Toolbox in Python [26.5] 我々はQuTiP v5の最新の開発について紹介し、QuTiPの将来に大きな影響を与えることを想定している。
コード設計と基本データレイヤの変更と効率の改善を要約します。
QuTiPのすべての量子オブジェクト'の基盤となるデータレイヤのさらなる柔軟性により、最先端のデータフォーマットとJAX、CuPyなどのパッケージのパワーを利用することができます。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:06:47 GMT)
REAL: Reading Out Transformer Activations for Precise Localization in Language Model Steering [26.4] 推論時ステアリングは、パラメータを変更することなく、大きな言語モデルの応答を変更することを目的としている。
既存のアプローチはしばしば単純化的なキューやアドホックな一般化に依存している。
本稿では,Transformerモデルにおける振る舞い関連モジュールを識別するフレームワークであるREALを紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:56:05 GMT)
Self-Evolving Multi-Agent Simulations for Realistic Clinical Interactions [26.2] MedAgentSimは、医師、患者、測定エージェントによる、オープンソースのシミュレートされた臨床環境である。
従来のアプローチとは違って,本フレームワークでは,マルチターン会話を通じて医師が患者と活発に交流する必要がある。
我々は、モデルが診断戦略を反復的に洗練できる自己改善メカニズムを組み込んだ。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:09:34 GMT)
Semantic-Driven AI Agent Communications: Challenges and Solutions [25.7] 本稿では,意味駆動型AIエージェント通信フレームワークを提案する。
第一に、意味適応伝達は、様々な環境にモデルを効率的に適応させるために、実または生成サンプルと微調整を適用する。
第二に、セマンティック・ライトウェイト・トランスミッションはプルーニング、量子化、知覚対応サンプリングを取り入れ、モデルの複雑さを低減し、エッジエージェントの計算負担を軽減する。
第三に、セマンティックな自己進化制御では、分散階層的な意思決定を用いて多次元資源を最適化し、動的環境における堅牢なマルチエージェント協調を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:52:37 GMT)
Milco: Learned Sparse Retrieval Across Languages via a Multilingual Connector [25.7] Learned Sparse Retrieval (LSR) は、2エンコーダの効率と語彙マッチングの透明性を組み合わせている。
MILCOは、異なる言語からのクエリやドキュメントを共通の英語語彙空間にマッピングするLSRアーキテクチャである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:58:25 GMT)
The Good, the Bad, and the Sampled: a No-Regret Approach to Safe Online Classification [25.4] 本研究は, リスクが未知のロジスティックモデルによって管理される2次性疾患の結果に対して, 個人を順次検査する問題について考察する。
我々のゴールは、必要となるコストのかかるテストの総数を最小限に抑えながら、誤分類のごく一部が予め特定されたエラー耐性を超えないことを保証することです。
これにより、エラー制約のあるロジスティックテストに対する最初のノンレグレット保証が確立され、コストセンシティブな医療スクリーニングに直接適用される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:28:00 GMT)
Attribution Gradients: Incrementally Unfolding Citations for Critical Examination of Attributed AI Answers [25.2] 属性勾配を情報源属性検証の解として提示する。
ユーザは、回答の文をそのクレームに分解することができる。
各クレームに対して、ユーザはソースから抽出されたサポートや矛盾した抜粋を見ることができる。
これらの属性勾配の特徴は、応答、クレーム、抽出、コンテキスト間の同時相互接続を促進する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:07:28 GMT)
Low Rank Gradients and Where to Find Them [25.1] バルクを異方性と不規則にすることができるスパイクされたデータモデルを考える。
入力重みに対する勾配は, ほぼ低ランクであることを示す。
また、重み劣化、入力雑音、ジャコビアン罰則などの標準正規化器もこれらの成分を選択的に変調することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:20:19 GMT)
GIM: Improved Interpretability for Large Language Models [25.0] セルフリペア(Self-repair)とは、ネットワークが他のコンポーネントを増幅することで信号の減少を補う現象である。
本稿では,バックプロパゲーション中の自己修復を考慮に入れたGIM(Gradient Interaction Modifications)を紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:18:47 GMT)
TextCAM: Explaining Class Activation Map with Text [24.9] 本稿では,クラスアクティベーションマッピング(Class Activation Mapping, CAM)とその変種が主流である深層視覚モデルに焦点をあてる。
我々は,CAMを自然言語で強化する新しい説明フレームワークであるTextCAMを提案する。
CLIP埋め込みと線形判別分析を用いてチャネルレベルの意味表現を導出し,それらをCAM重みで集約する。
このことは、モデルがどこに出席し、どのような視覚的属性がその決定を支援するかを共同で定義する、という説明をもたらす。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:11:14 GMT)
Diversity-Enhanced Reasoning for Subjective Questions [24.9] 多様性を高めるトレーニングフレームワークであるMultiRole-R1は、様々な役割の観点から推論チェーンを合成する。
ドメイン内精度とドメイン外精度を14.1%と7.64%向上させ、AIME 2024のような高度な数学推論の性能も向上させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:03:30 GMT)
Hot PATE: Private Aggregation of Distributions for Diverse Task [24.8] PATE(Private Aggregation of Teacher Ensembles)は、機密データの非結合部分集合からの応答を集約することで、プライバシ保護機械学習を可能にする。
多様性が増すにつれて、異なる教師のサンプルは同意する傾向が低いが、合意の低さは、同じプライバシー要件に対する実用性を低下させる。
多様な生成環境のために設計されたPATEの変種であるHot PATEを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:00:27 GMT)
Graph Integrated Multimodal Concept Bottleneck Model [24.7] MoE-SGTは、Graph TransformerとMixture of Experts (MoE)モジュールを注入する構造でConcept Bottleneck Models (CBM)を拡張するフレームワークである。
我々は,概念間の構造的関係を明示的にモデル化するために,マルチモーダル入力のための回答概念と回答探索グラフを構築した。
MoE-SGTは、複数のデータセット上の他の概念ボトルネックネットワークよりも高い精度を達成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:18:38 GMT)
One More Question is Enough, Expert Question Decomposition (EQD) Model for Domain Quantitative Reasoning [24.6] エキスパート質問分解(Expert Question Decomposition, EQD)は、ドメイン知識の使用と計算効率のバランスをとるように設計されている。
数千のトレーニング例と、微調整のための1つのA100 GPUが必要で、推論時間はゼロショットプロンプトに匹敵する。
専門知識と複雑な量的推論を特徴とする金融分野のEQDを,4つのベンチマークデータセットで評価した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:45:45 GMT)
LLM Watermark Evasion via Bias Inversion [24.5] 本稿では,理論的動機付けとモデルに依存しないemphBias-Inversion Rewriting Attack (BIRA)を提案する。
BIRAは、下層の透かし方式を知らずに書き直し中に、おそらく透かしのトークンのロジットを抑えることで透かし信号を弱める。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:24:12 GMT)
The Transformer Cookbook [24.5] 本稿では、アルゴリズムを直接トランスフォーマーのパラメータに符号化するテクニックの集合であるトランスフォーマークックブックを紹介する。
フィードフォワード層における基本的な算術演算から、自己注意による複雑なデータルーティングまで、あらゆるものを実装する方法を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:25:07 GMT)
Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct [24.4] DiDi-Instructは、高速世代のために数ステップの学生を蒸留するトレーニングベースの方法である。
OpenWebText上でDiDi-Instructは62.2 (8 NFEs)から18.4 (128 NFEs)にパープレキシティを実現する
これらの利得には無視できるエントロピー損失(約1%)が伴い、競合するdLLM蒸留法と比較して、追加のトレーニングウォールタイム時間を20時間以上短縮する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:45:09 GMT)
DreamCS: Geometry-Aware Text-to-3D Generation with Unpaired 3D Reward Supervision [24.2] 3D-MeshPrefは、最初の大規模な未ペアの3D嗜好データセットである。
RewardCSは、3D-MeshPrefのデータを直接トレーニングした最初の報酬モデルである。
DreamCSはRewardCSをテキストから3Dパイプラインに統合する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:30:25 GMT)
On Task Vectors and Gradients [24.0] タスクベクトルとタスク損失の勾配との接続を確立することにより、タスク演算の厳密な理論的基礎を提供する。
標準勾配勾配下では,1つの微調整のエポックから生成されたタスクベクトルは,学習速度によってスケールされた損失の負の勾配と正確に等価であることを示す。
7つの視覚ベンチマークによる経験的分析は、我々の理論を裏付け、最初のエポック勾配がノルムと方向の両方において微調整軌道を支配していることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:47:28 GMT)
Adaptive Gradient Normalization and Independent Sampling for (Stochastic) Generalized-Smooth Optimization [24.0] 既存のアルゴリズムは一般化された非滑らかな幾何学に完全に適応していないことを示す。
実験により,本アルゴリズムによるサンプリング問題の高速収束が示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:12:45 GMT)
Direct Preference Optimization for Adaptive Concept-based Explanations [23.9] 概念に基づく説明法は、リスナーの好みなど、説明のコミュニケーションの文脈を無視する。
実践的推論の原理と合理的な発話法に基づくリスナー適応的説明を導入する。
提案手法は話者を画像分類データセット上で模擬リスナーの好みに合わせることができることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:11:40 GMT)
Graph2Region: Efficient Graph Similarity Learning with Structure and Scale Restoration [23.9] グラフ類似性はグラフ検索などのグラフ関連タスクにおいて重要であり、最大共通部分グラフ(MCS)やグラフ編集距離(GED)などのメトリクスが一般的に使用される。
最近のニューラルネットワークに基づくアプローチは、計算負担を軽減するために埋め込み空間における類似度スコアを近似している。
グラフ2Region (G2R) と呼ばれる新しい幾何学的グラフ埋め込み法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:10:18 GMT)
Temporal Misalignment Attacks against Multimodal Perception in Autonomous Driving [23.8] DejaVuは車載ネットワークを利用して、センサストリーム間の遅延を誘導し、微妙な時間的ミスアライメントを生成する攻撃である。
包括的攻撃分析により,センサのタスク特異的な不均衡感が明らかになった。
シングルフレームのLiDAR遅延では、攻撃者は車検出のmAPを最大88.5%削減し、3フレームのカメラ遅延、車滴の多重物体追跡精度(MOTA)を73%削減できる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:29:16 GMT)
STORK: Faster Diffusion And Flow Matching Sampling By Resolving Both Stiffness And Structure-Dependence [23.8] 拡散モデル (DM) とフローマッチングモデルは画像およびビデオ生成において顕著な性能を示した。
しかし、そのようなモデルはサンプリング中にかなりの数の関数評価(NFE)を必要とするため、コストがかかる。
本稿では,安定化テイラー直交ランジュ・クッタ法(STORK)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:07:21 GMT)
On Conformal Machine Unlearning [23.7] 共形予測(CP)に基づく機械アンラーニング(MU)の新しい定義を提案する。
本研究では,CP集合から忘れられたサンプルの頻度を定量化するコンフォメーション基準を定式化し,未学習の有効性を測定するための経験的指標を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:55:45 GMT)
Adaptive Event Stream Slicing for Open-Vocabulary Event-Based Object Detection via Vision-Language Knowledge Distillation [23.5] イベントカメラは、高速応答、低レイテンシ、動きのぼかしに対する堅牢性によるオブジェクト検出タスクの利点を提供する。
現在のイベントベースの検出方法は、通常、事前に定義されたカテゴリに基づいて訓練され、新しいオブジェクトに一般化する能力を制限する。
本稿では、CLIPのセマンティック理解を活用して、イベントデータ上でオープンな語彙オブジェクト検出を実現するイベントイメージ知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:03:30 GMT)
To Augment or Not to Augment? Diagnosing Distributional Symmetry Breaking [23.5] 本稿では,データセットにおける異方性の量,つまり対称性の破れを定量化する指標を提案する。
いくつかのベンチマークポイントクラウドデータセットにおいて、驚くほど高いアライメントの度合いを明らかにするために使用しています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:26:33 GMT)
Language Models can Subtly Deceive Without Lying: A Case Study on Strategic Phrasing in Legislation [23.3] 大規模言語モデル(LLM)は、戦略的に表現し、意図的に情報を操作することで微妙な偽装を行う。
本研究は,中性言語が自己維持目標を達成するために,LSMの戦略的表現能力のリスクを強調した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:38:55 GMT)
PurpCode: Reasoning for Safer Code Generation [23.3] 安全なコード推論モデルをトレーニングするための最初のトレーニング後レシピであるPurpCodeを紹介します。
PurpCodeはルール学習と強化学習という2つの段階の推論モデルをトレーニングする。
我々は、最先端のサイバー安全性を示す推論に基づくコーディングモデル、すなわちPurpCode-32Bを開発した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:55:16 GMT)
Beyond the Strongest LLM: Multi-Turn Multi-Agent Orchestration vs. Single LLMs on Benchmarks [23.3] 複数の大規模言語モデル(LLM)エージェントが複数回にわたって対話するマルチターンマルチエージェントオーケストレーションについて,回答を反復的に提案したり,コンセンサスに到達するまで投票を行ったりすることで検討する。
GPQA-Diamond, IFEval, MuSRの4つのLCM(Gemini 2.5 Pro, GPT-5, Grok 4, Claude Sonnet 4)を用いて, GPQA-Diamond, IFEval, MuSRの2つの実験を行った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:39:15 GMT)
ATLAS: Autoformalizing Theorems through Lifting, Augmentation, and Synthesis of Data [23.2] ATLASは、定理文の高品質な並列コーパスを生成するために設計された、新しいデータ生成フレームワークである。
我々は,Llama3.1-8B-インストラクトをLoRAで微調整することで,117k文の学部レベルのデータセットを構築し,ATLASトランスレータを開発した。
このモデルは、Herald TranslatorとKimina-Autoformalizerに対する統計的に有意な改善を証明し、新しい最先端技術を確立している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:11:33 GMT)
HR-INR: Continuous Space-Time Video Super-Resolution via Event Camera [23.1] 連続時空ビデオ超解像(C-STVSR)は、任意のスケールでビデオ解像度とフレームレートを同時に向上することを目的としている。
暗黙の神経表現(INR)はビデオ復元に応用され、ビデオは任意のスケールでデコードできる暗黙のフィールドとして表現されている。
HR-INRという新しいC-STVSRフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:39:11 GMT)
Pay-Per-Search Models are Abstention Models [22.8] 我々は, LLM から容易に吸収を抽出する学習フレームワーク MASH (Modeling Abstention via Selective Help-seeking) を紹介する。
MASHは、このアイデアを強化学習を用いて運用する。
以上の結果から,MASHはより効率的な探索手法の選択的ヘルプ検索性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:41:54 GMT)
The Three Regimes of Offline-to-Online Reinforcement Learning [22.8] オフラインからオンラインへの強化学習(RL)は、トレーニング前のオフラインデータセットと微調整のためのオンラインインタラクションを活用する実用的なパラダイムとして登場した。
この矛盾を説明できる安定性-塑性原理を提案する。
この作業は、オフラインデータセットと事前訓練済みポリシーの相対的なパフォーマンスに基づいて、オフラインからオンラインまでのRLの設計選択を導くための原則化されたフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:58:14 GMT)
VLOD-TTA: Test-Time Adaptation of Vision-Language Object Detectors [22.7] 本稿では,視覚言語オブジェクト検出のためのテスト時間適応フレームワークであるVLOD-TTAを紹介する。
空間的コヒーレントな提案クラスタへの適応に集中するIoU重み付きエントロピー目的を提案する。
画像条件付きプロンプト選択を導入し、画像レベルの互換性によってプロンプトをランク付けする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:17:56 GMT)
Hierarchy-Aware Neural Subgraph Matching with Enhanced Similarity Measure [22.6] グラフマッチングは、時間を要する検索を必要とするため、難しい。
最近のグラフニューラルネットワーク(GNN)ベースのアプローチでは、グラフ情報を抽出するためにGNNエンコーダを用いてこの問題に対処している。
ニューラルグラフマッチングのための新しいGNNアーキテクチャであるNC-Isoを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:27:41 GMT)
Learning to Play Multi-Follower Bayesian Stackelberg Games [22.4] マルチフォローのStackelbergゲームでは、リーダーは$L$アクションに対して混合戦略を実行し、$nge 1$フォロワー、それぞれが$K$のプライベートタイプを持つ。
リーダーが$T$ラウンドと$n$フォロワーと、未知のディストリビューションからサンプリングされたタイプと相互作用する。
リーダーの目標は、最適戦略の累積効力と実際に選択された戦略との差として定義される後悔を最小限にすることである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:20:35 GMT)
Learning a Zeroth-Order Optimizer for Fine-Tuning LLMs [22.4] 大規模言語モデルのための学習ベースゼロトオーダーであるZO Fine-tunerを提案する。
コンパクトでメモリ効率の良い設計により、効率的な摂動戦略を自動的に学習する。
実験の結果、ZOファインチューナーはタスクモデルの組み合わせの82.1%において、ゼロ階前のベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:01:07 GMT)
GRID: Scalable Task-Agnostic Prompt-Based Continual Learning for Language Models [22.3] Prompt-based continual learning (CL)は、タスクシーケンス全体にわたって大きな言語モデル(LLM)を適用するためのパラメータ効率のよいアプローチを提供する。
既存のほとんどのメソッドはタスク認識推論に依存し、タスク固有のプロンプトの集合を維持する。
これらの課題に対処するために設計された統合フレームワークであるGRIDを提示する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:07:15 GMT)
To model human linguistic prediction, make LLMs less superhuman [22.1] 近年,言語モデルによる次の単語の予測が向上するにつれて,人間の読解行動を予測する能力は低下している。
なぜなら、LLMは人よりずっと優れた単語を予測でき、読み出しの難易度を予測できるからです。
我々は、人間のような長期記憶と短期記憶を持つモデルの作成を提唱し、この目標を達成するためのいくつかの可能な方向性を概説する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:53:42 GMT)
Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO [22.0] グループ相対ポリシー最適化は、グループ内のすべてのレスポンスが正しくない場合にポリシーを更新できない。
この制限は、人工知能と人間の知性の間に重要なギャップを浮き彫りにする。
グループ内に応答の多様性を取り入れることで、全負のサンプル問題を緩和するシンプルなフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:55:06 GMT)
Model Parallelism With Subnetwork Data Parallelism [21.9] 本稿では,個別の作業者に対して,モデルの小型で構造化された作業をトレーニングすることで,メモリ要求を低減できる新しい手法を提案する。
我々は,各パラメータの均一な表現を保証する原理によって導かれる2つのサブネットワーク構築戦略を評価する。
予備実験では、性能を損なうことなく20~40%のメモリ使用量の削減を実現し、我々のアプローチの可能性を強調した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:08:23 GMT)
PolyLink: A Blockchain Based Decentralized Edge AI Platform for LLM Inference [21.9] PolyLinkは、大規模な言語モデル(LLM)の開発と推論を分散化する、ブロックチェーンベースの分散AIプラットフォームである。
推論整合性を確保するため、軽量なクロスエンコーダモデルとLPM-as-a-Judgeを組み合わせたTIQEプロトコルを設計する。
その結果,推測と検証のレイテンシが現実的であることが示唆された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:57:29 GMT)
Exploring System 1 and 2 communication for latent reasoning in LLMs [21.8] フロートベースがコプロセッサとラテントメッセージを交換する2階層ラテント推論について検討する。
ラテント解析は、弱い推論ゲインと整合して、限られた特殊化を持つ重なり合う部分空間を示す。
両モデル潜伏推論は原則として有望だが, 目的や通信機構が必要である可能性が高い。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:26:09 GMT)
First Hallucination Tokens Are Different from Conditional Ones [21.6] トークンレベルでの幻覚は、リアルタイムフィルタリングとターゲットの修正に不可欠である。
我々は、RAGTruthコーパスをトークンレベルのアノテーションと再現ロジットを用いて幻覚信号の解析を行う。
その結果,最初の幻覚トークンは強い信号を持ち,条件付きトークンよりも検出しやすくなった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:26:55 GMT)
Stability Bounds for the Unfolded Forward-Backward Algorithm [21.5] 劣化演算子が線形で知られている逆問題を解決するために設計されたニューラルネットワークアーキテクチャを考察する。
入力摂動に対する逆法のロバスト性は理論的に解析される。
我々の研究の重要な新規性は、そのバイアスの摂動に対する提案されたネットワークの堅牢性を調べることである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:27:26 GMT)
Designing Ambiguity Sets for Distributionally Robust Optimization Using Structural Causal Optimal Transport [21.4] 本稿では,因果グラフ情報を含む構造方程式を取り入れ,あいまいさの集合を強化することを提案する。
本研究では, 最適輸送問題における次元性の呪いを克服し, 無秩序で高速な縮小を実現する方法を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:26:47 GMT)
Replicable Reinforcement Learning with Linear Function Approximation [21.4] 複製可能なランダム設計回帰と非中心共分散推定のための2つの効率的なアルゴリズムを導入する。
次に、これらのツールを活用して、線形マルコフ決定プロセスのための最初の証明可能なRLアルゴリズムを提供する。
我々は、我々のアルゴリズムを実験的に評価し、より一貫性のあるニューラルポリシーをいかに刺激するかを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:47:11 GMT)
Stop Playing the Guessing Game! Target-free User Simulation for Evaluating Conversational Recommender Systems [21.3] PEPPERは、実際のユーザインタラクション履歴とレビューから構築された、ターゲットフリーなユーザシミュレータによる評価プロトコルである。
PEPPERは、単純な推測ゲームに陥ることなく、現実的なユーザ-CRS対話を可能にする。
PEPPERは、CRSの嗜好誘発能力を包括的に評価するための詳細な尺度を提示する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:02:04 GMT)
Rethinking Layer-wise Model Merging through Chain of Merges [21.3] Chain of Merges(CoM)は、層間で重みを順次マージし、アクティベーション統計を逐次更新するレイヤワイドマージ手順である。
標準ベンチマークの実験では、CoMが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:54:45 GMT)
On-the-Fly Data Augmentation via Gradient-Guided and Sample-Aware Influence Estimation [21.3] モデル最適化に対する各サンプルの進化的影響に基づいて,各サンプルの強化強度をオンザフライで調整する,サンプル認識動的拡張(SADA)について紹介する。
本手法は軽量であり,補助モデルやポリシーチューニングを必要としない。既存のトレーニングパイプラインにプラグイン・アンド・プレイモジュールとしてシームレスに統合することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:26:52 GMT)
Computational Monogamy of Entanglement and Non-Interactive Quantum Key Distribution [21.2] 量子鍵分布(QKD)により、アリスとボブは秘密鍵を公開の信頼できない量子チャネル上で交換することができる。
従来のキー交換と比較して、QKDは永続的なセキュリティを実現している。
量子情報を用いても、永続的なセキュリティを提供する非対話的プロトコルは知られていない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:41:04 GMT)
UniverSR: Unified and Versatile Audio Super-Resolution via Vocoder-Free Flow Matching [20.9] 本稿では,複雑なスペクトル係数の条件分布を捉えるために,フローマッチング生成モデルを用いた超解像の超解像化フレームワークを提案する。
実験により,我々のモデルは様々なアップサンプリング要因にまたがる高忠実度48kHzのオーディオを連続的に生成することがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:04:53 GMT)
Dephasing-assisted diffusive dynamics in superconducting quantum circuits [20.9] 超伝導量子回路の劣化ノイズ制御による拡散力学を実証する。
準周期秩序を持つ超伝導量子ビットアレイにおいて,デファスティングが明確な動的挙動を与えることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:44:13 GMT)
Eyes-on-Me: Scalable RAG Poisoning through Transferable Attention-Steering Attractors [20.9] 検索拡張世代(RAG)システムに対する既存のデータ中毒攻撃は、ターゲットフレーズごとに有毒な文書を費用対効果で最適化する必要があるため、低スケールである。
我々は,Eyes-on-Meというモジュール型攻撃を導入し,敵の文書を再利用可能な注意喚起器と焦点領域に分解する。
我々の研究は、RAGデータ中毒のスケーラブルなパラダイムを確立し、モジュール化された再利用可能なコンポーネントが現代のAIシステムに実用的な脅威をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:07:22 GMT)
DeMuon: A Decentralized Muon for Matrix Optimization over Graphs [20.8] DeMuonは、与えられた通信トポロジに対する分散行列最適化の方法である。
我々は,様々な接続度を持つグラフを事前学習する分散トランスについて,予備的な数値実験を行った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:06:11 GMT)
SAGE-LD: Towards Scalable and Generalizable End-to-End Language Diarization via Simulated Data Augmentation [20.8] 本稿では,1つのフレームワーク内で非制約言語をサポートするニューラル音声言語ダイアリゼーションモデルを提案する。
提案手法は,多言語認識に基づく学習可能なクエリベースアーキテクチャと,シミュレートされたコードスイッチングデータに基づく大規模事前学習を統合した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:01:33 GMT)
LSPO: Length-aware Dynamic Sampling for Policy Optimization in LLM Reasoning [20.5] 本稿では,各ステップにおけるトレーニングデータを平均応答長に基づいて動的に選択するメタRLVRアルゴリズムを提案する。
複数のベースモデルとデータセットにまたがるLSPOを評価し,学習効率を継続的に向上することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:57:22 GMT)
GuRE:Generative Query REwriter for Legal Passage Retrieval [20.4] LPR(Lawal Passage Retrieval)システムは、法的議論を起草する際の時間節約を支援するため、重要なシステムである。
主な理由は、クエリとターゲットパスの間の大きな語彙ミスマッチである。
本稿では,簡易かつ効果的な生成クエリリライタ(GuRE)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:25:22 GMT)
On the Role of Domain Experts in Creating Effective Tutoring Systems [20.4] 説明可能なAI(XAI)技術を使って、レッスンを自動生成する方法について検討する。
第2に,対象概念を学習するための専門的なカリキュラムが,適応型チューリングシステムの開発にどのように役立つかを確認する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:12:57 GMT)
How Well Can Preference Optimization Generalize Under Noisy Feedback? [20.1] 優先最適化は、人間のフィードバックに基づいて、好ましくない応答と好ましくない応答を区別するモデルを訓練する。
既存の研究の多くはノイズのないフィードバックを前提としているが、これは人間の判断に固有の誤りや矛盾のため非現実的である。
本稿では,雑音フィードバックが優先最適化に与える影響を考察し,これらの条件下での一般化保証を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:56:31 GMT)
TShape: Rescuing Machine Learning Models from Complex Shapelet Anomalies [20.1] 時系列異常検出(TSAD)は、現代のITインフラの信頼性を維持する上で重要である。
本稿では,産業時系列異常検出の課題に対処する新しいフレームワークであるTShapeを紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:03:01 GMT)
Analyse comparative d'algorithmes de restauration en architecture dépliée pour des signaux chromatographiques parcimonieux [19.9] 劣化した観測からのデータ復元は研究の活発な分野である。
従来の反復最適化手法は、現在ではディープラーニング技術によって補完されている。
パラメータ化クロマトグラフィー信号データベースにおける3つのアーキテクチャの比較研究を行った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:27:01 GMT)
RS-OOD: A Vision-Language Augmented Framework for Out-of-Distribution Detection in Remote Sensing [19.7] アウト・オブ・ディストリビューション(OOD)検出はリモートセンシングアプリケーションにおいて重要な課題である。
我々は,リモートセンシング特有の視覚言語モデリングを活用して,ロバストな数ショットOOD検出を実現する新しいフレームワークRS-OODを提案する。
提案手法では,空間的特徴強調によるシーン識別の改善,デュアルプロンプトアライメント機構,信頼誘導型自己学習ループの3つの重要なイノベーションを紹介した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:11:04 GMT)
MG2FlowNet: Accelerating High-Reward Sample Generation via Enhanced MCTS and Greediness Control [19.5] Generative Flow Networks (GFlowNets) は、与えられた報酬関数に比例した分布からサンプルを学習することで、多種多様な高次構造化オブジェクトを生成する強力なツールとして登場した。
本研究では,モンテカルロ木探索(MCTS)をGFlowNetsサンプリングプロセスに統合し,探索とエクスプロイトを適応的にバランスさせる。
本手法は,高次領域の発見速度を早めるだけでなく,生成分布の多様性を保ちながら,連続的に高次領域を生成できる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:09:04 GMT)
CAMILA: Context-Aware Masking for Image Editing with Language Alignment [19.4] 本稿では,CAMILAと命名された画像編集のためのコンテキスト認識手法を提案する。
CAMILAは、命令と画像間のコンテキスト的コヒーレンスを検証するように設計されている。
提案手法は,最先端モデルよりも優れた性能とセマンティックアライメントを実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:11:16 GMT)
CoLA: Compute-Efficient Pre-Training of LLMs via Low-Rank Activation [19.4] 我々は,計算効率の高いオートエンコーダを用いて,CoLAとそのメモリ効率の高い実装であるCoLA-Mを提案する。
6000万から70億のパラメータを持つLLaMAモデルに対する実験は、CoLAが計算コストを$bf 2pmbtimes$.bf 2pmbtimes$.comに削減したことを示している。
CoLA-Mはスループットを犠牲にすることなくメモリコストをさらに削減し、全体として優れたパラメータ、計算、メモリ効率を備えた事前学習アプローチを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:00:03 GMT)
Research on the Integration of Embodied Intelligence and Reinforcement Learning in Textual Domains [19.4] 本稿は,インテリジェンスの知覚と行動優位性と強化学習の判断最適化能力に基づいて,より知性のあるテキストハンドリングを強化することを目的とする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:21:04 GMT)
Developers' Perspectives on Software Licensing: Current Practices, Challenges, and Tools [19.3] この研究は、開発者がライセンスコンプライアンスタスクにどのようにアプローチするかを研究する。
58人のソフトウェア開発者と7人のフォローアップインタビューによる調査で構成されている。
この研究は、現在の実践状況に関する15の重要な発見をもたらした。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:42:10 GMT)
AFFORD2ACT: Affordance-Guided Automatic Keypoint Selection for Generalizable and Lightweight Robotic Manipulation [19.3] AFFORD2ACTは、テキストプロンプトと単一画像から最小限の意味2Dキーポイントのセットを蒸留する、割当誘導フレームワークである。
データ効率を継続的に改善し、目に見えないオブジェクト、新しいカテゴリ、バックグラウンド、イントラクタで82%の成功率を達成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:13:39 GMT)
Stop Misusing t-SNE and UMAP for Visual Analytics [19.0] 視覚分析における t-SNE と UMAP の誤用はますます一般的になっている。
誤用の有無を検証するため136件の論文をレビューする。
我々はDRの専門家にインタビューを行い、なぜこれまでの取り組みが誤用に対処しなかったのかを調べた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:08:39 GMT)
Chiral quantum state circulation from photon lattice topology [19.0] キラル量子状態の循環は量子コンピュータの動作に不可欠である。
キュービットに結合した3つのキャビティからなるキャビティQEDアーキテクチャを提案する。
半古典的限界における循環周期を計算し、総光子数とともに変動する時間スケールにおいて循環が持続することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:00:00 GMT)
Efficient and Transferable Agentic Knowledge Graph RAG via Reinforcement Learning [19.0] 知識グラフ検索強化世代(KG-RAG)は、大きな言語モデル(LLM)と構造化された検証可能な知識グラフ(KG)を結合して幻覚を減らし、推論トレースを公開する。
我々は、強化学習(RL)によるエージェントKG検索増強世代(KG-RAG)フレームワークであるKG-R1を紹介する。
KG-R1は、KGと相互作用する単一のエージェントを環境として利用し、各ステップで学習し、取得した情報をその推論と生成に組み込む。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:16:36 GMT)
Out-of-Distribution Detection using Synthetic Data Generation [19.0] In- and out-of-distriion (OOD) 入力は、分類システムの信頼性の高いデプロイに不可欠である。
本稿では,Large Language Models (LLMs) の生成能力を利用して,高品質なOODプロキシを生成する手法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:33:37 GMT)
ReSeek: A Self-Correcting Framework for Search Agents with Instructive Rewards [18.9] 本稿では,検索エージェントを訓練するための自己修正フレームワークであるReSeekを提案する。
本フレームワークでは,誤探索経路からエージェントを動的に識別・復元する自己補正機構を導入している。
既存のデータセットにおけるデータ汚染のリスクを軽減するため、FictionalHotを導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:44:28 GMT)
Efficient Non-Adaptive Quantum Algorithms for Tolerant Junta Testing [18.9] 我々は、$n$-qubitユニタリが$varepsilon$-close to some $k$-junta or $varepsilon$-far from every $k$-junta。
単一量子ビット演算のみを用いて実装される最初の2つの量子アルゴリズムに適応し、実験可能性を高める。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:52:18 GMT)
Neu-RadBERT for Enhanced Diagnosis of Brain Injuries and Conditions [18.8] BERTをベースとしたモデルであるNeu-RadBERTを開発した。
Neu-RadBERTは急性脳損傷に対して98.0%の精度を達成した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:54:33 GMT)
Safety Instincts: LLMs Learn to Trust Their Internal Compass for Self-Defense [18.8] 安全本能強化学習(SIRL: Safety Instincts Reinforcement Learning)は、低エントロピーの拒絶行動を強化することによって、モデルの安全性本能を信頼することを教える。
SIRLは、数学、コーディング、会話ベンチマークのパフォーマンスを保ちながら、リソース集約型の管理手法を超越している。
私たちの研究は、効果的なアライメントが内部から現れ、より自律的で堅牢なAI安全メカニズムへの道を開くことを実証しています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:35:03 GMT)
StepORLM: A Self-Evolving Framework With Generative Process Supervision For Operations Research Language Models [18.5] 我々は、生成過程を監督する新しい自己進化フレームワークであるStepORLMを紹介する。
StepORLMの中核となるのは、ポリシーモデルと生成プロセス報酬モデル(GenPRM)が相互に反復的に改善される、共進化ループである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:49:36 GMT)
Erase to Improve: Erasable Reinforcement Learning for Search-Augmented LLMs [18.4] 脆弱な推論を堅牢なプロセスに変換する新しいフレームワークであるERLを提案する。
ERLは、障害ステップを明確に識別し、それらを消去し、推論をその場で再生し、欠陥論理が推論チェーンを通過するのを防ぐ。
ESearchと呼ばれるERLでトレーニングされたモデルは、HotpotQA、MuSiQue、2Wiki、Bamboogleで大幅に改善されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:10:36 GMT)
Goal Recognition Design for General Behavioral Agents using Machine Learning [18.2] 目標認識設計(GRD)は、意思決定環境への限定的な修正を目標とし、それらの環境内で行動するエージェントの目標の推測を容易にする。
機械学習手法を目標認識設計に活用し、実行時の効率を改善し、一般的な行動モデルを持つエージェントを考慮に入れます。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:55:59 GMT)
Improving Retrieval-Augmented Neural Machine Translation with Monolingual Data [18.2] 多くの設定では、ターゲット言語の単言語コーパスがしばしば利用可能である。
文レベルと単語レベルの整合性を両立させた改良型言語間検索システムを設計した。
また,本手法はモノリンガルよりもはるかに大きく,ベースライン設定と汎用的クロスリンガル検索の双方に対して強い改善が見られた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:59:54 GMT)
ACPO: Adaptive Curriculum Policy Optimization for Aligning Vision-Language Models in Complex Reasoning [17.9] ACPOは、安定的で、準政治的な探索段階から、効率的で、非政治的な搾取段階へ、原則的な移行を編成する動的カリキュラムを採用している。
我々は、MathVista、LogicVista、MMMU-Proなど、挑戦的なマルチモーダル推論ベンチマークのスイートで広範な実験を行う。
その結果,ACPOはDAPOやPAPOなどの強いベースラインを一貫して上回り,最先端性能,収束の促進,訓練安定性の向上を実現している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:11:27 GMT)
One Policy to Run Them All: an End-to-end Learning Approach to Multi-Embodiment Locomotion [17.6] 統一ロボット形態学アーキテクチャであるURMAを紹介する。
我々のフレームワークは、脚のあるロボットの領域にエンドツーエンドのマルチタスク強化学習アプローチをもたらす。
URMAはロボットプラットフォームに容易に移動可能な複数の実施形態の移動ポリシーを学習できることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:41:12 GMT)
MoveGPT: Scaling Mobility Foundation Models with Spatially-Aware Mixture of Experts [17.4] MoveGPTは、スケーリングの障壁を克服するために特別に設計された、大規模な基盤モデルである。
幅広いダウンストリームタスクにまたがって新たな最先端技術を確立し、平均して35%のパフォーマンス向上を実現している。
また、目に見えない都市に強力な一般化能力を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:50:20 GMT)
TimeEmb: A Lightweight Static-Dynamic Disentanglement Framework for Time Series Forecasting [17.1] 時系列は、静的パターンと動的パターンを示す時間不変成分と時間変化成分の2つの要素に分解することができる。
時系列予測のための軽量な静的力学分解フレームワークTimeEmbを提案する。
TimeEmbは、時系列を革新的に2つの相補的なコンポーネントに分割する: (1) 時系列間の永続的な表現を学習する新しいグローバルな埋め込みモジュールによってキャプチャされる時間不変成分、(2) 信号処理におけるフルスペクトル解析にインスパイアされた効率的な周波数領域フィルタリング機構によって処理される時間変化成分。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:28:49 GMT)
Affordable AI Assistants with Knowledge Graph of Thoughts [17.0] 大規模言語モデル(LLM)は、ドメイン間で多様なタスクを実行できるAIアシスタントの開発に革命をもたらしている。
我々は、LLM推論と動的に構築された知識グラフ(KGs)を統合する革新的なAIアシスタントアーキテクチャであるKGoT(Knowledge Graph of Thoughts)を提案する。
KGoTはGAIAベンチマークでのタスク成功率を、GPT-4o miniのHugging Face Agentsと比較して29%改善した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:38:58 GMT)
LongCodeZip: Compress Long Context for Code Language Models [16.9] LongCodeZipは、LLM(Large Language Models)用に設計された新しいプラグアンドプレイコード圧縮フレームワークである。
重要な情報を保持しながらコンテキストサイズを効果的に削減することで、LongCodeZipはLLMを現実世界の大規模コードシナリオに拡張することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:54:57 GMT)
Fingerprinting LLMs via Prompt Injection [16.9] 大規模言語モデル(LLM)は、後処理や量子化といった後処理によって、リリース後にしばしば修正される。
既存のプロファイランス検出手法には,(1)リリース前のベースモデルにシグナルを埋め込む,(2)手作りのプロンプトやランダムなプロンプトを用いたモデル間の出力を比較する,という2つの制限がある。
我々はLLMPrintを提案する。LLMPrintはLDM固有の脆弱性を利用して指紋を検知する新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:04:38 GMT)
When Models Reason in Your Language: Controlling Thinking Language Comes at the Cost of Accuracy [16.9] 思考トレースを持つLarge Reasoning Models (LRMs) は、英語の推論タスクに強いパフォーマンスを示している。
なぜなら、ユーザーは自分の言語で表現された場合にのみ、その推論トレースが監視に有用であることを見つけることができるからだ。
我々は、XReasoningベンチマークでLRMの2つの主要なファミリーを評価し、最も先進的なモデルでさえしばしば英語に戻るか、他の言語で断片化された推論を生成することを発見した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:59:48 GMT)
jina-reranker-v3: Last but Not Late Interaction for Document Reranking [16.7] jina-reranker-v3は0.6Bパラメータの多言語ドキュメント再ランカである。
このアーキテクチャは、61.94 nDCG@10で最先端のBEIR性能を実現し、生成的リストワイド・リランカよりも大幅に小さい。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:49:17 GMT)
LoRA Users Beware: A Few Spurious Tokens Can Manipulate Your Finetuned Model [16.6] Low-Rank Adaptation (LoRA)は、低リソースコストで高いパフォーマンスを提供する。
本研究では,LoRAが脆弱性をショートカットする扉を開くことを実証する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:16:42 GMT)
Has the Two-Decade-Old Prophecy Come True? Artificial Bad Intelligence Triggered by Merely a Single-Bit Flip in Large Language Models [16.6] Bit-Flip Attack (BFA)は、ハードウェアフォールトインジェクションを通じてリモートでソフトウェアシステムの完全性を損なう能力に対して、広く注目を集めている。
本稿では,大規模言語モデル(LLM)における単一ビット脆弱性の存在を,.gguf量子化形式を用いて体系的に発見し,検証した最初の例である。
攻撃周波数は毎秒464.3回で、1ビットは31.7秒で100%成功してフリップできる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:20:03 GMT)
A universal compression theory: Lottery ticket hypothesis and superpolynomial scaling laws [16.5] ニューラルネットワークは、学習力学を保ちながら、多対数幅に圧縮可能であることを示す。
また,大きなデータセットを多対数サイズに圧縮でき,対応するモデルの損失状況は変化しないことを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:35:23 GMT)
Fair CCA for Fair Representation Learning: An ADNI Study [16.4] フェア表現学習のための新しいフェアカノニカル相関解析(CCA)手法を提案する。
我々はアルツハイマー病神経画像イニシアチブ(ADNI)の合成データと実世界のデータについて検証する。
我々の研究は、偏見のない分析が不可欠である神経画像研究において、公正な機械学習を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:01:21 GMT)
Enhancing Rating Prediction with Off-the-Shelf LLMs Using In-Context User Reviews [16.4] 等級評価予測は、言語と数学的推論の両方を効果的に解く必要がある回帰タスクである。
本研究では,市販LCMの性能を評価予測に用い,異なるコンテキスト情報を提供する。
ユーザによるレビューでは,LCMのレーティング予測性能が大幅に向上していることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:04:20 GMT)
Steering When Necessary: Flexible Steering Large Language Models with Backtracking [16.2] 大規模言語モデル(LLM)は多くの世代で顕著な性能を達成している。
アクティベーションステアリング(Activation steering)は、推論段階においてLSMのアクティベーションを直接変更する効果的で費用効率のよいアプローチである。
本稿では,介入の必要性と強度の両方を動的に決定するフレキシブル・アクティベーション・ステアリング・アット・バックトラッキング(FASB)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:31:05 GMT)
NS-Pep: De novo Peptide Design with Non-Standard Amino Acids [15.9] 非標準アミノ酸(NSAAs)は、結合親和性を改善し、薬理学的特性を改善している。
既存のペプチド設計法は標準的なアミノ酸に限られており、NSAAを意識した設計はほとんど探索されていない。
NS-Pepは、ペプチド配列と構造をNSAAsと共設計するための統合フレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:04:06 GMT)
LEAP: Local ECT-Based Learnable Positional Encodings for Graphs [15.7] グラフ位置符号化(PE)はこれらの制限に対処するための有望な方向として登場した。
グラフのための新しいエンドツーエンドトレーニング可能な局所構造PEであるLEAPを提案する。
グラフ表現学習パイプラインの強力なコンポーネントとして,LEAPを用いたエンコーディングの可能性について検討した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:44:01 GMT)
Spiking Neural Network for Cross-Market Portfolio Optimization in Financial Markets: A Neuromorphic Computing Approach [15.6] 本研究では,スパイキングニューラルネットワーク(SNN)の市場ポートフォリオ最適化への応用について検討する。
Yahoo Finance APIを通じて、毎日の株価の取引日を約1,250日とする5年間のデータセットを体系的に収集した。
提案フレームワークはLeaky Integrate-andFireニューロンダイナミクスを適応しきい値、スパイク依存性の可塑性、横方向の抑制と統合し、金融時系列のイベント駆動処理を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:13:44 GMT)
Gather-Scatter Mamba: Accelerating Propagation with Efficient State Space Model [15.6] ステート・スペース・モデル(SSM)は歴史的にシーケンシャル・モデリングにおいて中心的な役割を果たしてきた。
Mambaのような選択型SSMの最近の進歩は、魅力的な代替手段を提供する。
本研究では,空間的コンテキストアグリゲーションのためのシフトウィンドウ自己アテンションと,効率的な時間的伝搬のためのマンバ型選択走査を組み合わせたハイブリッドアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:11:13 GMT)
HiSpec: Hierarchical Speculative Decoding for LLMs [15.3] 低オーバーヘッド中間検証のために$textitearly-exit(EE)モデルを利用する投機的復号化フレームワークを提案する。
HiSpecは平均1.28$times$、平均2.01$times$をベースラインのシングルレイヤの推測と比較して改善している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:04:14 GMT)
Composer: A Search Framework for Hybrid Neural Architecture Design [15.3] 計算プリミティブを異なる比率で組み合わせたハイブリッドモデルアーキテクチャは、トランスフォーマーを超える有望な性能を示している。
モジュール型ハイブリッドモデルアーキテクチャ検索フレームワークであるComposerの設計において、原則化されたアプローチを取ります。
Composer を用いて,Llama 3.2 より優れたハイブリッド LLM アーキテクチャを新たに発見する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:51:36 GMT)
Sample-Efficient Differentially Private Fine-Tuning via Gradient Matrix Denoising [15.2] DP-SGDを用いた大規模言語モデル(LLM)の微分プライベート微調整におけるサンプル効率の課題に対処する。
DP-SGDは強力なプライバシー保証を提供するが、付加ノイズは勾配行列のエントロピーを著しく増大させる。
本稿では,ランダム行列理論を利用して勾配を識別し,低ランク構造を復元し,元の信号との整合性を改善するポストプロセッシングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:25:23 GMT)
Semantics-Aligned, Curriculum-Driven, and Reasoning-Enhanced Vulnerability Repair Framework [15.2] SeCuRepairは、セマンティクスに準拠し、カリキュラム駆動で、脆弱性修復のための推論強化フレームワークである。
コアとなるSeCuRepairは、理由と脆弱性の修正方法をモデルに明記する必要がある、合理的に編集されたパラダイムを採用している。
SeCuRepairはまた、従来の教師付き微調整を超えて、セマンティックス対応の強化学習を採用している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:09:27 GMT)
Synthetic Blips: Generalizing Synthetic Controls for Dynamic Treatment Effects [15.2] 一般的な処理シーケンスで収集したパネルデータから単位特異的な処理効果を推定する。
実装が容易で,望ましい特性が得られる推定アルゴリズムを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:07:11 GMT)
FusionAdapter for Few-Shot Relation Learning in Multimodal Knowledge Graphs [15.2] マルチモーダル知識グラフ(MMKG)は、エンティティと関係表現を強化するために、テキストや画像を含む様々なモダリティを組み込んでいる。
MMKGにおける少数ショット関係の学習のためのFusionAdapterを提案する。
多様なモダリティからの情報を効果的に適応・融合することにより、FusionAdapterは最小限の監督力を持つ新しい関係への一般化を改善する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:36:56 GMT)
FAME: Adaptive Functional Attention with Expert Routing for Function-on-Function Regression [15.0] FAME(Functional Attention with a Mixture-of-Experts)は、関数・オン・ファンクションの回帰のためのエンドツーエンドの完全なデータ駆動フレームワークである。
FAMEは、神経制御微分方程式とMoE駆動ベクトル場を結合して機能的連続性を捉えることで連続的な注意を形成する。
合成および実世界の汎関数回帰ベンチマークの実験により、FAMEは任意のサンプリングされた離散観測に対して、最先端の精度、強い堅牢性を達成することが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:53:55 GMT)
Learning Hierarchical Domain Models Through Environment-Grounded Interaction [15.0] オープンワールド環境では、単一の汎用ドメインモデルは様々なタスクをキャプチャできない。
大きな言語モデル(LLM)はそのようなドメインを生成することができるが、適用性を制限する高いエラー率に悩まされる。
LLMと環境基盤からの自律的ドメイン学習のためのフレームワークであるLODGEを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:01:27 GMT)
The Command Line GUIde: Graphical Interfaces from Man Pages via AI [15.0] ドキュメントをAI経由でインターフェース仕様に変換することで,コマンドラインツールのグラフィカルインターフェースを自動生成する機構を示す。
生成したインタフェースをコマンドのコーパス上で評価し,GUIdeが実際のコマンドラインタスクに対してどの程度のグラフィカルインターフェースを提供するかを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:46:53 GMT)
Retain or Reframe? A Computational Framework for the Analysis of Framing in News Articles and Reader Comments [14.9] 我々は、ソースコンテンツ(ニュース記事)とオーディエンス応答(読者コメント)にわたるフレーミングの大規模解析のための、最初の計算フレームワークを提示する。
フレームワークを11のトピックと2つのニュースソースに適用すると、コメントのフレーム再利用はアウトレット間で非常に相関し、トピック固有のパターンは様々である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:06:22 GMT)
Looking Alike From Far to Near: Enhancing Cross-Resolution Re-Identification via Feature Vector Panning [14.9] クロスリゾリューションReID(CR-ReID)法は、特徴補償のための超解像(SR)や共同学習に依存している。
単語埋め込み空間のセマンティックな方向から着想を得た結果,ReIDの特徴空間にも,解決の相違を意味するセマンティックな方向が現れることが実証的に明らかになった。
本稿では,新しい視点からCR-ReIDを実行する軽量で効果的なベクトルパニング機能アライメント(VPFA)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:15:39 GMT)
Making, not Taking, the Best of N [14.8] Fusion-of-N (FusioN) は、一般LLM判定器を用いて各試料の最も情報性の高い要素を1つの最終回答に合成する手法である。
We compare FusioN to BoN in two settings, (i) test-time scaling, where we sample and aggregate from a single model at test-time synthetic data generation, where we fuse a pool of various teachers to improve a student model。
ベンチ全体では、FusioNは、テスト時間スケーリングと合成データ生成による下流ゲインの両方において、汎用性と堅牢性を示すBoNを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:14:31 GMT)
Eliciting Secret Knowledge from Language Models [14.7] シークレット・エリケーション(Secret elicitation)とは、AIが持っているが、明示的に言語化されていない知識を発見することである。
テストベッドとして,大規模言語モデル(LLM)の3つのファミリーをトレーニングして,下流に適用される特定の知識を持つように訓練する。
我々は,様々なブラックボックスとホワイトボックスの秘密抽出手法を設計し,LLM監査員が秘密知識を推測できるかどうかに基づいて評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:12:28 GMT)
Divergence-Based Similarity Function for Multi-View Contrastive Learning [14.6] 本稿では,各拡張ビューの集合を分布として表現することにより,結合構造を捉える分散型類似関数(DSF)を提案する。
大規模な実験により、DSFはkNN分類や線形評価など、様々なタスクにおけるパフォーマンスを一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:31:21 GMT)
Bayesian Distributional Models of Executive Functioning [14.5] DLVMは、特に少ないデータ量でIMLEを一貫して上回り、真の分布の高精度な推定よりも高速に収束する。
DALEは、情報ゲイン、ランダムサンプリング、固定テストバッテリを最大化するために、適応的にサンプリングを誘導する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:59:31 GMT)
Dynamic-TreeRPO: Breaking the Independent Trajectory Bottleneck with Structured Sampling [14.4] 本研究では,木構造による雑音強度の深さに沿って,スライディング・ウインドウ・サンプリング・ストラテジーを実装したDynamic-TreeRPOを提案する。
木層ごとによく設計されたノイズ強度により、Dynamic-TreeRPOは余分な計算コストを伴わずに探索のばらつきを高めることができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:11:51 GMT)
ReFACT: A Benchmark for Scientific Confabulation Detection with Positional Error Annotations [14.4] 大規模言語モデル(LLM)は、しばしば科学的事実を議論し、その信頼性を著しく損なう。
多様な科学的領域にまたがる1,001名の専門家による質問応答対のベンチマークであるReFACTを紹介する。
それぞれのインスタンスには、科学的に正しい答えと、正確なエラースパンとエラータイプで注釈付けされた非実例の両方が含まれている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:57:04 GMT)
FANS -- Formal Answer Selection for Natural Language Math Reasoning Using Lean4 [14.3] FANS: Lean4を用いた自然言語数学推論のための形式的アンサー選択法を提案する。
LLMの算数推論能力を高めるためにLean4を使用した最初のフレームワークである。
LLMのNL数学能力を強化し、その正解をコンピュータで検証できるソリューションを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:43:03 GMT)
Discrete Wavelet Transform as a Facilitator for Expressive Latent Space Representation in Variational Autoencoders in Satellite Imagery [14.2] ラテント拡散モデル(LDM)は、変分オートエンコーダ(VAE)によって構築された圧縮潜在空間内での操作により画素空間拡散の計算複雑性を緩和する
本稿では、離散ウェーブレット変換(DWT)を利用して、衛星画像用に設計されたVAEの潜在空間表現を強化する革新的な視点を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:49:41 GMT)
Robust Spatiotemporally Contiguous Anomaly Detection Using Tensor Decomposition [14.2] 本稿では,非教師付きテンソルに基づく異常検出手法を提案する。
提案手法は合成データと実データの両方で評価される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:25:44 GMT)
AP2O: Correcting LLM-Generated Code Errors Type by Type Like Humans via Adaptive Progressive Preference Optimization [14.1] 本稿では,LLMを適応的かつ体系的にガイドし,コード生成のためのコードエラーを低減する手法であるAP2O-Coderを提案する。
広範な実験を通じて、私たちのAP2O-Coderは、好みの少ないデータを使用しながら、pass@kでコード生成性能を最大3%改善します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:17:08 GMT)
Neuro-Symbolic AI for Analytical Solutions of Differential Equations [14.1] 本稿では,ニューロシンボリックAIフレームワークを用いて微分方程式の解析解を求める。
この積分は、ニューロシンボリックAIフレームワークを介して数値方程式と記号微分方程式を統一する。
様々な問題に対して,商業的解法,記号的解法,近似ニューラルネットワークの利点を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:38:14 GMT)
Collaborative-Distilled Diffusion Models (CDDM) for Accelerated and Lightweight Trajectory Prediction [14.1] 軌道予測は自律走行車(AV)とインテリジェントトランスポーテーションシステム(ITS)の基本課題である
拡散モデルは最近、確率的軌道予測において強い性能を示した。
本稿では, リアルタイムかつ軽量な軌道予測手法であるCDDMを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:00:31 GMT)
Automated Structured Radiology Report Generation with Rich Clinical Context [14.1] 胸部X線画像からの文脈的構造化ラジオグラフィーレポート生成(SRRG)を提案する。
C-SRRGはSRRGの豊富な臨床コンテキストを包括的に取り入れている。
提案したC-SRRGに臨床コンテキストを組み込むことで,報告の質が著しく向上することが実証された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:14:23 GMT)
Black-Box Time-Series Domain Adaptation via Cross-Prompt Foundation Models [14.0] 本稿では,ブラックボックスの時系列領域適応問題に対するCross-Prompt Foundation Model (CPFM) の概念を提案する。
CPFMは、データ分布の異なる特性をキャプチャする独自のプロンプトを各ブランチに備えた二重分岐ネットワーク構造の下で構成される。
我々の実験は、異なるアプリケーションドメインの3つの時系列データセットにおいて、競合他社から顕著なマージンで改善された結果を裏付けるものである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:09:01 GMT)
Unpacking Let Alone: Human-Scale Models Generalize to a Rare Construction in Form but not Meaning [13.9] 我々は、英語LET-ALONE構築の形式と意味の知識に基づいて、人間のスケールトランスフォーマー言語モデルをテストする。
関連する構造がデータセットからフィルタリングされた場合でも,人間のスケールのLMは形成に敏感であることがわかった。
人間のスケール LM は LET-ALONE の意味を正しく一般化しない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:01:31 GMT)
Advantage for Discrete Variational Quantum Algorithms in Circuit Recompilation [13.8] 量子回路再コンパイルタスクにおける適応的戦略と非適応的戦略の指数関数的分離の証拠を示す。
数値実験により,ボリューム・ロー・エンタングルメントとハイ・マグニックの条件下で動作している隠れ回路構造を効率よく発見できることが示されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:42:55 GMT)
Assessing Foundation Models for Mold Colony Detection with Limited Training Data [13.8] 5000ペトリの食器画像にバウンディングボックスをアノテートした代表的データセットを構築した。
従来のタスク固有のメトリクスのベースラインに対して、3つのビジョンファウンデーションモデルをベンチマークする。
MaskDinoは150枚の画像のみを微調整しながら、広範囲に訓練されたYoloV9モデルでほぼ完成している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:25:45 GMT)
Beyond Semantics: Rediscovering Spatial Awareness in Vision-Language Models [13.8] 視覚言語モデル(VLM)はオブジェクトの識別と記述に優れるが、しばしば空間的推論では失敗する。
視覚トークンの埋め込みは、テキストトークンよりもはるかに大きな規範を持っている。
視覚トークンとシステムが注目を惹きつけることを明らかにするツール。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:26:04 GMT)
Differential Privacy of Network Parameters from a System Identification Perspective [13.7] 本稿では,サイバー物理システムシミュレーションの共有において,プライバシシステム識別(SI)攻撃からネットワーク情報を保護するという課題に対処する。
我々は,グラフシフト演算子(GSO)を推定することを目的とした,差分プライベート(DP)の帰納的励起によって駆動されるグラフフィルタの時系列出力として,ネットワーク化された状態のアナリスト観測をモデル化する。
入力にDP機構を適用することで、GSOに対して正式なプライバシー保証が得られ、グラフフィルタのスペクトル特性とノイズ共分散に縛られた$(epsilon,delta)$-DPがリンクされることが示される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:08:15 GMT)
Exploring and Controlling Diversity in LLM-Agent Conversation [13.7] 本稿では,単一パラメータで多様性を制御できる新しい手法であるAdaptive Prompt Pruning (APP)を提案する。
APPは広範な実験を通じて多様性を効果的に調整し、既存の多様性制御手法と互換性がある。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:50:01 GMT)
Simultaneous Multi-objective Alignment Across Verifiable and Non-verifiable Rewards [13.7] 私たちは、検証可能で検証不可能な報酬を持つ領域にまたがるモデルを同時に整合させるのに何が必要かに答えようとしています。
本稿では,プロセス報酬モデル(PRM)のトレーニングを,検証可能な設定と検証できない設定の両方にわたって標準化する統合フレームワークを提案する。
数学推論、値アライメント、マルチターン対話による実験は、我々のフレームワークが複数の目的に対して同時に性能を向上させることを示している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:54:15 GMT)
Analyzing Dialectical Biases in LLMs for Knowledge and Reasoning Benchmarks [13.6] 我々は、アメリカ英語の「標準」質問を「標準」でない方言の変種としてタイプし、複数の選択質問応答タスクに与える影響を分析した。
個々の文法規則は性能に様々な影響を与えるが、他の規則よりも簡潔なものもある。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:35:16 GMT)
SoftAdaClip: A Smooth Clipping Strategy for Fair and Private Model Training [13.5] ハードクリッピングをスムーズでタングベースの変換に置き換える,微分プライベートなトレーニング手法であるSoftAdaClipを導入する。
我々はMIMIC-III(クリニカルテキスト)、GOSSIS-eICU(構造化ヘルスケア)、成人所得など、様々なデータセットでSoftAdaClipを評価した。
その結果,SoftAdaClipはDP-SGDに対して最大87%,Adaptive-DPSGDでは最大48%のサブグループ格差を減少させることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:38:37 GMT)
PhyloLM : Inferring the Phylogeny of Large Language Models and Predicting their Performances in Benchmarks [13.5] 本稿では,Large Language Models(LLMs)に系統解析アルゴリズムを適用するPhyloLMを紹介する。
本手法は, LLMsの出力の類似性に基づいて系統的距離測定値を算出する。
我々の系統的距離は標準ベンチマークの性能を予測し,その機能的妥当性を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:40:22 GMT)
Relevance-Zone Reduction in Game Solving [13.3] 本稿では,領域を徐々に制限しながら,同じ位置を繰り返す反復RZ低減手法を提案する。
7x7 Killall-Goの実験では,RZの平均サイズを85.95%に削減した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:10:32 GMT)
RiskPO: Risk-based Policy Optimization via Verifiable Reward for LLM Post-Training [13.3] 検証可能な報酬を伴う強化学習は、大規模言語モデル(LLM)の訓練後の中心パラダイムとして浮上している。
これらの問題は、稀だが有意義な推論パスを無視しながら、高確率な出力シーケンスを過度に強調することに起因すると我々は主張する。
本稿では,古典的平均的目標を原則的リスク対策に置き換えるリスクベース政策最適化(RiskPO)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:53:09 GMT)
NUMINA: A Natural Understanding Benchmark for Multi-dimensional Intelligence and Numerical Reasoning Abilities [13.2] 我々は,多次元インテリジェンスと数値推論のための最初の自然理解ベンチマークであるNUMINAを紹介する。
Chat-Scene フレームワークによるNUMINA 上での様々な最先端 LLM の性能評価を行った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:50:33 GMT)
Code Like Humans: A Multi-Agent Solution for Medical Coding [13.1] Code Like Humans: 大きな言語モデルで医療コーディングを行うための新しいエージェントフレームワークを紹介します。
人間の専門家のための公式なコーディングガイドラインを実装しており、完全なICD-10コーディングシステムをサポートする最初のソリューションである。
希少な診断符号で現在までの最高のパフォーマンスを達成している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:16:56 GMT)
Private Realizable-to-Agnostic Transformation with Near-Optimal Sample Complexity [13.1] 実現可能-認識可能変換は、現実化可能な設定のプライベート学習者を、不可知な設定のプライベート学習者に変換する一般的なメカニズムを提供する。
本研究では、$varepsilon$への依存をなくす改良された構成を与える。
その結果、プライベートな学習では、プライバシコストは実現可能な部分でのみ重要であることが判明した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:49:43 GMT)
Private Online Learning against an Adaptive Adversary: Realizable and Agnostic Settings [13.1] 我々は、学習者がT$のデータポイントのシーケンスを受け取り、仮説の段階ごとに応答しなければならない、プライベートオンライン学習の問題を再考する。
出力仮説全体のストリームは、差分プライバシーを満たすべきである。
一般的なLittlestoneクラスに対して$tildeO_d(sqrtT)$のサブ線形後悔を実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:53:57 GMT)
The Sandbox Configurator: A Framework to Support Technical Assessment in AI Regulatory Sandboxes [13.1] EUの人工知能法は、AI規制サンドボックス(AIRS)を導入している。
評価メソッドは断片化され、テストは標準化が欠如し、開発者と規制当局の間のフィードバックループは弱い。
共有ライブラリからドメイン関連テストを選択し、ダッシュボードを統合したカスタマイズされたサンドボックス環境を生成することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:11:01 GMT)
Linear-Size QAC0 Channels: Learning, Testing and Hardness [13.1] 現在の雑音量子ハードウェアは、短時間で忠実な量子計算しか実行できない。
本稿では,サブ指数実行時間とクエリを用いた$mathbfQAC0$チャネルの最初のアルゴリズムを提案する。
また,Choi行列のスペクトルノルム距離とダイヤモンドノルム距離の両方の下で,$mathbfQAC0$チャネルを学習する際のクエリ複雑性を指数関数的に低くする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:19:38 GMT)
Weighted Sequential Bayesian Inference for Non-Stationary Linear Contextual Bandits [13.1] 逐次ベイズ推論のレンズによる非定常線形文脈帯域について検討する。
我々の主な貢献は、WSB後部における新しい濃度不等式である。
本稿では,WSB-LinUCB,WSB-RandLinUCB,WSB-LinTSの3つのアルゴリズムを紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:59:25 GMT)
MetaLogic: Robustness Evaluation of Text-to-Image Models via Logically Equivalent Prompts [13.0] テキスト・トゥ・イメージ(T2I)モデルは、入力が言語的変化を誘発するときに意味的一貫性を維持するのに苦労する。
提案するMetaLogicは,T2Iミスアライメントを検出する新しい評価フレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:51:13 GMT)
Train on Validation (ToV): Fast data selection with applications to fine-tuning [13.0] 最先端の機械学習は、しばしば2段階のプロセスに従う: 大きな汎用データセットで$(i)$pre-training、タスク固有のデータで$(ii)$fine-tuning。
既存のデータ選択方法は、対象サンプルを検証セットとして扱い、トレーニングプールから単一のサンプルの追加や削除の効果を推定する。
電車とバリデーションの通常の役割を逆転する,よりシンプルで高速な代替案を提案する。
私たちの重要な洞察は、小さな検証セットの微調整によって最も影響を受けるトレーニングサンプルが最も有用であることです。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:55:39 GMT)
COOKIEGUARD: Characterizing and Isolating the First-Party Cookie Jar [13.0] サードパーティ製スクリプトは、サードパーティ製スクリプトを含むサードパーティ製のクッキーにアクセスし、公開することができる。
2万のウェブサイトにまたがる第1のクッキーへのクロスドメインアクセスの大規模な測定を行った。
ブラウザベースの実行時実行機構であるCookieGuardを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:44:52 GMT)
Electromagnetic Inverse Scattering from a Single Transmitter [12.8] 医用画像では、散乱電磁場から相対誘電率を再構成することが目的である。
最近の機械学習ベースのアプローチであるImg-Interiorsは、連続的な暗黙の関数を活用することで、有望な結果を示す。
本稿では,計測フィールドから散乱器の相対誘電率を予測する,エンドツーエンドでデータ駆動のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:13:23 GMT)
Self-Supervised Representation Learning as Mutual Information Maximization [12.8] 自己指導型表現学習(SSRL)は、顕著な経験的成功を示している。
最近の研究は、情報理論の目的を検証してSSRL法を統一しようと試みている。
予測器ネットワーク、停止段階演算、統計正則化器といったアーキテクチャ要素は、しばしば経験的に動機づけられた付加物と見なされる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:18:14 GMT)
Beyond Single LLMs: Enhanced Code Generation via Multi-Stage Performance-Guided LLM Orchestration [12.7] 大規模言語モデル(LLM)は、自動コード生成の主要なパラダイムとなっている。
本稿では,マルチステージなパフォーマンス誘導オーケストレーションフレームワークを導入することで,シングルモデルコンベンションに挑戦する。
Perchは、ステージワイドバリデーションとロールバックメカニズムを通じて、各タスクコンテキストでトップパフォーマンスのLLMをオーケストレーションする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:07:16 GMT)
MS-DFTVNet:A Long-Term Time Series Prediction Method Based on Multi-Scale Deformable Convolution [12.7] 我々は,長期予測のための変形可能な畳み込みフレームワークであるMS-DFTVNetを開発した。
実験の結果、MS-DFTVNetは強いベースラインを著しく上回るだけでなく、平均7.5%の改善も達成している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:35:31 GMT)
CINDES: Classification induced neural density estimator and simulator [12.5] 本稿では, 実装が容易で適応性の高い構造に依存しないニューラル密度推定器を提案する。
提案した推定器は自然に生成型サンプリングパイプラインに統合されることを示す。
我々は、広範囲なシミュレーションと実データアプリケーションを通して、その性能を検証する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:21:37 GMT)
Weakly Supervised Cloud Detection Combining Spectral Features and Multi-Scale Deep Network [12.5] 本稿では,スペクトル特徴とマルチスケールシーンレベル深層ネットワーク(SpecMCD)を組み合わせた弱教師付きクラウド検出手法を提案する。
提案手法のF1スコアは7.82%以上の改善を示し,クラウド検出におけるSpecMCD法の優位性と可能性を強調した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:32:49 GMT)
Small Vectors, Big Effects: A Mechanistic Study of RL-Induced Reasoning via Steering Vectors [12.3] ベースモデルの残留流路に挿入された軽量ステアリングベクトルについて検討し,強化学習目標を用いて訓練を行った。
i)最後の層ステアリングベクトルは、第1生成トークンに集中したトークン置換バイアスのように振舞い、"To"や"Step"のようなトークンを一貫して増加させる。
また, (i) ステアリングベクトルが他のモデルに遷移し, (ii) 独立に訓練された場合, (iii) 適応的なトークンワイドスケーリングの下で意味のあるプロンプトセグメントに集中して, 層間を結合することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:37:07 GMT)
COM-BOM: Bayesian Exemplar Search for Efficiently Exploring the Accuracy-Calibration Pareto Frontier [12.3] 先行探索法は予測精度とモデル校正を狭義に最適化する。
本稿では,予測精度の決定値とキャリブレーション誤差の最小化の両方を対象とする多目的最適化問題を定式化する。
その結果,COM-BOMは2つの目的を協調的に最適化する上で,ベースラインに打ち勝つか一致することがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:57:49 GMT)
Steering LLM Reasoning Through Bias-Only Adaptation [12.2] 基本重みの全てを凍結しながら、強化学習による1層あたりの1d$次元ステアリングベクトルのトレーニングは、数学的推論タスクにおいて完全にRLで調整された推論モデルの精度と一致することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:23:07 GMT)
Training Large Language Models To Reason In Parallel With Global Forking Tokens [12.2] LLMは並列テスト時間計算のスケーリングによる性能向上を実証している。
困難な問題に対して、多種多様な正しい推論モードをトリガーするトークンをフォークすることは、通常サンプリングツリーの奥深くにある。
本研究では,ユニークな推論モードを保ち,創発的なグローバルフォークトークンを生成するSet Supervised Fine-Tuning (SSFT)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:48:39 GMT)
A Practitioner's Guide to Multi-turn Agentic Reinforcement Learning [12.2] マルチターン強化学習を通じて,大規模言語モデルをエージェントとして訓練する上で,実際にどのような効果があるのか,どのような効果があるのかを検討する。
デザインスペースを環境、報酬、ポリシーという3つの相互関係の柱に分割します。
これらの知見を,3つの柱にまたがる共同設計を指導する学習レシピに抽出する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:23:04 GMT)
Heisenberg-Limited Quantum Metrology without Ancillae [12.1] 本稿では,量子力学と量子チャネル理論のブリッジング問題に対処する新たな理論枠組みを提案する。
推定するチャネルの繰り返し適用でハイゼンベルク限界を達成するのに十分な条件を証明した。
後者の場合、制御操作を明示的に識別するアルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:39:48 GMT)
Dirichlet-Prior Shaping: Guiding Expert Specialization in Upcycled MoEs [12.1] トレーニング済みの高密度モデルをスパース・ミックス・オブ・エクササイズ(MoEs)にアップサイクリングすることは、モデルのキャパシティを効率的に向上させるが、単純な重量再現による専門性に乏しいことがしばしばある。
本稿では,ディリクレ・プライア・シェイピング・ロス(DPSL, Dirichlet-Prior Shaping Loss)について紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:59:52 GMT)
Ambiguity in LLMs is a concept missing problem [12.0] 自然言語における曖昧さは、構造化されたデータマッピングに対する正確なテキストを実現するための重要な障害である。
我々は、潜在空間における曖昧なテキストの表現差を特徴付ける異なるアプローチを採用する。
本稿では,概念上のパスカーネルに基づく新しい距離測度を導入し,あいまいな質問とあいまいな質問を区別する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:44:19 GMT)
Cascaded Diffusion Framework for Probabilistic Coarse-to-Fine Hand Pose Estimation [12.0] 本稿では,確率的モデリングとカスケード改良を組み合わせた粗大なカスケード拡散フレームワークを提案する。
学習空間における多種多様な共同仮説を用いたメッシュ LDM の学習により,我々のフレームワークは配電・配電・連成関係を学習する。
FreiHAND と HO3Dv2 の実験により,提案手法はポーズ分布を効果的にモデル化しながら,最先端の性能を実現することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:19:15 GMT)
A Comprehensive Framework to Operationalize Social Stereotypes for Responsible AI Evaluations [12.0] 社会的なステレオタイプは、責任あるAI介入の無数の中心にある。
生成AI評価におけるステレオタイプを運用するための統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:07:44 GMT)
Back to the Basics: Rethinking Issue-Commit Linking with LLM-Assisted Retrieval [12.0] 問題と修正するコミットを結びつけるイシューコミットリンクは、ソフトウェアのメンテナンスに不可欠である。
本稿では,ベクトルデータベースを現代的な情報検索手法として活用したEasyLinkを提案する。
我々の評価では、EasyLinkは75.03%の平均Precision@1を達成し、最先端の技術を4倍以上改善しています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:01:30 GMT)
DEAP DIVE: Dataset Investigation with Vision transformers for EEG evaluation [11.9] 脳信号から感情を正確に予測することは、メンタルヘルスの改善、人間とコンピュータの相互作用、感情コンピューティングといった目標を達成する可能性がある。
本研究は,低コストの脳波デバイスを用いて,脳波チャネルのサブセットを用いて十分な正確な感情予測を行う方法について検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:07:07 GMT)
Bayesian Neural Networks for Functional ANOVA model [11.8] ANOVA分解は高次元関数を低次元成分に分解するための基本ツールである。
TPNNは、ANOVA-TPNNと呼ばれる機能的ANOVAモデルの基盤関数として開発され、応用されている。
本研究では,TPNN基底関数を持つ機能的ANOVAモデルのベイズ推論手法であるBayesian-TPNNを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:04:11 GMT)
Graph-S3: Enhancing Agentic textual Graph Retrieval with Synthetic Stepwise Supervision [11.8] Graph-$S3$は、LLMベースのレトリバーをベースとしたエージェント型テキストグラフ推論フレームワークである。
提案手法は精度が平均8.1%向上し,F$_1$スコアが9.7%向上した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:27:36 GMT)
Training-free LLM Verification via Recycling Few-shot Examples [11.8] ReFeriはベイズのルールから動機付けられた2つの異なるスコアを組み合わせて生成した出力を評価し、その後候補を選択する。
3つの異なるLLMと7つの多様なタスクによる実験により、我々のフレームワークはLLMの精度を大幅に向上することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:58:58 GMT)
Vicinity-Guided Discriminative Latent Diffusion for Privacy-Preserving Domain Adaptation [11.7] 識別性粘度拡散(DVD)は、ソースフリードメイン適応の実践的な変種のためのフレームワークである。
DVDは、各ソース特徴のラベル情報をその潜在近傍にエンコードする。
標準的なSFDAベンチマークにおいて,DVDは最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:58:26 GMT)
Benchmarking LLM-Assisted Blue Teaming via Standardized Threat Hunting [11.6] 本稿では,大規模言語モデルをブルーチームで指導するためのベンチマークであるCyberTeamを提案する。
まず、脅威属性からインシデント応答への分析タスク間の依存関係をキャプチャすることで、現実的な脅威追跡をモデル化する。
次に、各タスクは、その特定の分析要求に合わせて調整された一連の運用モジュールを通して対処される。
全体として、CyberTeamは30のタスクと9つの運用モジュールを統合し、標準化された脅威分析を通じてLLMをガイドする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:01:24 GMT)
Agentar-Scale-SQL: Advancing Text-to-SQL through Orchestrated Test-Time Scaling [11.6] 最先端のSOTA (State-of-the-art) テキスト・トゥ・ザ・アーティカルな手法は、BIRDのような計算ベンチマークの挑戦に関して、人間の専門家よりかなり遅れている。
テスト時間のスケーリングを探求する現在のアプローチでは、組織化された戦略が欠如し、モデルの内部推論プロセスを無視しています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:55:56 GMT)
Social and Physical Attributes-Defined Trust Evaluation for Effective Collaborator Selection in Human-Device Coexistence Systems [11.6] 本研究では,標準相関解析によるハイパーグラフ自己教師学習(HSLCCA)手法を提案する。
HSLCCA法は,信頼されたデバイスを効果的に識別する上で,ベースラインアルゴリズムを著しく上回っている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:03:01 GMT)
The Rise of AfricaNLP: Contributions, Contributors, and Community Impact (2005-2025) [11.5] 本研究ではアフリカンNLP(AfricaNLP)の進展について,基礎研究の課題を問う。
我々は,1.9K NLP論文要約,4.9K著者コントリビュータ,および7.8K人による貢献文を用いて,アフリカNLP研究の貢献を定量的に検討した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:19:31 GMT)
Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits [11.5] 不完全情報下でのFriedkin-Johnsen意見力学モデルにおける分極と不一致の最小化の問題について検討する。
ソーシャルメディアプラットフォームに対する定期的な介入を自然に反映したこの新しい設定は、後悔の最小化問題として定式化されている。
本アルゴリズムは, 累積的後悔とランニング時間の両方において, 線形バンディットベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:05:10 GMT)
Breaking the Code: Security Assessment of AI Code Agents Through Systematic Jailbreaking Attacks [11.4] コード対応の大規模言語モデル(LLM)エージェントはソフトウェア工学に組み込まれ、コードを読み、書き、実行することができる。
JAWS-BENCHは、3つのエスカレーションワークスペースにまたがるベンチマークであり、攻撃能力を反映している。
JAWS-0のプロンプトのみの条件下では、コードエージェントは平均して61%の攻撃を受けており、58%が有害、52%がパース、27%がエンドツーエンドで実行される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:38:20 GMT)
Optimal Stopping vs Best-of-$N$ for Inference Time Optimization [11.3] PandoraのBox問題に基づく推論時間最適化のための新しいフレームワークを提案する。
そこで我々は,報酬分布を知らずにいつ生成を止めるかを決定するアルゴリズムを開発した。
この結果から,最適停止理論と推定時間スケーリングの原則的ブリッジが確立された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:25:59 GMT)
Propagating Model Uncertainty through Filtering-based Probabilistic Numerical ODE Solvers [11.3] 本稿では, ODEフィルタと数値次数を組み合わせた新しい手法を提案する。
複数の力学系に対する実験により、結果として生じる不確実性推定が参照解と密接に一致していることが示される。
この結果から,確率的数値法は力学系における数値的およびパラメトリック的不確実性の両方を効果的に定量化できることが示唆された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:40:01 GMT)
Through the Valley: Path to Effective Long CoT Training for Small Language Models [11.3] ロングチェーン・オブ・思想(CoT)の監督は、言語モデルにおける推論を強化する共通の戦略となっている。
私たちはLong CoT Degradationと呼ぶ現象を特定し、小さな言語モデル(SLM)が限られた長いCoTデータでトレーニングされた場合、性能が著しく低下する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:57:08 GMT)
Beyond Needle(s) in the Embodied Haystack: Environment, Architecture, and Training Considerations for Long Context Reasoning [11.2] $infty$-THORは、エンボディドAIにおける長期コンテキスト理解を促進する、長期的なエンボディドタスクのための新しいフレームワークである。
a new embodied QA task, Needle(s) in the Embodied Haystack, (3) long-horizon dataset and benchmark suite。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:51:44 GMT)
Susceptibility of entanglement entropy: a universal indicator of quantum criticality [11.0] 量子系における絡み合いエントロピーの感度の尺度が提案され,その情報源が議論されている。
2つの正確に解けるスピン系に対して、熱力学的臨界性は、大域極大の有限サイズのスケーリングによって直接テクスタイズされることが示されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:49:07 GMT)
Solar PV Installation Potential Assessment on Building Facades Based on Vision and Language Foundation Models [11.0] 本研究では,SF-SPA(Semantic Facade Solar-PV Assessment)を提案する。
このアプローチは、コンプタービジョンと人工知能技術を組み合わせて、視点歪み補正、ファサード要素の意味的理解、PVレイアウト最適化のための空間推論の3つの主要な課題に対処する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:51:28 GMT)
On Estimating the Quantum Tsallis Relative Entropy [10.9] 量子状態間の相対エントロピーは、その識別可能性を定量化する。
任意の定数 $alpha in (0, 1)$ に対して、$alpha$-Tsallis の階数 $r$ の2つの量子状態間の相対エントロピーが推定可能であることを示す。
また、量子$alpha$-Tsallis相対エントロピーと量子ヘルガー距離に関する量子状態の微分可能性問題は、ある状態において$mathsfQSZK$-completeであることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:38:59 GMT)
ThinkBrake: Mitigating Overthinking in Tool Reasoning [10.9] 小さな推論モデル(SRM)は、しばしばツールの使用時に過大評価される。
文境界で/think>を注入/注入するオラクルロールアウトを通じて過剰思考を診断する。
ThinkBrakeは/think>と文境界における現在のトップトークンの間のログ確率のマージンを監視します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:04:57 GMT)
Prosperity before Collapse: How Far Can Off-Policy RL Reach with Stale Data on LLMs? [10.9] 古いデータは、適切に悪用された場合、政治上のデータと同じくらい情報的になり得ることを示す。
重み付けの第2モーメントを制約し, 極端外れ値のみを抑制するM2POを導入する。
M2POは、少なくとも256のモデル更新によってデータが不安定になっても、安定したオフポリシートレーニングを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:48:23 GMT)
EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework [10.6] グループ相対政策最適化(GRPO)は効率を向上するが、探索や訓練の不安定さに悩まされる。
GRPOを3次元に拡張するExploration-Filter-ReplayフレームワークであるEFRameを紹介する。
この統合されたフレームワークは、探索、効率、安定性のバランスをとる、原則化されたトレーニングサイクルを確立します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:28:04 GMT)
On the Adversarial Robustness of Learning-based Conformal Novelty Detection [10.6] AdaDetect を用いた共形ノベルティ検出の対角的ロバスト性について検討した。
以上の結果から,高い検出力を維持しながらFDRを著しく増大させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:29:11 GMT)
Resolving UnderEdit & OverEdit with Iterative & Neighbor-Assisted Model Editing [10.5] 大規模言語モデル(LLM)は下流のタスクに広くデプロイされているが、リトレーニングや微調整によって知識を最新に保つことは、しばしば計算コストがかかる。
モデル編集は、ターゲットとするパラメータのサブセットを更新することで、より効率的な代替手段を提供する。
本稿では,UnderEditを緩和するために連続的な編集を行う反復的モデル編集法と,OverEditの削減のために,編集中に近隣の知識を取り入れた近隣モデル編集法との2つの補完手法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:59:16 GMT)
Explaining novel senses using definition generation with open language models [10.5] AXOLOTL'24共有タスクのデータセットを,説明可能な意味変化モデリングに利用した。
私たちは、最高の提案よりも高いパフォーマンスのオープンソースモデルを微調整し、公開しています。
さらに、エンコーダ-デコーダ定義ジェネレータはデコーダのみのジェネレータと同等に動作することがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:03:53 GMT)
AIReg-Bench: Benchmarking Language Models That Assess AI Regulation Compliance [10.5] AIシステムが所定のAI規則(AIR)に準拠しているかどうかを評価するために、LLM(Large Language Models)の使用に対する関心が高まっている。
最初のベンチマークデータセットであるAIReg-Benchを紹介します。これは、LLMがEU AI Act(AIA)のコンプライアンスをどの程度うまく評価できるかをテストするために設計されたものです。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:33:33 GMT)
Edge Artificial Intelligence: A Systematic Review of Evolution, Taxonomic Frameworks, and Future Horizons [10.5] Edge AIは、インテリジェンスを直接、ネットワークエッジのデバイスに埋め込む。
このレビューでは、Edge AIの進化、現在の状況、今後の方向性を体系的に検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:22:17 GMT)
Hybrid Training for Vision-Language-Action Models [10.5] 本稿では,視覚言語モデルを用いて思考から学習し,関連するパフォーマンス向上の恩恵を受けることができるフレームワークを提案する。
多様な出力のセットを条件付きで予測することを学ぶことで、HyTは推論時の柔軟性をサポートし、モデルが直接アクションを予測するか、思考を生成するか、指示に従うことができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:27:15 GMT)
Benchmarking Machine Learning Models for Fault Classification and Localization in Power System Protection [10.4] 本研究は、EMTデータに基づく電力系統保護における故障分類(FC)と故障局所化(FL)に関する古典的機械学習モデルの比較ベンチマーク研究である。
最高性能のFCモデルは0.992$pm$0.001のF1スコアを獲得し、上位のFLモデルは0.806$pm$0.008のR2スコアに達し、平均処理時間は0.563msとなった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:44:14 GMT)
Auditing Algorithmic Bias in Transformer-Based Trading [10.2] 予測にはトランスフォーマーモデルを用いており、各資産の意思決定への影響を測定するために部分情報分解(PID)に基づくメトリクスを導入している。
まず、モデルがデータのボラティリティを完全に無視し、次に、低周波の価格変動を伴うデータに偏っていることを明らかにする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:20:26 GMT)
Analyzing Latent Concepts in Code Language Models [10.2] グローバルなポストホック解釈可能性フレームワークであるコード概念分析(CoCoA)を提案する。
CoCoAは、コード言語モデルの表現空間における創発的語彙、構文、意味構造を明らかにする。
本稿では,静的解析ツールをベースとした構文アライメントと,プロンプトエンジニアリングによる大規模言語モデルを組み合わせたハイブリッドアノテーションパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:53:21 GMT)
RheOFormer: A generative transformer model for simulation of complex fluids and flows [10.2] レオロジー演算子変換器(RheoFormer, RheOFormer)は、自己注意を利用して複雑な流体の流れの異なる空間的相互作用や特徴を効率的に学習する生成的演算子学習法である。
その結果、RheOFormerは、限られたデータセットで訓練しても、複雑な流体のスカラーとテンソルの非線形力学の両方を正確に学習できることが示されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:49:04 GMT)
Relative-Absolute Fusion: Rethinking Feature Extraction in Image-Based Iterative Method Selection for Solving Sparse Linear Systems [10.2] RAF(Relative-Absolute Fusion)は、画像ベース選択手法を強化するための効率的な特徴抽出手法である。
画像表現を絶対的特徴として対応する数値と相対的特徴として抽出・融合することにより、RAFは包括的行列表現を実現する。
従来の画像ベース選択法よりも5.86%-11.50%高速であるスパース線形系に対して,解時間を0.08s-0.29s削減することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:33:23 GMT)
In-Place Feedback: A New Paradigm for Guiding LLMs in Multi-Turn Reasoning [10.1] LLMの以前の応答を直接編集する新しいインタラクションパラダイムであるin-place feedbackを導入する。
推論集約型ベンチマークの実証評価により、インプレースフィードバックは従来のマルチターンフィードバックよりも優れたパフォーマンスが得られることが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:16:04 GMT)
JEPA-T: Joint-Embedding Predictive Architecture with Text Fusion for Image Generation [10.0] 画像とキャプションを個別の視覚的およびテキスト的トークンに符号化する統合マルチモーダルフレームワークを提案する。
タスク非依存のバックボーンを維持しながら条件付き認知のための特徴予測器のクロスアテンションを組み込んだ。
提案手法は, トークンベースのT2Iにおいて, 遅延アーキテクチャ融合と目的レベルのアライメントを組み合わせることで, コンディショニング強度とバックボーンの汎用性とを効果的にバランスできることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:51:10 GMT)
Oh-A-DINO: Understanding and Enhancing Attribute-Level Information in Self-Supervised Object-Centric Representations [9.9] 自己教師付き視覚モデルとスロットベース表現はエッジ由来の幾何学の同定に優れるが、幾何学的でない表面レベルの手がかりを保存できない。
VAE正則化はコンパクトで不整合なオブジェクト中心の表現を強制し、これらの欠落した属性を復元する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:39:01 GMT)
Faster LLM Inference using DBMS-Inspired Preemption and Cache Replacement Policies [9.9] 本稿ではまず, LLM推論の性能を分析し, LLM推論におけるデータ管理の問題に焦点をあてる。
スケジューリングシステムには,要求のスケジューリングに十分なリソースコストモデルと最適化戦略が欠如していることが判明した。
我々は,LLM推論に適した並列推論要求のコストモデルと新しいキャッシュ置換ポリシーを構築することで,古典的なデータベース手法を適用した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:30:18 GMT)
Exact Coset Sampling for Quantum Lattice Algorithms [9.9] 複雑なGaussian windowcitepchen2024quantumを用いた最近のウィンドウ付きQFT格子アルゴリズムのステップ9において、競合する領域拡張'をシンプルかつ確実に置き換える。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:01:39 GMT)
Intuitions of Machine Learning Researchers about Transfer Learning for Medical Image Classification [9.9] 本研究では,機械学習の実践者がソースデータセットをどのように選択するかを検討する。
この結果から、選択はタスク依存であり、コミュニティプラクティス、データセット特性、計算(データ埋め込み)の影響を受けていることが示唆された。
参加者はしばしば曖昧な用語を使い、より明確な定義とHCIツールの必要性を示唆している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:44:46 GMT)
Guaranteed Noisy CP Tensor Recovery via Riemannian Optimization on the Segre Manifold [9.8] 階数 1 のテンソルの内在幾何学を、回復タスクをセグレ多様体上の最適化問題としてキャストすることで活用する。
RGD は局所的2次収束相を示し,RGN は局所的2次収束相を示し,繰り返しが統計ノイズフロアに近づくと線形に遷移する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:44:52 GMT)
Discovering Communities in Continuous-Time Temporal Networks by Optimizing L-Modularity [9.7] 縦モードの厳密な最適化による動的コミュニティの発見手法であるLAGOを紹介する。
時間的離散化や固いコミュニティの進化を前提とする従来のアプローチとは異なり、LAGOはノードがコミュニティに侵入する正確な瞬間を捉えている。
合成ベンチマークと実世界のデータセットを用いてLAGOを評価し,時間的および位相的コヒーレントなコミュニティを効率的に発見できることを実証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:25:16 GMT)
AGNOMIN - Architecture Agnostic Multi-Label Function Name Prediction [9.7] 本稿では,削除されたバイナリにおける複数ラベル関数名予測の新しい手法AGNOMINを提案する。
AGNOMINはFeature-Enriched Hierarchical Graphs (FEHGs)を構築し、コントロールフローグラフ、ファンクションコールグラフ、動的に学習されたtexttPCode機能を組み合わせた。
我々はAGNOMINを3つのアーキテクチャにわたる9000個のELF実行可能バイナリの包括的データセットで評価し、最先端のアプローチと比較して優れた性能を示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:13:21 GMT)
Enhancing Electricity-System Resilience with Adaptive Robust Optimization and Conformal Uncertainty Characterization [9.5] 極度の天候は電気系統を緊張させており、反応の限界を露呈している。
本稿では, 確率的行動, 対角的破壊, 反応を統合した三段階最適化モデルを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:23:38 GMT)
Mutual information maximizing quantum generative adversarial networks [9.4] InfoQGANは、InfoGANの原理とQGANアーキテクチャを統合する量子古典的ハイブリッド生成対向ネットワークである。
InfoQGANは、量子発生器における頑健な特徴の絡み合いを達成しつつ、モード崩壊を効果的に軽減することを示す。
これらの結果は、NISQ時代の量子生成モデリングを進化させるアプローチとして、InfoQGANの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:41:48 GMT)
A Physics-Inspired Optimizer: Velocity Regularized Adam [9.4] 深層ニューラルネットワークのトレーニングにVelocity-Regularized Adamvolution(VRAdam)を導入する。
VRAdamは、速度に基づいて学習率により高い順序のペナルティを加える。
我々は、AdamWを含む標準凸に対してVRAdamが性能を上回ることを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:53:20 GMT)
On Effective Semantic Translation for Code: A Study Based on Pseudocode [9.4] Pseudocodeベースの翻訳は、まずプログラムの意図とロジックを擬似コードに解釈することで、人間の意味翻訳をエミュレートする。
擬似コードに基づく翻訳は、直接翻訳に苦労するプログラムを翻訳するのに役立ちます。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:58:19 GMT)
A theoretical framework for M-posteriors: frequentist guarantees and robustness properties [9.2] 本研究は,M-posteriorがM-estimation Losとそれ以前の軽度条件下で一貫した分布を示す。
M推定器を中心とした正規分布の周囲の確率におけるM後契約は、頻繁なロバスト性を示す。
我々は, 後部影響関数の新たな特徴と, 後部分布に適応したブレークポイントの新たな定義により, M後部特性を定式化する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:37:05 GMT)
Toward a Robust R2D2 Paradigm for Radio-interferometric Imaging: Revisiting Deep Neural Network Training and Architecture [9.1] R2D2 Deep Neural Network (DNN)シリーズは、最近、電波干渉計における画像形成のために導入された。
シリーズ収束、トレーニング手法、DNNアーキテクチャの観点からR2D2を再考する。
残差がノイズと互換性がある場合、再構成プロセスが停止する収束基準を導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:33:24 GMT)
Generalized Time-Coarse Graining via an Operator Cumulant Expansion [9.0] 任意の時間依存ジェネレータから有効動力学を導出するための一般的なフレームワークを提案する。
我々の方法は、線型作用素によって生成される任意の力学 – ハミルトン的、そうでない、量子的、古典的、開、閉である – と互換性がある。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:52:10 GMT)
TAG-EQA: Text-And-Graph for Event Question Answering via Structured Prompting Strategies [8.9] TAG-EQA(Text-And-Graph for Event Question Answering)は、構造化関係を自然言語文に変換することで、因果イベントグラフを入力に注入するプロンプトフレームワークである。
TORQUESTRAベンチマークでは、TAG-EQAはテキストのみのベースラインよりも平均で5%精度が向上し、ゼロショット設定では最大12%、グラフ拡張CoTプロンプトが有効であれば18%向上する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:23:41 GMT)
Instant4D: 4D Gaussian Splatting in Minutes [8.9] Instant4Dは、キャリブレーションされたカメラや奥行きセンサーを使わずに、数分でカジュアルな映像シーケンスを処理できる単分子再構成システムである。
我々の設計は、幾何学的整合性を保ちながら冗長性を著しく低減し、モデルのサイズを元のフットプリントの10%以下に削減する。
提案手法は,Dycheckデータセット上で10分以内に,あるいは一般的な200フレームのビデオに対して,単一のビデオを再構成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:07:21 GMT)
A Likelihood Based Approach to Distribution Regression Using Conditional Deep Generative Models [8.9] 本研究では,条件付き深部生成モデルの推定のための可能性に基づくアプローチの大規模サンプル特性について検討する。
その結果,条件分布を推定するための最大極大推定器の収束率を導いた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:35:20 GMT)
Fine-tuning with RAG for Improving LLM Learning of New Skills [8.8] 大規模言語モデル(LLM)エージェントは予測可能な方法で頻繁に失敗する。
本稿では,推論時間検索を蒸留による学習能力に変換する単純なパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:03:48 GMT)
QUASAR: Quantum Assembly Code Generation Using Tool-Augmented LLMs via Agentic RL [8.8] 大規模言語モデル(LLM)に基づく量子回路生成は有望な自動解法として登場した。
本稿では,量子回路生成と最適化のためのエージェント強化学習フレームワークであるQUISARを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:40:04 GMT)
ModernVBERT: Towards Smaller Visual Document Retrievers [8.8] ModernVBERTはコンパクトな視覚言語エンコーダで、文書検索タスクで微調整された場合、最大10倍のモデルで性能が向上する。
我々は、注目マスキング、画像解像度、モダリティアライメントデータレギュレーション、および中心的なパフォーマンス要因として出現する相対的な目標を中心とする遅延相互作用の影響を計測する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:41:17 GMT)
TubeDAgger: Reducing the Number of Expert Interventions with Stochastic Reach-Tubes [8.6] DAggerアルゴリズムは、環境とのインタラクションとネットワークの再トレーニングを交互に行い、堅牢な初心者ポリシーを訓練する。
本稿では,専門家の介入の必要性を推定するための新しい手法として,リーチチューブの利用を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:45:16 GMT)
EVALOOOP: A Self-Consistency-Centered Framework for Assessing Large Language Model Robustness in Programming [8.5] EVALOOOPは自己整合性の観点から堅牢性を評価するアセスメントフレームワークである。
MBPP Plusベンチマークで96の人気のある大言語モデル(LLM)を評価した。
EVALOOOPは10ループでパス@1の精度を2.65%-47.62%低下させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:28:54 GMT)
Automated Evaluation can Distinguish the Good and Bad AI Responses to Patient Questions about Hospitalization [8.5] AIレスポンスを評価するための現在のゴールドスタンダードは、労働集約的で遅い。
評価手法に関する大規模な体系的研究を行った。
この結果は,AIシステムの比較評価を,慎重に設計した自動評価が拡張可能であることを示唆している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:39:37 GMT)
Mapping Overlaps in Benchmarks through Perplexity in the Wild [8.3] 我々は,大規模言語モデル(LLM)ベンチマークとその意味的な重複を特徴付けるために,キャパシティ親しみやすさのシグネチャを開発する。
本分析は,ベンチマーク質問の意味的類似性とモデル性能の相関性の両方に関して,シグネチャを定式化したものである。
最終的には、論理、数学、言語、命令追従、世界モデリングにまたがるクロスファンクショナルオーバーラップを識別し、コーディングが最重複の少ないドメインとして現れます。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:19:41 GMT)
From latent factors to language: a user study on LLM-generated explanations for an inherently interpretable matrix-based recommender system [8.3] 大規模言語モデル(LLM)が数学的に解釈可能なレコメンデーションモデルから,効果的なユーザ向け説明を生成できるかどうかを検討する。
本研究は,5次元にわたる説明の質を評価する326人の被験者を対象に実施した。
分析の結果、全ての説明型は概ね好意的であり、戦略間の統計的差異は緩やかであることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:49:58 GMT)
Training-Free Data Assimilation with GenCast [8.2] 本研究では,力学系をエミュレートするために事前学習した拡散モデルを用いて,データ同化を行う軽量で汎用的な手法を提案する。
本手法は,データ同化アルゴリズムのクラスである粒子フィルタ上に構築されており,それ以上の訓練は不要である。
我々は,グローバルアンサンブル天気予報を生成する拡散モデルであるGenCastの方法論について述べる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:31:26 GMT)
Progressive Weight Loading: Accelerating Initial Inference and Gradually Boosting Performance on Resource-Constrained Environments [8.0] プログレッシブウェイトローディング(Progressive Weight Loading, PWL)は、最初は軽量の学生モデルをデプロイし、次にその層を事前訓練された教師モデルに置き換えることで、高速な初期推論を可能にする技術である。
VGG, ResNet, ViT アーキテクチャに関する実験により,PWL で訓練されたモデルは,教師層がロードされるにつれて,競争蒸留性能を維持し,徐々に精度を向上することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:53:12 GMT)
Uncovering the Computational Ingredients of Human-Like Representations in LLMs [8.0] 人のような表現を発達させるモデルを構築する上で、これらの材料のうちどれが最も重要なのかは、いまだに不明である。
現在のベンチマークのほとんどは、人間とモデルの間の表現的アライメントの測定には適していない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:37:19 GMT)
Maven-Lockfile: High Integrity Rebuild of Past Java Releases [8.0] MavenはJavaエコシステムにおいて最も重要なパッケージマネージャの1つです。
Maven-Lockfileを使ってロックファイルの生成と更新を行い、過去のバージョンからのプロジェクトの再構築をサポートしています。
評価の結果、Maven-Lockfileは過去のコミットからビルドを再現でき、改ざんされたアーティファクトを検出できることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:14:32 GMT)
PRPO: Paragraph-level Policy Optimization for Vision-Language Deepfake Detection [7.9] 本稿では,ディープフェイク検出のための推論注釈付きデータセットを導入し,ディープフェイク検出のための強化学習アルゴリズムを提案する。
実験の結果、PRPOは検出精度を広いマージンで改善し、推論スコアが4.55/5.0であることがわかった。
これらの結果は、より信頼性が高く、解釈可能なディープフェイク検出を可能にするために、視覚的エビデンスにおけるマルチモーダル推論の基盤となることの重要性を強調している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:27:21 GMT)
Knowledge-guided machine learning for county-level corn yield prediction under drought [7.8] リモートセンシング(RS)技術は、広範囲の地上観測を非接触で取得することを可能にし、収穫量の予測に有用なツールである。
従来のプロセスベースのモデルは、大量のRSデータを組み込むのに苦労している。
機械学習(ML)モデルは、その限定的な解釈可能性のため、しばしば「ブラックボックス」として批判される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:53:56 GMT)
Rehearsal-free and Task-free Online Continual Learning With Contrastive Prompt [7.8] オンライン連続学習(OCL)は、最も難しい連続学習シナリオの1つである。
本研究は, サンプルを保存せず, タスク境界やアイデンティティを使わずに, 破滅的な忘れを効果的に取り組んだ。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:39:29 GMT)
Evaluating New AI Cell Foundation Models on Challenging Kidney Pathology Cases Unaddressed by Previous Foundation Models [7.8] 正確な細胞核のセグメンテーションは、腎病理における下流のタスクに重要である。
我々は、2024年以前に開発された3つの広く使われている細胞基盤モデルに対して、高度なAI細胞基盤モデルをベンチマークした。
CellViT++ [Virchow] は,2,091個の試行錯誤サンプルに対して "Good" と評価された40.3%の予測で,スタンドアローンのパフォーマンスが最も高い。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:38:36 GMT)
AortaDiff: A Unified Multitask Diffusion Framework For Contrast-Free AAA Imaging [7.8] 非コントラストCTスキャンから合成CECT画像を生成する統合ディープラーニングフレームワークを提案する。
本研究では,条件拡散モデル(CDM)とマルチタスク学習を統合し,画像合成と解剖学的セグメンテーションのエンドツーエンド共同最適化を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:19:27 GMT)
RoVerFly: Robust and Versatile Implicit Hybrid Control of Quadrotor-Payload Systems [7.8] RoVerFlyは、四辺形軌道追跡のための学習ベースの制御フレームワークである。
明示的なモード検出やコントローラの切り替えなしに複雑なダイナミクスを管理する。
ペイロード設定間で強力なゼロショットの一般化を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:47:23 GMT)
Online Non-convex Optimization with Long-term Non-convex Constraints [7.7] 一般の長期制約最適化問題をオンライン手法で解くために,新しいFollow-the-Perturbed-Leader型アルゴリズムを提案し,解析した。
提案手法は,長期制約のある情報源同定問題に対処し,理論結果の検証を行い,既存手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:17:35 GMT)
Feature Identification for Hierarchical Contrastive Learning [7.7] 本稿では,2つの新しい階層型コントラスト学習法を提案する。
提案手法は,階層レベルのクラス間関係と不均衡なクラス分布を明示的にモデル化する。
提案手法は,線形評価における最先端性能を実現し,既存の階層的コントラスト学習法を精度で2ポイント向上させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:46:47 GMT)
Fine-Tuning Jailbreaks under Highly Constrained Black-Box Settings: A Three-Pronged Approach [7.6] 我々は,データセットのみのブラックボックスファインチューニングインタフェースの下で,プロバイダの防御に対する3段階のジェイルブレイク攻撃を示す。
我々の攻撃には、安全スタイルの接頭辞/接尾辞ラッパー、敏感なトークンの良質な語彙エンコーディング(アンダースコーディング)、バックドア機構が組み合わされている。
実世界の展開において,本手法はOpenAIプラットフォーム上でGPT-4.1とGPT-4oをジェイルブレークし,攻撃成功率は両モデルともに97%以上である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:14:13 GMT)
Diagnosing Shortcut-Induced Rigidity in Continual Learning: The Einstellung Rigidity Index (ERI) [7.6] ショートカット機能は、分散シフト時の堅牢性を損なうとともに、信頼性を低下させる。
連続学習(CL)では、ショートカットによる搾取の結果が持続し、強化される。
CLでは、ショートカットによって引き起こされる剛性は、新規なものの獲得を阻害する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:52:40 GMT)
Combining complex Langevin dynamics with score-based and energy-based diffusion models [7.6] 生成AIでは、拡散モデルはデータから分布やログデリバティブを学習することができる。
複雑なランゲヴィン過程によってサンプリングされた分布を拡散モデルで学習する能力について検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:00:34 GMT)
Image-Difficulty-Aware Evaluation of Super-Resolution Models [7.5] 本稿では,SISRモデルの差別化を図るため,性能評価手法を提案する。
本稿では,これらのテスト画像を予測するために,高頻度指数と回転不変エッジ指数という2つの画像差分尺度を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:39:16 GMT)
Encoder Circuit Optimization for Non-Binary Quantum Error Correction Codes in Prime Dimensions: An Algorithmic Framework [7.5] 本稿では,素次元安定化器符号に対してエンコーダ回路を最適化するための体系的枠組みを提案する。
本手法が鍵符号に対して有効であることを示し,エンコーダ回路ゲート数の13~44%削減を実現した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:46:48 GMT)
RealClass: A Framework for Classroom Speech Simulation with Public Datasets and Game Engines [7.5] 本稿では,ゲームエンジンを用いた教室騒音と室内インパルス応答(RIR)コーパスの合成手法を提案する。
本稿では、合成された教室ノイズコーパスと、公開されているコーパスからコンパイルされた教室音声データセットを組み合わせたデータセットであるRealClassを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:04:51 GMT)
Articulation-Informed ASR: Integrating Articulatory Features into ASR via Auxiliary Speech Inversion and Cross-Attention Fusion [7.5] 我々は深層学習の時代に音声情報を再考する。
本稿では,音声認識モデルに対する補助的タスクと擬似インプットの両方として,調音表現を利用するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:07:29 GMT)
ATAS: Any-to-Any Self-Distillation for Enhanced Open-Vocabulary Dense Prediction [7.4] Any-to-Any Self-Distillation (ATAS)は、セマンティックコヒーレンスときめ細かいアライメントを同時に強化する新しいアプローチである。
ATASはオープン語彙オブジェクト検出とセマンティックセグメンテーションのベンチマークでかなりの性能向上を達成した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:34:36 GMT)
Poisson Midpoint Method for Log Concave Sampling: Beyond the Strong Error Lower Bounds [7.4] 過度に損傷/破壊されたランゲヴィン力学の中間点離散化を用いた$mathbbRd$上の強対数分布からのサンプリング問題について検討する。
2-ワッサーシュタイン距離(W$)における収束性を証明し、オイラー・丸山離散化に対する目標精度(epsilon$)に依存して立方体スピードアップを達成する。
特に、アンダーダムングランゲヴィン力学の場合、$W$収束の複雑さは$L2$の収束の複雑さの下限よりもはるかに小さいことを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:30:51 GMT)
Proper Theory of Magnon Orbital Angular Momentum [7.3] 電荷のないボソンの軌道運動は、電子の軌道運動とは異なり、磁気モーメントを発生しない。
有限温度でマグノン軌道角運動量(OAM)の適切な理論を定式化する。
ジアロシンスキー-モリヤ相互作用は強磁性および反強磁性の基底状態において大きなマグノンOAMを誘導することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:55:50 GMT)
CultranAI at PalmX 2025: Data Augmentation for Cultural Knowledge Representation [7.1] 我々のシステムであるCultranAIは、アラビア文化知識表現のための大規模言語モデル(LLM)のデータの増大とLoRA微調整に焦点を当てた。
タスクの最高の性能モデルを特定するために、いくつかのLCMをベンチマークした。
実験の結果,Fanar-1-9B-Instructモデルが最も高い性能を示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:29:27 GMT)
Commmunication-Efficient and Accurate Approach for Aggregation in Federated Low-Rank Adaptation [7.1] 現在のフェデレート低ランク適応(FedLoRA)メソッドは、不正確な更新のために顕著な課題に直面している。
textbfFederated textbfLow-textbfRank textbfAggregation with textbfNearly textbfAccurate Estimation (FLoRA-NA)を提案する。
FLoRA-NAは、局所的なパーソナライゼーションとグローバルな一般化のギャップを埋め、以前のパーソナライズされたFedLoRAアプローチの重要な制限に対処する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:20:03 GMT)
Latent Collective Preference Optimization: A General Framework for Robust LLM Alignment [7.1] 雑音データから潜在集団コンセンサスを学習するためにLCPO(Latent Collective Preference Optimization)を導入する。
本実験はLCPOの汎用フレームワークとしての有効性を実証し、4つの最先端アライメントアルゴリズムを一貫して強化した。
Mistral と Llama 3 モデルに適用すると、LCPO を拡張した手法は AlpacaEval 2 と Arena-Hard でかなりの利得を達成し、両方のベンチマークで最大 7.0 % 改善した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:46:49 GMT)
Fully Heteroscedastic Count Regression with Deep Double Poisson Networks [7.0] Deep Double Poisson Network (DDPN) はニューラル・離散カウント回帰モデルである。
DDPNはヘテロセダスティックガウスモデルと同様の頑健な回帰特性を示す。
多様なデータセットの実験では、DDPNが現在のベースラインを精度、キャリブレーション、アウト・オブ・ディストリビューション検出で上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:21:19 GMT)
Comparative Field Deployment of Reinforcement Learning and Model Predictive Control for Residential HVAC [6.8] 強化学習(Reinforcement Learning)は、自動化と適応性の向上を約束するが、現実の住宅環境における実践的応用は、ほとんど実証されていない。
実験の結果,RLは工学的オーバーヘッドを低減させるが,モデル精度と運用上の堅牢性において,実用的なトレードオフをもたらすことがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:36:04 GMT)
Expandable Decision-Making States for Multi-Agent Deep Reinforcement Learning in Soccer Tactical Analysis [6.8] サッカーなどの侵入チームスポーツは、多くの選手が共有フィールドで相互作用するときに、高次元で強く結合された状態空間を作り出す。
従来のルールに基づく分析は直感的であるが、現代の予測機械学習モデルは明示的なエージェント表現なしでパターンマッチングを行うことが多い。
本稿では,関係変数による原位置と速度を増大させる意味的にリッチな状態表現である拡張可能意思決定状態(EDMS)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:01:51 GMT)
Breaking the Euclidean Barrier: Hyperboloid-Based Biological Sequence Analysis [6.8] ゲノム配列解析は、様々な科学的・医学的な領域において重要な役割を担っている。
伝統的な機械学習アプローチは、高次元ユークリッド空間で作業する場合、しばしば複雑な関係やシーケンスデータの階層構造を捉えるのに苦労する。
本研究では,生物配列の特徴表現をハイパーボロイド空間に変換する手法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:04:21 GMT)
How Does the Pretraining Distribution Shape In-Context Learning? Task Selection, Generalization, and Robustness [6.7] 計算課題における事前学習分布形状 ICL の統計的特性について述べる。
我々は,タスク選択と一般化を統一し,先行結果を拡張・短縮する理論的枠組みを開発する。
次に、課題タスクの事前学習分布によって、ICLの性能がどのように変化するかを実証的に研究する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:52:29 GMT)
ViLBias: Detecting and Reasoning about Bias in Multimodal Content [6.7] ViLBiasは、マルチモーダルニュースにおけるバイアスの検出と推論のためのフレームワークである。
データセットは40,945のテキストペアで構成されている。
その結果,テキストによる画像の検出精度は3~5%向上した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:49:54 GMT)
Data Quality Challenges in Retrieval-Augmented Generation [6.6] Retrieval-Augmented Generation (RAG)は、企業固有の知識を持つ大規模言語モデルを強化する。
現在のデータ品質(DQ)フレームワークは主に静的データセット用に開発されており、RAGシステムの動的で多段階的な性質に十分対応していない。
この研究は、この新しいタイプのAIベースのシステムのためのDQ次元を開発することを目的としている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:13:40 GMT)
Towards Verifiable Federated Unlearning: Framework, Challenges, and The Road Ahead [6.5] フェデレーション・アンラーニング(FUL)は、分散クライアント間でトレーニングされたモデルからデータの影響を取り除くことを可能にする。
この記事では、検証エンティティ、目標、アプローチ、メトリクスを形式化する検証FULの参照フレームワークであるVeriFULを紹介します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:45:46 GMT)
Graphon Particle Systems, Part II: Dynamics of Distributed Stochastic Continuum Optimization [6.5] ノード連続体を持つグラフオン上での分散最適化問題について検討する。
グラノン上での勾配降下と勾配追従アルゴリズムを提案する。
時間変化アルゴリズムを適切に選択することにより、すべてのノードの状態が接続されたグラフに対して$mathcalLinfty$-consensusを達成することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:22:00 GMT)
Assumption-Lean Post-Integrated Inference with Surrogate Control Outcomes [6.4] 制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
我々は、予測された直接効果推定に関する半パラメトリック推論を開発し、隠された仲介者、共同設立者、モデレーターを考慮に入れた。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:10:01 GMT)
Minimax and Bayes Optimal Best-Arm Identification [6.4] サンプリングフェーズとレコメンデーションフェーズからなる適応的な手順を検討する。
提案した戦略では,サンプリングフェーズは2段階で構成され,第1段階はパイロットフェーズであり,各アームを等比で均一に割り当てる。
サンプリングフェーズの後、推奨フェーズに入り、最も高いサンプル平均の腕をベストアームの推定値として選択する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:11:29 GMT)
SeMoBridge: Semantic Modality Bridge for Efficient Few-Shot Adaptation of CLIP [6.4] 私たちはSeMoBridgeを紹介します。これは軽量でパワフルなアプローチで、このミスアライメントに直接対処します。
本手法は,セマンティック・モダリティ・ブリッジ (Semantic Modality Bridge) と呼ばれるものを通して,画像のセマンティック・モダリティを保ちながら,画像をテキスト・モダリティにマッピングする。
実験によると、トレーニングされたバージョンであるSeMoBridge-Tは、トレーニング時間のごく一部しか必要とせず、全体として他のメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:18:57 GMT)
Coupling Magnons to an Opto-Electronic Parametric Oscillator [6.4] 我々は、コヒーレントマグノン現象における長距離結合と非線形性を研究するための新しいハイブリッドプラットフォームを導入する。
本結果は,コヒーレントマグノニクス現象における長距離結合と非線形性を研究するための,新しいハイブリッドプラットフォームを構築した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:18:49 GMT)
Agent Fine-tuning through Distillation for Domain-specific LLMs in Microdomains [6.3] エージェント型大規模言語モデル (LLM) は, 外部環境との自律的対話において注目されている。
本稿では,日立のJP1マイクロドメインにおけるドメイン適応のためのエージェント微調整について検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:04:53 GMT)
Equivariant Geometric Scattering Networks via Vector Diffusion Wavelets [6.2] 本稿では,スカラーおよびベクトルノード特徴を含む幾何グラフに対する幾何散乱変換の新たなバージョンを提案する。
我々は、同変散乱に基づくGNNが、パラメータカウントのごく一部で、他の同変メッセージパスベースのGNNと同等の性能を達成することを実証的に示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:28:45 GMT)
NL2Plan: Robust LLM-Driven Planning from Minimal Text Descriptions [6.2] NL2Planは、最小限の自然言語記述から完全なPDDLタスクを生成する最初の完全自動システムである。
我々は,NL2Planを7つの計画領域で評価するが,そのうち5つは新規であり,LLMトレーニングデータには含まれない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:14:50 GMT)
Virtual Fashion Photo-Shoots: Building a Large-Scale Garment-Lookbook Dataset [6.2] 本稿では,仮想的なファッション写真撮影の課題を紹介する。
我々は,eコマースとファッションメディアのギャップを埋めて,衣料品見本ペアの最初の大規模データセットを構築した。
このデータセットは、カタログスタイルの生成を超えて、創造性、雰囲気、ストーリーテリングを反映したファッションイメージに向かうモデルの基礎を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:05:05 GMT)
MEMTRACK: Evaluating Long-Term Memory and State Tracking in Multi-Platform Dynamic Agent Environments [6.1] MEMTRACKは、マルチプラットフォームエージェント環境における長期記憶と状態追跡を評価するために設計されたベンチマークである。
それぞれのベンチマークインスタンスは、ノイズ、競合、相互参照情報を備えた、時系列的にプラットフォームインターリーブされたタイムラインを提供する。
ベンチマークでは、取得、選択、競合解決などのメモリ機能をテストしています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:34:03 GMT)
Carbon-Aware Orchestration of Integrated Satellite Aerial Terrestrial Networks via Digital Twin [6.1] 衛星航空地上ネットワーク(ISATN)は6Gのキーイネーブラーとして想定されている。
この研究は、ISATNのための炭素を意識したオーケストレーションフレームワークを提案することで、エネルギーを意識した以前の研究を前進させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:49:42 GMT)
EvoStruggle: A Dataset Capturing the Evolution of Struggle across Activities and Skill Levels [6.0] 我々は、61.68時間のビデオ録画、2,793ビデオ、5,385の注釈付き時間的闘争セグメントを含む、闘争決定のためのデータセットを収集した。
データセットには、結び目、折り紙、タングラムパズル、シャッフルカードの4つのアクティビティにグループ化された18のタスクが含まれている。
我々は、闘争決定問題を時間的行動ローカライズタスクとして定義し、開始時間と終了時間による闘争セグメントの特定と正確な位置決めに焦点をあてる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:41:10 GMT)
NeuroTTT: Bridging Pretraining-Downstream Task Misalignment in EEG Foundation Models via Test-Time Training [6.0] 本稿では,脳波基礎モデルのための2段階アライメント戦略を提案する。
まず,ドメイン固有の自己教師型微調整パラダイムであるNeuroTTTを提案する。
第2に、未ラベルのテストサンプルの自己教師型テストタイムトレーニングを行う。
我々のアプローチは、大規模なEEG基盤モデルにおけるテストタイムトレーニングとドメインチューニングされたセルフスーパービジョンを統合する最初の方法です。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:07:17 GMT)
CodeGenLink: A Tool to Find the Likely Origin and License of Automatically Generated Code [6.0] CodeGenLinkは、Visual Studio Code用のGitHub CoPilotエクステンションである。
大規模言語モデルとWeb検索機能を組み合わせた候補リンクを検索する。
生成されたコードと検索されたコード間の類似性解析を行う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:21:13 GMT)
Economic Competition, EU Regulation, and Executive Orders: A Framework for Discussing AI Policy Implications in CS Courses [5.9] コンピュータ科学のカリキュラムには、AI政策の意義に関する議論がまだ存在しないと論じる。
技術的および非技術的(倫理的)CSコースにおけるAI政策に関するクラス議論の枠組化のための指導的質問を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:49:32 GMT)
Automatic Speech Recognition (ASR) for African Low-Resource Languages: A Systematic Literature Review [5.9] この体系的な文献レビューはアフリカ言語のためのASRの研究を探求する。
我々は2,062のレコードのうち71をスクリーニングし、111言語にまたがる合計74のデータセットを記録しました。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:36:06 GMT)
Unveiling Interesting Insights: Monte Carlo Tree Search for Knowledge Discovery [5.8] 我々はAIDE(Automated Insights and Data Exploration)の新しい手法を提案する。
AIDE は Monte Carlo Tree Search (MCTS) を用いて,課題に対処するための堅牢な基盤として機能する。
実世界のデータと合成データの両方を用いてAIDを評価し,データ変換と興味深いデータパターンを明らかにするモデルの有効性を実証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:25:15 GMT)
A first-order method for constrained nonconvex--nonconcave minimax problems under a local Kurdyka-Łojasiewicz condition [5.8] 我々は、内部が潜在的に複雑な制約を伴う制約付き非コンケーブミニマックス問題の研究を行う。
元の問題の最大関数は局所的なH"古い性質の滑らかさを楽しむことを示す。
本稿では,制約付き最適化問題の解法を提案し,その収束性を局所KL条件下で確立する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:54:27 GMT)
Synthetic Census Data Generation via Multidimensional Multiset Sum [5.8] 我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。
我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:10:22 GMT)
MetaSynth: Multi-Agent Metadata Generation from Implicit Feedback in Black-Box Systems [5.8] 暗黙的な検索フィードバックから学習する検索拡張生成フレームワークであるMeta Synthを紹介する。
プロプライエタリなeコマースデータとAmazon Reviewsコーパスの両方で、Meta Synthは、NDCG、MRR、ランキングメトリクスで強力なベースラインを上回ります。
この研究は暗黙の信号を用いたブラックボックスシステムにおけるコンテンツを最適化するための一般的なパラダイムに寄与する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:41:39 GMT)
Secure and reversible face anonymization with diffusion models [5.7] コンピュータビジョンアルゴリズムによって処理された顔画像には、悪意あるアクターが同意なしにキャプチャできる機密性の高い個人情報が含まれている。
現在の手法では、高品質な画像生成と、後続の人物認証の可逆性を備えたセキュアなスキーム間の良好なトレードオフを提案するのに苦労している。
我々は,拡散モデルに基づく最初のセキュアで高品質な可逆匿名化手法を紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:37:20 GMT)
Understanding Sensitivity of Differential Attention through the Lens of Adversarial Robustness [5.7] 差分注意(DA)は、標準的注意を喚起するための改良として提案されている。
DAは対向性摂動下での構造的不安定性を示す。
ViT/DiffViTの系統実験と事前学習したCLIP/DiffCLIPの評価により,このFragile原則を実証的に検証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:01:39 GMT)
Make a Video Call with LLM: A Measurement Campaign over Five Mainstream Apps [5.7] 2025年、Large Language Model Servicesは、リアルタイムビデオ通信(RTC)を通じてAIエージェントと対話可能な、AIビデオチャットという新機能をローンチした。
既存のAIビデオチャットシステムの性能について、体系的な研究は行われていない。
本稿では, 品質, レイテンシ, 内部機構, システムオーバーヘッドの4次元にわたるメトリクスを慎重に設計した総合ベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:03:51 GMT)
Toward Safer Diffusion Language Models: Discovery and Mitigation of Priming Vulnerability [5.7] 拡散言語モデル (DLMs) は反復的 denoising を通じてトークンを並列に生成する。
本稿では, DLM が反復的 denoising プロセスから生じる致命的な脆弱性を明らかにする。
汚染された中間状態から安全な応答を生成するためにモデルを訓練するDLMに適した新しい安全アライメント手法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:35:23 GMT)
Strategic Fusion of Vision Language Models: Shapley-Credited Context-Aware Dawid-Skene for Multi-Label Tasks in Autonomous Driving [5.5] 大規模視覚言語モデル(VLM)は、自律車載スタックでの使用が増えているが、幻覚によって安全クリティカルパイプラインの信頼性が制限されている。
本稿では,エゴビュー・ダシュカムビデオのマルチラベル理解のためのゲーム理論融合法である,Shapley-credited Context-Aware Dawid-Skene with Agreementを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:14:11 GMT)
CarbonX: An Open-Source Tool for Computational Decarbonization Using Time Series Foundation Models [5.5] CarbonXは、炭素強度の予測と計算のためのオープンソースのツールである。
平均絶対パーセンテージ誤差(MAPE)は世界214のグリッドで15.82%とゼロショットで予測されている。
13のベンチマークグリッドで、CarbonXのパフォーマンスは現在の最先端に匹敵する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:36:11 GMT)
Curriculum Imitation Learning of Distributed Multi-Robot Policies [5.4] マルチロボットシステムの学習制御ポリシは,長期的調整と現実的なトレーニングデータ取得の難しさから,大きな課題である。
そこで本研究では,訓練中の専門的軌跡の長さを徐々に増加させるカリキュラム戦略を提案する。
また,各ロボットの自我中心的知覚を,第三者によるグローバルなデモンストレーションのみを用いて近似する手法も導入した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:05:59 GMT)
Embedding Sustainability in Software Engineering Curriculum: A Case Study [5.4] 本稿では,ある大学におけるソフトウェア・エンジニアリング・プログラムにおいて,サステナビリティがモジュール全体にどのように組み込まれているかを検討するケーススタディについて報告する。
本論文は,サステナビリティ・アウェアネス・フレームワーク(Sustainability Awareness Framework)の5次元に則って,学者と学生が統合の機会を同一視する過程を概説する。
このような統合は、変化する社会における持続可能性に敏感なプロフェッショナルとして、ソフトウェア工学の卒業生を準備するための必要かつ緊急のステップである、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:06:13 GMT)
Optimal placement of wind farms via quantile constraint learning [5.4] 風力発電所は、特定の地域内の複数の風力発電所のサイズと場所を配置する。
確率論的ニューラルネットワークを代理として使用し、風速の相関を考慮に入れます。
電気生産の条件量子化は、第2段階における配置決定とみなされる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:38:56 GMT)
Mode Selection in Quantum Nonlinear Optics Using Optical Resonators [5.3] 非線形プロセスにおけるモードセレクタとしての光共振器の新しい応用について述べる。
まず,共振器による自発的なダウンコンバージョンにより,デコリレーションと波長の柔軟性を向上したスペクトル非相関光子対を生成できることを示す。
次に,高分解能時間モード選択性と正確なスペクトル制御を有する量子パルスゲートを実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:10:45 GMT)
OTTER: Open-Tagging via Text-Image Representation for Multi-modal Understanding [5.3] OTTERはオープンセットのマルチラベルタグフレームワークである。
キュレートされた事前定義されたカテゴリセットの安定性と、ユーザ主導のオープンタグの適合性を調和させる。
OTTERは、2つのベンチマークデータセットの競合ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:31:19 GMT)
Gauges and Accelerated Optimization over Smooth and/or Strongly Convex Sets [5.3] 我々は、滑らかかつ/または強い凸集合上で定義される実現可能性および制約付き最適化問題を考察する。
これらの設定において,新しい拡張性,プロジェクションフリー,アクセラレーションファーストオーダー手法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:47:55 GMT)
Adversarial Attacks to Latent Representations of Distributed Neural Networks in Split Computing [5.2] 分散ディープニューラルネットワーク(DNN)は、モバイルデバイスの計算負担を低減し、エッジコンピューティングシナリオにおけるエンドツーエンドの推論レイテンシを低減することが示されている。
本稿では,分散DNNの対戦行動に対するロバスト性を厳格に分析することにより,既存の研究ギャップを埋める。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:10:54 GMT)
Speak to a Protein: An Interactive Multimodal Co-Scientist for Protein Analysis [5.2] emphSpeak to a protein(タンパク質に話しかける)は、タンパク質分析を専門家の科学者との対話的なマルチモーダルな対話に変える。
AIシステムは、関連する文献、構造、およびリガンドデータを検索し、合成する。
答えはライブの3Dシーンで表示され、ハイライト、注釈付け、操作、視覚化を見ることができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:12:34 GMT)
Lower Bounds for Learning Hamiltonians from Time Evolution [5.1] 我々はハミルトニアンを時間進化から学ぶことの問題を考察する。
逆時間分解能を持つ任意の学習アルゴリズムは、超ポリノミカルな全進化時間を必要とすることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:18:46 GMT)
Quantum Lego and XP Stabilizer Codes [5.1] 量子レゴ(Quantum Lego)は、安定化器群が一般に非アベリア系であるXP安定化器符号に適用される。
演算子マッチングの考え方がそのような符号を保ち続けており、結果の符号が XP であれば、すべての XP 対称性を生成するのに十分であることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:19:22 GMT)
Robust Rydberg facilitation via rapid adiabatic passage [5.0] 本稿では,急速断熱路に基づくRydbergアンチブロッカドのロバストな実装を提案し,解析する。
1次元アレイと2次元アレイの両方で自然に雪崩励起成長を生じさせることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:48:29 GMT)
SCOPED: Score-Curvature Out-of-distribution Proximity Evaluator for Diffusion [5.0] アウト・オブ・ディストリビューション(OOD)検出は、視覚、ロボット工学、強化学習などにおける機械学習システムの信頼性の高い展開に不可欠である。
SCOPED(Score-Curvature Out-of-distribution Proximity Evaluator for Diffusion)を紹介する。
SCOPEDは、多様なデータセットでトレーニングされた単一の拡散モデルから計算され、モデルのスコア関数のジャコビアントレースと2乗ノルムを単一のテスト統計量に結合する。
4つのビジョンベンチマークでは、SCOPEDは計算コストの低いにもかかわらず、競合または最先端の精度リコールスコアを達成している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:54:49 GMT)
Scheme for braiding Majorana zero modes in vortices using an STT-matrix [5.0] トポロジカル量子計算を約束するマヨラナゼロモード(MZM)は、自然に超伝導渦にホストされている。
本研究は, スピン伝達トルク(STT)のプログラム可能な行列を用いた新しい制動方式を提案し, 数値的に実証する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:05:06 GMT)
Multidimensional Bayesian Active Machine Learning of Working Memory Task Performance [4.9] 作業記憶再構築作業におけるベイズ的2軸能動的分類手法の有効性を示す。
若年者におけるGP駆動適応モード(AM)と従来の適応階段古典モード(CM)を比較した。
AM推定は他のサンプリング手法よりも早く収束し、完全なモデルの正確な適合には30のサンプルしか必要としないことを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:48:14 GMT)
Dressing the Imagination: A Dataset for AI-Powered Translation of Text into Fashion Outfits and A Novel KAN Adapter for Enhanced Feature Adaptation [4.8] FLORAは4,330種類のファッション服とそれに対応するテキスト記述を含む最初の包括的データセットである。
第2のコントリビューションとして,Kolmogorov-Arnold Networks (KAN) に基づく新しいアダプタアーキテクチャであるNeRAを紹介する。
FLORAデータセットと実装コードの両方をオープンソースにします。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:59:00 GMT)
Are Large Language Models Chronically Online Surfers? A Dataset for Chinese Internet Meme Explanation [4.8] 大規模な言語モデル(LLM)は、インターネットから大量のテキストで訓練されているが、インターネット上で急速に広まるバイラルコンテンツは本当に理解しているのだろうか?
ChiMEはCineese Internet Meme Explanationのデータセットである。
データセットは、中国インターネットから人気のフレーズベースのミームからなり、その意味、起源、例文、型などの詳細情報が注釈付けされている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:41:46 GMT)
Beyond the Algorithm: A Field Guide to Deploying AI Agents in Clinical Practice [4.8] 本稿では,電子健康記録(EHR)データを用いた生成エージェントをデプロイするための実践者指向のフィールドマニュアルを提案する。
本ガイドは、臨床ノートから免疫関連有害事象を検出する自動システム「IRAE-Agent」をデプロイした経験から得られたものである。
データ統合、モデル検証、経済的な価値の確保、システムドリフトの管理、ガバナンスです。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:11:30 GMT)
Continuous Wrist Control on the Hannes Prosthesis: a Vision-based Shared Autonomy Framework [4.6] 義肢をつかむためのほとんどの制御技術は、器用な指の制御に焦点をあてるが、手首の動きを見渡す。
これにより、肘、肩、腰で補償運動を行い、手首をつかむように適応させる。
本稿では,共有自律フレームワークにおけるユーザと自動システムの協調を利用したコンピュータビジョンベースシステムを提案する。
当社のパイプラインでは,人工手首をシームレスに制御して対象物を追尾し,最終的にユーザの意図に応じて把握するように調整しています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:27:05 GMT)
Are All Marine Species Created Equal? Performance Disparities in Underwater Object Detection [4.5] 全ての種が等しく検出されるわけではないが、根本原因は不明である。
1) データ量を超える要因は、クラス固有のパフォーマンス格差を引き起こすか?
我々は,DuOとRUODのデータセットを操作して,対象検出タスクを局所化と分類に分離し,頭蓋骨の低性能について検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:13:50 GMT)
Network-Level Vehicle Delay Estimation at Heterogeneous Signalized Intersections [4.5] 本研究では,様々な交差点を横断する車両遅延を推定するためのドメイン適応(DA)フレームワークを提案する。
新たなDAモデルであるGradient Boosting with Balanced Weighting (GBBW)は、ターゲットドメインとの類似性に基づいてソースデータを重み付けする。
8つの最先端ML回帰モデルと7つのインスタンスベースのDA手法で性能を評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:19:50 GMT)
Predictive Modeling and Explainable AI for Veterinary Safety Profiles, Residue Assessment, and Health Outcomes Using Real-World Data and Physicochemical Properties [4.5] 逆事象(AEs)は、予期せぬまたは毒性の運動作用を示し、食物連鎖の違反的残基のリスクを増大させる。
本研究は,米国食品医薬品局(FDA)の獣医学センターからの128万件の報告を用いて,結果の分類(死対回復)を行うための予測的枠組みを紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:34:46 GMT)
Prompt Tuning Decision Transformers with Structured and Scalable Bandits [4.5] 提案手法は,推定時刻における実演データから最適軌道プロンプトを構築することを学習するバンディットベースのプロンプトチューニング手法である。
提案手法は,幅広いタスク,高次元環境,アウト・オブ・ディストリビューションシナリオにまたがる性能を継続的に向上することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:56:28 GMT)
Estimating quantum relative entropies on quantum computers [4.5] 2つの量子状態間の量子相対性を推定するために、Kullback-Leibler分散を用いる。
また,量子コンピュータチャネルの重付加性についても検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:04:00 GMT)
CardioBench: Do Echocardiography Foundation Models Generalize Beyond the Lab? [4.4] ファンデーションモデル(FM)は医療画像の再構成を行っているが、そのエコー心エコー法への応用は限られている。
心エコー検査のための総合的ベンチマークであるCardioBenchを紹介する。
CardioBenchは8つの公開データセットを4つの回帰と5つの分類タスクにまたがる標準化されたスイートに統合する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:09:48 GMT)
PromptPilot: Improving Human-AI Collaboration Through LLM-Enhanced Prompt Engineering [4.3] PromptPilotは、4つの実験的に導出された設計目標を基盤とした対話型プロンプトアシスタントである。
80名の被験者によるランダム化制御実験を行い、3つの現実的作業関連書記タスクを完了した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:14:42 GMT)
Risk Phase Transitions in Spiked Regression: Alignment Driven Benign and Catastrophic Overfitting [4.3] この論文は、スパイク強度の変化とターゲットスパイクアライメントがリスクにどのように影響するかを特徴付ける。
この研究は、一般化誤差の正確な表現を示し、良性、誘惑性、破滅的な過剰適合状態の包括的分類に繋がる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:51:47 GMT)
Curiosity-Driven LLM-as-a-judge for Personalized Creative Judgment [4.3] 本稿では,創造的文章評価のための新しい好奇心駆動型LCM-as-a-judgeを提案する。
本手法は,全アノテータが互いに一致しない主観評価において特に有用である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:29:36 GMT)
Activation-Deactivation: A General Framework for Robust Post-hoc Explainable AI [4.3] アクティベーション・デアクティベーション(AD)は、モデルの決定から排除された入力特徴の影響を取り除く。
トレーニング済みの畳み込みニューラルネットワーク(CNN)に簡単に追加できるドロップイン機構であるConvADを導入する。
我々は、ConvAD機構がネットワークの意思決定プロセスを変えていないことを証明した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:42:58 GMT)
On the Identifiability of Latent Action Policies [4.3] 近年,映像データから行動表現を検出するフレームワークであるLAPO(Latent Action Policy Learning)の識別可能性について検討した。
このような表現のデシダラタについて、その統計的利点と識別不可能性の潜在的な源について、正式に記述する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:09:24 GMT)
Grasp Pre-shape Selection by Synthetic Training: Eye-in-hand Shared Control on the Hannes Prosthesis [4.3] アイ・イン・ハンドシステムは、握る前に手の動きを自動で制御する。
RGB 配列から手形前分類を行うための目印学習方式を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:40:46 GMT)
On the Soundness and Consistency of LLM Agents for Executing Test Cases Written in Natural Language [4.3] グラフィカルユーザインタフェース(GUI)アプリケーションを検証するための自然言語(NL)テストケースの利用は、将来性のある方向として現れつつある。
大規模言語モデル(LLM)の最近の進歩は、LLMエージェントによるNLテストケースの直接実行の可能性を広げている。
本稿では,NLテストケースの不協和性とテストケース実行の整合性に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:32:15 GMT)
NLD-LLM: A systematic framework for evaluating small language transformer models on natural language description [4.2] 自然言語記述(英: Natural Language Description、NLD)は、自然言語入力から構造化された意味のある出力を生成するモデルを必要とする自然言語処理(NLP)タスクである。
NLD-LLMは、言語モデルの性能を評価し、正確かつ簡潔なソースコード記述を生成するための体系的なNLPフレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:03:20 GMT)
Attack logics, not outputs: Towards efficient robustification of deep neural networks by falsifying concept-based properties [4.2] コンピュータビジョンのためのディープニューラルネットワーク(NN)は、敵の攻撃に対して脆弱である。
このような堅牢性の問題を検証し緩和するための重要なアプローチは、期待される出力の振る舞いを偽装することである。
本稿では,すでに訓練済みのNNに対して,概念ベースプロパティの簡易実装を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:51:10 GMT)
Learning linear dynamical systems under convex constraints [4.1] 単一軌道の標本から線形力学系の有限時間同定の問題を考える。
A*$は制約のない設定に必要な値よりもはるかに小さい値に対して確実に推定できることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:51:06 GMT)
Derandomised tensor product gap amplification for quantum Hamiltonians [4.1] PCP予想は、高エネルギーハミルトニアンと低エネルギーハミルトニアンを区別することがQMAハードかどうかを問う。
ハミルトニアンの量子ギャップ増幅法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:02:11 GMT)
Fine-tuning LLMs with variational Bayesian last layer for high-dimensional Bayesian optimzation [4.1] 高い評価コストを伴うブラックボックス最適化問題は、サンプル効率でブラックボックス最適化問題を解く必要がある。
本稿では,高次元の入力変数から目的関数へのマッピングをモデル化するニューラルネットワークに基づくサロゲートを提案する。
提案した(ENS-)LoRA-VBLL手法の様々な高次元ベンチマークおよび実世界の分子最適化タスクにおける性能を実証する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:28:50 GMT)
Chain-in-Tree: Back to Sequential Reasoning in LLM Tree Search [4.1] テスト時のスケーリングにより、言語モデルは推論時に追加の計算を割り当てることで、ロングホライズン推論タスクを改善することができる。
CiTは,各ステップで分岐するのではなく,検索中に分岐するタイミングを適応的に決定するフレームワークである。
我々はCitをツリー思考(ToTBS)、ReST-MCTS、RAPの3つの代表的なLCMチェーンに統合し、GSM8KとMath500で評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:57:48 GMT)
PyTrim: A Practical Tool for Reducing Python Dependency Bloat [4.1] 依存性の肥大化はPythonプロジェクトでの永続的な課題である。
このプロセスを自動化するエンド・ツー・エンドのシステムであるPYTRIMを導入する。
PYTRIMは、さまざまなファイルタイプにわたる未使用のインポートとパッケージ宣言を削除する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:58:55 GMT)
Rationale-Augmented Retrieval with Constrained LLM Re-Ranking for Task Discovery [4.1] GoEngageを利用するヘッドスタートプログラムは、新しいスタッフやローテーションスタッフがプラットフォームホームページで適切なタスクを見つけようとすると、重大な課題に直面します。
これらの困難は、ドメイン固有の用語、システム固有の命名法、およびタイポスや様々な単語順序を扱う際の語彙探索の固有の制限から生じる。
本稿では, 軽量な型付き語彙検索, 埋め込み型ベクトル類似性, 制約付き大言語モデル(LLM)を組み合わさった, 実用的なハイブリッド意味検索システムを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:28:59 GMT)
On the joint observability of flow fields and particle properties from Lagrangian trajectories: evidence from neural data assimilation [4.1] ラグランジュ粒子追跡データから流動状態と未知粒子特性の連成観測可能性について数値解析を行った。
圧縮性,衝撃支配流れにおける速度,圧力,密度,慣性粒子特性(直径,密度)の初回共同再構成について報告する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:00:52 GMT)
PhraseStereo: The First Open-Vocabulary Stereo Image Segmentation Dataset [4.1] PhraseStereoは、ステレオ画像ペアにフレーズ領域セグメンテーションをもたらす最初の新しいデータセットである。
GenStereoを活用してPhraseCutデータセット上に構築され、既存のシングルビューデータから正確な右ビュー画像を生成する。
言語、視覚、および3D知覚の交わりにおける将来の研究の基礎を築いている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:29:24 GMT)
Forestpest-YOLO: A High-Performance Detection Framework for Small Forestry Pests [4.0] 本稿では,森林リモートセンシングのニュアンスに巧みに最適化された検出フレームワークであるフォレストペスト・ヨロを紹介する。
まず、ダウンサンプリングモジュールであるSPD-Convを統合し、ネットワーク全体を通して小さなターゲットに関する重要な高解像度の詳細が保存されるようにします。
これは、背景雑音を抑えながらマルチスケールの特徴表現を動的に強化する新しいクロスステージ機能融合ブロック、CSPOKによって補完される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:06:40 GMT)
Neural Logic Networks for Interpretable Classification [3.9] 我々は解釈可能な構造を持つニューラルネットワークを開発する。
我々は、観測されていないデータを考慮したNOT演算とバイアスでこれらのネットワークを一般化する。
本手法はブールネットワーク発見における最先端の手法を改良し,関連性のある解釈可能なルールを学習することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:26:57 GMT)
Interpreting Language Models Through Concept Descriptions: A Survey [3.9] モデルコンポーネントと抽象化の概念記述の新たな分野について、初めて調査する。
我々の合成は、より厳密で因果的な評価に対する需要が増大していることを示している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:51:44 GMT)
Test-Time Search in Neural Graph Coarsening Procedures for the Capacitated Vehicle Routing Problem [3.9] キャパシタ容量不等式(RCIs)のような有効不等式の同定は、キャパシタ付き車両ルーティング問題(CVRP)の切断面法の重要な構成要素である。
深層学習に基づく分離手法では,高品質なカットの発見が可能であるが,多種多様なサブセットを生成できないため,予測よりも少ないカットを生成できることがわかった。
本稿では,新しいテスト時間探索アグリティーを用いて,推論時間における学習モデルの性能を向上させる方法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:31:36 GMT)
A Geometric Unification of Generative AI with Manifold-Probabilistic Projection Models [3.9] いくつかの生成モデルでは、データの低次元の性質は、低次元の潜在空間の導入によって表される。
本研究では,幾何学的枠組みとカーネルに基づく確率的手法を同時に提供することにより,幾何学的・確率的視点を統一する。
我々は,LMPPM (Latent MPPM) が様々なデータセットにおいてLDM (Latent Diffusion Model) より優れていることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:50:30 GMT)
The Inhibitor: ReLU and Addition-Based Attention for Efficient Transformers under Fully Homomorphic Encryption on the Torus [3.9] 我々は、ドット生成物とソフトマックスに基づく注意を、加算とReLU活性化のみを含む別のメカニズムに置き換える。
これは行列乗法でしばしば必要とされる倍精度への拡張をサイドステップとし、コストのかかるソフトマックス評価を避ける。
より効率的な実行を可能にし、リソース制約のあるハードウェアや同型暗号のような代替の算術システム上で、より大きな量子化トランスフォーマーモデルをサポートする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:31:08 GMT)
Achieving More Human Brain-Like Vision via Human EEG Representational Alignment [3.9] 非侵襲脳波に基づく人間の脳活動に対応する視覚モデル「Re(presentational)Al(ignment)net」を提案する。
我々の革新的な画像から脳への多層符号化フレームワークは、複数のモデル層を最適化することにより、人間の神経のアライメントを向上する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:45:57 GMT)
Fixing That Free Lunch: When, Where, and Why Synthetic Data Fails in Model-Based Policy Optimization [3.9] 本稿では, モデルベースポリシー最適化(MBPO)に注目した。
結果のフェールモードに対処することで、以前は達成不可能だったポリシーの改善が可能になることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:54:51 GMT)
Verifiability and Privacy in Federated Learning through Context-Hiding Multi-Key Homomorphic Authenticators [3.9] フェデレーテッド・ラーニングは、当初から急速に発展し、現在多くの研究機関、いくつかのフレームワークを持ち、様々な商用製品で販売されている。
悪意のあるクライアントの場合、堅牢性を提供するアルゴリズムはたくさんあります。
本稿では,クライアントが更新の秘密性を損なうことなく,アグリゲータの正しさを検証できる検証可能なフェデレーション学習プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:42:12 GMT)
Cyber Academia-Chemical Engineering (CA-ChemE): A Living Digital Town for Self-Directed Research Evolution and Emergent Scientific Discovery [3.8] 本稿では,Cyber Academia-Chemical Engineering (CA-ChemE)システムについて述べる。
ドメイン固有の知識ベース、知識強化技術、コラボレーションエージェントを統合することで、システムはインテリジェントなエコシステムの構築に成功した。
本研究では, 化学工学における自律的な科学的発見への道筋として, マルチエージェントアーキテクチャがいかに慎重に設計されているかを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:26:55 GMT)
Physics-Informed Neural Controlled Differential Equations for Scalable Long Horizon Multi-Agent Motion Forecasting [3.8] 複数の自律ロボットの長距離移動予測は、非線形エージェント相互作用のため困難である。
長軸運動予測のためのニューラル制御微分方程式(CDE)に基づくモデルを構築した。
PINCoDEは将来の目標に設定されており、長い期間にわたってロボットの動きに関する物理学的な制約を課している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:27:07 GMT)
Fast, Secure, and High-Capacity Image Watermarking with Autoencoded Text Vectors [3.8] 意味コミュニケーションとして透かしを再構成するLatentSealを提案する。
軽量テキストオートエンコーダは、全文メッセージを256次元単位ノルム潜在ベクトルにマッピングする。
得られたシステムは全文メッセージを隠蔽し、リアルタイムで復号し、付加価値と幾何学的攻撃に耐える。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:56:40 GMT)
Floquet-engineered moire quasicrystal patterns of ultracold Bose gases in twisted bilayer optical lattices [3.8] Floquet-engineered intralayer atomic interaction によるツイスト二層格子に閉じ込められたボースガス中のモア準結晶パターンの形成について検討した。
12倍の準結晶パターンは特定のパラメータの下で出現し、二層グラフェンのモワール準結晶とよく似ている。
我々は,超低温ボソニック系における準結晶とその対称性を探索するための新しい量子プラットフォームを構築した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:36:26 GMT)
Exploring Network-Knowledge Graph Duality: A Case Study in Agentic Supply Chain Risk Analysis [3.7] ネットワークと知識グラフの本質的にの双対性を利用する。
ネットワーク集中度スコアで導かれるグラフトラバーサは、最も経済的に健全なリスクパスを効率的に抽出する。
エージェントアーキテクチャは、数値係数テーブルとニュースストリームのデータとともに、このグラフ検索をオーケストレーションする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:02:14 GMT)
Beyond one-hot encoding? Journey into compact encoding for large multi-class segmentation [3.7] 本稿では,クラス数の対数化に要する計算複雑性とメモリ要求を低減するために,一点符号化の代わりに二項符号化方式のファミリを提案する。
3次元MRI画像に基づく108種類の脳機能解析のユースケースに本手法を適用した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:53:39 GMT)
CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation [3.7] 本稿では,学習状態の進化パターンに基づいて標準注意重みを変調するクロス状態遷移注意変換器を提案する。
我々のアプローチは、この構造化された注意とトレーニング中の時間的マスキングを組み合わせることで、最近の時間経過から視覚情報をランダムに取り除き、歴史的文脈からの時間的推論を促進する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:09:05 GMT)
Photorealistic Inpainting for Perturbation-based Explanations in Ecological Monitoring [3.7] 本稿では,シーンコンテキストを保存した摂動,マスローカライズされた編集を生成するインパインティングガイドによる説明手法を提案する。
我々は,Glacier Bayのドローン画像において,港のシール検出のために微調整されたYOLOv9検出器のアプローチを実証する。
その結果、診断構造をローカライズし、従来の摂動に共通する削除アーティファクトを回避し、ドメイン関連洞察を得る。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:18:27 GMT)
Decentralized Online Regularized Learning Over Random Time-Varying Graphs [3.7] ランダムな時間変化グラフを用いたオンライン正規化線形回帰アルゴリズムを開発した。
後悔の上限は$O(T1-tauln T)$であり、$tauin (0.5,1)$はアルゴリズムのゲインに依存する定数である。
さらに、後悔の上限は$O(T1-tauln T)$であり、$tauin (0.5,1)$はアルゴリズムのゲインに依存する定数であることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:44:50 GMT)
Bridging the Gap Between Simulated and Real Network Data Using Transfer Learning [3.7] シミュレーションデータと実世界のデータを組み合わせたトランスファーラーニングを利用したハイブリッド手法を提案する。
トレーニング済みモデルを小さな実データセットで微調整することで、性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:29:47 GMT)
Integrating Offline Pre-Training with Online Fine-Tuning: A Reinforcement Learning Approach for Robot Social Navigation [3.6] 本稿では,Return-to-Go(RTG)を統合した,ロボットソーシャルナビゲーションのためのオフライン・オンラインファインチューニングアルゴリズムを提案する。
本アルゴリズムは,時間的歩行者動作パターンと空間的群集動態を協調的に符号化することにより,RTG値をリアルタイムに正確に推定するトランスフォーマー・ポラル融合モデルを特徴とする。
シミュレーションされた社会航法環境における実験により,本手法は最先端のベースラインに比べて高い成功率と低い衝突率を達成することが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:37:02 GMT)
POVQA: Preference-Optimized Video Question Answering with Rationales for Data Efficiency [3.5] 近年,VQAタスクには1500以上のフレームのコンテキストウィンドウが設けられている。
データ効率のよいパイプラインであるPOVQAを導入し、ビデオの各秒を1つの時間プール画像に圧縮する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:15:36 GMT)
OntoLogX: Ontology-Guided Knowledge Graph Extraction from Cybersecurity Logs with Large Language Models [3.4] システムログはサイバー脅威インテリジェンス(CTI)の貴重な情報源である
しかし、それらのユーティリティは、構造の欠如、セマンティックな一貫性の欠如、デバイスやセッション間の断片化によって制限されることが多い。
OntoLogXは生ログをオントロジー基底知識グラフ(KG)に変換する
システムはKGをセッションに集約し、MITRE ATT&CKの戦術を予測する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:46:15 GMT)
GeoSURGE: Geo-localization using Semantic Fusion with Hierarchy of Geographic Embeddings [3.4] 我々は、クエリ画像の視覚的表現と学習された地理的表現との整合性として、地理的ローカライゼーションを定式化する。
主要な実験では、5つのベンチマークデータセットで測定された25のメトリクスのうち22のベストが改善された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:39:48 GMT)
Reliable End-to-End Material Information Extraction from the Literature with Source-Tracked Multi-Stage Large Language Models [3.4] 大規模言語モデルを用いた多段階情報抽出パイプラインを提案する。
実験によって報告された材料から構成、構造処理、特性にまたがる47の特徴を捉えている。
パイプラインは、反復抽出とソーストラッキングを統合して、正確性と信頼性を両立させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:03:28 GMT)
Automating Data-Driven Modeling and Analysis for Engineering Applications using Large Language Model Agents [3.3] 本稿では,Large Language Model (LLM) エージェントを用いてデータ駆動モデリングと分析を自動化する革新的なパイプラインを提案する。
協調エージェントを特徴とするマルチエージェントシステムと、Reasoning and Acting(ReAct)パラダイムに基づく単一エージェントシステムである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:28:35 GMT)
On Integer Programming for the Binarized Neural Network Verification Problem [3.3] バイナリ化ニューラルネットワーク(BNN)は、バイナリウェイトとアクティベーション機能を備えたフィードフォワードニューラルネットワークである。
検証問題は、与えられた入力の小さな摂動がBNNによって誤って分類される可能性があるかどうかを判断しようとする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:43:18 GMT)
Multi-modal Spatio-Temporal Transformer for High-resolution Land Subsidence Prediction [3.3] 本研究では,動的変位データを静的な物理先行値と融合する新しいフレームワークを提案する。
公開EGMSデータセットでは、MM-STTが新しい最先端技術を確立し、長距離予測RMSEを桁違いに削減する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:00:59 GMT)
PAN: Pillars-Attention-Based Network for 3D Object Detection [3.3] 本研究では,鳥眼ビュー(BEV)におけるカメラとレーダーを用いた新しい3次元物体検出アルゴリズムを提案する。
我々のアルゴリズムは、特徴を検知ヘッドに融合する前にレーダーの利点を利用する。
新しいバックボーンが導入され、レーダー柱の特徴を埋め込み次元にマッピングする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:20:37 GMT)
LVTINO: LAtent Video consisTency INverse sOlver for High Definition Video Restoration [3.3] 本稿では,VCMで符号化された先行画像を用いた高精細ビデオ再生のための,最初のゼロショット・プラグ・アンド・プレイ逆解器であるLVTINOを提案する。
我々の条件付け機構は、自動微分の必要性を回避し、少数のニューラルファンクション評価で最先端のビデオ再構成品質を達成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:10:08 GMT)
Optimal Quantum Information Transmission Under a Continuous-Variable Erasure Channel [3.3] ボソニック連続可変消去チャネルの量子容量とエンタングルメント支援量子容量を導出する。
次に、符号化状態の典型的な部分空間内でのスクランブル情報に基づいてランダムコードを構築する。
情報回復は入力モードと出力モードの比に依存する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:02:14 GMT)
Geometric Properties of Neural Multivariate Regression [3.3] 崩壊モデルではID_H ID_Yが示され、過剰圧縮と一般化が不十分になる。
特徴次元を拡大または縮小することで性能が向上する2つのレジームを同定する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:50:57 GMT)
LVLMs as inspectors: an agentic framework for category-level structural defect annotation [3.2] エージェントベースの新しいエージェントアノテーションフレームワークであるDefect Pattern Taggerが導入された。
これはLVLM(Large Vision-Language Models)とセマンティックパターンマッチングモジュールと反復的な自己探索機構を統合している。
生の視覚データを高品質でセマンティックにラベル付けされた欠陥データセットに変換する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:31:42 GMT)
Ultra-Efficient Decoding for End-to-End Neural Compression and Reconstruction [3.2] ベクトル量子化を用いたオートエンコーダに低ランク表現を組み込んだ新しい圧縮再構成フレームワークを開発した。
画像の学習遅延表現に対して,一連の計算効率のよい低ランク演算を行うことで,高画質で効率的にデータを再構成できることを実証する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:42:59 GMT)
VerifiableFL: Verifiable Claims for Federated Learning using Exclaves [3.2] FL(Federated Learning)では、データプロバイダがトレーニングデータを共有せずに、マシンラーニングモデルを共同でトレーニングする。
トレーニングされたモデルに関する検証可能なクレームを提供するFLモデルのトレーニングシステムであるVerifiableFLについて述べる。
VerifiableFLは、未保護のFLモデルトレーニングと比較して10%未満のオーバーヘッドを導入している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:03:16 GMT)
AI Where It Matters: Where, Why, and How Developers Want AI Support in Daily Work [3.2] ジェネレーティブAIはソフトウェアワークを再構築していますが、開発者が最も必要とする場所とサポートの明確なガイダンスはありません。
我々は、N=860の開発者を対象に、AIの助けを求める場所、理由、方法、限界を調査する大規模で混合的な研究を報告します。
私たちの結果は、開発者とその作業にとって重要なAIを提供するための、具体的かつコンテキスト的なガイダンスを提供します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:51:03 GMT)
Hybrid Predictive Modeling of Malaria Incidence in the Amhara Region, Ethiopia: Integrating Multi-Output Regression and Time-Series Forecasting [3.2] エチオピアではマラリアが主要な公衆衛生上の問題となっている。
マラリアの発生を正確に予測することは、効果的な資源配分とタイムリーな介入に不可欠である。
本研究では,時系列予測,複数出力回帰,従来の回帰に基づく予測を組み合わせた予測モデルを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:16:47 GMT)
Toward Foundational Model for Sleep Analysis Using a Multimodal Hybrid Self-Supervised Learning Framework [3.1] 本研究では,PSG(Polysomnography)データを解析するためのマルチモーダルハイブリッド学習フレームワークであるSynthSleepNetを紹介する。
SynthSleepNetは、マスク付き予測とコントラスト学習を効果的に統合し、複数のモードにまたがる相補的特徴を活用する。
3つの下流タスクにわたる最先端のメソッドよりも優れたパフォーマンスを実現した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:32:35 GMT)
Visualizing Quantum Circuits: State Vector Difference Highlighting and the Half-Matrix [3.0] 回路シミュレータの既存のグラフィカルユーザインタフェースは、各キュービットの減少状態の小さな視覚的要約を示すことが多い。
小回路に関するより完全な情報を提供するために,2つの新しい視覚的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:37:21 GMT)
Density-Ratio Weighted Behavioral Cloning: Learning Control Policies from Corrupted Datasets [2.9] 本稿では,密度比重み付き行動クローンについて紹介する(重み付きBC)。
重み付きBC(Weighted BC)は、2値判別器を介して軌跡レベルの密度比を推定するために、小さな検証済みの基準セットを使用する頑健な模倣学習手法である。
実験により、Weighted BCは汚染率が高い場合でもほぼ最適性能を維持していることが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:43:04 GMT)
Tackling Federated Unlearning as a Parameter Estimation Problem [2.9] 本研究は,情報理論に基づく効果的なフェデレート・アンラーニング・フレームワークを提案する。
本手法では, 忘れられているデータに最も敏感なパラメータのみを識別し, 選択的にリセットするために, 2次ヘッセン情報を用いる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:15:14 GMT)
Expected Attention: KV Cache Compression by Estimating Attention from Future Queries Distribution [2.9] 我々は、KVペアの重要性を予測し、将来のクエリがそれに参加するかを予測する、トレーニング不要な圧縮手法である、textbfExpected Attentionを紹介した。
本手法はプリフィルとデコードの両方のフェーズでシームレスに動作し,両シナリオにおいて常に最先端のベースラインよりも優れています。
$textbfweがKVPressをリリースした。KVキャッシュ圧縮メソッドの実装とベンチマークを可能にする包括的なライブラリだ。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:12:14 GMT)
Linear RNNs for autoregressive generation of long music samples [2.9] 我々は,小規模データセット上での美術ログや知覚的メトリクスの状態を把握したモデルであるHarmonicRNNを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:26:54 GMT)
Combining Large Language Models and Gradient-Free Optimization for Automatic Control Policy Synthesis [2.9] 大型言語モデル (LLM) は、シンボル制御ポリシーのジェネレータとして期待されている。
パラメータ最適化から構造合成を分離するハイブリッド手法を提案する。
シンボルプログラム合成と数値最適化を組み合わせることで、解釈可能ながら高い性能のポリシーが得られることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:42:15 GMT)
Spectral Scaling Laws in Language Models: How Effectively Do Feed-Forward Networks Use Their Latent Space? [2.8] 本研究では、スペクトル利用問題として、フィードフォワードネットワーク(FFN)とリキャスト幅選択について検討する。
主な発見は非対称スペクトルスケーリング法則である。
我々は,FFN幅選択を,テールキャパシティと支配モードキャパシティのトレードオフとして再検討した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:38:21 GMT)
VL-KnG: Visual Scene Understanding for Navigation Goal Identification using Spatiotemporal Knowledge Graphs [2.8] 本稿では,知識グラフ構築と識別のための効率的なクエリ処理を用いて,課題に対処するビジュアルシーン理解システムを提案する。
また、WalkieKnowledgeという、約100分間のビデオデータにまたがる8つのさまざまなトラジェクトリに対して、約200の注釈付き質問が手動で表示される新しいベンチマークも導入しました。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:53:44 GMT)
SVDefense: Effective Defense against Gradient Inversion Attacks via Singular Value Decomposition [2.8] Federated Learning(FL)は、生データを共有せずに協調的なモデルトレーニングを可能にするが、勾配反転攻撃(GIA)に弱い。
SVD(Truncated Singular Value Decomposition)を利用して勾配更新を難読化するGIAに対する新しい防御フレームワークであるSVDefenseを提案する。
SVDefenseは様々なリソース制約の組込みプラットフォームにデプロイするのに実用的です。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:25:41 GMT)
Generic Method for Integrating Lindblad Master Equations [2.7] 我々はリンドブラッドマスター方程式を統合する一般的な方法を提案する。
この方法では、級数は切り詰められ、有限個の項を保持し、密度行列上のリンドブラディアンの反復作用は対応するマスター方程式に従う。
本手法は,多くの自由度を持つシステムにおいて,メモリコストと時間の両方で数値効率を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:04:26 GMT)
Complex System Exploration with Interactive Human Guidance [2.7] 複雑なシステムから出現するパターンの多様性は、科学的または芸術的な目的のためにの使用を動機付けている。
直面する課題は、パラメータ空間のサイズと、パラメータと出現するパターンの間の強い非線形マッピングである。
これらの課題に対処するための設計選択と実装を提供します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:47:13 GMT)
Fundamental solutions of heat equation on unitary groups establish an improved relation between $ε$-nets and approximate unitary $t$-designs [2.7] epsilon$-nets と Unitary $delta$-approximate $t$-designs の概念は、量子計算と情報にまたがって重要かつユビキタスである。
我々は$delta simeq left(epsilon3/2/dright)d2$から$epsilon$-net(epsilon/d1/2right)d2$から$delta simeq left(epsilon/d1/2right)d2$に必要とされる$delta$のバウンダリを改善する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:23:37 GMT)
FIN: Fast Inference Network for Map Segmentation [2.7] 自動運転車のマルチセンサー融合は、複数の知覚タスクに対してより堅牢な代替手段を提供するために、より一般的になりつつある。
カメラレーダー融合は、カメラからのリッチな意味情報とレーダからの正確な距離測定を組み合わせることで、コスト効率の良いソリューションを提供する。
この研究は、アクラフルベブ空間におけるカメラとレーダーを用いた、新しく効率的なマップセグメンテーションアーキテクチャを提示する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:29:59 GMT)
Memory Determines Learning Direction: A Theory of Gradient-Based Optimization in State Space Models [2.7] 状態空間モデル(SSM)はトランスフォーマーを上回る可能性を示すことで注目を集めている。
本研究では,このような説明を行い,改良されたトレーニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:30:42 GMT)
Facilitating Cognitive Accessibility with LLMs: A Multi-Task Approach to Easy-to-Read Text Generation [2.6] ETR(Easy-to-Read)イニシアチブは、ニューロディバージェント人口にコンテンツがアクセスできるようにするためのフレームワークを提供する。
本研究では,大規模言語モデル(LLM)のERRコンテンツの自動生成の可能性について検討する。
本稿では,テキスト要約,テキスト単純化,ETR生成を併用したマルチタスク学習(MTL)手法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:44:05 GMT)
INSIGHT: INference-time Sequence Introspection for Generating Help Triggers in Vision-Language-Action Models [2.5] 最近のVision-Language-Action(VLA)モデルは強力な一般化能力を示しているが、失敗を予測したり、人間の上司に助けを求めるための内省的なメカニズムは欠如している。
トークンレベルの不確実性信号を利用してVLAがいつ助けを求めるべきかを予測する学習フレームワークである textbfINSIGHT を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:22:48 GMT)
Semantic and Visual Crop-Guided Diffusion Models for Heterogeneous Tissue Synthesis in Histopathology [2.5] 現実的な異種組織像を生成する潜在拡散モデルを提案する。
本手法は, 生の組織作物を対応する意味領域から直接組み込むことによって, 重要な形態的詳細を保存している。
手動のアノテーションを使わずに11,765個のTCGA全スライディング画像にスケールすることで、我々のフレームワークは、多種多様な注釈付き病理データを生成するための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:22:31 GMT)
Entropy Computing, A Paradigm for Optimization in Open Photonic Systems [2.5] ハイブリッドコンピュータの構築によるエントロピー計算の実現可能性を示す。
提案するエントロピー・コンピューティング・パラダイムは、幅広いNPハード最適化問題に対処するためのスケーラブルで多用途なプラットフォームとして機能することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:33:38 GMT)
Eliciting Chain-of-Thought Reasoning for Time Series Analysis using Reinforcement Learning [2.4] 複雑な数値時系列解析は、しばしば現在のモデルの範囲を超えて多段階の推論能力を必要とする。
我々は,大規模言語モデルを訓練して,多種多様な時系列タスクに対して,検証可能な報酬付き強化学習(RL)を用いた推論を行うための,最初のフレームワークであるCOUNTS(Chain Of thought for Understanding Numerical Time Series)を紹介した。
実験により、中間CoT推論を用いたこのRL駆動方式は、様々な時系列解析タスクにおけるLLM性能を大幅に向上させ、複雑な時間的データ推論の新たな可能性を開くことを実証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:02:28 GMT)
Augmenting LLMs for General Time Series Understanding and Prediction [2.4] 時系列データは、医療、金融、環境科学を含む多くの重要な領域における意思決定に不可欠である。
TsLLM(Time Series-augmented LLM)を200万回以上のインターリーブされた時系列とテキストサンプルの大規模なコーパスでトレーニングする。
このトレーニングにより、TsLLMは言語理解と新たに獲得した時間的推論機能の両方を活用することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:54:46 GMT)
Entropic Risk Optimization in Discounted MDPs: Sample Complexity Bounds with a Generative Model [2.4] 有限割引決定過程において、最適状態-作用値関数$Q*$と最適ポリシー$pi*$を学習する際のサンプル複雑度を解析する。
我々は、モデルに基づくリスクに敏感な$Q$-value-iteration (MB-RS-QVI) と呼ばれる単純なモデルベースアプローチを提案し、分析する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:50:45 GMT)
Fiaingen: A financial time series generative method matching real-world data quality [2.3] 時系列データ生成のための新しいテクニックのセットを紹介する(Fiaingenと名づける)。
a)次元空間を縮小した実世界のデータと合成データの重複、(b)下流機械学習タスクにおけるパフォーマンス、(c)実行時のパフォーマンスの3つの基準でそれらの性能を評価する。
実験により, 上述の3つの基準にまたがって, 最先端の性能を達成できることが実証された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:55:08 GMT)
Hybrid Dialogue State Tracking for Persian Chatbots: A Language Model-Based Approach [2.3] 対話状態追跡(DST)は会話AIの重要な要素である。
従来のルールベースのDSTは複雑な会話には十分ではない。
本研究では,ルールベースの手法と言語モデルを用いたハイブリッドDSTモデルを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:57:19 GMT)
Quantum simulation approach to ultra-weak magnetic anisotropy in a frustrated spin-1/2 antiferromagnet [2.3] 磁気結晶異方性(MCA)は、実磁石の重要な特徴である。
我々はCuSb2O6におけるMCAの量子シミュレーションフレームワークを開発した。
本研究は, 実材料における複雑な磁性現象の, 資源効率のよい量子シミュレーションの実現可能性を示すものである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:26:51 GMT)
Aligning Video Models with Human Social Judgments via Behavior-Guided Fine-Tuning [2.3] 現代ビデオと言語モデルが社会的ビデオにおいて人間に知覚される類似性を捉えているかどうかを考察する。
ソーシャルインタラクションの3秒ビデオクリップ250本に対して、49,000件以上の奇抜な1対1類似性判定のベンチマークを新たに導入した。
我々は、これらの人間の判断に基づいてTimeSformerビデオモデルに、新しいハイブリッドトリプルトRSA目標を付与する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:29:55 GMT)
Multi-Agent Stage-wise Conservative Linear Bandits [2.3] マルチエージェントネットワーク設定における線形帯域幅問題について検討する。
エージェントは段階的に保守的な制約を満たす必要がある。
我々は,行動選択とコンセンサス構築フェーズの交互に行うエピソードアルゴリズムMA-SCLUCBを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:29:18 GMT)
Whose Journey Matters? Investigating Identity Biases in Large Language Models (LLMs) for Travel Planning Assistance [2.2] 本研究では,大規模言語モデル(LLM)による旅行推薦における民族的・ジェンダー的偏見について検討する。
その結果,人種別と性別別の両方の検定精度がランダムな確率を超えていることが示唆された。
本研究は,AIによる旅行計画支援の傾向と信頼性を向上させるため,バイアス軽減戦略の必要性を明らかにするものである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:07:44 GMT)
Robustness and sex differences in skin cancer detection: logistic regression vs CNNs [2.2] 本研究は、アルツハイマー病の検出に関する以前の研究の再現であり、患者性間のロジスティック回帰(LR)と畳み込みニューラルネットワーク(CNN)の堅牢性について研究した。
PAD-UFES-20データセットと、手作りの特徴を反映したLRと、トレーニング済みのResNet-50モデルを用いて、皮膚がん検出における性バイアスについて検討した。
以上の結果より、LRとCNNはともに性分布に頑健であったが、CNNの精度は有意に高く、AUROC以下であった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:38:25 GMT)
Domain-Specialized Interactive Segmentation Framework for Meningioma Radiotherapy Planning [2.2] Interactive Medical Image (IMIS)は、高度なAI技術と臨床入力を統合することで、この問題に対処する。
放射線治療(RT)における3D髄膜腫セグメンテーションのための専用IMISツールであるInteractiveMEN-RTを紹介する。
このシステムには、ポイントアノテーション、バウンディングボックス、ツール、スクリブルなど、複数の臨床的に関係のある相互作用方法が組み込まれており、使用性と臨床精度が向上している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:57:10 GMT)
Diffusion Model-based Parameter Estimation in Dynamic Power Systems [2.2] この研究は、そのような限界に対処する新しいパラメータ推定フレームワーク、JCDI(Joint Diffusion Model Inverse Problemsolvr)を導入する。
複合負荷モデルパラメータ化という電力系統の課題に対して、JCDIは単一条件モデルと比較してパラメータ推定誤差を58.6%削減する。
また、様々な電気的欠陥の下でシステムの動的応答を正確に再現し、根の平均二乗誤差は4*10(-3)以下である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:31:42 GMT)
Benchmarking Agentic Systems in Automated Scientific Information Extraction with ChemX [2.2] ChemXは、ナノマテリアルと小さな分子に焦点を当てた、手動でキュレートされ、ドメインに精通した10のデータセットの集合である。
これらのデータセットは化学における自動抽出手法を厳格に評価し、拡張するために設計されている。
本稿では,ChatGPTエージェントや化学特異的データ抽出エージェントなど,最先端のエージェントシステムとの比較を行った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:50:11 GMT)
Extracting O*NET Features from the NLx Corpus to Build Public Use Aggregate Labor Market Data [2.2] 我々は、ジョブ投稿から構造化情報を抽出する自然言語処理ツールを構築するためのフレームワークとして、O*NETを採用している。
我々は、National Labor Exchange (NLx) Research Hubが提供している1億1500万以上のオンライン求人広告から、100億以上のデータポイントを抽出します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:27:11 GMT)
E-FuzzEdge: Optimizing Embedded Device Security with Scalable In-Place Fuzzing [2.2] E-FuzzEdgeは、実行速度を最適化してマイクロコントローラのためのハードウェア・イン・ループファズリングの非効率性に対処する。
E-FuzzEdgeの重要な利点は、ファームウェアエミュレーションの代わりにデバイステストで実行する他の組み込みファズー技術との互換性である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:24:35 GMT)
Inclusive Easy-to-Read Generation for Individuals with Cognitive Impairments [2.1] ETR-fr は欧州の ETR ガイドラインに準拠した ETR テキスト生成のための最初のデータセットである。
本研究では, PLM と LLM をパラメータ効率よく微調整することで, 生成ベースラインの確立を図る。
その結果、PLMはLLMと互換性があり、ドメイン外のテキストに効果的に適応できることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:13:18 GMT)
Span-level Detection of AI-generated Scientific Text via Contrastive Learning and Structural Calibration [2.1] Sci-SpanDetはAI生成した学術テキストを検出するための構造認識フレームワークである。
セクション条件付きスタイリスティックモデリングとマルチレベルコントラスト学習を組み合わせることで、人間のニュアンスとAIの違いを捉える。
F1(AI)は80.17、AUROCは92.63、Span-F1は74.36である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:35:14 GMT)
Quantum-inspired Benchmark for Estimating Intrinsic Dimension [2.1] 機械学習モデルは、現実世界のデータセットでうまく一般化することができる。
ID推定法(IDE)は数多く存在するが、その推定方法は大きく異なる。
量子インスパイアされた固有次元推定(QuIIEst)ベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:03:02 GMT)
Vectorised Hashing Based on Bernstein-Rabin-Winograd Polynomials over Prime Order Fields [2.1] AXUハッシュ関数deBRWHashはBernsteinRabin-Winograd(BRW)に基づいている
4-decBRWHashは、数百バイトのメッセージではより高速で、数キロバイトのメッセージ長で約16%のスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:30:49 GMT)
Batch-CAM: Introduction to better reasoning in convolutional deep learning models [2.0] Batch-CAMはGrad-CAMアルゴリズムのバッチ実装を融合した新しいトレーニングパラダイムである。
以上の結果から,Batch-CAMはトレーニング時間と推論時間を短縮しつつ,精度と画像再構成品質の同時向上を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:47:00 GMT)
Out of the Box, into the Clinic? Evaluating State-of-the-Art ASR for Clinical Applications for Older Adults [2.0] 本研究は,オランダ語話者の言語利用に関する最先端自動音声認識(ASR)モデルの評価である。
オランダ語話者を対象とした多言語ASRモデルのベンチマークを行った。
以上の結果から,汎用多言語モデルは細調整モデルよりも優れており,近年のASRモデルは実世界のデータセットにうまく一般化できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:06:51 GMT)
Policy-Oriented Binary Classification: Improving (KD-)CART Final Splits for Subpopulation Targeting [2.0] 本稿では, 学生モデルがKD-CARTであるCARTと知識蒸留法が潜在確率分類に最適であることを示す。
本稿では,CART/KD-CARTを厳格に支配する分割規則を生成するMDFS(Maximizing Distance Final Split)を提案する。
MDFSはCART/KD-CARTよりも脆弱なサブ集団をターゲットにしている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:14:29 GMT)
Cryogenic pressure sensing with an ultrafast Meissner-levitated microrotor [1.9] 磁気浮上式回転ローターはジャイロスコープによるナビゲーション、フライホイールによるエネルギー貯蔵、ターボ分子ポンプによる超高真空発生、プロセス制御のための圧力感知などの技術において重要な要素である。
我々は,4.2ケルビンでマイスナー効果によって浮遊するマイクロマグネットをベースとした回転ローターによる広範囲圧力センシングを実演した。
超低トルクノイズで実現される量子力学や重力を含む基礎科学の探索に、浮上ローターを用いることを想定する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:23:47 GMT)
Constant in an Ever-Changing World [1.9] Ever-Changing World (CIC)フレームワークの定数は、アルゴリズムの安定性を高めてパフォーマンスを向上させる。
我々は,5つのMuJoCo環境上でCICを評価し,CICが計算コストを増大させることなく従来のアルゴリズムの性能を向上させることを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:46:14 GMT)
Combining Error Detection and Mitigation: A Hybrid Protocol for Near-Term Quantum Simulation [1.9] Pauli twirling,確率的エラーキャンセル,および$[n, n-2, 2]$の量子エラー検出コードを統合するハイブリッドエラー抑制プロトコルを開発した。
我々は,非クリフォード変分量子ゾルバ回路上でのプロトコルの実証を行った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:59:03 GMT)
Mathematical and numerical analysis of quantum signal processing [1.9] 量子信号処理(QSP)は、$mathrmSU(2)$の行列の積として$d$のスカラーの表現を提供する。
QSPは量子特異値変換(QSVT)の数学的基礎であり、これは過去10年で最も重要な量子アルゴリズムの1つである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:49:50 GMT)
Dissipative Preparation of Many-Body Quantum States: Towards Practical Quantum Advantage [1.9] 散逸性プロトコルは、エンジニアリングされたシステム環境相互作用を活用することで、複雑な多体量子状態を作成することができる。
このエッセイは、アルゴリズムで構築されたリンドブラッドジェネレータを利用するアルゴリズムのクラスに焦点を当てている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:00:12 GMT)
Sentry: Authenticating Machine Learning Artifacts on the Fly [1.9] 機械学習システムは、データセットや他のパーティによって作成またはホストされるモデルのような、オープンソースのアーティファクトにますます依存している。
外部データセットと事前トレーニングされたモデルへの依存は、エンドユーザに配信する前にアーティファクトを毒化できるチェーンアタックをサプライするシステムを公開する。
Sentryは、データセットとモデルの暗号署名と検証を実装することによって、機械学習アーティファクトの信頼性を検証する新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:13:52 GMT)
Pharmacophore-Guided Generative Design of Novel Drug-Like Molecules [1.8] 本稿では, 活性分子の構造的多様性と参照化合物との類似性をバランスさせる新しい生成機構を提案する。
乳がんに対するエストロゲン受容体調節薬およびアンタゴニストを標的とした症例研究を通じて,その適用性を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:45:58 GMT)
Succinct Perfect Zero-knowledge for MIP* [1.8] 本稿では,RE の不正な検証に対する完全ゼロ知識 MIP* プロトコルが存在することを示す。
質問の削減は、正当性検証に対する元のプロトコルの完全なゼロ知識特性を保っていることを示す。
第2に、MIP*の量子情報特徴を提供する制約制約バイナリ制約系(BCS)非局所ゲームは、同期制約変数のBCSゲームに変換され、圧縮の完全性を維持することができることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:10:55 GMT)
LLM-guided Task and Motion Planning using Knowledge-based Reasoning [1.8] 本研究は,タスクコンテキスト推論と知識ベース環境記述を用いて,ユーザプロンプトを洗練・拡張する知識ベース推論を用いた新しいオント・LLM-TAMPフレームワークを提案する。
提案フレームワークはシミュレーションと実世界のシナリオの両方を通じて検証され,動的環境への適応性や意味論的に正しいタスクプランの生成の観点から,ベースラインアプローチに対する大幅な改善が示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:37:49 GMT)
SpeechWeave: Diverse Multilingual Synthetic Text & Audio Data Generation Pipeline for Training Text to Speech Models [1.7] SpeechWeaveは、TSモデルをトレーニングするための多言語、ドメイン固有のデータセットの自動生成が可能な合成音声データ生成パイプラインである。
我々のアプローチは、TSトレーニングのためのスケーラブルで高品質なデータ生成を可能にし、生成されたデータセットの多様性、正規化、音声一貫性を改善します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:37:31 GMT)
Quantum adders: on the structural link between the ripple-carry and carry-lookahead techniques [1.7] 加算アルゴリズムを設計するための2つの基本的な構造的アプローチは、いくつかのよく知られた量子加算器で特定できる。
トフォリのはしごは3つの異なる方法で実装できる: 直線的あるいは多対数的深さはアンシラ無し、あるいは対数的深さはアンシラキュービットを使用する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:51:10 GMT)
From 2D to 3D, Deep Learning-based Shape Reconstruction in Magnetic Resonance Imaging: A Review [1.7] 深層学習に基づく2次元磁気共鳴画像(MRI)からの3次元形状再構成は、医療疾患の診断、治療計画、計算モデルにおいてますます重要になっている。
本稿では,ポイントクラウド,メッシュベース,形状認識,容積モデルという4つの主要なアプローチに注目し,3次元MRI再構成の方法論的展望を概観する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:57:29 GMT)
Analysis of Variational Sparse Autoencoders [1.7] SAEアーキテクチャに変分手法を組み込むことで,特徴構造や解釈可能性が改善されるかどうかを検討する。
本稿では,変分スパースオートエンコーダ(vSAE)を導入し,決定論的ReLUゲーティングを学習したガウス後部からのサンプリングに置き換える。
以上の結果から,SAEに対する変分法の適用は,機能的構造や解釈可能性の向上には至らないことが示唆された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:44:58 GMT)
Multi-Actor Multi-Critic Deep Deterministic Reinforcement Learning with a Novel Q-Ensemble Method [1.7] 本研究では,新しいマルチアクタ・マルチクリティック(MAMC)深部決定性強化学習法を提案する。
提案手法は,探索のための非支配的ソートに基づくアクターの選択を含む3つの特徴を持つ。
実験の結果,提案手法は最先端のDeep Deterministic based reinforcement learning法よりも優れていた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:29:48 GMT)
Isogeny Graphs in Superposition and Quantum Onion Routing [1.6] Onionルーティングは暗号化のレイヤ化によって匿名性を提供するので,送信者と宛先をリンクするリレーは不要である。
複素乗法理論から各層をアーベルイデアル類群作用でインスタンス化することにより、対称エニオン系量子オンイオンルーティング方式を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:15:22 GMT)
Characterizing Model Behavior Under Synthetic Data Training: An Empirical Study Across Scales and Mixing Ratios [1.6] 本稿では, モデル性能, キャリブレーション, 出力特性を, 各種合成・外部データ比で学習した場合に比較検討する。
モデルが最大20%の合成データで安定した性能を維持するが、劣化は30%以上加速する。
80%以上の外部データを維持するSTaRやセルフインストラクトシステムで採用されている現在のベストプラクティスは、我々の実験によって特定された安全な体制の中でうまく機能する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:28:01 GMT)
Hierarchical place recognition with omnidirectional images and curriculum learning-based loss functions [1.6] 本稿では,移動ロボットの安全なナビゲーションに不可欠な視覚的位置認識(VPR)について述べる。
提案手法は,カリキュラム学習戦略を統合した三重項損失関数を微調整したパノラマ画像とディープラーニングモデルを用いる。
提案手法は,これらの状況すべてにおいて,高い認識精度を達成し,実世界のロボット応用のための信頼性の高いソリューションとしての可能性を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:23:25 GMT)
Discovering Software Parallelization Points Using Deep Neural Networks [1.6] 本研究では,並列化の可能性に応じて,プログラム中のループを発見するためのディープラーニングに基づくアプローチを提案する。
2つの遺伝的アルゴリズムに基づくコードジェネレータが開発され、2つの異なるタイプのコードを生成する。
2つのディープラーニングモデル、DNN(Deep Neural Network)とCNN(Convolutional Neural Network)が実装され、その分類が行われた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:33:46 GMT)
GDLNN: Marriage of Programming Language and Neural Networks for Accurate and Easy-to-Explain Graph Classification [1.5] グラフ分類タスクのための新しいグラフ機械学習アーキテクチャであるGDLNNを提案する。
GDLNNはGDLと呼ばれるドメイン固有のプログラミング言語とニューラルネットワークを組み合わせる。
評価の結果,ほとんどのグラフ分類ベンチマークにおいて,GDLに基づく表現が高精度であることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:44:58 GMT)
KeySG: Hierarchical Keyframe-Based 3D Scene Graphs [1.5] KeySGは3Dシーンを、床、部屋、オブジェクト、機能要素からなる階層的なグラフとして表現している。
我々はVLMを利用してシーン情報を抽出し、オブジェクト間の関係エッジを明示的にモデル化する必要性を緩和する。
我々のアプローチは、大規模シーングラフに関連するスケーラビリティ問題を緩和しながら、複雑であいまいなクエリを処理できる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:53:27 GMT)
HalluGuard: Evidence-Grounded Small Reasoning Models to Mitigate Hallucinations in Retrieval-Augmented Generation [1.5] 検索・拡張世代(RAG)における幻覚の緩和のための小型推論モデル(SRM)であるHaluGuardを提案する。
HalluGuard は文書定義ペアを、根拠付きまたは幻覚化されたものとして分類し、透明性のための証拠に基づく正当化を生成する。
受け入れ次第、HaluGuardとデータセットをApache 2.0でリリースします。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:28:20 GMT)
Federated Dynamic Modeling and Learning for Spatiotemporal Data Forecasting [1.5] 本稿では,複雑な時間的データを予測するための高度なフェデレート学習(FL)フレームワークを提案する。
Gated Recurrent Unit(RU)モジュールをLong Short-Term Memory(LSTM)ネットワークに置き換える。
結果として生じるアーキテクチャは、様々な予測アプリケーションで複雑な時間パターンを扱う能力を大幅に改善します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:09:16 GMT)
LLaVAShield: Safeguarding Multimodal Multi-Turn Dialogues in Vision-Language Models [1.5] 悪意のある意図は、マルチモーダル・マルチトゥル(MMT)ダイアログにおいて、ターンとイメージに分散することができる。
MMT対話の安全性に関する最初の体系的定義と研究について述べる。
我々は、MMDSのための安全でないマルチターン対話を生成するために、自動マルチモーダル・マルチターン・リピート・フレームワークを開発した。
ユーザ入力とアシスタント応答のリスクを共同で検出し,評価する強力なツールであるLLaVAShieldを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:07:48 GMT)
SynCED-EnDe 2025: A Synthetic and Curated English - German Dataset for Critical Error Detection in Machine Translation [1.5] 機械翻訳におけるクリティカルエラー検出は、翻訳が安全かどうかを判断することを目的とする。
我々は,1000個のゴールドラベルと8,000個の銀ラベルの文対からなる新しい資源であるSynCED-EnDeを提案する。
我々は、情報検索や会話アシスタントにおけるMTの安全な展開を促進するためのコミュニティリソースとして、SynCED-EnDeを構想する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:38:56 GMT)
Extended c-differential distinguishers of full 9 and reduced-round Kuznyechik cipher [1.4] 9ラウンドの Kuznyechik 暗号に対して,鍵前白を伴わない truncated $c$-differential analysis を導入する。
これは9ラウンドのクズニエチクの派生型に対する最初の実用的区別である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:48:13 GMT)
AS400-DET: Detection using Deep Learning Model for IBM i (AS/400) [1.4] 1,050のシステム画面画像からなる人手による注釈付きデータセットを提案する。
各イメージには、テキストラベル、テキストボックス、オプション、テーブル、命令、キーボード、コマンドラインを含む複数のコンポーネントが含まれている。
我々は最先端のディープラーニングモデルに基づく検出システムを開発し、異なるアプローチを評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:01:15 GMT)
Advancing Automated Ethical Profiling in SE: a Zero-Shot Evaluation of LLM Reasoning [1.4] 大規模言語モデル(LLM)は、コード合成を超えて拡張されたタスクのためのソフトウェア工学(SE)ツールにますます統合されています。
ゼロショット設定で16LLMの倫理的推論能力を評価するための完全に自動化されたフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:28:26 GMT)
Family Matters: Language Transfer and Merging for Adapting Small LLMs to Faroese [1.4] 我々は、低リソースの北ゲルマン語であるFaroeseに小型で効率的なLLMを適用する。
本研究は,LoRAを用いたパラメータ効率チューニングと完全微調整を比較し,言語的精度とテキスト理解に与える影響を評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:17:09 GMT)
Learning simple heuristic rules for classifying materials based on chemical composition [1.4] 本研究では, 材料が金属であるか否かを化学組成に基づいて分類するための簡単なルールを開発するために, 機械学習の利用について検討する。
化学インフォームドインダクティブバイアスを組み込むことで、所定のレベルのテスト精度に達するのに必要なトレーニングデータの量を削減できることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:23:38 GMT)
Nonlinear Framework for Speech Bandwidth Extension [1.3] NDSI-BWEは、非線形力学系にインスパイアされた4つの新しい識別器を利用する新しい逆帯域幅拡張(BWE)フレームワークである。
NDSI-BWEは、各ディスクリミネータによる畳み込みブロックのコアにおける深さ方向の畳み込みを利用して、8倍のパラメータ還元を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:47:31 GMT)
Pre-Distillation of Magic States via Composite Schemes [1.3] 本稿では,魔法状態の生成における系統的なエラーを抑制する複合パルスシーケンスに基づく,前処理のための一般的なフレームワークを提案する。
いずれのプラットフォームにおいても,高忠実度$mathcalT$ゲートがノイズを低減し,蒸留量の最大3倍まで減少する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:06:14 GMT)
HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems [1.2] 圧力センサーは、現代、換気、空調(暖房)システムに広く統合されている。
音圧に敏感であるため、盗聴の源ともなる。
本稿では,低分解能雑音データから可聴音声を再構成するHVAC-EARを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:29:34 GMT)
Syntax-Guided Diffusion Language Models with User-Integrated Personalization [1.2] 大規模な言語モデルは、人間のようなテキストを生成するために革命的な進歩を遂げてきたが、そのアウトプットは一般的なものであることが多い。
近年の拡散モデルの発展により、自己回帰パラダイムの限界を超えて言語生成を改善する新たな機会が開かれた。
テキストの品質,多様性,制御性を向上させるために,構造的監督とパーソナライズドコンディショニングを統合した構文誘導拡散言語モデルを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:33:12 GMT)
U-DFA: A Unified DINOv2-Unet with Dual Fusion Attention for Multi-Dataset Medical Segmentation [1.2] U-DFAはDINOv2-Unetエンコーダとデコーダを統一したアーキテクチャで,新たにLGFA(Local-Global Fusion Adapter)を統合し,セグメンテーション性能を向上させる。
本手法は,トレーニング可能なモデルパラメータの33%に過ぎず,Synapse と ACDC のデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:06:49 GMT)
Editing Physiological Signals in Videos Using Latent Representations [1.2] 心拍数(Heart Rate、HR)は、個人の健康をモニターする非接触手段である。
顔ビデオに重要な信号があることは、プライバシーの懸念を生じさせる。
映像中の生理的信号の編集を視覚的忠実性を維持しながら行うことを提案する。
リアルビデオにおける生体信号の匿名化や,バイタルサイン付きリアルビデオなどの応用には,制御可能なHR編集が有用である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:16:13 GMT)
From Videos to Indexed Knowledge Graphs -- Framework to Marry Methods for Multimodal Content Analysis and Understanding [1.2] マルチモーダルコンテンツ分析のための効率的なプロトタイピングパイプラインを実現するフレームワークを提案する。
パイプラインの候補レシピを作成し、事前訓練されたモデルのセットを組み、ビデオを時間的半構造化データフォーマットに変換する。
さらに,この構造を,問合せが可能で連続学習をサポートするフレームレベルのインデックス付き知識グラフ表現に変換する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:20:15 GMT)
Discontinuous Epitope Fragments as Sufficient Target Templates for Efficient Binder Design [1.1] タンパク質折り畳みニューラルネットワーク(PFNN)は、局所的な相互作用を優先し、グローバルな折り畳み性に制限された感度を示す。
結合部位を囲む不連続な表面残基のみを保持する進化のみの戦略を提案する。
このアプローチは、シリコの成功率を最大80%向上させ、成功設計当たりの平均時間を最大40倍に削減する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:52:17 GMT)
A Multi-Agent LLM Defense Pipeline Against Prompt Injection Attacks [1.1] 本稿では,インジェクション攻撃をリアルタイムに検出・中和する新しいマルチエージェント・ディフェンス・フレームワークを提案する。
我々は2つの異なるアーキテクチャ、シーケンシャル・チェーン・オブ・エージェント・パイプラインと階層的コーディネータ・ベース・システムを用いてアプローチを評価した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:39:48 GMT)
Intensity correlations in decoy-state BB84 quantum key distribution systems [1.1] 生成した信号の強度に対する高次相関は、最も近い近傍相関よりもはるかに高い値を示す。
我々は,高次相関が生成した信号の強度に与える影響が,最近傍相関よりもはるかに高いことを実験的に確認した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:18:05 GMT)
Rapid training of Hamiltonian graph networks using random features [1.1] Hamiltonian Graph Networks(HGN)は、反復最適化をランダムな特徴ベースのパラメータ構成に置き換えることで、600倍高速にトレーニングすることができる。
N-body mass-spring や分子系を含む様々なシミュレーションでは,最大3次元で1万の粒子が異なる。
最小限の8ノードシステムでトレーニングしても、モデルがゼロショット方式で4096ノードのシステムに再トレーニングせずに一般化できることを明らかにする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:14:08 GMT)
Emergence of robust looming selectivity via coordinated inhibitory neural computations [1.1] 本稿では, シミュレーションにおける抑制機構の役割と規模について, 新たな知見を提供する。
フィードフォワード、多層ニューラルネットワークフレームワーク、大域的阻害、側方抑制、自己抑制、フィードフォワード抑制を統合する。
自己抑制と側方抑制は連続的に行われ、フィードフォワード阻害によって結合される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:32:33 GMT)
Glaucoma Detection and Structured OCT Report Generation via a Fine-tuned Multimodal Large Language Model [1.1] このモデルは,品質評価,緑内障検出,RAF薄型分類の3つの課題に対して,ホールドアウトテストセットで評価した。
このモデルは、画像品質の問題を特定し、緑内障を検出する上で高い精度を実現した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:37:28 GMT)
GLAI: GreenLightningAI for Accelerated Training through Knowledge Decoupling [1.1] 従来のアーキテクチャに代わるものとして設計された新しいアーキテクチャブロックであるGreenLightningAI(GLAI)を紹介する。
i) 構造的知識*はReLUアクティベーションによって引き起こされる安定した活性化パターンによってエンコードされ、(ii) 定量的知識*は数値的な重みとバイアスによってもたらされる。
一度安定化した構造を固定することにより、GLAIは、定量的成分のみを最適化した経路の組み合わせとして構造を再構成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:31:34 GMT)
CounselBench: A Large-Scale Expert Evaluation and Adversarial Benchmarking of Large Language Models in Mental Health Question Answering [1.0] 我々は,100人のメンタルヘルス専門家による大規模ベンチマークであるCounselBenchを紹介し,大規模言語モデル(LLM)の評価とストレステストを行う。
最初のコンポーネントであるCounselBench-EVALは、公開フォーラムCounselChatの患者に対する質問に対して、GPT-4、LLaMA 3、Gemini、およびヒトセラピストから2000の専門家による回答の評価を含んでいる。
専門家による評価では、LLMはいくつかの次元において高いスコアを得る一方で、非建設的フィードバック、過度な一般化、限定されたパーソナライゼーションや関連性など、繰り返し発生する問題も示している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:10:02 GMT)
Streamline pathology foundation model by cross-magnification distillation [1.0] ファンデーションモデル(FM)は、計算病理を変容させたが、臨床展開では計算が禁じられている。
本稿では, コース磁化蒸留により開発された軽量FMであるXMAGを紹介する。
XMAGはコンパクトなバックボーンを採用しており、全スライド画像の11.3倍のパッチを必要とする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:30:22 GMT)
Meta-Transfer Derm-Diagnosis: Exploring Few-Shot Learning and Transfer Learning for Skin Disease Classification in Long-Tail Distribution [0.9] 稀な皮膚疾患の正確なモデルを作るのは難しい。
我々は,エピソード学習,教師あり移行学習,対照的自己指導事前学習の3つの学習戦略を比較した。
伝統的な移動学習アプローチは、訓練例の数が増えるにつれて、エピソード的および自己指導的手法を一貫して上回る。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:09:15 GMT)
Social Photo-Elicitation: The Use of Communal Production of Meaning to Hear a Vulnerable Population [0.9] ネパールの非政府組織が生み出した保護的生活環境において,性行為の生き残りについて調査した。
感性のある設定における値の抽出方法として,コミュニカルなフォトエリケーション方式を提案する。
「再生し、新しい常態で生きていく生き残りの複雑な状況を提示する。」
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:36:59 GMT)
Deep learning motion correction of quantitative stress perfusion cardiovascular magnetic resonance [0.9] 教師なし深層学習に基づく動き補正パイプラインを開発した。
3つのステップで動きを補正し、強靭な主成分分析を用いてコントラスト関連の効果を減少させる。
評価は時間的アライメントと定量灌流値を用いて行った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:59:48 GMT)
A Deep Learning Pipeline for Epilepsy Genomic Analysis Using GPT-2 XL and NVIDIA H100 [0.9] 本稿では,ディープラーニング戦略のパワーとGPUアクセラレーションを統合して,てんかんにおける遺伝子発現パターンを解析する新しい分析パイプラインを提案する。
提案手法は変換器をベースとした大規模言語モデル(LLM)であるGPT-2 XLを用いてゲノム配列解析を行う。
その結果,ケトゲン食療法後の海馬アストログリオーシスの減少,ゼブラフィッシュモデルにおける興奮抑制シグナル平衡の回復など,いくつかの重要な転写学的修飾が示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:07:35 GMT)
Development of a Mobile Application for at-Home Analysis of Retinal Fundus Images [0.9] このプラットフォームの目的は、これらの指標の変化を時間とともに観察し、眼疾患の早期発見を提供することである。
分析対象は血管の好奇心、緑内障、網膜症、黄斑浮腫の徴候である。
DeepSeeNetの緑内障検出モデルからの情報に加えて、トルチューシティの計算も取り入れられ、最終的に網膜底部画像監視プラットフォームが提供される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:37:01 GMT)
DiffKnock: Diffusion-based Knockoff Statistics for Neural Networks Inference [0.9] 有限サンプル偽発見率(FDR)制御による高次元特徴選択のための拡散型ノックオフフレームワークであるDiffKnockを紹介する。
提案手法では、拡散モデルを用いて有効なノックオフを生成し、ニューラルネットワークに基づく勾配とフィルタ統計を用いて非対称な特徴重要度尺度を構築する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:54:23 GMT)
End-to-end Training of High-Dimensional Optimal Control with Implicit Hamiltonians via Jacobian-Free Backpropagation [0.8] 本稿では,値関数を直接パラメータ化して最適制御法を学習する,エンドツーエンドの暗黙的深層学習手法を提案する。
提案手法は暗黙ハミルトニアンを含む複数のシナリオにまたがる高次元フィードバックコントローラを効果的に学習することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:03:08 GMT)
A robust phase of continuous transversal gates in quantum stabilizer codes [0.7] 量子誤り訂正符号は、符号化された論理情報を誤りから保護する。
トランスバーサルゲートは論理量子ビットを操作する自然なフォールトトレラントな方法であるが、それ自体は普遍的ではない。
これを利用して、連続角論理回転のための単純なフォールトトレラントプロトコルを設計する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:00:02 GMT)
Random Feature Spiking Neural Networks [0.7] 機械学習(ML)モデルとしてのスパイキングニューラルネットワーク(SNN)は最近、多くの注目を集めている。
本稿では,SNNのエンドツーエンドトレーニングのための新しいデータ駆動,高速,高性能,解釈可能なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:18:40 GMT)
Evaluating LLMs for Combinatorial Optimization: One-Phase and Two-Phase Heuristics for 2D Bin-Packing [0.7] 本稿では,Large Language Models (LLM) の最適化能力を評価するための評価フレームワークを提案する。
我々は,LLMと進化的アルゴリズムを組み合わせた体系的手法を導入し,解の生成と洗練を行う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:33:56 GMT)
Metaphor identification using large language models: A comparison of RAG, prompt engineering, and fine-tuning [0.7] 本研究では,大言語モデル(LLM)が全文でメタファ識別を自動化する可能性について検討する。
i) 検索拡張生成(RAG) モデルにコードブックを付与し,その規則や例に基づいて注釈を付けるように指示する手法, (ii) タスク固有の言語命令を設計する手法, (iii) ハンドコードされたテキストでモデルを訓練してパフォーマンスを最適化するファインチューニング,の3つの手法を比較した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:06:17 GMT)
Predicting Diabetic Retinopathy Using a Two-Level Ensemble Model [0.6] 糖尿病網膜症は、高齢者の視覚障害の主要な原因である。
画像ベースのAIツールは、早期検出の限界を示している。
実験結果を用いたDR予測のための非画像ベース2レベルアンサンブルモデルを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:19:57 GMT)
TabINR: An Implicit Neural Representation Framework for Tabular Data Imputation [0.6] 本稿では,テーブルをニューラルネットワークとしてモデル化する自動デコーダベースのImplicit Neural RepresentationフレームワークであるTabINRを紹介する。
我々は、現実世界の12のデータセットと複数の欠落メカニズムにまたがって、我々のフレームワークを評価した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:24:35 GMT)
Decomposing Attention To Find Context-Sensitive Neurons [0.6] 本研究は,注意パターンが広まっており,注意スコアが内容に左右されるアテンションヘッドについて検討する。
我々は、GPT2-Smallの第1層における複数の安定ヘッドの出力を結合し、周辺テキストの線形要約によってそれらの組合せ出力を近似する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:29:39 GMT)
ChatGPT in Introductory Programming: Counterbalanced Evaluation of Code Quality, Conceptual Learning, and Student Perceptions [0.6] ChatGPTのような大規模言語モデル(LLM)は、プログラミング入門コースでますます使われている。
CS1コースにおいて,ChatGPTアクセスがコード品質,概念理解,タスク完了時間,学生の知覚に与える影響について検討した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:19:24 GMT)
Towards understanding Accelerated Stein Variational Gradient Flow -- Analysis of Generalized Bilinear Kernels for Gaussian target distributions [0.6] SVGD(Stein variational gradient descent)は、ターゲット分布からサンプリングするカーネルベースの非パラメトリック粒子法である。
本稿では,確率密度の計量空間における加速勾配流に基づいて,加速SVGD(ASVGD)を導入する。
ベイズニューラルネットワークの設定において、SVGDはログライクリフとトータルタイムの点でSVGDを著しく上回る。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:06:25 GMT)
Enhancing Software Testing Education: Understanding Where Students Struggle [0.5] 本研究は,学生が非効率な変化を起こすための具体的なテスト概念について検討する。
本研究では,2つの課題から学生が提出した課題を解析し,非生産的修正の一般的な概念的ギャップとパターンを同定した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:30:22 GMT)
Optimal Untelegraphable Encryption and Implications for Uncloneable Encryption [0.5] 本稿では,不特定性セキュリティを実現するために,無条件でセキュアなUTEの構築を提案する。
まず、UTEに新しい下位境界を与え、UEに新しい下位境界を与える。次に、UEの敵の数が増える体制において、UTEとUEの等価性を証明する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:45:01 GMT)
Low Depth Color Code Circuits with CXSWAP gate [0.5] カラーコードのための新しい2種類のシンドローム抽出回路を提案する。
私たちの最初の構築は、[M. McEwen, D. Bacon, C. Gidney, Quantum 7, 1172 (2023)の後で、バルクデータと測定量子ビットの役割を定期的に交換することでリークエラーを軽減することを約束しています。
2番目の構造は、CNOTの代わりにCXSWAPゲートを使用することで、[C. Gidney and C. Jones, arXiv:2312.08813 (2023) と比較して回路深さを減少させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:29:22 GMT)
AI-CNet3D: An Anatomically-Informed Cross-Attention Network with Multi-Task Consistency Fine-tuning for 3D Glaucoma Classification [0.5] 緑内障は進行性眼疾患であり、視神経の損傷を引き起こす。
本稿では、3次元畳み込みニューラルネットワークにクロスアテンション機構を統合するハイブリッドディープラーニングモデルを提案する。
我々は、AI-CNet3D (AI-See'-Net3D) と命名し、3Dデータを操作する解剖学的インフォームド・クロスアテンション・ネットワークとしての設計を反映した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:30:55 GMT)
What Did I Learn? Operational Competence Assessment for AI-Based Trajectory Planners [0.5] トレーニングされたモデルの運用リスクを評価するために、データセットに含まれるものを知ることが重要です。
本稿では,知識グラフとして駆動データをモデル化し,実体とその関連性を持つ運転シーンを表現した。
トレーニングセットにおけるサブシーン構成のカバレッジと複雑さを考慮し,運転シーンにおける車両の能力を評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:46:50 GMT)
Proof-of-Social-Capital: Privacy-Preserving Consensus Protocol Replacing Stake for Social Capital (Short Paper) [0.5] フェアネスと分散化を確保するために,社会資本を用いた新たなプロトコルを提案する。
理論的な枠組みによってプライバシーと株式は強化されるが、オフチェーンの贈収賄のような未解決の問題はさらなる研究を必要とする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:28:33 GMT)
Deep Learning-Based Approach for Improving Relational Aggregated Search [0.5] 本研究では,高度自然言語処理技術,すなわち積み重ねオートエンコーダとAraBERT埋め込みの適用について検討する。
従来の検索エンジンの限界を超越して、検索結果のより豊かで文脈に合った特徴付けを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:37:38 GMT)
PAL-Net: A Point-Wise CNN with Patch-Attention for 3D Facial Landmark Localization [0.5] 3D顔スキャンにおける解剖学的ランドマークのマニュアルアノテーションは、時間と専門性に依存したタスクである。
本研究は,50個の解剖学的ランドマークをステレオフォトグラム法顔モデル上に局在させる完全自動ディープラーニングパイプライン(PALNet)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:52:35 GMT)
Mathematical Theory of Collinearity Effects on Machine Learning Variable Importance Measures [0.5] 2つのアプローチは、検証セット内の機能をランダムに置換するPermute-and-Predict(PaP)と、トレーニング機能の変更後にモデルをトレーニングするLeave-One-Co-Out(LOCO)である。
この研究は経験的証拠と理論を橋渡しし、可変重要度尺度の解釈可能性と適用性を高めた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:18:57 GMT)
Integrating AI and Ensemble Forecasting: Explainable Materials Planning with Scorecards and Trend Insights for a Large-Scale Manufacturer [0.5] 本稿では,アフターセール需要予測とモニタリングのための実用的アーキテクチャを提案する。
統計モデル、機械学習モデル、ディープラーニングモデルの、収益とクラスタ対応のアンサンブルを統合する。
システムは90か国以上、約6,000の部品の予測、監視、在庫決定のループを閉じる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:14:10 GMT)
IntrusionX: A Hybrid Convolutional-LSTM Deep Learning Framework with Squirrel Search Optimization for Network Intrusion Detection [0.5] 侵入検知システム(IDS)は、NSL-KDDのようなベンチマークデータセットにおいて、サイバー攻撃の進化、高次元トラフィックデータ、厳しいクラス不均衡により、永続的な課題に直面している。
IntrusionXは,局所的特徴抽出のための畳み込みニューラルネットワーク(CNN)と時間的モデリングのためのLong Short-Term Memory(LSTM)ネットワークを統合したハイブリッドディープラーニングフレームワークである。
パイプラインには厳密な前処理,階層化データ分割,動的クラス重み付けが組み込まれ,レアクラスの検出が促進される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:51:25 GMT)
Defend LLMs Through Self-Consciousness [0.4] 本稿では,大規模言語モデル(LLM)に対する自己意識防御機構について紹介する。
本稿では,メタ認知およびアロケーションモジュールを組み込んだフレームワークを提案し,LCMが自己の出力を自律的に評価・調整することを可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:23:36 GMT)
GeoGraph: Geometric and Graph-based Ensemble Descriptors for Intrinsically Disordered Proteins [0.4] シミュレーションインフォームド・サロゲートであるGeoGraphを導入し,残差残差マップトポロジのアンサンブル平均統計をシーケンスから直接予測する。
粗粒度分子動力学シミュレーションを残差レベルおよびシーケンスレベルのグラフ記述子に分解することにより、ロバストで情報豊富な学習ターゲットを作成する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:13:53 GMT)
Addressing Moral Uncertainty using Large Language Models for Ethical Decision-Making [0.4] 本稿では,タスクに依存しない倫理的レイヤを用いて,事前学習された強化学習(RL)モデルを洗練する倫理的意思決定フレームワークを提案する。
倫理的階層は、Jensen-Shannon Divergence と Dempster-Shafer Theory を用いて複数の道徳的観点から信念のスコアを集約する。
この統合学習フレームワークは、複雑な環境においてRLエージェントが道徳的不確実性をナビゲートし、様々なタスクにおいて道徳的に健全な決定を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:23:12 GMT)
An Efficient Quality Metric for Video Frame Interpolation Based on Motion-Field Divergence [0.4] ビデオフレームは時間的ビデオ強調の基本的なツールであるが、既存の品質指標は、人工物の影響を効果的に評価するのに苦労している。
動きの発散重み付けによりPSNRを強化する新しい完全参照品質指標であるtextPSNR_textDIV$を提示する。
提案手法では,画像誤差の重み付けに使用される運動場の特異点に着目した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:40:38 GMT)
BioVERSE: Representation Alignment of Biomedical Modalities to LLMs for Multi-Modal Reasoning [0.4] 本稿では,事前学習したBioFMをモダリティエンコーダとして適応する2段階のアプローチであるBIOVERSEを提案する。
このアプローチはまず、各モダリティを共有 LLM 空間に整列する。
次に、マルチモーダルデータによる標準的な命令チューニングを適用して、下流の推論のためにそれらをまとめる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:07:36 GMT)
Improving Cryptocurrency Pump-and-Dump Detection through Ensemble-Based Models and Synthetic Oversampling Techniques [0.4] 本研究では,暗号通貨市場におけるポンプ・ダンプ(P&D)の操作を検出することを目的とする。
SMOTEの適用により、すべてのモデルがP&Dイベントを検出する能力が大きく向上した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:46:45 GMT)
GenIA-E2ETest: A Generative AI-Based Approach for End-to-End Test Automation [0.3] 本稿では、生成AIを利用して自然言語記述からE2Eテストスクリプトを自動生成するGenIA-E2ETestを紹介する。
提案手法は, 完全性, 正確性, 適応性, 堅牢性を評価した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:30:24 GMT)
Estimating Visceral Adiposity from Wrist-Worn Accelerometry [0.3] 内臓組織(VAT)は代謝的健康と習慣的身体活動の両方の鍵となるマーカーである
VATは、運動中にカテコールアミンによって刺激されるターンオーバーが増大する、非常にラベラブルな脂肪補給所である。
VATは高度なイメージング技術で測定できるが、PAから直接推定することもできる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:23:43 GMT)
Linguistic Characteristics of AI-Generated Text: A Survey [0.3] 大規模言語モデル(LLM)は、テキストの自動生成のための効果的なツールとして、現代世界での地位を固めている。
AI生成テキストに存在する言語的特徴を研究する必要性が高まっている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:44:28 GMT)
Neural Theorem Proving: Generating and Structuring Proofs for Formal Verification [0.3] 組込み戦術の力と既製の自動定理プローバーを利用するシステム内で使用される形式言語で全ての証明を生成するフレームワークを導入する。
LLMのトレーニングには2段階の微調整プロセスを使用し、まずSFTベースのトレーニングを使用して、モデルが構文的に正しいIsabelleコードを生成する。
我々は,MiniF2F-testベンチマークとIsabelle証明アシスタントを用いてフレームワークを検証し,S3バケットアクセスポリシーコードの正当性を検証するためのユースケースを設計する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:25:14 GMT)
Learning the Universe: Learning to Optimize Cosmic Initial Conditions with Non-Differentiable Structure Formation Models [0.2] 本稿では,3次元宇宙初期条件を再構築するためのLearning the Universe by Learning to Optimize (LULO)を紹介する。
LULOは、3次元宇宙の初期条件を再構築するための勾配のないフレームワークである。
ダークマターのみの$N$ボディシミュレーションで同定した$M_200mathrmc$halosから初期条件を正確に再構成することで,本手法を実証する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:31:28 GMT)
ALARB: An Arabic Legal Argument Reasoning Benchmark [0.2] アラビア法域内の大規模言語モデル(LLM)の推論能力を評価するために設計された,データセットとタスクスイートであるALARBを紹介する。
データセットは、サウジアラビアからの13万件の商業裁判所事件で構成され、各事件には、提示された事実、裁判所の理由、判決、および規制文書から抽出された引用条項が含まれる。
ALARBを用いた定型12Bパラメータモデルの命令チューニングにより,検証予測とアラビア判定生成の性能が著しく向上することを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:15:41 GMT)
Retrieval-Augmented Framework for LLM-Based Clinical Decision Support [0.2] 本稿では,大言語モデル(LLM)を用いた臨床意思決定支援システムを提案する。
このフレームワークは自然言語処理と構造化された臨床入力を統合し、文脈に関連のあるレコメンデーションを生成する。
本稿では,表現表現のアライメントや生成戦略など,システムの技術的コンポーネントについて概説する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:45:25 GMT)
PaECTER: Patent-level Representation Learning using Citation-informed Transformers [0.2] PaECTERは、特許に特有のオープンソースドキュメントレベルのエンコーダである。
我々は,特許文書の数値表現を生成するために,受験者による引用情報付き特許用BERTを微調整する。
PaECTERは、特許ドメインで使用されている現在の最先端モデルよりも類似性タスクが優れている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:24:42 GMT)
A Flexible Method for Behaviorally Measuring Alignment Between Human and Artificial Intelligence Using Representational Similarity Analysis [0.2] 我々は、AIと人間間のアライメントを定量化するために、ペアワイズな類似度評価法であるRepresentational similarity Analysis (RSA)を適用した。
我々は,テキストと画像のモダリティ間のセマンティックアライメント(セマンティックアライメント)を検証し,Large Language and Vision Language Model(LLM, VLM)の類似性判断が,グループレベルでも個人レベルでも人間の反応とどのように一致しているかを測定した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:28:31 GMT)
Bridging Language Gaps: Advances in Cross-Lingual Information Retrieval with Multilingual LLMs [0.2] 言語間情報検索(CLIR)は、元のクエリとは異なる言語で書かれた関連文書を取得するという課題に対処する。
近年の進歩は、翻訳に基づく手法から埋め込みに基づくアプローチへと移行している。
この調査は、初期の翻訳に基づく手法から、最先端の埋め込み駆動および生成技術への展開の包括的概要を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:50:05 GMT)
Advances in Medical Image Segmentation: A Comprehensive Survey with a Focus on Lumbar Spine Applications [0.2] 医用画像分析(MIS)は、医療画像解析の基盤として機能し、正確な治療計画や様々な医療状況のモニタリングにおいて重要な役割を担っている。
本稿では,従来の画像処理技術と最新のディープラーニング手法のギャップを埋める,MIS手法の包括的かつ体系的な調査を行う。
この調査には、しきい値検出、エッジ検出、リージョンベースのセグメンテーション、クラスタリングアルゴリズム、モデルベースのテクニックが含まれている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:34:38 GMT)
SUPER-Net: Trustworthy Image Segmentation via Uncertainty Propagation in Encoder-Decoder Networks [0.2] SUPER-Netは、不確実性伝播による信頼できる画像セグメンテーションのためのフレームワークである。
分割された画像と画素単位の不確実性マップの2つの出力を同時に生成する。
以上の結果から, SUPER-Netは最先端モデルよりもロバスト性と精度が優れていた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:00:56 GMT)
The Social Laboratory: A Psychometric Framework for Multi-Agent LLM Evaluation [0.2] マルチエージェント討論を制御された「社会実験室」として活用する新しい評価枠組みを導入する。
特に認知活動において、割り当てられたペルソナが安定した、測定可能な心理測定プロファイルを誘導することを示す。
この研究は、動的、心理学的に基礎付けられた評価プロトコルの新しいクラスの青写真を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:10:28 GMT)
AttentionDep: Domain-Aware Attention for Explainable Depression Severity Assessment [0.2] 本稿では,説明可能な抑うつ度推定を駆動するドメイン認識型アテンションモデルであるAttentionDepを提案する。
ポストは、ユニグラムとビッグラムを使用して階層的にエンコードされ、臨床的に関連するトークンをハイライトする注意機構を持つ。
実験によると、AttentionDepは、データセット全体のグレードされたF1スコアにおいて、最先端のベースラインを5%以上上回っている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:20:53 GMT)
Discerning What Matters: A Multi-Dimensional Assessment of Moral Competence in LLMs [0.1] 道徳的能力は道徳的原則に従って行動する能力である。
大規模言語モデル(LLM)は、道徳的能力を求める状況においてますます展開されているため、この能力を実証的に評価することへの関心が高まっている。
i) 道徳的特徴を明確に強調した事前パッケージ化された道徳的シナリオへの過度な信頼、(ii) 道徳的推論よりも検証予測に焦点をあてること、(iii) 追加情報が必要な時に認識できないモデルの不適切なテスト。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:40:32 GMT)
The causal structure of galactic astrophysics [0.1] データ駆動の天体物理学は、現在、物体の性質間の相関の検出と特徴付けに依存している。
このプロセスは理論の予測の重要な部分を形成するデータに情報を利用することができない。
我々は因果発見を通じてこの情報を回復することを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:55:49 GMT)
Independent e- and m-anyon confinement in the parallel field toric code on non-square lattices [0.1] Kitaevのトーリックコードは、拡張された分解されたトポロジカルバルクフェーズをホストする最も単純なモデルである。
我々は, 連続時間量子モンテカルロ理論を用いて, ハニカム, 三角形, 立方体格子上の並列場トーリック符号の基底状態物理学を研究する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:56:18 GMT)
Benchmarking Optimization Algorithms for Automated Calibration of Quantum Devices [0.0] 本稿では,量子デバイスの校正のための最適化アルゴリズムの総合的な研究結果を紹介する。
我々のベンチマークには、Nelder-Meadや最先端のCovariance Matrix Adaptation Evolution Strategy (CMA-ES)のような広く使われているアルゴリズムが含まれている。
この結果に基づき,CMA-ESアルゴリズムを推奨し,全てのテストシナリオにおいて優れた性能を示す実証的証拠を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:27:07 GMT)
A Neuro-Fuzzy System for Interpretable Long-Term Stock Market Forecasting [0.0] Fuzzy Transformer(ファジィトランスフォーマー)は、マルチヘッド自己アテンションとファジィ推論システムを組み合わせた、新しいリカレントニューラルネットワークアーキテクチャである。
実世界の株価指数S&P500について検討した。
最初の結果は、解釈可能な予測と現在のパフォーマンストレードオフの特定の可能性を示している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:33:07 GMT)
Visualizing the state space of quantum trits, quadits, and pairs of qubits via toral geometry [0.0] 様々なラディクスに対する量子計算の研究において,トーリックな多様構造の新しい利用法を提案する。
特に,様々なラディクスに対する量子計算の研究において,トーリック多様体の新たな利用法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:50:50 GMT)
Vector-Valued Reproducing Kernel Banach Spaces for Neural Networks and Operators [0.0] ベクトル値付きRKBS (vv-RKBS) の一般定義を開発する。
浅い$mathbbRd$-valued ニューラルネットワークは、特定の vv-RKBS の要素であり、すなわち、積分とニューラル vv-RKBS のインスタンスであることを示す。
また、ニューラル演算子の関数構造を探索するため、DeepONetとHypernetworkアーキテクチャを分析し、それらも積分的でニューラルなvv-RKBSに属することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:46:23 GMT)
Typed Chain-of-Thought: A Curry-Howard Framework for Verifying LLM Reasoning [0.0] CoT(Chain-of-Thought)は、大規模言語モデルの推論能力を高める。
本稿では、カリー・ホワード対応に基づく新しい理論レンズを提案する。
我々はこの類似を運用し、CoTの非公式な自然言語ステップを形式化された型付き証明構造に抽出し、マッピングする方法を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:06:40 GMT)
Triple-Tone Microwave Control for Sensitivity Optimization in Compact Ensemble Nitrogen-Vacancy Magnetometers [0.0] トリプルトーン励起は、2つの直流磁気メトリープロトコルの標準シングルトーン制御よりも有利である。
パルス光検出磁気共鳴では、三重音駆動は低劣化状態において最大3倍の感度を向上する。
ラムゼー干渉計では、三重音励起はMW電力が制限された場合にのみ感度を向上させる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:54:48 GMT)
Triacontagonal proofs of the Bell-Kochen-Specker theorem [0.0] コクセターは、複数のポリトープが直交的に2次元に射影され、その頂点が複数の同心正則三角形(または30-角形)上にあることを指摘した。
これらの射影がコッチェン・セッカー図形にどのように修正され、ベル=コッチェン=スペーカーの定理のパリティ証明が抽出されるかを示す。
我々の構成は、すべてのポリトープに対して15の基底のパリティ証明を自明に生成し、同じタイプの他の多くの証明を2つに構築することを可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:02:56 GMT)
The View From Space: Navigating Instrumentation Differences with EOFMs [0.0] 地球観測ファウンデーションモデル(EOFM)は、リモートセンシングやその他の地球観測データを大量に処理し、多くの重要な地球観測タスクに影響を及ぼすツールとして広く普及している。
出現するトレンドは、事前学習されたモデルの出力を「埋め込み」として利用し、類似性検索やコンテンツ固有のクエリといった一般的なタスクに使用する高次元データを要約する。
ほとんどのEOFMモデルは、データの単一のモダリティのみに基づいて訓練され、異なるモダリティにわたるマッチングバンドによって適用またはベンチマークされる。
多様なセンサーアーキテクチャが内部表現に与える影響は、既存の研究から明らかでない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:53:45 GMT)
The Gauss-Markov Adjunction Provides Categorical Semantics of Residuals in Supervised Learning [0.0] 機械学習のインテリジェンス性と解釈可能性を高めることは、AI原則としての説明可能性の要求に対応する上で重要なタスクである。
本稿では、教師付き学習の最も基本的な形態を表す多重線形回帰モデルに焦点を当てた。
このフレームワークの本質的な構造は、ガウス-マルコフ共役(英語版)と呼ばれるものによって捉えられることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:16:42 GMT)
Temperature Dependence of the Response Functions of Graphene: Impact on Casimir and Casimi-Polder Forces in and out of Thermal Equilibrium [0.0] グラフェンの空間非局所応答関数の温度依存性に関する新しい研究結果
グラフェンの応答関数の2つのグラフェンシート間の平衡カシミール力と原子(ナノ粒子)とグラフェンシート間のカシミール・ポルダー力の計算への応用を検討した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:58:41 GMT)
Target Population Synthesis using CT-GAN [0.0] 本研究では,CT-GAN(Conditional Tabular Generative Adrial Network)と呼ばれる深層生成モデルを用いて,ターゲット個体群を創出する方法について検討する。
本研究は、旅行調査と地域レベルの人口データに対する人口合成モデルを評価する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:20:18 GMT)
Superpositions of Quantum Gaussian Processes [0.0] 連続変数(CV)系のガウス形式を一般化し、ガウス過程の量子重ね合わせをもたらす量子ビット/量子ビットとの相互作用を記述する。
閉形式の新しい方程式の集合を導出し、ハイブリッドシステムのユニタリかつオープンな力学を正確に扱うことができる。
一般的な形式主義を2つのパラダイム的な例で紹介する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:44:49 GMT)
Study of spin states in vacuum pair production via the Dirac-Heisenberg-Wigner formalism [0.0] 強磁場中で生成する電子-陽電子対の一般的なスピン分解運動量分布を導出した。
その結果、以前の文献で与えられるスピン解とヘリシティ解の運動量分布は、実際にはその2つの特別な場合であることが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:08:02 GMT)
Structured Quantum Baths with Memory: A QuTiP Framework for Spectral Diagnostics and Machine Learning Inference [0.0] 本稿では,QuTiPを用いたオープン量子システムモデリングのためのコンパクトなシミュレーションフレームワークを提案する。
本手法では,浴槽を調整可能な接続を持つ層状キュービットの有限集合としてモデル化する。
スペクトル分析は、理論、シミュレーション、実験にまたがる統一的で量子プラットフォームに依存しないツールとして機能する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:59:45 GMT)
Stabilizer Entropy and entanglement complexity in the Sachdev-Ye-Kitaev model [0.0] 本研究では,SYK4+SYK2モデルの基底状態および高励起状態における安定化器R'enyiエントロピー(SRE)と絡み合いエントロピーの相互作用について検討した。
SYK4 は実際には絡み合いと非安定化資源の両方の複雑なパターンによって特徴づけられるが、SYK2 は非普遍的で複雑ではない。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:03:23 GMT)
Simple Quantum Algorithm for Approximate $k$-Mismatch Problem [0.0] パターンと長さがそれぞれ$n$と$m$のテキストが与えられた$k$-mismatch問題では、テキストがパターンから少なくとも$k$のハミング距離を持つサブストリングを持っているかどうかを確認する必要がある。
パラメータ $epsilon in (0, 1]$ が与えられたとき、近似的に問題を解く単純な量子アルゴリズムを提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:09:55 GMT)
Security of device-independent quantum key distribution via monogamy relations from multipartite information causality [0.0] デバイス非依存(DI)暗号セキュリティは量子鍵配布プロトコル上で保証されていることを示す。
セキュリティは、量子到達可能な様々なパラメータが量子後盗聴器によって個々の攻撃に対して証明されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:40:46 GMT)
Securing IoT Devices in Smart Cities: A Review of Proposed Solutions [0.0] スマートシティのプライバシとセキュリティは、IoT(Internet of Things)デバイスが導入した脆弱性のため、常に危険にさらされている。
この記事では、スマートシティ環境でIoTデバイスを保護するためのセキュリティ提案についてレビューする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:36:32 GMT)
Sample-based Quantum Diagonalization Methods for Modeling the Photochemistry of Diazirine and Diazo Compounds [0.0] ジアジリンおよびジアゾ化合物は、カルベンを生成するための光反応性前駆体として広く用いられている。
本研究では, 代表的なジアジリン-ジアゾメタン系におけるカルベン生成の研究に, ハイブリッド量子古典ワークフローを利用する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:07:24 GMT)
Sample Complexity of Black Box Work Extraction [0.0] 量子システムから作業を引き出すのに必要な未知の状態のサンプル数を分析する。
未知の状態の1つのコピーだけで、エルゴトロピーが極限においてゼロに近づくことを証明できる。
本研究は、未知の状態の有効性を量子電池として評価するための、サンプル効率のよいプロトコルを開発する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:12:06 GMT)
Randomized Matrix Sketching for Neural Network Training and Gradient Monitoring [0.0] 本稿では,ニューラルネットワーク層活性化に対する制御理論的行列スケッチの初回適応について述べる。
スケッチされたアクティベーションストレージが、メモリ効率のよいニューラルネットワークのトレーニングと分析にどのように役立つかを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 02:49:40 GMT)
Quantum ergodicity and scrambling in quantum annealers [0.0] 量子異方体の完全な力学を記述するユニタリ進化作用素は、典型的には量子カオスである。
我々は、量子アニールのハイゼンベルク力学が、量子情報の揺らぎの目印である広範な演算子拡散につながることを観察する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:21:26 GMT)
Quantum Signatures of Strange Attractors [0.0] 古典力学では、散逸を伴う駆動系は、しばしば奇妙な誘引子として知られる複雑なフラクタル力学を示す。
本稿では、量子領域におけるそのような構造がどのように現れるかという根本的な問題に対処する。
位相空間における量子状態を表すためにフシミ分布を用いることで、このモデルの中で量子奇数誘引子を初めて可視化する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:52:16 GMT)
Quantum Optimization with Classical Chaos [0.0] 量子近似最適化アルゴリズム(QAOA)は、最大満足度や最大カットといった様々な問題を解決する強力なツールである。
しかし、ハードな計算問題は、古典的な変分パラメータ最適化に高い要求を与えるディープ回路を必要とする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:02:46 GMT)
Provably Optimal Quantum Circuits with Mixed-Integer Programming [0.0] 量子回路コンパイルのための奥行き対応最適化フレームワークを提案する。
対象ユニタリの正確な合成のために、線形大域的同値性を持つ混合整数線形プログラム(MILP)を定式化する。
正確なMILPを超越したスケーリングを実現するために,本研究では,主に時間とともに回転し,アクティブキュービットをカプセル化し,キュービット当たりのクロージャを強制する,新しい圧延回路最適化(RHO)を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:25:43 GMT)
Probing quantum advantage for solving the Fermi-Hubbard model with entropy benchmarking [0.0] 量子優位性ベンチマークフレームワークを開発する。
量子処理ユニットにおけるエントロピーの蓄積と、解の分解を目標最適化問題に結びつける。
二次元Fermi-Hubbardの基底状態を求める問題に対する適用性を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:10:30 GMT)
Probability-Phase Mutual Information [0.0] コヒーレンス測度は密度行列内の重ね合わせを定量化するが、純状態の異なる分布を通して同じ混合状態を生成するアンサンブルを区別することはできない。
まず,確率位相相互情報$I(P;Phi)$を導入し,測定可能確率と計測不能位相との統計的相関をアンサンブル全体で測定する。
我々は,アンサンブルコヒーレンスと密度行列コヒーレンスとの関連性を示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:50:51 GMT)
Probability distributions over CSS codes: two-universality, QKD hashing, collision bounds, security [0.0] 本稿では,CSS符号と2大学ハッシュプロトコルの新しい確率分布について述べる。
2つのユニバーサルQKDハッシュプロトコルのセキュリティは、厳密な正の定数$C$に対して2 frac52 (5 - frac32 ) + Mathrmqrlog stC$より安全である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:52:00 GMT)
Probability calibration for precipitation nowcasting [0.0] 降水量などの順序クラスでの誤校正をよりよく捉えるための新しい指標である,予測しきい値校正誤差 (ETCE) を導入する。
その結果,リードタイム条件付き選択的スケーリングは,予測品質を低下させることなく,モデルの誤校正を減少させることがわかった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:21:05 GMT)
Privacy Preserved Federated Learning with Attention-Based Aggregation for Biometric Recognition [0.0] A3-FLフレームワークはFVC2004指紋データを用いて評価される。
A3-FLフレームワークの精度、収束速度、堅牢性は標準FL(FedAvg)や静的ベースラインよりも優れている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:58:59 GMT)
Predicting the Geothermal Gradient in Colombia: a Machine Learning Approach [0.0] 地熱勾配の決定は 特定の地域の地熱エネルギーポテンシャルを評価するのに 不可欠です
地熱勾配の予測に教師付き機械学習の最近の進歩を活用するアプローチを提案する。
我々は,本モデルの予測精度が12%以内であり,他の著者による独立測定値が本モデルとよく一致していることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:55:18 GMT)
Practical considerations for assignment of photon numbers with SNSPDs [0.0] 超伝導ナノワイヤ単光子検出器(SNSPD)は光子数分解能(PNR)を可能にする
本研究は,光パルス形状と持続時間が精度に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:48:43 GMT)
Population Synthesis using Incomplete Information [0.0] 本稿では,不完全マイクロサンプルの学習にWasserstein Generative-Adversarial Network(WGAN)を用いた集団合成モデルを提案する。
マスクマトリックスを使用して、不足した値を表現し、WGANトレーニングアルゴリズムを提案し、不足した情報を持つトレーニングデータセットからモデルを学習する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:09:14 GMT)
Pointwise spinor quantum fields cannot be microcausal nor Poincaré covariant [0.0] 量子場の弱連続性は、大域双曲時空における等時正準共役(反)交換関係を規定する。
ワイトマンのノーゴー定理を拡張して、量子場の弱い連続性は、C2$ローレンツ空間におけるフェルミオン的微小因果性(英語版)(fermionic microcausality)を規定することを示した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:32:31 GMT)
Phase Transitions and Noise Robustness of Quantum Graph States [0.0] IIDパウリ雑音下での任意の理想グラフ状態とそのノイズの忠実度は、古典的なスピン系の分割関数にマッピング可能であることを示す。
我々は、純状態状態と、グラフ状態の接続性(次数)と空間的次元性の両方によって支配されるノイズ支配状態との間の相転移の出現を明らかにする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:08:47 GMT)
Performance of the empirical median for location estimation in heteroscedastic settings [0.0] 我々は、共通だが未知の位置パラメータを共有する独立対称実数値確率変数について考察する。
我々は、その推定誤差に基づいて、非漸近的上界と下界のマッチングを導出する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:49:22 GMT)
Perfect Quantum State Revivals: Designing Arbitrary Potentials with Specified Energy Levels [0.0] 任意の有界量子状態が時間内に周期的であるという異常な性質を持つ分析ポテンシャルが限られた数存在することが知られている。
本稿では、そのようなポテンシャルを設計する一般的な方法を提案する。
鍵となる要件は、そのエネルギー固有値は整数間隔(プレファクタまで)を持つことである。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:22:52 GMT)
Peak state transfer in continuous quantum walks [0.0] 連続時間量子ウォークをモデルとした量子ビットネットワークにおける高次状態伝達の概念であるピーク状態伝達について検討する。
ピーク状態伝達のスペクトル解析を行い、ピーク状態伝達の多くの例を見つけることができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:19:46 GMT)
Parametric modeling of shear wave velocity profiles for the conterminous U.S [0.0] 本研究は、VS-with-deepthを米国全体で記述する機能形式を定義する。
我々は,9000以上の地学的測定値の全国的コンパイルを用いて,関数のパラメータを校正する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:37:17 GMT)
Parallel-in-time quantum simulation via Page and Wootters quantum time [0.0] 我々はPage and Woottersフォーマリズムに触発された並列時間シミュレーションのための量子アルゴリズムを提案する。
提案アルゴリズムは,多体システムの時間特性をN$の異なる時間で計算できることを示す。
システムキュービットとクロックキュービットの間に生じる絡み合いが運用上の意味があることを厳密に証明する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:55:07 GMT)
On the Relativity of Quantumness as Implied by Relativity of Arithmetic and Probability [0.0] 同型算術の階層構造です
確率$p_k=gk(p)$, ここで$g$は$g_mathbbR$の間隔$[0,1]$に対する制限である。
量子二項確率は$g(p)=sin2fracpi2p$で定義される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:13:14 GMT)
On the Natural Gradient of the Evidence Lower Bound [0.0] 本稿では,エビデンス・ローバウンド(ELBO)のフィッシャー・ラオ勾配(自然勾配とも呼ばれる)について考察する。
このことは、エビデンスとその下限であるELBOの間のギャップが、本質的に、制約のない最適化の中で消滅する自然勾配を持つことを明らかにする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:08:39 GMT)
Non-stabilizerness in quantum-enhanced metrological protocols [0.0] 非安定化器性は真の量子(クリフォードの他に)演算を特徴づける。
安定化器R'enyi Entropy(SRE)による非安定化性の測定
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:08:39 GMT)
Neural Network Surrogates for Free Energy Computation of Complex Chemical Systems [0.0] 本稿では,モンテカルロ座標から直接CVを学習するニューラルネットワークサロゲートフレームワークを提案する。
MgCl2イオン対流法では, 簡単な距離CVと複雑な配位数CVの両方で高い精度を達成できた。
このフレームワークは、勾配に基づく自由エネルギー法で複雑なCVと機械で学習したCVを組み込むことを可能にし、生化学と材料シミュレーションの範囲を広げる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 19:28:16 GMT)
Multi-Scale Node Embeddings for Graph Modeling and Generation [0.0] ノード埋め込みアルゴリズムはグラフを入力として取り、その構造を幾何学空間内のノードを表す出力ベクトルにエンコードする。
関係のない2つの制限がこれらのアルゴリズムに影響を及ぼす。
本稿では,ブロックノードの埋め込みベクトルと,その構成ノードの埋め込みベクトルの和との統計的整合性を保証するマルチスケールノード埋め込み法を定義する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:33:38 GMT)
Modeling Market States with Clustering and State Machines [0.0] この研究は、解釈可能な確率的状態マシンを通じて金融市場をモデリングするための新しい枠組みを導入する。
我々は、拡大段階、縮小期、危機、回復など、根底にある体制をとらえる異なる市場国家を識別する。
これらの状態間のダイナミクスを表す遷移行列から、市場の時間的進化をモデル化する確率的状態マシンを構築する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:28:12 GMT)
Memory-Augmented Log Analysis with Phi-4-mini: Enhancing Threat Detection in Structured Security Logs [0.0] 構造化ログ解析のための二重メモリ検索拡張生成フレームワークである textbfDM-RAG を提案する。
これは最近の要約のための短期記憶バッファと、歴史的パターンのための長期FAISSインデックスメモリを統合している。
UNSW-NB15データセットでは、DM-RAG 53.64%の精度と98.70%のリコールがあり、リコール時のRAGベースラインと微調整された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:23:05 GMT)
Magneto-optical properties of Group-IV--vacancy centers in diamond upon hydrostatic pressure [0.0] G4V(-)またはG4V中心と呼ばれるダイヤモンドの負電荷型グループIV空孔欠陥は、量子情報処理において大きな注目を集めている。
高圧加水圧180GPaにおけるG4V中心の磁気光学特性について検討した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:31:54 GMT)
Machine Learning approach to reconstruct Density Matrices from Quantum Marginals [0.0] 本稿では,量子行列問題の特定の側面に対処する機械学習に基づくアプローチを提案する。
提案手法は,畳み込み復号化オートエンコーダと量子境界法を統合した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:41:15 GMT)
Machine Learning Detection of Lithium Plating in Lithium-ion Cells: A Gaussian Process Approach [0.0] 高速充電中のリチウムめっきは、キャパシティフェードを加速し、破滅的な安全障害を引き起こす重要な劣化機構である。
最近の研究で、DQ/dVのピークが4.0Vを超えることが、めっき開始の確実なサインであると確認されている。
電荷-電圧関係Q(V)を直接キャリブレーションした不確実性を有するプロセスとしてモデル化し,リチウムめっき検出のためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 01:51:15 GMT)
Logical Consistency Between Disagreeing Experts and Its Role in AI Safety [0.0] 2人の専門家は、テストについて意見が一致せず、両方が100%の正解ではないと結論付けるかもしれない。しかし、完全に同意すれば、評価は除外できない。
合意と不一致の効用におけるこの非対称性は、分類器の教師なし評価の論理を定式化することによって研究される。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:30:01 GMT)
Learning Passive Continuous-Time Dynamics with Multistep Port-Hamiltonian Gaussian Processes [0.0] 多段階ポート-ハミルトニアンガウス過程(MS-PHS GP)を提案する。
MS-PHS GP はベクトル場とハミルトン面の両方を遅延状態のない閉形式条件付けを可能にし、設計によりエネルギー収支と通過率を強制する。
我々は, ベクトル場回復とハミルトンの不確かさを, 質量スプリング, Van der Pol, Duffingベンチマークで実証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:55:28 GMT)
Learning From Simulators: A Theory of Simulation-Grounded Learning [0.0] シミュレーション・グラウンドド・ニューラルネットワーク(SGNN)は、メカニカル・シミュレーションから完全に合成データに基づいて訓練された予測モデルである。
我々は、SGNNを統一的な統計フレームワークに配置する。標準的な損失関数の下では、シミュレータによって訓練されたベイズ予測器として解釈することができる。
SGNNは遅延パラメータを復元し、ミスマッチ下では頑健であり、古典的ツールよりも優れています。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:40:45 GMT)
Lateral Tree-of-Thoughts Surpasses ToT by Incorporating Logically-Consistent, Low-Utility Candidates [0.0] Lateral Tree-of-Thoughts (LToT) は、ユーティリティを論理的一貫性から分離し、低ユーティリティだが一貫した候補を無駄ではなく資産として扱うドロップインコントローラである。
LToTは、横方向の小さなプローブを非常に広い横方向のセットに広げるキャップ付き連続半減レースである、横方向レーシングと短絡(LR--SC)を介して横方向を探索する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:23:58 GMT)
Knot invariants and indefinite causal order [0.0] 任意の有限個の事象に対する因果順序の不確定性の度合いと、重ね合わせにおける時空構成を測定するために、いくつかの新しい量化器を導入する。
事象間の因果次数の図式的および結び目論的表現を構築することにより、因果次数の定性または最大不定性は位相不変であることが分かる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:15:27 GMT)
Interpretable Machine Learning for Life Expectancy Prediction: A Comparative Study of Linear Regression, Decision Tree, and Random Forest [0.0] 本研究では、線形回帰(LR)、回帰決定木(RDT)、ランダムフォレスト(RF)の3つの機械学習モデルを評価する。
RFは最大予測精度(R2 = 0.9423$)を達成し、LRとRTTを大きく上回る。
これらの洞察は、公衆衛生上の課題に対処する上で、アンサンブル手法と透明性の相乗効果を強調している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:02:31 GMT)
Intelligent Healthcare Ecosystems: Optimizing the Iron Triangle of Healthcare (Access, Cost, Quality) [0.0] 米国はGDPの約17%を医療に費やしているが、不均一なアクセスと結果に直面している。
本稿では,生成型AIと大規模言語モデルを用いた統合型データ駆動型フレームワークを提案する。
iHEが無駄を減らし、ケアをパーソナライズし、価値に基づく支払いをサポートする方法を示します。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:10:57 GMT)
Integration of Calcium Imaging Traces via Deep Generative Modeling [0.0] スパイク推定アルゴリズムに頼らずに、カルシウムイメージング蛍光トレースから単一ニューロン表現を学習する方法を示す。
このアプローチは、バッチ効果を緩和しながら生物学的変動を保ちながら、最先端モデルよりも優れていることが判明した。
このフレームワークは、シングルニューロンダイナミクスの堅牢な可視化、クラスタリング、解釈を可能にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:40:11 GMT)
Integrated Security Mechanisms for Weight Protection in Memristive Crossbar Arrays [0.0] 非揮発性メムリスタは、ハードウェアが侵害された際に保存された重りを敵に抽出するなど、セキュリティ上の脅威に対して脆弱である。
キー付きパーミュータとウォーターマーク保護カラムの2つのセキュリティ機構を提案する。
提案手法は, 設計の大幅な変更を伴わず, 既存の経験的クロスバーアーキテクチャと効率よく統合する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:26:50 GMT)
Integrated Framework for LLM Evaluation with Answer Generation [0.0] 本稿では,エキスパート駆動型診断システムSPEEDを用いたテキスト自己修正記述評価という統合評価フレームワークを提案する。
SPEEDは、幻覚検出、毒性評価、語彙・文脈的適切性など、複数の次元にわたる専門家のフィードバックを積極的に取り入れている。
実験結果から,SPEEDはさまざまなドメインやデータセットに対して,堅牢かつ一貫した評価性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:09:25 GMT)
Imprints of screened dark energy on nonlocal quantum correlations [0.0] 局所的な第5の力制約による宇宙加速を駆動する光スカラー場を再現するスクリーニング機構の探索方法について検討する。
我々は、地球を周回する一対の質量を持つスピン-1/2粒子を特徴とするゲダンケン実験を考察する。
曲線化された時空スピンの進化に先立って開発された一般的な定式化を用いて,CHSHの不等式に対するスクリーニングの効果を計算した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:31:21 GMT)
Image Generation Based on Image Style Extraction [0.0] 本研究では,事前学習した生成モデルの生成能力を最大化する方法に焦点を当てた。
本稿では,スタイルエンコーダとスタイルプロジェクション層を用いた3段階のトレーニングスタイル抽出画像生成手法を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:23:09 GMT)
Higher-order spacings in the superposed spectra of random matrices with comparison to spacing ratios and application to complex systems [0.0] 与えられた$m(k)$と$beta'$に対して、$k(m)$の関数として得られる$beta'$の列はユニークであることを示す。
k=1$の場合、ポアソン分布への収束が対応する間隔よりも速いことが観察された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:34:11 GMT)
Gated X-TFC: Soft Domain Decomposition for Forward and Inverse Problems in Sharp-Gradient PDEs [0.0] Gated X-TFCは、前方および逆問題の両方のための新しいフレームワークである。
ソフトで学習されたドメイン分解によって制限を克服する。
ゲーテッドX-TFCは、計算効率の精度と劇的な改善を実現している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:43:02 GMT)
From Bell Products to GHZ: Quantum Memories via Emergent Hamiltonians [0.0] 我々は、Emergent Hamiltonianフレームワークを用いて、非常に絡み合った多体状態を保存する方法を示す。
多体局在のような他の現象とは異なり、この手法は量子状態の局所的特性と大域的性質の両方を保存している。
いくつかの例では、このプロトコルが最大絡み合ったマルチキュービット状態の保存に利用できることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:02:52 GMT)
Financial Stability Implications of Generative AI: Taming the Animal Spirits [0.0] 我々の結果は、AIエージェントが人間よりも合理的な決定をすることを示している。
AIによるトレーディングアドバイスへの依存度が高まると、資産価格バブルが減少する可能性がある。
最適な放牧は市場の規律を改善するが、この行動は金融安定の可能性を秘めている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 20:46:02 GMT)
Feature Identification via the Empirical NTK [0.0] 我々は、経験的ニューラルネットワーク(eNTK)の固有解析が、訓練されたニューラルネットワークで使われる特徴を表面化できることを示す。
eNTKは、最上部の固有空間が地上構造と整合する鋭い崖を示す。
我々は,層状eNTKが特定の層に特徴を局在させ,eNTK固有スペクトルの進化がグルーキング相転移の診断に有効であることを示す。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:39:48 GMT)
Fast frequency reconstruction using Deep Learning for event recognition in ring laser data [0.0] 約10ミリ秒以内に数百ヘルツの周波数を再構成できるニューラルネットワーク手法を提案する。
本手法は、GINGERINOの運用範囲における周波数推定精度を2倍に向上させ、標準フーリエ法より優れる。
高速周波数推定に加えて,レーザ不安定性や地震イベントなどの信号の物理的乱れを識別する自動分類フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:18:31 GMT)
False Discovery Rate Control via Bayesian Mirror Statistic [0.0] 本研究では,False Discovery Rate(FDR)制御に対するミラー統計手法をベイズモデルフレームワークに適用する。
本稿では、ベイズ的モデルの定式化に頼り、興味係数の後方分布を用いてミラー統計を構築することを提案する。
自動微分変分推論を頼りにすることで、高次元へのアプローチをスケーラブルに保ちます。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:24:50 GMT)
Exploiting Translational Symmetry for Quantum Computing with Squeezed Cat Qubits [0.0] 我々の自律型QECプロトコルは光子損失による論理的誤りの修正を可能にする。
また、小ステップのユニタリ演算を繰り返すことで、信頼性の高い論理演算の実装方法についても紹介する。
非直交的に圧縮された猫のコードを正確に読み取る回路を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:30:00 GMT)
Enhancing pair production with optimized chirped laser fields [0.0] 電子-陽電子対生成を促進するための最適チャープ場を量子論的手法を用いて検討した。
ガウスチャープフィールドで生成するEP対の運動量スペクトルと数密度について検討した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:33:11 GMT)
Emission of pairs of Minkowski photons through the lens of the Unruh effect [0.0] 我々はミンコフスキー光子の対の放出が3つの異なる過程に対応することを示した。
慣性フレームで観測された放射は、リンドラーフレームの散乱チャネルによって完全に記述することができる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:40:26 GMT)
Effective Dynamics for Weakly Interacting Bosons in an Iterated High-Density Thermodynamic Limit [0.0] 任意の体積の3次元トーラス上での弱い相互作用を持つボース気体の時間進化について検討する。
準完全ボース=アインシュタイン凝縮を示す初期状態のクラスを考慮する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:48:53 GMT)
Dynamically generated concatenated codes and their phase diagrams [0.0] 我々は、拡張木幾何学におけるユニタリ量子回路の作用としてコード連結を定式化する。
バルク誤差が存在する場合、符号化相はスピンガラスの一種であり、故障確率の分布が特徴である。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:02:25 GMT)
Dynamical system reconstruction from partial observations using stochastic dynamics [0.0] 観測データに基づく力学系の学習モデルは、多くの科学分野において興味深い。
本稿では,動的システムのための変分オートエンコーダの枠組みに基づく新しい手法を提案する。
本研究では,6つのテスト問題に対する提案手法の性能を実証し,シミュレーションおよび実験データについて述べる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:36:18 GMT)
Dynamical decoupling of interacting spins through group factorization [0.0] 我々は、既に望ましくないハミルトニアンに存在している対称性が、デカップリング配列の複雑さを減らすためにどのように利用できるかを示す。
マヨラナ星座と点群分解を用いて、相互作用ハミルトニアンの対称性を特定し、活用する様々なスピン系において、多くの関連する例を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:09:27 GMT)
Diffraction by Circular and Triangular Apertures as a Diagnostic Tool of Twisted Matter Waves [0.0] 円周開口は円筒対称性を保ち、半径が$|ell|$に依存するが符号に敏感な遠距離場プロファイルを生成する。
等辺三角形は軸対称を破り、大きさと符号を$ell$でエンコードする構造パターンを得る。
この結果は、構造化量子ビームのOAM内容を読み取るための単純で受動的で頑健な方法として三角回折を確立した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 12:37:17 GMT)
Deterministic Detection of Single Ion Implantation [0.0] 集束イオンビームを用いた単一イオン注入は、量子技術の高空間分解能とマスクレスドーピングを可能にする。
本研究では, 各種イオン種の単一イオン検出効率について検討した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:39:59 GMT)
Deciphering WONTFIX: A Mixed-Method Study on Why GitHub Issues Get Rejected [0.0] 調査では、GitHub上のさまざまなオープンソースリポジトリで willtfix とラベル付けされている問題の存在状況と理由について調査している。
調査の結果、GitHub上のプロジェクトの約30%が、いくつかの問題に対して wontfixラベルを適用していることがわかった。
この研究は、ユーザ固有のコントロールファクタからメンテナ固有の決定まで、ラベル付け問題の背後にある8つの一般的なテーマを、Ventfixとして特定した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 23:22:18 GMT)
DECOR: Deep Embedding Clustering with Orientation Robustness [0.0] 私たちは、ウェハマップから一貫したクラスタに複雑な欠陥パターンをグループ化する、指向性フレームワークを備えたディープクラスタリングであるDECORを紹介します。
提案手法をオープンソースのMixedWM38データセット上で評価し,手動チューニングなしでクラスタを検出できることを実証した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 18:22:03 GMT)
DACoN: DINO for Anime Paint Bucket Colorization with Any Number of Reference Images [0.0] DACoNは、基礎モデルを利用して、ライン描画でも部分レベルのセマンティクスをキャプチャするフレームワークである。
提案手法は,CNNから高分解能な空間的特徴を持つ基礎モデルから低分解能な意味的特徴を融合して,きめ細かな特徴抽出を行う。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 06:59:16 GMT)
Cumulant expansion approach to the decay dynamics of interacting Mössbauer nuclei after strong impulsive excitation [0.0] 加速器ベースのX線源の最近の進歩は、M"オスバウアー核のアンサンブルの励起を実験可能性に近づける。
ここでは、任意の励起度で大きな核アンサンブルを効率的にモデル化できる非線形方程式の集合を導出する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:41:14 GMT)
Credit Default Prediction with Projected Quantum Feature Models and Ensembles [0.0] 我々は、投影された量子特徴写像に基づくハイブリッド量子古典機械学習モデルと、従来のモデルとのアンサンブル統合を用いて、クレジットカードのデフォルト予測の問題を調べる。
以上の結果から,アンサンブルモデルでは,"デフォルトリスク"(CDR)測定で表される純粋に古典的な結果がわずかに改善できることが示唆された。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:21:44 GMT)
Conversational Agents for Building Energy Efficiency -- Advising Housing Cooperatives in Stockholm on Reducing Energy Consumption [0.0] 本稿では、エネルギー効率に関する協力者への助言を目的として、SPARAと呼ばれる会話エージェントシステムを紹介した。
SPARAはRetrieval-Augmented Generationフレームワークを言語モデルで活用することで、エネルギー効率のアドバイザとして機能する。
予備的な結果は、SPARAが自治体のエネルギー効率の専門家に匹敵する精度80%のエネルギー効率アドバイスを提供できることを示している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:40:11 GMT)
Continual Learning with Query-Only Attention [0.0] 継続的な学習には、データポイントを繰り返すことなく、データのストリームから学ぶことが含まれる。
本稿では,キーと値を捨てるクエリのみのアテンション機構を提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:14:34 GMT)
Computing entanglement costs of non-local operations on the basis of algebraic geometry [0.0] 分離可能な(SEP)チャネルに対する最適化を体系的に単純化するフレームワークを開発する。
本フレームワークは,SEPチャネル下での非ローカル操作の実装において,ワンショットの絡み合いコストの計算に応用する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:02:38 GMT)
Computational-Assisted Systematic Review and Meta-Analysis (CASMA): Effect of a Subclass of GnRH-a on Endometriosis Recurrence [0.0] 本研究では,情報検索駆動型ワークフローであるCASMAを評価し,効率,透明性,体系的レビューを改善する。
ファジィマッチングと正規表現(regex)を併用したハイブリッドアプローチ PRISMA ガイドラインは,手動スクリーニングの前に半自動重複とフィルタリングレコードを容易にする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 16:32:27 GMT)
Color Models in Image Processing: A Review and Experimental Comparison [0.0] 色モデルと空間のレビュー、理論的基礎、計算的性質、実用的応用の解析。
RGB、CMYK、YUVといった伝統的なモデル、CIELABやCIELUVのような知覚的に均一な空間、ファジィベースのアプローチなどがある。
実験では、既存のカラーモデルのギャップが明らかとなり、HS*ファミリーが人間の知覚に最も適していることが示されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:06:02 GMT)
Cloud Investigation Automation Framework (CIAF): An AI-Driven Approach to Cloud Forensics [0.0] クラウド調査自動化フレームワーク(CIAF)は,クラウドの法医学的ログを体系的に調査するフレームワークである。
CIAFはセマンティック検証を通じてユーザ入力を標準化し、曖昧さを排除し、ログ解釈の一貫性を確保する。
その結果,ランサムウェア検出の精度,リコール,F1スコアが93%向上した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:05:47 GMT)
Causally-Informed Reinforcement Learning for Adaptive Emotion-Aware Social Media Recommendation [0.0] ソーシャルメディアレコメンデーションシステムは、ユーザの感情的な体験を形作る上で中心的な役割を果たす。
本稿では,ユーザの感情的軌跡の進化に基づいてコンテンツをパーソナライズする感情対応型ソーシャルメディアレコメンデーションフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:31:23 GMT)
COMMET: orders-of-magnitude speed-up in finite element method via batch-vectorized neural constitutive updates [0.0] アーキテクチャを再設計し,高コスト更新を高速化するオープンソース有限要素フレームワークを導入する。
FE COMMETは、バッチ化およびベクトル化評価をサポートする新しいアセンブリアルゴリズム、自動微分に取って代わる計算グラフ最適化デリバティブ、MPIによる分散メモリ並列性をサポートする。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:31:56 GMT)
Bound on the distance between controlled quantum state and target state under decoherence [0.0] 我々は、2つの制御された量子系間の距離の上限をデコヒーレンスの存在と欠如に設定する。
境界は、与えられた目標状態に対する制御の達成度をデコヒーレンスの下で定量化し、方程式を解くことなく簡単に計算できる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 08:52:36 GMT)
Block-Encoding Tensor Networks and QUBO Embeddings [0.0] 我々は,任意のテンソルネットワーク(TN)を局所ユニタリ列に変換するアルゴリズムを提案する。
構成は各TNを局所等距離として埋め込み、それをユニタリに拡張する。
我々は、形式文、擬符号、資源公式、および一般量子作用素の状態準備と学習への利用に関する議論を提供する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:15:22 GMT)
Beyond Pass/Fail: The Story of Learning-Based Testing [0.0] 学習ベーステスト(LBT)は、学習とテストのプロセスを融合して、テストと行動の妥当性の両方を達成する。
LBTは能動学習を利用してシステム・アンダー・テスト(SUT)のモデルを推論する
この体系的な文献レビューは、LBTの創始と発展に関する総合的な視点を研究者に提供することを目的としている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:04:33 GMT)
Architectural Transformations and Emerging Verification Demands in AI-Enabled Cyber-Physical Systems [0.0] CPS(Cyber-Physical Systems)では、デジタル技術が物理世界と出会う際にリアルタイムの融合が発生する。
AI統合の進歩にもかかわらず、このシフトがCPSアーキテクチャ、運用上の複雑さ、検証プラクティスにどのように影響するかを理解する上で、大きなギャップは依然として残っている。
この要約は、Simulinkで設計されたAI駆動制御モデルと従来の制御モデルとのアーキテクチャ的区別と、システム検証におけるそれぞれの意味について考察する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 05:09:12 GMT)
Approximation of differential entropy in Bayesian optimal experimental design [0.0] 設計から独立しているか、明示的に評価できるような設定において、期待される情報ゲインを推定することに集中する。
これにより、問題は最大エントロピー推定に還元され、期待される情報ゲインに固有のいくつかの課題が軽減される。
我々は,この戦略が,完全な情報取得推定のための最先端手法に匹敵する,あるいはそれ以上の収束率を達成することを証明した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:17:07 GMT)
Anomaly of conserved and nonconserved axial charges in Hamiltonian lattice gauge theory [0.0] 保存された軸方向電荷は連続時空における軸方向の異常関係を正しく再現することを示す。
我々の発見は、格子ゲージ理論のハミルトン時間発展における二重化アーティファクトに関する貴重な教訓となる。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:18:59 GMT)
Anisotropic and non-additive interactions of a Rydberg impurity in a quantum bath [0.0] ボース=アインシュタイン凝縮体に浸漬されたリドベルク原子に焦点をあて、リドベルク不純物の内部状態縮退が構成に依存しない非付加ポテンシャルを生じさせる。
このアプローチは、Rydbergの不純物が量子浴に浸漬されたときの異方性と非付加性特性を捉え、Fr"ohlichパラダイムを超えた多くの量子不純物問題に広範な適用性を与える。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 22:15:45 GMT)
An InAsSb surface quantum well with in-situ deposited Nb as a platform for semiconductor-superconductor hybrid devices [0.0] 分子線エピタキシャル成長したInAsSb表面量子井戸と、その場で堆積したNbトップ層を用いた新しい半導体-超伝導ハイブリッド材料を提案する。
Nbのその場堆積は、InAsSb量子井戸との強い結合を可能にする高品質な界面をもたらす。
大きな誘導超伝導ギャップと強いスピン軌道相互作用が組み合わさって、この物質はゲート可変超伝導とトポロジカル超伝導デバイスを探索するための魅力的なプラットフォームとなっている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:42:21 GMT)
An Ethically Grounded LLM-Based Approach to Insider Threat Synthesis and Detection [0.0] 本研究では,大規模言語モデル(LLM)であるClaude Sonnet 3.7を用いて,サイログメッセージを動的に合成する手法を提案する。
メッセージは、高度に不均衡な(1%のインサイダー脅威)によって、現実世界のデータ分散を反映する
Sonnet 3.7は、ほとんど全ての指標、特に誤報の低減と検出精度の向上において、一貫してGPT-4oを上回った。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:55:29 GMT)
An Analytical and AI-discovered Stable, Accurate, and Generalizable Subgrid-scale Closure for Geophysical Turbulence [0.0] この閉鎖を伴う大渦シミュレーション(LES)は正確で安定であり、極端なものを含むDNS統計を再現する。
また、新しい閉包はテイラー展開の4階の閉包から導かれることも示している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 00:32:31 GMT)
An Agent-Based Framework for Automated Higher-Voice Harmony Generation [0.0] 本フレームワークは,入力された楽譜を解析,標準化するための音楽摂取エージェントと,コードフォーマー(トランスフォーマーモデル)を用いたコード知識エージェントと,複雑なコード記号の構成音を解釈し,提供するハーモニー生成エージェントと,メロジカルかつリズミカルに相補的な調和ラインを構成するハーモニー生成エージェントとからなる。
特定のタスクを専門のエージェントに委譲することで、人間のミュージシャンの協調プロセスを効果的に模倣する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 07:00:41 GMT)
AgentMisalignment: Measuring the Propensity for Misaligned Behaviour in LLM-Based Agents [0.0] 大規模言語モデル (LLM) エージェントはより広く普及し、関連するミスアライメントリスクが増加する。
本研究では,モデルが追求する内部目標と,デプロイ者の意図する目標との相反として,不整合にアプローチする。
現実的なシナリオにおいて,LLMエージェントの適合性を評価するためのベンチマークスイートであるtextscAgentMisalignmentを導入する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 15:15:52 GMT)
Adaptive Data-Knowledge Alignment in Genetic Perturbation Prediction [0.0] ALIGNEDは、Abductive Learningパラダイムに基づいた、神経象徴的なフレームワークである。
神経と象徴的な要素を整合させ、体系的な知識の洗練を行う。
その結果,ALIGNEDは高いバランスの取れた一貫性を達成し,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:48:43 GMT)
Accurate Estimation of Mutual Information in High Dimensional Data [0.0] 相互情報(MI)は2つの変数間の統計的依存の基本的な尺度である。
最近の機械学習ベースの推定器は、将来性を示すが、その精度はデータセットのサイズと構造に敏感に依存する。
これらのギャップを、標準ベンチマークと新しい合成データセットで古典的および神経的MI推定器を体系的に評価することで、埋める。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 14:41:28 GMT)
AI in data science education: experiences from the classroom [0.0] 本研究では、ChatGPTのようなAI、特に大規模言語モデル(LLM)の教育環境への統合について検討する。
Wageningen Universityのデータサイエンスコースのコースコーディネータとのインタビューは、教室でAIに関連するメリットと課題の両方を特定している。
研究は、責任あるAI利用の重要性、倫理的考察、教育的な成果を確実にするためにアセスメント手法を適用する必要性を強調している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 11:45:25 GMT)
A-VERT: Agnostic Verification with Embedding Ranking Targets [0.0] 構造自由評価法を提案する。
本手法は,対象候補と任意のLM生成テキストとをマッチングするために,意味埋め込み距離を利用する。
その結果, 回帰スコアは0.97, 精度は96%であった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:26:03 GMT)
A principled way to think about AI in education: guidance for action based on goals, models of human learning, and use of technologies [0.0] 教育目標を実践可能なプラクティスに広げる一連の原則を具体的に述べます。
この記事では、原則化されたアプローチが、その基本的なミッションを維持しながら、新しいツールを活用するための高等教育をいかに可能にしているかを説明している。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 21:19:12 GMT)
A Visual Diagnostics Framework for District Heating Data: Enhancing Data Quality for AI-Driven Heat Consumption Prediction [0.0] 本稿では,視覚診断を用いたデータ品質の評価と改善のための体系的なアプローチを提案する。
ダッシュボードには,時系列プロットやヒートマップ,ボックスプロット,ヒストグラム,相関行列,歪や異常検出などの異常検出など,Pythonベースの可視化技術が採用されている。
この研究は、ビジュアルデータ検査のためのスケーラブルで一般化可能なフレームワークに貢献し、AI駆動のエネルギー管理システムにおけるデータ品質の重要な役割を明らかにしている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 13:21:55 GMT)
A Monoid Ring Approach to Color Visual Cryptography [0.0] ビジュアル暗号スキーム(英: visualcryptgraphy scheme)は、秘密情報が画像であり、その共有が透明性に印刷される秘密共有スキームである。
このようなスキームは、秘密を回復するために暗号ツールの知識を一切必要としない。
QRコードや医療画像の共有など、広く応用されている。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 10:51:45 GMT)
A Hitchhiker's Guide to Privacy-Preserving Digital Payment Systems: A Survey on Anonymity, Confidentiality, and Auditability [0.0] 暗号資産と中央銀行デジタル通貨(CBDC)は、分散コンピューティング環境における価値の交換方法を変えつつある。
これらのシステムは、暗号化プリミティブ、プロトコル設計、システムアーキテクチャを組み合わせて、透明性と効率性を提供します。
本調査では,プライバシ保護型デジタル決済システムの概要について概観する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 09:51:36 GMT)
A Fast and Precise Method for Searching Rectangular Tumor Regions in Brain MR Images [0.0] 提案手法はセグメンテーションネットワークとユーザ制御可能なサーチメトリックを用いた高速サーチ手法からなる。
3次元フルサーチを用いた場合,提案手法は従来の手法よりも100~500倍高速であった。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 04:35:52 GMT)
A Contextual Seven-Valued Logic (\emph{Saptabhangīnaya}) for Quantum Systems [0.0] 我々は、イアンフサプタブン=イナヤのジャイナ教義をモデルとした文脈的七値論理を導入する。
1つの定式化において、各命題は与えられた文脈内でその状態が真、偽、あるいは偽であることを示す三重項 $(t,f,u)$ を割り当てられる。
別の例では、文脈は量子化された条件によって明示的に定式化され、ボーアの見解と直接的に一致し、意味は実験的な配置に由来する。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 17:07:22 GMT)
A Call to Action for a Secure-by-Design Generative AI Paradigm [0.0] 大規模言語モデル(LLM)は、インジェクションや他の敵攻撃に対して脆弱である。
本稿では,決定論的かつセキュアな対話を実現するフレームワークであるPromptShieldを紹介する。
その結果,モデルの安全性と性能が向上し,精度,リコール,F1スコアが約94%向上した。
論文参考訳(メタデータ) (Wed, 01 Oct 2025 03:05:07 GMT)