Fugu-MT: arxivの論文翻訳(概要)

ATTS: Asynchronous Test-Time Scaling via Conformal Prediction [112.5]
大規模な言語モデル(LLM)は、テスト時のスケーリングの恩恵を受けるが、しばしば高い推論遅延によって妨げられる。統計的に保証された適応スケーリングフレームワークであるATTS(Asynchronous Test-Time Scaling)を紹介する。 ATTSは、テストタイムのスケーリングにおいて最大56.7倍のスピードアップと4.14倍のスループット向上を実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:40:34 GMT)
Sequential Diffusion Language Models [110.1]
拡散言語モデル(DLM)は理論効率が強いが、固定長の復号化とキー値キャッシュとの非互換性によって制限される。次点と次点の予測を統一するNext Sequence Prediction (NSP)を導入する。本稿では,事前学習した自己回帰言語モデル(ALM)を最小限のコストで再現可能な逐次拡散言語モデル(SDLM)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:59:15 GMT)
HunyuanImage 3.0 Technical Report [108.4]
HunyuanImage 3.0は、自動回帰フレームワーク内でのマルチモーダル理解と生成を統合する、ネイティブなマルチモーダルモデルである。 HunyuanImage 3.0は、これまでで最大かつ最も強力なオープンソース画像生成モデルである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:14:10 GMT)
Truly Assessing Fluid Intelligence of Large Language Models through Dynamic Reasoning Evaluation [106.2]
大きな言語モデル(LLM)は、人間のような思考を反映する印象的な推論能力を示している。既存の推論ベンチマークでは、ドメイン固有の知識(結晶化インテリジェンス)に焦点を当てるか、解釈可能性に欠ける。階層的認知フレームワークを基盤とした動的推論評価ベンチマークであるDRE-Benchを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:54:56 GMT)
Sim-DETR: Unlock DETR for Temporal Sentence Grounding [104.8]
時間文グラウンドディングは、与えられたテキストクエリに対応するビデオ内の正確なモーメントを特定することを目的としている。 DETRを強化するために設計された典型的な戦略は改善せず、その課題における性能を低下させる可能性さえある。 2つの小さな修正を加えて標準DETRを拡張するSim-DETRを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:21:10 GMT)
EarthMind: Leveraging Cross-Sensor Data for Advanced Earth Observation Interpretation with a Unified Multimodal LLM [103.8]
地球観測(EO)データ分析は、環境と人間の動態のモニタリングに不可欠である。最近のMultimodal Large Language Models (MLLM) は、EO理解の可能性を秘めているが、シングルセンサー入力に限定されている。我々は、シングルセンサーとクロスセンサーの両方の入力を処理する統合視覚言語フレームワークであるEarthMindを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:14:53 GMT)
The Clever Hans Mirage: A Comprehensive Survey on Spurious Correlations in Machine Learning [99.0]
機械学習モデルは、入力の非本質的特徴と対応するラベルの間の急激な相関に敏感である。本稿では,機械学習モデルにおける突発的相関に対処する既存の最先端手法の詳細な分類法とともに,この問題の包括的調査を行う。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:05:52 GMT)
SparseD: Sparse Attention for Diffusion Language Models [98.1]
拡散言語モデル(DLM)は自己回帰モデル(AR)に代わる有望な代替手段を提供する既存のオープンソースDLMは、高い推論遅延に悩まされている。 DLMのための新しいスパースアテンション手法であるスパースDを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:10:10 GMT)
LLaVA-OneVision-1.5: Fully Open Framework for Democratized Multimodal Training [92.9]
LLaVA-OneVision-1.5はLMMの新しいファミリーであるこれは、計算コストと財政コストを大幅に削減して最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:52:55 GMT)
Agentic Reinforcement Learning with Implicit Step Rewards [92.3]
大規模言語モデル (LLMs) は強化学習 (agentic RL) を用いた自律的エージェントとして発展している。我々は,標準RLアルゴリズムとシームレスに統合された一般的なクレジット割り当て戦略であるエージェントRL(iStar)について,暗黙的なステップ報酬を導入する。我々は,WebShopとVisualSokobanを含む3つのエージェントベンチマークと,SOTOPIAにおける検証不可能な報酬とのオープンなソーシャルインタラクションについて評価した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:47:55 GMT)
Trained Mamba Emulates Online Gradient Descent in In-Context Linear Regression [90.9]
Mambaは、Long-Sequence Modelingのための線形複雑性を持つ効率的なTransformer代替品である。最近の実証研究は、Mambaのテキスト内学習(ICL)がTransformersと競合していることを示している。本稿では,線形回帰 ICL タスクにおける Mamba のトレーニングダイナミクスについて検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:48:49 GMT)
Game-RL: Synthesizing Multimodal Verifiable Game Data to Boost VLMs' General Reasoning [89.9]
視覚言語強化学習(RL)は主に狭い領域に焦点を当てている。ビデオゲームは本質的に、検証が容易なリッチなビジュアル要素とメカニクスを提供します。ビデオゲームにおけるマルチモーダルかつ検証可能な報酬を完全に活用するために,Game-RLを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:36:59 GMT)
Seedream 4.0: Toward Next-generation Multimodal Image Generation [88.9]
Seedream 4.0は効率的かつ高性能なマルチモーダル画像生成システムである。テキスト・トゥ・イメージ(T2I)合成、画像編集、複数画像合成を単一のフレームワークに統合する。 Seedream 4.0は、多種多様な知識中心の概念にまたがる数十億のテキストイメージ対で事前訓練されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:10:54 GMT)
SLA: Beyond Sparsity in Diffusion Transformers via Fine-Tunable Sparse-Linear Attention [88.5]
Diffusion Transformer(DiT)モデルでは、特にビデオ生成において、注意遅延が大きなボトルネックとなっている。注目重量は2つの部分に分けられる: 高いランクの大型重量のごく一部と、非常に低いランクの残りの重量の2つである。本稿では,拡散モデルを高速化するために,疎度と直線的注意を融合させる訓練可能な注意法SLAを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:58:59 GMT)
Interaction Field Matching: Overcoming Limitations of Electrostatic Models [85.9]
静電場整合(EFM)は、近年、電気コンデンサのアイデアを用いて、データ生成と転送のための物理に着想を得たパラダイムとして登場した。我々は、静電気以外の一般的な相互作用場を利用できるEMFの一般化であるInteraction Field Matching (IFM)を提案する。一連の玩具および画像データ転送問題に対して,その性能を示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:45:05 GMT)
Electric Currents for Discrete Data Generation [85.9]
ECD$2$Gは電気工学理論に基づく離散的なデータ生成の先駆的手法である。 ECD$2$G法を説明するための概念実証実験を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:57:18 GMT)
LightFair: Towards an Efficient Alternative for Fair T2I Diffusion via Debiasing Pre-trained Text Encoders [84.4]
本稿では,テキストエンコーダの悪影響に対処して,公平なテキスト・画像拡散モデル(T2I DM)を実現するための,新しい軽量なアプローチを提案する。 T2I DMは複数のコンポーネントから構成されており、テキストエンコーダは最も微調整可能なフロントエンドモジュールである。本手法は,SOTA脱バイアスをトレーニング負荷のわずか1/4ドルで達成し,サンプリング負荷がほぼ増加しない。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:46:39 GMT)
RADAR: A Risk-Aware Dynamic Multi-Agent Framework for LLM Safety Evaluation via Role-Specialized Collaboration [81.4]
大規模言語モデル(LLM)の既存の安全性評価手法は、固有の制約に悩まされている。リスク概念空間を再構築する理論的枠組みを導入する。マルチエージェント協調評価フレームワークRADARを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:35:32 GMT)
Visual CoT Makes VLMs Smarter but More Fragile [79.3]
チェーン・オブ・ソート(CoT)技術は視覚言語モデル(VLM)における推論を著しく向上させた Visual CoTは、興味のある領域のトリミングや注釈付けなどの明示的なビジュアル編集を推論プロセスに統合する。視覚摂動下での視覚的CoTロバスト性の最初の体系的評価について述べる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:19:59 GMT)
SPELL: Self-Play Reinforcement Learning for evolving Long-Context Language Models [79.0]
SPELLは、長文推論のためのスケーラブルでラベルなしの最適化を可能にする。本稿では、文書長を徐々に向上させる自動カリキュラムと、モデルの進化する機能に質問の難しさを適応させる報奨関数を導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:08:10 GMT)
HieraTok: Multi-Scale Visual Tokenizer Improves Image Reconstruction and Generation [77.9]
HieraTokは、ViT(Multi-scale Vision Transformer)ベースの新しいトークンである。これらの設計を組み合わせることで、HieraTokは画像再構成と生成タスクの両方において大幅な改善を実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:30:26 GMT)
GUI-Shepherd: Reliable Process Reward and Verification for Long-Sequence GUI Tasks [75.5]
本稿では,エージェントを誘導するプロセス・リワード・モデルを提案する。 Gui-Shepherdは52ドル(約5,800円)のインタラクションからなるさまざまな大規模データセットでトレーニングされている。 GUIエージェントにおけるプロセス管理の体系的な研究を最初に行った。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:35:16 GMT)
Knowledge Homophily in Large Language Models [75.1]
大規模言語モデル(LLM)における類似知識のホモフィリパターンについて検討する。我々は LLM の知識を三重項レベルと実体レベルの両方の知識チェックを通じてグラフ表現にマッピングする。このホモフィリ原理により、三重項の実体レベルの知識度スコアを推定するグラフニューラルネットワーク(GNN)回帰モデルを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:40:27 GMT)
Estimating Time Series Foundation Model Transferability via In-Context Learning [74.7]
時系列基礎モデル(TSFM)は、大規模な事前訓練を通じて強力なゼロショット予測を提供する。微調整は、公開データに制限のあるドメインのパフォーマンス向上に依然として不可欠である。モデル選択をコンテキスト内学習問題として再キャストする転送可能性推定フレームワークであるTimeTicを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:07:13 GMT)
Do Larger Language Models Generalize Better? A Scaling Law for Implicit Reasoning at Pretraining Time [73.2]
この研究は、モデルサイズのスケーリングによる直感的効果を示し、言語モデル(LM)におけるスケーリングと推論の関係に関する新たな洞察を提供する。我々は,実世界の大規模知識グラフの構造と分布を再現する合成暗黙のマルチホップ推論環境において,ゼロからLMを事前学習する。次に、実世界の事前学習における暗黙的推論の単純化とみなすことができるマルチホップ推論を必要とする、グラフの欠落したエッジを完遂するLMの能力を評価する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:01:31 GMT)
EditScore: Unlocking Online RL for Image Editing via High-Fidelity Reward Modeling [71.8]
強化学習(RL)は有望な解決策を提供するが、画像編集におけるその採用は、高忠実で効率的な報酬信号の欠如によって妨げられている。我々は、最先端の特殊報酬モデルの開発を中心に、この障壁を克服するための包括的な方法論を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:28:24 GMT)
GenView++: Unifying Adaptive View Generation and Quality-Driven Supervision for Contrastive Representation Learning [71.5]
GenView++はイメージベースのコントラスト学習のための統合フレームワークである。多様なセマンティック・コヒーレントなビューを合成するマルチソース適応ビュー生成機構を導入する。品質駆動型コントラスト学習機構は、各ペアのセマンティックアライメントと多様性を評価して、トレーニングコントリビューションを動的にリウェイトする。実験では、視覚と視覚言語の両方のタスクにおけるGenView++の有効性が示されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:35:37 GMT)
Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning [71.3]
サンプルプルーニングとトークンプルーニングを戦略的に協調する統合フレームワークを提案する。 Q-Tuningは、トレーニングデータの12.5%しか使用せず、全データSFTベースラインに対する平均38%の改善を実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:27:38 GMT)
A Statistical Learning Perspective on Semi-dual Adversarial Neural Optimal Transport Solvers [70.4]
本稿では,ミニマックス二次OT解法により得られた近似OT写像の一般化誤差の上限を確立する。解析は2次OTに焦点をあてるが、同様の境界は一般的なOTの場合に導出され、将来の研究に期待できる方向を踏むことができると信じている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:46:45 GMT)
Mix-Ecom: Towards Mixed-Type E-Commerce Dialogues with Complex Domain Rules [69.0]
この研究はまず、Mix-EComと呼ばれる新しいコーパスを紹介した。これは、実際のカスタマーサービス対話とポストプロセッシングに基づいて構築され、ユーザのプライバシを削除し、CoTプロセスを追加する。具体的には、4つの対話型(QA,レコメンデーション,タスク指向対話,チャット)、3つのeコマースタスク型(プレセール,ロジスティクス,アフターセール)、82のeコマースルールを含んでいる。その結果、現在のeコマースエージェントはeコマース対話を扱う十分な能力を持っていないことがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:19:27 GMT)
Fast Thinking for Large Language Models [67.7]
我々は、訓練中にのみ簡潔なCoTスケッチを使用して個別戦略事前のコードブックを学習するフレームワークであるLatent Codebooks for Fast Thinkingを紹介した。推論では、コードブックから抽出した少数の連続的思考スイッチのモデル条件を1パスにすることで、明確な推論トークンを生成することなく、戦略レベルのガイダンスを可能にする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:19:48 GMT)
QuantSparse: Comprehensively Compressing Video Diffusion Transformer with Model Quantization and Attention Sparsification [67.2]
拡散変換器は素晴らしいビデオ生成能力を示すが、その計算とメモリの禁止コストは実際の展開を妨げる。モデル量子化とアテンションスパシフィケーションは圧縮に有望な2つの方向であるが、それぞれがアグレッシブ圧縮の下で深刻な性能劣化を被っている。モデル量子化と注意散布を統合した統合フレームワークである textbfQuantSparse を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:49:44 GMT)
InfMasking: Unleashing Synergistic Information by Contrastive Multimodal Interactions [66.5]
マルチモーダル表現学習において、モダリティ間の相乗的相互作用は相補的な情報を提供し、ユニークな結果を生み出す。既存の手法は、シナジスティックな情報の完全なスペクトルを捉えるのに苦労し、そのような相互作用が重要となるタスクにおいて、最適以下のパフォーマンスをもたらす。我々は、textbfInfinite textbfMasking戦略を通じて、相乗的情報を強化するために設計された対照的な相乗的情報抽出手法であるInfMaskingを紹介する。大規模な実世界のデータセットの評価において、InfMaskingは7つのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:31:59 GMT)
DiffuSpec: Unlocking Diffusion Language Models for Speculative Decoding [66.4]
DiffuSpecは、事前訓練された拡散言語モデル(DLM)を用いて、単一のフォワードパスでマルチトークンのドラフトを生成する、トレーニングフリーのドロップインフレームワークである。ベンチマーク全体を通じて、DiffuSpecは最大3倍のウォールクロックスピードアップを達成し、投機的復号化のための自己回帰型ドラフトラの堅牢な代替手段として拡散ベースのドラフトを確立する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:00:15 GMT)
Un-Doubling Diffusion: LLM-guided Disambiguation of Homonym Duplication [65.7]
ホモニム(Homonym)とは、同一の綴りであるが意味の異なる単語である。拡散モデルは単語の複数の感覚を同時に生成することができる。そこで本研究では,異なる拡散モデルの重複率を計測し,評価を行う手法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:41:18 GMT)
Thread: A Logic-Based Data Organization Paradigm for How-To Question Answering with Retrieval Augmented Generation [65.5]
ハウツー質問は意思決定に不可欠であり、動的でステップバイステップのレスポンスを必要とする。我々は,ハウツー質問をより効果的に処理できる新しいデータ組織パラダイムThreadを提案する。具体的には、「論理単位」(LU)という新たな知識を導入し、大きな言語モデルによって文書をより構造化され、疎結合なLUに変換する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:27:08 GMT)
FrameMind: Frame-Interleaved Chain-of-Thought for Video Reasoning via Reinforcement Learning [65.4]
現在のビデオ理解モデルは、各質問の特定の推論条件にかかわらず、固定されたフレームサンプリング戦略に依存し、所定の視覚入力を処理する。この静的アプローチは、視覚的エビデンスを適応的に収集する能力を制限し、広範囲の時間的カバレッジやきめ細かい空間的詳細を必要とするタスクにおいて、最適以下のパフォーマンスをもたらす。 Frame-Interleaved Chain-of-Thought (FiCOT)を通して、モデルが推論中に視覚情報を動的に要求することを可能にする強化学習で訓練されたエンドツーエンドフレームワークであるFrameMindを紹介する。従来のアプローチとは異なり、FrameMindは複数のターンで動作し、モデルがテキスト推論とアクティブな視覚知覚を交互に切り替え、ツールを使って抽出する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:59:43 GMT)
Efficient Multi-turn RL for GUI Agents via Decoupled Training and Adaptive Data Curation [65.4]
視覚言語モデル(VLM)に基づくGUIエージェントは複雑なタスクの自動化を約束するが、強化学習(RL)の適用において大きな課題に直面している。異種モジュールを高度に非結合的に協調するGUIエージェントのための非結合エージェントRLトレーニングフレームワークであるDARTを提案する。 OSWorldのベンチマークでは、DART-GUI-7Bは42.13%のタスク成功率、14.61%の絶対ゲイン、オープンソースSOTAよりも7.34%高い。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:19:20 GMT)
3D-LATTE: Latent Space 3D Editing from Textual Instructions [64.8]
本研究では,ネイティブな3次元拡散モデルの潜在空間内で動作する学習自由な編集手法を提案する。生成元からの3Dアテンションマップとソースオブジェクトをブレンドすることで、編集合成をガイドする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:16:44 GMT)
Double Check My Desired Return: Transformer with Target Alignment for Offline Reinforcement Learning [64.6]
教師付き学習(RvS)による強化学習は、シーケンスモデリングタスクとしてオフラインRLをフレーム化する。決定変換器(DT)は、実際の完了したリターンを特定のターゲットリターンと確実に整合させるのに苦労する。そこで我々は,Offline RLの目標アライメントによる変換器の二重チェックを行う新しいアプローチであるDoctorを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:32:52 GMT)
ChartMaster: Advancing Chart-to-Code Generation with Real-World Charts and Chart Similarity Reinforcement Learning [64.4]
チャートからコードへの生成タスクでは、チャートイメージを実行可能なコードに変換するMLLMが必要である。このタスクは、データ多様性の制限と、生成されたチャートと元のチャートの間の視覚的一貫性を維持することの難しさという、2つの大きな課題に直面する。本稿では,arXiv論文から抽出した実世界の人間設計チャートをプロンプトとして活用するReChartPromptを提案する。また,GRPOに基づく強化学習アルゴリズムであるChartSimRLを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:18:42 GMT)
DiffPCN: Latent Diffusion Model Based on Multi-view Depth Images for Point Cloud Completion [63.9]
DiffPCN(DiffPCN)を提案する。提案手法は, 粗い点雲を発生させる初期段階と, 品質を向上する改良段階の2段階からなる。実験の結果,DiffPCNは幾何的精度と形状の完全性において最先端の性能を発揮することがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:05:43 GMT)
Representation Entanglement for Generation: Training Diffusion Transformers Is Much Easier Than You Think [63.3]
REPAとその変種は、事前訓練されたモデルから外部の視覚表現を取り入れることで、拡散モデルのトレーニング課題を効果的に軽減する。偏見推論過程全体において欠落している外部アライメントは、識別的表現の可能性を完全に活用するに足らないと我々は主張する。本稿では,事前学習した基礎モデルから,低レベル画像ラテントを1つの高レベルクラストークンで絡み合わせるRepresentation Entanglement for Generation (REG)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:19:38 GMT)
Analyzing and Evaluating Unbiased Language Model Watermark [63.0]
UWbenchは、偏りのない透かし手法の原理的評価を専門とする、最初のオープンソースベンチマークである。我々の枠組みは理論的な貢献と経験的な貢献を組み合わせている。我々は,非バイアス性,検出性,堅牢性という3軸評価プロトコルを確立し,トークン改質攻撃がパラフレーズベースの手法よりも安定したロバストネス評価を提供することを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:46:01 GMT)
GBSK: Skeleton Clustering via Granular-ball Computing and Multi-Sampling for Large-Scale Data [62.4]
本稿では,大規模データセットのクラスタリング処理を行うために,GBSKというスケーラブルなスケルトンクラスタリングアルゴリズムを提案する。データセットのマルチサンプリングと多粒度グラニュラーボールの構築により、GBSKは徐々に統計的「骨格」を発見さらに,ユーザビリティの向上と現実シナリオへの展開を容易にするため,パラメータ設定を簡略化した適応型AGBSKを導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:41:15 GMT)
SCRAMBLe : Enhancing Multimodal LLM Compositionality with Synthetic Preference Data [62.3]
SCRAMBLe: 2進選好学習によるMLLMの合成合成推論 MLLMはデータを用いて概念を解明することで改善できることを示し、モデルがクローズだが不正確な画像に対して正しいキャプションを好むように訓練される。 SCRAMBLeはこれらのMLLMの合成推論機能を大幅に改善する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:58:05 GMT)
Disentangling Regional Primitives for Image Generation [62.2]
本稿では,新しい視点から画像生成のためのニューラルネットワークについて説明する。本稿では,画像生成のためのニューラルネットワークの表現構造を定義するために,望ましい特性のセットを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:49:42 GMT)
LongProc: Benchmarking Long-Context Language Models on Long Procedural Generation [62.0]
LongProc(Long Procedural Generation)は、Long-context言語モデルを評価するための新しいベンチマークである。高度に分散した情報と長文生成を統合する必要がある。我々は,LongProc上の23個のLCLMを3つの難易度で評価し,500,2K,8Kの出力トークンの最大数を示した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:53:45 GMT)
Training Optimal Large Diffusion Language Models [61.7]
拡散言語モデル(DLM)の最初の体系的スケーリング法則であるQuokkaを紹介する。この結果が、DLMのトレーニングにおける短期的な実践的なガイダンスと、AIコミュニティ全体の長期的なインスピレーションをもたらすことを期待しています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:20:02 GMT)
Uni4D-LLM: A Unified SpatioTemporal-Aware VLM for 4D Understanding and Generation [61.6]
既存の3Dおよび4Dアプローチは、通常、シーン幾何学を意味的理解とコンテンツ生成のための拡散モデルのための自己回帰モデルに組み込む。我々は4次元シーン理解と生成のための時間的認識を備えた最初の統合VLMフレームワークであるUni4D-LLMを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:06:54 GMT)
Bridging the Task Gap: Multi-Task Adversarial Transferability in CLIP and Its Derivatives [61.6]
きめ細かいタスクから生成される敵の例は、粗いタスクよりも強い伝達ポテンシャルを示すことが多い。本稿では,タスク認識機能集約損失を導入し,タスク間の一般化機能を強化した摂動を生成する,新しいフレームワークであるMulti-Task Adversarial CLIP (MT-AdvCLIP)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:46:52 GMT)
TRIPS: Efficient Vision-and-Language Pre-training with Text-Relevant Image Patch Selection [61.1]
我々は,textbfText-textbfRelevant textbfImage textbfPatch textbfSelection,すなわちTRIPSを用いた視覚・言語事前学習モデルを提案する。 TRIPSは、効率的なトレーニングと推論のために、視覚バックボーン内のテキスト誘導パッチ選択層によって、視覚的シーケンスを徐々に減少させる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:22:30 GMT)
An Ensemble Framework for Unbiased Language Model Watermarking [61.0]
本研究では,アンサンブル・フレームワークであるENSを提案する。 ENSは複数の独立した透かしインスタンスを順次構成し、それぞれ異なるキーによって管理され、透かし信号を増幅する。実験的な評価では、ENSは信頼できる検出に必要なトークンの数を大幅に減らし、平滑化やパラフレージング攻撃に対する耐性を高めている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:37:44 GMT)
PSG-Agent: Personality-Aware Safety Guardrail for LLM-based Agents [60.2]
PSG-AgentはLLMベースのエージェントのためのパーソナライズされた動的システムである。まずPSG-Agentは、安定した特性のために相互作用履歴をマイニングすることでパーソナライズされたガードレールを作成する。第二に、PSG-Agentは特別なガードでエージェントパイプラインを横断する継続的監視を実装している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:31:59 GMT)
UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction [59.8]
実世界の知識グラフ(英語版) (KGs) は標準的な三つの事実だけでなく、より複雑で異種な事実も含んでいる。ハイパーリレーショナルKG,時間的KG,ネストした事実KGを3次元表現に統一する学習フレームワークであるUniHRを提案する。 5種類のKGにまたがる9つのデータセットの実験は、UniHRの有効性を示し、統一表現の強い可能性を強調している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:49:02 GMT)
AdaPtis: Reducing Pipeline Bubbles with Adaptive Pipeline Parallelism on Heterogeneous Models [59.7]
AdaPtisは、適応パイプライン並列性をサポートする大規模言語モデル(LLM)のトレーニングシステムである。大規模な実験により、AdaPtisはMegatron-LM I-1F1Bよりも平均1.42倍(最大2.14倍)のスピードアップを達成した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:05:13 GMT)
On the Design of KL-Regularized Policy Gradient Algorithms for LLM Reasoning [59.1]
政策勾配アルゴリズムは大規模言語モデル(LLM)の推論能力の向上に成功している。規則化されたポリシーグラディエント(RPG)ビューは、広く使われている$k_3$ペナルティが、正確には非正規化されたKLであることを示している。 RPG-REINFORCE with RPG-Style Clipは、DAPOよりも最大6ドル以上の絶対パーセンテージポイントの精度を向上させる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:42:53 GMT)
CTTS: Collective Test-Time Scaling [58.6]
テスト時スケーリング(TTS)は,大規模言語モデル(LLM)のパフォーマンス向上のための,有望かつトレーニング不要なアプローチとして登場した。単体テストタイムスケーリング(STTS)パラダイムを克服するために、CTTS(Collective Test-Time Scaling)を導入します。 CTTS-MMは、マルチエージェントとマルチリワードのコラボレーションを運用する新しいフレームワークである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:43:05 GMT)
AutoPrune: Each Complexity Deserves a Pruning Policy [58.4]
Complexity Pruning(AutoPrune)は、プルングポリシーをさまざまなサンプルやタスクの複雑さに合わせて調整する、トレーニングフリーのプラグイン・アンド・プレイフレームワークである。我々はAutoPruneを、標準的な視覚適応タスクと、自律運転のためのビジョン・ランゲージ・アクションモデルで評価する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:09:00 GMT)
SafeSearch: Automated Red-Teaming for the Safety of LLM-Based Search Agents [58.2]
我々は、低品質な検索結果の出現率と、エージェントの動作を誤る可能性を実証する2つの実験を行った。この脅威に対処するため、私たちは、体系的、スケーラブルで、コスト効率のよい自動化されたレッドチームフレームワークを導入しました。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:05:17 GMT)
GroupCoOp: Group-robust Fine-tuning via Group Prompt Learning [57.9]
Group Context Optimization (GroupCoOp) は、単純で効果的な微調整アルゴリズムである。微調整視覚言語モデル(VLM)の群ロバスト性を高める GroupCoOpは、5つのCLIPアーキテクチャにわたる5つのベンチマークで最高の結果を得た。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:54:30 GMT)
Comba: Improving Bilinear RNNs with Closed-loop Control [57.8]
本稿では,これらのモデルの利点と限界を包括的に分析したBilinear RNNの概念を紹介する。我々は,状態フィードバックと出力フィードバックの両補正を併用した,スカラー+低ランク状態遷移を取り入れた新しいバイリニアRNNであるCombaを提案する。また,大規模コーパス上での340M/1.3Bパラメータのトレーニングモデルと,ハードウェア効率のよいチャンクワイド並列カーネルを実装した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:27:51 GMT)
Beyond Magic Words: Sharpness-Aware Prompt Evolving for Robust Large Language Models with TARE [57.7]
そこで,本論文では,プロンプトをハードパラフレーズで強調する内的,サンプリングに基づく逆探索を交互に行う,デリバティブフリーなフレームワークTAREを紹介する。また,意味的近傍を形成するために異方性重みを学習し,時間とともに半径を調整し,探索と忠実性のバランスをとるATAREを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:57:05 GMT)
MoReact: Generating Reactive Motion from Textual Descriptions [57.6]
MoReactは拡散に基づく手法で、グローバルな軌跡と局所的な動きを連続的に引き離すように設計されている。 2人の動作データセットから適応したデータを用いて,本手法の有効性を実証した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:31:41 GMT)
VisionReasoner: Unified Reasoning-Integrated Visual Perception via Reinforcement Learning [57.0]
複数の視覚知覚タスクの推論と解決が可能な統合フレームワークであるVisionReasonerを紹介する。 VisionReasonerは、視覚的な入力を分析するための推論機能を強化し、統一モデル内の様々な知覚タスクに対処する。 VisionReasonerは、検出、セグメンテーション、カウントという3つの重要な領域にまたがる10のタスクに対して評価する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:10:14 GMT)
Assessing Visual Privacy Risks in Multimodal AI: A Novel Taxonomy-Grounded Evaluation of Vision-Language Models [55.2]
包括的で多レベルなビジュアルプライバシ分類を導入します。いくつかの最先端のビジョン・ランゲージ・モデルの性能評価を行った。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:04:54 GMT)
Beyond Benchmarks: Understanding Mixture-of-Experts Models through Internal Mechanisms [55.2]
Mixture-of-Experts (MoE)アーキテクチャは、推論中にパラメータのサブセットだけをアクティベートすることで、効率とスケーラビリティを提供する、有望な方向性として登場した。内部メトリックを用いて、ルーティング機構を明示的に取り入れ、専門家レベルの振る舞いを分析することで、MoEアーキテクチャのメカニズムを解明する。その結果,(1)モデルの発展に伴ってニューロンの利用が減少し,より高度な一般化が期待できる,(2)ベンチマークのパフォーマンスが限られた信号のみを提供するダイナミックな軌道を示す,(3)複数の専門家の協力的貢献からタスク完了が生じる,(4)ニューロンレベルでの活性化パターンがデータ多様性のきめ細かいプロキシを提供する,といった結果が得られた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:13:38 GMT)
UniAlignment: Semantic Alignment for Unified Image Generation, Understanding, Manipulation and Perception [54.5]
UniAlignmentは単一の拡散変換器内での統一されたマルチモーダル生成フレームワークである。固有モード意味アライメントとクロスモーダル意味アライメントの両方を組み込むことで、モデルのクロスモーダル一貫性と命令追従ロバスト性を高める。本稿では、複雑なテキスト命令下でのマルチモーダルなセマンティック一貫性を評価するために設計された新しいベンチマークであるSemGen-Benchを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:11:30 GMT)
Understanding Textual Capability Degradation in Speech LLMs via Parameter Importance Analysis [54.5]
言語モデル(LLM)への音声の統合は、その能力を大幅に拡張したが、多くの場合、中核となるテキスト能力の弱さを犠牲にしている。本稿では,パラメータ重要度推定に基づく分析フレームワークを提案する。レイヤワイズ学習率スケジューリングとローランド適応(LoRA)の2つの緩和戦略について検討する。実験結果から,両手法は完全な微調整よりもテキスト能力の維持が良好であるとともに,下流の質問応答性能も向上していることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:04:40 GMT)
HiPO: Hybrid Policy Optimization for Dynamic Reasoning in LLMs [54.2]
大規模言語モデル(LLM)は、複雑なタスクの正確性を改善するために、チェーン・オブ・シント(CoT)推論にますます依存している。本稿では適応推論制御のフレームワークであるHybrid Policy Optimization(HiPO)を紹介する。数学とコーディングベンチマークによる実験は、HiPOがトークン長を大幅に削減し、正確性を維持したり改善したりすることを示した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:46:12 GMT)
Towards a Comprehensive Scaling Law of Mixture-of-Experts [54.1]
本論文では,すべての重要な要因を考慮に入れた総合的かつ正確なMoEスケーリング法を提案する。我々の結果は、$G$と$S$の最適設定が、モデルアーキテクチャとデータサイズの両方に依存しないことを示しています。提案したMoEスケーリング法則は,将来のMoEモデル設計およびトレーニングを促進するための,正確かつ洞察に富んだガイダンスとして機能する可能性がある。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:35:34 GMT)
MotionVerse: A Unified Multimodal Framework for Motion Comprehension, Generation and Editing [54.0]
MotionVerseは、シングルパーソンとマルチパーソンの両方のシナリオで人間の動作を理解し、生成し、編集するフレームワークである。我々は、連続的な動き列をマルチストリーム離散トークンに変換する残差量子化を伴う動きトークン化器を用いる。また、残留トークンストリームの符号化を時間的に停滞させる textitDelay Parallel Modeling 戦略も導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:20:56 GMT)
Mash, Spread, Slice! Learning to Manipulate Object States via Visual Spatial Progress [53.7]
SPARTAは、オブジェクトの状態変化操作タスクのファミリーで最初に統合されたフレームワークである。 SPARTAは、空間的に進行するオブジェクト変化のセグメンテーションマップ、実行可能領域と変換可能領域を知覚する視覚的スキル、時間とともに漸進的な進歩を捉える高密度報酬を統合している。 SPARTAを現実のロボットで検証し、10種類の現実世界のオブジェクトにまたがる3つの課題について検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:56:07 GMT)
Code2MCP: Transforming Code Repositories into MCP Services [53.2]
Model Context Protocol (MCP)は、大規模言語モデルがどのようにツールを使用するかの標準を作成することを目的としている。私たちは、GitHubリポジトリを機能的なMSPサービスに自動的に変換するエージェントベースのフレームワークであるCode2MCPを紹介します。 Code2MCPはバイオインフォマティクス、数学、流体力学などの科学分野におけるオープンソースの計算ライブラリの変換に成功している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:50:03 GMT)
Test-time GNN Model Evaluation on Dynamic Graphs [52.3]
我々は,DyGEvalと呼ばれる動的グラフニューラルネットワーク評価器を提案し,この問題に対処する。提案したDyGEvalは,(1) テスト時動的グラフシミュレーション,(2) テスト時動的グラフ上でのよく訓練されたDGNNモデルの性能を正確に推定するDyGEvalの開発・訓練の2段階からなる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:40:37 GMT)
ResAD++: Towards Class Agnostic Anomaly Detection via Residual Feature Learning [52.1]
本稿では,クラス非依存型異常検出(AD)の問題点について検討する。目的は、ターゲットデータの再トレーニングや微調整をせずに、異なるドメインから様々な新しいクラスの異常を一般化して検出できる、クラスに依存しないADモデルをトレーニングすることである。 8つの実世界のADデータセットに関する総合的な実験は、ResAD++が新しいクラスで直接使用されると、素晴らしいAD結果が得られることを示した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:41:05 GMT)
VividFace: High-Quality and Efficient One-Step Diffusion For Video Face Enhancement [51.8]
ビデオ顔強調(VFE)は、劣化したビデオシーケンスから高品質な顔領域を再構築することを目指している。ビデオの超解像と生成フレームワークに依存する現在の手法は、3つの根本的な課題に直面している。ビデオ・フェイス・エンハンスメントのための新規かつ効率的なワンステップ拡散フレームワークであるVividFaceを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:39:48 GMT)
Improving Black-Box Generative Attacks via Generator Semantic Consistency [51.5]
ジェネレーティブアタックはテスト時に 1つのフォワードパスで敵の例を生成する初期ジェネレータの中間機能をEMA教師に整列させることで意味的整合性を実現する。我々のアプローチは、ブラックボックス転送の一貫性を保ちながら、既存のジェネレーティブアタックにシームレスに統合することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:04:26 GMT)
LLM/Agent-as-Data-Analyst: A Survey [51.2]
大規模言語モデル(LLM)とデータ分析のためのエージェント技術は、学術と産業の両方に大きな影響を与えている。この技術進化は、インテリジェントなデータ分析エージェントのための5つの重要な設計目標、すなわちセマンティック・アウェア・デザイン、ハイブリッド統合、自律パイプライン、ツールの拡張されたモダリティ、オープンワールドタスクのサポートをさらに強化する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:31:38 GMT)
LoTA-QAF: Lossless Ternary Adaptation for Quantization-Aware Fine-Tuning [50.9]
リソース制約のあるエッジデバイスに大規模言語モデル(LLM)をデプロイするには、量子化と微調整が不可欠である。 LoTA-QAFは量子化LDM用に特別に設計された新しい微調整法である。 MMLUベンチマークでは,16ビットLORAを最大5.14%越えて,量子化モデルの性能を効果的に回復する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:18:37 GMT)
CaRe-BN: Precise Moving Statistics for Stabilizing Spiking Neural Networks in Reinforcement Learning [50.9]
Spiking Neural Networks (SNN)は、ニューロモルフィックハードウェア上で低レイテンシでエネルギー効率の意思決定を提供する。スパイクの離散的かつ微分不可能な性質のため、直接訓練されたSNNは勾配更新を安定させるためにバッチ正規化(BN)に大きく依存する。オンライン強化学習(RL)では、BN統計は搾取を妨げ、収束と準最適政策を遅くする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:21:17 GMT)
Conditional Advantage Estimation for Reinforcement Learning in Large Reasoning Models [50.8]
本研究では,条件付きアドバンテージ・エスティマティオン(CANON)を導入し,その方向を推定せずに目標距離の影響を増幅する。エントロピーに基づくCANONは、数学推論と高複雑性論理タスクの両方において、従来手法よりも一貫して優れている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:33:07 GMT)
HUNT: High-Speed UAV Navigation and Tracking in Unstructured Environments via Instantaneous Relative Frames [50.8]
HUNT (High-speed UAV Navigation and Tracking) は、1つの相対的な定式化の中で統合、取得、追跡を行うリアルタイムフレームワークである。密林、コンテナ化合物、および車両やマネキンによる捜索救助活動の試行は、グローバルな方法が失敗した場合の堅牢な自律性を示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:17:18 GMT)
Finite-Sample Analysis of Policy Evaluation for Robust Average Reward Reinforcement Learning [50.8]
我々は、ロバスト平均マルコフ決定過程(PMD)における政策評価の第1次有限サンプル解析を提案する。頑健なベルマン作用素は、慎重に構築された半ノルムの下で収縮し、制御バイアスを持つフレームワークを開発することを示す。本手法は,ロバストな政策評価とロバストな平均報酬推定のために,$tildemathcalO(epsilon-2)$のオーダー最適サンプル複雑性を実現する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:44:18 GMT)
Why Alignment Must Precede Distillation: A Minimal Working Explanation [50.8]
標準のKD -> Alignワークフローは、稀だが望ましい振る舞いを整列するためにモデルの能力を低下させる。蒸留に先立って,まず高リコール基準でアライメントを行わなければならないことを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:12:19 GMT)
Decentralized Dynamic Cooperation of Personalized Models for Federated Continual Learning [50.6]
フェデレーション型連続学習のための分散動的協調フレームワークを提案する。顧客は、新しい知識の獲得と事前学習の維持のバランスをとるために、動的な協調学習連合を確立する。また、協調的・動的平衡を達成するために、マージブロックアルゴリズムと動的協調的進化アルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:53:23 GMT)
GraphIFE: Rethinking Graph Imbalance Node Classification via Invariant Learning [49.5]
ほとんどのグラフニューラルネットワークは、バランスの取れたクラス分布を暗黙的に仮定するが、これは偏りのある学習と少数クラスの性能低下につながる可能性がある。合成ノードの品質不整合を緩和する新しいフレームワークであるGraphIFEを提案する。提案手法は,グラフ不変学習の2つの重要な概念を取り入れ,埋め込み空間表現を強化する戦略を導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:41:16 GMT)
Reversed in Time: A Novel Temporal-Emphasized Benchmark for Cross-Modal Video-Text Retrieval [49.4]
クロスモーダル検索(例えば、画像テキスト、ビデオテキスト)は、情報検索およびマルチモーダル視覚言語理解分野において重要なタスクである。本稿では,新しい時間強調ビデオテキスト検索データセットRTimeを紹介する。私たちのRTimeデータセットは、現在1ビデオにつき10キャプションの21Kビデオで構成されており、合計で約122時間です。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:46:07 GMT)
Compose and Fuse: Revisiting the Foundational Bottlenecks in Multimodal Reasoning [49.2]
MLLM(Multimodal large language model)は、テキスト、ビジョン、オーディオなどの多様な入力を統合することで推論を強化することを約束する。しかし、追加のモダリティがパフォーマンスを損なうかどうかについての報告は相反する。我々は、多モーダル推論を6つの相互作用パターンに分類し、事実がどのようにモダリティに分散され、論理的に組み合わせられるかを決定する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:46:11 GMT)
Audio-centric Video Understanding Benchmark without Text Shortcut [49.0]
音声視覚大言語モデル(LLM)の映像理解タスクにおける補助的モダリティとして機能することも多い。本稿では,マルチモーダルLLMの映像理解能力を評価するために,AVUT(Audio-centric video understanding benchmark)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:16:42 GMT)
RPG360: Robust 360 Depth Estimation with Perspective Foundation Models and Graph Optimization [49.0]
RPG360は、トレーニング不要のロバストな360度モノクル深度推定法である。グラフに基づく最適化を用いた新しい深度スケールアライメント手法を提案する。提案手法は,Matterport3D,Stanford2D3D,360Locなど,多様なデータセットにまたがる優れた性能を実現する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:33:12 GMT)
IM360: Large-scale Indoor Mapping with 360 Cameras [49.0]
大規模屋内環境のための新しい3Dマッピングパイプラインを提案する。本稿では,球面カメラモデルとStructure-from-Motion(SfM)パイプラインを融合したIM360を提案する。我々のSfMは、360度画像に特化して設計された密マッチング機能を利用しており、画像登録の優れた能力を示している。大規模屋内シーンにおけるパイプラインの評価を行い,実世界のシナリオにおけるその効果を実証した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:20:19 GMT)
Token Painter: Training-Free Text-Guided Image Inpainting via Mask Autoregressive Models [48.8]
我々は,Mask AutoRegressive(MAR)モデルに基づく,トレーニング不要なテキストガイド画像の描画手法を開発した。提案手法では,(1)2つの鍵となる要素を紹介する:(1)Dual-Stream Information Fusion (DEIF) は,新しい誘導トークンを生成するために,周波数領域のテキストや背景からのセマンティック情報とコンテキスト情報を融合し,(2)適応デコーダのアタプティブ・スコア・エンハンシング (ADAE) は,誘導トークンのアテンションスコアを適応的に向上する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:48:52 GMT)
Generalizable Speech Deepfake Detection via Information Bottleneck Enhanced Adversarial Alignment [48.7]
信頼誘導対向アライメントは、識別的手がかりを消去することなく攻撃固有のアーティファクトを適応的に抑制する。 IB-CAANは、多くのベンチマークにおいて、ベースラインと最先端のパフォーマンスを一貫して上回る。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:48:49 GMT)
ReWatch-R1: Boosting Complex Video Reasoning in Large Vision-Language Models through Agentic Data Synthesis [48.2]
先進的なビデオ推論を促進するために構築された大規模データセットであるReWatchを紹介する。中心となるイノベーションは、CoT合成のためのMulti-Agent ReActフレームワークです。スーパービジョンファインチューニング(SFT)とRLVRフレームワークを用いた強力なベースラインLVLMのポストトレーニングによりReWatch-R1を開発する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:38:16 GMT)
Formalization Driven LLM Prompt Jailbreaking via Reinforcement Learning [48.1]
PASSは、初期のジェイルブレイクプロンプトを形式化された記述に変換するために強化学習を使用している。我々は、共通のオープンソースモデルに関する広範な実験を行い、攻撃の有効性を実証した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:38:00 GMT)
From Reasoning to Answer: Empirical, Attention-Based and Mechanistic Insights into Distilled DeepSeek R1 Models [48.0]
蒸留した3種類のDeepSeek R1モデルにおいて、推論と回答生成の相互作用を3段階に分けて検討する。明示的な推論を含めることで、さまざまな領域での回答品質が一貫して向上することを示す。以上の結果から,重要な推論トークンに対する摂動が最終回答を確実に変更できることが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:32:21 GMT)
Toward Model-centric Heterogeneous Federated Graph Learning: A Knowledge-driven Approach [48.0]
FGL(Federated Graph Learning)は、協調的な機械学習のための有望なパラダイムとして登場した。 MHtFGL問題は、様々な企業のモデルの集約など、現実世界のアプリケーションで発生する。本稿では,2つの主要コンポーネントからなるフェデレートグラフ知識コラボレーション(FedGKC)フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:08:14 GMT)
Meta Pruning via Graph Metanetworks : A Universal Meta Learning Framework for Network Pruning [47.9]
ネットワークプルーニングのための全く新しいメタラーニングフレームワークを提案する。理論上はほとんど全ての種類のネットワークに適用でき、あらゆる種類のプルーニングを持ち、非常に汎用性と転送性を有する。我々のフレームワークは、ニューラルネットワーク(metanetwork)を介して、複雑なプルーニングルールを自動で学習することができ、特別なトレーニングをすることなくプルーすることのできる非常に一般的な機能を備えている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:42:31 GMT)
MineAnyBuild: Benchmarking Spatial Planning for Open-world AI Agents [47.0]
我々は,MinecraftゲームにおけるオープンワールドAIエージェントの空間計画能力を評価するために,MineAnyBuildというベンチマークを構築した。 MineAnyBuildは、与えられたマルチモーダルなヒューマンインストラクションに基づいて実行可能なアーキテクチャ構築プランを生成するエージェントを必要とする。 4000のキュレートされた空間計画タスクを伴い、リッチなプレイヤー生成コンテンツを利用することで無限に拡張可能なデータ収集のパラダイムを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:39:59 GMT)
DPsurv: Dual-Prototype Evidential Fusion for Uncertainty-Aware and Interpretable Whole-Slide Image Survival Prediction [47.0]
本稿では,不確実性を認識した生存区間を出力するデュアルプロトタイプ全スライディング画像顕在核融合ネットワークDPsurvを提案する。予測結果の解釈は、特徴、推論、決定レベルで透明性を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:37:29 GMT)
Speculative Safety-Aware Decoding [46.8]
推論を高速化しながら, LLMに所望の安全性特性を付与する軽量な復号時間方式であるSpeculative Safety-Aware Decoding(SSD)を導入する。 SSDはデコード中の投機的サンプリングを統合し、小型モデルと複合モデルとのマッチング比を利用してジェイルブレイクのリスクを定量化する。実験の結果,SSDは大きなモデルに所望の安全性特性を持たせることができた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:23:45 GMT)
2nd Place Report of MOSEv2 Challenge 2025: Concept Guided Video Object Segmentation via SeC [46.8]
セミ教師付きビデオオブジェクトは、指定されたターゲットを1フレームのマスクでビデオシーケンスを通してセグメントすることを目的としている。 SeCフレームワークはより永続的なセグメンテーションのためにオブジェクトの深いセマンティック理解を確立した。 SeCはテストセットで39.7 JFnを獲得し、第7回大規模ビデオオブジェクトチャレンジの複合VOSトラックで2位にランクインした。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:26:03 GMT)
Adversarial Diffusion for Robust Reinforcement Learning [46.4]
我々はロバスト強化学習(AD-RRL)のための逆拡散を導入する。 AD-RRLは拡散過程を導出し、トレーニング中に最悪の場合の軌跡を生成し、累積リターンの条件値(CVaR)を効果的に最適化する。標準ベンチマークにおける実験結果から、AD-RRLは既存のロバストなRL法と比較して、優れたロバスト性と性能を発揮することが示された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:34:35 GMT)
SimpleGVR: A Simple Baseline for Latent-Cascaded Video Super-Resolution [46.3]
後続の超解像モデルの設計原理について検討し,その設計原理について検討する。まず、ベースモデルの出力特性をよりよく模倣し、VSRモデルと上流ジェネレータとの整合性を確保するための2つのトレーニングペアを生成する方法を提案する。第2に,(1)時間ステップサンプリング戦略,(2)低分解能(LR)入力に対する雑音増強効果の系統的解析を通じて,VSRモデル行動に対する批判的洞察を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:49:21 GMT)
Investigating Multi-layer Representations for Dense Passage Retrieval [46.3]
文書の表現を構成するために多層表現(MLR)を示す。まず,異なる層における表現がマルチベクトル検索条件下でのMLRの性能に与える影響について検討する。本稿では,マルチベクタモデルから単一ベクタモデルへのプーリング戦略を活用することで,検索効率を向上させることを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:00:53 GMT)
Attention Layers Add Into Low-Dimensional Residual Subspaces [46.3]
注意出力は驚くほど低次元の部分空間に限定されていることを示す。この低ランク構造が、スパース辞書学習における一般的な致命的特徴の鍵となる要素であることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:00:01 GMT)
On the Shelf Life of Fine-Tuned LLM Judges: Future Proofing, Backward Compatibility, and Question Generalization [46.2]
我々は、精巧な審査員の棚の生活に影響を与える3つの側面を定式化する。実験によると、将来の防食はほとんどのモデルにとって難しい。継続学習は、より古い応答分布と新しい応答分布のシフトによりバランスのとれた適応を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:43:52 GMT)
Pure Node Selection for Imbalanced Graph Node Classification [46.1]
グラフ構造化データではクラス不均衡が一般的であり、グラフニューラルネットワーク(GNN)は通常、クラスバランスの仮定に基づいている。我々は、ランダム性異常接続問題(RACP)に対処するPAS(Pure Node Smpling)を提案する。量不均衡や位相不均衡を扱うためのアルゴリズムを設計する既存のアプローチとは異なり、PNSはノード合成時に直接動作する新しいプラグアンドプレイモジュールである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:53:33 GMT)
Human-like Content Analysis for Generative AI with Language-Grounded Sparse Encoders [46.1]
Language-Grounded Sparses (LanSE)は、画像を自然言語記述で解釈可能な視覚パターンに分解する。 93%の人的合意で5000以上の視覚パターンが検出された。言語基底パターンを抽出する手法は自然に多くの分野に適用できる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:56:20 GMT)
A Unified Information-Theoretic Framework for Meta-Learning Generalization [46.1]
本稿では,単一ステップの導出を用いた統合情報理論フレームワークを開発する。結果として得られるメタ一般化境界は、様々な情報測度で表されるものであり、以前の研究よりも大きな優位性を示している。雑音と反復的メタ学習アルゴリズムの2つのクラスにおける一般化特性に関する新しい理論的知見を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:45:18 GMT)
Do LLMs Adhere to Label Definitions? Examining Their Receptivity to External Label Definitions [46.1]
複数の説明ベンチマークデータセット(一般およびドメイン固有)にまたがる実験を行う。以上の結果から,明示的なラベル定義は精度と説明可能性を高めることができるが,LLMのタスク解決プロセスへの統合は保証されず,一貫性も持たないことが明らかとなった。これらの知見は、LLMが既存の能力とともに外部知識をどのように処理するかをより深く理解する必要性を浮き彫りにした。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:44:37 GMT)
Stochastic Primal-Dual Double Block-Coordinate for Two-way Partial AUC Maximization [46.0]
2方向部分AUCAUCは、不均衡なデータを持つバイナリ分類における重要な性能指標である。 TPAUC最適化のための既存のアルゴリズムは未探索のままである。 TPAUC最適化のための2つの革新的な二重座標ブロック座標アルゴリズムを導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:32:07 GMT)
AGSwap: Overcoming Category Boundaries in Object Fusion via Adaptive Group Swapping [45.9]
クロスカテゴリオブジェクトを1つのコヒーレントオブジェクトに融合させることは、テキスト・ツー・イメージ(T2I)生成において注目を集めている。 textbfAdaptive Group Swapping (AGSwap) を提案する。我々はまた、ImageNet-1KとWordNet上に構築された大規模で階層的に構造化されたデータセットである textbfCross-category Object Fusion (COF) も導入した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:08:18 GMT)
Optuna vs Code Llama: Are LLMs a New Paradigm for Hyperparameter Tuning? [45.6]
この研究は、LoRAを用いてパラメータ効率の良いCode Llamaを微調整することで、ハイパーパラメータ最適化のための大規模言語モデル(LLM)の使用について検討する。提案手法は,計算オーバーヘッドを大幅に削減しつつ,競合的あるいは優れたRoot Mean Square Error(RMSE)を実現する。その結果,LLMに基づく最適化によって,木構造型パーゼンエミュレータ (TPE) のようなベイズ的手法が確立されただけでなく,知覚品質と低レイテンシ処理を必要とする実世界のアプリケーションへのチューニングが高速化された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:53:20 GMT)
XTransfer: Modality-Agnostic Few-Shot Model Transfer for Human Sensing at the Edge [45.4]
XTransferは、資源効率の高い設計で、モダリティに依存しない、少数ショットのモデル転送を可能にする第一種方式である。最先端のパフォーマンスを実現し、センサデータ収集やモデルトレーニング、エッジデプロイメントのコストを大幅に削減する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:19:55 GMT)
HomeSafeBench: A Benchmark for Embodied Vision-Language Models in Free-Exploration Home Safety Inspection [45.2]
身体的エージェントは、家庭環境における安全上の危険を識別し報告することができる。既存のベンチマークには2つの重要な制限がある。 HomeSafeBenchは、一般的な5つのホームセーフティーハザードをカバーする12,900のデータポイントを持つベンチマークである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:01:27 GMT)
Spiral of Silence in Large Language Model Agents [45.0]
スピラル・オブ・サイレンス(SoS)理論では、少数派の見解を持つ個人は社会的孤立を恐れて発言することをしばしば控えている。 SoSライクなダイナミクスは、大きな言語モデルで純粋に統計的な言語生成から生まれるのか? 本研究では,「歴史」と「ペルソナ」の信号の可利用性を体系的に変化させる4つの制御条件について考察する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:59:54 GMT)
Revisit the Imbalance Optimization in Multi-task Learning: An Experimental Analysis [44.4]
マルチタスク学習(MTL)は、1つのネットワークをトレーニングして複数のタスクを共同実行することで汎用的な視覚システムを構築することを目的としている。期待されているが、そのポテンシャルは「不均衡な最適化」によって妨げられることが多い。本稿では,この持続的問題に寄与する要因を解明するための系統的な実験的検討を行った。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:40:06 GMT)
Revisiting Vulnerability Patch Localization: An Empirical Study and LLM-Based Solution [44.4]
オープンソースのソフトウェア脆弱性検出は、ソフトウェアのセキュリティを維持し、ソフトウェアサプライチェーンの整合性を確保するための重要なコンポーネントである。従来の検出方法は、大量のコミット履歴を処理する際に、大きなスケーラビリティの課題に直面している。バージョン駆動型候補フィルタリングと大規模言語モデルに基づく多ラウンド対話投票を組み合わせた新しい2段階フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:59:10 GMT)
OViP: Online Vision-Language Preference Learning for VLM Hallucination [44.1]
大型視覚言語モデル(LVLM)は幻覚に弱いままであり、しばしば視覚入力と一致しないコンテンツを生成する。本稿では,モデル自身の幻覚に基づいて,コントラスト学習データを動的に構築するオンラインビジョン言語嗜好学習フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:48:41 GMT)
Omni-SafetyBench: A Benchmark for Safety Evaluation of Audio-Visual Large Language Models [43.9]
Omni-SafetyBenchは、OLLMの安全性評価のための最初の総合的な並列ベンチマークである。複雑なオムニモーダル入力によるOLLMの理解課題を考慮し,条件付き攻撃成功率(C-ASR)と拒絶率(C-RR)に基づく安全スコアを提案する。 Omni-SafetyBenchを用いて、既存の安全アライメントアルゴリズムを評価し、OLLMの安全性アライメントにおける重要な課題を特定した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:50:33 GMT)
Taught Well Learned Ill: Towards Distillation-conditional Backdoor Attack [43.7]
蒸留条件のバックドア攻撃(DCBA) DCBAは休眠と検出不能なバックドアを教師モデルに注入し、KDプロセスを介して学生モデルで活性化される。我々のSCARは、事前最適化されたトリガーインジェクション機能を持つ暗黙の微分アルゴリズムを用いて、この複雑な最適化に対処する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:24:46 GMT)
Learning Encoding-Decoding Direction Pairs to Unveil Concepts of Influence in Deep Vision Networks [43.5]
Empical evidence shows that deep vision network presented concept as direction in latent space, vectors called concept embeddeds。与えられたパッチに対して、複数の潜伏因子は、概念埋め込みを係数として線形に結合することでコンパクト表現に符号化される。潜在因子は、デコード方向と呼ばれるベクトルであるフィルタで内部積を介して回収することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:02:34 GMT)
Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-Tuning and Can Be Mitigated by Machine Unlearning [43.2]
現在のアライメント戦略は、キュレートされたデータセットによる監視された安全性の微調整に依存している。教師付き微調整は,表面テクスチャパターンと安全応答の急激な相関を必然的に強化することを示す。マシン・アンラーニング(MU)は、教師付き安全微調整の強力な代替手段であることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:35:12 GMT)
FA: Forced Prompt Learning of Vision-Language Models for Out-of-Distribution Detection [43.0]
本稿では,In-Distribution (ID) の知識をフル活用するために,Forced prompt leArning (FA) に基づく革新的なCLIPベースのフレームワークを提案する。 FAは、外部補助データセットなしでトレーニングされた場合でも、OOD検出の顕著な改善を達成することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:39:18 GMT)
Joint Multi-Target Detection-Tracking in Cognitive Massive MIMO Radar via POMCP [42.6]
この対応は、MIMO(Multiple-input multiple-output)レーダー環境において、複数の目標を共同で検出・追跡するためのパワーアウェアな認知レーダフレームワークを示す。部分観測可能なモンテカルロ計画(POMCP)に基づく従来の単一ターゲットアルゴリズムに基づいて,各ターゲットを独立したPOMCPツリーに割り当てることで,マルチターゲットケースに拡張する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:09:07 GMT)
Joint Superpixel and Self-Representation Learning for Scalable Hyperspectral Image Clustering [42.6]
サブスペースクラスタリングは、ハイパースペクトル画像(HSI)解析のための強力な教師なしアプローチである。スーパーピクセルセグメンテーションは、処理するデータポイントの数を減らすことで効率を向上させることができる。本稿では,スーパーピクセルセグメンテーションとサブスペースクラスタリングを協調的に最適化する統合エンドツーエンドフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:42:48 GMT)
Generalized Category Discovery in Hyperspectral Images via Prototype Subspace Modeling [42.6]
一般化されたカテゴリ発見(GCD)は、ラベルなしデータにおいて、既知のカテゴリと新しいカテゴリの両方を共同で識別しようとする。これまでの研究は主にRGB画像に焦点を当ててきたが、その仮定とモデリング戦略は、本質的に高次元で複雑なスペクトル構造を示すハイパースペクトル画像(HSI)によく当てはまらない。本稿では,HSIに適した最初のGCDフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:16:59 GMT)
Jet-Nemotron: Efficient Language Model with Post Neural Architecture Search [42.5]
Jet-Nemotronはハイブリッドアーキテクチャ言語モデルの新しいファミリーである。それは、主要なフルアテンションモデルの正確さと一致または超える。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:41:58 GMT)
DocPruner: A Storage-Efficient Framework for Multi-Vector Visual Document Retrieval via Adaptive Patch-Level Embedding Pruning [42.4]
Visual Document Retrieval (VDR)は多くの現実世界のアプリケーションに不可欠である。近年の手法は多ベクトルパラダイムにおけるLVLM(Large Vision-Language Models)を活用している。 1ページあたり数百のベクタを格納することは、大規模なデプロイメントをコストと実用的でないものにします。 DocPrunerは、VDRに適応パッチレベルの埋め込みプルーニングを適用し、ストレージオーバーヘッドを効果的に削減する最初のフレームワークである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:47:24 GMT)
EmbeddingGemma: Powerful and Lightweight Text Representations [42.3]
EmbeddingGemmaはGemma 3言語ファミリに基づいた、新しい軽量でオープンなテキスト埋め込みモデルである。スプレッドアウト正規化器を用いてモデル頑健性と表現性を向上する。さらなる研究を促進するため、コミュニティに EmbeddingGemma をリリースします。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:00:34 GMT)
Dual-Scale World Models for LLM Agents Towards Hard-Exploration Problems [41.8]
LLMベースのエージェントは有望な進歩を見てきたが、それでも探索を通じて新しい知識を学ぶことを必要とする「ハード探索」のタスクに限られている。本稿では,グローバルスケールにおける高価値発見の軌道フロンティアを維持しつつ,デュアルスケールの世界モデルを活用した新たなアプローチであるGLoWを提案する。我々はテキストベースのゲームのJerichoベンチマークスイートに取り組み、GLoWはLLMベースのアプローチのための新しい最先端パフォーマンスを実現する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:19:27 GMT)
UltraIF: Advancing Instruction Following from the Wild [41.4]
大規模言語モデル(LLM)を構築するためのシンプルでスケーラブルなアプローチであるUltraIFを提案する。 UltraIFは、現実世界のユーザプロンプトを、より単純なクエリ、制約、および対応する制約に対する評価質問に分解する。我々は,制約関連プロンプトを構成するためにUltraComposerを訓練する。我々の実験では、LLaMA-3.1-8B-Baseを、ベンチマーク情報なしで5つのインストラクションフォローベンチマークのインストラクションバージョンに追いつくために、初めて、LLaMA-3.1-8B-Baseを調整しました。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:59:13 GMT)
LocoFormer: Generalist Locomotion via Long-context Adaptation [41.3]
LocoFormerは、これまで目に見えなかった脚と車輪のついたロボットを制御できる、汎用的なオムニ体ロコモーションモデルである。 LocoFormerは、テスト時にモルフォロジーやダイナミクスの変化に適応することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:50:28 GMT)
Towards Redundancy Reduction in Diffusion Models for Efficient Video Super-Resolution [41.2]
ビデオ超解像(VSR)への生成拡散モデルへの直接適応は冗長性をもたらす。 OASISは、$textbfa$ttention $textbfs$pecialization for real-world v$textbfi$deo $textbfs$uper- resolutionを備えた効率的な$textbfo$ne-step拡散モデルである。 OASISは、合成データセットと実世界のデータセットの両方で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:08:51 GMT)
FuzzyLight: A Robust Two-Stage Fuzzy Approach for Traffic Signal Control Works in Real Cities [41.1]
ファジィライトと呼ばれる頑健な2段階ファジィ手法を提案する。圧縮センシングとRTLを統合してTSCデプロイメントを行う。これは22の交差点の実際の都市で機能し、現実世界とシミュレーション環境の両方で優れたパフォーマンスを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:18:21 GMT)
DiffInk: Glyph- and Style-Aware Latent Diffusion Transformer for Text to Online Handwriting Generation [41.1]
DiffInkは、完全な手書き文字を生成するための最初の遅延拡散トランスフォーマーフレームワークである。 InkVAEは2つの相補的な潜在空間正規化損失で拡張された新しい逐次変分オートエンコーダである。次に、ターゲットテキストと参照スタイルを統合し、コヒーレントペントラジェクトリを生成する新しい遅延拡散変換器InkDiTを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:58:15 GMT)
Don't Settle Too Early: Self-Reflective Remasking for Diffusion Language Models [40.9]
RemeDiはマスクベースのDLMで、トークンの分布と各ステップにおけるトークン毎の信頼スコアを予測する。モデルに不正トークンを検出して再マスクする教師付き微調整を含む、この能力をトレーニングするために、リマスク対応パイプラインをトレーニングします。実験により、RemeDiは複数のデータセット上のオープンソースのDLMの最先端の結果を達成することが示された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:39:49 GMT)
References Indeed Matter? Reference-Free Preference Optimization for Conversational Query Reformulation [40.7]
本稿では,新しい参照不要な選好最適化フレームワークであるDualReformを紹介する。クエリとレスポンスのみを含む会話データセットから、疑似参照文を生成する。参照パスに依存しないにもかかわらず、DualReformは参照パスでのみ取得可能な検索精度の96.9--99.1%を達成し、最先端の手法を最大31.6%上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:43:31 GMT)
Towards Fine-Grained Text-to-3D Quality Assessment: A Benchmark and A Two-Stage Rank-Learning Metric [40.3]
テキスト・ツー・3D(T23D)生成モデルにより、テキスト・プロンプトから多種多様な高忠実な3Dアセットを合成できるようになった。既存の課題は信頼性T23D品質評価(T23DQA)の開発を制限している。合成T23D生成のための総合ベンチマークであるT23D-CompBenchを紹介する。また,T23DQAの2段階トレーニングによる効果的な評価器である Rank2Score を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:30:47 GMT)
Tiered Agentic Oversight: A Hierarchical Multi-Agent System for Healthcare Safety [39.9]
Tiered Agentic Oversight (TAO)は階層的なマルチエージェントシステムで、階層化された自動監視を通じてAIの安全性を高める。臨床階層(例えば、看護師-物理学者-専門医)にインスパイアされたTAOは、複雑性に基づいた専門エージェントにタスクをルーティングする。実験によると、TAOは5つの医療安全ベンチマークのうち4つでシングルエージェントや他のマルチエージェントシステムを上回っ、最大8.2%改善されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:10:16 GMT)
PoliCon: Evaluating LLMs on Achieving Diverse Political Consensus Objectives [39.5]
PoliConは、13年以上にわたる欧州議会の2,225の高品質な審議記録から構築された新しいベンチマークである。 PoliCon の社会的選択理論に基づく評価フレームワークを開発した。実験結果から,最先端モデルでさえ複雑なタスクに満足していないことが明らかとなった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:32:15 GMT)
The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs [39.5]
単一ステップ精度の限界ゲインであっても、モデルが正常に完了できるタスク長の指数的な改善に結びつくことを示す。単純なタスクの失敗は、推論ができないというよりも、実行時のミスによるものである、と我々は主張する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:00:13 GMT)
Leveraging BEV Paradigm for Ground-to-Aerial Image Synthesis [39.4]
地上から地上への画像合成は、対応する地上の景観画像から現実的な空中画像を生成することに焦点を当てている。本研究では,ストリートビュー画像から航空画像を合成する新しいクロスビュー生成手法であるSkyDiffusionを紹介する。地上から地上までの多様な画像合成用途のために設計された新しいデータセット「Ground2Aerial-3」を紹介した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:12:17 GMT)
Not All Tokens are Guided Equal: Improving Guidance in Visual Autoregressive Models [39.4]
Information-Grounding Guidance (IGG) は、意味的に重要な領域へのガイダンスを注意を通して固定する新しいメカニズムである。 IGGはよりシャープでコヒーレントでセマンティックな画像を提供し、ARベースのメソッドの新しいベンチマークを設定している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:33:49 GMT)
Continuous Chain of Thought Enables Parallel Exploration and Reasoning [39.4]
連続価値トークン(CoT2)による思考の連鎖は、本質的に探索能力を必要とする論理的推論タスクによって動機付けられている。我々は、CoT2が複数の離散トレースを並列に追跡するのにどのように役立つかを示す。また, 埋込次元が十分であれば, サブセット和問題(subset sum problem)を解くCoT2ベースの一層変圧器も提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:02:10 GMT)
Aligning LLMs for Multilingual Consistency in Enterprise Applications [39.2]
大規模言語モデル(LLM)は、グローバルなエンタープライズアプリケーションには信頼できないままである。細調整LDMのための実用的なバッチワイドアライメント戦略を提案する。このアプローチは、英語のパフォーマンス、モデル推論、検索品質を損なうことなく、英語以外の精度を最大23.9%向上させる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:51:22 GMT)
StolenLoRA: Exploring LoRA Extraction Attacks via Synthetic Data [39.2]
本稿では,LoRA抽出と呼ばれるモデル抽出攻撃の新たな焦点を紹介する。代用モデルを用いてLoRA適応モデルの機能を抽出するStolenLoRAと呼ばれる新しい抽出法を提案する。実験では,StolenLoRAの有効性を実証し,96.60%の攻撃成功率を10kクエリで達成した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:51:35 GMT)
Accurate and Efficient Low-Rank Model Merging in Core Space [39.1]
コアスペースのマージフレームワークは、共通アライメントベースでLoRA対応モデルのマージを可能にする。 Core Spaceは既存のマージ技術を大幅に改善し、ビジョンと言語タスクの両面で最先端の結果が得られます。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:21:24 GMT)
Uncovering Privacy Vulnerabilities through Analytical Gradient Inversion Attacks [39.0]
フェデレーション学習は、大規模な分散データセットを活用するための、顕著なプライバシ保護技術として登場した。最近の研究では、勾配反転攻撃によってプライベートトレーニングデータが露出可能であることが示されている。本稿では,勾配反転攻撃の適用性を拡大する3つの高度なアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:47:02 GMT)
Internal Chain-of-Thought: Empirical Evidence for Layer-wise Subtask Scheduling in LLMs [38.9]
大規模言語モデル (LLM) は連続的に分解され、複合タスクを層ごとに実行する。 i)異なるサブタスクは異なるネットワーク深さで学習され、ii)これらのサブタスクは層間で順次実行される。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:30:28 GMT)
Revisiting Visual Understanding in Multimodal Reasoning through a Lens of Image Perturbation [38.7]
言語のみのモデルでは、生の視覚入力を消費するMLLMと同等またはそれ以上の性能が得られることを示す。そこで我々は,アルゴリズムの修正を必要とせず,知覚の堅牢性を高めるシンプルな視覚摂動フレームワークを提案する。本研究は,マルチモーダル数学的推論における視覚摂動の重要性を明らかにするものである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:21:13 GMT)
Any-to-Bokeh: Arbitrary-Subject Video Refocusing with Video Diffusion Model [38.6]
拡散モデルは、カメラシミュレーションの強力なツールとして登場した。画像ベースのボケレンダリングは有望な結果を示しているが、ビデオボケの拡散は未解明のままである。時間的コヒーレントな深度対応ビデオボケレンダリングを生成するための一段階拡散フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:29:49 GMT)
Satellite: Detecting and Analyzing Smart Contract Vulnerabilities caused by Subcontract Misuse [38.2]
Satelliteは、スマートコントラクトにおけるミスユース脆弱性検出のサブコントラクトのための、新しいバイトコードレベルの静的分析フレームワークである。衛星は10,011個の現実世界のスマートコントラクトで14個の新しい未知のSMVを識別することに成功した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:39:58 GMT)
Define latent spaces by example: optimisation over the outputs of generative models [37.6]
多くの下流タスクは、制約のないサンプリングよりも高いレベルの制御を必要とする。非パラメトリックで低次元のユークリッド埋め込みは、任意の生成モデルから抽出できる。我々のアプローチはアーキテクチャに依存しず、計算コストをほとんど必要とせず、モダリティにまたがって一般化する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:50:06 GMT)
Imagined Autocurricula [37.5]
組み込まれた環境で行動する訓練エージェントは、通常、膨大なトレーニングデータや正確なシミュレーションへのアクセスを必要とする。オフラインで受動的に収集されたデータを活用する代替手段として、世界モデルが登場しつつある。我々は、生成された世界に対して自動カリキュラムを誘導するIMACを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:24:27 GMT)
Probabilistic Soundness Guarantees in LLM Reasoning Chains [37.4]
ARES(Autoregressive Reasoning Entailment Stability)は、事前に検証された前提のみに基づいて、各推論ステップを評価する確率的フレームワークである。 ARESは4つのベンチマークで最先端のパフォーマンスを達成し、非常に長い合成推論チェーン上で優れた堅牢性を示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:15:42 GMT)
CLARAE: Clarity Preserving Reconstruction AutoEncoder for Denoising and Rhythm Classification of Intracardiac Electrograms [37.0]
CLARAEは1次元エンコーダデコーダである。高忠実度再構成とコンパクトな64次元潜在表現を実現する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:39:21 GMT)
Federated Sketching LoRA: A Flexible Framework for Heterogeneous Collaborative Fine-Tuning of LLMs [37.0]
リソース制約のあるクライアント上での微調整大型言語モデル(LLM)は依然として難しい問題である。最近の研究は、クライアントモデルのサイズやデータ不足に伴う課題を軽減するために、フェデレートされた微調整によるローランク適応(LoRA)技術と融合している。サーバが保持するグローバルなLoRAモジュールのサブマトリクスをクライアントが更新できるように,スケッチ機構を活用したフェデレートスケッチLoRAを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:07:49 GMT)
VoiceBridge: Designing Latent Bridge Models for General Speech Restoration at Scale [36.6]
橋梁モデルは近年, 難読化, 難読化, 超解像化などの音声強調作業のために検討されている。本稿では,LBMをルーツとするGSRシステムであるVoiceBridgeについて述べる。データ領域から潜在空間へのブリッジモデルの利点をよりよく継承するため,エネルギー保存型変分オートエンコーダを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:12:13 GMT)
Query2Triple: Unified Query Encoding for Answering Diverse Complex Queries over Knowledge Graphs [36.4]
単純で複雑なクエリのトレーニングを分離する新しいアプローチであるQuery to Triple (Q2T)を提案する。提案するQ2Tは, トレーニングだけでなく, モジュール性にも優れ, 様々なニューラルネットワーク予測器に容易に適応できる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:55:22 GMT)
Griffin: Generative Reference and Layout Guided Image Composition [36.4]
テキストではなく画像から所望のコンテンツが指定されるマルチイメージレイアウト制御の課題に対処する。我々のアプローチはトレーニング不要であり、参照毎に1つのイメージが必要であり、オブジェクトと部分レベルの構成を明示的でシンプルな制御を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:54:06 GMT)
ZeroScene: A Zero-Shot Framework for 3D Scene Generation from a Single Image and Controllable Texture Editing [36.1]
画像から3Dのシーン再構成とテクスチャ編集をゼロショットで行う新しいシステムを提案する。 ZeroSceneは、入力画像からオブジェクトレベルの2Dセグメンテーションと深度情報を抽出し、シーン内の空間的関係を推測する。そして、ポイントクラウドの3Dおよび2Dプロジェクション損失を共同で最適化し、正確なシーンアライメントのためのオブジェクトのポーズを更新する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:21:12 GMT)
Automated design of compound lenses with discrete-continuous optimization [36.0]
本稿では,複合レンズ設計における連続的パラメータと離散的パラメータの両方を自動的に,共同で更新する手法を提案する。本手法は,勾配に基づく最適化とマルコフ連鎖モンテカルロサンプリングアルゴリズムを組み合わせることで,この性能を実現する。そこで本研究では,複合レンズの広義設計空間を効果的に探索する様々なレンズ設計タスクについて実験的に検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:08:23 GMT)
Advancing Multi-agent Traffic Simulation via R1-Style Reinforcement Fine-Tuning [35.8]
エージェントの振る舞いを人間の好みや評価指標とよりよく整合させるため,次世代の予測モデルに適した新しいR1型強化微調整パラダイムを提案する。提案手法では、分布アライメントを改善するためのメトリック指向ポリシー最適化アルゴリズムと、スーパービジョンファインチューニング(SFT)と強化ファインチューニング(RFT)を交互に行う反復的な"SFT-RFT-SFT"トレーニング戦略を導入する。 Open Sim Agents Challengeの結果、SMART-R1は総合リアリズムメタスコア0.7858で最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:36:13 GMT)
PROMFUZZ: Leveraging LLM-Driven and Bug-Oriented Composite Analysis for Detecting Functional Bugs in Smart Contracts [35.7]
スマートコントラクトにおける機能的バグを検出する自動化およびスケーラブルなシステムである PROMFUZZ の設計と実装を行う。まず,デュアルエージェント・プロンプト・エンジニアリング・ストラテジーを活用するLarge Language Model (LLM) 駆動分析フレームワークを提案する。最後に,高レベルのビジネスモデルから低レベルのスマートコントラクト実装へ論理情報をマッピングする,バグ指向ファジリングエンジンを設計する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:32:41 GMT)
Prompt-Driven Agentic Video Editing System: Autonomous Comprehension of Long-Form, Story-Driven Media [35.6]
タイムラインではなく自由形式のプロンプトを通じて、クリエイターが複数時間コンテンツを再構成するのに役立つプロンプト駆動のモジュール編集システムを提案する。コアとなるセマンティックインデックスパイプラインは、時間分割、ガイド付きメモリ圧縮、粒度間の融合を通じてグローバルな物語を構築する。我々のシステムは、即席編集をスケールし、物語の一貫性を保ち、自動化と創造者制御のバランスをとる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:22:30 GMT)
IndexNet: Timestamp and Variable-Aware Modeling for Time Series Forecasting [35.2]
IndexNetは、Index Embedding (IE)モジュールを備えたベクトルベースの拡張フレームワークである。 IEはタイムスタンプを埋め込みに変換し、入力シーケンスに注入することで、長期の複雑な周期パターンをキャプチャするモデルの能力を向上させる。並行してCEは、各変数をそのインデックスに基づいてユニークで訓練可能なID埋め込みを割り当て、モデルが不均一な変数を明示的に区別できるようにする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:30:17 GMT)
ML-Asset Management: Curation, Discovery, and Utilization [35.1]
モデル、データセット、メタデータなどの機械学習(ML)資産は、現代のMLの中心である。実際には爆発的な成長にもかかわらず、これらの資産は、断片化されたドキュメント、ストレージ、一貫性のないライセンス、統一された発見メカニズムの欠如により、しばしば利用されていない。このチュートリアルでは、カリキュラム、発見、利用など、ML-アセット管理アクティビティのライフサイクル全体について概観する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:14:33 GMT)
DEL-ToM: Inference-Time Scaling for Theory-of-Mind Reasoning via Dynamic Epistemic Logic [34.9]
理論・オブ・ミンド(ToM)タスクは大きな言語モデルに固有の課題をもたらす。推論時間スケーリングによる検証可能なToM推論を改善するフレームワークであるDEL-ToMを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:36:39 GMT)
ReflAct: World-Grounded Decision Making in LLM Agents via Goal-State Reflection [34.8]
ReflActは、推論を単に次のアクションを計画することから、その目標に対してエージェントの状態を継続的に反映することに移行する。決定を明示的に下し、進行中のゴールアライメントを実施することで、ReflActは戦略的信頼性を劇的に向上します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:14:06 GMT)
PCRI: Measuring Context Robustness in Multimodal Models for Enterprise Applications [34.6]
MLLMのロバスト性を定量化する最初の体系的かつ解釈可能なスコアである textbfPatch Context Robustness Index (PCRI) を導入する。 InternVL2-26B や Qwen2VL-72B など,タスク間の一貫したロバスト性を示すモデルはほとんどありません。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:39:57 GMT)
RobuQ: Pushing DiTs to W1.58A2 via Robust Activation Quantization [34.0]
Diffusion Transformer (DiT) は画像生成の強力なバックボーンとして登場した。彼らの実践的な展開は、相当な計算とメモリコストによって妨げられている。本稿では,RobuQ という名称の DiT の体系的 QAT フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:35:12 GMT)
Query-Focused Retrieval Heads Improve Long-Context Reasoning and Re-ranking [33.7]
QRHead (Query-Focused Retrieval Head) を導入し,長いコンテキストからの検索を向上するアテンションヘッドの改良を行った。また,QRHeadの蓄積したアテンションマスを検索スコアとして利用する,効率的かつ効果的な検索手法であるQRRetrieverを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:15:02 GMT)
Towards Foundation Models for Zero-Shot Time Series Anomaly Detection: Leveraging Synthetic Data and Relative Context Discrepancy [33.7]
時系列異常検出(TSAD)は重要な課題であるが、見えないデータに一般化するモデルを開発することは大きな課題である。我々は、新しい事前学習パラダイムの上に構築されたTSADの新たな基盤モデルであるtextttTimeRCDを紹介した。 textttTimeRCD はゼロショット TSAD において,既存の汎用および異常固有の基盤モデルよりも大幅に優れていることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:02:53 GMT)
RCI: A Score for Evaluating Global and Local Reasoning in Multimodal Benchmarks [33.7]
リージョンインデックス(RCI)は、データセットがグローバルとローカルの視覚情報に依存することを定量化する最初のモデルベースのスコアである。 RCIを広く使用されている13のマルチモーダルベンチマークに適用すると,そのほとんどは局所的推論を好んでいることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:26:11 GMT)
AudioMoG: Guiding Audio Generation with Mixture-of-Guidance [33.4]
本稿ではオーディオ生成のための混合誘導フレームワークであるAudioMoGを紹介する。デザインの世界では、AudioMoGは独特の指針原理の相補的な利点を利用することができる。推定速度が同じである場合、AudioMoGアプローチはT2A生成における単一のガイダンスを一貫して上回ることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:12:43 GMT)
Improving LLM Reasoning through Interpretable Role-Playing Steering [33.3]
ロールプレイングは大規模言語モデル(LLM)の推論能力を高める効果的な手法として登場した。 Sparse Autoencoder Role-Playing Steering (SRPS) は、ロールプレイング行動に関連する内部モデルの特徴を特定し、操作する新しいフレームワークである。提案手法は,ロールプレイプロンプトから潜在表現を抽出し,アクティベーションパターンに基づいて最も関連性の高い特徴を選択し,制御可能な強度でモデルの残留ストリームに注入可能なステアリングベクトルを構築する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:11:49 GMT)
TreeIRL: Safe Urban Driving with Tree Search and Inverse Reinforcement Learning [33.1]
TreeIRLはモンテカルロ木探索(MCTS)と逆強化学習(IRL)を組み合わせた自動運転のための新しいプランナーである大規模シミュレーションでは古典的かつ最先端のプランナーと、ラスベガス大都市圏で500マイル以上を走行する現実の自動運転に対して、TreeIRLを評価した。 TreeIRLは、安全性、進歩性、快適性、人間らしくバランスをとることで、全体的なパフォーマンスを最高のものにします。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:16:46 GMT)
GSID: Generative Semantic Indexing for E-Commerce Product Understanding [32.9]
textbfGenerative textbfSemantic textbfIntextbfDexings (GSID)を提案する。 GSID は,(1) ドメイン内のセマンティック埋め込みを学習するための非構造化製品メタデータの事前学習,(2) 下流アプリケーションに適したより効果的なセマンティックコードの生成,という2つの重要なコンポーネントから構成される。実際のeコマースプラットフォーム上でのデプロイに成功し、製品理解やその他の下流タスクにおいて有望な成果を上げています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:58:05 GMT)
Token Merging via Spatiotemporal Information Mining for Surgical Video Understanding [32.5]
本稿では,画像理解トークン統合法(STIM-TM)を提案する。 STIM-TMは、時間的および空間的次元に沿ってトークンの冗長性を独立に減少させる分離戦略を導入する。 STIM-TMは、トレーニングなしの方法で動作し、65ドル以上のGFLOPを削減し、総合的な手術ビデオタスク間の競争精度を維持しながら、かなりの効率を達成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:24:57 GMT)
ByteSized32Refactored: Towards an Extensible Interactive Text Games Corpus for LLM World Modeling and Evaluation [32.0]
本稿では,ByteSized32 コーパスのモジュール化と実装であるByteSized32Refactoredを紹介した。各テキストゲームのコード構造を最適化し,GameBasic.pyファウンデーションライブラリを作成する。集中型設計により、ByteSized32Refactoredはより効率的に拡張でき、新しいシナリオと仕様のテキストゲームを含めることができます。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:07:54 GMT)
DESIGNER: Design-Logic-Guided Multidisciplinary Data Synthesis for LLM Reasoning [31.7]
本稿では,「設計論理」の概念を導入し,人間教育者の質問作成過程を模倣するようにLCMに指示する。 LLMを使って、さまざまな分野にわたる既存の質問から12万以上の設計ロジックをリバースエンジニアリングし、抽象化します。これらの設計ロジックをソースドキュメントとマッチングすることで、既存のデータセットの難しさや多様性をはるかに超える推論的な質問を作成できるのです。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:53:49 GMT)
Flexible MOF Generation with Torsion-Aware Flow Matching [31.5]
化学および幾何学的自由度の両方をモデル化することにより制限を克服する2段階MOF生成フレームワークを提案する。本実験では, 復元精度の向上, 有効, 新規, ユニークなMOFの生成, 新規なビルディングブロックの創出能力について検証した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:29:33 GMT)
Continuous Optimization for Feature Selection with Permutation-Invariant Embedding and Policy-Guided Search [31.5]
我々は,特徴選択の知識を連続的な埋め込み空間に保存するエンコーダ・デコーダパラダイムを開発した。埋め込み空間の探索を指導するために,政策に基づく強化学習アプローチも採用している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:56:46 GMT)
Language Model Planning from an Information Theoretic Perspective [31.3]
デコーダのみの言語モデル(LM)は、コヒーレントな長距離生成をサポートするために中間計算を編成する。計画には、長い地平線上で計算を構造化し、複数の可能な継続を考慮し、過去の情報を選択的に再利用することが含まれる。我々は、合成文法、パスフィニングタスク、自然言語データセットにわたるLMにおける計画について研究する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:58:15 GMT)
Enhancing LLM Steering through Sparse Autoencoder-Based Vector Refinement [31.3]
既存のステアリング手法は、行動情報を学習するために大規模なデータセットに依存している。本稿では,SAAEを利用してステアリングベクトルを意味的に識別・拡張するスパースオートエンコーダ(SAE-RSV)によるステアリングベクトルの精細化について紹介する。本フレームワークでは、まず、SAEが提供するセマンティクスに基づいてタスク関連機能を取り除き、そのセマンティクスの類似性を通じて、小さなデータセットから欠落したタスク関連機能を強化する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:49:22 GMT)
Joint Value Estimation and Bidding in Repeated First-Price Auctions [31.2]
競売者は、各競売の後に実現された結果(勝敗)のみを観察する。本稿では,私的価値を共同で推定し,入札戦略を最適化するアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:07:44 GMT)
AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving [31.1]
VLM(Vision-Language Models)は、自律走行を約束するが、幻覚、非効率な推論、限られた実世界の検証は、正確な知覚と堅牢なステップバイステップ推論を妨げる。我々は、Chain-of-Thought(CoT)推論と、自律運転タスクのための動的エージェントスタイルのツール呼び出しを統合した、先駆的な統合フレームワークであるtextbfAgentThinkを紹介した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:34:37 GMT)
The Final Layer Holds the Key: A Unified and Efficient GNN Calibration Framework [31.1]
グラフニューラルネットワーク(GNN)は、グラフベースのタスクにおいて顕著な効果を示した。しかしながら、彼らの予測的自信は、しばしば誤解され、通常、自信不足を示す。本稿では,この問題に対処するための簡易かつ効率的なグラフキャリブレーション法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:37:12 GMT)
VisioMath: Benchmarking Figure-based Mathematical Reasoning in LMMs [31.0]
1,800 の高品質 K-12 数学問題のキュレートされたベンチマークである groundingMath は、すべての候補解が微妙な視覚的類似性を持つダイアグラムである。最先端のオープンソースシステムと広く採用されているオープンソースモデルの両方をカバーする、最先端のLMMの包括的な評価は、画像間の類似性が増大するにつれて、一貫した精度の低下を示す。トレーニングなしアプローチと微調整の3つのアライメント指向戦略について検討し,精度の向上を図る。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:16:57 GMT)
Adversarial Versus Federated: An Adversarial Learning based Multi-Modality Cross-Domain Federated Medical Segmentation [31.0]
フェデレーション学習は、異なるクライアント間で機械学習モデルの協調トレーニングを可能にする。我々は新しいフェデレーションドメイン適応(FedDA)セグメンテーショントレーニングフレームワークを提案する。提案するFedDAは、クロスドメインのフェデレーションアグリゲーションを実現し、クロスモダリティ処理機能を備えた単一モダリティクライアントを実現する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:26:04 GMT)
DriveE2E: Closed-Loop Benchmark for End-to-End Autonomous Driving through Real-to-Simulation [31.0]
我々は,CARLAシミュレータに現実の運転シナリオを密に統合した,単純なクローズドループ評価フレームワークを導入する。当社のアプローチでは、高マウントのインフラストラクチャセンサーによってキャプチャされた総合的な100時間ビデオデータセットから選択された800の動的トラフィックシナリオを抽出する。これらのデジタル双生児は実世界の交通と環境特性を正確に再現し、CARLAのより現実的なシミュレーションを可能にした。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:55:14 GMT)
Pretraining Scaling Laws for Generative Evaluations of Language Models [30.7]
生成評価にパス-at-k$を適合させ、最も高価なモデルのパス-at-k$を予測するための3つの異なるスケーリング法則を示す。我々のフレームワークは、研究者や実践者に対して、生成性能を予測するための洞察と方法論を提供します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:04:18 GMT)
Autoregressive Video Generation beyond Next Frames Prediction [30.7]
VideoARは、様々な予測ユニットをサポートする統一されたフレームワークである。立方体に基づく予測は、常に優れた品質、速度、時間的コヒーレンスを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:37:53 GMT)
Reasoning Scaffolding: Distilling the Flow of Thought from LLMs [30.6]
我々は、推論を構造化生成プロセスとして再編成するフレームワークであるReasoning Scaffoldingを紹介します。本手法は, 精度と論理的整合性の両方において, 最先端の蒸留法よりも優れていた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:49:32 GMT)
K-DeCore: Facilitating Knowledge Transfer in Continual Structured Knowledge Reasoning via Knowledge Decoupling [30.5]
既存の連続学習アプローチは、シーケンシャルなタスクに適用した場合、重大な課題に直面します。そこで我々はCSKRフレームワークであるtextscK-DeCoreを提案する。 textscK-DeCoreは、異なるステージに対してデュアルパースペクティブなメモリ統合機構を統合し、構造誘導された擬似データ合成戦略を導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:34:21 GMT)
From An LLM Swarm To A PDDL-Empowered HIVE: Planning Self-Executed Instructions In A Multi-Modal Jungle [30.3]
我々は、一連のアトミックアクションの知識を意識した計画のための包括的ソリューションであるHiveを紹介する。 Hiveは一連のモデルで動作し、自然言語の命令を受け取り、スケジュールし、アトミックアクションの計画を実行します。エージェントシステムのマルチモーダル能力を総合的に評価するために, MuSE ベンチマークを導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:13:10 GMT)
Optimization Modeling via Semantic Anchored Alignment [30.0]
SAC-Optは,問題セマンティクスにおいて,解答フィードバックではなく最適化モデルに基づく後方誘導補正フレームワークである。各ステップで、SAC-Optは元のセマンティックアンカーと生成されたコードから再構成されたアンカーを調整し、ミスマッチしたコンポーネントのみを選択的に修正する。 7つの公開データセットに関する実証的な結果は、SAC-Optが平均モデリング精度を7.8%改善し、ComplexLPデータセットで最大21.9%向上したことを示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:25:31 GMT)
GRS-SLAM3R: Real-Time Dense SLAM with Gated Recurrent State [29.9]
本稿では,高密度シーン再構築のためのエンドツーエンドSLAMフレームワークであるGRS-SLAM3Rを紹介する。本手法は,グローバル座標における逐次的入力と計量スケールの点群を漸進的に推定する。各種データセットを用いた実験により, リアルタイム性能を維持しつつ, より優れた復元精度を実現することができた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:33:34 GMT)
BridgeDrive: Diffusion Bridge Policy for Closed-Loop Trajectory Planning in Autonomous Driving [29.8]
BridgeDriveは、閉ループ軌道計画のための新しいアンカー誘導拡散ブリッジポリシーである。我々はBench2Driveベンチマークで最先端のパフォーマンスを達成し、先行技術よりも成功率を5%向上させた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:47:12 GMT)
Temporal Grounding as a Learning Signal for Referring Video Object Segmentation [29.6]
Referring Video Object (RVOS)は、自然言語表現に基づくビデオ内のオブジェクトのセグメンテーションと追跡を目的としており、ビジュアルコンテンツとテキストクエリの正確なアライメントを必要とする。既存の手法は、主に訓練中にフレームサンプリングとすべての可視物体の監督が区別できないため、意味的ミスアライメントに悩まされることが多い。私たちは、MeViSベンチマークに基づいて構築されたデータセットであるMeViS-Mを紹介します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:27:41 GMT)
StrucADT: Generating Structure-controlled 3D Point Clouds with Adjacency Diffusion Transformer [29.6]
本稿では,部分的存在と部分的隣接関係を構成する形状構造を用いて点雲の生成を制御することを提案する。この構造グラフ表現に基づいて,新しい構造制御可能な点雲生成モデルであるStrucADTを紹介する。実験により, 構造制御可能な3次元点雲生成法は高品質で多様な点雲を生成することが示された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:45:51 GMT)
Towards Understanding Subliminal Learning: When and How Hidden Biases Transfer [29.6]
言語モデルは蒸留中に隠れバイアスを転送することができる。この現象をサブリミナル学習(subliminal learning)という。柔らかい蒸留の下では,教師の次点の完全な分布について,教師の指導を受けることができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:51:22 GMT)
CE-FAM: Concept-Based Explanation via Fusion of Activation Maps [29.5]
活性化マップ(CE-FAM)の融合による概念ベース説明本稿では,CE-FAM(Fusion of Activation Maps)による概念ベース説明法を提案する。提案手法は,注釈付きデータセットを必要とせず,任意の概念を扱うためにVLM知識を活用しながら,概念領域とそのコントリビューションを識別するための一般的なフレームワークを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:40:53 GMT)
RAM-W1K: A Multi-Task Wrist Dataset and Benchmark for Rheumatoid Arthritis [29.3]
手首は関節リウマチ(RA)の診断における重要な領域であるこのデータセットは、4つの医療センターから388人の患者から1048個の手首の従来のX線写真で構成されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:16:06 GMT)
Reinforcement Learning with Inverse Rewards for World Model Post-training [29.2]
ビデオワールドモデルにおける動作追跡を改善するために,逆回帰を用いた強化学習を提案する。 RLIRは、逆ダイナミクスモデルを用いて生成されたビデオから入力アクションを復元することにより、検証可能な報酬信号を導出する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:27:47 GMT)
Ghost Imaging with Free Electron-Photon Pairs [28.5]
ゴーストイメージングとしても知られるコインシデンスイメージングは、2つの粒子間の相関を利用して標本に関する情報を再構成する。本研究では,透過電子顕微鏡内で発生した電子-カソードルミネッセンス光子対を用いた同時撮像について検討する。空間分解能を2$mu$mまで下げることで、フォトニック量子光学から電子顕微鏡への量子強調画像技術の適用を可能にしました。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:29:16 GMT)
BlockFUL: Enabling Unlearning in Blockchained Federated Learning [28.5]
フェデレートラーニング(FL)におけるアンラーニングは、モデルが複雑な継承関係を持って成長し進化するにつれて、大きな課題を提起する。本稿では,FL内の未学習機能を実現するために,ライブチェーンとアーカイブチェーンからなる二重鎖構造を持つ新しいフレームワークを提案する。 2つの新しいアンラーニングパラダイム、すなわち並列およびシーケンシャルパラダイムは、勾配ベースおよび再学習ベースのアンラーニング手法によって効果的に実装できる。実験により,これらの手法がデータ依存や運用上のオーバーヘッドを効果的に低減し,BlockFUL内の未学習モデル全体の性能を向上することを確認した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:01:54 GMT)
Vidar: Embodied Video Diffusion Model for Generalist Manipulation [28.2]
Vidarは、ほとんどのエンボディメント固有のデータを転送可能なビデオに置き換える、事前駆動のローショット適応パラダイムである。以上の結果から,強力で安価なビデオプリエントと最小限のオンロボットアライメントという,“先行的かつ多数の実施”のためのスケーラブルなレシピが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:56:12 GMT)
MetaMind: Modeling Human Social Thoughts with Metacognitive Multi-Agent Systems [28.2]
メタ認知の心理学理論に触発されたマルチエージェントフレームワークであるMetaMindを紹介する。我々のフレームワークは3つの挑戦的なベンチマークで最先端のパフォーマンスを実現し、実世界の社会的シナリオは35.7%改善した。この研究は、共感的対話や文化的に敏感な相互作用に応用して、人間のような社会知性に向けてAIシステムを前進させる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:33:10 GMT)
A Necessary Step toward Faithfulness: Measuring and Improving Consistency in Free-Text Explanations [28.1]
本稿では,エビデンス重みの概念を拡張し,予測-説明整合性の尺度を提案する。直接選好最適化を適用することで、3つのモデルファミリー間で発生した説明の一貫性が向上することを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:19:57 GMT)
Taming Masked Diffusion Language Models via Consistency Trajectory Reinforcement Learning with Fewer Decoding Step [28.1]
マスケッド拡散言語モデルは、並列復号化、フレキシブルな生成順序、推論ステップの少ないポテンシャルなどの特性を提供する。直感的なアプローチは、自己回帰(AR)言語モデルのために確立された技術を直接MDLMに転送することである。本稿では,EOS Early Rejection (EOSER) と Ascending Step-Size (ASS) デコードスケジューラを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:01:15 GMT)
MCPMark: A Benchmark for Stress-Testing Realistic and Comprehensive MCP Use [28.0]
MCPMarkは、より現実的で包括的な方法でMPPの使用を評価するために設計されたベンチマークである。ドメインの専門家とAIエージェントが共同で作成した127ドルの高品質なタスクで構成されている。平均して、LCMは16.2ドル、タスクごとに17.4ドルのツールコールを必要とし、以前のMPPベンチマークよりも大幅に上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:53:27 GMT)
Multi-Scale Spatial-Temporal Hypergraph Network with Lead-Lag Structures for Stock Time Series Forecasting [27.9]
本研究は,ストック時系列予測のためのHermesフレームワークを提案する。移動アグリゲーションとマルチスケールの融合モジュールをハイパーグラフネットワークに統合する。その結果,Hermesは既存の最先端手法よりも効率と精度が優れていることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:13:55 GMT)
Position-Blind Ptychography: Viability of image reconstruction via data-driven variational inference [27.8]
位置盲検撮影における視覚的逆問題について検討した。この問題の動機は、単一粒子回折X線イメージングによるものである。適切な照明構造と強い先行性により, 計測ノイズ下であっても, 信頼性が高く, 良好な画像再構成が可能であることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:49:55 GMT)
Evaluating the Robustness of Chinchilla Compute-Optimal Scaling [27.8]
Hoffman et al (2022)のChinchilla論文は、計算最適スケーリングの原則を導入した。開業医はいまだにチンチラの処方薬を頼りにできるのか? 意外なことに、分析にどのモデルパラメータが使われているかは、重要な結果に有意に影響を与えていない。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:41:01 GMT)
Diff-3DCap: Shape Captioning with Diffusion Models [27.7]
Diff-3DCapは3次元オブジェクトと連続拡散モデルを表現するために一連の投影されたビューを使用し、キャプション処理を容易にする。実験の結果,Diff-3DCapは現在の最先端手法に匹敵する性能を達成できることが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:59:22 GMT)
Knowledge-Level Consistency Reinforcement Learning: Dual-Fact Alignment for Long-Form Factuality [27.7]
幻覚と事実性の欠如は、大きな言語モデルの信頼性にとって重要な障害である。本稿では,政策モデルの表現された知識と基本モデルのパラメトリック知識との知識整合性に着目した新しい枠組みを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:23:06 GMT)
AssemblyHands-X: Modeling 3D Hand-Body Coordination for Understanding Bimanual Human Activities [27.6]
本稿では,バイマニュアルアクティビティのためのマーカーレス3Dハンドボディベンチマークである AssemblyHands-X を紹介する。このアプローチは多視点三角測量とSMPL-Xメッシュフィッティングを組み合わせることで,手と上半身の信頼性の高い3D登録を実現する。提案実験により,ポーズに基づくアクション推論はビデオベースラインよりも効率的かつ正確であることが確認された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:52:14 GMT)
Continuous Speculative Decoding for Autoregressive Image Generation [27.3]
連続的視覚自己回帰(AR)モデルは、画像生成において有望な性能を示す。投機的復号化は事実上自己回帰推論を加速させたこの研究は、低受理率、不整合出力分布、解析式のない修正分布からの課題に対処する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:54:03 GMT)
Fractional Control Gate Protocols For Quantum Engines [27.2]
Nthルートゲートは2ビット演算のペーストな適用を可能にする。量子熱エンジンを操作するための量子熱力学プロトコルに適用する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:42:42 GMT)
AISHELL6-whisper: A Chinese Mandarin Audio-visual Whisper Speech Dataset with Speech Recognition Baselines [27.2]
AISHELL6-Whisperは,大規模オープンソースの音声-視覚的ささやき音声データセットである。本稿ではWhisper-Flamingoフレームワークに基づく音声視覚音声認識(AVSR)ベースラインを提案する。本モデルでは, データセットのテストセットにおいて, ささやき音声の文字誤り率(CER)を4.13%, 正常音声の1.11%とする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:14:06 GMT)
OrderFusion: Encoding Orderbook for End-to-End Probabilistic Intraday Electricity Price Forecasting [27.1]
OrderFusionと呼ばれるエンドツーエンドの確率モデルを提案する。購入販売ダイナミクスのインタラクション対応表現を生成する。階層的に複数の量子を推定し、4,872個のパラメータでパラメータ効率を保っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:47:28 GMT)
Timber: Training-free Instruct Model Refining with Base via Effective Rank [26.8]
ポストトレーニングは、トレーニング済みのベースモデルを対応するインストラクトモデルに引き込む。この超現実性はまた、重要なトレードオフを被り、探査を制限するコストで搾取能力を改善している。我々は,Timberを提案する。Timberは,インストラクタモデルの探索能力を向上し,その活用性を保っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:59:43 GMT)
Sketching Low-Rank Plus Diagonal Matrices [26.8]
この研究は、低ランク*と*の対角成分を同時に推定するSKETCHLORDを導入する。理論的および経験的に、この結合推定は任意の逐次変量よりも優れていることを示す。合成(近似)LoRD行列に関する総合的な実験により、これらの構造を正確に復元するSKETCHLORDの性能が確認された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:44:16 GMT)
BOSfM: A View Planning Framework for Optimal 3D Reconstruction of Agricultural Scenes [26.8]
アクティブビジョン(AV)は多くの応用でロボット工学の研究が注目されている。本報告では, 新規な再構成品質に基づく最適化手法を提案する。選択した2次元画像から求める環境の3次元構造を再構築する「動きからの構造」の概念に依存している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:50:36 GMT)
From Personal to Collective: On the Role of Local and Global Memory in LLM Personalization [26.7]
大規模言語モデル(LLM)のパーソナライゼーションは、過去のインタラクションに基づいて、個人ユーザに対して振る舞いをモデル化することを目的としている。ローカルメモリとグローバルメモリを組み合わせたローカル・グローバル・メモリ・フレームワーク(LoGo)を提案する。 LoGoは、コールドスタートユーザーを温め、バイアスのある予測を緩和することで、パーソナライズ品質を継続的に改善する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:32:18 GMT)
VCSearch: Bridging the Gap Between Well-Defined and Ill-Defined Problems in Mathematical Reasoning [26.6]
5000以上の不確定な数学的問題を含むPMC(Issue with Missing and Contradictory conditions)というベンチマークを開発した。 VCSEARCHは、解決不可能な問題を特定する精度を、さまざまな大きな言語モデルで少なくとも12%向上させる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:03:09 GMT)
HS-STaR: Hierarchical Sampling for Self-Taught Reasoners via Difficulty Estimation and Budget Reallocation [26.5]
自己学習推論器(STaR)は、自己学習に自己生成応答を活用することにより、大規模言語モデル(LLM)の数学的推論能力を高める。本稿では,自己学習推論のための階層型サンプリングフレームワークHS-STaRを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:46:13 GMT)
Anchored Supervised Fine-Tuning [26.2]
大規模言語モデルのポストトレーニングには、教師付き微調整と強化学習のトレードオフが含まれる。 Dynamic Fine-Tuning (DFT)は、最近、トークンの確率でSFTの目標を再重み付けする、有望な中核として登場した。我々は, 軽量KL正則化によるDFTの再重み付けを向上し, 安定性を確保しつつ, 密度を維持したAnchored Supervised Fine-Tuning (ASFT)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:58:12 GMT)
MedLA: A Logic-Driven Multi-Agent Framework for Complex Medical Reasoning with Large Language Models [26.2]
textscMedLAは、大規模な言語モデル上に構築されたロジック駆動のマルチエージェントフレームワークである。エージェントはグラフ誘導の議論を行い、論理木を比較して反復的に洗練する。 textscMedLAは静的ロールベースシステムと単一エージェントベースラインの両方を一貫して上回っていることを実証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:06:39 GMT)
DEMO:Diffusion-based Evolutionary Optimization for 3D Multi-Objective Molecular Generation [25.8]
構造的制約を満足しながら複数の目的特性を最適化することは、3次元分子発見の大きな課題である。本稿では,事前学習した拡散モデルの生成力を生かした新しい3次元分子多目的進化アルゴリズムを提案する。本手法は,拡散モデルの前方処理で定義される雑音空間におけるクロスオーバー操作を行い,親の特徴や所望のフラグメントを子孫に融合させる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:25:09 GMT)
Logic Gate Neural Networks are Good for Verification [25.7]
学習論理ゲートネットワーク(LGN)における大域的ロバスト性と公正性を検証するためのSAT符号化を導入する。提案手法は,新たに構築された5クラスの変種を含む5つのベンチマークデータセットを用いて評価し,LGNが検証に適しており,高い予測性能を維持していることを確認した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:03:31 GMT)
On the Emergence of Weak-to-Strong Generalization: A Bias-Variance Perspective [25.6]
W2SG(Weak-to-strong generalization)とは、弱い教師によってラベル付けされたデータセットに基づいて訓練された強力な学生モデルが、ターゲットタスクにおいて教師より優れる現象である。近年の研究では、学生モデルと教師モデルの間の予測ミスフィットによるパフォーマンス向上が評価されている。 W2SGは、生徒モデルが個々の教師を模倣するのではなく、その後部の平均教師に近似した場合に出現する可能性が示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:13:18 GMT)
Video Panels for Long Video Understanding [25.6]
本稿では,長時間ビデオ理解に特化して設計された視覚的プロンプト戦略を提案する。複数のフレームを1つの画像に組み合わせることで、時間分解能の空間的詳細を効果的に取り除くことができる。我々のアプローチは、トレーニングフリー、パラメータフリー、モデル非依存であり、既存のビデオ言語モデルにシームレスに統合できる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:05:55 GMT)
Towards Large-Scale In-Context Reinforcement Learning by Meta-Training in Randomized Worlds [25.3]
In-Context Reinforcement Learning (ICRL)により、エージェントは対話的な体験から自動的に、そしてオンザフライで学習することができる。我々はAnyMDPという手続き的に生成されたマルコフ決定プロセスを提案する。慎重に設計されたランダム化プロセスを通じて、AnyMDPは比較的低い構造バイアスを維持しながら、大規模に高品質なタスクを生成することができる。提案手法は,AnyMDPタスクを十分に大規模に行うことで,多目的な文脈内学習パラダイムによる学習では考慮されなかったタスクを一般化できることを実証した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:53:05 GMT)
Durian: Dual Reference Image-Guided Portrait Animation with Attribute Transfer [25.3]
デュリアンは、1つ以上の参照画像から対象のポートレートに相互同一性属性を伝達したポートレートアニメーションビデオを生成するための最初の方法である。本稿では,通常のポートレートビデオを利用して,明示的なペアデータなしで属性転送を学習する自己再構成式を提案する。 Durianは、属性転送を伴うポートレートアニメーションの最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:25:52 GMT)
Hanfu-Bench: A Multimodal Benchmark on Cross-Temporal Cultural Understanding and Transcreation [25.3]
Hanfu-Benchは、専門家による新しいマルチモーダルデータセットである。文化的な視覚的理解と文化的なイメージの再現という2つの中心的な課題から構成される。我々の評価では, 閉鎖型VLMは視覚的カットラル理解の非専門家と同等に機能するが, 人間の専門家では10%弱に低下する。トランスクリエーション作業では,多面的評価により,最高の性能モデルがわずか42%の成功率を達成したことが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:52:01 GMT)
From Past To Path: Masked History Learning for Next-Item Prediction in Generative Recommendation [25.3]
Masked History Learning (MHL) は、単純な次のステップの予測から歴史の深い理解へと目標をシフトする、新しいトレーニングフレームワークである。 MHLは、マスクされた歴史的なアイテムを再構築する補助的なタスクで、標準的な自己回帰目標を増強する。 3つの公開データセットの実験により、我々の手法は最先端の生成モデルよりも著しく優れていることが示された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:22:19 GMT)
MetaLint: Generalizable Idiomatic Code Quality Analysis through Instruction-Following and Easy-to-Hard Generalization [25.0]
コード品質分析を定式化するインストラクションフォローフレームワークであるMetaLintを紹介する。静的コード品質規則でモデルをトレーニングする従来のアプローチとは異なり、MetaLintは合成Linter生成データに命令チューニングを採用する。以上の結果から,MetaLintトレーニングは,未確認イディオムへの一般化を改善することが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:34:58 GMT)
Toward a Holistic Approach to Continual Model Merging [24.8]
本稿では,統合前,統合後,継続学習における2つの基本的な課題に対処する,3つの重要な段階に介入する連続モデル統合のための総合的枠組みを提案する。提案手法は,まずドメイン固有データに基づいて,その接空間内の主モデルを微調整することによって,制約を克服する。マージ中は、単にパラメータ平均を超える利用可能な状態からの関数情報を活用して、古いモデルを再検討する必要を回避する。最後に、マージ後の補正は、事前および後マージされたモデル間の表現差を調整し、バイアスを低減し、一定のメモリ制約の下で動作しながら、全体的なパフォーマンスを向上する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:51:04 GMT)
Easy Turn: Integrating Acoustic and Linguistic Modalities for Robust Turn-Taking in Full-Duplex Spoken Dialogue Systems [24.7]
Easy Turnはオープンソースのモジュール型ターンテイク検出モデルである。音声と言語によるバイモーダル情報を統合し、対話のターン状態を予測する。データとモデルはGitHubで公開される予定だ。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:29:44 GMT)
A Partition Cover Approach to Tokenization [24.6]
トークン化とは、文字列を一定の語彙サイズのトークンに符号化するプロセスである。 Byte-Pair corpora (BPE) は、トークン化問題を圧縮問題として定式化し、マージのシーケンスを実行することでそれに取り組む。 GreedTokは圧縮においてBPEやUnigramよりも優れており、GreedWMCに匹敵するカバースコアが得られることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:27:52 GMT)
Space Group Conditional Flow Matching [24.6]
無機結晶は3次元空間における原子の周期的、高対称性の配列である。原子座標を予測するほとんどの生成モデルは、これらの対称性の制約を無視する。本研究では,高対称性で安定な結晶のターゲット個体群にかなり近づいた新しい生成フレームワークであるSpace Group Conditional Matching Flowを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:51:29 GMT)
Transparent Visual Reasoning via Object-Centric Agent Collaboration [24.5]
Oceanは本質的に、オブジェクト中心の表現と透過的なマルチエージェント推論プロセスに基づいて構築された解釈可能なフレームワークである。標準的な視覚分類器やGradCAMやLIMEといった一般的なポストホックな説明ツールと比較した。本結果は,忠実な推論プロセスを持つ最先端のブラックボックスモデルに対して,競争性能を示すものである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:06:52 GMT)
Face-voice Association in Multilingual Environments (FAME) 2026 Challenge Evaluation Plan [24.5]
フェース・ボイス・アソシエーション・イン・マルチリンガル・アソシエーション(FAME) 2026 Challengeは、マルチリンガル・シナリオの下でのフェース・ボイス・アソシエーションの探求に焦点を当てている。本報告では、FAME Challengeの課題、データセット、ベースラインモデル、タスクの詳細について説明する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:39:18 GMT)
CC-Time: Cross-Model and Cross-Modality Time Series Forecasting [24.4]
時系列予測のためのPLMを用いたクロスモデル・クロスモーダル学習(CC-Time)を提案する。第1の側面では、CC-Timeは、時系列シーケンスと対応するテキスト記述の両方から、言語モデルにおける時間的依存とチャネル相関をモデル化するために、相互モダリティ学習を取り入れている。第2の側面では、CC-Timeはさらに、PLMと時系列モデルからの知識を適応的に統合し、より包括的な時系列パターンのモデリングを形成するクロスモデル融合ブロックを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:19:26 GMT)
HiViS: Hiding Visual Tokens from the Drafter for Speculative Decoding in Vision-Language Models [24.0]
視覚言語モデル(HiViS)における投機的復号化のためのドナーからの視覚トークンの隠蔽を提案する。 HiViSは、視覚言語モデルにおける投機的復号化の非効率性を緩和する明示的単純入力分解フレームワークである。提案手法は, プリフィルシーケンス長を目標VLM入力の0.7%-1.3%に圧縮する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:05:21 GMT)
Hazy Pedestrian Trajectory Prediction via Physical Priors and Graph-Mamba [23.9]
本研究では,大気散乱の物理的先行と歩行者関係のトポロジ的モデリングを組み合わせた深層学習モデルを提案する。本手法は, 密集ヘイズシナリオにおけるSOTAモデルと比較して, minADE/minFDEメトリクスを37.2%, 41.5%削減する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:29:43 GMT)
PartnerMAS: An LLM Hierarchical Multi-Agent Framework for Business Partner Selection on High-Dimensional Features [23.8]
評価を3層に分割する階層型マルチエージェントフレームワークを提案する。戦略を設計するプランナーエージェント,役割特異的評価を行う専門エージェント,アウトプットを統合するスーパーバイザエージェントである。 140のケースで、PartnerMASはシングルエージェントと議論ベースのマルチエージェントベースラインを一貫して上回り、最大10-15%のマッチレートを達成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:39:03 GMT)
Efficient Audio-Visual Speech Separation with Discrete Lip Semantics and Multi-Scale Global-Local Attention [23.7]
我々は,リップモーションを個別の音声対応セマンティックトークンに変換する軽量ビデオエンコーダDP-LipCoderを開発した。音声分離のための軽量エンコーダデコーダセパレータを構築し,各層がグローバルローカルアテンション(GLA)ブロックを組み込む。 3つのベンチマークデータセットの実験では、Dolphinは現在の最先端(SOTA)モデルを分離品質で上回るだけでなく、優れた効率向上を実現した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:25:34 GMT)
Score Replacement with Bounded Deviation for Rare Prompt Generation [23.7]
拡散モデルはしばしば、トレーニング分布にしばしば現れる稀な概念に苦しむ。スコア交換のレンズを通してレアプロンプト生成を再構成する。境界偏差基準を導入し、偏差が閾値を超えるとスイッチをトリガーする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:37:20 GMT)
Unlearning Isn't Invisible: Detecting Unlearning Traces in LLMs from Model Outputs [23.5]
大規模言語モデル(LLM)のための機械学習(MU)は、特定の望ましくないデータや知識を訓練されたモデルから取り除こうとする。未学習のトレース検出という新たな脆弱性を特定します。非学習トレースを90%以上の精度で検出できることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:16:49 GMT)
VMDiff: Visual Mixing Diffusion for Limitless Cross-Object Synthesis [23.5]
本稿では,ノイズレベルと潜時レベルの両方で2つの入力画像を統合することで,単一のコヒーレントオブジェクトを合成する拡散ベースフレームワークを提案する。本手法は, 視覚的品質, 意味的整合性, 人格的創造性において, 高いベースラインを達成している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:17:58 GMT)
High-Precision Dichotomous Image Segmentation via Depth Integrity-Prior and Fine-Grained Patch Strategy [23.4]
高精細度画像から細粒度オブジェクトを抽出する作業として,DIS(High-precision Dichotomous Image segmentation)がある。既存の方法はジレンマに直面し、非拡散法は効率的に機能するが、弱い意味論による誤検出や誤検出に悩まされる。単眼深度推定モデルから擬似深度情報を得ると,本質的な意味理解が得られる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:14:20 GMT)
Diagnosing Failure Root Causes in Platform-Orchestrated Agentic Systems: Dataset, Taxonomy, and Benchmark [23.3]
本稿では,プラットフォーム構築型エージェントシステムの根本原因同定について述べる。我々は、10のエージェントシステムから307の障害ログを含むデータセットAgentFailを構築し、それぞれが障害を根本原因にリンクする詳細なアノテーションを持つ。障害の原因を特徴付ける分類法を開発し、異なるプラットフォームやタスク領域にまたがる分布を解析する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:30:03 GMT)
When Thinking Backfires: Mechanistic Insights Into Reasoning-Induced Misalignment [23.1]
Reasoning-induced Misalignment (RIM) は推論能力が強化されたときに現れる。 RIMは推論やトレーニング中に特定のタイプの推論パターンが導入されたときに発生する。トレーニング中、安全クリティカルニューロンの推論と安全性の間には、アクティベーションの絡み合いが著しく高いことが判明した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:36:22 GMT)
FusionDTI: Fine-grained Binding Discovery with Token-level Fusion for Drug-Target Interaction [23.0]
本稿では,トークンレベルのFusionモジュールを用いてドラッグ・ターゲットインタラクションの詳細な情報を学習するFusionDTIという新しいモデルを提案する。特に、FusionDTIモデルでは、医薬品のSELFIES表現を使用して、配列フラグメントの無効化を軽減しています。提案したFusionDTIモデルは,既存の7つの最先端ベースラインと比較して,DTI予測において最高の性能が得られることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:13:13 GMT)
CORE-RAG: Lossless Compression for Retrieval-Augmented LLMs via Reinforcement Learning [22.9]
Retrieval-Augmented Generation (RAG) は、知識更新のタイムラインと大規模言語モデルにおける応答の事実的正確性を高めるための有望なアプローチとして登場した。 RAG用に調整された文書圧縮への既存のアプローチは、しばしばタスクパフォーマンスを低下させる。我々は、RAGにおけるロスレスコンテキスト圧縮の新しい手法であるCOREを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:58:19 GMT)
Differentiable Sparsity via $D$-Gating: Simple and Versatile Structured Penalization [22.9]
D$-Gatingは、理論上、元の群疎性問題の解法と等価であることを示す。ビジョン、言語、タスクにまたがって私たちの理論を検証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:08:29 GMT)
A Modality-Tailored Graph Modeling Framework for Urban Region Representation via Contrastive Learning [22.9]
都市域表現のためのモダリティ調整グラフモデリングフレームワークMTGRRを提案する。集約レベルのモダリティに対して、MTGRRは、各モダリティを専用の専門家GNNによって処理する、Mix-of-expertsグラフアーキテクチャを採用している。点レベルのモダリティのために、双対レベルのGNNを構築して、きめ細かい視覚的意味的特徴を抽出する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:38:08 GMT)
ColLab: A Collaborative Spatial Progressive Data Engine for Referring Expression Comprehension and Generation [22.8]
ColLabは、人間の監督なしに完全に自動化されたRECとREGデータ生成を可能にする、協調的な空間的プログレッシブデータエンジンである。 ColLab は REC と REG のアノテーション処理を著しく促進し,生成した表現の質と識別性を改善した。 ICCV 2025 MARS2 Challenge on Multimodal Reasoningにおいて,本フレームワークを部分的に採用した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:21:29 GMT)
Beyond the Strongest LLM: Multi-Turn Multi-Agent Orchestration vs. Single LLMs on Benchmarks [22.8]
複数の大規模言語モデル(LLM)エージェントが複数回にわたって対話するマルチターンマルチエージェントオーケストレーションについて,回答を反復的に提案したり,コンセンサスに到達するまで投票を行ったりすることで検討する。 GPQA-Diamond, IFEval, MuSRの4つのLCM(Gemini 2.5 Pro, GPT-5, Grok 4, Claude Sonnet 4)を用いて, GPQA-Diamond, IFEval, MuSRの2つの実験を行った。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:15:21 GMT)
Two Heads Are Better Than One: Dual-Model Verbal Reflection at Inference-Time [22.4]
本稿では,効果的なリフレクションを訓練した専用の批判モデルを備えたデュアルモデル反射スコーリングフレームワークを提案する。 DARSは強力なパフォーマンスを達成し、すべての評価指標で既存のASSベースラインを一貫して上回ります。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:21:29 GMT)
GRID: Scalable Task-Agnostic Prompt-Based Continual Learning for Language Models [22.3]
Prompt-based continual learning (CL)は、タスクシーケンス全体にわたって大きな言語モデル(LLM)を適用するためのパラメータ効率のよいアプローチを提供する。既存のほとんどのメソッドはタスク認識推論に依存し、タスク固有のプロンプトの集合を維持する。これらの課題に対処するために設計された統合フレームワークであるGRIDを提示する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:28:24 GMT)
HiDe: Rethinking The Zoom-IN method in High Resolution MLLMs via Hierarchical Decoupling [22.1]
HiDeは、Token-wise Attention Decoupling(TAD)を使用して、質問トークンを分離し、キー情報トークンを識別する、トレーニング不要のフレームワークである。背景干渉を排除しつつ、重要な空間配置を保存するコンパクトな表現を再構築する。最適化後、HiDeは以前のトレーニング不要のアプローチよりも75%少ないメモリを使用する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:31:48 GMT)
Towards Efficient CoT Distillation: Self-Guided Rationale Selector for Better Performance with Fewer Rationales [21.9]
チェイン・オブ・シント(CoT)蒸留は, より大規模な教師モデルから多段階の推論能力を伝達することにより, 小型言語モデル(SLM)推論を強化することを目的としている。既存の作業は、主にデータ量に焦点を当てた合理的な品質を過小評価しており、ノイズや誤った情報を学生モデルに転送することができる。 textbfModel-textbfOriented textbfRationale textbfSelection textbfDistillation (MoRSD)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:09:07 GMT)
Poivre: Self-Refining Visual Pointing with Reinforcement Learning [21.9]
本稿では,視覚的ポインティングのための簡易かつ効果的な自己修正手法を提案する。我々は、この自己精製能力にインセンティブを与えるために強化学習を採用する。当社のトレーニングモデルであるPoivre-7Bは、Point-Benchに新たな技術状況を設定し、プロプライエタリなモデルと大規模なオープンソースモデルの両方を3%以上上回っています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:51:47 GMT)
A Family of Kernelized Matrix Costs for Multiple-Output Mixture Neural Networks [21.9]
ペアワイズ距離に基づくコストは、自己監督的でコントラストのある特徴学習に不可欠である。本稿では,4種類のカーネル化行列コストを用いたデータ密度近似を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:23:11 GMT)
Semantic Discrepancy-aware Detector for Image Forgery Identification [21.7]
偽造概念空間と意味概念空間のミスアライメントは、モデルの偽造検出性能を妨げる。本稿では,再現学習を利用して2つの空間をきめ細かな視覚レベルで整列させるセマンティック離散性認識検出器(SDD)を提案する。視覚的意味論的概念と偽トレースとの相互作用を強化するために,視覚的再構成パラダイムに基づく概念レベルの偽差学習モジュールを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:48:18 GMT)
Moving Out: Physically-grounded Human-AI Collaboration [21.6]
我々は、新しい人間-AIコラボレーションベンチマークであるTransping Outを紹介した。我々は、多様な人間の行動に適応するモデルの能力と、見えない物理的特性を評価する。我々の実験によると、BASSはAI-AIと人間-AIのコラボレーションにおいて最先端のモデルよりも優れています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:57:13 GMT)
Texture Vector-Quantization and Reconstruction Aware Prediction for Generative Super-Resolution [21.6]
テクスチャベクトル量子化とリコンストラクションアウェア予測戦略を提案する。提案した生成SRモデル (TVQ&RAP) は,少ない計算コストで実写SR結果を提供できる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:40:38 GMT)
In-Context Compositional Q-Learning for Offline Reinforcement Learning [21.5]
In-context compositional Q-Learning (textttICQL) は、Qラーニングを文脈推論問題として定式化する最初のオフラインRLフレームワークである。局所的なQ-関数の線形近似と正確なウェイト推定の2つの仮定の下で、textttICQLは有界Q-関数近似誤差を達成する。経験的に言えば、 textttICQLはオフライン設定のパフォーマンスを大幅に改善する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:55:21 GMT)
Bridging the Performance Gap Between Target-Free and Target-Based Reinforcement Learning [21.4]
本稿では,オンラインネットワークの最後の線形層のコピーをターゲットネットワークとして利用する新しい手法を提案する。連続的なベルマン更新を並列に学習する反復型Q-ラーニングの概念と組み合わせることで、ターゲットレスアプローチのサンプル効率を向上させることができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:20:32 GMT)
Dynamic Early Exit in Reasoning Models [21.3]
長いチェーン・オブ・シンクレット(CoT)生成における再考は、問題解決の効率を低下させるだけでなく、精度損失のリスクも引き起こす。我々は,LLMが生成時に早期終了によってCoT配列を自己トランケートできる簡易かつ効果的な方法を提案する。提案手法は追加のトレーニングを必要とせず,既存の o1 ライクな推論 LLM にシームレスに統合することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:33:07 GMT)
AdversariaL attacK sAfety aLIgnment(ALKALI): Safeguarding LLMs through GRACE: Geometric Representation-Aware Contrastive Enhancement- Introducing Adversarial Vulnerability Quality Index (AVQI) [21.2]
LLMに対する敵の脅威は、現在の防衛が適応できるよりも急速にエスカレートしている。 ALKALIは, 厳格にキュレートされた最初の逆数ベンチマークである。本稿では、遅延空間正規化と協調するアライメントフレームワークGRACEを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:31:47 GMT)
GEAR: A General Evaluation Framework for Abductive Reasoning [21.1]
GEAR(General Evaluation for Abductive Reasoning)は、汎用的で、完全に自動化され、透明で、ラベルのない評価パラダイムである。 GEARは、仮説セットを3つの指標でスコア付けする: 一貫性(それぞれの仮説が観察を説明する)、一般化可能性(一貫性のある仮説は目に見えない入力について有意義な予測をする)、多様性(セットは異なる予測とパターンをカバーしている)。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:22:28 GMT)
Singleton-Optimized Conformal Prediction [21.0]
コンフォーマル予測は、真の結果を所望の確率でカバーする単一の予測セットを構築するのに使うことができる。あいまいさを最小化することを目的とした,新たな非指向スコアを提案する。非整合集合を生成する平均確率。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:20:40 GMT)
DiBS-MTL: Transformation-Invariant Multitask Learning with Direction Oracles [20.9]
マルチタスク学習(MTL)アルゴリズムは、通常、異なるタスク損失または重み付き平均化による勾配を組み合わせたスキームに依存する。このような場合、タスクの損失を任意にスケールできるため、中心的な課題が発生する。非MTL設定におけるDiBSの収束挙動は理解されていないことを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:57:06 GMT)
RAVEN: Resilient Aerial Navigation via Open-Set Semantic Memory and Behavior Adaptation [20.7]
RAVENは、非構造化屋外環境での空中セマンティックナビゲーションのための3Dメモリベースの行動ツリーフレームワークである。空間的に一貫したセマンティックなボクセル線マップを永続記憶として使用し、長期計画を可能にし、純粋に反応性のある振る舞いを避ける。 RAVENは、シミュレーションのベースラインを85.25%上回り、屋外フィールドテストにおける空中ロボットへの展開を通じて実世界の適用性を実証している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:43:25 GMT)
Large-Scale Constraint Generation - Can LLMs Parse Hundreds of Constraints? [20.5]
大規模制約生成(LSCG: Large-Scale Constraint Generation)は、大規模言語モデルが大規模できめ細かい制約のリストを解析できるかどうかを評価する新しい問題である。 Words Checkerでは、モデル特性(例えば、サイズ、家族)とステアリング技術(例えば、Simple Prompt、Chain of Thought、Best of N)がパフォーマンスに与える影響を評価する。制約の元のリストを小さなサブセットにパースし、LLMが関連する制約にフォーカスするのに役立つ、小さくて専用のモデルであるFoCusNetを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:55:53 GMT)
VAMamba: An Efficient Visual Adaptive Mamba for Image Restoration [20.5]
VAMambaは2つの重要なイノベーションを持つVisual Adaptive Mambaフレームワークである。 QCLAMencesfeaturelearningthrougha FIFOキャッシュ。 GPS-SS2D(GreedyPathScanSS2D)は適応走査を誘導する。 VAMambaは、修復の質と効率の両方において、既存のアプローチを一貫して上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:12:43 GMT)
InfoDet: A Dataset for Infographic Element Detection [20.4]
本稿では,インフォグラフィックにおけるチャートとHROの正確なオブジェクト検出モデルの開発を支援するデータセットであるInfoDetを紹介する。 11,264件のリアルインフォグラフィックと90,000件のインフォグラフィックが含まれており、1400万以上のバウンディングボックスアノテーションがある。 1)視覚言語モデルのチャート理解性能を高めるためのThinking-with-Boxesスキームの構築,2)既存のオブジェクト検出モデルとの比較,3)ドキュメントレイアウトとUI要素検出に開発した検出モデルを適用する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:53:16 GMT)
CADDesigner: Conceptual Design of CAD Models Based on General-Purpose Agent [19.9]
大規模言語モデル(LLM)を用いたCAD概念設計のためのエージェントを提案する。 CIP(Context-Independent Imperative Paradigm)に基づいて構築され、高品質なCADモデリングコードを生成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:32:41 GMT)
VFRTok: Variable Frame Rates Video Tokenizer with Duration-Proportional Information Assumption [19.8]
既存のトークン化器は固定時間圧縮率を提供し、拡散モデルの計算コストはフレームレートと線形にスケールする。本稿では、可変フレームレート符号化と復号を可能にするトランスフォーマーベースのビデオトークンであるVFRTokを紹介する。 VFRTokは既存のトークンよりも1/8トークンしか使用せず、競争力のある再構築品質と最先端のビデオ忠実性を実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:51:18 GMT)
A Unified MDL-based Binning and Tensor Factorization Framework for PDF Estimation [19.7]
多変量確率密度関数推定のための新しい非パラメトリックアプローチを提案する(PDF)。提案手法は, 共役確率テンソルの正準多進分解(CPD)を利用するテンソル分解法に基づく。我々は,本手法が合成データおよび実生豆分類データセットに与える影響を実証した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:35:54 GMT)
Clebsch-Gordan Transformer: Fast and Global Equivariant Attention [19.7]
我々はClebsch-Gordon Transformerを提案し、新しいClebsch-Gordon Convolutionを$SO(3)$の既約表現で実現した。提案手法は,O(N log N)$入力トークンの複雑さを達成しつつ,任意の順序で特徴の同変モデリングを可能にする。提案手法は,n体シミュレーション,QM9,ModelNet点クラウド分類,ロボットによる把握データセットなど,さまざまなベンチマークでベンチマークを行う。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:09:36 GMT)
PD-Diag-Net: Clinical-Priors guided Network on Brain MRI for Auxiliary Diagnosis of Parkinson's Disease [19.7]
パーキンソン病 (PD) は、患者の生活の質を著しく低下させる一般的な神経変性疾患である。 PD-Diag-Netは、生のMRIスキャンから直接リスクアセスメントと補助診断を行う。実験の結果,PD-Diag-Netは早期診断で86%,96%以上精度が得られた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:00:03 GMT)
EAPO: Enhancing Policy Optimization with On-Demand Expert Assistance [19.2]
大規模言語モデル (LLM) は、最近、検証可能な報酬の下で強化学習 (RL) で最適化された場合、推論において進歩している。本稿では,外部の専門家とのマルチターンインタラクションを取り入れた新しいRLフレームワークEAPOを提案する。 EAPOは、いつ、どのように専門家に相談するかを適応的に決定し、よりリッチな報酬信号とより信頼性の高い推論軌跡を得る政策を奨励する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:20:22 GMT)
Falcon: A Cross-Modal Evaluation Dataset for Comprehensive Safety Perception [19.1]
本研究は,視覚的質問応答におけるコンテンツモデレーションにおける視覚情報の重要性を強調した。私たちはFalconを紹介します。これは大規模な視覚言語安全データセットで、13の有害カテゴリにわたる57,515のVQAペアを含みます。 Falconデータセットを用いてQwen2.5-VL-7Bから微調整した特殊評価器FalconEyeを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:00:37 GMT)
Embedding Domain Knowledge for Large Language Models via Reinforcement Learning from Augmented Generation [19.0]
本稿では,RLAG(Reinforcement Learning from Augmented Generation)を提案し,ドメイン知識を大規模言語モデルに組み込む。提案手法は, サンプリング世代間を反復的に循環し, 計算した報酬によってモデルを最適化する。医学、法学、天文学、および現在のイベントデータセットにわたる実験結果から、提案手法がベースラインアプローチを著しく上回ることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:06:48 GMT)
Overcoming Long-Context Limitations of State-Space Models via Context-Dependent Sparse Attention [18.8]
状態空間モデル(SSM)の長期コンテキストモデリング機能の解析と改善に焦点をあてる。本稿では,広く使用されている合成課題である連想的リコールが,実世界の長文モデリングの複雑さを十分に表していることを示す。理論的解析と実世界の応用のギャップを埋めるために, 疎鍵選択による局所性に敏感なハッシュ注意を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:41:46 GMT)
Pancreas Part Segmentation under Federated Learning Paradigm [18.7]
MRIにおける膵部分(頭部,体,尾部)分節に対する初回フェデレートラーニング(FL)アプローチを提案する。このコントリビューションは、まずは、MRIにおける膵部分のデライン化の技術的複雑さと、それ以前のアプローチを妨げるデータ不足の問題の2つの根本的な課題に対処する。直接データを共有することなく、7つの医療機関間で協調的なモデルトレーニングを可能にするプライバシー保護FLフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:42:43 GMT)
Disentanglement of Variations with Multimodal Generative Modeling [18.6]
マルチモーダルデータの堅牢な表現を学習する際の課題を解決するために,IDMVAE(Information-disentangled Multimodal VAE)を提案する。既存のアプローチと比較すると、IDMVAEは共有情報とプライベート情報の明確な分離を示し、課題のあるデータセットに対して優れた生成品質とセマンティックコヒーレンスを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:54:39 GMT)
Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory [18.5]
本稿では,長期メモリを備えた新しいマルチモーダルエージェントフレームワークであるM3-Agentを紹介する。 M3-Agentは、リアルタイムの視覚的および聴覚的入力を処理し、エピソードおよびセマンティックメモリの構築と更新を行う。命令が与えられた後、M3-Agentは自動でマルチターン推論を行い、関連するメモリを取得してタスクを完了させる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:03:44 GMT)
Rethinking Reward Miscalibration of GRPO in Agentic RL [18.5]
結果に基づく報酬は、これらの欠陥のある中間ステップに対して期待される負の優位性を保証することを示す。我々は,善悪行為の埋め込みを分離するために,善悪行為を分類するアクターの訓練を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:24:38 GMT)
PDFBench: A Benchmark for De novo Protein Design from Function [18.4]
PDFBenchは、関数誘導デノボタンパク質設計のための最初の包括的なベンチマークである。本ベンチマークでは,2つのキー設定の16のメトリクスに対して,8つの最先端モデルを体系的に評価する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:52:13 GMT)
Aha Moment Revisited: Are VLMs Truly Capable of Self Verification in Inference-time Scaling? [18.4]
視覚言語モデル(VLM)に類似した推論時間スケーリング手法が有用かどうかを検討する。多数決や自己検証によるベスト・オブ・Nといった戦略はVLMのパフォーマンスを向上させるが、多数決は検証中心の戦略を著しく上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:02:38 GMT)
Hedonic Neurons: A Mechanistic Mapping of Latent Coalitions in Transformer MLPs [18.3]
本稿では,連立ゲーム理論に基づく機械的解釈可能性フレームワークを提案する。非添加作用を有する神経細胞の安定な連なりを抽出する。次に、レイヤ間の遷移を永続性、分割、マージ、消失として追跡します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:55:24 GMT)
Clean First, Align Later: Benchmarking Preference Data Cleaning for Reliable LLM Alignment [18.3]
人間のフィードバックは、大きな言語モデル(LLM)と人間の嗜好の整合において重要な役割を果たす。この問題を軽減するために様々な自動データクリーニング手法が提案されているが、その効果の体系的評価は依然として不十分である。 PrefCleanBenchは、アライメントパフォーマンスと一般化性の観点からクリーニング戦略を評価するための標準化されたプロトコルを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:44:05 GMT)
Parse Trees Guided LLM Prompt Compression [18.2]
本稿では、PartPromptと呼ばれる新しい選択的圧縮手法を提案する。まず、言語規則に基づいて各文のパースツリーを取得し、パースツリーの各ノードのローカル情報エントロピーを算出する。実験によると、PartPromptはさまざまなデータセットで最先端のパフォーマンスを受信している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:07:23 GMT)
PERSE: Personalized 3D Generative Avatars from A Single Portrait [18.1]
PERSEは、参照ポートレートからパーソナライズされた3D生成アバターを構築する方法である。提案手法は,大規模な合成2Dビデオデータセットから始まる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:33:24 GMT)
Unified Multi-Modal Interactive & Reactive 3D Motion Generation via Rectified Flow [18.0]
マルチモーダルな2人動作生成のためのフレームワークであるDualFlowを紹介する。テキスト、音楽、先行の動作シーケンスを含む様々な入力で動きを合成する。時間的にコヒーレントでリズミカルに同期した動作を生成し、マルチモーダルな人間の動作生成において最先端の動作を設定する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:36:18 GMT)
Binary Diff Summarization using Large Language Models [17.9]
大型言語モデル(LLM)は、従来のツールを拡張するためにバイナリ分析に適用されている。 LLMを用いた二項差分要約のための新しいフレームワークを提案する。 6つのオープンソースプロジェクトに3つの異なるマルウェアを注入することで、ソフトウェアサプライチェーンセキュリティベンチマークを作成します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:47:24 GMT)
Semantic-guided Diverse Decoding for Large Language Model [17.8]
Semantic-Guided Diverse Decoding (SeemDiD)を紹介する。 SemDiDは3つの相補的なメカニズムによって品質と多様性のバランスをとる。実験では、SemDiDは既存のメソッドよりも一貫して優れています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:32:17 GMT)
Collaborative Device-Cloud LLM Inference through Reinforcement Learning [17.7]
デバイスとクラウドのコラボレーションは、大きな言語モデル(LLM)をデプロイするための有望なパラダイムとして登場した。本稿では,デバイス上でのLCMが問題解決プロセスの最後にルーティング決定を行うフレームワークを提案する。特に、効果的な問題解決とクラウドへの司法的オフロードを促進するために、慎重に設計された報酬で報酬問題を定式化する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:48:56 GMT)
NextLocLLM: Location Semantics Modeling and Coordinate-Based Next Location Prediction with LLMs [17.6]
NextLocLLMは、位置予測を座標回帰として再構成し、両方の位置意味論にLLMを統合する新しいフレームワークである。さまざまな都市での実験では、NextLocLLMは教師付き設定とゼロショット設定の両方で既存のベースラインを上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:23:49 GMT)
Synthetic-to-Real Camouflaged Object Detection [17.6]
我々はS2R-COD(Syn-to-Real Camouflaged Object Detection)という新しいタスクを提案する。実世界のシナリオにおけるモデル性能を改善するためには,注釈付き合成カモフラージュ画像の集合と,注釈なしの実画像の限られた数を利用する必要がある。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:20:38 GMT)
From Neural Networks to Logical Theories: The Correspondence between Fibring Modal Logics and Fibring Neural Networks [17.5]
モーダル論理のフィブリング(英: Fibring of modal logics)は、モーダル論理の可算族を単一のフィブリング言語に結合するための、十分に確立された形式主義である。ニューラルネットワークのファイブリングは、ニューラルネットワークにおける学習と推論を組み合わせるためのニューロシンボリックフレームワークとして導入された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:32:42 GMT)
SynParaSpeech: Automated Synthesis of Paralinguistic Datasets for Speech Generation and Understanding [17.4]
笑いやため息のようなパラ言語的な音は、より現実的で魅力的なスピーチを合成するのに不可欠である。大規模パラ言語データを生成するための自動フレームワークを提案し,それをSynParaSpeechデータセットの構築に適用する。データセットは6つのパラ言語カテゴリーで構成され、118.75時間のデータと正確なタイムスタンプは、いずれも自然な会話音声に由来する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:08:35 GMT)
Are VLMs Ready for Lane Topology Awareness in Autonomous Driving? [17.3]
VLM(Vision-Language Models)は、最近、マルチモーダル推論において顕著な進歩を示したが、自動運転におけるその応用は限定的である。本研究では,道路トポロジ理解におけるVLMの能力を体系的に評価する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:38:55 GMT)
Emission-GPT: A domain-specific language model agent for knowledge retrieval, emission inventory and data analysis [17.3]
エミッションGPT(Electron-GPT)は、大気のエミッションドメインに適した、知識に富んだ大規模言語モデルエージェントである。 1万以上のドキュメント(標準、レポート、ガイドブック、ピアレビューされた文献を含む)のキュレートされた知識ベース上に構築されたElectron-GPTは、迅速なエンジニアリングと質問補完を統合し、正確なドメイン固有の質問応答をサポートする。ユーザは、クエリや視覚化、ソースコントリビューションの分析、ユーザ定義シナリオのエミッションファクタの推奨といった、自然言語によるエミッションデータをインタラクティブに分析することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:50:05 GMT)
Find your Needle: Small Object Image Retrieval via Multi-Object Attention Optimization [17.2]
本研究では,小物体画像検索(SoIR)の課題に対処する。その目的は,特定の小物体を含む画像を,散らばったシーンで検索することである。主な課題は、画像内のすべてのオブジェクトを効果的に表現する、スケーラブルで効率的な検索のための単一のイメージ記述子を構築することである。専用多目的事前学習フェーズを組み込んだ新しい検索フレームワークであるMaO(Multi-object Attention Optimization)を導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:44:35 GMT)
Future-Proofing Programmers: Optimal Knowledge Tracing for AI-Assisted Personalized Education [17.1]
CoTutorは、学生の進捗モデリングを改善するために信号処理技術を用いてベイズ知識追跡を強化するAI駆動モデルである。大学試験では、従来の教育ツールを上回りながら、学習成果の計測可能な改善を実証している。我々の結果は、AIによるパーソナライゼーション、スケーラビリティ、そして教育技術におけるプライバシーと倫理的考慮を前進させる将来の機会の可能性を強調します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:40:39 GMT)
SolContractEval: A Benchmark for Evaluating Contract-Level Solidity Code Generation [17.1]
Solidityはスマートコントラクトの主要な言語です。既存の評価は、実世界の契約開発におけるモデルの能力を評価するに足りません。 SolContractEvalは、Solidityコード生成のための最初のコントラクトレベルのベンチマークです。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:53:41 GMT)
PAT-Agent: Autoformalization for Model Checking [17.1]
PAT-Agentは自然言語の自動形式化と形式モデル修復のためのエンドツーエンドフレームワークである。これは、大きな言語モデルの生成能力と形式的検証の厳密さを組み合わせたものである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:32:14 GMT)
DFG-PCN: Point Cloud Completion with Degree-Flexible Point Graph [17.1]
本稿では,DFG-PCN(Degree-Flexible Point Graph Completion Network)と呼ばれるポイントクラウド補完フレームワークを提案する。特徴変動と曲率を組み合わせて、構造的に重要な領域に焦点を合わせるディテール・アウェア・メトリックを使用して、ノードの次数を適応的に割り当てる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:28:42 GMT)
A Comprehensive Graph Pooling Benchmark: Effectiveness, Robustness and Generalizability [17.1]
我々は、17のグラフプーリング方法と28のグラフデータセットを含む包括的なベンチマークを構築した。このベンチマークは3次元のグラフプーリング法の性能を体系的に評価する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:30:23 GMT)
Does Weak-to-strong Generalization Happen under Spurious Correlations? [17.0]
弱体化(W2S)の一般化の鍵となる問題は、弱体化教師の下流課題において、弱体化教師の擬似ラベルを微調整する際、W2Sは起こるのか、失敗時にどのように改善するかである。 i) グループ不均衡のラベル付きデータに基づいて微調整された弱い教師と, (ii) グループ不均衡なラベル付きデータセットを, 少数派$eta_u$を持つ教師によって擬似ラベル付けされた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:57:49 GMT)
Collaboration of Fusion and Independence: Hypercomplex-driven Robust Multi-Modal Knowledge Graph Completion [17.0]
マルチモーダル知識グラフ補完(MMKGC)は、マルチモーダル知識グラフ(MMKG)における行方不明事実の発見を目的とする。既存のMMKGCメソッドは、融合ベースとアンサンブルベースの2つのマルチモーダルパラダイムに従っている。本稿では, 融合および独立なモダリティ表現の共存と協調を実現するMMKGC手法 M-Hyper を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:55:01 GMT)
BioVessel-Net and RetinaMix: Unsupervised Retinal Vessel Segmentation from OCTA Images [16.6]
BioVessel-Netは非教師なしの生成フレームワークであり、船体バイオ統計学と敵対的精錬と半径誘導セグメンテーション戦略を統合している。 2Dおよび3D OCTA画像の新しいベンチマークデータセットであるRetinaMixを紹介した。 BioVessel-Netは、RetinaMixおよび既存のデータセット間でほぼ完璧なセグメンテーション精度を実現し、最先端の教師付きおよび半教師付きメソッドよりも大幅に優れています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:46:20 GMT)
TusoAI: Agentic Optimization for Scientific Methods [16.3]
大規模言語モデル(LLM)は、文学の合成、経験的データによる推論、ドメイン固有コードの生成において強力な能力を示している。本稿では,評価機能を備えた科学的タスク記述を行うエージェントAIシステムであるTusoAIを紹介する。 TusoAIはドメイン知識を知識ツリー表現に統合し、反復的でドメイン固有の最適化とモデル診断を行う。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:30:44 GMT)
Exponential Advantage from One More Replica in Estimating Nonlinear Properties of Quantum States [16.2]
我々は、幅広い観測可能なクラスに対して$mathrmtr(rhok O)$を推定することは、$(k-1)$-replicaの関節測定に制限された任意のプロトコルに対して指数関数的に難しいことを証明した。その結果、任意の整数$k>2$に対する$(k-1)$-と$k$-replicaプロトコルの指数的分離が初めて確立された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:46:43 GMT)
STAIR: Addressing Stage Misalignment through Temporal-Aligned Preference Reinforcement Learning [16.1]
嗜好に基づく強化学習(PbRL)は、人間の嗜好から直接報酬を学習することで、複雑な報酬工学をバイパスする。エージェントが連続的にサブタスクを実行するマルチステージタスクの有効性は、ステージミスアライメントによって制限される。本稿では、まず時間的距離に基づいて段階近似を学習し、同じ段階における比較を優先するStage-AlIgned Reward Learning(STAIR)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:56:15 GMT)
What Do Indonesians Really Need from Language Technology? A Nationwide Survey [16.1]
インドネシアにおける母語話者の実際のニーズを評価するために全国調査を実施している。以上の結果から,特に機械翻訳や情報検索による言語障壁への対処が最重要課題であることが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:45:28 GMT)
Half-order Fine-Tuning for Diffusion Model: A Recursive Likelihood Ratio Optimizer [16.1]
確率拡散モデル(DM)は、連鎖構造を通して推論することで内容を生成する。現代の手法は強化学習 (RL) と切り離されたバックプロパゲーション (BP) に基づいている DMのためのRLR(Recursive Likelihood Ratio)ファインチューニングパラダイムを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:20:24 GMT)
FraudTransformer: Time-Aware GPT for Transaction Fraud Detection [16.0]
我々は、専用のタイムエンコーダでバニラGPTスタイルのアーキテクチャを拡張するシーケンスモデルであるFraudTransformerを紹介する。大規模な産業データセット(数千万のトランザクションと補助イベント)の実験は、FraudTransformerが4つの強力な古典的ベースラインを超えたことを示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:53:41 GMT)
AERA Chat: An Interactive Platform for Automated Explainable Student Answer Assessment [16.0]
AERA Chatは、生徒の回答の自動評価のために設計されたインタラクティブな視覚化プラットフォームである。 AERA Chatは複数の言語モデル(LLM)を活用して、生徒の回答を同時にスコアし、説明的合理性を生成する。複数のデータセットに対する複数の合理的生成手法の評価を通じて,プラットフォームの有効性を実証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:32:22 GMT)
InteractMove: Text-Controlled Human-Object Interaction Generation in 3D Scenes with Movable Objects [15.9]
動画像を用いた3次元シーンにおけるテキスト制御によるオブジェクトインタラクション生成の課題を提案する。既存の人間とシーンの相互作用データセットは、不十分な相互作用カテゴリに悩まされる。異なる手関節の接触領域を予測するための手指型手指合せ学習を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:29:15 GMT)
Uncovering Vulnerabilities of LLM-Assisted Cyber Threat Intelligence [15.9]
大規模言語モデル(LLM)は、サイバー脅威の迅速な搾取に対抗するセキュリティアナリストを支援するために、集中的に使用される。本稿では,サイバー脅威インテリジェンス(CTI)におけるLCMの固有の脆弱性について検討する。本稿では, 階層化, 自己回帰的洗練, ループ内人間監督を統合した新たな分類手法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:08:27 GMT)
How Effective Are Time-Series Models for Rainfall Nowcasting? A Comprehensive Benchmark for Rainfall Nowcasting Incorporating PWV Data [15.7]
RainfallBench(レインフォールベンチ)は、降雨用に設計されたベンチマークである。このデータセットは、6つの必須変数の15分間隔で記録された5年間の気象観測から導かれる。我々はRainfallBenchで6つの主要なアーキテクチャで20以上の最先端モデルを評価した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:21:24 GMT)
From Static to Dynamic: a Survey of Topology-Aware Perception in Autonomous Driving [15.7]
自律運転を実現するための鍵は、トポロジーを意識した認識にある。静的な事前構築された地図からダイナミックなセンサー駆動の知覚へのシフトを観察する。より適応的でスケーラブルで説明可能な自律運転システムを実現するための道を開いたのです。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:47:33 GMT)
Assessing Large Language Models in Updating Their Forecasts with New Information [15.7]
EVOLVECASTは,大規模言語モデルが新たな情報に反応して予測を適切に修正するかどうかを評価するフレームワークである。我々は、人間予測器を比較基準として、更新された状況下での予測シフトと信頼度校正を分析する。言語化やロジットに基づく信頼度評価は、常に他方よりも優れておらず、どちらも人間の基準から遠く離れている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:16:20 GMT)
Tequila: Trapping-free Ternary Quantization for Large Language Models [15.6]
大規模言語モデル(LLM)をエッジデバイスにデプロイするには,量子化技術が不可欠である。テキーラ(Tequila)は、デッドゾーントラッピングされた重みを動的バイアスとして再資源化することで、トラップなし量子化最適化手法である。 SOTAベースラインよりも4%の精度向上を実現し、(1%の差で)完全精度のパフォーマンスと3.0倍の推論スピードアップとほぼ一致している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:17:40 GMT)
The Impossibility of Inverse Permutation Learning in Transformer Models [15.5]
復号器のみの変圧器における逆置換学習の問題について検討する。任意の深さのデコーダのみの変換器では、このタスクを学習できないことを示す。これは、チェーン・オブ・シントが推し進める、あるいはより一般的には中間思考のトークンが推論を可能にする別のメカニズムを示唆するかもしれない。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:48:11 GMT)
Security and Privacy Measurement on Chinese Consumer IoT Traffic based on Device Lifecycle [15.4]
本研究は,中国における消費者向けIoTデバイストラフィックに関する最初の大規模データセットを構築した。 38のブランドと12のデバイスカテゴリにまたがる77のデバイスからのトラフィックを集めています。他の地域と比較すると、中国の消費者向けIoTデバイスは国内サービスに依存している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:04:40 GMT)
From What to Why: A Multi-Agent System for Evidence-based Chemical Reaction Condition Reasoning [15.3]
ChemMASは、条件予測をエビデンスベースの推論タスクとして再設定するマルチエージェントシステムである。 ChemMASはドメイン固有のベースラインよりも20～35%向上し、Top-1精度で汎用LLMを10～15%上回る。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:34:35 GMT)
MSD-KMamba: Bidirectional Spatial-Aware Multi-Modal 3D Brain Segmentation via Multi-scale Self-Distilled Fusion Strategy [15.3]
本稿では,新しい3次元マルチモーダル画像分割フレームワークMSD-KMambaを提案する。双方向の空間知覚とマルチスケールの自己蒸留を統合している。我々のフレームワークは、セグメンテーション精度、ロバスト性、一般化における最先端の手法を一貫して上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:34:01 GMT)
ChunkLLM: A Lightweight Pluggable Framework for Accelerating LLMs Inference [15.3]
トランスフォーマーベースの大規模モデルは自然言語処理やコンピュータビジョンに優れるが、計算の非効率さに直面する。軽量でプラグイン可能なトレーニングフレームワークであるChunkLLMを提案する。 ChunkLLMは120K長文の処理においてバニラ変換器と比較して最大4.48倍の高速化を実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:04:00 GMT)
Demographic-Agnostic Fairness without Harm [15.2]
機械学習アルゴリズムは、社会的ドメインにおいて、人間について予測するためにますます使われている。これらのアルゴリズムが特定の社会集団に対する偏見を示すのではないかという懸念が高まっている。本研究では, 調和最適化アルゴリズムを使わずに, 新たなテクスタイトデデマトグラフィー・アノスティックフェアネスを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:23:32 GMT)
Bridging the Knowledge-Prediction Gap in LLMs on Multiple-Choice Questions [15.2]
大規模言語モデル(LLM)は、しばしば多重選択質問(MCQ)で失敗する。このサブスペース内の知識座標と予測座標を整合させるために隠れ状態を変化させるパラメータフリーな介入であるtextbfKAPPA (Knowledge-Aligned Prediction through Projection-based Adjustment) を導入する。 Big-Bench-Hard と ARC-Challenge のバイナリ選択再構成実験により、KAPPA は精度を大幅に向上し、ベースラインを一貫して上回ることを示した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:57:24 GMT)
Beyond the Exploration-Exploitation Trade-off: A Hidden State Approach for LLM Reasoning in RLVR [15.1]
RLVR(Reinforcement Learning for Verifiable Rewards)の一般的な見解は、探索・探索トレードオフのレンズを通して最近の進歩を解釈している。我々はこの視点を再検討し、この認識されたトレードオフは基本的な制約ではなく、測定レベルの成果物である可能性を示唆している。本稿では,相乗的探索・探索強化の原理を最初に運用する,Velocity-Exploiting Rank-Learning (VERL)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:14:58 GMT)
Recurrent Memory for Online Interdomain Gaussian Processes [15.0]
本稿では,オンライン学習環境における時系列データ中の長期記憶をキャプチャ可能な,新しいオンラインガウスプロセス(GP)モデルを提案する。我々のモデルである Online HiPPO Sparse Variational Gaussian Process (OHSVGP) は、その長距離メモリモデリング機能によりRNNドメインで普及しているHiPPOフレームワークを活用している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:53:51 GMT)
M3DLayout: A Multi-Source Dataset of 3D Indoor Layouts and Structured Descriptions for 3D Generation [15.0]
テキスト駆動の3Dシーン生成では、オブジェクトレイアウトは、高レベルの言語命令を詳細な出力でブリッジする重要な中間表現として機能する。 3次元屋内レイアウト生成のための大規模マルチソースデータセットであるM3Dを紹介する。 M3Dは15,080のレイアウトと258k以上のオブジェクトインスタンスで構成され、現実世界のスキャン、プロのCADデザイン、手続き的に生成されたシーンを統合している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:16:08 GMT)
Equivariant Spherical Transformer for Efficient Molecular Modeling [14.9]
Equivariant Spherical Transformer (EST)は,グループ表現のFourier空間領域にトランスフォーマーのようなアーキテクチャを適用した,新しいプラグイン・アンド・プレイフレームワークである。 ESTは、決定的同変誘導バイアスを保ちながら、従来のモデルよりも高い表現性を達成する。我々は, OC20 や QM9 のような挑戦的なベンチマークにおいて, EST ベースのモデルが最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:04:34 GMT)
HIVTP: A Training-Free Method to Improve VLMs Efficiency via Hierarchical Visual Token Pruning Using Middle-Layer-Based Importance Score [14.9]
HIVTPは、VLM(Vision-Language Models)推論効率を改善するためのトレーニング不要の手法である。本稿では,グローバルかつ局所的に重要な視覚トークンを保持するための階層的視覚トークンプルーニング手法を提案する。 HIVTPは, LLaVA-v1.5-7BとLLaVA-Next-7BのTTFTを最大50.0%, 55.1%削減できることを示した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:53:39 GMT)
Evaluating noises of boson sampling with statistical benchmark methods [14.8]
量子計算の利点を慎重に示すためには,ノイズレベルを知ることが重要である。相関器や雲などの統計的ベンチマーク手法を用いて,暗黒数で補正した光子偏微分率と光子損失のノイズを定量化する。以上の結果から, ボソンサンプリングのノイズ評価には, 統計的ベンチマーク手法が有効であることが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:52:08 GMT)
Sparse-Up: Learnable Sparse Upsampling for 3D Generation with High-Fidelity Textures [14.8]
本稿では,メモリ効率,高忠実度テクスチャモデリングフレームワークであるSparse-Upを提案する。スパースボクセルを用いてテクスチャ再構築をガイドし、マルチビューの一貫性を確保する。幾何整合性を犠牲にすることなく、高分解能ボクセルトレーニング中のメモリ消費量を大幅に削減できる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:06:03 GMT)
How LLMs Learn to Reason: A Complex Network Perspective [14.6]
Reinforcement Learning from Verifiable Rewards による大規模言語モデルのトレーニングは、突飛な振る舞いのセットを示している。この現象は単一統一理論を用いて説明できると考えられる。私たちの研究は、将来のAIシステムの創発的な推論能力をエンジニアリングするための新しい物理的直感を提供します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:10:37 GMT)
Self-Supervised Geometry-Guided Initialization for Robust Monocular Visual Odometry [14.5]
学習に基づく高密度SLAM法は、そのような障害に対処するために反復的な高密度バンドル調整を利用する。その可能性にもかかわらず、この手法は大きな動きとオブジェクトのダイナミクスを含むシナリオといまだに苦労している。本研究では, 凍結した大規模単分子深度推定器を用いて, 密集束調整過程を初期化する自己教師付き事前推定手法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:08:43 GMT)
FedDAPL: Toward Client-Private Generalization in Federated Learning [14.4]
フェデレーテッド・ラーニング(FL)は、各研究センターまたはクリニックでモデルをローカルに訓練し、モデル更新のみを集約する。ハードウェアや取得プロトコルの非生物学的なバリエーションは、外部のサイトでモデルが失敗する可能性がある。本稿では,FLプロセス内にDANN(Domain-Adversarial Neural Network)を組み込むことで,これらの課題に対処する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:01:14 GMT)
MACE: A Hybrid LLM Serving System with Colocated SLO-aware Continuous Retraining Alignment [14.4]
エッジサーバにデプロイされる大規模言語モデル(LLM)は、パーソナライズされたアシスタント、レコメンデーション、コンテンツモデレーションといった遅延に敏感なアプリケーションでますます利用されている。既存のリトレーニング戦略は、モデル更新の遅延、再トレーニングのための過剰コミットリソース、イテレーションレベルのリトレーニングの粒度を見落としている。我々は,同時推論(プリフィル,デコード)と微調整を同時に行うハイブリッドLLMシステムであるMACEを提案し,知的メモリ管理により,推論スループットを約束しながらタスク性能を最大化する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:45:28 GMT)
Spatially Parallel All-optical Neural Networks [14.3]
AONN(All-optical Neural Network)は、超高速でエネルギー効率の高い計算のための有望なパラダイムとして登場した。本稿では、全光ニューラルネットワーク(SP-AONN)のための空間並列アーキテクチャを提案する。我々は,光学的ニューラルコンピューティングの能力向上のための実用的かつスケーラブルな戦略として,空間並列性に注目した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:25:40 GMT)
SandCell: Sandboxing Rust Beyond Unsafe Code [14.3]
Rustは、コンパイル時にオーナシップを強制し、ルールを借用することによって、メモリ安全性を保証するモダンなシステムプログラミング言語である。 Rustを脆弱性から保護するために、安全でないコードを分離するためのさまざまなアプローチが提案されている。本論文では,既存の構文境界を利用して,Rustのフレキシブルかつ軽量な分離を実現するためのSandCellを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:01:51 GMT)
AttriLens-Mol: Attribute Guided Reinforcement Learning for Molecular Property Prediction with Large Language Models [14.2]
本稿では,LLMを用いた分子特性予測のための属性誘導強化学習フレームワークであるAttriLens-Molを紹介する。 AttriLens-Molは、(1)属性ベースの構造化された出力を奨励する形式報酬、(2)無関係な属性の列挙を避けるためのカウント報酬、(3)高度なLLMとRDKitを使った報酬を使用するモデルの推論を操縦する。 AttriLens-Mol法を用いて, 4000試料を用いた7BサイズR1-Distilled-Qwen2.5およびR1-Distilled-LLaMA3.1モデルのトレーニングを行った結果, 性能が有意に向上した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:09:30 GMT)
Cooperative Sheaf Neural Networks [14.1]
本稿では,メッセージ指向性の欠如により,既存の拡散法が協調動作を達成できないことを示す。本稿では,この制限を克服するためにCSNN(Cooperative Sheaf Neural Networks)を提案する。実験の結果,CSNNは従来の拡散技術や協調グラフニューラルネットワークと比較して総合的に優れた性能を示すことがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:58:46 GMT)
Beyond Greedy Exits: Improved Early Exit Decisions for Risk Control and Reliability [14.0]
早期のDeep Neural Networksは、中間層での予測を可能にすることで、適応推論を可能にする。我々のフレームワークは、フルモデルのパフォーマンスと比較して、パフォーマンス低下(2%)を最小限に抑えながら、スピードアップ(1.70-2.10x)が一貫した改善を示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:05:24 GMT)
Making Language Model a Hierarchical Classifier [14.0]
人間の階層的思考能力によって動機づけられた階層的デコーダアーキテクチャは,テキストの復号化を同時に行うことができる。本研究は、スクラッチから事前学習した一般化階層的推論器の可能性を示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:57:03 GMT)
Neural-Augmented Kelvinlet for Real-Time Soft Tissue Deformation Modeling [13.9]
本稿では,ソフト形状変形のリアルタイム予測を可能にする物理インフォームド・ニューラル・シミュレーション・フレームワークを提案する。提案手法は, ケビンレットをベースとした解析的先行データと大規模FEMデータを統合し, 非線形組織応答と非線形組織応答の両方を捉える。これらの結果から,Kelvinlet-augmented Learningは,外科的AIにおけるリアルタイムな物理対応型ソフトタスクシミュレーションのための,原理的かつ計算学的に効率的なパラダイムとして確立された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:30:08 GMT)
Navigating the Labyrinth: Path-Sensitive Unit Test Generation with Large Language Models [13.9]
単体テストはソフトウェアの品質保証には不可欠だが、テストの記述とメンテナンスは時間がかかり、エラーが発生しやすい。このギャップを埋めるために、コード知識とLLMのセマンティック機能を組み合わせることで、パスに敏感なフレームワークであるJUnitGenieを紹介します。 JUnitGenieを実世界の10のJavaプロジェクトから2,258の複雑な焦点メソッドで評価する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:29:57 GMT)
SAR-KnowLIP: Towards Multimodal Foundation Models for Remote Sensing [13.9]
クロスモーダル人工知能は近年広く注目を集めており、自然画像の研究において大きな進歩を遂げている。既存の手法は主にRGB画像用に設計されており、合成開口レーダ(SAR)画像のモデリングにおいて大きなギャップを残している。本稿では、再利用可能なデータと評価ベースラインとともに、初の汎用SARマルチモーダル基盤モデルであるSAR-KnowLIPを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:03:25 GMT)
Improving constraint-based discovery with robust propagation and reliable LLM priors [13.9]
高信頼度種子から縁を伝播する因果発見法であるMosaCDを提案する。次に、最も信頼性の高いエッジを優先し、スケルトンに基づく発見手法と統合可能な、新しい信頼度低下伝搬戦略を適用する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:00:20 GMT)
VeriFuzzy: A Dynamic Verifiable Fuzzy Search Service for Encrypted Cloud Data [13.9]
暗号化クラウドデータ上で動的で検証可能なファジィ検索(DVFS)をサポートするサービスは、依然として根本的な課題である。本稿では,3つのイノベーションを包括的に統合した新しいDVFSサービスフレームワークである textbfVeriFuzzy を提案する。私たちのコードとデータセットは現在オープンソースで、将来のDVFS研究に刺激を与えたいと思っています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:45:47 GMT)
SQL-of-Thought: Multi-agentic Text-to-SQL with Guided Error Correction [13.8]
In-context Learning と chain-of- Thought は、テキスト・トゥ・コンテクスト・システムのための堅牢なソリューションを開発するために利用することができる。本稿では,Text2タスクをスキーマリンク,サブプロブレム識別,クエリプラン生成,ガイド付き修正ループに分解するマルチエージェントフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:12:42 GMT)
Gaussian Universality for Diffusion Models [13.7]
一般化線形モデルである $f(mathbfW)$ のテスト誤差は、拡散データ上の分類タスクのために訓練された検定誤差がガウス混合法で訓練された $f(mathbfW)$ のテスト誤差と一致することを示す。また、任意の$$$-lipschitz scalar function $phi$, $phi(mathbfx)$ が $mathbbE phi(mathbfx)$ に近く、条件拡散モデルからサンプリングされた $mathbfx$ の確率が高いことも示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:57:28 GMT)
ToxiEval-ZKP: A Structure-Private Verification Framework for Molecular Toxicity Repair Tasks [13.7]
本稿では,分子毒性修復の課題に焦点をあてる。構造プライベートな検証フレームワークであるToxiEval-ZKPを提案する。このタスクの評価プロセスにゼロ知識証明機構を導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:53:25 GMT)
MAD-PINN: A Decentralized Physics-Informed Machine Learning Framework for Safe and Optimal Multi-Agent Control [13.5]
大規模マルチエージェントシステムにおける安全性とパフォーマンスの最適化は、依然として根本的な課題である。マルチエージェント状態制約最適制御問題を解くための分散機械学習フレームワークMAD-PINNを提案する。マルチエージェントナビゲーションタスクの実験では、MAD-PINNは優れた安全性と性能のトレードオフを実現し、エージェントの数が増えるにつれてスケーラビリティを維持し、常に最先端のベースラインを上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:31:22 GMT)
Dynamic Orthogonal Continual Fine-tuning for Mitigating Catastrophic Forgettings [13.3]
大規模言語モデルの継続的な学習において、破滅的な忘れは依然として重要な課題である。本研究では,動的直交連続(DOC)ファインチューニングを提案する。これは関数方向のドリフトを追跡し,ファインチューニングプロセス中に動的に更新する新しいアプローチである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:55:05 GMT)
Fine-tuning Diffusion Policies with Backpropagation Through Diffusion Timesteps [13.3]
NCDPOは拡散政策を雑音条件決定政策として再構成する新しい枠組みである。実験の結果,NCDPOはスクラッチからトレーニングを行う際に,PPOに匹敵するサンプル効率が得られることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:21:28 GMT)
Quant Fever, Reasoning Blackholes, Schrodinger's Compliance, and More: Probing GPT-OSS-20B [13.3]
OpenAIのGPT-OSSファミリは、オープンウェイト言語モデルに、明示的なチェーン・オブ・シークレット(CoT)推論とハーモニープロンプトフォーマットを提供する。 GPT-OSS-20Bの広範囲なセキュリティ評価を要約し、異なる逆条件下でモデルの挙動を探索する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:44:37 GMT)
AnveshanaAI: A Multimodal Platform for Adaptive AI/ML Education through Automated Question Generation and Interactive Assessment [13.3]
AnveshanaAIは、人工知能のためのアプリケーションベースの学習プラットフォームである。学習者には、データサイエンス、機械学習、ディープラーニング、トランスフォーマー、生成AI、大規模言語モデル、マルチモーダルAIといった分野にわたる、ストリーク、レベル、バッジ、構造化されたナビゲーションを備えたパーソナライズされたダッシュボードが提供される。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:24:22 GMT)
Learning Adaptive Pseudo-Label Selection for Semi-Supervised 3D Object Detection [13.0]
半教師付き3Dオブジェクト検出(SS3DOD)は、ラベルなしデータを利用したコストの高い3Dデータセットの削減を目的としている。近年の研究では、擬似ラベルベースの教師学習フレームワークを採用し、印象的なパフォーマンスを誇示している。これらのフレームワークの主な課題は、教師の予測から高品質な擬似ラベルを選択することである。本稿では,高品質な擬似ラベルを自動かつ適応的に選択する学習可能な擬似ラベルモジュールを特徴とする新しいSS3DODフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:40:48 GMT)
Achieving quantum advantage in a search for a violations of the Goldbach conjecture, with driven atoms in tailored potentials [12.9]
ゴールドバッハ予想は、任意の自然数$N$が2ドル以上であっても、$ptext(I)$と$ptext(II)$の2つの素数の和として書けると述べている。本稿では,問題を解く量子アナログデバイスを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:51:45 GMT)
A Multi-Camera Vision-Based Approach for Fine-Grained Assembly Quality Control [12.8]
既存のソリューションは、しばしばシングルビューイメージングや手動検査に依存している。本稿では,新しいマルチビュー品質制御モジュールを提案する。 3つのカメラビューから画像をキャプチャすることで、システムはアセンブリプロセスのコンポーネントの包括的視覚的カバレッジを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:37:48 GMT)
From NL2SQL to NL2GeoSQL: GeoSQL-Eval for automated evaluation of LLMs on PostGIS queries [12.5]
本研究では,PostGISクエリ生成のための最初のエンドツーエンド自動評価フレームワークであるGeo-Evalを紹介する。このフレームワークは4つの認知次元、5つの習熟度レベル、20のタスクカテゴリを含み、総合的な評価モデルのパフォーマンスを提供する。並行して、3つのタスクタイプ、340のPostGIS関数、82のドメイン固有データベースにまたがる14178の質問からなるベンチマークデータセットGeo-Benchを開発した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:50:48 GMT)
Patterns in the Transition From Founder-Leadership to Community Governance of Open Source [12.5]
637のGitHubリポジトリを分析して、創業者主導から共有ガバナンスへの移行をトレースします。役割と行動が成長し、規制がよりバランスを取ります。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:17:58 GMT)
Bridging Discrete and Continuous RL: Stable Deterministic Policy Gradient with Martingale Characterization [12.3]
離散時間アルゴリズムを連続時間設定に拡張する際の大きな課題は、時間離散化に対する感度である。連続時間強化学習のための決定論的政策勾配法を提案する。提案アルゴリズムは,従来の離散時間法や連続時間法と比較して,安定性と収束性を向上する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:53:33 GMT)
CrimEdit: Controllable Editing for Counterfactual Object Removal, Insertion, and Movement [12.2]
CrimEditは単一のモデル内でタスクの埋め込みと挿入を訓練する。両方の物体とその効果を除去し、挿入中の物体効果の制御可能な合成を可能にする。 CrimEditは、より優れたオブジェクト除去、制御可能なエフェクト挿入、効率的なオブジェクト移動を実現する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:41:25 GMT)
Multi-Value-Product Retrieval-Augmented Generation for Industrial Product Attribute Value Identification [12.2]
MVP-RAG(Multi-Value-Product Retrieval-Augmented Generation)を紹介する。 MVP-RAGはPAVIを検索生成タスクと定義している。まず、同じカテゴリと候補属性値の類似した製品を取得し、次に標準化された属性値を生成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:29:20 GMT)
Continual Learning to Generalize Forwarding Strategies for Diverse Mobile Wireless Networks [12.1]
多様なモバイルネットワークシナリオを考慮した一般化可能なベースモデルを構築した。そして、破滅的な忘れをすることなく、多様なネットワークシナリオでDRLモデルをトレーニングできる連続学習(CL)アプローチを開発します。最先端のフォワード戦略と比較すると,最大で78%の遅延削減,24%のデリバリ速度向上,および同等あるいはわずかに高いフォワード数を実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:37:15 GMT)
Sequence Pathfinder for Multi-Agent Pickup and Delivery in the Warehouse [12.0]
Multi-Agent Pickup and Delivery (MAPD) は Multi-Agent Path Finding (MAPF) の挑戦的拡張であるコミュニケーション学習は、グローバルな情報の欠如を緩和するが、ポイントツーポイント通信による高い計算複雑性をもたらす。本稿では,暗黙的な情報交換を実現するためのシークエンシャルパスファインダ(SePar)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:48:13 GMT)
FedAgentBench: Towards Automating Real-world Federated Medical Image Analysis with Server-Client LLM Agents [12.0]
Federated Learning(FL)は、機密性の高い患者データを共有せずに、医療現場間で協調的なモデルトレーニングを可能にする。現実のFLの展開は、しばしば人的努力を必要とする複雑な運用上の課題によって妨げられる。本稿では,クライアント選択からトレーニング完了まで,実世界のFLの重要なフェーズをキャプチャするエージェント駆動FLフレームワークと,FedAgentBenchと呼ばれるベンチマークを紹介する。我々のフレームワークは40のFLアルゴリズムを組み込んでおり、それぞれが多様なタスク固有の要件とクロスクライアント特性に対処するように調整されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:06:07 GMT)
QuadEnhancer: Leveraging Quadratic Transformations to Enhance Deep Neural Networks [11.9]
本稿では,ニューラルネットワークの非線形性をさらに向上させる2次変換の導入について検討する。低ランク性, 重量共有, スパシフィケーション技術を用いた軽量2次エンハンサーを提案する。本稿では,画像分類,テキスト分類,微調整型大言語モデルという3つの課題にまたがって,提案手法の実証実験を行う。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:35:31 GMT)
FastViDAR: Real-Time Omnidirectional Depth Estimation via Alternative Hierarchical Attention [11.9]
FastVidarは、魚眼カメラの入力を4つ受け取り、完全な深度マップを360ドル(約3万3000円)で作成する新しいフレームワークだ。ビューをまたいだ機能を効率的に融合する代替階層的注意(AHA)機構を導入する。本稿では,多視点深度推定を共有正方形座標系に投影する新しいERP融合手法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:25:27 GMT)
Theoretical Modeling of LLM Self-Improvement Training Dynamics Through Solver-Verifier Gap [11.7]
理論的には、ソルバ検証ギャップの概念を用いて自己改善の訓練力学をモデル化する。分析を拡張して、外部データがフレームワーク内のこれらのダイナミクスにどのように影響するかを調べます。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:36:59 GMT)
OVSeg3R: Learn Open-vocabulary Instance Segmentation from 2D via 3D Reconstruction [11.6]
OVSeg3Rは、3D再構成の助けを借りて、よく研究された2D知覚モデルからオープン語彙の3Dインスタンスセグメンテーションを学習する。 OVSeg3Rは2Dビデオの再構成シーンを直接入力として採用し、手作業による手作業の調整は避ける。 OVSeg3Rはテールクラスとヘッドクラスのパフォーマンスギャップを著しく狭め、ScanNet200ベンチマークで+2.3 mAPを全体として改善した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:41:22 GMT)
Benchmarking LLM-Assisted Blue Teaming via Standardized Threat Hunting [11.6]
本稿では,大規模言語モデルをブルーチームで指導するためのベンチマークであるCyberTeamを提案する。まず、脅威属性からインシデント応答への分析タスク間の依存関係をキャプチャすることで、現実的な脅威追跡をモデル化する。次に、各タスクは、その特定の分析要求に合わせて調整された一連の運用モジュールを通して対処される。全体として、CyberTeamは30のタスクと9つの運用モジュールを統合し、標準化された脅威分析を通じてLLMをガイドする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:08:17 GMT)
When Is Diversity Rewarded in Cooperative Multi-Agent Learning? [11.5]
異種チームに適した目的を調査する。計算パラダイムとしてマルチエージェント強化学習(MARL)を用いる。 We show that HetGPS reiscovers the reward regimes predict by our theory。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:35:57 GMT)
Trainable Dynamic Mask Sparse Attention [11.5]
大規模な言語モデルでは、長いコンテキストのモデリングに対する需要はますます増加しています。既存のスパースアテンションメカニズムは効率を高めるが、静的パターンや情報損失といった制限に悩まされることが多い。本稿では,3つの重要なイノベーションを通じてこれらの課題に対処する,トレーニング可能なダイナミックマスクスパース注意機構を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:45:55 GMT)
QKV Projections Require a Fraction of Their Memory [11.0]
本稿では,注意層におけるQ,K,V$プロジェクションのメモリ消費を最大512ドルまで削減するテンソル圧縮手法を提案する。 PAMMはFlashAttentionのような効率的な注意手法で完全に構成可能であり、メモリ効率のLLMトレーニングのための実用的で補完的な方法である。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:30:47 GMT)
DataPuzzle: Breaking Free from the Hallucinated Promise of LLMs in Data Analysis [11.0]
大規模言語モデル(LLM)は、マルチモーダルデータ分析にますます応用されている。一般的なPrompt-to-Answer'パラダイムは、LSMをブラックボックスアナリストとして扱う。複雑な質問を分解する概念的マルチエージェントフレームワークであるDataPuzzleを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:12:23 GMT)
RIV: Recursive Introspection Mask Diffusion Vision Language Model [11.0]
マスク拡散に基づく視覚言語モデル(MDVLM)はマルチモーダル理解タスクにおいて顕著な進歩を遂げている。これらのモデルでは、生成されたトークンのエラーを修正できないため、自己補正能力が欠如している。本稿では,自己補正能力を備えた再帰検査マスク拡散視覚言語モデル(RIV)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:01:46 GMT)
PreScope: Unleashing the Power of Prefetching for Resource-Constrained MoE Inference [10.9]
メモリへの専門家の重み付けは、計算を数倍超えるPCIe転送遅延をもたらす。予測駆動型エキスパートスケジューリングシステムPreScopeについて述べる。 PreScopeは141%のスループットと74.6%のレイテンシを実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:35:12 GMT)
Unveiling Over-Memorization in Finetuning LLMs for Reasoning Tasks [10.8]
事前訓練された大言語モデル (LLM) はラベル付きデータで微調整され、人間の値に適合する。本研究では,LLMファインタニングの学習ダイナミクスを推論タスクで研究し,その過記憶現象を明らかにする。この効果を緩和するために,チェックポイントマージやメモリ化対応リウェイトといった手法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:13:06 GMT)
Multi-Level Heterogeneous Knowledge Transfer Network on Forward Scattering Center Model for Limited Samples SAR ATR [10.7]
本研究は,前向き散乱中心モデル(FSCM)という,純粋および鍵標的知識を移行するための新しいシミュレーションデータについて検討する。この目的を達成するために,FSCMの知識を特徴,分布,カテゴリレベルから完全に移行する多レベル異種知識伝達ネットワークを提案する。特に,FSCMデータとSAR画像による2つの新しいデータセットに対する広範な実験により,本手法の優れた性能が示された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:04:04 GMT)
Policy Gradient Algorithms for Robust MDPs with Non-Rectangular Uncertainty Sets [10.6]
非矩形不確実性集合を持つロバスト無限水平マルコフ決定過程(MDP)に対するポリシー勾配アルゴリズムを提案する。対応するロバストなMDPは動的プログラミング技術では解決できず、実際は難解である。そこで我々は,大域的最適性保証を提供する非矩形不確実性集合を持つ頑健なMDPに対する最初の完全解法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:25:59 GMT)
Calibrated and Resource-Aware Super-Resolution for Reliable Driver Behavior Analysis [10.5]
ドライバー監視システムは、安全クリティカルな配置のために、高精度だが信頼性があり、信頼性の高い信頼性スコアを必要とする。直接の低解像度トレーニングは、全体的な精度が向上するが、安全クリティカルなシナリオでは危険であるような、キャリブレーションの低い予測を生成する。本稿では、モデルキャリブレーションと臨界事象の高精度リコールに最適化されたリソース対応適応型超解像フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:08:44 GMT)
SpeedCP: Fast Kernel-based Conditional Conformal Prediction [10.4]
等角予測は有限サンプル条件付き分布自由予測セットを提供する。我々は,RKHSをベースとしたGibsら(2023)のフレームワークを構築し,近似条件等角予測区間を提供する。我々は,正則化RKHS整合最適化問題の完全な解経路を計算する,安定かつ効率的なアルゴリズムを開発した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:38:33 GMT)
LionGuard 2: Building Lightweight, Data-Efficient & Localised Multilingual Content Moderators [10.2]
LionGuard 2は、シンガポールのコンテキストに合わせた軽量で多言語対応のモデレーション分類器である。英語、中国語、マレー語、一部のタミル語をサポートしている。シンガポール政府内で運用されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:30:26 GMT)
FlowLUT: Efficient Image Enhancement via Differentiable LUTs and Iterative Flow Matching [10.2]
FlowLUTは、LUTの効率性、複数プリエント、フローマッチングされた再構成画像のパラメータ非依存特性を統合する、新しいエンドツーエンドモデルである。軽量な融合予測ネットワークは複数の3D LUT上で動作し、シーン適応色補正には$mathcalO(1)$の複雑さがある。モデル全体は、知覚的および構造的忠実性を含む複合損失関数の下で共同最適化される。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:22:01 GMT)
CGELBank Annotation Manual v1.2 [10.1]
CGELBankは、Cambridge Grammar of the English(CGEL; Huddleston and Pullum, 2002)から派生した英語の構文形式に基づく木バンクおよび関連ツールであるこの文書はCGELBankアノテーションスキームの特異性を概説している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:02:34 GMT)
APRMCTS: Improving LLM-based Automated Program Repair with Iterative Tree Search [10.0]
APRMCTS はモンテカルロ木探索 (MCTS) をパッチ探索に取り入れ、探索されたパッチのグローバル評価を行い、改良と生成のために最も有望なパッチを選択する。 Defects4Jの835のバグに関する実験では、GPT-3.5と統合すると、APRMCTSは合計201のバグを修正でき、すべての最先端のベースラインを上回ります。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:48:20 GMT)
A Second-Order Perspective on Pruning at Initialization and Knowledge Transfer [10.0]
本研究では,事前学習した視覚モデルのプルーニングに対するデータの影響について検討する。驚くべきことに、1つのタスクでプルーニングすることは、目に見えないタスクでもモデルがゼロショットのパフォーマンスを維持する。この現象は,大規模データセット上での事前学習によって引き起こされる,良好な損失景観に起因している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:55:11 GMT)
An Investigation of Batch Normalization in Off-Policy Actor-Critic Algorithms [10.0]
バッチ正規化(BN)は、トレーニング安定性を改善し、オーバーフィッティングを緩和し、より効果的な最適化を可能にすることによって、ディープラーニングの成功において重要な役割を担っている。 BNは深い強化学習環境において、特にその堅牢性と訓練の容易さによって、独特な優位性を維持している、と我々は主張する。 DRLパイプラインにおける頑健なBN統合のための実用的な提案を行うためのモード認識バッチ正規化(MA-BN)手法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:54:33 GMT)
ToDi: Token-wise Distillation via Fine-Grained Divergence Control [10.0]
Token-wise Distillation (ToDi) は、Sigmoid-based weighting function を用いてトークンごとのフォワードKLとリバースKLを適応的に結合する新しい方法である。 ToDiは、均一またはより粒度の低い戦略を用いて、最近の蒸留ベースラインを一貫して上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:55:16 GMT)
A Self-Adaptive Frequency Domain Network for Continuous Intraoperative Hypotension Prediction [9.8]
術中低血圧 (IOH) は, 術後合併症と強く関連している。既存の手法は時間領域情報と周波数領域情報の両方を組み込む際に制限に直面している。 SAFDNet(Self-Adaptive Frequency Domain Network)を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:02:28 GMT)
GradES: Significantly Faster Training in Transformers with Gradient-Based Early Stopping [9.8]
早期停止はグローバルなバリデーション損失を監視し、すべてのパラメータ更新を同時に停止する。 textitGradESは、トランスフォーマーコンポーネント内で動作可能な、新しい勾配ベースの早期停止アプローチである。 textitGradESはトレーニング時間を1.57--7.22$times$で高速化すると同時に、オーバーフィッティングの早期防止による一般化を同時に強化する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:09:03 GMT)
VIVA+: Human-Centered Situational Decision-Making [9.7]
本研究では,人間中心の状況下でのMLLMの推論と意思決定のベンチマークであるVIVA+を紹介する。 Vila+は1,317の現実世界の状況と6,373の複数の質問を組み合わせ、意思決定のコアとなる3つの能力をターゲットにしている。最新の商用およびオープンソースモデルをVIVA+で評価し、異なるパフォーマンスパターンを明らかにし、重要な課題を浮き彫りにする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:13:11 GMT)
Controllable Reference Guided Diffusion with Local Global Fusion for Real World Remote Sensing Image Super Resolution [9.7]
超解像技術は、リモートセンシング画像の空間分解能を高め、より効率的な大規模な地球観測アプリケーションを可能にする。既存のRefSR手法は、クロスセンサーの解像度ギャップや重要な土地被覆の変化など、現実世界の複雑さに苦しむ。実世界リモートセンシング画像SRのための新しい制御可能な参照誘導拡散モデルであるCRefDiffを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:26:55 GMT)
Curriculum-Guided Layer Scaling for Language Model Pretraining [9.6]
計算効率向上のためのフレームワークであるCGLS(Curriculum-Guided Layer Scaling)を提案する。 CGLSは、データの増大とモデルの成長を同期させる。モデル深度の増加は、様々なダウンストリームベンチマークにおいて、より良い一般化とゼロショット性能をもたらすことを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:30:51 GMT)
Integrated Communication and Control for Energy-Efficient UAV Swarms: A Multi-Agent Reinforcement Learning Approach [9.5]
本稿では,UAVSwarm支援通信の品質向上を目的とした,統合型通信・制御協調設計機構を提案する。マルコフ決定過程(MDP)として,共同資源配分と3次元軌道制御問題を定式化する。我々は,UAV群全体のリアルタイム協調動作を可能にするマルチエージェント強化学習フレームワークを開発した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:23:04 GMT)
Joint Memory Frequency and Computing Frequency Scaling for Energy-efficient DNN Inference [9.3]
リソース制約のあるデバイスでは、高いレイテンシとエネルギーオーバーヘッドは避けられない。この課題に対処するため、ほとんどの研究者は動的電圧と周波数スケーリング(DVFS)技術に焦点を当てている。本稿ではまず,結合記憶周波数と計算周波数のスケーリングが推定時間とエネルギー消費に与える影響について検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:28:58 GMT)
Characteristic Root Analysis and Regularization for Linear Time Series Forecasting [9.3]
時系列予測は多くの領域において重要な課題である。近年の研究では、単純な線形モデルの驚くほどの競争性が強調されている。本稿では時間力学における特性根の役割に焦点を当てる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:06:30 GMT)
Toward Preference-aligned Large Language Models via Residual-based Model Steering [9.2]
本稿では,Residual Steering (PaLRS) を用いた大規模言語モデルの参照アライメントを提案する。 PaLRSは、Large Language Modelsの残留ストリームに符号化された好み信号を利用する。各種小型オープンソースLLM上でのPaLRSの評価を行った。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:16:16 GMT)
Pragmatic Inference for Moral Reasoning Acquisition: Generalization via Distributional Semantics [9.2]
大規模言語モデル(LLM)の有望な研究方向としてモラル推論が登場した本稿では, LLMが分布意味論に依存しつつも, 一般化された道徳的推論を実現する方法について検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:40:58 GMT)
BrainPath: Generating Subject-Specific Brain Aging Trajectories [9.1]
トレーニング中に脳の経時変化を学習する3D生成フレームワークであるBrainPathについて紹介する。 BrainPathは、単一のベースラインスキャンから任意の時点における解剖学的に忠実なMRIを予測する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:44:46 GMT)
Uncovering Grounding IDs: How External Cues Shape Multi-Modal Binding [8.9]
そこで本稿では,オブジェクトをモダリティを越えて指定したパーティションにバインドする外部キューによって誘導される潜在識別子であるグラウンディングIDの概念を提案する。また, 接地IDは, 関連成分間の注意力を高め, それによって相互接地が向上し, 幻覚を減少させることを示した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:15:07 GMT)
MAN: Latent Diffusion Enhanced Multistage Anti-Noise Network for Efficient and High-Quality Low-Dose CT Image Denoising [8.9]
本稿では,高画質低線量CT画像復調作業のための遅延拡散増強型マルチステージアンチノイズネットワークMANについて紹介する。提案手法は、知覚的に最適化されたオートエンコーダを介して圧縮された潜在空間で動作する。本研究は,医用画像の先進的生成モデルに向けた実践的な道筋を示すものである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:13:39 GMT)
LUQ: Layerwise Ultra-Low Bit Quantization for Multimodal Large Language Models [8.9]
マルチモーダルLLMの超低ビット(4ビット)量子化に関する最初の研究について述べる。解析の結果,多モードトークンと中間層アクティベーションは,テキストトークンと比較して,統計的分散とエントロピーが著しく高いことがわかった。我々はMLLM量子化の新しい戦略であるLUQ:Layerwise Ultra-Low Bit Quantizationを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:20:00 GMT)
Beyond English-Centric Training: How Reinforcement Learning Improves Cross-Lingual Reasoning in LLMs [8.9]
強化学習(RL)とスーパーバイザードファインチューニング(SFT)の言語間推論一般化に関する最初の体系的研究について述べる。 1) RL によるチューニングは高い精度を達成できるが, SFT と比較して言語間一般化能力は著しく向上する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:48:39 GMT)
Long Context Scaling: Divide and Conquer via Multi-Agent Question-driven Collaboration [8.8]
長いコンテキストを処理するための新しいマルチエージェントフレームワークを提案する。 XpandA(Expand-Agent)は質問駆動ワークフローと動的パーティショニングと結合されている。 XpandAは、フルコンテキスト、RAGおよびそれ以前のエージェントベースのメソッドのベースラインに対する20%の改善と1.5倍の推論高速化を実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:52:21 GMT)
TGT: A Temporal Gating Transformer for Smartphone App Usage Prediction [8.7]
本研究では,時間帯に隠蔽表現を条件付ける時間的ゲーティングモジュールを備えたTransformerフレームワークを提案する。 TGTは15の競争ベースラインをはるかに上回り、HR@1で顕著な利益を上げ、コールドスタートシナリオ下で堅牢性を維持する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:32:54 GMT)
HFuzzer: Testing Large Language Models for Package Hallucinations via Phrase-based Fuzzing [8.7]
大規模言語モデル(LLM)はコード生成に広く使用されているが、実用製品に適用した場合、重大なセキュリティリスクに直面している。パッケージ幻覚に対するLLMのテストは、パッケージ幻覚を緩和し、潜在的な攻撃に対して防御するために重要である。パッケージ幻覚のためのLLMをテストするための新しいフレーズベースのファジリングフレームワークであるHFUZZERを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:16:43 GMT)
Interpreting deep learning-based stellar mass estimation via causal analysis and mutual information decomposition [8.6]
Sloan Digital Sky Survey (SDSS) と Wide-field Infrared Survey Explorer (WISE) から得られたデータを用いて、画像ベースモデルに対する物理的解釈を提供する有意義な結果を得た。我々の研究は、深層学習と解釈可能性技術を組み合わせることで得られる利益を実証し、よりデータ駆動の天体物理学研究を促進することを約束している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:17:25 GMT)
PEARL: Peer-Enhanced Adaptive Radio via On-Device LLM [8.6]
PEARLはデバイス間通信(D2D)における協調的な層間最適化のためのフレームワークである。コンテキスト認識報酬は、アプリケーション寛容によってレイテンシを正規化し、デバイスバッテリ状態によってエネルギーを変調する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:43:17 GMT)
Focusing on What Matters: Object-Agent-centric Tokenization for Vision Language Action models [8.5]
我々は,視覚・言語・アクション(VLA)モデルのためのオブジェクト・エージェント中心のトークン化であるOat-VLAを提案する。 Oat-VLAは、パフォーマンスを犠牲にすることなく、視覚トークンの数をわずかに減らすことができる。我々は,Oat-VLA が LIBERO スイート上で OpenVLA の少なくとも2倍の速度で収束していることを明らかにする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:42:53 GMT)
TRAPDOC: Deceiving LLM Users by Injecting Imperceptible Phantom Tokens into Documents [8.4]
大規模言語モデル(LLM)への過度な依存は、重要な社会的問題として浮上している。そこで本研究では,LLMがユーザにとって妥当と思われるが,実際には誤りである出力を生成するために,不知覚なファントムトークンを文書に注入する手法を提案する。本手法を応用して,高信頼性LLMユーザを欺くためのフレームワークであるTRAPDOCを導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:05:30 GMT)
Explore-Execute Chain: Towards an Efficient Structured Reasoning Paradigm [8.4]
Chain-of-Thought(CoT)とその変種は、大規模言語モデル(LLM)の推論能力を著しく向上させた。 E2C$(Explore-Execute Chain)は、推論を2つの異なるフェーズに分離する構造化推論フレームワークである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:48:40 GMT)
EduVidQA: Generating and Evaluating Long-form Answers to Student Questions based on Lecture Videos [8.4]
本稿では,マルチモーダル大規模言語モデル(MLLM)を用いて,オンライン講義から学生の質問に自動的に答える方法について検討する。 EduVidQAデータセットは,296のコンピュータサイエンスビデオから5252対の質問応答ペア(合成と実の両方)で紹介され,さまざまなトピックと難易度をカバーしている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:33:58 GMT)
Merging Memory and Space: A State Space Neural Operator [8.4]
State Space Neural Operator (SS-NO) は時間依存偏微分方程式の解演算子を学習するためのコンパクトなアーキテクチャである。 SS-NOは多種多様なPDEベンチマークにおける最先端性能を実現する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:46:23 GMT)
StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions [8.3]
伝統的なインパクトモデルは、限られた観測と概念の漂流のために空間的な一般化に苦しむ。ランドスケープインタラクションを中心とした地層モデルであるStefaLandを紹介した。我々の知る限り、これは地表面相互作用予測を実証的に改善する最初の地表面基盤モデルである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:59:45 GMT)
Comprehension Without Competence: Architectural Limits of LLMs in Symbolic Computation and Reasoning [8.2]
大型言語モデル (LLM) は、記号的推論、算術的精度、論理的整合性を必要とするタスクにおいて、表面流速が著しく低下するが、体系的に失敗する。本稿では,このような障害の構造的診断を行い,テキスト理解とテキストコンピテンスの間に持続的なギャップがあることを明らかにする。我々はこの現象を,命令経路と行動経路が幾何学的に,機能的に二分される計算テキストスプリット・ブレイン症候群と呼ぶ。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:21:18 GMT)
Efficient Domain-Adaptive Multi-Task Dense Prediction with Vision Foundation Models [8.2]
本稿では,視覚基礎モデル(VFM)を強力な教師として活用することにより,このギャップを埋める,シンプルで効果的なUDAフレームワークであるFAMDAを紹介する。提案手法は,基礎モデルを自己学習パラダイムに統合し,対象ドメインに対する高品質な擬似ラベルを生成する。実験により、FAMDAは、標準の合成から現実のUDAマルチタスク学習ベンチマークにおいて、最先端(SOTA)性能を達成し、日々の適応に挑戦することが示されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:02:36 GMT)
Diffusion Generative Models Meet Compressed Sensing, with Applications to Imaging and Finance [8.0]
CSDM: まずデータセットを潜伏空間に圧縮し、潜伏空間で拡散モデルを訓練し、次に、潜伏空間で生成されたサンプルに圧縮されたセンシングアルゴリズムを適用して元の空間に復号する。提案手法は, 拡散モデル推論とスパースリカバリを組み合わせることにより, より高速な収束を実現する。このアプローチの有効性を説明するために,手書きの数字,医療・気候画像,ストレステストのための財務時系列など,さまざまなデータセットを用いて数値実験を行った。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:56:10 GMT)
When Federated Learning Meets Quantum Computing: Survey and Research Opportunities [7.8]
量子フェデレーションラーニング(QFL)は、分散フェデレーションラーニング(FL)モデルのスケーラビリティと効率を改善するために、量子コンピューティング(QC)の進歩を活用する新興分野である。本稿では,FLがQCに適合する際の課題と解決策について,体系的かつ包括的な調査を行う。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:28:42 GMT)
EfficientMIL: Efficient Linear-Complexity MIL Method for WSI Classification [7.6]
パッチ選択モジュールAdaptive Patch Selector (APS) を用いた全スライド画像(WSI)分類のための新しい線形複雑MIL手法であるEfficientMILを導入する。効率的なMILは、複数の病理組織学データセットにまたがる他のMIL法よりも優れた計算効率の向上を実現している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:47:11 GMT)
On The Variability of Concept Activation Vectors [7.5]
本稿では,概念活性化ベクトル(CAV)の理論解析を行い,その変動性を定量化する。いくつかの実生活データセットの実験により確認され、普遍的な結果に向けて指摘された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:23:31 GMT)
Automated Vulnerability Validation and Verification: A Large Language Model Approach [7.5]
本稿では、生成AI、特に大規模言語モデル(LLM)を利用したエンドツーエンド多段階パイプラインを提案する。本手法は,国立脆弱性データベース(National Vulnerability Database)のCVE開示情報から抽出する。これは、Retrieval-Augmented Generation (RAG)を使用して、外部の公開知識(例えば、脅威アドバイザリ、コードスニペット)で拡張する。パイプラインは生成されたアーティファクトを反復的に洗練し、テストケースでのアタック成功を検証し、複雑なマルチコンテナセットアップをサポートする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:16:12 GMT)
Is Thompson Sampling Susceptible to Algorithmic Collusion? [7.4]
プレイヤーがトンプソンサンプリングを使用すると、ゲームダイナミクスはナッシュ平衡に収束することを示す。プレイヤーが意図的に競争戦略を展開していないにもかかわらず、このケースではアルゴリズムによる共謀は発生しないことを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:33:32 GMT)
Fathom-DeepResearch: Unlocking Long Horizon Information Retrieval and Synthesis for SLMs [7.4]
本稿では2つの特殊モデルからなるエージェントシステムであるFathom-DeepResearchを紹介する。ひとつは、ライブWeb検索とターゲットWebページクエリによるエビデンスベースの調査に最適化された、DeepSearchモデルであるFathom-Search-4Bである。 2つ目は、Qwen3-4Bから訓練されたFathom-Synthesizer-4Bである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:58:11 GMT)
Game-Oriented ASR Error Correction via RAG-Enhanced LLM [7.3]
一般的なASRシステムは、ショートフレーズ、ラピッドスピーチ、ジャーゴン、ノイズといったゲーム固有の課題に苦しむ。本稿では,大規模言語モデル,RAG(Retrieval-Augmented Generation),データ拡張戦略を統合したGO-AECフレームワークを提案する。 GO-AECは文字誤り率を6.22%、文誤り率を29.71%削減し、ゲームシナリオにおけるASRの精度を大幅に改善した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:12:07 GMT)
Controllable Generation of Large-Scale 3D Urban Layouts with Semantic and Structural Guidance [7.3]
大規模3次元ベクトル都市レイアウト生成のための制御可能なフレームワークを提案する。幾何学的特徴や意味的属性,エッジ重み,建物の高さをグラフに埋め込むことで,本手法は2次元レイアウトをリアルな3次元構造に拡張する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:08:17 GMT)
Two-Stage Nuisance Function Estimation for Causal Mediation Analysis [7.2]
Tchetgen Tchetgen and Shpitser (2012) は、メディエーション機能に対する効率的で、偏りがあり、堅牢な影響関数に基づく推定器を導入した。この推定器は治療、メディエーター、および結果平均メカニズムに依存している。本研究では、4つのニュアンス関数を必要とする可能性関数の特定の再パラメータ化について考察する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:55:08 GMT)
GPS-MTM: Capturing Pattern of Normalcy in GPS-Trajectories with self-supervised learning [7.2]
大規模モビリティデータの基礎モデルであるGPSMasked Trajectory Transformer(GPS-MTM)を紹介する。 GPS-MTMはモビリティを2つの相補的なモードに分解する:状態(興味のあるカテゴリー)と行動(エージェント遷移)
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:00:50 GMT)
Disentangling Score Content and Performance Style for Joint Piano Rendering and Transcription [7.2]
EPR(Expressive Performance rendering)とAPT(Automatic piano transcription)は、音楽情報検索において基本的な逆のタスクである。本稿では,EPRとAPTを協調的にモデル化する統合フレームワークを提案する。我々のフレームワークは変換器に基づくシーケンス・ツー・シーケンスアーキテクチャに基づいて構築されており、シーケンス・アライン・データのみを用いて訓練されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:36:33 GMT)
SURGE: On the Potential of Large Language Models as General-Purpose Surrogate Code Executors [7.2]
大規模言語モデル(LLM)がコード実行予測の代理モデルとして機能するかどうかを検討する。オープンソースおよびプロプライエタリ LLM の広範な分析を通じて,スケーリング法則,データ効率,予測精度について検討する。計算機処理における効率的なサロゲートとしてのLCMの実現可能性に関する重要な知見を明らかにした。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:36:20 GMT)
GeoFunFlow: Geometric Function Flow Matching for Inverse Operator Learning over Complex Geometries [7.2]
偏微分方程式(PDE)が支配する逆問題は、科学や工学において重要である。複素幾何学上の逆問題に対する幾何拡散モデルフレームワークであるEm GeoFunFlowを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:21:52 GMT)
Open-DeBias: Toward Mitigating Open-Set Bias in Language Models [7.0]
我々は,テキストベースの質問応答タスクにおいて,オープンセットバイアス検出と緩和という新たな課題に取り組む。 OpenBiasBenchは、様々なカテゴリやサブグループにまたがるバイアスを評価するために設計されたベンチマークである。また,新しいデータ効率,パラメータ効率のデバイアス法であるOpen-DeBiasを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:08:39 GMT)
DeepONet for Solving Nonlinear Partial Differential Equations with Physics-Informed Training [7.0]
本研究では,物理インフォームドトレーニングにおけるDeepONetの性能について検討し,(1)ディープブランチとトランクネットワークの近似能力,(2)ソボレフノルムの一般化誤差の2点に着目した。以上の結果から,複雑な分岐ネットワークが性能向上に寄与するのに対し,トランクネットワークは比較的シンプルに維持される場合が最も有効であることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:23:10 GMT)
SVAC: Scaling Is All You Need For Referring Video Object Segmentation [6.9]
Video Video Object (RVOS) は、自然言語による記述に基づいて、対象物をビデオシーケンスに分割することを目的としている。マルチモーダル大言語モデル(LMML)の最近の進歩は,テキスト・ビデオ理解の強化を通じてRVOSの性能を改善している。入力フレームとセグメンテーショントークンをスケーリングすることでRVOSを改善する統一モデルSVACを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:02:09 GMT)
Time-Shifted Token Scheduling for Symbolic Music Generation [6.8]
遅延に基づくスケジューリング機構を適用し、デコードステップを越えて複合的なトークンを拡張する。本手法は,標準的な複合トークン化よりもすべてのメトリクスを改善し,そのギャップを微細なトークン化に狭める。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:52:44 GMT)
Scrambling-Enhanced Quantum Battery Charging in Black Hole Analogues [6.8]
ブラックホールは自然界で最速の量子情報スクランブラを構成する。ブラックホールの衝突が、予め設定された衝突パラメータの制御されたクエンチを介して帯電に与える影響について検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:06:44 GMT)
Controllable Adversarial Makeup for Privacy via Text-Guided Diffusion [6.7]
対面認識技術は、顔画像に逆らうことによってプライバシーを保護する。生成的メイクベースのアプローチは最も広く研究されている。我々は,ユーザ定義のテキストプロンプトによって誘導される局所的な対角化粧を生成する新しい拡散ベースのフレームワークであるMASQUEを開発する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:12:16 GMT)
Constant Bit-size Transformers Are Turing Complete [6.7]
任意の長さの入力で動くチューリングマシンは、定ビットサイズの変圧器でシミュレートできることを示す。提案手法は,チューリング完全計算モデルであるPostマシンのシミュレーションに依存する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:26:40 GMT)
ADAPT: Lightweight, Long-Range Machine Learning Force Fields Without Graphs [6.7]
第一原理法は、欠陥データベースのスケールを含む欠陥エネルギーと構造を計算するために広く使われている。 MLFFは計算コストが高く、機械学習力場(MLFF)は構造緩和を加速させる魅力的な代替品である。既存のMLFFのほとんどはグラフニューラルネットワーク(GNN)をベースとしている。本稿では,グラフ表現を空間内直接座標で置き換えるMLFFである ADAPT (Accelerated Deep Atomic Potential Transformer) を導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:18:57 GMT)
Graph Mixing Additive Networks [6.6]
グラフニューラル付加ネットワーク(GNAN)を拡張するフレキシブルで解釈可能な表現型フレームワークであるGMANを紹介する。 GMANは、各時間依存軌跡を有向グラフとして表現し、各グラフにより豊かで表現性の高いGNANを適用する。実世界のデータセットでは、GMANは強力な非解釈可能なブラックボックスベースラインを上回り、アクション可能なドメイン整合した説明を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:58:58 GMT)
Extracting Moore Machines from Transformers using Queries and Counterexamples [6.6]
正規言語で訓練された変換器の高レベル抽象化として有限状態オートマトンを構築する。文献で使用される多くのトレーニングタスクをそれらにマッピングできるので、ムーアマシンを抽出する。本稿では,正のみの学習法とシーケンス精度を詳細に研究することで,このアプローチの有用性を実証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:25:45 GMT)
MemMamba: Rethinking Memory Patterns in State Space Model [6.5]
マンバのような選択的状態空間モデルは O(n) 時間と O(1) 繰り返しの推論で高い効率性を示すが、その長距離メモリは指数関数的に崩壊する。長文読解時の塩分情報の蒸留・保存方法に着想を得て,MemMambaを提案する。 MemMambaは、長期間のベンチマークで既存のMambaとTransformerよりも大幅に改善されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:40:58 GMT)
Conformal prediction of future insurance claims in the regression problem [6.5]
本稿では、有効な予測のための一般的な機械学習戦略である共形予測を紹介する。提案手法はモデルフリーとチューニングフリーの両方である。また、事前指定されたカバレッジの確率レベルで有限サンプルの妥当性を保証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:25:54 GMT)
End-to-end Topographic Auditory Models Replicate Signatures of Human Auditory Cortex [6.4]
ヒトの聴覚的 fMRI 応答の予測において,皮質トポグラフィーは過去の最高性能モデルには存在しないことを示す。地形組織の形成を促進するために,視覚知覚のために考案された皮質配線制約を適応させる。 TopoAudioは、初期地形を示す最初のエンド・ツー・エンドの生物学的基盤を持つ聴覚モデルである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:20:30 GMT)
LLM Hallucination Detection: HSAD [6.3]
幻覚検出方法は、事実整合性検証や静的な隠蔽層機能に依存する。本稿では,隠蔽層時間信号の周波数領域解析に基づく幻覚検出手法を提案する。この手法は、知識カバレッジと推論バイアスの検出の観点から、既存のアプローチの限界を克服する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:25:34 GMT)
Heterogeneous Multi-agent Collaboration in UAV-assisted Mobile Crowdsensing Networks [6.2]
無人航空機(UAV)による移動式クラウドセンシング(MCS)は,データ収集において有望なパラダイムとして浮上している。我々は,センサ,通信,資源配分の効率的な調整を妨げる,スペクトル不足,デバイス計算,ユーザモビリティといった課題に対処する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:13:19 GMT)
Improving the Efficiency of LLM Agent Systems through Trajectory Reduction [6.1]
本稿では,エージェントのコスト削減のための推定時間トラジェクトリ削減手法を提案する。 AgentDietは入力トークンを39.9% 59.7%、最終計算コストを21.1% 35.9%削減し、同じエージェント性能を維持することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:43:41 GMT)
VioPTT: Violin Technique-Aware Transcription from Synthetic Data Augmentation [6.0]
ヴァイオリン演奏技術を直接書き起こす軽量なエンドツーエンドモデルである textbfVioPTT (Violin Playing Technique-aware Transcription) を提案する。我々は、手動でラベル付けされたアノテーションの必要性を回避するために、新しい高品質な合成ヴァイオリン演奏技術データセットであるtextbfMOSA-VPT をリリースする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:10:17 GMT)
INSTINCT: Instance-Level Interaction Architecture for Query-Based Collaborative Perception [6.0]
協調認識システムは、マルチエージェントの知覚データを統合し、精度と安全性を向上させることで、単一車両の制限を克服する。これまでの研究は、クエリベースのインスタンスレベルのインタラクションが帯域幅の要求と手作業による事前処理を減らすことを証明してきたが、協調認識におけるLiDARによる実装は未開発のままである。 InSTINCTは,(1)高品質なインスタンス特徴選択のための品質認識型フィルタリング機構,2)協調関連インスタンスと協調関連インスタンスを分離するデュアルブランチ検出ルーティングスキーム,3)クロスエージェントローカルインスタンスフュージョンモジュール,の3つのコアコンポーネントを特徴とする新しい協調認識フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:16:32 GMT)
ReLumix: Extending Image Relighting to Video via Video Diffusion Models [5.9]
ビデオのポストプロダクション中に照明を制御することは、計算写真において重要な目標である。本稿では、時間合成からリライトを分離する新しいフレームワークであるReLumixを紹介する。 ReLumixは、合成データに基づいて訓練されているが、実世界のビデオに対する競争上の一般化を示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:35:33 GMT)
CLEAR: Calibrated Learning for Epistemic and Aleatoric Risk [5.8]
2つの異なるパラメータを持つ校正法であるCLEARを提案する。予測可能性-計算可能性-安定性フレームワークから引き出された(i)量子不確実性と(ii)アンサンブルに対して、(i)量子レグレッションでどのように使用できるかを示す。 17の多様な実世界のデータセットで、CLEARはインターバル幅で平均28.2%と17.4%の改善を達成した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:18:33 GMT)
Communication-aware Wide-Area Damping Control using Risk-Constrained Reinforcement Learning [5.7]
非理想的な通信リンク、特に遅延は、電力系統の高速ネットワーク制御に重大な影響を及ぼす。伝統的に、このサイバー物理結合に対処するために遅延推定と補償アプローチが採用されている。本稿では,通信遅延をターゲットとしたリスク制約付きフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:51:11 GMT)
Finite-Time Bounds for Two-Time-Scale Stochastic Approximation with Arbitrary Norm Contractions and Markovian Noise [5.7]
2時間スケール近似(英: Two-time-scale Approximation、SA)は、強化学習と最適化に応用した反復アルゴリズムである。強化学習の応用により、非線型2時間スケール SA 上の最初の平均正方形を与える。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:03:17 GMT)
3D Foundation Model for Generalizable Disease Detection in Head Computed Tomography [5.7]
本稿では,頭部CTの基礎モデルであるFM-CTについて紹介する。提案手法では,手動アノテーションを必要とせずに,361,663個の非コントラスト3次元頭部CTスキャンの大規模データセット上で,ディープラーニングモデルを事前学習する。以上の結果から, 自己監督基盤モデルにより下流診断における性能が著しく向上することが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:50:50 GMT)
TF-Bench: Evaluating Program Semantics Reasoning with Type Inference in System F [5.6]
大規模言語モデル(LLM)は、ソフトウェアエンジニアリングエコシステムにますます統合されています。本稿では,システムFの型推論に基づいてLLM推論を評価するベンチマークであるTF-Benchを紹介する。 TF-Bench_pureは、純粋に意味論的に駆動されるTF-Benchの変種である。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:57:42 GMT)
Self-Normalized Resets for Plasticity in Continual Learning [5.6]
SNR(Self-Normalized Resets)は、ニューロンの重みをリセットすることで可塑性損失を緩和する適応アルゴリズムである。我々は,SNRが競合するアルゴリズムと比較して常に優れた性能を発揮することを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:26:18 GMT)
Automatic Speech Recognition for Greek Medical Dictation [5.5]
本論文の主な目的は,ギリシャ語医療用音声書き起こしのためのドメイン固有システムを作ることである。自動音声認識技術とテキスト修正モデルを組み合わせたシステムを開発した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:15:47 GMT)
Physics-Guided Null-Space Diffusion with Sparse Masking for Corrective Sparse-View CT Reconstruction [5.5]
拡散モデルは画像処理タスクにおいて顕著な生成能力を示した。スパース・ビューCT再構成のためのスパース・コンディション・リワイト統合分布推定誘導拡散モデル(STRIDE)を提案する。実験結果から,PSNRでは2.58dB,SSIMでは2.37%,MSEでは0.236に改善した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:12:00 GMT)
Position: Thematic Analysis of Unstructured Clinical Transcripts with Large Language Models [5.4]
LLM(Large Language Model)は、構造化されていない臨床転写のセマンティック解析をサポートする。既存の評価方法は大きく異なり、進歩を妨げ、研究全体で有意義なベンチマークを防ぐ。本稿では,妥当性,信頼性,解釈可能性の3つの側面に着目した評価フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:36:22 GMT)
HyMaTE: A Hybrid Mamba and Transformer Model for EHR Representation Learning [5.4]
縦型データ表現に適したハイブリッドモデルであるHyMaTE(HyMaTE:HyMaba and Transformer Model for EHR Representation Learning)を提案する。複数の臨床データセット上の予測タスクでモデルをテストすることにより、HyMaTEがより効果的で、よりリッチで、よりニュアンスに統一されたEHRデータの表現をキャプチャする能力を示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:24:15 GMT)
Mode Selection in Quantum Nonlinear Optics Using Optical Resonators [5.3]
非線形プロセスにおけるモードセレクタとしての光共振器の新しい応用について述べる。まず,共振器による自発的なダウンコンバージョンにより,デコリレーションと波長の柔軟性を向上したスペクトル非相関光子対を生成できることを示す。次に,高分解能時間モード選択性と正確なスペクトル制御を有する量子パルスゲートを実現する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:54:50 GMT)
Deep Taxonomic Networks for Unsupervised Hierarchical Prototype Discovery [5.3]
既存の手法は、しばしば構造をクラスの数に結び付け、中間階層レベルで利用可能なリッチなプロトタイプ情報を未利用にする。我々はこれらのギャップを埋めるために設計された新しい潜伏変数アプローチであるDeep Taxonomic Networkを導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:13:32 GMT)
$\mathbf{R}^3$: Reconstruction, Raw, and Rain: Deraining Directly in the Bayer Domain [5.2]
ほとんどの再構成ネットワークはISP後のsRGBイメージでトレーニングされているが、イメージ信号処理パイプラインは、色やクリップのダイナミックレンジを不可逆的に混合し、細部がぼやけている。本報告では, 雨害対策として雨害対策を応用し, 生モザイクを直接学習することで, より優れた再現性が得られることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:31:24 GMT)
Detecting and Rectifying Noisy Labels: A Similarity-based Approach [5.2]
本稿では,ニューラルネットワークの直観的特徴を利用したポストホック,モデルに依存しない誤り検出と修正手法を提案する。我々の考えは、誤ラベル付きデータポイントと真のクラスデータポイントとの類似性は他のクラスのデータポイントよりも高いという観察に基づいている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:41:56 GMT)
Tunable-Generalization Diffusion Powered by Self-Supervised Contextual Sub-Data for Low-Dose CT Reconstruction [5.1]
SuperDiffは、低用量CT再構成のための自己教師付きコンテキストサブデータを利用した、チューニング可能な一般化拡散法である。再現性と一般化性能の点で、既存の最先端手法を一貫して上回っている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:50:29 GMT)
Variable Rate Image Compression via N-Gram Context based Swin-transformer [5.1]
本稿では,学習画像圧縮のためのN-gramコンテキストベースのSwin変換器を提案する。我々は,N-gramコンテキストをSwin Transformerに組み込むことで,高解像度画像再構成における大域無視の限界を克服する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:46:32 GMT)
Avoid Catastrophic Forgetting with Rank-1 Fisher from Diffusion Models [5.1]
破滅的な忘れは、ニューラルモデルにおける継続的な学習の中心的な障害である。我々は,すでに高品質な再生データを生成することができる拡散モデルの勾配幾何学について検討する。 EWCのランク1変種は、対角近似と同等に安価であるが、支配的な曲率方向を捉えている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:51:16 GMT)
TReF-6: Inferring Task-Relevant Frames from a Single Demonstration for One-Shot Skill Generalization [5.1]
本稿では,単純化された6DoFタスク関連フレームを単一軌道から推定するTReF-6を提案する。提案手法は,DMP(Dynamic Movement Primitive)のパラメータ化の基準となる局所フレームの原点を定義するために,軌道形状から純粋に影響点を同定する。推定フレームは視覚言語モデルを介して意味的に接地され、グラウンドド・SAMによって新しいシーンにローカライズされる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:29:06 GMT)
Evaluating the Impact of Radiographic Noise on Chest X-ray Semantic Segmentation and Disease Classification Using a Scalable Noise Injection Framework [4.9]
我々は2つの重要な胸部X線作業における量子(Poisson)と電子(Gaussian)ノイズのシミュレーションに対する最先端畳み込みニューラルネットワーク(CNN)の堅牢性を評価する。セマンティックセグメンテーションモデルは非常に脆弱で、肺セグメンテーション性能は重度の電子ノイズ下で崩壊した。我々は、AtelectasisとPneumothoraxを区別するなどの特定のタスクが、量子ノイズの下で破滅的に失敗することを発見した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:09:43 GMT)
End-to-End Deep Learning for Predicting Metric Space-Valued Outputs [4.9]
本稿では,計量空間値出力を予測するためのディープラーニングフレームワークであるE2Mを紹介する。 E2Mは、トレーニング出力よりも重み付けされたFr'teche手段を介して予測を行う。以上の結果から,E2Mは常に最先端の性能を達成でき,その優位性はより大きいサンプルサイズでより顕著になることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:46:12 GMT)
Efficient AllReduce with Stragglers [4.7]
StragglARは、分散トレーニングと推論を高速化するAllReduceの並列アルゴリズムである。 StragglARは、大規模なGPUクラスタのための一般的な帯域幅効率アルゴリズムよりも2倍のスピードアップを実現している。 8-GPUサーバ上では、StragglARは最先端のAllReduceアルゴリズムよりも25%のスピードアップを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:34:14 GMT)
DRIK: Distribution-Robust Inductive Kriging without Information Leakage [4.7]
トレーニング、検証、テストセットをきれいに分離する3x3パーティションを提案する。インダクティブ・クリグの本質性を念頭に設計した分散ロバスト・インダクティブ・クリグ手法であるDRIKを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:14:39 GMT)
ICYM2I: The illusion of multimodal informativeness under missingness [4.5]
ICYM2I(ICYM2I)を導入する。合成,半合成,実世界のデータセットに欠落した情報獲得を推定するために提案した調整の重要性を実証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:41:12 GMT)
Transformer Tafsir at QIAS 2025 Shared Task: Hybrid Retrieval-Augmented Generation for Islamic Knowledge Question Answering [4.4]
本稿では,イスラム知識の理解と推論に関するQIAS 2025の共通課題について述べる。本研究では,大言語モデル(LLM)の性能向上のために,スパース法と高密度検索法を組み合わせたハイブリッド検索拡張生成(RAG)システムを開発した。我々の3段階パイプラインは、初期検索にBM25、セマンティックマッチングに密着した埋め込み検索モデル、正確なコンテンツ検索にクロスエンコーダが組み込まれている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:27:08 GMT)
A Computational Perspective on NeuroAI and Synthetic Biological Intelligence [4.4]
我々はNeuroAIのランドスケープをハードウェア、ソフトウェア、ウェットウェアの3つの相互作用ドメインにまとめる。我々は、オルガノイドインテリジェンス、ニューロモルフィックコンピューティング、ニューロシンボリックラーニングの進歩を強調している。これらの発展は、生きた神経組織とデジタルアルゴリズムの相互作用を通して計算する新しい種類のシステムに一括して向けられている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:05:27 GMT)
Discovering Transformer Circuits via a Hybrid Attribution and Pruning Framework [4.3]
本研究は,属性パッチを用いて高電位部分グラフを同定するハイブリッド属性・プルーニングフレームワークを提案する。回路忠実度を犠牲にすることなく,HAPはベースラインアルゴリズムよりも46%高速であることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:34:43 GMT)
ResFormer: All-Time Reservoir Memory for Long Sequence Classification [4.3]
シーケンス分類は、感情分析、意図検出、トピック分類といったタスクにおける言語パターンの理解と分類に欠かせない。トランスフォーマーベースのモデルは、最先端のパフォーマンスを達成しているにもかかわらず、2次時間とメモリの複雑さのために固有の制限がある。提案するResFormerは,カスケード手法を用いて,コンテキスト長を効率的にモデル化するニューラルネットワークアーキテクチャである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:20:49 GMT)
Echo Flow Networks [4.3]
非線形読み出しを伴うEcho State Networks (X-ESNs) グループで構成されるフレームワークである Echo Flow Networks (EFNs) を紹介する。 EFNは、PatchTSTのような主要なメソッドに比べて最大4倍高速なトレーニングと3倍のモデルサイズを実現している。当社のフレームワークのインスタンス化のひとつであるEchoFormerは、5つのベンチマークデータセットで、常に新しい最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:38:55 GMT)
Guide: Generalized-Prior and Data Encoders for DAG Estimation [4.3]
我々は,Large Language Model (LLM) の生成した隣接行列と,デュアルエンコーダアーキテクチャによる観測データを統合するフレームワークである textbfGUIDE を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:35:21 GMT)
GPM: The Gaussian Pancake Mechanism for Planting Undetectable Backdoors in Differential Privacy [4.3]
意図しないプライバシー喪失のいくつかの出来事は、数値的な問題と微分プライバシーソフトウェアの不適切な構成に起因する。本稿では、広く使われているガウスのメカニズム(GM)と計算的に区別できない新しいメカニズムであるガウスのパンケーキ機構(GPM)を提案する。 GMの数値的な問題による意図しないプライバシの損失とは異なり、GPMはデータプライバシに対する敵対的だが検出不可能なバックドア攻撃である。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:14:06 GMT)
Color-Pair Guided Robust Zero-Shot 6D Pose Estimation and Tracking of Cluttered Objects on Edge Devices [4.3]
本稿では,エッジデバイス上での効率的な実行を目的とした統合フレームワークを提案する。当社のアプローチの鍵は、ライトと不変なカラーペアの特徴表現の共有です。最初の見積のために、この機能はライブRGB-Dビューとオブジェクトの3Dメッシュの間の堅牢な登録を容易にする。追跡に関しては、同じ特徴論理が時間的対応を検証し、軽量モデルが物体の動きを確実に回帰させることができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:07:49 GMT)
SIE3D: Single-image Expressive 3D Avatar generation via Semantic Embedding and Perceptual Expression Loss [4.2]
SIE3Dは、単一の画像と記述テキストから表現力のある3Dアバターを生成するフレームワークである。画像からアイデンティティの特徴を融合させ、新しい条件付けスキームを通じてテキストからセマンティックな埋め込みを行う。テキストを正確に一致させるために、革新的な知覚的表現損失関数を導入している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:56:42 GMT)
A Weather Foundation Model for the Power Grid [4.1]
我々はSilurian AIのWFM, Generative Forecasting Transformer (GFT)を微調整する 5つのグリッドクリティカル変数に対して、ハイパーローカルでアセットレベルの予測を提供する。平均精度は0.72で、頭頂部ライムアイス検出を行う。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:05:46 GMT)
Symbolic Imitation Learning: From Black-Box to Explainable Driving Policies [4.1]
シンボリック・イミテーション・ラーニング(SIL)を導入し、合成データセットから説明可能かつ一般化可能な駆動ポリシーを導出する。 SILは、様々な運転条件の強い性能を維持しながら、ポリシーの透明性を著しく向上させる。これらの知見は、より安全で信頼性の高い自律システムを促進するために、ILPを模倣学習に統合する可能性を強調している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:34:29 GMT)
Measurement-Based Entanglement Distillation and Constant-Rate Quantum Repeaters over Arbitrary Distances [4.0]
測定に基づく量子リピータは絡み合った蒸留とリンク間の交換を用いる。測定に基づく絡み込み蒸留のための体系的プロトコルとそのリピータへの応用について紹介する。本稿では,量子低密度パリティチェック符号に基づく測定に基づくリピータプロトコルを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:08:39 GMT)
SHAPoint: Task-Agnostic, Efficient, and Interpretable Point-Based Risk Scoring via Shapley Values [3.9]
SHAPointはタスクに依存しないフレームワークであり、勾配の上昇した木の予測精度と点ベースのリスクスコアの解釈可能性を統合する。既存のフレームワークと比較して、SHAPointは優れた柔軟性、手動の事前処理への依存の低減、ランタイムパフォーマンスの高速化を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:05:19 GMT)
Gaze Estimation for Human-Robot Interaction: Analysis Using the NICO Platform [3.9]
本稿では,HRIコンテキストにおける現在の視線推定手法について述べる。我々はNICOロボットプラットフォームで収集された新しい注釈付きデータセットを紹介する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:49:27 GMT)
Bimodule Quantum Markov Semigroups [3.8]
双加群量子マルコフ半群によって支配される密度の進化は、量子対称性に対する相対エントロピーに対する双加群勾配フローであることを示す。また、既約包含と相対エルゴード双加群量子半群に対する双加群 Poincar の不等式も確立する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:34:41 GMT)
From Fields to Splats: A Cross-Domain Survey of Real-Time Neural Scene Representations [3.8]
この調査は、SLAM、テレプレゼンスと遠隔操作、ロボット操作、および3Dコンテンツ生成において、3DGSがどのように採用されているかを調べる。 3DGSがNeRFベースのアプローチに取って代わりつつある理由を説明する統一された研究質問に関するレビューをまとめる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:30:50 GMT)
Contrastive Learning Enhances Language Model Based Cell Embeddings for Low-Sample Single Cell Transcriptomics [3.8]
大規模言語モデル(LLM)は、自然言語処理や生成、コンピュータビジョン、マルチモーダル学習といった分野にまたがるリッチな表現を生成する能力を示している。本稿では、単一セルRNAシークエンシング(scRNA-seq)とLLMを統合し、知識インフォームド遺伝子埋め込みを導出する計算フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:45:39 GMT)
Joint Hybrid Beamforming and Artificial Noise Design for Secure Multi-UAV ISAC Networks [3.7]
統合センシングと通信(ISAC)は、スマートシティや自律システムといった次世代アプリケーションにとって重要な実現手段として現れます。既存の研究は主にUAVを航空基地局として扱い、ISACユーザーとしての役割を見落としている。本稿では,マルチUAVネットワークのためのセキュアでスペクトル性の高いISACフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:58:04 GMT)
TREAT-Net: Tabular-Referenced Echocardiography Analysis for Acute Coronary Syndrome Treatment Prediction [3.6]
TREAT-Netは急性冠症候群治療予測のための多モードディープラーニングフレームワークである。 9000件以上のACSのデータセットでトレーニングされ、精度は67.6%、AUROCは71.1%である。以上より,TREAT-Netは経時的かつ正確な患者トリアージのための非侵襲的ツールである可能性が示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:45:01 GMT)
PakBBQ: A Culturally Adapted Bias Benchmark for QA [3.4]
PakBBQは、文化的かつ地域的に適応した、質問回答データセットのオリジナルのバイアスベンチマークの拡張である。 PakBBQは、英語とウルドゥー語の両方の8つのカテゴリーにまたがる214以上のテンプレートと17180のQAペアで構成されており、年齢、障害、外観、性別、社会経済的地位、宗教、地域関係、言語形式を含む8つのバイアス次元をカバーしている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:05:18 GMT)
Invariant Measures in Time-Delay Coordinates for Unique Dynamical System Identification [3.4]
時間遅延座標で表される不変測度は、トポロジ的共役性に至るまでのダイナミクスを識別できることを示す。複数の遅延フレームから構築された不変測度と異なる可観測性を組み合わせることで、システムは一意に識別できる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:10:03 GMT)
Off-Policy Evaluation in Markov Decision Processes under Weak Distributional Overlap [3.4]
我々は,マルコフ決定過程(MDP)における非政治的評価の課題を再考し,分布重なりというより弱い概念の下で検討する。本稿では,この環境での良好な性能を期待できる2重頑健性(TDR)推定器のクラスを紹介する。我々の実験では、強い分布重なりが保たない場合、適切な乱れが、政治外の正確な評価を可能にする上で重要な役割を担っていることがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:54:12 GMT)
Optimism as Risk-Seeking in Multi-Agent Reinforcement Learning [3.3]
リスク探索の目的を楽観主義として解釈する原則的枠組みを提案する。我々は、エントロピーリスク/KL-ペナルティ設定の明示的な公式を含む楽観的値関数に対するポリシー勾配定理を導出する。この枠組みはリスクに敏感な学習と楽観主義を統一し,MARLにおける協調に対する理論的根拠と実践的効果的なアプローチを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:44:59 GMT)
Towards Interpretable Visual Decoding with Attention to Brain Representations [3.3]
近年の研究では、複雑な視覚刺激が深部生成モデルを用いて人間の脳活動からデコードできることが示されている。視覚的デコードフレームワークであるNeuroAdapterを提案する。本研究は、視覚神経科学のレンズを通して、脳と画像の終末復号化の可能性を強調し、拡散モデルを解釈する方法を確立するものである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:55:55 GMT)
A Hierarchical Structure-Enhanced Personalized Recommendation Model for Traditional Chinese Medicine Formulas Based on KG Diffusion Guidance [3.2]
本稿では,知識グラフ拡散誘導,すなわちTCM-HEDPRに基づく,新しい階層構造付きパーソナライズドレコメンデーションモデルを提案する。具体的には,患者対人的なプロンプトシーケンスを用いた症状表現を事前訓練し,データ拡張にプロンプト指向のコントラスト学習を適用した上で,KG誘導の同種グラフ拡散法と自己認識機構を統合し,非線形症状-ハーブ関係をグローバルに捉えた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:40:01 GMT)
Multiple Concurrent Proposers: Why and How [3.1]
単一プロモーターブロックチェーンはマイナー抽出可能な値(MEV)に悩まされる我々は,これらの特性を正確に提供するマルチ並列プロポーサ (MCP) プロトコルを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:24:18 GMT)
A Novel Hybrid Deep Learning and Chaotic Dynamics Approach for Thyroid Cancer Classification [3.1]
本稿では,適応畳み込みニューラルネットワーク(CNN)とCohen-Daubechies-Feauveau(CDF9/7)ウェーブレットを結合するインテリジェントな分類法を提案する。 DDTI甲状腺超音波画像(n = 1,638画像,819悪性/819良性)を5倍のクロスバリデーションを用いて評価した。提案手法は98.17%の精度、98.76%の感度、97.58%の特異性、97.55%のF1スコア、AUCは0.9912である。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:46:31 GMT)
VFSI: Validity First Spatial Intelligence for Constraint-Guided Traffic Diffusion [3.1]
現在のモデルは、物理的妥当性をアーキテクチャ要求よりも創発的な性質として扱う。本稿では,拡散サンプリング中のエネルギーベース誘導による制約を強制する,妥当性第一空間知能(VFSI)を提案する。 200のシナリオで、VFSIは衝突率を67%(24.6%から8.1%)削減し、全体的な妥当性を87%(50.3%から94.2%)改善している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:48:49 GMT)
Med-PU: Point Cloud Upsampling for High-Fidelity 3D Medical Shape Reconstruction [3.0]
骨盤形状の正確な再構築のために,医用画像セグメンテーションと点雲アップサンプリングを統合したフレームワークであるMed-PUを提案する。ランドマークやPCAベースの統計形状モデルとは異なり、Med-PUは大規模3次元形状データから直接暗黙の解剖学を学習する。 Med-PUは、アーティファクトを低減しつつ、表面品質と解剖学的忠実度を一貫して改善し、入力密度間の堅牢性を実証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:16:30 GMT)
Adapting Large Language Models to Mitigate Skin Tone Biases in Clinical Dermatology Tasks: A Mixed-Methods Study [3.0]
皮膚疾患に対するSkinGPT-4(SkinGPT-4)の性能バイアスについて検討した。我々は、SkinGPT-4のバックボーンを利用して、カスタム皮膚疾患分類タスクのための微調整モデルを開発した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:40:40 GMT)
LifeCLEF Plant Identification Task 2015 [3.0]
LifeCLEFの植物識別課題は,植物識別手法やシステムを大規模に活用することを目的としている。 2015年の評価は、実際に西ヨーロッパに住む1000種の植物を描写した100万枚以上の画像に基づいて行われた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:53:35 GMT)
A First Look at Privacy Risks of Android Task-executable Voice Assistant Applications [2.9]
本稿では,Androidタスク実行可能なVAアプリケーションにおけるプライバシーリスクに関する,ユーザ中心の総合的研究について述べる。プライバシーラベル、ポリシー、マニフェストファイルを含む6つのソースで、プライバシー宣言をクロスチェックします。 1)Alexaスキルのような統合されたミニアプリが不十分に表現されているメガアプリにおけるプライバシーの不正開示、2)アプリケーション間インタラクションによる特権エスカレーション、3)Androidの通信メカニズムを利用してユーザの同意を回避し、(3)Googleのシステムアプリケーションの悪用により、アプリが危険な許可の宣言を避けることができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:47:06 GMT)
Graph Neural Networks with Diversity-aware Neighbor Selection and Dynamic Multi-scale Fusion for Multivariate Time Series Forecasting [2.9]
ダイバーシティを意識した周辺選択と動的マルチスケールフュージョン(DIMIGNN)を備えたグラフニューラルネットワーク(GNN)を提案する。 DIMIGNNは、各変数が隣人と高い情報的類似性を共有することを保証するために、DNSM(Diversity-aware Neighbor Selection Mechanism)を導入している。実世界のデータセットの実験では、DIMIGNNは従来手法よりも一貫して優れていた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:23:43 GMT)
Influence-Guided Concolic Testing of Transformer Robustness [2.8]
ディープニューラルネットワークの競合テストは、具体的な実行と制約解決を交互に行い、決定を反転させるインプットを検索する。本稿では,トランスフォーマー分類器に対するインフルエンス誘導型衝突試験器を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:09:15 GMT)
PerfBench: Can Agents Resolve Real-World Performance Bugs? [2.8]
PerfBenchは、GitHubから81の実際のパフォーマンスバグ修正タスクからなるベンチマークである。 PerfBenchは、エージェントが独自のパフォーマンスベンチマークを生成することができる新しい評価ハーネスを備えている。 OpenHands-Perf-Agentは、パフォーマンスに配慮したツールと命令を組み、ベンチマークで20%の成功率を達成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:00:33 GMT)
PVTAdpNet: Polyp Segmentation using Pyramid vision transformer with a novel Adapter block [2.6]
PVTAdpNet(Pyramid Vision Transformer Adapter Residual Network)を導入する。このモデルは、U-Netスタイルのエンコーダ・デコーダ構造と、ピラミッドビジョントランスフォーマーのバックボーン、新しい残留ブロック、アダプタベースのスキップ接続を統合している。 PVTAdpNetはリアルタイムで正確なポリプセグメンテーションを実現し、ベンチマークデータセット上での優れたパフォーマンスを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:55:50 GMT)
How Does A Text Preprocessing Pipeline Affect Ontology Matching? [2.5]
トークン化と正規化(フェーズ1テキストプリプロセッシングに分類される)は、ストップワードの除去やステミング/レマタイズよりも効果的である。本稿では,第2相テキスト前処理で発生する不要な偽マッピングを修復する2つの新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:43:59 GMT)
LifeCLEF Plant Identification Task 2014 [2.4]
LifeCLEFsの植物識別タスクは、500種の木や草本植物の植物識別をシステム指向で評価するためのテストベッドを提供する。このデータの主な独創性は、フランスのアマチュア・専門家植物学者のソーシャルネットワークであるTela Botanicaが実施した市民科学イニシアチブによって特別に構築されたことである。この概要は、タスクのリソースと評価をより正確に提示し、参加グループによって採用された検索アプローチを要約し、主要なeval-uation結果の分析を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:16:15 GMT)
Q-FSRU: Quantum-Augmented Frequency-Spectral For Medical Visual Question Answering [2.4]
本稿では、周波数スペクトル表現と融合(FSRU)と量子検索拡張生成(Quantum Retrieval-Augmented Generation:量子RAG)を組み合わせた医用視覚質問応答(VQA)の新しいモデルであるQ-FSRUを提案する。 Q-FSRUは医療画像や関連テキストから特徴を抽出し、Fast Fourier Transform (FFT) を用いて周波数領域にシフトする。精度を向上し、実際の知識に基づいて回答を確実にするために、量子インスパイアされた検索システムを追加します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:09:00 GMT)
WAREX: Web Agent Reliability Evaluation on Existing Benchmarks [2.3]
本稿では,既存のベンチマークを用いた Web Agent Reliability Evaluation を提案する。 WebArena、WebVoyager、REALの3つの人気のあるベンチマークでWAREXの影響を測定します。実験の結果,WAREXの導入はタスク成功率の大幅な低下を招き,最先端エージェントの堅牢性に限界があることが示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:51:05 GMT)
MAUSAM: An Observations-focused assessment of Global AI Weather Prediction Models During the South Asian Monsoon [2.3]
南アジアモンスーンにおけるAI不確実性の測定(MAUSAM:Measuring AI Uncertainty in South Asian Monsoon)について,7つのAIベースの予測システムの評価を行った。 AIモデルは、幅広い変数にわたるモンスーン中の印象的な予測スキルを示しています。モデルは、極度の降水量の過小予測のような、より微細なスケールで体系的なエラーを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:58:49 GMT)
Similarity-Based Assessment of Computational Reproducibility in Jupyter Notebooks [2.3]
Jupyter Notebookの再実行は、さまざまな要因によって必ずしも同じ結果を生成するとは限らない。本稿では,類似度に基づく再現性指標(SRI)を紹介する。 SRIは、異なるタイプのPythonオブジェクトに特有の類似度メトリクスに基づいた、新しいメソッドを採用している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:01:51 GMT)
Low-Overhead and High-Fidelity Preparation of Logical Non-Clifford States with Multi-Level Transversal Injection [2.3]
状態蒸留またはゲート合成は通常、耐故障性回転ゲートを実装するために使用される。任意のクリフォード階層レベルで回転状態を作成するためのMLTI(Multi-level Injection)法を提案する。 MLTIは従来の手法に比べてオーバーヘッドを著しく低減しつつ高い忠実度を達成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:52:13 GMT)
Calibration Meets Reality: Making Machine Learning Predictions Trustworthy [2.1]
ポストホック校正法は機械学習モデルから確率予測の信頼性を向上させるために広く用いられている。本研究では, ポストホックキャリブレーション法の理論解析を行い, プラットスケーリングとソトニック回帰に着目した。また,制御された合成実験によるキャリブレーション性能に及ぼす特徴情報の影響についても検討した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:04:56 GMT)
Measuring Sparse Autoencoder Feature Sensitivity [2.1]
特徴感度を評価するスケーラブルな手法を開発した。言語モデルを用いて、機能の活性化例と同じ意味特性を持つテキストを生成する。次に、これらの生成されたテキストでこの機能がアクティブになるかどうかをテストする。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:58:53 GMT)
Node Classification via Simplicial Interaction with Augmented Maximal Clique Selection [1.9]
本稿では,ネットワーク内の高次相互作用を扱うために,拡張された最大斜め戦略を提案する。最大傾きのみを使用することで、不要なオーバーラップを低減し、ネットワークの簡潔な表現を提供することができる。我々の戦略は、高次ネットワーク学習のための計算効率が高く効果的なソリューションを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:57:01 GMT)
Measurement of Medial Elbow Joint Space using Landmark Detection [1.8]
本研究は関節腔を計測する新しい超音波肘部データセットを提案する。このデータセットは、22人の被験者から4,201個の肘超音波画像からなり、上腕骨と尺骨にランドマークの注釈が付けられている。本研究では,熱マップに基づく,回帰に基づく,トークンに基づくランドマーク検出手法を用いて,提案したデータセットを用いた共同空間計測手法の評価を行った。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:29:22 GMT)
EWC-Guided Diffusion Replay for Exemplar-Free Continual Learning in Medical Imaging [1.8]
患者を記憶しない継続的学習フレームワークを提案する。コンパクトなVision Transformerバックボーンを用いて、8つのMedMNIST v2タスクとCheXpertを評価した。その結果,臨床画像モデルの拡張性,プライバシに配慮した継続的適応のための実践的経路が示唆された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:23:46 GMT)
From Occasional to Steady: Habit Formation Insights From a Comprehensive Fitness Study [1.7]
この研究は、トゥルキエ最大のスポーツチェーンであるマルス・アスレティック・クラブ(Mars Athletic Club)のデータを利用する。生活習慣形成には,特定の参加期間が不可欠であることが示唆された。因果推論分析を用いて、パーソナライズされたガイダンスと社会的ダイナミクスが長期にわたるエンゲージメントの重要な要因であることを実証した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:04:13 GMT)
Ancestry Tree Clustering for Particle Filter Diversity Maintenance [1.7]
粒子フィルタリングにおける線形時間多様性維持手法を提案する。系統樹のトポロジーに基づいて粒子をクラスターし、十分に大きなサブツリーの密接な関連粒子をまとめる。我々は,マルチモーダルロボットシミュレーションと実世界のマルチモーダル屋内環境におけるアプローチを検証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:45:03 GMT)
Virtual Nodes based Heterogeneous Graph Convolutional Neural Network for Efficient Long-Range Information Aggregation [1.7]
仮想ノードはグラフ内の特定のタイプのすべてのノードと相互接続された補助ノードである。 VN-HGCNは4ドルの層しか持たない効果的な情報集約を実現する。 VN-HGCNの有効性を実証評価した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:52:18 GMT)
SEARA: An Automated Approach for Obtaining Optimal Retrievers [1.6]
本稿では,サブセットサンプリング手法を用いて評価データの課題に対処するSEARAを提案する。本手法は,実際のユーザクエリに基づいて,完全自動検索を低コストで実現する。我々は,知識に基づくQ&Aシステムや検索に基づく旅行アシスタントなど,従来のRAGアプリケーションにまたがる手法を検証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:55:24 GMT)
BTC-SAM: Leveraging LLMs for Generation of Bias Test Cases for Sentiment Analysis Models [1.6]
感性分析(SA)モデルは、現実世界の応用において有害な社会的バイアスを持つ。最小限の仕様を持つSAモデルにおいて、バイアステストのための高品質なテストケースを生成する新しいバイアステストフレームワークであるBTC-SAMを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:39:40 GMT)
Equation-Free Coarse Control of Distributed Parameter Systems via Local Neural Operators [1.5]
本稿では,局所的ニューロ演算子を顕微鏡・メソスコピックデータで訓練し,効率的な短時間解演算子を得るデータ駆動型代替手法を提案する。その後、Krylov-Arnoldi は支配的な固有スペクトルを近似し、ヤコビアン集合を明示せずに開ループのスローダイナミクスを捕捉する縮小モデルを生成する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:01:53 GMT)
Latent Representation Learning from 3D Brain MRI for Interpretable Prediction in Multiple Sclerosis [1.5]
InfoVAE-Med3Dは、認知低下の解釈可能なバイオマーカーをターゲットにした、3次元脳MRIの潜在表現学習手法である。提案手法はInfoVAEを拡張して画像と潜伏変数間の相互情報を明示的に最大化する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:22:56 GMT)
A Survey on Self-supervised Contrastive Learning for Multimodal Text-Image Analysis [1.5]
近年のテキストイメージモデルにおけるコントラスト学習のアプローチの概要について述べる。第3に、プロセスで使用されるテクニックの最新の進歩を紹介し、議論する。テキスト画像に基づく自己教師付きコントラスト学習モデルの最近の技術応用について論じる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:14:54 GMT)
Min-Max Optimisation for Nonconvex-Nonconcave Functions Using a Random Zeroth-Order Extragradient Algorithm [1.4]
変動不等式の観点から、min-max問題について議論する。制約のない問題に対して、ZO-EGアルゴリズムのNC-NC目的関数の$epsilon$-stationary点近傍への収束を確立する。非微分可能の場合、目的関数の滑らかなバージョンのエプシロン$定常点の近傍へのZO-EGアルゴリズムの収束を証明する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:55:46 GMT)
Merge Now, Regret Later: The Hidden Cost of Model Merging is Adversarial Transferability [1.3]
モデルマージング(MM)が対向例の伝達性に及ぼす影響について検討する。我々は、MMは、95%以上の相対的な転送攻撃の成功率を持つ、転送攻撃に対して確実に防御できないことを示す。本研究は,MMを用いたより安全なシステムを設計するための重要な知見を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:01:21 GMT)
Curriculum-Guided Reinforcement Learning for Synthesizing Gas-Efficient Financial Derivatives Contracts [1.2]
本稿では,共通ドメインモデル(CDM)仕様から直接スマートコントラクトを生成するための強化学習フレームワークを提案する。我々は、事前定義されたライブラリから最適なコードスニペットを選択することを学ぶPPO(Proximal Policy Optimization)エージェントを使用している。我々の実証実験の結果、RLエージェントは、大きなガス削減を伴う契約を学習し、見当たらない試験データに対して最大35.59%のコスト削減を実現した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:01:55 GMT)
AgentGuard: Runtime Verification of AI Agents [1.1]
AgentGuardは、エージェントAIシステムの実行時検証のためのフレームワークである。動的確率保証(Dynamic Probabilistic Assurance)と呼ばれる新しいパラダイムを通じて、継続的な量的保証を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:08:50 GMT)
Large Language Models and Futures Price Factors in China [1.1]
我々は、中国先進国市場向けの因子モデル構築において、GPT(Generative Pre-trained Transformer)のような大規模言語モデルの能力を活用している。長短長の戦略と長短の戦略により、単一要素と多要素のポートフォリオを設計するための40の要素をうまく獲得する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:24:10 GMT)
Attentive Dilated Convolution for Automatic Sleep Staging using Force-directed Layout [1.1]
AttDiCNN(Attentive Dilated Convolutional Neural Network)と呼ばれる自動睡眠ステージ分類器を提案する。ネットワークは、ローカル空間特徴抽出ネットワーク(LSFE)、時空間長期保持ネットワーク(S2TLR)、グローバル平均注意ネットワーク(G2A)の3つのモジュールで構成されている。 EDFX, HMC, NCHの3つのデータセットに対して, それぞれ98.56%, 99.66%, 99.08%の精度を達成し, 低計算を維持しながら, モデルの性能評価を行った。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:54:24 GMT)
From Frustration to Fun: An Adaptive Problem-Solving Puzzle Game Powered by Genetic Algorithm [1.0]
本稿では,問題解決スキル開発を支援するゲームを用いて,適応型問題解決について検討する。適応型AIを利用したパズルゲームを用いて、適応型問題解決システムは遺伝的アルゴリズムを用いてパスフィンディングに基づくパズルを動的に生成する。プレイヤモデリングシステムは、ユーザインタラクションを記録し、パズルの生成を通知し、プレイヤのさまざまなメトリクスに基づいて、ターゲットの難易度を近似する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:40:14 GMT)
Comparison of Hyperplane Rounding for Max-Cut and Quantum Approximate Optimization Algorithm over Certain Regular Graph Families [1.0]
Goemans-Williamson アルゴリズムによる Max-Cut の近似は 0.912-approximation で達成される。エッジウェイトを摂動することで計算的に難解なインスタンスの構築について検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:00:28 GMT)
Jackal: A Real-World Execution-Based Benchmark Evaluating Large Language Models on Text-to-JQL Tasks [0.9]
自然言語クエリをJira JQLにマッピングするための、オープンで実世界の実行ベースのベンチマークはありません。検証済みのJQLクエリとペアリングされた10万の自然言語(NL)リクエストと、20万以上の問題のあるライブJiraインスタンス上での実行ベースの結果からなる、新しい大規模テキスト・トゥ・JQLベンチマークであるJackalを紹介した。パラメータサイズ、オープンおよびクローズドソースモデル、実行精度、正確な一致、正準正則整合を対象とする23大言語モデル(LLM)のテキストからJQL結果について報告する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:23:22 GMT)
Evaluating the Effectiveness of Transformer Layers in Wav2Vec 2.0, XLS-R, and Whisper for Speaker Identification Tasks [0.9]
本研究では,Wav2Vec 2.0,XLS-R,Whisperの話者識別タスクにおける3種類の高度な音声エンコーダモデルの性能を評価する。 We found that Wav2Vec 2.0 and XLS-R capture speaker-specific features in their early layer, with fine-tuning improve stability and performance。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:00:24 GMT)
From Unstable to Playable: Stabilizing Angry Birds Levels via Object Segmentation [0.9]
既存のPCGモデルによって生成された不安定なレベルを同定し,修復する手法を提案する。我々はAngry Birdsをケーススタディとして使用し、確立したPCGアプローチによるゲームレベルの手法を実証した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:15:19 GMT)
Brain-language fusion enables interactive neural readout and in-silico experimentation [0.9]
CorTextは、大きな言語モデルの潜在空間に直接神経活動を統合するフレームワークである。正確な画像キャプションを生成し、神経データのみにアクセスしながら、コントロールよりも詳細な質問に答えることができる。これらの進歩は、受動的復号化から、脳の活動と言語の間の生成的で柔軟なインターフェースへの移行を示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:35:25 GMT)
Latent Chain-of-Thought? Decoding the Depth-Recurrent Transformer [0.9]
CoT(Chain-of- Thought)推論は、トランスフォーマーベースの言語モデルで複雑な数学や多段階計画に優れる。標準的なデコーダのみのアーキテクチャでは、これらの推論ステップは自然言語で外部化され、効率を犠牲にして解釈性を向上させる。パラメータ数の増加を伴わずに推論時に層を再利用する深度再帰変換器である Huginn-3.5B にそのような推論構造が出現するかどうかを検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 04:19:15 GMT)
AutoML in Cybersecurity: An Empirical Study [0.9]
本稿では,11の公開サイバーセキュリティデータセットを対象とした8つのオープンソースAutoMLフレームワークを体系的に評価する。結果は、ツールやデータセット間での大幅なパフォーマンスの変動を示しており、一貫して優れたソリューションは存在しない。主な課題は、敵の脆弱性、モデルドリフト、不適切な機能エンジニアリングである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:52:46 GMT)
Quantum Mpemba effect without global symmetries [0.8]
ムペンバ効果(Mpemba effect)は、最初に平衡から遠く離れた系が平衡に近づくよりも速く緩和する現象であり、古典的な系において広く研究されている。我々は、QMEは、そのような対称性を欠く汎用的で非可積分な多体システムにおいてユビキタスであると主張する。横方向および縦方向の場を持つ量子イジングモデルのようなパラダイムモデルを用いて、QMEは初期状態のエネルギー密度によって理解可能であることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:17:35 GMT)
From Edge to HPC: Investigating Cross-Facility Data Streaming Architectures [0.8]
DTS(Direct Streaming)、PRS(Proxied Streaming)、MSS(Managed Service Streaming)の3つのクロスファシリティデータストリーミングアーキテクチャについて検討する。我々の研究では、DTSは最小のホップパスを提供し、スループットの向上とレイテンシの低減を実現しているのに対し、MSSは複数のユーザに対してデプロイメントの実現可能性とスケーラビリティを提供していますが、大きなオーバーヘッドが発生しています。 PRSは、ほとんどの場合、DTSに匹敵するパフォーマンスを備えたスケーラブルなアーキテクチャを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:54:38 GMT)
Do LLMs Understand Romanian Driving Laws? A Study on Multimodal and Fine-Tuned Question Answering [0.7]
本稿では,ルーマニアの運転法QAにおけるLarge Language Models (LLMs) について解説した。我々は1,208件の検索データセット(387件のマルチモーダル)を公開し、テキストのみのSOTAシステムとマルチモーダルのSOTAシステムを比較した。 Llama 3.1-8B-InstructとRoLlama 3.1-8B-Instructのドメイン特異的微調整の影響を測定した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:58:00 GMT)
Semantic Representation of Processes with Ontology Design Patterns [0.7]
オントロジーデザインパターン(ODP)は、繰り返し発生する問題に対してモジュール型セマンティックおよび再利用可能なモデリングソリューションを提供する。この研究は、科学的・工学的なプロセスモデリングに関係し、その構造に埋め込まれた暗黙的なデザインパターンを特定した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:42:01 GMT)
Quantum state-preparation control in noisy environment via most-likely paths [0.6]
雑音の影響を受けないオープン量子系の別の見方として、平均力学を仮定的雑音軌道に到達させる方法を考える。本稿では,騒音発生確率に基づく状態準備問題の制御戦略を提案する。概念実証として,提案手法を劣化雑音下でのqu状態生成に適用し,任意の目標状態に対する制御されたRabiドライブの解析的解決を行う。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:04:52 GMT)
Cognifying Education: Mapping AI's transformative role in emotional, creative, and collaborative learning [0.6]
感情的サポート、創造性、文脈理解、学生参加、問題解決、倫理と道徳、コラボレーションの7つの主要な領域について検討する。私たちは、AIが人間の教育者を補完し、強化することで、認知、社会的、感情的な側面を越えてより豊かな学習経験を育むことができることに気付きました。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:32:10 GMT)
AI4DiTraRe: Building the BFO-Compliant Chemotion Knowledge Graph [0.4]
本稿では,BFO準拠のChemotion Knowledge Graphを構築するためのセマンティックパイプラインを提案する。 Chemotion-KG APIは、化学におけるAI駆動の発見と推論をサポートするために、FAIR原則に従うために開発された。ソースコードとデータセットはGitHubから公開されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:26:03 GMT)
Do Repetitions Matter? Strengthening Reliability in LLM Evaluations [0.4]
LLMのリーダーボードはシングルランに依存することが多いが、信頼できる結論を得るために何回繰り返しが必要なのかは不明だ。我々は、AI4Mathベンチマークで8つの最先端モデルを再評価し、設定ごとに3つの独立した実行を実行しました。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:45:20 GMT)
Energy Consumption of TLS, Searchable Encryption and Fully Homomorphic Encryption [0.4]
プライバシー強化技術(PET)は、プライバシー規制に反応して大きな注目を集め、ユーザーデータ保護を優先するアプリケーションの開発を推進している。本研究は, 暗号PETの環境影響を, 3個のPETによるエネルギー消費の増加を非私的PETと比較して測定することによって検討した。その結果,TLSの2倍から検索可能暗号化の10倍,FHEの10倍まで,エネルギー消費量の増大が認められた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:37:54 GMT)
From Drawings to Decisions: A Hybrid Vision-Language Framework for Parsing 2D Engineering Drawings into Structured Manufacturing Knowledge [0.4]
2Dエンジニアリング図面からの重要な情報は、デジタル製造の進歩に不可欠である。手動の抽出は遅く、労働集約的であるが、一般的なOCRモデルは複雑なレイアウト、エンジニアリングシンボル、回転テキストのために失敗することが多い。回転認識オブジェクト検出モデル(YOLOv11-obb)とトランスフォーマーに基づく視覚言語モデル(VLM)を統合するハイブリッドビジョン言語フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:44:47 GMT)
Tool-Assisted Conformance Checking to Reference Process Models [0.3]
整合性チェックは、さまざまなプロセスの品質と一貫性を維持するために不可欠です。本稿では,参照モデルに対する具体的なプロセスモデルの自動適合性チェックについて検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:15:23 GMT)
Non-Abelian interference of topological edge states [0.3]
トポロジカル境界状態は、一方向伝播や雑音の頑健性など、特徴的な特性を示す。二重対称性で保護された非アベリア量子干渉および絡み合い生成の実装を実証する。我々の研究は、量子科学と技術に適用された非アベリアトポロジーを探索するための代替経路を確立する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:29:27 GMT)
Digital welfare fraud detection and the Dutch SyRI judgment [0.3]
判定の即時効果は限定的であることを示す。この判決は、不正検出はプライバシーの権利を尊重する形で起こらなければならないことを政策立案者に思い出させる。この判断は、個人データを使用する場合の透明性の重要性も確認する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:32:05 GMT)
Automatic selection of primary studies in systematic reviews with evolutionary rule-based classification [0.3]
我々は,論文検索プロセスから抽出した論文が関連しているかどうかを自動的に判断する進化的機械学習手法「我がモデル」を提案する。文法を用いて文法と規則の構造を定義することにより、従来のテキスト情報と最先端の手法では考慮されていない他の文献データを簡単に組み合わせることができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:13:20 GMT)
Opinions can be Incorrect! In our Opinion. On the accuracy principle in data protection law [0.3]
正確性原理は、個人データに対して、データ対象に関する意見の形で適用可能であると論じる。我々はまた、規範的な観点から、正確性原理は意見に適用されるべきであると主張する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:37:46 GMT)
Quantifying constraint hierarchies in Bayesian PINNs via per-constraint Hessian decomposition [0.3]
後方ヘシアンを各制約から寄与に分解するスケーラブルでマトリックスフリーなLaplaceフレームワークを導入する。提案手法は, 制約がネットワークの幾何学をいかに彫り上げたかを追跡し, ヘッセン川を直接通し, 単一損失重みの変更が曲率と有効支配を非自明に再分配するかを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:06:46 GMT)
SEMF: Supervised Expectation-Maximization Framework for Predicting Intervals [0.3]
Supervised expectation-Maximization Framework (SEMF)は、任意のMLモデルで予測間隔を生成するための汎用的でモデルに依存しないアプローチである。 SEMFは、所望のカバレッジ確率を維持しながら、常により狭い予測間隔を生成する。量子(スピンボール)損失を使わずに、SEMFは勾配ブースト木やニューラルネットワークを含む点予測器を共形量子レグレッションで校正することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:17:30 GMT)
Causal inference for the expected number of recurrent events in the presence of a terminal event [0.2]
終端故障イベントを伴う繰り返しイベントデータにおける因果推論のための多元的ロバストな推定フレームワークを開発する。条件付き独立検閲よりも弱い条件下で推定値が識別可能であることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:40:44 GMT)
Price discrimination, algorithmic decision-making, and European non-discrimination law [0.2]
アルゴリズムによる意思決定には差別効果がある。オンライン価格の差別は間接的な差別につながる可能性がある。しかし、論文は、非差別法はアルゴリズムによる意思決定に適用した場合に欠陥があることを示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:41:48 GMT)
The AI Agent Code of Conduct: Automated Guardrail Policy-as-Prompt Synthesis [0.2]
本稿では,非構造化設計文書の検証可能なリアルタイムガードレールへの翻訳を自動化する新しいフレームワークを提案する。『Promptとしての政治』では、自然言語政策の解釈と実施にLarge Language Models(LLMs)を使用している。さまざまなアプリケーションにまたがってアプローチを検証することで、スケーラブルで監査可能なパイプラインを実証しています。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:36:52 GMT)
A Cross-Lingual Analysis of Bias in Large Language Models Using Romanian History [0.2]
研究プロセスは3段階に分けて実施され、期待する応答の種類がある程度、応答そのものに影響を及ぼすという考え方を確認する。その結果、バイナリ応答の安定性は比較的高いが、完璧には程遠いことが示され、言語によって異なる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:03:09 GMT)
Beyond Game Theory Optimal: Profit-Maximizing Poker Agents for No-Limit Holdem [0.1]
Game-Theory-Regret Minimization (CFR) は、ヘッドアップの状況では最高であり、CFRは、ほとんどのマルチウェイの状況では最強の方法である。我々のアプローチは、ポーカーエージェントが単に負けないものから、多様な相手に一貫して勝つものへとどう動くかを示すことを目的としている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:51:57 GMT)
WordAlchemy: A transformer-based Reverse Dictionary [0.0]
インド語をサポートするオープンソースのクロスランガル逆辞書システムを提案する。このアーキテクチャは、従来の BERT の Masked Language Modeling (MLM) 技術ではなく、Translation Language Modeling (TLM) 技術を使用している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:40:30 GMT)
Vision-Grounded Machine Interpreting: Improving the Translation Process through Visual Cues [0.0]
Vision-Grounded Interpreting (VGI) は、一元的機械解釈の限界に対処するために設計された新しい手法である。本稿では,Webカメラからの音声入力と視覚入力の両方を処理するために,視覚言語モデルを統合するプロトタイプシステムを提案する。本手法の有効性を評価するため,3種類のあいまいさを対象とする手作り診断コーパスを構築した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:25:33 GMT)
Transparent, Evaluable, and Accessible Data Agents: A Proof-of-Concept Framework [0.0]
本稿では、AIエージェントの開発と評価のためのモジュール型コンポーネントベースのアーキテクチャについて述べる。このシステムは、技術的でないユーザが複雑なデータウェアハウスと対話できるようにすることによって、データアクセシビリティにおける中核的な課題に対処する。設計の要点は、多層推論フレームワークを通じて達成される透明な意思決定へのコミットメントである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:54:41 GMT)
The Role of Logic and Automata in Understanding Transformers [0.0]
ここ数年の急速な進歩を、トランスフォーマーに何ができるかという疑問に振り返る。この質問に答える上で、ロジックとオートマトンの役割は不可欠です。また、論理、オートマトン、検証、変換器の交点におけるいくつかのオープンな問題についても言及する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:34:30 GMT)
The Non-Abelian Casimir Effect for Plates, Symmetrical Tube and Box on the Lattice [0.0]
2+1)D および (3+1)D における非アーベル SU(3) ゲージ理論におけるカシミールポテンシャルの非摂動結果を示す。パラレルプレート(3+1)Dを超える測地を初めて探索し、対称管と対称箱に対するカシミール効果が魅力的であることを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:17:19 GMT)
The Hidden Costs of Translation Accuracy: Distillation, Quantization, and Environmental Impact [0.0]
本研究では,機械翻訳を用いた実スケール,蒸留,定量化モデルの比較を行った。評価1回あたりの炭素排出量分析の結果, BLEUスコアが最も高い3.3B fp32モデルでは, 環境フットプリントが最大であることが判明した。攻撃的な量子化(INT4)でさえ高いレベルの精度とフラレンシを保持しており、モデル間の差は概して小さい。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 17:32:52 GMT)
The Aharonov-Casher theorem on a line [0.0]
一次元空間におけるスピン=1/2$荷電粒子の零モードの縮退について検討する。一次元では、スカラーポテンシャルの無限族が存在する可能性が示されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:44:32 GMT)
Taking control: Policies to address extinction risks from advanced AI [0.0]
AI企業からの自発的なコミットメントは不適切で不十分な反応である、と私たちは主張する。先進的なAIの脅威に有意義に対処する3つの政策提案について述べる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:59:21 GMT)
Spectral decomposition and high-accuracy Greens functions: Overcoming the Nyquist-Shannon limit via complex-time Krylov expansion [0.0]
複素時間クリロフ空間を用いて基本極限を克服する方法を示す。 2次元Su-Schrieffer-Heegerモデルにおける臨界$S-1/2$Heisenbergモデルとライトバイポーラロンの例において、精度の大幅な改善を示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:59:11 GMT)
Searching Repulsive Casimir Forces Between Magneto-Electric Materials [0.0]
磁気材料間のカシミール力を計算するとともに, 対称性破壊誘起カシミール力のサインを規定する相図を得る。この結果は,理論的興味と実践的意義の両方を有する主題であるカシミール力のサインの理解に寄与する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:40:50 GMT)
SALM: A Multi-Agent Framework for Language Model-Driven Social Network Simulation [0.0]
SALM(Social Agent LM Framework)は、言語モデル(LM)をソーシャルネットワークシミュレーションに統合するための新しいアプローチである。私たちのコントリビューションには階層的なプロンプトアーキテクチャが含まれており、4000以上のタイムステップで安定したシミュレーションを可能にし、トークン使用率を73%削減しています。本研究では, 長期的社会現象をモデル化し, 行動忠実度を実証的に検証した上で, 最初のLCMベースのフレームワークを実証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:32:26 GMT)
Robust Deep Network Learning of Nonlinear Regression Tasks by Parametric Leaky Exponential Linear Units (LELUs) and a Diffusion Metric [0.0]
非線形ac.fは非線形データセットの学習に必要です Smooth but disappearing-gradient ac.f's have limited performance。トレーニングされたモデルの性能を評価するために、新しい拡散損失計量も提案されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:51:04 GMT)
Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning [0.0]
本稿では,ロボットナビゲーションと各種エージェントや障害物とのインタラクションを改善するための,新しい深層強化学習手法を提案する。このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを確保する。ロボットに近づいたり、異なる物体と衝突したりすることを罰する新たな報酬関数を導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:25:12 GMT)
Reasoning Isn't Enough: Examining Truth-Bias and Sycophancy in LLMs [0.0]
本研究は,大規模言語モデルの精度検出能力について,これまでで最大評価を行ったものである。真理バイアスの率、あるいは主張が真であると信じる確率は、推論モデルでは非推論モデルよりも低い。最も関係のあるのは、いくつかの高度なモデルにおいて、梅毒の傾向を特定することである。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:57:43 GMT)
Quantum calculation of the collision-induced line-shape effects in antiprotonic helium and the new accurate ab initio $\bar{p}$He$^{+}$-He potential energy surface [0.0]
反陽子性ヘリウム中での衝突誘起スペクトル線の拡大とシフトに関する最初の完全な初期計算について述べる。このデータセットは、初期の半古典的計算のための厳密なベンチマークを提供する。これはアンチプロトン性ヘリウムの高精度分光のための堅牢な理論基準を確立する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:45:36 GMT)
Quantum Resonance Beyond Direct Measurement: Insights from Weak Measurement [0.0]
弱い測定によって実現されたアハロノフの弱値増幅は、物理パラメータを高精度に測定する汎用的な手段を提供する。この関係は、主に弱値増幅の研究に使用される標準スキームである間接弱測定の場合において成り立つことを示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 06:56:31 GMT)
Quantum Algorithm of the GLMY Homology on Digraphs [0.0]
本稿では,GLMYホモロジーに対する量子アルゴリズムを提案する。 GLMYホモロジーの量子アルゴリズムは一般に立方体スピードアップを提供し、入力データがパスの仕様として与えられる場合の指数的量子優位性を提供することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 03:34:00 GMT)
Quantile-Scaled Bayesian Optimization Using Rank-Only Feedback [0.0]
ランクに基づく最適化フレームワークであるQuantile-Scaled Bayesian Optimization (QS-BO)を提案する。 QS-BOは量子スケーリングパイプラインを通じてランクをヘテロセダスティックなガウス目標に変換する。その結果,QS-BOは目標値の低さを一貫して達成し,走行時の安定性が向上した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:03:18 GMT)
Privacy in the Age of AI: A Taxonomy of Data Risks [0.0]
本稿では,AIプライバシリスクを分類する分類法を提案する。データセットレベル、モデルレベル、インフラストラクチャレベル、インサイダー脅威の4つのカテゴリに分類される19の主要なリスクを特定します。発見はこれらの次元のバランスの取れた分布を明らかにし、人間のエラー(9.45%)が最も重要な要因である。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 00:20:03 GMT)
Preserving Cross-Modal Stability for Visual Unlearning in Multimodal Scenarios [0.0]
3つの重要なコンポーネントを統合したクロスモーダル・コントラスト・アンラーニング(CCU)フレームワークを提案する。 CCUの精度は7.12%向上し、学習時間の7%に過ぎなかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:03:37 GMT)
Performance of Machine Learning Methods for Gravity Inversion: Successes and Challenges [0.0]
機械学習の最近の進歩は、重力反転のためのデータ駆動アプローチを動機付けている。まず、重力異常を直接密度場にマッピングするように訓練された畳み込みニューラルネットワークを設計する。生成モデルをさらに研究するために,変分オートエンコーダ(VAE)とGAN(Generative Adversarial Networks)を用いる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:19:07 GMT)
Path Integral Quantum Control for Quantum Chemistry Applications [0.0]
我々は、パラメータ化量子回路の最適化にPiQCアルゴリズムを適用した。可変量子固有解器(VQE)に対するPQCのゲートベースおよびパルスベースバージョンをベンチマークする。どちらのPiQCアルゴリズムも、分子結合距離の変化によって誘導される標的ハミルトニアンの変化に対するSPSAよりも強い堅牢性を示す。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:42:06 GMT)
Open Opportunities in AI Safety, Alignment, and Ethics (AI SAE) [0.0]
本稿では、外部アドオンとしてではなく、アライメントのための構造レンズとして倫理を探求する。モラル推論は、圧縮され生存バイアスのある投影として扱われる。この論文は、倫理を直接表現的基質に埋め込むことによって、哲学的主張をより経験的に親しみやすいものにする研究の課題をスケッチしている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:52:36 GMT)
Noncommutative Landau problem in graphene: a gauge-invariant analysis with the Seiberg-Witten map [0.0]
グラフェン中の無質量電子の2次元非可換(NC)平面における定バックグラウンド磁場下での相対論的量子力学について検討した。具体的には、この背景場内の単層グラフェン中の相対論的電子の運動を分析し、NCランダウ系のエネルギースペクトルを計算する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:17:12 GMT)
Non-local integrals of motion for deformed $W$-algebra $W_{q,t}(g)$ associated with $g=A_l^{(1)}, D_l^{(1)}, E_{6,7,8}^{(1)}$ [0.0]
運動の非局所積分の可換性は、直接計算により$g=A_l(1)$と$D_l(1)$の場合に示される。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:46:13 GMT)
Mathematically rigorous proofs for Shapley explanations [0.0]
数学的に厳密な観点から、Lundberg と Lee の2つの主要な結果について議論する。最初の結果は、Youngの公理に基づく機械学習におけるShapley値の公理的評価である。 2つ目の結果は、重み付き線形回帰問題の一意解としてShapley値を記述することができることを示している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:26:50 GMT)
Learning-Based Testing for Deep Learning: Enhancing Model Robustness with Adversarial Input Prioritization [0.0]
このプロジェクトはディープニューラルネットワーク(DNN)における障害検出とモデルロバスト性の向上を目的としている。本手法は, アーキテクチャ固有の特徴や形式的検証に頼ることなく, モデル欠陥を暴露する確率の高い逆入力のサブセットを選択する。テストの置換を効率的に組織することにより、さまざまなデータセット、モデルアーキテクチャ、および敵攻撃テクニックで、潜在的なすべての障害を著しく高速に発見する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:31:30 GMT)
Learning to Explain Air Traffic Situation [0.0]
本稿では,航空交通状況を説明するための機械学習フレームワークを提案する。具体的には,トランスフォーマーをベースとした多エージェント軌道モデルを用いて,航空機の時空間移動とそれらの間の社会的相互作用の両方をカプセル化する。これにより、航空管制官が交通状況をどのように認識し理解しているかを説明できる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:24:15 GMT)
Information theory for data-driven model reduction in physics and biology [0.0]
我々は,将来最も予測的な変数として定義される変数を同定する手法を開発する。高圧縮の極限において、関連する変数は、最も遅く縮退する固有関数によって直接決定される。この結果から,変数を自動識別する深層学習ツールが確立された。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:28:07 GMT)
Hyperbolic Floquet code with graph-edge syndromes [0.0]
浮動小数点符号(英: Floquet code)は、低重量パリティ測定を時間周期で適用する安定化器ベースの符号である。我々のコードにおけるパリティ測定は、半(半)双曲型3色タイリングの6段階の反復測定から成っている。正規の8,3$格子上のコードには以下の3つの利点がある: (i)パリティの測定値は、それぞれ$k$と$n$の論理量子ビットに対して、 (ii) エンコードレートは有限である。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:03:17 GMT)
Hilbert space representation for quasi-Hermitian position-deformed Heisenberg algebra and Path integral formulation [0.0]
ハイゼンベルク代数の位置変形は、この代数を生成する作用素のエルミティシティの損失につながることを示す。すると、これらの準エルミート作用素に付随するヒルベルト空間表現を構築し、準エルミート・ハイゼンベルク代数を生成する。我々は、この系のユークリッドプロパゲータ、作用、運動エネルギーが、標準的な古典力学の限界によって制約されていることを実証する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:17:20 GMT)
Hierarchical MLANet: Multi-level Attention for 3D Face Reconstruction From Single Images [0.0]
そこで本研究では,単一の画像から3次元顔モデルを再構成するための畳み込みニューラルネットワークによるアプローチを提案する。本モデルでは, 顔形状, テクスチャ, ポーズ, 照明パラメータを1つの画像から予測する。 3D Morphable Model (3DMM)パラメータを公開データセットから組み込んだ半教師付きトレーニング戦略が採用されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:39:06 GMT)
Haag Duality for 2D Quantum Spin Systems [0.0]
ハーグ双対性(Haag duality)は、2次元の格子量子スピン系に対する局所性の強い概念である。双連結$C*$-弱ホップ代数に基づく二次元テンソルネットワーク状態がハーグ双対性を満たすことを証明する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:27:49 GMT)
Gradient-based grand canonical optimization enabled by graph neural networks with fractional atomic existence [0.0]
State-of-the-artモデルは一般的に、原子埋め込みを反復的に更新するためにメッセージパッシングを使用するグラフニューラルネットワークである。我々は、分数原子の存在を考慮に入れた連続変数を含むことによって、メッセージパッシング形式を拡張した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:13:28 GMT)
Gradient Flow Convergence Guarantee for General Neural Network Architectures [0.0]
本稿では,連続勾配降下の線形収束(勾配流とも呼ばれる)の統一的な証明を示すとともに,一括非ゼロ活性化やReLU,シグモイド活性化によるニューラルネットワークのトレーニングを行う。本研究の結果は, 無限小のステップサイズ限界においてのみ正確であるが, 実測値と実測値のステップサイズ勾配法との間には, 優れた実験的一致が得られた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:52:13 GMT)
Genuine multipartite entanglement detection with mutually unbiased bases (MUBs) [0.0]
提示されたフレームワークは、多くの身体シナリオにおける絡みを検出するのに十分な基準であることが判明した。操作的普遍性に加えて、MUBsにおける測定によって得られる相関は、よく知られた三分儀と四分儀の絡み合いの測度がほとんどないことが示されている。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 19:38:58 GMT)
GANji: A Framework for Introductory AI Image Generation [0.0]
本稿では,基礎となるAI画像生成手法をベンチマークするフレームワークであるGANjiを紹介する。可変オートエンコーダ(VAE)、GAN(Generative Adrial Network)、DDPM(Denoising Diffusion Probabilistic Model)の性能を体系的に比較する。その結果、DDPMはFr'echet Inception Distance(FID)スコアが26.2であるのに対し、サンプリング時間は他のモデルよりも2,000倍以上遅いことがわかった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 23:54:59 GMT)
Fusing Sequence Motifs and Pan-Genomic Features: Antimicrobial Resistance Prediction using an Explainable Lightweight 1D CNN-XGBoost Ensemble [0.0]
抗微生物抵抗性(AMR)は、急速に拡大する世界的な健康危機である。標準的な機械学習モデルは、ゲノムを秩序のない機能のコレクションとして扱う。本稿では,シーケンスベースと特徴ベース学習を組み合わせたアンサンブルフレームワークであるAMR-EnsembleNetを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 01:19:11 GMT)
Fully quantum perturbative description of correlated Stokes--anti-Stokes scattering [0.0]
ストークス-反ストークス散乱は絡み合った光子対を生成する。本研究では, 4波混合型相関SaS散乱が摂動の第1次に現れることを示す。また、量子フォーマリズムからSaS散乱に対する3次非線形光感受性を構築する方法についても論じる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:46:04 GMT)
From Quasiperiodicity to a Complete Coloring of the Kohmoto Butterfly [0.0]
コフモトモデルのスペクトルは、コフモト蝶として知られるフラクタル相図を生成する。このレターはその障害を克服し、Kohmotoモデル指標の完全な分類を提供する。本手法では, コフモトバタフライをスペクトル木グラフとしてエンコードし, 周期スペクトルを通して準周期的な性質を反映する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:34:43 GMT)
FairViT-GAN: A Hybrid Vision Transformer with Adversarial Debiasing for Fair and Explainable Facial Beauty Prediction [0.0]
顔の美を予測するための新しいハイブリッドフレームワークである textbfFairViT-GAN を提案する。本研究では,FairViT-GANが予測精度を向上し,textbf0.9230のピアソン相関を実現し,RMSEをtextbf0.2650に短縮することを示す。対象者の分類精度がほぼランダムな確率(52.1%)に低下する傾向がみられた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:55:31 GMT)
Ensembling Multilingual Transformers for Robust Sentiment Analysis of Tweets [0.0]
本稿では,他言語の感情分析を用いたトランスフォーマーアンサンブルモデルと大規模言語モデル(LLM)を提案する。次に,事前学習した感情分析モデル(bert-base-multilingual-uncased-sentiment,XLM-R)を用いて文に対する感性の評価を行った。実験の結果, 感情分析性能は86%以上であった。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:34:48 GMT)
Efficient Identification of High Similarity Clusters in Polygon Datasets [0.0]
本稿では,検証を必要とするクラスタ数を削減し,これらのシステムに対する計算負荷を低減させるフレームワークを提案する。このフレームワークは動的類似性指数閾値、教師付きスケジューリング、リコール制約付き最適化を統合している。提案手法は精度を犠牲にすることなく計算コストを大幅に削減する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:39:15 GMT)
Effective delocalization in the one-dimensional Anderson model with stealthy disorder [0.0]
我々は、アンダーソンモデルと「スティルティー」障害を1次元で解析的に、数値的に研究する。固定エネルギーと小さなが有限障害強度$W$に対して、任意の有限長系に対して、局所化長がシステムサイズを超えるステルスネス$chi$が存在する。非相関性障害とは違い、局所化長$xi$は小 W の先行順序に$W-2$とスケールするが、ステルス乱数系に対する$xi$の摂動展開における先行順序項は、徐々に多くの項に対して同一に消滅する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 13:43:55 GMT)
Edge-FIT: Federated Instruction Tuning of Quantized LLMs for Privacy-Preserving Smart Home Environments [0.0]
本稿では,大規模言語モデル(LLM)のFIT(Federated Instruction Tuning)のためのスケーラブルなフレームワークを提案する。当社のEdge-FITフレームワークは,フェデレーション学習と4ビット量子化低ランク適応(QLORA)を組み合わせたものです。私たちは、IoTドメイン用の汎用Databricks Dolly 15kデータセットをフィルタリングすることで、これを実証します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:06:37 GMT)
EVO-LRP: Evolutionary Optimization of LRP for Interpretable Model Explanations [0.0]
説明可能なAI(XAI)メソッドは、どの画像領域がモデルの予測に影響を与えるかを特定するのに役立つが、ディテールと解釈可能性の間のトレードオフに直面していることが多い。本稿では,CMA-ES(Co Matrix Adaptation Evolution Strategy)を用いて,量的解釈可能性指標に基づくLRPハイパーパラメータのチューニングを行う手法であるEVO-LRPを紹介する。 EVO-LRPは、解釈可能性メトリックのパフォーマンスと視覚的コヒーレンスの両方において従来のXAIアプローチより優れており、クラス固有の特徴に対して強い感度を持つ。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:42:53 GMT)
Dynamically near-stable two-mode squeezing in optomechanical systems [0.0]
2モード圧縮状態は、量子情報処理とメトロジーに広く応用されたパラダイム的絡み合った状態である。ハイブリッド3モードキャビティ光学系における2モードスクイーズ方式を提案する。我々は、オープン量子システムフレームワーク内で生成する過程の厳密な理論的解決策を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 02:55:53 GMT)
Dynamic syndrome decoder in volume-law phases of hybrid quantum circuits [0.0]
体積則エンタングルメントを持つ物質の相は、量子回路でしばしば観察される。絡み合った複雑な量子情報をホストする能力は、量子測定から効率的に隠蔽する能力によって補われている。本稿では,対数回路深度における情報検索を可能にする,復調可能なボリューム法則位相を特徴とするクリフォード回路のクラスを紹介する。我々の研究は、量子誤り訂正や量子暗号における潜在的な応用を開拓し、中間回路計測によるエンコーダとして体積法則状態を使用する方法の道を開いた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:28:15 GMT)
Dynamic Policy Induction for Adaptive Prompt Optimization: Bridging the Efficiency-Accuracy Gap via Lightweight Reinforcement Learning [0.0]
本稿では,1ステップのマルコフ決定プロセス(MDP)として適応戦略選択を形式化する軽量強化学習フレームワークであるPrompt Policy Network(PPN)を紹介する。算術的推論ベンチマークの実験では、PPNは競争精度を維持しながら自己整合性よりも61.5%のトークンコスト削減を達成した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:32:42 GMT)
Diffusion Models are Kelly Gamblers [0.0]
条件拡散ストアには、シグナルを$X$と条件情報$Y$と結びつけるための追加情報がある。拡散モデルは無限に深い自己エンコーダである、という一般的な観点から、いくつかのニュアンスを指摘する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:27:25 GMT)
DNABERT-2: Fine-Tuning a Genomic Language Model for Colorectal Gene Enhancer Classification [0.0]
DNABERT-2は、DNAから可変長トークンを学習するためにバイトペアエンコーディングを使用するトランスフォーマーゲノム言語モデルである。遺伝子エンハンサーは、いつ、どこで遺伝子がスイッチされるかを制御するが、その配列の多様性と組織特異性は、大腸癌の特定を困難にしている。大腸癌におけるBPEトークン化を用いた第2世代のゲノム言語モデルを適用した最初の研究である。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:10:03 GMT)
CrashSplat: 2D to 3D Vehicle Damage Segmentation in Gaussian Splatting [0.0]
本研究では,2次元マスクの昇降による3次元損傷セグメンテーションを行う自動車両損傷検出パイプラインを提案する。また,シングルビュー3D-GSセグメンテーションのためのシンプルな学習自由アプローチを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:49:33 GMT)
Constructing Opera Seria in the Iberian Courts: Metastasian Repertoire for Spain and Portugal [0.0]
ペレス、ガルーピ、ヨメリ、コンフォルト、コルセッリは、イベリア宮廷のオペラ・セリアの作曲を依頼された作曲家である。この記事では、国際舞台における5人の作曲家(ペレス、ガルーピ、ヨミッリ、コンフォルト、コルセッリ)のスタイルが、イベリアの宮廷でオペラ・セリアを書くよう依頼された際にどう変わるかを調査します。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:35:51 GMT)
Confidence Aware SSD Ensemble with Weighted Boxes Fusion for Weapon Detection [0.0]
公共空間の安全と安全は極めて重要であり、兵器を正確に検出できる高度な監視システムの必要性を招いている。単一モデル検出器は先進的であるが、困難な条件下では堅牢性に欠けることが多い。本稿では,多様な特徴抽出バックボーンを持つシングルショットマルチボックス検出器(SSD)モデルのアンサンブルにより,検出の堅牢性を大幅に向上できるという仮説を提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 07:08:48 GMT)
Chronic Obstructive Pulmonary Disease Prediction Using Deep Convolutional Network [0.0]
本研究では,慢性閉塞性肺疾患(COPD)を検出するための呼吸音解析のための深部畳み込みニューラルネットワーク(CNN)を用いたアプローチを提案する。このシステムは、病気の重症度を軽度、中等度、重度に分類する。 ICBHIデータベースの評価は10倍のクロスバリデーションと90%の精度で96%の精度を達成した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:02:24 GMT)
Bayesian Mixture-of-Experts: Towards Making LLMs Know What They Don't Know [0.0]
Mixture-of-Experts (MoE) は大規模で効率的な大規模言語モデルの構築を可能にした。標準的な決定論的ルーティングメカニズムは、重大な制限を提示する。この論文では、構造化されたtextbfBayesian MoEルーティングフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 12:07:35 GMT)
Automatic Question & Answer Generation Using Generative Large Language Model (LLM) [0.0]
本研究では,NLPにおける教師なし学習手法の活用を提案する。カスタマイズされたモデルは、教育者、インストラクター、テキストベースの評価に従事する個人に対して効率的なソリューションを提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 22:13:13 GMT)
Atom beam-splitter with internal state selection using spin-dependent optical standing wave potentials [0.0]
スピン依存光電位を用いた出力ビーム中の原子の内部スピン状態の操作を可能にする原子ビームスプリッター。このような原子ビームスプリッターの有用性は、一定の均一な電場を受ける原子のアハロノフ・カシエ相の測定に応用して実証される。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 10:45:46 GMT)
Asymptotic Expansion for Nonlinear Filtering in the Small System Noise Regime [0.0]
システムノイズの小さなパラメータに基づく非線形フィルタリングのための新しい拡張法を提案する。このアプローチは、既存の手法に固有の計算効率と精度のトレードオフを緩和する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:50:45 GMT)
Artificially Fluent: Swahili AI Performance Benchmarks Between English-Trained and Natively-Trained Datasets [0.0]
本研究は、Swahiliデータで完全にトレーニングされ、テストされた2つの単言語BERTモデルと、同等の英語ニュースデータで比較した。このアプローチは、スワヒリの入力を英語モデルで評価するために翻訳すると、スワヒリで完全にモデルを訓練しテストするよりも、より良い性能が得られるかどうかを評価することによって仮説を検証する。その結果、高品質な翻訳にもかかわらず、スワヒリ語学習モデルはスワヒリ語から英語への翻訳モデルよりも優れた性能を示し、それぞれ0.36%対1.47%の誤差が得られた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:25:45 GMT)
An international treaty to implement a global compute cap for advanced artificial intelligence [0.0]
この条約の主な条項は、グローバルな計算上限であり、合意された計算リソースのしきい値を超えるAIシステムの開発を禁止している。この条約は、先進的な人工知能の危険性から文明を保護するための統治体制を実装することで、世界のリーダーにとって有用なテンプレートになることを期待している。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 14:36:06 GMT)
An Empirical Study on the Computation Budget of Co-Optimization of Robot Design and Control in Simulation [0.0]
ロボットの設計と制御の協調最適化は、どちらもタスクに適合する設計と制御を生成する。本稿では,シミュレーションにおける設計と制御の協調最適化に固有の課題について検討する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 16:24:28 GMT)
AmarDoctor: An AI-Driven, Multilingual, Voice-Interactive Digital Health Application for Primary Care Triage and Patient Management to Bridge the Digital Health Divide for Bengali Speakers [0.0]
AmarDoctorは多言語音声対話型デジタルヘルスアプリだ。ベンガル語話者のための総合的な患者トリアージとAIによる臨床決定支援を提供する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 11:31:59 GMT)
Accuracy-Robustness Trade Off via Spiking Neural Network Gradient Sparsity Trail [0.0]
スパイキングニューラルネットワーク(SNN)は、計算神経科学と人工知能の両方への関心が高まっている。近年の研究では、対向摂動に対する堅牢性を高めるためにスパース勾配を正規化の一形態として活用することを提案した。特定のアーキテクチャ構成下では、SNNは自然な勾配幅を示し、明示的な正規化を必要とせず、最先端の対角防御性能を達成することができる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 09:15:33 GMT)
AQUAIR: A High-Resolution Indoor Environmental Quality Dataset for Smart Aquaculture Monitoring [0.0]
AquaIRは6つの屋内環境品質変数をログするオープンアクセス公開データセットである。 2024年10月14日から2025年1月9日までの5分毎に1台のAwair HOMEモニターがサンプリングされた。本稿では,センサ配置,ISO準拠の装着高さ,基準機器に対する校正チェック,タイムスタンプの正規化を行うオープンソースの処理パイプラインについて述べる。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 21:07:10 GMT)
A Voter-Based Stochastic Rejection-Method Framework for Asymptotically Safe Language Model Outputs [0.0]
本稿では,LLMの安全性を活用して,安全でない,あるいは低品質な大規模言語モデル(LLM)の出力を防止する手法を提案する。このシステムでは、LCMチェッカーが生成した出力の受理性に投票し、不承認のしきい値に達すると再生する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 18:15:48 GMT)
A University of Texas Medical Branch Case Study on Aortic Calcification Detection [0.0]
テキサス大学医学部(UTMB)はZaulon Labs, Inc.と共同で、胸部X線写真を用いた大動脈石灰化(AC)の検出とコーディングを強化した。心血管疾患の予後に重要な価値があるにもかかわらず、ACは報告されていないことが多い。 3,988名の患者のうち495名の患者(総検査総数5,000名)が、再納のために適切にコーディングされていない大動脈石灰化の徴候を報告していた。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 15:08:53 GMT)
A State-Specific Iterative Decoupling Scheme Based on Perturbation Theory for Low-Energy Electronic States [0.0]
マルチステップRayleigh-SchrodingerとBrillouin-Wigner摂動スキームの選択的かつスケーラブルな拡張を導入する。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 08:40:02 GMT)
A Small Math Model: Recasting Strategy Choice Theory in an LLM-Inspired Architecture [0.0]
「戦略選択理論(SCT)脚注戦略選択理論」 SCTをSmall Math Model' (SMM) として再放送する
論文参考訳（メタデータ） (Sun, 28 Sep 2025 20:58:48 GMT)
A Recall-First CNN for Sleep Apnea Screening from Snoring Audio [0.0]
睡眠時無呼吸症(Sleep apnea)は、重篤な睡眠関連呼吸障害であり、治療を受けていないと健康に影響を及ぼす。ポリソムノグラフィーは高価で時間を要するため、大規模な集団のスクリーニングには実用的ではない。そこで本研究では,呼吸記録を用いて無呼吸の兆候を見つけることで,よりアクセスしやすい選択肢を探索した。
論文参考訳（メタデータ） (Sun, 28 Sep 2025 05:00:01 GMT)