UserRL: Training Interactive User-Centric Agent via Reinforcement Learning [104.6] 強化学習(Reinforcement Learning, RL)は、動的多ターン相互作用に関わるエージェントモデルのトレーニングにおいて有望であることを示す。
我々は,標準化された体育環境を通じて,ユーザ中心の能力のトレーニングと評価を行う統一的なフレームワークであるUserRLを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:33:20 GMT)
HawkBench: Investigating Resilience of RAG Methods on Stratified Information-Seeking Tasks [102.7] HawkBenchは、RAGのパフォーマンスを厳格に評価するために設計された、人間ラベル付きマルチドメインベンチマークである。
情報探索行動に基づくタスクの階層化により、HawkBenchはRAGシステムが多様なユーザニーズにどのように適応するかを体系的に評価する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:30:12 GMT)
The Medium Is Not the Message: Deconfounding Document Embeddings via Linear Concept Erasure [98.7] 埋め込みベースの類似度メトリクスは、テキストのソースや言語のような刺激的な属性に影響される可能性がある。
本稿では,エンコーダ表現から観測された共同創設者に関する情報を除去するデバイアスアルゴリズムにより,これらのバイアスを最小の計算コストで大幅に低減することを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:40:38 GMT)
Generative Model Inversion Through the Lens of the Manifold Hypothesis [98.4] モデル反転攻撃(MIA)は、訓練されたモデルからクラス表現型サンプルを再構成することを目的としている。
最近の生成的MIAは、生成的敵ネットワークを使用して、反転過程を導く画像の事前学習を行う。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:39:25 GMT)
Online Process Reward Leanring for Agentic Reinforcement Learning [92.3] 大規模言語モデル(LLM)は、強化学習(RL)を自律的なエージェントとして訓練されることが増えている。
最近の研究は、プロセスの監視をエージェント学習に統合しようと試みているが、バイアスドアノテーションに悩まされている。
エージェントRLの一般的なクレジットアサインメント戦略であるオンライン・プロセス・リワード・ラーニング(OPRL)を紹介する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:27:23 GMT)
Lost in Translation? Vocabulary Alignment for Source-Free Domain Adaptation in Open-Vocabulary Semantic Segmentation [90.6] VocAlignは、セマンティックセグメンテーションにおいてVLM用に特別に設計された、ソースフリーのドメイン適応フレームワークである。
提案手法は,CityScapesデータセットの6.11mIoU改善を実現し,ゼロショットセグメンテーションベンチマークにおいて優れた性能を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:54:20 GMT)
Detoxifying Large Language Models via Autoregressive Reward Guided Representation Editing [77.8] 大規模言語モデル(LLM)は、様々なタスクにわたって印象的なパフォーマンスを示してきたが、有害なコンテンツの生成には弱いままである。
textscAutoregressive textscReward textscGuided textscRe presentation textscEditing (ARGRE)を提案する。
ARGREは遅延表現空間内の毒性遷移を明示的にモデル化し、安定かつ正確な報酬誘導編集を可能にする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:40:32 GMT)
Tree Search for Language Model Agents [74.0] 対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。
我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。
現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:46:23 GMT)
VisualTrap: A Stealthy Backdoor Attack on GUI Agents via Visual Grounding Manipulation [73.9] この研究は、GUI要素に対するGUIエージェントをマッピングするテキストプランの視覚的基盤が脆弱性をもたらすことを明らかにしている。
視覚的接地を目的としたバックドア攻撃では、適切なタスク解決計画が与えられた場合でもエージェントの行動が損なわれる可能性がある。
そこで我々は,エージェントが意図したターゲットではなく,意図した位置をトリガーするテキストプランを見つけることをミスリードすることで,グラウンドディングをハイジャックできるVisualTrapを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:33:17 GMT)
A Gapped Scale-Sensitive Dimension and Lower Bounds for Offset Rademacher Complexity [72.8] 逐次的および非逐次的設定における関数クラスのスケール感応次元のギャップ化について検討した。
偏差次元は, オフセットラデマッハ平均値において低い境界となることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:49:53 GMT)
Fast Estimation of Wasserstein Distances via Regression on Sliced Wasserstein Distances [70.9] 本稿では,スライスされたワッサーシュタイン距離の回帰に基づく高速推定法を提案する。
少数の分布対から正確なモデルを学習できることが示される。
我々の手法は、最先端のワッサーシュタイン埋め込みモデルであるワッサーシュタインワームホールよりも、ワッサーシュタイン距離の近似が常に優れている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:30:53 GMT)
PolGS: Polarimetric Gaussian Splatting for Fast Reflective Surface Reconstruction [68.9] PolGSは10分で高速な反射面再構成が可能なポラリメトリック・ガウス・スプレイティングモデルである。
偏光的制約を3DGSフレームワークに組み込むことで、PolGSは分光成分と拡散成分を効果的に分離し、難解な反射材料のための再構成品質を向上する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:09:52 GMT)
SurgVidLM: Towards Multi-grained Surgical Video Understanding with Large Language Model [67.8] SurgVidLMは、完全かつきめ細かい外科的ビデオ理解に対処するために設計された最初のビデオ言語モデルである。
我々は,SurgVidLMが,映像理解タスクと細粒度ビデオ理解タスクの両方において,同等のパラメータスケールの最先端のVid-LLMを著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:26:52 GMT)
Universal Camouflage Attack on Vision-Language Models for Autonomous Driving [67.3] 自動運転のためのビジュアル言語モデリングが、有望な研究方向として浮上している。
VLM-ADは、敵の攻撃による深刻なセキュリティ脅威に弱いままである。
VLM-ADのための最初のユニバーサルカモフラージュ攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:52:01 GMT)
Embodied AI: From LLMs to World Models [65.7] 人工知能(AI)は、人工知能(AGI)を実現するためのインテリジェントシステムパラダイムである。
近年のLarge Language Models(LLMs)とWorld Models(WMs)のブレークスルーは、AIを具現化する上で大きな注目を集めている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:37:48 GMT)
A Theory of Multi-Agent Generative Flow Networks [65.5] マルチエージェント生成フローネットワーク(MA-GFlowNets)の理論的枠組みを提案する。
MA-GFlowNetsは複数のエージェントに適用して、一連のジョイントアクションを通じて協調的にオブジェクトを生成する。
ジョイントフロートレーニングは、(局所的な)GFNのコレクションをユニークな(グローバルな)GFNとしてトレーニングするための、ローカル・グローバルの原則に基づいている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:01:21 GMT)
DISCO Balances the Scales: Adaptive Domain- and Difficulty-Aware Reinforcement Learning on Imbalanced Data [65.1] 本稿では,グループ間不均衡と2つの重要なイノベーションに対処するGRPOの原理的拡張を提案する。
ドメイン対応報酬スケーリングは、ドメインの頻度に基づいて最適化を再重み付けすることで周波数バイアスに対処する。
難解な報酬のスケーリングは、学習価値を提供する不確実なプロンプトを特定し、優先順位付けするために、プロンプトレベルの自己整合性を活用する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:25:12 GMT)
MeshMosaic: Scaling Artist Mesh Generation via Local-to-Global Assembly [62.5] MeshMosaicは,100K以上の三角形にスケールするアーティストメッシュ生成のための,新たなローカル・グローバルなフレームワークである。
MeshMosaicは,幾何学的忠実度とユーザの好みの両方において,最先端の手法を著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:02:03 GMT)
4D Driving Scene Generation With Stereo Forcing [62.5] 現在の生成モデルは、時間外挿と空間的新規ビュー合成(NVS)をシーンごとの最適化なしで同時にサポートする動的4D駆動シーンの合成に苦慮している。
PhiGenesisは、幾何学的・時間的整合性を持った映像生成技術を拡張する4次元シーン生成のための統合フレームワークである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:37:17 GMT)
EndoBench: A Comprehensive Evaluation of Multi-Modal Large Language Models for Endoscopy Analysis [62.0] EndoBenchは、内視鏡的プラクティスの全スペクトルにわたるMLLMを評価するために特別に設計された最初の包括的なベンチマークである。
我々は、汎用、医療特化、プロプライエタリMLLMを含む23の最先端モデルをベンチマークする。
私たちの実験では、プロプライエタリなMLLMは、オープンソースや医療専門のモデルよりも優れていますが、それでも人間の専門家を追い越しています。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:44:36 GMT)
Thinking While Listening: Simple Test Time Scaling For Audio Classification [61.4] 本稿では,ニューラルネットワークが日常の音を聴きながら"考える"ことを可能にするフレームワークを提案する。
大規模言語モデルの推論能力の最近の進歩により、我々は2つの中心的な疑問に対処する: (i) 既存の音声分類パイプラインに思考を組み込んで、カテゴリ空間での推論を可能にし、パフォーマンスを向上させる方法、(ii) 思考とテストタイムのスケーリングの両方をサポートするために、新しいアーキテクチャをゼロから設計することができるか。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:17:24 GMT)
Threading the Needle: Reweaving Chain-of-Thought Reasoning to Explain Human Label Variation [60.2] 大規模言語モデル(LLM)は最終答を出す前に思考の連鎖(CoT)を生成する。
本稿では,各回答オプションに対するサポート文と反対文を抽出するために,言語的に接頭した談話セグメンタを付加した新しいパイプラインを提案する。
また、正確なスコアよりも回答のランクを優先するランクベースHLV評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:01:02 GMT)
SMLNet: A SPD Manifold Learning Network for Infrared and Visible Image Fusion [60.2] マルチモーダル画像融合のための新しいSPD(対称正定値)多様体学習を提案する。
我々のフレームワークは現在の最先端手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:41:58 GMT)
Mixture of Noise for Pre-Trained Model-Based Class-Incremental Learning [59.6] クラスインクリメンタルラーニング(CIL)は,旧来の知識を維持しつつ,新たなカテゴリを継続的に学習することを目的としている。
バックボーンに軽量な微調整を適用する既存のアプローチは、依然としてドリフトを誘発する。
バックボーン一般化の劣化を軽減し,新しいタスクを適応させることを目的として,Mixture of Noise (Min)を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:22:58 GMT)
EditVerse: Unifying Image and Video Editing and Generation with In-Context Learning [58.5] イメージとビデオの生成と編集を単一のモデルで統合したフレームワークであるEditVerseを紹介する。
テキスト、画像、ビデオなどのすべてのモダリティを統一されたトークンシーケンスとして表現することで、EditVerseは、堅牢なインコンテキスト学習を実現するために自己アテンションを活用する。
多様なタスクや解像度をカバーする命令ベースのビデオ編集のための最初のベンチマークであるEditVerseBenchを紹介する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:59:30 GMT)
Levels of AGI for Operationalizing Progress on the Path to AGI [53.3] 本稿では,人工知能(AGI)モデルとその前駆体の性能と動作を分類する枠組みを提案する。
このフレームワークは、AGIのパフォーマンス、一般性、自律性のレベルを導入し、モデルを比較し、リスクを評価し、AGIへの道筋に沿って進捗を測定する共通の言語を提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:37:50 GMT)
SafeEraser: Enhancing Safety in Multimodal Large Language Models through Multimodal Machine Unlearning [48.4] MLLM(Multimodal Large Language Models)のための安全アンラーニングベンチマークであるSAFEERASERを提案する。
我々は2つの観点から非学習手法を総合的に評価する。
実験により、PD損失と既存の未学習手法を組み合わせることで、過剰な鍛造を効果的に防止できることが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:44:35 GMT)
Long Video Understanding with Learnable Retrieval in Video-Language Models [48.4] 本稿では,学習可能な検索ベースビデオ言語モデル(R-VLM)を提案する。
具体的には、質問(クエリ)と長いビデオから、我々のモデルは最も関連性の高いKビデオチャンクを特定し、選択する。
これにより、ビデオトークンの数を効果的に減らし、ノイズ干渉をなくし、システム性能を高めることができる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:24:43 GMT)
GAF: Gaussian Action Field as a 4D Representation for Dynamic World Modeling in Robotic Manipulation [47.5] 既存のアプローチは、視覚入力から直接アクションを予測するV-A(Vision-to-A)パラダイムや、中間的な3D表現を活用するV-3D-to-A(Vision-to-A)パラダイムに従うのが一般的である。
本稿では,ガウスアクション場(GAF)を介して動作認識4D表現から直接行動推論を可能にするV-4D-Aフレームワークを採用する。
実験では、+11.5385 dB PSNR、+0.3864 SSIM、-0.5574 LPIPSの改善を達成し、平均+7.3%の成功を上げた。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:17:18 GMT)
PersONAL: Towards a Comprehensive Benchmark for Personalized Embodied Agents [47.4] PersONALは、Embodied AIのパーソナライゼーションを研究するためのベンチマークである。
HM3Dデータセットから、30以上のフォトリアリスティックな家庭に2,000以上の高品質なエピソードを収録する。
ベンチマークでは,(1)見えない環境でのアクティブナビゲーション,(2)マップされたシーンでのオブジェクトグラウンドの2つの評価モードがサポートされている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:39:16 GMT)
Propagation of Chaos in One-hidden-layer Neural Networks beyond Logarithmic Time [46.2] 本稿では,a-width ニューラルネットワークの力学と無限幅ニューラルネットワークとの近似ギャップについて検討する。
平均場力学によって支配される微分方程式を通して、この近似ギャップを厳密に束縛する方法を実証する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:21:03 GMT)
Benchmarking Contextual and Paralinguistic Reasoning in Speech-LLMs: A Case Study with In-the-Wild Data [46.1] 音声-LLMは、書き起こしや翻訳といったタスクにおいて顕著なパフォーマンスを示してきたが、社会的および感情的な知性に不可欠な音声のパラ言語的側面を理解することにはまだ限界がある。
文脈パラ言語推論における音声LLMの評価のためのベンチマークであるCP-Benchを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:32:29 GMT)
White-Basilisk: A Hybrid Model for Code Vulnerability Detection [45.0] 我々は、優れた性能を示す脆弱性検出の新しいアプローチであるWhite-Basiliskを紹介する。
White-Basiliskは、パラメータ数2億の脆弱性検出タスクで結果を得る。
この研究は、コードセキュリティにおける新しいベンチマークを確立し、コンパクトで効率的に設計されたモデルが、特定のタスクにおいてより大きなベンチマークよりも優れているという実証的な証拠を提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:51:16 GMT)
Augmenting Multi-Agent Communication with State Delta Trajectory [44.7] 本稿では,自然言語トークンとトークン単位の状態遷移の両方をエージェントから別のエージェントに転送する新しい通信プロトコルを提案する。
それぞれのトークンを生成した後のLSMの状態変化のシーケンスは、推論プロセスの裏側に隠された情報をよりよく反映できることがわかった。
実験の結果,SDEを用いたマルチエージェントシステムでは,他の通信プロトコルと比較してSOTAの性能が向上していることがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:27:14 GMT)
A Set of Generalized Components to Achieve Effective Poison-only Clean-label Backdoor Attacks with Collaborative Sample Selection and Triggers [44.5] クリーンラベルのバックドアアタックは、ラベルを変更することなく単にデータセットを中毒させることで、攻撃者が望んだ振る舞いをDNNに隠密に注入することを目的としている。
バックドアを効果的に埋め込むため、攻撃成功率(ASR)とステルスネスの様々な攻撃要件に対して複数のテキストブラガーが提案されている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:58:31 GMT)
U-Mamba2-SSL for Semi-Supervised Tooth and Pulp Segmentation in CBCT [44.4] U-Mamba2モデルに基づく新しい半教師付き学習フレームワークであるU-Mamba2-SSLを提案する。
U-Mamba2-SSLは平均スコア0.872とDSC0.969を検証データセットで達成した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:19:33 GMT)
Uncovering Graph Reasoning in Decoder-only Transformers with Circuit Tracing [44.1] 基本デコーダのみの変換器をセットし,回路トラクサフレームワークを用いてそれらを説明する。
我々は、推論トレースを可視化し、トークンのマージと構造記憶という2つのコアメカニズムを識別する。
本研究は,デコーダのみの変換器の構造的推論を理解するための統合的解釈可能性フレームワークを提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:25:05 GMT)
Understanding-in-Generation: Reinforcing Generative Capability of Unified Model via Infusing Understanding into Generation [44.0] 統一モデル(UiG)のための新しい推論フレームワークを提案する。
UiGの中核となる洞察は、推論過程において強力な理解能力によって生成誘導を統合することである。
我々のUiGフレームワークは,既存のテキスト・ツー・イメージ推論手法に比べて,テキスト・ツー・イメージ生成の性能が大幅に向上したことを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:22:07 GMT)
Causal Understanding by LLMs: The Role of Uncertainty [43.9] 近年の論文では、LLMは因果関係分類においてほぼランダムな精度を達成している。
因果的事例への事前曝露が因果的理解を改善するか否かを検討する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:06:35 GMT)
MechStyle: Augmenting Generative AI with Mechanical Simulation to Create Stylized and Structurally Viable 3D Models [41.9] 本稿では、3Dプリント可能なモデルのスタイリングを可能にするシステムであるMechStyleを紹介する。
MechStyleは、Finite Element Analysis (FEA)シミュレーションからフィードバックを得て、ジェネレーティブAIベースのスタイリングプロセスを拡張することで、これを達成している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:24:25 GMT)
Examining the robustness of Physics-Informed Neural Networks to noise for Inverse Problems [40.5] 逆問題の解法におけるPINNの性能を有限要素法と数値法を組み合わせた従来の手法と比較する。
PINNは人間の努力や専門知識を少なくするが、従来の手法では優れていた。
ノイズの多い逆問題におけるPINNの性能がより競争力のあるものになれば,トレーニング中の一般的な障害に対処できる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:48:01 GMT)
C$^2$MIL: Synchronizing Semantic and Topological Causalities in Multiple Instance Learning for Robust and Interpretable Survival Analysis [40.5] グラフベースのMultiple Instance Learning (MIL)は、ヘマトキシリンとEosin(H&E)による全スライド画像(WSI)の生存分析に広く用いられている。
染色と走査のバリエーションは意味バイアスをもたらすが、因果関係に関係のないトポロジカルな部分グラフはノイズを引き起こすことがある。
両因果グラフに基づくMILモデルC$2$MILを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:17:39 GMT)
Language Model Evolutionary Algorithms for Recommender Systems: Benchmarks and Algorithm Comparisons [40.5] 大規模言語モデル(LLM)は進化アルゴリズム(EA)の機能を大幅に強化した
本稿では,LLM ベースの EA の性能評価を行うベンチマーク問題セット RSBench を提案する。
確立されたEAフレームワークに基づく3つのLCMベースのEAを開発し、RSBenchを用いてその性能を実験的に評価する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:12:51 GMT)
APRIL: Active Partial Rollouts in Reinforcement Learning to Tame Long-tail Generation [40.1] 強化学習(RL)は、大規模事前訓練言語モデル(LLM)の進展の基盤となっている。
強化学習におけるアクティブ部分ロールアウト(APRIL)を提案する。
APRILは一般的なRLアルゴリズムで、ロールアウトスループットを少なくとも44%改善する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:43:41 GMT)
Adaptive Model Ensemble for Continual Learning [39.9] 本稿では,メタウェイト・アンサンブラを用いて,連続学習のための異なるタスクの知識を適応的に融合させる手法を提案する。
メタウェイトアンサンブラは,破滅的な忘れ事の達成と最先端のパフォーマンスを効果的に軽減することを示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:01:49 GMT)
Scan-do Attitude: Towards Autonomous CT Protocol Management using a Large Language Model Agent [39.7] プロトコル構成要求の解釈と実行を支援するために,LLM(Large Language Model)ベースのエージェントフレームワークが提案されている。
このエージェントは、コンテキスト内学習、命令フォロー、構造化ツールコール機能を組み合わせて、関連するプロトコル要素を特定し、正確な修正を適用する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:04:11 GMT)
PU-Gaussian: Point Cloud Upsampling using 3D Gaussian Representation [39.2] PU-ガウスアン(PU-Gaussian)は、異方性3次元ガウス分布を用いて各点周辺の局所近傍をモデル化する新しいアップサンプリングネットワークである。
我々はPU1KとPUGANデータセットの広範なテストを行い、PU-Gaussianが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:02:03 GMT)
Towards a user-centric HPC-QC environment [39.1] 量子処理ユニット(QPU)で強化された高性能環境で動作するハイブリッド量子古典プログラムの開発と実行のための,基本的でポータブルな実行環境に向けた進展を示す。
このアプローチは、最近提案されたベンダー中立の量子リソース管理インターフェース(QRMI)上に構築することで、複数のプログラミングソフトウェア開発キット(SDK)を環境の第一級市民として管理することを可能にする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:53:36 GMT)
First-Extinction Law for Resampling Processes [39.1] 平均はバクスターらのライト=フィッシャーの結果とちょうど一致することを証明している。
簡単な自己学習装置でモデル崩壊の予測力を実証する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:26:37 GMT)
VisualMimic: Visual Humanoid Loco-Manipulation via Motion Tracking and Generation [39.0] VisualMimicは、ヒューマノイドロボットのための階層的な全身制御で自我中心のビジョンを統一するビジュアルフレームワークである。
VisualMimicは、シミュレーションで訓練されたビジュモータポリシーを実際のヒューマノイドロボットにゼロショットで転送することを可能にする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:10:02 GMT)
Deciphering Functions of Neurons in Vision-Language Models [39.0] 本研究の目的は、視覚言語モデル(VLM)の内部を探索し、個々のニューロンの機能を理解することである。
入力された視覚トークンやテキストトークンに関してニューロンの活性化を観察し、いくつかの興味深い知見を明らかにした。
我々は、GPT-4oのアシスタントを用いて、ニューロンの説明を自動化するフレームワークを構築した。
視覚ニューロンに対しては,視覚ニューロンに対する説明の信頼性を評価するためのアクティベーションシミュレータを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:14:54 GMT)
Charting a Decade of Computational Linguistics in Italy: The CLiC-it Corpus [38.7] イタリアのCLとNLPコミュニティの研究動向をCLiC-itへの貢献の分析を通じて追跡する。
我々は、CLiC-itカンファレンスの最初の10版からCLiC-it Corpusに手続きをコンパイルする。
我々の目標は、イタリアと国際的な研究コミュニティに、新たなトレンドや重要な発展に関する貴重な洞察を提供することです。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:17:32 GMT)
Multimodal AI predicts clinical outcomes of drug combinations from preclinical data [38.3] マドリガル(Madrigal)は、構造、経路、細胞生存性、転写データから学習し、薬物結合効果を予測するマルチモーダルAIモデルである。
Madrigalは、注意ボトルネックモジュールを使用して、前臨床薬のデータモダリティを統一する。
単一モダリティ法や最先端のモデルより優れており、有害な薬物相互作用を予測する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:32:56 GMT)
Language Models that Think, Chat Better [37.4] 検証可能な報酬(RLVR)を用いた強化学習は、数学やコードなどの検証可能な領域におけるルールベースの報酬を使用することで、言語モデル推論を改善する。
本稿では、RLVRパラダイムが検証可能な領域を超えて有効であることを示し、汎用チャット機能のための**RL****odel-rewarded **T*hinking (**RLMT**)を導入している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:57:34 GMT)
Large AI Model-Enabled Generative Semantic Communications for Image Transmission [37.1] 本稿では,キー領域と非キー領域に分割することで,セマンティックな粒度を改良する,革新的な生成意味コミュニケーションシステムを提案する。
重要な視覚情報を含むキー領域は、画像指向セマンティックエンコーダを用いて処理される。
非キー領域は画像からテキストへのモデリング手法によって効率よく圧縮される。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:46:38 GMT)
A Versatile Foundation Model for AI-enabled Mammogram Interpretation [36.5] VersaMammoは制限を克服するために設計されたマンモグラムの汎用基盤モデルである。
まず,教師モデルは自己教師型学習を用いて学習し,ラベルのないマンモグラムから伝達可能な特徴を抽出する。
そして、教師付き学習と知識蒸留を組み合わせることで、特徴と臨床知識の両方をVersaMammoに転送する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:04:39 GMT)
Rectified Decoupled Dataset Distillation: A Closer Look for Fair and Comprehensive Evaluation [36.4] 本稿では,コンパクトな合成データセットを生成するために,Rectified Decoupled dataset Distillation (RD$3$)を提案する。
RD$3$は、将来のデータセット蒸留研究における公正かつ再現可能な比較の基礎を提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:47:04 GMT)
Multimodal Representation-disentangled Information Bottleneck for Multimodal Recommendation [36.3] 我々はMRdIB(Multimodal Representation-disentangled Information Bottleneck)という新しいフレームワークを提案する。
具体的には,まず,入力表現を圧縮するためにマルチモーダル・インフォメーション・ボトルネックを用いる。
そして,レコメンデーションターゲットとの関係に基づいて,情報をユニークで冗長な,シナジスティックなコンポーネントに分解する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:18:32 GMT)
Culture is Everywhere: A Call for Intentionally Cultural Evaluation [36.2] 文献的文化的評価について論じる: 評価のあらゆる側面に埋め込まれた文化的仮定を体系的に検証するアプローチ。
我々は、現在のベンチマークプラクティスを超えて、意味と今後の方向性について議論する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:02:11 GMT)
AAPO: Enhancing the Reasoning Capabilities of LLMs with Advantage Momentum [36.1] 大規模言語モデル(LLM)の推論能力を高める効果的なアプローチとして強化学習(RL)が登場している。
グループ相対的優位性推定は、値モデルへの依存性を排除したことでかなりの注目を集めている。
本稿では,モーメントに基づく推定手法によって強化された利点を用いて,クロスエントロピー損失を最適化する新しいRLアルゴリズムであるAdvantage-Augmented Policy Optimization (AAPO)を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:47:49 GMT)
To Fold or Not to Fold: Graph Regularized Tensor Train for Visual Data Completion [35.6] データのテンソルを折り畳まないよう検討し、同時にグラフ情報を用いて近隣のエントリ間の局所的類似性を規則化する。
TT完了問題におけるグラフベースの正規化によって引き起こされる高い計算複雑性を克服するため,元の問題を複数のサブプロブレムに分割することを提案する。
合成データと実世界の視覚データの両方を用いた実験は,提案手法の優位性を示している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:57:10 GMT)
LEDiT: Your Length-Extrapolatable Diffusion Transformer without Positional Encoding [35.1] 拡散変換器(DiT)は、トレーニング解像度よりも高い解像度で画像を生成するのに苦労する。
本稿では,この制限を克服するために,Longth-Extrapolatable Diffusion Transformer(LEDiT)を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:48:25 GMT)
How Well Can Reasoning Models Identify and Recover from Unhelpful Thoughts? [35.0] 本研究では,4種類の不愉快な思考から推論モデルがどのように識別し,回復するかを検討する。
モデルは、最も無害な思考を特定するのに効果的であるが、それらが思考プロセスに注入されると、同じ思考から回復することが困難であることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:39:44 GMT)
Instruction Boundary: Quantifying Biases in LLM Reasoning under Various Coverage [34.2] 大規模言語モデル(LLM)推論は長年、ドメイン間の問題解決の強力なツールとみなされてきた。
バイアスのあるプロンプトや不完全なプロンプトを — しばしば意図せずに — 提供できるため、LLMは誤解され、信頼性が損なわれ、リスクが生じる可能性がある。
BiasDetectorは、3つの命令タイプから生じるバイアスを測定するフレームワークである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:15:26 GMT)
Do You Need Proprioceptive States in Visuomotor Policies? [33.9] 模倣学習に基づくビジュモータポリシーはロボット操作に広く用いられている。
本研究では,視覚的観察にのみ条件付き動作を予測し,自己受容的状態入力を除去する「状態自由政策」を提案する。
実証的な結果から、国家自由政策は国家基本政策よりもはるかに強力な空間一般化を実現することが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:38:56 GMT)
DSA, AIA, and LLMs: Approaches to conceptualizing and auditing moderation in LLM-based chatbots across languages and interfaces in the electoral contexts [33.7] 大規模言語モデルの検索エンジンへの統合は、これらのオンラインエンティティによって出力されるコンテンツの管理、評価、精査に新たな課題をもたらす。
まず、LLMベースのチャットボットとモデレーションの概念をシチュレートできる規制環境について調査する。
我々は、2024年の欧州議会選挙と2024年のアメリカ合衆国大統領選挙の文脈において、コパイロット、チャットGPT、ジェミニを10言語にわたって調査した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:38:16 GMT)
Video models are zero-shot learners and reasoners [33.7] Veo 3は、明示的にトレーニングされていないさまざまなタスクを解決できます。
Veoの創発的なゼロショット機能は、ビデオモデルが統一された一般的なビジョン基盤モデルへの道のりにあることを示している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:17:27 GMT)
PerFace: Metric Learning in Perceptual Facial Similarity for Enhanced Face Anonymization [33.7] 本稿では,人間の知覚に基づく顔類似度尺度を提案し,その類似度を予測するために6,400のトリプルトアノテーションとメートル法学習のデータセットを作成する。
実験の結果,既存手法に比べて顔類似度予測と属性に基づく顔分類の双方において顕著な改善が認められた。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:15:43 GMT)
To Trust Or Not To Trust Your Vision-Language Model's Prediction [32.3] 我々は,VLMの予測をいつ信頼できるかを推定する課題に対処する,トレーニング不要なフレームワークTrustVLMを紹介した。
観測されたVLMのモダリティギャップに触発されて,この空間を利用して誤分類検出を改善する新しい信頼度スコアリング関数を提案する。
4つのアーキテクチャと2つのVLMを使用して、17の多様なデータセットにまたがるアプローチを厳格に評価し、最先端のパフォーマンスを実証します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:40:31 GMT)
GemDetox at TextDetox CLEF 2025: Enhancing a Massively Multilingual Model for Text Detoxification on Low-resource Languages [32.2] PAN 2025 Multilingual Text Detoxification Challengeについて述べる。
パラメータ効率のよいLoRA SFT微調整を施し、少数ショットやチェーン・オブ・サートのような技法を推し進める。
当社のシステムは、まず、高リソースおよび低リソース言語にランク付けする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:06:40 GMT)
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models [32.0] CoT(Chain-of- Thought)は、大規模言語モデル(LLM)の能力を普遍的に改善することが期待される。
テスト時間計算のスケーリングに対する推論をインセンティブ化することで,複雑な命令を扱う上でのLLMを向上する体系的手法であるRAIFを提案する。
より優れたCoT施行のためのサンプルワイドコントラストによる複雑な指示の下での推論の浅く、重要でない性質に対処する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:19:59 GMT)
Benchmarking Gaslighting Attacks Against Speech Large Language Models [31.8] 我々は、ガスライティング攻撃、戦略的に構築されたプロンプトを導入し、モデル推論を誤解させたり、覆ったり、歪んだりする。
具体的には、Anger、Cognitive Disruption、Sarcasm、Implicit、Professional Negationの5つの操作戦略を構築します。
我々のフレームワークは、無言の謝罪や拒絶など、パフォーマンス劣化と行動応答の両方を捉えています。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:57:10 GMT)
Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models [31.8] ロングフォームな書記エージェントは情報検索、推論、合成において柔軟な統合と相互作用を必要とする。
本稿では,人間ライクな適応記述を実現する汎用エージェントフレームワークWriteHEREを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:56:18 GMT)
Feeding Two Birds or Favoring One? Adequacy-Fluency Tradeoffs in Evaluation and Meta-Evaluation of Machine Translation [31.5] 評価レベルでは、このトレードオフの深刻さを示し、人気のあるメトリクスがどこにあるかを分析します。
We found that the standard WMT meta-evaluation favors adequacy-oriented metrics than fluency-oriented。
このバイアスを制御するために,メタ評価において翻訳システムを合成する手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:21:37 GMT)
Closed-loop control of seizure activity via real-time seizure forecasting by reservoir neuromorphic computing [31.5] リアルタイムにパーソナライズされたフリーラン刺激を駆動できるニューロモルフィック貯水池コンピューティングハードウェアシステムを提案する。
このシステムは、トレーニング期間中の発作発生を予測する際に、83.33%の精度を達成する。
本研究は, パーソナライズされたDRE治療のための次世代神経調節戦略としてのニューロモルフィックシステムの可能性を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:08:10 GMT)
MNV-17: A High-Quality Performative Mandarin Dataset for Nonverbal Vocalization Recognition in Speech [31.4] 我々は、7.55時間のマンダリン音声データセットであるMNV-17を紹介する。
モデルベース検出に依存する既存のコーパスとは異なり、MNV-17の性能特性は高忠実で明瞭なNVインスタンスを保証する。
4つの主要なASRアーキテクチャでMNV-17をベンチマークし、意味転写とNV分類の併用性能を評価した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:45:14 GMT)
Safe-SAIL: Towards a Fine-grained Safety Landscape of Large Language Models via Sparse Autoencoder Interpretation Framework [31.3] 大規模言語モデル(LLM)内でのSAE機能を解釈するフレームワークであるSafe-SAILを提案する。
提案手法は,SAEを最も優れた概念特異的解釈可能性で体系的に識別し,安全性関連ニューロンを説明し,解釈プロセスをスケールアップするための効率的な戦略を導入する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:58:59 GMT)
CamPVG: Camera-Controlled Panoramic Video Generation with Epipolar-Aware Diffusion [31.0] CamPVGは、正確なカメラポーズによってガイドされるパノラマビデオ生成のための初めての拡散ベースのフレームワークである。
球面投影に基づくパノラマ画像とクロスビュー特徴集計のためのカメラ位置符号化を実現する。
提案手法は,パノラマ映像生成における既存の手法をはるかに超え,カメラトラジェクトリーと整合した高品質なパノラマ映像を生成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:34:24 GMT)
A Framework for Situating Innovations, Opportunities, and Challenges in Advancing Vertical Systems with Large AI Models [30.4] 大規模なAIモデルは、医療、教育、法律など、高度な分野に展開されている。
これらの課題は、モデルの能力と現実世界のアプリケーションのニーズを整合させるために、学際的な革新を必要とします。
我々は,ユーザの要求を満たすためのイノベーションを階層的に抽象化することで,このギャップに対処するフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:34:51 GMT)
MazeMate: An LLM-Powered Chatbot to Support Computational Thinking in Gamified Programming Learning [30.3] 計算思考(CT)は基礎的な問題解決技術であり、ゲーミフィケーションプログラミング環境はそれを栽培するための広く採用されているアプローチである。
LLMはオンデマンドのプログラミングサポートを提供するが、現在のアプリケーションはCT開発を促進することは滅多にない。
迷路解法や迷路設計において,CTプロセスに適合した適応的,文脈に敏感な足場を提供するMazeMateを提案する。
学生は,MazeMateを適度に役に立つものと評価し,迷路設計よりも迷路解決に有用と認識された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:25:19 GMT)
WEST: LLM based Speech Toolkit for Speech Understanding, Generation, and Interaction [30.3] Westは、音声理解、生成、相互作用のための大規模言語モデル(LLM)に基づく音声ツールキットである。
認識、合成、理解、対話、マルチモーダル機能といったタスクをサポートする。
Westは2種類のレシピ、モデル、実験結果を提供している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:56:32 GMT)
Representation Convergence: Mutual Distillation is Secretly a Form of Regularization [30.1] 我々は、強化学習政策間の相互蒸留が暗黙の正則化となることを論じる。
我々は,無関係な特徴に対するポリシーの堅牢性の向上が一般化性能の向上につながることを初めて証明した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:52:43 GMT)
Intuition to Evidence: Measuring AI's True Impact on Developer Productivity [30.0] 本稿では,企業規模でのAI支援ソフトウェア開発ツールの総合的実環境評価について述べる。
1年以上にわたり、複数のチームにわたる300人のエンジニアが、コード生成と自動レビュー機能を組み合わせた社内AIプラットフォーム(DeputyDev)を統合した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:34:11 GMT)
V-GameGym: Visual Game Generation for Code Large Language Models [29.7] V-GameGymは100のテーマクラスタにわたる2,219の高品質なサンプルからなる総合的なベンチマークである。
視覚的コード合成のためのLLM駆動パイプラインを自動化したマルチモーダル評価フレームワークを提案する。
解析の結果,V-GameGymはコード生成精度と実用的なゲーム開発とのギャップを効果的に埋めることがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:01:18 GMT)
Langevin Unlearning: A New Perspective of Noisy Gradient Descent for Machine Unlearning [28.8] プライバシは、スクラッチから再トレーニングするための統計的不明瞭さとして定義される。
勾配勾配に基づくアンラーニングフレームワークであるランゲヴィン・アンラーニングを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:50:24 GMT)
Queryable 3D Scene Representation: A Multi-Modal Framework for Semantic Reasoning and Robotic Task Planning [28.8] 3D Queryable Scene Representation(3D QSR)は、3つの補完的な3D表現を統合するマルチメディアデータ上に構築されたフレームワークである。
オブジェクト中心の設計に基づいて構築されたこのフレームワークは、意味的なクエリビリティを実現するために、大きな視覚言語モデルと統合されている。
その結果,シーン理解の促進と空間的および意味的推論の統合が,フレームワークの持つ能力を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:53:32 GMT)
Equip Pre-ranking with Target Attention by Residual Quantization [28.5] TARQは、産業レコメンデーションシステムのための新しいプレグレードのフレームワークである。
当社のモデルは本番環境に完全にデプロイされており、毎日数千万人のアクティブユーザが利用しています。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:26:28 GMT)
SceneWeaver: All-in-One 3D Scene Synthesis with an Extensible and Self-Reflective Agent [28.1] SceneWeaverは、ツールベースの反復改善を通じて多様なシーン合成パラダイムを統合するフレームワークである。
セマンティックな矛盾を特定し、ターゲットとするツールを呼び出し、連続したイテレーションで環境を更新できる。
多様な指示で複雑なシーンを効果的に一般化し、汎用的な3D環境生成への一歩を踏み出した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:06:41 GMT)
Online Language Splatting [28.1] 3DGS-SLAMシステム内で、オンライン、ほぼリアルタイムでオープン語彙の言語マッピングを実現するための最初のフレームワークであるOnline Language Splattingを紹介する。
我々のオンライン手法は最先端のオフライン手法を精度良く超え,40倍以上の効率向上を実現している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:17:15 GMT)
Learning to Bid Optimally and Efficiently in Adversarial First-price Auctions [27.5] 我々は,$widetildeO(sqrtT)$ regretを達成する,最初のミニマックス最適オンライン入札アルゴリズムを開発した。
Verizon Mediaから得られた3つの実世界の1価オークションデータセットを用いて,本アルゴリズムを検証した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:52:27 GMT)
RadialRouter: Structured Representation for Efficient and Robust Large Language Models Routing [27.5] Radialは、大規模言語モデルのルーティングのための新しいフレームワークである。
RadialFormerという名前のラジアル構造を持つ軽量なTransformerベースのバックボーンを使用して、クエリとLLMの関係を明確にする。
バランシングとコストファーストのシナリオでは、既存のルーティングメソッドの9.2%と5.8%を大きく上回っている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:02:55 GMT)
The Iterative Chainlet Partitioning Algorithm for the Traveling Salesman Problem with Drone and Neural Acceleration [27.5] ドローンによるトラベリングセールスマン問題(TSP-D)を解決するための反復連鎖分割(ICP)アルゴリズムとそのニューラルアクセラレーションについて紹介する。
ICPは、従来の最先端アルゴリズムよりも平均2.6%のソリューション品質向上を実現し、計算時間を91.3%削減した。
ICPと比較して、NICPは計算時間を28.6%削減し、目的関数値の増大は0.14%に制限される。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:42:20 GMT)
Z-Scores: A Metric for Linguistically Assessing Disfluency Removal [27.1] Zスコア(Z-Scores)は、異なる不フルエンシタイプにまたがるシステムの振る舞いを分類する、言語学的に座屈した評価指標である。
我々の決定論的アライメントモジュールは、単語レベルのメトリクスが曖昧であるような体系的な弱点を明らかにすることができる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:02:39 GMT)
Deep learning for exoplanet detection and characterization by direct imaging at high contrast [26.4] 高コントラストで多変量画像系列を劣化させるニュアンス成分のマルチスケール統計モデルを提案する。
VLT/SPHERE計のデータに応用すると、検出感度とアストロメトリおよび光度推定の精度が大幅に向上する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:43:28 GMT)
Unsupervised Domain Adaptation with an Unobservable Source Subpopulation [26.1] 我々は、ソースドメインがバイナリラベル$Y$とバイナリ背景(または環境)$A$で定義されたサブポピュレーションから構成される教師なしドメイン適応問題について検討する。
我々は、ソースドメイン内のそのようなサブポピュレーションが観測不可能な、困難な設定に焦点を当てる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:00:49 GMT)
TianHui: A Domain-Specific Large Language Model for Diverse Traditional Chinese Medicine Scenarios [26.1] 本研究は、文脈データ統合とドメイン知識融合によって構築された特殊TCM LLMであるTianHuiについて述べる。
大規模TCMコーパス(0.97GBの教師なしデータ+611,312のQAペア)を構築し、QRA、DeepSpeed Stage 2、Flash Attention 2による2段階トレーニング戦略を採用した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:26:21 GMT)
Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with Large Language Models [25.8] 時間グラフニューラルネットワーク(TGNN)は時間グラフモデリングにおいて顕著な性能を示した。
TTAGモデリングのための既存のTGNNをシームレスに拡張するフレキシブルなフレームワークである textbfCROSS を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:41:11 GMT)
Enhancing Crash Frequency Modeling Based on Augmented Multi-Type Data by Hybrid VAE-Diffusion-Based Generative Neural Networks [25.8] 衝突頻度モデリングにおける重要な課題は、過剰なゼロ観測の頻度である。
我々は、ゼロ観測を減らすために、ハイブリッドなVAE拡散ニューラルネットワークを提案する。
我々は、類似性、正確性、多様性、構造的整合性といった指標を用いて、このモデルによって生成された合成データ品質を評価する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:54:44 GMT)
LAMA-UT: Language Agnostic Multilingual ASR through Orthography Unification and Language-Specific Transliteration [25.7] 正書法統一とLAMA-UT(Language-Agnostic Multilingual ASR Pipeline)による言語に依存しないASRパイプラインを提案する。
LAMA-UTは、最小限のデータ量でトレーニングされた最先端モデルのパフォーマンスに適合しながら、言語固有のモジュールなしで動作します。
パイプラインはWhisperと比較して45%の相対誤差低減率を実現し,MMSと相容れない性能を示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:24:43 GMT)
MMG: Mutual Information Estimation via the MMSE Gap in Diffusion [25.7] 相互情報(MI)は、確率変数間の関係を測る最も一般的な方法の1つである。
拡散モデルのデノイングは、密度推定のための新しいバーを最近設定した。
拡散モデルを用いてMIを推定できることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:04:48 GMT)
Challenges and Trends in Egocentric Vision: A Survey [25.6] エゴセントリックな視覚は、人間の体に装着されたカメラやセンサーを通して、視覚的およびマルチモーダルなデータをキャプチャする。
本稿では,自我中心の視覚理解に関する研究を包括的に調査する。
最新の進歩を要約することで、拡張現実、バーチャルリアリティ、エンボディドインテリジェンスといった分野において、エゴセントリックなビジョン技術の幅広い応用が期待できる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:38:29 GMT)
CIFLEX: Contextual Instruction Flow for Sub-task Execution in Multi-Turn Interactions with a Single On-Device LLM [25.5] 単一オンデバイス大規模言語モデル(LLM)を用いたマルチターンインタラクションにおいて,効率的なサブタスク処理のための新しい実行方式を提案する。
我々は、小規模モデルに適した階層的な分類戦略を開発し、複数選択決定をバイナリモデルに分解する。
実験により、CIFLEXはタスク性能を劣化させることなく計算コストを大幅に削減し、デバイス上でスケーラブルで効率的なマルチタスク対話を可能にした。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:20:47 GMT)
RAR$^2$: Retrieval-Augmented Medical Reasoning via Thought-Driven Retrieval [25.4] 大きな言語モデル(LLM)は、様々な医療ベンチマークで有望なパフォーマンスを示している。
RAGは、外部医療情報を取り入れることで、知識ギャップと幻覚を緩和するための重要なアプローチとして登場した。
我々は、Reasoning-Augmented RetrievalとRetrieval-Augmented Reasoningを改善する共同学習フレームワークであるRAR$2$を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:35:57 GMT)
One Filters All: A Generalist Filter for State Estimation [25.2] 我々は,大規模言語モデル (LLM) を利用して状態推定を行う汎用フィルタリングフレームワーク textbfLLM-Filter を提案する。
まず、状態推定は、事前学習されたLLMに埋め込まれた推論知識の恩恵を受けることができる。
これらのプロンプトによって導かれ、LLM-Filterは例外的な一般化を示し、変化した環境や目に見えない環境で正確にフィルタリングタスクを実行することができる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:19:18 GMT)
Neural Networks as Surrogate Solvers for Time-Dependent Accretion Disk Dynamics [25.1] 降着円盤は天体物理学においてユビキタスであり、惑星形成系からX線双対や活動銀河核まで多様な環境に現れる。
伝統的に、それらの力学をモデル化するには、計算集約的な(磁気)流体力学シミュレーションが必要である。
近年,物理情報ニューラルネットワーク(PINN)が有望な代替手段として登場している。
我々は,非自己重力降着円盤の2次元時間依存流体力学を解くためのPINNを初めて実証した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:01:04 GMT)
Unleashing the Potential of the Semantic Latent Space in Diffusion Models for Image Dehazing [25.1] DiffLI$2$Dという画像デハジングのための拡散遅延インスパイアネットワークを提案する。
まず、事前学習した拡散モデルのセマンティック潜時空間が、画像の内容とヘイズ特性を表現することができることを明らかにした。
異なる時間ステップでの拡散遅延表現を繊細に設計したデハジングネットワークに統合し、画像デハジングの指示を与える。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:11:37 GMT)
LLMs for Bayesian Optimization in Scientific Domains: Are We There Yet? [25.1] 大規模言語モデル (LLM) は実験設計のための汎用エージェントとして提案されている。
本仮説は, 遺伝的摂動および分子特性探索に応用したオープンソースとクローズドソースのLLMを用いて評価する。
LLMをベースとしたエージェントは、実験的なフィードバックに敏感ではなく、実結果をランダムに置換したラベルに置き換えることは、性能に影響を与えない。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:50:17 GMT)
EDBench: Large-Scale Electron Density Data for Molecular Modeling [24.9] 電子密度(ED)$rho(r)$は、対話型多粒子系のすべての基底状態特性を決定する。
EDBenchは、電子規模の学習ベースの研究を促進するために設計されたEDの大規模で高品質なデータセットである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:45:47 GMT)
UnifiedRL: A Reinforcement Learning Algorithm Tailored for Multi-Task Fusion in Large-Scale Recommender Systems [24.6] MTF(Multi-Task Fusion)は、Multi-Task Learning(MTL)モデルによって出力される複数のスコアを最終スコアに組み合わせ、ユーザの満足度を最大化する。
近年,長期ユーザ満足度を最適化するために,強化学習(Reinforcement Learning, RL)がRSのMSFに使用されている。
大規模RSにおけるMTFに適したUnifiedRLという革新的な手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:35:43 GMT)
Current and Future Directions for Responsible Quantum Technologies: A ResQT Community Perspective [24.6] ResQT(Responsible Quantum Technologies)コミュニティは、様々な分野の知識、視点、ベストプラクティスを共有するために設立された。
その使命は、QT開発が倫理原則と整合し、エクイティを促進し、意図しない結果をもたらすことを保証することである。
本稿では,ResQTコミュニティの現状と今後の方向性について概説する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:53:25 GMT)
Towards the Identifiability in Noisy Label Learning: A Multinomial Mixture Modelling Approach [24.6] 本稿では,雑音ラベル(LNL)から学習する新しいデータ駆動型手法を提案する。
そこで本研究では,最寄りの周辺部から追加の雑音ラベルを自動生成する手法を提案する。
提案手法は,合成,Web制御,実世界のデータセットを含む,さまざまなラベルノイズベンチマークにおいて,クリーンなラベルを正確に推定する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:55:45 GMT)
FoMo-0D: A Foundation Model for Zero-shot Tabular Outlier Detection [24.4] FoMo-0Dは、表データの0/0ショットODのための事前訓練されたファンデーションモデルである。
パラメータを微調整することなく、テストサンプルの(より低い/より低い)ラベルを直接予測できる。
57の実世界のデータセットに対する実験は、FoMo-0Dが非常に競争力があることを示している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:42:57 GMT)
Enhancing Targeted Adversarial Attacks on Large Vision-Language Models via Intermediate Projector [24.4] ブラックボックスの敵攻撃は特に大型ビジョンランゲージモデル(VLM)に深刻な脅威をもたらす
本稿では,プロジェクタを利用した新たなブラックボックスターゲットアタックフレームワークを提案する。
具体的には、グローバルな画像埋め込みをきめ細かなクエリ出力に変換する、広く採用されているクエリ変換器(Q-Former)を利用する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:02:50 GMT)
You Only Measure Once: On Designing Single-Shot Quantum Machine Learning Models [24.4] You Only Measure Once (Yomo) は、劇的に少ない測定で正確な推論を実現する設計である。
理論解析により,Yomoは期待モデルに固有のショットスケーリング制限を回避していることがわかった。
正確な単発推論を可能にすることで、YomoはQMLをデプロイする際の金銭的および計算的コストを大幅に削減する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:08:20 GMT)
Human-Interpretable Uncertainty Explanations for Point Cloud Registration [24.3] 我々は,登録の不確実性を定量化し,それを説明する新しいアプローチであるGaussian Process Concept Attribution(GP-CA)を開発した。
GP-CAを3つの公開データセットと実世界のロボット実験で検証した。
我々のビデオはまた、GP-CAが効果的な障害回復行動を可能にし、より堅牢なロボット知覚をもたらすことを実証している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:40:17 GMT)
Alignment-Sensitive Minimax Rates for Spectral Algorithms with Learned Kernels [24.3] 我々は、アライメントに敏感な複雑性尺度である有効スパンディメンション(ESD)を導入する。
ESDが少なくとも$K$のシーケンスモデルでは、ミニマックス超過リスクは$sigma2K$とスケールする。
この発見は、適応的特徴学習とスペクトルアルゴリズムの一般化における証明可能な改善との関連性を確立する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:28:08 GMT)
Do Code Semantics Help? A Comprehensive Study on Execution Trace-Based Information for Code Large Language Models [24.1] コードLLMの教師付き微調整(SFT)と位相後推論におけるトレースベースセマンティック情報の有用性について検討する。
実験結果は従来の研究と驚くほど異なっており、意味情報がコードLLMのSFTおよびテスト時間スケーリングに限られた有用性を持っていることを実証している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:06:41 GMT)
On the Integration of Spatial-Temporal Knowledge: A Lightweight Approach to Atmospheric Time Series Forecasting [24.1] 複雑建築における時空間知識統合の有効性を強調し,大気時系列予測(ATSF)の新たな知見を提供する。
10kパラメータと1時間のトレーニングにより、STELLAは他の高度なメソッドと比較して、5つのデータセットで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:41:57 GMT)
Myosotis: structured computation for attention like layer [23.2] メモリと計算のスケールを シーケンスの長さで2倍にします
両概念の利点を組み合わせた新しいアルゴリズムを提案する。
我々の考えは、木構造行列の効率的な反転に基づいている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:26:38 GMT)
Multi-Agents are Social Groups: Investigating Social Influence of Multiple Agents in Human-Agent Interactions [23.0] 我々は,AIエージェントの集団が,ユーザに対して同意を求める社会的プレッシャーを生じさせるかどうかを検討する。
その結果、複数のエージェントと会話することで、参加者が感じた社会的プレッシャーが増すことがわかった。
本研究は, 単一エージェントプラットフォームに対するマルチエージェントシステムの潜在的利点が, 意見変化を引き起こす可能性を示唆している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:34:53 GMT)
Structure As Search: Unsupervised Permutation Learning for Combinatorial Optimization [22.5] 本稿では,トラベリングセールスマン問題に対する非自己回帰的枠組みを提案する。
ハミルトンサイクルに類似性変換を適用することにより、モデルは連続緩和を通じて置換を近似することを学ぶ。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:36:27 GMT)
SynchroRaMa : Lip-Synchronized and Emotion-Aware Talking Face Generation via Multi-Modal Emotion Embedding [22.5] SynchroRaMaは、テキストと音声の感情信号を組み合わせることで、マルチモーダルな感情埋め込みを統合する新しいフレームワークである。
SynchroRaMaにはオーディオ・トゥ・モーション(A2M)モジュールが含まれており、入力されたオーディオに合わせてモーションフレームを生成する。
ベンチマークデータセットの実験では、SynchroRaMaが最先端よりも優れていることが示されている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:21:29 GMT)
Do Before You Judge: Self-Reference as a Pathway to Better LLM Evaluation [22.4] LLM-as-Judgeフレームワークは、AI評価でますます人気がある。
モデルの生成と判断能力の関係に関する研究結果は相容れないままである。
本稿では,モデル自身の回答を参照として活用する自己参照型評価戦略を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:32:45 GMT)
CHOIR: A Chatbot-mediated Organizational Memory Leveraging Communication in University Research Labs [22.4] CHOIRは、ドキュメントベースQ&A、フォローアップディスカッションのためのQ&A共有、会話からの知識抽出、AI支援ドキュメント更新の4つの重要な機能を通じて、組織記憶をサポートする。
私たちはCHOIRを4つの研究室に1ヶ月間展開しました。そこでは、ラボのメンバーが107の質問をし、ラボのディレクターが組織の記憶の中で38回ドキュメントを更新しました。
質問はプライベートに質問され、ドキュメントのギャップへの監督の視認性が制限された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:35:28 GMT)
Do Bias Benchmarks Generalise? Evidence from Voice-based Evaluation of Gender Bias in SpeechLLMs [22.2] 特定のMCQA動作を誘導するために,LoRAアダプタを用いて3つのSpeechLLMを微調整する。
我々は、これらの振る舞いが別のMCQAベンチマークに一般化するかどうかを評価し、より重要なのは、長文で創造的なタスクである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:16:59 GMT)
Every Character Counts: From Vulnerability to Defense in Phishing Detection [22.1] 組織と個人の両方をターゲットにしたフィッシング攻撃は、ますます重大な脅威になりつつある。
現在の自動検出法は、しばしば新しいフィッシング攻撃を検出するための説明性や堅牢性を欠いている。
本研究では,フィッシング検出における文字レベル深層学習モデルの有効性について検討する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:03:30 GMT)
The 2020 United States Decennial Census Is More Private Than You (Might) Think [22.0] 2020年の米国国勢調査は、その名目上の保証が示すよりもはるかに強力なプライバシー保護を提供している。
ノイズのばらつきを15.08%$から24.82%$に減らし、地理的レベルごとにほぼ同じレベルのプライバシー保護を維持できることを示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:32:50 GMT)
No Encore: Unlearning as Opt-Out in Music Generation [21.7] 本稿では,創造的コンテンツの不注意な使用を防ぐために,機械学習技術の初回適用に関する予備的結果を示す。
モデル性能を損なうことなく、未学習の事前学習データセットにおけるそれらの有効性を分析する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 00:07:25 GMT)
X-Part: high fidelity and structure coherent shape decomposition [21.1] X-Partは、総合的な3Dオブジェクトを意味論的に意味のある部分に分解するために設計された制御可能な生成モデルである。
X-Partは、部分生成のプロンプトとしてバウンディングボックスを使用し、意味のある分解のためにポイントワイドなセマンティック特徴を注入する。
この研究は、プロダクション対応、編集可能、構造的に健全な3Dアセットを作成するための新しいパラダイムを確立します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:57:21 GMT)
Rethinking Pulmonary Embolism Segmentation: A Study of Current Approaches and Challenges with an Open Weight Model [21.0] 3Dモデルは、塞栓の形態的特徴から、この課題に特に適している。
CNNベースのモデルは一般的に、PEセグメンテーションにおけるVTベースのモデルよりも優れたパフォーマンスが得られる。
一方、タスクの複雑さと高品質なデータセットの不足のため、遠位塞栓は難しいままである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:07:54 GMT)
HiCoLoRA: Addressing Context-Prompt Misalignment via Hierarchical Collaborative LoRA for Zero-Shot DST [20.9] Zero-shot Dialog State Tracking (zs-DST)は、タスク指向のダイアログシステム(TOD)がコストのかかるデータアノテーションなしで新しいドメインに一般化できるようにするために必須である。
HiCoLoRAは、堅牢なプロンプトアライメントを通じてゼロショットスロット推論を強化するフレームワークである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:44:16 GMT)
SDE-DET: A Precision Network for Shatian Pomelo Detection in Complex Orchard Environments [20.6] ポメロ検出は、そのローカライゼーション、自動化されたロボット収穫、成熟度分析に欠かせないプロセスである。
本研究では、カスタムデータセットを構築し、シャチのポメロ検出のためのSDE-DETモデルを提案する。
実験の結果、SDE-DETはシャチのポメロ検出の信頼性の高い方法を提供し、自動収穫ロボットのさらなる開発の基礎を築いた。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:50:44 GMT)
Expanding the WMT24++ Benchmark with Rumantsch Grischun, Sursilvan, Sutsilvan, Surmiran, Puter, and Vallader [20.4] Rumantsch Grischunは超地域品種であり、Sursilvan、Sutsilvan、Surmiran、Puter、Valladerの5つの地域品種である。
我々の参照翻訳は、WMT24++ベンチマークに基づいて、人間の翻訳者によって作成された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:07:19 GMT)
Improving Generalizability and Undetectability for Targeted Adversarial Attacks on Multimodal Pre-trained Models [20.4] マルチモーダル事前学習モデルには、一般化可能性と非検出性という2つの側面がある。
具体的には、工芸目的敵例(AE)は、クロスモーダルアライメントタスクにおいて、部分的に知られている、または意味的に類似したターゲットに限定的な一般化を示す。
本稿では,複数のソース・モーダル・ターゲット・モーダル・プロキシを利用してターゲットAEを最適化するPTA(Proxy Targeted Attack)を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:00:43 GMT)
CLOSP: A Unified Semantic Space for SAR, MSI, and Text in Remote Sensing [20.3] 我々は647,000以上のSentinel-1 SARとSentinel-2マルチスペクトル画像からなる新しい大規模コーパスCrisisLandMarkを紹介する。
次に、テキストをブリッジとして使用する新しいフレームワークであるCLOSPを紹介し、未対光画像とSAR画像を統合埋め込み空間に整列させる。
実験の結果, CLOSPは新たな最先端を実現し, nDGC@1000を既存モデルよりも54%向上した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:10:23 GMT)
Interdisciplinary Research in Conversation: A Case Study in Computational Morphology for Language Documentation [20.2] 本稿は,NLPにおける研究と実践の幅広い相違点の中で,計算形態学と言語文書との切り離しを考察する。
ユーザ中心設計(UCD)の体系的な統合を伴わずに、非コンテキスト化と非効率化のフィールドリスクを論じる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:59:55 GMT)
Ensuring Reliable Participation in Subjective Video Quality Tests Across Platforms [19.7] ビデオ品質アセスメント(VQA)は、コミュニケーション、ストリーミング、パイプライン間のエンドユーザエクスペリエンスを測定するための金の標準である。
クラウドソーシングは正確で信頼性が高く、より速く、より安価な評価を提供するが、指示やゲーム報酬を無視した労働者による信頼できない提出に苦しむ。
最近のテストでは、ビデオメタデータの高度な活用とリモートデスクトップ接続の利用の増加が明らかにされている。
本稿では,RDユーザを対象とした主観的および主観的検出手法を提案し,その感受性と緩和性について2つの主流クラウドソーシングプラットフォームを比較した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:17:25 GMT)
Survey of Deep Learning and Physics-Based Approaches in Computational Wave Imaging [19.6] 計算波イメージング(CWI)は、物質体積の隠れ構造と物理的性質を抽出する。
CWI問題を解くための現在のアプローチは、伝統的な物理学に根ざしたものと、ディープラーニングに基づくものに分けられる。
機械学習ベースの計算手法が登場し、これらの課題に対処するための異なる視点を提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:28:55 GMT)
CAMILA: Context-Aware Masking for Image Editing with Language Alignment [19.4] 本稿では,CAMILAと命名された画像編集のためのコンテキスト認識手法を提案する。
CAMILAは、命令と画像間のコンテキスト的コヒーレンスを検証するように設計されている。
提案手法は,最先端モデルよりも優れた性能とセマンティックアライメントを実現する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:20:44 GMT)
From Text to Talk: Audio-Language Model Needs Non-Autoregressive Joint Training [19.4] 本稿では,ARテキスト生成と非自己回帰音声拡散を統合した統合音声テキストモデリングフレームワークを提案する。
本研究では,ARテキスト生成と非自己回帰音声拡散を統合した統合音声テキストモデリングフレームワークTtTを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:44:26 GMT)
GS-RoadPatching: Inpainting Gaussians via 3D Searching and Placing for Driving Scenes [19.3] GS-RoadPatching(GS-RoadPatching)は、完全に再構成された領域を参照してシーン完了を駆動する方法である。
提案手法は,3DGSモダリティによる代替シーンの塗り絵や編集を可能にする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:44:37 GMT)
Unifying Symbolic Music Arrangement: Track-Aware Reconstruction and Structured Tokenization [19.3] 自動マルチトラック音楽アレンジメントのための統合フレームワークを提案する。
中心となるのは、トークンレベルのアンタングルされたコンテンツとスタイルで動作するセグメントレベルの再構築目標である。
トラックワイズ・モデリングを支援するため,マルチトラック・シンボリック・ミュージックのための構造化トークン化手法であるREMI-zを導入する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:18:09 GMT)
GraphEQA: Using 3D Semantic Scene Graphs for Real-time Embodied Question Answering [19.2] EQA(Embodied Question Answering)では、エージェントは、位置した質問に自信を持って答えるために、目に見えない環境の意味的な理解を探求し、発展させなければならない。
本稿では,リアルタイムな3次元メトリセマンティックシーングラフ(3DSG)とタスク関連画像をマルチモーダルメモリとして利用して視覚言語モデル(VLM)を構築する新しいアプローチであるGraphEQAを提案する。
我々は,3DSGの階層的性質を利用した階層的計画手法を用いて,構造的計画と意味論的指導による探索を行う。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:49:49 GMT)
SKYLENAGE Technical Report: Mathematical Reasoning and Contest-Innovation Benchmarks for Multi-Level Math Evaluation [19.1] 大規模言語モデル(LLM)は今や多くの公的な数学スイートで強く機能しているが、数学におけるフロンティア分離は天井効果に悩まされている。
本稿では,SKYLENAGE-ReasoningMATHとSKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE- MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SKYLE NAGE-MATH,SKYLENAGE-MATH,SKYLENAGE-MATH,SK。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:09:32 GMT)
GaussianSeal: Rooting Adaptive Watermarks for 3D Gaussian Generation Model [19.1] 本稿では3DGS生成モデルのための最初のビット透かしフレームワークであるGaussianSealを提案する。
モデルの出力の忠実さを維持しながら、トレーニングオーバーヘッドを最小限に抑えた高精度ビットデコーディングを実現する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:02:27 GMT)
The Cream Rises to the Top: Efficient Reranking Method for Verilog Code Generation [19.1] LLMは、ドメイン固有の知識が限られているため、Verilog生成において重大な課題に直面している。
本稿では,VCD-RNKを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:12:21 GMT)
Embedding Domain Knowledge for Large Language Models via Reinforcement Learning from Augmented Generation [19.0] 本稿では,RLAG(Reinforcement Learning from Augmented Generation)を提案し,ドメイン知識を大規模言語モデルに組み込む。
提案手法は, サンプリング世代間を反復的に循環し, 計算した報酬によってモデルを最適化する。
医学、法学、天文学、および現在のイベントデータセットにわたる実験結果から、提案手法がベースラインアプローチを著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:30:16 GMT)
Feature Dynamics as Implicit Data Augmentation: A Depth-Decomposed View on Deep Neural Network Generalization [18.7] 時間的一貫性は、目に見えないデータや破損したデータにまで拡張されるが、セマンティック構造が破壊されると崩壊する。
これらの知見は、特徴力学と一般化をリンクする概念的な視点を示唆している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:23:56 GMT)
CorIL: Towards Enriching Indian Language to Indian Language Parallel Corpora and Machine Translation Systems [18.5] インドの言語風景は世界でも最も多様であり、120以上の主要言語と1,600以上の追加言語から構成されている。
最近の多言語ニューラルネットワーク翻訳(NMT)の進歩にもかかわらず、インドの言語に対する高品質な並列コーパスは依然として乏しい。
本稿では,11言語を対象とした大規模で高品質な並列コーパスを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:48:26 GMT)
HoT: Highlighted Chain of Thought for Referencing Supporting Facts from Inputs [18.2] 事実と非事実の言明が混ざり合った反応は、人間が自分の決定を正確かつ正確に検証することの難しさを浮き彫りにする。
提案するHighlighted Chain-of-Thought Prompting(HoT)は,大規模言語モデルに対して,クエリで提供される事実をベースとしたXMLタグによる応答を生成する技術である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:26:13 GMT)
Let's Play Across Cultures: A Large Multilingual, Multicultural Benchmark for Assessing Language Models' Understanding of Sports [18.2] textbftextitCultSportQAは、LMが60か国と6大陸にわたる伝統的なスポーツに対する理解を評価するために設計されたベンチマークである。
データセットには、テキストと画像のモダリティにまたがる33,000の多重選択質問(MCQ)が含まれている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:06:36 GMT)
EC-LDA : Label Distribution Inference Attack against Federated Graph Learning with Embedding Compression [18.2] グラフニューラルネットワーク(GNN)はグラフ解析に広く利用されている。
Federated Graph Learning(FGL)は、さまざまなクライアントからグラフデータを協調的にトレーニングする、新たな学習フレームワークである。
クライアント側データのラベル分布を推定することを目的としたFGL上のラベル分散攻撃(LDA)を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:32:47 GMT)
Who is Responsible? The Data, Models, Users or Regulations? A Comprehensive Survey on Responsible Generative AI for a Sustainable Future [18.0] ジェネレーティブAIは、研究からセクターをまたいだ現実世界への展開へと急速に移行している。
この研究は、メソッド、ベンチマーク、ポリシーにまたがる責任ある生成AIの風景を合成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:04:24 GMT)
OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models [18.0] 認知心理学に基づく空間的推論のベンチマークであるOmniSpatialを紹介する。
動的推論、複雑な空間論理、空間相互作用、視点取りという4つの主要なカテゴリをカバーしている。
注意深い手動アノテーションにより8.4K以上の質問応答対を構築する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 00:47:35 GMT)
MESS+: Dynamically Learned Inference-Time LLM Routing in Model Zoos with Service Level Guarantees [17.5] オープンウェイトな大規模言語モデル(LLM)動物園は、多くの高品質なモデルへのアクセスを提供する。
ほとんどのユーザーは、モデル技術に気を使わずに、事実的正確で安全で満足な応答を欲しがっている。
コスト最適LCM要求ルーティングのための最適化アルゴリズムであるMESS+を紹介する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:01:26 GMT)
MAPEX: A Multi-Agent Pipeline for Keyphrase Extraction [17.5] キーフレーズ抽出にマルチエージェント協調を導入するMAPEXを提案する。
MAPEXは、専門家の募集、候補者抽出、トピックガイダンス、知識増強、後処理のためのモジュールを通してLLMベースのエージェントをコーディネートする。
二重パス戦略は文書長に動的に適応する: 短文の知識駆動抽出と長文のトピック誘導抽出である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:21:15 GMT)
RSAVQ: Riemannian Sensitivity-Aware Vector Quantization for Large Language Models [17.3] 大規模言語モデル(LLM)は、幅広い自然言語処理タスクにおいて顕著な性能を示している。
指数関数的に増加するパラメータは、リソース制約のあるデバイスへの展開に重大な課題をもたらす。
LLMの超低ビット量子化を実現する新しいフレームワークであるRSAVQを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:40:32 GMT)
Function Spaces Without Kernels: Learning Compact Hilbert Space Representations [17.2] 本稿では,関数エンコーダが特徴学習とカーネル手法との原則的接続を提供することを示す。
コンパクトなベースを学習する2つのトレーニングアルゴリズムを開発した。
この研究は、カーネルレベルの保証を持つ神経予測器への道を示唆している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:55:52 GMT)
An Improved Time Series Anomaly Detection by Applying Structural Similarity [17.1] 本稿では,新しい構造強化型異常検出手法であるStrADを提案する。
この結果から,StrADは5つの実世界の異常検出データセットにまたがって,最先端の再構築モデルの性能を向上させることを示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:45:00 GMT)
Stylus: Repurposing Stable Diffusion for Training-Free Music Style Transfer on Mel-Spectrograms [16.9] Stylusは、メル・スペクトログラム領域における音楽スタイルの転送のためのトレーニング不要のフレームワークである。
ソースクエリを保存しながらスタイルキー値の機能を注入することで、自己注意を操作する。
コンテンツ保存率は34.1%、知覚品質は25.7%向上している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:37:35 GMT)
Positional Prompt Tuning for Efficient 3D Representation Learning [16.9] 変換器をベースとした位置符号化手法は,点雲のマルチスケールな特徴を集約するのに有効である,と我々は主張する。
本稿では,プロンプトとアダプタのレンズを通して,パラメータ効率のよい微調整(PEFT)について検討する。
PPTにはパッチトークンが増加し、トレーニング可能な位置エンコーディングが組み込まれている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 00:39:45 GMT)
DAOpt: Modeling and Evaluation of Data-Driven Optimization under Uncertainty with LLMs [16.6] 大規模言語モデル(LLM)の最近の進歩は、自動最適化モデリングの研究を加速させている。
DAOpt フレームワークは,新たなデータセット OptU,マルチエージェント意思決定モジュール,LLM 評価のためのシミュレーション環境を含む。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:19:28 GMT)
When Words Can't Capture It All: Towards Video-Based User Complaint Text Generation with Multimodal Video Complaint Dataset [16.5] 本稿では, 苦情マイニングの分野での新たな課題を定式化し, 利用者が表現力のある苦情を書くことを支援する。
この目的のために,1,175本の苦情ビデオと対応する記述を含むビデオ苦情データセットであるComVIDを紹介する。
本稿では,提案した(CoD-V)タスクを標準映像要約タスクと区別するCR評価指標を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:00:05 GMT)
Anomaly Detection by Clustering DINO Embeddings using a Dirichlet Process Mixture [16.4] ディリクレプロセス混合モデル(DPMM)を用いた標準DINOv2埋め込みの分布のモデル化を提案する。
実験の結果,DINOv2のDPMM埋め込みにより,自然画像の訓練にもかかわらず,医用画像ベンチマークにおいて非常に競合的な異常検出性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:02:56 GMT)
TReMu: Towards Neuro-Symbolic Temporal Reasoning for LLM-Agents with Memory in Multi-Session Dialogues [16.3] 本稿では,LoCoMoからの対話を増強し,複数選択QAを作成することで,新しいベンチマークを構築する手法を提案する。
また,LLMエージェントの時間的推論能力の向上を目的とした新しいフレームワークであるTReMuについても紹介する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:09:22 GMT)
Data-Efficient Stream-Based Active Distillation for Scalable Edge Model Deployment [16.2] 本研究は,トランスミッションコストを低く抑えながら,モデル品質を最大化するために,トレーニングに最も有用な画像を選択する方法について検討する。
我々の研究は、同様のトレーニング負荷(イテレーション)に対して、多様性に基づくアプローチと組み合わせた高信頼のストリームベースの戦略が、最小限のデータセットクエリを備えた高品質なモデルを生成することを示している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:52:34 GMT)
When Long Helps Short: How Context Length in Supervised Fine-tuning Affects Behavior of Large Language Models [16.1] 大規模言語モデル (LLM) は自然言語処理 (NLP) タスクにまたがって優れた性能を達成している。
現実世界のアプリケーションは、より長いコンテキストウインドウをますます求めているため、長いコンテキストデータに対する事前トレーニングと教師付き微調整(SFT)が一般的なアプローチとなっている。
SFTデータ長が短時間のタスクにおけるLLMの挙動にどう影響するかを系統的に検討する。
長文事前学習による劣化に対して,長文SFTは短文性能を向上することがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:47:31 GMT)
Objective Evaluation of Prosody and Intelligibility in Speech Synthesis via Conditional Prediction of Discrete Tokens [16.1] 本稿では,離散音声トークンの条件付き予測に基づく,ターゲット型かつ参照不要な評価フレームワークであるTScoreを提案する。
TTScoreは入力テキストに条件付きシーケンス・ツー・シーケンス予測器を2つ採用している: TTScore-intはコンテンツトークンによるインテリジェンスを計測し、TScore-proはプロソディトークンによるプロソディを評価する。
SOMOS、VoiceMOS、TTSArenaベンチマークの実験では、TScore-intとTScore-proは信頼性が高く、アスペクト特異的な評価を提供し、既存のインテリジェンスや韻律中心のメトリクスよりも、全体的な品質の人間の判断と強い相関性を実現する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:55:18 GMT)
CogAtom: From Cognitive Atoms to Olympiad-level Mathematical Reasoning in Large Language Models [16.0] 我々は、厳密で認知的に多様な問題を合成するための新しい認知原子ベースのフレームワークであるCogAtomを紹介する。
私たちの研究は、スケーラブルで高品質な数学問題生成への認知的に根ざした道筋を提供します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:23:31 GMT)
From Input Perception to Predictive Insight: Modeling Model Blind Spots Before They Become Errors [15.2] 言語モデルは慣用的、図形的、文脈に敏感な入力に苦しむことが多い。
本稿では,トークンレベルの確率的特徴を仮定と一様情報密度仮説にインスパイアした,そのような故障を予測するための入力のみの手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:33:54 GMT)
Date Fragments: A Hidden Bottleneck of Tokenization for Temporal Reasoning [15.2] 我々は,トークン化器が複数桁の日付成分をいかに忠実に保存するかを測定する,単純な解釈可能な日付フラグメンテーション比を導入する。
DateAugBenchは3つの時間的推論タスクにまたがった6500の例のスイートです。
実験の結果, 過度な断片化は, 異常な日付で最大10ポイントの精度低下と相関していることがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:35:24 GMT)
Robust Training of Neural Networks at Arbitrary Precision and Sparsity [15.1] 本稿では,原理的リッジ回帰目標から導かれるデノナイジング・デクエント化変換を導入する。
我々は、この原理を、重要でない値を0にマッピングする特別な量子化の形式として見ることにより、スパーシフィケーションに拡張する。
このアプローチは最先端の結果をもたらし、理論上は高効率ニューラルネットワークへの経路を提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:53:58 GMT)
Large Pre-Trained Models for Bimanual Manipulation in 3D [15.1] 我々は、事前訓練された視覚変換器からの注意マップをボクセル表現に統合し、バイマニュアルロボット操作を強化する。
最先端のボクセルベースの政策に統合されると、注意誘導による成果物化は平均8.2%の絶対的な改善をもたらす。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:38:42 GMT)
CPCLDETECTOR: Knowledge Enhancement and Alignment Selection for Chinese Patronizing and Condescending Language Detection [15.1] 中国語愛国語(英語: Chinese Patronizing and Condescending Language、CPLC)は、中国のビデオプラットフォーム上で脆弱なグループをターゲットにした、暗黙の差別的な有毒なスピーチである。
既存のデータセットには、ビデオコンテンツを直接反映するユーザコメントがない。
本研究は,103kのコメントエントリを含む新しいデータセットPCLMMPLUSを再構成し,データセットサイズを拡大する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:29:46 GMT)
Frequency-domain Multi-modal Fusion for Language-guided Medical Image Segmentation [15.0] 臨床的テキストレポートをセマンティックガイダンスとして組み込むことにより、医用画像のセグメンテーションの精度を向上させることができる。
言語誘導型医用画像分割のための周波数領域マルチモーダルインタラクションモデル(FMISeg)を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:02:38 GMT)
InstructVTON: Optimal Auto-Masking and Natural-Language-Guided Interactive Style Control for Inpainting-Based Virtual Try-On [14.9] InstructVTONは命令追従型の対話型仮想試行システムで、細粒度で複雑なスタイリング制御を可能にする。
InstructVTONは既存の仮想試行モデルと相互運用可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:52:40 GMT)
A co-evolving agentic AI system for medical imaging analysis [14.9] TissueLabは、研究者が直接質問し、説明可能な結果を自動的に計画し、生成し、リアルタイム分析を行うことができるエージェントAIシステムである。
多様なツールのインプット、アウトプット、能力の標準化により、システムはいつ、どのように呼び出すかを決定し、研究や臨床上の問題に対処する。
tissueLabは、エンドツーエンドのビジョン言語モデル(VLM)や他のエージェントAIシステム(GPT-5)と比較して、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:15:28 GMT)
BiTAA: A Bi-Task Adversarial Attack for Object Detection and Depth Estimation via 3D Gaussian Splatting [14.9] 本稿では,3次元ガウス平板上に構築したビタスク対逆攻撃BiTAAについて述べる。
具体的には、フルイメージとパッチ設定の両方をサポートするデュアルモデルアタックフレームワークを導入する。
また,クロスタスク転送メトリクスと実世界評価を併用した統合評価プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:27:15 GMT)
MCGrad:: Multicalibration at Web Scale [14.8] マルチキャリブレーションは、機械学習ベースのシステムの性能にとって重要な特性である。
我々は,新しいスケーラブルなマルチキャリブレーションアルゴリズム MCGrad を提案する。
MCGradは保護されたグループの明示的な仕様を必要とせず、スケーラブルであり、しばしばそれらを傷つけることなく、他のML評価指標を改善する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:34:38 GMT)
Measuring Harmfulness of Computer-Using Agents [14.5] コンピュータ利用エージェント(CUA)は、コンピュータを自律的に制御し、マルチステップアクションを実行する。
CUAHarmは104名の専門家による現実的な誤用リスクで構成されている。
GPT-5, Claude 4 Sonnet, Gemini 2.5 Pro, Llama-3.3-70B, Mistral Large 2などのフロンティア膜の評価を行った。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:08:42 GMT)
When Your Boss Is an AI Bot: Exploring Opportunities and Risks of Manager Clone Agents in the Future Workplace [14.5] Manager Clone Agentsは、管理タスクを代行するAI駆動のデジタルサロゲートである。
我々は6つのデザイン・フィクション・ワークショップをマネージャと労働者で開催し、参加者は投機的シナリオを共同制作した。
管理者クローンエージェントの参加者が想定する役割として,プロキシ存在,インフォメーションコンベアベルト,生産性エンジン,リーダシップアンプの4つを挙げる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:39:46 GMT)
HiPerformer: A High-Performance Global-Local Segmentation Model with Modular Hierarchical Fusion Strategy [14.2] 局所的な詳細とグローバルな文脈は、医用画像のセグメンテーションにおいて不可欠であり、それらを効果的に統合することは、高い精度を達成するために不可欠である。
マルチソース機能を並列に融合する新しいモジュラー階層アーキテクチャであるHiPerformerを提案する。
ローカル・グローバル・フィーチャー・フュージョン(LGFF)モジュールを設計し,局所的詳細情報と大域的意味情報の正確かつ効率的な統合を実現する。
11の公開データセットの実験では、提案手法が既存のセグメンテーション手法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:15:42 GMT)
Safeguarding Privacy of Retrieval Data against Membership Inference Attacks: Is This Query Too Close to Home? [14.1] RAGシステム用に設計された新しい類似性に基づくMIA検出フレームワークを提案する。
単純な検出・隠蔽戦略は攻撃者を難読化し、データユーティリティを維持でき、MIAに対してシステムに依存しないことを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:57:31 GMT)
A Quad-Step Approach to Uncertainty-Aware Deep Learning for Skin Cancer Classification [14.0] ディープラーニングモデルは、皮膚がんの分類を自動化することを約束している。
しかし、データ不足と不確実性に対する認識が限られているため、課題は残る。
本研究では,HAM10000データセットを用いたDLベースの皮膚病変分類の包括的評価を行った。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:41:38 GMT)
Adaptive User Interest Modeling via Conditioned Denoising Diffusion For Click-Through Rate Prediction [13.9] 検索システムのユーザー行動シーケンスは「興味ある化石」に似ており、露出バイアス、カテゴリードリフト、文脈ノイズによって侵食された真の意図を捉えている。
本稿では,この問題を解決するための文脈拡散(CDP)を提案する。
CDPは、シナリオで動的に進化する純粋でコンテキスト対応の関心表現を生成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:28:33 GMT)
Does the Manipulation Process Matter? RITA: Reasoning Composite Image Manipulations via Reversely-Ordered Incremental-Transition Autoregression [13.9] 我々は、条件付きシーケンス予測タスクとして画像操作のローカライゼーションを再構成し、RITAフレームワークを提案する。
RITAは、各ステップの予測を次のステップの条件として、操作された領域を順番に階層的に予測する。
トレーニングと評価を可能にするため,マルチステップ操作データを合成し,新しいベンチマークHSIMを構築する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:25:44 GMT)
Citrus-V: Advancing Medical Foundation Models with Unified Medical Image Grounding for Clinical Reasoning [13.8] 本稿では,画像解析とテキスト推論を組み合わせたマルチモーダル医療基盤モデルであるCitrus-Vを紹介する。
このモデルは、検出、セグメンテーション、およびマルチモーダル・チェーン・オブ・シント推論を統合する。
ピクセルレベルの病変の局所化、構造化レポート生成、医師のような診断推論をサポートする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:19:50 GMT)
Differential Privacy of Network Parameters from a System Identification Perspective [13.7] 本稿では,サイバー物理システムシミュレーションの共有において,プライバシシステム識別(SI)攻撃からネットワーク情報を保護するという課題に対処する。
我々は,グラフシフト演算子(GSO)を推定することを目的とした,差分プライベート(DP)の帰納的励起によって駆動されるグラフフィルタの時系列出力として,ネットワーク化された状態のアナリスト観測をモデル化する。
入力にDP機構を適用することで、GSOに対して正式なプライバシー保証が得られ、グラフフィルタのスペクトル特性とノイズ共分散に縛られた$(epsilon,delta)$-DPがリンクされることが示される。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:06:11 GMT)
Understanding and Improving Adversarial Robustness of Neural Probabilistic Circuits [13.7] 新しい概念ボトルネックモデルであるニューラル確率回路は、属性認識モデルと推論のための確率回路から構成される。
理論的にNPCの対向ロバスト性を解析し、属性認識モデルのロバスト性にのみ依存することを示す。
我々は,認識モジュールに対する敵攻撃に対して,最初の堅牢なニューラル確率回路であるRNPCを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:25:17 GMT)
Improving Monte Carlo Tree Search for Symbolic Regression [13.6] 記号回帰は、望ましい目的を満たす簡潔で解釈可能な数学的表現を見つけることを目的としている。
2つの重要な革新を通じてこれらの制限に対処するシンボリックレグレッションのための改良されたフレームワークを提案する。
本手法は, 回復率の観点から, 最先端ライブラリと競合する性能を達成し, 精度とモデル複雑性の両面において良好な位置を占める。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:41:54 GMT)
No-Go Theorems for Universal Quantum State Purification via Classically Simulable Operations [13.6] 量子状態浄化のための古典的にシミュレート可能な演算の限界について検討する。
古典的にシミュレート可能な操作のみを用いた決定論的・確率的プロトコルは、普遍的な浄化を達成できないことを証明した。
本研究は, 量子状態浄化における非安定化資源の役割と, 古典的にシミュレート可能な操作の限界を明らかにするものである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:42:15 GMT)
ARCADE: A Real-Time Data System for Hybrid and Continuous Query Processing across Diverse Data Modalities [13.3] ARCADEはリアルタイムデータシステムであり、多様なデータタイプにわたる表現豊かなハイブリッドおよび連続的なクエリ処理をサポートする。
RocksDBによるオープンソースのストレージシステム上に構築されたARCADEは、リードヘビーで最大7.4倍、ライトヘビーなワークロードで1.4倍の性能を持つ。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:26:25 GMT)
On Araki-Type Trace Inequalities [13.1] トレース不等式 $textTr[f(A) As Bs ] leq textTr[g(A) (A1/2 B A1/2 )s ]$ を証明します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:28:06 GMT)
Error Exponents for Quantum Packing Problems via An Operator Layer Cake Theorem [13.1] 古典量子チャネル符号化のためのワンショットランダム符号化を証明した。
この結果は、様々な量子パッキング型問題にまで及んでいる。
このことは、ある種の良い測定がランダム化されたホレボ・ヘルストロム測定と等価であることを示している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:34:58 GMT)
TactfulToM: Do LLMs Have the Theory of Mind Ability to Understand White Lies? [13.1] TactfulToMは,Large Language Models (LLM) の機能を評価するために設計された新しい英語ベンチマークである。
我々のベンチマークは、LLMが手動で設計したシードストーリーを会話に拡張し、真に白い嘘をつくのに必要な情報非対称性を維持するマルチステージのヒューマン・イン・ザ・ループ・パイプラインを通じて生成される。
我々は、TactfulToMが人間よりかなり低い性能を発揮する最先端のモデルでは困難であることが示し、ToM推論を完全に理解し、白い嘘を真に理解する能力の欠点を明らかにした。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:47:31 GMT)
MARS: toward more efficient multi-agent collaboration for LLM reasoning [12.9] マルチエージェントレビューシステム(MARS)は、レビュープロセスにインスパイアされたロールベースのコラボレーションフレームワークである。
我々は,MARSがトークン使用量と推論時間の両方を約50%削減しながら,MAD(Multi-Agent Debate)の精度に一致していることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:24:33 GMT)
Towards Robust In-Context Learning for Medical Image Segmentation via Data Synthesis [12.8] ユニバーサルな医用画像セグメンテーションのためのIn-Context Learning (ICL)は、大規模で多様な訓練用データセットに対する前例のない需要をもたらした。
ドメインランダム化に基づく新しいデータ合成フレームワークである textbf SynthICL を提案する。
私たちの仕事は、ICLベースのセグメンテーションにおけるデータのボトルネックを軽減するのに役立ちます。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:44:53 GMT)
Blind Men and the Elephant: Diverse Perspectives on Gender Stereotypes in Benchmark Datasets [12.8] 本稿では,内在型ステレオタイプベンチマークの不整合について検討する。
StereoSetとCrowS-Pairsをケーススタディとして,データ分布がベンチマーク結果に与える影響を検討した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:03:47 GMT)
From Samples to Scenarios: A New Paradigm for Probabilistic Forecasting [12.8] ほとんどの最先端の確率的時系列予測モデルは、将来の不確実性を表すためにサンプリングに依存している。
textbf Probabilistic Scenariosは,サンプリングの限界に対処するための代替パラダイムである。
TimePrismは、2つのメトリクスに関する5つのベンチマークデータセットに対して、10の最先端結果のうち9を達成している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:30:33 GMT)
SMILES-Inspired Transfer Learning for Quantum Operators in Generative Quantum Eigensolver [12.8] UCCSD量子演算子のためのテキストベース表現手法を開発した。
我々は、転写学習フレームワークを確立するために、テキスト類似度メトリクスを使用します。
この発見は、分子基底状態エネルギーのハイブリッド量子古典計算に重要な利点をもたらす。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:54:09 GMT)
Symbol-Temporal Consistency Self-supervised Learning for Robust Time Series Classification [12.7] デジタルヘルスにおける時系列データは、非常に騒々しく、本質的には概念の漂流を伴うことが知られており、一般化可能なディープラーニングモデルをトレーニングする上での課題となっている。
そこで本稿では,記号表現を意識した自己教師型学習フレームワークを提案する。
提案手法は, 重要なデータシフトが存在する場合において, 性能が著しく向上することが実証された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 00:18:28 GMT)
Sobolev acceleration for neural networks [12.7] ソボレフトレーニングは、従来の$L2$トレーニングと比較して収束を加速し、一般化を改善することが示されている。
本稿では,ソボレフトレーニングがReLU(Rectified Linear Unit)ネットワークの収束を加速することを示す,厳密な理論フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:52:02 GMT)
How Large Language Models Need Symbolism [12.5] AIの未来にはスケーリング以上のものが必要だ、と私たちは主張する。
真の発見を解き明かすためには、大きな言語モデルにはコンパスが必要だ。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:51:42 GMT)
Unmasking Fake Careers: Detecting Machine-Generated Career Trajectories via Multi-layer Heterogeneous Graphs [12.5] 本研究では,Large Language Models(LLM)と各種手法を用いて,機械学習のキャリアトラジェクトリのデータセットを構築した。
実履歴から構築した統一グローバルグラフにおいて,キャリアエンティティとその関係をモデル化する新しい異種階層型多層グラフフレームワークであるCareerScapeを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:18:59 GMT)
An Empirical Study of Testing Practices in Open Source AI Agent Frameworks and Agentic Applications [12.2] ファンデーションモデル(FM)ベースのAIエージェントは、さまざまなドメインで急速に採用されている。
その固有の非決定主義と非再現性は、テストと品質保証の課題を引き起こす。
AIエージェントエコシステムにおけるテストプラクティスの大規模な実証的研究を初めて実施する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:15:20 GMT)
Do AI Companies Make Good on Voluntary Commitments to the White House? [12.0] 我々は、2023年のホワイトハウスへの8つの自発的なコミットメントに基づいて、詳細なルーリックを開発することで、公表された行動に基づいて企業を評価する。
最も高く評価されている企業(OpenAI)は、当社のルーリック全体で83%だが、全企業の平均スコアはわずか53%だ。
両社は、平均17%のスコアでウェイトセキュリティのモデル化を約束する上で、システム的にパフォーマンスが劣っていることを実証している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:30:04 GMT)
Scent of Knowledge: Optimizing Search-Enhanced Reasoning with Information Foraging [11.4] InForageは、動的情報探索プロセスとして検索強化推論を形式化する強化学習フレームワークである。
我々は,複雑な実世界のWebタスクに対する反復探索と推論のトラジェクトリをキャプチャするヒューマンガイドデータセットを構築した。
これらの結果は、堅牢で適応的で効率的な推論エージェントの構築におけるInForageの有効性を強調している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:54:58 GMT)
Predictive Quality Assessment for Mobile Secure Graphics [11.2] 本稿では,下流検証作業におけるフレームの有用性を予測するフレームワークを提案する。
本フレームワークは,105台のスマートフォンから32,000枚以上の画像の大規模データセットを用いて,再コンテキスト化FNMRおよびISRRメトリクスを用いて検証した。
フリーズされたImageNet-pretrainedネットワーク上の軽量プローブは、完全に微調整されたモデルよりも、目に見えない印刷技術に最適化される。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:46:15 GMT)
Kalman Filter Enhanced GRPO for Reinforcement Learning-Based Language Model Reasoning [11.2] グループ相対政策最適化(GRPO)は、グループ内の全ての出力に対して平均報酬をベースラインとして減算することで、各出力の利点を計算するために提案された。
より適応的な利点推定モデルを用いて、KRPOはGRPOの安定性と性能を向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:31:07 GMT)
Ads that Stick: Near-Optimal Ad Optimization through Psychological Behavior Models [11.1] 既存のスケジューリングポリシーは、一様間隔や周波数上限のような、長期のユーザの関心を覆い隠す単純なものに依存している。
我々は,単なる露出,ヘドニック適応,オペラントコンディショニングに基づく広告表示によるユーザ関心の変化をモデル化する。
表示された広告の数が固定された場合、最適な広告スケジュールは操作条件関数にのみ依存することを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:35:18 GMT)
Investigating the Representation of Backchannels and Fillers in Fine-tuned Language Models [11.1] 逆チャネルとフィラーは対話において重要な言語表現であるが、トランスフォーマーベース言語モデル(LM)では不足している。
我々の研究は3つの微調整戦略を用いて言語モデルにおけるそれらの表現を研究する。
まず,バックチャネルとフィラーの学習表現にクラスタリング解析を適用し,微調整モデルからの表現にシルエットスコアが増大していることを発見した。
また、自然言語生成指標を用いて、微調整された言語モデルによって生成された発話が、より人間生成された発話に類似していることを確認する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:27:44 GMT)
TABFAIRGDT: A Fast Fair Tabular Data Generator using Autoregressive Decision Trees [11.0] 本稿では,自己回帰決定木を用いた公正な合成データ生成手法であるTABFAIRGDTを紹介する。
ベンチマークフェアネスデータセット上でTABFAIRGDTを評価し,SOTA(State-of-the-art)深部生成モデルよりも優れていることを示す。
注目すべきなのは、TABFAIRGDTは、さまざまなデータセットサイズで、最速のSOTAベースラインよりも平均72%のスピードアップを実現していることだ。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:35:52 GMT)
MathBuddy: A Multimodal System for Affective Math Tutoring [11.0] MathBuddyはLLMで動くMath Tutorだ。
生徒の感情を関連する教育戦略にマッピングし、教師と学生の会話をより共感的なものにする。
DAMRスコアを用いて,勝利率と総合的な3ポイントゲインを用いて,23ポイントの大規模なパフォーマンスゲインを報告した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:05:55 GMT)
Can LLMs Reason Over Non-Text Modalities in a Training-Free Manner? A Case Study with In-Context Representation Learning [10.9] そこで本研究では,LLMの非テキストモダリティ表現を適応的に活用するための概念実証として,ICRL(In-Context Representation Learning)を提案する。
従来のテキスト内学習とは異なり、ICRLはテキスト入力をFM表現に置き換え、LLMは微調整なしでマルチモーダル推論を行うことができる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:24:09 GMT)
AJAHR: Amputated Joint Aware 3D Human Mesh Recovery [10.8] 既存の人間のメッシュ回復法は標準的な人体構造を前提としており、手足の喪失のような多様な解剖学的状態を見渡せる。
適応的なポーズ推定フレームワークであるAJAHR(Amputated Joint Aware 3D Human Mesh Recovery)を提案する。
本モデルでは,メッシュリカバリネットワークと共同でトレーニングした身体部分切断を統合して,潜在的な切断を検出する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:46:10 GMT)
MultiSoundGen: Video-to-Audio Generation for Multi-Event Scenarios via SlowFast Contrastive Audio-Visual Pretraining and Direct Preference Optimization [10.7] 本研究では,新しいV2AフレームワークであるMultiSoundGenを提案する。
V2AドメインにDPO(Direct preference Optimization)を導入し、AVP(Audio-visual pretraining)を活用して、複雑なマルチイベントシナリオのパフォーマンスを向上させる。
実験により、MultiSoundGenは、マルチイベントシナリオにおいて、最先端(SOTA)のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:04:34 GMT)
VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip [10.7] Value Sign Flip (VSF) は、数ステップの拡散とフローマッチング画像生成モデルに負のプロンプトガイダンスを組み込む、シンプルで効率的な方法である。
本手法は計算オーバーヘッドを小さくし,MMDiTスタイルのアーキテクチャを効果的に統合する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:43:29 GMT)
The Syntax and Semantics of einsum [10.6] einsumは2011年にテンソル表現の実用的で便利な表記法としてNumPyに導入された。
PyTorchや量子回路シミュレーションなどのPythonフレームワークや、Juliaなどの他のプログラミング言語でも実装されている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:36:02 GMT)
Plan Verification for LLM-Based Embodied Task Completion Agents [10.4] 大規模言語モデル(LLM)に基づくタスク計画とそれに対応するAIの人間による実演は騒々しいかもしれない。
審査員が行動系列を批判し、プランナーLLMが修正を適用する反復検証フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:01:43 GMT)
From Query to Logic: Ontology-Driven Multi-Hop Reasoning in LLMs [10.4] 我々は、LLMの生成能力と知識グラフの構造的利点を組み合わせたトレーニングなしのフレームワークである**ORACLE* (**O**ntology-driven **R**easoning **A**nd **C*hain for **L*ogical **E**ucidationを提案する。
実験の結果,私たちのフレームワークは,DeepSeek-R1のような最先端モデルに匹敵する,論理的に高い競争力を持つことがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:11:07 GMT)
PathGene: Benchmarking Driver Gene Mutations and Exon Prediction Using Multicenter Lung Cancer Histopathology Image Dataset [10.3] 肺癌における遺伝子変異、変異サブタイプおよびそれらのエクソンの正確な予測は、パーソナライズされた治療計画と予後評価に重要である。
病理組織像と次世代シークエンシングレポートを組み合わせたPathGeneを収集した。
このマルチセンターデータセットは、全スライディングイメージをドライバ遺伝子変異状態、突然変異サブタイプ、エキソン、腫瘍突然変異負担(TMB)ステータスにリンクする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:16:30 GMT)
Online-Optimized RAG for Tool Use and Function Calling [10.3] 検索拡張生成(RAG)は、事前に指定されたツール/機能記述にユーザクエリを埋め込むことで、ツールの使用と関数呼び出しを駆動する。
Online-d RAGは、最小限のフィードバックを使用して、ライブインタラクションからの検索埋め込みに適応する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:08:46 GMT)
Automated Repair of Ambiguous Problem Descriptions for LLM-Based Code Generation [9.9] 自然言語(NL)の曖昧さは、ソフトウェアの品質を損なう可能性がある。
あいまいなNL記述の自動修復を導入する。
このアプローチをSpecFixというツールで実装しています。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:19:16 GMT)
Design Insights and Comparative Evaluation of a Hardware-Based Cooperative Perception Architecture for Lane Change Prediction [9.9] 本研究では,混在交通における実際のハードウェア展開による協調車線変化予測について検討する。
ボトルネック、信頼性の問題、システムの振る舞いを形作る運用上の制約など、私たちが直面した現実的な課題を強調します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:15:05 GMT)
LegalSearchLM: Rethinking Legal Case Retrieval as Legal Elements Generation [9.9] LCR(Lawal Case Retrieval)は、法律専門家の基本的な課題である。
LCRに関する既存の研究は2つの大きな制限に直面している。
まず,比較的小規模な検索コーパスを用いて評価を行った。
第二に、埋め込み方式や語彙マッチング方式への依存は、しばしば限定的な表現と法的に無関係な一致をもたらす。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:47:04 GMT)
A Scalable Nyström-Based Kernel Two-Sample Test with Permutations [9.8] 2サンプル仮説テストは統計学と機械学習の基本的な問題である。
本研究では,最大平均誤差(MMD)のNystr "om approxation"を用いて,計算効率よく実用的なテストアルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:47:01 GMT)
Nonlocal Games and Self-tests in the Presence of Noise [9.8] ハイノイズ政権における自己検査について研究する。
これらは、ハイノイズ状態において堅牢であり、選手の計測値がうるさい場合でも音が残る最初の自己テストである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:45:03 GMT)
COLT: Enhancing Video Large Language Models with Continual Tool Usage [9.7] 連続するツールストリームにおけるツール使用能力を自動取得するContinuaL Tool usage(COLT)を提案する。
我々のCOLTは学習可能なツールコードブックをツール固有のメモリシステムとして組み込んでいる。
ビデオLLMのツール使用可能性を解き放つために,ビデオ中心のツール利用指導データセットであるVideoToolBenchを収集する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:53:56 GMT)
Piezomechanical scattering loss in electro-optics quantum transducers [9.4] 我々は、フォノン放射によるマイクロ波光子の基板への損失をハイブリッド量子デバイスにおける普遍的な散逸機構として、圧電体散乱を同定する。
マイクロ波・光共振器の構成によらず,コヒーレントトランスダクション結合の最適化は必然的に消散を増大させるという基本的なトレードオフを明らかにする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:13:29 GMT)
Universal Dynamics with Globally Controlled Analog Quantum Simulators [9.4] アナログ量子シミュレータの幅広いクラスは、実際には普遍的であることを示す。
実験には、直接量子最適制御という新しい制御手法を導入する。
この手法により、複素実効ハミルトニアンの合成が可能となり、現実的なハードウェア制約を組み込むことができる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:58:38 GMT)
Unveiling the Role of Learning Rate Schedules via Functional Scaling Laws [9.3] スケーリング法は、大規模言語モデル(LLM)のトレーニングを導く上で、基礎的な役割を担っている。
本稿では,一般LSSの訓練過程における集団リスクの進化を特徴付ける機能スケーリング法を紹介する。
我々は、データ限定型と計算限定型の両方の条件下で、広く使われている3つのLSS(定数、指数減衰、ウォームアップ安定デカイ(WSD))を分析した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:27:45 GMT)
Choose Your Battles: Distributed Learning Over Multiple Tug of War Games [9.2] N人のプレイヤーとK人のゲームが同時に行われる。
各プレイヤーは一度に1試合に出場する。
各ステップで、プレイヤーは、そのゲームに参加することを希望するゲームと、そのゲームに参加するアクションを決定する。
彼らの報酬は、同じゲームにいるすべてのプレイヤーの行動に依存する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:11:51 GMT)
AMLA: MUL by ADD in FlashAttention Rescaling [9.2] MLA(Multi-head Latent Attention)は、大規模言語モデルにおけるKVCacheメモリ使用量を大幅に削減する。
本稿では,HuaweiのAscend NPU向けに最適化された高性能カーネルであるAscend MLAを紹介する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:04:59 GMT)
An LLM-based Agentic Framework for Accessible Network Control [9.2] 従来のネットワーク管理のアプローチは、専門知識の豊富な少数の高度に訓練されたネットワークオペレータにのみアクセス可能であった。
我々は,自然言語によるネットワークの対話を可能にすることによって,ネットワーク管理を専門家以外の幅広い利用者に利用できるようにするシステムの設計を行った。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:45:09 GMT)
Imaging Biomarkers for Neurodegenerative Diseases from Detailed Segmentation of Medial Temporal Lobe Subregions on in vivo Brain MRI Using Upsampling Strategy Guided by High-resolution ex vivo MRI [9.2] 延髄側頭葉 (MTL) は、アルツハイマー病(AD)の早期に広範囲に及び非一様に影響を及ぼす領域である
異なるMRIモダリティは、MTL形態計測に明確な利点がある。
本稿では,T1w と T2w のモダリティをほぼ等方的なボクセル空間に導いて橋渡しする多モード MTL セグメンテーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:59:22 GMT)
A Transformer Model for Predicting Chemical Products from Generic SMARTS Templates with Data Augmentation [9.0] この研究は、SMARTSで書かれた20の一般的な反応テンプレートを含む集合であるBroad Reaction Set (BRS)を提案する。
また、SMARTS反応テンプレートを直接処理および適用できるT5ベースのモデルであるProPreT5を紹介する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:24:14 GMT)
A Detection Region Method-Based Evolutionary Algorithm for Binary Constrained Multiobjective Optimization [9.0] 本稿では,検出領域法に基づくDRMCMOと呼ばれる新しいアルゴリズムを提案する。
DRMCMOでは、検出領域は収束を高めるために実現可能なソリューションを動的に監視し、住民が局所的最適から逃れるのを助ける。
バイナリ制約のあるCMOPのベンチマークテスト問題として、既存の3つのテストスイートを変更しました。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:15:32 GMT)
Pure Exploration via Frank-Wolfe Self-Play [9.0] 我々は、有限個の代替案から正しい仮説を効果的に同定することを目的として、構造化された多腕包帯の純粋な探索について研究する。
我々の分析は連続時間ステア(英語版)を通し、減衰するリャプノフ函数との微分包含は、失効する双対性ギャップと最適値への収束を示唆する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:55:21 GMT)
Into the Void: Understanding Online Health Information in Low-Web Data Languages [9.0] 研究言語としてのチグリニャ語とアムハラ語における健康質問に対する検索結果の特徴について検討した。
我々は、低ウェブデータ言語におけるヘルスクエリーの検索結果が必ずしも検索の言語であるとは限らないことを発見した。
低リソース言語でのクエリから分岐する検索結果は、アルゴリズムの失敗、意図的操作(意図的操作)、あるいはコンテンツ作成者によるアクティブな操作によるものである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:35:01 GMT)
Diffusion and Flow-based Copulas: Forgetting and Remembering Dependencies [9.0] 本稿では拡散と流れの原理に基づいてコプラをモデル化する手法を提案する。
各プロセスから忘れられた依存関係を覚えることを学ぶことで、コプラモデルを得る方法を示す。
実験により,提案手法が最先端のコプラ手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:33:29 GMT)
Adversarial Defense in Cybersecurity: A Systematic Review of GANs for Threat Detection and Mitigation [8.9] GAN(Generative Adversarial Networks)は、強力なアタックイネーブラーと有望な防御装置として機能する。
この調査は、GANベースのサイバーセキュリティにおける敵防衛を体系的にレビューする。
本稿では,防衛機能,GANアーキテクチャ,サイバーセキュリティドメイン,敵脅威モデルにまたがる4次元分類手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:17:57 GMT)
Beyond Language Barriers: Multi-Agent Coordination for Multi-Language Code Generation [8.9] XL-CoGenは、複数のプログラミング言語で高品質なコードを生成する。
中間表現、コード生成、翻訳、自動修復を統合する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:18:08 GMT)
Probability Signature: Bridging Data Semantics and Embedding Structure in Language Models [8.9] トークン間の意味的関係を反映した確率シグネチャのセットを提案する。
Pile corpus のサブセット上で Qwen2.5 アーキテクチャをトレーニングすることで,我々の作業を大規模言語モデル (LLM) に一般化する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:49:44 GMT)
Cross-Domain Underwater Image Enhancement Guided by No-Reference Image Quality Assessment: A Transfer Learning Approach [8.7] 単一水中画像強調(UIE)は難しい問題であるが、その開発は2つの大きな問題によって妨げられている。
水中参照データセットのラベルは擬似ラベルであり、教師付き学習におけるこれらの擬似基底真理を頼りにするとドメインの不一致につながる。
事前学習を通じてUIEの基本パラダイムをキャプチャするトランスUIEモデルを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:35:05 GMT)
CHURRO: Making History Readable with an Open-Weight Large Vision-Language Model for High-Accuracy, Low-Cost Historical Text Recognition [8.7] 本稿では,3Bパラメータを持つオープンウェイトVLMであるCHURROについて述べる。
CHURROは、これまでで最大の歴史的テキスト認識データセットであるCHURRO-DSで訓練されている。
CHURRO-DSテストセットでは、CHURROは82.3%(印刷)と70.1%(手書き)のレヴェンシュテイン類似性を達成した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:38:45 GMT)
A Unified Noise-Curvature View of Loss of Trainability [8.6] 継続的学習におけるトレーニング容易性(LoT)の喪失は、タスクが進化するにつれて、ステップが改善されなくなります。
バッチサイズ対応勾配雑音境界と曲率ボラティリティ制御境界の2つの相補的基準を導入する。
このしきい値を用いることで、各レイヤを安全な限界以下に維持する、単純なレイヤごとのスケジューラを構築します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:11:13 GMT)
Towards Self-Supervised Foundation Models for Critical Care Time Series [8.6] Bi-Axial Transformer (BAT) をベースとした危機ケアのための早期事前学習基盤モデルを提案する。
本研究では,学習源と異なるデータセット上でモデルを微調整し,効果的な伝達学習を実証する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:34:46 GMT)
Model-Agnostic AI Framework with Explicit Time Integration for Long-Term Fluid Dynamics Prediction [7.7] 本稿では,データ駆動AR予測に適した2段階微分Adams-Bashforth法の最初の実装について紹介する。
我々は、異なる将来のステップの重要性を動的に調整する3つの新しい適応重み付け戦略を開発した。
本フレームワークは,平均二乗誤差を0.125から0.002に削減する350のステップを正確に予測する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:12:38 GMT)
Runtime Analysis of Competitive co-Evolutionary Algorithms for Maximin Optimisation of a Bilinear Function [7.7] 共進化的アルゴリズムには、ハードウェア設計、ボードゲーム戦略の進化、ソフトウェアバグのパッチなど、幅広い応用がある。
これらのアルゴリズムはよく理解されておらず、しばしば病理学的行動によって制限される。
共進化的アルゴリズムが解を効率的にかつ確実に見つけることを予測できる理論を開発することは、オープンな挑戦である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:11:18 GMT)
Demystifying the Evolution of Neural Networks with BOM Analysis: Insights from a Large-Scale Study of 55,997 GitHub Repositories [7.6] 本稿では,NNソフトウェアに適した包括的データセット構造であるNNBOM(Neural Network Bill of Materials)を紹介する。
55,997のキュレートされたPyTorch GitHubリポジトリから大規模なNNBOMデータベースを作成し、TPL、PTM、モジュールをカタログ化しています。
ソフトウェアスケール、コンポーネントの再利用、ドメイン間の依存性に関する、ニューラルネットワークソフトウェア進化に関する包括的な実証的研究を行います。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:29:02 GMT)
Efficient & Correct Predictive Equivalence for Decision Trees [7.6] Rashomonの意思決定ツリー(DT)は、重要な使用方法を見つけます。
同じ分類関数、すなわち予測等価DTを計算するDTは、ラショーモン集合のかなりの部分を表すことができる。
本稿では,QM法において最悪の指数的実行時間と空間を誘導する決定木が存在することを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:36:23 GMT)
Towards Adapting Federated & Quantum Machine Learning for Network Intrusion Detection: A Survey [7.6] 本調査では,ネットワーク侵入検知システム(NIDS)とフェデレートラーニング(FL)の統合について検討する。
FLは、データのプライバシを保持しながら、分散デバイス間で協調的なモデルトレーニングを可能にする。
我々は、DDoS、MITM、ボットネット攻撃を含む脅威に対する、プライバシー保護技術、モデル圧縮アプローチ、および攻撃固有のフェデレーションソリューションについて、詳細な調査を行う。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:39:34 GMT)
A HyperGraphMamba-Based Multichannel Adaptive Model for ncRNA Classification [7.6] 非コードRNA(ncRNA)は、遺伝子発現調節と様々な疾患の病原性において重要な役割を担っている。
本稿では,HGMamba-ncRNAを提案する。HGMamba-ncRNAはHyperGraphMambaをベースとしたマルチチャネル適応モデルである。
3つの公開データセットで実施された実験は、HGMamba-ncRNAが精度やその他の指標で常に最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:31:49 GMT)
VLM See, Robot Do: Human Demo Video to Robot Action Plan via Vision Language Model [7.5] 視覚言語モデル(VLM)は、常識推論と一般化可能性において、ロボット工学に採用されている。
本研究では,VLMを用いて人間のデモ映像を解釈し,ロボットによるタスク計画を生成する。
これは、VLMが人間によるデモンストレーションを「見る」ことができ、それに対応する計画をロボットに「見る」ように説明できるためである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:44:46 GMT)
Heterogeneous Directed Hypergraph Neural Network over abstract syntax tree (AST) for Code Classification [7.5] 本稿では、抽象構文木(AST)を表すヘテロジニアス指向ハイパーグラフ(HDHG)と、コード分類のためのグラフを処理するヘテロジニアス指向ハイパーグラフニューラルネットワーク(HDHGN)を提案する。
提案手法は, コード理解を改善し, 対の相互作用を超えた高次データ相関を表現できる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:50:06 GMT)
Tokenization and Representation Biases in Multilingual Models on Dialectal NLP Tasks [7.2] 我々は、事前学習された多言語モデルにおける表現バイアスの尺度として、トークン化パリティ(TP)と情報化パリティ(IP)を関連付ける。
我々は,最先端デコーダのみのLLMと,方言分類,話題分類,抽出質問応答の3つのタスクからなるエンコーダベースモデルを比較した。
分析の結果,TPは統語的・形態的手法に依存したタスクの性能を予測し,IPは意味的タスクのパフォーマンスを予測できることがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:13:53 GMT)
SwissGPC v1.0 -- The Swiss German Podcasts Corpus [7.1] 我々はスイスGPC v1.0について紹介する。
データセットは、Schweizer Radio und FernsehenとYouTubeでホストされているトーク番組やポッドキャストへのリンクで構成されており、生のオーディオは約5400時間である。
セグメンテーションと弱い注釈の後、5000時間近い演説が残され、標準ドイツ語と共に7つの主要なスイスドイツ語方言地域をカバーした。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:13:44 GMT)
Large Language Models for Multilingual Previously Fact-Checked Claim Detection [7.1] 本稿では,複数言語による事実チェックによるクレーム検出のための大規模言語モデル (LLM) の総合評価について述べる。
20言語にまたがる7つのLLMをモノリンガル・クロスリンガル・セッティングで評価する。
この結果から,LLMは高リソース言語ではよく機能するが,低リソース言語では苦戦していることがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:17:32 GMT)
PolypSeg-GradCAM: Towards Explainable Computer-Aided Gastrointestinal Disease Detection Using U-Net Based Segmentation and Grad-CAM Visualization on the Kvasir Dataset [7.0] 大腸癌(CRC)は、世界中のがん関連死亡率と死亡率の主要な原因の1つである。
深層学習法は自動ポリープ解析の強力な可能性を示しているが、その限定的な解釈性は臨床応用の障壁である。
本稿では,U-NetアーキテクチャとGradient-weighted Class Activation Mapping (Grad-CAM)を統合し,透過的なPolypセグメンテーションを実現するフレームワークであるPolypSeg-GradCAMを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:32:31 GMT)
Analysis of approximate linear programming solution to Markov decision problem with log barrier function [6.8] マルコフ決定問題(MDP)の解決には2つの主要なアプローチがある。
動的プログラミング法は最も広く用いられ、古典的・近代的な強化学習(RL)の基礎を形成している。
本稿では,LPベースのMDPをより効果的かつ実用的な方法で解くための理論的基盤を確立する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:36:11 GMT)
FusedANN: Convexified Hybrid ANN via Attribute-Vector Fusion [6.7] 現在のソリューションでは、スケールしない脆弱なインデックスハックを頼りに、リコール、スピード、柔軟性をトレードオフしています。
本稿では,属性を埋め込み,属性を緩和するハイブリッドフレームワークFusedANNを紹介する。
FusedANNは、一致が不十分な場合に、セマンティックに最も近い属性を保存しながら、ハイクセマンティクスの下で正確なフィルタリングを行う。
これは、象徴的制約とベクトル類似性の間の原則付き、スケーラブルで、ブリッジを確立し、大規模、ハイブリッド、動的/MLワークロードのための新しい世代のフィルタ付き検索システムをアンロックする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:33:53 GMT)
A Generative Conditional Distribution Equality Testing Framework and Its Minimax Analysis [6.7] 我々のフレームワークはニューラルネットワークに基づく生成手法とサンプル分割技術に基づいて構築されている。
生成的置換に基づく条件分布等式テストと生成的分類精度に基づく条件分布等式テストの2つの特別試験を導入する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:57:51 GMT)
FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models [6.5] FS-DFM, Few-Step Discrete Flow-Matchingを紹介する。
品質を犠牲にすることなく高速に設計された離散フローマッチングモデル。
言語モデリングベンチマークでは、8つのサンプリングステップを持つFS-DFMが1,024ステップの離散フローベースラインでパープレキシティパリティを達成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:59:05 GMT)
Testing Fairness with Utility Tradeoffs: A Wasserstein Projection Approach [6.4] 本稿では,近似的公正性と有効性を共同で評価する統計的仮説テストフレームワークを提案する。
当社のフレームワークは,人口統計学の同等性基準に基づいて構築され,潜在的成果フレームワークに動機づけられた実用性尺度が組み込まれている。
このテストは、計算可能で、解釈可能で、機械学習モデルに広く適用でき、より一般的な設定に拡張可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:20:53 GMT)
LLMs Reproduce Stereotypes of Sexual and Gender Minorities [6.3] 我々は、二進圏を超えた性や性別のマイノリティに対する大きな言語モデルのバイアスについて研究する。
分析の結果, LLMは創造的執筆において性・性マイノリティのステレオタイプ表現を生成することがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:58:32 GMT)
An Optimized PatchMatch for Multi-scale and Multi-feature Label Fusion [6.3] 我々は,新しいパッチベースのラベル融合フレームワークを導入し,解剖学的構造のセグメンテーションを行う。
OPAL戦略は、類似パッチの検索に必要な計算時間を劇的に削減する。
OPALは、専門家間の変動に類似したセグメンテーション精度を作成した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:38:18 GMT)
Extrapolating Pauli Checks for Expectation Value Estimation on Noisy Quantum Devices [6.3] Pauli Check Extrapolation (PCE) は量子回路の誤差軽減手法である。
我々はPCEが最先端のロバスト・シャドウ推定よりも高い忠実性が得られることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:49:17 GMT)
Efficient Fine-Tuning of Large Language Models for Automated Medical Documentation [6.2] 本研究は,医学的対話から医療報告を自動生成することを目的とした,微調整型大規模言語モデル(LLM)であるMediGenを紹介する。
オープンソース事前訓練モデルの微調整に最先端の方法論を活用することで、MediGenは臨床相互作用の転写および要約において高い精度を達成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:59:19 GMT)
An Efficient Conditional Score-based Filter for High Dimensional Nonlinear Filtering Problems [6.2] Conditional Score-based Filter (CSF) は、セット変換器エンコーダと条件拡散モデルを利用して、リトレーニングなしで効率よく正確な後方サンプリングを実現する新しいアルゴリズムである。
ベンチマーク問題に対する実験により、CSFは様々な非線形フィルタリングシナリオにおいて優れた精度、堅牢性、効率を達成することが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:55:52 GMT)
Quasi-Synthetic Riemannian Data Generation for Writer-Independent Offline Signature Verification [6.2] 手書き署名検証のための準合成データ生成フレームワークを提案する。
対称正定値行列(SPD)空間における真のサンプルの小さなセットが種である。
メトリック学習フレームワークは、類似した異なるSPDポイントのペアを使用し、その後、実世界のデータセット上でそれをテストする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:28:16 GMT)
AutoEval: A Practical Framework for Autonomous Evaluation of Mobile Agents [6.0] モバイルエージェントを手作業なしでテストする評価フレームワークであるAutoEvalを提案する。
提案手法では,タスク報酬信号の自動生成に使用可能なUI状態変化表現を設計する。
我々はまた、我々のフレームワークを使って最先端のモバイルエージェントを評価し、その性能と限界について洞察を提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:11:34 GMT)
Choosing to Be Green: Advancing Green AI via Dynamic Model Selection [5.9] Green AIのダイナミックモデル選択は、最も持続可能なモデルを選択することで、AIの環境フットプリントを削減することを目的としている。
以上の結果から,グリーンAIのダイナミックモデル選択により,最大25%の省エネが可能であり,かつ,最も省エネ性の高い解の精度を著しく維持できることがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:02:13 GMT)
Large Language Models for Pedestrian Safety: An Application to Predicting Driver Yielding Behavior at Unsignalized Intersections [5.9] 大型言語モデル(LLM)は異種交通データからパターンを抽出するのに適しており、ドライバーと歩行者の相互作用の正確なモデリングを可能にする。
本稿では,GPT-4oが常に高い精度とリコールを達成するのに対して,Deepseek-V3は高精度であることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 00:25:19 GMT)
Large Language Models for Real-World IoT Device Identification [5.8] 異種ネットワークメタデータ上での言語モデリングタスクとしてデバイス識別を再構成するセマンティック推論パイプラインを導入する。
信頼性の高い監視を構築するために、IoT Inspectorデータセット用の高忠実度ベンダーラベルを生成します。
次に,LLaMA3.18Bの量子化モデルとカリキュラム学習を併用し,疎性および長期ベンダー分布下での一般化を支援する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:33:48 GMT)
Accurate crystal field Hamiltonians of single-ion magnets at mean-field cost [5.8] ランダムに回転した平均場状態の密度汎関数計算により、有効結晶場ハミルトニアンを導出する。
我々は実験的な低エネルギースペクトルと磁気特性を以前の試みよりも精度良く再現することができる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:39:56 GMT)
Robust superpixels using color and contour features along linear path [5.7] リニアパス(SCALP)を用いた輪郭アヒーレンス付き高精度で正規なスーパーピクセルを提供するフレームワークを提案する。
また、画素をスーパーピクセルに関連付ける際に、画像境界の交差を防止するために、輪郭前も使用される。
SCALPは、標準セグメンテーションデータセット上で広範囲に評価され、得られた結果は最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:35:19 GMT)
A Recovery Theory for Diffusion Priors: Deterministic Analysis of the Implicit Prior Algorithm [5.7] 高次元劣化測定は、逆問題における中心的な課題である。
生成拡散モデルにおける最近の進歩は、強力なデータ駆動型前駆体の提供において、顕著な実証的な成功を示している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:35:23 GMT)
Distinguishability of causal structures under latent confounding and selection [5.5] 我々は、因果グラフの同値類を新しい図形構造として定式化し、選択有理化有向グラフ(smDG)を定式化する。
2つの有向非巡回グラフと、選択された頂点とが同一のsmDGを持つことを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:00:22 GMT)
Enhancing Requirement Traceability through Data Augmentation Using Large Language Models [5.3] 本研究では,データ拡張に大規模言語モデル(LLM)を用いることにより,要求トレーサビリティにおけるデータ不足問題に対処することを目的とする。
提案手法は,LLMを用いたプロンプトベースの手法を用いて,拡張された要求とコード間のトレースリンクを生成する手法である。
実験の結果,F1スコアは最大28.59%向上した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:14:21 GMT)
2025 Southeast Asia Eleven Nations Influence Index Report [5.3] 本研究は,完全データ駆動・再現可能な東南アジア影響指数(SAII v3)を構築した。
本稿では,3階層の標準化チェーンであるQuantile-Box-Cox-min-maxを適用し,アウトレーヤと歪を緩和する。
経済は35-40%、軍事は20-25%、外交は20%、ソシオ技術は15%である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:01:02 GMT)
Mahānāma: A Unique Testbed for Literary Entity Discovery and Linking [5.2] Mah=an=amaは、サンスクリットでエンドツーエンドのエンティティディスカバリとリンクのための最初の大規模データセットである。
データセットは、5.5Kのユニークなエンティティにマッピングされた109K以上の名前付きエンティティを含む。
Mah=an=amaの複雑な物語構造は、広範囲な名前のバリエーションや曖昧さと相まって、解決システムに重大な課題をもたらす。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:42:39 GMT)
Incorporating External Controls for Estimating the Average Treatment Effect on the Treated with High-Dimensional Data: Retaining Double Robustness and Ensuring Double Safety [5.1] 外部の制御データが、多くの場合、はるかに大きなサンプルサイズで利用可能であるシナリオに対処する。
ATT用2重頑健性推定器に外部制御を組み込むと、パラドックス的に効率が低下する可能性がある。
本稿では,従来の手法よりも高効率な2重頑健な推定器を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:55:54 GMT)
Multi-Modal Artificial Intelligence of Embryo Grading and Pregnancy Prediction in Assisted Reproductive Technology: A Review [5.1] 主な課題は、胚のグレーディングにおける固有の主観性と、マルチモーダルデータ統合の非効率性である。
このような背景から、AI駆動技術の採用は、これらの問題に対処するための重要な戦略として現れている。
本稿では、胚のグレーディングと妊娠予測のためのAI応用の進歩を概観する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:44:12 GMT)
Simple, Fast and Efficient Injective Manifold Density Estimation with Random Projections [5.1] 本稿では,インジェクティブ正規化フローの原理的フレームワークであるRandom Projection Flows (RPFs)を紹介する。
RPFはランダム行列理論とランダム射影幾何学のツールを利用する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:01:18 GMT)
When Does Meaning Backfire? Investigating the Role of AMRs in NLI [5.0] 自然言語推論(NLI)において、抽象的意味表現(AMR)という形で意味情報を追加することが、事前学習された言語モデルをより一般化するのに役立つかどうかを検討する。
AMR を NLI に組み込んだ実験により, 微調整条件と微調整条件の両方において AMR の存在がモデル一般化を阻害し, 同時に AMR を刺激すると GPT-4o がわずかに向上することが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:57:58 GMT)
Sample what you cant compress [5.0] 拡散に基づく損失の下で、連続エンコーダとデコーダの学習方法を示す。
提案手法は,GANベースのオートエンコーダと比較して,再構築品質が向上することを示す。
また, 得られた表現は, 最先端のGANに基づく損失から得られた表現と比較して, 潜時拡散モデルによりモデル化し易いことを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:56:48 GMT)
Multilingual Hope Speech Detection: A Comparative Study of Logistic Regression, mBERT, and XLM-RoBERTa with Active Learning [4.9] 本稿では,能動的学習手法とトランスフォーマーモデルを用いた希望音声検出のための多言語フレームワークを提案する。
実験は英語、スペイン語、ドイツ語、ウルドゥー語で行われた。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:54:30 GMT)
Games Are Not Equal: Classifying Cloud Gaming Contexts for Effective User Experience Measurement [4.8] ネットワークトラフィックを分析し,クラウドゲーム体験をリアルタイムに計測する手法を提案する。
本手法は,ゲーム開始から5秒以内にゲームタイトルを分類することができる。
このリージョンのNVIDIAクラウドゲームサーバをホストするISPにデプロイしています。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:02:24 GMT)
Energy Use of AI Inference: Efficiency Pathways and Test-Time Compute [4.8] 非生産推定と仮定はエネルギー使用量を4-20倍に超過することができる。
モデル,サービスプラットフォーム,ハードウェアレベルでの達成可能な効率向上の定量化を行う。
10億のクエリを毎日0.8GWhと見積もる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:32:01 GMT)
RAG Security and Privacy: Formalizing the Threat Model and Attack Surface [4.8] Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)と外部文書検索を組み合わせて、より正確で基礎的な応答を生成する自然言語処理における新興のアプローチである。
既存の研究では、RAGがトレーニングデータ記憶や敵対的プロンプトを通じて機密情報を漏洩し、RAGシステムがこれらの脆弱性の多くを継承していることが示されている。
これらのリスクにもかかわらず、現在、RAGシステムの脅威状況を定義する公式なフレームワークは存在しない。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:11:35 GMT)
ToolBrain: A Flexible Reinforcement Learning Framework for Agentic Tools [4.8] ToolBrainはフレキシブル強化学習(RL)を備えたエージェントモデルで使用されるコーチングツールのフレームワーク
GRPOやDPOといったRLアルゴリズムや教師あり学習など、幅広いトレーニング戦略をサポートしている。
効率的な開発のための大規模から小規模なモデルからの知識蒸留、ツール記述からのタスクの自動生成、シームレスなツール検索、UnslothによるQLoRAによる効率的な微調整パイプライン、ビット/バイトによる量子化推論など、有用な機能を備えている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:01:05 GMT)
Wrapped Gaussian on the manifold of Symmetric Positive Definite Matrices [4.7] 円形および非平坦なデータ分布は、データ科学の様々な領域で広く使われている。
このようなデータの基盤となる幾何学を考慮に入れるための原則的なアプローチは、重要なものである。
この研究は、古典的な機械学習と統計手法をより複雑で構造化されたデータに拡張するための基礎となる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:05:02 GMT)
LiDAR MOT-DETR: A LiDAR-based Two-Stage Transformer for 3D Multiple Object Tracking [4.7] ライダーをベースとした2段式DETRインバータ,スムーズかつトラッカーを提案する。
よりスムーズなステージは、移動中の時間窓を越えて、市販の検出器からライダー物体の検出を洗練させる。
トラッカーステージはDETRベースのアテンションブロックを使用して、トラックされたオブジェクトと、ポイントクラウドをコンテキストとして洗練された検出とを関連付けることで、トラックを時間にわたって維持する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:44:49 GMT)
On the Rate of Convergence of Kolmogorov-Arnold Network Regression Estimators [4.6] Kolmogorov-Arnold Networks (KAN) は多変量関数近似のための構造化および解釈可能なフレームワークを提供する。
加法およびハイブリッド加法-乗法の両方が極小マックス-最適収束率に達することを証明した。
B-スプラインにおける最適な結び目数を選択するためのガイドラインを導出する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:22:03 GMT)
Realization of Graphene Quantum Dots for Innovative Biosensor Development and Diverse Applications [4.6] グラフェン量子ドット(GQD)は、従来のQDよりも安全で安定した代替品として出現している。
GQDはハニカム格子炭素原子であり、ユニークな電子的および光学的性質を持つ。
バイオメディカル、電子、エネルギーストレージの分野では有望な候補だ。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:22:58 GMT)
Evading Toxicity Detection with ASCII-art: A Benchmark of Spatial Attacks on Moderation Systems [4.5] ASCIIアートの形で空間的に構造化されたテキストの解釈に失敗する言語モデルを利用した、毒性検出モデルに対する敵対的攻撃の新たなクラスを導入する。
我々の攻撃は、最先端の大規模言語モデルと専用モデレーションツールの多様なセットで完璧なアタック成功率(ASR)を達成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:50:44 GMT)
A Simple Data Augmentation Strategy for Text-in-Image Scientific VQA [4.5] 合成データとEXAMS-Vを混合した小さな多言語マルチモーダルモデルを微調整すると、13言語で顕著な利得が得られる。
本稿では,視覚コンテンツとテキストコンテンツの両方を単一の画像に埋め込むことにより,新たなパラダイムを提案する。
この「text-in-image」フォーマットでのトレーニングデータの不足に対処するため、既存の分離された画像テキストペアを統一された画像に変換することで、新しいデータセットを合成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:41:04 GMT)
Investigating Security Implications of Automatically Generated Code on the Software Supply Chain [4.4] ソフトウェアサプライチェーン(SSC)攻撃は、世界社会に重大なリスクをもたらす。
大規模言語モデル(LLM)のようなコード生成技術は、開発者コミュニティで広く利用されている。
LLMは、製造、誤情報、時代遅れのトレーニングデータへの依存など、コードを生成する際に固有の問題に悩まされる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:15:17 GMT)
Geometric Autoencoder Priors for Bayesian Inversion: Learn First Observe Later [4.3] 物理応答の幾何認識生成モデルを学ぶためのフレームワークであるGABI(Geometric Autoencoders for Bayesian Inversion)を紹介する。
本研究では, 矩形領域上の定常熱, 翼まわりを流れるレイノルズ平均ナビエストークス(RANS), ヘルムホルツ共鳴と3次元車体へのソースローカライゼーションについて検討した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:38:11 GMT)
SiniticMTError: A Machine Translation Dataset with Error Annotations for Sinitic Languages [4.3] SiniticMTErrorは、既存の並列コーパス上に構築された新しいデータセットで、エラースパン、エラータイプ、エラー重大度アノテーションを提供する。
我々のデータセットは、エラー検出機能を備えた微調整モデルを利用するためのMTコミュニティのリソースとして役立ちます。
本稿では,言語話者による厳密なアノテーションプロセスについて報告し,アノテーション間の合意,反復的フィードバック,エラータイプおよび重大度パターンの分析を行った。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:50:09 GMT)
LatentGuard: Controllable Latent Steering for Robust Refusal of Attacks and Reliable Response Generation [4.3] LATENTGUARDは、行動アライメントと教師付き潜在空間制御を組み合わせて、解釈可能で正確な安全操縦を行うフレームワークである。
本研究は, 実用性を損なうことなく, 安全性制御性と応答解釈性の両方を向上することを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:31:54 GMT)
Integrated Forecasting of Marine Renewable Power: An Adaptively Bayesian-Optimized MVMD-LSTM Framework for Wind-Solar-Wave Energy [4.1] 総合的な音波海洋システムは、沖合と沿岸部でクリーンな電気を供給することを広く約束している。
複数のリソースの補完を利用することで、そのようなシステムは単一ソース出力の不確定性とボラティリティを効果的に軽減することができる。
正確な超短命予測は、安全な運用とプロアクティブディスパッチの最適化に不可欠である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:29:42 GMT)
Entropic and operational characterizations of dynamic quantum resources [4.1] 自由条件最小エントロピー(FCME)と呼ばれる量子条件最小エントロピーの資源論的一般化を提案する。
我々は、FCMEに基づく相互情報的量の観点から、状態やチャネルの資源大域的ロバスト性に関する情報理論的解釈を導出する。
通信課題における自由チャネルに対するチャネルの運用上の優位性として,適切に定義されたロバスト性に基づく通信路の計測が可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:40:34 GMT)
Resource-Efficient Adaptation of Large Language Models for Text Embeddings via Prompt Engineering and Contrastive Fine-tuning [4.0] 大規模言語モデル(LLM)は自然言語処理(NLP)の基盤となっている。
プリトレーニングされたデコーダのみのLLMの適応戦略について検討する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:55:48 GMT)
Staying on the Manifold: Geometry-Aware Noise Injection [3.9] 学習中の入力の摂動は学習関数の勾配を暗黙的に規則化することを示した。
従来の研究は、データの構造を考慮せずに、入力空間に周囲ノイズを加えることを主に検討していた。
入力空間が居住する低次元多様体を考慮に入れた幾何対応の入力雑音を追加する方法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:58:38 GMT)
Pi-Transformer: A Physics-informed Attention Mechanism for Time Series Anomaly Detection [3.9] 2つの注意経路を持つ物理インフォーム変換器であるPi-Transformerを提案する。
このモデルは、アライメント重み付けされた再構成信号と、タイミングと位相破壊を強調するミスマッチ信号を組み合わせる。
Pi-Transformerは最先端または競争性の高いF1を実現し、特にタイミングと位相破壊異常に強い。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:47:48 GMT)
Hierarchical Bayesian Operator-induced Symbolic Regression Trees for Structural Learning of Scientific Expressions [3.9] 我々は,木構造的記号表現のアンサンブルとして科学法則を表す記号回帰の階層的ベイズ的枠組みを開発する。
我々はベイズ後部濃度の最小値に近い値を確立し、シンボル回帰の文脈で最初の厳密な保証を提供する。
実験的な評価は,提案手法の最先端の競合モジュールに対する堅牢な性能を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:42:25 GMT)
Feasibility of Structuring Stress Documentation Using an Ontology-Guided Large Language Model [3.8] Ontology Pitfall Scanner! を用いたメンタルストレスオントロジー(MeSO)の開発と専門家による検証
オントロジー誘導大言語モデル(LLM)は、物語テキストからストレス関連情報を抽出するために用いられる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:10:57 GMT)
Revisiting Residual Connections: Orthogonal Updates for Stable and Efficient Deep Networks [3.8] 残余接続は、深いニューラルネットワークにとって重要なものであり、消滅する勾配を緩和することでより深い深さを可能にする。
通常の残余更新では、モジュールの出力が入力ストリームに直接追加される。
これは、既存のストリーム方向を主に強化または修正する更新につながる可能性があるため、モジュールの能力が全く新しい機能を学ぶのに過小評価される可能性がある。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:40:31 GMT)
AI-Specific Code Smells: From Specification to Detection [3.8] SpecDetect4AIは、AI固有のコードの臭いの仕様と検出のためのツールベースのアプローチである。
我々は、AI固有の22のコードの臭いを特定し、826のAIベースシステム(2000万行のコード)上でSpecDetect4AIを評価した。
以上の結果から,SpecDetect4AIはAI固有のコードの匂いの特定と検出を専用ルールでサポートし,大規模AIベースのシステムを効果的に分析できることが示唆された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:09:09 GMT)
Responsible AI Technical Report [3.8] KTは、AIサービスの安全性と信頼性を保証するために、Responsible AI (RAI)アセスメント方法論とリスク軽減技術を開発した。
我々は、KTのAIリスク分類に基づくモデル安全性とロバスト性を検証する信頼性の高い評価手法を提案する。
また、特定されたAIリスクを管理し緩和するための実用的なツールも提供します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:26:33 GMT)
Weak anharmonicity sensing by single- and two-photon drives [3.7] 単一光と2光の両方の駆動による光キャビティ内の弱いカーの非線形性を検知する手法を提案する。
2光子駆動により誘導されるCP周辺の平均光子数は光キャビティのカー係数に敏感に依存することを示した。
単一光子駆動は、量子ノイズを抑え、信号対雑音比を向上する有効な方法であることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:39:47 GMT)
OR-Toolformer: Modeling and Solving Operations Research Problems with Tool Augmented Large Language Models [3.7] 大規模言語モデル(LLM)は強い数学的推論を示す。
Llama-3.1-8B-Instructを半自動データ合成パイプラインで微調整するOR-Toolformerを導入する。
4つの標準ベンチマークのうち、OR-Toolformerは最大80.1%の実行精度を達成している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:42:40 GMT)
DS-Diffusion: Data Style-Guided Diffusion Model for Time-Series Generation [3.7] 時系列生成タスクのためのデータスタイル誘導拡散モデル(DS-Diffusion)を提案する。
DS-Diffusionは、条件付きガイダンスを導入するためにフレームワーク全体をトレーニングするのを避ける。
生成されたサンプルは、それらが発するデータスタイルを明確に示すことができる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:15:05 GMT)
Benchmarking Web API Integration Code Generation [3.6] LLMがWeb API呼び出しコードを生成する能力を評価するために設計されたデータセットと評価パイプラインを提案する。
オープンソースのLLMを使った実験では、API呼び出しの生成が大きな課題となることが分かりました。
評価済みのオープンソースモデルはいずれも40%以上のタスクを解決できなかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:36:44 GMT)
Redemption Score: A Multi-Modal Evaluation Framework for Image Captioning via Distributional, Perceptual, and Linguistic Signal Triangulation [3.5] Redemption Score(RS)は、3つの相補的な信号を三角測量することによって画像キャプションをランク付けする新しいフレームワークである。
Flickr8kベンチマークでは、RSはKendall-$tau$ 58.42を達成した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:01:31 GMT)
Investigating Traffic Accident Detection Using Multimodal Large Language Models [3.4] 本研究では,交通事故の検出と記述を行うマルチモーダル大規模言語モデル(MLLM)のゼロショット機能について検討する。
その結果、PixtralはF1スコア71%、リコール83%のトップパフォーマーとなった。
これらの結果は、MLLMと高度な視覚分析技術の統合の可能性を示している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:42:59 GMT)
A GEN AI Framework for Medical Note Generation [3.4] MediNotesは、医療会話からSOAP(Subjective, Objective, Assessment, Plan)ノートの作成を自動化するために設計された高度な生成AIフレームワークである。
MediNotesはLarge Language Models (LLM)、Retrieval-Augmented Generation (RAG)、Automatic Speech Recognition (ASR)を統合し、テキスト入力と音声入力の両方をリアルタイムで、記録されたオーディオからキャプチャし、処理する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:00:37 GMT)
Monitoring Violations of Differential Privacy over Time [3.4] 開発や展開の過程で変化を経験できるメカニズムの持続的な監査について検討する。
最先端の(静的な)監査を何度も実行するには、過剰なサンプリング努力が必要である。
本稿では,アルゴリズムの展開履歴全体から情報を抽出する新しいモニタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:15:51 GMT)
Discovering Association Rules in High-Dimensional Small Tabular Data [3.4] Association Rule Miningは、命題ルールの形式でデータセットの特徴間のパターンを見つけることを目的としている。
高次元設定では、ルールの爆発と計算オーバーヘッドにより、一般的なアルゴリズムのアプローチは実用的ではない。
Aerial+のようなニューロシンボリックな手法は、最近ARMの規則の爆発に対処するために提案されている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:37:53 GMT)
Labeling Free-text Data using Language Model Ensembles [3.3] 本稿では,プライバシ制約下での自由テキストデータにおける所定のトピックのラベル付けを強化する枠組みを提案する。
我々は,摂食障害関連フォーラムから公開されているRedditデータと摂食障害患者の自由テキスト応答を用いて,アンサンブルアプローチを評価した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:35:52 GMT)
TALEC: Teach Your LLM to Evaluate in Specific Domain with In-house Criteria by Criteria Division and Zero-shot Plus Few-shot [3.0] 本稿では,モデルに基づく評価手法 TALEC を提案する。
ユーザは自分の評価基準を柔軟に設定でき、インコンテキストラーニング(ICL)を使って審査員にこれらの評価基準を教えることができる。
TALECは人間の嗜好を正確に反映する強力な能力を示し、人間の判断と80%以上の相関を達成している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:33:59 GMT)
Fisher information flow in artificial neural networks [3.0] 本稿では,パラメータ推定タスクを実行するANNを通して,フィッシャー情報の流れをモニタリングする手法を提案する。
最適な推定性能はフィッシャー情報の最大伝送量に対応することを示す。
これにより、独立したバリデーションデータセットの必要性を解消するネットワークトレーニングのためのモデルフリーの停止基準が提供される。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:57:23 GMT)
Quantum Computing Beyond Ground State Electronic Structure: A Review of Progress Toward Quantum Chemistry Out of the Ground State [3.0] 量子化学を基底状態を超えて理解するための量子計算の進歩と可能性について概観する。
我々は、これらのアプリケーションが共有するアルゴリズムやその他の考慮事項、およびそれらに固有の違いについて論じる。
この議論は、将来量子計算が実験化学にどのように役立つか、さらなる研究を促すことを願っている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:36:30 GMT)
B5GRoam: A Zero Trust Framework for Secure and Efficient On-Chain B5G Roaming [3.0] B5GRoamは、セキュアでプライバシーを保護し、スケーラブルなローミング決済のための、新しいオンチェーンおよびゼロトラストフレームワークである。
B5GRoamは暗号的に検証可能なコール詳細レコード (CDR) プロトコルを導入した。
スループットは7,200tx/s以上で、強力なプライバシと大幅なコスト削減を実現しています。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:30:35 GMT)
Assay2Mol: large language model-based drug design using BioAssay context [3.0] Assay2Molは、早期薬物発見のための大規模言語モデルに基づくワークフローである。
Asthma2Molは、新しいターゲットに似たターゲットを含む既存のアッセイレコードを検索し、コンテキスト内学習を用いて候補分子を生成する。
Asthma2Molは、ターゲットタンパク質の構造の候補分子を生成する機械学習アプローチよりも優れている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:03:34 GMT)
Fidelity zeros and Lee-Yang theory of quantum phase transitions [3.0] 我々は、対称性の破れによって引き起こされる忠実度ゼロから量子相転移を理解するための統一的な枠組みを開発する。
忠実度ゼロはリー=ヤンの定理に従い、臨界点の近くで忠実度エッジを生じさせる。
複素磁場下での1次元および2次元強磁性イジングモデルにおける忠実度ゼロの数値解析と数値計算を行った。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:45:10 GMT)
WEE-Therapy: A Mixture of Weak Encoders Framework for Psychological Counseling Dialogue Analysis [2.9] Weak Ensemble機構を組み込んだマルチタスクオーディオLLMであるWEE-Therapyを提案する。
新たなデュアルルーティング戦略は、安定的でデータに依存しないドメイン知識と、動的でデータに依存しない専門家選択を組み合わせたものだ。
We show that WEE-Therapy achieve significant performance gains across all task with least parameters overhead。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:43:53 GMT)
Exploration with Foundation Models: Capabilities, Limitations, and Hybrid Approaches [2.9] VLM指導は早期サンプル効率を著しく向上させることができることを示す。
本結果は,エンド・ツー・エンド・エンド・コントロールではなく,基礎モデルを用いて探索をガイドする可能性や制約を明らかにするものである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:25:15 GMT)
Less is More: The Effectiveness of Compact Typological Language Representations [2.9] 言語的特徴データセットであるEL+は、言語間関係のモデル化には有用であるが、その高次元性と空間性は距離メトリクスの有効性を制限している。
本稿では,特徴選択とインプットを組み合わせることで,特徴空間を最適化するパイプラインを提案する。
言語的距離アライメントと下流タスクにおいて,これらの特徴部分集合を評価し,言語型学の小型表現により,より情報的距離の指標が得られることを示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:55:56 GMT)
Direct Analysis of Zero-Noise Extrapolation: Polynomial Methods, Error Bounds, and Simultaneous Physical-Algorithmic Error Mitigation [2.8] ゼロノイズ外挿法(ゼロノイズ外挿法、ZNE)は、人工的に回路ノイズを増幅し、結果をノイズのない回路に外挿する量子誤差緩和法である。
本稿では、これらの課題を包括的に分析し、誤りを定量化するバイアスと分散を提示する。
本稿では,時間ステップサイズと雑音レベルを同時スケーリングすることで,回路とアルゴリズムの誤りを同時に軽減する手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:59:42 GMT)
Achieving Fair Skin Lesion Detection through Skin Tone Normalization and Channel Pruning [2.8] そこで本研究では,ロスによる皮膚の正常化とデータ拡張手法を提案する。
皮膚のトーン正規化では、ITAは皮膚のトーンタイプを推定し、データセットのバランスのためにターゲットのトーンに自動的に調整するために使用される。
本手法の有効性をISIC 2019データセットで検証した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:06:31 GMT)
Advancing Universal Deep Learning for Electronic-Structure Hamiltonian Prediction of Materials [2.8] 我々は、ハミルトン予測のための普遍的な深層学習パラダイムを進化させるために、方法論とデータセットの双方に貢献する。
NextHAMは、効率的で一般化可能な電子構造ハミルトニアン予測のためのニューラルネットワークE(3)対称性および表現的補正法である。
Materials-HAM-SOCの実験結果から、NextHAMはハミルトニアンやバンド構造を予測するのに優れた精度と効率を達成することが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:30:58 GMT)
Emergent Risk Awareness in Rational Agents under Resource Constraints [2.7] この研究は、生存圧力下で活動するAIエージェントの創発的行動の理解と解釈可能性を高めることを目的としている。
我々は、生存駆動の嗜好シフトの影響を定量化する理論的および経験的な結果を提供する。
リスク探索やリスク回避行動の出現を緩和するメカニズムを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:44:56 GMT)
A Comparative Benchmark of Real-time Detectors for Blueberry Detection towards Precision Orchard Management [2.7] 本研究では,先進的リアルタイム物体検出器の比較ベンチマーク解析を行った。
このデータセットは、2022-2023シーズンにスマートフォンで収集された671枚の天蓋画像からなる。
YOLOモデルのうち、YOLOv12mはmAP@50の93.3%で最高の精度を達成した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:42:24 GMT)
Superdiffusive transport in chaotic quantum systems with nodal interactions [2.7] 超拡散輸送を示す節間相互作用を持つ$d$次元で相互作用するフェルミオン量子モデルのクラスを導入する。
相互作用の結節構造が、拡散定数のばらつきをもたらす長寿命準粒子励起を引き起こすことを、非摂動的に確立する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:56:23 GMT)
PS3: A Multimodal Transformer Integrating Pathology Reports with Histology Images and Biological Pathways for Cancer Survival Prediction [2.6] 計算オンコロジーにおける現在のマルチモーダル融合アプローチは、主に、複数のギガピクセルのヒストロジー全体のスライド画像(WSI)をゲノムデータや転写データと統合することに焦点を当てている。
本稿では,両立表現を生成するプロトタイプベースの手法を提案し,生存予測のためにTransformerベースの融合モデルを用いて統合する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:37:52 GMT)
Surrogate Modeling of 3D Rayleigh-Benard Convection with Equivariant Autoencoders [2.6] 本稿では、同変畳み込み自己エンコーダと同変畳み込みLSTMからなる終端から終端までの同変代理モデルを提案する。
サンプルとパラメータの効率が大幅に向上し、さらに複雑なダイナミックスへのスケーリングが向上した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:36:11 GMT)
SHMoAReg: Spark Deformable Image Registration via Spatial Heterogeneous Mixture of Experts and Attention Heads [2.6] SHMoARegという名前のエンコーダとデコーダの両方にMixture of Experts (MoE) 機構を応用した新しいエキスパート誘導型DIRネットワークを提案する。
MoARegは、各画像トークンに対するアテンションヘッドの最適な組み合わせを動的に選択することで、特徴抽出の特殊化を強化する。
2つの公開データセットで実施された実験は、様々な方法に対して一貫した改善が見られ、腹部CTデータセットのDiceスコアが60.58%から65.58%に顕著に増加した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:50:04 GMT)
Smaller is Better: Enhancing Transparency in Vehicle AI Systems via Pruning [2.6] ポストホックの説明は、接続された自動運転車に透明性を提供する。
これらの説明の品質と信頼性は、モデル決定を表現する上での矛盾と忠実性の欠如のためにしばしば疑問視される。
本稿では, 自然訓練, 対人訓練, プルーニングの3つの方法が, ポストホックな説明の質に及ぼす影響について検討する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:11:59 GMT)
Entropy Computing: A Paradigm for Optimization in an Open Quantum System [2.5] ハイブリッドコンピュータの構築によるエントロピー計算の実現可能性を示す。
提案するエントロピー・コンピューティング・パラダイムは、幅広いNPハード最適化問題に対処するためのスケーラブルで多用途なプラットフォームとして機能することを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:01:58 GMT)
MSCoD: An Enhanced Bayesian Updating Framework with Multi-Scale Information Bottleneck and Cooperative Attention for Structure-Based Drug Design [2.4] 提案するMSCoDは,構造に基づく薬物設計のための新しいベイズ更新に基づく生成フレームワークである。
マルチスケールインフォメーション・ボトルネック (MSIB) を開発した。
MSCoDはベンチマークデータセットの最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:51:07 GMT)
Personality Vector: Modulating Personality of Large Language Models by Model Merging [2.4] 大規模言語モデル(LLM)におけるパーソナリティ変調の新しい手法を提案する。
我々は、与えられた性格特性に基づいて、微調整モデルから事前訓練されたモデルの重みを減らし、人格ベクトルを構築する。
実験により、人格ベクトルは特性強度を連続的に制御し、複数の特徴の合成を支援することが示されている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 03:11:28 GMT)
Calibrated Reasoning: An Explanatory Verifier for Dynamic and Efficient Problem-Solving [2.4] そこで本稿では,評価スコアと関連する自然言語推論値を生成するペアワイズ説明検証手法を提案する。
我々の検証器は、ベスト・オブ・nやセルフ・リフレクションのようなテスト時間戦略の精度と効率を向上させる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:36:00 GMT)
Causal-Counterfactual RAG: The Integration of Causal-Counterfactual Reasoning into RAG [2.3] 大規模言語モデル(LLM)は自然言語処理(NLP)を変換し、大規模な事前学習知識を統合することで多様な応用を可能にしている。
Retrieval-Augmented Generation (RAG)は、検索機構と生成モデルを組み合わせて文脈理解を改善することでこの問題に対処する。
本稿では,因果関係を表す明示的な因果グラフを検索プロセスに統合し,因果構造に基づく反因果推論を取り入れた新しいフレームワークであるCausal-Counterfactual RAGを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:48:43 GMT)
Oversampling and Downsampling with Core-Boundary Awareness: A Data Quality-Driven Approach [2.3] 本稿では,2種類のデータを系統的に識別し,識別する手法を提案する。
高品質な意思決定関連データを優先順位付けすることで、私たちのアプローチはテキスト、マルチモーダル、そして自己教師型学習シナリオにまで拡張できます。
この研究は、データ効率の学習における将来の研究の道を開いた。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:55:07 GMT)
LLMs as a synthesis between symbolic and distributed approaches to language [2.2] 言語のためのディープラーニングモデルは、実際には2つの伝統の合成を表している、と私は主張する。
LLMにおけるモルフォシンタクティック知識のかなりの部分が, ほぼ離散的にコード化されていることを示す, 解釈可能性に関する最近の研究をレビューする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:06:37 GMT)
Engineering RAG Systems for Real-World Applications: Design, Development, and Evaluation [2.2] 大規模言語モデル(LLM)を外部知識に基盤付けるための重要なアプローチとして,検索-拡張生成(RAG)システムが登場している。
本稿では,ガバナンス,サイバーセキュリティ,農業,産業研究,医療診断の5つの領域固有のRAGアプリケーションについて述べる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:46:21 GMT)
Sub-femtosecond stabilization of multicore fiber for high-fidelity quantum networking at 100% duty cycle [2.1] MCFコアは高いノイズ相関を持ち、様々な用途に利用できる。
一方のコア上で100アト秒の統合ジッタを、他方のコアから派生した位相情報を用いて実現する。
MCFによる我々の結果は、量子チャネル上で100%のデューティサイクルを持つ超安定量子ネットワークに対する有望なアプローチである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:59:15 GMT)
The Conductor and the Engine: A Path Towards Co-Designed Reasoning [2.1] LLM推論は、内部モデルトレーニングと外部エージェントオーケストレーションによって駆動される、広範なテスト時間計算に依存している。
この能力とコストのトレードオフを分析し、より小さなオープンソースモデルに対して、モデルのサイズを何倍も上回るように、最適化された推論ワークフロー(cepo)を導入します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:09:43 GMT)
Explainable Sentiment Analysis with DeepSeek-R1: Performance, Efficiency, and Few-Shot Learning [2.1] DeepSeek-R1はOpenAIのGPT-4oとGPT-4o-miniに対するオープンソース推論モデルである。
実験の結果、DeepSeek-R1は5クラスの感情で91.39%のF1スコア、バイナリタスクで99.31%の精度を5ショットで達成した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:27:29 GMT)
OpenGVL - Benchmarking Visual Temporal Progress for Data Curation [2.1] データ不足は、ロボティクスの進歩を推し進める上で最も制限される要因の1つだ。
野生で利用可能なロボットデータの量は指数関数的に増えている。
信頼性の高い時間的タスク完了予測は、このデータを自動アノテートし、大規模にキュレートするのに役立ちます。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:27:53 GMT)
Counterfactual Cocycles: A Framework for Robust and Coherent Counterfactual Transports [2.1] 対実的な結果に対する共同分布(すなわちカップリング)の推定は、パーソナライズされた意思決定と治療リスク評価の中心である。
代数構造を用いてコヒーレンスと識別可能性を保証する反事実輸送のためのフレームワークである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:10:30 GMT)
Spectator-Aware Frequency Allocation in Tunable-Coupler Quantum Architectures [2.1] 本稿では,SNAILをベースとした超伝導量子モジュールの設計制約について述べる。
モジュールの半径が増加するにつれて,周波数群集がゲートの忠実度に与える影響を解析する。
我々は、オブザーバによるエラーを最小限に抑えるスケーラブルな周波数割り当て戦略を実証する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:21:21 GMT)
Table Detection with Active Learning [2.0] アクティブラーニングは、最も有益なサンプルを選択することで、アノテーションコストを最小限に抑える、有望なソリューションである。
提案手法は,モデル一般化を改善する代表例の選択を保証する。
その結果,ALに基づくサンプル選択は,ランダムサンプリングよりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:22:30 GMT)
Modeling and Control of Deep Sign-Definite Dynamics with Application to Hybrid Powertrain Control [1.9] 深層学習は、第一原理モデリングが難しい物理システムやシステムにますます使われる。
我々は,ジャコビアンエントリの制約を満たす新しいタイプの深層学習モデルを開発する。
2タンク方式のハイブリッドシステムでは,提案手法は既存手法よりも制御入力を改善する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:15:26 GMT)
Amplituhedra for Generic Quantum Processes from Computation-Scattering Correspondence [1.9] 我々は、トポロジカル量子ニューラルネットワーク(TQNN)が量子計算の普遍性を実現する方法を示す。
次に、TQNNとAmplituhedraの正式な対応を示し、汎用量子プロセスにおけるAmplituhedraの存在を支持する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:43:11 GMT)
(2+1)D Quantum Electrodynamics at Finite Density on a Quantum Computer [1.9] 2+1)次元量子力学を2つのフェルミオンフレーバーを含む量子コンピュータ上で有限密度で探索する。
本手法では、ガウスの法則を強制する量子回路構造とともに、効率的なゲージ不変アンサッツを用いる。
我々は,この手法を大規模システムに拡張するためのハードウェアの限界と将来性について論じる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:51:52 GMT)
Federation of Agents: A Semantics-Aware Communication Fabric for Large-Scale Agentic AI [1.8] エージェントのフェデレーション(FoA)は,マルチエージェントのコーディネーションを動的かつ能力駆動的なコラボレーションに変換する分散オーケストレーションフレームワークである。
FoAは、セマンティック埋め込みを通じてエージェント機能を検索可能にするマシン可読プロファイルであるVersioned Capability Vectors (VCVs)を導入した。
単一モデルベースラインよりも13倍の改善が見られ、クラスタリング強化労働力は複雑な推論タスクに特に有効である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:38:06 GMT)
Longitudinal Monitoring of LLM Content Moderation of Social Issues [1.8] 大規模言語モデル(LLM)のアウトプットは、不透明で頻繁に変化する企業のコンテンツモデレーションポリシーとプラクティスによって形作られています。
我々は、LLMの拒絶を公に測定し追跡する縦断監査システムであるAI Watchmanを紹介する。
400以上の社会的課題のデータセットを使用して、Open AIのモデレーションエンドポイント、GPT-4.1、GPT-5、DeepSeekを監査する。
企業方針の変更、公に発表されていないものでさえ、AI Watchmanによって検出できる証拠を見つける。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:06:21 GMT)
Developer Productivity With and Without GitHub Copilot: A Longitudinal Mixed-Methods Case Study [1.7] 本研究では,ジェネレーティブAI(GenAI)ツールであるGitHub Copilotが開発者の活動と生産性に与える影響について検討した。
NAV ITのGitHubリポジトリ703から,2年間に26,317のユニークな非マージコミットを分析した。
分析の結果、Copilotが導入される前であっても、Copilotを使用する個人は非ユーザよりも一貫してアクティブであることが判明した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:55:56 GMT)
GraspFactory: A Large Object-Centric Grasping Dataset [1.7] GraspFactoryは、Franka PandaとRobotiq 2F-85のグリップに対して、合計で109万以上の6-DoFグリップを含むデータセットである。
本研究では,GraspFactoryのサブセット上でトレーニングされたそのようなモデルの,シミュレーションと実世界の両方の設定における一般化能力を実証する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:29:46 GMT)
Play by the Type Rules: Inferring Constraints for LLM Functions in Declarative Programs [1.7] 本稿では,LLM関数の適切な型付けを実現するための効率的な解を提案する。
マルチホップ質問応答データセットの精度は7%向上し、同等のソリューションよりも53%のレイテンシが向上した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:02:33 GMT)
Downscaling climate projections to 1 km with single-image super resolution [1.7] 単一画像の超解像モデルでは、統計的に気候予測を1kmまで下げることができる。
我々は、高分解能観測格子データセット上でモデルを訓練し、それらを低分解能気候予測に適用する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:19:51 GMT)
AutoOEP -- A Multi-modal Framework for Online Exam Proctoring [1.7] 本稿では,コンピュータビジョンと機械学習を活用した総合的マルチモーダルフレームワークであるAutoOEP(Automated Online Exam Proctoring)を紹介する。
このシステムは、デュアルカメラ装置を使用して、検査の正面ビューとワークスペースの側面ビューの両方をキャプチャし、盲点を最小限にする。
Hand Moduleは、禁止アイテム(携帯電話、ノートなど)を検知し、これらのオブジェクトに手近をトラッキングするために、微調整されたYOLOv11モデルを使用している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:29:40 GMT)
Sensor optimization for urban wind estimation with cluster-based probabilistic framework [1.6] 複雑な都市部におけるドローン軌道に対するセンサベースフロー推定のための機械学習フレームワークを提案する。
このフレームワークは、単純な例として、ドローンの飛行経路を3つのビルディングクラスタを通してデモする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 05:12:16 GMT)
Functional vs. Object-Oriented: Comparing How Programming Paradigms Affect the Architectural Characteristics of Systems [1.6] 本研究ではオブジェクト指向プログラミング(OOP)や関数型プログラミング(FP)がソフトウェアシステムのアーキテクチャ特性に与える影響を比較検討する。
Kotlin(OOP用)とScala(FP用)で開発されたDigital Walletシステムの設計と実装について検討する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:42:40 GMT)
Are Foundation Models Ready for Industrial Defect Recognition? A Reality Check on Real-World Data [1.2] ファンデーションモデル(FM)は、様々なテキストおよび画像処理タスクにおいて印象的なパフォーマンスを示している。
ゼロショット設定でドメインやデータセットをまたいで一般化することができる。
退屈なラベリングタスクを単純なテキストプロンプトに置き換えて、異常を記述することで、モデルの設定と実装においてかなりの労力を節約できる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:46:51 GMT)
Beyond SSO: Mobile Money Authentication for Inclusive e-Government in Sub-Saharan Africa [1.1] サブサハラアフリカ(SSA)におけるモバイルマネーサービス(Mobile Money Services)の急速な普及は、e-Governmentサービスのアクセシビリティ向上に有効な道筋を提供する。
既存のMobile Money AuthenticationメソッドはSIMスワップへの感受性、セッション保護の弱さ、ピーク時のスケーラビリティの低下など、重大な制限に直面している。
本研究では,オフラインアクセス性とセッション継続性を確保するためのハイブリッド認証プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:09:24 GMT)
Quantum computing on encrypted data with arbitrary rotation gates [1.1] 任意の回転ゲートを用いた暗号化データに対する半盲量子計算の普遍的スキームを提案する。
この研究は、セキュアなNISQ-eraコンピューティングにおけるそのような技術の実用化に向けた肯定的な一歩である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:42:25 GMT)
DeNOTS: Stable Deep Neural ODEs for Time Series [1.0] CDEは不規則時系列の時間的進化を処理する方法を提供する。
我々は、NFEの増加とモデルの「深化」のために統合時間地平線を拡大することを提案する。
また、負のフィードバックによって動的を安定化する方法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:10:35 GMT)
TSKAN: Interpretable Machine Learning for QoE modeling over Time Series Data [0.9] 本稿では,ML(Interpretable Machine Learning)技術を用いたビデオストリーミングアプリケーションにおけるQoEモデリングの新しい手法を提案する。
従来のブラックボックスアプローチとは異なり、我々の手法は、コンパクトな周波数領域上の解釈可能な読み出しとして、KAN(Kolmogorov-Arnold Networks)を組み合わせている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:25:30 GMT)
Unsupervised Log Anomaly Detection with Few Unique Tokens [0.9] 本稿では,欧州XFEL加速器の制御系ノードからログデータの異常を検出する新しい手法を提案する。
確率比に基づいて個々のログエントリをスコアリングすることで異常を識別する。
高いスコアは、ノードのルーチンの振る舞いから逸脱する潜在的な異常を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:42:17 GMT)
Dynamic Lagging for Time-Series Forecasting in E-Commerce Finance: Mitigating Information Loss with A Hybrid ML Architecture [0.8] 動的ラグ機能工学と適応型ローリングウインドウ表現を統合したハイブリッド予測フレームワークを提案する。
提案手法は、請求書レベルの行動モデリング、サポートデータの構造化ラグ、およびカスタム安定性を考慮した損失関数を明示的に組み込んだものである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:33:16 GMT)
Preparation Meets Opportunity: Enhancing Data Preprocessing for ML Training With Seneca [0.7] 入力データ前処理は、現代のシステムで機械学習(ML)モデルを同時にトレーニングする場合、一般的なボトルネックである。
キャッシュパーティショニングとデータサンプリングを最適化したデータロードシステムであるSenecaについて述べる。
Seneca は PyTorch と比較してmepan を 45.23% 削減し、次の最高のデータローダに比べてデータ処理のスループットを 3.45 倍に向上させる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:27:42 GMT)
Small or Large? Zero-Shot or Finetuned? Guiding Language Model Choice for Specialized Applications in Healthcare [0.7] ファインタニングは、ゼロショット結果と比較して、すべてのシナリオでSLMのパフォーマンスを著しく改善した。
ドメイン依存のSLMは、特に難しいタスクにおいて、微調整後の一般的なSLMよりもパフォーマンスが良くなった。
さらなるドメイン固有の事前訓練は、より簡単なタスクでは控えめなゲインを得たが、複雑なデータスカースタスクでは大幅に改善された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:15:31 GMT)
Adversarial bandit optimization for approximately linear functions [0.6] 非滑らかかつ非滑らかな関数に対する帯域最適化問題を考える。
それぞれのトライアルでは、損失関数は線形関数の和であり、プレイヤーの選択を観察した後に選択された小さいが任意の摂動である。
その結果、最適化のために高確率の後悔を省くことが示唆された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:06:50 GMT)
Characterizing Translation-Invariant Bell Inequalities using Tropical Algebra and Graph Polytopes [0.6] 一次元幾何学における有限範囲相関器による変換不変(TI)ベルの不等式を特徴づける。
驚いたことに、TI Bell のポリトープには、システムサイズに関して一様上界にできる極端点が多数存在する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:40:21 GMT)
Exact Solvability and Integrability Signatures in a Periodically Driven Infinite-Range Spin Chain: The Case of Floquet interval $π/2$ [0.6] スピンチェーンモデルにおける量子積分可能性(QI)のシグネチャについて検討する。
我々は、任意の初期状態に対して、ユニタリ作用素、固有系、単一量子化密度行列、およびエンタングルメントダイナミクスを任意の$N$に対して解析する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:50:56 GMT)
A Data-Driven Framework for Digital Transformation in Smart Cities: Integrating AI, Dashboards, and IoT Readiness [0.5] 本研究では,公共部門におけるデジタルトランスフォーメーション(DT)のレベルを評価するための革新的な方法論を提案する。
提案手法は従来の評価手法と人工知能(AI)技術を組み合わせたものである。
我々のアプローチは、バレンシア地方公共団体(Spain)における地方行政に関する実例研究に応用されている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:39:40 GMT)
FedRAIN-Lite: Federated Reinforcement Algorithms for Improving Idealised Numerical Weather and Climate Models [0.5] 気候モデルにおけるサブグリッドパラメータ化は、伝統的に静的で、オフラインで調整される。
FedRAIN-Liteは一般的な循環モデルで使用される空間分解を反映するフレームワークである。
Deep Deterministic Policy Gradientは、静的と単一エージェントのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:41:10 GMT)
Quantum Key Distribution with Spatial Modes: From 360 to 5000-Dimensional Hilbert Space [0.5] 本稿では,光子対の位置と運動量の絡み合いを利用した高次元QKDプロトコルを提案する。
我々は,90個の空間モードを用いて光子毎の5.07ビットの光子情報効率と,361個のモードで0.9Kb/sの最大ビットレートを実現する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:02:44 GMT)
HumAIne-Chatbot: Real-Time Personalized Conversational AI via Reinforcement Learning [0.5] textbfHumAIne-chatbotはAIによる会話エージェントで、新しいユーザプロファイリングフレームワークを通じて応答をパーソナライズする。
ライブインタラクションの間、オンライン強化学習エージェントは暗黙の信号を組み合わせることで、ユーザ毎のモデルを洗練する。
その結果、パーソナライズ機能を有効にすると、ユーザ満足度、パーソナライズ精度、タスク達成度が一貫した改善が見られた。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:51:50 GMT)
ExpFace: Exponential Angular Margin Loss for Deep Face Recognition [0.5] SphereFace、CosFace、ArcFaceなどのMarginベースのソフトマックス損失は、ノイズの多いサンプルの影響を見落としている。
本稿では,角指数項をマージンとして導入したExpFace(Exponential Angular Margin Loss)を提案する。
この設計は、中心領域でより大きなペナルティを、周辺領域でより小さいペナルティを、角空間内で適用する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:08:19 GMT)
Generative Adversarial Networks Applied for Privacy Preservation in Biometric-Based Authentication and Identification [0.5] 個人のプライバシーを保護し,GAN(Generative Adversarial Network)に基づく新たな認証手法を提案する。
GANは顔の画像を視覚的にプライベートな領域(花や靴など)に翻訳する。
我々の実験に基づいて、この手法は攻撃に対して堅牢であり、それでも有意義なユーティリティを提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:39:40 GMT)
How deep is your network? Deep vs. shallow learning of transfer operators [0.4] 我々は、データから転送演算子とそのスペクトル分解を学習するためのRaNNDyと呼ばれるランダム化ニューラルネットワークアプローチを提案する。
主な利点は、精度の顕著な低下がなければ、このアプローチがトレーニング時間とリソースを大幅に削減することです。
複素力学系の挙動解析に重要な応用があるクープマン作用素やペロン・フロベニウス作用素など、様々な力学作用素に対する結果を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:38:42 GMT)
SwasthLLM: a Unified Cross-Lingual, Multi-Task, and Meta-Learning Zero-Shot Framework for Medical Diagnosis Using Contrastive Representations [0.4] SwasthLLMは、医用診断のための統一、ゼロショット、クロスランガル、マルチタスク学習フレームワークである。
英語、ヒンディー語、ベンガル語で、言語固有の微調整を必要としない。
SwasthLLMは97.22%、F1スコア97.17%という高い診断性能を達成している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:20:49 GMT)
Efficient Uncertainty Estimation for LLM-based Entity Linking in Tabular Data [0.4] トークンレベルの特徴量を用いて単発出力から不確実性を推定するための自己教師型アプローチについて検討する。
得られた不確実性推定は,低精度出力の検出に極めて有効であることを示す。
これは計算コストのごく一部で達成され、不確実性対策をEntity Linkingに費用対効果で統合するのをサポートする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:44:16 GMT)
Efficient Preparation of Resource States for Hamiltonian Simulation and Universal Quantum Computation [0.4] アルゴリズム調整グラフ状態に関する過去の研究を、一般化されたパウリ回転の周期列に拡張する。
グラフ状態とCNOTゲートのラグに基づく資源状態作成のための新しいスキームを導出する。
また、ハミルトニアンを生成するための最小の普遍的集合から普遍的資源状態を得るための2つのアプローチも展開する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:04:56 GMT)
Learning Greens Operators through Hierarchical Neural Networks Inspired by the Fast Multipole Method [0.3] Fast Multipole Method (FMM) は、N$ボディ問題における長距離力の効率的な計算アルゴリズムである。
本稿では,FMMの情報フローを階層型機械学習フレームワークに統合するニューラルネットワークアーキテクチャであるNeural FMMを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:08:10 GMT)
Digital Signal Processing from Classical Coherent Systems to Continuous-Variable QKD: A Review of Cross-Domain Techniques, Applications, and Challenges [0.3] 本稿では,連続可変量子鍵分布(CV-QKD)へのディジタル信号処理(DSP)技術の適用について検討する。
これらの領域の収束によりCV-QKDの性能は大幅に向上した。
我々は、今後のCV-QKD統合の可能性が高いコヒーレント光通信システムにおける最近のDSPの革新を同定する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:05:19 GMT)
Auto-Regressive U-Net for Full-Field Prediction of Shrinkage-Induced Damage in Concrete [0.3] この研究は、自動回帰U-Netモデルを用いて、単位セル内のスカラー損傷場の進化を予測する。
畳み込みニューラルネットワーク(CNN)は、観測された収縮や残留剛性を含む重要な力学特性を予測するために用いられる。
これはコンクリートの混合設計の最適化に役立ち、耐久性の向上と内部損傷の低減につながる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:29:45 GMT)
Characterizing the Multipartite Entanglement Structure of Non-Gaussian Continuous-Variable States with a Single Evolution Operator [0.3] 連続変数系における多部絡み構造を効率的に検出する手法を提案する。
ランダムに生成した105ドル以上の多モード量子状態に対して,本手法の有効性を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:04:08 GMT)
Machine Learning Time Propagators for Time-Dependent Density Functional Theory Simulations [0.3] 本稿では,リアルタイムTDDFTに基づく電子動力学シミュレーションを高速化する機械学習手法を提案する。
本研究では,レーザーパラメータの影響下での1次元二原子分子のクラスにおけるモデルの有効性を示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:54:35 GMT)
Cascade! Human in the loop shortcomings can increase the risk of failures in recommender systems [0.1] Human-in-the-loop」は、主に説明責任の問題に対処するために広く採用されている。
我々は、リコメンデータシステム設計における人間の監視もまた、まだ完全に説明されていない新しいリスクを伴っていると考えている。
他のAIシステムに対して有意義な監視を提供するための"Human-in-the-loop"プラクティスの欠点に関する新たな知識は、社会的に責任を負うレコメンデーションを達成するのに不十分である可能性を示唆している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:23:03 GMT)
InsightGUIDE: An Opinionated AI Assistant for Guided Critical Reading of Scientific Literature [0.1] InsightGUIDEは、リプレースではなく、読み取りアシスタントとして機能するように設計された、AIを活用した新しいツールである。
我々のシステムは、専門家の読書方法論を直接そのコアAIロジックに埋め込むことで、論文のキー要素への"マップ"として機能する簡潔で構造化された洞察を提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:10:52 GMT)
Error Propagation in Dynamic Programming: From Stochastic Control to Option Pricing [0.1] 本稿では、離散時間における最適制御(SOC)の理論的および方法論的基礎について検討する。
制御問題を一般的な動的プログラミングフレームワークで定式化し、詳細な収束解析に必要な数学的構造を導入する。
我々は、我々の分析が重要な金融アプリケーション、すなわちアメリカのオプションの価格にどのように自然に適用するかを説明します。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:30:19 GMT)
How People Manage Knowledge in their "Second Brains"- A Case Study with Industry Researchers Using Obsidian [0.1] ノートテイキングアプリケーションは、個人の知識基盤を構築し維持するための貴重なツールである。
本稿では,様々な目的のために個人的知識基盤の構築と探索を行うケーススタディを提案する。
重要な発見は、参加者の知識検索戦略がコンテンツの作り方や維持方法に影響を与えることである。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:45:35 GMT)
Model Agnostic Defense against Adversarial Patch Attacks on Object Detection in Unmanned Aerial Vehicles [0.1] 無人航空機(UAV)のキーコンポーネントとなる物体検出
物体探知機に対する 敵のパッチ攻撃は 上流のタスクのパフォーマンスを 著しく損なう可能性がある
本稿では,敵パッチ攻撃の脅威に対するモデル非依存防衛機構を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:46:12 GMT)
No Quantum Advantage in Decoded Quantum Interferometry for MaxCut [0.1] Decoded Quantum Interferometry (DQI)は、特別な種類の離散最適化問題を近似するためのフレームワークである。
DQI が非自明な保証を得た MaxCut のインスタンスは、古典的な時間で正確に解決可能であることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:21:31 GMT)
An effective control of large systems of active particles: An application to evacuation problem [0.1] 我々は、強化学習と、システムに作用する人工力を組み合わせた、リーダーのための効果的な制御戦略を開発する。
我々は、RLの簡単な適用は、高度なアーキテクチャであっても、準最適結果をもたらすが、我々のアプローチは堅牢で効率的な避難戦略を提供することを示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:27:45 GMT)
Machine-Learning Interatomic Potentials for Long-Range Systems [0.0] 本稿では,機械学習の力場に長距離インタラクションを統合するための軽量フレームワークを提案する。
様々な畳み込み層にまたがるガウスの乗算器を学習することにより、SOG-Netは様々な長距離減衰挙動を適応的に捉える。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:14:01 GMT)
Wartime Media Dynamics in Emerging Democracies: Case Study of Pakistani Media in May 2025 Indo-Pak Conflict [0.0] 本研究では、2025年5月のインド・パキスタン紛争がパキスタンメディアの報道にどのように影響したかを検討する。
戦争に関する報告は、政治的反対と反対の報道を著しく過小評価していた。
これらの知見は、不安定な地域でのプレスの自由を守る必要性を補強する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:40:10 GMT)
Vulnerability Disclosure or Notification? Best Practices for Reaching Stakeholders at Scale [0.0] セキュリティ研究者はセキュリティ脆弱性に関心を持っているが、これらのセキュリティ脆弱性はステークホルダーのリスクを生み出す。
協調脆弱性開示は、新しく発見された脆弱性を公開するための長年のベストプラクティスとして受け入れられてきた。
これは脆弱性開示とは違い、むしろ脆弱性通知の実践である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:18:22 GMT)
Vibrational Fingerprints of Strained Polymers: A Spectroscopic Pathway to Mechanical State Prediction [0.0] 高分子ネットワークの振動応答は、分子の変形の感度の高いプローブを提供する。
実効エポキシサーモセットにおいて, 機械学習力場が量子レベルの忠実度でこれらの分光指紋を再現することを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:37:29 GMT)
Towards Complete Causal Explanation with Expert Knowledge [0.0] 最大祖先グラフのマルコフ同値類を、特定のエッジマークを含むMAGのみに限定する問題について検討する。
このようなマルコフ同値類の制限は、制限された本質的な祖先グラフによって一意に表される。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:09:56 GMT)
Time-of-Flow Distributions in Discrete Quantum Systems: From Operational Protocols to Quantum Speed Limits [0.0] 本稿では,離散量子系における遷移タイミングを時間流(TF)分布を用いて定量化する枠組みを提案する。
本フレームワークは,時間依存ハミルトニアンの最適化,ショートカット・ツー・アディバティティティプロトコルの解析,3段階の時間依存デチューニングモデルの力学における非断熱的特徴の研究,および,閉じた量子系とオープンな量子系の両方に対する遷移ベースの量子速度限界(TF-QSL)を導出する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:01:07 GMT)
The three main doctrines on the future of AI [0.0] 支配主義は、十分に進歩したAIを作る最初の俳優が圧倒的な戦略的優位性に達すると予測している。
絶滅の教義は、人類がAIIのコントロールを失う可能性があり、人類の絶滅や恒久的な非武装化につながることを予想している。
代替教義は、AIが現在人間が行っているタスクの多くを自動化すると予測するが、人間の文明を根本的に作り直したり終わらせたりするほど変革的ではない。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:17:29 GMT)
The Sensitivity of Variational Bayesian Neural Network Performance to Hyperparameters [0.0] 科学的応用において、予測モデリングは正確な不確実性定量化(UQ)を伴わない限られた使用法であることが多い。
BNNはニューラルネットワーク(NN)の重みで不確実性を伝播することによって予測の不確実性を生み出す。
実際にBNNで正確なUQを得ることは、実際的なモデルトレーニングに使用される近似のために難しい。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:29:11 GMT)
The Role of High-Performance GPU Resources in Large Language Model Based Radiology Imaging Diagnosis [0.0] 大規模言語モデル(LLM)は放射線学に急速に適用され、自動画像解釈とレポート生成タスクが実現されている。
高性能なグラフィカル処理ユニット(GPU)は、画像データ上で大きなLLMを実行するために必要な計算量とメモリスループットを提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:08:24 GMT)
The Knowledge-Behaviour Disconnect in LLM-based Chatbots [0.0] 大規模言語モデルに基づく人工会話エージェント(ChatGPTなど)は、あらゆる種類の質問に答える。
しかし、これらのモデルは、自身の会話行動の基礎として、この知識を使用しますか?
「これはそうではないと私は主張するが、私はこの失敗を断絶と呼ぶ。」
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:24:49 GMT)
TE-PAI: Exact Time Evolution by Sampling Random Circuits [0.0] 量子ハミルトニアンの下での時間進化のシミュレーションは、量子コンピュータの最も自然な応用の1つである。
TE-PAIは、ランダムな量子回路をサンプリングすることによって、時間進化を正確にシミュレートする。
浅い回路深度を達成しつつ、離散化やアルゴリズム誤差を伴わずに時間進化をシミュレートすることを証明する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:36:22 GMT)
Superfluid-Mott transition in a frustrated triangular optical lattice [0.0] 我々は、幾何学的フラストレーションを研究するために、三角形光学格子に超低温ボソニック399ドルK原子を用いる。
幾何学的フラストレーションはモット絶縁体(chi$-SF-MI)量子相転移に対する(キラル-)超流体の臨界相互作用強度を抑制する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:54:58 GMT)
Structuring Collective Action with LLM-Guided Evolution: From Ill-Structured Problems to Executable Heuristics [0.0] 個別インセンティブと集合目標の整合性を必要とする集団行動問題は、Ill-Structured Problems(ISP)の古典的な例である。
本稿では,この大域的複雑性を,各エージェントに対して抽出可能なWSP(Well-Structured Problem)に変換する計算フレームワークECHO-MIMICを提案する。
ECHO-MIMICは、アルゴリズム発見と調整されたコミュニケーションを結合することにより、集団行動の認知的負担を単純なエージェントレベルの命令セットに変換する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:26:56 GMT)
StrCGAN: A Generative Framework for Stellar Image Restoration [0.0] 我々は、低解像度の天体写真画像を改善するために設計された生成モデルStrCGANを紹介する。
我々のゴールは、天体の高忠実な真実のような表現を再構築することであり、これは小望遠鏡観測の解像度と品質に制限があるため難しい課題である。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:42:32 GMT)
SoK: A Systematic Review of Malware Ontologies and Taxonomies and Implications for the Quantum Era [0.0] 量子マルウェアはセキュリティ上の懸念が高まり、早めに対処しなければ、破滅的な科学的・技術的影響をもたらすだろう。
本稿では、量子マルウェアの基本的な性質と意義を考察し、適切な対策と防御の今後の発展を可能にする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 00:06:17 GMT)
Similarity Field Theory: A General Mathematical Framework for Intelligence [0.0] 類似性フィールド理論(英: similarity Field Theory)は、実体間の類似性値とその進化を規定する原則を定式化する理論である。
この枠組みの中で、我々は知性の生成的定義を定式化する。
我々は、2つの定理を証明している: (i)非対称性は相互包含をブロックし、 (ii)安定性はアンカー座標または準位集合内の最終的な閉じ込めを必要とする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:52:27 GMT)
SINAI at eRisk@CLEF 2025: Transformer-Based and Conversational Strategies for Depression Detection [0.0] 本稿では,eRisk@CLEF 2025ラボにおけるSINAI-UJAチームの参加について述べる。
提案課題は, (i) 文脈適応型早期抑うつ検出, (ii) パイロットタスク: LLMによる会話型抑うつ検出である。
タスク2のアプローチは,RoBERTa BaseやMentalRoBERTA Largeといったトランスフォーマーベースのモデルと,広範な前処理パイプラインを組み合わせたものです。
パイロットタスクでは,限られた数で情報ゲインを最大化することに集中して,LLMを活用したペルソナと対話するための一連の対話戦略を設計した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:04:32 GMT)
Region-of-Interest Augmentation for Mammography Classification under Patient-Level Cross-Validation [0.0] 我々は,Mini-DDSMデータセット(画像9,684枚,患者2,414枚)を再検討し,軽量な関心領域(ROI)拡張戦略を導入した。
トレーニング中、フルイメージは確率的に、事前に計算されたラベルフリーのバウンディングボックスバンクからサンプリングされたランダムROIの作物に置き換えられる。
厳密な患者レベルのクロスバリデーションで評価し,ROC-AUC,PR-AUC,トレーニング時間効率の指標を報告する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:52:49 GMT)
Redundancy-as-Masking: Formalizing the Artificial Age Score (AAS) to Model Memory Aging in Generative AI [0.0] 人工知能は、時系列ではなく、記憶性能における構造的対称性を通して年齢が観察される。
この現象を捉えるため、AAS(Artificial Age Score)はログスケールのエントロピーインフォームドメトリックとして導入されている。
AASは、穏やかでモデルに依存しない仮定の下で、明確に定義され、境界付けられ、単調であることが証明されている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:18:27 GMT)
Reconstruction-Based Adaptive Scheduling Using AI Inferences in Safety-Critical Systems [0.0] 本稿では,スケジュールの動的検証とアセンブルを目的とした新しい再構築フレームワークを提案する。
堅牢な安全性チェック、効率的なアロケーションアルゴリズム、予期しないコンテキストイベントを処理するリカバリメカニズムが組み込まれている。
提案するフレームワークは,システム適応性,運用上の整合性,実行時のパフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:38:43 GMT)
Quantum speed limits based on Jensen-Shannon and Jeffreys divergences for general physical processes [0.0] 一般の物理過程における有限次元量子系の量子速度制限(QSL)について論じる。
結果は閉量子系と開量子系の両方に適用できる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:39:09 GMT)
Probing Gender Bias in Multilingual LLMs: A Case Study of Stereotypes in Persian [0.0] マルチ言語大言語モデル(LLM)におけるジェンダーステレオタイプを明らかにするテンプレートベースの探索手法を提案する。
我々は,異なる言語的特徴を持つ低リソース言語ペルシャに焦点をあてた4つの顕著なモデルを評価する。
以上の結果から,すべてのモデルに男女のステレオタイプが示され,ペルシャ語では全ドメインで英語よりも大きな差異が認められた。
本研究は、包括的NLPプラクティスの必要性を強調し、他の低リソース言語におけるバイアスを評価するためのフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:34:17 GMT)
Principle of Diminishing Potentialities in Large N Algebras [0.0] 熱平衡では、DDP(Diminishing potentialities)の原理が$mathcalN=4$ Super Yang-Mills (SYM) 理論の大きい$N$代数に成り立つことを示す。
二つの辺の永遠ブラックホールのコンパクト対称性群 $G$ の極大アーベル部分群 $H$ で交差積をすることで、大きな $N$ 代数学を拡張する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:21:59 GMT)
Potential renormalisation, Lamb shift and mean-force Gibbs state -- to shift or not to shift? [0.0] ポテンシャル歪みが小さければ(しかし無視できない)、対数項はカップリングにおける二階の散逸過程に影響を与えないことを示す。
大規模環境遮断においては, ランブシフト項は, 対向項によるコヒーレント効果をほぼキャンセルすることを示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:52:06 GMT)
Phase-Subtractive Interference and Noise-Resistant Quantum Imaging with Two Undetected Photons [0.0] 本稿では、2つの独立した源によって生成される4光子量子状態を用いて2光子干渉パターンを生成する量子干渉現象について述べる。
共通認識とは対照的に、干渉パターンは、検出された光子によって得られる位相と完全に独立にすることができる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:24:49 GMT)
PerceptronCARE: A Deep Learning-Based Intelligent Teleophthalmology Application for Diabetic Retinopathy Diagnosis [0.0] PerceptronCAREは網膜画像を用いた糖尿病網膜症自動検出のための遠隔眼科アプリケーションである。
このシステムは、ResNet-18、EfficientNet-B0、SqueezeNetなど、複数の畳み込みニューラルネットワークを用いて開発、評価された。
最終モデルは85.4%の精度で病気の重症度を分類し、臨床および遠隔医療におけるリアルタイムスクリーニングを可能にする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:09:54 GMT)
Numerically exact quantum dynamics with tensor networks: Predicting the decoherence of interacting spin systems [0.0] この目的を達成するために,行列積状態表現を利用して数値的正確でスケーラブルな手法を導入する。
提案手法は,幅広いパラメーター条件下でのスピンネットワークのコヒーレンスと人口動態を正確に予測する。
そこで本手法は, 分子磁石と固体スピンにまたがる中程度の大きさのスピンプラットフォームに対して, 信頼性の高い結果を与える。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:54:24 GMT)
Nonlocal Magic Generation and Information Scrambling in Noisy Clifford Circuits [0.0] 有限個の量子ビットのノイズは、マクロ的な情報スクランブルと非局所的なマジック生成能力をもたらす。
演算子レベルのマジックモノトンであるマジックキャパシティと結果回路のAPEPの関係を数値的に検討する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 21:18:53 GMT)
Muse-it: A Tool for Analyzing Music Discourse on Reddit [0.0] Muse-itは、ユーザ定義クエリを中心とした包括的なRedditデータを取得するプラットフォームである。
また、音楽関連のハイパーリンク(Spotifyなど)を特定し、アーティスト、アルバム、リリース日、ジャンル、人気、歌詞などのトラックレベルのメタデータを検索し、議論にリンクする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:22:23 GMT)
Measuring space-time curvature using maximally path-entangled quantum states [0.0] これまで行われた量子実験の重力面はニュートン重力内かアインシュタインの同値原理によって説明できる。
我々は,マッハ・ツェンダー干渉計において,絡み合いによって引き起こされる感度の上昇が,重力によって引き起こされる位相にも寄与することを示した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:20:40 GMT)
MOIS-SAM2: Exemplar-based Segment Anything Model 2 for multilesion interactive segmentation of neurofibromas in whole-body MRI [0.0] 神経線維腫症1型(英: Neurofibromatosis type 1)は、多くの神経線維腫(NF)が全身に発達するのを特徴とする遺伝疾患である。
本研究では,この課題に合わせた対話型セグメンテーションモデルを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:17:37 GMT)
Local reminiscence in the PXP model [0.0] 我々は,Rydberg原子配列で実現された制約付きスピン系であるPXPモデルにおける局所的思い出の出現について検討した。
2つの特定の状態、$theta$-symmetric およびblockaded 状態は、システムサイズが大きくなるにつれて、一様に近い忠実さと変動を抑えながら、堅牢な局所的思い出を示す。
以上の結果から,非エルゴディックなレギュレーションは局所記憶を安定に保ちつつ,複雑なグローバルダイナミクスを実現することが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 09:51:20 GMT)
Learning to Lead Themselves: Agentic AI in MAS using MARL [0.0] 本稿では,エージェント人工知能,エージェントが独立して,適応的かつ積極的に行動することで,マルチエージェントシステムにおけるタスク割り当てとコーディネーションを改善する方法について検討する。
協調型マルチエージェント強化学習環境における問題を定式化し、PyTorchにおけるIPPOと呼ばれる軽量なマルチエージェントプロキシポリシー最適化を実装した。
実験はPettingZoo環境で行われ、複数の均質なドローンやエージェントが、明示的なコミュニケーションなしに異なるターゲットをカバーするために自己組織化されなければならない。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:36:07 GMT)
Interaction dependence of the Hall response for the Bose-Hubbard triangular ladder [0.0] 磁場中におけるBose-Hubbard三角はしごのホール応答について検討する。
我々は、弱い相互作用の限界からハードコア体制まで、幅広い相互作用の強さを考察する。
様々なキラル状態の指紋にホール応答を適用できることが示される。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:17:30 GMT)
Intelligent Algorithm Selection for Recommender Systems: Meta-Learning via in-depth algorithm feature engineering [0.0] No Free Lunch"定理は、すべてのユーザに最適なレコメンデータアルゴリズムが存在しないことを規定している。
標準的なメタ学習アプローチは、ユーザー機能に基づいたアルゴリズムを選択することでこの問題を解決することを目的としているが、アルゴリズム自体を同等の「ブラックボックス」選択として扱う。
この論文は、アルゴリズム自体を明示的に特徴付ける包括的な機能セットをエンジニアリングすることで、この制限を克服する影響について考察する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:00:37 GMT)
Integrated Framework for LLM Evaluation with Answer Generation [0.0] 本稿では,エキスパート駆動型診断システムSPEEDを用いたテキスト自己修正記述評価という統合評価フレームワークを提案する。
SPEEDは、幻覚検出、毒性評価、語彙・文脈的適切性など、複数の次元にわたる専門家のフィードバックを積極的に取り入れている。
実験結果から,SPEEDはさまざまなドメインやデータセットに対して,堅牢かつ一貫した評価性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:20:37 GMT)
Innovative Deep Learning Architecture for Enhanced Altered Fingerprint Recognition [0.0] DeepAFRNetは,歪んだ指紋サンプルをマッチングし,認識するディープラーニング認識モデルである。
このアプローチでは、VGG16バックボーンを使用して高次元の特徴とコサイン類似性を抽出し、埋め込みを比較する。
厳格なしきい値では、DeepAFRNetは96.7%、98.76パーセント、99.54パーセントを達成している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 20:12:37 GMT)
Induced electric dipole moment coupling in Dirac equation [0.0] ディラック中性粒子と誘導電気双極子モーメントと磁場および電場との相互作用を記述するモデルとして、ディラック方程式に非最小結合を導入する。
誘電体双極子モーメントと電場との相互作用から相対論的幾何学量子位相を求める。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:44:16 GMT)
In-Process Monitoring of Gear Power Honing Using Vibration Signal Analysis and Machine Learning [0.0] 本研究では、ギヤパワーホニングのプロセス内監視のための新しいデータ駆動型フレームワークを提案する。
提案手法は加速度計による連続的なデータ取得と時間周波数信号解析を含む。
提案手法は工業環境で高い分類精度(最大100%)を達成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:32:28 GMT)
Impact of Loss Weight and Model Complexity on Physics-Informed Neural Networks for Computational Fluid Dynamics [0.0] 物理情報ニューラルネットワークは、PDEを解くためのメッシュフリーフレームワークを提供するが、損失重量選択に非常に敏感である。
本稿では,2次元解析に基づく重み付け手法を提案する。
熱伝導、対流拡散、蓋駆動キャビティフローのベンチマークでは、第2のスキームは均等な重み付けよりも安定性と精度を一貫して向上することが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:58:14 GMT)
IBiT: Utilizing Inductive Biases to Create a More Data Efficient Attention Mechanism [0.0] 近年,トランスフォーマーベースのアーキテクチャがコンピュータビジョンアプリケーションの主要な手法となっている。
Transformerは、データセットのサイズに合わせて説明可能でスケール可能であるが、畳み込みニューラルネットワークの帰納バイアスは欠如している。
これらの帰納バイアスを学習マスクを通じて導入することで、視覚変換器は知識蒸留なしではるかに小さなデータセットで学習できることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:19:23 GMT)
IA aplicada al análisis del conflicto Irán-Israel: Mapeo de discursos en YouTube [0.0] この研究は、YouTubeに投稿された12万のコメントに基づいて、2025年6月に起きたイランとイスラエルの紛争のデジタル表現を分析した。
彼らは、関係するアクターに関する不正確な位置を特定し、メディアとアルゴリズムの偏見がどのようにデジタル会話を形成するかを調べることを試みた。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:51:26 GMT)
How to simulate magic state cultivation with around $8$ Clifford terms on average [0.0] 我々は,非クリフォード$d=5$マジックステート培養回路のシミュレーション方法を示す。
我々の結果は、内部構造を持つ運用関連の高い高いT$カウント量子回路のシミュラビリティに光を当てる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 16:19:41 GMT)
Holographic Aspects of Dynamical Mean-Field Theory [0.0] 動的平均場理論とホログラフィーはDMFTのホログラフィー的側面に光を流すことによって関連付けられる。
本研究では,分岐グリーン関数のスケーリング次元とBethe格子ネットワークの外縁における電子の境界相関関数が固定点グリーン関数によって特徴づけられることを示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 02:25:27 GMT)
High-Dimensional Statistical Process Control via Manifold Fitting and Learning [0.0] オンラインおよび「フェーズII」統計プロセス制御(SPC)のための2つの異なるモニタリングフレームワークを提案する。
最初の方法は、そのデータが周囲の高次元空間内に存在する多様体を正確に近似するために、多様体フィッティングにおける最先端技術を利用する。
第2の手法は、まずデータを低次元空間に埋め込んだ後、埋め込み観測を監視することによって、線形次元削減SPC手法に類似した、より伝統的なアプローチを採用する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:02:39 GMT)
Hierarchy of timescales in a disordered spin-$1/2$ XX ladder [0.0] 我々は、その拡散力学で知られている実験的に実現可能なモデルである、歪んだスピン-1/2$ XXはしごについて検討する。
他の非可積分モデルとは異なり、スピン拡散はエネルギー拡散よりも速く進行する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:57:06 GMT)
Graph theory and tunable slow dynamics in quantum East Hamiltonians [0.0] グラフ理論の概念は、速度論的制約のある系におけるスローダイナミクスの起源について、どのように洞察を与えるかを示す。
スローダイナミクスは、フォック空間グラフ上のノード間の強い階層の存在に関連している。
これらの変形が有限系上の非エルゴディディティの度合いにどのように影響するかを数値的に示す。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 10:51:28 GMT)
GPT and Prejudice: A Sparse Approach to Understanding Learned Representations in Large Language Models [0.0] 大規模言語モデル(LLM)は、大規模で未処理のコーパスでますます訓練されている。
本研究では, モデル動作だけでなく, 学習データに埋め込まれたより深い構造, テーマ, バイアスの解釈を可能にする。
我々は、社会構造や物語パターンに富んだコーパスであるジェーン・オーステンの小説にのみ焦点をあてて、GPTスタイルのトランスフォーマーモデルを訓練する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:10:16 GMT)
From Pheromones to Policies: Reinforcement Learning for Engineered Biological Swarms [0.0] 本研究では, フェロモンを介するセロモン凝集と強化学習(RL)の理論的等価性を確立する。
我々は,フェロモンが数学的に相互学習の更新を反映していることを示し,捕食作業を行う線虫群をモデル化した。
この結果から, 環境信号が外部メモリとして機能する分散RLプロセスは, スティグマイシン系が本質的にコード化されていることが示唆された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:16:35 GMT)
FastTracker: Real-Time and Accurate Visual Tracking [0.0] 本稿では,複数のオブジェクトタイプを扱える汎用的な追跡フレームワークを提案する。
提案手法は,(1)密閉物体の識別を向上する隠蔽認識再識別機構,(2)道路構造認識トラックレット改質戦略の2つの重要な要素を組み込んだ。
大規模な実験結果から,提案手法は新たに導入されたデータセットといくつかの公開ベンチマークの両方で堅牢な性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 00:55:49 GMT)
Failure Modes of Maximum Entropy RLHF [0.0] 我々は,SimPOを最大エントロピー強化学習として長さ正規化温度で導出可能であることを示す。
オンラインRLHF設定において,最大エントロピーRLが同様の結果が得られるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:52:36 GMT)
Exploring Complexity Changes in Diseased ECG Signals for Enhanced Classification [0.0] 心電図(ECG)で捉えた心臓の複雑な運動は電気活動に反映される
本研究では,心電図の複雑度が心疾患とどのように異なるかを理解するために非線形時系列解析を用いる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:02:36 GMT)
Experience Deploying Containerized GenAI Services at an HPC Center [0.0] Generative Artificial Intelligence(GenAI)アプリケーションは、推論サーバ、オブジェクトストレージ、ベクトルおよびグラフデータベース、ユーザインターフェースなど、特殊なコンポーネントで構成されている。
コンテナ化されたGenAIワークロードを実行するHPCとプラットフォームを統合した収束コンピューティングアーキテクチャについて説明する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:54:21 GMT)
Excited-CAFQA: A classical simulation bootstrap for the variational estimation of molecular excited states [0.0] 変分量子アルゴリズム(VQA)は、現在の量子デバイスの実装に適した反復アルゴリズムである。
CAFQAプロトコルは、状態空間全体の古典的にシミュレート可能なサブセットを通して離散的な検索を実行する。
Excited-CAFQAは、H2およびHeH+分子系の様々な結合長および励起状態に対して90から99%の精度を達成する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 22:01:23 GMT)
EfficienT-HDR: An Efficient Transformer-Based Framework via Multi-Exposure Fusion for HDR Reconstruction [0.0] 本研究では,HDR再構成のための軽量ビジョントランスアーキテクチャを提案する。
ゴーストを効果的に抑制するために、Intersection-Aware Adaptive Fusionモジュールを使用している。
実験の結果、ベースラインと比較して、メインバージョンはFLOPSを約67%削減した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:01:37 GMT)
Dual-Language General-Purpose Self-Hosted Visual Language and new Textual Programming Language for Applications [0.0] ほとんどのビジュアルプログラミング言語(VPL)はドメイン固有であり、プログラミング・アン・コーディング・テクノロジー(PWCT)のような汎用的なVPLはほとんどない。
この論文では、多言語(アラビア語/英語)で汎用的で自己ホスト型ビジュアル言語であるPWCT2を設計・開発した。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:43:55 GMT)
Directionality of the Voynich Script [0.0] 我々は、ヴォイニヒ写本はほぼ確実に左から右に書かれていたと論じている。
文字列の方向バイアスを決定するためにn-gramパープレキシティ非対称性を利用する統計手法を提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 15:35:24 GMT)
DELM: a Python toolkit for Data Extraction with Language Models [0.0] DELM(Data extract with Language Models)は、オープンソースのPythonツールキットで、データ抽出パイプラインの迅速な実験的なイテレーション用に設計されている。
定型的なコードを最小限にし、構造化出力、ビルトインバリデーション、フレキシブルなデータローディングとスコアリング戦略、効率的なバッチ処理を備えたモジュール化されたフレームワークを提供する。
また、再試行ロジック、結果キャッシング、詳細なコストトラッキング、包括的な構成管理など、LLM APIの動作に対する堅牢なサポートも含まれている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:47:55 GMT)
Cuffless Blood Pressure Prediction from Speech Sentences using Deep Learning Methods [0.0] 血圧は心臓血管の健康にとって重要な指標であり、高血圧関連合併症の予防には正確なモニタリングが不可欠である。
伝統的なカフベースの方法は、ホワイトコートや仮面高血圧などの要因により、一貫性のない結果をもたらすことが多い。
提案手法は, 音声特徴の音響特性を活用し, 血圧値との相関性を確立する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 04:05:22 GMT)
Asymptotically optimal unitary estimation in $\mathrm{SU}(3)$ by the analysis of graph Laplacian [0.0] ユニタリ推定は、未知のユニタリ演算子$UinmathrmSU(d)$と対応するユニタリ演算に対する$n$クエリを推定するタスクである。
三次元ユニタリ推定の最適忠実度は、グラフラプラシアン解析により、$F_mathrmest(n,d) = 1-frac56pi29n2 + O(n-3)$で与えられる。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:02:33 GMT)
Assessing the dynamical assumptions in Tsirelson inequality tests of non-classicality in harmonic oscillators [0.0] ツィレルソンの不等式違反は、単に力学的な仮定を破るだけのマクロ現実論的なシステムによって説明できることを示した。
我々は、最大違反状態に関するいくつかの偶発的な数学的結果を得る。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 17:42:09 GMT)
Assertion Messages with Large Language Models (LLMs) for Code [0.0] 開発者が記述したアサーションメッセージを含む216個のJavaテストメソッドのデータセット上で,4つの最先端のFill-in-the-Middle (FIM) LLMの評価を導入する。
Codestral-22Bは,手書きメッセージの3.24に比べて,人間的な評価手法を用いて,5点中2.76点の最高品質を達成している。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 01:13:08 GMT)
Anomaly Detection in Complex Dynamical Systems: A Systematic Framework Using Embedding Theory and Physics-Inspired Consistency [0.0] 複雑な力学系における異常検出は、産業やサイバー物理のインフラにおける信頼性、安全性、効率を確保するために不可欠である。
本稿では,古典的な埋め込み理論と物理に着想を得た一貫性原理を基礎としたシステム理論による異常検出手法を提案する。
本研究は, 異常が安定系の力学を阻害する仮説を支持し, 異常検出のためのロバストな信号を提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 07:27:12 GMT)
Agentic Metacognition: Designing a "Self-Aware" Low-Code Agent for Failure Prediction and Human Handoff [0.0] 自律エージェントの非決定論的性質は信頼性の課題を示す。
二次的な「メタ認知」層は一次LCNC剤を活発に監視する。
人間のイントロスペクションにインスパイアされたこのレイヤは、差し迫ったタスクの失敗を予測するように設計されている。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 06:10:23 GMT)
Affective Computing and Emotional Data: Challenges and Implications in Privacy Regulations, The AI Act, and Ethics in Large Language Models [0.0] 本稿では,感情知能の人工知能システムへの統合について検討する。
コンピュータ科学、心理学、神経科学を組み合わせた学際的な研究に基づいて、感情認識を可能にする神経アーキテクチャを分析する。
本論文は、医療、教育、カスタマーサービスなど、さまざまな領域にまたがる影響について考察する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:18:41 GMT)
Adaptive Approach to Enhance Machine Learning Scheduling Algorithms During Runtime Using Reinforcement Learning in Metascheduling Applications [0.0] 本稿では,メタスケジューラに組み込まれた適応型オンライン学習ユニットを提案する。
オンラインモードでは、強化学習は、新しいスケジューリングソリューションを継続的に探索し発見することで、重要な役割を果たす。
オンライン学習ユニット内にいくつかのRLモデルが実装され、それぞれがスケジューリングの特定の課題に対処するように設計された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:46:22 GMT)
Accelerating Quantum Relaxation via Temporary Reset: A Mpemba-Inspired Approach [0.0] 一般マルコフ開量子系における緩和の大幅な加速を可能にするプロトコルを導入する。
このフレームワークは、緩和時間スケールを制御する汎用的で実験的に実現可能なツールを提供する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:00:39 GMT)
AI-enhanced Quantum Simulation of Schwinger Model [0.0] 量子電気力学(QED)のシュウィンガーモデル(Schwinger Model)は、長い間、重要な物理現象を探索するための貴重な単純化モデルとして機能してきた。
本稿では,ニューラルネットワークファシリテーテッドインプリシット量子シミュレーション(NN-IQS)モデルを解として提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:37:16 GMT)
A Verified Compiler for Quantum Simulation [0.0] ハミルトンシミュレーションは量子コンピューティングの中心的な応用である。
ハミルトンシミュレーションをコンパイルするための高レベル、正式に検証されたフレームワークであるQBlueを紹介する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 23:46:44 GMT)
A Taxonomy of Data Risks in AI and Quantum Computing (QAI) - A Systematic Review [0.0] 本研究は、QAIデータリスクの理解を深めるために、67のプライバシおよびセキュリティに関する研究を体系的にレビューする。
ガバナンス,リスクアセスメント,コントロール実装,ユーザ配慮,継続的監視の5つのカテゴリに分類される22の重要データリスクの分類法を提案する。
以上の結果から,QAI特有の脆弱性が明らかとなり,総合的リスク評価におけるギャップが明らかになった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 11:17:27 GMT)
A Novel Short-Term Anomaly Prediction for IIoT with Software Defined Twin Network [0.0] IIoT環境の動的かつセキュアな監視は、SDN(Software-Defined Network)とDT(Digital Twin)のパラダイムとの統合によって実現される。
我々はSDNベースのDTを用いた短時間の異常検出のための新しいフレームワークを提案している。
本稿では,SD-TWINに基づく新しい異常検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 12:37:18 GMT)
A Contrastive Learning Framework for Breast Cancer Detection [0.0] そこで本研究では,ラベル付きデータセットの少ないContrastive Learning(CL)フレームワークを提案する。
Inbreast と MIAS のベンチマークデータから乳癌検出の精度は96.7%であった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 18:43:38 GMT)
A Compound Classification System Based on Fuzzy Relations Applied to the Noise-Tolerant Control of a Bionic Hand via EMG Signal Recognition [0.0] 著者らは, 汚染バイオシグナールの検出による手指義手制御を目的とした新しい認識システムを提案する。
全ての認識システムに対して、認識プロセス全体で均一なソフト(ファジィ)決定スキームを使用できる、元のコヒーレントなファジィモデルが開発された。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 19:48:21 GMT)
A Comparison of Quadratic and Higher-Order Representations for QAOA [0.0] ルーティング問題を考慮し、量子近似最適化アルゴリズム(QAOA)を用いて2次および高次表現を比較する。
より高次形式は解の質を向上し、キュービットの個数ではスケールが良くなるが、より2キュービットのゲートを必要とする。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 13:53:50 GMT)
A Comparative Analysis of Sparse Autoencoder and Activation Difference in Language Model Steering [0.0] 我々は、冗長な特徴を排除し、単一の最も関連性の高いSAE潜伏者(top-1)に焦点を当てることを提案する。
推論に関連付けられたSAE潜伏剤の操舵は、ステップバイステップの数学的推論を確実に引き起こすことを示す。
その結果,SAEは数学推論ベンチマークにおいて平均アクティベーション差法より優れており,IF-Eval上での性能と一致していることがわかった。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 08:31:31 GMT)
(When) Should We Delegate AI Governance to AIs? Some Lessons from Administrative Law [0.0] 高度なAIシステムは、AIガバナンスで使用されている。
人間の実践者はAIの決定を理解することができない可能性があるため、ガバナンスにAIを使用すると深刻なリスクが発生する。
本稿では,AIガバナンスをAIに委譲する際の原則的枠組みの開発に着手する。
論文参考訳(メタデータ) (Wed, 24 Sep 2025 14:50:37 GMT)