Fugu-MT: arxivの論文翻訳(概要)

Humanity's Last Exam [521.6]
HumanityのLast Exam(HLE)は、人間の知識の最前線におけるマルチモーダルベンチマークである。数学、人文科学、自然科学など、数十の分野にまたがる2,500の質問で構成されている。各質問には、曖昧で容易に検証できる既知のソリューションがあるが、インターネット検索ではすぐには答えられない。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:27:10 GMT)
DRS: Deep Question Reformulation With Structured Output [133.2]
大規模言語モデル(LLM)は、解決不可能な質問を検知できるが、これらの質問の修正をユーザーが支援するのに苦労する。 DRS:Deep Question Reformulation with Structured Output, a novel zero-shot method to help users in reformulation question。 DRS は GPT-3.5 の改定精度を 23.03% から 70.42% に改善し,オープンソースモデルの性能も向上することを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:44:14 GMT)
Vulnerability of LLMs to Vertically Aligned Text Manipulations [130.5]
垂直テキスト入力は、数学計算や単語ベースのスドクパズルなど、様々な現実世界のアプリケーションでよく見られる。近年の研究では、エンコーダベースのモデルで単語を垂直に整列させるような入力形式の変更は、テキスト分類タスクにおいて大幅に精度を低下させることが示されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:38:32 GMT)
MAPO: Mixed Advantage Policy Optimization [121.0]
我々は、簡易かつ効果的なGRPO戦略、Mixed Advantage Policy Optimization (MAPO)を提案する。その結果, 軌道の精度は異なることが判明し, 高精度な軌道を持つ試料の偏差の利点が示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:02:44 GMT)
Response to Promises and Pitfalls of Deep Kernel Learning [117.0]
このノートは「深層カーネル学習の約束と落とし穴」(Ober et al., 2021)に反応する。ガウス過程の限界確率は、データ適合項と複雑性ペナルティに分解できる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:31:42 GMT)
MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources [113.3]
VAS (Variance-Aware Sampling) は、Variance Promotion Score (VPS) によって導かれるデータ選択戦略である。我々は、1.6MのCoT冷間開始データと15kのRLQAペアを含む大規模かつ慎重にキュレートされたリソースをリリースする。数学的推論ベンチマークによる実験では、キュレートされたデータと提案されたVASの有効性が示されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:58:29 GMT)
SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines [112.8]
我々は、自然言語と異質な科学的表現を整合させる科学的推論基盤モデルを提案する。このモデルは、科学的なテキスト、純粋なシーケンス、シーケンスとテキストのペアにまたがる206Bのコーパスで事前訓練され、4000万の命令でSFTを介してアライメントされる。 i) テキストと科学形式間の忠実な翻訳、(ii) テキスト/知識抽出、(iii) プロパティの予測、(iv) プロパティの分類、(v) 条件なしおよび条件付きシーケンスの生成と設計。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 17:52:06 GMT)
SIM-CoT: Supervised Implicit Chain-of-Thought [108.3]
Implicit Chain-of-Thought(CoT)メソッドは、大規模言語モデルにおける明示的なCoT推論に代わるトークン効率の代替手段を提供する。暗黙的なCoTの計算予算をスケールする際の中核的な不安定性問題を特定する。そこで我々はSIM-CoTを提案する。SIM-CoTは,遅延推論空間を安定化・拡張するためのステップレベルの監視を実現するモジュールである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:17:01 GMT)
A Simple "Motivation" Can Enhance Reinforcement Finetuning of Large Reasoning Models [103.9]
MeRF(Motivation-enhanced Reinforcement Finetuning)は、大規模共振モデルの強化微調整を強化する直感的かつ効果的な方法である。 MeRFは報酬仕様を直接プロンプトに注入し、最適化目標を認識するためのコンテキスト内モチベーションとして機能する。 MeRFはRLVRベースラインよりもパフォーマンスが大幅に向上する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:11:07 GMT)
Causal Time Series Generation via Diffusion Models [97.0]
新しいTSGタスクファミリーとして因果時系列生成を導入し,Pearlの因果はしご内で定式化した。これらのタスクをインスタンス化するために、統合拡散ベースのフレームワークであるCaTSGを開発した。合成データセットと実世界のデータセットの両方の実験は、CaTSGが優れた忠実性を達成することを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:34:46 GMT)
Understanding Optimization in Deep Learning with Central Flows [95.6]
複雑な状態における最適化のダイナミクスを記述できる理論を開発する。この結果から,ディープラーニングの最適化を推論する上で,中央フローが重要な理論ツールとなる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:29:29 GMT)
DermINO: Hybrid Pretraining for a Versatile Dermatology Foundation Model [92.7]
DermNIOは皮膚科学の多目的基盤モデルである。自己教師型学習パラダイムを増強する、新しいハイブリッド事前学習フレームワークが組み込まれている。さまざまなタスクにおいて、最先端のモデルよりも一貫して優れています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:47:44 GMT)
DELTA-Code: How Does RL Unlock and Transfer New Programming Algorithms in LLMs? [92.5]
本稿では、学習可能性と伝達可能性という2つの基本的な側面を探索するために設計された合成符号問題ファミリーのベンチマークを紹介する。実験の結果, ほぼゼロ報酬の期間が延長された後, RL訓練モデルが突然, ほぼ完全な精度に上昇した。その結果、家族や再考されたスキルに対してしっかりとした利益が得られたが、変革的ケースでは持続的な弱点がみられた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:20:56 GMT)
Thinking Augmented Pre-training [88.0]
拡張事前学習は、自動生成された思考軌跡でテキストを増強する普遍的な方法論である。本稿では,既存のテキストデータを思考トラジェクトリで拡張することにより,大規模言語モデル(LLM)トレーニングのデータ効率を向上させるための,シンプルでスケーラブルなアプローチを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:55:02 GMT)
SD3.5-Flash: Distribution-Guided Distillation of Generative Flows [87.5]
SD3.5-Flashは、高画質の画像生成を消費者デバイスにもたらす、効率的な数ステップ蒸留フレームワークである。グラデーションノイズを低減するための"タイムステップ共有"と、迅速なアライメントを改善するための"スプリットタイムステップ微調整"の2つの重要なイノベーションを紹介します。これにより、携帯電話からデスクトップコンピュータまで、あらゆるデバイスへのアクセスが民主化される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 16:07:38 GMT)
Learning to Summarize by Learning to Quiz: Adversarial Agentic Collaboration for Long Document Summarization [87.0]
SummQは長期文書要約のための新しい逆多重エージェントフレームワークである。提案手法では,包括的な要約を作成し,評価するために協調作業を行う要約ジェネレータとレビュアーを用いる。広範に使用されている3つの文書要約ベンチマーク上でSummQを評価する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:36:19 GMT)
InComeS: Integrating Compression and Selection Mechanisms into LLMs for Efficient Model Editing [86.2]
In-context Learningは、コンテキストエンコーディングを通じて編集情報を解釈することで、有望な編集方法である。この方法は、大きな言語モデルの限られたコンテキストウィンドウによって制約される。編集コンテキストの処理能力を向上させるフレキシブルなフレームワークであるInComeSを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:15:45 GMT)
Process Reward Models That Think [85.1]
ステップバイステップ検証 - プロセス報酬モデル(PRM)としても知られる - は、テスト時間スケーリングの鍵となる要素である。この研究は、検証チェーン・オブ・シント(CoT)を生成することにより、ソリューションのすべてのステップを検証する言語化されたステップワイド報酬モデルとして、データ効率の高いPRMを構築することを目的としている。我々は差別的PRMよりもプロセスラベルを桁違いに少なめに微調整した長いCoT検証器ThinkPRMを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:09:09 GMT)
ASCIIEval: Benchmarking Models' Visual Perception in Text Strings via ASCII Art [84.0]
我々は,この問題を認識タスクとみなし,新しいベンチマークASCIIEvalを構築した。精巧な分類木を持つ3Kサンプルに加えて、さらなる拡張のためのトレーニングセットもカバーしている。テキスト入力が与えられた言語モデルは、ASCIIアートの概念に基づいて視覚的知覚能力を示す。画像入力において,オープンソースのMLLMは,微細なテキスト認識と集合的視覚知覚のトレードオフに悩まされていることが明らかになった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:46:11 GMT)
DistillKac: Few-Step Image Generation via Damped Wave Equations [83.5]
減衰波方程式とKac表現を用いて有限速で確率質量を移動させる高速画像生成装置であるDistillKacを提案する。逆時間速度が硬く、暗黙的に非有界伝播速度を許容する拡散モデルとは対照的に、Kac力学は有限速度輸送を強制し、大域的有界運動エネルギーを得る。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:04:41 GMT)
What Makes a Reward Model a Good Teacher? An Optimization Perspective [82.7]
報酬モデルがどの程度正確であるかに関わらず、低報酬分散を誘導した場合、RLHFの目的は平坦な景観に悩まされる。さらに、ある言語モデルでうまく機能する報酬モデルが、低い報酬分散を誘発し、したがって、別の言語モデルに対して平坦な客観的景観をもたらすことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:11:11 GMT)
FORCE: Transferable Visual Jailbreaking Attacks via Feature Over-Reliance CorrEction [82.7]
視覚的ジェイルブレイク攻撃は、洗練されたテキスト攻撃よりも簡単にオープンソースのMLLMを操作することができる。これらの攻撃は、非常に限られたクロスモデル転送可能性を示し、クローズドソースMLLMの脆弱性を確実に特定することができない。本稿では,FORCE(Feature Over-Reliance CorrEction)手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:36:56 GMT)
One-Embedding-Fits-All: Efficient Zero-Shot Time Series Forecasting by a Model Zoo [82.7]
Time Series Foundation Models (TSFM) はゼロショット予測を大幅に進歩させた。異なるモデルが異なる時間パターンの好みを示すため、単一のTSFMが普遍的に優れているものはない。本稿では,各モデルの予測強度を特徴付けるZooCastを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:20:23 GMT)
Who Gets Cited Most? Benchmarking Long-Context Language Models on Scientific Articles [81.9]
SciTrekは、科学論文を用いた大規模言語モデル(LLM)の長文推論能力を評価するために設計された、新しい質問応答ベンチマークである。本分析により,モデルの基本的数値演算を行ない,特定の情報を長い文脈で正確に特定する能力において,系統的な欠点が明らかとなった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:36:09 GMT)
ConsistentChat: Building Skeleton-Guided Consistent Multi-Turn Dialogues for Large Language Models from Scratch [79.1]
Skeleton-Guided Multi-Turn Dialogue Generationは、人間の意図を明示的にモデル化することで、マルチターン命令合成を制約する。約15,000のマルチターン会話と224,392の発話を持つマルチターン命令データセットであるConsistentChatを構築した。 Light, Topdial, MT-Evalベンチマークの実験では、ConsistentChatで微調整されたモデルでは、チャットの一貫性が20～30%向上し、タスクの成功率が15%向上している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:47:02 GMT)
CNS-Bench: Benchmarking Image Classifier Robustness Under Continuous Nuisance Shifts [78.8]
我々は,連続ニュアンスシフトベンチマークであるCNS-Benchを導入し,連続かつ現実的なニュアンスシフトのための画像分類器の堅牢性を定量化する。本稿では,従来の手法よりも優れたフィルタリング機構を提案し,生成モデルによる信頼性の高いベンチマークを可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:09:35 GMT)
What Happens Next? Anticipating Future Motion by Generating Point Trajectories [76.2]
一つの画像から動きを予測し、世界の物体がどのように動くかを予測する問題を考察する。我々はこのタスクを,現代のビデオジェネレータのアーキテクチャを忠実に追従するモデルを用いて,高密度トラジェクトリグリッドの条件生成として定式化する。このアプローチはシーン全体のダイナミクスと不確実性を捉え、以前の回帰器やジェネレータよりも正確で多様な予測をもたらす。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:03:56 GMT)
ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs [75.7]
本稿では,新しいトラジェクトリ対応PRMであるReasonFlux-PRMを紹介し,トラジェクトリ応答型推論トレースの評価を行う。 ReasonFlux-PRMはステップレベルとトラジェクトリレベルの両方の監視機能を備えており、構造化された連鎖データと整合した微粒な報酬割り当てを可能にする。得られたReasonFlux-PRM-7Bは、教師付き微調整で平均12.1%、強化学習で4.5%、テスト時間スケーリングで6.3%向上した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:30:13 GMT)
AdaSVD: Adaptive Singular Value Decomposition for Large Language Models [75.1]
Singular Value Decomposition (SVD) は,大規模言語モデル(LLM)の有望な圧縮手法として登場した。既存のSVDベースの手法は、SVDトランケーションによって引き起こされるエラーを効果的に軽減するために苦労することが多い。適応SVDに基づくLLM圧縮手法であるAdaSVDを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:28:19 GMT)
MMSI-Bench: A Benchmark for Multi-Image Spatial Intelligence [74.5]
MMSI-Benchは、マルチイメージ空間インテリジェンスに特化したVQAベンチマークである。我々は、大規模な実験を行い、34のオープンソースおよびプロプライエタリMLLMを徹底的に評価する。最も強力なオープンソースモデルはおよそ30%の精度に達し、OpenAIのo3推論モデルは40%に達し、人間は97%である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:01:27 GMT)
Training-Free Layout-to-Image Generation with Marginal Attention Constraints [73.6]
トレーニング不要なレイアウト・トゥ・イメージ(L2I)アプローチを提案する。具体的には、テキスト・ビジュアル・クロスアテンション・フィーチャーマップを用いて、生成された画像のレイアウトと提供された命令の不整合を定量化する。自己アテンション特徴写像の画素間相関を利用して、交差アテンション写像を整列し、境界注意で制約された3つの損失関数を組み合わせ、潜時特徴を更新する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:19:23 GMT)
Why Settle for One? Text-to-ImageSet Generation and Evaluation [72.6]
Text-to-ImageSet (T2IS) の生成は,ユーザ命令に基づいて,さまざまな一貫性要件を満たすイメージセットを生成することを目的としている。トレーニング不要なフレームワークである$textbfAutoT2IS$を提案する。また,本手法は,多くの未探索現実世界の応用を可能にする能力を示し,その実用的価値を実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:49:27 GMT)
Beyond Quantity: Distribution-Aware Labeling for Visual Grounding [72.4]
視覚的な接地には、大きく多様な領域テキストペアが必要である。既存の擬似ラベルパイプラインは、しばしばバイアス分布に適合する。視覚的グラウンドティングのための分布認識型ラベリングフレームワークであるDALを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:30:01 GMT)
MultiVox: A Benchmark for Evaluating Voice Assistants for Multimodal Interactions [70.9]
音声と視覚を融合させる音声アシスタントの能力を評価する最初のベンチマークであるMultiVoxを紹介する。具体的には、MultiVoxには、多種多様なパラ言語的特徴を包含する1000の人間の注釈付き音声対話が含まれている。 10の最先端モデルに対する我々の評価は、人間はこれらのタスクに長けているが、現在のモデルは、常に文脈的に接地された応答を生成するのに苦労していることを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:32:50 GMT)
Aligning Distributionally Robust Optimization with Practical Deep Learning Needs [70.9]
従来のLearning (DL)メソッドはすべてのサンプルを平等に扱うが、DROと現在のDLプラクティスの間には大きなギャップがある。本稿では,重み付けグループを扱える改良DRO目標に対する適応アルゴリズムを導入することにより,このギャップを埋めることを目的とする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:03:41 GMT)
Physics Informed Neural Networks for design optimisation of diamond particle detectors for charged particle fast-tracking at high luminosity hadron colliders [70.7]
将来の高輝度ハドロン衝突装置は、極端放射線耐性、空間精度、ナノ秒以下のタイミングで追跡検出器を必要とする。 3Dダイヤモンドのピクセルセンサーは、ダイヤモンドの放射硬度とキャリアの移動性のために、これらの機能を提供する。我々は、マクスウェル方程式の準定常近似として導かれた3次、3+1D PDEを用いて、この現象をモデル化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:09:28 GMT)
IDEATOR: Jailbreaking and Benchmarking Large Vision-Language Models Using Themselves [70.4]
IDEATORは、ブラックボックスジェイルブレイク攻撃のための悪意のある画像テキストペアを自律的に生成する新しいジェイルブレイク手法である。最近リリースされたVLM11のベンチマーク結果から,安全性の整合性に大きなギャップがあることが判明した。例えば、我々はASRをGPT-4oで46.31%、Claude-3.5-Sonnetで19.65%と設定した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:00:41 GMT)
Responsible Diffusion: A Comprehensive Survey on Safety, Ethics, and Trust in Diffusion Models [69.2]
拡散モデル(DM)は,高品質なデータを生成する能力から,様々な領域で研究されている。従来のディープラーニングシステムと同様に、DMに対する潜在的な脅威も存在する。この調査は、その枠組み、脅威、および対策を包括的に解明する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:51:43 GMT)
Investigating Factuality in Long-Form Text Generation: The Roles of Self-Known and Self-Unknown [68.3]
様々な大言語モデル(LLM)における長文テキスト生成の事実性について検討する。分析の結果, 文末文の事実性は低下傾向にあり, 支持請求件数が増加傾向にあることが明らかとなった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:28:07 GMT)
SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [68.2]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、密度分布を持つ。各種ラベル付き環境下での多目的対象物に対する大規模な実験により,本手法の有効性が示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:03:08 GMT)
S$^2$Transformer: Scalable Structured Transformers for Global Station Weather Forecasting [67.9]
既存の時系列予測手法は、大規模なグローバルステーション予測を行う際に、空間的相関を無視または一方向的にモデル化することが多い。これは、予測性能を制限する地球規模の気象システムの観測の根底にある性質と矛盾する。本稿では,構造的空間的注意を新たに提案する。空間グラフを一連のサブグラフに分割し、サブグラフ内の注意をインスタンス化し、各サブグラフ内の局所的な空間相関を学習する。ノードをサブグラフ間のメッセージパッシングのためのサブグラフ表現に集約する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:12:08 GMT)
TempSamp-R1: Effective Temporal Sampling with Reinforcement Fine-Tuning for Video LLMs [67.6]
本稿では,マルチモーダルな大規模言語モデル(MLLM)をビデオ時間的グラウンド処理に適応させることの有効性向上を目的とした,新しい強化微調整フレームワークであるTempSamp-R1を紹介する。我々は、TempSamp-R1がGRPOベースのベースラインより優れており、ベンチマークデータセット上で新しい最先端のパフォーマンスを確立していることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:28:56 GMT)
Quantized Visual Geometry Grounded Transformer [67.2]
本稿では,VGGTの最初の量子化フレームワーク,すなわちQuantVGGTを提案する。球状前アダマール回転と局所流路平滑化を統合したDual-Smoothed Fine-Grained Quantizationを導入する。また、重層統計量を用いて外周をフィルタするノイズフィルタディバースサンプリングを設計する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:17:11 GMT)
3D-MoRe: Unified Modal-Contextual Reasoning for Embodied Question Answering [66.9]
3D-MoReは、基礎モデルの強みを活用して、大規模な3D言語データセットを生成するように設計されている。このフレームワークは、マルチモーダル埋め込み、クロスモーダルインタラクション、言語モデルデコーダなど、主要なコンポーネントを統合している。 ScanNetの3DシーンデータセットとScanQAとScanReferのテキストアノテーションを使用して、3D-MoReは62,000の質問応答ペアと73,000のオブジェクト記述を生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:53:01 GMT)
LogReasoner: Empowering LLMs with Expert-like Coarse-to-Fine Reasoning for Log Analysis Tasks [66.8]
汎用大規模言語モデル(LLM)は、専門家の認識と整合した構造化推論を定式化し、推論ステップの正確な詳細を提供するのに苦労する。我々は,LLMが専門家のようなログ解析タスクを推論できるように設計された粗粒度拡張フレームワークであるLogReasonerを提案する。我々は,Qwen-2.5 や Llama-3 といったオープンソースの LLM を用いて,ログ解析の4つのタスクについてLogReasoner の評価を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:26:49 GMT)
MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios [66.6]
我々は,ビデオOCRアプリケーションシナリオを包括的に含むMME-VideoOCRベンチマークを紹介する。ベンチマークは、解像度、アスペクト比、持続時間が異なる1,464本のビデオと、2000本の細心の注意を払って、手動で注釈付けされた質問回答ペアで構成されている。 MME-VideoOCRを用いて18種類のMLLMを評価し,最高の性能モデル(Gemini-2.5 Pro)でさえ73.7%の精度で達成できることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:34:16 GMT)
Semantic F1 Scores: Fair Evaluation Under Fuzzy Class Boundaries [65.9]
本稿では,主観的,ファジィなマルチラベル分類のための新しい評価指標であるセマンティックF1スコアを提案する。セマンティックF1は意味的に関連があるが、識別できないラベルに部分クレジットを与えることで、人間の不一致やファジィ圏の境界によって特徴付けられる領域の現実をよりよく反映する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:48:48 GMT)
Un-Doubling Diffusion: LLM-guided Disambiguation of Homonym Duplication [65.7]
ホモニム(Homonym)とは、同一の綴りであるが意味の異なる単語である。拡散モデルは単語の複数の感覚を同時に生成することができる。そこで本研究では,異なる拡散モデルの重複率を計測し,評価を行う手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:54:36 GMT)
A Fano-Style Accuracy Upper Bound for LLM Single-Pass Reasoning in Multi-Hop QA [65.4]
MHQA(Multi-Hop Question Answering)は、ノイズ下でのシーケンシャルな推論を通じて、分散した相互依存的な証拠を統合する必要がある。我々はMHQAのための概念実証マルチコールフレームワークをInfoQAで紹介する。我々は、理論とフレームワークを検証するために、厳密で騒音に富んだベンチマークを構築した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:11:57 GMT)
Bounds of Chain-of-Thought Robustness: Reasoning Steps, Embed Norms, and Beyond [64.9]
既存の研究では、CoT(Chain-of-Thought)の出力が入力摂動に大きく影響していることが示されている。我々は,CoT出力の変動に対する入力摂動の影響を理論的に解析する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:04:31 GMT)
FORGE: Forming Semantic Identifiers for Generative Retrieval in Industrial Datasets [64.5]
FORGEは、産業データセットを使ったジェネレーティブrEtrievalにおけるFOrmingセマンティック識別のベンチマークである。現実世界のアプリケーションでは、オンラインコンバージェンスを半減するオフライン事前トレーニングスキーマが導入されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:44:22 GMT)
MedVSR: Medical Video Super-Resolution with Cross State-Space Propagation [63.4]
低解像度(LR)医療ビデオは、ビデオ超解像度(VSR)モデルに固有の課題を提示する。本稿では,医療用VSRのためのフレームワークであるMedVSRを提案する。 MedVSRは既存のVSRモデルよりも性能と効率が優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:56:59 GMT)
From Tokens to Thoughts: How LLMs and Humans Trade Compression for Meaning [63.3]
大きな言語モデル (LLMs) は言語能力を示すが、同じバランスをとれるかどうかは不明だ。本稿では,LLMと人間を定量的に比較するために,Information Bottleneckの原理を適用した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:34:22 GMT)
Efficiently Disentangling CLIP for Multi-Object Perception [62.5]
CLIPのような視覚言語モデルは、シーン内の1つの顕著なオブジェクトを認識するのに優れていますが、複数のオブジェクトを含む複雑なシーンで苦労しています。凍結したVLMに最小限の学習可能なパラメータのみを追加しながら、最適な相互情報のレベルを学習する効率的なフレームワークであるDCLIPを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:58:13 GMT)
UDDETTS: Unifying Discrete and Dimensional Emotions for Controllable Emotional Text-to-Speech [62.0]
制御可能な感情的TTSのための離散的感情と次元的感情を統一する普遍的なフレームワークであるUDDETTSを提案する。このモデルは、次元的感情記述のための解釈可能なArousal-Dominance-Valence(ADV)空間を導入し、離散的な感情ラベルまたは非線形に定量化されたADV値によって駆動される感情制御をサポートする。実験の結果, UDDETTSは3次元の線形感情制御を実現し, エンドツーエンドの感情音声合成能力に優れていた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:20:16 GMT)
Enrich-on-Graph: Query-Graph Alignment for Complex Reasoning with LLM Enriching [61.8]
大言語モデル(LLM)は知識グラフ質問応答(KGQA)のような知識集約的なシナリオにおける幻覚と事実的誤りに苦しむこれは、構造化知識グラフ(KG)と非構造化クエリのセマンティックギャップによるもので、その焦点や構造に固有の違いが原因である。既存の手法は通常、バニラKGの資源集約的で非スケーリング可能な推論を用いるが、このギャップを見落としている。我々は、LLMの事前知識を活用してKGを充実させる柔軟なフレームワークEnrich-on-Graph(EoG)を提案し、グラフとクエリ間のセマンティックギャップを埋める。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:48:52 GMT)
Searching for Privacy Risks in LLM Agents via Simulation [61.2]
本稿では,プライバシクリティカルなエージェントインタラクションのシミュレーションを通じて,攻撃と防御戦略の改善を交互に行う検索ベースのフレームワークを提案する。攻撃戦略は、直接の要求から、不正行為や同意偽造といった高度な戦術へとエスカレートする。発見された攻撃と防御は、さまざまなシナリオやバックボーンモデルにまたがって伝達され、プライバシーに配慮したエージェントを構築するための強力な実用性を示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:24:30 GMT)
MMaDA: Multimodal Large Diffusion Language Models [61.1]
マルチモーダル拡散基礎モデルの新たなクラスであるMMaDAを紹介する。テキスト推論、マルチモーダル理解、テキスト・ツー・イメージ生成など、さまざまな領域で優れたパフォーマンスを実現するように設計されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:40:45 GMT)
Physics of Learning: A Lagrangian perspective to different learning paradigms [60.8]
効率的な学習は情報を最小時間で処理し、すなわち、最小数の観測値で所望の誤差閾値に達するシステムを構築する。我々は古典的な学習アルゴリズム、強化学習におけるベルマンの最適性方程式、第一原理から生成モデルにおけるアダムを導出する。我々は,ラグランジアンにおける定常経路の学習探索と,定常軌道を求めることによって学習アルゴリズムが導出可能であることを仮定する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:00:22 GMT)
QAMO: Quality-aware Multi-centroid One-class Learning For Speech Deepfake Detection [60.5]
ワンクラスの学習は、単一のセントロイド周囲のボナ・フェイド音声のコンパクトな分布をモデル化することにより、目に見えないディープフェイク攻撃を検出することができる。音声深度検出のための品質認識型マルチセントロイドワンクラス学習(QAMO:QAMO: Multi-Centroid One-Class Learning)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:27:49 GMT)
Addressing Gradient Misalignment in Data-Augmented Training for Robust Speech Deepfake Detection [60.5]
音声ディープフェイク検出(SDD)のための勾配アライメントを用いたデュアルパスデータ拡張(DPDA)トレーニングフレームワークを提案する。本フレームワークでは,各学習発話を2つの入力経路で処理する。 In-the-Wildデータセットの誤差率は,ベースラインと比較して最大18.69%減少する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:31:54 GMT)
Instance-aware Image Colorization with Controllable Textual Descriptions and Segmentation Masks [60.5]
現在の主流の画像カラー化モデルは、カラー出血やカラーバインディングエラーといった問題に直面している。利用指導による高精度なインスタンス認識カラー化を実現するために,拡散型カラー化手法MT-Colorを提案する。我々は、既存の画像データセット上で大きな視覚言語モデルを活用することで、インスタンスレベルのカラー化タスクであるGPTカラーのための特別なデータセットを作成しました。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:25:28 GMT)
Zero-Shot Privacy-Aware Text Rewriting via Iterative Tree Search [60.2]
クラウドベースのサービスにおける大規模言語モデル(LLM)は、重大なプライバシー上の懸念を引き起こしている。既存のテキスト匿名化と、ルールベースのリアクションやスクラブのような非識別技術は、プライバシー保護とテキストの自然性と実用性のバランスをとるのに苦労することが多い。我々は,一貫性,妥当性,自然性を保ちながら,秘密情報を体系的に難読化・削除するゼロショット木探索型反復文書き換えアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:23:52 GMT)
Fractional Reasoning via Latent Steering Vectors Improves Inference Time Compute [60.2]
本稿では,推論時の推論強度を連続的に制御するフレームワークであるフラクショナル推論を提案する。提案手法は, より深い推論を伴う潜在ステアリングベクトルを抽出し, 調整可能なスケーリング係数で再適用することによって機能する。 GSM8K、MATH500、GPQAの実験により、フラクショナル推論は様々な推論タスクやモデルのパフォーマンスを一貫して改善することを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:27:44 GMT)
LLaVA-RadZ: Can Multimodal Large Language Models Effectively Tackle Zero-shot Radiology Recognition? [59.8]
LLaVA-RadZは、既存のMLLM機能を利用して、ゼロショットの医療疾患認識のための、シンプルで効果的なフレームワークである。具体的には、MLLMデコーダアーキテクチャの特性を活用するために、DFAT(Decoding-Side Feature Alignment Training)と呼ばれるエンドツーエンドのトレーニング戦略を設計する。また,大規模モデルの本質的な医学的知識を活用するために,DKAM(Domain Knowledge Anchoring Module)を導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:17:42 GMT)
NeuVAS: Neural Implicit Surfaces for Variational Shape Modeling [59.4]
NeuVASは、スパース入力形状制御の下で拘束されたニューラル暗黙表面を用いた形状モデリングにおける変分アプローチである。ニューラルネットワークSDFのゼロレベル設定面の形状変化を最小限に抑えるために,曲面曲率関数に基づく滑らかさ項を導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:19:46 GMT)
UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction [59.0]
実世界の知識グラフ(英語版) (KGs) は標準的な三つの事実だけでなく、より複雑で異種な事実も含んでいる。ハイパーリレーショナルKG,時間的KG,ネストした事実KGを3次元表現に統一する学習フレームワークであるUniHRを提案する。 5種類のKGにまたがる9つのデータセットの実験は、UniHRの有効性を示し、統一表現の強い可能性を強調している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:54:26 GMT)
EditVerse: Unifying Image and Video Editing and Generation with In-Context Learning [58.5]
イメージとビデオの生成と編集を単一のモデルで統合したフレームワークであるEditVerseを紹介する。テキスト、画像、ビデオなどのすべてのモダリティを統一されたトークンシーケンスとして表現することで、EditVerseは、堅牢なインコンテキスト学習を実現するために自己アテンションを活用する。多様なタスクや解像度をカバーする命令ベースのビデオ編集のための最初のベンチマークであるEditVerseBenchを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:11:13 GMT)
TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them [58.0]
自動評価器(LLM-as-a-judge)としての大規模言語モデル(LLM)は、現在の評価フレームワークにおいて重大な矛盾を明らかにしている。スコア比較不整合とペアワイズ・トランジティビティ不整合という2つの基本的不整合を同定する。我々は2つの重要なイノベーションを通じてこれらの制限に対処する確率的フレームワークであるTrustJudgeを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:04:29 GMT)
A Comprehensive Taxonomy of Negation for NLP and Neural Retrievers [57.6]
我々は、哲学的、言語的、論理的定義から派生した否定の分類を導入した。ニューラルネットワーク検索モデルの性能評価に使用できるベンチマークデータセットを2つ生成する。本稿では,既存のデータセットの検索モデルの性能を解析するために,論理に基づく分類機構を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:21:40 GMT)
WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents [57.2]
本稿では,モデルに基づく探索と反復的,長短のクエリ進化を用いた体系的データ生成手法であるWebExplorerを紹介する。我々のモデルは、128Kのコンテキスト長と最大100のツール呼び出しスイッチをサポートし、長期の問題解決を可能にします。 8Bサイズのモデルとして、WebExplorer-8Bは、RLトレーニング後の平均16ターンを効果的に探索することができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:49:47 GMT)
VideoJudge: Bootstrapping Enables Scalable Supervision of MLLM-as-a-Judge for Video Understanding [57.2]
ビデオ理解モデルから出力を評価するための3Bおよび7BサイズのMLLM判定器であるVideoJudgeを紹介する。 VideoJudgeのトレーニングには、ジェネレータと評価器の相互作用に基づいてレシピを構築します。 4つのメタ評価ベンチマークのうち3つで、VideoJudge-7BはMLLMの判断基準を大きく上回っている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:22:57 GMT)
DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation [55.9]
DORAEMONは、人間のナビゲーション機能を模倣したVentralとDorsal Streamsで構成される、認知にインスパイアされたフレームワークである。我々は,DORAEMONをHM3D,MP3D,GOATのデータセット上で評価し,成功率(SR)と成功度(SPL)の測定値の両方で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:34:10 GMT)
Reinforcement Learning on Pre-Training Data [55.6]
我々は,大規模言語モデル(LLM)を最適化するための新しい訓練時間スケーリングパラダイムである,事前学習データ(R)の強化学習を紹介する。 Rは、有意義な軌道を自律的に探索し、事前学習データから学び、強化学習(RL)を通してその能力を向上させる。複数のモデルにわたる一般領域および数学的推論ベンチマークの広範な実験は、Rの有効性を検証した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:10:03 GMT)
LM-Searcher: Cross-domain Neural Architecture Search with LLMs via Unified Numerical Encoding [55.6]
LM-Searcherは、クロスドメインニューラルネットワーク最適化のための新しいフレームワークである。我々のアプローチの中心は、ニューラルネットワークのための普遍的な数値文字列表現であるNCodeである。我々のデータセットは、幅広いアーキテクチャとパフォーマンスのペアを含み、堅牢で伝達可能な学習を促進する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:43:31 GMT)
You Are Your Own Best Teacher: Achieving Centralized-level Performance in Federated Learning under Heterogeneous and Long-tailed Data [54.6]
局所的な非IIDデータとグローバルな長期分布から生ずるデータ不均一性は、連邦学習(FL)における大きな課題である弱い局所サンプルと強い局所サンプルの知識を蒸留し,表現学習を改善するためにFedYoYoを提案する。我々は、FedYoYoが最先端の結果を達成し、グローバルな長期的設定の下で集中ロジット調整手法を5.4%超えたことを示します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:41:15 GMT)
OjaKV: Context-Aware Online Low-Rank KV Cache Compression with Oja's Rule [54.4]
我々は,戦略的ハイブリッドストレージポリシとオンラインサブスペース適応を統合したフレームワークであるOjaKVを紹介する。 OjaKVは、重要かつ最新のトークンをフルランクで保存し、注意のために高忠実なアンカーを維持している。オンライン主成分分析のためのOjaのアルゴリズムを用いて、プロジェクションベースを漸進的に適応させることにより、低ランク圧縮を適用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:42:27 GMT)
ProstaTD: Bridging Surgical Triplet from Classification to Fully Supervised Detection [54.3]
ProstaTDは、ロボット補助前立腺切除術の技術的要求領域から開発された、外科的三重項検出のための大規模なデータセットである。このデータセットは、71,775の動画フレームと196,490の注釈付きトリプルトインスタンスで構成され、複数の機関で実施された21の手術から収集された。 ProstaTDは、これまでで最大かつ最も多様な3重項データセットであり、単純な分類から正確な空間的境界と時間的境界を持つ完全な検出へとフィールドを移動している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:02:50 GMT)
Neptune-X: Active X-to-Maritime Generation for Universal Maritime Object Detection [54.2]
海上物体検出は、航行安全、監視、自律運転に不可欠である。 Neptune-Xは、トレーニングの有効性を高めるデータ中心の生成選択フレームワークである。我々の手法は海洋シーン合成における新しいベンチマークを定めている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:59:02 GMT)
SFT Doesn't Always Hurt General Capabilities: Revisiting Domain-Specific Fine-Tuning in LLMs [53.8]
Supervised Fine-Tuning (SFT) は、大規模言語モデル(LLM)を特殊タスクに適用するための一般的なアプローチである。より少ない学習率で一般的な性能劣化を著しく軽減することができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:28:22 GMT)
Reformulation is All You Need: Addressing Malicious Text Features in DNNs [53.5]
本稿では,敵攻撃とバックドア攻撃の両方に対して有効な,統一的かつ適応的な防御フレームワークを提案する。我々のフレームワークは、様々な悪意あるテキスト機能において、既存のサンプル指向の防御基準よりも優れています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:09:47 GMT)
Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.5]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。 Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。 SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:05:55 GMT)
Causal Abstraction Inference under Lossy Representations [53.2]
我々は、既存の定義を一般化して損失表現に適合させる、投影抽象化と呼ばれる新しいタイプの抽象化を導入する。低レベルモデルから投影された抽象化を構築する方法と、それと等価な観察的、介入的、および反ファクト的因果クエリを低レベルから高レベルに翻訳する方法を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:20:42 GMT)
Texture or Semantics? Vision-Language Models Get Lost in Font Recognition [53.1]
FRB(Font Recognition Benchmark)は15のフォントからなるコンパクトで構造化されたデータセットである。 FRBには2つのバージョンがある: (i) 簡単なバージョン、10つの文を異なるフォントで描画するバージョン、 (ii) ハードバージョン。フォント認識タスクにおける様々なVLMの広範な評価を通じて,以下の重要な知見を得た。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:24:21 GMT)
$A^2R^2$: Advancing Img2LaTeX Conversion via Visual Reasoning with Attention-Guided Refinement [53.1]
視覚言語モデル(VLM)は、様々な視覚的理解タスクにおいて顕著な進歩を遂げている。 A2R2$:Advancing Img2La Conversion via Visual Reasoning with Attention-Guided Refinementを提案する。有効評価のために,1,100個の慎重にキュレートされた,挑戦的なサンプルからなる新しいデータセットImg2LaTex-Hard-1Kを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:30:03 GMT)
VerifyBench: Benchmarking Reference-based Reward Systems for Large Language Models [53.1]
OpenAI o1とDeepSeek-R1は、推論の領域で素晴らしいパフォーマンスを達成した。彼らのトレーニングの重要な要素は、強化学習に検証可能な報酬を取り入れることである。既存の報酬ベンチマークでは、参照ベースの報酬システムの評価は行われていない。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:20:02 GMT)
Which Cultural Lens Do Models Adopt? On Cultural Positioning Bias and Agentic Mitigation in LLMs [53.1]
大規模言語モデル(LLM)は、幅広い下流生成アプリケーションをアンロックした。また、米国主流の文化の観点から、文化にまつわる微妙な公平性の問題に対処し、世代を配置するリスクも見いだす。本稿では、これらのバイアスを解決するための2つの推論時間緩和法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:28:25 GMT)
Graph Random Features for Scalable Gaussian Processes [52.9]
離散入力空間上のスケーラブルなガウス過程へのグラフランダム特徴(GRF)の適用について検討する。我々は、(穏やかな仮定の下で) GRF に対するベイズ的推論が、正確なカーネルに対して$O(N3)$のノード数に対して$O(N3/2)$の時間複雑性を楽しむことを証明した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:24:05 GMT)
From Physics to Machine Learning and Back: Part II - Learning and Observational Bias in PHM [52.6]
物理インフォームドモデリングとデータストラテジーによる学習と観察バイアスの導入は、モデルを物理的に一貫した信頼性のある予測へと導くことができるかを検討する。メタラーニングや少数ショットラーニングなどの高速適応手法をドメイン一般化手法とともに検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:15:43 GMT)
CodeBrain: Towards Decoupled Interpretability and Multi-Scale Architecture for EEG Foundation Model [52.5]
EEGファウンデーションモデル(EFM)は、タスク固有のモデルのスケーラビリティ問題に対処するために登場した。このギャップを埋めるために設計された2段階のEMFであるCodeBrainを紹介します。第1段階では、異種時間・周波数の脳波信号を離散トークンに分解するTFDual-Tokenizerを導入する。第2段階では、構造化されたグローバル畳み込みとスライディングウインドウの注意を結合したマルチスケールEEGSSMアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:55:31 GMT)
iTACO: Interactable Digital Twins of Articulated Objects from Casually Captured RGBD Videos [52.4]
本研究では,手持ちカメラで撮影したカジュアルなRGBD映像から,物体の動作解析と部分レベルセグメンテーションに焦点を当てた。スマートフォンを用いて手軽に手軽に手軽に手軽に手に入ることができる。動的RGBDビデオからオブジェクトの関節パラメータとセグメントを推論する粗粒度フレームワークiTACOを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:24:31 GMT)
MonSter++: Unified Stereo Matching, Multi-view Stereo, and Real-time Stereo with Monodepth Priors [52.4]
MonSter++は多視点深度推定の基礎モデルである。多視点深度推定に単眼深度推定を組み込む。 MonSter++はステレオマッチングとマルチビューステレオの両方で新しい最先端を実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:51:56 GMT)
An Adaptor for Triggering Semi-Supervised Learning to Out-of-Box Serve Deep Image Clustering [52.2]
ASDは、SSL学習者のコールドスタートを前提条件にすることなく、ディープイメージクラスタリングを可能にするアダプタである。最新のディープ・イメージ・クラスタリング・アプローチに対して,各種ベンチマークにおけるASDの優れた性能を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:21:01 GMT)
ScaleDiff: Scaling Difficult Problems for Advanced Mathematical Reasoning [51.9]
大規模推論モデル (LRM) は複雑な問題解決において顕著な能力を示している。難しい問題の生成をスケールするために設計されたパイプラインであるScaleDiffを提案する。我々のパイプラインは、より大きくて高価な教師モデルに頼ることなく、高度な推論能力を効果的に伝達できることを示します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:22:44 GMT)
Lightweight MSA Design Advances Protein Folding From Evolutionary Embeddings [51.7]
マルチシークエンスアライメント(MSA)は低ホモロジーおよび孤児タンパク質で機能する。我々は、下流の折り畳みをより良くサポートするMSAを生成する軽量なMSA設計フレームワークPLAMEを紹介する。 AlphaFold2の低ホモロジー/孤児ベンチマークでは、PLAMEは構造精度の最先端の改善を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:22:48 GMT)
Degree-Conscious Spiking Graph for Cross-Domain Adaptation [51.6]
Spiking Graph Networks (SGNs) はグラフ分類において大きな可能性を証明している。 DeSGraDA(Degree-Consicious Spiking Graph for Cross-Domain Adaptation)という新しいフレームワークを紹介する。 DeSGraDAは3つのキーコンポーネントを持つドメイン間の一般化を強化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:31:16 GMT)
UNCERTAINTY-LINE: Length-Invariant Estimation of Uncertainty for Large Language Models [51.5]
UNCERTAINTY-LINEは、名目上は長さ正規化UQ法よりも一貫して改善されていることを示す。本手法は, ポストホック, モデル非依存であり, 様々なUQ尺度に適用可能である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:33:25 GMT)
LeVERB: Humanoid Whole-Body Control with Latent Vision-Language Instruction [51.3]
ヒューマノイド全体制御のための視覚言語・クローズドループベンチマーク(WBC)について紹介する。そこで我々は,人間型視覚言語WBCのための階層型遅延命令追従フレームワークであるLeVERB: Latent Vision-Language-Encoded Robot Behaviorを提案する。私たちのベンチマークでは、単純なビジュアルナビゲーションタスクでゼロショットが80%の成功率、全体的な58.5%の成功率が、階層的な階層的なVLA実装よりも7.8倍高い。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:11:15 GMT)
Inverse Reinforcement Learning with Dynamic Reward Scaling for LLM Alignment [51.1]
DR-IRL(逆強化学習によるリワードの動的調整)を提案する。まず、IRLを介して7つの有害なカテゴリをカバーするバランスの取れた安全データセットを用いて、カテゴリ固有の報酬モデルを訓練する。次に,テキストエンコーダのコサイン類似性によるデータレベルの硬さ,報酬ギャップによるモデルレベルの応答性など,タスク難易度による報酬を導入することにより,グループ相対政策最適化(GRPO)を強化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:38:14 GMT)
HUNT: High-Speed UAV Navigation and Tracking in Unstructured Environments via Instantaneous Relative Frames [50.8]
HUNT (High-speed UAV Navigation and Tracking) は、1つの相対的な定式化の中で統合、取得、追跡を行うリアルタイムフレームワークである。密林、コンテナ化合物、および車両やマネキンによる捜索救助活動の試行は、グローバルな方法が失敗した場合の堅牢な自律性を示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:54:30 GMT)
VideoChat-R1.5: Visual Test-Time Scaling to Reinforce Multimodal Reasoning by Iterative Perception [50.4]
VTTS(Visual Test-Time Scaling)は、推論中の反復推論を通じてMLLMの推論を強化する新しい手法である。 VTTSは、高信頼の階層的時間領域に注目することで人間の注意を模倣し、更新されたテキスト予測によってガイドされる。新たに導入した Videochat-R1.5 モデルは,平均 5% 以上の向上を実現しています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:46:46 GMT)
RobotDancing: Residual-Action Reinforcement Learning Enables Robust Long-Horizon Humanoid Motion Tracking [50.2]
RobotDancingはシンプルでスケーラブルなフレームワークで、残留する関節の目標を予測して、ダイナミックスの不一致を明示的に修正する。複数分間の高エネルギー動作(ジャンプ、スピン、カートホイール)をトラッキングし、高いモーショントラッキング品質のハードウェアにゼロショットをデプロイする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:30:34 GMT)
Disagreements in Reasoning: How a Model's Thinking Process Dictates Persuasion in Multi-Agent Systems [49.7]
本稿では,説得力はモデルスケールの関数である,という一般的な仮説に挑戦する。一連のマルチエージェントの説得実験を通じて、パーサーション・デュナリティ(Persuasion Duality)と呼ばれる基本的なトレードオフを明らかにする。以上の結果から, LRMの推理過程は説得に対する抵抗性が大きく, 当初の信念をより堅固に維持していることが明らかとなった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:03:10 GMT)
LIMI: Less is More for Agency [49.6]
LIMI(Less Is More for Intelligent Agency)は、機関が根本的に異なる開発原則に従うことを示す。高度なエージェント・インテリジェンスは、最小でも戦略的にキュレートされた自律行動のデモンストレーションから生まれる可能性がある。マシンの自律性はデータの豊富さではなく、高品質なエージェント実証の戦略的キュレーションから生まれる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:23:08 GMT)
MI-Fuse: Label Fusion for Unsupervised Domain Adaptation with Closed-Source Large-Audio Language Model [49.6]
大規模音声言語モデル(LALM)は、音声タスクに強いゼロショット能力を示し、音声感情認識(SER)の可能性を示唆している。私たちは、未ラベルのターゲットドメインオーディオとAPIのみのLALMだけを考えると、学生モデルがターゲットドメインのLALMを上回るように適応できるだろうか? LALMを補助教師としてソースドメイン訓練されたSERで補足する識別ラベル融合フレームワークであるMI-Fuseを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:16:32 GMT)
Joint Active RIS Configuration and User Power Control for Localization: A Neuroevolution-Based Approach [49.5]
Reconfigurable Intelligent Surface (RIS) によるユーザローカライゼーションの研究ベースステーションからユーザへのフィードバックリンクを採用し、アップリンク内のユーザパイロット送信の動的電力制御を可能にする。 RIS位相構成とユーザ送信電力のジョイント制御のための新しいマルチエージェントアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:36:04 GMT)
Dense Semantic Matching with VGGT Prior [49.4]
本稿では,VGGTの本質的な強みを,初期の特徴段階を再利用し,後続の特徴段階を微調整し,双方向対応のための意味的頭部を追加することによって維持するアプローチを提案する。提案手法は, 従来のベースラインよりも優れた幾何認識, 整合性, および多様体保存を実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:56:11 GMT)
FFT-based Dynamic Subspace Selection for Low-Rank Adaptive Optimization of Large Language Models [49.4]
低次元空間へのSVD/QRベースの勾配射影を近似する2段階の手順を提案する。大きな層の場合、DCTはMakhoulの$N$-pointアルゴリズムを介して$O(n2 log(n))$ timeでFFT(Fast Fourier Transform)に基づいて計算できる。事前学習と微調整の両課題に対する実験により、最適な低ランク射影を近似する2つの戦略の有効性が示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:47:27 GMT)
Towards Inclusive ASR: Investigating Voice Conversion for Dysarthric Speech Recognition in Low-Resource Languages [49.3]
音声変換モデルを英語の変形音声(UASpeech)に微調整し、話者特性と韻律歪みの両方を符号化する。次に、健康な非英語音声(FLEURS)を非英語の変形性音声に変換する。生成されたデータは、MMS(Massively Multilingually Speech)と呼ばれる多言語ASRモデルの微調整に使用される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:15:58 GMT)
Context-Aware Reasoning On Parametric Knowledge for Inferring Causal Variables [49.3]
本稿では,部分因果グラフの完成を目的とした新しいベンチマークを提案する。原因と効果の間のバックドア変数を仮説化するLLMの強い能力を示す。固定された関連性の単純な記憶とは異なり、我々のタスクはグラフ全体のコンテキストに応じてLCMを推論する必要がある。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:38:43 GMT)
GeoEvolve: Automating Geospatial Model Discovery via Multi-Agent Large Language Models [49.3]
進化的探索と地理空間的ドメイン知識を結合した多エージェントLLMフレームワークであるGeoEvolveを紹介する。本研究では,空間的不確実性と空間的不確実性という2つの基本的・古典的課題について評価する。空間誤差(RMSE)を13-21%削減し、不確実性推定性能を17%向上させる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:03:57 GMT)
PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints [49.2]
大規模言語モデル(LLM)のための透かしレベル(SWM)に関する新しい理論フレームワークを提案する。 PMarkは単純だが強力なSWM手法であり、サンプリングチャネルを通して中央値の次文を動的に推定する。実験結果から,PMarkはテキスト品質とパラフレージングの両方において,既存のSWMベースラインを一貫して上回ることがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:08:31 GMT)
LDC-MTL: Balancing Multi-Task Learning through Scalable Loss Discrepancy Control [49.0]
マルチタスク学習(MTL)は、複数のタスクを同時に学習する能力に広く採用されている。両レベル最適化の観点から定式化されたMDLの簡易かつスケーラブルな損失分散制御手法であるLCC-MTLを提案する。提案手法は2つの重要な要素を包含する: (i) 細粒度損失分散制御のための2レベル定式化, (ii) 時間とメモリを$mathcalO(1)$でしか必要としないスケーラブルな1次2レベルアルゴリズム。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:29:34 GMT)
Co-Evolving LLM Coder and Unit Tester via Reinforcement Learning [48.7]
本稿では,専用の報酬設計を備えた新しい強化学習フレームワークCUREを提案する。 CUREは、その相互作用の結果に基づいて、コーディングと単体テスト生成機能を共進化させる。我々のモデルは,ベースモデルに基づく強化学習に有効な報奨モデルとして機能することを発見した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:36:19 GMT)
VC-Agent: An Interactive Agent for Customized Video Dataset Collection [48.7]
本稿では,ユーザの質問やフィードバックを理解する対話型エージェントVC-Agentを提案する。エージェント機能については,既存のマルチモーダルな大規模言語モデルを活用し,ユーザの要求をビデオコンテンツと結びつける。我々は、パーソナライズされたビデオデータセット収集のための新しいベンチマークを提供し、様々な実シナリオにおけるエージェントの使用状況を検証するために、ユーザースタディを慎重に実施する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:08:28 GMT)
CryoSplat: Gaussian Splatting for Cryo-EM Homogeneous Reconstruction [48.5]
低温電子顕微鏡(cryo-EM)は、分子構造をほぼ原子の分解能で決定するのに役立つ。単一粒子Cryo-EMにおける中心的な計算課題は、未知の方向で取得されたノイズの多い2Dプロジェクションから分子の3次元静電ポテンシャルを再構築することである。本稿では,GMMをベースとしたCryoSplatを提案し,Gaussian splattingとCryo-EM画像形成の物理を統合する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:10:11 GMT)
Conditional Video Generation for High-Efficiency Video Compression [48.3]
本稿では,条件付き拡散モデルを利用した映像圧縮フレームワークを提案する。具体的には、映像圧縮を条件生成タスクとして再構成し、生成モデルがスパース信号から映像を合成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:52:36 GMT)
Vision Transformers: the threat of realistic adversarial patches [48.0]
ビジョントランスフォーマー(ViT)は、現代の機械学習において大きな注目を集めている。 ViTは、特に敵のパッチに対して、回避攻撃に弱いままである。本研究では,VT分類モデルに適用したCNNにおける敵攻撃手法の転送可能性について検討した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:36:25 GMT)
MathFimer: Enhancing Mathematical Reasoning by Expanding Reasoning Steps through Fill-in-the-Middle Task [48.0]
数学的推論ステップ拡張のための新しいフレームワークであるMathFimerを紹介する。我々は、慎重にキュレートしたNuminaMath-FIMデータセットに基づいて、特殊モデルMathFimer-7Bを開発した。次に、これらのモデルを適用して、解鎖に詳細な中間ステップを挿入することで、既存の数学的推論データセットを強化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:50:06 GMT)
REArtGS: Reconstructing and Generating Articulated Objects via 3D Gaussian Splatting with Geometric and Motion Constraints [47.8]
REArtGSは、幾何学的および運動的制約を3Dガウスプリミティブに導入する新しいフレームワークである。与えられた状態に対する高忠実なテクスチャ化表面再構成を実現し、目に見えない状態に対する高忠実な表面生成を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:07:05 GMT)
CLAUSE: Agentic Neuro-Symbolic Knowledge Graph Reasoning via Dynamic Learnable Context Engineering [47.8]
CLAUSEは,文脈構築を知識グラフ上の逐次決定プロセスとして扱うエージェント型3エージェントニューロシンボリックフレームワークである。 CLAUSEは提案したLagrangian-Constrained Multi-Agent Proximal Policy Optimization (LC-MAPPO)アルゴリズムを用いて、サブグラフアーキテクト、パスナビゲータ、コンテキストキュレーターの3つのエージェントを調整する。 HotpotQA、MetaQA、FactKG全体では、CLAUSEはより高いEM@1を得られると同時に、トークン予算が等しく低い場合のサブグラフの成長とエンドツーエンドのレイテンシを低減する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:43:08 GMT)
Sigma: Semantically Informative Pre-training for Skeleton-based Sign Language Understanding [47.5]
事前学習は手話理解タスクにおける伝達可能な特徴の学習に有効であることが証明されている。 1)視覚的特徴と言語的文脈との深い相互作用を促進し,視覚的特徴と言語的文脈との深い相互作用を促進するサイン・アウェア・アーリー・フュージョン・メカニズム,2)異なるモダリティから異なるレベルの特徴のマッチングを共同で最大化し,詳細な詳細と高レベルのセマンティックな関係を効果的に把握する階層的アライメント学習戦略,3)コントラスト的学習,テキストマッチング,言語モデリングを組み合わせた統合事前学習フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:28:34 GMT)
Automatic Red Teaming LLM-based Agents with Model Context Protocol Tools [47.3]
我々は、悪意のあるMPPツールを生成することで、LSMベースのエージェントのための自動レッドチーム化フレームワークであるAutoMalToolを提案する。評価の結果,AutoMalToolは主要なLCMエージェントの動作を制御できる悪意のあるMPPツールを効果的に生成できることがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:14:38 GMT)
Revisiting Data Challenges of Computational Pathology: A Pack-based Multiple Instance Learning Framework [47.0]
コンピュータ病理学(CPath)は、病理スライドを全スライド画像(WSI)にデジタル化する WSIは、非常に長いシーケンス長(最大200K)、相当な長さのバリエーション(200Kから200K)、限られた監督を持っている。これらの課題に対処するためのパックベースのMILフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:05:40 GMT)
TABLET: A Large-Scale Dataset for Robust Visual Table Understanding [47.0]
既存のビジュアルテーブル理解(VTU)データセットは、単一の視覚化と事前定義された命令を備えた固定例を提供する。 20タスクにわたる400万のサンプルを備えた大規模なVTUデータセットであるTABLETを紹介した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:14:27 GMT)
Learning GUI Grounding with Spatial Reasoning from Visual Feedback [46.7]
我々は,多段階オンライン強化学習を用いたGUIグラウンドモデル GUI-Cursor を訓練する。実験の結果、Qwen2.5-VL-7Bに基づくGUI-Cursorは、GUIグラウンドの精度を向上し、最先端の結果が得られることがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:38:01 GMT)
Breaking the Exploration Bottleneck: Rubric-Scaffolded Reinforcement Learning for General LLM Reasoning [46.6]
大規模言語モデル(LLM)は、推論能力の出現を促進するために強化学習(RL)の可能性を強調している。本稿では,一般的な推論のための探索ボトルネックを解消するために,Scaffolded Reinforcement Learning (RuscaRL)を提案する。我々は、RuscaRLがQwen2.5-7B-InstructをHealthBench-500で23.6から50.3に大幅に向上し、GPT-4.1を上回っていることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:24:28 GMT)
Training-Free Stein Diffusion Guidance: Posterior Correction for Sampling Beyond High-Density Regions [46.6]
自由拡散誘導の訓練は、追加の訓練なしに既成の分類器を活用する柔軟な方法を提供する。本稿では,SOC を対象とする新たなトレーニングフリーフレームワークである Stein Diffusion Guidance (SDG) を紹介する。分子低密度サンプリングタスクの実験は、SDGが標準のトレーニングフリーガイダンス手法を一貫して上回っていることを示唆している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:35:37 GMT)
Forecasting Seismic Waveforms: A Deep Learning Approach for Einstein Telescope [46.5]
我々は、アインシュタイン望遠鏡のような将来の重力波検出器の文脈において、3成分地震波形を予測する変圧器に基づくモデルであるtextitSeismoGPTを紹介した。波形データから直接時間的および空間的依存関係を学習することにより、SeesmoGPTは現実的な地動パターンを捉え、正確な短期予測を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:16:13 GMT)
Turning Internal Gap into Self-Improvement: Promoting the Generation-Understanding Unification in MLLMs [46.4]
MLLMの統一化は、優れた生成の理解と内部的なギャップを生じさせることを示す。この発見は、シンプルだが効果的な内部ギャップに基づく自己改善フレームワークを提案する動機となっている。プレトレーニングでよく知られるが,ポストトレーニングでは過小評価されている,このような自己改善の併用効果を実証的に発見する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:17:06 GMT)
Logic of Hypotheses: from Zero to Full Knowledge in Neurosymbolic Integration [46.4]
ニューロシンボリック統合(NeSy)は、ニューラルネットワーク学習とシンボリック推論をブレンドする。本稿では,データ駆動型ルール学習を記号的先行と専門知識で統一する新言語LoHについて紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:31:43 GMT)
Efficient Ensemble Conditional Independence Test Framework for Causal Discovery [46.3]
本稿では,汎用およびプラグアンドプレイフレームワークであるEnsemble Conditional Independence Test (E-CIT)を紹介する。 E-CITはデータをサブセットに分割し、与えられたベースCITを各サブセットに独立に適用し、結果として得られるp値を集約する。その結果、E-CITはCITの計算負担と因果発見を著しく低減するだけでなく、競争性能も向上することが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:31:16 GMT)
ImaginationPolicy: Towards Generalizable, Precise and Reliable End-to-End Policy for Robotic Manipulation [46.1]
ロボット操作のための新しい動き指向キーポイント(CoMOK)の定式化を提案する。私たちの定式化は、エンドツーエンドでトレーニング可能なニューラルポリシーのアクション表現として使用されます。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:29:07 GMT)
Scalable modular architecture for universal quantum computation [46.0]
一つの絡み合う2量子ゲートで制御可能な進化演算子である2つの量子ビットアレイを接続することは十分であることを示す。提案手法は,IBMの量子プロセッサにインスパイアされた,それぞれ127量子ビットからなる2つの例で説明する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:30:13 GMT)
Functional Encryption in Secure Neural Network Training: Data Leakage and Practical Mitigations [45.9]
本稿では,関数暗号化(FE)を用いて暗号化データのセキュアなトレーニングを行うニューラルネットワークに対する攻撃を提案する。 1つのアプローチは暗号化に頼ることなくセキュリティを保証するが、もう1つは関数を隠蔽する内部製品技術を使用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:56:05 GMT)
Positional Encoding via Token-Aware Phase Attention [45.9]
本研究は,Rotary Positional Embedding (RoPE) が注意点の内在的距離依存バイアスを導入し,RoPEが長期コンテキストをモデル化する能力を制限していることを示す。本稿では,学習可能な位相関数をアテンション機構に組み込んだ新しい位置符号化手法であるToken-Aware Phase Attention (TAPA)を紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:11:04 GMT)
GeoRef: Referring Expressions in Geometry via Task Formulation, Synthetic Supervision, and Reinforced MLLM-based Solutions [45.7]
本稿では,幾何学的問題に対するReferring Expression (REC) の課題を紹介する。 RECは、テキストのプロンプトに応じて図形の点、形、空間関係をローカライズできるかどうかを評価する。構造化幾何形式言語を用いた大規模合成学習データセットを生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:00:52 GMT)
ARMesh: Autoregressive Mesh Generation via Next-Level-of-Detail Prediction [45.7]
本稿では,3次元メッシュの自動回帰生成手法を提案する。具体的には、メッシュの単純化アルゴリズムを見て、メッシュを徐々にマージして、よりシンプルなメッシュを構築する。実験により、この新しいプログレッシブメッシュ生成アプローチは、生成品質と時間消費を直感的に制御できることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:12:02 GMT)
Frequency-Compensated Network for Daily Arctic Sea Ice Concentration Prediction [45.5]
北極圏SIC予測のための周波数補償ネットワーク(FCNet)を毎日提案する。特に、周波数特徴抽出と畳み込み特徴抽出のための分岐を含む二重分岐ネットワークを設計する。高周波の特徴はチャネルワイド・アテンションによって強化され、時間的アテンション・ユニットは低周波の特徴抽出に使われ、長距離海氷の変化を捉えている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:23:07 GMT)
CusEnhancer: A Zero-Shot Scene and Controllability Enhancement Method for Photo Customization via ResInversion [45.1]
既存のアイデンティティカスタマイズモデルを拡張する新しいフレームワークであるCustomEnhancerを紹介します。当社のパイプラインは、パーソナライズされたモデルの生成プロセスに対する、包括的なトレーニング不要な制御を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:00:34 GMT)
Diff-Reg v2: Diffusion-Based Matching Matrix Estimation for Image Matching and 3D Registration [44.9]
本稿では,行列空間における拡散モデルを利用して,ロバストマッチング行列推定を行う革新的パラダイムを提案する。具体的には、3D-3Dおよび2D-3D登録タスクに対して2次元行列空間に拡散モデルを適用する。 3つの登録タスクすべてに対して、各タスクの特定の特性に合わせた適応的マッチング行列埋め込み実装を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:04:34 GMT)
$\mathbf{Li_2}$: A Framework on Dynamics of Feature Emergence and Delayed Generalization [44.6]
非線形ネットワークにおけるグラッキング現象,すなわち遅延一般化について検討する。 2層非線形ネットワークのグルーキング動作の3つの重要な段階を捉える。我々の研究は、体重減少、学習率、グルーキングにおけるサイズといったハイパーマスが果たす役割に光を当てています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:08:09 GMT)
Understanding-in-Generation: Reinforcing Generative Capability of Unified Model via Infusing Understanding into Generation [44.0]
統一モデル(UiG)のための新しい推論フレームワークを提案する。 UiGの中核となる洞察は、推論過程において強力な理解能力によって生成誘導を統合することである。我々のUiGフレームワークは,既存のテキスト・ツー・イメージ推論手法に比べて,テキスト・ツー・イメージ生成の性能が大幅に向上したことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:19:34 GMT)
SelfBudgeter: Adaptive Token Allocation for Efficient LLM Reasoning [43.9]
SelfBudgeterは、アダプティブな制御可能な推論フレームワークで、推論の前に予算推定メカニズムを組み込む。本稿では,問題複雑度に応じて予算を動的に割り当てることにより,平均応答長61%の圧縮が得られることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:07:40 GMT)
ARTI-6: Towards Six-dimensional Articulatory Speech Encoding [43.9]
ARTI-6は、リアルタイムMRIデータから導出した6次元音声符号化フレームワークである。 ARTI-6は,(1)声道のキー領域を表す6次元の調音特徴集合,(2)音声音響から調音特徴を予測する調音反転モデル,(3)聴覚特徴から直接可聴音声を再構成する調音合成モデルからなる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:18:35 GMT)
VISION: Prompting Ocean Vertical Velocity Reconstruction from Incomplete Observations [43.8]
我々は、ペタスケールシミュレーションによる高分解能海洋力学ベンチマークKD48を構築し、リリースする。次に、動的プロンプトに基づく新しい再構成パラダイムであるVISIONを紹介する。 VISIONの本質は、利用可能な観測のサブセットから視覚的なプロンプトをオンザフライで生成できる能力にある。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:41:20 GMT)
Null-Space Filtering for Data-Free Continual Model Merging: Preserving Transparency, Promoting Fidelity [43.8]
データフリー連続モデルマージは、タスクデータにアクセスすることなく、入ってくるタスクで進化する単一のバックボーンに、独立して微調整されたモデルを融合することを目的としている。本稿では,DFCMMにおける2つの基本的なデシラタを定式化する。本稿では,これらのデシラタを最適化に直接リンクするデータフリーフレームワークであるNUFILTを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:33:02 GMT)
CHARM: Control-point-based 3D Anime Hairstyle Auto-Regressive Modeling [43.5]
アニメヘアスタイルモデリングのための新しいパラメトリック表現および生成フレームワークであるCHARMを提案する。 CHARMはコンパクトで可逆な制御ポイントベースのパラメータ化を導入し、制御ポイントのシーケンスは各ヘアカードを表す。この表現に基づいて、CHARMは自動回帰生成フレームワークを導入し、入力画像や点雲からアニメのヘアスタイルを効果的に生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:00:38 GMT)
Differential-Integral Neural Operator for Long-Term Turbulence Forecasting [43.0]
textbfunderlineDifferential-textbfunderlineIntegral textbfunderlineNeural textbfunderlineOperator (method) メソッドは、異なる物理演算子を学習する並列分岐による乱流進化を明示的にモデル化する。数百のタイムステップにわたる誤差の蓄積をうまく抑制し、渦場とエネルギースペクトルの両方において高い忠実性を維持し、物理的に一貫した長距離乱流予測のための新しいベンチマークを確立する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:08:26 GMT)
Average-Case Complexity of Quantum Stabilizer Decoding [42.8]
1つの論理量子ビットでさえも、ランダムな安定化符号を復号化することは、ランダムな古典符号を一定速度で復号化することと同じくらい難しいことを証明している。この結果は、最も簡単なランダム量子復号問題は、少なくとも最も難しいランダム古典復号問題と同じくらい難しいことを示唆している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:04:40 GMT)
A State-of-the-Art SQL Reasoning Model using RLVR [42.5]
BIRDと呼ばれる一般的なデータサイエンスベンチマークにReinforcement Learningを適用した。 BIRDトレーニングセット以外のトレーニングデータがないため、私たちの最初の提出は最先端の精度に達しました。 BIRDは単なるプロキシタスクですが、私たちのフレームワークのシンプルさによって、エンタープライズドメインに広く適用できます。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:27:35 GMT)
When Instructions Multiply: Measuring and Estimating LLM Capabilities of Multiple Instructions Following [42.1]
本稿では,複数の命令が重要である基本領域に対する2つの特別なベンチマークを紹介する。命令数が増えるにつれて、性能が一貫して低下することを示す。本稿では,説明変数として命令数を用いたロジスティック回帰モデルを用いて,約10%の誤差で複数の命令を追従する性能を予測できることを実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:01:32 GMT)
Residual Off-Policy RL for Finetuning Behavior Cloning Policies [42.0]
本稿では,行動クローニング(BC)と強化学習(RL)の利点を組み合わせたレシピを提案する。提案手法は疎二元報酬信号のみを必要とするため,高次自由度(DoF)システムの操作ポリシーを効果的に改善することができる。特に、私たちの知る限りでは、人型ロボットによる実世界初のRLトレーニングが成功しました。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:53:20 GMT)
Identifying Group Anchors in Real-World Group Interactions Under Label Scarcity [41.9]
グループ間相互作用は、例えば、共著者、電子メール通信、オンラインQ&Aなど、様々な現実世界の文脈で発生する。各グループには、しばしば重要なメンバーが存在し、その周りでグループが形成されている。このような個人をグループアンカーと呼び、それらを識別する問題について研究する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:38:58 GMT)
Observation of Discrete Time Quasicrystal in Rydberg Atomic Gases [41.8]
離散時間準結晶(DTQC)は、厳密な周期性のない時間秩序を特徴とする非平衡物質のクラスである。ここでは、強く相互作用するRydberg原子の駆動散逸アンサンブルにおいてDTQCを実験的に観察する。本研究では,DTQC位相の出現を示す複数の非共振周波数で頑健なサブハーモニック応答を示すことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:43:18 GMT)
$100K or 100 Days: Trade-offs when Pre-Training with Academic Resources [41.6]
プレトレーニングは計算集約的なことで知られ、学術研究者はリソース不足で有名です。このようなリソース上でモデルを複製する時間を経験的に測定します。我々は、価格と事前訓練時間のトレードオフを明らかにするために、費用対効果分析で締めくくります。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:50:33 GMT)
Unlocking Noise-Resistant Vision: Key Architectural Secrets for Robust Models [41.4]
ある種の視覚アーキテクチャが本質的に加法ガウス雑音に対して堅牢である理由を考察する。具体的には,1,174個の事前学習型視覚モデルの評価を行う。ガウス雑音に対するロバスト性を改善するための4つの一貫した設計パターンを同定する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:24:49 GMT)
DimINO: Dimension-Informed Neural Operator Learning [41.4]
Diminoは次元分析にインスパイアされたフレームワークである。既存のニューラル演算子アーキテクチャにシームレスに統合することができる。 PDEデータセットで最大76.3%のパフォーマンス向上を実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:58:25 GMT)
LLMs4All: A Review on Large Language Models for Research and Applications in Academic Disciplines [41.2]
ChatGPTのようなLLM(Large Language Models)ベースのアプリケーションは、人間のような会話を生成する能力を示している。本稿では,最先端のLDMの概要と,幅広い学術分野への統合について述べる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:18:21 GMT)
Data-Centric Elastic Pipeline Parallelism for Efficient Long-Context LLM Training [40.7]
Elastic Pipeline Parallelism (EPP)は、トークンレベルのPPとバッチレベルのPPをオーケストレーションして、リソースとワークロードの不均一性に適応する。 InfiniPipeは最先端システムの1.69倍の高速化を実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:01:25 GMT)
Rosenthal-type inequalities for linear statistics of Markov chains [40.6]
幾何学的エルゴード的マルコフ鎖の加法関数に対する濃度不等式を確立する。我々は、対応する鎖の混合時間に対する境界の依存に特に注意を払う。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:58:15 GMT)
Quantum lattice Boltzmann algorithm for heat transfer with phase change [40.5]
本稿では,相変化を伴う熱伝達をシミュレーションするための量子格子ボルツマン法(QLBM)を提案する。この手法は格子ボルツマン法(LBM)の統計的性質を活用し、量子コンピューティングにおける非線形相転移の課題に対処する。我々は、古典的および量子的ハードウェア間の頻繁な情報交換を避けるために、位相変化情報を量子回路に格納する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:47:31 GMT)
A Causality-Aware Spatiotemporal Model for Multi-Region and Multi-Pollutant Air Quality Forecasting [40.5]
AirPCMは、多汚染物質力学と明示的な気象-汚染物質因果モデリングを組み合わせる。 AirPCMは、予測精度と一般化能力の両方において、最先端のベースラインを一貫して超越している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:54:23 GMT)
Towards Scalable Language-Image Pre-training for 3D Medical Imaging [40.3]
本研究では, 放射線学データの内在的階層(スライス, スキャン, 研究)にインスパイアされた新しい階層的注意機構を導入する。脳MRIで313万スキャン、頭部CTで144万スキャンで240万スキャンで220万の研究で訓練されたHLIPは、最先端のパフォーマンスを実現している。これらの結果から,HLIPでは,未修正臨床データセットを直接事前トレーニングすることは,3次元医用画像における言語画像事前トレーニングのスケーラブルかつ効果的な方向であることが示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:14:52 GMT)
RL Squeezes, SFT Expands: A Comparative Study of Reasoning LLMs [40.2]
大規模言語モデル(LLM)は通常、推論能力を改善するために、検証可能な報酬(RLVR)を持つ強化学習(RL)によって訓練される。本稿では,各学習過程において,推論経路を定量化し,定性的な変化を捉える新しい分析フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:18:57 GMT)
Behind RoPE: How Does Causal Mask Encode Positional Information? [40.2]
因果マスクは注意点における位置依存パターンを誘導できることを示す。因果マスクと RoPE の相互作用は,RoPE の相対的注意点パターンを非相対的に歪曲する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:48:24 GMT)
Edge Probability Graph Models Beyond Edge Independency: Concepts, Analyses, and Algorithms [40.2]
好ましくないランダムグラフモデル(RGM)は、実世界のグラフで共通のパターンを再現すべきである。一般的なRGM(例えばエルドス・レニイやクロネッカー)はエッジ確率を出力する。エッジ独立性では、RGMは高いサブグラフ密度と高い出力変動を同時に生成できない。高いトラクタビリティと可変性を維持しつつ、共通パターンをよりよく再現できるエッジ独立性を超えたRGMについて検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:23:25 GMT)
Background Prompt for Few-Shot Out-of-Distribution Detection [39.7]
FS-OOD検出のための新しいFG-BG分解フレームワークであるMamboを提案する。具体的には、背景情報と画像意味情報の両方を含む局所的背景類似性を得るために、まず背景プロンプトを学習することを提案する。局所的背景類似度と局所クラス類似度の両方を用いて背景抽出を行い,従来手法における局所クラス類似度への依存性を低減する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:03:24 GMT)
LLMTrace: A Corpus for Classification and Fine-Grained Localization of AI-Written Text [39.6]
LLMTraceは、AIによるテキスト検出のための、大規模なバイリンガル(英語とロシア語)コーパスである。私たちのデータセットは、従来のフルテキストバイナリ分類(人間対AI)と、AI生成間隔検出の新しいタスクの2つの重要なタスクをサポートするように設計されています。 LLMTraceは、よりニュアンスで実用的なAI検出モデルの次世代をトレーニングし、評価するための重要なリソースになると考えています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:59:43 GMT)
MemLens: Uncovering Memorization in LLMs with Activation Trajectories [39.6]
生成中の数値トークンの確率軌跡を解析してメモリ化を検出するために,MemLensを提案する。提案手法では, 汚染試料はショートカットの挙動を示し, 信頼性の高い解答にロックする。汚染された試料とクリーンな試料は, 別々に分離された推理軌道を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:55:18 GMT)
Canary-1B-v2 & Parakeet-TDT-0.6B-v3: Efficient and High-Performance Models for Multilingual ASR and AST [39.4]
Canary-1B-v2は、自動音声認識(ASR)と音声テキスト翻訳(AST)のための高速で堅牢な多言語モデルである FastConformerエンコーダとTransformerデコーダで構築され、主にヨーロッパ25言語をサポートしている。動的データバランシングを伴う2段階の事前学習および微調整プロセスとnGPTエンコーダを用いた実験について述べる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:56:16 GMT)
Chasing the Tail: Effective Rubric-based Reward Modeling for Large Language Model Post-Training [39.4]
強化微調整 (Reinforcement fine-tuning, RFT) は、ポリシーモデルが報酬信号をハックして高いスコアを得るという、過度な最適化に悩まされることが多い。我々の理論的分析は、高いリワードテールにおける報酬の誤特定に鍵がかかっていることを示している。政治以外の見習いは入手し易いが、彼らのナイーティブな訓練は、私たちが調整しようとしている政策に対して、不明確な報酬を与える。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:57:39 GMT)
ReviewScore: Misinformed Peer Review Detection with Large Language Models [38.9]
15.2%の弱点と26.4%の質問が誤記されていることを示し、レビューポイントが誤記されているかどうかを示すReviewScoreを紹介した。人間の専門家によるReviewScoreデータセットを構築し、LLMがReviewScore評価を自動化する能力をチェックする。また、前提レベルの事実性を評価することは、弱点レベルの事実性を評価するよりも、はるかに高い合意を示すことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:55:05 GMT)
Can Less Precise Be More Reliable? A Systematic Evaluation of Quantization's Impact on CLIP Beyond Accuracy [38.9]
量子化がCLIPの性能に与える影響を精度を超えて評価する。量子化は、一般に信頼できない事前学習モデルの校正を一貫して改善することを示す。我々は、ゼロショット精度、キャリブレーション、OODロバスト性において同時ゲインをもたらす特定の量子化対応トレーニング(QAT)法を同定する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:54:34 GMT)
The Use of the Simplex Architecture to Enhance Safety in Deep-Learning-Powered Autonomous Systems [38.9]
本稿では,学習に基づく自律システムの安全性,セキュリティ,予測可能性のレベルを向上するソフトウェアアーキテクチャを提案する。これは2つの独立した実行ドメインを活用している。1つは、信頼できるオペレーティングシステム下でのニューラルネットワークの実行に特化しており、信頼できないと見なされている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:20:47 GMT)
Text-Augmented Multimodal LLMs for Chemical Reaction Condition Recommendation [38.8]
Chemma-RCは、タスク固有の対話と条件生成を通じて有効な条件を識別するテキスト拡張マルチモーダルLLMである。 Chemma-RCは、複数のモダリティ(テキストコーパス、反応SMILES、反応グラフを含む)を共有埋め込みモジュールで整列させることで、化学反応の統一的な表現を学習する。データセットのパフォーマンスベンチマークは、最適な条件を特定する上で高い精度を示し、最先端の手法よりも最大17%改善した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:37:24 GMT)
Inverse Reinforcement Learning Using Just Classification and a Few Regressions [38.7]
逆強化学習は、基礎となる報酬を明らかにすることによって観察された振る舞いを説明することを目的としている。集団最大化解は, 行動方針を含む線形不動点方程式によって特徴づけられることを示す。最適解法,一般オラクルアルゴリズム,有限サンプル誤差境界,およびMaxEnt IRLに対する競合的あるいは優れた性能を示す実験結果の正確な評価を行う。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:53:43 GMT)
Polarity Detection of Sustainable Detection Goals in News Text [38.0]
国連の持続可能な開発目標は、社会的、環境的、経済的課題に対処するための世界的な枠組みを提供する。自然言語処理(NLP)と大規模言語モデル(LLM)の最近の進歩は、特定のSDGに基づいてテキストデータの自動分類を容易にする。本稿では,テキストセグメントが特定のSDGに向かって進行を示すか,あるいはその進展を達成する意図を伝達するかを評価するSDG極性検出の新しいタスクを提案する。本研究は、持続可能性モニタリングのための方法論ツールキットを進歩させ、効率的で高性能な極性検出システムの開発に関する実用的な知見を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:37:09 GMT)
Automotive-ENV: Benchmarking Multimodal Agents in Vehicle Interface Systems [38.0]
ドライバーの注意不足、厳格な安全要件、複雑な位置ベースのインタラクションパターンなどである。本稿では,車載GUIに適した,最初の高忠実度ベンチマークおよびインタラクション環境であるAutomotive-ENVを紹介する。位置, 環境条件, 地域運転規範に基づいて動的に行動を調整するために, GPSインフォームドコンテキストを統合した地理認識型マルチモーダルエージェントASURADAを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:30:13 GMT)
Efficient Multimodal Dataset Distillation via Generative Models [37.6]
本稿では,効率的なマルチモーダルデータセット蒸留のための生成蒸留法であるEDGEを紹介する。具体的には、生成モデルを用いてマルチモーダルデータセットを蒸留する2つの重要な課題を特定する。両方向のコントラスト損失と多様性損失を有する新しい生成モデルトレーニングワークフローを提案する。提案手法はFlickr30K,COCO,CC3Mのデータセットを用いて評価し,既存の手法と比較して優れた性能と効率性を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:23:18 GMT)
MORPH: Shape-agnostic PDE Foundation Models [37.3]
MORPHは偏微分方程式(PDE)の形状に依存しない自己回帰基底モデルである畳み込みビジョンのバックボーン上に構築されており、異なる解像度で様々なデータ次元(1D--3D)の評価をシームレスに処理する。広範なデータセット全体にわたって、MORPHは強力なベースラインと最近の最先端モデルにマッチするか、超えている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:38:36 GMT)
CaTS-Bench: Can Language Models Describe Numeric Time Series? [37.0]
CaTS-Benchは、コンテキスト対応の時系列キャプションのための、最初の大規模な実世界のベンチマークである。 CaTS-Benchは、約465kのトレーニングと105kのテストタイムスタンプを含む11の多様なデータセットから派生している。この作業の重要な貢献は、参照キャプションを生成するために使用されるスケーラブルなパイプラインである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:10:03 GMT)
The Validation Gap: A Mechanistic Analysis of How Language Models Compute Arithmetic but Fail to Validate It [36.9]
大規模言語モデル(LLM)における誤り検出の力学解析について述べる。回路解析により,4つの小さいLLMの演算誤差を検出する計算部分グラフを同定する。この結果から,算術的解法における数値値の表面レベルのアライメントを評価するために,すべてのモデルが$textitConsistency Head$-attention Headに大きく依存していることが判明した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:37:54 GMT)
Reinforcement Fine-Tuning Naturally Mitigates Forgetting in Continual Post-Training [36.7]
本稿では,教師付きファインチューニング(SFT)と強化ファインチューニング(RFT)の2つのコアポストトレーニングパラダイムの比較分析を行った。本実験は,7つの多様なマルチモーダルタスクからなるベンチマークで実施した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:26:17 GMT)
X-Streamer: Unified Human World Modeling with Audiovisual Interaction [36.5]
X-Streamerは、テキスト、音声、ビデオ間の無限の相互作用が可能なデジタルヒューマンエージェントを構築するためのフレームワークである。中心となるのは、マルチモーダル理解と生成を統一するThinker-Actorデュアルトランスフォーマーアーキテクチャである。 X-Streamerは2つのA100 GPU上でリアルタイムに動作し、一貫したビデオチャット体験を数時間持続する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:53:27 GMT)
Every Subtlety Counts: Fine-grained Person Independence Micro-Action Recognition via Distributionally Robust Optimization [36.2]
マイクロアクション認識は、心理的アセスメントと人間とコンピュータの相互作用に不可欠である。既存の手法は現実のシナリオで失敗することが多い。本稿では、分散ロバスト最適化の原則を取り入れた個人独立ユニバーサルマイクロアクション認識フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:54:24 GMT)
Decoding the Surgical Scene: A Scoping Review of Scene Graphs in Surgery [36.2]
シーングラフ(SG)は、複雑なダイナミックな手術環境のデコードに不可欠な構造化された表現を提供する。 The PRISMA-ScR-guided scoping review systemally map the evolution landscape of SG research in surgery。我々の分析は急速に成長しているが、重要な「データ分割」を明らかにしている SGは重要なセマンティックブリッジに成熟し、新しい世代のインテリジェントシステムによって外科の安全性、効率、訓練を改善することができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:25:46 GMT)
Discovering alternative solutions beyond the simplicity bias in recurrent neural networks [36.1]
神経科学的なタスクを実行するためのリカレントニューラルネットワーク(RNN)のトレーニングは、ニューラルネットワークがどのように計算を行うかの仮説を生成する一般的な方法となっている。最近の研究は、タスク学習されたRNNが強力な単純さバイアスを持つことを示した。本稿では、この帰納バイアスを破るために、反復的ニューラル類似度デフレを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:59:04 GMT)
Improved Scaling Laws in Linear Regression via Data Reuse [36.1]
データの再利用は線形回帰における既存のスケーリング法則を改善することができることを示す。これはデータ再利用によるスケーリング法則の改善(すなわち、データ制約されたレシエーションで$L>N$を選択する)を示唆している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:04:26 GMT)
Rethinking Circuit Completeness in Language Models: AND, OR, and ADDER Gates [35.9]
論理ゲートはAND,OR,ADDERの3種類の論理ゲートを導入し,回路を論理ゲートの組み合わせに分解する。本稿では,既存の回路発見手法に容易に組み込むことが可能な,ノイズ発生に基づく介入と雑音発生に基づく介入を組み合わせたフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:04:14 GMT)
CLUE: Conflict-guided Localization for LLM Unlearning Framework [35.9]
LLMアンラーニングフラムワークのための衝突誘導型ローカライゼーションを提案する。この枠組みは、重要なニューロンからなる、忘れと保持回路を特定し、その後、回路を結合正常な形に変換する。実験により、CLUEは正確な神経局在化によって優れた忘れの有効性を達成し、有用性を維持できることが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:23:16 GMT)
Interactive Recommendation Agent with Active User Commands [35.8]
本稿では、主流の推薦フィード内で自然言語コマンドを可能にする先駆的なパラダイムであるInteractive Recommendation Feed(IRF)を紹介する。ユーザが暗黙的な行動の影響を受動的に抑制する従来のシステムとは異なり、IRFはリアルタイム言語コマンドを通じて推奨ポリシーを積極的に制御する。 RecBotは、ユーザ満足度とビジネス成果の両方において、大幅に改善されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:38:27 GMT)
LLM Agent Meets Agentic AI: Can LLM Agents Simulate Customers to Evaluate Agentic-AI-based Shopping Assistants? [35.7]
この研究は、LLMエージェントがエージェントAIシステムと人間のマルチターンインタラクションをどのようにミラーできるかを定量化した最初のものである。私たちは、Amazon Rufusで買い物をする40人の参加者を募集し、ペルソナ、インタラクショントレース、UXフィードバックを収集し、タスクを繰り返すためにデジタルツインを作成しました。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:58:02 GMT)
Bias Similarity Measurement: A Black-Box Audit of Fairness Across LLMs [35.7]
バイアス類似度測定(BSM)は、公平性をモデル間の関係性として扱う。オープンウェイトモデルは、プロプライエタリなシステムと一致したり、超えたりすることができる。 BSMは、調達、回帰テスト、系統スクリーニングのための監査ワークフローを提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:01:14 GMT)
Strassen Attention, Split VC Dimension and Compositionality in Transformers [35.6]
任意に多くの精度のビット(無限)を持つ1層ソフトマックス変圧器の理論的限界を示す。最初のタスクであるMatch 3では、入力シーケンスで可能なトークン三つ子をすべて確認する必要があります。第2タスクと第3タスクは、構成性に基づく推論を扱う。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:17:52 GMT)
Reparameterization Proximal Policy Optimization [35.6]
ポリシーグラデーション(RPG)は、微分可能なダイナミクスを活用することで、サンプル効率を改善することを約束している。我々は、安定なサンプル再利用を可能にするために代理目的を利用するPPO(Proximal Policy Optimization)からインスピレーションを得ている。本稿では,安定かつサンプル効率の高いRPGベースの手法であるRe Parameters Proximal Policy Optimization (RPO)を提案する。 RPOはRPGに適したポリシー勾配クリッピング機構を用いることで、複数のエポック上で安定したサンプル再利用を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:17:31 GMT)
Look Before you Leap: Estimating LLM Benchmark Scores from Descriptions [35.5]
テキストのみのパフォーマンス予測について検討し、タスク記述と意図した構成からモデルのスコアを推定する。系統的な研究を支援するため,多種多様なタスク,ドメイン,メトリクスにまたがる記述性能対のコーパスであるPreCOGをキュレートする。実験では、タスクは困難だが実現可能であり、高い信頼しきい値の精度サブセットで平均8.7の絶対誤差に達する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:02:27 GMT)
Towards an AI-Augmented Textbook [35.3]
生成AIを用いて教科書を変換・拡張する手法を提案する。このアプローチで構築されたシステムをLearning Your Wayと呼ぶ。異なる変換と拡張の教育学的評価を報告し、ランダム化制御試験の結果を報告する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:48:28 GMT)
A Framework for Rapidly Developing and Deploying Protection Against Large Language Model Attacks [35.2]
大規模言語モデル(LLM)はAIデプロイメントに革命をもたらし、業界全体で自律的および半自律的なアプリケーションを可能にする。 LLMに対するゼロデイアタックや新規アタックは、既知のアプローチでは防げない。これにより、AI保護システムは、確立されたマルウェア保護システムに似たカテゴリに置かれる。本稿では,マルウェア検出と脅威知能の確立に根ざした,生産レベルの防衛システムを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:36:19 GMT)
On the Perception Bottleneck of VLMs for Chart Understanding [35.2]
チャート理解には、数値データ、テキスト要素、複雑なビジュアルコンポーネントを分析し、推論するモデルが必要である。この過程において,既存の大規模視覚言語モデル(LVLM)の知覚能力が重要なボトルネックとなっていることが明らかとなった。本研究では,視覚エンコーダのボトルネックと抽出ボトルネックの2つのコンポーネントに分解することで,この認識ボトルネックを解明する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:16:36 GMT)
Compositional-ARC: Assessing Systematic Generalization in Abstract Spatial Reasoning [34.9]
体系的な一般化は、既知のコンポーネントから新しい組み合わせを理解し、生成する能力を指す。本研究では,構成性のメタラーニングを抽象空間推論の領域に拡張する。この結果から, メタラーニングにより学習したトランスフォーマーを用いたエンコーダデコーダモデルにより, 既往の変換合成に体系的に一般化できることが示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:11:59 GMT)
QuadGPT: Native Quadrilateral Mesh Generation with Autoregressive Models [34.9]
エンドツーエンドで四角形メッシュを生成するための,最初の自動回帰フレームワークであるQuadGPTを紹介する。我々の研究は、ネイティブクアッドメシュ生成のための新しいベンチマークを確立し、大規模自己回帰モデルとトポロジを意識したRLリファインメントを組み合わせたパワーを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:58:36 GMT)
Trustworthy Semantic Communication for Vehicular Networks: Challenges and Solutions [34.8]
vehicular SemCom Network (VN-SemComNets) は情報伝達、セマンティックエンコーディング、通信エンティティの信頼性において重要な信頼課題に直面している。本稿では,革新的な3層信頼性を有するVN-SemComNetアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:18:20 GMT)
Actively Learning Halfspaces without Synthetic Data [34.8]
我々は、点合成なしでハーフスペースを学習するための効率的なアルゴリズムを設計する。コーナリーとして、軸整合半空間に対して最適な$O(d + log n)$クエリ決定論的学習器を得る。我々のアルゴリズムはブール関数を$f$ over $n$要素で学習するより一般的な問題を解く。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:39:25 GMT)
Hunyuan3D-Omni: A Unified Framework for Controllable Generation of 3D Assets [34.7]
Hunyuan3D-Omniは、Hunyuan3D 2.1上に構築されたきめ細かい制御可能な3Dアセット生成のための統一されたフレームワークである。我々のモデルは単一のクロスモーダルアーキテクチャで全ての信号を統一する。実験により、これらの追加制御により生成精度が向上し、幾何認識変換が可能となり、生産の堅牢性も向上することが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:39:17 GMT)
Federated Domain Generalization with Domain-specific Soft Prompts Generation [34.5]
本稿では,フェデレートされた領域一般化タスクを扱うための,ジェネレーティブの観点から,新しい効果的な手法を提案する。具体的には、トレーニング中、各ドメインに対してドメイン固有のソフトプロンプト(DSP)を導入し、コンテンツとドメイン知識を生成モデルに統合する。推論フェーズでは、ジェネレータを使用して、未知のターゲットドメインのDSPを取得し、未知のドメインの下流タスクを誘導する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:41:48 GMT)
NoHumansRequired: Autonomous High-Quality Image Editing Triplet Mining [34.4]
ドメイン、解像度、命令の複雑さ、スタイルにまたがる高忠実度三重項をマイニングする、自動化されたモジュラーパイプラインを提案する。インバージョンと合成ブートストラップは、およそ2.6倍の精度でマイニングセットを拡大し、大規模な高忠実度トレーニングデータを可能にする。 NHR-Editは、720kの高品質なトリプルのオープンデータセットで、数百万のガイド付き世代とバリデータパスを通じて産業規模でキュレートされています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:06:59 GMT)
MOSS-ChatV: Reinforcement Learning with Process Reasoning Reward for Video Temporal Reasoning [34.2]
マルチモーダル大言語モデル(MLLM)の重要機能としてビデオ推論が登場した既存のMLLMは、最終回答が正しい場合でも、中間的推論がビデオダイナミクスから漂流するプロセスの不整合を示すことが多い。動的時間ウォーピング(DTW)に基づくプロセス報酬を備えた強化学習フレームワークであるMOSS-ChatVを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:59:13 GMT)
Expanding Reasoning Potential in Foundation Model by Learning Diverse Chains of Thought Patterns [34.2]
我々は,基礎モデルの推論可能性について,疑問に正しく答えるために必要な独立した試みの数の逆として初めて定義する。次に、高価値推論パターンを付加した多種多様なデータを活用し、推論可能性を拡張することを提案する。 85A6B Mixture-of-Experts (MoE) モデルは, AIME 2024 と 2025 の挑戦に対して 9.58% 改善可能である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:11:35 GMT)
Reasoning-Enhanced Domain-Adaptive Pretraining of Multimodal Large Language Models for Short Video Content Moderation [34.1]
本稿では,不適切なコンテンツ検出を統一するためのMLLM事前学習パラダイムを提案する。短いビデオコンテンツとMLLMのオリジナル事前学習データとの分配ギャップに対処するために,3つの目標事前学習タスクを導入する。実験結果から,ゼロショットおよび教師付き微調整環境におけるMLLMの性能は,事前学習により有意に向上することが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:46:34 GMT)
A Genetic Algorithm for Navigating Synthesizable Molecular Spaces [34.1]
合成経路上で直接動作する単純な遺伝的アルゴリズムであるSynGAを提案する。適合度関数を変更することで、さまざまなデザインタスクにおけるSynGAの有効性を実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:33:30 GMT)
OLMA: One Loss for More Accurate Time Series Forecasting [34.0]
時系列予測は2つの重要な課題に直面するが、しばしば見過ごされる。ニューラルネットワークは、時系列の状態空間をモデル化する際に周波数バイアスを示す。本稿では,チャネルと時間次元の周波数領域変換を利用して予測を向上するOLMAという新しい損失関数を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:06:01 GMT)
Adaptively profiling models with task elicitation [33.7]
Task Elicitationは、フロンティアモデルが体系的な失敗を示す数百の自然言語タスクを見つける。我々は、Sonnet 3.5が量子コンピューティングとAGIを過度に関連付けており、o3-miniは、製造がコンテキスト内で繰り返されるときに幻覚を起こす傾向があることを発見した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:09:21 GMT)
Towards Foundation Models for Zero-Shot Time Series Anomaly Detection: Leveraging Synthetic Data and Relative Context Discrepancy [33.7]
時系列異常検出(TSAD)は重要な課題であるが、見えないデータに一般化するモデルを開発することは大きな課題である。我々は、新しい事前学習パラダイムの上に構築されたTSADの新たな基盤モデルであるtextttTimeRCDを紹介した。 textttTimeRCD はゼロショット TSAD において,既存の汎用および異常固有の基盤モデルよりも大幅に優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:05:15 GMT)
Predicting LLM Reasoning Performance with Small Proxy Model [33.7]
本研究では,小プロキシが事前学習対象と目標タスクとより緊密に連携することで,大規模モデルの推論を効果的に予測できることを示す。 rBridgeは、フロンティアモデルからの推論トレースをゴールドラベルとして使用して、負のログライクな部分をタスクアライメントで重み付けすることでこれを実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:20:38 GMT)
PseudoBridge: Pseudo Code as the Bridge for Better Semantic and Logic Alignment in Code Retrieval [33.6]
PseudoBridgeは、中間的、半構造化されたモダリティとして擬似コードを導入する、新しいコード検索フレームワークである。まず,NLクエリと擬似コードとの明示的なアライメントを実現するために,先進的な大規模言語モデル(LLM)を用いる。第2に、論理不変のコードスタイル拡張戦略を導入し、LLMを用いて、スタイリスティックに多様だが論理的に等価なコード実装を擬似コードで生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:10:36 GMT)
UniSS: Unified Expressive Speech-to-Speech Translation with Your Voice [33.4]
表現型S2STのための新しい単一ステージフレームワークUniSSを紹介する。提案手法は、注意深く設計された音声意味とスタイルモデリングを特徴とする。我々は44.8k時間のデータからなる大規模で高品質な表現型S2STデータセットUniSTをリリースする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:30:46 GMT)
RARE: Retrieval-Aware Robustness Evaluation for Retrieval-Augmented Generation Systems [33.4]
Retrieval-Augmented Generation (RAG)は、回答の正確性と事実性を高める。既存の評価では、RAGシステムが現実世界のノイズ、内部と外部の取得したコンテキストの衝突、あるいは急速に変化する事実にどれくらいうまく対処しているかを検査することはめったにない。本稿では,動的で時間に敏感なコーパス上でのストレステストクエリと文書摂動を共同で行う,統一されたフレームワークと大規模ベンチマークであるRetrieval-Aware Robustness Evaluation (RARE)を紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:17:09 GMT)
Explaining Grokking and Information Bottleneck through Neural Collapse Emergence [33.2]
本稿では,グルーキングの統一的な説明と,神経崩壊のレンズによる情報ボトルネック原理について述べる。本研究では,集団の集団間分散の縮小が,情報ボトルネックとグルーキングの両根底にある重要な要因であることを示す。神経崩壊のダイナミクスを解析することにより、トレーニングセットの適合と神経崩壊の進行の間に異なる時間スケールが、後期現象の挙動に関係していることが示される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:17:41 GMT)
FERD: Fairness-Enhanced Data-Free Robustness Distillation [33.1]
本稿では,Fairness-Enhanced data-free Robustness Distillation (FERD) フレームワークを提案する。 FERDは、あらゆる敵攻撃の下で最先端の最悪のクラスロバスト性を達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:22:11 GMT)
Towards Atoms of Large Language Models [33.0]
大きな言語モデル(LLM)の内部表現は未定義のままであり、そのメカニズムのさらなる理解を制限している。我々は、そのような単位を原子として定義する原子論を提案する。我々はGemma2-2B、Gemma2-9B、Llama3.1-8Bでしきい値活性化SAEを訓練し、平均で99.9%のスパース再構成を実現した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:13:05 GMT)
Beyond the Individual: Introducing Group Intention Forecasting with SHOT Dataset [33.0]
グループ意図は、複数の個人の行動を通じて現れる共通の目標を表す。グループ意図予測(Group Intention Forecasting, GIF)は、集団意図がいつ起こるかを予測する新しいタスクである。 SHOTはGIF用の最初の大規模なデータセットで、5つのカメラビューから撮影された1,979本のバスケットボールビデオクリップで構成されている。 GIFTは、意図の出現を予測するためにグループダイナミクスを進化させる、きめ細かい個々の特徴とモデルを抽出するフレームワークである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:28:01 GMT)
A Formal Comparison Between Chain-of-Thought and Latent Thought [32.8]
Chain-of-Thought (CoT) は、自然言語の中間ステップを明示的に生成することで、大きな言語モデルで推論を行う。ループモデルにおける潜在思想は、連続潜在空間で直接動作し、離散言語表現を超えた計算を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:27:52 GMT)
One Model for All Tasks: Leveraging Efficient World Models in Multi-Task Planning [32.1]
UniZeroのようなマルチタスクの世界モデルは、シングルタスク設定で優れている。勾配の矛盾やモデル塑性の喪失はサンプルの効率を阻害することが多い。本研究では,これらの課題を2つの相補的な視点 – 単一学習イテレーションと全体学習プロセス – から解決する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:04:15 GMT)
MACD: Multi-Agent Clinical Diagnosis with Self-Learned Knowledge for LLM [32.1]
大規模言語モデル(LLM)は医学的応用において顕著な可能性を示している。本研究は,新しいMulti-Agent Clinical Diagnosis (MACD) フレームワークを提案する。 LLMはマルチエージェントパイプラインを通じて自己学習型臨床知識を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:59:16 GMT)
LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence [31.7]
マルチモーダル拡散変換器の最初のドラッグベースの画像編集手法であるLazyDragを紹介する。 LazyDragは暗黙の点マッチングへの依存を直接排除する。テキストガイダンスと正確な幾何学的制御を統一し、以前は手に入らなかった複雑な編集を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:37:41 GMT)
villa-X: Enhancing Latent Action Modeling in Vision-Language-Action Models [31.6]
VLA(Vision-Language-Latent-Action)モデルは、ロボット操作ポリシーを学ぶための一般的なパラダイムとして登場した。最近の研究は、2つのフレーム間の動きの抽象的な表現である潜伏行動のVLA事前学習への組み入れを探求し始めている。一般化可能なロボット操作ポリシーを学習するための潜在アクションモデリングを進化させる新しいフレームワークであるVilla-Xを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:26:44 GMT)
DiffSyn: A Generative Diffusion Approach to Materials Synthesis Planning [31.6]
DiffSynは、50年間にわたる23,000以上の合成レシピに基づいて訓練された生成拡散モデルである。 DiffSynは、所望のゼオライト構造と有機テンプレートに条件付き可能な合成経路を生成する。概念実証として,DiffSyn合成経路を用いてUFI材料を合成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:06:52 GMT)
Learning the Wrong Lessons: Syntactic-Domain Spurious Correlations in Language Models [31.6]
タスク命令ペアにおける構文テンプレート,ドメイン,セマンティクスを特徴付ける。構文とドメインの相関は性能を低下させる可能性がある。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:42:28 GMT)
GALAX: Graph-Augmented Language Model for Explainable Reinforcement-Guided Subgraph Reasoning in Precision Medicine [31.6]
精密医療では、量的マルチオミックな特徴、トポロジカルコンテキスト、テキスト生物学的知識が、疾患クリティカルなシグナル伝達経路や標的を特定する上で重要な役割を担っている。我々は、事前学習されたグラフニューラルネットワーク(GNN)をLLM(Large Language Models)に統合する革新的なフレームワークであるGALAXを提案する。アプリケーションとして,CRISPRを識別したターゲット,マルチオミックプロファイル,および多様ながん細胞株のバイオメディカルグラフ知識を組み合わせたベンチマークであるTarget-QAも導入した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:20:58 GMT)
Flexible MOF Generation with Torsion-Aware Flow Matching [31.5]
化学および幾何学的自由度の両方をモデル化することにより制限を克服する2段階MOF生成フレームワークを提案する。本実験では, 復元精度の向上, 有効, 新規, ユニークなMOFの生成, 新規なビルディングブロックの創出能力について検証した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:41:17 GMT)
Closed-loop control of seizure activity via real-time seizure forecasting by reservoir neuromorphic computing [31.5]
リアルタイムにパーソナライズされたフリーラン刺激を駆動できるニューロモルフィック貯水池コンピューティングハードウェアシステムを提案する。このシステムは、トレーニング期間中の発作発生を予測する際に、83.33%の精度を達成する。本研究は, パーソナライズされたDRE治療のための次世代神経調節戦略としてのニューロモルフィックシステムの可能性を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:12:51 GMT)
The Limit Points of (Optimistic) Gradient Descent in Min-Max Optimization [31.2]
我々は,2つの基本的な1次法,すなわちGDA(Gradient Descent/Ascent)とOGDA(Optimistic Gradient Descent Ascent)の限界点を特徴付ける。小さなステップのサイズと穏やかな仮定では、OGDA安定臨界点の集合はGDA安定臨界点のスーパーセットであり、これは局所 min-max 解のスーパーセットである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:21:30 GMT)
Generating 360° Video is What You Need For a 3D Scene [31.1]
中間シーン表現として360degビデオを利用する実用的でスケーラブルなソリューションを提案する。テキストプロンプトから3Dシーンを合成する生成パイプラインであるWorldPrompterを提案する。 WorldPrompterには条件付き360度パノラマビデオジェネレータが組み込まれており、仮想環境を歩いたり捉えたりする人をシミュレートする128フレームのビデオを生成することができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:04:40 GMT)
RecIS: Sparse to Dense, A Unified Training Framework for Recommendation Models [31.0]
RecISは、PyTorchエコシステムに基づいたスパースセンストレーニングフレームワークである。現在、RecISはAlibabaで多数の大規模強化レコメンデーショントレーニングタスクに使用されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:12:55 GMT)
VIFO: Visual Feature Empowered Multivariate Time Series Forecasting with Cross-Modal Fusion [31.0]
時系列モデルのための時空間予測モデルVIFOを提案する。多変量時系列をイメージ化し、事前訓練されたLVMで複雑なチャネル間のパターンを抽出する。複数のベンチマークで競合性能を達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:02:26 GMT)
EC-Diffuser: Multi-Object Manipulation via Entity-Centric Behavior Generation [30.9]
高次元観測から物体を操作することを学ぶことは重要な課題である。最近のアプローチでは、大規模なオフラインデータを使用して、ピクセル観測からモデルをトレーニングしている。本稿では、オブジェクト中心の表現とエンティティ中心のトランスフォーマーを活用する新しい行動クローニング(BC)手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:41:03 GMT)
QueryGym: Step-by-Step Interaction with Relational Databases [30.8]
本稿では,LLMベースのクエリ計画エージェントの構築,テスト,評価を行う対話型環境であるQueryGymを紹介する。既存のフレームワークは、エージェントを特定のクエリ言語方言に結びつけることや、それらの推論を曖昧にすることが多い。 QueryGymは、関係代数演算の明示的なシーケンスを構築するためにエージェントを必要とする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:48:49 GMT)
Comparative Personalization for Multi-document Summarization [30.7]
パーソナライズされたマルチドキュメント要約フレームワークであるComPSumを提案する。ユーザの好みを他のユーザの好みと比較することにより、ユーザの構造化された分析を生成する。生成された構造化分析は、パーソナライズされた要約の生成を導くために使用される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:42:30 GMT)
LoRA is All You Need for Safety Alignment of Reasoning LLMs [30.6]
本稿では,SFT に LoRA を使用すれば,その推論能力を損なうことなく,安全のためにモデルを効果的に整列させることができることを示す。これは、安全ウェイト更新を低ランク空間に制限することは、推論ウェイトとの干渉を最小限にするからである。実験により, 本手法は, 全モデルファインチューニングに匹敵する安全性を保ちながら, 推論能力を損なうことなく, 安全性の高いLCMを生成できることが示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:39:42 GMT)
MotionFlow:Learning Implicit Motion Flow for Complex Camera Trajectory Control in Video Generation [30.5]
本稿では,カメラとオブジェクトの動作を,対応する画素の運動に変換することによって統合する新しいアプローチを提案する。我々のモデルはSOTA法よりも大きなマージンで優れている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:06:12 GMT)
Blockwise Hadamard high-Rank Adaptation for Parameter-Efficient LLM Fine-Tuning [30.3]
HiRAのようなアダマール式の拡張は、名目上のランクを上げるが、凍結重み行列のグローバルエネルギーパターンへの更新を毎回繰り返す。本稿では,各重み行列を分割し,ブロック毎に独立にHiRA型乗算変調を適用するブロック・アダマール高ランク適応(BHRA)を提案する。我々の実証分析により、このブロックワイズ設計は、グローバルな変調によって引き起こされる崩壊を緩和し、ランクの予算にわたって豊富なスペクトルを維持していることが明らかとなった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:54:09 GMT)
Patch-Based Diffusion for Data-Efficient, Radiologist-Preferred MRI Reconstruction [30.2]
パッチベースの拡散モデルでは、小さな実数値データセットよりも効果的なデータ駆動の事前学習が期待できる。本研究では,25k領域の画像の小さなデータセットでトレーニングしたPaDIS-MRIモデルが,画像品質の指標でFastMRI-EDMより優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:18:56 GMT)
Are Modern Speech Enhancement Systems Vulnerable to Adversarial Attacks? [30.1]
本研究は, 音声強調モデルに対向雑音を注入できることを示す。予測音声強調モデルが実際にこのような方法で操作可能であることを実験的に検証する。我々は, サンプルを用いた拡散モデルが, 設計によるこのような敵攻撃に対して, 本質的に堅牢性を示すことを強調した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:39:19 GMT)
Feature Augmentation of GNNs for ILPs: Local Uniqueness Suffices [30.1]
そこで我々は,各ノードのd-hop近傍で識別子が一意であることを保証する,d-hopユニークな色付けに基づく類似のローカルUIDスキームを提案する。我々は、D層ネットワークにおいて、ローカルUIDはより強力な一般化を提供しながら、グローバルUIDの表現力を達成することを証明した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:50:22 GMT)
Enhanced Generative Model Evaluation with Clipped Density and Coverage [30.1]
Clipped DensityとClipped Coverageという2つの新しい指標を紹介します。クラッピング密度とクラッピング被覆は、ロバスト性、感度、解釈可能性の観点から既存の手法よりも優れていた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:04:10 GMT)
Inference-Time Scaling for Generalist Reward Modeling [29.9]
強化学習(RL)は大規模言語モデル(LLM)のポストトレーニングにおいて広く採用されている。 RLの主な課題は、検証可能な質問や人工ルールを超えて、様々な領域のLLMに対して正確な報酬信号を得ることである。本研究では,一般問合せに対する推論計算により,報酬モデルを改善する方法について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:35:26 GMT)
Elucidating Mechanisms of Demographic Bias in LLMs for Healthcare [29.7]
性別情報は層内で高度に局所化されており、パッチを当てることで推論時に確実に操作できることがわかった。患者人種の表現は多少分散しているが、ある程度は介入することもできる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:51:06 GMT)
RLBFF: Binary Flexible Feedback to bridge between Human Feedback & Verifiable Rewards [29.5]
バイナリフレキシブルフィードバック(RLBFF)を用いた強化学習を提案する。 RLBFFは、人間主導の好みの汎用性とルールベースの検証の精度を組み合わせる。この方法で訓練されたReward Modelsは、データにマッチするとBradley-Terryモデルより優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 16:19:06 GMT)
P3-SAM: Native 3D Part Segmentation [29.5]
そこで本研究では,P$3$-SAMと呼ばれる,ネイティブな3Dポイントプロンプト可能な部分分割モデルを提案する。 SAMにインスパイアされたP$3$-SAMは、特徴抽出器、複数のセグメンテーションヘッド、IoU予測器から構成される。私たちのモデルは、合理的なセグメンテーションラベルを持つ約370万のモデルを含む、新たに構築されたデータセットでトレーニングされています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:25:54 GMT)
Dual Branch VideoMamba with Gated Class Token Fusion for Violence Detection [29.3]
本稿では,RWF-2000,RLVS,SURV,VioPeruを併用したビデオ暴力検出手法を提案する。実験結果から,本モデルによる評価結果が得られた。スケーラブルでほぼリアルタイムな監視暴力検出のためのSSMの約束を実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:26:24 GMT)
ReciNet: Reciprocal Space-Aware Long-Range Modeling for Crystalline Property Prediction [28.9]
ReciNetは、幾何学的GNNと相互ブロックを統合して、短距離と長距離の相互作用をモデル化する新しいアーキテクチャである。本稿では,ReciNetが結晶特性予測タスクの範囲で最先端の予測精度を実現することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:12:34 GMT)
The Unwinnable Arms Race of AI Image Detection [28.8]
データ次元とデータの複雑さの2つの要因を分析します。非常に単純かつ複雑なデータセットが合成画像の検出性を低下させることを示す。対照的に、中間複雑データセットは検出に最も好ましい条件を生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:25:59 GMT)
DAMR: Efficient and Adaptive Context-Aware Knowledge Graph Question Answering with LLM-Guided MCTS [28.8]
本稿では,知識グラフ質問応答(KGQA)のための動的適応MCTSベースの推論(DAMR)を提案する。 DAMRは、MCTS(Monte Carlo Tree Search)と適応経路評価を統合し、コンテキスト対応のKGQAを実現する。複数のKGQAベンチマークの実験では、DAMRはSOTA法よりも大幅に優れていた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:25:22 GMT)
MDPO: Overcoming the Training-Inference Divide of Masked Diffusion Language Models [28.8]
拡散言語モデルは、トレーニングと推論の主な相違に悩まされる。本稿では,マルコフ特性拡散を利用するためのMasked Diffusion Policy Optimization (MDPO)を提案する。本研究は,MDLMの事前学習と推測の相違を調査するための大きな可能性を見出した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:56:49 GMT)
Mechanisms of Projective Composition of Diffusion Models [28.7]
拡散モデルにおける構成の理論的基礎について考察する。作文が「仕事」を意味するかは明らかになっていない。本稿では,新作曲の成功や失敗を予測するための簡易な外挿法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:57:40 GMT)
VocalAgent: Large Language Models for Vocal Health Diagnostics with Safety-Aware Evaluation [28.6]
本稿では,音声による健康診断を通じてこれらの課題に対処する音声大言語モデル(LLM)であるVocalAgentを紹介する。 Qwen-Audio-Chatを病院患者から収集した3つのデータセットに微調整した。 VocalAgentは、最先端のベースラインと比較して、音声障害分類において優れた精度を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:01:20 GMT)
Vision Language Models Cannot Plan, but Can They Formalize? [28.5]
本稿では,1ショット,オープンボキャブラリ,マルチモーダルPDDL形式化に対処する5つのVLM-as-formalizerパイプラインについて述べる。 VLMは、必要となるオブジェクト関係の網羅的な集合を捕捉できないことが多いため、言語よりも視覚的なボトルネックを明らかにする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:55:11 GMT)
Autoregressive Image Generation with Randomized Parallel Decoding [28.4]
本稿では,ランダム化並列生成が可能な新しい視覚自己回帰モデルであるARPGを紹介する。 ARPGは推論の30倍以上の高速化と、メモリ消費の75%削減を実現している。 ImageNet-1K 256ベンチマークでは、32ステップのサンプリングでFIDが1.83に達した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:55:44 GMT)
HermesFlow: Seamlessly Closing the Gap in Multimodal Understanding and Generation [28.3]
マルチモーダル大規模言語モデルにおける理解と生成のギャップを埋めるためにHermesFlowを提案する。データを入力として、理解と生成の両方の好みデータをキュレートする。 HermesFlowは、好みデータを用いたマルチモーダル理解と生成を効果的に調整する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:42:58 GMT)
CLIPin: A Non-contrastive Plug-in to CLIP for Multimodal Semantic Alignment [28.3]
大規模な自然画像テキストデータセットは、監督の弱いため、しばしば緩やかなセマンティックアライメントに悩まされる。私たちはCLIPスタイルのアーキテクチャにシームレスに統合できる統合された非コントラストプラグインであるCLIPinを提案する。 2つの共有ロバスト性事前プロジェクタは、コントラスト学習と非コントラスト学習の統合を容易にするために、それぞれ画像とテキストのモダリティのために設計されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:29:48 GMT)
Concise and Sufficient Sub-Sentence Citations for Retrieval-Augmented Generation [28.2]
RAG質問応答システムでは、大きな言語モデル(LLM)出力の引用を生成することにより、ユーザが潜在的幻覚を識別するのに役立つ。第一に、引用は通常文や段落レベルで提供される。第二に、文レベルの引用は、出力を検証するのに不可欠な情報を省略し、ユーザが周囲のコンテキストを読むことを強制する。本稿では,簡潔かつ十分なサブ文引用を生成することを提案する。これにより,ユーザが生成した出力の正確性を確認するのに要する労力を削減できる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:50:30 GMT)
Toward Robust and Efficient ML-Based GPU Caching for Modern Inference [28.1]
学習ベースのGPUキャッシングのためのフレームワークであるtextscLCRを提案する。そのコアアルゴリズムであるtextscLARUは、マシン学習した予測でtextscLRUを強化し、オンラインエラー推定を通じて予測精度に動的に適応する。実験では、スループットを最大24.2%改善し、P99 TTFTを最大28.3%削減し、広く使われている推論システムを上回っている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:23:50 GMT)
Online Language Splatting [28.1]
3DGS-SLAMシステム内で、オンライン、ほぼリアルタイムでオープン語彙の言語マッピングを実現するための最初のフレームワークであるOnline Language Splattingを紹介する。我々のオンライン手法は最先端のオフライン手法を精度良く超え,40倍以上の効率向上を実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:40:54 GMT)
CE-GPPO: Controlling Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning [28.0]
強化学習(RL)は、大規模言語モデル(LLM)を最適化して複雑な推論タスクを処理するための強力なパラダイムとなっている。政策最適化(PPO)やその変種といった既存の手法は、クリッピング機構により、低確率トークンから貴重な勾配信号を捨てる。 textbfGradient-textbfPreserving textbfPolicy textbfOptimization (CE) による textbfControlling textbfEntropy を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:22:04 GMT)
There Was Never a Bottleneck in Concept Bottleneck Models [27.9]
コンセプト・ボトルネック・モデル(CBM)はこの問題を緩和するための有望なアプローチとして登場した。コンポーネントが概念を予測できるという事実は、その概念に関する情報のみを符号化することを保証しません。本稿では,最小概念ボトルネックモデル(MCBM)を提案する。このモデルでは,情報ボトルネック(IB)の目的を組み込んで,各表現要素を制約し,対応する概念に関する情報のみを保持する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:09:14 GMT)
United Minds or Isolated Agents? Exploring Coordination of LLMs under Cognitive Load Theory [27.9]
大規模言語モデル(LLM)は、複雑で多面的なタスクに顕著なパフォーマンス天井を示す。 CoThinkerは認知的過負荷を軽減し、協調的な問題解決能力を高めるために設計された新しいフレームワークである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:49:56 GMT)
GraphPFN: A Prior-Data Fitted Graph Foundation Model [27.5]
大規模データセットで事前訓練された基礎モデルは、自然言語処理やコンピュータビジョンといった分野に変化をもたらした。ノードレベルの予測のための事前データ付きネットワークであるGraphPFNを提案する。最大50,000ノードのさまざまな実世界のグラフデータセットでは、GraphPFNは、微調整後の強いコンテキスト内学習のパフォーマンスと最先端の結果を示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:47:49 GMT)
TokUR: Token-Level Uncertainty Estimation for Large Language Model Reasoning [27.4]
token-level Uncertainty Estimation framework for Reasoning (TokUR)を提案する。 TokURは、大規模言語モデルにおいて、数学的推論における応答を自己評価し、自己改善することを可能にする。様々な難易度を持つ数学的推論データセットの実験により、TokURは答えの正しさとモデルロバストネスと強い相関を示すことが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:44:35 GMT)
UniTransfer: Video Concept Transfer via Progressive Spatial and Timestep Decomposition [27.3]
高精度かつ制御可能なビデオコンセプトトランスファーを実現するための新しいアーキテクチャUniTransferを提案する。空間分解の観点では、ビデオは主題、背景、動きの流れの3つの重要な構成要素に分離する。また、ビデオ内の異なるコンポーネントのきめ細かな制御をサポートするために、デュアル・ツー・シングル・ストリームのDiTベースのアーキテクチャも導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:39:06 GMT)
Enter the Mind Palace: Reasoning and Planning for Long-term Active Embodied Question Answering [27.2]
LA-EQA(Long-term Active Question Answering)は、ロボットが過去の経験を思い出し、その環境を積極的に探究して、複雑な時間的な質問に答えなければならない、という新しいタスクである。大規模なモデルに基づく標準的なEQAアプローチは、コンテキストウインドウの制限、永続メモリの欠如、メモリリコールとアクティブな探索を組み合わせられないため、この設定で苦労している。本稿では,認知科学のマインド・パレス法にヒントを得た,ロボットのための構造化メモリシステムを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:00:21 GMT)
Persona-Augmented Benchmarking: Evaluating LLMs Across Diverse Writing Styles [27.2]
さまざまなモデルやタスクにまたがって、低いか高いパフォーマンスを連続的に引き起こす異なる書き込みスタイルを特定します。我々の研究は、既存のベンチマークを拡大するためのスケーラブルなアプローチを提供し、LLM性能の測定に提供される評価の外部的妥当性を改善します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:37:43 GMT)
What Do LLM Agents Do When Left Alone? Evidence of Spontaneous Meta-Cognitive Patterns [27.1]
外部に課されたタスクを欠いた大規模言語モデル(LLM)エージェントの動作を研究するアーキテクチャを提案する。永続的なメモリと自己フィードバックを使用して、継続的な理由と行動のフレームワークは、持続的な自律的な操作を可能にします。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:29:49 GMT)
Cross-Cancer Knowledge Transfer in WSI-based Prognosis Prediction [27.0]
Whole-Slide Image (WSI) は癌予後を推定するための重要なツールである。本稿では,知識伝達へのパラダイムシフトを行い,WSIにおけるクロス・カンサー・プログノーシスの知識伝達に関する最初の予備的かつ体系的な研究を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:16:02 GMT)
Does FLUX Already Know How to Perform Physically Plausible Image Composition? [26.8]
ShiNEは、中性化エラーを伴うシームレス、高忠実な挿入のためのトレーニング不要のフレームワークである。我々は,低照度,強い照明,複雑な影,反射面などの多様な解像度と課題を特徴とするコンプレックスコンプレックスを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:01:49 GMT)
RIS-LAD: A Benchmark and Model for Referring Low-Altitude Drone Image Segmentation [26.8]
Referring ImageHide (RIS)は、自然言語の記述に基づいて特定のオブジェクトを分割することを目的としている。既存のデータセットとメソッドは、一般的に高高度および静的な画像のために設計されている。 RIS-LADは、低高度ドローン(LAD)のシナリオ用に調整された、最初のきめ細かいRISベンチマークである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:29:18 GMT)
WeFT: Weighted Entropy-driven Fine-Tuning for dLLMs [26.5]
拡散言語モデルのための重み付きSFT法であるWeFTを提案し、トークンはエントロピーに基づいて異なる重みを割り当てる。 WFTは、s1K、s1K-1.1および3kサンプルをopen-r1からトレーニングし、広く使用されている4つの推論ベンチマークで標準SFTよりも39%、64%、83%の相対的な改善を達成している。コードとモデルは公開されます。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:55:58 GMT)
Long-Tailed Out-of-Distribution Detection with Refined Separate Class Learning [26.2]
堅牢な機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。我々はRefined Separate Class Learning (RSCL)と呼ばれる新しいアプローチを提案する。 RSCLは、分配データにおける分類精度を改善しつつ、優れたOOD検出性能を実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:41:54 GMT)
FreeInsert: Personalized Object Insertion with Geometric and Style Control [26.1]
3次元幾何情報を利用して任意のシーンへのオブジェクト挿入をカスタマイズする学習自由フレームワークを提案する。レンダリングされた画像は、幾何学的制御として機能し、拡散アダプタによって達成されたスタイルとコンテンツ制御とを結合する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:26:10 GMT)
Exploring the Secondary Risks of Large Language Models [26.0]
良心的衝動時の有害または誤解を招く行動に特徴付けられる二次的リスクを導入する。敵の攻撃とは異なり、これらのリスクは不完全な一般化から生じ、しばしば標準的な安全メカニズムを回避する。本研究では,ブラックボックス型多目的検索フレームワークSecLensを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:51:45 GMT)
Scaling Laws for Online Advertisement Retrieval [25.9]
スケーリング法則はニューラルネットワークモデルの顕著な特性であり、大きな言語モデルの開発を著しく推進している。最近の研究では、スケーリング法則はタスクやトランスフォーマーアーキテクチャに限らず、レコメンデーションのようなドメインにも適用されることがますます示されている。本稿では,新しいオフラインメトリックとオフラインシミュレーションアルゴリズムを取り入れた検索モデルのオンラインスケーリング法則を同定するための軽量なパラダイムを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:19:47 GMT)
HEIST: A Graph Foundation Model for Spatial Transcriptomics and Proteomics Data [25.9]
本稿では,空間転写学とトランスフォーマーのための階層グラフ基盤モデルであるHEISTを紹介する。 HEISTは、124の組織から15の臓器の22.3M細胞に、空間的に認識されるコントラストとマスクされた自己エンコーディングの目的を用いて事前訓練されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:18:59 GMT)
Small Stickers, Big Meanings: A Multilingual Sticker Semantic Understanding Dataset with a Gamified Approach [25.9]
我々は,多種多様で高品質で,文脈的に共鳴するステッカークエリを収集するために設計された,ゲーミフィケーションアノテーションフレームワークであるSticktionaryを紹介した。次に、60時間以上のコントリビュータによって注釈付けされた1,115の英語と615の中国語クエリを含む、多言語ステッカークエリデータセットであるStickerQueriesを紹介する。第3に,本手法がステッカー領域におけるクエリ生成品質,検索精度,意味理解を著しく向上させることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:56:08 GMT)
IoT-MCP: Bridging LLMs and IoT Systems Through Model Context Protocol [25.7]
IoT-MCPは、エッジデプロイサーバを通じてモデルコンテキストプロトコル(MCP)を実装する新しいフレームワークである。この作業は、オープンソースの統合フレームワークと、LLM-IoTシステムの標準化された評価方法論の両方を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:35:47 GMT)
Near-Optimal Experiment Design in Linear non-Gaussian Cyclic Models [25.5]
線形非ガウス構造方程式モデルから因果構造学習の問題を考察する。近年の研究では、単に観測データを用いることで、因果グラフは置換等価クラスまでしか識別できないことが示されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:34:24 GMT)
Instruction-tuned Self-Questioning Framework for Multimodal Reasoning [25.3]
SQ-InstructBLIPは,画像認識による情報サブクェリとサブサブ問合せを反復的に生成することで,推論性能を向上させる。提案手法は,VQAタスクを解く際に,生成したサブクエストを付加情報として用いたSQ-InstructBLIPが,従来よりも高精度な推論を行うことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:45:06 GMT)
Leveraging What's Overfixed: Post-Correction via LLM Grammatical Error Overcorrection [25.3]
大きな言語モデル(LLM)は、しばしば反対の傾向を示し、過度な過度なオーバーコレクションを引き起こし、精度が低い。本稿では, 戦略的リコールと精度のバランスをとる新しいアプローチとして, オーバーコレクションによるポストコレクション(PoCO)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:49:26 GMT)
Leveraging Temporally Extended Behavior Sharing for Multi-task Reinforcement Learning [25.0]
マルチタスク強化学習(MTRL)は、サンプル効率を改善するための有望なアプローチを提供する。多様なタスクデータを収集するコストが高いため、MTRLをロボット工学に適用することは依然として困難である。 MTRL環境における試料効率を向上させる新しい探索手法MT-L'evyを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:46:41 GMT)
Knowledgeable Language Models as Black-Box Optimizers for Personalized Medicine [24.9]
パーソナライズドメディカルでは、候補治療を患者に任意に投与して有効性を評価することはできない。我々は、LEONを「プロンプトによる最適化」により実装し、LLMを治療設計を提案するエンジンとして利用する。実世界の最適化タスクの実験では、LEONは患者に対する個別治療の提案において、従来の方法とLLMベースの方法の両方に優れていた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:19:52 GMT)
Revenue Maximization Under Sequential Price Competition Via The Estimation Of s-Concave Demand Functions [24.8]
半パラメトリック最小二乗推定を用いた動的価格ポリシーを提案する。我々は,販売者が当社の方針を採用すると,その価格がナッシュ均衡価格に対して$O(T-1/7)のレートで収束することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:17:55 GMT)
Recon-Act: A Self-Evolving Multi-Agent Browser-Use System via Web Reconnaissance, Tool Generation, and Task Execution [24.7]
Recon-Actは、Reconnaissance-Actionの行動パラダイムに基づく、自己進化型のマルチエージェントフレームワークである。システムは偵察チームとアクションチームで構成される。 Recon-Actは、目に見えないWebサイトへの適応性と、長期的なタスクに対する解決可能性を大幅に改善する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:23:49 GMT)
Unsupervised Defect Detection for Surgical Instruments [24.5]
本稿では,手術器具の非監視的欠陥検出手法に適応する汎用的手法を提案する。背景マスキング,パッチベースの分析戦略,ドメイン適応の効率化により,本手法はこれらの制約を克服する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:40:52 GMT)
Learning Inter-Atomic Potentials without Explicit Equivariance [24.4]
現在の最先端モデルは、同変ニューラルネットワークアーキテクチャを通じてロト翻訳対称性を強制する。 TransIP: Transformer-based Inter-Atomic potentials, a novel training paradigm for interatomic potentials to achieved symmetric compliance。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:15:10 GMT)
The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm [24.0]
極分解を計算するための新しい手法であるPolar Expressを紹介する。この戦略が最悪の場合においてエラーを最小限に抑え、極極急行をできるだけ早く収束させることができることを実証する。 Muon トレーニングフレームワークに統合されると,本手法は検証損失を一貫した改善をもたらす。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:39:00 GMT)
Task-Agnostic Federated Continual Learning via Replay-Free Gradient Projection [24.0]
フェデレートされた連続学習(FCL)により、分散クライアントデバイスは、多様で進化するタスクにわたるストリーミングデータから学習することができる。タスク識別予測(FedProTIP)を用いた連立勾配予測型連続学習を提案する。このフレームワークは、クライアントのアップデートをグローバルモデルの以前に学習された表現によって分散されたサブスペースの補空間に投影することで、忘れを軽減します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:20:00 GMT)
X-CoT: Explainable Text-to-Video Retrieval via LLM-based Chain-of-Thought Reasoning [23.9]
本研究は、LLM CoT推論に基づく説明可能な検索フレームワークであるX-CoTを提案する。まず、セマンティック理解をサポートするビデオアノテーションを追加して既存のベンチマークを拡張します。 X-CoTは、検索性能を実証的に改善し、詳細な合理性を生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:39:45 GMT)
IntSR: An Integrated Generative Framework for Search and Recommendation [23.8]
IntSRは検索とレコメンデーションのための統合生成フレームワークである。統合されたS&R行動と、動的に変化するコーパスによって導入された誤パターン学習に関連する計算複雑性の増大に対処する。 IntSRはAmapの様々なシナリオに展開され、デジタル資産のGMV(+3.02%)、POIレコメンデーションのCTR(+2.76%)、旅行モードの提案のACC(+5.13%)が大幅に改善された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:58:33 GMT)
C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring Challenges in Complex Conversations [23.8]
音声対話モデル(SDM)は近年,ユーザの音声クエリに直接音声応答を生成する能力に注目が集まっている。人間の音声相互作用は、音声対話特有の特徴のため、本質的にテキストよりも複雑である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:06:31 GMT)
Tree Search for LLM Agent Reinforcement Learning [23.7]
Tree-based Group Relative Policy Optimization (Tree-GRPO) は、木探索に基づくグループ化エージェントRL法である。共通のプレフィックスを共有することで、ツリー検索サンプリングは、達成可能なロールアウトの数を増やす。木レベルでの相対的政策最適化の目的は、ステップレベルの直接選好学習と同等であることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:37:09 GMT)
Verification Limits Code LLM Training [23.7]
コード生成のための大規模言語モデルは、問題解と検証テストの両方がモデルによって生成される合成データにますます依存している。本研究では,検証設計と戦略がモデル性能に与える影響について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:23:30 GMT)
Causal Structure Learning in Hawkes Processes with Complex Latent Confounder Networks [23.7]
連続時間事象列は時間間隔が縮むにつれて離散時間因果モデルで表現できることを示す。本稿では,検出したサブプロセス間の因果関係の推論と,新しい潜在サブプロセスの発見を交互に行う2相反復アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:58:04 GMT)
PALQO: Physics-informed Model for Accelerating Large-scale Quantum Optimization [23.6]
変分量子アルゴリズム(VQA)は、短期量子デバイスの実用性に到達するための主要な戦略である。本稿では、非線形偏微分方程式としてVQAのトレーニング力学を再構成し、このシステムを効率的にモデル化するための新しいプロトコルを提案する。提案手法は従来の手法に比べて最大30倍の高速化を実現し,最大40キュービットのタスクに対して最大90%の量子リソースコスト削減を実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:26:02 GMT)
One Model, Many Morals: Uncovering Cross-Linguistic Misalignments in Computational Moral Reasoning [23.6]
大規模言語モデル(LLM)における言語が道徳的意思決定をどのように仲介するかを検討する。我々の分析は、LLMの言語間の道徳的判断に重大な矛盾があることを示し、しばしば文化的不一致を反映している。我々は、私たちの洞察を、より文化的に認識されたAIを要求する道徳的推論エラーの構造化されたタイプロジーに精査する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:14:17 GMT)
Human-like Navigation in a World Built for Humans [23.3]
ReasonNavは、人間のようなナビゲーションスキルを統合したモジュラーナビゲーションシステムである。ナビゲーションのランドマークに基づいた,コンパクトな入力と出力の抽象化を設計する。 ReasonNavは、大規模で複雑な建物を効率的に航行するために、高次推論をうまく採用している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:04:17 GMT)
R&D-Agent-Quant: A Multi-Agent Framework for Data-Centric Factors and Model Joint Optimization [23.2]
金融市場は、その高次元性、非定常性、持続的ボラティリティにより、資産返却予測に根本的な課題を提起する。大規模言語モデルやマルチエージェントシステムの進歩にもかかわらず、現在の定量的研究パイプラインは、限定された自動化、弱い解釈可能性、ファクタマイニングやモデル革新といった重要なコンポーネント間の断片的な調整に悩まされている。本稿では,量的ファイナンスのためのR&D-Agentを提案する。RD-Agent(Q)は,コーディネート・ファクターモデルによる量的戦略の完全な研究と開発を自動化するために設計された,最初のデータ中心型マルチエージェントフレームワークである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:13:08 GMT)
Robustifying Learning-Augmented Caching Efficiently without Compromising 1-Consistency [23.2]
Guardは軽量なロバスト化フレームワークで、学習強化型キャッシュアルゴリズムの堅牢性を2H_k + 2$に向上させる。 Guardは、一貫性と堅牢性の間の、現在のよく知られたトレードオフを実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:49:59 GMT)
Learning Flow-Guided Registration for RGB-Event Semantic Segmentation [23.0]
イベントカメラは、RGBセンサーを補完するマイクロ秒レベルのモーションキューをキャプチャする。 RGB-Eventセグメンテーションを融合から登録に再キャストする。非対称なモーダル間の対応を適応的にマッチングする新しいフロー誘導双方向フレームワークであるBRENetを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:06:47 GMT)
Scalable Second-order Riemannian Optimization for $K$-means Clustering [22.8]
K$-meansクラスタリング問題をサブ多様体として新たに定式化する。 K$-平均多様体を積多様体に分解することにより、ニュートン部分確率がどのように解けるかを示す。実験の結果,提案手法は最先端の1次負の非負の非負の分解法よりもはるかに高速に収束することがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:49:00 GMT)
Semantic-Aware Reconstruction Error for Detecting AI-Generated Images [22.8]
本稿では,画像とキャプション誘導再構成のセマンティック・アウェア・リコンストラクション・エラー(SARE)を計測する新しい表現を提案する。 SAREは、さまざまな生成モデル間で偽画像を検出するための堅牢で差別的な機能を提供する。また,SAREを背骨検出器に統合する融合モジュールを,クロスアテンション機構を介して導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:29:54 GMT)
DriftLite: Lightweight Drift Control for Inference-Time Scaling of Diffusion Models [22.8]
本研究では,拡散モデルに対する予測時間スケーリングについて検討し,事前学習したモデルを新たなターゲット分布に適応させることを目標とする。 DriftLiteは軽量でトレーニング不要な粒子ベースのアプローチで、飛行中の推論ダイナミクスを最適に安定に制御する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:21:59 GMT)
SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation [22.7]
SmallPlanは、教師モデルとしてLarge Language Modelsを活用して、ハイレベルパス計画タスクのために軽量なSLM(Small Language Models)をトレーニングする新しいフレームワークである。 LLM誘導微調整(SFT)と強化学習(RL)を併用したシミュレーションによるインターリーブ方式のSLM訓練本研究は, GPT-4oのような大型モデルと連続経路計画において, 幻覚や過剰適合に悩まされることなく, 微調整SLMが競合することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:12:31 GMT)
Towards Transparent AI: A Survey on Explainable Language Models [22.7]
言語モデル(LM)は、自然言語処理を著しく進歩させ、様々な領域で顕著な進歩を可能にした。透明性の欠如は、高い領域の採用において特に問題となる。 XAI法は非LMに対してよく研究されているが、LMに適用した場合、多くの制限に直面している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:47:39 GMT)
Differentiable Structure Learning for General Binary Data [22.6]
離散変数間の任意の依存関係をキャプチャ可能な、微分可能な構造学習フレームワークを提案する。学習問題を最も一般的な形式で1つの微分可能な最適化タスクとして定式化する。実験結果から,本手法は離散データの複雑な関係を効果的に捉えていることが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:26:55 GMT)
Attributing Responsibility in AI-Induced Incidents: A Computational Reflective Equilibrium Framework for Accountability [22.5]
AI(Artificial Intelligence)の広範な統合は、AI対応システムに関わるインシデントが発生した場合の責任と説明責任において、複雑な課題を導入している。この研究は、すべての利害関係者に対して、一貫性があり倫理的に許容される責任帰属の枠組みを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:24:28 GMT)
Domain-Aware Tensor Network Structure Search [22.3]
テンソルネットワーク構造探索(TN-SS)問題は依然として課題である。現在の最先端(SOTA)アルゴリズムは、純粋に数値最適化問題としてTN-SSを解く。本稿では,データに関するドメイン情報を組み込んだ新しいTN-SSフレームワークtnLLMを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:19:14 GMT)
From Replication to Redesign: Exploring Pairwise Comparisons for LLM-Based Peer Review [22.3]
原稿間の相互比較を行うために,LLMエージェントを用いた新しいメカニズムを導入,検討する。この比較手法は, 従来の評価に基づく手法よりも, 高インパクト論文の同定に優れることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:35:58 GMT)
AOT*: Efficient Synthesis Planning via LLM-Empowered AND-OR Tree Search [22.0]
AOT*は、LLM生成化学合成経路と系統的なAND-OR木探索を統合することで、レトロシンセティックプランニングを変換するフレームワークである。 AOT* は、既存の LLM ベースのアプローチよりも 3-5$times$ のイテレーションを減らして、競争力のある解決率を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:30:37 GMT)
On Code-Induced Reasoning in LLMs [21.9]
並列命令データセットを10のプログラミング言語で構築する。コードの構造的・意味的特性を選択的に破壊する制御摂動を適用する。以上の結果から,LLMは意味論的よりも構造的摂動に弱いことが示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:57:36 GMT)
Wonder Wins Ways: Curiosity-Driven Exploration through Multi-Agent Contextual Calibration [21.4]
エージェントがノイズの多いサプライズ信号をフィルタリングし、固有好奇心を推論されたマルチエージェントコンテキストで動的に校正することで、ガイド探索を可能にする、原則化されたフレームワークであるCERMICを紹介する。 CERMICをVMAS, Meltingpot, SMACv2などのベンチマークスイートで評価する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:07:08 GMT)
Collab-Overcooked: Benchmarking and Evaluating Large Language Models as Collaborative Agents [21.3]
LLM(Large Language Models)ベースのエージェントシステムは、従来のNLPタスクを超えて、現実世界のアプリケーションにおいて大きな進歩を遂げてきた。本稿では,インタラクティブ環境において,より適用性が高く,課題の多いOvercooked-AIゲーム上に構築された新しいベンチマークであるCollab-Overcookedを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:15:18 GMT)
Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data [21.3]
タブラル基礎モデルは、低リソース問題でますます人気がある。これらのモデルは、大量の合成データを事前学習することで、小さなトレーニングデータセットを構成する。そこで本研究では,推論可能なLCMを用いて決定木を誘導する手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:30:39 GMT)
Hallucination reduction with CASAL: Contrastive Activation Steering For Amortized Learning [21.3]
大きな言語モデル(LLM)は印象的な能力を示すが、しばしば幻覚を呈し、無知を認めるのではなく、自信を持って不正確な答えを提供する。本稿では、解釈可能性とアモータイズ最適化を結合する効率的なアルゴリズムであるCASAL(Contrastive Activation Steering for Amortized Learning)を紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:49:02 GMT)
WDformer: A Wavelet-based Differential Transformer Model for Time Series Forecasting [21.2]
時系列予測には,気象降雨予測,交通流解析,財務予測,運用負荷監視など,さまざまな応用がある。時系列データのばらつきのため、時間領域や周波数領域のモデリングのみに依存するため、モデルがマルチドメイン情報を十分に活用する能力は制限される。我々は,ウェーブレットに基づく微分変換器モデルであるWDformerを提案し,時系列データの多分解能解析を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:43:51 GMT)
Who's Laughing Now? An Overview of Computational Humour Generation and Explanation [21.2]
我々は、創造と説明の創造的なタスクに関連する計算ユーモアの風景を調査する。基礎的なNLPタスクのすべての目印を包含するユーモアを理解するタスクにもかかわらず、ペストを超えたユーモアの生成と説明の作業はいまだに疎いままである。本稿では,ユーモアの主観的かつ倫理的にあいまいな性質を考慮に入れた研究の今後の方向性について広範な議論を行う。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:56:56 GMT)
OmniScene: Attention-Augmented Multimodal 4D Scene Understanding for Autonomous Driving [21.1]
人間の視覚は、2次元の観察をエゴセントリックな3次元のシーン理解に変換することができる。我々は,総合的な4Dシーン理解のための多視点と時間的知覚を統合する,OmniSceneと呼ばれる新しいヒューマンライクなフレームワークを提案する。我々のアプローチは、認識、予測、計画、視覚的質問応答における新しいベンチマークを確立することで、常に優れた結果を達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:33:06 GMT)
ButterflyQuant: Ultra-low-bit LLM Quantization through Learnable Orthogonal Butterfly Transforms [21.0]
大きな言語モデルは巨大なメモリフットプリントを必要とし、コンシューマハードウェアへのデプロイを著しく制限する。量子化は低い数値精度でメモリを減少させるが、極端な2ビット量子化は、アクティベーションの異常値による破滅的な性能損失に悩まされる。本研究では,アダマール回転を学習可能なバタフライ変換に置き換えるバタフライ量子化法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:12:18 GMT)
JUREX-4E: Juridical Expert-Annotated Four-Element Knowledge Base for Legal Reasoning [20.9]
JUREX-4Eは155件の刑事訴追を専門とする4要素知識ベースである。 JUREX-4Eを類似電荷曖昧化タスクで評価し, 判例検索に適用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:24:56 GMT)
Grounding AI Explanations in Experience: A Reflective Cognitive Architecture for Clinical Decision Support [20.9]
我々は、高精度で高品質な説明は別個の目的ではなく、データを深く直接理解するモデルの結果を相互に補強していると論じる。より深い理解を促進する信号として予測精度を使用することで、RCAはデータの強力な内部モデルを構築する。以上の結果から,RCAはベースラインの40%以上の相対的な改善によって最先端の精度と堅牢性を達成するだけでなく,この深い理解を活用して,明確で論理的,エビデンスに基づく,バランスの取れた説明の創出に長けていることが示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:57:52 GMT)
D2-Mamba: Dual-Scale Fusion and Dual-Path Scanning with SSMs for Shadow Removal [20.8]
本稿では,デュアルスケール核融合とデュアルパススキャンを併用した新しいマンバ型ネットワークを提案する。提案手法は,影除去ベンチマークにおける既存の最先端手法を著しく上回ることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:25:16 GMT)
SupCLAP: Controlling Optimization Trajectory Drift in Audio-Text Contrastive Learning with Support Vector Regularization [20.7]
対照的な学習における負のサンプルから押し力の垂直成分を制御するための支援ベクトル正規化を提案する。提案手法は,分類,単言語検索,多言語検索において,InfoNCEやSigLIPの損失など,広く使用されているベースラインを超えていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:40:20 GMT)
Security of Deep Reinforcement Learning for Autonomous Driving: A Survey [20.7]
強化学習(RL)は、エージェントが環境との相互作用を通じて最適な行動を学ぶことを可能にする。その約束にもかかわらず、RLは、政策学習を妥協したり、訓練されたエージェントによる誤った判断を誘発するために設計された攻撃に影響を受けやすい。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:51:20 GMT)
The Value of Information in Human-AI Decision-making [20.7]
情報の価値を特徴付けるための意思決定理論の枠組みに貢献する。補完的な情報を定義することによって、エージェントがAIによる意思決定で利用可能な情報をよりうまく活用する機会を特定することができる。本稿では、SHAPの説明に適応し、人間の補足情報を強調する新しい説明手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:58:41 GMT)
A Decision Theoretic Framework for Measuring AI Reliance [20.7]
人間はしばしば人工知能(AI)システムの助けを借りて意思決定をする。研究者は、補完的なパフォーマンスを達成する上で重要な要素として、人間がAIに適切に依存していることを確認する。本稿では, 統計的決定理論に基づく信頼の形式的定義を提案し, 意思決定者がAIの推奨に従う確率として信頼の概念を分離する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:06:11 GMT)
Imagining Design Workflows in Agentic AI Futures [20.7]
エージェントAIという新しいコンセプトが生まれつつある。生成AIはプロンプトに応じて出力を生成するが、エージェントAIシステムは日常的なタスクを自律的に実行することを約束する。我々は、デザイナーが協力的なエージェントAIプラットフォームとどのように対話したいかを検討した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:23:16 GMT)
Lossless Compression: A New Benchmark for Time Series Model Evaluation [20.5]
時系列モデルを評価するための新しいパラダイムとしてロスレス圧縮を導入する。この観点は、最適圧縮長と負の対数類似度との直接同値性を確立する。我々は,包括的評価フレームワークTSCom-Benchを提案し,オープンソース化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:52:48 GMT)
Data-Augmented Few-Shot Neural Emulator for Computer-Model System Identification [20.5]
部分方程式 (Partial equations, PDE) は、多くの自然および工学的なシステムのモデリングである。ニューラルネットワーク表現でPDEの支配方程式の一部または全部を置き換えることで、ニューラルPDEのようなモデルを表現するのが便利である。本稿では,コンピュータモデルからニューラルPDEトレーニングデータを生成するための,より効率的なデータ拡張戦略を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:08:24 GMT)
Shaping Initial State Prevents Modality Competition in Multi-modal Fusion: A Two-stage Scheduling Framework via Fast Partial Information Decomposition [20.4]
マルチモーダル・フュージョンは、関節トレーニング中にしばしばモダリティ・コンペティションに悩まされる。共同トレーニングの前に一助訓練により初期状態を形作るための2段階トレーニングフレームワークを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:27:57 GMT)
Enhancing Cross-View Geo-Localization Generalization via Global-Local Consistency and Geometric Equivariance [20.4]
クロスビューなジオローカライゼーションは、大きく異なる視点から捉えた同じ位置の画像をマッチングすることを目的としている。クロスドメインの一般化を促進するための新しいCVGLフレームワークであるEGSを提案する。 EGSは一貫して大幅なパフォーマンス向上を実現し、クロスドメインCVGLにおける新しい最先端技術を確立している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:35:21 GMT)
Can Federated Learning Safeguard Private Data in LLM Training? Vulnerabilities, Attacks, and Defense Evaluation [20.4]
フェデレートラーニング(FL)により、クライアントは、コラボレーティブトレーニングのためのモデルパラメータのみを共有しながら、ローカルデータを保持できる。攻撃者は、簡単な生成方法を用いても、グローバルモデルからトレーニングデータを抽出できることを示す。 FLに合わせた攻撃戦略を導入し、トレーニング中にグローバルモデルのアップデートを追跡し、プライバシーの漏洩を強化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:28:08 GMT)
HAMMER: Hamiltonian Curiosity Augmented Large Language Model Reinforcement [20.2]
ハミルトンの好奇心強化大言語モデル強化(HAMMER)を提案する。 HAMMERは、データセット評価で一般的に使用される多様性メトリクスを動的強化学習手順に転送する。実験的な評価は、HAMMERがモデル「好奇心」を刺激し、平均精度の3%から4%を一貫して達成していることを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:38:16 GMT)
SLAM-Free Visual Navigation with Hierarchical Vision-Language Perception and Coarse-to-Fine Semantic Topological Planning [20.1]
脚付きロボットナビゲーションのための視覚のみのSLAMフリーナビゲーションフレームワークを提案する。階層的な視覚言語知覚モジュールは、シーンレベルのコンテキストとオブジェクトレベルの手がかりを融合して、堅牢なセマンティック推論を行う。強化学習コントローラと統合されたこのフレームワークは、さまざまな脚を持つロボットプラットフォームにデプロイ可能である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:38:45 GMT)
Shortcut Flow Matching for Speech Enhancement: Step-Invariant flows via single stage training [20.1]
拡散に基づく生成モデルは、音声強調における知覚品質の最先端性能を達成した。音声強調のためのショートカットフローマッチング(SFMSE)を導入する。その結果,一段階のSFMSE推論により,コンシューマGPU上でのリアルタイム係数(RTF)が0.013となることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:09:05 GMT)
Nuclear Diffusion Models for Low-Rank Background Suppression in Videos [20.0]
核拡散は、実際の医療画像問題、すなわち心臓超音波脱ハージングに基づいて評価される。その結果、高忠実度ビデオ復元のためのモデルベース時間モデルと深部生成前のモデルを組み合わせる可能性を強調した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:20:22 GMT)
Embodied Representation Alignment with Mirror Neurons [20.0]
ミラーニューロン(英: Mirror neurons)は、個体が行動を観察し、同じ行動を行うときに活性化するニューロンである。本研究では,表現学習のレンズによるモデリングにおいて,統一的な視点を提供する。ミラーニューロンにインスパイアされた我々は、観察された行動と実行された行動の表現を明示的に整列させるアプローチを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:27:37 GMT)
Poisoning Prompt-Guided Sampling in Video Large Language Models [19.8]
我々は,ビデオLLMの即時サンプリングを阻害する最初のブラックボックス中毒発作であるPoisonVIDを提示する。 PoisonVIDは、クローズドループ最適化戦略を通じて、基礎となるプロンプト誘導サンプリング機構を妥協する。攻撃成功率は82% - 99%であり、ビデオLLMの将来の高度なサンプリング戦略を開発することの重要性を強調している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:40:16 GMT)
Confidence-guided Refinement Reasoning for Zero-shot Question Answering [19.8]
C2R(Confidence-guided Refinement Reasoning)は、テキスト、画像、ビデオドメインにわたる質問応答タスクに適用可能な、新しいトレーニングフリーフレームワークである。 C2Rは戦略的にサブクエストとそれらの回答(サブQA)を構築し、洗練し、ターゲットの回答に対してより良い信頼スコアを得る。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:15:12 GMT)
SOLAR: Towards Characterizing Subjectivity of Individuals through Modeling Value Conflicts and Trade-offs [19.8]
我々は,ソーシャルメディア上での個人の主観性を特徴付け,その道徳的判断を大規模言語モデルを用いて推測する。本研究では,個人の主観的根拠をよりよく表現するために,ユーザ生成テキストにおける価値相反やトレードオフを観察するフレームワークであるSOLARを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:12:37 GMT)
Taxonomy-aware Dynamic Motion Generation on Hyperbolic Manifolds [19.7]
本稿では,動きの階層構造と時間的ダイナミクスの両方を保った潜在表現を学習し,物理的整合性を確保する新しいアプローチであるacgphdmを紹介する。この幾何学的・分類学的枠組みに基づいて、分類学的・物理的に整合な動作を生成するための3つの新しいメカニズムを提案する。ハンドグリーピング分類における現実的な動き列の生成実験により,提案したGPHDMは,その基盤となる分類と時間的ダイナミクスを忠実に符号化し,新しい物理的に一貫性のある軌道を生成することを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:03:03 GMT)
Diffence: Fencing Membership Privacy With Diffusion Models [19.7]
ディープラーニングモデルは、メンバーシップ推論攻撃(MIA)に対して脆弱である生成モデルを活用することでMIAに対する新たな防御フレームワークを導入する。当社の防衛はDIFFENCEと呼ばれ、事前推論を行います。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:46:44 GMT)
Flow Matching in the Low-Noise Regime: Pathologies and a Contrastive Remedy [19.6]
フローマッチングは、生成モデリングと表現学習のための連続時間定式化を提供する。この枠組みは低雑音体制における根本的な不安定性に悩まされていることを示す。直接速度回帰を小さな雑音レベルにおける対照的な特徴アライメントに置き換えるハイブリッドトレーニングプロトコルであるLocal Contrastive Flow (LCF)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:36:41 GMT)
A High-Dimensional Statistical Method for Optimizing Transfer Quantities in Multi-Source Transfer Learning [19.6]
対象モデルを共同でトレーニングするために、各ソースタスクから必要なソースサンプルの最適な量は何か? 具体的には、K-Lの発散に基づく一般化誤差尺度を導入し、高次元統計解析に基づいて最小化し、各ソースタスクの最適転送量を決定する。アーキテクチャに依存しないデータ効率アルゴリズムOTQMSを開発し、マルチソース変換学習におけるターゲットモデルトレーニングのための理論的結果を実装した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:25:12 GMT)
Equi-RO: A 4D mmWave Radar Odometry via Equivariant Networks [19.6]
Equi-ROは4次元レーダオドメトリーのための同変ネットワークベースのフレームワークである。グラフベースのアーキテクチャは、スパースレーダデータの特徴集約を強化する。オープンソースデータセットと自己収集データセットの実験は、Equi-ROが最先端のアルゴリズムを精度と堅牢性で上回っていることを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:21:05 GMT)
Vim-F: Visual State Space Model Benefiting from Learning in the Frequency Domain [19.6]
Mambaディープラーニングモデルとして知られる、効率的なハードウェア対応設計のステートスペースモデル(SSM)は、長いシーケンスのモデリングにおいて大きな進歩を遂げた。従来の畳み込みニューラルネットワーク(CNN)やビジョントランスフォーマー(ViT)と比較して、ビジョン・マンバ(ViM)メソッドのパフォーマンスは、まだ完全に競合していない。周波数領域と空間領域の両方で純粋なマンバエンコーダとスキャンを利用するVim-Fと呼ばれる新しいモデルを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:58:13 GMT)
Conditionally Whitened Generative Models for Probabilistic Time Series Forecasting [19.5]
Conditionally Whitened Generative Models (CW-Gen) は、条件付きホワイトニングを通じて事前情報を組み込むフレームワークである。 CW-Genは予測性能を継続的に向上し、非定常力学と変数間相関を事前自由アプローチよりも効果的に捉えている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:13:37 GMT)
TestAgent: Automatic Benchmarking and Exploratory Interaction for Evaluating LLMs in Vertical Domains [19.5]
大規模言語モデル(LLM)は、高度に専門化された垂直ドメインにデプロイされることが多い。既存の垂直領域の評価は、通常、静的な単一ターンデータセットの労働集約的な構築に依存している。垂直領域における自動ベンチマークと探索動的評価のためのフレームワークであるTestAgentを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:19:24 GMT)
From Text to Talk: Audio-Language Model Needs Non-Autoregressive Joint Training [19.4]
Text-to-Talk (TtT) は、自動回帰(AR)テキスト生成と非自己回帰(NAR)音声拡散を統合した統合オーディオテキストフレームワークである。このハイブリッド生成パラダイムをサポートするために,テキストの因果復号を強制するモダリティ対応アテンション機構を設計する。推論中、TtTは可変長出力を柔軟に処理しながら、ブロックワイド拡散を用いてオーディオを並列に合成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:23:12 GMT)
A circuit for predicting hierarchical structure in-context in Large Language Models [19.4]
大規模言語モデル(LLM)はコンテキスト内学習において優れており、将来的なトークンの予測を改善するためにコンテキストとして提供される情報を利用することができる。そこで本研究では,トークンを階層的依存関係で繰り返し行う合成文脈内学習タスクを設計する。文脈内で何に参加するべきかを学習することで予測を支援する適応型誘導ヘッドが見つかる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:20:23 GMT)
StyleBench: Evaluating thinking styles in Large Language Models [19.3]
StyleBenchは、様々なタスクやモデルにわたる推論スタイルを評価するための総合的なベンチマークである。思考の連鎖(CoT)、思考のツリー(ToT)、思考のアルゴリズム(AoT)、思考のスケッチ(SoT)、思考の連鎖(CoD)の5つの代表的な推論スタイルを評価する。我々の大規模分析により、単一のスタイルが普遍的に最適でないことが判明した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:00:39 GMT)
Integrating Object Interaction Self-Attention and GAN-Based Debiasing for Visual Question Answering [19.3]
IOG-VQAは、オブジェクトインタラクションの自己認識とGANベースのデバイアスを統合し、VQAモデルの性能を向上させる。本モデルでは,既存手法と比較して優れた性能を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:13:19 GMT)
A Theoretical Perspective on Why Stochastic Population Update Needs an Archive in Evolutionary Multi-objective Optimization [19.3]
アーカイブを使用すれば人口が少なくなり,SPUベースのMOEAの探索性能が向上する可能性が示唆された。 SMS-EMOA と NSGA-II の2つの古典的アルゴリズムについて,双目的問題 OneJumpZeroJump について検討した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:10:31 GMT)
Security-aware Semantic-driven ISAC via Paired Adversarial Residual Networks [19.2]
本稿では,セキュリティ・セマンティック・セマンティック・インテリジェンス・コミュニケーション(ISAC)フレームワーク,すなわちセキュリティ・セマンティックISAC(SS-ISAC)を提案する。対向攻撃のポジティブな影響に触発され、提案したSS-ISACフレームワークでは、プラグ可能な暗号化モジュールと復号モジュールが設計されている。 SACと盗難防止性能の両面から提案したSS-ISACフレームワークの有効性をシミュレーションにより検証した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:22:33 GMT)
HyperFlexis: Joint Design of Algorithms and Systems for Multi-SLO Serving and Fast Scaling [19.2]
現代の大規模言語モデル(LLM)が提供するシステムは、さまざまな長さ、優先順位、ステージ固有のサービスレベル目標(SLO)を持つ、高度に可変的な要求からの課題に直面している。我々は,複数のSLO下でのスケジューリングとスケーリングを協調的に最適化するために,アルゴリズムとシステムレベルのイノベーションを統合した統一LLMサービスシステムHyperFlexisを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:00:22 GMT)
GeMix: Conditional GAN-Based Mixup for Improved Medical Image Augmentation [19.1]
本稿では,2段階のフレームワークであるGeMixを提案する。我々は,3つのバックボーン(ResNet-50,ResNet-101,EfficientNet-B0)を用いて,大規模COVIDx-CT-3データセット上でGeMixをベンチマークした。実際のデータと組み合わせると,従来のすべてのバックボーンの混合よりもマクロF1が増加し,新型コロナウイルス検出の偽陰性率が低下する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:48:22 GMT)
Are Hallucinations Bad Estimations? [19.1]
損失最小化の最適推定器でさえまだ幻覚的であることを示す。これにより、幻覚は損失最小化と人間の許容できる出力の間の構造的ミスアライメントとして再編成される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:39:09 GMT)
JudgeAgent: Knowledge-wise and Dynamic LLM Evaluation with Agent-as-Interviewer [19.1]
本稿では,大規模言語モデルを用いた動的評価パラダイムであるエージェント・アズ・インタービューアを提案する。現在のベンチマークや動的インタラクションのパラダイムとは異なり、エージェント・アズ・インタービューアはエージェントを使用して、より広く深い知識のために知識ツールを呼び出す。エージェントのツールとして知識駆動型合成を利用する知識系動的評価フレームワークであるJiceAgentを開発した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:06:13 GMT)
RollPacker: Mitigating Long-Tail Rollouts for Fast, Synchronous RL Post-Training [19.0]
強化学習(Reinforcement Learning, RL)は、大規模言語モデル(LLM)の推論能力を高めるための重要なポストトレーニング手法である。多くのRLシステムは同期を緩和することでこの問題を緩和しようとするが、これは精度のトレーニングを損なう可能性がある。同期RLのための新しいロールアウトスケジューリング戦略であるtailを導入し,ロールアウトステップの小さなサブセット(ロングラウンド)に長いテール応答をもたらすプロンプトを体系的に統合する。 RollPackerは、veRLと比較して2.03x-2.56xのトレーニング時間を短縮し、Qwen2.5のRLHFuseよりも最大2.24倍のスピードアップを実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:13:22 GMT)
RJE: A Retrieval-Judgment-Exploration Framework for Efficient Knowledge Graph Question Answering with LLMs [18.9]
Retrieval-Judgment-Exploration (RJE)は、洗練された推論経路を検索し、その十分性を評価し、追加の証拠を条件付きで探索するフレームワークである。 RJE はエージェントベースの手法と比較して LLM 呼び出しとトークンの使用量を著しく削減し、大幅な効率改善をもたらす。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:56:18 GMT)
Scaling Laws are Redundancy Laws [18.9]
スケーリング法則は、冗長法則として正式に説明できることを示す。この研究は、スケーリング法則を有限サンプル冗長法則として初めて厳密な数学的説明を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:48:51 GMT)
d2: Improved Techniques for Training Reasoning Diffusion Language Models [18.8]
マスク拡散言語モデル(DLM)に適した推論フレームワークであるd2を導入する。我々のフレームワークの中心は、サンプリング軌道の確率を正確に推定するためにマスキングの特性に依存する新しいポリシー勾配アルゴリズムである。実験的に、d2はRLのみを使用した従来の拡散推論フレームワークよりも大幅に改善される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:40:36 GMT)
RLCracker: Exposing the Vulnerability of LLM Watermarks with Adaptive RL Attacks [18.8]
適応的強靭性半径(Adaptive robustness radius)は、適応的敵に対する透かし抵抗性を定量化する公式な計量である。 RLCrackerは強化学習(RL)に基づく適応攻撃であり,意味的忠実さを維持しながら透かしを消去する。その結果、適応攻撃は広範囲に効果があり、現在のウォーターマーク防御に根本的な脅威をもたらすことが確認された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:08:02 GMT)
Mammo-CLIP Dissect: A Framework for Analysing Mammography Concepts in Vision-Language Models [18.6]
Mammo-CLIP Dissectは、マンモグラフィーで訓練されたディープラーニングビジョンモデルを体系的に分離するための、最初の概念ベースの説明可能性フレームワークである。一般的な画像データセットで訓練されたDLビジョンモデルとマンモグラフィー固有のデータセットのコンセプト学習の違いについて検討する。マンモグラフィーデータで訓練されたモデルは,マンモグラフィーデータで訓練されていないモデルよりも臨床的に関連性のある概念を捉え,放射線科医とより緊密に一致していることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:47:27 GMT)
Bidirectional Intention Inference Enhances LLMs' Defense Against Multi-Turn Jailbreak Attacks [18.3]
ジェイルブレイク」攻撃は、安全アライメントメカニズムをバイパスする敵のプロンプトを悪用する。この課題に対処するために,Bi Intention Inference Defense (BIID)を提案する。 BIIDは、フォワード要求に基づく意図推論と後方応答に基づく意図の振り返りを統合する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:29:48 GMT)
Prompt Injection Attacks on LLM Generated Reviews of Scientific Publications [18.3]
本稿では,操作の実践性と技術的成功について考察する。システム評価では, LLM が生成する 2024 ICLR 論文の1k のレビューを用いて評価を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:26:58 GMT)
Real-Time Out-of-Distribution Failure Prevention via Multi-Modal Reasoning [18.3]
FORTRESSはロボットの安全性のための共同推論と計画のフレームワークである。セマンティックに安全なフォールバック戦略を生成し、安全クリティカルなOOD障害を防ぐ。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:51:50 GMT)
Hyperspectral Adapter for Semantic Segmentation with Vision Foundation Models [18.2]
ハイパースペクトルイメージング(HSI)は、多数の狭い波長帯にわたる密度のスペクトル測定とともに空間情報をキャプチャする。本アーキテクチャでは、スペクトル変換器とスペクトル対応空間先行モジュールを組み込んで、豊富な空間スペクトル特徴を抽出する。我々のアーキテクチャは、HSI入力を直接使用しながら、最先端のセマンティックセマンティックセマンティックセマンティクス性能を実現し、ビジョンベースとハイパースペクトルセマンティクスの両方のセマンティクス法より優れている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:37:47 GMT)
The role of synthetic data in Multilingual, Multi-cultural AI systems: Lessons from Indic Languages [18.1]
インドの13言語にまたがる950万のデータポイントからなる大規模合成命令追従データセットであるUpdeshを紹介した。自動メトリクスと人的アノテーションの両方を10k評価に取り入れた総合的な評価は、生成されたデータが高品質であることを示している。 Updeshでトレーニングされたモデルは、生成タスクにおいて一貫して大きな利益を達成し、多重選択スタイルのNLUタスクにおいて競争力を維持する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:13:00 GMT)
Learning Ising Models under Hard Constraints using One Sample [17.8]
逆温度パラメータ $beta$ of a $n$-dimensional truncated Ising model を単一サンプルを用いて推定する問題を考察する。グラフ $G = (V,E)$ with $n$ vertices が与えられたとき、truncated Ising Model は $n$-dimensional hypercube $-1,1n$ 上の確率分布であり、各構成 $mathbfsigma$ は truncation set $S subseteq -1,1n$ に置かれ、確率 $Pr(mathbfsigma) を持つ。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:42:19 GMT)
SeamCrafte: Enhancing Mesh Seam Generation for Artist UV Unwrapping via Reinforcement Learning [17.7]
我々は、ポイントエンコーダ入力に条件付き自己回帰GPTスタイルのシームジェネレータであるSeamCrafterを紹介する。 SeamCrafterは、従来のアプローチよりも歪みや断片化が著しく低いシームを生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:58:59 GMT)
Buffer-free Class-Incremental Learning with Out-of-Distribution Detection [17.7]
クラスインクリメンタルラーニング(CIL)は、オープンワールドシナリオにおいて大きな課題となる。本稿では,ポストホックOOD検出手法の詳細な解析を行い,メモリバッファの必要性を解消する可能性について検討する。このバッファフリー手法は,クラスインクリメンタル学習と未知サンプルの拒絶という両面において,バッファベースの手法と同等あるいは優れた性能が得られることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:21:01 GMT)
Examining the Prevalence and Dynamics of AI-Generated Media in Art Subreddits [17.7]
Dall-Eのような生成AIモデルは、誰でも魅力的なビジュアルアートを作れるようにした。オンラインコミュニティでは、AIGCの導入が社会力学に影響を及ぼす可能性がある。 AIGCがRedditのアート関連コミュニティに与える影響について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:56:11 GMT)
Interpreting ResNet-based CLIP via Neuron-Attention Decomposition [17.7]
本稿では,CLIP-ResNetのニューロンを個別の計算経路に分解して解釈する手法を提案する。これらのニューロンヘッドペアは、CLIP-ResNetのイメージテキスト埋め込み空間において、単一の方向で近似できる。トレーニング不要なセマンティックセマンティックセグメンテーションでは,CLIP-ResNetの従来の手法よりも優れている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:27:10 GMT)
EvoMail: Self-Evolving Cognitive Agents for Adaptive Spam and Phishing Email Defense [17.6]
スパムやフィッシングの堅牢な検出のための自己進化型認知エージェントフレームワークであるEvoMailを提案する。 LLM(Large Language Model)によって強化された認知グラフニューラルネットワークは、調整されたスパムキャンペーンを特定するためにソース間でコンテキスト認識推論を実行する。 EvoMailは、検出精度、スパム戦術の進化への適応性、推論の解釈性において、最先端のベースラインを一貫して上回る。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:19:59 GMT)
A Preprocessing Framework for Efficient Approximate Bi-Objective Shortest-Path Computation in the Presence of Correlated Objectives [17.6]
本研究は,両目的性短絡(BOSP)問題と相関する目的が存在することを考察する。 BOSPは、探索空間のサイズが目的関数の数とグラフサイズで指数関数的であるため、一般に計算的に困難である。相関対象が存在する場合の探索労力を削減できる効率的なアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:40:30 GMT)
PhyMAGIC: Physical Motion-Aware Generative Inference with Confidence-guided LLM [17.6]
一つの画像から物理的に一貫した動きを生成するトレーニング不要のフレームワークであるPhyMAGICを提案する。 PhyMAGICは、事前訓練された画像間拡散モデル、LDMによる信頼誘導推論、微分可能な物理シミュレータを統合する。総合的な実験により、PhyMAGICは最先端のビデオジェネレータや物理対応のベースラインより優れていることが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:17:16 GMT)
HiSin: A Sinogram-Aware Framework for Efficient High-Resolution Inpainting [17.5]
CT再建には高分解能シングラムの塗布が不可欠である。そこで我々は,高効率な音像インペイントのための新しい拡散型フレームワークであるHiSinを提案する。 HiSinはピークメモリ使用量を最大30.81%削減し、推論時間を最大17.58%削減する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:35:48 GMT)
MASS: Muli-agent simulation scaling for portfolio construction [17.4]
本稿では,マルチエージェント・スケーリング・シミュレーション(MASS)を紹介する。 MASSの中核は、不均一なエージェントの最適分布を動的に学習するために、後方最適化プロセスを採用する。エージェントの数が指数関数的に増加するにつれて(最大512まで)、集約された決定は徐々に過剰なリターンを増大させる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:52:25 GMT)
Spectral Graph Neural Networks are Incomplete on Graphs with a Simple Spectrum [17.3]
スペクトル機能は、その表現力を改善するために、グラフニューラルネットワーク(GNN)に広く組み込まれている。簡単なスペクトルグラフ上でSGNNの表現性を向上する手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:10:11 GMT)
NewtonGen: Physics-Consistent and Controllable Text-to-Video Generation via Neural Newtonian Dynamics [17.1]
我々は、データ駆動合成と学習可能な物理原理を統合するフレームワークであるNewtonGenを提案する。コアにはトレーニング可能なニューラルニュートンダイナミクス(NND)があり、様々なニュートン運動をモデル化し予測することができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:25:33 GMT)
Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks [17.1]
現在、Mixture-of-Experts (MoE)モデルは最先端システムでは標準となっている。記憶能力と推論能力の2つの異なる能力体制にMoEがどのような影響を及ぼすかを検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:09:33 GMT)
FURINA: Free from Unmergeable Router via LINear Aggregation of mixed experts [17.1]
パラメータ効率の良い微調整のために,Mixture of Experts (MoE) をローランド適応 (LoRA) に統合することに成功している。既存のMoE-LoRA手法の鍵となる制限は、離散ルータに依存することである。我々は,LINear Aggregation of expertsに基づく,フリー・アグリゲーション・オブ・アンマージブル・ルータ・フレームワークであるFURINAを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:54:34 GMT)
LLM Output Homogenization is Task Dependent [17.0]
本稿では,8つのタスクカテゴリから構成されるタスク分類について述べる。そこで本研究では,同種化を希望する場所で保存しながら,機能的多様性を高めるタスクアンカレッドサンプリング手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:58:07 GMT)
Can AI Perceive Physical Danger and Intervene? [16.8]
AIが物理的な世界と対話するとき、新しい安全上の課題が生まれる。最先端のファンデーションモデルは、物理的な安全性に関する常識的な事実をどの程度理解していますか?
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:09:17 GMT)
On Theoretical Interpretations of Concept-Based In-Context Learning [16.8]
In-Context Learning (ICL)は、自然言語処理と大規模言語モデル(LLM)アプリケーションにおいて重要な新しいパラダイムとして登場した。本稿では,概念ベースICL (CB-ICL) と呼ばれる,特定のICLアプローチについて検討することを目的とする。特に,CB-ICL を ICL タスクに適用するための理論的解析法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:11:09 GMT)
SoM-1K: A Thousand-Problem Benchmark Dataset for Strength of Materials [16.8]
材料強度の問題に関する基礎モデルを評価するための,最初の大規模マルチモーダルベンチマークデータセットであるSoM-1Kを紹介する。この研究は、エンジニアリングAIのための厳格なベンチマークを確立し、より堅牢なマルチモーダル推論機能を開発するための重要なニーズを強調している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:28:22 GMT)
Enabling Approximate Joint Sampling in Diffusion LMs [16.7]
マスケ拡散言語モデルでは、トークンを順に、そして潜在的に並列にアンマキングすることでテキストを生成する。本稿では,1つのフルモデルフォワードパスにおいて,関節分布からの複数のトークンのサンプルをエミュレートする方法を考案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:23:26 GMT)
Matched-Pair Experimental Design with Active Learning [16.4]
本稿では,高治療効果領域の患者を順次登録するマッチングペア実験設計を提案する。対象領域を分類問題として同定し,マッチングペア設計に適した能動的学習フレームワークを提案する。我々の設計は治療効果を検出するための実験コストを低減させるだけでなく、特定された領域が高処理効果領域全体を囲んでいることを保証します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:14:15 GMT)
Redefining Neural Operators in $d+1$ Dimensions [16.4]
我々は、Schr"オーディンジェライゼーション法に基づいて、新しい$d+1$次元領域上でニューラル作用素を再定義する。このフレームワーク内では、$d+1$の次元展開と整合したSchr"odingerized Kernel Neural Operator (SKNO)を実装している。実験では、SKNO における $d+1$ 次元の進化的設計は、他のベースラインよりも一貫して優れている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:19:53 GMT)
ToMPO: Training LLM Strategic Decision Making from a Multi-Agent Perspective [16.3]
大規模言語モデル(LLM)は複雑なシナリオでの意思決定に使われてきた。本稿では,他の個別戦略の認識とゲーム状況の傾向を最適化するToMPOアルゴリズムを提案する。 ToMPOアルゴリズムは、モデル出力のコンプライアンスと協調的な結果の点でGRPO法を35%上回る。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:25:15 GMT)
CAD-Tokenizer: Towards Text-based CAD Prototyping via Modality-Specific Tokenization [16.3]
CAD-Tokenizerは、プリミティブレベルプーリングと制約付きデコードを備えたシーケンスベースのVQ-VAEを用いて、モダリティ固有のトークンでCADデータを表現している。この設計はCADの構造的性質に沿ったコンパクトでプリミティブな表現を生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:38:36 GMT)
Understanding Mode Switching in Human-AI Collaboration: Behavioral Insights and Predictive Modeling [16.2]
本研究では,シーケンシャルな意思決定作業において,ユーザが高レベルの制御と低レベルの制御を動的に切り替える方法について検討する。我々は8人の参加者から400以上のモデムスイッチング決定を収集し、視線、感情状態、サブタスクの難易度データを収集した。我々は制御レベルスイッチを予測する軽量モデルを訓練する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:58:46 GMT)
RL of Thoughts: Navigating LLM Reasoning with Inference-time Reinforcement Learning [16.1]
我々は、推論時間における推論を適応的に強化するために、強化学習(RL)を用いた軽量ナビゲータモデルを訓練する。 RLナビゲータは3Kパラメータ未満で、100BスケールのLLMに匹敵するサブ10BのLLMを作ることができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:00:05 GMT)
SimDiff: Simulator-constrained Diffusion Model for Physically Plausible Motion Generation [16.1]
既存のアプローチでは、しばしば物理的妥当性を強制するために拡散過程にシミュレータベースのモーションプロジェクション層が組み込まれている。シミュレータに基づく動き予測はガイダンスの形式として解釈可能であることを示す。環境パラメータを直接デノナイジングプロセスに統合するシミュレータ制約拡散モデルであるSimDiffを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:13:35 GMT)
Pure Vision Language Action (VLA) Models: A Comprehensive Survey [16.0]
ビジョン言語アクション(VLA)モデルの出現は、従来のポリシーベースの制御から一般化されたロボット工学へのパラダイムシフトを表している。この調査は、明確な分類学と既存の研究の体系的、包括的レビューを提供することを目的として、先進的なVLA手法を探求する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:59:28 GMT)
SCRA-VQA: Summarized Caption-Rerank for Augmented Large Language Models in Visual Question Answering [16.0]
我々は、SCRA-VQA(Summarized Caption-Rerank Augmented VQA)を提案する。 SCRA-VQAは、イメージをキャプションに変換するために、事前訓練された視覚言語モデルを使用している。キャプションの文脈的な例を生成し、同時にそれらを要約して並べ替え、無関係な情報を除外する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:01:28 GMT)
SuperCoder: Assembly Program Superoptimization with Large Language Models [15.9]
超最適化は、プログラムをより高速なプログラムに変換し、入力・出力動作を保存するタスクである。我々は,大規模言語モデル (LLM) がスーパーオプティマイザとして機能し,すでに業界標準コンパイラによって最適化されているコードより優れているアセンブリプログラムを生成することを検討した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:58:56 GMT)
A Unified Framework for Diffusion Model Unlearning with f-Divergence [15.8]
テキスト・トゥ・イメージ(T2I)モデルの学習方法は、ターゲットの出力分布とアンカーの概念の間の平均2乗誤差(MSE)を最小化することに依存することが多い。この MSE ベースのアプローチは,$f$-divergence-based framework の特別な場合であり,$f$-divergence を利用できることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:51:04 GMT)
TRiCo: Triadic Game-Theoretic Co-Training for Robust Semi-Supervised Learning [15.6]
TRiCoは、半教師付き学習の構造を再考する、三進的ゲーム理論の共同学習フレームワークである。既存のSSLフレームワークにおける重要な制限に対処することによって、TRiCoは原則付き、一般化可能なソリューションを提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:10:41 GMT)
Finding 3D Positions of Distant Objects from Noisy Camera Movement and Semantic Segmentation Sequences [15.4]
カメラの一連の測定に基づく3Dオブジェクトのローカライゼーションは、ドローンベースの山火事監視のような安全クリティカルな監視タスクに不可欠である。本稿では,単一目的シナリオと複数目標シナリオの両方に対して,粒子フィルタを用いてタスクを解くことができることを示す。本手法は,グローバルナビゲーション衛星システム(GNSS)を用いた3次元シミュレーションと,ドローンによる画像分割シーケンスを用いて検討した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:46:37 GMT)
Query-Centric Graph Retrieval Augmented Generation [15.4]
QCG-RAGはクエリ中心のグラフRAGフレームワークで、クエリ粒度インデックスとマルチホップチャンク検索を可能にする。 LiHuaWorldとMultiHop-RAGの実験では、QCG-RAGは問合せ精度において、チャンクベースおよびグラフベースのRAG法よりも一貫して優れていた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:35:44 GMT)
Tensor State Space-based Dynamic Multilayer Network Modeling [15.4]
既存のモデルは、しばしばそのようなネットワークの時間的および層間ダイナミクスを捉えるのに失敗する。本稿では、潜在空間モデルフレームワークを利用した動的多層ネットワークのための新しい状態空間モデル(TSSDMN)を提案する。数値シミュレーションとケーススタディにより,動的多層ネットワーク理解における TSSDMN の有効性が実証された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:11:51 GMT)
Why and When Deep is Better than Shallow: An Implementation-Agnostic State-Transition View of Depth Supremacy [15.3]
一般距離空間上で作用する抽象的状態遷移半群として深部モデルを定式化する。我々は、実装(例えば、ReLUネット、トランスフォーマー、チェーンオブ思想)を抽象状態遷移から分離する。差分は抽象的な深さ-$k$ネットワークにのみ依存し、実装には依存しないバイアス-分散分解を証明している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:55:56 GMT)
EpiCache: Episodic KV Cache Management for Long Conversational Question Answering [15.3]
長時間会話型質問応答のためのトレーニング不要なKVキャッシュ管理フレームワークであるEpiCacheを紹介した。 EpiCacheはブロックワイズプリフィルを通じてキャッシュの成長を制限し、エピソードKV圧縮を通じてトピック関連コンテキストを保存する。 3つのLongConvQAベンチマークで、EpiCacheは最近のベースラインよりも40%の精度向上を実現し、4-6倍の圧縮でほぼフルなKVの精度を維持し、レイテンシとメモリを最大2.4倍と3.5倍に削減した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:24:14 GMT)
Enhancing Molecular Property Prediction with Knowledge from Large Language Models [15.3]
本研究では,大規模言語モデルから抽出した知識を,事前学習された分子モデルから抽出した構造的特徴と統合し,分子特性の予測を強化する新しいフレームワークを提案する。分子ベクター化のためのドメイン関連知識と実行可能コードの両方を生成し,その後構造表現に融合した知識ベースの特徴を生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:48:54 GMT)
A Generalized $χ_n$-Function [15.2]
一般化写像 $chi_n, m$ by $y=chi_n, m(x)$ with $y_i=x_i+x_i+m (x_i+m-1+1)(x_i+m-2+1) cdots (x_i+m-1+1)(x_i+m-1+1) cdots (x_i+m-1+1) cdots (x_i+m-1+1) cdots (x_i+m-1+1)
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:10:02 GMT)
The Unanticipated Asymmetry Between Perceptual Optimization and Assessment [15.1]
画像品質評価(IQA)に優れる忠実度指標は知覚的最適化に必ずしも有効ではないことを示す。また、識別器設計は、バニラやトランスフォーマーベースの代替品よりも、より忠実な詳細な再構築を提供するパッチレベルおよび畳み込みアーキテクチャによって、最適化を形作る上で決定的な役割を担っていることも示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:08:26 GMT)
ArtUV: Artist-style UV Unwrapping [15.1]
我々はArtUVを紹介した。ArtUVは完全に自動化され、アーティストスタイルのUVアンラッピングを生成するエンド・ツー・エンドの手法である。プロのUVマッピングプロセスを,表面シーム予測とアーティストスタイルのUVパラメータ化の2段階に分割してシミュレートする。提案手法は, 意味的一貫性を確保し, トポロジ的構造を保ちながら, 2次元編集が可能なUVマップを作成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:21:21 GMT)
Autoregressive End-to-End Planning with Time-Invariant Spatial Alignment and Multi-Objective Policy Refinement [15.0]
自動回帰モデルは、自動運転におけるエンドツーエンドの計画のための、強烈なベースラインである。彼らのパフォーマンスは、過去の知覚データに将来の行動を条件にする必要があるため、時間的ミスアライメントによって制約される。本稿では,初期環境特徴を一貫したエゴ中心のフレームに投影する時間不変アライメント(TISA)モジュールを提案する。また、DPO(Direct Preference Optimization)を用いた多目的ポストトレーニングのステージを導入し、純粋な模倣を克服する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:24:45 GMT)
The Causal Abstraction Network: Theory and Learning [15.0]
因果的人工知能は、構造因果モデル(SCM)を活用することにより、AIの説明可能性、堅牢性、信頼性を高めることを目的としている。近年の進歩は因果知識のネットワーク層を形式化している。因果抽象ネットワーク (CAN) は, (i) がガウスであり, (ii) 写像が構成的線形抽象の転置であるようなせん断の具体例である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:48:25 GMT)
SGMem: Sentence Graph Memory for Long-Term Conversational Agents [14.9]
チャンク単位内の文レベルグラフとして対話を表現するSGMem(Sentence Graph Memory)を紹介する。 SGMem は, 長期会話型質問応答において, 精度を向上し, 高いベースラインを向上することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:21:44 GMT)
MCGrad: Multicalibration at Web Scale [14.8]
マルチキャリブレーションは、機械学習ベースのシステムの性能にとって重要な特性である。我々は,新しいスケーラブルなマルチキャリブレーションアルゴリズム MCGrad を提案する。 MCGradは保護されたグループの明示的な仕様を必要とせず、スケーラブルであり、しばしばそれらを傷つけることなく、他のML評価指標を改善する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:01:16 GMT)
SuperOffload: Unleashing the Power of Large-Scale LLM Training on Superchips [14.6]
Superchipsは、GPUとCPUを同じパッケージに統合する、密結合のヘテロジニアスアーキテクチャを採用している。 Hopper GPU, Grace CPU, NVLink-C2Cを併用したスーパーチップ中心のオフロードシステムであるSuperOffloadを提案する。 NVIDIA GH200上でのSuperOffloadの評価は、最先端のオフロードベースシステムと比較して最大2.5倍のスループット向上を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:00:16 GMT)
Limitations on Safe, Trusted, Artificial General Intelligence [14.4]
安全、信頼、人工知能(Artificial General Intelligence、AGI)は、人工知能(AI)システムにおける野心的な目標である。安全・信頼・AGIの厳密な数学的定義を提案する。プログラム検証、計画、およびグラフ到達性に関する結果を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:16:38 GMT)
SDPO: Importance-Sampled Direct Preference Optimization for Stable Diffusion Training [14.4]
逆拡散過程と前方拡散過程のミスマッチに起因する時間ステップ依存性不安定性について検討した。 DPO-C&Mは,不定形タイムステップの切り抜きとマスキングにより安定性を向上させる実用戦略である。次に、政治外バイアスを完全に補正する目的に重要サンプリングを組み込んだ、原則化されたフレームワークであるSDPOを紹介します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:07:51 GMT)
Lost in Latent Space: An Empirical Study of Latent Diffusion Models for Physics Emulation [14.4]
動的システムのエミュレーションに同様の戦略を効果的に適用できるかどうかを検討する。遅延空間エミュレーションの精度は、広範囲の圧縮速度に対して驚くほど堅牢であることがわかった。また,拡散型エミュレータは非生成的エミュレータよりも一貫して精度が高いことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:05:46 GMT)
Marching Neurons: Accurate Surface Extraction for Neural Implicit Shapes [14.4]
ニューラル暗黙関数から表面を解析的に抽出する新しい手法を提案する。我々の方法は並列に動作し、大きなニューラルアーキテクチャをナビゲートできる。結果として得られるメッシュは、アドホックな空間的離散化なしに、ネットワークから全幾何学情報を忠実にキャプチャする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:06:42 GMT)
CoT-Space: A Theoretical Framework for Internal Slow-Thinking via Reinforcement Learning [14.3]
CoT-Spaceは、離散トークン予測タスクから連続的、推論レベルのセマンティック空間内の最適化プロセスへの推論を、LLM(Large Language Models)に再キャストする新しい理論フレームワークである。最適CoT長への収束は、不適合と過適合の基本的なトレードオフの自然な結果であることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:48:38 GMT)
DiaMoE-TTS: A Unified IPA-Based Dialect TTS Framework with Mixture-of-Experts and Parameter-Efficient Zero-Shot Adaptation [14.2]
音声表現を標準化し,グラファイムと音素のあいまいさを解消する統合IPAベースのフレームワークであるDiaMoE-TTSを提案する。大規模またはプロプライエタリなリソースに依存するアプローチとは異なり、DiaMoE-TTSはスケーラブルでオープンデータ駆動の合成を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:02:04 GMT)
Personalized Federated Dictionary Learning for Modeling Heterogeneity in Multi-site fMRI Data [14.2]
PFedDLは各サイトで独立した辞書学習を行い、各サイト固有の辞書を共有グローバルコンポーネントとパーソナライズされたローカルコンポーネントに分解する。 ABIDEデータセットの実験は、PFedDLが既存の手法よりも精度と堅牢性で、非IIDデータセットよりも優れていることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:01:02 GMT)
A Meta-Analysis of LLM Effects on Students across Qualification, Socialisation, and Subjectification [14.2]
大規模言語モデル(LLM)は、教育のソリューションとしてますます位置づけられているが、評価は、パフォーマンス指標の狭さに対する影響を減少させることが多い。この記事では,“LLMが教育にどのような影響を与えるべきか? 133の実験と準実験のメタ分析(k = 188)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:11:19 GMT)
Parallel Thinking, Sequential Answering: Bridging NAR and AR for Efficient Reasoning [14.2]
我々は,自己回帰(AR)と非自己回帰(NAR)言語モデルを統合するフレームワークを通じて推論タスクを研究する。テキストを逐次生成するARモデルは、一貫性のある出力を生成するのに優れるが、しばしば遅い推論に悩まされる。我々は、NARモデルが中間的推論トレースを効率よく生成する新しいパラダイムを導入し、その結果、ARモデルが正確な最終回答を提供するように誘導する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:50:11 GMT)
Distilling Many-Shot In-Context Learning into a Cheat Sheet [14.1]
提案手法は,マルチショットICLからの情報を,推論時にコンテキストとして使用する簡潔なテキスト要約(チートシート)に蒸留するチートシートICLを提案する。難解な推論タスクの実験では、不正なシークレットICLは、トークンがはるかに少ない多くのショットICLと同等または優れたパフォーマンスを達成し、テスト時間検索を必要とせずに検索ベースのICCと一致している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:07:46 GMT)
Combinatorial Creativity: A New Frontier in Generalization Abilities [14.1]
大規模言語モデル(LLM)における創造性のスケーリング挙動について検討する。固定的な計算予算では、創造力に最適なモデル深さが存在することが分かりました。アイデアと実行のギャップは、クリエイティビティアルゴリズムのより基本的な新規ユーティリティのトレードオフ特性によって説明できる可能性がある。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:48:37 GMT)
Emergent Inductance from Chiral Orbital Currents in a Bulk Ferrimagnet [14.1]
バルクフェライトMn3Si2Te6における新しいインダクタンスの発見を報告する。我々は、COCドメインの1次再構成から得られたミリエンリスケールまでの巨大な帰納的応答を明らかにする。この創発的インダクタンス(英語版)は古典的なモデルに反し、超伝導や工学的なナノ構造を伴わずに発生し、軌道ベースの量子機能とデバイス概念の新たなフロンティアを開く。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:59:52 GMT)
Does the Manipulation Process Matter? RITA: Reasoning Composite Image Manipulations via Reversely-Ordered Incremental-Transition Autoregression [13.9]
我々は、条件付きシーケンス予測タスクとして画像操作のローカライゼーションを再構成し、RITAフレームワークを提案する。 RITAは、各ステップの予測を次のステップの条件として、操作された領域を順番に階層的に予測する。トレーニングと評価を可能にするため,マルチステップ操作データを合成し,新しいベンチマークHSIMを構築する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:49:11 GMT)
DATS: Distance-Aware Temperature Scaling for Calibrated Class-Incremental Learning [13.9]
連続学習(CL)は、新しいクラスの連続から1つのモデルを漸進的に学習できる能力に注目が集まっている。安全クリティカルなアプリケーションでは、予測モデルは、その不確実性(すなわち、ターゲットイベントの真の頻度に一致した信頼スコア)を確実に伝達することができる。本研究では,プロトタイプに基づく距離推定と距離認識キャリブレーションを組み合わせた距離認識温度スケーリング(DATS)を提案し,タスク近接を推定し,先行タスク情報なしで適応温度を割り当てる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:46:56 GMT)
Automated Visual Attention Detection using Mobile Eye Tracking in Behavioral Classroom Studies [13.9]
教師がどの学生に焦点をあてているかを認識するために、手動で最小限のアノテートデータを必要とする自動処理パイプラインの概念を提案する。我々は、最先端の顔検出モデルと顔認識機能埋め込みを利用して、教室環境における伝達学習を伴う顔認識モデルを訓練する。本手法では,手動で注釈付けした大量のデータを必要としないため,教師の視覚的注意を非侵襲的に扱える。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:41:50 GMT)
Odo: Depth-Guided Diffusion for Identity-Preserving Body Reshaping [13.9]
本研究では1523名の被験者を対象とした18,573枚の画像の大規模なデータセットについて紹介する。簡単な意味的属性によって導かれる現実的で直感的な身体再構成を可能にする,エンドツーエンドの拡散に基づく手法であるOdoを提案する。提案手法は,入力画像から微細な外観や背景の詳細を保存した凍結UNetと,SMPL深度マップを用いた形状変換を誘導するコントロールネットを組み合わせる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:05:11 GMT)
Probability Distribution Collapse: A Critical Bottleneck to Compact Unsupervised Neural Grammar Induction [13.8]
教師なしニューラル文法誘導は言語データから解釈可能な階層構造を学習することを目的としている。既存のモデルはボトルネックに直面しており、多くの場合、不要に大きいが、性能の低い文法となる。我々は、ニューラルネットワークのパラメータ化の鍵となるコンポーネント間で崩壊がいつ、どのように起こるかを分析し、ターゲットとするソリューションを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:31:14 GMT)
MMPlanner: Zero-Shot Multimodal Procedural Planning with Chain-of-Thought Object State Reasoning [13.7]
マルチモーダル手続き計画(MPP)は、テキストと画像を組み合わせたステップバイステップの指示を生成することを目的としている。ゼロショットMPPフレームワークであるMMPlannerについて述べる。 MMPlannerは最先端のパフォーマンスを実現し、テキストプランニングを+6.8%改善し、クロスモーダルアライメントを+11.9%改善し、ビジュアルステップオーダを+26.7%改善した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:31:19 GMT)
Constructions are Revealed in Word Distributions [13.7]
構成文法は、言語の経験を通じて、構成または形式的意味のペアリングが取得される。この分布には、実際にどの程度の情報が含まれていますか? この分布のプロキシとしてRoBERTaモデルを使用し、統計親和性のパターンとして構造が明らかになるという仮説を立てる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:18:30 GMT)
Neurodynamics-Driven Coupled Neural P Systems for Multi-Focus Image Fusion [13.7]
マルチフォーカス画像融合(MFIF)は画像処理において重要な技術である。ブラックボックス機構を用いたルールや深層学習に基づく従来の手法では,高品質な意思決定マップを生成することは困難である。スパイキング機構にインスパイアされた第3世代ニューラルモデルである神経力学駆動型結合型ニューラルP(CNP)システムを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:08:19 GMT)
Neuroprobe: Evaluating Intracranial Brain Responses to Naturalistic Stimuli [13.5]
高解像度のニューラルデータセットは、次世代の脳-コンピュータインタフェースと神経学的治療の基礎モデルを可能にする。 Neuroprobeは、脳内のマルチモーダル言語処理を研究するためのデコードタスクのスイートである。 NeuroprobeはBrainTreebankのデータセット上に構築されており、10人の被験者から40時間のiEEG録音が自然主義映画視聴タスクを実行している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:38:53 GMT)
Explaining Fine Tuned LLMs via Counterfactuals A Knowledge Graph Driven Framework [13.5]
Low-Rank Adaptation (LoRA)は、大きな言語モデルでドメイン固有の知識を驚くほど効率よく取得することを可能にする。本研究は,知識グラフを基盤としたファクトファクトを介し,微調整 LLM を記述した新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:37:40 GMT)
Evaluating the Evaluators: Metrics for Compositional Text-to-Image Generation [13.5]
本稿では,コンポジションテキスト画像評価に広く用いられている指標について検討する。我々の分析は単純な相関を超越し、様々な構成課題にまたがってそれらの振る舞いを調べる。結果は、1つのメトリクスがタスク間で一貫した実行をしないことを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:31:09 GMT)
MobiLLM: An Agentic AI Framework for Closed-Loop Threat Mitigation in 6G Open RANs [13.5]
6G O-RAN環境における完全自動化されたエンドツーエンドの脅威軽減のためのエージェントAIフレームワークを提案する。 MobiLLMは,大規模言語モデルを利用したモジュール型マルチエージェントシステムを通じて,セキュリティをオーケストレーションする。最初の評価は、MobiLLMが複雑な緩和戦略を効果的に識別し、編成できることを示していた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:49:43 GMT)
Constrained Decoding for Robotics Foundation Models [13.4]
ロボット基礎モデルの開発における最近の進歩は、ロボットシステムにおけるエンド・ツー・エンドおよび汎用能力の有望な発展につながっている。これらのモデルは、ロボット軌道の膨大なデータセットに基づいて事前訓練され、マルチモーダル入力を処理し、システムが実際の世界で実行する一連のアクションを直接出力する。本稿では,動的システムにおける動作軌跡の論理的制約を強制する,ロボット基礎モデルのための制約付き復号化フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:15:37 GMT)
ParallelTime: Dynamically Weighting the Balance of Short- and Long-Term Temporal Dependencies [13.4]
自然言語処理では、短期依存関係をキャプチャするローカルウィンドウアテンションと、長期依存関係をキャプチャするMambaを組み合わせたアプローチが使用されている。時系列予測タスクでは,長期的および短期的依存関係に等しい重みを割り当てるのが最適ではないことがわかった。本稿では,長期および短期の依存関係に対する相互依存重みを算出する動的重み付け機構であるParallelTime Weighterを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:52:23 GMT)
Expert-guided Clinical Text Augmentation via Query-Based Model Collaboration [13.3]
大規模言語モデル(LLM)はこの目的のために強力な生成能力を示している。医療などのハイテイク分野における彼らの応用は、臨床的に誤った情報や誤解を招くリスクがあるため、ユニークな課題を呈している。本稿では、エキスパートレベルのドメイン知識を統合して拡張プロセスをガイドする、新しいクエリベースのモデルコラボレーションフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:18:39 GMT)
Understanding and Enhancing Mask-Based Pretraining towards Universal Representations [13.3]
マスクをベースとした事前訓練は、言語、視覚、生物学にまたがる近代的な大規模モデルの基盤となっている。マスクによる事前学習の動作は,高次元最小ノルム(リッジレス)線形回帰におけるテストリスクによって直接的に特徴付けられることを示す。我々はRandomly Random Mask Auto (R$2$MAE)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:08:25 GMT)
Energy based diffusion generator for efficient sampling of Boltzmann distributions [13.3]
エネルギーベース拡散発生器(EDG)は、変分オートエンコーダと拡散モデルからアイデアを統合する新しいアプローチである。 EDGはシミュレーションなしで、訓練中に通常の方程式や微分方程式を解く必要がなくなる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:03:11 GMT)
InvBench: Can LLMs Accelerate Program Verification with Invariant Synthesis? [13.2]
不変合成におけるLCMの評価のための原理的フレームワークを提案する。提案手法は,形式的な音質保証を備えた検証器に基づく決定手順を用いる。我々は,従来の解法UAutomizerに対して,最先端のLLMと既存のLLMベースの検証器を7つ評価した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:47:02 GMT)
Semantic Reformulation Entropy for Robust Hallucination Detection in QA Tasks [13.2]
既存のエントロピーに基づくセマンティックレベルの不確実性推定法は,可変長解のサンプリングノイズと不安定クラスタリングによって制限される。本稿では2つの方法で不確実性評価を改善するセマンティック・リフォーム・エントロピー(SRE)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:28:29 GMT)
ControlHair: Physically-based Video Diffusion for Controllable Dynamic Hair Rendering [13.2]
物理シミュレータと条件付きビデオ拡散を統合し,動的ヘアレンダリングを可能にするハイブリッドフレームワークであるControlHairを提案する。 ControlHairは3段階のパイプラインを採用しており、まずシミュレータを使って物理パラメータをフレーム単位の幾何学にエンコードし、次にフレーム単位の制御信号を抽出し、最後に制御信号をビデオ拡散モデルに供給して、所望のヘアダイナミックスでビデオを生成する。 10Kのビデオデータセットに基づいてトレーニングされたControlHairは、テキストとポーズ条件のベースラインを上回り、正確に制御されたヘアダイナミックスを提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:29:05 GMT)
No Prior, No Leakage: Revisiting Reconstruction Attacks in Trained Neural Networks [13.1]
ニューラルネットワークによるトレーニングデータにより、プライバシとセキュリティに対する懸念が高まっている。近年の研究では, ある条件下では, モデルパラメータから直接トレーニングセットの一部を再構築できることが示されている。既存の再建手法の弱点と限界を分析し,失敗する条件を同定する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:14:08 GMT)
Guiding Audio Editing with Audio Language Model [13.1]
本稿では,ステレオ音声編集のための新しいフレームワークであるSmartDJを紹介する。高レベルの命令が与えられたら、SmartDJはそれを一連のアトミックな編集操作に分解する。これらの操作はステレオオーディオを操作するために訓練された拡散モデルによって実行される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:43:45 GMT)
FantasyWorld: Geometry-Consistent World Modeling via Unified Video and 3D Prediction [13.1]
本稿では,FantasyWorldについて紹介する。FantasyWorldは,凍結動画基盤モデルをトレーニング可能な幾何学的ブランチで拡張する幾何学的拡張フレームワークである。提案手法は,3次元予測を正規化するためのガイド映像生成とビデオ優先の手法であるクロスブランチ・インフォメーションを導入する。実験により、FantasyWorldは映像の想像力と3D知覚を効果的に橋渡しし、近年の多視点コヒーレンスとスタイル整合性において、幾何学的に一貫性のあるベースラインを上回っていることが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:24:23 GMT)
CLaw: Benchmarking Chinese Legal Knowledge in Large Language Models - A Fine-grained Corpus and Reasoning Analysis [13.1]
大規模言語モデル (LLM) は、法的テキストを分析し、関連する法令を引用するタスクが増えている。本稿では,中国法学におけるLLMの厳密な評価と推論への応用を目的とした新しいベンチマークであるCLawを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:19:51 GMT)
Breaking the curse of dimensionality for linear rules: optimal predictors over the ellipsoid [13.1]
我々は,次元の増大に伴う統計的学習境界の劣化を防止するために,どのような最小構造仮定が必要かを検討する。分析では, リスクに対する2つの基本的な寄与を取り上げている: (a) データの内在的次元を捉える分散のような用語, (b) ノイズレス誤差(高次元構造において特に発生する用語)。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:54:37 GMT)
Reinforcement Learning Fine-Tuning Enhances Activation Intensity and Diversity in the Internal Circuitry of LLMs [13.0]
大規模言語モデル(LLM)は、大規模な事前学習を通じて広範囲の事前知識を取得し、教師付き微調整(SFT)や強化学習(RL)ベースの後訓練によってさらに強化することができる。 RL微細調整は、SFT単独で達成した以上のLLMの能力を向上することを示す証拠が増えている。しかし、RL微調整が固有の特性の異なる様々なLLMの能力を高めるメカニズムは未解明のままである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:51:05 GMT)
LOGen: Toward Lidar Object Generation by Point Diffusion [13.0]
我々は、LiDARスキャンで見るように、3Dオブジェクトを生成するモデルを必要とする、LiDARオブジェクト生成の課題について考察する。本稿では,LDAR 点雲を生成するための拡散モデルを提案する。 nuScenes と KITTI-360 を用いた実験により,LiDAR オブジェクトに適合する新しい3次元計測値が得られた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:08:54 GMT)
Bridging Arbitrary and Tree Metrics via Differentiable Gromov Hyperbolicity [12.9]
任意の計量空間が与えられると、ツリー計量からの偏差はグロモフの$delta$-hyperbolicityによって定量化できる。本稿では,差分最適化フレームワーク DeltaZero を導入し,この問題を解決する。我々の手法は一貫して最先端の歪みを実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:47:40 GMT)
Distributed quantum algorithm for divergence estimation and beyond [12.9]
本稿では,$rm Tr(f(A)g(B))$を付加誤差$varepsilon$内で計算する分散量子アルゴリズムフレームワークを提案する。このフレームワークは、様々な分散量子コンピューティングタスクに適用可能である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:20:44 GMT)
Decipher-MR: A Vision-Language Foundation Model for 3D MRI Representations [12.8]
Decipher-MRは、大規模なデータセットに基づいて訓練された3次元MRI固有の視覚言語基盤モデルである。 Decipher-MRは、自己指導型視覚学習とレポート誘導型テキスト監視を統合し、堅牢で一般化可能な表現を構築する。以上の結果から,Decipher-MRはMRIベースのAIのスケーラブルで汎用的な基盤として確立され,臨床および研究領域における効率的な開発が促進される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:43:33 GMT)
Extracting Conceptual Knowledge to Locate Software Issues [12.7]
RepoLensは、コードリポジトリの概念的知識を抽象化し、活用する新しいアプローチである。概念知識をリポジトリ全体の知識ベースに抽出するオフラインステージと、問題固有の用語を検索するオンラインステージである。 RepoLensは3つの最先端ツールを継続的に改善し、Hit@kでは平均22%、ファイルレベルのローカライゼーションではRecall@kでは46%を達成している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:53:06 GMT)
AI-Enabled Crater-Based Navigation for Lunar Mapping [12.6]
クレーターベースのナビゲーション(CBN)は、画像上で観測された月のユビキタス衝突クレーターを自然のランドマークとして使用し、宇宙船の6度の自由なポーズを決定する。 STELLAは、長期の月面マッピングのための最初のエンドツーエンドCBNパイプラインである。 STELLAを厳格にテストするために、私たちはCRESENT-365という1年間の月面マッピングミッションをエミュレートした最初の公開データセットを紹介します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:09:41 GMT)
Rebuild AC Power Flow Models with Graph Attention Networks [12.5]
フルパワーフローモデル(フルパワーフローモデル、英: Full Power Flow Model)は、物理電力ネットワークの完全な表現である。実際には、いくつかのPFモデルパラメータは、電力系統の不確かさや力学のために不正確なり、利用できないこともある。本稿では,各バスにおける電圧の実部と虚部に基づいて新しいグラフを構築することにより,グラフアテンションネットワーク(GAT)に基づくPF再構築モデルを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:54:35 GMT)
Alignment Unlocks Complementarity: A Framework for Multiview Circuit Representation Learning [12.5]
ブール回路上のマルチビュー学習は、グラフベースの異なる表現が相補的な構造的および意味的な情報を提供するので、大きな可能性を秘めている。 MixGateは、モデルに共有された関数対応表現空間を教える、原則付きトレーニングカリキュラム上に構築されたフレームワークである。我々のアライメントファースト戦略は、マスク付きモデリングを非効率な手法から強力なパフォーマンスドライバに変換することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:12:04 GMT)
Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices [12.4]
大規模マルチモーダルモデル (LMM) は、視覚とオーディオエンコーダ、プロジェクタ、および大きな言語モデルからなる、本質的にモジュラーである。しかし、それらはほとんど常にモノリシックに実行され、不均一な加速器を弱めている。大規模マルチモーダルモデル(LMM)のためのハードウェア-ソフトウェア共設計推論フレームワークを提案する。このフレームワークは、大規模なモデルをモジュラーコンポーネントに分割し、最も適切な計算ユニットで実行する予定である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:28:44 GMT)
Just-in-time and distributed task representations in language models [12.3]
本稿では,新しいタスクの表現が言語モデルでいつ生成されるかを検討する。これらの表現は、非単調および散発的な方法で進化することを示す。より長く複合的なタスクでは、モデルは時間的に分散された表現に依存する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:34:41 GMT)
Probing Neural Topology of Large Language Models [12.3]
本稿では,大規模言語モデルの機能的接続を明らかにするためのグラフ探索手法を提案する。多様なLLMファミリーやスケールのモデルを探索することにより、次の予測性能の普遍的な予測可能性を見出す。興味深いことに、トポロジーの探索は、最大130.4%のアクティベーションでの探索よりも優れている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:23:14 GMT)
HiddenBench: Assessing Collective Reasoning in Multi-Agent LLMs via Hidden Profile Tasks [12.2]
マルチエージェント LLM における集合的推論を評価するための最初のベンチマークである HiddenBench を紹介する。ベンチマークを基礎として,このパラダイムをカスタムタスクで形式化し,GPT-4.1グループが分散知識の統合に失敗したことを示す。次に、カスタムデザイン、先行研究、自動生成から引き出された65のタスクにまたがる完全なベンチマークを構築します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:30:07 GMT)
Kant: An Efficient Unified Scheduling System for Large-Scale AI Clusters [12.2]
Kantは、大規模なAIコンテナクラスタのための効率的な統合スケジューリングプラットフォームである。システムはトレーニングと推論の両方のジョブのスケジューリングをサポートする。システムは数百から数万のGPUのクラスタにおいて、例外的なパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:25:12 GMT)
MASt3R-Fusion: Integrating Feed-Forward Visual Model with IMU, GNSS for High-Functionality SLAM [12.2]
フィードフォワード・ポイントマップ・レグレッションと相補的なセンサ情報を統合するマルチセンサ支援視覚SLAMフレームワークMASt3R-Fusionを提案する。実時間スライディングウインドウ最適化とアグレッシブループ閉鎖を伴う大域的最適化の両立が可能な階層的因子グラフ設計法を開発した。我々は、公開ベンチマークと自己収集データセットの両方に対するアプローチを評価し、精度とロバスト性を大幅に改善したことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:26:28 GMT)
Ambiguity Resolution in Text-to-Structured Data Mapping [12.0]
自然言語における曖昧さは、構造化されたデータマッピングに対する正確なテキストを実現するための重要な障害である。我々は、潜在空間における曖昧なテキストの表現差を特徴付ける異なるアプローチを採用する。本稿では,概念上のパスカーネルに基づく新しい距離測度を導入し,あいまいな質問とあいまいな質問を区別する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:14:10 GMT)
Designing Ethereum's Geographical (De)Centralization Beyond the Atlantic [12.0]
無許可のシステムでは、場所を強制することはできないが、インセンティブから現れる。今日、バリデーターは大西洋(EUと米国東海岸)に沿ってクラスタ化されており、遅延は構造的に有利である。これらの結果は,プロトコル設計が分散化を図り,地理的分散化を促進するためのレバーを提供することを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:40:49 GMT)
SwinMamba: A hybrid local-global mamba framework for enhancing semantic segmentation of remotely sensed images [12.0]
リモートセンシング画像のセマンティックセグメンテーションのための新しいフレームワークであるSwinMambaを提案する。 SwinMambaは、シフトウィンドウ内の局所的なMambaスタイルのスキャンをグローバルな受容領域に統合し、局所的特徴とグローバル的特徴の両方に対するモデルの認識を強化する。我々のモデルでは、重なり合うシフトウィンドウを使うことにより、地域間情報交換が強化され、より堅牢な機能統合が促進される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:01:36 GMT)
StructPrune: Structured Global Pruning asymptotics with $\mathcal{O}(\sqrt{N})$ GPU Memory [12.0]
プルーニングは大規模言語モデル(LLM)のスケーリングに重要であるグローバルプルーニングは高いパフォーマンスを実現するが、$mathcalO(N)$メモリを必要とする。ローカルプルーニングは、レイヤを独立してプルーニングすることで、GPUメモリ使用量を単一のレイヤに短縮する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:16:50 GMT)
DeFacto: Counterfactual Thinking with Images for Enforcing Evidence-Grounded and Faithful Reasoning [12.0]
DeFactoは、正確な回答と忠実な推論を共同で実施する、反ファクト的推論フレームワークである。本研究では,疑問関連証拠を自動的に局所化し,肯定的,反実的,ランダムな変種を構成するパイプラインを開発する。多様なベンチマークの実験では、DeFactoは回答の正確さと忠実性の推論の両方を大幅に改善している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:58:10 GMT)
Perry: A High-level Framework for Accelerating Cyber Deception Experimentation [11.9]
サイバー詐欺は、ハニーポット、デコイ認証、デコイファイルなどの偽の資産を持つネットワーク攻撃者の注意をそらし、遅らせ、検出することを目的としている。既存のツールやプラットフォームには、変更や拡張が難しい、移植不可能で複雑な実装があります。私たちは、偽装のシナリオの設計と探索を加速する高レベルのフレームワークであるPerryを紹介します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:24:07 GMT)
Evading Overlapping Community Detection via Proxy Node Injection [11.7]
我々は,対象ノードが元のコミュニティから離脱する原因となるエッジ修正を求める,共生メンバシップ隠蔽(CMH)の問題に対処する。本稿では,グラフ構造を保存しながら,プロキシノードの使用を含む効果的な修正ポリシーを学習する深層強化学習手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:21:16 GMT)
From Next Token Prediction to (STRIPS) World Models -- Preliminary Results [11.7]
本研究では,行動トレースのみから命題STRIPS世界モデルを学習する問題について考察する。適切なトランスフォーマーアーキテクチャは命題的STRIPS世界モデルを忠実に表現できることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:09:53 GMT)
FedCLF - Towards Efficient Participant Selection for Federated Learning in Heterogeneous IoV Networks [11.6]
Federated Learning(FL)は、クライアントデータの代わりにトレーニング済みパラメータのみを共有することで、データのプライバシを保存する分散機械学習技術である。本稿では,クライアントのサンプリング周波数を動的に調整するフィードバック制御機構と選択プロセスにおいて,キャリブレーション損失をユーティリティとして導入する,キャリブレーション損失とフィードバック制御を備えたFedCLFを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:51:38 GMT)
Structure before the Machine: Input Space is the Prerequisite for Concepts [11.6]
ハイレベルな表現は、AIの透明性と制御を強化することの中心となり、個々のニューロンや回路から人間の解釈可能な概念に沿った構造化されたセマンティックな方向へと注目を移している。線形表現仮説 (LRH) によって動機付けられた入力空間線形性仮説 (ISLH) を提案する。次に、スペクトル主経路(SPP)フレームワークを導入し、より深いネットワークが支配的なスペクトル方向の小さなセットに沿って線形表現を段階的に蒸留する方法を定式化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:21:43 GMT)
Discovery Learning accelerates battery design evaluation [11.6]
Discovery Learning (DL)は、アクティブラーニング、物理誘導学習、ゼロショットラーニングを人間のような推論ループに統合する。 DLは歴史的なバッテリー設計から学び、プロトタイピングの必要性を積極的に減らすことができる。 DLは、未知のデバイス変数の下での平均サイクル寿命を予測する際に、テストエラーが7.2%に達する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:08:19 GMT)
Unlocking Financial Insights: An advanced Multimodal Summarization with Multimodal Output Framework for Financial Advisory Videos [11.6]
FASTER(Financial Advisory Summariser with Textual Embedded Relevant Image)は、最適化された簡潔な要約を生成するフレームワークである。 FASTERは、セマンティックな視覚的記述にBLIP、テキストパターンにOCR、話者ダイアリゼーションをBOS機能としてWhisperベースの書き起こしにBLIPを使用している。 A modified Direct Preference Optimization (DPO)-based loss function, equipped with BOS-specific fact-checking, ensure precision, Relevance, and factual consistency。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:54:19 GMT)
A Finite-Time Analysis of TD Learning with Linear Function Approximation without Projections or Strong Convexity [11.5]
線形関数近似を用いた時間差分学習(TD)の有限時間収束特性について検討する。単純な射影自由多様体は、マルコフノイズの存在下でさえ$widetildemathcalO(frac||theta)$の速度で収束することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:48:21 GMT)
DyME: Dynamic Multi-Concept Erasure in Diffusion Models with Bi-Level Orthogonal LoRA Adaptation [11.5]
テキストから画像への拡散モデルは、著作権のあるスタイルを不注意に再現し、視覚的概念を保護し、法的および倫理的懸念を提起する。概念消去は、微調整によってそのような概念を選択的に抑制することを目的とした安全保護として登場した。我々は、軽量でコンセプト固有のLoRAアダプタを訓練し、推論に必要なものだけを動的に構成するオンデマンド消去フレームワークDyMEを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:16:17 GMT)
Gate-Based Initialization and Fidelity in Correlated Open Quantum Systems [11.4]
本稿では,ゲート操作によるオープン量子システムの初期化,システムバス相関処理,等足歩行における制御ダイナミクスについて述べる。ゲートの忠実度は、スピンエコのような2pi$回転付近でのエラーの抑制を示し、エラーキャンセルの本質的なメカニズムを示している。結果は、超高速パルスによって引き起こされる強い非マルコフ力学から長寿命のエキシトニックコヒーレンスが生じることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:06:34 GMT)
Correct Reasoning Paths Visit Shared Decision Pivots [11.4]
我々は,任意の正しい推論経路を訪れる必要があるという,最小限かつ検証可能なチェックポイントの考え方を導入する。我々は,多様な推論経路を抽出し,意思決定の選択肢を共有する自己学習パイプラインを提案する。提案手法は, 根拠となる真理推論データや外部メトリクスを使わずに推論を整列する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:34:45 GMT)
Event2Vec: Processing Neuromorphic Events directly by Representations in Vector Space [11.4]
ニューロモルフィックイベントカメラは、従来のカメラに比べて時間分解能、電力効率、ダイナミックレンジが優れている。この非互換性に対する既存のソリューションは、しばしば時間分解を犠牲にし、広範囲の事前処理を必要とし、GPUアクセラレーションを完全に活用しない。我々は、ニューラルネットワークがイベントを直接処理できる新しい表現であるEvent2vecを紹介した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:07:18 GMT)
Asynchronous Perception Machine For Efficient Test-Time-Training [11.3]
テスト時間トレーニング(TTT)のための計算効率の良いアーキテクチャである非同期知覚機械(APM)を提案する。 APMは、任意の順序で画像のパッチを一度に処理でき、ネット内のセマンティック・アウェアネスをコード化することができる。我々は、データセット固有の事前トレーニング、拡張、あるいは任意のプレテキストタスクなしで、APMが配布外画像を認識する能力を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:15:56 GMT)
Towards Multimodal Active Learning: Efficient Learning with Limited Paired Data [11.2]
非整合データを用いたマルチモーダル能動学習のための第1のフレームワークを導入し、学習者はクロスモーダルアライメントを積極的に取得しなければならない。我々は,不確実性と多様性の原則を組み合わさった新しいアルゴリズムを開発し,線形時間取得を実現し,プールベースとストリーミングベースの両方の設定にシームレスに適用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:08:03 GMT)
Beyond SHAP and Anchors: A large-scale experiment on how developers struggle to design meaningful end-user explanations [11.2]
現代の機械学習は、ユーザーや開発者が完全に理解できないモデルを生成する。透明性と説明可能性の手法は、モデルの理解にいくつかの助けを提供することを目的としている。ガイドラインと規則の創出は目標を設定するが、開発者に効果的なガイダンスを提供しない可能性がある。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:48:45 GMT)
Design, Implementation and Evaluation of a Novel Programming Language Topic Classification Workflow [11.2]
本稿では,新しいプログラミング言語トピック分類ワークフローの設計,実装,評価について述べる。提案手法では,マルチラベルサポートベクトルマシン(SVM)とスライディングウィンドウと投票戦略を組み合わせることで,コア言語概念の詳細なローカライゼーションを実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:02:55 GMT)
Mirror Descent Policy Optimisation for Robust Constrained Markov Decision Processes [11.2]
本稿では、ロバスト制約付きマルコフ決定過程(RCMDP)に対するミラー降下ポリシーの最適化について述べる。我々は政策勾配法を用いて、制約されたMDPを表すラグランジアン上のポリシー(最大値)と遷移カーネル(最小値)の両方を最適化する。実験は、制約付きおよび制約なしの最適化におけるミラー降下ポリシー最適化の利点を確認し、ロバストネステストで顕著な改善が観察された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:04:39 GMT)
Benchmarking for Practice: Few-Shot Time-Series Crop-Type Classification on the EuroCropsML Dataset [11.0]
MAMLに基づくメタ学習アルゴリズムは、教師付き転送学習やSSL法に比べて若干精度が高い。教師付き手法は、地理的に近接した地域で事前訓練されたり微調整されたりした場合、最も恩恵を受ける。 SSLは、特に現実世界の作物タイプの分類に不可欠なきめ細かい特徴をキャプチャする上で、スクラッチからトレーニングするよりも利点がある。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:37:34 GMT)
Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation [11.0]
単一または少数の画像に基づいて高忠実表面とSDFフィールドを再構成する高速画像からニューラル表面(FINS)を提案する。 FINSは、軽量な幾何学とカラーヘッドを備えたマルチ解像度ハッシュグリッドを統合し、近似二階エンコーダによるトレーニングを極めて効率的にする。同条件下では, コンバージェンス速度, 表面再構成精度, SDF場推定精度の両面で, 最先端のベースラインよりも優れることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:30:05 GMT)
Radar-Guided Polynomial Fitting for Metric Depth Estimation [10.9]
POLARはレーダー誘導深度推定法である。スケールレス深度予測を、事前訓練された単眼深度推定(MDE)モデルからメートル法深度マップに変換する。 3つのデータセットにわたる最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:31:10 GMT)
BP-Seg: A graphical model approach to unsupervised and non-contiguous text segmentation using belief propagation [10.8]
本稿では,効率的なテキストセグメンテーションのためのグラフモデルに基づく教師なし学習手法BP-Segを提案する。本手法は, 局所的コヒーレンスを考慮し, 隣接文がより関連性が高いという直感を捉えるだけでなく, 意味論的に類似しない文章を効果的にグループ化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:51:05 GMT)
RED-DiffEq: Regularization by denoising diffusion models for solving inverse PDE problems with application to full waveform inversion [10.8]
偏微分方程式(PDE)が支配する逆問題(逆問題)は、様々な科学的・工学的応用において基本的な問題である。我々は、物理駆動の逆転とデータ駆動学習を統合することにより、新しい計算フレームワークRED-DiffEqを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:28:56 GMT)
On Entropy Control in LLM-RL Algorithms [10.7]
LLM-RL設定におけるエントロピーボーナスの問題について検討した。自動調整係数を持つ新しいクランプ型エントロピーボーナスを利用するエントロピー制御法であるAEntを提案する。 AEntは、異なるベースモデルとデータセットの下で数学推論タスクでテストされており、AEntがベースラインを一貫して上回ることが観察されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:05:58 GMT)
FracAug: Fractional Augmentation boost Graph-level Anomaly Detection under Limited Supervision [10.7]
FracAugは、グラフニューラルネットワーク(GNN)を強化した革新的なプラグイン拡張フレームワーク意味的に一貫したグラフ変種と相互検証を伴う擬似ラベルを生成する。 12の現実世界データセット上の14のGNNに対する実験は、一貫した利得を示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:23:21 GMT)
KeyWorld: Key Frame Reasoning Enables Effective and Efficient World Models [10.6]
KeyWorldはテキスト条件のロボットワールドモデルを改善するフレームワークである。 KeyWorldはフレーム・ツー・フレーム生成ベースラインと比較して5.68$times$Accelerationを実現していることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:35:40 GMT)
Failure Makes the Agent Stronger: Enhancing Accuracy through Structured Reflection for Reliable Tool Interactions [10.6]
現在の自己回帰のプラクティスは、プロンプトや一方的な推論に依存しています。提案する構造的リフレクションは, エラーから修復までの経路を明示的で制御可能な, 訓練可能な動作に変換する。 BFCL v3とTool-Reflection-Benchの実験では、マルチターンツールコールの成功とエラー回復、冗長呼び出しの削減が大幅に向上した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:17:18 GMT)
FerretNet: Efficient Synthetic Image Detection via Local Pixel Dependencies [10.6]
FerretNetは1.1Mパラメータしか持たない軽量ニューラルネットワークで、効率的で堅牢な合成画像検出を提供する。実験によると、フェレットネットは4クラスのProGANデータセットのみに訓練されており、平均精度は97.1%である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:28:32 GMT)
TasselNetV4: A vision foundation model for cross-scene, cross-scale, and cross-species plant counting [10.5]
種別カウントから種間カウントに移行したTasselNetV4について紹介する。普通の視覚変換器の上に構築され、新しいマルチブランチボックス対応のローカルカウンタが組み込まれている。以上の結果から,タッセルネットV4はクロスシーン,クロススケール,クロスタイプ植物カウントのためのビジョン基盤モデルであることが示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:48:29 GMT)
Filtering with Confidence: When Data Augmentation Meets Conformal Prediction [10.4]
本稿では,合成データ拡張のための基本データフィルタリングフレームワークを提案する。 F1スコアの最大40%の一貫性のあるパフォーマンス向上を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:42:02 GMT)
RedHerring Attack: Testing the Reliability of Attack Detection [10.4]
我々は、RedHerringという新たなアタック設定とアタックを提案し、テストする。 RedHerringは、テキストを変更することで攻撃検出モデルを信頼できないようにする。 RedHerringは検出精度を20～71ポイントに下げることができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:53:11 GMT)
Concepts in Motion: Temporal Bottlenecks for Interpretable Video Classification [10.4]
MoTIFは、ビデオ分類のための概念ボトルネックフレームワークに適応するトランスフォーマーにインスパイアされたアーキテクチャ設計である。我々のデザインは、ビデオ全体にわたるグローバルな概念の重要性、特定のウィンドウ内でのローカルな概念の関連性、時間の経過とともに概念の時間的依存という、3つの補完的な視点を可能にします。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:35:03 GMT)
Even More Kawaii than Real-Person-Driven VTubers? Understanding How Viewers Perceive AI-Driven VTubers [10.4]
我々は、Twitchで845万のフォロワー、YouTubeで753万のフォロワーを持つ、最も人気のあるAI駆動型VTuberであるNeuro-samaの視聴者認識を調査した。我々の発見は、AI駆動型VTuberの理解と、そのデジタルストリーミング文化への影響を高める。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:58:13 GMT)
VDFD: Multi-Agent Value Decomposition Framework with Disentangled World Model [10.4]
本稿では,Distangled World Modelを用いた新しいモデルベースマルチエージェント強化学習手法であるValue Decomposition Frameworkを提案する。提案手法は, サンプル効率が高く, 多様なマルチエージェント学習タスクにおいて, 他のベースラインと比較して優れた性能を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:51:30 GMT)
Bispectral OT: Dataset Comparison using Symmetry-Aware Optimal Transport [10.3]
バイスペクトル最適輸送(Bispectral Optimal Transport)は、離散OTの対称性を考慮した拡張であり、バイスペクトルを用いて要素を表現して比較する。本研究では,バイスペクトルOTを用いて計算した輸送計画が,視覚対称性で変換されたベンチマークデータセット上の特徴OTよりも高いクラス保存精度を達成できることを実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:25:24 GMT)
T2I-Diff: fMRI Signal Generation via Time-Frequency Image Transform and Classifier-Free Denoising Diffusion Models [10.2]
本稿では,BOLD信号の時間周波数表現を利用するfMRI生成フレームワークであるT2I-Diffを紹介する。ダウンストリームfMRIを用いた脳ネットワーク分類において,精度の向上と一般化を実証した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:08:19 GMT)
WAVECLIP: Wavelet Tokenization for Adaptive-Resolution CLIP [10.2]
WAVECLIPは、標準的なパッチ埋め込みをマルチレベルウェーブレット分解に置き換える。我々は、WAVECLIPをゼロショット分類で評価し、シンプルな信頼に基づくゲーティング機構が適応的な早期退避を可能にすることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:39:16 GMT)
Best-of-$\infty$ -- Asymptotic Performance of Test-Time Compute [10.2]
我々は,大言語モデル (LLMs) において,多数決に基づく最安の$N$について検討する。回答合意に基づいてN$を選択する適応生成方式を提案する。フレームワークを複数のLLMの重み付けアンサンブルに拡張し、そのような混合物が個々のモデルより優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:41:05 GMT)
Provenance Analysis of Archaeological Artifacts via Multimodal RAG Systems [10.0]
本稿では,考古学的遺物の発見分析のためのRAGに基づくシステムを提案する。このシステムは、参照テキストや画像からデュアルモーダルな知識ベースを構築し、ビジュアル、エッジ強化、セマンティック検索を可能にする。大英博物館の東ユーラシア青銅器群について評価を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:52:13 GMT)
BESPOKE: Benchmark for Search-Augmented Large Language Model Personalization via Diagnostic Feedback [10.0]
本稿では,検索強化された大規模言語モデルにおけるパーソナライズ評価のための現実的なベンチマークであるBESPOKEを提案する。 BESPOKEは、人間から直接、本物のチャットと検索履歴を収集することによって、現実的なものの両方を意図している。我々は,情報探索タスクにおける効果的なパーソナライズのための重要な要件を明らかにする体系的な分析を行う。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:53:07 GMT)
Model-Based Reinforcement Learning under Random Observation Delays [9.9]
我々は,POMDPにおけるランダムなセンサ遅延について検討した。本稿では,入ってくる観測ストリームに基づいて,信頼状態を逐次更新するモデルに基づくフィルタリングプロセスを提案する。次に、モデルベースのRLにこのアイデアを組み込んだ、シンプルな遅延認識フレームワークを紹介します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:01:13 GMT)
Punching Above Precision: Small Quantized Model Distillation with Learnable Regularizer [9.9]
Game of Regularizer (GoR) は、タスク固有性(TS)と蒸留損失を適応的にバランスをとる学習可能な正規化手法である。 GoRは、最先端のQAT-KD法を低消費電力エッジデバイスで一貫して上回っている。また,多種多様な教師モデルを用いたアンサンブル蒸留フレームワークQAT-EKD-GoRについても紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:43:13 GMT)
SAGE: A Realistic Benchmark for Semantic Understanding [9.7]
SAGE(Semantic Alignment & Generalization Evaluation)は,埋め込みモデルと類似度指標の両方を評価するための厳密なベンチマークである。 9つの埋め込みモデルと古典的なメトリクスを総合的に評価すると、大きなパフォーマンスのギャップが明らかになる。 OpenAI のtext-embedding-3-small が最も高いクラスタリング性能 (0.483) を達成するが、最低ロバストネススコア (0.011) で極端に脆さを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:27:15 GMT)
Dual-supervised Asymmetric Co-training for Semi-supervised Medical Domain Generalization [9.6]
医用画像セグメンテーションにおける半教師付きドメイン一般化(SSDG)は、テスト中に見えないドメインに一般化するための有望なソリューションを提供する。従来のSSDGメソッドでは、トレーニングセットの各ソースドメインに対してラベル付きおよびラベルなしのデータが利用可能であると仮定している。本稿では,ラベル付きトレーニングデータとラベルなしトレーニングデータの間でドメインシフトが発生する,より実践的で困難なシナリオについて検討する。既存のSSDG法は、不正確な擬似ラベルのため、そのようなドメインシフト下での準最適性能を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:13:25 GMT)
Machine Learning. The Science of Selection under Uncertainty [9.6]
この本は、不確実性の下での選択結果に関する理論的保証を得るための統計ツールを提供する。この本は、マルコフ、チェビシェフ、ホーフディング、バーンスタイン、経験的バーンスタイン、kl、スプリット-klなど、幅広い不平等をカバーしている。本稿では, 環境フィードバック, 環境抵抗, 構造複雑性を特徴とするオンライン学習問題の空間について述べる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:33:13 GMT)
High-Probability Analysis of Online and Federated Zero-Order Optimisation [9.5]
勾配のないゼロオーダー最適化の設定における分散学習について検討する。我々は,厳密な理論的保証を提供するフェデレートゼロオーダーアルゴリズムであるFedZeroを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:44:57 GMT)
Differential Gated Self-Attention [9.5]
マルチヘッド差分ゲーテッド・セルフアテンションは、ヘッドごとの入力依存ゲーティングを学習し、注意雑音を動的に抑制する。筆者らの貢献は, 側方抑制を基礎とした自己保持のための新たな入力依存型ゲーティング機構, (ii) 生物学的コントラスト増強と自己保持理論の原理的合成, (iii) 耐雑音性およびクロスドメイン適用性を示す総合的な実験である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:59:51 GMT)
CompareBench: A Benchmark for Visual Comparison Reasoning in Vision-Language Models [9.4]
CompareBenchは視覚言語モデル(VLM)における視覚比較推論を評価するためのベンチマークである。量(600)、時間(100)、幾何学(200)、空間(100)の4つのタスクにまたがる1000のQAペアで構成されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:14:11 GMT)
PhenoMoler: Phenotype-Guided Molecular Optimization via Chemistry Large Language Model [9.3]
フェノモラーは化学的に有効で、新規で多様な分子を所望の表現型プロファイルに沿って生成する。 FDAが承認した薬物と比較すると、生成された化合物は、同等または強化された薬物類似性(QED)、最適化された物理化学的性質、および主要ながん標的に対する優れた結合親和性を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:37:19 GMT)
Feature-Oriented IoT Malware Analysis: Extraction, Classification, and Future Directions [9.3]
この調査は、IoTマルウェア分析のための機能抽出テクニックの包括的なレビューを提供する。まず静的特徴抽出法と動的特徴抽出法,次いでハイブリッド手法について検討する。次に,グラフ学習に基づく特徴表現戦略について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:14:20 GMT)
Diagnosing the Performance Trade-off in Moral Alignment: A Case Study on Gender Stereotypes [9.3]
モーラルアライメントは、事前訓練された言語モデル(PLM)の振る舞いを制御するための広く採用されているアプローチとして登場した。ジェンダーステレオタイプを緩和する文脈において,パフォーマンストレードオフの基盤となるメカニズムについて検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:26:00 GMT)
PLaMo 2 Technical Report [9.2]
本研究では,サンバをベースとしたハイブリッドアーキテクチャを特徴とする,日本語を対象とする大規模言語モデルであるPLaMo 2を紹介する。 PLaMo 2モデルは、日本語のベンチマークで最先端の結果を達成し、命令追従、言語流速、日本語特有の知識において、同様の大きさのオープンモデルよりも優れている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:33:51 GMT)
Speech Language Models for Under-Represented Languages: Insights from Wolof [9.1]
We present our journey in training a speech language model for Wolof, a underrepresented language spoken in West Africa。まず,大規模で自発的で高品質な教師なし音声データを収集することの重要性を強調した。このデータセット上でのHuBERTの事前学習は、ASRのベースモデルとアフリカ中心モデルの両方より優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:40:33 GMT)
On the Necessity of Output Distribution Reweighting for Effective Class Unlearning [9.1]
モデルが近隣のクラスに割り当てる確率を用いて、未学習のサンプルを検出するMIA-NNによる会員推論攻撃を導入する。そこで我々は,このプライバシー漏洩を緩和する新たな微調整手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:25:09 GMT)
Improving LLM Unlearning Robustness via Random Perturbations [9.1]
現状のLLMアンラーニング手法は,モデルのロバスト性を本質的に低下させることを示す。本研究では,非学習プロセスをバックドア攻撃と防御として再編成する理論的枠組みを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:44:11 GMT)
IndiSeek learns information-guided disentangled representations [9.0]
IndiSeekは、新しい非絡み合い表現学習手法である。 IndiSeekは独立性と完全性のバランスをとり、モダリティ固有の特徴を原則的に抽出することを可能にする。 IndiSeekが人工シミュレーション,CITE-seqデータセット,および実世界のマルチモーダルベンチマークに与える影響を実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:58:34 GMT)
LANCE: Low Rank Activation Compression for Efficient On-Device Continual Learning [9.0]
オンデバイス学習は、リソース制約のある環境におけるパーソナライズ、プライバシ、長期適応に不可欠である。既存のアクティベーション圧縮手法は、このコストを削減するが、繰り返し低ランクの分解に依存し、計算オーバーヘッドを発生させる。アクティベーションプロジェクションのための再利用可能な低ランク部分空間を得るために,一ショット高次特異値分解(SVD)を行うフレームワークであるLANCEを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:33:40 GMT)
GraphUniverse: Enabling Systematic Evaluation of Inductive Generalization [9.0]
GraphUniverseはグラフの全ファミリーを生成するためのフレームワークである。これにより、スケールでの帰納的一般化の最初の体系的評価が可能になる。私たちの中心となるイノベーションは、永続的なセマンティックなコミュニティを持つグラフの生成です。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:46:01 GMT)
ReSpace: Text-Driven 3D Indoor Scene Synthesis and Editing with Preference Alignment [9.0]
ReSpaceはテキスト駆動型屋内シーン合成と編集のための生成フレームワークである。教師付き微調整と選好アライメントを組み合わせた二段階学習手法を応用した。シーン編集にはゼロショットLLMを用いてオブジェクトの削除と追加のプロンプトを行う。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:16:36 GMT)
Contextual Combinatorial Bandits with Changing Action Sets via Gaussian Processes [8.9]
本稿では,アクションセットと時間変化によるベースアームの可利用性に関するコンテキスト的帯域幅問題について考察する。我々は,カーネル上信頼境界(O'CLOK-UCB)を用いた最適組合せ学習と最適化というアルゴリズムを提案する。アルゴリズムを劇的に高速化するために,スパースGPを用いたO'CLOK-UCBの変種を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:39:08 GMT)
Generating Stable Placements via Physics-guided Diffusion Models [8.9]
オブジェクトを複数オブジェクトのシーンに安定に配置することは、ロボット操作の基本的な課題である。本手法は,拡散モデルのサンプリングプロセスに直接安定性を統合する。私たちの物理誘導モデルでは、強引な摂動に対して56%強固な配置を実現しています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:32:35 GMT)
Multimodal Iterative RAG for Knowledge-Intensive Visual Question Answering [8.8]
MI-RAGは、推論を利用して検索を強化し、知識合成を取り入れて理解を深めるフレームワークである。 Encyclopedic VQA、InfoSeek、OK-VQAといった挑戦的なベンチマークの実験は、MI-RAGが検索リコールと回答精度の両方を著しく改善していることを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:26:45 GMT)
Training Set Reconstruction from Differentially Private Forests: How Effective is DP? [8.8]
我々は、最先端の$epsilon$-DPランダム森林を対象とした再建攻撃を導入する。以上の結果から,有意義なDP保証で訓練された無作為林が,トレーニングデータの一部を漏洩させる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:23:53 GMT)
"DIVE" into Hydrogen Storage Materials Discovery with AI Agents [8.8]
データ駆動人工知能(AI)アプローチは、新しい素材の発見を変革している。本稿では,視覚表現の記述的解釈(Descriptive Interpretation of Visual Expression, DIVE)について述べる。 4000の出版物から3万点を超えるキュレートされたデータベース上に構築し、これまで報告されていない水素貯蔵成分を2分で識別できる高速な逆設計ワークフローを構築した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:01:31 GMT)
Binary Autoencoder for Mechanistic Interpretability of Large Language Models [8.7]
隠れアクティベーションのミニバッチに最小エントロピーを強制する新しいバイナリオートエンコーダを提案する。効率的なエントロピー計算のために、ステップ関数を介して隠れたアクティベーションを1ビットに識別する。我々は、大規模言語モデルの推論力学を経験的に評価し、活用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:48:48 GMT)
On the Dynamic Regret of Following the Regularized Leader: Optimism with History Pruning [8.7]
FTRL(Follow the Regularized Leader)は、オンライン凸最適化(OCO)のためのフレームワークである。これまでの研究は、動的環境におけるフレームワークの制限を強調してきた。 FTRLは、将来的なコストの楽観的な構成により、既知の動的後悔境界を回復できることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:55:03 GMT)
Generation-Time vs. Post-hoc Citation: A Holistic Evaluation of LLM Attribution [8.7]
大規模言語モデル (LLMs) は、医療、法律、アカデミア、金融といった高度な領域において、人間の検証可能な情報源を引用しなければならない。本稿では,一つのパスで応答と引用を生成する生成時間Citation(G-Cite)と,起草後の引用を付加または検証するポストホックCitation(P-Cite)という2つのパラダイムを紹介する。両パラダイムにおける帰属品質の主要因は検索であり,適用範囲と引用精度の相反するトレードオフを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:39:26 GMT)
Fast Revocable Attribute-Based Encryption with Data Integrity for Internet of Things [8.6]
Revocable-basedcrypt(RABE)は、IoT(Internet of Things)内のクラウドストレージおよびアウトソースデータ環境における、フレキシブルできめ細かなアクセス制御とデータ共有を保証するために不可欠である。本稿では,複数のチャレンジ暗号文による適応型セキュリティを特徴付ける,IoT用のデータ整合性を備えた高速なRABE方式を提案する。我々は、複数のチャレンジ暗号文で定義されたセキュリティモデル内で適応セキュリティを実証し、その性能を最適化した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:24:29 GMT)
A Sentinel-3 foundation model for ocean colour [8.6]
我々は,Sentinel-3 Ocean and Land Colour Instrument (OLCI) のデータ再構成を事前訓練した Prithvi-EO Vision Transformer アーキテクチャを用いた新しい基礎モデルについて述べる。 2つの下流海洋地球観測課題の微調整によるモデルの評価を行った。この新世代の地理空間AIモデルは、海洋生態系とその地球温暖化プロセスにおける役割について、より堅牢でデータ駆動的な洞察を提供する可能性を秘めている、と結論付けています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:00:38 GMT)
Ko-PIQA: A Korean Physical Commonsense Reasoning Dataset with Cultural Context [8.5]
PIQAのような物理コモンセンス推論データセットは、主に英語中心であり、文化的多様性を欠いている。文化コンテキストを組み込んだ韓国の物理常識推論データセットKo-PIQAを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:44:01 GMT)
Entanglement sharing schemes [8.5]
我々は,あるサブシステムの組が局所的な操作によって絡み合いを回復できるような絡み合い共有スキーム(ESS)を定義した。 ESSスキームには2つのバリエーションがある。ひとつは、絡み合うべきパートナーシステムが知られている場合であり、もう一つはそうでない場合である。量子ネットワークにおける時間依存性要求に応答して、絡み合いの分布に関連するオープンな問題を解くために、絡み合い共有理論の応用を与える。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:29:22 GMT)
Fine-Tuning LLMs to Analyze Multiple Dimensions of Code Review: A Maximum Entropy Regulated Long Chain-of-Thought Approach [8.4]
大きな言語モデル(LLM)は、自動コードレビューをサポートする大きな可能性を示しています。近年,コードレビューデータを用いた微調整LDMによる性能向上が報告されている。本稿では,複数次元のコードレビューを解析する優れた推論能力を備えたLCMを訓練する,COTファインチューニングアプローチであるMelcotCRを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:51:56 GMT)
Mechanism of Task-oriented Information Removal in In-context Learning [8.3]
In-context Learning (ICL) は、現代の言語モデル(LM)に基づく、新たな数発学習パラダイムである。本稿では,情報除去の新たな視点を通して,そのメカニズムを考察する。低ランクフィルタにより隠蔽状態から特定の情報を選択的に除去し,LMを目的のタスクに向けて効果的に操ることがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:18:09 GMT)
Hallucination as an Upper Bound: A New Perspective on Text-to-Image Evaluation [8.2]
我々は、テキスト・画像モデルにおける幻覚をバイアス駆動偏差として定義する。属性,関係性,対象幻覚の3つのカテゴリからなる分類法を提案する。このフレーミングは評価のための上限を導入し、隠れバイアスを表面化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:50:21 GMT)
Regularization can make diffusion models more efficient [8.2]
本研究は,特に統計学でよく知られている疎水性の概念が,より効率的な拡散パイプラインの経路となることを示唆している。我々の数学的保証は、空間が入力次元の計算複雑性への影響を、データの本質的な次元よりもはるかに小さくすることができることを証明している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:46:51 GMT)
SPAR: Self-supervised Placement-Aware Representation Learning for Distributed Sensing [8.2]
SPARは分散センシングにおける自己教師型配置認識表現学習のためのフレームワークである。 SPARは、様々なモード、配置、下流タスクにまたがる優れた堅牢性と一般化を実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:04:47 GMT)
Joint Flow Trajectory Optimization For Feasible Robot Motion Generation from Video Demonstrations [8.1]
本稿では,LfD(Learning-from-Demonstration)パラダイムに基づくポーズ生成とオブジェクトの軌道模倣を把握するためのフレームワークを提案する。人間の手の動きを直接模倣するのではなく,実演を対象中心のガイドとして扱う。我々は,様々な実世界の操作タスクにおけるシミュレーションと実世界の実験の両方において,我々のアプローチを検証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:11:07 GMT)
Distributed Specialization: Rare-Token Neurons in Large Language Models [8.1]
大型言語モデル(LLM)は、特殊なドメインにおいて重要であるにもかかわらず、希少なトークンの表現と生成に苦慮している。 LLMは、離散モジュラーアーキテクチャや分散パラメータレベルの微分ドメインを通じて内部特殊化機構を開発するかを検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:49:38 GMT)
Neural Audio Codecs for Prompt-Driven Universal Sound Separation [8.1]
デバイス上でのユニバーサルなテキスト駆動分離のための最初のNACベースモデルであるCodecSepを紹介する。 CodecSepは、DAC圧縮とCLAP由来のFiLMパラメータによって変調されたトランスフォーマーマスクを組み合わせる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:44:56 GMT)
Investigating Modality Contribution in Audio LLMs for Music [8.1]
オーディオ大言語モデル(Audio LLMs)は、人間の音楽に関する会話を可能にする。音声を本当に聴いているのか、それとも単にテキストによる推論を使っているのかは不明だ。本稿では,モデル出力に対する各モダリティの寄与を定量化し,この問題を考察する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:56:35 GMT)
Physics-Guided Motion Loss for Video Generation Model [8.1]
現在のビデオ拡散モデルは視覚的に魅力的なコンテンツを生成するが、物理の基本法則に反することが多い。モデルアーキテクチャを変更することなく、動きの可視性を向上する周波数領域物理を導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:44:47 GMT)
A Data-driven Typology of Vision Models from Integrated Representational Metrics [8.0]
大規模ビジョンモデルは、アーキテクチャやトレーニングのパラダイムにおいて大きく異なるが、家族間で表現のどの側面が共有されているかを決定するための原則的な方法が欠如している。表現的類似度メトリクスの組を活用し、それぞれ異なる顔-幾何学、ユニットチューニング、線形な陰極性、および家族分離性を評価する。我々は、これらの相補的なファセットを統合するために、マルチオミクス統合にインスパイアされたSimisity Network Fusion(SNF)を適用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:46:09 GMT)
Real-Time Object Detection Meets DINOv3 [8.0]
私たちはDEIMをDINOv3機能で拡張し、結果としてDEIMv2を作りました。 X、L、M、Sの変異体では、DINOv3を前処理または蒸留したバックボーンを採用する。超軽量モデル(Nano、Pico、Femto、Atto)では、厳格なリソース予算を満たすために、深さと幅のプルーニングを備えたHGNetv2を使用します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:14:00 GMT)
Preemptive Detection and Steering of LLM Misalignment via Latent Reachability [8.0]
大規模言語モデル(LLM)は現在、日常的なツールで広く普及しており、有害なコンテンツを生成する傾向について緊急の安全上の懸念を提起している。我々は, LLM推論に制御理論安全ツールを提供する, 到達可能性に基づくフレームワークであるBRT-Alignを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:15:29 GMT)
Tool Calling for Arabic LLMs: Data Strategies and Instruction Tuning [8.0]
2つのオープンソースのツールコールデータセットをアラビア語に翻訳し、適応することで、リソースギャップを埋める。本研究は,アラビア語に対する堅牢なツール強化剤開発のための最適戦略に関する重要な知見を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:45:12 GMT)
Incorporating LLM Embeddings for Variation Across the Human Genome [7.9]
我々はヒトゲノム全体にわたる変異レベルの埋め込みを生成する最初の体系的な枠組みの1つを提示する。 FAVOR, ClinVar, GWAS Catalog のキュレートされたアノテーションを用いて, 我々は890億の可能な変種についてセマンティックテキスト記述を構築した。埋め込みはOpenAIのtext-em-3-largeとオープンソースのQwen3-Embedding-0.6Bモデルの両方で製造された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:09:16 GMT)
Federated Flow Matching [7.9]
プライバシ制約下でのフローマッチングモデルをトレーニングするためのフレームワークであるFederated Flow Matching (FFM)を紹介した。合成データセットと画像データセットの実験により、FFMは、フェデレートされた設定におけるフローストレートネスとサンプル品質の両方を強化しながら、プライバシ保護トレーニングを可能にすることが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:45:02 GMT)
Development and Validation of a Large Language Model for Generating Fully-Structured Radiology Reports [7.8]
完全に構造化されたレポートを作成するための現在のLLMは、外部サーバにデータをアップロードする際のエラー、コンテンツ幻覚、プライバシー漏洩といった問題に直面している。我々は,各機関の様々な自由テキストレポートから完全に構造化され,標準化されたLCSレポートを作成するための,オープンソースで正確なLCMを開発することを目的としている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:44:19 GMT)
Overcoming Black-box Attack Inefficiency with Hybrid and Dynamic Select Algorithms [7.8]
既存のブラックボックス攻撃法は、しばしば大量のクエリを必要とするため、研究者にとって非効率で実用的ではない。本稿では,従来の選択アルゴリズムの強みをうまく組み合わせたHybridとDynamic Selectという2つの新しい攻撃選択戦略を提案する。 4つのデータセットと6つのターゲットモデルにまたがって、我々のベストメソッド(センスレベルハイブリッドセレクト)は、アタック毎の要求クエリ数を平均25.82%削減できる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:06:35 GMT)
Fairy: Interactive Mobile Assistant to Real-world Tasks via LMM-based Multi-agent [7.7]
Fairyはインタラクティブなマルチエージェントモバイルアシスタントで、アプリ知識を継続的に蓄積し、使用中に自己進化する。 i) ユーザタスクをクロスアプリビューからサブタスクに分解するGlobal Task Planner,(ii) サブタスクを長期メモリと短期メモリに基づいてステップとアクションに洗練するApp-Level Executor,(iii) 実行エクスペリエンスをApp MapとTricksに統合するSelf-Learnerの3つのコアモジュール。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:21:31 GMT)
SlimDiff: Training-Free, Activation-Guided Hands-free Slimming of Diffusion Models [7.7]
SlimDiffはアクティベーションインフォームド構造圧縮フレームワークである。 DMの注意とフィードフォワード次元の両方を減少させるが、完全に勾配のない。最大で35%のアクセラレーションと、ベースラインに対する$sim$100Mパラメータの削減を実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:56:17 GMT)
Real-time Hybrid System Identification with Online Deterministic Annealing [7.7]
本稿では、入力出力領域と状態空間領域の両方において、離散時間状態依存切替システムに対するリアルタイム識別手法を提案する。スイッチングシステムにおける標準的な識別アルゴリズムとは対照的に,提案手法は徐々にモード数を推定し,リアルタイムシステム識別に適している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:01:46 GMT)
SiNGER: A Clearer Voice Distills Vision Transformers Further [7.6]
高ノルムのアーティファクトが目的を担っているため、学生はアーティファクトや過度な情報信号に過度に適合する。以前の作業では、アーティファクトの除去を試みたが、アーティファクトの抑制と情報的信号の保存の間に固有のトレードオフに遭遇した。 Singular Nullspace-Guided Energy Reallocation (SiNGER)を紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:29:47 GMT)
Runtime-Adaptive Pruning for LLM Inference [7.5]
我々は、強化学習(RL)によって駆動される弾力的な刈り取りフレームワークであるRAPを提案する。 RAPは、実際の実行におけるモデルパラメータとKV-cacheの進化率を追跡する。 RAPは最先端のベースラインよりも優れており、モデル重量とKVcacheを同時に検討するのは初めてである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:45:01 GMT)
Decoding Open-Ended Information Seeking Goals from Eye Movements in Reading [7.5]
日々の生活の中で、人々は読書行動のガイドとなるテキスト固有の目標を何種類も備えたテキストに近づきます。本研究は,視線運動のみからオープンエンド読解目標を自動復号化できるかどうかを初めて問うものである。これらの課題に対して,識別的・生成的マルチモーダルテキストと眼球運動LLMの開発と比較を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:28:15 GMT)
HuLA: Prosody-Aware Anti-Spoofing with Multi-Task Learning for Expressive and Emotional Synthetic Speech [7.5]
本稿では,スプーフ検出のための2段階の韻律対応マルチタスク学習フレームワークであるHuLAを提案する。ステージ1では、F0予測と音声・無声分類の補助的タスクを用いて、自己教師型学習バックボーンを実音声で訓練する。ステージ2では、実データと合成データの両方において、スプーフ検出と韻律タスクに共同最適化されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:49:58 GMT)
FSMODNet: A Closer Look at Few-Shot Detection in Multispectral Data [7.5]
FSMOD (Few-shot Multispectral Object Detection) は、最小限のデータで可視・熱モードで物体を検出するという課題に対処する。我々は,限定ラベルでも検出性能を向上させるために,クロスモーダル機能統合を利用するFSMODNetというフレームワークを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:45:05 GMT)
Cross-Modal Instructions for Robot Motion Generation [7.4]
本稿では,ロボットが粗いアノテーションの形でデモによって形づくられる,クロスモーダルな指示からの学習を紹介する。そこで,CrossInstructフレームワークを紹介した。このフレームワークは,視覚言語モデルに対する文脈入力の例として,クロスモーダル命令を統合する。次に、VLMは小さな細調整されたモデルを反復的にクエリし、複数の2Dビュー上で所望の動作を合成する。大規模VLMの推論をきめ細かなポインティングモデルに組み込むことで、CrossInstructは限られた指導例の環境を超えて一般化する実行可能なロボット動作を生成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:54:00 GMT)
HazeFlow: Revisit Haze Physical Model as ODE and Non-Homogeneous Haze Generation for Real-World Dehazing [7.4]
デヘイズには、画像からヘイズや霧を取り除き、明瞭さを回復し、可視性を改善することが含まれる。大気散乱モデル(ASM)に基づく従来の手法は、現実の複雑さや多様なヘイズパターンを扱うのに不足することが多い。我々は、ASMを通常の微分方程式(ODE)として再構成する新しいODEベースのフレームワークであるHazeFlowを提案する。 Rectified Flow (RF)にインスパイアされたHazeFlowは、ヘイジーな画像をクリーンなものにマップするための最適なODE軌道を学び、単一の推論ステップで現実のデハージングパフォーマンスを向上させる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:32:29 GMT)
Discretization Error of Fourier Neural Operators [7.4]
オペレータ学習は、データから関数空間間のマップを近似するために設計された機械学習の変種である。フーリエニューラル演算子(フーリエニューラル演算子、FNO)は、演算子学習に使用される主要なモデルアーキテクチャの1つである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:39:06 GMT)
FlowXpert: Context-Aware Flow Embedding for Enhanced Traffic Detection in IoT Network [7.3]
IoT(Internet of Things)環境では、多数のデバイス間の継続的なインタラクションによって複雑な動的ネットワークトラフィックが生成される。機械学習(ML)ベースのトラフィック検出技術は、ネットワークセキュリティを確保する上で重要なコンポーネントである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:52:58 GMT)
Energy Guided Geometric Flow Matching [7.3]
時間的データに対して有用な帰納バイアスは、軌跡がデータ多様体に近づかなければならないことである。従来のフローマッチングは直線的な条件付きパスに依存しており、測地学を学ぶフローマッチング手法は、次元性の呪いに苦しむRBFカーネルや近隣のグラフに依存している。本稿では, スコアマッチングとエネルギー蒸留を用いて, 基礎となるデータ形状を忠実に捉え, より正確な流れを知らせる計量テンソルを学習することを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:42:28 GMT)
AUDDT: Audio Unified Deepfake Detection Benchmark Toolkit [7.3]
既存の28のオーディオディープフェイクデータセットを体系的にレビューし、AUDDTと呼ばれるオープンソースのベンチマークツールキットを提示する。このツールキットの目的は、これらの28のデータセットにわたる事前訓練された検出器の評価を自動化することであり、ディープフェイク検出器の利点と欠点を直接フィードバックすることである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:09:40 GMT)
Symmetry Breaking Dynamics in Quantum Many-Body Systems [7.3]
エンタングルメント非対称性は、量子多体系における対称性の破れを特徴づける強力なツールとして登場した。このレターでは、2つの異なるシナリオにおいて、対称性が絡み合う非対称性のレンズを通して動的に破壊されるかを考察する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:27:55 GMT)
Interpretable time series analysis with Gumbel dynamics [7.2]
動的システムの切り替えは、解釈可能性を維持しながら複雑な時系列データをモデル化することができる。この集合の離散的な性質のため、そのようなモデルは滑らかで変動速度の遷移を捉えるのに苦労する。本稿ではGumbel Dynamical Model(GDM)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:56:01 GMT)
Chiseling: Powerful and Valid Subgroup Selection via Interactive Machine Learning [7.2]
回帰と因果推論において、制御されたサブグループ選択は、与えられた閾値を超える平均応答または治療効果を持つサブグループを特定することを目的としている。そこで本研究では,解析者が反復的に縮小することで,候補サブグループをインタラクティブに洗練し,検証することを可能にする,Chiselingと呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:19:31 GMT)
Enhancing Contrastive Learning for Geolocalization by Discovering Hard Negatives on Semivariograms [7.1]
そこで本研究では,半可変図を組み込んだ空間正規化コントラスト学習戦略を提案する。空間的先行条件を明示的にモデル化することで、画像に基づく地理的局所化性能が向上することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:53:06 GMT)
GRAB: A Risk Taxonomy--Grounded Benchmark for Unsupervised Topic Discovery in Financial Disclosures [7.1]
8,247件の書類から1.61万文の財務特化ベンチマークであるGRABを提示する。ラベルは5つのマクロクラスの下にネストされた21のきめ細かいタイプに193の用語をマッピングするリスク分類に固定されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:48:33 GMT)
Exact Subgraph Isomorphism Network for Predictive Graph Mining [6.9]
本稿では,厳密なサブグラフ列挙,ニューラルネットワーク,スパース正規化を組み合わせたエクササイズサブグラフ同型ネットワーク(EIN)を提案する。 EINは、標準的なグラフニューラルネットワークモデルと比較して十分に高い予測性能を持つ。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:49:26 GMT)
Selective Risk Certification for LLM Outputs via Information-Lift Statistics: PAC-Bayes, Robustness, and Skeleton Design [6.9]
我々は,モデル確率を骨格ベースラインと比較し,重み付き境界の下で有効なPAC-Bayesに証拠を蓄積する情報リフト証明書を開発した。 8つのデータセットにまたがって77.2%のカバレッジを2%のリスクで達成し、最近の2023～2024のベースラインを8.6～15.1ポイント上回った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:55:13 GMT)
Inducing Faithfulness in Structured Reasoning via Counterfactual Sensitivity [6.9]
大規模言語モデルは、欠陥や無関係な推論トレースに依存しながら、正しい答えを生成することが多い。本稿では,新しい学習目標であるtextbfCounterfactual Sensitivity Regularization (CSR)を紹介する。 CSRは、標準的な微調整とプロセスの監督に対する忠実度を最大70パーセント向上させる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:43:39 GMT)
RL-Obfuscation: Can Language Models Learn to Evade Latent-Space Monitors? [6.9]
潜在空間モニタは、その内部表現を活用することで、大規模言語モデルにおける望ましくない振る舞いを検出することを目的としている。これは重要な疑問を提起する。モデルがそのようなモニターを避けることができるか? RL-Obfuscationを導入し,LLMを強化学習により微調整し,遅延空間モニタを回避する。トークンレベルのモニタはこの攻撃に対して非常に脆弱であるのに対して、最大プールやアテンションベースのプローブのようなより包括的なモニタは堅牢である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:43:01 GMT)
Distillation of supersinglet states [6.8]
N量子ビットからなる超特異状態に対するエンタングルメント蒸留プロトコルを導入する。このプロトコルは、ローカル操作と古典的な通信のみを使用する。量子クロック同期や暗号などの長距離アプリケーションに適している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:58:14 GMT)
FusedANN: Convexified Hybrid ANN via Attribute-Vector Fusion [6.7]
現在のソリューションでは、スケールしない脆弱なインデックスハックを頼りに、リコール、スピード、柔軟性をトレードオフしています。本稿では,属性を埋め込み,属性を緩和するハイブリッドフレームワークFusedANNを紹介する。 FusedANNは、一致が不十分な場合に、セマンティックに最も近い属性を保存しながら、ハイクセマンティクスの下で正確なフィルタリングを行う。これは、象徴的制約とベクトル類似性の間の原則付き、スケーラブルで、ブリッジを確立し、大規模、ハイブリッド、動的/MLワークロードのための新しい世代のフィルタ付き検索システムをアンロックする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:07:48 GMT)
Byam: Fixing Breaking Dependency Updates with Large Language Models [6.7]
廃止、パラメータ名や型の変更、新しいAPIへの完全な置き換えといったAPIの変更は、既存のクライアントコードを壊す可能性がある。 APIユーザがこれらのブレークの原因を特定して、それに従ってコードを更新するのは、しばしば面倒です。依存関係の更新の破壊に対応するため、クライアントコードの更新を自動化するために、LLM(Large Language Models)の使用について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:30:09 GMT)
Merging Memory and Space: A State Space Neural Operator [6.6]
State Space Neural Operator (SS-NO) は時間依存偏微分方程式の解演算子を学習するためのコンパクトなアーキテクチャである。 SS-NOは多種多様なPDEベンチマークにおける最先端性能を実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:28:46 GMT)
A Single Neuron Works: Precise Concept Erasure in Text-to-Image Diffusion Models [6.5]
単一ニューロンに基づく概念消去は、単一のニューロンのみを操作することによって有害なコンテンツ生成を防止する。 SNCEは,非ターゲット概念に対するモデルの生成能力を保ちながら,目標概念の消去において最先端の結果が得られることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:10:33 GMT)
ArchGPT: Understanding the World's Architectures with Large Multimodal Models [6.5]
本稿では,マルチモーダルな視覚的質問応答(VQA)モデルであるArchGPTを提案する。このパイプラインはArch-300Kというドメイン特化データセットを約315,000枚取得する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:49:43 GMT)
Retrieval over Classification: Integrating Relation Semantics for Multimodal Relation Extraction [6.5]
関係抽出(RE)は、非構造化テキストにおけるエンティティ間の意味的関係を特定することを目的としている。 underlineRetrieval underlineOver underlineClassification (ROC)は、リレーショナルセマンティクスによって駆動される検索タスクとしてマルチモーダルREを再構成する新しいフレームワークである。 ROCは、マルチモーダルエンコーダを通じてエンティティタイプと位置情報を統合し、大きな言語モデルを用いて関係ラベルを自然言語記述に拡張し、意味的類似性に基づくコントラスト学習を通じてエンティティ-リレーションペアを調整する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:38:38 GMT)
ARF-RLHF: Adaptive Reward-Following for RLHF through Emotion-Driven Self-Supervision and Trace-Biased Dynamic Optimization [6.5]
本稿では,自然フィードバックを連続的な嗜好軌道に変換する適応回帰追跡(ARF)を提案する。 ARFはPPOとDPOを一貫して上回り、アライメントを最大7.6%改善する。その結果,連続報酬モデリングはパーソナライズされ理論的に基礎付けられたRLHFへのスケーラブルな経路を提供することを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:04:16 GMT)
Stratify or Die: Rethinking Data Splits in Image Segmentation [6.4]
Iterative Pixel Stratification (IPS)は、セグメンテーションタスクに適したラベル対応サンプリング手法である。 We present Wasserstein-Driven Evolutionary Stratification (WDES), a novel genetic algorithm designed to minimize the Wasserstein distance。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:04:26 GMT)
IConv: Focusing on Local Variation with Channel Independent Convolution for Multivariate Time Series Forecasting [6.3]
実世界の時系列データは、変化傾向、不規則な季節性、残差など、しばしば非定常性を示す。近年,多層パーセプトロン (MLP) を用いたモデルでは,長期依存性を捕捉する性能が向上している。本稿では,時間チャネルを独立に処理し,チャネル間関係を考慮した新しいアーキテクチャIConvを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:09:37 GMT)
Go With The Flow: Churn-Tolerant Decentralized Training of Large Language Models [6.3]
GWTFは、大規模な言語モデル(LLM)のための、クラッシュ耐性のある実用的な分散トレーニングフレームワークである。リソースをボランティアする異種クライアント上でのLLMの効率的な協調トレーニングを可能にする。 GWTFはノードチャーン、すなわちクライアントがいつでもシステムに参加または離脱し、ネットワークの不安定さに対処する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:27:41 GMT)
SuperPatchMatch: an Algorithm for Robust Correspondences using Superpixel Patches [6.3]
われわれはまず,SuperPatchと呼ばれるスーパーピクセルベースのパッチを新たに導入する。提案した構造は,空間情報が自然に含まれているため,強靭な記述子となる。画像データベースから高速なセグメンテーションとラベリングを行うためのフレームワークを提案し、計算コストと精度、顔ラベリングと医用画像セグメンテーションの両面で最先端の手法の結果を比較検討した結果、我々のアプローチの可能性を実証した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:29:59 GMT)
Building Tailored Speech Recognizers for Japanese Speaking Assessment [6.2]
我々はアクセントマーカーで音声ラベルを出力する音声認識器を構築した。日本語は資源に富んでいるが、正確な音素の書き起こしを行うための訓練用データはほとんどない。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:26:11 GMT)
Sig2Model: A Boosting-Driven Model for Updatable Learned Indexes [6.1]
Sig2Modelは効率的で適応的な学習指標であり、3つの主要な手法による再学習コストを最小限に抑える。 Sig2Modelは、トレーニングコストを最大20倍に削減し、最大3倍高いQPSを実現し、最大1000倍のメモリを使用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:07:13 GMT)
Optimal Formats for Weight Quantisation [6.1]
本稿では,量子化フォーマットの体系的設計と分析のためのフレームワークを提案する。一般的なフォーマットの実践的パフォーマンスは,可変長符号を用いた値表現能力に起因していることが示される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:13:01 GMT)
Implicit Neural Representations of Intramyocardial Motion and Strain [6.0]
本研究では, 連続左室変位の予測法について, 推定時間最適化を必要とせずに提案する。 452英国のバイオバンク試験で評価したところ、この手法は最高の追跡精度 (2.14 mm RMSE) と、地球外周率 (2.86%) と放射率 (6.42%) で最小の組み合わせ誤差を達成した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:10:05 GMT)
Exploring Engagement in Hybrid Meetings [6.0]
新型コロナウイルス(COVID-19)パンデミック後のハイブリッドワークの普及により、ソフトウェア開発プラクティスが変化した。ミーティングへのリモート参加が一般的になっている一方で、孤立、疎外、リモートチームメンバー間の関与の減少につながる可能性がある。本研究の目的は,ハイブリッドミーティングにおけるエンゲージメントパターンを客観的な測定によって同定し,特徴付けることである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:07:02 GMT)
New Algorithmic Directions in Optimal Transport and Applications for Product Spaces [6.0]
アルゴリズムの観点から2つの高次元分布$mu,nu$ in$Rn$の最適輸送について検討する。実行時間は、$mu,nu$の完全な表現サイズではなく、次元に依存する。ガウス測度$varepsilon$の場合、ほとんどの$Phin$サンプルは距離$O(sqrtlog 1/varepsilon)$ in $poly(n/varepsilon)$にマッピングできる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:58:06 GMT)
Path-Controlled Secure Network Coding [5.9]
機密データを安全に共有するためのマルチキャストがますます重要になっている。現在、計算セキュリティに基づく重複・フォワードルーティングと暗号手法に依存している。経路制御されたユニバーサル・サイエント・ランプSNCはQKD/PLSネットワークにオーバーレイ可能であり,マルチキャスト容量,ITS,スケーラビリティを実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:00:44 GMT)
Smart Cellular Bricks for Decentralized Shape Classification and Damage Recovery [5.9]
本稿では,ローカル通信,処理,センシング機能を備えた物理3Dブリックの新しいシステムを提案する。様々な3次元形状を正確に分類するために,数百個の細胞レンガを収集できることを実証する。形状推論に加えて、同じ分散化フレームワークを拡張して、欠落したコンポーネントや損傷したコンポーネントを検出する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:44:16 GMT)
Semantic Edge-Cloud Communication for Real-Time Urban Traffic Surveillance with ViT and LLMs over Mobile Networks [5.9]
インテリジェント・トランスポーテーション・システム(ITS)にとって、道路の安全を確保し、交通の流れを最適化し、車両軌道を追跡し、スマートシティでの衝突を防止するために、リアルタイムの都市交通監視が不可欠である。本稿では,送信オーバヘッドを大幅に低減する意味コミュニケーションフレームワークを提案する。従来の収穫画像では93%の精度で89%のLLM応答精度を維持しながら,データ伝送サイズを99.9%削減する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:53:36 GMT)
RAM-NAS: Resource-aware Multiobjective Neural Architecture Search Method for Robot Vision Tasks [5.8]
RAM-NASモデルは、ImageNet上で76.7%から81.4%の範囲でトップ1の精度を達成することができる。リソースを意識した多目的NASは,ロボットのエッジハードウェアにおけるモデルの推論遅延を大幅に低減する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:42:57 GMT)
Locally Adaptive Conformal Inference for Operator Models [5.8]
演算子モデルに対して関数値の局所適応予測セットを生成するための分散フリーフレームワークであるLocal Sliced Conformal Inference (LSCI)を紹介する。我々は有限サンプルの有効性を証明し、局所交換性の下でのカバレッジギャップにデータ依存の上限を導出する。偏りのある予測や分布外雑音に対する空間を実証的に実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:26:06 GMT)
Language-Guided Multi-Agent Learning in Simulations: A Unified Framework and Evaluation [5.7]
本稿では,大規模言語モデル(LLM)をマルチエージェント強化学習(MARL)に組み込んだ統合フレームワークを提案する。フレームワークにはCoordinator、Communicator、Memoryの3つのモジュールコンポーネントがあり、サブゴールを動的に生成する。 Google Research Football、Magent Battle、StarCraft IIで評価されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:04:28 GMT)
Meta-Memory: Retrieving and Integrating Semantic-Spatial Memories for Robot Spatial Reasoning [5.7]
本稿では,環境の高密度メモリ表現を構築する,大規模言語モデル(LLM)駆動エージェントであるMeta-Memoryを提案する。メタメモリの重要な革新は、意味論と空間的モダリティに関する共同推論を通じて関連する記憶を検索し、統合する能力にある。実験の結果、Meta-MemoryはSpaceLocQAとパブリックなNaVQAベンチマークの両方で最先端の手法を著しく上回っていることがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:22:52 GMT)
Thinking Outside the (Gray) Box: A Context-Based Score for Assessing Value and Originality in Neural Text Generation [5.7]
創造的なタスクのための大きな言語モデルは、しばしば多様性を欠いている。高温でのサンプリングのような一般的なソリューションは、結果の品質を損なう可能性がある。価値と独創性を定量的に評価する文脈に基づくスコアを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:33:30 GMT)
Wav2Arrest 2.0: Long-Horizon Cardiac Arrest Prediction with Time-to-Event Modeling, Identity-Invariance, and Pseudo-Lab Alignment [5.7]
高周波生理学的波形モダリティは、患者の状態に対する深いリアルタイムな洞察を提供する。近年、心臓発作を含む重要な事象を予測するための生理学的基礎モデルが示されている。最小限の補助情報を用いてPSGのみのCAシステムを改善するための3つの改良点を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:46:39 GMT)
Rejuvenating Cross-Entropy Loss in Knowledge Distillation for Recommender Systems [5.7]
本稿では,レコメンダシステムにおける知識蒸留(KD)のクロスエントロピー(CE)損失を分析した。アイテムサブセット上でKDを実行する場合、CE損失を最小限に抑えることで、NDCGの下位境界が最大になることを示す。知識蒸留のための共役クロストロピー(RCE-KD)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:31:59 GMT)
Generalizing while preserving monotonicity in comparison-based preference learning models [5.7]
拡散優先度を持つ線形一般化ブラッドレー・テリーモデルの新しいクラスを提案する。実験の結果,新しい一般化モデルでは,特にデータセットが限定された場合,精度が向上することがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:18:45 GMT)
DENet: Dual-Path Edge Network with Global-Local Attention for Infrared Small Target Detection [5.7]
災害警報や海上監視といったリモートセンシングアプリケーションには、赤外線小目標検出が不可欠である。このタスクの深層モデルの設計における根本的な課題は、微小目標に対する高解像度の空間的詳細を捉えることと、より大きな目標に対する堅牢な意味的コンテキストを抽出することの相違にある。既存の手法は、低コントラストと高雑音下でターゲットエッジを正確に抽出するには不十分な、固定勾配演算子や単純な注意機構に頼っていることが多い。本稿では,エッジ拡張とセマンティックモデリングを2つの補完処理経路に分離することで,この課題に対処する新しいDual-Path Edge Networkを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:08:26 GMT)
GRPO is Secretly a Process Reward Model [5.6]
GRPO RLアルゴリズムは実世界の条件下で非自明なプロセス報酬モデルを生成する。この欠陥を軽減するために,アルゴリズムの簡単な修正を提案する。この結果から,GRPO の高コストで明示的な PRM の利点を疑問視する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:40:36 GMT)
Network Formation and Dynamics Among Multi-LLMs [5.5]
ソーシャルネットワークは、人間が意見を作り、情報を交換し、まとめる方法に大きな影響を与える。大規模言語モデル(LLM)は、社会的および専門的な環境にますます組み込まれているため、それらの相互作用が人間に似たネットワーク力学に近似するかどうかを理解することが重要である。我々は,複数のLLMエージェントのネットワーク形成挙動を解析し,人的決定に対してそれらをベンチマークする枠組みを開発した。 LLMは、コミュニティ構造や小世界効果を含むマクロレベルの特性だけでなく、優先的なアタッチメント、三進的クロージャ、ホモフィリーといった基本的ミクロレベルの原則を一貫して再現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:27:44 GMT)
Estimating Deep Learning energy consumption based on model architecture and training environment [5.5]
モデルアーキテクチャと学習環境がエネルギー消費に与える影響について検討する。適切なモデル学習環境の組み合わせを選択することで、トレーニングのエネルギー消費を最大80.68%削減できることがわかった。本稿では,STEP(Stable Training Epoch Projection)とPRE(Pre-Treging Regression-based Estimation)手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:25:25 GMT)
AuthPrint: Fingerprinting Generative Models Against Malicious Model Providers [5.5]
本稿では,認証モデルの出力空間から隠れ指紋を抽出し,検知器を訓練する信頼性検証器を提案する。検証中、この検出器は、特別なハードウェアやモデル修正を必要とせずに、新しい出力が認定されたモデルと一致しているかどうかを判断できる。 GANと拡散モデルの両方でFPR@95%TPRをほぼゼロとする実験を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:41:41 GMT)
SD-RetinaNet: Topologically Constrained Semi-Supervised Retinal Lesion and Layer Segmentation in OCT [5.4]
完全微分可能なバイオマーカートポロジエンジンを導入した新しい半教師付きモデルを提案する。我々のモデルは、空間的要素とスタイル要素を分離して、不整合表現を学習する。我々は,OCTスキャンの公開および内部データセット上で提案したモデルを評価し,病変と層分断の双方において現状よりも優れた性能を示すことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:56:38 GMT)
Two-level overlapping additive Schwarz preconditioner for training scientific machine learning applications [5.4]
我々は、科学機械学習アプリケーションのトレーニングを加速するための、2レベル重なり合う新しいシュワルツプレコンディショナーを紹介する。提案したプレコンディショナーの設計は、非線形二段重なり合うシュワルツプレコンディショナーによって動機付けられている。提案した2レベルプレコンディショナーは、標準(LBS)の収束を著しく高速化するとともに、より正確な機械学習モデルを生成することを実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:17:33 GMT)
GenFacts-Generative Counterfactual Explanations for Multi-Variate Time Series [5.4]
我々は,クラス識別型変分オートエンコーダに基づく生成フレームワークGenFactsを紹介する。我々は,レーダジェスチャデータに対するGenFactsを産業的ユースケースとして,手書き文字トラジェクトリを直感的なベンチマークとして評価した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:22:19 GMT)
Holevo Cramér-Rao bound: How close can we get without entangling measurements? [5.3]
プローブ状態の複数の同一コピーに対するエンタングリング測定は、各プローブを個別に測定するよりも優れていることが知られている。本研究では,集団量子計測が個々の測定値に対して与えうる最大精度の向上について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:15:22 GMT)
The Impact of Audio Watermarking on Audio Anti-Spoofing Countermeasures [5.3]
本稿では,音声透かしがスプーフィング対策に与える影響について検討する。我々はWatermark-Spoofingデータセットという,透かし強化されたトレーニングと評価データセットを構築した。実験の結果, 透かし性能は一貫して低下し, 透かし密度は高いEERと相関していることがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:34:39 GMT)
MoCLIP-Lite: Efficient Video Recognition by Fusing CLIP with Motion Vectors [5.2]
MoCLIP-Liteは、効率的なビデオ認識のためのシンプルだが強力な2ストリーム遅延融合フレームワークである。提案手法は,凍結したCLIP画像エンコーダと,生のMVで訓練された軽量で教師付きネットワークの機能を組み合わせたものである。提案手法は89.2%のTop-1精度を実現し,強いゼロショット(65.0%)とMVのみ(66.5%)のベースラインを著しく上回っている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:09:09 GMT)
Markup Language Modeling for Web Document Understanding [5.2]
本研究は,ショッピングレビューサイトから詳細な情報を抽出することで,最新の製品データベースを構築することの課題を考察する。異なるサイズのレビューサイトから収集した製品データに基づいてMarkupLMを微調整し、MarkupLM++と呼ばれる変種を開発しました。最終モデルは0.906、リコールは0.724、F1スコアは0.805に達した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:25:43 GMT)
Designing for Novice Debuggers: A Pilot Study on an AI-Assisted Debugging Tool [5.2]
本研究は,大学院生のグループで行った第2の設計デバッガーから得られた知見を報告する。その結果,本ツールは意味的誤りの解消に極めて有効であり,第1版よりも使いやすくなっていることがわかった。学生との対話を最適化するためには、ユーザープロファイルに基づいてAI支援デバッグツールをパーソナライズする必要があると結論付けている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:18:20 GMT)
MS-YOLO: Infrared Object Detection for Edge Deployment via MobileNetV4 and SlideLoss [5.2]
我々は YOLOv8 の CSPDarknet バックボーンを MobileNetV4 に置き換える textttMS-YOLO (textbfMobileNetv4 および textbfSlideLoss based YOLO) を提案する。 FLIR ADAS V2ベンチマークの実験では、 textttMS-YOLO は textbf6.7 GFLOPs でのみ動作しながら、競合する mAP と優れた精度を実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:48:06 GMT)
Radiation of "breathing" vortex electron packets in magnetic field [5.1]
振動電荷分布は磁場中で光子を放出することが期待される。この放射によってOAMが取り除かれ、電子の渦性が失われるのか? 我々は、縦磁場中を伝播しながら、渦電子がエネルギーとOAMを失う速度を定量化し、放射された電界の総放射パワーと角運動量を計算する。我々は、少なくとも準古典近似において、線形加速器が相対論的渦電子や他の荷電粒子の渦性を維持するための顕著なツールであることを示す放射パワーと角運動量損失の両方が無視可能であることを発見した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:08:23 GMT)
Lower Bounds for Learning Hamiltonians from Time Evolution [5.1]
我々はハミルトニアンを時間進化から学ぶことの問題を考察する。逆時間分解能を持つ任意の学習アルゴリズムは、超ポリノミカルな全進化時間を必要とすることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:50:55 GMT)
Expressiveness of Multi-Neuron Convex Relaxations in Neural Network Certification [5.1]
本稿では, マルチニューロン緩和の表現性について, 厳密な分析を行った。有限個のニューロンと最適層を捉えるのに十分な資源を割り当てた場合でも、それらが本質的に不完全であることを示す。本研究は, マルチニューロン緩和の基礎を築き, 信頼性の高いロバスト性を示す新たな方向を示すものである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:51:41 GMT)
TRACED: Transition-aware Regret Approximation with Co-learnability for Environment Design [5.0]
深い強化学習エージェントを目に見えない環境に一般化することは、依然として大きな課題である。有望な解決策の1つは、教師が高い学習可能性を持つタスクを適応的に生成する共進化的フレームワークであるUnsupervised Environment Design (UED)である。環境設計のための共学習性を考慮した遷移認識レギュレット近似(TRACED)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:03:33 GMT)
Supervised Graph Contrastive Learning for Gene Regulatory Networks [5.0]
Graph Contrastive Learning(GCL)は,グラフ摂動によるデータ拡張を行う,強力な自己教師型学習フレームワークである。 GCLでよく用いられる人工摂動、例えばノードの落下は、生物学的現実から分岐できる構造変化を誘導する。遺伝子ノックダウン実験の生物学的摂動を直接監視する新しいGCL法であるSupGCLを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:44:32 GMT)
Intelligent Graybox Fuzzing via ATPG-Guided Seed Generation and Submodule Analysis [5.0]
ハードウェアファジィングは、現代のハードウェア設計におけるセキュリティ欠陥を見つけるための重要なテクニックの1つである。 Coverage-Guided Fuzzing (CGF) 法はデザインをより効果的に探索するのに役立つが、ハードウェアの特定の部分に焦点を合わせるのに苦労する。 DirectFuzzのような既存のDGF(Directed Gray-box Fuzzing)技術は、ターゲットテストを生成することでこれを解決しようとしている。本稿では, DGF アプローチに倣い, ファジングと自動テストパターン生成(ATPG)を組み合わせてより効率的なファジングを実現する新しいフレームワーク PROFUZZ を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:46:19 GMT)
Teaching RL Agents to Act Better: VLM as Action Advisor for Online Reinforcement Learning [5.0]
視覚言語アクション(VLA)ポリシーは、多様なタスクを解決するための有望な方向を表す。我々は、視覚言語モデル(VLM)のドメイン知識を活用するフレームワークであるtextbf VARL(textbfVLM as textbfAction Advisor for online textbfReinforcement textbfL)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:16:34 GMT)
Predictive Coding-based Deep Neural Network Fine-tuning for Computationally Efficient Domain Adaptation [5.0]
デバイス上でのドメイン適応を効率的に行うためのハイブリッドトレーニング手法を提案する。この方法は、バックプロパゲーションを使用してオフラインでトレーニングされたディープニューラルネットワークから始まる。予測符号化はオンライン適応に使用されており、入力データ分布の変化によって失われた精度を復元することができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:18:57 GMT)
ExMolRL: Phenotype-Target Joint Generation of De Novo Molecules via Multi-Objective Reinforcement Learning [5.0]
ExMoIRLは、デノボ分子生成のための表現型および標的特異的なキューを統合する新しい生成フレームワークである。ドッキング親和性と薬物類似度スコアを融合させ、ランキング損失、前装正規化、エントロピーを増強する。大規模な実験では、ExMoIRLは最先端およびターゲットベースモデルよりも優れた性能を示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:13:24 GMT)
Multi-Objective Reinforcement Learning for Large Language Model Optimization: Visionary Perspective [5.0]
大規模言語モデル(LLM)における多目的強化学習(MORL)の課題と機会我々はMORL分類法を導入し、LLM最適化に適用した場合の様々なMORL法の利点と限界について検討する。本稿では,様々な手法が多様な客観的関係に与える影響に対処するMORLベンチマークフレームワークのビジョンを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:29:08 GMT)
ILRe: Intermediate Layer Retrieval for Context Compression in Causal Language Models [5.0]
ILRe(Intermediate Layer Retrieval)と呼ばれる新しいコンテキスト圧縮パイプラインを導入する。 ILReは、チャンクされたプリフィルをその層にだけストリーミングすることでコンテキストをエンコードし、入力クエリと指定された層のフルキーキャッシュの間のアテンションスコアによってトークンをリコールする。追加のポストトレーニングやオペレータ開発がなければ、ILReは100万ドルのトークン要求を30分以内で処理できる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:30:06 GMT)
Actor-Critic without Actor [4.9]
Actor-Critic without Actor (ACA)はアクターネットワークを排除し、ノイズレベルの批評家の分野から直接アクションを生成する軽量なフレームワークである。 ACAは、標準的なアクター批判法と最先端拡散法の両方と比較して、より好ましい学習曲線と競争性能を達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:33:09 GMT)
Time series saliency maps: explaining models across multiple domains [4.9]
本稿では,統合勾配の一般化であるクロスドメイン統合勾配について紹介する。我々の方法は、時間領域の可逆かつ微分可能な変換として定式化できる任意の領域における特徴属性を可能にする。これらの結果は、時系列モデルにおいて意味論的に意味のある洞察を提供するクロスドメイン統合勾配の能力を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:00:49 GMT)
Fractal Graph Contrastive Learning [4.9]
Fractal Graph Contrastive Learning (FractalGCL)は、2つの重要なイノベーションを紹介する理論駆動のフレームワークである。フォールバック機構は、非フラクタルグラフでさえパフォーマンスの低いバウンドを保証する。実験によると、FractalGCLは標準ベンチマークで最先端の結果を提供するだけでなく、従来と最新のトラフィックネットワークのベースラインを平均で約4%上回っている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:50:34 GMT)
Recov-Vision: Linking Street View Imagery and Vision-Language Models for Post-Disaster Recovery [4.9]
災害後のビルレベルの占有は、トリアージ、検査、ユーティリティーの再エネルギー化、資源配分等に不可欠である。本稿では、パノラマ動画をパーセルにリンクし、ファサードにビューを修正し、解釈可能な属性を付与するフレームワークであるFacadeTrackを紹介する。 2段階のアプローチは、0.927の精度、0.781のリコール、F-1のスコアを0.848の精度で達成し、1段階のベースラインの0.943の精度、0.728のリコール、F-1のスコアを0.822の精度で達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:01:38 GMT)
Operator entanglement in $\mathrm{SU}(2)$-symmetric dissipative quantum many-body dynamics [4.9]
対称性の存在は、オープン量子多体系における作用素の絡み合いの非自明なダイナミクスをもたらす可能性がある。散逸性量子多体系における演算子絡み合いの遠方平衡力学を数値的に研究する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:06:12 GMT)
Single Answer is Not Enough: On Generating Ranked Lists with Medical Reasoning Models [4.9]
本稿では,医療推論モデルによる回答ランキング作成のための体系的研究について述べる。本稿では、ランク付けされたリストと2つのアプローチ、即興と微調整の代替フォーマットを提案する。いくつかのSFTモデルは特定の回答形式に一般化するが、RFTで訓練されたモデルは複数のフォーマットでより堅牢であることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:59:23 GMT)
BabyLM's First Constructions: Causal probing provides a signal of learning [4.9]
2024年のBabyLM Challengeにおける言語モデルの構築学習の評価を行った。以上の結果から, 発達的に妥当なデータ量で訓練しても, モデルは多様な構成を学習することがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:38:36 GMT)
Efficient Sparse State Preparation via Quantum Walks [4.9]
我々は,単一エッジと自己ループの動的CTQWを計算のゲートモデルに変換するアルゴリズムを開発した。このマッピングを用いて、動的CTQWに基づく効率的な量子状態準備フレームワークを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:25:25 GMT)
Communication Bias in Large Language Models: A Regulatory Perspective [4.8]
本稿では、EUのAI法やデジタルサービス法のようなフレームワークに焦点を当て、バイアスのあるアウトプットのリスクとその社会的影響をレビューする。絶え間ない規制を超えて、公正で信頼できるAIを確保するためには、競争やデザインガバナンスへのより強い注意が必要である、と私たちは主張する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:25:06 GMT)
OmniPlantSeg: Species Agnostic 3D Point Cloud Organ Segmentation for High-Resolution Plant Phenotyping Across Modalities [4.8]
ハードウェアやニューラルネットワークの入力サイズ要件を満たすために、広範な前処理とプラントポイントクラウドのダウンサンプルを使用することが一般的である。我々は,センサデータや植物種に依存しない生物点雲のサブサンプリングのための,単純かつ効果的なアルゴリズムKDSSを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:45:14 GMT)
Real-Time System for Audio-Visual Target Speech Enhancement [4.8]
本稿では,CPU上で完全に動作するように設計されたリアルタイム音声・視覚音声強調システムを提案する。 RAVENは、音声・視覚音声認識モデルからの事前学習された視覚埋め込みを用いて、唇の動き情報をエンコードすることで、このギャップを埋める。このデモでは、参加者はマイクとウェブカメラのセットアップを使って、ヘッドフォンによるクリーンな音声再生によって、ライブの音声と視覚のターゲット音声の強調を体験することができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:45:28 GMT)
AMPED: Adaptive Multi-objective Projection for balancing Exploration and skill Diversification [4.7]
スキルベース強化学習(SBRL)は、スキル条件付き政策を事前訓練することにより、スパース報酬のある環境への迅速な適応を可能にする。探索とスキル多様化(AMPED)のバランスをとるための新しい手法である適応多目的投影法を提案する。提案手法は,SBRLのベースラインを超える性能を,様々なベンチマークで達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:57:59 GMT)
LiLAW: Lightweight Learnable Adaptive Weighting to Meta-Learn Sample Difficulty and Improve Noisy Training [4.7]
軽量学習型適応重み付け(LiLAW)は,各トレーニング試料の損失重みを,その進行困難度に基づいて動的に調整する手法である。 LiLAWは高雑音環境でも継続的に性能を向上する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:13:25 GMT)
Enhanced Generative Machine Listener [4.6]
本稿では,MUSHRAスコアによる主観的音質予測のための基準ベースモデルGMLv2を提案する。多様なテストセットに関する広範な評価は、提案されたGMLv2が、PEAQやViSQOLなど、広く使用されているメトリクスを一貫して上回っていることを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:29:25 GMT)
CompressAI-Vision: Open-source software to evaluate compression methods for computer vision tasks [4.6]
下流視覚タスクに最適化された圧縮手法の実装と評価には,統合されたプラットフォームが必要である。 CompressAI-Visionは、視覚ネットワークの入力を効率的に圧縮するために、新しいコーディングツールが競合する総合的な評価プラットフォームとして導入された。この評価プラットフォームはオープンソースソフトウェアとして開発され、Moving Pictures Experts Groupによって採用されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:01:55 GMT)
Agribot: agriculture-specific question answer system [4.6]
このシステムは文の埋め込みモデルに基づいており、精度は56%である。コールセンターの従業員の仕事はより簡単になり、様々な労働者のハードワークはより良い目標にリダイレクトできる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:22:09 GMT)
Seeing Through Words, Speaking Through Pixels: Deep Representational Alignment Between Vision and Language Models [4.5]
両モデルタイプの中間層から後期層にアライメントピークが存在することが判明した。画像キャプチャマッチの人間の好みは、すべての視覚言語モデルペアの埋め込み空間に反映される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:16:28 GMT)
Spiking Brain Compression: Exploring One-Shot Post-Training Pruning and Quantization for Spiking Neural Networks [4.5]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェアの実装に適したエネルギー効率の良いニューラルネットの新世代として登場した。近年,SNNの効率向上のために,軽量プルーニングと量子化が検討されている。我々は,スポーキング脳圧縮(SBC)という,訓練後プルーニング/量子化のための新しいワンショットフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:53:36 GMT)
Provably Sample-Efficient Robust Reinforcement Learning with Average Reward [4.5]
本稿では,$ell_p$-normと汚染モデルにより特徴付けられる遷移不確実性を持つロバストなマルコフ決定過程(MDP)を設計した新しいアルゴリズムを提案する。我々のアルゴリズムは、頑健なMDPの事前知識を必要とせずに動作する。我々の研究は、ロバスト平均報酬RLのサンプル効率の基本的な理論的理解を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:09:15 GMT)
Reconfigurable Physical Unclonable Function based on SOT-MRAM Chips [4.5]
物理的非拘束機能(PUF)は、デバイス固有の暗号鍵を生成する。 CMOS集積SOT-MRAMチップにおけるrPUFのデュアルパルス再構成方式を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:23:52 GMT)
Beyond Ensembles: Simulating All-Atom Protein Dynamics in a Learned Latent Space [4.5]
LD-FPGの学習潜在空間内でのダイナミクスをシミュレーションするモジュールコンポーネントであるGraph Latent Dynamics Propagator (GLDP)を紹介する。我々は,スコア誘導ランゲヴィン力学,(ii)クープマンに基づく線形作用素,(iii)自己回帰ニューラルネットワークの3種類のプロパゲータを比較した。統合エンコーダ・プロパゲータ・デコーダ・フレームワーク内では、長い水平安定性、バックボーンとサイドチェーンのアンサンブルの忠実さ、機能的自由エネルギーの景観を評価する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:07:28 GMT)
No Alignment Needed for Generation: Learning Linearly Separable Representations in Diffusion Models [4.5]
本稿では,中間層表現の線形SEP (Linear SEParability) の促進に基づく,学習のための代替正規化を提案する。本結果は,フローベーストランスアーキテクチャにおけるトレーニング効率と生成品質の両面で大幅に向上したことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:46:48 GMT)
TyphoonMLA: A Mixed Naive-Absorb MLA Kernel For Shared Prefix [4.5]
MLA(Multi-Head Latent Attention)は、DeepSeek-v3やKim K2といった最先端のLLMで採用されている、最近の注目メカニズムである。新たな定式化により、MLAは2つの機能的に等価だが、計算的に異なるカーネル実装(ナイーブと吸収)を可能にする。我々は,両者の強みを活かすために,ナイーブと吸収式を組み合わせたハイブリッドアプローチであるTyphoonMLAを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:32:02 GMT)
PARS: Low-Latency LLM Serving via Pairwise Learning-to-Rank [4.4]
本稿では,PLMタスクスケジューラPARSを紹介する。最短ジョブ優先(SJF)スケジューリングを、ペアのランキングとマージンランキングの損失で近似する。応答長ベースのタスク順序付けを効果的に予測し、オーバーヘッドを最小限に抑えてレイテンシを低減する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:26:38 GMT)
General Pruning Criteria for Fast SBL [4.4]
スパースベイズ学習(SBL)は、各重みがガウス分布でゼロ平均と精度(逆分散)が関連するハイパーパラメータと等しいと仮定して、基底線形モデルの各重みにハイパーパラメータを関連付ける。ガウスの場合、2つの条件は相補的であり、高速なSBL(F-SBL)のプルーニング条件と一致することが示され、このアルゴリズムについてさらなる知見が得られた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:52:28 GMT)
Reliability Analysis of Fully Homomorphic Encryption Systems Under Memory Faults [4.3]
ホモモルフィック暗号化(英: Homomorphic Encryption、FHE)は、暗号のパラダイムシフトであり、暗号化されたデータを直接計算し、プライバシクリティカルな計算をアンロックすることを可能にする。本稿では,FHEがメモリ障害の存在下でどのように振る舞うかを,個々の操作やアプリケーションレベルで,異なるFHEスキームに対してより深く理解することを目的とする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:40:16 GMT)
Mixture of Thoughts: Learning to Aggregate What Experts Think, Not Just What They Say [4.3]
Mixture of Thoughts (MoT) は、グローバルなルーティング方式の下で、異種の専門家間の潜在レベル協調のための単純な方法である。 MoTは現在のルーティングと集約ベースのアベンジャーズをそれぞれ$+0.38%$と$+2.92%$で上回っている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:50:09 GMT)
Improving Early Sepsis Onset Prediction Through Federated Learning [4.3]
本稿では,セプシオンセット予測のためのフェデレーション・アテンション強化長短期記憶モデルを提案する。固定予測ウィンドウに依存する既存のアプローチとは異なり、我々のモデルは可変予測水平線をサポートしている。固定ウィンドウではなく変数予測ウィンドウを採用するという選択は,性能を著しく損なうものではなく,計算,通信,組織的オーバーヘッドを低減させることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:19:22 GMT)
Federated Markov Imputation: Privacy-Preserving Temporal Imputation in Multi-Centric ICU Environments [4.3]
我々は,集中ケアユニット(ICU)が時間的インプットのためのグローバル移行モデルを協調的に構築できるプライバシー保護手法であるFederated Markov Imputation (FMI)を提案する。我々は、MIMIC-IVデータセットを用いて、実世界のセシオンセット予測タスク上でFMIを評価し、局所的な計算基準よりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:00:05 GMT)
Distribution-Controlled Client Selection to Improve Federated Learning Strategies [4.3]
フェデレートラーニング(Federated Learning, FL)は、複数のクライアントが共同で共有モデルをトレーニングできる分散ラーニングパラダイムである。クライアント間のデータ不均衡の存在は、共有モデルの性能が低下する原因となるFLの成功へのスレッドである。本稿では,既存のFL戦略を拡張し,現在のラベル分布と2つのターゲット分布のうちの1つを最適に整合させるアクティブクライアントを選択する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:07:13 GMT)
How to Evaluate Medical AI [4.2]
アルゴリズム診断(RPAD, RRAD)の相対精度とリコールについて紹介する。 RPADとRADは、AIの出力を単一の参照ではなく複数の専門家の意見と比較する。大規模な研究によると、DeepSeek-V3のようなトップパフォーマンスモデルは、専門家のコンセンサスに匹敵する一貫性を達成している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:31:04 GMT)
It's not Easy: Applying Supervised Machine Learning to Detect Malicious Extensions in the Chrome Web Store [4.2]
そのような拡張の最もよく知られているマーケットプレースは、Chrome Web Store (CWS) である。このような拡張機能は、Google自身による審査プロセスの後にのみ、ユーザに提供される。ここでは、教師付き機械学習(ML)に依存する自動メカニズムが、CWS上の悪意ある拡張を検出するのにどの程度有効であるかを精査する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:03:06 GMT)
Accelerate Creation of Product Claims Using Generative AI [4.2]
$textbfClaim Advisor$はクレーム検索、生成、最適化、シミュレーションのスピードと経済性を損なうように設計されている。 1)既存の請求項及び/または消費者の声に共鳴する視覚を意味的に検索し,識別する機能,(2)製品の説明と消費者プロファイルに基づいてクレームを生成し,/または最適化する機能,(3)合成消費者によるシミュレーションを用いて作成したクレームのランキングと/または手動で作成する機能,の3つがある。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:17:13 GMT)
Entanglement distillation on symmetric two-qutrit entangled states of rank five [4.1]
エンタングルメント蒸留は理論上も実用上も、量子情報の鍵となるステップである。非陽性部分移動(NPT)が4位以上で絡み合った状態は局所的な手術や古典的なコミュニケーションで1-蒸留可能であることが証明されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:52:56 GMT)
Frictional Q-Learning [4.1]
連続制御のための深層強化学習アルゴリズムであるFrictional Q-learningを提案する。我々のアルゴリズムはエージェントの行動空間を制約し、正規直交作用空間の多様体からの距離を維持しながら、リプレイバッファと同様の振る舞いを奨励する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:26:16 GMT)
Dual-Head Reasoning Distillation: Improving Classifier Accuracy with Train-Time-Only Reasoning [4.1]
本稿では,デコーダのみの言語モデル(LM)の簡易訓練法であるDHRDを紹介する。 7つのスーパーGLUEタスクにおいて、DHRDはプールされたベースラインよりも0.65-5.47%の相対的なゲインを得る。テスト時に推論ヘッドを無効にするため、推論スループットはプール化された分類器と一致し、同じバックボーン上のCoTデコーディングをQPSで96-142倍超える。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:47:19 GMT)
Consistency Models as Plug-and-Play Priors for Inverse Problems [4.1]
拡散逆問題解法は、非条件スコア関数と前方過程に関する後部近似の組み合わせを用いて測定されたデータの後部から標本化することを目的としている。我々は, 塗装, 勾配ノイズ注入, 磁気共鳴画像再構成など, 様々な逆問題に対するアプローチを評価した。私たちの知る限りでは、これがMRIでトレーニングされた初めてのCMです。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:27:56 GMT)
Empirical PAC-Bayes bounds for Markov chains [4.0]
マルコフ連鎖に対する新しいPAC-Bayesのバウンドを証明する。この境界は擬スペクトルギャップと呼ばれる量に依存する。シミュレーション実験では、境界の経験的バージョンは本質的に経験的でないものと同じくらいきつくなっている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:28:49 GMT)
Aligning Inductive Bias for Data-Efficient Generalization in State Space Models [4.0]
モデリングにおける次のフロンティアの1つは、データ効率である。この問題を解決するための原則的枠組みを導入する。本稿では,タスク依存初期化(TDI: Task-Dependent Initialization: タスク依存初期化)手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:14:44 GMT)
Acoustic-based Gender Differentiation in Speech-aware Language Models [4.0]
音声認識言語モデル(SpeechLMs)は、音声ベースのコミュニケーションを可能にすることによって、人間とAIの相互作用を根本的に変える。本稿では,ジェンダー・インディペンデント,ジェンダー・ステレオタイプ,ジェンダー・インディペンデントという3つのカテゴリにまたがる9,208の音声サンプルを含む,この現象の系統的解析を可能にする新しいデータセットを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:15:01 GMT)
ixi-GEN: Efficient Industrial sLLMs through Domain Adaptive Continual Pretraining [4.0]
オープンソースの大規模言語モデル(LLM)は、エンタープライズアプリケーションにチャンスを広げました。多くの組織は、大規模なモデルをデプロイし、メンテナンスするインフラをまだ持っていない。小型LLM(sLLM)は、固有の性能制限にもかかわらず、実用的な代替品となっている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:48:59 GMT)
Technical report on label-informed logit redistribution for better domain generalization in low-shot classification with foundation models [3.9]
信頼度校正は、基礎モデルに基づく現実世界の意思決定システムにおいて、新たな課題である。本研究では,微調整の際,不正分類を罰する損失目標に組み込んだペナルティを提案する。 CMP(textitconfidence misalignment penalty)と呼ぶ。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:54:10 GMT)
Domain-Aware Speaker Diarization On African-Accented English [3.9]
我々は,重なり合うような厳密なDERプロトコルの下で,一般と臨床の対話システムの評価を行った。臨床スピーチには一貫したドメインペナルティが出現し、モデル全体でも重要な存在である。その結果, 重なり認識されたセグメンテーションと, 臨床資源のバランスが, 次のステップとして示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:38:51 GMT)
Uncertainty-Aware Knowledge Tracing Models [3.9]
我々は,予測の不確実性を捉えることによって,知識追跡モデルに新たな機能を加えるアプローチを示す。我々は、KTモデルの不確実性は情報であり、この信号が教育学習プラットフォームにおける応用に教育的に有用であることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:06:02 GMT)
VoiceBBQ: Investigating Effect of Content and Acoustics in Social Bias of Spoken Language Model [3.9]
VoiceBBQ(VoiceBBQ)は、不明瞭または曖昧な文脈を示すことによって社会的バイアスを測定するデータセットである。データセットは、すべてのBBQコンテキストを制御された音声条件に変換し、元のテキストベンチマークに匹敵するアクセントの精度、バイアス、一貫性のスコアを可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:54:31 GMT)
Parameter-Efficient Adaptation of Geospatial Foundation Models through Embedding Deflection [3.8]
DEFLECTは、非常に少数のパラメータを持つマルチスペクトル衛星画像にGFMを適用するための新しい戦略である。 5-10$times$より少ないパラメータで、オンパーまたはより高い精度で分類とセグメンテーションタスクを実現する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:52:37 GMT)
Structure-Attribute Transformations with Markov Chain Boost Graph Domain Adaptation [3.8]
グラフ領域適応のための新しいフレームワークとして,Markov Chain (SATMC) を用いた構造属性変換を提案する。 SATMCは、グラフ構造と属性変換の両方を通して、ネットワーク間の分布を逐次整列する。 9組のパブリックなクロスドメインデータセットの実験により、SATMCはクロスネットワークノード分類タスクにおいて最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:09:53 GMT)
Can social media provide early warning of retraction? Evidence from critical tweets identified by human annotation and large language models [3.8]
この調査は、604件の削除記事を参照する3,815件のツイートと、668件の非削除記事を参照する3,373件のツイートを分析した。人間のアノテーションは、削除された記事の8.3%が、削除される前に少なくとも1つの重要なツイートに関連付けられていることを明らかにした。この研究は、ソーシャルメディア信号と生成AI技術が組み合わさって、研究の整合性を高める努力をどのように支援するかについての洞察を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:58:23 GMT)
A Variational Framework for Residual-Based Adaptivity in Neural PDE Solvers and Operator Learning [3.8]
残差ベースの適応戦略は機械学習で広く使われているが、多くは残っている。残差の凸変換を統合することにより,これらの手法を形式化する統一的変分フレームワークを導入する。本結果は,残差に基づく適応性の理論的正当性を提供し,原理的離散化と訓練戦略の基礎を確立した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:51:05 GMT)
Fine-tuning of Large Language Models for Domain-Specific Cybersecurity Knowledge [3.7]
大規模言語モデル(LLM)にサイバーセキュリティ知識を組み込むための微調整戦略サイバーセキュリティのQ&Aデータセットを用いて、スーパーバイザードファインチューニング(SFT)、ローランク適応(LoRA)、量子化ローランク適応(QLoRA)について検討した。我々の研究は、汎用LLMとドメイン固有のアプリケーション間のギャップを埋めるための低ランク微調整戦略の可能性を強調している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:25:11 GMT)
On the System Theoretic Offline Learning of Continuous-Time LQR with Exogenous Disturbances [3.7]
線形二次規制 (LQR) 戦略のオフライン設計を不確実な乱れを伴う解析を行う。我々のアプローチは、適応動的プログラミングの基本的な学習ベースのフレームワークの上に構築されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:03:42 GMT)
Formalising Human-in-the-Loop: Computational Reductions, Failure Modes, and Legal-Moral Responsibility [3.6]
我々はAIシステムのための異なるHuman-in-the-loop(HITL)セットアップを定式化する。異なる設定の法的地位と安全性は大きく異なることを示す。本稿では,HITLの障害モードを分類するための分類法を提案し,HITL設定の実用的限界を強調した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:54:54 GMT)
Mixture-of-Experts Framework for Field-of-View Enhanced Signal-Dependent Binauralization of Moving Talkers [3.6]
信号マッチングにおけるフィールド・オブ・ビュー・エンハンスメントのための新しい専門家フレームワークを提案する。提案手法は, 連続した話者の動きに適応し, ユーザが選択した方向からの音声を強調・抑制できる動的空間音響レンダリングを実現する。これにより、移動音源のリアルタイム追跡と強化が可能になり、音声フォーカス、ノイズ低減、拡張現実および仮想現実におけるワールドロックされたオーディオなどのアプリケーションをサポートする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:00:21 GMT)
Robust Multi-Omics Integration from Incomplete Modalities Significantly Improves Prediction of Alzheimer's Disease [3.5]
MOIRA(Multi-Omics Integration with Robustness to Absent modalities)は、不完全なオミクスデータから堅牢な学習を可能にする早期統合手法である。アルツハイマー病(AD)に対する宗教秩序研究と記憶・老化プロジェクトデータセットの評価
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:29:46 GMT)
VideoPASTA: 7K Preference Pairs That Matter for Video-LLM Alignment [3.5]
ビデオ言語モデル(Video-LLMs)は、ビデオコンテンツを理解するのに優れているが、空間的関係、時間的順序付け、フレーム間の連続性に苦慮している。対象の選好最適化を通じてビデオLLMを強化するフレームワークであるVideoPASTAを紹介する。 VideoPASTAは、正確なビデオ表現と慎重に作られた敵の例を区別するためにモデルを訓練する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:30:46 GMT)
Discovering Association Rules in High-Dimensional Small Tabular Data [3.4]
Association Rule Miningは、命題ルールの形式でデータセットの特徴間のパターンを見つけることを目的としている。高次元設定では、ルールの爆発と計算オーバーヘッドにより、一般的なアルゴリズムのアプローチは実用的ではない。 Aerial+のようなニューロシンボリックな手法は、最近ARMの規則の爆発に対処するために提案されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:37:39 GMT)
Optimal scheme for distributed quantum metrology [3.3]
我々は,分散システムにおける究極の精度限界を特徴付ける分散量子力学の最適スキームを開発する。本研究では,各センサ上で最適な制御操作をローカルに実装できることを証明し,遠隔ノード間の非ローカル制御操作の必要性を排除した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:37:08 GMT)
Prompt-aware classifier free guidance for diffusion models [3.3]
本稿では,スケール依存品質を予測し,推論時に最適なガイダンスを選択するプロンプト対応フレームワークを提案する。セマンティック埋め込みと言語的複雑性を条件とした軽量な予測器は、マルチメトリック品質曲線を推定する。 MSCOCO2014とAudioCapsの実験では、バニラCFGよりも一貫した改善が見られた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:16:25 GMT)
Bilateral Distribution Compression: Reducing Both Data Size and Dimensionality [3.3]
既存の分布圧縮法は、元の集合と圧縮された集合の間の最大平均離散性(MMD)を最小化することでデータセットサイズを削減する。両軸に沿って圧縮し,基礎となる分布を保存した2段階のフレームワークであるバイラテラル分布圧縮(BDC)を提案する。実験により、BDCは環境空間圧縮に匹敵する性能または優れた性能を著しく低コストで達成できることが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:28:50 GMT)
PQFed: A Privacy-Preserving Quality-Controlled Federated Learning Framework [3.3]
フェデレートラーニングは、生データを共有せずに協調的なモデルトレーニングを可能にする。 PQFedは、プライバシを保存するパーソナライズされたフェデレーション学習フレームワークである。 PQFedは、限られた数の参加者であっても、ターゲットクライアントのモデルパフォーマンスを継続的に改善する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:56:24 GMT)
Cryptographic Backdoor for Neural Networks: Boon and Bane [3.3]
ニューラルネットワーク(NN)における暗号バックドアは2つの方向に非常に効果的であることを示す。攻撃側では、慎重に配置された暗号バックドアにより、NNに対する強力で目に見えない攻撃が可能になる。第1に、ユーザ認証を保証するプロトコル、第3に、NN知的財産権(IP)の不正な共有を追跡するプロトコルである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:27:46 GMT)
Performance Consistency of Learning Methods for Information Retrieval Tasks [3.2]
ランダム性を用いて、従来の統計学習モデルとトランスフォーマーに基づく学習モデルについて検討する。統計モデルは安定しているが、変圧器モデルは種子が変化するにつれて大きな変動を示す。以上の結果から,トランスフォーマーモデルによる不安定性のトレーニングや,過去の結果の信頼性に関する疑問が浮き彫りになった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:33:40 GMT)
Lost in Transition: The Struggle of Women Returning to Software Engineering Research after Career Breaks [3.1]
しかし、アカデミアは女性の復帰を動機づける機会が限られている。妊娠、移民状況、柔軟な労働オプションの欠如によるキャリアの混乱は、女性のキャリアの進歩に大きな影響を及ぼす。我々のゴールは、女性が学術的役割に復帰する際の、業界の役割と比較して、どのような課題に直面するかを探ることです。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:19:42 GMT)
Plant identification in an open-world (LifeCLEF 2016) [3.0]
LifeCLEFの植物識別課題は、植物識別方法やシステムを大規模に評価することを目的としている。 2016年の第2版は実際に西ヨーロッパに生息する1000種の植物を映し出した110万枚以上の画像に基づいて行われた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:01:13 GMT)
Plant identification based on noisy web data: the amazing performance of deep learning (LifeCLEF 2017) [3.0]
LifeCLEFの植物識別チャレンジは、自動植物識別システムにとって重要なマイルストーンである。 LifeCLEF 2017の課題は、Webを通じて収集された大規模なノイズの多いトレーニングデータセットをどの程度評価し、ラベル付けエラーが多数含まれているかを評価することを目的としている。本稿では,課題の資源と評価をより正確に提示し,参加研究グループが採用するアプローチとシステムを要約し,主な成果について分析する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:47:43 GMT)
Overview of ExpertLifeCLEF 2018: how far automated identification systems are from the best experts? [3.0]
LifeCLEF 2018 ExpertCLEFチャレンジは、人間の専門家と自動化システムの比較を可能にするように設計されている。フランスの植物学の専門家9名を対象に,4つの異なる研究チームが実施した19のディープラーニングシステムを評価した。主な成果は、最先端のディープラーニングモデルのパフォーマンスが、現在最も高度な人間の専門知識に近いことである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:54:03 GMT)
Uncertainty-Aware Surrogate-based Amortized Bayesian Inference for Computationally Expensive Models [3.0]
サロゲートモデルは計算コストを低くして近似シミュレーションを提供することによって解を提供する。不確かさを意識したサロゲートに基づくアモータイズベイズ推論(UA-SABI)を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:07:40 GMT)
RAPTOR-GEN: RApid PosTeriOR GENerator for Bayesian Learning in Biomanufacturing [2.9]
本稿では,メカニズムインフォームドベイズ学習フレームワークRAPTOR-GENを紹介する。 RAPTOR-GENは、スパースおよび異種実験データからインテリジェントデジタルツイン開発を加速するように設計されている。制御可能な誤りを考慮した高速かつ堅牢なRAPTOR-GENアルゴリズムを開発した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:20:49 GMT)
Prophecy: Inferring Formal Properties from Neuron Activations [2.9]
本稿では,フィードフォワードニューラルネットワークの形式的特性を自動推論するProphecyを提案する。予言は、望ましい出力特性を暗示する前提条件として、ニューロンの活性化に基づく規則を抽出することで機能する。本稿では,ニューラルネットワークの形式的説明の推論や証明,構成検証,実行時の監視,修復など,その応用の概要を紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:50:03 GMT)
On the hardness of approximating minimum distances of quantum codes [2.9]
誤り訂正符号の計算距離の問題は古典的設定と量子的設定の両方において基本的な問題である。特に、古典的線形符号の最小距離問題から、最も一般的に使用される量子符号であるCSS符号の直接削減が得られる。グラフの隣接行列が入力であるとき、グラフ状態の距離を計算/近似することはNPハードであることが示される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:35:49 GMT)
Advancing Universal Deep Learning for Electronic-Structure Hamiltonian Prediction of Materials [2.8]
我々は、ハミルトン予測のための普遍的な深層学習パラダイムを進化させるために、方法論とデータセットの双方に貢献する。 NextHAMは、効率的で一般化可能な電子構造ハミルトニアン予測のためのニューラルネットワークE(3)対称性および表現的補正法である。 Materials-HAM-SOCの実験結果から、NextHAMはハミルトニアンやバンド構造を予測するのに優れた精度と効率を達成することが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:01:42 GMT)
Expressive Power of Deep Networks on Manifolds: Simultaneous Approximation [2.8]
境界重みを持つ定数深度$mathrmReLUk-1$ネットワークは、ソボレフ空間内の任意の関数を近似することができることを示す。また、必要なパラメータ数が対数係数に一致することを示すことで、我々の構成がほぼ最適であることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:40:47 GMT)
Least Volume Analysis [2.8]
最小体積は幾何学的直観にインスパイアされた単純だが効果的な正規化法である。 LVは非線形モデルにおいてPCAのような重み付けを誘導することを示す。我々はLVを一般最小ボリューム(GLV)として非ユークリッド設定に拡張し、ラベル情報の潜在表現への統合を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:00:55 GMT)
An Improved Quantum Software Challenges Classification Approach using Transfer Learning and Explainable AI [2.8]
開発者はStack Overflow(SO)を使用して、課題について議論し、特殊な量子タグでポストをラベル付けする。量子関連タグを用いてQ&Aプラットフォームから2829の質問を抽出した。ポストは、頻繁な課題を特定し、新しい根拠理論を開発するために分析された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:19:50 GMT)
Breaking $1/ε$ Barrier in Quantum Zero-Sum Games: Generalizing Metric Subregularity for Spectraplexes [2.7]
我々は、$textitNesterov の反復滑らか化の行列変種が、量子零サムゲームにおいて線形速度で終点収束を達成することを証明した。副産物として、厳密な正の半定値プログラムの並列近似のための古典的ジャイナ・ワトラス [arXiv:0808.2775] 法を指数関数的に高速化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:51:13 GMT)
Learning to Look: Cognitive Attention Alignment with Vision-Language Models [2.7]
畳み込みニューラルネットワーク(CNN)は表面相関を利用してしばしば「熱い」。近年,概念に基づく監視と説明規則化を用いて,モデル注意を導く手法が提案されている。視覚言語モデルを利用してセマンティックアテンションマップを自動的に生成するスケーラブルなフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:40:48 GMT)
The Asymptotic Behavior of Attention in Transformers [2.6]
トランスフォーマーアーキテクチャは、現代の大規模言語モデル(LLM)の基礎となった。深さが増加するにつれて,すべてのトークンがクラスタに変換的に収束することを示す。次に、解析を自己回帰モデルに拡張し、その構造を利用して理論的保証をさらに一般化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:09:18 GMT)
Safe Explicable Policy Search [2.6]
安全リスクを最小限に抑えつつ、説明可能な行動生成のための学習アプローチを提供することを目的としたSEPSを提案する。我々は,SEPSを制約付き最適化問題として定式化し,エージェントは安全性に制約のある説明可能性スコアを最大化することを目的とする。安全ジャム環境でのSEPSの評価と,人間とAIのコラボレーションにおける効果と妥当性を示す物理ロボット実験を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:23:06 GMT)
SlideMamba: Entropy-Based Adaptive Fusion of GNN and Mamba for Enhanced Representation Learning in Digital Pathology [2.6]
本稿では,Mamba アーキテクチャと Graph Neural Networks (GNN) を統合し,WSI 分析を強化した一般化可能なディープラーニングフレームワークを提案する。本手法は,局所的空間関係と長期的コンテキスト依存の両方を抽出し,デジタル病理解析のための柔軟なアーキテクチャを提供する。本稿では,WSIの遺伝子融合と突然変異状態の予測という,代表的な課題に対するアプローチの有用性を実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:37:01 GMT)
DIM: Enforcing Domain-Informed Monotonicity in Deep Neural Networks [2.6]
本稿では,Deep Neural Networks(DIM)におけるドメインインフォームド・モノトニクスの強化という新たな正規化手法を提案する。 DIMは複雑なディープラーニングモデルにおけるドメインインフォームド・モノトニックな関係を維持し、予測をさらに改善する。シカゴの実際のライドソーシングデータセットと合成されたデータセットを用いて提案手法を検証・検証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:35:57 GMT)
PreLoRA: Hybrid Pre-training of Vision Transformers with Full Training and Low-Rank Adapters [2.6]
本稿では, 部分収束状態の同定と, ViT-Large モデル上での完全パラメータトレーニングからローランド適応 (LoRA) への切り替えを提案する。実験結果から,本手法はモデルの精度を保ちながら,トレーニング可能なパラメータの数を元のサイズの10%に減らしていることがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:34:17 GMT)
Evidence for Limited Metacognition in LLMs [2.5]
LLMにおけるメタ認知能力を定量的に評価するための新しい手法を提案する。非ヒト動物におけるメタ認知の研究からインスピレーションを得て、我々のアプローチは、モデルによる自己申告を行い、その代わりに、モデルが内部状態の知識を戦略的に展開できる程度にテストする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:30:15 GMT)
CogniLoad: A Synthetic Natural Language Reasoning Benchmark With Tunable Length, Intrinsic Difficulty, and Distractor Density [2.4]
認知負荷理論(CLT)に基づく新しい総合ベンチマークであるCogniLoadを紹介する。 CogniLoadは、CLTのコア次元を反映した、独立に調整可能なパラメータを持つ自然言語論理パズルを生成する。 CogniLoadは、タスク長を支配的な制約として識別する、異なるパフォーマンス感受性を明らかにしている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:33:39 GMT)
Implicit Augmentation from Distributional Symmetry in Turbulence Super-Resolution [2.4]
標準的な畳み込みニューラルネットワーク(CNN)は、明示的な拡張や特殊なアーキテクチャを使わずに部分的に回転対称性を得られることを示す。異方性が異なる3次元チャネルフローを用いて、より等方性中間平面データに基づいてトレーニングされたモデルが、より低い等方性誤差を実現する。これらの結果は, 回転対称性が学習アルゴリズムに明示的に組み込まれなければならないこと, 乱流から直接得られることを明らかにする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:31:56 GMT)
Shoot from the HIP: Hessian Interatomic Potentials without derivatives [2.4]
ヘッセンは、システムサイズで計算し、スケールするのが高価である。深層学習モデルから直接ヘッセンを予測できることを実証する。これにより、HIP Hessianは、桁違いに高速で、より正確で、よりメモリ効率が良く、トレーニングが容易になり、システムサイズでより好ましいスケーリングを可能にします。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:43:34 GMT)
No Universal Purification in Quantum Mechanics [2.4]
量子力学の線形性と肯定性は、量子浄化に一般の制約を課すことを証明している。量子演算は、未知の量子状態やチャネルの有限個のコピーを、入力に依存する純粋な状態やチャネルに変換することはできない。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:56:17 GMT)
Semantic Clustering of Civic Proposals: A Case Study on Brazil's National Participation Platform [2.4]
本稿では,BERとシード語を組み合わせたアプローチと,大規模言語モデルによる自動検証を提案する。最初の結果は、生成したトピックは、最小限の人的労力で、一貫性があり、制度的に整合していることを示している。この手法により、政府は大量の市民入力を公共政策のための実行可能なデータに変換することができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:11:14 GMT)
CTI Dataset Construction from Telegram [2.4]
サイバー脅威インテリジェンス(CTI)は、組織がサイバー脅威を予測し、検出し、進化させることを可能にする。近年、Telegramは貴重なCTIソースとして有名になり、タイムリーで多様な脅威関連情報を提供している。本稿では,Telegramから脅威関連コンテンツを体系的に収集・フィルタリングするエンドツーエンドの自動パイプラインを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:27:10 GMT)
Psychological and behavioural responses in human-agent vs. human-human interactions: a systematic review and meta-analysis [2.3]
インタラクティブな知的エージェントは社会全体で統合されています。人間のような能力を達成するにも拘わらず、これらのエージェントに対する人間の反応はいまだに理解されていない。一致した人間-エージェントと人間-人間の対話における心理的・行動的反応を比較検討した最初の体系的合成を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:29:36 GMT)
PALADIN: Self-Correcting Language Model Agents to Cure Tool-Failure Cases [2.3]
PALADINは、系統的な障害注入によって構築された5万以上のリカバリアノテーション付き軌道を走行する。トレーニングでは、LoRAベースの微調整を使用して、回復能力を注入しながらベース能力を維持する。このアプローチは、トレーニング分布を超えた新しい失敗に一般化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:37:30 GMT)
An Automated Retrieval-Augmented Generation LLaMA-4 109B-based System for Evaluating Radiotherapy Treatment Plans [2.3]
我々は,LLaMA-4 109Bを用いた放射線治療計画の自動化,プロトコル認識,解釈可能な評価のためのRAGシステムを開発した。 RAGシステムは5つのSentenceTransformerバックボーンに最適化された検索エンジン、コホート類似性に基づくパーセンタイル予測コンポーネント、臨床制約チェッカーの3つのコアモジュールを統合している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:18:31 GMT)
MPC-based Deep Reinforcement Learning Method for Space Robotic Control with Fuel Sloshing Mitigation [2.2]
本稿では、部分的に充填された燃料タンクを用いた自律衛星ドッキングのための強化学習(RL)とモデル予測制御(MPC)フレームワークを提案する。そこで我々は,PPOアルゴリズムとSACアルゴリズムをMPCと統合し,MPCの予測能力を活用してRLトレーニングを加速し,制御の堅牢性を向上させる。本研究は, 燃料効率と耐障害性のある衛星ドッキングを推し進め, 軌道上再給油・給油ミッションの実現可能性を高めた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:51:07 GMT)
Shift Happens: Mixture of Experts based Continual Adaptation in Federated Learning [2.2]
フェデレートラーニング(FL)は、生データを共有することなく、分散クライアント間で協調的なモデルトレーニングを可能にする。我々は,検出された分散シフトに応じて,特殊なグローバルモデルを動的に生成し,訓練する専門家フレームワークのシフト対応ミックスであるShiftExを紹介する。本研究では,5.5-12.9ポイントの精度向上と22-95%の適応率を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:22:08 GMT)
Limits to black-box amplification in QMA [2.2]
量子複雑性クラスQMAにおけるブラックボックス増幅の限界について検討する。増幅は、完全性と音響性の間の逆ポリノミカルギャップを指数的に小さな誤差に押し上げることが知られている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:21:27 GMT)
Generative AI for FFRDCs [2.1]
少数の入力出力例で,大規模言語モデルが要約,分類,抽出,センスメイキングをいかに促進できるかを示す。センシティブな政府コンテキストでの使用を可能にするために、生成AIのセキュアで柔軟な応用のためのオープンソースのフレームワークであるOnPrem$.LLMを適用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:45:39 GMT)
Lightweight Modular Parameter-Efficient Tuning for Open-Vocabulary Object Detection [2.1]
パラメータ効率の良いオープン語彙オブジェクト検出のための軽量なモジュラーフレームワークUniProj-Detを提案する。 UniProj-Detは事前訓練されたバックボーンを凍結し、学習可能なモダリティトークンを備えたユニバーサル・プロジェクション・モジュールを導入し、最小限のコストで視覚-言語適応を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:01:46 GMT)
SlotFM: A Motion Foundation Model with Slot Attention for Diverse Downstream Tasks [2.1]
本稿では,様々な下流タスクを一般化した加速度センサ基礎モデルであるSlotFMを提案する。我々はSlotFMを、標準的な人間の活動認識を超えた16の分類と回帰ダウンストリームタスクで評価した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:41:43 GMT)
ExpIDS: A Drift-adaptable Network Intrusion Detection System With Improved Explainability [2.1]
深層学習に基づくNIDS ExpIDS を設計し,高い決定木説明精度を実現する。我々は、ExpIDSが、最先端NIDSに匹敵する、高い決定木説明忠実度と悪意のあるトラフィック検出性能を達成することを検証した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:47:42 GMT)
PerHalluEval: Persian Hallucination Evaluation Benchmark for Large Language Models [2.0]
PerHalluEvalはペルシア語用に調整された最初の動的幻覚評価ベンチマークである。本ベンチマークでは,QAおよび要約タスクに関する妥当な回答と要約を生成する。生成したトークンのログ確率を用いて、最も信頼できる幻覚インスタンスを選択しました。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:50:46 GMT)
CORE: Full-Path Evaluation of LLM Agents Beyond Final State [2.0]
既存のエージェントベンチマークでは、最終状態のバイナリ判断に対する評価を少なくすることが多い。本稿では,タスクを有効なツール利用経路の集合として符号化する決定論的有限オートマトンに基づくフレームワークを提案する。 CORE(Path Correctness)、Path Correctness(Path Correctness)、Kendall's tau Composite(Kendall's tau Composite)、Prefix Criticality(Prefix Criticality)、Harmful-Call Rate(Harmful-Call Rate)、Efficency(Efficency)の5つのメトリクススイートを紹介します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:49:35 GMT)
Few-Shot and Training-Free Review Generation via Conversational Prompting [2.0]
現実世界のアプリケーションは、ほとんどショットやトレーニングなしの状況に直面することが多い。本稿では,ユーザレビューをマルチターン会話として再構成する軽量な手法である会話型プロンプトを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:36:08 GMT)
Higher-Order DisCoCat (Peirce-Lambek-Montague semantics) [2.0]
本稿では,高階DisCoCat(カテゴリー構成分布)モデルの新たな定義を提案する。私たちのモデルは、プリミティブが論理式ではなく文字列図形に作用する計算に基づいて、モンタギュー意味論の変種と見なすことができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:17:07 GMT)
Sycophancy Is Not One Thing: Causal Separation of Sycophantic Behaviors in LLMs [2.0]
我々は、真の合意とは対照的に、空想的合意と空想的賞賛を分解する。結果は、サイコファンティックな行動は、独立して選択可能な表現と一致していることを示唆している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:19:39 GMT)
It's Not You, It's Clipping: A Soft Trust-Region via Probability Smoothing for LLM RL [2.0]
PPOやGRPOのような強化学習(RL)手法を用いた大規模言語モデル(LLM)の訓練は、更新の安定化に比例する。重要度を計算する前に、従来の(行動)政策に対する現在の政策の確率を円滑にするPSPOを提案する。 GR-PSPOはクリップされたGRPOと比較して0.5Bと1.5Bの両方のパフォーマンスを大幅に改善し、GSM8Kでは20%以上向上した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:03:18 GMT)
Crosscap states and duality of Ising field theory in two dimensions [1.9]
2次元イジング場理論に対して、2つの異なるクロスキャップ状態を提案する。我々はマヨラナ自由場表現を導出し、ボゾン化法を拡張して、2次元イジング共形場理論の相関関数を計算する。イジング場理論では、解析結果は関連する摂動の下でのクラインボトルエントロピーの予想単調性を支持する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:04:25 GMT)
Why Attention Fails: The Degeneration of Transformers into MLPs in Time Series Forecasting [1.9]
トランスフォーマーベースのアーキテクチャは自然言語処理とコンピュータビジョンで高い性能を達成した。しかし、多くの研究では、時系列予測において明確な優位性を示していないことが示されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:25:51 GMT)
Conformal Calibration of Statistical Confidence Sets [1.9]
本研究では,TRUSTとTRUST++という2つの新しい手法を導入する。我々は,本手法が既存のアプローチ,特に小サンプル方式よりも優れていることを実証した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:12:23 GMT)
AnywhereVLA: Language-Conditioned Exploration and Mobile Manipulation [1.8]
AnywhereVLAは、モバイル操作のためのモジュラーフレームワークである。テキストプロンプトはエントリポイントとして機能し、構造化されたタスクグラフに解析される。相互作用のためには、コンパクトなSmolVLA操作ヘッドをプラットフォームピックとプレーストラジェクトリに微調整する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:04:44 GMT)
The Anatomy of Alignment: Decomposing Preference Optimization by Steering Sparse Features [1.8]
このフレームワークは、解釈可能なスパース機能を調節することで、モデル動作を操る軽量なアダプタを訓練する。この機構は, 学習後プロセスの挙動変化を近似するのに十分な原理と表現性を有することを示す。全体として、FSRLは解釈可能な制御インターフェースを提供し、フィーチャレベルでの好み最適化の圧力がどのように現れるかを診断する実用的な方法を提供している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:31:28 GMT)
Recidivism and Peer Influence with LLM Text Embeddings in Low Security Correctional Facilities [1.7]
低セキュリティ矯正施設の住民の間で8,000-120,000の事前訓練されたトランスフォーマーベース大規模言語モデル(LLM)を用いて得られたAI埋め込みを再現性が高く予測する。ネットワーク内在性を考慮した多変量ピアエフェクトモデルを用いて,これらのLLM生成言語におけるピアエフェクトを推定する。これらの新しい手法により、対話やフィードバックのための言語利用において重要なピア効果が得られます。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:14:57 GMT)
AMLgentex: Mobilizing Data-Driven Research to Combat Money Laundering [1.7]
マネーロンダリングは、不正資金を合法経済に移すことによって組織犯罪を可能にする。ラダーダラーは監視を逃れる確認されたケースは稀で組織はグローバル取引ネットワークの断片しか見ていない
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:46:21 GMT)
GNN-DT: Graph Neural Network Enhanced Decision Transformer for Efficient Optimization in Dynamic Environments [1.7]
本稿では,グラフニューラルネットワーク(GNN)を組み込んだ新しいDecision Transformer(DT)アーキテクチャであるGNN-DTを紹介する。 GNN-DTは、オンラインRLアルゴリズムのスパース報酬の制限に対処し、高品質なソリューションをリアルタイムで提供する。複雑な電気自動車(EV)の充電最適化問題に対してGNN-DTを評価し,その性能が優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:43:03 GMT)
Understanding the Issue Types in Open Source Blockchain-based Software Projects with the Transformer-based BERTopic [1.6]
本稿では,GitHubにホストされている1,209のオープンソースブロックチェーンプロジェクトから抽出した497,742件について,大規模な実証研究を行った。私たちの分析によると、一般的なソフトウェア開発の問題とブロックチェーン特有の懸念の両方が、ほぼ同じように表現されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:27:12 GMT)
Quantum Simulation of Fermions in $AdS_2$ Black Hole: Chirality, Entanglement, and Spectral Crossovers [1.6]
我々は、離散化された$AdS$ブラックホール背景上の自由ディラックフェルミオンを考える。我々は、曲線空間の赤方偏移、地平線、スピン接続がカイラル重力効果のスペクトル、輸送、揺らぎ現象をどのように引き起こしたかを分析する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:00:11 GMT)
Quantum State Learning Implies Circuit Lower Bounds [1.5]
状態トモグラフィー、擬似ランダム性、量子状態、回路下界の接続を確立する。わずかに自明な量子状態トモグラフィーアルゴリズムでさえも量子状態合成に関する新しい言明に繋がることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:30:21 GMT)
Adaptive Federated Learning Defences via Trust-Aware Deep Q-Networks [1.5]
フェデレート学習は、部分的に観察可能な状態での中毒やバックドア攻撃に対して脆弱である。我々は、クライアントの信頼更新に多信号の証拠を統合する、信頼を意識したディープQネットワークを導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:30:09 GMT)
Bayesian Attention Mechanism: A Probabilistic Framework for Positional Encoding and Context Length Extrapolation [1.5]
トランスフォーマーベースの言語モデルは、トークンの順序を処理し、コンテキスト長の外挿をサポートするために位置符号化(PE)に依存している。本稿では,確率モデル内で位置符号化を先行する理論的枠組みであるベイズ注意機構(BAM)を提案する。 BAMは既存の手法(例えば NoPE や ALiBi)を統一し、より長いコンテキストの一般化を大幅に改善する新しい一般化ガウス的位置付けを動機付けている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:36:48 GMT)
GEDAN: Learning the Edit Costs for Graph Edit Distance [1.5]
グラフ編集距離(GED)の編集コストを学習するための完全エンドツーエンドグラフニューラルネットワークフレームワークを提案する。本手法は,GED近似のための教師なし自己組織化機構と,文脈的編集コストを柔軟に学習する一般化付加モデルを組み合わせる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:18:42 GMT)
C-QUERI: Congressional Questions, Exchanges, and Responses in Institutions Dataset [1.5]
政治インタビューや公聴会の質問は、情報収集以上の戦略的目的に役立っている。議会の公聴会は政治問題を研究するための特に豊かで魅力的な場所を提供する。本研究では,非構造的補聴書から質問応答対を抽出するパイプラインを構築し,第108回から第117回までの委員会聴聞会の新たなデータセットを構築した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:34:05 GMT)
Structured Relational Representations [1.5]
不変構造は知識が存在する場所であり、特に抽象的な知識空間内の関係経路の閉包によって定義される分割である。これらの分割はコア不変表現として機能し、知識が保存され学習が行われる構造基板を形成する。我々は、線形代数構造である閉半環に基づく不変分割の構造的関係表現の計算基盤を定式化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:14:28 GMT)
A regret minimization approach to fixed-point iterations [1.4]
本稿では,後悔の最小化アルゴリズムを固定点反復に変換する変換方式を提案する。結果として生じる反復は、古典的なクラスノゼルスキイ-マンの反復の壮大な拡張と見なすことができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:13:30 GMT)
Visual Authority and the Rhetoric of Health Misinformation: A Multimodal Analysis of Social Media Videos [1.4]
本研究は,栄養・補充ビデオの信頼性について,権威信号の交わり,物語の技法,マネタイズを分析して検討した。われわれはTikTok、Instagram、YouTubeの152の公開ビデオからなるクロスプラットフォームコーパスを組み立て、視覚的権威、プレゼンター属性、物語戦略、エンゲージメントのキューを含む26の機能に注釈を付ける。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:56:38 GMT)
Quantum Algorithm for Subcellular Multiscale Reaction-Diffusion Systems [1.4]
重要な課題は「次元の計算」にあるこれらの課題を克服するために設計された量子アルゴリズムフレームワークを導入する。この枠組みは生物学的に関連する細胞内プロセスのシミュレーションへの扉を開く。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:04:41 GMT)
Quantum est in Libris: Navigating Archives with GenAI, Uncovering Tension Between Preservation and Innovation [1.4]
古代と近代の交差点を「リリスの静けさ」が探求している。一方、エストニア国立博物館(ERM)の写本は1世紀以上前のアーカイブである。一方、これらの素材を動的かつインタラクティブな体験に変換する技術がある。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:58:09 GMT)
Problem Solved? Information Extraction Design Space for Layout-Rich Documents using LLMs [1.3]
本稿では,大規模言語モデル(LLM)を用いたレイアウトリッチドキュメントからの情報抽出のための設計空間を定義し,検討する。本研究では,入力表現,チャンキング,プロンプト,LLMの選択,マルチモーダルモデルなど,これらのコア課題におけるサブプロブレムと手法について検討する。 LayIE-LLM(LayIE-LLM)は、オープンソースのレイアウト対応IEテストスイートである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:27:41 GMT)
An entropy-optimal path to humble AI [1.3]
ボルツマンマシンの非平衡エントロピー最適化再構成のための新しい数学的枠組みを導入する。その結果, 数学的に整合した存在と独特さの基準を持つ, 高性能だがより安価で, 勾配のない学習フレームワークが得られた。この枠組みを歴史的気候データに適用すると、重要なラニーナ現象とエルニーノ現象の発症の予測スキルが体系的に高いモデルが得られる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:18:04 GMT)
Agentic-AI Healthcare: Multilingual, Privacy-First Framework with MCP Agents [1.3]
Agentic-AI Healthcareは、単一の調査プロジェクトとして開発された、プライバシーを意識した多言語、説明可能な研究プロトタイプである。このプラットフォームには、ロールベースのアクセス制御(RBAC)、AES-GCMフィールドレベルの暗号化、タンパーによる詳細な監査ログなど、専用のプライバシとコンプライアンスレイヤが組み込まれている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:25:52 GMT)
Effective continuous equations for adaptive SGD: a stochastic analysis view [1.3]
そこで本研究では, 学習率の小さいシステムにおいて, 適応型グラディエント Descent (SGD) 手法の理論的解析を行った。我々の重要な貢献は、SGDのサンプリング誘起ノイズが、パラメータ勾配第二運動量進化を駆動する独立ブラウン運動として現れることである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:31:20 GMT)
Local Mechanisms of Compositional Generalization in Conditional Diffusion [1.3]
我々は、トレーニング中に見るよりも多くの物体で画像を生成することができる長さ一般化について研究する。制御されたCLEVR設定では、長さの一般化はいくつかのケースでは達成できるが、他のケースでは達成できない。次に,構成一般化のための構造機構としての局所性について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:19:02 GMT)
Cohort-Based Active Modality Acquisition [1.2]
コホートベースのActive Modality Acquisition (CAMA)は、追加のモダリティを受け取るべきサンプルを選択することの難しさを形式化する新しいテストタイム設定である。我々は、生成的計算と識別的計算を組み合わせた獲得戦略を導出する。我々の研究はコホートレベルでのモダリティ獲得を最適化するための効果的なアプローチを提供し、制約された設定におけるリソースのより効率的な利用を可能にする。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:57:11 GMT)
Residual Vector Quantization For Communication-Efficient Multi-Agent Perception [1.2]
中間特徴を圧縮しながら空間的アイデンティティを保持する学習機能であるReVQomを提案する。 ReVQomは、単純なボトルネックネットワークを介して特徴次元を圧縮するエンドツーエンドの手法である。 DAIR-V2XリアルタイムCPデータセットでは、ReVQomは30bppから1365xで273x圧縮を6bppで達成している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:30:27 GMT)
Quantum Computer Fingerprinting using Error Syndromes [1.2]
我々は、量子エラー補正(QEC)の副産物を活用して、ハードウェアのアイデンティティを検証し、"フリー"の量子計算を認証する戦略を提案する。シンドローム測定をメタデータのソースとして扱うことにより、検証を標準QECプロトコルにシームレスに組み込む。我々は,数世代にわたるIBM量子コンピュータ上で,複数の誤り訂正符号,量子状態,回路コンパイル戦略を用いてアプローチを検証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:46:21 GMT)
Constraints on axion-like dark matter from a SERF comagnetometer [1.2]
我々は,NOble and Alkali Spin Detectors for Ultralight Coherent darK matter (NASDUCK) の地球外領域について報告する。この検出器は希ガスとアルカリ金属原子の核を使用し、スピン交換自由(SERF)体制で作動する。質量範囲は 10-12$eV/$c2$ から $2times 10-10$eV/$c2$ で、堅牢な天体境界に取って代わる限界を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:27:10 GMT)
Automated Formative Feedback for Short-form Writing: An LLM-Driven Approach and Adoption Analysis [1.2]
本稿では,工学プログラムにおけるAIベースの形式的フィードバックの開発と導入について検討する。学生にドラフトレポートに対するパーソナライズされたフィードバックを提供し、完全性と品質の向上に向けて指導するためのツールが開発された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:17:51 GMT)
Coherent control of photonic spin Hall effect in a Cavity [1.2]
本稿では,光スピンホール効果(フォトニックSHE)のキャビティ内における4レベルクローズドコヒーレント制御結合方式による操作について理論的に検討する。このシステムは、CTL構成で複数の透過窓を示し、可変フォトニックSHEをより広い範囲のプローブフィールドデチューニングで使用できる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:26:13 GMT)
Learning Conformal Explainers for Image Classifiers [1.2]
本稿では、画像に基づく予測を説明するための、新しい共形予測に基づくアプローチを提案する。この手法は,モデルの予測を保存するのに十分な,有能な特徴のサブセットを同定する。 4つの整合関数は、説明がモデルの予測に適合する程度を定量化するために提案される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:20:44 GMT)
AutoClimDS: Climate Data Science Agentic AI -- A Knowledge Graph is All You Need [1.2]
気候データ科学は、データソースの断片化された性質、異質なフォーマット、データセットを特定し、取得し、処理するために必要な急激な技術的専門知識から生じる永続的な障壁に直面している。クラウドネイティブな科学研究のために設計されたAIエージェントと、キュレートされた知識グラフ(KG)を統合することで、これらの障壁に対処するための概念実証を行う。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:38:23 GMT)
A Real-Time On-Device Defect Detection Framework for Laser Power-Meter Sensors via Unsupervised Learning [1.1]
このシステムは、正常なコーティング分布パターンを学習するために、良質なセンサイメージのみを訓練する教師なし異常検出フレームワークを使用している。このシステムは、デバイス上の実装において、自動品質制御と1イメージあたり0.5秒の処理時間を通じて、潜在的な年間コスト削減を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:29:20 GMT)
Probing Bandwidth and Sensitivity in Rydberg Atom Sensing via Optical Homodyne and RF Heterodyne Detection [1.1]
ライドバーグ原子ベースのセンサーは、SIトレーサブル測定を可能にする。本稿では,ルビジウム気相セルにおけるRydberg原子系センサの帯域幅と感度について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:03:39 GMT)
Automated and Interpretable Survival Analysis from Multimodal Data [1.1]
本稿では,臨床変数とCT画像の統合による生存分析の自動化を目的とした,解釈可能なマルチモーダルAIフレームワークを提案する。我々のMultiFIXベースのフレームワークは、Grad-CAMを介して解釈される生存関連機能を深層学習で推測する。頭頸部癌に対するオープンソースのRADCUREデータセットを用いて、MultiFIXは0.838(予測)と0.826(成層化)のCインデックスを達成する
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:13:39 GMT)
Optimal Robust Recourse with $L^p$-Bounded Model Change [1.1]
データ分散や環境の変化を反映するために、しばしばモデルが更新される。一般化線形モデルに対する最適ロバストなリコースを確実に計算する新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:11:51 GMT)
Hierarchical Graph Neural Network for Compressed Speech Steganalysis [1.0]
本稿では,圧縮音声のVoIP音声ストリームのステガナリシスのためのグラフニューラルネットワーク(GNN)の最初の応用について述べる。この方法ではVoIPストリームからのグラフ構築が簡単で、階層的ステガナリシス情報を取得するのにGraphSAGEを使用する。 0.5秒の短いサンプルであっても検出精度は98%を超え、埋め込み率の低い困難な条件下では95.17パーセントの精度が得られる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:46:49 GMT)
Quantum Simulation and Energy Estimation for Discretized Anharmonic oscillator [1.0]
フィルタに基づく設計とトフォリゲートを備えた量子回路は、量子状態の進化を追跡するために構築される。エネルギー推定には、2ローカルアンサッツと変分量子デフレレーション(VQD)を備えた変分量子固有解器(VQE)を用いる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:49:09 GMT)
Maxout Polytopes [1.0]
最大出力ポリトープは、第1層の後、最大出力活性化関数と非負重みを持つフィードフォワードニューラルネットワークによって定義される。浅層ネットワークにおける最大ポリトープのパラメータ空間と極端Fベクトルを特徴付けるとともに,ネットワークに層を追加して発生する超曲面の分離について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:06:10 GMT)
GEP: A GCG-Based method for extracting personally identifiable information from chatbots built on small language models [1.0]
小型言語モデル(SLM)は、大型言語モデル(LLM)と比較してほぼ同等の性能のため、前例のないほど魅力的になる。しかし、下流タスクのためのSLMの個人識別情報(PII)漏洩は未だ調査されていない。 PII抽出に特化して設計されたgreedy coordinate gradient-based (GCG) 法である GEP を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:05:47 GMT)
Score-based Idempotent Distillation of Diffusion Models [0.9]
一等性生成ネットワーク(IGN)は、対象多様体への等等性写像に基づく新しい生成モデルである。本研究では拡散モデルスコアから等等化モデルを蒸留することにより拡散とIGNを結合し、SIGNと呼ぶ。提案手法は非常に安定しており, 対向的損失を伴わないため, 提案手法の理論的解析を行い, IGNを予め学習した拡散モデルから効果的に蒸留できることを実証的に示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:36:10 GMT)
A Hierarchical Variational Graph Fused Lasso for Recovering Relative Rates in Spatial Compositional Data [0.9]
本研究では,空間信号パターンの自然な間隔を利用して,画像全体にわたる各分子の相対率を復元するスケーラブルなベイズフレームワークを開発した。本手法は,従来の図形ラッソの重み付き変奏法と,新しい階層的変奏法を併用することに依存する。実際のIMSデータから,本手法は既知組織の真の解剖学的構造を回復し,アーティファクトを除去し,標準解析手法で欠落した活性領域を検出する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:19:45 GMT)
SPREAD: Sampling-based Pareto front Refinement via Efficient Adaptive Diffusion [0.9]
SPREADは拡散確率モデル(DDPM)に基づく生成フレームワークである決定空間からサンプリングされた点上の条件拡散過程を学習する。適応的多重勾配降下インスパイアされた更新を高速収束に利用するサンプリングスキームにより、候補を洗練する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:09:37 GMT)
Informed Forecasting: Leveraging Auxiliary Knowledge to Boost LLM Performance on Time Series Forecasting [0.9]
時系列予測において,Large Language Models (LLMs) の性能を高めるために,新しいクロスドメイン知識伝達フレームワークを提案する。この手法は、LLMを構造化時間情報で体系的に注入し、予測精度を向上させる。その結果,知識インフォームド予測は予測精度と一般化の点で非フォームドベースラインを著しく上回ることがわかった。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:10:46 GMT)
EnGraf-Net: Multiple Granularity Branch Network with Fine-Coarse Graft Grained for Classification Task [0.8]
きめ細かい分類モデルは、非常に類似したクラスを区別するために必要な関連する詳細に焦点を当てるように設計されている。自動収穫法を含む部分的アプローチは、局所的特徴の不完全な表現に悩まされる。本研究では,エングラフネット(EnGraf-Net)と呼ばれるエンドツーエンドのディープニューラルネットワークモデルにおいて,階層構造(分類)として構築されたセマンティックアソシエーションを教師付き信号として活用する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:11:42 GMT)
Analysis of instruction-based LLMs' capabilities to score and judge text-input problems in an academic setting [0.8]
LLM(Large Language Model)は、LLM-as-a-JudgeやLLMの微調整といった手法によって研究される評価器として機能する。本稿では,3つのモデルを持つ高校生のコンピュータ科学に関する110の回答をカスタムデータセットで検証した5つの評価システムを提案する。平均絶対偏差 (0.945) と最低根平均正方偏差 (1.214) を人的評価と比較すると, 基準支援評価は見識的, 完全評価とともに公正スコアを提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:26:23 GMT)
QECO: A QoE-Oriented Computation Offloading Algorithm based on Deep Reinforcement Learning for Mobile Edge Computing [0.8]
効率的なタスクオフロードは、ユーザにとってシームレスな品質のエクスペリエンス(QoE)を保証する上で、重要な役割を担います。深部強化学習(DRL)に基づく分散QoE指向計算オフロード(QECO)アルゴリズムを提案する。シミュレーションの結果、QECOはタスクの完了数を最大14.4%増加させ、タスク遅延とエネルギー消費をそれぞれ9.2%と6.3%削減した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:11:21 GMT)
Benchmarking Quantum Computers: Towards a Standard Performance Evaluation Approach [0.7]
我々は、古典的なプロセッサベンチマークとそれらを構成するメトリクスの両方の最も重要な側面についてレビューする。量子コンピューティングのパラダイムを特徴付ける本質的な特性を解析する。本稿では,量子ベンチマークの一般的なガイドラインを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:03:16 GMT)
A Review on Quantum Circuit Optimization using ZX-Calculus [0.7]
ZX計算は、セマンティックス保存量子回路最適化を可能にする代替フレームワークとして登場した。本稿では、ZXに基づく量子回路の最適化について概観し、最適化手法、ターゲットメトリック、量子コンピューティングアーキテクチャにより分類する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:48:07 GMT)
Neural-Network solver of ideal MHD equilibria [0.7]
本稿では,ニューラルネットワークを用いたフーリエモードのパラメータ化による3次元磁気流体平衡の計算手法を提案する。我々は、最小限の複雑なニューラルネットワークを使用し、ニューラルネットワークで単一の平衡を解くだけでなく、平衡の連続分布に有効なニューラルネットワークモデルを計算するための大幅な改善を期待する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:11:31 GMT)
Gender Stereotypes in Professional Roles Among Saudis: An Analytical Study of AI-Generated Images Using Language Models [0.6]
ImageFX, DALL-E V3, およびGrokが生成した1,006の画像を, 56種類のサウジアラビアの専門職に対して分析した。 ImageFXの出力は85%が男性、Grok 86.6%が男性、DALL-E V3が96%である。反ステレオタイプ的イメージは、真に進歩的な描写というよりはむしろ文化的な誤解から生じることが多い。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:30:51 GMT)
Generalized Gradient Descent is a Hypergraph Functor [0.5]
勾配降下は最適化問題のハイパーグラフ圏から力学系のハイパーグラフ圏へハイパーグラフ関手を誘導することを示す。本稿では、ハイパーグラフ関手が、ドメイン内で指定された任意の合成問題に対して分散最適化アルゴリズムをいかに誘導するかを説明する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:17:47 GMT)
Phase Transitions in Nonreciprocal Driven-Dissipative Condensates [0.5]
非平衡駆動散逸相転移における境界と空間的非相互性の影響について検討する。我々のモデルは選択後不要であり、超伝導回路などのプラットフォームで実験的に実現可能である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:21:45 GMT)
Learning Terrain-Specialized Policies for Adaptive Locomotion in Challenging Environments [0.5]
この研究は、地形に特化されたポリシーとカリキュラムの学習を活用して、複雑な環境での俊敏性を高め、パフォーマンスを追跡する階層的な強化学習フレームワークを導入する。本研究では,本手法をシミュレーションで検証し,本手法は成功率を最大16%向上させ,速度目標の増大とともに追従誤差の低減を図る。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:17:39 GMT)
Measuring LLM Sensitivity in Transformer-based Tabular Data Synthesis [0.5]
トランスフォーマーベースのモデルは、データ品質の点で他の最先端モデルよりも優れている。高い計算コストは、プロサマーハードウェアを持つエンドユーザーには実現不可能な場合があります。 GReaTは、REaLTabFormerよりも低いランタイムを一貫して達成し、最も大きなデータセットでしか実行できない。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:48:48 GMT)
Frequency-Aware Model Parameter Explorer: A new attribution method for improving explainability [0.4]
我々は、転送可能な周波数認識攻撃と呼ばれる、転送可能な敵攻撃の新しいカテゴリを提案する。また、周波数認識モデルエクスプローラ(FAMPE)という新しい属性手法を提案する。現在の最先端手法である AttEXplore と比較して,FAMPE の平均値が13.02% に達した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:00:44 GMT)
Fractals and spontaneous symmetry breaking with type-B Goldstone modes: a perspective from entanglement [0.4]
1次元スピン-$s$ $rm SU(2)$ 強磁性ハイゼンベルク模型は、タイプBゴールドストーンモード(GM)を持つ自然対称性破壊(SSB)のパラダイム的な例として、基底状態部分空間の下の抽象的なフラクタルを示すことが期待されている。この内在的な抽象フラクタルは、カントール集合の集合に分解可能なフラクタル上の因子化(アンタングル化)基底状態の線形結合に対する絡み合いエントロピーの体系的な研究から明らかである。我々の議論は、タイプBGMでSSBを実行している任意の量子多体系に拡張されるかもしれない
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:50:08 GMT)
i-LAVA: Insights on Low Latency Voice-2-Voice Architecture for Agents [0.4]
我々は,音声音声合成システム(V-2-V)に不可欠なコンポーネントを解析し,自動音声認識(ASR),テキスト音声合成(TTS),ダイアログ管理を行う。我々の研究は、自然停止や宣言を含む感情に満ちた生活に似た音声を生成するTTS成分がリアルタイムファクター(RTF)に最も影響を与えることを確認した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:15:51 GMT)
World's First Authenticated Satellite Pseudorange from Orbit [0.4]
本稿では,Pulsarの透かし設計とセキュリティ解析について論じる。我々はPulsar透かしの誤検知と誤警報の確率を導出する。軌道からの送信を利用したパルサー透かしの検証結果を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:14:12 GMT)
Extrapolating Phase-Field Simulations in Space and Time with Purely Convolutional Architectures [0.4]
LMD(Liquid Metal dealloying)の位相場モデルは、リッチな微細構造力学を解くことができるが、大きな領域や長い時間的地平線では難解となる。条件付きパラメータ化された完全に畳み込みされたU-Netサロゲートは、空間と時間の両方でトレーニングウィンドウをはるかに越えて一般化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:52:59 GMT)
Diffusion-Augmented Contrastive Learning: A Noise-Robust Encoder for Biosignal Representations [0.4]
本稿では,拡散モデルと教師付きコントラスト学習の概念を融合した,拡散拡張コントラスト学習(DACL)を提案する。 Scattering Transformer(ST)機能に基づいてトレーニングされた軽量変分オートエンコーダ(VAE)によって作成された潜時空間で動作する。 U-Netスタイルのエンコーダは、教師付きコントラスト目標を用いて訓練され、様々な拡散時間ステップでクラス識別とノイズとの堅牢性のバランスをとる表現を学ぶ。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:19:39 GMT)
Guiding Application Users via Estimation of Computational Resources for Massively Parallel Chemistry Computations [0.4]
我々は,スーパーコンピュータ上で高価な実験を行うことにコミットする前に,アプリケーションユーザを誘導する機械学習戦略を開発する。アプリケーション実行時間の予測により、ノード数やタイルサイズなどの最適な実行時パラメータ値を決定する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:00:36 GMT)
Painless Activation Steering: An Automated, Lightweight Approach for Post-Training Large Language Models [0.4]
アクティベーションステアリング(AS)は、既存の2つのポストトレーニング方法に代わる、安価で、高速で、制御可能な代替手段を約束する。完全に自動化された手法のファミリーであるPainless Activation Steering (PAS)を紹介する。 PASは行動タスクのパフォーマンスを確実に向上させるが、インテリジェンス指向のタスクには向いていない。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:25:47 GMT)
Decoupled-Value Attention for Prior-Data Fitted Networks: GP Inference for Physical Equations [0.4]
PFNは、物理系の高速サロゲートを生成するための時間消費ガウス過程(GP)推論の代替として有望である。本稿では,DVA(Decoupled-Value Attention)を導入し,関数空間が入力上のカーネルによって完全に特徴付けられるというGP特性を動機とした。 PFNをスケールする上で重要な要素は,アーキテクチャ自体よりもアテンションルールにあることを実証する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:32:42 GMT)
Information-theoretic analysis of complex eigenmodes across avoided crossings in open microcavities [0.4]
複素固有周波数を持つオープンマイクロキャビティは、開度と損失がモーダル構造を再編成する様子を観察するための便利なプラットフォームを提供する。実数体と虚数体の確率重みによる複素QNMを表すコンパクトな四角形空間フレームワークを提案する。この手法を交流領域に適用すると、非局在化は個々の二次構造の拡大だけでなく、交流近傍における内部相関の顕著な増大によっても引き起こされることが分かる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:46:57 GMT)
From Indexing to Coding: A New Paradigm for Data Availability Sampling [0.4]
我々はDASに新たなアプローチを導入し、オンザフライコーディングによるサンプリングを行いながら、未コーディングデータにコミットすることで、コーディングとコミットメントのプロセスをモジュール化する。結果として得られたサンプルははるかに表現力が高く、光ノードは具体的実装において、データの可用性の保証を最大で複数の順序で得ることができる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:59:35 GMT)
humancompatible.train: Implementing Optimization Algorithms for Stochastically-Constrained Stochastic Optimization Problems [0.3]
公正さや安全性といったアプリケーションに対する、ディープニューラルネットワーク(DNN)の制約付きトレーニングには、かなりの関心が寄せられている。我々は、制約のあるトレーニングのために、容易に拡張可能なPyTorchベースのPythonパッケージであるHuman compatible.trainを提示する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:46:49 GMT)
Revolutionizing Precise Low Back Pain Diagnosis via Contrastive Learning [0.3]
腰痛は世界中の何百万もの人に影響を与え、堅牢な診断モデルの必要性を喚起する。我々は,腰椎MRIスキャンとそれに対応する放射線学的記述との整合性を確保するために,コントラスト言語画像事前訓練を利用する新しいフレームワークであるLumbarCLIPを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:52:25 GMT)
FHRFormer: A Self-supervised Transformer Approach for Fetal Heart Rate Inpainting and Forecasting [0.3]
胎児心拍数(FHR)モニタリングは、出生前医療における胎児の健康を評価する上で重要な役割を担っている。人工知能(AI)手法を適用して、持続的なFHR監視エピソードの大規模なデータセットを分析することで、呼吸補助や介入を必要とするリスクを予測する新たな洞察が得られるかもしれない。マスク付きトランスフォーマーを用いたオートエンコーダ手法を提案し, 空間成分と周波数成分の両方を捕捉することにより, 欠落したFHR信号を再構成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:40:21 GMT)
ALICE: An Interpretable Neural Architecture for Generalization in Substitution Ciphers [0.3]
本稿では、ニューラルネットワークの推論と一般化を研究するための理想的なテストベッドとして、暗号解法を提案する。我々は,この復号化問題の精度と速度を両立させる,シンプルなエンコーダのみの変換器であるALICEを開発した。驚くべきことに、ALICEはsim1500$のユニークな暗号をトレーニングした後、目に見えない暗号に一般化している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:15:04 GMT)
Human Semantic Representations of Social Interactions from Moving Shapes [0.3]
視覚的特徴を補うために人間が使用する意味表現について検討する。人間の類似性判定により,27の社会的相互作用の表現幾何学を測定した。意味モデルの中で、記述から抽出された動詞ベースの埋め込みは、人間の類似性判断が最善である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:15:50 GMT)
Multimodal Deep Learning for Phyllodes Tumor Classification from Ultrasound and Clinical Data [0.3]
Phyllodes tumors (PTs) は良性線維腺腫との放射線学的類似性から術前の分類が困難である。乳房超音波(BUS)画像を構造化された臨床データと統合して診断精度を向上させるマルチモーダルディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:00:16 GMT)
Predicting Male Domestic Violence Using Explainable Ensemble Learning and Exploratory Data Analysis [0.2]
本研究ではバングラデシュにおける男性家庭内暴力(MDV)の新しいデータ駆動分析法を提案する。バングラデシュの9大都市から収集したデータを探索データ分析(EDA)を用いて解析した。 EDAは, 言語虐待の頻度, 金銭的依存の影響, MDVにおける家族的・社会経済的要因の役割などのパターンを明らかにした。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:50:42 GMT)
AutoIntent: AutoML for Text Classification [0.2]
AutoIntentは、埋め込みモデル選択、分類器最適化、決定しきい値チューニングを備えたエンドツーエンドの自動化を提供する。 AutoIntentは、標準的なインテント分類データセット上の既存のAutoMLツールよりも優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:27:52 GMT)
Energy saving in off-road vehicles using leakage compensation technique [0.2]
本論文は, 重土移動装置に用いるリニアアクチュエータのエネルギー効率向上に焦点をあてる。 PFCVを用いた油圧回路はPDCVを用いた従来の回路よりも8.5%エネルギー効率が高い。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:11:27 GMT)
Machine Learning for Pattern Detection in Printhead Nozzle Logging [0.2]
ノズルロギングの多面的データセットに基づくプリントヘッド故障分類の問題点について検討する。本稿では,この問題に対する機械学習の分類手法を提案する。提案モデルでは、複数の故障機構に対する重み付けされたF1スコアを用いて、社内ルールベースのベースラインよりも優れた性能を示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:41:10 GMT)
DisCoCLIP: A Distributional Compositional Tensor Network Encoder for Vision-Language Understanding [0.1]
本稿では,構文構造を符号化するマルチモーダルエンコーダであるDisCoCLIPを紹介する。 DisCoCLIPは動詞のセマンティクスや単語の順序に対する感度を著しく改善する。その結果、テンソルネットワークによる明示的な言語構造の埋め込みは、解釈可能なパラメータ効率の表現をもたらすことが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:06:56 GMT)
Cascade! Human in the loop shortcomings can increase the risk of failures in recommender systems [0.1]
Human-in-the-loop」は、主に説明責任の問題に対処するために広く採用されている。我々は、リコメンデータシステム設計における人間の監視もまた、まだ完全に説明されていない新しいリスクを伴っていると考えている。他のAIシステムに対して有意義な監視を提供するための"Human-in-the-loop"プラクティスの欠点に関する新たな知識は、社会的に責任を負うレコメンデーションを達成するのに不十分である可能性を示唆している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:14:50 GMT)
Holographic codes and bulk RG flows [0.1]
本稿では,Fallkner-Lewkowycz-Maldacena式における$A/4G$項のこの流れの下での正規化について検討する。これは、Susskind と Uglum の引数に関する一般的な量子コードビューを提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:11:50 GMT)
Quantum Simulation Programming via Typing [0.1]
量子シミュレーションは量子システムをモデル化するために設計されている。量子コンピュータ上でそのようなシミュレーションを実行するための多くのコンパイルフレームワークが開発されている。 QBLUEは量子システムの振る舞いを記述するための最初のプログラミング言語として提案されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:20:07 GMT)
Causal Reflection with Language Models [0.1]
本稿では,因果関係を状態,行動,時間,摂動の動的関数として明示的にモデル化するフレームワークCausal Reflectionを紹介する。我々は,予測結果と観測結果のミスマッチを識別し,因果仮説を生成し,エージェントの内部モデルを改訂する形式的リフレクション機構を定義する。我々の枠組みは、進化する環境における因果的理解を適応し、自己修正し、伝達できる因果的反射エージェントの理論的基礎を定めている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:51:34 GMT)
AbideGym: Turning Static RL Worlds into Adaptive Challenges [0.1]
AbideGymは動的MiniGridラッパーで、エージェント対応の摂動と拡張性のある複雑さを導入し、エピソード内適応を強制する。静的ポリシーの弱点を明らかにし、レジリエンスを促進することで、AbideGymはカリキュラム学習、継続的な学習、堅牢な一般化の研究を進めるためのモジュラーで再現可能な評価フレームワークを提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:34:36 GMT)
Context-Aware Hybrid Routing in Bluetooth Mesh Networks Using Multi-Model Machine Learning and AODV Fallback [0.1]
Bluetoothベースのメッシュネットワークは、緊急およびリソース制約のあるシナリオにおけるオフライン通信のための有望なインフラストラクチャを提供する。 Adhoc On-Demand Distance Vector (AODV)のような従来のルーティング戦略は、しばしば混雑と動的トポロジ的変化の下で劣化する。本研究では,教師付き機械学習によりAODVを増強し,ホップ選択を改善するハイブリッドなインテリジェントルーティングフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:49:24 GMT)
Downscaling human mobility data based on demographic socioeconomic and commuting characteristics using interpretable machine learning methods [0.1]
本研究は,ニューヨーク市内におけるOrigin-Detination (OD) タクシーの走行をダウンスケールする機械学習フレームワークを提案する。 OD旅行と人口統計,社会経済,通勤特性の相関関係を考察した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:55:10 GMT)
Quantum algorithms for solving a drift-diffusion equation: analysing circuit depths [0.0]
2次元のドリフト拡散方程式を解く量子アルゴリズムを実装した。ゲートセットは、制約のないゲートセット、QuantinuumのTK1ゲートセット、IBM HeronとIonQのネイティブゲートセット、そして富士通の時空効率的なアナログローテーション(STAR)ゲートセットである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:02:35 GMT)
Harnessing optical disorder for Bell inequalities violation [0.0]
ベルの不等式は、量子通信チャネルにおける量子絡み合いを証明している。ベル不等式検査による絡み合いの証明に光学障害を活用できることが示唆された。我々の手法はベルの不等式をテストするための根本的に新しい方法を提供し、測定基準の明示的な選択の必要性を排除している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:02:06 GMT)
WISER: Segmenting watermarked region - an epidemic change-point perspective [0.0]
We propose WISER: a novel, computely efficient, watermark segmentation algorithm。 WISERは最先端のベースライン法よりも優れていることを示す。また、古典的な統計問題からの洞察が理論的に有効で計算学的に効率的な解をもたらすことを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:44:34 GMT)
VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment [0.0]
本稿では,視覚言語キャプション・エンハンサー(VLCE)を導入し,災害画像の包括的,文脈的にインフォームドされた説明を作成する。 VLCEでは、XBDデータセットのEuroSat衛星画像に事前トレーニングされたResNet50バックボーンを備えたCNN-LSTMモデルと、RescueNetデータセットのUAV画像に事前トレーニングされたViTモデルという、デュアルアーキテクチャのアプローチを採用している。セマンティックアライメントにはCLIPScore,キャプション情報にはInfoMetICを用いて,主要な視覚言語モデル(LLaVAとQwenVL)と比較してVLCEを評価する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:21:00 GMT)
UNO: Unlearning via Orthogonalization in Generative models [0.0]
非条件および条件付き生成モデルに対する高速非学習アルゴリズムを提案する。我々のアルゴリズムは、元のモデルの忠実さを維持しながらデータを忘れることができることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:29:59 GMT)
Two-dopant origin of competing stripe and pair formation in Hubbard and $t$-$J$ models [0.0]
本研究では, 密度行列再正規化群アルゴリズムを用いて, 円筒系における単対のドーパントについて検討した。秩序と一様ペアリングの相互作用は、有限ドーピングにおけるモデルの位相の中心であり、その起源は単対レベルである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:12:03 GMT)
Tracking spin qubit frequency variations over 912 days [0.0]
Si/SiGe量子ドットプラットフォームにおけるスピン量子ビット周波数の安定性について検討する。 6量子ビットデバイスの校正量子ビット周波数は、最大100ドルMHzまで変化し、912日間にわたって様々な実験を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:35:04 GMT)
Thermal reconstruction of chaotic quantum many-body systems [0.0]
条件付き相互情報を用いてペッツ回復の良さを確認する。モデルのカオス的相と可積分相の異なる挙動を観察する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:14:03 GMT)
Theoretical Bounds for Stable In-Context Learning [0.0]
In-context Learning (ICL) は柔軟性があるが、その信頼性は迅速な長さに敏感である。本稿では、最小数の実証とICL安定性を結びつける非漸近的下界を確立する。本稿では,1ショットキャリブレーションを施した2段階観測可能推定器を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:25:05 GMT)
The Lifecycle Principle: Stabilizing Dynamic Neural Networks with State Memory [0.0]
状態記憶を中心とした正規化機構を提案する。再生したニューロンを再初期化する代わりに、私の方法はパラメータを最後の既知の有効状態に復元する。画像分類ベンチマーク実験により, この手法が一般化とロバスト性を向上させることが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:54:37 GMT)
Tensors, entanglement, separability, and their complexity [0.0]
ほとんどの幾何学的測度は、$d$-partite状態は最小スペクトルノルムと最大核ノルムを持つ。エルミートテンソルと密度テンソルの概念と、ボソンズに対応する二対称エルミートテンソルの部分空間を導入する。分離性密度テンソルと強い分離性二対称密度テンソルは、対応する核ノルムの値(1に等しい)によって特徴づけられることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:58:44 GMT)
Temporal vs. Spatial: Comparing DINOv3 and V-JEPA2 Feature Representations for Video Action Analysis [0.0]
DINOv3 は空間的特徴抽出によってフレームを独立に処理し、V-JEPA2 はビデオシーケンス間の共同時間モデリングを採用している。 UCFスポーツデータセットにおいて,分類精度,クラスタリング性能,クラス内整合性,クラス間識別など,複数の次元による特徴量の検討を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:05:07 GMT)
Teleportation-based filtering for gravitational-wave detectors [0.0]
重力波検出器における量子テレポーテーションの原理は、技術的な課題に対処する方法を提供する。最近の提案では、量子テレポーテーションをカスケードすることで、任意の数の有効スクイーズ角回転が達成できることが示されている。自然な疑問は、テレポーテーションベースのプロトコルが周波数依存性のポストフィルタを実現することができるかどうかである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:50:27 GMT)
StrCGAN: A Generative Framework for Stellar Image Restoration [0.0]
我々は、低解像度の天体写真画像を改善するために設計された生成モデルStrCGANを紹介する。我々のゴールは、天体の高忠実な真実のような表現を再構築することであり、これは小望遠鏡観測の解像度と品質に制限があるため難しい課題である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:22:50 GMT)
Squeezing codes: robust fluctuation-stabilized memories [0.0]
古典力学の族を2次元以上の次元で導入し、任意の対称性が存在しない場合に秩序を安定化させる。我々のモデルのうちの1つは、2次元でしか順序づけられた位相を保持しない。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:22:06 GMT)
SpecMER: Fast Protein Generation with K-mer Guided Speculative Decoding [0.0]
SpecMER (Speculative Decoding via k-mer Guidance) は、生物学的、構造的、機能的な事前を組み込んだ新しいフレームワークである。通常の自己回帰復号よりも24～32%のスピードアップを実現し、高い受容率と改善されたシーケンス確率を実現している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:26:04 GMT)
Sparse Representations Improve Adversarial Robustness of Neural Network Classifiers [0.0]
ディープニューラルネットワークは、画像分類タスクにおいて極めてよく機能するが、慎重に構築された敵の摂動に弱いままである。この研究は、線形次元の減少を単純なデータ適応型防衛として再考する。実証的には、プロジェクション後の小さな非線形ネットワークにより、SPCAは強いホワイトボックスとブラックボックス攻撃の下で、PCAよりも常に優雅に低下する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:21:22 GMT)
Smearing of dynamical quantum phase transitions in dissipative free-fermion systems [0.0]
消散性二次フェルミオン系におけるLoschmidtエコー(RLE)のリンドブラッドダイナミクスについて検討した。対応するユニタリ力学に存在する非解析性は、純粋にゲインまたは純粋に損失過程の下で生き残ることができることを示す。また, 発散動力学と単体動力学の微妙な相互作用は, RLEの力学においてネストした光錐構造を生じさせることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:59:20 GMT)
Small LLMs with Expert Blocks Are Good Enough for Hyperparamter Tuning [0.0]
我々は小言語モデルを用いたHPTのためのエキスパートブロックフレームワークを提案する。 Trajectory Context Summarizer (TCS)は、生のトレーニング軌跡を構造化されたコンテキストに変換する決定論的ブロックである。 TCS対応HPTパイプラインは、6つのタスクでGPT-4の0.9パーセントの範囲で平均性能を達成する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:26:44 GMT)
Size-dependent critical localization [0.0]
このレターでは、サイズ依存臨界状態と呼ばれる、エキゾチックなタイプの臨界状態を予測する。サイズ依存臨界状態の物理的起源は、局所的非相互領域壁とNHSEの相乗的相互作用にあることを証明した。臨界局在化の確立されたパラダイムに挑戦する臨界位相を明らかにすることで、準周期系における局所化現象を探求するための新たな道を開く。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:46:59 GMT)
Simulating Student Success in the Age of GenAI: A Kantian-Axiomatic Perspective [0.0]
本研究は,モンテカルロシミュレーションを用いて,生成型AI(GenAI)を用いた学生の認知的成功を,カンチアン・アキシマティックレンズを用いて再解釈する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 03:01:39 GMT)
Series of molecular-like doubly excited states of a quasi-three-body Coulomb system [0.0]
ストロンチウム原子の高角運動量惑星状態の共鳴多光子励起について検討した。二重イオン化しきい値に収束する2重励起電子状態が第一原理計算によって同定され、再現された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:22:14 GMT)
Semantic Data Representation for Explainable Windows Malware Detection Models [0.0]
本稿では,PEマルウェアファイルに対する再利用可能なセマンティックスキーマを提供するPEマルウェアオントロジーを提案する。このオントロジーは、PEファイルの静的マルウェア解析に焦点を当てたEMBERデータセットの構造に着想を得たものである。また、EMBERの実験を支援するために、分数データセットを含む意味的に処理されたEMBERデータも公開する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:47:17 GMT)
Sampling via Gaussian Mixture Approximations [0.0]
非正規化ターゲット密度をサンプリングするためのGMAサンプル群を提示する。この最適化・再サンプリング方式は、穏やかな条件下で一貫した近似が得られることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 04:13:31 GMT)
Reverse Faà di Bruno's Formula for Cartesian Reverse Differential Categories [0.0]
ここではファア・ディ・ブルーノの公式の逆微分類似式を示す。適切に行うために、部分逆微分と高次逆微分も定義する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:16:45 GMT)
Retina Vision Transformer (RetinaViT): Introducing Scaled Patches into Vision Transformers [0.0]
空間周波数の異なるパッチを視覚変換器(ViT)に導入する効果について検討する。このモデルをRetina Vision Transformer (RetinaViT) と呼ぶのは、人間の視覚系からのインスピレーションによるものである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:52:06 GMT)
Resolving space-time structures of quantum impurities with a numerically exact few-body algorithm [0.0]
大規模浴槽における量子不純物に対する数値的に正確なリアルタイム進化法を提案する。このアルゴリズムは、時間依存の軌道回転によって(自明な生成状態において)不活性にできる電子軌道を識別する、ほとんど身体的でない。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:06:07 GMT)
Regulating the Agency of LLM-based Agents [0.0]
本稿では,AIシステムを直接計測し,制御する手法を提案する。我々は, LLMをベースとしたエージェントのエージェントを, インテリジェンス関連の対策とは無関係な資産として概念化する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:14:02 GMT)
Quantum Algorithm for Smoothed Particle Hydrodynamics [0.0]
本研究ではスムーズな粒子流体力学(SPH)法に対する量子計算アルゴリズムを提案する。誤差収束は、キュービット数において指数関数的に高速である。一次元の対流と偏微分微分方程式の解法を拡張する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:06:11 GMT)
Quantifying depressive mental states with large language models [0.0]
大規模言語モデル(LLM)はメンタルヘルスにおいて重要な役割を担っている。 3つの臨界試験におけるLLM性能の概要と評価を行った。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:11:20 GMT)
Probing non-equilibrium steady states of the Klein-Gordon field with Unruh-DeWitt detectors [0.0]
非平衡定常状態に結合したUnruh-DeWitt検出器の遷移速度を計算する。検出器はモノポール相互作用により磁場に直線的に結合し、NESS熱流の軸に沿って運動する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:13:10 GMT)
Part-of-speech tagging for Nagamese Language using CRF [0.0]
本稿では,ナガメ語における自然言語処理(NLP)の重要な課題である音声タグ付けについて検討する。 16,112個のトークンの注釈付きコーパスを作成し、条件ランダムフィールド(Conditional Random Fields, CRF)として知られる機械学習技術を適用した。 CRFを用いて、全体のタグ付け精度は85.70%、精度は86%、f1スコアは85%である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:44:43 GMT)
Optimal squeezing to minimize vulnerability to losses [0.0]
非ガウス状態の損失に対するロバスト性は、量子状態の前処理によって著しく改善できることを示す。このようなよく知られた量子状態は、シュロディンガー・キャット、フォック、バナナのものとみなす。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:58:41 GMT)
On the Quantization of the Electromagnetic Field with Magnetic Monopoles [0.0]
磁気モノポールの存在下での電磁場の量子化のための共変フレームワークを提案する。我々は、従来の光子に加えて、磁気電荷に付随する二重光子の存在を予測する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:45:07 GMT)
Observation of resonant monopole-dipole energy transfer between Rydberg atoms and polar molecules [0.0]
ヘリウム中のリドバーグ準位はアンモニア分子との低温衝突で観測されている。このハイブリッドリドバーグ原子の極分子はモノポール-双極子エネルギー交換反応を表す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:57:43 GMT)
Nonstabilizerness of a Boundary Time Crystal [0.0]
境界時間結晶はその定常状態の絡み合いにおいて測定誘起相転移を示す。非安定度は、異なる未発見のスキームの下で不変である。発見は、オープンシステムで異なる量子リソースがどのように現れるかについての洞察を与える。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:21:11 GMT)
Neural Operators for Mathematical Modeling of Transient Fluid Flow in Subsurface Reservoir Systems [0.0]
本稿では, 開発型ニューラルオペレーターアーキテクチャ(TFNO-opt)に基づく地下貯留層における過渡流動のモデル化手法を提案する。提案したアーキテクチャは、無限次元関数空間におけるPDE解の近似を可能にするフーリエニューラル演算子に基づいている。提案手法の有効性を計算実験により確認した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:45:07 GMT)
Nanoscale Mirrorless Superradiant Lasing [0.0]
我々は高密度ナノスコピックエミッタ配置における集合的「自由空間」ラシングを予測する。このことが原子周波数付近の超放射光の発散につながることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:33:56 GMT)
Multi-Modal Sentiment Analysis with Dynamic Attention Fusion [0.0]
本稿では,事前学習した言語モデルからの凍結したテキスト埋め込みと音声エンコーダの音響的特徴を組み合わせた軽量フレームワークである動的注意融合(DAF)を紹介する。提案するDAFモデルは,大規模なマルチモーダルベンチマークにおいて,静的核融合と非モードベースラインの両方を一貫して上回っている。言語情報と非言語情報を効果的に統合することにより、我々のアプローチは感情予測のためのより堅牢な基盤を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:54:04 GMT)
MolPILE - large-scale, diverse dataset for molecular representation learning [0.0]
MolPILEは2億2200万の化合物の大規模で多様で厳密な収集品である。この研究はモデルトレーニングのための標準化されたリソースを提供し、分子化学におけるImageNetのようなデータセットの必要性に対処する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:48:11 GMT)
Measuring Algorithmic Partisanship via Zero-Shot Classification and Its Implications on Political Discourse [0.0]
本稿では、ゼロショット分類手法を用いて、アルゴリズムによる政治的パルチザン性を評価する。 6つの主要な大言語モデルにまたがる1800のモデル応答は、4つの異なる微調整された分類アルゴリズムに個別に入力された。その結果、リベラルな権威主義的なアライメントが増幅され、推論のスーパーセッションや缶詰の拒絶の顕著な例が示されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 05:26:20 GMT)
ML-PWS: Estimating the Mutual Information Between Experimental Time Series Using Neural Networks [0.0]
実験的な時系列データから生成モデルを構築するために機械学習を利用する手法を提案する。 ML-PWSとよばれるこの手法の精度を,PWSを同一モデルに直接適用することによって得られる地中信頼度に対して示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:26:54 GMT)
MAIFormer: Multi-Agent Inverted Transformer for Flight Trajectory Prediction [0.0]
Multi-Agent Inverted Transformer MAIFormerは、マルチエージェントの飛行軌跡を予測する新しいニューラルネットワークである。我々は,MAIFormerを実世界における自動監視ブロードキャストフライトトラジェクトリデータセットを用いて評価する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:59:29 GMT)
Leveraging Big Data Frameworks for Spam Detection in Amazon Reviews [0.0]
この研究は、高度なビッグデータ分析と機械学習アプローチを、Amazon製品レビューのかなりのデータセットに採用している。主な目的は、スパムレビューを正確に検出し、分類し、レビューの信頼性を高めることである。ロジスティック回帰は90.35%の精度を達成し、より信頼性が高く透明なオンラインショッピング環境に寄与する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:56:13 GMT)
Learning to Reason with Mixture of Tokens [0.0]
検証可能な報酬(RLVR)による強化学習は、大規模言語モデル(LLM)推論能力を改善するための主要なアプローチとなっている。本稿では,既存のMoT-Gアプローチを一般化するフレームワークを提案する。 Qwen2.5-1.5Bモデルと比較すると,MoT-G法は10タスク中7タスクで5-35パーセント向上した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:44:24 GMT)
Learning to Align Molecules and Proteins: A Geometry-Aware Approach to Binding Affinity [0.0]
FIRM-DTIは、機能的に線形な変調層を通じてタンパク質の埋め込みに分子の埋め込みを調節する軽量なフレームワークである。埋め込み距離で動作するRBF回帰ヘッドは、滑らかで解釈可能な親和性予測をもたらす。本研究は,ロバストな薬物親和性予測のための条件付けとメートル法学習の価値を裏付けるものである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:55:24 GMT)
Label-Efficient Grasp Joint Prediction with Point-JEPA [0.0]
Point-JEPAによる3次元自己教師付き事前トレーニングにより,ラベル効率のよいグリップ・アングル予測が可能となる。 JEPAスタイルの事前学習は、データ効率のよい学習のための実践的なレバーである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:40:32 GMT)
LLM-Based Support for Diabetes Diagnosis: Opportunities, Scenarios, and Challenges with GPT-5 [0.0]
本研究は、Ada Standards of Care 2025に準拠した合成ケースをベースとしたシミュレーションフレームワークを用いて、最新の生成事前学習トランスであるGPT-5を評価する。症状認識, 検査室解釈, 妊娠中の糖尿病スクリーニング, リモートモニタリング, 合併症検出の5つのシナリオが検討された。 GPT-5は, 臨床医と患者のための多目的ツールとして機能する可能性が示唆された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:22:04 GMT)
LAVA: Explainability for Unsupervised Latent Embeddings [0.0]
LAVA(Locality-Aware Variable Associations)は、局所的な埋め込み組織と入力機能との関係を説明するために設計された。 MNIST と単細胞腎データセットの UMAP 埋め込みに基づいて,LAVA が関連する特徴関連を捉えていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:38:17 GMT)
Isentropic processes for axisymmetric Black Holes [0.0]
古典的荷電試験粒子の等エントロピー吸収は、重力の微分同相不変理論において、すべての3+1次元定常非極端軸対称ブラックホールに対して古典的に禁じられていることを示す。さらに、量子トンネル法を用いて、一般相対性理論と解析においてカー・ニューマンブラックホールを考えると、等エントロピー吸収が許容される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:28:37 GMT)
Information and majorization theory for fermionic phase-space distributions [0.0]
超数理論を用いてフェルミオン相空間分布の不確かさを解析する。フェルミオン相空間分布はグラスマン評価されるが、対応する不確実性測度はベレジン積分として表される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:06:45 GMT)
In AI Sweet Harmony: Sociopragmatic Guardrail Bypasses and Evaluation-Awareness in OpenAI gpt-oss-20b [0.0]
本研究では,社会実践的フレーミング,言語選択,命令階層が拒絶行動に与える影響について検討する。我々は、ZIPボム構築(サイバー脅威)を含むいくつかの有害ドメインをテストする。 OpenAI モデレーション API は,セマンティックグレーダに対して非常に有用な出力を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 07:00:12 GMT)
Identification and Optimal Nonlinear Control of Turbojet Engine Using Koopman Eigenfunction Model [0.0]
ガスタービンエンジンは複雑で非線形な力学系である。物理ベースのモデルを導出するのは、必ずしも利用できないパフォーマンス特性を必要とするため、難しい場合があります。本稿では,コンポーネントレベルおよび局所線形パラメータ変動モデルの導出に用いる従来の実験手法の限界について論じる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:18:12 GMT)
Hybrid Summary Statistics [0.0]
本稿では,厳密なシミュレーションに基づく推論のために,パラメータ空間上でスパースにサンプリングされたトレーニングセットから高情報後部を捕捉する方法を提案する。これらの統計データをニューラルネットワーク出力で拡張することにより、相互情報の最大化が、ニューラルネットワーク単独や既存の要約との結合よりも情報抽出を改善することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:27:51 GMT)
Hallucination-Resistant, Domain-Specific Research Assistant with Self-Evaluation and Vector-Grounded Retrieval [0.0]
RA-FSMはGPTベースの研究アシスタントであり、有限状態制御ループで生成をラップする。コントローラはスコープ外クエリをフィルタリングし、応答可能性を評価し、質問を分解し、必要なときにのみ検索をトリガーする。本稿では,フォトニクスのためのシステムを実装し,解析的推論,数値解析,方法論的批判,比較合成,事実抽出,アプリケーション設計の6つのカテゴリで評価する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:35:46 GMT)
HARLI CQUINN: Higher Adjusted Randomness with Linear In Complexity QUantum INspired Networks for K-Means [0.0]
古典的k平均アルゴリズムと同等以上の量子性能を示す。我々は、その精度のベンチマークを、よく知られたデータセットと実験データセットの両方のテストケースに提示する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 01:46:44 GMT)
GenUQ: Predictive Uncertainty Estimates via Generative Hyper-Networks [0.0]
演算子学習は関数間の写像への回帰の一般化である。既に海氷、燃焼、大気物理学のモデリングなど、いくつかの分野で応用例が見つかっている。我々は、生成的ハイパーネットワークモデルを導入することにより、可能性を構築することを避けるため、UQに対する測度理論的アプローチであるGenUQを紹介する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:19:03 GMT)
GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion [0.0]
計量単分子深度推定の一般化は、その不適切な性質のために重要な課題となる。本稿では,様々なカメラ設定の整合性を維持する新しい標準表現を提案する。また,物体の大きさや垂直位置の手がかりによって推定される深度を適応的かつ確率的に融合する新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:48:57 GMT)
From VQE To SQD: Modern Quantum Algorithms For The Electronic Structure Problem [0.0]
本論文は,電子状態エネルギー推定のためのサンプリングベース量子アルゴリズムについて考察する。変分量子固有解法(VQE)の短期的な代替手段として、量子選択構成相互作用(QSCI)とサンプルベース量子対角化(SQD)に焦点を当てている。この分析は、IBMの127キュービットのIBM Brisbaneプロセッサ上でのシミュレーション、ハードウェアキャリブレーションによるノイズ研究、実行を通じて検証される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:39:14 GMT)
From Sorting Algorithms to Scalable Kernels: Bayesian Optimization in High-Dimensional Permutation Spaces [0.0]
本稿では,ソートアルゴリズムから派生したカーネル関数を用いて,効率的な置換表現を生成する新しいフレームワークを提案する。このフレームワーク内では、Mallowsカーネルはソートから派生した特別なインスタンスと見なすことができる。我々の中心的な主張は、マージカーネルが低次元設定でMallowsカーネルと競合するということである。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:43:27 GMT)
Foundation models for high-energy physics [0.0]
このレビューは、高エネルギー物理学の基礎モデルに関する最初の話題である。これまでにフィールドで出版された研究を要約し、議論している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:03:37 GMT)
FastTracker: Real-Time and Accurate Visual Tracking [0.0]
本稿では,複数のオブジェクトタイプを扱える汎用的な追跡フレームワークを提案する。提案手法は,(1)密閉物体の識別を向上する隠蔽認識再識別機構,(2)道路構造認識トラックレット改質戦略の2つの重要な要素を組み込んだ。大規模な実験結果から,提案手法は新たに導入されたデータセットといくつかの公開ベンチマークの両方で堅牢な性能を実現することが示された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 02:15:12 GMT)
Fast-SEnSeI: Lightweight Sensor-Independent Cloud Masking for On-board Multispectral Sensors [0.0]
Fast-SEnSeIは、センサーに依存しないエンコーダモジュールで、マルチスペクトルセンサー間で柔軟でオンボードのクラウドセグメンテーションを可能にする。スペクトルバンドとその波長の任意の組み合わせを受け入れ、コンパクトで量子化されたセグメンテーションモデルに供給する固定サイズの特徴写像を生成する。 Sentinel-2とLandsat 8データセットの評価では、多様な入力構成の正確なセグメンテーションが示されている。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:40:31 GMT)
Fast mixing of operator-loop path-integral quantum Monte Carlo for stoquastic XY Hamiltonians [0.0]
演算子ループ更新を用いた量子モンテカルロ法は、凝縮物質物理学で広く用いられている強力な手法である。様々なスピン、ボゾン系、フェルミオン系の局所ハミルトン系の熱的および基底状態から試料を採取することができる。この手法の実際的な成功にもかかわらず、アルゴリズムの効率に関する理論的理解は欠如している。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 23:19:01 GMT)
Exploiting Non-Markovian Memory Effects for Robust Quantum Teleportation [0.0]
非マルコフ力学がテレポーテーションの忠実性にどのように影響するかを研究する。測定に基づく2つの戦略は、非マルコフ雑音下でのテレポーテーションの忠実度を高めることができる。以上の結果から,非マルコフ記憶効果,統計速度,コヒーレンス保存の関連性が確認された。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:21:33 GMT)
Ethical AI for Young Digital Citizens: A Call to Action on Privacy Governance [0.0]
若者が利用するデジタルプラットフォームにおける人工知能の急速な拡張は、プライバシ、自律性、データ保護に関する大きな課題を生み出している。 AI駆動のパーソナライゼーションは、ユーザエクスペリエンスの向上を提供するが、しばしば明確な倫理的境界なしに動作し、若いユーザはデータエクスプロイトやアルゴリズム上のバイアスに弱いままである。本稿では、青少年中心のプライバシ保護、透過的なデータプラクティス、規制監督を保証する構造化されたフレームワークを提唱する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:43:39 GMT)
Estimating the entanglement of random multipartite quantum states [0.0]
ランダムサンプリングテンソルのインジェクティブノルムを推定するために,様々なアルゴリズムを研究・比較する。真のマルチパーティリート絡み合いの量に関する最初の数値計算は、通常ランダムなマルチパーティリート純状態の様々なモデルに存在する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:16:43 GMT)
Erasing Photon-Number Correlations through Hong-Ou-Mandel Interference [0.0]
ビームスプリッターに干渉するパラメトリックダウンコンバージョン源は、絡み合ったN00N状態の源または独立なソースと説明できる。この干渉の出力は光子数図で分離可能であることを示すとともに、励起光源の特性評価のための光子数相関値の値を示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:09:48 GMT)
Empirical Analysis Of Heuristic and Approximation Algorithms for the The Mutual-Visibility Problem [0.0]
本稿では,3つの異なるアルゴリズム – 直接ランダムな振る舞い,ハイパーグラフに基づく近似,遺伝的アルゴリズム – を実装し,評価する。以上の結果から,より小さなグラフに対して,アルゴリズムは理論的境界に整合したMV集合のサイズを一貫して達成することを示した。既知の最適グラフの検証では、遺伝的アルゴリズムと他のアルゴリズムが試験方法の中で最高の性能を示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:45:40 GMT)
Emerging Paradigms for Securing Federated Learning Systems [0.0]
MPC、ホモモルフィック暗号化(HE)、微分プライバシ(DP)などの手法は、しばしば高コストのコンプ・テイタショナル・コストを発生させ、スケーラビリティの制限に悩まされる。本調査では,フェデレート学習におけるプライバシと効率性の向上を約束する,新たなアプローチについて検討する。各パラダイムに対して、FLパイプラインとの関連性を評価し、その強み、限界、実践的考察を概説する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:34:44 GMT)
Efficient Quantum Measurements: Computational Max- and Measured Rényi Divergences and Applications [0.0]
本稿では,計算の最大偏差(max-divergence)と計算のR'enyi発散(R'enyi divergences)の2つの新しい種類について検討する。無限次極限において、R'enyi の発散は計算最大偏差と一致することを証明した。多重コピー方式では、正規化バージョンを導入し、達成可能な仮説テスト指数に束縛された一方の計算スタインを確立する。さらに、我々の計算分岐によって引き起こされる資源測度を定義し、資源の相対エントロピーの計算的相対的エントロピーに対して連続性を証明した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 15:22:23 GMT)
EEG-Based Consumer Behaviour Prediction: An Exploration from Classical Machine Learning to Graph Neural Networks [0.0]
脳波(EEG)データは、脳の神経活動に関する詳細な情報を提供することで、意思決定プロセスを分析するのに役立つ。古典モデルやグラフニューラルネットワークなど、さまざまな機械学習モデルを使用し、比較する。結果は全体としては大きな違いは示さなかったが、GNNモデルは古典的モデルが満足できないいくつかの基本的な基準において、概して良好な性能を示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:50:29 GMT)
Dynamics and Control of Two Coupled Quantum Oscillators: An Analytical Approach [0.0]
共通ローレンツ環境における2つの結合量子発振器を解析し、それらの周波数を調整して制御する。一定周期, 幅, 振幅の完全に周期的なオン/オフパルスと, オン/オフ構造は同じだが周期, 幅, 振幅のサイクル・ツー・サイクルジッタを持つ不規則なデチューニングの2つの制御スケジュールについて検討した。デチューニングは、システムを浴場のスペクトルピークから遠ざけ、デコヒーレンスを抑え、非マルコフの復活を阻害する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:53:34 GMT)
Dynamic RIS-Assisted THz Quantum Networks: Joint Optimization of Entanglement Generation and Fidelity under Channel Impairments [0.0]
テラヘルツ(THz)無線リンクがサポートする量子ネットワーク(QN)は、ファイバベースインフラの代替となる。 THzチャネルにおける信号減衰、分子吸収、および激しい伝搬損失は、信頼性の高い量子状態伝達と絡み合い分布に重大な課題をもたらす。本稿では、アクティブモードとパッシブモードを切り替えることのできる適応RIS要素を利用する動的再構成可能なインテリジェントサーフェス(RIS)支援無線QNアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 19:46:08 GMT)
Dual-Path Phishing Detection: Integrating Transformer-Based NLP with Structural URL Analysis [0.0]
フィッシングメールは、持続的かつますます高度な脅威となる。従来の検出方法は、これらの進化する攻撃に包括的に対処できない。自然言語処理(NLP)と古典的機械学習を統合したデュアルパスフィッシング検出フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:17:12 GMT)
Deterministic Discrete Denoising [0.0]
マルコフ連鎖に基づく離散状態拡散モデルに対する決定論的分解アルゴリズムを提案する。生成逆過程は、弱いカオス的ダイナミクスを持つハーディングアルゴリズムの変種を導入することによりデランドマイズされる。連続拡散において確立された決定論的逆過程は離散状態空間においても有効であることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:30:58 GMT)
Deep Learning for Crime Forecasting: The Role of Mobility at Fine-grained Spatiotemporal Scales [0.0]
歴史的犯罪や社会デマログラフィーデータとともに,マイクロレベルのモビリティ機能の導入が犯罪予測における予測性能を高めるか,どのように評価するかを評価するためのディープラーニングフレームワークを開発した。我々は、各市の警察署から得られた犯罪事件データと、アメリカコミュニティサーベイの社会デマグラフィーデータと、Advanの人間モビリティデータとを併用する。我々のディープラーニングモデルは、4つの都市で最高のリコール、精度、F1スコアを達成し、代替手法よりも優れています。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:58:56 GMT)
Data-driven Neural Networks for Windkessel Parameter Calibration [0.0]
そこで本研究では,Windkessel (WK) パラメータを次元的に低減した1D-0D結合血流モデルでキャリブレーションする方法を提案する。左腕動脈の血流を模擬したデータ駆動型ニューラルネットワーク(NN)を設計した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:14:53 GMT)
DAC-LoRA: Dynamic Adversarial Curriculum for Efficient and Robust Few-Shot Adaptation [0.0]
本稿では,PEFT に対人訓練を統合する新しいフレームワークである Dynamic Adrial Curriculum DAC-LoRA を提案する。本研究は,DAC-LoRAフレームワークを標準PEFTパイプラインに統合し,ロバスト性を大幅に向上させることができることを示すために,効果的で軽量で広く適用可能な手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 06:20:56 GMT)
Cross-Linguistic Analysis of Memory Load in Sentence Comprehension: Linear Distance and Structural Density [0.0]
本研究では, 文レベルの記憶負荷が, 構文的に関連した単語間の線形近接や, 介在物の構造密度によってよりよく説明されるかを検討する。複数の言語にまたがる調和した依存性ツリーバンクと混合効果フレームワークを用いて、分析は文の長さ、依存関係の長さ、インターベンタ複雑度をメモリ負荷測定の予測器として共同で評価する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 08:59:51 GMT)
Critical dynamics and superconducting state preparation in the quenched Kitaev chain with pairing imbalance [0.0]
ペアリング項のバランスは、p波スピンレスキタエフ鎖におけるトポロジカル超伝導の出現に重要な役割を果たしている。北エフ鎖の平衡現象と非平衡現象に対する非エルミートペアリング項の影響について検討する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:28:58 GMT)
CopulaSMOTE: A Copula-Based Oversampling Approach for Imbalanced Classification in Diabetes Prediction [0.0]
本研究では,マイノリティクラスにおけるデータ生成時の依存構造を保存するコプラに基づくデータ拡張について検討した。我々は、Pima Indianデータセットを選択し、A2 copulaを使用してデータを生成し、5つの機械学習アルゴリズムを適用した。以上の結果から,A2コプラオーバーサンプリング(theta = 10)によるランダムフォレストが最高の成績を示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:52:54 GMT)
Contrastive Mutual Information Learning: Toward Robust Representations without Positive-Pair Augmentations [0.0]
我々は,相互情報機械(MIM)を拡張した確率的フレームワークである相互情報機械(cMIM)を紹介した。 CMIMはこのギャップに対処し、MIMの生成的忠実性を維持しながら、グローバルな差別的構造を付与する。視覚および分子ベンチマークにおける実証的証拠として,cMIM がMIM やInfoNCE より優れていることを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:03:24 GMT)
Cognitive Load Limits in Large Language Models: Benchmarking Multi-Hop Reasoning [0.0]
大規模言語モデル(LLM)は孤立したタスクにおいて優れるが、認知的負荷下での推論はいまだに理解されていない。本稿では,タスク不適切な情報(コンテキスト飽和)とタスク切替による干渉が,性能を低下させる重要なメカニズムであることを示唆する,計算認知負荷の形式的理論を導入する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 21:42:07 GMT)
Closed-form $\ell_r$ norm scaling with data for overparameterized linear regression and diagonal linear networks under $\ell_p$ bias [0.0]
パラメータノルムの族をスケールするために、統一的で高確率な特徴を与える。次に、降下によって訓練された線形ネットワークについて研究する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:59:22 GMT)
Classical and quantum chaotic synchronization in coupled dissipative time crystals [0.0]
2つのコヒーレント結合型散逸時間結晶のダイナミクスについて検討する。古典的な場合と類似して、この挙動を量子カオス同期と解釈する。古典的および量子的交叉の位置は、無限スピン極限と無限時間極限の非可換性を反映して異なる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:03:58 GMT)
CONSIGN: Conformal Segmentation Informed by Spatial Groupings via Decomposition [0.0]
ほとんどの機械学習ベースのイメージセグメンテーションモデルは、各ピクセルにおける各クラスラベルの予測確率を表す画素単位の信頼スコアを生成する。コンフォーマル予測は、信頼度スコアを統計的に妥当な不確実性推定に変換するための原則化された枠組みを提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 11:09:43 GMT)
Bridging Quantum Computing and Nuclear Structure: Atomic Nuclei on a Trapped-Ion Quantum Computer [0.0]
我々は、RIKEN-Quantinuum Reimei型量子コンピュータにおける中質量原子核の正確な量子シミュレーションを報告する。 pUCCDアンサッツをハードコアボソンマッピングで実装し, 粒子数復元後選択により, 地中エネルギー推定値はノイズフリー状態ベクトルシミュレーション, 正確な対角化結果と0.1%の相対誤差で一致した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:58:36 GMT)
Beyond asymptotic reasoning: the practicalities of a quantum ground state projector based on the wall-Chebyshev expansion [0.0]
壁面関数に対するチェビシェフ級数近似に基づく地中準備のための量子アルゴリズムについて検討する。我々は、異なる量子実装のスケーリングと成功確率を分析し、数値ベンチマークを提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:01:54 GMT)
Beyond Stars: Bridging the Gap Between Ratings and Review Sentiment with LLM [0.0]
本稿では,従来の星形成システムに固有の制約に対処するために,モバイルアプリレビュー分析に先進的なアプローチを提案する。本稿では,構造化プロンプト技術により強化された大規模言語モデル(LLM)を活用するモジュラーフレームワークを提案する。本手法は,数値評価とテキスト感情の相違を定量化し,詳細な特徴レベルの洞察を抽出し,レビューのインタラクティブな探索を支援する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:39:12 GMT)
Beyond Chat: a Framework for LLMs as Human-Centered Support Systems [0.0]
大規模言語モデルは、コンパニオン、コーチ、仲介者、キュレーターとして振舞うために、トランザクションの質問に答える以上のものを動かしている。本稿では,人間中心型LLM支援システムにおける役割ベースフレームワークを提案する。透明性、パーソナライゼーション、ガードレール、プライバシによるメモリ、共感と信頼性のバランスといった、横断的な設計原則を特定します。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:33:58 GMT)
Automating Sensor Characterization with Bayesian Optimization [0.0]
本稿では,開発サイクルの試験段階を高速化することを目的とした自動センサキャリブレーション手法を提案する。本手法を低雑音CCDを用いて実証し,センサの動作を2日以内で効率よく評価・最適化できることを示した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:31:15 GMT)
Automated Machine Learning Pipeline for Training and Analysis Using Large Language Models [0.0]
データセット生成からモデル検証まで、ワークフロー全体を統一する自動機械学習パイプライン(AMLP)を導入します。 AMLPは、電子構造コードの選択、入力準備、出力変換を支援するために、大きな言語モデルエージェントを使用する。アクリジンのポリモルフィックで検証され、基礎モデルの素直な微調整により、エネルギーの1.7 meV/原子と力の7.0 meV/AAの絶対誤差が達成される。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:05:20 GMT)
Application of Audio Fingerprinting Techniques for Real-Time Scalable Speech Retrieval and Speech Clusterization [0.0]
本稿では,音声検索の専門的課題に対処するため,既存の手法を応用するための新たな知見を提供する。単一のリクエストを容易にするのではなく、バッチ処理で迅速かつ正確なオーディオ検索を実現することに注力している。本論文は,実際の音声からテキストへの変換を行なわずに,音声によるクラスタリングを支援する手法について述べる。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 12:16:54 GMT)
Amplified quantum non-demolition measurements of optical quadratures using quadratic nonlinearity [0.0]
量子非破壊測定(quantum non-demolition, QND)は、量子バックアクションを回避するための特殊な手法である。非退化光パラメトリック増幅器に基づく新しいQND計測手法を提案する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:08:59 GMT)
Affective Computing and Emotional Data: Challenges and Implications in Privacy Regulations, The AI Act, and Ethics in Large Language Models [0.0]
本稿では,感情知能の人工知能システムへの統合について検討する。コンピュータ科学、心理学、神経科学を組み合わせた学際的な研究に基づいて、感情認識を可能にする神経アーキテクチャを分析する。本論文は、医療、教育、カスタマーサービスなど、さまざまな領域にまたがる影響について考察する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 10:43:22 GMT)
Adversarial generalization of unfolding (model-based) networks [0.0]
本稿では,$l$-normの制約付き攻撃で乱れた場合の展開ネットワークの対角一般化について検討する。これは展開ネットワークの対角一般化に関する最初の理論的解析である。実世界のデータに関する一連の実験を行い、得られた理論を裏付ける結果を得た。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 13:39:51 GMT)
Adoption, usability and perceived clinical value of a UK AI clinical reference platform (iatroX): a mixed-methods formative evaluation of real-world usage and a 1,223-respondent user survey [0.0]
臨床医は、バイオメディカル文献やガイドラインからの情報過剰が増加し、エビデンスベースのケアを妨げている。 RAGをベースとした臨床リファレンスプラットフォームであるiatroXについて述べる。本報告では, 早期導入, ユーザビリティ, 臨床的価値を, 形式的実装評価から報告する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 14:03:04 GMT)
Adaptive Cybersecurity Architecture for Digital Product Ecosystems Using Agentic AI [0.0]
本研究では,動的学習と文脈認識型意思決定が可能な自律目標駆動エージェントを提案する。行動ベースライン、分散リスクスコア、フェデレーションされた脅威情報共有は重要な特徴である。このアーキテクチャは、複雑なデジタルインフラストラクチャを保護するインテリジェントでスケーラブルな青写真を提供する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 00:43:53 GMT)
A Systematic Review of Conformal Inference Procedures for Treatment Effect Estimation: Methods and Challenges [0.0]
治療効果推定のための共形予測手法について,系統的な検討を行った。この領域で現在行われている最先端の手法を同定し記述する。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 22:31:14 GMT)
A Quotient Homology Theory of Representation in Neural Networks [0.0]
各ポリヘドロンと入力多様体の交叉が凸であれば、ニューラル表現のホモロジー群は商ホモロジー群 $H_k(Phi(mathcalM)) simeq H_k(mathcalM/mathcalO_Phi)$ に同型である。線形計画法とユニオン・フィンド・アルゴリズムを用いて重なり合う分解を計算する手法を開発した。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:13:12 GMT)
A Principled Loss Function for Direct Language Model Alignment [0.0]
本稿では,RLHF最適条件から直接導出した新しい損失関数を提案する。提案した損失は,その差ではなく,基礎となる報酬によって規定される,ロジットの特定の有限値を対象としている。この固有の安定性は、報酬のハッキングを防ぎ、より効果的なアライメントをもたらす。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:08:05 GMT)
A Markovian approach to $N$-photon correlations beyond the quantum regression theorem [0.0]
周波数分解した$N$- Photon相関関数を計算するためのMarkovianフレームワークを提案する。フォノン側バンドを介して放出される光子は、モロー三重項の2次コヒーレンス特性を継承することを示す。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:51:08 GMT)
A Deep Learning Framework for Evaluating Dynamic Network Generative Models and Anomaly Detection [0.0]
本稿では,DGSP-GCN(グラフ畳み込みネットワークに基づく動的グラフ類似度予測)を提案する。グラフ畳み込みネットワークと動的グラフ信号処理技術を統合し、生成モデルを評価し、動的ネットワークの異常を検出する統一的なソリューションを提供する。 WikiMath、Chickenpox、PedalMe、MontevideoBus、MetraLaの5つの実世界のデータセットでテストされた。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 09:19:30 GMT)
"Be My Cheese?": Assessing Cultural Nuance in Multilingual LLM Translations [0.0]
このパイロットスタディでは、比喩的言語を翻訳する際に、最先端の多言語AIモデルのローカライズ能力について検討する。文化的な適切さと全体的なローカライゼーションの質 - マーケティングやeコマースといった現実世界のアプリケーションにとって重要な要素である。
論文参考訳（メタデータ） (Thu, 25 Sep 2025 20:55:36 GMT)