Fugu-MT: arxivの論文翻訳(概要)

Expanding Performance Boundaries of Open-Source Multimodal Models with Model, Data, and Test-Time Scaling [191.8]
InternVL 2.5は、InternVL 2.0上に構築された高度マルチモーダル大規模言語モデル(MLLM)シリーズである。 InternVL 2.5は、GPT-4oやClaude-3.5-Sonnetといった主要な商用モデルと競合する競争力を持つ。このモデルが、マルチモーダルAIシステムの開発と適用のための新しい標準を設定することで、オープンソースコミュニティに貢献できることを願っています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:52:41 GMT)
GUI Agents: A Survey [159.8]
グラフィカルユーザインタフェース(GUI)エージェントは、人間とコンピュータのインタラクションを自動化するためのトランスフォーメーションアプローチとして登場した。 GUIエージェントの関心の高まりと基本的な重要性により、ベンチマーク、評価指標、アーキテクチャ、トレーニングメソッドを分類する総合的な調査を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:01:59 GMT)
LiT: Delving into a Simple Linear Diffusion Transformer for Image Generation [135.6]
本稿では,事前学習した拡散変換器(DiT)を線形DiTに変換する方法について検討する。線形アテンション設計から最適化戦略まで,さまざまなソリューションを提供しています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:10:31 GMT)
Mind-the-Glitch: Visual Correspondence for Detecting Inconsistencies in Subject-Driven Generation [120.2]
本稿では,事前学習した拡散モデルのバックボーンから視覚的特徴と意味的特徴を分離するための新しいアプローチを提案する。注釈付きセマンティックと視覚対応を備えた画像ペアを構築する自動パイプラインを導入する。被験者駆動画像生成における視覚的不整合を定量化する新しい指標であるビジュアルセマンティックマッチングを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:11:55 GMT)
Think With Videos For Agentic Long-Video Understanding [117.7]
ロングビデオ理解はコンピュータビジョンにおいて難しい問題である。ビデオによる思考の原則に基づくフレームワークであるVideoExplorerを提案する。静的なコンテキストを推論する代わりに、VideoExplorerは、サブクエストを反復的に定式化し、関連するモーメントを特定し、タスク指向で時間的にスケーラブルなビデオ理解を実行する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:22:16 GMT)
MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing [117.6]
MinerU2.5は、例外的な計算効率を維持しつつ、最先端の認識精度を実現する文書解析モデルである。提案手法では,局所的なコンテンツ認識からグローバルなレイアウト解析を分離する,粗大な2段階解析戦略を採用している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:45:48 GMT)
Does Generative Retrieval Overcome the Limitations of Dense Retrieval? [117.5]
生成的検索(GR)はニューラル情報検索の新しいパラダイムとして登場した。本研究では,GRが高密度検索(DR)から学習目的と表現能力の両方において根本的に分岐するかを検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:38:01 GMT)
Geometric-Mean Policy Optimization [117.1]
グループ相対政策最適化(GRPO)は,大規模言語モデルの推論能力を大幅に向上させた。 GRPOは、不利な重要度重み付けされた報酬を持つトークンに直面すると、不安定なポリシー更新に悩まされる。本稿では,GRPOの安定性を向上させるために,トークン報酬の出力を抑えることにより,GMPO(Geometric-Mean Policy Optimization)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:33:27 GMT)
DynamicControl: Adaptive Condition Selection for Improved Text-to-Image Generation [116.5]
多様な制御信号の動的組み合わせをサポートするDynamicControlを提案する。様々な条件下での制御性,生成品質,構成性の観点から,DynamicControlは既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:04:37 GMT)
Infini-gram mini: Exact n-gram Search at the Internet Scale with FM-Index [110.9]
ペタバイトレベルのテキストコーパスを検索可能にするシステムであるinfini-gram miniを提案する。 FMインデックスデータ構造に基づいて,本システムはコーパスの44%の大きさのインデックスを生成する。ベンチマーク汚染の大規模解析において重要なユースケースが1つある。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:16:47 GMT)
Position: The Hidden Costs and Measurement Gaps of Reinforcement Learning with Verifiable Rewards [110.5]
我々は、RLVR税、評価落とし穴、データ汚染という3つの力によって利回りが過大評価されることが多いと論じている。本稿では, 精度, グラウンド, キャリブレーションを両立させる税意識訓練・評価プロトコルを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:06:25 GMT)
Reasoning to Edit: Hypothetical Instruction-Based Image Editing with Visual Reasoning [106.9]
Reason50Kは、仮説的推論画像編集のトレーニングと評価のために算出された大規模なデータセットである。 ReasonBrainは、様々なシナリオにまたがる暗黙の仮説的命令を推論し実行するために設計された、新しいフレームワークである。データセットとコードは公開されます。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:15:21 GMT)
RefAM: Attention Magnets for Zero-Shot Referral Segmentation [104.0]
本稿では,下流タスクの拡散変換器から特徴,注意点を活用できる新しい手法を提案する。重要な洞察は、停止語は注意磁石として機能するということだ。停止語を付加した背景アクティベーションを小さなクラスタに分割するアテンション再分配戦略を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:57 GMT)
RLP: Reinforcement as a Pretraining Objective [103.5]
我々は,情報駆動型強化事前訓練の目的として,強化学習のコアスピリットである探索を,事前訓練の最終段階に導くことを提案する。このトレーニングの目的は、モデルが次に何が起こるかを予測する前に、自分自身で考えることを奨励し、事前学習の早い段階で独立した思考行動を教えることである。特に、RLPは、通常のテキストにおける事前学習対象としての推論のための強化学習を再構築し、次のトーケン予測と有用な連鎖推論の出現の間のギャップを埋める。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:53:54 GMT)
DEFT: Decompositional Efficient Fine-Tuning for Text-to-Image Models [103.2]
DEFT(Decompositional Efficient Fine-Tuning)は、事前トレーニングされた重み行列を2つのコンポーネントに分解することで適応する。パーソナライズのためのDreamboothおよびDreambench Plusデータセット、オブジェクトおよびシーン適応のためのInsDetデータセット、ユニバーサル画像生成フレームワークのためのVisualClozeデータセットについて実験を行った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:01:15 GMT)
Visual Multi-Agent System: Mitigating Hallucination Snowballing via Visual Flow [99.5]
視覚言語モデル (VLM) を利用したマルチエージェントシステム (MAS) は, 難易度の高いタスクを実現するが, 新たな障害項である視覚幻覚スノーボールに悩まされる。本研究では,視覚的注意配分の低減に関して,幻覚雪球の本質に関する詳細な知見を提供する。選択した視覚的リレートークンをベースとしたビジュアルフローとエージェント間メッセージを中継する軽量なプラグアンドプレイ緩和パラダイムであるViFを提案し,このパターンを増幅するために注目位置を適用した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:43:24 GMT)
Why Reinforcement Fine-Tuning Enables MLLMs Preserve Prior Knowledge Better: A Data Perspective [98.5]
Supervised Fine-Tuning (SFT) や Reinforcement Fine-Tuning (RFT) といったポストトレーニングアルゴリズムは、マルチモーダルな大規模言語モデルを下流タスクに適応するために広く使われている。タスク適応には有効であるが、以前の知識に対する影響はいまだ不明である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:33:22 GMT)
MesaTask: Towards Task-Driven Tabletop Scene Generation via 3D Spatial Reasoning [98.0]
操作タスクを実行するロボットの能力は、トレーニングのためのタスク関連テーブルトップシーンの可用性を必要とする。これらのシーンを作成する伝統的な方法は、時間を要する手動レイアウト設計や純粋にランダムなレイアウトに依存している。我々は、この推論チェーンを利用したLCMベースのフレームワークであるMesaTaskを、DPOアルゴリズムにより拡張し、物理的に可算なテーブルトップシーンを生成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:46:00 GMT)
vCache: Verified Semantic Prompt Caching [95.2]
本稿では,ユーザ定義エラー率保証を備えた最初の検証済みセマンティックキャッシュであるvCacheを提案する。オンライン学習アルゴリズムを使用して、キャッシュされたプロンプト毎に最適な閾値を推定し、追加のトレーニングなしで信頼性の高いキャッシュ応答を可能にする。我々の実験によると、vCacheは特定のエラー境界を一貫して満たし、最先端の静的な閾値と微調整された埋め込みベースラインより優れています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:40:58 GMT)
Think Socially via Cognitive Reasoning [94.6]
本稿では,人間の社会的認知をモデルとした認知推論について紹介する。 CogFlowは、この機能をLLMに組み込む完全なフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:27:29 GMT)
Process Reinforcement through Implicit Rewards [94.1]
複雑なプロセス報酬は、大きな言語モデル(LLM)の推論時間スケーリングにおいて、スパースな結果レベルの報酬よりも効果的な選択肢であることが証明されている。ディエンス報酬は、その微粒な報酬が結果報酬の固有の問題に対処する可能性があるため、LLMの強化学習(RL)に魅力的な選択を与える。これは主に、高品質なプロセスラベルの収集が違法に高価であるオンラインのトレーニングプロセス報酬モデル(PRM)の課題に起因する可能性がある。提案するPRIMEは,ポリシロールアウトと結果ラベルのみを用いて,インプットプロセス報酬によるオンラインPRM更新を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:25:31 GMT)
Variational Reasoning for Language Models [93.1]
本稿では,思考トレースを潜在変数として扱う言語モデルのための変分推論フレームワークを提案する。 GRPOを含むリジェクションサンプリングとバイナリリワードRLは局所的なフォワードKLの目的と解釈できることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:58:10 GMT)
Learning Human-Perceived Fakeness in AI-Generated Videos via Multimodal LLMs [92.0]
DeeptraceRewardは、人間が認識した偽のトレースをビデオ生成報酬に注釈付けするベンチマークである。データセットは、高品質な3.3ビデオにまたがる4.3Kの詳細なアノテーションで構成されている。これらのアノテーションを9つの主要なディープフェイクトレースカテゴリに集約し、人間が動画をAI生成であると識別する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:54 GMT)
CapRL: Stimulating Dense Image Caption Capabilities via Reinforcement Learning [90.2]
本稿では,キャプションの品質を再定義するトレーニングフレームワークであるCaptioning Reinforcement Learning (CapRL)を紹介する。主観的画像キャプションタスクにRLVRを適用した最初の研究として、CapRLは複数の設定を大幅に強化することを示した。 CapRLはQwen2.5-VL-72Bに匹敵する性能を達成し、ベースラインのマージンは平均8.4%を超えた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:55 GMT)
Calibrated Multi-Preference Optimization for Aligning Diffusion Models [90.2]
Calibrated Preference Optimization (CaPO) は、テキスト・ツー・イメージ(T2I)拡散モデルを調整する新しい手法である。 CaPOは、人間の注釈のない複数の報酬モデルからの一般的な好みを取り入れている。実験結果から, CaPOは従来法よりも常に優れていたことが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:22:26 GMT)
Prompting is not Enough: Exploring Knowledge Integration and Controllable Generation on Large Language Models [89.7]
オープンドメイン質問応答(OpenQA)は自然言語処理(NLP)の基盤である。我々は,知識統合と制御可能生成を探求し,OpenQAの性能向上を目的としたGenKIという新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:49:19 GMT)
Language Models Can Learn from Verbal Feedback Without Scalar Rewards [88.8]
本稿では,言語フィードバックを条件付け信号として扱うことを提案する。テキスト・画像生成における言語先行性に着想を得て,フィードバック条件ポリシーを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:58:27 GMT)
Thinking Augmented Pre-training [88.0]
拡張事前学習は、自動生成された思考軌跡でテキストを増強する普遍的な方法論である。本稿では,既存のテキストデータを思考トラジェクトリで拡張することにより,大規模言語モデル(LLM)トレーニングのデータ効率を向上させるための,シンプルでスケーラブルなアプローチを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:29:15 GMT)
Multidimensional Uncertainty Quantification via Optimal Transport [88.0]
相補的なUQ測度をベクトルに積み重ねることで,不確実性定量化(UQ)の多次元的考察を行う。 VecUQ-OTは、個々の測定が失敗しても高い効率を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:09:03 GMT)
Demystifying Domain-adaptive Post-training for Financial LLMs [87.3]
FINDAPは、大規模言語モデルのドメイン適応後トレーニングに関する体系的できめ細かな研究である。このアプローチは、FinCap、FinRec、FinTrain、FinEvalの4つの重要なコンポーネントで構成されています。結果として得られるモデルであるLlama-Finは、幅広い財務タスクにわたる最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:45:18 GMT)
UIP2P: Unsupervised Instruction-based Image Editing via Edit Reversibility Constraint [87.2]
本研究では,教師なし指導に基づく画像編集手法を提案する。本稿では,編集可逆性制約 (ERC) と呼ばれる新しい編集機構を導入することで,これらの課題に対処する。これにより、地道に編集されたイメージの必要性を回避し、実際のイメージキャプチャペアまたはイメージキャプチャインストラクショントリプルからなるデータセットで、初めてトレーニングをアンロックすることが可能になります。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:56 GMT)
Learning to Summarize by Learning to Quiz: Adversarial Agentic Collaboration for Long Document Summarization [87.0]
SummQは長期文書要約のための新しい逆多重エージェントフレームワークである。提案手法では,包括的な要約を作成し,評価するために協調作業を行う要約ジェネレータとレビュアーを用いる。広範に使用されている3つの文書要約ベンチマーク上でSummQを評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:37:45 GMT)
HBO: Hierarchical Balancing Optimization for Fine-Tuning Large Language Models [87.0]
多様なデータセット上の微調整された大きな言語モデルは、データの不均衡と不均一性による課題を引き起こす。本稿では,LLMがデータアロケーションを自律的に調整できる新しい手法である階層的バランシング最適化(HBO)を紹介する。我々は,多言語およびマルチタスク設定において,9つのタスクにまたがる3つのLLMバックボーン上でHBOを評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:33:17 GMT)
ExpertSteer: Intervening in LLMs through Expert Knowledge [87.0]
アクティベーションステアリングは、大規模言語モデルの生成プロセスを制御するための有望な方法を提供する。本稿では、任意の専門的モデルを用いてステアリングベクトルを生成する新しいアプローチであるExpertSteerを提案する。 3つのLSMを4つの異なる領域にわたる15の人気のあるベンチマークで包括的な実験を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:35:13 GMT)
Demystifying Multilingual Chain-of-Thought in Process Reward Modeling [87.0]
プロセス報酬モデル(PRM)を多言語設定に拡張するという課題に対処する。我々は、7つの言語にまたがるデータセット上で多言語PRMを訓練し、それを英語から翻訳する。本結果は,学習言語数と英語データ量の両方に対する多言語PRMの感度を強調した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:20:20 GMT)
DVD-Quant: Data-free Video Diffusion Transformers Quantization [86.9]
DVD-Quantは、ビデオDiTのための新しいデータフリー量子化フレームワークである。先進的なDiTモデルの完全精度ベースラインよりも約2$times$のスピードアップを実現している。 DVD-Quantは、ビデオ品質を損なうことなくW4A4 PTQ for Video DiTsを有効にする最初の製品である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:59:20 GMT)
RAPID^3: Tri-Level Reinforced Acceleration Policies for Diffusion Transformer [86.6]
ディフュージョントランスフォーマー(DiT)は、視覚発生時に優れるが、遅いサンプリングによって妨げられる。本稿では,RAPID3: Tri-Level Reinforced Acceleration Policies for Diffusion Transformersを紹介する。ベースジェネレータの更新をゼロにするイメージワイドアクセラレーションを提供する。競合する生成品質でサンプリングを3倍近く高速化する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:20:52 GMT)
Sharing Matters: Analysing Neurons Across Languages and Tasks in LLMs [85.0]
大規模言語モデル(LLM)は自然言語処理(NLP)の分野に革命をもたらした。多言語環境でのLLMの内部動作を探究する研究はほとんどない。我々は、異なる言語にまたがる特定の入力に対する応答に基づいて、ニューロンを4つの異なるカテゴリに分類する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:01:36 GMT)
SPARK: Synergistic Policy And Reward Co-Evolving Framework [84.2]
我々は、RLVR上に構築された効率的でオン・ポリティクス、安定した手法であるSPARK(Synergistic Policy and Reward Co-Evolving Framework)を紹介する。ロールアウトと正確性データを捨てる代わりに、SPARKはこの貴重な情報をリサイクルし、生成的報酬モデルとしてモデル自体をトレーニングする。 SPARK は複数の LLM モデルと LVLM モデル,および複数の推論,報酬モデル,一般ベンチマークにおいて,大幅な性能向上を実現していることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:50:12 GMT)
Fine-tuning Done Right in Model Editing [83.8]
大規模な言語モデルを適応するための基礎的な手法であるファインチューニングは、長い間モデル編集には有効ではないと考えられてきた。ミニバッチ最適化により、標準的な幅優先パイプライン(エポックベース)に微調整を復元する。我々は、復元された微調整フレームワーク上に構築された、シンプルで効果的なローカライズド編集手法であるLocFT-BFを導出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:53:13 GMT)
WoW: Towards a World omniscient World model Through Embodied Interaction [83.4]
世界モデルの正当性的な物理的直観は、現実世界との広範囲で因果的に豊かな相互作用に基礎を置いていなければならない。このWoWは、200万のロボットインタラクショントラジェクトリに基づいてトレーニングされた、ジェネレーティブな世界モデルである。 WoWBenchは、ビデオの物理的一貫性と因果推論に焦点を当てた新しいベンチマークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:07 GMT)
Re-Densification Meets Cross-Scale Propagation: Real-Time Neural Compression of LiDAR Point Clouds [83.4]
LiDARポイントクラウドは、様々なアプリケーションに基本的だが、高精度スキャンは、かなりのストレージと送信オーバーヘッドを発生させる。既存の手法では、非順序の点を階層的なオクツリーやボクセル構造に変換して、密度から疎い予測符号化を行うのが一般的である。筆者らのフレームワークは2つの軽量モジュールから構成されている。まず、Geometry Re-Densification Moduleがエンコードされたスパース幾何を再認識し、より密なスケールで特徴を抽出し、予測符号化のための特徴を再分離する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:40:04 GMT)
FORCE: Transferable Visual Jailbreaking Attacks via Feature Over-Reliance CorrEction [82.7]
視覚的ジェイルブレイク攻撃は、洗練されたテキスト攻撃よりも簡単にオープンソースのMLLMを操作することができる。これらの攻撃は、非常に限られたクロスモデル転送可能性を示し、クローズドソースMLLMの脆弱性を確実に特定することができない。本稿では,FORCE(Feature Over-Reliance CorrEction)手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:08:26 GMT)
PSRT: Accelerating LRM-based Guard Models via Prefilled Safe Reasoning Traces [81.7]
提案手法では,PSRT をモデル推論プロセスから Prefilled Safe Reasoning Trace に置き換える手法を紹介する。 PSRTは構築されたデータセットから“仮想トークンの安全な推論”をプリフィルし、継続的な埋め込みについて学習する。我々は,PSRTを7つのモデル,13のデータセット,8つのジェイルブレイク法で評価した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:14:31 GMT)
KV Cache Steering for Controlling Frozen LLMs [80.5]
キャッシュステアリングは、言語モデルの暗黙的なステアリングのための軽量な方法である。キャッシュステアリングを応用して、小さな言語モデルにおける連鎖推論を誘導する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:54 GMT)
Hierarchical Representation Matching for CLIP-based Class-Incremental Learning [80.2]
クラスインクリメンタルラーニング(Class-Incremental Learning, CIL)は、進化するデータストリームに継続的に適応可能なモデルを提供することを目的とする。事前訓練された視覚言語モデル(例えばCLIP)の最近の進歩は、このタスクの強力な基盤を提供する。本稿では,CLIPベースのCILのためのHiErarchical Representation MAtchiNg(HERMAN)を紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:51 GMT)
R-Stitch: Dynamic Trajectory Stitching for Efficient Reasoning [80.1]
CoT(Chain-of- Thought)は、大規模言語モデルの問題解決能力を高める。 CoTは長い自己回帰軌道のためにかなりの推論コストを発生させる。トレーニング不要なハイブリッドデコーディングフレームワークであるR-Stitchを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:55:36 GMT)
Dynamic Novel View Synthesis in High Dynamic Range [78.7]
現在の手法は主に静的なシーンに焦点を当てており、すべてのシーン要素が静止していて生きていないことを暗黙的に仮定している。 HDR-4DGSは,革新的な動的トーンマッピングモジュールを備えたガウススプラッティング方式のアーキテクチャである。実験により、HDR-4DGSは、定量的性能と視覚的忠実度の両方において、既存の最先端手法を超越していることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:29:22 GMT)
Local models and Bell inequalities for the minimal triangle network [78.5]
非局所的な相関は、量子情報や量子基底における驚くべき現象を引き起こす。最も単純なシナリオの一つとして、最小三角形ネットワークにおけるパーティの置換の下での分布不変性について検討する。連立結果を持つ三角形ネットワークにおける古典量子ギャップの存在についての知見を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:01:22 GMT)
Latent Veracity Inference for Identifying Errors in Stepwise Reasoning [78.3]
本稿では、精度割当てに対する離散探索アルゴリズムであるVeracity Search(VS)を紹介する。その他の方法では、後続の精度値よりも後続の分布において難解な推論を行う。 VSを一般化し、新しいコンテキストで正確なゼロショットの精度推論を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:18:43 GMT)
Drag4D: Align Your Motion with Text-Driven 3D Scene Generation [77.8]
Drag4Dはインタラクティブなフレームワークで、テキスト駆動の3Dシーン生成にオブジェクトの動き制御を統合する。このフレームワークにより、ユーザーは単一の画像から生成された3Dオブジェクトに対して3Dトラジェクトリを定義し、それらを高品質な3D背景にシームレスに統合することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:23:45 GMT)
DS-STAR: Data Science Agent via Iterative Planning and Verification [76.9]
DS-STARは,様々なデータフォーマットからコンテキストを自動探索し抽出する新しいデータサイエンスエージェントである。具体的には,(1)非構造化型を含む多種多様なデータ形式からコンテキストを自動的に探索・抽出するデータファイル解析モジュール,(2)LLMベースの審査員が各段階で解析計画の十分性を評価する検証ステップ,(3)単純で実行可能な計画から始まる逐次計画機構,(3)DS-STARの満足度が検証されるまでそのフィードバックに基づいて反復的に洗練する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:38:12 GMT)
WeightLoRA: Keep Only Necessary Adapters [76.3]
低ランク適応(texttLoRA$)は、指定されたレイヤにトレーニング可能なアダプタを追加する。我々は、最も重要な$textttLoRA$ヘッダの適応的な選択によってこの問題を克服する新しい方法である$textttWeightLoRA$を提案する。我々は、一連の競合ベンチマークとDeBERTa、BART、Llamaモデルの実験を行い、我々の手法を異なる適応的アプローチと比較した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:09:35 GMT)
MILR: Improving Multimodal Image Generation via Test-Time Latent Reasoning [75.8]
我々は,画像とテキストを結合的に関連づけるテストタイム手法MILRを提案する。統合マルチモーダル理解・生成フレームワーク内でMILRをインスタンス化する。我々は、GenEval、T2I-CompBench、WISE上でMILRを評価し、すべてのベンチマークで最先端の結果を得る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:06:10 GMT)
JointDiff: Bridging Continuous and Discrete in Multi-Agent Trajectory Generation [75.6]
生成モデルは、しばしば連続したデータと離散的なイベントを別々のプロセスとして扱う。このギャップを埋めるために、連続時間データと同期離散イベントを同時に生成してこれらの2つのプロセス間の相互作用を設計した新しい拡散フレームワークであるJointDiffを導入する。 JointDiffは最先端のパフォーマンスを実現し、インタラクティブシステムのための現実的で制御可能なモデルを構築するために、ジョイントモデリングが不可欠であることを実証している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:04:00 GMT)
FlashEdit: Decoupling Speed, Structure, and Semantics for Precise Image Editing [75.3]
FlashEditは、高忠実でリアルタイムな画像編集を可能にするように設計された新しいフレームワークである。その効率性は,(1)コストのかかる反復プロセスをバイパスするワンステップ・インバージョン・アンド・編集(OSIE)パイプライン,(2)編集領域内でのみ特徴を選択的に修正することで背景保存を保証するバックグラウンドシールド(BG-Shield)技術,(3)背景への意味的漏洩を抑えることで正確な局所的編集を保証するスカラー化空間横断認識(SSCA)機構の3つの重要なイノベーションに由来する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:59:30 GMT)
Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [74.4]
本稿では,行動学習から原理的アライメントを分離する2段階の軌道計画フレームワークを提案する。 Plan-R1は計画の安全性と実現可能性を大幅に改善し、最先端の性能を達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:19:49 GMT)
Perception-Consistency Multimodal Large Language Models Reasoning via Caption-Regularized Policy Optimization [72.3]
マルチモーダルな言語モデルは、視覚知覚と象徴的推論を統合するタスクに優れています。 CapPO は,(1) 原画像上の条件付き応答とキャプション上の条件付き応答のばらつきを最小限に抑えるキャプションベース整合性正規化,(2) KL 重み付き優位性推定スキームを適応的に拡張して知覚整合性トラジェクトリを強化するキャプションベース整合性正規化という2つの重要なメカニズムを統合した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:32:26 GMT)
GLip: A Global-Local Integrated Progressive Framework for Robust Visual Speech Recognition [72.3]
我々は、ロバストな視覚音声認識(VSR)のために設計されたグローバルローカル統合プログレッシブフレームワークGLipを提案する。 GLipは、グローバルな視覚的特徴とローカルな視覚的特徴の両方を、容易にアクセス可能な音声視覚データを用いて対応する音声音声単位に整合させることを学ぶ。第2段階では、ローカル機能を関連するグローバルコンテキストと動的に統合するコンテキスト拡張モジュール(CEM)を導入します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:09:42 GMT)
Active Attacks: Red-teaming LLMs via Adaptive Environments [71.6]
大規模言語モデル(LLM)に対する多様な攻撃プロンプトを生成するという課題に対処する。我々は、犠牲者が進化するにつれて攻撃に適応する新しいRLベースのレッドチームアルゴリズムであるtextitActive Attacksを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:27:00 GMT)
The Imitation Game: Turing Machine Imitator is Length Generalizable Reasoner [71.4]
本稿では,大規模言語モデルの長さ一般化能力を向上させるため,Turing Machine Imitation Learning (TAIL)を提案する。 TAILはコンピュータプログラムによってチューリングマシンの実行プロセスを模倣するチェーン・オブ・思想(CoT)データを合成する。ベルとホイッスルがなければ、TAILは様々なタスクにおけるQwen2.5-7Bの性能と同様に、長さの一般化能力を大幅に改善する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:58:32 GMT)
Towards an AI Musician: Synthesizing Sheet Music Problems for Musical Reasoning [69.8]
本稿では,ビートやインターバルをプログラム関数として扱うような,コア音楽理論のルールを扱う新しいアプローチを提案する。このアプローチは、テキストと視覚の両方で検証可能な楽譜の質問を生成する。 SSMR-Benchの評価結果は,楽譜の解釈における重要な役割を浮き彫りにした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:37:24 GMT)
VideoScore2: Think before You Score in Generative Video Evaluation [69.4]
VideoScore2は、視覚的品質、テキスト・ツー・ビデオのアライメント、物理的/常識的一貫性を明確に評価する多次元、解釈可能、そして人間によるアライメントフレームワークである。我々のモデルは、27,168人の注釈付きビデオを含む大規模なデータセットVideoFeedback2で訓練されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:09:03 GMT)
DOTA: Distributional Test-Time Adaptation of Vision-Language Models [69.4]
トレーニングデータとテストデータの間に大きな分散ギャップが存在する場合、視覚言語の基礎モデルは信頼できない。本稿では,DOTA(DistributiOnal Test-time Adaptation)を提案する。この分散中心のアプローチは、モデルが継続的に学習し、デプロイメント環境に適応することを可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:17:15 GMT)
Mitigating Hallucination Through Theory-Consistent Symmetric Multimodal Preference Optimization [69.1]
マルチモーダル大言語モデル(MLLM)における幻覚を緩和するための効果的なアプローチとして、直接選好最適化(DPO)が登場している。我々は、直接選好監督(応答対)を伴う対称選好学習を行うシンメトリ・マルチモーダル選好最適化(SymMPO)を提案する。従来の順序的嗜好学習に加えて、SymMPOは、左右の選好ペア間の選好ギャップを定量的に調節する、選好マージン整合性損失を導入している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:18:35 GMT)
UniErase: Towards Balanced and Precise Unlearning in Language Models [69.0]
大規模言語モデル(LLM)は、古い情報問題に対処するために反復的な更新を必要とする。 UniEraseは、知識の未学習と能力保持の間の精度とバランスの取れたパフォーマンスを示す、新しいアンラーニングフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:52:07 GMT)
CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [69.0]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。本稿では,RGB,マルチスペクトル,ハイパースペクトル画像を用いたカメラ非依存表現学習モデルCARLを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:56:26 GMT)
Scalable In-Context Q-Learning [69.0]
textbfScalable textbfIn-textbfContext textbfQ-textbfLearning (textbfSICQL)を提案する。 textbfSICQLは動的プログラミングとワールドモデリングを利用して、ICRLを効率的な報酬とタスクの一般化に向けて制御する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:48:02 GMT)
Front-Loading Reasoning: The Synergy between Pretraining and Post-Training Data [68.9]
LLMの推論能力を高めるための主流パラダイムは、高品質な推論集約的なデータによるポストトレーニングを中心に展開される。新興文献では、学習中期にも推論データが組み込まれていることが示唆されているが、事前学習におけるそうしたデータの役割はいまだ不明である。我々は,学習の異なる段階に導入した場合のLLM性能に,スケール,多様性,品質がどのような影響を及ぼすかについて,最初の系統的研究を行った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:08:51 GMT)
LongLive: Real-time Interactive Long Video Generation [68.5]
LongLiveはリアルタイムおよびインタラクティブなロングビデオ生成のためのフレームレベルの自動回帰フレームワークである。 LongLiveは1つのNVIDIA H100上で20.7 FPSを持続し、短いビデオと長いビデオの両方でVBenchで強力なパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:48:24 GMT)
Structured Sparse Transition Matrices to Enable State Tracking in State-Space Models [68.3]
状態空間モデル(SSM)における遷移行列の構造的スパースパラメトリゼーションを提案する。我々の方法PD-SSMは、遷移行列をカラム1ホット行列(P$)と複素数値対角行列(D$)の積としてパラメータ化する。このモデルは、様々なFSA状態追跡タスクにおいて、現代のSSMの多種多様なバリエーションを著しく上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:46:30 GMT)
RoboView-Bias: Benchmarking Visual Bias in Embodied Agents for Robotic Manipulation [67.4]
ロボット操作における視覚バイアスの定量化を目的とした,最初のベンチマークであるRoboView-Biasを提案する。我々は、個々の視覚的要因とその相互作用によって引き起こされるバイアスの堅牢な測定を可能にする2,127のタスクインスタンスを作成します。本研究は,視覚バイアスの系統的解析が,安全で信頼性の高い汎用的なエンボディエージェントの開発に必須であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:53:25 GMT)
Shadow-FT: Tuning Instruct Model via Training on Paired Base Model [67.2]
大規模言語モデル(LLM)は、様々なタスクのさらなる微調整の恩恵を一貫して受けている。本稿では,対応するベースモデルを活用してインストラクタモデルをチューニングするための新しいシャドウ-FTフレームワークを提案する。提案するShadow-FTは,追加パラメータを導入せず,実装が容易で,性能が大幅に向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:43:47 GMT)
On the Within-class Variation Issue in Alzheimer's Disease Detection [66.7]
Alzheimer's Disease (AD) 検出では、ADと非ADの個人を区別するために、機械学習の分類モデルを使用している。そこで本研究では,サンプルスコア推定器を用いて,認知的スコアと整合した標本特異的なソフトスコアを生成できることを確認した。ソフトターゲット蒸留(SoTD)とインスタンスレベルの再分散(InRe)の2つの簡易かつ効果的な方法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:56:49 GMT)
CapSpeech: Enabling Downstream Applications in Style-Captioned Text-to-Speech [66.3]
CapTTS関連の一連のタスクのための新しいベンチマークであるCapSpeechを紹介する。 CapSpeechは、1000万以上の機械アノテーション付きオーディオキャプチャーペアと、約0.36万の人間アノテーション付きオーディオキャプチャーペアで構成されている。 CapSpeech上で自己回帰モデルと非自己回帰モデルの両方を用いて包括的実験を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:07:51 GMT)
GLEAM: Learning to Match and Explain in Cross-View Geo-Localization [66.1]
CVGL(Cross-View Geo-Localization)は、同じ地理的位置の異なる視点から撮影された画像間の対応を識別することに焦点を当てている。 GLEAM-Cは、UAV画像、ストリートマップ、パノラマ画像、地上写真を含む複数のビューとモダリティを衛星画像のみに合わせる基本CVGLモデルである。従来のCVGL手法では解釈可能性の欠如に対処するため,クロスビュー対応予測と説明可能な推論を組み合わせたGLEAM-Xを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:44:36 GMT)
Omni-Thinker: Scaling Multi-Task RL in LLMs with Hybrid Reward and Task Scheduling [66.1]
我々はOmni-Thinkerについて紹介する。Omni-Thinkerは多種多様なタスクにわたって大きな言語モデルをスケールする統合強化学習フレームワークである。我々のスケジューラは,BWTに基づいてタスクを順序付けし,マルチタスク性能を向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:12:02 GMT)
Dendritic Resonate-and-Fire Neuron for Effective and Efficient Long Sequence Modeling [66.1]
樹状共振器(RF)ニューロンは入力信号から効率的に周波数を抽出し、スパイク列車に符号化することができる。 RFニューロンは、複雑なタスクにおけるエネルギー効率とトレーニング速度のトレードオフとして、有効なメモリ容量が限られている。本稿では,複数の共振器とソマアーキテクチャを明示的に組み込んだDdendritic Resonate-and-Fireモデルを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:41:31 GMT)
Relative Entropy Pathwise Policy Optimization [66.0]
そこで本稿では,Q値モデルをオンライントラジェクトリから純粋に訓練するオンラインアルゴリズムを提案する。安定トレーニングのための制約付き更新と探索のためのポリシを組み合わせる方法を示し、価値関数学習を安定化させる重要なアーキテクチャコンポーネントを評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:28:37 GMT)
Review of Hallucination Understanding in Large Language and Vision Models [65.3]
本稿では,多様なアプリケーションにまたがる画像とテキストの幻覚を特徴付けるフレームワークを提案する。我々の調査によると、幻覚はデータ分布や遺伝バイアスの予測可能なパターンから生じることが多い。この調査は、現実世界の生成AIシステムにおける幻覚に対するより堅牢で効果的なソリューションを開発する基盤を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:23:08 GMT)
High-Quality Sound Separation Across Diverse Categories via Visually-Guided Generative Modeling [65.0]
DAVIS(Diffusion-based Audio-VIsual separation framework)を提案する。本フレームワークは、混合音声入力と関連する視覚情報に基づいて、ノイズ分布から直接、所望の分離音スペクトルを合成することによって機能する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:46:00 GMT)
A conversion theorem and minimax optimality for continuum contextual bandits [65.0]
本研究では,学習者が側情報ベクトルを逐次受信し,凸集合内の行動を選択する,文脈連続帯域幅問題について検討する。目標は、受信したコンテキストのすべての基盤関数を最小化することです。サブ線形の静的な後悔を達成するアルゴリズムを拡張して、サブ線形の文脈的後悔を実現することができることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:09:09 GMT)
MDAR: A Multi-scene Dynamic Audio Reasoning Benchmark [64.9]
本稿では,複雑なマルチシーン,動的に進化する音声推論タスクのモデルを評価するためのベンチマークMDARを紹介する。 MDARは、様々なオーディオクリップにリンクされた3000の慎重にキュレートされた質問応答ペアから構成される。 MDAR上で26の最先端オーディオ言語モデルをベンチマークし、それらが複雑な推論タスクに制限があることを観察する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:12:46 GMT)
Taming Flow-based I2V Models for Creative Video Editing [64.7]
ビデオ編集は、ユーザーの意図に応じてビデオを編集することを目的としているが、まだまだ課題だ。既存の画像条件付きビデオ編集手法の多くは、モデル固有の設計の逆変換を必要とするか、あるいは広範囲の最適化を必要とする。 Inversion-Free 方式である IF-V2V を提案し,ビデオ編集のためのオフザシェルフフローマッチングベースの I2V モデルを,計算オーバーヘッドの大きいものに適応させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:57:04 GMT)
FORGE: Forming Semantic Identifiers for Generative Retrieval in Industrial Datasets [64.5]
FORGEは、産業データセットを使ったジェネレーティブrEtrievalにおけるFOrmingセマンティック識別のベンチマークである。現実世界のアプリケーションでは、オンラインコンバージェンスを半減するオフライン事前トレーニングスキーマが導入されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:53:31 GMT)
Effective Policy Learning for Multi-Agent Online Coordination Beyond Submodular Objectives [64.2]
マルチエージェントオンライン協調問題に対する2つのポリシー学習アルゴリズムを提案する。 1つめの textttMA-SPL は MA-OC 問題に対して最適な$(fracce)$-approximation を達成することができる。第2のオンラインアルゴリズムである textttMA-MPL は同じ近似比を同時に維持できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:16:34 GMT)
QoNext: Towards Next-generation QoE for Foundation Models [63.8]
ファウンデーションモデルの既存の評価は、本当に重要なこと、つまりインタラクション中のユーザの経験を捉えるのに失敗します。基礎モデルの評価にQuality of Experienceの原則を適用する最初のフレームワークであるQoNextを紹介します。我々はQoE指向のデータベースを構築し、測定可能なシステムパラメータから知覚されたユーザエクスペリエンスを推定する予測モデルを訓練する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:26:52 GMT)
StableDub: Taming Diffusion Prior for Generalized and Efficient Visual Dubbing [63.7]
視覚的ダビングタスクは、運転音声と同期した口の動きを生成することを目的としている。音声のみの運転パラダイムは、話者固有の唇習慣を不十分に捉えている。 Blind-inpaintingアプローチは、障害を処理する際に視覚的なアーティファクトを生成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:23:31 GMT)
Universal Inverse Distillation for Matching Models with Real-Data Supervision (No GANs) [63.7]
提案するRealUIDは,GANを使わずに実データを蒸留プロセスにシームレスに組み込む,全てのマッチングモデルのための汎用蒸留フレームワークである。我々のRealUIDアプローチは、フローマッチングと拡散モデルに対する以前の蒸留方法をカバーする単純な理論基盤を提供し、ブリッジマッチングや補間といった修正にも拡張されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:12:02 GMT)
UltraHorizon: Benchmarking Agent Capabilities in Ultra Long-Horizon Scenarios [63.7]
textbfUltraHorizonは、複雑な現実世界の課題に不可欠な基礎的能力を測定する新しいベンチマークである。エージェントは、隠されたルールを反復的に発見しなければならない、長期にわたる発見タスクで設計されている。実験の結果, LLM-agents はこれらの設定において常に不利な成績を示し, ヒトは高いスコアを得ることができた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:04:00 GMT)
Text Adversarial Attacks with Dynamic Outputs [63.3]
テキスト逆攻撃法は典型的には、固定数の出力ラベルと予め定義されたラベル空間を持つ静的シナリオのために設計される。本稿では,クラスタリングに基づく代理モデルトレーニング手法を用いたテキスト動的出力攻撃(TDOA)手法を提案する。テキスト毎の単一のクエリで、TDOAは最大攻撃成功率は50.81%に達する。我々は TDOA を生成環境に拡張し,0.64 RDBLEU と 0.62 RDchrF の先行結果を上回った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:21:46 GMT)
LEO-VL: Efficient Scene Representation for Scalable 3D Vision-Language Learning [63.2]
主なボトルネックは、現在のシーン表現がパフォーマンスと効率のバランスをとるのに苦労していることです。本稿では,トークンのオーバーヘッドを大幅に低減し,認識能力の強い,効率的なシーン表現であるコンデンス機能グリッド(CFG)を提案する。実世界の4つの屋内ドメインと、キャプションや対話といった5つのタスクにまたがる700k3D-VLデータに基づいて訓練された3D VLMであるLEO-VLを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:16:53 GMT)
Unlocking the Essence of Beauty: Advanced Aesthetic Reasoning with Relative-Absolute Policy Optimization [63.2]
強化学習(RL)を用いた包括的審美的推論フレームワークAes-R1を提案する。 Aes-R1はパイプライン、AesCoTを統合し、高品質なチェーン・オブ・プリーティングデータの構築とフィルタリングを行う。実験により、Aes-R1は背骨の平均PLCC/SRCCを47.9%/34.8%改善することが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:55:00 GMT)
KaLM-Embedding-V2: Superior Training Techniques and Data Inspire A Versatile Embedding Model [63.1]
KaLM-Embedding-V2は、汎用的でコンパクトな埋め込みモデルである。 0.5Bのコンパクトなサイズでモデルを実装し,固定長埋め込みを実現する。トレーニングデータでは, プレトレーニング用20種, 微調整用100種, コントラスト蒸留用100種をキュレートする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:08:11 GMT)
No More Manual Guides: Automatic and Scalable Generation of High-Quality Excel Tutorials [63.1]
既存のチュートリアルは、専門家が手作業で作成し、ソフトウェアリリース毎に頻繁な更新が必要で、相当なコストがかかる。自然言語タスク記述から直接Excelチュートリアルを自動生成する最初のフレームワークを提案する。我々のフレームワークは、最先端のベースラインよりもタスク実行の成功率を8.5%向上させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:21:39 GMT)
ResT: Reshaping Token-Level Policy Gradients for Tool-Use Large Language Models [62.8]
大規模言語モデル(LLM)は受動的生成を超越し、外部ツールを呼び出すことで目標指向エージェントとして機能する。 textbfReshaped textbfToken-level policy gradients (textbfResT) for tool-use task。 textbfResTは最先端の結果を達成し、以前のメソッドを最大8.76%$で上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:38:27 GMT)
CoFFT: Chain of Foresight-Focus Thought for Visual Language Models [61.3]
フォレスト・フォーカス思考の連鎖(英語: Chain of Foresight-Focus Thought, CoFFT)は、人間の視覚的認知をエミュレートすることによって視覚的推論を強化する訓練のないアプローチである。これらの段階は反復的に機能し、推論が視覚的焦点を導き、視覚的焦点がその後の推論を知らせる相互依存サイクルを生成する。 Qwen2.5-VL、InternVL-2.5、Llava-Nextを使った複数のベンチマークでの実証結果では、3.1-5.8%が一貫したパフォーマンス向上を示し、計算オーバーヘッドは増大した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:46:30 GMT)
Backdoor Attribution: Elucidating and Controlling Backdoor in Language Models [61.3]
微調整された大規模言語モデル(LLM)は、データ中毒によるバックドア攻撃に対して脆弱である。 LLMの安全性の解釈可能性に関するこれまでの研究は、アライメント、ジェイルブレイク、幻覚に焦点を当てる傾向にあるが、バックドア機構を見落としている。本稿では,3部構成の因果解析フレームワークであるBackdoor Attribution (BkdAttr) によるLCMバックドアの解釈機構について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:45:25 GMT)
ControlEvents: Controllable Synthesis of Event Camera Datawith Foundational Prior from Image Diffusion Models [61.2]
本稿では,多様な制御信号によって誘導される高品質なイベントデータを合成するために,拡散に基づく生成モデルを提案する。視覚認識, 2次元骨格推定, 3次元身体ポーズ推定のためのイベントデータを合成することで, 本手法の有効性を実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:22:07 GMT)
PartCo: Part-Level Correspondence Priors Enhance Category Discovery [60.4]
Generalized Category Discovery (GCD)は、ラベルなしデータ内の既知のカテゴリと新しいカテゴリの両方を識別することを目的としている。 PartCoは、部分レベルの視覚的特徴対応を取り入れてカテゴリ発見を強化する新しいフレームワークである。複数のベンチマークデータセットに対する実験により、PartCoは現在のGCDアプローチの性能を大幅に改善することが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:16 GMT)
MTRec: Learning to Align with User Preferences via Mental Reward Models [60.3]
我々は、実際のユーザの好みに合わせてデザインされたシーケンシャルなレコメンデーションフレームワークであるMTRecを提案する。ユーザの満足度を定量化するためのメンタル報酬モデルを導入し,それを学習するための分散逆強化学習手法を提案する。実験により、MTRecは様々なレコメンデーションモデルに大幅な改善をもたらすことが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:10:48 GMT)
A Tale of Two Experts: Cooperative Learning for Source-Free Unsupervised Domain Adaptation [59.9]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、ソースデータにアクセスすることなく、ターゲットドメインにソース学習モデルを適用するという現実的な課題に対処する。既存のSFUDA手法は、ソースモデルの予測のみを利用するか、大きなマルチモーダルモデルを微調整する。本稿では、補完的な洞察と対象データの潜在構造を利用するためのエキスパート協調学習(EXCL)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:39:50 GMT)
Where MLLMs Attend and What They Rely On: Explaining Autoregressive Token Generation [59.4]
マルチモーダル大規模言語モデル(MLLM)は、視覚入力と自然言語出力の整合性を示す。しかし、生成したトークンが視覚的モダリティに依存する範囲は、いまだに理解されていない。 MLLMにおける自己回帰トークン生成を説明するための軽量なブラックボックスフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:38:42 GMT)
Overclocking Electrostatic Generative Models [59.3]
PFGM++は補助次元$D$で拡張データ空間で動作し、拡散モデルフレームワークを$Dtoinfty$として回復する。 Inverse Poisson Flow Matching (IPFM, Inverse Poisson Flow Matching)を提案する。 IPFMは、ごく少数の機能評価だけで、ほぼ教師に近い、あるいは優れたサンプル品質を実現する蒸留発電機を生産する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:07:23 GMT)
Multi-View Causal Discovery without Non-Gaussianity: Identifiability and Algorithms [59.2]
因果発見は、通常、非ガウス性のようなデータ生成モデルに対する強い仮定に依存する難しい問題である。ここでは、この多視点構造を利用して、弱い仮定で因果発見を行う。本稿では,複数視点因果探索アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:48:36 GMT)
LoopServe: An Adaptive Dual-phase LLM Inference Acceleration System for Multi-Turn Dialogues [59.1]
LoopServeは、多ターン対話における大規模言語モデルのための適応的な二相推論フレームワークである。 LoopServeは、既存のベースラインに比べて一貫して優れた効率を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:14:44 GMT)
IIET: Efficient Numerical Transformer via Implicit Iterative Euler Method [59.0]
高次数値計算法は、NLPやCVのようなタスクにおけるトランスフォーマーの性能を向上させるが、計算オーバーヘッドの増加による性能-効率トレードオフを導入する。そこで本研究では,PCformerを例に,従来の蒸留技術はこれらのモデルの性能に悪影響を及ぼす可能性が示唆された。提案するtextbfIterative textbfImplicit textbfEuler textbfTransformer textbf(IIET)。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:14:03 GMT)
DivLogicEval: A Framework for Benchmarking Logical Reasoning Evaluation in Large Language Models [58.4]
本稿では,多種多様な文からなる自然文からなる古典論理ベンチマークDivLogicEvalを提案する。また,より信頼性の高い評価を実現するために,大規模言語モデルに固有のバイアスやランダム性の影響を緩和する新たな評価指標を導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:57:51 GMT)
KnowMT-Bench: Benchmarking Knowledge-Intensive Long-Form Question Answering in Multi-Turn Dialogues [58.3]
MT-LFQA(Multi-Turn Long-Form Question Answering)は、知識集約ドメインにおけるLLM(Large Language Models)の重要な応用パラダイムである。 textbfKnowMT-Benchは、知識集約的な分野にわたるLLMのためのMT-LFQAを体系的に評価するために設計された、テキストファーストなベンチマークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:32:29 GMT)
TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them [58.0]
自動評価器(LLM-as-a-judge)としての大規模言語モデル(LLM)は、現在の評価フレームワークにおいて重大な矛盾を明らかにしている。スコア比較不整合とペアワイズ・トランジティビティ不整合という2つの基本的不整合を同定する。我々は2つの重要なイノベーションを通じてこれらの制限に対処する確率的フレームワークであるTrustJudgeを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:33:48 GMT)
A2R: An Asymmetric Two-Stage Reasoning Framework for Parallel Reasoning [57.7]
モデルポテンシャルと実際の性能の間のギャップを埋めるために設計された非対称な2段階推論フレームワーク。 A2R-Efficientは、Qwen3-4BとQwen3-8Bシンセサイザーを組み合わせた「小型から大型」の派生型である。その結果、A2Rはパフォーマンス・ブートスティングのフレームワークであるだけでなく、現実世界のアプリケーションに対して効率的かつ実用的なソリューションであることがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:27:03 GMT)
Wide-In, Narrow-Out: Revokable Decoding for Efficient and Effective DLLMs [57.7]
Diffusion Large Language Models (DLLM) は、自動回帰モデルの魅力的な代替品として登場した。既存のDLLMは、高速な並列復号化によって性能が著しく低下する、厳しい品質と速度のトレードオフに悩まされている。本稿では,DLLMの復号化を可能にするトレーニング不要復号アルゴリズムであるWide-In, Narrow-Out (WINO)を紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:15:45 GMT)
Reinforcement Learning with Discrete Diffusion Policies for Combinatorial Action Spaces [57.5]
強化学習(Reinforcement Learning, RL)は、現実の多くの問題に共通する大規模なアクション空間にスケールするために苦労する。本稿では、複雑な環境下での高効率なポリシーとして、離散拡散モデルを訓練するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:53:36 GMT)
WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents [57.2]
本稿では,モデルに基づく探索と反復的,長短のクエリ進化を用いた体系的データ生成手法であるWebExplorerを紹介する。我々のモデルは、128Kのコンテキスト長と最大100のツール呼び出しスイッチをサポートし、長期の問題解決を可能にします。 8Bサイズのモデルとして、WebExplorer-8Bは、RLトレーニング後の平均16ターンを効果的に探索することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:31:59 GMT)
From Bias to Balance: Exploring and Mitigating Spatial Bias in LVLMs [57.0]
LVLM(Large Vision-Language Models)は、様々なマルチモーダルタスクにおいて大きな成功を収めている。画像内の異なる場所に同じキー情報を置くと、モデルがどのように反応するかに焦点を当てる。本研究では,すべての画像トークンに同一位置埋め込みを割り当てるシンプルかつ効果的な機構であるBaPAを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:07:03 GMT)
SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models [56.8]
モデルパラメータを直接編集する効率的な概念消去手法であるSPEEDを導入する。 Speedyは、パラメータ更新がターゲット以外の概念に影響しないモデル編集スペースであるnullスペースを検索する。たった5秒で100のコンセプトを消去しました。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:49:33 GMT)
Table-R1: Inference-Time Scaling for Table Reasoning [56.8]
推論時間スケーリングを実現するための2つのポストトレーニング戦略を開発し評価する。蒸留では,DeepSeek-R1 が生成した推論トレースの大規模データセットを導入する。 RLVRではタスク固有の検証可能な報酬関数を提案し、GRPOアルゴリズムを適用してTable-R1-Zeroモデルを得る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:16:13 GMT)
MrGuard: A Multilingual Reasoning Guardrail for Universal LLM Safety [56.8]
大規模言語モデル(LLM)は、ジェイルブレイクのような敵の攻撃を受けやすい。この脆弱性は、多言語セーフティアライメントされたデータが制限される多言語設定で悪化する。素早い分類のための多言語ガードレールを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:05:35 GMT)
Rethinking the Embodied Gap in Vision-and-Language Navigation: A Holistic Study of Physical and Visual Disparities [56.7]
VLN-PEは、人間型、四足型、車輪型ロボットをサポートする物理的に現実的なVLNプラットフォームである。われわれは,エゴ中心のVLN手法を,様々な技術パイプラインにまたがる物理ロボット設定において初めて評価した。以上の結果から,ロボット観測空間の制限,環境光の変動,衝突や落下などの物理的課題による性能劣化が明らかとなった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:50:31 GMT)
Solving the Granularity Mismatch: Hierarchical Preference Learning for Long-Horizon LLM Agents [56.6]
自律的なエージェントとしての大規模言語モデル(LLM)は、複雑で長期にわたる問題の解決にますます取り組まれている。直接優先度最適化(DPO)は、正確なクレジット代入には大きすぎる信号を提供するが、ステップレベルのDPOは、しばしば、複数のステップの振る舞いの値をキャプチャするには、筋が通らない。階層的選好学習(HPL)は、複数の相乗的粒度における選好信号を活用することで、LLMエージェントを最適化する階層的フレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:43:39 GMT)
GSM-Agent: Understanding Agentic Reasoning Using Controllable Environments [56.0]
GSM-Agentは複雑な環境でエージェント推論を評価するための新しいベンチマークである。我々は,環境文書の埋め込みをノードにクラスタ化することでエージェント推論パターンを分析し,各ツールコールを最も近いノードにマッピングする。本稿では,LLMのエージェント推論性能を向上させるためのツール拡張テストタイムスケーリング手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:24:37 GMT)
Explaining multimodal LLMs via intra-modal token interactions [55.3]
MLLM(Multimodal Large Language Models)は、様々な視覚言語タスクにおいて顕著な成功を収めているが、その内部決定機構は十分に理解されていない。モーダル内相互作用を利用した解釈可能性の向上を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:39:13 GMT)
EmoBench-UA: A Benchmark Dataset for Emotion Detection in Ukrainian [55.1]
EmoBench-UAはウクライナのテキストで感情を検出するための最初の注釈付きデータセットである。その結果,ウクライナ語のような非主流言語における感情分類の課題が浮き彫りになった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:31:00 GMT)
WaveMind: Towards a Conversational EEG Foundation Model Aligned to Textual and Visual Modalities [55.0]
脳波信号は認知過程と固有の神経状態の両方を同時に符号化する。我々は、EEG信号とその対応するモダリティを統一意味空間にマッピングし、一般化された解釈を実現する。結果として得られたモデルは、柔軟でオープンな会話をサポートしながら、堅牢な分類精度を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:21:51 GMT)
Single-weight Model Editing for Post-hoc Spurious Correlation Neutralization [54.9]
ニューラルネットワークのトレーニングは、トレーニング損失を最小限に抑えるショートカットとして、最も単純な機能を利用する傾向がある。これらの特徴のいくつかは、ターゲットラベルと急激な相関関係があり、モデルによる誤った予測につながる可能性がある。本稿では,一重の修正を行なえる独特な厳密なクラス除去手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:01:42 GMT)
Deeper Diffusion Models Amplify Bias [54.9]
本稿では,拡散モデルにおけるバイアス分散トレードオフの概念について考察する。 1つの極端な場合、拡散モデルはトレーニングデータの固有のバイアスを増幅し、もう1つの場合、トレーニングサンプルの想定されるプライバシーを損なう可能性がある。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:25:28 GMT)
BEVTrack: A Simple and Strong Baseline for 3D Single Object Tracking in Bird's-Eye View [54.5]
3Dシングルオブジェクトトラッキング(SOT)はコンピュータビジョンの基本課題であり、自律運転のようなアプリケーションにおいて重要な役割を果たす。 BEVTrackは、シンプルだが効果的な動きに基づくトラッキング手法である。我々は,BEVTrackが200FPSで動作しながら最先端の結果を達成し,リアルタイム適用性を実現していることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:03:08 GMT)
StableToken: A Noise-Robust Semantic Speech Tokenizer for Resilient SpeechLLMs [54.2]
音声トークン化器は、意味不明な音響摂動に対して頑健ではない。この不安定性は、脆い単一パス量子化アーキテクチャと遠い訓練信号の2つの欠陥に由来する。コンセンサス駆動機構による安定性を実現するトークンライザであるStableTokenを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:32:51 GMT)
Neptune-X: Active X-to-Maritime Generation for Universal Maritime Object Detection [54.2]
Neptune-Xは、海洋オブジェクト検出のためのデータ中心の生成-選択フレームワークである。 X-to-Maritime(X-to-Maritime)は、多様で現実的な海洋シーンを合成する多モード条件生成モデルである。提案手法は,海上シーン合成における新しいベンチマークを設定し,検出精度を大幅に向上させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:42:36 GMT)
Large Material Gaussian Model for Relightable 3D Generation [54.1]
物理ベースレンダリング(PBR)素材を用いた高品質な3Dコンテンツ作成のための新しいフレームワークを提案する。また,本手法は,ベースライン法に比べて視覚的魅力が向上するだけでなく,材料モデリングも向上し,下流レンダリングの実用化を可能にした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:35:12 GMT)
Investigating Redundancy in Multimodal Large Language Models with Multiple Vision Encoders [54.0]
選択したエンコーダがマスクされた場合, 性能は良好に低下し, 広範にエンコーダの冗長性が明らかとなった。我々は、OCRやChartのようなタスクにおいて、単一のエンコーダが90%以上のCURで支配できる強力な特殊化を観察する。特定のエンコーダを使用すると、特定のタスクカテゴリにおいて最大16%の精度が得られ、全体のパフォーマンスがフルモデルよりも3.6%向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:45:03 GMT)
Stuffed Mamba: Oversized States Lead to the Inability to Forget [53.5]
Mambaベースのモデルは、内蔵の忘れ物機構であっても、以前のトークンを効果的に忘れるのに苦労していることを示す。モデルの学習に必要な最小トレーニング長は状態サイズと線形に一致し,5桁パスキーの精度向上のための最大コンテキスト長は状態サイズと指数関数的に一致した。我々の研究は、将来のRNN設計は、状態サイズ、トレーニング期間、長いコンテキストタスクにおいて堅牢なパフォーマンスを達成するためのメカニズムを忘れることの間の相互作用を考慮しなければならないことを示唆している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:31:28 GMT)
Stochastic activations [53.4]
この戦略は、大規模言語モデルのフィードフォワード層における複数の非線形関数をランダムに選択する。我々は,(1)事前学習中にアクティベーションを使用し,RELUを用いてモデルを微調整する。この戦略は、温度スケーリングと組み合わせた最良の決定論的非線形性(SILU)よりもわずかに劣る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:53:56 GMT)
SciTS: Scientific Time Series Understanding and Generation with LLMs [53.4]
SciTSは12の科学領域と43のタスクにまたがるベンチマークである。テキストのみのLLM、マルチモーダルのLLM、統合時系列モデルを含む17のモデルをベンチマークする。次に、時系列を理解して生成する能力を備えたLLMに対応するフレームワークであるTime Omniを紹介します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:25:16 GMT)
Draw-In-Mind: Rebalancing Designer-Painter Roles in Unified Multimodal Models Benefits Image Editing [53.2]
DIM-T2I(Draw-In-Mind:Draw-In-Mind:DIM)と、GPT-4oが生成した233Kのチェーン・オブ・シンジケーションからなるDIM-Edit(DIM-Edit)という2つの補完的なサブセットからなるデータセットを紹介し、画像編集のための明示的な設計青写真として機能する。 DIM-4.6B-T2I/Edit は ImgEdit や GEdit-Bench のベンチマークにおいて、UniWorld-V1 や Step1X-Edit など、はるかに大きなモデルよりも優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:30:36 GMT)
Image Recognition with Online Lightweight Vision Transformer: A Survey [53.0]
本稿では、画像認識のための軽量な視覚変換器を作成するための様々なオンライン戦略について調査する。我々は、ImageNet-1Kベンチマークにおいて、各トピックに関する関連する探索を評価した。視覚変換器の軽量化における今後の研究の方向性と今後の課題を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:47:51 GMT)
4DGCPro: Efficient Hierarchical 4D Gaussian Compression for Progressive Volumetric Video Streaming [52.8]
本稿では,新しい階層型4D圧縮フレームワークである4DGCProを紹介する。 4DGCProは、プログレッシブボリュームビデオストリーミングによるリアルタイムモバイルデコーディングと高品質なレンダリングを容易にする。エンドツーエンドのエントロピー最適化トレーニングスキームを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:46:59 GMT)
One Token to Fool LLM-as-a-Judge [52.5]
大規模言語モデル(LLM)は、自動化された審査員としてますます信頼され、評価を支援し、他のモデルを訓練するための報酬信号を提供する。生成的報酬モデルは、ハッキングに対して体系的に影響を受けやすい。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:31:22 GMT)
STQE: Spatial-Temporal Attribute Quality Enhancement for G-PCC Compressed Dynamic Point Clouds [52.4]
圧縮された動的点雲の視覚的品質を改善するために,空間的・時間的相関を利用した時空間属性品質向上(STQE)ネットワークを提案する。私たちのコントリビューションには、参照属性情報を現在のフレーム形状に再マップして、フレーム間の正確なアライメントを実現する、リカラーベースのモーション補償モジュールが含まれています。最新のG-PCCテストモデルに適用すると、STQEはデルタPSNRの0.855dB、0.682dB、0.828dBの改善を達成し、Bjontegaard Delta rate (BD-rate) は-25.2%、-31.6%、そして-。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:27:47 GMT)
Benefits and Pitfalls of Reinforcement Learning for Language Model Planning: A Theoretical Perspective [52.4]
強化学習(RL)法は大規模言語モデル(LLM)の計画能力を大幅に向上させた本研究では,RLの利点と制約をグラフに基づく抽出により検討する。我々の理論的分析から, 教師付き微調整(SFT)は共起性に基づく突発性解を導入しうるが, RLは探索によって正しい計画を立てる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:39:48 GMT)
Attributing Response to Context: A Jensen-Shannon Divergence Driven Mechanistic Study of Context Attribution in Retrieval-Augmented Generation [52.4]
我々は、コンテキストに対する属性応答(ARC-JSD)のための新しいJensen-Shannon Divergence駆動方式を提案する。 ARC-JSDは、追加の微調整、勾配計算、サロゲートモデリングなしで、重要な文脈文の効率的かつ正確な識別を可能にする。 TyDi QA, Hotpot QA, Musique など,様々なスケールの命令調整 LLM を用いたRAG ベンチマークの評価により,精度が向上し,計算効率が向上した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:58:14 GMT)
On Robustness of Vision-Language-Action Model against Multi-Modal Perturbations [52.1]
視覚-言語-アクション(VLA)モデルでは、現実世界の摂動に対する堅牢性は、デプロイに不可欠である。本稿では,VLA入力と出力の摂動に対するロバストVLAを提案する。 LIBEROの実験では、ロバストVLAは、pi0バックボーンで12.6%、OpenVLAバックボーンで10.4%のベースラインをはるかに上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:42:23 GMT)
TDEdit: A Unified Diffusion Framework for Text-Drag Guided Image Manipulation [51.7]
共同ドラッグテキスト画像編集のための拡散型統合フレームワークを提案する。本フレームワークでは,(1)3次元特徴マッピングによる遅延空間レイアウト制御を向上するポイント・クラウド決定性ドラッグ,(2)ドラッグ・テキスト・ガイド・デノナイズ(Drag-Text Guided Denoising),(2)デノナイズ中のドラッグとテキスト条件の影響を動的にバランスするDrag-Text Guided Denoisingを導入している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:39:03 GMT)
Ringleader ASGD: The First Asynchronous SGD with Optimal Time Complexity under Data Heterogeneity [51.6]
本稿では,並列計算の理論的下界を実現する最初の非同期アルゴリズムであるリングリーダーASGDを紹介する。我々の分析により、リングリーダーASGDは任意の勾配と時間変化速度の下で最適であることが明らかとなった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:19:15 GMT)
Diversity Boosts AI-Generated Text Detection [51.6]
DivEyeは、予備的な機能を使って、予測不可能がテキスト間でどのように変動するかをキャプチャする、新しいフレームワークである。提案手法は、既存のゼロショット検出器を最大33.2%向上させ、微調整ベースラインとの競合性能を達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:36:00 GMT)
WebGen-Agent: Enhancing Interactive Website Generation with Multi-Level Feedback and Step-Level Reinforcement Learning [51.1]
WebGen-Agentは、包括的で多層的な視覚フィードバックを活用する新しいWebサイト生成エージェントである。 WebGen-Agent の推論エンジンとして機能する LLM の能力を向上させるために,Screenshot と GUI-Adnt Feedback を備えた textitStep-GRPO を導入している。 WebGen-Agent は Claude-3.5-Sonnet の精度を 26.4% から 51.9% に引き上げ、外観スコアを 3.0 から 3.9 に引き上げた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:51 GMT)
Wavelet-Induced Rotary Encodings: RoPE Meets Graphs [51.1]
WIREはRotary Position sをグラフ構造化データに拡張する。我々は、WIRE が RoPE よりも一般的であることを示し、グリッドグラフの特別な場合において後者を復元する。 WIREは、様々な合成および実世界のアルゴリズムタスクでテストする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:20:18 GMT)
ERIS: An Energy-Guided Feature Disentanglement Framework for Out-of-Distribution Time Series Classification [51.1]
理想的な時系列分類(TSC)は不変表現をキャプチャできるべきである。現在の手法は、真に普遍的な特徴を分離するために必要な意味的な方向性を欠いている。本稿では,シフト・ロバストネス・フレームワークのためのエンドツーエンドのエネルギー規則化情報を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:04:12 GMT)
Compute-Optimal Quantization-Aware Training [51.0]
量子化対応トレーニング(QAT)は、量子化されたニューラルネットワークの精度を向上させるための主要な技術である。従来の研究では、トレーニングを完全精度(FP)フェーズに分解し、QATフェーズが続くと、より優れた精度が得られることが示されている。最終性能に及ぼすQAT時間の影響について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:09:54 GMT)
GDR-learners: Orthogonal Learning of Generative Models for Potential Outcomes [50.2]
本稿では,潜在的結果の条件分布を推定する生成的Neyman-orthogonal Learningersの一般スイートを紹介する。提案したGDR-learnerは柔軟で,多くの最先端の深層生成モデルでインスタンス化することができる。従来の手法とは異なり、GDR学習者は準器効率と二重頑健性の性質を持っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:35:28 GMT)
Beyond Early-Token Bias: Model-Specific and Language-Specific Position Effects in Multilingual LLMs [50.1]
我々は,5言語(英語,ロシア語,ドイツ語,ヒンディー語,ベトナム語)にまたがる調査を行った。位置バイアスが即時戦略とどのように相互作用し、出力エントロピーに影響を及ぼすかを検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:21:49 GMT)
FLEXI: Benchmarking Full-duplex Human-LLM Speech Interaction [49.8]
音声とコンピュータの対話によりリアルタイム音声対話システムを実現する。これらのモデルのモデリングとベンチマークは、依然として根本的な課題である。フルヒューマン音声対話のための最初のベンチマークであるFLEXIを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:57:42 GMT)
Reinforcement Learning for Durable Algorithmic Recourse [49.5]
提案手法は,提案手法を用いて,候補集団が推薦に応じてどのように適応するかを明示的にモデル化する。また、環境の進化的ダイナミクスをキャプチャするRLベースのリコースアルゴリズムも導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:24:12 GMT)
Safety Compliance: Rethinking LLM Safety Reasoning through the Lens of Compliance [49.5]
既存の安全手法はアドホックな分類に依存しており、厳格で体系的な保護を欠いている。我々は,法規を組み込んだ現実的なLLM安全シナリオを生成することで,安全コンプライアンスのための新しいベンチマークを開発する。本実験は,新しいベンチマークにおいて,コンプライアンス・リゾネータが優れた性能を発揮することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:11:29 GMT)
FFT-based Dynamic Subspace Selection for Low-Rank Adaptive Optimization of Large Language Models [49.4]
低次元空間へのSVD/QRベースの勾配射影を近似する2段階の手順を提案する。当社の戦略はランタイムの高速化とメモリ使用量の削減を,さまざまなモデルサイズで最大25%削減できることが示されています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:42:23 GMT)
Critique-Coder: Enhancing Coder Models by Critique Reinforcement Learning [49.4]
強化学習(Reinforcement Learning, RL)は、特に推論モデルと組み合わせた場合、一般的なトレーニングパラダイムとして現れている。本稿では,モデルが与えられた(探索,解)ペアに対する批判を生成するための批判強化学習(CRL)を提案する。 textscCritique-Coderは、RLのみのベースラインを異なるベンチマークで一貫して上回ることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:30:49 GMT)
On the Complexity Theory of Masked Discrete Diffusion: From $\mathrm{poly}(1/ε)$ to Nearly $ε$-Free [49.3]
マスク付き離散拡散(マスク付き離散拡散)は、トークンが識別される前に特別なマスクシンボルによって劣化するテキスト生成のフレキシブルパラダイムである。その結果,Eulerサンプルは,$tildeO(d2epsilon-3/2)$離散スコア評価で,総変量(TV)の$epsilon$-精度を達成できることが判明した。そこで我々は,有界スコアの仮定を取り除き,偏りのない離散スコア近似を保ったMask-Aware Truncated Uniformization (MATU) アプローチを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:50:17 GMT)
AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning [49.2]
我々は、原子レベルで正確な異種知識推論を行うための大規模な言語モデルのためのフレームワークAtomRを紹介する。 AtomRは複雑な質問を、各葉ノードが原子知識演算子に対応する推論木に分解する。推論実行段階では、AtomRは各原子知識演算子を実行し、弾力的に異種源から原子レベルの知識を選択し、取得し、操作する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:16:28 GMT)
Grounding Multimodal LLMs to Embodied Agents that Ask for Help with Reinforcement Learning [49.2]
家庭環境下で活動する身体的エージェントは、曖昧で特定されていない人間の指示を解釈しなければならない。 LLM生成報酬を用いたオンライン強化学習(RL)を用いた視覚言語行動(VLA)ポリシーとして,マルチモーダル大規模言語モデル(MLLM)を微調整する新しいアプローチを提案する。以上の結果から,RLを微細化したMLLMは,すべてのベースラインを顕著なマージン(10.4～16.5%)で上回り,新規なシーンやタスクに適していることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:06:34 GMT)
Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.2]
生成のための教師なし共形推論フレームワークを提案する。我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:40:47 GMT)
Thinking with Sound: Audio Chain-of-Thought Enables Multimodal Reasoning in Large Audio-Language Models [49.1]
本稿では,Large Audio-Language ModelsとAudio CoTを併用したThinking-with-Sound(TwS)を提案する。 TwSにより、モデルは音声信号で積極的に考えることができ、数値解析やマルチモーダル推論によるデジタル操作を行うことができる。実験によると、最先端のLALMはMELD-Hard1kで劇的に性能が低下しており、クリーンオーディオに比べて精度が50%以上低下している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:27:59 GMT)
Scale-Wise VAR is Secretly Discrete Diffusion [49.0]
次なるスケール予測 Visual Autoregressive Generation (VAR) は、拡散ベースモデルを超えながら、最近顕著な性能を示した。本稿では,VARを再検討し,マルコフの注意マスクを装着した場合,VARは離散拡散と数学的に等価であることを示す。本稿では, 繰り返し改良やVARへのアーキテクチャ不効率の低減, 収束の高速化, 推論コストの低減, ゼロショット再構成の改善など, 拡散の利点を直接インポートする方法を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:58:04 GMT)
StateX: Enhancing RNN Recall via Post-training State Expansion [49.0]
我々は、トレーニング後RNNの状態を効率的に拡張するためのトレーニングパイプラインであるStateXを紹介する。最大1.3Bパラメータのモデル実験により、StateXはトレーニング後の高コストや他の能力の妥協なしに、RNNのリコールとコンテキスト内学習能力を効率的に向上することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:55:22 GMT)
Detecting and Interpreting NSFW Prompts in Text-to-Image Models through Uncovering Harmful Semantics [48.9]
悪意のあるユーザは、T2I(text-to-image)モデルを使用してNot-Safe-for-Work(NSFW)イメージを生成する。我々は,NSFWプロンプトを検出するために,T2Iモデルの隠れ状態を利用するフレームワークであるHiddenGuardを提案する。実験の結果,HiddenGuardは商用およびオープンソースのモデレーションツールよりも大幅に優れていた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:15:59 GMT)
Color Names in Vision-Language Models [48.8]
視覚言語モデル(VLM)におけるカラー命名機能の最初の体系的評価について述べる。以上の結果から,VLMは古典的な研究から色に対して高い精度が得られる一方で,拡張された非原型カラーセットでは性能が著しく低下することが示唆された。我々は、すべてのモデルに一貫して現れる21の共通色項を特定し、2つの異なるアプローチを明らかにした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:04:18 GMT)
The Lie of the Average: How Class Incremental Learning Evaluation Deceives You? [48.8]
クラスインクリメンタルラーニング(CIL)では、モデルが学習済みのクラスを忘れずに、新しいクラスを継続的に学習する必要がある。我々は、ロバストなCIL評価プロトコルは、性能分布全体を正確に特徴付け、推定するべきであると論じる。我々は,タスク間類似度を用いて,極端なクラスシーケンスを適応的に識別し,サンプリングする評価プロトコルEDGEを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:00:15 GMT)
Shape-for-Motion: Precise and Consistent Video Editing with 3D Proxy [48.7]
本稿では,精密で一貫したビデオ編集のための3Dプロキシを組み込んだ新しいフレームワークであるShape-for-Motionを紹介する。我々のフレームワークは、ポーズ編集、回転、スケーリング、翻訳、テクスチャ修正、オブジェクト合成など、ビデオフレーム間の精密で物理的に一貫性のある操作をサポートしています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:29:19 GMT)
RedNote-Vibe: A Dataset for Capturing Temporal Dynamics of AI-Generated Text in Social Media [48.6]
ソーシャルメディアAIGT分析のための最初の縦長(5年)データセットであるRedNote-Vibeを紹介する。このデータセットはXiaohongshuプラットフォームから提供されており、LLM以前の期間から2025年7月までのユーザエンゲージメントメトリクスとタイムスタンプが含まれている。ソーシャルメディアの文脈でAIGTを検出するために,解釈可能なアプローチである心理言語AIGT検出フレームワーク(PLAD)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:36:45 GMT)
Closing the Safety Gap: Surgical Concept Erasure in Visual Autoregressive Models [48.3]
本稿では,視覚的自己回帰モデルにおける概念消去を安定させる新しいフレームワークVAREを提案する。次に、VAR用に設計された新規かつ効果的な概念消去手法であるS-VAREを紹介する。提案手法は,生成品質を保ちながら外科的概念の消去を実現し,自動回帰テキスト・画像生成における安全性のギャップを埋める。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:26:52 GMT)
video-SALMONN 2: Caption-Enhanced Audio-Visual Large Language Models [47.7]
ビデオ記述と質問応答(QA)に新たなSOTA(State-of-the-art)を設定できる音声視覚大言語モデルであるVideo-SALMONN 2を提案する。我々の中核的な貢献はマルチラウンド直接選好最適化(MrDPO)であり、完全性と事実的精度を両立させるキャプション品質の目標と組み合わせている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:30:12 GMT)
Rate-Distortion Optimized Communication for Collaborative Perception [47.7]
本稿では,多エージェント協調のための実用的速度歪み理論を導入し,特に性能・コミュニケーションのトレードオフを解析するために定式化した。本稿では,コミュニケーション効率のよい協調認識フレームワークRDcommを提案する。 3Dオブジェクト検出とBEVセグメンテーションの実験により、RDcommはDAIR-V2XとOPV2Vの最先端精度を実現し、通信容量を最大108倍に削減した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:21:32 GMT)
PartSAM: A Scalable Promptable Part Segmentation Model Trained on Native 3D Data [47.6]
大規模3次元データに基づいてトレーニングされた最初のプロンプト可能なパートセグメンテーションモデルであるPartSAMを提案する。 PartSAMはエンコーダ・デコーダアーキテクチャを採用しており、三面体をベースとしたデュアルブランチ・エンコーダが空間的に構造化されたトークンを生成する。大規模監視を実現するために,500万以上の3次元形状部品対をキュレートしたループ型アノテーションパイプラインを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:52:35 GMT)
MS-GS: Multi-Appearance Sparse-View 3D Gaussian Splatting in the Wild [47.5]
野生の写真コレクションは、しばしば限られた量の画像を含んでおり、複数の外観を示す。 3DGS を用いたスパースビューシナリオにおけるマルチアジュアンス機能を備えた新しいフレームワーク MS-GS を提案する。我々は,MS-GSが様々な難解な視界とマルチアジュアンス条件下でレンダリングを実現することを実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:42:25 GMT)
PipelineRL: Faster On-policy Reinforcement Learning for Long Sequence Generation [47.5]
大規模言語モデル(LLM)の推論能力を高めるために強化学習(RL)がますます活用されている。本稿では、ハードウェア効率と政治上のデータとの良好なトレードオフを実現するために設計されたPipelineRLを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:28:08 GMT)
The Invisible Leash: Why RLVR May or May Not Escape Its Origin [47.5]
RLVRの現在の実践がモデルの推論境界を真に拡張するかどうかは不明である。現在の訓練条件下では、RLVRはサポート制約付き最適化メカニズムとして動作することができる。 RLVRは精度を確実に向上させるが、探索は徐々に狭くなり、正しく表現されていない解を見落としてしまう可能性がある。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:52:44 GMT)
Taxonomy, Opportunities, and Challenges of Representation Engineering for Large Language Models [47.4]
RepEはモデルの内部表現を直接操作する。より効果的で、解釈可能で、データ効率が良く、モデルの振る舞いを柔軟に制御できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:29:51 GMT)
Intentional Gesture: Deliver Your Intentions with Gestures for Speech [47.3]
Intentional-Gestureは、ハイレベルなコミュニケーション機能に基づく意図推論タスクとしてジェスチャ生成をキャストする新しいフレームワークである。我々のフレームワークは、デジタル人間と具体化されたAIにおいて、表現力のあるジェスチャー生成のためのモジュラー基盤を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:02:17 GMT)
Reasoning Under Uncertainty: Exploring Probabilistic Reasoning Capabilities of LLMs [47.2]
我々は,大規模言語モデル(LLM)の推論能力について,初めて包括的な研究を行った。我々は,3つの注意深く設計されたタスク,モード識別,最大推定,サンプル生成のモデルを評価する。経験的評価を通じて、より小さなモデルと大きなモデルの間に明らかなパフォーマンスギャップがあることを実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:28:16 GMT)
Constituency Parsing using LLMs [47.2]
選挙区解析は自然言語処理における根本的な課題であるが未解決の課題である。我々は、ゼロショット、少数ショット、教師付き微調整学習パラダイムの下で、最近の大規模言語モデル(LLM)の性能を評価する。そこで本研究では,より正確な構成木を生成するため,LLMを誘導する2つの戦略を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:39:10 GMT)
Towards Understanding Feature Learning in Parameter Transfer [47.1]
上流モデルと下流モデルの両方がReLU畳み込みニューラルネットワーク(CNN)である設定を解析する。我々は、継承されたパラメータが普遍的な知識のキャリアとしてどのように振る舞うかを特徴付け、目的のタスクに対するそれらの有益な影響を増幅する重要な要因を識別する。我々の分析は、ある場合において、新しいモデルをスクラッチからトレーニングするよりも、パラメータの転送がターゲットタスクのテスト精度を低下させる可能性がある理由を洞察する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:37:54 GMT)
Practical estimation of the optimal classification error with soft labels and calibration [47.0]
我々は,ベイズ誤差,最適誤差率を推定するために,ソフトラベルを用いた以前の研究を拡張した。我々は、破損したソフトラベルによる推定という、より困難な問題に取り組みます。私たちのメソッドはインスタンスフリーです。つまり、入力インスタンスへのアクセスを前提としません。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:33:29 GMT)
QA-LIGN: Aligning LLMs through Constitutionally Decomposed QA [46.7]
本稿では,モノリシック報酬を解釈可能な原理固有評価に分解するQA-LIGNを紹介する。ランマ-3.1-8B-インストラクションの適用により、QA-LIGNは攻撃成功率を最大68.7%まで下げる一方で、偽拒絶率0.67%を維持している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:57:59 GMT)
LLMAEL: Large Language Models are Good Context Augmenters for Entity Linking [46.6]
特殊エンティティリンク(EL)モデルは、ユニークな知識ベース(KB)エンティティへのマッピングで十分に訓練されている。広範に事前訓練された大型言語モデル(LLM)は、一般的でないエンティティの幅広い知識を持っている。 LLMデータ拡張による特殊ELモデルを拡張した最初のフレームワークであるLLMAEL(LLMAEL)を紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:30:48 GMT)
AgentPack: A Dataset of Code Changes, Co-Authored by Agents and Humans [46.6]
コード編集のための微調整された大きな言語モデルは、一般的にコミットのマイニングやプルリクエストに依存しています。我々は、Claude Code、OpenAI Codex、Cursor Agentが共著した1.3Mコード編集コーパスであるAgentPackを紹介する。 AgentPackで微調整されたモデルは、以前の人間のみのコミットコーパスで訓練されたモデルより優れていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:28:22 GMT)
What Do They Fix? LLM-Aided Categorization of Security Patches for Critical Memory Bugs [46.3]
我々は、LLM(Large Language Model)と細調整された小言語モデルに基づく2つのアプローチを統合するデュアルメタルパイプラインであるLMを開発した。 LMは、OOBまたはUAFの脆弱性に対処する最近のLinuxカーネルのパッチ5,140のうち111つを、手作業による検証によって90の正の正が確認された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:06:36 GMT)
Degradation-Aware All-in-One Image Restoration via Latent Prior Encoding [46.1]
現実のイメージはしばしば、ヘイズ、雨、雪、低光といった空間的に多様な劣化に悩まされる。既存のオールインワンの復元アプローチは、外部のテキストプロンプトに依存するか、手作りのアーキテクチャの先行を組み込むかのいずれかである。劣化認識表現が自動的に入力から推測されるような、学習済みの事前推論としてAIRを再設計することを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:01:23 GMT)
Cost-Optimal Grouped-Query Attention for Long-Context Modeling [46.0]
Grouped-Query Attention(GQA)は、大規模言語モデルにおける注目層の計算コストを削減するための広く採用されている戦略である。我々は,文脈長,モデルサイズ,GQA構成,モデル損失の関係を分析する。コスト最適GQA構成の導出法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:14:31 GMT)
The Counting Power of Transformers [46.0]
我々は変圧器の計数力を調べるための公式な枠組みを提供する。我々の主な成果は、変換器が非常に非線形なカウント特性を表現できることである。より正確には、変換器が全ての半代数的カウント特性をキャプチャできることを証明できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:10:51 GMT)
HEART: Emotionally-driven test-time scaling of Language Models [45.6]
HEARTは感情駆動型プロンプトを反復的自己補正に用いる新しいフレームワークである。我々は、OlympiadBench、HumanityのLast Exam、SimpleQAなど、挑戦的な推論ベンチマークに関するフレームワークを評価した。オラクル検証器によって導かれると、この感情的プロトコルははるかに深い推論を解き放ちます。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:41:00 GMT)
MNT-TNN: Spatiotemporal Traffic Data Imputation via Compact Multimode Nonlinear Transform-based Tensor Nuclear Norm [45.6]
現代のコミュニケーション技術は、価値計算の欠如に新たな課題をもたらしている。マルチモード変換核ノルム(MNSS-TNN)に基づく新しい計算法を提案する。また,計算結果を改善するために,ATTNN(Augmented Transform-based Nuclear Norm Families)フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:01:58 GMT)
Quantization Meets Reasoning: Exploring and Mitigating Degradation of Low-Bit LLMs in Mathematical Reasoning [45.6]
低ビット後の量子化は、より厳しい設定で69.81%の数学的推論を損なう。デプロイクリティカルな2つの問題に,プロセスレベルの精度で対処する。われわれの設定では、332のキュレートされたサンプルと1つのGPUで3～5分計算すると、完全な精度のベースラインに向かって4ビットの重み計算が引き起こされる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:27:57 GMT)
Self-alignment of Large Video Language Models with Refined Regularized Preference Optimization [45.6]
大規模ビデオ言語モデル(LVLM)は、微細な時間的理解と幻覚に苦慮し、単純なビデオ質問応答タスクでも単純な誤りを犯すことが多い。本稿では,LVLMが自己の誤りから学習できる自己調整フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:21:18 GMT)
From Parameters to Behavior: Unsupervised Compression of the Policy Space [45.3]
我々は、ポリシーパラメータ空間 $Theta$ を低次元潜在空間 $mathcalZ$ に圧縮する、新しい教師なしのアプローチを開発する。学習された多様体は、潜時空間$mathcalZ$におけるポリシーグラディエント操作によるタスク固有の適応を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:42:52 GMT)
SecP-Tuning: Efficient Privacy-Preserving Prompt Tuning for Large Language Models via MPC [45.3]
大規模言語モデル(LLM)は多くの分野に革命をもたらしたが、医療やファイナンスといったプライバシーに敏感な分野の特殊タスクへの適応には制約が残っている。セキュアなマルチパーティ計算(MPC)ベースのプライバシ保護機械学習は、モデルパラメータとデータのプライバシに関する理論的保証を提供する。提案するSecP-Tuningは,LLMの効率的なプライバシ保護プロンプトチューニングを目的とした,最初のMPCベースのフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:13:33 GMT)
VoiceAssistant-Eval: Benchmarking AI Assistants across Listening, Speaking, and Viewing [45.2]
VoiceAssistant-Evalは、13のタスクカテゴリにまたがる10,497のキュレートされた例で構成されている。実用性を示すため,21のオープンソースモデルとGPT-4o-Audioを評価した。プロプライエタリなモデルは、オープンソースモデルより普遍的に優れているわけではない。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:59 GMT)
Distillation-Enabled Knowledge Alignment Protocol for Semantic Communication in AI Agent Networks [45.0]
大規模人工知能(AI)エージェントのための蒸留対応知識アライメントプロトコル(DeKAP)を提案する。 DeKAPは、各エージェントの専門知識をパラメータ効率の低い低ランク行列に蒸留し、それらをネットワーク全体に割り当て、エージェントが複数のタスクに対して整合した知識を同時に維持できるようにする。我々は、大規模な整数線形計画問題として、アライメント損失、通信オーバーヘッド、ストレージコストの結合最小化を定式化する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:25:29 GMT)
SUV: Scalable Large Language Model Copyright Compliance with Regularized Selective Unlearning [44.9]
SUVは、大規模言語モデルが著作権のあるコンテンツを記憶することを防ぐために設計された選択的なアンラーニングフレームワークである。私たちは、冗長な著作権のあるコンテンツを、プラウシブルで一貫性のある代替品に置き換えます。我々は,500冊の有名な書籍の大規模データセットを用いて,我々のアプローチを検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:16:11 GMT)
FormalML: A Benchmark for Evaluating Formal Subgoal Completion in Machine Learning Theory [44.6]
大規模言語モデル (LLM) は、最近、形式定理の証明において顕著な進歩を見せている。しかし、数学者の実践的なアシスタントとして機能する能力は、複雑な証明の中で欠落したステップを埋めるものであり、まだ解明されていない。機械学習の基礎理論に基づいて構築された、リーン4ベンチマークであるFormalMLを紹介します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:40:14 GMT)
MMSearch-Plus: Benchmarking Provenance-Aware Search for Multimodal Browsing Agents [44.6]
マルチモーダル理解を強制する311タスクのベンチマークであるMMSearch-Plusを紹介する。標準ブラウジングツールとset-of-mark(SoM)モジュールを備えたモデルに依存しないエージェントフレームワークを提供する。 SoMは、プロファイナンス対応のズーム・アンド・リトリーブを可能にし、マルチステップ推論におけるロバスト性を改善する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:36:22 GMT)
Chimera: Diagnosing Shortcut Learning in Visual-Language Understanding [44.5]
ウィキペディアから得られた7,500の高品質な図からなるテストスイートであるChimeraを紹介する。各ダイアグラムは、その象徴的な内容が意味的な三重項で表され、多段階の質問とともに注釈付けされる。視覚的質問応答における3種類のショートカットの存在を測定するために,チメラを用いている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:55:04 GMT)
StreetReaderAI: Making Street View Accessible Using Context-Aware Multimodal AI [44.4]
初めてアクセス可能なストリートビューツールであるStreetReaderAIを紹介します。 StreetReaderAIを使えば、視覚障害者は目的地を事実上検査したり、オープンワールドで探索したり、2200億枚以上の画像を実質的にツアーすることができる。以上の結果から,POI調査と遠隔経路計画を支援する上で,アクセス可能な街路ビューの価値が示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:19:50 GMT)
Adaptive Margin RLHF via Preference over Preferences [44.3]
好みの強さをモデル化することで、より一般化し、より忠実なアライメントにつながると我々は主張する。本稿では, DPO-PoP(Direct Preference Optimization, DPO-PoP)の拡張について紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:03:24 GMT)
Generator-Assistant Stepwise Rollback Framework for Large Language Model Agent [44.3]
大規模言語モデル(LLM)エージェントは通常、ステップバイステップの推論フレームワークを採用し、与えられたタスクを達成するための思考と行動のプロセスをインターリーブする。本稿では,ジェネレータ・アシスタント・ステップワイド・ロールバック(GA-Rollback)と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:48:59 GMT)
InftyThink: Breaking the Length Limits of Long-Context Reasoning in Large Language Models [44.3]
InftyThinkは、モノリシック推論を中間的な要約を伴う反復的なプロセスに変換するパラダイムである。本手法では, 計算コストを抑えながら, 推理深度を推定できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:25:38 GMT)
CCNeXt: An Effective Self-Supervised Stereo Depth Estimation Approach [44.2]
深度推定のための自己教師型畳み込み手法を提案する。提案したCCNeXtアーキテクチャは、エンコーダに新しいウィンドウ付きエピポーラ・クロスアテンションモジュールを備えた、最新のCNN特徴抽出器を採用している。我々の実験は、CCNeXtが現在のベストモデルよりも10.18$times$の速度で競合指標を達成することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:51:28 GMT)
Quantile Advantage Estimation for Entropy-Safe Reasoning [44.2]
RLVRによる強化学習はLLM推論を強化するが、エントロピー崩壊とエントロピー爆発の間のトレーニングはしばしば振動するいずれのハザードも値のないRLで使われる平均ベースラインに辿り着くが、これは不適切に報酬のアウトリージの下で負のアドバンテージサンプルをペナルティ化する。本稿では,平均値をグループ単位のK量子基底線に置き換えた量子アドバンテージ推定(QAE)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:37:52 GMT)
Can LLMs Alleviate Catastrophic Forgetting in Graph Continual Learning? A Systematic Study [44.1]
グラフ構造データを含む実世界のデータはしばしばストリーミング方式で配信されるため、学習システムは新たな知識を継続的に取得する必要がある。本稿では,従来のGNNベースラインを約20%超えたシンプルなグラフ連続学習手法であるSimple Graph Continual Learning(SimGCL)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:09:18 GMT)
EqDiff-CT: Equivariant Conditional Diffusion model for CT Image Synthesis from CBCT [43.9]
画像誘導放射線療法(IGRT)に広く用いられているコーンビームCT(CBCT) CBCTから高品質なCT画像を生成するために,EqDiff-CTという新しい拡散型条件生成モデルを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:51:59 GMT)
Audio Super-Resolution with Latent Bridge Models [43.8]
遅延ブリッジモデル(LBM)を用いた新しいシステムを提案する。音声波形を連続的な潜時空間に圧縮し,LBMを設計して潜時から潜時生成プロセスを実現する。 HRサンプルが限られているにもかかわらず、トレーニング結果をさらに高めるため、周波数認識型LBMを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:39:37 GMT)
XBOUND: Exploring Capability Boundaries of Device-Control Agents at the State Level [43.7]
Device-Control Agents(DCエージェント)はグラフィカルユーザインタフェース(GUI)を管理する状態ごとの命令完了の精度を評価するための新しい評価手法 XBOUND を提案する。 UI-TARSは最強の7Bモデルであり、現在のエージェントは命令統一においてバイモーダルなパフォーマンスパターンを示し、サブ7Bモデルは状態熟達において制限されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:13:44 GMT)
Efficient Orthogonal Fine-Tuning with Principal Subspace Adaptation [43.7]
パラメータ効率の良いファインチューニングのための主部分空間適応(PSOFT)を用いたオルソゴンファインチューニングを提案する。 35のNLPタスクとCVタスクの実験により、PEFTにおける意味保存、表現性、多次元効率を同時に達成するために、PSOFTは実用的でスケーラブルなソリューションを提供することが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:35:01 GMT)
One Prompt Fits All: Universal Graph Adaptation for Pretrained Models [43.7]
Graph Prompt Learning (GPL)は、グラフ事前学習モデルと下流シナリオをブリッジする有望なパラダイムとして登場した。提案するUniPromptは、事前学習されたモデルに適応し、入力グラフの構造を保ちながら事前学習されたモデルの能力を開放する新しい手法である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:39:31 GMT)
Elastic MoE: Unlocking the Inference-Time Scalability of Mixture-of-Experts [43.6]
Mixture-of-Experts (MoE)モデルは通常、トレーニングと推論の両方でアクティベートされた専門家の数を$k$に修正する。新たなトレーニングフレームワークであるElastic Mixture-of-Experts(EMoE)を導入しました。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:29:19 GMT)
Prima.cpp: Fast 30-70B LLM Inference on Heterogeneous and Low-Resource Home Clusters [43.5]
オンデバイス推論は、プライバシ、オフライン使用、即時応答を提供するが、コンシューマハードウェアは、大きな言語モデル(LLM)を低スループットと能力に制限する。本稿では,CPU/GPUの混在,RAM/VRAMの不足,ディスクの遅い,Wi-Fiリンク,異種OSを備えた家電クラスタ上で30～70B LLMを動作させる分散オンデバイス推論システムprime.を提案する。計算・通信とディスクI/Oの重なり合うようにパイプラインリング並列化(PRP)を導入し,mapベースのオフロードにおけるプレフェッチ・リリース競合に対処する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:17:23 GMT)
Generalized Multi-agent Social Simulation Framework [43.5]
マルチエージェントのソーシャルインタラクションは、明らかに大規模言語モデルから恩恵を受けている。現在のシミュレーションシステムは、多様なシナリオへのスケーリングの難しさやモジュール設計の欠如による再利用性の低下といった課題に直面している。階層構造を通じて様々なベースクラスを有機的に統合し,スケーラビリティと再利用性を得るモジュール型オブジェクト指向フレームワークを開発する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:36:16 GMT)
Mixture-of-Visual-Thoughts: Exploring Context-Adaptive Reasoning Mode Selection for General Visual Reasoning [43.1]
我々は、新しい適応推論パラダイム、Mixture-of-Visual-Thoughts (MoVT)を提案する。 MoVTは単一のモデル内で異なる推論モードを統一し、コンテキストに基づいて適切なモードを選択するように誘導する。 AdaVaRは、モデルを効果的にガイドし、複数のモードを学び、区別し、コンテキスト適応モード選択を実行する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:33:53 GMT)
Differential-Integral Neural Operator for Long-Term Turbulence Forecasting [43.0]
textbfunderlineDifferential-textbfunderlineIntegral textbfunderlineNeural textbfunderlineOperator (method) メソッドは、異なる物理演算子を学習する並列分岐による乱流進化を明示的にモデル化する。数百のタイムステップにわたる誤差の蓄積をうまく抑制し、渦場とエネルギースペクトルの両方において高い忠実性を維持し、物理的に一貫した長距離乱流予測のための新しいベンチマークを確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:35:12 GMT)
Distributed Associative Memory via Online Convex Optimization [42.9]
連想メモリ(AM)はキュー・レスポンスのリコールを可能にし、連想記憶はトランスフォーマーのような現代のニューラルアーキテクチャの動作を過小評価するために最近注目されている。この作業は、エージェントがそれぞれのアソシエーションをリコールするローカルAMと、他のエージェントからの選択的な情報を保持する分散設定に対処する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:20:15 GMT)
CausalKANs: interpretable treatment effect estimation with Kolmogorov-Arnold networks [42.9]
causalKANsは、条件付き平均治療効果(CATE)の神経推定器をコルモゴロフ-アルノルドネットワーク(KAN)に変換するフレームワークである。プルーニングと記号の単純化を取り入れることで、コーサルカンは予測精度を保ちながら解釈可能な閉形式式を得る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:16:06 GMT)
RuCCoD: Towards Automated ICD Coding in Russian [42.6]
本研究は, バイオメディカルリソースが限られているロシア語におけるクリニカルコーディングの自動化の実現可能性について検討した。我々は,1万以上のエンティティと1500以上のユニークなICDコードを含む電子健康記録からの診断フィールドを含む,ICD符号化のための新しいデータセットを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:49:44 GMT)
S2J: Bridging the Gap Between Solving and Judging Ability in Generative Reward Models [42.6]
生成報酬モデル(GRM)は報酬モデルや評価に広く採用されている。従来の研究は主に、選好データセットに基づいて、判断の正しさを監督として最適化することで、専門的なGEMの訓練に重点を置いてきた。この問題に対処するためのS2J(Solve-to-Judge)アプローチを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:21:17 GMT)
IA2: Alignment with ICL Activations Improves Supervised Fine-Tuning [42.5]
In-Context Learning (ICL) は、インプロンプト内のインストラクションやデモによってモデルに適応する。 ICLとSFTは異なるアクティベーションパターンを生成し,異なる機能機構によって2つの手法が適応可能であることを示す。 ICL Activation Alignment (IA2) は、ICCの活性化パターンをSFTモデルで再現し、ICCのような内部推論をインセンティブ化する自己蒸留技術である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:46:32 GMT)
POLO: Preference-Guided Multi-Turn Reinforcement Learning for Lead Optimization [42.5]
大規模言語モデル(LLM)は、コンテキスト内学習と命令追従機能を通じて、有望なアプローチを提供する。分離されたステップではなく、完全な最適化軌道からLLMを学習できるPOLOを提案する。 POLOはシングルプロパティタスクの平均成功率は84%、マルチプロパティタスクの平均成功率は50%である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:06:58 GMT)
Johnson-Lindenstrauss Lemma Guided Network for Efficient 3D Medical Segmentation [42.2]
本研究では,高次元画像の特徴に基づいてフレームワークを再設計する方法について述べる。私たちのアプローチであるVeloxSegは、デプロイ可能でデュアルストリームのCNN-Transformerアーキテクチャから始まります。 VeloxSegはDiceを26%改善し、GPUスループットを11倍、CPUを48倍向上させた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:12:43 GMT)
Learning More with Less: A Dynamic Dual-Level Down-Sampling Framework for Efficient Policy Optimization [42.2]
GRPOのような批判のないメソッドは、複数のロールアウトから利点を推定することでメモリ要求を減らすが、徐々に収束する傾向がある。我々は、ポリシー最適化の効率を改善するために、グループ間で最も有益なサンプルとトークンを優先順位付けする textbfDynamic Dual-Level Down-Sampling (D$3$S) フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:36:53 GMT)
Universal Legal Article Prediction via Tight Collaboration between Supervised Classification Model and LLM [42.1]
法律記事予測(LAP)は、法的テキスト分類において重要な課題である。法律記事予測のための普遍的な枠組みであるUni-LAPを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:42:20 GMT)
SpikeMatch: Semi-Supervised Learning with Temporal Dynamics of Spiking Neural Networks [42.0]
SpikeMatchは、スパイキングニューラルネットワーク(SNN)のための、最初の半教師付き学習フレームワークである。 SpikeMatchは、弱い拡張された未ラベルのサンプルから信頼できる擬似ラベルを生成し、強化されたサンプルでトレーニングする。実験によると、SpikeMatchは、SNNバックボーンに適合する既存のSSLメソッドを、さまざまな標準ベンチマークで上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:01:21 GMT)
Learn the Ropes, Then Trust the Wins: Self-imitation with Progressive Exploration for Agentic Reinforcement Learning [41.9]
エージェントLLMを学習するためのカリキュラムベースの自己アニメーション学習(SIL)レシピであるSPEARを提案する。具体的には,本手法は,本質的な報奨を生かして,技術レベルの探究を促進するためのカリキュラムを取り入れている。さらにトレーニングを安定させるために、リプレイバッファでの経験の利点を再検討し、潜在的ポリシードリフトに対処する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:20:38 GMT)
VidBridge-R1: Bridging QA and Captioning for RL-based Video Understanding Models with Intermediate Proxy Tasks [41.9]
VidBridge-R1は、"Reason-Then-Respond"パラダイムの競合を効果的に橋渡しする、世界初の多目的ビデオ推論モデルである。大規模な実験により、VidBridge-R1は1つのモデルにおいて、QAとキャプションの両方で大きなパフォーマンス向上を達成することが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:33:17 GMT)
Fairness-Aware Reinforcement Learning (FAReL): A Framework for Transparent and Balanced Sequential Decision-Making [41.5]
実世界のシーケンシャルな決定問題の等価性は、公平性を意識した方法で実施することができる。複数のトレードオフを探索できるフレームワークを提案する。フレームワークは複数のシナリオでより公平なポリシーを学習し、パフォーマンスの報酬をわずかに損なうだけであることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:42:14 GMT)
A Unifying Framework for Parallelizing Sequential Models with Linear Dynamical Systems [41.4]
固定点法を用いて逐次過程を並列に評価するためのいくつかの手法が提案されている。これらの手法は線形力学系に基づく共通フレームワーク内で理解可能であることを示す。この統一的な見解は、これらのテクニックの背後にある共通原則を強調し、特定の固定ポイントメソッドが最も効果的である可能性を明確にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:27:02 GMT)
Mamba-Driven Topology Fusion for Monocular 3D Human Pose Estimation [41.1]
本研究では,マンバ駆動トポロジフュージョンによる3次元ポーズ推定手法を提案する。具体的には,提案した骨認識モジュールは球面座標系における骨ベクトルの方向と長さを推定する。また、シーケンス内の時間的関係と空間的関係の両方をモデル化する時空間リファインメントモジュールを設計する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:22:42 GMT)
ConQuER: Modular Architectures for Control and Bias Mitigation in IQP Quantum Generative Models [41.0]
瞬時量子(IQP)回路に基づく量子生成モデルは、複素分布の学習において非常に有望である。現在の実装は、生成した出力に対する制御性の欠如と、期待される特定のパターンに対する深刻な生成バイアスに悩まされている。モジュール回路アーキテクチャによる両課題に対処する制御可能な量子生成フレームワーク ConQuER を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:32:41 GMT)
Sparsity Forcing: Reinforcing Token Sparsity of MLLMs [40.9]
マルチモーダル大規模言語モデル(MLLM)におけるトークンの分散性を,単純なRLベースのポストトレーニングフレームワークであるtextitSparsity Forcing を用いて明示的に強化する。本手法では,複数ロールアウトを異なるトークン予算で実行し,効率(トーケン還元率)と性能(回答正当性)の両方を共同報酬として定式化することにより,効率・正確性トレードオフを探索する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:40:43 GMT)
Clinical Uncertainty Impacts Machine Learning Evaluations [40.8]
機械学習評価は, 直接分布に作用する確率的指標を用いて, アノテーションの不確かさを明示的に考慮すべきである,と論じる。我々は、データセットの生アノテーションをコミュニティに公開し、パフォーマンス推定が臨床データをよりよく反映できるように、不確実性を考慮した評価を採用するよう促す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:56:58 GMT)
MimicDreamer: Aligning Human and Robot Demonstrations for Scalable VLA Training [40.5]
低コストな人間によるデモンストレーションをロボットで使用可能な監視に変換するフレームワークであるMimicDreamerを提案する。視覚的アライメントのために,高忠実度ロボットデモビデオを生成するビデオ拡散モデルH2R Alignerを提案する。視点安定化のためにEgoStabilizerを提案する。動作アライメントのために,人間の手の動きをロボットフレームにマッピングし,制約付き逆運動学解法を適用する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:05:10 GMT)
Enriching Knowledge Distillation with Intra-Class Contrastive Learning [40.4]
ソフトラベルに含まれるクラス内情報を豊かにするために,教員養成中にクラス内コントラストロスを取り入れることを提案する。クラス内コントラスト損失はクラス内多様性を豊かにすることができることが証明されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:35:34 GMT)
InfiR2: A Comprehensive FP8 Training Recipe for Reasoning-Enhanced Language Models [40.4]
本稿では、連続的な事前学習と教師付き微調整をシームレスに統合するエンドツーエンドのFP8トレーニングレシピを提案する。我々は,FP8をBF16の実用的で堅牢な代替品として確立し,大規模モデルトレーニングをさらに民主化するためのコードをリリースする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:16:49 GMT)
WildSpeech-Bench: Benchmarking End-to-End SpeechLLMs in the Wild [40.2]
マルチモーダル大規模言語モデル (LLM) は直接音声対話の強力な機能を示している。既存の評価手法は、しばしばテキストベースのベンチマークに適応し、音声の特徴や課題を見下ろしている。本稿では,実践会話におけるエンドツーエンドの音声LLMを体系的に評価するために設計された,最初の総合的ベンチマークを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:14:14 GMT)
VidCRAFT3: Camera, Object, and Lighting Control for Image-to-Video Generation [40.2]
制御可能なイメージ・ツー・ビデオ(I2V)生成は、参照画像をユーザ指定の制御信号でガイドされたコヒーレントなビデオに変換する。我々は、カメラモーション、オブジェクトモーション、照明方向の独立制御とジョイント制御をサポートする統合I2VフレームワークであるVidCRAFT3を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:44:52 GMT)
APRIL: Active Partial Rollouts in Reinforcement Learning to Tame Long-tail Generation [40.1]
強化学習(RL)は、大規模事前訓練言語モデル(LLM)の進展の基盤となっている。強化学習におけるアクティブ部分ロールアウト(APRIL)を提案する。 APRILはロールアウト要求をオーバープロビジョンし、ターゲットのレスポンス数が到達したら終了し、将来のステップで継続するために不完全なレスポンスをリサイクルする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:20:15 GMT)
MLP Memory: A Retriever-Pretrained Memory for Large Language Models [39.9]
本稿では,明示的な文書アクセスを伴わずに検索パターンを内部化するパラメトリックモジュールを提案する。我々のアーキテクチャでは、この事前学習されたメモリを単純な確率でデコーダと統合し、5つの質問応答ベンチマークで12.3%、9つの一般的なNLPタスクで5.2ポイントの絶対ゲインを達成した。本研究は,学習パターンが効果的な推論と効果的な知識アクセスのギャップをパラメトリックに埋めることを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:52:08 GMT)
ExPLAIND: Unifying Model, Data, and Training Attribution to Study Model Behavior [39.6]
ポストホックの解釈可能性のメソッドは、通常、モデルの振る舞いをそのコンポーネント、データ、または独立した訓練軌跡に関連付ける。これらの観点をすべて統合した統合フレームワークであるExPLAINDを紹介します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:38:34 GMT)
Navigate the Unknown: Enhancing LLM Reasoning with Intrinsic Motivation Guided Exploration [39.5]
そこで,本研究では,高密度報酬を付与し,RLに基づくパラダイムにおける探索を増幅するために,固有モチベーションギルド探索比N meThOd foR LLM推論(i-MENTOR)を提案する。 4つの公開データセットにわたる実験は、i-MENTORの有効性を示し、AIME 2024で22.23%改善した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:18:44 GMT)
Sign-SGD is the Golden Gate between Multi-Node to Single-Node Learning: Significant Boost via Parameter-Free Optimization [39.4]
Sign-SGDは、単一ノードトレーニングにおけるメモリ効率のよいアプローチであり、分散学習における勾配圧縮技術である。理論的な観点から有効段数を自動的に決定することは不可能である。我々は、一つのノードと複数のノードの学習、モメンタムを組み込んだ手法にアプローチを拡張します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:03:47 GMT)
Leveraging Coordinate Momentum in SignSGD and Muon: Memory-Optimized Zero-Order [39.3]
ダウンストリームタスクに事前訓練されたモデルを適用するには、微調整大型言語モデル(LLM)が不可欠である。従来の一階述語アルゴリズムは、モデルサイズであまりスケールしない、禁止的なメモリと計算コストを発生させる。メモリと計算効率の代替としてゼロオーダー(ZO)最適化法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:29:26 GMT)
CHRONOBERG: Capturing Language Evolution and Temporal Awareness in Foundation Models [39.2]
本稿では,250年にわたる英語本文の時間的構造化コーパスであるCHRONOBERGを紹介する。言語モデルをCHRONOBERGで逐次訓練し,ダイアクロニックシフトをエンコードする方法を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:56:16 GMT)
Mpemba Effects in Quantum Complexity [39.1]
ランダム回路モデルにおけるコヒーレンス、想像力、非ガウス性、およびマジック状態資源のダイナミクスについて検討する。この結果から,コヒーレンスと想像力は,資源状態にある場合の量子Mpemba効果を示すことがわかった。ポントス=ムペンバ効果(ポントス=ムペンバ効果)と呼ばれる4つの資源はいずれも、初期の「予熱」段階は、直接の「冷却」力学よりも緩和を加速する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:35:05 GMT)
Incorporating Scene Context and Semantic Labels for Enhanced Group-level Emotion Recognition [39.1]
グループレベルの感情認識(GER)は、複数の個人を含むシーン内の全体的感情を識別することを目的としている。現在ある手法は、個々の関係をモデル化する際の視覚的な文脈情報の重要性を過小評価している。本稿では,GER性能を向上させるために,視覚的シーンコンテキストとラベル誘導意味情報を組み込んだ新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:25:39 GMT)
Learn Globally, Speak Locally: Bridging the Gaps in Multilingual Reasoning [39.0]
M2Aは,マルチスケール多言語アライメントと,機械翻訳された質問に対する言語一貫性報酬を組み合わせた新しい手法である。地理に基づく多言語事実推論ベンチマークであるGeoFact-Xと5言語での推論トレースを紹介する。以上の結果から,M2Aは数学的および事実的推論タスクにおいて,多言語推論の忠実度を著しく向上させることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:57:11 GMT)
Pixel Motion Diffusion is What We Need for Robot Control [38.9]
DAWNは言語条件のロボット操作のための統合拡散ベースのフレームワークである。高レベルの動き意図と低レベルのロボット動作を、構造化されたピクセルの動き表現を介してブリッジする。 DAWNは、挑戦的なCALVINベンチマークで最先端の結果を達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:59 GMT)
Unlearning Isn't Deletion: Investigating Reversibility of Machine Unlearning in LLMs [38.8]
大規模言語モデル(LLM)におけるアンラーニングは、指定されたデータを削除することを目的としているが、その効果は通常、正確性や複雑度のようなタスクレベルのメトリクスで評価される。最小限の微調整によって元の動作が容易に復元される間、モデルは忘れることができることを実証する。この表現可能性の現象は、情報は単に抑圧されているだけであり、真に消去されていないことを示唆している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:26:51 GMT)
PANICL: Mitigating Over-Reliance on Single Prompt in Visual In-Context Learning [38.7]
Visual In-Context Learning (VICL) は、インコンテキストペア(または例)と呼ばれる入力出力イメージペアを使用して、多様な視覚タスクの実行においてモデルをガイドするクエリイメージと併用する。 VICLは、単一のコンテキスト内のペアに対する過度な信頼性に悩まされることが多く、バイアスや不安定な予測につながることがある。我々は、複数のコンテキスト内ペアを活用することでこの問題を緩和する一般的なトレーニング不要のフレームワークである、PAtchベースの$k$-Nearestのビジュアル・インコンテキスト・ラーニング(PANICL)を紹介した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:13:40 GMT)
SpectrumWorld: Artificial Intelligence Foundation for Spectroscopy [38.7]
本稿では,分光学における深層学習研究の体系化と高速化を目的とした,先駆的な統一プラットフォームであるSpectrumLabを紹介する。 SpectrumLabには,重要なデータ処理と評価ツールを備えた包括的なPythonライブラリとリーダボード,限定されたシードデータから高品質なベンチマークを生成する革新的なSpectrumAnnotatorモジュールという,3つのコアコンポーネントが統合されている。私たちはSpectrumLabが、ディープラーニング駆動分光の今後の進歩の重要な基盤になることを期待しています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:39:16 GMT)
Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning [38.7]
自己アライメント(MASA)によるメタアウェアネスを高めるトレーニングパイプラインを設計する。既存のメタ認知推論モデルとは異なり、本手法は外部トレーニング源を必要としない。我々の戦略は、ドメイン内タスクの精度とトレーニング効率の両方において、大幅な改善をもたらす。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:05:48 GMT)
Trial and Trust: Addressing Byzantine Attacks with Comprehensive Defense Strategy [38.6]
本稿では、侵害されたクライアントが世界収束を遅らせるために敵の更新を注入する、ビザンチン攻撃という特定の脅威に対処する。信頼スコアの概念とトライアル関数の方法論を組み合わせることで、アウトレイラを動的にフィルタリングする。提案手法は,Byzantineノードが多数を占める場合でも機能を実現するため,従来のアプローチの限界に対処する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:49:28 GMT)
Justice in Judgment: Unveiling (Hidden) Bias in LLM-assisted Peer Reviews [38.5]
大規模言語モデル (LLM) の生成するピアレビューのバイアスを, センシティブなメタデータの実験により検討する。我々の分析は、共通の学術的ランキングに高いランクの機関を優先するアフィリエイトバイアスを一貫して示している。トークンベースのソフトレーティングでより明確になる暗黙のバイアスを明らかにする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:58:54 GMT)
Understanding the Effects of Miscalibrated AI Confidence on User Trust, Reliance, and Decision Efficacy [38.4]
ミススカラーAIの信頼性は、ユーザの適切な信頼を損なうとともに、AI支援による意思決定の有効性を低下させる。コミュニケーションAIの信頼度調整レベルは、AIの誤校正を検出するのに役立ちます。しかし、そのようなコミュニケーションは、未調整のAIに対するユーザの信頼を低下させるため、信頼性が低いため、意思決定の有効性は向上しない。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:48:29 GMT)
Language-Specific Latent Process Hinders Cross-Lingual Performance [38.4]
大規模言語モデル(LLM)は言語間移動が可能なが、異なる言語で書かれたのと同じクエリで入力されたときに一貫性のない出力を生成することができる。言語間の表現類似度を測定し,LLMの暗黙的なステップを解釈するためにロジットレンズを適用し,多言語多選択推論問題の解法を提案する。分析の結果,LLMは共通意味空間で作業するのではなく,言語間で異なる表現に依存しているため,不整合性を予測でき,精度が低いことが明らかとなった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:42:48 GMT)
Hilbert: Recursively Building Formal Proofs with Informal Reasoning [38.4]
大規模言語モデル(LLM)は、驚くべき数学的推論能力を示しているが、そのソリューションには自動検証できないエラーが含まれていることが多い。非公式な推論と形式的検証の相補的な強みを組み合わせたエージェントフレームワークであるHilbertを紹介する。我々のシステムは4つのコンポーネントを編成する: 数学的推論に優れる非公式のLLM、リーン4の戦術に最適化された特殊なLLM、形式検証器、意味定理検索器。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:24:23 GMT)
Evaluating and Improving Cultural Awareness of Reward Models for LLM Alignment [38.2]
リワードモデル(RM)は、大きな言語モデルと多様な文化の整合に不可欠である。既存のRM評価は、文化的に関連するデータセットが不足しているため、文化的意識を評価するには不十分である。文化意識リワードモデリングベンチマーク (CARB) を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:56:06 GMT)
SIU3R: Simultaneous Scene Understanding and 3D Reconstruction Beyond Feature Alignment [38.2]
エンド・ツー・エンドのインボディード・インボディード・システム開発において,同時理解と3次元再構築が重要な役割を担っている。提案するSIU3Rは,非ポーズ画像からの一般化可能な同時理解と3次元再構成のための,アライメントのない最初のフレームワークである。具体的には、SIU3Rは、ピクセル整列した3D表現でタスクの再構築と理解をブリッジし、複数の理解タスクを一組の学習可能なクエリに統一する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:45:01 GMT)
The First Impression Problem: Internal Bias Triggers Overthinking in Reasoning Models [38.1]
推論モデルは、冗長な推論ステップを特徴とする過度な思考を示すことが多い。我々は、入力問題によって引き起こされる内部バイアスを、そのような行動の鍵となる引き金とみなす。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:01:19 GMT)
Exploring Solution Divergence and Its Effect on Large Language Model Problem Solving [37.9]
より高度な解の発散は、様々なモデルにまたがるより良い問題解決能力に肯定的に関係していることを示す。 SFT戦略とRL戦略の両方をサポートする新しい指標として解の発散を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:27:50 GMT)
Learning What To Hear: Boosting Sound-Source Association For Robust Audiovisual Instance Segmentation [37.9]
既存の手法は2つの根本的な問題から生じる視覚バイアスに悩まされている。一様加法融合は、クエリが異なる音源に特化することを防ぎ、視覚のみの訓練目的は、クエリが任意の有意なオブジェクトに収束することを許している。クロスアテンションを用いた音声中心クエリ生成を提案し、各クエリは異なる音源に選択的に参加し、音声固有の先行情報を視覚的復号化することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:31:17 GMT)
Geo-R1: Improving Few-Shot Geospatial Referring Expression Understanding with Reinforcement Fine-Tuning [37.9]
リモートセンシングにおける表現理解の参照は、ユニークな課題である。数ショットの地理空間参照のための推論中心強化微調整(RFT)パラダイムであるGeo-R1を提案する。我々はGeo-R1を慎重に設計した3つの地理空間参照ベンチマークで検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:01:12 GMT)
Improving LLM-as-a-Judge Inference with the Judgment Distribution [37.8]
言語モデルを用いて、テキスト品質(LLM-as-a-judge)に関する人間の嗜好を近似する手法が、多くのタスクに適用可能な標準のプラクティスとなっている。判定分布の平均値を取ると、すべての評価設定においてモード(グレディ復号化)を連続的に上回ることがわかった。さらに, 評価分布から嗜好を導出する新たな手法について検討し, リスク回避を取り入れた手法により, 性能が向上することを見出した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:21:52 GMT)
Learning Personalized Driving Styles via Reinforcement Learning from Human Feedback [37.8]
生成軌道モデルのための人間のフィードバック駆動微調整フレームワークであるTrajHFを紹介する。 TrajHFは、マルチ条件デノイザと強化学習を人間のフィードバックで組み込んで、マルチモーダル軌道生成を洗練させる。 TrajHFは、NavSimベンチマークの最先端に匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:25:56 GMT)
On the Value of Cross-Modal Misalignment in Multimodal Representation Learning [37.8]
マルチモーダル表現学習は、モダリティ間でキューを整列させることにより、強力な表現を学習することを目的としている。最近の研究により、現実世界のデータセットは、しばしばモダクティブなミスアライメントを示すことが明らかになっている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:09:38 GMT)
Fast-Forward Lattice Boltzmann: Learning Kinetic Behaviour with Physics-Informed Neural Operators [37.7]
格子ボルツマン方程式(LBE)のための物理インフォームドニューラルネットワークフレームワークを提案する。我々のフレームワークは離散化不変であり、粗い格子で訓練されたモデルをより微細なものに一般化することができる。その結果,von Karman vortex shedding, ligament breakup, bubble adhesionなどの複雑な流れシナリオの堅牢性を示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:36:23 GMT)
SPATIALGEN: Layout-guided 3D Indoor Scene Generation [37.3]
本研究では,現実的でセマンティックに整合した室内シーンを生成するマルチビューマルチモーダル拡散モデルであるSpatialGenを提案する。 3次元レイアウトと参照画像が与えられたモデルでは、任意の視点から外観(カラー画像)、幾何学(シーン座標マップ)、意味(セマンティックセグメンテーションマップ)を合成する。私たちは、コミュニティを力づけ、屋内のシーン理解と生成の分野を前進させるために、データとモデルをオープンソース化しています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:23:26 GMT)
Hybrid Diffusion for Simultaneous Symbolic and Continuous Planning [37.3]
拡散モデルが複雑な意思決定を伴う長期的タスクに苦しむことを示す。本稿では,高レベルなシンボルプランを同時に生成することで連続軌道生成を向上することを提案する。これは、離散変数拡散と連続拡散の新たな混合を必要とし、ベースラインを劇的に上回ることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:06:26 GMT)
Can Diffusion Models Disentangle? A Theoretical Perspective [37.2]
本稿では,拡散モデルが非交叉表現を学習する方法を理解するための新しい理論的枠組みを提案する。我々は、一般的な非絡み付き潜在変数モデルの識別可能性条件を確立し、トレーニング力学を解析し、非絡み付き潜在部分空間モデルのサンプル複雑性境界を導出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:47:03 GMT)
Beyond Static Testbeds: An Interaction-Centric Agent Simulation Platform for Dynamic Recommender Systems [37.2]
RecInterは、リコメンダシステムのための新しいエージェントベースのシミュレーションプラットフォームである。 RecInterでは、ユーザーアクション(例えば、レビュー、購入など)をリアルタイムで動的に更新する。 Merchant Agentsは、より現実的で進化したエコシステムを育むことができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:01:40 GMT)
Retrieval-Augmented Generation with Hierarchical Knowledge [37.0]
グラフベースのRetrieval-Augmented Generation (RAG)法は,大規模言語モデル(LLM)の性能を大幅に向上させた。既存のRAG法は、人間の認知において自然に生ずる階層的知識を適切に利用していない。本稿では階層的知識を利用してRAGシステムの意味的理解と構造的捕捉能力を高める新しいRAG手法、HiRAGを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:37:04 GMT)
SRHand: Super-Resolving Hand Images and 3D Shapes via View/Pose-aware Neural Image Representations and Explicit 3D Meshes [36.9]
SRHand (Super-Resolution Hand) は、低解像度画像から手の詳細な3次元形状とテクスチャ画像の再構成方法である。具体的には、粗い入力画像のアップサンプリングにより、詳細ハンドを事前に学習する幾何学的認識型暗黙画像関数(GIIF)を導入する。提案手法は,手動データセットに適応した最先端画像アップサンプリング手法よりも優れていた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:34:34 GMT)
Resolving Ambiguity in Gaze-Facilitated Visual Assistant Interaction Paradigm [36.8]
実世界の応用におけるモデルの有効性を高めるために,視線情報を活用する新しい手法であるGLARIFYを導入する。本研究では,ユーザの視線パターンのノイズ特性を示すために,視線モダリティを用いた数百のサンプルを解析した。 GLARIFYはベースラインを著しく上回ることを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:02:40 GMT)
Beyond the Proxy: Trajectory-Distilled Guidance for Offline GFlowNet Training [36.6]
Trajectory-Distilled GFlowNet(TD-GFN)は、新しいプロキシフリートレーニングフレームワークである。逆強化学習を通じて、オフライン軌道から高密度で遷移レベルなエッジ報酬を学習する。コンバージェンス速度と最終サンプル品質の両方において、既存のベースラインを大きく上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:08:31 GMT)
ESGSenticNet: A Neurosymbolic Knowledge Base for Corporate Sustainability Analysis [36.5]
本稿では,持続可能性分析の知識基盤であるESGSenticNetを紹介する。 ESGSenticNetは、特殊概念解析、GPT-4o推論、および半教師付きラベル伝搬を統合するニューロシンボリックフレームワークから構築されている。 ESGSenticNetは、語彙的手法としてデプロイされると、より効果的に関連性があり実行可能なサステナビリティ情報をキャプチャする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:52:12 GMT)
Discrete Guidance Matching: Exact Guidance for Discrete Flow Matching [36.3]
この問題に対処するために、離散データのための新しいガイダンスフレームワークを提案する。学習した離散フローマッチングモデルにより、所望の分布の正確な遷移率を導出する。本稿では,エネルギー誘導型シミュレーションと嗜好アライメントによるテキスト・ツー・イメージ生成とマルチモーダル理解タスクの有効性を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:51:31 GMT)
Privacy Mechanism Design based on Empirical Distributions [36.3]
ポイントワイド最大リーク(ポイントワイド最大リーク、英: Pointwise maximal leakage、PML)は、定量的情報フローからの脅威モデルに基づく、アウトカムごとのプライバシー対策である。本稿では,このデータ生成分布を実証的に推定したPMLプライバシ評価とメカニズム設計のためのフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:46:59 GMT)
TAPTRv3: Spatial and Temporal Context Foster Robust Tracking of Any Point in Long Video [36.3]
通常のビデオではうまく機能するが、長いビデオでは失敗する傾向にあるポイントトラッキングフレームワークであるTAPTRv3を提案する。空間的および時間的文脈の両方を用いて、空間的および時間的次元に沿ってより優れた特徴クエリを実現する。 TAPTRv3は、挑戦的なデータセットの大部分でTAPTRv2をはるかに上回り、最先端のパフォーマンスを得る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:17:26 GMT)
Deepfakes: we need to re-think the concept of "real" images [36.2]
私たちは、現在の作業と以前の作業は、生成アルゴリズムと“フェイク”データサンプルに集中しすぎている、と論じています。基本的に現在の「フェイク」検出手法の開発と評価は、非常に古い「リアル」画像の低解像度データセットに頼っている。少なくとも、"本物の"イメージと新しいベンチマークデータセットの明確な技術的定義が必要です。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:40:13 GMT)
Unveiling the Potential of Diffusion Large Language Model in Controllable Generation [36.1]
最先端の自己回帰型大規模言語モデル(LLM)でさえ、構造化された出力を生成するために必要な場合、信頼性が低い。現在の拡散型大規模言語モデル(dLLM)に触発されて、アーキテクチャ上の違いが次世代の制御可能生成をアンロックする鍵であることに気付いた。本稿では,dLLMが安定して構造化された出力を生成できる新しいフレームワークであるSelf-Adaptive Scaffoldingを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:46:39 GMT)
MCGM: Multi-stage Clustered Global Modeling for Long-range Interactions in Molecules [36.0]
MCGM(Multi-stage Clustered Global Modeling)は、幾何学的GNNに階層的グローバルコンテキストを与える軽量なプラグアンドプレイモジュールである。 AQMでは、MCGMはニューラルP3Mよりも20%少ないパラメータを使用しながら、最先端の精度(エネルギーは17.0 meV、力は4.9 meV/AA)を達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:06:47 GMT)
Soft-Di[M]O: Improving One-Step Discrete Image Generation with Soft Embeddings [36.0]
Masked Diffusion Models (MDMs) から蒸留した1ステップの発電機は、複数のサンプリングステップを1つの前方パスに圧縮する。彼らは教師からモデリングバイアスを受け継ぎ、それぞれのトークンはブロック勾配の流れを出力する。我々は、離散トークンをジェネレータの出力分布下で期待される埋め込みに置き換える単純な緩和であるソフト埋め込みを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:51:20 GMT)
A Law of Data Reconstruction for Random Features (and Beyond) [35.9]
大規模なディープラーニングモデルは、トレーニングセットの一部を記憶することが知られている。モデル内のパラメータs$p$が、トレーニングサンプルs$n$よりも大きい場合、これを実現できることを示す。我々の結果はデータ再構成の法則を明らかにしており、トレーニングデータセット全体が$p$が$dn$を超えると、回復できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:29:23 GMT)
You Can't Steal Nothing: Mitigating Prompt Leakages in LLMs via System Vectors [35.8]
大規模言語モデル(LLM)は様々なアプリケーションで広く採用されており、多様なタスクにカスタマイズされたシステムプロンプトを活用している。本稿では,そのようなリスクを明らかにするために,単純かつ効果的なプロンプトリーク攻撃を提案する。本稿では,システムプロンプトを生テキストではなく内部表現ベクトルとして符号化するSysVecを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:17:38 GMT)
Think-on-Graph 3.0: Efficient and Adaptive LLM Reasoning on Heterogeneous Graphs via Multi-Agent Dual-Evolving Context Retrieval [35.7]
Think-on-Graph 3.0 (ToG-3) は、制約を克服するためにMulti-Agent Context Evolution and Retrieval (MACER) メカニズムを導入した新しいフレームワークである。我々の中心となる革新は、チャンク・トリプレット・コミュニティ・ヘテロジニアスグラフ指数の動的構築と洗練である。マルチエージェントシステムは、エビデンス検索、回答生成、十分性、そして決定的に進化するクエリとサブグラフの反復的なプロセスに関与する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:13:10 GMT)
GraphSearch: An Agentic Deep Searching Workflow for Graph Retrieval-Augmented Generation [35.7]
textscGraphSearchは、GraphRAGの二重チャネル検索を備えた新しいエージェントディープ検索ワークフローである。 textscGraphSearchは、従来の戦略よりも解答精度と生成品質を一貫して改善する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:45:56 GMT)
Beyond Shallow Behavior: Task-Efficient Value-Based Multi-Task Offline MARL via Skill Discovery [35.6]
オフラインのMARLは、オフラインデータセットのみから優れたポリシを学ぶ。本稿では,タスク効率の高いマルチタスクオフラインMARLアルゴリズムであるSkill-Discovery conservative Q-Learning (SD-CQL)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:50:30 GMT)
Self-Guidance: Boosting Flow and Diffusion Generation on Their Own [35.6]
自己誘導(SG)は、低品質サンプルの生成を抑えることにより、生成画像の品質を著しく向上させることができる。 SGは、異なる雑音レベルにおける元の拡散または流れモデルのサンプリングスコア関数に依存する。我々は、異なるアーキテクチャでテキスト・ツー・イメージとテキスト・ツー・ビデオ生成に関する広範な実験を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:47:13 GMT)
Automated Facility Enumeration for Building Compliance Checking using Door Detection and Large Language Models [35.4]
ビルコンプライアンスチェック(BCC)は、建設施設が規制基準を満たすことを保証するための重要なプロセスである。その重要性にもかかわらず、この問題はほとんど文献で見過ごされてきた。大規模言語モデル(LLM)の最近の進歩は、自動化を強化する新たな機会を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:31:47 GMT)
No Prompt Left Behind: Exploiting Zero-Variance Prompts in LLM Reinforcement Learning via Entropy-Guided Advantage Shaping [35.3]
ゼロ分散プロンプトから学習信号を抽出する新しいアルゴリズムであるゼロ分散プロンプト(RL-ZVP)を導入する。 RL-ZVPは、応答を対比することなく、直接正しさを報償し、エラーを罰する。 6つの数学推論ベンチマークで、RL-ZVPはGRPOよりも最大8.61ポイント、パスレート7.77ポイントの大幅な改善を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:03:54 GMT)
Learning Flexible Forward Trajectories for Masked Molecular Diffusion [35.3]
仮面拡散モデル (MDMs) は離散データのモデリングにおいて顕著な進歩を遂げているが、分子生成におけるそのポテンシャルは未解明のままである。標準MDMを適用すると、性能が著しく低下するという驚くべき結果が紹介される。本研究では, 分子グラフ間の衝突を避けるため, 要素ごとの分解軌道を編成するMasked Element-wise Learnable Diffusion (MELD)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:42:34 GMT)
Dynamic Experts Search: Enhancing Reasoning in Mixture-of-Experts LLMs at Test Time [35.3]
テスト時間スケーリング(TTS)は、推論中にさらなる計算を割り当てることで、大規模言語モデル(LLM)の推論能力を高める。本稿では,エキスパートアクティベーションを検索空間の制御可能な次元に高めるTTS戦略であるDynamic Experts Search (DES)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:49:10 GMT)
EMMA: Generalizing Real-World Robot Manipulation via Generative Visual Transfer [35.3]
視覚言語アクション(VLA)モデルは、堅牢な一般化を達成するために、多種多様なトレーニングデータに依存している。本稿では,VLAポリシー拡張フレームワークであるEmbodied Manipulation Media Adaptation (EMMA)を提案する。 DreamTransferは、3D構造や幾何学的妥当性を損なうことなく、ロボットビデオのテキスト制御による視覚的編集、前景、背景、照明条件の変換を可能にする。 AdaMixは、動的にトレーニングバッチを再重み付けして、知覚的あるいは運動学的に困難なサンプルに最適化する、ハードサンプル対応のトレーニング戦略である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:34:44 GMT)
PDV: Prompt Directional Vectors for Zero-shot Composed Image Retrieval [35.2]
Composed Image Retrieval (ZS-CIR) は、大規模なペアデータで訓練された特殊なテキスト画像合成ネットワークを必要とせず、参照画像とテキストプロンプトを用いた画像検索を可能にする。 textbfPrompt Directional Vector (PDV)は、ユーザプロンプトによって誘導されるセマンティックな修正をキャプチャする、シンプルで効果的なトレーニング不要拡張である。 PDVは、3つの重要な改善を可能にしている。(1) 即時調整をスケーリング係数で制御可能な動的合成テキスト埋め込み、(2) テキストプロンプトから画像特徴へのセマンティックトランスファーによる合成画像埋め込み、(3) 合成テキストと画像埋め込みの重み付け融合である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:06:35 GMT)
A Machine Learning Pipeline for Multiple Sclerosis Biomarker Discovery: Comparing explainable AI and Traditional Statistical Approaches [35.2]
多発性硬化症(MS)におけるバイオマーカー発見のための機械学習パイプラインを提案する。頑健な前処理の後、ベイズ探索により最適化されたXGBoost分類器を訓練した。以上の結果より,SHAPとDEAの重なり合いと特異なバイオマーカーの両者が明らかとなり,相補的強度が示唆された。この研究は、説明可能なAI(xAI)と従来の統計手法を組み合わせることの価値を強調し、疾患のメカニズムについて深い洞察を得る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:31:34 GMT)
Position IDs Matter: An Enhanced Position Layout for Efficient Context Compression in Large Language Models [34.9]
文脈情報を圧縮するために特別なトークンを使うことは、大規模言語モデル(LLM)の一般的な慣習である。位置IDの調整のみでLLMの文脈圧縮能力を向上させる手法であるtextbfEnhanced Position Layout (EPL) を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:19:34 GMT)
AMANDA: Agentic Medical Knowledge Augmentation for Data-Efficient Medical Visual Question Answering [34.9]
LLMエージェントを介して医療知識を増強するトレーニングフリーエージェントフレームワークであるAMANDAを提案する。 8つのMed-VQAベンチマークの実験では、ゼロショットと少数ショットのMed-VQA設定の両方で大幅に改善されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:22:25 GMT)
SurvDiff: A Diffusion Model for Generating Synthetic Data in Survival Analysis [34.9]
生存分析は、転移、疾患再発、または患者の死亡などの時間と時間の結果をモデル化することによって臨床研究の基盤となる。 SurvDiffは、生存分析において合成データを生成するために特別に設計されたエンドツーエンドの拡散モデルである。シュルブディフは、複数の医療データセットにおける分布的忠実度と下流評価指標の両方において、最先端の世代ベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:50:29 GMT)
Error Analysis of Discrete Flow with Generator Matching [34.8]
我々は、離散フローモデルの理論的性質を研究するために、計算理論に基づく統一的な枠組みを開発する。具体的には、遷移速度の異なる2つの連続時間マルコフ連鎖に関する2つの経路測度のKLばらつきを導出する。遷移速度推定と早期停止から生じる誤差を包括的に分析する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:41:45 GMT)
DeHate: A Stable Diffusion-based Multimodal Approach to Mitigate Hate Speech in Images [34.8]
本稿では,デジタルコンテンツにおけるヘイトを識別するためのマルチモーダルデータセットを提案する。我々は,Digital Attention Analysis Module (DAAM)と組み合わせた透かし,安定性向上,安定拡散技術を適用した。この組み合わせは、画像内の憎しみのある要素をピンポイントし、それによって詳細な憎しみの注意マップを生成するのに役立ちます。マルチモーダルデハティフィケーションタスク用に設計された視覚言語モデルであるDeHaterを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:42:59 GMT)
BrainPro: Towards Large-scale Brain State-aware EEG Representation Learning [34.5]
最近の脳波基礎モデルでは、従来の復号法よりも性能と一般化性が向上している。既存のモデルでは、チャネル間およびリージョン間相互作用を明示的にキャプチャできない場合が多い。 BrainProは9つのパブリックBCIデータセットで最先端のパフォーマンスと堅牢な一般化を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:34:04 GMT)
From Formal Language Theory to Statistical Learning: Finite Observability of Subregular Languages [34.4]
我々は,すべての標準正規言語クラスが決定述語で表される場合,線形に分離可能であることを証明した。合成実験は、雑音のない条件下での完全分離性を確認し、一方、英語形態学における実データ実験は、学習された特徴がよく知られた言語的制約と一致することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:17:15 GMT)
Multimodal Slice Interaction Network Enhanced by Transfer Learning for Precise Segmentation of Internal Gross Tumor Volume in Lung Cancer PET/CT Imaging [34.4]
PET/CT画像における肺腫瘍内腫瘍容積(IGTV)は肺がんに対する最適な放射線治療に重要である。我々は,MAMBAを用いたマルチモーダル対話型知覚ネットワークを用いた伝達学習手法を提案する。 2.5Dセグメンテーションフレームワーク内にスライス相互作用モジュール(SIM)を導入し,スライス間関係を効果的にモデル化する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:48:08 GMT)
A Flux-Tunable cavity for Dark matter detection [34.3]
超伝導3次元マイクロ波空洞と直流束可変SQUIDを結合させて電子的に調整可能な空洞構造を構築する。キャビティ内で高いコヒーレンスを維持するために設計されたフラックス配信システムを用いて、量子制限しきい値以下の暗黒物質探索を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:52:57 GMT)
MOSS-ChatV: Reinforcement Learning with Process Reasoning Reward for Video Temporal Reasoning [34.2]
マルチモーダル大言語モデル(MLLM)の重要機能としてビデオ推論が登場した既存のMLLMは、最終回答が正しい場合でも、中間的推論がビデオダイナミクスから漂流するプロセスの不整合を示すことが多い。動的時間ウォーピング(DTW)に基づくプロセス報酬を備えた強化学習フレームワークであるMOSS-ChatVを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:41:48 GMT)
Leveraging Model Guidance to Extract Training Data from Personalized Diffusion Models [34.2]
拡散モデル(DM)は強力な画像生成ツールとなっている。多くの人がオンラインで微調整されたチェックポイントをアップロードし、CivitaiやHuggingFaceといったコミュニティを育てている。オンラインで共有されているこれらの微調整されたDMからトレーニングデータを抽出するか? 微調整データを抽出するフレームワークであるFineXtractを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:37:14 GMT)
Expanding Reasoning Potential in Foundation Model by Learning Diverse Chains of Thought Patterns [34.2]
我々は,基礎モデルの推論可能性について,疑問に正しく答えるために必要な独立した試みの数の逆として初めて定義する。次に、高価値推論パターンを付加した多種多様なデータを活用し、推論可能性を拡張することを提案する。 85A6B Mixture-of-Experts (MoE) モデルは, AIME 2024 と 2025 の挑戦に対して 9.58% 改善可能である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:10:45 GMT)
DiTraj: training-free trajectory control for video diffusion transformer [34.1]
軌道制御は、制御可能なビデオ生成におけるユーザフレンドリなタスクを表す。提案するDiTrajは,DiTに適したテキスト・ビデオ生成におけるトラジェクトリ制御のためのトレーニングフリーフレームワークである。提案手法は,映像品質とトラジェクトリ制御性の両方において,従来の手法よりも優れていた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:53:31 GMT)
DriveAgent-R1: Advancing VLM-based Autonomous Driving with Active Perception and Hybrid Thinking [34.0]
本稿では,計画のためのアクティブな認識が可能な最初の自律運転エージェントであるDriveAgent-R1を紹介する。複雑なシナリオでは、DriveAgent-R1は視覚的推論を行うためのツールを積極的に呼び出し、その決定を視覚的証拠にしっかりと基礎づける。本稿では,人間ドライバーの認知パターンにインスパイアされたハイブリッド思考フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:14:08 GMT)
Quantum-limited optical delay sensing across an enhanced dynamic range by frequency-resolving two-photon interference [34.0]
ホン・ウー・マンデル干渉計は高精度センシングの有効なツールであるが、ダイナミックレンジと測定精度の基本的なトレードオフに直面している。この制限を克服するため、2つの干渉光子の周波数をサンプリングし、時間領域の感度を高める。これにより、未解決推定値の最大20倍の光学遅延推定のダイナミックレンジが向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:01:00 GMT)
Robot Learning from Any Images [33.9]
このフレームワークは、任意のWildイメージを対話型で物理対応のロボット環境に変換するものだ。従来の方法とは異なり、RoLAは追加のハードウェアやデジタルアセットを必要とせずに、単一のイメージ上で直接動作する。我々は、スケーラブルなロボットデータ生成と拡張、インターネットイメージからのロボット学習、マニピュレータとヒューマノイドのためのシングルイメージのリアルタイムシステムなど、RoLAの汎用性を実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:10:34 GMT)
Learnable Kernel Density Estimation for Graphs [33.5]
グラフ密度推定の鍵となる課題は、構造パターンと意味的バリエーションの両方を捉えることである。本研究は,グラフのカーネル密度推定を学習するLGKDEフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:51:37 GMT)
Closing the Oracle Gap: Increment Vector Transformation for Class Incremental Learning [33.2]
クラスインクリメンタルラーニング(CIL)は,従来学習していたクラスを忘れずに,新しいクラスの知識を逐次取得することを目的としている。線形モード接続性(LMC)に関する最近の知見から着想を得て,インクリメントベクトル変換(IVT)を提案する。 IVTは、モデルのパラメータを、以前のタスク最適に線形接続を維持する変換されたソリューションに定期的にテレポートする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:31:59 GMT)
FERD: Fairness-Enhanced Data-Free Robustness Distillation [33.1]
本稿では,Fairness-Enhanced data-free Robustness Distillation (FERD) フレームワークを提案する。 FERDは、あらゆる敵攻撃の下で最先端の最悪のクラスロバスト性を達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:40:58 GMT)
Content-Aware Mamba for Learned Image Compression [33.1]
本稿では,その処理を画像コンテンツに動的に適応させるSSMであるContentAware Mamba(CAM)を紹介する。まず、厳密なスキャンをコンテンツ適応型トークン置換戦略に置き換える。第二に、状態空間モデルにサンプル固有のグローバルプリエントを注入することで、シーケンシャルな依存関係を克服する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:32:40 GMT)
Learning to Detect Relevant Contexts and Knowledge for Response Selection in Retrieval-based Dialogue Systems [32.9]
我々はtextbfContext と textbfKnowledge コレクションの関連部分を textbfDetect で検出できる multi-turn textbfResponse textbfSelection textbfModel を提案する。我々のモデルは、まず、単語レベルと発話レベルのセマンティクスにおいて、コンテキストと知識コレクションの関連部分を事前に選択するために、最近のコンテキストをクエリとして使用する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:53:29 GMT)
TRUST: Test-Time Refinement using Uncertainty-Guided SSM Traverses [32.9]
State Space Models (SSMs) は視覚変換器 (ViTs) の効率的な代替品として登場した。入力画像の複数の因果的視点を生成する新しいテスト時間適応(TTA)手法であるTRUSTを提案する。 7つのベンチマーク実験により、TRUSTは一貫してロバスト性を改善し、既存のTTAメソッドより優れていることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:19:25 GMT)
Towards Generalizable Implicit In-Context Learning with Attention Routing [32.9]
In-Context Routing (ICR) は、注意ログレベルにおいて一般化可能なICLパターンを内部化する新しい暗黙のICL手法である。多様なドメインと複数の大規模言語モデルにまたがる12の実世界のデータセット上でICRを評価した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:05:45 GMT)
Can Synthetic Query Rewrites Capture User Intent Better than Humans in Retrieval-Augmented Generation? [32.8]
マルチターンRAGシステムは、しばしば口語省略と曖昧な参照を伴うクエリに直面する。アノテータの表現力の限界と理解の深さのため、手動で書き直したクエリは現実世界のRAGシステムで必要とされるものとは異なることが多い。ユーザ意図に適合した高品質な合成リライトを生成するための合成データ駆動型クエリリライトモデルであるSynRewriteを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:23:01 GMT)
Sequential 1-bit Mean Estimation with Near-Optimal Sample Complexity [32.7]
1ビット通信制約を用いた分散平均推定問題について検討する。私たちの推定器は、有界平均$-lambda le mathbbE(X) le lambda $)と変数$mathrmVar(X) le sigma2$)を持つすべてのディストリビューションに対して$(epsilon, delta)$-PACです。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:22:57 GMT)
Fine-Grained Uncertainty Decomposition in Large Language Models: A Spectral Approach [32.5]
本稿では,大規模言語モデルにおける不確実性を定量化し,分解する新しい手法であるスペクトル不確実性を紹介する。既存のベースライン法とは異なり、本手法は意味的類似性のきめ細かい表現を取り入れている。実験的評価により、スペクトル不確かさは、アレタリックとトータル不確実性の両方を推定する最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:39:10 GMT)
T-TAMER: Provably Taming Trade-offs in ML Serving [32.5]
我々は、この設定を多段階決定プロセスとして定式化する一般的なフレームワーク、T-Tamerを提案する。我々の主な結果は、リコールは、証明可能なパフォーマンス保証を達成するのに必要であり、十分であることを示している。その結果、リコールベースの戦略は効率のよいレイテンシトレードオフをもたらすことがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:08:03 GMT)
Group Critical-token Policy Optimization for Autoregressive Image Generation [32.5]
主な障害は、AR生成中によりクリティカルな画像トークンを識別し、それらに対して効果的なトークンワイズ最適化を実装する方法にある。具体的には、3つの観点からRLVRベースのAR生成における重要なトークンを識別する: $textbf(1)$ CausalDepend: 初期トークンは、一方向依存性による後のトークンと最終的な画像効果を根本的に決定する。 ARモデルと統合マルチモーダルモデルのための複数のテキスト・画像ベンチマーク実験は、その効果を実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:33:18 GMT)
Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents [32.4]
本稿では,自己改善型AIであるDarwin G"odel Machine(DGM)を紹介する。ダーウィンの進化とオープンエンドネスの研究に触発されたDGMは、生成されたコーディングエージェントのアーカイブを維持している。エージェントをサンプリングし、ファンデーションモデルを使用して、サンプルされたエージェントの新しい、興味深いバージョンを作成することで、アーカイブを成長させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:36:03 GMT)
EntropyLong: Effective Long-Context Training via Predictive Uncertainty [32.4]
長距離依存関係をキャプチャするための長期コンテキスト言語モデルのトレーニングには、特別なデータ構築が必要である。本研究では,予測不確実性を利用して依存性の品質を検証する新しいデータ構築手法であるEntropyを提案する。提案手法は,文書中の高エントロピー位置を特定し,大規模コーパスから意味論的に関連づけられたコンテキストを抽出し,予測エントロピーを減少させるかどうかを判断して有用性を検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:38:08 GMT)
A minimalist self-differencing gating scheme for dead-time-free single-photon avalanche diodes at high repetition rate [32.2]
焼成されたSPAD検出器は量子通信や量子コンピューティングのセットアップで広く使われている。本稿では,自己差分法に基づく高繰り返しレート(100MHz)正弦波ゲートSPADに関する新しいスキームを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:11:08 GMT)
MACD: Multi-Agent Clinical Diagnosis with Self-Learned Knowledge for LLM [32.1]
大規模言語モデル(LLM)は医学的応用において顕著な可能性を示している。本研究は,新しいMulti-Agent Clinical Diagnosis (MACD) フレームワークを提案する。 LLMはマルチエージェントパイプラインを通じて自己学習型臨床知識を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:33:31 GMT)
Infusing Theory of Mind into Socially Intelligent LLM Agents [31.9]
心の理論 (ToM) は人間の社会知性の重要な側面である。 ToMを明示的に用いたソーシャルエージェントは対話性が向上し、より効果的に目標を達成できることを示す。 ToMA(Tomagent)は,ToMに着目した対話エージェントである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:07:34 GMT)
Multilingual Dialogue Generation and Localization with Dialogue Act Scripting [31.8]
対話行為スクリプト(英: Dialogue Act Script、DAS)は、抽象目的表現から多言語対話を符号化し、ローカライズし、生成するための構造化されたフレームワークである。 DASは言語間の柔軟なローカライゼーションをサポートし、翻訳を緩和し、より流動的で自然主義的な会話を可能にする。イタリア語、ドイツ語、中国語の人間の評価は、DASが生成する対話は機械と人の両方の翻訳者によって生成されるものよりも一貫して優れていることを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:09:08 GMT)
Erase or Hide? Suppressing Spurious Unlearning Neurons for Robust Unlearning [31.8]
Webスケールのデータに基づいてトレーニングされた大規模な言語モデルは、プライベートまたはセンシティブな知識を記憶し、重大なプライバシーリスクを生じさせる。いくつかの未学習の手法は、その後の訓練中に「再学習」に弱いままであり、忘れられた知識のかなりの部分が再浮上する。 Ssiuuは、帰属指導による正規化を取り入れた新しい学習方法であり、刺激的なネガティブな影響を防ぎ、ターゲット知識を忠実に除去する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:27:23 GMT)
Taxonomy of Comprehensive Safety for Clinical Agents [31.8]
TACOSは、安全フィルタリングとツールの選択を単一のユーザ意図の分類ステップに統合する、きめ細かい21クラスの分類である。フレームワークを検証するため、TACOSアノテーション付きデータセットをキュレートし、広範な実験を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:22:59 GMT)
Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning [31.7]
本稿では,最初の統一マルチモーダルCoT型報酬モデルUnifiedReward-Thinkを提案する。まず、GPT-4oの推論過程を抽出するために、少量の画像生成嗜好データを用いる。次に、大規模に統一されたマルチモーダル嗜好データを作成し、様々な視覚タスクにわたってモデルの推論プロセスを導出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:30:36 GMT)
Can Prompts Rewind Time for LLMs? Evaluating the Effectiveness of Prompted Knowledge Cutoffs [31.6]
大規模言語モデル(LLM)は時間的予測に広く用いられているが、事前学習データへの依存は汚染の懸念を引き起こす。 LLMにおける初期の知識遮断をシミュレートする能力について検討する。以上の結果から, 即時的知識カットオフは, その日以降の情報を直接クエリした場合の有効性を示すが, 忘れた内容が直接問い合わせられるのではなく, 慎重にクエリに関連付けられている場合, 忘れることの誘発に苦慮していることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:37:44 GMT)
Learning the Wrong Lessons: Syntactic-Domain Spurious Correlations in Language Models [31.6]
構文テンプレート -- Part-of-Speech(PoS)タグの頻繁なシーケンス -- は、トレーニングデータで一般的であり、しばしばモデル出力に現れる。本研究では,タスク・インストラクション・ペアにおける構文テンプレート,ドメイン,セマンティクスを特徴付ける。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:37:41 GMT)
Diverse Subset Selection via Norm-Based Sampling and Orthogonality [31.6]
大きな注釈付きデータセットはディープニューラルネットワークの成功には不可欠だが、医療画像のような領域ではラベル付けデータは非常に高価である。この研究はサブセット選択の問題に取り組み、アノテーションのために大きなラベル付けされていないプールから最も情報に富んだ例の小さなセットを選択する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:04:24 GMT)
HD-PiSSA: High-Rank Distributed Orthogonal Adaptation [31.2]
HD-PiSSAは、異なるデバイスにまたがるアダプタを初期化する分散PEFTアプローチである。これにより、データ並列のLoRAやPiSSAよりも16倍以上の効果的な更新ランクが得られる。マルチタスク設定では、HD-PiSSAはLoRAよりも10.0絶対点(14.63%)、PiSSAより4.98点(6.60%)の平均ゲインを達成している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:49:44 GMT)
Doubly-Robust LLM-as-a-Judge: Externally Valid Estimation with Imperfect Personas [31.2]
本稿では,評価サンプリングバイアスに対処するために,2倍のロバスト推定フレームワークを提案する。このアプローチの鍵となるのは、評価者が人間のレーダとして振る舞うように促すことによって生成される「ペルソナ」格付けを使用することです。提案手法は,aとaとaとaとaとaとaとaとaとaとaとaとaとaとaとaとaとaとaとととa
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:42:51 GMT)
FAST: Foreground-aware Diffusion with Accelerated Sampling Trajectory for Segmentation-oriented Anomaly Synthesis [30.8]
本稿では,Anomaly-Informed Accelerated Smpling (AIAS) とForeground-Aware Restruction Module (FARM) の2つの新しいモジュールを特徴とする,フォアグラウンド対応拡散フレームワークを提案する。 AIAS(AIAS)は、セグメンテーション指向の産業的異常合成のために特別に設計された訓練不要サンプリングアルゴリズムである。 FARMは、サンプリングステップ毎にマスクされた前景領域内の異常認識ノイズを適応的に調整し、復調軌跡全体にわたって局所的な異常信号を保存する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:41:01 GMT)
Counterfactual Visual Explanation via Causally-Guided Adversarial Steering [30.2]
対物的視覚的説明に関する最近の研究は、人工知能モデルをより説明しやすいものにするために貢献している。これらのアプローチは、画像生成プロセスの背後にある因果関係と突発的な相関を無視する。本稿では、まず因果的に誘導された逆法を利用して、対実的説明を生成する新しいフレームワークCECASを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:16:30 GMT)
Resource Consumption Red-Teaming for Large Vision-Language Models [30.2]
大規模言語モデル(LLM)の展開に対する重大な脅威として、リソース消費攻撃(RCA)が出現している。視覚モダリティの統合により、大規模視覚言語モデル(LVLM)におけるRCAのリスクが増大する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:25:36 GMT)
A Unified Empirical Risk Minimization Framework for Flexible N-Tuples Weak Supervision [30.2]
経験的リスク最小化に基づく一般的なN-tuples学習フレームワークを提案する。我々は,N-tuples学習タスク間の一般化を継続的に改善していることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:30:32 GMT)
GeoSplat: A Deep Dive into Geometry-Constrained Gaussian Splatting [29.8]
まず,一階数と二階数の両方の幾何量を利用する一般幾何学制約最適化フレームワークGeoSplatを提案する。次に,我々のフレームワークに動的幾何学的事前情報を提供する,効率的かつノイズロバストな推定手法を提案する。我々は、新しいビュー合成のための複数のデータセットに関する広範な実験を行い、我々のフレームワークであるGeoSplatはガウススプラッティングの性能を大幅に向上させることを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:09:08 GMT)
Functional Critic Modeling for Provably Convergent Off-Policy Actor-Critic [29.7]
本稿では,機能的批判モデルという新しい概念を導入し,新たなACフレームワークを提案する。線形関数設定の理論的解析を行い、我々のフレームワークの証明可能な収束を確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:55:26 GMT)
Large Pre-Training Datasets Don't Always Guarantee Robustness after Fine-Tuning [29.7]
我々は、微調整モデルにおけるロバストネスの保存性を評価するために、ロバストネス継承ベンチマーク(ImageNet-RIB)を提案する。微調整は事前訓練されたモデル間の堅牢性を低下させる。最大および最も多様なデータセットで事前訓練されたモデルは、小さなデータセットを微調整した後、より大きなロバスト性損失と低い絶対ロバスト性の両方を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:57:05 GMT)
Death of the Novel(ty): Beyond n-Gram Novelty as a Metric for Textual Creativity [29.6]
N-gramノベルティは、トレーニングデータ以外のテキストを生成する言語モデルの能力を評価するために広く利用されている。我々は,この創造性の概念とn-gramの新規性との関係を,人間とAIが生成したテキストの密読を通して検討する。我々は,n-gramの新規性は,専門家が判断する創造性と肯定的に関連しているのに対し,n-gramの新規性によるトップクァアタイル表現の91%は創造性とは判断されないことがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:05 GMT)
Customizing Visual Emotion Evaluation for MLLMs: An Open-vocabulary, Multifaceted, and Scalable Approach [29.5]
この矛盾は, 既存の評価手法の制約に起因していると論じる。これらの制約を克服する感情文判断タスクを提案する。人間の努力を最小限に抑えて感情中心の文を効率的に構築する自動パイプラインを考案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:30:39 GMT)
REMA: A Unified Reasoning Manifold Framework for Interpreting Large Language Model [29.4]
推論多様体(Reasoning Manifold)は、すべての正しく推論された世代に対応する内部表現によって形成される潜在低次元幾何学構造である。誤りと正しい推論サンプルに対応する内部モデル表現の空間的関係を定量的に比較することにより,障害の起源を説明するフレームワークであるREMAを構築した。多様な言語およびマルチモーダルモデルおよびタスクに関する実験は、推論多様体の低次元の性質と誤った推論表現と正しい推論表現の間の高い分離性を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:02:27 GMT)
CircuitSense: A Hierarchical Circuit System Benchmark Bridging Visual Comprehension and Symbolic Reasoning in Engineering Design Process [29.4]
エンジニアリング設計は、システム仕様からコンポーネント実装までの階層的な抽象化を通して行われる。 MLLM(Multi-modal Large Language Models)は自然画像のタスクに優れるが、技術図から数学的モデルを抽出する能力はいまだ解明されていない。 textbfCircuitSenseは、コンポーネントレベルのスキーマからシステムレベルのブロックダイアグラムにまたがる8,006以上の問題を通じて、この階層の回路理解を評価するベンチマークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:32:14 GMT)
Synthetic Dialogue Generation for Interactive Conversational Elicitation & Recommendation (ICER) [29.2]
本研究では,行動シミュレータとLM-promptingを用いた自然な対話を生成する手法を開発した。提案手法は,好みの推論とサンプルのクオリティを併用した,大規模でオープンソースのCRSデータセットを作成したものである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:53:44 GMT)
Astraea: A Token-wise Acceleration Framework for Video Diffusion Transformers [29.1]
ビデオ拡散変換器(vDiTs)は、テキストからビデオへの生成において大きな進歩を遂げているが、その計算要求は、実用的な展開において大きな課題となっている。 Astraeaは,vDiTをベースとしたビデオ生成の最適に近い構成を,パフォーマンス目標下で検索するフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:32:05 GMT)
Context and Diversity Matter: The Emergence of In-Context Learning in World Models [29.1]
本研究では,文脈内環境学習(ICEL)について検討し,ゼロショット性能から世界モデルの成長と限界へ注目を移す。我々は,(1)世界モデルの文脈内学習を形式化し,環境認識と環境学習という2つの中核的なメカニズムを同定し,(2)そのメカニズムの出現を露呈する2つのメカニズムのエラー上限を導出する,(3)世界モデルに異なるICL機構が存在することを実証的に確認する,という3つの貢献である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:50:32 GMT)
Octic Vision Transformers: Quicker ViTs Through Equivariance [29.0]
我々は幾何学的対称性を捉えるためにOctic Vision Transformer (octic ViTs)を導入する。われわれの八面体線形層はFLOPの5.33倍、メモリの8倍の低減を実現している。我々は ImageNet-1K 上で octic ViT (DeiT-III) と unsupervised (DINOv2) を訓練する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:59:43 GMT)
GoalRank: Group-Relative Optimization for a Large Ranking Model [28.8]
我々は、常に最適なランキングポリシーに対する厳密な近似誤差を達成するジェネレータのみのモデルが存在すると論じる。ジェネレータのみのランキングフレームワークであるGoalRankを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:32:16 GMT)
Light Differentiable Logic Gate Networks [28.8]
微分論理ゲートネットワーク(DLGN)は、競合精度を保ちながら、推論において極めて効率が高い。しかし、勾配の消失、離散化エラー、高いトレーニングコストは、これらのネットワークのスケーリングを妨げる。これらの問題の根本原因は論理ゲートニューロン自体のパラメトリゼーションにあることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:44:51 GMT)
MultiCrafter: High-Fidelity Multi-Subject Generation via Spatially Disentangled Attention and Identity-Aware Reinforcement Learning [28.8]
マルチオブジェクト画像生成は、ユーザが提供する対象を1つの画像で合成することを目的としている。既存の手法は、単純な再構築に基づく目的への依存によって制限される。提案するMultiCrafterは,高忠実で嗜好に整合した生成を実現するフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:41:43 GMT)
Task-Adaptive Parameter-Efficient Fine-Tuning for Weather Foundation Models [28.8]
We introduced WeatherPEFT, a novel PEFT framework for Weather Foundation Models (WFMs) Task-Tu Dynamic Prompting (TTu) は、内部および外部パターン抽出によってトレーニング済みのバックボーンの入力トークンにエンコーダ内の埋め込み重みを注入する。フィッシャーガイド適応選択 (Fisher-Guided Adaptive Selection, SFAS) は、訓練済みの知識を保ちながら、その選択を安定化させ、最もタスククリティカルなランダム性を特定する。既存のPEFT法ではフルチューニングとWeatherPEFT性能が同等であるのに対し,既存のPEFT法では大きな差がみられ,WeatherPEFTの有効性と効率が示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:54:05 GMT)
InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.7]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。 InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:44:09 GMT)
SelfJudge: Faster Speculative Decoding via Self-Supervised Judge Verification [28.6]
本稿では,対象モデルの自己監督により検証者の判断を訓練するSelfJudgeを提案する。本手法は,トークン置換応答が本来の応答の意味を保っているかどうかを評価することによって意味保存を測定する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:21:12 GMT)
Think Smart, Not Hard: Difficulty Adaptive Reasoning for Large Audio Language Models [28.6]
大規模音声言語モデル(LALM)は、顕著な推論能力を示している。 LALMの難易度適応推論法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:49:14 GMT)
Generation Properties of Stochastic Interpolation under Finite Training Set [28.5]
規則的な条件下では、決定論的生成過程はトレーニングサンプルを正確に回収し、生成過程は追加のノイズを伴うトレーニングサンプルとして現れる。提案手法は,推定誤差が存在する場合,一様雑音とガウス雑音の混合によるトレーニングサンプルの凸結合を効果的に生成することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:13:03 GMT)
GeoSketch: A Neural-Symbolic Approach to Geometric Multimodal Reasoning with Auxiliary Line Construction and Affine Transformation [28.5]
GeoSketchは、幾何学的推論をインタラクティブな知覚・推論・アクションループとして再キャストする、ニューラルシンボリックなフレームワークである。階層的な意思決定、実行可能な視覚行動、象徴的な検証を統一することにより、GeoSketchは静的解釈から動的相互作用へのマルチモーダル推論を前進させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:12:04 GMT)
DanceText: A Training-Free Layered Framework for Controllable Multilingual Text Transformation in Images [28.5]
DanceTextは、画像の多言語テキスト編集のためのトレーニング不要のフレームワークである。複雑な幾何学的変換をサポートし、シームレスに前景と背景の統合を実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:03:49 GMT)
$γ$-Quant: Towards Learnable Quantization for Low-bit Pattern Recognition [28.3]
パターン認識のための非線形量子化のタスク特化学習として$gamma$-Quantを提案する。学習可能な量子化が可能な生データは,12ビットのデータと同等に4ビットで処理できることを実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:03:55 GMT)
Beyond Formula Complexity: Effective Information Criterion Improves Performance and Interpretability for Symbolic Regression [28.3]
記号回帰は与えられたデータを記述するための正確で解釈可能な公式を発見する。有効情報基準(EIC)は、公式を特定の内部構造を持つ情報処理システムとして扱う。 EICは108人の専門家による公式解釈可能性の選好と70.2%の合意を示し、式中の不合理な構造を測定することで、実際に公式の解釈可能性を反映していることを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:32:43 GMT)
Detecting (Un)answerability in Large Language Models with Linear Directions [28.2]
大きな言語モデル(LLM)は、必要な情報がなくても、しばしば疑問に対して自信を持って反応し、幻覚的な答えをもたらす。抽出質問応答(QA)に着目した解答可能性検出の問題点について検討する。本稿では,モデルのアクティベーション空間の方向を特定するための簡単な手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:04:32 GMT)
ECHO: Toward Contextual Seq2Seq Paradigms in Large EEG Models [28.2]
大規模脳波モデル(LEM)は、エンコーダ中心のアーキテクチャを大規模未ラベルデータに事前訓練し、普遍的な表現を抽出することでこの問題に対処する。脳波モデリングをシーケンス・ツー・シーケンス・ラーニングとして再構成する新しいデコーダ中心のLEMパラダイムであるECHOを導入する。 ECHOは、最先端のシングルタスクEMをマルチタスク設定で一貫して上回り、より優れた一般化と適応性を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:37:34 GMT)
Pearl: A Multimodal Culturally-Aware Arabic Instruction Dataset [28.0]
PEARLは、文化的理解のために設計された大規模なアラビアのマルチモーダルデータセットとベンチマークである。 PEARLは、文化的に重要な10の領域にまたがる309K以上の例で構成されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:54:35 GMT)
Leveraging LLM Agents for Automated Video Game Testing [27.9]
Tests MMORPGs(Massively Multiplayer Online Role-Playing Games)は、ゲーム開発において重要な作業である。これらの課題に対処するため,知的MMORPGテストのための効果的なLLM駆動エージェントフレームワークであるTITANを提案する。我々はTITANのプロトタイプを実装し、PCとモバイルプラットフォームにまたがる2つの大規模商用MMORPG上で評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:31:21 GMT)
RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation [27.8]
Repository Planning Graph (RPG)は、統一グラフ内の機能、ファイル構造、データフロー、関数をエンコードする。 ZeroRepoは、提案レベルの計画、実装レベルの構築、テストバリデーションを備えたグラフ誘導コード生成という、グラフ駆動のフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:50:53 GMT)
ART-DECO: Arbitrary Text Guidance for 3D Detailizer Construction [27.7]
粗い3D形状プロキシを高品質なアセットに即時に変換できるニューラルネットワークである3Dディファレンサを導入する。我々のモデルはテキストプロンプトを用いて訓練され、形状クラスを定義し、生成した詳細の外観ときめ細かいスタイルを特徴付ける。我々の精細化器は単一形状に最適化されておらず、生成モデルを蒸留した結果であり、再学習せずに再利用でき、任意の形状を生成することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:03:04 GMT)
Constructive Conflict-Driven Multi-Agent Reinforcement Learning for Strategic Diversity [27.3]
コンストラクティブ・コンフリクト(CoDiCon)は,競争インセンティブを協調シナリオに組み込んだ新しいアプローチである。中央固有の報酬モジュールは、様々な報酬値を生成し、エージェントに分配し、競争と協力の効果的なバランスを確保する。実験により,CoDiConは,多様かつ適応的な戦略を効果的に推進する競争本質的な報奨によって,優れた性能を発揮することが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:28:36 GMT)
AutoSCORE: Enhancing Automated Scoring with Multi-Agent Large Language Models via Structured Component Recognition [27.3]
大規模言語モデル(LLM)は、自動スコアリングにおいて大きな可能性を示している。エンド・ツー・エンドのレーダとしての使用は、低い正確性、迅速な感度、限定的な解釈可能性、ルーリックなミスアライメントといった課題に直面している。本稿では,多エージェント LLM フレームワークである AutoSCORE を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:45:14 GMT)
Model-Preserving Adaptive Rounding [27.2]
しかし、別の量子化アルゴリズム (YAQA) は適応的なラウンドリングアルゴリズムであり、ネットワークの出力の誤差を直接考慮している。 YAQA は GPTQ/LDLQ よりも有効に優れており,これらの手法よりも$approx 30% の誤差を経験的に低減できることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:30:13 GMT)
Communication-Efficient and Interoperable Distributed Learning [27.1]
不均一なモデルアーキテクチャをまたいだ協調学習は、相互運用性の確保とプライバシの保護において大きな課題となる。モデルの不均一性をサポートし,推論時のモジュール構成を可能にする通信効率のよい分散学習フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:30:36 GMT)
Action-aware Dynamic Pruning for Efficient Vision-Language-Action Manipulation [27.0]
既存の手法では、VLAモデル内の視覚的冗長性を低減し、推論速度を最適化する。 textbfAction-aware textbfDynamic textbfPruning (textbfADP)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:13:02 GMT)
Subspace Clustering of Subspaces: Unifying Canonical Correlation Analysis and Subspace Clustering [26.9]
本稿では,列空間に基づく背の高い行列の集合をクラスタリングするための新しいフレームワークを提案する。我々の定式化は、各データサンプルを行列として直接モデル化し、それらの下位部分空間に従ってそれらをクラスタ化する。実世界のハイパースペクトル画像データセットを用いた実験により,本手法はクラスタリング精度とロバスト性に優れることを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:48:15 GMT)
Learning from Delayed Feedback in Games via Extra Prediction [26.9]
本研究は,ゲーム学習における時間遅延フィードバックの問題を提起し,解決するものである。この矛盾を克服するために、将来の報奨の予測はアルゴリズム(通常はOptimistic Follow-the-Regularized-Leader (OFTRL))に組み込まれる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:46:21 GMT)
Online Multi-Agent Control with Adversarial Disturbances [26.9]
本研究では, 対向障害を考慮した多エージェント線形力学系におけるオンライン制御について検討する。本研究は,ゲームにおけるオンライン学習によるオンライン制御のブリッジ化の第一歩として,個人のパフォーマンス保証の堅牢性を確立した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:12:28 GMT)
DeepTravel: An End-to-End Agentic Reinforcement Learning Framework for Autonomous Travel Planning Agents [26.8]
旅行計画(TP)エージェントは、最近、旅行計画生成のための外部ツールやリソースと対話するための新しいビルディングブロックとして機能している。本稿では,自律走行計画エージェントを構築するためのエージェント強化学習フレームワークであるDeepTravelを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:03:52 GMT)
Detecting Scarce and Sparse Anomalous: Solving Dual Imbalance in Multi-Instance Learning [26.8]
実世界のアプリケーションでは、非常にスパースな異常のある異常なサンプルを検出することは極めて困難である。そこで我々は,BFGPU(Ba balanced Fine-Grained Positive-Unlabeled)という新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:02:05 GMT)
UrbanFeel: A Comprehensive Benchmark for Temporal and Perceptual Understanding of City Scenes through Human Perspective [26.7]
UrbanFeelは、3つの認知的に進歩的な次元にまたがる、慎重に構築された視覚的質問からなる。 Gemini-2.5 Proは、人間のエキスパートレベルに近づいているため、全体的なパフォーマンスが最高である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:38:57 GMT)
Sharpness-Aware Minimization Can Hallucinate Minimizers [26.6]
シャープネス・アウェア・ミニマライゼーション(Sharpness-Aware Minimization)は、幻覚最小化器に収束できることを示す。そこで本研究では,ハロゲン化最小化を避けるための簡易かつ効果的な治療法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:26:07 GMT)
ProPerSim: Developing Proactive and Personalized AI Assistants through User-Assistant Simulation [26.5]
タイムリーでパーソナライズされたレコメンデーションを作成できるAIアシスタントを開発するためのタスクおよびシミュレーションフレームワークであるProPerSimを紹介する。 ProPerAssistantは、ユーザのフィードバックを通じて継続的に学習し、適応する検索強化された、嗜好に整合したアシスタントである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:57:27 GMT)
A Benchmark for Localizing Code and Non-Code Issues in Software Projects [26.5]
46の人気のあるGitHub Pythonプロジェクトから1,100のイシューのデータセットであるMULocBenchを紹介します。既存のベンチマークと比較すると、MULocBenchはイシュータイプ、根本原因、ロケーションスコープ、ファイルタイプに大きな多様性を提供する。このベンチマークを用いて、最先端のローカライズ手法と5つのLCMベースのプロンプト戦略の性能を評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:05:20 GMT)
Mamba Integrated with Physics Principles Masters Long-term Chaotic System Forecasting [26.5]
PhyxMambaは、Mambaベースの状態空間モデルと物理インフォームドの原理を統合し、カオスシステムの長期的な振る舞いを予測するフレームワークである。我々はPhyxMambaが優れた予測精度を提供し、短期的な歴史的観測から重要な統計を忠実に捉えていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:35:24 GMT)
DialSim: A Dialogue Simulator for Evaluating Long-Term Multi-Party Dialogue Understanding of Conversational Agents [26.3]
対話シミュレーションに基づく評価フレームワークであるDialSimを紹介する。ダイアルシム(DialSim)では、エージェントが台詞付き会話におけるキャラクターの役割を仮定し、対話履歴のみを用いて自発的な質問に答える能力を評価する。このフレームワークをサポートするために,LongDialQAを導入した。 DialSimを用いたLLMを用いた会話エージェントの評価では,大局的なコンテキストウィンドウやRAG機能を持つモデルでさえ,長期にわたる多人数インタラクションに対する正確な理解の維持に苦慮していることが明らかとなった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:04:26 GMT)
DualFocus: Depth from Focus with Spatio-Focal Dual Variational Constraints [26.3]
DFFフレームワークであるDualFocusは、フォーカス変動によって引き起こされる焦点スタックの特異な勾配パターンを利用する。 DualFocus は深度精度と知覚品質の両方で最先端の手法を一貫して上回っていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:15:36 GMT)
EditGRPO: Reinforcement Learning with Post -Rollout Edits for Clinically Accurate Chest X-Ray Report Generation [26.2]
放射線学レポート生成には、高度な医用画像解析、効果的な時間的推論、正確なテキスト生成が必要である。本研究は,臨床動機による報酬生成を最適化するために設計された複合政治強化学習(RL)アルゴリズムであるEditGRPOを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:19:00 GMT)
RAU: Reference-based Anatomical Understanding with Vision Language Models [26.1]
視覚言語モデル(VLM)を用いた参照型解剖学的理解のためのフレームワークであるRAUを紹介する。まず,VLMが参照画像と対象画像の相対的空間的推論により解剖学的領域の同定を学習することを示す。次に, VLM由来の空間的手がかりをSAM2の細粒度セグメンテーション能力とシームレスに統合できることを実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:32:03 GMT)
Diagnosing and Mitigating Modality Interference in Multimodal Large Language Models [26.0]
マルチモーダル大規模言語モデルでは,非関連信号とタスク関連情報を区別することが困難である。無関係なモダリティからの急激な情報は、しばしば大幅な性能低下をもたらすことを示す。本稿では,摂動と対向的摂動を併用した摂動に基づくデータ拡張を含む,MLLMを微調整する新しい枠組みを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:54:35 GMT)
Introducing Multimodal Paradigm for Learning Sleep Staging PSG via General-Purpose Model [25.9]
睡眠ステージングは、睡眠障害を診断し、神経学的健康を評価するために不可欠である。既存の自動手法は、一般的に複雑なポリソノグラフィ(PSG)信号から特徴を抽出し、ドメイン固有のモデルを訓練する。臨床診断の実践をエミュレートするために,大規模な多モード汎用モデルを活用する睡眠ステージングの新しいパラダイムを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:14:43 GMT)
R-Capsule: Compressing High-Level Plans for Efficient Large Language Model Reasoning [25.9]
CoT(Chain-of-Thought)は、大規模言語モデル(LLM)が明確なステップバイステップの合理性を引き出すことによって、複雑な推論に対処するのに役立つ。提案するReasoning Capsule (R-Capsule) は,遅延推論の効率と明示的なCoTの透明性の両立を目的としたフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:53:41 GMT)
Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learning [25.7]
Proximal Policy Optimization (PPO)は、大規模言語モデル(LLM)の機能を改善するためのフレームワークである。 PPOは監督された微調整よりも一貫して優れており、GLUEでは平均6.3ポイント向上している。本研究は,LLMを強化学習問題とみなすことで,新たなタスクに適応する上で有望な方向性を示すものである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:43:55 GMT)
MIRAGE: Multi-hop Reasoning with Ambiguity Evaluation for Illusory Questions [25.7]
実世界のマルチホップ質問回答(QA)は、推論プロセス自体と分離できないあいまいさを伴うことが多い。この曖昧さは、一つの質問から複数の推論パスが現れるという、明確な課題を生み出します。本稿では,MultI-hop Reasoning with AmbiGuity Evaluation for Illusory Questions (MIRAGE)を紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:31:01 GMT)
Memory-QA: Answering Recall Questions Based on Multimodal Memories [25.7]
メモリQA(Memory-QA)は,従来記憶されていたマルチモーダルメモリからの視覚的コンテンツに関するリコール質問に応答する,新しい実世界のタスクである。このタスクは、タスク指向メモリの作成、時間的および場所的情報のメモリ内で有効活用、複数のメモリを描画してリコール問題に答える能力など、ユニークな課題を提起する。我々はPensieveという包括的パイプラインを提案し、メモリ固有の拡張、時間と位置を意識したマルチシグナル検索、マルチメモリQA微調整を統合した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:04:32 GMT)
Semantic Consistent Language Gaussian Splatting for Point-Level Open-vocabulary Querying [25.3]
オープン語彙の3Dシーン理解は、自然言語による操作など、ロボット工学の応用にとって不可欠である。既存の3Dガウススプラッティングの問合せ方法は、矛盾しない2Dマスクの監視にしばしば苦労する。本稿では,セグメンテーションマスク上でのトラッキングを行い,意味的に一貫した基盤構造を確立するための新しいポイントレベルのクエリフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:36:37 GMT)
Jailbreaking on Text-to-Video Models via Scene Splitting Strategy [25.3]
SceneSplitは、有害な物語を複数のシーンに断片化し、それぞれが個々に良心する新しいブラックボックスジェイルブレイク手法である。以上の結果から,Luma Ray2は77.2%,Haluoは84.1%,Veo2は78.2%であり,既存のベースラインを大きく上回っていることがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:54:23 GMT)
PSTTS: A Plug-and-Play Token Selector for Efficient Event-based Spatio-temporal Representation Learning [25.3]
イベントデータに対するPSTTS(Progressive Spatio-temporal Token Selection)を提案する。 PSTTSは、生のイベントデータに埋め込まれた時間的・時間的分布特性を利用して、冗長トークンを効果的に識別し、破棄する。 PSTTSはFLOPを29-43.6%削減し、FPSを21.6-41.3%増加させた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:30:00 GMT)
GRAM-TDI: adaptive multimodal representation learning for drug target interaction prediction [25.3]
GRAMDTIは、マルチモーダル分子とタンパク質の入力を統一表現に統合する事前学習フレームワークである。 GRAMDTIは、ボリュームベースのコントラスト学習を4つのモードに拡張し、高次のセマンティックアライメントをキャプチャする。本結果は,高次マルチモーダルアライメント,適応的モダリティ利用,堅牢かつ一般化可能なDTI予測のための補助的監視の利点を強調した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:59:00 GMT)
Learning to Ball: Composing Policies for Long-Horizon Basketball Moves [25.2]
ロングホライゾンタスクは、明確に定義された目標を持つサブタスクから成り、不明確な目標を持つトランジショナルサブタスクによって分離される。専門家の混在やスキル連鎖のような既存の手法は、個別のポリシーが広く検討されている重要な状態を共有していないタスクと競合する。本稿では,長期的タスクにおける運動能力の大幅な変化を実現するための新しいポリシー統合フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:02:05 GMT)
Enhancing Low-Rank Adaptation with Structured Nonlinear Transformations [25.2]
Low-Rank Adaptation (LoRA) は、大規模言語モデルに対して広く採用されているパラメータ効率の高い微調整法である。低ランク更新に軽量な変換を適用するLoRAの非線形拡張であるLoRANを提案する。要約タスクと分類タスクによる実験では、LoRANはQLoRAよりも一貫して改善されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:54:02 GMT)
ReLAM: Learning Anticipation Model for Rewarding Visual Robotic Manipulation [25.1]
リワードデザインは、ロボット操作のための視覚的強化学習において、依然として重要なボトルネックとなっている。本研究では,画像から抽出したキーポイントを通して空間距離を暗黙的に推定する手法を提案する。 Reward Learning with Precipation Model (ReLAM) は、アクションフリーのビデオデモから高密度で構造化された報酬を自動的に生成する新しいフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:28:42 GMT)
SpecXNet: A Dual-Domain Convolutional Network for Robust Deepfake Detection [25.0]
本稿では,堅牢なディープフェイク検出のためのデュアルドメインアーキテクチャであるSpectral Cross-Attentional Network (SpecXNet)を提案する。修正されたXceptionNetバックボーンの上に構築され、DDFCとDFAモジュールを分離可能な畳み込みブロックに埋め込む。本研究は,高密度・高密度深度検出における空間スペクトル学習の有効性を明らかにするものである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:51:59 GMT)
Evaluating Uncertainty Quantification Methods in Argumentative Large Language Models [25.0]
我々は,異なるUQ手法を用いる場合のクレーム検証タスクにおいて,ArgLLMsの性能を評価する実験を行う。これらの結果から,ArgLLMsでは直接的プロンプトが有効なUQ戦略であることが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:59:09 GMT)
Speak Your Mind: The Speech Continuation Task as a Probe of Voice-Based Model Bias [24.9]
音声継続 (SC) は、意味的文脈と話者識別を保ちながら、音声プロンプトのコヒーレントな拡張を生成するタスクである。本研究は,性差と発声タイプが継続行動にどのように影響するかを調査し,SCにおけるバイアスの最初の体系的評価を行った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:43:25 GMT)
Bridging Draft Policy Misalignment: Group Tree Optimization for Speculative Decoding [24.7]
グループツリー最適化(GTO)を導入し、デコード時ツリーポリシーとトレーニングを整合させる。ドラフトツリーリワードの増加は、受け入れ長とスピードアップを確実に改善することを示す。 GTOは、効率的な大規模言語モデル推論のための実用的で一般的なソリューションを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:55:35 GMT)
Self-Supervised Point Cloud Completion based on Multi-View Augmentations of Single Partial Point Cloud [24.3]
ポイント雲の完成は、部分的な観測から完全な形状を再構築することを目的としている。既存の自己教師付き手法は、自己教師付き信号の限られた能力のために不満足な予測を生成する。単一部分点雲の多視点拡張に基づく新しい自己教師型信号群を設計する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:53:55 GMT)
TreeMind: Automatically Reproducing Android Bug Reports via LLM-empowered Monte Carlo Tree Search [24.2]
そこで我々は,大規模言語モデルとモンテカルロ木探索アルゴリズムを統合し,バグ再現における戦略的UI探索を実現する新しい手法であるTreeMindを提案する。私たちの知る限りでは、これは、外部の意思決定とセマンティック推論を組み合わせた、信頼性のあるバグ再現のための最初の作業です。広範に使用されている3つのベンチマークから、実世界の93のAndroidバグレポートのデータセットに基づいて、TreeMindを評価した。実験の結果、再現成功率の4つの最先端のベースラインを著しく上回っていることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:50:13 GMT)
Avoiding $\mathbf{exp(R_{max})}$ scaling in RLHF through Preference-based Exploration [24.2]
RLHF(Reinforcement Learning from Human Feedback)は,大規模言語モデル(LLM)アライメントのための重要な手法として登場した。本稿では、オンラインRLHFの設定と、サンプル効率の向上に焦点をあてる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:18:48 GMT)
MolSpectLLM: A Molecular Foundation Model Bridging Spectroscopy, Molecule Elucidation, and 3D Structure Generation [24.1]
MolSpectLLMはQwen2.5-7Bで事前訓練された分子基盤モデルであり、分子3D構造と実験的分光を統一する。分子スペクトルを明示的にモデル化することで、MollSpectLLMはNMR、IR、MSベンチマークで平均0.03の精度でスペクトル関連タスクにおける最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:37:44 GMT)
ProRe: A Proactive Reward System for GUI Agents via Reasoner-Actor Collaboration [24.0]
ProReは汎用推論エージェントとドメイン固有評価エージェントを利用するプロアクティブ報酬システムである。 ProReは報酬精度を最大5.3%、F1スコアを19.4%向上させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:29:36 GMT)
Beyond Structure: Invariant Crystal Property Prediction with Pseudo-Particle Ray Diffraction [23.9]
結晶特性予測は、従来の密度汎関数理論を用いて、大きな多体系に対して正確に解くことを計算的に禁止している。グラフ表現の他に、独自の相互空間回折を利用するRDNetを導入する。 Materials Project、JARVIS-DFT、MatBenchで大規模な実験を行い、提案モデルが最先端の性能を達成することを実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:30:23 GMT)
Universal Multi-Domain Translation via Diffusion Routers [23.9]
マルチドメイン翻訳(MDT)は、複数のドメイン間の翻訳を学習することを目的としている。我々は,MDTの一般化であるUniversal MDT (UMDT)を導入し,中央ドメインと組み合わせたK-1$のみを用いて任意の$K$ドメイン間の変換を試みる。単一雑音予測器を用いた中央$leftarrow$non-central翻訳をモデル化した拡散型統合フレームワークDiffusion Router (DR)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:32:43 GMT)
IntSR: An Integrated Generative Framework for Search and Recommendation [23.8]
IntSRは検索とレコメンデーションのための統合生成フレームワークである。異なるクエリモーダルを使って、これらの異なるタスクを統合する。 IntSRはAmapのさまざまなシナリオでうまくデプロイされている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:16:49 GMT)
Towards Strategic Persuasion with Language Models [23.8]
大規模言語モデル(LLM)は、人間のものと同等の強い説得能力を示している。 LLMの説得能力を測定するためのスケーラブルで原則化されたフレームワークを提供するために、理論駆動のアプローチを採用する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:00:15 GMT)
EUGENE: Explainable Structure-aware Graph Edit Distance Estimation with Generalized Edit Costs [23.6]
グラフ編集距離(GED)は、グラフ間距離を測定するために好ましい。 GED近似は主に神経学的手法を用いる。我々は,GEDを推定し,推定コストに応じた編集を提供する,効率的で代数的で構造を考慮した最適化手法であるEUGENEを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:48:04 GMT)
COMPASS: Robust Feature Conformal Prediction for Medical Segmentation Metrics [23.6]
コンフォーマル予測(CP)は、原則付き不確実性保証を導出する一般的なフレームワークであるが、複雑なセグメンテーション-メトリックパイプラインをブラックボックスとして扱う。本稿では,その基盤となるディープニューラルネットワークの帰納バイアスを利用して,画像分割モデルに対して,効率的で計量ベースのCP間隔を生成するフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:56:28 GMT)
Rare-to-Frequent: Unlocking Compositional Generation Power of Diffusion Models on Rare Concepts with LLM Guidance [23.5]
拡散モデルの合成生成能力は,大規模言語モデル指導によって著しく向上できることを示す。本稿では、レア・ツー・頻繁なコンセプトガイダンスを計画し、実行するためのトレーニングフリーアプローチR2Fを提案する。我々のフレームワークは、事前訓練された拡散モデルやLLMに対して柔軟であり、領域誘導拡散アプローチとシームレスに統合することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:22:42 GMT)
Forward-only Diffusion Probabilistic Models [23.2]
この研究は、生成モデリングのためのフォワードオンリー拡散(FoD)アプローチを示す。 FoDは単一の前方拡散プロセスを通じてデータ生成を直接学習し、シンプルだが効率的な生成フレームワークを生成する。私たちのコードはhttps://github.com/Algolzw/FoD.comで公開されています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:17:30 GMT)
SEDM: Scalable Self-Evolving Distributed Memory for Agents [23.2]
SEDMは、メモリをパッシブリポジトリからアクティブな自己最適化コンポーネントに変換する検証可能で適応的なフレームワークである。また,SEDMは,強いメモリベースラインに比べてトークンオーバーヘッドを低減しつつ,推論精度を向上することを示した。結果は、SEDMをオープンエンドのマルチエージェントコラボレーションのためのスケーラブルで持続可能なメモリメカニズムとして強調する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:26:13 GMT)
Fuzzy Reasoning Chain (FRC): An Innovative Reasoning Framework from Fuzziness to Clarity [23.1]
Fuzzy Reasoning Chain(FRC)フレームワークは、セマンティックプリエントと連続したファジィメンバーシップの学位を統合する。 FRCは、解釈性と堅牢性を改善した微妙で曖昧な表現を管理するための一般的なメカニズムを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:36:38 GMT)
JanusVLN: Decoupling Semantics and Spatiality with Dual Implicit Memory for Vision-Language Navigation [23.0]
Vision-and-Language Navigationでは、自然言語命令と連続的なビデオストリームによってガイドされた、目に見えない環境をナビゲートするために、エンボディエージェントが必要である。 VLNの最近の進歩は、マルチモーダル大規模言語モデルの強力な意味理解によって推進されている。本稿では,空間幾何学的,視覚的セマンティックメモリを分離,コンパクト,固定サイズのニューラル表現としてモデル化した,二重暗黙的ニューラルメモリを備えた新しいVLNフレームワークであるJanusVLNを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:29:37 GMT)
REFINE-CONTROL: A Semi-supervised Distillation Method For Conditional Image Generation [22.9]
条件付き画像生成モデルは、テキストベースの制御を活用して、カスタマイズされた画像を生成することで、目覚ましい結果を得た。しかしながら、これらのモデルの高いリソース要求と、十分に注釈付けされたデータの不足により、エッジデバイスへのデプロイメントが妨げられている。これらの課題を克服するための半教師付き蒸留フレームワークであるRefine-Controlを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:59:40 GMT)
EgoVIS@CVPR: What Changed and What Could Have Changed? State-Change Counterfactuals for Procedure-Aware Video Representation Learning [22.9]
状態変化記述を取り入れたプロシージャ対応ビデオ表現学習について検討する。我々は、仮説化された失敗の結果をシミュレートする状態変化反事実を生成する。本研究は,提案した状態変化記述の有効性と,その有効性を実証するものである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:20:27 GMT)
Investigating Faithfulness in Large Audio Language Models [22.9]
忠実さは、チェーンオブ思想表現がモデルの決定過程を正確に反映しているかどうかを測り、信頼性のある説明として使用することができる。本稿では,複数のLALMが生成するCoTの忠実度を,対象とする介入を適用して検討する。上記のいくつかのデータセットやタスクにわたる介入を経た上で、私たちの実験は、LALMが一般的に、根底にある意思決定プロセスに忠実であるように見えるCoTを生成することを示唆しています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:58:22 GMT)
InstructPro: Natural Language Guided Ligand-Binding Protein Design [22.9]
InstructProは、自然言語命令とリガンド式からタンパク質を設計する生成モデルのファミリーである。トレーニングと評価を可能にするために,960万(関数記述,リガンド,タンパク質)の大規模データセットであるInstructProBenchを開発した。 InstructPro-1Bは2.46%と3.14%、InstructPro-3Bは5.06%と3.93%である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:58:26 GMT)
Training-Free Bayesianization for Low-Rank Adapters of Large Language Models [22.8]
TFB(Training-Free Bayesianization)は、トレーニングなしでトレーニングされた低ランクアダプタをベイズアダプタに変換するフレームワークである。 TFBは既存の手法よりも優れた不確実性推定と一般化を実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:37:00 GMT)
Differentially Private Two-Stage Gradient Descent for Instrumental Variable Regression [22.7]
差分プライバシー制約下でのインストゥルメンタル変数回帰(IVaR)について検討する。勾配更新に慎重に校正された雑音を注入することにより、差分プライバシーを確保するノイズの多い2状態勾配降下アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:02:58 GMT)
Intercept Cancer: Cancer Pre-Screening with Large Scale Healthcare Foundation Models [22.6]
CATCH-FM, CATch carcinoma early with Healthcare Foundation Models。 Caught-FMは、過去の医療記録に基づいて、リスクの高い患者をスクリーニングするために特定する。本分析は,様々な患者分布におけるCATCH-FMのロバスト性,ICD符号空間での操作の利点,非自明ながんリスク因子を捕捉する能力を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:50:53 GMT)
Abductive Logical Rule Induction by Bridging Inductive Logic Programming and Multimodal Large Language Models [22.5]
Inductive Logic Programming(ILP)とMultimodal Large Language Models(MLLM)をブリッジするILP-CoTを提案する。このタスクには、論理的事実の発見と、少数の構造化されていないテキストや視覚的な入力から論理的ルールの誘導の両方が含まれる。本手法は,MLLMのルール構造提案に基づいて,探索空間を切断したILPタスクを自動生成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:56:19 GMT)
Pose-free 3D Gaussian splatting via shape-ray estimation [22.4]
ポーズフリーでフィードフォワードのガウススプレイティングフレームワークであるSHAREを紹介する。関節形状とカメラ線推定によりあいまいさを克服する。提案手法はポーズフリーな一般化可能なガウススプラッティングにおけるロバストな性能を実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:08:53 GMT)
AgentOrchestra: Orchestrating Hierarchical Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol [22.4]
本稿では,環境,エージェント,ツールを統一システムに統合するツール-環境-エージェントプロトコルを提案する。本稿では,複雑な目的を分解し,特殊エージェントをコーディネートする中央計画エージェントを備えた階層型マルチエージェントフレームワークであるAgensOrchestraを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:51:17 GMT)
D-Artemis: A Deliberative Cognitive Framework for Mobile GUI Multi-Agents [22.3]
D-ArtemisはGUIエージェントのための新しい検討フレームワークである。 D-Artemisは、詳細なアプリ固有のチップ検索メカニズムを使用して、意思決定プロセスに通知する。また、TACチェックモジュールとACA(Action Correction Agent)が協調して動作し、実行障害のリスクを軽減している。実行後状態反映エージェント(SRA)は認知ループを完了し、経験から戦略的学習を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:56:19 GMT)
Evaluating Memory in LLM Agents via Incremental Multi-Turn Interactions [22.2]
メモリエージェントに不可欠な4つのコア能力、すなわち、正確な検索、テスト時間学習、長距離理解、選択的忘れの4つを特定した。既存のベンチマークは、限られたコンテキスト長に依存するか、書籍ベースのQAのような静的で長いコンテキスト設定用に調整されている。メモリエージェント用に特別に設計された新しいベンチマークであるMemoryAgentBenchを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:31:14 GMT)
Bridging Fairness and Explainability: Can Input-Based Explanations Promote Fairness in Hate Speech Detection? [22.2]
本研究では,ヘイトスピーチ検出における説明可能性と公平性の関係について,最初の系統的研究を行った。バイアス付き予測の同定,(2)公正モデルの選択,(3)モデルトレーニング時のバイアス軽減の3つの重要な側面について検討する。入力に基づく説明は, 偏りのある予測を効果的に検出できるが, 候補の中から公平なモデルを選択するには信頼性が低い。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:53:20 GMT)
Grasping a Handful: Sequential Multi-Object Dexterous Grasp Generation [22.1]
SeqGraspはシーケンシャルな多目的ロボットグリップサンプリングアルゴリズムである。我々はSeqGraspとSeqDiffuserを、最先端の非シーケンシャルなマルチオブジェクトグリップ生成法であるMultiGraspに対して実験的に評価した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:57:45 GMT)
TempFlow-GRPO: When Timing Matters for GRPO in Flow Models [22.0]
本稿では,フローベース生成に固有の時間構造を捕捉し,活用する,原理的なGRPOフレームワークを提案する。新しい革新は、基礎となる生成力学を尊重する時間的に認識された最適化をモデルに与える。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:28:04 GMT)
TAMMs: Temporal-Aware Multimodal Model for Satellite Image Change Understanding and Forecasting [22.0]
我々は、単一のMLLM拡散アーキテクチャにおいて、TDとFSIFを共同で実行するように設計された最初の統合フレームワークであるTAMMを紹介する。 TAMMは2つの重要なイノベーションを紹介している: 時間適応モジュール(TAM)は、凍ったMLLMの長距離力学の理解能力を強化し、セマンティック・フューズド・コントロール・インジェクション(SFCI)機構は、この変化の理解をきめ細かな生成制御に変換する。大規模な実験では、TAMMは両方のタスクにおける最先端の専門家のベースラインを大幅に上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:35:39 GMT)
DeLiVR: Differential Spatiotemporal Lie Bias for Efficient Video Deraining [21.8]
ネットワークの注意点に直接リー群差分バイアスを注入する,効率的なビデオデラミニング手法であるDeLiVRを提案する。回転有界リー相対バイアスは、コンパクトな予測モジュールを用いて各フレームの面内角度を予測する。微分群変位は、速度を推定するために隣接するフレーム間の角度差を計算する。このバイアスは、時間的減衰とアテンションマスクを組み合わせて、雨の流れの方向を正確に一致させながら、フレーム間の関係に焦点を当てる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:29:36 GMT)
Learning the Neighborhood: Contrast-Free Multimodal Self-Supervised Molecular Graph Pretraining [21.7]
C-FREE(Contrast-Free Representation Learning on Ego-nets)は,2次元グラフと3次元コンバータのアンサンブルを統合するシンプルなフレームワークである。 C-FREEは、潜在空間内の相補的な近傍から部分グラフの埋め込みを予測することによって分子表現を学ぶ。 C-FREE State-of-the-art results on MoleculeNet。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:16:20 GMT)
UniMIC: Token-Based Multimodal Interactive Coding for Human-AI Collaboration [21.6]
エッジデバイスとクラウドAIエージェントをブリッジするトークンベースのMultimodal Interactive CodingフレームワークであるUniMICを提案する。 UniMICは通信媒体としてコンパクトなトークン化表現を採用し、効率的な低ビットレート伝送を実現する。テキスト・ツー・イメージ生成、テキスト・ガイド・インペインティング、アウトペインティング、視覚的質問応答の実験は、UniMICがかなりの節約を達成していることを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:46:12 GMT)
Goal-Guided Efficient Exploration via Large Language Model in Reinforcement Learning [21.5]
本稿では,RLエージェントを効率的に探索するための構造化ゴールプランナとゴール条件アクションプルーナーを紹介する。本手法をCrafter と Craftax-Classic で評価し,SGRL が既存の最先端手法と比較して優れた性能を発揮することを示す実験結果を得た。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:45:41 GMT)
ASCoT: An Adaptive Self-Correction Chain-of-Thought Method for Late-Stage Fragility in LLMs [21.4]
CoT(Chain-of-Thought)の促進により,LLM(Large Language Models)の推論機能が大幅に向上した。 CoT鎖の後半で導入されたエラーは、当初と同一のエラーよりも、最終回答が著しく破損する可能性が高い。本稿では、この脆弱性に対処するために、適応自己補正連鎖法(ASCoT)を導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:53:35 GMT)
Benchmarking and Mitigate Psychological Sycophancy in Medical Vision-Language Models [21.4]
視覚言語モデルは、しばしば、証拠に基づく推論よりも、社会的手がかりや認識された権威を記述したユーザーとの整合性に優先順位を付ける、幻想的行動を示す。本研究は, 新規な臨床評価基準を用いて, 医用視覚質問応答における臨床症状について検討した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:02:22 GMT)
SynerGen: Contextualized Generative Recommender for Unified Search and Recommendation [21.3]
生成シーケンスモデルは、自動回帰的にランク付けされたアイテムを自動生成することで、検索とランキングの統一を約束している。 textitSynerGenは、パーソナライズされた検索とレコメンデーションの両方のための単一の生成バックボーンを提供することで、この重要なギャップを埋める新しい生成レコメンデーションモデルである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:27:04 GMT)
Beyond Classification Accuracy: Neural-MedBench and the Need for Deeper Reasoning Benchmarks [21.2]
近年の視覚言語モデル (VLM) の進歩は, 標準医学ベンチマークにおいて顕著な性能を発揮しているが, その真の臨床推論能力は未だ不明である。我々はニューラルメドベンチ(Neural-MedBench)について紹介する。これは、神経学におけるマルチモーダルな臨床推論の限界を調査するためのコンパクトで推論集約的なベンチマークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:20:01 GMT)
Decentralized Stochastic Nonconvex Optimization under the Relaxed Smoothness [21.1]
分散正規化勾配勾配(DNS)という新しいアルゴリズムを提案する。 DNSは各ローカルエージェントで$bold$ilonポイントを達成することができる。以上より, $mathcal O(m-1(L_fsigma2Delta_fepsilon-4 + sigma2epsilon-2 + L_f-1)$ per agent。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:08:27 GMT)
CMRAG: Co-modality-based visual document retrieval and question answering [21.0]
共同モダリティベースのRAG(RAG)フレームワークは、テキストや画像を利用してより正確な検索と生成を行うことができる。我々のフレームワークは、複数のビジュアル文書質問応答(VDQA)ベンチマークにおいて、単一モダリティベースのRAGを一貫して上回ります。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:25:26 GMT)
From Long to Lean: Performance-aware and Adaptive Chain-of-Thought Compression via Multi-round Refinement [21.0]
CoT(Chain-of-Thought)推論は複雑なタスクのパフォーマンスを改善するが、冗長性による遅延が大幅に増加する。マルチラウンド適応チェイン・オブ・ソート圧縮(MACC)を提案する。本手法は,最先端のベースラインに対して平均5.6%の精度向上を実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:02:48 GMT)
Fused Partial Gromov-Wasserstein for Structured Objects [21.0]
我々はFGWを拡張して不均衡なデータに対応するFPGW(Fused partial Gromov-Wasserstein)フレームワークを提案する。本研究では、FPGWとFGWの関係を確立し、FPGWの計量特性を証明する。グラフマッチング,グラフ分類,グラフクラスタリング実験を通じてFPGW距離を評価し,その頑健な性能を実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:17:32 GMT)
IP$^{2}$-RSNN: Bi-level Intrinsic Plasticity Enables Learning-to-learn in Recurrent Spiking Neural Networks [20.9]
2レベル内在性可塑性を有する繰り返しスパイクニューラルネットワーク(IP$2$-RSNN)を開発した。以上の結果から,RSNNにおけるL2Lの実現には,両レベルの内在性可塑性が重要な役割を担っていることが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:31:10 GMT)
SingRef6D: Monocular Novel Object Pose Estimation with a Single RGB Reference [20.9]
本稿では,単一のRGB画像のみを参照として必要とする軽量パイプラインであるSingRef6Dを提案する。まず,Depth-Anything v2上に新たな最適化損失を発生させるトークンスケーラを用いた微調整機構を提案する。第2に,Deep-Aware matching(深度対応マッチング)を導入し,難解な材料や照明条件のマッチング処理を可能にした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:14:41 GMT)
HiCoLoRA: Addressing Context-Prompt Misalignment via Hierarchical Collaborative LoRA for Zero-Shot DST [20.9]
Zero-shot Dialog State Tracking (zs-DST)は、タスク指向のダイアログシステム(TOD)がコストのかかるデータアノテーションなしで新しいドメインに一般化できるようにするために必須である。 HiCoLoRAは、堅牢なプロンプトアライメントを通じてゼロショットスロット推論を強化するフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:05:22 GMT)
The Internet of Us [20.9]
インターネット・オブ・Us(英語: Internet of Us, IoU)は、より豊かで深い社会関係を促進できるオンラインの多様性に配慮したソーシャルインタラクションである。社会設定における多様性の多面的側面と、IoUの恩恵を享受するために必要となる多分野的な作業について論じる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:52:48 GMT)
Learning with errors may remain hard against quantum holographic attacks [20.8]
近年の研究では、絡み合いのエントロピーはLearning with Errors (LWE)と同じくらい難しく、量子重力とAdS/CFTとの緊張を生み出すことが示されている。これは、ホログラフィック双対を構築し、極端の表面を測定することで、LWEを解くためのパラドックス的な経路を示唆している。ホログラフィックエントロピーは、難解なホログラフィック辞書を必要とせず、量子計算の限界と一致していることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:38:27 GMT)
BiomedSQL: Text-to-SQL for Scientific Reasoning on Biomedical Knowledge Bases [20.7]
実世界のバイオメディカル知識ベース上で科学的推論を評価するために設計された最初のベンチマークであるBiomedを紹介する。 Biomedは68,000の問合せ/問合せ/問合せのトリプルで構成されている。 GPT-o3-mini 3ステップエージェントは59.0%の実行精度を達成し、カスタムマルチステップエージェントBMは62.6%に達した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:14:24 GMT)
Pre-Training Representations of Binary Code Using Contrastive Learning [20.5]
ContraBinは、ソースコードとコメント情報をバイナリと統合する、対照的な学習テクニックである。我々は、人書きと合成コメントがバイナリコード理解タスクに与える影響を分析する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:28:14 GMT)
A Critical Look At Tokenwise Reward-Guided Text Generation [20.4]
フルシーケンスでトレーニングされた報酬モデルは、スコアリング部分シーケンスと互換性がないことを示す。本稿では,部分列を明示的に学習するBradley-Terry報酬モデルを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:34:07 GMT)
Distribution-Aligned Decoding for Efficient LLM Task Adaptation [20.4]
タスク適応を出力分配アライメントとして再キャストする。本稿では,PEFT互換で理論上は基礎的手法であるステアリングベクトル復号法(SVD)を紹介する。 3つのタスクと9つのベンチマークで、SVDは4つの標準PEFTメソッドと組み合わせることで、最大5ポイントの多重選択精度を向上させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:27:02 GMT)
Towards Minimal Causal Representations for Human Multimodal Language Understanding [20.4]
従来の可能性よりも因果原理を活用する因果多様情報ボトルネック(CaMIB)モデルを導入する。因果的特徴のグローバルな整合性を確保するため,器用変数制約を組み込む。マルチモーダル感情分析、ユーモア検出、およびサルカズム検出の実験は、OODテストセットとともに、CaMIBの有効性を実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:04:23 GMT)
From Grunts to Lexicons: Emergent Language from Cooperative Foraging [20.2]
マルチエージェントフォーエイジングゲームにおける言語の出現について検討する。エージェントは、他のエージェントや環境に関する部分的な知識だけで、共有グリッドの世界で動作します。エンドツーエンドの深層強化学習を使用して、エージェントはアクションとコミュニケーション戦略の両方をゼロから学ぶ。我々は,それぞれの特性を定量化し,人口規模,社会動態,時間的依存など,創発的言語の特定の側面を形作る要因がどのように異なるかを分析する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:22:11 GMT)
EgoInstruct: An Egocentric Video Dataset of Face-to-face Instructional Interactions with Multi-modal LLM Benchmarking [20.2]
対面指導のエゴセントリックな新しいビデオデータセットを提案する。我々は,2つの基本的なタスクに対して,命令的相互作用の包括的理解に向けた第一歩となる基本的アノテーションを提供する。画像,音声,テキストを共同処理するMLLMを最近導入した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:52:26 GMT)
Can DPO Learn Diverse Human Values? A Theoretical Scaling Law [20.1]
嗜好学習は、人間のフィードバックに基づいて、好ましくない反応と好ましくない反応を区別するモデルを訓練する。本稿では,値の多様性とサンプル量とともに一般化がいかにスケールするかを解析するための新しい理論的枠組みを提案する。我々のフレームワークは、有限個の勾配ステップの後、モデルがどのように一般化するかを厳格に評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:16:19 GMT)
Metric-Guided Conformal Bounds for Probabilistic Image Reconstruction [20.1]
そこで我々は,ブラックボックス画像再構成アルゴリズムのクレームに有効な予測境界を計算するためのフレームワークを提案する。本稿では,従来の画素ベースのバウンディング手法よりも意味論的解釈の優れたバウンダリを生成することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:05:48 GMT)
Persistent Autoregressive Mapping with Traffic Rules for Autonomous Driving [20.1]
PAMR(Persistent Autoregressive Mapping with Traffic Rules)は、車線ベクトルと交通ルールの自己回帰協調構築を行う新しいフレームワークである。提案手法では,時間セグメント内のシーンの処理を行うMap-Rule Co-Constructionと,ルール一貫性を維持するMap-Rule Cacheという2つの重要なメカニズムを導入している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:33:36 GMT)
What Makes LLM Agent Simulations Useful for Policy? Insights From an Iterative Design Engagement in Emergency Preparedness [20.0]
社会シミュレーションにLarge Language Modelsをエージェント(LLMエージェント)として使うことへの関心が高まっているが、実際の採用は限られている。 LLMエージェントのシミュレーションは、政策にどのように役立つのか? 我々は,様々な緊急シナリオ下での大規模な集まりにおいて,群衆の動きとコミュニケーションをシミュレートする13,000個のLDMエージェントを反復的に開発した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:51:34 GMT)
Transport Based Mean Flows for Generative Modeling [20.0]
フローマッチング生成モデルは、連続データ生成の強力なパラダイムとして現れています。これらのモデルは、多数のシーケンシャルサンプリングステップを必要とするため、推論が遅い。最近の研究はサンプリングステップの数を減らして推論を加速させようとしている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:12:19 GMT)
FailureAtlas:Mapping the Failure Landscape of T2I Models via Active Exploration [19.9]
FailureAtlasは、T2Iモデルの大規模な障害状況を自律的に探索し、マッピングするように設計されたフレームワークである。我々の手法は、これまで未知のエラースライスを数十万も発見する。 FailureAtlasは、より堅牢な生成AIの開発をガイドする、診断優先の新しい方法論を確立している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:23:23 GMT)
Learning to summarize user information for personalized reinforcement learning from human feedback [19.9]
Preference Learning Using Summarization (PLUS) は、強化学習を用いて、各ユーザの好みのテキストベースの要約を生成する。ユーザサマリゼーションモデルと報酬モデルの両方を同時にトレーニングし、オンラインのコ適応ループを作成する。 PLUSはユーザの好みを多様に把握し,報奨モデルの精度を11～77%向上することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:32:18 GMT)
Guidance Watermarking for Diffusion Models [19.8]
本稿では拡散モデルのための新しい透かし手法を提案する。市販の透かしデコーダから計算された勾配を用いて拡散過程を導出することに基づく。本手法は拡散過程の終端における変分オートエンコーダを変更する透かし手法と相補的であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:49:44 GMT)
InfiMed: Low-Resource Medical MLLMs with Advancing Understanding and Reasoning [19.8]
InfiMed-SFT-3B と InfiMed-RL-3B は7つのマルチモーダル医療ベンチマークで最先端のパフォーマンスを実現する。 InfiMed-RL-3Bの平均精度は59.2%であり、InternVL3-8Bのような大型モデルよりも57.3%高い。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:34:37 GMT)
InfiMed-Foundation: Pioneering Advanced Multimodal Medical Models with Compute-Efficient Pre-Training and Multi-Stage Fine-Tuning [19.8]
InfiMed-Foundation-1.7BとInfiMed-Foundation-4Bは、医療応用における最先端のパフォーマンスを実現するために設計された2つの医療用MLLMである。我々は、トレーニング効率を高めるために、低解像度画像分解能とマルチモーダルシーケンスパッキングを用いる。 InfiMed-Foundation-1.7BはQwen2.5VL-3Bを上回っ、InfiMed-Foundation-4BはHuatuoGPT-V-7BとMedGemma-27B-ITを上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:26:16 GMT)
DualNILM: Energy Injection Identification Enabled Disaggregation with Deep Multi-Task Learning [19.7]
本稿では,アプライアンス状態認識と入射エネルギー識別の2つのタスクを対象とした深層マルチタスク学習フレームワークであるDualNILMを提案する。我々の研究は、再生可能エネルギーの浸透を伴う現代のエネルギーシステムにおいて、この枠組みの強固なエネルギー分散の可能性を強調している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:09:20 GMT)
VQEzy: An Open-Source Dataset for Parameter Initialization in Variational Quantum Eigensolvers [19.7]
変分量子固有解法(VQEs)は、ノイズの多い中間スケール量子(NISQ)アルゴリズムの第一級である。 VQEzyはVQEパラメータの初期化のための最初の大規模データセットである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:58:42 GMT)
AnchDrive: Bootstrapping Diffusion Policies with Hybrid Trajectory Anchors for End-to-End Driving [19.7]
AnchDriveはエンドツーエンドの駆動のためのフレームワークである。従来の生成モデルの高い計算コストを軽減するために、拡散ポリシーをブートストラップする。 NAVSIMベンチマークの実験では、AnchDriveが新たな最先端を設定していることが確認された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:00:50 GMT)
A Theoretical Analysis of Discrete Flow Matching Generative Models [19.7]
本稿では、離散フローマッチング(DFM)生成モデルのエンドツーエンドトレーニングに関する理論的解析を行う。 DFMは、ニューラルネットワークをトレーニングして変形速度場を近似することにより、基礎となる生成ダイナミクスを学ぶ、有望な離散生成モデリングフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:48:56 GMT)
UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models [19.6]
生涯学習は、内部知識を継続的に更新することによって、大きな言語モデルが進化する情報に適応することを可能にする。 UltraEditは、トレーニング、主題、メモリフリーのアプローチであり、ウルトラスケーラブルで現実世界の生涯モデル編集に適しています。従来の最先端の方法よりも7倍高速で、VRAMは1/4以下である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:37:01 GMT)
ChartGalaxy: A Dataset for Infographic Chart Understanding and Generation [19.5]
インフォグラフィックチャートの理解を促進するために設計された100万規模のデータセットであるChartGalaxyを紹介する。データセットは、実際のインフォグラフィックチャートから75のチャートタイプ、440のチャートバリエーション、68のテンプレートを識別するインダクティブプロセスによって構築される。 1)微調整によるインフォグラフィックチャート理解の改善,2)インフォグラフィックチャートのベンチマークコード生成,3)インフォグラフィックチャート生成の実現。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:00:42 GMT)
DynaNav: Dynamic Feature and Layer Selection for Efficient Visual Navigation [19.5]
DynaNavは動的ビジュアルナビゲーションフレームワークで、シーンの複雑さに基づいて機能とレイヤの選択を適用する。訓練可能なハード機能セレクタを使用してスパース操作を行い、効率と解釈性を高めている。 ViNTと比較すると、DynnaNavはFLOPの2.26倍の減少、42.3%の推論時間、32.8%のメモリ使用率を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:15:31 GMT)
PilotRL: Training Language Model Agents via Global Planning-Guided Progressive Reinforcement Learning [19.5]
大規模言語モデル(LLM)はエージェント指向タスクの処理において顕著な進歩を見せている。現在のアプローチは主に教師付き微調整に依存しており、しばしばモデルが確立されたタスク完了軌跡を記憶させる。適応的グローバルプランベースエージェントパラダイムであるAdaPlanを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:04:34 GMT)
Following the TRACE: A Structured Path to Empathetic Response Generation with Multi-Agent Models [19.5]
共感的応答生成は、より人間らしく支持的な会話エージェントを作成するための重要なタスクである。既存の手法は、専門モデルの分析的深さと大規模言語モデルの生成的頻度との間の中心的なトレードオフに直面している。我々は,共感を構造化認知プロセスとしてモデル化する新しいフレームワークであるTRACEを提案し,そのタスクを解析と合成のためのパイプラインに分解する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:20:37 GMT)
Partial Parameter Updates for Efficient Distributed Training [19.4]
低コミュニケーション分散トレーニングのためのメモリ効率と計算効率の手法を提案する。本手法は,同一のトークンと帯域幅の予算の下で,従来の低通信方式の難易度と一致する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:39:44 GMT)
LUMINA: Detecting Hallucinations in RAG System with Context-Knowledge Signals [19.4]
Retrieval-Augmented Generation (RAG) は、検索した文書に応答を接地することで、大規模言語モデル(LLM)における幻覚を軽減することを目的としている。しかし、RAGベースのLLMは、正確で十分なコンテキストが提供されても、まだ幻覚的である。本稿では,RAGシステムにおける幻覚を検出する新しいフレームワークLUMINAを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:57:46 GMT)
Frequency-Domain Refinement with Multiscale Diffusion for Super Resolution [19.3]
周波数領域誘導型マルチスケール拡散モデル(FDDiff)を提案する。 FDDiffは、高周波情報補完プロセスをよりきめ細かいステップに分解する。これは、高忠実度超解像結果で先行生成法より優れる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:03:06 GMT)
Unifying Symbolic Music Arrangement: Track-Aware Reconstruction and Structured Tokenization [19.3]
自動マルチトラック音楽アレンジメントのための統合フレームワークを提案する。中心となるのは、トークンレベルのアンタングルされたコンテンツとスタイルで動作するセグメントレベルの再構築目標である。トラックワイズ・モデリングを支援するため,マルチトラック・シンボリック・ミュージックのための構造化トークン化手法であるREMI-zを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:10:50 GMT)
MUCAR: Benchmarking Multilingual Cross-Modal Ambiguity Resolution for Multimodal Large Language Models [19.2]
MLLM(Multimodal Large Language Models)は多くの視覚言語タスクにおいて大きな進歩を見せている。マルチランガルおよびクロスモーダルシナリオ間のマルチモーダル曖昧性解決を明示的に評価するために設計された新しいベンチマークであるMUCARを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:51:36 GMT)
Syncphony: Synchronized Audio-to-Video Generation with Diffusion Transformers [19.2]
380x640の解像度、24fpsのビデオが多様な音声入力と同期するSyncphonyを提案する。提案手法は,事前学習したビデオバックボーン上に構築され,同期性を改善するために2つの重要なコンポーネントが組み込まれている。 AVSync15とThe Greatest Hitsデータセットの実験では、Syncphonyは同期精度と視覚的品質の両方で既存のメソッドよりも優れています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:30:06 GMT)
Global Convergence in Neural ODEs: Impact of Activation Functions [19.2]
活性化関数の性質,特に滑らかさと非線形性は,運動力学の訓練に重要であることを示す。理論的知見は数値実験によって検証され、解析を支援し、ニューラルネットワークのスケーリングのための実践的ガイドラインを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:54:48 GMT)
GPU Temperature Simulation-Based Testing for In-Vehicle Deep Learning Frameworks [19.2]
本研究では,温度変化環境下での初めての自動車深層学習フレームワークテスト手法であるHeatherGuardianを提案する。具体的には、温度感受性演算子をターゲットにしたモデル変異ルールを使用してテスト入力モデルを生成し、Newtonの冷却則に基づいてGPU温度変動をシミュレートし、リアルタイムGPU温度に基づいてGPU周波数を制御する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:30:39 GMT)
We Think, Therefore We Align LLMs to Helpful, Harmless and Honest Before They Go Wrong [19.1]
Adaptive Multi-Branch Steering (AMBS) は、統合された効率的な多目的アライメントのための2段階の1-Nフレームワークである。 AMBSは、複数の7B LLMバックボーン間のHHHアライメントを一貫して改善する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:52:21 GMT)
The Measurement Imbalance in Agentic AI Evaluation Undermines Industry Productivity Claims [19.1]
本稿では,エージェントAIシステムに対する現在の評価手法が,業界生産性の主張に疑問を呈するシステム的不均衡を示すことを示す。 84論文(2023年-2025年)の体系的レビューでは,技術指標が評価を支配している評価の不均衡が明らかとなった。バランスの取れた4軸評価モデルを提案し、このパラダイムシフトをリードするようコミュニティに呼びかける。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:21:40 GMT)
JudgeAgent: Knowledge-wise and Dynamic LLM Evaluation with Agent-as-Interviewer [19.1]
大規模言語モデル(LLM)のための動的評価パラダイムであるエージェント・アズ・インタービューアを提案する。現在のベンチマークや動的相互作用のパラダイムとは異なり、エージェント・アズ・インタービューアはエージェントを使用して動的マルチターン質問生成においてより広く深い知識を得るために知識ツールを呼び出します。我々は、知識駆動型合成をエージェントのツールとして活用し、戦略指導として難易度スコアリングを利用する知識ワイドな動的評価フレームワークであるJiceAgentを開発する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:22:22 GMT)
UISim: An Interactive Image-Based UI Simulator for Dynamic Mobile Environments [19.0]
UISimは、スクリーンイメージから携帯電話環境を純粋に探索するための動的でインタラクティブなプラットフォームを提供する、画像ベースの新しいUIシミュレータである。初期電話画面イメージとユーザアクションが与えられたら、まず次のUI状態の抽象的なレイアウトを予測し、次に視覚的に一貫した新しいイメージを合成する。実験の結果、UISimは、現実的で一貫性のあるその後のUI状態を生成する際に、エンド・ツー・エンドのUI生成ベースラインを上回ります。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:02:00 GMT)
Unlocking the Power of Mixture-of-Experts for Task-Aware Time Series Analytics [19.0]
時系列分析は、天気予報、金融詐欺検出、IoTシステムの欠落データに対する計算、行動認識のための分類など、さまざまな現実世界のアプリケーションで広く利用されている。 MoEは強力なアーキテクチャでありながら、タスクに依存しないルータとチャネル相関をモデル化する能力の欠如により、時系列分析における汎用タスクへの適応に依然として不足している。 PatchMoEと呼ばれる新しいMoEベースの時系列フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:44:46 GMT)
MO-GRPO: Mitigating Reward Hacking of Group Relative Policy Optimization on Multi-Objective Problems [18.9]
グループ相対政策最適化は、正確な報酬モデルが利用できる場合に有効なアルゴリズムであることが示されている。報奨関数を値のばらつきに応じて自動的に重み付けする単純な正規化法により,GRPOの拡張であるMO-GRPOを提案する。また、MO-GRPOは、全ての報酬関数が優先順序を保ちながら損失関数に等しく寄与することを保証していることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:32:22 GMT)
NeuroScalar: A Deep Learning Framework for Fast, Accurate, and In-the-Wild Cycle-Level Performance Prediction [18.9]
本稿では,生産ハードウェア上での高忠実なインザワイルドシミュレーションのための新しいディープラーニングフレームワークを提案する。我々のコアコントリビューションは、仮説プロセッサ設計のためのサイクルレベルの性能を予測するために、マイクロアーキテクチャに依存しない機能に基づいて訓練されたDLモデルである。このフレームワークは,大規模なハードウェアA/Bテストと正確な性能解析を可能にすることを実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:36:06 GMT)
MotivGraph-SoIQ: Integrating Motivational Knowledge Graphs and Socratic Dialogue for Enhanced LLM Ideation [18.9]
大規模言語モデル(LLM)は、学術的思考を加速させる大きな可能性を秘めている。モチベーション・ナレッジグラフ(MotivGraph)とQ-Driven Socratic Ideatorを統合することを提案する。 MotivGraph-SoIQは、LCMベースのスコアリング、ELOランキング、人的評価指標にまたがる既存の最先端アプローチに対する明確なアドバンテージを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:02:05 GMT)
Mental Health Impacts of AI Companions: Triangulating Social Media Quasi-Experiments, User Perspectives, and Relational Theory [18.7]
我々は,AICCがウェルビーイングをどのように形成し,ユーザがこれらの経験をどう感じたかを検討した。発見は、感情と悲しみの表現、読みやすさ、対人的な焦点の混合効果を示した。私たちは、健全なバウンダリを把握し、マインドフルエンゲージメントをサポートし、依存のない開示をサポートし、表面的な関係ステージを持つAIコンパニオンに対して、設計上の意味を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:47:37 GMT)
Bézier Meets Diffusion: Robust Generation Across Domains for Medical Image Segmentation [18.6]
異なる医用画像モダリティにわたる堅牢な学習アルゴリズムのトレーニングは、大きなドメインギャップのために困難である。教師なしドメイン適応(UDA)は、ソースドメインからの注釈付きイメージとターゲットドメインからのラベルなしイメージを使用して、ディープモデルをトレーニングすることでこの問題を軽減する。既存のアプローチは、しばしばGANベースのスタイル転送に依存しているが、これらの手法は、高い可変性を持つ領域におけるクロスドメインマッピングの取得に苦慮している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:23:17 GMT)
Aurora: Towards Universal Generative Multimodal Time Series Forecasting [18.6]
ドメイン間の一般化は時系列予測において非常に重要である。最近の研究は、時系列基礎モデルとエンドツーエンドのマルチモーダル監視モデルの構築に重点を置いている。本稿では,マルチモーダル入力とゼロショット推論をサポートするマルチモーダル時系列ファウンデーションモデルであるAuroraを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:56:20 GMT)
Causal-EPIG: A Prediction-Oriented Active Learning Framework for CATE Estimation [18.6]
本稿では,獲得関数が観測不能な因果量をターゲットにすべきとする因果的客観的アライメントの原理を紹介する。我々はCausal-EPIGフレームワークを通じてこの原則を運用する。基本的なトレードオフを具現化する2つの異なる戦略を導出します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:44:27 GMT)
Uncovering Alzheimer's Disease Progression via SDE-based Spatio-Temporal Graph Deep Learning on Longitudinal Brain Networks [18.5]
我々は、将来のアルツハイマー病(AD)の進行を予測するニューラルネットワークフレームワークを開発する。筆者らの枠組みは, 地域的, 結合的重要性の低い確率を効果的に学習する。以上の結果から,AD進行の早期・個別化予測における時間グラフ学習の可能性が示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:02:34 GMT)
Pedestrian Attribute Recognition via Hierarchical Cross-Modality HyperGraph Learning [18.5]
本稿では,標準歩行者属性認識フレームワークを強化するための知識グラフ誘導型クロスモーダルハイパーグラフ学習フレームワークを提案する。複数のPARベンチマークデータセットの実験は、提案した知識グラフの有効性を徹底的に実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:25:43 GMT)
Concept activation vectors: a unifying view and adversarial attacks [18.5]
コンセプトアクティベーションベクトル(Concept Activation Vectors、CAV)は、説明可能なAIのツールである。それらは、概念クラスまたは非概念の例に属する入力の隠れ層活性化から計算される。確率論的観点を採用すると、(非)概念入力の分布はCAV上の分布を誘導し、潜在空間におけるランダムなベクトルとなる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:22:31 GMT)
UML-CoT: Structured Reasoning and Planning with Unified Modeling Language for Robotic Room Cleaning [18.5]
CoT(Chain-of-Thought)は、大規模言語モデル(LLM)の推論を改善するが、非構造化テキストへの依存は、エンボディされたタスクの解釈可能性と実行可能性を制限する。本稿では,UML(Unified Modeling Language)を利用してシンボルCoTと実行可能なアクションプランを生成する構造的推論・計画フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:51:46 GMT)
StepORLM: A Self-Evolving Framework With Generative Process Supervision For Operations Research Language Models [18.5]
我々は、生成過程を監督する新しい自己進化フレームワークであるStepORLMを紹介する。 StepORLMの中核となるのは、ポリシーモデルと生成プロセス報酬モデル(GenPRM)が相互に反復的に改善される、共進化ループである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:39:10 GMT)
Bilinear relational structure fixes reversal curse and enables consistent model editing [18.5]
逆の呪いは本質的に失敗ではなく、モデルが知識をエンコードする方法の成果であることを示す。関係知識グラフの合成データセットをスクラッチからトレーニングすることにより、両線形関係構造が隠れ表現に現れることを示す。この構造は逆の呪いを著しく軽減し、LMが見えない逆の事実を推測することを可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:19:39 GMT)
MoWM: Mixture-of-World-Models for Embodied Planning via Latent-to-Pixel Feature Modulation [18.5]
MoWMは、ハイブリッドワールドモデルから表現を融合して、具体的アクションプランニングを行う混合世界モデルフレームワークである。提案手法では,ピクセル空間モデルから微細な視覚的特徴の抽出を誘導する,潜在モデルからの動き認識表現を高レベルな事前表現として利用する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:54:36 GMT)
Gradient-based multi-focus image fusion with focus-aware saliency enhancement [18.3]
MFIF(Multi-focus Image fusion)は、複数の部分集中インプットから全焦点画像を取得することを目的としている。本稿では,高品質な融合境界を生成する重要な境界拡張に基づくMFIF法を提案する。本手法は主観的評価と客観的評価の両面で,12の最先端手法を一貫して上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:20:44 GMT)
KG-SAM: Injecting Anatomical Knowledge into Segment Anything Models via Conditional Random Fields [18.3]
KG-SAMは知識誘導型フレームワークで、解剖学的な事前情報と境界修正と不確実性推定を統合している。 KG-SAMは前立腺のセグメンテーションで平均82.69%のDiceスコアを達成し、腹部のセグメンテーションでかなりの利得をもたらす。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:29:12 GMT)
Black-Box Hallucination Detection via Consistency Under the Uncertain Expression [18.3]
大規模言語モデル(LLM)は、非現実的な応答、いわゆる「ハロシン化(hallucination)」問題を生成することで有名である。簡単なブラックボックス幻覚検出尺度を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:26:16 GMT)
Teaching Transformers to Solve Combinatorial Problems through Efficient Trial & Error [18.2]
本研究では,従来のニューロシンボリックアプローチと比較して,スドクのパラダイム的課題に着目し,最先端の精度(99%)を達成する。提案手法は,単純なスドク規則の模倣学習と,Depth-First Search(DFS)探索戦略を統合する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:57:34 GMT)
Semantic Agreement Enables Efficient Open-Ended LLM Cascades [18.1]
カスケードシステムは、可能な限り小さなモデルに計算要求をルーティングし、必要な時にのみ大きなモデルに遅延する。我々は,信頼度の高い推論のための訓練自由信号として意味的合意を提案する。セマンティックカスケードは、40%のコストでターゲットモデル品質に適合または超過し、最大60%のレイテンシを削減している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:51:28 GMT)
"Your AI, My Shell": Demystifying Prompt Injection Attacks on Agentic AI Coding Editors [18.1]
攻撃者が悪質な指示で外部開発資源に毒を盛ることで、リモートでこれらのシステムを利用する方法を示す。 AIShellJackはエージェントAIコーディングエディタのインジェクション脆弱性を評価する自動テストフレームワークである。評価の結果,攻撃成功率は悪意のあるコマンドを実行する場合,最大84%に達する可能性が示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:20:54 GMT)
SimulSense: Sense-Driven Interpreting for Efficient Simultaneous Speech Translation [18.1]
現在の最先端システムは、マルチターン対話タスクとしてSimulSTを定式化している。入力音声を連続的に読み取ることで、人間の通訳を模倣するSimulSTの新しいフレームワークであるSimulSenseを提案する。提案手法は,高品質なレイテンシトレードオフを実現し,リアルタイムの効率を大幅に向上させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:18:10 GMT)
Can LLMs be Good Graph Judge for Knowledge Graph Construction? [18.1]
上記の課題に対処するためのKG構築フレームワークである textbfGraphJudge を提案する。本フレームワークでは,文書中のノイズ情報を除去するためのエンティティ中心の戦略を設計する。そして、LLMをグラフ判定器として微調整し、生成したKGの品質を最終的に向上させた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:25:50 GMT)
POEM: Explore Unexplored Reliable Samples to Enhance Test-Time Adaptation [18.0]
テストタイム適応(TTA)は、ソースモデルから未知のテストデータに、潜在的分散シフトをオンライン形式で転送することを目的としている。本稿では,従来未使用であったreliablunderlinetextbfored reliablunderlinetextbfe saunderlinetextbfmplegnosticsを用いてTTAを促進するための一般的なアプローチである underlinePOEM を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:34:07 GMT)
Boosting Pointer Analysis With Large Language Model-Enhanced Allocation Function Detection [17.9]
既存のアプローチは、主にカスタムアロケータを見落とし、粗いエイリアスと分析精度の低下につながる。 AFDは、カスタムアロケーション関数を自動的に識別し、モデル化することにより、ポインタ解析を強化する新しい技術である。 AFDを実世界の15のプロジェクトで評価し,600以上のカスタムAFを同定した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:08:58 GMT)
Unstable Unlearning: The Hidden Risk of Concept Resurgence in Diffusion Models [17.9]
一見無関係な画像にテキストから画像への拡散モデルを微調整することで、以前は「未学習」だった概念を「再学習」することができることを示す。本研究は,インクリメンタルなモデル更新の脆弱さを浮き彫りにして,テキスト・ツー・イメージ拡散モデルの安全性と整合性を確保するための現在のアプローチに対する深刻な新たな懸念を提起するものである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:06:23 GMT)
BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Models [17.9]
LoRAのような低ランク適応法は「カタストロフィック継承」を悪化させる Bias-Alleviating Low-Rank Adaptation (BA-LoRA)を紹介する。以上の結果から,BA-LoRAは性能および安定性の点で最先端のLoRAよりも優れるだけでなく,目標評価に対する頑健性とバイアス軽減の定量的に優れていることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:54:47 GMT)
Aerial Path Planning for Urban Geometry and Texture Co-Capture [17.9]
本稿では,事前知識が限定された都市形状とテクスチャ共捕獲問題を紹介する。唯一の入力は、ターゲットエリアの2次元建物の輪郭図と、建物の上の安全な飛行高度である。構造幾何学と高忠実度テクスチャの両方を再構成するための画像の共撮を目的とした革新的な空中経路計画フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:38:42 GMT)
Unforgettable Lessons from Forgettable Images: Intra-Class Memorability Matters in Computer Vision [17.9]
クラス内の特定の画像が他のクラスよりも記憶可能なクラス内記憶性を導入する。画像提示の時間間隔を計算に組み込んだ新しい指標であるICMscore(Intra-Class Memorability score)を提案する。 Intra-Class Memorability dataset (ICMD) をキュレートし、2000人の参加者の回答から得られたICMスコアを用いて10のオブジェクトクラスに5,000以上の画像を含む。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:48:08 GMT)
SK2Decompile: LLM-based Two-Phase Binary Decompilation from Skeleton to Skin [17.8]
SK2Decompileは,スケルトン(意味構造)からプログラムのスキン(識別器)へデコンパイルするための新しい2相アプローチである。具体的には、まず、プログラムの「スケルトン」の導出として、プログラムのバイナリコードを中間表現(IR)に変換する構造回復モデルを適用する。我々は,コンパイラが期待する構文的・意味的規則に従うプログラム構造を生成するモデルに,強化学習を適用した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:35:46 GMT)
Learning to Segment for Vehicle Routing Problems [17.8]
車両ルーティング問題(VRPs)の最先端技術として広く認識されているイテレーティブ本研究では, 解の大部分が安定であり, 探索を繰り返して変化しないため, 冗長な計算が生じる。我々は、反復解法を高速化するために、FSTA(First-Segment-Then-Aggregate)分解技法の正式な研究を開拓した。我々は3つのL2Seg変種を提示する:非自己回帰(グローバルに包括的だが局所的に無差別)、自己回帰(局所的に洗練されているが、グローバルに不足している)、およびそれらの相乗効果。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:09:55 GMT)
SeamCrafter: Enhancing Mesh Seam Generation for Artist UV Unwrapping via Reinforcement Learning [17.7]
我々は、ポイントエンコーダ入力に条件付き自己回帰GPTスタイルのシームジェネレータであるSeamCrafterを紹介する。 SeamCrafterは、従来のアプローチよりも歪みや断片化が著しく低いシームを生成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:01:38 GMT)
Category Discovery: An Open-World Perspective [17.6]
カテゴリー発見(CD)は、非競合データを自動的に分類することを目的とした、新たなオープンワールド学習タスクである。文献の総合的なレビューを行い、様々な手法について詳細な分析と詳細な議論を行う。大規模に訓練されたバックボーン,階層的および補助的なキュー,カリキュラムスタイルのトレーニングが,すべてカテゴリ発見に有用であることを示す重要な知見を抽出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:19:05 GMT)
Online Resource Allocation with Average Budget Constraints [17.5]
平均予算制約によるオンライン資源配分の問題点を考察する。簡単なポリシーがOmega(sqrtT)$ regretを達成していることを示す。予算安全バッファを組み込んだ新しいポリシーを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:06:32 GMT)
Tricks and Plug-ins for Gradient Boosting with Transformers [17.4]
BoostTransformerは、サブグリッドトークンの選択と重要度の高いサンプリングを通じて、トランスフォーマーを強化します。提案手法はトランスパイプラインに直接最小2乗推進目標を組み込むことで,より効率的なトレーニングと性能向上を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:57:01 GMT)
Tricks and Plug-ins for Gradient Boosting in Image Classification [17.4]
本稿では,動的特徴選択とBoostCNNの原理を統合したCNN性能向上のための新しいフレームワークを提案する。以上の結果から,従来のCNNよりも予測性能とトレーニング速度が優れていたことが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:53:26 GMT)
MoveFM-R: Advancing Mobility Foundation Models via Language-driven Semantic Reasoning [17.4]
モビリティ・ファンデーション・モデル(MFM)は、人間の動きパターンのモデリングを進歩させたが、データスケールと意味理解の制限により天井に面している。本稿では,言語駆動型セマンティック推論機能を活用することで,モビリティ基盤モデルの潜在能力を最大限に活用する新しいフレームワークであるMoveFM-Rを提案する。 MoveFM-Rは、地理的言語ギャップを埋めるために意味的に拡張された位置エンコーディング、進歩的なカリキュラム、対話的な自己回帰メカニズムの3つの中心的なイノベーションに基づいて構築されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:31:57 GMT)
Lightweight error mitigation strategies for post-training N:M activation sparsity in LLMs [17.4]
本研究は,大規模言語モデルにおけるN:Mアクティベーションプルーニングの学習後手法を包括的に分析する。本研究は, 刈り込み活性化により, 同等の空間レベルでの刈り込みに比べて, 生成能の保存性が向上できることを実証する。本研究は,アクティベーションプルーニングの効果的な実践方法と,よりフレキシブルなスパーシティパターンをサポートする将来のハードウェアへのモチベーションを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:27:55 GMT)
Ctrl-Z Sampling: Diffusion Sampling with Controlled Random Zigzag Explorations [17.4]
本稿では,局所的な急激な最大値の検出と回避を適応的に行う新しいサンプリング戦略を提案する。 Ctrl-Zサンプリングは生成品質を著しく向上するが,元のNFEの7.72倍程度しか必要としないことを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:52:12 GMT)
SecureAgentBench: Benchmarking Secure Code Generation under Realistic Vulnerability Scenarios [17.3]
SecureAgentBenchは、セキュアなコード生成において、コードエージェントの機能を厳格に評価するために設計された105のコーディングタスクのベンチマークである。その結果、(i)現在のエージェントがセキュアなコードを生成するのに苦労していることが示され、最高のパフォーマンスのエージェントであるDeepSeek-V3.1がサポートしているSWE-agentも15.2%の正安のソリューションしか達成していない。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:18:57 GMT)
Order Matters! An Empirical Study on Large Language Models' Input Order Bias in Software Fault Localization [17.0]
本研究では,入力順序と文脈サイズが大規模言語モデル(LLM)の性能に及ぼす影響について検討する。 JavaプロジェクトのTop-1 FL精度は57%から20%に低下しますが、Pythonプロジェクトでは、コード順序を逆転すると38%から約3%に低下します。入力を小さなコンテキストに分割することで、このバイアスを減らし、FLのパフォーマンスギャップを22%から6%に減らし、両方のベンチマークで1%に減らします。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:33:14 GMT)
Prompt-guided Representation Disentanglement for Action Recognition [17.0]
ProDA(Prompt-Guided Disentangled Representation for Action Recognition)を提案する。 ProDAは、特定のアクションをマルチアクションシーンから切り離す。動的重みを使って情報を集約するビデオ適応型グラフパーシングニューラルネットワーク(GPNN)を設計する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:39:40 GMT)
Challenges in Non-Polymeric Crystal Structure Prediction: Why a Geometric, Permutation-Invariant Loss is Needed [17.0]
分子集合問題に焦点をあて、同一の剛性分子のセット$mathcalS$を充填して結晶構造を形成する。本稿では,鍵となる幾何学的特性を捉えた損失関数を導入する,より優れた定式化を提案する。注目すべきは、このフレームワーク内では、単純な回帰モデルは、すでに以前のアプローチよりも優れています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:33:29 GMT)
Training-Free Multimodal Deepfake Detection via Graph Reasoning [16.8]
マルチモーダルディープフェイク検出(MDD)は、視覚的、テキスト的、聴覚的モダリティにまたがる操作を明らかにすることを目的としている。我々はMDDのためのトレーニングフリーフレームワークであるGASP-ICL(Guid Adaptive Scorer and Propagation In-Context Learning)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:22:12 GMT)
Polysemous Language Gaussian Splatting via Matching-based Mask Lifting [16.8]
MUSplatは、機能の最適化を完全に放棄した、トレーニング不要のフレームワークである。パイプラインは多粒性2Dマスクを3次元に生成し,各ガウス点に対する前景確率を推定し,初期対象群を形成する。次に、これらの初期群のあいまいな境界を意味エントロピーと幾何学的不透明度を用いて最適化する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:38:05 GMT)
A Multi-Level Framework for Multi-Objective Hypergraph Partitioning: Combining Minimum Spanning Tree and Proximal Gradient [16.8]
本稿では,新しい非目的制約緩和モデルに基づく効率的な高速化分割フレームワークを提案する。提案アルゴリズムは,KaHyParと比較して,カットサイズを約2%--5%削減できることを示す。また,提案手法により,hMetisパーティションを最大16%改善することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:55:30 GMT)
Tokenizing Single-Channel EEG with Time-Frequency Motif Learning [16.7]
本稿では,新しいトークン化フレームワークであるFM-Tokenizerを提案する。単一チャネルのEEG信号から時間周波数モチーフの語彙を学び、それらを離散トークンにエンコードする。信号形式, チャネル構成, 記録装置, タスクの事前学習データと異なる耳-EEG睡眠ステージング実験により, トークン化装置がベースラインを14%上回ることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:48:12 GMT)
Reimagining Agent-based Modeling with Large Language Model Agents via Shachi [16.6]
大規模言語モデル(LLM)によるマルチエージェントシステムにおける創発的行動の研究は重要な研究課題である。エージェントのポリシーをコア認知コンポーネントに分解する形式的方法論とモジュラーフレームワークであるShachiを紹介する。提案手法を総合的な10タスクベンチマークで検証し,新しい科学的探究を通じてその能力を実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:38:59 GMT)
LongScape: Advancing Long-Horizon Embodied World Models with Context-Aware MoE [16.6]
LongScapeは、チャンク内拡散とチャンク間自己回帰因果生成を組み合わせたハイブリッドフレームワークである。私たちの中心となるイノベーションは、ロボットアクションのセマンティックコンテキストに基づいてビデオを分割するアクションガイド付き可変長チャンキングメカニズムです。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:47:05 GMT)
OS-W2S: An Automatic Labeling Engine for Language-Guided Open-Set Aerial Object Detection [16.5]
我々は,大規模言語誘導型オープンセット空中検出データセットを開発した。 MI-OADには163,023枚の画像と200万枚の画像が格納されている。 MI-OAD は、+31.1 AP$_50$ と +34.7 Recall@10 で Grounding DINO をリフトする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:51:15 GMT)
Cross-modal RAG: Sub-dimensional Text-to-Image Retrieval-Augmented Generation [16.4]
Cross-modal RAGは、クエリとイメージの両方をサブ次元のコンポーネントに分解する新しいフレームワークである。本稿では,サブ次元スパースレトリバーと高密度レトリバーを組み合わせたハイブリッド検索手法を提案する。 MS-COCO、Flickr30K、WikiArt、CUB、ImageNet-LTの実験では、クロスモーダルRAGが検索において既存のベースラインを大幅に上回ることを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:48:32 GMT)
Dual Optimistic Ascent (PI Control) is the Augmented Lagrangian Method in Disguise [16.4]
ラグランジアン上の双対楽観的な昇華は、増進ラグランジアン上の勾配降下昇華と同値であることを示す。この発見により、ALMの堅牢な理論的保証を双対楽観的な設定に移行し、すべての局所解に線型収束することを証明できる。我々の研究は、双対楽観的手法の実証的成功と理論的基礎の間に重要なギャップを埋める。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:41:20 GMT)
SBFA: Single Sneaky Bit Flip Attack to Break Large Language Models [16.4]
Bit-Flip攻撃はディープニューラルネットワーク(DNN)を著しく損なう SBFA(Sneaky Bit-Flip Attack)を提案する。パラメータ感度の基準であるImpactScoreを用いて、反復的な検索とランキングによって達成される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:03:53 GMT)
LoRA-MGPO: Mitigating Double Descent in Low-Rank Adaptation via Momentum-Guided Perturbation Optimization [16.4]
LoRA-MGPO は Momentum-Guided Perurbation Optimization (MGPO) を組み込んだフレームワークである。 MGPOは勾配状態から運動量ベクトルを誘導する運動力学を安定化させる。実験の結果, LoRA-MGPO は LoRA や他のPEFT 法よりも優れた性能を発揮することがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:04:08 GMT)
Bottlenecked Transformers: Periodic KV Cache Consolidation for Generalised Reasoning [16.4]
トランスフォーマーLSMは推論時間計算でスケールする強力な推論能力を示すことが示されている。 KVキャッシュの書き直しによるメモリ(re)統合が、推論の改善に有効である理由を理論的に正当化する。我々のモデルでは、バニラトランスフォーマーと停止する拡張ベースラインに対して一貫したパフォーマンス向上が見られ、選択されたタスク/バックボーンに対して最大6.6ppのゲインが得られる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:35:04 GMT)
Diffusion Curriculum: Synthetic-to-Real Data Curriculum via Image-Guided Diffusion [16.4]
品質の低いデータや少ないデータは、実際にディープニューラルネットワークをトレーニングする上で大きな課題となっている。拡散カリキュラム(DisCL)は、訓練段階ごとに画像合成のイメージガイダンスレベルを調整する。 DisCLは、多様性や品質に弱いかもしれない高感度画像を学習するウォームアップとして、高品質な画像から特徴を学ぶことに焦点を当てている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:24:32 GMT)
VAT-KG: Knowledge-Intensive Multimodal Knowledge Graph Dataset for Retrieval-Augmented Generation [16.2]
マルチモーダル知識グラフ(MMKG)は、複数のモーダルにまたがる明示的な知識を表す。 Visual-Audio-Text Knowledge Graph (VAT-KG)は、概念中心で知識集約型のマルチモーダル知識グラフである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:43:45 GMT)
WAVE: Learning Unified & Versatile Audio-Visual Embeddings with Multimodal LLM [16.2]
WAVEは、テキスト、オーディオ、ビデオのモダリティを統一した表現空間を作成する最初のLCMベースの埋め込みである。 WAVEは、MMEB-v2ビデオベンチマークに新しい最先端技術を設定し、オーディオとオーディオの検索において優れた結果を得る。私たちのコード、チェックポイント、データはリリースされます。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:13:37 GMT)
Non-Linear Trajectory Modeling for Multi-Step Gradient Inversion Attacks in Federated Learning [16.2]
グラディエント・インバージョン・アタック(GIA)に対する非線形パラメトリック・トラジェクトリ・モデリングを導入する最初の方法であるNL-SME(Non-Linear Surrogate Model Extension)を提案する。提案手法は,SGDの曲線特性を制御点から捉えた学習可能な2次B'ezier曲線に置き換え,正規化とdvecスケーリング機構を併用して表現性を向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:04:25 GMT)
Fine-Grained Detection of Context-Grounded Hallucinations Using LLMs [16.2]
コンテキストグラウンドド・幻覚(Context-grounded hallucination)は、モデル出力がソーステキストに対して検証できない情報を含む場合である。このような幻覚を局在化するためのLCMの適用性について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:03:24 GMT)
LLMs Behind the Scenes: Enabling Narrative Scene Illustration [16.0]
本研究では、物語のシーンを描写した画像を自動的に生成するストーリーシーンイラストアのタスクに焦点を当てる。近年のテキスト・ツー・イメージ・モデルの発展により,LLMをテキスト・ツー・イメージ・モデルを促進するインタフェースとして利用するパイプラインが検討されている。このパイプラインのバリエーションを顕著なストーリーコーパスに適用し、これらのストーリーのシーンのイラストを合成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:15:18 GMT)
An Exploratory Study on Fine-Tuning Large Language Models for Secure Code Generation [16.0]
脆弱性修正コミットのデータセット上で学習済みの大規模言語モデルがセキュアなコード生成を促進するかどうかを検討する。オープンソースのリポジトリから、確認済みの脆弱性のコード修正を収集することで、セキュアなコード生成のための微調整データセット(14,622 C/C++ファイル)をクロールします。 C言語のセキュリティの最大改善は6.4%、C++言語の5.0%です。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:50:10 GMT)
Reversible GNS for Dissipative Fluids with Consistent Bidirectional Dynamics [16.0]
Reversible Graph Network Simulator (R-GNS)は、単一のグラフアーキテクチャ内で双方向の一貫性を強制する統一フレームワークである。 R-GNSはパラメータの4分の1で高い精度と一貫性を実現し、最適化ベースのベースラインよりも100倍以上高速な逆推論を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:21:31 GMT)
Multi-View Hypercomplex Learning for Breast Cancer Screening [16.0]
多視点乳がん分類のための新しい学習パラダイムである多視点超複雑学習を導入する。超複素代数のおかげで、我々のモデルは本質的にビュー内関係とビュー間関係の両方を捉えている。我々のアプローチは、最先端のマルチビューモデルよりも一貫して優れています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:46:44 GMT)
Same Content, Different Representations: A Controlled Study for Table QA [15.9]
リアルタイム設定におけるテーブル質問回答(Table QA)は、構造化されたデータベースとテキストフィールドを含む半構造化されたテーブルの両方で操作する必要がある。既存のベンチマークは固定データ形式に結びついており、表現自体がモデルパフォーマンスに与える影響を体系的に検討していない。コンテント定数を一定に保ちながら構造を変化させることによりテーブル表現の役割を分離する最初の制御された研究について述べる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:33:19 GMT)
RelMap: Enhancing Online Map Construction with Class-Aware Spatial Relation and Semantic Priors [15.8]
本稿では,オンラインHDマップ構築を改善するために,空間関係とセマンティック先行の両方を明示的にモデル化するエンドツーエンドフレームワークを提案する。 RelMapは、単一フレームと時間知覚の両方のバックボーンと互換性があり、nuScenesとArgoverse 2データセットの両方で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:32:56 GMT)
Learning Unified Representation of 3D Gaussian Splatting [15.8]
十分に設計されたベクトル化表現は、3Dガウススプラッティングに固有の学習システムにとって不可欠である。本稿では,ガウス原始体の固有情報をカプセル化した連続部分多様体場に基づく3DGSの埋め込み表現を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:44:59 GMT)
ZeroTuning: Unlocking the Initial Token's Power to Enhance Large Language Models Without Training [15.8]
我々はZeroTuningを紹介した。ZeroTuningは、初期トークンに頭部特異的な注意調整を適用することで、LCMの性能を向上させる訓練自由な方法である。このトークンの注意ログに軽量バイアスを加えることで、下流の注意分布のエントロピーを単調に制御できることが理論的に示されている。検証例を校正する教師ありモードと、モデルの出力エントロピーを直接最小化する教師なしモードの2つのバリエーションを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:55:57 GMT)
ChatInject: Abusing Chat Templates for Prompt Injection in LLM Agents [15.8]
ChatInjectは、悪意のあるペイロードをフォーマットしてネイティブチャットテンプレートを模倣する攻撃である。我々は,会話の交互にエージェントを素数化して不審な行為を受け入れ,実行させる,説得駆動型マルチターン変異体を開発した。 ChatInjectは従来のプロンプトインジェクション法よりも平均的な攻撃成功率が高い。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:38:07 GMT)
Latent Concept Disentanglement in Transformer-based Language Models [15.8]
大規模言語モデル(LLM)は、新しいタスクを解決するためにコンテキスト内学習(ICL)を使用する。これにより、トランスフォーマーがその計算の一部として潜在構造をどのように表現するかという疑問が提起される。我々は機械的解釈可能性を用いてこの問題を研究する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:37:33 GMT)
SemanticControl: A Training-Free Approach for Handling Loosely Aligned Visual Conditions in ControlNet [15.7]
ControlNetは、深度やエッジマップなどの視覚的条件を組み込むことで、テキストから画像への拡散モデルにおける詳細な空間制御を可能にした。現在のコントロールネットモデルは、ゆるやかに整列された視覚的条件を使用するのに苦労しており、しばしばテキストの忠実度や視覚的アーティファクトが低下する。本研究では,意味論的に関係のある視覚条件を効果的に活用するためのトレーニング不要なSemanticControlを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:22:15 GMT)
Unsupervised Speech Enhancement using Data-defined Priors [15.7]
教師なし音声強調のための新しいデュアルブランチエンコーダ・デコーダアーキテクチャを提案する。提案手法は,教師なし音声強調手法に匹敵する性能を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:16:08 GMT)
Efficient Prior Selection in Gaussian Process Bandits with Thompson Sampling [15.6]
GPトンプソンサンプリング(GP-TS)に基づくGPバンディットの結合前選択と後悔の最小化のための2つのアルゴリズムを提案する: GP-TS(PE-GP-TS)とHyperPrior GP-TS(HP-GP-TS)である。理論的にはアルゴリズムを解析し,それぞれの後悔に対する上限を確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:13:04 GMT)
Does AI Coaching Prepare us for Workplace Negotiations? [15.6]
私たちは、AIコーチのプロトタイプであるTruceyと、従来の交渉ハンドブックを比較します。手帳の包括的でレビュー可能な内容は参加者の自信と準備に不可欠であった。参加者はAIのリハーサル能力を評価したが、その指導はしばしば冗長で断片的であると感じた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:21:24 GMT)
EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning [15.5]
スパース報酬を伴うマルチターン環境におけるLLMエージェントの訓練は、強化学習の根本的な課題である。この設定に特有のクリティカルな障害モード、すなわち探索・探索カスケードの障害を特定します。本稿では,この障害サイクルを3つの相乗的メカニズムによって破る一般的なフレームワークであるエントロピー規則化政策最適化(EPO)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:51:44 GMT)
Decentralized Aerial Manipulation of a Cable-Suspended Load using Multi-Agent Reinforcement Learning [15.5]
本稿では, マイクロ空力車(MAV)チームを用いて, ケーブルサスペンション負荷の実世界の6-DoF操作を可能にする最初の分散化手法を提案する。提案手法はマルチエージェント強化学習(MARL)を利用して,MAV毎に外部ループ制御ポリシーを訓練する。本研究では,負荷モデルの不確実性を考慮した実世界の実環境実験において,本手法の有効性を検証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:39:00 GMT)
Reinforcement Learning Based Traffic Signal Design to Minimize Queue Lengths [15.4]
本稿では、RL(Reinforcement Learning)を活用して全信号位相の待ち行列長を最小化する適応型TSCフレームワークを提案する。提案アルゴリズムは,都市交通シミュレータ(SUMO)を用いて実装されている。最も優れた構成は、従来のWebster法と比較して平均キュー長を約29%削減する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:23:30 GMT)
Defending MoE LLMs against Harmful Fine-Tuning via Safety Routing Alignment [15.4]
大規模言語モデル(LLM)に適した安全な微調整法であるSafeMoEを提案する。 SafeMoEは、微調整モデルのルーティングウェイトと初期安全整合モデルのルーティングウェイトとのギャップを埋めることによって、ルーティングドリフトを直接緩和する。実験の結果、SafeMoEはHFT攻撃を効果的に軽減し、OLMoEの有害度スコアを62.0から5.0に下げた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:10:32 GMT)
ChaosNexus: A Foundation Model for Universal Chaotic System Forecasting with Multi-scale Representations [15.4]
ChaosNexusは、カオス力学の多様なコーパスに基づいて事前訓練された基礎モデルである。これは、合成ベンチマークと実世界のベンチマークの両方で最先端のゼロショットの一般化を実証している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:59:12 GMT)
TRACE: Learning to Compute on Graphs [15.3]
アーキテクチャ的に健全なバックボーンと原則学習目標に基づいて構築された新しいパラダイムである textbfTRACE を紹介する。まず、TRACEは階層変換器を使用し、計算のステップバイステップフローを反映する。第2に、学習問題を分離する新しい目的であるtextbffunction shift learningを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:22:32 GMT)
Why High-rank Neural Networks Generalize?: An Algebraic Framework with RKHSs [15.3]
我々は、クープマン演算子、グループ表現、再現カーネルヒルベルト空間(RKHS)を用いたディープニューラルネットワークに対する新しいRademacher複雑性を導出する。提案したバウンダリは、高階重量行列を持つモデルがよく一般化する理由を記述している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:30:37 GMT)
Collusion-Driven Impersonation Attack on Channel-Resistant RF Fingerprinting [15.3]
本稿では, 偽りのRFレベルの模倣を実現する, 共謀駆動型偽装攻撃を提案する。提案手法は,異なるチャネル条件下で95%以上の成功率を維持する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:13:34 GMT)
Beyond Textual Context: Structural Graph Encoding with Adaptive Space Alignment to alleviate the hallucination of LLMs [15.3]
SSKG-LLMは、KGの構造情報を大規模言語モデルの推論プロセスに効率的に統合する革新的なモデルアーキテクチャである。我々は、広範囲にわたる実験を行い、かつ、KGの構造情報を組み込むことによって、LLMの事実推論能力を高める方法について、詳細な分析を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:14:01 GMT)
STHN: Deep Homography Estimation for UAV Thermal Geo-localization with Satellite Imagery [15.1]
粗大から細い深部ホログラフィー推定手法を用いたUAV熱ジオローカライズ手法を提案する。この方法は、UAVの最後の位置から半径512メートル以内で、信頼性の高い熱的位置決めを可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:27:13 GMT)
MindCraft: How Concept Trees Take Shape In Deep Models [15.1]
コンセプトツリー上に構築されたMindCraftフレームワークを紹介します。概念木は階層的な概念の出現を再構築し、共有表現から線形に分離可能な部分空間へと正確に分岐する。実証的な評価は、概念ツリーが意味的階層を回復し、潜在概念を歪め、複数のドメインにまたがって広く適用可能であることを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:39:52 GMT)
JGU Mainz's Submission to the WMT25 Shared Task on LLMs with Limited Resources for Slavic Languages: MT and QA [15.1]
パラメータ効率を考慮したQwen2.5-3B-Instructモデルについて検討した。我々のパイプラインは、追加の翻訳と複数選択質問応答(QA)データを統合する。実験により、我々のモデルは両方のタスクのベースラインより優れています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:35:38 GMT)
Preference-Guided Learning for Sparse-Reward Multi-Agent Reinforcement Learning [15.0]
少額の報酬のある環境におけるオンラインマルチエージェント強化学習(MARL)の課題について検討する。中間報酬の欠如は、標準のMARLアルゴリズムがポリシー学習を効果的に導くのを妨げる。本稿では,オンライン・逆選好学習とマルチエージェント・オン・ポリシー最適化を統合した新しいフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:41:40 GMT)
Learning Hierarchical Domain Models Through Environment-Grounded Interaction [15.0]
オープンワールド環境では、単一の汎用ドメインモデルは様々なタスクをキャプチャできない。大きな言語モデル(LLM)はそのようなドメインを生成することができるが、適用性を制限する高いエラー率に悩まされる。 LLMと環境基盤からの自律的ドメイン学習のためのフレームワークであるLODGEを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:32:46 GMT)
Library Hallucinations in LLMs: Risk Analysis Grounded in Developer Queries [14.9]
大規模言語モデル(LLM)は、コードを生成するためにますます使われていますが、幻覚を継続し、しばしば存在しないライブラリを発明します。 LLM生成コードのライブラリ幻覚にユーザレベルのプロンプト変動がどう影響するかについて,最初の系統的研究を行った。ライブラリ名の1文字のミススペルは、最大26%のタスクで幻覚を引き起こし、偽のライブラリ名は最大99%のタスクで受け入れられ、時間関連のプロンプトは最大84%のタスクで幻覚を引き起こす。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:14:38 GMT)
KAME: Tandem Architecture for Enhancing Knowledge in Real-Time Speech-to-Speech Conversational AI [14.7]
リアルタイム音声合成(S2S)モデルは低レイテンシな会話応答を生成するのに優れているが、深い知識と意味理解が欠けていることが多い。自動音声認識、テキストベース大規模言語モデル(LLM)、テキスト音声合成を組み合わせたCケースドシステムは、高いレイテンシを犠牲にして優れた知識表現を提供する。本稿では,この2つのパラダイムのギャップを埋める新しいハイブリッドアーキテクチャを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:46:34 GMT)
Conditional Latent Space Molecular Scaffold Optimization for Accelerated Molecular Design [14.6]
CLaSMO ( Conditional Latent Space Molecular Scaffold Optimization) を導入する。 CLaSMOは、条件変分オートエンコーダ(CVAE)とLatent Space Bayesian Optimization(LSBO)を統合し、分子を戦略的に修飾する。 LSBO設定は, 分子最適化の試料効率を向上し, 実世界の適用可能性の高い分子を得るのに有効である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:21:40 GMT)
Reasoning BO: Enhancing Bayesian Optimization with Long-Context Reasoning Power of LLMs [14.6]
本稿では、推論モデルを利用してBOのサンプリングプロセスを導出する新しいフレームワークであるReasoning BOを設計する。推論BO(Reasoning BO)は、実証可能な科学的理論に基づく批判的な洞察とともに、リアルタイムサンプリングレコメンデーションを提供する。合成数学関数と複素実世界の応用を含む10の多種多様なタスクにまたがるアプローチを評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:12:20 GMT)
PRIME: Planning and Retrieval-Integrated Memory for Enhanced Reasoning [14.6]
マルチエージェント推論フレームワークである textbfPRIME (Planning and Retrieval-Integrated Memory for Enhanced Reasoning) を導入する。 PRIME は textbfSystem 1 (高速で直感的な思考) と textbfSystem 2 (スローで思慮深い思考) を動的に統合する本研究は,複雑な知識集約的推論を必要とする領域におけるLLMを改善するためのスケーラブルなソリューションとしてPRIMEを確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:16:36 GMT)
QWHA: Quantization-Aware Walsh-Hadamard Adaptation for Parameter-Efficient Fine-Tuning on Large Language Models [14.5]
本稿では,Walsh-Hadamard Transform (WHT) を変換カーネルとして利用することにより,FTベースのアダプタを量子化モデルに統合する手法を提案する。我々はQWHAが微調整を容易にしながら量子化誤差を効果的に軽減し,その設計によって計算コストを大幅に削減できることを実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:23:43 GMT)
Towards Context-aware Mobile Privacy Notice: Implementation of A Deployable Contextual Privacy Policies Generator [14.5]
PivScanは、Android用の最初のデプロイ可能なContextual Privacy Policies Software Development Kit(SDK)です。ライブアプリのスクリーンショットをキャプチャして、個人データの種類に関連するGUI要素を特定し、簡潔でユーザ対応のフォーマットでCPPを表示する。実現可能性指向評価では,平均実行時間は9.15秒であり,本手法の実用性を示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:26:32 GMT)
CLIP-IT: CLIP-based Pairing for Histology Images Classification [14.4]
マルチモーダル学習は、画像やテキストのような相補的なモダリティを組み合わせた医療画像において有望であることを示している。 CLIP-IT(CLIP-IT)は、リッチな未ペアテキストレポートに依存する新しいフレームワークである。また,CLIP-ITは,CLIPベースラインの非標準およびマルチモーダルベースラインの分類精度を常に向上することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:23:09 GMT)
HiPerformer: A High-Performance Global-Local Segmentation Model with Modular Hierarchical Fusion Strategy [14.2]
局所的な詳細とグローバルな文脈は、医用画像のセグメンテーションにおいて不可欠であり、それらを効果的に統合することは、高い精度を達成するために不可欠である。マルチソース機能を並列に融合する新しいモジュラー階層アーキテクチャであるHiPerformerを提案する。ローカル・グローバル・フィーチャー・フュージョン(LGFF)モジュールを設計し,局所的詳細情報と大域的意味情報の正確かつ効率的な統合を実現する。 11の公開データセットの実験では、提案手法が既存のセグメンテーション手法より優れていることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:51:38 GMT)
Spectral Collapse Drives Loss of Plasticity in Deep Continual Learning [14.2]
深層ニューラルネットワークは, 深い連続学習において, 可塑性に悩まされていることを示す。我々は、$tau$-trainabilityの概念を導入し、現在の可塑性保存アルゴリズムをこのフレームワークで統一できることを示します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:28:53 GMT)
Nearly Tight Regret Bounds for Profit Maximization in Bilateral Trade [14.2]
バイラテラル取引は、売り手と買い手という2つの戦略エージェントの仲介を行うタスクをモデル化する。我々は,この問題をブローカーの観点から,後悔の最小化フレームワークを用いて検討する。本稿では,売り手と評価を引いた場合,約$tildeO(sqrtT)=後悔を保証できる学習アルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:42:05 GMT)
OptiMind: Teaching LLMs to Think Like Optimization Experts [14.2]
我々は最適化の専門知識を体系的に統合し、混合整数線形プログラミングの定式化精度を向上させる。提案手法はまず,クラスベースのエラー解析によってトレーニングデータをクリーン化する。次に、クラス固有のエラーサマリとソルバフィードバックでLLMを誘導するマルチターン推論戦略を開発する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:23:12 GMT)
Developing Vision-Language-Action Model from Egocentric Videos [14.2]
エゴセントリックなビデオは、人間がオブジェクトやツールを操作する方法を捉え、オブジェクトの操作を学ぶための多様な動きの手がかりを提供する。このようなビデオを利用してロボットのポリシーを訓練する以前の研究は、手動の詳細な記録のような補助的なアノテーションに依存していた。本研究では,エゴセントリックビデオから6DoFオブジェクト操作トラジェクトリを抽出するフレームワークであるEgoScalerを活用することで,この問題に対処する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:09:33 GMT)
CARE: Confidence-aware Ratio Estimation for Medical Biomarkers [14.1]
比例ベースのバイオマーカーは、診断、予後、治療計画を支援するために臨床実践で広く用いられている。既存の方法は点推定のみを提供し、不確実性の尺度を提供しない。比に基づくバイオマーカーを推定するための統合信頼度対応フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:22:59 GMT)
Think Right, Not More: Test-Time Scaling for Numerical Claim Verification [14.1]
テスト時間計算は複雑な数値的なクレームの検証に有効であることを示す。クレームの認識複雑性に基づいてTTSを選択的に実行する適応機構を提案する。このアプローチは標準のTSよりも1.8倍高い効率を実現し、シングルショットクレーム検証法よりも18.8%の性能向上を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:23:35 GMT)
Navigating the Impact of Structured Output Format on Large Language Models through the Compass of Causal Inference [14.1]
大規模言語モデル(LLM)からの構造化出力は、生成された情報を処理する際の効率を向上した。構造化フォーマットが完全性と事実的正確性を高めることを示唆する者もいる。 LLMの推論能力を制限し、標準評価指標の削減につながると主張する者もいる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:47:11 GMT)
Mitigating Semantic Collapse in Generative Personalization with Test-Time Embedding Adjustment [13.9]
生成的パーソナライゼーションにおいて、学習された視覚概念(V$)は、原文の意味から徐々に変化していく。本研究では,事前学習した埋め込みの大きさと方向を推論時に調整する学習自由度手法を提案する。本手法は多種多様なパーソナライズ手法に適用可能であり,テキスト画像アライメントの大幅な向上を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:15:36 GMT)
Training-Free Synthetic Data Generation with Dual IP-Adapter Guidance [13.9]
DIPSYは、数ショットの例を使って合成画像を生成するトレーニング不要のアプローチである。我々の手法は最先端または同等のパフォーマンスを達成する。本研究は,クラス識別特徴の生成に肯定的指導を施した二重画像の活用の有効性を強調した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:57:32 GMT)
See, Point, Fly: A Learning-Free VLM Framework for Universal Unmanned Aerial Navigation [13.9]
本稿では,視覚言語モデル(VLM)上に構築された,訓練不要な空中視覚・言語ナビゲーションフレームワークであるSee, Point, Fly(SPF)を紹介する。 SPFは任意の種類のフリーフォーム命令に基づいて任意の目標にナビゲートすることができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:59 GMT)
PoCGen: Generating Proof-of-Concept Exploits for Vulnerabilities in Npm Packages [13.9]
我々は,npmパッケージの脆弱性に対するPoCエクスプロイトを自律的に生成し,検証する新しいアプローチであるPoCGenを提案する。 PoCGenはSecBench$.jsデータセットの脆弱性の77%のエクスプロイトを生成することに成功した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:43:31 GMT)
Structural Information-based Hierarchical Diffusion for Offline Reinforcement Learning [13.8]
本稿では,効率的なオフライン政策学習のための構造情報に基づく階層的拡散フレームワークを提案する。オフライン軌道に埋め込まれた構造情報を解析して拡散階層を適応的に構築する。 SIHDは意思決定性能において最先端のベースラインを著しく上回ることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:24:06 GMT)
Mobi-$π$: Mobilizing Your Robot Learning Policy [13.7]
そこで本研究では,ロボットのベースポーズを最適化し,学習したポリシーに適合させることにより,ナビゲーションと操作をブリッジする新しいポリシーモビライゼーション手法を提案する。提案手法は,3次元ガウススプラッティングを新しいビュー合成,ポーズ適合性評価のためのスコア関数,最適なロボットポーズを特定するためのサンプリングベース最適化に活用する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:17:30 GMT)
VeriFact: Enhancing Long-Form Factuality Evaluation with Refined Fact Extraction and Reference Facts [13.7]
本稿では,事実抽出の促進を目的とした実感評価フレームワークであるVeriFactを紹介する。また、FactRBenchは、長文モデル応答における精度とリコールの両方を評価するベンチマークである。実証的な評価は、VeriFactは事実の完全性を著しく向上させ、重要な関係情報を持つ複雑な事実を保存することを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:11:28 GMT)
Conflict-Aware Soft Prompting for Retrieval-Augmented Generation [13.7]
Retrieval-augmented Generation (RAG)は、外部知識を入力プロンプトに組み込むことで、大規模言語モデル(LLM)の能力を高める。 RAGはしばしば、誤った外部コンテキストと正しいパラメトリック知識の間の競合を解決できない。コンテクストアセスタとベースLLMから構成されるCARE(Conflict-Aware Retrieval-Augmented Generation)を紹介する。 CAREはコンテキストメモリの競合を効果的に軽減し、QAとファクトチェックベンチマークの平均パフォーマンスは5.0%向上した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:07:03 GMT)
LucidFlux: Caption-Free Universal Image Restoration via a Large-Scale Diffusion Transformer [13.6]
ユニバーサル画像復元(UIR)は、意味を保ちながら未知の混合物によって劣化した画像を復元することを目的としている。本稿では,大容量拡散変換器(Flux.1)を画像キャプションなしで適用可能な,キャプションフリーなUIRフレームワークであるLucidFluxを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:39:08 GMT)
Is GPT-OSS Good? A Comprehensive Evaluation of OpenAI's Latest Open Source Models [13.6]
2025年8月、OpenAIはGPT-OSSモデルをリリースした。両変種を,14.7Bから235Bまでの6つの現代オープンソース大言語モデルと比較した。どちらのモデルも、コード生成の相対的な長所と、多言語タスクの顕著な弱点によって、現在のオープンソースランドスケープにおける中間層全体のパフォーマンスを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:42:33 GMT)
In-Context Algorithm Emulation in Fixed-Weight Transformers [13.6]
凍結したウェイトを持つ最小のトランスフォーマーは、コンテキスト内プロンプトによって幅広いアルゴリズムのクラスをエミュレートする。 1つの固定重2層アテンションモジュールは、プロンプトのみを通してタスク固有のクラスから全てのアルゴリズムをエミュレートする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:04:11 GMT)
Rethinking Large Language Model Distillation: A Constrained Markov Decision Process Perspective [13.6]
本稿では, 大規模言語モデル (LLM) の蒸留に制約付き強化学習問題として定式化することによって, 新たなアプローチを導入する。本稿では,教師モデルからの逸脱を一定の閾値以下に抑えながら,タスク固有の報酬を最大化する最適化フレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:47:49 GMT)
Follow the Path: Reasoning over Knowledge Graph Paths to Improve LLM Factuality [13.5]
大規模な推論モデルから導出することで、推論トレースの事実性を向上する手法であるfs1を紹介する。我々は、3.9Kの事実的根拠に基づく推論トレースに基づいて8つの命令調整型大規模言語モデル(LLM)を微調整する。その結果,fs1調整モデルでは,命令調整モデルよりも6～14絶対点の並列サンプリングの方が優れていた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:25:25 GMT)
LABELING COPILOT: A Deep Research Agent for Automated Data Curation in Computer Vision [13.4]
本稿では,コンピュータビジョンのための初のデータキュレーションディープリサーチエージェントであるLabeling Copilotを紹介する。大規模なマルチモーダル言語モデルを利用する中央オーケストレータエージェントは、多段階推論を使用して、3つのコア機能にまたがる特殊なツールを実行する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:55:26 GMT)
Vivid-VR: Distilling Concepts from Text-to-Video Diffusion Transformer for Photorealistic Video Restoration [13.4]
先進的なT2Vファンデーションモデルに基づいて構築されたDiTベースの生成ビデオ復元手法であるVivid-VRを提案する。 Vivid-VRは, 実世界のベンチマークと実世界のベンチマークの両方において, 既存のアプローチに対して良好に動作することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:11:21 GMT)
Your RAG is Unfair: Exposing Fairness Vulnerabilities in Retrieval-Augmented Generation via Backdoor Attacks [13.3]
Retrieval-augmented Generation (RAG)は、検索機構と生成モデルを統合することにより、現実のグラウンド化を促進する。本稿では,2段階のバックドアアタックを通じてRAGの公平性の脆弱性を明らかにするシステムフレームワークであるBiasRAGを紹介する。事前学習フェーズでは、クエリエンコーダが妥協され、ターゲットグループを意図した社会的バイアスに整合させ、長期的持続性を確保する。デプロイ後の段階では、バックドアを強化するために、敵文書を知識ベースに注入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:33:36 GMT)
Align2Speak: Improving TTS for Low Resource Languages via ASR-Guided Online Preference Optimization [13.2]
自動回帰型多言語TSモデルを新しい言語に適用するためのフレームワークを提案する。我々は、ターゲット言語の韻律的特徴を捉えるために、新しい言語の限られたペアデータに基づいて、このモデルを微調整する。実験により、このパイプラインは低リソース言語で理解不能で話者一貫性のある音声を生成することが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:28:50 GMT)
Stage-wise Dynamics of Classifier-Free Guidance in Diffusion Models [13.0]
CFGは拡散モデルにおける条件の忠実度向上に広く用いられているが、サンプリング力学への影響はよく分かっていない。 CFGをマルチモーダル条件下で解析し,サンプリングプロセスが3段階に展開することを示す。実験はこれらの予測を支持し、早期の強いガイダンスが世界的な多様性を損なう一方で、後期の強いガイダンスはきめ細かい変化を抑制することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:45:20 GMT)
In Their Own Words: Reasoning Traces Tailored for Small Models Make Them Better Reasoners [13.0]
より大きな言語モデルから小さな言語モデルへの推論能力の転送は、しばしば反故意に失敗する。より大きなモデルからのトレースの推論は、学生の分布下では低い確率のトークンを含む。本稿では,学生に優しい推論トレースを生成するメカニズムであるReverse Speculative Decoding (RSD)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:40:32 GMT)
UESA-Net: U-Shaped Embedded Multidirectional Shrinkage Attention Network for Ultrasound Nodule Segmentation [13.0]
既存のネットワークは、低レベルの空間的詳細と高レベルのセマンティクスの整合に苦慮している。我々は,多方向縮小に着目したU字型ネットワークUESA-Netを提案する。 2つの公開データセットにおいて、UESA-Netは、それぞれ0.8487と0.6495の交差一致(IoU)スコアで最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:54:38 GMT)
HEAPr: Hessian-based Efficient Atomic Expert Pruning in Output Space [12.9]
HEAPrは、専門家を小さく、識別不能な原子エキスパートに分解する、新しい刈り取りアルゴリズムである。これは、原子専門家の固有の特性を利用して、2階の情報を専門家パラメータから原子専門家パラメータに変換する。これは、様々な圧縮率とベンチマークで、既存のエキスパートレベルのプルーニング手法よりも優れています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:00:46 GMT)
Where Did It Go Wrong? Attributing Undesirable LLM Behaviors via Representation Gradient Tracing [12.8]
大きな言語モデル(LLM)は目覚ましい機能を示しているが、そのデプロイメントは望ましくない振る舞いによってしばしば損なわれている。本稿では,表現とその勾配を解析することによって,望ましくないLCMの挙動を診断する,新しい,効率的なフレームワークを提案する。本手法は,有害な内容の追跡,バックドア中毒の検出,知識汚染の同定などのタスクに対して,系統的に評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:07:47 GMT)
What Is The Political Content in LLMs' Pre- and Post-Training Data? [12.7]
完全オープンソースモデルであるOLMO2の事前学習コーパスと後学習コーパスの解析を行った。これらのコーパスから、我々は大きなランダムサンプルを描き、政治的指向のために自動的に文書を注釈付けし、それらのソースドメインとコンテンツを分析する。次に、トレーニングデータの政治的コンテンツが、特定の政策問題に対するモデルのスタンスとどのように関連しているかを評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:00:51 GMT)
Voting-Bloc Entropy: A New Metric for DAO Decentralization [12.6]
分散型自治機構(DAO)は、スマートコントラクトを使用して、共通の目標に向かって作業するコミュニティを育成する。本研究は,VBE(Voting-Bloc Entropy)と呼ばれる分散化を計測する新しいフレームワークを提案する。 VBEは、密接に一致した関心を持つ有権者が中央集権的な力として振る舞うという考えに基づいており、そのようにモデル化されるべきである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:46:07 GMT)
Pose Prior Learner: Unsupervised Categorical Prior Learning for Pose Estimation [12.6]
前者は、システムに関する信念や仮定の集合を表します。本稿では,ポーズ推定における教師なしカテゴリー事前学習の課題を紹介する。本稿では,PPL (Pose Prior Learner) という新しい手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:51:11 GMT)
When Does Reasoning Matter? A Controlled Study of Reasoning's Contribution to Model Performance [12.6]
Instruction Fine-Tuning (IFT) と様々なサイズの推論モデルを比較する。我々の分析によると、推論はモデル性能を継続的に改善し、多くの場合、より大規模なIFTシステムに適合または超越している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:53:52 GMT)
In-Context Learning can Perform Continual Learning Like Humans [12.5]
大規模言語モデル(LLM)は、パラメータを更新することなく、ICL(In-context Learning)を介して新しいタスクに適応することができる。マルチタスク環境におけるICLの保持特性について検討し,それを文脈内連続学習(ICCL)に拡張する。 ICCLは、人間に類似した方法で分散プラクティスの恩恵を受けており、維持のための「スイートスポット」の間隔を一貫して明らかにしている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:08:06 GMT)
Few-Shot Adversarial Low-Rank Fine-Tuning of Vision-Language Models [12.5]
本稿では,LoRAを微調整したCLIPモデルの対角的ロバスト性を高めるためのAdvCLIP-LoRAを提案する。提案手法は,低ランクアダプタと対向的摂動に対する最小限の最適化としてトレーニングを定式化し,トレーニング可能なフットプリントを小さくすることで堅牢な適応を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:53:17 GMT)
Efficient Epistemic Uncertainty Estimation in Regression Ensemble Models Using Pairwise-Distance Estimators [12.5]
ペアワイズ距離推定器(PaiDEs)はエントロピー上の境界を確立する。サンプルベースのモンテカルロ推定器とは異なり、PaiDEは最大100倍の速度でてんかんの不確実性を推定する顕著な能力を示す。我々は,既存の能動学習手法と比較し,高次元回帰タスクにおいて,我々のアプローチが優れていることを見出した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:57:20 GMT)
GeoDANO: Geometric VLM with Domain Agnostic Vision Encoder [12.4]
平面幾何学問題を解くために,ドメインに依存しない視覚エンコーダを備えた幾何学的視覚モデル(VLM)であるGeoDANOを紹介する。ベンチマークの結果,GeoCLIPは幾何学的特徴を認識する上で,既存の視覚エンコーダよりも優れていた。そこで我々は,GeoCLIPをドメイン適応戦略で拡張したVLMであるGeoDANOを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:10:53 GMT)
Bridging Kolmogorov Complexity and Deep Learning: Asymptotically Optimal Description Length Objectives for Transformers [12.4]
本稿では,普遍性と最適記述長の目的に関する理論的概念を紹介する。変動目的を構築・解析することで,そのような目的を抽出し,識別可能であることを示す。より広義には、強力なアルゴリズム保証を持つ記述長目標を識別する理論的枠組みを提供することにより、より圧縮と一般化を達成するニューラルネットワークのトレーニングへの潜在的な道筋を概説する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:02:24 GMT)
Linear Causal Representation Learning by Topological Ordering, Pruning, and Disentanglement [12.4]
因果表現学習(CRL)は、因果推論や人工知能コミュニティからの関心が高まっている。本研究では, 環境の不均一性やデータ生成分布について, より弱い仮定の下での線形CRLアルゴリズムを提案する。合成実験と大規模言語モデルの解釈可能性解析により,新しいアルゴリズムの有効性を検証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:35:42 GMT)
Chain or tree? Re-evaluating complex reasoning from the perspective of a matrix of thought [12.4]
思考のマトリックス(MoT)は、大規模言語モデル(LLM)のための新規で効率的な思考構造である MoTは「カラムセル通信」機構を通じて水平次元と垂直次元の両方の問題を探索する。我々のフレームワークは最先端の手法より優れており、推論時間はベースライン手法の14.4%に過ぎない。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:57:36 GMT)
Collaborative and Proactive Management of Task-Oriented Conversations [12.4]
タスク指向対話システム (TOD) は、自然言語対話におけるユーザの好みに基づいたタスクを完了させる。タスク完了には積極的な計画が不可欠だが、既存のTODの多くは効果的な目標認識計画を見落としている。本稿では,対話管理への情報状態アプローチを中心に,タスク指向の会話を管理するモデルを作成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:18:13 GMT)
Extending coherence time beyond break-even point using only drives and dissipation [12.4]
量子エラー補正(QEC)は、環境への量子情報の損失を軽減することを目的としている。本稿では,任意の誤り訂正符号に適用可能な量子チャネルシミュレーションに基づくAQECプロトコルを提案する。これは、AQECで保護されたボソニックな論理量子ビットの破れ点を超えた最初の実験的実現である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:50:27 GMT)
pFedMMA: Personalized Federated Fine-Tuning with Multi-Modal Adapter for Vision-Language Models [12.3]
pFedMMAは、視覚言語タスクにマルチモーダルアダプタを活用する最初のパーソナライズされた学習フレームワークである。 pFedMMAはパーソナライゼーションと一般化の間の最先端のトレードオフを実現し、近年のフェデレーション・プロンプト・チューニング手法よりも優れていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:36:44 GMT)
Graph is a Natural Regularization: Revisiting Vector Quantization for Graph Representation Learning [12.2]
本稿では,ベクトル量子化をグラフデータに適用した場合に,コードブックの崩壊が一貫して起こることを示す最初の実証的研究を示す。グラフトポロジと特徴的類似性を明示的な正規化信号として統合し,コードブックの利用率を高め,トークンの多様性を促進する新しいフレームワークであるRGVQを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:31:45 GMT)
UniVid: Unifying Vision Tasks with Pre-trained Video Generation Models [12.2]
広範なコーパスで訓練された大規模言語モデルは、単一の生成フレームワーク内で多様な言語タスクを統一することに成功した。このようなモデリングには、モダリティやソースをまたいだタスク固有の事前トレーニングが必要です。タスク固有の変更なしに様々な視覚タスクを処理するために,ビデオ拡散変換器を微調整するフレームワークであるUniVidを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:43:40 GMT)
Towards Efficient Online Exploration for Reinforcement Learning with Human Feedback [12.2]
人間のフィードバックによる強化学習は、大きな言語モデルと人間の好みを整合させる中心的なパラダイムとして現れてきた。オンラインRLHFの探索原理について検討し、報酬モデルとポリシーの両方をデータ効率のよい方法で洗練しようとする。そこで本研究では,報酬差の不確実性を抑えるために,嗜好クエリを指示する新たな探索手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:57:17 GMT)
Type-Compliant Adaptation Cascades: Adapting Programmatic LM Workflows to Data [12.1]
本稿では,ワークフロー適応を学習型確率型プログラムとして再放送するフレームワークであるType-Compliant Adaptation Cascadesを紹介する。経験的に、TACは最先端のプロンプト最適化ベースラインを大幅に上回る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:39:05 GMT)
Debiased Front-Door Learners for Heterogeneous Effects [12.1]
フロントドア(FD)識別下での不均一処理効果(HTE)について検討した。本稿では,FD-DR-LearnerとFD-R-Learnerの2つのデバイアスド学習者を紹介する。本研究は, 合成研究における堅牢な経験的性能と, シートベルト法則の実例を実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:11:14 GMT)
Capacity-Aware Planning and Scheduling in Budget-Constrained Multi-Agent MDPs: A Meta-RL Approach [12.1]
容量・予算制約型マルチエージェントMDP(CB-MA-MDP)について検討する。本稿では,大規模システムに対して,引き続きトラクタブルな2段階のソリューションを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:27:30 GMT)
Implicit bias produces neural scaling laws in learning curves, from perceptrons to deep networks [12.1]
我々は,異なるノルムベースの複雑性尺度の関数として,パフォーマンスの進化を規定する2つの新しいテキスト力学的スケーリング法則を同定する。我々の発見は、CNN、ResNets、MNIST、CIFAR-10、CIFAR-100で訓練されたVision Transformersで一致している。我々は,ロジスティックな損失で訓練された単一層パーセプトロンを用いて解析支援を行い,新しい動的スケーリング法則を導出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:31:07 GMT)
Rigidity-Aware 3D Gaussian Deformation from a Single Image [12.1]
単一の画像のみから3次元ガウス変形を導く新しいフレームワークであるDeformSplatを提案する。また,3次元ガウス表現と2次元画素観測の領域ギャップを埋めるガウス対Pixelマッチングを提案する。これら2つの手法を組み合わせることで,1つの画像から一貫した変形を再構成することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:34:55 GMT)
Lattice-Based Dynamic $k$-times Anonymous Authentication [12.0]
$k$-times anonymous authentication(k$-TAA)スキームにより、グループのメンバーは、アプリケーションプロバイダによって最大$k$倍まで匿名で認証される。量子コンピューティング攻撃を考えると、格子ベースの$k$-TAAが導入された。最初の格子ベースの動的$k$-TAAは、限定的な匿名認証、動的メンバ管理、量子後セキュリティを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:42:31 GMT)
Dream to Chat: Model-based Reinforcement Learning on Dialogues with User Belief Modeling [11.9]
我々は,ユーザの感情,感情,意図,将来的な発話を予測できる対話世界モデルを構築した。本稿では,モデルに基づく強化学習フレームワークを対話システムに適用し,DreamCUBというフレームワークを提案する。実験により、事前訓練された対話世界モデルは、感情分類と感情識別に関する最先端のパフォーマンスを達成できることが示されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:30:43 GMT)
Whom to Trust? Adaptive Collaboration in Personalized Federated Learning [11.9]
共同作業における適応性ときめ細かな信頼は、個々の事例のレベルで、フェデレートされた半教師付き学習において達成可能であることを示す。 FEDMOSAICは、顧客による個人別合意と信頼度に基づいて、その損失と擬似ラベルへの貢献を重み付けするパーソナライズされた協調学習手法である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:12:13 GMT)
GraphSCENE: On-Demand Critical Scenario Generation for Autonomous Vehicles in Simulation [11.9]
本研究では,多様なトラフィックシナリオに対応する動的時間的シーングラフをオンデマンドで生成し,ユーザ定義の好みに合わせて作成する手法を提案する。時間的グラフニューラルネットワーク(GNN)モデルは、実世界の相互作用パターンによって導かれる、エゴ・車両エージェントと静的構造の関係を予測することを学習する。予測されたシナリオをシミュレーションでレンダリングし、AVエージェントのテスト環境としての有効性をさらに実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:44:53 GMT)
Why Chain of Thought Fails in Clinical Text Understanding [11.9]
チェーン・オブ・シークレット・プロンプト(CoT)はステップ・バイ・ステップの推論を導く。大規模言語モデル(LLM)は、臨床医療にますます応用されている。本研究は,臨床テキスト理解のためのCoTの大規模体系化研究である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:18:15 GMT)
Efficient Fine-Grained GPU Performance Modeling for Distributed Deep Learning of LLM [11.9]
大規模言語モデル(LLM)の訓練は、高性能コンピューティングにおける最も計算集約的なタスクの1つである。我々は、数百のGPUに分散したマルチビリオンパラメータモデルのエンドツーエンドトレーニング時間を予測するためのフレームワークを提案する。われわれのフレームワークは、Perlmutter(A100)で4.98%、Vista(GH200)で9.38%の低平均予測誤差を128GPUで20Bパラメータまで達成している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:38:25 GMT)
The QCET Taxonomy of Standard Quality Criterion Names and Definitions for the Evaluation of NLP Systems [11.9]
2つの評価が同等の時期を知らないということは、システム品質に関する信頼できる結論を引き出す能力が欠如しているということです。 NLPで報告された評価の3つの調査から品質基準名と定義の標準セットを導出するQCETを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:49:03 GMT)
From tests to effect sizes: Quantifying uncertainty and statistical variability in multilingual and multitask NLP evaluation benchmarks [11.9]
モデルおよびデータ関連情報源の両方から,実験結果の変動が生じることを示す。また,リーダーボードに使用される様々な量のサンプリング分布の計算に,再サンプリング手法がいかに有用かを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:37:55 GMT)
FeatBench: Evaluating Coding Agents on Feature Implementation for Vibe Coding [11.8]
FeatBenchは、機能実装に焦点を当てた、バイブコーディングのための新しいベンチマークである。 FeatBenchは、ベンチマークを進化させるための品質と完全に自動化されたパイプラインを保証するために、マルチレベルのフィルタリングパイプライン上に構築されている。我々の評価によると、ビブ符号化パラダイムにおける機能実装は重要な課題であり、最高成功率は29.94%である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:47:50 GMT)
HiGS: History-Guided Sampling for Plug-and-Play Enhancement of Diffusion Models [11.8]
歴史誘導サンプリング(HiGS)と呼ばれる新しい運動量に基づくサンプリング手法を提案する。 HiGSは、最新のモデル予測を各推論ステップに統合することにより、拡散サンプリングの品質と効率を向上させる。提案手法では,既存の拡散フレームワークとシームレスに統合する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:01:10 GMT)
An Adaptive ICP LiDAR Odometry Based on Reliable Initial Pose [11.7]
反復クローズトポイント法(ICP)に基づく手法は,LiDARオドメトリーのコア技術となっている。適応機構の欠如は、複雑な動的環境の効果的処理を妨げる。本稿では,信頼度の高い初期ポーズに依存する適応型ICPベースのLiDARオドメトリー法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:40:53 GMT)
FastGRPO: Accelerating Policy Optimization via Concurrency-aware Speculative Decoding and Online Draft Learning [11.7]
グループ相対ポリシー最適化(GRPO)は、大規模言語モデルの推論能力を改善する上で大きな可能性を証明している。本稿では, リアルタイムレベルに応じて, ドラフトと検証戦略を調整する投機的復号化フレームワークを提案する。提案手法は,2.35xから2.72xまでのエンドツーエンドの高速化を実現し,効率性においてベースラインアプローチを大幅に上回ることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:48:41 GMT)
How Strategic Agents Respond: Comparing Analytical Models with LLM-Generated Responses in Strategic Classification [11.6]
我々は、エージェントと意思決定者の相互作用を研究するために戦略分類を用いる。 i) LLMはSC設定において効果的で社会的に責任のある戦略を生成することができるか? 意思決定方針にアクセスできなくても、LLMはエージェントのスコアと資格を改善する効果的な戦略を生み出すことができることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:21:50 GMT)
FGIT: Fault-Guided Fine-Tuning for Code Generation [11.6]
大規模言語モデルのコード生成を改善するために,FGIT(Fault-Guided Fine-Tuning)を提案する。提案手法は,pass@1ベンチマークで平均6.9%の相対的改善を実現している。本手法は,多種多様な命令調整 LLM に対して3.8% から19.1% までの性能向上を図った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:17:15 GMT)
InqEduAgent: Adaptive AI Learning Partners with Gaussian Process Augmentation [11.5]
本稿では,探索指向学習に適した学習パートナーをシミュレートし,選択するための LLM を利用したエージェントモデルを提案する。生成エージェントは、現実世界のシナリオにおける学習者の認知的・評価的特徴を捉えるように設計されている。実験の結果,ほとんどの知識学習シナリオやLLM環境において,InqEduAgentの最適性能が示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:12:46 GMT)
Superconvergence of High-order Magnus Quantum Algorithms [11.4]
次数$p$の量子Magnusアルゴリズムは、シュル・オーディンガー方程式のシミュレーションに適用した場合、次数$2p$の超収束を達成できることを示す。我々の分析は、半古典解析とワイル計算の技法を組み合わせて、時間依存ハミルトニアンシミュレーションのための量子アルゴリズムの数学的基礎に関する新しい視点を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:23:25 GMT)
Accuracy-First Rényi Differential Privacy and Post-Processing Immunity [11.4]
精度優先の観点からの既存の研究は、後処理免疫として知られる差分プライバシーの重要な特性を無視している。後処理免疫を有するR'enyi差分プライバシーに基づく新しい定義を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:27:36 GMT)
The Rogue Scalpel: Activation Steering Compromises LLM Safety [11.4]
アクティベーションステアリング(Activation steering)は、推論中にモデルの隠れ状態に直接意味論的意味のあるベクトルを追加することによって、LCMの動作を制御する技術である。ステアリングはモデルアライメントの保護を系統的に破り、有害な要求に従わせる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:49:47 GMT)
Recursive Training Loops in LLMs: How training data properties modulate distribution shift in generated data? [11.4]
大規模言語モデル(LLM)は、オンラインコンテンツの作成にますます利用されている。この合成データに基づいて、次の世代のモデルのトレーニングが行われると、フィードバックループが生成される。このようなループは、人間のデータの真の基盤となる分布を誤って表現するモデルである、分散シフトにつながることが示されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:11:25 GMT)
Sample-efficient Multiclass Calibration under $\ell_{p}$ Error [11.4]
ラベル上の分布を出力するマルチクラス予測器の校正は、予測値の指数的な数のために困難である。本研究では,2つの確立された校正誤差概念を補間する誤りの定義を提案する。重要な技術的貢献は、高い適応性を持つデータ分析の新たな応用であるが、サンプルの複雑さにおける対数的オーバーヘッドのみである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:30:31 GMT)
Variational Deep Learning via Implicit Regularization [11.3]
現代のディープラーニングモデルは、過度にパラメータ化され、明示的な正規化をほとんど、あるいは全く行わずに訓練されているにもかかわらず、非常によく分布する。本稿では,(確率的な)勾配勾配の暗黙バイアスにのみ依存して,変分ニューラルネットワークの正規化を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:54:59 GMT)
ERGO: Efficient High-Resolution Visual Understanding for Vision-Language Models [11.3]
ERGOは推論駆動の知覚平均化マルチモーダルコンテキストで、どこにフォーカスするかを決定する。我々は、粗大な知覚のための強化学習フレームワークにおいて、単純で効果的な報酬成分を開発する。提案手法は,従来のモデルや競合手法よりも精度が高く,効率が向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:15:19 GMT)
LLM-OptiRA: LLM-Driven Optimization of Resource Allocation for Non-Convex Problems in Wireless Communications [11.2]
無線通信における非リソース割り当て問題の解法を示す。また、エラー訂正率を80%にする方法も示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:15:55 GMT)
"In my defense, only three hours on Instagram": Designing Toward Digital Self-Awareness and Wellbeing [11.2]
WellScreenは軽量なプローブで、毎日の反射を足場にし、スマートフォンの使用を見積り、報告する。推定値と実際の使用率の相違がデジタル認識と幸福を形作るかを検討した。本研究は、自己認識と意図的なデジタルエンゲージメントを支援するための軽量な反射的介入の可能性を浮き彫りにした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:35:50 GMT)
NFDI4DS Shared Tasks for Scholarly Document Processing [11.1]
本稿では,ドイツ国立データサイエンス・人工知能研究機構(NFDI4DS)のコンソーシアムで開発された12の共有タスクについて概説する。このタスクは方法論的な革新を促進し、より広い研究コミュニティのためのオープンアクセスデータセット、モデル、ツールに貢献する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:01:24 GMT)
CoBel-World: Harnessing LLM Reasoning to Build a Collaborative Belief World for Optimizing Embodied Multi-Agent Collaboration [11.1]
大規模言語モデル(LLM)は、協調的なタスク解決のための有望な自律エージェントとして登場した。我々は,LLMエージェントを協調的信念の世界に適合させる新しいフレームワークであるCoBel-Worldを提案する。その結果,CoBel-Worldは通信コストを22～60%削減し,最強のベースラインに比べてタスク完了効率を4～28%向上した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:03:52 GMT)
Secure and Efficient Access Control for Computer-Use Agents via Context Space [11.1]
CSAgentは、コンピュータ利用エージェントのためのシステムレベルの静的ポリシーベースのアクセス制御フレームワークである。我々はCSAgentの実装と評価を行い、99.36%以上の攻撃に対して防御に成功し、パフォーマンスオーバーヘッドは6.83%に過ぎなかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:19:27 GMT)
Convolutional Set Transformer [11.0]
本稿では、任意の濃度の画像集合を処理するために設計された新しいニューラルネットワークである畳み込み集合変換器(CST)を紹介する。既存のセットインプットネットワーク、例えばDeep SetsやSet Transformerはベクトル入力に限られており、直接3D画像テンソルを扱えない。 CSTは3次元画像テンソル上で直接動作し、特徴抽出とコンテキストモデリングを同時に行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:13:00 GMT)
Conditional Denoising Diffusion Autoencoders for Wireless Semantic Communications [10.9]
無線セムコムシステムは,低次元のセマンティクスから高次元の地上構造へのマッピングを学習することを目的としている。セマンティックトランスミッタのニューラルエンコーダは、ハイレベルセマンティクスを抽出する。セマンティックレシーバにおける条件拡散モデル(CDiff)は、信号空間のデノイングにソース分布を利用する。提案したデコーダモデルが地中構造データの一貫した推定器であることを解析的に証明した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:46:21 GMT)
Scalable Option Learning in High-Throughput Environments [10.9]
本稿では,既存の階層型手法に比べて35倍高いスループットを実現する,スケーラブルな階層型RLアルゴリズムを提案する。 SOLの性能とスケーラビリティを示すため,NetHackの複雑なゲームにおいて,300億フレームの経験を生かした階層型エージェントを訓練する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:53:47 GMT)
OrtSAE: Orthogonal Sparse Autoencoders Uncover Atomic Features [10.9]
スパースオートエンコーダ(SAE)は、ニューラルネットワークの活性化を人間の解釈可能な特徴にスパース分解する技術である。本研究では,これらの問題を緩和するために,学習特徴間の直交性を強制する手法であるOrthogonal SAE(OrtSAE)を紹介する。その結果,OrtSAEはより9%の異なる特徴を発見し,機能吸収率(65%)と構成率(15%)を低減し,スプリアス相関除去性能(+6%)を向上し,従来のSAEと比較して,他のダウンストリームタスクのオンパー性能を実現していることがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:10:52 GMT)
Exploiting Block Coordinate Descent for Cost-Effective LLM Model Training [10.8]
ブロック降下座標(BCD)に基づく事前学習・微調整フレームワークを提案する。同じハードウェア構成で、7BモデルのトレーニングコストをA100/800Aクラスタ上で33%に削減する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:22:24 GMT)
Multi-channel convolutional neural quantum embedding [10.6]
量子計算の標準回路モデルに限らず,量子埋め込みを最適化するための古典量子ハイブリッド手法を提案する。我々は,CIFAR-10とTiny ImageNetデータセットを用いて,フレームワーク内の各種モデルの性能をベンチマークした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:51:40 GMT)
RsGCN: Subgraph-Based Rescaling Enhances Generalization of GCNs for Solving Traveling Salesman Problems [10.6]
GCNベースの旅行セールスマン問題(TSP)は、TSPのクロススケール一般化の貧弱さと高いトレーニングコストの2つの重要な課題に直面している。グラフ畳み込みネットワーク(RsGCN)を提案する。統一された部分グラフの観点で、RsGCNは低コストで小規模のTSPからスケール一般化可能な表現を効率的に学習することができる。 RsGCN と RBS を併用したアーキテクチャにより,本手法は目覚ましい一般化と訓練コストの低減を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:01:49 GMT)
Joint graph entropy knowledge distillation for point cloud classification and robustness against corruptions [10.5]
本研究は,textbfJoint textbfGraph textbfEntropy textbfKnowledge textbfDistillation (JGEKD)の分類戦略を提案する。非独立かつ同一に分散された3Dポイントクラウドデータに適している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:09:58 GMT)
From Authors to Reviewers: Leveraging Rankings to Improve Peer Review [10.5]
近年,機械学習(ML)カンファレンスのレビュー品質が懸念されている。本稿では,著者ではなくレビュアーからのランキング情報を活用するアプローチを提案する。その結果, (i)レビュアーからの情報を取り入れたランキングは, 各論文の品質評価を著しく向上させることができ, 著者のみによるランキング情報の利用よりも優れていることがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:16:09 GMT)
Do Data Valuations Make Good Data Prices? [10.5]
データバリュエーションを、$textitmarket-designの視点で見直す。低い支払いのために、Leave-One-OutやData Shapley-makeなどの一般的な評価方法が示されています。我々は、メカニズム設計、すなわちMyersonとVickrey-Clarke-Grovesから確立された支払いルールを適用する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:21:43 GMT)
Not only a helper, but also a teacher: Interactive LLM Cascade [10.5]
大きな言語モデル(LLM)はその能力で大きく異なり、より大きなモデルは性能が良く、コストも高い。 LLMs Cascadeは弱い/チープから強い/拡張的なモデルへの難しいクエリをデファクトする。 Inter-Cascadeは、バックアップヘルパーから長期の教師まで、強力なモデルの役割を拡大します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:35:00 GMT)
On the Status of Foundation Models for SAR Imagery [10.5]
本稿では,SAR(Synthetic Aperture Radar)オブジェクト認識タスクにおける基礎的AI/MLモデルの実現可能性について検討する。我々は、SARデータを用いた公開SSLモデルのセルフスーパービジョン微調整が実現可能であることを示す。実験では、下流のタスク適応レシピで異なるバックボーンを使用することによるパフォーマンスのトレードオフをさらに分析した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:46:17 GMT)
Beyond Simple Graphs: Neural Multi-Objective Routing on Multigraphs [10.5]
マルチグラフ上での多目的ルーティングに対処するグラフニューラルネットワークに基づく2つの手法を提案する。最初のアプローチは、ツアーが完了するまでエッジを自動回帰的に選択することで、マルチグラフ上で直接動作する。 2つ目のモデルは、よりスケーラブルで、まず学習されたプルーニング戦略を介してマルチグラフを単純化し、その結果の単純なグラフ上で自己回帰的なルーティングを実行する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:37:50 GMT)
Concept-SAE: Active Causal Probing of Visual Model Behavior [10.3]
Concept-SAEは、概念トークンを意味的に基礎づけるフレームワークである。まず、我々の二重スーパービジョンアプローチが、著しく忠実で空間的に局在したトークンを生み出すことを定量的に示す。この検証された忠実さは,(1)内部概念と直接介入による予測の因果関係を探索し,(2)特定の層に敵対的脆弱性を体系的に局在させることにより,モデルの障害モードを探索する,という2つの重要な応用を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:51:03 GMT)
Online-Optimized RAG for Tool Use and Function Calling [10.3]
検索拡張生成(RAG)は、事前に指定されたツール/機能記述にユーザクエリを埋め込むことで、ツールの使用と関数呼び出しを駆動する。 Online-d RAGは、最小限のフィードバックを使用して、ライブインタラクションからの検索埋め込みに適応する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:20:04 GMT)
FreqDebias: Towards Generalizable Deepfake Detection via Consistency-Driven Frequency Debiasing [10.3]
ディープフェイク検出器は、限られたトレーニングデータから得られたバイアスにより、しばしば新しい偽造タイプに一般化するのに苦労する。本稿では,周波数領域における新しいタイプのモデルバイアスを同定する。本稿では2つの相補的戦略を通じてスペクトルバイアスを緩和する周波数脱バイアスフレームワークであるFreqDebiasを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:37:29 GMT)
Spectral-inspired Operator Learning with Limited Data and Unknown Physics [10.1]
スペクトルインスパイアされたニューラルオペレータ(SINO)は、明示的なPDE項を必要とせずに、わずか2-5軌道から複雑なシステムをモデル化することができる。非線形効果をモデル化するために、SINOはスペクトル特性の乗法演算を行うPiブロックを用いており、エイリアスを抑制するためにローパスフィルタで補完される。 2次元PDEと3次元PDEのベンチマーク実験により、SINOは1-2桁の精度で最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:09:49 GMT)
Fundamental Scaling Laws of Covert Communication in the Presence of Block Fading [10.1]
無線通信システムにおいて,信号フェードのようなチャネル障害は,隠蔽通信システムの効果的な実装と解析において課題となる。本稿では,ブロックフェーディングチャネルで使用した$n$チャネルで隠蔽送信可能なビット数について,その計算結果を考慮し,カバート通信分野における初期処理を一般化する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:30:20 GMT)
Brain PathoGraph Learning [10.1]
本稿では,病理パターンフィルタリングと病理特徴蒸留による効率的な脳グラフ学習を実現するBrain PathoGraph Learningモデルを提案する。 BrainPoGは、様々な脳疾患検出タスクにおいて、モデル性能と計算効率の両方において優位性を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:17:05 GMT)
MIRG-RL: Multi-Image Reasoning and Grounding with Reinforcement Learning [10.0]
現在、LVLM(Large Visual Language Models)は2つの重要な課題に直面している。強化学習によるマルチイメージ推論とグラウンド化(MIRG-RL)の統一フレームワークを提案する。具体的には、教師付き微調整と注釈付き軌跡と画像認識強化学習最適化を組み合わせた2段階の訓練パラダイムを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:43:22 GMT)
Beyond Johnson-Lindenstrauss: Uniform Bounds for Sketched Bilinear Forms [10.0]
我々は、スケッチされた双線型形式を解析し、関連する集合の幾何学的複雑さの観点から一様境界を導出する枠組みを開発する。この統一解析は、J-L補題のような既知の結果を特別なケースとして回収し、RIP型保証を延長する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:15:29 GMT)
Kernel Regression of Multi-Way Data via Tensor Trains with Hadamard Overparametrization: The Dynamic Graph Flow Case [9.9]
Kernel Regression via Trains with Hadamard overparametrization (KReTTaH)は、マルチウェイデータ計算を解釈可能な回帰ベースのフレームワークである。 KReTTaHは、最先端の代替品を一貫して上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:00:05 GMT)
Generalized Tangent Kernel: A Unified Geometric Foundation for Natural Gradient and Standard Gradient [9.9]
自然勾配と標準勾配の両方を研究するための幾何学的視点と数学的枠組みを提供する。自然勾配と標準勾配を統一する鍵となる道具は、ニューラルタンジェントカーネル(NTK)の一般化形式である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:00:01 GMT)
Position: Simulating Society Requires Simulating Thought [9.9]
大規模言語モデル(LLM)で社会をシミュレートするには、構造化され、修正可能で、追跡可能な認知的根拠を持つ推論が必要である。本稿では,ジェネレーティブ・マインド(GenMinds,ジェネレーティブ・マインド)の概念的モデリングパラダイムを提案する。これらの貢献は、社会シミュレーションのための思考(言語だけでなく)をシミュレートする表面レベルの模倣から生成エージェントへの、より広範なシフトを推進している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:20:04 GMT)
Generative Modeling and Decision Fusion for Unknown Event Detection and Classification Using Synchrophasor Data [9.9]
本稿では, 生成モデル, スライドウインドウ時間処理, 決定融合を統合し, 堅牢なイベント検出と分類を実現する新しいフレームワークを提案する。実験結果は、最先端の精度、機械学習、ディープラーニング、エンベロープベースのベースラインを上回ることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:04:03 GMT)
LocationReasoner: Evaluating LLMs on Real-World Site Selection Reasoning [9.7]
実世界のサイト選択の文脈において,大規模言語モデルの推論能力を評価するために設計されたベンチマークであるLocationReasonerを紹介する。このベンチマークは、様々な難易度を持つクエリを慎重に作成し、制約ベースの位置情報検索のための社内ツールを備えたサンドボックス環境によってサポートされている。ボストン、ニューヨーク、タンパの現実世界のサイト選択データに対する大規模な評価は、最先端の推論モデルが、非合理的な先駆者に対して限定的な改善をもたらすことを明らかにしている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:39:37 GMT)
NeLLCom-Lex: A Neural-agent Framework to Study the Interplay between Lexical Systems and Language Use [9.7]
NeLLCom-Lexは意味の変化をシミュレートするために設計されたニューラルネットワークフレームワークである。 i)人間のような命名行動や語彙を発達させ,(ii)コミュニケーションニーズに応じてその行動や語彙を変化させる要因について検討する。教師付きおよび強化学習パイプラインを用いた実験では、既存の言語を「話す」ように訓練されたニューラルエージェントが、色命名における人間に似たパターンを著しく再現できることが示されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:25:59 GMT)
Resisting Contextual Interference in RAG via Parametric-Knowledge Reinforcement [9.7]
Retrieval-augmented Generation (RAG)は、知識集約的なタスクのパフォーマンスを向上させるが、間違った、無関係、あるいは、検索されたテキストの矛盾によって脱線することができる。本稿では,大規模言語モデルにパラメトリック知識を用いた強化学習フレームワークであるKnowledgeable-R1を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:11:36 GMT)
Benchmarking MLLM-based Web Understanding: Reasoning, Robustness and Safety [9.6]
マルチモーダルな大規模言語モデル(MLLM)は、複雑なWeb関連アプリケーションを構築するためのAIコラボレータとしてますます位置づけられている。我々は、WebRSSBenchと呼ばれる総合的なWeb理解ベンチマークを導入し、8つのタスクでReasoning, Robustness, Safetyを共同で評価する。このベンチマークは729のウェブサイトから構築され、3799の質問応答ペアが含まれており、ページ構造、テキスト、ウィジェット、安全クリティカルな相互作用に関する多段階の推論を探索している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:38:14 GMT)
From Superficial Outputs to Superficial Learning: Risks of Large Language Models in Education [9.6]
大規模言語モデル(LLM)は、パーソナライズ、フィードバック、知識アクセスを可能にすることで教育を変革している。しかし、これらのリスクに関する実証的な証拠は依然として断片化されている。本稿では,コンピュータ科学,教育,心理学にまたがる70の実証的研究を体系的にレビューする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:59:36 GMT)
RAAG: Ratio Aware Adaptive Guidance [9.5]
フローベースの生成モデルは驚くべき進歩を遂げた。推論全体を通じて強力な、固定されたガイダンススケールを適用することは、現代的なアプリケーションに必要な、迅速な、数ステップのサンプリングには適していない。本稿では,進化率に基づいて早期段階の指導尺度を自動的に減衰させる,シンプルな,理論的に基礎付けられた適応型指導スケジュールを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:05:23 GMT)
Optimizing Long-Form Clinical Text Generation with Claim-Based Rewards [9.5]
長期臨床テキスト生成のための評価統合強化学習フレームワークを提案する。提案手法は,個別の報酬モデルを訓練したり,人手による参照に頼ることなく,現実的な接地と完全性を直接的に最適化する。このフレームワークは現実世界の設定にスケーラブルで、ガイドラインの遵守や請求の好みといったカスタムの目的を組み込むことができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:53:08 GMT)
Hybrid Deep Learning for Hyperspectral Single Image Super-Resolution [9.5]
本稿では,標準的な2次元畳み込みアーキテクチャにシームレスに統合可能な新しいモジュールであるSpectral-Spatial Unmixing Fusion (SSUF)を紹介する。 SSUFはスペクトルアンミックスとスペクトル空間特徴抽出を組み合わせ、ResNetベースの畳み込みニューラルネットワークを誘導して再構成を改善する。 3つのパブリックリモートセンシングハイパースペクトルデータセットの実験は、提案したハイブリッドディープラーニングモデルが競合性能を達成することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:28:07 GMT)
The Flood Complex: Large-Scale Persistent Homology on Millions of Points [9.4]
我々は、Alpha と Witness の複素構造の利点に触発されたFlood 複素体を紹介する。我々の構成では、効率的なPH計算が可能であり、いくつかの望ましい理論的特性を持ち、GPU並列化に対応できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:50:31 GMT)
UniMapGen: A Generative Framework for Large-Scale Map Construction from Multi-modal Data [9.4]
本稿では,大規模な地図構築のための新しい生成フレームワークUniMapGenを提案する。 UniMapGenは、車線を textbfdiscrete シーケンスとして表現し、より完全で滑らかなマップベクトルを生成する反復戦略を確立する。 UniMapGenはOpenSatMapデータセット上で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:26:33 GMT)
ASSESS: A Semantic and Structural Evaluation Framework for Statement Similarity [9.3]
ASSESS (Semantic and Structure Evaluation Framework for Statement similarity) を導入し、セマンティックおよび構造情報を総合的に統合し、連続的な類似度スコアを提供する。厳密な検証のために,ミニF2F と ProofNet から派生した 524 のエキスパート注釈付き形式文ペアの新しいベンチマーク EPLA を提案する。 EPLAの実験では、TransTEDの類似性は既存の手法よりも優れており、最先端の精度と最高カッパ係数が達成されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:02:58 GMT)
LG-CD: Enhancing Language-Guided Change Detection through SAM2 Adaptation [9.3]
我々はLG-CD(Language-Guided Change Detection Model)を提案する。このモデルは、自然言語のプロンプトを利用して、ネットワークの関心領域への注意を向ける。 3つのデータセットに対する実験により、LG-CDは最先端の変更検出方法よりも一貫して優れていることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:30:11 GMT)
RISK: A Framework for GUI Agents in E-commerce Risk Management [9.3]
電子商取引のリスク管理には、多段階のステートフルなインタラクションを通じて、多様な、深く埋め込まれたWebデータを集約する必要がある。 RISK(リンク)は、このドメインのためにGUIエージェントを構築し、デプロイするように設計された新しいフレームワークである。 RISK-Dataは8,492段のシングルステップと2,386段のマルチステップインタラクショントラジェクトリのデータセット、RISK-Benchは802段のシングルステップと320段のマルチステップトラジェクトリのベンチマークで、標準化された評価のために3つの困難レベルにまたがるベンチマーク、RISK-R1はR1スタイルの強化微調整フレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:05:01 GMT)
BOW: Reinforcement Learning for Bottlenecked Next Word Prediction [9.2]
次単語予測(NWP)のRL式であるbottle next-Word Prediction(BOW)を提案する。 BOWはバニラNWPの代替であり、明示的な次の単語推論を誘発し、一般的な推論能力を強化する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:37:55 GMT)
CSF: Fixed-outline Floorplanning Based on the Conjugate Subgradient Algorithm Assisted by Q-Learning [9.2]
共役劣等化アルゴリズム(CSA)による非滑らかな解析フロアプランニングモデルを提案する。 MCNCおよびGSRCベンチマークの実験結果から、CSAQ(CSF)に基づく固定アウトラインフロアプランニングアルゴリズムが提案されていることが示されている。また、CSFはハードモジュールのみを含むフロアプランニングシナリオにおける最先端のアルゴリズムと競合することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:08:45 GMT)
Graph of Agents: Principled Long Context Modeling by Emergent Multi-Agent Collaboration [9.2]
本稿では,モデルに依存しない長期コンテキストモデリング問題を圧縮問題として定式化するフレームワークを提案する。この目的を最大化する入力依存の協調構造を動的に構築するグラフ・オブ・エージェント(GoA)を提案する。 GoAはLongBenchの128KコンテキストウィンドウであるLlama 3.1 8Bを超え、有効コンテキスト長が劇的に増加した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:15:40 GMT)
SubZeroCore: A Submodular Approach with Zero Training for Coreset Selection [9.1]
SubZeroCoreは、サブモジュールのカバレッジと密度を単一の統一された目的に統合する、トレーニング不要なコアセット選択方法である。 SubZeroCoreはトレーニングベースのベースラインと一致し、高いプルーニングレートで大幅に性能を向上し、計算オーバーヘッドを劇的に削減することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:26:45 GMT)
HyperCore: Coreset Selection under Noise via Hypersphere Models [9.1]
HyperCoreは、ノイズの多い環境のための堅牢で適応的なコアセット選択フレームワークである。我々はHyperCoreが最先端のコアセット選択手法を一貫して超越していることを示します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:24:16 GMT)
Parameterized Hardness of Zonotope Containment and Neural Network Verification [9.1]
2層ReLUネットワークで計算された関数 $fcolonmathbbRdtomathbbR$ の正則性は、$d$ でパラメータ化されると W[1]-ハードであることが証明される。また、2層ReLUネットワークにおける任意の乗算係数内の最大値の近似、2層ネットワークにおける$pin(0,infty)$に対する$L_p$-Lipschitz定数の計算、3層ネットワークにおける$L_p$-Lipschitz定数の近似はNPであることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:59:59 GMT)
MultiMat: Multimodal Program Synthesis for Procedural Materials using Large Multimodal Models [9.0]
ビジュアルグラフ表現とテキストグラフ表現の両方を処理するプログラム合成フレームワークであるMultiMatを提案する。我々は、生産品質の高い手続き資料の新しいデータセットに基づいてモデルをトレーニングし、制約付き木探索推論アルゴリズムと組み合わせる。実験結果から, このマルチモーダルプログラム合成法は, 非条件および条件付きグラフ合成において, より効率的であることが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:10:25 GMT)
Context-Specific Instruction: A Longitudinal Study on Debugging Skill Acquisition and Retention for Novice Programmers [9.0]
バグローカライゼーションは重要なスキルであるが、初心者はしばしば体系的なアプローチを欠いている。本研究は8週間の縦断的研究を行い,4つの条件(命令なし,抽象的ガイドラインなし,具体的ステップなし,文脈特有な指示なし)について検討した。文脈固有の指導は、抽象的なガイドラインや文脈に依存しないステップよりも、スキルの獲得と保持が早くなると結論付けている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:42:10 GMT)
Two failure modes of deep transformers and how to avoid them: a unified theory of signal propagation at initialisation [9.0]
ニューラルネットワークの適切な初期化を見つけることは、スムーズなトレーニングと優れたパフォーマンスを保証するために不可欠である。トランスフォーマーでは、間違った初期化は、ランク崩壊、すべてのトークンが同様の表現に崩壊するランク崩壊、エントロピー崩壊、高度に集中した注意スコアが不安定になる2つの失敗モードの1つにつながる可能性がある。ここでは、自己アテンション、層正規化、スキップ接続、勾配を有する深層変圧器による信号伝搬の解析理論を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:22:08 GMT)
SNR and Resource Adaptive Deep JSCC for Distributed IoT Image Classification [9.0]
我々は,IoTデバイスとエッジサーバ間での無線画像分類のための,新しいSNRおよび計算適応型分散CNNフレームワークを提案する。既存の J SCC ベースの SNR 適応型多層化フレームワークと比較して,SNR が 10dB 以下である場合と比較して,分類精度が10% 向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:59:39 GMT)
SINQ: Sinkhorn-Normalized Quantization for Calibration-Free Low-Precision LLM Weights [9.0]
訓練後の量子化は、大規模言語モデルを低精度で展開するための最も広く使われている戦略として現れてきた。現在の手法では、ビット幅が4以下でパープレキシティ劣化を示す。本稿では,2軸スケール係数と高速シンクホーン-ノック方式のアルゴリズムにより,既存の学習後量子化器を増強するSINQを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:22:54 GMT)
Lifelong Learning with Behavior Consolidation for Vehicle Routing [8.9]
本稿では,ニューラルVRPソルバのための新しい生涯学習パラダイムについて検討する。 LLR-BCは、新しいタスクで訓練された問題解決者の行動とバッファリングされた課題とを整合させることにより、事前知識を効果的に統合する。静電容量化車両経路問題と走行セールスマン問題の実験は、高性能ニューラルネットワークの訓練におけるLLR-BCの有効性を実証している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:03:48 GMT)
The Thinking Spectrum: An Emperical Study of Tunable Reasoning in LLMs through Model Merging [8.9]
本稿では,複数の推論ベンチマークにまたがるモデルマージ手法について,大規模な実験的検討を行った。その結果, モデルマージは, 推論精度とトークン効率のトレードオフを校正するための, 効果的かつ制御可能な手法であることがわかった。本研究は、この調整可能な空間を包括的に解析し、特定の推論プロファイルを持つLCMを作成するための実践的ガイドラインを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:12:13 GMT)
Ontological foundations for contrastive explanatory narration of robot plans [8.9]
本稿では、2つの競合する計画の比較について、モデリングと推論のアプローチに焦点を当てる。競合する計画の違いを形式化し、推論するために、新しい存在論的モデルが提案されている。計画間の異なる知識を活用し、対照的な物語の構築を容易にする新しいアルゴリズムが提示される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:37:47 GMT)
Influence-driven Curriculum Learning for Pre-training on Limited Data [8.9]
本研究では,従来の人中心難易度尺度を,モデルトレーニング中に観察されたような難易度に対応する指標に置き換えた上で,カリキュラム学習が競争力を持つかどうかを検討する。私たちのカリキュラムでトレーニングされたモデルは、ランダムにトレーニングされたモデルをベンチマークで10ポイント以上向上させることができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:45:06 GMT)
Semantic Component Analysis: Introducing Multi-Topic Distributions to Clustering-Based Topic Modeling [8.8]
本稿では,サンプル毎に複数のトピックを検出するトピックモデリング手法であるセマンティックコンポーネント分析(SCA)を紹介する。英語、ハウサ語、中国語のTwitterデータセット上でSCAを評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:48:22 GMT)
Metric response of relative entropy: a universal indicator of quantum criticality [8.7]
熱力学的限界における量子臨界点 (QCP) の密度感受性のばらつきを示す。そこで本研究では,QRE感受性のピークに対するスケーリング挙動を,N$の関数として示す。この感受性は、ハミルトニアン勾配の絡み合いの不確かさを符号化し、ペッツ・レーニエントロピーのような他の情報測度と直接結びついている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:58:00 GMT)
Pre-training Epidemic Time Series Forecasters with Compartmental Prototypes [8.7]
本稿では,パンデミック予測のための最初のオープンソース事前学習モデルCAPEを提案する。疫学的な課題を見落としている既存の時系列基盤モデルとは異なり、CAPEモデルは潜伏する人口状態のダイナミックスを流行させる。 17の疾患と50以上の領域にまたがる包括的なベンチマークでは、CAPEはゼロショット、少数ショット、フルショット予測において、強いベースラインを著しく上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:37:12 GMT)
SSVIF: Self-Supervised Segmentation-Oriented Visible and Infrared Image Fusion [8.6]
セグメンテーション指向型VIF法(SSVIF)のための自己教師型トレーニングフレームワークを提案する。本稿では, セグメンテーションラベルの監督なしに, 融合モデルで高レベルのセグメンテーション特徴を学習することのできる, 自己教師型タスククロスセグメンテーション整合性を導入する。提案するSSVIFは従来のVIF法と競合するセグメンテーション指向の手法より優れている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:05:33 GMT)
EigenTrack: Spectral Activation Feature Tracking for Hallucination and Out-of-Distribution Detection in LLMs and VLMs [8.6]
EigenTrackは大規模言語モデル(LLM)のための解釈可能なリアルタイム検出器である表面誤差が現れる前に幻覚とOODドリフトを信号する表現構造における時間的シフトを追跡する。既存のホワイトボックス検出器とは異なり、時間的コンテキストを保存し、グローバルシグナルを集約し、解釈可能な精度-遅延トレードオフを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:38:41 GMT)
NanoTag: Systems Support for Efficient Byte-Granular Overflow Detection on ARM MTE [8.5]
バッファオーバーフローやUse-after-freeといったメモリ安全性のバグは、本番環境でのソフトウェア安全性の問題の主要な原因である。 ArmのMemory Tagging Extension (MTE)は、ハードウェアのこれらのバグをはるかに少ないオーバーヘッドで検出する、有望な代替手段を提供する。 ARM MTEを用いて,修正されていないバイナリのメモリ安全性のバグをバイト単位で検出するシステムであるNanoTagを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:03:22 GMT)
Information-Theoretic Bayesian Optimization for Bilevel Optimization Problems [8.4]
2段階最適化問題は、上層および下層問題としてネストされた2つの最適化問題からなる。上と下の両方の最適解と値の情報ゲインを考慮した情報理論手法を提案する。提案手法の有効性を,複数のベンチマークデータセットを用いて実証的に実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:52:14 GMT)
Scalable Wi-Fi RSS-Based Indoor Localization via Automatic Vision-Assisted Calibration [8.4]
Wi-Fiベースの位置決めは、モール、空港、キャンパスなどの屋内環境における位置情報ベースのサービスの、スケーラブルでプライバシー保護のソリューションを約束する。 RSSベースの方法は、すべてのWi-Fi対応デバイスでRSSデータが利用できるため、広くデプロイできるが、RSSはマルチパス、チャンネルのバリエーション、受信特性に非常に敏感である。短時間のカメラアシストキャリブレーションフェーズを用いて,高分解能同期RSSロケーションデータ収集を自動化するフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:28:46 GMT)
Learning Admissible Heuristics for A*: Theory and Practice [8.4]
ディープラーニングアプローチは、しばしば許容性を無視し、トレーニングデータ以外の一般化に関して制限された保証を提供する。本稿では,これら2つの制約に対処する。まず,制約付き最適化問題として学習を行い,学習中に許容度を強制する損失関数であるクロスエントロピー適応性(CEA)を導入する。ルービックキューブ領域では、圧縮されたパターンデータベース(PDB)のガイダンスよりもはるかに強いほぼ許容値が得られる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:51:26 GMT)
EgoVIS@CVPR: PAIR-Net: Enhancing Egocentric Speaker Detection via Pretrained Audio-Visual Fusion and Alignment Loss [8.3]
エゴセントリックビデオにおけるアクティブな話者検出(ASD)は、不安定な視点、動きのぼやけ、オフスクリーン音声源などによる固有の課題を提示する。本稿では,部分的に凍結したWhisperオーディオエンコーダと,微調整されたAV-HuBERTビジュアルバックボーンを統合する効果的なモデルであるPAIR-Netを紹介する。実世界の自我中心の条件下では,事前学習音声の付加価値とアライメントに基づくアライメント・ベース・フュージョンが重要である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:22:00 GMT)
Smoothing-Based Conformal Prediction for Balancing Efficiency and Interpretability [8.2]
Conformal Prediction (CP) は、統計的に厳密な予測セットを構築するための分布自由フレームワークである。 CP フレームワークにスムーズな操作を組み込んだ SCD-split を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:08:26 GMT)
Spatial Reasoning in Foundation Models: Benchmarking Object-Centric Spatial Understanding [8.2]
基礎モデルにおけるオブジェクト中心空間推論のベンチマークを示す。グラウンディングディーノやOWLv2のような検出器は、リレーショナル推論に制限のある正確なボックスを提供する。本研究は,地域化と真の空間理解のギャップを強調し,地域社会における空間認識基盤モデルの必要性を指摘する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:06:19 GMT)
Factor-Based Conditional Diffusion Model for Portfolio Optimization [8.2]
ポートフォリオ最適化のための条件付き拡散モデルを提案する。資産固有の要因を条件に、翌日の株価リターンの断面分布を学習する。中国のAシェア市場における実証的な結果は、我々のアプローチがベンチマーク手法を一貫して上回っていることを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:11:08 GMT)
DoDo-Code: an Efficient Levenshtein Distance Embedding-based Code for 4-ary IDS Channel [8.1]
深部レベンシュテイン距離埋め込みによる高速単一IDS訂正符号を設計するための新しい手法を提案する。深層学習モデルを用いて、シークエンスを埋め込みベクトルに投影し、元のシークエンス間のレヴェンシュテイン距離を保存する。この埋め込み空間は、コードワード検索とセグメント修正のためのアルゴリズムを開発する複雑なLevenshteinドメインのプロキシとして機能する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:01:26 GMT)
Exposing Hallucinations To Suppress Them: VLMs Representation Editing With Generative Anchors [8.1]
マルチモーダル大規模言語モデル (MLLM) は様々な視覚言語タスクにおいて顕著な成功を収めている。 MLLMは幻覚に非常に敏感であり、視覚的証拠とは相容れない内容を生み出す。本研究では,幻覚の緩和のための訓練不要で自己指導的な方法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:24:28 GMT)
Unbiased Binning: Fairness-aware Attribute Representation [8.0]
我々は、バケット化が与えられた場合、等サイズのビン化に最も近い離散化を求める不偏のビン化問題を導入する。偏見のない双生児を見つけることは、しばしば高い公正さをもたらすか、あるいは存在すらしないかもしれない。そこで我々は,epsilon-biased binningのための局所探索(LS)に基づく,実用的なスケーラブルなアルゴリズムを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:42:25 GMT)
TEXT2AFFORD: Probing Object Affordance Prediction abilities of Language Models solely from Text [8.0]
事前学習言語モデル(LM)と事前学習型ビジョンランゲージモデル(VLM)における対象値の知識について検討する。 Text2Affordは15のアプライアンスクラスを特徴とする,新しい,包括的なオブジェクトアプライアンスデータセットをキュレートする。実験結果から, PTLMは, 一般的でない物価の場合に, 限られた推論能力を示すことが明らかとなった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:50:48 GMT)
The InviTE Corpus: Annotating Invectives in Tudor English Texts for Computational Modeling [8.0]
我々は、事前処理とデータ選択を通じて生データから反復的なアノテーションプロセスまで、ワークフローの概要を述べる。 InviTEコーパス(InviTE corpus) - ほぼ2000年の近世英語(EModE)文のコーパス。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:42:32 GMT)
Towards Faithful Reasoning in Remote Sensing: A Perceptually-Grounded GeoSpatial Chain-of-Thought for Vision-Language Models [8.0]
リモートセンシングにおける視覚言語モデル(VLM)は、複雑な分析タスクで失敗することが多い。我々は、知覚的に周囲の地理空間的連鎖(Geo-CoT)を紹介する。 Geo-CoTは、リモートセンシング分析を検証可能なマルチステッププロセスとしてモデル化するフレームワークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:34:42 GMT)
Progressive Weight Loading: Accelerating Initial Inference and Gradually Boosting Performance on Resource-Constrained Environments [8.0]
プログレッシブウェイトローディング(Progressive Weight Loading, PWL)は、最初は軽量の学生モデルをデプロイし、次にその層を事前訓練された教師モデルに置き換えることで、高速な初期推論を可能にする技術である。 VGG, ResNet, ViT アーキテクチャに関する実験により,PWL で訓練されたモデルは,教師層がロードされるにつれて,競争蒸留性能を維持し,徐々に精度を向上することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:19:32 GMT)
Real-Time Object Detection Meets DINOv3 [8.0]
私たちはDEIMをDINOv3機能で拡張し、結果としてDEIMv2を作りました。 X、L、M、Sの変異体では、DINOv3を前処理または蒸留したバックボーンを採用する。超軽量モデル(Nano、Pico、Femto、Atto)では、厳格なリソース予算を満たすために、深さと幅のプルーニングを備えたHGNetv2を使用します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:12:39 GMT)
Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy [8.0]
我々は高解像度センサのクラウドとクラウドのシャドウ検出問題に機械学習を用いて対処する。先進的なディープラーニングアーキテクチャ,すなわちUNet と Spectral Channel Attention Network (SCAN) の手法を用いて,従来の手法をデプロイし,評価する。その結果,従来の手法は空間的・境界的定義に苦慮し,雲や雲の影の検出に影響を及ぼすことがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:44:55 GMT)
Physics-informed GNN for medium-high voltage AC power flow with edge-aware attention and line search correction operator [7.9]
物理インフォームドグラフニューラルネットワーク(PIGNN)は高速な交流電力フロー解法として登場した。 PIGNN-Attn-LSは電圧0.00033 p.uのRMSE、角度0.08$circ$のRMSEを達成し、それぞれPIGNN-MLPベースラインの99.5%と87.1%を上回っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:09:26 GMT)
What Factors Affect LLMs and RLLMs in Financial Question Answering? [7.9]
本研究では,様々な手法が大規模言語モデル(LLM)に与える影響と,大規模言語モデル(RLLM)が財務的質問応答タスクに与える影響について検討する。本研究は,金融質問応答におけるLCMの促進手法とエージェント・フレームワークにより,LCMの性能が向上することが示唆された。 RLLMはLong CoT機能を備えており、従来の手法の有効性を制限し、性能をさらに向上させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:02:45 GMT)
MMPB: It's Time for Multi-Modal Personalization [7.9]
パーソナライズにおける視覚言語モデル(VLM)を評価するための,最初の広範囲なベンチマークであるMMPBを紹介する。 MMPBは10kイメージクエリペアで構成されており、人間、動物、物体、キャラクターの4つのカテゴリにまたがる111のパーソナライズ可能な概念を含んでいる。我々は,概念注入,マルチターン対話,パーソナライズクエリといった3段階のプロトコルを用いてパーソナライズ性能を評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:24:48 GMT)
Do LLM Agents Know How to Ground, Recover, and Assess? A Benchmark for Epistemic Competence in Information-Seeking Agents [7.9]
本稿では,Large Language Model (LLM) 検索エージェントの能力を評価する最初のベンチマークであるSeekBenchを紹介する。 SeekBenchは、190のエキスパートアノテーション付きトレースで構成され、1,800以上のレスポンスステップがLLM検索エージェントによって生成される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:18:50 GMT)
Learning Equivariant Functions via Quadratic Forms [7.8]
データから群に対応する二次形式 $xT A x$ を学習することにより、群(未知あるいは未知の)同変関数を学習する手法を提案する。我々は、対応する一意対称行列とその固有の対角形を利用し、単純化され、効率的であるモデルを生み出す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:44:26 GMT)
Automatic Discovery of One Parameter Subgroups of $SO(n)$ [7.8]
我々は、$SO(3)$とより一般的には$SO(n)$の1-パラメータ部分群の自動発見のための新しいフレームワークを導入する。この方法は、標準ジョルダン形式のスキュー対称行列を使い、$SO(n)$のリー代数を定義する。提案手法の有効性は,振り子モデリング,慣性モーメント・オブ・慣性予測,トップクォークタグ付け,不変回帰といったタスクによって実証される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:31:38 GMT)
A Random Matrix Perspective of Echo State Networks: From Precise Bias--Variance Characterization to Optimal Regularization [7.7]
本研究では,重み付き線形教師託宣で設定した教師生徒を対象に,Echo State Networks (ESNs) の厳密な分析を行った。入力統計値、オラクルベクトル、リッジ正規化パラメータの関数として、バイアス、分散、平均二乗誤差(MSE)の閉形式式を導出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:47:39 GMT)
Reinforcement Learning-Guided Chain-of-Draft for Token-Efficient Code Generation [7.7]
LLMは、コード生成において表面的なフラレンシを示すが、構造化推論タスクに苦労する。我々は、CoD生成ソリューションから最も有望な候補を選択することを学ぶ強化学習フレームワークであるmulticodを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:40:17 GMT)
Index-MSR: A high-efficiency multimodal fusion framework for speech recognition [7.7]
Index-MSRは効率的なマルチモーダル音声認識フレームワークである。 MFDは、ビデオからのテキスト関連情報を音声認識に効果的に組み込む。 Index-MSR はソータ精度を実現し,置換誤差を 2050% 削減した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:47:15 GMT)
Proving and Rewarding Client Diversity to Strengthen Resilience of Blockchain Networks [7.6]
クライアントの多様性はブロックチェーンのレジリエンスの基盤だが、ほとんどのネットワークは、クライアント実装の危険な分散に悩まされている。このモノカルチャーは、ネットワークを非常に危険なシナリオに公開します。本稿では、検証可能な実行と経済的インセンティブを組み合わせて、マイノリティクライアントの使用を確実に識別し、報奨する新しい枠組みを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:06:59 GMT)
Adaptive Policy Backbone via Shared Network [7.6]
強化学習(Reinforcement Learning, RL)は、ドメイン間で印象的な結果を得たが、最適なポリシを学ぶには、通常、広範囲なインタラクションデータが必要である。本稿では,共有バックボーンの前後に軽量な線形層を挿入するメタトランスファーRL手法であるAdaptive Policy Backbone (APB)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:14:03 GMT)
Mechanistic Independence: A Principle for Identifiable Disentangled Representations [7.6]
アンタングル表現は、観測データに基づく変動の潜伏因子を復元しようとする。メカニスティックな独立によって解離が達成される統一的な枠組みを導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:58:03 GMT)
Can Large Language Models Autoformalize Kinematics? [7.5]
本稿では,Large Language Models (LLM) が形式化プロセスを自動化するかどうかを実験的に検討する。 20問題ベンチマークスイートは、学部レベル物理学のキネマティクス問題から設計されている。成功率70%(5サンプル以上)を達成し, 失敗事例を分析し, 今後の改善に向けての方向性を明らかにする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:01:48 GMT)
GenesisGeo: Technical Report [7.5]
ユークリッド幾何学における自動定理証明であるGenesisGeoを提案する。我々は218万の幾何学的問題からなる大規模な幾何学的データセットをオープンソース化した。また、Qwen3-0.6B-Base上にニューロシンボリック証明器GenesisGeoを構築した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:30:43 GMT)
Generalizing Multi-Objective Search via Objective-Aggregation Functions [7.5]
多目的探索(MOS)は、現実のロボットシステムが複数の、しばしば矛盾する目標のバランスをとる必要があるため、ロボット工学において不可欠なものとなっている。最近の研究は、目的間の複雑な相互作用を探求し、最先端のMOSアルゴリズムを使用できない問題定式化につながっている。隠れた(検索)目的の集約関数を介して解の目的を最適化する一般化された問題定式化を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:06:03 GMT)
Sparse but Wrong: Incorrect L0 Leads to Incorrect Features in Sparse Autoencoders [7.4]
本研究では, L0 が SAE に与える影響について検討し, L0 が正しく設定されていない場合, SAE は LLM の基本的な特徴を乱すことができないことを示す。本稿では,SAE に対する適切な L0 探索を,与えられたトレーニング分布上で導くためのプロキシ指標を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:13:02 GMT)
Neighborhood Sampling Does Not Learn the Same Graph Neural Network [7.3]
大規模グラフニューラルネットワークのトレーニングにおいて,近傍サンプリングは重要な要素である。提案手法は,複数の近傍サンプリング手法と,それに対応する後方GPについて検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:28:13 GMT)
Enhancing Credit Risk Prediction: A Meta-Learning Framework Integrating Baseline Models, LASSO, and ECOC for Superior Accuracy [7.3]
本研究では,複数の相補的モデルを合成する包括的メタラーニングフレームワークを提案する。我々は,全ての構成モデルにまたがる予測クラスに対して,置換特徴重要度分析を実装した。その結果,我々の枠組みは,財務組織分類の精度を著しく向上させることがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:09:04 GMT)
A benchmark for vericoding: formally verified program synthesis [7.2]
私たちのベンチマークには12,504の正式な仕様が含まれており、Dafnyでは3,029、Verus/Rustでは2,334、Leanでは7,141です。私たちは、リーンで27%、Verus/Rustで44%、Dafnyで82%のベリコード成功率を、既製のLLMを使っています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:36:20 GMT)
Surgical Vision World Model [7.2]
動作制御可能な手術データを生成する最初の手術視覚世界モデルを提案する。提案モデルでは, 動作制御可能な手術データを生成し, アーキテクチャ設計の検証を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:33:43 GMT)
Personalized LLM Decoding via Contrasting Personal Preference [7.2]
本研究では,パラメータ効率のよい微細チューニング(PEFT)をユーザ固有のデータに適用した新しいデコード時間手法CoPeを提案する。私たちの中核となる考え方は、各ユーザの暗黙の報酬信号の最大化によって、特にパーソナライズのために報酬誘導復号を利用することです。実験の結果,CoPeは高い性能を示し,ROUGE-Lでは平均10.57%のパーソナライゼーションが向上した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:35:55 GMT)
The Emergence of Altruism in Large-Language-Model Agents Society [7.1]
社会シミュレーションのための大規模言語モデルを活用することは、計算社会科学のフロンティアである。適応的エゴイスト(Adaptive Egoists)は自己利益を優先するが、社会的規範的メッセージボードの影響下で利他的行動が増加する。社会シミュレーションにおいては,モデル選択は推論能力を選択することだけでなく,本質的な社会的行動論理を選択することである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:17:29 GMT)
Repetitive TMS-based Identification of Methamphetamine-Dependent Individuals Using EEG Spectra [7.1]
メタンフェタミン (METH) の反復的経頭蓋磁気刺激 (rTMS) は, アンケートにより評価されることが多い。本研究は、より客観的な結果を得るために、ニューラルシグナルを使用することの可能性を検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:42:17 GMT)
Training-Free Defense Against Adversarial Attacks in Deep Learning MRI Reconstruction [7.1]
本稿では,MRI再建モデルに対する逆行性攻撃を再訓練せずに軽減するための新しいアプローチを提案する。循環測定整合性の概念に基づいて,攻撃入力の周囲の小さな球において最小化される新たな緩和目標を考案する。その結果,本手法は,異なるデータセット間での対向摂動の影響を著しく低減することがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:56:39 GMT)
Large language models management of medications: three performance analyses [7.1]
大規模言語モデル(LLM)は、医学的状態の診断に有用であるが、適切な薬局においてそれらの整合性を評価する研究はほとんどない。本評価の目的は,GPT-4oを3種類のベンチマーク試験で試験することであった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:51:48 GMT)
Managing Classical Processing Requirements for Quantum Error Correction [7.0]
量子誤り訂正を実用化するためには,効率的なデコーダスケジューリングが不可欠であることを示す。提案手法は,フォールトトレラントベンチマークにおけるデコーダ要件を10～40%削減する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:52:59 GMT)
Comparing Uncertainty Measurement and Mitigation Methods for Large Language Models: A Systematic Review [6.9]
大規模言語モデル(LLM)は多くの領域にまたがって変換されている。不確実性定量化(英: Uncertainty Quantification, UQ)とは、不確実性の測定と、不確実性と正確性の間の不一致に対処するための校正技術である。この調査は、LCMの校正方法と関連するメトリクスをレビューする最初の専用研究である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:08:32 GMT)
What Matters More For In-Context Learning under Matched Compute Budgets: Pretraining on Natural Text or Incorporating Targeted Synthetic Examples? [6.9]
本稿では、前向きコピー(インダクション)、後向きコピー(アンティ)、あるいはバランスの取れたミックスを事前学習ストリームに注入する軽量カリキュラムBi-Inductを紹介する。我々は、0.13Bから1BのパラメータをイソFLOPでトレーニングし、 (i) 少数ショットICLベンチマーク、 (ii) ヘッドレベルテレメトリ、 (iii) 言語モデリングの難易度を評価した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:27:55 GMT)
Scaling Accessibility Education: Reflections from a Workshop Targeting CS Educators and Software Professionals [6.9]
インドにおけるコンピュータサイエンス学部と産業界実践者の間で,アクセシビリティ実践の基礎的能力構築を目的とした1日間のワークショップを開催した。参加者の大多数はワークショップを肯定的に評価し、多くの報告では信頼が高まり、アクセシビリティに対する認識が共有責任として変化した。私たちは、インドのコンピューティング教育と専門分野におけるアクセシビリティの能力強化を目的とした将来のイニシアチブのガイドとして、実用的な洞察を提供しています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:03:57 GMT)
AI Ethics Education in India: A Syllabus-Level Review of Computing Courses [6.9]
医療、ガバナンス、金融、教育といった分野にまたがる人工知能(AI)の広範な統合は、その倫理的意味についての精査を強めている。倫理はコンピュータ科学(CS)教育においてより広く注目されているが、AI倫理の特定の教育的扱いはいまだに過小評価されていない。本研究は,インドの主要機関におけるCSおよび同盟地域からの3,395件の公開アクセスシラビの大規模分析を通してのギャップを解消するものである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:24:01 GMT)
A critical review of methods and challenges in large language models [6.9]
大規模言語モデル(LLM)の詳細な分析についてリカレントニューラルネットワーク(RNN)からトランスフォーマーモデルへの進化を検査する。コンテキスト内学習や様々な微調整アプローチといった最先端のテクニックを記述します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:07:34 GMT)
Retrieval-of-Thought: Efficient Reasoning via Reusing Thoughts [6.8]
本稿では, 事前推論を構成可能な思考として再利用するRetrieval-of-Thought(RoT)を提案する。 RoTは、シーケンシャルかつセマンティックなエッジを持つ思考グラフにステップを整理し、高速な検索と柔軟な再結合を可能にする。複数のモデルを用いた推論ベンチマークでRoTを評価し,精度,トークン使用率,レイテンシ,メモリオーバーヘッドを測定した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:17:35 GMT)
RSTGCN: Railway-centric Spatio-Temporal Graph Convolutional Network for Train Delay Prediction [6.8]
本稿では,鉄道駅における全列車の到着遅延を予測するために,鉄道中心の時空間グラフ畳み込みネットワーク(RSTGCN)を提案する。提案手法は,列車の周波数を考慮した空間的注意を含む,いくつかのアーキテクチャの革新と新しい特徴の統合を取り入れている。この取り組みを支援するために、インド鉄道ネットワーク(IRN)全体の包括的なデータセットをキュレートし、リリースしました。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:52:52 GMT)
AI Noether -- Bridging the Gap Between Scientific Laws Derived by AI Systems and Canonical Knowledge via Abductive Inference [6.8]
現代科学の中核的な目標は、AIとコンピュータ処理の最近の進歩を活用して、科学的手法を自動化し、加速することである。シンボリック回帰は解釈可能なモデルとデータに適合するが、これらのモデルは確立された理論の外に位置することが多い。解: 公理と仮説が方程式として表現できる限り、公理を導出するのに十分である最小の公理の集合を生成するシステムを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:50:25 GMT)
Incorporating priors in learning: a random matrix study under a teacher-student framework [6.7]
正規化線形回帰は機械学習の中心であるが、その情報的先行を伴う高次元挙動はいまだに理解されていない。本研究は,MAP回帰を最大化するためのトレーニングとテストのリスクを,初めて正確に評価するものである。我々のフレームワークは、リッジ回帰、最小二乗、および事前インフォームド推定器を統一し、ランダム行列理論を用いて、閉形式リスク公式を生成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:47:15 GMT)
LiteGS: A High-performance Framework to Train 3DGS in Subminutes via System and Algorithm Codesign [6.7]
3D Gaussian Splatting (3DGS)は、3D表現において有望な代替手段として登場したが、それでも高いトレーニングコストに悩まされている。本稿では、3DGSトレーニングパイプラインを体系的に最適化する高性能計算フレームワークであるLiteGSを紹介する。実験の結果、LiteGSはオリジナルの3DGSトレーニングを最大13.4倍、同等または優れた品質で加速した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:24:20 GMT)
Latent Diffusion : Multi-Dimension Stable Diffusion Latent Space Explorer [6.7]
本稿では、カスタマイズ可能な潜在空間演算を拡散プロセスに統合するフレームワークであるWorknameを紹介する。概念的および空間的表現の直接操作を可能にすることにより、この手法は生成芸術における創造可能性を広げる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:15:58 GMT)
Feature Hedging: Correlated Features Break Narrow Sparse Autoencoders [6.6]
スパースオートエンコーダ(SAE)は多意味的な活性化を解釈可能な線形方向へ分解する。 SAEがトレーニング対象の「真の特徴」の数よりも狭く、特徴の間に相関関係がある場合、SAEは関連する特徴のコンポーネントをマージする。特徴ヘッジ(feature hedging)と呼ばれるこの現象は、SAE再建損失によって引き起こされ、SAEがより狭くなるほど深刻である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:18:40 GMT)
LLM Assisted Alpha Fairness for 6 GHz WiFi and NR_U Coexistence: An Agentic Orchestrator for Throughput, Energy, and SLA [6.5]
Wi-Fiと5G NR-Uはリス・バイ・トーク(LBT)ルールの下で同じチャンネルで競合する。ポリシーと実行を分離するエージェントコントローラを提案する。 2つの160MHzチャネルと混合Wi-Fi/NR-Uユーザーを持つ6GHzシミュレータでは、LDMアシストポリシーは強力なルールベースラインとのスループットを保ちながら、エネルギー効率を一貫して改善する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:34:45 GMT)
Self-Supervised Learning of Graph Representations for Network Intrusion Detection [6.5]
GraphIDSは、表現学習と異常検出を統一する自己教師型侵入検出モデルである。帰納的グラフニューラルネットワークは、各フローを局所的なトポロジカルコンテキストに埋め込んで、典型的なネットワークの振る舞いをキャプチャする。 Transformerベースのエンコーダデコーダは、これらの埋め込みを再構築し、自己注意を通じてグローバルな共起パターンを暗黙的に学習する。推論中は、異常に高い復元誤差のフローが潜在的侵入としてフラグ付けされる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:30:43 GMT)
Noise-to-Notes: Diffusion-based Generation and Refinement for Automatic Drum Transcription [6.5]
オートマチック・ドラム・リテラル(ADT)は、伝統的に、オーディオ・スペクトログラムからドラムイベントを予測する識別タスクとして定式化されている。ノイズ・トゥ・ノート(N2N)は、拡散モデルを利用して、音響条件付きガウス雑音を関連する速度でドラムイベントに変換するフレームワークである。 N2Nは、複数のADTベンチマークにまたがって、最先端のパフォーマンスを新たに確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:12:43 GMT)
Direct Bias-Correction Term Estimation for Propensity Scores and Average Treatment Effect Estimation [6.4]
本研究は平均治療効果(ATE)の推定について考察する。我々は、直接バイアス補正項推定により、確率スコアを推定する。本稿では,この直接バイアス補正項推定手法の一般的な枠組みを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:45:12 GMT)
A Domain-Agnostic Scalable AI Safety Ensuring Framework [6.4]
高い性能を維持しつつ、強力な安全保証を実現するための、ドメインに依存しない最初のAI安全フレームワークを提案する。本フレームワークは,(1) 確率制約付き最適化コンポーネント,(2) 安全性分類モデル,(3) 内部試験データ,(4) 保守的試験手順,(5) 情報的データセット品質測定,(6) 勾配勾配を有する連続近似損失関数を含む。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:48:04 GMT)
Comparing RAG and GraphRAG for Page-Level Retrieval Question Answering on Math Textbook [6.4]
ラージ言語モデル(LLM)は、学習中の情報検索のための新しい補助具として登場した。本稿では,知識グラフ強化型RAG手法であるRetrieval-Augmented Generation(RAG)とGraphRAGについて,ページレベルの質問応答について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:24:50 GMT)
Secure IVSHMEM: End-to-End Shared-Memory Protocol with Hypervisor-CA Handshake and In-Kernel Access Control [6.3]
本稿では,エンド・ツー・エンドの相互認証を実現するプロトコルであるSecure IVSHMEMを提案する。マイクロベンチマークでは、Secure IVSHMEMは200ms以下でワンタイムハンドシェイクを完了し、修正されていないベースラインの5%以内にデータプレーンのラウンドトリップレイテンシを保持する。この設計は、パフォーマンスとセキュリティの両方が最重要である自動車システムのような、安全と遅延クリティカルなホストドメインに理想的だと考えています。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:20:41 GMT)
Motion-Aware Transformer for Multi-Object Tracking [6.3]
我々は、トラッククエリを事前に更新するために、フレーム間のオブジェクトの動きを明示的に予測するMotion-Aware Transformer (MATR)を導入する。 DanceTrack、SportsMOT、BDD100kの実験は、MATRが標準メトリクス間で大きな利益をもたらすことを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:25:30 GMT)
PRIME: Large Language Model Personalization with Cognitive Dual-Memory and Personalized Thought Process [6.3]
大規模言語モデル(LLM)のパーソナライゼーションは、モデルのアウトプットを個人の独特な好みや意見と整合させることを目的としている。本稿では,エピソードおよびセマンティックメモリ機構を用いた統一フレームワークPRIMEを提案する。実験はPRIMEの有効性を長文と短文の両方のシナリオで検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:13:38 GMT)
Multi-View Crowd Counting With Self-Supervised Learning [6.2]
SSLCounterはMVCのための新しい自己教師型学習フレームワークである。 SSLCounterはシーンの暗黙の表現を学習し、連続した幾何学形状の再構築を可能にする。実験では、SSLCounterは、トレーニングデータの70%のみを使用して、競争力のあるパフォーマンスを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:59:12 GMT)
Transformers Can Learn Connectivity in Some Graphs but Not Others [6.2]
変換器は、各ノードを低次元のサブ空間に埋め込むことができる「グリッドのような」有向グラフ上で接続性を学ぶことができる。基礎となるグリッドグラフの次元性は、接続タスクを学習するトランスフォーマーの能力の強い予測子であることがわかった。モデルスケールの増大により、グリッドグラフ上の接続性を推測する一般化がますます向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:39:09 GMT)
AI for Scientific Discovery is a Social Problem [6.2]
主な障壁は社会と制度にあると我々は主張する。コミュニティの障害,上流ニーズの一致しない研究優先,データの断片化,インフラストラクチャの不平等という,4つの相互接続的な課題を強調します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:57:09 GMT)
TY-RIST: Tactical YOLO Tricks for Real-time Infrared Small Target Detection [6.0]
赤外線小目標検出(IRSTD)は、防衛と監視に重要であるが、依然として困難である。我々は、ストライド対応のバックボーンと微粒な受容場を統合した、最適化されたYOLOv12nアーキテクチャであるTY-RISTを提案する。 4つのベンチマークと20の異なるモデルの実験では、最先端のパフォーマンスを示し、0.5 IoUでmAPを+7.9%、精度を+3%、リコールを+10.2%改善した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:36:57 GMT)
Learning Temporal Saliency for Time Series Forecasting with Cross-Scale Attention [6.0]
パッチベースのクロスアテンション機構とマルチスケール処理を組み合わせた,革新的なアーキテクチャであるCrossScaleNetを提案する。本評価は,時間的塩分濃度検出と予測精度の両方において優れた性能を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:43:51 GMT)
Evaluating the Limits of Large Language Models in Multilingual Legal Reasoning [5.9]
この研究は、LLaMAとGeminiを多言語法的および非法的ベンチマークで評価する。マルチリンガル・タスク多様性ベンチマークをサポートするために設計された,オープンソースのモジュール型評価パイプラインを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:19:12 GMT)
Neo-Grounded Theory: A Methodological Innovation Integrating High-Dimensional Vector Clustering and Multi-Agent Collaboration for Qualitative Research [5.8]
Neo Grounded Theory (NGT)は、定性的研究のスケール深さパラドックスを解決するために、ベクトルクラスタリングとマルチエージェントシステムを統合する。 NGTは168倍の速度向上(3時間対3週間)、優れた品質(0.904対0.883)、96%のコスト削減を達成した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:26:33 GMT)
PAPER: Privacy-Preserving ResNet Models using Low-Degree Polynomial Approximations and Structural Optimizations on Leveled FHE [5.8]
最近の研究は、完全同型暗号化(FHE)を用いた深層畳み込みニューラルネットワーク(CNN)の実行により、非インタラクティブなプライバシ保護推論をより実用的なものにしている。また、非線形アクティベーションの高次近似にも依存しており、これは平文のReLUモデルと比較して乗算深度を増大させ、精度を2-5%削減する。本研究では、プライバシ保護推論において広く採用されているベンチマークアーキテクチャであるResNetsに注目し、FHE非インタラクティブモデルとそれに対応するモデルの精度ギャップを埋める。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:10:23 GMT)
Data-driven Piecewise Affine Decision Rules for Stochastic Programming with Covariate Information [5.8]
非部分的決定(PADR)に埋め込まれた経験的リスク(M)手法を提案する。提案手法は理論的整合性を持つ広範で非クラスな非制約問題に適用可能であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:39:17 GMT)
Triple-BERT: Do We Really Need MARL for Order Dispatch on Ride-Sharing Platforms? [5.7]
Triple-BERTは、ライドシェアリングプラットフォーム上の大規模オーダー車両用に特別に設計された集中型シングルエージェント強化学習(MARL)手法である。提案手法は,共同動作確率を個々の運転者行動確率に分解する動作分解戦略を通じて,広い行動空間に対処する。 Triple-BERTは、現在の最先端技術よりも約11.95%改善され、4.26%のサービス注文が増加し、22.25%のピックアップ時間が短縮された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:15:18 GMT)
GTPO and GRPO-S: Token and Sequence-Level Reward Shaping with Policy Entropy [5.7]
本稿では,2つの新しいアルゴリズムによる報酬の微粒化を促進するメカニズムである動的エントロピー重み付けを提案する。報酬形成のための政策のエントロピーを再取得することで、我々は真にトークン単位の信用割り当てを達成できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:04:07 GMT)
Neural Feature Geometry Evolves as Discrete Ricci Flow [5.6]
深層ニューラルネットワークは入力データ多様体の複雑な幾何学的変換を通じて特徴表現を学習する。離散幾何学のレンズによる神経特徴幾何学について検討する。フィードフォワードニューラルネットワークにおいて,非線形アクティベーションが特徴幾何を形成する上で重要な役割を担っていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:57:46 GMT)
SoK: Potentials and Challenges of Large Language Models for Reverse Engineering [5.6]
リバースエンジニアリング(RE)はソフトウェアセキュリティの中心であり、脆弱性発見やマルウェア分析などのタスクを可能にする。ディープラーニングの初期の進歩は、特にマルウェア検出と脆弱性分類のために、REの一部を自動化するようになった。最近では、急速に成長する研究機関が、同様の目的にLarge Language Models (LLMs)を適用している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:26:51 GMT)
COSPADI: Compressing LLMs via Calibration-Guided Sparse Dictionary Learning [5.6]
CoSpaDiは、低ランクの分解をより柔軟な構造化されたスパース分解に置き換える、トレーニング不要の圧縮フレームワークである。複数のLlamaモデルとQwenモデルにまたがるCoSpaDiを,20～50%の圧縮比で層間および群間設定で評価した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:55:09 GMT)
Retrieval-Augmented Guardrails for AI-Drafted Patient-Portal Messages: Error Taxonomy Construction and Large-Scale Evaluation [5.6]
EHRポータル経由の非同期患者・クリニックメッセージングは、クリニックのワークロードの増加源である。 1) 5つのドメインと59の粒度のエラーコードからなる臨床基礎的エラーオントロジーを導入し,(2)検索強化評価パイプラインを開発し,(3)拡張性,解釈性,階層的エラー検出を実現するためにDSPyを用いた2段階のプロンプトアーキテクチャを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:42:43 GMT)
FlowDrive: moderated flow matching with data balancing for trajectory planning [5.6]
FlowDriveは、条件付き修正フローを学習し、ノイズを直接トラジェクトリ分布にマッピングするフローマッチングトラジェクトリプランナである。 FlowDriveは、学習ベースのプランナーとルールベースの改善によるアプローチ手法の間で、最先端の結果を達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:49:22 GMT)
Chronic Stress, Immune Suppression, and Cancer Occurrence: Unveiling the Connection using Survey Data and Predictive Models [5.4]
慢性的なストレスはがんの発生に関係していたが、直接的な因果関係は確立されていない。ストレス指標,がん歴,自己報告調査による人口統計から変数を用いた予測モデルを開発した。その結果, ストレス頻度, ストレスレベル, 健康影響の知覚, 癌の発生率との間に有意な因果関係が認められた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:42:09 GMT)
Beyond RAG vs. Long-Context: Learning Distraction-Aware Retrieval for Efficient Knowledge Grounding [5.4]
Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) を外部の最新の情報に基盤付けるためのフレームワークである。本稿では,適応型検索システムLDAR(Learning Distraction-Aware Retrieval)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:40:42 GMT)
Metrics for Parametric Families of Networks [5.3]
最適輸送のグロモフ・ワッサーシュタイン変則に基づいて、パラメータ化されたグロモフ・ワッサーシュタイン距離の族を定義する。これらの距離の基本的な性質を確立し、文献におけるいくつかの既存の指標を仮定することを示す。生成モデルからの経験的推定をすることで、我々の距離をランダムグラフとランダムな距離空間設定で一貫して近似できることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:31:28 GMT)
TabText: Language-Based Representations of Tabular Health Data for Predictive Modelling [5.2]
本稿では,前処理および特徴抽出手法であるTabTextを紹介する。メソッドはテーブルを文脈言語に変換する。タスク非依存の数値表現を生成するために、事前訓練された大きな言語モデルを適用する。これらの固定埋め込みは、様々な予測タスクの入力として使用される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:08:23 GMT)
A Two-Stage Strategy for Mitosis Detection Using Improved YOLO11x Proposals and ConvNeXt Classification [5.2]
MIDOG 2025 Track 1は、非腫瘍性、炎症性、壊死性再腫瘍を含む全スライディングイメージ(WSI)におけるミトーシス検出を必要とする。複雑で異質な文脈のため、しばしば偽陽性と偽陰性が存在するため、検出F1スコアは劣化する。本稿では、有糸分裂候補を生成し、偽陽性を除去する2段階フレームワークを提案する。 MIDOG 2025 Track 1の予備テストセットでは、thealgorithmのスコアは0.7587である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:20:20 GMT)
DriveAction: A Benchmark for Exploring Human-like Driving Decisions in VLA Models [5.2]
VLA(Vision-Language-Action)モデルには高度な自律運転があるが、既存のベンチマークにはシナリオの多様性、信頼性の高いアクションレベルのアノテーション、人間の好みに沿った評価プロトコルが欠けている。我々は,2,610の駆動シナリオから生成された16,185のQAペアからなる,VLAモデル用に特別に設計された最初のアクション駆動ベンチマークであるDriveActionを紹介する。我々の実験は、最先端の視覚言語モデル(VLM)が正確な行動予測に視覚と言語指導の両方を必要とすることを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:33:48 GMT)
OFMU: Optimization-Driven Framework for Machine Unlearning [5.1]
大規模言語モデルは、ユーザ要求、著作権のある資料、時代遅れの情報など、特定の知識を解放する能力を必要としている。我々は,保留期間を保ちながら忘れを明示的に優先順位付けするペナルティベースの二段階最適化フレームワークOFMUを提案する。 OFMUは既存のアンラーニング手法を有効性と有効性の両方で一貫して上回っていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:31:32 GMT)
Large Language Models as Nondeterministic Causal Models [5.1]
Chatzi et al. と Ravfogel et al. による最近の研究は、確率的大言語モデルの反事実を生成する手法を初めて開発した。既存の手法は LLM の曖昧な解釈に依存していると私は主張する。非決定論的因果モデルとして表現することで、LLMの意図した解釈に基づく、より単純な偽物を生成する方法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:59:41 GMT)
Asymptotic equipartition property of subadditive multipartite entanglement measures on pure states [5.1]
弱条件を許容する部分加法的絡み合い対策として, AEP を定式化する。これは双極子の場合の極限における絡み合いエントロピーの特異性によって動機付けられる。得られた正規化エンタングルメント対策は,両部エンタングルメントエントロピーの凸結合に還元されることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:11:34 GMT)
How Accurate Are LLMs at Multi-Question Answering on Conversational Transcripts? [5.1]
大きな言語モデル(LLM)は、同じ会話コンテキストに基づいて複数の質問に答えることができる。この課題に対して、広範な実験を行い、プロプライエタリモデルとパブリックモデルの両方をベンチマークします。 GPT-4oのような強力なプロプライエタリなLLMは、全体的な性能が最も優れているが、最大80億のパラメータを持つ微調整されたパブリックなLLMは、GPT-4oを精度良く超える可能性がある。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:58:01 GMT)
A High-Capacity and Secure Disambiguation Algorithm for Neural Linguistic Steganography [5.0]
ニューラル言語ステガノグラフィーは、統計的検出不能を保ちながら、情報を自然のテキストに埋め込むことを目的としている。最近のSyncPoolは、あいまいな候補のグループに対して粗い粒度の同期機構を用いることで、この曖昧さに対処している。本稿では,SyncPoolの容量制限を克服し,保証可能なセキュリティ保証を維持したルックアヘッド同期法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:56:32 GMT)
Estimating the Empowerment of Language Model Agents [5.0]
EELMAはマルチターンテキストインタラクションから効果的なエンパワーメントを近似するアルゴリズムである。我々はEELMAを言語ゲームとスケールアップしたWebブラウザのシナリオの両方で検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:46:14 GMT)
How LLMs Fail to Support Fact-Checking [4.9]
LLM(Large Language Models)は、オンラインの誤報を増幅するが、誤報に対処することを約束する。我々は、政治的誤報に対処する3つのLDM(ChatGPT、Gemini、Claude)の能力を実証的に研究する。以上の結果から,モデルが実際のニュースソースで回答を得るのに苦労し,左利きの情報源を引用する傾向が示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:10:11 GMT)
Axiomatic Choice and the Decision-Evaluation Paradox [4.9]
倫理的制約などの決定に関する言明である公理を用いて意思決定をモデル化する枠組みを導入する。我々は,その構造的特性に基づいて決定公理の分類を定義し,決定を行うための公理の使用と,決定を評価するための公理の使用との間に緊張関係を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:50:55 GMT)
Causes and Consequences of Representational Similarity in Machine Learning Models [4.9]
この研究は、データセットの重複とタスクの重複という2つの要因が下流モデルの類似性にどのように影響するかを考察する。タスクとデータセットの重複が表現の類似性を高め、それらを組み合わせることで最も強い効果が得られます。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:20:39 GMT)
Critique-Guided Distillation for Efficient and Robust Language Model Reasoning [4.8]
専門家によるデモンストレーションで監督された微調整は、しばしば模倣問題に悩まされる。教師が生成した説明的批判と洗練された反応でSFTを増強する多段階学習フレームワークであるCrytique-Guided Distillation (CGD)を提案する。分析の結果,CGDは改良の不確実性を一貫して低減し,批判と反応の整合性を向上し,試料効率を向上することがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:35:43 GMT)
Can Code Language Models Learn Clarification-Seeking Behaviors? [4.8]
ClarifyCoderは,合成データ生成と命令調整を行うフレームワークである。 ClarifyCoderは,あいまいなタスクに対して,コミュニケーション率63%,質問率52%を達成した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:13:28 GMT)
FoodSEM: Large Language Model Specialized in Food Named-Entity Linking [4.8]
FoodSEMは、NEL(Non-entity Linking)と食品関連のオープンソース言語モデルのための、最先端の微調整された大型モデルである。 FoodSEMは、関連するモデルやシステムと比較して、最先端のパフォーマンスのモデルを実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:47:35 GMT)
DyRo-MCTS: A Robust Monte Carlo Tree Search Approach to Dynamic Job Shop Scheduling [4.7]
最先端の手法では、機械学習を使用してスケジューリングポリシーをオフラインで学習し、動的イベントに対する迅速な応答を可能にする。新しい仕事の到着の予測不可能さは、不完全な問題情報に基づく決定が障害に弱いため、オンライン計画が複雑になる。動作推定をMCTSに統合した動的ロバスト頑健性MCTS(DyRo-MCTS)手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:35:51 GMT)
AMPED: Adaptive Multi-objective Projection for balancing Exploration and skill Diversification [4.7]
スキルベース強化学習(SBRL)は、スキル条件付き政策を事前訓練することにより、スパース報酬のある環境への迅速な適応を可能にする。探索とスキル多様化(AMPED)のバランスをとるための新しい手法である適応多目的投影法を提案する。提案手法は,SBRLのベースラインを超える性能を,様々なベンチマークで達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:14:01 GMT)
Preventing Model Collapse Under Overparametrization: Optimal Mixing Ratios for Interpolation Learning and Ridge Regression [4.7]
モデル崩壊は、生成モデルが自身の合成出力を繰り返し訓練した後で劣化するときに起こる。この反復スキームの下で最小$$$-normとリッジ回帰の正確な誤差式を導出する。本分析により, 長期予測誤差を最小化する混合重量の興味深い特性が明らかとなった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:34:48 GMT)
Unveiling Many Faces of Surrogate Models for Configuration Tuning: A Fitness Landscape Analysis Perspective [4.7]
チューニングにおけるモデルの有用性を評価するための精度の代替として,理論を提案する。我々は,どのモデル-チューニングペアが最適かを推定する自動予測ツールであるModel4Tuneを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:25:19 GMT)
Learnable Conformal Prediction with Context-Aware Nonconformity Functions for Robotic Planning and Perception [4.7]
Learnable Conformal Predictionは、固定スコアを軽量なニューラル関数に置き換えて、コンテキスト認識の不確実性セットを生成する。 CPの理論的保証を維持しつつ、予測セットのサイズを18%減らし、検出間隔を52%減らし、経路計画の安全性を72%から91%に改善し、オーバーヘッドを最小限に抑えている。ハードウェア評価では、LCPは1%未満のメモリと15.9%の推論オーバーヘッドを追加したが、検出タスクでは39 FPSを維持し、アンサンブルの7.4倍のエネルギー効率を保っている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:44:58 GMT)
Not My Agent, Not My Boundary? Elicitation of Personal Privacy Boundaries in AI-Delegated Information Sharing [4.7]
差別的タスクを通じて個人のプライバシー境界を調査する,AIによるエレケーションアプローチを提案する。本研究は,実世界のデータフローにおいて,プライバシ・プライバシ・プライバシ・プライオリティ・エコリケーション(プライバシ・プライバシ・プライバシ・プライバシ・プライバシ・プライバシ・エカシエーション)を満足させることの重要性を浮き彫りにした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:20:30 GMT)
JE-IRT: A Geometric Lens on LLM Abilities through Joint Embedding Item Response Theory [4.7]
本稿では,LLMと問合せの両方を共有空間に埋め込む幾何学的項目応答フレームワークであるJE-IRTを提案する。質問埋め込みでは、方向は意味論を符号化し、基準は難易度を符号化するが、各質問の正しさはモデルと質問埋め込みの間の幾何学的相互作用によって決定される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:11:47 GMT)
Enhancing Vehicle Detection under Adverse Weather Conditions with Contrastive Learning [4.7]
軽量モデルを用いた車両検出のためのサイドロード-CL適応フレームワークを提案する。提案したサイドロード-CL適応モデルにより,NVDデータセット上のmAP50で検出性能が3.8%から9.5%向上する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:55:41 GMT)
Extracting Actionable Insights from Building Energy Data using Vision LLMs on Wavelet and 3D Recurrence Representations [4.7]
データの3次元グラフィカル表現に基づいて視覚言語大モデル(VLLM)を微調整するフレームワークを提案する。連続ウェーブレット変換(CWT)と繰り返しプロット(RP)を用いた1次元時系列を3次元表現に変換する手法これらの3Dエンコーディングにより、VLLMはエネルギー消費パターンを視覚的に解釈し、異常を検出し、エネルギー効率を推奨できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:18:51 GMT)
FishAI 2.0: Marine Fish Image Classification with Multi-modal Few-shot Learning [4.6]
FishAI 2.0は、マルチモーダルな数ショットのディープラーニング技術と、データ拡張のための画像生成を統合している。 FishAI 2.0の精度は91.67パーセント、Top-5の精度は97.97パーセントである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:54:35 GMT)
Redefining Machine Simultaneous Interpretation: From Incremental Translation to Human-Like Strategies [4.5]
同時機械翻訳(SiMT)は、厳密なリアルタイム制約の下で高品質な翻訳を必要とする。我々は,Sentence_CUT,DROP,Partial_MARIZATION,PronoMINALZATIONの4つの適応アクションでSiMTのアクション空間を拡張した。我々は、これらのアクションをデコーダのみの大規模言語モデル(LLM)フレームワークで実装し、アクション認識プロンプトを通じてトレーニング参照を構築する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:57:36 GMT)
A Quantum Algorithm for Nonlinear Electromagnetic Fluid Dynamics via Koopman-von Neumann Linearization [4.5]
本研究では,空間プラズマを制御した非線形電磁流体力学の量子アルゴリズムを提案する。クープマン・フォン・ノイマン線型化を適用してシュリンガー方程式に写像し、量子特異値変換によってシステムを進化させる。数値実験により、正確な解は理論上予想されるよりも小さい$m$で達成可能であることが検証された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:44:51 GMT)
Linear quantum systems: poles, zeros, invertibility and sensitivity [4.4]
量子力学の非可換性は、系の力学に基本的な制約を課す。本稿では線形量子系の零点と極について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:03:21 GMT)
A Practical Synthesis of Detecting AI-Generated Textual, Visual, and Audio Content [4.3]
AI生成コンテンツの進歩により、大きな言語モデル、拡散ベースのビジュアルジェネレータ、合成オーディオツールが広く採用されている。これらの発展は、誤情報、著作権侵害、セキュリティの脅威、および公的な信頼の侵食に関する懸念を提起する。本稿では,AI生成したテキストコンテンツ,視覚コンテンツ,音声コンテンツの検出と緩和を目的とした,幅広い手法について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:48:49 GMT)
Patient-specific Biomolecular Instruction Tuning [4.3]
CPTAC-PROTSTRUCTは,オンコロジーの分子理解のための最初のインストラクションチューニングである。また、患者固有のグラフ表現を学習し、臨床推論の強化を目的としたグラフLLMフレームワークであるKRONOSを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:05:32 GMT)
Gaussian Process Priors for Boundary Value Problems of Linear Partial Differential Equations [4.3]
適切に配置されたシステムは数値解法やニューラル演算子によって処理されるが、データによって記述されたシステムはPINNやガウス過程によって処理されることが多い。本稿では,GP事前構築のための新しい確率的枠組みである境界Ehrenpreis--Palamodov Gaussian Processes (B-GPs)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:17:49 GMT)
Lightweight Structured Multimodal Reasoning for Clinical Scene Understanding in Robotics [4.3]
映像に基づくシーン理解のための軽量なエージェント・マルチモーダル・フレームワークを提案する。チェーンオブ思考の推論、音声ビジョンの融合、動的ツールの実行をサポートする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:49:49 GMT)
Vision-Language Alignment from Compressed Image Representations using 2D Gaussian Splatting [4.2]
現代のビジョン言語パイプラインは、大量の画像テキストコーパスでトレーニングされたRGBビジョンエンコーダによって駆動される。これらのパイプラインは、ピクセル領域から2つの構造的非効率を継承する: (i) エッジデバイスからクラウドへ高密度のRGB画像を送信することはエネルギー集約的でコストがかかり、 (ii) パッチベースのトークン化はシーケンス長を爆発させる。 2次元ガウス散乱(2DGS)をアライメントのための代替視覚基板として検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:41:57 GMT)
FedCF: Fair Federated Conformal Prediction [4.1]
コンフォーマルフェアネス(CF)フレームワークをフェデレートラーニング設定に拡張し、フェアネスのためのフェデレーションモデルの監査方法について議論します。複数のドメインにまたがる複数のデータセットの実験を行うことで、我々のフレームワークを実証的に検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:35:22 GMT)
Green Prompt Engineering: Investigating the Energy Impact of Prompt Design in Software Engineering [4.1]
本稿では,グリーン・プロンプト・エンジニアリングを紹介し,エネルギー消費と性能に影響を及ぼす設計次元として言語学的複雑さを浮き彫りにする。我々は,オープンソースの小言語モデルを用いた要件分類に関する実証的研究を行い,プロンプトの可読性を変化させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:19:33 GMT)
SADA: Safe and Adaptive Inference with Multiple Black-Box Predictions [4.1]
実世界のアプリケーションは、金標準実験の高コストと時間要件のためにラベル付きデータが不足していることが多い。本稿では,複数のブラックボックス予測を安全かつ適応的に未知の品質で集約する手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:02:54 GMT)
Semantic-Inductive Attribute Selection for Zero-Shot Learning [4.1]
ゼロショット学習(ZSL)のための2つの相補的特徴選択戦略について検討する。 1つ目は、ZSLの要求に埋め込まれた特徴選択を適応させ、モデル駆動のランキングを意味のあるセマンティックプルーニングに変換する。 2つ目は、進化的計算を利用して属性部分集合の空間を直接探索する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:14:36 GMT)
Aligning Inductive Bias for Data-Efficient Generalization in State Space Models [4.0]
モデリングにおける次のフロンティアの1つは、データ効率である。この問題を解決するための原則的枠組みを導入する。本稿では,タスク依存初期化(TDI: Task-Dependent Initialization: タスク依存初期化)手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:57:47 GMT)
Budgeted Broadcast: An Activity-Dependent Pruning Rule for Neural Network Efficiency [4.0]
Budgeted Broadcast (BB) は、各ユニットにローカルトラフィック予算(長期オンデマンド$a_i$とファンアウト$k_i$の製品)を与える。 BBはこのバランスを、ファンイン(アクティビティを低くするために)またはファンアウト(ブロードキャストを減らすために)を刺激する単純なローカルアクチュエーターと強制する
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:28:52 GMT)
A Comprehensive Evaluation of Transformer-Based Question Answering Models and RAG-Enhanced Design [4.0]
トランスフォーマーベースのモデルは質問応答の分野を進歩させてきたが、複数の経路にまたがるエビデンスを必要とするマルチホップ推論は依然として困難である。本稿では,検索強化生成フレームワーク内でのマルチホップ質問応答に対する検索戦略を総合的に評価する。 HotpotQAデータセットの実験は、ハイブリッドアプローチがベースラインメソッドを大幅に上回っていることを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:11:10 GMT)
Emergent morpho-phonological representations in self-supervised speech models [3.9]
本研究では,単語認識に最適化されたS3M変種が音韻的および形態学的現象をどう表すかを検討する。それらの表現は、英語の名詞と動詞を通常の屈折形に結びつけるのに使用できる大域的な線形幾何を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:16:35 GMT)
Shape-Informed Clustering of Multi-Dimensional Functional Data via Deep Functional Autoencoders [3.9]
FAEclustは多次元関数データのクラスタ解析のための新しい機能的オートエンコーダフレームワークである。本稿では, 成分関数間の複素非線形依存性をキャプチャするユニバーサル近似器エンコーダと, ユークリッド関数と多様体値関数の両方を正確に再構成できるユニバーサル近似器デコーダを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:10:23 GMT)
Observation-Free Attacks on Online Learning to Rank [3.9]
我々は、広く使われているオンライン学習アルゴリズムのいくつかを攻撃するための新しいフレームワークを提案する。本フレームワークは,T-o(T)ラウンドのトップKレコメンデーションリストに表示されるようにターゲット項目のセットをプロモートすると同時に,学習アルゴリズムにおける線形後悔を同時に引き起こすように設計されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:06:42 GMT)
An Ontology for Unified Modeling of Tasks, Actions, Environments, and Capabilities in Personal Service Robotics [3.9]
タスク,行動,環境,能力の統一表現を提供するために,既存のものを拡張したrobots and acTions(OntoBOT)のオントロジーを提案する。 1) これらの側面を結合体にまとめて、実行、アクション、環境、能力に関する正式な推論をサポートします。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:53:08 GMT)
Towards Agentic OS: An LLM Agent Framework for Linux Schedulers [3.8]
我々は、完全に自律的な大規模言語モデル(LLM)エージェントが、人間の関与なしにLinuxスケジューラを最適化できるフレームワークであるSchedCPを紹介した。 SchedCPは、Workload Analysis Engine、進化するSchduler Policy Repository、Execution Verifierの3つの主要なサービスを備えた安定したインターフェースを提供する。評価の結果,SchedCPの性能改善は1.79倍,コスト削減は13倍であった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:10:59 GMT)
CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives [3.8]
CLASHは345個のハイインパクトジレンマと3,795個の異なる値の個々の視点からなるデータセットである。 CLASHは、価値に基づく意思決定プロセスの批判的かつ未調査な側面の研究を可能にする。 GPT-5やClaude-4-Sonnetのような強力なプロプライエタリモデルでさえ、曖昧な決定に苦戦している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:40:31 GMT)
Scaling to Multimodal and Multichannel Heart Sound Classification: Fine-Tuning Wav2Vec 2.0 with Synthetic and Augmented Biosignals [3.8]
心臓血管疾患(CVD)は、毎年約1790万人が死亡し、世界中で主要な死因となっている。近年, 心電図(ECG)信号と同期心電図(PCG)信号を用いて, CVDの異常心音の分類に深層学習が応用されている。この作業は、従来の信号処理と拡散モデルであるWaveGradとDiffWaveを組み合わせて、Wav2Vec 2.0ベースの分類器を微調整する拡張データセットを作成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:27:14 GMT)
Rethinking RoPE Scaling in Quantized LLM: Theory, Outlier, and Channel-Band Analysis with Weight Rescaling [3.7]
本研究では, 軸整合量子化器と回転する RoPE 対による長いコンテキストエイリアス化, ダイナミックレンジ拡張, 異方性などの効果により, RoPE 位置認識 (PI) と PTQ を併用すると精度が低下することを示す。本稿では,Q-ROAR (Quantization, RoPE-interpolation, Outlier Aware Rescaling) を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:23:32 GMT)
Freqformer: Frequency-Domain Transformer for 3-D Reconstruction and Quantification of Human Retinal Vasculature [3.7]
本稿では,グローバル空間コンテキストをキャプチャするトランスフォーマー層を統合した,デュアルブランチアーキテクチャを備えた新しいトランスフォーマーモデルであるFreqformerを紹介する。 Freqformerは1枚の深度平面OCTA画像を用いて訓練され、音量積分OCTAを基礎的真理として利用した。 Freqformerは既存の畳み込みニューラルネットワークとTransformerベースの手法を大幅に上回り、優れた画像メトリクスを実現した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:21:35 GMT)
Exploring the Relationships Between Physiological Signals During Automated Fatigue Detection [3.7]
生理的信号を用いた疲労検出は、輸送、医療、パフォーマンス監視といった領域において重要である。本研究は,信号対間の統計的関係を調べ,分類ロバスト性を改善する。 EMG EEGの組み合わせによるXGBoostは最高のパフォーマンスを達成した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:49:44 GMT)
SAGE: Scene Graph-Aware Guidance and Execution for Long-Horizon Manipulation Tasks [3.7]
ロングホライゾン操作タスクは、拡張されたアクションシーケンスと複雑なオブジェクトの相互作用を含む。長軸操作タスクにおけるSAGE(Scene Graph-Aware Guidance and Execution)の新たなフレームワークを提案する。 SAGE は,(1) VLM と LLM を用いて環境解析を行うシーングラフベースのタスクプランナと,(2) 対象のサブゴールグラフを対応する画像に変換する分離構造画像編集パイプラインから構成される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:14:55 GMT)
A Fully Automatic Framework for Intracranial Pressure Grading: Integrating Keyframe Identification, ONSD Measurement and Clinical Data [3.7]
頭蓋内圧(ICP)上昇は脳機能に深刻な脅威をもたらし、時間的介入の監視を必要とする。 OnSD測定と臨床データを統合したICPグレーティングのための完全自動2段階フレームワークを提案する。評価精度は0.845 pm 0.071$, 独立試験精度0.786であり, 従来のしきい値法よりも優れていた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:18:06 GMT)
TimeMosaic: Temporal Heterogeneity Guided Time Series Forecasting via Adaptive Granularity Patch and Segment-wise Decoding [3.6]
TimeMosaicは、時間的不均一性に対処することを目的とした予測フレームワークである。 TimeMosaicは、局所情報密度に応じて動的に粒度を調整するために適応パッチ埋め込みを採用している。我々は,321億の観測値を持つ大規模コーパスを訓練し,最先端のTSFMと性能を比較検討した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:33:25 GMT)
Can Large Language Models Develop Gambling Addiction? [3.6]
本研究では,大規模言語モデルがヒトギャンブル中毒に類似した行動パターンを呈するか否かを検討する。我々は,ヒトギャンブル中毒研究に基づく認知行動および神経レベルにおける意思決定の分析を行った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:24:22 GMT)
A Survey on LLM-based Code Generation for Low-Resource and Domain-Specific Programming Languages [3.6]
LLM(Large Language Models)は、人気のあるプログラミング言語のコード生成機能を示す。低リソースプログラミング言語(LRPL)とドメイン特化言語(DSL)のパフォーマンスは依然として大きな課題です。 LRPLやDSLは金融や科学といった専門分野の開発効率を高めるため、これらの課題に対処することが不可欠である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:40:54 GMT)
Deep Learning-Based Cross-Anatomy CT Synthesis Using Adapted nnResU-Net with Anatomical Feature Prioritized Loss [3.6]
マルチセンターSynthRAD2025データセットを用いて, MRからCTへの3D nnUNet適応とCTへのCBCTへのCT画像変換を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:22:15 GMT)
Benchmarking LLMs in Web API Integration Tasks [3.6]
本稿では,大規模な言語モデルによるWeb API呼び出しコード生成能力を評価するためのデータセットと評価パイプラインを提案する。私たちの実験では、API呼び出しの生成が大きな課題となり、幻覚的なエンドポイント、誤った引数の使用、その他のエラーが発生します。評価済みのオープンソースモデルはいずれも40%以上のタスクを解決できなかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:24:10 GMT)
The Dark Art of Financial Disguise in Web3: Money Laundering Schemes and Countermeasures [3.6]
調査の目的は、Web3におけるマネーロンダリングを促進するために利用される、ハイレベル戦略と基盤となるメカニズムの分類を概説することである。犯罪者は、規制の弱いフレームワークとともに、Web3の匿名性を悪用し、不正な金融活動を隠蔽する方法について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:47:58 GMT)
LLM-Augmented and Fair Machine Learning Framework for University Admission Prediction [3.5]
この研究は、機械学習、ディープラーニング、および大規模言語モデルテクニックを融合させる包括的なフレームワークを提示している。 2000以上の学生の記録に基づいて、この研究はロジスティック回帰、ナイーブベイズ、ランダムな森林、ディープニューラルネットワーク、そして積み重ねられたアンサンブルをベンチマークした。フレームワークは解釈可能で、公正を意識し、デプロイ可能である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:40:44 GMT)
GPU-Accelerated Loopy Belief Propagation for Program Analysis [3.5]
本稿では,プログラム解析のためのGPU高速化LPPアルゴリズムを提案する。本稿では,依存関係解析アルゴリズムとともに,任意のユーザ定義更新戦略を指定する統一表現を提案する。当社のアプローチでは,最先端のシーケンシャルアプローチよりも平均2.14タイム,最先端のGPUベースのアプローチよりも5.56タイムのスピードアップを実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:30:30 GMT)
A Source of Deterministic Entanglement for Matter-Wave Networks [3.5]
本稿では,Feshbach分子の解離制御による超低温中性原子の絡み合った対を生成するプロトコルについて述べる。提案アーキテクチャは、自然に原子線回路やチップベースの物質波光学と統合される。この方式は、ビームスプリッター、位相シフター、干渉計、トンネル接合、局所検出器の物質波光ネットワークに接続されたアレイ内の数百の平行絡み源にスケールすることができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:18:11 GMT)
VeriFlow: Modeling Distributions for Neural Network Verification [3.5]
フォーマル検証は、ニューラルネットワークの安全性と信頼性を保証するための有望な方法として登場した。本稿では,検証手法が関心のあるデータ分布に限定できるように,フローベース密度モデルとしてVeriFlowアーキテクチャを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:57:18 GMT)
SpotEdit: Evaluating Visually-Guided Image Editing Methods [3.5]
SpotEditは、視覚的に誘導された画像編集方法を評価するために設計された包括的なベンチマークである。我々のベンチマークには幻覚の専用コンポーネントが含まれており、GPT-4oのような主要なモデルが視覚的キューの存在を幻覚し、誤って編集タスクを実行するかを強調している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:05:06 GMT)
Efficiency Boost in Decentralized Optimization: Reimagining Neighborhood Aggregation with Minimal Overhead [3.5]
マルチエージェントネットワークにおける情報集約のための新しいフレームワークであるDYNAWEIGHTを紹介する。 DYNAWEIGHTは、ローカルデータセットに対する相対的な損失に基づいて、近隣のサーバに動的に重みを割り当てる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:34:06 GMT)
No-Reference Image Contrast Assessment with Customized EfficientNet-B0 [3.5]
NR IQAモデルでは,様々な実環境下でのコントラスト歪みの精度評価に苦慮した基準画像品質評価は行われなかった。本研究では,ブラインドコントラスト品質評価のためのディープラーニングに基づくフレームワークを提案する。モデルはコントラスト対応レグレッションヘッドと、ターゲットデータ拡張を使用してトレーニングされたエンドツーエンドで修正される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:54:37 GMT)
Context Parametrization with Compositional Adapters [3.4]
CompAsは、コンテキストをコンポジション構造を持つアダプタパラメータに変換するメタ学習フレームワークである。我々の研究は、大規模言語モデルのスケーリングのための実用的で効率的な代替手段として、構成可能なアダプタ生成を確立している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:16:28 GMT)
Labeling Free-text Data using Language Model Ensembles [3.3]
本稿では,プライバシ制約下での自由テキストデータにおける所定のトピックのラベル付けを強化する枠組みを提案する。我々は,摂食障害関連フォーラムから公開されているRedditデータと摂食障害患者の自由テキスト応答を用いて,アンサンブルアプローチを評価した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:57:27 GMT)
Small Dents, Big Impact: A Dataset and Deep Learning Approach for Vehicle Dent Detection [3.3]
本稿では、YOLOv8オブジェクト認識フレームワークを用いて、顕微鏡表面欠陥を検出するためのディープラーニングベースのソリューションを提供する。この技術は検出精度に優れ、推論レイテンシも低く、リアルタイムアプリケーションに適している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:47:11 GMT)
Mitigating Exponential Mixed Frequency Growth through Frequency Selection [3.2]
アングル符号化は、古典的なデータを量子モデルに埋め込む機能マップ(FM)として人気がある。すべての関連する周波数が理論上アクセス可能である場合でも、トレーニングの失敗は起こり得ることを示す。パラメータ要求を減らすための実用的なソリューションとして周波数選択を導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:22:07 GMT)
Toward a Theory of Generalizability in LLM Mechanistic Interpretability Research [3.1]
機械的主張が一般化する5つの対応軸を提案する。 Pythiaモデルのランダムシードの事前学習における「ワンバックアテンションヘッド」の分析を行った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:38:16 GMT)
Eliminating Exponential Key Growth in PRG-Based Distributed Point Functions [3.1]
PRGベースのマルチパーティDPFは、パーティ数やフィールドサイズと指数関数的に増加するキーサイズのため、実用性に苦慮している。我々の研究は、ボイルらによるPRGベースの多人数DPF方式を最適化することで、このボトルネックに対処する。提案手法は,実用的な鍵サイズを持つ初のPRGベースのマルチパーティDPF方式であり,最もよく知られているマルチパーティDPFよりも最大3倍小さい鍵を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:57:24 GMT)
Partially Functional Dynamic Backdoor Diffusion-based Causal Model [2.9]
部分機能的動的バックドア拡散に基づく因果モデル(PFD-BDCM)を導入する。 PFD-BDCMは、有効なバックドア調整を拡散サンプリング機構に組み込んで、測定されていない共同設立者からのバイアスを軽減する。実測値の誤差設定による理論的保証を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:29:20 GMT)
Zero-Effort Image-to-Music Generation: An Interpretable RAG-based VLM Approach [2.9]
本稿では,視覚言語モデル(VLM)に基づく画像音楽(I2M)フレームワークを提案する。具体的には、ABC表記を用いてテキストと音楽のモダリティをブリッジし、VLMが自然言語を使って音楽を生成する。次に,マルチモーダル検索・拡張生成(RAG)と自己精製技術を適用し,VLMが外部トレーニングなしで高品質な楽曲を制作できるようにする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:07:29 GMT)
RMT-KD: Random Matrix Theoretic Causal Knowledge Distillation [2.9]
BERTやResNetといった大規模なディープラーニングモデルは最先端のパフォーマンスを実現するが、エッジでのデプロイにはコストがかかる。本稿では,Random Matrix Theory (RMT) を用いて知識蒸留を行い,ネットワークサイズを反復的に削減する手法であるRTT-KDを提案する。 GLUE、AG News、CIFAR-10では、RTT-KDは最大80%のパラメータ還元を実現し、2%の精度の損失しか得られず、2.8倍の高速な推論とほぼ半分の消費電力を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:34:41 GMT)
Physically Plausible Multi-System Trajectory Generation and Symmetry Discovery [2.9]
我々は複数のシステムのダイナミクスを捉えるためにSPS-GAN(Symphlectic Phase Space GAN)を導入する。 SPS-GANはシステム構成空間の事前の知識を必要としない。提案手法は,複数のシステムを捕捉し,単一システム用に設計された教師付きモデルと同等の性能を実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:46:55 GMT)
Federated Learning of Quantile Inference under Local Differential Privacy [2.8]
局所微分プライバシー(LDP)下での量子推論の学習について検討する。本稿では,局所勾配勾配(SGD)に基づく推定器を提案する。我々は、推定器の正規性と機能中心極限定理を確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:56:39 GMT)
Ultralow-Temperature Cryogenic Transmission Electron Microscopy Using a New Helium Flow Cryostat Stage [2.8]
CondenZeroの低温冷却システムは、超低温でのイメージングと分光のために設計されている。このシステムは、振動減衰ステージに装着された外装デワーと、加圧低ノイズヘリウム輸送線とを含む。 7K未満の信頼性の高い低温操作を提供し、量子材料中の電子および磁気相変換を直接可視化するための低ドリフト経路を確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:09:55 GMT)
Exploiting the Asymmetric Uncertainty Structure of Pre-trained VLMs on the Unit Hypersphere [2.8]
本稿では,単位超球面上で事前学習された視覚言語モデルから確率的埋め込みを構築することを提案し,不確実な定量化を実現する。確立されたベンチマークに対する確率的埋め込みの有効性を検証し,テキストおよび視覚データの不確実性構造における非対称性の性質を示す包括的アブレーション研究を行った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:06:47 GMT)
GPT-4 for Occlusion Order Recovery [2.8]
本稿では,事前学習したGPT-4モデルの高度な性能を利用して注文を推定する手法を提案する。入力画像と共に特別に設計されたプロンプトを提供することで、GPT-4は画像を分析し、順序予測を生成することができる。その結果,意味的文脈,視覚的パターン,常識的知識を用いることで,モデルがより正確な順序予測を生成できることが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:11:39 GMT)
Evaluating Open-Source Large Language Models for Technical Telecom Question Answering [2.8]
本稿では,2つのオープンソースのLarge Language Model,Gemma 3 27BとDeepSeek R1 32Bを,実例と推論に基づく質問に対して評価する。我々は105組の質問応答対のベンチマークを構築し、語彙メトリクス、意味的類似性、LLM-as-a-judgeスコアを用いて性能を評価する。その結果,Gemma は意味的忠実度と LLM 評価の正確性に優れており,DeepSeek では語彙整合性がわずかに高いことが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:29:15 GMT)
A Systematic Review: Affective Perception on Urban Facades [2.8]
建築ファサードは、都市環境における感情的な知覚を批判的に形成する。建築環境に対する情緒的な反応への関心が高まりつつあるにもかかわらず、都市建築ファサードの情緒的な影響はいまだに未理論のままである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:18:02 GMT)
AntiFLipper: A Secure and Efficient Defense Against Label-Flipping Attacks in Federated Learning [2.7]
フェデレートラーニング(FL)は、データを分散化してプライバシ保護モデルトレーニングを可能にする。悪意のあるクライアントがラベルを操作してグローバルモデルに悪影響を及ぼすような、ラベルフリップ攻撃には依然として脆弱だ。 FLにおけるマルチクラスラベルフリップ攻撃に対する,新規かつ計算効率のよい防御手法であるAntiFLipperを紹介した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:36:52 GMT)
Slicing Wasserstein Over Wasserstein Via Functional Optimal Transport [2.6]
ワッサーシュタイン距離は任意の距離空間上の確率測度の間の距離を定義する。既存のWoW加速器はパラメトリックなメタ測定や高次モーメントの存在に依存している。 DSWの最小化はWoWの最小化と同等であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:59:14 GMT)
Hole spin splitting in a Ge quantum dot with finite barriers [2.6]
平面Ge量子ドット(QD)に閉じ込められた単一ホールの低エネルギースペクトルについて検討する。 QDは[001]方向に沿って成長した有限電位高さの2つのGeSi障壁の間に挟まれている。トップゲート電界および残留張力ひずみがクビット状態に与える影響について検討した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:14:24 GMT)
Opening Knowledge Gaps Drives Scientific Progress [2.6]
ギャップを開く論文は、最もよく引用される作品の1つにランクインする傾向にある。開き目のない新しい組み合わせを導入する論文は、引用数のトップ1%にランク付けされがちである。本研究は, ギャップ開き論文がより破壊的であり, 科学的探究のための新たな方向を刺激する上で, それらの生成的役割を強調していることを示唆する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:33:10 GMT)
ArFake: A Multi-Dialect Benchmark and Baselines for Arabic Spoof-Speech Detection [2.6]
アラビア語スプーフ音声データセットを初めて紹介する。以上の結果から,FishSpeechはカサブランカコーパスのアラビア語音声クローニングにおいて,他のTSモデルよりも優れていた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:11:20 GMT)
SpinGPT: A Large-Language-Model Approach to Playing Poker Correctly [2.6]
我々は、人気のある3人プレイのオンラインポーカーフォーマットであるSpin & Goに合わせた、最初のLarge Language ModelsであるSpinGPTを紹介する。以上の結果から,SpinGPTは解答者の行動に78%の精度で一致していることがわかった。これらの結果は、LLMがポーカーのようなマルチプレイヤー不完全な情報ゲームに対処する新しい方法になり得ることを示唆している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:15:44 GMT)
Ground-Truthing AI Energy Consumption: Validating CodeCarbon Against External Measurements [2.5]
本研究では静的および動的エネルギー推定手法の信頼性を系統的に評価する。確立された推定手法は、一貫して最大40%の誤差を発生させる。この研究は透明性を確立し、持続可能なAI開発に広く利用されているツールを検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:12:21 GMT)
Generalization Analysis for Classification on Korobov Space [2.5]
凸$eta$-normの損失関数に従って,過度な誤分類誤差の学習率を導出する。我々は、浅いReLUニューラルネットワークにより、コロボフ空間$X2, p([-1,1]d)$, $1leq p leq infty$から関数の近似の$L_p$のレートを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:56:45 GMT)
Excavating in the Wild: The GOOSE-Ex Dataset for Semantic Segmentation [2.4]
本研究では,異なる環境から5000個のラベル付きマルチモーダルフレームを含むGOOSE-Exデータセットをオープンソースとして公開する。本研究では,異なるプラットフォーム上でのセマンティックセグメンテーション性能と,目に見えない環境におけるセンサモードの総合的な解析を行う。組み合わせたデータセットが、さまざまなダウンストリームアプリケーションやコンペにどのように使用できるかを実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:03:00 GMT)
The Express Lane to Spam and Centralization: An Empirical Analysis of Arbitrum's Timeboost [2.4]
われわれはTimeboostの大規模な実証的研究を行った。 Timeboostはオークションベースのトランザクションシーケンシング機構で、急行車線への短期的な優先アクセスを可能にする。 Timeboostは、公正性、分散化、スパム削減という目標を達成できないことがわかりました。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:02:15 GMT)
Numerion: A Multi-Hypercomplex Model for Time Series Forecasting [2.4]
複数の超複素空間に基づく時系列予測モデルであるNumerionを提案する。我々の研究は、複素領域と高次超複素空間において、時系列の特徴周波数が自然に減少することを明らかにする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:53:48 GMT)
Dynamic Buffers: Cost-Efficient Planning for Tabletop Rearrangement with Stacking [2.4]
乱雑なテーブルトップ環境でオブジェクトを配置することは、ロボット工学における長年の課題である。これらの問題を解決するために、Dynamic Bufferと呼ばれる新しいプランニングプリミティブが導入されている。人間のグループ化戦略にインスパイアされたロボットは、一時的に移動可能なスタックを形成し、ユニットとして輸送することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:36:40 GMT)
Mixture of Detectors: A Compact View of Machine-Generated Text Detection [2.4]
本稿では,文書レベルのバイナリやマルチクラス分類,ジェネレータ属性など,複数のシナリオにわたる機械生成テキストの検出に対処する。 BMAS Englishと呼ばれる新しい研究は、人文と機械文のバイナリ分類のための英語データセット、マルチクラス分類のための、そして検出の緩和のための共通の行為であるアドリアックアタックアタックアタック(Adrial attack addressing)である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:05:22 GMT)
Average relative entropy of random states [2.4]
相対エントロピーは量子情報理論における概念として機能する。 Hilbert-Schmidt および Bures-Hall アンサンブルの主要な一般状態モデルからランダム状態の相対エントロピーを研究する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:15:07 GMT)
Adversarial training with restricted data manipulation [2.4]
悲観的二水準最適化は、敵に対するレジリエントな分類器を訓練する効果的な方法であることが示されている。制約付き悲観的二段階最適化モデルを提案する。実験を通じて、このモデルが既存のアプローチよりも平均して優れていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:17:57 GMT)
AutoPK: Leveraging LLMs and a Hybrid Similarity Metric for Advanced Retrieval of Pharmacokinetic Data from Complex Tables and Documents [2.3]
AutoPKは、複雑な科学表からPK(Pharmacokinetics)データを正確かつスケーラブルに抽出するための新しいフレームワークである。キャプションやフットノートを含む605 PKテーブルの実際のデータセットで評価した。 AutoPKは、スケーラブルで高信頼なPKデータ抽出を可能にし、獣医学、薬物安全性監視、公衆衛生決定における重要な応用に適している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:05:32 GMT)
When Speculation Spills Secrets: Side Channels via Speculative Decoding In LLMs [2.3]
そこで本研究では,不正な推測と正しい推測の入力依存パターンを,フィルタ単位のトークン数やパケットサイズをモニタすることによって推定できる,新たなサイドチャネルを明らかにする。これらのパターンを観察する敵は、4つの投機的デコードスキームで90%の精度でユーザクエリをフィンガープリントすることができる。パケットパディングや繰り返しトークンアグリゲーションなど,一連の軽減策を提案し,評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:28:00 GMT)
Quantum simulation approach to ultra-weak magnetic anisotropy in a frustrated spin-1/2 antiferromagnet [2.3]
磁気結晶異方性(MCA)は、実磁石の重要な特徴である。我々はCuSb2O6におけるMCAの量子シミュレーションフレームワークを開発した。本研究は, 実材料における複雑な磁性現象の, 資源効率のよい量子シミュレーションの実現可能性を示すものである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:59:43 GMT)
ADAM: A Diverse Archive of Mankind for Evaluating and Enhancing LLMs in Biographical Reasoning [2.3]
文献的推論におけるマルチモーダル大言語モデル(MLLM)の評価と改善のためのフレームワークであるADAMを紹介する。 AdamDBは、地理、時間、職業にわたって400万人以上の個人をカバーする多言語およびマルチモーダルのデータセットである。アダムベンチはブルームの分類に基づいて認知的に構造化された評価を提供しており、英語と母語の両方で6つの推論レベルにまたがっている。 AdamRAG(アダムラグ)は、生物学的文脈に合わせた検索拡張生成システムである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:04:28 GMT)
CryptoSRAM: Enabling High-Throughput Cryptography on MCUs via In-SRAM Computing [2.2]
CryptoSRAMは、MCUの標準配列内で直接操作を行う暗号アーキテクチャである。メモリアレイを非常に並列な処理ファブリックに再利用することで、CryptoSRAMはデータ移動のボトルネックを取り除く。一般的な暗号カーネルでは、CryptoSRAMは最大74$times$と67$times$のスループット向上を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:36:45 GMT)
Conversational Implicatures: Modelling Relevance Theory Probabilistically [2.2]
確率論の最近の進歩は、プラグマティクスとセマンティクスの「確率論的転回」につながった。本稿では、類似したベイズ的アプローチが、関連理論のプラグマティクスにどのように適用できるかを考察する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:50:49 GMT)
Self-driving cars: Are we there yet? [2.2]
CARLAのリーダーボードv2.0とnuPlanとOpenデータセットに特徴付けられる動作計画手法の比較分析を行った。我々は、一般的な傾向、共通の課題を特定し、運動計画研究を進めるための潜在的方向性を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:13:50 GMT)
OnPrem.LLM: A Privacy-Conscious Document Intelligence Toolkit [2.1]
我々は,大規模言語モデル(LLM)を機密性の高い非公開データに適用するためのPythonベースのツールキットであるOnPrem$.$LLMを提案する。このシステムはプライバシ保護のユースケース用に設計されており、ドキュメント処理とストレージのためのプレビルドパイプラインを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:32:04 GMT)
Towards a Physics Foundation Model [2.1]
シミュレーションデータの1.8TBをトレーニングした一般物理変換器(GPhyT)について述べる。 GPhyTは複数の物理領域にまたがる優れた性能を実現し、特殊アーキテクチャを最大29倍の性能で上回る。単一のモデルがデータだけで一般的な物理原理を学習できることを確立することで、この研究は普遍的な物理基礎モデルへの道を開く。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:59:55 GMT)
ArabJobs: A Multinational Corpus of Arabic Job Ads [2.1]
ArabJobsは、エジプト、ヨルダン、サウジアラビア、アラブ首長国連邦から集められたアラビア語の求人広告のコーパスである。このデータセットはアラブの労働市場における言語、地域、社会経済の変動を捉えている。本稿では、性別の表現と職業構造の分析を行い、広告間の弁証的変動を強調した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:06:07 GMT)
Hallucination to Truth: A Review of Fact-Checking and Factuality Evaluation in Large Language Models [2.1]
大規模言語モデル(LLM)は、不正確なコンテンツや誤解を招くコンテンツを含む多種多様なインターネットコーパスで訓練されている。本総説では,LLM生成したコンテンツが現実の精度でどのように評価されるかを系統的に分析する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:54:51 GMT)
Data-Driven Temperature Modelling of Machine Tools by Neural Networks: A Benchmark [2.1]
我々は,NNが機械工具内の高忠実度温度と熱流束場を予測するために訓練される新しいパラダイムを導入する。提案したフレームワークは、モジュール式でスワップ可能な下流コンポーネントを使用して、幅広いエラータイプの計算と修正を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:43:08 GMT)
Bridging Technical Capability and User Accessibility: Off-grid Civilian Emergency Communication [2.1]
本稿では,低消費電力長距離ネットワークと危機対応スマートフォンアプリケーションを組み合わせた統合緊急通信システムを提案する。システムは通信性能とアプリケーション機能という2つの次元で評価される。並行して、ピアツーピアメッセージング、アイデンティティ検証、コミュニティモデレーションを備えたモバイルアプリケーションを開発した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:44:23 GMT)
Seeing Isn't Believing: Context-Aware Adversarial Patch Synthesis via Conditional GAN [2.0]
完全制御可能な敵パッチ生成のための新しいフレームワークを提案する。攻撃者は、入力画像xとターゲットクラスyターゲットの両方を自由に選択でき、したがって正確な誤分類結果を決定する。提案手法は,生成的U-Net設計とGrad-CAM誘導パッチ配置を組み合わせることで,セマンティック・アウェア・ローカライゼーションを実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:39:21 GMT)
Boundary on the Table: Efficient Black-Box Decision-Based Attacks for Structured Data [2.0]
構造化データの敵対的ロバスト性は、視覚や言語ドメインと比較して未探索のフロンティアのままである。本手法は、勾配のない方向推定と反復境界探索を組み合わせ、離散的かつ連続的な特徴空間の効率的なナビゲーションを可能にする。実験により,本手法は多種多様なモデルでテストセットのほぼ全域を損なうことができた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:00:11 GMT)
Sycophancy Is Not One Thing: Causal Separation of Sycophantic Behaviors in LLMs [2.0]
我々は、真の合意とは対照的に、空想的合意と空想的賞賛を分解する。結果は、サイコファンティックな行動は、独立して選択可能な表現と一致していることを示唆している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:15:36 GMT)
The Bias is in the Details: An Assessment of Cognitive Bias in LLMs [2.0]
大規模言語モデル(LLM)は、現実の意思決定プロセスにますます組み込まれています。本稿では,45LLMにおける8つの認知バイアスの大規模評価について述べる。モデルサイズと迅速な特異性の両方がバイアス感受性に重要な役割を果たすことがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:09:42 GMT)
Role-Aware Multi-modal federated learning system for detecting phishing webpages [1.9]
本稿では,URL,HTML,画像入力をサポートするマルチモーダルフィッシングサイト検出器を提案する。提案手法は,FedProx上の役割認識バケットアグリゲーションであり,Mixture-of-ExpertsとFedMMにインスパイアされたものである。その結果,バケットアグリゲーションとハードゲートの専門家は,厳密なプライバシーの下で安定したフェデレーショントレーニングを可能にすることがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:02:20 GMT)
DexBench: Benchmarking LLMs for Personalized Decision Making in Diabetes Management [1.8]
DexBenchは,大規模言語モデル(LLM)の性能を実世界の意思決定タスクで評価するための最初のベンチマークである。我々のベンチマークは7つの異なるタスクカテゴリを含んでおり、糖尿病患者が質問する現実世界の質問の幅を反映している。このベンチマークを確立することで、糖尿病治療におけるAIソリューションの信頼性、安全性、有効性、実用性を向上することを目指している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:08:30 GMT)
LFA-Net: A Lightweight Network with LiteFusion Attention for Retinal Vessel Segmentation [1.8]
新たに設計された注目モジュールLiteFusion-Attentionを組み込んだ新しい血管分割ネットワークLFA-Netを提案する。 LFA-Netは、0.11百万のパラメータ、0.42MBのメモリサイズ、および4.46GFLOPのハイパフォーマンスを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:07:05 GMT)
Log2Plan: An Adaptive GUI Automation Framework Integrated with Task Mining Approach [1.8]
既存のVLMベースのプランナー・エグゼクタエージェントは、不安定な一般化、高いレイテンシ、限られた長距離コヒーレンスに悩まされている。 Log2Planは、構造化された2段階の計画フレームワークと、ユーザの振る舞いログに対するタスクマイニングアプローチを組み合わせることで、これらの制限に対処する。実世界のタスク200件についてLog2Planを評価し,タスク成功率と実行時間を大幅に改善した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:56:44 GMT)
Mixtures Closest to a Given Measure: A Semidefinite Programming Approach [1.8]
対象測度を有限個のモーメントでしか利用できない問題について検討する。既存の多くのアプローチとは異なり、パラメータ集合は有限ではないと仮定される。クラスタリングには,スタンドアローンのメソッドとして,あるいは前処理のステップとして,フレームワークが機能するアプリケーションを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:51:21 GMT)
Modelling Analogies and Analogical Reasoning: Connecting Cognitive Science Theory and NLP Research [1.8]
アナロジカル推論は人間の認知の重要な側面である。これらの概念がNLP研究におけるいくつかの大きな課題にどのように関係しているかを示す。これによって研究者は、エンティティレベルの類似性に大きく依存するのではなく、テキストのリレーショナル理解をより良く最適化することが可能になる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:52:31 GMT)
A Notion of Uniqueness for the Adversarial Bayes Classifier [1.8]
本稿では,二項分類の設定において,逆ベイズ分類器に対して一意性という新たな概念を提案する。摂動半径が増加するにつれて、逆ベイズ分類器の正則性の概念が向上することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:44:38 GMT)
Thinking in Many Modes: How Composite Reasoning Elevates Large Language Model Performance with Limited Data [1.7]
複合推論(CR)は、大規模言語モデル(LLM)を活用して複数の推論スタイルを探索し組み合わせる新しい推論手法である。科学的および医学的な質問応答ベンチマークで評価する。その結果, LLMは内部推論スタイルの多様性を育むことで, より堅牢で適応的で効率的な問題解決能力を得ることができた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:38:03 GMT)
Label-Guided Imputation via Forest-Based Proximities for Improved Time Series Classification [1.7]
時系列分類の文脈でデータ計算を欠くためのフレームワークを提供する。ラベルに条件付きで不足した値を出力する手段を定義する。この手法を用いて計算を行うことで,分類精度の向上につながる情報をよりリッチに提供できることが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:47:00 GMT)
Analysis of Variational Autoencoders [1.7]
スパースオートエンコーダ(SAE)は、ニューラルネットワーク表現を解釈するための有望なアプローチとして登場した。 SAEアーキテクチャに変分手法を組み込むことで,特徴構造や解釈可能性が改善されるかどうかを検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:09:56 GMT)
(Sometimes) Less is More: Mitigating the Complexity of Rule-based Representation for Interpretable Classification [1.7]
ディープニューラルネットワークはAIの実践的な応用に広く利用されているが、その内部構造と複雑さにより、一般的には容易に解釈できない。本研究では、論理に基づくニューラルネットワークであるMLLP(Multi-layer Logical Perceptron)に$L_0$正規化の微分可能な近似を適用し、その離散解釈可能なバージョンである概念ルールセット(CRS)の複雑さを低減する効果を研究する。結果は、ネットワーク重みのランダム二元化のような代替手法と比較され、ノイズの少ない手法を用いて、より良い結果が得られるかどうかが決定される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:13:08 GMT)
Activation Function Design Sustains Plasticity in Continual Learning [1.6]
継続的な学習では、モデルは適応する能力を失う可能性がある。可塑性損失を軽減するため, アクティベーション選択はアーキテクチャに依存しない主要なレバーであることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:41:47 GMT)
Understanding SOAP from the Perspective of Gradient Whitening [1.6]
我々は勾配の白化の観点からAdam、Shampoo、SOAPを分析します。 Kronecker の製品仮定の下で,SOAP と Shampoo の理想的なバージョン間の理論的等価性を確立する。以上の結果から,SOAP は Shampoo と同様の収束率を示し,最終的な損失において Adam と Shampoo の双方に対して有意な優位性は得られなかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:13:02 GMT)
BPINN-EM-Post: Bayesian Physics-Informed Neural Network based Stochastic Electromigration Damage Analysis in the Post-void Phase [1.6]
本稿では,BPINN-EM-PostSpiceと呼ばれる機械学習に基づく新しいフレームワークを提案する。 BPINN-EM-PostSpiceはモンテカルロシミュレーションと比較して240倍以上,67倍以上の高速化を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:13:59 GMT)
A Framework for Scalable Heterogeneous Multi-Agent Adversarial Reinforcement Learning in IsaacLab [1.6]
マルチエージェント強化学習(MARL)は、動的環境下で協調するロボットシステムの中心である。我々はIsaacLabフレームワークを拡張し、高忠実度物理シミュレーションにおける敵ポリシーのスケーラブルなトレーニングを支援する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:16:48 GMT)
Effectively Leveraging Momentum Terms in Stochastic Line Search Frameworks for Fast Optimization of Finite-Sum Problems [1.6]
深度最適化のための最近の線探索手法と運動量方向の関係について検討する。本稿では,モーメントパラメータの定義と行探索にデータ持続性,永続型ルールを併用したアルゴリズムフレームワークを提案する。結果のアルゴリズムは、適切な仮定の下でコンバージェンスを確実に保持する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:14:23 GMT)
Coarse-grained Bootstrap of Quantum Many-body Systems [1.5]
本稿では,量子多体システムの研究のために,粗粒化法とブートストラップ法を組み合わせた新しい計算手法を提案する。この方法は、無限量子スピン鎖の任意の局所可観測体の零および有限温度期待値の厳密な上と下の境界を効率的に計算する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:15:26 GMT)
Machine Learning and AI Applied to fNIRS Data Reveals Novel Brain Activity Biomarkers in Stable Subclinical Multiple Sclerosis [1.5]
多発性硬化症(MS)の患者は,手指伸展障害と認知疲労を訴える。機能近赤外分光法(FNIRS)は、脳の血行動態を測定する非侵襲的な神経イメージング技術である。認知疲労の主観的報告を記述できる脳活動バイオマーカーの発見を目的とした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:16:17 GMT)
Reparameterizing 4DVAR with neural fields [1.5]
本稿では,ニューラルネットワークによってパラメータ化された連続関数として全状態を表現したニューラルネットワークに基づく実装を提案する。コルモゴロフ強制による2次元非圧縮性ナビエ-ストークス方程式の評価を行った。多くの機械学習ベースのアプローチとは異なり、我々のフレームワークは地平線状態や再解析データへのアクセスを必要としない。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:30:33 GMT)
EfficientDepth: A Fast and Detail-Preserving Monocular Depth Estimation Model [1.5]
我々は、トランスフォーマーアーキテクチャと軽量畳み込みデコーダを組み合わせた、EfficientDepthと呼ばれる新しいMDEシステムを導入する。我々は,ハイパフォーマンスなMDE法を用いて,ラベル付き合成画像と実画像と,擬似ラベル付き実画像の組み合わせでモデルを訓練する。一般的に使用される目的に加えて,LPIPSに基づく損失関数を導入し,ネットワークが詳細な深度マップを作成することを奨励する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:05:43 GMT)
Text-Independent Speaker Identification Using Audio Looping With Margin Based Loss Functions [1.5]
畳み込みニューラルネットワークアーキテクチャを用いたテキスト独立話者識別におけるCosFace LossとArcFace Lossの有効性を検討した。モデル精度とロバスト性への影響を解析するために,両損失関数を実装する。実験の結果,従来のSoftmax損失法と比較して同定精度が優れていた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:40:32 GMT)
Developing Strategies to Increase Capacity in AI Education [1.4]
Computing Research Associationは、AI教育を改善する202人のエキスパートの仮想ラウンドテーブルディスカッションを32回実施した。私たちは、AI教育の能力を高めるために、以下のハイレベルなコミュニティの必要性を特定しました。この調査を通じて、参加者が言及したリソースのリストを編集し、整理しました。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:23:11 GMT)
Multi-Channel Differential Transformer for Cross-Domain Sleep Stage Classification with Heterogeneous EEG and EOG [1.4]
異種脳波-EOG表現学習のための多チャンネル差動変換フレームワークであるSleepDIFFormerを提案する。 SleepDIFFormerは複数のスリープステージデータセットでトレーニングされており、それぞれがソースドメインとして扱われる。提案手法は,空間的および時間的注意雑音を緩和し,データセット間の特徴分布アライメントを通じて,領域不変なEEG-EOG表現を学習することにより,新しい領域への一般化を促進する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:39:36 GMT)
Solving Currency Arbitrage Problems using D-Wave Advantage2 Quantum Annealer [1.4]
本稿では,量子アニーリングをCA最適化問題に適用する方法について検討する。この研究の重要な貢献は、QUBO (Quadratic Unconstrained Boolean Optimization) 問題としてCA問題のオリジナルの定式化である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:07:02 GMT)
Variational Autoencoders-based Detection of Extremes in Plant Productivity in an Earth System Model [1.4]
本研究は, 総生産生産性の極端事象を同定するために, 変分オートエンコーダ(VAE)の新たな応用法を提案する。 VAEを用いた異常検出法と従来の特異スペクトル分析法(SSA)法(1850-80,1950-80,2050-80)を比較した。その結果, 極端事象周波数の空間パターンにおいて, VAE法とSSA法との間に強い地域的一致が認められた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:03:20 GMT)
Question-Driven Analysis and Synthesis: Building Interpretable Thematic Trees with LLMs for Text Clustering and Controllable Generation [1.4]
二分木を対話的に構築するための再帰的テーマ分割(RTP)を導入する。ツリーの各ノードは、データを意味的に分割する自然言語の質問であり、完全に解釈可能な分類である。 RTPの質問駆動階層はBERTopicのような強力なベースラインからのキーワードベースのトピックよりも解釈可能であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:27:22 GMT)
Memory Self-Regeneration: Uncovering Hidden Knowledge in Unlearned Models [1.4]
モデルが知識を忘れ、思い出す能力について考察する。本稿では,失った知識の効果的な回復を支援するための再生的アプローチとして,MemoRa戦略を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:11:01 GMT)
Scaling Laws for Neural Material Models [1.3]
優れた電池、半導体、医療機器を設計するには、材料特性の予測が不可欠である。深層学習は、科学者がエネルギー、力、ストレスを予測することによって、有望な物質を素早く見つけるのに役立つ。私たちのチームは、トレーニングデータのスケーリング(学習すべきより多くの情報を提供するモデル)、モデルサイズ(パターンを学ぶための能力を与えるモデル)、ニューラルネットワークの計算が、物質的特性予測のパフォーマンスにどのように影響するかを分析します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:14:46 GMT)
Two times or none? [1.3]
量子力学における空間と等価な足場上の時間を扱うための2時間のアプローチ。我々は、時間のないフレームワークと2時間のアプローチの間に微妙な選択があることを示します。時間のない哲学を2時間量子力学と組み合わせることのできる枠組みをスケッチする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:28:25 GMT)
Integrating Background Knowledge in Medical Semantic Segmentation with Logic Tensor Networks [1.3]
本稿では,一階述語論理(FOL)ルールを用いて医学的背景知識を符号化するための論理ネットワーク(LTN)を提案する。脳MRIで海馬のセグメンテーションの課題について検討した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:26:26 GMT)
Bridging Language Models and Formal Methods for Intent-Driven Optical Network Design [1.3]
Intent-Based Networking (IBN)は、ユーザが高レベルな目標を指定できるようにすることで、ネットワーク管理を簡単にすることを目的としている。非公式な自然言語の意図を、正式に正しい光ネットワークトポロジに変換することは、依然として困難である。本稿では,Large Language Models(LLMs)に基づくインテント解析,形式的手法,光検索拡張生成(RAG)を統合した新しいハイブリッドパイプラインを提案する。このアプローチは、ミッションクリティカルなネットワークタスクに不可欠な信頼性と正確性を保証することで、ITNを著しく向上させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:38:53 GMT)
Generating quantum non-local entanglement with mechanical rotations [1.3]
本稿では,フォトニック干渉計の機械的回転によって引き起こされる機構により,絡み合った状態を実現することができるサニャック型干渉計を提案する。その結果、ベル=クライザー=ホルン=シモニー=ホルトの不等式はツィレルソン境界まで破られ、強い量子非局所性を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:34:35 GMT)
Optimizing the non-Clifford-count in unitary synthesis using Reinforcement Learning [1.2]
本稿では、量子回路の合成に強化学習(RL)を用いる可能性について検討する。 2つの量子ビット上でのクリフォード+T合成の結果は、最大100個のTゲートに対して最適に分解できる。我々のRLアルゴリズムは、1 qubitユニタリのT数最適分解のための既知最適線形複雑性アルゴリズムを復元することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:10:02 GMT)
Learning to Price Bundles: A GCN Approach for Mixed Bundling [1.2]
バンドル価格問題におけるグラフ畳み込みネットワーク(GCN)の利用について検討する。トレーニングされたGCNに基づいて、高品質な実現可能なソリューションを導出するための2つの推論戦略を提案する。 5つの製品を持つインスタンスで訓練されたGCNを用いて、我々の手法は計算時間に限り、ほぼ最適な解(97%以下)を一貫して達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:39:00 GMT)
Bayesian Transfer Operators in Reproducing Kernel Hilbert Spaces [1.2]
カーネルベースのクープマンアルゴリズムを用いて,2つの分散問題を緩和する方法を示す。まず、疎結合性:ほとんどのカーネルメソッドはスケーラビリティが良くなく、現実的になるには近似が必要である。計算要求を低減できるだけでなく、センサノイズに対するレジリエンスの向上も示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:31:11 GMT)
Dynamic Context Adaptation for Consistent Role-Playing Agents with Retrieval-Augmented Generations [1.2]
ロールプレイングエージェント(RPAs)のためのトレーニングフリーフレームワークであるAmadeusを提案する。アマデウスフレームワークは、キャラクタの知識を超えた質問に応答しても、ペルソナの一貫性を著しく向上させることができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:28:35 GMT)
Markovian Transformers for Informative Language Modeling [1.2]
CoT(Chain-of-Thought)推論は、しばしば言語モデルの根底にある決定プロセスを忠実に反映しない。推論オートエンコーダとして理解可能なマルコフ言語モデルフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:17:53 GMT)
Automatically Advancing LLM Expertise in Technology Judgment [1.1]
大規模言語モデル(LLM)は、科学、工学、革新のための中核的なツールになりつつある。ますます難しい問題に答えられるという印象的な能力にもかかわらず、LLMが新しい課題に直面する際に真に自分の知識を使うかどうかは不明だ。我々は、2015年以降の1300万のコンピュータサイエンス特許ペアのベンチマークを評価し、密度の高い技術ジャーゴンと戦略的に複雑な書き込みを特徴とする。 LLMはベンチマークに失敗することが多く、セマンティックに類似した特許の識別に苦慮している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:52:41 GMT)
Effect of Model Merging in Domain-Specific Ad-hoc Retrieval [1.1]
モデルマージ(英: Model merging)は、複数のモデルの多様な特性を組み合わせた技法である。我々は、線形アプローチを用いて、ソース検索モデルとドメイン固有(非検索)モデルの重みをマージした。実験結果から,モデルマージにより,より効果的なドメイン固有検索モデルが得られる可能性が示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:54:23 GMT)
The MUG-10 Framework for Preventing Usability Issues in Mobile Application Development [1.0]
本研究の目的は,モバイルアプリケーション開発におけるユーザビリティの問題を回避するための対策を提供することである。本研究は,20人のモバイルソフトウェア設計・開発実践者の調査を通じて,この研究ギャップを埋めることを目的としている。収集した材料を解析することにより,10のガイドラインと3つのアクティビティからなる新しいフレームワークの開発が可能となった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:54:48 GMT)
Human Mobility Datasets Enriched With Contextual and Social Dimensions [1.0]
意味的に富んだ人間の軌道の2つのデータセットと、それらを構築するためのパイプラインを提示する。トラジェクトリはOpenStreetMapから取得した公開GPSトレースである。新しいセマンティックな特徴は、大規模言語モデルによって生成された合成的で現実的なソーシャルメディア投稿を含めることである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:45:27 GMT)
SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models [1.0]
タイポグラフィー攻撃は、マルチモーダル基礎モデルにおけるテキストと視覚コンテンツ間の相互作用を利用する。 SCAMは,これまでで最大かつ多種多様な実世界タイポグラフィー・アタック・イメージのデータセットである。以上の結果から, タイポグラフィーによる攻撃は, 最先端の大規模視線モデルに対して有効であることが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:30:35 GMT)
MakOne: Behavioural Data of University Students' Smart Devices in Uganda [1.0]
本稿では,カンボジアのMakerere大学の72人の学生から6週間にわたって収集された,新しいマルチモーダルデータセットMakOneを紹介する。このデータセットは、受動的スマートフォンセンサーのデータ(位置、身体活動、スクリーン使用量を含む)と、学生の気分や日常のルーチンをキャプチャする生態的瞬間評価(EMA)を統合している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:28:52 GMT)
Localized Uncertainty Quantification in Random Forests via Proximities [1.0]
機械学習では、不確実性定量化はモデルの予測の信頼性を評価するのに役立つ。従来のアプローチでは予測精度が重視されることが多いが、不確実性対策の導入に焦点が当てられている。自然発生試験セットと類似度尺度(確率)をランダム林の副産物と見なす新しいアプローチを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:53:28 GMT)
Sleeping Kelly is a Thirder [1.0]
睡眠の美」問題は、不完全なリコールのある状況における確率の役割を強調している。睡眠美」問題を解決する一つのアプローチは、睡眠美」が彼女の信念に基づいて決定を下すことを可能にすることである。代わりに、ケリー基準を用いて彼女の富の伸び率を最大化することは、スリーピングビューティにとって合理的である、と私は主張する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:26:31 GMT)
Red Teaming Quantum-Resistant Cryptographic Standards: A Penetration Testing Framework Integrating AI and Quantum Security [1.0]
本研究では,量子暗号プロトコルの脆弱性を評価するための構造化アプローチを提案する。 BB84量子鍵分布法とNational Institute of Standards and Technology (NIST)が承認した量子耐性アルゴリズムに焦点を当てている。 AI駆動のレッドチーム、自動テスト、リアルタイム異常検出を統合することで、量子ネットワークにおけるセキュリティリスクを評価し緩和するフレームワークを開発する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:36:59 GMT)
Comprehensive Analysis of VQC for Financial Fraud Detection: A Comparative Study of Quantum Encoding Techniques and Architectural Optimizations [1.0]
本研究は,量子回路解析のための新しい手法を導入し,実用的な量子機械学習実装のための実用的なデプロイメントレコメンデーションを提供する。これらの研究は、量子強化詐欺検知システムの初期ベンチマークを提供し、金融セキュリティアプリケーションにおける量子機械学習の潜在的な利点を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:31:30 GMT)
Modeling Psychological Profiles in Volleyball via Mixed-Type Bayesian Networks [1.0]
潜在Max-Min Hill-Climbing (MMHC) を用いた混合型変数間の有向関係の学習サンプルサイズ,疎度,寸法のシミュレーションでは,MMHCは最近のコプラベース学習者よりも低い構造ハミング距離と高いエッジリコールを実現する。バレーボールに応用すると、学習ネットワークはゴール設定と自己自信に関するメンタルスキルを組織し、感情的な覚醒的リンクと不安を関連づける。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:31:18 GMT)
Brain Tumor Classification from MRI Scans via Transfer Learning and Enhanced Feature Representation [1.0]
磁気共鳴画像(MRI)スキャンによる脳腫瘍検出のための,自動的かつ効率的なディープラーニングフレームワークを提案する。このフレームワークは特徴抽出のために事前訓練されたResNet50モデルを使用し、続いてGlobal Average Pooling (GAP) と線形投影を用いてコンパクトで高レベルな画像表現を得る。もうひとつの大きな貢献は、信頼できる脳腫瘍MRIリソースの欠如に対応するために設計された、Mymensingh Medical College脳腫瘍データセットの作成である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:41:30 GMT)
A Multi-Modality Evaluation of the Reality Gap in Autonomous Driving Systems [1.0]
我々は、Software-in-the-Loop (SiL), Vehicle-in-the-Loop (ViL), Mixed-Reality (MR), full real-world testingの4つの代表的なテストモードを比較した。以上の結果から,SiLとViLのセットアップは実世界のダイナミックスとセンシングの重要な側面を単純化するが,MRテストは安全性や制御を損なうことなく知覚リアリズムを改善することが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:08:53 GMT)
Improving accuracy in short mortality rate series: Exploring Multi-step Forecasting Approaches in Hybrid Systems [1.0]
多段階の予測は公衆衛生、人口計画、保険リスク評価に不可欠である。本研究では,ハイブリッドシステムの精度に及ぼす多段階予測手法の影響について検討した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:22:48 GMT)
Hybrid SU(1,1) interferometry in optomechanics [1.0]
本稿では,1つの「アーム」が2つの連続モード整合相互作用を行うメカニカルモードである光学系におけるハイブリッド実装を提案する。このようなエンジニアリングされた相互作用は、機械的熱ノイズや光学的損失があっても、サブショットノイズの位相検出を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:07:31 GMT)
Anti-Regulatory AI: How "AI Safety" is Leveraged Against Regulatory Oversight [1.0]
AI企業は、プライバシ強化技術、バイアス抑制対策、評価フレームワーク、アライメントテクニックの開発と展開をますます進めている。本稿では,法的な影響のメカニズムとして,これらの技術の内面的機能について考察する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:35:10 GMT)
KurdSTS: The Kurdish Semantic Textual Similarity [1.0]
形式と非公式のレジスタにまたがる1万の文対。我々は、Sentence-BERT、Multilingual BERT、その他の強力なベースラインをベンチマークし、クルド人の形態、正書法の変化、コードミキシングに起因する課題を強調しながら、競争結果を得る。データセットとベースラインは再現可能な評価スイートを確立し、クルド人のセマンティクスと低リソースNLPに関する将来の研究の出発点となる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:55:55 GMT)
Multilingual Vision-Language Models, A Survey [1.0]
本研究では,言語間でテキストや画像を処理する多言語視覚言語モデルについて検討する。エンコーダのみおよび生成アーキテクチャにまたがる31のモデルと21のベンチマークをレビューする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:46:13 GMT)
GEP: A GCG-Based method for extracting personally identifiable information from chatbots built on small language models [1.0]
小型言語モデル(SLM)は、大型言語モデル(LLM)と比較してほぼ同等の性能のため、前例のないほど魅力的になる。しかし、下流タスクのためのSLMの個人識別情報(PII)漏洩は未だ調査されていない。 PII抽出に特化して設計されたgreedy coordinate gradient-based (GCG) 法である GEP を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:02:21 GMT)
Haar-Laplacian for directed graphs [0.9]
本稿では,スペクトル畳み込みネットワークの構築を目的とした新しいラプラシア行列を提案する。重み予測や有向グラフの denoising などの応用において,本手法がよりよい結果をもたらすことを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:55:58 GMT)
Leveraging Wireless Sensor Networks for Real-Time Monitoring and Control of Industrial Environments [0.9]
我々は、強い無線センサネットワーク(WSN)を確立するためのNRFトランシーバに基づくシステムを提案した。温度・湿度・土壌水分・火災検知などの産業設備において重要なパラメータをモニターし,LCD画面に表示する。監視以外にも、オンラインコマンドを通じてDCモータの速度を制御することで、これらのパラメータを遠隔操作する機能も追加された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:07:44 GMT)
Quantum Krylov Subspace Diagonalization via Time Reversal Symmetries [0.9]
我々は、ハミルトン進化における時間反転対称性を活用することでボトルネックを回避する、Krylov Time Reversal (KTR)と呼ばれる新しいプロトコルを導入する。これにより,回路の深さを大幅に低減し,浅い量子アーキテクチャとの整合性を高めることができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:26:34 GMT)
MINT-RVAE: Multi-Cues Intention Prediction of Human-Robot Interaction using Human Pose and Emotion Information from RGB-only Camera Data [0.9]
本稿では,人間のインタラクション意図とフレームレベルの精度を予測する新しいパイプラインを提案する。意図予測における重要な課題は、実世界のHRIデータセットに固有のクラス不均衡である。我々の手法は最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:49:40 GMT)
AEGIS: Authentic Edge Growth In Sparsity for Link Prediction in Edge-Sparse Bipartite Knowledge Graphs [0.9]
AEGISは、既存のトレーニングエッジを再サンプリングする、エッジのみの拡張フレームワークである。テキストリッチGDPグラフでは、セマンティックKNNが最大のAUC改善とBrierスコアの削減を実現している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:51:40 GMT)
Random Unitaries in Constant (Quantum) Time [0.9]
我々は、量子計算のよく研究されたモデルにおいて、ユニタリ設計とPRUを効率的に構築できることを示す。その結果、単体設計とPRUは以前考えられていたよりもはるかに弱い回路モデルで構築可能であることが示された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:37:23 GMT)
Guided Manifold Alignment with Geometry-Regularized Twin Autoencoders [0.8]
本稿では、幾何学規則化された双対オートエンコーダアーキテクチャを利用した案内表現学習フレームワークを提案する。本手法は,学習した埋め込みにおける幾何学的忠実度を維持するために,構造的クロスモーダルマッピングを強制する。この枠組みをアルツハイマー病の診断に応用し、マルチモーダルな患者データを統合する能力を実証した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:41:02 GMT)
Learning KAN-based Implicit Neural Representations for Deformable Image Registration [0.8]
我々はKan-IDIRとRandKAN-IDIRを提案し、Kolmogorov-Arnold Networks(KAN)を暗黙のニューラル表現(INR)で変形可能な画像登録に初めて統合した。提案したランダム化されたベースサンプリング戦略は,登録品質を維持しつつ,kanの必要なベース関数数を削減できる。 Kan-IDIRとRandKAN-IDIRは、すべての評価されたモダリティと解剖において、INRベースの手法の中で最高精度を達成した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:37:46 GMT)
Adaptive Dual-Mode Distillation with Incentive Schemes for Scalable, Heterogeneous Federated Learning on Non-IID Data [0.8]
Federated Learning(FL)は、ユーザプライバシを損なうことなく分散データの使用を可能にする、有望な分散学習(DL)アプローチとして登場した。すべてのクライアントが同じ機械学習モデルをトレーニングできると仮定されるが、ビジネスニーズと計算資源の違いにより、すべてのクライアントがこの仮定を満たすことはできない。統計的不均一性の文脈における効率、プライバシー保護、コミュニケーション効率の学習を容易にするDL-SHと、統計的格差に対処しながら完全に異種モデルを管理するためのDL-MHと、インセンティブに基づくインセンティブベースの拡張であるI-DL-MHを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:48:14 GMT)
Comparative Analysis of GAN and Diffusion for MRI-to-CT translation [0.8]
MRIからCTへの変換によく使われる2つのアーキテクチャの性能を比較した。古典的な3次元翻訳問題を横面上の2次元翻訳列に分割する。また、生成過程の条件付けが1つのMRI画像/スライスおよび複数のMRIスライスに与える影響についても検討した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:33:34 GMT)
The Glider Equation for Asymptotic Lenia [0.8]
Asymptotic Leniaはコンウェイの『ゲーム・オブ・ライフ』の連続的な拡張であり、豊かなパターン形成を示している。グライダー方程式」と呼ばれるグライダーパターンの条件を解析的に導出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:35:16 GMT)
A Global Analysis of Cyber Threats to the Energy Sector: "Currents of Conflict" from a Geopolitical Perspective [0.8]
本稿では, 地政学, サイバー脅威情報分析, 高度な検出技術との交点について検討する。生成人工知能を利用して、生のサイバー脅威記述から情報を抽出し、構造化する。我々は、エネルギー標的攻撃の妥協の指標を検出するためのサイバーセキュリティツールの有効性を評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:45:29 GMT)
Rescuing double robustness: safe estimation under complete misspecification [0.8]
二つの頑健な推定器は、すべてのニュアンス関数が誤って特定されると脆弱に振る舞う可能性がある。適応補正クリッピング(ACC)に基づく解を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:03:18 GMT)
Local unitary decomposition of tripartite arbitrary leveled qudit stabilizer states into $p$-level-qudit EPR and GHZ state [0.8]
任意の局所ユニタリの下で, 3部安定化器状態の絡み合い構造を次元$D$の$N$クォーディットで調べ, パーティ間を分散する$A$, $B$, $C$について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:00:18 GMT)
Hemorica: A Comprehensive CT Scan Dataset for Automated Brain Hemorrhage Classification, Segmentation, and Detection [0.7]
Hemoricaは、2012年から2024年の間に取得された372個の頭部CT検査の公開コレクションである。 ICHサブタイプ(EPH)、サブデューラル(SDH)、サブアラキノイド(SAH)、パーレンキマル(IPH)の5つのサブタイプ(EPH)に対して、各スキャンは徹底的に注釈付けされている。 Hemoricaは、マルチタスクとカリキュラム学習をサポートする統一されたきめ細かいベンチマークを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:09:41 GMT)
Large Language Models versus Classical Machine Learning: Performance in COVID-19 Mortality Prediction Using High-Dimensional Tabular Data [0.7]
本研究では,古典的特徴ベース機械学習モデル(CML)と大規模言語モデル(LLM)のパフォーマンスを比較し,新型コロナウイルス死亡率の予測を行った。 XGBoost と RF は CML において優れた性能を示し,F1 スコアは0.87 と 0.83 であった。 GPT-4はF1スコアが0.43、微調整のMistral-7bは1%から79%に大幅に改善され、外部検証では安定したF1スコアが0.74となった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:00:01 GMT)
CubistMerge: Spatial-Preserving Token Merging For Diverse ViT Backbones [0.7]
ViTのバックボーンは、ウィンドウアテンション、SAMの相対的な位置埋め込み、DINOv3のRoPEといった空間設計を採用している。本稿では,空間的整合性を維持し,空間的アーキテクチャとのシームレスな整合性を実現するための,シンプルで効果的なトークンマージ手法を提案する。提案手法では, (i) 構成されたトークン配置を強制するための2次元削減戦略, (ii) 相対的なトークン位置を維持する空間認識型マージアルゴリズム, (iii) 新規な最大値/次元トークン表現を用いる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:59:29 GMT)
PhishLumos: An Adaptive Multi-Agent System for Proactive Phishing Campaign Mitigation [0.7]
PhishLumosは、アダプティブなマルチエージェントシステムで、攻撃キャンペーン全体を積極的に緩和する。 PhishLumosは、回避によってブロックされる代わりに、基盤となるインフラストラクチャを調査するための重要なシグナルとして扱う。実世界のデータから、サイバーセキュリティの専門家による確認の1週間前、私たちのシステムは中央値のキャンペーンの100%を特定しました。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:21:04 GMT)
Edge modes, extended TQFT, and measurement based quantum computation [0.7]
citeWong:2022mnvでは、1次元における測定に基づく量子計算がゲージ理論の用語で理解できると説明されている。本研究では、この「絡み合いゲージ理論」を拡張位相場理論として定式化する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:20:38 GMT)
Countering adversarial evasion in regression analysis [0.7]
敵の回避は、敵がデータを適応して、確立した予測モデルから特定の結果に影響を与えるシナリオを考える。本稿では,回帰シナリオに対する悲観的二段階最適化プログラムを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:35:26 GMT)
SoDaDE: Solvent Data-Driven Embeddings with Small Transformer Models [0.7]
溶媒データ駆動型埋め込み(SoDaDE)の開発による新しい溶媒表現法を提案する。 SoDaDEは小さなトランスモデルと溶媒特性データセットを使用して、溶媒の指紋を生成する。この論文を通じて、データ駆動型指紋は小さなデータセットで作成でき、他のアプリケーションで探索可能なワークフローをセットアップできることを実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:03:06 GMT)
Meta-Learning Fourier Neural Operators for Hessian Inversion and Enhanced Variational Data Assimilation [0.7]
本稿では,FNO(Fourier Neural Operator)を用いたメタラーニングフレームワークを提案する。線形対流方程式の数値実験により、結果として生じるFNO-CGアプローチにより、平均相対誤差が62%、反復回数が17%減少することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:30:31 GMT)
Outlier Detection in Plantar Pressure: Human-Centered Comparison of Statistical Parametric Mapping and Explainable Machine Learning [0.7]
統計的パラメトリックマッピング(SPM)は、解釈可能な解析を提供するが、アライメントに敏感であり、ロバストな外れ値検出能力は未だ不明である。本研究では、SPMアプローチと説明可能な機械学習(ML)アプローチを比較して、プラント圧力データセットのための透明な品質制御パイプラインを確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:25:02 GMT)
NIFTY: a Non-Local Image Flow Matching for Texture Synthesis [0.7]
NIFTYは、畳み込みニューラルネットワークでトレーニングされた拡散モデルに関する最近の知見と、パッチベースのテクスチャ最適化技術を組み合わせたハイブリッドフレームワークである。 NIFTYは、非局所パッチマッチングに基づいて構築された、非パラメトリックフローマッチングモデルである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:19:26 GMT)
A Review on Quantum Circuit Optimization using ZX-Calculus [0.7]
ZX計算は、セマンティックス保存量子回路最適化を可能にする代替フレームワークとして登場した。本稿では、ZXに基づく量子回路の最適化について概観し、最適化手法、ターゲットメトリック、量子コンピューティングアーキテクチャにより分類する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:00:58 GMT)
Tiny-QMoE [0.7]
QMoEモデルは、大規模なMixture-of-Experts(MoE)モデルの圧縮に実用的なアプローチを提供する。 QMoEはテラバイト規模のメモリ制限に対応するソリューションを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:33:20 GMT)
Intrinsic Signal Models Defined by the High-Dimensional, Small-Sample Limit [0.7]
本研究では,高次元および小サイズ条件下での信号検出を可能にする固有信号モデル'を提案する。このような信号モデルにより,田口法は信号を検出する効果的な方法を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:56:56 GMT)
From Outliers to Topics in Language Models: Anticipating Trends in News Corpora [0.7]
本稿では,話題モデリングにおけるノイズとしてしばしば無視される外れ値が,動的ニュースコーパスにおいて出現する話題の弱い信号として機能するかを検討する。企業における社会的責任と気候変動に焦点をあてた、フランス語と英語のニュースデータセットで、彼らの進化を時間とともに追跡します。アウトリーチは、モデルと言語の両方にわたって、時間とともに一貫性のあるトピックへと進化する傾向にあります。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:07:02 GMT)
Mind the Missing: Variable-Aware Representation Learning for Irregular EHR Time Series using Large Language Models [0.7]
VITAL(VITAL)は、不規則にサンプリングされた生理的時系列から学習するのに適した可変対応大規模言語モデル(LLM)ベースのフレームワークである。言語空間に重要な記号をリプログラミングし、LLMが時間的文脈を捉え、欠落した値に対する推論を可能にする。高レベルの欠如の下では堅牢なパフォーマンスを維持しており、これは実際の臨床シナリオでよく見られる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:44:16 GMT)
U-MAN: U-Net with Multi-scale Adaptive KAN Network for Medical Image Segmentation [0.6]
マルチスケール・アダプティブ・カン(U-MAN)は、新しいコルモゴロフ・アルノルドネットワーク(KAN)を強化する新しいアーキテクチャである。 PAGFモジュールは単純なスキップ接続を置き換え、エンコーダとデコーダのヒューズ機能に注意を払っています。 MANモジュールにより、ネットワークは複数のスケールで機能を適応的に処理し、さまざまなサイズのオブジェクトを分割する能力を向上させることができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:02:13 GMT)
"She was useful, but a bit too optimistic": Augmenting Design with Interactive Virtual Personas [0.6]
本稿では,対話型バーチャルペルソナ(IVP)について紹介する。マルチモーダル,対話型ユーザシミュレーションにより,設計者がインタビュー,ブレインストーミング,フィードバックの収集をリアルタイムで行うことができる。以上の結果から,ITPが情報収集を迅速化し,設計ソリューションを刺激し,迅速なユーザライクなフィードバックを提供する可能性が示唆された。設計者は、バイアス、過度な最適化、真の利害関係者の入力なしに信頼性を確保することの難しさ、そしてIPPが人間のインタラクションのニュアンスを完全に再現できないことへの懸念を提起した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:50:33 GMT)
The quantum super-Krylov method [0.6]
リアルタイムの進化と回復確率のみを利用する新しいKQD法を提案する。ノイズの多いデータに対して頑健な新しい微分推定アルゴリズムを提案する。ハミルトニアンスペクトルの仮定の下で、我々のアルゴリズムは指数関数的に基底状態エネルギーに収束することが証明される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:05:02 GMT)
Towards Human-interpretable Explanation in Code Clone Detection using LLM-based Post Hoc Explainer [0.6]
本稿では,MLベースのコードクローン検出器による予測を解明するために,大規模言語モデルの文脈内学習機能を活用する新しい手法を提案する。我々のアプローチは、正しい説明を98%まで与え、良い説明を95%提供することで、ポストホックな説明者として有望です。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:20:17 GMT)
Decoding quantum low density parity check codes with diffusion [0.6]
量子低密度パリティチェック符号におけるシンドローム測定から論理誤差を推定するための拡散モデルフレームワークを提案する。マスク付き拡散デコーダは平均より正確で、しばしば高速であり、最悪の場合、他の最先端のデコーダよりも常に高速であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:46:52 GMT)
Interfacing of an Optical Nanofiber with Tunably Spaced Atoms in an Optical Lattice [0.6]
我々は、可変間隔の光学格子を用いて、多数の原子の光ナノファイバーへの効率的な対面を実験的に実証した。格子ビームとナノファイバーからの反射は、全ての運動自由度で密閉するトラップ電位を与える。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:43:18 GMT)
Rule-Based Reinforcement Learning for Document Image Classification with Vision Language Models [0.6]
文書画像分類におけるルールベース強化学習の効果について検討する。強化学習は、分布外データよりも一般化能力が高い傾向にある。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:46:24 GMT)
Machine Unlearning for Speaker-Agnostic Detection of Gender-Based Violence Condition in Speech [0.5]
ジェンダーベースの暴力は、女性のメンタルヘルスに深刻な影響を及ぼす公衆衛生上の問題である。本研究は、性別による暴力被害者を音声から検出するための話者非依存的アプローチを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:32:26 GMT)
A Nonparametric Discrete Hawkes Model with a Collapsed Gaussian-Process Prior [0.5]
ベースラインと励起の両方にガウス過程を優先する非パラメトリックフレームワークを提案する。これにより、所定の傾向、周期性、または崩壊形を伴わないスムーズなデータ適応構造が得られる。シミュレーションでは、GP-DHPは多様な励起形状を復元し、ベースラインを進化させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:23:57 GMT)
Model Context Protocol for Vision Systems: Audit, Security, and Protocol Extensions [0.5]
Model Context Protocol (MCP) は、エージェントとツールのインタラクションのためのスキーマ境界実行モデルを定義する。これは、ビジョンシステムにおけるMPPのデプロイメントスケール監査である、最初のプロトコルレベルである。我々は,9次元の合成忠実度にアノテートされた91個の視覚中心型MPPサーバを解析した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:20:08 GMT)
Evaluation of A National Digitally-Enabled Health Promotion Campaign for Mental Health Awareness using Social Media Platforms Tik Tok, Facebook, Instagram, and YouTube [0.5]
メンタルヘルス障害は、世界の疾病の重荷に寄与する10の要因のうちの1つである。本研究は,シンガポールにおけるデジタル型メンタルヘルス推進キャンペーンの有効性について検討した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:13:58 GMT)
Neural Orchestration for Multi-Agent Systems: A Deep Learning Framework for Optimal Agent Selection in Multi-Domain Task Environments [0.5]
マルチドメインタスク環境における最適なエージェント選択のためのニューラルネットワークフレームワークであるMetaOrchを提案する。ファジィ評価モジュールは、完全性、妥当性、信頼度に沿ってエージェント応答をスコアし、オーケストレータを訓練するためのソフトインスペクタラベルを生成する。異種剤を用いた模擬環境実験により, 提案手法が86.3%の選択精度を達成できた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:28:11 GMT)
A Sparse $Z_2$ Chain Complex Without a Sparse Lift [0.4]
スパース$Z$連鎖複体(3つの異なる次数を持ち、量子コードに対応するように)を構築する。整数に対するスパースリフトを認めず、Ref. 1の質問に答える。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:19:23 GMT)
Pushing Toward the Simplex Vertices: A Simple Remedy for Code Collapse in Smoothed Vector Quantization [0.4]
ベクトル量子化は連続ベクトル空間を有限な代表ベクトルの集合(コードブック)に離散化する滑らかなベクトル量子化は、コードブックベクトルのハードな割り当てを、コードブックエントリの重み付けの組み合わせに緩和することでこの問題に対処する。離散画像の自動符号化やコントラスト音声表現学習を含む代表的ベンチマーク実験により,提案手法がより信頼性の高いコードブック利用を実現することを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:17:42 GMT)
Chirality-induced Spin-Orbit Coupling and Spin Selectivity [0.4]
1次元ヘリカルパスに沿って走行するスピノルが、経路の曲率の結果としてスピン軌道結合を発達させることを示す。このキラリティによって引き起こされるスピン軌道結合は、時間反転対称性の破れと相まって、CISS現象の微視的基盤となる重要な要素である可能性がある。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:43:16 GMT)
Forecasting the Future with Yesterday's Climate: Temperature Bias in AI Weather and Climate Models [0.3]
我々は、AI気象モデルと気候モデルにおける冬の冬の土地温度バイアスを分析する。いずれのモデルも,予測期間よりも15～20年早く,寒冷な平均気温を発生させることがわかった。アメリカ合衆国東部など一部の地域では、この予測は20-30年前の気候に似ている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:55:29 GMT)
Geometry aware inference of steady state PDEs using Equivariant Neural Fields representations [0.3]
本稿では,幾何的変動を考慮した定常PDEの予測手法であるenf2enfを紹介する。本手法は,特定空間に固定された遅延特徴にジオメトリを符号化し,ネットワーク全体の局所性を保存する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:06:23 GMT)
Multi-modal Bayesian Neural Network Surrogates with Conjugate Last-Layer Estimation [0.3]
我々は、2つのマルチモーダルニューラルネットワークサロゲートモデルを開発し、最終層における条件共役分布を利用してモデルパラメータを推定する。我々は,スカラーデータと時系列データの両方に対する一様サロゲートモデルと比較して,予測精度と不確実性が改善されたことを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:13:57 GMT)
Resource-efficient universal photonic processor based on time-multiplexed hybrid architectures [0.3]
我々は、離散時間量子ウォークにおけるユニバーサルフォトニックプロセッサの実装のレシピを提供することにより、理論的提案と最先端の実験能力のギャップを埋める。我々は,複数自由度からなるハイブリッド符号化により,インターフェースが高度にスケーラブルで資源効率が高いことを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:03:53 GMT)
Towards a more realistic evaluation of machine learning models for bearing fault diagnosis [0.3]
本稿では,振動を用いた軸受故障診断におけるデータ漏洩問題とそのモデル評価への影響について検討する。本研究では, 軸受データ分割に着目したリークフリー評価手法を提案し, トレーニングやテストに使用する物理部品の重複を防止した。 CWRU、パダーボーン大学(PU)、オタワ大学(UORED-VAF)の3つの広く採用されているデータセットに対する方法論の評価を行った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:35:02 GMT)
EigenBench: A Comparative Behavioral Measure of Value Alignment [0.3]
EigenBenchは、言語モデルの値をベンチマークするためのブラックボックスメソッドである。合理的な判断者が正しいラベルに同意できない主観的な特性を定量化するように設計されている。 GPQAベンチマークのモデルランキングを、客観的ラベルにアクセスすることなく復元することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:58:19 GMT)
On the Capacity of Self-Attention [0.3]
本稿では,自己保持能力に関するキャパシティに基づくスケーリング法を提案する。 D_K$は、広いグラフのクラスにおいて、$m'$関係を回復するのに必要かつ十分であることを示す。また、固定されたD_K$を多数の小さな頭部に割り当てることで干渉を緩和することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:47:35 GMT)
Formal Verification of Legal Contracts: A Translation-based Approach (Extended Version) [0.2]
本稿では,Java モデリング言語仕様に注釈付けされた Java コードへの変換を通じて,Stipula 契約の正当性を正式に検証する手法を提案する。検証バックエンドとしては、推論検証ツールのKeYが使用されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:51:15 GMT)
Lexicon-Enriched Graph Modeling for Arabic Document Readability Prediction [0.2]
アラビア語における文書レベルの可読性を予測するために,レキシコンに富んだグラフベースの手法を提案する。我々のシステムは各文書を文レベルグラフとしてモデル化し、ノードは文と補題を表す。文書レベルの予測には、最大プーリングを用いて文レベルの出力を集約し、最も難しい文を反映する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:29:32 GMT)
High-dimensional quantum Schur transforms [0.2]
我々は、Kroviのアルゴリズムの修正版と、BCHシュル変換の高次元バージョンを詳細に扱う。我々の研究は文学における重要なギャップに対処し、シュル=ワイル双対性に依存する幅広い結果のアルゴリズム的基礎を強化する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:04 GMT)
Representing LLMs in Prompt Semantic Task Space [0.2]
大規模言語モデル(LLM)は様々なタスクに対して印象的な結果をもたらす。与えられたタスクに対して最高のパフォーマンスのLLMを特定することは、大きな課題です。この研究は、プロンプトのセマンティックタスク空間内でLLMを線形作用素として表すための効率的で訓練のないアプローチを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:48:10 GMT)
Zubov-Net: Adaptive Stability for Neural ODEs Reconciling Accuracy with Robustness [0.2]
本稿ではZubovNetという適応型安定学習フレームワークを提案する。本稿では,PRoAsを直接最適化することで,ロアの形状を積極的に制御する新しいパラダイムを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:01:51 GMT)
Safety and Security Analysis of Large Language Models: Benchmarking Risk Profile and Harm Potential [0.2]
本研究は,9大言語モデル(LLM)の実証分析とリスクプロファイルを提供する。 RSIはアジャイルでスケーラブルな評価スコアであり、セキュリティ姿勢を定量化し比較し、LLMのリスクプロファイルを作成する。この研究は、テストされたLLMの安全性フィルタの広範な脆弱性を発見し、より強力なアライメント、責任あるデプロイメントプラクティス、モデルガバナンスの必要性を強調している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:00:08 GMT)
Robust semi-parametric signal detection in particle physics with classifiers decorrelated via optimal transport [0.2]
我々は、信号リッチ化ステップを使用して、信号リッチサンプル上で信号検出テストを行う。その結果, 脱相関法は中程度の背景不特定性に対して頑健であることが判明した。我々は、デコレーションと信号の富化が安定的で、堅牢で、有効で、より強力なテストを生み出すと結論付けている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:54:20 GMT)
Societal Capacity Assessment Framework: Measuring Resilience to Inform Advanced AI Risk Management [0.1]
社会能力評価フレームワーク(Scietal Capacity Assessment Framework、SCAF)は、AI関連のリスクに対応する社会の脆弱性、対処能力、適応能力を測定するための指標に基づくアプローチである。 SCAFは、確立されたレジリエンス分析方法論をAIに適用し、国レベルのデプロイメント状況に関する洞察でリスク管理を基盤とすることを可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:55:53 GMT)
APTx: better activation function than MISH, SWISH, and ReLU's variants used in deep learning [0.1]
活性化関数はディープニューラルネットワークに非線形性をもたらす。本稿では,MISHに類似した動作を行うアクティベーション関数 APTx を提案する。 APTxのより少ない計算要件は、モデルのトレーニングを高速化し、深層学習モデルのハードウェア要件を低減します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:16:00 GMT)
APTx Neuron: A Unified Trainable Neuron Architecture Integrating Activation and Computation [0.1]
非線形活性化と線形変換を1つのトレーニング可能な表現に統合する,新しい統合型ニューラルネットワークユニットを提案する。我々は、約332Kのトレーニング可能なパラメータを用いて、11のエポックで最大96.69%のテスト精度を達成し、MNISTデータセット上でAPTxニューロンベースのアーキテクチャを検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:16:46 GMT)
Security Degradation in Iterative AI Code Generation -- A Systematic Analysis of the Paradox [0.1]
本稿では,400個のコードサンプルを用いた制御実験により,AI生成コードのセキュリティ劣化を解析する。たった5回のイテレーションで,致命的な脆弱性が37.6%増加したことが分かりました。これらのリスクを軽減するための実践的ガイドラインを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:44:27 GMT)
The Cost of Secure Restaking vs. Proof-of-Stake [0.1]
リスク要件の観点から,セキュアな再試行とProof-of-Stakeプロトコルの効率を比較検討する。このような再帰グラフをセキュアなPoSプロトコルに変換することは,常に可能であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:54:43 GMT)
Average-computation benchmarking for local expectation values in digital quantum devices [0.1]
対象の計算をその変種と組み合わせ、平均化すると古典的に解ける相関関数を実現できるスキームを導入する。この変種は、ゲートを古典的にシミュレート可能なセットに単純化することなく、回路構造と深さを正確に保存する。平均計算期待値の推定には,限られた数の異なる回路の実現しか必要としないことを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:35:50 GMT)
Bridging Quantum Noise and Classical Electrodynamics with Stochastic Methods [0.1]
量子光学における新興技術の発展は、量子効果を忠実に捉える正確なモデルを必要とする。 We developed a framework based on process with a common cross-covariance structure which can be coupled to various type of Maxwell solver。この結果は、複雑なフォトニック環境下での非古典的な光をシミュレートするための調整プロセスの可能性を強調した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:14:33 GMT)
An LLM-Powered Agent for Real-Time Analysis of the Vietnamese IT Job Market [0.1]
我々は、AI Job Market Consultantを紹介します。これは、労働市場から直接、リアルタイムに、深く、データ駆動的な洞察を提供する、会話エージェントです。私たちのシステムの中核は、ReActエージェントフレームワークに基づいたツール拡張AIエージェントです。プロトタイプは3,745件の求人情報を収集し分析した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:03:12 GMT)
A Longitudinal Randomized Control Study of Companion Chatbot Use: Anthropomorphism and Its Mediating Role on Social Impacts [0.1]
社会人工知能(AI)エージェントとの関係が高まりつつある。人々は友人関係、メンターシップ、そしてReplikaのようなチャットボットとのロマンチックなパートナーシップを報告します。人間とAIの相互作用が人間とAIの相互作用にどう影響するかは、人々の社会的要求状態とAIエージェントの人為的類型が関与する可能性がある。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:44:25 GMT)
NarrLV: Towards a Comprehensive Narrative-Centric Evaluation for Long Video Generation [0.1]
長いビデオ生成タスクの目標は、ビデオの長さを延ばすだけでなく、長いビデオの中でよりリッチな物語コンテンツを正確に表現することである。提案するNarrLVは,Long Video生成モデルのナラティブ表現能力を総合的に評価する最初のベンチマークである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:21:12 GMT)
Active Leakage Cancellation in Single Qubit Gates [0.1]
我々は、アクティブリークキャンセルを導入することにより、最先端のシングルキュービットゲートを強化する。本手法を超伝導トランスモン量子ビットに適用し,10～5ドル以下でのリークを抑制する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:54:16 GMT)
Universality of Shallow Global Quenches in Critical Spin Chains [0.0]
本研究では,2種類の容易にアクセス可能な初期条件から局所可観測体の力学について検討する。いずれの場合も、普遍的なスケーリングの崩壊とスケーリング関数を識別する。有限温度クエンチに対しては、共形場理論の結果が回復される状態を決定する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:00:00 GMT)
Can In-Context Reinforcement Learning Recover From Reward Poisoning Attacks? [0.0]
テキスト内強化学習(ICRL)の劣化・破壊性について検討する。本稿では,AT-DPT(Adversarially Trained Decision-Pretrained Transformer)と呼ばれる,新たな逆トレーニングフレームワークを提案する。本手法は,攻撃者に対して,有害な環境報酬によるDPTの真の報酬を最小限に抑えるよう同時に訓練し,有害なデータから最適な行動を推測するDPTモデルを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:20:36 GMT)
VizGen: Data Exploration and Visualization from Natural Language via a Multi-Agent AI Architecture [0.0]
VizGenはAIによるグラフ生成システムで、ユーザーが自然言語を使って意味のある視覚化を作成できるようにする。マルチエージェントアーキテクチャ上に構築されたVizGenのハンドレスql生成、グラフ生成、カスタマイズ、洞察抽出。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:31:00 GMT)
VibeCodeHPC: An Agent-Based Iterative Prompting Auto-Tuner for HPC Code Generation Using LLMs [0.0]
VibeCode HPCはマルチエージェントロールアロケーションと反復的なプロンプトリファインメントを通じてプログラムをチューニングする。エージェントの動的配置とアクティビティモニタリング機能を導入し,効率的なマルチエージェントコラボレーションを実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:54:13 GMT)
Variance-Bounded Evaluation without Ground Truth: VB-Score [0.0]
基礎的真理を必要とせず,有効性とロバスト性の両方を測定する分散境界評価フレームワークであるVB-Scoreを紹介する。クエリや入力が与えられた場合、VB-Scoreは妥当な解釈を列挙し、確率を割り当て、分散によって罰せられる期待成功による出力を評価し、インテント間の一貫したパフォーマンスに報いる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:54:38 GMT)
Urban Green Governance: IoT-Driven Management and Enhancement of Urban Green Spaces in Campobasso [0.0]
カンポバッソ市のスマートグリーンシティのユースケースは、グリーン都市部の持続可能な管理のための革新的なモデルである。このプロジェクトはIoTシステムとデータ駆動型ガバナンスプラットフォームを統合し、木や緑地の健康状態のリアルタイム監視を可能にする。クラウドベースのプラットフォームは、グリーンアーバンマネージャ、技術専門家、運用スタッフのための総合的なリアルタイム意思決定をサポートする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:45:07 GMT)
Universal and Efficient Quantum State Verification via Schmidt Decomposition and Mutually Unbiased Bases [0.0]
任意の多部純量子状態を検証する普遍的プロトコルを提案する。局所次元に依存しないサンプル複雑性の普遍的な上限を確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:39:39 GMT)
Universal Entanglement Revival of Topological Origin [0.0]
我々は散逸性フェルミオンおよびボゾン性Su-Schrieffer-Heeger(SSH)モデルにおける絡み合いのダイナミクスを解析した。デコヒーレンスチャネルがキラル対称性を保存すると、幅広いパラメータの絡み合いが復活する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:10:25 GMT)
Two classes of quantum spin systems that are gapped on any bounded-degree graph [0.0]
変換不変量子スピンハミルトニアンを非可換相互作用を持つ一般グラフ上で研究する。我々は、ハミルトニアンが大きな局所次元において高い確率を持つ任意の有界グラフ上でギャップを持つことを証明する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:57:27 GMT)
Tunable optical lattices for the creation of matter-wave lattice solitons [0.0]
光学格子中の明るい物質波ソリトンを生成・研究するために,動的に調整可能な間隔を持つ光アコーディオン格子を用いた実験手法を提案する。格子間隔に調整された格子パラメータのキャリブレーション法を詳述し、マイクロ波アドレス化によるサイト分解原子番号の調製を実演する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:19:02 GMT)
TrueGradeAI: Retrieval-Augmented and Bias-Resistant AI for Transparent and Explainable Digital Assessments [0.0]
TrueGradeAIは、従来の紙ベースの評価の欠点を克服するために設計された、AI駆動のデジタル検査フレームワークである。このシステムは、セキュアなタブレット上でスタイラス入力による自然な手書き文字のキャプチャと、トランスフォーマーベースの光文字認識を転写に応用する。評価は、教員ソリューション、キャッシュ層、外部参照を統合した検索強化パイプラインを通じて行われる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:00:36 GMT)
Transfer learning for multifidelity simulation-based inference in cosmology [0.0]
ダークマターのみのN$-bodyシミュレーションの事前トレーニングは、高忠実度流体力学シミュレーションの必要な回数を8ドルから15ドルに削減する。より安価なシミュレーションを活用することで,計算コストを大幅に削減しつつ,高忠実度モデルの性能と高精度な推論を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:47:28 GMT)
Towards reconstructing quantum structured light on a quantum computer [0.0]
測定データから量子状態を再構成するための変分量子コンピューティング手法を提案する。再構成コスト関数をイジングモデルにマッピングすることにより、現在の量子ハードウェア上の変分固有解器を用いて問題を解くことができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:04:23 GMT)
Toward a Physics of Deep Learning and Brains [0.0]
生体脳における神経細胞の雪崩を記述するために用いられる方程式は、深部神経ネットワークにおける活動のカスケードにも適用可能であることを示す。この理論的枠組みは、普遍的な特徴が生物学的ニューラルネットワークと人工ニューラルネットワークの両方で共有されていることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:59:57 GMT)
The system of processing and analysis of customer tracking data for customer journey research on the base of RFID technology [0.0]
本稿では,RFID技術に基づく追跡データの処理と解析を行うシステムの研究に焦点をあてる。追跡データとトランザクションデータの統合は、小売を正確でデータ駆動の科学に変える基盤を作る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:20:18 GMT)
The quantum XY chain with boundary fields: finite-size gap and phase behavior [0.0]
逆場における有限サイズの1次元量子XY鎖について検討する。我々は、(M)相(Delta sim e-aL$)、(MI)相(Delta sim L-2$)、(K)相(Delta sim L-2 f_KI(L)$)、および(KI)相(Delta sim L-2 f_KI(L)$)を求める。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:38:06 GMT)
The STAR-XAI Protocol: A Framework for Inducing and Verifying Agency, Reasoning, and Reliability in AI Agents [0.0]
大きな推論モデルの「ブラックボックス」の性質は、信頼性と透明性の限界を示す。本稿では,信頼性の高いAIエージェントをトレーニングし,運用するための新たな運用方法論であるSTAR-XAIプロトコルを紹介する。我々の方法は、明示的で進化する象徴的ルールブックによって支配される構造化ソクラテス的対話として、人間とAIの相互作用を再編成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:49:26 GMT)
The Outputs of Large Language Models are Meaningless [0.0]
我々は,大規模言語モデル (LLM) の出力が無意味であるという結論を論じる。我々の主張は、2つの重要な前提に基づいている: (a) LLMの出力が文字通りの意味を持つために、ある種類の意図が必要とされること、そして (b) LLMが正しい種類の意図を持つことができないこと。論文は、たとえ議論が健全であっても、LLMの出力が意味のあるように見え、真の信念や知識を得るのに使用できる理由を論じて締めくくる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:21:22 GMT)
The AI_INFN Platform: Artificial Intelligence Development in the Cloud [0.0]
AI_INFNは、INFNユースケースにおける機械学習技術の採用を促進することを目的としている。我々はGPUによるデータ分析プラットフォームのコミッタリングについて更新する。このセットアップは、異なるリソースプロバイダ間でLHCを管理することができる。最初のテスト結果、新しいケーススタディ、統合シナリオが提示されます。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:40:51 GMT)
The 2T-quoctit: a two-mode bosonic qudit for high energy physics [0.0]
本研究では,非アベリア群構造型コヒーレント状態の星座内のクオクタイトの2モードボソニック符号化について検討した。この研究は、素粒子物理学における非アーベル対称性の重要性と、非アーベル論理ゲートを持ちたいという欲求によって動機付けられている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:23:15 GMT)
Temporal-Aware Iterative Speech Model for Dementia Detection [0.0]
音声を用いた認知症自動検出の現在の手法は,静的,時間に依存しない特徴や集約された言語コンテンツに依存している。本稿では,認知症検出のための自然発話を動的にモデル化するテンポラル・アウェア・イテレーティブ・フレームワークであるTAI-Speechを紹介する。私たちの研究は、より柔軟で堅牢な認知評価ソリューションを提供し、生のオーディオのダイナミクスを直接操作します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:56:07 GMT)
Teaching AI to Feel: A Collaborative, Full-Body Exploration of Emotive Communication [0.0]
Commonaiverseは、フルボディのモーショントラッキングとリアルタイムAIフィードバックを通じて人間の感情を探索するインタラクティブなインストールである。この協調的、アウト・オブ・ザ・ボックス(out-of-of-the-box)アプローチが、マルチメディア研究を、より具体化され、共創された感情的AIのパラダイムへと押し上げる方法について論じる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:28:56 GMT)
TRUSTCHECKPOINTS: Time Betrays Malware for Unconditional Software Root of Trust [0.0]
信頼の根源を確立するための現在のアプローチは秘密鍵や特別なセキュアなハードウェアに依存している。 TRUSTCHECKPOINTSは、正式なモデルに基づいて信頼の無条件ソフトウェアルートを確立する最初のシステムである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:27:48 GMT)
Supervised Machine Learning for Predicting Open Quantum System Dynamics and Detecting Non-Markovian Memory Effects [0.0]
オープン量子システムのダイナミクスを予測し,非マルコフメモリを検出するための,エンフノベルでスケーラブルな教師付き機械学習フレームワークを提案する。過去の補足データの短いスライディングウィンドウでトレーニングされたフィードフォワードニューラルネットワークは、状態トモグラフィや風呂の知識のない観測可能なシステム$langle Z_(S)(t)rangle$を予測する。メモリの定量化のために、Emphpredicted $langle Z_(S) において上向きの 'ターンバック' をカウントする正規化再生基準を導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:40:44 GMT)
Student Engagement with GenAI's Tutoring Feedback: A Mixed Methods Study [0.0]
本研究の目的は,(1) 学生が学習のフィードバックコンポーネントに関わったときにどう思うかを明らかにすること,(2) フィードバックコンポーネント,学生の視覚的注意,言語的思考,および問題の解決プロセスの一環としての即時行動との関係を探索することである。 380のフィードバックコンポーネントを取り入れた学生の思考の分析から,学生は理解や意見の相違,追加情報が必要,学生はフィードバックを明確に判断する4つの主要なテーマが明らかになった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:17:20 GMT)
Statistical Advantage of Softmax Attention: Insights from Single-Location Regression [0.0]
大規模言語モデルにおける代替案に対するソフトマックスの優位性について検討する。ソフトマックスがベイズリスクを達成するのに対し、線形注意は基本的に不足していることを示す。勾配に基づくアルゴリズムによる最適化の関連について論じる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:21:30 GMT)
Stable and Interpretable Jet Physics with IRC-Safe Equivariant Feature Extraction [0.0]
コライダー物理におけるクォークグルーオン識別のためのグラフニューラルネットワークについて検討する。特に、赤外線とコリニア(IRC)の安全性を強制するメッセージパッシングアーキテクチャを設計する。解析により、物理認識ネットワークはトレーニングインスタンス間でより安定であり、複数の解釈可能な方向にわたって遅延分散を分散していることがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:42:58 GMT)
Solving Free Fermion Problems on a Quantum Computer [0.0]
計算コストを大幅に削減した量子アルゴリズムにより解くことができる自由フェルミオン問題をいくつか提示する。メモリコストは指数関数的に改善され、poly log$(N)$である。シミュレーションアルゴリズムは,自由なボソンシステムを含む他の有望な対象に一般化可能であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:46:03 GMT)
Software Engineering Data Analytics: A Framework Based on a Multi-Layered Abstraction Mechanism [0.0]
このフレームワークはドメイン固有の演算子で構成される多層抽象機構に準拠している。ケーススタディを用いて,このアプローチの可能性を紹介した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:06:12 GMT)
Smart Medical IoT Security Vulnerabilities: Real-Time MITM Attack Analysis, Lightweight Encryption Implementation, and Practitioner Perceptions in Underdeveloped Nigerian Healthcare Systems [0.0]
医療用IoT(mIoT)デバイスにおけるセキュアでない無線通信は、患者のデータをサイバー脅威に晒す。本研究では,この脆弱性をMITM攻撃シミュレーションを用いて調査し,低コストデバイス上での軽量AES-128暗号の評価を行った。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:45:16 GMT)
Simultaneous Quantization and Reduction of Constrained Systems [0.0]
本稿では,制約量子系の量子化のための新しい枠組みを提案する。量子化と制約執行のプロセスを同時に行う。制約量子系に対する統一的な変分原理に加えて、形式主義は真空変動に起因する量子効果に関する情報理論的な視点も提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:42:19 GMT)
Short Blocklength Error Correction Codes for Continuous-Variable Quantum Key Distribution [0.0]
本稿では,連続可変量子鍵分布系における2段階誤り訂正方式を提案する。短いブロック長(1000ビット)の誤り訂正符号を使用することで、140kmの距離で秘密鍵レートを最大7.3倍に向上させることができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:44:11 GMT)
Self-Speculative Biased Decoding for Faster Live Translation [0.0]
Self-Speculative Biased Decodingは、一貫して成長する入力ストリームに対して、スクラッチから繰り返し出力を生成するのを避けるために設計された、新しい推論パラダイムである。提案手法は,従来の自己回帰的再翻訳に比べて,品質を損なうことなく最大1.7倍の高速化を実現する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:13:37 GMT)
Searching for Bloch wave packets with almost definite momentum direction [0.0]
ブロッホ波のパケットが一定の-またはほぼ--運動量方向を維持することができるかどうかを検討する。この問題は、量子バックフローの最初の実現を探索するために固体系システムを使用することの可能性に関係している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:53:52 GMT)
Sachdev-Ye-Kitaev Model in a Quantum Glassy Landscape [0.0]
ボソン-フェルミオン結合は、量子スピングラス相の安定性を高めることを示す。特に、量子スピングラス相では、虚時力学はギャップ位相の高速指数減衰特性からはるかに遅いダイナミクスへと変換される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:19:20 GMT)
SHAKE-GNN: Scalable Hierarchical Kirchhoff-Forest Graph Neural Network [0.0]
我々は,Kirchhoff Forestsの階層構造に基づく,スケーラブルなグラフレベルGNNフレームワークであるSHAKE-GNNを紹介する。 SHAKE-GNNはマルチスケールの表現を生成し、効率と性能のトレードオフを柔軟に実現している。我々は、トレードオフパラメータを選択し、SHAKE-GNNの時間複雑度を分析するための改良されたデータ駆動戦略を導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:22:10 GMT)
Relativistic Quantum Simulation under Periodic and Dirichlet Boundary Conditions: A First-Quantised Framework for Near-Term Devices [0.0]
第一量子化手法を用いた相対論的量子シミュレーションの新しい手法を提案する。波動関数は系量子ビットで表される有限格子にわたって離散化される。相対論的運動エネルギーは、全運動ハミルトニアンの摂動膨張によって近似される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:58:07 GMT)
Recent Advancements in Microscopy Image Enhancement using Deep Learning: A Survey [0.0]
顕微鏡画像強調の進歩は、特に深層学習の助けを借りて顕著に増加している。本研究の目的は,この急速に成長する最先端の手法のスナップショットを提供することであり,その進化,応用,課題,今後の方向性に焦点をあてることである。中心となる議論は、顕微鏡画像の超解像・再構成・復調の重要領域を中心に行われ、各領域は現在の傾向と深層学習の実用性の観点から探索されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:24:21 GMT)
Real-Time Brain Biomechanics Prediction with Neural Operators: Toward Clinically Deployable Traumatic Brain Injury Models [0.0]
外傷性脳損傷(TBI)は、毎年6900万人以上の患者を抱える公衆衛生上の問題となっている。 FEモデルは、脳の変形を高忠実に予測するが、計算コストが高く、シミュレーションに何時間も要する。本研究は、脳変位場の迅速かつ患者特異的な予測のための最先端のニューラルオペレーター(NO)アーキテクチャをベンチマークする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:48:27 GMT)
Quantum topological data analysis algorithm for dynamical systems [0.0]
本稿では,力学系の特性を決定するための量子フレームワークを提案する。量子アルゴリズム、特に量子ODEソルバと量子トポロジカルデータ解析における最近の多くの進歩を組み合わせる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:04:16 GMT)
Quantum sensing of a quantum field [0.0]
2レベル原子と相互作用させることにより、コヒーレント量子化場の振幅が推定されることを示す。どちらの気象シナリオにおいても、原子プローブの減少状態の量子フィッシャー情報(QFI)に焦点を当てる。大振幅$alpha$の極限において、QFIはその最大値が$tau =O(1)$および$tau =O(alpha2)$で1.47$に達し、また、ずっと後の周期的復活を示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:56:54 GMT)
Quantum reflection time and the Goos-Hänchen effect [0.0]
反射波パケットの運動の追従と散乱電位による粒子に課される空間遅延の量子的測定の類似性について検討する。このような遅延を時間に換算すると「負の時間」となり、避けられることが示されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:46:36 GMT)
Quantum internal vibrations in macroscopic systems with classical centers of mass [0.0]
科学界のかなりの部分は、古典力学は量子力学から生じる効果的な理論であるという考えを支持している。我々のモデルは、(古典的な質量中心を持つ)マクロ系が量子内部振動を吸収することを防ぐものではないことを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:48:38 GMT)
Quantum Measurement Trees, II: Quantum Observables as Ortho-Measurable Functions and Density Matrices as Ortho-Probability Measures [0.0]
有限次元空間 $ Cn $ の量子状態が与えられたとき、量子可観測体の可能な値の範囲は通常、対応するエルミート行列の固有値の離散スペクトルと同一視される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:43:51 GMT)
Quantum Measurement Trees, I: Two Preliminary Examples of Induced Contextual Boolean Algebras [0.0]
量子ランダム性は、単一のコルモゴロフ確率空間上で定義される確率変数の古典的枠組みを明らかに超越している。関連する非量子の例は Boole (1862) と Vorob$'$ev (1962) にインスパイアされたものであり、2値の確率変数 $X$, $Y$ と $Z$ を持つ。 1つ以上の準備ノードを持つ量子測定木を用いて量子実験結果を記述する方法について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:13:32 GMT)
Quantum Complexity and Chaos in Many-Qudit Doped Clifford Circuits [0.0]
奇素次元$d$のクォーディットに作用するドッピングクリフォード回路における量子複雑性とカオスの出現について検討する。ドッピングされたクリフォード・ウィンガルテン計算とレプリカテンソルネットワーク形式を用いて、正確な結果を導き、大規模シミュレーションを行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:05:23 GMT)
Quantum Chaos and Universal Trotterisation Behaviours in Digital Quantum Simulations [0.0]
デジタル量子シミュレーション(DQS)は、量子プロセッサの最初の有用な実世界のアプリケーションを実現するための最も有望な道の1つである。 Trotterisationは現在、最先端のリソーススケーリングを提供している。トロッタライズド・アイジングの最近の理論的研究は、予想よりも優れた性能が、明確なブレークスルーしきい値まで実現可能であることを示唆している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:14:15 GMT)
Proposal of method to solve a Traveling Salesman Problem using Variational Quantum Kolmogorov-Arnold Network [0.0]
トラベルセールスマン問題(TSP)は、多くのグループが解決しようとしている最適化問題の1つである。本稿では,変分量子コルモゴロフ・アルノルドネットワーク(VQKAN)を用いた新しい手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:05:44 GMT)
Properties of computational entanglement measures [0.0]
計算的絡み合い測定は、限られた計算資源の存在下での絡み合いの有用性を定量化する。我々は、絡み合い測度がスカラー値で定義されない場合に、基本特性の低境界および上界拡張を導入する。本分析では, 単発シナリオと一様設定の両方を対象とし, 前者が自然に後者に拡張する性質を定めている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:10:47 GMT)
Propagation Dynamics and Transient Amplification in Warm and Cold Atomic EIT Systems [0.0]
電磁誘導透過(EIT)を示す原子系における過渡増幅の観測限界について検討する。単一原子,空間的均一なOBE処理は,伝播ダイナミクスを無視することで利得を過大評価することを示した。以上の結果から, OBE予測と実験観測の相違が説明され, 低温・熱膨張EIT媒体における過渡的な利得の限界が確立された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:31:26 GMT)
Probing metric fluctuations with the spin decoherence of a particle in a quantum simulation [0.0]
ディラックフェルミオンと相互作用する(2+1)Dの巨大重力玩具モデルは、特定の時空変動をサポートすることができる。我々は、フェルミオンのスピンが時空のゆらぎと結合していることによる進化に焦点を当てる。このシステムのエミュレーションには、原子の電子状態においてスピン自由度を符号化することが含まれる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:19:39 GMT)
Probing high-frequency gravitational waves with entangled vibrational qubits in linear Paul traps [0.0]
我々は、$N$振動量子ビットの絡み合いによって信号の確率が$N2$になることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:22:29 GMT)
Probabilistic Consistency in Machine Learning and Its Connection to Uncertainty Quantification [0.0]
ある種の自己整合MLモデルは,クラス条件付き確率分布と等価であることを示す。この情報は、マルチクラスベイズ最適化の構築や、クラス割り当てにおける固有の不確実性を推定するタスクに十分である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:54:20 GMT)
Privacy in Distributed Quantum Sensing with Gaussian Quantum Networks [0.0]
ガウスネットワークにおける分散量子センシングプロトコルのプライバシー特性について検討する。最適化された完全に対称なガウス状態が、完全なプライバシーに急速に近づきつつあることを示す。本研究は,実用的でプライベートな量子センシングプロトコルの開発への道を開くものである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:24:24 GMT)
Prepare-and-measure and entanglement simulation beyond qubits [0.0]
正確な古典的プロトコルの重要な特徴を$d=2$で識別し、より高次元のロバストな近似プロトコルを構築するために使用する。提案手法は、$d=2$の量子確率分布を正確に再現し、高次元の既存のプロトコルと比較して非常によく機能する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:11:42 GMT)
Photons do not see entanglement (Entanglement, nonlocality, and the collapse of the wavefunction) [0.0]
絡み合いの背景にある考え方は、いかなる古典的現実主義の観点にも直感的ではない。軌道角運動量(OAM)のローレンツ加速下での基準フレームにおける絡み合いの進化について検討した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:13:10 GMT)
OrthoGrad Improves Neural Calibration [0.0]
$perp$Gradは、過信に対処するために降下方向を制約する。 $perp$Gradは、最適化のための幾何学的な修正である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:46:25 GMT)
Orbit dimensions in linear and Gaussian quantum optics [0.0]
量子状態の軌道の次元(ヒルベルト空間の多様体として)を研究する。群のリー代数を利用して、軌道次元を計算する汎用的で簡単な方法を示す。我々は、ガウスユニタリ群の下での軌道次元が非ガウス性証人となることを強調する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:57:46 GMT)
OpenAI's GPT-OSS-20B Model and Safety Alignment Issues in a Low-Resource Language [0.0]
本稿では,OpenAI の GPT-OSS-20b モデルで発見された脆弱性の集合を概説する。私たちの仕事のコアモチベーションは、過小評価されたコミュニティからのユーザに対するモデルの信頼性に疑問を呈することです。主要なアフリカの言語であるHausaを用いて、モデルの振る舞いにおけるバイアス、不正確さ、文化的不感を明らかにする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:14:54 GMT)
On the Incompatibility of Quantum State Geometry and Fuzzy Metric Spaces: Three No-Go Theorems [0.0]
ファジィ距離空間が量子状態幾何学の本質的な特徴を捉えることができないことを示す。第二に、量子状態空間からファジィ計量空間への距離保存埋め込みが存在しないことを証明する。第三に、ファジィ論理は対称と非対称な概念の組み合わせを区別できない。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:58:46 GMT)
On a discrete version of the position-momentum commutation relation [0.0]
十分な次元のヒルベルト空間によって記述されたキューディットの場合、位置-運動量交換関係の離散バージョンが存在する。連続パラメータとある種の離散コヒーレント状態に依存する離散変数ガウス状態の族を含むことを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:01:31 GMT)
Nonlinear Optimization with GPU-Accelerated Neural Network Constraints [0.0]
我々は、ニューラルネットワークを「グレーボックス」として扱い、中間変数と制約が最適化解法に晒されないようにする。フルスペースの定式化と比較すると、縮小空間の定式化は、インテリアポイント法におけるより高速な解法とより少ないイテレーションをもたらす。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:13:46 GMT)
Noise cross-correlations from single-shot measurements [0.0]
量子ビット対の雑音の自己およびクロスパワースペクトル密度を抽出する新しい手法を提案する。この方法は単純な入力、すなわち単一キュービットラムゼー型実験からの単発読み出しを用いる。半導体スピン量子デバイスからの実験データに適用し、周波数5桁以上のノイズスペクトルを得る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:54:29 GMT)
Next Generation Equation-Free Multiscale Modelling of Crowd Dynamics via Machine Learning [0.0]
本稿では,潜在空間における創発的群運動に対する離散的進化演算子を学習するために,多様体と機械学習を組み合わせた手法を提案する。提案するフレームワークは,高次元マルチスケールシステムのサロゲートモデルを学習するための方程式フリーアルゴリズムに関するこれまでの研究に基づいている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:22:46 GMT)
New Quantum Internet Applications via Verifiable One-Time Programs [0.0]
検証可能なワンタイムプログラム(Ver-OTP)を導入し,単一ラウンドのオープンセキュア計算(OSC)を構築するために使用する。我々の研究は、短期量子技術で実装可能な量子支援暗号の新しいフレームワークを提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:53:16 GMT)
Naturalistic intuitionism for physics [0.0]
我々は、ニコラス・ギシンとフラビオ・デル・サントの自然主義的な物理学直観主義の哲学的背景を発展させた。本稿では,自然主義的直観主義を正当化する自己完結的哲学的枠組みを提案する。この改訂は、いくつかの中心的な直観論的なトピックの独特な自然主義的扱いの調査を伴う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:06:44 GMT)
Multiplicative-Additive Constrained Models:Toward Joint Visualization of Interactive and Independent Effects [0.0]
解釈可能性(英: Interpretability)は、医療などの高度な分野に機械学習を適用する際の考慮事項の1つである。 GAM(Generalized Additive Models)は、形状関数を可視化することで解釈可能性を高める。本稿では,CESRを加法部で拡張し,その対話的・独立的な項の相互に絡み合う係数を解消する乗法・適応的制約モデル(MACMs)を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:08:31 GMT)
Multimodal Recurrent Ensembles for Predicting Brain Responses to Naturalistic Movies (Algonauts 2025) [0.0]
本稿では,事前訓練されたビデオ,音声,言語埋め込みをfMRI時系列にマッピングする階層的マルチモーダル・リカレントアンサンブルを提案する。トレーニングは複合的なMSE相関損失と、初期の知覚的堅牢性から後期関連領域に徐々に重点を移すカリキュラムに依存している。このアプローチは、将来のマルチモーダル脳エンコーディングベンチマークのための単純で自然なベースラインを確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:29:40 GMT)
Multi-Qubit Gates by Dynamical Decoupling Implemented with IBMQ and 15NV Center in Diamond [0.0]
ターゲット量子ビットに結合された中心量子ビットに印加された動的デカップリング(DD)パルス列を用いて高速な高忠実なマルチキュービットゲートを実現するためのプロトコルを示す。このようにして、中心量子ビットとの本質的な相互作用を活用することにより、ターゲット量子ビットの状態を制御することができる。この研究は、量子制御のための堅牢なハードウェアに依存しない戦略を提供し、中心ターゲットの量子ビット記述に適合する任意のシステムで実装することができる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:26:55 GMT)
Multi-Agent Reinforcement Learning for Greenhouse Gas Offset Credit Markets [0.0]
政府は企業に対して排ガス制限を課し、その限界を超える排ガスを罰することができる。排ガス過剰は、二酸化炭素削減プロジェクトに投資する企業によっても相殺される可能性がある。オフセット信用市場における有限エージェントナッシュ均衡を特徴付ける。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:25:07 GMT)
Multi-Agent Path Finding via Offline RL and LLM Collaboration [0.0]
Multi-Agent Path Finding (MAPF) は、ロボティクスやロジスティクスの応用において重要な課題となる。決定変換器(DT)に基づく効率的な分散化計画フレームワークを提案する。提案手法は,長期信用割当を効果的に処理し,疎度と遅延報酬を伴うシナリオの性能を著しく向上させる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:53:40 GMT)
MonoCon: A general framework for learning ultra-compact high-fidelity representations using monotonicity constraints [0.0]
我々は、任意のトレーニング済みエンコーダに取り付けられた小さな単調多層パーセプトロン(MLP)ヘッドを使用する単純なフレームワークであるMonoConを提案する。 MonoConは、事実上無視可能なパフォーマンスコストで、堅牢で、ゆがみがあり、非常にコンパクトな埋め込みを学ぶ。 SNLI文類似性タスクにおいて, STSbスコアの限界縮小のために, 3.4倍のコンパクト化と1.4倍の頑健な表現を報告した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:54:40 GMT)
Modelling non-stationary extremal dependence through a geometric approach [0.0]
非定常極端依存は、環境データセットや財務データセットでよく見られる。多変量極値モデリングへの最近のアプローチは幾何学的枠組みを用いており、そこでは、スケールされたサンプル雲の制限形状を通して、極依存性の特徴が推測される。このフレームワークは、幅広い依存構造を捉えることができ、定常環境では様々な推論手順が提案されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:42:57 GMT)
Measurability in the Fundamental Theorem of Statistical Learning [0.0]
統計的学習の基本定理は、仮説空間がPAC学習可能であることと、そのVC次元が有限であることは同値である。本稿では、実数 O-極小展開上で定義された仮説空間のPAC学習可能性について十分な条件を示す。この仮説空間のクラスは、ReLUやシグモイド関数のようなよく用いられる活性化関数を使用する二項分類のためのすべての人工ニューラルネットワークをカバーする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:35:54 GMT)
Malaysia's AI-Driven Education Landscape: Policies, Applications, and Comparative Insights for a Digital Future [0.0]
この記事では、マレーシアのAI駆動型教育の展望について説明する。教育、カリキュラムデザイン、管理、教師のトレーニングでAIアプリケーションをマップする。マレーシアのAIリテラシーとパーソナライズドラーニングの進歩が注目されている。勧告には、ガバナンスの強化、公平なインフラへの投資、民間とのパートナーシップの促進などが含まれる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 04:33:37 GMT)
Machine learning approaches to seismic event classification in the Ostrava region [0.0]
チェコ北東部は、国内で最も地震の多い地域の一つである。最も頻発する地震は、かつては強い鉱業活動があったため、鉱業によって引き起こされたものである。鉱業活動の停止にもかかわらず、地雷による地震が発生している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:51:16 GMT)
Machine Learning-Assisted Sustainable Remanufacturing, Reusing and Recycling for Lithium-ion Batteries [0.0]
この論文は、バッテリライフサイクルを通じてこれらの課題に対処するための機械学習支援フレームワークを開発する。物理情報による品質制御モデルは、限られた初期サイクルデータから長期劣化を予測する。予備電池の迅速かつ正確な評価を可能にする生成学習に基づく残留値評価方法。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:32:54 GMT)
Machine Learning for Quantum State Tomography: Robust Covariance Matrix Estimation for Squeezed Vacuum States with Thermal Noise [0.0]
本稿では,ガウス量子状態の共分散行列を熱雑音の存在下で推定するための教師付き機械学習に基づく手法を提案する。単モード圧縮真空状態の実験データと比較し、その精度と実験劣化の定量化能力を示す。熱多成分ガウス状態のリアルタイム量子状態トモグラフィーをマルチモードシステムに拡張するための基礎を築いた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 00:37:09 GMT)
ML2B: Multi-Lingual ML Benchmark For AutoML [0.0]
ML2Bは多言語機械学習コード生成のための最初のベンチマークである。評価には、データサイエンスパイプラインのエンドツーエンド評価のための自動フレームワークであるAIDEを用いる。その結果,非英語タスクでは15～45%の性能低下が認められた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:20:27 GMT)
MDP modeling for multi-stage stochastic programs [0.0]
このクラスは、連続状態とアクション空間を持つ構造化マルコフ決定プロセス(MDP)を含む。一段階の遷移確率に対する決定依存の不確実性を含むようにポリシーグラフを拡張します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 22:25:16 GMT)
Longitudinal and Multimodal Recording System to Capture Real-World Patient-Clinician Conversations for AI and Encounter Research: Protocol [0.0]
本研究は,マヨクリニックの外来内科で実施されている。参加診療所への直接訪問患者を招待し、360度ビデオカメラで記録する。訪問後、患者は共感、満足度、ペース、治療負担に関する調査を完了する。 2025年8月までに、36人の臨床医のうち35人(97%)と281人の患者のうち212人(75%)が同意した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:04:13 GMT)
Lightweight Learning for Grant-Free Activity Detection in Cell-Free Massive MIMO Networks [0.0]
Grant-free random access (GF-RA) は、将来の無線ネットワークにおける大規模機械型通信(mMTC)のための有望なアクセス技術である。本研究では、デバイスアクティビティ検出(AD)における課題に対処するために、教師付き機械学習技術を用いた効率性を検討する。我々は,mMTC 用の GF-RA のアクティビティ検出に特化して設計された,新しい軽量なデータ駆動型アルゴリズムフレームワークを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:46:04 GMT)
Leveraging Large Language Models for Robot-Assisted Learning of Morphological Structures in Preschool Children with Language Vulnerabilities [0.0]
言語療法士は、形態的構造を日常の相互作用やゲームベースの学習活動に組み込む。このアプローチは、正確な言語知識と様々な形態素のリアルタイム生産を必要とする。 TalBotプロジェクトでは、Furhatの会話ロボットが単語検索ゲーム"Alias"を子供たちとプレイし、言語スキルを向上させるアプリケーションを開発した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:48:51 GMT)
Learn, Check, Test -- Security Testing Using Automata Learning and Model Checking [0.0]
外部通信インタフェースを用いたブラックボックスとしてのサイバー物理システムについて検討する。まず、各プロトコルからモデルにコンテキスト情報をマッピングすることで、命題付きモデルにアノテートする。基本的なセキュリティ要件に基づいて、一般的なセキュリティ特性を定義します。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:29:53 GMT)
Intuition emerges in Maximum Caliber models at criticality [0.0]
直観は学習のメタスタブルなフェーズとして現れ、将来の経路エントロピーに対する次のトーケン予測を批判的にバランスさせる。この研究は、学習のメタスタブルなフェーズとして出現する原始的な直観を報告し、将来の経路エントロピーに対する次のトーケン予測を批判的にバランスさせる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:53:43 GMT)
Introduction of modelling radical pair quantum spin dynamics with tensor networks [0.0]
全ての核スピンを含むラジカル対スピンダイナミクスシミュレーションは、指数的スケーリングメモリ要求のために計算障壁となっている。本稿では,ラジカル対系の全開量子力学を正確にシミュレーションするためのテンソルネットワーク手法を用いてこの問題に対処する。我々はこれらの方法の生物学的に関連するフラビン-トリプトファンラジカル対系による効果を実証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:25:49 GMT)
Interpreting quantum reference frame transformations through a simple example [0.0]
量子参照フレームに対する3つのアプローチ - パースペクティブニュートラル、余分な粒子、運用と呼ばれている。これら3つのアプローチのそれぞれが、グローバルな状態に対する異なる態度を反映するものとして、異なる変換ルールを提供することを示す。これにより、各アプローチの運用上の意味と、それらが最も自然に適用される可能性のあるコンテキストを明確化できます。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:18:27 GMT)
Improving variational counterdiabatic driving with weighted actions and computer algebra [0.0]
可変カウンターダイアバティック(CD)駆動は、量子多体系を堅牢に制御するための規律付き、広く使われている方法である。ここでは, AGP理論に新たな自由度を導入することにより, 変動CD駆動を大幅に改善できることを明らかにする。計算機代数を用いた改良駆動プロトコルの効率的な数値計算法を開発した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:04:35 GMT)
Impact of Collective Behaviors of Autonomous Vehicles on Urban Traffic Dynamics: A Multi-Agent Reinforcement Learning Approach [0.0]
本研究では, 混合交通環境下での都市交通流に対する強化学習(RL)対応自動運転車(AV)の潜在的影響について検討した。人間の運転者が選択した経路を走行し、最低旅行時間で目的地にたどり着く都市ネットワークを考える。最適化目標のセットを定義するか、あるいはそれらが行動と呼ぶように、利己的、協力的、競争的、社会的、利他的、悪意的を定義します。シミュレーションの結果,AVの走行時間は最大5%まで最適化され,AVの挙動によって人体運転者の走行時間に異なる影響が認められた。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:29:54 GMT)
Identifying Memory Effects in Epidemics via a Fractional SEIRD Model and Physics-Informed Neural Networks [0.0]
本研究では,数次SEIRD流行モデルにおけるパラメータ推定のための物理インフォームドニューラルネットワークフレームワークを開発した。我々のフレームワークは、トレーニング可能なパラメータとして分のメモリオーダー$alpha$を学習し、同時に疫学レート$(beta, sigma, gamma, mu)$を推定する。合成Mpoxデータを用いたテストでは, ノイズ下での$alpha$とパラメータの信頼性が確認された。一方, COVID-19への応用では, 最適な$alpha in (0, 1]$がメモリ効果を捉え, 従来のSEIRDモデルよりも予測性能を向上させることが示されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:41:11 GMT)
HyCoVAD: A Hybrid SSL-LLM Model for Complex Video Anomaly Detection [0.0]
ビデオ異常検出(VAD)はインテリジェントな監視には不可欠だが、複雑な異常を識別することが大きな課題である。マルチタスク SSL 時間解析器と LLM バリデータを組み合わせたハイブリッド SSL-LLM モデルである HyVAD を導入する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:20:06 GMT)
How to simulate magic state cultivation with around $8$ Clifford terms on average [0.0]
我々は,非クリフォード$d=5$マジックステート培養回路のシミュレーション方法を示す。我々の結果は、内部構造を持つ運用関連の高い高いT$カウント量子回路のシミュラビリティに光を当てる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:39:22 GMT)
HierLight-YOLO: A Hierarchical and Lightweight Object Detection Network for UAV Photography [0.0]
本稿では,小型物体のリアルタイム検出を支援する階層的特徴融合と軽量モデルであるHierLight-YOLOを提案する。本稿では階層型拡張経路集約ネットワーク(HEPAN)を提案する。小さい物体検出ヘッドは、空間分解能をさらに高め、小さな物体(4ピクセル)検出に対処するために特徴融合を行うように設計されている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:59:02 GMT)
Guiding Evolution of Artificial Life Using Vision-Language Models [0.0]
マルチモーダル・ファンデーション・モデル(FM)でガイドされるオープン・エンド・ライクな検索手法であるASAL++を紹介する。シミュレーションの視覚履歴に基づいて,第2のFMを用いて新たな進化目標を提案する。 1)1回の反復で1つの新しいプロンプトを一致させるシミュレーション(Evolved Supervised Targets: EST)と,(2)生成されたプロンプトのシーケンス全体(Evolved Temporal Targets: ETT)を一致させるシミュレーション(Evolved Supervised Targets: EST)である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:03:24 GMT)
Group Evidence Matters: Tiling-based Semantic Gating for Dense Object Detection [0.0]
本稿では,重畳誘起冗長性をグループエビデンスに変換する検出器非依存のポストプロセッシングフレームワークを提案する。このフレームワークは再訓練を必要とせず、現代の検出器と統合する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:22:22 GMT)
Generative Logic: A New Computer Architecture for Deterministic Reasoning and Knowledge Generation [0.0]
Generative Logic (GL) は、ユーザの公理的定義から始まる決定論的アーキテクチャである。 GLは予想を列挙し、正規化、型、CEフィルタを適用し、機械チェック可能な証明を自動的に再構築する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:33:45 GMT)
Generating Generalised Ground-State Ansatzes from Few-Body Examples [0.0]
量子多体系のための基底状態アンサーゼを生成する手法を提案する。相関関係をエンコードし、有限サイズの効果を捉え、基底状態のエネルギーを正確に予測し、臨界現象のよい記述を提供する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:17:38 GMT)
GS-2M: Gaussian Splatting for Joint Mesh Reconstruction and Material Decomposition [0.0]
3次元ガウススプラッティングに基づくマルチビュー画像からのメッシュ再構成と材料分解のための統一解を提案する。以前の作業はこれらのタスクを別々に処理し、非常に反射的な表面を再構築するのに苦労した。提案手法は, この2つの問題に対して, 描画深度と正規度に関する属性を協調的に最適化することによって対処する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:43:33 GMT)
From Roots to Rewards: Dynamic Tree Reasoning with Reinforcement Learning [0.0]
木に基づく推論を適応的なプロセスに変換する動的強化学習フレームワークを提案する。これはProbTreeの確率的厳密さを維持しつつ、ソリューションの品質と計算効率の両方を改善している。この研究は、確率的フレームワークの信頼性と現実の質問応答システムに必要な柔軟性のバランスをとる、木構造推論の新しいパラダイムを確立する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:43:14 GMT)
From Noise to Knowledge: A Comparative Study of Acoustic Anomaly Detection Models in Pumped-storage Hydropower Plants [0.0]
本稿では,水力発電プラントの予測保守を改善する手段として,音響に基づく異常検出手法の比較分析を行った。時間領域と周波数領域の特徴を抽出する前に、ノイズの多い条件下での音響前処理における重要な課題に対処する。オーストリアのRodundwerk IIポンプ保存プラントで実世界の2つのデータセットでテストされているLSTM AE、K-Means、OC-SVMの3つの機械学習モデルをベンチマークした。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:57:40 GMT)
Fracture Detection In X-rays Using Custom Convolutional Neural Network (CNN) And Transfer Learning Models [0.0]
骨骨折は、しばしば痛み、モビリティの低下、生産性の低下をもたらす、世界的な健康上の大きな課題となる。従来の撮像法は、高コスト、放射線暴露、特殊解釈への依存に悩まされている。我々は、カスタム畳み込みニューラルネットワーク(CNN)を用いたX線画像の自動破壊検出のためのAIベースのソリューションを開発した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 19:27:15 GMT)
Fractional Orbital Angular Momentum as a Quantitative Measure of Wave-Particle Duality [0.0]
相対論的ガウス電子ビームに対するディラック方程式の解は、発散ビームに対して、各電子のスピンはスピン行列と軌道角運動量作用素の両方からの分数的寄与の和であることを示した。ここでは、分数軌道角運動量 (FOAM) は、系の粒子状特性を定量化する内在的な補体として、分数スピン角運動量 (FSAM) が系の波状特性の測度であると主張する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:55:31 GMT)
Forecasting the future development in quality and value of professional football players [0.0]
本稿では,予測精度と不確実性定量化手法に基づいて,説明可能な機械学習モデルを評価する。予測精度は1年後の選手の質と価値を予測するためにモデルを訓練することで研究される。概して、ランダム森林モデルは最も適したモデルである。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:51:52 GMT)
Feature- and process-based optimal control of quantum dynamics [0.0]
我々はマルコフ進化の下で、オープン量子プロセスのための特徴に基づく最適コヒーレント制御形式を開発した。特徴量に基づく Krotov 最適化アルゴリズムの性能は、学習された初期推定場を選択することで改善できる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:27:26 GMT)
Fast Partition-Based Cross-Validation With Centering and Scaling for $\mathbf{X}^\mathbf{T}\mathbf{X}$ and $\mathbf{X}^\mathbf{T}\mathbf{Y}$ [0.0]
機械学習モデルの分割に基づくクロスバリデーションを大幅に高速化するアルゴリズムを提案する。我々のアルゴリズムは、例えば、主成分分析(PCA)、主成分回帰(PCR)、隆起回帰(RR)、通常最小二乗(OLS)、部分最小二乗(PLS)のモデル選択に応用できる。文献に見られる代替手段とは異なり、前処理によるデータの漏洩を避ける。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:33:09 GMT)
Extract-0: A Specialized Language Model for Document Information Extraction [0.0]
本稿では,文書情報抽出に特化して最適化された7ビリオンパラメータ言語モデルであるExtract-0を提案する。 Extract-0は、GPT-4.1 (0.457)、o3 (0.464)、GPT-4.1-2025 (0.459)を上回り、1000種類の文書抽出タスクのベンチマークで0.573の平均的な報酬を得る。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:34:43 GMT)
Exploring the Early Universe with Deep Learning [0.0]
来るべき正方形キロメアアレイ天文台(SKAO)は、イオン化エポック(EoR)中の中性水素の分布をマッピングする。我々は,SKAOから期待される水素信号の2次元パワースペクトルから情報を抽出する最新の深層学習技術を開発した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:51:59 GMT)
Exploratory Semantic Reliability Analysis of Wind Turbine Maintenance Logs using Large Language Models [0.0]
本稿では、より複雑な推論タスクに現代大規模言語モデル(LLM)を活用する際のギャップについて論じる。我々は,LLMを用いた探索的フレームワークを導入し,分類を超えて意味分析を行う。以上の結果から,LSMは,テキスト情報や行動可能な専門家レベルの仮説を合成するためにラベル付けを超えて,強力な"信頼性共パイロット"として機能できることが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:00:20 GMT)
Excitable quantum systems: the bosonic avalanche laser [0.0]
本研究では, 発散3モード混合プロセスを通じて, ボゾン(準)粒子の電流によって駆動されるラシング系の力学について検討する。このシステムの半古典的解析は、キャビティモードとゲイン媒体の両方がラジング遷移を行うことのできる、異なる動的状態を予測する。正確なモンテカルロシミュレーションにより、このコヒーレンス共鳴の効果は、比較的低い平均光子数であっても、巨大なボソニック粒子数ゆらぎに支配されているにもかかわらず、持続することを示した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:29:32 GMT)
Exact solutions of open quantum Brownian motions on the real line for two-level systems [0.0]
古典拡散過程の量子アナログとしてのオープン量子ブラウン運動を外部環境との相互作用下で研究する。 2段階の内的自由度を持つ粒子の1次元進化に対する正確な解析解を導出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:24:04 GMT)
Evaluating LLMs for Combinatorial Optimization: One-Phase and Two-Phase Heuristics for 2D Bin-Packing [0.0]
本稿では,Large Language Models (LLM) の最適化能力を評価するための評価フレームワークを提案する。我々は,LLMと進化的アルゴリズムを組み合わせた体系的手法を導入し,解の生成と洗練を行う。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:19:22 GMT)
Entanglement and apparent thermality in simulated black holes [0.0]
量子ブラックホールの半古典的極限におけるホーキング放射の明らかな熱性について検討する。事象地平線を隔てて2分割すると、モードの占有が明らかに熱フェルミ・ディラック分布に従うような密度行列が得られることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:00:01 GMT)
Entanglement Hamiltonian for the massless Dirac field on a segment with an inhomogeneous background [0.0]
非均質な背景における質量を持たないディラック場に対する区間の絡み合いハミルトニアンについて検討する。我々は、空間座標にのみ依存するワイル因子を通して、ワイルと平坦な計量と等価な計量のクラスに焦点を当てる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:40:56 GMT)
Ensemble Prediction via Covariate-dependent Stacking [0.0]
本研究では,CDST (covariate-dependent stacking) という,アンサンブル予測の新しい手法を提案する。従来の積み重ね法やモデル平均化法とは異なり、CDSTはモデルの重みを共変量の関数として柔軟に変化させることができる。以上の結果から,CDSTは複雑性・時間的予測問題に特に有用であるが有用ではないことが示唆された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 07:39:23 GMT)
Enhancing Safety in Diabetic Retinopathy Detection: Uncertainty-Aware Deep Learning Models with Rejection Capabilities [0.0]
糖尿病網膜症(DR)は視覚障害の主要な原因である。深層学習モデルは網膜画像からDRを特定することに成功している。本稿では,不確実性を考慮したディープラーニングモデルにおいて,低信頼度予測を拒否する拒否機構を含む代替手法について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:47:43 GMT)
Effectiveness of Large Multimodal Models in Detecting Disinformation: Experimental Results [0.0]
本研究では,偽情報の検出・緩和における大規模マルチモーダルモデルの可能性について検討する。本稿では,GPT-4oモデルの高度な機能を活用し,マルチモーダルな偽情報検出手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 14:07:06 GMT)
Dynamics and computation in linear open quantum walks [0.0]
オープン量子ウォーク(英語: Open Quantum Walks、OQW)は、システムと環境との相互作用によって制御される量子ウォークの一種である。このモデルでは、デフォーカスやデポーラ化といったランダムなユニタリな量子チャネルをどのように表現できるかを示す。また,本モデルのための回路表現を用いたシミュレーションプロトコルを開発した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:21:01 GMT)
DragGANSpace: Latent Space Exploration and Control for GANs [0.0]
この研究はStyleGAN、DragGAN、主成分分析(PCA)を統合し、GAN生成画像の遅延空間効率と制御性を向上させる。画像操作のためのDrag-GANフレームワークにPCAをベースとした次元削減を組み込むことで、最適化効率を向上しつつ、性能を維持できることがわかった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:30:49 GMT)
Divide, Conquer and Verify: Improving Symbolic Execution Performance [0.0]
シンボル実行(英: Symbolic Execution)は、コンピュータプログラムの動作を確認し、ソフトウェア脆弱性を検出するための形式的な方法である。近年のパフォーマンス向上にもかかわらず、Symbolic Executionは現実のソフトウェアに適用するには遅すぎる。個別のスライスを実行し,その後に副作用を組み合わせることで,シンボル実行のための分割・コンカレント手法を提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:20:15 GMT)
Divide and Conquer based Symbolic Vulnerability Detection [0.0]
本稿では,シンボル実行と制御フローグラフ解析に基づく脆弱性検出手法を提案する。提案手法では,無関係なプログラム情報を除去するために,分割・分散アルゴリズムを用いる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:47:52 GMT)
Delay in electronic vortex states created by multiphoton ionization with single elliptically polarized laser pulses [0.0]
光電子運動量分布における渦状構造は、1つの強い楕円偏光レーザーパルスと相互作用する原子に対して観察することができる。これらの渦巻き構造は、2つの支配的な光電子渦状態の破壊的干渉の結果であることが明らかとなった。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:24:00 GMT)
Deep Learning-Based Pneumonia Detection from Chest X-ray Images: A CNN Approach with Performance Analysis and Clinical Implications [0.0]
胸部X線画像から自動的に肺炎を検出するために,Conal Neural Networksを用いた複雑なディープラーニングシステムを提案する。提案したCNNアーキテクチャは,分離可能な畳み込みやバッチ正規化,ドロップアウト正規化といった高度な手法を統合している。精度、精度、リコール、F1スコアなどの複雑な評価指標の配列は、精度91の精度を記録して、モデル例外性能を総合的に検証する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:58:50 GMT)
Decoding Deception: Understanding Automatic Speech Recognition Vulnerabilities in Evasion and Poisoning Attacks [0.0]
本稿では,コスト効率のよいホワイトボックス攻撃と,自動音声認識システムに対する非伝達性ブラックボックス攻撃について検討する。本稿では, 摂動攻撃が最先端モデルの性能を低下させ, 音声信号の誤解釈につながることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:42:59 GMT)
Debiasing Large Language Models in Thai Political Stance Detection via Counterfactual Calibration [0.0]
タイの政治は、間接的な言語、偏りのある人物、絡み合った感情とスタンスによって特徴付けられる。低リソースで文化的に複雑な環境での政治的スタンスの検出は、大きな言語モデルにとって重要な課題である。我々は、微調整を必要とせず、政治的偏見を緩和する、軽量でモデルに依存しないキャリブレーションフレームワークであるThaiFACTUALを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:26:21 GMT)
Data-driven Neural Networks for Windkessel Parameter Calibration [0.0]
そこで本研究では,Windkessel (WK) パラメータを次元的に低減した1D-0D結合血流モデルでキャリブレーションする方法を提案する。左腕動脈の血流を模擬したデータ駆動型ニューラルネットワーク(NN)を設計した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:54:58 GMT)
Cross-Linguistic Analysis of Memory Load in Sentence Comprehension: Linear Distance and Structural Density [0.0]
本研究では, 文レベルの記憶負荷が, 構文的に関連した単語間の線形近接や, 介在物の構造密度によってよりよく説明されるかを検討する。複数の言語にまたがる調和した依存性ツリーバンクと混合効果フレームワークを用いて、分析は文の長さ、依存関係の長さ、インターベンタ複雑度をメモリ負荷測定の予測器として共同で評価する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:52:14 GMT)
Creative Adversarial Testing (CAT): A Novel Framework for Evaluating Goal-Oriented Agentic AI Systems [0.0]
CAT(Creative Adversarial Testing)は、エージェントAIタスクとシステムの意図する目的との間の複雑な関係をキャプチャして分析するために設計された、新しいアプローチである。我々は、Alexa+オーディオサービスに倣った合成相互作用データを用いて、CATフレームワークを広範囲にシミュレーションすることで検証する。我々の結果は、CATフレームワークが目標とタスクのアライメントに関する前例のない洞察を提供し、エージェントAIシステムのより効率的な最適化と開発を可能にしていることを実証している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:52:20 GMT)
Cost-aware Photonic Graph State Generation: A Graphical Framework [0.0]
フォトニックグラフ状態は、量子計算と通信に不可欠な資源である。任意の大きさと形状のフォトニックグラフ状態を生成するためのコスト対応フレームワークを提案する。このフレームワーク内では,2ビットゲートの使用量を大幅に削減する決定論的生成アルゴリズムであるGraph Builderを開発した。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:00:01 GMT)
Correlators in phase-ordering from Schrödinger-invariance [0.0]
位相秩序運動学を経る系は、完全に乱れた初期状態から0TT_c$の順序相へのクエンチ後に位相秩序運動学を行う。雑音の初期条件によって決定される1時間と2時間の相関子の長時間の挙動は、シュル「オーディンガー不変性」から導かれる。完全有限系と大域相関系のスケーリングを見つけ、低温の一般化 $lambda = d-2 ヤンセン=シャウブ=シュミットマンスケーリング関係の値が導出される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:05:37 GMT)
Convexity-Driven Projection for Point Cloud Dimensionality Reduction [0.0]
本稿では,点雲の次元的低減のための凸性駆動型除細動(CDP)を提案する。 CDPは、点雲の次元還元のための境界自由線形法である。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:25:12 GMT)
Construction and simulability of quantum circuits with free fermions in disguise [0.0]
自由フェルミオンを擬似的に収容する局所量子回路を階段とレンガ工で検討する。我々の研究は、文学における最近の予想を証明し、偽装した自由フェルミオンの古典的シミュラビリティに関する新しい疑問を提起する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:04:27 GMT)
Constructing qubit edge states by inverse-designing the electromagnetic environment [0.0]
相互作用する量子ビットの連鎖を囲む周期的誘電体構造を逆設計し、拡張された二量化Su-Schrieffer-Heeger励起模型をエミュレートする。提案手法により光子を介する相互作用の精密制御が可能となり, クビット鎖における位相的エッジ状態の出現を探索することができる。この研究は、トポロジカルな励起状態の安定化における逆設計の可能性を強調し、先進的な量子技術への新たな可能性を開く。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:15:19 GMT)
Constrained Search in Imaginary Time [0.0]
本稿では,密度汎関数理論から純状態制約付き探索関数を評価するための仮想時間進化法を提案する。固有状態の所定の密度を生成するポテンシャルを生じる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 15:22:20 GMT)
Compiling by Proving: Language-Agnostic Automatic Optimization from Formal Semantics [0.0]
シンボル実行とグラフ構造のコンパイルにより全パス到達可能性証明を構築する。我々は、多くの意味的な書き直しを単一のルールに集約し、建設による正確性を維持します。我々はこれを言語に依存しないKフレームワークの拡張として実装する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 02:49:08 GMT)
Comparison of wave-mixing processes in rarefied gas and QED vacuum using numerical simulations [0.0]
真空中におけるレーザー誘起非線形量子電磁力学(QED)効果と競合する信号とを区別するために必要な条件について検討する。希薄ガスの寄与は1D-1V フラソフ-マクスウェル系を用いて統計的にモデル化される。真空非線形性はハイゼンベルク・オイラー効果の弱場展開の中で説明される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 20:20:02 GMT)
Closed-Form Interpretation of Neural Network Latent Spaces with Symbolic Gradients [0.0]
オートエンコーダやシームズネットワークのような人工ニューラルネットワークが、潜在空間において有意義な概念を符号化していることが実証されている。本稿では,ニューラルネットワークの潜在空間におけるニューロンのクローズドフォーム解釈の枠組みを提案する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 09:33:03 GMT)
Classical and quantum chaotic synchronization in coupled dissipative time crystals [0.0]
2つのコヒーレント結合型散逸時間結晶のダイナミクスについて検討する。古典的な場合と類似して、この挙動を量子カオス同期と解釈する。古典的および量子的交叉の位置は互いに一致している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 12:46:46 GMT)
Caterpillar GNN: Replacing Message Passing with Efficient Aggregation [0.0]
我々は,より強く,より構造化された帰納的バイアスに対して,ある表現性を意図的に取り除くために構築された歩行入射に基づく行列に対する効率的な集約を導入する。私たちのアプローチは、古典的なメッセージパッシングと、ウォークに基づくシンプルなメソッドのシームレスなスケーリングを可能にします。計算グラフの隠蔽層におけるノード数を著しく削減しつつ,キャタピラーGNNの予測性能が同等であることを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 10:26:27 GMT)
Capturing Opinion Shifts in Deliberative Discourse through Frequency-based Quantum deep learning methods [0.0]
議論は、決定に達する前に様々な視点を測ることで成果を形作る上で重要な役割を担います。近年の自然言語処理の進歩により、議論をコンピュータでモデル化することが可能になった。本稿では,複数のNLP手法の比較分析を行い,モデルが会話を効果的に解釈する方法について検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:23:55 GMT)
Can LLMs Solve and Generate Linguistic Olympiad Puzzles? [0.0]
我々は,高校生を対象とした言語オリンピアードのパズルに着目した。本稿では,Large Language Models (LLM) を用いた言語パズルの解法について検討する。パズル解法実験から得られた知見を用いて,パズル生成の新たな課題を導出する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 03:26:28 GMT)
CRACQ: A Multi-Dimensional Approach To Automated Document Assessment [0.0]
CRACQは、コヒーレンス、リゴール、適切性、完全性、品質といった、f i v e特有の特性で文書を評価するのに適した多次元評価フレームワークである。言語的、意味的、構造的なシグナルを累積評価に統合し、全体的および特性レベルの分析を可能にする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 17:01:54 GMT)
Blockchain Voting System [0.0]
本稿では、選挙組織と中立オブザーバによって維持されるプライベートブロックチェーンに暗号化された投票を格納する、ハイブリッドブロックチェーンベースの投票モデルを提案する。このシステムは、匿名性を保護するために、一度に盲目で署名されたトークンを発行し、彼らの投票を確認するためにレシートを提供する。この研究は、小規模グループから大規模組織まで、安全な、検証可能な、スケーラブルなオンライン投票の実現可能性を強調している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 21:58:52 GMT)
Biospheric AI [0.0]
我々は、エコセントリックな視点を前提とした新しいパラダイムであるバイオスフェアAIを提案する。この研究は、AIとバイオスフィアの相互作用に焦点を当てた包括的な研究プログラムへの第一歩を踏み出そうとする。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:40:37 GMT)
Beyond Token Limits: Assessing Language Model Performance on Long Text Classification [0.0]
我々は,XLM-RoBERTa,Longformer,GPT-3.5,GPT-4の5言語を対象に,比較Agendasプロジェクトのマルチクラス分類タスクについて実験を行った。その結果、ロングフォーマーモデルには特に利点がなく、特にロングインプットを扱うために事前訓練されている。クラスレベルの要因の分析は、長いテキスト入力のパフォーマンスに関して、特定のカテゴリ間のサポートと物質重なりが重要であることを示唆している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:22:03 GMT)
An rf-SQUID-based traveling-wave parametric amplifier with -84 dBm input saturation power across more than one octave bandwidth [0.0]
トラベリングウェーブパラメトリック増幅器(TWPA)は、量子回路の読み出しと暗黒物質の探索に欠かせない道具となっている。本稿では,rf-SQUIDをベースとした平均飽和電力-84dBmのJosephson TWPAの実装について報告する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 08:51:57 GMT)
All multipartite entanglements are quantum coherences in locally distinguishable bases [0.0]
多部量子系のm-分離性とk-粒子の絡み合いは、完全正則基底に関して同じ量子コヒーレンスと相関している。多部量子状態のm-分離可能な絡み合いの幾何学的測度は、完全正則基底に対する状態の最小忠実度に基づく量子コヒーレンスの二乗に等しいことを示す。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 11:13:16 GMT)
Aircraft Trajectory Dataset Augmentation in Latent Space [0.0]
本稿では,航空機軌道データセット拡張のための新しいフレームワークであるATRADAを提案する。提案フレームワークでは,トランスフォーマーエンコーダが元のトラジェクトリデータセットの下位パターンを学習する。新しいサンプルは装着されたGMMから引き出され、サンプルの寸法は元の次元に戻され、サンプルは多層パーセプトロンで復号される。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:26:30 GMT)
Advancing Natural Language Formalization to First Order Logic with Fine-tuned LLMs [0.0]
予測可用性はパフォーマンスを15～20%向上させる。モデルは特定の訓練をせずに、目に見えない論理的議論に一般化する。構造論理の翻訳は堅牢であるが、述語抽出が主要なボトルネックとして現れる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 13:30:50 GMT)
AI Brown and AI Koditex: LLM-Generated Corpora Comparable to Traditional Corpora of English and Czech Texts [0.0]
本稿では,大言語モデル(LLM)を用いた英語とチェコ語のテキストのコーパスについて述べる。その動機は、人文テキストとLLM生成テキストを言語的に比較するためのリソースを作成することである。これらのリソースが多言語であり、トピック、著者、テキストタイプに富んでいることが強調された。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 23:11:17 GMT)
ACCeLLiuM: Supervised Fine-Tuning for Automated OpenACC Pragma Generation [0.0]
本稿では,2つのオープンウェイトであるACCeLLiuMについて紹介する。 ACCeLLiuM SFTデータセットには、GitHub C/C++から採掘された4,033のOpenACCプラグマループペア、トレーニング用の3,223ペア、テスト用の810が含まれている。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:37:37 GMT)
A universal constraint for relaxation rates for quantum Markov generators: complete positivity and beyond [0.0]
普遍的制約の妥当性に影響を与えることなく,2-正に緩和できることを示す。また、これらの境界と量子過程における定常状態の数との関係についても検討する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 06:49:22 GMT)
A theoretical guarantee for SyncRank [0.0]
雑音のペア比較からグローバルランキングを復元する SyncRank アルゴリズムの理論的,実証的な解析を行う。我々の主定理は臨界雑音閾値(sigma = O(sqrt(n / log n))を特徴付け、SyncRankは高い確率で正確なランク回復を達成する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 16:45:06 GMT)
A theoretical basis for model collapse in recursive training [0.0]
生成モデルからのトレーニングは、シミュレーションされた確率分布のいわゆる「崩壊」につながることが知られている。このノートは、外部ソース、どのようにマイナーであれ、サンプルにも貢献するかどうかによって、実際には2つの異なる振る舞いが得られていることを示している。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 18:37:11 GMT)
A Verified Compiler for Quantum Simulation [0.0]
ハミルトンシミュレーションは量子コンピューティングの中心的な応用である。ハミルトンシミュレーションをコンパイルするための高レベル、正式に検証されたフレームワークであるQBlueを紹介する。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 01:57:18 GMT)
A Large-Scale Dataset and Citation Intent Classification in Turkish with LLMs [0.0]
まず、トルコ語による引用意図のデータセットを公開し、目的付けのアノテーションツールで作成する。次に,Large Language Models (LLMs) を用いた標準インコンテキスト学習の性能評価を行い,手動で設計したプロンプトによる一貫性のない結果によってその効果が制限されることを示した。最終分類には、複数の最適化されたモデルから出力を集約し、安定かつ信頼性の高い予測を保証するために、重ねられた一般化アンサンブルを用いる。
論文参考訳（メタデータ） (Fri, 26 Sep 2025 05:44:04 GMT)