RoboOmni: Proactive Robot Manipulation in Omni-modal Context [165.1] 我々は,音声対話や環境音,視覚的手がかりから意図を導出する,クロスモーダルな文脈指示を導入する。
目的認識,インタラクション確認,アクション実行を統一する,エンドツーエンドのOmni-Modal LLMに基づくフレームワークであるRoboOmniを提案する。
シミュレーションと実世界の設定の実験では、Robo OmniはテキストベースとASRベースのベースラインを越え、成功率、推論速度、意図認識、積極的に支援している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:33:51 GMT)
VideoExplorer: Think With Videos For Agentic Long-Video Understanding [117.7] ロングビデオ理解はコンピュータビジョンにおいて難しい問題である。
ビデオによる思考の原則に基づくフレームワークであるVideoExplorerを提案する。
静的なコンテキストを推論する代わりに、VideoExplorerは、サブクエストを反復的に定式化し、関連するモーメントを特定し、タスク指向で時間的にスケーラブルなビデオ理解を実行する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:37:25 GMT)
Rethinking Facial Expression Recognition in the Era of Multimodal Large Language Models: Benchmark, Datasets, and Beyond [116.7] MLLMの表情推論能力の向上を目的とした後学習戦略を提案する。
We developed a unified and interpretable FER foundation model called UniFER-7B。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:53:00 GMT)
Real-IAD Variety: Pushing Industrial Anomaly Detection Dataset to a Modern Era [110.8] Real-IAD Varietyは、160の異なる対象カテゴリにわたる198,960の高解像度画像からなる、最大かつ最も多様なIADベンチマークである。
その多様性は、28の産業、24の素材タイプ、22のカラーバリエーションを包括的にカバーすることで保証されている。
この重要な分野のイノベーションを促進するために、Real-IAD Varietyが公開される。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:58:02 GMT)
ToM: Leveraging Tree-oriented MapReduce for Long-Context Reasoning in Large Language Models [107.9] ToMは、長期コンテキスト推論のための新しいツリー指向MapReduceフレームワークである。
ToM は既存の分割・クエリー・フレームワークや検索拡張生成手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:43:58 GMT)
FLARE: Feed-forward Geometry, Appearance and Camera Estimation from Uncalibrated Sparse Views [100.5] FLAREは、高品質カメラのポーズと3次元幾何を、補正されていないスパースビュー画像から推定するために設計されたフィードフォワードモデルである。
本ソリューションでは,3次元構造を2次元画像平面にマッピングする上で,カメラポーズが重要なブリッジとして機能するケースケード学習パラダイムを特徴とする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:11:30 GMT)
MindJourney: Test-Time Scaling with World Models for Spatial Reasoning [97.6] 視覚言語モデルのためのテスト時間スケーリングフレームワークであるMindJourneyを提案する。
我々は,代表的空間推論ベンチマークSATにおいて,MindJourneyが平均7.7%以上の性能向上を達成したことを示す。
また,本手法は,強化学習により訓練した試験時間推定VLMも改善する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:54:48 GMT)
CoT-Saliency: Unified Chain-of-Thought Reasoning for Heterogeneous Saliency Tasks [96.6] 本稿では,3つの運用上不均一なサリエンシタスクを共同で処理する,最初の統合フレームワークを提案する。
タスクの不均一性を橋渡しする視覚言語モデル(VLM)において、チェーン・オブ・ソート(CoT)推論プロセスを導入する。
我々は,全タスクにまたがる特別なSOTA手法と強力なクローズドソースVLMの整合性を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:37:01 GMT)
Spike Imaging Velocimetry: Dense Motion Estimation of Fluids Using Spike Cameras [84.6] 本研究では、粒子画像速度測定(PIV)におけるスパイクカメラ(超高速・高ダイナミックレンジカメラの一種)の膨大なポテンシャルについて検討する。
本研究では,高乱流・複雑な流れ場に特化して設計された深層学習フレームワークSpike Imaging Velocimetry (SIV)を提案する。
本稿では,スパイクに基づくPIVデータセットであるParticle Scenes with Spike and Displacement (PSSD)を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:53:29 GMT)
CoP: Agentic Red-teaming for Large Language Models using Composition of Principles [68.7] 本稿では,Large Language Models (LLM) のリピートプロセスを自動化するエージェントワークフローを提案する。
ヒューマンユーザは、AIエージェントへの指示として、効果的な赤チーム戦略を自動オーケストレーションし、ジェイルブレイクプロンプトを生成する、一連の赤チームの原則を提供する。
先進的なLLMに対して試験すると、CoPは新しいジェイルブレイクプロンプトを見つけ、最もよく知られているシングルターン攻撃の成功率を19.0倍に改善することで、前例のない安全リスクを明らかにしている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:27:01 GMT)
Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.7] The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:56:06 GMT)
Do You Know About My Nation? Investigating Multilingual Language Models' Cultural Literacy Through Factual Knowledge [68.7] ほとんどの多言語質問答えベンチマークは、取得した情報の地域的多様性を規定していない。
XNationQAには、9カ国の地理、文化、歴史に関する合計49,280の質問が7つの言語で提示されている。
我々はXNationQA上で8つの標準多言語LLMをベンチマークし、2つの新しい転送指標を用いて評価した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:41:34 GMT)
Transferring Linear Features Across Language Models With Model Stitching [65.7] 言語モデルの残差ストリーム間のアフィンマッピングは、モデル間で表現された特徴を転送するための安価な方法であることを示す。
小型モデルと大規模モデルは同様の表現空間を学習し、より小さなモデルでSAEなどの高価なコンポーネントをトレーニングし、FLOPの貯蓄でより大きなモデルに転送する動機付けをする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:08:13 GMT)
Audio Driven Real-Time Facial Animation for Social Telepresence [65.7] 最小遅延時間で3次元顔アバターをアニメーションするオーディオ駆動リアルタイムシステムを提案する。
我々のアプローチの中心は、音声信号をリアルタイムに潜在表情シーケンスに変換するエンコーダモデルである。
我々は、リアルタイムなパフォーマンスを達成しつつ、自然なコミュニケーションに必要な表情の豊富なスペクトルを捉えている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:10:39 GMT)
Reasoning by Superposition: A Theoretical Perspective on Chain of Continuous Thought [64.4] 連続CoTのD$ステップを持つ2層トランスが有向グラフ到達可能性問題を解くことができることを証明した。
我々の構成では、各連続思考ベクトルは複数の探索フロンティアを同時に符号化する重ね合わせ状態である。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:48:10 GMT)
Recent Trends in Distant Conversational Speech Recognition: A Review of CHiME-7 and 8 DASR Challenges [63.7] CHiME-7と8つの遠隔音声認識(DASR)の課題は、多チャンネル、一般化可能、共同自動音声認識(ASR)、対話音声のダイアリゼーションである。
本稿では,参加者からの重要傾向を分析しつつ,課題の設計,評価指標,データセット,ベースラインシステムについて概説する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:05:57 GMT)
Separate the Wheat from the Chaff: Winnowing Down Divergent Views in Retrieval Augmented Generation [61.5] WinnowRAGは、価値あるコンテンツを保持しながら、ノイズの多いドキュメントを体系的にフィルタリングするように設計されている。
WinnowRAGは2段階で動作する: ステージIでは、クエリ対応クラスタリングを行い、類似したドキュメントをグループ化し、異なるトピッククラスタを形成する。
ステージIIでは,批判的なLCMが複数のエージェントの出力を評価し,有用な文書をノイズのあるものから反復的に分離する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:08:13 GMT)
A Collectivist, Economic Perspective on AI [60.9] 情報技術は、データ収集と機械学習が人類の世界にかつてないほど影響を与えている革命の真っ最中にある。
この見解は、人間が社会的な動物であり、私たちの知性の多くは社会的・文化的起源であるという事実を無視している。
進路は単なるデータと計算ではなく、アルゴリズム設計のレベルでの計算と推論の概念と経済と社会の概念の徹底的な融合である。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:38:45 GMT)
Bootstrap Off-policy with World Model [59.1] ブートストラップループを通じて計画と非政治学習を緊密に統合するフレームワークであるBOOMを提案する。
BOOMは、トレーニングの安定性と最終的なパフォーマンスの両方において、最先端の結果を達成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:33:04 GMT)
Leveraging Hierarchical Image-Text Misalignment for Universal Fake Image Detection [58.9] 実画像と比較して,偽画像は対応するキャプションと適切に一致しないことを示す。
本稿では,視覚空間における画像テキストの不一致を識別的手がかりとして活用し,簡易かつ効果的なITEMを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:51:14 GMT)
MCP-Flow: Facilitating LLM Agents to Master Real-World, Diverse and Scaling MCP Tools [58.6] 大規模言語モデルは、複雑で現実的なタスクを実行するために、ますます外部ツールに依存しています。
既存のMSPリサーチは、少数のサーバーをカバーし、コストのかかる手作業によるキュレーションに依存し、トレーニングサポートが欠如している。
我々は大規模なサーバ発見、データ合成、モデルトレーニングのための自動Webエージェント駆動パイプラインであるMPP-Flowを紹介した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:07:32 GMT)
A Closer Look at Bias and Chain-of-Thought Faithfulness of Large (Vision) Language Models [58.3] 思考の連鎖(CoT)推論は、大きな言語モデルの性能を高める。
大規模視覚言語モデルにおけるCoT忠実度に関する最初の総合的研究について述べる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:22:45 GMT)
Adversarial Déjà Vu: Jailbreak Dictionary Learning for Stronger Generalization to Unseen Attacks [57.1] 新たなジェイルブレイクに対する防御は、AIの安全性にとって重要な課題である。
本稿では,目に見えないジェイルブレイクに対する堅牢性向上のための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 23:39:19 GMT)
The Curse of CoT: On the Limitations of Chain-of-Thought in In-Context Learning [56.6] CoT(Chain-of-Thought)プロンプトは,大規模言語モデル(LLM)における推論能力の向上によって広く認識されている。
我々は、CoTとその推論変異が、様々なモデルスケールやベンチマークの複雑さに対して、直接応答を一貫して過小評価していることを実証する。
パターンベースICLにおけるCoTの性能を駆動する明示的単純推論の基本的なハイブリッド機構を明らかにする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:44:43 GMT)
DTS: Enhancing Large Reasoning Models via Decoding Tree Sketching [55.0] 大規模推論モデル(LRMs)は、精度を低下させる、非常に長い連鎖のトレースを生成する。
本稿では,高エントロピートークンを分岐することで推論空間をスケッチするモデル非依存デコーディングフレームワークを提案する。
このアプローチは、追加のトレーニングや監督を必要とせず、効率と正確性を両立させる最適解を近似する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:41:28 GMT)
Is Risk-Sensitive Reinforcement Learning Properly Resolved? [54.0] 本稿では,RSRL問題に対するポリシー改善のための新しいアルゴリズムであるトラジェクトリQ-Learning(TQL)を提案する。
新たな学習アーキテクチャに基づいて,さまざまなリスク対応政策を学習するための,さまざまなリスク対策の汎用的かつ実践的な実装を自由に導入できる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:10:10 GMT)
Friend or Foe: How LLMs' Safety Mind Gets Fooled by Intent Shift Attack [53.3] 大きな言語モデル(LLM)は、印象的な機能にもかかわらず、ジェイルブレイク攻撃に対して脆弱なままである。
本稿では,攻撃意図について LLM を混乱させる ISA (Intent Shift Attack) を提案する。
私たちのアプローチでは、元の要求に対して最小限の編集しか必要とせず、自然で、可読性があり、一見無害なプロンプトをもたらす。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:44:42 GMT)
Exploring Effective Factors for Improving Visual In-Context Learning [53.1] In-Context Learning(ICL)は、いくつかのデモ(別名プロンプト)を通じて新しいタスクを理解し、モデルをチューニングせずに新しい入力を予測することである。
本稿では,視覚的文脈学習の推論性能に直接的な影響を及ぼす要因として,迅速な選択と迅速な融合があげられる。
視覚的インコンテキスト学習のためのシンプルなフレームワークプロンプトSelFを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:26:20 GMT)
HumanCrafter: Synergizing Generalizable Human Reconstruction and Semantic 3D Segmentation [51.3] 本研究では,1つの画像から外見と人間部分のセマンティクスをモデリングする統合的なフレームワークを提案する。
HumanCrafterは、3Dの人間の部分分割と1枚の画像からの3Dの人間の再構築の両方において、既存の最先端の手法を超越している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:29:36 GMT)
Reimagining Safety Alignment with An Image [49.3] 大きな言語モデル(LLM)は多様なアプリケーションで優れていますが、Jailbreak攻撃下で有害なコンテンツを生成し、良質なクエリを過剰に拒否する、という2つの課題に直面しています。
我々は,過度な拒絶を低減しつつ,セキュリティを向上させる最適化駆動型ビジュアルプロンプトフレームワークであるMagic Imageを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:27:07 GMT)
SViM3D: Stable Video Material Diffusion for Single Image 3D Generation [49.0] ビデオ拡散モデルは、1つの画像から3Dオブジェクトを効率的に再構成するのに成功している。
我々は,映像拡散モデルを拡張し,空間的に変化するPBRパラメータと表面正規度を,明示的なカメラ制御に基づいて各生成したビューと共同で出力する。
このユニークなセットアップにより、私たちのモデルをニューラルプリエントとして使用した3Dアセットのリライトと生成が可能になります。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:07:33 GMT)
REN: Fast and Efficient Region Encodings from Patch-Based Image Encoders [48.9] Region Network (REN) は、ポイントプロンプトを用いて領域ベースの画像表現を生成するための高速で効果的なモデルである。
RENは、リージョントークンを直接生成する軽量モジュールを使用して、このボトルネックをバイパスする。
これはいくつかのクロスアテンションブロックを使用し、ポイントプロンプトをクエリとして取り、パッチベースのイメージエンコーダからキーと値として機能してリージョントークンを生成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:47:43 GMT)
Cross-Validated Causal Inference: a Modern Method to Combine Experimental and Observational Data [48.7] 我々は、因果推論において実験データと観測データを統合するための新しい手法を開発した。
実験と観測の損失の重み付けを最小化することにより、因果パラメータを含む完全なモデルを得る。
実データおよび合成データを用いた実験により,本手法の有効性と信頼性が示された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:24:16 GMT)
Combinative Matching for Geometric Shape Assembly [47.1] 幾何形状の組立のためのインターロック部品を組み合わせた新しい形状マッチング手法を提案する。
本手法では,各領域の形状が同一に見えるが,各領域の体積が互いに逆空間を占有する領域間の対応性を確立する。
提案手法は、マッチングにおける局所的な曖昧さを著しく低減し、組立における部品の堅牢な組み合わせを可能にする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:51:00 GMT)
Enhancing Frequency Forgery Clues for Diffusion-Generated Image Detection [46.6] 拡散モデルは画像合成において顕著な成功を収めてきたが、生成した高品質な画像は潜在的に悪意のある使用に対する懸念を引き起こす。
既存の検出器は、様々なモデルや設定にまたがる差別的手がかりをつかむのに苦労することが多い。
周波数フォージェy Clue (F2C) を全周波数帯域で拡張することにより, 単純かつ効果的な表現を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:58:05 GMT)
Taxonomy-based Negative Sampling In Personalized Semantic Search for E-commerce [46.3] 本稿では,クエリや商品を共有ベクトル空間に埋め込んだeコマース検索のセマンティック検索モデルを提案する。
顧客の過去の購買履歴と行動をモデル化し,ユーザレベルのパーソナライゼーションを取り入れた。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:25:00 GMT)
Sherlock: Reliable and Efficient Agentic Workflow Execution [44.3] 大規模言語モデル(LLM)は、従来のアプリケーションを置き換える傾向にある。
あるステップにおける不正または部分的に正しい出力は、その後の段階を通じて伝播または増幅することができる。
すべてのステップを検証することは、大きなレイテンシとコストオーバーヘッドをもたらす。
提案手法であるSherlockは,エージェントの反実解析を用いて,エラー発生ノードを同定し,コスト最適検証器を選択的にアタッチする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:17:57 GMT)
Application of Langevin Dynamics to Advance the Quantum Natural Gradient Optimization Algorithm [43.2] 近年,変分量子回路の最適化のためのQNGアルゴリズムが提案されている。
モメンタムQNGは、変動パラメータ空間における局所的なミニマとプラトーを逃れるのにより効果的である。
強スピンガラス系におけるシェリントン・カークパトリックモデルにおいて、最良の結果が得られる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:59:20 GMT)
Auto-Search and Refinement: An Automated Framework for Gender Bias Mitigation in Large Language Models [43.2] 巨大なテキストコーパス上でのLLMの事前学習は、自然言語処理能力を高めるが、社会的バイアスを符号化するリスクを増大させる。
FaIRMakerは、Fairwordsを自動的に検索し、動的に洗練し、性バイアスを効果的に軽減することを示した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:20:02 GMT)
Learning an Efficient Optimizer via Hybrid-Policy Sub-Trajectory Balance [42.6] 生成モデリングの最近の進歩により、ニューラルネットワークは勾配に基づく最適化に頼ることなく重みを生成することができる。
Lo-Hpは分離された2段階の重み生成フレームワークで、様々な最適化ポリシーを学習することで柔軟性を向上させる。
本研究では,グローバルな最適重みの生成を促進しつつ,局所最適化のみの学習が長期的問題に対処できることを実証する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:08:28 GMT)
More Than A Shortcut: A Hyperbolic Approach To Early-Exit Networks [42.5] HypEEは、ハイパーボリックな空間でEE表現を学ぶ新しいフレームワークです。
我々はHypEEが標準のEuclidean EEベースラインを大幅に上回っていることを示す。
学習された幾何学はまた、不確実性の原則的な尺度を提供し、新しいトリガー機構を可能にする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:43:02 GMT)
EmbeddingGemma: Powerful and Lightweight Text Representations [42.3] EmbeddingGemmaはGemma 3言語ファミリに基づいた、新しい軽量でオープンなテキスト埋め込みモデルである。
スプレッドアウト正規化器を用いてモデル頑健性と表現性を向上する。
さらなる研究を促進するため、コミュニティに EmbeddingGemma をリリースします。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 23:38:27 GMT)
VisionCAD: An Integration-Free Radiology Copilot Framework [42.3] VisionCADはビジョンベースの放射線支援フレームワークである。
カメラシステムを使って、ディスプレイから直接医療画像をキャプチャする。
診断性能は従来のCADシステムに匹敵する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:29:50 GMT)
Unveiling the Quantum Toroidal Dipole [42.0] ナノ構造におけるTDの完全な量子力学的定式化について述べる。
直接測定のための最初の分光法を提案する。
これは明快な実験的な青写真を提供し、この明快な第3のマルチポールモーメントを公表し、測定し、特徴づける。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:57:26 GMT)
Listwise Preference Diffusion Optimization for User Behavior Trajectories Prediction [41.5] ユーザ行動軌跡予測(UBTP)を,長期ユーザの嗜好を明示的にモデル化するタスク設定として定式化する。
項目列全体に対して構造化された嗜好を直接最適化する拡散に基づくトレーニングフレームワークであるリスワイズ・ディフュージョン・最適化(LPDO)を導入する。
多段階の予測品質を厳密に評価するために、正確な軌跡合意を計測するタスク特異的な逐次マッチング(SeqMatch)を提案し、確率的忠実度を評価するパープレキシティ(PPL)を採用する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:16:24 GMT)
MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification [41.1] 我々は、協調学習と整合性正規化のパラダイムを擬似ラベルで組み合わせた、新しい半教師付き学習(SSL)アルゴリズムであるMultiMatchを紹介する。
コアとなるMultiMatchは、ヘッドアグリーメントとモデルの信頼性に基づいた擬似ラベルの選択とフィルタリングのために設計された擬似ラベル重み付けモジュールを備えている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:40:37 GMT)
OmniTrack++: Omnidirectional Multi-Object Tracking by Learning Large-FoV Trajectory Feedback [40.7] 本稿ではパノラマ画像におけるマルチオブジェクト追跡(MOT)について検討する。
MOTは、360deg Field of View (FoV)、解像度の希釈、厳密なビュー依存歪みなど、ユニークな課題を導入している。
360deg FoVでパノラマ歪み、大きな検索スペース、アイデンティティの曖昧さに対処するため、OmniTrack++はフィードバック駆動のフレームワークを採用している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:28:05 GMT)
PixelRefer: A Unified Framework for Spatio-Temporal Object Referring with Arbitrary Granularity [40.0] PixelReferは、統一された領域レベルのMLLMフレームワークで、ユーザが指定した領域についてより詳細な理解を可能にする。
解析の結果,グローバルな視覚トークンは主に初期のLCM層に寄与し,PixelRefer-Liteの設計を刺激していることがわかった。
微粒な命令チューニングを容易にするため,高品質なオブジェクト中心命令データセットであるPixelRefer-2.2Mをキュレートする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:38:13 GMT)
Scalable Autoregressive Image Generation with Mamba [38.8] 本稿では,マンバアーキテクチャに基づく自己回帰(AR)画像生成モデルであるAiMを紹介する。
Mamba(マンバ)は、線形時間による長周期モデリングに特有な性能を特徴とする、新しい状態空間モデルである。
パラメータ数は128Mから1.3Bまで様々である。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:26:53 GMT)
PPMI: Privacy-Preserving LLM Interaction with Socratic Chain-of-Thought Reasoning and Homomorphically Encrypted Vector Databases [38.4] 大規模言語モデル(LLM)は、カレンダー、メール、医療記録などの機密性の高いユーザーデータにアクセスするパーソナルエージェントとして、ますます使われるようになっている。
現在、ユーザはトレードオフに直面している。強力なが信頼できないLLMプロバイダにプライベートレコードを送信することで、露出リスクが増大する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:32:10 GMT)
Outlier-Aware Post-Training Quantization for Image Super-Resolution [36.4] QAT(quantization-aware training)やPTQ(post-training Quantization)といった量子化技術は、画像超解像(SR)ネットワークの推論加速に欠かせないものとなっている。
本稿では、各領域に独立に均一な量子化を適用し、ビット幅割り当てのバランスを改善するために、活性化を外れ値領域と高密度領域に分割する二重領域量子化戦略を提案する。
提案手法は,様々なSRネットワークやデータセットにまたがる既存のPTQ手法よりも優れており,少なくとも75スピードアップのシナリオではQAT手法に匹敵する性能を実現している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:49:33 GMT)
Through the River: Understanding the Benefit of Schedule-Free Methods for Language Model Training [35.8] 本研究では, 損失景観の「川」構造を, 崩壊相や補助平均化を伴わず, 効果的にナビゲート可能であることを示す。
本研究では,大きなバッチサイズにおいて,運動量の向上と性能向上を図ったSFの改良版を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:58:54 GMT)
RL Fine-Tuning Heals OOD Forgetting in SFT [35.0] スーパービジョン・ファインチューニングと強化学習の相乗効果の進化とメカニズムを考察する。
本研究は,2段階微調整におけるSFTとRLの役割を再同定し,特異ベクトルの回転を鍵機構として発見する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:50:29 GMT)
Targeted Distillation for Sentiment Analysis [34.3] 我々は、強力で一般化可能な感情分析機能を保持するコンパクトで実用的なモデルを構築している。
SentiBenchは総合的で体系的な感情分析ベンチマークで、12のデータセットにまたがるさまざまなタスクをカバーしています。
実験結果から,本手法は多様な感情分析タスクにおいて,コンパクトモデルの性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:38:42 GMT)
Realization of Trapped Ion Dynamics in the Strong-Field Regime and Non-Markovianity [33.8] 我々は、Rabi周波数(Omega)が振動モード周波数(nu)に近づくトラップイオンのダイナミクスを実験的に検討した。
量子状態トモグラフィーを用いて、密度行列を再構成し、その進化を追跡して非マルコビアン性を評価する。
本研究は,非マルコフ性,コヒーレント制御,および極端状態における開量子系の基本的な挙動を解明するために,トラップイオンプラットフォームを用いた経路を確立した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:22:39 GMT)
Comprehensive and Efficient Distillation for Lightweight Sentiment Analysis Models [33.2] 感情分析のための包括的で効率的な蒸留フレームワークCompEffDistを紹介する。
本フレームワークは属性ベースの自動命令構築と難易度ベースのデータフィルタリングという2つの重要なモジュールから構成される。
複数のモデルシリーズにまたがってメソッドを適用することで、3Bの学生モデルが、ほとんどのタスクにおいて20倍の大きな教師モデルの性能と一致させることができる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:14:44 GMT)
FedMGP: Personalized Federated Learning with Multi-Group Text-Visual Prompts [31.9] FedMGPは、視覚言語モデルにおけるパーソナライズされた即時学習のための新しいパラダイムである。
多様性の喪失は、各プロンプトグループに異なる相補的な意味的側面を専門化させるために導入された。
FedMGPはパーソナライゼーションとドメインの一般化の両方において、先行したアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:15:04 GMT)
Reject Only Critical Tokens: Pivot-Aware Speculative Decoding [31.2] 投機的復号(SD)は、出力がターゲットモデルの分布と正確に一致することを保証する。
提案するPivot-Aware Speculative Decodingは,最終的な出力の実用性低下につながるトークンのみを拒否する。
さまざまなデータセットにまたがってメソッドを評価し、同等のユーティリティで最大2.5タイムのスピードアップを達成できることを示します。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:35:10 GMT)
GreekBarBench: A Challenging Benchmark for Free-Text Legal Reasoning and Citations [31.1] ギリシャ・バーベンチは、ギリシャ・バーの試験と異なる5つの法分野の法的問題に関するLLMを評価するベンチマークである。
自由テキスト評価の課題に対処するために,LLM-as-a-judgeアプローチと組み合わせた3次元スコアリングシステムを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:51:34 GMT)
Diffusion Classifiers Understand Compositionality, but Conditions Apply [30.4] 本稿では,多種多様な構成課題における拡散分類器の識別能力について検討する。
具体的には,10のデータセットと30以上のタスクにまたがる3つの拡散モデル(SD 1.5,2.0,および3m)について検討する。
また,拡散モデル自身が生成した画像からなる新しい診断ベンチマークtextscSelf-Benchを導入する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:03:16 GMT)
Reasoning Beyond Language: A Comprehensive Survey on Latent Chain-of-Thought Reasoning [29.8] 大規模言語モデル(LLM)は、Chain-of-Thought(CoT)推論を通じて、複雑なタスクにおいて印象的なパフォーマンスを示している。
テクスチレントCoT推論には研究の関心が高まり、推論プロセスは潜在空間に埋め込まれている。
本稿では,このパラダイムの包括的概要を提示し,体系的な分類体系を確立することを目的とする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:41:11 GMT)
Reviving Stale Updates: Data-Free Knowledge Distillation for Asynchronous Federated Learning [29.0] Federated Learning (FL)は、生データを共有せずに、分散クライアント間で協調的なモデルトレーニングを可能にする。
AFL(Asynchronous Federated Learning)は、クライアントが独立して通信できるようにすることによってこの問題を軽減する。
我々は、データフリー知識蒸留(DFKD)を通じて古い更新を復活させる非同期FLフレームワークであるFedReviveを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:35:20 GMT)
Keep It Real: Challenges in Attacking Compression-Based Adversarial Purification [28.8] 再構築された画像における高いリアリズムは、攻撃の難しさを著しく増大させる。
現実的かつ高忠実な再構築を実現できる圧縮モデルが,我々の攻撃に対して極めて耐性があることを実証した。
この研究は、将来の敵対的攻撃の大きな障害を強調し、現実主義を克服するより効果的な技術を開発することが、総合的なセキュリティ評価にとって重要な課題であることを示唆している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:10:19 GMT)
SlideAgent: Hierarchical Agentic Framework for Multi-Page Visual Document Understanding [28.8] マルチモーダル,マルチページ,マルチスライダーの文書を理解するための汎用エージェントフレームワークであるSlideAgentを紹介する。
推論中、SlideAgentは多レベル推論のための特殊エージェントを選択的に活性化し、出力を一貫性のあるコンテキスト対応の回答に統合する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:48:18 GMT)
Instructing Large Language Models for Low-Resource Languages: A Systematic Study for Basque [28.7] ユーザ意図で言語モデルを教えるには、限られた言語セットでしか利用できない大規模な命令データセットが必要である。
対象言語におけるコーパス、既存のオープンウェイトな多言語ベースと指示されたバックボーンLLM、および指示されたバックボーンから合成された命令のみを利用できる低リソース言語に対する現実的なシナリオを仮定する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:20:17 GMT)
AdFair-CLIP: Adversarial Fair Contrastive Language-Image Pre-training for Chest X-rays [28.1] 本稿では,AdFair-CLIPについて紹介する。
我々は胸部X線(CXR)データセットの総合的な実験を行い、AdFair-CLIPは公平性と診断精度の両方を著しく向上させることを示した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:47:07 GMT)
Jarvis: Towards Personalized AI Assistant via Personal KV-Cache Retrieval [28.0] Jarvisは、パーソナルなKVキャッシュ検索を通じてパーソナライズされたAIアシスタントのための革新的なフレームワークである。
我々は、同じ画像パッチマイニングパイプラインで構築されたきめ細かいベンチマークを導入する。
Jarvis氏は、複数のデータセットにまたがる視覚的質問応答とテキストのみのタスクにおいて、最先端の結果を達成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:01:00 GMT)
Bayesian Network Structure Discovery Using Large Language Models [27.5] ベイジアンネットワーク構造発見のための統一的なフレームワークを提案する。
当社のフレームワークでは,データフリーとデータアウェア設定の両方をサポートする大規模言語モデル(LLM)を中心に置いています。
実験により,本手法は従来のLCM手法と従来のデータ駆動アルゴリズムの両方に優れていた。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:32:52 GMT)
H-NeiFi: Non-Invasive and Consensus-Efficient Multi-Agent Opinion Guidance [27.0] 既存のメソッドは、しばしばユーザービューを直接変更したり、グループ間の接続を強制する。
我々は階層的で非侵襲的な意見誘導フレームワークH-NeiFiを提案する。
実験の結果、H-NeiFiは専門家がいない場合でもコンセンサス速度を22.0%から30.7%増加させ、世界的な収束を維持していることがわかった。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:03:00 GMT)
DSpAST: Disentangled Representations for Spatial Audio Reasoning with Large Language Models [27.0] 大きな言語モデルによる空間オーディオの推論には、音響フロントエンドとしての空間オーディオエンコーダが必要である。
本研究では,空間音響のアンタングル表現を学習するSpatialASTに基づく新しいオーディオエンコーダであるDSpASTについて述べる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:57:08 GMT)
Word Salad Chopper: Reasoning Models Waste A Ton Of Decoding Budget On Useless Repetitions, Self-Knowingly [26.7] 大規模な推論モデル(LRM)は高コストの出力トークンによってボトルネックとなることが多い。
これらのトークンの大部分は,“ワードサラダ(word salad)”と呼ばれる,無駄な自己繰り返しであることを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:46:12 GMT)
Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime [26.5] アダムは深層学習の事実上のデファクトであるが、理論的な理解は限られている。
線形分離可能なデータに対するロジスティック回帰のために, インクリメンタルAdamの暗黙バイアス(ステップ毎に1つのサンプルを用いて)について検討した。
我々は、Adam が $ell_infty$-max-margin に確実に収束する構造化データセットのクラスを構築する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:55:48 GMT)
KVCOMM: Online Cross-context KV-cache Communication for Efficient LLM-based Multi-agent Systems [25.8] KVCOMMは、マルチエージェント推論における効率的なプリフィルを可能にする、トレーニング不要のフレームワークである。
KVCOMMはキャッシュされたサンプル終端アンカーのプールを参照することにより、共有コンテンツのKVキャッシュを推定し、調整する。
KVCOMMは多様なマルチエージェントワークロード間で70%以上の再利用率を達成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:26:24 GMT)
Joint Lossless Compression and Steganography for Medical Images via Large Language Models [25.5] 医用画像のための新しい非破壊圧縮・ステガノグラフィーフレームワークを提案する。
ビットプレーンスライシング(BPS)にインスパイアされて、医療画像にプライバシーメッセージを埋め込むことができる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:02:39 GMT)
GraphChain: Large Language Models for Large-scale Graph Analysis via Tool Chaining [25.4] GraphChainは、LLM(Large Language Models)が特殊なツールの動的シーケンスを通じて複雑なグラフを分析することを可能にするフレームワークである。
提案手法では,(1)プログレッシブグラフ蒸留(Progressive Graph Distillation),(2)情報圧縮とタスク関連性のバランスをとる最適化ツールシーケンスを生成する強化学習機構,(2)多彩なグラフトポロジに対するツール選択戦略を効率的に調整する構造対応テスト時間適応(Structure-aware Test-Time Adaptation)という2つの重要なイノベーションを紹介した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:47:05 GMT)
SOCRATES: Simulation Optimization with Correlated Replicas and Adaptive Trajectory Evaluations [25.2] SOCRATESは、調整されたSOアルゴリズムの設計を自動化する新しい2段階のプロシージャである。
実システムのデジタルレプリカのアンサンブルは、ベースラインSOアルゴリズムのセットを評価するテストベッドとして使用される。
LLMはメタ最適化器として機能し、これらのアルゴリズムのパフォーマンストラジェクトリを分析して、最終的なハイブリッド最適化スケジュールを反復的に修正し構成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:57:38 GMT)
GDROS: A Geometry-Guided Dense Registration Framework for Optical-SAR Images under Large Geometric Transformations [24.2] 我々はGDROSを提案する。GDROSはグローバルなクロスモーダル画像の相互作用を利用したジオメトリ誘導型密度登録フレームワークである。
まず、CNN-Transformerハイブリッド特徴抽出モジュールを用いて、光学画像とSAR画像からクロスモーダルな深度特徴を抽出する。
次に、予測された高密度光流場を幾何学的に制約する最小二乗回帰(LSR)モジュールを実装した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:40:34 GMT)
Outlier Gradient Analysis: Efficiently Identifying Detrimental Training Samples for Deep Learning Models [24.1] 本稿では,影響関数と外乱勾配検出による有害トレーニングサンプルの同定とを橋渡しする。
まず, 合成データセットにおける外乱勾配解析手法の仮説を検証した。
次に、視覚モデルにおける誤ラベルサンプルの検出と、自然言語処理トランスフォーマーモデルの性能向上のためのデータサンプル選択の有効性を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:54:52 GMT)
Ariadne: A Controllable Framework for Probing and Extending VLM Reasoning Boundaries [23.8] 多段階空間推論のための合成迷路を利用したフレームワークであるAriadneを紹介する。
我々は、この制御可能な環境を利用して、難易度を意識したカリキュラムにおいて、Reinforcement Learning with Verified Rewards(RLVR)を用いて視覚言語モデル(VLM)を訓練する。
驚くべきことに、VLMはRLVR後のトレーニングにおいて、ベースモデルが0%となる問題セットに対して50%以上の精度を達成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:19:41 GMT)
OneVision: An End-to-End Generative Framework for Multi-view E-commerce Vision Search [23.7] OneVisionは、視覚検索のためのエンドツーエンドの生成フレームワークである。
OneVisionは、視覚対応の残留量子化符号化であるVRQ上に構築されている。
オフライン評価では、OneVisionはオンラインMCAと同等に動作し、推論効率を21%向上させる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:20:55 GMT)
SegDebias: Test-Time Bias Mitigation for ViT-Based CLIP via Segmentation [23.6] 本稿では,ViTベースのCLIPモデルに対して,追加のトレーニングやバイアスアノテーションの仮定を必要としないテスト時デバイアス手法を提案する。
提案手法では,対象の視覚属性を抽出するために事前訓練されたセグメンテーションモデルを用いて,非対象領域を調整し,その埋め込みがすべてのクラス固有のテキストプロンプトと均一に類似するようにする。
WaterbirdsとCelebAの実験により、我々の手法は、グループロバストネスメトリクスと注意IoUの両方において、既存のテスト時間偏りのアプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:57:57 GMT)
Reasoning Planning for Language Models [23.5] 本稿では,コントラスト学習フレームワークであるEPICを紹介する。
EPICは、モデル推論能力とクエリメソッド互換性の両方をキャプチャする共有表現空間を学習する。
多様な数学的推論タスクの実験は、EPICが常に最適な推論方法を選択することを示している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:51:53 GMT)
CueBench: Advancing Unified Understanding of Context-Aware Video Anomalies in Real-World [23.5] 我々はCueBenchを紹介した。CueBenchは、コンテキスト対応ビデオ異常に特化しているBenchmarkの最初のものだ。
本稿では,認識,時間的接地,検出,予測など,さまざまな課題を伴うコンテキスト対応VAUの統一とベンチマークを提案する。
さらに,R1-style reinforcement fine-tuning に基づく Cue-R1 の開発を行った。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:29:35 GMT)
The Language of Interoception: Examining Embodiment and Emotion Through a Corpus of Body Part Mentions [23.3] 本論文は, 感情, 体感, 日常言語間の関係を, 自然言語データの大規模なサンプルで調査した最初の事例である。
オンライン英語テキスト(ブログ投稿とつぶやき)でボディ部分言及(BPM)のコーパスを作成しました。
BPMは個人的な物語やつぶやき(投稿の5%から10%はBPMを含む)で一般的であり、それらの利用パターンは時間や地域によって大きく異なります。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:28:58 GMT)
Robustifying Learning-Augmented Caching Efficiently without Compromising 1-Consistency [23.2] Guardは、学習強化されたキャッシュアルゴリズムのための軽量な堅牢化フレームワークである。
一貫性と堅牢性の間の最もよく知られたトレードオフを実現し、要求毎のオーバーヘッドはO(1)のみである。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:26:03 GMT)
Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering [22.7] 大規模言語モデル(LLM)は、推論時にプロンプト(コンテキスト内学習)と内部アクティベーション(アクティベーションステアリング)を通じて制御できる。
この研究は、LCM行動の即時およびアクティベーションに基づく制御の統一的な説明と、これらの介入の効果を実証的に予測するための方法論を提供する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:46:03 GMT)
G2: Guided Generation for Enhanced Output Diversity in LLMs [22.5] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる例外的な性能を示している。
LLMは出力の多様性に限界があり、しばしば複数の試行において非常に類似したコンテンツを生成する。
生成品質を維持しながら出力の多様性を高める訓練不要なプラグアンドプレイ方式であるガイド・ツー・ジェネレーション(G2)を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:13:28 GMT)
Generalized Category Discovery under Domain Shift: A Frequency Domain Perspective [22.3] Generalized Category Discovery (GCD)は、既知のカテゴリのラベル付きサンプルを非ラベルデータに活用することを目的としている。
既存の手法は標準条件下では目覚ましい結果を得たが、その性能は分散シフトの存在下で劣化することが多い。
本稿では,分布シフト下でのカテゴリ発見能力を高めるために,Genetextbfunderlineerized Cattextbfunderlineegory Discovtextbfunderlineery framework (FREE)を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:29:49 GMT)
Lattice Boltzmann Model for Learning Real-World Pixel Dynamicity [21.8] この研究は、視覚追跡のための実世界のピクセル動態を学習するためのLattice Boltzmann Model (LBM)を提案する。
LBMは動的ピクセル格子に視覚表現を分解し、衝突ストリームプロセスを通じて画素運動状態を解決する。
既存の手法と比較すると、LBMはオンラインおよびリアルタイムに実用的な適用性を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:04:57 GMT)
Tree Training: Accelerating Agentic LLMs Training via Shared Prefix Reuse [21.6] 本研究では,各接頭辞を1回だけ計算し,前後の両方の分岐で中間結果を再利用するパラダイムであるツリートレーニングを提案する。
複数のオープンソースモデルの実験では、総トレーニング時間を3.9倍に削減し、より効率的なLLM SFTおよびRLトレーニングを可能にした。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:56:49 GMT)
Sensitivity Analysis for Climate Science with Generative Flow Models [21.6] 感度分析は気候科学の基盤であり、嵐の強度から長期の気候フィードバックまでの現象を理解するのに不可欠である。
現代のAIベースの生成モデルは、評価が桁違い速くなっているが、それらを用いたコンピューティングの感度は、依然として大きなボトルネックとなっている。
本研究は、生成フローモデルにおける勾配の計算に随伴状態法を適用することにより、この問題に対処する。
本稿では,モデル自身の出力に対して計算された感度を定量的に評価するための,新しい勾配自己整合性チェックを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:57:01 GMT)
OSMGen: Highly Controllable Satellite Image Synthesis using OpenStreetMap Data [21.5] 我々は,生のOpenStreetMapデータから直接,リアルな衛星画像を生成する生成フレームワークであるOSMGenを紹介する。
フレームワークの中心的な特徴は、一貫した事前イメージペアを生成する能力である。
これにより、不足とクラス不均衡に対処するトレーニングデータを生成することができる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:05:29 GMT)
Multi-scale Latent Point Consistency Models for 3D Shape Generation [21.5] MLPCM(Multi-scale Latent Point Consistency Model)を提案する。
OurCMは遅延拡散フレームワークに従い、ポイントレベルからスーパーポイントレベルまで、階層的な潜在表現レベルを導入します。
また,前者を1ステップの発電機に圧縮する潜時整合モデルを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:46:02 GMT)
DRIP: Defending Prompt Injection via De-instruction Training and Residual Fusion Model Architecture [21.5] 大規模言語モデル(LLM)は、素晴らしい命令追従機能を示している。
モデルの中心的な脆弱性は、セマンティックロール理解の欠如にある。
本稿では,意味モデリングの観点からの訓練時間防衛であるDRIPを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:26:37 GMT)
Abstraction Alignment: Comparing Model-Learned and Human-Encoded Conceptual Relationships [21.2] モデル行動と形式的人間の知識を比較する手法である抽象的アライメントを導入する。
抽象化アライメントは、抽象グラフとしてドメイン固有の人間の知識を外部化する。
ユーザーは、モデルが学んだ人間の概念など、アライメント仮説をテストすることができる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:58:09 GMT)
Learning Repetition-Invariant Representations for Polymer Informatics [20.7] グラフ反復不変性(GRIN)は,グラフ表現における繰り返し単位の数に不変なポリマー表現を学習するための新しい手法である。
GRINはグラフベースの最大スパンニングツリーアライメントと繰り返しユニット拡張を統合し、構造的な一貫性を確保する。
ホモポリマーとコポリマーのベンチマークで最先端のベースラインを上回り、安定で反復不変な表現を学習し、目に見えない大きさのポリマー鎖に効果的に一般化する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:02:00 GMT)
LingGym: How Far Are LLMs from Thinking Like Field Linguists? [20.5] 本稿ではLingGymについて紹介する。LingGymはメタ言語推論のためのLLMの能力を評価する新しいベンチマークである。
制御された評価タスク:Word-Gloss Inferenceでは、モデルが文脈から欠落した単語と光沢を推測しなければならない。
その結果,構造化言語的手がかりを取り入れることで,全てのモデルにおける推論性能が一貫した改善が得られた。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:59:13 GMT)
Can Classic GNNs Be Strong Baselines for Graph-level Tasks? Simple Architectures Meet Excellence [20.3] グラフニューラルネットワーク(GNN)の未解決の可能性について,拡張フレームワークであるGNN+を用いて検討する。
GNN+フレームワークによって強化された3つの古典的GNNを14のグラフレベルデータセットで体系的に再評価する。
以上の結果から,これらの古典的GNNは,広く普及している信念とは対照的に,GTのパフォーマンスと一貫して一致しているか,上回っていることが明らかとなった。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:22:28 GMT)
Towards Robust Evaluation of STEM Education: Leveraging MLLMs in Project-Based Learning [20.1] プロジェクトベースラーニング(PBL)は、様々な高度に相関したマルチモーダルデータを含んでおり、STEM分野において重要な教育的アプローチとなっている。
MLLM(Multimodal large language model)の急速な発展に伴い、研究者は情報検索、知識理解、データ生成といったタスクを強化する可能性を探り始めた。
既存のベンチマークは、自由形式の出力構造と厳格な人間の専門家による検証プロセスの両方を提供することで不足しており、実際の教育タスクを評価する上での有効性を制限している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:29:22 GMT)
mmCooper: A Multi-agent Multi-stage Communication-efficient and Collaboration-robust Cooperative Perception Framework [19.7] mmCooperは、新しいマルチエージェント、マルチステージ、コミュニケーション効率、コラボロバストな協調認識フレームワークである。
本フレームワークはエージェント間の情報共有のための中間段階と後期段階の情報をバランスさせ,コミュニケーション効率を維持しつつ知覚性能を向上させる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:31:05 GMT)
Strict area law entanglement versus chirality [19.4] キラリティー(英: Chirality)は、非ゼロ熱伝導や電気伝導によって表される2つの空間次元における物質のギャップの位相である。
我々は、有限次元局所ヒルベルト空間における量子状態に対するそのようなキラリティを厳密な領域法則エントロピーで禁止する2つのノーゴー定理を証明した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:26:50 GMT)
Split Learning-Enabled Framework for Secure and Light-weight Internet of Medical Things Systems [19.2] 本稿では,イメージベース分類によるIoTマルウェア検出のためのスプリットラーニング(SL)に基づくフレームワークを提案する。
このフレームワークは、クライアントとエッジサーバ間のニューラルネットワークトレーニングを分割することにより、リソース制約のあるクライアントの計算負担を軽減する。
実験により,提案手法の精度 (+6.35%), F1スコア (+5.03%), 高収束速度 (+14.96%), 資源消費量 (33.83%) において, FL法よりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:40:10 GMT)
ERA-Solver: Error-Robust Adams Solver for Fast Sampling of Diffusion Probabilistic Models [19.1] 本稿では,拡散ODEの高速サンプリングのための誤差ローバストなAdams解法を提案する。
提案した解法は,任意の事前訓練された拡散モデルに直接適用することができる。
提案手法は,画像生成のためのFID(Frechet Inception Distance)を3.54,5.06,5.02,5.11とし,ネットワーク評価を行った。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:42:32 GMT)
Test-time Scaling of LLMs: A Survey from A Subproblem Structure Perspective [19.1] 問題がどのようにサブプロブレムに分解されるか、そしてこれらのサブプロブレムを共通のレンズで構成するかに焦点を当てる。
我々は,これらの手法の既存の分析を合成し,それぞれの長所と短所を強調し,今後の研究に向けての有望な方向性を概説して結論づける。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:41:23 GMT)
Targeted Attack Improves Protection against Unauthorized Diffusion Customization [19.1] 拡散モデルは画像生成の新たなマイルストーンを築き、公共の関心を喚起する。
カスタマイズのために、未許可の画像に微調整できる。
標的外攻撃を利用した現在の保護は、十分に効果がないように見える。
ターゲット攻撃の導入により、不正拡散のカスタマイズに対する保護をシンプルかつ効果的に行うことを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:12:26 GMT)
With Privacy, Size Matters: On the Importance of Dataset Size in Differentially Private Text Rewriting [18.6] 動的分割サイズを持つ大規模データセット上での試験を設計する。
プライバシーとユーティリティのトレードオフに対するデータセットサイズの増加の影響に注目します。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:41:05 GMT)
Distribution-aware Knowledge Unification and Association for Non-exemplar Lifelong Person Re-identification [18.6] 生涯人物再識別(LReID)は、古い知識の保存と新しい情報への適応のバランスをとるという重要な課題に遭遇する。
本稿では,これらの制約を克服するために,分散認識型知識統合・アソシエーション(DKUA)フレームワークを提案する。
実験の結果,DKUAは従来の手法よりも7.6%/5.3%,平均mAP/R@1の改善率および一般化能力に優れていた。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:28:51 GMT)
PrunedLoRA: Robust Gradient-Based structured pruning for Low-rank Adaptation in Fine-tuning [18.3] 低ランク適応(LoRA)は、大規模言語モデルのパラメータ効率の良い微調整のパラダイムとして広く使われている。
構造化プルーニングを利用して高代表性の高い低ランクアダプタを得る新しいフレームワークである textitPrunedLoRA を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:19:13 GMT)
FIPER: Factorized Features for Robust Image Super-Resolution and Compression [17.5] 低レベル視覚タスクに統一表現(Factized Features)を用いることを提案する。
これらのタスク間の共通原則によって動機付けられ、細かい画像の詳細を復元し保存する必要がある。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:51:33 GMT)
Tricks and Plug-ins for Gradient Boosting with Transformers [17.4] BoostTransformerは、サブグリッドトークンの選択と重要度の高いサンプリングを通じて、トランスフォーマーを強化します。
提案手法はトランスパイプラインに直接最小2乗推進目標を組み込むことで,より効率的なトレーニングと性能向上を実現している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:05:07 GMT)
Tricks and Plug-ins for Gradient Boosting in Image Classification [17.4] 本稿では,動的特徴選択とBoostCNNの原理を統合したCNN性能向上のための新しいフレームワークを提案する。
以上の結果から,従来のCNNよりも予測性能とトレーニング速度が優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:03:15 GMT)
LIR: The First Workshop on Late Interaction and Multi Vector Retrieval @ ECIR 2026 [17.1] ColBERTによって先駆けられた後期相互作用探索法は、単一ベクトルニューラルIRの強力な代替品として登場した。
それらは、特にドメイン外設定において、強力な一般化と堅牢性をもたらすことが実証されている。
最近では、推論ベースや相互モダリティ検索など、新しいユースケースに特に適していることが示されている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:21:33 GMT)
Grounding Surgical Action Triplets with Instrument Instance Segmentation: A Dataset and Target-Aware Fusion Approach [16.6] CholecTriplet-Segは3万以上の注釈付きフレームを含む大規模データセットで、アクション動詞と解剖学的ターゲットアノテーションと、楽器のインスタンスマスクをリンクし、強く監督されたインスタンスレベルの三重項グラウンドと評価のための最初のベンチマークを確立する。
また,Mask2Formerを拡張した新たなアーキテクチャであるTargetFusionNetを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:45:40 GMT)
IndicSentEval: How Effectively do Multilingual Transformer Models encode Linguistic Properties for Indic Languages? [16.5] Indic言語6言語における13の摂動にまたがる8つの言語特性の符号化能力とロバスト性について検討した。
表面, 構文, 意味的特性の探索解析により, ほぼすべての多言語モデルが英語における一貫した符号化性能を示した。
インデックス固有の多言語モデルは、普遍的モデルよりもインディック言語の言語特性を捉えている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:06:29 GMT)
Topic Analysis with Side Information: A Neural-Augmented LDA Approach [16.5] 本稿では,ニューラル先行機構を通じて側情報を組み込んだニューラル拡張確率的トピックモデルを提案する。
nnLDA は LDA と Dirichlet-Multinomial Regression を、トピックコヒーレンス、パープレキシティ、分布、下流分類において一貫して上回っている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:06:32 GMT)
EPARA: Parallelizing Categorized AI Inference in Edge Clouds [16.4] EPARAはエッジにおけるエンドツーエンドのAI並列推論フレームワークである。
EPARAは,1)タスクの並列モードを決定するタスク分類並列化アロケータ,2)特定の要求の計算を行う分散リクエストハンドラ,3)エッジクラウドにおけるサービス配置を定期的に更新する状態認識スケジューラの3つのコアコンポーネントから構成される。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:09:14 GMT)
Robust Atypical Mitosis Classification with DenseNet121: Stain-Aware Augmentation and Hybrid Loss for Domain Generalization [16.0] 筆者らはMIDOG 2025 (Track 2) 設定における非定型有糸分裂分類に適した DenseNet-121 ベースのフレームワークを提案する。
本手法は, クラス重み付き二元交叉エントロピーと焦点損失を併用したハイブリッド目的を用いて, ステンドアウェア拡張(マッケンコ), 幾何および強度変換, および重み付きサンプリングによる不均衡認識学習を統合する。
AdamWでエンドツーエンドにトレーニングされ、複数の独立したドメインで評価され、スキャナと染色シフトの下で強力な一般化が示され、バランスの取れた精度85.0%、AUROC 0.927、感度89.2%、そして公式テストセットの80.9%が達成された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:03:25 GMT)
A Survey on Cache Methods in Diffusion Models: Toward Efficient Multi-Modal Generation [15.7] 拡散モデルは、異常な生成品質と制御性のために、現代の生成AIの基盤となっている。
Diffusion Cachingは、トレーニングのない、アーキテクチャに依存しない、効率的な推論パラダイムを提供する。
計算機能レベルのクロスステップの再利用と層間スケジューリングを有効にすることにより、モデルパラメータを変更することなく削減できる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:49:20 GMT)
Covert Entanglement Generation and Secrecy [15.4] ノイズの多い量子チャネル上での絡み合い発生のカバート容量を決定する。
秘密は、送信された情報が敵にアクセスできないことを保証しますが、秘密の通信は送信自体が検出不可能であることを保証します。
秘密保持を伴わない古典的情報量と同一の秘密絡み発生率の達成可能性を確立する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:49:58 GMT)
Better Call CLAUSE: A Discrepancy Benchmark for Auditing LLMs Legal Reasoning Capabilities [15.4] CLAUSE は LLM の法的な推論の脆弱性を評価するために設計された第一種ベンチマークである。
我々の研究は、法的AIにおけるそのような推論失敗を特定し、修正する道筋を概説している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:51:21 GMT)
Neural Network Based Framework for Passive Intermodulation Cancellation in MIMO Systems [15.3] 本稿では, アンテナやサブキャリア間の非線形依存関係を効率的に捉えるために, 奥行き分離可能な畳み込みと拡張畳み込みを利用するPIMキャンセルのための軽量ディープラーニングフレームワークを提案する。
その結果,3次受動変調(PIM)の歪みを効果的に抑制し,最大29dBの平均電力誤差(APE)を111kのトレーニングパラメータで達成できることがわかった。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:37:29 GMT)
Dequantified Diffusion-Schr{ö}dinger Bridge for Density Ratio Estimation [15.1] 密度比の推定は$f$-divergencesを含むタスクの基本である。
我々は,textbfrobust, textbfstable, textbfefficient 密度比推定のための統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:15:53 GMT)
Issue-Oriented Agent-Based Framework for Automated Review Comment Generation [15.0] RevAgentは、コードレビューコメントのための新しいエージェントベースのイシュー指向フレームワークである。
タスクは生成、識別、訓練の3段階に分けられる。
最先端のPLMとLMベースのベースラインをはるかに上回っている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:44:11 GMT)
Fast Networks for High-Performance Distributed Trust [14.7] コラボレーション型データ分析とAIは、分散信頼のための現在の暗号化技術が提供できる以上のレベルのパフォーマンスを必要とする。
これは、組織が異なる信頼ドメインでソフトウェアを運用しているためであり、WANやパブリックインターネットを介して通信する必要がある。
LANの分散信頼フレームワークを慎重に再設計することで、LANを“非日常的に”使用するよりも、桁違いなパフォーマンスを達成できることが示される。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:10:13 GMT)
Toward Unifying Group Fairness Evaluation from a Sparsity Perspective [14.5] 本稿では,アルゴリズムの公平性を評価するための分散空間ベースのフレームワークを提案する。
このフレームワークは、既存の公正性基準と整合し、幅広い機械学習タスクに幅広い適用性を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:02:11 GMT)
THFlow: A Temporally Hierarchical Flow Matching Framework for 3D Peptide Design [14.4] 多モーダル時間的不整合問題は、低結合性生成ペプチドに寄与する重要な因子である。
本稿では,ペプチドの位置とコンフォーメーションの時間的階層を明示的にモデル化するフローベース生成モデルを提案する。
THFlowは、安定性、親和性、多様性に優れたペプチドを生成する既存の方法よりも優れている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:00:57 GMT)
4D Neural Voxel Splatting: Dynamic Scene Rendering with Voxelized Guassian Splatting [14.2] ボクセルをベースとした表現とニューラルガウススプラッティングを組み合わせた4Dニューラルボクセルスプラッティング(4D-NVS)を提案する。
本手法では,時間的ダイナミクスをモデル化するために,学習された変形場を備えたコンパクトな神経ボクセルを用いる。
実験により,本手法はメモリの大幅な削減とトレーニングの高速化により最先端の手法よりも優れており,より優れた視覚的忠実度を持つリアルタイムレンダリングを実現している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:49:42 GMT)
Editing Across Languages: A Survey of Multilingual Knowledge Editing [14.1] この調査は、MKE(Multilingual Knowledge Editing)に関する最近の研究を体系化する。
MKEは、事実編集が言語全体にわたって確実に一般化されることを保証することに焦点を当てたモデル編集のサブドメインである。
本稿では,パラメータベース,メモリベース,微調整,ハイパーネットワークアプローチを網羅したMKE手法の包括的分類法を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:42:04 GMT)
Lorica: A Synergistic Fine-Tuning Framework for Advancing Personalized Adversarial Robustness [14.0] モバイルデバイスは敵の攻撃に弱いままであり、モデルの堅牢性とセキュリティを脅かす。
textitLoricaは、カスタマイズされた防御モデルを提供する、パーソナライズされた相乗的対角訓練フレームワークである。
ベンチマークデータセットの実験では、 textitLorica が最大68$times$ の通信効率向上を実現可能であることが示されている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:02:25 GMT)
Beyond ImageNet: Understanding Cross-Dataset Robustness of Lightweight Vision Models [13.7] 本研究では,7つの異なるデータセットに対して,100時間周期でトレーニングした11個の軽量ビジョンモデル(2.5Mパラメータ)について,最初の体系的評価を行った。
我々は、様々な視覚領域にわたるモデルパフォーマンスの一貫性と堅牢性を定量化する統合メトリックであるクロスデータセットスコア(xScore)を紹介した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:40:06 GMT)
A Streaming Sparse Cholesky Method for Derivative-Informed Gaussian Process Surrogates Within Digital Twin Applications [13.5] デジタル双生児は、特定の物理的資産(または双生児)の挙動をモデル化する。
それらは高忠実度物理学に基づくモデルやサロゲートから構成される。
特定の物理双生児に適応するためには、デジタル双生児モデルは、その物理双生児のサービス内データを使用して更新する必要がある。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:20:28 GMT)
Penetrating the Hostile: Detecting DeFi Protocol Exploits through Cross-Contract Analysis [13.5] DeFi(Decentralized Finance)プロトコルは、ブロックチェーン上に開発された暗号通貨で、デジタル資産を管理する。
現在のツールは、悪意のあるイベント中に発生する可能性のある状態変化を分析して、コントラクトの潜在的な脆弱性を検出し、検出する。
本稿では,DeFiTailを提案する。DeFiTailは,アクセス制御とフラッシュローンのエクスプロイト検出にディープラーニング技術を利用する最初のフレームワークである。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:23:24 GMT)
Diverse Human Value Alignment for Large Language Models via Ethical Reasoning [13.4] 大規模言語モデル(LLM)は、異なる地域や文化にわたる多様な人間の価値と整合する必要がある。
現在のアライメントアプローチは、真の倫理的理解よりも表面的整合性をもたらす。
確立された倫理的意思決定モデルに触発されたLLMのための新しい倫理的推論パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:26:24 GMT)
Execution-Aware Program Reduction for WebAssembly via Record and Replay [13.4] 本稿では, RR-ReduceとHybrid-Reduceについて述べる。
RR-Reduceは、バグトリガ機能をターゲット関数として識別し、その機能をプログラムの他の部分から分離し、縮小されたプログラムを生成する。
RR-ReduceとHybrid-Reduceを28のWasmプログラムで評価し、3つのエンジンの様々なバグを発生させる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:37:26 GMT)
A DeepONet joint Neural Tangent Kernel Hybrid Framework for Physics-Informed Inverse Source Problems and Robust Image Reconstruction [13.3] 本研究では,Deep Operator Networks(DeepONet)とNeural Tangent Kernel(NTK)を統合し,複雑な逆問題の解法を提案する。
この方法は,Navier-Stokes方程式が支配するソースローカライゼーションや画像再構成といったタスクを効果的に処理し,非線形性,疎性,ノイズデータに関わる課題を克服する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:49:20 GMT)
Structurally Refined Graph Transformer for Multimodal Recommendation [13.3] 構造的に最適化されたマルチモーダルレコメンデーションモデルSRGFormerを提案する。
モデルへのより良い統合のためにトランスフォーマーを変更することで、ユーザの全体的な行動パターンをキャプチャします。
そして,マルチモーダル情報をハイパーグラフ構造に埋め込み,ユーザとアイテム間の局所構造を学習する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:18:00 GMT)
Federated Dialogue-Semantic Diffusion for Emotion Recognition under Incomplete Modalities [13.1] モダリティ回復のためのFedDISC(Federated Dialogue-guided and Semantic-Consistent Diffusion)フレームワークを提案する。
FedDISCは、クライアントで訓練されたモダリティ固有の拡散モデルの連合集約によって、モダリティ完全性への単一サイクル依存を克服する。
IEMOCAP、CMUMOSI、CMUMOSEIデータセットの実験は、FedDISCが様々な欠落したモダリティパターンに対して優れた感情分類性能を達成することを示した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:00:06 GMT)
Incivility and Rigidity: Evaluating the Risks of Fine-Tuning LLMs for Political Argumentation [12.7] Twitter(現在のX)やRedditなどのプラットフォームでのインキュビティは、AIシステムの開発を複雑にしている。
コントラストのある2つの政治談話データセットを微調整したtextitGPT-3.5 による実験を行った。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:20:38 GMT)
ToxicTextCLIP: Text-Based Poisoning and Backdoor Attacks on CLIP Pre-training [12.7] ToxicTextCLIPは,事前学習期間中に高品質なテキストを生成するためのフレームワークである。
このフレームワークは、2つの主要な課題に対処する。背景の不整合による意味的不整合と、背景一貫性テキストの不足である。
最大95.83%の毒殺、98.68%のバックドアHit@1、RoCLIP、CleanCLIP、SafeCLIPをバイパスする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:25:49 GMT)
Knolling Bot: Teaching Robots the Human Notion of Tidiness [12.6] そこで本研究では,家庭内ロボットにノーミングによる簡単な作業を行うアプローチを提案する。
クナッシング(Knewing)とは、散らばったアイテムを、きれいで空間効率の良いレイアウトに配置するプラクティスである。
この研究は、人間の美意識を内包し、私たちの生活空間で真に共同創造できるロボットを構築するための一歩である。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:45:48 GMT)
Recitation over Reasoning: How Cutting-Edge Language Models Can Fail on Elementary School-Level Reasoning Problems? [12.6] 既存の最先端LCMは, 極めて重篤なリサイクリング行動を示す。
条件の1つのフレーズを変更することで、OpenAI-o1やDeepSeek-R1といったトップモデルのパフォーマンスが60%低下する可能性がある。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:10:45 GMT)
Enhancing Heavy Rain Nowcasting with Multimodal Data: Integrating Radar and Satellite Observations [12.5] ドイツでは、2001年から2018年にかけての1時間にわたる大雨の17.3%しか降雨量計によって記録されていない。
レーダーデータも 進行中の降水量を追跡する
本研究では,レーダ画像と衛星画像を組み合わせて,5,15,30分間の降水量の予測を行うマルチモーダル流速モデルを構築した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:47:07 GMT)
DMol: A Highly Efficient and Chemical Motif-Preserving Molecule Generation Platform [12.4] DMolと呼ばれる小分子生成のための新しいグラフ拡散モデルを提案する。
最先端のDiGressモデルよりも、すべてのベンチマークデータセットで約1.5%向上している。
拡散ステップの数を少なくとも10倍に減らし、走行時間を約半分に短縮する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:24:58 GMT)
OpinioRAG: Towards Generating User-Centric Opinion Highlights from Large-scale Online Reviews [12.3] 本稿では,大量のユーザレビューから得られた意見ハイライトの問題点について考察する。
既存のメソッドはスケールアップに失敗するか、パーソナライズされたニーズを見落としている汎用的で一大の要約を生成するかのいずれかです。
本稿では,RAGに基づくエビデンス検索とLCMを組み合わせた拡張性のあるトレーニングフリーフレームワークであるOpinioRAGを紹介する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:48:15 GMT)
FlashEVA: Accelerating LLM inference via Efficient Attention [12.2] FlashEVAはEVA(制御変数による効率的な注意)の効率的な実装である
提案手法では, 1.5Bのトークンしか持たないトランスフォーマーモデルの微調整が可能であり, ダウンストリームタスク間で有効性を保っている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:38:57 GMT)
PolyG: Adaptive Graph Traversal for Diverse GraphRAG Questions [12.1] 知識グラフ質問の基本パターンを分類するために,完全4クラス分類法を提案する。
次に、グラフの包括的な集合を含む新しいグラフRAGベンチマークであるPolyBenchを作成します。
提案する質問分類法に基づき,質問を分解・分類し,適応的なグラフRAG手法であるPolyGを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:15:26 GMT)
Recognising, Anticipating, and Mitigating LLM Pollution of Online Behavioural Research [12.0] LLM汚染がオンライン行動研究を脅かす3つの相互作用型を同定する。
本稿では,研究者の実践,プラットフォームアカウンタビリティ,コミュニティ活動にまたがる多層応答を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:45:45 GMT)
Wisdom is Knowing What not to Say: Hallucination-Free LLMs Unlearning via Attention Shifting [11.7] 選択的アンラーニングのためのAttention-Shifting(AS)フレームワークを導入する。
ASは,(1)LLMの言語構造を損なうことなく,事実を含むトークンへの注意を弱める文脈保存抑制,(2)未学習コンテンツについて問い合わせたときの完成度を損なう幻覚耐性応答の2つの設計目標によって駆動される。
実験の結果、ASは最先端の未学習手法よりも性能を向上し、ToFUベンチマークでは最大15%、TDECベンチマークでは10%の精度を達成し、競合する幻覚のない未学習の有効性を維持した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:49:29 GMT)
A Big Step Forward? A User-Centric Examination of iOS App Privacy Report and Enhancements [11.5] AppleはiOS 15.2以降,アプリのデータアクセスと共有に関する詳細な洞察をユーザに通知する新機能として,App Privacy Reportを導入した。
この機能は、ユーザープライバシの大きな進歩として売り出されてきたが、実際のユーザーのプライバシとコントロールに対する影響は、まだ検討されていない。
この作業は、ユーザのプライバシーの透明性を高めるための実践的な洞察を提供する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:29:04 GMT)
Is Grokking a Computational Glass Relaxation? [11.3] トレーニング性能がほぼ完璧に到達した後,ニューラルネットワークが突然一般化するグラッキング現象について検討する。
グラッキングの記憶-一般化遷移におけるNOエントロピー障壁は、グラキングを一階相転移と定義する以前の理論に挑戦する。
グラッキングの非平衡な性質に触発され、ワンランダウ分子動力学に基づくおもちゃのWanDを開発し、グラッキングを制約なく排除し、高ノルム一般化解を求めることができる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:02:19 GMT)
Text-guided Fine-Grained Video Anomaly Detection [11.3] ビデオ異常検出(VAD)は、ビデオセグメント内の異常事象を特定することを目的としている。
従来のVADは、通常または異常として限られた出力を提供する。
我々は,LVLM(Large Vision-Language Model)に基づくフレームワークであるT-VAD(Text-Guided Fine-Grained Video Anomaly Detection)を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:59:23 GMT)
EP-HDC: Hyperdimensional Computing with Encrypted Parameters for High-Throughput Privacy-Preserving Inference [11.1] ホモモルフィック暗号化(HE)は強力なプライバシ保護を提供するが、計算コストが高いため、単純なタスクに制限されている。
最近、HEに適用された超次元コンピューティング(HDC)は、プライバシー保護機械学習(PPML)に有望な性能を示した。
本稿では,クライアント側HEを特徴とする新しいPPML手法であるEP-HDCを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 23:22:01 GMT)
InputDSA: Demixing then Comparing Recurrent and Externally Driven Dynamics [11.1] 入力DSA(iDSA)という,内在性(再帰性)と入力駆動性(input-driven dynamics)を比較するための新しい指標を提案する。
入力DSAは、ノイズの多いデータから部分的に観測された入力駆動システムと比較できることを示す。
本稿では,Deep Reinforcement LearningでトレーニングしたリカレントニューラルネットワークにInputDSAを適用し,ハイパフォーマンスネットワークが動的に類似しているのに対して,低パフォーマンスネットワークはより多様であることを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:34:13 GMT)
HIP-LLM: A Hierarchical Imprecise Probability Approach to Reliability Assessment of Large Language Models [10.9] 大規模言語モデル(LLM)は、様々な領域にまたがって展開され、厳格な信頼性評価方法の必要性が高まっている。
本稿では,LLMの信頼性をモデル化・推定するための階層的不整合確率フレームワークであるHIP-LLMを紹介する。
複数のベンチマークデータセットの実験により、HIP-LLMは既存のベンチマークや最先端アプローチよりも正確で標準化された信頼性特性を提供することが示された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:04:30 GMT)
Deep Learning Approach to Anomaly Detection in Enterprise ETL Processes with Autoencoders [10.8] この研究はまず、遅延、欠落した値、重複ロード、突然の異常な変化など、プロセス内の複数のタイプの異常を分析します。
手法設計では,エンコーダ・デコーダ構造は高次元の入力を潜在表現に圧縮して再構成し,再構成誤差を用いて異常レベルを測定する。
その結果、ディープオートエンコーダに基づく検出機構は、企業レベルのデータストリームにおける遅延分布パターンを効果的にキャプチャできることを示した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:06:26 GMT)
Data Analysis and Performance Evaluation of Simulation Deduction Based on LLMs [10.4] シミュレーション推論のデータ解析と性能評価は、現代の戦争において重要な役割を担っている。
従来の手動分析手法は時間を要するものであり、人間のエラーによって制限される。
本稿では,まず複雑なタスクを複数のサブタスクに分解し,効果的なシステムプロンプトを設計する手法を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:32:33 GMT)
AI-Generated Video Detection via Perceptual Straightening [10.2] 本稿では,AI生成ビデオと自然を区別する新しい手法であるReStraVを提案する。
知覚的直交」仮説に着想を得て、モデルの表現領域における時間的曲率と段階的距離を定量化する。
我々の分析によると、AI生成ビデオは実際のビデオと比べて、曲率と距離のパターンがかなり異なる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:33:06 GMT)
Zero-knowledge LLM hallucination detection and mitigation through fine-grained cross-model consistency [10.1] 大規模言語モデル(LLM)は、様々なタスクにまたがる印象的な能力を示してきたが、幻覚(幻覚)の影響を受けにくい。
Finch-Zkは、細粒度のクロスモデル一貫性を利用して幻覚を検知・緩和するブラックボックスフレームワークである。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:07:12 GMT)
TESGNN: Temporal Equivariant Scene Graph Neural Networks for Efficient and Robust Multi-View 3D Scene Understanding [9.7] 本稿では,2つの鍵成分からなる時変Scene Graph Neural Network (TESGNN)を提案する。
ESGNNは、3次元点雲から情報を抽出し、重要な対称性特性を保持しながらシーングラフを生成する。
対称性保存特性を活用することにより,より安定かつ正確なグローバルシーン表現が得られることを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:16:46 GMT)
Space Object Detection using Multi-frame Temporal Trajectory Completion Method [9.4] 静止地球軌道(GEO)における宇宙物体は、光学画像において重要な検出課題を呈している。
ウェーブレット変換により1フレームレベルの背景雑音を抑えながらGEOターゲットの高周波特性を向上する。
欠落検出と誤検出を効果的に軽減するため、時間的マッチングと完了、時間的一貫性に基づくノイズフィルタリング、進行軌道改善を含む一連の重要なステップを設計する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:59:06 GMT)
Quantum Machine Unlearning: Foundations, Mechanisms, and Taxonomy [9.3] 量子マシン・アンラーニングは、計算と信頼できる人工知能をプライバシ保存する量子情報理論の交差において、基礎的な課題として浮上している。
本稿では、検証可能なパラダイム内で、物理的制約のアルゴリズム機構と倫理的ガバナンスを統一する形式的な枠組みを確立することにより、QMUを推し進める。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:11:40 GMT)
Balancing Caregiving and Self-Care: Exploring Mental Health Needs of Alzheimer's and Dementia Caregivers [9.3] アルツハイマー病(英語: Alzheimer's Disease and Related Dementias、AD/ADRD)は、記憶、思考過程、機能に障害がある進行性神経変性疾患である。
AD/ADRD患者の家族介護者は、長期的な介護責任のため、大きなメンタルヘルス上の課題に直面している。
本研究は,介護者の精神的健康への懸念を調査し,介護者の負担管理の実践に焦点をあてた。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:00:01 GMT)
A Study in Dataset Distillation for Image Super-Resolution [9.2] 蒸留されたデータセットは、元のサイズの8.88%しか占めていないが、完全なデータセットでトレーニングされたデータセットとほぼ同じ復元忠実性を保持するSRモデルを訓練できることが示される。
本研究は, SRデータセット蒸留の可能性を明らかにするとともに, メモリおよび計算効率の高い生成復元モデルの基礎的知見を確立することを目的とした。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:04:05 GMT)
STACKFEED: Structured Textual Actor-Critic Knowledge Base Editing with FeedBack [9.2] FEED(英: Structured Textual Actor-Critic Knowledge base editing with FEEDback approach)は、構造化テキストアクター・クリティカルな知識ベースの編集である。
FEEDは、専門家のフィードバックに基づいて知識ベースを洗練し、マルチアクタ、集中型批評家強化学習フレームワークを使用する。
FEEDはRAGシステムの品質と性能を大幅に改善する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:17:52 GMT)
MIFO: Learning and Synthesizing Multi-Instance from One Image [9.1] 本稿では,単一画像からの高精度な学習法とマルチインスタンスセマンティクスを提案する。
学習段階における類似意味論を解消するためのペナルティに基づくアテンション最適化を提案する。
この合成では,注意層におけるボックス制御を導入,最適化し,セマンティックリークを緩和する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:01:30 GMT)
OpenFACADES: An Open Framework for Architectural Caption and Attribute Data Enrichment via Street View Imagery [9.1] この研究は,クラウドソースデータを活用したオープンなフレームワークであるOpenFACADESを導入して,そのギャップを埋めるものである。
パノラマ画像におけるファサードの自動検出と、オブジェクトを全体的視点のビューに変換するための再投影アプローチの調整を行う。
第3に、マルチ属性予測とオープン語彙キャプションのためのオープンソースの大規模視覚言語モデル(VLM)の機能を活用し、検討する革新的なアプローチを導入する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:54:52 GMT)
From Framework to Practice: Designing a Real-World Telehealth Application for Palliative Care [9.1] 本稿では, 緩和テレヘルス能力(ETHC)に着目した緩和ケア用ソフトウェアアプリケーションを設計する手法について述べる。
我々の社会技術設計フレームワークは、安全で公平でレジリエントなデジタルヘルスアプリケーションを作成することに成功しました。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:14:25 GMT)
Towards Immersive Mixed Reality Street Play: Understanding Co-located Bodily Play with See-through Head-mounted Displays in Public Spaces [8.9] 我々は,Immersive Mixed Reality Street Play(IMRSP)の社会的意味,課題,機会,デザインレコメンデーションについて検討する。
マルチプレイヤーOmnipresent Fighting Arena (MOFA) は, 様々な公共施設に展開している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:22:31 GMT)
Investigating Label Bias and Representational Sources of Age-Related Disparities in Medical Segmentation [8.8] 医療画像におけるアルゴリズムバイアスは、健康格差を持続させる。
乳がんセグメンテーションでは、モデルが若年者に対して大きなパフォーマンス格差を示す。
本研究は,医学的セグメンテーションにおけるアルゴリズムバイアスの診断のための体系的枠組みを導入する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:06:30 GMT)
Interpreting the Latent Structure of Operator Precedence in Language Models [8.7] 大きな言語モデル(LLM)は印象的な推論能力を示しているが、算術的なタスクに苦戦し続けている。
LLMは,LLaMA 3.2-3Bモデルを用いて,内部表現に先行する演算子を符号化するかどうかを検討する。
本稿では,演算子間で高インパクトな埋め込み次元を交換することにより,演算子優先性を変更する手法である部分埋め込みを導入する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:04:45 GMT)
A CPU-Centric Perspective on Agentic AI [8.4] Agentic AIフレームワークは、Web検索、Pythonインタプリタ、コンテキストデータベースなど、外部ツールに埋め込まれた意思決定オーケストレータを追加する。
本稿では,エージェントAIワークロードが導入するシステムのボトルネックをCPU中心の観点から特徴づけ,理解することを目的とする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 23:46:44 GMT)
Free Draft-and-Verification: Toward Lossless Parallel Decoding for Diffusion Large Language Models [8.4] 本稿では,DLLMに適した高速デコードアルゴリズムFree Draft-and-Verification(FreeDave)を紹介する。
FreeDaveは、パフォーマンスを低下させることなく、推論スループットを最大3.78倍に向上させることが証明されている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 23:45:41 GMT)
Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers [8.0] 著者のスタイルをエミュレートしながら、フロンティアAIモデルが高品質な文学テキストを生成できるかどうかは不明だ。
MFAの訓練を受けたエキスパートライターと、ChatGPT、Claude、Geminiの3つのフロンティアAIモデルを比較する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:29:36 GMT)
LLM Strategic Reasoning: Agentic Study through Behavioral Game Theory [7.9] 本研究では,行動ゲーム理論に基づく評価フレームワークを導入する。
実験の結果,GPT-o3-mini,GPT-o1,DeepSeek-R1がほとんどのゲームを支配しているが,モデルスケールだけでは性能を判断できないことがわかった。
拡張の促進に関して、CoT(Chain-of-Thought)の促進は、特定のレベルのモデルに対してのみ戦略的推論を増大させ、他の場所では限定的な利得を提供するため、普遍的に効果的ではない。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:42:55 GMT)
A Low-Resolution Image is Worth 1x1 Words: Enabling Fine Image Super-Resolution with Transformers and TaylorShift [7.8] TaylorIRは1x1パッチの埋め込みを真にピクセルワイドな推論のために強制するプラグイン・アンド・プレイのフレームワークである。
最先端のパフォーマンスを提供し、メモリ消費を最大60%削減する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:57:49 GMT)
PolyRecommender: A Multimodal Recommendation System for Polymer Discovery [7.7] PolyRecommenderは、PolyBERTからの化学言語表現とグラフエンコーダからの分子グラフベースの表現を統合するフレームワークである。
我々の研究は、次世代高分子の発見のためのAI誘導設計を推進し、一般化可能なマルチモーダルパラダイムを確立する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:13:56 GMT)
AgentGit: A Version Control Framework for Reliable and Scalable LLM-Powered Multi-Agent Systems [7.4] AgentGitはGitライクなロールバックとブランチをマルチエージェントシステム(MAS)にもたらすフレームワークです。
AgentGitは冗長、ランタイム、トークンの使用を著しく削減し、複数のブランチをまたいだ並列探索をサポートしています。
この作業は、より堅牢なMAS設計への実践的なパスを提供し、コラボレーティブAIシステムにおけるエラー回復、安全な探索、計算、A/Bテストを可能にする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:11:31 GMT)
Nirvana AI Governance: How AI Policymaking Is Committing Three Old Fallacies [7.4] 私は現在のAI規制提案の根本的な欠陥を明らかにします。
一部のコメンテーターは、人々は機械よりも信頼性が高いと直感的に信じている。
一部の政策立案者や研究者は、損害とコストが彼らの提案に固有のものであるという事実に気付いていない。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:28:50 GMT)
QCoder Benchmark: Bridging Language Generation and Quantum Hardware through Simulator-Based Feedback [7.4] 本稿では,大規模言語モデル(LLM)を量子プログラミングで評価する評価フレームワークであるQCoder Benchmarkを紹介する。
提案ベンチマークは,従来のPython実行以上の量子シミュレータ環境による評価をサポートする。
GPT-4oのような先進的なモデルでさえ18.97%の精度しか達成せず、ベンチマークの難しさを強調している。
対照的に、o3のような推論ベースのモデルは78%の精度に達し、人間の書いたコードの平均成功率を上回っている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:02:22 GMT)
\texttt{ReMind}: Understanding Deductive Code Reasoning in LLMs [6.9] 大規模言語モデル(LLM)は、コード関連のタスクにおいて顕著な進歩を遂げた。
彼らはまだ、プログラム実行プロセスについて推論する能力である暗黙のコード推論に苦戦しています。
textttReMindは,textttMutator, textttExecutor, textttInspectorで構成されるマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:42:40 GMT)
SonarSweep: Fusing Sonar and Vision for Robust 3D Reconstruction via Plane Sweeping [6.8] 3次元再構成への単一モダリティアプローチは、視認性や幾何学的制約が低いために失敗する。
それまでの融合技術は、欠陥のある幾何学に依存しており、重要なアーティファクトと複雑なシーンをモデル化することができない。
本稿では,これらの制約を克服する新しいエンドツーエンドディープラーニングフレームワークであるSonarSweepを紹介する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:12:27 GMT)
Why Federated Optimization Fails to Achieve Perfect Fitting? A Theoretical Perspective on Client-Side Optima [6.8] 本稿は、なぜこのような劣化が起こるのかを説明する理論的な視点を提供する。
異種クライアントデータが異なる局所最適化につながるという仮定を導入する。
この仮定は,1) クライアントの局所的最適距離が,全クライアントデータの完全整合性を高めること,2) 最終訓練段階では,グローバルモデルが単一最適値に収束する代わりに領域内で振動し,データを完全に整合する能力を制限すること,の2つの重要な結果を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:31:35 GMT)
Adversarial Distilled Retrieval-Augmented Guarding Model for Online Malicious Intent Detection [6.7] ADRAGは、堅牢で効率的なオンライン悪意のある意図検出のための2段階のフレームワークである。
リアルタイムアプリケーションでは、毎秒300クエリで最大5.6倍のレイテンシを提供する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:50:23 GMT)
Exploring Large Language Models for Detecting Mental Disorders [6.5] 本稿では、抑うつや不安を検知するタスクにおける機械学習手法、エンコーダベースモデル、および大規模言語モデル(LLM)の有効性を比較した。
我々は、言語的特徴に基づくAutoMLモデル、BERTのようなエンコーダベースのトランスフォーマーのバリエーション、そして病理分類モデルとして最先端のLCMを試験した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:27:50 GMT)
Filtered Neural Galerkin model reduction schemes for efficient propagation of initial condition uncertainties in digital twins [6.4] ディジタルツインの不確実性は、利用可能なデータを超えた信頼性と信頼性のある予測を可能にするために重要である。
還元解分布の平均と共分散を時間的に改善する還元型モデリング手法を提案する。
フィルタされたニューラルガレルキンスキームは,アンサンブルに基づく不確実性伝播に比べて1桁以上の高速化を実現する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:21:42 GMT)
What Features in Prompts Jailbreak LLMs? Investigating the Mechanisms Behind Attacks [6.4] 本研究では,35種類の攻撃方法にまたがる10,800件のジェイルブレイク試行からなる新しいデータセットを提案する。
我々は、脱獄の成功を予測するために、オープンウェイトLLMの隠れ状態に関する線形および非線形プローブを訓練する。
因果関係を確立するために、予測方向のコンプライアンスを体系的にシフトするプローブ誘導潜時介入を構築した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:40:30 GMT)
Language Native Lightly Structured Databases for Large Language Model Driven Composite Materials Research [6.3] 材料の準備手順は、しばしば実験的なプロトコル、研究論文、特許、実験ノートに物語的に埋め込まれる。
我々はこの課題を,テキストファーストで軽量に構造化された材料データベースを中心としたフレームワークを通じて,テキスト推論問題に再構築する。
LLMに基づく推論と言語固有のデータが組み合わさることで,実用的材料準備が大幅に促進されることを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:07:08 GMT)
Efficiency vs. Alignment: Investigating Safety and Fairness Risks in Parameter-Efficient Fine-Tuning of LLMs [6.3] 微調整技術は安全性と公正性に異なる影響を及ぼす可能性がある。
アダプタベースのアプローチでは安全性のスコアが向上する傾向があり、公平性に対して最も破壊的ではない。
Prompt-Tuning と P-Tuning は一般に安全性を低下させ、より大きな公正性回帰を引き起こす。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:29:56 GMT)
Schrödinger Bridge Matching for Tree-Structured Costs and Entropic Wasserstein Barycentres [6.2] フローベース生成モデリングの最近の進歩は、分布間のSchr"odinger Bridge (SB) を計算するためのスケーラブルな方法を提供している。
従来のIPF(Iterative Proportional Fitting)法よりも多くの特性を持つエレガントで実践的なアプローチを提案する。
得られたアルゴリズムは、ツリーベースの設定でIPFアプローチよりもIMFの多くの利点を継承する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:43:29 GMT)
Evolve to Inspire: Novelty Search for Diverse Image Generation [6.0] WANDERは1つの入力プロンプトから多様な画像を生成する新しい検索手法である。
多様な画像集合のセマンティック進化にLarge Language Model(LLM)を用い,CLIP埋め込みを用いて新規性を定量化する。
さらに、エミッタを適用して、プロンプト空間の異なる領域への探索を誘導し、生成した画像の多様性を高めることを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:58:07 GMT)
Unpacking Personal(?!) Health Informatics for Proactive Collective Care in India [6.0] パーソナライズ・ヘルス・インフォマティクス(PHI)は,インドにおける集団ケアの監視と実現に有用である。
しかし、その採用は、低い健康と技術リテラシー、ユーザビリティと統合の問題、断片的でコストのかかる技術エコシステム、デジタルヘルスプラットフォームへの不信によって制限されている。
本稿では,フィグマプロトタイプの設計と評価を通じて,包括的ケアのための統合プラットフォームのための文化的基盤設計ビジョンを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:31:52 GMT)
Robust Single-Agent Reinforcement Learning for Regional Traffic Signal Control Under Demand Fluctuations [5.8] 交通渋滞は、主に交差点の待ち行列によって引き起こされ、都市生活水準、安全性、環境品質、経済効率に大きな影響を及ぼす。
本研究では,地域適応型TSCのための新しい単エージェント強化学習フレームワークを提案する。
このフレームワークは堅牢な反ゆらぎ能力を示し、待ち時間を大幅に短縮する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:18:50 GMT)
Privacy-Aware Time Series Synthesis via Public Knowledge Distillation [5.5] Pub2Privは、異種公共知識を活用することで、プライベート時系列データを生成する新しいフレームワークである。
我々のモデルは、公開データを時間的・機能的な埋め込みにエンコードする自己認識機構を採用している。
合成データの識別可能性を評価することにより、プライバシーを評価するための実用的な指標を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:44:24 GMT)
Diagnosing Hallucination Risk in AI Surgical Decision-Support: A Sequential Framework for Sequential Validation [5.5] 大言語モデル (LLMs) は脊椎手術における臨床的決定支援の転換的可能性を提供する。
LLMは幻覚を通じて重大なリスクを引き起こすが、これは事実的に矛盾しているか、文脈的に不一致な出力である。
本研究は, 診断精度, 推奨品質, 推理堅牢性, 出力コヒーレンス, 知識アライメントを評価することによって, 幻覚リスクを定量化するための臨床中心の枠組みを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:25:55 GMT)
Per-Row Activation Counting on Real Hardware: Demystifying Performance Overheads [5.5] Per-Row Activation Counting (PRAC) はキーDRAMのタイミングパラメータを変更する。
PRACはシミュレーターベースの研究でかなりの性能上のオーバーヘッドを引き起こしたと伝えられている。
PRACの最初の実機性能解析について述べる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:15:58 GMT)
Style-Aware Blending and Prototype-Based Cross-Contrast Consistency for Semi-Supervised Medical Image Segmentation [5.4] スタイル認識型ブレンディングとプロトタイプベースのクロスコントラスト一貫性学習フレームワークを提案する。
ラベル付きデータとラベルなしデータの分散ミスマッチが統計的モーメントによって特徴付けられるという経験的観察から着想を得て,我々はスタイル誘導型分散混合モジュールを設計した。
強い擬似ラベルの潜在的なノイズを考慮すると,プロトタイプベースのクロスコントラスト戦略を導入し,情報監督信号の学習を促す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:35:00 GMT)
MMbeddings: Parameter-Efficient, Low-Overfitting Probabilistic Embeddings Inspired by Nonlinear Mixed Models [5.3] MMbeddingsは、非線形混合モデルのレンズを通して分類的埋め込みエンコーダを再解釈する確率的埋め込み手法である。
MMbeddingsは従来の埋め込みよりも一貫して優れており、さまざまな機械学習アプリケーションにまたがる可能性を示している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:01:35 GMT)
Single-agent Reinforcement Learning Model for Regional Adaptive Traffic Signal Control [5.2] 本研究は、プローブ車両技術と互換性のある単一エージェントRLに基づく地域交通信号制御モデルを提案する。
RL設計の主要なコンポーネントは状態、アクション、報酬関数の定義である。
実験により,提案手法は協調型多区間制御により,大規模領域の混雑レベルを効果的に緩和することを示した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:29:13 GMT)
Temporal Fusion Transformer for Multi-Horizon Probabilistic Forecasting of Weekly Retail Sales [5.0] 本稿では、TFT(Temporal Fusion Transformer)を用いた毎週のウォルマート販売に関する新しい研究について述べる。
パイプラインはQuantile Lossを通じて1週間から5週間の確率予測を生成する。
固定された2012年のホールトアウトデータセットで、TFTは1店舗当たり57.9k米ドルのRMSEと0.9875ドルのR2ドルを達成している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:34:29 GMT)
On the Bias of Next-Token Predictors Toward Systematically Inefficient Reasoning: A Shortest-Path Case Study [4.8] 大規模言語モデルにおける推論を改善するための2つの重要な要因について検討する。
我々は、カスタムトークン化器を用いて、質問-トレース-回答三重項に対してデコーダのみの変換器を訓練する。
同じトレーニングの予算で、非効率なトレースで訓練されたモデルは、目に見えないグラフよりも一般化される。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:09:31 GMT)
Large Language Models as Medical Codes Selectors: a benchmark using the International Classification of Primary Care [4.6] 本研究では,ドメイン固有検索エンジンを用いてICPC-2符号を割り当てる大規模言語モデルの可能性を評価する。
ICPC-2コードでアノテートされたブラジルポルトガルの437の臨床的表現のデータセットが使用された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:19:12 GMT)
An Empirical Investigation of the Experiences of Dyslexic Software Engineers [4.6] ソフトウェアエンジニアリング(SE)では、読み書きの困難が重大な課題を引き起こしているように見える。
しかしながら、最初の研究は、これらの課題が非ディプレクシックな同僚と比べてパフォーマンスに悪影響を及ぼさないことを示唆している。
失読症に関連する強みは プログラミングやデザインなど 分野で特に有益です
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:08:56 GMT)
Benchmarking individual tree segmentation using multispectral airborne laser scanning data: the FGI-EMIT dataset [4.6] 本研究では,FGI-EMITについて紹介する。FGI-EMITは,個別木分割のための大規模空中レーザスキャンベンチマークデータセットである。
データセットは、1,561本の注釈付き木で構成され、特に小さな下層木に焦点を当てている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:31:18 GMT)
Exploring Kolmogorov-Arnold Networks for Interpretable Time Series Classification [4.5] Kolmogorov-Arnold Networks (KAN) はディープラーニングの代替として提案されている。
本稿では,UCRベンチマークアーカイブから117個のデータセットを用いた時系列分類のためのkanアーキテクチャについて検討する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:15:17 GMT)
Words That Unite The World: A Unified Framework for Deciphering Central Bank Communications Globally [4.4] 世界中央銀行のデータセットを導入し,28年間の歴史的データをもとに25の中央銀行から380万件の文を作成した。
我々は3つのタスクを定義する:スタンス検出、時間分類、不確かさ推定。
銀行間で集約されたデータに基づいてトレーニングされたモデルは、個々の銀行のデータに基づいてトレーニングされたモデルを大幅に上回っており、「全体はその部分の総和よりも大きい」という原則を確認している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:51:13 GMT)
VDDP: Verifiable Distributed Differential Privacy under the Client-Server-Verifier Setup [4.3] 検証可能な分散微分プライバシー(VDDP)は、分散DP機構の実行を検証するためのフレームワークである。
私たちは、クライアント、サーバ、検証者の敵対的行動が解決する可能性のある可能性に対して、エンドツーエンドのセキュリティとプライバシの保証をキャプチャします。
VDDPは通信コストと検証器のオーバーヘッドを最大5,000倍に削減する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:51:23 GMT)
Challenging DINOv3 Foundation Model under Low Inter-Class Variability: A Case Study on Fetal Brain Ultrasound [4.1] 本研究は, 胎児超音波(US)画像の基礎モデルについて, クラス間変動の少ない条件下での総合評価を行った。
われわれは胎児脳標準平面(TT)、経室(TV)、経脳小脳(TC))に焦点をあて、高い重なり合いの解剖学的特徴を示した。
胎児超音波データで事前訓練されたモデルは、F1スコアの最大20%の重み付けにより、自然画像よりも一貫して優れていた。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:37:22 GMT)
Polynomial Mixing Times of Simulated Tempering for Mixture Targets by Conductance Decomposition [4.0] 位置シフトのみが異なる対数凹成分の混合物から採取した模擬温度計の理論的複雑さについて検討した。
主な結果は、メトロポリス・ランゲヴィンアルゴリズム(MALA)と組み合わせた模擬テンパリングの初めての保証を確立することである。
この証明は、拡張空間上に構築された補助マルコフ連鎖に適用される、$s$コンダクタンスの一般的な状態分解定理に基づいている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:16:35 GMT)
A Multimodal Framework for Depression Detection during Covid-19 via Harvesting Social Media: A Novel Dataset and Method [3.9] 新型コロナウイルス(COVID-19)はパンデミックとなり、世界中で影響を与えている。
うつ病は世界中のほとんどの病気に大きく影響し、人々の精神的な健康状態を検出することは困難である。
本稿では,ソーシャルメディア利用者の抑うつを検出するために,テキスト,ユーザ固有,画像分析を組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:33:14 GMT)
GDPR-Bench-Android: A Benchmark for Evaluating Automated GDPR Compliance Detection in Android [3.7] 我々は,8つの状態LLM,フォーマルASTアナライザ,検索拡張(RAG)法,エージェント(ReAST)法を含む11の手法をベンチマークした。
以上の結果から,全てのタスクに共通するパラダイムは存在しないことが判明した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:49:43 GMT)
Can Large Language Models Detect Real-World Android Software Compliance Violations? [3.7] 現在のモデルは、さまざまな法律フレームワークにわたるAndroidアプリケーションのコンプライアンス違反を検出するのに苦労している。
コンプライアンス違反を検知するLLMの能力を評価するための新しい評価フレームワークであるemphCompliBenchを提案する。
GPT-4OやClaude-3.5を含む6つのモデルによる実験では、emphCompliBenchはコンプライアンス検出を改善している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:58:33 GMT)
Mind the Gap: Missing Cyber Threat Coverage in NIDS Datasets for the Energy Sector [3.7] 本研究では, ネットワーク検出可能なMITRE ATT&CK技術に対して広く使用されている5つのデータセットの代表性を評価する。
CIC-IDS 2017 (0.55) と SWaT と WADI は最低値 (0.38) を記録した。
この分析は、特に横移動と産業プロトコル操作において重要なギャップを特定し、ハイブリッドIT/OTエネルギー環境におけるデータセットの強化とより堅牢なNIDS評価のための明確な経路を提供する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:02:25 GMT)
Multivariate Gaussian Topic Modelling: A novel approach to discover topics with greater semantic coherence [3.6] セマンティック・コヒーレントなトピックを識別する新しい多変量ガウス的トピックモデル(MGTM)を提案する。
このアプローチは20のニュースグループデータセットに適用され、vis-a-vis 4の他のベンチマークモデルによる解釈可能性の利点を実証する。
このモデルは、平均トピックコヒーレンス(0.7)と中央トピックコヒーレンス(0.76)をベンチマークモデルとして達成し、解釈可能で意味的にコヒーレントなトピックを特定する上で高い効果を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:16:39 GMT)
Proactive DDoS Detection and Mitigation in Decentralized Software-Defined Networking via Port-Level Monitoring and Zero-Training Large Language Models [3.6] Software-Defined Networking (cSDN)は、柔軟でプログラム可能なネットワーク制御を提供するが、スケーラビリティと信頼性の問題に悩まされている。
分散化されたSDN(dSDN) 複数のローカルコントローラ間で制御を分散することで、これらの懸念を緩和する。
このアーキテクチャは、Denial-of-Service(DDoS)攻撃に対して非常に脆弱である。
本稿では,dSDN環境に適した新しい検出・緩和フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:57:29 GMT)
Cross-Lingual SynthDocs: A Large-Scale Synthetic Corpus for Any to Arabic OCR and Document Understanding [3.6] Cross-Lingual SynthDocsは、光学文字認識(OCR)と文書理解(DU)のためのアラビア語リソースの不足に対処するために設計された大規模な合成コーパスである。
データセットは、150万のテキストデータ、270万の注釈付きテーブル、数十万の実際のデータベースチャートを含む、250万以上のサンプルで構成されている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:54:58 GMT)
Exploring the Hidden Capacity of LLMs for One-Step Text Generation [3.6] 凍結した大きな言語モデルでは、1つのトークン並列フォワードパスで数百の正確なトークンを生成することができることを示す。
これらの表現は与えられたテキストに固有のものではないが、埋め込み空間において接続された局所領域を形成する。
また、これらの表現は与えられたテキストに固有のものではないが、埋め込み空間において接続された局所領域を形成することを実証的に示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:01:56 GMT)
Leveraging the Cross-Domain & Cross-Linguistic Corpus for Low Resource NMT: A Case Study On Bhili-Hindi-English Parallel Corpus [3.4] インドにおける言語的な多様性は、特にビリ語のような少数民族言語に対して、機械翻訳に重大な課題をもたらす。
本稿では,Bhili-Hindi-English Parallel Corpus (BH EPC)について述べる。
BH EPCは教育、管理、ニュースといった重要な領域にまたがっており、低リソース機械翻訳の研究のための貴重なベンチマークを確立している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:39:56 GMT)
SplashNet: Split-and-Share Encoders for Accurate and Efficient Typing with Surface Electromyography [3.4] 手首にある表面筋電図(sEMG)は、キーボードのない自然なテキスト入力を可能にする。
最先端の Emg2qwerty ベースラインは、まだ見知らぬユーザーのゼロショット設定で511.8%の文字を認識していない。
これらの誤りの多くを、ユーザ間信号統計のミスマッチに追従する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:33:29 GMT)
Longitudinal Vestibular Schwannoma Dataset with Consensus-based Human-in-the-loop Annotations [3.2] このデータセットには,184例のT1強調検査(T1CE)534例と6例の非アノテーションT2強調検査(T2強調検査)190例が含まれている。
提案手法は,自動セグメンテーションモデルの目的とするデータ分布への効率的かつ資源効率の高い一般化を可能にする。
従来の手作業による注釈処理と比較して、効率を約37.4%向上させると見積もられている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:53:28 GMT)
Remembering Unequally: Global and Disciplinary Bias in LLM-Generated Co-Authorship Networks [3.2] 本研究では,Large Language Models (LLM) が共著者ネットワークに与える影響について検討する。
我々は、DeepSeek R1、Llama 4 Scout、Mixtral 8x7Bの3つの著名なモデルにおける効果を評価する。
我々のグローバル分析では、高度に引用された研究者に有利な一貫したバイアスが明らかになっているが、このパターンは均一に観察されていない。
臨床医学などの特定の分野や、アフリカの一部を含む地域は、よりバランスの取れた表現を示している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:05:43 GMT)
Towards Automated Petrography [3.1] ペトログラフィー(英: Petrography)は、岩石の鉱物学的組成を分析する地質学の分野である。
LITHOS(Large-scale Imaging and Thin section Optical-polarization Set)は、自動ペトログラフィーのための、最大かつ最も多種多様な実験フレームワークである。
LITHOSには、偏光の211,604個の高分解能RGBパッチと、25の鉱物カテゴリにわたる105,802個のエキスパートアノテート穀物が含まれている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:15:18 GMT)
SLIP: Securing LLMs IP Using Weights Decomposition [3.1] クラウドベースのデプロイメントのコストが高いことから、エッジデバイス上でモデルを実行することへの関心が高まっている。
本稿では,エッジデプロイされたモデルを盗難から保護するために設計されたハイブリッド推論アルゴリズムSLIPを紹介する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:59:22 GMT)
Three-dimensional narrow volume reconstruction method with unconditional stability based on a phase-field Lagrange multiplier approach [3.0] 点雲からの物体の再構成は、補綴、医用画像、コンピュータビジョンなどにおいて不可欠である。
本稿では,ラグランジュ乗算手法を用いて,アレン-カーン型再構成モデルの効率的なアルゴリズムを提案する。
textitStar Warsの文字などの複雑な3Dボリュームの再構成を含む総合的な数値実験は、アルゴリズムの正確性、安定性、有効性を検証する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:21:12 GMT)
EvoMem: Improving Multi-Agent Planning with Dual-Evolving Memory [3.0] 本稿では,デュアル進化メモリ機構上に構築されたマルチエージェントフレームワークであるEvoMemを紹介する。
旅行計画、会議計画、カレンダースケジューリングにおける一貫したパフォーマンス改善を示す。
この成功は、マルチエージェント計画の強化におけるメモリの重要性を強調している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:38:07 GMT)
Quantum optical nonreciprocity on a magnetic-free photonic chip [2.7] 集積フォトニックチップ上での高効率かつノイズのない全光周波数変換により、量子状態における無磁場光非相互性を示す。
本装置は、入力光子の量子コヒーレンスと絡み合いを保ちながら、例外的な性能パラメータを提供する。
スケーラブルなフォトニックプラットフォームにおける量子光学的非相互性の実現は、指向性量子通信とノイズ耐性量子ネットワークへの道を開く。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:26:37 GMT)
Learning to Car-Follow Using an Inertia-Oriented Driving Technique: A Before-and-After Study on a Closed Circuit [2.7] 従来の研究は、走行距離が交通不変量であるかどうかを疑問視していた。
本研究は,実回路におけるDI戦略の適用可能性を示す最初のものである。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:30:30 GMT)
An Efficient Anomaly Detection Framework for Wireless Sensor Networks Using Markov Process [2.6] 1次マルコフ連鎖モデルに基づく軽量かつ解釈可能な異常検出フレームワークが提案されている。
提案したフレームワークは、Intel Berkeley Research Labデータセットを使用して検証された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:19:00 GMT)
FeNN-DMA: A RISC-V SoC for SNN acceleration [2.6] スパイキングニューラルネットワーク(SNN)は、標準ニューラルネットワーク(ANN)に代わる有望でエネルギー効率のよい代替品である
FeNN-DMAは、最先端の固定機能SNNアクセラレータと同等の資源使用量とエネルギー要求を有することを示す。
スパイキングハイデルベルクディジットとニューロモルフィックMNISTタスクのシミュレーションにおける最先端の分類精度を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:59:54 GMT)
PADBen: A Comprehensive Benchmark for Evaluating AI Text Detectors Against Paraphrase Attacks [2.5] そこで本研究では,AIGT識別のために設計された検出システムに対して,繰り返しパラメタしたテキストが回避される理由について検討する。
パラフレーズ攻撃シナリオに対する検出ロバスト性を系統的に評価した最初のベンチマークであるPADBenを紹介する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:59:46 GMT)
Isotropic Curvature Model for Understanding Deep Learning Optimization: Is Gradient Orthogonalization Optimal? [2.5] 本稿では,重みの行列構造を利用して,一反復でディープラーニングの最適化を解析するモデルを提案する。
最適更新行列は、元の勾配行列のスペクトルをより均一にすることで得られることを示す。
深層学習と言語モデルの学習のための新しい最適化手法の設計に等方的曲率モデルを活用する方法について,今後の研究について論じる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:37:29 GMT)
Modeling the Construction of a Literary Archetype: The Case of the Detective Figure in French Literature [2.5] 本研究は,フランスの推理小説における探偵アーチェタイプの進化を,計算分析を通して探求するものである。
定量的手法と文字レベルの埋め込みを用いて,150年間の文献において,教師付きモデルが刑事考古学者の統一性を捉えることができることを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:09:05 GMT)
Stochastic Subspace Descent Accelerated via Bi-fidelity Line Search [2.4] 本研究では,新しいゼロ階最適化法であるBF-SSDアルゴリズムを導入する。
BF-SSDは、高忠実度評価を著しく少なくしながら、優れた最適化性能を継続的に達成する。
本研究は,BF-SSDを有望かつ計算効率のよいアプローチとして位置づけ,ゼロ階最適化における両忠実性の統合の有効性を強調した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:23:06 GMT)
VinDr-CXR-VQA: A Visual Question Answering Dataset for Explainable Chest X-Ray Analysis with Multi-Task Learning [2.3] VinDr-CXR-VQA(VinDr-CXR-VQA)は、医用視覚質問応答(Med-VQA)のための大規模胸部X線データセットである。
データセットには4,394枚の画像からなる17,597枚の質問応答対が含まれており、それぞれに放射線技師が検証した境界ボックスと臨床理由説明が注釈付けされている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:17:44 GMT)
3MDBench: Medical Multimodal Multi-agent Dialogue Benchmark [2.3] 3MDBenchは、LVLM駆動の遠隔医療相談をシミュレートし評価するためのオープンソースのフレームワークである。
内部推論によるマルチモーダル対話は、非対話設定よりもF1スコアが6.5%向上する。
診断畳み込みニューラルネットワークからLVLMのコンテキストに予測を注入すると、F1は最大20%向上する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:05:56 GMT)
Node Preservation and its Effect on Crossover in Cartesian Genetic Programming [2.3] ノードが保存されている変種に対して,基本的なクロスオーバー法,すなわちワンポイント法と均一法を比較した。」
突然変異とクロスオーバーの両方におけるノードの保存は、シンボリック・レグレッション・ベンチマーク問題を用いた探索を改善する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:26:56 GMT)
Who Can We Trust? Scope-Aware Video Moment Retrieval with Multi-Agent Conflict [2.2] ビデオモーメント検索はテキストクエリを使用して、与えられた未トリミングビデオ参照から瞬間を特定する。
このタスクの現在のソリューションは、異なるモデルから得られるロケーション内の競合を考慮していない。
本研究では,モーメント境界を見つけるためにビデオ全体を一度スキャンできる強化学習に基づくビデオモーメント検索モデルを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:42:36 GMT)
Exploring the Synergy of Quantitative Factors and Newsflow Representations from Large Language Models for Stock Return Prediction [2.1] 定量的投資では、リターン予測は株式選択、ポートフォリオ最適化、リスク管理など様々なタスクをサポートする。
ニュースや文字起こしのような構造化されていない財務データは、近年の大規模言語モデル(LLM)の進歩によって、注目を集めている。
本稿では,リターン予測と株価選択において,マルチモーダル要因とニューズフローを活用する効果的な手法について検討する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:24:40 GMT)
Validating Deep Models for Alzheimer's 18F-FDG PET Diagnosis Across Populations: A Study with Latin American Data [2.1] 我々はアルツハイマー病神経画像イニシアチブデータセットの畳み込みモデルとトランスフォーマーモデルを比較した。
すべてのモデルがADNI上で高いAUCを達成する一方で、その性能はFLENIで大幅に低下することを示す。
これらの知見は、診断AIモデルの集団認識による検証の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:24:31 GMT)
On Improvisation and Open-Endedness: Insights for Experiential AI [1.9] 即興のオープンエンドな性質は、新しい、再現不可能な瞬間の流れを生み出している。
生成AIの台頭は、AIに優れた即興性をもたらすものは何なのか?
ダンス,音楽,接触即興の6つの専門家との深いインタビューから得られた知見を報告する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:13:02 GMT)
Efficient Generation of Binary Magic Squares [1.8] 我々のアルゴリズムは、常に最適な理論的複雑さを持つ有効なバイナリマジックスクエアを返すことを示す。
次に、この研究を非二乗二項マジックスクエアに拡張し、これらのBMSの行と列の和に関する条件を定式化し、最初のアルゴリズムのわずかな変種が証明可能生成できることを示します。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:15:22 GMT)
Air Pollution Forecasting in Bucharest [1.7] 大気汚染、特に粒子状物質2.5(PM2.5)は近年懸念が高まっている。
本稿では,PM2.5の将来のレベルを予測するための機械学習モデルを設計,微調整,テスト,評価することを目的とする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:24:11 GMT)
Towards Quantum Algorithms for the Optimization of Spanning Trees: The Power Distribution Grids Use Case [1.7] エネルギーシステムでは、ネットワーク再構成は損失とコストを大幅に削減することができる。
多くの関連する最適化問題はNPハードであり、実用的な応用を制限している。
本稿では、これらのアルゴリズムプリミティブを分散グリッド再構成に適用し、必要な量子資源を定量化する方法を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:12:00 GMT)
A Critical Roadmap to Driver Authentication via CAN Bus: Dataset Review, Introduction of the Kidmose CANid Dataset (KCID), and Proof of Concept [1.6] 犯罪者は、認証機構をバイパスするために、コントローラエリアネットワーク(CAN)バスシステムの脆弱性を利用する。
CANバスデータによるドライバ認証は、詳細な防御の有望な追加レイヤを提供する。
既存のオープンアクセスドライバフィンガープリントデータセットは、重大な制限に悩まされている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:36:18 GMT)
SmartDoc: A Context-Aware Agentic Method Comment Generation Plugin [1.6] プログラムの主要なビルディングブロックとしてのメソッドは、コード理解のための知識ソースを開発者に提供します。
We propose a solution as a IntelliJ IDEA plugin, named SmartDoc, which help developers to generate context-aware method comments。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:33:57 GMT)
Variational Autoencoder for Calibration: A New Approach [1.5] 本稿では,センサの校正のための変分オートエンコーダ(VAE)の新たな実装を提案する。
既存のマルチセンサガスデータセットを用いて概念実証を行う。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:05:20 GMT)
Oitijjo-3D: Generative AI Framework for Rapid 3D Heritage Reconstruction from Street View Imagery [1.5] Oitijjo-3Dは3D文化保存を民主化する無償のジェネレーティブAIフレームワークである。
Oitijjo-3Dは、2段階のパイプラインを通して、遺産構造の忠実な3Dモデルを再構築する。
システムは数秒でフォトリアリスティックで計量的にコヒーレントな再構成を生成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:09:26 GMT)
Quantum-enhanced quickest change detection of transmission loss [1.2] 時間モード干渉計におけるシャープドライトの分割は、チャネル損失の急激な変化を検出するホモダイン受信機の性能を高めることができることを示す。
我々は、最も速い変化検出の量子限界と、共同通信と変化検出の問題について議論する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 04:06:30 GMT)
Certain but not Probable? Differentiating Certainty from Probability in LLM Token Outputs for Probabilistic Scenarios [1.2] 確率確率的シナリオにおけるトークンの確実性と理論的確率分布との整合性について検討する。
本研究では,(1)シナリオ制約に対する応答妥当性,(2)トークンレベルの出力確率と理論的確率の一致の2つの次元を測る。
以上の結果から,両モデルが全てのプロンプトシナリオにおいて完全なドメイン内応答精度を達成する一方で,トークンレベルの確率とエントロピー値は対応する理論分布から常に分岐することがわかった。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:51:11 GMT)
Enhancing failure prediction in nuclear industry: Hybridization of knowledge- and data-driven techniques [1.1] 本稿では,データ駆動技術と原子力機器のドメイン知識を組み合わせた新しい予測保守手法を提案する。
この研究の適用上の新規性は、安全保障、経済、環境上の懸念から非常に制限され、超敏感な核産業のような領域内での使用にある。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:52:08 GMT)
Cognitively-Inspired Episodic Memory Architectures for Accurate and Efficient Character AI [1.1] 大規模な言語モデルは、対話システムに歴史的な文字を具現化することを約束するが、既存のアプローチは重要なトレードオフに直面している。
本稿では、オフラインデータ拡張と、構造化エピソードメモリからの効率的な並列検索により、この緊張を解消するアーキテクチャを提案する。
本システムでは,2段階検索で0.52秒の即時生成を実現し,生涯データを1,774個の濃厚な初対人記憶に変換する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:26:16 GMT)
Object-Centric Analysis of XES Event Logs: Integrating OCED Modeling with SPARQL Queries [1.1] 本稿では,プロセスマイニングにおけるイベントログにおけるXES標準の限界を克服するために,OEDO(Object-Centric Event Data Ontology)を用いることを提案する。
我々は、イベントとオブジェクトの関係をより明確にするために、SPARQLクエリと統合されたOCEDOアプローチをBPIC 2013データセットに適用する方法を実証する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:24:36 GMT)
Transfer Learning for Onboard Cloud Segmentation in Thermal Earth Observation: From Landsat to a CubeSat Constellation [1.0] この研究は、軽量なMobileNetエンコーダを備えたUNetを用いて、FOEST-2 CubeSatの熱クラウドセグメンテーションに変換学習を適用する。
我々は、パブリックなLandsat-7クラウドカバレッジアセスメントデータセットでモデルを事前トレーニングし、少数のミッション固有のサンプルで微調整する。
我々は、このモデルをaRTエンジンに変換し、NVIDIA Jetson Nano上で5秒未満でフルイメージの推論を実演する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:59:16 GMT)
Agentic Auto-Scheduling: An Experimental Study of LLM-Guided Loop Optimization [1.0] 大規模言語モデル(LLM)は、コンパイラとのクローズドループインタラクションを通じてプロセスをガイドする。
ComPilotは、LLMが特定のループネストのコンパイラへの変換を提案するフィードバックループを確立する。
コンパイラは変換を試み、合法性ステータスを報告し、スピードアップまたはスローダウンを測定します。
ComPilotは、元のコードに対して2.66x(単一実行)と3.54x(ベスト・オブ・5実行)の幾何平均スピードアップを達成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:32:34 GMT)
CausalARC: Abstract Reasoning with Causal World Models [0.9] CausalARCは、低データおよびアウト・オブ・ディストリビューション体制におけるAI推論の実験的なテストベッドである。
それぞれのCausalARC推論タスクは、完全に指定された因果世界モデルからサンプリングされる。
モデル内およびモデル間のパフォーマンスはタスクによって大きく異なり、言語モデルの推論を大幅に改善する余地が示唆された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 23:22:34 GMT)
Been There, Scanned That: Nostalgia-Driven LiDAR Compression for Self-Driving Cars [0.8] 自動運転車は1日に数テラバイトのセンサーデータを生成することができる。
このデータの大部分は、LiDARのような深度センサーによって生成された3Dポイント雲で構成されている。
ネットワークとストレージのコストを削減するため、本稿ではDejaViewを紹介します。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:25:08 GMT)
Survey Transfer Learning: Recycling Data with Silicon Responses [0.8] サーベイ・トランスファー・ラーニング (STL) は、コンピュータサイエンスによるサーベイ・リサーチのためのトランスファー・ラーニング・パラダイムを開発する。
政治行動理論に触発されたSTLは、偏極化アメリカの文脈において高い予測力を持つ共有人口統計学変数を利用する。
STLは、個々のレベルの精度で経験的に基底化されたシリコン応答を生成し、社会科学とポーリング業界における重要な課題を軽減するのに役立つ可能性がある。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:13:42 GMT)
Region-Aware Reconstruction Strategy for Pre-training fMRI Foundation Model [0.8] 我々は,自己指導型事前訓練中に,意味的コヒーレントな脳領域を選択的にマスキングするためのROI誘導マスキング戦略を導入する。
本手法はADHDと診断された個人から健康的なコントロールを識別するための分類精度が4.23%向上したことを示す。
以上の結果から, モデル前訓練における解剖学的領域のマスキングは, 解釈可能性を高めるだけでなく, より堅牢で差別的な表現をもたらすことが示唆された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:12:00 GMT)
Penalized Empirical Likelihood for Doubly Robust Causal Inference under Contamination in High Dimensions [0.7] 低サンプルサイズ方程式における平均処理効果を2倍頑健に推定する手法を提案する。
提案した信頼区間は, 競合する推定値と比較して効率がよいことを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:59:08 GMT)
Metadata-Aligned 3D MRI Representations for Contrast Understanding and Quality Control [0.7] MR-CLIPは, ボリューム画像とDICOM取得パラメータを一致させてMRIコントラスト表現を学習する, メタデータ誘導型フレームワークである。
結果として得られた埋め込みは、MRIシーケンスの異なるクラスタを示し、データ不足下で教師付き3Dベースラインを上回っている。
MR-CLIPは、多種多様な臨床データセットにわたるラベル効率のMRI解析のためのスケーラブルな基盤を提供する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:49:32 GMT)
Toward Better Optimization of Low-Dose CT Enhancement: A Critical Analysis of Loss Functions and Image Quality Assessment Metrics [0.7] LDCT画像品質向上のための異なる損失関数の関係を客観的に解析する。
その結果、LFと品質指標の矛盾が明らかとなり、画像品質向上のための新たな損失関数を開発する際に、画質指標の考慮の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:40:19 GMT)
Lessons Learned from the Use of Generative AI in Engineering and Quality Assurance of a WEB System for Healthcare [0.7] ソフトウェアエンジニアリングプラクティスにおける生成AIの利用は、まだ初期段階にある。
本報告では,ソフトウェア開発プロセスにおけるジェネレーティブAIの利用に関する,開発チームの学習経験について報告する。
開発プロセスを著しく発展させる決定的な技術的証拠はまだ持っていませんが、その結果は、生成AIでソフトウェア品質を達成するための開発プラクティスを革新しようとするソフトウェア組織にとって、貴重な洞察となりました。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:42:29 GMT)
FTT-GRU: A Hybrid Fast Temporal Transformer with GRU for Remaining Useful Life Prediction [0.6] 本稿では,Fast Temporal Transformer (FTT) とゲートリカレントユニット (GRU) を組み合わせ,逐次モデリングを行うハイブリッドモデル FTT-GRU を提案する。
NASA CMAPSS FD001では、FTT-GRUはRMSE 30.76、MAE 18.97、R2=0.45$に達し、バッチ=1.12msのCPUレイテンシを持つ。
これらの結果は,コンパクトなTransformer-RNNハイブリッドがCMAPSS上で高精度かつ効率的なRUL予測を実現することを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:02:03 GMT)
Fibbinary-Based Compression and Quantization for Efficient Neural Radio Receivers [0.6] 本稿では,量子化と圧縮の2つの最適化手法について検討する。
フィボナッチ符号ワード量子化(FCQ)のような一様量子化と非一様量子化の両方を導入する。
次に、上述の量子化技術がもたらす損失を補うために、インクリメンタルネットワーク量子化(INQ)戦略に対する新しいきめ細かいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 22:39:44 GMT)
multiMentalRoBERTa: A Fine-tuned Multiclass Classifier for Mental Health Disorder [0.6] ソーシャルメディアからのメンタルヘルス障害の早期発見は、適切なリソースへのタイムリーなサポート、リスクアセスメント、参照を可能にするために重要である。
この研究は、一般的な精神状態のマルチクラス分類用に設計された微調整RoBERTaモデルであるMultiMentalRoBERTaを紹介する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:55:48 GMT)
A Multimodal Dataset for Indoor Radio Mapping with 3D Point Clouds and RSSI [0.6] このリソースは、データ駆動型無線モデリングの研究を促進するために設計されている。
堅牢で高容量な屋内通信システムの開発を進めることを目的としている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:02:16 GMT)
Hierarchical Quantum Optimization for Large-Scale Vehicle Routing: A Multi-Angle QAOA Approach with Clustered Decomposition [0.6] 大規模車両ルーティング問題(VRP)の量子最適化手法を提案する。
このアプローチは、3つのバランスの取れたクラスタにまとめて13のロケーションベースのVRP問題を分解し、クラスタ内のオープンループトラベリングセールスマン問題(OTSP)に標準QAOA、クラスタ間VRPルーティングにMA-QAOAを適用する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:19:56 GMT)
Efficiency vs. Efficacy: Assessing the Compression Ratio-Dice Score Relationship through a Simple Benchmarking Framework for Cerebrovascular 3D Segmentation [0.5] ZFPは、高い忠実度を維持しながら、エラー耐性モードの22.89:1の比率で、実質的なデータ削減を実現することができる。
その結果、ZFPは大規模医療データセットのより効率的でアクセスしやすい研究を可能にするための、実用的で強力なツールであることが示された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:29:34 GMT)
Exploiting Latent Space Discontinuities for Building Universal LLM Jailbreaks and Data Extraction Attacks [0.5] 本稿では,ユビキタスジェイルブレイクとデータ抽出攻撃の新たな手法を提案する。
我々は、トレーニングデータの空間性に関連するアーキテクチャ上の脆弱性である潜時空間の不連続を悪用する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:19:12 GMT)
Fine-Tuning DialoGPT on Common Diseases in Rural Nepal for Medical Conversations [0.5] ネパールの農村部における医師と患者との相互作用のデータセット上でオフラインで動作可能な軽量な生成対話モデルを微調整した。
限られたドメイン固有のデータセットでトレーニングされているにもかかわらず、微調整されたモデルは一貫性があり、文脈的に関連があり、医学的に適切な応答を生み出した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:33:44 GMT)
Emotion Detection in Speech Using Lightweight and Transformer-Based Models: A Comparative and Ablation Study [0.4] 本稿では,軽量トランスモデルであるDistilHuBERTとPaSSTの比較分析を行う。
MFCC機能を用いた従来のCNN-LSTMベースラインモデルと比較した。
DistilHuBERTは、非常に小さなモデルサイズ(0.02MB)を維持しながら、優れた精度(70.64%)とF1スコア(70.36%)を示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:01:04 GMT)
Knowledge-guided Continual Learning for Behavioral Analytics Systems [0.3] このコンテンツをキャプチャするために学習するモデルは、データドリフトによって時間の経過とともにパフォーマンスが低下する可能性がある。
このようなモデルを時間をかけて微調整することは、破滅的な忘れ物のために有害である可能性がある。
連続学習におけるリプレイベースのアプローチは、そのようなモデルを更新するための単純で効率的な方法を提供する。
本稿では,リプレイ型連続学習フレームワークに外部知識を取り入れた拡張型アプローチを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:07:18 GMT)
Red-teaming Activation Probes using Prompted LLMs [0.3] アクティベーションプローブは、低コストとレイテンシのため、AIシステムにとって魅力的なモニターだが、現実の堅牢性はまだ探索されていない。
現実的でブラックボックスの対向的な圧力の下では、障害モードはどのように発生しますか?
既製のLCMを反復的フィードバックとコンテキスト内学習(ICL)でラップする,軽量なブラックボックスレッドチーム方式を提案する。
高精細度相互作用のためのプローブを用いたケーススタディを実行することで、私たちのアプローチがSOTAプローブに関する貴重な洞察を発見できることを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 13:35:34 GMT)
Single Sr Atoms in Optical Tweezer Arrays for Quantum Simulation [0.2] 光学式ツイーザにおいて, 個々の88ドルSr原子をトラップし, 操作するためのプラットフォームの実現について報告する。
捕捉された原子は蛍光イメージングにより99.986(6)%$で検出され、生存確率は9.7(2)%$である。
その結果, 効率的なローディング, 冷却, 高忠実度検出を併用した頑健なアルカリ-アーストウィーザープラットフォームが実証された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:57:47 GMT)
Optimal Execution with Reinforcement Learning [0.2] 本研究では,強化学習による最適実行戦略の開発について検討する。
本稿では,独自のMDPの定式化を行い,提案手法の結果を確認し,標準実行戦略に対して性能をベンチマークする。
その結果, 強化学習エージェントは, 標準的な戦略よりも優れ, 実世界のトレーディングアプリケーションに実用的な基盤を提供することがわかった。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:34:00 GMT)
Reversal Invariance in Autoregressive Language Models [0.2] 次トーケン予測損失は、コーパスとその反転に同一の確率を割り当て、標準CLM事前学習が方向盲であることを示唆する。
この対称性は、人間の言語と推論の本質的に時間非対称性の性質にもかかわらず、逆テキストで訓練されたモデルがフォワードテキストで訓練されたモデルと同等のパフォーマンスを達成できる理由を説明する。
我々は、時間的非対称性のレンズを通して事前学習を行い、標準言語モデリング能力を維持しつつ、言語矢印を明示的にモデル化する損失関数やアーキテクチャに関する将来の研究を動機付けることを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:51:46 GMT)
TextCrafter: Optimization-Calibrated Noise for Defending Against Text Embedding Inversion [0.1] テキスト埋め込みインバージョン攻撃は、潜在表現から原文を再構築し、協調推論とエッジコンピューティングにおいて深刻なプライバシー上の脅威を生じさせる。
本研究では, RL学習, 幾何を考慮したノイズ注入, クラスタ先行によるユーザ埋め込み, PII信号誘導を併用して, 作業性を維持しながらインバージョンを抑える, 最適化に基づく逆摂動機構であるTextCrafterを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:21:49 GMT)
Reasoning Trajectories for Socratic Debugging of Student Code: From Misconceptions to Contradictions and Updated Beliefs [0.1] ほとんどの初心者プログラマのバグは、プログラミングの誤解によって引き起こされる。
本稿では,推論軌道生成の課題について紹介する。
次に、Reasoning Trajectory(RT)とSocraticの会話を生成するソリューションについて説明する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:51:50 GMT)
Autoadaptive Medical Segment Anything Model [0.1] 本稿では,医療画像セグメンテーションのための新しいマルチタスク学習フレームワークであるADA-SAM(Automated, Domain-specific, Adaptive segment any model)を提案する。
提案手法は,ラベル設定が制限された場合,全教師付きベースラインと半教師付きベースラインを2桁で上回る。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:38:04 GMT)
Connected correlations in cold atom experiments [0.1] 本稿では,相互作用する量子粒子のアンサンブルを特徴付ける上での相関関係の重要性について述べる。
位数 n > 2 の非零連結相関は、明らかに非ガウス量子状態を特定する。
このような多粒子クラスターを識別する能力は、微視的なスケールで物質の強い相関量子状態について興味深い視点を与える。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:29:56 GMT)
Quantum Field Theory and the Measurement Problem in Quantum Mechanics [0.0] 本稿では、量子場理論とハーグの定理に基づく測定問題に対する新しい解を提案する。
粒子の含有量が変化した素粒子相互作用における我々の提案によれば、時間的進化は非一意性である。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:50:23 GMT)
Complex and tunable heating in conformal field theories with structured drives via classical ergodicity breaking [0.0] 本研究では、周期的Thue-Morse列までの構造化ドライブの族について検討する。
我々は,加熱相や非加熱相など,物質の様々な動的相を分類する。
非零測度を持つ別の非加熱相が、純粋にユニタリ CFT を介してアクセス不可能である。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:59:48 GMT)
Zero-Knowledge Extensions on Solana: A Theory of ZK Architecture [0.0] 本稿では,ソラナのゼロ知識拡張をアーキテクチャ理論として再構築する。
目的(スキャラビリティ対プライバシ)と配置(オンチェーン対オフチェーン)によってゼロ知識の使用を正規化する2軸モデルを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:58:13 GMT)
Will Humanity Be Rendered Obsolete by AI? [0.0] 本稿では、人工知能(AI)が人間にもたらす存在リスクを分析し、現在のAIから超知能への軌道を辿る。
機械の指数関数的に増大する認知力と仮説IQを考えると、人類をはるかに超越した知能の倫理的および実在的な含意に対処する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:18:13 GMT)
Weakly Supervised Pneumonia Localization from Chest X-Rays Using Deep Neural Network and Grad-CAM Explanations [0.0] 本研究は,胸部X線からの肺炎の分類と局在化のための弱教師付き深層学習フレームワークを提案する。
コストのかかるピクセルレベルのアノテーションの代わりに,画像レベルのラベルを用いて臨床的に意味のあるヒートマップを生成する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:44:24 GMT)
Universality in Ionic Three-body Systems Near an Ion-atom Feshbach Resonance [0.0] イオン-原子散乱長の連続する量子境界チャネルへの組換え速度を計算する。
弱結合型イオン三原子分子の出現を観察する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:04:26 GMT)
Trust-Region Methods with Low-Fidelity Objective Models [0.0] 本稿では,マジックトラスト領域(MTR)フレームワークに基づく2つのマルチフィデリティ信頼領域手法を提案する。
二次魔法の方向は、粗い信頼領域のサブプロブレムを低忠実度対象モデルに基づいて解くことによって決定される。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:25:43 GMT)
The Narrative Continuity Test: A Conceptual Framework for Evaluating Identity Persistence in AI Systems [0.0] Narrative Continuity Test (NCT) は、AIシステムにおけるアイデンティティの永続化とダイアクロニックコヒーレンスを評価するためのフレームワークである。
NCTは、Situated Memory、Goal Persistence、Autonomous Self-Correction、Stylistic & Semantic stability、Persona/Role Continuityの5つの必要軸を定義している。
ケース分析では、ステートレス推論の下で予測可能な連続性障害が示される。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:06:59 GMT)
The Evolution of Agile and Hybrid Project Management Methodologies: A Systematic Literature Review [0.0] この体系的なレビューは、アジャイル方法論のハイブリッドフレームワークへの進化について調査する。
我々は,過去8年間のピアレビュー研究のPRISMAガイドによる分析を通じて,重要な傾向を明らかにした。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:13:47 GMT)
Taming quantum systems: A tutorial for using shortcuts-to-adiabaticity, quantum optimal control, and reinforcement learning [0.0] 本稿では,チュートリアル形式での量子制御の基礎について紹介する。
我々は3つの分野に焦点をあてる: 断熱へのショートカット、量子最適制御、機械学習に基づく制御。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:42:06 GMT)
TRISKELION-1: Unified Descriptive-Predictive-Generative AI [0.0] TRISKELION-1は、統一された記述予測生成アーキテクチャである。
統計的、機械的、および生成的推論を1つのエンコーダ・デコーダ・フレームワークに統合する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:23:38 GMT)
TRACES: Temporal Recall with Contextual Embeddings for Real-Time Video Anomaly Detection [0.0] 本稿では,文脈認識型ゼロショット異常検出問題に対処する。
提案手法は,時間的信号と視覚的埋め込みを関連づけたメモリ拡張パイプラインを定義する。
我々は、UCF-Crimeで90.4%のAUC、XD-Violenceで83.67%のAPを達成している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:54:08 GMT)
Synthetic Data Generation with Lorenzetti for Time Series Anomaly Detection in High-Energy Physics Calorimeters [0.0] 我々はLorenzetti Simulatorを用いて、注入されたカロリーメータ異常を伴う合成イベントを生成する。
次に、変換器ベースや他のディープラーニングモデルを含む時系列異常検出手法の感度を評価する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:48:30 GMT)
Superpositional Gradient Descent: Harnessing Quantum Principles for Model Training [0.0] Superpositional Gradient Descent (SGD) は、量子回路の摂動を注入することによって量子重ね合わせに勾配の更新をリンクする新しい方法である。
本稿では,PyTorch と Qiskit のハイブリッド量子古典回路を実装した数学的枠組みを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:37:55 GMT)
Structure-Preserving Physics-Informed Neural Network for the Korteweg--de Vries (KdV) Equation [0.0] 本稿では,非線形カルテヴェーグ・ド・ヴリー(KdV)方程式に対するエンファン構造保存型PINNフレームワークを提案する。
提案手法は、質量とハミルトンエネルギーの保存を直接損失関数に埋め込む。
我々は保存不変量を維持しながらKdVダイナミクスの目印挙動をうまく再現する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:07:24 GMT)
Sparse and nonparametric estimation of equations governing dynamical systems with applications to biology [0.0] スパースパラメトリック推定と非パラメトリック手法を統合する新しいフレームワークを提案する。
シンディが説明できない非線形性を捉え、それらの機能形式に関する事前情報を必要としない。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:43:50 GMT)
Short-time dynamics in phase-ordering kinetics [0.0] 2D$ Blume-Capelモデルの短時間のダイナミクスは分析されている。
非平衡力学では、$Theta=0.190(5)$と$Theta=-0.542(5)$を再現する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:12:24 GMT)
ShadowLogic: Backdoors in Any Whitebox LLM [0.0] 大規模言語モデル(LLM)は様々なアプリケーションに広くデプロイされており、有害なコンテンツや制限されたコンテンツの発生を防ぐための安全策がしばしばある。
この研究は、計算グラフベースのLLMフォーマットにおける重要なセキュリティ脆弱性を強調している。
そこで我々は,非検閲ベクトルを計算グラフ表現に注入することにより,White-box LLMでバックドアを作成する方法であるShadowLogicを紹介した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:10:08 GMT)
Self-testing of semisymmetric informationally complete measurements in a qubit prepare-and-measure scenario [0.0] 自己検査は量子システムを認証するための強力な方法である。
本研究では,特定の種類の非射影量子ビット測定の自己検査に焦点をあてる。
我々の結果は、潜在的に最小限の PM シナリオ内で、極小の qubit POVM を自己テストするための道を開いた。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:13:53 GMT)
Retrieval-Augmented Generation of Pediatric Speech-Language Pathology vignettes: A Proof-of-Concept Study [0.0] 汎用大規模言語モデル(LLM)はテキストを生成することができるが、ドメイン固有の知識が欠如しており、幻覚と専門家の修正を必要とする。
本研究では,検索強化世代(RAG)とキュレートされた知識ベースを統合し,小児SLP症例資料を生成する概念実証システムを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 23:35:19 GMT)
Reducing students' misconceptions about video game development. A mixed-method study [0.0] 本研究では,ゲーム開発に関する学生のナレーション的思考(誤解)について検討する。
本研究は, 産業界の専門家による15時間の講義シリーズの有効性を評価した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 05:15:48 GMT)
Quantum dynamics in lattices in presence of bulk dephasing and a localized source [0.0] 本研究では,バルクデファス法の存在下での局在化フェルミオン源の量子系のダイナミクスについて検討する。
我々の詳細な研究は、オープン量子系におけるハミルトン力学と様々な環境誘起機構の間の興味深い相互作用を明らかにしている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 14:42:52 GMT)
Quantum Qomrades: Catalysts in Resource Theories and Memories in Dynamic Programming [0.0] この論文は補助システムを使用する際の基礎となる強度源について考察する。
次に、これらの知見を量子コンピューティングの実践的な問題に適用する。
補助システムを利用したアルゴリズムパラダイムを考案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 08:36:24 GMT)
Quantum Mechanics from General Relativity and the Quantum Friedmann Equation [0.0] 最近導入された線型方程式は、第一のフリードマン方程式を再構成し、量子宇宙論方程式の第一階 WKB 展開であることを示す。
この結果は、一般相対性理論と量子力学の深い関係を示し、統一されたフレームワークを指し示している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:31:04 GMT)
Principle of Minimal Heating for Collapse and Hybrid Gravitational Models [0.0] エネルギー非保存は、崩壊と古典量子重力のハイブリッドモデルの顕著で実証可能な予測である。
固定された$r_C$の場合、加熱速度を最小化する分布を選択する。
本手法は, GRW, CSL, DPの最も検討された崩壊モデルに適用する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 17:47:28 GMT)
MedRECT: A Medical Reasoning Benchmark for Error Correction in Clinical Texts [0.0] 大規模言語モデル (LLM) は医療応用における将来性を示すが, 臨床用テキストにおける誤りの検出と訂正能力は, 未評価のままである。
我々は,医療ミス処理を3つのサブタスクとして定式化する言語間ベンチマーク(日本語/英語)であるMedRECTを紹介する。
プロプライエタリ、オープンウェイト、理性家族にまたがる9つの現代LSMを評価した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:19:34 GMT)
MalDataGen: A Modular Framework for Synthetic Tabular Data Generation in Malware Detection [0.0] MalDataGenは、モジュール型のディープラーニングモデルを使用して、高忠実な合成データを生成するためのオープンソースのフレームワークである。
そのフレキシブルな設計は、検出パイプラインへのシームレスな統合を可能にし、サイバーセキュリティアプリケーションのための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:08:58 GMT)
MH-1M: A 1.34 Million-Sample Comprehensive Multi-Feature Android Malware Dataset for Machine Learning, Deep Learning, Large Language Models, and Threat Intelligence Research [0.0] MH-1Mは、高度なAndroidマルウェア研究のための最も包括的で最新のデータセットの1つである。
データセットは1,340,515のアプリケーションで構成され、幅広い機能と広範なメタデータを含んでいる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:54:08 GMT)
Lost and found charge in quantum batteries [0.0] 我々は、一見役に立たない熱環境の非自明な利用を活用して、量子電池をリサイクルする。
本報告では, 熱的操作によって生じる絡み合いを特徴付けるため, 得られた電荷の相違について報告する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:28:58 GMT)
Lifted Successor Generation in Numeric Planning [0.0] ほとんどのプランナーは、数値的な計画タスクを基礎的なタスク表現に置きます。
これにより、タスク表現サイズが指数関数的に爆発する可能性がある。
我々は、数値プレコンディショナビリティをサポートするため、古典的な計画のために最先端のリフトアップ後継ジェネレータを拡張した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:33:16 GMT)
Leveraging Multi-Agent System (MAS) and Fine-Tuned Small Language Models (SLMs) for Automated Telecom Network Troubleshooting [0.0] テレコムネットワークは、規模と複雑さが急速に増加し、効率的な管理、運用、最適化がますます困難になっている。
既存のモデルはスコープが狭く、大量のラベル付きデータを必要とし、異種デプロイメントを一般化するのに苦労することが多い。
本稿では,エージェントワークフローを利用するマルチエージェントシステム (MAS) を提案し,LLM(Large Language Models) が完全自動ネットワークトラブルシューティングのための特別なツールをコーディネートする。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 18:19:41 GMT)
LGCA: Enhancing Semantic Representation via Progressive Expansion [0.0] Localized-Globalized Cross-Alignment (LGCA)は、まず画像の局所的な特徴をキャプチャし、次に最も有能な領域を選択して拡張するフレームワークである。
提案手法は,多種多様なデータセット間のゼロショット性能を大幅に向上させ,最先端のベースラインよりも優れる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:09:42 GMT)
Key and Value Weights Are Probably All You Need: On the Necessity of the Query, Key, Value weight Triplet in Decoder-Only Transformers [0.0] クエリの重みが冗長であることの仮定を単純化し、非埋め込み/lmヘッドパラメータの数を8%以上削減する。
完全複雑GPT-3小アーキテクチャの理論を検証した。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:55:07 GMT)
Identifying Entanglement Phases with Bipartite Projected Ensembles [0.0] 量子多体波動関数に対するバイパルタイト射影アンサンブル(BPE)を導入する。
体積法則の絡み合った状態において、EAEはサブシステム間の距離を増大させる非ゼロ値に収束する。
EAEは相転移の証人として機能するだけでなく、動的スケーリングや表面臨界指数などの重要な現象特性も明らかにしている。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 07:08:20 GMT)
Human-AI Programming Role Optimization: Developing a Personality-Driven Self-Determination Framework [0.0] 論文は、自己決定理論とパーソナリティ心理学を通じて、人間とAIのプログラミングの役割を最適化する。
The Explorer (high Openness/low Agreeableness)、The Orchestrator (high Extraversion/Agreeableness)、The Craftsperson (high Neuroticism/low Extraversion)、The Architect (high Conscientiousness)、The Adapter (balanced profile)の5つの異なる個人的アーティタイプが出現する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:00:14 GMT)
Horizon brightened acceleration radiation entropy in causal diamond geometry: A near-horizon perspective [0.0] 我々は、元来Marlan Scullyらによって導入された地平面輝度加速放射(HBAR)フレームワークを拡張した。
放射スペクトルは温度$T_D = 1/(ピアルファ)$で、関連するフォン・ノイマンエントロピーフラックスは放射場のエントロピー生成を再現する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:50:36 GMT)
Gaining Momentum: Uncovering Hidden Scoring Dynamics in Hockey through Deep Neural Sequencing and Causal Modeling [0.0] 本稿では,プロホッケーにおける攻撃モーメントの定量化と強化,および確率(予測目標,xG)を評価するための統一されたデータ駆動フレームワークを提案する。
我々のフレームワークは、コーチやアナリストにリアルタイムで行動可能な洞察を提供し、原則的かつ因果的な戦術最適化に向けてホッケー分析を進めます。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 16:36:53 GMT)
Exploring and Mitigating Gender Bias in Encoder-Based Transformer Models [0.0] 本稿では,トランスフォーマーモデルの重要な構成要素である文脈的単語埋め込みにおけるジェンダーバイアスについて検討する。
バイアスの度合いを定量化するために,マスク付きトークンを埋めるモデル確率に基づいてバイアスを評価する新しい計量MALoRを導入する。
実験により,異なる代名詞対における性別バイアススコアの顕著な減少が示された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:49:44 GMT)
Evaluation and Optimization of Leave-one-out Cross-validation for the Lasso [0.0] 私は,ラッソの残余のクロスバリデーションを計算できる分数式を生成するアルゴリズムを開発した。
アルゴリズムがどのように修正され、より大規模なデータセットに適合し、ほぼ一対一のクロスバリデーションを計算することができるかを示す。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:55:05 GMT)
Entanglement Hamiltonian and orthogonal polynomials [0.0] 我々は、特定の形の不均一性を持つ自由フェルミオン鎖に対するハミルトニアンの絡み合いについて研究する。
この変形は局所的逆温度として解釈され、連続極限で得られることを示す。
この予測を用いて、通勤作用素の適切に再スケールされた固有値は、絡み合いスペクトルとエントロピーの非常に良い近似を与える。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 11:24:09 GMT)
Employee Performance when Implementing Agile Practices in an IT Workforce [0.0] 本研究は,南アフリカのIT従事者を対象とした,アジャイル環境における従業員のパフォーマンスについて調査する。
私たちの結果は、アジャイルプラクティスが従業員のパフォーマンスに大きく影響していることを示している。
私たちの調査結果は、アジャイルの課題に対処し、さらなるサポートを提供すれば、従業員のパフォーマンスが大幅に改善できることを示唆しています。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:09:39 GMT)
Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach [0.0] 従来のディープフェイク検出方法は、Stable DiffusionやDALL-Eのようなテキストと画像のシステムでは失敗する。
本稿では,多強度画像再構成を応用した拡散型法科学フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 01:35:54 GMT)
Delta-learned force fields for nonbonded interactions: Addressing the strength mismatch between covalent-nonbonded interaction for global models [0.0] textit$Delta$-sGDMLは、フラグメント固有のモデルを訓練し、推論時にそれらを合成することによって、分子内および分子間物理学を分解するスケールアウェアな定式化である。
textit$Delta$-sGDMLは1つのグローバルモデルに対して一貫した利得を示し、エネルギー精度を損なうことなく、フラグメント解決された力-エラーの削減をtextbf75%まで削減する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 06:15:05 GMT)
Continual Learning with Query-Only Attention [0.0] 継続的な学習には、データポイントを繰り返すことなく、データのストリームから学ぶことが含まれる。
本稿では,キーと値を捨てるクエリのみのアテンション機構を提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 03:58:05 GMT)
Comment on "Consequences of the single-pair measurement of the Bell parameter" [0.0] ベル-CHSHの不等式はベルパラメータ全体に基づいていないので、これらの実験は経験的実験とは無関係である。
ベルパラメータ全体を測定するこれらの新しい実験の物理的意味は、異なる解釈が可能であることを指摘している。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 12:42:53 GMT)
Chronic Diseases Prediction using Machine Learning and Deep Learning Methods [0.0] 本研究は,慢性疾患および甲状腺疾患の予測に機械学習(ML)およびディープラーニング(DL)技術の応用について検討した。
我々は、ロジスティック回帰(LR)、ランダムフォレスト(RF)、グラディエントブーストツリー(GBT)、ニューラルネットワーク(NN)、決定木(DT)、ネイティブベイズ(NB)など、さまざまなモデルを使用した。
その結果、ランダムフォレストやグラディエントブーストツリーのようなアンサンブル手法は一貫して優れていた。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 09:16:50 GMT)
Beyond PCA: Manifold Dimension Estimation via Local Graph Structure [0.0] そこで本研究では,PCAと回帰に基づく手法を統合することで,多様体次元推定のための一般的なフレームワークを提案する。
本枠組みでは,2次埋め込み (QE) と最小二乗 (TLS) の2つの代表的な推定器を紹介する。
合成されたデータセットと実世界のデータセットの両方の実験では、これらの手法が最先端の代替手段と競合し、しばしば優れています。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 00:45:20 GMT)
Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet [0.0] 本稿では,透過ファジィ推論手法(ANFIS-FBCSP-PSO)とBCIコンペティションIV-2aデータセットを用いたディープラーニングベンチマーク(EEGNet)を比較した。
物体内実験では、ファジィニューラルモデルは68.58パーセント+/-13.76パーセントの精度で、カッパ=58.04パーセント+/-18.43)。
本研究は,MI-BCIシステムを選択するための実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 02:42:01 GMT)
BEN: Using Confidence-Guided Matting for Dichotomous Image Segmentation [0.0] CGM(Confidence-Guided Matting)と呼ばれる画像セグメンテーションのための新しいアーキテクチャ手法を提案する。
BEN は、初期セグメンテーションのための BEN Base と信頼性ベースの精錬のための BEN Refiner の2つのコンポーネントで構成されている。
本研究は,コンピュータビジョンにおける微粒化オブジェクト境界予測を改善するため,マッチングとセグメンテーション技術を統合するための新しいパラダイムを導入する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 15:04:27 GMT)
Automated Invoice Data Extraction: Using LLM and OCR [0.0] この研究は、OCR、ディープラーニング、LLM(Large Language Models)、グラフ分析を組み合わせた総合人工知能(AI)プラットフォームを導入し、前例のない抽出品質と一貫性を実現する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 19:05:09 GMT)
Applying Medical Imaging Tractography Techniques to Painterly Rendering of Images [0.0] トラクトグラフィーアルゴリズムを用いて、人間の絵を描く過程を模倣するブラシストロークを配置することができる。
この技法を肖像画や一般画像で実演し、繊維追跡とブラシストローク配置の類似性について論じる。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 20:51:01 GMT)
Agentic Educational Content Generation for African Languages on Edge Devices [0.0] 本研究では,エッジデバイス上での教育コンテンツ生成のための自律型エージェントオーケストレーションフレームワークを提案する。
このフレームワークは高い多言語品質を提供し、BLEUスコアは0.688、文化的妥当性は4.4/5、公試されたアフリカの言語は4.2/5だった。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:13:47 GMT)
Accuracy estimation of neural networks by extreme value theory [0.0] ニューラルネットワークのエラー、すなわち、関数とニューラルネットワークの間の残りのバイアスを定量化する方法は明確ではない。
本稿では,誤差の大きい値の定量化に極値理論を適用することを提案する。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:52:51 GMT)
ADPO: Anchored Direct Preference Optimization [0.0] 本稿では、ポリシー更新を基準モデルにアンロックすることで、ソフトでリストワイズな監視から学習するフレームワークを提案する。
私たちの重要な理論的貢献は、このアンカー機構がポリシー更新に暗黙の信頼領域を課すことを示すことです。
私たちの中心的な経験的発見は、アンカー更新戦略間のタスク依存のトレードオフです。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 10:49:23 GMT)
A Voice-Enabled Virtual Patient System for Interactive Training in Standardized Clinical Assessment [0.0] 大規模言語モデル(LLM)を利用した音声対応仮想患者シミュレーションシステムを提案する。
本研究は, 本システムの発展を概説し, 既定の臨床像に固執する仮想患者を創出する能力を検証した。
以上の結果から, LLMを用いた仮想患者シミュレーションは, 臨床医の教育に有効かつスケーラブルなツールであることが示唆された。
論文参考訳(メタデータ) (Sat, 01 Nov 2025 21:18:08 GMT)