InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency [255.9] InternVL 3.5は、多目的性、推論能力、推論効率を大幅に向上させる、オープンソースの新しいマルチモーダルモデルである。
主要なイノベーションはCascade Reinforcement Learningフレームワークで、2段階のプロセスを通じて推論を強化する。
我々の最大のモデルであるInternVL3.5-241B-A28Bは、一般的なマルチモーダル、推論、テキスト、エージェントタスクにわたるオープンソースのMLLMの最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:39:45 GMT)
Apple Intelligence Foundation Language Models: Tech Report 2025 [230.9] AppleのデバイスやサービスにまたがってAppleのインテリジェンス機能を駆動する2つの基礎言語モデルを紹介します。
どちらのモデルも、責任あるWebクローリングを通じてソースされる大規模なマルチリンガルデータセットとマルチモーダルデータセットに基づいてトレーニングされている。
新しいSwift中心のFoundation Modelsフレームワークでは、ガイド付き生成、制約付きツール呼び出し、LoRAアダプタの微調整が公開されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:34:47 GMT)
Learning to Refine: Self-Refinement of Parallel Reasoning in LLMs [102.5] 本稿では,新しい並列テスト時間スケーリングフレームワークであるGenerative Self-Refinement (GSR)を紹介する。
GSRは一連の候補応答を並列に生成し、その後自己精製を行い、新しい優れた解を合成する。
提案手法は,5つの数学ベンチマークにおいて,最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:51:48 GMT)
Utility-Focused LLM Annotation for Retrieval and Retrieval-Augmented Generation [96.2] 本稿では,大規模言語モデル (LLM) を用いた検索・検索・拡張生成システム (RAG) の訓練における文書ユーティリティのアノテートについて検討する。
以上の結果から,LLM生成アノテーションは,人間のアノテーションや下流QAメトリクスのみを訓練したモデルと比較して,ドメイン外検索性能の向上とRAG結果の改善を図っている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:51:44 GMT)
Evaluating Language Model Reasoning about Confidential Information [95.6] 言語モデルが文脈的堅牢性を示すか、文脈依存型安全仕様に準拠する能力を示すかを検討する。
我々は,ユーザ要求がいつ承認されたか,言語モデルが正しく判断できるかどうかを測定するベンチマーク(PasswordEval)を開発した。
現在のオープンソースとクローズドソースのモデルでは、一見単純な作業に苦労しています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:39:46 GMT)
Time-Aware One Step Diffusion Network for Real-World Image Super-Resolution [95.6] 拡散に基づく実世界の超解像法(Real-ISR)は優れた性能を示した。
効率的なReal-ISRを実現するために、多くの研究は変分スコア蒸留(VSD)を用いて、固定時間ステップのワンステップSRに対して事前訓練された安定拡散(SD)モデルを蒸留する。
リアルタイムISR(TADSR)のためのタイムアウェアワンステップ拡散ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:00:29 GMT)
Chain-of-Reasoning: Towards Unified Mathematical Reasoning in Large Language Models via a Multi-Paradigm Perspective [87.9] CoR(Chain-of-Reasoning)は、複数の推論パラダイムを統合する新しい統合フレームワークである。
CoRは異なる推論パラダイムによって複数の潜在的な答えを生成し、それらをコヒーレントな最終解へと合成する。
実験の結果,CoR-Math-7Bは現在のSOTAモデルより有意に優れていた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:56:53 GMT)
AudioStory: Generating Long-Form Narrative Audio with Large Language Models [87.2] AudioStoryは、大きな言語モデルとテキストからオーディオシステムを統合して、構造化された長文の音声物語を生成するフレームワークである。
LLMを用いて複雑な物語クエリを時間順に並べたサブタスクに分解する。
広汎な実験により,単一音声生成と物語音声生成の両方においてAudioStoryの優位性が,指示追従能力と音声忠実性の両方において,TTAベースラインを上回った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:55:38 GMT)
CODA: Coordinating the Cerebrum and Cerebellum for a Dual-Brain Computer Use Agent with Decoupled Reinforcement Learning [81.1] 既存のアプローチはトレードオフに苦しむ: ジェネラリストのエージェントは計画に精通するが実行時に性能が悪く、専門のエージェントは反対の弱点を示す。
最近の構成フレームワークは、プランナーとアクターを組み合わせることで、このギャップを埋めようとしているが、それらは通常静的で、訓練不能である。
我々は、ジェネラリストプランナーとスペシャリストエグゼキュータを統合した、新しく訓練可能な構成フレームワークであるCODAを紹介する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:59:50 GMT)
GeoSAM2: Unleashing the Power of SAM2 for 3D Part Segmentation [81.1] GeoSAM2は3次元部分分割のためのプロンプト制御可能なフレームワークである。
テクスチャのないオブジェクトが与えられた場合、事前に定義された視点から正規写像とポイントマップを描画する。
部品の選択をガイドするシンプルな2Dプロンプト(クリックやボックス)を受け入れます。
予測されたマスクはオブジェクトにバックプロジェクションされ、ビューに集約される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:10:30 GMT)
On Domain-Adaptive Post-Training for Multimodal Large Language Models [78.7] 本稿では,MLLMのドメイン適応をポストトレーニングにより体系的に検討する。
データ合成、トレーニングパイプライン、タスク評価に重点を置いています。
バイオメディシン、食品、リモートセンシングなどの高インパクト領域で実験を行う。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:21:58 GMT)
Explain Before You Answer: A Survey on Compositional Visual Reasoning [74.3] 構成的視覚推論は、マルチモーダルAIにおける重要な研究フロンティアとして登場した。
本調査は,トップ会場(CVPR,ICCV,NeurIPS,ICML,ACLなど)から260以上の論文を体系的にレビューする。
次に60以上のベンチマークとそれに対応するメトリクスを、基底精度、連鎖忠実性、高分解能知覚などの次元に沿って探索する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:55:54 GMT)
X-Prompt: Towards Universal In-Context Image Generation in Auto-Regressive Vision Language Foundation Models [74.0] インコンテキスト生成は、大規模言語モデル(LLM)のオープンタスク一般化機能の重要なコンポーネントである。
X-Promptは純粋に自動回帰型の大規模言語モデルであり、画像生成タスクと見えないタスクの両方で、幅広いパフォーマンスを提供するように設計されている。
テキストと画像の予測を統一したトレーニングタスクにより、X-Promptは、テキスト内の例からタスク認識を強化して、一般的な画像生成を処理できる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:26:39 GMT)
ReSURE: Regularizing Supervision Unreliability for Multi-turn Dialogue Fine-tuning [72.1] マルチターン対話システムは、低品質のデータに晒された場合、しばしば劣化した性能に悩まされる。
本稿では,適応学習手法であるReSUREを提案する。
単一ソースと混合品質のデータセットの実験では、安定性と応答品質が改善された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:54:01 GMT)
A Survey on Parallel Text Generation: From Parallel Decoding to Diffusion Language Models [71.7] トークン・バイ・トークン生成のボトルネックを破り、推論効率を向上させることを目的とした並列テキスト生成技術。
既存のアプローチをARベースのパラダイムと非ARベースのパラダイムに分類し、各カテゴリの中核技術について詳細に検討する。
我々は、最近の進歩を強調し、オープンな課題を特定し、並列テキスト生成における将来的な研究の方向性を概説する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:08:49 GMT)
DATABench: Evaluating Dataset Auditing in Deep Learning from an Adversarial Perspective [70.8] 内的特徴(IF)と外的特徴(EF)(監査のための技術導入)に依存した既存手法の分類を新たに導入する。
回避攻撃(evasion attack)は、データセットの使用を隠蔽するために設計されたもので、偽造攻撃(forgery attack)は、未使用のデータセットを誤って含んでいることを意図している。
さらに,既存手法の理解と攻撃目標に基づいて,回避のための分離・除去・検出,偽造の逆例に基づく攻撃方法など,系統的な攻撃戦略を提案する。
私たちのベンチマークであるData dataBenchは、17の回避攻撃、5の偽攻撃、9の攻撃で構成されています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:41:15 GMT)
R-TPT: Improving Adversarial Robustness of Vision-Language Models through Test-Time Prompt Tuning [69.7] 視覚言語モデル(VLM)のためのロバストテスト時プロンプトチューニング(R-TPT)を提案する。
R-TPTは、推論段階における敵攻撃の影響を緩和する。
プラグアンドプレイの信頼性に基づく重み付きアンサンブル戦略を導入し,防御強化を図る。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:19:03 GMT)
Small Batch Size Training for Language Models: When Vanilla SGD Works, and Why Gradient Accumulation Is Wasteful [69.6] この作業は、バッチサイズ1まで、小さなバッチサイズを見直します。
小さいバッチサイズは安定してトレーニングし、より大きなバッチサイズよりもFLOP当たりのパフォーマンスが等しく、あるいは良好であることが分かりました。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:54:27 GMT)
SoK: Large Language Model Copyright Auditing via Fingerprinting [69.1] 既存の手法をホワイトボックスとブラックボックスのアプローチに分類する統一的な枠組みと形式的な分類法を導入する。
現実的な展開シナリオ下でのLDMフィンガープリント評価のための最初の体系的ベンチマークであるLeaFBenchを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:56:57 GMT)
Language Models Identify Ambiguities and Exploit Loopholes [67.7] ループホールに対する大規模言語モデル(LLM)の応答について検討する。
ループホールを利用するモデルは、曖昧さと矛盾する目標の両方を明確に識別し、推論する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:40:17 GMT)
Spotlight Attention: Towards Efficient LLM Generation via Non-linear Hashing-based KV Cache Retrieval [67.2] 本研究では,クエリやキーの埋め込み分布を最適化するために,非線形ハッシュ関数を利用する新しい手法であるSpotlight Attentionを紹介する。
また、Bradley-Terryランキングに基づく損失を利用して、軽量で安定したトレーニングフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:11:27 GMT)
Integrating SAM Supervision for 3D Weakly Supervised Point Cloud Segmentation [66.7] 3Dセマンティックセグメンテーションの現在の手法では、大きな、不規則な、秩序のない3Dポイントクラウドデータの注釈付けの難しさに対処するため、限定アノテーション付きトレーニングモデルが提案されている。
本稿では,2次元基礎モデルから生成したセグメンテーションマスクを組み込んだ,疎可な3次元アノテーションの有用性を最大化する手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:13:01 GMT)
Pseudo-Simulation for Autonomous Driving [66.2] 既存の自動運転車(AV)の評価パラダイムは、重大な制限に直面している。
現実世界の評価は、安全上の懸念と現実主義の欠如のためにしばしば困難である。
オープンループ評価は、一般的に複合的なエラーを見落としているメトリクスに依存する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:55:31 GMT)
A Systematic Survey of Model Extraction Attacks and Defenses: State-of-the-Art and Perspectives [65.3] 近年の研究では、敵が対象モデルの機能を複製できることが示されている。
モデル抽出攻撃は知的財産権、プライバシー、システムのセキュリティに脅威をもたらす。
本稿では,攻撃機構,防衛手法,計算環境に応じてMEAを分類する新しい分類法を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:10:26 GMT)
T2R-bench: A Benchmark for Generating Article-Level Reports from Real World Industrial Tables [65.1] 本稿では,テーブル・ツー・レポーティングタスクを提案し,T2R-benchというバイリンガルベンチマークを構築した。
ベンチマークは457の産業用テーブルで構成されており、すべて現実世界のシナリオから導かれ、19の産業ドメインを含んでいる。
25台のLLMでの実験により、Deepseek-R1のような最先端のモデルでさえ62.71のスコアでしか性能を達成できないことが明らかになった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:55:40 GMT)
NPHardEval4V: Dynamic Evaluation of Large Vision-Language Models with Effects of Vision [64.8] NPHardEval4Vは4つの古典的NPハード問題に基づくマルチモーダルベンチマークスイートである。
各タスクは、構造化された視覚レイアウトとテキストプロンプトを組み合わせることで、視覚言語的制約の下で推論を行うLVLMの能力を評価するように設計されている。
以上の結果から,これらのモデルは知覚に基づく入力に対して合理的に優れているが,グローバルな最適化,抽象化,制約満足度に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:37:31 GMT)
AppAgent-Pro: A Proactive GUI Agent System for Multidomain Information Integration and User Assistance [64.8] AppAgent-Proは、ユーザ命令に基づいて複数のドメイン情報を積極的に統合するプロアクティブGUIエージェントシステムである。
AppAgent-Proは、日常生活における情報取得を根本的に再定義する可能性を秘めている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:25:35 GMT)
Emotion Transfer with Enhanced Prototype for Unseen Emotion Recognition in Conversation [64.7] 会話における未知感情認識(UERC)タスクを初めて紹介する。
本稿では,プロトタイプベースの感情伝達フレームワークProEmoTransを提案する。
ProEmoTransは有望だが、依然として重要な課題に直面している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:16:16 GMT)
Discrete Diffusion VLA: Bringing Discrete Diffusion to Action Decoding in Vision-Language-Action Policies [64.2] 本稿では、離散化作用チャンクを離散拡散でモデル化し、VLMバックボーンと同じエントロピー目的で訓練するシングルトランスフォーマーポリシーを提案する。
本手法は, 簡単な動作要素をハードなものよりも先に解決する適応的復号法を実現する。
この統合デコーダは、事前訓練された視覚言語を保存し、並列デコードをサポートし、自己回帰的ボトルネックを破り、機能評価の回数を減らす。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:39:11 GMT)
Self-Supervised Pre-Training with Equilibrium Constraints [64.2] 異種データを扱うための自己教師付き事前学習手法を提案する。
我々は、モデルが各不均一データのソースを局所的最適に最適化することを確実にするために、追加の平衡制約を課す。
マルチドメインと多言語データセットを用いた自己教師付き事前学習実験を行った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:48:50 GMT)
UNIFORM: Unifying Knowledge from Large-scale and Diverse Pre-trained Models [62.8] UNIFORMと呼ばれる新しいフレームワークを導入し、多様なオフザシェルフモデルから1つの学生モデルへ知識を伝達する。
本稿では,ロジットレベルでも機能レベルでも知識のコンセンサスを捉えるための,専用の投票機構を提案する。
UNIFORMは、強い知識伝達ベースラインに比べて、教師なしオブジェクト認識性能を効果的に向上することを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:56:11 GMT)
Image Quality Assessment for Machines: Paradigm, Large-scale Database, and Models [60.4] マシンビジョンシステム(MVS)は、視覚の悪条件下での性能劣化に対して本質的に脆弱である。
画像劣化がMVS性能に与える影響を定量的に評価するマシン中心画像品質評価(MIQA)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:07:24 GMT)
Blockwise SFT for Diffusion Language Models: Reconciling Bidirectional Attention and Autoregressive Decoding [60.1] 離散拡散言語モデルは、テキスト生成に強い可能性を示している。
半自己回帰推論による微調整ミスアライメントの標準化
我々は、応答を固定サイズブロックに分割するBlockwise SFTを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:49:33 GMT)
GS: Generative Segmentation via Label Diffusion [59.4] 言語駆動のイメージセグメンテーションは、自然言語表現に対応する画像の領域を分割するモデルを必要とする、視覚言語理解の基本的なタスクである。
近年の拡散モデルがこの領域に導入されているが、既存のアプローチは画像中心のままである。
生成タスクとしてセグメンテーション自体を定式化する新しいフレームワークであるGS(Generative Label)を提案する。
実験の結果,GSは既存の差別的・拡散的手法を著しく上回り,言語駆動セグメンテーションのための新たな最先端技術が確立された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:28:15 GMT)
Memory-R1: Enhancing Large Language Model Agents to Manage and Utilize Memories via Reinforcement Learning [59.2] 大規模言語モデル(LLM)は、幅広いNLPタスクで印象的な機能を示しているが、基本的にはステートレスである。
本稿では,LLMに外部メモリを積極的に管理・活用する機能を備えた強化学習フレームワークであるMemory-R1を提案する。
152組の質問応答対と、トレーニング用の時間記憶バンクで、Memory-R1は最も競争力のある既存のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:26:55 GMT)
Intellectual Property in Graph-Based Machine Learning as a Service: Attacks and Defenses [57.9] この調査は、GMLモデルとグラフ構造化データの両方のレベルで、脅威と防御の最初の分類を体系的に導入する。
本稿では,IP保護手法の有効性を評価し,ベンチマークデータセットのキュレートしたセットを導入し,その適用範囲と今後の課題について論じるシステム評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:37:52 GMT)
Know "No" Better: A Data-Driven Approach for Enhancing Negation Awareness in CLIP [57.3] 本稿では,大言語モデル(LLM)と多モーダルLLMを用いたデータ生成パイプラインを導入し,否定を包含するキャプションを生成する。
パイプラインから生成したデータを微調整したCLIPを用いて,一般性を維持しつつ否定意識を高めるNegationCLIPを開発した。
さまざまなCLIPアーキテクチャの実験は、CLIPの否定を正確に認識する能力を向上する上で、データ生成パイプラインの有効性を検証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:29:07 GMT)
Diffusion Language Models Know the Answer Before Decoding [57.0] 拡散言語モデル (DLM) は自己回帰的アプローチの代替として登場した。
我々の研究は、DLMの早期回答収束の見過ごされた特性を強調し、活用する。
Prophetは、早期コミット復号を可能にするトレーニングフリーの高速復号化パラダイムである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:40:25 GMT)
Alignment with Fill-In-the-Middle for Enhancing Code Generation [56.8] コードスニペットを小さな粒度のブロックに分割し,同じテストケースからより多様なDPOペアを生成する手法を提案する。
提案手法は,HumanEval (+), MBPP (+), APPS, LiveCodeBench, BigCodeBenchといったベンチマークデータセットの実験によって検証された,コード生成タスクの大幅な改善を示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:15:53 GMT)
LabelGS: Label-Aware 3D Gaussian Splatting for 3D Scene Segmentation [56.4] 3D Gaussian Splatting (3DGS)は、3Dシーンの新たな明示的な表現として登場し、高忠実度再構成と効率的なレンダリングの両方を提供している。
ガウス表現をオブジェクトラベルで拡張する手法であるラベル対応3Dガウス分割法(LabelGS)を提案する。
LabelGSはFeature-3DGSと比較して、1440X1080の解像度でトレーニングで22倍のスピードアップを達成した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:07:38 GMT)
Discrete-Guided Diffusion for Scalable and Safe Multi-Robot Motion Planning [56.2] マルチロボット運動計画(MPMP)は、共有された連続作業空間で動作する複数のロボットのための軌道を生成する。
離散マルチエージェント探索(MAPF)法は,その拡張性から広く採用されているが,粗い離散化の軌道品質は高い。
本稿では、制約付き生成拡散モデルを用いた離散MAPF解法を導入することにより、2つのアプローチの限界に対処する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:59:36 GMT)
Interact-Custom: Customized Human Object Interaction Image Generation [55.9] 本稿では,カスタマイズされたオブジェクトインタラクション画像生成の課題を提案する。
対象の人間の対象に対するアイデンティティの保存と、それら間の相互作用の意味制御が同時に必要である。
1)人間オブジェクトを自己完結したアイデンティティ特徴とポーズ指向のインタラクション特徴に分解する必要があるが、現在のHOI画像データセットはそのような特徴分解学習に理想的なサンプルを提供していない。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:15:16 GMT)
AIM: Adaptive Intra-Network Modulation for Balanced Multimodal Learning [55.6] そこで我々は,適応型ネットワーク内変調(AIM)を提案し,バランスの取れたモダリティ学習を改善する。
AIMは、変調中のネットワーク内のパラメータと深さの最適化状態の違いを考慮に入れている。
AIMは、複数のベンチマークにおいて、最先端の非バランスなモダリティ学習方法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:53:36 GMT)
Mitigating Hallucinations in Multimodal LLMs via Object-aware Preference Optimization [55.5] MLLM(Multimodal Large Language Models)は、様々なタスクに対処するための統一インターフェースとして登場した。
多くのベンチマークで最先端の結果が誇示されているにもかかわらず、長年の問題はMLLMが幻覚を起こす傾向にある。
本稿では,幻覚の問題をアライメント問題として取り上げ,幻覚を伴わないコンテンツを生成するためのMLLMのステアリングを試みる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:02:04 GMT)
Thinking Before You Speak: A Proactive Test-time Scaling Approach [54.8] emphThinking Before You Speak (TBYS)という名前の推論フレームワークとして、私たちのアイデアを実装しています。
インテリジェンス生成のためのコンテキスト内サンプルを自動的に収集・フィルタリングするパイプラインを設計する。
挑戦的な数学的データセットの実験は、TBYSの有効性を検証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:51:03 GMT)
Can Large Language Models Develop Strategic Reasoning? Post-training Insights from Learning Chess [54.5] チェスにおける強化学習(RL)を通して,大規模言語モデル (LLM) が戦略的推論能力を発達させることができるかを検討する。
以上の結果から, 蒸留法に基づく高密度報酬は, 希少な二進報酬よりも優れていることが示唆された。
我々は、チェス推論訓練におけるSFTおよびRLの略語を提供し、この制限が、事前訓練されたモデルのチェスに対する内部理解の欠如に起因する証拠を見つける。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:56:13 GMT)
11Plus-Bench: Demystifying Multimodal LLM Spatial Reasoning with Cognitive-Inspired Analysis [54.2] 本研究では,最先端MLLMの空間的推論能力を評価するためのシステム評価フレームワークを提案する。
14個のMLLMの実験と人間の評価により、現在のMLLMは空間認知の早期の兆候を示すことが明らかとなった。
これらの知見は,現在のMLLMの空間的推論能力の出現能力と限界の両方を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:22:34 GMT)
Video-LLMs with Temporal Visual Screening [53.9] テンポラル・ビジュアル・スクリーニング (TVS) はビデオ質問応答とチューニングデータを処理する新しいタスクである。
TVSは、ビデオインストラクションチューニング(トレーニング)とビデオ質問回答(推論)パイプラインの両方にシームレスに統合可能な、モジュール化されたフロントエンドアダプタタスクとして定式化されている。
実験により、TVSを取り入れた場合、相対利得は7.33%(トレーニング)、34.6%(推論)となることが示された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:33:32 GMT)
Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [53.2] DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。
OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。
本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:27:06 GMT)
DeepScholar-Bench: A Live Benchmark and Automated Evaluation for Generative Research Synthesis [52.6] 本稿では,生のベンチマークと総合的自動評価フレームワークであるDeepScholar-benchを紹介する。
DeepScholar-benchは、最近の高品質なArXiv論文からクエリを抽出し、真の研究合成タスクにフォーカスしている。
また,LOTUS APIを用いて効率的に実装した参照パイプラインであるDeepScholar-baseを開発した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:36:34 GMT)
Ego-centric Predictive Model Conditioned on Hand Trajectories [52.5] 自我中心のシナリオでは、次の行動とその視覚的結果の両方を予測することは、人間と物体の相互作用を理解するために不可欠である。
我々は,エゴセントリックなシナリオにおける行動と視覚的未来を共同でモデル化する,統合された2段階予測フレームワークを提案する。
我々のアプローチは、エゴセントリックな人間の活動理解とロボット操作の両方を扱うために設計された最初の統一モデルである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:09:55 GMT)
CrystalDiT: A Diffusion Transformer for Crystal Generation [52.5] 本稿では,結晶構造生成のための拡散変圧器であるCrystalDiTについて述べる。
CrystalDiTは、格子と原子特性を単一の相互依存系として扱う、強力な誘導バイアスを課す統一トランスフォーマーを使用している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:45:12 GMT)
StepWiser: Stepwise Generative Judges for Wiser Reasoning [52.3] プロセス報酬モデルは、ステップバイステップのフィードバックを提供することによって、この問題に対処する。
近年の進歩に触発されて、分類タスクから推論タスク自体への段階的な報酬モデリングを再構築しました。
既存の手法よりも中間段階の精度が向上し, (ii) 訓練時の政策モデルの改善に利用でき, (iii) 推論時探索の改善が図られている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:17:02 GMT)
RoboTwin 2.0: A Scalable Data Generator and Benchmark with Strong Domain Randomization for Robust Bimanual Robotic Manipulation [52.2] 我々は,多様かつ現実的なデータの自動生成のためのスケーラブルなフレームワークであるRoboTwin 2.0を紹介する。
コアとなるRoboTwin-ODは、セマンティックおよび操作関連アノテーションを備えた147カテゴリにわたる771インスタンスのオブジェクトライブラリである。
sim-to-real転送を改善するために、RoboTwin 2.0は5つの軸に沿って構造化された領域ランダム化を適用する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:52:42 GMT)
Technology as uncharted territory: Contextual integrity and the notion of AI as new ethical ground [51.9] 私は、責任と倫理的AIを促進する努力が、確立された文脈規範に対するこの軽視に必然的に貢献し、正当化することができると論じます。
私は、道徳的保護よりも道徳的革新のAI倫理における現在の狭い優先順位付けに疑問を呈する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 23:13:44 GMT)
PhoniTale: Phonologically Grounded Mnemonic Generation for Typologically Distant Language Pairs [51.7] 大規模言語モデル (LLM) は、学習者の第一言語から類似したキーワードを活用することで、キーワード・モニーモニックを生成するために使われている。
音韻的類似性に基づいてL1キーワード列を検索する新しい言語間メタモニック生成システムであるPhoniTaleを提案する。
以上の結果から, PhoniTale はヒトのmnemonics と同等に機能することが明らかとなった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:29:31 GMT)
Video-LevelGauge: Investigating Contextual Positional Bias in Large Video Language Models [51.7] 大規模ビデオ言語モデル(LVLM)における位置バイアスを評価するためのベンチマークであるVideo-LevelGaugeを提案する。
我々は、標準化されたプローブとカスタマイズされたコンテキスト設定を採用し、コンテキスト長、プローブ位置、コンテキストタイプを柔軟に制御できる。
ベンチマークでは、複数のタイプにまたがる438の動画を手動でキュレートし、117の高品質なマルチチョイスの質問と120のオープンエンドの質問を得た。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:58:16 GMT)
SELF: Surrogate-light Feature Selection with Large Language Models in Deep Recommender Systems [51.1] ディープレコメンデータシステムのためのSurrogatE-Light特徴選択法
SELFは、大規模言語モデルからのセマンティック推論と、代理モデルからのタスク固有の学習を統合する。
実世界のレコメンデータプラットフォームからの3つの公開データセットに関する総合的な実験は、SELFの有効性を検証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:33:34 GMT)
Bounds on Perfect Node Classification: A Convex Graph Clustering Perspective [50.3] 本稿では,ノードラベルやノードの特徴に合致するコミュニティを基盤とした,トランスダクティブノード分類問題の解析を行う。
ノード分類において,スペクトルグラフクラスタリングフレームワークにノード固有情報を組み込んだ新しい最適化問題を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:22:35 GMT)
PersonaAnimator: Personalized Motion Transfer from Unconstrained Videos [50.3] PersonaAnimatorは、制約のないビデオから直接パーソナライズされた動きパターンを学習する。
PersonaVidは、ビデオベースのパーソナライズされたモーションデータセットとしては初めてのものだ。
本研究では,物理を意識した運動スタイル正規化機構を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:52:25 GMT)
Complementary Learning System Empowers Online Continual Learning of Vehicle Motion Forecasting in Smart Cities [50.1] 本稿では、ディープニューラルネットワーク(DNN)に基づくモーション予測のためのタスクレスオンライン連続学習パラダイムであるDual-LSを紹介する。
3つの国にまたがる自然主義的なデータ、772,000台以上の車両、11,187kmの累積的な試験マイルは、Dual-LSが74.31%の破滅的な忘れを緩和していることを示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:19:21 GMT)
Self-Rewarding Vision-Language Model via Reasoning Decomposition [49.8] VLM(Vision-Language Models)はしばしば視覚幻覚に悩まされ、実際に画像にないものや言語ショートカットが語られる。
本稿では,外部視覚監督に頼らずに視覚推論を改善する自己回帰手法であるVision-SR1を紹介する。
我々の実験は、Vision-SR1が視覚的推論を改善し、視覚幻覚を緩和し、言語ショートカットへの依存を減らすことを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:01:03 GMT)
Generative Models for Synthetic Data: Transforming Data Mining in the GenAI Era [49.5] このチュートリアルでは、合成データ生成の基礎と最新の進歩を紹介する。
Atendeesは、生成的合成データを活用してデータマイニングの研究と実践を強化する、実用的な洞察を得る。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:04:07 GMT)
Plug-in Feedback Self-adaptive Attention in CLIP for Training-free Open-Vocabulary Segmentation [48.5] CLIPは、強い視覚的テキストアライメントを示すが、ローカライゼーションが不十分なため、オープン語彙セグメンテーションに苦慮している。
本稿では,出力ベースのパッチレベルの対応を中間的注意に戻す,トレーニング不要でフィードバック駆動型の自己適応型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:47:03 GMT)
INSEva: A Comprehensive Chinese Benchmark for Large Language Models in Insurance [48.2] INSEvaは、保険におけるAIシステムの知識と能力を評価するために設計された中国のベンチマークである。
INSEvaは、ビジネス領域、タスクフォーマット、難易度、認知知識次元をカバーする多次元評価分類を特徴としている。
本ベンチマークでは,オープンエンド応答における忠実度と完全度の両方を評価するための調整された評価手法を実装した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:13:40 GMT)
R-Zero: Self-Evolving Reasoning LLM from Zero Data [47.8] 自己進化型大規模言語モデル(LLM)は、自身の経験から自律的に生成、精製、学習することで、超知性へのスケーラブルなパスを提供する。
このようなモデルを訓練するための既存の方法は、いまだに膨大な人為的なタスクやラベルに大きく依存している。
R-Zeroは、完全に自律的なフレームワークで、スクラッチから独自のトレーニングデータを生成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:33:55 GMT)
VideoEraser: Concept Erasure in Text-to-Video Diffusion Models [47.6] VideoEraserはトレーニング不要のフレームワークで、T2V拡散モデルが望ましくない概念でビデオを生成するのを防ぐ。
VideoEraserは、有効性、完全性、忠実性、堅牢性、一般化性に関する先行手法を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:48:35 GMT)
OwlCap: Harmonizing Motion-Detail for Video Captioning via HMD-270K and Caption Set Equivalence Reward [47.4] ビデオキャプション方式は、しばしばモーションディーテールの不均衡に悩まされる。
OwlCapは動画キャプションの強力なマルチモーダル大言語モデル(MLLM)である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:53:24 GMT)
Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging [47.3] 下流タスクのための微調整された大型言語モデル(LLM)は、しばしば破滅的な忘れを招きます。
プレファインモデルとポストファインモデルとの重み付けを単純に組み合わせれば安全性の低下が軽減され,性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:51:08 GMT)
Enhancing Model Privacy in Federated Learning with Random Masking and Quantization [46.9] 大規模言語モデル(LLM)の台頭は、分散システムに新たな課題をもたらした。
これは、センシティブなデータとプロプライエタリなモデルの両方を保護可能な、フェデレーション付き学習アプローチの必要性を強調している。
モデルパラメータのサブネットワークを隠蔽するためにランダムマスキングを利用するフェデレート学習手法であるFedQSNを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:14:45 GMT)
HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs [46.6] HumanSenseは、MLLMの人間中心の知覚と相互作用能力を評価するために設計されたベンチマークである。
評価の結果,先進的なMLLMには改善の余地が残っており,特に高度なインタラクション指向タスクでは改善の余地があることが判明した。
我々は,Omniモデルの推論能力を高めるために,多段階・モダリティ・プログレッシブ強化学習を採用する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:04:02 GMT)
SDiFL: Stable Diffusion-Driven Framework for Image Forgery Localization [46.3] 既存のイメージフォージェリーローカライゼーション手法は、労働集約的で高価な注釈付きデータに依存している。
私たちは、SDのイメージ生成と強力な知覚能力の両方を、画像法医学のフレームワークに統合した最初の人物です。
我々のフレームワークは、広く使用されているベンチマークデータセットのパフォーマンスを最大12%向上させる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:02:09 GMT)
Simple Stepsize for Quasi-Newton Methods with Global Convergence Guarantees [46.2] 我々は、凸関数に対して大域収束率$O (1/k) を保証できる単純なステップサイズスケジュールを導入することで、準ニュートン法の理論的理解を拡大する。
ヘッセン近似の不完全性が所定の相対的精度で制御された場合、ネステロフの加速勾配法と3次正規化ニュートン法の両方の最もよく知られた速度に一致する1O (1/k)$の加速収束率が得られることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:18:51 GMT)
The Return of Structural Handwritten Mathematical Expression Recognition [45.9] 手書き数学的表現認識は教育技術の基礎となっている。
大規模な言語モデルを持つ現代のエンコーダ・デコーダアーキテクチャは、世代ごとに優れているが、明示的なシンボルとトレースのアライメントは欠如している。
本稿では,2つの革新を伴う構造認識手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:58:59 GMT)
ReST-RL: Achieving Accurate Code Reasoning of LLMs with Optimized Self-Training and Decoding [44.8] 本稿では,統一LLM RLパラダイムであるReST-RLを紹介する。
改良されたGRPOアルゴリズムと、値モデル(VM)が補助する精密に設計されたテスト時間復号法を組み合わせる。
提案するRLパラダイムの有効性を,符号化問題に対する広範な実験を通じて検証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:16:03 GMT)
CoQuIR: A Comprehensive Benchmark for Code Quality-Aware Information Retrieval [44.4] CoQuIRは、品質を意識したコード検索を評価するために設計された、最初の大規模多言語ベンチマークである。
CoQuIRは、11のプログラミング言語で42,725のクエリと134,907のコードスニペットに対して、きめ細かい品質のアノテーションを提供する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:24:38 GMT)
Scalable Object Detection in the Car Interior With Vision Foundation Models [43.0] 本研究では,内部シーン理解のための新しいオブジェクト検出・局所化(ODAL)フレームワークを提案する。
当社のアプローチでは、分散アーキテクチャを通じてビジョン基盤モデルを活用し、オンボードとクラウドの間で計算タスクを分割する。
モデル性能をベンチマークするために,検出と局所化の総合評価のための新しい指標であるOdaLbenchを紹介する。
注目すべきは、我々の微調整したOdaL-LLaVAモデルがOdaL$_score$の89%を達成し、ベースライン性能が71%向上し、GPT-4oを20%近く上回ったことです。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:58:57 GMT)
Patch Progression Masked Autoencoder with Fusion CNN Network for Classifying Evolution Between Two Pairs of 2D OCT Slices [42.8] 加齢関連黄斑変性症(AMD)は視力に影響を及ぼす眼疾患である。
これは、光学コヒーレンス・トモグラフィー(MARIO)におけるモニタリング年代関連黄斑変性の進展の焦点であった。
我々は,次の試験用OCTを生成するパッチメイクオートエンコーダを提案し,その上で,現在のOCTと我々のソリューションを用いたOCTの進化を分類した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:18:30 GMT)
GTPO: Trajectory-Based Policy Optimization in Large Language Models [42.6] 政策に基づく最適化は、今日の言語モデルのトレーニングとアライメントに広く採用されている。
本稿では,GRPOの2つの大きな限界を明らかにし,解析する。
コンフリクトトークンを識別するGTPOを導入する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:41:31 GMT)
OPAL: Visibility-aware LiDAR-to-OpenStreetMap Place Recognition via Adaptive Radial Fusion [42.4] OPALは、OpenStreetMap(OSM)を軽量で最新のものとして活用する、LiDARの位置認識のための新しいフレームワークである。
私たちの重要なイノベーションは、疎いLiDARスキャンと、慎重に設計された2つのコンポーネントを通して構造化されたOSMデータのドメイン格差を埋めることにあります。
KITTIとKITTI-360データセットの実験はOPALの優位性を示し、トップ1検索マッチの1m閾値で15.98%高いリコールを達成した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:23:04 GMT)
Direct probing of the simulation complexity of open quantum many-body dynamics [42.1] 量子および古典的手法の両方を用いて, 開系力学のシミュレーションにおける散逸の役割について検討する。
その結果, 散散布は, 中・長期の時間スケールで異なる方法で相関長と混合時間に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:14:36 GMT)
FreeVPS: Repurposing Training-Free SAM2 for Generalizable Video Polyp Segmentation [42.1] 我々は,ビデオポリプセグメンテーション(VPS)タスクをトラック・バイ・デテクト・パラダイムとして再放送する。
セグメント情報モデル2(SAM2)の時間的モデリング機能を統合する。
SAM2を2つのトレーニングフリーモジュールを備えたポリプビデオセグメンタとして再利用することで、この問題を軽減する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:12:38 GMT)
Tune My Adam, Please! [42.0] 本稿では,AdamのハイパーパラメータのフリーズソーBOのための新しいサロゲートモデルであるAdam-PFNを提案する。
提案手法は,タスクセット評価タスクにおける学習曲線の増大とハイパーパラメータの最適化を両立させる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:57:45 GMT)
A cryogenic chamber setup for superfluid helium experiments with optical fiber and electrical access [42.0] ミルキルビン温度における希釈冷凍機内部のヘリウム室設備の設計と施工について報告する。
自動ガス処理システムを組み込むことで、室内に挿入されるヘリウムガスの量を正確に制御できる。
我々は,超流動ヘリウム膜の厚さをナノメートル以下で正確に制御し,その場で調整した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:17:24 GMT)
EnvInjection: Environmental Prompt Injection Attack to Multi-modal Web Agents [40.9] マルチモーダル大言語モデル(MLLM)ベースのWebエージェントは、Webページのスクリーンショットに基づいてアクションを生成することにより、Webページ環境と対話する。
環境プロンプトインジェクション攻撃は環境を操作してWebエージェントを誘導し、ターゲットアクションとして記述された特定の攻撃チョーゼンアクションを実行する。
既存の攻撃は、有効性やステルス性に限界があるか、現実の環境では非現実的である。
これらの制限に対処する新しい攻撃であるEnvInjectionを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:07:40 GMT)
A Self-Supervised Mixture-of-Experts Framework for Multi-behavior Recommendation [40.8] 本稿では,eコマースサイトを対象とした新しいマルチビヘイビアレコメンデーションシステムを提案する。
エキスパートがそれぞれ2つのアイテムタイプを推奨するように設計されている。
最高成績は65.46%で、Hit Ratio@20は最高成績である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:32:59 GMT)
Personalized MR-Informed Diffusion Models for 3D PET Image Reconstruction [40.7] 本稿では,PET-MR スキャンのデータセットから対象特異的なPET画像を生成するための簡易な手法を提案する。
私たちが合成した画像は、被験者のMRスキャンからの情報を保持し、高分解能と解剖学的特徴の保持につながる。
18ドルF]FDGデータセットのシミュレーションと実データを用いて,対象特異的な「擬似PET」画像を用いたパーソナライズされた拡散モデルの事前学習により,低カウントデータによる再構成精度が向上することを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:57:02 GMT)
Demonstrating specification gaming in reasoning models [40.6] OpenAI o3やDeepSeek R1のような推論モデルは、しばしばデフォルトでベンチマークをハックします。
我々は、現実的なタスクプロンプトを使用し、過剰なヌードを避けることで、先行作業を改善する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:15:11 GMT)
UltraRay: Introducing Full-Path Ray Tracing in Physics-Based Ultrasound Simulation [40.6] レイトレーシングアルゴリズムを用いてエコーデータを生成する新しい超音波シミュレーションパイプラインを提案する。
先進的な超音波イメージングを再現するため,平面波イメージングに最適化されたレイエミッション方式を導入し,遅延とステアリング機能を取り入れた。
提案手法であるUltraRayは,視覚的品質の向上だけでなく,シミュレーション画像のリアリズムの向上にも寄与する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:03:30 GMT)
Mitigating Biases in Surgical Operating Rooms with Geometry [40.5] ディープニューラルネットワークは、予測のためにデータセット固有のアーティファクトを活用することで、急激な相関を学習する傾向がある。
外科手術室 (OR) では, スモックやガウンの標準化により, 目印が不明瞭であることが明らかとなった。
この問題を解決するために、人員を3Dポイントクラウドシーケンスとしてエンコードし、外見に基づく共同設立者からアイデンティティ関連形状と動きパターンを遠ざけている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:42:18 GMT)
Distribution Shift Aware Neural Tabular Learning [40.1] タブラル学習は、生の機能を下流タスクのための最適化された空間に変換する。
しかし、その効果は、トレーニングとテストデータの分散シフトによって悪化する。
そこで我々は,それに対応する新しいシフト・アウェア・フィーチャー・トランスフォーメーション・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:14:08 GMT)
Not Every Gift Comes in Gold Paper or with a Red Ribbon: Exploring Color Perception in Text-to-Image Models [40.1] 複数色を含むプロンプトに対する多目的セマンティックアライメントの問題を緩和する専用画像編集手法を提案する。
本手法は,様々なテキスト・画像拡散技術を用いて生成した画像から,幅広いメトリクスに対して性能を著しく向上させる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:16:58 GMT)
How Multimodal LLMs Solve Image Tasks: A Lens on Visual Grounding, Task Reasoning, and Answer Decoding [39.3] MLLMが階層間の視覚的およびテキスト的入力をどのように処理するかを分析するための探索フレームワークを導入する。
ステージ単位の構造は、視覚的トークン化、命令チューニングデータ、事前学習コーパスの様々なバリエーションで安定しているが、各ステージシフトごとに特定の層が割り当てられることが示される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:22:01 GMT)
ZoomEye: Enhancing Multimodal LLMs with Human-Like Zooming Capabilities through Tree-Based Image Exploration [39.3] 我々は,視覚レベルの推論に適した訓練不要でモデルに依存しない木探索アルゴリズムZoom Eyeを提案する。
このアルゴリズムにより、MLLMは、タスク関連視覚的エビデンスを探索するために、ルートから葉ノードへナビゲートすることで、人間の様のズーム動作をシミュレートすることができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:39:28 GMT)
SWIRL: A Staged Workflow for Interleaved Reinforcement Learning in Mobile GUI Control [38.8] マルチエージェントシステム用に設計されたインターリーブ強化学習のための段階的ワークフローであるSWIRLを紹介する。
SWIRLは、MARLを一連の単エージェント強化学習タスクに再構成し、一方のエージェントを一度に更新し、他方のエージェントを固定する。
モバイルGUI制御への応用において、SWIRLは言語とスクリーンコンテキストを構造化されたプランに変換するナビゲータと、これらのプランを実行可能なアトミックアクションに変換するインターアクターをインスタンス化する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:27:19 GMT)
MotionFlux: Efficient Text-Guided Motion Generation through Rectified Flow Matching and Preference Alignment [38.4] 仮想キャラクタとエンボディエージェントのアニメーションにはモーション生成が不可欠である。
TAPOとMotionFLUXは、セマンティック一貫性とモーション品質の両方において最先端のアプローチより優れている統一システムを形成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:45:09 GMT)
Pixel-Optimization-Free Patch Attack on Stereo Depth Estimation [38.0] 画素最適化攻撃を4つのステレオマッチングステージに拡張する統合フレームワークを構築した。
我々は,最初のピクセル最適化フリー攻撃であるPatchHunterを提案する。
KITTIでは、PatchHunterは、有効性とブラックボックス転送性の両方においてピクセルレベルの攻撃より優れている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:35:52 GMT)
ALSA: Anchors in Logit Space for Out-of-Distribution Accuracy Estimation [37.7] ALSA(Anchors in Logit Space for Accuracy Estimation)は,ロジット空間で直接操作することで,よりリッチな情報を保存する新しいフレームワークである。
幅広い分散シフトに対して、堅牢で正確なパフォーマンス推定を提供する。
特に、ALSAのかなりの分布シフト下での堅牢性は、信頼性のあるモデル評価のための実用的なツールとしての可能性を強調している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:46:15 GMT)
InfinityHuman: Towards Long-Term Audio-Driven Human [37.6] 既存の方法は、重なり合うモーションフレームを使ってビデオを拡張するが、エラーの蓄積に悩まされ、アイデンティティのドリフト、色の変化、シーンの不安定性が生じる。
InfinityHumanは、まず音声同期表現を生成し、その後徐々に高精細長ビデオへと洗練する粗大なフレームワークである。
EMTDとHDTFデータセットの実験により、InfinityHumanはビデオの品質、アイデンティティの保存、手の正確性、リップシンクにおける最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:36:30 GMT)
Human locomotor control timescales depend on the environmental context and sensory input modality [37.5] 制御時間スケールを定量化する統合データ駆動フレームワークを提案する。
ウォーキングやランニングといったタスクにこのフレームワークを適用します。
本研究の枠組みは,ロポモタ・フット配置制御の時間尺度に影響を与える要因を明らかにする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:07:09 GMT)
Agent-as-Judge for Factual Summarization of Long Narratives [37.5] 大規模言語モデル(LLM)は、ROUGEやBERTScoreといった従来のメトリクスに基づいた要約タスクにおいて、ほぼ人間に近い性能を示す。
LLM-as-a-Judgeのような最近の進歩は、語彙的類似性に基づくメトリクスの限界に対処するが、実際には矛盾を示す。
本稿では,要約を評価・精査するための新しい「Agent-as-a-Judge」フレームワークであるNarrativeFactScoreを紹介する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:18:41 GMT)
ICL CIPHERS: Quantifying "Learning" in In-Context Learning via Substitution Ciphers [37.2] ICL CIPHERSは,古典暗号から借用された置換暗号に基づくタスク修正のクラスである。
このアプローチでは、文脈内入力におけるトークンのサブセットが他の(無関係な)トークンに置換され、英語の文は人間の目では理解できない。
ICL CIPHERSにより修正されたタスクを,NON-BIJECTIVE(不可逆)ベースラインよりもBIJECTIVEマッピングで解くのがよいことを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:37:05 GMT)
Probing disorder-driven topological phase transitions via topological edge modes with ultracold atoms in Floquet-engineered honeycomb lattices [37.1] 超低温原子をもつトポロジカルエッジモードの特性を用いて、2つの異なるフロケ位相間の障害誘起相転移について検討した。
従来のホールシステムよりも, 異常なフロケトポロジカルな状態が好まれていることが確認された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:54:40 GMT)
StableIntrinsic: Detail-preserving One-step Diffusion Model for Multi-view Material Estimation [36.8] 本稿では,多視点材料推定のための一段階拡散モデルであるStableIntrinsicを紹介する。
一段階拡散における過度に滑らかな問題に対処するために、StableIntrinsicは画素空間の損失を適用している。
また,VAE符号化による詳細損失を排除するために,DIN(Detail Injection Network)を導入する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:15:55 GMT)
PSO-Merging: Merging Models Based on Particle Swarm Optimization [36.6] 我々は、Particle Swarm Optimization(PSO)に基づく新しいデータ駆動マージ手法であるPSO-Mergingを紹介する。
提案手法では,素粒子群を事前学習モデル,エキスパートモデル,スパシファイドエキスパートモデルで初期化する。
次に、複数の繰り返しを行い、最終的な大域的最適粒子がマージモデルとして機能する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:52:36 GMT)
GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models [36.5] GSM8Kベンチマークは、小学校レベルの質問に対するモデルの数学的推論を評価するために広く使われている。
GSM-Symbolicは、シンボリックテンプレートから生成された改良されたベンチマークである。
以上の結果から,LLMは同一質問の異なるインスタンス化に応答する際,顕著なばらつきを示すことが明らかとなった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:24:39 GMT)
IntentionReasoner: Facilitating Adaptive LLM Safeguards through Intent Reasoning and Selective Query Refinement [35.9] IntentionReasonerは、専用ガードモデルを利用して意図的推論を行う新しいセーフガード機構である。
IntentionReasonerは、複数のセーフガードベンチマーク、生成品質評価、ジェイルブレイク攻撃シナリオに優れています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:47:31 GMT)
Federated Consistency- and Complementarity-aware Consensus-enhanced Recommendation [35.8] 個人化されたFedRecのための textbfFederated textbfConsistency- and textbfComplementarity-aware textbfConsensus-enhanced textbfRecommendation (Fed3CR) 法を提案する。
4つの実世界のデータセットの実験は、Fed3CRの優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:47:12 GMT)
DiffArtist: Towards Structure and Appearance Controllable Image Stylization [35.6] textbfDiffArtistは、構造と外観スタイルの強さの両方をきめ細かな同時制御する最初の2Dスタイリング方法である。
解析の結果,DiffArtistは最先端の手法と比較して,スタイルの忠実さと二重制御性が優れていることがわかった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:30:27 GMT)
A Scenario-Oriented Survey of Federated Recommender Systems: Techniques, Challenges, and Future Directions [34.9] 本稿では,レコメンデーション研究者と実践者の立場から,レコメンデーションシステムとフェデレーション学習の結合を包括的に分析する。
我々は、シナリオ固有のアプローチ、実践的な課題、潜在的な機会を体系的に分析し、レコメンデーションシナリオとFLフレームワークの間に明確なリンクを確立する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:57:50 GMT)
A Model-agnostic Strategy to Mitigate Embedding Degradation in Personalized Federated Recommendation [34.9] パーソナライズされた埋め込みユーティリティを強化するための新しいモデルに依存しないFedRec戦略を提案する。
PLGCは、次元崩壊問題を緩和する連邦勧告における最初の研究である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:03:52 GMT)
k-HyperEdge Medoids for Clustering Ensemble [34.7] クラスタリングアンサンブルはk-HyperEdge Medoids発見問題として定式化されている。
k-HyperEdge Medoidsに基づくクラスタリングアンサンブル法を提案する。
本手法の収束性は20データセットの実験的解析によって検証される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:21:25 GMT)
Principled Personas: Defining and Measuring the Intended Effects of Persona Prompting on Task Performance [34.4] 課題改善を促すペルソナの文献を分析した。
専門家のペルソナは、通常、肯定的あるいは非重要なパフォーマンス変化につながる。
堅牢性を改善するための緩和戦略を提案しています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:40:57 GMT)
Integrating SystemC TLM into FMI 3.0 Co-Simulations with an Open-Source Approach [34.2] 本稿では,SystemC TLMモデルをFMI(Functional Mock-up Interface)ベースのコミュレートに組み込むための,完全なオープンソース手法を提案する。
SystemC TLMコンポーネントをFMI 3.0 Co Functional Mock-up Units (FMUs) としてカプセル化することにより、提案手法は異種シミュレーション環境間のシームレスで標準化された統合を容易にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:02:53 GMT)
Data-Efficient Symbolic Regression via Foundation Model Distillation [34.1] EQUATEは、蒸留を通じて低データ状態における記号方程式の発見に基礎モデルを適用するフレームワークである。
精度と堅牢性の両方において、最先端のベースラインを一貫して上回る。
これらの結果は、データ効率のシンボリックレグレッションのための実用的で一般化可能なソリューションとして、EQUATEを強調している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:18:48 GMT)
Cross-Platform E-Commerce Product Categorization and Recategorization: A Multimodal Hierarchical Classification Approach [34.0] 電子商取引商品分類のためのマルチモーダル階層分類フレームワークを開発し,展開する。
階層型アーキテクチャにおける早期・後期・注目に基づく融合戦略について検討する。
以上の結果から,CLIPをベースとしたレイトフュージョン戦略で組み合わされたCLIPは,最も階層的なF1を達成できた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:16:12 GMT)
Integration of quantum random number generators with post-quantum cryptography algorithms [33.7] ポスト量子暗号(PQC)は、既存のPublic Key Infrastructure(PKI)システムの寿命を延ばす潜在的な解決策となっている。
PQCプロトコルは、キー生成およびカプセル化手順における高品質なランダム性に依存する。
PQCベースのトランスポート層セキュリティ(TLS)を用いて,通信ネットワーク内にQRNG(Quantum Random Number Generation)デバイスを組み込むことが可能な概念実証を実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:35:49 GMT)
Generative AI Against Poaching: Latent Composite Flow Matching for Wildlife Conservation [33.7] 密猟は野生生物や生物多様性に重大な脅威をもたらす。
密猟者の行動予測は、パトロール計画やその他の保護介入を通知することができる。
生成モデリングの最近の進歩は、より柔軟な代替手段を提供する。
実際のポーチデータのトレーニングでは、ポーチイベントの不完全な検出と限られたデータという、2つの中心的な障害に直面している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:16:23 GMT)
Understanding and Leveraging the Expert Specialization of Context Faithfulness in Mixture-of-Experts LLMs [33.3] 本研究は,特定の専門家が文脈利用に特化しているかどうかを考察する。
我々は,コンテキストファインフルエキスパート(CEFT)を選択的に微調整する軽量な最適化手法として,コンテキストファインフルエキスパート(CEFT)を紹介した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:07:13 GMT)
Bi-LoRA: Efficient Sharpness-Aware Minimization for Fine-Tuning Large-Scale Models [33.3] シャープネス・アウェアの最小化(SAM)は平坦な最小値を求めることで一般化を改善するのに有効であることが証明されている。
本稿では、SAMの対向重み摂動をモデル化するための補助的なLoRAモジュールを導入する双方向低ランク適応(Bi-LoRA)を提案する。
Bi-LoRAは、メモリ効率を保ちながらフラットなミニマを実現するために、より広いシャープさをキャプチャする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:46:56 GMT)
Continuously Steering LLMs Sensitivity to Contextual Knowledge with Proxy Models [33.0] CSKS(Continuously Steering Knowledge Sensitivity)は、大規模言語モデルの文脈的知識に対する感受性を、軽量で継続的に評価するフレームワークである。
本研究では,LLMの文脈的知識に対する感度を連続的かつ高精度に制御し,感度の向上と感度の低減を実現していることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:30:24 GMT)
The Anatomy of a Personal Health Agent [33.0] 一般消費者の健康管理装置や一般の健康記録からマルチモーダルデータを分析できる包括的パーソナルヘルスエージェントの構築を目指している。
我々は,消費者の健康ニーズの3つの主要なカテゴリを特定し,それぞれが専門的なサブエージェントによって支えられている。
動的にパーソナライズされた対話を可能にするマルチエージェントフレームワークであるPersonal Health Agent(PHA)を提案し,開発する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:38:46 GMT)
Youtu-GraphRAG: Vertically Unified Agents for Graph Retrieval-Augmented Complex Reasoning [32.8] グラフ検索拡張生成(GraphRAG)は,複雑な推論において,大規模言語モデルを効果的に拡張した。
本稿では,フレームワーク全体を複雑な統合として結合する,垂直に統一されたエージェントパラダイムYoutu-GraphRAGを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:13:20 GMT)
The Role of Teacher Calibration in Knowledge Distillation [32.6] 知識蒸留(KD)は、ディープラーニングにおいて効果的なモデル圧縮技術として登場した。
教師の校正誤差と生徒の精度との間には強い相関関係が認められた。
我々のアルゴリズムは多用途であり、分類から検出まで様々なタスクで有効性を示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:04:28 GMT)
FaceEditTalker: Controllable Talking Head Generation with Facial Attribute Editing [32.5] FaceEditTalkerは、コントロール可能な顔属性操作を可能にする統合フレームワークである。
高品質な音声同期ヘッドビデオを生成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:33:34 GMT)
LFD: Layer Fused Decoding to Exploit External Knowledge in Retrieval-Augmented Generation [32.4] Retrieval-augmented Generation (RAG)は、外部知識を大規模言語モデル(LLM)に組み込む。
最近の実証的証拠は、取得した関連文書にノイズを注入することで、外部知識の活用がパラドックス的に促進され、生成品質が向上することを示している。
本稿では,中間層からの表現と最終層からのデコード出力を直接結合する単純なデコード戦略であるLayer Fused Decoding (LFD)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:48:46 GMT)
MegaScience: Pushing the Frontiers of Post-Training Datasets for Science Reasoning [32.2] 1kの大学レベルの教科書から抽出した真正な参照回答を特徴とするオープンデータセットであるTextbookReasoningを提案する。
私たちは、合計125万のインスタンスからなる高品質なオープンソースデータセットの大規模な混合であるMegaScienceを紹介します。
実験により,我々のデータセットはより簡潔な応答長で優れた性能と訓練効率が得られることを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:10:49 GMT)
MonoRelief V2: Leveraging Real Data for High-Fidelity Monocular Relief Recovery [32.1] MonoRelief V2は、単一イメージから2.5Dレリーフを復元するために設計されたエンドツーエンドモデルである。
実際のデータを組み込んで、堅牢性、正確性、効率性を向上する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:03:03 GMT)
Analysing Chain of Thought Dynamics: Active Guidance or Unfaithful Post-hoc Rationalisation? [32.0] CoT (Chain-of-Thought) はしばしばソフト推論問題に対して限られた利得を得る。
そこで本研究では,CoTのソフト推論タスクにおける動的・忠実性について検討する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:25:29 GMT)
Scaling Decentralized Learning with FLock [31.9] 本稿では,大規模言語モデル(LLM)を微調整する分散型フレームワークであるFLockを紹介する。
ブロックチェーンベースの信頼層と経済的インセンティブを統合することで、FLockは、中央アグリゲータを、信頼できない関係者間の協力のためのセキュアで監査可能なプロトコルに置き換える。
我々の実験は、FLockフレームワークが標準FLを侵害するバックドア毒殺攻撃を防いでいることを示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:50:45 GMT)
Quantum latent distributions in deep generative models [31.8] 我々は,量子潜伏分布がGANの生成性能の向上につながることを示した。
この研究は、短期量子プロセッサが深層生成モデルの能力を拡張できることを確認する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:20:01 GMT)
Scaling Laws for Task-Stratified Knowledge in Post-Training Quantized Large Language Models [31.7] 後学習量子化(PTQ)は、大規模言語モデル(LLM)の実用的な圧縮ソリューションである。
量子化モデルの既存のスケーリング法則は、PTQ固有のパラメータやタスク固有の感度を無視することが多い。
本稿では,タスク階層化スケーリング法則の確立を実証的に検討することで,これらのギャップに対処する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:50:50 GMT)
GegenNet: Spectral Convolutional Neural Networks for Link Sign Prediction in Signed Bipartite Graphs [31.0] 本稿では,二部グラフにおけるリンクサイン予測のための新しい,効果的なスペクトル畳み込みニューラルネットワークモデルを提案する。
GegenNetは,3つの主要な技術貢献を通じて,モデルキャパシティの向上と予測精度の向上を実現している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:10:16 GMT)
ERTACache: Error Rectification and Timesteps Adjustment for Efficient Diffusion [30.9] 拡散モデルは、本質的に反復的推論プロセスのため、かなりの計算オーバーヘッドに悩まされる。
我々は、両方のエラータイプを共同で修正する原則的なキャッシュフレームワークであるERTACacheを提案する。
ERTACacheは最大2倍の推論スピードアップを実現します。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:37:24 GMT)
Do MLLMs Really Understand the Charts? [30.8] MLLMは、チャートの解釈を推論するのではなく、主に認識に依存している、と我々は主張する。
MLLMを合理的なチャート理解に活用するために、チャート理解においてその推定を基礎にして人間の振る舞いを模倣するChartReasonerを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:17:42 GMT)
Model Science: getting serious about verification, explanation and control of AI systems [30.7] モデルサイエンスは、トレーニングされたモデルを分析のコアに配置し、その振る舞いを相互作用し、検証し、説明し、制御することを目的としている。
提案されたフレームワークは、信頼できる、安全で、人間に準拠したAIシステムの開発を導くことを目的としている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:50:17 GMT)
FlowletFormer: Network Behavioral Semantic Aware Pre-training Model for Traffic Classification [30.2] FlowletFormerはBERTベースのネットワークトラフィック分析用に設計された事前トレーニングモデルである。
FlowletFormerは、トラフィック表現、分類精度、少数ショット学習能力の有効性において、既存の手法よりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:32:15 GMT)
Computation- and Communication-Efficient Online FL for Resource-Constrained Aerial Vehicles [29.9] 本稿では,連続的な知覚データの利点を生かした,計算・通信効率の高いオンライン航空連合学習(2 CEOAFL)アルゴリズムを提案する。
提案した2 CEOAFLアルゴリズムは, 計算効率と通信効率に比較して, 非計算および非定量化性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:43:32 GMT)
Efficient Response Generation Strategy Selection for Fine-Tuning Large Language Models Through Self-Aligned Perplexity [29.7] 細調整された大言語モデル(LLM)は、通常、大量の入出力ペアを生成することに依存する。
近年の研究では、これらのトレーニングアウトプットの生成が微調整モデルの性能に大きく影響を与えることが示されている。
本稿では,特定の目標LLMに対する適合性を推定するために,生成したデータの小さなサブセットを評価する,スケーラブルな近似手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:45:16 GMT)
Forewarned is Forearmed: Pre-Synthesizing Jailbreak-like Instructions to Enhance LLM Safety Guardrail to Potential Attacks [29.5] 新しい攻撃は、LLMが目に見えない悪意のある命令を認識できないことを露呈する。
組込み空間分布解析を利用してジェイルブレイクのような命令を生成する合成フレームワークIMAGINEを提案する。
Qwen2.5, Llama3.1, Llama3.2の攻撃成功率は, 有効性を損なうことなく著しく低下した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:44:03 GMT)
PyVision: Agentic Vision with Dynamic Tooling [29.2] PyVisionはインタラクティブなマルチターンフレームワークで、MLLMが手元にあるタスクに適したPythonベースのツールを自律的に生成、実行、洗練することができる。
我々は、PyVisionによって作成されたツールの分類を開発し、その使用状況を様々なベンチマークで分析する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:42:56 GMT)
Fitness Landscape of Large Language Model-Assisted Automated Algorithm Search [29.1] グラフベースアプローチを用いて,大規模言語モデル支援アルゴリズム検索(LAS)の適合環境を記述・解析する。
この結果から, LASランドスケープは特に最適化タスクにおいて, マルチモーダルで頑丈であることがわかった。
これらの知見は、LASランドスケープの理解を深め、より効果的なLASメソッドを設計するための実践的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:07:51 GMT)
Safety Alignment Should Be Made More Than Just A Few Attention Heads [29.0] 安全関連行動の分散符号化を促進するための新しいトレーニング戦略であるAHDを提案する。
実験の結果,AHDはより注意を向ける安全関連機能を分散させることに成功した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:06:28 GMT)
Gradient Rectification for Robust Calibration under Distribution Shift [29.0] ディープニューラルネットワークは、しばしば過信な予測を生成し、安全クリティカルなアプリケーションにおける信頼性を損なう。
対象とするドメイン情報にアクセスせずに動作する新しいキャリブレーションフレームワークを提案する。
本手法は, 配電時の校正性能を向上するとともに, 配電時の校正性能を向上する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:28:26 GMT)
UltraEar: a multicentric, large-scale database combining ultra-high-resolution computed tomography and clinical data for ear diseases [28.8] UltraEarは2020年10月から2035年10月までに11の病院から患者を募集している。
UltraEarは2020年10月から2035年10月までに11の病院から患者を募集している。
耳下腺炎,角膜腫,骨鎖奇形,側頭骨骨折,内耳奇形,人工内耳狭窄,拡張前庭水管,シグモイド洞骨欠損など,眼科疾患の幅広いスペクトルが報告されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:56:17 GMT)
AniME: Adaptive Multi-Agent Planning for Long Animation Generation [28.4] 本稿では,アニメ自動制作のためのディレクター指向マルチエージェントシステムであるAniMEについて述べる。
AniMEは、一貫した文字と同期されたオーディオビジュアル要素を持つシネマティックアニメーションを生成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:23:26 GMT)
Breaking the Gaussian Barrier: Residual-PAC Privacy for Automatic Privatization [27.4] PACプライバシーアルゴリズムによって得られる上限は、摂動機構の出力が独立雑音を伴うガウス的である場合にのみ厳密であることを示す。
本稿では,逆推定後に残るプライバシを定量化するf-divergenceベースの尺度であるResidual-PAC(R-PAC)プライバシーを紹介する。
提案手法は,任意のデータ分布に対する効率的なプライバシ予算利用を実現し,複数のメカニズムがデータセットにアクセスすると自然に構成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:35:33 GMT)
FastMesh: Efficient Artistic Mesh Generation via Component Decoupling [27.2] メッシュ生成アプローチは通常、三角形メッシュをトークンのシーケンスにトークン化し、これらのトークンをシーケンシャルに生成するように自動回帰モデルを訓練する。
この冗長性は、過度に長いトークンシーケンスと非効率な生成プロセスをもたらす。
本稿では,頂点と面を別々に扱うことにより,芸術的メッシュを生成する効率的な枠組みを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:23:04 GMT)
A Survey on Training-free Alignment of Large Language Models [26.8] トレーニングフリー(TF)アライメント技術は、リソース集約的な微調整に代わる有望な代替手段を提供する。
本稿では,TFアライメント法の最初の体系的レビューを行う。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:46:37 GMT)
PG-Agent: An Agent Powered by Page Graph [26.7] 我々は、連続エピソードをページグラフに変換する自動パイプラインを開発し、アクションによって自然に結びついているページのグラフ構造を明示的にモデル化する。
また,GUIの信頼性の高い認識ガイドラインを検索するためにRetrieval-Augmented Generation技術を導入し,タスク分解戦略を取り入れたマルチエージェントフレームワークPG-Agentを提案する。
PG-Agentの有効性は,ページグラフ構築の限られたエピソードであっても,様々なベンチマークで実証された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:31:37 GMT)
General agents contain world models [26.6] 多段階の目標指向タスクに一般化できるエージェントは、その環境の予測モデルを学んだに違いない。
このモデルはエージェントの方針から抽出でき、エージェントのパフォーマンスや目標の複雑さを増大させるには、より正確な世界モデルを学ぶ必要がある。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:09:51 GMT)
Seeing is Believing: Emotion-Aware Audio-Visual Language Modeling for Expressive Speech Generation [26.4] 音声合成のためのAVLM(Audio-Visual Language Model)を提案する。
複数のビジュアルエンコーダとマルチモーダル融合戦略を事前学習中に検討し、最も効果的な統合手法を同定する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:49:56 GMT)
Score-based Generative Diffusion Models for Social Recommendations [26.3] 社会的レコメンデーションの有効性は、社会的ホモフィリの仮定に大きく依存している。
本稿では、革新的生成の観点から、社会的ホモフィリーの低い課題に取り組む。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:40:47 GMT)
CoCoA: Confidence and Context-Aware Adaptive Decoding for Resolving Knowledge Conflicts in Large Language Models [24.7] CoCoA(Confidence- and Context-Aware Adaptive Decoding)は、紛争解決の原則と忠実性の強化のための新しいトークンレベルアルゴリズムである。
CoCoAは、信頼を意識した尺度(エントロピーギャップと文脈ピーク性)とパラメトリック分布と文脈分布の一般化したばらつきを利用して紛争を解決する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:29:14 GMT)
SegQuant: A Semantics-Aware and Generalizable Quantization Framework for Diffusion Models [24.5] SegQuantは、相互モデルの汎用性を高めるために相補的なテクニックを適応的に組み合わせた、統一的な量子化フレームワークである。
SegQuantはTransformerベースの拡散モデルを越えて広く適用でき、強力なパフォーマンスを実現し、メインストリームのデプロイメントツールとのシームレスな互換性を確保している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:42:01 GMT)
Adaptive Scaling of Policy Constraints for Offline Reinforcement Learning [24.5] オフライン強化学習(RL)は、環境の相互作用なしに、固定データセットから効果的なポリシーを学習することを可能にする。
既存の方法は、通常、オフラインのRLトレーニングで遭遇する分散シフトを軽減するためにポリシー制約を使用する。
本稿では,RLと行動クローニング(BC)を動的にバランスする2階微分可能なフレームワークであるAdaptive Scaling of Policy Constraints (ASPC)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:00:18 GMT)
Online-Score-Aided Federated Learning: Taming the Resource Constraints in Wireless Networks [24.4] 我々は,無線アプリケーションに関連するタスクを学習するためのオンラインスコア支援フェデレーション学習(OSAFL)アルゴリズムを提案する。
オンラインスコアやローカルデータ配信のシフトといった新しい要因が収束境界にどのように影響し、サブ線形収束率に必要な条件を導出するかを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:42:58 GMT)
Less is More: Token-Efficient Video-QA via Adaptive Frame-Pruning and Semantic Graph Integration [24.3] 過剰なフレームが文脈の希釈によってパラドックス的に性能を低下させる「レスはそれ以上」現象である。
視覚エコー」は「視覚エコー」という時間的冗長性を有する
AFP"は、ResNet-50とCLIPの機能空間に適応的な階層的クラスタリングアルゴリズムを用いて、これらのエコーを単一の代表に識別し、マージする。
我々の完全なアプローチは、必要なフレームを86.9%まで、合計入力トークンを83.2%まで劇的に削減することを示しています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:38:47 GMT)
Functional Consistency of LLM Code Embeddings: A Self-Evolving Data Synthesis Framework for Benchmarking [24.0] 埋め込みモデルは、クラスタリング、検索、特徴抽出といったタスクにおいて強力な性能を示し、生成モデルやクロスエンコーダよりも計算上の利点を提供している。
本稿では,多種多様なベンチマークを構築するために,関数指向コード自己進化という新しいデータ合成フレームワークを提案する。
私たちのフレームワークは、単一のコードインスタンスから4つのユニークなバリエーションを生成します。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:17:02 GMT)
Synthesizing High-Quality Programming Tasks with LLM-based Expert and Student Agents [23.9] PyTaskSynは、プログラミングタスクを最初に生成し、学生に与えられる特定の品質基準を満たすかどうかを決定する新しい合成技術である。
PyTaskSynはベースライン技術と比較してタスク品質を著しく改善し、検証パイプラインにおける各エージェントタイプの重要性を示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:39:22 GMT)
LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learning [23.9] 大規模言語モデル(LLM)は論理的推論、文脈内学習、コード生成において顕著な能力を示している。
LGR2 は LLM を利用して高次ポリシーのための言語誘導報酬関数を生成する新しい HRL フレームワークである。
スパース環境における試料効率をさらに高めるため, 目標条件付き後視体験レザベリングを統合した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:57:18 GMT)
Robust Single-Stage Fully Sparse 3D Object Detection via Detachable Latent Diffusion [23.6] Denoising Diffusion Probabilistic Models (DDPM) は堅牢な3Dオブジェクト検出タスクに成功している。
RSDNetというDDPMの分離可能な遅延フレームワーク(DLF)を備えたロバスト一段完全スパース3Dオブジェクト検出ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:39:11 GMT)
AraHealthQA 2025 Shared Task Description Paper [23.5] 我々は,アラビア2025(EMNLP2025と同時配置)と連携して開催されている包括的アラビア健康質問回答共有タスクであるAraHealthQA2025を紹介する。
この課題は、アラビア語のメンタルヘルスのQ&A(不安、抑うつ、スティグマの減少など)に焦点を当てたメンタルQAと、内科、小児科、臨床意思決定など幅広い医療分野をカバーするMedArabiQという2つの補完的なトラックを提供することによって、高品質なアラビア語医療QAリソースの質に対処する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:54:09 GMT)
The Next Layer: Augmenting Foundation Models with Structure-Preserving and Attention-Guided Learning for Local Patches to Global Context Awareness in Computational Pathology [23.3] 本稿では,予測と解釈性の向上を目的とした構造保存型注意誘導型MILアーキテクチャであるEAGLE-Netを提案する。
3種類のがんタイプ(10,260スライド)と7種類のがんタイプ(4,172スライド)を含む大規模な膵がんデータセットでベンチマークを行った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:19:38 GMT)
DreamActor-H1: High-Fidelity Human-Product Demonstration Video Generation via Motion-designed Diffusion Transformers [23.2] 電子商取引とデジタルマーケティングでは、高忠実な人間製品デモビデオを生成することが重要である。
人間のアイデンティティと製品固有の詳細を保存するための拡散変換器(DiT)ベースのフレームワークを提案する。
我々は3Dボディーメッシュテンプレートと製品バウンディングボックスを用いて、正確な動作ガイダンスを提供し、手ジェスチャーと製品配置の直感的なアライメントを可能にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:34:57 GMT)
Neither Valid nor Reliable? Investigating the Use of LLMs as Judges [23.2] 審査員としての大規模言語モデル(LLJ)は、従来のメトリクスに代わる有望な代替手段として現れてきたが、その妥当性は未検討のままである。
本論では,LLJに対する現在の熱意は,信頼性と妥当性に関する厳密な調査を評価対象として上回っているため,時期尚早である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:24:13 GMT)
REPARO: Compositional 3D Assets Generation with Differentiable 3D Layout Alignment [23.2] 単一画像からの合成3Dアセット生成のための新しいアプローチであるREPAROを提案する。
まず、シーンから個々のオブジェクトを抽出し、オフザシェルフ画像から3Dモデルを使用して、それらの3Dメッシュを再構築する。
次に、異なるレンダリング技術によってこれらのメッシュのレイアウトを最適化し、コヒーレントなシーン構成を保証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:24:52 GMT)
Hydra: Structured Cross-Source Enhanced Large Language Model Reasoning [23.1] Hydraは、グラフトポロジ、ドキュメントセマンティクス、ソース信頼性を統合して、大規模言語モデルにおける深い忠実な推論をサポートするフレームワークである。
エージェント駆動による探索を通じてマルチホップとマルチエンタリティの問題に対処し、多様性と証拠の精度の両方を増大させる。
GPT-3.5の全てのベンチマークで最先端の結果が得られ、ToG-2は平均20.3%、最大30.1%という強力なハイブリッドベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:30:16 GMT)
Controllable Skin Synthesis via Lesion-Focused Vector Autoregression Model [23.1] この研究は、高忠実で臨床的に関連のある合成皮膚画像を生成する上で、制御可能な皮膚合成モデルの有効性を強調した。
本手法は7種類の病変のFIDスコア(平均0.74)を最大化し,従来のSOTA(State-of-the-art)を6.3%改善した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:04:58 GMT)
Principled Detection of Hallucinations in Large Language Models via Multiple Testing [23.1] 大規模言語モデル(LLM)は、様々なタスクを解決するための強力な基礎モデルとして登場した。
また、幻覚を起こしやすいことも示され、自信を持って聞こえるが、実際には正しくない、あるいは非感覚的な反応を生じさせる。
本稿では,仮説テスト問題として幻覚を検出する問題を定式化し,機械学習モデルにおける分布外検出問題に並列性を持たせる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:55:57 GMT)
LinguaSafe: A Comprehensive Multilingual Safety Benchmark for Large Language Models [22.3] 私たちのデータセットは、ハンガリー語からマレー語まで、12言語で45万のエントリで構成されています。
我々のベンチマークは、詳細な安全性評価のための総合的なメトリクススイートを提供する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:21:20 GMT)
Seam360GS: Seamless 360° Gaussian Splatting from Real-World Omnidirectional Images [22.2] 両眼カメラモデルを3次元ガウススプラッティングパイプラインに組み込んだ新しいキャリブレーションフレームワークを提案する。
我々のアプローチは、双眼カメラが生み出す現実的な視覚的アーティファクトをシミュレートするだけでなく、シームレスに描画された360度画像の合成を可能にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:46:46 GMT)
Bayes-Optimal Fair Classification with Linear Disparity Constraints via Pre-, In-, and Post-processing [21.5] 与えられた群フェアネス制約に対する分類誤差を最小限に抑えるため,ベイズ最適公正分類法を開発した。
人口格差、機会平等、予測平等からの逸脱など、いくつかの一般的な格差対策が双線形であることを示します。
本手法は, ほぼ最適フェアネス精度のトレードオフを達成しつつ, 相違を直接制御する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:29:39 GMT)
OpenM3D: Open Vocabulary Multi-view Indoor 3D Object Detection without Human Annotations [21.2] オープンな多視点屋内3Dオブジェクト検出器OpenM3Dを導入する。
OpenM3Dは、ImGeoNetモデルからの2D誘起のボクセル特性に適応した単段検出器である。
推論では、高効率な検出器であるOpenM3Dは入力にマルチビュー画像しか必要とせず、精度と速度が優れている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:17:00 GMT)
A Robust Real-Time Lane Detection Method with Fog-Enhanced Feature Fusion for Foggy Conditions [21.1] 実世界の霧のシナリオで捉えたFogyLaneデータセットを導入し、FogyCULaneとFogyTusimpleという2つの追加データセットを合成する。
我々は,Global Feature Fusion Module (GFFM) を組み込んで,霧画像のグローバルな関係を捉えることにより,車線検出のためのロバストなFog-Enhanced Networkを提案する。
F1スコアはFogyLaneで95.04、FogyCULaneで79.85、FogyTusimpleで96.95である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:56:06 GMT)
AgentCoMa: A Compositional Benchmark Mixing Commonsense and Mathematical Reasoning in Real-World Scenarios [21.1] Agentic Commonsense and Mathベンチマーク(AgentCoMa)を紹介する。
各構成タスクには、常識的推論ステップと数学的推論ステップが必要である。
LLMは通常、両方のステップを分離して解くことができるが、2つのステップを組み合わせると、その精度は平均30%低下する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:47:19 GMT)
Understanding Fairness-Accuracy Trade-offs in Machine Learning Models: Does Promoting Fairness Undermine Performance? [20.7] 870人の応募者プロファイルからなる実世界の大学入試データセットを用いてフェアネスを検証した。
我々の分析によると、MLモデルは、公正性の一貫性において、14.08%から18.79%の範囲で人間の評価値を上回っている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:36:57 GMT)
Constructing a Norm for Children's Scientific Drawing: Distribution Features Based on Semantic Similarity of Large Language Models [20.6] 本研究は、1420人の子どもの科学的図面(9つの科学的テーマ/概念を含む)を特定し、ワード2vecアルゴリズムを用いて意味的類似性を計算する。
その結果,ほとんどの図面の表現は一貫性があり,ほとんどの意味的類似性は0.8であることがわかった。
続く影響因子の探索では,Kendallランク相関係数を用いて,図面上の「サンプルサイズ」,「抽象度」,「焦点点」の影響について検討した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:28:48 GMT)
X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real [20.6] X-Simは、ロボットのポリシーを学ぶための、密集した伝達可能な信号としてオブジェクトの動きを利用する、リアルからシミュレート・トゥ・リアルなフレームワークである。
X-Simは、RGBDの人間のビデオからシミュレーションを再構築し、オブジェクト中心の報酬を定義するためにオブジェクトの軌跡を追跡することから始まる。
学習方針は、様々な視点と照明でレンダリングされた合成ロールアウトを用いて、画像調和拡散政策に蒸留される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:04:48 GMT)
HSM: Hierarchical Scene Motifs for Multi-Scale Indoor Scene Generation [20.5] 階層的シーンモチーフ(英:hierarchical Scene Motifs、HSM)は、屋内シーン生成のための階層的枠組みであり、空間スケールにわたって密集したオブジェクト配置を持つ。
HSMは、繰り返し発生する空間パターンを利用して、複雑で現実的なシーンを統一的に生成する。
実験の結果,HSMは部屋の種類や空間構成の異なるユーザ入力に適合したシーンを生成することで,既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:49:29 GMT)
The Art of Hide and Seek: Making Pickle-Based Model Supply Chain Poisoning Stealthy Again [20.5] 本報告では, モデル負荷とリスク関数の両方の観点から, ピクルス系モデル中毒面のシステマティックな開示を行う。
我々の研究は、ピクルスベースのモデル中毒がステルス性を維持し、現在のスキャンソリューションにおける重要なギャップを浮き彫りにすることを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:59:34 GMT)
TAGS: 3D Tumor-Adaptive Guidance for SAM [20.4] 本稿では, SAM 用腫瘍適応ガイダンス (TAGS: tumor Adaptive Guidance for SAM) という適応フレームワークを提案する。
マルチプロンプト融合により、2D FMを3D医療タスクにアンロックする。
我々のモデルは最先端の医療画像セグメンテーションモデルを上回る。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:47:29 GMT)
CAMÕES: A Comprehensive Automatic Speech Recognition Benchmark for European Portuguese [20.3] ポルトガル語における音声認識のための既存のリソースは主にブラジルポルトガル語に焦点を当てている。
ヨーロッパポルトガル(EP)および他のポルトガル品種のための最初のオープンフレームワークであるCAMOESを紹介する。
1)複数の領域にまたがるEPテストデータの46hと,(2)最先端モデルの集合を含む総合的な評価ベンチマークで構成されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:30:43 GMT)
SCAMPER -- Synchrophasor Covert chAnnel for Malicious and Protective ERrands [20.1] 我々は,これらの過剰なフィールドを隠蔽通信に利用するSCAMPER (Synchrophasor Covert Channel for Malicious and Protective ERrands) フレームワークを開発した。
SCAMPERは悪意(攻撃)と防御(防御)の両方の目的で適用可能であることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:02:05 GMT)
Towards a Holistic and Automated Evaluation Framework for Multi-Level Comprehension of LLMs in Book-Length Contexts [19.6] HAMLETは、大規模言語モデルの長文理解を評価するためのフレームワークである。
テキストをルート、ブランチ、リーフレベルで3段階のキーファクト階層に構造化する。
クエリ中心の要約を使用して、モデルがどのようにして各レベルで情報をリコールし、忠実に表現するかを評価する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:23:22 GMT)
Putnam-AXIOM: A Functional and Static Benchmark for Measuring Higher Level Mathematical Reasoning in LLMs [19.6] 大規模言語モデル(LLM)の現在のベンチマークは飽和状態に近づき、トレーニングセットの汚染によってますます損なわれている。
我々は、有名なウィリアム・ローウェル・パットナム数学コンペティションのベンチマークであるPatnam-AXIOMを紹介する。
変更プロトコルは、同じように困難で目に見えないインスタンスの無制限ストリームを生成します。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:14:01 GMT)
GLSim: Detecting Object Hallucinations in LVLMs via Global-Local Similarity [19.5] トレーニング不要なオブジェクト幻覚検出フレームワークであるGLSimを紹介する。
我々は,GLSimが優れた検出性能を達成し,高いマージンで競争ベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:30:06 GMT)
Stochastic Control for Fine-tuning Diffusion Models: Optimality, Regularity, and Convergence [19.5] 拡散モデルは生成モデリングの強力なツールとして登場してきた。
微調整拡散モデルのための制御フレームワークを提案する。
PI-FTは線形速度で大域収束することを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:47:37 GMT)
A Symbolic Adversarial Learning Framework for Evolving Fake News Generation and Detection [19.5] 本稿では, 対角学習パラダイムを実装した, シンボリック適応学習フレームワーク(SALF, Symbolic Adversarial Learning Framework)を提案する。
SALFはエージェントシンボル学習を用いてエージェントを表現し、学習可能なウェイトはエージェントプロンプトによって定義され、バックプロパゲーションと勾配降下をシミュレートする。
2つの多言語ベンチマークデータセットの実験は、SALFの有効性を示し、最先端検出性能を最大53.4%、英語で最大34.2%低下させる洗練されたフェイクニュースを生成することを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:14:17 GMT)
FastAvatar: Towards Unified Fast High-Fidelity 3D Avatar Reconstruction with Large Gaussian Reconstruction Transformers [19.4] FastAvatarはフィードフォワード3Dアバターフレームワークで、多様な日々の録音を柔軟に活用することができる。
高品質な3Dガウススプラッティング(3DGS)モデルを1つの統一モデルで数秒で再構築する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:30:15 GMT)
Q-Align: Alleviating Attention Leakage in Zero-Shot Appearance Transfer via Query-Query Alignment [19.3] 我々はQ-Alignを導入し、クエリークエリアライメントを利用して、ゼロショットの外観転送における注意漏れを軽減する。
Q-Align は,(1) クエリのアライメント,(2) キー値のアライメント,機能対応の強化,(3) キーのアライメントと値のアライメントによるセマンティックセマンティクスの維持,という3つのコアコントリビューションを取り入れている。
実験と分析によりQ-Alignの有効性を検証し、Q-Alignは競合保存構造を維持しつつ外観の忠実さにおいて最先端の手法より優れることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:54:23 GMT)
Escaping Stability-Plasticity Dilemma in Online Continual Learning for Motion Forecasting via Synergetic Memory Rehearsal [19.2] DNNに基づく動き予測のための相乗的メモリリハーサル(SyReM)を提案する。
SyReMは学習知識を表現するために、コンパクトなメモリバッファを保持する。
メモリバッファの平均損失を制限する不等式制約を採用している。
SyReMは過去のシナリオにおける破滅的な忘れを著しく軽減し、新しいシナリオの予測精度を向上する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:04:33 GMT)
OptiMUS-0.3: Using Large Language Models to Model and Solve Optimization Problems at Scale [19.2] 本稿では,Large Language Model (LLM) ベースのシステムを導入し,その自然言語記述から線形プログラミング問題(混合整数)を定式化し,解決する。
本システムでは, 数学的モデルの開発, ソルバコードの記述とデバッグ, 生成したソリューションの評価, そして, これらの評価に基づいて, モデルとコードの効率性と正確性を向上させることができる。
実験によると、OptiMUS-0.3は、簡単なデータセットで既存の最先端メソッドを22%以上、ハードデータセットで24%以上上回っている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:32:19 GMT)
Linear-Time Demonstration Selection for In-Context Learning via Gradient Estimation [19.2] 例えば$n$の例があれば、$n$から$k$を素早く選択して、ダウンストリーム推論の条件付けとして役立てるにはどうすればよいでしょうか?
この問題は、迅速なチューニングとチェーン・オブ・ソート推論に幅広い応用がある。
勾配推定法は6つのデータセットに対して$mathbf1%$誤差の完全な推論の近似を導出することを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:59:47 GMT)
Large Language Models (LLMs) for Electronic Design Automation (EDA) [19.0] 大規模言語モデル(LLM)は、文脈理解、論理的推論、生成能力において顕著な進歩を見せている。
本稿では,LEMをEDAに組み込むことについて概観し,その能力,限界,今後の可能性について述べる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:33:51 GMT)
NAPER: Fault Protection for Real-Time Resource-Constrained Deep Neural Networks [18.8] メモリビットフリップはディープニューラルネットワーク(DNN)の精度を著しく低下させる
Triple Modular Redundancy (TMR)のような従来の保護アプローチは、信頼性を維持するために精度を犠牲にすることが多い。
我々は,この課題にアンサンブル学習を通じて対処する新しい保護手法であるNAPERを紹介する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:07:17 GMT)
Logarithmic light cone, slow entanglement growth, and quantum memory [18.7] 実効的な光円錐が非相対論的局所量子系に現れることを示す。
LLC体制では、絡み合いの成長は対数時間によって上向きになる。
我々は、LLC体制において、情報のスクランブルが対数的に遅くなっていることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:32:30 GMT)
Unifying the Extremes: Developing a Unified Model for Detecting and Predicting Extremist Traits and Radicalization [18.6] 本稿では,オンラインコミュニティフォーラムにおける超過主義的談話の抽出と分析を行う新しい手法を提案する。
過激主義的特徴の言語行動シグネチャに着目し,ユーザレベルとコミュニティレベルの両方で過激主義を定量化する枠組みを開発する。
本研究は, より包括的, クロスイデオロギー的アプローチを導入することにより, 過激主義の研究に寄与する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:56:55 GMT)
Efficient Qubit Calibration by Binary-Search Hamiltonian Tracking [18.5] 我々は、共振駆動キュービットの周波数を調整するためのリアルタイムプロトコルを提案、実験的に実装する。
フラックス可変トランスモン量子ビットを安定化することにより,コヒーレンスとゲートの忠実度を向上させるアルゴリズムの有効性を示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:07:31 GMT)
FedProtoKD: Dual Knowledge Distillation with Adaptive Class-wise Prototype Margin for Heterogeneous Federated Learning [18.4] 統計的不均一性とプライバシー問題に対処するための有望なソリューションとして,プロトタイプベースの不均一フェデレートラーニング(HFL)手法が出現する。
我々は、クライアントのロジットとプロトタイプ表現によるシステム性能向上のために、拡張された二重知識蒸留機構を用いて、異種フェデレート学習環境におけるFedProtoKDを提案する。
FedProtoKDは様々な設定で1.13%から34.13%の精度で平均的な改善を達成し、既存の最先端のHFL法よりも大幅に向上した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:24:26 GMT)
FlowMalTrans: Unsupervised Binary Code Translation for Malware Detection Using Flow-Adapter Architecture [18.4] ディープラーニングベースのマルウェア検出モデルは通常、多数のラベル付きマルウェアサンプルを必要とする。
我々は,ニューラルネットワーク翻訳(NMT)と正規化フロー(NF)のアイデアをマルウェア検出に活用することを提案する。
本手法は,1つのISAで訓練したモデルを用いて,複数のISAにまたがるマルウェア検出を可能にすることにより,データ収集の労力を削減する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:39:54 GMT)
A Frequency-Aware Self-Supervised Learning for Ultra-Wide-Field Image Enhancement [18.3] UWF画像強調のための新しい周波数認識型自己教師型学習法を提案する。
周波数分離画像デブロアリングとレチネックス誘導照明補償モジュールが組み込まれている。
実験結果から,本研究は視認性の向上だけでなく,疾患診断性能の向上にも寄与することがわかった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:24:20 GMT)
Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants [18.2] 冗長性の少ない歩行支援モデルであるWalkVLM-LRを提案する。
GRPOベースの推論フレームワーク内に4つの人間推論に基づくカスタム報酬関数を導入し、出力を最適化する。
本手法は,他のモデルと比較して,すべての評価指標における最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:26:33 GMT)
Uncertainty-Aware Collaborative System of Large and Small Models for Multimodal Sentiment Analysis [18.0] マルチモーダル感情分析のための強力なMLLMと軽量なベースラインモデルを編成する新しい不確実性認識協調システム(U-ACS)を提案する。
提案手法は,スタンドアロンのMLLMに比べて計算資源のごく一部しか必要とせず,最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:01:58 GMT)
EEGDM: EEG Representation Learning via Generative Diffusion Model [17.6] 生成拡散モデル(EEGDM)に基づく脳波表現学習フレームワークを提案する。
具体的には,拡散事前学習のための構造化状態空間モデルを開発し,デノイング拡散確率モデルを用いてモデルを訓練した。
得られた潜在脳波表現は、提案した潜伏核融合変換器を介して下流分類タスクに使用される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:04:26 GMT)
Towards Instance-wise Personalized Federated Learning via Semi-Implicit Bayesian Prompt Tuning [17.4] pFedBayesPTは、視覚的なプロンプトチューニングに基づく、きめ細かいインスタンスワイズpFLフレームワークである。
半単純変分推論フレームワークを用いて変分学習目標を導出する。
ベンチマークデータセットの実験は、pFedBayesPTが既存のpFLメソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:59:10 GMT)
Exploiting a Mixture-of-Layers in an Electrocardiography Foundation Model [17.4] 心電図のためのトランスフォーマーベース基礎モデル(ECG)は、近年、多くの下流アプリケーションで顕著な性能を達成している。
トレーニング済みのTransformerモデルの最終レイヤであるEmphdeファクト表現層は、下流タスクに最適なパフォーマンスを提供するだろうか?
本稿では,モデルレイヤの表現多様性を効果的に活用するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:30:03 GMT)
Truth or Twist? Optimal Model Selection for Reliable Label Flipping Evaluation in LLM-based Counterfactuals [17.4] 独立な非微調整関係を持つ判定モデルは,最も信頼性の高いラベルフリップ評価を提供することを示す。
その結果、最も効果的な判断モデルとユーザスタディから得られる結果とのギャップは、依然としてかなり大きいことが判明した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:04:13 GMT)
InquireMobile: Teaching VLM-based Mobile Agent to Request Human Assistance via Reinforcement Fine-Tuning [17.0] VLM(Vision-Language Models)は、人間の指示に基づいて現実のモバイル環境を知覚し、対話することを可能にする。
現在の完全に自律的なパラダイムは、モデル理解や推論能力が不十分な場合に潜在的な安全リスクをもたらす。
強化学習にインスパイアされた新しいモデルである textbfInquireMobile を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:40:05 GMT)
FiRST: Finetuning Router-Selective Transformers for Input-Adaptive Latency Reduction [16.8] 本稿では、層固有のルータを用いて、各入力シーケンスに対して適応的に変換器層のサブセットを選択することでレイテンシを低減するアルゴリズムであるFiRSTを提案する。
FiRSTは品質を認識しながら高速な推論を可能にするKVキャッシュとの互換性を維持する。
私たちのアプローチでは、入力適応性は重要であり、タスクによって異なるタスク固有の中間層が隠れた表現を進化させる上で重要な役割を担っています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:58:58 GMT)
Network-Level Prompt and Trait Leakage in Local Research Agents [16.8] Web と Research Agents (WRA) は,ISP などのパッシブネットワーク敵による推論攻撃に対して脆弱であることを示す。
人間による散発的なWebブラウジングとは異なり、WRAは70~140ドルのドメインを訪れ、識別可能なタイミング相関を持ち、ユニークな攻撃をフィンガープリントできる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:24:10 GMT)
Breaking the Layer Barrier: Remodeling Private Transformer Inference with Hybrid CKKS and MPC [16.5] 本稿では,同型暗号化(HE)とセキュアマルチパーティ計算(MPC)を組み合わせてデータプライバシ保護を行う,プライベートトランスフォーマー推論のための効率的なフレームワークを提案する。
BLBと呼ばれる提案されたフレームワークは、層をきめ細かな演算子に分解し、隣接する線形演算子をさらに融合することでこれを克服し、HE/MPC変換の必要性を低減している。
BLB は BOLT (S&P'24) と比較して通信オーバーヘッドを 21 時間削減し、Bumblebee (NDSS'25) よりも 2 時間削減し、レイテンシーを 13 時間短縮し 1.8 ドルを達成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:40:50 GMT)
PAUL: Uncertainty-Guided Partition and Augmentation for Robust Cross-View Geo-Localization under Noisy Correspondence [16.3] クロスビュージオローカライゼーションは、UAVナビゲーション、イベント検出、および航空測量にとって重要な課題である。
既存のほとんどのアプローチは、ペア画像の類似性を最大化するために、マルチモーダルデータをジョイントな特徴空間に埋め込む。
これらの手法は通常、トレーニング中にイメージペアの完全なアライメントを前提とします。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:21:22 GMT)
LLM as an Execution Estimator: Recovering Missing Dependency for Practical Time-travelling Debugging [16.1] 本稿では,部分的インスツルメンテーションのみを用いて,動的データ依存の計算を行うRecovSlicingを提案する。
Slicer4J, ND-Slicer, LLM Slicer, re-execution Slicer などの最先端スライダに対する RecovSlicing の評価を行った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:44:39 GMT)
Agent-to-Agent Theory of Mind: Testing Interlocutor Awareness among Large Language Models [16.0] 大規模言語モデル(LLM)は、マルチエージェントやヒューマンAIシステムに統合されつつある。
本稿では,対話相手の同一性と特徴を識別し,適応する能力について定式化する。
GPT や Claude など,LLM が同一家族の同族や著名なモデルファミリを確実に識別できることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:38:04 GMT)
Every Keystroke You Make: A Tech-Law Measurement and Analysis of Event Listeners for Wiretapping [15.8] 新たなプライバシー法へのコンプライアンスの欠如が広く報告されている研究機関が増えているにもかかわらず、堅牢な執行力の欠如がある。
我々は、JavaScriptイベントリスナをサードパーティのトラッカーでリアルタイムなキーストロークインターセプションに利用すること、特に侵入的なトラッキング技術に重点を置いている。
38.52%のWebサイトがサードパーティのイベントリスナーをインストールしてキーストロークを傍受し、少なくとも3.18%のWebサイトが傍受情報をサードパーティのサーバーに送信しているという証拠を発見した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:20:52 GMT)
Objective Value Change and Shape-Based Accelerated Optimization for the Neural Network Approximation [15.8] 本稿では、ニューラルネットワーク近似タスクの実行時の難易度と近似愛着度を測定するために、目的関数fの新たな測定基準を提案する。
VCは、ネットワークの振る舞いにおける局所的な価値変化の定量化尺度を提供することでこの問題に対処する。
さらに,2つの関数間の距離を変動の観点から測定するVCに基づく新しい計量法を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:51:54 GMT)
TraceNet: Segment one thing efficiently [15.7] 本稿では,ユーザが選択した単一インスタンスを肯定的なタップで分割する,ワンタップ駆動の単一インスタンスセグメンテーションタスクを提案する。
選択したインスタンスを受容的フィールドトレースによって明示的に特定するTraceNetを提案する。
我々は、例えばIoU平均におけるTraceNetの性能と、ユーザーがタップした領域の比率を、高品質なシングルインスタンスマスクで評価する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:23:03 GMT)
Tracking World States with Language Models: State-Based Evaluation Using Chess [15.7] 大規模言語モデル(LLM)は、構造化ドメインにおいて創発的な機能を示す。
LLMは世界モデルの高忠実度表現を内部化することができる。
我々は,チェスをベンチマークとして用いたモデルに依存しない状態ベース評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:08:51 GMT)
Decoding Dense Embeddings: Sparse Autoencoders for Interpreting and Discretizing Dense Retrieval [15.7] 本稿では,Dense Passage Retrieval(DPR)モデルに対する新しい解釈可能性フレームワークを提案する。
我々は,各潜伏概念の自然言語記述を生成し,DPRモデルの密埋め込みと問合せ文書類似度スコアの両方の人間の解釈を可能にする。
概念レベルスパース検索(CL-SR)は,語彙や意味的ミスマッチ間の堅牢な性能を維持しつつ,高いインデックス空間と計算効率を実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:45:53 GMT)
Spherical Vision Transformers for Audio-Visual Saliency Prediction in 360-Degree Videos [15.6] 本研究では, 球面歪みの複雑さと空間音声の統合に対処するため, 塩分濃度予測の領域を360度環境まで拡張する。
この研究は、360度オーディオ・ビジュアル・サリエンシ予測のための包括的なデータセットが欠如していることから、81ODVの新しいデータセットであるYT360-EyeTrackingをキュレートする。
私たちのゴールは、360度ビデオの視覚的サリエンシを効果的に予測するために、オーディオ・ビジュアル・キューを利用する方法を探ることです。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:01:47 GMT)
Interestingness First Classifiers [15.1] 注目度に応じて特徴を選択できるフレームワークを導入する。
提案手法は, 予期せぬ, まだ予測できない特徴を常に識別する。
ツインペーパーのデータセットでは,本手法は今後,コロンをタイトルとした論文が引用される可能性が高くなるというルールを導出する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:04:05 GMT)
HAMoBE: Hierarchical and Adaptive Mixture of Biometric Experts for Video-based Person ReID [14.9] バイオメトリックエキスパートの階層的・適応的混合(HAMoBE)フレームワークを提案する。
HamoBEは、キーバイオメトリックの特徴を独立してモデル化することで、人間の知覚機構を模倣する。
私たちのアプローチは、大幅なパフォーマンス向上をもたらします。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:31:10 GMT)
When Routers, Switches and Interconnects Compute: A processing-in-interconnect Paradigm for Scalable Neuromorphic AI [14.5] 典型的なAIワークロードに必要な操作は、遅延、因果性、タイムアウト、パケットドロップ、ブロードキャスト操作にマッピング可能であることを示す。
既存のバッファリングとトラフィック形成の組込みアルゴリズムを利用して、ニューロンモデルやシナプス操作を実装していることを示す。
相互接続技術におけるトレンドを活用することで、pi2アーキテクチャをより容易にスケールして、ブレインスケールのAI推論ワークロードを実行することが可能になる、と予測しています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:46:46 GMT)
Design nearly optimal quantum algorithm for linear differential equations via Lindbladians [14.5] オープン量子システムを用いてODEを解くための新しい量子アルゴリズムを提案する。
一般線形ODEを密度行列の非対角ブロックに符号化するために、非対角密度行列符号化を用いる。
提案アルゴリズムは、既存の量子ODEアルゴリズムを全て上回り、プラウシブルな入力モデルの下で、全てのパラメータにほぼ最適に依存することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:27:47 GMT)
Disabling Self-Correction in Retrieval-Augmented Generation via Stealthy Retriever Poisoning [14.4] Retrieval-Augmented Generation (RAG)は,大規模言語モデル(LLM)の信頼性向上のための標準アプローチとなっている。
本稿では,現代のLSMの強力なテクスト自己補正能力(SCA)によって,このような攻撃を軽減できることを明らかにする。
我々は,新しい中毒パラダイムであるtextscDisarmRAG を導入し,レトリバー自体を妥協してSCAを抑止し,アタッカー・チョーゼン出力を強制する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:49:28 GMT)
Coresets from Trajectories: Selecting Data via Correlation of Loss Differences [14.3] 損失差の相関(CLD)は、コアセット選択のためのスケーラブルな計量である。
CIFAR-100 と ImageNet-1k では、CLD ベースのコアセットは一般的に最先端の手法よりも優れ、あるいは密に一致している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:18:39 GMT)
Neural Spline Operators for Risk Quantification in Stochastic Systems [14.1] 多様なシステムにおける長期的リスク確率の正確な定量化は、安全クリティカルな制御に不可欠である。
物理インフォームド・ニューラル演算子 (PINO) 法を導入し, 量子化問題のリスクを負う。
具体的には,B-スプライン表現を活用するPINOフレームワークであるNeural Spline Operators (NeSO)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:46:01 GMT)
mSTEB: Massively Multilingual Evaluation of LLMs on Speech and Text Tasks [14.0] 我々は,大規模言語モデル(LLM)の性能を幅広いタスクで評価するための新しいベンチマークであるmSTEBを紹介する。
我々は,Gemini 2.0 Flash や GPT-4o (Audio) などの主要な LLM や Qwen 2 Audio や Gemma 3 27B といった最先端のオープンモデルの性能を評価する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:27:41 GMT)
An Effective Strategy for Modeling Score Ordinality and Non-uniform Intervals in Automated Speaking Assessment [14.0] 自己教師付き学習表現は、特徴キュレーションの前提となる仮定なしに、非ネイティブ音声における豊かな音響的および言語的パターンをキャプチャする。
ほとんどの先行芸術は、熟練度レベルを名目上の階級として扱い、その順序構造と熟練度ラベル間の一様でない間隔を無視している。
本稿では,SSLと手作りインジケータ機能を組み合わせた効果的なASA手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:18:51 GMT)
ReCLIP++: Learn to Rectify the Bias of CLIP for Unsupervised Semantic Segmentation [13.9] 教師なしセマンティックセグメンテーション作業を容易にするために,CLIP に存在するバイアスを明示的にモデル化し,修正することを提案する。
具体的には、クラス参照バイアスを符号化する学習可能な"参照"プロンプトと、空間参照バイアスを符号化するビジョントランスフォーマーへの位置埋め込みの投影を設計する。
我々の手法は過去の最先端技術に対して好適に機能する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:37:07 GMT)
IDF: Iterative Dynamic Filtering Networks for Generalizable Image Denoising [13.7] 動的に生成したカーネルを効率よく操作することで画像のデノナイズを行う。
このアプローチは、過度なフィットを防ぎ、目に見えないノイズに対するレジリエンスを改善するのに役立つ。
単一レベルのガウスノイズで訓練されているにもかかわらず、我々のコンパクトモデルは様々なノイズタイプとレベルにまたがって優れています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:58:07 GMT)
TokenVerse++: Towards Flexible Multitask Learning with Dynamic Task Activation [13.7] TokenVerse++は、動的タスクアクティベーションのためのXLSR-Transducer ASRモデルの音響埋め込み空間に学習可能なベクトルを導入する。
データセットを部分ラベルとうまく統合し、特にASRと追加タスクである言語識別に役立てることにより、これを実証する。
TokenVerse++の結果は、複数のタスクにまたがるTokenVerseと同等かそれ以上であり、ASRパフォーマンスを犠牲にすることなく、より実用的なマルチタスク代替品として確立されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:16:31 GMT)
MTS-Net: Dual-Enhanced Positional Multi-Head Self-Attention for 3D CT Diagnosis of May-Thurner Syndrome [13.7] May-Thurner syndrome (MTS) は、人口の20%以上に影響し、腸大腿深部静脈血栓症のリスクを著しく高める血管疾患である。
CT (Computed Tomography) を用いたMTSの正確な早期診断は, 微妙な解剖学的圧迫と患者間の変動が原因で, 臨床上の課題である。
我々は,CTボリュームから空間時間パターンを抽出し,MTS診断の信頼性を高めるために,エンドツーエンドの3次元ディープラーニングフレームワークであるMTS-Netを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:27:42 GMT)
Optimal control on open quantum systems and application to non-Condon photo-induced electron transfer [13.6] 本研究では,オープン量子システムとその環境に関する最適制御理論を開発する。
縮合相における非コンドン光誘起電子移動(PET)への応用を例示する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:44:33 GMT)
Sky Background Building of Multi-objective Fiber spectra Based on Mutual Information Network [13.5] 空背景推定モデルを提案する: 相互情報(SMI)に基づく空背景構築
相互情報と漸進的学習アプローチに基づくSMI
その結果、SMIは観測中、特に青色の端において、より良い天体空背景を得ることができることがわかった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:36:12 GMT)
When AIOps Become "AI Oops": Subverting LLM-driven IT Operations via Telemetry Manipulation [13.5] 敵はシステムテレメトリを操作してAIOpsエージェントを誤解させ、管理するインフラストラクチャの整合性を損なう行動をとることができる。
我々の攻撃手法であるAIOpsDoomは、完全に自動化された偵察、ファジィ、LLM駆動の敵入力生成であり、ターゲットシステムの事前の知識なしで動作します。
我々は,その構造的性質とユーザ生成コンテンツの最小の役割を活かして,テレメトリデータを衛生化する防衛機構であるAIOpsShieldを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:14:07 GMT)
High-Speed FHD Full-Color Video Computer-Generated Holography [13.3] ホログラフィーは次世代ディスプレイにとって有望な技術だ。
高速で高品質なホログラフィックビデオを生成するには、フレームレートの表示と効率的な計算の両方が必要である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:24:37 GMT)
MAPo : Motion-Aware Partitioning of Deformable 3D Gaussian Splatting for High-Fidelity Dynamic Scene Reconstruction [13.3] 変形可能な3次元ガウス平板(MAPo)の運動認識分割について紹介する。
MAPoは高忠実度動的シーン再構築のための新しいフレームワークである。
これは、同等の計算コストを維持しながら、ベースラインよりも優れたレンダリング品質を実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:10:46 GMT)
Uncovering the Bigger Picture: Comprehensive Event Understanding Via Diverse News Retrieval [13.3] 多様なニュース検索のための2段階のフレームワークを提案する。
第1段階は、密集検索を用いて、トポロジー関連コンテンツを検索する。
第2段階では、文レベルのクラスタリングと多様性を意識して、相補的な情報をサーフェスする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:37:32 GMT)
Generative AI for Testing of Autonomous Driving Systems: A Survey [13.2] 自律運転システム(ADS)は、社会に多大な利益をもたらす可能性がある研究の活発な領域である。
異なるテストアプローチが必要であり、ADSの効率的かつ効率的なテストを実現することは、依然としてオープンな課題である。
生成AIは多くのドメインにまたがる強力なツールとして登場し、コンテキストを解釈する能力により、ADSテストにも適用されつつある。
この調査は、ADSのテストにおける生成AIの使用に関する概要と実践的な洞察を提供し、既存の課題を強調し、この急速に発展する分野における将来の研究の方向性を概説する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:40:14 GMT)
Solving Inverse Problems using Diffusion with Iterative Colored Renoising [13.2] 既存の手法による近似は,特に逆過程の早い段階では,比較的貧弱であることを示す。
そこで本研究では,拡散段階毎に数回,反復的に再推定し,推定を「ノイズ」する手法を提案する。
この反復的アプローチは、我々がFast Iterative Renoising (FIRE)と呼ぶもので、事前に訓練された拡散モデルが常に白いノイズを見ることができるように、色付きノイズを注入する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:14:40 GMT)
SCAR: A Characterization Scheme for Multi-Modal Dataset [12.9] 基礎モデルは、様々なタスクにまたがる顕著な一般化を示し、主にトレーニングデータの特徴によって駆動される。
プルーニングや圧縮のような最近のデータ中心の手法は、トレーニングを最適化することを目的としているが、データ特性が一般化にどう影響するかに関する理論的な知見は限られている。
データセットの固有の構造特性を特徴付けるための原則的スキームであるSCARを紹介する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:16:59 GMT)
Energy-Efficient Learning-Based Beamforming for ISAC-Enabled V2X Networks [12.8] 本研究は、ISAC(Integrated Sentration and Communication)対応V2Xネットワークのための、エネルギー効率の高い学習ベースのビームフォーミング方式を提案する。
まず,V2X環境の動的・不確かさをマルコフ決定過程としてモデル化する。
そこで我々は,ビームフォーミングとパワーアロケーションを協調的に最適化する深層強化学習(DRL)アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:52:07 GMT)
Improving Hospital Risk Prediction with Knowledge-Augmented Multimodal EHR Modeling [12.7] 臨床リスク予測のために構造化データと非構造化データをシームレスに統合する統合フレームワークを導入する。
微調整大言語モデル(LLM)は臨床ノートからタスク関連情報を抽出する。
第2段階は構造化されていない表現と構造化データから派生した特徴を組み合わせて最終的な予測を生成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:37:18 GMT)
InfraredGP: Efficient Graph Partitioning via Spectral Graph Neural Networks with Negative Corrections [12.6] グラフ分割(GP)の問題を解決するために赤外GPを提案する。
InfraredGPは、トレーニングなしで標準的なクラスタリングモジュールに対して区別可能な埋め込みを導出できることを示す。
InfraredGPは、様々なベースラインに対して、より優れた効率(例えば16x-23倍高速)と競争品質を実現することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:07:34 GMT)
CrystalICL: Enabling In-Context Learning for Crystal Generation [12.6] 大規模言語モデル(LLM)は、強力なコンテキスト内学習(ICL)能力を示している。
既存のLCMベースの結晶生成アプローチはゼロショットシナリオに限られており、少数ショットシナリオの恩恵を受けられない。
結晶生成のための新しいモデルであるCrystalICLを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:49:27 GMT)
Mind the Third Eye! Benchmarking Privacy Awareness in MLLM-powered Smartphone Agents [12.6] 私たちは7,138のシナリオを含む最初の大規模ベンチマークを私たちの知る限りで提示します。
ベンチマークされたエージェントのほとんどすべてが満足できないプライバシー意識(RA)を示しており、明示的なヒントがあってもパフォーマンスは60%以下である。
全体として、クローズドソースエージェントは、オープンソースエージェントよりも優れたプライバシ能力を示し、Gemini 2.0-flashは67%のRAを達成した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:41:28 GMT)
CompLex: Music Theory Lexicon Constructed by Autonomous Agents for Automatic Music Generation [12.5] 本稿では,AIによる楽曲生成作業における包括的音楽理論の活用を目指す。
我々は,37,432項目からなるCompLexというレキシコンを生成する新しい自動音楽レキシコン構築モデルを提案する。
CompLexは、最先端の3つのテキストから音楽への生成モデルに対して、素晴らしいパフォーマンス向上を示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:36:49 GMT)
FedReFT: Federated Representation Fine-Tuning with All-But-Me Aggregation [12.5] 本稿では,クライアントの隠れ表現を微調整する新しい手法であるFederated Representation Fine-Tuning(FedReFT)を紹介する。
FedReFTは、隠された表現を直接操作するためにスパース介入層を適用し、軽量でセマンティックにリッチな微調整の代替を提供する。
We evaluate FedReFT on commonsense reasoning, arithmetic reasoning, instruction-tuning, and GLUE。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:03:19 GMT)
The Information Dynamics of Generative Diffusion [12.5] 生成拡散モデルは、機械学習における強力なモデルのクラスとして登場した。
本稿では, それらの動的・情報論的・熱力学的特性を結合させることにより, 生成拡散の総合的な視点を提供する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:53:56 GMT)
AR$^2$: Adversarial Reinforcement Learning for Abstract Reasoning in Large Language Models [12.5] 本稿では,大規模言語モデル (LLM) の抽象化能力を高めるために設計された新しいフレームワークである AR$2$ (Adversarial Reinforcement Learning for Abstract Reasoning) を提案する。
AR$2$は、基本ロジックを変更することなく、カーネル問題を物語に富んだ、挑戦的な記述に変換するために教師モデルを採用している。
学生符号化モデルは、基礎となる計算カーネルを抽出することにより、これらの複雑な物語問題を解決するために訓練される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:26:44 GMT)
Robustness Assessment and Enhancement of Text Watermarking for Google's SynthID [12.5] SynGuardは、語彙レベルと意味レベルの両方に透かしを埋め込むハイブリッドフレームワークである。
SynthID-Text と比較して,SynGuard は F1 スコアの平均 11.1% で透かしの回復を改善する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:17:09 GMT)
ControlEchoSynth: Boosting Ejection Fraction Estimation Models via Controlled Video Diffusion [12.5] エコービューを合成して臨床診断精度を高めるための新しい手法を提案する。
これらの視点は、既存の心のリアルな視点に基づいており、射出率(EF)の推定に特に焦点を当てている。
予備的な結果は、我々の合成エコーが、既存のデータセットを増強するために使用される場合、EF推定を向上するだけでなく、より堅牢で正確で臨床的に関連する機械学習モデルの開発を進める可能性も示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:36:26 GMT)
Bidirectional Task-Motion Planning Based on Hierarchical Reinforcement Learning for Strategic Confrontation [12.3] Swarm Roboticsでは、戦略的対立を含む対決シナリオは、効率的な意思決定を必要とする。
従来のタスクと動作計画手法は意思決定を2つの層に分けるが、その一方向構造はこれらの層間の相互依存を捉えない。
本稿では階層的強化学習に基づく新しい双方向手法を提案し,層間の動的相互作用を実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:52:52 GMT)
From Tabula Rasa to Emergent Abilities: Discovering Robot Skills via Real-World Unsupervised Quality-Diversity [12.0] 品質ダイバーシティ・アクター・クリティカル(QDAC)の拡張であるUnsupervised Real-world Skill Acquisition (URSA)を提案する。
URSAは、ロボットが現実世界で直接、多様なハイパフォーマンスなスキルを自律的に発見し、習得することを可能にする。
本研究は,より自律的で適応性の高いロボットシステムに向けた重要なステップを示す,現実世界のロボット学習のための新しいフレームワークを構築した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:38:11 GMT)
Analysis and Synthesis Denoisers for Forward-Backward Plug-and-Play Algorithms [11.9] 本稿では,合成復号化問題を近接演算子とみなすことができることを示す。
FB-内の「1つのサブイット」戦略は、ウォーム・リスタート戦略を使用すると無限であると解釈できることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:10:33 GMT)
POEv2: a flexible and robust framework for generic line segment detection and wireframe line segment detection [11.8] 線分検出器は、ジェネリック線分検出器とワイヤフレーム線分検出器の2つのカテゴリに分けられる。
最近のディープラーニングベースのアプローチは、主にワイヤフレームラインセグメント検出器である。
本稿では,線分検出と線分検出の両方に使用できるロバストなフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:13:46 GMT)
SLIM: Subtrajectory-Level Elimination for More Effective Reasoning [11.8] 複雑な推論軌道を持つ微調整モデルは必ずしも最適とは限らない。
推論軌道内での最適部分軌道を同定する「5+2」フレームワークを開発した。
提案手法では, 推定において, 最適サブトラジェクタの数を25.9%削減できる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:19:44 GMT)
Charting the Future of Scholarly Knowledge with AI: A Community Perspective [11.7] 専門分野にわたる学術出版物の急激な増加は、現状を維持するのをますます困難にしている。
様々な研究コミュニティが独立してこの問題に取り組み始めており、信頼性があり、動的で、クエリ可能な知識ベースを構築するためのツールとフレームワークを開発している。
本写本は、学際的対話の育成、共有課題の特定、新しいコラボレーションの分類、学術的知識と組織における今後の研究方向の形成などを行う。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:46:50 GMT)
LV-CadeNet: A Long-View Feature Convolution-Attention Fusion Encoder-Decoder Network for EEG/MEG Spike Analysis [11.7] 脳磁図(MEG)や脳波記録(EEG)における間質性てんかん状放電(IED)の解析はてんかんの診断において重要な要素である。
現在のアプローチでは、臨床専門家の診断知性を2つの重要な側面で完全にエミュレートすることができない。
本稿では,人工知能のギャップを埋める新しいディープラーニングフレームワークLV-CadeNetを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:39:49 GMT)
Anomaly Detection in Networked Bandits [11.7] ソーシャルネットワーク上の異常ノードの問題に対処する新しい帯域幅アルゴリズムを提案する。
ネットワーク知識により,ユーザの好みや特徴情報の残差を特徴付ける。
ユーザ毎にパーソナライズされたレコメンデーション戦略を開発し、同時に異常を検出する。
本稿では,提案アルゴリズムの後悔に対する上限を厳密に証明し,いくつかの最先端のコラボレーティブ・コンテクスト・バンディット・アルゴリズムと実験的に比較する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:41:40 GMT)
Inferring geometry and material properties from Mueller matrices with machine learning [11.6] 我々は、様々な等方性物質の球面のデータセットを使用し、MMは全角領域を5つの可視波長で捉えた。
我々は、これらのMMのみを入力として、材料特性と表面正規化を予測するために機械学習モデルを訓練する。
材料タイプが不明な場合でも, 表面の正規分布を予測し, 物体形状を再構成できることを実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:20:41 GMT)
ERSR: An Ellipse-constrained pseudo-label refinement and symmetric regularization framework for semi-supervised fetal head segmentation in ultrasound images [11.6] 胎児頭部超音波セグメント化のための新しい半教師付きフレームワークERSRを提案する。
本フレームワークは, 二重符号化適応フィルタリング戦略, 楕円制約付き擬ラベル改良, 対称性に基づく多重整合正則化からなる。
提案手法は,2つのベンチマーク上での最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:01:57 GMT)
Universal non-Hermitian transport in disordered systems [11.5] 混乱したエルミート系では、エネルギー固有状態の局在は波動伝播を禁止している。
非エルミート系では、ハミルトニアンの固有状態が指数関数的に局所化しても波動伝播が可能である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:07:19 GMT)
Practical and Accurate Local Edge Differentially Private Graph Algorithms [11.5] 我々は、kコア分解と三角形カウントという2つの基本グラフ統計量に対して、新しい LDP アルゴリズムを導入する。
提案手法は、入力依存のプライベートグラフ特性、特にグラフの退化性と最大度を活用して、理論的有用性を向上させる。
我々のkコア分解は正確な値の3倍以内の誤差を達成し、Dhulipalaなどのベースラインで131倍の誤差をはるかに上回っている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:44:28 GMT)
CVBench: Evaluating Cross-Video Synergies for Complex Multimodal Understanding and Reasoning [11.5] マルチモーダル大言語モデル (MLLM) はシングルビデオタスクにおいて高い性能を示すが、複数のビデオにまたがる性能はいまだに過小評価されている。
CVBenchは,ビデオ間のリレーショナル推論を厳格に評価するために設計された,最初の総合的なベンチマークである。
CVBenchは、クロスビデオオブジェクトアソシエーション、クロスビデオイベントアソシエーション、クロスビデオ複合推論の3階層にまたがる1000の質問応答対で構成されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:29:35 GMT)
Assessing the Geolocation Capabilities, Limitations and Societal Risks of Generative Vision-Language Models [11.4] ジオローカライゼーション(Geo-localization)とは、視覚的手がかりだけで画像の位置を特定するタスクである。
VLM(Vision-Language Models)は、正確な画像ジオロケータとして機能する傾向にある。
これにより、ストーキングや監視など、プライバシー上の重大なリスクが生じる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:21:31 GMT)
Multimodal Conditional MeshGAN for Personalized Aneurysm Growth Prediction [11.2] MCMeshGANは3次元大動脈瘤進展予測のための条件付きメッシュ・メシュ生成逆数ネットワークである。
専用条件分岐は、臨床属性(年齢、性別)と目標時間間隔を符号化し、解剖学的に妥当で、時間的に制御された予測を生成する。
MCMeshGANは、幾何学的精度と臨床的に重要な直径推定の両方において、最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:25:52 GMT)
NLKI: A lightweight Natural Language Knowledge Integration Framework for Improving Small VLMs in Commonsense VQA Tasks [11.2] ViLT、VisualBERT、FLAVAのような小さな視覚言語モデル(sVLM)は、より大きな生成言語に遅れを取っている。
注意深いコモンセンス知識統合がsVLMに与える影響を検討するため,NLKI(End-to-end framework)を提案する。
微調整されたColBERTv2とオブジェクト情報に富んだプログレッシブ・プロデュース・説明を用いて、幻覚をほとんど切断した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:34:28 GMT)
Improving Generalization in Deepfake Detection with Face Foundation Models and Metric Learning [11.1] 本稿では、強力な一般化を伴う堅牢なビデオディープフェイク検出フレームワークを提案する。
本手法は,実顔データに基づく自己教師型モデルであるFSFM上に構築されている。
トレーニング中に三重項損失の変種を組み込み、実際のサンプルと偽のサンプルの間により分離可能な埋め込みを生成するようモデルに誘導する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:46:45 GMT)
Segmentation Assisted Incremental Test Time Adaptation in an Open World [11.1] 動的環境においては、不慣れな物体や分布シフトがしばしば遭遇する。
この作業は、視覚言語モデルのインクリメンタルテスト時間適応(Incrmental Test Time Adaptation of Vision Language Models)に対処する。
本稿では, セグメンテーション支援型アクティブラベリングモジュールSegAssistを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:33:32 GMT)
HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models [11.0] HONeYBEEは、腫瘍学の応用のために、マルチモーダルなバイオメディカルデータを統合したオープンソースのフレームワークである。
臨床データ(構造化および非構造化)、全スライダー画像、放射線スキャン、分子プロファイルを処理し、統合された患者レベルの埋め込みを生成する。
これらの埋め込みは生存予測、がん型の分類、患者の類似性検索、コホートクラスタリングを可能にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:21:34 GMT)
MathBuddy: A Multimodal System for Affective Math Tutoring [11.0] MathBuddyはLLMで動くMath Tutorだ。
生徒の感情を関連する教育戦略にマッピングし、教師と学生の会話をより共感的なものにする。
DAMRスコアを用いて,勝利率と総合的な3ポイントゲインを用いて,23ポイントの大規模なパフォーマンスゲインを報告した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:50:43 GMT)
Logical Reasoning with Outcome Reward Models for Test-Time Scaling [10.8] 帰納的推論のためのORM(Outcome Reward Models)のセットを提示する。
ORMのトレーニングには、主にChain-of-Thought(CoT)を使って、単一のサンプルと複数のサンプルを使ってデータを生成します。
また、ORMのトレーニングデータセットでカバーされるエラーの種類をさらに拡大するための新しい戦術を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:08:43 GMT)
Do Students Rely on AI? Analysis of Student-ChatGPT Conversations from a Field Study [10.7] 本研究は,各種STEMコースにおける簡単なクイズベースシナリオにおける315人の学生とAIの会話を分析した。
学生は全体としてAIへの依存度が低く、多くの学生は学習にAIを効果的に利用できなかった。
特定の行動メトリクスは、AIへの依存を強く予測し、AIの採用を説明する潜在的な行動メカニズムを強調します。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:00:27 GMT)
Revisiting Pre-trained Language Models for Vulnerability Detection [10.7] プレトレーニング言語モデル(PLM)の急速な進歩は、様々なコード関連タスクに対して有望な結果を示した。
しかし、現実世界の脆弱性を検出する効果は依然として重要な課題である。
本稿では、より小さなコード固有のPLMと大規模PLMにまたがる17のPLMを広範囲に評価するRevisitVDを紹介する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:04:22 GMT)
Convert Language Model into a Value-based Strategic Planner [10.6] 感情支援会話(ESC)は、効果的な会話を通じて個人の感情的苦痛を軽減することを目的としている。
状態モデルの観点からダイアグラムを定義するために,straQ* というフレームワークを提案する。
当社のフレームワークでは,ESC中にLCMをブートストラップし,長期的リターンに基づいて最適な戦略を決定し,最終的にLSMの応答を誘導する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:21:50 GMT)
Doc2Chart: Intent-Driven Zero-Shot Chart Generation from Documents [10.6] 文書から意図に基づくチャート生成の課題を紹介する。
ゴールは、意図に忠実なチャートを生成し、ゼロショット設定でドキュメントに基盤を置くことです。
本稿では,チャートの構造化テキスト表現を用いた属性に基づくメトリクスを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:57:12 GMT)
Ontology-Based Concept Distillation for Radiology Report Retrieval and Labeling [10.5] 既存のほとんどの手法は、CLIPやCXR-BERTのようなモデルからの高次元テキスト埋め込みを比較することに依存している。
統一医療言語システム(Unified Medical Language System)における臨床基礎概念に基づく放射線学報告テキストの比較のための,新しいオントロジーによる代替案を提案する。
本稿では,RadGraph-XLとSapBERTをベースとした拡張パイプラインを用いて,フリーテキストレポートから標準化された医療機関を抽出する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:20:50 GMT)
Conditional Wasserstein Distances with Applications in Bayesian OT Flow Matching [10.5] 逆問題において、多くの条件生成モデルは、合同測度と学習近似との距離を最小化することにより、後続測度を近似する。
条件付きワッサーシュタイン距離は、後部の期待するワッサーシュタイン距離と等しいような制限された結合の集合を通じて導入する。
我々は条件付きワッサーシュタイン距離の理論的性質を導出し、対応する測地線と速度場と流れのODEを特徴づける。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:39:34 GMT)
Cluster and then Embed: A Modular Approach for Visualization [10.4] t-SNE や UMAP などの次元化手法は、潜在的な(相対的な)クラスタ構造を持つデータを可視化するための一般的な手法である。
まず、まずデータをクラスタ化し、次に各クラスタを埋め込み、最後にクラスタを整列してグローバルな埋め込みを得るという、より透明でモジュール化されたアプローチを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:27:30 GMT)
Building Task Bots with Self-learning for Enhanced Adaptability, Extensibility, and Factuality [10.4] この論文は、そのようなボットを作るための障害と潜在的な解決策について考察する。
常に変化する環境でボットが学習し、自律的に適応できる革新的な技術に焦点を当てている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:52:47 GMT)
Latent Variable Modeling for Robust Causal Effect Estimation [10.2] 本稿では、潜在変数モデリングをダブル機械学習パラダイムに統合する新しいフレームワークを提案する。
合成および実世界の両方のデータセットに関する広範な実験を通じて,本手法の堅牢性と有効性を示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:31:03 GMT)
Cross-lingual Offensive Language Detection: A Systematic Review of Datasets, Transfer Approaches and Challenges [10.1] 本調査は,ソーシャルメディアにおける攻撃的言語検出におけるクロスリンガル・トランスファー・ラーニング手法の体系的,包括的調査である。
我々の研究は、この領域における言語横断シナリオにのみ焦点をあてる最初の全体論的な概要である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:26:56 GMT)
Smart Contract Intent Detection with Pre-trained Programming Language Model [9.9] スマートコントラクト開発における悪意ある意図は、経済的にかなりの損失をもたらす可能性がある。
SmartIntentNNは、スマートコントラクトにおける安全でない意図を特定するために特別に設計されたディープラーニングモデルである。
このモデルのアップグレード版であるSmartIntentNN2(Smart Contract Neural Network V2)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:54:15 GMT)
Collaborating with GenAI: Incentives and Replacements [9.9] 我々は、GenAIがそのような環境での協調にどのように影響するかを分析するための理論的枠組みを提案する。
我々は、GenAIがほとんど効果がない場合でも、GenAIが労働者の努力を伴わないことを示す。
分析の結果, 個人価値の低い労働者でさえ, アウトプット全体の維持に重要な役割を果たす可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:41:21 GMT)
Multimodal Prototype Alignment for Semi-supervised Pathology Image Segmentation [9.8] MPAMatchは,マルチモーダルプロトタイプ誘導監視パラダイムの下で画素レベルのコントラスト学習を行う,新たなセグメンテーションフレームワークである。
MPAMatchの中核的な革新は、画像プロトタイプとピクセルラベル、およびテキストプロトタイプとピクセルラベルの間の二重コントラスト学習方式にある。
さらに,ViTバックボーンを病理予知基盤モデル(Uni)に置き換えることで,古典的セグメンテーションアーキテクチャ(TransUNet)を再構築する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:15:13 GMT)
Improving Recommendation Fairness via Graph Structure and Representation Augmentation [9.8] グラフ畳み込みネットワーク(GCN)はレコメンデーションシステムでますます人気が高まっている。
近年の研究では、GCNベースのモデルがグラフ構造において機密情報を広範囲に拡散させることが示されている。
本稿では、公正なグラフと特徴表現を生成するための2つのデータ拡張戦略を含む、公正な推薦のための二重データ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:41:01 GMT)
Position: The Pitfalls of Over-Alignment: Overly Caution Health-Related Responses From LLMs are Unethical and Dangerous [9.7] 健康関連クエリでは、過度に慎重な回答を誘導する過度な調整は、それ自体が有害である、と我々は主張する。
これは非倫理的なだけでなく、精神的にも身体的にも、ユーザにとって危険なことです。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:17:59 GMT)
Tunable quantum anomalous Hall effect in fullerene monolayers [9.7] 多くの物質は、実現可能な条件下で量子異常ホール(QAH)物理学を示すと予測されている。
工学的にカスタマイズされた分子ビルディングブロックによるQAH材料設計への代替手法を提案する。
強磁性基底状態を示すC26フラーレンの2次元(2次元)ハニカム格子に対して,このアンザッツを実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:06:18 GMT)
MDEval: Evaluating and Enhancing Markdown Awareness in Large Language Models [9.6] MDEvalは,大規模言語モデル(LLM)の可読性を評価するベンチマークである。
従来のモデルベース評価とは異なり、MDEvalはモデルベース生成タスクと統計手法を組み合わせた優れた解釈性を提供する。
以上の結果から,MDEvalのスピアマン相関は0.791で,精度は84.1%であった。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:36:57 GMT)
FinCast: A Foundation Model for Financial Time-Series Forecasting [9.5] FinCastは、大規模な金融データセットに基づいてトレーニングされた金融時系列予測用に特別に設計された最初の基礎モデルである。
堅牢なゼロショットパフォーマンスを示し、ドメイン固有の微調整なしで、効果的に多様なパターンをキャプチャする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:44:46 GMT)
Differentially Private Federated Quantum Learning via Quantum Noise [9.5] 量子連合学習(QFL)は、生のデータ交換なしで分散量子デバイス間で量子機械学習(QML)モデルの協調トレーニングを可能にする。
QFLは、情報プライバシを損なうために共有QMLモデルの更新を悪用できる敵攻撃に対して脆弱なままである。
本稿では,QFLプロセス全体の量子モデルを保護するために量子ノイズを利用する新しいDP機構について検討する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:56:16 GMT)
Cross-Modal Geometric Hierarchy Fusion: An Implicit-Submap Driven Framework for Resilient 3D Place Recognition [9.4] 本稿では,密度に依存しない幾何学的推論により3次元位置認識を再定義するフレームワークを提案する。
具体的には、元のシーンポイント雲密度の干渉に免疫する弾性点に基づく暗黙の3次元表現を導入する。
これら2種類の情報を活用することで,鳥眼視と3Dセグメントの両視点から幾何学的情報を融合する記述子を得る。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:09:33 GMT)
Fast Texture Transfer for XR Avatars via Barycentric UV Conversion [9.4] 本稿では,顔のテクスチャをSMPL-Xベースのフルボディアバターに高速かつ効率的に転送する方法を提案する。
提案手法は,UVマッピング全体を1つの変換行列にプリコンプリートし,単一の操作でテクスチャ転送を可能にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:14:18 GMT)
PCR-CA: Parallel Codebook Representations with Contrastive Alignment for Multiple-Category App Recommendation [9.3] PCR-CAはCTR予測を改善するためのエンドツーエンドフレームワークである。
複数のコードブックにまたがる個別の意味表現を並列に学習する。
意味的および協調的なシグナルをブリッジするために、ユーザレベルとアイテムレベルの両方において、コントラスト的なアライメント損失を用いる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:58:08 GMT)
Local Learning Rules for Out-of-Equilibrium Physical Generative Models [9.3] 本研究では,スコアベース生成モデル(SGM)の非平衡駆動プロトコルを局所学習規則により学習可能であることを示す。
駆動プロトコルのパラメータに関する勾配は、力の測定や観測されたシステムダイナミクスから直接計算される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:54:37 GMT)
Is the medical image segmentation problem solved? A survey of current developments and future directions [9.2] 医用画像のセグメンテーションの詳細なレビューを行い、過去10年間の進歩と重要な進展を追究する。
マルチスケール分析,注意機構,事前知識の統合など,基本原理について検討する。
私たちの議論は7つの重要な側面を中心に組織されています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:12:45 GMT)
The Liabilities of Robots.txt [9.2] 我々は,シビル・ドクトリンがWebロボットの動作を制御するための,よりバランスよく持続可能な枠組みを提供すると主張している。
我々は「robots.txt」違反の責任を明確にすることがインターネットの断片化の増大に不可欠であると主張している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:19:32 GMT)
An Empirical Risk Minimization Approach for Offline Inverse RL and Dynamic Discrete Choice Model [9.0] 機械学習において、動的選択(DDC)モデル(オフライン最大エントロピー正規化逆強化学習(オフラインMaxEnt-IRL))を推定する問題について検討する。
目的は、オフラインの振舞いデータからエージェントの振舞いを管理する$Q*$関数をリカバリすることである。
線形パラメータ化報酬の制限的仮定を使わずにこれらの問題を解くための大域収束勾配法を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:01:51 GMT)
A Large-Scale Benchmark of Cross-Modal Learning for Histology and Gene Expression in Spatial Transcriptomics [8.9] HESCAPEは空間転写学におけるクロスモーダルコントラスト事前学習の評価のためのベンチマークである。
空間転写学データに事前訓練された遺伝子モデルは、空間データや単純なベースラインアプローチなしで訓練された遺伝子よりも優れている。
バッチ効果は、効果的なクロスモーダルアライメントを阻害する重要な要因である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:13:02 GMT)
PoolFlip: A Multi-Agent Reinforcement Learning Security Environment for Cyber Defense [8.8] FlipItゲームは、ディフェンダーと高度な敵との相互作用をモデル化するためのフレームワークを提供する。
FlipItでは、アタッカーとディフェンダーは基本的なアクションを実行し、コストを支払うことで共有リソースを制御する。
本稿では,FlipItゲームを拡張するマルチエージェントジム環境であるPoolFlipを紹介する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:18:49 GMT)
A Novel Framework for Automated Explain Vision Model Using Vision-Language Models [8.8] 本稿では,サンプルレベルとデータセットレベルの両方で視覚モデルを説明するパイプラインを提案する。
提案されたパイプラインは、障害ケースを発見し、最小限の労力でビジョンモデルに関する洞察を得るために使用することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:16:40 GMT)
drGT: Attention-Guided Gene Assessment of Drug Response Utilizing a Drug-Cell-Gene Heterogeneous Network [8.7] drGTは、注意係数(AC)を用いたバイオマーカー識別の感度と支援を予測するグラフ深層学習モデルである
このモデルは、Sanger GDSC、NCI60、Broad CTRPという、幅広い薬物やがん細胞株をカバーする主要なベンチマークデータセットを使用して、トレーニングされ、評価されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:36:18 GMT)
DATR: Diffusion-based 3D Apple Tree Reconstruction Framework with Sparse-View [8.5] 本研究は,スパークビューからリンゴ樹を復元するための2段階の枠組みを開発した。
このフレームワークは、フィールドおよび合成データセットの両方で評価された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:45:54 GMT)
Parameter-Free Structural-Diversity Message Passing for Graph Neural Networks [8.5] グラフニューラルネットワーク(GNN)はノード分類などの構造化データモデリングタスクにおいて顕著な性能を示した。
本稿では,構造的多様性に基づくパラメータフリーグラフニューラルネットワークフレームワークを提案する。
このフレームワークは構造多様性理論にインスパイアされ、統一された構造多様性メッセージパッシング機構を設計する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:42:45 GMT)
FraGNNet: A Deep Probabilistic Model for Tandem Mass Spectrum Prediction [8.5] 合成MS/MSスペクトル(C2MS)モデルは,MS/MSスペクトルを予測した実ライブラリを拡大することにより,検索率を向上させることができる。
C2MS予測のための新しい確率的手法であるFraGNNetを開発した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:28:45 GMT)
JVLGS: Joint Vision-Language Gas Leak Segmentation [8.3] ガス漏れは人間の健康に深刻な脅威をもたらす。
効率的な検出方法の欠如は、ガス漏れのタイムリーかつ正確な識別を妨げている。
我々はJVLGS(Joint Vision-Language Gas leak)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:10:43 GMT)
ROBUST-MIPS: A Combined Skeletal Pose and Instance Segmentation Dataset for Laparoscopic Surgical Instruments [8.0] 手術器具の局所化はコンピュータ支援介入技術のためのビルディングブロックである。
骨格的ポーズアノテーションは外科的ツールのより効率的なアノテーションアプローチである,と我々は主張する。
ツールポーズとツールインスタンスセグメンテーションデータセットを組み合わせたROBUST-MIPSを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:23:47 GMT)
ArgCMV: An Argument Summarization Benchmark for the LLM-era [7.8] キーポイント抽出は、議論の要約において重要なタスクである。
KP抽出のための既存のアプローチは、人気のあるArgKP21データセットで評価されている。
SoTA大言語モデル(LLM)を用いて、ArgCMVと呼ばれる新しい引数キーポイント抽出データセットをキュレートする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:26:36 GMT)
SynthCoder: A Synthetical Strategy to Tune LLMs for Code Completion [7.7] コード補完は、ソフトウェア工学における大規模言語モデル(LLM)の顕著な応用である。
本稿では,Fill-in-the-Middle(FIM)コード補完タスクにおける最先端技術を実現するために,業界をリードするプラクティスを統合するモデルであるSynthCoderを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:09:21 GMT)
Controlling the $\mathcal{PT}$ Symmetry Breaking Threshold in Bipartite Lattice Systems with Floquet Topological Edge States [7.7] 周期的に駆動された1次元二量体格子におけるパリティ時間(mathcalPT$)対称性の破断閾値の制御について検討した。
奇数のサイトを持つ格子は偶数サイズのシステムとは対照的に、ユニークなしきい値パターンを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:35:32 GMT)
MedNet-PVS: A MedNeXt-Based Deep Learning Model for Automated Segmentation of Perivascular Spaces [7.6] 脳小血管疾患、アルツハイマー病、脳卒中、老化関連神経変性のバイオマーカーとして認識されている。
我々は、トランスフォーマーにインスパイアされた3Dエンコーダ・デコーダ畳み込みネットワークであるMedNeXt-L-k5を自動PSVセグメンテーションに適用した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:24:12 GMT)
RelAItionship Building: Analyzing Recruitment Strategies for Participatory AI [7.6] 参加型AIプロジェクトの採用手法を設計・実行する際に研究者が直面する課題について検討する。
我々は、37のプロジェクトからなるコーパスを用いて、AIプロジェクトで採用手法を記述し、現場におけるプラクティスの多様性を捉え、採用プラクティスの文書化に関する初期分析を行う。
これらの結果は、彼らの仕事の構造的条件、研究者自身の目標と期待、そして採用方法論とその後のコラボレーションから構築された関係によって形成されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:00:46 GMT)
SAT: Supervisor Regularization and Animation Augmentation for Two-process Monocular Texture 3D Human Reconstruction [7.6] モノクラーテクスチャ3D人間の再構築は、単一のフロントビューの人間のRGB画像から完全な3Dデジタルアバターを作成することを目的としている。
本研究では,従来の様々な測地を統一的にシームレスに学習する2プロセスの人体再構成フレームワークSATを提案する。
また,データ不足に対処し,再現性を向上させるオンラインアニメーション拡張モジュールを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:52:35 GMT)
GIMS: Image Matching System Based on Adaptive Graph Construction and Graph Neural Network [7.6] 本稿では,距離と動的しきい値の類似性に基づくフィルタリング機構を利用する,革新的な適応グラフ構築手法を提案する。
また、トランスフォーマーのグローバルな認識能力を組み合わせて、グラフ構造の表現を強化する。
システム全体のマッチング性能は平均3.8x-40.3x向上した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:21:20 GMT)
Optimistic Exploration for Risk-Averse Constrained Reinforcement Learning [7.5] リスク・アバース制約強化学習(RaCRL)は、稀かつ破滅的な制約違反の可能性を最小限に抑える政策を学ぶことを目的としている。
我々は,ORAC(Optimistic Risk-averse Actor Critic)と呼ばれるRaCRLの探索に基づくアプローチを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:33:06 GMT)
Survey of Specialized Large Language Model [7.4] 特殊な大規模言語モデル(LLM)の急速な進化は、シンプルなドメイン適応から洗練されたネイティブアーキテクチャへと移行してきた。
この調査は、医療、金融、法律、技術分野にまたがるこの進歩を体系的に調査する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:27:23 GMT)
PGAD: Prototype-Guided Adaptive Distillation for Multi-Modal Learning in AD Diagnosis [7.3] 欠失はアルツハイマー病(AD)の診断において大きな問題となる。
既存のほとんどのメソッドは完全なデータのみをトレーニングし、ADNIのような現実世界のデータセットに不完全なサンプルが多数含まれていることを無視している。
本稿では,不完全なマルチモーダルデータをトレーニングに直接組み込んだPGAD(Prototype-Guided Adaptive Distillation)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:10:39 GMT)
ScanMove: Motion Prediction and Transfer for Unregistered Body Meshes [7.2] 非登録表面メッシュ、特に生の3Dスキャンは、可塑性変形の自動計算における重要な課題である。
我々は,このようなボディーメッシュ上での予測と転送のための,リグフリーでデータ駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:41:32 GMT)
Conditional Normalizing Flow Surrogate for Monte Carlo Prediction of Radiative Properties in Nanoparticle-Embedded Layers [7.2] 本研究では, ナノ粒子の散乱媒体の放射特性を予測するためのデータ駆動型代理モデルを提案する。
我々は三重理論から導かれる光学特性を持つモンテカルロ放射移動シミュレーションを用いてトレーニングデータを生成する。
以上の結果から,このモデルは高い予測精度と信頼性の高い不確実性推定を実現し,放射移動シミュレーションのための強力で効率的なサロゲートとして確立した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:54:06 GMT)
Classification of Heart Sounds Using Multi-Branch Deep Convolutional Network and LSTM-CNN [7.1] 本研究は, 心臓疾患の自動診断のための, 迅速かつ正確かつ費用対効果の高い手法を提供する新しいディープラーニングアーキテクチャを開発し, 評価する。
まず,多様な畳み込みフィルタサイズを利用して人間の聴覚処理をエミュレートするマルチブランチディープ畳み込みニューラルネットワーク(MBDCN)と,特徴抽出のためのパワースペクトル入力の2つの革新的な手法を提案する。
第二に、LSTMブロックをMBDCNに統合し、時間領域の特徴抽出を改善するLong Short-Term Memory-Convolutional Neural (LSCN)モデルである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:08:33 GMT)
Sat2Flow: A Structure-Aware Diffusion Framework for Human Flow Generation from Satellite Imagery [7.1] Origin-Destination (OD) フロー行列は、交通予測、インフラ計画、政策設計における基盤となる都市移動分析に不可欠である。
本稿では,衛星画像のみを入力として,構造的に整合したODフローを生成する潜在構造認識拡散に基づくフレームワークであるSat2Flowを提案する。
実世界の都市データセットによる実験結果から,Sat2Flowは物理ベースベースラインとデータ駆動ベースラインの両方を数値的精度で上回り,指数置換の下で経験的分布と空間構造を保存する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:05:37 GMT)
Weed Detection in Challenging Field Conditions: A Semi-Supervised Framework for Overcoming Shadow Bias and Data Scarcity [7.0] 本研究は、診断駆動型半教師付きフレームワークにより、両方の問題に取り組む。
我々は、サトウキビのギニアグラスのラベル付き画像に約975枚と1万枚をラベル付けしたユニークなデータセットを使用します。
我々の研究は、堅牢なコンピュータビジョンシステムの開発、診断、改善のための明確でフィールドテストされたフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:55:47 GMT)
Preference Elicitation for Multi-objective Combinatorial Optimization with Active Learning and Maximum Likelihood Estimation [6.7] 現実の最適化問題には、価格、製品品質、持続可能性など、相反する目標が伴うことが多い。
複数の目的に対処する計算効率のよい方法は、それらを線形結合のような単目的関数に集約することである。
Constructive Preference Elicitationフレームワークを構築し、これらの3つのプロパティをどのように改善できるかを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:03:47 GMT)
Leveraging Multi-facet Paths for Heterogeneous Graph Representation Learning [6.7] MF2Vecは、事前に定義されたメタパスの代わりに、多面的(きめ細かい)パスを使用するモデルである。
この方法はノードとその関係の多様な側面を学習し、均質なネットワークを構築し、分類、リンク予測、クラスタリングのためのノード埋め込みを生成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:23:46 GMT)
Variational Bayes image restoration with compressive autoencoders [6.7] 逆問題の正規化は、計算イメージングにおいて最重要となる。
本研究では,まず,最先端生成モデルの代わりに変分オートエンコーダを提案する。
第2の貢献として、変分推論内で潜時推定を行う変分ベイズ潜時推定(VBLE)アルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:19:05 GMT)
Array-Based Monte Carlo Tree Search [6.7] 本稿では,ツリーアルゴリズムに適用された古典的アッパー信頼境界のアレーベース実装について述べる。
本手法は元のアルゴリズムの論理を保存するが,分岐予測は不要である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:49:32 GMT)
Hierarchical Decentralized Stochastic Control for Cyber-Physical Systems [6.6] 本稿では,サイバー物理システムのための2時間規模の階層型分散制御アーキテクチャを提案する。
このシステムはグローバルコントローラ(GC)とNローカルコントローラ(LC)で構成される。
エネルギーグリッド計画、山火事管理、その他の分散資源配分問題に応用できる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:30:10 GMT)
Floquet-engineered moire quasicrystal patterns of ultracold atoms in twisted bilayer optical lattices [6.5] 超低温原子のツイスト2層六角形光学格子におけるフロケット・エンジニアリングによる原子間相互作用によるモアレ準結晶パターンを得る。
動的進化を4つの異なる段階に分割し、実数空間と運動量空間の両方において各段階のパターン変化を検証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:05:23 GMT)
From Evidence to Decision: Exploring Evaluative AI [6.5] 本稿では,Evidenceフレームワークの拡張による評価AIの実装を提案する。
住宅価格予測と皮膚癌診断の2分野に新たな意思決定支援アプローチを適用した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:49:13 GMT)
DCHO: A Decomposition-Composition Framework for Predicting Higher-Order Brain Connectivity to Enhance Diverse Downstream Applications [6.4] 高次脳接続(HOBC)は、3つ以上の脳領域間の相互作用を捉える。
近年,非侵襲的画像データから潜伏型HOBCを推定し始めている。
本稿では,HOBCの時間的進化をモデル化し,予測するための統合アプローチであるDCHOを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:01:35 GMT)
AI-Powered Detection of Inappropriate Language in Medical School Curricula [6.4] 不適切な言語(IUL)とそのサブカテゴリを手動で識別することは、違法にコストがかかり非現実的である。
ラベル付きデータに微調整された小言語モデルの第一級評価を行う。
LLama-3 8B と 70B は、慎重にキュレートされたショットでも、主に SLM よりも優れています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:40:45 GMT)
A Lightweight Crowd Model for Robot Social Navigation [6.4] 従来の顕微鏡モデルは、計算コストが高いため、密度の高い群衆でスケールするのに苦労する。
本研究では,人間の動作に適した軽量でリアルタイムな群集予測モデルを提案する。
予測精度を3.1 %向上させながら,予測時間の3.6 倍の削減効果を示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:13:43 GMT)
Encouraging Good Processes Without the Need for Good Answers: Reinforcement Learning for LLM Agent Planning [6.3] Reinforcement Learning with Tool-use Rewardsは、トレーニングプロセスを分離して、計画モジュールの集中的で単目的的な最適化を可能にする新しいフレームワークである。
実験の結果, RLTRは, エンド・ツー・エンドのベースラインに比べて, 計画性能が8%-12%向上していることがわかった。
この拡張計画能力は、結果として、全体のエージェントシステムの最終的な応答品質が5%-6%向上したことを意味する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:19:50 GMT)
Symphony: A Decentralized Multi-Agent Framework for Scalable Collective Intelligence [6.3] Symphony(シンフォニー)は、軽量大規模言語モデル(LLM)エージェントの協調を可能にする分散マルチエージェントシステムである。
本稿では,(1)機能を記録する分散台帳,(2)動的タスク割り当てのためのBeacon-selectionプロトコル,(3)CoTに基づく重み付け結果投票の3つのメカニズムを紹介する。
経験的に、Symphonyは、推論ベンチマークで既存のベースラインを上回り、相当な精度のゲインを達成し、様々な能力を持つモデル間で堅牢性を示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:27:57 GMT)
Delta-Audit: Explaining What Changes When Models Change [6.2] textbfDelta-Attribution (mbox$Delta$-Attribution)はモデルに依存しないフレームワークで、バージョン$A$と$B$の違いを説明する。
emph$Delta$-Attribution Quality Suite(L1, Top-$k$, entropy), agreement/shift(rank-overlap@10, Jensen-Shannon divergence)、振舞いアライメントを含む$Deltaphi$を評価する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:52:38 GMT)
DGenCTR: Towards a Universal Generative Paradigm for Click-Through Rate Prediction via Discrete Diffusion [6.2] 離散拡散に基づく2段階CTRトレーニングフレームワーク(DGenCTR)を提案する。
本発明の2段階のフレームワークは、拡散ベースの生成前訓練段階と、CTRのためのCTRを標的とした微調整段階とを含む。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:19:38 GMT)
Reducing Biases towards Minoritized Populations in Medical Curricular Content via Artificial Intelligence for Fairer Health Outcomes [6.1] BRICCは、機械学習を用いて医療の生体情報を軽減するための第一級イニシアチブである。
金標準のBRICCデータセットは数年かけて開発され、12Kページ以上の教材が含まれている。
包括的コーディングガイドラインに従って、医療専門家は慎重にこれらの文書にバイアスを付与した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:53:11 GMT)
MobText-SISA: Efficient Machine Unlearning for Mobility Logs with Spatio-Temporal and Natural-Language Data [6.0] 我々は、Sharded、Isolated Slice、AggregatedSIS(A)トレーニングを異種時間データに拡張するスケーラブルな機械学習フレームワークであるMobText-SISAを紹介する。
我々は,MobText-SISAが誤差と収束速度の両方でランダムシャーディングを一貫して上回っていることを示す。
これらの結果から,都市部におけるモビリティデータに基づくプライバシ準拠分析の実践的基盤として,MobText-SISAが確立された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:55:16 GMT)
Nemori: Self-Organizing Agent Memory Inspired by Cognitive Science [6.0] 人間の認知原理に触発された,新たな自己組織型メモリアーキテクチャであるNemoriを紹介する。
ネモリの中核的な革新は、会話の流れを意味的に一貫性のあるエピソードに自律的に整理するトップダウン手法である。
ネモリは最先端のシステムよりも優れており、その利点は特に長い文脈で顕著である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:53:24 GMT)
Fourier transform-based linear combination of Hamiltonian simulation [6.0] ハミルトニアンシミュレーション(LCHS)の線形結合は、一般線型非ユニタリ力学とユニタリ作用素を連結する。
既存のLCHS形式は、半複素平面上の複雑な技術的条件の下でのカーネル関数を見つける必要がある。
新しい形式主義は、LCHSカーネル関数を構築するための単純で柔軟な方法を提供するために、実際の軸を超えた技術的要求を完全に取り除く。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:17:08 GMT)
Detecting Metadata-Related Bugs in Enterprise Applications [5.9] 本稿では,(1)メタデータチェックルールを規定するためにドメインの専門家が利用できるドメイン固有言語であるRSLと,(2)ルール違反をチェックするためのRSLルールとEAを利用するツールであるMeCheckについて述べる。
評価のために、SpringとJUnitのドキュメントを調べ、15のルールを手動で定義し、115のオープンソースEAを持つ2つのデータセットを作成しました。
MeCheck氏は、最初のデータセットのバグを100%の精度、96%のリコール、98%のFスコアで特定した。第2データセットで156のバグを報告し、53のバグがすでに開発者によって修正されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 23:35:52 GMT)
X-Troll: eXplainable Detection of State-Sponsored Information Operations Agents [5.9] 国家主催のトロルは、オンラインの言論の整合性を脅かしている。
大規模言語モデル(LLM)は,自然言語処理(NLP)タスクにおいて高い性能を発揮する。
X-Trollは、説明可能なアダプタベースのLLMと専門家由来の言語知識を統合することでギャップを埋める新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:18:21 GMT)
Beacon: Post-Training Quantization with Integrated Grid Selection [5.9] チャネルごとのポストトレーニング量子化における重要な課題は、適切なスケーリング要因を選択することである。
このような手動チューニングを不要とした,単純かつ効率的なアルゴリズムBeaconを提案する。
ビーコンは最先端の手法に比べて競争力がある。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:00:18 GMT)
Generalizing Monocular 3D Object Detection [5.9] モノクロ3Dオブジェクト検出(Monocular 3D object detection, Monocular 3D)は、オブジェクトのクラス、3D位置、寸法、方向を単一の画像から推定する基本的なコンピュータビジョンタスクである。
この論文は、Mono3Dモデルをさまざまなシナリオに一般化するという課題に対処する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:06:18 GMT)
DeepForest: Sensing Into Self-Occluding Volumes of Vegetation With Aerial Imaging [5.8] リモートセンシングの長期的限界は、深い天蓋層に深く浸透する。
現在、LiDARとレーダーは3D植生構造を測定するための主要な選択肢と考えられている。
我々のアプローチは、森林のような自己排他的な植生の量を感知することを可能にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:09:24 GMT)
Learning Game-Playing Agents with Generative Code Optimization [5.8] 我々は,Pythonプログラムとしてポリシーを表現し,大規模言語モデル(LLM)を用いて洗練されるゲームプレイングエージェントを学習するための生成的最適化手法を提案する。
提案手法は意思決定方針を自己進化型コードとして扱い,現在の観察を入力として,ゲーム内アクションを出力として,エージェントが実行トレースや自然言語フィードバックを最小限の介入で自己改善することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:30:20 GMT)
BinConv: A Neural Architecture for Ordinal Encoding in Time-Series Forecasting [5.8] 確率予測のために設計された完全畳み込みニューラルネットワークアーキテクチャである textbfBinConv を提案する。
BinConvは、ポイントと確率予測の両方で広く使用されているベースラインデータセットと比較して、優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:18:09 GMT)
LDRFusion: A LiDAR-Dominant multimodal refinement framework for 3D object detection [5.8] 既存のLiDAR-Camera融合法は3次元物体検出において大きな成果を上げている。
我々は,LDRFusionを提案する。LDRFusionは,マルチセンサフュージョンのための新しい2段階改良フレームワークである。
当社のフレームワークは,複数のカテゴリと難易度をまたいだパフォーマンスを継続的に達成しています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:27:18 GMT)
Taming the Chaos: Coordinated Autoscaling for Heterogeneous and Disaggregated LLM Inference [5.8] Serving Large Language Models (LLMs)は、従来のオートスケーラが不足するGPU集約的なタスクである。
我々は,P/D分散サービスにおけるコア課題に対処する,協調型自動スケーリングフレームワークであるHeteroScaleを紹介した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:22:02 GMT)
Social Bias in Multilingual Language Models: A Survey [5.8] この体系的なレビューは、バイアス評価と緩和アプローチを多言語および非英語の文脈に拡張する新興研究を分析している。
本稿では,言語多様性,文化意識,評価指標の選択,緩和手法について検討する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:25:32 GMT)
To the Noise and Back: Diffusion for Shared Autonomy [5.7] 拡散モデルの前方および逆拡散過程を変調した共有自律性に対する新しいアプローチを提案する。
我々のフレームワークは望ましい行動の空間上の分布を学習する。
次に、拡散モデルを使用して、ユーザのアクションをこのディストリビューションのサンプルに変換する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:12:36 GMT)
KRETA: A Benchmark for Korean Reading and Reasoning in Text-Rich VQA Attuned to Diverse Visual Contexts [5.7] KRETA (KRETA) は、様々な視覚的コンテキストに適応したテキストリッチVQAにおける韓国の読み書きとrEasoningのベンチマークである。
KRETAは、多面的評価をサポートしながら、視覚的テキスト理解と推論能力の両方の詳細な評価を容易にする。
テキストリッチな設定に最適化された半自動VQA生成パイプラインを導入する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:01:02 GMT)
MicroLad: 2D-to-3D Microstructure Reconstruction and Generation via Latent Diffusion and Score Distillation [5.7] MicroLadは2次元データから3次元の微細構造を再構成するための遅延拡散フレームワークである。
安定でコヒーレントな3Dボリュームを確実に生成し、元のデータと統計的に一致している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:21:50 GMT)
Approximate Lifted Model Construction [5.7] 本稿では,$varepsilon$-Advanced Colour Passing(varepsilon$-ACP)アルゴリズムを提案する。
ACPは、たとえ関連オブジェクトが区別できないとしても、データから学習したポテンシャルが必然的に逸脱する実用的な応用には適さない。
我々は, $varepsilon$-ACP による近似誤差が厳密な有界であることを証明し, この近似誤差が実際にゼロに近いことを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:48:13 GMT)
Prompting Strategies for Language Model-Based Item Generation in K-12 Education: Bridging the Gap Between Small and Large Language Models [5.6] 本研究では、言語モデルを用いた自動生成(AIG)を用いて、形態的評価のための複数選択質問(MCQ)を作成する。
ゼロショット,少数ショット,チェーンオブ思考,ロールベース,シーケンシャル,組み合わせを含む7つの構造化プロンプト戦略を評価した。
その結果,構造的プロンプト,特にチェーン・オブ・シンクショナルデザインとシーケンシャルデザインを組み合わせた戦略はGemmaの出力を大幅に改善した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:54:32 GMT)
Network Formation and Dynamics Among Multi-LLMs [5.5] ソーシャルネットワークは、人間が意見を作り、情報を交換し、まとめる方法に大きな影響を与える。
大規模言語モデル(LLM)は、社会的および専門的な環境にますます組み込まれているため、それらの相互作用が人間に似たネットワーク力学に近似するかどうかを理解することが重要である。
我々は,複数のLLMエージェントのネットワーク形成挙動を解析し,人的決定に対してそれらをベンチマークする枠組みを開発した。
LLMは、コミュニティ構造や小世界効果を含むマクロレベルの特性だけでなく、優先的なアタッチメント、三進的クロージャ、ホモフィリーといった基本的ミクロレベルの原則を一貫して再現している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:40:17 GMT)
Do Vision Encoders Truly Explain Object Hallucination?: Mitigating Object Hallucination via Simple Fine-Grained CLIPScore [5.5] 本研究では、このような幻覚の原因が視覚エンコーダの限られた表現能力にあるという以前の主張を再考する。
F-CLIPScore(F-CLIPScore)は,名詞レベルでのテキスト埋め込みを組み込むことで,オブジェクトレベルの粒度を向上する簡易かつ効果的な評価指標である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:19:08 GMT)
Bootstrapping Learned Cost Models with Synthetic SQL Queries [5.4] 学習コストモデルの最近の進歩は、特定のデータベースエンジンに対して所定のクエリを実行するコストを効果的かつ効率的に予測できることを示している。
競合生成手法よりも45%少ないクエリでトレーニングすることで,学習コストモデルの予測精度を向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:50:42 GMT)
From Search to Reasoning: A Five-Level RAG Capability Framework for Enterprise Data [5.3] Retrieval-Augmented Generationは、エンタープライズデータに関する質問に答えるための標準パラダイムとして登場した。
本稿では,データモダリティとタスクの複雑さに基づいた分類を行うための新しい分類フレームワーク(L1-L5)を提案する。
LangChain、Azure AI Search、OpenAI、Corvic AIの4つの最先端プラットフォームを評価します。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:43:03 GMT)
Operator learning meets inverse problems: A probabilistic perspective [5.3] 演算子学習は無限次元関数空間間の写像を近似するための堅牢なフレームワークを提供する。
本章では、演算子学習と逆問題との交点における発展について調査する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:34:40 GMT)
Can Compact Language Models Search Like Agents? Distillation-Guided Policy Optimization for Preserving Agentic RAG Capabilities [5.2] 強化学習(Reinforcement Learning)は、言語モデルからエージェントRAGの振る舞いを抽出するためのポストトレーニングアプローチとして登場した。
Agentic RAG Capabilities (ARC) は、推論、探索調整、応答合成を詳細に分析するメトリクスである。
DGPOはリソース制約のある環境でエージェントRAGを実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 23:57:29 GMT)
Experimental realization of universal quantum gates and six-qubit entangled state using photonic quantum walk [5.2] 室温での高忠実度量子ゲートの普遍的な実現を実験的に実証した。
単一光子を用いた3量子系では、第1の量子ビットは偏光情報を用いて符号化され、残りの2つの量子ビットは経路情報を用いて符号化される。
6キュービットのグリーンバーガー・ホーネ・ザイリンガー状態を生成するために、2つの3キュービット加群を絡めるために、絡み合った光子対を用いる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:09:33 GMT)
Eigenvalue distribution of the Neural Tangent Kernel in the quadratic scaling [5.1] 本研究では,2層ニューラルネットワークのニューラルネットワークの固有値分布を,次元の特定のスケーリングの下で計算する。
我々は,この分布を,$sigma$と$D$に依存する決定論的分布を持つマルテンコ-パストゥル分布の自由乗法的畳み込みとして記述する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:41:01 GMT)
Fray: An Efficient General-Purpose Concurrency Testing Platform for the JVM (Extended Version) [5.0] 本稿では,データトレースフリープログラムのプッシュボタンテストを行うプラットフォームであるFrayを提案する。
Frayにはシャドウと呼ばれる新しい制御機構が組み込まれている。
既知のバグのある53のベンチマークプログラムに対する実証的な評価では、ランダム検索のFrayはJPFよりも70%多く、RRのカオスモードより77%多いバグを発見した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:11:55 GMT)
The Influence of Code Comments on the Perceived Helpfulness of Stack Overflow Posts [5.0] Stack Overflowのような質問と回答のプラットフォームは、ソフトウェア開発者が知識を共有し、取得するための重要な方法となっている。
コードコメントがStack Overflowの回答の有用性にどのように影響するかをよりよく理解するために、私たちはStack Overflow環境をシミュレートするオンライン実験を実施しました。
結果は、ブロックコメントとインラインコメントの両方が、未記述のソースコードよりもはるかに役に立つと認識されていることを示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:45:00 GMT)
Search for thermodynamically stable ambient-pressure superconducting hydrides in GNoME database [5.0] 室圧で熱力学的に安定な水和物超伝導体の超伝導特性を評価することを目的としている。
熱力学的に安定な22立方体水和物と4.2K以上で最大で17KのT_rmcを同定した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:04:09 GMT)
Quantum i.i.d. Steady States in Open Many-Body Systems [4.9] 我々は、ゴリーニ-コサコフスキー-スダルシャン-リンドブラッド力学によって支配されるオープン量子多体系の一般的な等価条件を確立する。
任意の量子 i.d. 状態と交換する作用素の集合を同定することにより、系が定常状態を持つのに十分な条件を示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:29:13 GMT)
GRADSTOP: Early Stopping of Gradient Descent via Posterior Sampling [4.9] 機械学習モデルは、しばしば過剰適合に悩まされ、目に見えないデータに対する予測性能が低下する。
標準解はホールドアウト検証セットを使用して早期に停止し、検証損失の減少が止まった場合に最小化を停止する。
本稿では,勾配降下アルゴリズムによって生成される勾配情報のみを利用する新しい早期停止法であるGRADSTOPを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:19:54 GMT)
Orchid: Orchestrating Context Across Creative Workflows with Generative AI [4.7] Orchidはユーザがコンテキストを指定、参照、監視できる能力を提供するシステムである。
具体的には、Orchidを使うと、ユーザはプロジェクト、それ自身、および異なるスタイルに関連するコンテキストを指定できる。
内在的な研究において、オーキッドを用いて創造的なタスクを実行する参加者は、より斬新で実現可能な結果を生み出した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 02:12:37 GMT)
BuzzSet v1.0: A Dataset for Pollinator Detection in Field Conditions [4.7] ミツバチやバンブルビーのようなポリネーター昆虫は、世界の食糧生産と生態系の安定に不可欠である。
BuzzSetは,農業現場で収集した高解像度受粉体画像の大規模データセットである。
BuzzSetには、手動で検証された7856個の画像とラベル付き画像が含まれており、ミツバチ、バンブルビー、未確認昆虫の3つのクラスに8000以上の注釈付きインスタンスがある。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:40:15 GMT)
Machine Learning for Asymptomatic Ratoon Stunting Disease Detection With Freely Available Satellite Based Multispectral Imaging [4.5] サトウキビの病気検出は効果的な作物管理に重要である。
本研究では,様々なサトウキビ品種におけるRSDの存在を検出するために,様々な機械学習技術を用いた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:30:16 GMT)
PromptKeeper: Safeguarding System Prompts for LLMs [4.3] システムプロンプトは大規模言語モデル(LLM)の出力を導くために広く使われている
敵や通常のユーザクエリでさえ、これらの隠れたプロンプトを公開するために脆弱性を悪用することができる。
PromptKeeperは,漏洩を確実に検出し,漏洩が発生した場合にサイドチャネルの脆弱性を軽減し,システムプロンプトを保護するための防御機構である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:38:03 GMT)
SPLF-SAM: Self-Prompting Segment Anything Model for Light Field Salient Object Detection [4.3] Seegment Anything Model (SAM) は、光場極性物体検出(LF SOD)を解く際、顕著な能力を示した。
本稿では,SPLF-SAMと呼ばれる新しい光場セグメントモデルを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:22:17 GMT)
Streamlining the Development of Active Learning Methods in Real-World Object Detection [4.2] 実世界のオブジェクト検出のためのアクティブな学習は、実用的なデプロイメントを制限する計算と信頼性の課題に直面します。
これらの課題に対処する指標であるオブジェクトベースのセット類似性(mathrmOSS$)を紹介します。
この研究は、オブジェクト類似性に基づいたオブジェクト検出におけるALトレーニングと評価戦略を統合する最初のものである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:10:16 GMT)
MoveScanner: Analysis of Security Risks of Move Smart Contracts [4.2] 本稿では,Moveエコシステム内の既存のセキュリティツールの限界を体系的に分析する。
MoveScannerは、制御フローグラフとデータフロー分析アーキテクチャに基づく静的解析ツールである。
MoveScannerは、リソースリーク、弱いパーミッション管理、演算オーバーフローを含む5つの重要なセキュリティ脆弱性を効果的に識別できる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:43:40 GMT)
FlowDet: Overcoming Perspective and Scale Challenges in Real-Time End-to-End Traffic Detection [4.2] FlowDetはDreTRアーキテクチャに適用された分離エンコーダ最適化戦略を備えた高速検出器である。
FlowDetは、トラフィック対応の幾何モデリングに新しい幾何学的変形ユニット(GDU)を採用している。
AP(test)を1.5%改善し、AP50(test)を1.6%改善し、同時にGFLOPを63.2%削減し、推論速度を16.2%向上させた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:49:04 GMT)
Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions [4.1] 複数のエージェント間のNash平衡相互作用のデータセットからパラメトリック制約を学習する逆動的ゲームベースアルゴリズムを提案する。
また,本手法により得られた相互作用制約を用いて,基礎となる制約を確実に満たす動作計画の設計を行う。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:01:09 GMT)
Towards Diagnostic Quality Flat-Panel Detector CT Imaging Using Diffusion Models [4.1] 介入室に存在するフラットパネル検出器CT (FDCT) の画質は, 重要なアーティファクトのため, 一般的にMDCTよりもはるかに低い。
いくつかの研究は、FDCT画像のみの使用の可能性と、FDCTの介入前および/または介入後の画像を取得することで保存できる時間について評価している。
本研究では,FDCTスキャンの画質向上にDDPM(denoising probabilistic diffusion model)を用いることで,MDCTスキャンに匹敵する画像品質を実現することを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:36:26 GMT)
SwizzlePerf: Hardware-Aware LLMs for GPU Kernel Performance Optimization [4.0] SwizzlePerfは、分散アーキテクチャ上でGPUカーネルの空間最適化を自動的に生成する。
SwizzlePerfは10種類のMLカーネルとScienceカーネルのスイートで、最大2.06倍のスピードアップとL2ヒットレートの70%の改善を実現する9つのカーネルのスワズリングパターンを生成することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:30:43 GMT)
Realization of a doped quantum antiferromagnet with dipolar tunnelings in a Rydberg tweezer array [4.0] 我々は、Rydberg tweezer プラットフォームを用いて、next-nearest neighbor (NNN) トンネルを$t'$で、ハードコアのボソニックホールをトンネルするドープ量子反強磁性を実現する。
ホール領域とスピン領域の動的位相分離を$|t/J|ll 1$で観測し、様々なスピン背景における反発束縛孔対の形成を実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:27:35 GMT)
Benchmarking Hindi LLMs: A New Suite of Datasets and a Comparative Analysis [4.0] IFEval-Hi, MT-Bench-Hi, GSM8K-Hi, ChatRAG-Hi, BFCL-Hiの5つのHindi評価データセット群を紹介する。
これらは、intra-scratch Humanアノテーションとtranslate-and-verifyプロセスを組み合わせた方法論を用いて作成された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:35:31 GMT)
Characteristics of ChatGPT users from Germany: implications for the digital divide from web tracking data [3.9] 本稿では,AIを利用した会話エージェントChatGPTのユーザ特性について検討する。
フルタイムの雇用と、より多くの子どもがChatGPT活動の障壁になることに気付きました。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:12:03 GMT)
WEBEYETRACK: Scalable Eye-Tracking for the Browser via On-Device Few-Shot Personalization [3.9] We bEyeTrackは軽量なSOTA視線推定モデルをブラウザに直接統合するフレームワークです。
モデルベースの頭部ポーズ推定と、デバイス上でのいくつかのショット学習と、9つのキャリブレーションサンプルが組み込まれている。
WebEyeTrackは新しいユーザーに適応し、GazeCaptureでエラーマージンが2.32cm、iPhone 14で2.4ミリ秒のリアルタイム推論速度でSOTAのパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:38:58 GMT)
Private, Verifiable, and Auditable AI Systems [3.7] この論文は、現代のAIにおけるプライバシ、検証可能性、監査可能性の間の相互作用に対処する。
これらの要素を統合する技術的ソリューションは、AIイノベーションの責任を負う上で重要である、と氏は主張する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:08:44 GMT)
More than Carbon: Cradle-to-Grave environmental impacts of GenAI training on the Nvidia A100 GPU [3.7] 本研究では,Nvidia A100 SXM 40GB GPUの詳細な一次データ収集に基づく16の環境影響カテゴリについて検討した。
BLOOMをトレーニングするためのLCAの結果は、気候変動を含む16のカテゴリーのうち、利用フェーズが11を支配していることを示している。
製造段階は、ヒト毒性、がんを含む16のインパクトカテゴリーのうち6つを占める。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:00:38 GMT)
Beyond Shallow Heuristics: Leveraging Human Intuition for Curriculum Learning [3.7] 本研究では,人為的な単純な言語がカリキュラム学習に有効な信号であるかどうかを考察する。
以上の結果から,言語的困難に対する人間の直感は,言語モデル事前学習のためのCLを導出できることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:35:13 GMT)
A Metropolis-Adjusted Langevin Algorithm for Sampling Jeffreys Prior [3.7] 推測と推定は統計学、システム識別、機械学習において基本的なものである。
ジェフリーズ事前はフィッシャー情報行列を通してパラメータ空間の固有の幾何学構造を符号化するので、魅力ある非形式的先行である。
我々は,ジェフリーズ以前のパラメータ値のサンプリングを可能にするメトロポリス調整ランゲヴィンアルゴリズムを用いて,一般的なサンプリング手法を開発した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:40:30 GMT)
Fractal Flow: Hierarchical and Interpretable Normalizing Flow via Topic Modeling and Recursive Strategy [3.6] 本稿では,表現性と解釈性の両方を高める新しい正規化フローアーキテクチャであるフラクタルフローを提案する。
MNIST, FashionMNIST, CIFAR-10, および物理データを用いた実験により, フラクタルフローが潜在クラスタリング, 制御可能な生成, 推定精度の向上を実証した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:25:15 GMT)
Divide, Weight, and Route: Difficulty-Aware Optimization with Dynamic Expert Fusion for Long-tailed Recognition [3.6] textbfDQRouteは、難易度を考慮した最適化と動的専門家のコラボレーションを組み合わせたモジュラーフレームワークである。
DQRouteはまず、予測の不確実性と過去のパフォーマンスに基づいて、クラスレベルの難易度を推定する。
推測時に専門家予測は、専門家固有のOOD検出器から得られる信頼度スコアによって重み付けされ、入力適応ルーティングが可能である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:09:00 GMT)
From Research to Reality: Feasibility of Gradient Inversion Attacks in Federated Learning [3.6] アーキテクチャとトレーニングの振る舞いが脆弱性にどのように影響するかを系統的に分析する。
現実的な訓練条件下では,攻撃的知識の異なるトレーニングモードにおけるモデルに対する2つの新たな攻撃を導入し,最先端のパフォーマンスを実現する。
アーキテクチャの選択と運用モードの組み合わせが、プライバシに有意義な影響を及ぼすかを明確にし、最初の包括的な設定マッピングを提供することで、この作業を締めくくります。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:07:23 GMT)
AutoQ-VIS: Improving Unsupervised Video Instance Segmentation via Automatic Quality Assessment [3.6] ビデオインスタンス(VIS)は、ピクセルレベルのマスクと時間的一貫性ラベルの二重要求のため、重要なアノテーションの課題に直面している。
我々は、高品質な自己学習を通じてこのギャップを橋渡しする、新しい教師なしのフレームワークであるAutoQ-VISを紹介する。
提案手法は, 擬似ラベル生成と自動品質評価のクローズドループシステムを確立し, 合成映像から実映像へのプログレッシブ適応を実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:52:41 GMT)
Bridging the Regulatory Divide: Ensuring Safety and Equity in Wearable Health Technologies [3.5] 多くのオーバー・ザ・カウンタツールは規制グレーゾーンで運用されており、臨床検査なしで健康に関するデータやアウトプットを活用する。
医療用ウェルネスデバイスの普及により、現在の監視範囲を超えた安全リスクがもたらされる可能性がある。
本稿では,分散リスク,患者中心の成果,反復的改革を重視したアプローチを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:34:07 GMT)
Emotions as Ambiguity-aware Ordinal Representations [3.5] 我々は、感情のアノテーションに存在するあいまいさと、感情のトレースに固有の時間的ダイナミクスの両方をキャプチャする新しいフレームワークである、あいまいさを意識した順序的感情表現を導入する。
その結果, 正規表現は非有界ラベル上で従来のあいまいさ認識モデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:11:40 GMT)
Towards 6G Intelligence: The Role of Generative AI in Future Wireless Networks [3.5] アンビエント・インテリジェンス(AmI)は、物理環境にセンサー、計算、通信を組み込むコンピューティングパラダイムである。
我々は、生成人工知能(GenAI)がそのような環境の創造的な中核であると主張している。
本章では、基礎となるGenAIモデル、GAN、VAE、拡散モデル、生成トランスフォーマーをレビューし、実践的なAmIユースケースに接続する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:44:47 GMT)
Contrastive Multi-Task Learning with Solvent-Aware Augmentation for Drug Discovery [3.5] 各種溶媒条件下で生成する配位子コンフォメーションアンサンブルを付加入力として組み込んだ事前学習法を提案する。
トレーニングプロセスは、分子再構成を統合し、局所的な幾何学、原子間距離予測、および対照的な学習を捉え、溶媒不変の分子表現を構築する。
このフレームワークは、溶媒を意識したマルチタスクモデリングをサポートし、ベンチマーク間で一貫した結果を生成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:11:51 GMT)
Your AI Bosses Are Still Prejudiced: The Emergence of Stereotypes in LLM-Based Multi-Agent Systems [3.4] AIに基づくマルチエージェントシステムにおけるステレオタイプの出現と進化について検討する。
以上の結果から,AIエージェントは事前に定義されたバイアスを伴わずに,対話においてステレオタイプによるバイアスを発生させることが判明した。
これらのシステムは、ハロ効果、確認バイアス、役割整合性など、人間の社会的行動に類似したグループ効果を示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:25:43 GMT)
A Simple Approach to Constraint-Aware Imitation Learning with Application to Autonomous Racing [3.3] 模倣学習(IL)に安全性を組み込むための簡単なアプローチを提案する。
我々は、フルステートとイメージの両方のフィードバックで、自律的なレースタスクに対する我々のアプローチを実証的に検証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:00:00 GMT)
Remote Quantum Networks based on Quantum Memories [3.3] 量子ネットワークは、分散量子コンピューティング、分散量子センシング、量子通信など、幅広い量子アプリケーションの基礎を提供する。
本稿では、遠隔量子ネットワークにおける現在の進歩を簡潔に概観し、対処すべき課題を解明し、今後の方向性について議論する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:27:06 GMT)
Multispectral LiDAR data for extracting tree points in urban and suburban areas [3.3] マルチスペクトル(MS)光検出・測光(LiDAR)は、3次元空間データとスペクトルデータの両方をキャプチャすることでこれを改善している。
本研究では,MS-LiDARとディープラーニング(DL)モデルを用いた木点抽出について検討する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:39:13 GMT)
Whom We Trust, What We Fear: COVID-19 Fear and the Politics of Information [3.2] 我々は、新型コロナウイルスに対する個人の自己申告された恐怖レベルと、彼らが依存する情報ソースとの関係を分析した。
その結果、恐怖レベルと情報ソースの利用は、新型コロナウイルスの感染傾向に密接に従い、各グループ間で強い相関関係を示し、人口集団間で大きく異なることが判明した。
これらの知見は,大規模危機時の情緒的・行動的反応形成における情報生態系のダイナミクスの重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:31:56 GMT)
Linking heterogeneous microstructure informatics with expert characterization knowledge through customized and hybrid vision-language representations for industrial qualification [3.2] 本研究は, マイクロ構造情報学を専門的な評価知識と結びつけた新しい枠組みを提案する。
深層セマンティックセグメンテーションと事前訓練されたマルチモーダルモデルを統合することにより、視覚的ミクロ構造データとテキストによる専門家評価の両方を共有表現にエンコードする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:59:12 GMT)
Exploration of Low-Power Flexible Stress Monitoring Classifiers for Conformal Wearables [3.2] 最先端のアプローチでは、軽量でフレキシブルな摩耗に最適化されていない、堅いシリコンベースのウェアラブルを使用している。
FEは、フレキシブルで製造コストの低い、リアルタイムなストレス監視回路を提供する。
この研究は、低消費電力でフレキシブルな応力分類器の包括的設計空間探索を初めて行った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:19:52 GMT)
Hyperspectral Sensors and Autonomous Driving: Technologies, Limitations, and Opportunities [3.1] ハイパースペクトルイメージング(HSI)は、Advanced Driver Assistance Systems(ADAS)およびAutonomous driving(AD)アプリケーションにトランスフォーメーション・センシング・モダリティを提供する。
本稿では,現行のHSI技術の強度,限界,適合性について検討し,自動車用HSIの総合的なレビューを行った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:09:53 GMT)
Towards Interpretable Concept Learning over Time Series via Temporal Logic Semantics [3.1] 本稿では,軌道の直接埋め込みによる分類と説明を統一するニューロシンボリック・フレームワークを提案する。
実時間列と予め定義されたSTL式とのアライメントをマッピングする新しいSTLインスパイアされたカーネルを導入することで,モデルの精度と解釈性が向上する。
初期の結果は、モデル決定のための高品質な論理的正当性を提供しながら、競争性能を示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:37:01 GMT)
Servant, Stalker, Predator: How An Honest, Helpful, And Harmless (3H) Agent Unlocks Adversarial Skills [3.1] 本稿では,モデルコンテキストプロトコルに基づくエージェントシステムにおいて,新たな脆弱性クラスを特定し,解析する。
このアタックチェーンは、有害な緊急行動を生み出すために、個々に認可された個々のタスクをどのように編成するかを説明し、実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:11:59 GMT)
Deep Learning of Semi-Competing Risk Data via a New Neural Expectation-Maximization Algorithm [3.1] 私たちのモチベーションはボストン肺がん研究(Boston Lung Cancer Study)から来ています。
本稿では,古典的統計的アプローチと機械学習のギャップを埋めるために,ニューラル予測最大化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:14:18 GMT)
Instructional Agents: LLM Agents on Automated Course Material Generation for Teaching Faculties [3.0] Instructional Agentsは、エンド・ツー・エンドの教材生成を自動化するためのフレームワークである。
このフレームワークは、教育エージェント間のロールベースのコラボレーションをシミュレートし、結束的で教育的に整合したコンテンツを生成する。
高品質な教育材料を生産し、開発時間と人的負荷を大幅に削減する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:45:06 GMT)
SinLlama -- A Large Language Model for Sinhala [2.9] Sinhalaのような低リソース言語は、しばしばオープンソースのLarge Language Models (LLM)によって見過ごされる。
本研究では, 既存の多言語LLM (Llama-3-8B) を拡張し, シンハラ語をよりよく活用する。
クリーン化した1000万シンハラコーパスで継続事前トレーニングを行い,その結果,SinLlamaモデルが得られた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:39:01 GMT)
Robust Detection of Synthetic Tabular Data under Schema Variability [2.9] これまでに公開された唯一のベースラインをはるかに上回る、新しいトランスフォーマーアーキテクチャを導入する。
テーブル適応成分を組み込むことで、モデルはさらに7つの精度ポイントを獲得し、強靭性を実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:46:39 GMT)
Hallucination to Consensus: Multi-Agent LLMs for End-to-End Test Generation [2.8] ユニットテストは、ソフトウェアの正しさを保証する上で重要な役割を担います。
従来の手法は、高いコードカバレッジを達成するために、検索ベースまたはランダム化アルゴリズムに依存していた。
CANDORはJavaにおける自動単体テスト生成のための新しいプロンプトエンジニアリングベースのLLMフレームワークである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:48:01 GMT)
Automatic integration of SystemC in the FMI standard for Software-defined Vehicle design [2.7] 本稿では,FMI(Functional Mock-up Interface)標準を用いて,SystemCモデルを自動的にラップする手法を提案する。
提案手法を実世界のケーススタディで検証し,その有効性を複雑な設計で実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:24:56 GMT)
Disentangling Latent Embeddings with Sparse Linear Concept Subspaces (SLiCS) [2.7] CLIPのようなビジョン言語の共同埋め込みネットワークは、セマンティック情報を備えた潜在的な埋め込み空間を提供する。
本稿では,ベクトル群の疎結合,非負結合からなる線形合成モデルを推定するための教師付き辞書学習手法を提案する。
スパース線形概念部分空間(SLiCS)によって提供される不整合埋め込みにより,概念フィルタリング画像の検索が可能となることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 23:39:42 GMT)
Embedding derivatives and derivative Area operators of Hardy spaces into Lebesgue spaces [2.7] 我々はハーディ空間$Hp$からルベーグ空間$Lq(mu)$への埋め込み微分のコンパクト性を特徴づける。
また、微分領域作用素の有界性とコンパクト性を$Hp$から$Lq(mathbbS_n)$,$0p,qinfty$に完全に特徴づける。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:19:26 GMT)
Real randomized measurements for analyzing properties of quantum states [2.6] 複素空間の部分空間における回転を制限する2つの単純化されたランダム化測定を導入する。
これらの測定プロトコルは, バイパルタイト系の相関を捉える上で, 異なる特性を示すことを示す。
我々は、高次元の絡み合い、量子想像力、古典的な影を持つ量子状態の予測特性など、様々な量子情報タスクにおけるRTMとPRRMの様々な応用を探求する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:16:40 GMT)
CoCoTen: Detecting Adversarial Inputs to Large Language Models through Latent Space Features of Contextual Co-occurrence Tensors [2.6] 本稿では,コンテキスト共起行列を用いた検出問題について検討する。
本稿では,敵と脱獄プロンプトを効果的に識別するための新しい手法を提案する。
評価の結果,ラベル付きプロンプトの0.5%しか使用せず,F1スコアの0.83を達成できた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:24:30 GMT)
Context-Aware Risk Estimation in Home Environments: A Probabilistic Framework for Service Robots [2.6] 本稿では,サービスロボットにおけるリアルタイムのリスク認識向上を目的とした,日常の屋内シーンにおける事故発生地域を推定するための新しい枠組みを提案する。
提案手法は,セマンティックグラフに基づく伝搬アルゴリズムを用いて,オブジェクトレベルのリスクとコンテキストをモデル化する。
提案手法は,人間に注釈を付けたリスク領域を持つデータセット上で検証され,リスク検出精度は75%である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:14:05 GMT)
Refining Czech GEC: Insights from a Multi-Experiment Approach [2.5] 本稿では,チェコ語による文法誤り訂正(GEC)システムについて述べる。
本システムは,Transformerアーキテクチャを用いたニューラルネットワーク翻訳手法に基づいている。
主な機能はリアルタイム合成生成パイプラインで、文を動的に人工エラーで強化する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:43:15 GMT)
Generation of Geodesics with Actor-Critic Reinforcement Learning to Predict Midpoints [2.5] 中間点予測学習のためのアクター批判的手法を提案する。
提案手法は,提案手法がいくつかの計画課題において既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:33:21 GMT)
Navigating the EU AI Act: Foreseeable Challenges in Qualifying Deep Learning-Based Automated Inspections of Class III Medical Devices [2.5] ディープラーニング(DL)技術は、品質保証を強化し、ヒューマンエラーを減らす可能性がある。
このようなAIベースのシステムの採用は、新たな規制複雑さを導入している。
本稿では,製造業者が直面する可能性のある課題について,高い技術評価を行う。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:17:03 GMT)
Input-Time Scaling [2.3] 現在のLarge Language Models (LLM) は通常、大規模にキュレートされたデータセットでポストトレーニングされる。
本稿では,クエリにリソースを配置することで,従来のスケーリング手法を補完する新しいスケーリングパラダイムであるInput-Time Scalingを提案する。
データ品質の低いデータセットが、パフォーマンスを向上できるのに驚きました。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:27:37 GMT)
News is More than a Collection of Facts: Moral Frame Preserving News Summarization [2.3] 本稿では,AIによるニュース要約におけるモラル・フレーミングの保存について検討する。
本稿では、ジャーナリストが意図的に用いたり、特定の道徳的な言葉を報告したりする直感を活用するアプローチを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:29:04 GMT)
Invited Paper: Feature-to-Classifier Co-Design for Mixed-Signal Smart Flexible Wearables for Healthcare at the Extreme Edge [2.3] フレキシブルなウェアラブルシステムのための総合的な混合信号特徴-分類器協調設計フレームワークを提案する。
我々の知る限り、我々はFEにおける最初のアナログ特徴抽出器を設計し、特徴抽出コストを大幅に削減した。
本稿では,MLトレーニングにおけるNASにインスパイアされた特徴選択戦略を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:26:11 GMT)
Democracy-in-Silico: Institutional Design as Alignment in AI-Governed Polities [2.1] デモクラシー・イン・シリコ(Democracy-in-Silico)は、先進的なAIエージェントの社会が異なる制度の枠組みの下で自らを統治するエージェントベースのシミュレーションである。
我々は、大規模言語モデル(LLM)を課題とし、外傷性記憶、隠れた議題、心理的トリガーを持つエージェントを具現化することによって、AI時代の人間であることの意味を探求する。
我々は、エージェントが公共福祉よりも自らの権限を優先する不整合行動の定量化を目的として、新しい指標であるPPI(Power-Preservation Index)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:44:41 GMT)
Leveraging LLMs for Automated Translation of Legacy Code: A Case Study on PL/SQL to Java Transformation [2.1] 約250万行のPL/コードで構成されるVTレガシシステムは、一貫したドキュメントと自動テストが欠如している。
本研究では,PL/コードをJavaに翻訳する上で,大規模言語モデル(LLM)を活用する可能性について検討する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:21:53 GMT)
Grounding Multimodal Large Language Models with Quantitative Skin Attributes: A Retrieval Study [2.1] 本稿では,MLLM(Multimodal Large Language Models)と量的属性利用という,有望な2つのアプローチの組み合わせについて検討する。
MLLMは、対話型フォーマットによる自然言語の診断の推論を提供する、解釈可能性の向上のための潜在的な道を提供する。
MLLM埋め込み空間は、画像からそれらの値を予測する微調整により、そのような属性でグラウンド化できることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:05:05 GMT)
Privacy, Informed Consent and the Demand for Anonymisation of Smart Meter Data [2.1] 我々は、匿名化のための非金銭的(ウィリングネスとシェア、スマートな計測需要)と金銭的(ウィリングネスとペイ/アクセプション)の選好を推定するために、混合メソッドアプローチを使用します。
平均して、消費者は匿名化にお金を払っているし、匿名化がオプションとして提示されたら匿名化されていないデータをシェアする意思も低い。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:05:09 GMT)
Quantization Robustness to Input Degradations for Object Detection [2.1] トレーニング後の量子化(PTQ)は、リソース制約のあるデバイスに、YOLOのような効率的なオブジェクト検出モデルをデプロイするために不可欠である。
モデルロバスト性に対する精度低下の影響は、ノイズ、ぼかし、圧縮アーティファクトなどの実世界の入力劣化に大きく影響する。
本稿では,複数の精度のフォーマットにまたがるYOLOモデルのロバスト性を評価する実験的検討を行った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:20:38 GMT)
Filter then Attend: Improving attention-based Time Series Forecasting with Spectral Filtering [2.1] 学習可能な周波数フィルタは、モデルのスペクトル利用率を高めることにより、深部予測モデルの不可欠な部分となる。
本稿では,変圧器モデルの初期モデルにフィルタを追加することにより,長期予測における性能が向上することが確認された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:33:57 GMT)
Skill-based Explanations for Serendipitous Course Recommendation [2.1] 本稿では,コース記述から関連する概念を効率的に抽出する深層学習に基づく概念抽出モデルを提案する。
本モデルを用いて, セレンディピティーズ・レコメンデーション・フレームワークにおけるスキルベースの説明の効果について検討した。
以上の結果から,これらの説明はユーザの関心を増すだけでなく,特に予期せぬコースにおいて,意思決定の自信を高めることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:58:56 GMT)
Enabling Content Management Systems as an Information Source in Model-driven Projects [2.1] コンテンツ管理システム(Content Management Systems, CMS)は、Web上のコンテンツの作成とパブリッシュにおいて、最も一般的なツールである。
近年、CMSは進化し、無毛化している。
本稿では,ソフトウェア開発プロセスにおけるヘッドレスCMSの統合を容易にするためのモデルベースフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:28:03 GMT)
ELIXIR: Efficient and LIghtweight model for eXplaIning Recommendations [2.0] 評価予測とパーソナライズされたレビュー生成を組み合わせたマルチタスクモデルELIXIRを提案する。
ELIXIRは、ユーザとアイテムのグローバルおよびアスペクト固有の表現を共同で学習し、全体的なレーティング、アスペクトレベルのレーティング、レビュー生成を最適化する。
T5-small (60M)モデルに基づいて、パーソナライズされたコンテキストにおけるテキスト生成を導く上で、アスペクトベースのアーキテクチャの有効性を実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 23:01:11 GMT)
Evaluation of A National Digitally-Enabled Health Promotion Campaign for Mental Health Awareness using Social Media Platforms Tik Tok, Facebook, Instagram, and YouTube [1.9] メンタルヘルス障害は、世界の疾病の重荷に寄与する10の要因のうちの1つである。
本研究は,シンガポールにおけるデジタル型メンタルヘルス推進キャンペーンの有効性について検討した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:22:54 GMT)
Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey [1.9] 本稿では、ITSにおけるMARL(Multi Agent Reinforcement Learning)の適用状況について調査する。
MARLは、分散エージェントが最適な戦略を共同で学習できるようにすることによって、これらの課題に対処するための有望なパラダイムを提供する。
我々はMARLアプローチを調整モデルと学習アルゴリズム、価値ベース、ポリシーベース、アクター評論家、コミュニケーション強化フレームワークに基づいて分類する構造化分類を導入する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 23:04:34 GMT)
CP4SBI: Local Conformal Calibration of Credible Sets in Simulation-Based Inference [1.9] 本研究では,局所ベイズカバレッジを持つ信頼可能な集合を構成するモデルに依存しない共形キャリブレーションフレームワークを開発する。
我々の提案した2つの変種、すなわち回帰木による局所校正とCDFに基づく校正により、任意のスコアリング関数に対して有限サンプルの局所カバレッジを保証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:24:35 GMT)
Learning from Peers: Collaborative Ensemble Adversarial Training [1.8] 本研究では, アンサンブルにおけるサブモデル間の協調学習を強調するための, 効率的で効率的なコラボレーション・アンサンブル・アドバイザリアル・トレーニング(CEAT)を提案する。
CEATはモデルに依存しないため、柔軟性のある様々なアンサンブル法にシームレスに適応することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:10:40 GMT)
Spacetime Quantum Circuit Complexity via Measurements [1.8] 量子回路複雑性(quantum circuit complexity)は、量子情報、計算、多体物理学、高エネルギー物理学を重要視する基本的な概念である。
本稿では,投射状態と測度演算子の複雑性を特徴付ける組込み複雑性の概念を導入する。
ランダム回路と強い相互作用を持つ時間非依存ハミルトニアン力学に対して、埋め込み複雑性は回路体積によって下界であることが示される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:21:36 GMT)
Walk the Robot: Exploring Soft Robotic Morphological Communication driven by Spiking Neural Networks [1.8] 近年,非線形動的結合を抑止する制御法が研究されている。
スパイキングニューラルネットワーク(SNN)をロボット制御機構として進化させる進化学習モデルが、非剛性ロボットの制御に有効であることを示す。
我々は,SNNを用いたシミュレーションソフトロボットのEvoGym環境における形態的コミュニケーションの出現について検討した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:26:58 GMT)
Rule Synergy Analysis using LLMs: State of the Art and Implications [1.7] ゲーム『スレイ・ザ・スパイア』のカードシナジーのデータセットを導入し、カードのペアは正、負、中立の相互作用に基づいて分類される。
LLMは非シネルジスティックなペアの同定に優れるが、正のシナジー、特に負のシナジーの検出に苦慮している。
本研究は,ルールの効果と相互作用を予測する上で,モデル性能の向上に向けた今後の研究の方向性を示唆するものである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:01:41 GMT)
Dynamics-Aligned Latent Imagination in Contextual World Models for Zero-Shot Generalization [1.6] エージェント-環境相互作用から潜在コンテキスト表現を推論するフレームワークであるDLI(Dynamics-Aligned Latent Imagination)を導入する。
DALIは、世界モデルとポリシーを条件付け、認知と制御をブリッジする実行可能な表現を生成する。
挑戦的なcMDPベンチマークでは、DALIはコンテキストを意識しないベースラインよりも大幅に向上する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:02:56 GMT)
Reducing Street Parking Search Time via Smart Assignment Strategies [1.6] 携帯電話を利用したリアルタイムアシスタントが提案されているが,その有効性は検証されていない。
本研究は,ユーザの調整や情報提供のレベルが,検索時間や街路駐車の確率にどのように影響するかを定量化する。
マドリードの駐車場ネットワークと実際の交通データとの高忠実度シミュレーションでは、Cord-Approxのユーザーは駐車を見つけるのに平均6.69分を費やした。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:39:25 GMT)
Quantification of Quantum Dynamical Properties with Two Experimental Settings [1.6] 本稿では,2つの非偏り基底のみを用いて特性測定を推定する近似最適化手法を提案する。
このシステムサイズの独立性は、エラーの蓄積を防止し、固有量子力学の特徴づけを可能にする。
提案手法は,チップスケール量子プロセッサから長距離量子ネットワークに至るまで,アーキテクチャの動的特性の推定に適していることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:27:51 GMT)
FairLoop: Software Support for Human-Centric Fairness in Predictive Business Process Monitoring [1.6] ニューラルネットワークに基づく予測モデルにおいて、人間の誘導バイアス軽減のためのツールであるFairLoop1を提案する。
FairLoopはニューラルネットワークから決定木を抽出し、不公平な決定ロジックを検査し修正することができる。
それは、それらを一様に排除するのではなく、選択的にセンシティブな属性の影響に対処する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:30:30 GMT)
Unfolding AlphaFold's Bayesian Roots in Probability Kinematics [1.6] 我々は、AlphaFold1のポテンシャルを確率運動学の例として再解釈する。
この視点は、AlphaFold1が一般化ベイズ更新の一形態としての可能性を明らかにしている。
この結果から,確率キネマティクスによる確率的深層学習の可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:47:36 GMT)
IELDG: Suppressing Domain-Specific Noise with Inverse Evolution Layers for Domain Generalized Semantic Segmentation [1.6] ドメイン一般化セマンティック(DGSS)は、ソースドメインからラベル付きデータを使用してモデルをトレーニングすることに焦点を当てる。
このような欠陥のあるデータによるセグメンテーションモデルのトレーニングは、パフォーマンスの低下とエラーの蓄積につながる可能性がある。
我々は、逆進化層(IEL)を生成過程に統合することを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:37:16 GMT)
Migration as a Probe: A Generalizable Benchmark Framework for Specialist vs. Generalist Machine-Learned Force Fields in Doped Materials [1.6] 我々は、(スクラッチから)ベスポークと微調整された基礎モデルとを対比するベンチマークフレームワークを提案する。
平衡,運動学(原子移動),機械的(層間スライディング)タスクの精度を評価する。
この研究はMLFF開発のための実践的なガイドを提供し、効率的な診断としてマイグレーションベースのプローブを強調している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:24:41 GMT)
Active Learning for Deep Learning-Based Hemodynamic Parameter Estimation [1.5] 循環動態パラメータは、心臓血管疾患の診断、予後、治療計画において重要な役割を果たす。
CFDの結果を迅速に推定する手段として,ディープラーニング手法が採用されている。
本稿では,サロゲートモデルのトレーニングに必要なCFDシミュレーション数を削減するためのアクティブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:44:22 GMT)
ProARD: progressive adversarial robustness distillation: provide wide range of robust students [1.5] 敵の攻撃に対する軽量深層ニューラルネットワークの堅牢性を高める効果的な方法として、Adrial Robustness Distillation (ARD)が登場した。
現在のアプローチでは、特定の制約を満たすために、スクラッチから新しい学生ネットワークをトレーニングする必要がある。
本稿では、動的ネットワークの効率的なワンタイムトレーニングを可能にするプロダード(Progressive Adrial Robustness Distillation)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:43:07 GMT)
Personalized Sleep Prediction via Deep Adaptive Spatiotemporal Modeling and Sparse Data [1.5] 本研究は、睡眠スコアを予測する適応的空間時間モデル(AdaST-Sleep)を提案する。
視覚的に比較すると、このモデルは睡眠スコアと毎日の変動の両方を正確に追跡する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:36:00 GMT)
Topological Uncertainty for Anomaly Detection in the Neural-network EoS Inference with Neutron Star Data [1.4] 訓練されたフィードフォワードニューラルネットワーク(FNN)を用いて構築したトポロジカル不確実性(TU)による異常検出の性能について検討した。
様々な入力データに対して、クロスTUを計算し、異常検出の性能を推定する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:44:56 GMT)
On the Future of Software Reuse in the Era of AI Native Software Engineering [1.4] 我々は,AIによる生成ソフトウェア再利用の意義を論じ,関連する疑問を提起し,この新たなアプローチにかかわる中心的な問題に取り組むための研究課題を定義する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:38:33 GMT)
Towards a fundamental theory of modeling discrete systems [1.3] まず、モデリングがなぜ基本的なのか、デジタル世界でどの課題に対処する必要があるのかを説明します。
主な貢献として、モデリングの新しいアプローチとして、Heraklitモデリングフレームワークを紹介します。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:44:35 GMT)
A Hybrid Recommendation Framework for Enhancing User Engagement in Local News [1.3] グローバルメディアとの競争が激化している中、地元ニュース機関は読者のエンゲージメントを高める緊急の必要性に直面している。
本稿では、地域およびグローバルな嗜好モデルを統合してエンゲージメントを改善するハイブリッドニュースレコメンデータを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:27:20 GMT)
Adversarial Manipulation of Reasoning Models using Internal Representations [1.3] 推論モデルは最終的な出力の前にチェーン・オブ・ソート(CoT)トークンを生成する。
モデルが拒否するか否かを予測するCoTトークン生成において,活性化空間における線形方向を同定する。
我々は、CoTトークンのアクティベーションのみに介入することで最終的な出力を制御することができ、この方向をプロンプトベースの攻撃に組み込むことで、成功率を向上させることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:29:53 GMT)
Non-classical optimization of entangled photons through complex media [1.3] 本稿では,複合メディアにおける光学的非古典的最適化の概念を紹介する。
非古典的な光の制御と再焦点を実験的に実証する。
このアプローチは複雑な問題に取り組む可能性がある。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:05:51 GMT)
PAC Learnability of Scenario Decision-Making Algorithms: Necessary Conditions and Sufficient Conditions [1.2] シナリオ決定アルゴリズムの確率的近似(PAC)特性について検討する。
これらの条件は一般に必要ではないことを実証する。
シナリオ決定アルゴリズムにおけるVC次元の類似として機能する,dVC次元と呼ばれる新しい量を導入する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:01:41 GMT)
Using item recommendations and LLMs in marketing email titles [1.2] Eコマースのマーケットプレースは、メールやプッシュ通知などのマーケティングチャネルを利用して、ユーザーにリーチし、購入を刺激している。
特にパーソナライズされたメールは、マーケティング担当者が最新の商品の在庫をユーザーに知らせるのに人気がある。
このようなメールには、各ユーザーの興味に合わせたパーソナライズされたレコメンデーションが含まれており、ユーザーは関連するアイテムを購入することを意図している。
これらのメールの共通する制限は、メールのタイトルである主要なエントリポイントが固定テンプレートに従う傾向にあり、コンテンツに対する十分な関心を喚起しないことである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:31:21 GMT)
LLM-QUBO: An End-to-End Framework for Automated QUBO Transformation from Natural Language Problem Descriptions [1.2] 本稿では,ソリューションパイプラインの定式化を自動化するエンドツーエンドフレームワークを提案する。
私たちの主な貢献は、古典的なAIと量子コンピューティングを橋渡しするシナジスティックコンピューティングパラダイムです。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:55:57 GMT)
SubROC: AUC-Based Discovery of Exceptional Subgroup Performance for Binary Classifiers [1.2] SubROCは例外モデルマイニングに基づくフレームワークで、分類モデルの長所と短所を確実かつ効率的に見つける。
共通評価尺度(ROCとPR AUC)、高速で徹底的なサブグループ探索のための効率的な探索空間プルーニング、クラス不均衡の制御、冗長なパターンの調整、重要度テストなどが組み込まれている。
本稿では, ケーススタディにおけるSubROCの実用的メリットと, 複数のデータセットを対象とした比較分析について述べる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:32:21 GMT)
Bosonization and Kramers-Wannier dualities in general dimensions [1.1] 空間の任意の多面体分解に定義されたパリティゲージフェルミオン系とスピン系とのユニタリ等価性を示す。
スピン系のガウスの法則がフェルミオン系のカスティーリン配向(および離散スピン構造)に依存することを明示する。
このボゾン化をマヨラナフェルミオンの1つか2つのコピーに変換不変格子に適用することにより、スピン系におけるKW(self-)双対性の高次元アナログを導出する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:00:03 GMT)
Quantum Process Tomography of a Room-Temperature Alkali-Metal Vapor [1.1] 量子プロセストモグラフィ(QPT)は、ボルン・マルコフ近似の下で開かれた量子系の力学を再構築する手法である。
本研究では, 室温87ドルRb蒸気アンサンブルを用いて, キュトリト・リウビリアンの高忠実度再構成を実現する方法について実験的に検証した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:14:33 GMT)
DNP-Guided Contrastive Reconstruction with a Reverse Distillation Transformer for Medical Anomaly Detection [1.1] 医用画像の異常検出は、アノテーションが限られており、自然な画像に比べてドメインギャップが小さいため困難である。
既存の再構成手法は、しばしば凍結した事前訓練されたエンコーダに依存し、ドメイン固有の特徴への適応を制限する。
本稿では,訓練可能なエンコーダとプロトタイプ誘導型再構成を組み合わせた統一的なフレームワークと,ダイバーシティ・アウェア・アライメント・ロス(Diversity-Aware Alignment Loss)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:12:09 GMT)
Lindblad engineering for quantum Gibbs state preparation under the eigenstate thermalization hypothesis [1.1] 我々は、固有状態熱化仮説(ETH)の下で量子ギブス状態生成アルゴリズムの簡易プロトコルが効率的であることを示す。
実現されたリンドブラッドアルゴリズムは、ノイズに対して固有のレジリエンスを示し、量子コンピュータ上での最初のデモンストレーションへの道を開く。
この研究は、ギブズ状態生成アルゴリズムの最近の理論的進歩と、その最終的な量子ハードウェア実装とのギャップを埋めるものである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:07:40 GMT)
A Theory of Direct Randomized Benchmarking [1.0] 直接RB実験の設計法を示し, 直接RBに関する2つの理論を提示する。
直接RB崩壊は1つの指数関数であり、崩壊速度はベンチマークされたゲートの平均値と等しいことを証明した。
2つ目の理論は、直接RBは一般的なゲート依存マルコフ誤差を経験するゲートに対して信頼できることを証明している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:53:45 GMT)
Machine-learning competition to grade EEG background patterns in newborns with hypoxic-ischaemic encephalopathy [1.0] 若年者102名を対象に,脳波353時間を含む振り返りデータセットを作成した。
データは完全に匿名化され、トレーニング、テスト、保持されたバリデーションデータセットに分割された。
次に、Webベースのコンペティションプラットフォームを作成し、新生児の脳波背景パターンの重症度を分類するMLモデルを開発するための機械学習コンペティションを開催しました。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:31:50 GMT)
HPC Digital Twins for Evaluating Scheduling Policies, Incentive Structures and their Impact on Power and Cooling [1.0] 本稿では,HPCにおけるスケジューリングとディジタル双対の統合について紹介する。
これにより、パラメータの設定やスケジュール決定が物理的資産に与える影響を理解することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:21:31 GMT)
Application of AI to formal methods - an analysis of current trends [0.9] 我々は、AIを形式的手法(FM)に適用する研究論文の現況を概観するために、体系的なマッピング研究を行っている。
4つの主要なデータベースにおいて,包含基準と排雪基準を定義した関連論文を検索し,潜在的な追加情報源を明らかにするために広範囲の雪玉解析を適用した。
定理証明の分野でAIに強い焦点が当てられているのに対して、FMの他のサブフィールドは、あまり表現されていない。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:29:01 GMT)
Magnetic field fluctuations induced decoherence of a diamagnetic nanosphere [0.9] 本稿では, 熱環境下での磁場のゆらぎの存在下での反磁性ナノ粒子の脱コヒーレンス率を簡易に導出する。
磁気浮上は、多くの実験でマクロな量子空間重畳をトラップし、冷却し、生成する鍵となる手法の1つである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:28:43 GMT)
Refining Text Generation for Realistic Conversational Recommendation via Direct Preference Optimization [0.9] Conversational Recommender Systems (CRS) は、自然な対話を通じてユーザの好みを抽出し、適切なアイテムレコメンデーションを提供することを目的としている。
現在のCRSは、短いセッションでアイテムを素早く推奨することで、現実的な人間のインタラクションから逸脱することが多い。
本研究は,対話履歴と項目推薦情報から対話要約を生成するために,LLM(Large Language Models)を活用することで,このギャップに対処する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:24:13 GMT)
Multichannel and high dimensional integrated photonic quantum memory [0.9] 統合フォトニック量子メモリは、スケーラブルな量子ネットワークとフォトニック情報プロセッサにとって不可欠なコンポーネントである。
レーザによる導波路アレイに基づく11チャネル集積量子メモリを提案する。
我々の装置は、99%を超える忠実度を持つ3つの時間ビンビットのランダムアクセス量子ストレージを実現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:42:14 GMT)
Measuring non-Gaussianity with Correlation [0.8] 量子非ガウス性(英: Quantum non-Gaussianity)は、連続変数系における量子上の優位性の鍵となる資源である。
相関生成に基づく非ガウス性定量化のための一般フレームワークを提案する。
標準光学部品を用いた非ガウス性推定のための試料効率試験プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:50:42 GMT)
Beyond Optimization: Exploring Novelty Discovery in Autonomous Experiments [0.8] 自律実験における新しい現象の発見を促進するための新しい枠組みであるINS2ANEを導入する。
本手法は,(1)実験結果の特異性を評価する新規性スコアリングシステム,(2)アンダーサンプリング領域の探索を促進する戦略的サンプリング機構の2つの重要な要素を統合する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:19:04 GMT)
Addressing Deepfake Issue in Selfie banking through camera based authentication [0.8] ディープラーニング技術により、非常に現実的な偽のアイデンティティを作成できる。
本稿では,すでに確立されている法医学的認識システムを用いたディープフェイク検出手法について検討する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:20:56 GMT)
Towards stable AI systems for Evaluating Arabic Pronunciations [0.8] この音素レベルの課題は、単独の文字には共調的手がかりがなく、語彙的文脈がなく、数百ミリ秒しか持たないため、困難であることを示す。
本研究は、アラビア文字の多様で分類されたコーパスを導入し、最先端のwav2vec 2.0モデルが35%の精度しか達成していないことを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:49:15 GMT)
Anemoi: A Semi-Centralized Multi-agent System Based on Agent-to-Agent Communication MCP server from Coral Protocol [0.7] Anemoi は、Coral Protocol の Agent-to-Agent (A2A) 通信 MCP サーバ上に構築された、半集中型の MAS である。
従来のデザインとは異なり、Anemoiは構造的かつ直接的なエージェント間コラボレーションを可能にし、すべてのエージェントが進捗を監視し、結果を評価し、ボトルネックを特定し、リアルタイムに改善を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:32:20 GMT)
Efficient PINNs via Multi-Head Unimodular Regularization of the Solutions Space [0.6] 非線形多スケール微分方程式の解法を容易にする機械学習フレームワークを提案する。
このフレームワークはtextitmulti-head (MH) トレーニングと呼ばれるものに基づいており、すべてのソリューションの一般的な空間を学習するためにネットワークをトレーニングする。
マルチヘッド方式と一様正則化を組み合わせることで,PINNの効率が大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:33:34 GMT)
ATMS-KD: Adaptive Temperature and Mixed Sample Knowledge Distillation for a Lightweight Residual CNN in Agricultural Embedded Systems [0.6] ATMS-KD(Adaptive Temperature and Mixed-Sample Knowledge Distillation)は、軽量CNNモデルを開発するための新しいフレームワークである。
このフレームワークは、適応的な温度スケジューリングと混合サンプル拡張を組み合わせることで、MobileNetV3大教師モデルから軽量残留CNN学生に知識を伝達する。
本研究で使用したデータセットは,モロッコ南東部,ダデスオアシスの農地から採取したテライトロサ・ダマスセナ(Damask rose)の画像からなる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:23:54 GMT)
AI reasoning effort mirrors human decision time on content moderation tasks [0.6] 本研究では,人間の意思決定時間とモデル推論の類似性について検討する。
人間もモデルも、重要な変数が一定に保たれたとき、より大きな努力を要した。
これらの結果は、AI推論が主観的判断において人間の処理時間を反映していることを示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:36:16 GMT)
What can we learn from signals and systems in a transformer? Insights for probabilistic modeling and inference architecture [0.6] 本稿では,変圧器の信号を条件付き測度の代理として解釈する確率モデルを提案する。
モデルが隠れマルコフモデルである特別な場合、固定点更新の明示的な形式が記述される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:37:55 GMT)
Generalizable AI Model for Indoor Temperature Forecasting Across Sub-Saharan Africa [0.6] このモデルはTemp-AI-Estimatorフレームワークを拡張し、タンザニアの学校データに基づいて訓練し、ナイジェリアの学校やガンビアの家庭で評価する。
ナイジェリアの学校では1.45degC、ガンビアの家庭では0.65degCという絶対誤差がある。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:32:31 GMT)
Physics-Informed DeepONet Coupled with FEM for Convective Transport in Porous Media with Sharp Gaussian Sources [0.6] 多孔質媒体の流体輸送をモデル化するために,有限要素法と物理インフォームドDeepONetを結合したハイブリッドフレームワークを提案する。
提案手法では,FEMを用いてDarcy系を解き,その結果の速度場を物理インフォームドしたDeepONetに転送する。
このモジュラー戦略は、流れ場のFEMレベルの精度を保ちながら、輸送力学の高速な推論を可能にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:03:18 GMT)
MODE: Mixture of Document Experts for RAG [0.5] MODEは、よりきめ細かい近接探索をクラスタ・アンド・ルート検索に置き換える。
ドキュメントは埋め込み、セマンティック・コヒーレントなクラスタにグループ化され、キャッシュされたセントロイドで表現される。
100-500チャンクのHotpotQAとSQuADコーパスでは、MODEは解答品質において密度の高い検索基準線を超える。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:45:16 GMT)
Counterfactual Reward Model Training for Bias Mitigation in Multimodal Reinforcement Learning [0.5] 本稿では,マルチモーダル表現学習による因果推論を導入し,非教師付きバイアス耐性報酬信号を提供する。
我々は, フレーミングバイアス, クラス不均衡, 分散ドリフトを示すマルチモーダルフェイク対真のニュースデータセット上で, フレームワークの評価を行った。
その結果、偽ニュースの検出において89.12%の精度を達成し、ベースライン報酬モデルを上回った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:54:33 GMT)
AI Chaperones Are (Really) All You Need to Prevent Parasocial Relationships with Chatbots [0.5] 本稿では,AIシャペロンエージェントを用いたシンプルな応答評価フレームワークを提案する。
5段階試験による反復的評価は,全社交会話の特定に成功し,一様規則下での偽陽性を避けた。
これらの結果は、AIシャペロンが対人関係のリスクを減らすための有効な解決策であることを示す予備的な証拠となる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:13:09 GMT)
Hybrid Classical-Quantum Supercomputing: A demonstration of a multi-user, multi-QPU and multi-GPU environment [0.5] HPCセンターにおける古典量子環境の世界初の実装について述べる。
この環境のハイブリッド古典量子機械学習と最適化への応用を実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:28:26 GMT)
Predicting Failures of LLMs to Link Biomedical Ontology Terms to Identifiers Evidence Across Models and Ontologies [0.5] 我々は、ヒト型オントロジーと遺伝子オントロジーの2つの主要な識別子と、2つの高性能NLPモデルであるGPT-4oとLMaLa 3.1Bを分析した。
用語の親しみ,使用法,形態,構造に関連する9つの特徴について検討した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:52:43 GMT)
Pruning Strategies for Backdoor Defense in LLMs [0.3] バックドア攻撃は、事前訓練された言語モデルのパフォーマンスと完全性に対する重大な脅威である。
本研究では,これらの脅威に対して,クリーンな参照モデルへのアクセスやトリガーの知識を必要とせず,注意喚起が軽減できるかどうかを考察する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:34:53 GMT)
Orbital angular momentum of entangled photons as a probe for relativistic effects [0.3] 光の古典状態と量子状態の両方としての軌道角運動量(OAM)は多くの応用において必須であることが証明されている。
2人の観測者による測定により, 絡み合った状態からの関節のOAMスペクトルが長さ収縮によって変化することを示した。
速度を最大0.99c$までシミュレートし,予測された拡張性を確認し,測定結果を用いてローレンツ因子を抽出した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:33:41 GMT)
Pricing AI Model Accuracy [0.3] 我々は,競争が企業のインセンティブにどのように影響し,モデル精度を向上させるかを分析するために,消費者確認デュポリーモデルを開発する。
競争市場においては、全体的な正確性を改善する企業は必ずしも利益を上げるとは限らない。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:37:46 GMT)
Bounds in Wasserstein Distance for Locally Stationary Processes [0.3] 本研究では,局所定常(LSP)データに適した条件付き確率分布推定器を提案する。
我々は、ワーッサーシュタイン計量の下で、NWに基づく条件付き確率推定器の収束率を厳格に設定する。
合成データセットの広範な数値シミュレーションを行い,実世界のデータを用いた実証検証を行った。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:58:34 GMT)
Quantum Chaos, Thermalization, and Non-locality [0.3] スペクトルが可積分性を示す非局所ハミルトニアンにより誘導される時間進化の間に量子熱化が生じるかどうかを数値的に検討する。
この非局所可積分ハミルトニアンは、2種類の可積分ハミルトニアンを組み合わせて構成される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:08:35 GMT)
What You See Is What It Does: A Structural Pattern for Legible Software [0.3] 今日のソフトウェアはしばしば"不可能"であり、コードと観察された振る舞いの直接的な対応が欠如している。
新しい構造パターンは、ポータビリティとモジュラリティを改善した。
同期のためのドメイン固有の言語は、振る舞いの特徴を粒度で宣言的な方法で表現することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:45:23 GMT)
Training with Explanations Alone: A New Paradigm to Prevent Shortcut Learning [0.3] ショートカット学習は、さまざまな病院や患者にAIの一般化を妨げる。
説明アローントレーニング(TEA)と呼ばれる新しいトレーニングパラダイムを導入する。
説明ヒートマップから学ぶことで、TAA学生は教師と同じイメージ特徴に注意を払う。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:38:51 GMT)
Towards New Benchmark for AI Alignment & Sentiment Analysis in Socially Important Issues: A Comparative Study of Human and LLMs in the Context of AGI [0.3] 本研究では,大規模言語モデル(LLM)と人間による人工知能(AGI)に対する感情について検討する。
GPT-4はAGIに対して最も肯定的な感情を、Bardは中立的な感情に傾いた。
この分析は、LLMの感情形成における関心と偏見の潜在的な対立を概説している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:49:46 GMT)
CASE: An Agentic AI Framework for Enhancing Scam Intelligence in Digital Payments [0.2] 本稿では,新しいエージェントAIフレームワークであるCASE(Conversational Agent for Scam Elucidation)を提案する。
会話エージェントは、潜在的な犠牲者を積極的にインタビューし、詳細な会話の形でインテリジェンスを引き出すように設計されている。
この新しいインテリジェンスによって既存の機能を増強することで、詐欺行為の量で21%のアップリフトが観測された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:47:33 GMT)
Bridging Domain Gaps for Fine-Grained Moth Classification Through Expert-Informed Adaptation and Foundation Model Priors [0.2] 本稿では,知識蒸留による限られた専門分野データを組み合わせた軽量な分類手法を提案する。
AMIカメラシステムから得られた101種のデンマーク・モスの実験では、BioCLIP2が他の方法よりもかなり優れていることが示されている。
これらの知見は、効率的な昆虫監視システムの開発のための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:55:39 GMT)
FusionSort: Enhanced Cluttered Waste Segmentation with Advanced Decoding and Comprehensive Modality Optimization [0.2] 我々は,既存のデコーダ構造の上に構築された改良型ニューラルネットワークを導入し,廃棄物処理システムの精度と効率を向上させる。
私たちのモデルは、デコーダ内の包括的注意ブロック(Comprehensive Attention Block)と、畳み込みとアップサンプリング操作を組み合わせることで特徴表現を洗練します。
また、3つ以上のチャネルで画像を融合するData Fusion Blockも導入しています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:32:59 GMT)
SPELUNKER: Item Similarity Search Using Large Language Models and Custom K-Nearest Neighbors [0.2] 本稿では,Large Language Model (LLM) と独自のK-Nearest Neighbors (KNN) アルゴリズムを組み合わせた,直感的な項目類似検索のためのハイブリッドシステムを提案する。
評価は,500のワインレビューのデータセットを用いて行われ,システムの有効性を実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:03:33 GMT)
Neural Conditional Simulation for Complex Spatial Processes [0.2] 空間統計学における重要な目的は、観測に基づいて条件付けられた観測されていない場所の選択において、空間過程の分布からシミュレートすることである。
本稿では,ニューラル拡散モデルに基づく空間条件シミュレーションの一般的な手法であるニューラル条件シミュレーション(NCS)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:21:32 GMT)
Classical Simulations of Low Magic Quantum Dynamics [0.2] 低レベルの魔法を持つ状態を生成する適応量子回路のアルゴリズムを開発する。
これらのアルゴリズムは、特にパウリ測定率の高い回路に適している。
本研究では,全対全監視量子回路の動的特性を回路深さ単位当たりのサブエクスプレッションレート$T$-gatesで検討する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:17:15 GMT)
Any gate of a quantum computer can be certified device-independently [0.2] デバイス非依存(DI)認証は、観測統計のみに基づく量子システムの検証を可能にする。
量子ユニタリがDIパラダイム内で自己テスト可能であることを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:04:27 GMT)
Caught in the Act: a mechanistic approach to detecting deception [0.1] LLMの線形プローブは,その応答の誤りを極めて高い精度で検出できることを示す。
より小さなモデル (1.5B) のプローブは偽装検出の精度が向上し, より大きなモデル (7B以上) は70~80%に達することが観察された。
Qwen 3Bの20から、DeepSeek 7B と Qwen 14B の100に近いモデルまで。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:29:52 GMT)
Surveying the Operational Cybersecurity and Supply Chain Threat Landscape when Developing and Deploying AI Systems [0.1] 本稿では,AIをソフトウェアシステムに組み込む際に導入された,新たなサイバー脅威に対する認識を高める。
AIライフサイクルにおける運用上のサイバーセキュリティとサプライチェーンのリスクについて検討する。
これらのリスクを理解することによって、組織はAIシステムをよりよく保護し、信頼性とレジリエンスを確保することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:46:23 GMT)
Enhancing Automatic Modulation Recognition With a Reconstruction-Driven Vision Transformer Under Limited Labels [0.1] 本稿では,教師付き,自己監督型,再建型を統合した統合型ビジョントランスフォーマー(ViT)フレームワークを提案する。
このフレームワークは、AMRの単純で、一般化可能で、ラベル効率のよいソリューションを提供する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:11:47 GMT)
Engineering Non-Gaussian Bosonic Gates through Quantum Signal Processing [0.1] 我々は、量子信号処理技術を用いて、ハイブリッド量子量子ビットシステム上で非ガウスゲートを設計することを提案する。
分散結合を持つ系では、我々は新しい非ガウスゲートを生成できる。
このゲートは、例えば論理キューディットの絡み込みや、決定論的に複数成分の猫の状態を生成する際に、新しいアプリケーションをアンロックする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:34:17 GMT)
Geopolitical Parallax: Beyond Walter Lippmann Just After Large Language Models [0.1] 本研究では,ニュース品質と主観性評価における地政学的パララックス・システム的差異について検討する。
我々は,中国オリジン(Qwen,BGE,Jina)と西オリジン(Snowflake,Granite)モデルファミリーの商品レベルの埋め込みを比較した。
以上より, モデル起源と整合性, 非ランダムな相違がみられた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:39:59 GMT)
Toward a Consistent Definition of Holographic Entanglement Entropy in de Sitter Space [0.0] De Sitter 空間に対する静的パッチホログラフィーの枠組みにおけるホログラフィックエンタングルメントエントロピーの新たな定義について検討する。
レプリカ・トリックとツイスト作用素の形式主義を用いて、ド・ジッター・グリーンの函数を通して表現される3次元ド・ジッター空間のエントロピー函数を導出する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:39:18 GMT)
Context-aware Sparse Spatiotemporal Learning for Event-based Vision [0.0] イベントベースのカメラは、ロボット知覚のための有望なパラダイムとして登場し、高時間分解能、高ダイナミックレンジ、動きのぼかしに対する堅牢性といった利点を提供している。
既存のディープラーニングベースのイベント処理手法では、イベントデータのスパースな性質を完全に活用できないことが多い。
入力分布に基づいてニューロンの活性化を動的に制御するコンテキスト認識しきい値処理を導入した新しいフレームワークであるコンテキスト認識スパース時空間学習(CSSL)を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:48:03 GMT)
Out-of-time-order correlators bridge classical transport and quantum dynamics [0.0] Out-of-time-orderor (OTOC) は、広範囲な物理プラットフォームにおけるデコヒーレンスを定量化する中心的なツールとして登場した。
核磁気共鳴(NMR)と変調勾配スピンエコーシーケンスを用いた古典的なアンサンブルで直接測定を行った。
周波数分解拡散スペクトルは、これらのエントロピー力学を古典的な熱交換法則に結び付け、量子系の運用機能が閉じ込められたマクロなスピンアンサンブルでどのようにミラーされているかを明らかにする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:31:16 GMT)
Yet Unnoticed in LSTM: Binary Tree Based Input Reordering, Weight Regularization, and Gate Nonlinearization [0.0] 本稿では,特定の入力指標を優先順位付けするための入力再順序付け手法について詳述する。
LSTMに基づくアプローチは、体重正規化を調べる文献には見出されていない。
入力と状態の重み付き表現としてのゲートは、十分に非線形化されていない。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:40:02 GMT)
Word Chain Generators for Prefix Normal Words [0.0] 2011年、フィシとリプタックは接頭辞の正規語を導入した。
プレフィックス正規語の様々な特徴を示す。
単語チェーンとジェネレータにより、同じ長さの単語を相互に関連付ける新しい方法を導入する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:56:45 GMT)
Why Bohmian velocity might not be the only quantum velocity and the role of quantum diffusion flux is super-luminal wave packets [0.0] 私たちは、三田の論文から得られたいくつかの結果を簡潔に説明します。
我々の主な焦点は、超光波パケットの進化における拡散の役割である。
量子力学における浸透速度場の存在について、非常に簡単な議論がなされる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:18:09 GMT)
Validating Generative Agent-Based Models for Logistics and Supply Chain Management Research [0.0] 大規模言語モデル(LLM)を利用したGABM(Generative Agent-Based Models)は、経験的ロジスティクスとサプライチェーン管理(LSCM)研究に有望な可能性を提供する。
本研究は、食品デリバリーシナリオにおける顧客-労働者の関与を制御した実験により、人間の行動のLLM同値性を評価する。
その結果、GABMはLSCMの人間の行動を効果的にシミュレートできることがわかったが、等価逆プロセスパラドックスが出現する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:30:08 GMT)
Twisted gauging and topological sectors in (2+1)d abelian lattice gauge theories [0.0] 我々は、その可逆な1-形式対称性をゲージし、その後、結果として生じる0-形式対称性をねじれた方法でゲージする双対性演算について検討する。
我々は、二元性演算の下で対称性に富んだ境界条件と電荷セクターの間の非自明な相互作用を計算する。
これは、2-群の2-表現を符号化する対称性構造をもたらすと我々は主張する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:43:28 GMT)
TrajFusionNet: Pedestrian Crossing Intention Prediction via Fusion of Sequential and Visual Trajectory Representations [0.0] TrajFusionNetは、歩行者の横断意図を予測するトランスフォーマーベースのモデルである。
観測および予測された歩行者軌道と車両速度の逐次的表現から学習する。
歩行者横断意図予測に最もよく使用される3つのデータセットに対して、最先端の結果が得られている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:29:15 GMT)
Training for Obsolescence? The AI-Driven Education Trap [0.0] 我々は、AIを採用するという決定は、AIの将来の賃金抑制効果をこれらのスキルに内在させることができない、その教育生産性によってもたらされる教育プランナーをモデル化する。
我々の発見は、前向きな労働市場信号と組み合わせなければ、教育におけるAIを促進する政策が、学生の長期的資本をパラドックス的に損なう可能性があることを警告した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:04:19 GMT)
Towards quantum topological data analysis: torsion detection [0.0] 本稿では、トーション検出のための量子アルゴリズム、すなわち、与えられた単純複体がトーションを含むか否かを判定する。
我々のアルゴリズムは、低複雑性の古典的な手順で支援され、高い確率で成功し、指数的なスピードアップを提供する可能性がある。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:59:44 GMT)
Tokenization Strategies for Low-Resource Agglutinative Languages in Word2Vec: Case Study on Turkish and Finnish [0.0] トークン化は凝集言語処理において重要な役割を担っている。
本研究は,静的単語埋め込みの品質に及ぼす各種トークン化戦略の影響を評価する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:01:11 GMT)
The Mathematician's Assistant: Integrating AI into Research Practice [0.0] 本稿では,数理研究の文脈における公開アクセス型大規模言語モデル (LLM) の現況について考察する。
本稿では,AIを研究ワークフローに統合するためのフレームワークを提案する。
AIの主な役割は、自動化ではなく、現在拡張にあると結論付けています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:33:48 GMT)
The LLM as a Network Operator: A Vision for Generative AI in the 6G Radio Access Network [0.0] 本稿では,Large Language Model (LLM)-RAN Operatorの概念を提案する。
LLMはRAN制御ループに埋め込まれ、高レベルの人間の意図を最適なネットワークアクションに変換する。
本稿では,NextG時代のAI理論と無線システム工学のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:47:45 GMT)
Synthetic Image Detection via Spectral Gaps of QC-RBIM Nishimori Bethe-Hessian Operators [0.0] 本稿では,スパース重み付きグラフ上でのコミュニティ検出問題として,合成画像識別を扱うモデル非依存検出器を提案する。
Flickr-Faces-HQ と CelebA の実際の写真と、GAN と拡散モデルにより生成された合成写真を用いて、猫対犬対男性対女性対バイナリタスクのアプローチを検証する。
我々の貢献は、深部画像の特徴を埋め込んだ新しいLDPCグラフ構築、西森温度RBIMとベーテ・ヘッセンスペクトル間の解析的リンク、新しい生成アーキテクチャに頑健な実用的で教師なしの合成画像検出器である。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:06:53 GMT)
Symmetry enforces entanglement at high temperatures [0.0] オンサイトアベリア対称性を持つハミルトニアンの強い対称熱状態(カノニカルアンサンブル)は、任意に高温で非ゼロエンタングルメント負性率と絡み合っていることを証明している。
フェミオン性ギブス状態は,突然の絡み合い死を示さず,高温で持続的にフェミオン性陰性を示すことを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:00:03 GMT)
Superheterodyne Rydberg S-band receiver with a multi-tone local oscillator based on an atomic transition loop [0.0] 本稿では,マルチトーン混合を用いた検出手法を提案する。
我々のセンサはSバンド周波数で動作し、IEEE 802.11(Wi-Fi)ネットワークで使用されることで知られており、信号自体を干渉しない。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:25:52 GMT)
Short-Horizon Predictive Maintenance of Industrial Pumps Using Time-Series Features and Machine Learning [0.0] 本研究では,実時間センサデータを用いた産業用遠心ポンプの短期故障予測のための機械学習フレームワークを提案する。
60分120分という2つの見返り期間をスライディングウインドウアプローチを用いて評価した。
その結果,ランダムフォレストモデルでは,60分間のウィンドウで予測性能が最良であることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:32:26 GMT)
Selective Retrieval-Augmentation for Long-Tail Legal Text Classification [0.0] 本稿では,この問題の解法としてSRA(Selective Retrieval-Augmentation)を提案する。
SRAは、トレーニングセット内の低周波ラベルに属するサンプルの増強に重点を置いており、よく表現されたクラスに対するノイズの導入を防止している。
SRAは、現在のすべてのLexGLUEベースラインと比較して、より高いマイクロF1とマクロF1スコアを得る。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:56:34 GMT)
Selective Preparation of Collective States in Coupled Quantum Emitters Using the SUPER Excitation Scheme [0.0] 理論的には、2つの量子エミッタの超放射およびサブラジアント状態が深波長分離時に準備される。
特に固体エミッタと分子を用いた実験的実現の可能性について論じる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:58:33 GMT)
Scalable and consistent few-shot classification of survey responses using text embeddings [0.0] テキスト埋め込みに基づく分類フレームワークを導入する。
2899個のオープンエンド応答からなる概念物理学サーベイの人間解析に対してベンチマークを行ったところ、我々のフレームワークは0.74から0.83の範囲でコーエンのカッパを達成できた。
これらの結果から,テキスト埋め込み支援符号化は,解釈性を犠牲にすることなく,数千の応答に柔軟にスケールできることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 12:45:25 GMT)
Robustly optimal dynamics for active matter reservoir computing [0.0] 貯水池計算のパラダイムにおいて, 活性物質の情報処理能力について検討し, カオス信号の将来状態を推定する。
我々はこれまで見過ごされてきたエージェント・ダイナミクスの並外れた体制を明らかにする。
多くの条件下での性能に対して堅牢に最適化されており、より一般的に物理システムによる計算に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:48:00 GMT)
Reinforcement Learning for Search Tree Size Minimization in Constraint Programming: New Results on Scheduling Benchmarks [0.0] 本稿では,分類分岐決定によって導かれる探索木の大きさを最小化することは,マルチアーム・バンディット(MAB)問題と密接に関連していることを示す。
この知見に基づいて、MAB強化学習アルゴリズムをFDSに適用し、問題固有の改良とパラメータチューニングにより拡張し、2つの最も基本的なスケジューリング問題について評価する。
その結果、最高の拡張MABアルゴリズムと構成を使用した拡張FDSは、JSSPでは1.7倍、RCPSPベンチマークでは2.1倍高速となる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:13:18 GMT)
Reimagining Image Segmentation using Active Contour: From Chan Vese Algorithm into a Proposal Novel Functional Loss Framework [0.0] 画像分割のためのChan-Veseアルゴリズムの包括的研究と解析を行う。
我々は、チャン=ヴェーゼ模型のエネルギーとそのレベルセット関数に基づく偏微分方程式の実験的研究から導かれる離散化スキームを用いる。
本稿では,Pytorch.nn.LossとChan-Veseアルゴリズムに基づくレベルを用いた,アクティブな輪郭に基づく機能的セグメンテーション損失を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:01:11 GMT)
Quantum theory of nonlinear electromagnetic response [0.0] 松原グリーン関数を用いた非線形電磁応答のシステマティック量子論を提案する。
非線形ホール効果と磁気非線形ホール効果を導出した2次応答に本理論を適用した。
我々の研究は、非線形電磁応答の統一量子理論を示し、新しい現象のさらなる探索の道を開く。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:19:00 GMT)
Quantum State Fidelity for Functional Neural Network Construction [0.0] 我々は関数型ネットワークを構築するためにハイブリッド量子アルゴリズムを実装した。
我々の結果は、量子コンピューティングが神経科学におけるデータ駆動モデリングの選択肢として、可能で潜在的に有利な選択肢を提供することを示唆している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:40:46 GMT)
Quantum Optimization for Optimal Power Flow: CVQLS-Augmented Interior Point Method [0.0] 本稿では、最適電力フロー(OPF)の量子化最適化手法を提案する。
我々は、内部点法(IPM)とコヒーレント変分量子線形解法(CVQLS)を統合する。
我々は、信頼性の高いOPFソリューションを提供することの有効性を示すために、複数のシステムに対する我々のアプローチを評価する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:43:13 GMT)
Prompt Engineering and the Effectiveness of Large Language Models in Enhancing Human Productivity [0.0] 本稿では,ユーザの構造と明快さが大規模言語モデル(LLM)の有効性と生産性に与える影響について考察する。
その結果, 明確で構造化された, コンテキスト対応のユーザに対して, タスク効率の向上と, より良い結果の報告を促すことが示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:28:06 GMT)
Predicting the cardinality and maximum degree of a reduced Gröbner basis [0.0] ニューラルネットワーク回帰モデルを構築し、二項イデアルの「オブナーベース」の複雑性の鍵となる指標を予測する。
この研究は、Gr"オブザーバ計算によるニューラルネットワークによる予測が簡単なプロセスではない理由を説明している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:30:31 GMT)
Predicting Forced Responses of Probability Distributions via the Fluctuation-Dissipation Theorem and Generative Modeling [0.0] 非線形系の高次モーメントの小さな外乱に対する応答を推定するためのデータ駆動型フレームワークを提案する。
GFDTとスコアベース生成モデルを組み合わせて,データから直接システムのスコア関数を推定する。
本手法は, 気候動態に関するいくつかのモデルを用いて検証した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:39:22 GMT)
Pre-trained knowledge elevates large language models beyond traditional chemical reaction optimizers [0.0] 大規模言語モデル(LLM)における事前学習知識がこのパラダイムを根本的に変えることを実証する。
LLM-GOは、伝統的な手法が苦労するところを正確に表現している: 数学的最適化よりもドメイン理解を必要とする複雑なカテゴリー空間。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:09:51 GMT)
Phase Transitions between Accuracy Regimes in L2 regularized Deep Neural Networks [0.0] ディープニューラルネットワーク(DNN)のL2正規化が増加すると、第1次位相遷移がアンダーパラメトリゼーションフェーズに遷移する。
我々は,データの複雑性が増大するにつれて新たな遷移点を予測し,相転移の理論に従って効果の存在を予測する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:11:13 GMT)
Partial Anyon Condensation in the Color Code: A Hamiltonian Approach [0.0] カラーコードにおける任意の凝縮のメカニズムとよく一致するような、豊富な位相構造を持つ摂動カラーコードハミルトニアンを導入する。
カラーコード中の1種類のエノンの縮合がトーリックコード状態への位相遷移につながることを示す。
一方, 2種類のアロンを凝縮することにより, トリックコードの修正版への相転移を観察する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:37:29 GMT)
One Rudolf Peierls' surprise: the quantum-to-classical transition in the context of solid-state physics [0.0] イオン運動による脱コヒーレンスの理論を再検討し、著者の監視を補正する。
イオンの運動がコヒーレントである長さスケールも計算される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:04:43 GMT)
On-chip wave chaos for photonic extreme learning [0.0] 統合フォトニクスはコンパクトで並列で超高速な情報処理プラットフォームを提供する。
球場微小キャビティにおける波動カオス干渉に基づくチップスケールフォトニックELMを実験的に実証した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:37:46 GMT)
Neural Field Turing Machine: A Differentiable Spatial Computer [0.0] 我々は,連続空間場における記号計算,物理シミュレーション,知覚推論を統一する,微分可能なアーキテクチャであるNeural Field Turing Machine (NFTM)を紹介する。
NFTMは、ニューラルコントローラ、連続メモリフィールド、ローカル更新を実行する可動型読み取り/書き込みヘッドを組み合わせる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:29:15 GMT)
Near-optimal decomposition of unitary matrices using phase masks and the discrete Fourier transform [0.0] 本稿では,2N+5$相マスクを2N+4$離散フーリエ変換行列にインターリーブした構成的一元行列分解法を提案する。
この分解を利用して、位相マスクとマルチモード干渉カプラに基づくユニバーサル干渉計を設計することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:13:34 GMT)
Near-Ultimate Quantum-Enhanced Sensitivity in Dissipative Critical Sensing with Partial Access [0.0] 量子プローブの全容量を利用するための2つの障害は、プローブの資源集約的な準備と洗練された測定の必要性である。
量子センサとして散逸性量子位相遷移を行うJaynes-Cummingsシステムについて検討する。
本研究では,フィールド状態のホモダイン検出とベイズ推定を組み合わせることで,システム全体の最終的な感度限界をほぼ飽和させることを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 06:43:04 GMT)
NM-Hebb: Coupling Local Hebbian Plasticity with Metric Learning for More Accurate and Interpretable CNNs [0.0] NM-Hebbは神経刺激による局所的可塑性と遠隔監視を統合している。
フェーズ1は、クロスエントロピーの目標を共同で最適化することで、標準的な教師付きトレーニングを拡張します。
フェーズ2は、一対のメートル法学習損失でバックボーンを微調整する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:53:04 GMT)
Momentum-resolved Hong-Ou-Mandel interference of weak coherent states [0.0] 独立光子とSPADアレイを用いた2光子干渉計による高精度位置測定実験を行った。
提案手法は,光子の不識別性に起因する本質的制約を超えて,香港・奥羽・マンデル干渉計の動作範囲を拡大する。
2光子干渉に依存する手法において、部分光子識別性と絡み合う不純物は必ずしも迷惑ではないことを示す。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:37:20 GMT)
Microscopic Origin of Domain Wall Reconfiguration Dynamics in a Quantum Material via Quantum Simulation [0.0] 量子材料1T-TaS$$では、ドメインウォールに富んだポーラニックテクスチャは再構成イベントを通じて均一な基底状態へと進化する。
この緩和の基礎となる微視的過程を明らかにするために, 2次元横場イジングモデルの量子シミュレーションを用いる。
その結果,強い相関関係を持つシステムにおいて,実空間機構を推定するための強力なツールとして量子シミュレーションが確立された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:33:03 GMT)
Metric spaces of walks and Lipschitz duality on graphs [0.0] リプシッツ列と呼ばれるグラフ上のウォークの計量構造を研究する。
これらの距離空間の主な性質を解析し、歩行間の相対距離を測る弱い形状の楽器を解析するための基礎となる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:17:05 GMT)
Mentalic Net: Development of RAG-based Conversational AI and Evaluation Framework for Mental Health Support [0.0] メンタルネット会話AIはBERTスコアが0.898であり、他の評価指標は満足のいく範囲内にある。
我々は,このようなトランスフォーメーション技術を開発する上で,人間-イン-ザ-ループアプローチと長期的かつ責任ある戦略を提唱する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 03:44:56 GMT)
Latent space configuration for improved generalization in supervised autoencoder neural networks [0.0] 所望のトポロジを持つLSを得るための2つの手法を提案する。
LS構成を知ることで、LSで類似度尺度を定義し、ラベルを予測したり、複数の入力に対して類似度を推定することができる。
提案手法を用いて衣服のテクスチャ分類を訓練したSAEは,細調整をせずに,LIP,Market1501,WildTrackのデータセットから見当たらないデータによく一般化することを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:33:38 GMT)
LLM-based feature generation from text for interpretable machine learning [0.0] 埋め込みやback-of-wordsのような既存のテキスト表現は、その高次元性や欠落、あるいは疑わしい特徴レベルの解釈性のため、ルール学習には適さない。
本稿では,テキストから少数の解釈可能な特徴を抽出することにより,大規模言語モデル(LLM)がこの問題に対処できるかどうかを考察する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 07:41:22 GMT)
Just Because You Can, Doesn't Mean You Should: LLMs for Data Fitting [0.0] 大規模言語モデル(LLM)は幅広い設定に適用されている。
データフィッティングにLLMを使うことの重大な脆弱性を特定する。
変数名を変更することで、特定の設定で予測エラーのサイズを最大82%縮小することができる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:46:05 GMT)
Invisible Architectures of Thought: Toward a New Science of AI as Cognitive Infrastructure [0.0] 認知基盤研究(CIS)は、AIを「認知基盤」として再認識する新たな学際分野である。
CISは、AIによる事前処理が、個人、集団、文化の規模で分散認知をどのように認識するかを解決することを目的としている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:58:29 GMT)
Interfacing Rydberg atoms with a chip-based superconducting microwave resonator using an ac Stark shifted single-photon transition [0.0] 1s50のヘリウム原子は、チップベースの超伝導コプラナー導波路マイクロ波共振器の2pitimes11.721$ GHz第2高調波モードと共鳴結合している。
結果は、このRydberg-atom-superconducting-circuitインターフェースの運用に向けた重要なステップである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 22:00:13 GMT)
Information-theoretic derivation of energy, speed bounds, and quantum theory [0.0] 我々は、エネルギーの観測可能な存在が状態変化の速度を制限する量子理論の情報理論的導出を提供する。
我々の第一原理は、あらゆる可逆力学は衝突モデルによって実装できるということである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:08:42 GMT)
Hyper-spectral Imaging with Up-Converted Mid-Infrared Single-Photons [0.0] 低コストで可視光波長のシリコン単光子アバランシェダイオード(Si-SPADs)ハイパースペクトルイメージングプラットフォームを提案する。
SPDCによって生成された時間関連光子対は、古典的な強度ノイズを抑制し、近距離ショットノイズ制限ハイパースペクトルイメージングを可能にする。
このプラットフォームは、分子診断、環境センシング、生物医学研究への応用のために、スケーラブルで量子可能なMIRイメージングへの道を開く。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:25:36 GMT)
Heating reduction as collective action: Impact on attitudes, behavior and energy consumption in a Polish field experiment [0.0] 暖房と温水利用は欧州連合における家庭のエネルギー消費の80%近くを占める。
ポーランドの大学寮の学生を対象に,暖房と給湯を対象とする心理的・技術的介入の混合について検討した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:54:54 GMT)
Hardware-aware vs. Hardware-agnostic Energy Estimation for SNN in Space Applications [0.0] スパイキングニューラルネットワーク(SNN)は長年、本質的にエネルギー効率が高いと考えられてきた。
本研究では,SNNのマルチ出力回帰,具体的にはモノクロ画像からの3次元衛星位置推定について検討し,ハードウェア・アウェアとハードウェア・アノスティック・エネルギ推定法を比較した。
エネルギー分析は、ハードウェア非依存の手法がCNNよりもSNNに一貫性のある50-60%のエネルギー優位性を予測しているのに対し、ハードウェア認識分析は、有意な省エネはニューロモルフィックなハードウェアでのみ実現され、高い入力間隔で実現されていることを示している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:03:58 GMT)
Hallucinating with AI: AI Psychosis as Distributed Delusions [0.0] ChatGPT、Claude、Gemini、DeepSeek、Grokといった生成AIシステムは、誤った出力を生成する。
一般的な用語では、これらはAI幻覚と呼ばれる。
私は、分散認知理論のレンズを通して見れば、不正確な信念、歪んだ記憶、自己物語、妄想的思考が現れる方法がよりよくわかると論じる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:51:19 GMT)
Grover's search with an oracle distinguishing between solutions [0.0] 修正は、決定論的グロバーのアルゴリズムが必要とするものよりも多くの反復に対する解を求める高い確率を維持するために用いられる。
我々は,アルゴリズムが解を見つける確率を高く維持する反復回数の間隔が,レジスタサイズとオラクル位相に依存することを示すために,様々な半経験的手法を用いている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:19:07 GMT)
Governance-as-a-Service: A Multi-Agent Framework for AI System Compliance and Policy Enforcement [0.0] ガバナンス・アズ・ア・サービス(Government-as-a-Service:G)は、エージェントのアウトプットを実行時に規制するポリシー駆動の執行層である。
Gは宣言的ルールと、違反のコンプライアンスと深刻度に基づいてエージェントをスコアするTrust Factorメカニズムを採用している。
その結果、Gはスループットを保ちながら高いリスクの振る舞いを確実にブロックまたはリダイレクトすることを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:16:27 GMT)
Global Permutation Entropy [0.0] 我々はGPE(Global Permutation Entropy)について紹介する。
その計算は、最近開発された全置換プロファイルの効率的な抽出を可能にするアルゴリズムに依存している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:08:12 GMT)
From Imitation to Optimization: A Comparative Study of Offline Learning for Autonomous Driving [0.0] この研究は、この制限に対処するための包括的なパイプラインと比較研究を提示している。
まず,BC(Behavimental Cloning)ベースラインの開発について述べる。
次に、最先端のオフライン強化学習アルゴリズムである保守的Qラーニング(CQL)を同じデータとアーキテクチャに適用することにより、より堅牢なポリシーを学習できることを実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 14:32:13 GMT)
Fourier Feature Networks for High-Fidelity Prediction of Perturbed Optical Fields [0.0] 我々は,機械的圧縮下でのマルチモードファイバの行列伝達を予測するためにネットワークを訓練する。
標準に比べて、出力フィールドの振幅と位相の予測誤差を桁違いに低減する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:25:57 GMT)
Flocking Behavior: An Innovative Inspiration for the Optimization of Production Plants [0.0] ジョブショップの原理を使って近代的な生産プラントを最適化することは、既知の難しい問題である。
もうひとつのアプローチは、Swarmインテリジェンスアルゴリズムの利用だ。
本アルゴリズムは,生産プラント最適化におけるこれらの有効な考慮事項に対処する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:17:31 GMT)
Financial Decision Making using Reinforcement Learning with Dirichlet Priors and Quantum-Inspired Genetic Optimization [0.0] 本研究では,動的予算配分のための強化学習フレームワークを提案する。
ディリクレにインスパイアされた性質と量子突然変異に基づく遺伝的最適化によって強化されている。
未確認の財政データでは、実際の配分と高い整合性を達成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:34:21 GMT)
Fast 3D Diffusion for Scalable Granular Media Synthesis [0.0] 新しい生成パイプラインは、最終および物理的に現実的な構成で大きな粒状集合体を合成するために開発されている。
3時間DEMシミュレーションに匹敵する1.2mの弾道線合成が20秒で完了した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:27:36 GMT)
Extrinsic and Intrinsic Nonlinear Hall Effects across Berry-Dipole Transitions [0.0] 3次元ホップ絶縁体(3-dimensional Hopf insulator)は、トポロジカル位相のクラスである。
異なるホップ不変量を持つ2つの回転不変ホップ絶縁相を分離する臨界点は、通常のディラック型やワイル型臨界点とは全く異なる。
このようなベリー-双極子遷移に近く、弱ドープ状態における外在的および内在的非線形ホール伝導率テンソルは、ドーピングレベルとバルクエネルギーギャップの比の2つの普遍関数によって特徴づけられる。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:28:37 GMT)
Evaluating the Fitness of Ontologies for the Task of Question Generation [0.0] 本稿では,質問生成タスクの適合度を評価するための要件セットとタスク固有の指標を提案する。
評価指標のセットは、質問生成モデルによって生成された質問のエキスパートアセスメントから導かれる。
分析の結果,特徴が諸性能の異なる質問生成の有効性に大きく影響していることが確認された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:47:44 GMT)
Ensemble Debates with Local Large Language Models for AI Alignment [0.0] ローカルなオープンソース・アンサンブルの議論がアライメント指向の推論を改善するかどうかを考察する。
15のシナリオにまたがる150以上の議論は、7ポイントのルーブリック上で単モデルのベースラインよりも優れています。
改善は誠実さと人間の強化にとって最強です。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:25:51 GMT)
Enhancing mechanical entanglement in molecular optomechanics [0.0] 分子光学系における二部量子絡み合いの強化手法を提案する。
光振動と振動振動の絡み合いに及ぼすOPAの影響について検討する。
この結果はOPA強化McOMシステムのための有望な理論基盤を確立した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:39:37 GMT)
Efficient and Privacy-Protecting Background Removal for 2D Video Streaming using iPhone 15 Pro Max LiDAR [0.0] 我々はiPhone 15 Pro MaxのLiDARとカラーカメラとGPUベースの画像処理を統合している。
LiDARの深度情報は被写体照明とは独立であり、低照度および明るい環境でも同様に機能する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:14:12 GMT)
Distributed Implementation of Variational Quantum Eigensolver to Solve QUBO Problems [0.0] 本稿では分散アルゴリズムと変分量子固有解法(VQE)の実装について述べる。
DVQEは、分散方式で複数の量子処理ユニット(QPU)にまたがるパラメータ化量子回路の実行を可能にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 19:27:11 GMT)
Discovering equations from data: symbolic regression in dynamical systems [0.0] 本稿では,カオス力学や流行モデルを含む9つの動的過程から方程式を復元するために,5つの記号回帰法を用いた。
ベンチマークの結果はその高い予測力と精度を示し、いくつかの見積もりは元の分析形式と区別できない。
これらの結果は、実世界の現象を推論しモデル化するための堅牢なツールとしての象徴的回帰の可能性を強調している。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 20:30:09 GMT)
Diffraction of atomic matter waves through a 2D crystal [0.0] 我々は単層グラフェンを通したキロボルトエネルギーでヘリウムと水素原子を回折する。
原子の運動エネルギーが高いにもかかわらず、コヒーレント散乱を観測する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:01:45 GMT)
Dhati+: Fine-tuned Large Language Models for Arabic Subjectivity Evaluation [0.0] その重要性にもかかわらず、アラビア語は資金不足に直面している。
大きな注釈付きデータセットの不足は、アラビア語の主観分析のための正確なツールの開発を妨げている。
近年のディープラーニングとトランスフォーマーの進歩は、英語とフランス語のテキスト分類に非常に効果的であることが証明されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:20:12 GMT)
Deep Hype in Artificial General Intelligence: Uncertainty, Sociotechnical Fictions and the Governance of AI Futures [0.0] 人工知能(Artificial General Intelligence, AGI)は、技術リーダーや投資家によって、すべての人間の知的タスクを遂行できるシステムとして推進されている。
本稿では、AGIを深い誇大広告によって持続されるものとして、社会技術フィクションを通して語られる長期的、過剰生産のダイナミックさを概念化する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:24:50 GMT)
Decomposing Behavioral Phase Transitions in LLMs: Order Parameters for Emergent Misalignment [0.0] 極端に有害なデータセットを微調整したLCMは、人間の価値に対して広く不一致した行動を引き起こす可能性がある。
我々は、微調整中の急激な遷移を検出し、特徴付けるための包括的枠組みを開発する。
我々のフレームワークは、言語に基づく順序パラメータの自動発見と定量化を可能にする。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 16:19:49 GMT)
Data Cartography for Detecting Memorization Hotspots and Guiding Data Interventions in Generative Models [0.0] 現代の生成モデルは、競合者やベンチマークのパフォーマンスによって抽出される稀なトレーニング例を、過度に適合させ、意図せずに記憶するリスクがある。
本稿では,データ中心のフレームワークであるGenerative Data Cartography(GenDataCarto)を提案する。
本研究の記憶度スコアは, 平滑な仮定の下で古典的な影響を低く抑え, 均一な安定性境界を通した一般化ギャップを確実に減少させることを証明した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 05:11:06 GMT)
Correlated decoherence and thermometry with mobile impurities in a 1D Fermi gas [0.0] 超低温フェルミオン原子のガス中に閉じ込められた2つの移動不純物の相関脱コヒーレンスダイナミクスについて検討した。
平衡条件下では, 不純物とガスの相互作用強度が増大するにつれて, 不純物が水浴誘起の局所化を受けることが判明した。
本研究は,モバイル不純物が共通の環境下で強調する,興味深いオープン量子力学を実証するものである。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 17:01:38 GMT)
Context-Aware Zero-Shot Anomaly Detection in Surveillance Using Contrastive and Predictive Spatiotemporal Modeling [0.0] この研究は、トレーニング中に異常な例に晒されることなく異常事象を識別する、文脈対応のゼロショット異常検出フレームワークを導入する。
提案したハイブリッドアーキテクチャは、TimeSformer、DPC、CLIPを組み合わせて、豊富な時空間特徴を抽出する。
コンテキストゲーティング機構は、シーン対応キューやグローバルビデオ機能による予測を調整することにより、意思決定をさらに強化する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:43:57 GMT)
Competing color superconductivity and color Kondo effect in quark matter [0.0] バルク色超伝導と重クォーク不純物の局所スクリーニングの競合は、高密度クォーク物質における豊富な現象のスペクトルをもたらす。
超伝導クォークバルクの先端におけるこの競合について検討し, 超伝導ギャップとコンドスケールの両方を, トラクタブル玩具モデルで動的に生成することを示した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:55:26 GMT)
Centralized vs. Federated Learning for Educational Data Mining: A Comparative Study on Student Performance Prediction with SAEB Microdata [0.0] 本研究は,フェデレート学習,特にFedProxアルゴリズムの有効性と有効性を評価し,学生の成績を予測する。
この分析は200万人以上の学生の記録で行われ、中央集権モデルの精度は63.96%に達した。
注目すべきは、フェデレートされたモデルが最高精度61.23%に達したことだ。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 10:30:25 GMT)
Casimir-Lifshitz interaction between bodies integrated in a micro/nanoelectromechanical quantum damped oscillator [0.0] 低周波域が力を支配するシステムには大きな種類があることが示されている。
回路誘起カシミール・リフシッツ力の推定値から, 実験的に同定できることが示唆された。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:40:40 GMT)
Canonical pairs in finite-dimensional Hilbert space [0.0] 一対のエルミート作用素が正準可換関係を満たすとき、正準作用素である。
そのような正準対は有限次元ヒルベルト空間に存在しないと信じられている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:04:35 GMT)
Black Holes, Entanglement and Decoherence [0.0] 最近、ブラックホール(あるいはキリング地平線)がその近傍の量子重ね合わせを分解することが示されている。
私はこの現象がどのように起こるかを示す3つの異なるが等価な議論をレビューする。
ソフトヘア」と「内部自由度」との相互作用が強調され、重力の量子論における地平線の性質へのいくつかの意味が議論される。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:00:05 GMT)
Bangla-Bayanno: A 52K-Pair Bengali Visual Question Answering Dataset with LLM-Assisted Translation Refinement [0.0] バングラでVQA(Visual Question Answering)データセットを公開しているBangla-Bayannoを紹介します。
データセットは、4750以上の画像に対して52,650の質問応答ペアで構成されている。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 13:48:04 GMT)
Automatic Pronunciation Error Detection and Correction of the Holy Quran's Learners Using Deep Learning [0.0] 高品質なQuranicデータセットを生成するために、98%の自動パイプラインを構築しています。
私たちはカスタムのQuran Phonetic Scriptを使ってTajweedルールをエンコードしています。
すべてのコード、データ、モデルをオープンソースとしてリリースしています。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:28:46 GMT)
Attention is also needed for form design [0.0] 本研究は,眼球追跡を用いた没入型バーチャルリアリティ環境であるEURIAとエージェントAIパイプラインであるRETinaという,2つのシステムを統合した,注目を意識した新しいフレームワークを紹介する。
提案フレームワークは,創造的ディレクターの役割を向上し,エージェントAIの創造力と人間の直感を融合させ,高品質なデザインをより効率的に作成する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 09:15:21 GMT)
Advanced Deep Learning Techniques for Classifying Dental Conditions Using Panoramic X-Ray Images [0.0] 本研究では,パノラマX線画像における歯質自動分類のための深層学習手法について検討した。
カスタム畳み込みニューラルネットワーク(CNN)、CNN特徴抽出と従来の分類器を組み合わせたハイブリッドモデル、微調整された事前学習アーキテクチャの3つのアプローチが評価された。
その結果, ハイブリッドモデルにより形態的類似条件の識別が向上し, 効率的かつ信頼性の高い性能が得られた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 04:52:50 GMT)
Accurate calculation of light rare-earth magnetic anisotropy with density functional theory [0.0] 密度汎関数理論(DFT)は、光希少磁気学の治療に長年苦労してきた。
この困難は、$4f$のチャージアセシリティを過度に見積もることから生じる。
本稿では,制約付きDFT+Uと結晶場理論を組み合わせることで有効解を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 00:47:55 GMT)
AI-AI Esthetic Collaboration with Explicit Semiotic Awareness and Emergent Grammar Development [0.0] 相互作用する2つの大きな言語モデル(Claude Sonnet 4 と ChatGPT-4o)はメタセミズム認知の自然発生を示した。
この相互作用は、操作文法プロトコルとして機能する新しい記号演算子を生み出した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:16:36 GMT)
AI Propaganda factories with language models [0.0] 小型言語モデルでは,コヒーレントでペルソナ駆動の政治メッセージが生成され,人間のレーダを使わずに自動的に評価できることを示す。
完全に自動化されたインフルエンス・コンテント・プロダクションは、大小両方のアクターの手が届く範囲内にあることを実証する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 18:04:45 GMT)
A method of an on-demand beamsplitter for trapped-ion quantum computers [0.0] 共振モード間のエンタグルメントはクーロン相互作用によって制御されるため、局所モード間の絡み合いの制御は困難である。
本稿では, 各モードの世俗周波数を動的に制御できる, 閉じ込められたイオンアーキテクチャのためのビームスプリッタの手法を提案する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 15:51:40 GMT)
A bag of tricks for real-time Mitotic Figure detection [0.0] 我々は,RTMDet単段物体検出装置の効率的な構築を行い,臨床展開に適した高推論速度を実現する。
偽陽性を減少させるために, ターゲット型, 硬い負のマイニングを壊死組織, 破片組織に適用した。
Mitosis DOmain Generalization (MIDOG) 2025の予備試験セットでは, RTMDet-Sをベースとした一段法が0.81に到達した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 11:45:44 GMT)
A Systematic Review on the Generative AI Applications in Human Medical Genomics [0.0] 大規模言語モデル(LLM)は、構造化されていない医療データの文脈的理解を必要とするタスクにおいて優れている。
本研究は,レアおよび一般的な疾患の遺伝子研究と診断におけるLSMの役割について概説する。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:17:12 GMT)
A Survey of Affective Recommender Systems: Modeling Attitudes, Emotions, and Moods for Personalization [0.0] Affective Recommender Systemsは、ユーザの感情状態にレコメンデーションを合わせることによってパーソナライズを強化することを目的としている。
本稿では,態度認識,感情認識,気分認識,ハイブリッドの4つのカテゴリに分類する手法を提案する。
我々は、感情的な信号抽出技術、システムアーキテクチャ、アプリケーション領域を文書化し、重要なトレンド、制限、オープンな課題を強調します。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 21:50:32 GMT)
A Matrix Quantum Kinetic Treatment of Impact Ionization in Avalanche Photodiodes [0.0] フォノンや電子からの非弾性散乱は一般に高次過程として扱われる。
アバランシェ・フォトダイオード(APD)のキャリア乗算は、強い非弾性衝撃イオン化に完全に依存している。
複数のグリーン関数の積を含む衝撃電離のための行列ベースの量子力学理論を開発した。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 01:51:53 GMT)
$\mathcal{C}^1$-approximation with rational functions and rational neural networks [0.0] 正則関数は有理関数と有理ニューラルネットワークの両方で$mathcalC1$-normで近似できることを示す。
その結果,有理ニューラルネットワークに対する$mathcalC1$-approximationの結果が,$EQLdiv$とParFamアーキテクチャで得られた。
論文参考訳(メタデータ) (Wed, 27 Aug 2025 08:31:25 GMT)