Safety at Scale: A Comprehensive Survey of Large Model and Agent Safety [296.5] 我々は、敵攻撃、データ中毒、バックドア攻撃、ジェイルブレイクとプロンプトインジェクション攻撃、エネルギー遅延攻撃、データとモデル抽出攻撃、出現するエージェント固有の脅威を含む、大規模なモデルに対する安全脅威の包括的分類を提示する。
我々は、大規模なモデル安全性におけるオープンな課題を特定し、議論し、包括的な安全性評価、スケーラブルで効果的な防御機構、持続可能なデータプラクティスの必要性を強調します。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:45:01 GMT)
FlexOlmo: Open Language Models for Flexible Data Use [184.9] 我々は、データ共有なしで分散トレーニングをサポートする新しい言語モデル(LM)であるFlexOlmoを紹介します。
FlexOlmoはエキスパートの混成アーキテクチャを採用しており、各専門家はクローズドデータセットで独立して訓練される。
我々は、公開データで訓練された一般専門家と、他のデータ所有者から独立した訓練を受けた専門家とを効果的に組み合わせることができることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:10:14 GMT)
Advancing Science- and Evidence-based AI Policy [163.4] 本稿では,AIの機会と課題に対処するために,エビデンスと政策の関係を最適化する方法の課題に取り組む。
i)AIのリスクとその効果的な緩和に関する研究、または(ii)これらのリスクに対処するための政策を提唱することで、この問題に対処する努力が増えている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:20:58 GMT)
Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems [132.8] この本は、モジュール化された脳に触発されたアーキテクチャの中で、インテリジェントなエージェントをフレーミングする、包括的な概要を提供する。
自己向上と適応的な進化のメカニズムを探求し、エージェントが自律的に能力を洗練する方法を探求する。
また、エージェントの相互作用、協力、社会構造から生じる集合的知性についても調べる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:44:02 GMT)
Training Dynamics of the Cooldown Stage in Warmup-Stable-Decay Learning Rate Scheduler [106.6] Warmup-Stableスケジューリングスケジューラのフェーズのみを網羅的に分析する。
我々の分析では、異なる形状が結果のモデルに基本的な偏見を示すことが明らかになっている。
また、景観の可視化も提供し、川流域の損失の視点を裏付ける。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:36:52 GMT)
ForenX: Towards Explainable AI-Generated Image Detection with Multimodal Large Language Models [82.0] ForenXは画像の真正性を識別するだけでなく、人間の思考に共鳴する説明を提供する新しい手法である。
ForenXは、強力なマルチモーダル大言語モデル(MLLM)を使用して、法医学的な手がかりを分析し、解釈する。
本稿では,AI生成画像における偽証拠の記述専用のデータセットであるForgReasonを紹介する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:21:26 GMT)
DELTAv2: Accelerating Dense 3D Tracking [79.6] 本稿では,ビデオ中の高密度3次元点追跡を高速化するための新しいアルゴリズムを提案する。
極小点の小さな部分集合で追跡を開始し、トラックされた軌道の集合を段階的に拡大する粗大な戦略を導入する。
新たに追加されたトラジェクトリは学習可能なモジュールを使用しており、トラッキングネットワークとともにエンドツーエンドでトレーニングされている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:15:47 GMT)
Rethinking the Role of Prompting Strategies in LLM Test-Time Scaling: A Perspective of Probability Theory [79.6] 本稿では、標準的で現実的なスケーリング設定である多数決に焦点をあてる。
サンプリング時間と計算オーバーヘッドが増加するにつれて、より優れた初期性能を持つ複雑なプロンプト戦略が、次第に単純なチェーン・オブ・サート(Chain-of-Thought)に遅れることが示される。
本稿では,スケーリング性能を効率的に予測し,大規模なサンプリング時間下での最良のプロンプト戦略を特定する確率的手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:06:23 GMT)
MeshLLM: Empowering Large Language Models to Progressively Understand and Generate 3D Mesh [79.2] MeshLLMは、大規模言語モデル(LLM)を活用して、テキストシリアライズされた3Dメッシュを理解して生成するフレームワークである。
我々は3次元メッシュを構造的に意味のあるサブユニットに分割するプリミティブ・メシュ分解戦略を導入する。
実験により、MeshLLMはメッシュ生成の品質と形状理解の両方において最先端のLLaMA-Meshよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:37:37 GMT)
Can Indirect Prompt Injection Attacks Be Detected and Removed? [68.7] 間接的インジェクション攻撃の検出・除去の可能性について検討した。
検出のために,既存のLCMとオープンソースの検出モデルの性能を評価する。
そこで本研究では,(1) インジェクション命令を含む部分をセグメント化して除去するセグメンテーション除去法,(2) 抽出モデルを訓練してインジェクション命令を識別・除去する抽出除去法,の2つの直感的手法を評価する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:41:06 GMT)
Defense Against Prompt Injection Attack by Leveraging Attack Techniques [66.7] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクで顕著なパフォーマンスを実現している。
LLMが進化を続けるにつれて、新しい脆弱性、特にインジェクション攻撃が発生する。
近年の攻撃手法は, LLMの命令追従能力とデータ内容に注入された命令を識別する能力を活用している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:44:03 GMT)
SpectrumFM: A New Paradigm for Spectrum Cognition [65.7] 本稿ではスペクトル認識のための新しいパラダイムを提供するスペクトルFMと呼ばれるスペクトル基盤モデルを提案する。
畳み込みニューラルネットワークを利用した革新的なスペクトルエンコーダを提案し、スペクトルデータにおける微細な局所信号構造と高レベルのグローバルな依存関係の両方を効果的に捕捉する。
2つの新しい自己教師型学習タスク、すなわちマスク付き再構成と次のスロット信号予測が、SpectrumFMの事前学習のために開発され、モデルがリッチで伝達可能な表現を学習できるようにする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:40:50 GMT)
MoGA: 3D Generative Avatar Prior for Monocular Gaussian Avatar Reconstruction [65.5] MoGAは高忠実度3Dガウスアバターを単一視点画像から再構成する新しい手法である。
提案手法は最先端の手法を超越し,実世界のシナリオを一般化する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:22:12 GMT)
Zero-Shot Vision Encoder Grafting via LLM Surrogates [65.4] 視覚言語モデル(VLM)は通常、控えめな大きさの視覚エンコーダと大きな言語モデル(LLM)をペアリングする。
我々は,大対象LLMと同じ埋め込み空間と表現言語を共有する小さな「代理モデル」を構築した。
その後、サロゲートで訓練された視覚エンコーダを、より大きなモデルに直接転送することができる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:03:19 GMT)
Object Affordance Recognition and Grounding via Multi-scale Cross-modal Representation Learning [64.3] Embodied AIの中核的な問題は、人間がしているように、観察からオブジェクト操作を学ぶことだ。
本稿では,3D表現の可利用性を学習し,段階的推論戦略を採用する新しい手法を提案する。
提案手法の有効性を実証し,アベイランスグラウンドと分類の両面での性能向上を示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:14:18 GMT)
Raising the Bar in Graph OOD Generalization: Invariant Learning Beyond Explicit Environment Modeling [61.2] 実世界のグラフデータは、従来のモデルでは一般化できない、多様で変化する環境を示すことが多い。
マルチプロトタイプ超球形不変学習(MPHIL)と呼ばれる新しい手法を提案する。
MPHILは最先端のパフォーマンスを実現し、様々なドメインからのグラフデータと異なる分散シフトで既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:44:07 GMT)
LZ Penalty: An information-theoretic repetition penalty for autoregressive language models [61.2] LZペナルティ(LZ penalty)は,自己回帰言語モデルにおいて,能力の喪失を伴わない縮退反復を減らしたペナルティである。
我々は、LZペナルティにより、最先端のオープンソース推論モデルがgreedy(温度0)デコードで動作できることを実証する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:02:19 GMT)
WebDS: An End-to-End Benchmark for Web-based Data Science [59.3] WebDSは、Webベースの初のエンドツーエンドデータサイエンスベンチマークである。
29のWebサイトにわたる870のWebベースのデータサイエンスタスクで構成されている。
WebDSは、実用的に有用なLCMベースのデータサイエンスの開発において、大きな進歩の舞台となる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:39:59 GMT)
Geo-NI: Geometry-aware Neural Interpolation for Light Field Rendering [58.3] 光場レンダリングのためのGeo-NI(Geometry-aware Neural Interpolation)フレームワークを提案する。
NIとDIBRの優位性を組み合わせることで、提案したGeo-NIは、大きな差異でビューをレンダリングすることができる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:54:24 GMT)
Self-Enhanced Image Clustering with Cross-Modal Semantic Consistency [58.0] 効率的な画像クラスタリングのためのクロスモーダルなセマンティック一貫性に基づくフレームワークを提案する。
当社のフレームワークはまず,クロスモーダルセマンティック一貫性を通じて,強力な基盤を構築します。
最初の段階では、トレーニング済みモデルのリッチなセマンティクスに合わせて、軽量クラスタリングヘッドをトレーニングします。
第2段階では、自己強化微調整戦略を導入する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:12:57 GMT)
Rectifying Magnitude Neglect in Linear Attention [57.1] リニアアテンションは、標準的なSoftmaxアテンションに比べて大幅にパフォーマンスが低下する。
我々は,線形注意の計算を改良し,クエリの規模を完全に組み込むMagnitude-Aware Linear Attention (MALA)を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:04:52 GMT)
Oldie but Goodie: Re-illuminating Label Propagation on Graphs with Partially Observed Features [44.4] 実世界のグラフでは、ノード機能のごく一部または大多数が欠落しているような、機能不足の状況が頻繁に発生します。
失われた状況を緩和しようとするいくつかのGNNベースの手法が出現したにもかかわらず、従来の構造ベースのモデルよりもパフォーマンスが悪くなっている。
本稿では、特に部分的な機能しか利用できない場合に、特徴伝達を利用する新しいフレームワークを提案する。
提案モデルであるGOODIEは,いくつかの機能が利用可能であるだけでなく,十分に利用可能な状況下でも,既存の最先端手法よりも優れた性能を発揮する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:50:41 GMT)
Harnessing Collective Intelligence of LLMs for Robust Biomedical QA: A Multi-Model Approach [44.0] 第13回BioASQチャレンジへの参加について紹介する。
バイオメディカルな疑問に答えるために,オープンソースの大規模言語モデル(LLM)を検索強化ジェネレータとして展開する。
我々は、13の最先端のオープンソースLLMを評価し、最終的な回答に貢献するために、あらゆる可能なモデルの組み合わせを探索した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:20:08 GMT)
Prompting Large Language Models with Partial Knowledge for Answering Questions with Unseen Entities [43.9] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLMs) におけるパラメトリック知識の補足と置換によって優れた性能を示す
我々は,金の推論経路とその変種が,その答えを含む経路を除去することにより,部分的に関連する知識を構築するためにどのように使用されるかを示す。
我々の覚醒に基づくアプローチは、組み込みベースの類似性に依存する従来の手法よりも優れた実用的効果を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:54:46 GMT)
LAVA: Language Driven Scalable and Versatile Traffic Video Analytics [43.8] 自然言語クエリを受信し,トラフィックターゲットを検索するシステムであるtextscLava を構築した。
textscLavaは,1)ビデオセグメントレベルのローカライゼーションのためのマルチアームバンディットに基づく効率的なサンプリング手法,2)オブジェクトレベルの検索のためのビデオ固有のオープンワールド検出モジュール,3)時間的オブジェクト関連のための長期オブジェクト軌跡抽出方式の3つの主要コンポーネントから構成される。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:22:34 GMT)
From Semantic Web and MAS to Agentic AI: A Unified Narrative of the Web of Agents [43.5] エージェントのWeb(WoA)の包括的進化的概要について紹介する。
A2AやMPPのような現代的なプロトコルは、FIPA標準やOWLベースのセマンティックエージェントのような以前の標準の制限に対する直接的な進化的応答であることを示す。
我々は、新しいプロトコルは不可欠であるが、堅牢でオープンで信頼できるエコシステムを構築するには不十分である、と結論付けている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:13:45 GMT)
LoRI: Reducing Cross-Task Interference in Multi-Task Low-Rank Adaptation [43.3] Low-Rank Adaptation (LoRA)は、Large Language Models (LLMs) のためのPEFT法として人気がある。
提案するLoRA with Reduced Interference (LoRI) は,プロジェクション行列をランダムなプロジェクションとして$A$を凍結し,タスク固有のマスクを用いて$B$をスパースする,単純かつ効果的な手法である。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:46:21 GMT)
Parallel Logical Measurements via Quantum Code Surgery [43.0] 量子符号手術(Quantum code surgery)は、量子誤り訂正符号の論理的測定を行うための、柔軟で低オーバーヘッドな技術である。
本稿では,量子ビット安定化器の低密度パリティチェック(LDPC)コードに適用可能なコード手術方式を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:53:18 GMT)
WarriorMath: Enhancing the Mathematical Ability of Large Language Models with a Defect-aware Framework [42.7] WarriorMathは数学的問題解決のための欠陥認識フレームワークである。
我々は、複数の専門家のLLMを協調的なプロセスで採用し、問題を生成、批判、洗練させます。
トレーニング段階において、我々は、その弱点に合わせてますます困難なデータを用いてモデルを反復的に微調整する進歩的学習フレームワークを導入する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:45:12 GMT)
Control Illusion: The Failure of Instruction Hierarchies in Large Language Models [42.3] 大規模言語モデル (LLM) は階層的な命令スキームによって徐々に展開される。
制約優先順位付けに基づく体系的評価フレームワークを導入し,LLMがいかに命令階層を強制するかを評価する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:43:49 GMT)
Kronos: A Foundation Model for the Language of Financial Markets [42.0] 金融Kラインモデリングに適した,統一的でスケーラブルな事前学習フレームワークであるKronosを提案する。
Kronosは、継続的な市場情報をトークンシーケンスに識別し、価格ダイナミクスと取引活動パターンの両方を保存する。
我々はKronosを、45のグローバル取引所から120億以上のKラインレコードの巨大なマルチマーケットコーパスで自己回帰目標を用いて事前訓練する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:15:59 GMT)
Causal Effect Estimation under Networked Interference without Networked Unconfoundedness Assumption [41.8] 観測データからのネットワーク干渉による因果効果の推定は極めて難しい問題である。
我々は,ネットワーク環境において,潜在的共同設立者の3つのカテゴリを特徴付ける共同設立者回復フレームワークを開発した。
この枠組みに基づいて,識別可能な表現学習技術を用いたネットワーク効果推定器を設計する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:08:56 GMT)
Artificial Intelligence and Misinformation in Art: Can Vision Language Models Judge the Hand or the Machine Behind the Canvas? [40.7] 画像の生成と解析が可能な強力な人工知能モデルは、属性を描くための新たな課題を生み出します。
一方、AIモデルは画家のスタイルを模倣するイメージを作成することができる。
一方、AIモデルは実際の絵画のアーティストを正しく識別できない可能性がある。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:27:31 GMT)
OmniPose6D: Towards Short-Term Object Pose Tracking in Dynamic Scenes from Monocular RGB [40.6] 実環境の多様性を反映した大規模合成データセットOmniPose6Dを提案する。
本稿では,ポーズ追跡アルゴリズムの総合的な比較のためのベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:44:58 GMT)
DisFaceRep: Representation Disentanglement for Co-occurring Facial Components in Weakly Supervised Face Parsing [40.4] Weakly Supervised Face Parsing (WSFP)を提案する。
WSFPは、顔コンポーネントの高い共起と視覚的類似性のために、ユニークな課題を導入している。
顔成分の分離を目的とした表現不整合フレームワークであるDisFaceRepを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:02:06 GMT)
Mitigating Information Loss under High Pruning Rates for Efficient Large Vision Language Models [39.9] LVLMの計算コストは主に数百から数千のトークンからなる入力の視覚的シーケンスに由来する。
本稿では,画像キャプションによる視覚情報損失を効果的に軽減する適応コンテンツ補償法を提案する。
我々は7つのベンチマークで広範囲に実験を行い、その結果、ACCMはFLOPの低い既存手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:22:08 GMT)
VideoLLaMB: Long Streaming Video Understanding with Recurrent Memory Bridges [39.7] VideoLLaMBは、長いビデオ理解のためのフレームワークである。
SceneTilingアルゴリズムは、ビデオをコヒーレントなセマンティックユニットに分割する。
VideoLLaMBは1つのNvidia A100 GPUを使用して最大320フレームを処理する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:32:09 GMT)
Affordance Benchmark for MLLMs [38.6] A4Bench**は,MLLMの2次元における空き知覚能力を評価するために設計された,新しいベンチマークである。
我々は17のMLLM(9つのプロプライエタリと8つのオープンソース)を評価し、それらを人的パフォーマンスと比較した。
結果として、プロプライエタリなモデルは一般的にオープンソースモデルよりも優れていますが、すべてのモデルは人間よりはるかに低いパフォーマンスを示します。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:06:31 GMT)
MECAT: A Multi-Experts Constructed Benchmark for Fine-Grained Audio Understanding Tasks [38.5] MECATは、細粒度音声理解タスクのためのマルチエキスパートコンストラクトベンチマークである。
専門的な専門家モデルからの分析を、Chain-of-Thoughtの大規模言語モデル推論と統合する。
また,最先端オーディオモデルの包括的評価について述べる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:46:50 GMT)
Importance Sampling is All You Need: Predict LLM's performance on new benchmark by reusing existing benchmark [38.4] 既存のベンチマークは、(1)高品質なテストスイートと参照ソリューションを構築するためのエスカレートコスト、(2)データ汚染のリスクの増加という2つの大きな課題に直面している。
我々は,コード生成タスク上でのLLM性能のゼロトラストフリー予測を可能にする,プロンプト中心評価フレームワークであるBISを提案する。
本フレームワークでは,コード正当性スコアの平均絶対誤差が1.1%であり,それぞれ0.3%,最悪のエラーが1.9%である。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:34:05 GMT)
PRIMAL: Physically Reactive and Interactive Motor Model for Avatar Learning [38.0] 我々は,対話型アバターの運動系を生成運動モデルとして定式化する。
基礎モデルの最近の進歩に触発されて,我々はPRIMALを提案する。
このモデルを利用して、Unreal Engineでリアルタイムのキャラクターアニメーションシステムを作成します。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:13:09 GMT)
A Confidence Interval for the $\ell_2$ Expected Calibration Error [35.9] 我々は信頼区間を$ell$ expected the Error (ECE) で開発する。
信頼性キャリブレーションの一般的な概念とキャリブレーションの両方を含む,トップ1からk$のキャリブレーションを考える。
ECEのデバイアスド推定器では、正規性を示すが、校正モデルとミスドモデルに対する収束率と分散は異なる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:10:37 GMT)
Joint Generative Modeling of Grounded Scene Graphs and Images via Diffusion Models [35.2] 本稿では,共同シーングラフ(画像生成)のためのフレームワークを提案する。
DiffuseSGは、異種ノードとエッジ属性を共同でモデル化する新しい拡散モデルである。
本モデルは,VGおよびCOCO-Stuffデータセット上でのシーングラフ生成において,既存の手法よりも優れる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:00:21 GMT)
PiKV: KV Cache Management System for Mixture of Experts [35.2] キーバリュー(KV)キャッシュストレージは、マルチGPUとマルチノード推論において大きなボトルネックとなっている。
我々は,MoEアーキテクチャに適した並列分散KVキャッシュサービスフレームワークである textbfPiKV を紹介する。
PiKVは、まだ生きたプロジェクトであり、MoE Architecturesの総合的なKVキャッシュ管理システムになることを目指している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:50:14 GMT)
CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning [35.1] 本稿では,新しいコントラストアルゴリズムRL-L1を用いた自動強化学習フレームワークを提案する。
NVIDIA A100でトレーニングされたRL-L1では、平均速度はx3.12、中央速度はx1.42で、カーネルBenchの全250カーネルで最大速度はx120に達する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:46:46 GMT)
Not All Tokens Are What You Need In Thinking [34.8] 条件付きトークン選択(CTS)は、思考の連鎖において最も重要なトークンのみを特定し保存する。
CTSは、強い推論性能を維持しながら、効果的に長いCoTを圧縮する。
さらにトレーニングトークンを42%削減すると、限界5%の精度低下しか生じず、推論トークンの75.8%が減少する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:54:47 GMT)
Can Tool-augmented Large Language Models be Aware of Incomplete Conditions? [33.7] 本研究では,大規模言語モデルが不完全条件を識別し,いつツールの使用を控えるかを適切に判断できるかどうかを検討する。
本稿では,情報の有効性とツールの有効性を評価するために,モデルに明示的に指示する新しいプロンプトベースの推論手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:08:30 GMT)
Considering Spatial Structure of the Road Network in Pavement Deterioration Modeling [33.5] 本研究では,道路ネットワークの空間的依存性をグラフニューラルネットワーク(GNN)を用いた舗装劣化モデルに適用する。
本研究で使用されるデータには,テキサス交通省が管理する舗装管理情報システム(PMIS)から50万件以上の観測データを収集した大規模舗装条件データセットが含まれている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:48:53 GMT)
MoKD: Multi-Task Optimization for Knowledge Distillation [33.4] 知識蒸留(KD)における2つの重要な課題は、教師の指導と課題目標からの学習のバランスである。
知識蒸留のためのマルチタスク最適化(MoKD)を提案する。
MoKDはKDを多目的最適化問題として再定義し、目的物間のバランスを改善する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:17:13 GMT)
Vision Calorimeter for Anti-neutron Reconstruction: A Baseline [32.9] ビジョン・カロリメータ (ViC) は、深層学習検出器を用いた反中性子再構成のためのベースライン法である。
ViCは従来の再建手法よりも大幅に優れており、インシデント位置の予測誤差を42.81%削減している。
本研究は, インシデント$barn$運動量の測定を初めて実現した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:12:28 GMT)
Early Timestep Zero-Shot Candidate Selection for Instruction-Guided Image Editing [32.6] ELECT (Early-timestep Latent Evaluation for Candidate Selection) は、早期拡散時の背景ミスマッチを推定することにより、信頼性の高い種を選択するフレームワークである。
バックグラウンドの不整合スコアによってシード候補をランク付けし、編集性を維持しながら、バックグラウンド一貫性に基づいて、不適切なサンプルを早期にフィルタリングする。
実験の結果、ELECTは計算コスト(平均で41%削減)を削減し、バックグラウンドの一貫性と命令の順守を改善し、外部の監督や訓練なしに失敗するケースで約40%の成功率を達成した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:53:06 GMT)
Voyaging into Perpetual Dynamic Scenes from a Single View [31.9] 主な課題は、異なる生成されたビューが基礎となる3Dモーションと一致していることを保証することだ。
そこで本稿では,動的シーン生成を動的コンテンツによるシーン性能問題として再定義するDynamicVoyagerを提案する。
実験により、我々のモデルは、フライスルーカメラに沿って一貫した動きを持つ永遠のシーンを生成できることが示されている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:42:13 GMT)
Med-R$^3$: Enhancing Medical Retrieval-Augmented Reasoning of LLMs via Progressive Reinforcement Learning [31.6] 本稿では、**Med-R$3$*, a*Med*ical **R**etrieval-augmented **R**easoning framework driven by Progress **R**einforcement learningを紹介する。
本稿ではまず,医学的問題に対する論理的推論を行うモデルの開発を行う。
次に,知識コーパスの特性と外部情報の利用性に適合するように,検索機能を適応的に最適化する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:06:57 GMT)
GS-Occ3D: Scaling Vision-only Occupancy Reconstruction with Gaussian Splatting [31.5] 職業は自律運転に不可欠であり、知覚と計画に不可欠な幾何学的事前情報を提供する。
既存のメソッドは、主にLiDARベースの占有アノテーションに依存している。
本稿では,視覚のみのスケーラブルなフレームワークであるGS-Occ3Dを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:10:54 GMT)
SBP-YOLO:A Lightweight Real-Time Model for Detecting Speed Bumps and Potholes [30.8] 本稿では, YOLOv11をベースとした軽量検出フレームワークであるSBP-YOLOを提案する。
このモデルは、効率的な計算のためにGhostConv、マルチスケール機能拡張のためのVoVGSCSPC、早期機能処理コストを削減するためのEfficency Detection (LEDH)を統合している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:15:08 GMT)
RoboMemory: A Brain-inspired Multi-memory Agentic Framework for Lifelong Learning in Physical Embodied Systems [30.5] 本稿では,脳にインスパイアされたマルチメモリ・フレームワークであるRoboMemoryについて紹介する。
継続的学習、マルチモジュールメモリレイテンシ、タスク相関キャプチャ、クローズドループ計画における無限ループ緩和といった現実の環境における課題に対処する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:39:42 GMT)
Towards Efficient Medical Reasoning with Minimal Fine-Tuning Data [30.4] Supervised Fine-Tuning (SFT)は、医学的推論などの専門分野にLarge Language Models (LLM)を適用する上で重要な役割を担っている。
既存の手法では、知識と推論の複雑さによって定義されるサンプルの難易度に基づいてデータを選択することで、この問題を緩和しようとする。
本稿では,高拡散高影響クアドラントのサンプルを優先するデータ選択戦略であるDIQを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:50:35 GMT)
PromptSafe: Gated Prompt Tuning for Safe Text-to-Image Generation [30.2] テキスト・ツー・イメージ(T2I)モデルは、暴力的または明示的なイメージなど、安全でない作業用コンテンツ(NSFW)の生成に脆弱である。
本稿では,軽量でテキストのみを教師付きソフト埋め込みと,推論時間付きゲート制御ネットワークを組み合わせたゲートプロンプトチューニングフレームワークであるPromptSafeを提案する。
PromptSafeはSOTAの安全でない生成率(2.36%)を達成し,高い良性を維持していることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:09:40 GMT)
TripTailor: A Real-World Benchmark for Personalized Travel Planning [29.0] TripTailorは、現実世界のシナリオでパーソナライズされた旅行計画のためのベンチマークである。
このデータセットには、50,000以上の現実世界の関心点(POI)と4000近い多様な旅行イテナリーが含まれている。
旅行計画において、実現可能性、合理性、パーソナライズされたカスタマイズなど、いくつかの重要な課題を特定します。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:44:02 GMT)
Towards Bridging Review Sparsity in Recommendation with Textual Edge Graph Representation [28.9] 本稿では,意味的信号と構造的信号とを共同でモデル化することで,欠落レビューを示唆する統一的なフレームワークを提案する。
AmazonとGoodreadsデータセットの実験は、TWISTERが従来の数値、グラフベース、LLMベースラインを一貫して上回っていることを示している。
要約すると、TWISTERはより有用で、本物で、特定のレビューを生成し、構造的なシグナルを滑らかにすることで推奨を改善する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 00:53:40 GMT)
CTR-Driven Ad Text Generation via Online Feedback Preference Optimization [28.7] 大規模言語モデル(LLM)は、手動の広告テキスト作成よりも効率性が高い。
LLMは人造テキストよりも高いCTR性能を保証していない。
オンラインフィードバックからの好みの最適化によってCTRを最適化する新しい広告テキスト生成手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:32:08 GMT)
SuPerPM: A Surgical Perception Framework Based on Deep Point Matching Learned from Physical Constrained Simulation Data [28.3] 変形時の組織追跡誤差の主な原因は、観測されたセンサ測定と以前追跡されたシーンとの間違ったデータ関係にある。
この問題を軽減するために,データアソシエーションのための学習ベースの非剛点クラウドマッチングを利用した外科的知覚フレームワークSuPerPMを提案する。
提案手法は, 大規模な変形を特徴とする, 高度な手術シーン追跡アルゴリズムよりも優れた性能を有する, 難易度の高いいくつかの手術用データセット上で実証された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:42:47 GMT)
ODOV: Towards Open-Domain Open-Vocabulary Object Detection [28.3] まず、46,949の画像を含む新しいベンチマークOD-LVISを構築し、18の複雑な現実世界ドメインと1,203のカテゴリをカバーした。
そこで我々は,ODOV検出のための新しいベースライン法を開発した。
提案するODOV検出タスクに対して十分なベンチマーク評価を行い,その結果を報告する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:10:45 GMT)
Your Learned Constraint is Secretly a Backward Reachable Tube [27.6] ICLは、障害が発生している状態の集合ではなく、障害が避けられない状態の集合を回復することを示す。
障害セットとは対照的に、BRTはデータ収集システムのダイナミクスに依存する。
得られた制約の動的条件が,政策探索のサンプル効率と学習制約の伝達可能性の両方に与える影響を考察する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:15:55 GMT)
CPformer -- Concept and Physics enhanced Transformer for Time Series Forecasting [27.5] 提案するCPformerは,5つのドメインに依存しない概念を通じて,すべての予測を伝達する概念的および物理学的変換器である。
最強のトランスフォーマーベースライン(FEDformer)に対して、CPformerは平均二乗誤差を23%、トラフィック44%、病気61%減らす。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:25:10 GMT)
Can3Tok: Canonical 3D Tokenization and Latent Modeling of Scene-Level 3D Gaussians [27.2] Can3Tokは、多数のガウスプリミティブを低次元の潜伏埋め込みに符号化できる最初の3次元シーンレベルの変分オートエンコーダである。
本稿では,大規模不整合問題に対処する3次元シーンデータ処理のための汎用パイプラインを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:43:45 GMT)
TreeDiff: AST-Guided Code Generation with Diffusion LLMs [27.1] 本稿では,抽象構文木(AST)の構造的先行を記述プロセスに組み込んだ構文対応拡散フレームワークを提案する。
その結果,構文認識の破損は構文的正当性,再構成精度,不明なコードパターンへの一般化を著しく改善することが示された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:46:09 GMT)
Handoff Design in User-Centric Cell-Free Massive MIMO Networks Using DRL [26.8] 本稿では,モバイルユーザに対するコネクションの予測と管理を行うための,深層強化学習に基づくソリューションを提案する。
提案手法では,活動空間を連続的に表現したソフトアクター・クライブアルゴリズムを用いて,HOポリシとして機能するディープニューラルネットワークをトレーニングする。
本稿では,HOの達成率とHOに関連するオーバーヘッドのバランスをとるために,HOペナルティを統合した報酬関数を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:14:14 GMT)
GSCache: Real-Time Radiance Caching for Volume Path Tracing using 3D Gaussian Splatting [26.7] 科学的可視化において、ボリュームレンダリングは、研究者が複雑な3Dデータを解析し解釈するのを助ける重要な役割を担っている。
最も顕著な問題の1つは、モンテカルロ統合によるレンダリング性能の遅さと高いピクセル分散である。
本稿では,パストレースボリュームレンダリングのための新しいラジアンスキャッシング手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:59:11 GMT)
Scalable DC Optimization via Adaptive Frank-Wolfe Algorithms [26.6] コンパクト凸可能領域$P$ 上の(滑らかな)凸関数の差を最小化する問題を考える。
Blended Pairwise Gradients (BPCG) アルゴリズムを用いて, 拘束された直流問題を効率的に解けることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:10:34 GMT)
CityNav: A Large-Scale Dataset for Real-World Aerial Navigation [25.5] 航空VLNのための最初の大規模実世界のデータセットであるCityNavを紹介する。
我々のデータセットは32,637人の実証軌道で構成されており、それぞれに自然言語の記述が組み合わされている。
ナビゲーション中に補助的なモダリティ入力として使用できる地理意味マップを作成する方法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:25:00 GMT)
FloorplanMAE:A self-supervised framework for complete floorplan generation from partial inputs [25.4] 不完全なフロアプランを完全なフロアプランに復元するための自己教師型学習フレームワークであるFloorplanMAEを提案する。
まず,建築用フロアプランに特化して訓練したフロアプラン再構築データセットFloorplanNetを開発した。
次に,Masked Autoencoders (MAE) に基づくフロアプラン再構築手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:17:09 GMT)
FloorPlan-DeepSeek (FPDS): A multimodal approach to floorplan generation using vector-based next room prediction [25.4] 既存のフロアプラン生成モデルは、主にエンド・ツー・エンドの世代であり、単一のパスでピクセルベースのレイアウト全体を生成する。
建築フロア・プラン・モデリングに適した新しい「次の部屋予測」パラダイムを提案する。
FPDSは、テキストからフロアプランタスクにおける拡散モデルとTell2Designと比較して、競合性能を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:27:22 GMT)
Fourier Basis Mapping: A Time-Frequency Learning Framework for Time Series Forecasting [25.3] 本稿では,時間周波数空間におけるフーリエ基底展開とマッピングによる時間周波数特徴の統合手法を提案する。
本手法は時間的特性を保ちながら明確な周波数特徴を抽出する。
結果は、長期および短期の予測タスクにおいて、多様な実世界のデータセットで検証される。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:17:13 GMT)
DBAIOps: A Reasoning LLM-Enhanced Database Operation and Maintenance System using Knowledge Graphs [25.2] 商用製品を含む既存のデータベースO&Mメソッドは、専門家の経験を効果的に活用できない。
本稿では,DBAIOpsを提案する。DBAIOpsは,推論と知識グラフを組み合わせてDBBAスタイルの診断を行うハイブリッドデータベースO&Mシステムである。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:36:57 GMT)
Fast and scalable retrosynthetic planning with a transformer neural network and speculative beam search [25.1] 本稿では,SMILES-to-SMILES変換器を単一ステップ逆合成モデルとして用いた多段階合成計画システムの高速化手法を提案する。
提案手法により,AiZynthFinder における多段合成計画におけるSMILES-to-SMILES変換器の遅延を低減する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:30:06 GMT)
Deep Learning for Pavement Condition Evaluation Using Satellite Imagery [24.1] 本研究では,衛星画像解析のためのディープラーニングモデルを用いた舗装条件の評価を行った。
我々は,TxDOTのPMISデータベースから,舗装部の衛星画像3,000枚以上を集め,舗装評価を行った。
その結果,精度は90%を超えることがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:43:33 GMT)
MoRe-ERL: Learning Motion Residuals using Episodic Reinforcement Learning [24.0] MoRe-ERLは、エピソード強化学習(ERL)と残留学習を組み合わせたフレームワークである。
MoRe-ERLは、重要なタスクに関連する操作を保存しながら、修正を必要とする軌道セグメントを特定する。
B-Splineベースの運動プリミティブを用いてスムーズな残留調整を生成する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:28:11 GMT)
InstructLayout: Instruction-Driven 2D and 3D Layout Synthesis with Semantic Graph Prior [23.5] 自然言語命令を補完することは、2Dおよび3Dレイアウト合成システムにとって魅力的な特性である。
既存の手法は、オブジェクトの関節分布を暗黙的にモデル化し、オブジェクトの関係を表現し、生成物の可制御性合成システムを妨げる。
Instructは、セマンティックグラフとレイアウトデコーダを統合した、新しい生成フレームワークである。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:17:52 GMT)
Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens [23.3] CoT(Chain-of-Thought)プロンプトにより,様々なタスクにおいてLLM(Large Language Model)のパフォーマンスが向上することが示されている。
しかしながら、いくつかの初期の発見は、CoT推論が見かけよりも表面的であることを示唆している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:37:28 GMT)
ConfGuard: A Simple and Effective Backdoor Detection for Large Language Models [23.2] バックドア攻撃は大規模言語モデル(LLM)に重大な脅威をもたらす
既存の防衛手法の多くは、主に分類タスクのために設計されており、自己回帰性やLLMの膨大な出力空間に対して効果がない。
本稿では,トークンの信頼度をスライディングウィンドウに監視してシーケンスロックを識別する,軽量かつ効果的な検出手法ConfGuardを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:38:04 GMT)
LACONIC: A 3D Layout Adapter for Controllable Image Creation [23.0] 誘導画像合成のための既存の生成アプローチは、画像やテキスト空間の2D制御に依存している。
本稿では,事前訓練されたテキスト・画像拡散モデルに接続可能な新しい条件付け手法,トレーニング方法,アダプタネットワークを提案する。
本手法は, カメラ制御, 明快な3次元空間におけるジオメトリの条件付け, シーンのコンテキスト全体について初めて記述する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:59:32 GMT)
Predicting Video Slot Attention Queries from Random Slot-Feature Pairs [22.9] スロットと機能の両方を組み込んだ新しいトランジタを提案し,クエリ予測のための情報を提供する。
シーン表現実験により,本手法が既存のOCL手法をはるかに上回っていることが示された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:48:04 GMT)
Associate Everything Detected: Facilitating Tracking-by-Detection to the Unknown [22.8] 本稿では,CV-MOT と OV-MOT を市販の検出器と統合した統合型フレームワークであるAssociate Everything Detected (AED) を提案する。
AEDは事前の知識(例えばモーションキュー)を排除し、複雑な軌跡を扱うために高度に堅牢な特徴学習にのみ依存する。
既存の強力なOV-MOT法やCV-MOT法と比較して,AEDはTAO,SportsMOT,DanceTrackにおいて事前の知識なく優れた性能を発揮する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:00:23 GMT)
Adaptive Content Restriction for Large Language Models via Suffix Optimization [22.4] 大規模言語モデル(LLM)は多様なアプリケーションで大きな成功を収めている。
コンテンツ制限の1つの側面は、LSMが有害なコンテンツを生成するのを防ぐことである。
これらのユースケースにSFTを適用することは、高い計算量、データ、ストレージ要求のために現実的ではない。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:09:58 GMT)
Model Tensor Planning [22.2] 我々は,高エントロピー制御トラジェクトリ生成を導入した新しいサンプリングベースMPCフレームワークであるEmphModel Planning (MTP)を提案する。
ランダム化された多部グラフをサンプリングすることにより、MPPはスムーズでグローバルに多様な制御候補を保証する。
我々の実装はJAXで完全にベクトル化され、 MuJoCo XLAと互換性があり、リアルタイム制御のためのemphJust-in-time(JIT)コンパイルとバッチロールアウトをサポートしています。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:07:06 GMT)
UniEgoMotion: A Unified Model for Egocentric Motion Reconstruction, Forecasting, and Generation [21.7] 本稿では、シーン認識動作合成に一対一のイメージを利用する2つの新しいタスクである、エゴセントリックモーション生成とエゴセントリックモーション予測を紹介する。
我々は,エゴセントリックデバイスに適した新しい頭部中心運動表現を備えた統一された条件付き運動拡散モデルUniEgoMotionを提案する。
UniEgoMotionは、自我中心の運動再構成において最先端のパフォーマンスを達成し、単一の自我中心の画像から動きを初めて生成する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 00:41:20 GMT)
SpatioTemporal Difference Network for Video Depth Super-Resolution [21.7] ビデオ深度超解像は、明らかに長い尾の分布の影響を受けている。
本研究では,空間差分枝と時間差分枝の2つのコア分岐からなる新しい時空間差分ネットワーク(STDNet)を提案する。
空間差分枝では,空間非平滑領域における長い尾の問題を緩和する空間差分機構を導入する。
時間差分枝では、隣接するRGBおよび深度フレームから現在の深度フレームへの時間差情報を優先的に伝播する時間差分戦略を設計する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:18:38 GMT)
A Coarse-to-Fine Approach to Multi-Modality 3D Occupancy Grounding [21.6] 挑戦的な屋外シーンにおける3D接地のためのベンチマークを導入する。
nuScenesデータセットに基づいて構築され、自然言語とボクセルレベルの占有アノテーションを統合する。
また,マルチモーダル学習による3次元接地のためのエンド・ツー・エンド・エンド・モデルである GroundingOcc を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:05:50 GMT)
Syllabus: Portable Curricula for Reinforcement Learning Agents [21.2] Syllabusはポータブルなカリキュラム学習ライブラリである。
カリキュラム学習のためのユニバーサルAPI、人気のある自動カリキュラム学習メソッドのモジュール実装、インフラを提供する。
我々はNetHackとNeural MMOの2つの最も難しいRLベンチマークにおいて、自動カリキュラム学習の最初の例を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:21:27 GMT)
Progressive Growing of Video Tokenizers for Temporally Compact Latent Spaces [20.9] ビデオトークン化器は遅延ビデオ拡散モデルに必須であり、生のビデオデータを遅延空間に変換して効率的なトレーニングを行う。
時間圧縮を強化するための代替手法を提案する。
本研究では, 高度圧縮ブロックを, 十分に訓練された低圧縮モデル上で段階的に訓練する, ブートストラップ付き高時間圧縮モデルを開発した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:44:27 GMT)
Recognising, Anticipating, and Mitigating LLM Pollution of Online Behavioural Research [20.8] LLM汚染がオンライン行動研究を脅かす3つの相互作用型を同定する。
本稿では,研究者の実践,プラットフォームアカウンタビリティ,コミュニティ活動にまたがる多層応答を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:40:54 GMT)
MaRGen: Multi-Agent LLM Approach for Self-Directed Market Research and Analysis [20.6] エンド・ツー・エンドのビジネス分析と市場レポート生成を自動化する自律的なフレームワークを提案する。
その中核となるのは、データを分析し、包括的なレポートを生成するために協力する特殊なエージェントだ。
このフレームワークは、データベースのクエリ、データ分析、洞察の生成、可視化の作成、市場レポートの作成など、多段階のプロセスを実行する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:49:15 GMT)
Text2Story: Advancing Video Storytelling with Text Guidance [20.5] 我々は、自然なアクション遷移と構造化された物語を伴うシームレスなビデオ生成を可能にする、AIを活用した新しいストーリーテリングフレームワークを導入する。
まず、長ビデオのセグメント間の時間的一貫性を確保するために、双方向の時間重み付き潜在ブレンディング戦略を提案する。
次に,各拡散時間におけるシーンおよびアクションプロンプトの影響を適応的に調整する動的インフォームドプロンプト重み付け機構を導入する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:32:26 GMT)
What are Foundation Models Cooking in the Post-Soviet World? [20.4] ソ連後を中心に、ロシア語とウクライナ語で1147と823の料理のデータセットであるBORSchを構築した。
我々は,ソ連後諸国の料理の起源を,テキストのみとマルチモーダル質問回答(QA)の両方で正確に識別する上で,先行モデルが困難であることを実証した。
これらの結果は,ウクライナの食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器の混用などの言語的現象を誤解して説明できることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:12:59 GMT)
Action2Dialogue: Generating Character-Centric Narratives from Scene-Level Prompts [20.3] 本稿では,アクションレベルのプロンプトを視覚的,聴覚的に基礎付けられた物語対話に変換するモジュールパイプラインを提案する。
提案手法はシーン毎に一対のプロンプトを入力し,第1に設定を定義し,第2にキャラクタの動作を指定する。
我々は、各発話を表現的、文字条件付き音声として表現し、その結果、完全に音声化されたマルチモーダルなビデオ物語を生み出す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:24:24 GMT)
SpectrumWorld: Artificial Intelligence Foundation for Spectroscopy [20.0] 本稿では,分光学における深層学習研究の体系化と高速化を目的とした,先駆的な統一プラットフォームであるSpectrumLabを紹介する。
SpectrumLabには,重要なデータ処理と評価ツールを備えた包括的なPythonライブラリとリーダボード,限定されたシードデータから高品質なベンチマークを生成する革新的なSpectrumAnnotatorモジュールという,3つのコアコンポーネントが統合されている。
私たちはSpectrumLabが、ディープラーニング駆動分光の今後の進歩の重要な基盤になることを期待しています。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:21:07 GMT)
RSPO: Risk-Seeking Policy Optimization for Pass@k and Max@k Metrics in Large Language Models [19.8] 本稿では,Pass@kとMax@kを直接対象とする新しい手法であるRSPOを提案する。
RSPOは「ヒッチハイク」問題に対処する:低逆応答は、高逆応答と共起した場合、必然的に強化される。
複数の応答に対するネスト勾配の複雑さにもかかわらず、RSPOは両方のメトリクスに対して効率的で偏りのない勾配推定器を生成する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:25:26 GMT)
Dynamic Modes as Time Representation for Spatiotemporal Forecasting [19.6] 提案手法は動的モード合成(DMD)を用いて観測データから直接時間モードを抽出する。
都市移動性,高速道路交通,気候に関する実験により,DMDをベースとした埋没は長期水平予測の精度を一貫して改善し,残差相関を低減し,時間的一般化を高めることが示されている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:43:07 GMT)
Data-Driven Discovery of Mobility Periodicity for Understanding Urban Transportation Systems [19.2] 実世界の人体移動データには,中国・杭州における地下鉄の乗客移動,ニューヨーク(ニューヨーク)とシカゴでのライドシェアリングなど,我々の枠組みを適用した。
特に、2019年から2024年にかけてのライドシェアリングデータの分析では、新型コロナウイルスのパンデミックがモビリティーの規則性に破壊的な影響があることが示されています。
我々は、ニューヨークとシカゴの双方が2020年に週ごとの定期性の大幅な減少を経験し、ニューヨークのモビリティ・レギュラーの回復がシカゴよりも速いことを調査した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:25:20 GMT)
COLLAGE: Adaptive Fusion-based Retrieval for Augmented Policy Learning [19.2] 数発の模倣学習において,COLLAGEはCOLLective Data AGgrEgationの手法である。
Collageは適応的なレイトフュージョン機構を使用して、複数のキューのタスク固有の組み合わせに基づいて、関連するデモの選択をガイドする。
コラージュは最先端の検索とマルチタスク学習の手法を10タスクで5.1%、現実世界では6タスクで16.6%上回っている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:23:09 GMT)
ReCoDe: Reinforcement Learning-based Dynamic Constraint Design for Multi-Agent Coordination [19.1] 本稿では,分散化されたハイブリッドフレームワークReCoDeを紹介する。これは,最適化ベースのコントローラの信頼性と強化学習の適応性を融合させる。
本研究では、複雑なコンテキストベースの動きとコンセンサスを必要とするマルチエージェントナビゲーションタスクへのReCoDeの適用に焦点を当てる。
我々は,ユーザ定義コントローラの維持が不完全である場合でも,スクラッチから学習するよりも効率的であるという経験的(実際のロボット)および理論的証拠を提示する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:01:16 GMT)
Multimodal Attention-Aware Fusion for Diagnosing Distal Myopathy: Evaluating Model Interpretability and Clinician Trust [19.1] 遠位筋症は広範な臨床症状を呈する骨格筋疾患の一群である。
本稿では,2つの異なる深層学習モデルから抽出した特徴を組み合わせたマルチモーダル・アウェア・フュージョンアーキテクチャを提案する。
提案手法は,これらの特徴をアテンションゲート機構を通じて統合し,予測性能と解釈可能性の両方を向上させる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:08:55 GMT)
Improving Handwritten Text Recognition via 3D Attention and Multi-Scale Training [19.1] 本稿では,新しい3次元アテンションモジュールとグローバルなコンテキスト情報を用いて,新しい認識ネットワークを提案する。
注意機構、完全接続層、繰り返しユニット、畳み込み層を含む主要な正準神経ユニットは、効率的にネットワークに組織される。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:07:00 GMT)
Predictive Data Selection: The Data That Predicts Is the Data That Teaches [19.0] 予測データ選択(PreSelect)は,高速テキストベースのスコアラのみのトレーニングとデプロイを必要とする軽量で効率的なデータ選択手法である。
我々は,PreSelectで選択した30Bトークンでトレーニングされたモデルが300Bトークンでトレーニングされたバニラベースラインのパフォーマンスを上回ることを実証し,計算要求の10倍の削減を実現した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:34:03 GMT)
RelMap: Reliable Spatiotemporal Sensor Data Visualization via Imputative Spatial Interpolation [18.9] 本稿では、信頼性の高い結果を得るとともに、不確実性のある新しいヒートマップ表現を生成する、新しい短時間データパイプラインを提案する。
我々は、ニューラルネットワーク(GNN)の計算を利用して、可視化の信頼性と時間分解能を高める。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:25:23 GMT)
RMT-PPAD: Real-time Multi-task Learning for Panoptic Perception in Autonomous Driving [18.9] RMT-PPADはリアルタイムトランスフォーマーベースのマルチタスクモデルである。
オブジェクト検出、ドライビング可能なエリアセグメンテーション、レーンラインセグメンテーションを共同で行う。
その結果,RTT-PPADは安定した性能が得られた。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:34:24 GMT)
LLMs on Trial: Evaluating Judicial Fairness for Large Language Models [18.9] 大規模言語モデル(LLM)は、その決定が権利や株式に影響を及ぼすハイテイク分野において、ますます使われている。
LLMsの司法公正性と社会正義への含意はいまだに過小評価されている。
LLMの公平度を測定するための総合的なフレームワークを構築し、65ラベルと161の値が選択される。
この枠組みを司法システムに適用し、177,100のユニークな事例事実からなる広範なデータセットJudiFairをコンパイルする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:45:01 GMT)
DiffSSC: Semantic LiDAR Scan Completion using Denoising Diffusion Probabilistic Models [18.3] 3D LiDARセンサーは、車両の周囲の粗い点雲を捉えるために広く使われている。
このようなシステムは、これらの点雲の空白さと意味論の欠如により、隠蔽された領域と風景の隙間を知覚するのに苦労する。
我々は、より完全なシーン表現を目指して、生のLiDAR測定で得られたシーンにおける観測されていない幾何学と意味を共同で予測する。
我々は、自律運転データセットに対する我々のアプローチを評価し、SSCの最先端性能を達成し、既存のほとんどの手法を上回ります。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:14:10 GMT)
Geminio: Language-Guided Gradient Inversion Attacks in Federated Learning [18.3] 視覚言語モデル(VLM)は、連邦学習(FL)における勾配反転攻撃(GIA)を強化するために武器化することができる。
我々は、GAAを意味論的に意味のある標的攻撃に変換する最初のアプローチであるGeminioを提案する。
攻撃者は自然言語で、彼らが価値と考えるデータを記述でき、Geminioはそれらの高価値なサンプルにフォーカスするために再構築を優先する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:52:34 GMT)
OpenGS-Fusion: Open-Vocabulary Dense Mapping with Hybrid 3D Gaussian Splatting for Refined Object-Level Understanding [17.5] 提案するOpenGS-Fusionは、セマンティックモデリングを改善し、オブジェクトレベルの理解を洗練させる革新的なオープン語彙密集型マッピングフレームワークである。
また,MLLM-Assisted Adaptive Thresholding という新しい多モーダル言語誘導手法を導入し,類似度閾値を適応的に調整することで3次元オブジェクトのセグメンテーションを改良する。
提案手法は,3次元オブジェクト理解とシーン再構築の品質において,既存の手法よりも優れており,言語誘導シーンインタラクションにおけるその効果を示している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:22:36 GMT)
Segment Any Architectural Facades (SAAF):An automatic segmentation model for building facades, walls and windows based on multimodal semantics guidance [17.5] 本研究では,マルチモーダルな意味指導に基づくファサードの壁や窓の自動セグメンテーションモデルを提案する。
本研究では,テキスト記述から画像分割へのマッピング関係を自律的に学習するためのエンドツーエンドトレーニングフレームワークを開発した。
本モデルでは,壁面分割作業と窓分割作業の精度向上と一般化能力の向上を図っている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:21:14 GMT)
A Comprohensive Review of Domain Adaptation Techniques for Agricultural Image Analysis in Precision Agriculture [17.5] 本稿では,農業画像解析におけるクロスドメイン転送性の向上により,ドメイン適応技術が課題にどう対処できるかを検討する。
このレビューは、作物の健康モニタリング、害虫検出、果物の認識といった応用に焦点をあてて、農業画像におけるDAの最近の進歩を体系的に要約している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:00:18 GMT)
Large Language Models Facilitate Vision Reflection in Image Classification [17.4] 本稿では,大規模マルチモーダルモデル(LMM)における視覚反射の新たな説明可能性について述べる。
我々は,画像ネットなどのベンチマーク上でも,LMMが特別な視覚モデルの予測を検証できるように促すことで,認識精度が向上することを示した。
第3に、訓練不要コネクタは、広範囲な特徴調整訓練を伴わずに、微粒化認識タスクにおけるLMM性能を向上させることができることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:34:42 GMT)
DeepGB-TB: A Risk-Balanced Cross-Attention Gradient-Boosted Convolutional Network for Rapid, Interpretable Tuberculosis Screening [17.3] DeepGB-TB(ディープGB-TB)は、オーディオと人口統計データを用いて、すぐにTBリスクスコアを割り当てる非侵襲システムである。
DeepGB-TBは7カ国で収集された1,105人の患者の多様なデータセットで評価される。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:11:07 GMT)
Multi-Operator Few-Shot Learning for Generalization Across PDE Families [17.2] 本稿では,PDE演算子を一般化することを目的とした,マルチオペレータによる複数ショット学習のための統一フレームワークを提案する。
提案手法は,(i)共有フーリエニューラル演算子(FNO)エンコーダのマルチタスクによる事前学習,(ii)入力出力フィールドの統計的要約から得られるテキスト条件付き演算子埋め込み,(iii)メモリ拡張マルチモーダルプロンプトの3つの重要な要素を統合する。
Darcy Flow や Navier Stokes の変種を含む PDE ベンチマークの実験は、我々のモデルが数ショットの一般化で既存の演算子学習ベースラインより優れていることを示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:00:01 GMT)
No Pose at All: Self-Supervised Pose-Free 3D Gaussian Splatting from Sparse Views [17.2] SPFSplatはスパース多視点画像から3次元ガウススプラッティングを行うための効率的なフレームワークである。
共有機能抽出バックボーンを使用し、3Dガウスプリミティブとカメラポーズの同時予測を可能にする。
視点の大幅な変化や画像重なりの制限の下でも、新しいビュー合成における最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:19:13 GMT)
OCSplats: Observation Completeness Quantification and Label Noise Separation in 3DGS [17.1] 既存の3DGS-Bsedアンチノイズ再構成法では、ノイズを効果的に分離できない。
本稿では,ハイブリッドノイズアセスメントと観測に基づく認知補正を組み合わせた新しい枠組みであるOCSplatsを提案する。
OCSplatは、複雑さの異なるシーンにおいて、常に先行する再構成性能と正確なラベルノイズ分類を実現する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:24:12 GMT)
Weakly-Supervised Image Forgery Localization via Vision-Language Collaborative Reasoning Framework [17.0] ViLaCoは視覚言語の共同推論フレームワークで、事前訓練された視覚言語モデルから抽出した補助的セマンティックインスペクションを導入する。
ViLaCoは既存のWSIFL法を大幅に上回り、検出精度とローカライゼーション精度の両方で最先端の性能を達成する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:14:29 GMT)
NatureGAIA: Pushing the Frontiers of GUI Agents with a Challenging Benchmark and High-Quality Trajectory Dataset [16.7] 本稿では,Causal Pathwaysの原理に基づく新しいベンチマークを紹介する。
Agentは、ロングホライゾンタスクに特化して最適化された階層型エージェントアーキテクチャである。
次に、このデータセットを用いて、Q2.5-VL-7Bモデル上でReinforcement FineTuning(RFT)を行う。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:53:41 GMT)
Construction of Digital Terrain Maps from Multi-view Satellite Imagery using Neural Volume Rendering [16.6] 衛星画像から直接テクスチャ化されたデジタル地形図を学習するために、ニューラルネットワークのボリュームレンダリング技術を適用する。
我々は、地球と火星の合成衛星データと実際の衛星データの両方について、我々の手法を実証する。
提案手法は,衛星画像の解像度とほぼ等しい地形予測精度で,有望な結果を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:29:20 GMT)
Trustworthy Reasoning: Evaluating and Enhancing Factual Accuracy in LLM Intermediate Thought Processes [16.5] 本稿では,Large Language Models(LLMs)における重大な脆弱性に対処する新しいフレームワークを提案する。
この現象は、医療、法的な分析、科学研究など、高度な領域に重大なリスクをもたらす。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:16:31 GMT)
Towards Evaluation for Real-World LLM Unlearning [16.3] 分布補正に基づく未学習評価(DCUE)と呼ばれる新しい指標を提案する。
コアトークンを特定し、検証セットを使用して信頼性スコアの分布バイアスを修正する。
結果はコルモゴロフ=スミルノフ検定を用いて定量化される。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:32:41 GMT)
Decentralized Aerial Manipulation of a Cable-Suspended Load using Multi-Agent Reinforcement Learning [16.2] 本稿では, マイクロ空力車(MAV)チームを用いて, ケーブルサスペンション負荷の実世界の6-DoF操作を可能にする最初の分散化手法を提案する。
提案手法はマルチエージェント強化学習(MARL)を利用して,MAV毎に外部ループ制御ポリシーを訓練する。
本研究では,負荷モデルの不確実性を考慮した実世界の実環境実験において,本手法の有効性を検証した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:52:33 GMT)
Momentum-GS: Momentum Gaussian Self-Distillation for High-Quality Large Scene Reconstruction [15.9] 3D Gaussian Splattingは大規模なシーン再構築において顕著な成功を収めた。
しかし、高いトレーニングメモリ消費とストレージオーバーヘッドのため、課題は継続する。
本稿では,運動量に基づく自己蒸留を利用して,一貫性と精度を向上させる新しい手法であるMomentum-GSを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:32:10 GMT)
LinkQA: Synthesizing Diverse QA from Multiple Seeds Strongly Linked by Knowledge Points [15.8] LinkSynは、新しい知識ポイント(KP)グラフベースの合成フレームワークである。
LinkSynはQAシードデータからKPを抽出し、多様なQAデータを合成するためにKPグラフを構築する。
LinkQAは、モデルサイズと初期FLOPスケールのパフォーマンスを一貫して向上させる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:09:06 GMT)
Large-Scale Diverse Synthesis for Mid-Training [15.8] BoostQAは100Bの大規模質問回答データセットである。
本稿では,BoostQAを合成するための新しい多様化パイプラインを提案する。
提案手法は,Llama-3 8Bを40Bトーケンデータセットで中級訓練し,MMLUとCMMLUで平均$mathbf12.74%の改善を実現する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:37:16 GMT)
A Closer Look on Memorization in Tabular Diffusion Model: A Data-Centric Perspective [15.3] 生成したサンプルがレプリカとしてフラグ付けされている回数に基づいて,実サンプル毎のメモリ化を定量化する。
経験的分析により,暗記回数の重み付き分布が明らかとなった。
モデルに依存しない2段階緩和法であるDynamicCutを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:31:43 GMT)
Frequency-Constrained Learning for Long-Term Forecasting [15.3] 実世界の時系列は、物理法則、人間のルーチン、季節周期から生じる強い周期構造を示す。
現代の深層予測モデルは、スペクトルバイアスと周波数認識による誘導前兆の欠如により、繰り返し発生するパターンを捉えることができないことが多い。
本稿では,周期性を明示的にモデル化し,長期予測を効果的に行う手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:12:15 GMT)
FlashSVD: Memory-Efficient Inference with Streaming for Low-Rank Models [15.2] FlashSVDは、SVD圧縮された大規模言語モデルのためのエンドツーエンドのランクアウェアストリーミング推論フレームワークである。
ピークアクティベーションメモリを最大70.2%削減し、中間のトランジェントメモリを75%削減する。
アップストリームエンコード圧縮法では精度の低下は生じず、低ランクLLMのメモリ制約による展開への実践的な経路を提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:06:46 GMT)
Multi-Cache Enhanced Prototype Learning for Test-Time Generalization of Vision-Language Models [15.1] ゼロショット設定では、テスト時間適応はテストフェーズからのラベルなしデータを用いて事前訓練されたモデルを調整し、未知のテスト分布の性能を向上させる。
既存のキャッシュ強化TTA法は、クラス内のコンパクトさを前提として、プロトタイプ構築のためのサンプルを選択するために低エントロピー基準に依存している。
本研究は,キャッシュ強化性能とクラス内コンパクト性との正の相関性を明らかにする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:43:43 GMT)
From Technical Excellence to Practical Adoption: Lessons Learned Building an ML-Enhanced Trace Analysis Tool [14.9] 産業環境における微量分析導入の障壁について検討した。
専門家が専門家の知識を実践可能な洞察に翻訳するのに苦労していることがわかりました。
TMLLは、インターフェイスに専門家の知識を埋め込んだ採用にフォーカスした設計を通じて、この問題に対処する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:32:46 GMT)
VoiceCloak: A Multi-Dimensional Defense Framework against Unauthorized Diffusion-based Voice Cloning [14.9] 拡散モデル(DM)は現実的な音声クローニング(VC)において顕著な成功を収めた
DMは、拡散の複雑な生成機構により、プロアクティブな防御と相容れないことが証明されている。
我々はVoiceCloakを紹介した。VoiceCloakは多次元のプロアクティブ・ディフェンス・フレームワークで、話者のアイデンティティを曖昧にし、潜在的な不正なVCの品質を劣化させることを目的としている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:09:52 GMT)
NS-Net: Decoupling CLIP Semantic Information through NULL-Space for Generalizable AI-Generated Image Detection [14.7] NS-Netは、CLIPの視覚的特徴から意味情報を分離する新しいフレームワークである。
実験の結果、NS-Netは既存の最先端手法よりも優れており、検出精度は7.4%向上している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:58:15 GMT)
Thinker-DDM: Modeling Deliberation for Machine Translation with a Drift-Diffusion Process [14.6] 本稿では,人間翻訳者の動的意思決定を制約リソース下でエミュレートするために,Drift-Diffusion Modelを用いたThinkerを提案する。
WMT22とCommonMTのデータセットを用いて、高リソース、低リソース、コモンセンスの翻訳設定で実験を行う。
また,提案手法の有効性と有効性を示すために,コモンセンス翻訳のさらなる分析と評価を行う。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:18:03 GMT)
SGCap: Decoding Semantic Group for Zero-shot Video Captioning [14.5] ゼロショットビデオキャプションは、ビデオテキストペアのモデルをトレーニングすることなく、ビデオを記述するための文を生成することを目的としている。
ゼロショットビデオキャプションのためのセマンティックグループキャプション(SGCap)手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:05:45 GMT)
P3P Made Easy [14.5] 本稿では, パースペクティブ・スリーポイント(P3P)問題に対する新しい解を提案する。
本手法は,解析的に単純かつ計算的に効率的である係数を用いて,問題をクォートに再構成する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:58:03 GMT)
SaviorRec: Semantic-Behavior Alignment for Cold-Start Recommendation [14.4] コールドスタート勧告フレームワークのためのセマンティックビヘイビアアライメントを提案する。
まず、ドメイン固有の知識を活用して、意味表現を生成するためにマルチモーダルエンコーダを訓練する。
第二に、残差量子化セマンティックIDを用いて、マルチモーダル表現とランキングモデルの間のギャップを動的にブリッジする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:09:21 GMT)
CLIP Brings Better Features to Visual Aesthetics Learners [14.4] Image Aesthetics Assessment (IAA) は主観的性格と高価な手作業による課題である。
Contrastive Language-Image Pre-Training (CLIP) のような近年の大規模視覚言語モデルでは、様々な下流タスクに期待できる表現能力を示している。
本稿では,CLIPの強力な一般化能力を活用しつつ,軽量なIAAモデルを学習することを目的とした,2相CLIPに基づく半教師付き知識蒸留パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:50:28 GMT)
Central Limit Theorems for Transition Probabilities of Controlled Markov Chains [14.4] 制御マルコフ連鎖における遷移行列の非パラメトリック推定器に対する中心極限定理(CLT)を開発する。
我々は、推定モデルから得られた最適ポリシーを含む任意の定常ポリシーの値、Q-、利点関数についてCLTを導出する。
これらの結果は、オフライン政策評価と最適政策回復のための新しい統計ツールを提供し、遷移確率の仮説テストを可能にする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:33:57 GMT)
Anti-Inpainting: A Proactive Defense Approach against Malicious Diffusion-based Inpainters under Unknown Conditions [14.3] アンチ・インペインティング(英: anti-Inpainting)は、3つの新しいモジュールからなる保護を達成するプロアクティブ・ディフェンス・アプローチである。
まず,拡散復調過程から複雑な特徴を抽出する多層深層特徴抽出器を提案する。
次に, 対向摂動の伝達性を高めるため, マルチスケールな意味保存データ拡張手法を設計する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:16:27 GMT)
Large Language Model-based Data Science Agent: A Survey [14.3] 本調査では、データサイエンスタスク用に設計されたLCMベースのエージェントを包括的に分析する。
エージェントの観点からは、エージェントの役割、実行、知識、リフレクションメソッドをカバーする重要な設計原則について議論する。
データサイエンスの観点から、私たちは、データ前処理、モデル開発、評価、可視化など、LLMベースのエージェントの重要なプロセスを特定します。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:33:18 GMT)
ArchiLense: A Framework for Quantitative Analysis of Architectural Styles Based on Vision Large Language Models [14.0] 我々は1,765の高品質なアーキテクチャイメージとそれに対応するスタイルアノテーションからなるArchDiffBenchというプロのアーキテクチャスタイルデータセットを構築した。
アドバンストなコンピュータビジョン技術、ディープラーニング、機械学習を統合することで、ArchiLenseはアーキテクチャイメージの自動認識、比較、正確な分類を可能にする。
ArchiLenseはアーキテクチャスタイルの認識において、92.4%の一貫性と専門家アノテーション、84.5%の分類精度で高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:10:07 GMT)
Show or Tell? Modeling the evolution of request-making in Human-LLM conversations [13.3] 我々は、チャットクエリをリクエストの内容、ロール、クエリ固有のコンテキスト、追加表現に分割する新しいタスクを提案する。
チャットベースのインタラクションに精通しているにも関わらず、LLMクエリにおけるリクエスト作成は、同等の人間と人間のインタラクションと大きく異なるままである。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:08:37 GMT)
Prompting Large Language Models for Training-Free Non-Intrusive Load Monitoring [13.0] 非侵入的負荷モニタリングは、総消費電力を個別の機器使用量に分解することを目的としている。
深層学習はNILMを進歩させたが、ラベル付きデータへの依存、一般化の制限、説明可能性の欠如によって制限されている。
本稿では,テキスト内学習による大規模言語モデルを活用した,最初のプロンプトベースのNILMフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:15:38 GMT)
MedSynth: Realistic, Synthetic Medical Dialogue-Note Pairs [12.6] Med Synthは合成医療対話とノートのデータセットである。
ダイアログ・ツー・ノート(Dial-2-Note)タスクとノート・ツー・ダイアログ(Note-2-Dial)タスクを前進させるように設計されている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:18:19 GMT)
BSL: A Unified and Generalizable Multitask Learning Platform for Virtual Drug Discovery from Design to Synthesis [12.5] そこで我々は,仮想薬物発見のためのディープラーニングによるオープンアクセスプラットフォームであるBailaisheng (BSL)を提案する。
BSLは7つのコアタスクを統一的でモジュール化されたフレームワークに統合し、生成モデルやグラフニューラルネットワークといった高度な技術を取り入れている。
BSLは、現実世界の医薬品研究にアルゴリズムの革新と高精度の予測の両方を提供している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:58:56 GMT)
Translation-Equivariant Self-Supervised Learning for Pitch Estimation with Optimal Transport [12.4] 本研究では,一次元翻訳同変系学習のための最適輸送目標を提案する。
提案手法は, 理論的に基礎を置き, より数値的に安定し, より簡易な, 最先端の自己教師型ピッチ推定器の訓練のための代替手段を提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:31:14 GMT)
D-SCoRE: Document-Centric Segmentation and CoT Reasoning with Structured Export for QA-CoT Data Generation [12.3] D-SCoREはトレーニング不要のパイプラインで、任意のテキストソースから高品質なQAデータセットを生成する。
D-SCoREは、100-200ワードテキストあたりの4オプションの反ファクト素材を持つ6つのQA-CoTペアを90秒で生成する。
そのシンプルさとスケーラビリティにより、効率的なQA生成とドメイン間の高性能な微調整が可能になる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:45:05 GMT)
Between Linear and Sinusoidal: Rethinking the Time Encoder in Dynamic Graph Learning [12.2] TGATやDyGFormerのようなセミナルアテンションベースのモデルは、エッジイベント間の時間的依存関係をキャプチャするために正弦波時間エンコーダに依存している。
線形時間エンコーダは正弦波関数による時間情報損失を回避し,高次元時間エンコーダの必要性を低減する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:33:54 GMT)
Domain Generalized Stereo Matching with Uncertainty-guided Data Augmentation [11.9] State-of-the-art stereo matching (SM)モデルはドメインの違いにより実際のデータドメインに一般化できないことが多い。
データ拡張を活用してトレーニングドメインを拡張し、堅牢なクロスドメイン特徴表現を取得するようモデルに促します。
私たちのアプローチはシンプルでアーキテクチャに依存しないもので、任意のSMネットワークに統合することができます。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:26:53 GMT)
Conquering High Packet-Loss Erasure: MoE Swin Transformer-Based Video Semantic Communication [11.8] 本稿では,パケットロス耐性 MoE Swin Transformer-based Video Semantic Communication (MSTVSC) システムを提案する。
本稿では,パケットロス耐性のMoE Swin Transformerを用いたビデオセマンティック通信(MSTVSC)システムを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:41:52 GMT)
Are Domain Generalization Benchmarks with Accuracy on the Line Misspecified? [11.5] モデルが活用できる不安定な統計的ショートカットである鮮やかな相関は、性能のアウト・オブ・ディストリビューションを低下させると予想される。
現状の実践は、排除しようとする刺激的なシグナルを真に強調することなく、"ロバスト性"を評価することを示しています。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:34:06 GMT)
PESTO: Real-Time Pitch Estimation with Self-supervised Transposition-equivariant Objective [11.4] PESTOは単ピッチ推定のための自己教師付き学習手法である。
キャッシュ型畳み込みを用いたストリーム可能なVQT実装を開発した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:00:55 GMT)
Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions [11.3] 大規模言語モデル(LLM)は、有害な行動を引き起こすジェイルブレイク攻撃に対して脆弱なままである。
悪意のあるユーザは、有害な意図のために、共通のインタラクションパターンを簡単に活用することができます。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:38:57 GMT)
H2C: Hippocampal Circuit-inspired Continual Learning for Lifelong Trajectory Prediction in Autonomous Driving [11.2] 本研究では,海馬回路にインスパイアされた連続学習法(H2C)を提案する。
実験結果から,H2CはDLベースラインの破滅的忘れをタスクフリーで平均22.71%減少させることがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:49:41 GMT)
Enhancing Multi-view Open-set Learning via Ambiguity Uncertainty Calibration and View-wise Debiasing [11.0] あいまいさの不確かさの校正とビューワイズ・デバイアスによる多視点オープンセット学習フレームワークを提案する。
多様なマルチビューベンチマークの実験により、提案フレームワークは未知のクラス認識を継続的に強化することを示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:46:16 GMT)
Exploring Direct Instruction and Summary-Mediated Prompting in LLM-Assisted Code Modification [11.0] 本稿では,大規模言語モデル(LLM)を用いた既存コードの変更について検討する。
プロンプティング(prompting)は、開発者がLLMにインテントを伝えるための主要なインターフェースである。
本研究では,LLM支援符号修正のための2つの手順について検討した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:52:49 GMT)
Benchmarking and Bridging Emotion Conflicts for Multimodal Emotion Reasoning [10.8] 現実的な感情対立下でMLLMを調べるための新しいベンチマークであるCA-MERを紹介する。
評価の結果,現在最先端の感情MLLMは感情衝突時の音声信号に過度に適応していることが明らかとなった。
バランスの取れたモダリティ統合を促進するパラメータ効率のよいフレームワークであるMoSEARを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:03:44 GMT)
$\textit{Revelio}$: Interpreting and leveraging semantic information in diffusion models [10.7] 様々なレイヤで表現されるリッチな視覚的意味情報と,異なる拡散アーキテクチャの時間ステップについて検討する。
k-スパースオートエンコーダ(k-SAE)を利用した単意味的解釈可能な特徴を明らかにする。
既成拡散モデルの特徴量に対する軽量分類器を用いた移動学習による機械的解釈について検討する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:01:09 GMT)
VWAttacker: A Systematic Security Testing Framework for Voice over WiFi User Equipments [10.6] VWAttackerは、Voice over WiFi (VoWiFi) User Equipment (UE)実装のセキュリティを分析するためのフレームワークである。
プロパティ誘導の敵テストを使用して、異なるUEのセキュリティ問題を系統的に発見する。
11の仕様から63のプロパティを抽出し、1,116のテストケースを評価し、21のUEで13の問題を検出する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:37:57 GMT)
Safeguarding Vision-Language Models: Mitigating Vulnerabilities to Gaussian Noise in Perturbation-based Attacks [10.4] VLM(Vision-Language Models)は、ノイズや破損した画像を処理する際に、ジェイルブレイク攻撃に対して脆弱である。
この課題に対処するために、画像とテキストのペアが一致しないマルチモーダル安全データセットであるRobust-VLGuardを提案する。
より強力な最適化に基づく視覚摂動攻撃のための拡散モデルを用いたDiffPure-VLMを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:47:53 GMT)
AgentSight: System-Level Observability for AI Agents Using eBPF [10.4] 既存のツールは、エージェントの高レベルな意図(LSMプロンプトを介して)または低レベルな行動(例えば、システムコール)を観察するが、これら2つのビューを関連付けることはできない。
AgentOpsはハイブリッドアプローチを使用して,このセマンティックギャップをブリッジする,AgentOpsオブザーバビリティフレームワークです。
AgentSightはTLS暗号化されたLLMトラフィックをインターセプトしてセマンティックインテントを抽出し、カーネルイベントを監視してシステム全体の効果を観察し、これら2つのストリームをプロセス境界を越えて因果的に関連付ける。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:43:39 GMT)
Uncertainty Quantification for Large-Scale Deep Networks via Post-StoNet Modeling [10.2] 深層ニューラルネットワーク(DNN)からの予測の不確実性を定量化する新しい後処理手法を提案する。
このアプローチは、事前学習された大規模モデルからニューラルネットワークパラメータ(StoNet)に出力する。
提案手法はコンフォメーション法と比較して短い区間長で忠実な信頼区間を構築することができることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:19:23 GMT)
Is Exploration or Optimization the Problem for Deep Reinforcement Learning? [10.1] 本研究は、深層強化学習アルゴリズムの最適化限界を決定するための、新しいテキスト実践的準最適推定器を提案する。
得られた最高のエクスペリエンスの差は、ポリシーの学習したパフォーマンスよりも2~3$times$である。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:40:26 GMT)
TKG-DM: Training-free Chroma Key Content Generation Diffusion Model [9.9] トレーニングフリークロマキーコンテンツ生成拡散モデル(TKG-DM)
学習自由クロマキーコンテンツ生成拡散モデル(TKG-DM)を提案する。
提案手法は、制御された背景生成のための初期雑音における色相の操作を初めて検討するものである。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:16:18 GMT)
Open-Attribute Recognition for Person Retrieval: Finding People Through Distinctive and Novel Attributes [9.9] The Open-Attribute Recognition for Person Retrieval (OAPR) task aimed to retrieve individuals based on attribute cues, whether that attribute were seen in training。
本稿では,幅広い属性カテゴリをカバーする一般化可能なボディ部分表現の学習を目的とした,新しいフレームワークを提案する。
オープン属性認識のための4つの広く使われているデータセットを再構成する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:38:24 GMT)
Mitigating Watermark Forgery in Generative Models via Multi-Key Watermarking [9.9] GenAIプロバイダに対するセキュリティ上の脅威は、悪意のあるユーザがプロバイダの透かしを生成されたコンテンツに挿入するEmphforgery攻撃である。
偽造に抵抗する潜在的な防御の1つは、生成されたコンテンツを透かしに複数のキーを使用することである。
調査対象の全ての偽造攻撃に抵抗する改良されたマルチキー透かし法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:28:08 GMT)
C3D-AD: Toward Continual 3D Anomaly Detection via Kernel Attention with Learnable Advisor [9.9] 3次元異常検出 (AD) は, 工業製品の異常や欠陥を検出する大きな可能性を示している。
既存のメソッドは通常、クラス固有の方法で訓練され、新しいクラスから学ぶ能力も欠如している。
連続3次元異常検出(C3D-AD)を提案する。これは多点点クラウドの一般化表現を学習するだけでなく,時間とともに出現する新しいクラスを処理できる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:54:55 GMT)
$R^2$-CoD: Understanding Text-Graph Complementarity in Relational Reasoning via Knowledge Co-Distillation [9.5] テキスト-グラフ表現の相補性を解析駆動で検討する。
テキストとグラフ構造が異なる推論を含む5つのタスクを探索し、そのタスクを解決するために必要な情報をエンコードする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:51:50 GMT)
Advancing the Foundation Model for Music Understanding [9.2] 総合音楽理解のための基礎モデル MuFun を導入する。
我々のモデルは、楽器と歌詞のコンテンツを共同で処理する新しいアーキテクチャを特徴としている。
また,MuCUEと呼ばれる多面的音楽理解のための新しいベンチマークを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:33:47 GMT)
3DRot: 3D Rotation Augmentation for RGB-Based 3D Tasks [9.2] 3DRotはプラグ・アンド・プレイで、カメラの光学中心の画像を回転させてミラーする。
古典的な3Dタスク, モノクロ3D検出による3DRotの検証を行った。
カメラ空間変換によって純粋に動作するため、3DRotは他の3Dタスクに簡単に転送できる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:08:16 GMT)
Multi-Object Sketch Animation by Scene Decomposition and Motion Planning [9.1] MoSketchは、マルチオブジェクトのスケッチをアニメーションするためのトレーニングデータなしのメソッドである。
MoSketchには、LLMベースのシーン分解、LLMベースのモーションプランニング、多粒度モーションリファインメント、合成SDSという4つの新しいモジュールがある。
MoSketchは、マルチオブジェクトのスケッチアニメーションへの先駆的な一歩を踏み出し、将来の研究と応用のための新たな道を開く。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:45:45 GMT)
HIT Model: A Hierarchical Interaction-Enhanced Two-Tower Model for Pre-Ranking Systems [9.1] 階層的相互作用強化2-tower(HIT)モデルを提案する。
このアーキテクチャは、一般的な2towerパラダイムを2つの重要なコンポーネントで強化する。
HITモデルはTencentのオンラインディスプレイ広告システムにうまく展開されている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 00:31:18 GMT)
T-CBF: Traversability-based Control Barrier Function to Navigate Vertically Challenging Terrain [9.1] トラバーサビリティに基づく制御バリア機能(T-CBF)について紹介する。
本研究では,非構造的垂直な地形における衝突回避以外の安全性を達成するために,神経制御バリア関数(CBF)を用いる。
シミュレーションおよび物理的Verti-4 Wheeler (V4W) プラットフォーム上での実験実験を行い,T-CBF が目標地点に到達しながらトラバーサビリティの安全性を提供できることを示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:44:19 GMT)
A Full-Stage Refined Proposal Algorithm for Suppressing False Positives in Two-Stage CNN-Based Detection Methods [8.9] 本稿では,2段階CNNに基づく歩行者検出フレームワークにおいて,偽陽性を除去することを目的としたフルステージ改良提案(FRP)アルゴリズムを提案する。
複数のベンチマークとSY-Metroデータセットで実施された様々な実験により、FRPアルゴリズムの異なる組み合わせによって支持されたモデルが、様々な範囲で偽陽性を効果的に排除できることが示されている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:25:37 GMT)
HuggingGraph: Understanding the Supply Chain of LLM Ecosystem [8.8] 大規模言語モデル(LLM)は、文脈に基づいて単語のシーケンスを処理および予測するためにディープラーニングアーキテクチャを活用する。
LLMは広範な計算資源と大規模データセットを必要とする。
本研究の目的は,LLMサプライチェーンの中心となるモデルとデータセットの関係を研究することである。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:22:07 GMT)
KEDAS: Knowledge Editing Alignment with Diverse Augmentation and Self-adaptive Inference [8.6] 本稿では,大規模言語モデルと知識編集との整合性を高めるために,多言語拡張と自己適応推論(KEDAS)による知識編集アライメントを提案する。
実験では、KEDASは4つのデータセットで36ケース中35ケースで最高パフォーマンススコアを確保している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:25:36 GMT)
Reinforcing VLMs to Use Tools for Detailed Visual Reasoning Under Resource Constraints [8.4] 我々は、視覚言語モデル(VLM)のためのDeepseek-r1のような手法からインスピレーションを得て、グループ相対ポリシー最適化(GRPO)を用いて小規模モデルを訓練し、ズームのような外部ツールを使用する。
最大のメリットは、GRPO学習、単純な報酬構造、シンプルなツール呼び出しインターフェース、そして視覚的に難しい例を過剰に表現するトレーニングデータミックスを組み合わせることで得られる。
同様に大規模なベースラインモデルと比較して,外部ツールから収集した詳細な視覚情報により,視覚的質問応答(VQA)タスクの性能が向上する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:27:29 GMT)
Efficient Data Selection for Training Genomic Perturbation Models [8.4] グラフニューラルネットワークに基づく遺伝子摂動モデルを用いて、遺伝子摂動の結果を予測する。
アクティブラーニングは、しばしばこれらのモデルをトレーニングするために使われ、ウェットラブ実験とモデル更新の交互に行われる。
本研究では,遺伝子摂動を1ショットで,モデル無しで選択するグラフベースのデータフィルタリング手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:33:32 GMT)
AgentArmor: Enforcing Program Analysis on Agent Runtime Trace to Defend Against Prompt Injection [8.3] 大きな言語モデル(LLM)エージェントは、自然言語推論と外部ツールの実行を組み合わせることで、さまざまな問題を解決するための強力な新しいパラダイムを提供する。
本研究では,エージェントランタイムトレースを解析可能なセマンティクスを用いた構造化プログラムとして扱う新しい知見を提案する。
本稿では,エージェントトレースをグラフ中間表現に基づく構造化プログラム依存表現に変換するプログラム解析フレームワークであるAgentArmorを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:59:34 GMT)
UniExtreme: A Universal Foundation Model for Extreme Weather Forecasting [8.2] 既存のアプローチは、一般的な気象条件に焦点を当てるか、特定のタイプの極端を専門にし、様々な極端事象の現実世界の大気パターンを無視している。
本研究では,(1)通常の気象条件に対するスペクトル差,(2)階層的ドライバ,および多様な極度の地理的ブレンディングという,極端な事象の2つの重要な特徴を同定する。
UniExtremeは、適応周波数変調(AFM)モジュールと、通常の気象と極度の気象の領域的なスペクトル差を捉えた普遍的極端気象予測基盤モデルと、階層的な極端多様性と合成を解決するために、地域固有の極端事象を組み込んだイベント事前拡張(EPA)モジュールを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:20:19 GMT)
SWAN: Synergistic Wavelet-Attention Network for Infrared Small Target Detection [8.1] 赤外線小目標検出(IRSTD)は、民間および軍事用途において重要である。
近年の手法は局所的な空間パターンを主に捉えた従来の畳み込み処理に重点を置いている。
空間領域と周波数領域の両方からターゲットを知覚する新しいフレームワークであるSynergistic Wavelet-Attention Network (SWAN)を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:26:58 GMT)
Reinforcement Learning for Intensity Control: An Application to Choice-Based Network Revenue Management [8.1] 我々は、選択に基づくネットワーク収益管理を用いた強化学習フレームワークを強化制御に適用する。
ジャンプポイントによって生成されたサンプルパスの固有な離散化を利用することで、事前に時間的地平線を識別する必要がないことを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:11:19 GMT)
CarbonScaling: Extending Neural Scaling Laws for Carbon Footprint in Large Language Models [8.1] textitCarbonScalingは、ニューラルネットワークのスケーリング法則を拡張して、操作性と実施性の両方を組み込む分析フレームワークである。
その結果, 炭素と精度の関係は, 実世界の非効率性は, スケーリング係数を著しく高めていることがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 00:41:45 GMT)
AI Techniques in the Microservices Life-Cycle: A Systematic Mapping Study [8.0] AI(MS)の利用は、かなりの数の調査で示されているように、新興分野である。
私たちは、DevOpsフェーズにおいて、すべての品質属性(QA)を改善するために、AIテクニックの使用間のすべての可能な接続を明らかにするために、徹底的なアプローチを取っています。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:12:12 GMT)
High-dimensional Linear Bandits with Knapsacks [7.9] 本研究では,スパース推定をオンラインで行うハードしきい値アルゴリズムのオンライン版を開発する。
以下の構造的仮定のいずれかが、よりシャープな後悔境界である$tildeO(s_0 sqrtT)$に対して十分であることを示す。
副産物として、クナップサック制約を伴わない高次元のコンテキスト帯域に我々のフレームワークを適用することで、データポーラとデータリッチレジームの両方において最適な後悔率を回復する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:21:42 GMT)
Prompt to Pwn: Automated Exploit Generation for Smart Contracts [7.8] LLMベースのエクスプロイト合成をFoundryテストスイートに統合するフレームワークであるtextscReXを提案する。
我々は、既知のハイインパクトエクスプロイトの影響を受け、合成ベンチマークと実世界のスマートコントラクトの両方で、最先端の5つのLCMを評価した。
以上の結果から,現代のLLMでは,さまざまな脆弱性タイプに対して,機能的なPoCエクスプロイトを確実に生成することが可能であり,成功率は最大92%に達することが示唆された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:52:15 GMT)
MARS: A Meta-Adaptive Reinforcement Learning Framework for Risk-Aware Multi-Agent Portfolio Management [7.7] 強化 学習は、自動ポートフォリオ管理において大きな可能性を秘めている。
リスク認識システム(MARS)のためのメタ制御エージェントを提案する。
MARSは異種エージェントアンサンブルを使用しており、各エージェントは固有の固有のリスクプロファイルを持っている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:23:41 GMT)
Tuning LLM-based Code Optimization via Meta-Prompting: An Industrial Perspective [7.7] 多様な大規模言語モデル(LLM)にまたがるタスク固有のプロンプトを自動的に生成するフレームワークであるMPCO(Meta-Prompted Code Optimization)を紹介する。
MPCOは、自動検証とスケーリングのために、ARTEMISインダストリアルプラットフォームにシームレスにデプロイする。
分析によると、トップパフォーマンス最適化の96%は意味のある編集に由来する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:11:40 GMT)
Describe Anything Model for Visual Question Answering on Text-rich Images [7.6] DAMの領域認識機能を利用するフレームワークであるDAM-QAを,テキストリッチな視覚質問応答問題に適用する。
我々のアプローチは、DocVQAで注目すべき7以上のポイントゲインで、ベースラインDAMを一貫して上回ります。
その結果、効率的な使用法と統合戦略を組み合わせれば、テキストリッチで広範なVQAタスクのためのDAMライクなモデルの可能性が浮き彫りになる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:35:59 GMT)
CreditARF: A Framework for Corporate Credit Rating with Annual Report and Financial Feature Integration [7.6] 本稿では、財務データをFinBERTを用いた年次レポートから抽出した特徴と統合する企業信用格付けフレームワークを提案する。
提案手法は評価精度を8-12%向上させ,企業信用格付けの有効性と信頼性を著しく向上させる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:56:36 GMT)
RoadMamba: A Dual Branch Visual State Space Model for Road Surface Classification [7.3] Mambaアーキテクチャは視覚処理タスクにおいて顕著なパフォーマンスを示している。
しかし、既存のマンバ建築は最先端の視覚的路面分類を達成するのに苦労している。
そこで我々は,RoadMambaと呼ばれる局所的・グローバル的認識を効果的に組み合わせた手法を提案する。
提案したRoadMambaは,大規模道路表面分類データセットの実験において,最先端の性能を達成する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:54:38 GMT)
Req-Rec: Enhancing Requirements Elicitation for Increasing Stakeholder's Satisfaction Using a Collaborative Filtering Based Recommender System [7.3] Req-Recの第一の目的は、要件適用段階において、利害関係者の満足度を高めることである。
その結果, 提案手法は, 共通要求抽出手法の弱点を効果的に克服することができた。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:53:51 GMT)
A Study on Enhancing User Engagement by Employing Gamified Recommender Systems [7.3] ゲーミフィケーションは、個人がシステム上でより多くの活動を行う動機となる。
この研究は、様々なドメインアプリケーションにおけるユーザエンゲージメントを高めるためのゲーミフィケーションレコメンデーションシステムについて、包括的なレビューを提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:49:45 GMT)
MCA-Bench: A Multimodal Benchmark for Evaluating CAPTCHA Robustness Against VLM-based Attacks [7.3] MCA-Benchは包括的な再現可能なベンチマークスイートである。
不均一なCAPTCHA型を単一の評価プロトコルに統合する。
大規模な実験により、MCA-Benchは現在のCAPTCHA設計の脆弱性スペクトルを効果的にマッピングしていることが明らかになった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:44:04 GMT)
WinkTPG: An Execution Framework for Multi-Agent Path Finding Using Temporal Reasoning [7.2] エージェントの大規模なグループに対する衝突のない経路の計画は、多くの現実世界のアプリケーションにおいて難しい問題である。
我々は,MAPFプランをキノダイナミックに実現可能なプランに効率的に洗練するマルチエージェント速度最適化アルゴリズムである,キノダイナミック時空間グラフ計画(kTPG)を提案する。
kTPGをベースとしたMAPF実行フレームワークであるWindowed kTPG(WinkTPG)を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:33:08 GMT)
RoboLinker: A Diffusion-model-based Matching Clothing Generator Between Humans and Companion Robots [7.1] 我々は、人間とロボットのマッチング服を作成するジェネレーティブデザインシステムであるRoboLinkerを紹介する。
ロボット画像とユーザからのスタイルプロンプトを入力として、ロボットの服装を視覚的に補完する人間の服装を出力する。
ヒューマノイドとペットライクなロボットでRoboLinkerを評価し,スタイリスティックにコヒーレントで感情的に共鳴する結果を生み出す能力を示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:04:46 GMT)
Perspective from a Broader Context: Can Room Style Knowledge Help Visual Floorplan Localization? [6.8] 本稿では,自己照合された未ラベルの部屋画像上で,部屋識別器を事前訓練するためのクラスタリング制約付き教師なし学習手法を提案する。
このような判別器は、観察された画像の隠されたルームタイプを経験的に抽出し、他のルームタイプと区別することができる。
識別器が要約したシーンコンテキスト情報をFLOCアルゴリズムに注入することにより、室内スタイルの知識を効果的に活用し、特定視覚FLOCを誘導する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:17:54 GMT)
Efficient Generative Model Training via Embedded Representation Warmup [6.8] 拡散モデルは高次元データを生成するのに優れるが、自己教師付き手法に比べて訓練効率と表現品質に劣る。
トレーニング中に高品質で意味豊かな表現を不活用すること。
本稿では,Embeded Representation Warmup (ERW)を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:33:55 GMT)
WIP: Enhancing Game-Based Learning with AI-Driven Peer Agents [6.7] K-12 STEM教育におけるエンゲージメントと知識保持を高めるために設計されたゲーミフィケーション学習プラットフォーム。
初期の教室パイロットは、テスト前とテスト後、ゲーム内分析、学生や教師からの質的なフィードバックを組み合わせたマルチメソッドアセスメントフレームワークを利用した。
予備調査の結果,学生のエンゲージメントは有意に増加し,ほとんどの参加者はSTEMに対する関心が高かった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:11:13 GMT)
ChartEdit: How Far Are MLLMs From Automating Chart Analysis? Evaluating MLLMs' Capability via Chart Editing [6.7] マルチモーダルな大言語モデル(MLLM)は、チャートレンダリングコードを生成する際の約束を示すが、コードによるチャートの編集はより難しい課題である。
グラフ編集タスク用に設計された新しいベンチマークであるtextscChartEditを提案する。
コードレベルとチャートレベルの2種類の実験で10種類のMLLMの性能を評価した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:58:14 GMT)
Effective Damage Data Generation by Fusing Imagery with Human Knowledge Using Vision-Language Models [6.6] 現在のディープラーニングアプローチは、データクラスの不均衡と中程度の損傷例の不足により、効果的な一般化に苦慮している。
我々は、視覚言語モデルにおける最先端技術を利用して、画像と人間の知識の理解を融合させる。
実験結果から,データ生成品質の向上が示唆され,構造的損傷のレベルが異なるシーンの分類精度の向上が示されている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:22:25 GMT)
A graph neural network based on feature network for identifying influential nodes [6.5] 本稿ではFNGCNと略される特徴ネットワークに基づくグラフ畳み込みネットワークフレームワークを提案する。
浅いGCNと深いGCNをFNGCNフレームワークに取り込むことで、2つのFNGCNを開発する。
実験の結果,FNGCNとFNGCNは比較した手法よりも精度の高いノードを同定できることがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:15:52 GMT)
PolarGrad: A Class of Matrix-Gradient Optimizers from a Unifying Preconditioning Perspective [6.5] 我々は、"マクロ認識"プリコンディショニング手法を解析するための統一フレームワークを提案する。
本稿では,行列値勾配の極分解に基づく事前条件付き最適化手法であるPolarGradを紹介する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:22:59 GMT)
CSIRO-LT at SemEval-2025 Task 11: Adapting LLMs for Emotion Recognition for Multiple Languages [6.2] textitSemeval 2025 Task 11: Bridging the Gap in Text-Based emotion shared task were organized to investigate emotion recognition across different languages。
このタスクの目的は、その感情の強さとともに、一般のサードパーティの観察者が著者が書いたテキストスニペットに基づいて、著者に帰属する基本的な感情状態を特定することができる感情認識器を実装することである。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:55:26 GMT)
Training and Evaluating Language Models with Template-based Data Generation [6.0] 本稿では,フロンティアLSM(GPT-4)を利用してメタテンプレートを自動生成する新しいパラダイムであるTDGを紹介する。
メタテンプレート生成にGPT-4を用い,多種多様な複雑な問題構造を保証し,データ拡張を行った。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:11:13 GMT)
TestWeaver: Execution-aware, Feedback-driven Regression Testing Generation with Large Language Models [5.9] 回帰テストは、コードの変更が意図せずに既存の機能を壊さないようにする。
大規模言語モデル(LLM)の最近の進歩は、回帰テストのためのテスト生成を自動化することを約束している。
テスト生成をより効率的にガイドするために、軽量なプログラム分析を統合する新しいアプローチであるTestWeaverを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:13:02 GMT)
Spatial Transcriptomics Analysis of Spatially Dense Gene Expression Prediction [5.8] PixNetは、様々な大きさのスポットにまたがる空間的に解決された遺伝子発現を予測し、病理学的スライド画像から直接スケールできる密集した予測ネットワークである。
組織学的スライド画像から空間的に高密度な連続遺伝子発現マップを生成し、興味のある場所の値を集約し、遺伝子発現を予測する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:54:54 GMT)
Via Score to Performance: Efficient Human-Controllable Long Song Generation with Bar-Level Symbolic Notation [5.8] 曲生成は音楽AIGCにおいて最も難しい問題とみなされている。
本稿では,人間編集可能なシンボリックスコアを用いた楽曲生成のための最初のモデルであるBar-level AI Composing Helper(BACH)を提案する。
BACHは、階層的な歌の構造に合わせて、トークン化戦略と象徴的な生成手順を導入する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:58:34 GMT)
Personalized Safety Alignment for Text-to-Image Diffusion Models [5.8] 生成モデルにおける安全行動に対するユーザ固有の制御を可能にするフレームワークを提案する。
ユーザ固有の安全設定をキャプチャする新しいデータセットであるSageを導入する。
実験により、PSAは有害なコンテンツ抑制において既存の方法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:23:20 GMT)
Resolving Memorization in Empirical Diffusion Model for Manifold Data in High-Dimensional Spaces [5.7] データ分布がn個の点からなる場合、経験的拡散モデルは既存のデータ点を再現する傾向がある。
本研究は,経験的拡散シミュレーションの最後に慣性更新を適用することで,記憶の問題を解くことができることを示す。
このモデルから得られたサンプルの分布は、次元$d$の$C2$多様体上の真のデータ分布を、位数$O(n-frac2d+4)$のWasserstein-1距離内で近似することを示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:46:23 GMT)
Multi-TW: Benchmarking Multimodal Models on Traditional Chinese Question Answering in Taiwan [5.7] Multi-TWは、任意のモデルのパフォーマンスとレイテンシを評価するための、中国の最初の伝統的なベンチマークである。
音声の書き起こしによる様々な非日常モデルと視覚言語モデル (VLM) の評価を行った。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:10:15 GMT)
CARGO: A Co-Optimization Framework for EV Charging and Routing in Goods Delivery Logistics [5.7] EVベースの配送経路計画問題(EDRP)に対処する枠組みを提案する。
EDF と NDF の22% の充電コストが 39% と 22% に削減され,同等の配送が完了した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:08:46 GMT)
An Empirical Validation of Open Source Repository Stability Metrics [5.7] 提案する複合安定度指数(CSI)を,高度にランク付けされたGitHubレポジトリ100個を用いて実験し,最初の実証検証を行った。
その結果,(1)週毎のコミット頻度パターンのサンプリングは,レポジトリ間でのコミット頻度の安定性を評価する上で,より有効な尺度であることが示唆された。
これらの知見はいずれも、オープンソースの健康に対する制御理論レンズの有効性を確認し、実世界のプロジェクトモニタリングツールに具体的なエビデンス支援のアプリケーションを提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:14:10 GMT)
The Overlap Gap Property limits limit swapping in the QAOA [5.6] 量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、組合せ最適化問題(COP)のために設計された量子アルゴリズムである。
また, スピングラス型COPの局所アルゴリズムが, 基礎となるErd"os-R'enyiハイパーグラフの対数深さでの性能に制限されている場合, ランダム正規ハイパーグラフも同様に制限されることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:45:49 GMT)
Understanding User Mental Models in AI-Driven Code Completion Tools: Insights from an Elicitation Study [5.5] 共同設計ワークショップを用いた56人の開発者を対象に,CCTと対話する際の精神モデルの検討を行った。
開発者はいつ、どのようにコード提案をトリガーするかについて、さまざまな好みを表明している。
また、アクティベーションタイミングのカスタマイズ、表示のモダリティ、提案の粒度、説明内容などをサポートする必要がある。
そこで本研究では, 概念実証CCTであるATHENAを開発した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:18:50 GMT)
Quenched large deviations for Monte Carlo integration with Coulomb gases [5.5] 確率のランダムな近似は、提案した積分アルゴリズムが独立性あるいはマルコフ二次性を上回ることを保証し、高速な大きな偏差原理を保っていることを示す。
クーロン相互作用核に対しては、別のギブズ測度に基づく近似が必要であり、ポテンシャルの近似の均一収束の制御をパスすることが証明される。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:52:06 GMT)
Eigen Neural Network: Unlocking Generalizable Vision with Eigenbasis [5.5] 固有ニューラルネットワーク(Eigen Neural Network, ENN)は、各層の重みを再パラメータ化する新しいアーキテクチャである。
標準BPと統合すると、ENNは大規模画像分類ベンチマークにおける最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:33:58 GMT)
BlockA2A: Towards Secure and Verifiable Agent-to-Agent Interoperability [5.5] BlockA2Aはエージェントとエージェントの相互運用性のための統合されたマルチエージェント信頼フレームワークである。
集中的な信頼ボトルネックを排除し、メッセージの信頼性と実行の整合性を確保し、エージェント間のインタラクションにおける説明責任を保証する。
ビザンチンエージェントのフラグング、リアクティブ実行停止、即時許可取り消しなど、リアルタイムメカニズムによる攻撃を中和する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:59:21 GMT)
StyleSentinel: Reliable Artistic Copyright Verification via Stylistic Fingerprints [5.5] StyleSentinelは、アーティストのアートワークに固有のスタイリスティックな指紋を検証することによって、アートワークの著作権保護のためのアプローチである。
我々は,芸術作品のスタイリスティックな表現性を高めるために,セマンティックな自己再構成プロセスを採用している。
我々は,抽象芸術様式をコンパクトなスタイリスティックフィンガーにエンコードするために,多層画像特徴を適応的に融合する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:04:52 GMT)
ModelNet40-E: An Uncertainty-Aware Benchmark for Point Cloud Classification [5.4] 合成LiDARのような雑音下での点雲分類モデルのロバスト性および校正性を評価するための新しいベンチマークであるModelNet40-Eを紹介する。
我々は、分類精度、校正基準、不確実性認識を用いて、PointNet、DGCNN、Point Transformer v3-across multiple noise levelsの評価を行った。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:57:20 GMT)
A Guide to Misinformation Detection Data and Evaluation [5.3] 文献で最大の(ミス)情報データセットを収集し,75。
我々は,文やクレームからなる36のデータセットと,純粋に段落形式のデータからなる9つのデータセットの質を評価する。
このガイドは、高品質なデータとより良い基盤評価のためのロードマップを提供し、最終的には誤情報検出の研究を改善することを目的としている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:53:26 GMT)
Assumptions to Evidence: Evaluating Security Practices Adoption and Their Impact on Outcomes in the npm Ecosystem [5.3] 本研究の目的は、実践者や政策立案者がどのセキュリティプラクティスを採用するべきかを判断するのを支援することである。
セキュリティプラクティスの採用状況と,145K npmパッケージのセキュリティ結果指標への影響を分析した。
以上の結果から,総合的なセキュリティプラクティスの採用には5.2の脆弱性,216.8日のMTTR,52.3日のMTTUが関与していることがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:00:18 GMT)
StyDeco: Unsupervised Style Transfer with Distilling Priors and Semantic Decoupling [5.1] StyDecoは、スタイル転送タスクに適したテキスト表現を学習する教師なしのフレームワークである。
本フレームワークは, 構造的忠実度と構造的保存性の両方において, 既存手法より優れる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:17:23 GMT)
AIRepr: An Analyst-Inspector Framework for Evaluating Reproducibility of LLMs in Data Science [5.1] 大規模言語モデル(LLM)は、実行可能なコード生成を通じてデータ分析を自動化するために、ますます使われるようになっている。
LLM 生成データ解析の $itRepr$oducibility を自動的に評価し,改善するための $itA$nalyst - $itI$nspector フレームワークである $itAIRepr を提示する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:17:22 GMT)
Convergence Analysis of Aggregation-Broadcast in LoRA-enabled Federated Learning [4.9] フェデレートラーニング(FL)は、分散データソース間の協調モデルトレーニングを可能にする。
Low-Rank Adaptation (LoRA) は効率的な微調整法としてFLに導入された。
LoRAに更新されたローカルモデルをサーバに集約する方法は、依然として重要かつ未検討の課題である。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:54:17 GMT)
ESM: A Framework for Building Effective Surrogate Models for Hardware-Aware Neural Architecture Search [4.9] ハードウェア対応ニューラルアーキテクチャサーチ(NAS)は、リソース制約のあるデバイスに効率的なディープニューラルネットワーク(DNN)を設計するための最も有望なテクニックの1つである。
我々は、異なる種類の代理モデルを研究し、その強みと弱みを強調します。
本稿では,モデル生成パイプラインの異なる段階の全体的なコストを考慮した,信頼性の高いデータセット生成と効率的なモデル生成を実現するための総合的なフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:06:39 GMT)
GMAT: Grounded Multi-Agent Clinical Description Generation for Text Encoder in Vision-Language MIL for Whole Slide Image Classification [4.9] 多重インスタンス学習(MIL)は、全スライド画像(WSI)分類における主要なアプローチである。
最近の研究は、医療知識を取り入れたビジョン言語モデル(VLM)をMILパイプラインに導入している。
本稿では2つの重要なコントリビューションを持つビジョン言語MILフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:59:39 GMT)
GeHirNet: A Gender-Aware Hierarchical Model for Voice Pathology Classification [4.5] 本稿では,まず,Melスペクトログラム上でResNet-50を用いて性別特異的な病理パターンを識別し,その後に性別条件付き疾患分類を行う新しい枠組みを提案する。
本研究は,声質特性の階層的モデリングにより,性別バイアスを低減しつつ,声質分類を推し進める。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:19:44 GMT)
KCR: Resolving Long-Context Knowledge Conflicts via Reasoning in LLMs [4.4] 我々は,LLMが矛盾する知識を解決する能力を高める,知識衝突推論(KCR)フレームワークを提案する。
KCRの基本的な考え方は、コンテキストの選択と定着に報いることによって、バックボーンLSMをトレーニングして正しい推論プロセスを確立することである。
我々は、モデルに正しい推論経路に従う推論プロセスのパラダイムを学ぶよう促すために強化学習を採用する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:09:50 GMT)
Agentic TinyML for Intent-aware Handover in 6G Wireless Networks [4.4] この原稿にはWAANという,意図認識と積極的なハンドオーバを可能にするクロスレイヤフレームワークが導入されている。
TinyMLエージェントは、異種エッジノードにまたがって、自律的で交渉可能なエンティティとして組み込まれている。
モビリティによって引き起こされる破壊の連続性を確保するため、WAANは半安定ランデブー点を取り入れている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:13:42 GMT)
Correctness Assessment of Code Generated by Large Language Models Using Internal Representations [4.3] 大規模言語モデル(LLM)が生成するコードの正確性を評価する新しいフレームワークであるOPENIAを紹介する。
我々の経験的分析により、これらの内部表現が潜時情報を符号化し、生成したコードの正しさと強く相関していることが明らかとなった。
OPENIAはベースラインモデルより一貫して優れており、高い精度、精度、リコール、F1スコアを実現し、スタンドアロンコード生成の最大2倍の改善を実現している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:08:59 GMT)
ParaRevSNN: A Parallel Reversible Spiking Neural Network for Efficient Training and Inference [4.2] RevSNN(Reversible Spiking Neural Networks)は、バックプロパゲーション中に前方アクティベーションを再構築することで、メモリ効率のトレーニングを可能にする。
RevSNNは厳密な逐次計算のためにレイテンシが高い。
本稿では,並列可逆SNNアーキテクチャであるParaRevSNNを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:40:59 GMT)
RAMBO: Enhancing RAG-based Repository-Level Method Body Completion [4.1] RAMBOは、レポジトリレベルのMBCのための新しいRAGベースのアプローチである。
クラス、メソッド、変数/フィールドなど、レポジトリ固有の要素とその関連する使用法を特定します。
RAMBOは、最先端のレポジトリレベルのMBCアプローチを大幅に上回った。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:11:51 GMT)
TEACH: Text Encoding as Curriculum Hints for Scene Text Recognition [4.0] Scene Text Recognition (STR) は、複雑な視覚的外観と限定的なセマンティック先行のために難しい課題である。
そこで本研究では,新たな学習パラダイムであるTAACHを提案する。
対象ラベルを埋め込み空間にエンコードし、損失認識マスキングを適用することにより、TEACHは、ラベル依存学習から完全な視覚認識へモデルを導くカリキュラム学習プロセスをシミュレートする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:28:09 GMT)
The Vanishing Gradient Problem for Stiff Neural Differential Equations [3.9] 強靭なシステムでは、高速脱着モードを制御するパラメータに対する感度が訓練中に著しく小さくなることが観察されている。
ここでは, この勾配の消失現象は, 特定の手法の人工物ではなく, A-stable および L-stable の厳密な数値積分スキームの普遍的な特徴であることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:44:14 GMT)
Ensemble learning for uncertainty estimation with application to the correction of satellite precipitation products [3.9] そこで我々は,9つの定量値に基づくアンサンブル学習装置を導入し,降水データセット作成のギャップに対処する。
提案手法は, 衛星の降水量から予測器の数を削減し, 特徴工学的手法を取り入れたものである。
QRとQRNNのアンサンブル学習は、0.025から0.975までの様々な研究された量子レベルで最高の結果をもたらし、基準法を3.91%から8.95%に上回った。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:09:34 GMT)
From Query to Logic: Ontology-Driven Multi-Hop Reasoning in LLMs [3.8] 我々は、LLMの生成能力と知識グラフの構造的利点を組み合わせたトレーニングなしのフレームワークである**ORACLE* (**O**ntology-driven **R**easoning **A**nd **C*hain for **L*ogical **E**ucidationを提案する。
実験の結果,私たちのフレームワークは,DeepSeek-R1のような最先端モデルに匹敵する,論理的に高い競争力を持つことがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:12:42 GMT)
Unlocking Excellence: The Impact of Voucher Incentives on Cybersecurity Education [3.7] 本研究では,サイバーセキュリティ教育の学生にインスピレーションを与えるために,業界ブーチャーインセンティブを活用する。
ポートフォリオベースの評価戦略を100%採用し、学生は自由に対象の成績を選択できる。
調査とインタビューの結果,学生のキャリア願望に対するブーチャーインセンティブのかなりの影響が明らかとなった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:51:17 GMT)
Quasi-Clifford to qubit mappings [3.6] 与えられた(反)可換構造を持つ代数は量子力学において広く使われている。
本稿では、QCAからパウリ代数への写像を示し、量子情報や計算におけるその利用について論じる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:40:44 GMT)
A Theory of Adaptive Scaffolding for LLM-Based Pedagogical Agents [3.6] 大規模言語モデル(LLM)は、学生の学習を支援するために意味のある対話を行う教育エージェントを作成する新しい機会を提供する。
本研究では,STEM+C学習に着目したLLMエージェントの適応的足場構築のための,エビデンス中心設計と社会認知理論を組み合わせたフレームワークを提案する。
この結果から,Inquizzitorは中核的な学習理論に沿った高品質な評価とインタラクションを提供し,教師が学生に価値をもたらす効果的な指導を提供することがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:58:32 GMT)
Calibrated Prediction Set in Fault Detection with Risk Guarantees via Significance Tests [3.5] 本稿では,形式的リスク保証を提供するために,コンフォメーション予測フレームワークと重要度テストを統合した新しい故障検出手法を提案する。
提案手法は,名目レベル以上の経験的カバレッジ率(1-alpha$)を一貫して達成する。
その結果、ユーザ定義のリスクレベル(alpha$)と効率の間のコントロール可能なトレードオフが明らかとなり、より高いリスク耐性が平均予測セットのサイズを小さくする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:49:02 GMT)
Equivariant Map and Agent Geometry for Autonomous Driving Motion Prediction [3.5] 本研究では、理論的に幾何学的同変であり、粒子と人間の相互作用不変な運動予測モデルであるEqMotionを用いて、画期的な解を提案する。
これらの技術を適用することで、軽量な設計と効率的なデータ利用を維持しながら、予測精度の高いモデルを実現することができる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:00:47 GMT)
EqDrive: Efficient Equivariant Motion Forecasting with Multi-Modality for Autonomous Driving [3.5] 我々は,マルチエージェント車両運動予測のタスクにおいて,先行する同変粒子であるEqMotionと人間の予測モデルを用いる。
EqMotionを利用することで、パラメータが少なく(120万)、トレーニング時間を大幅に短縮(2時間以内)で、最先端(SOTA)のパフォーマンスを実現します。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:52:11 GMT)
Debiasing Machine Learning Predictions for Causal Inference Without Additional Ground Truth Data: "One Map, Many Trials" in Satellite-Driven Poverty Analysis [3.4] 新たに収集したラベル付きデータに頼らずに予測バイアスを大幅に低減する2つの補正手法を導入・評価する。
提案手法は, (a) パイプラインのトレーニングや (b) 追加ラベル付きデータに対する調整を必要とする既存のアプローチに適合するか,あるいは性能を向上することを示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:26:26 GMT)
Asking the Right Questions: Benchmarking Large Language Models in the Development of Clinical Consultation Templates [3.2] 145名の専門家によるテンプレートを用いて,臨床的整合性,簡潔さ,優先順位付けされた臨床質問スキーマの作成能力の評価を行った。
o3のようなモデルは高い包括性(最大92.2%)を達成するが、常に非常に長いテンプレートを生成する。
パフォーマンスは専門分野によって異なり、精神医学や痛み医学のような物語駆動の分野において著しく低下している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:51:27 GMT)
HyClone: Bridging LLM Understanding and Dynamic Execution for Semantic Code Clone Detection [3.2] コードクローン検出(Code clone detection)は、ソフトウェア工学において重要なタスクであり、ソフトウェアシステム内の重複や類似のコードフラグメントを識別することを目的としている。
大規模言語モデル(LLM)の最近の進歩は、コードセマンティクスの理解において有望であることを示している。
LLMに基づくスクリーニングと,Pythonプログラムのセマンティッククローンを検出するための実行ベースの検証を組み合わせた,新しい2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:11:56 GMT)
Lightweight Backbone Networks Only Require Adaptive Lightweight Self-Attention Mechanisms [3.1] 本稿では,適応的な特徴マップサイズを持つ軽量なSoftMaxアテンション計算機構を提案する。
LOLViTは推論速度とモデル精度の両方で同一レベルのCNNモデルより優れていた。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:28:57 GMT)
ReMu: Reconstructing Multi-layer 3D Clothed Human from Image Layers [3.0] 本稿では,多層布を施した人間を画像層に再構成するReMuを提案する。
まず,標準体ポーズによって定義された共有座標系を用いて,各衣服層を再構成・整列する。
なお,本手法はテンプレートフリーでカテゴリ非依存であり,多様な衣服スタイルで3D衣服を復元することができる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:24:47 GMT)
MoGaFace: Momentum-Guided and Texture-Aware Gaussian Avatars for Consistent Facial Geometry [3.0] MoGaFaceは、顔の形状とテクスチャ特性を継続的に洗練する、3Dヘッドアバターモデリングフレームワークである。
MoGaFaceは高忠実な頭部アバター再構成を実現し、新規な合成品質を著しく向上させる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:25:51 GMT)
Think, Reflect, Create: Metacognitive Learning for Zero-Shot Robotic Planning with LLMs [3.0] 大規模言語モデル(LLM)は、様々な領域において大きな可能性を示している。
メタ認知学習をLLMによるマルチロボットコラボレーションに統合するフレームワークを提案する。
より困難なロボットベンチマークタスクを提案し、既存のベンチマークと新しいタスクに関する我々のフレームワークを評価する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:43:52 GMT)
A Survey on Agent Workflow -- Status and Future [2.8] この調査は、エージェントワークフローシステムの包括的なレビューを提供する。
既存のシステムを機能機能機能とアーキテクチャの2つの重要な側面に沿って分類する。
共通パターン、潜在的な技術的課題、新たなトレンドを強調します。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:15:30 GMT)
Spatial-Frequency Aware for Object Detection in RAW Image [2.8] 直接RAWに基づく物体検出は、その広いダイナミックレンジと線形応答のために固有の課題に直面している。
本研究では,空間および周波数表現を相乗化する新しいフレームワークである空間周波数認識RAW画像オブジェクト検出エンハンサー(SFAE)を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:03:23 GMT)
$I^{2}$-World: Intra-Inter Tokenization for Efficient Dynamic 4D Scene Forecasting [2.7] I2$-Worldは、4D占有率予測のための効率的なフレームワークである。
本手法は,シーントークン化をシーン内およびシーン間トークン化剤に分解する。
I2$-Worldは最先端のパフォーマンスを達成し、既存の手法を25.1%のmIoUで、36.9%のIoUで4D占有率予測で上回っている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:31:49 GMT)
How Far Are LLMs from Symbolic Planners? An NLP-Based Perspective [2.6] 提案手法では,NLP の操作により,生成した計画のNLP に基づく評価と,計画の復元を行う3つの段階からなるリカバリパイプラインを提案する。
本研究は, 計画生成における基礎的理由づけの明確な証拠は得られず, 従来の計画立案者の品質と信頼性に乏しく, NLPに基づく計画解析と回復機構を併用したパイプラインが依然として不足していることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:20:52 GMT)
Semi-Supervised Anomaly Detection in Brain MRI Using a Domain-Agnostic Deep Reinforcement Learning Approach [2.4] 我々は,大規模データやオーバーフィット,クラス不均衡といった課題に対処するために,深層強化学習(DRL)を用いたドメインに依存しない半教師付き異常検出フレームワークを開発した。
この研究では、2005年から2021年の間に収集された公開の脳MRIデータセットを使用した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:39:13 GMT)
CoCoLIT: ControlNet-Conditioned Latent Image Translation for MRI to Amyloid PET Synthesis [2.3] 三次元神経画像データの高次元的・構造的複雑さはMRIからPETへの翻訳に課題をもたらす。
本稿では,3つの主要なイノベーションを取り入れた拡散型遅延生成フレームワークであるCoCoLITを紹介する。
我々は、公開データセット上でのCoCoLITの性能を評価し、我々のモデルが画像ベースとアミロイド関連メトリクスの両方で最先端の手法を大幅に上回っていることを発見した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:58:30 GMT)
Flow IV: Counterfactual Inference In Nonseparable Outcome Models Using Instrumental Variables [2.3] 標準IVの仮定の下では、治療と結果における潜伏雑音が厳密に単調で連立ガウス的であるという仮定とともに、治療と成果の関係は観測データから一意に特定される。
これにより、非分離モデルにおいても反ファクト推論が可能となる。
本手法は,観測結果の精度を最大化するために正規化フローをトレーニングすることにより実現し,基礎となる結果関数の正確な回復を実証する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:24:03 GMT)
A Large-Scale Benchmark of Cross-Modal Learning for Histology and Gene Expression in Spatial Transcriptomics [2.3] HESCAPEは空間転写学におけるクロスモーダルコントラスト事前学習の評価のためのベンチマークである。
空間転写学データに事前訓練された遺伝子モデルは、空間データや単純なベースラインアプローチなしで訓練された遺伝子よりも優れている。
バッチ効果は、効果的なクロスモーダルアライメントを阻害する重要な要因である。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:11:36 GMT)
Directed Grammar-Based Test Generation [2.1] この研究は自動テスト生成アプローチ(FdLoopと呼ばれる)を提案する。
FdLoopは、既存の入力から関連する入力特性を反復的に学習し、ゴール固有の入力を生成する。
FdLoopは3つのよく知られた入力形式(JSON、CSS、JavaScript)と20のオープンソースソフトウェアを用いて評価する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:43:15 GMT)
GitHub Marketplace: Driving Automation and Fostering Innovation in Software Development [2.1] コラボレーションソフトウェア開発の中心的なハブであるGitHubは、同社のGitHub Marketplaceを通じて、オープンソースソフトウェア(OSS)エコシステムに革命をもたらした。
この研究はGitHub Marketplaceを体系的に分析し、業界ツールで見られるトレンドと学術文献で報告される進歩を比較した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:01:45 GMT)
Flow Matching: Markov Kernels, Stochastic Processes and Transport Plans [2.0] フローマッチング技術は、逆問題の解決に利用できる。
逆問題の解法として,フローマッチングが有効であることを示す。
本稿では,連続正規化フローとスコアマッチング手法について簡潔に述べる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:47:51 GMT)
Dataset Condensation with Color Compensation [1.9] 画像レベルの選択方法(コアセット選択、データセット量子化)は、凝縮不効率に悩まされる。
データセットの凝縮における重要な問題は、情報キャリアと基本的な意味表現ユニットとしてのカラーの二重の役割の監視である。
我々は、Color Compensationを用いたデータセット凝縮フレームワークDC3を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:44:23 GMT)
Transformers in Pseudo-Random Number Generation: A Dual Perspective on Theory and Practice [1.9] Pseudo-random number generators (PRNG) は高非線形プロセスであり、大規模言語モデルの最適化において鍵となるブロックである。
変換器を用いて高品質な擬似ランダム数を生成することは妥当であることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:31:53 GMT)
PUZZLED: Jailbreaking LLMs through Word-Based Puzzles [1.9] 本稿では,大規模言語モデルの推論機能を活用した新しいジェイルブレイク手法PUZLEDを紹介する。
我々は,LLMを認知的に要求する3種類のパズル型検索,アナグラム,クロスワードを設計する。
攻撃成功率は88.8%、特にGPT-4.1では96.5%、Claude 3.7 Sonnetでは92.3%である。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:36:01 GMT)
Proving security of BB84 under source correlations [1.8] デバイス不完全性とメモリ効果は、現実的な量子源によって生成される状態の間に望ましくない相関をもたらす可能性がある。
本稿では,BB84プロトコルのセキュリティ証明を,ほぼ完全であるソースとの相関で簡易かつ汎用的に削減する手法を提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:59:00 GMT)
Quantum Sensing with Bright Two-Mode Squeezed Light in a Distributed Network of Gyroscopes [1.8] 本研究は、角速度推定を改善するために、分散量子センシングと光学ジャイロスコープの統合について検討する。
複数の空間分離型光学ジャイロスコープ間の連続可変絡み合いを利用した新しい構成を提案する。
このスキームは、新興量子ネットワークにおける量子エンハンスな慣性航法と精度メートル法に潜在的に応用できる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:28:38 GMT)
Instruction-based Time Series Editing [1.8] 時系列編集では、ある時系列のプロパティを変更せずに変更することを目的としている。
既存の拡散ベースのエディタは、厳密で定義済みの属性ベクトルを条件として依存し、サンプリングを通じてオール・オー・ナッシングの編集を生成する。
Instruction-based Time Series Editingでは、ユーザが自然言語を使って意図した編集を指定できる。
次に、最初の命令ベースの時系列エディタであるInstructTimeを紹介します。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:03:54 GMT)
Nakamoto Consensus from Multiple Resources [1.8] Gamma(S,V,W)は、正直な当事者が管理するリソースの重みが敵の相手の重みよりも大きい場合、ブロックチェーンはプライベートな二重攻撃に対して安全であるという意味で、何の重み関数かを問う。
Gamma(S,V,W) は、時間資源 V と W の次数 1 の同質である場合に限り、プライベートな二重攻撃に対して安全である。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:36:50 GMT)
SimDeep: Federated 3D Indoor Localization via Similarity-Aware Aggregation [1.8] 屋内のローカライゼーションは、幅広い位置情報ベースのサービスをサポートする上で重要な役割を果たす。
非独立かつ同一に分散された(非IID)データによって引き起こされる障害を克服する新しいフェデレート学習フレームワークであるSimDeepを提案する。
SimDeepには、データ類似性に基づいてクライアントモデルの更新を集約するSimisity Aggregation Strategyが組み込まれており、非IIDデータによる問題を大幅に軽減している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:09:29 GMT)
Discovering Bias Associations through Open-Ended LLM Generations [1.7] 言語モデル(LLM)に埋め込まれた社会的バイアスは、重大な懸念を引き起こす。
本稿では,Bias Association Discovery Framework(BADF)について紹介する。
本研究は, オープンエンド世代におけるバイアスの理解を促進するとともに, LLMにおけるバイアス関連を識別・解析するためのスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:31:55 GMT)
Unifying Mixture of Experts and Multi-Head Latent Attention for Efficient Language Models [1.7] MoE-MLA-RoPEは、Mixture of Experts (MoE)とMulti-head Latent Attention (MLA)とRotary Position Embeddings (RoPE)を組み合わせた、効率的な言語モデリングのための新しいアーキテクチャの組み合わせである。
提案手法は,3つの重要なイノベーションを通じて,モデル容量と計算効率の基本的なトレードオフに対処する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:33:30 GMT)
Hyperparameter-Free Neurochaos Learning Algorithm for Classification [1.5] Neurochaos Learning (NL)は、カオス力学を用いて入力データから特徴を抽出する脳にインスパイアされた分類フレームワークである。
本稿では,NLアルゴリズムの新しいハイパーパラメータフリー変種であるAutochaosNetを提案する。
以上の結果から,AutochaosNetの競合性能や優れた分類性能は高いが,計算労力の削減によるトレーニング時間を大幅に短縮できることが示された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:12:39 GMT)
HT-Transformer: Event Sequences Classification by Accumulating Prefix Information with History Tokens [1.5] 本稿では,予測事前学習における履歴情報の蓄積を促進する新しい概念であるヒストリトークンを紹介する。
当社のアプローチはトランスフォーマーベースのモデルを大幅に改善し、金融、eコマース、ヘルスケアタスクにおいて素晴らしい成果を上げています。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:50:58 GMT)
Point-wise Diffusion Models for Physical Systems with Shape Variations: Application to Spatio-temporal and Large-scale system [1.5] 本稿では,形状変化を伴う複雑な物理系を効率的に予測するために,時間的点を独立に処理する点幅拡散モデルを提案する。
複雑な幾何学的構成を持つ3つの異なる物理領域にまたがるアプローチを検証する。
提案手法は,画像ベース拡散モデルよりも優れた性能を実現する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:55:59 GMT)
Modeling Deontic Modal Logic in the s(CASP) Goal-directed Predicate Answer Set Programming System [1.5] デフォルトの否定と強い否定を用いて、(決定的な)モーダル作用素をエレガントに表現する方法を示す。
本稿では、ASPのグローバル制約を用いて、デオン型モーダル論理の義務と不完全性を表現することを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:29:14 GMT)
Active Inference AI Systems for Scientific Discovery [1.5] この観点では、進歩は抽象論、推論、経験的根拠の3つのギャップを互いに強化する。
デザイン原則は、想像空間を推論し、世界から学ぶシステムのために提案されている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:50:38 GMT)
Uncertainty-Aware Segmentation Quality Prediction via Deep Learning Bayesian Modeling: Comprehensive Evaluation and Interpretation on Skin Cancer and Liver Segmentation [1.4] そこで本研究では,テスト期間中に真理アノテーションを必要とせずにセグメンテーションの品質を予測できる新しいフレームワークを提案する。
我々のフレームワークは、HAM10000データセット上のR2スコア93.25とピアソン相関96.58を達成している。
3次元肝セグメンテーションでは、エントロピーによるテスト時間増強はR2スコア85.03、ピアソン相関65.02を達成し、モダリティ間の堅牢性を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:30:32 GMT)
HoTPP Benchmark: Are We Good at the Long Horizon Events Forecasting? [1.4] 長軸予測を厳格に評価するために設計された最初のベンチマークである HoTPP を紹介する。
我々は,広く使用されている評価指標の欠点を特定し,理論的に基礎付けられたT-mAP尺度を提案し,人気モデルの効率的な実装を提供する。
我々は,自己回帰と強度に基づく損失が予測品質に与える影響を分析し,今後の研究に向けた有望な方向性を概説する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:29:49 GMT)
Beyond Algorithmic Proofs: Towards Implementation-Level Provable Security [1.3] 我々は,実世界の攻撃面に対して構造的に検証可能なレジリエンスの観点からセキュリティを定義する新しいパラダイムである,実装レベル確率セキュリティを提案する。
本稿では,ファイル破壊システムであるSEER(Secure and Efficient Encryption-based Erasure via Ransomware)について述べる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:58:06 GMT)
DisTaC: Conditioning Task Vectors via Distillation for Robust Model Merging [1.3] 統合プロセスには特に2つの要因がある。タスクベクトルノルムの格差と、ソースモデルの信頼性の低さである。
本稿では,これらの問題のあるタスクベクトルをマージ前にプリコンディションする新しい手法であるDisTaCを提案する。
本研究では, DisTaC を用いたタスクベクトルのプレコンディショニングにより, 有害な特性を示すモデルの統合に成功できることを実証した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 02:13:50 GMT)
Human-Robot Red Teaming for Safety-Aware Reasoning [1.3] 安全を意識した推論のためのヒューマンロボット・レッド・チーム・パラダイムを提案する。
人間とロボットが協力して、環境に関する仮定に挑戦し、起こりうる危険の空間を探索することを期待しています。
この調査により、ロボットは、特にハザード識別、リスクアセスメント、リスク軽減、安全報告など、安全を意識した推論を行うことができる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 00:55:09 GMT)
Cryptocurrency Price Forecasting Using Machine Learning: Building Intelligent Financial Prediction Models [1.3] 本稿では,VVR(Volume-to-Volatility Ratio)とVWAP(Volume-Weighted Average Price)の2つの重要な流動性プロキシ指標を紹介する。
これらの指標は市場の安定性と流動性を明確に理解し、最終的に価格予測の精度を向上します。
当社の調査結果は、米国のデジタル資産市場で、トレーダーやデベロッパーがより賢くリスクに配慮した戦略を創り出そうとする上で貴重な洞察を提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:54:41 GMT)
The Homogenizing Effect of Large Language Models on Human Expression and Thought [1.2] このレビューは言語学、認知学、コンピュータ科学にまたがる証拠を合成し、大きな言語モデル(LLM)が支配的なスタイルをどのように反映し、強化するかを示す。
トレーニングデータにおけるパターンのミラーリングによって,その設計と普及が,この効果にどのように寄与するかを検討する。
確認されていないが、この均質化は、集団知性と適応性を促進する認知的景観をフラットにするリスクがある。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:22:25 GMT)
Erbium-Doped Fibre Quantum Memory for Chip-Integrated Quantum-Dot Single Photons at 980 nm [1.2] InAsP/InPナノワイヤ量子ドット(QD)とガラス繊維(エルビウムドープファイバ、EDF)にドープされたEr$3+$イオンに基づく固体QMとの間のコヒーレントなハイブリッド光物質界面を初めて実験的に実現した。
InAsP/InPナノワイヤQDの発光スペクトルは、低温下でのEDFの吸収帯域幅980nmと一致し、2つの系間の効率的な相互作用を可能にする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:48:58 GMT)
Generalisation Bounds of Zero-Shot Economic Forecasting using Time Series Foundation Models [1.1] 本研究では,時系列基礎モデルのマクロ経済指標に対するゼロショット予測能力について検討した。
データスカース条件と構造破壊の下で、最先端の3つのTSFMをバックテストしました。
この結果から, TSFMは微調整がなければ, 安定した経済環境下での古典的モデルに適合し, 超過することができることが示唆された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:52:49 GMT)
Predicting EGFR Mutation in LUAD from Histopathological Whole-Slide Images Using Pretrained Foundation Model and Transfer Learning: An Indian Cohort Study [1.0] 肺腺癌 (LUAD) は非小細胞肺癌(NSCLC)の亜型である
EGFR遺伝子変異を有するLUADは、LUAD症例の約46%を占める。
AIモデルの最近の進歩は、がんの検出と分類において有望な結果を示している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:57:16 GMT)
Effects of Feature Correlations on Associative Memory Capacity [1.0] 我々は,データ構造がキャパシティ・ダイナミクスに与える影響を分析するための経験的枠組みを開発した。
実験により、メモリ容量は入力空間の分離の増加とともに指数関数的にスケールすることを確認した。
我々の発見は、DAMの理論的作業と実践的な設定を橋渡しし、よりデータ中心の手法を刺激する可能性がある。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:03:01 GMT)
Bridging LLMs and Symbolic Reasoning in Educational QA Systems: Insights from the XAI Challenge at IJCNN 2025 [1.0] 本稿では,Ho Chi Minh City University of Technology (HCMUT) と International Workshop on Trustworthiness and Reliability in Neurosymbolic AI (TRNS-AI) が共同で主催するハッカソン型コンペであるXAI Challenge 2025を総合的に分析する。
この課題は、学生が大学政策に関する質問に回答し、明確な論理に基づく自然言語の説明を生成できる質問応答システム(QA)の構築を参加者に委ねた。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:46:06 GMT)
In situ Al2O3 passivation of epitaxial tantalum and aluminum films enables long-term stability in superconducting microwave resonators [1.0] 超伝導マイクロ波共振器の長期安定性は、スケーラブルな量子技術に不可欠である。
超高真空下でのAl2O3のその場堆積により保護されたエピタキシャルタンタル膜とアルミニウム膜から作製したマイクロストリップ共振器の優れた安定性を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:05:32 GMT)
Foundation Models for Bioacoustics -- a Comparative Review [0.9] 本稿では, 生体音響基礎モデルについて, モデルアーキテクチャ, 事前学習計画, 訓練パラダイムなどの設計決定を徹底的に分析して検討する。
BEANSおよびBirdSetベンチマークから,分類タスクの選択基盤モデルを評価する。
総合的な実験分析の結果,BirdSetベンチマークでは,大規模鳥の鳴き声データに基づく自己指導による学習が最高の成績を収めていることが明らかとなった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:15:16 GMT)
Class-Wise Federated Averaging for Efficient Personalization [0.8] フェデレートラーニング(FL)は、データを集中することなく、分散クライアント間で協調的なモデルトレーニングを可能にする。
我々は,各クラスに対してフェデレート平均化を行う新しいパーソナライズされたFL(PFL)フレームワークである,クラスワイドフェデレーション平均化(cwFedAvg)を提案する。
Weight Distribution Regularizer (WDR) も提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:10:56 GMT)
UEChecker: Detecting Unchecked External Call Vulnerabilities in DApps via Graph Analysis [0.8] 脆弱性は、呼び出しの結果を検証せずに、コントラクトが外部プロトコルとやりとりするときに発生する。
コールグラフとグラフ畳み込みネットワークを利用して,外部のコール脆弱性を検出する,ディープラーニングベースのツールであるUECheckerを提案する。
608DAppのスマートコントラクトを監査した結果,未確認外部呼び出しの脆弱性の検出において,当社のツールが87.59%の精度を実現していることがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:40:17 GMT)
NATLM: Detecting Defects in NFT Smart Contracts Leveraging LLM [0.8] NFTスマートコントラクトの潜在的な欠陥を検出するために,NATLMというフレームワークを提案する。
このフレームワークは、NFTスマートコントラクトの4つの一般的な脆弱性を効果的に識別する。
実験の結果、NATLMは8,672個のNFTスマートコントラクトを分析し、全体の精度は87.72%、リコールは89.58%、F1スコアは88.94%に達した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:56:27 GMT)
MultiCFV: Detecting Control Flow Vulnerabilities in Smart Contracts Leveraging Multimodal Deep Learning [0.8] 多くのスマートコントラクトには脆弱性やエラーが含まれており、ブロックチェーン内のアセットが失われている。
本稿では,誤制御フローの脆弱性を分析し,検出するためのマルチモーダル深層学習手法であるMultiCFVを提案する。
実験により,本手法は構造情報,構文情報,意味情報を効果的に組み合わせ,スマートコントラクトの脆弱性検出とクローン検出の精度を向上することを示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:49:41 GMT)
Blockchain security based on cryptography: a review [0.8] 本稿では,暗号の観点からブロックチェーンに対する攻撃を分析することを目的とする。
ブロックチェーンの6層アーキテクチャに基づいて、データ層、ネットワーク層、コンセンサス層、コントラクト層、インセンティブ層、アプリケーション層に対する攻撃を分析する。
攻撃を緩和または抵抗する手法が提案されている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:24:37 GMT)
Hybrid quantum-classical framework for Betti number estimation with applications to topological data analysis [0.8] トポロジカルデータ解析(TDA)は、代数的トポロジの技法を応用し、大規模データからロバストな特徴を抽出する急速に成長する分野である。
TDAにおける重要なタスクは、(正規化された)ベッチ数の推定であり、これは重要な位相不変量を取得する。
古典的資源と量子的資源を組み合わせて、単純複素数のベッチ数をより効率的に推定する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:19:11 GMT)
AI-Driven Cybersecurity Threat Detection: Building Resilient Defense Systems Using Predictive Analytics [0.7] 本研究では、人工知能が米国のサイバー脅威の特定と緩和にどのように役立つかを検討する。
侵入検知、マルウェア分類、フィッシング検出、およびインサイダー脅威分析について調べる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:03:35 GMT)
GraphVSSM: Graph Variational State-Space Model for Probabilistic Spatiotemporal Inference of Dynamic Exposure and Vulnerability for Regional Disaster Resilience Assessment [0.7] GraphVSSM(Graph Variational-Space Model)は、グラフ深層学習、状態空間モデリング、変分推論を統合する新しいモジュラーアプローチである。
フィリピンのケソン市における都市全体の実演, ククル海岸地域社会(バングラデシュ)の急激な変化, および泥すべりの影響を受けたフリータウン(シエラレオネ)について検討した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 10:49:30 GMT)
Generative AI-Driven Decision-Making for Disease Control and Pandemic Preparedness Model 4.0 in Rural Communities of Bangladesh: Management Informatics Approach [0.7] バングラデシュの農村部は深刻な医療障害に直面している。
これらの障害は、効果的な疾患管理とパンデミックの準備を妨げる。
この研究は、辺境化した農村住民の健康回復力とパンデミックの準備は、AIによる局所的な疾病管理戦略によって改善できると結論付けている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 01:54:16 GMT)
Classifying Epistemic Relationships in Human-AI Interaction: An Exploratory Approach [0.7] 本研究は,研究と教育の文脈において,ユーザがAIをどのように評価し,信頼し,協力するかを調査する。
専門分野にまたがる31人の学者へのインタビューをもとに、5つのパートのコードブックを作成し、5つの関係タイプを特定した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:41:28 GMT)
Privacy-Enhanced Adaptive Authentication: User Profiling with Privacy Guarantees [0.7] 本稿では,プライバシ強化型アダプティブ認証プロトコルを提案する。
リアルタイムリスクアセスメントに基づいて認証要求を動的に調整する。
CCPAなどのデータ保護規則を遵守することにより,セキュリティを向上するだけでなく,ユーザの信頼も向上する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:02:58 GMT)
OpenLambdaVerse: A Dataset and Analysis of Open-Source Serverless Applications [0.6] OpenLambdaVerseは、1つ以上のLambda関数を含むアプリケーションでServerless Frameworkを使用するGitHubリポジトリのデータセットである。
現在のアプリケーションのサイズや複雑さ、採用言語や言語、機能がどのように起動されるか、プロジェクトの成熟度、セキュリティプラクティスについて、重要な洞察を得ています。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:30:01 GMT)
An Analysis of HPC and Edge Architectures in the Cloud [0.6] 私たちは最近、AWS上にデプロイされた396の現実世界のクラウドアーキテクチャのデータセットを分析しました。
このデータセットから、HPCやエッジコンポーネントを含むアーキテクチャを特定し、それらの設計を特徴付ける。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:32:02 GMT)
Non-Markovian N-spin chain quantum battery in thermal charging process [0.5] エルゴトロピーは量子電池の性能を評価する重要な指標である。
マイクロキャビティに埋め込まれたNスピン鎖からなる非マルコフ型QBにおけるエルゴトロピーダイナミクスについて検討した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:38:09 GMT)
Embedding-Enhanced Probabilistic Modeling of Ferroelectric Field Effect Transistors (FeFETs) [0.5] FeFETはメモリとロジック技術の進歩に強い可能性を秘めているが、その固有のランダム性は正確で信頼性の高いモデリングに重大な課題をもたらす。
既存の決定論的および機械学習ベースのコンパクトモデルは、しばしばこの変動の完全な範囲を捉えない。
本稿では,これらの制約に対処するFeFETの確率的モデリングフレームワークについて述べる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:20:31 GMT)
Theory of quantum comb enhanced interferometry [0.5] 量子コムを設計・解析する理論を開発し,双対コム干渉計測に着目する。
我々の分析では、分割受信機とヘテロダイン受信機による量子コムの圧縮と絡み合いの両方をカバーし、スクイーズ/絡み合い強度でスケーラブルな量子アドバンテージを持つ4つのプロトコルを導いた。
このような、スケーラブルな量子優位性のロス・ロバスト性は、従来の量子センシングプロトコルには見出されていない。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:46:00 GMT)
BAR Conjecture: the Feasibility of Inference Budget-Constrained LLM Services with Authenticity and Reasoning [0.4] LLMサービスの3つの特性を同時に最適化するモデルは存在しないと我々は主張する。
LLMアプリケーション設計のための原則的フレームワークであるThe BAR Theoremを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:05:26 GMT)
Recovering Individual-Level Activity Sequences from Location-Based Service Data Using a Novel Transformer-Based Model [0.4] 位置情報ベースのサービス(LBS)データは、人間の移動性に関する重要な洞察を提供するが、その空間性はしばしば不完全な旅行と活動シーケンスをもたらす。
そこで本研究では,VSNIT (Variable Selection Network-Fuused Insertion Transformer) を新たに提案し,不完全な動作シーケンスの欠落セグメントを復元する手法を提案する。
結果は、VSNITがより多様で現実的なアクティビティパターンを挿入し、現実世界の多様性をより密にマッチングし、破壊されたアクティビティ遷移をターゲットとより効果的に整合させることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 00:33:18 GMT)
Zero-shot Segmentation of Skin Conditions: Erythema with Edit-Friendly Inversion [0.3] 本研究は, 拡散モデルにおける編集フレンドリーな逆転を用いたエロテマ(皮膚の赤み)の検出のためのゼロショット画像分割フレームワークを提案する。
この方法は、生成的編集により、エリスマのない同一患者の参照画像を合成し、これらの参照を元の画像と正確に整合させる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:00:35 GMT)
Showcasing standards and approaches for cybersecurity, safety, and privacy issues in connected and autonomous vehicles [0.2] 本稿では、リスクアセスメント(RA)と脅威モデリング(TM)に関して、コネクテッド・自動運転車(CAV)におけるサイバーセキュリティ、安全、プライバシの懸念を橋渡しすることを目的とする。
我々は、自動車設定によって生じるような複雑な攻撃面に取り組むためのRAおよびTM研究における最新の標準とアプローチを強調した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 05:45:50 GMT)
Prototype Learning to Create Refined Interpretable Digital Phenotypes from ECGs [0.2] プロトタイプベースのニューラルネットワークは、トレーニングデータに固定された学習された代表的な信号パターンと入力を比較して解釈可能な予測を提供する。
PTB-XLデータセットを用いた多ラベルECG分類のためのプロトタイプベースディープラーニングモデルを用いる。
分類専用に訓練された個別の試作機がフェーコード形式での退院診断に関連があるかどうかを評価する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:52:08 GMT)
Enhancing AI System Resiliency: Formulation and Guarantee for LSTM Resilience Based on Control Theory [0.2] 我々は,LSTMが異常入力後に正常状態に戻るために必要な時間を定量化するために,新たな回復時間(recovery time)をレジリエンスの指標として導入する。
簡易モデルを用いた実験により, レジリエンス推定と制御手法の有効性が示された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:52:33 GMT)
VerificAgent: Domain-Specific Memory Verification for Scalable Oversight of Aligned Computer-Use Agents [0.2] 未確認の記憶は、ユーザの意図や安全性の制約から逸脱することがある。
CUAのためのスケーラブルな監視フレームワークであるVerificAgentを紹介する。
VerificAgentはタスクの信頼性を改善し、幻覚による障害を低減し、解釈可能な監査可能なガイダンスを保持する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:56:27 GMT)
Who Gets Cited? Gender- and Majority-Bias in LLM-Driven Reference Selection [0.2] 本研究では,大規模言語モデル(LLM)における性別バイアスを系統的に研究する。
以上の結果から,男性による基準に対する永続的嗜好と,候補プールにおいてどの性別が一般的であるかを優先する多数派偏見の2つの形態が明らかとなった。
以上の結果から, LLMは学術的認識において, 既存の男女不均衡を補強・悪化させることができることが示唆された。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:27:32 GMT)
SpINRv2: Implicit Neural Representation for Passband FMCW Radars [0.2] 本研究では,周波数変調連続波レーダを用いた高忠実度ボリューム再構成のためのニューラルネットワークSpINRv2を提案する。
我々のコアコントリビューションは、クローズドフォーム合成を用いて複雑なレーダ応答をキャプチャする、完全微分可能な周波数領域フォワードモデルである。
細かな範囲の解像度で生じる曖昧なサブビンの曖昧さを解消するために、スパーシリティと正規化を導入する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 00:51:31 GMT)
Think Broad, Act Narrow: CWE Identification with Multi-Agent Large Language Models [0.1] 近年,脆弱性検出のための機械学習と大規模言語モデル (LLM) が注目されている。
セキュリティの弱点(CWE)を特定するための新しいマルチエージェントLCM手法を提案する。
PrimeVulデータセットでは、研究対象の脆弱性関数の40.9%で適切なCWEを正しく識別する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:57:46 GMT)
pySLAM: An Open-Source, Modular, and Extensible Framework for SLAM [0.0] pySLAMは、Visual SLAMのためのオープンソースのPythonフレームワークである。
モノクロ、ステレオ、RGB-Dカメラの入力をサポートする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:23:35 GMT)
Win-k: Improved Membership Inference Attacks on Small Language Models [0.0] 小型言語モデル(SLM)におけるMIA(Message Inference attack)について検討する。
我々は、最先端攻撃(min-k)の上に構築されたwin-kと呼ばれる新しいMIAを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:50:42 GMT)
Video-based Vehicle Surveillance in the Wild: License Plate, Make, and Model Recognition with Self Reflective Vision-Language Models [0.0] 自動ナンバープレート認識(ALPR)のための大規模視覚言語モデル(VLM)の可能性について検討する。
提案したナンバープレート認識パイプラインフィルタをシャープフレームに送信し,複数のプロンプト戦略を用いてマルチモーダルプロンプトをVLMに送信する。
テキサス大学オースティン校のキャンパスで収集されたスマートフォンのデータセットの実験では、ALPRが91.67%、メイクとモデル認識が66.67%というトップ1の精度を達成した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:34:19 GMT)
Unitary Gate Synthesis via Polynomial Optimization [0.0] 量子最適制御は、量子技術の発展において重要な役割を果たす。
マグナス展開を用いてゲートを合成する手法を提案する。
我々は,計算効率を向上しつつ,QCPOPの精度を維持していることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:11:21 GMT)
TrajFlow: A Generative Framework for Occupancy Density Estimation Using Normalizing Flows [0.0] 本稿では,動的エージェントの占有密度を推定するための生成フレームワークを提案する。
本フレームワークは因果エンコーダを用いて,観察された軌跡の意味的に意味のある埋め込みを抽出する。
本稿では,この枠組みの実装として,神経微分方程式を基礎とした新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:43:48 GMT)
The Cognitive Foundations of Economic Exchange: A Modular Framework Grounded in Behavioral Evidence [0.0] 初期の人間社会からの証拠は、互恵性はバーターではなく基礎的な経済論理であったことを示唆している。
認知的プリミティブに基づく最小限の行動枠組みを導入する。
このフレームワークは、人間と人工両方のシステムの信頼、調整、経済行動のモデリングのための統一された基盤を提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:08:09 GMT)
TeSent: A Benchmark Dataset for Fairness-aware Explainable Sentiment Classification in Telugu [0.0] インド亜大陸では、テルグ語はインドの6つの古典言語の一つである。
全世界で9900万の話者ベースを抱えるTeluguは、グローバルなNLPと機械学習の世界では、いまだに不足している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:42:37 GMT)
Squeezed gravitons from superradiant axion fields around rotating black holes [0.0] 回転する(ケラー型)ブラックホール (BH) を取り巻く超放射性陽イオン雲による重力状態の新たな天体物理源である3+1次元時空について提案する。
軸索の特定の微視的起源は、質量が大きければ重要ではない。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:34:59 GMT)
Spectroscopy of drive-induced unwanted state transitions in superconducting circuits [0.0] マイクロ波駆動は超伝導量子回路における制御および読み出し操作の実装に不可欠である。
9GHz帯のマイクロ波駆動を受ける固定周波数キュービットにおける不要な状態遷移について検討する。
本研究は、これらの遷移を包括的に分類し、駆動周波数の情報選択による緩和戦略と回路設計の改善を提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:36:41 GMT)
Some mathematical issues regarding a new approach towards quantum foundations [0.0] 最も弱い可能性定理は、量子論のヒルベルト空間形式論の基礎を与えるものである。
ベル実験や決定理論へのいくつかの応用について概説する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 08:11:04 GMT)
ShrutiSense: Microtonal Modeling and Correction in Indian Classical Music [0.0] インドの古典音楽は22シュルーティス(ピッチ間隔)の洗練されたマイクロトンシステムに依存している
既存のシンボリック・ミュージック・プロセッシング・ツールでは、これらのマイクロトナーの区別や文化的に特有のラガの文法を説明できない。
インド古典音楽のための総合的な記号ピッチ処理システムであるShrutiSenseを紹介する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:42:47 GMT)
RinQ: Predicting central sites in proteins on current quantum computers [0.0] RinQはタンパク質の機能的に重要な残基を同定するためのハイブリッド量子古典的枠組みである。
この研究は、タンパク質ネットワーク分析を進めるための、短期的な量子および量子に触発された手法の可能性を強調している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 21:53:09 GMT)
Relation-Aware LNN-Transformer for Intersection-Centric Next-Step Prediction [0.0] 市内の道路横断グラフ上に道路利用者軌道を表す道路ノード中心の枠組みを導入する。
これらのキューと構造グラフの埋め込みを組み合わせることで、意味的に基底化されたノード表現が得られる。
我々のモデルは6つの最先端のベースラインを最大17ポイントの精度で1ホップで、MRRで10ポイントの精度で上回ります。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:47:12 GMT)
Regression Augmentation With Data-Driven Segmentation [0.0] 不均衡回帰は、ターゲット分布が歪んだときに発生し、モデルが密度の高い領域に集中し、表現不足の(マイノリティ)サンプルと競合する原因となる。
本稿では,Mahalanobis-Gaussian Mixture Modeling (GMM) を用いて,マイノリティサンプルの自動同定を行う,完全なデータ駆動型GANベースの拡張フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:12:11 GMT)
Reconstructing Trust Embeddings from Siamese Trust Scores: A Direct-Sum Approach with Fixed-Point Semantics [0.0] 本研究では,多くの分散セキュリティフレームワークが公開している1次元シームズ信頼スコアから高次元信頼埋め込みを再構築する逆問題について検討する。
合成ベンチマークのスイートは、ガウスノイズの存在下でも、回収された埋め込みはユークリッドとコサインの計測値によって測定されたデバイス間幾何学を保存することを確認している。
詳細な信頼スコアを公開することで、デバイスと評価モデルの両方に関する潜伏した行動情報が漏洩する可能性がある。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 20:19:22 GMT)
Quantum Algorithms for Gowers Norm Estimation, Polynomial Testing, and Arithmetic Progression Counting over Finite Abelian Groups [0.0] 有限アーベル群上のゴワーズノルム$Uk$を推定するための量子アルゴリズム群を提案する。
これらのアルゴリズムは、ガウワーズノルムに対する最近の逆定理と振幅推定を利用して高次相関を明らかにする。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:58:12 GMT)
Proof of quantum to classical transition for the center of mass of quantum many body systems [0.0] 量子力学の古典的極限は、多体系の質量の中心の研究に焦点をあてて研究される。
粒子の数が分散し、非常に一般的な仮定の下では、系の質量の中心がもはや量子力学によって記述されないかを研究する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 13:33:09 GMT)
Physics-Informed Neural Network Approaches for Sparse Data Flow Reconstruction of Unsteady Flow Around Complex Geometries [0.0] PINNは物理インフォームド機械学習(PIML)の分野である
PINNは流体力学における多種多様な前方および逆問題の解法として広く研究されている。
本研究は, (a) 円柱を過ぎる2次元非定常層流と (b) 超大型コンテナ船(ULCS)を過ぎる3次元非定常乱流の2例に焦点を当てた。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:06:19 GMT)
On the role of symmetry and geometry in global quantum sensing [0.0] グローバル量子センシングは、有限個の測定値を持つ任意の範囲にわたるパラメータ推定を可能にする。
事前の無知と非情報推定には、根本的に異なる2つの方法がある。
雑音条件下でのレートとコヒーレンス推定の関連例に2つの手法を適用する方法を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 00:11:41 GMT)
Nonequilibrium Critical Scaling of a Squeezing Phase Transition [0.0] ハイゼンベルクの限定的スクイーズを特徴とする集合相と,スケーラブルなスクイーズを伴う部分的集合相との遷移を見出した。
本研究は, 低温原子, 分子, ライドバーグプラットフォームにおける量子センシングおよび量子シミュレーションへの応用の可能性を考慮した新しい動的相転移を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 19:50:44 GMT)
NICE^k Metrics: Unified and Multidimensional Framework for Evaluating Deterministic Solar Forecasting Accuracy [0.0] NICEkフレームワーク(k = 1, 2, 3, Sigma)を導入する。
NICE1は平均エラーをターゲットとし、NICE2は大きなずれを強調し、NICE3は外れ値を強調し、NICESigmaは全部を組み合わせます。
スペインSIARネットワークの68局のモンテカルロシミュレーションとデータを用いて, 自己回帰モデル, 極端な学習, スマート永続性などの手法を評価した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:20:12 GMT)
MEGANet-W: A Wavelet-Driven Edge-Guided Attention Framework for Weak Boundary Polyp Detection [0.0] MEGANet-Wは、大腸ポリープ分割のためのウェーブレット駆動エッジガイドアテンションネットワークである。
指向性のあるパラメータフリーなHaarウェーブレットエッジマップをデコーダの各ステージに注入し、セマンティックな特徴を再検討する。
5つのパブリックなpolypデータセットで既存のメソッドを一貫して上回る。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:36:03 GMT)
Kernel-Based Sparse Additive Nonlinear Model Structure Detection through a Linearization Approach [0.0] 連続時間NLシステムモデルのクラスを単純化するためのデータ駆動型アプローチを提案する。
スパース加法NLモデルでは,NLサブター数とその対応する入力空間を同定する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:02:44 GMT)
Inferring processes within dynamic forest models using hybrid modeling [0.0] 森林間隙モデルとディープニューラルネットワーク(DNN)を組み合わせたハイブリッドモデリング手法であるフォレストインフォームドニューラルネットワーク(FINN)を紹介する。
我々は,成長過程をDNNに置き換えることで,FINNの完全な機械的バージョンと比較して,予測性能と継承軌道が向上することを示した。
結論として,我々の新しいハイブリッド・モデリング・アプローチは,データから森林動態を推定し,前例のない環境変化下での生態系の軌道予測を改善するための汎用的な機会を提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:46:37 GMT)
Impact of quantum coherence on the dynamics and thermodynamics of quenched free fermions coupled to a localized defect [0.0] 本研究では,非平衡量子力学と自由フェルミオンの熱力学を,高調波トラップの局所的欠陥に突如結合して検討する。
エネルギー固有状態のコヒーレントな重ね合わせにおける系の初期化は、非古典的特徴をもたらすことを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 17:21:19 GMT)
Idempotent Equilibrium Analysis of Hybrid Workflow Allocation: A Mathematical Schema for Future Work [0.0] 大規模なAIシステムは、仕事をどのように人と機械に分割するかを変えようとしている。
我々は、この位置を反復的タスクデリゲーション写像として定式化し、その過程が安定な等等均衡に収束することを示す。
我々は、「センタウル」な人間とAIの連携を促進する政策は、福祉を最大化する固定点に向けて経済を操ることができると論じる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:28:34 GMT)
Half-life Measurements of Highly Charged Radioisotopes by Nuclear Recoil in a Penning Trap [0.0] ペニングイオントラップを用いた非破壊核再コイル検出による高電荷放射性同位体の半減期測定法を提案する。
特定の重点は$rm 7Be3+$に置かれ、恒星の進化と太陽ニュートリノの生成に重要な役割を果たしている。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:18:28 GMT)
Fusion Sampling Validation in Data Partitioning for Machine Learning [0.0] 本研究では、単純なランダムサンプリング(SRS)とK-Fold Cross-Validation(KFCV)を組み合わせたハイブリッドモデルFusion Smpling Validation(FSV)を提案する。
FSVは、バイアスを最小化し、SRSとKFCVの精度をマージすることを目的としている。
データパーティショニング、特にリソース制約のある環境では、精度と信頼性が優れていた。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 11:32:47 GMT)
From Taylor Series to Fourier Synthesis: The Periodic Linear Unit [0.0] 周期的非単調性を持つ学習可能な正弦波に基づくアクティベーションである周期線形ユニット(PLU)を導入する。
2つのニューロンのみによる最小限の活性化は、標準的なアクティベーションを用いた等価ネットワークでは不可能なスパイラル分類タスクを解くことができることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 03:26:48 GMT)
Exploitation Is All You Need... for Exploration [0.0] 実験対象を最大化するために訓練されたエージェントは, にもかかわらず, 創発的な探索行動を示すことができることを示す。
適切な前提条件の下では、探索と搾取は目的として扱われる必要はないが、統一的な報酬-最大化プロセスから生まれる可能性がある。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:42:59 GMT)
Entropic Fluctuations in Statistical Mechanics II. Quantum Dynamical Systems [0.0] 我々は、エバンス・サールズゆらぎ定理のいくつかの可能な拡張を量子系に考慮し、比較する。
モジュラー理論は古典的な位相空間収縮率の概念を量子領域に拡張する方法を提供する。
得られた結果は、量子統計力学におけるエントロピー変動の性質に新たな光を当てた。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:47:50 GMT)
Entanglement patterns of quantum chaotic Hamiltonians with a scalar U(1) charge [0.0] 多体ハミルトニアンにおける固有状態アンサンブルの統計的挙動を正確に記述できることが示される。
本研究は, 空間的局所性が, 容積法則を超えた普遍的特徴を記述する上で果たす重要な役割を強調した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:09:25 GMT)
Entanglement in Elastic Electron Scattering: Perturbation theory misses fundamental aspects of Bragg scattering [0.0] 弾性電子散乱は、原子スケールで材料を研究する主要な手段の1つである。
プローブビームと試料の相互作用が両システム間の絡み合いをもたらすことを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 14:26:05 GMT)
Enhanced Gravity-Induced Entanglement via Squeezed Input Light under Finite Measurement Time [0.0] 圧縮された入力光は、機械的条件下での光学ノイズを低減し、GIEを向上させることを実証する。
圧縮された入力光を使用する場合、SNR=1を達成するには106 sの総測定時間が必要であるのに対し、106.8 sは圧縮された入力光を使わずに必要である。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:09:36 GMT)
End-to-End Personalization: Unifying Recommender Systems with Large Language Models [0.0] グラフ注意ネットワーク(GAT)と大言語モデル(LLM)を組み合わせた新しいハイブリッドレコメンデーションフレームワークを提案する。
LLMは、タイトル、ジャンル、概要などのメタデータに基づいて意味的に意味のあるプロファイルを生成することによって、ユーザーとアイテムの表現を豊かにするために最初に使用される。
MovieLens 100kと1Mを含むベンチマークデータセットでモデルを評価し、強いベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:46:50 GMT)
Embracing Dynamics: Dynamics-aware 4D Gaussian Splatting SLAM [0.0] D4DGS-SLAMは動的環境に対する4DGSマップ表現に基づく最初のSLAM法である。
提案手法は,カメラのポーズトラッキングとマップの品質の両方において,最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 06:44:17 GMT)
Diagnosing chaos in a periodically driven Ising model with a ramping field via out-of-time-order correlation saturation [0.0] 時間外順序付き相関器(OTOC)の動的領域は、古典的および半古典的システムにおけるカオスの強力な指標となる。
線形に傾斜する横磁場を受ける時間依存のイジングスピン系を解析する。
傾斜場強度の増大は,OTOCの飽和領域における振動の周波数の抑制につながることがわかった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:34:21 GMT)
Defending Against Beta Poisoning Attacks in Machine Learning Models [0.0] 機械学習(ML)モデルのトレーニングデータセットを敵に操作する攻撃は、MLセキュリティに重大な脅威をもたらす。
我々は,kNN Proximity-Based Defense (KPB), Neighborhood Class Comparison (NCC), Clustering-Based Defense (CBD), Mean Distance Threshold (MDT)の4つの防衛戦略を提案する。
MNISTとCIFAR-10データセットを用いた実験的評価では、KPBとMDTは完全な精度とF1スコアを達成でき、CBDとNCCは強力な防御能力も提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:13:10 GMT)
Counterdiabatic Route to Entanglement Steering and Dynamical Freezing in the Floquet Lipkin-Meshkov-Glick Model [0.0] この研究は、反断熱駆動(CD)が、長い時間、絡み合った軌道に沿って集合スピン系を操る強力なツールであることを示した。
CD駆動は、各駆動サイクルの中間点においてスピンスクイーズとそれに関連するメロジカルに有用なマルチパーティント絡みを発生させる。
我々の研究は、集合スピン系におけるフロケット加熱と絡み合いの発生を回避するための新しい経路を開く。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:21:04 GMT)
Classification of Brain Tumors using Hybrid Deep Learning Models [0.0] 本研究は, より少ないトレーニングサンプルを用いて, 強い分類性能を達成するために伝達学習を適用した。
その結果,EfficientNetV2は他のモデルに比べて優れた性能を示した。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 12:56:18 GMT)
Categorical Construction of Logically Verifiable Neural Architectures [0.0] ニューラルネットワークはパターン認識に優れるが、信頼できる論理的推論に苦しむ。
我々は、証明可能な論理的保証を持つニューラルネットワークを体系的に構築する分類的枠組みを開発する。
このフレームワークは信頼できるAIシステムのための数学的基盤を提供し、定理証明、形式的検証、そして検証可能な論理的振る舞いを必要とする安全クリティカルな推論タスクへの応用を提供する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 04:30:05 GMT)
Canoe Paddling Quality Assessment Using Smart Devices: Preliminary Machine Learning Study [0.0] 毎年2200万人以上のアメリカ人がパドル関連活動に参加しており、2020年の世界のパドルスポーツ市場は24億ドルと評価されている。
その人気にもかかわらず、このスポーツは機械学習(ML)の統合が限られており、コーチングと特殊装備のコストによって妨げられている。
本研究では、動きデータに基づいて訓練されたMLモデルを使用し、大言語モデル(LLM)を介してストロークフィードバックを提供する、AIベースの新しいコーチングシステムを提案する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:42:19 GMT)
Can Memory-Augmented LLM Agents Aid Journalism in Interpreting and Framing News for Diverse Audiences? [0.0] MADESは、社会的コミュニケーションをシミュレートするために設計されたエージェントベースのフレームワークである。
我々は、その反復的な議論プロセスを通じて、ニュースコンテンツ内の混乱と誤解を識別する。
以上の結果から, エージェントは補充資料を受け取った後, ニュース理解を著しく改善したことが明らかとなった。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:21:23 GMT)
BioDisco: Multi-agent hypothesis generation with dual-mode evidence, iterative feedback and temporal evaluation [0.0] 既存の自動化手法は、斬新で根拠に基づく仮説を生成するのに苦労している。
BioDiscoは言語モデルに基づく推論とデュアルモードエビデンスシステムに基づくマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 09:32:52 GMT)
Asymptotically optimal joint phase and dephasing strength estimation using spin-squeezed states [0.0] 1軸スイッチングされたスピン圧縮状態を含む明示的な$N$-qubitプロトコルを示す。
プロトコルの関連性は、この特定のモデルを超えます。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 23:47:03 GMT)
ArzEn-MultiGenre: An aligned parallel dataset of Egyptian Arabic song lyrics, novels, and subtitles, with English translations [0.0] ArzEn-MultiGenreは、エジプトのアラビア語の歌詞、小説、テレビ番組のサブタイトルのパラレルデータセットで、手動で翻訳され、英語のサブタイトルと一致している。
データセットには25,557のセグメントペアが含まれており、新しい機械翻訳モデルのベンチマーク、数ショット設定で微調整された大きな言語モデル、Google Translateなどの商用機械翻訳アプリケーションへの適応に使用できる。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 15:28:41 GMT)
A machine learning approach to tomographic pattern generation and classification of quantum states of light [0.0] 我々はこの機械を訓練し、フォック状態、コヒーレント状態(CS)、および1光子付加CS(1$-PACS)のトモグラムを生成する。
生成した断層図から直接, 平均光子数, ばらつきおよび高次モーメントを抽出した。
本研究は、光学トモグラフィーを生成するために機械学習を用いることを実証する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 18:35:26 GMT)
A Reward-Directed Diffusion Framework for Generative Design Optimization [0.0] 本研究は, 高精度な工学設計を実現するため, 微調整拡散モデルと報酬指向サンプリングに基づく。
提案手法は, 訓練データ分布を超えるサンプルを生成し, 船体設計の抵抗率を25%以上低減し, 2次元翼設計のリフト・アンド・ドラッグ比を10%以上改善する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:19:02 GMT)
A Novel cVAE-Augmented Deep Learning Framework for Pan-Cancer RNA-Seq Classification [0.0] 本研究では,cVAE (class-conditional variational autoencoder) を用いて,パン・カンサー遺伝子発現分類のためのトレーニングデータを拡張する新しいディープラーニングフレームワークを提案する。
本稿では、VAEトレーニング曲線、性能指標(ROC曲線と混乱行列)、アーキテクチャ図など、詳細な実験結果を示す。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:57:31 GMT)
A Framework Combining 3D CNN and Transformer for Video-Based Behavior Recognition [0.0] 本稿では3D CNNとTransformerアーキテクチャを組み合わせたハイブリッドフレームワークを提案する。
3D CNNモジュールは低レベルの時間的特徴を抽出し、Transformerモジュールは長期の時間的依存関係をキャプチャする。
提案モデルは従来の3D CNNやスタンドアロンのトランスフォーマーよりも優れており、高い認識精度と管理可能な複雑さを実現している。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 07:33:29 GMT)
A Conjecture on a Fundamental Trade-Off between Certainty and Scope in Symbolic and Generative AI [0.0] 論文では、AIシステムにおける証明可能な正しさと広範なデータマッピング能力の基本的なトレードオフを定式化する予想を紹介している。
この暗黙のトレードオフを明確化し、厳密な検証にオープンにすることで、この予想は、エンジニアリングの野望とAIに対する哲学的な期待の両方を大きく変えた。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 22:20:53 GMT)
A Causal Model of the Hydrogen Atom -- New Electron Orbits [0.0] 我々は水素原子の因果モデルの詳細を開発する。
角運動量測定の因果モデルとEPR実験に焦点をあてる。
我々は、電子軌道、角運動量、量子ポテンシャルの関係を詳細に研究する。
論文参考訳(メタデータ) (Sat, 02 Aug 2025 16:41:15 GMT)