Large-Scale AI in Telecom: Charting the Roadmap for Innovation, Scalability, and Enhanced Digital Experiences [212.6] 大型通信モデル(LTM)は、現代の通信ネットワークが直面する複雑な課題に対処するために設計されたAIモデルである。
本稿は、LTMのアーキテクチャとデプロイメント戦略から、ネットワーク管理、リソース割り当て、最適化における彼らのアプリケーションまで、幅広いトピックについて論じる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:53:24 GMT)
On the Challenges and Opportunities in Generative AI [158.0] 私たちは、現在の大規模な生成AIモデルは、ドメイン間で広く採用されるのを妨げるいくつかの根本的な欠点を示しています。
我々は、研究者に実りある研究の方向性を探るための洞察を提供することを目標とし、より堅牢でアクセスしやすい生成AIソリューションの開発を促進する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:29:41 GMT)
Shh, don't say that! Domain Certification in LLMs [124.6] 大きな言語モデル(LLM)は狭いドメインで制約されたタスクを実行するためにしばしばデプロイされる。
ドメイン認証は、言語モデルのドメイン外動作を正確に特徴付ける保証である。
次に, 逆境界を証明として提供するVALIDを, 単純かつ効果的なアプローチとして提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:49:11 GMT)
Underlying Semantic Diffusion for Effective and Efficient In-Context Learning [113.4] Underlying Semantic Diffusion (US-Diffusion)は、セマンティック学習、計算効率、文脈内学習能力を高める拡張拡散モデルである。
本稿では,フィードバック信号を利用したフィードバック支援学習(FAL)フレームワークを提案する。
また,高雑音レベルの時間ステップで高密度サンプリングを行うためのプラグイン・アンド・プレイの効率的なサンプリング戦略(ESS)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:06:22 GMT)
DSPNet: Dual-vision Scene Perception for Robust 3D Question Answering [107.0] 3次元質問回答(3D QA)では、テキストによって記述された位置の3Dシーンを理解し、周囲の環境を判断し、その状況下での質問に答える必要がある。
既存の手法は通常、純粋な3次元点雲からのグローバルなシーン認識に依存しており、マルチビュー画像からのリッチな局所テクスチャの詳細の重要性を見落としている。
本稿では,DSPNet(Dual-vision Scene Perception Network)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:32:56 GMT)
Nature Language Model: Deciphering the Language of Nature for Scientific Discovery [105.6] 基礎モデルは自然言語処理と人工知能に革命をもたらした。
本研究では,科学発見のためのシーケンスベース科学基盤モデルであるNatureLMを紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:34:23 GMT)
Token-Efficient Long Video Understanding for Multimodal LLMs [101.7] STORMは、イメージエンコーダとビデオLLMの間に専用のテンポラリエンコーダを組み込んだ、新しいアーキテクチャである。
我々は,STORMが様々な長いビデオ理解ベンチマークにおいて最先端の結果を達成することを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:17:38 GMT)
METAL: A Multi-Agent Framework for Chart Generation with Test-Time Scaling [100.3] 視覚言語モデル(VLM)をベースとした,効率的な自動チャート生成のためのマルチエージェントフレームワークを構築した。
グラフ生成のタスクを特殊エージェント間の反復的協調に分解するマルチエージェントフレームワークMETALを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:45:00 GMT)
LaVin-DiT: Large Vision Diffusion Transformer [100.0] LaVin-DiTは、20以上のコンピュータビジョンタスクを生成フレームワークで扱うために設計された、スケーラブルで統一された基盤モデルである。
視覚タスクの生成性能を最適化するための重要なイノベーションを紹介する。
このモデルは0.1Bから3.4Bのパラメータに拡張され、様々な視覚タスクにまたがる相当なスケーラビリティと最先端の性能を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:26:35 GMT)
Fundamental Limits of Hierarchical Secure Aggregation with Cyclic User Association [93.5] 階層的なセキュアな集約は、連合学習によって動機づけられる。
本稿では,各ユーザが連続する$B$のリレーに接続される循環型アソシエーションパターンを用いたHSAについて考察する。
本稿では、勾配符号化にインスパイアされた入力に対するメッセージ設計を含む効率的なアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:53:37 GMT)
Full-Duplex-Bench: A Benchmark to Evaluate Full-duplex Spoken Dialogue Models on Turn-taking Capabilities [93.1] FullDuplexBenchは、重要な会話動作を体系的に評価するベンチマークである。
音声対話のモデリングを推進し、よりインタラクティブで自然な対話システムの開発を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:59:16 GMT)
An Empirical Study on Eliciting and Improving R1-like Reasoning Models [90.5] RLトレーニングのスケーリングは、そのような推論モデルを実装するための中心的なテクニックとなっている。
我々のRLトレーニングアプローチはQwen2.5-32Bベースモデルを継続的に改善することを示した。
また、ツール操作の利用についても検討し、大きな推論モデルの推論性能を大幅に向上させることを見出した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:34:27 GMT)
MVGenMaster: Scaling Multi-View Generation from Any Image via 3D Priors Enhanced Diffusion Model [87.7] MVGenMasterは3Dプリエントで拡張された多視点拡散モデルであり,NVS(多目的なノベルビュー合成)タスクに対処する。
我々のモデルは、可変参照ビューとカメラポーズで条件付けられた100の新しいビューを生成できる、シンプルで効果的なパイプラインを特徴としている。
スケールアップデータセットを用いてモデルを強化するために,いくつかのトレーニングとモデル修正を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:45:21 GMT)
Robotic Control via Embodied Chain-of-Thought Reasoning [86.7] 学習したロボット制御ポリシーの鍵となる制限は、トレーニングデータの外部で一般化できないことである。
視覚言語行動モデル(VLA)に関する最近の研究は、大規模なインターネット事前学習型視覚言語モデルを使用することで、その堅牢性と一般化能力を大幅に向上させることができることを示した。
ロボットの動作を予測する前に、VLAに対して、計画、サブタスク、動作、視覚的接地機能について複数の推論を行うために、VLAに対してEmbodied Chain-of-Thought Reasoning (ECoT)を導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:29:03 GMT)
LeanAgent: Lifelong Learning for Formal Theorem Proving [85.4] フォーマルな定理証明のための新しい生涯学習フレームワークであるLeanAgentを紹介する。
LeanAgentは継続的に一般化し、拡張可能な数学的知識を改善します。
これは23のリーンリポジトリにわたる155の定理の正式な証明を生成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:20:32 GMT)
How Far Are We on the Decision-Making of LLMs? Evaluating LLMs' Gaming Ability in Multi-Agent Environments [83.8] GAMA($gamma$)-Benchは、マルチエージェント環境における大規模言語モデルのゲーム能力を評価するための新しいフレームワークである。
$gamma$-Benchは8つの古典ゲーム理論シナリオと、LSMの性能を評価するために特別に設計された動的スコアリングスキームを含んでいる。
以上の結果から, GPT-3.5は強い強靭性を示すが, 一般化性は限定的であり, Chain-of-Thoughtのような手法で拡張可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:58:23 GMT)
LLMs Can Generate a Better Answer by Aggregating Their Own Responses [83.7] 大きな言語モデル(LLM)はタスク間で顕著な機能を示しているが、複雑な問題に直面している場合、追加のプロンプト技術を必要とすることが多い。
この制限は、共通LLMポストトレーニング手順が差別的判断タスクの明示的な監督を欠いているという事実に起因している、と我々は主張する。
本稿では,モデルの識別機能を必要とせず,解答品質を向上させる手法である生成自己集合(GSA)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:25:43 GMT)
Learning to Generate Structured Output with Schema Reinforcement Learning [83.1] 本研究では,大規模言語モデル(LLM)の構造的生成能力について検討する。
最新のLLMはまだ有効な文字列を生成するのに苦労している。
我々のモデルでは、出力と下流の両方のタスクが大幅に改善されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:06:40 GMT)
ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models [79.9] 大型マルチモーダルモデル(LMM)は、画像の解釈において大きな欠点を示し、いくつかの手段によっては、小さな子供や動物よりも空間認知が劣っている。
我々は,現代フロンティアLMMでは不可能な,軽量な視覚推論ベンチマークであるZeroBenchを紹介する。
ZeroBench 上で 20 LMM の評価を行い,そのスコアは 0.0% であり,誤差を厳密に分析した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:45:33 GMT)
Benchmarking Reasoning Robustness in Large Language Models [76.8] 新規データや不完全データでは,性能が著しく低下することがわかった。
これらの結果は、厳密な論理的推論に対するリコールへの依存を浮き彫りにした。
本稿では,情報不足によって引き起こされる幻覚を利用して推論ギャップを明らかにする,Math-RoBと呼ばれる新しいベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:36:06 GMT)
SD-LoRA: Scalable Decoupled Low-Rank Adaptation for Class Incremental Learning [73.9] 基礎モデルによる継続的な学習は、シーケンシャルなタスクに取り組むための事前トレーニング中に得られた豊富な知識を活用するための有望なパラダイムとして現れてきた。
既存のプロンプトベースおよびローランク適応ベース(LoRAベース)メソッドでは、プロンプト/ローラプールの拡張や、以前のタスクのサンプルの保持がしばしば必要である。
クラスインクリメンタル学習のためのスケーラブルデカップリングLoRA(SD-LoRA)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:43:48 GMT)
What Are You Doing? A Closer Look at Controllable Human Video Generation [73.9] What Are You Doing?」は、人間の制御可能な画像とビデオの生成を評価するための新しいベンチマークである。
このビデオは、1,544本のキャプション付きビデオで構成されており、56の細かなカテゴリーで細かな収集と注釈付けがなされている。
制御可能な画像・映像生成における7つの最先端モデルの詳細な解析を行う。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:59:29 GMT)
OlympicArena: Benchmarking Multi-discipline Cognitive Reasoning for Superintelligent AI [73.8] 我々は,11,163のバイリンガル問題を含む,テキストのみとインターリーブされたテキストイメージのモダリティを紹介する。
これらの課題には、7つのフィールドと62の国際オリンピック大会にわたる幅広い規律が含まれており、データ漏洩について厳格に調査されている。
我々の評価によると、GPT-4oのような先進モデルでさえ、複雑な推論とマルチモーダル統合における現在のAI制限を反映して、全体的な精度は39.97%しか達成していない。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:55:25 GMT)
Continual Optimization with Symmetry Teleportation for Multi-Task Learning [73.3] マルチタスク学習(MTL)は、1つのモデルを用いて複数のタスクの同時学習を可能にする。
シンメトリ・テレポーテーション(COST)を用いた連続最適化に基づく新しい手法を提案する。
COSTは、競合の勾配を減らすために、損失ランドスケープに別の損失等価点を求める。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:58:09 GMT)
DoraemonGPT: Toward Understanding Dynamic Scenes with Large Language Models (Exemplified as A Video Agent) [73.1] 本稿では,LLMによる動的シーン理解のための包括的かつ概念的にエレガントなシステムであるドラモンGPTについて検討する。
質問/タスクのあるビデオが与えられた場合、DoraemonGPTは入力されたビデオをタスク関連の属性を格納するシンボリックメモリに変換することから始める。
我々は,DoraemonGPTの有効性を,3つのベンチマークといくつかのアプリ内シナリオで広範囲に評価した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:27:02 GMT)
Audio Flamingo 2: An Audio-Language Model with Long-Audio Understanding and Expert Reasoning Abilities [72.9] 本稿では,Audio Flamingo 2 (AF2),Audio-Language Model,LongAudioを紹介した。
AF2は、20以上のベンチマークで大規模なオープンソースおよびプロプライエタリモデルを上回る3Bパラメータの小さな言語モデルで、最先端のパフォーマンスを実現している。
音声理解を長い音声セグメント(30秒から5分)に拡張し、長い音声キャプションと質問応答タスクに基づいてALMをトレーニングするための大規模で斬新なデータセットであるLongAudioを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:10:26 GMT)
360$^\circ$REA: Towards A Reusable Experience Accumulation with 360° Assessment for Multi-Agent System [72.0] 評価フィードバックからの経験を総合的に評価し蓄積することは、システム性能を改善するための効果的なアプローチである、と我々は主張する。
企業組織の実践にインスパイアされた階層的なマルチエージェントフレームワークである360$circ$REA(360$circ$REA)による再利用可能なエクスペリエンス蓄積を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:54:37 GMT)
Enough Coin Flips Can Make LLMs Act Bayesian [71.8] 大規模言語モデル(LLMs)は、入力プロンプトで与えられた少数ショットの例を一般化する能力を示しており、これはICL(In-context Learning)として知られる創発的能力である。
我々は,ILCを用いてベイズフレームワークと整合性のある構造的推論を行うか,パターンマッチングに依存するかを検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:59:23 GMT)
Semi-Parametric Retrieval via Binary Bag-of-Tokens Index [71.8] SemI-parametric Disentangled Retrieval (SiDR)は、ニューラルパラメータから検索インデックスを分離するバイエンコーダ検索フレームワークである。
SiDRは、検索のための非パラメトリックトークン化インデックスをサポートし、BM25のようなインデックス化の複雑さを著しく改善した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:39:48 GMT)
Protein Large Language Models: A Comprehensive Survey [71.7] タンパク質特異的な大規模言語モデル(Protein LLMs)は、より効率的なタンパク質構造予測、機能アノテーション、設計を可能にすることで、タンパク質科学に革命をもたらしている。
この作業は、アーキテクチャ、データセットのトレーニング、評価メトリクス、さまざまなアプリケーションをカバーする、Protein LLMの最初の包括的な概要を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:14:45 GMT)
A conversion theorem and minimax optimality for continuum contextual bandits [70.7] 本研究では,学習者が側情報ベクトルを逐次受信し,凸集合内の行動を選択する,文脈連続帯域幅問題について検討する。
目標は、受信したコンテキストのすべての基盤関数を最小化することです。
サブ線形の静的な後悔を達成するアルゴリズムを拡張して、サブ線形の文脈的後悔を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:20:32 GMT)
LONGCODEU: Benchmarking Long-Context Language Models on Long Code Understanding [69.9] Long code understanding benchmark LONGCODEU to evaluate LCLMs' long code understanding ability required for practical applications。
LCLMの性能は、長いコード長が32Kを超えると劇的に低下し、128K-1Mのコンテキストウィンドウよりもはるかに低下した。
我々の研究は、LCLMを最適化し、ソフトウェア工学の進歩を推進するための貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:02:31 GMT)
Disparities in LLM Reasoning Accuracy and Explanations: A Case Study on African American English [67.0] 本研究では,Large Language Models (LLMs) 推論タスクにおける方言の相違について検討する。
LLMは、AAE入力に対するより正確な応答とより単純な推論チェーンと説明を生成する。
これらの知見は、LLMの処理方法と異なる言語品種の理由の体系的差異を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:15:34 GMT)
Uncovering inequalities in new knowledge learning by large language models across different languages [66.7] 低リソース言語は、4つの次元すべてで一貫して不利に直面していることを示す。
我々は,LLMの新たな知識学習における言語的不平等の認識を高め,より包括的で公平な将来のLLMの開発を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:41:47 GMT)
GENERator: A Long-Context Generative Genomic Foundation Model [66.5] 本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:41:32 GMT)
AutoBench-V: Can Large Vision-Language Models Benchmark Themselves? [65.9] 本稿では,モデル能力の特定の側面に基づいてLVLMをベンチマークする,オンデマンドで評価を行う自動フレームワークであるAutoBench-Vを紹介する。
5つの要求されたユーザ入力に対して9つの人気のあるLVLMを広範囲に評価することにより、このフレームワークの有効性と信頼性を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:31:32 GMT)
SafeArena: Evaluating the Safety of Autonomous Web Agents [65.5] LLMベースのエージェントは、Webベースのタスクの解決に精通している。
この能力により、悪意のある目的のために誤用されるリスクが高まる。
我々は、Webエージェントの意図的に誤用に焦点を当てた最初のベンチマークであるSafeArenaを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:43:14 GMT)
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets [65.4] 本稿では,専門家が設計した報酬関数と,小規模データセットから学習した報酬関数を整列し,微調整する新しい手法を提案する。
提案手法は,大規模テキスト条件による画像拡散モデルである安定拡散の高速かつ多様かつ事前保存的な微調整を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:15:58 GMT)
3HANDS Dataset: Learning from Humans for Generating Naturalistic Handovers with Supernumerary Robotic Limbs [65.0] スーパー数式ロボットアーム(英: Supernumerary Robotics limbs、SRL)は、ユーザーの身体と密に統合されたロボット構造である。
3HANDSは,日常活動を行う参加者と,ヒップマウントSRLを自然な方法で実施する参加者との間の,オブジェクトハンドオーバインタラクションの新たなデータセットである。
本稿では,自然なハンドオーバ軌跡を生成する3つのモデル,適切なハンドオーバエンドポイントを決定する1つのモデル,ハンドオーバ開始のタイミングを予測する3つのモデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:23:55 GMT)
PostEdit: Posterior Sampling for Efficient Zero-Shot Image Editing [63.4] 拡散サンプリングプロセスを制御するために後続のスキームを組み込んだPostEditを導入する。
提案したPostEditは、未編集領域を正確に保存しながら、最先端の編集性能を実現する。
インバージョンもトレーニングも不要で、約1.5秒と18GBのGPUメモリを必要とするため、高品質な結果が得られる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:03:07 GMT)
Keeping Yourself is Important in Downstream Tuning Multimodal Large Language Model [63.1] MLLM(Multi-modal Large Language Models)は、視覚的および言語的推論を統合して、画像キャプションや視覚的質問応答といった複雑なタスクに対処する。
ダウンストリームタスクのためのMLLMのチューニングには,2つの重要な課題がある。タスク-Expert – 事前トレーニングとターゲットデータセット間の分散シフトによってターゲットのパフォーマンスが制限される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:29:13 GMT)
PSDNorm: Test-Time Temporal Normalization for Deep Learning on EEG Signals [63.1] PSDNormは、Mongeマッピングと時間コンテキストを活用して、ディープラーニングモデルでフィーチャーマップを正規化するレイヤである。
PSDNormは、トレーニング中に見えないデータセットのテスト時間における最先端のパフォーマンスを達成する。
PSDNormはロバスト性を大幅に改善し、20%の難題でF1スコアを著しく高めている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:20:25 GMT)
Towards Intelligent Transportation with Pedestrians and Vehicles In-the-Loop: A Surveillance Video-Assisted Federated Digital Twin Framework [62.5] 本稿では,歩行者や車いすによるITSを支援するための監視ビデオ支援型デジタルツイン(SV-FDT)フレームワークを提案する。
i)複数のソースからトラフィック監視ビデオを収集するエンドレイヤ、(ii)セマンティックセグメンテーションに基づく視覚理解、ツインエージェントベースのインタラクションモデリング、およびローカルデジタルツインシステム(LDTS)をローカルで作成するエッジレイヤ、(iii)異なるリージョンにわたるLDTSを統合してグローバルDTモデルをリアルタイムで構築するクラウドレイヤの3層で構成されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:36:06 GMT)
Chart-HQA: A Benchmark for Hypothetical Question Answering in Charts [62.5] 本稿では,同じ質問に対して仮定を課し,グラフの内容に基づいた反実的推論を行うようモデルに強制する,新しいChart hypothetical Question Answering (HQA)タスクを提案する。
さらに,LLMのテキスト編集能力と人間の知識を併用して,多種多様な高品質HQAデータを低コストで生成する,人間とAIの対話型データ合成手法であるHAIを導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:08:40 GMT)
Social Genome: Grounded Social Reasoning Abilities of Multimodal Models [61.9] ソーシャルゲノム(Social Genome)は、マルチモーダルモデルのきめ細かいきめ細やかな社会的推論能力を示す最初のベンチマークである。
相互作用の272のビデオと、これらの相互作用に関する推論に関連する1,486人の注釈付き推論トレースを含んでいる。
社会ゲノムはまた、社会的推論における外部知識を研究するための最初のモデリング課題である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:07:48 GMT)
Robust Multi-View Learning via Representation Fusion of Sample-Level Attention and Alignment of Simulated Perturbation [61.6] 実世界のマルチビューデータセットは、しばしば不均一で不完全である。
本稿では,表現融合とアライメントを同時に行う新しいロバストMVL法(RML)を提案する。
実験では、教師なしマルチビュークラスタリング、ノイズラベル分類、およびクロスモーダルハッシュ検索のためのプラグ・アンド・プレイモジュールとして採用する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:01:08 GMT)
A Simple and Effective Reinforcement Learning Method for Text-to-Image Diffusion Fine-tuning [61.4] 強化学習(Reinforcement Learning, RL)に基づく微調整は, 拡散モデルとブラックボックスの目的を整合させる強力なアプローチとして登場した。
拡散微調整のための新しいRLであるLOOP(Left-one-out PPO)を提案する。
以上の結果から, LOOPは様々なブラックボックス対象の拡散モデルを効果的に改善し, 計算効率と性能のバランスを良くすることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:19:22 GMT)
Structured Preference Optimization for Vision-Language Long-Horizon Task Planning [60.3] 視覚言語タスクプランニングの既存の方法は、短期水平タスクでは優れているが、動的環境における複雑な長期水平計画では不足することが多い。
これらの課題は、ロングホライゾンタスクのための高品質な推論プロセスを生成するために、効果的にモデルを訓練することの難しさから生じる。
本研究では,長期タスク計画における推論と行動選択の促進を目的とした構造的選好最適化(SPO)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:50:44 GMT)
PIGUIQA: A Physical Imaging Guided Perceptual Framework for Underwater Image Quality Assessment [59.9] 水中画像品質評価(UIQA)のための物理画像ガイド型知覚フレームワークを提案する。
水中放射移動理論を応用して、物理に基づく画像推定を統合して、これらの歪みの定量的な測定値を確立する。
提案モデルは,画像品質のスコアを正確に予測し,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:19:13 GMT)
TRACT: Regression-Aware Fine-tuning Meets Chain-of-Thought Reasoning for LLM-as-a-Judge [59.6] TRACT(Two-stage Regression-Aware fine-tuning with CoT)は、CoT推論と回帰学習を組み合わせた手法である。
4つの LLM-as-a-judge データセットと2つの LLM データセットによる実験により、TRACT が既存の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:33:20 GMT)
VISION-XL: High Definition Video Inverse Problem Solver using Latent Image Diffusion Models [58.5] 本稿では,遅延画像拡散モデルを用いた高精細ビデオ逆問題の解法を提案する。
提案手法は,NVIDIA 4090 GPUの1フレームあたり6秒未満でHD解像度の再構成を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:05:32 GMT)
Hamiltonian Mechanics of Feature Learning: Bottleneck Structure in Leaky ResNets [58.5] ResNets と Fully-Connected Nets を相互接続する Leaky ResNets について「有効深度」に依存して検討する。
この直感を利用して、以前の研究で見られるように、ボトルネック構造の出現を説明する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:47:53 GMT)
Locate Anything on Earth: Advancing Open-Vocabulary Object Detection for Remote Sensing Community [58.4] LAEタスクのための最初のオープンボキャブラリ基礎オブジェクト検出器であるLAE-DINOモデルを提案し,訓練する。
我々は、確立されたリモートセンシングベンチマークDIOR、DOTAv2.0、および新たに発表された80クラスのLEE-80Cベンチマークについて実験を行った。
その結果, LAE-1Mデータセットの利点と, LAE-DINO法の有効性が示された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:26:00 GMT)
Learning Transformer-based World Models with Contrastive Predictive Coding [58.0] 変換器の表現能力を十分に活用するには,次の状態予測目標が不十分であることを示す。
本稿では,行動条件のContrastive Predictive Codingを用いた世界モデルであるTWISTERを導入することで,世界モデル予測をより長い時間的地平線まで拡張することを提案する。
TWISTERは、Atari 100kベンチマークで162%の人間正規化平均スコアを達成し、ルックアヘッド検索を使用しない最先端のメソッドの中で、新しい記録を樹立した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:18:37 GMT)
Predictable Scale: Part I -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining [57.9] 最適な学習速度は、モデルパラメータとデータサイズの両方とのパワー-法則関係に従うが、最適なバッチサイズは、主にデータサイズでスケールする。
これらの法則は、モデル空間、トレーニングデータ分布、モデル形状のバリエーションにまたがる顕著な堅牢性を示す。
この研究は、Mixture-of-Expertsモデルや高密度トランスなど、異なるモデル形状と構造を統一する最初の研究である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:58:29 GMT)
Tgea: An error-annotated dataset and benchmark tasks for text generation from pretrained language models [57.8] TGEAは、事前訓練された言語モデル(PLM)からテキストを生成するためのエラーアノテートデータセットである。
PLM生成文で発生する24種類の誤りを網羅する誤り分類を作成する。
PLM生成テキストに対する包括的なアノテーションを備えた最初のデータセットである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:14:02 GMT)
Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.6] 本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:13:19 GMT)
TableLoRA: Low-rank Adaptation on Table Structure Understanding for Large Language Models [57.0] TableLoRA は、PEFT における LLM のテーブル構造理解を改善するために設計されたモジュールである。
テーブルを特別なトークンエンコーダでシリアライズするための特別なトークンを組み込み、2D LoRAを使ってセル位置の低ランク情報をエンコードする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:50:14 GMT)
DuCos: Duality Constrained Depth Super-Resolution via Foundation Model [56.9] ラグランジアン双対性理論に基づく新しい深度超解像フレームワークであるDuCosを紹介する。
DuCosは、ファンデーションモデルをプロンプトとして、さまざまなシナリオにおける一般化を著しく改善した最初の企業だ。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:36:45 GMT)
The VLLM Safety Paradox: Dual Ease in Jailbreak Attack and Defense [56.3] Vision Large Language Models(VLLMs)のジェイルブレイク攻撃に対する脆弱性は、驚くにあたらない。
これらの攻撃に対する最近の防御機構は、ベンチマーク評価においてほぼ飽和状態に達している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:45:26 GMT)
Collapse of Dense Retrievers: Short, Early, and Literal Biases Outranking Factual Evidence [56.1] 検索モデルは、Retrieval-Augmented Generation (RAG)のような情報検索(IR)アプリケーションで一般的に使用される。
検索者は文書の優先順位の過度な開始、短い文書、繰り返しのエンティティ、リテラルマッチングといった表面的なパターンにしばしば依存していることを示す。
これらのバイアスは、検索優先の文書がLLMを誤解させるおそれのあるRAGのような下流アプリケーションに直接的な結果をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:23:13 GMT)
Get my drift? Catching LLM Task Drift with Activation Deltas [55.8] タスクドリフトは攻撃者がデータを流出させたり、LLMの出力に影響を与えたりすることを可能にする。
そこで, 簡易線形分類器は, 分布外テストセット上で, ほぼ完全なLOC AUCでドリフトを検出することができることを示す。
このアプローチは、プロンプトインジェクション、ジェイルブレイク、悪意のある指示など、目に見えないタスクドメインに対して驚くほどうまく一般化する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:43:10 GMT)
AfroBench: How Good are Large Language Models on African Languages? [55.4] AfroBenchは、64のアフリカ言語にわたるLLMのパフォーマンスを評価するためのベンチマークである。
AfroBenchは9つの自然言語理解データセット、6つのテキスト生成データセット、6つの知識と質問応答タスク、1つの数学的推論タスクで構成される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:29:24 GMT)
Drag Your Gaussian: Effective Drag-Based Editing with Score Distillation for 3D Gaussian Splatting [55.1] DYGは3次元ガウススプラッティングのための効果的な3次元ドラッグベース編集法である。
3次元マスクと一対の制御点を入力して編集範囲を正確に制御できる。
DYGは暗黙三面体表現の強さを統合し、編集結果の幾何学的足場を確立する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:55:41 GMT)
Quantifying the Reasoning Abilities of LLMs on Real-world Clinical Cases [54.7] 症例は1,453例で,MedR-Benchについて検討した。
本ベンチマークは,13の身体系と10の専門疾患にまたがって,一般的な疾患と稀な疾患の両方を対象とする。
本稿では,自由文推論応答の自動化と客観的な定量化を目的とした新しいエージェントシステムReasoning Evaluatorを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:35:39 GMT)
Topology-Aware Conformal Prediction for Stream Networks [54.5] 本研究では,ネットワークトポロジと時間的ダイナミクスを共形予測フレームワークに統合した新しいフレームワークであるspatio-Temporal Adaptive Conformal Inference (textttCISTA)を提案する。
この結果から,TextttCISTAは予測効率とカバレッジのバランスを効果的に保ち,既存のストリームネットワークの共形予測手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:21:15 GMT)
The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation [53.8] LanDiffは、自己回帰言語モデルと拡散モデルの強みを相乗化するハイブリッドフレームワークである。
本アーキテクチャでは,(1)効率的なセマンティック圧縮により3次元視覚特徴をコンパクトな1次元表現に圧縮するセマンティック・トークンー,(2)高レベルのセマンティックな関係を持つセマンティック・トークンを生成する言語モデル,(3)粗いセマンティクスを高忠実なビデオに洗練するストリーミング拡散モデルを紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:53:14 GMT)
BHViT: Binarized Hybrid Vision Transformer [53.4] モデルバイナライゼーションは畳み込みニューラルネットワーク(CNN)のリアルタイムおよびエネルギー効率の計算を可能にした。
本稿では,バイナライズフレンドリーなハイブリッドViTアーキテクチャであるBHViTとそのバイナライズモデルを提案する。
提案アルゴリズムは,バイナリ ViT 手法間でSOTA 性能を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:10:24 GMT)
EgoNormia: Benchmarking Physical Social Norm Understanding [52.9] 我々はEgoNormia $|epsilon|$について紹介する。
規範的行動には、安全、プライバシー、プロキシ、丁寧さ、協力、協調/行動、コミュニケーション/相対性という7つのカテゴリが含まれる。
私たちの研究は、現在の最先端のビジョン言語モデルは、EgoNormiaで最大45%のスコアで、堅牢なノルム理解を欠いていることを実証しています。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:59:40 GMT)
Visual Description Grounding Reduces Hallucinations and Boosts Reasoning in LVLMs [52.5] LVLM(Large Vision-Language Models)はしばしば、幻覚として知られる事実情報を誤認する応答を生成する。
視覚的知覚の向上とLVLMの推論能力の向上を目的とした学習自由度手法であるVisual Description Grounded Decoding (VDGD)を紹介した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:59:59 GMT)
Synthetic Data is an Elegant GIFT for Continual Vision-Language Models [52.3] GIFTはVision-Language Modelsにおける破滅的な忘れを克服するための、新しい連続的な微調整手法である。
我々は、事前学習と下流タスクデータの両方を再現するために、事前学習した拡散モデルを用いる。
提案手法は,様々な設定において従来手法よりも常に優れていた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:09:18 GMT)
Efficient Masked AutoEncoder for Video Object Counting and A Large-Scale Benchmark [52.3] 前景の動的不均衡は、ビデオオブジェクトのカウントにおいて大きな課題である。
本稿では,密度埋め込み型効率的なマスドオートエンコーダカウント(E-MAC)フレームワークを提案する。
さらに,渡り鳥保護のための自然シナリオにおいて,まず,大規模なビデオバードカウントデータセットであるDroneBirdを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:28:09 GMT)
Greedy Algorithm for Structured Bandits: A Sharp Characterization of Asymptotic Success / Failure [51.5] 我々は,既知報酬構造を持つバンドイット問題における欲求(探索のみ)アルゴリズムについて検討する。
我々は、グリディがアルゴリズム的に成功するか失敗するかを、サブ線形対線形後悔という意味で完全に特徴づける。
我々は、任意のフィードバックで、文脈的な包帯と対話的な意思決定に特徴を拡張します。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:51:11 GMT)
START: Self-taught Reasoner with Tools [51.4] ツール統合長チェーン・オブ・シークレット(CoT)推論LSMであるSTART(Self-Taught Reasoner with Tools)を紹介する。
STARTは複雑な計算、自己チェック、多様な方法の探索、そして自己老化を行うことができる。
基礎となるQwQ-32Bを著しく上回り、最先端のオープンウェイトモデルR1-Distill-Qwen-32Bに匹敵する性能を達成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:11:51 GMT)
Lost in Literalism: How Supervised Training Shapes Translationese in LLMs [51.0] 大規模言語モデル(LLM)は機械翻訳において顕著な成功を収めた。
しかし、過度にリテラルと不自然な翻訳を特徴とする翻訳は、依然として永続的な課題である。
我々は、黄金の基準を磨き、不自然なトレーニングインスタンスをフィルタリングするなど、これらのバイアスを軽減する方法を導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:14:45 GMT)
How to Mitigate Overfitting in Weak-to-strong Generalization? [50.4] Weak-to-strongの一般化は、弱いスーパーバイザーを通して強いモデルの能力を引き出すことを目的としている。
強いモデルは弱強一般化において顕著な過剰適合を示す。
本稿では,監視信号の品質と入力質問の品質を同時に向上する2段階フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:32:39 GMT)
DiffPO: Diffusion-styled Preference Optimization for Efficient Inference-Time Alignment of Large Language Models [50.3] 拡散型優先度最適化(Diffusion-styled Preference Optimization: モデル)は、LLMを人間と整合させるための効率的でポリシーに依存しないソリューションを提供する。
modelavoidはトークンレベルの生成に関連する時間遅延をモデル化する。
AlpacaEval 2, MT-bench, HH-RLHFの実験により, 種々の環境におけるアライメント性能が良好であることが示された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:21:54 GMT)
An Egocentric Vision-Language Model based Portable Real-time Smart Assistant [50.3] 我々は、ポータブルデバイス上でリアルタイムかつ包括的なAIアシストを提供するために設計された視覚言語システムであるVinciを紹介する。
Vinciは、エゴセントリックなビジョン基盤モデルと大きな言語モデルを統合する新しいモデルであるEgoVideo-VLを活用している。
vinciはハードウェアに依存しないため、スマートフォンやウェアラブルカメラなど、幅広いデバイスへのデプロイをサポートする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:33:46 GMT)
Graph Neural Networks for Edge Signals: Orientation Equivariance and Invariance [50.3] 我々は、新しい方向対応エッジレベルグラフシフト演算子からなるアーキテクチャであるEIGNを開発する。
EIGNは、例えばRMSEのフローシミュレーションタスクを最大23.5%改善するなど、エッジレベルのタスクにおける以前の作業より優れていた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:10:06 GMT)
DiRe-JAX: A JAX based Dimensionality Reduction Algorithm for Large-scale Data [49.8] DiReは、UMAPやtSNEといった従来の手法が直面する課題に対処するために設計された、新しい次元削減ツールキットである。
このツールキットは、最先端の UMAP や tSNE の実装と比較して、データ内のローカル構造とグローバル構造の両方を保存することにかなり有望である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:40:27 GMT)
Distributional Associations vs In-Context Reasoning: A Study of Feed-forward and Attention Layers [49.8] 本研究では,大規模言語モデルにおけるフィードフォワード層とアテンション層との区別について検討する。
フィードフォワード層はビッグラムのような単純な分布関係を学習する傾向があり、注意層は文脈内推論にフォーカスする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:55:51 GMT)
LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant [49.5] また,「Fast & Slow Video-Language Thinker」は,リアルタイム・能動的・時間的・文脈的・正確な応答を実現するオンネバイドアシスト「LION-FS」である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:25:37 GMT)
Back Home: A Machine Learning Approach to Seashell Classification and Ecosystem Restoration [49.2] コスタリカでは、年間平均5トンの貝殻が生態系から抽出されている。混入した貝殻は、原産地認識の欠如により生態系に戻れない。
貝殻同定のための畳み込みニューラルネットワーク(CNN)を開発した。
私たちは太平洋とカリブ海の海岸から約19万枚の画像からなるデータセットをスクラッチから構築しました。
このモデルはユーザフレンドリーなアプリケーションに統合され、これまで36,000以上の貝殻を分類し、画像1枚につき3秒以内にリアルタイムで結果を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:35:19 GMT)
Determinant Estimation under Memory Constraints and Neural Scaling Laws [48.7] メモリ制約設定における大規模対数決定式計算のための新しい階層的アルゴリズムを導出する。
擬似決定詞の比率が法則関係を満たすことを示し、対応するスケーリング法則を導出できるようにする。
これにより、完全なデータセットのごく一部からNTKログ行列式を正確に推定できる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:32:13 GMT)
Simulating the Real World: A Unified Survey of Multimodal Generative Models [48.4] 実世界のシミュレーションにおいて,データ次元の進行を調査する多モード生成モデルについて統一的な調査を行う。
我々の知る限りでは、これは単一のフレームワーク内で2D、ビデオ、3D、および4D生成の研究を体系的に統一する最初の試みである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:31:43 GMT)
When Can You Get Away with Low Memory Adam? [48.3] 我々は、$textitSlimAdam$がAdamのパフォーマンスと安定性にマッチし、合計2回目で98%のコストを節約できることを示します。
code for $textitSlimAdam$はhttps://github.com/dayal-kalra/low-Memory-adamで入手できる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:38:33 GMT)
RadIR: A Scalable Framework for Multi-Grained Medical Image Retrieval via Radiology Report Mining [48.2] 本稿では,複数の粒度で画像の類似度を決定するために,高密度ラジオロジーレポートを利用した新しい手法を提案する。
我々は、胸部X線用MIMIC-IRとCTスキャン用CTRATE-IRの2つの総合的な医用画像検索データセットを構築した。
RadIR-CXR と Model-ChestCT という2つの検索システムを開発し,従来の画像画像検索と画像レポート検索に優れた性能を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:43:03 GMT)
S2Gaussian: Sparse-View Super-Resolution 3D Gaussian Splatting [47.8] S2Gaussianと呼ばれる新しいスパースビュー超高解像度3Dガウス撮影フレームワークを提案する。
実験は優れた結果を示し、特により一貫した幾何と細かな詳細を持つ新しい最先端のパフォーマンスを確立する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:58:26 GMT)
How Do Hackathons Foster Creativity? Towards AI Collaborative Evaluation of Creativity at Scale [47.7] 我々は193,353のハッカソンプロジェクトの計算分析を行う。
組織がハッカソンで創造性を育むための手段を特定します。
創造的な成果を評価するために,大規模言語モデルの利用について検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:17:52 GMT)
Stealthy Jailbreak Attacks on Large Language Models via Benign Data Mirroring [47.4] そこで本研究では,ターゲットブラックボックスモデルのミラーモデルを良質なデータ蒸留により局所的に訓練することにより,悪意あるプロンプト構築を誘導するトランスファー攻撃法を提案する。
提案手法は最大攻撃成功率92%, バランス値80%を達成し, GPT-3.5 Turboに対して平均1.5のジェイルブレイククエリが検出された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:38:42 GMT)
DM-Adapter: Domain-Aware Mixture-of-Adapters for Text-Based Person Retrieval [47.0] テキストベースの人物検索(TPR)は、きめ細かな課題として注目されている。
TPRの以前のフルモデル微調整は計算コストが高く、過度に適合する傾向がある。
新しいDomain-Aware Mixture-of-Adapter (DM-Adapter)は最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:41:38 GMT)
Revisiting the Othello World Model Hypothesis [46.8] 我々はOthelloボードの状態を分析し、以前の動きに基づいて次の動きを予測するモデルを訓練する。
すべてのモデルが教師なしの接地において最大99%の精度を達成し、彼らが学んだボード機能に高い類似性を示すことがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:26:58 GMT)
The Last Iterate Advantage: Empirical Auditing and Principled Heuristic Analysis of Differentially Private SGD [46.7] ノイズカットされた勾配勾配(DP-SGD)の簡易なプライバシー解析法を提案する。
各種トレーニング手順に適用したプライバシー監査の結果を予測できることを実験的に示す。
既存のプライバシー監査攻撃は、視覚と言語の両方のタスクにおける分析によって制限されていることを実証的に示しています。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:20:00 GMT)
Data-Efficient Learning from Human Interventions for Mobile Robots [46.7] モバイルロボットは、自律デリバリやホスピタリティサービスといったアプリケーションに不可欠である。
モバイルロボットタスクに学習ベースの手法を適用することは、その堅牢性と一般化性から人気を集めている。
Imitation Learning (IL) や Reinforcement Learning (RL) といった従来の手法は、適応性を提供するが、大きなデータセット、慎重に構築された報酬関数、そして実際のギャップに直面する。
本稿では,ILとRLを組み合わせたオンライン・ヒューマン・イン・ザ・ループ学習手法PVP4Realを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:02:02 GMT)
LLM-wrapper: Black-Box Semantic-Aware Adaptation of Vision-Language Models for Referring Expression Comprehension [45.9] 視覚言語モデル(VLM)は、様々なオープン語彙タスクにおいて顕著な能力を示してきたが、タスク固有の微調整モデルに遅れたゼロショットのパフォーマンスは遅れている。
大規模言語モデル(LLM)を用いた参照表現タスクのためのVLMの「ブラックボックス」適応法であるLLM-wrapperを提案する。
当社のアプローチでは,内部動作へのアクセスを必要とせずに,クローズドソースモデルの適応を可能にするという,いくつかの利点がある。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:12:48 GMT)
Q-PART: Quasi-Periodic Adaptive Regression with Test-time Training for Pediatric Left Ventricular Ejection Fraction Regression [45.7] 適応型左室エジェクション・フラクション(LVEF)の評価の課題に対処する。
我々はtextbfTest-time Training (Q-PART) フレームワークを用いた textbfQuasi-textbfPeriodic textbfAdaptive textbfRegression を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:24:51 GMT)
Do Not Trust Licenses You See -- Dataset Compliance Requires Massive-Scale AI-Powered Lifecycle Tracing [45.7] 本稿では,データセットの法的リスクは,ライセンス条項だけでは正確に評価できないことを論じる。
データセットの再配布と完全なライフサイクルの追跡が不可欠である、と同社は主張する。
我々は、AIが人間の専門家よりも高い精度、効率、コスト効率でこれらのタスクを実行できることを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:45:51 GMT)
Generalization in Federated Learning: A Conditional Mutual Information Framework [45.7] Federated Learning (FL)は、広く採用されているプライバシー保護分散学習フレームワークである。
本研究では,条件付き相互情報(CMI)フレームワークを用いて情報理論解析を行い,FLの2段階の一般化について検討する。
我々は、仮説に基づくCMI境界を含む複数のCMIベースの境界を導出し、FLにおけるプライバシー制約が保証を一般化することを示唆する方法について説明する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:57:51 GMT)
HelpSteer2-Preference: Complementing Ratings with Preferences [45.0] 我々は、HelpSteer2データセットで既存のレーティング(回帰スタイルのトレーニング用に設計された)を補完するために、好みのアノテーションをリリースします。
データに適切に一致する場合、Bradley-TerryモデルとRegressionモデルの最初のヘッド・ツー・ヘッド比較を行う。
このアプローチをチューニングしたラマ-3.1-70B-インストラクションモデルは、2024年10月1日のリワードベンチで94.1得点を記録し、140以上の報酬モデルでトップとなった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:13:14 GMT)
IDInit: A Universal and Stable Initialization Method for Neural Network Training [44.5] レイヤ内のアイデンティティ移行を維持する方法は、ネットワークトレーニングにおいて優れた効率性を示している。
IDInitは、残差ネットワークの主層とサブステム層の両方にアイデンティティを保持する新しい方法である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:12:46 GMT)
Iris Style Transfer: Enhancing Iris Recognition with Style Features and Privacy Preservation through Neural Style Transfer [44.4] アイリステクスチャは、認証と識別のための金の標準バイオメトリック・モダリティとして広く見なされている。
マスク識別可能な虹彩スタイル特徴に対するニューラルスタイル転送を提案する。
この研究は、虹彩指向でセキュアでプライバシーに配慮した生体認証システムのための新しい道を開く。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:55:21 GMT)
EgoExoLearn: A Dataset for Bridging Asynchronous Ego- and Exo-centric View of Procedural Activities in Real World [44.3] EgoExoLearnは、以下のプロセスで人間の実演をエミュレートするデータセットである。
EgoExoLearnには120時間にわたるエゴセントリックでデモ的なビデオデータが含まれている。
クロスビューアソシエーション、クロスビューアクションプランニング、クロスビュー参照スキルアセスメントなどのベンチマークを提示する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:46:51 GMT)
Reasoning to Attend: Try to Understand How <SEG> Token Works [44.3] 我々は、$texttSEG>$トークンが、画像とテキストのペア内のセマンティックな類似性に寄与していることを示す。
本稿では,高活性点の誘導の下で,LMMの高強度な$textbfREA$soning機能を実現するREADを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:11:30 GMT)
Autoformalizing Natural Language to First-Order Logic: A Case Study in Logical Fallacy Detection [44.3] 自然言語をFOLに自動変換するフレームワークであるNL2FOLについて,Large Language Models (LLMs) を用いて段階的に導入する。
本手法は,暗黙の背景知識の統合など,翻訳プロセスにおける重要な課題に対処する。
ニューロシンボリックなアプローチでは、推論プロセスに対する解釈可能な洞察も提供し、モデル微調整やラベル付きトレーニングデータを必要とせずに堅牢性を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:29:44 GMT)
Wanda++: Pruning Large Language Models via Regional Gradients [44.2] 大規模言語モデル(LLM)プルーニングは、パフォーマンスへの影響を最小限に抑えて、推論スピードアップのための重要でない重みを取り除こうとする。
本稿では,デコーダブロックレベルのtextbf 局所勾配を利用して,最先端の手法より優れた新しいプルーニングフレームワーク Wanda++ を提案する。
提案手法は軽量で,1つのNVIDIA H100 GPU上で7B LLaMAモデルを10分以内でプルーニングする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:42:35 GMT)
Parallel Logical Measurements via Quantum Code Surgery [43.0] 量子符号手術(Quantum code surgery)は、量子誤り訂正符号の論理的測定を行うための、柔軟で低オーバーヘッドな技術である。
本稿では,Calderbank-Shor-Steane量子低密度パリティチェック(LDPC)コードに適用可能なコード手術方式を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:05:52 GMT)
DexMimicGen: Automated Data Generation for Bimanual Dexterous Manipulation via Imitation Learning [42.9] 本稿では,人間の手による人型ロボットの人体実験からトラジェクトリを合成する大規模自動データ生成システムを提案する。
私たちは、たった60のソースの人間デモから、これらのタスク全体で21Kのデモを生成します。
また、実世界のヒューマノイド缶ソートタスクに、実世界のシミュレート・トゥ・リアルパイプラインを配置する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:34:17 GMT)
FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement [42.2] MLLM(Multimodal Large Language Models)はセマンティックなタスクに優れるが、3Dシーン生成への応用は3D幾何学の限られた基盤によって妨げられる。
本稿では,(1)3次元の幾何学的推論と関連する幾何学的詳細の抽出に既存のMLLMを適用した新しいフレームワークFirePlaceを紹介し,(2)抽出した低レベル幾何学の幾何学的制約の構築と解決,(3)常識に適合した最終配置のためのプルーニングを紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:34:15 GMT)
Tensor Network Techniques for Quantum Computation [41.9] この本はテンソルネットワークとその量子計算および量子情報への応用の入門的かつ徹底的なガイドとして機能する。
パートIでは、テンソル構造やマトリックス製品状態(MPS)やツリーネットワーク(TTN)といったネットワーク表現など、基本的なトピックが取り上げられている。
第2部は量子力学のシミュレーションにおけるテンソルネットワークの実践的応用を探る。
最後の章ではテンソルネットワークにおける「量子魔法」の役割について論じている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:31:17 GMT)
Better Process Supervision with Bi-directional Rewarding Signals [41.9] 本稿では,過去の手順の正しさを評価するプロセス監視モデルであるBiRMを紹介し,今後の成功の可能性をモデル化する。
数学的推論のタスクについて広範な実験を行い、BiRMがLLM推論のステップをより正確に評価できることを実証した。
検索ベースの戦略では、より包括的なガイダンスを提供し、それぞれMATH-500でORMを5.0%、PRMを3.8%上回る。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:03:17 GMT)
A Survey of Deep Learning-based Radiology Report Generation Using Multimodal Data [41.8] 本調査では,最新の研究で開発された重要なテクニックを要約し,ディープラーニングに基づくレポート生成のための一般的なワークフローを提案する。
本研究の目的は,臨床報告の自動生成と医用画像解析に関心のある研究者に対して,包括的で豊富な情報を提供することである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:18:49 GMT)
Subgraph Federated Learning for Local Generalization [41.6] グラフ上のフェデレートラーニング(FL)により、各クライアントのプライバシを損なうことなく、協調モデルトレーニングによってパフォーマンスを向上させることができる。
既存の手法は、しばしばグラフデータの不変性を見落とし、しばしば新しいノードを導入し、ラベルの分布の変化につながる。
提案手法であるFedLoGは,局所的なオーバーフィッティングを軽減し,この問題に効果的に対処する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:08:01 GMT)
H3O: Hyper-Efficient 3D Occupancy Prediction with Heterogeneous Supervision [41.5] 本稿では3次元占有予測手法であるH3Oを提案する。H3Oは高効率なアーキテクチャ設計を特徴とし,現在の最先端手法と比較して計算コストを大幅に削減する。
特に, マルチカメラ深度推定, セマンティックセグメンテーション, および表面正規推定を, 対応する2次元ラベルで教師する可変ボリュームレンダリングにより統合する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:27:14 GMT)
UIPE: Enhancing LLM Unlearning by Removing Knowledge Related to Forgetting Targets [41.0] 大規模言語モデル(LLM)は、大規模なデータセットのトレーニング中に必然的に有害な情報を取得する。
既存のアンラーニング手法は、非ラーニングの有効性に論理的関連知識が与える決定的な影響を克服しつつ、対象データを忘れることに重点を置いている。
本研究では,忘れる対象と高い相関性を持つ知識を除去するUIPE(Unlearning Improvement via Extrapolation)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:40:00 GMT)
Mark Your LLM: Detecting the Misuse of Open-Source Large Language Models via Watermarking [41.0] 本研究は,オープンソースの大規模言語モデル(LLM)における2つの誤用シナリオを定義する。
本稿では,これらの文脈における推論時透かし蒸留とバックドア透かしの適用について検討する。
実験の結果, 後方透かしはIP Violationを効果的に検出でき, 推論時透かし蒸留はどちらのシナリオにも適用可能であることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:24:06 GMT)
ViT-VS: On the Applicability of Pretrained Vision Transformer Features for Generalizable Visual Servoing [40.7] 本稿では,事前学習した視覚変換器を用いて意味的特徴抽出を行う視覚サーボ手法を提案する。
提案手法は、従来の画像に基づく視覚サーボよりも、摂動シナリオの相対的な改善を31.2%も上回っている。
実世界の評価では、エンドエフェクタの位置決め、工業用ボックス操作、見えない物体の把握において堅牢な性能が確認されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:33:19 GMT)
A Morse Transform for Drug Discovery [40.7] 結合ポテンシャルの予測にPLモース理論を用いた新しいリガンドベースの仮想スクリーニング(LBVS)フレームワークを提案する。
プレナード・デラウネー三角法(英語版)を用いて単純複素数としてモデル化し、複数の方向関数にまたがる臨界点をカタログ化する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:54:28 GMT)
Generative Flows on Synthetic Pathway for Drug Design [39.7] 分子構築ブロックと化学反応テンプレートを用いて分子を逐次組み立てるRxnFlowを提案する。
RxnFlowはCrossDocked 2020において、平均8kcal.85/molのVinaスコアと34.8%の合成性を備えた、ポケットコンディショナー生成のための最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:14:44 GMT)
A kinetic-based regularization method for data science applications [39.6] 本稿では,統計力学にインスパイアされた関数学習のための物理に基づく正規化手法を提案する。
補間器のパラメータの最適化とシステムのエネルギーの最小化の類似性から,データ分布の低次モーメントに対する制約を導入する。
これにより、データの離散表現と連続表現の相違が最小化され、それによってより好ましいエネルギーランドスケープにアクセスできるようになる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:12:01 GMT)
Direct Distributional Optimization for Provable Alignment of Diffusion Models [39.0] 分布最適化の観点から拡散モデルの新しいアライメント手法を提案する。
まず、確率分布に対する一般正規化損失最小化として問題を定式化する。
本研究では,Doob の $h$-transform 技術を用いてスコア関数を近似することにより,学習した分布からのサンプリングを可能にする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:25:25 GMT)
Symbiotic Cooperation for Web Agents: Harnessing Complementary Strengths of Large and Small LLMs [38.9] 大規模言語モデル(LLM)を利用したWebブラウジングエージェントは、複雑なWebベースのタスクを自動化する大きな可能性を示している。
既存のアプローチは通常、Web環境を探索し、軌跡データを生成するために大きなLLMに依存している。
本稿では,データ合成とタスクパフォーマンスを結合した反復的フレームワークであるAgentSymbioticを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:40:57 GMT)
ForestLPR: LiDAR Place Recognition in Forests Attentioning Multiple BEV Density Images [38.7] 本研究では,自然林におけるロバストなLiDARを用いた位置認識手法であるフォレストLPRを提案する。
異なる高さの森の地形の断面画像には、ある場所を再訪するために必要な情報が含まれている。
提案手法では,視覚変換器を共有バックボーンとして使用し,局所記述子の集合を生成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:24:22 GMT)
RCRank: Multimodal Ranking of Root Causes of Slow Queries in Cloud Database Systems [38.7] ルート原因の診断は、遅いクエリの検出とリビジョンを促進するのに不可欠である。
本稿では、遅いクエリの根本原因タイプを特定し、遅いクエリを高速化する可能性に応じてそれらをランク付けする手法を提案する。
より正確かつ詳細な診断を可能にするために,RCRankフレームワークの根本原因のマルチモーダルランキングを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:35:20 GMT)
Exploring the Multilingual NLG Evaluation Abilities of LLM-Based Evaluators [38.7] 本研究は,近年の10個のLLMの多言語評価性能を包括的に分析する。
参照応答をプロンプトから除外すると、様々な言語のパフォーマンスが向上することがわかった。
LLMに基づく評価器の多くは、低リソース言語よりも、高リソース言語における人間の判断と高い相関関係を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:04:29 GMT)
Dual Reasoning: A GNN-LLM Collaborative Framework for Knowledge Graph Question Answering [38.3] 我々は、知識グラフ(KGs)の明示的推論のために、グラフニューラルネットワーク(GNN)に基づく外部システムを統合する新しいフレームワークであるDual-Reasoningを提案する。
我々は,DualRが高効率と解釈性を維持しつつ,最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:49:04 GMT)
FILM: Framework for Imbalanced Learning Machines based on a new unbiased performance measure and a new ensemble-based technique [37.9] 本研究は,バイナリ分類タスクの非バランスなデータセットを扱う際の課題に対処する。
標準評価指標は、しばしば少数民族の不均等な表現に偏っている。
本稿では, バイアスを著しく低減した新しい指標Unbiased Integration Coefficientsを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:15:56 GMT)
M3HF: Multi-agent Reinforcement Learning from Multi-phase Human Feedback of Mixed Quality [37.7] 混合品質の多相フィードバック(M3HF)から多エージェント強化学習を導入する。
M3HFはMARLトレーニングプロセスに混成品質のマルチフェーズフィードバックを統合する新しいフレームワークである。
提案手法は,様々な品質レベルにまたがるニュアンスされた人間の洞察の統合を可能にし,マルチエージェント協調の解釈可能性と堅牢性を高める。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:50:31 GMT)
Prompting with Phonemes: Enhancing LLMs' Multilinguality for Non-Latin Script Languages [37.6] そこで本研究では,音声の書き起こしを補完信号として活用し,スクリプト不変表現を誘導する手法を提案する。
In-context Learning (ICL) における音素文字と正書法文字がそれぞれ異なる例を検索することを示す。
これにより、提案したMixed-ICL検索戦略のモチベーションが得られ、両者のさらなる集約により性能が大幅に向上する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:46:40 GMT)
How to Move Your Dragon: Text-to-Motion Synthesis for Large-Vocabulary Objects [37.1] 多様なオブジェクトカテゴリのためのモーション合成は、3Dコンテンツ作成に大きな可能性を秘めている。
本稿では,多種多様かつ不明瞭な物体に対するテキスト記述から高忠実な動きを生成する手法を提案する。
実験により,本手法は多種多様かつ見えざる物体のテキスト記述から高忠実な動きを生成することができることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:39:09 GMT)
Federated Inverse Probability Treatment Weighting for Individual Treatment Effect Estimation [37.0] 個別治療効果(ITE)の推定は、医療において重要な問題である。
FED-IPTWは、IPTWをフェデレートした設定に拡張する新しいアルゴリズムである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:24:34 GMT)
Leveraging Domain Knowledge at Inference Time for LLM Translation: Retrieval versus Generation [36.4] 機械翻訳(MT)において,大規模言語モデル (LLM) がますます採用されている。
本研究は,LLMを用いたドメイン適応MTについて,慎重なプロンプト設定により検討する。
実演は用語学を一貫して上回り、検索は生成を一貫して上回ります。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:23:07 GMT)
LLMVoX: Autoregressive Streaming Text-to-Speech Model for Any LLM [35.4] 本稿では、低レイテンシで高品質な音声を生成する軽量で自己回帰型ストリーミングTSシステムを提案する。
提案手法は,音声対応LLMに比べて単語誤り率を著しく低くし,レイテンシとUTMOSスコアに匹敵する操作を行う。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:59:38 GMT)
Implicit Cross-Lingual Rewarding for Efficient Multilingual Preference Alignment [35.2] 提案手法は,暗黙の報奨によって適切に整合した英語モデルからの好みを捉え,反復学習を通じて他言語に伝達する手法である。
2回に分けて微調整したLlama3はウィンレートを平均12.72%改善し、X-AlpacaEvalのリーダーボード上でのトレーニング言語全体の長さ制御ウィンレートを5.97%向上させた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:33:01 GMT)
No More Sliding Window: Efficient 3D Medical Image Segmentation with Differentiable Top-k Patch Sampling [34.5] No-More-Sliding-Window (NMSW)は、3Dセグメンテーションのための新しいエンドツーエンドのトレーニング可能なフレームワークである。
NMSWは、最も関連するパッチのみを選択的にサンプリングするために、差別化可能なTop-kモジュールを使用している。
H100 GPUでは9.1倍高速な推論、Xeon Gold CPUでは11.1倍高速な推論を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:05:23 GMT)
The Challenge of Identifying the Origin of Black-Box Large Language Models [34.3] サードパーティは、微調整によって大きな言語モデル(LLM)をカスタマイズでき、ブラックボックスのAPIアクセスのみを提供する。
この慣行は不正競争を悪化させるだけでなく、ライセンス契約に違反している。
本稿では,LLMに逆トークン埋め込みを積極的にプラグインしてトレースと識別を行うPlugAEを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:30:32 GMT)
ToFu: Visual Tokens Reduction via Fusion for Multi-modal, Multi-patch, Multi-image Task [34.3] ToFuは視覚的エンコーダに依存しない,トレーニング不要な,高解像度でマルチイメージなタスクのためのToken Fusion戦略を提案する。
LLaVA-Interleave Benchは,マルチイメージタスクに挑戦する手法である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:00:59 GMT)
HELMET: How to Evaluate Long-Context Language Models Effectively and Thoroughly [34.2] HELMETは7つの多様なアプリケーション中心のカテゴリを包含する総合ベンチマークである。
NIAHのような合成タスクは、下流のパフォーマンスを確実に予測できない。
ほとんどのLCLMは完全なNIAHスコアを達成しているが、タスクが完全コンテキスト推論を必要とする場合、オープンソースモデルはクローズドなスコアよりも大幅に遅れている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:41:54 GMT)
Diff-Reg v2: Diffusion-Based Matching Matrix Estimation for Image Matching and 3D Registration [33.8] 本稿では,行列空間における拡散モデルを利用して,ロバストマッチング行列推定を行う革新的パラダイムを提案する。
具体的には、3D-3Dおよび2D-3D登録タスクに対して2次元行列空間に拡散モデルを適用する。
3つの登録タスクすべてに対して、各タスクの特定の特性に合わせた適応的マッチング行列埋め込み実装を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:13:27 GMT)
SynGraph: A Dynamic Graph-LLM Synthesis Framework for Sparse Streaming User Sentiment Modeling [33.7] eコマースプラットフォームのユーザレビューは、時間的および文脈的要因によって引き起こされる動的な感情パターンを示す。
従来の感情分析手法は、ユーザの感情評価とテキストコンテンツの間の時間的関係を捉えるのに失敗する。
本稿では,ストリーミングレビューにおける感情分析におけるデータの空間性に対処する新しいフレームワークであるSynGraphを紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:05:33 GMT)
TimeFound: A Foundation Model for Time Series Forecasting [33.6] TimeFoundはエンコーダ・デコーダ・トランスフォーマーベースの時系列基礎モデルである。
複数のスケールで複雑な時間パターンをキャプチャするために,マルチレゾリューションパッチ方式を用いる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:55:45 GMT)
Manta: Enhancing Mamba for Few-Shot Action Recognition of Long Sub-Sequence [33.4] 数ショットのアクション認識では、ビデオの長いサブシーケンスは、アクション全体をより効果的に表現する。
最近のMambaは、長いシーケンスをモデリングする効率を示すが、MambaをFSARに直接適用することは、局所的な特徴モデリングとアライメントの重要性を見落としている。
これらの課題を解決するために,Matryoshka MAmba と CoNtrasTive LeArning フレームワーク (Manta) を提案する。
Mantaは、SSv2、Kineetics、UCF101、HMDB51などの著名なベンチマークで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:26:33 GMT)
QuietPaw: Learning Quadrupedal Locomotion with Versatile Noise Preference Alignment [32.7] 四足歩行ロボットの騒音は、家やオフィス、病院といった人間中心の環境を妨害する可能性がある。
そこで我々は,騒音の低減レベルにポリシーの振舞いを条件付けることで,フレキシブルでノイズ対応のロコモーションを可能にする,制約付き学習ベースアルゴリズムQuietPawを提案する。
我々はシミュレーションと実世界における我々のアプローチを検証し、CNCPがロコモーション性能と雑音制約を効果的にバランスできることを実証した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:20:04 GMT)
A Generalist Cross-Domain Molecular Learning Framework for Structure-Based Drug Discovery [32.6] 構造に基づく薬物発見(Structure-based drug discovery、SBDD)は、標的タンパク質の詳細な物理的構造を利用して新しい薬物を開発する体系的な科学的プロセスである。
生体分子の事前学習モデルの最近の進歩は、様々な生化学的応用において顕著な成功を収めている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:04:56 GMT)
Shifting Long-Context LLMs Research from Input to Output [32.2] 本稿は,NLP研究におけるパラダイムシフトの提唱である。
小説の執筆、長期計画、複雑な推論といったタスクは、広範囲のコンテキストを理解し、一貫性があり、文脈的にリッチで論理的に一貫した拡張テキストを生成するモデルを必要とする。
我々は、この未探索領域の重要性を強調し、高品質で長期のアウトプットを生み出すのに適した基礎的LLMの開発に焦点をあてる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:59:37 GMT)
FuseChat-3.0: Preference Optimization Meets Heterogeneous Model Fusion [32.1] FuseChat-3.0は、異種音源LLMの強みをよりコンパクトな目標LLMに組み込むことによって開発された大型言語モデル(LLM)のスイートである。
ターゲットモデルでは、Llama-3.1-8B-インストラクト、Gemma-2-9B-it、Qwen-2.5-72B-インストラクトの3種類に焦点をあてる。
結果として得られたFuseChat-3.0モデルは、命令追従、一般的な知識、数学、コーディングといったタスク間で大きなパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:03:36 GMT)
Safety is Not Only About Refusal: Reasoning-Enhanced Fine-tuning for Interpretable LLM Safety [31.9] 大きな言語モデル(LLM)は、従来の安全アライメントの弱点を利用するジェイルブレイク攻撃に対して脆弱である。
解釈可能なLLM安全性のための推論強化ファインタニング(Rational)を提案する。
合理的列車は、応答前に明確な安全な推論を行うようにモデル化する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:47:45 GMT)
Uncovering Gaps in How Humans and LLMs Interpret Subjective Language [31.9] 人間は直接言語モデル(LLM)に主観的自然言語に依存することが多い
本研究では,LLMの実際の運用意味論と人間が期待するものとの相違点を明らかにする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:43:35 GMT)
Mocap-2-to-3: Lifting 2D Diffusion-Based Pretrained Models for 3D Motion Capture [31.8] Mocap-2-to-3は複雑な3D動作を2Dポーズに分解する新しいフレームワークである。
我々は2次元データを活用し,多様なシナリオにおける3次元運動再構成を向上する。
実世界のデータセット上でのモデルの性能を評価する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:32:49 GMT)
WeakMedSAM: Weakly-Supervised Medical Image Segmentation via SAM with Sub-Class Exploration and Prompt Affinity Mining [31.8] 弱教師付きSAMベースセグメンテーションモデルであるWeakMedSAMについて検討し,ラベリングコストの低減を図る。
特に,提案するWeakMedSAMは, 医用画像における重度の共起を緩和するモジュールと, クラスアクティベーションマップの品質向上のためのモジュールの2つを含む。
本手法はSAMUSおよびEfficientSAMを用いて実験を行った。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:28:44 GMT)
Robust Data Watermarking in Language Models by Injecting Fictitious Knowledge [31.8] トレーニングデータにコヒーレントで確実な知識を注入する新しいデータ透かし手法を提案する。
我々の透かしはLLMによって効果的に記憶され、透かしの密度、長さ、および属性の多様性の増大によって記憶が強化されることを実証した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:40:51 GMT)
DAST: Difficulty-Adaptive Slow-Thinking for Large Reasoning Models [31.2] 本稿では,問題の難易度に基づいて,モデルがチェーン・オブ・ソート(CoT)の長さを自律的に調整できる新しいフレームワークであるDASTを紹介する。
多様なデータセットとモデルスケールの実験により、DASTは複雑な問題に対する推論精度を維持しながら、過剰思考を効果的に軽減することを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:23:06 GMT)
Careful with that Scalpel: Improving Gradient Surgery with an EMA [30.9] 簡単な和以上の勾配をブレンドすることで、パフォーマンスを向上させる方法を示す。
我々は,我々の手法であるBloopが,NLPおよび視覚実験において,より優れた性能を実現することを実証した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:57:29 GMT)
Human Motion Instruction Tuning [30.7] 本稿では,人間の動作指導のためのフレームワークであるLLaMoについて述べる。
LLaMoは、命令チューニングのためのネイティブフォームで動作を保持します。
ビデオデータとモーションデータをテキスト入力と共に処理することで、LLaMoは柔軟な人間中心の分析を可能にする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:06:49 GMT)
Enhancing SAM with Efficient Prompting and Preference Optimization for Semi-supervised Medical Image Segmentation [30.5] 完全教師なし方式で生成されるアノテーション効率のよいプロンプトを利用するSAM(Segment Anything Model)フレームワークを提案する。
我々は、モデルが高忠実度セグメンテーションを生成できるように最適なポリシーを設計するために、直接選好最適化手法を採用する。
X線, 超音波, 腹部CTなど多彩な領域にわたる肺分節, 乳房腫瘍分節, 臓器分節などのタスクにおける我々のフレームワークの最先端性能は, 低アノテーションデータシナリオにおけるその有効性を正当化するものである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:28:48 GMT)
A Dataset and Benchmark for Shape Completion of Fruits for Agricultural Robotics [30.5] 本稿では,農業用視覚システムのための3次元形状補完データセットを提案する。
果実の3次元形状を推定するためのRGB-Dデータセットを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:06:01 GMT)
CEPA: Consensus Embedded Perturbation for Agnostic Detection and Inversion of Backdoors [30.1] ディープニューラルネットワーク(DNN)における(バックドア攻撃)トロイの木馬に対する様々な防御策が提案されている。
バックドアに依存しない手法は、攻撃者が使用する組み込み機構に関係なく、バックドアを確実に検出および/または緩和しようとする。
バックドアを推定(反転)し,対象とするクラスを特定するために,組込み特徴表現に依存する新しい検出器について述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:00:04 GMT)
Procedural Knowledge in Pretraining Drives Reasoning in Large Language Models [30.1] 推論タスクを行う際に,大規模言語モデルが採用する一般化戦略について検討する。
以上の結果から, モデルを用いた推論手法は検索と異なり, より一般化可能な戦略であることが示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:14:17 GMT)
PALo: Learning Posture-Aware Locomotion for Quadruped Robots [29.6] 本稿では,姿勢認識型移動ロボットPALoのエンド・ツー・エンド深部強化学習フレームワークを提案する。
PALoは、直線速度と角速度の同時追跡と、体高、ピッチ、ロール角度のリアルタイム調整を行う。
PALoは、シミュレートされた環境でアジャイルな姿勢認識ロコモーションコントロールを実現し、微調整なしで実世界の設定に転送することに成功した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:13:59 GMT)
Integrating Protein Dynamics into Structure-Based Drug Design via Full-Atom Stochastic Flows [29.5] 従来の構造に基づく薬物設計(SBDD)アプローチは、一般的に堅固な構造を持つ結合部位をターゲットにしている。
本稿では,タンパク質ポケットのコンフォメーション変化を考慮したSBDD生成モデルを提案する。
我々は,DynamicFlowがアポポケットやノイズポケットをホロポケットやそれに対応する3D分子に変換することを学習していることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:34:44 GMT)
FluidNexus: 3D Fluid Reconstruction and Prediction from a Single Video [29.4] 現在の方法では、流体再構成のためのマルチビュービデオが必要である。
我々はビデオ生成と物理シミュレーションを橋渡しする新しいフレームワークであるFluidNexusを紹介する。
本手法は, 単一流体映像からの動的新規ビュー合成, 将来予測, 相互作用シミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:59:06 GMT)
An Information-theoretic Multi-task Representation Learning Framework for Natural Language Understanding [29.4] 本稿では,新しい多タスク表現学習フレームワーク(InfoMTL)を提案する。
すべてのタスクに対して共有表現が十分であることを保証し、冗長な機能によるネガティブな影響を軽減する。
マルチタスクパラダイムの下で、事前訓練された言語モデル(PLM)の言語理解を強化することができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:59:51 GMT)
On Expert Estimation in Hierarchical Mixture of Experts: Beyond Softmax Gating Functions [29.1] Hierarchical Mixture of Experts (HMoE)は、複雑な入力の処理とターゲットタスクのパフォーマンス向上に長けている。
我々の分析では,従来のHMoEフレームワークにおけるSoftmaxゲーティングよりもLaplaceゲーティング関数を使うことの利点を強調した。
様々なシナリオにまたがる実証的な検証は、これらの理論的な主張を支持している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:09:01 GMT)
Assisting Mathematical Formalization with A Learning-based Premise Retriever [29.1] 本稿では,数学の形式化を支援するために,前提レトリバーを訓練する革新的な手法を提案する。
我々のアプローチでは、証明状態と前提を共有潜在空間に埋め込むためにBERTモデルを採用しています。
形式化プロセスの合理化を図り,証明状態を用いてMathlibの定理を直接問合せできる検索エンジンをリリースする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:51:24 GMT)
ReasonGraph: Visualisation of Reasoning Paths [28.9] ReasonGraphは、LLM(Large Language Models)推論プロセスの可視化と解析を行うWebベースのプラットフォームである。
シーケンシャルおよびツリーベースの推論手法をサポートし、主要なLCMプロバイダと50以上の最先端モデルを統合している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:03:55 GMT)
Cross-Modal Prototype based Multimodal Federated Learning under Severely Missing Modality [28.9] MFCPL (Multimodal Federated Cross Prototype Learning) は、MFLにおいて、高度に欠落したモダリティの下での新たなアプローチである。
MFCPLは、モダリティ共有レベルにおいて、クロスモーダル正規化とクロスモーダルコントラスト機構を備えたモダリティ固有レベルと共に多様なモダリティ知識を提供する。
本手法では,モーダリティに特有な特徴の正規化を実現するために,クロスモーダルアライメントを導入し,全体的な性能を向上させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:38:00 GMT)
Chunking the Critic: A Transformer-based Soft Actor-Critic with N-Step Returns [28.8] SAC(Soft Actor-Critic)は批判的ネットワークに依存している。
N-returnsフレームワークを安定かつ効率的に統合したTransformer-based Critic Network for SACを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:32:00 GMT)
Adapt3R: Adaptive 3D Scene Representation for Domain Transfer in Imitation Learning [28.8] キャリブレーションされたRGBDカメラからの観察を取り入れた3次元シーン表現は、ILポリシーの一般化性を改善する方法として提案されている。
本稿では、1つ以上のRGBDカメラからのデータを1つのベクトルに合成し、任意のILアルゴリズムの条件付けとして使用できる新しいアーキテクチャを用いたAdaptive 3D Scene Representation(Adapt3R)を提案する。
我々は,複数のSOTAマルチタスクILアルゴリズムを用いてエンドツーエンドにトレーニングを行った場合,Adapt3Rはこれらのアルゴリズムのマルチタスク学習能力を維持しつつ,新規なエンボディメントやカメラポーズへのゼロショット転送を可能にしていることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:17:09 GMT)
Balcony: A Lightweight Approach to Dynamic Inference of Generative Language Models [28.8] Balconyは深度に基づく動的推論のためのフレームワークである。
完全なモデルの性能を維持しつつ、異なる計算予算へのリアルタイム適応を可能にしている。
注目すべきことに、BalconyはFlextronやLayerskipのような最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:09:55 GMT)
An artificially intelligent magnetic resonance spectroscopy quantification method: Comparison between QNet and LCModel on the cloud computing platform CloudBrain-MRS [28.6] 本研究は,ヒト脳磁気共鳴分光法(MRS)の代謝物定量化を,深層学習法QNetと従来のLCModelとで統計的に比較することを目的とした。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:19:55 GMT)
Weak-to-Strong Preference Optimization: Stealing Reward from Weak Aligned Model [28.6] この研究は弱強一般化に触発され、弱いモデルによって生成されるラベルに強いLMを微調整することで、弱いスーパーバイザーを一貫して上回る。
Weak-to-Strong Preference Optimization (WSPO)を提案し、弱いモデルのアライメント前後の分布差を学習することにより、強力なモデルアライメントを実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:45:40 GMT)
Explaining Caption-Image Interactions in CLIP models with Second-Order Attributions [28.5] CLIPモデルは、2種類の入力を共有埋め込み空間にマッピングし、それらの類似性を予測します。
しかし、その成功にもかかわらず、これらのモデルがどのように2つの入力を比較するかは理解されていない。
一般的な1次特徴属性法は、デュアルエンコーダに対する限られた洞察しか提供できない。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:00:18 GMT)
Pathfinder for Low-altitude Aircraft with Binary Neural Network [28.3] 以前のグローバルトポロジマップ(例えば、OpenStreetMap, OSM)は、地上移動ロボットによる自律的マッピングの性能を高めることができる。
本稿では,低高度航空機が搭載する空中センサを用いたOSMメーカを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:26:08 GMT)
AgentSafe: Safeguarding Large Language Model-based Multi-agent Systems via Hierarchical Data Management [28.1] 大規模言語モデルに基づくマルチエージェントシステムは、自律的なコミュニケーションとコラボレーションに革命をもたらしている。
本稿では,階層的な情報管理とメモリ保護を通じてMASセキュリティを強化する新しいフレームワークであるAgentSafeを紹介する。
AgentSafeには2つのコンポーネントが含まれている: ThreatSieveは情報権限の検証と不正行為の防止によって通信を保護する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:41:54 GMT)
Scale-Invariant Adversarial Attack against Arbitrary-scale Super-resolution [28.1] 局所連続画像関数(LIIF)は、任意のスケールの超解像(SR)技術に対して大きな注目を集めている。
敵の攻撃に対する連続表現に基づく任意のスケールのSRの堅牢性は、さらなる探索を保証している領域のままである。
本稿では, SIAGT と呼ばれる, 高い転送性を有する簡易かつ効果的なスケール不変な SR 逆攻撃法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:36:35 GMT)
Learning Object Placement Programs for Indoor Scene Synthesis with Iterative Self Training [27.8] データ駆動および自己回帰型屋内シーンシステムは、オブジェクトを1つずつ提案し、配置することで、自動的にシーンを生成する。
機能制約を規定するドメイン固有言語を設計する。
我々は、新しいプログラムブートストラップアルゴリズムを導入するために、教師なしプログラム誘導における以前の作業を構築した。
また,従来のシステムと同等の品質の屋内シーンも生成し,トレーニングデータが少ないと性能が低下するのに対して,システムは同じ程度に劣化しない。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:44:25 GMT)
EVE: Towards End-to-End Video Subtitle Extraction with Vision-Language Models [27.7] 本稿では,視覚エンコーダ,アダプタモジュール,大規模言語モデルという3つのモジュールからなる,EVEと呼ばれるエンドツーエンドビデオ字幕抽出手法を提案する。
視覚エンコーダから視覚トークンを効果的に圧縮するために,2つのモダリティをインターリーブする新しいアダプタInterleavedVTを提案する。
ビデオ字幕抽出タスクをベンチマークするために,2.5Mビデオを含む大規模なデータセットViSaを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:19:56 GMT)
A Benchmark for Multi-Lingual Vision-Language Learning in Remote Sensing Image Captioning [27.4] リモートセンシング画像キャプチャー(Remote Sensing Image Captioning、RSIC)は、リモートセンシング画像における特徴やシーンの自然言語記述を自動的に生成することを目的とした、クロスプラットフォームの視野と言語である。
非英語記述データセットの不足とモデルに対する多言語能力評価の欠如という2つの重要な課題が続いている。
本稿では,68,170のバイリンガルキャプションと組み合わせた13,634枚の画像を含む,3つの確立した英語RSICデータセットを中国語記述で強化した包括的バイリンガルデータセットであるBRSICを紹介し,分析する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:31:34 GMT)
Incentivizing Multi-Tenant Split Federated Learning for Foundation Models at the Network Edge [27.2] Split Federated Learning (SFL)は、リソース制約のあるローカルデバイス上での、プライバシー保護のFM微調整を容易にする。
独立デバイス参加によるモデルバイアスを排除するため, バイアス耐性を持つグローバルSFLモデルアグリゲーション手法を開発した。
そこで,不均一デバイスによるFM性能向上への寄与を評価するために,厳密なSFL収束を導出する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:06:27 GMT)
The Role of Visual Modality in Multimodal Mathematical Reasoning: Challenges and Insights [26.9] 既存のマルチモーダルな数学的モデルでは視覚情報を最小限に活用できることを示す。
これは、意図せずモデルに回答を誘導するテキスト情報と回答オプションの優位性に起因している。
先行モデルをテストする際、微妙な視覚的差異を検知できないことは、現在の視覚知覚能力の限界を示唆している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:29:33 GMT)
Meta-Learned Modality-Weighted Knowledge Distillation for Robust Multi-Modal Learning with Missing Data [26.8] マルチモーダル学習では、いくつかのモダリティは他のモダリティよりも影響を受けており、それらの欠如は分類・分類精度に大きな影響を及ぼす可能性がある。
本稿では,メタ学習型モダリティ重み付き知識蒸留(MetaKD)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:51:28 GMT)
NormAd: A Framework for Measuring the Cultural Adaptability of Large Language Models [26.6] 大規模言語モデル(LLM)は、ユーザ価値や文化にアウトプットを適応させる必要があります。
LLMの文化的適応性を評価するための評価フレームワークであるNormAdを紹介する。
我々はNormAd-Etiを作成した。これは、75か国における、社会的な倫理的関連文化規範を表す2.6kの状況記述のベンチマークである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:13:04 GMT)
Layer-Specific Scaling of Positional Encodings for Superior Long-Context Modeling [26.3] 大規模言語モデルは、文脈の中央にある重要な情報が不足したり、失われたりする、という「中間者」の問題に悩まされる。
本稿では,各層に異なるスケーリング要素を割り当てるレイヤ固有の位置符号化スケーリング手法を提案する。
提案手法により,Key-Value Retrievalデータセットの平均精度は最大20%向上した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:59:55 GMT)
Bridging the Vision-Brain Gap with an Uncertainty-Aware Blur Prior [26.2] 我々はtextbfUncertainty-aware Blur Prior (UBP) と呼ばれるシンプルで効果的な手法を提案する。
これは、脳信号と視覚刺激のミスマッチを反映して、ペアデータ内の不確実性を推定する。
本手法は,ゼロショット脳画像検索タスクにおいて,textbf50.9%のTop-1精度とtextbf79.7%のTop-5精度を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:31:40 GMT)
HybridNorm: Towards Stable and Efficient Transformer Training via Hybrid Normalization [25.9] 本稿では,プレノーム法とポストノーム法の両方の利点を統合した,単純かつ効果的なハイブリッド正規化戦略を提案する。
テストの結果、HybridNormはPre-NormとPost-Normの両方のアプローチを一貫して上回っている。
これらの知見は、ディープトランスモデルのトレーニングと性能を改善するためのより安定的で効果的な手法として、HybridNormの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:40:48 GMT)
Ticktack : Long Span Temporal Alignment of Large Language Models Leveraging Sexagenary Cycle Time Expression [25.7] 大規模言語モデル(LLM)は、特に長期にわたって時間的ミスアライメントの問題に悩まされる。
本稿では,LLMの長期的不整合に対処する手法として,Ticktack(ティックタック)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:59:09 GMT)
Continual Pre-training of MoEs: How robust is your router? [25.4] MoEは、トレーニング時のサンプル効率の改善と、より強力なパフォーマンスの恩恵を受ける。
多くのクローズドソースおよびオープンソースフロンティア言語モデルは、MoEアーキテクチャを採用している。
CPTにおいて, MoE LLMはサンプル効率(FLOP整合密度モデルと比較して)を維持し, 完全に再学習した MoE の性能を, コストのごく一部で一致させることができることを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:55:01 GMT)
Dynamic Pricing for On-Demand DNN Inference in the Edge-AI Market [25.4] 収益最適化のためのオークションベースのエッジ推論価格メカニズム(AERIA)。
オンデマンドDNN推論高速化のためのマルチエグジットデバイスエッジのシナジスティック推論方式について検討する。
当社のAERIAメカニズムは、Edge-AI市場におけるオンデマンド推論におけるAERIAの有効性を実証し、収益における最先端のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:08:31 GMT)
Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models [25.3] Retrieval-augmented Large Language Models (RALMs) は、元の検索自由言語モデル (LMs) を一貫して上回るものではない。
提案実験により, この例レベルの性能不整合性は, 検索強化と検索不要のLMの間だけでなく, 異なる検索者の間にも存在することが明らかとなった。
本稿では,異なる知識ソースから適応的に検索し,予測不能な読み出し誤りを効果的に低減できるトレーニング可能なフレームワークであるEnsemble of Retrievers(EoR)を紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:34:13 GMT)
Conformal Prediction with Upper and Lower Bound Models [25.3] 本稿では,回帰条件下での予測区間構築のための Conformal Prediction (CP) 手法について検討する。
モデル選択アプローチを採用することで、後処理を超える新しいCPメカニズム(CPUL)を提案する。
OMLTという最適しきい値設定機構を提案し,CPUL間隔をアンダーカバーで調整する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:07:25 GMT)
BackdoorMBTI: A Backdoor Learning Multimodal Benchmark Tool Kit for Backdoor Defense Evaluation [25.1] バックドア攻撃の範囲はコンピュータビジョンを超えて拡大しており、自然言語処理や音声認識などの領域に侵入している。
BackdoorMBTIは、マルチモーダル評価のために設計された最初のバックドア学習ツールキットとベンチマークである。
BackdoorMBTIは、データ処理、データ中毒、バックドアトレーニング、評価を含む、体系的なバックドア学習パイプラインを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:50:21 GMT)
Label Distribution Learning-Enhanced Dual-KNN for Text Classification [25.0] トレーニング中にモデル自体が生成した内部情報、例えばテキスト埋め込みや予測ラベル確率分布は、いくつかのテキストの結果を予測する際に悪用される。
2つの$k$NNモジュールを持つ2つの$k$近辺(D$k$NN)フレームワークを提案し、トレーニングセットから複数の隣人を検索し、ラベルの分布を拡大する。
また,ラベルの類似性を学習するラベル分布学習モジュールを導入し,より優れたラベル分布を生成することにより,モデルによるテキストの識別をより効果的に行えるようにした。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:15:26 GMT)
E4: Energy-Efficient DNN Inference for Edge Video Analytics Via Early-Exit and DVFS [24.9] ディープニューラルネットワーク(DNN)モデルは、エッジビデオ分析アプリケーションでますます人気が高まっている。
現在のソリューションでは、ビデオフレームのさまざまな複雑さを考慮できないため、エッジビデオ分析では、サブ最適パフォーマンスが期待できる。
本稿では,エッジビデオ解析におけるDNN推論効率を向上させるためのエネルギー効率の良い早期実行フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:41:28 GMT)
CATCH: Channel-Aware multivariate Time Series Anomaly Detection via Frequency Patching [24.9] 周波数パッチに基づくフレームワークであるCATCHを紹介する。
本稿では,パッチワイドマスクジェネレータとマスクアテンション機構を備えたChannel Fusion Module (CFM)を提案する。
10の現実世界のデータセットと12の合成データセットの実験は、CATCHが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:39:32 GMT)
Adding Alignment Control to Language Models [24.8] 本稿では,CLMと呼ばれる単一モデルにアライメント制御を組み込む手法を提案する。
このアプローチでは、初期レイヤの前に1つのID層を追加し、このレイヤ上でのみ好みの学習を行い、不整合入力トークンの埋め込みを整合空間にマッピングする。
実験により, この効率的な微調整法は完全微調整に匹敵する性能を示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:42:03 GMT)
ML-Based Behavioral Malware Detection Is Far From a Solved Problem [24.7] マルウェア検出は、セキュリティにおける機械学習(ML)のユビキタスな応用である。
デプロイメントでは、エンドポイントホストのマルウェア検出は、サンドボックスからではなく、エンドポイントホストから取得したトレースに依存する必要があることが多い。
実世界のエンドポイントにおけるMLベースのマルウェア検知器の性能を初めて測定する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:40:57 GMT)
Understanding Expert Structures on Minimax Parameter Estimation in Contaminated Mixture of Experts [24.7] 汚染された専門家の混合物におけるパラメータ推定の収束解析を行う。
このモデルは、専門家として定式化できるプロンプトを利用して、下流のタスクを学習するための大規模な事前学習モデルを微調整する、素早い学習問題から動機付けられている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:46:29 GMT)
Automatically Labeling Clinical Trial Outcomes: A Large-Scale Benchmark for Drug Development [24.7] 臨床試験アウトカム(CTO)ベンチマークは、約125,000の薬物および生物学的試験を含む、完全に再現可能な大規模リポジトリである。
成績ラベルの品質と信頼性を高めるため,2020年から2024年にかけて行われた臨床試験のデータセットを手動でアノテートした。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:41:55 GMT)
Runtime Backdoor Detection for Federated Learning via Representational Dissimilarity Analysis [24.6] フェデレーションラーニング(FL)は、分散クライアントからモデル更新を集約することで、共有モデルをトレーニングする。
モデル学習をローカルデータから切り離すことで、FLはバックドア攻撃に対して非常に脆弱になる。
本稿では,悪意のあるクライアントを,正確で安定的で効率的な方法で検出する手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:23:18 GMT)
Data-driven Error Estimation: Upper Bounding Multiple Errors without Class Complexity as Input [24.5] 私たちはこれを「エラー推定問題」と捉えています。
目標は、推定クラスの最大誤差の高確率上限を決定することである。
有限なクラス設定と無限なクラス設定の両方にそのような境界を導出する、完全にデータ駆動のアプローチを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:17:07 GMT)
Investigating Non-Transitivity in LLM-as-a-Judge [24.4] 本稿では,AlpacaEvalフレームワークにおける非透過性の存在について検討し,モデルランキングに対するその影響を分析する。
ラウンドロビントーナメントの計算コストに対処するため,スイス・ワイズ・イテレーティブ・マッチメイキング(Swim)トーナメントを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:32:54 GMT)
A Graph-Partitioning Based Continuous Optimization Approach to Semi-supervised Clustering Problems [24.2] 我々は、半教師付きクラスタリングタスクを、与えられたデータセットに関連付けられたグラフ上のパーティショニング問題とみなす。
このモデルを効率的に解くためにブロック座標降下アルゴリズムを提案する。
穏やかな仮定の下で、理論的には必須リンク制約を満たすクラスタを構築することができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:02:28 GMT)
L1: Controlling How Long A Reasoning Model Thinks With Reinforcement Learning [24.0] 推論言語モデルは、より長いチェーン・オブ・シークエンスを生成することによって、より長い'、つまり、より長い'、という考え方によって、テスト時のパフォーマンスを改善する能力を示している。
長長制御政策最適化(Longth Controlled Policy Optimization、LCPO)は、ユーザ指定長制約に対する精度と順守を最適化する強化学習手法である。
LCPOは推論長を正確に制御することができ、テスト時間計算と精度の微粒化を可能にしている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:43:29 GMT)
Reproducibility Assessment of Magnetic Resonance Spectroscopy of Pregenual Anterior Cingulate Cortex across Sessions and Vendors via the Cloud Computing Platform CloudBrain-MRS [23.9] この研究は、異なるセッション、マシンモデル、さらには3つのTスキャナーの異なるベンダーから得られる代謝物濃度が再現性が高く、診断分析のためにプールされているかどうかを決定することである。
参加者は1週間以内に2日間に1度MRI検査を受けた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:06:50 GMT)
Beyond Single Concept Vector: Modeling Concept Subspace in LLMs with Gaussian Distribution [23.6] 本稿では,特定の概念を表す部分空間を近似する手法を提案する。
我々は,GCSの有効性を,複数の大規模言語モデルにまたがる忠実度と妥当性を計測することによって実証する。
また、感情ステアリングなどの実世界の応用において、表現介入タスクを用いてその効果を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:50:28 GMT)
Provable Robust Overfitting Mitigation in Wasserstein Distributionally Robust Optimization [23.2] 本稿では,ワッサーシュタイン距離と統計的誤差による対向雑音に対する新しい不確実性セットの下で,新しいロバストな最適化フレームワークを提案する。
我々は,WDROの枠組みにおいて,ロバストなオーバーフィッティングを著しく軽減し,ロバスト性を高めることを実証した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:58:35 GMT)
Towards Generalizable Reinforcement Learning via Causality-Guided Self-Adaptive Representations [22.6] 汎用インテリジェンスには、タスク間の迅速な適応が必要です。
本稿では,分布だけでなく,環境空間も変化するシナリオを幅広く検討する。
我々はCSRと呼ばれる因果性誘導型自己適応表現に基づく手法を導入し、エージェントを効果的に一般化させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:16:08 GMT)
Prompt Programming: A Platform for Dialogue-based Computational Problem Solving with Generative AI Models [22.3] 学生は、しばしば正式な指導や指導なしに、プログラミング支援のために生成AIツールをますます頼りにしている。
このことは、学生にAIモデルと効果的に対話する方法を教える必要性を強調している。
我々は,対話に基づく対話を可能にするプロンプトプログラミングのための新しいプラットフォームを開発した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:56:07 GMT)
CLDyB: Towards Dynamic Benchmarking for Continual Learning with Pre-trained Models [22.0] 本稿では,CL手法を確実に評価するための一般的な計算フレームワークである,動的ベンチマーク(CLDyB)について述べる。
まず、複数の最先端CL手法を共同で評価し、一般に困難なタスクシーケンスと一般化可能なタスクシーケンスのセットを導出する。
CLDyBを用いて個々のCL法を個別に評価し,それぞれの長所と短所を明らかにする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:49:13 GMT)
InterChat: Enhancing Generative Visual Analytics using Multimodal Interactions [22.0] 視覚要素の直接操作と自然言語入力を組み合わせた生成的視覚分析システムであるInterChatを開発した。
この統合により、正確なインテント通信が可能になり、プログレッシブで視覚的に駆動された探索データ分析をサポートする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:35:19 GMT)
Learning from negative feedback, or positive feedback or both [22.0] ポジティブなフィードバックとネガティブなフィードバックから学習を分離する新しいアプローチを導入する。
重要な貢献は、ネガティブなフィードバックだけで安定した学習を示すことです。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:11:57 GMT)
X-Boundary: Establishing Exact Safety Boundary to Shield LLMs from Multi-Turn Jailbreaks without Compromising Usability [21.9] 既存の防御方法は、マルチターンジェイルブレイクに対するLDMの堅牢性を改善するが、ユーザビリティを損なう。
我々は,有害な表現を安全な表現から遠ざけ,正確な識別境界を得るために,X境界を提案する。
実験結果から,X-Boundaryは多ターンジェイルブレイクに対する最先端の防御性能を実現することが示された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:38:31 GMT)
Human-Feedback Efficient Reinforcement Learning for Online Diffusion Model Finetuning [21.7] HEROは、人間のフィードバックを捉え、微調整のための情報学習信号を提供するオンライントレーニング手法である。
HEROは、推論、カウント、パーソナライズ、NSFWコンテンツを0.5Kのオンラインフィードバックで効果的に処理できる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:11:55 GMT)
From Pixels to Trajectory: Universal Adversarial Example Detection via Temporal Imprints [21.5] 我々は,対立例(AE)攻撃による識別可能な時間的(または歴史的)軌跡のインプリントを公表した。
AE検出のためのTRAIT(TRaceable Adrial temporal trajectory ImprinTs)を提案する。
TRAIT は AE 検出精度が 97% を超え、多くの場合 99% 程度であり、偽の拒絶率 1% を維持している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:00:04 GMT)
Wasserstein-regularized Conformal Prediction under General Distribution Shift [21.3] 等式予測は、i.d.仮定の下で真のターゲットの1-alpha$カバレッジが保証された予測セットを生成する。
本稿では、ワッサーシュタイン距離に基づくカバレッジギャップの上界を提案し、確率測度をプッシュフォワードで解析する。
本稿では,重要重み付けと正規化表現学習(WR-CP)に基づくアルゴリズム設計のための分離を利用して,有限サンプル誤差境界のワッサーシュタイン境界を低減する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:22:38 GMT)
Compositional Translation: A Novel LLM-based Approach for Low-resource Machine Translation [20.7] 機械翻訳は、翻訳する文と意味的に類似している場合に、文脈内例の恩恵を受けることが示されている。
本稿では,LLMに基づく新しい翻訳パラダイムである合成翻訳を提案する。
私たちの直感は、これらの短いフレーズは本質的に翻訳が簡単で、関連する例と簡単に一致するので、このアプローチは翻訳を改善するべきだということです。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:37:31 GMT)
OmniGuard: Hybrid Manipulation Localization via Augmented Versatile Deep Image Watermarking [20.7] 既存の多用途透かしアプローチは、タンパーの局所化精度と視覚的品質のトレードオフに悩まされている。
オムニガード(OmniGuard)は、能動的埋め込みと受動的、視覚的抽出を統合した新しい多目的透かし手法である。
コンテナ画像のPSNRは4.25dB、ノイズ条件ではF1スコアは20.7%、平均ビット精度は14.8%である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:49:58 GMT)
Energy-Guided Optimization for Personalized Image Editing with Pretrained Text-to-Image Diffusion Models [20.6] 本稿では,潜在空間における編集画像の最適化として,パーソナライズされたコンテンツ編集を定式化する学習自由フレームワークを提案する。
テキスト・エネルギ・ガイダンスを早期に活用し,対象クラスへの自然な移行を実現するための粗大な戦略を提案する。
ドメインギャップが大きくてもオブジェクト置換が優れている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:52:29 GMT)
GaussianGraph: 3D Gaussian-based Scene Graph Generation for Open-world Scene Understanding [20.6] 本稿では,セマンティッククラスタリングとシーングラフ生成を統合し,3DGSに基づくシーン理解を強化する新しいフレームワークを提案する。
本稿では,シーンスケールや特徴分布に動的に対応し,特徴圧縮を回避する"Control-Follow"クラスタリング戦略を提案する。
2次元基礎モデルから抽出したオブジェクト属性と空間関係を統合することでシーン表現を充実させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:36:59 GMT)
AUTOFRAME -- A Software-driven Integration Framework for Automotive Systems [20.4] この研究は、ソフトウェア定義自動車の複雑さの増加に対処する新しいフレームワークを提示します。
ハードウェア抽象化レイヤと動的ソフトウェアデプロイメント機能を活用して、業界の需要の増大に対応しています。
本研究は,将来の車両の開発・保守を促進する枠組みの可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:58:38 GMT)
Generalizability of Neural Networks Minimizing Empirical Risk Based on Expressive Ability [20.4] 本稿では,経験的リスクを最小限に抑えた,あるいはほぼ最小化したニューラルネットワークの一般化可能性について検討する。
我々は、堅牢な一般化を含む、深層学習におけるいくつかの現象に関する理論的洞察を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:36:35 GMT)
ACC-Collab: An Actor-Critic Approach to Multi-Agent LLM Collaboration [20.0] ACC-CollabはActor-Criticベースの学習フレームワークで、コラボレーションに特化した2エージェントチームを生成する。
ACC-Collabは、幅広いベンチマークでSotAマルチエージェント技術より優れていることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:28:55 GMT)
TinyR1-32B-Preview: Boosting Accuracy with Branch-Merge Distillation [19.9] 本稿では, モデル圧縮を2相で促進するブランチ・マージ蒸留法を提案する。
我々は,DeepSeek-R1を教師とし,DeepSeek-R1-Distill-Qwen-32Bを学生として蒸留アプローチを検証する。
合併したTinyR1-32B-Previewは、複数のベンチマークでDeepSeek-R1-Distill-Qwen-32Bを上回った。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:25:53 GMT)
TIMER: Temporal Instruction Modeling and Evaluation for Longitudinal Clinical Records [19.3] 我々は,患者の記録の異なる部分に接する命令応答ペアを組み込んだフレームワークであるTIMERを紹介する。
縦型EHR上での時間的推論能力を評価する最初のタイムアウェアベンチマークであるTIMER-Benchを開発した。
TIMER-Instructで微調整されたモデルでは、人為的なベンチマークでは7.3%、TIMER-Benchでは9.2%の性能向上が示されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:44:17 GMT)
SonicSim: A customizable simulation platform for speech processing in moving sound source scenarios [19.2] SonicSimは、AIシミュレーションプラットフォームHabitat-simをベースにした合成ツールキットである。
音源を動かすために高度にカスタマイズ可能なデータを生成する。
シーンレベルの調整、マイクレベルの調整、ソースレベルの調整など、マルチレベルの調整をサポートする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:11:26 GMT)
CrowdHMTware: A Cross-level Co-adaptation Middleware for Context-aware Mobile DL Deployment [19.2] CrowdHMTwareは、異種モバイルデバイス向けのコンテキスト適応型ディープラーニング(DL)モデルデプロイメントである。
弾力性推論、スケーラブルオフロード、モデル適応エンジンなど、クロスレベル機能コンポーネント間の自動適応ループを確立する。
DLモデル、オフロード、エンジンアクションをさまざまなプラットフォームやタスクにわたって効果的にスケールできます。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:52:20 GMT)
Sample-Optimal Agnostic Boosting with Unlabeled Data [19.2] Boostingは、親指の不正確なルールから正確な学習アルゴリズムを構築するためのフレームワークを提供する。
本稿は、予期せぬ、これまで探索されなかった改善の道である未ラベルのサンプルを取り上げる。
我々は、最もよく知られたブースティングアルゴリズムにおいて、必要となるサンプルの総数は、ラベル付きおよびラベル付きで、それ以上ではないことを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:54:42 GMT)
TIGER: Time-frequency Interleaved Gain Extraction and Reconstruction for Efficient Speech Separation [19.1] パラメータと計算コストを大幅に削減した音声分離モデルを提案する。
TIGERは事前の知識を活用して周波数帯域を分割し、周波数情報を圧縮する。
我々はTIGERがパラメータ数を94.3%削減し、MACを95.3%削減することを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:03:53 GMT)
End-to-End Human Pose Reconstruction from Wearable Sensors for 6G Extended Reality Systems [19.0] フル3次元ポーズ再構築は,第6世代(6G)ネットワークにおける拡張現実(XR)アプリケーションにとって重要な実現手段である。
従来のアプローチでは、屋内環境でのエラーのない送信を前提としており、実際のシナリオに適用性に制限がある。
我々はOFDMシステム上での人間のポーズ再構築のための新しいディープラーニングベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:52:44 GMT)
dnamite: A Python Package for Neural Additive Models [19.0] 本稿では,ニューラル付加モデル(NAM)を実装したPythonパッケージであるdnamiteを紹介する。
本報告では,dnamiteの基礎となる方法論,設計原理,実装について述べる。
特徴選択と生存分析の両方が重要である実世界の環境で、dnamiteの有用性を実証する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:24:54 GMT)
Towards Edge General Intelligence via Large Language Models: Opportunities and Challenges [19.0] エッジインテリジェンス(EI)は、エッジネットワークの計算能力を活用することで、リアルタイムなローカライズされたサービスを提供する上で重要な役割を果たしている。
大規模言語モデル(LLM)の統合により、EIは次のステージへと進化する。
本調査は, LLMを取り入れたEGIを, 集中型, ハイブリッド型, 分散型という3つの概念システムに分類し, 従来のEIとEGIの区別を明らかにした。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:10:12 GMT)
DB-Explore: Automated Database Exploration and Instruction Synthesis for Text-to-SQL [18.9] 大規模言語モデル(LLM)を用いたデータベース理解のための新しいフレームワークDB-Exploreを提案する。
我々のフレームワークは、多様なサンプリング戦略と自動命令生成を通じて、包括的なデータベース理解を可能にする。
Qwen2.5-coder-7Bモデルに基づくオープンソース実装は、比較評価において複数のGPT-4駆動のテキスト・ツー・コーダシステムより優れている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:46:43 GMT)
Decentralized Sporadic Federated Learning: A Unified Algorithmic Framework with Convergence Guarantees [18.2] 分散学習計算(DFL)は、(i)モデル更新と(ii)モデルアグリゲーションの両方が中央サーバなしでクライアントによって実行されるFL設定をキャプチャする。
$textttDSpodFL$は、ローカルグラデーションとアグリゲーションプロセスの両方において、$textitsporadicity$という一般的な概念に基づいて構築されたDFL方法論である。
$textttDSpodFL$は、さまざまなシステム設定のベースラインと比較して、改善されたスピードを一貫して達成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:07:54 GMT)
FRNet: Frustum-Range Networks for Scalable LiDAR Segmentation [18.2] 最近のレンジビューLiDARセグメンテーションアプローチは、リアルタイム処理の可能性を示唆している。
本稿では,範囲画像のコンテキスト情報の復元を目的とした簡易かつ強力なFRNetを提案する。
4つの人気のあるLiDARセグメンテーションベンチマークで実施された実験はFRNetの優位性を示している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:06:24 GMT)
UniMLVG: Unified Framework for Multi-view Long Video Generation with Comprehensive Control Capabilities for Autonomous Driving [18.2] UniMLVGは、拡張ストリートマルチパースペクティブビデオを生成するために設計された統合フレームワークである。
FIDの48.2%、FVDの35.2%の改善を実現している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:40:15 GMT)
Refined Policy Distillation: From VLA Generalists to RL Experts [18.2] 本稿では,RLに基づく政策精錬法であるRefined Policy Distillation (RPD)を提案する。
RPDにより、RLエージェントは、密集した報酬設定とまばらな報酬設定の両方において、教師のパフォーマンスを上回る専門家のポリシーを学ぶことができる。
我々のアプローチは、カメラの視点の変化に対してさらに堅牢であり、基礎となるVLAが解決できないタスクのバリエーションに一般化することができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:52:11 GMT)
Compositional Causal Reasoning Evaluation in Language Models [18.1] 因果推論と構成推論は、生成的AIにおける2つの中核的な願望である。
コンポジション因果推論(CCR)と呼ばれる,両方の行動を同時に考える統一的な視点を探求する。
我々は,CCRのシステム的評価のためのフレームワークを,平均的治療効果と必要十分性および十分性の可能性のためにインスタンス化する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:47:19 GMT)
Dynamic Benchmarking of Reasoning Capabilities in Code Large Language Models Under Data Contamination [18.0] 潜在的なデータ汚染下でのコードLLMを評価するための新しいベンチマークスイートであるツールを提案する。
ツールは複数のエージェントを使用して、コアロジックを変更することなくコンテキストを抽出し、変更し、意味的に等価なバリエーションを生成する。
その結果、ツールが汚染リスク下での推論能力を効果的にベンチマークし、多様な問題セットを生成し、一貫性と信頼性を保証できることが判明した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:56:59 GMT)
Benchmarking Large Language Models on Multiple Tasks in Bioinformatics NLP with Prompting [18.0] 大規模言語モデル(LLM)は生物学的問題を解決する上で重要なツールとなっている。
我々はBio-benchmarkと呼ばれる総合的なプロンプトベースのベンチマークフレームワークを導入する。
GPT-4oとLlama-3.1-70bを含む6つの主要LCMを0ショットと数ショットのChain-of-Thought設定を用いて評価した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:01:59 GMT)
How can representation dimension dominate structurally pruned LLMs? [18.0] プルーニングは、元のディープニューラルネットワークにサブネットワークが存在すると仮定する。
異なるサブネットワーク抽出によってモデル性能がどう変化するかは明らかでない。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:28:59 GMT)
In-depth Analysis of Graph-based RAG in a Unified Framework [17.9] グラフベースのRetrieval-Augmented Generation (RAG)は、外部知識を大規模言語モデルに統合するのに有効であることが証明されている。
まず、高レベルの観点から全てのグラフベースのRAGメソッドを統合する統一フレームワークを要約する。
次に, 探索探索(QA)データセットに対して, 代表グラフに基づくRAG手法を広範囲に比較する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:34:49 GMT)
Pretrained Embeddings as a Behavior Specification Mechanism [17.9] 仕様言語における第一級コンストラクトとして埋め込みを導入する。
埋め込みベースの仕様は、望ましい行動に向けてシステムを操るのに有効であることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:32:23 GMT)
Knowledge-Decoupled Synergetic Learning: An MLLM based Collaborative Approach to Few-shot Multimodal Dialogue Intention Recognition [17.8] 数発のマルチモーダル対話意図認識のためのトレーニングには、2つの相互接続タスクが含まれる。
この現象は、トレーニング過程における重み行列更新の重畳による知識干渉に起因する。
本稿では,知識を解釈可能な規則に変換する知識分離型シナジー学習を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:28:44 GMT)
A Modular Pipeline for 3D Object Tracking Using RGB Cameras [17.8] 複数の物体の3次元軌跡を計算できる新しいモジュールパイプラインを提案する。
複数のタイム同期および静止カメラが動く物体を記録する様々な設定に適合する。
数百のテーブルセット試行にスケールするが、人間のアノテーション入力はほとんどない。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:14:59 GMT)
Spectral Informed Mamba for Robust Point Cloud Processing [17.7] 本稿では,ポイントクラウドデータにMambaとMasked Autoencoderネットワークを利用する新しい手法を提案する。
複雑なクラウド構造を処理する上で,Mambaの能力を高めるために,3つの重要なコントリビューションを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:32:59 GMT)
LEDiT: Your Length-Extrapolatable Diffusion Transformer without Positional Encoding [17.7] LEDiTはこの制限を克服するためにシンプルだが強力なアーキテクチャである。
256x256 と 512x512 ImageNet の実験では、LEDiT がそれぞれ 512x512 と 1024x1024 にスケールできることが示されている。
LEDiTは、トレーニング済みのDiT上で100Kステップの微調整を行うだけで、強い外挿性能を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:41:36 GMT)
RetinalGPT: A Retinal Clinical Preference Conversational Assistant Powered by Large Vision-Language Models [17.6] 臨床的に好ましい網膜画像の定量的解析のための多モード対話アシスタントであるtextitRetinalGPT を紹介する。
特に網膜GPTは、網膜疾患の診断において、ジェネリックドメインのMLLMよりも大きなマージンで優れている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:19:54 GMT)
Beyond Cosine Decay: On the effectiveness of Infinite Learning Rate Schedule for Continual Pre-training [17.4] ラベルのないデータは、人工知能システムのトレーニングの機会と課題の両方を提示します。
自己教師付き学習は、大量のラベルのないデータから有意義な表現を抽出する強力なパラダイムとして現れてきたが、既存の手法は、それまでの知識を忘れずに、実世界のデータストリームの静的で非IID的な性質に適応することに苦慮している。
本研究では,最近提案された無限学習率スケジュールと広く使用されているコサインスケジュールを体系的に比較し,後者がより効果的な方法であることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:17:08 GMT)
Collaborative Evaluation of Deepfake Text with Deliberation-Enhancing Dialogue Systems [17.2] グループベースの問題解決は、機械生成項を識別する精度を大幅に向上させる。
DeepFakeDeLiBotは、エンゲージメントの向上、コンセンサス構築、推論に基づく発話の頻度と多様性を促進する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:19:38 GMT)
PokéChamp: an Expert-level Minimax Language Agent [17.0] 本稿では,大言語モデル(LLM)を利用したミニマックスエージェントであるPok'eChampを紹介した。
Pok'eChampは2プレイヤーの競争ゲームのための一般的なフレームワーク上に構築されており、LLMのジェネラリスト機能を活用してミニマックスツリーサーチを強化している。
この作品は、500万以上のハイエロの試合を含む300万以上のゲームを含む、最も大きなリアルプレイヤーのポケモンバトルデータセットをコンパイルする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:06:27 GMT)
DP-GTR: Differentially Private Prompt Protection via Group Text Rewriting [16.9] DP-GTRは、局所微分プライバシー(DP)とグループテキスト書き換えによる合成定理を利用する新しい3段階フレームワークである。
CommonSense QAとDocVQAの実験は、DP-GTRが既存のアプローチより優れていることを示した。
われわれのフレームワークは既存の書き換え技術と互換性があり、プライバシー保護を強化するためのプラグインとして機能している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:39:42 GMT)
Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous Driving [16.8] Dur360BEVは高解像度の128チャンネルのLiDARとRTK精製/INSシステムを備えた自動運転データセットである。
このデータセットとベンチマークは、単一球面カメラのみを使用したBird-Eye-View(BEV)マップの課題に対処する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:59:08 GMT)
DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms [16.4] DongbaMIEは、Dongba pictographsのセマンティック理解と抽出のための最初のマルチモーダルデータセットである。
23,530の文レベルと2,539の段落レベルのイメージを含み、対象、行動、関係、属性の4つの意味的次元をカバーする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:36:33 GMT)
Evaluating Answer Reranking Strategies in Time-sensitive Question Answering [16.2] 質問応答(QA)における回答の時間的特性の影響について,いくつかの簡単な回答選択手法を探索して検討する。
本研究は,ダイアクロニック文書コレクションから最も関連性の高い回答を選択する上で,時間的特徴が果たす役割を強調した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:06:35 GMT)
SOLAR: Scalable Optimization of Large-scale Architecture for Reasoning [16.2] SOLARは様々な推論トポロジを動的に最適化して精度と効率を向上させるフレームワークである。
Topological-Scalingは、トレーニングと推論のスケーリングを調整する報奨駆動のフレームワークである。
報奨制度を育成するため,マルチタスク・トポロジカル・リワード・モデル (M-TRM) を訓練し,一つのパスで最適な推論トポロジと解答を自律的に選択する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:19:17 GMT)
DTU-Net: A Multi-Scale Dilated Transformer Network for Nonlinear Hyperspectral Unmixing [16.2] 非線形ハイパースペクトルアンミキシングのためのDilated Transformerベースのアンミキシングネットワークを提案する。
デコーダは線形と非線形の混合シナリオの両方に対応するように設計されている。
その解釈性は、終端員、存在量、非線形係数の間の関係を明示的にモデル化することによって強化される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:55:33 GMT)
Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes [16.1] アルツハイマー病(英: Alzheimer's disease、AD)は、世界中の何百万もの人に影響を及ぼす主要な神経変性疾患である。
脳構造核磁気共鳴イメージング(sMRI)は、AD診断のためのより安全で便利な解決策を提供する可能性がある。
近年の幾何学的深層学習の進歩は、sMRI解析とADの早期診断を助長している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:02:18 GMT)
Democratizing Signal Processing and Machine Learning: Math Learning Equity for Elementary and Middle School Students [16.0] 信号処理(SP)と機械学習は、優れた数学とコーディング知識に依存している。
本稿では,学外数学支援プログラムの開始と参加において,SP教員,学生,専門家がいかに重要な役割を果たすかを論じる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:54:28 GMT)
More Documents, Same Length: Isolating the Challenge of Multiple Documents in RAG [15.9] マルチホップQAタスクから派生したカスタムデータセットの様々な言語モデルを評価する。
我々は文書数を変えながら関連情報のコンテキスト長と位置を一定に保ち、RAG設定における文書数の増加がLCMにとって大きな課題となることを発見した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:38:17 GMT)
Learning truly monotone operators with applications to nonlinear inverse problems [15.7] 本稿では,新たに定義されたペナル化損失を通じてモノトーンニューラルネットワークを学習するための新しいアプローチを紹介する。
The Forward-Backward-Forward (FBF) algorithm is used to address monotone inclusion problem。
次に,非線形逆問題の解法が成功したシミュレーション例を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:21:39 GMT)
Data Poisoning Attacks to Locally Differentially Private Range Query Protocols [15.7] ローカル微分プライバシー(LDP)は、分散データ収集においてユーザのプライバシを保護するために広く採用されている。
近年の研究では、LDPプロトコルがデータ中毒攻撃に弱いことが判明している。
本稿では LDP 範囲のクエリプロトコルをターゲットとしたデータ中毒攻撃に関する最初の研究について述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:25:03 GMT)
Assessing Pre-Trained Models for Transfer Learning Through Distribution of Spectral Components [15.7] 本稿では、スペクトル成分分布(DISCO)を用いた事前学習モデル評価のための新しい視点を提案する。
異なるスペクトル成分について検討し, 異なる透過性を有することを観察し, 微調整性能に多彩に寄与する。
提案手法は柔軟であり, 分類タスクと回帰タスクの両方に適用できる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:32:37 GMT)
Instrument-Splatting: Controllable Photorealistic Reconstruction of Surgical Instruments Using Gaussian Splatting [15.5] Real2Simは、外科的人工知能(AI)と自律性の急速な発展により、ますます重要になりつつある。
本稿では3次元ガウススプラッティングを応用した新しいReal2Sim法であるtextitInstrument-Splattingを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:37:09 GMT)
F-Fidelity: A Robust Framework for Faithfulness Evaluation of Explainable AI [15.3] XAI技術は、ディープラーニングモデルから意味のある洞察を抽出することができる。
適切に評価する方法は、未解決の問題である。
我々は,XAIのための堅牢な評価フレームワークとして,F-Fidelity(F-Fidelity)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:06:16 GMT)
The impact of conformer quality on learned representations of molecular conformer ensembles [15.3] 本研究では,3次元コンフォメータ依存特性を予測するための代理モデルの性能が,入力として使用する3次元コンフォメータの品質にどのように影響するかを問う。
回答はケース特化されるが,本分析は3次元表現学習モデルにおける貴重な視点を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:49:05 GMT)
KidneyTalk-open: No-code Deployment of a Private Large Language Model with Medical Documentation-Enhanced Knowledge Database for Kidney Disease [15.1] KidneyTalk-openは、デスクトップ上で安全なドキュメント化された医療Q&Aを可能にする、最初のノーコード医療LLMシステムである。
グラフィカルなインターフェースは、臨床医が医療文書を管理し、専門知識のないAIによるコンサルティングを行うことを可能にするように設計されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:01:36 GMT)
Eavesdropping on Goal-Oriented Communication: Timing Attacks and Countermeasures [15.1] 遠隔マルコフプロセスの追跡のためのプルベース目標指向スケジューリングに対する盗聴攻撃について検討する。
攻撃の有効性と可能な対策を定義するための理論的枠組みを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:13:21 GMT)
MMGDreamer: Mixed-Modality Graph for Geometry-Controllable 3D Indoor Scene Generation [15.0] MMGDreamerは、Mixed-Modality Graphを組み込んだシーン生成のための二重ブランチ拡散モデルである。
ビジュアルエンハンスメントモジュールは、テキスト埋め込みを使用して視覚表現を構築することで、テキストのみのノードの視覚的忠実度を高める。
我々の関係予測器はノード表現を利用してノード間の不連続な関係を推定し、より一貫性のあるシーンレイアウトをもたらす。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:02:33 GMT)
Shaken, Not Stirred: A Novel Dataset for Visual Understanding of Glasses in Human-Robot Bartending Tasks [15.0] 我々は,ヒューマノイドロボットプラットフォームであるNICOL(Neuro-Inspired COLlaborator)上で収集された,新しい実世界のガラスオブジェクトデータセットを提供する。
トレーニングされたベースラインモデルは、最先端のオープンボキャブラリアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:51:04 GMT)
Measuring temporal effects of agent knowledge by date-controlled tool use [15.0] 我々は,日付制御ツールから大規模言語モデル(LLM)エージェントの知識変動を測定するために,ツールベースのサンプル外テストフレームワークを構築した。
検索エンジンの時間的効果はツール依存エージェントのパフォーマンスに変換されるが,基本モデルの選択や明示的な推論命令によって緩和できることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:03:51 GMT)
Poisoning Attacks to Local Differential Privacy Protocols for Trajectory Data [14.9] 地理的な位置からの動きを追跡するトラジェクトリデータは、現実世界のアプリケーションを改善するために不可欠である。
ローカルディファレンシャルプライバシ(LDP)は、個人が自分の軌跡データを共有する前に局所的に摂動できるようにするソリューションを提供する。
プライバシー上の利点にもかかわらず、LDPプロトコルはデータ中毒攻撃に対して脆弱であり、攻撃者は偽のデータを注入して集約された結果を操作する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:31:45 GMT)
Neural Configuration-Space Barriers for Manipulation Planning and Control [14.8] 乱雑な動的環境下での高次元ロボットマニピュレータの計画と制御は、計算効率と堅牢な安全保証の両方を必要とする。
安全制約をCDFバリアとして定式化する動き計画と制御の統一フレームワークを提案する。
CDFバリアは局所的な自由構成空間を近似し、モーションプランニング中の衝突チェック操作の数を著しく削減する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:00:56 GMT)
AOLO: Analysis and Optimization For Low-Carbon Oriented Wireless Large Language Model Services [14.7] 大規模言語モデル (LLM) は、エネルギー消費と炭素フットプリントの大幅な増加により、懸念が高まっている。
低炭素指向の無線LLMサービスの解析と最適化のためのフレームワークであるAOLOを提案する。
AOLOは、LLMサービスチェーン全体にわたる温室効果ガス排出量を定量化する包括的な炭素フットプリントモデルを導入している。
SNNに基づく深部強化学習(SDRL)という低炭素指向最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:21:38 GMT)
Legal Fact Prediction: The Missing Piece in Legal Judgment Prediction [14.6] 法的判断予測(LJP)は、訴訟者とその弁護士が判断結果を予測し、訴訟戦略を洗練させることを可能にする。
我々は,裁判で提出された証拠を法的事実を予測するための入力として用い,新たな法的NLPタスクであるthistlegal fact prediction (LFP)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:48:54 GMT)
SCSA: A Plug-and-Play Semantic Continuous-Sparse Attention for Arbitrary Semantic Style Transfer [14.6] 根本原因は局所的地域と意味的地域との関係を考慮できないことにあると論じる。
任意のセマンティック・スタイルの転送を行うために,SCSA と呼ばれるプラグイン・アンド・プレイ型セマンティック・セマンティック・スパース・アテンションを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:56:25 GMT)
TS-RAG: Retrieval-Augmented Generation based Time Series Foundation Models are Stronger Zero-Shot Forecaster [14.5] 時系列基礎モデル (TSFM) にはドメイン適応の固有のメカニズムが欠如しており、限定的な解釈可能性に悩まされている。
TS-RAGは、検索強化世代別時系列予測フレームワークである。
TS-RAGは最先端のゼロショット予測性能を達成し,様々な領域でTSFMを最大6.51%上回った。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:48:48 GMT)
Real-time Spatial-temporal Traversability Assessment via Feature-based Sparse Gaussian Process [14.4] 地上移動ロボットを現実のタスクに応用するためには,地形解析が重要である。
本研究では,自律型ロボットが複雑な地形を移動できるようにすることを目的とした,空間的時間的トラバーサビリティ評価手法を提案する。
本研究では,移動可能性マップと統合された自律ナビゲーションフレームワークを開発し,複雑な屋外環境での微分駆動車による検証を行う。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:26:57 GMT)
Leveraging priors on distribution functions for multi-arm bandits [14.4] 本稿では,Dirichlet Process Posterior Sampling (DPPS)を導入する。
本研究では,DPPSの総合的および実世界のバンディット環境における優れた実証性能を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:06:01 GMT)
Biological Sequence with Language Model Prompting: A Survey [14.3] 大きな言語モデル(LLM)は、さまざまなドメインにまたがる課題に対処するための強力なツールとして登場した。
本稿では, LLMを用いたプロンプトベース手法の生物学的配列への応用を系統的に検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:28:36 GMT)
DreamText: High Fidelity Scene Text Synthesis [14.3] シーンテキスト合成では、指定されたテキストを任意の画像にレンダリングする。
現在の方法は、通常、このタスクをエンドツーエンドで定式化するが、トレーニング中に効果的なキャラクタレベルのガイダンスが欠如している。
本稿では,高忠実度シーンテキスト合成のためのDreamTextを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:38:23 GMT)
scDD: Latent Codes Based scRNA-seq Dataset Distillation with Foundation Model Knowledge [14.1] 単細胞RNAシークエンシング(scRNA-seq)は、これまで、臓器、疾患、発達、摂動にまたがる何十億ものヒト細胞をプロファイル化してきた。
高次元のスパーシリティ、バッチ効果ノイズ、カテゴリー不均衡、そして絶え間なく増加するデータスケールは、マルチセンタの知識伝達、データ融合、およびクロスバリデーションの課題を提起する。
我々は,基礎モデル知識と原データセット情報をコンパクトな潜伏空間に蒸留する,SCDDと呼ばれる潜伏コードに基づくScRNA-seqデータセット蒸留フレームワークを提案する。
また,SCDGと呼ばれる単一ステップの条件付き拡散発生器を提案し,単一ステップで動作させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:01:20 GMT)
MedUnifier: Unifying Vision-and-Language Pre-training on Medical Data with Vision Generation Task using Discrete Visual Representations [14.0] 医療データに適した統合型ビジョンランゲージ事前学習フレームワークであるMedUnifierを提案する。
MedUnifierはテキスト基底画像生成機能とマルチモーダル学習戦略をシームレスに統合する。
本手法では, 視覚ベクトル量子化を用いて, クロスモーダル理解のためのより密着的な学習戦略を実現するとともに, マルチモーダル生成品質を向上させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:17:22 GMT)
A Consensus Privacy Metrics Framework for Synthetic Data [14.0] 合成データのプライバシーを測定するための統合された標準は存在しない。
以上の結果から,現在の類似度指標は個人情報の開示を測ることが困難であることが示唆された。
異なるプライベートな合成データについては、ゼロに近いプライバシー予算は解釈できないと考えられていた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:19:02 GMT)
Tutorial on amortized optimization [13.8] このチュートリアルでは、これらの進歩の背後にある償却最適化の基礎について紹介する。
変分推論、スパース符号化、勾配に基づくメタラーニング、制御、強化学習、凸最適化、最適輸送、深い平衡ネットワークにおけるそれらの応用を概説する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:24:46 GMT)
Measuring Human and AI Values Based on Generative Psychometrics with Large Language Models [13.8] 本研究はGPV(Generative Psychometrics for Values)を紹介する。
GPVはデータ駆動値測定のパラダイムであり、テキスト検索による選択的知覚に基づいている。
GPVを人間によるブログに適用することにより、従来の心理学的ツールよりも安定性、妥当性、優越性を実証する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:18:50 GMT)
MathMistake Checker: A Comprehensive Demonstration for Step-by-Step Math Problem Mistake Finding by Prompt-Guided LLMs [13.8] そこで本研究では,数理問題におけるステップ・バイ・ステップの誤り発見を自動化する新しいシステムであるMathMistake Checkerを提案する。
本システムは,教育的観点からの学習経験を簡素化し,効率を向上させることを目的としている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:19:01 GMT)
Large Language Models in Bioinformatics: A Survey [13.7] 大規模言語モデル(LLM)は生物情報学に革命をもたらし、DNA、RNA、タンパク質、単細胞データの高度な解析を可能にしている。
この調査は、ゲノム配列モデリング、RNA構造予測、タンパク質機能推論、単細胞転写学など、最近の進歩の体系的なレビューを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:38:20 GMT)
Modulating CNN Features with Pre-Trained ViT Representations for Open-Vocabulary Object Detection [13.5] 我々は、textbfViT-Feature-textbfModulated Multi-Scale textbfConvolutional Network (VMCNet) と呼ばれる新しい2分岐バックボーンネットワークを提案する。
VMCNetは、トレーニング可能な畳み込みブランチ、凍結された事前トレーニングされたViTブランチ、VMCモジュールで構成される。
この混合構造により、検出器はより新しいカテゴリーの物体を発見する可能性が高くなる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:08:38 GMT)
Towards Effective and Sparse Adversarial Attack on Spiking Neural Networks via Breaking Invisible Surrogate Gradients [13.5] スパイキングニューラルネットワーク(SNN)は、勾配に基づく敵攻撃に対して脆弱である。
本稿では,SGとモデル間のロバストな接続を確立するために,革新的な電位依存サロゲート勾配(PDSG)法を提案する。
また,バイナリダイナミックイメージを効果的に攻撃するためのスパースダイナミックアタック(SDA)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:49:46 GMT)
Fractional Correspondence Framework in Detection Transformer [13.4] Detection Transformer (DETR) はオブジェクト検出タスクのマッチングプロセスを大幅に単純化した。
このアルゴリズムは、予測された有界箱とトレーニング中の接地的アノテーションとの最適な1対1マッチングを容易にする。
本稿では,予測と地上の真実を整合させるコストを捉え,最も正確な対応を見つけるためのフレキシブルマッチング戦略を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:29:20 GMT)
Fast Preemption: Forward-Backward Cascade Learning for Efficient and Transferable Preemptive Adversarial Defense [13.3] 高速プリエンプション(Fast Preemption)は、最先端の堅牢性と転送可能性を達成する一方で、効率上の課題を克服する、新しい先制敵防衛である。
わずか3イテレーションで実行することで、Fast Preemptionは既存のトレーニング時間、テスト時間、プリエンプティブディフェンスを上回っます。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:03:41 GMT)
Pap2Pat: Benchmarking Outline-Guided Long-Text Patent Generation with Patent-Paper Pairs [13.2] PAP2PATは、同じ発明を記述した1.8kの特許と紙のペアからなる特許草案作成のためのオープンベンチマークである。
PAP2PATと人体ケーススタディを用いて評価したところ、LCMは紙からの情報を有効に活用できるが、それでも必要な詳細情報を提供するのに苦労している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:51:05 GMT)
SurveyForge: On the Outline Heuristics, Memory-Driven Generation, and Multi-dimensional Evaluation for Automated Survey Writing [13.1] 本研究では,人間の記述したアウトラインの論理構造を解析し,アウトラインを生成するサーベイサーベイForgeを紹介する。
総合的な評価を実現するために,100件の人書き調査論文を含むSurveyBenchを構築した。
実験では、SurveyはAutoSurveyのような以前の作業より優れていることが示されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:15:48 GMT)
INTENT: Trajectory Prediction Framework with Intention-Guided Contrastive Clustering [13.1] 本研究では,道路エージェントの意図の理解と推論が軌道予測タスクにおいて重要な役割を担っていることを主張する。
本稿では,道路エージェントの軌道に含まれる情報にのみ依存する効果的な意図誘導軌道予測モデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:31:11 GMT)
Pretraining Decision Transformers with Reward Prediction for In-Context Multi-task Structured Bandit Learning [12.6] マルチタスク構造化バンディット問題の学習について検討する。
目的は、累積的後悔を最小限に抑える、ほぼ最適アルゴリズムを学ぶことである。
我々は、この共有構造をデモンストレーターが収集したデータから学習するために、トランスフォーマーを意思決定アルゴリズムとして利用する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:27:38 GMT)
Reheated Gradient-based Discrete Sampling for Combinatorial Optimization [12.6] 勾配に基づく離散サンプリングは、様々な最適化(CO)問題に対する高効率で汎用的な解法として登場した。
本稿では,この制限を克服することを目的とした,臨界温度と物理における比熱の概念から着想を得た新しい再加熱機構を導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:01:25 GMT)
R2-KG: General-Purpose Dual-Agent Framework for Reliable Reasoning on Knowledge Graphs [12.5] R2-KGは、推論を2つの役割に分けるプラグイン・アンド・プレイのフレームワークである。
以上の結果から,R2-KGはKGベースの推論のための柔軟性とコスト効率のよい解であることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:41:40 GMT)
Anyon Theory and Topological Frustration of High-Efficiency Quantum LDPC Codes [12.4] 量子低密度パリティチェック(QLDPC)符号は、低オーバーヘッドフォールトトレラント量子計算への有望な経路を示す。
実世界の量子ハードウェアに適したQLDPC符号の卓越したクラスであるバイヴァリエート自転車符号の研究のためのトポロジ的枠組みを確立する。
トロイス上の基底状態の縮退が、トーラスの総数から逸脱する、トポロジカルなフラストレーションを含む、新しい現象が明らかにされている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:46:14 GMT)
Beyond Existance: Fulfill 3D Reconstructed Scenes with Pseudo Details [12.2] 本研究では,拡散モデルと擬似地下構造データを用いたマルチスケールトレーニングを統合する新しいトレーニング手法を提案する。
提案手法は,各種ベンチマークにおける最先端性能を実現し,トレーニングデータセットを超えて3次元再構成機能を拡張する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:46:10 GMT)
IFIR: A Comprehensive Benchmark for Evaluating Instruction-Following in Expert-Domain Information Retrieval [12.0] 我々は、専門家ドメインにおける指示追従情報検索を評価するために設計された、最初の包括的なベンチマークであるIFIRを紹介する。
IFIRには2,426の高品質な例があり、金融、法律、医療、科学文学という4つの専門分野にまたがる8つのサブセットをカバーしている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:32:22 GMT)
Compact and fully functional high-frequency sine wave gating InGaAs/InP single-photon detector module [11.8] 高周波正弦波ゲーティング(SWG) InGaAs/InP単光子検出器(SPD)は近赤外線単光子同時検出に広く用いられている。
ここでは、我々の知る限り、最もコンパクトで完全に機能する高周波SWG InGaAs/InP SPDについて述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:38:43 GMT)
A Comprehensive Survey of Deep Learning for Multivariate Time Series Forecasting: A Channel Strategy Perspective [11.8] 本研究では,時系列のチャネルモデリング戦略を体系的にレビューする。
本稿では,戦略的視点,メカニズム的視点,特徴的視点という,3つの階層的なレベルに分けられた分類法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:12:22 GMT)
On the Feasibility of Using LLMs to Execute Multistage Network Attacks [11.7] マルチステージネットワーク攻撃は、複数のホストにまたがる多様なアクションの実行を含む。
LLM非依存の高レベルアタック抽象化層であるIncalmoを導入する。
Incalmoは10の現実的なエミュレートネットワークのうち9つでマルチステージ攻撃をうまく実行可能であることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:06:18 GMT)
Streaming Private Continual Counting via Binning [11.7] 我々は、$textitbinning$を介して低空間における分解機構を近似する簡単な方法を提案する。
空間利用が極端に少ない場合でも、最適分解機構の性能は密に一致し、時には上回ることができることを実証的に示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:14:01 GMT)
AdaptBot: Combining LLM with Knowledge Graphs and Human Input for Generic-to-Specific Task Decomposition and Knowledge Refinement [11.7] 膨大な知識に基づいて訓練された大規模言語モデル(LLM)は、そのようなタスクを完了するための抽象的なアクションのシーケンスを予測するのに使用できる。
我々のフレームワークは、LLMが提供するジェネリックな予測と知識グラフにエンコードされた以前のドメイン知識を活用することで、これらの課題に対処する。
ロボットはまた、既存の知識を洗練するために人間の入力を要請し、使用する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:09:38 GMT)
Training neural networks faster with minimal tuning using pre-computed lists of hyperparameters for NAdamW [11.7] NAdamWのための実用的かつ高性能なハイパーパラメータリストを提示する。
最高のNAdamWハイパーパラメータリストは、構築に使用されていないAlgoPerfのホールドアウトワークロードでうまく機能します。
また、ベーシックな学習率/ウェイト崩壊スイープと、同じ予算に制限された既製のベイズ最適化ツールを上回ります。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:14:50 GMT)
Cloud Computing Energy Consumption Prediction Based on Kernel Extreme Learning Machine Algorithm Improved by Vector Weighted Average Algorithm [11.7] 本研究では,クラウドコンピューティング環境におけるエネルギー消費予測を改善するために,カーネル・エクストリーム・機械学習・マシン(KELM)を用いたベクトル重み付き平均アルゴリズムを提案する。
VWAA-KELMの優れた性能を示す実験結果: テストセット予測誤差の94.7%が[0, 50]単位内にあり、100単位を超えるケースはわずか3つしかない。
提案されたハイブリッドフレームワークは、IoT(Internet of Things)とエッジコンピューティングにおいて広範なアプリケーションを持ち、リアルタイムエネルギー管理とインテリジェントリソース割り当てをサポートする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:52:50 GMT)
Knowledge Retention for Continual Model-Based Reinforcement Learning [11.6] DRAGOは連続モデルに基づく強化学習のための新しいアプローチである。
DRAGOは、Synthetic Experience RehearsalとRe Get Memories Through Explorationの2つの重要なコンポーネントで構成されている。
実証的な評価は、DRAGOがタスク間の知識を保存でき、様々な連続学習シナリオにおいて優れたパフォーマンスを達成できることを示している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:38:14 GMT)
Robust Computer-Vision based Construction Site Detection for Assistive-Technology Applications [11.5] 建設現場では、不均一な表面、障害物バリア、有害物質、過度な騒音などの危険が導入されている。
既存の補助技術は、ナビゲーションアプリが旅行計画中の建設現場を考慮していないため、制限されている。
本研究では,オープンボキャブラリオブジェクト検出,YOLOに基づく足場検出モデル,OCRモジュールを統合した新しいコンピュータビジョンベースシステムを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:35:19 GMT)
An Analysis Framework for Understanding Deep Neural Networks Based on Network Dynamics [11.4] ディープニューラルネットワーク(DNN)は、ディープ層にまたがる異なるモードのニューロンの割合を合理的に割り当てることで、情報抽出を最大化する。
このフレームワークは、"フラット・ミニマ効果(flat minima effect)"、"グロッキング(grokking)"、二重降下現象(double descend phenomena)など、基本的なDNNの振る舞いについて統一的な説明を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:49:50 GMT)
NsBM-GAT: A Non-stationary Block Maximum and Graph Attention Framework for General Traffic Crash Risk Prediction [11.4] 既存の衝突リスク予測モデルは、研究者が危険とみなす仮説上のシナリオに依存している。
ダッシュカムビデオは、個々の車のクレーシュ前動作を撮影するが、周囲の車両の動きに関する重要な情報を欠いていることが多い。
本研究では,車両とその周辺車両間の対話的挙動を捉えるために,新しい非定常極値理論(EVT)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:12:40 GMT)
Conformal forecasting for surgical instrument trajectory [11.4] 本研究では, 整合性予測と整合性量子レグレッションを応用し, 手術器具の動作予測における不確実性を推定する。
本研究は外科的指導に適合予測を適用した最初の研究である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:06:03 GMT)
Women, Infamous, and Exotic Beings: What Honorific Usages in Wikipedia Reveal about the Socio-Cultural Norms [11.3] 我々はベンガル語とヒンディー語ウィキペディアの記事に10,000の実在と架空の人物の記事を載せた。
名誉の使用はヒンディー語よりもベンガル語の方が一貫して一般的である。
両方の言語において、非名誉代名詞の使用は、悪名高い、若く、エキゾチックな存在に対してより一般的に見られる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:46:49 GMT)
Security-Aware Sensor Fusion with MATE: the Multi-Agent Trust Estimator [11.2] セキュリティ意識の欠如により、スマートシティのようなマルチエージェントネットワークを持つシステムにおけるセンサーの融合は、攻撃に対して脆弱である。
我々は,信頼以上の分布推定に基づくセキュリティ対応型センサフュージョンを設計する。
新たなセキュリティ関連メトリクスと古典的セキュリティ関連メトリクスの混合は、我々のセキュリティ対応融合によって、敵対的な状況でも信頼できる状況認識を構築することができることを示している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:33:25 GMT)
Unveiling the Power of Noise Priors: Enhancing Diffusion Models for Mobile Traffic Prediction [11.1] ノイズはモバイルトラフィックの予測を形作り、明瞭で一貫したパターンを示す。
NPDiffは,雑音をテキストプリンシパルとテキストプリンシパルに分解するフレームワークである。
NPDiffは、様々な拡散に基づく予測モデルとシームレスに統合することができ、効率的、効率的、堅牢な予測を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:49:24 GMT)
Some Targets Are Harder to Identify than Others: Quantifying the Target-dependent Membership Leakage [11.1] メンバーシップ推論(MI)ゲームでは、攻撃者はアルゴリズムの入力にターゲットポイントが含まれているか否かを推測しようとする。
本稿では,固定ターゲットMIゲームにおける最適攻撃のパワーを研究することで,会員攻撃の目標依存性の硬さを説明する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:17:02 GMT)
DTL: Data Tumbling Layer. A Composable Unlinkability for Smart Contracts [11.0] 非対話型データタンブリングのための暗号方式であるData Tumbling Layer (DTL)を提案する。
中心となるコンセプトは、ユーザが特定のデータにコミットし、その後、異なるアプリケーション間で暗号化されたバージョンのデータに再利用できるようにすることである。
リンク不能で機密性の高い支払いアプリケーションでは、ユーザーはパーソナルノートパソコンで1.5ドル未満でそのような取引を開始することができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:43:34 GMT)
SWIFT: On-the-Fly Self-Speculative Decoding for LLM Inference Acceleration [11.0] 投機的復号法(SD)は,LLM推論を品質を損なうことなく高速化するためのパラダイムとして広く用いられている。
本稿では,LLMの中間層を適応的に選択して推論時にスキップする,オンザフライの自己投機的復号アルゴリズムであるSWIFTを紹介する。
実験により,SWIFTは生成したテキストの元の分布を保ちながら,1.3x-1.6x以上の高速化を実現することができることを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:04:44 GMT)
Nonlinear Nanophotonics for High-Dimensional Quantum States [10.9] 量子ナノフォトニクスは、ナノスケール光操作の精度と量子技術の能力を融合させる。
我々は、最近実証された非線形ナノフォトニクスプロセスを用いて、フォトニック高次元量子状態(量子)を選択的に生成する方法を示す。
このアイデアは、ナノフォトニックプラットフォーム内の非線形性を通じて量子状態の生成と操作を実験的に実現するための重要なステップである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:54:30 GMT)
InfoDisent: Explainability of Image Classification Models by Information Disentanglement [10.9] 本稿では,情報ボトルネックの原理に基づく説明可能性のハイブリッドアプローチであるInfoDisentを紹介する。
本稿では,各種データセットを対象とした計算実験とユーザスタディを通じてInfoDisentの有効性を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:16:09 GMT)
Unifying Multitrack Music Arrangement via Reconstruction Fine-Tuning and Efficient Tokenization [10.7] 本稿では,無条件および条件付きシンボル音楽生成のための効率的なマルチトラック音楽トークンについて紹介する。
事前学習された音楽用LMのシーケンス・ツー・シーケンス再構成の微調整目的は、タスク固有のニーズとコヒーレンス制約とのバランスをとる。
提案手法は,目標と知覚品質の両面において,タスク固有モデルを超え,バンドアレンジメント,ピアノアレンジメント,ドラムアレンジメントの最先端結果を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:45:08 GMT)
Unseen Fake News Detection Through Casual Debiasing [10.7] 既存の手法は、過去のイベントやドメインからのトレーニングデータに依存するため、目に見えないニュースに苦しむ。
分類信頼度と伝播構造正則化に基づく重み付け戦略を応用した縮退解FNDCDを提案する。
非重複ニュースドメインを用いた実世界のデータセットの実験では、ドメイン間の一般化を改善するFNDCDの有効性が示されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:23:44 GMT)
Markov Chain of Thought for Efficient Mathematical Reasoning [10.7] 多段階の思考の連鎖(CoT)は、推論ステップとタスク固有のアクションの論理構造から恩恵を受ける。
我々は、標準多段階CoTを思考のマルコフ連鎖(MCoT)として概念化する。
我々のMCoTは、従来の推論ステップを単純化した質問に圧縮し、効率的な次ステップ推論を可能にすることを目的としている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:39:56 GMT)
GaussianVideo: Efficient Video Representation and Compression by Gaussian Splatting [10.6] Implicit Neural Representation for Videos (NeRV) はビデオ表現と圧縮のための新しいパラダイムを導入した。
データハンドリングを効率的に処理するための2次元ガウススプラッティングに基づく新しいビデオ表現と手法を提案する。
メモリ使用量を最大78.4%削減し,ビデオ処理を大幅に高速化し,5.5倍高速トレーニング,12.5倍高速デコードを実現した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:31:08 GMT)
The Impact Analysis of Delays in Asynchronous Federated Learning with Data Heterogeneity for Edge Intelligence [10.5] フェデレートラーニング(FL)は、機械学習モデルを協調的にトレーニングするために、クライアントのグループを調整するための新しい方法論を提供する。
本稿では,データ不均一性を伴う非同期フェデレート学習(AFL)システムにおいて,遅延の原因不明が訓練成績に及ぼす影響について検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:10:49 GMT)
Overcoming user-rate limit of quantum network [10.5] 我々は,ユーザチャネル当たりの情報容量がネットワーク容量に依存しない量子ネットワークアーキテクチャを開発する。
この成果は、量子インターネットの発展の鍵となる量子ネットワークのユーザレート制限を克服する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:53:58 GMT)
Which Frequencies do CNNs Need? Emergent Bottleneck Structure in Feature Learning [10.5] 本稿では,CNNにおけるConvolution Bottleneckの構造の出現について述べる。
ボトルネック内に保持される周波数の数と種類を記述したCBNランクを定義した。
パラメータノルムがほぼ最適である任意のネットワークは、両方の重みでCBN構造を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:01:48 GMT)
CAUSAL3D: A Comprehensive Benchmark for Causal Learning from Visual Data [10.4] 我々は、構造化されたデータ(テーブル)と対応する視覚表現(画像)を統合する新しいベンチマークであるtextsctextbfCausal3Dを導入し、因果推論を評価する。
Causal3Dは、多様な因果関係、ビュー、背景をキャプチャする19の3Dシーンデータセットで構成されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:40:01 GMT)
SRAG: Structured Retrieval-Augmented Generation for Multi-Entity Question Answering over Wikipedia Graph [10.3] MEQA(Multi-entity Question answering)は、大規模言語モデルにおいて重要な課題である。
本稿では、抽出されたエンティティをリレーショナルテーブルに整理する構造化RAGフレームワークを提案する。
ウィキペディアベースのマルチエンタリティQAタスクの実験では、SRAGが最先端の長文LLMを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:27:24 GMT)
PP-DocBee: Improving Multimodal Document Understanding Through a Bag of Tricks [10.2] PP-DocBeeは、エンドツーエンドの文書イメージ理解のために設計された、新しいマルチモーダルな大規模言語モデルである。
我々は、モデル一般化を改善するために多様なデータセットを構築するシナリオを文書化するのに適したデータ合成戦略を開発する。
我々は、動的比例サンプリング、データ前処理、OCR後処理戦略など、いくつかのトレーニング手法を適用している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:43:21 GMT)
White Gaussian Noise Generation with a Vacuum State Quantum Entropy Source Chip [10.2] ホワイトガウシアンノイズ(WGN)は、通信システムテスト、物理モデリング、モンテカルロシミュレーション、電子対策に広く用いられている。
本稿では,量子エントロピーソースチップを用いたWGN生成の実装について紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:35:14 GMT)
Energy-Latency Attacks: A New Adversarial Threat to Deep Learning [10.2] 本稿では,エネルギー遅延攻撃に関する最近の研究の概要について概説する。
これは、この新たな攻撃パラダイムに対するディープニューラルネットワークの脆弱性に焦点を当てており、サービス停止攻撃を誘発する可能性がある。
我々は、これらの攻撃の成功を測定するために使用されるさまざまな指標を調査し、既存の攻撃戦略の分析と比較を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:50:58 GMT)
The Illusion of Empathy: How AI Chatbots Shape Conversation Perception [10.1] GPTベースのチャットボットは人間の会話相手よりも共感的でないと認識された。
以上の結果から,会話の質形成における共感の重要性が示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:06:51 GMT)
DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time [10.1] 実時間DLOモデリングのための微分離散分岐弾性棒
本稿では、実時間(DEFT)におけるFurcated DLOのモデル化のための微分離散分岐弾性ロッドを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:50:30 GMT)
SED2AM: Solving Multi-Trip Time-Dependent Vehicle Routing Problem using Deep Reinforcement Learning [10.0] 本稿では,同時デコーダ・アテンションモデル(SED2AM)と呼ばれるDRLに基づく手法を提案する。
MTTDVRP(Multi-trip time-dependent vehicle routing problem)には、最大労働時間制限が課せられる。
カナダの2つの主要都市の実世界のデータセットを用いた実験の結果、SED2AMは現在の最先端のDRLベースとメタヒューリスティックベースのベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:47:49 GMT)
FUSE: First-Order and Second-Order Unified SynthEsis in Stochastic Optimization [9.9] 一階法と二階法は全く異なる状況にある。
本稿では,一階法と二階法の両方を統一的なアルゴリズムフレームワークで活用する新しい手法を提案する。
FUSE-PVは、第1次と第2次を切り替える単純な最適化手法である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:30:18 GMT)
Enhancing Multimodal Medical Image Classification using Cross-Graph Modal Contrastive Learning [9.9] 本稿では,医用画像分類を改善するために,マルチモーダル構造化データを対象としたクロスグラフ・モーダルコントラスト学習フレームワークを提案する。
提案手法は、パーキンソン病(PD)データセットと公共メラノーマデータセットの2つのデータセットで評価される。
以上の結果から,CGMCLは従来手法よりも精度,解釈可能性,早期疾患予測に優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:43:10 GMT)
LiteChain: A Lightweight Blockchain for Verifiable and Scalable Federated Learning in Massive Edge Networks [9.9] フェデレートラーニング(FL)におけるブロックチェーンの活用は、MEN(Massive Edge Networks)におけるセキュアなコラボレーティブラーニングの新たなパラダイムとして現れます。
我々は、MENで効率的かつセキュアなサービスを提供するために、検証可能でスケーラブルなFL、すなわちLiteChainのための軽量ブロックチェーンを提案する。
本稿では,包括的ビザンチンフォールトトレランス(CBFT)コンセンサス機構と,LiteChainによるモデルトランザクションのセキュリティを確保するセキュアな更新機構を導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:38:58 GMT)
Dynamic-KGQA: A Scalable Framework for Generating Adaptive Question Answering Datasets [9.8] 知識グラフから適応的なQAデータセットを生成するスケーラブルなフレームワークであるDynamic-KGQAを紹介する。
固定ベンチマークとは異なり、Dynamic-KGQAは、基盤となるディストリビューションを保持しながら、実行毎に新しいデータセットバリアントを生成する。
Dynamic-KGQAは、KGQAモデルのトレーニングと評価を容易にするコンパクトでセマンティックなコヒーレントなサブグラフを生成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:58:01 GMT)
The day-ahead scenario generation method for new energy based on an improved conditional generative diffusion model [9.7] 本稿では,改良された条件付き生成拡散モデルに基づく日頭新エネルギーシナリオ生成手法を提案する。
まず、拡散過程を通じて履歴データを純粋なノイズに変換し、続いて条件情報を用いて復調過程を導出する。
ノイズテーブルはコサイン形式に改善され、生成されたシナリオの品質が向上する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:30:34 GMT)
Self-Supervised Models for Phoneme Recognition: Applications in Children's Speech for Reading Learning [9.7] まず, フランス語音声における音素認識に適応したwav2vec 2.0, HuBERT, WavLMモデルを比較した。
次に,子音の微調整中に変圧器ブロックを解凍することで適応する。
We show that WavLM base+ is more robust to various reading task and noise levels。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:57:16 GMT)
Data-augmented Learning of Geodesic Distances in Irregular Domains through Soner Boundary Conditions [9.7] 本研究では不規則領域における測地距離を学習するための枠組みを提案する。
トレーニングの安定性と解の精度に及ぼすデータ損失の影響を評価した。
これらの結果から, ハイブリッドデータ物理手法は, 疎データの学習に基づく測地距離解法の信頼性を効果的に向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:13:32 GMT)
Diagnosing Moral Reasoning Acquisition in Language Models: Pragmatics and Generalization [9.7] 大規模言語モデル(LLM)は、道徳的認識を必要とするタスクで満足に機能しないことが多い。
現在の学習パラダイムは、LLMが十分な道徳的推論能力を得ることができるか?
性能改善は意味レベルの課題に類似したメカニズムを踏襲し,言論における潜在道徳の実践的性質の影響を受け続けることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:56:40 GMT)
MultiChallenge: A Realistic Multi-Turn Conversation Evaluation Benchmark Challenging to Frontier LLMs [9.6] 我々は,大規模言語モデル(LLM)を評価する先駆的ベンチマークであるMultiChallengeを紹介した。
我々は,現在の人間とLLMの対話において一般的で現実的なマルチターン会話における課題の4つのカテゴリを識別する。
既存のマルチターン評価ベンチマークでほぼ完全なスコアを得たにもかかわらず、すべてのフロンティアモデルはMultiChallengeで50%未満の精度を持つ。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:41:56 GMT)
Prediction of Frozen Region Growth in Kidney Cryoablation Intervention Using a 3D Flow-Matching Model [9.4] 本研究は,腎の凍結凝固過程における凍結領域(アイスボール)の進行を予測するための3次元フローマッチングモデルを提案する。
このモデルは、IoU(Intersection over Union)スコアが0.61、Dice係数が0.75となる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:52:58 GMT)
An LLM-based Agent for Reliable Docker Environment Configuration [9.4] Repo2Runは環境設定を完全に自動化し、任意のPythonリポジトリに対して実行可能なDockerfileを生成するように設計されたエージェントである。
1) LLMエージェントが分離されたDockerコンテナ内の環境を構成できるようにし、(2) 正常な設定プロセスが記録され、エラーなく正確にDockerfileに転送されることを保証する。
Repo2Runonが提案した420のPythonレポジトリとユニットテストのベンチマークを評価し、86.4%の成功率で、ベースラインを63.9%上回った。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:17:09 GMT)
Persuade Me if You Can: A Framework for Evaluating Persuasion Effectiveness and Susceptibility Among Large Language Models [9.4] 大きな言語モデル(LLM)は、人間レベルの説得と競合する説得力を示す。
LLMの説得への感受性は、倫理的原則との整合性に関する懸念を提起する。
マルチエージェントインタラクションによる説得評価フレームワークPersuade Me If You Can (PMIYC)を紹介した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:13:20 GMT)
How DNNs break the Curse of Dimensionality: Compositionality and Symmetry Learning [9.3] ディープニューラルネットワーク(DNN)は,有界な$F_1$-normで任意の関数の合成を効率的に学習できることを示す。
スケーリング法則を経験的に計算し、$g$か$h$のどちらを学ぶのが難しいかによって相転移を観察する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:40:09 GMT)
A characterization of sample adaptivity in UCB data [9.2] UCBアルゴリズムによる2本腕のバンディット環境において、プル数とサンプル平均アームの報酬のジョイントCLTを特徴付ける。
1)大腕間隙系における標準形と小腕間隙系における緩やかな集中形との間に円滑に補間する擬似回帰型プル数の非標準CLT。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:37:30 GMT)
How Breakable Is Privacy: Probing and Resisting Model Inversion Attacks in Collaborative Inference [9.1] 協調推論は、中間機能をクラウドモデルに伝達することでエッジデバイスの計算効率を向上させる。
モデル逆攻撃(MIA)の評価基準は確立されていない。
ユーザビリティを維持しつつMIAに抵抗するプライバシー保護フレームワークであるSiftFunnelを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:30:00 GMT)
Golden Ratio Weighting Prevents Model Collapse [9.1] 近年の研究では、モデル崩壊として知られる生成モデルトレーニングにおける現象が特定されている。
本稿では,新たに収集した実データと合成データを組み合わせて生成モデルを反復的に訓練する新しい枠組みの中で,この現象を理論的に検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:03:59 GMT)
GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving [9.0] 我々はGPSRと呼ばれる3次元ガウススプラッティングに基づくマルチモーダル位置認識ネットワークを提案する。
マルチビューRGB画像とLiDAR点雲を時間的に統一されたシーン表現とMultimodal Gaussian Splattingを明示的に組み合わせている。
提案手法は,多視点カメラとLiDARの相補的強度を有効活用し,ソタ位置認識性能を向上し,ソタ位置認識性能を向上する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:32:33 GMT)
One-Shot is Enough: Consolidating Multi-Turn Attacks into Efficient Single-Turn Prompts for LLMs [8.9] 本稿では,マルチターンジェイルブレイクプロンプトを単一ターン攻撃に変換するM2S(Multi-turn-to-Single-turn)という新しい手法を提案する。
実験の結果、M2Sは元来のマルチターン会話に比べて高い攻撃成功率(ASR)を増大または維持することが示された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:34:51 GMT)
A Backbone for Long-Horizon Robot Task Understanding [8.9] Therblig-Based Backbone Framework (TBBF)は、ロボットシステムにおける解釈可能性、データ効率、一般化を強化する構造である。
TBBFは、専門家によるデモンストレーションを利用して、rbligレベルのタスク分解を可能にする。
オフライントレーニングの段階において,正確なソルビグセグメンテーションのためのMeta-RGate SynerFusionネットワークを開発した。
オンラインテストの段階では、新しいタスクのワンショットデモが収集された後、MGSFネットワークは高いレベルの知識を抽出する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:59:11 GMT)
Optimizing for the Shortest Path in Denoising Diffusion Model [8.9] 最短経路拡散モデル(ShortDF)は、復調誤差の最小化を目的とした最短経路問題である。
複数の標準ベンチマークの実験により、ShortDFは拡散時間(またはステップ)を大幅に短縮することが示された。
この研究は、インタラクティブな拡散ベースのアプリケーションへの道を開き、高速なデータ生成の基礎を確立します。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:46:21 GMT)
High-Precision Transformer-Based Visual Servoing for Humanoid Robots in Aligning Tiny Objects [8.9] 本稿では,ヒューマノイドロボットのハンドヘルドツールと対象物との相対的位置を正確に推定し,制御するための視覚ベースのフレームワークを提案する。
頭部と胴体カメラの画像を頭部関節角度で融合することにより、トランスフォーマーベースの視覚サーボ法により、ハンドヘルドツールの位置誤差を効果的に補正することができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:40:30 GMT)
Security and Real-time FPGA integration for Learned Image Compression [8.8] Learnable Image Compression (lic) は、圧縮効率において、標準化されたビデオコーデックよりも優れていることが証明されている。
本研究は、ハードウェア上でlicモデルをトレーニング、セキュリティ、デプロイするための統合ワークフローとプラットフォームを提供することによって、これらの課題に対処する。
本稿では,量子化時にモデルに透かしを施す新しいQAW手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:33:13 GMT)
Gate-Shift-Pose: Enhancing Action Recognition in Sports with Skeleton Information [8.8] Gate-Shift-Poseは、フィギュアスケートにおける選手の転倒分類のために、RGBフレームとともにスケルトンポーズデータを統合するように設計されている。
我々は、RGBフレームと入力段階でポーズキーポイントのガウス熱マップを組み合わせたアーリーフュージョンと、RGBとポーズ特徴を組み合わせたマルチストリームアーキテクチャを用いたレイトフュージョンの2つの融合戦略を評価する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:21:43 GMT)
Incorporating Surrogate Gradient Norm to Improve Offline Optimization Techniques [8.8] オフライン最適化のためのモデルに依存しない手法を開発した。
オフラインデータセットにおけるサロゲートシャープネスの低減は、目に見えないデータに対する一般化シャープネスを確実に減少させることを示す。
我々の分析は、既存の理論を、(目に見えないデータ上の)一般化予測損失と損失シャープネスの境界から、トレーニングデータに対する経験的推定で最悪の一般化サロゲートシャープネスの境界まで拡張する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:24:23 GMT)
Boosting Offline Optimizers with Surrogate Sensitivity [8.8] オフライン最適化は、オンライン実験が高価すぎる多くの材料工学領域において重要であり、ブラックボックス関数のシリコサロゲートに置き換えられる必要がある。
このようなサロゲートはオフラインデータから学ぶことができるが、その予測はオフラインデータ体制以外では信頼性がないかもしれない。
1)サロゲートモデルの感度をどうやって調節するか、(2)そのようなサロゲートで表現されたオフラインインフォームがより良いパフォーマンスをもたらすかどうか。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:50:32 GMT)
Graph Neural Networks for Virtual Sensing in Complex Systems: Addressing Heterogeneous Temporal Dynamics [8.7] 複雑なシステムの信頼性と効率的な運用にはリアルタイム状態監視が不可欠である。
仮想センシングは、利用可能なセンサデータとシステム知識を活用することで制限に対処する。
異種時間グラフニューラルネットワーク(HTGNN)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:47:01 GMT)
Noise-Injected Spiking Graph Convolution for Energy-Efficient 3D Point Cloud Denoising [8.7] スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワーク(ANN)よりも2次元分類タスクにおいて優れたエネルギー効率を示した
本研究では,3次元点群におけるSNNのフルレグレッションポテンシャルを活用するために,ノイズ注入型スパイキンググラフ畳み込みネットワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:14:41 GMT)
Temporal Analysis of NetFlow Datasets for Network Intrusion Detection Systems [8.6] 本稿では,機械学習に基づくネットワーク侵入検知システム(NIDS)におけるNetFlowデータセットの時間的解析について検討する。
本稿では,NetFlowデータセットの時間的分布を経時的に検討し,時間的・時間的分析を行った。
その結果、多くの攻撃にはユニークなパターンがあることが示され、MLモデルの識別がより容易になる可能性がある。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:58:09 GMT)
Self-correction is Not An Innate Capability in Large Language Models: A Case Study of Moral Self-correction [8.6] 我々は、道徳的自己補正は大規模言語モデル(LLM)の本質的な能力ではないと論じる。
我々は,CoT(Chain-of-Thought)推論や外部フィードバックといった自己補正の重要な構成要素が,道徳的自己補正を実現するためにどのように相互作用するかを,機械論的に分析する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:52:23 GMT)
Inducing Efficient and Equitable Professional Networks through Link Recommendations [8.6] グループ内での選好がなくても不平等が増大することを示す。
不平等の増大は、差分レバレッジの特権と特権のない個人が接続を形成する際に生じる。
我々は、不平等を意識したプラットフォームが、接続を補助することで不平等を減らしうることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:28:12 GMT)
Training-Free Graph Filtering via Multimodal Feature Refinement for Extremely Fast Multimodal Recommendation [8.5] 効率的なマルチモーダルレコメンデーションのためのマルチモーダルグラフフィルタリング(MM-GF)を提案する。
MM-GFは、グラフフィルタリング(GF)の概念に基づく、効率的かつ正確なマルチモーダルレコメンデーションに基づく、トレーニング不要な手法である。
実世界のベンチマークデータセットの実験は、MM-GFが推奨精度を最大13.35%向上するだけでなく、ランタイムを10秒未満で達成することで計算コストを大幅に削減することを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:00:53 GMT)
Select before Act: Spatially Decoupled Action Repetition for Continuous Control [8.4] 強化学習(Reinforcement Learning, RL)は、ロボット操作や移動など、様々な連続的な制御タスクにおいて顕著な成功を収めている。
近年の研究では、RLにアクション繰り返しを組み込んで、サンプル効率の向上と性能の向上を図りつつ、アクション持続性の向上を実現している。
既存の方法は、繰り返しの間、すべてのアクション次元を全体として扱い、それらの違いを無視します。
本稿では,各アクション次元に対してクローズドループ・アク・オート・リピート・セレクションを個別に実装したSDARという新しい繰り返しフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:25:18 GMT)
MASTER: Multimodal Segmentation with Text Prompts [8.3] RGB-熱融合は、挑戦的なシナリオにおける様々な気象や光条件に対する潜在的な解決策である。
大規模言語モデル (LLMs) の広範な適用により, 付加価値情報を自然言語からより効果的に抽出することができる。
RGB-Thermal マルチモーダルデータの融合に LLM を統合した MultimodAl with TExt PRompts (MASTER) アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:27:51 GMT)
USBSnoop -- Revealing Device Activities via USB Congestions [8.2] このプロジェクトは、混雑によるUSBサイドチャネルアタックに革新的なアプローチを導入している。
遠隔プロファイリングおよびサイドチャネル攻撃に対するUSBデバイスとハブの感受性を評価した。
われわれの調査結果は、USB接続デバイスに依存している時代において、ユーザーのプライバシーを保護するためのセキュリティ対策を強化する必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:06:02 GMT)
EvidMTL: Evidential Multi-Task Learning for Uncertainty-Aware Semantic Surface Mapping from Monocular RGB Images [8.2] EvidMTLは、深度推定とセマンティックセグメンテーションのために明らかなヘッドを使用するマルチタスク学習フレームワークである。
EvidKimeraは不確実性を認識したセマンティックサーフェスマッピングフレームワークで、3次元メートル法とセマンティックの整合性を改善するために明らかな深さとセマンティックス予測を使用する。
ScanNetV2のゼロショットマッピングテストでは、EvidKimeraはセマンティックサーフェスマッピングの精度と一貫性でKimeraを上回っている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:56:48 GMT)
Adaptive Prototype Learning for Multimodal Cancer Survival Analysis [8.2] 本稿では, 適応型プロトタイプ学習(Adaptive Prototype Learning, APL)を提案する。
APLはデータ駆動方式で代表プロトタイプを適応的に学習し、重要な情報を保持しながら冗長性を低下させる。
本手法では,高次元表現と生存予測の橋渡しとして,学習可能な2つのクエリベクトルを用いる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:32:15 GMT)
Towards One Model for Classical Dimensionality Reduction: A Probabilistic Perspective on UMAP and t-SNE [8.1] 本稿では,Wishart分布を用いたグラフラプラシアン(データ精度行列の推定値)について述べる。
同様の次元削減手法を研究できるツールを紹介した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:22:22 GMT)
SMAC-R1: The Emergence of Intelligence in Decision-Making Tasks [8.1] 本稿では,DeepSeek-Coder-v2.5-236Bから抽出したQwen2.5-7B-Base LLMに基づくSMAC-R1を紹介する。
オフライン学習プロセスにおける行動クローン後のオンライン強化学習と同様に、私たちのパイプラインでは、エージェントがDeepSeek LLMを利用して決定ツリーコードを生成する。
従来の23のSMACタスクと10の新たに設計されたタスクで実験を行い、提案手法が高品質で解釈可能な決定木を作成できることを実証した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:38:52 GMT)
Search-Based Path Planning in Interactive Environments among Movable Obstacles [8.0] 本稿では,2つのPAMOの定式化について述べる。
完全性と解の最適性を保証する計画手法であるPAMO*を開発し,その2つの問題を解決する。
結果から,PAMO*は最大400個のオブジェクトを持つ乱雑な写像において,1秒以内に最適解を見つけることができることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:04:03 GMT)
DVM-SLAM: Decentralized Visual Monocular Simultaneous Localization and Mapping for Multi-Agent Systems [7.9] 本稿では,DVM-SLAM(Decentralized Visual Monocular SLAM)について述べる。
DVM-SLAMの実際の適用性は、カスタム衝突回避フレームワークを備えた物理ロボットで検証される。
また,最先端の単分子C-SLAMシステムに匹敵する精度を示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:10:21 GMT)
Propagating Model Uncertainty through Filtering-based Probabilistic Numerical ODE Solvers [7.9] 本稿では, ODEフィルタと数値次数を組み合わせた新しい手法を提案する。
複数の力学系に対する実験により、結果として生じる不確実性推定が参照解と密接に一致していることが示される。
この結果から,確率的数値法は力学系における数値的およびパラメトリック的不確実性の両方を効果的に定量化できることが示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:26:42 GMT)
Slow is Fast! Dissecting Ethereum's Slow Liquidity Drain [7.8] 分散型金融(DeFi)の脅威である緩やかな流動性ドレイン(SLID)詐欺を特定する。
本研究では,2018年以降の6大取引所(DEX)における319,166の流動性プールの大規模解析を行った。
我々は3,117個のSLIDが影響を受けた流動性プールを同定し,累積損失は1億3300万ドル以上となった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:24:35 GMT)
InviCloak: An End-to-End Approach to Privacy and Performance in Web Content Distribution [7.8] InviCloakは、TLSを変更したりCDNをアップグレードしたりすることなく、ユーザの機密性とWebサイトのプライベートコミュニケーションを保護するシステムである。
InviCloakは、既存のDNSインフラストラクチャを使用して、軽量でセキュアで実用的なキー配布メカニズムを構築する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:06:47 GMT)
MIDAS: Modeling Ground-Truth Distributions with Dark Knowledge for Domain Generalized Stereo Matching [7.7] 提案手法を用いたPCWNetは,KITTI 2015 と 2012 のデータセット上での最先端の一般化性能を実現する。
提案手法は,4つの一般的な実世界のデータセットにまたがる包括的ランキングにおいて,既存の手法よりも優れる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:27:58 GMT)
Bi-Lipschitz Ansatz for Anti-Symmetric Functions [7.7] 反対称関数を近似する新しい普遍アンサッツを提案する。
このアンザッツの主な利点は、自然に定義された計量に関してバイリプシッツであることである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:47:41 GMT)
Dedicated Feedback and Edit Models Empower Inference-Time Scaling for Open-Ended General-Domain Tasks [7.7] 推論時間スケーリングは、OpenAI o1やDeepSeek R1といった最近のモデルの成功に不可欠である。
私たちは、人間が最初に試みる方法からインスピレーションを得て、他の人から詳細なフィードバックを求め、そのようなフィードバックに基づいて改善します。
Arena EloのベンチマークであるArena Hardのパフォーマンスは、初期レスポンスドラフトの数、効果的なフィードバック、編集されたレスポンスをスケールすることで向上できることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:30:24 GMT)
LVLM-Compress-Bench: Benchmarking the Broader Impact of Large Vision-Language Model Compression [7.7] LVLM-Compress-Benchはマルチモーダル入力駆動タスクによるLVLMの生成性能に対する圧縮の影響を広く研究するフレームワークである。
一般的なLLaVAフレームワークの4つのLVLM変種を用いて、さまざまな最先端KVと重み圧縮手法を統合することにより、分析結果を提示する。
本フレームワークは,実世界と合成データセットの組み合わせを利用して,一般的な指標と重要な指標の両方に対する圧縮効果を実証する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:21:18 GMT)
TractCloud-FOV: Deep Learning-based Robust Tractography Parcellation in Diffusion MRI with Incomplete Field of View [7.6] 本研究では,不完全なFOV条件下でのトラクトグラフィーを堅牢に解析するディープラーニングフレームワークであるTractCloud-FOVを紹介する。
そこで本研究では,実世界劣等なFOVカットオフシナリオのスペクトルをシミュレートするために,トラクトグラムを合成的にカットする,新しいトレーニング戦略FOV-Cut Augmentation(FOV-CA)を提案する。
提案したTractCloud-FOVを,不完全なFOVを含む2つの実生活データセットと合成されたトラクトグラフィーで評価した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:31:21 GMT)
PathoPainter: Augmenting Histopathology Segmentation via Tumor-aware Inpainting [7.5] 画像とマスクのペア生成を腫瘍塗布タスクとして再構成するPathoPainterを提案する。
本手法は,腫瘍領域を塗布しながら背景を保存し,生成した画像と対応するマスクとの正確な整合性を確保する。
包括的評価は、腫瘍の種類や様々なトレーニングデータスケールを特徴とする複数のデータセットにまたがる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:21:12 GMT)
LangGas: Introducing Language in Selective Zero-Shot Background Subtraction for Semi-Transparent Gas Leak Detection with a New Dataset [7.5] ガス漏れは予防を必要とする重大な危険をもたらす。
近年の研究では、この問題に機械学習技術を適用しているが、高品質でパブリックなデータセットが不足している。
本稿では,背景部分抽出,ゼロショットオブジェクト検出,フィルタリング,セグメンテーションを組み合わせたゼロショット手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:19:44 GMT)
Curiosity-Driven Imagination: Discovering Plan Operators and Learning Associated Policies for Open-World Adaptation [7.4] 動的で不確実な環境に素早く適応することは、ロボット工学における大きな課題である。
従来のタスク・アンド・モーション・プランニングアプローチは、予期せぬ変化に対処し、適応するときにデータ非効率であり、学習中に世界モデルを活用するのに苦労する。
我々はこの問題を、2つのモデルを統合するハイブリッド計画学習システムで解決する: 遷移を学習し、固有の好奇性モジュール(ICM)による探索を駆動する低レベルニューラルネットワークベースモデル。
シーケンシャル・ノベルティ・インジェクションを用いたロボット操作領域における評価は、我々のアプローチがより高速に収束し、最先端のハイブリッド手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:02:26 GMT)
Watson: A Cognitive Observability Framework for the Reasoning of LLM-Powered Agents [7.4] ファウンデーションモデル(FM)はエージェントソフトウェアのような複雑なソフトウェアシステムにおいて、ますます顕著な役割を担っている。
高速思考の大規模言語モデル(LLM)は、レイテンシの制約のため、依然として好まれている。
暗黙の推論プロセスに推論可能性を提供するフレームワークであるWatsonを紹介します。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:55:37 GMT)
ChatGPT vs Social Surveys: Probing Objective and Subjective Silicon Population [7.3] 大規模言語モデル(LLM)は、社会調査における人間の反応をシミュレートし、信頼できる予測を生成する可能性を秘めている。
GPTにより生成したシリコン試料の集団パラメータを同定するサンプリング分布を生成するために,繰り返しサンプリングを用いる。
以上の結果から、GPTの人口分布は、性別と平均年齢の点で、2020年の米国人口と一致していることがわかった。
GPTの立位スコアの点推定は極めて矛盾しており、特定のイデオロギーに対する明確な傾きを示していない。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:37:06 GMT)
Disentangling the Complex Multiplexed DIA Spectra in De Novo Peptide Sequencing [7.2] Data-Independent Acquisition (DIA) は、高強度ピークをサンプリングするだけでなく、すべてのペプチドをカバーする感度を向上させるために導入された。
デノボペプチドシークエンシングにおけるDIAデータの有用性は明らかになっていない。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:15:54 GMT)
Computational Intractability of Strategizing against Online Learners [7.2] 本稿では,学習者に対する準最適戦略を,標準の非回帰アルゴリズムで計算可能であることを示す。
これにより、一般的なゲーム理論の設定において最適な戦略を見つけるための基本的な計算障壁が確立される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:28:50 GMT)
A General Framework for Scalable UE-AP Association in User-Centric Cell-Free Massive MIMO based on Recurrent Neural Networks [7.2] 本研究では,セルフリー大規模ネットワークにおけるアクセスポイント (AP) とユーザ機器 (UE) の連携の課題に対処する。
Bi Long ShortTerm Memoryセルを利用したディープラーニングアルゴリズムと、重み更新のためのハイブリッド確率的手法を導入している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:07:17 GMT)
MobileViM: A Light-weight and Dimension-independent Vision Mamba for 3D Medical Image Analysis [7.1] この原稿は3次元医用画像の効率的なセグメンテーションのための合理化アーキテクチャであるMobileViMを提示する。
我々は,視覚マンバを基盤とした新しい次元非依存機構と二方向トラバースアプローチを考案した。
これらの拡張により、MobileViMは1つのグラフィックス処理ユニットで毎秒90フレームを超えるセグメンテーション速度を達成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:27:12 GMT)
PQMass: Probabilistic Assessment of the Quality of Generative Models using Probability Mass Estimation [7.1] そこで本研究では,各試料から得られる2つの分布を比較するための可能性のない手法を提案する。
PQMassはサンプル空間を重複しない領域に分割し、各領域に該当するデータサンプルの数にチ二乗テストを適用する。
我々はPQMassが適度に高次元データにスケールできることを示し、実用的な応用における特徴抽出の必要性を排除している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:43:48 GMT)
Efficiently Escaping Saddle Points under Generalized Smoothness via Self-Bounding Regularity [7.1] 一階法および二階法における適切な点を示す。
我々の知る限り、これは一階一般化の下での非定常最適化のための最初のノンテキストブックである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:57:34 GMT)
GIFT: Unlocking Full Potential of Labels in Distilled Dataset at Near-zero Cost [7.1] データセット蒸留の最近の進歩は、事前訓練された教師モデルによって生成されたソフトラベルを使うことによる重要な利点を示している。
ラベルのフル活用を強調することによって,新しい視点を導入する。
本稿では,ソフトラベルの精細化とコサイン類似度に基づく損失関数を含むGIFTを紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:52:43 GMT)
A learning-based approach to stochastic optimal control under reach-avoid constraint [7.0] 我々は,リーチアビド制約を受けるマルコフ系を最適に制御するためのモデルフリーアプローチを開発する。
適切な仮定の下では、政策パラメータが最適パラメータに収束し、システム軌道が到達不能な制約を高い確率で満たすことが保証される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:04:11 GMT)
Curb Your Attention: Causal Attention Gating for Robust Trajectory Prediction in Autonomous Driving [6.9] 自律走行における軌道予測モデルは、非因果エージェントの摂動に弱い。
過去のステップのウィンドウ上で、エージェント間の因果関係を特定するために、$textitCausal tRajecTory predICtion$ $textbf(CRiTIC)$を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:13:01 GMT)
Can We Optimize Deep RL Policy Weights as Trajectory Modeling? [6.8] 我々は、歴史的政策のネットワーク重みの軌跡に代表される、深いRLにおける政策学習経路に焦点を当てる。
本稿では,政策ネットワークの重み付けを自己回帰的に処理するTIPL(Transformer as Implicit Policy Learner)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:12:22 GMT)
Comparing hundreds of machine learning classifiers and discrete choice models in predicting travel behavior: an empirical benchmark [6.8] 多くの研究は、旅行需要予測において機械学習(ML)と離散選択モデル(DCM)を比較してきた。
これらの研究は、文脈変動を考慮せずに決定論的にモデルを比較するため、一般化性に欠けることが多い。
このベンチマークでは、2つの大規模データソースを比較した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:21:55 GMT)
StoryTeller: Improving Long Video Description through Global Audio-Visual Character Identification [6.8] ロングビデオ記述には、一貫した文字識別やプロットレベルの記述など、新しい課題が導入されている。
低レベルな視覚概念と高レベルなプロット情報の両方を取り入れた長編ビデオの濃密な記述を生成するシステムであるStoryTellerを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:13:28 GMT)
An optimal Petrov-Galerkin framework for operator networks [6.7] 我々はペトロフ・ガレルキン変分模倣演算子ネットワーク(PG-VarMiON)と呼ばれる演算子ネットワークフレームワークを提案する。
PG−VarMiONは、PDEデータと対応するPDEソリューションとからなるラベル付きデータセットを用いて教師付き方法で訓練される。
PG-VarMiONの近似誤差推定を導出し,様々な誤差源の寄与を明らかにする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:21:32 GMT)
A Novel Solution for Drone Photogrammetry with Low-overlap Aerial Images using Monocular Depth Estimation [6.7] 低オーバラップの空中画像は、従来のフォトグラム法に重大な課題を生んでいる。
本稿では,従来の手法の限界に対処するため,単眼深度推定に基づく新しいワークフローを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:59:38 GMT)
Conclusive exclusion of quantum states with group action [6.6] 群作用下での量子状態の包括的状態排除について検討する。
有限群やコンパクトリー群を含む複素対称性に対しては、排他的排除のための十分条件を導出する。
量子状態の排他的排除によるゼロエラー通信について検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:50:23 GMT)
Shazam: Unifying Multiple Foundation Models for Advanced Computational Pathology [6.6] 計算病理学(CPath)における基礎モデル(FM)は、病理画像データセットから有意義な特徴の抽出を著しく進歩させてきた。
優れた性能にもかかわらず、これらのモデルは、異なるタスクに適用した場合にしばしばばらつきを示す。
複数のCPathモデルを効率的に組み合わせた新しいフレームワークであるShazamを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:35:09 GMT)
HalluCounter: Reference-free LLM Hallucination Detection in the Wild! [6.5] HalluCounterは、応答応答とクエリ応答の整合性とアライメントパターンの両方を利用する参照なし幻覚検出手法である。
我々の手法は最先端の手法よりもかなり優れており、データセット間での幻覚検出における平均信頼度は90%を超えている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:59:18 GMT)
Towards Fully-Automated Materials Discovery via Large-Scale Synthesis Dataset and Expert-Level LLM-as-a-Judge [6.4] 本研究は,実践的でデータ駆動型資源を提供することで,材料科学コミュニティを支援することを目的としている。
オープンアクセス文献から17Kのエキスパートが検証した合成レシピの包括的データセットを収集した。
AlchemicalBenchは、合成予測に適用された大規模言語モデルの研究をサポートするエンドツーエンドフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:40:18 GMT)
Iterative Flow Matching -- Path Correction and Gradual Refinement for Enhanced Generative Modeling [6.3] 本稿では,フローマッチングが幻覚を発生させる理由を説明し,生成プロセスを改善するための反復的プロセスを提案する。
我々の反復的プロセスは、事実上$textitany$生成モデリング技術に統合することができ、それによって合成画像システムの性能と堅牢性を向上させることができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:55:58 GMT)
Neural Network Surrogate Model for Junction Temperature and Hotspot Position in $3$D Multi-Layer High Bandwidth Memory (HBM) Chiplets under Varying Thermal Conditions [6.3] 本研究では3次元チップレットにおける接合温度とホットスポット位置の高速予測のためのデータ駆動ニューラルネットワークモデルを開発する。
パラメータ空間では考慮されない他の熱条件に対して良い一般化性を示す。
これは、高性能コンピューティングアプリケーションにおける熱管理と性能を改善するための貴重なツールである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:05:54 GMT)
OrbID: Identifying Orbcomm Satellite RF Fingerprints [6.2] 本稿では、Orbcomm衛星形成への衛星通信におけるRFF(Radio Frequency Fingerprinting)に関する以前の研究を拡張した。
我々は、異なるSDRと位置を用いて、Orbcom衛星コンステレーションから8992474個のパケットを含む新しいデータセットを収集する。
我々は、星座内の異なる衛星を区別する場合のROC AUCスコア0.53、正衛星とSDRを区別する場合の0.98を達成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:33:31 GMT)
No Forgetting Learning: Memory-free Continual Learning [6.2] この作業では、メモリフリーの継続的学習フレームワークであるNo Forgetting Learning(NFL)を紹介します。
NFLは最先端の手法の約14.75倍のメモリを消費し、競争力を発揮する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:25:46 GMT)
InfoSEM: A Deep Generative Model with Informative Priors for Gene Regulatory Network Inference [6.2] 遺伝子発現データから遺伝子制御ネットワーク(GRN)を推定することは生物学的プロセスを理解する上で重要である。
インフォメーションモデルであるInfoSEMを導入する。
バイオマーカー発見などの現実世界の応用をよりよく反映した,生物学的に動機づけたベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:32:00 GMT)
An Efficient Learning Method to Connect Observables [6.2] 本稿では,新しいモデルであるマルチパラメータ固有値問題(MEP)エミュレータを提案する。
新しい方法はエミュレータを接続し、可観測物から可観測物に直接予測を行う。
一次元格子上の簡単なシミュレーションによりMEPエミュレータの性能が確認できる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:07:34 GMT)
Spatial-Temporal Perception with Causal Inference for Naturalistic Driving Action Recognition [6.1] 自動車キャビン監視システムには, 自然な運転行動認識が不可欠である。
これまでのアプローチでは、微妙な振る舞いの違いを観察する能力が限られていたため、実践的な実装に苦労してきた。
本稿では,時間的情報と空間的関係を両立する空間的知覚アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:28:11 GMT)
Training and Evaluating Language Models with Template-based Data Generation [6.0] 我々は、700万以上の合成された小学校数学問題からなるデータセットを作成する。
このデータセットは、数学的推論においてLLMを事前学習、微調整、評価するための貴重なリソースとして機能する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:54:29 GMT)
TPC: Cross-Temporal Prediction Connection for Vision-Language Model Hallucination Reduction [5.9] 視覚言語モデル(VLM)は、大きな言語モデル(LLM)の印象的な能力を生かして、目覚ましい進歩を遂げた。
それにもかかわらず、幻覚として知られる重要な課題は、モデルが画像から欠落している物体や属性を過度に記述するときに起こる。
この制限により、高スループットアプリケーションにおけるモデルの信頼性が低下する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:11:00 GMT)
Quantumness and entropic uncertainty for a pair of static Unruh-DeWitt detectors [5.9] 我々はミンコフスキー時空で動作する2つの検出器について検討し、このフレームワーク内の様々な量子リソースの特性を解析する。
我々はベル非局所性、量子コヒーレンス、量子コヒーレンス(NAQC)の非局所的優位性、および検出器間のエネルギー比と距離に関する不確実性の測定に焦点をあてる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:12:29 GMT)
Fusion of Various Optimization Based Feature Smoothing Methods for Wearable and Non-invasive Blood Glucose Estimation [5.9] 得られた基準血糖値の取得特徴および確率は信頼性が低い。
本稿では,得られた特徴や基準血糖値を円滑にするために適合する手法を提案する。
提案手法は平均絶対相対偏差(MARD)を0.0930とし、クラーク誤差のゾーンAに落下するテストデータの比率を94.1176%とする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:42:53 GMT)
CA-W3D: Leveraging Context-Aware Knowledge for Weakly Supervised Monocular 3D Detection [5.9] 本稿では,この制限を2段階の訓練パラダイムで解決するために,単眼3次元物体検出のためのコンテキスト認識弱スーパービジョン(CA-W3D)を提案する。
具体的には、まず、トレーニング可能なモノクロ3Dエンコーダと凍結したオープンボキャブラリ2D視覚接地モデルから得られた地域オブジェクトの埋め込みを整列するROCM(Regional-wise Object Contrastive Matching)を用いた事前学習ステージを導入する。
第2段階では、文脈先行を効果的に伝達するD2OD(Dual-to-One Distillation)機構を備えた擬似ラベルトレーニングプロセスを導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:02:13 GMT)
GBT-SAM: A Parameter-Efficient Depth-Aware Model for Generalizable Brain tumour Segmentation on mp-MRI [5.8] GBT-SAMは、Segment Anything Model(SAM)を脳腫瘍のセグメンテーションタスクに拡張する新しいフレームワークである。
これは、アダルト・グリオーマデータセット上で最先端のパフォーマンスを達成する。
メニンギオーマ、小児グリオーマ、サブサハラグリオーマのデータセットにまたがる堅牢な一般化を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:18:22 GMT)
Matrix Factorization for Inferring Associations and Missing Links [5.7] リンク予測の欠如は、ネットワーク内の見えないが潜在的に存在するコネクションを特定する。
増殖検出においては、国家および非国家アクターによる核兵器獲得の試みを特定し、特徴付ける努力を支援する。
本稿では,新しい重み付き (WNMFk), Boolean (BNMFk), およびRecommender (RNMFk) 行列因数分解法と,ロジスティック因数分解を組み込んだアンサンブル変種をリンク予測のために導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:22:46 GMT)
The Next Frontier of LLM Applications: Open Ecosystems and Hardware Synergy [5.7] 大規模言語モデル(LLM)アプリケーションは、AIエコシステムの未来を形作っている。
本稿では, LLM アプリケーションの将来を考察し, 3層疎結合アーキテクチャを提案する。
安全でスケーラブルなAIデプロイメントのための重要なセキュリティとプライバシの課題を強調します。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:38:23 GMT)
When Radiation Meets Linux: Analyzing Soft Errors in Linux on COTS SoCs under Proton Irradiation [5.7] Linux on commercial off-the-shelf (COTS) system-on-chip (SoC) in spaceborne computingは、ソフトエラーのような放射線誘発障害に対する感受性を継承する。
現代のCOTSは、アグレッシブトランジスタのスケーリングにより、臨界電荷閾値が減少し、ソフトエラーを誘発し、高密度に充填されたトランジスタ内での放射線効果を増大させるため、この問題を悪化させる。
Linuxのモノリシックアーキテクチャはこれらのリスクを増幅し、密結合されたカーネルサブシステムはエラーを重要なコンポーネント(メモリ管理など)に伝達するが、エラー訂正コード(ECC)は最小限の緩和を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:31:48 GMT)
Image Computation for Quantum Transition Systems [5.6] 本稿では,量子遷移系に対する効率的な画像アルゴリズムを提供することにより,量子システムのモデル検査の開発を進める。
量子遷移系における画像計算の効率を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:49:49 GMT)
Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection [5.6] YOLOのようなリアルタイムオブジェクト検出器は、複数のエポックのための大規模なデータセットでトレーニングされた場合、例外的なパフォーマンスを達成する。
データが徐々に到着する現実のシナリオでは、ニューラルネットワークは破滅的な忘れに苦しむ。
YOLOを用いた連続物体検出に適した自己蒸留法であるYOLO LwFを紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:31:41 GMT)
Union of Experts: Adapting Hierarchical Routing to Equivalently Decomposed Transformer [5.6] 提案するUnion-of-Experts(UoE)は,変圧器を等価な専門家グループに分解し,入力データとエキスパートを選択的にルーティングする。
実験により、UoEモデルはフルアテンション、最先端のMoE、効率的なトランスフォーマーを上回ることが示されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:51:47 GMT)
When Claims Evolve: Evaluating and Enhancing the Robustness of Embedding Models Against Misinformation Edits [5.4] 本稿では,6つの一般的な実世界の誤情報編集の分類を導入し,有効で自然なクレーム変動を生成する摂動フレームワークを提案する。
標準の埋め込みモデルはユーザによる編集に苦労するが、LCMの埋め込みは高い計算コストで堅牢性を向上する。
本研究は,クレームマッチングシステムに実用的な改良を加え,より信頼性の高い偽情報の事実チェックを可能にした。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:00:35 GMT)
Precoder Learning for Weighted Sum Rate Maximization [5.3] 重み付き和プリコーディング(WSRM)のためのプリコーダを学習するための新しいディープニューラルネットワーク(DNN)を提案する。
既存のユニタリと比較して、提案したDNNは、最適プリコーディングポリシーに固有の結合と置換のバランスを利用する。
シミュレーションの結果,提案手法は学習性能と一般化性能の両方の観点から学習方法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:45:38 GMT)
Spatial regularisation for improved accuracy and interpretability in keypoint-based registration [5.3] 教師なしキーポイント検出に基づく最近のアプローチは、解釈可能性に非常に有望である。
本稿では,特徴量の空間分布を正規化するための3倍の損失を提案する。
我々の損失は特徴の解釈可能性を大幅に改善し、現在では正確で解剖学的に意味のあるランドマークに対応しています。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:48:25 GMT)
L$^2$M: Mutual Information Scaling Law for Long-Context Language Modeling [5.3] 我々は、長距離依存を管理する自然言語において、二分的相互情報スケーリング法を厳格に確立する。
我々は,過去情報を記憶するための潜在状態の大きさのスケーリングと,有効長コンテキスト長モデリングのためのモデルのキャパシティを関連づけたLong-context Language Modeling条件を定式化する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:59:48 GMT)
Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models [5.2] 強化学習(Reinforcement Learning, RL)は、エージェントが対話や報酬信号を通じて、複雑な振る舞いを自律的に最適化することを可能にする。
本研究では,自然言語タスク記述から直接報酬関数を生成するために,事前学習されたLLMであるGPT-4を利用した教師なしパイプラインを提案する。
報酬はシミュレーション環境でRLエージェントを訓練するために使用され、報酬生成プロセスは実現可能性を高めるために形式化される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:08:44 GMT)
Computational Law: Datasets, Benchmarks, and Ontologies [5.2] 近年のコンピュータ科学と人工知能の発展は、法分野に寄与している。
機械学習モデルとディープラーニングモデルは、トレーニングと比較のためにかなりの量のドメイン固有データを必要とする。
意味的な資源は大規模な法体系を構築するのに有用である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:46:15 GMT)
Learning 3D Medical Image Models From Brain Functional Connectivity Network Supervision For Mental Disorder Diagnosis [5.2] MRIに基づく精神疾患の診断において、最も古い研究は機能的MRI(fMRI)に由来する機能的接続ネットワーク(FCN)に焦点を当てていた。
本稿では,sMRIとFCNの対比学習を利用したCINP(Contrastive Image-Network Pre-training)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:30:33 GMT)
A Unified Framework with Novel Metrics for Evaluating the Effectiveness of XAI Techniques in LLMs [5.1] 本研究では,5つのXAI技術の有効性を評価するための4つの新しい指標を用いた総合的評価フレームワークを提案する。
この評価は、人間関係協定(HA)、ロバスト性、一貫性、コントラストの4つの重要な指標に焦点を当てている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:59:50 GMT)
Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control [5.1] 本稿ではロバスト決定性ポリシー勾配(RDPG)と呼ばれる強化学習アルゴリズムを提案する。
RDPGは2プレイヤーゼロサムダイナミックゲームとして$H_infty$制御問題を定式化している。
次に、決定論的政策勾配(DPG)とその深い強化学習を用いて、効果的な外乱減衰を伴う堅牢な制御政策を訓練する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:02:06 GMT)
LLM-guided Plan and Retrieval: A Strategic Alignment for Interpretable User Satisfaction Estimation in Dialogue [5.1] PRAISEは効果的なユーザ満足度予測のための解釈可能なフレームワークである。
3つのモジュールを通して動作する。
ユーザ満足度推定タスクの3つのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:12:33 GMT)
Implicit Neural Representation for Video and Image Super-Resolution [5.0] 暗黙的ニューラル表現(INR)を用いた超解像の新手法を提案する。
提案手法は,低分解能入力と3次元高分解能グリッドのみを用いた高分解能再構成を容易にする。
提案手法であるSR-INRは,フレームと画像間の一貫した詳細を維持し,時間的安定性を著しく向上させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:58:55 GMT)
ThrowBench: Benchmarking LLMs by Predicting Runtime Exceptions [4.9] 大規模言語モデル(LLM)は、コード理解と合成の驚くべき能力を示している。
4つの異なるプログラミング言語で書かれた2,400以上の短いユーザ記述プログラムからなるベンチマークであるThrowBenchを紹介する。
我々は6つの最先端コードLLMのベンチマーク評価を行い、19~38%(F1スコア)の適度なパフォーマンスを確認した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:22:23 GMT)
Simple Fault Localization using Execution Traces [4.9] スペクトルベースの断層定位(SBFL)を改善するための簡単な方法を提案する。
提案手法は,OchiaiやQuixBugsなどのSBFL式よりも優れている。
既存のSBFLソリューションは、合理的な努力で改善される可能性がある。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:41:12 GMT)
Extracting Fix Ingredients using Language Models [4.9] ScanFixは、追加のスキャナモデルを利用して、バグファイルと潜在的プロジェクトレベルのコンテキストから識別子を抽出するアプローチである。
遠距離識別子の知識の欠如が、修復に失敗した重要な原因であることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:48:52 GMT)
UoR-NCL at SemEval-2025 Task 1: Using Generative LLMs and CLIP Models for Multilingual Multimodal Idiomaticity Representation [4.8] SemEval-2025 Task 1は、与えられた名目化合物とのアライメントに基づいて、画像のランク付けに重点を置いている。
この研究は、生成的大言語モデル(LLM)と多言語CLIPモデルを用いて、慣用的な複合表現を強化する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:36:48 GMT)
HILGEN: Hierarchically-Informed Data Generation for Biomedical NER Using Knowledgebases and Large Language Models [4.7] HILGENは、UMLS(Unified Medical Language System)のドメイン知識と、大規模言語モデル(LLM)によって生成された合成データを組み合わせた階層的インフォームドデータ生成手法である。
提案手法はUMLSの階層構造を利用して,LLMからコンテキスト情報を取り込みながら,関連する概念でトレーニングデータを拡張する。
提案手法は,手動で注釈付けしたデータを必要とすることなく,数ショット設定でNERの性能を向上させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:02:19 GMT)
Quantum-Inspired Reinforcement Learning in the Presence of Epistemic Ambivalence [4.7] エピステム・アンビバレンス(EA)は、矛盾する証拠や矛盾した経験から生じる。
EA-MDPは意思決定プロセスにおけるEAの理解と制御を目的としている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:54:31 GMT)
Large Language Models for Zero-shot Inference of Causal Structures in Biology [4.7] 本稿では,生物学における因果関係のゼロショット推論のための大規模言語モデル(LLM)を評価する枠組みを提案する。
実世界の介入データを用いて, LLMから得られた因果関係を系統的に評価した。
以上の結果から, 比較的小さなLLMでも生物学的システムにおける因果構造の意義を捉えることが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:43:30 GMT)
Extracting Formulae in Many-Valued Logic from Deep Neural Networks [4.6] 本稿では,深いReLUネットワークからMV論理式を抽出するアルゴリズムを提案する。
このアルゴリズムは一般に、特に実数値の重みを持つネットワークに適用されるため、データに基づいて訓練された深いReLUネットワークから論理式を抽出することができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:33:28 GMT)
HyDA: Hypernetworks for Test Time Domain Adaptation in Medical Imaging Analysis [4.5] ドメイン特性を抑圧するのではなく活用する新しいハイパーネットワークフレームワークであるHyDAを紹介する。
具体的には、HyDAは暗黙のドメイン表現を学び、それを使ってモデルパラメータをオンザフライで調整する。
我々はHyDAをMRI脳年齢予測と胸部X線診断の2つの臨床応用で検証した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:17:40 GMT)
ValuePilot: A Two-Phase Framework for Value-Driven Decision-Making [4.4] 本稿では、データセット生成ツールキットDGTと、生成されたデータに基づいて訓練された意思決定モジュールDMMからなる2相値駆動意思決定フレームワークを提案する。
DGTは、データセットの有効性を保証するために、自動フィルタリング技術と人間のキュレーションを使用して、価値次元に基づいてシナリオを生成し、現実世界のタスクを密にミラーリングすることができる。
生成されたデータセットでは、シナリオ固有の値を認識し、アクションの実現可能性を計算し、複数の値次元間のトレードオフをナビゲートして、パーソナライズされた決定を行う。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:02:53 GMT)
Joint Masked Reconstruction and Contrastive Learning for Mining Interactions Between Proteins [4.3] タンパク質とタンパク質の相互作用 (PPI) の予測は、細胞操作の基礎となるメカニズムを解明するための手段である。
本稿では,JmcPPIと呼ばれるマスク型再構成とコントラスト学習を組み合わせた新しいPPI予測手法を提案する。
3つの広く利用されているPPIデータセットに対して行われた大規模な実験は、JmcPPIが既存の最適なベースラインモデルを上回ることを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:39:12 GMT)
Estimation of multiple mean vectors in high dimension [4.2] 我々は,独立標本に基づいて,共通空間上の様々な確率分布の多次元的手段を推定する。
我々のアプローチは、これらのサンプルから得られた経験的手段の凸結合による推定器の形成である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:32:52 GMT)
UniNet: A Unified Multi-granular Traffic Modeling Framework for Network Security [4.2] UniNetは、新しいマルチグラニュラートラフィック表現(T-Matrix)を導入する統一フレームワークである
UniNetは、最新のネットワークセキュリティのための新しいベンチマークを設定する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:39:37 GMT)
ConstellationNet: Reinventing Spatial Clustering through GNNs [4.2] 我々は、CNNの埋め込み能力、GNNの隣接集約、バッチデータを扱うニューラルネットワークの機能を活用して、空間クラスタリングを改善し、グラフ拡張予測による分類を行う畳み込みニューラルネットワーク(CNN)グラフニューラルネットワーク(GNN)フレームワークを開発する。
ConstellationNetは、複数のデータセットにまたがる教師付き分類と教師なしクラスタリングの両方で最先端のパフォーマンスを実現し、モデルのサイズとトレーニング時間を最大10倍に削減しつつ、最先端の分類とクラスタリングより優れたパフォーマンスを実現している。
速いトレーニングと強力な性質のため、ConstellationNetは疫学や疫学などの分野での約束を持っている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:10:11 GMT)
Explainable AI in Time-Sensitive Scenarios: Prefetched Offline Explanation Model [4.2] Poemは、画像データに対するモデルに依存しない局所的な説明可能性アルゴリズムである。
それは、迅速かつ効果的な説明を提供するために、模範者、反例者、および正当性マップを生成する。
前作のAbeleのスピードと能力は、よりニュアンスで多彩な模範を生み出す能力で上回っている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:09:20 GMT)
Dicke superradiant enhancement of the heat current in circuit QED [4.1] Dicke superradiant emissionのような集団効果は、量子デバイスの性能を高めることができる。
本研究では, 冷湯と熱湯の間に流れる熱流を, N$ qubitsのアンサンブルを通して調査した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:44:04 GMT)
Slug Mobile: Test-Bench for RL Testing [4.1] Slug Mobileは、AVのシミュレートと現実のギャップに対処するために作られた、第10の自動運転車だ。
他の10倍のAVで見つかった従来のセンサーに加えて、Dynamic Vision Sensorも搭載しました。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:11:20 GMT)
AI-based Programming Assistants for Privacy-related Code Generation: The Developers' Experience [4.0] 私たちは、ソフトウェアプライバシの要件を満たすために、AIベースのプログラミングアシスタントの期待と現実が同じかどうかを知りたかったのです。
私たちは世界中で51人の開発者を対象に調査を実施しました。
私たちは、開発者がプライバシを保証するコードを生成することで、AIベースのプログラミングアシスタントをより信頼するために、改善する必要があることに気付きました。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:34:25 GMT)
FREAK: Frequency-modulated High-fidelity and Real-time Audio-driven Talking Portrait Synthesis [4.0] FREAK という,周波数変調,高忠実,リアルタイムのオーディオ駆動型talKing ポートレート合成フレームワークを提案する。
F FREAKは、周波数領域の観点から肖像画を語るモデルであり、合成された肖像画の忠実性と自然性を高める。
提案手法は, 顔のテクスチャを詳細に表現し, 高精度な唇同期をリアルタイムに実現し, 高い忠実度を呈するポートレートを合成できることを実証した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:52:46 GMT)
Reinforcement Learning on Reconfigurable Hardware: Overcoming Material Variability in Laser Material Processing [4.0] 本研究では,実時間実行を実現するためにフィールドプログラマブルゲートアレイ上に実装された,レーザプロセス制御のための新しいリアルタイム強化学習手法を提案する。
具体的には、このアルゴリズムは各一意な表面特性に対する正しいパワープロファイルを学習し、手動の最適定電力戦略よりも大幅に改善された。
このアプローチは、レーザープロセスの自動化と最適化において大きな進歩を示し、複数の産業で応用される可能性がある。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:23:22 GMT)
Provably Correct Automata Embeddings for Optimal Automata-Conditioned Reinforcement Learning [3.9] この研究は、オートマチック条件付きRL問題の理論的枠組みを提供し、おそらくほぼ正しい学習可能であることを示す。
次に、最適マルチタスクポリシー学習を保証し、正当に正当な自動埋め込みを学習する手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:37:05 GMT)
GAGrasp: Geometric Algebra Diffusion for Dexterous Grasping [3.9] 本稿では, ゆるやかなグリップ生成のための新しいフレームワークであるGAGraspを提案する。
本手法は,SE(3)対称性制約を直接アーキテクチャに符号化することにより,データとパラメータの効率を向上する。
我々は、物理インフォームド・リファインメント・レイヤを組み込み、生成したグリップが物理的に妥当で安定であることを保証する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:00:55 GMT)
Evaluating Search Engines and Large Language Models for Answering Health Questions [3.9] 本研究は,150の健康関連質問に対して,4つの人気のあるSE,7つのLLM,および検索強化(RAG)変異体の性能を比較した。
発見によると、SEは50から70%の質問に正しく答えており、多くの場合、健康問題に反応しない多くの検索結果によって妨げられている。
RAG法はLLMの有効性を著しく向上させ, 精度を最大30%向上させた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:53:49 GMT)
Learning Causal Response Representations through Direct Effect Analysis [3.9] 本稿では,因果応答表現を学習するための新しいアプローチを提案する。
本手法は,多次元的な結果が処理変数によって最も直接的に引き起こされる方向を抽出することを目的としている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:01:41 GMT)
Mamba-based Deep Learning Approaches for Sleep Staging on a Wireless Multimodal Wearable System without Electroencephalography [3.7] 本稿では,アンネワンシステムからの信号に基づいて,マンバをベースとした睡眠ステージングのためのディープラーニングアプローチについて検討する。
我々は、畳み込みリカレントニューラルネットワーク(CRNN)とリカレントニューラルネットワーク(RNN)アーキテクチャを用いて、Mambaベースのモデルを訓練した。
深層学習モデルは、ANNE Oneから主要な睡眠段階を推測することができ、第三次ケア睡眠クリニックに参加する成人のデータにうまく適用することができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:43:09 GMT)
Enhancing Vietnamese VQA through Curriculum Learning on Raw and Augmented Text Representations [3.7] Visual Question Answering (VQA)は、テキスト入力と視覚入力をまたいだ推論を必要とするマルチモーダルタスクである。
従来の手法は、広範囲の注釈付きデータセット、計算コストの高いパイプライン、大規模な事前訓練されたモデルに大きく依存することが多い。
パラフレーズベースの機能拡張モジュールと動的カリキュラム学習戦略を組み合わせたトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:42:37 GMT)
Decidability of Querying First-Order Theories via Countermodels of Finite Width [3.7] 本稿では,幅広い論理的包含問題の決定可能性を確立するための汎用的枠組みを提案する。
幅有限有限普遍モデル集合を示す論理を同定し、幅広い準同型クローズドクエリに対して決定可能なエンテーメントを保証する。
ルールの有限分割幅集合が、他の既知の抽象決定可能なクラスをサブスクライブするが、既存の成層概念を活用することにより、また、幅広い新しいルールセットをカバーしている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:09:31 GMT)
Is Bellman Equation Enough for Learning Control? [3.7] ベルマン方程式のユニークな解は連続状態空間において成り立たないことを示す。
次に, 既約解と既約解の指数的不均衡に起因する不安定解への収束という, 値に基づく手法で共通の障害モードを示す。
最後に,この問題に対処するための構築による安定解の収束を保証する肯定的なニューラルアーキテクチャを導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:57:43 GMT)
Speculative MoE: Communication Efficient Parallel MoE Inference with Speculative Token and Expert Pre-scheduling [3.7] MoE(Mixture of Experts)は、現代のトランスフォーマーベースのLLM(Large Language Models)を前例のない規模に拡張可能なニューラルネットワークとして普及している。
最先端のMoE推論フレームワークであるDeepSpeed-MoEは、EP(Expert Parallelism)、TP(Tensor Parallel)、DP(Data Parallelism)を含む3D並列パラダイムを採用している。
本研究の目的は,EPの通信オーバヘッドをSpeculative MoEという技術で戦略的に削減し,DeepSpeed-MoEを向上することである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:52:22 GMT)
The role of exchange interactions in superradiant phenomena [3.7] ディックモデル(Dicke model)は、強い光-物質相互作用とその超放射特性を探求する中心的なプラットフォームである。
異方性スピンスピン結合と異方性スピンスピンカップリングがディックパラダイムに与える影響について検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:47:45 GMT)
Multi-modal Summarization in Model-Based Engineering: Automotive Software Development Case Study [3.7] 多様なデータモダリティからの情報を統合するマルチモーダル要約は、様々なプロセスにおける情報理解を支援するための有望なソリューションである。
マルチモーダル要約の応用と利点は、モデルベース工学(MBE)においてあまり注目を集めておらず、複雑なシステムの設計と開発において基盤となっている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:53:37 GMT)
DRACO-DehazeNet: An Efficient Image Dehazing Network Combining Detail Recovery and a Novel Contrastive Learning Paradigm [3.6] 我々は,Detail Recovery and Contrastive DehazeNetを開発した。
濃密な拡張反転残差ブロックと、注意に基づく詳細回復ネットワークを介して、効率的で効果的な脱ハジングを提供する。
大きな革新は、新しい四重項損失に基づくコントラストデハージングパラダイムによって達成された、限られたデータで効果的にトレーニングできることである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:06:50 GMT)
Geometry-Constrained Monocular Scale Estimation Using Semantic Segmentation for Dynamic Scenes [3.6] 本研究では,エゴモーション推定とグラウンドポイントの選択のための革新的な戦略を提案する。
本手法では,不安定な特徴を除去するためにダイナミック・オブジェクトマスクを組み込んでおり,立体三角測量に地上面マスクを用いる。
このアプローチとORB-SLAM3のモ眼バージョンの統合は,道路モデルの正確なエスティメーションを決定づける。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:15:13 GMT)
In-Context Reverse Classification Accuracy: Efficient Estimation of Segmentation Quality without Ground-Truth [3.6] 本稿では,セグメント化品質を自動的に推定する新しいフレームワークであるIn-Context Reverse Classification Accuracy(In-Context RCA)を紹介する。
提案手法により,最小限の参照データによる効率的な品質推定が可能となる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:08:34 GMT)
STX-Search: Explanation Search for Continuous Dynamic Spatio-Temporal Models [3.6] モデルからの予測を理解することは 信頼性と信頼性を確保するために重要です
連続時間動的グラフデータに基づいてトレーニングされたモデルについて、既存の方法はほとんど説明できない。
本稿では,新しい探索戦略と目的関数を導入し,忠実で解釈可能な説明を求める。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:55:25 GMT)
Self-Adaptive Gamma Context-Aware SSM-based Model for Metal Defect Detection [3.6] 金属欠陥検出は工業品質保証に重要である。
既存の方法は、グレースケールのバリエーションと複雑な欠陥状態に苦しむ。
本稿では,自己適応型ガンマコンテキスト認識SSMモデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:11:32 GMT)
Semi-Quantum Conference Key Agreement with GHZ-type states [3.6] 本稿では,無限ラウンドの制限内での集団攻撃に対処する情報理論セキュリティ証明を提案する。
この進歩は、現実世界のアプリケーションに対するSQCKAプロトコルの実現可能性を高める。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:45:21 GMT)
Magnetic Field Data Calibration with Transformer Model Using Physical Constraints: A Scalable Method for Satellite Missions, Illustrated by Tianwen-1 [3.5] 本研究は、天wen-1火星ミッションの磁場データ補正と、マクスウェル方程式に制約されたニューラルネットワークアーキテクチャを統合する新しいアプローチを提案する。
トランスフォーマーモデルを用いることで、衛星力学、機器干渉、環境騒音による計測異常を補正する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:52:11 GMT)
Guidelines for Applying RL and MARL in Cybersecurity Applications [3.4] 自動サイバー防衛(ACD)における課題に対処するための有望な手法として、強化学習(RL)とマルチエージェント強化学習(MARL)が出現している。
本報告では、サイバーセキュリティの専門家や研究者に対して、特定のユースケースに対するRLとMARLの適合性を評価するための、構造化されたガイドラインを提供する。
また、重要なアルゴリズムアプローチ、実装上の課題、データ不足や敵対的干渉といった実世界の制約についても論じている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:46:16 GMT)
Deep Learning Aided Software Vulnerability Detection: A Survey [3.4] ソフトウェア脆弱性の広範囲性は、サイバー攻撃の急増の要因として浮上している。
ディープラーニング(DL)メソッドは,コードの複雑なパターンを自動的に学習し,識別する上で優れています。
この調査は、2017年から2024年の間に、ハイインパクトな雑誌やカンファレンスから34の関連研究を分析した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:35:16 GMT)
Multi-Agent Inverse Q-Learning from Demonstrations [3.4] Multi-Agent Marginal Q-Learning from Demonstrations (MAMQL)は、マルチエージェントIRLのための新しいサンプル効率フレームワークである。
MAMQLは,従来のマルチエージェント手法よりも平均報酬率,サンプル効率,報酬回復率を2~5倍に向上させることを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:22:29 GMT)
LLMs' Reshaping of People, Processes, Products, and Society in Software Development: A Comprehensive Exploration with Early Adopters [3.4] OpenAI ChatGPT、Google Gemini、GitHub Copilotといった大規模言語モデル(LLM)は、ソフトウェア業界で急速に注目を集めている。
私たちの研究は、LLMがソフトウェア開発のランドスケープをどう形作っているのか、微妙に理解しています。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:27:05 GMT)
Static Vs. Agentic Game Master AI for Facilitating Solo Role-Playing Experiences [3.4] 本稿では,シングルプレイヤーロールプレイングゲームのためのゲームマスターAIを提案する。
このAIは、Dungeons & Dragonsのようなマルチプレイヤーのテーブルトップゲームに関連する、インタラクティブなテキストベースの物語と体験を提供するように設計されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:21:14 GMT)
Large Language Model for Qualitative Research -- A Systematic Mapping Study [3.3] 先進的な生成AIを駆使した大規模言語モデル(LLM)がトランスフォーメーションツールとして登場した。
本研究は, LLMを用いた定性的研究に関する文献を体系的にマッピングする。
LLMは様々な分野にまたがって利用されており、プロセスの自動化の可能性を示している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:49:51 GMT)
Detecting Systematic Weaknesses in Vision Models along Predefined Human-Understandable Dimensions [3.3] スライス発見法(SDM)はDNNの系統的弱点を見つけるための顕著なアルゴリズムである。
ゼロショット画像分類のための基礎モデルを組み合わせてセマンティックメタデータを生成するアルゴリズムを提案する。
人工と実世界の両方のデータセットでアルゴリズムを検証し、人間の理解可能な体系的弱点を回復する能力を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:07:00 GMT)
Approaching the Limits to EFL Writing Enhancement with AI-generated Text and Diverse Learners [3.3] 生徒は、自分の言葉をAI生成テキストと統合することで、テキストを構成することができる。
本研究は,香港の59人の中学生がAI生成テキストと対話し,特集記事を構成する方法を検討した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:08:32 GMT)
DIMSUM: Discourse in Mathematical Reasoning as a Supervision Module [3.3] より少ないデータや劣るトレーニング理由を持つモデルを支援するための新しい情報ソース、談話構造を導入する。
Llama2 13bのようなモデルでは,談話構造が最大160%向上することを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:27:41 GMT)
Know Thy Judge: On the Robustness Meta-Evaluation of LLM Safety Judges [3.2] 我々は、一般的に見落とされがちな2つの重要な課題について強調する: (i) 迅速な感度や分布シフトなどの要因がパフォーマンスに影響を及ぼす野生における評価、(ii) 裁判官を標的とする敵攻撃。
モデル出力のスタイルなどの小さな変更は、同じデータセット上の偽陰性率で最大0.24のジャンプを引き起こす可能性がある一方で、モデル生成に対する敵対的な攻撃は、一部の裁判官を騙して、有害な世代を100%安全なものと誤分類する可能性があることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:24:12 GMT)
Learning to Chain Operations by Routing Information Through a Global Workspace [3.2] 本稿では,グローバルワークスペース理論(Global Workspace Theory)にインスパイアされたモデルを提案する。
モデルの性能を単純な追加タスクで評価し、そこでは2つの加算をまとめる必要がある。
本研究は,深層学習の推論能力を高めるため,グローバルワークスペース理論に触発されたアーキテクチャの可能性を強調した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:37:23 GMT)
Beyond Memorization: Evaluating the True Type Inference Capabilities of LLMs for Java Code Snippets [3.2] 最近の研究は、コードスニペットの型推論にLarge Language Modelsを活用し、有望な結果を示している。
しかし、ベンチマークスイート(StatType-SO)が2017年以来GitHubで公開されているため、これらの結果はデータ漏洩の影響を受けやすい。
Java コードスニペット上で LLM の型推論能力を総合的に評価するために,3段階評価を行った。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:13:40 GMT)
Biases in Large Language Model-Elicited Text: A Case Study in Natural Language Inference [3.1] 我々は,Large Language Models (LLM) で作成したNLPデータセットが,アノテーションや社会的バイアスを含むかどうかを検証した。
GPT-4, Llama-2 70b for Chat, Mistral 7b Instruct を用いて, スタンフォード大学の自然言語推論コーパスの一部を再現した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:49:30 GMT)
Revisiting Multi-Permutation Equivariance through the Lens of Irreducible Representations [3.0] 非シーム層は、グラフ異常検出、重み空間アライメント、ワッサーシュタイン距離の学習といったタスクのパフォーマンスを向上させることができることを示す。
また、これらの追加の非シーム層は、グラフ異常の検出、重み空間のアライメント、ワッサーシュタイン距離の学習といったタスクのパフォーマンスを向上させることを実証的に示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:41:25 GMT)
VQEL: Enabling Self-Developed Symbolic Language in Agents through Vector Quantization in Emergent Language Games [3.0] VQELは、ベクトル量子化をエージェントのアーキテクチャに組み込む新しい方法である。
これにより、セルフプレイの参照ゲームにおいて、個別のシンボル表現を自律的に発明し、開発することができる。
実験の結果, VQELは従来のREINFORCE法に勝るだけでなく, 制御性の向上や, 崩壊に対する感受性の低下による効果も示された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:15:51 GMT)
Robust Amortized Bayesian Inference with Self-Consistency Losses on Unlabeled Data [2.9] 本研究では,モデルから生成した(ラベル付き)シミュレーションデータだけでなく,実世界のデータを含む任意の情報源から生成したラベル付きデータ上でのトレーニングを可能にする半教師付きアプローチを提案する。
実験結果から, シミュレーション外データに対するABIのロバスト性は著しく向上した。
我々の研究結果が他のシナリオやモデルクラスにも一般化されれば、新しい手法は神経性ABIの大きなブレークスルーとなると信じています。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:51:49 GMT)
Advancing Depth Anything Model for Unsupervised Monocular Depth Estimation in Endoscopy [2.9] 本稿では,Depth Anything Modelのための新しい微調整戦略を提案する。
本手法は本態性に基づく教師なし単眼深度推定フレームワークと統合する。
提案手法は,トレーニング可能なパラメータ数を最小化しつつ,最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:40:10 GMT)
Guiding LLMs to Generate High-Fidelity and High-Quality Counterfactual Explanations for Text Classification [2.9] 大規模言語モデルによる対実生成を支援するための単純な分類器誘導方式を2つ導入する。
その単純さにもかかわらず、我々の手法は最先端の対物生成方法より優れている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:15:07 GMT)
Coarse graining and reduced order models for plume ejection dynamics [2.9] 大気汚染物質の大気分散のモニタリングは、環境影響評価にとってますます重要になっている。
高忠実度計算モデルは、しばしば配管力学をシミュレートし、意思決定を導き、資源配置を優先順位付けするために用いられる。
本稿では,ビデオデータから直接プラムダイナミクスの低次解析モデルを同定する,データ駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:32:35 GMT)
RAAD-LLM: Adaptive Anomaly Detection Using LLMs and RAG Integration [2.9] 本稿では,適応型異常検出のための新しいフレームワークであるRAAD-LLMを提案する。
ドメイン固有の知識を効果的に活用することにより、RAAD-LLMは時系列データにおける異常の検出を強化する。
その結果、実世界のデータセットでは精度が70.7%から89.1%に向上した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:30:45 GMT)
Succinct Perfect Zero-knowledge for MIP* [2.8] ポリログの問合せサイズとO(1)の解答サイズを持つREのための2つのプレイヤー1ラウンド完全ゼロ知識MIP*プロトコルが存在することを示す。
MIP*=RE証明に基づく4つの中央圧縮手法を解析する。
また,制約制約と制約可変バイナリ制約システムの非局所ゲーム間の変換についても検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:05:22 GMT)
One-Shot Clustering for Federated Learning [2.8] One-Shot Clustered Federated Learning (OCFL)は、クラスタリングに最も適した瞬間を自動的に検出するクラスタリングに依存しないアルゴリズムである。
本アルゴリズムは,クライアントの勾配のコサイン類似性の計算と,フェデレートモデルが収束し始める温度測定値に基づく。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:12:43 GMT)
A Comparative Study of Diabetes Prediction Based on Lifestyle Factors Using Machine Learning [2.8] 本研究では,BRFSS(Behavimental Risk Factor Surveillance System)の2015年調査から得られたデータを用いて,生活習慣要因に基づく糖尿病の予測に機械学習モデルを用いることを検討した。
決定木(Decision Tree)、K-Nearest Neighbors(KNN)、ロジスティック回帰(Logistic Regression)の3つの分類モデルを実装し,その予測性能を評価する。
その結果、決定木、KNN、ロジスティック回帰はそれぞれ0.74、0.72、0.75の精度を達成し、精度とリコールの強さは様々であった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:31:40 GMT)
DSV-LFS: Unifying LLM-Driven Semantic Cues with Visual Features for Robust Few-Shot Segmentation [2.8] Few-shot semantic segmentation (FSS) は、限定されたラベル付き例のみを使用して、モデルが新規/未使用のオブジェクトクラスをセグメンテーションできるようにすることを目的としている。
本稿では,大規模言語モデル(LLM)を用いて,汎用クラス意味情報をクエリ画像に適用する新しいフレームワークを提案する。
我々のフレームワークは、様々なシナリオにまたがって、新しいクラスへの高度な一般化と堅牢性を示す、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:42:28 GMT)
Exceptional Topology on Nonorientable Manifolds [2.7] 非エルミートバンド構造の2次元非オリエントパラメータ空間上でのギャップ付き位相とギャップレス位相を分類する。
位相ギャップの場合、非配向空間は、ブレイド群論の基本的な構造問題を探索するための自然な設定を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:00:00 GMT)
Entanglement Transitions in Noisy Quantum Circuits on Trees [2.7] デコヒーレンスはユビキタスであり、量子現象の観測に重大な障害をもたらす。
本研究では,木上の量子回路における絡み合い遷移について,ノイズと測定の両面から検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:51:14 GMT)
ObjMST: An Object-Focused Multimodal Style Transfer Framework [2.7] 本稿では,オブジェクトや周辺要素を個別に監視する,オブジェクト中心のマルチモーダル・スタイル・トランスファー・フレームワークを提案する。
既存の画像テキスト・マルチモーダル・スタイル・トランスファー手法では,(1)非整合かつ一貫性のないマルチモーダル・スタイル・表現の生成,(2)コンテンツ・ミスマッチ,(2)同一のスタイル・パターンが正常なオブジェクトとその周辺の両方に適用される,といった課題に直面している。
提案手法は,(1)正当性オブジェクトとその周辺の両方に対して整合性と整合性のあるスタイル表現を保証し,(2)正中性オブジェクトをスタイリングする正中性マッピング機構を導入し,次いで画像を生成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:55:44 GMT)
Fault-Tolerant Logical Clifford Gates from Code Automorphisms [2.7] 本稿では, 耐故障性論理クリフォードゲートの実装について, 対称性に基づく安定化器量子誤り訂正符号について検討する。
我々のアプローチは、安定化器コードを二進線型コードにマッピングし、自己同型群を計算し、クリフォード作用素が許す制約を課すことである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:57:57 GMT)
Assumed Identities: Quantifying Gender Bias in Machine Translation of Ambiguous Occupational Terms [2.6] 本稿では,集約されたモデル応答による性別バイアスを評価する手法を提案する。
具体的には、ソーステキストと翻訳の男女不均衡を検出する手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:16:14 GMT)
Towards Data-Efficient Language Models: A Child-Inspired Approach to Language Learning [2.6] 我々は,従来の大規模言語モデル (LLM) と比較して,データ量が大幅に少ない様々な言語モデル(LM)を訓練する手法を用いている。
そこで本研究では,主に児童向け文字起こしから得られた1000万語からなるキュレートデータセットに基づいて学習したモデルを構築した。
我々は語彙を32,000のトークンに減らし、言語習得の初期段階の子供たちの限られた語彙と整合させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:57:26 GMT)
Secure Federated Data Distillation [2.5] プライバシを保ちながら蒸留プロセスの分散化を図るためのセキュアフェデレートデータ蒸留(SFDD)フレームワークを提案する。
本研究では, クライアントが原データを共有することなく蒸留プロセスに寄与する分散環境に適応し, 勾配マッチングに基づく蒸留手法を活用する。
LDPO-RLDと呼ばれる最適化されたローカル微分プライバシーアプローチを作成し、推論攻撃に耐性を持たせる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:07:57 GMT)
Seismic inversion using hybrid quantum neural networks [2.4] 量子機械学習は様々な分野において大きな可能性を秘めているが、地球科学では探索されていない。
本研究では、地震インバージョンのためのハイブリッド量子物理学インフォームドニューラルネットワーク(HQ-PINN)の開発を通じて、QMLの地下イメージングへの最初の応用について述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:21:45 GMT)
InFL-UX: A Toolkit for Web-Based Interactive Federated Learning [2.2] InFL-UXはブラウザベースのフェデレートラーニング(FL)ツールキットで、機械学習(ML)ワークフローにユーザコントリビューションをシームレスに統合するように設計されている。
ユーザビリティと分散モデルトレーニングを優先することにより、InFL-UXは、FLとInteractive Machine Learning(IML)のギャップを埋め、非技術者ユーザがML分類タスクに積極的に参加できるようにする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:00:18 GMT)
Surgical Gaussian Surfels: Highly Accurate Real-time Surgical Scene Rendering [2.2] 異方性点プリミティブを表面整列楕円形スプラットに変換する手術用ガウスサーフェルス(SGS)を導入する。
本手法は, 表面形状, 正常な地図品質, レンダリング効率において, 現状の手法よりも優れる2つの外科的データセットを用いて評価した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:33:19 GMT)
MarsLGPR: Mars Rover Localization with Ground Penetrating Radar [2.2] 火星のローバーローバーローカライゼーションにおける地中レーダ(GPR)の利用を提案する。
我々は1次元相対的なポーズ翻訳を予測する新しいGPRベースのディープラーニングモデルを開発した。
我々は,火星のアナログ環境で実験を行い,GPRに基づく変位予測が両輪エンコーダより優れていることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:19:21 GMT)
Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection [2.1] 本稿では,産業用異常検出のための大規模実世界物理地上ビデオデータセットである物理異常検出データセットを紹介する。
このデータセットには、22の現実世界のオブジェクトカテゴリにわたる6400以上のビデオが含まれており、ロボットアームやモーターと相互作用し、47種類の異常を示す。
我々は,非教師付きAD,弱い教師付きAD,ビデオ理解ADの3つの条件下で,最先端の異常検出手法をベンチマークした。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:06:58 GMT)
Protecting spin squeezing from decoherence [2.1] スピンスクイーズを脱コヒーレンスから保護する機構を見つけ, 安定状態においてロバストなスピンスクイーズを実現することができることを示す。
我々の研究は、現実的な環境で高精度なセンシングを実現するためのガイドラインを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:35:41 GMT)
Learning-based GNSS Uncertainty Quantification using Continuous-Time Factor Graph Optimization [2.1] 本稿では,グローバルナビゲーション衛星システム(GNSS)における測定の不確かさを定量化する2つの学習に基づく手法に関する研究成果について述べる。
我々は,複数のセンサ入力から軌跡を正確に,頑健に推定する新しいマルチセンサ状態推定器を提案する。
本研究では,多様な都市環境下で収集された実世界のセンサデータを用いて,学習モデルの有効性を検証する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:04:36 GMT)
Federated Learning With Individualized Privacy Through Client Sampling [2.0] フェデレートラーニング(FL)における個別微分プライバシー(IDP)を実現するための適応的手法を提案する。
我々は、不均一なプライバシー予算に基づいてクライアント固有のサンプリングレートを計算し、修正IDP-FedAvgアルゴリズムに統合する。
実験の結果,DPベースラインの統一化により,プライバシとユーティリティのトレードオフを低減できることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:17:31 GMT)
Learning finitely correlated states: stability of the spectral reconstruction [2.0] 未知の状態のコピーから最小次元の実現を学習する作業を考える。
無限鎖上の有限相関変換不変状態に対して、最小次元の実現は再構成できる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:30:10 GMT)
Quantifying patterns of punctuation in modern Chinese prose [1.9] 西洋古典文学の分析によると、句読点間の空間の分布は、離散的なワイブル分布と一致している。
中国語文の句読点間の距離分布はWeibullモデルに従っているが、より大きな間隔は英訳より少ない。
この可変性は、複雑で多フラクタルな文構造の形成をサポートする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:04:30 GMT)
Observation of non-adiabatic Landau-Zener tunneling among Floquet states [1.9] Floquet Engineeringは、電子状態に時間周期のフィールドを配置するための強力なフレームワークを提供する。
服装状態の非摂動応答が出現するが、その非線形力学は解釈が難しいままである。
以上の結果から, 物質の光着色, 非摂動型超高速光波エレクトロニクス, 固体中の高光高調波発生の直接接続が確立された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:44:21 GMT)
A Permutation-equivariant Deep Learning Model for Quantum State Characterization [1.9] 量子状態のキャラクタリゼーションは、量子技術のあらゆる応用の基本的なステップである。
置換等価なディープラーニングモデルとtQSTプロトコルを組み合わせる方法について述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:23:57 GMT)
Semantic Alignment of Unimodal Medical Text and Vision Representations [1.9] 汎用AIモデルは、セマンティックな関連データを処理する際に、同様の潜在空間を示すことができる。
我々は、汎用AIを専門の医療知識で橋渡しできるセマンティックアライメントについて述べる。
モダリティ間のセマンティックアライメントを利用する一元視覚エンコーダの新しいゼロショット分類手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:28:17 GMT)
Implementation of a quantum addressable router using superconducting qubits [1.9] 2つのネイティブ制御iSWAPゲートに基づくルーティングプロトコルを実装するために、固定周波数トランスモンキュービットを使用するQ2ルータを実現する。
平均経路忠実度は94.8%と推定され、主にデコヒーレンスや状態準備、測定による誤差がある。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:28:44 GMT)
Privacy Preserving and Robust Aggregation for Cross-Silo Federated Learning in Non-IID Settings [1.8] フェデレーション平均化は、フェデレーション学習において最も広く使われているアグリゲーション戦略である。
私たちのメソッドは、追加のクライアントメタデータを不要にするため、グラデーション更新のみに依存しています。
本研究は, グラデーションマスキングの有効性を, フェデレート学習のための実用的でセキュアなソリューションとして確立した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:06:20 GMT)
PLMP -- Point-Line Minimal Problems for Projective SfM [1.8] 我々は、ピンホールカメラで点と線が完全に観測される構造移動(Structure-from-Motion, SfM)の最小限の問題を全て分類する。
我々は291の最小問題を見つけ、そのうち73はユニークな解を持ち、従って線形に解ける。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:49:43 GMT)
BPQA Dataset: Evaluating How Well Language Models Leverage Blood Pressures to Answer Biomedical Questions [1.8] トランスフォーマーベース言語モデル(LM)が臨床的測定を効果的に解釈し利用できるかどうかは不明である。
新たに開発したBPQA(Blood Pressure Question Answering)を用いて,BERT,BioBERT,MedAlpaca,GPT-3.5の4種類のLMの性能評価を行った。
GPT-3.5およびMedAlpaca(大型・中型LM)はBERTおよびBioBERTよりもBPsが有効であることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:06:46 GMT)
Talking Back -- human input and explanations to interactive AI systems [1.8] XAIは人間にAIの説明を提供することに重点を置いているが、逆に人間はAIに判断を説明し、より豊かでシナジスティックな人間-AIシステムを育むことができるだろうか?
本稿では,AIに対する人間の入力のさまざまな形態について検討し,人間の説明が,人間の概念とより密接に一致した自動判断や説明に向けて,機械学習モデルをどのように導くかを検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:39:46 GMT)
Comparative Study of Zero-Shot Cross-Lingual Transfer for Bodo POS and NER Tagging Using Gemini 2.0 Flash Thinking Experimental Model [1.7] 本稿では,Google の Gemini 2.0 Flash Thinking Experiment モデルによる POS および NER タグの Bodo へのゼロショット言語間転送の有効性について検討する。
本研究では,(1) 英文のボドへの直接翻訳,(2) 英文-ボド語文のパラレル化によるタグ転送,の2つの方法について検討する。
いずれの手法もボドNLPのブートストラップが期待できるが,プロンプトベース転送は特にNERにおいて優れた性能を示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:59:11 GMT)
AnyAnomaly: Zero-Shot Customizable Video Anomaly Detection with LVLM [1.7] ビデオ異常検出(VAD)は、コンピュータビジョンにおけるビデオ分析と監視に不可欠である。
既存のVADモデルは学習された通常のパターンに依存しており、多様な環境に適用することは困難である。
本研究では,C-VAD技術とAnyAnomalyモデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:52:34 GMT)
Exploiting Distribution Constraints for Scalable and Efficient Image Retrieval [1.7] 最先端の画像検索システムは、データセットごとに特定のニューラルネットワークをトレーニングする。
オフザシェルフのファンデーションモデルは、データセット固有のモデルに匹敵するパフォーマンスを達成するには不足している。
本稿では,基本モデルの性能を著しく向上するAE-SVC(Strong Variance Constraints)を用いたオートエンコーダを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:31:31 GMT)
Kernel-based estimators for functional causal effects [1.7] 実験的なFr'echet平均と演算子評価カーネルに基づく因果効果推定器を提案する。
これらの手法は、処理ミス特異性に対する堅牢性を維持しながら、高次元性、逐次順序付け、モデル複雑性の課題に対処する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:48:55 GMT)
SSL4EO-S12 v1.1: A Multimodal, Multiseasonal Dataset for Pretraining, Updated [1.6] SSL4EO-S12 v1.1は大規模な基盤モデルの事前トレーニング用に設計されたデータセットである。
このデータセットは、世界1万の大都市とその周辺を4つの季節にわたって半径50kmの範囲でカバーしている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:23:35 GMT)
LesionDiffusion: Towards Text-controlled General Lesion Synthesis [1.6] 3次元CT画像のためのテキスト制御可能な病変合成フレームワークLesionDiffusionを提案する。
本モデルでは, 病変の属性を制御し, より広範囲な病変タイプをサポートする。
今回,8臓器に14種類の病変を網羅した1,505個のCTスキャンと2対の病変マスクと構造報告のデータセットを紹介した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:44:10 GMT)
Decoupled Recommender Systems: Exploring Alternative Recommender Ecosystem Designs [1.5] 我々は、レコメンデーションアルゴリズムが提供されるプラットフォームから切り離されるような構成の結果について研究する。
これは"フレンドリーな近所のアルゴリズムストア"や"ミドルウェア"モデルと呼ばれることもある。
我々は、アルゴリズムの選択を取り入れたレコメンデーションエコシステムのモデルを作成し、そのような設計の結果を調べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:28:36 GMT)
Deep Reinforcement Learning for Infinite Horizon Mean Field Problems in Continuous Spaces [1.5] 本稿では,平均場ゲーム(MFG)と平均場制御(MFC)問題を統一的に解くために,強化学習(RL)アルゴリズムを提案する。
提案手法は,パラメータ化スコア関数による平均場分布の表現とアクタ・クリティカル(AC)パラダイムを組み合わせて提案する。
アルゴリズムの修正により、混合平均場制御ゲーム(MFCG)を解くことができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:34:00 GMT)
Quantum reinforcement learning in continuous action space [1.5] 本稿では,古典的および量子的順序決定問題の両方に効率よく対処する量子Deep Deterministic Policy Gradientアルゴリズムを提案する。
ワンタイム最適化は、任意の目標状態に固定初期状態を駆動するために必要な制御シーケンスを出力するモデルを生成する。
シミュレーションにより本手法の有効性を実証し,その量子制御への応用の可能性について論じる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:22:15 GMT)
Advancing Solutions for the Three-Body Problem Through Physics-Informed Neural Networks [1.5] 三体問題の概念は、地球-太陽-月系の3つの天体の運動の研究として提唱された。
現在の最先端ソリューションは数値的な高精度統合や機械学習に基づくものである。
物理インフォームドニューラルネットワーク(PINN)を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:22:19 GMT)
Floxels: Fast Unsupervised Voxel Based Scene Flow Estimation [1.4] 1) 最適化手法と2) 最適化手法の2つのアプローチが進化した。
Floxelsは、計算コストのごく一部で同等のパフォーマンスを達成しながら、教師なしの手法の中でEulerFlowにしか勝っていない。
FloxelsはEulerFlow上で60~140倍の大幅なスピードアップを実現し、1シーケンスあたりのランタイムを1日から10分に短縮する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:58:45 GMT)
Unified Mind Model: Reimagining Autonomous Agents in the LLM Era [1.4] 大規模言語モデル(LLM)は、最近、ドメイン、タスク、言語間で顕著な機能を示した。
我々は,自律エージェントの迅速な作成を促進するためのガイダンスを提供する,新しい理論認知アーキテクチャである統一マインドモデル(UMM)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:32:45 GMT)
Malware Detection at the Edge with Lightweight LLMs: A Performance Evaluation [1.4] 従来のマルウェア検出技術は、現代のマルウェアの高度化と適応性に追いつくのに苦労している。
マルウェア検出用の大規模言語モデルをエッジデバイスに直接デプロイすることは、いくつかの課題を提起する。
本稿では,軽量LLMの強みを生かしたアーキテクチャを提案し,精度の低下や計算能力の不足といった限界に対処する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:42:18 GMT)
Design Obligations for Software, with Examples from Data Abstraction and Adaptive Systems [1.3] セマンティックな期待は、コードレベルだけでなく、ソフトウェアアーキテクチャのようなより抽象的なシステム構造にも適用できます。
残念なことに、これらの期待は暗黙的あるいは非公式にのみ文書化されることが多い。
設計パラダイムにおける許容可能な設計に対する制約であり、パラダイムの適切な使用を保証するのに役立ちます。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:17:29 GMT)
Novel Pipeline for Diagnosing Acute Lymphoblastic Leukemia Sensitive to Related Biomarkers [1.3] 急性リンパ芽球性白血病(ALL)は小児の血液型で最も多い。
これらの患者の血液スミア画像を調べることは、専門医がこの病気を診断するために使う方法の1つである。
深層学習に基づく手法は医学分野に多くの応用がある。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:55:15 GMT)
LINGOLY-TOO: Disentangling Memorisation from Reasoning with Linguistic Templatisation and Orthographic Obfuscation [1.3] 本稿では,モデル性能推定における暗記の影響を低減する言語推論問題を生成するための枠組みを提案する。
このフレームワークを言語推論のための挑戦的なベンチマークであるlingOLY-TOOの開発に適用する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:16:07 GMT)
Calibrating Magnetic Flux Control in Superconducting Circuits by Compensating Distortions on Time Scales from Nanoseconds up to Tens of Microseconds [1.3] 磁束を用いた超伝導量子ビットの遷移周波数の高速チューニングが不可欠である。
ナノ秒から数十マイクロ秒までの時間スケールにおいて,サブペルミユ残周周波数誤差による正確なフラックス制御を示す。
我々は、24個のフラックス活性化2量子ビットゲートを校正する量子誤り補正実験に、この手法をうまく導入した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:56:58 GMT)
Comparing Deep Neural Network for Multi-Label ECG Diagnosis From Scanned ECG [1.2] 我々は、スキャンされたECGデータセット上で、AlexNet、VGG、ResNet、Vision Transformerを含む複数のディープニューラルネットワークアーキテクチャの性能を評価する。
比較分析では, モデル精度, 画像アーチファクトの堅牢性, 各種ECG条件における一般化可能性について検討した。
この結果は各アーキテクチャの長所と短所を強調し、画像ベースの心電図診断の実現可能性に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:18:12 GMT)
Examining the Representation of Youth in the US Policy Documents through the Lens of Research [1.2] この研究は、学術研究と政策定式化の関係を明らかにすることを目的としている。
本研究は、政策文書における引用を受ける若者研究における頻繁に議論されるトピックの特定、政策における引用率の向上に寄与する若者研究におけるパターンの識別、政策文書を引用する若者研究におけるトピックのアライメントの比較という3つの重要な課題に焦点をあてる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:15:12 GMT)
Systematic benchmarking of quantum computers: status and recommendations [1.2] ベンチマークは量子コンピュータの性能を評価するために重要である。
この文書はコンポーネントレベル、システムレベル、ソフトウェアレベル、HPCレベル、アプリケーションレベルベンチマークといった重要な側面を強調している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:05:13 GMT)
HieroLM: Egyptian Hieroglyph Recovery with Next Word Prediction Language Model [1.2] エジプトのヒエログリフは多くの古代エジプトの遺物から発見されているが、浸食によってぼやけたり、行方不明になったりすることが多い。
ぼやけたヒエログリフの復元には、CNNやモデルヒエログリフリカバリといったコンピュータビジョン技術が用いられている。
本稿では,次の単語予測タスクとしてヒエログリフ回復をモデル化し,それに対応する言語モデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:53:49 GMT)
Prompt-Matcher: Leveraging Large Models to Reduce Uncertainty in Schema Matching Results [1.1] 本稿では,大規模言語モデルの特定のプロンプトを用いた細粒度対応検証に基づく新しい手法を提案する。
本手法は,(1)対応選択アルゴリズム,(2)対応検証,(3)確率分布の更新の3つの主成分からなる反復ループである。
本稿では,計算効率においてブルートアルゴリズムを著しく上回る新しい$(1-1/e)$-approximationアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:26:32 GMT)
Interpretable Transformation and Analysis of Timelines through Learning via Surprisability [1.1] 本稿では,高次元の時系列データを変換するための新しい手法であるLearning via Surprisability (LvS)を提案する。
LvSは、期待される振る舞いから逸脱を形式化し、時系列データの異常を定量化し、優先順位付けする。
3つの高次元タイムラインにおけるLvSの有用性を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:50:29 GMT)
Frequency Hopping Synchronization by Reinforcement Learning for Satellite Communication System [1.1] 本稿では,連続探索と強化学習を組み合わせた戦術的SCSにおける周波数ホッピング信号の同期手法を提案する。
提案手法は、同期に必要なホップ平均数を58.17%削減し、アップリンクホップタイミング推定の平均2乗誤差(MSE)を76.95%削減する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:50:43 GMT)
Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search [1.1] 本稿では,多ターン探索と利用を原則とした繰り返しサンプリングを一般化する新しい推論時フレームワークを提案する。
探索ツリーの各ノードにおいて、AB-MCTSは、新しい候補の応答を拡大することで「より広く」行くか、既存の応答を再考して「より深く進む」かを動的に決定する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:10:40 GMT)
Compositional World Knowledge leads to High Utility Synthetic data [1.1] 限られたデータに対する条件付き拡散モデルのトレーニングが,不正確な基礎分布をもたらすことを示す。
我々は、条件付き独立を強制することによって世界の構成的性質を反映するCoInDを提案する。
我々は、CoInDが生成した合成データが忠実であることを示し、これはCelebAにおける合成シフトタスクにおける最先端の最悪のグループ精度に変換する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:29:45 GMT)
TRANSIT your events into a new mass: Fast background interpolation for weakly-supervised anomaly searches [1.0] TRansport Adversarial Network for Smooth InTerpolation (TRANSIT) と呼ばれる条件付き連続データモーフィングの新しいモデルを提案する。
我々はLHCの弱い教師付き検索のための背景データテンプレートを作成するためにこれを適用した。
このモデルは特徴の非線形質量相関を捉え、最先端のトランスポートベースのテンプレートジェネレータと比較して、競合する異常感度を提供するテンプレートを生成する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:39:07 GMT)
BicliqueEncoder: An Efficient Method for Link Prediction in Bipartite Networks using Formal Concept Analysis and Transformer Encoder [1.0] 本稿では,テキスト形式概念解析(FCA)とトランスフォーマーエンコーダを用いたバイパートイトネットワークにおけるリンク予測手法を提案する。
バイパーティイトネットワークにおけるリンク予測は、オンライン販売における製品推奨や、医学における化学物質と化学物質の相互作用の予測など、様々な分野における実践的な応用を見出す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:47:37 GMT)
ControlFill: Spatially Adjustable Image Inpainting from Prompt Learning [1.0] textitControlFillという,2つの異なるプロンプトをトレーニングするインペイントフレームワークを紹介します。
推論段階において、これらの学習された埋め込みは、重いテキストエンコーダを必要とせずに動作する拡散ネットワークを誘導する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:57:26 GMT)
Filtered Markovian Projection: Dimensionality Reduction in Filtering for Stochastic Reaction Networks [1.0] 反応ネットワーク(SRN)によってモデル化された実用的な問題における典型的な課題は、少数の状態変数しか動的に観察できないことである。
本稿では,前向き問題に対して最初に導入されたマルコフ射影(MP)に基づく次元削減手法を提案する。
提案手法では, 投射モデルの跳躍強度を推定し, 低次元空間におけるフィルタリング方程式を解くために, 分散分散粒子フィルタを用いる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:07:14 GMT)
Revisiting Abstractions for Software Architecture and Tools to Support Them [1.0] 本稿では,ソフトウェアシステムの組織化に使用される抽象概念に基づくソフトウェアアーキテクチャの概念的視点について述べる。
システムレベルの抽象化に関する論文の主な考え方を考察する。
建築観念の現況と現状の課題について述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:48:25 GMT)
Machine learning driven search of hydrogen storage materials [0.9] 機械学習(ML)を利用して水素と金属の比と溶液エネルギーを予測する。
3元系合金よりH/M比と解エネルギーが向上する。
純TiおよびTi5Mo95合金の圧力-組成等温実験により, モリブデンリッチ合金中の水素の速度速度が遅いことが確認された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:24:40 GMT)
Optimizing Spot Instance Reliability and Security Using Cloud-Native Data and Tools [0.9] Cloudlabは、ネットワークセキュリティの研究とトレーニングをサポートするために設計された、包括的なクラウドネイティブな実験室である。
適応的でスケーラブルな環境を提供することで、Cloudlabはロールベースのアクセス制御、ポリシ・アズ・コード、コンテナセキュリティといった高度なセキュリティ概念をサポートする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:26:41 GMT)
Eventprop training for efficient neuromorphic applications [0.9] 我々は,mlGeNNで実装されたイベント駆動イベントプロップアルゴリズムを用いて,GPU上でのスパイクニューラルネットワークのトレーニングパイプラインを提案する。
キーワードスポッティングタスクのベンチマークでは、GPUとLoihi 2の実装の間には精度がほとんど失われていないことが示されている。
Loihi 2でサンプルを分類するのは最大10倍速く、NVIDIA Jetson Orin Nanoより200倍少ないエネルギーを使用する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:38:46 GMT)
Beyond Disorder: Unveiling Cooperativeness in Multidirectional Associative Memories [0.9] 我々は、ヘテロ連想メモリのためのニューラルネットワークのアーキテクチャを拡張し、教師付き学習プロトコルと教師なし学習プロトコルを探索する。
エントロピック・ヘテロジニアスデータセットを様々な層に提供することにより、新しい創発現象を予測し、定量化する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:09:30 GMT)
Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images [0.9] 本研究では,拡散確率モデル(DDPM)をランドマーク検出タスクに適用する新しい手法を提案する。
私たちの重要なイノベーションは、ランドマーク検出における自己教師付き事前トレーニングにDDPMを活用することです。
この方法は、最小限の注釈付きトレーニングデータで正確なランドマーク検出を可能にする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:03:35 GMT)
MTS: A Deep Reinforcement Learning Portfolio Management Framework with Time-Awareness and Short-Selling [0.9] 本稿では,時間認識と短時間販売を伴うDeep Reinforcement Learning Portfolio Management Frameworkを紹介する。
動的リスク管理の限界、時間的市場の利用、短期販売のような複雑な取引戦略の導入に対処する。
シャープ、オメガ、ソルティーノ比の累積リターンを継続的に達成し、リスクとリターンのバランスをとる効果を裏付ける。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:41:17 GMT)
Federated Dynamic Modeling and Learning for Spatiotemporal Data Forecasting [0.9] 本稿では、複雑な時間的データを予測するための高度なフェデレートラーニング(FL)フレームワークを提案し、最近の最先端モデルを改善した。
結果として生じるアーキテクチャは、様々な予測アプリケーションで複雑な時間パターンを扱う能力を大幅に改善します。
提案手法の有効性は,都市部におけるマルチモーダル交通需要予測のためのパブリックデータセットや,Origin-Destination (OD) 行列予測のためのプライベートデータセットなど,実世界の応用に関する広範な実験を通じて実証される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:16:57 GMT)
A Dataset for Analysing News Framing in Chinese Media [0.8] 本研究では、SemEval-2023タスク3データセットにスタンドアロンデータセットまたは補助リソースとして使用される最初の中国語ニュースフレイミングデータセットを紹介する。
このようなデータセットの必要性を強調し、将来の研究のためのベンチマークを作成するために、ベースライン実験を実施しています。
中国語では,F1-micro(SemEval Task 3, subtask 2)スコアが0.719であり,SemEvalデータセットを中国語ニュースフレーミングサンプルで拡張した場合のスコアが0.753である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:55:33 GMT)
Self-Supervised Large Scale Point Cloud Completion for Archaeological Site Restoration [0.8] 本研究では,大規模点群を限定的かつ不均衡な地上構造で復元する新しい手法を提案する。
完全構造の欠如と既存部品の不均衡分布のため,既存の「完全」パッチに類似した点でMCOP像を埋め込む自己教師型スキームを開発した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:29:12 GMT)
Mapping AI Benchmark Data to Quantitative Risk Estimates Through Expert Elicitation [0.8] 我々は、リスク見積の作成を容易にするために、既存のAIベンチマークをどのように利用できるかを示す。
本稿では、AIベンチマークであるCybenchからの情報を用いて確率推定を生成するパイロット研究の結果について述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:39:47 GMT)
A mirrored pair of optimal non-decomposable entanglement witnesses for two qudits does exist [0.8] 我々は絡み合い証人(EW)の構造を研究する。
ミラー化されたEWの概念をエクスプロイトすると、予想とは対照的に、最適なEWの対が存在することが示される。
構造がより高次元にまで拡張されることが示されるので、我々の結果はさらに絡み合いの目撃者の構造を明らかにする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:22:12 GMT)
Characterization and Mitigation of Crosstalk in Quantum Error Correction [0.7] 本稿では,多種多様なクロストークノイズについて検討し,その効果を表面符号で定量化する。
本稿では、冗長な安定化器チェックとフラグキュービット設計によるQECのクロストークロバスト実装について紹介する。
解析的および数値的な結果は、ハードウェア現実的なノイズに対して堅牢なQEC符号の設計に光を当てた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:32:01 GMT)
Quantifying the Relevance of Youth Research Cited in the US Policy Documents [0.7] 引用された政策文書に研究の関連性を示す具体的な証拠はない。
研究論文の関連度と政策文書の引用の程度を特定することは重要である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:14:04 GMT)
Are Large Language Models Good In-context Learners for Financial Sentiment Analysis? [0.7] 近年、数十億のパラメータを持つ大規模言語モデル (FSAM) が、ドメイン固有のデータ手法を探索する創発的な能力を示している。
本稿では,新たな文書の感情分析に対して,文書-知覚対の一般的な文脈内デモによって,LLMの学習が課題に対処できるかどうかについて,情報的な洞察を与えることができるかどうか,という根本的な疑問に答えることを目的とする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:38:12 GMT)
No Silver Bullet: Towards Demonstrating Secure Software Development for Danish Small and Medium Enterprises in a Business-to-Business Model [0.6] 本研究では中小企業がビジネス・ツー・ビジネス・モデルで運用する際のセキュリティを実証する方法を検討する。
以上の結果から, 認証, 報告, アンケート, 対話セッション, 社会的証明の5つの特異なセキュリティ実証アプローチが示唆された。
これらのアプローチに関連する課題、メリット、レコメンデーションについて論じる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:25:15 GMT)
A Survey on LLM Test-Time Compute via Search: Tasks, LLM Profiling, Search Algorithms, and Relevant Frameworks [0.6] この調査は、タスク定義を統一し、LLMプロファイリングとサーチ手順のモジュラー定義を提供する包括的な技術的レビューを提供する。
これらの定義は、従来の検索アルゴリズムから逸脱した点を強調しながら、様々なLLM推論フレームワークの正確な比較を可能にする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:22:28 GMT)
Exit the Code: A Model for Understanding Career Abandonment Intention Among Software Developers [0.6] キャリア放棄は、失われた投資と感情的、財政的なコストに対するフラストレーションを伴う。
これまでの研究では、失明の脅威など、仕事に関連したモチベーションがキャリア放棄の動機として特定されていた。
この記事では、これらのモチベータと、現在アクティブな開発者の間で放棄する意図との関係について調査する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:13:10 GMT)
Understanding and Detecting Compatibility Issues in Android Auto Apps [0.6] 我々は、Android Autoに関する147の報告を行い、その根本原因を特定した。
UIの不互換性,メディア再生エラーの24%,音声コマンド処理の失敗による約5%,などによって70%以上の問題が発生した。
Android Autoアプリの互換性問題を検出する静的解析フレームワークであるCarCompatを紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:37:02 GMT)
An Efficient Sparse Kernel Generator for O(3)-Equivariant Deep Networks [0.6] 回転同変グラフニューラルネットワークは、空間深層学習タスクにおける最先端の性能を得る。
クレーブシュ=ゴルドンテンソル積(Clebsch-Gordon tensor product, CG)は、2つの高次特徴ベクトルと高度に構造化されたスパーステンソルを交換して高密度出力ベクトルを生成するカーネルである。
我々は,CGテンソル製品用のGPUスパースカーネルジェネレータを導入し,既存のオープンソース実装とクローズドソース実装の大幅な高速化を実現した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:16:29 GMT)
Long-range nonstabilizerness from topology and correlation [0.6] ロングレンジマジック(Long-range Magic, LRM)は、一定深さの局所回路では消去できない不安定性である。
LRMは、低エネルギーの自明なマジック'の結果ではないと見なすことができる。
我々の研究は、量子資源、コーディングとフォールトトレランス理論、複雑性理論、多体物理学の相互作用に新たな光を当てている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:53:59 GMT)
Retrieving information in sloppy quantum phase estimation [0.6] 本研究では、2つの逐次位相の推定において、量子弱測定によってスロッピーの挙動を制御し、反作用させる方法を示す。
我々の研究は、量子力学やイメージング、量子セキュリティや量子モニタリングなど、量子システムのスロピネス検出に関する重要な洞察を提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:12:31 GMT)
Quantitative Flow Approximation Properties of Narrow Neural ODEs [0.5] ニューラル常微分方程式(NODE)のフロー近似問題を再考する。
浅いが広いNODEの近似流における狭いNODEの関係を導出する。
本研究では,狭いNODEの時間依存重み付けに必要なスイッチ数を推定し,単一層ニューラルネットワークを速度場とするNODEの挙動を模倣する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:54:42 GMT)
Quantum Down Sampling Filter for Variational Auto-encoder [0.5] 変分オートエンコーダ(VAE)は、生成モデリングと画像再構成の基礎となる。
本研究では,量子変分オートエンコーダ(Q-VAE)のハイブリッドモデルを提案する。
Q-VAEはエンコーダに量子符号化を統合し、完全に接続された層を利用して意味のある表現を抽出する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:10:14 GMT)
Poisoning Bayesian Inference via Data Deletion and Replication [0.5] 我々は、一般的なベイズ推論を攻撃するために、ホワイトボックスモデル中毒パラダイムの拡張に注力する。
攻撃者がベイズの後部を目標分布に向けて操ることのできる一連の攻撃が開発されている。
比較的わずかな努力で、攻撃者はベイジアンの信念を瞬時に変えることができ、より多くのリスクを受け入れることで、彼らはこれらの信念を彼らの意志に形作ることができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:30:15 GMT)
Evaluation of Privacy-aware Support Vector Machine (SVM) Learning using Homomorphic Encryption [0.5] 機械学習モデルに入力される前にデータを暗号化するためのホモモルフィック暗号化(FHE)。
これには、同型暗号化キーペアを作成し、関連する公開キーを使用して入力データを暗号化し、プライベートキーは出力を復号する。
本稿では,OpenFHE同型暗号化ライブラリを用いたSVM機械学習技術の性能上のオーバーヘッドを評価する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:42:23 GMT)
Ecomap: Sustainability-Driven Optimization of Multi-Tenant DNN Execution on Edge Servers [0.4] 本稿では,実時間炭素強度に基づいてエッジデバイスの最大出力閾値を調整するフレームワークであるEcomapを紹介する。
NVIDIA Jetson AGX Xavierを用いた実験の結果、Ecomapは二酸化炭素排出量を平均30%削減することが示された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:56:51 GMT)
Approaches to Quantum Remote Memory Attestation [0.4] インターネット・オブ・シングス・デバイスにおける量子ベースのリモートメモリ検証手順の欠陥と落とし穴を示す。
我々は、通信効率とセキュリティを改善した古典記憶のための量子ベースのシステムを設計するために学んだ教訓を活用している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:54:05 GMT)
Federated Multi-Agent Mapping for Planetary Exploration [0.4] 本稿では,エージェント間のグローバルマップモデルを生データを送信することなく,協調的にトレーニングするフェデレーション型マルチエージェントマッピング手法を提案する。
提案手法は暗黙的ニューラルマッピングを利用してパシモニアスで適応可能な表現を生成し,生のマップと比較して最大93.8%のデータを伝送する。
我々は,火星の地形や氷河のデータセットに対するアプローチの有効性を実証し,F1スコアを0.95ポイントまで下方経路計画を達成するとともに,地図の復元損失に勝る結果を得た。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:11:55 GMT)
Real-Time Motion Detection Using Dynamic Mode Decomposition [0.4] 動的モード分解(DMD)に根ざしたストリーミングビデオデータに対する簡易かつ解釈可能なモーション検出アルゴリズムを提案する。
提案手法は,前景運動などの重要な映像特徴の進化と,DMDを映像セグメントに適用した結果となる行列の固有値との間には対応関係があることを生かしている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:26:42 GMT)
Continual Learning in 3D Point Clouds: Employing Spectral Techniques for Exemplar Selection [0.4] 本稿では,3次元オブジェクト分類における連続学習のための新しいフレームワークを提案する。
CL3Dは,スペクトルクラスタリングを用いて各クラスからプロトタイプを選択する手法である。
我々は,ModelNet40,ShapeNet,ScanNetのデータセット上で実験を行い,入力空間の特徴を用いることで,最先端の精度を実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:19:58 GMT)
Deep unrolling for learning optimal spatially varying regularisation parameters for Total Generalised Variation [0.4] このフレームワークは、空間的に変化する2つのTGVパラメータを推論するディープ畳み込みニューラルネットワーク(CNN)と、対応する変動問題を解決するアンロールスキームを組み合わせる。
画像復調とMRI再建の数値的結果は, 最高のTGVスカラーパラメータの場合と比較して, 有意な質的, 定量的改善を示した。
特に、第1次TGV項を重み付けするパラメータは、高次の値が交互に変化する三辺構造を持ち、第2次項を重み付けするパラメータは、エッジ周辺の大きな近傍で小さな値を得る。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:19:59 GMT)
A Study on Malicious Browser Extensions in 2025 [0.4] 本稿は,Mozilla Firefox と Chrome を中心に,悪意あるブラウザエクステンションの2025 年の進化する脅威状況について考察する。
私たちの研究はFirefoxとChromeのセキュリティメカニズムを回避し、悪意のあるエクステンションをMozilla Add-ons StoreとChrome Web Store内で開発、公開、実行することが可能であることを実証しました。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:24:27 GMT)
Efficient detection of entanglement by stimulated disentanglement [0.4] 極端に時間エネルギーの絡み合った双光子(オクターブ散乱スペクトル 113THz)を作る
我々は、Delta(t_2)Delta(E_1+E_2)approx!2!cdot!10-13h$の時間差とエネルギーの相対的な不確実性を測定し、古典的境界を12桁以上違反する。
提案したコヒーレントSFGは, 標準法に比べて検出SNRを劇的に向上させる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:06:54 GMT)
HEISIR: Hierarchical Expansion of Inverted Semantic Indexing for Training-free Retrieval of Conversational Data using LLMs [0.3] 本稿では,会話データ検索における意味理解を強化する新しいフレームワークであるHEISIRを紹介する。
Heisir は,(1)階層型トリプレットの定式化と(2)アジュネート・アジュメンテーション(Adjunct Augmentation)という2段階のプロセスを実装し,SVOA(Subject-Verb-Object-Adjunct)四重項からなるセマンティック指標を生成する。
実験の結果,HEISIRは様々な埋め込み型や言語モデルにまたがる微調整モデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:39:25 GMT)
Manboformer: Learning Gaussian Representations via Spatial-temporal Attention Mechanism [0.3] ボクセルベースのグリッド予測と比較して、自律運転のための3Dセマンティック占有予測の分野において、ガウシアンフォーマーは3Dガウシアンを用いてオブジェクトに基づくスパースな3Dセマンティックガウシアンシーンを記述することを提案した。
実験の結果,本手法で要求されるガウス関数は,元の高密度グリッドネットワークのクエリ分解能よりも大きく,性能が損なわれていることがわかった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:40:46 GMT)
EDCA -- An Evolutionary Data-Centric AutoML Framework for Efficient Pipelines [0.3] この作業では、Evolutionary Data Centric AutoMLフレームワークであるEDCAを紹介します。
データ品質は通常、AutoMLの見過ごされている部分であり、手作業と時間を要するタスクであり続けています。
EDCAは、AutoMLベンチマークのトップの2つのフレームワークであるFLAMLとTPOTと比較された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:46:07 GMT)
Gradient-descent methods for fast quantum state tomography [0.2] 量子状態トモグラフィー(QST)の処理後ステップのためのグラデーション・ディフレクション(GD)アルゴリズムを導入する。
我々は、コレスキー分解、スティーフェル多様体、射影正規化など、様々な密度行列パラメタライゼーションを使用する。
我々のミニバッチGD-QSTアルゴリズムのランク制御されたアンサーゼは、ノイズやデータセットを効果的に処理する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:13:45 GMT)
Mitigation of birefringence in cavity-based quantum networks using frequency-encoded photons [0.2] Atomキャビティシステムは、大規模分散量子コンピュータを構築する上で、ユニークなアドバンテージを提供する。
偏光で光状態が符号化される一般的なスキームでは、共振器複屈折は共振器固有モードのエネルギー分割をもたらす。
周波数自由度で光量子ビットを符号化する方式を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:30:51 GMT)
The Structural Complexity of Matrix-Vector Multiplication [0.1] 行列ベクトル乗算問題は$tildeO(n2)$プレプロセッシングと$tildeO(n2-1/d)$クエリ時間で解けることを示す。
我々の結果は、多くの応用において最初の非自明な上界が得られる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:17:52 GMT)
Shaping Shared Languages: Human and Large Language Models' Inductive Biases in Emergent Communication [0.1] ヒトと大言語モデル(LLM)の帰納バイアスに最適化された人工言語がどのように進化するかを検討する。
我々は,人間とLLMが協力しながらも,すべての状況において信頼性の高いコミュニケーションを可能にする語彙が出現することを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:47:54 GMT)
VirtualXAI: A User-Centric Framework for Explainability Assessment Leveraging GPT-Generated Personas [0.1] eXplainable AI(XAI)の需要が増加し、AIモデルの解釈可能性、透明性、信頼性が向上した。
仮想ペルソナによる定量的ベンチマークと質的ユーザアセスメントを統合したフレームワークを提案する。
これにより、推定されたXAIスコアが得られ、与えられたシナリオに対して最適なAIモデルとXAIメソッドの両方にカスタマイズされたレコメンデーションが提供される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:44:18 GMT)
From Idea to CAD: A Language Model-Driven Multi-Agent System for Collaborative Design [0.1] 本稿では,このチーム構造を視覚言語モデル(VLM)に基づくマルチエージェントシステムで再現する手法を提案する。
モデルはスケッチやテキスト記述から自動的に生成される。
得られたモデルは、ユーザとの反復的検証ループで協調的に洗練することができる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:21:27 GMT)
ReynoldsFlow: Exquisite Flow Estimation via Reynolds Transport Theorem [0.0] 近年のAIの進歩により、深層学習モデルでは、光学フローをモーション分析の重要な特徴として活用できるようになった。
従来の光学フロー法は、明るさやスローモーションの制約のような制限的な仮定に依存している。
フロービジュアライゼーションを改善するために,ReynoldsFlow+という別の表現を導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:49:28 GMT)
What is so special about analogue simulations? [0.0] 本稿では, ブラックホール物理における地球上のアナログシミュレーションを, 科学における物質的アナロジーからの推論の例として論じる。
主な評決と勧告を概説し、既存の慣行に適合するだけでなく、著名な代替案が支持するものよりも信頼性が高いと主張した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:38:23 GMT)
Variational method for learning Quantum Channels via Stinespring Dilation on neutral atom systems [0.0] 拡張システム上で等価なユニタリ演算を変動的に構成することにより、任意のターゲット量子チャネルを近似する手法を提案する。
また、トレーニングデータによってカバーされた期間を超えて、離散的な時間ステップで量子チャネルを外挿するための実験的に実現可能なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:47:34 GMT)
Urban highways are barriers to social ties [0.0] 都市ハイウェイは社会的つながりの低下と関連していることを示す。
この障壁効果は特に短い距離で強く、ブラック地区を意図的に破壊したり孤立させたりするために建設された道路の歴史的事例と一致している。
本研究では,エビデンスに基づく空間的不等式低減のための再検討計画について報告する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:03:47 GMT)
Unsupervised anomaly detection on cybersecurity data streams: a case with BETH dataset [0.0] ストリーム学習アルゴリズムは、ほぼリアルタイムのデータ処理を提供することができる。
本稿では,サイバーセキュリティイベントを伴うBETHデータセット上の3つのPythonストリーム機械学習ライブラリの10のアルゴリズムの結果について検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:45:48 GMT)
Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size [0.0] エントロピー重み量子化(EWQ)を用いた選択モデル量子化の新しい手法を提案する。
EWQは、モデルアーキテクチャやサイズに依存しないパフォーマンス劣化を引き起こすことなく、どのブロックを安全に定量化できるかを決定する。
提案手法は一様量子化手法より優れており,MMLU(Massive Multitask Language Understanding)の精度は0.5%の範囲で維持されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:54:32 GMT)
Ultrahigh free-electron Kerr nonlinearity in all-semiconductor waveguides for all-optical nonlinear modulation of mid-infrared light [0.0] 長手バルクプラズモンは導波路において非常に強いKerr非線形性を生成することができることを示す。
これらの導波路は10$7$W$-1$km$-1$を超える超高非線形係数を達成し、100$mu$m以上の伝搬を持つ長伝搬モードをサポートする。
この研究は、フォトニック集積回路のための重ドープ半導体における自由電子非線形性の変換ポテンシャルを証明している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:57:25 GMT)
Transferable Foundation Models for Geometric Tasks on Point Cloud Representations: Geometric Neural Operators [0.0] 我々は、事前訓練された幾何学的ニューラル演算子(GNP)を得る方法を提案する。
GNPは幾何学的特徴を得るための基礎モデルとして機能する。
我々のGNPは、点-雲の微分幾何学の頑健な潜在表現を学習するためにどのように訓練されるかを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:35:37 GMT)
Toward Lightweight and Fast Decoders for Diffusion Models in Image and Video Generation [0.0] 大きな変分オートエンコーダデコーダは、生成を遅くし、かなりのGPUメモリを消費することができる。
軽量なVision Transformer と Taming Transformer アーキテクチャを用いたカスタムトレーニングデコーダを提案する。
COCO 2017では、画像生成の全体的なスピードアップが最大15%、サブモジュールでのデコーディングが最大20倍、ビデオタスクのUCF-101がさらに向上している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:21:49 GMT)
Topology-enhanced machine learning model (Top-ML) for anticancer peptide prediction [0.0] 抗がんペプチド予測のためのトポロジー強化機械学習モデル(Top-ML)を提案する。
本研究は,抗がんペプチドの同定を促進するために,新規なトポロジを基盤とした創製の可能性を強調した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:33:25 GMT)
Thermodynamic approach to quantum cooling limit of continuous Gaussian feedback [0.0] ガウス系における量子フィードバック冷却の基本的な境界を確立する。
既知境界とは対照的に、得られた境界は実験的に実現可能な状況によって飽和することができる。
我々の理論は、量子フィードバック冷却における熱力学的制約を理解するための一般的な枠組みを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:02:10 GMT)
Thermalization and irreversibility of an isolated quantum system [0.0] 局所演算による拡散非平衡状態情報の消去は多体系の不可逆性と熱化を説明するのに有効であることを示す。
この情報消去機構を1次元ハバードモデルに組み込むことで, 完全に分離されたシステムにおいて, 熱化過程が現れることを示す数値シミュレーションを行った。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:01:29 GMT)
There must be encapsulated nonconceptual content in vision [0.0] 本稿では,Jerry Fodor氏の主張を支持するために,入力システムはモジュールであり,情報的にカプセル化されているという主張を提案する。
視覚知覚における非概念的内容は情報的にカプセル化されていると考えられる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:44:55 GMT)
Theoretical and Empirical Advances in Forest Pruning [0.0] 回帰林の精度と回帰樹の解釈可能性という両世界の最善を尽くすアプローチである森林伐採を再考する。
我々は、弱い仮定の下で、未伐採林に対するラッソ伐採林の利点を証明した。
我々は19の異なるデータセット上の未伐採林に対する伐採林の精度を検証した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:11:43 GMT)
The singlet-triplet and exchange-only flopping-mode spin qubits [0.0] 超伝導マイクロ波空洞に埋め込まれた半導体ベースのスピン量子ビットは、量子ビット制御のための高速で有望なプラットフォームを構成する。
我々は、(1,0,1) - (0,1,1) [ (1,0,1,1) -- (0,1,1)] 電荷転移の近くの2つの電子が占有する3つの(4)量子ドットからなる2つの新しい浮動小数点量子ビットを提案する。
縦結合は、フラッピングモードST量子ビットと通常のフラッピングモードST量子ビットとを区別する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:12:12 GMT)
The Ising model as a window on quantum gravity with matter [0.0] 我々は、Isingモデル CFT が物質による3次元(量子)重力の明確な洞察を得るのに利用できると論じる。
BTZブラックホールと相互作用するバルク物質場の性質について説明する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:50:34 GMT)
The FFT Strikes Back: An Efficient Alternative to Self-Attention [0.0] 本稿では,長周期の適応スペクトルフィルタリングフレームワークbfFFTNetを紹介する。
入力を周波数領域に変換することで、FFTNetはParsevalの定理を利用して、長距離依存関係を効率的にキャプチャする。
主な理論的貢献は,1)適応スペクトルフィルタ,2)局所ウィンドウとグローバルFFT分岐を組み合わせること,および3)周波数領域とトークン領域の両方におけるリッチ非線形性の導入である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:39:55 GMT)
Tensor PCA for Factor Models [0.0] テンソル因子モデルでは、$d$次元パネルを、階数成分の減少と慣用音の和として記述する。
強因子モデルでは、単純なテンソル主成分分析アルゴリズムが因子や負荷を推定するのに最適であることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:58:34 GMT)
Ten simple rules for training scientists to make better software [0.0] 高品質な研究ソフトウェアを開発するには、多くのソフトウェア開発スキルを開発する必要がある。
計算研究における基礎的・優れた開発プラクティスの確保に重点が置かれている。
10 Simple Rulesコレクションの最近の記事は、生物学の学生にコンピュータサイエンスとコーディング技術の教育について論じている。
我々は、科学者が持続可能なソフトウェアパッケージを開発するために必要なスキルを効果的に教えるための具体的な手順を説明することによって、この議論を進める。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:54:09 GMT)
Synthetic and cosmological axion hybridization: entangled photons, (HBT) and quantum beats [0.0] トポロジカル絶縁体やワイル半金属の合成軸、創発的集合励起が宇宙軸と混和していることが示される。
両軸索の最初の個体群は、ハイブリッド化によって他方の個体群を誘導する。
ダークマター・アクシオン凝縮物は、小さな振幅で合成・アクシオンの凝縮を誘導する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:20:39 GMT)
Speeding up Local Search for the Indicator-based Subset Selection Problem by a Candidate List Strategy [0.0] 進化的多目的最適化において、指標に基づく部分集合選択問題は、与えられた品質指標を最大化する点の部分集合を見つけることである。
局所探索は、この問題における高品質な部分集合を得るための効果的なアプローチである。
本稿では,指標に基づくサブセット選択問題における局所探索のための候補リスト戦略を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:06:49 GMT)
Solving Word-Sense Disambiguation and Word-Sense Induction with Dictionary Examples [0.0] 多くの低リソース言語は、大きなタスク固有のデータセットの欠如に苦慮している。
辞書は、大きな情報内容にもかかわらず、リソースの少ない言語で滅多に使われない。
我々は、LLMが、リソースの少ない言語で既存の言語リソースを拡張するのにどのように使えるかを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:27:55 GMT)
Self-consistent tensor network method for correlated super-moiré matter beyond one billion sites [0.0] モイアと超モイアの材料は、エキゾチックな相関量子物質を設計するための例外的なプラットフォームを提供する。
スーパーモアの資料はこの要件を、数百万から数十億のサイトを考慮すべき限界まで押し上げています。
我々は,10億のサイトに到達するシステムにおいて,相関状態の解決を可能にする方法論を確立する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:17:11 GMT)
Secure Quantum Token Processing with Color Centers in Diamond [0.0] 本稿では、トークンがセキュアな認証や支払いを保証する量子状態である量子トークンスキームを提案する。
トークンは、単一光子源によって生成されたマルチキュービット状態に符号化され、量子メモリレジスタを持つユーザへ送信される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:31:31 GMT)
Scalable quantum simulator with an extended gate set in giant atoms [0.0] 本稿では,巨大原子3レベルシステムに基づく拡張ゲートセットを用いたスケーラブルな量子シミュレータを提案する。
このチューニング性を活用することで、簡単な周波数調整により、CZゲートとiSWAPゲートの両方をサポートする。
実演として,散逸型ハイゼンベルクXXZスピン鎖におけるスピンダイナミクスのシミュレーションを紹介する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:22:37 GMT)
Scalable and Site-Specific Frequency Tuning of Two-Level System Defects in Superconducting Qubit Arrays [0.0] 本稿では,量子2レベルシステム欠陥のサイト固有かつその場操作のためのスケーラブルなアーキテクチャを提案する。
提案手法は資源効率が高く,TLS周波数チューニングと1キュービット当たりの単一オンチップ制御に普遍的な単一キュービット制御を組み合わせた。
平均的なシングルキュービットエラーレートが36%、平均エネルギー緩和時間が17%改善されたことを実証します。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:49:46 GMT)
Rhythmic sharing: A bio-inspired paradigm for zero-shot adaptive learning in neural networks [0.0] 脳は新しい状況に素早く適応し、限られたデータから学習する。
リンク強度の発振を利用した学習パラダイムを開発し,これらの発振の協調と学習の関連性について検討した。
リンクの発振は、調整を迅速に変更し、ネットワークが監督なしに微妙なコンテキスト変化を感知し、適応できるようにする。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:09:16 GMT)
Revisiting Gaussian genuine entanglement witnesses with modern software [0.0] 連続変数ガウスの絡み合いは量子情報理論において魅力的な概念である。
測定された非物理的行列から最も可能性の高い物理的共分散行列を再構成するいくつかの方法を提案する。
正定値行列のシンプレクティックトレースに対する明示的な解析式を導出し, 絡み合う証人の単純な証人として機能する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:59:05 GMT)
Randomized based restricted kernel machine for hyperspectral image classification [0.0] ランダムベクトル汎関数リンク(RVFL)ネットワークは、ハイパースペクトル画像(HSI)分類において大きな人気を得ている。
RVFLモデルは、特に非線形関係や複雑なデータ構造を扱う際に、いくつかの制限に直面している。
本稿では,RVFLと制限されたカーネルマシンを併用した,ランダム化された制限されたカーネルマシン(R2KM$)モデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:18:39 GMT)
Quantum walk search on a two-dimensional grid with extra edges [0.0] 量子ウォークは、データベースの要素として識別された頂点を持つグラフ上のターゲットの探索に成功している。
我々は,長距離エッジを持つ2次元周期格子上の量子探索において,一定の成功確率を持つ$mathcalO(sqrtN/M)$の最適時間複雑性が達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:11:02 GMT)
Quantum walk search by Grover search on coin space [0.0] ラカダシカル量子ウォークは、追加の振幅増幅技術の助けなしに、グラフ上のターゲット頂点を探索することができる。
本稿では,不必要な量子ウォーク探索のための修正コインを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 02:30:37 GMT)
Qualitative In-Depth Analysis of GDPR Data Subject Access Requests and Responses from Major Online Services [0.0] プライバシーポリシーが不十分な場合、オンラインサービスが個々の要件に準拠するかどうかは不明だ。
調査では、分析されたサービスによってデータアクセス応答の品質が異なり、すべての要求が完全には満たされていないと結論付けている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:41:58 GMT)
PyPackIT: Automated Research Software Engineering for Scientific Python Applications on GitHub [0.0] PyPackITは、科学者がプロジェクトの科学的な側面に集中できるようにする、ユーザフレンドリーで使いやすいソフトウェアである。
PyPackITは、ビルド対応のPythonパッケージスケルトン、完全に運用されたドキュメンテーションとテストスイート、動的プロジェクト管理のためのコントロールセンタなど、堅牢なプロジェクトインフラストラクチャを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:41:55 GMT)
Privacy in Responsible AI: Approaches to Facial Recognition from Cloud Providers [0.0] Microsoft、AWS、Googleなどのクラウドプロバイダは、顔関連のテクノロジサービスを提供する最前線にいる。
本稿では,これらのクラウド巨人が顔認識と検出サービスにプライバシ原則をどのように実装しているかを比較する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:04:12 GMT)
Prevalence and Impacts of Image-Based Sexual Abuse Victimization: A Multinational Study [0.0] 画像に基づく性的虐待(英語: Image-based sexual abuse, IBSA)とは、親密な画像の作成、取得、共有を行うことを指す用語である。
本研究は,10カ国で16,000人以上の成人を対象に実施した調査を通じて,IBSAに対する頻度,影響,反応について検討した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:33:39 GMT)
PointsToWood: A deep learning framework for complete canopy leaf-wood segmentation of TLS data across diverse European forests [0.0] 我々は,ポイントネットとポイントクラウドから新たに開発されたディープラーニングアーキテクチャを用いて,3Dポイントクラウドを処理する新しいフレームワークを示す。
ボレアル地域,温帯地域,地中海地域,熱帯地域のオープンデータセットを用いて,その性能を評価した。
その結果、葉・木分断において最も広く使われているPointNetベースのアプローチに対して、一貫した性能を示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:23:03 GMT)
Partial yet definite emergence of the Kardar-Parisi-Zhang class in isotropic spin chains [0.0] 積分可能な等方スピン鎖におけるカルダル・パリ・張普遍性クラスについて検討する。
調整可能なパラメータを持たないKPZスケーリング法則と完全に一致している。
これにより、可積分等方性スピン鎖におけるKPZクラスの部分的な出現が確立される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:00:26 GMT)
POSERS: Steganography-Driven Molecular Tagging Using Randomized DNA Sequences [0.0] 我々は,DNAシークエンス内に埋め込まれたステガノグラフタグシステムPOSERS(Position-Oriented Scattering of Elements among a Randomized Sequence)を紹介する。
POSERSは、ランダム化されたDNAライブラリに制限を加えることで、コピーとフォージェリーの認証を保証する。
この結果から,製品認証の長期的かつ適応的なソリューションとして,POSERSの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:03:42 GMT)
PDX: A Data Layout for Vector Similarity Search [0.0] Partition Across Dimensions (PDX) は、複数のベクトルを1ブロックに格納するベクトルのためのデータレイアウトである。
PDXが標準水平ベクトルストレージ(40%高速化)でSIMD最適化距離カーネルを破る
さらにフレキシブルな次元探索戦略であるPDX-BONDを導入し,正確な探索性能と近似探索性能を向上した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:31:16 GMT)
Out-of-Distribution Radar Detection in Compound Clutter and Thermal Noise through Variational Autoencoders [0.0] 本稿では,変分オートエンコーダ(VAE)を用いた新しいレーダー目標検出手法を提案する。
複雑な分布を学習し、分布外サンプルを識別できることで知られ、提案されたVAEアーキテクチャは、レーダーターゲットと様々なノイズタイプを効果的に区別する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:38:14 GMT)
On the Random Schrödinger Equation and Geometric Quantum Control [0.0] ランダムなエルミート行列によって与えられる雑音項を雑音量子系をモデル化する手段として、ランダムなシュル「オーディンガー方程式を導入する。
合成ユニタリの誤差をノイズのノルム上の境界で導出し、特定のノイズ過程においてこれらの境界がきついことを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:01:06 GMT)
On the Importance of Clearsky Model in Short-Term Solar Radiation Forecasting [0.0] エクストリームラーニングマシン(ELM)モデルを用いたClearsky-Free予測手法を提案する。
ELMはGHI(Global Horizontal Irradiance)データから直接、日々の周期性と局所的な変動を学習する。
当社のアプローチは,雲のない条件下での照射を暗黙的に学習する非線形適応統計手法である。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:29:58 GMT)
On fully entangled fraction and quantum conditional entropies for states with maximally mixed marginals [0.0] 完全に絡み合った分数(FEF)は、最大絡み合った状態への量子状態の近接を測定する。
量子条件エントロピー(Quantum Conditional Entropy、QCE)は、量子系における相関の尺度である。
FEFは、$k$-コピー非ローカル性と$k$-コピーステアビリティと複雑に関連付けられている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 07:46:25 GMT)
On Fact and Frequency: LLM Responses to Misinformation Expressed with Uncertainty [0.0] 本研究では,3つの LLM の誤報に対する応答を検証し,不確定な文に変換した。
以上の結果から, LLMは, 事実確認分類を偽物から偽物に変更し, 25%の症例で偽物に分類した。
例外はドクサスティック変換であり、それは「それは信じる...」のような言語的キュー句を使う。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:02:25 GMT)
Nonlinear response theory for lossy superconducting quantum circuits [0.0] 損失量子回路に対する数値的かつ計算学的に実現可能な非線形応答理論を導入する。
弱い結合を超越したアプローチの重要な実演として、容量的かつ抵抗的なジョセフソン接合の低周波線形応答を解析する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:55:30 GMT)
No Silver Bullets: Why Understanding Software Cycle Time is Messy, Not Magic [0.0] 216の組織で55,000以上の観測データを用いて,チケット作成から完成までのサイクルタイムを計測した。
サイクルタイムと週あたりのコーディング日数、マージされたプルリクエストの数、コラボレーションの度合いといった要因との間には、正確だが控えめな関連性があります。
以上の結果から,一般的な職場要因は期待方向のサイクル時間に影響を及ぼすが,どの観測でも典型的性能に関する限られた信号が得られることが示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:32:53 GMT)
Neuromorphic Quantum Neural Networks with Tunnel-Diode Activation Functions [0.0] トンネルダイオードは量子トンネル(QT)の物理的効果を利用するよく知られた電子部品である
ニューラルネットワークのための新しい物理に基づく活性化関数として,トンネルダイオードの電流特性を用いる。
トンネルダイオードアクティベーション関数(TDAF)は,訓練と評価の双方において,精度と損失の点で従来のアクティベーション関数よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:14:23 GMT)
NaijaNLP: A Survey of Nigerian Low-Resource Languages [0.0] 3つの言語(Hausa、Yorub'a、Igbo)がナイジェリアの話し言葉の約60%を占めている。
これらの言語は、計算言語学におけるタスクを支援するリソースが不足しているため、低リソースに分類される。
本研究は,ナイジェリアの3大言語を対象とした低リソースNLP(LR-NLP)研究の進展を概観する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:45:51 GMT)
Multiscale Analysis of Woven Composites Using Hierarchical Physically Recurrent Neural Networks [0.0] 織物複合材料のマルチスケール均質化には, 詳細なミクロメカニカル評価が必要である。
本研究では,2段階の代理モデルを用いた階層型物理リカレントニューラルネットワーク(HPRNN)を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:02:32 GMT)
Metadata-free Georegistration of Ground and Airborne Imagery [0.0] 地上と空中の画像は、高品質な3Dモデルと観察シーンの新たな視点レンダリングを作成するために使用することができる。
標準フォトグラフィーパイプラインは任意の座標系でモデルを生成するが、ジオ登録されたモデルを必要とするアプリケーションには問題がある。
提案手法は,衛星ベースの参照生成物以外のメタデータを必要とせず,汎用性を有する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:57:45 GMT)
Meta Learning not to Learn: Robustly Informing Meta-Learning under Nuisance-Varying Families [0.0] RIME(Robustly Informed Meta lEarning)は,正および負の帰納バイアスの存在下でのメタ学習手法である。
RIMEは両方のバイアスを同時に統合することができ、分散的に堅牢な目的の下で、アートパフォーマンスの状態を達成できることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:05:29 GMT)
Memory Is All You Need: Testing How Model Memory Affects LLM Performance in Annotation Tasks [0.0] モデルが以前の分類情報を保持できるようにすることで、性能が大幅に向上することを示します。
モデル記憶と強化学習を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:39:18 GMT)
Maximizing Signal in Human-Model Preference Alignment [0.0] 本稿では、エンドユーザーがMLモデルによる決定に同意する必要がある場合、モデルが好みを表すデータに基づいて訓練され、評価されるべきである、と論じる。
評価手法のベストプラクティスに固執することで,ラベル付け不一致のノイズを最小限に抑えることができることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:10:57 GMT)
Linearization (in)stabilities and crossed products [0.0] 線型化(in)は、非線型方程式を持つ任意のゲージ共変場理論において起こる。
線形化解が正確な解と一体化できるかどうかを考察する。
対象を通常の正準定式化から体系的共変位相空間言語に変換する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 05:47:50 GMT)
Limitations of the paraxial beam model in the study of quantum vacuum signals [0.0] 本研究では, 偏光励起光子収率の過大評価について検討した。
従来の(導出順序)パラ軸ビームモデルに挑戦する場合に,正確なクローズドフォーム表現を得るための戦略を考案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:14:27 GMT)
Leveraging Large Language Models to Address Data Scarcity in Machine Learning: Applications in Graphene Synthesis [0.0] 材料科学における機械学習は、限られた実験データのために困難に直面している。
大規模言語モデル(LLM)を用いて機械学習の性能を向上させる戦略を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:04:01 GMT)
Leveraging Large Language Models For Scalable Vector Graphics Processing: A Review [0.0] 従来のベクトル化技術は、長い処理時間と過剰な出力の複雑さに悩まされている。
大規模言語モデル(LLM)の出現により、ベクトルグラフィックスの生成、編集、解析の新しい可能性が生まれた。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:23:17 GMT)
Insights into Schizophrenia: Leveraging Machine Learning for Early Identification via EEG, ERP, and Demographic Attributes [0.0] この研究は、統合失調症患者と健康管理の区別を目的とした機械学習(ML)分類器を提案する。
脳波(EEG)データから抽出された特徴を用いており、特に事象関連電位(ERP)と特定の人口統計学的変数に焦点を当てている。
このデータセットは、健康的な32のコントロールと49の統合失調症患者を含む、81人の参加者のデータで構成されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:42:25 GMT)
Incompatible observables in classical physics: A closer look at measurement in Hamiltonian mechanics [0.0] 物体系と有限温度測定装置の連成進化を含むプロセスとして,古典的ハミルトン物理学における測定について検討する。
観測可能度を測定すると、すべてのポアソン変換可観測値が乱されることはないが、必然的に全ての非ポアソン変換可観測値が乱される。
もともとハイゼンベルク関係に反する手段として提案されていた,小沢の古典的な量子測定モデルが,古典的関係に反するものではないことを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 01:23:58 GMT)
Inclusive STEAM Education: A Framework for Teaching Cod-2 ing and Robotics to Students with Visually Impairment Using 3 Advanced Computer Vision [0.0] 本稿では,事前構築したロボットと,迷路解決技術などのアルゴリズムを,アクセス可能な学習環境内で活用する枠組みを提案する。
提案システムでは、コントラスト言語画像事前学習(CLIP)を用いて、グローバルカメラキャプチャーされた迷路レイアウトを処理する。
学生は、CLIPを通じて洗練された音声コマンドを発行する一方、ロボット搭載ステレオカメラは、同時SLAMで処理されるリアルタイムデータを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:15:12 GMT)
Implantable Adaptive Cells: A Novel Enhancement for Pre-Trained U-Nets in Medical Image Segmentation [0.0] 本稿では,医用画像分割におけるトレーニング済みニューラルネットワークの性能向上のための新しいアプローチを提案する。
本稿では, 部分連結DARTSをベースとした小型モジュールであるIAC(Indegable Adaptive Cell)のコンセプトを提案する。
MRIとCT画像を用いた4つの医学データセットの実験では、様々なU-Net構成に対して一貫した精度の向上が示されている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:52:29 GMT)
Impact of chaos on the excited-state quantum phase transition of the Kerr parametric oscillator [0.0] 外部駆動とシステムの非線形性の間の相互作用から生じるカオスが、励起状態量子相転移(ESQPT)を破壊することを示す。
本研究は, より大きな非線形性を持つ新しいパラメトリック発振器の設計における理論モデルの解析の重要性を実証するものである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:39:49 GMT)
Image Data Augmentation for the TAIGA-IACT Experiment with Conditional Generative Adversarial Networks [0.0] 現代の画像型大気圧チェレンコフ望遠鏡(IACT)は、大量のデータを自動で、理想的にはリアルタイムで分類しなければならない。
実際のIACTデータ上でニューラルネットワークをトレーニングする際の問題は、これらのデータが事前にラベル付けされる必要があるのに対して、そのようなラベル付けは困難であり、その結果が推定されることだ。
我々は,条件付き生成逆数ネットワーク(cGAN)を用いて,所望の型とエネルギーの人工的に生成されたイベントを用いてデータ拡張を行うことを提案する。
本稿では,cGANを用いてバランスの取れたデータセットを生成するための簡単なアルゴリズムについて述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 00:09:01 GMT)
Identifying high-energy electronic states of NV$^-$ centers in diamond [0.0] ダイヤモンド中の負の窒素空孔中心は、フォトルミネッセンス点欠陥スピン量子ビットのプロトタイプである。
光サイクルに関わる5つの高エネルギー状態を特定し,特徴付ける。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:53:09 GMT)
ISP-AD: A Large-Scale Real-World Dataset for Advancing Industrial Anomaly Detection with Synthetic and Real Defects [0.0] 産業用スクリーン印刷異常検出データセット(ISP-AD)
ISP-ADは、ファクトリフロアから直接収集された合成欠陥と実際の欠陥を含む、これまでで最大のパブリックな産業データセットである。
合成および実際の欠陥を取り入れた複合教師あり訓練手法の実験を行った。
研究結果は, 偽陽性率の低い, 高いリコールなどの産業検査要求を満たすことによって, 合成的, 蓄積的両欠陥による監督が相互に補完できることを示唆している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:56:31 GMT)
Got Ya! -- Sensors for Identity Management Specific Security Situational Awareness [0.0] セキュリティ状況認識(Security situational awareness)とは、デジタルサイバー脅威を特定し、緩和し、予防することを指す。
アイデンティティ管理に特化してセキュリティ状況認識アプローチを提案する。
一般的な概念としてプロトコル仕様とアイデンティティ関連ソースに焦点を当てる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:03:45 GMT)
Geometrical frustration, power law tunneling and non-local gauge fields from scattered light [0.0] 幾何学的形状の分子雲上での非共鳴光子散乱過程を考察する。
解析により、そのようなセットアップはBose-Hubbard Hamiltonianによって適切にモデル化されていることが示された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:13:51 GMT)
Genuine tripartite entanglement in graviton-matter interactions [0.0] 量子重力系における真の三部構造非ガウス交絡の存在を示す。
我々は、ここで分析された重力-物質相互作用によく適合する新しい絡み合いの証人を紹介した。
証人は、システムが基底状態から始まるとき、ハミルトニアンによって生成される3つのモード状態に対してゼロではないことを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:38:49 GMT)
From Waterfallish Aerospace Certification onto Agile Certifiable Iterations [0.0] DO-178Cの要件を満たす継続的文書作成を支援する戦略とツールを提案する。
各ソフトウェアコンポーネントに関連するDO-178Cドキュメントを反復的に作成することで、真に継続的な認定可能なイテレーションへの道を開きます。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:49:57 GMT)
Fine-Tuning Florence2 for Enhanced Object Detection in Un-constructed Environments: Vision-Language Model Approach [0.0] VLM(Vision-Language Models)は、テキストと視覚入力を統合し、包括的な理解と相互作用を実現する。
本研究の目的は,フィレンツェ2モデルを微調整することで,挑戦的な環境下での効率を向上させることである。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:31:51 GMT)
FORTALESA: Fault-Tolerant Reconfigurable Systolic Array for DNN Inference [0.0] ミッションクリティカルおよび安全クリティカルなアプリケーションにおけるディープニューラルネットワーク(DNN)は、その信頼性を前面に持ち込む。
この作業では,3つの実行モードと4つの実装オプションを備えた,実行時再構成可能なsystolic配列アーキテクチャを提案する。
提案アーキテクチャは,サイストリックアレイPEのレジスタとMACユニットを過渡的および永久的故障から効率的に保護する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:35:59 GMT)
Extracting Symbolic Sequences from Visual Representations via Self-Supervised Learning [0.0] 自己教師付き学習(SSL)を用いた視覚データからシンボル表現を生成する新しい手法を提案する。
この手法の利点は、その解釈可能性である: シーケンスは、クロスアテンションを用いたデコーダ変換器によって生成される。
このアプローチは、ハイレベルなシーン理解に潜在的に適用可能な解釈可能なシンボル表現を作成する基盤となる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:02:20 GMT)
Entangled states from simple quantum graphs [0.0] 2つの散乱チャネルを持つ開量子グラフにおける量子輸送を扱う。
本稿では,2つの量子グラフ間の制御操作を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:46:34 GMT)
Enhancing Poverty Targeting with Spatial Machine Learning: An application to Indonesia [0.0] 本研究では,インドネシアにおける貧困を対象としたPMT(Proxy Means Testing)の精度を高めるために,空間機械学習を用いた。
本研究では,2016年から2020年から2021年にかけての社会福祉総合データサーベイ(DTKS)の世帯調査データを用いて,所得分布の空間的パターンを調査し,地域レベルと地域レベルの貧困クラスターを規定する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:40:34 GMT)
Enhancing AUTOSAR-Based Firmware Over-the-Air Updates in the Automotive Industry with a Practical Implementation on a Steering System [0.0] このプロジェクトの目的は、近代車両に適した高度なFOTAシステムの設計と実装である。
このシステムは更新プロセス中に認証とデータの整合性のためにUDS 0x27プロトコルを統合している。
システムの機能は、点滅LEDとLane Keeping Assist(LKA)システムという2つのアプリケーションを通して実証される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:54:40 GMT)
Electrically-Small Rydberg Sensor for Three-Dimensional Determination of rf k-Vectors [0.0] 楕円偏光無線周波数(rf)の3次元$k$-vectorを抽出できる小型のライドバーグ原子電界センサを提案する。
本手法では, 空間の単一点における場ベクトル測定を用い, キャリアの波長に対して任意に小さいセンサの体積と互換性がある。
センサは幅広い楕円性に作用し、電気的に小さな感知領域が最適であることを示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:01:56 GMT)
Efficient classical algorithm for simulating boson sampling with heterogeneous partial distinguishability [0.0] ボソンサンプリングの古典的シミュレーション理論を,光子対間の不明瞭性の程度が異なる場合に拡張する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:09:27 GMT)
Efficient Algorithms for Verifying Kruskal Rank in Sparse Linear Regression and Related Applications [0.0] 我々のフレームワークはランダム化ハッシュ技術と動的プログラミング戦略を組み合わせている。
我々のアルゴリズムは、高い確率的正確性を確保しつつ、$mathcalOleft(dk cdot left(nMright)lceil k / 2 rceilright)$のランタイムを実現する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:32:34 GMT)
EchoQA: A Large Collection of Instruction Tuning Data for Echocardiogram Reports [0.0] 集中治療のための医療情報マートから得られたエコー心電図を用いた質問応答(QA)データセットについて紹介する。
このデータセットは、心疾患とその重症度に対処する771,244のQAペアからなる、心疾患のQAシステムを強化するために特別に設計された。
我々は,ゼロショット評価のためのオープンソースおよびバイオメディカル固有モデル,ゼロショット評価のためのクローズソースモデルを含む大規模言語モデル(LLM)を比較した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 03:29:31 GMT)
Early Detection of Mental Health Issues Using Social Media Posts [0.0] Redditのようなソーシャルメディアプラットフォームは、ユーザー生成コンテンツの豊富なソースを表している。
メンタルヘルス危機の早期発見に言語的特徴と時間的特徴を統合したマルチモーダルディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:08:08 GMT)
Dynamical quantum phase transitions on random networks [0.0] N$のネットワーク上の横場イジングモデルにおける2種類の動的量子相転移(DQPT)について検討する。
ロシミットエコーのレート関数で定義されるDQPTに対して、このレート関数は初期状態と重なり合う点に近い$p=1$制限から逸脱する。
我々の分析は、このばらつきは、$p=1$制限に存在しない非自明な大域多体相関から生じることを示唆している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:00:01 GMT)
Dual-Class Prompt Generation: Enhancing Indonesian Gender-Based Hate Speech Detection through Data Augmentation [0.0] インドネシアのソーシャルメディアにおけるジェンダーベースのヘイトスピーチの検出は、ラベル付きデータセットが限られているため、依然として困難である。
我々は,逆翻訳,単一クラスプロンプト生成,および提案する2クラスプロンプト生成を評価した。
両クラスからサンプルを組み込むことで,言語モデルがより多様だが代表的なサンプルを生成することが示唆された。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:07:51 GMT)
Detection of 2D SPT Order with Partial Symmetries [0.0] 2次元対称性保護位相を識別するために部分対称性を用いる手法を提案する。
この構造は格子の回転対称性を利用して、オンサイトSPT不変量を抽出する。
その堅牢性は、部分対称性をレンズ空間の位相的分割関数を生成するものとして解釈することで示唆される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:56:52 GMT)
Detecting new obfuscated malware variants: A lightweight and interpretable machine learning approach [0.0] 本稿では,高度に正確で軽量で解釈可能な,難読化マルウェアを検出する機械学習システムを提案する。
本システムでは,1つのマルウェアサブタイプ,すなわちSpywareファミリーのTransponderでのみ訓練されているにもかかわらず,15種類のマルウェアサブタイプを検出することができる。
トランスポンダー中心のモデルは99.8%を超え、平均処理速度はファイルあたり5.7マイクロ秒であった。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 12:41:21 GMT)
Cryptoanalysis of a tropical triad matrix semiring key exchange protocol [0.0] 本稿では,3次熱帯セミリングに基づく鍵交換プロトコルについて分析する。
我々は、Sulaiman Alhussaini、Craig Collett、Sergei Sergeevによって導入されたアルゴリズムを用いて、熱帯行列上の二重離散対数問題を解く。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 15:41:00 GMT)
Computational complexity of isometric tensor network states [0.0] 2D isoTNSを1+1Dユニタリ量子回路にマッピングする。
強いインジェクティブなアイソTNSで局所的な期待値を計算するための高速な古典的アルゴリズムを求める。
本研究の結果は,isoTNSを契約する証明可能なアルゴリズムの設計に利用できる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 11:04:41 GMT)
ComplexityMeasures.jl: scalable software to unify and accelerate entropy and complexity timeseries analysis [0.0] ComplexityMeasures.jlは簡単に拡張可能で高性能なオープンソースソフトウェアであり、様々な複雑さ対策を実装している。
このソフトウェアは1638の測度と3,841行のソースコードを提供する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 09:00:26 GMT)
Comment on "Unified framework for open quantum dynamics with memory" [0.0] 最近の論文では、一般化量子マスター方程式(GQME)と調和浴に結合した系の経路積分の関係を見いだしている。
このコメントでこれらの3つの批判について詳しく述べる。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:47:37 GMT)
Codebook Reduction and Saturation: Novel observations on Inductive Thematic Saturation for Large Language Models and initial coding in Thematic Analysis [0.0] 本稿では,Large Language Models (LLMs) を用いたテーマ解析のプロセスについて考察する。
Inductive Thematic Saturation (ITS) 測定のための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:52:03 GMT)
Coarse Set Theory for AI Ethics and Decision-Making: A Mathematical Framework for Granular Evaluations [0.0] 粗い集合論(CST)は、粗い倫理(CE)を定式化する数学的枠組みを導入する
CEは人間の評価やAI分類システムでよく使われる粗粒度決定過程をモデル化する。
CSTは全順序構造と粗い写像を用いて集合間の階層的関係を定義し、決定の粒度を動的に調整することができる。
この研究では、グレーディングシステム、自動レコメンデーション、リスクアセスメントにCSTを採用し、公正性を高め、バイアスを低減し、AIによる意思決定における透明性を向上させる可能性を実証している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 23:24:47 GMT)
Classical Simulation of Non-Classical Systems: A Large Deviation Analysis [0.0] 古典的シミュレーションの下での大きな揺らぎの確率は、実際の非古典的システムよりも厳密に大きいことを示す。
本稿では、量子優位の新たな形態として、量子(および符号なし)系の潜在的な大きな偏差安定性を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:36:43 GMT)
Characterizing Dynamic Majorana Hybridization for Universal Quantum Computing [0.0] マヨラナゼロモード(MZM)で構築された量子ビットは、フォールトトレラントなトポロジカル量子計算への潜在的な経路として長い間理論化されてきた。
この研究は、空間や時間によって異なる動的ハイブリダイゼーションの量子ビット誤差を予測するための単純だが正確な方法を示す。
任意の1キュービット回転だけでなく、2キュービット制御された可変位相ゲートを実装するためにハイブリダイゼーションを利用する方法を示す。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 22:59:42 GMT)
Can we repurpose multiple-choice question-answering models to rerank retrieved documents? [0.0] R* は概念実証モデルであり、文書の再ランク付けのための多重選択質問回答(MCQA)モデルを調和させる。
実験的な検証により、R*は検索精度を向上し、フィールドの進歩に寄与することが証明される。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:53:24 GMT)
Can Large Language Models Predict Antimicrobial Resistance Gene? [0.0] 本研究では, 大規模言語モデルが様々なラベルを持つDNA配列をいかに効果的に扱うかを評価する。
抗菌抵抗性遺伝子について実験を行い、その結果、生成型大規模言語モデルが同等または潜在的に優れた予測を提供することを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:10:57 GMT)
Brain Tumor Detection in MRI Based on Federated Learning with YOLOv11 [0.0] 現在の機械学習アプローチには、データプライバシとレイテンシの2つの大きな制限がある。
YOLOv11アルゴリズムを取り入れたより正確な脳腫瘍検出のためのフェデレート学習アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 04:50:07 GMT)
Boltzmann convolutions and Welford mean-variance layers with an application to time series forecasting and classification [0.0] 本稿では,時系列予測と分類のためのForeClassNetと呼ばれるベイズ深層ニューラルネットワークアーキテクチャを提案する。
我々はForeClassNetが現在の技術手法と比較して優れた性能を発揮することを実証する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 20:41:25 GMT)
Bidirectionalization For The Common People [0.0] Bifronsは、ドメイン固有のプログラミング言語を置き換えるBXレンズのライブラリである。
提案手法は、双方向変換の実装作業を単純化する。
単純なレンズテストフレームワークを提供することで、合理的に正確性を保証する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:17:02 GMT)
Beyond-mean-field phases of rotating dipolar condensates [0.0] 回転する双極子ボース=アインシュタイン凝縮体は、長距離相互作用と回転の相互作用によってリッチな物理学を示す。
有限サイズの双極子凝縮体の研究には、数値的に正確な多重構成法を用いる。
我々は、新しい渦構造、回転するクラスター状態、強い断片化効果を明らかにし、大規模システムにおいても平均場外相関が顕著であることを示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:00:00 GMT)
Artificial Intelligence in Pronunciation Teaching: Use and Beliefs of Foreign Language Teachers [0.0] この研究は、キプロスで働くインサービス教員117人の英語・アズ・ア・外国語(EFL)に関するものだった。
教師は、AIの有効性の認識とそれを採用する意思について、かなり同意する傾向があった。
AIを利用した教師は、その効果に強く同意することが多い。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 06:14:27 GMT)
Architecture for a Trustworthy Quantum Chatbot [0.0] この記事では、いくつかの機能拡張を提供するC4Qの最新バージョン(2.0)について説明する。
C4Q 2.0 の分類 LLM はほぼ完全である。
この評価は、C4Q 2.0の保守性と正確性を強調する3つの既存のチャットボットによる比較研究から成っている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 16:43:23 GMT)
Application of integrated gradients explainability to sociopsychological semantic markers [0.0] 我々は、単語レベルでの分類出力を捉えるために、統合的勾配法(IG法)を利用する。
我々は、感情以外の心理学的マーカーに注目し、エージェントにおけるIGを効果的に訓練する方法について検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 21:35:24 GMT)
AppQSim: Application-oriented benchmarks for Hamiltonian simulation on a quantum computer [0.0] AppQSimは量子コンピュータのベンチマークスイートである。
正確なタスクとスコアを定義する5つの異なる設定を検討します。
テストされた量子ハードウェアの出力の質を評価するためのメトリクスを導入する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 10:39:11 GMT)
Algorithmic construction of SSA-compatible extreme rays of the subadditivity cone and the ${\sf N}=6$ solution [0.0] 強い部分付加性に相反する6次元部分付加性円錐の極端光線の集合を計算する。
我々は208個の新しい6つの軌道を同定し、そのうち52個は少なくとも1つのホログラフィックエントロピー不等式に違反している。
最後の6つの軌道については、ホログラフィックであるかどうかの疑問が残る。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 19:29:24 GMT)
Activation Space Interventions Can Be Transferred Between Large Language Models [0.0] モデル間での安全介入は、共有活性化空間の学習されたマッピングを通して伝達可能であることを示す。
このアプローチは、バックドアの除去と有害なプロンプトの拒絶という、確立された2つのAI安全タスクに対して実証する。
また、バックドアに関連付けられた知識を組み込むために、モデルに微調整を施した新しいタスク、textitcorrupted機能を提案する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:38:44 GMT)
Accurate predictive model of band gap with selected important features based on explainable machine learning [0.0] 本研究では、置換特徴の重要性やSHapley Additive exPlanationなど、説明可能なML(XML)技術を用いる。
XMLから派生した個々の機能の重要性に導かれ、機能削減予測モデルを構築するためのシンプルなフレームワークが提案されている。
モデル評価は、上位5つの特徴からなるXML誘導型コンパクトモデルが、ドメイン内のデータセット上のプリスタンモデルに匹敵する精度を達成することを示している。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:40:21 GMT)
A lightweight model FDM-YOLO for small target improvement based on YOLOv8 [0.0] 小さいターゲットは、低いピクセル数、複雑な背景、様々な射撃角度のために検出が困難である。
本稿では,小目標検出に焦点をあて,低計算制約下での物体検出手法について検討する。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 14:06:35 GMT)
A Study on the Matching Rate of Dance Movements Using 2D Skeleton Detection and 3D Pose Estimation: Why Is SEVENTEEN's Performance So Bita-Zoroi (Perfectly Synchronized)? [0.0] その数と身体的な違いにもかかわらず、セレンテエンのダンス・パフォーマンスはKポップ業界では例外なく団結している。
本研究では,SEVENTEENのダンスパフォーマンスについて,YouTubeで公開されているビデオを用いて分析した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 08:23:45 GMT)
A New Proof of the QNEC [0.0] 量子零エネルギー条件(QNEC)の簡易な証明を与える。
我々の証明は、エンタングリングカットに関する相対エントロピーの形状微分の明示的な公式に基づいている。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 17:41:51 GMT)
A Case Study of Counting the Number of Unique Users in Linear and Non-Linear Trails -- A Multi-Agent System Approach [0.0] そこで本研究では,分散ネットワークにおける低コストカメラを利用した一意ユーザ追跡と分析を行うマルチエージェントシステムを提案する。
ケーススタディとして、デラウェア州ウィルミントンにあるJack A. Markell(JAM)トレイルと、デラウェア州ニューアークにあるホールトレイルにこのシステムをデプロイした。
結果は、ユニークなユーザを特定する上で72%の成功率を示し、自動公園活動監視のベンチマークを設定した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 18:43:51 GMT)
A Cascaded Architecture for Extractive Summarization of Multimedia Content via Audio-to-Text Alignment [0.0] 本研究は,音声-テキストアライメントによるマルチメディアコンテンツの抽出要約のためのカスケードアーキテクチャを提案する。
Microsoft Azure Speechを使った音声からテキストへの変換と、Whisper、Pegasus、Facebook BART XSumといった高度な抽出要約モデルを統合する。
ROUGEとF1スコアを用いた評価は,従来の要約手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 06 Mar 2025 13:59:14 GMT)