DeepSeek-V3 Technical Report [147.2] We present DeepSeek-V3, a strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token。
我々は14.8兆の多様性と高品質のトークンでDeepSeek-V3を事前訓練し、その後にSupervised Fine-Tuning and Reinforcement Learningのステージを受講した。
包括的な評価によると、DeepSeek-V3は他のオープンソースモデルよりも優れており、主要なクローズドソースモデルに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:26:38 GMT)
Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.9] G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:44:29 GMT)
AnyRefill: A Unified, Data-Efficient Framework for Left-Prompt-Guided Vision Tasks [116.9] 本稿では,多様な参照型視覚タスクに対処するため,新しいLPG(Left-Prompt-Guided)パラダイムを提案する。
本稿では,テキスト・ツー・イメージ(T2I)モデルを様々な視覚タスクに効果的に適用するAnyRefillを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:25:32 GMT)
Step-Audio: Unified Understanding and Generation in Intelligent Speech Interaction [110.4] 本稿では,音声認識のための最初のプロダクション対応オープンソースソリューションであるStep-Audioを紹介する。
1) 統合された理解と生成を実現する統合音声テキストマルチモーダルモデル、2) 安価な音声クローニングフレームワークを確立し、蒸留によりオープンソースで軽量なStep-Audio-TTS-3Bモデルを生産する生成音声データエンジン、3) 方言、感情、歌、RAP間の動的調整を可能にする命令駆動型微制御システム、4) ツールコールとロールプレイング機能を備えた強化認知アーキテクチャ。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:29:10 GMT)
MagicArticulate: Make Your 3D Models Articulation-Ready [109.4] 静的な3Dモデルを自動的に調音可能なアセットに変換する効果的なフレームワークであるMagicArticulateを提案する。
まず,高品質な調音アノテーションを備えた33k以上の3Dモデルを含むArticulation-averseベンチマークを紹介し,XL-XLから慎重にキュレートする。
大規模な実験では、MagicArticulateはさまざまなオブジェクトカテゴリで既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:21:59 GMT)
AV-Flow: Transforming Text to Audio-Visual Human-like Interactions [101.3] AV-Flowは、テキスト入力のみを与えられた写真リアリスティックな4D音声アバターを識別するオーディオ視覚生成モデルである。
人間の音声合成, 唇の動きの同期, 表情の鮮やかさ, 頭ポーズを実演した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:56:18 GMT)
Political Neutrality in AI is Impossible- But Here is How to Approximate it [97.6] 真の政治的中立性は、主観的な性質と、AIトレーニングデータ、アルゴリズム、ユーザーインタラクションに固有のバイアスのため、実現可能でも普遍的に望ましいものではない、と我々は主張する。
我々は、政治的中立性の「近似」という用語を使って、到達不可能な絶対値から達成不可能で実用的なプロキシへ焦点を移す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:48:04 GMT)
RevisEval: Improving LLM-as-a-Judge via Response-Adapted References [95.3] RevisEvalは、応答適応参照による新しいテキスト生成評価パラダイムである。
RevisEvalは、理想的な参照が評価される応答に対する必要な関連性を維持するべきであるというキーオブザーバーによって駆動される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:38:18 GMT)
Multi-Step Alignment as Markov Games: An Optimistic Online Gradient Descent Approach with Convergence Guarantees [91.9] マルチステップ優先最適化(MPO)は、自然なアクター批判フレームワークciteprakhlin2013online,joulani17a上に構築されている。
我々はOMPOが$mathcalO(epsilon-1)$ポリシー更新を必要とし、$epsilon$-approximate Nash平衡に収束することを示した。
また,本手法がマルチターン会話データセットと数理推論データセットに与える影響についても検証した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:33:48 GMT)
Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning [90.0] 拡散モデルが自己回帰的アプローチを損なう困難なサブゴールをどのように学習するかを示す。
本稿では,学習時の難易度に基づいてサブゴールを優先する多粒度拡散モデリング(MGDM)を提案する。
MGDMは検索手法を使わずに自己回帰モデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:52:31 GMT)
Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis [89.6] 後学習量子化(PTQ)技術は大規模言語モデル(LLM)圧縮に広く採用されている。
既存のアルゴリズムは主にパフォーマンスに重点を置いており、モデルサイズ、パフォーマンス、量子化ビット幅間のトレードオフを見越している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:35:35 GMT)
Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs [86.8] OpenAIのo1のような大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な能力を示している。
我々は、o1-like LLMがしばしば異なる理性的思考を切り替える、という現象を特定する。
本稿では,思考間の早期移行を回避できる思考切替ペナルティTIPを用いた復号戦略を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:51:53 GMT)
NaturalReasoning: Reasoning in the Wild with 2.8M Challenging Questions [86.2] NaturalReasoningは、複数のドメインにまたがる280万の質問からなる包括的なデータセットである。
本研究では,NaturalReasoningが強力な教師モデルから推論能力を効果的に引き出すことができることを示す。
また、外部報酬モデルや自己回帰を用いた教師なしの自己訓練にも有効である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:46:57 GMT)
Corrupted but Not Broken: Rethinking the Impact of Corrupted Data in Visual Instruction Tuning [85.6] 劣化したデータがマルチモーダル大言語モデル(MLLM)に与える影響について検討する。
劣化したデータはMLLMの性能を劣化させるが、その効果はほとんど表面的である。
本稿では,自己検証とポストトレーニングを組み合わせた汚職-汚職訓練のパラダイムを提案し,既存の汚職軽減戦略を著しく上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:28:29 GMT)
Magma: A Foundation Model for Multimodal AI Agents [85.5] Magmaは、デジタルと物理の両方の世界でマルチモーダルAIエージェントタスクを提供する基盤モデルである。
エージェント機能を実現するために、Magmaは画像、ビデオ、ロボットデータなど、多種多様なデータセットを事前訓練している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:55:21 GMT)
Instance-Level Moving Object Segmentation from a Single Image with Events [84.1] 移動対象セグメンテーションは、複数の移動対象を含む動的なシーンを理解する上で重要な役割を果たす。
従来の手法では、物体の画素変位がカメラの動きや物体の動きによって引き起こされるかどうかを区別することが困難であった。
近年の進歩は、従来の画像の不適切な動作モデリング機能に対抗するために、新しいイベントカメラの動作感度を利用する。
補完的なテクスチャとモーションキューを統合した,最初のインスタンスレベルの移動オブジェクトセグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:56:46 GMT)
Finedeep: Mitigating Sparse Activation in Dense LLMs via Multi-Layer Fine-Grained Experts [82.7] ファインディープ(英: Finedeep)は、高密度モデルのための、きめ細かいきめ細かなアーキテクチャである。
我々のフレームワークは、従来の高密度モデルのフィードフォワードニューラルネットワーク層を小さな専門家に分割する。
各専門家の貢献度を決定するための新しいルーティング機構が提案されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:09:58 GMT)
Aspect-Aware Decomposition for Opinion Summarization [82.4] 本稿では、アスペクト識別、意見統合、メタレビュー合成のタスクを分離する、レビューアスペクトによってガイドされるモジュラーアプローチを提案する。
科学研究、ビジネス、製品ドメインを表すデータセットをまたいだ実験を行います。
その結果,本手法は強いベースラインモデルと比較して,より基底的なサマリーを生成することがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:30:09 GMT)
A Smooth Transition Between Induction and Deduction: Fast Abductive Learning Based on Probabilistic Symbol Perception [81.3] 確率的シンボル知覚(PSP)と呼ばれる最適化アルゴリズムを導入し,誘導と推論のスムーズな遷移を実現する。
実験は有望な結果を実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:59:54 GMT)
Migician: Revealing the Magic of Free-Form Multi-Image Grounding in Multimodal Large Language Models [79.6] 複数の画像に対して自由かつ正確なグラウンド化を行うことができる最初のマルチイメージグラウンドモデルであるMigicianを紹介する。
我々のモデルは、より優れたマルチイメージグラウンド機能を実現し、最高のMLLMを24.94%上回り、さらに大きな70Bモデルを超えた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:40:14 GMT)
HeadInfer: Memory-Efficient LLM Inference by Head-wise Offloading [79.4] HEADINFERはKVキャッシュをCPURAMにオフロードするが、GPU上のトランスフォーマー層のKVキャッシュを完全に保存する必要はない。
HEADINFERはメモリフットプリントを大幅に削減し,計算効率を向上することを示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:26:05 GMT)
Correcting the Mythos of KL-Regularization: Direct Alignment without Overoptimization via Chi-Squared Preference Optimization [78.8] $chi2$-Preference Optimization(chi$PO)は、オーバー最適化に対して確実に堅牢なオフラインアライメントアルゴリズムである。
$chi$POは、正規化による不確実性に直面して悲観主義の原理を実装している。
$chi$POの単純さと強力な保証により、オーバー最適化に対して確実に堅牢な、実用的で汎用的なオフラインアライメントアルゴリズムとなった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:16:55 GMT)
Large Language Diffusion Models [77.0] 自己回帰モデル(ARM)は、大規模言語モデル(LLM)の基盤として広く見なされている。
我々は,事前学習および教師付き微調整パラダイムの下で,ゼロから学習した拡散モデルであるLLaDAを紹介する。
広範なベンチマークを通じて、LLaDAは強力なスケーラビリティを示し、自己構築されたARMベースラインを上回っています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:08:59 GMT)
SongGen: A Single Stage Auto-regressive Transformer for Text-to-Song Generation [75.9] SongGenは、コントロール可能な曲を生成するための、完全なオープンソースでシングルステージの自動回帰トランスフォーマーである。
音声と伴奏の混合を生成する混合モードと、それらを別々に合成するデュアルトラックモードの2つの出力モードをサポートする。
コミュニティの関与と今後の研究を促進するため、私たちは、モデルの重み付け、トレーニングコード、注釈付きデータ、前処理パイプラインをリリースします。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:52:21 GMT)
Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System [75.3] 大規模言語モデル (LLM) に基づくマルチエージェントシステム (MAS) は協調的問題解決において顕著な可能性を示している。
通信効率の低下、スケーラビリティの低下、効果的なパラメータ更新方法の欠如などです。
本稿では,コミュニケーション効率とタスク効率を両立させ,これらの課題に対処する新しいフレームワークOptimaを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:50:00 GMT)
Bridging and Modeling Correlations in Pairwise Data for Direct Preference Optimization [75.1] 本稿では,BMC という名前のペアデータにおけるブリッジ・アンド・モデリングの効果的なフレームワークを提案する。
目的の修正によって、ペアの選好信号の一貫性と情報性が向上する。
DPOだけではこれらの相関をモデル化し、ニュアンス付き変動を捉えるには不十分である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:56:18 GMT)
Unbiased Learning to Rank with Query-Level Click Propensity Estimation: Beyond Pointwise Observation and Relevance [74.4] 現実のシナリオでは、ユーザーは複数の関連するオプションを調べた後、1つまたは2つの結果だけをクリックします。
本稿では,ユーザが異なる検索結果リストをクリックする確率を捉えるために,クエリレベルのクリック確率モデルを提案する。
本手法では,2次元逆重み付け機構を導入し,相対飽和度と位置偏差に対処する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:04:29 GMT)
Competitive Programming with Large Reasoning Models [73.7] 大規模言語モデル(LLM)に適用した強化学習は、複雑なコーディングや推論タスクの性能を大幅に向上させることを示す。
OpenAI o1 と初期チェックポイント o3 の2つの汎用推論モデルとドメイン固有のシステム o1-ioi を比較した。
以上の結果から,o1-ioiなどの特殊なパイプラインでは,手作りの推論に頼らずに,スケールアップされた汎用o3モデルがこれらの結果を上回っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:21:40 GMT)
NExT-Mol: 3D Diffusion Meets 1D Language Modeling for 3D Molecule Generation [72.2] NExT-Mol: 3D Diffusion Meets 1D Language Modeling for 3D Molecule Generationを提案する。
NExT-Molは1D分子生成のために広範囲に事前訓練された分子LMを使用し、その後、生成された分子の3Dコンホメータを予測する。
我々は,NExT-Molの性能を向上させるために,LMのモデルサイズをスケールアップし,拡散ニューラルアーキテクチャを改良し,三次元トランスファー学習に1Dを適用した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:40:13 GMT)
A Unified Framework for Event-based Frame Interpolation with Ad-hoc Deblurring in the Wild [72.0] 本稿では,デブロリングアドホックを行うイベントベースフレームの統一フレームワークを提案する。
我々のネットワークは、フレーム上の従来の最先端の手法、単一画像のデブロアリング、および両者のジョイントタスクを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:08:41 GMT)
Demystifying Multilingual Chain-of-Thought in Process Reward Modeling [71.1] プロセス報酬モデル(PRM)を多言語設定に拡張するという課題に対処する。
我々は、7つの言語にまたがるデータセット上で多言語PRMを訓練し、それを英語から翻訳する。
本結果は,学習言語数と英語データ量の両方に対する多言語PRMの感度を強調した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:11:44 GMT)
The Hidden Risks of Large Reasoning Models: A Safety Assessment of R1 [70.9] 本稿では,OpenAI-o3およびDeepSeek-R1推論モデルの総合的安全性評価を行う。
本研究では, 現実の応用における強靭性を評価するために, ジェイルブレイクやインジェクションなどの敵攻撃に対する感受性について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:06:07 GMT)
DSMoE: Matrix-Partitioned Experts with Dynamic Routing for Computation-Efficient Dense LLMs [70.9] 本稿では,事前学習したFFN層を計算ブロックに分割することで,分散化を実現するDSMoEを提案する。
我々は,Sigmoid アクティベーションとストレートスルー推定器を用いた適応型エキスパートルーティングを実装し,トークンがモデル知識の様々な側面に柔軟にアクセスできるようにする。
LLaMAモデルを用いた実験により、DSMoEは既存のプルーニング法やMoE法に比べて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:37:26 GMT)
HybriDNA: A Hybrid Transformer-Mamba2 Long-Range DNA Language Model [70.7] ハイブリッドトランスフォーマー-マンバ2アーキテクチャを組み込んだデコーダのみのDNA言語モデルであるHybriDNAを提案する。
このハイブリッド設計により、HybriDNAはDNA配列を最大131kbまで効率よく単一のヌクレオチド分解能で処理できる。
HybriDNAは、BEND、GUE、LRBベンチマークから算出された33のDNA理解データセットにまたがる最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:00:07 GMT)
Scaling Test-Time Compute Without Verification or RL is Suboptimal [70.3] RL法や検索法に基づく検証器ベース (VB) 手法による微調整は, 一定量の計算・データ予算を条件として, 蒸留・クローニングに基づく検証器フリー (VF) 手法よりもはるかに優れていることを示す。
我々は,3/8Bの事前学習型LLMのドクティクスと数学推論の両問題に対して,我々の理論を実証的に相関させ,テスト時間計算のスケーリングには検証が不可欠であることを確認した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:54:12 GMT)
The Mirage of Model Editing: Revisiting Evaluation in the Wild [70.2] 質問応答アプリケーションにおけるモデル編集の有効性について検討する。
単一の編集実験により、現在行われている編集手法は、以前報告したよりも大幅に悪化していることが示された。
本分析は,既存のモデル編集手法の現実的適用性と評価手法の両面について,基礎的な再検討を行うものである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:31:49 GMT)
EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.6] 戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
EPOはオープンなアクション空間で戦略を提供し、任意のLLMエージェントにプラグインすることで、ゴール指向の振る舞いを動機付けることができる。
社会的および物理的領域にわたる実験は、EPOの長期的なゴールアライメント能力を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:15:55 GMT)
What Do LLMs Need to Understand Graphs: A Survey of Parametric Representation of Graphs [69.5] 大規模言語モデル(LLM)は、期待される推論能力と推論能力のために、AIコミュニティで再編成されている。
我々は、グラフのこのようなパラメトリック表現、グラフ法則は、LLMがグラフデータを入力として理解させるソリューションであると信じている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:16:09 GMT)
RobuRCDet: Enhancing Robustness of Radar-Camera Fusion in Bird's Eye View for 3D Object Detection [69.0] 暗い照明や悪天候はカメラの性能を低下させる。
レーダーは騒音と位置のあいまいさに悩まされる。
本稿では,BEVの頑健な物体検出モデルであるRobuRCDetを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:17:38 GMT)
Improving Factuality with Explicit Working Memory [68.4] 大規模な言語モデルは、幻覚として知られる、事実的に不正確なコンテンツを生成することができる。
EWE(Explicit Working Memory)は、外部リソースからのリアルタイムフィードバックを受信するワーキングメモリを統合することで、長文テキスト生成における事実性を高める新しい手法である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:15:34 GMT)
WarriorCoder: Learning from Expert Battles to Augment Code Large Language Models [67.2] WarriorCoderは、専門家の戦いから学んだ新しいパラダイムで、現在のアプローチの限界に対処する。
我々は、専門家のLLMが互いに挑戦する場を作り、公平な審査員による評価を行う。
この競争フレームワークは、すべての参加者の強みを活用して、ゼロから新しいトレーニングデータを生成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:01:30 GMT)
OpenCharacter: Training Customizable Role-Playing LLMs with Large-Scale Synthetic Personas [65.8] 本研究では,文字一般化機能を備えた大規模言語モデルを実現するための大規模データ合成手法について検討する。
まず、ペルソナハブのペルソナを用いて、大規模な文字プロファイルを合成することから始める。
次に、応答書き換えと応答生成という2つの戦略を検討し、文字対応の命令応答を生成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:04:05 GMT)
MetaDesigner: Advancing Artistic Typography Through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.8] MetaDesignerがLarge Language Models(LLM)を利用したアートタイポグラフィーのための変換フレームワークを導入
その基盤は、Pipeline、Glyph、Textureエージェントで構成されるマルチエージェントシステムであり、カスタマイズ可能なWordArtの作成をまとめてオーケストレーションしている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:28:02 GMT)
Learning More Effective Representations for Dense Retrieval through Deliberate Thinking Before Search [65.5] ディリベレート思考に基づくDense Retriever (DEBATER)
DEBATERは、ステップバイステップの思考プロセスを通じて、より効果的な文書表現を学習できるようにすることにより、最近の密集型検索機能を強化している。
実験の結果,DEBATERはいくつかのベンチマークで既存手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:56:34 GMT)
Computational Safety for Generative AI: A Signal Processing Perspective [65.3] 計算安全性は、GenAIにおける安全性の定量的評価、定式化、研究を可能にする数学的枠組みである。
ジェイルブレイクによる悪意のあるプロンプトを検出するために, 感度解析と損失景観解析がいかに有効かを示す。
我々は、AIの安全性における信号処理の鍵となる研究課題、機会、そして重要な役割について論じる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:26:50 GMT)
PTQ1.61: Push the Real Limit of Extremely Low-Bit Post-Training Quantization Methods for Large Language Models [64.8] 大規模言語モデル(LLM)は、非常に低ビット(2ビット未満)の量子化に直面した場合、性能が著しく低下する。
我々はPTQ1.61と呼ばれる極低ビットのPTQ法を提案し、これによって初めて1.61ビットの重み量子化が可能となる。
実験により、PTQ1.61は極低ビット量子化において最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:04:58 GMT)
UMETTS: A Unified Framework for Emotional Text-to-Speech Synthesis with Multimodal Prompts [64.0] UMETTSは、複数のモーダルからの感情的手がかりを利用して、表現力が高く感情的に共鳴する音声を生成する新しいフレームワークである。
EP-Alignは対照的な学習を用いて、テキスト、オーディオ、視覚的モダリティをまたいだ感情的特徴を整合させ、マルチモーダル情報のコヒーレントな融合を保証する。
EMI-TTSは、アライメントされた感情埋め込みと最先端のTSモデルを統合し、意図した感情を正確に反映した音声を合成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:39:25 GMT)
SafeRoute: Adaptive Model Selection for Efficient and Accurate Safety Guardrails in Large Language Models [63.6] 本稿では,難しい例と簡単な例を区別するバイナリルータを提案する。
提案手法は、ルータが考慮するデータに対して、より大きな安全ガードモデルを選択的に適用し、精度を維持しながら効率を向上する。
複数のベンチマークデータセットによる実験結果から,適応モデルの選択により,計算コストと安全性性能のトレードオフが著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:51:17 GMT)
MomentSeeker: A Comprehensive Benchmark and A Strong Baseline For Moment Retrieval Within Long Videos [62.0] 我々は、一般的な長時間ビデオモーメント検索タスクの処理において、検索モデルの性能を評価するベンチマークであるMomentSeekerを提案する。
平均で500秒を超える長いビデオが組み込まれており、長時間ビデオのモーメント検索に特化した最初のベンチマークとなっている。
幅広いタスクカテゴリ(Moment Search, Caption Alignment, Image-conditioned Moment Search, Video-conditioned Moment Searchなど)と多様なアプリケーションシナリオをカバーする。
さらに、MLLMベースのLVMRレトリバーを合成データ上に微調整し、ベンチマークで高い性能を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:50:23 GMT)
Interactive Agents to Overcome Ambiguity in Software Engineering [61.4] AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:12:26 GMT)
Near-Optimal Private Learning in Linear Contextual Bandits [61.4] 一般化線形文脈包帯におけるプライベートラーニングの問題点を解析する。
私たちの結果は、共同プライバシーが、私たちが考慮しているすべての設定において、ほぼ"無料"であることを示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:35:24 GMT)
MALT Diffusion: Memory-Augmented Latent Transformers for Any-Length Video Generation [61.1] 長ビデオ生成に特化した新しい拡散モデルMALT Diffusionを提案する。
MALTは、短いセグメントに分割し、セグメントレベルの自己回帰生成を行うことで、長いビデオを処理する。
モデルが一貫した品質と最小限の劣化で長い地平線上でフレームを生成できるようにするための訓練手法をいくつか提示する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:22:50 GMT)
Sailor2: Sailing in South-East Asia with Inclusive Multilingual LLMs [61.1] Sailor2は、東南アジア(SEA)言語のための最先端の多言語言語モデルのファミリーであり、1B、8B、20Bサイズで利用可能である。
Sailor2は、中国語と英語の習熟を維持しながら、13のSEA言語をサポートするために500Bトークンを継続的に事前訓練している。
Sailor2-20Bモデルは、SEA言語間でGPT-4oに対して50-50の勝利率を達成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:04:57 GMT)
A Label-Free Heterophily-Guided Approach for Unsupervised Graph Fraud Detection [60.1] 本稿では,非教師付きGFDのための非教師付きグラフ不正検出手法(HUGE)を提案する。
推定モジュールでは、GFD の臨界グラフ特性をキャプチャする HALO と呼ばれる新しいラベルフリーなヘテロフィリー計量を設計する。
アライメントに基づく不正検出モジュールにおいて、ランキング損失と非対称アライメント損失を有する合同GNNアーキテクチャを開発する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:07:36 GMT)
Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability [59.8] 線形状態空間モデルにおいて閉形式ガウス推論を行う独立なカルマンフィルタ層を提案する。
効率的な線形リカレント層と同様に、Kalmanフィルタ層は並列スキャンを使用してシーケンシャルデータを処理している。
実験により、不確実性推論が意思決定の鍵となる問題においてカルマンフィルタ層が優れており、他のステートフルモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:40:35 GMT)
Learning to Defer for Causal Discovery with Imperfect Experts [59.1] L2D-CDは、専門家の推薦の正しさを測り、データ駆動因果発見結果と最適に組み合わせる手法である。
我々は,標準T"ubingenペアデータセット上でL2D-CDを評価し,因果探索法と分離に用いる専門家の双方と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:55:53 GMT)
Boost, Disentangle, and Customize: A Robust System2-to-System1 Pipeline for Code Generation [58.8] 大規模言語モデル(LLM)は、様々な領域、特にシステム1タスクにおいて顕著な機能を示した。
System2-to-System1法に関する最近の研究が急増し、推論時間計算によるシステム2の推論知識が探索された。
本稿では,システム2タスクの代表的タスクであるコード生成に注目し,主な課題を2つ挙げる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:20:50 GMT)
Not-So-Optimal Transport Flows for 3D Point Cloud Generation [58.2] 3次元点雲の生成モデルの学習は、3次元点雲の生成学習における根本的な問題の1つである。
本稿では,最近提案された同変OTフローを解析し,点ベース分子データに対する置換不変な生成モデルを学習する。
提案手法は, 広範囲な非条件生成および形状完備化において, 拡散および流動に基づく事前アプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:37:34 GMT)
Multi-Attribute Steering of Language Models via Targeted Intervention [56.9] 推論時間介入(ITI)は,大規模言語モデル(LLM)の振る舞いを特定の方向に操るための有望な手法として登場した。
マルチ属性・ターゲットステアリング(MAT-Steer)は,複数の属性をまたいだトークンレベルの選択的介入を目的とした,新しいステアリングフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:27:23 GMT)
Stepwise Perplexity-Guided Refinement for Efficient Chain-of-Thought Reasoning in Large Language Models [56.4] CoT推論は大規模言語モデル(LLM)の性能を大幅に向上させた。
本稿では,その重要性の尺度としてパープレキシティを用いた批判的推論ステップの同定手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:04:51 GMT)
Gradient Equilibrium in Online Learning: Theory and Applications [56.0] 勾配平衡は標準オンライン学習法によって達成される。
勾配平衡は、オンライン予測問題において解釈可能かつ有意義な性質に変換される。
勾配平衡フレームワークは,ブラックボックス予測の偏りを緩和する手法の開発に利用できることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:39:54 GMT)
MaxSup: Overcoming Representation Collapse in Label Smoothing [55.1] ラベル平滑化(LS)は、ニューラルネットワークの予測における過信を抑制し、一般化を促進するために広く採用されている。
以前の研究では、LSは特徴表現を過剰に厳密なクラスタに強制し、クラス内の区別を損なうことが示されている。
我々は、意図した正規化を正しい予測と誤予測の両方に均一に適用するMax Suppression(MaxSup)を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:10:34 GMT)
EquiBench: Benchmarking Code Reasoning Capabilities of Large Language Models via Equivalence Checking [54.4] 本稿では,大規模言語モデルのコード推論能力を評価する新しい手法として等価チェックの課題を提案する。
EquiBenchは、4つのプログラミング言語と6つの等価カテゴリにまたがる2400のプログラムペアのデータセットである。
その結果,OpenAI o3-miniの精度は78.0%と高いことがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:54:25 GMT)
LLMs Can Easily Learn to Reason from Demonstrations Structure, not content, is what matters! [53.8] 大推論モデル(LRM)は、長いチェーン・オブ・シント(Long CoT)に従うことによって複雑な推論問題に取り組む
また,Large Language Model (LLM) は,データ効率の教師付き微調整 (SFT) とパラメータ効率の低い低ランク適応 (LoRA) により,Long CoT推論を効果的に学習できることを見出した。
たった17kのCoTトレーニングサンプルで、Qwen2.5-32B-Instructモデルは、幅広い数学およびコーディングベンチマークで大幅に改善されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:20:33 GMT)
KL Penalty Control via Perturbation for Direct Preference Optimization [53.7] 我々は、KLのペナルティ強度を各選好ペアに対して適応的に制御できる$varepsilon$-Direct Preference Optimization (varepsilon$-DPO)を提案する。
実験の結果、$varepsilon$-DPOは既存の直接アライメントアルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:44:10 GMT)
Reasoning-Augmented Conversation for Multi-Turn Jailbreak Attacks on Large Language Models [53.6] Reasoning-Augmented Conversationは、新しいマルチターンジェイルブレイクフレームワークである。
有害なクエリを良心的な推論タスクに再構成する。
RACEは,複雑な会話シナリオにおいて,最先端攻撃の有効性を実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:47:19 GMT)
IM360: Textured Mesh Reconstruction for Large-scale Indoor Mapping with 360$^\circ$ Cameras [53.5] 室内環境の3次元マッピングとレンダリングのための360ドルのカメラのための新しい3D再構成パイプラインを提案する。
我々のアプローチ(IM360)は全方位画像の広い視野を活用し、球面カメラモデルをSfMパイプラインのすべてのコアコンポーネントに統合する。
Matterport3DとStanford2D3Dデータセットから大規模屋内シーンのパイプラインを評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:15:19 GMT)
Algorithmic causal structure emerging through compression [53.5] 因果関係,対称性,圧縮の関係について検討する。
我々は、学習と圧縮の既知の関係を因果モデルが識別できないような環境に構築し、一般化する。
我々はアルゴリズム因果関係を因果関係の代替的定義として定義する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:45:16 GMT)
Advancing Generative Artificial Intelligence and Large Language Models for Demand Side Management with Internet of Electric Vehicles [52.4] 本稿では,大規模言語モデル(LLM)のエネルギー管理への統合について検討する。
本稿では、自動問題定式化、コード生成、カスタマイズ最適化のために、LLMを検索拡張生成で強化する革新的なソリューションを提案する。
本稿では,電気自動車の充電スケジューリングと最適化における提案手法の有効性を示すケーススタディを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:08:55 GMT)
HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit [52.1] 現在のヒューマノイド遠隔操作システムは、信頼性の高い低レベル制御ポリシーを欠いているか、または正確な全身制御コマンドを取得するのに苦労している。
本稿では,ヒューマノイドのロコ操作ポリシと低コストなエクソスケルトン型ハードウェアシステムを統合した,新しいヒューマノイド遠隔操作コックピットを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:33:38 GMT)
REALTALK: A 21-Day Real-World Dataset for Long-Term Conversation [52.0] 本稿では、21日間のメッセージアプリ対話のコーパスであるREALTALKを紹介する。
EI属性とペルソナの整合性を比較し,現実世界の対話による課題を理解する。
その結果,モデルでは対話履歴のみからユーザをシミュレートすることが困難であり,特定のユーザチャットの微調整はペルソナのエミュレーションを改善することがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:29:01 GMT)
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides [51.9] そこで本研究では,人案に触発された2段階の編集手法を提案し,プレゼンテーションを自動的に生成する。
PWTAgentはまず参照を分析し、スライドレベルの関数型とコンテンツスキーマを抽出し、選択した参照スライドに基づいて編集アクションを生成する。
PWTAgentは、既存の3次元のプレゼンテーション生成方法よりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:18:53 GMT)
S$^2$R: Teaching LLMs to Self-verify and Self-correct via Reinforcement Learning [51.8] S$2$Rはモデルに推論時の自己検証と自己正当性を教えることによってLLM推論を強化する効率的なフレームワークである。
以上の結果から,Qwen2.5-math-7Bの精度は51.0%から81.6%に向上した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:40:22 GMT)
DAMamba: Vision State Space Model with Dynamic Adaptive Scan [51.8] 状態空間モデル(SSM)は近年、コンピュータビジョンにおいて大きな注目を集めている。
スキャン順序と領域を適応的に割り当てるデータ駆動型動的適応スキャン(DAS)を提案する。
DASをベースとしたビジョンバックボーンDAMambaの提案は,現在のビジョンタスクにおけるMambaモデルよりもはるかに優れている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:12:47 GMT)
Speech-FT: A Fine-tuning Strategy for Enhancing Speech Representation Models Without Compromising Generalization Ability [51.6] 音声-FTは、モデルマージを利用した音声表現モデルの戦略であり、微調整の恩恵を受けながら、一般化能力を維持する。
音声-FTは様々な微調整シナリオで有効であり、様々な種類の音声表現モデルと互換性がある。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:23:42 GMT)
Personalized Image Generation with Deep Generative Models: A Decade Survey [51.3] 本稿では、様々な生成モデルにまたがって、一般化されたパーソナライズされた画像生成についてレビューする。
まず、異なる生成モデル間でパーソナライズプロセスを標準化する統合フレームワークを定義する。
次に、各生成モデルにおけるパーソナライズ手法の詳細な分析を行い、そのユニークな貢献と革新を強調します。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:34:04 GMT)
Logarithmic Regret for Online KL-Regularized Reinforcement Learning [51.1] KL正規化は、大規模言語モデルにおけるRL微調整の効率向上に重要な役割を果たしている。
経験的優位性にもかかわらず、KL-正則化RLと標準RLの理論的相違はほとんど未探索のままである。
楽観的なKL正規化オンライン文脈帯域幅アルゴリズムを提案し,その後悔の新たな分析法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:55:04 GMT)
Probing Visual Language Priors in VLMs [51.0] 我々は,意図的に分布外画像を特徴付けるベンチマークであるViLPを紹介した。
ViLPの各質問には、3つの潜在的な答えと3つの対応するイメージが結合される。
本稿では,モデルが新たなVQAデータを生成し,ピクセルレベルおよびセマンティックな汚職を適用して,自己学習のための「良いバッド」画像ペアを生成する自己改善フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:37:23 GMT)
SmartAgent: Chain-of-User-Thought for Embodied Personalized Agent in Cyber World [50.9] COUT(Chain-of-User-Thought)は、新しい推論パラダイムである。
我々は、サイバー環境を認識し、パーソナライズされた要求を推論するエージェントフレームワークであるSmartAgentを紹介する。
我々の研究は、まずCOUTプロセスを定式化し、パーソナライズされたエージェント学習を具体化するための予備的な試みとして役立ちます。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:04:16 GMT)
Computational-Statistical Tradeoffs at the Next-Token Prediction Barrier: Autoregressive and Imitation Learning under Misspecification [50.7] 対数損失を伴う次のトーケン予測は自己回帰シーケンスモデリングの基盤となる。
次トーケン予測は、適度な誤差増幅を表す$C=tilde O(H)$を達成するために堅牢にすることができる。
C=e(log H)1-Omega(1)$。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:52:00 GMT)
Locality-aware Cross-modal Correspondence Learning for Dense Audio-Visual Events Localization [50.1] オーディオ・ビジュアル・イベント(DAVE)のための局所性を考慮したクロスモーダル対応学習フレームワークLoCoについて述べる。
LoCo は局所性対応対応補正 (LCC) を非モーダル特徴に適用する。
さらにクロスモーダル・ダイナミック・パーセプション・レイヤ(CDP)をクロスモーダル・フィーチャー・ピラミッドでカスタマイズし、音声視覚イベントの局所的時間パターンを理解する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:22:14 GMT)
Beyond Profile: From Surface-Level Facts to Deep Persona Simulation in LLMs [50.1] 本稿では,キャラクタの言語パターンと特徴的思考過程の両方を再現するモデルであるキャラクタボットを紹介する。
ケーススタディとしてLu Xunを用いて、17冊のエッセイコレクションから得られた4つのトレーニングタスクを提案する。
これには、外部の言語構造と知識を習得することに焦点を当てた事前訓練タスクと、3つの微調整タスクが含まれる。
言語的正確性と意見理解の3つのタスクにおいて、キャラクタボットを評価し、適応されたメトリクスのベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:11:54 GMT)
Towards Text-Image Interleaved Retrieval [50.0] テキスト画像検索(TIIR)タスクを導入し、クエリと文書をインターリーブしたテキスト画像シーケンスとする。
我々は、自然にインターリーブされたwikiHowチュートリアルに基づいてTIIRベンチマークを構築し、インターリーブされたクエリを生成するために特定のパイプラインを設計する。
異なる粒度で視覚トークンの数を圧縮する新しいMMEを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:00:47 GMT)
SoFar: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation [49.9] 本稿では,自然言語を用いたオブジェクト指向を参照フレームフリーで定義するセマンティック・オリエンテーションの概念を紹介する。
セマンティック・オリエンテーションをVLMシステムに統合することにより、ロボットは位置制約と向き制約の両方で操作動作を生成できる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:59:02 GMT)
Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.8] 我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。
MeCoは表現空間の高レベル認知信号をキャプチャし、ツールを呼び出すタイミングを指示する。
実験の結果,MeCoはLSMの内部認知信号を正確に検出し,ツール使用による意思決定を大幅に改善することがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:45:01 GMT)
Inference-Time Computations for LLM Reasoning and Planning: A Benchmark and Insights [49.4] 本稿では,大規模言語モデル(LLM)の複雑な課題解決における推論と計画能力について検討する。
近年の推論時間技術の発展は,LLM推論を追加訓練なしで向上させる可能性を示している。
OpenAIのo1モデルは、マルチステップ推論と検証の新たな使用を通じて、有望なパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:11:29 GMT)
CausalGraph2LLM: Evaluating LLMs for Causal Queries [49.3] CausalGraph2LLMは、さまざまな因果グラフ設定にまたがる700万以上のクエリからなるベンチマークである。
この領域ではLSMは有望であるが, 使用するエンコーディングに非常に敏感であることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:19:24 GMT)
G-Refer: Graph Retrieval-Augmented Large Language Model for Explainable Recommendation [48.2] 本稿では,グラフ検索拡張大言語モデル (LLM) を用いた提案手法を提案する。
G-Referは、説明可能性と安定性の両方において既存の手法と比較して優れた性能を達成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:42:38 GMT)
AGrail: A Lifelong Agent Guardrail with Effective and Adaptive Safety Detection [47.8] 我々は,エージェントの安全性を高めるため,生涯のガードレールであるAGrailを提案する。
AGrailは適応型安全チェック生成、効果的な安全チェック最適化、ツールの互換性と柔軟性を備えている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:37:44 GMT)
On-Policy Self-Alignment with Fine-grained Knowledge Feedback for Hallucination Mitigation [47.4] 幻覚は、大きな言語モデルが応答生成時の知識の境界から逸脱する振る舞いを示すときに起こる。
従来の学習に基づく手法はモデルを微調整しようとするが、非政治的なサンプリングと粗い粒度のフィードバックによって制限される。
RLFHは、LLMが自らの知識境界と自己正しい生成挙動を積極的に探求することを可能にする、政治上の自己調整手法である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:00:17 GMT)
Facilitating Long Context Understanding via Supervised Chain-of-Thought Reasoning [47.3] 我々は,Large Language Models (LLMs) にChain-of-Thought推論を統合して,効果的な長文理解を容易にする。
既存の長文合成データとは異なり、LongFinanceQAは最終結論の前に中間的なCoT推論を含む。
我々は,LongベンチマークでGPT-4o-mini w/PAIを評価し,標準GPT-4o-miniを20.0%上回るPAIの推論能力を評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:50:06 GMT)
A3: Android Agent Arena for Mobile GUI Agents [46.7] モバイルGUIエージェントは、モバイルデバイス上で自律的にタスクを実行するように設計されている。
Android Agent Arena (A3)は、現実の、開発中のタスクのパフォーマンスを評価するための、新しい評価プラットフォームである。
A3には、広く使われている21の一般サードパーティアプリと、一般的なユーザシナリオを表す201のタスクが含まれている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:24:59 GMT)
A Physical Coherence Benchmark for Evaluating Video Generation Models via Optical Flow-guided Frame Prediction [46.7] 本稿では,生成されたビデオの物理コヒーレンスを評価するためのベンチマークPhyCoBenchを紹介する。
われわれのベンチマークでは、120のプロンプトが7つのカテゴリの物理原理をカバーし、ビデオコンテンツで観察できる重要な物理法則を捉えている。
本稿では,光学フローと映像フレームをカスケード的に生成する拡散モデルであるPhyCoPredictorを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:07:09 GMT)
Causal Learning for Trustworthy Recommender Systems: A Survey [46.4] 本稿では、因果学習の観点から、信頼に値するRS(TRS)の概要を述べる。
それぞれの段階における潜在的信頼性の課題を特定し、それらを有効な因果解にリンクする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:36:34 GMT)
SafeDialBench: A Fine-Grained Safety Benchmark for Large Language Models in Multi-Turn Dialogues with Diverse Jailbreak Attacks [46.3] 大規模言語モデル(LLM)の安全性を評価するための詳細なベンチマーク SafeDialBench を提案する。
具体的には,6つの安全次元を考慮した2階層型階層型安全分類法を設計し,22の対話シナリオの下で中国語と英語の双方で4000以上のマルチターン対話を生成する。
特に,LLMの革新的なアセスメントフレームワークを構築し,安全でない情報を検出し,処理し,ジェイルブレイク攻撃時の一貫性を維持する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:05:15 GMT)
VC Search: Bridging the Gap Between Well-Defined and Ill-Defined Problems in Mathematical Reasoning [46.3] 5000以上の不確定な数学的問題を含むPMC(Issue with Missing and Contradictory conditions)というベンチマークを開発した。
VCSEARCHは、解決不可能な問題を特定する精度を、さまざまな大きな言語モデルで少なくとも12%向上させる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:14:48 GMT)
MoBA: Mixture of Block Attention for Long-Context LLMs [46.1] 汎用人工知能(AGI)に向けた大規模言語モデル(LLM)の進展に有効な文脈長のスケーリングが不可欠である
既存のアプローチでは、タスク固有のシンクやウィンドウアテンションなどの強いバイアスのある構造を課すか、あるいは、アテンションメカニズムを線形近似に根本的に変更する。
そこで本研究では,より少ない構造原理に固執する解を提案し,モデルが自律的に出席する場所を決定する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:06:05 GMT)
Improving Chain-of-Thought Reasoning via Quasi-Symbolic Abstractions [46.0] CoT(Chain-of-Though)は、大規模言語モデルにおける推論のための一般的な戦略である。
準シンボリックな説明を通じて,LLMを高レベルの抽象化で動作させる,CoTのバリエーションであるQuaSARを提案する。
実験の結果,準記号的抽象化はCoT法を最大8%精度で改善できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:58:48 GMT)
Score-Based Diffusion Policy Compatible with Reinforcement Learning via Optimal Transport [45.8] 拡散政策は、デモから複雑な振る舞いを学ぶ際に有望であることを示している。
本稿では,環境とのオンラインインタラクションによる拡散型模倣学習モデルの改善について検討する。
最適輸送理論を用いた拡散ポリシをRLと統合する新しい手法OTPRを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:22:20 GMT)
Bring Your Own Knowledge: A Survey of Methods for LLM Knowledge Expansion [45.4] 大規模言語モデル(LLM)を新しい多様な知識に適応させることは、現実世界のアプリケーションにおける持続的な有効性に不可欠である。
本調査は, 事実情報, ドメイン知識, 言語習熟度, ユーザの嗜好など, さまざまな知識タイプを統合することに焦点を当てる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:15:28 GMT)
Trust Me, I'm Wrong: High-Certainty Hallucinations in LLMs [45.1] LLM(Large Language Models)はしばしば、幻覚として知られる実世界の事実に根ざしていない出力を生成する。
モデルが正しい知識を持つ場合でも、高い確実性で幻覚できることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:46:31 GMT)
Learning the symmetric group: large from small [45.0] 置換予測を訓練したトランスフォーマーニューラルネットは、100%近い精度で対称群$S_25$に一般化できることを示す。
可変語長を管理するためのキーツールとしてアイデンティティ拡張を採用し、隣接する転置のトレーニングには分割ウィンドウを用いる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:28:25 GMT)
Green LIME: Improving AI Explainability through Design of Experiments [45.0] Local Interpretable Model-Agnostic Explanations (LIME)は、興味のあるインスタンスの近くで新しいデータポイントを生成し、それらをモデルに渡すことによって、説明を提供する。
LIMEは非常に多用途であり、幅広いモデルやデータセットに適用できる。
実験の手法を最適に設計することにより、複素モデルの関数評価の回数を減らすことができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:15:04 GMT)
StepTool: Enhancing Multi-Step Tool Usage in LLMs through Step-Grained Reinforcement Learning [45.0] 動的意思決定タスクとしてモデリングツール学習を提案する。
StepToolは,段階的な強化学習フレームワークである。
StepToolは、既存のメソッドを多段階のツールベースのタスクで大幅に上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:57:41 GMT)
CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image [44.8] 現在のメソッドはドメイン固有の制限や低品質のオブジェクト生成に悩まされることが多い。
本稿では,3次元シーンの復元と復元のための新しい手法であるCASTを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:29:52 GMT)
Self-Supervised Transformers as Iterative Solution Improvers for Constraint Satisfaction [44.7] 制約満足度問題(CSP)のためのトランスフォーマーベースのフレームワークを提案する。
CSPは多くのアプリケーションで利用されており、機械学習によるソリューションの高速化は幅広い関心を集めている。
本稿では,Transformerをソリューションリファインダとして活用する自己教師型フレームワークであるConsFormerを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:51:01 GMT)
Soundwave: Less is More for Speech-Text Alignment in LLMs [44.1] 音声とテキストの間には、表現空間ギャップとシーケンス長の不整合という2つの基本的な問題に焦点をあてる。
本稿では,これらの問題に対処するために,効率的なトレーニング戦略と新しいアーキテクチャを利用するSoundwaveを提案する。
Soundwaveは、トレーニングデータの5分の1しか使用せず、音声翻訳やAIR-Bench音声タスクにおいて、高度なQwen2-Audioよりも優れています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:36:39 GMT)
VidCapBench: A Comprehensive Benchmark of Video Captioning for Controllable Text-to-Video Generation [44.1] 本稿では,T2V生成に特化して設計されたビデオキャプション評価手法であるVidCapBenchを紹介する。
VidCapBenchは、収集された各ビデオと、ビデオの美学、コンテンツ、動き、および物理法則に関する重要な情報とを関連付ける。
既存のビデオキャプション評価手法と比較して, VidCapBench の安定性と包括性を示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:42:17 GMT)
Who Writes What: Unveiling the Impact of Author Roles on AI-generated Text Detection [44.1] 本稿では,社会言語学的属性・ジェンダー,CEFR習熟度,学術分野,言語環境に影響を及ぼすAIテキスト検出装置について検討する。
CEFRの習熟度と言語環境は一貫して検出器の精度に影響を与え,性別や学術分野は検出器に依存した効果を示した。
これらの発見は、特定の人口集団に不公平に罰を与えるのを避けるために、社会的に認識されたAIテキストの検出が不可欠であることを示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:49:31 GMT)
Differentiable Physics-based System Identification for Robotic Manipulation of Elastoplastic Materials [44.0] 本研究は, ロボットアームが簡単な操作動作と不完全な3次元点雲を用いて, 弾塑性材料の物理パラメータと環境を推測することのできる, 微分可能物理に基づくシステム同定(DPSI)フレームワークを提案する。
1つの現実世界の相互作用だけで、推定されたパラメータは、目に見えない、長い水平運動によって引き起こされる視覚的および物理的に現実的な振る舞いを正確にシミュレートすることができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:35:55 GMT)
Second-Order Fine-Tuning without Pain for LLMs:A Hessian Informed Zeroth-Order Optimizer [43.9] 古典的な1次メモリを備えた細調整の大型言語モデル(LLM)は、バックプロパゲーションプロセスによって禁止的なGPUを必要とする。
最近の研究は微調整のためのゼロオーダーに変化しており、2つのフォワードパスを使用することでかなりのメモリを節約している。
本研究では, 対角的ヘッセン情報に基づくゼロ階軌道であるHiZOOを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:45:50 GMT)
Pre-training Auto-regressive Robotic Models with 4D Representations [43.8] ARM4Rは、人間のビデオデータから学んだ低レベルの4D表現を利用して、より優れた事前訓練されたロボットモデルを生成する自動回帰ロボットモデルである。
実験の結果、ARM4Rは人間のビデオデータからロボットへ効率よく転送でき、さまざまなロボット環境や構成におけるタスクのパフォーマンスを継続的に改善できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:59:01 GMT)
Distinguishing Ignorance from Error in LLM Hallucinations [43.6] モデルがパラメータに正しい答えを持たない場合、HK-と呼ばれる場合、HK+と呼ばれる必要な知識があるにもかかわらず、モデルが正しく答えない場合の2つのタイプの幻覚を区別する。
モデル固有の幻覚データセットの構築をモチベーションとし,異なるモデルが異なる例に幻覚を呈することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:52:52 GMT)
VLMaterial: Procedural Material Generation with Large Vision-Language Models [43.6] 手続き資料を標準Pythonプログラムに変換する能力を活用している。
我々は、入力画像からそのようなプログラムを生成するために、事前学習された大規模な視覚言語モデルを微調整する。
本手法は, 合成実例と実例の両方において, 従来の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:53:58 GMT)
MS-HuBERT: Mitigating Pre-training and Inference Mismatch in Masked Language Modelling methods for learning Speech Representations [43.5] MS-HuBERTは、堅牢な音声表現を学習するためのエンドツーエンドの自己教師付き事前学習手法である。
ASR Librispeechベンチマークでバニラの HuBERT を平均5%の差で上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:07:36 GMT)
JOOCI: a Framework for Learning Comprehensive Speech Representations [43.5] JOOCIは、どちらの情報にも表現深度を損なうことのない、新しい音声表現学習法である。
JOOCIは、2つの話者認識と2つの言語タスクで評価された場合、WavLMの26.5%、および同様のサイズのモデル(100Mパラメータ)を上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:09:55 GMT)
Alternating Regret for Online Convex Optimization [43.1] 連続Hedgeアルゴリズムは,任意の逆数$次元OCO問題に対して,$tildemathcalO(dfrac23Tfrac13)$の繰り返し後悔を実現することを示す。
例えば、Regret Matching 変種に対する$Omega(sqrtT)$ lower boundなどである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:32:52 GMT)
Urinary Tract Infection Detection in Digital Remote Monitoring: Strategies for Managing Participant-Specific Prediction Complexity [43.1] 尿路感染症(UTIs)は特に認知症(PLWD)の患者にとって重要な健康上の問題である
この研究は、PLWDのUTIを検出する機械学習(ML)を利用した以前の研究に基づいている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:01:55 GMT)
Solving reaction dynamics with quantum computing algorithms [42.4] 線形応答によって支配される異なる反応を記述することに関連する応答関数の量子アルゴリズムについて検討する。
我々は原子核物理学の応用に焦点をあて、格子上の量子ビット効率のマッピングを検討し、現実的な散乱シミュレーションに必要な大量の量を効率的に表現することができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:06:54 GMT)
Understanding and Evaluating Hallucinations in 3D Visual Language Models [42.4] 3D-LLMは、インテリジェンスとシーン理解の複雑なタスクに取り組むために提案されている。
幻覚の影響が大きい。
本研究は、3D-LLMにおける幻覚に関する最初の体系的研究である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:15:43 GMT)
Proactive Conversational Agents with Inner Thoughts [42.3] 会話型AIにおける長年の願望の1つは、会話において自律的にイニシアティブ、すなわち積極的に行動できるようにすることである。
以前のNLP研究は、主に前の会話のような文脈から次の話者を予測することに焦点を当てていた。
我々は、人間と同じように、単にターンテイクの手がかりに反応するのではなく、プロアクティブなAIが会話中に自身の内的思考を定式化し、貢献する適切な瞬間を求めることを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:53:06 GMT)
Evaluating ML Robustness in GNSS Interference Classification, Characterization & Localization [42.1] ジャミング装置はグローバルナビゲーション衛星システム(GNSS)からの信号を妨害する
本稿では、低周波アンテナから得られたスナップショットからなる広範囲なデータセットを提案する。
本研究の目的は,機械学習モデル(ML)の環境変化に対するレジリエンスを評価することである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:24:25 GMT)
Myna: Masking-Based Contrastive Learning of Musical Representations [41.9] 我々は、自己教師付き音楽表現学習のためのシンプルで効果的なアプローチであるMynaを提案する。
Myna氏は2つの重要なイノベーションを紹介している。メル-スペクトログラムをバックボーンとして使用するビジョントランスフォーマー(ViT)と、スペクトログラムトークンの90%をマスクするトークンマスキングだ。
私たちのハイブリッドモデルであるMyna-22M-Hybridは16x16と128x2のパッチを処理し、最先端の結果を得る。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:54:25 GMT)
RuozhiBench: Evaluating LLMs with Logical Fallacies and Misleading Premises [41.4] 本稿では,677質問を慎重に整理したデータセットであるRuozhiBenchについて紹介する。
我々は,LuozhiBench上の5シリーズから17の大規模言語モデル (LLM) を評価する。
LLMは論理的誤りを検出・推論する能力に限界を示し、最も優れたモデルであるClaude-3-haikuでさえも90%以上のヒトと比較して62%の精度しか達成できなかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:47:11 GMT)
WMT24++: Expanding the Language Coverage of WMT24 to 55 Languages & Dialects [41.4] WMT24データセットを55言語に拡張し、新しい人書き参照と46の新しい言語と方言に対する後編集を収集する。
データセットには、文学、ニュース、社会、スピーチの4つの領域が含まれている。
収集したデータセット上で,各種MTプロバイダとLLMを自動メトリクスを用いてベンチマークし,LLMが全55言語で最高のパフォーマンスのMTシステムであることが確認された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:39:30 GMT)
RAD: Training an End-to-End Driving Policy via Large-Scale 3DGS-based Reinforcement Learning [41.1] 既存のエンドツーエンドの自動運転アルゴリズムは、通常、Imitation Learning(IL)パラダイムに従っている。
本研究では、3DGSに基づく閉ループ強化学習(RL)訓練パラダイムを確立する。
本稿では,これまで見えなかった多様な3DGS環境からなるクローズドループ評価ベンチマークを提案する。
ILベースの手法と比較して、RADは閉ループのほとんどの測定値、特に3倍の衝突速度でより高い性能を達成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:59:21 GMT)
Text2World: Benchmarking Large Language Models for Symbolic World Model Generation [41.0] ドメイン定義言語(PDDL)に基づいた新しいベンチマークであるText2Worldを導入する。
大規模強化学習で訓練された推論モデルは、他よりも優れていることがわかった。
これらの知見に基づいて,LLMの世界モデリング能力を高めるためのいくつかの有望な戦略について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:59:48 GMT)
SearchRAG: Can Search Engines Be Helpful for LLM-based Medical Question Answering? [40.8] 本稿では,リアルタイム検索エンジンを活用した制約を克服する新しいフレームワークであるSearchRAGを提案する。
本手法では,複雑な医療質問を検索エンジンフレンドリなクエリに変換するために,合成クエリ生成を用いる。
実験結果から,本手法は医療質問応答タスクの応答精度を有意に向上することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:12:15 GMT)
SimPER: A Minimalist Approach to Preference Alignment without Hyperparameters [40.6] SimPERは言語モデルアライメントのための効果的な選好最適化アルゴリズムである。
SimPERは実装が容易で、高価なハイパーパラメータチューニングと参照モデルを必要としない。
SimPERは、既存のアプローチよりも一貫して、大幅に優れています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:09:35 GMT)
MatterChat: A Multi-Modal LLM for Material Science [40.3] マルチモーダルな多モード言語モデルであるMatterChatを紹介する。
そこで,MatterChatは材料特性予測と人間-AIインタラクションの性能を大幅に向上させることを示す。
また、より高度な科学的推論やステップバイステップの物質合成などの応用においても有用性を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:19:36 GMT)
Graph Neural Networks for Databases: A Survey [40.3] グラフ計算ネットワーク(GNN)はグラフデータのための強力なディープラーニングモデルであり、さまざまな領域で顕著な成功を収めている。
近年、データベース(DB)コミュニティは、GNNの可能性をますます認識し、GNNベースのアプローチによるデータベースシステムの改善に焦点を当てた研究が急増している。
本調査は,DBシステムにおけるGNNの構造的かつ詳細な概要を提供することで,このギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:51:50 GMT)
Label Drop for Multi-Aspect Relation Modeling in Universal Information Extraction [39.8] ユニバーサルインフォメーション抽出(UIE)は、モデル爆発問題に効果的に対処できるため、大きな注目を集めている。
本稿では,多視点関係モデリングとラベルドロップ機構を組み込んだLDNetを提案する。
実験によると、LDNetは9つのタスク、33のデータセットで最先端のシステムよりも優れているか、競争力を発揮する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:53:26 GMT)
Reinforcement Learning for Dynamic Resource Allocation in Optical Networks: Hype or Hope? [39.8] 光ネットワークにおける動的資源配分への強化学習の適用は、近年の激しい研究活動の焦点となっている。
本稿では、この分野の進歩を概観し、ベンチマークの実践とソリューションにおける大きなギャップを明らかにする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:09:42 GMT)
Characterizing randomness in parameterized quantum circuits through expressibility and average entanglement [39.6] 量子回路(PQC)は、その主応用の範囲外ではまだ完全には理解されていない。
我々は、量子ビット接続性に関する制約の下で、PQCにおけるランダム状態の生成を分析する。
生成した状態の分布の均一性の増加と絡み合いの発生との間には,どれだけ急激な関係があるかを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:53:09 GMT)
TS40K: a 3D Point Cloud Dataset of Rural Terrain and Electrical Transmission System [39.2] TS40Kは欧州の農村部にある電気通信システムで4万Kmを超える3Dポイントクラウドデータセットである。
これは、電力グリッド検査のリスクの高いミッションを支援する研究コミュニティにとって、新しい問題であるだけでなく、自動運転や屋内の3Dデータとは異なる特徴を持つ3Dポイントクラウドも提供する。
本研究では,3次元セマンティックセグメンテーションと3次元オブジェクト検出に関するデータセット上での最先端手法の性能を評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:03:28 GMT)
SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models [39.2] 本稿では,画像キャプチャペアを生成するための新しいデータ合成とキュレーション手法であるSynthVLMを紹介する。
SynthVLMのパワーを実証するため,SynthVLM-100Kを導入した。
モデルと人両方の評価において、SynthVLM-100Kは従来の実世界のデータセットよりも優れています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:45:04 GMT)
Enhancing Power Grid Inspections with Machine Learning [39.1] 本稿では3次元コンピュータビジョンを用いた電力グリッド検査の自動化について検討する。
3Dセマンティックセグメンテーションに集中することにより、クラス不均衡やノイズの多いデータといった課題に対処する。
ベンチマークの結果は、大幅なパフォーマンス改善を示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:49:47 GMT)
Large Language Models as Evaluators for Conversational Recommender Systems: Benchmarking System Performance from a User-Centric Perspective [38.9] 本研究では,LCMを用いたCRS自動評価フレームワークを提案する。
これは、人間とコンピュータの相互作用と心理学に関する既存の研究に基づいている。
このフレームワークを用いて、4つの異なる対話レコメンデーションシステムを評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:46:28 GMT)
Bayesian Low-Rank LeArning (Bella): A Practical Approach to Bayesian Neural Networks [38.8] ベイズニューラルネットワーク(BNN)の計算負担を軽減するための革新的な枠組みを導入する。
提案手法は,ディープアンサンブルに基づくベイズ的手法の原理に従っているが,事前学習されたニューラルネットワークから生じるパラメータの低ランク摂動により,コストを大幅に削減する。
バニラ版のアンサンブルと、Stein Variational Gradient Descent (SVGD)を用いたベイズ学習のようなより洗練されたスキームは、提案フレームワーク内でシームレスに実装できる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:44:35 GMT)
PartSDF: Part-Based Implicit Neural Representation for Composite 3D Shape Parametrization and Optimization [38.8] PartSDFは教師付き暗黙の表現フレームワークで、独立して制御可能なパーツで合成形状を明示的にモデル化する。
PartSDFは、再構築および生成タスクにおいて、教師なしベースラインと教師なしベースラインの両方を上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:08:47 GMT)
SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models [38.7] 我々は,MLLMが自然言語の短い質問に答える事実性を評価するための,最初の総合的なベンチマークであるSimpleVQAを紹介する。
SimpleVQAは、複数のタスクと複数のシナリオをカバーすること、高品質で挑戦的なクエリを保証すること、静的でタイムレスな参照回答を維持すること、そして評価しやすいこと、の6つの重要な特徴によって特徴付けられる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:04:26 GMT)
SymAgent: A Neural-Symbolic Self-Learning Agent Framework for Complex Reasoning over Knowledge Graphs [38.5] SymAgentは、知識グラフと大規模言語モデルとの協調的な拡張を実現する革新的なニューラルシンボリックエージェントフレームワークである。
我々はKGを動的環境として概念化し、複雑な推論タスクを多段階の対話プロセスに変換することにより、KGが推論プロセスに深く参加できるようにする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:32:59 GMT)
RedundancyLens: Revealing and Exploiting Visual Token Processing Redundancy for Efficient Decoder-Only MLLMs [38.3] MLLM(Multimodal Large Language Model)の学習用フレームワークを提案する。
Probe-Activated Dynamic FFNとHollow Attentionで構成されており、ビジュアルトークンの計算の調整可能な削減を可能にする。
実験では、デコーダのみのMLLMに特有の、実質的で、構造化され、クラスタ化された冗長性を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:57:37 GMT)
RHINO: Learning Real-Time Humanoid-Human-Object Interaction from Human Demonstrations [38.2] RHINOは一般のヒューマノイド-ヒト-オブジェクト相互作用フレームワークである。
リアクティブモーション、命令ベースの操作、安全性に関する統一的なビューを提供する。
1)リアルタイムな人間の行動から人間の意図を推定するハイレベルプランナー,2)予測された意図に基づく反応行動とオブジェクト操作のスキルを達成する低レベルコントローラである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:56:41 GMT)
Elucidating Mechanisms of Demographic Bias in LLMs for Healthcare [38.0] 性別情報は中層に高度に局所化されており、パッチを当てることで推論時に確実に操作できることがわかった。
患者人種の表現は多少分散しているが、ある程度は介入することもできる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:40:40 GMT)
Contextual Linear Bandits with Delay as Payoff [37.6] コンテキスト線形帯域に対する遅延・アズ・ペイオフモデルについて検討する。
本稿では,標準の非遅延の場合と比較して,最大で$DDelta_maxlog T$の遅延オーバヘッドを持つ効率的なアルゴリズムを提案する。
ペイオフが損失である場合には、さらにバウンドの改善を示し、シュリッセルベルクらと同様の報酬と損失の分離を示す(2024年)。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:32:51 GMT)
CogSteer: Cognition-Inspired Selective Layer Intervention for Efficiently Steering Large Language Models [37.5] 大規模言語モデル(LLM)は、広範囲なデータに対する事前学習を通じて、優れたパフォーマンスを達成する。
基本的なメカニズムにおける解釈可能性の欠如は、特定のアプリケーションに対してLLMを効果的に操る能力を制限する。
本研究では,眼球運動計測を用いた認知的視点からLLMのメカニズムを考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:09:47 GMT)
Policy-to-Language: Train LLMs to Explain Decisions with Flow-Matching Generated Rewards [37.1] LLMに基づくモデルに依存しない説明生成器を構築する。
このLSMをトレーニングする報酬は、生成フローマッチングモデルによって生成される。
RLタスクとLLMタスクの両方の実験により、高額な人的フィードバックを節約しながら、高密度で効果的な報酬を生成できることが実証された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:34:45 GMT)
Multimodal Mamba: Decoder-only Multimodal State Space Model via Quadratic to Linear Distillation [36.4] mmMambaは、線形複雑でネイティブなマルチモーダル状態空間モデルを開発するためのフレームワークである。
提案手法は,訓練されたデコーダのみのMLLMを線形複雑度アーキテクチャへ直接変換することを可能にする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:59:57 GMT)
CartesianMoE: Boosting Knowledge Sharing among Experts via Cartesian Product Routing in Mixture-of-Experts [36.4] Mixture-of-Experts(MoE)モデルは、トレーニングや推論コストを大幅に高めることなく、モデルのサイズを拡大可能にする。
MoEモデルは、専門家間の知識共有に関する課題に直面し、そのパフォーマンスをルーティング精度に何らかの敏感にする。
本稿では,より効果的な知識共有を実現するCartesianMoEを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:00:04 GMT)
Lost in Transcription, Found in Distribution Shift: Demystifying Hallucination in Speech Foundation Models [36.3] 幻覚は特に医療、法務、航空などの高額な領域に関係している。
本研究では,分布変化やモデルサイズ,モデルアーキテクチャなどの要因が幻覚発生誤差率(HER)にどのように影響するかを検討する。
我々の研究は、ASRモデルの性能を評価するために、WERのような従来の指標とHERを併用することの重要性を強調した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:25:39 GMT)
Understanding Generalization in Transformers: Error Bounds and Training Dynamics Under Benign and Harmful Overfitting [36.1] ラベル付きフリップノイズをもつ2層変圧器の一般化理論を開発する。
信号-雑音比の異なるベニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグニグ
我々は、変圧器の試験誤差に影響を与える重要な要因を特定するために、広範囲な実験を行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:46:01 GMT)
Time-Irreversible Quantum-Classical Dynamics of Molecular Models in the Brain [36.1] この写本は、脳内の分子過程を研究する長期的なプロジェクトの中で、量子古典散逸理論を説明することを目的としている。
この理論は正式な要求のためではなく、脳のプロセスが分子、生理学、高機能レベルで散逸しているように見えるため、散逸しなくてはならない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:12:12 GMT)
Seed-Guided Topic Discovery with Out-of-Vocabulary Seeds [36.1] シード誘導されたトピック発見アプローチは、ユーザが提供するシードを利用してトピック表現の用語を発見する。
本稿では,シード誘導された話題発見の課題を一般化し,語彙外種子を許容する。
本研究では,PLMの一般的な知識と,入力コーパスから学習した局所的意味論を相互に活用する,SeeTopicという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:29:55 GMT)
Aspect-Guided Multi-Level Perturbation Analysis of Large Language Models in Automated Peer Review [36.1] 自動ピアレビューにおいて,大規模言語モデル(LLM)の堅牢性を評価するために,アスペクト誘導多段階摂動フレームワークを提案する。
我々のフレームワークは、ピアレビュープロセスペーパー、レビュー、そして、いくつかの品質面における反論の3つの重要な要素における摂動を探求する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:50:06 GMT)
Beyond Seen Data: Improving KBQA Generalization Through Schema-Guided Logical Form Generation [36.0] 知識ベース質問応答 (KBQA) は、大きなKBに格納された豊富な人間の知識を用いて、自然言語でユーザーの質問に答えることを目的としている。
本稿では,スキーマコンテキストをエンティティ検索や論理形式生成に注入する新しいモデルであるSG-KBQAを紹介する。
SG-KBQAは2つの一般的なベンチマークデータセット上で最先端のモデルよりも高い一般化性が得られることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:53:41 GMT)
RecDreamer: Consistent Text-to-3D Generation via Uniform Score Distillation [35.9] 現在のテキスト・ツー・3D生成法は幾何学的不整合に悩まされることが多く、3Dアセットの異なるポーズにまたがるパターンが繰り返される。
我々はRecDreamerというソリューションを提案し、より一貫性のあるポーズ表現を実現するために基礎となるデータ分布を再考する。
実験の結果、RecDreamerはマルチフェイス・ジャナス問題を効果的に緩和し、異なるポーズにまたがるより一貫性のある3Dアセット生成を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:42:55 GMT)
Enhancing the Capability and Robustness of Large Language Models through Reinforcement Learning-Driven Query Refinement [35.5] 大きな言語モデル(LLM)の、正直で無害で有用な応答を生成する能力は、ユーザープロンプトの品質に大きく依存している。
本研究では,LSMに入力される前にユーザプロンプトを洗練する,転送可能でプラグイン可能なフレームワークを提案する。
この戦略はクエリの品質を改善し、LCMにより誠実で良質で有用なレスポンスを生成する権限を与えます。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:06:14 GMT)
CityEQA: A Hierarchical LLM Agent on Embodied Question Answering Benchmark in City Space [35.2] EQA(Embodied Question Answering)は主に屋内環境に焦点を当てている。
本研究では,ダイナミックな都市空間における活発な探索を通じてオープンな語彙に答える新しい課題であるCityEQAを紹介する。
我々は,1,412の人的注釈付きタスクを含む最初のベンチマークデータセットであるCityEQA-ECを提示する。
また,CityEQA に適した新規エージェントである Planner-Manager-Actor (PMA) を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:36:15 GMT)
Towards Homogeneous Lexical Tone Decoding from Heterogeneous Intracranial Recordings [35.1] 神経表現のためのホモジニティ・ヘテロジニティ・ディサンタングルド・ラーニング(H2DiLR)は、複数の被験者の頭蓋内記録から同質性と異質性の両方を歪め、学習する新しいフレームワークである。
広汎な実験により、H2DiLRは統一復号法として従来の異種復号法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:28:03 GMT)
KazMMLU: Evaluating Language Models on Kazakh, Russian, and Regional Knowledge of Kazakhstan [35.0] KazMMLUは、カザフ語用に特別に設計された最初のMMLUスタイルのデータセットである。
STEM、人文科学、社会科学など、様々な教育レベルをカバーする23,000の質問が含まれている。
データセットには10,969のカザフスタン質問と12,031のロシア質問が含まれている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:48:37 GMT)
Exploring the Impact of Personality Traits on LLM Bias and Toxicity [34.5] 個人性が異なる大規模言語モデル(LLM)の「パーソナライゼーション」が研究の関心を集めている。
本研究では, 異なる性格特性をLSMに割り当てることが, アウトプットの毒性やバイアスに与える影響について検討した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:07:09 GMT)
Self-Enhanced Reasoning Training: Activating Latent Reasoning in Small Models for Enhanced Reasoning Distillation [34.5] 小型モデルでは, チェーン・オブ・シークレットがなくても, サンプリング中に高品質な推論経路を生成可能であることを示す。
小型モデルにおける潜在推論機能を活性化し活用する自己強化推論訓練(SERT)を提案する。
OpenAI の GPT-3.5 を教師モデルとして、GPT-2 モデルを学生モデルとして実験したところ、SERT が小モデルの推論能力を高めることが示されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:02:47 GMT)
From Principles to Applications: A Comprehensive Survey of Discrete Tokenizers in Generation, Comprehension, Recommendation, and Information Retrieval [34.4] 離散トークン化器は、現代の機械学習システムで必須のコンポーネントとして登場した。
本稿では、離散トークン化器の設計原理、応用、課題を体系的にレビューする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:29:51 GMT)
Triple Preference Optimization: Achieving Better Alignment using a Single Step Optimization [34.3] Triple Preference Optimization (TPO) は、推論能力と命令追従能力の両方を強化するために設計された新しい選好学習手法である。
TPOは、異なるデータセットサイズで応答長を大幅に増加させることなく、既存のメソッドよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:26:49 GMT)
CPRM: A LLM-based Continual Pre-training Framework for Relevance Modeling in Commercial Search [34.1] CPRMは、大規模言語モデル(LLM)の継続的な事前訓練のために設計されたフレームワークである
本フレームワークは3つのモジュールから構成される: 1) クエリとマルチフィールドアイテムを併用してドメイン知識を強化する,2) コンテキスト内事前学習を適用する,3) 関連するドメイン知識とバックグラウンド情報を生成する,という3つのモジュール。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:05:29 GMT)
RealSyn: An Effective and Scalable Multimodal Interleaved Document Transformation Paradigm [34.0] マルチモーダルなインターリーブド文書など、ペアリングされていない膨大な量のデータが、視覚言語表現学習に使われていない。
高品質な画像やテキストを抽出するリアルタイムデータ抽出パイプラインを構築した。
そして,各画像と複数の意味的関連現実的テキストを効率的に関連付ける階層的検索手法を設計する。
リアルテキストと合成テキストを組み合わせたデータセットであるRealSynを3つのスケールで構築する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:58:38 GMT)
On-Device Collaborative Language Modeling via a Mixture of Generalists and Specialists [34.0] CoMiGSは、少ないデータでデバイス上でプライベートな学習を容易にする新しいアプローチである。
さまざまな専門家をローカライズしながら、ユーザ間でジェネラリストの専門家のバランスをとる。
トークン生成毎に,CoMiGSは一般的な知識とパーソナライズされた知識のバランスを効果的に表す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:27:26 GMT)
Benchmarking and Improving Large Vision-Language Models for Fundamental Visual Graph Understanding and Reasoning [33.9] LVLM(Large Vision-Language Models)は、様々なタスクにまたがる顕著な性能を示す。
近年の研究では、LVLMは視覚グラフに係わる際にかなりの制限を受けることが示されている。
LVLMの基本的グラフ理解と推論能力を調べるための22のタスクをカバーするベンチマークであるVGCureを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:00:30 GMT)
RLEF: Grounding Code LLMs in Execution Feedback with Reinforcement Learning [33.8] エージェントとしてデプロイされる大規模言語モデル(LLM)は、必要な手動のエンゲージメントを最小限に抑えながら、複数のステップでユーザ指定タスクを解決する。
コード合成の領域における実行フィードバックを活用するためのモデル学習のためのエンドツーエンド強化学習手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:39:46 GMT)
Towards a Design Guideline for RPA Evaluation: A Survey of Large Language Model-Based Role-Playing Agents [33.4] ロールプレイングエージェント(Role-Playing Agent、RPA)は、様々なタスクにおいて人間のような振る舞いをシミュレートするLLMエージェントの一種である。
RPAの評価は多様なタスク要件とエージェント設計のために難しい。
本稿では, LLM に基づく RPA のためのエビデンスベース, 動作可能, 汎用的な評価設計ガイドラインを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:33:33 GMT)
Multilingual Language Model Pretraining using Machine-translated Data [33.4] 高品質なWebデータセットであるFineWeb-Eduを9言語に翻訳する。
TransWebLLMは、クローズドデータを用いて訓練された最先端の多言語モデルに適合し、性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:27:53 GMT)
DivIL: Unveiling and Addressing Over-Invariance for Out-of- Distribution Generalization [33.3] アウト・オブ・ディストリビューションの一般化は、モデルが列車データから遠く離れた分布でうまく機能することを期待する一般的な問題である。
この問題に対処するための一般的なアプローチは不変学習(IL)である。
本稿では,教師なしコントラスト学習とランダムマスキング機構を付加して,逆不変学習(DivIL)を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:17:05 GMT)
Do Large Multimodal Models Solve Caption Generation for Scientific Figures? Lessons Learned from SciCap Challenge 2023 [33.1] 2023年、初のSciCap Challengeが開催され、世界中のチームがSciCapデータセットを使用して、さまざまな学術分野のさまざまなフィギュアタイプをキャプションするモデルを開発するよう呼びかけた。
本稿では,第1回SciCap Challengeの概要を述べるとともに,そのデータ上での各種モデルの性能について詳述し,フィールド状態のスナップショットを撮影する。
プロの編集者は、GPT-4Vが生成した文字キャプションを他の全てのモデルや著者のオリジナルのキャプションよりも圧倒的に好んだ。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:07:34 GMT)
Deep Learning for Cross-Domain Few-Shot Visual Recognition: A Survey [33.0] わずかながらの学習により、モデルは非常に少ないラベル付き例でターゲットタスクを実行することができる。
この制限を克服するため、クロスドメインな数ショット学習が注目されている。
本稿では,クロスドメインFew-shot Learningの総合的なレビューを行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:34:28 GMT)
A Machine Learning Approach That Beats Large Rubik's Cubes [32.8] 本稿では,非常に大きなグラフ上でのパスフィニング問題に対する,機械学習に基づく新しいアプローチを提案する。
4x4x4 と 5x5x5 のルービック立方体に対する解を見つけることで、その効率性を実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:22:38 GMT)
SEA: Low-Resource Safety Alignment for Multimodal Large Language Models via Synthetic Embeddings [32.7] MLLM(Multimodal Large Language Models)は、重大なセキュリティ上の脆弱性を持つ。
テキストアライメントを含む既存の低リソースのセキュリティアライメント手法は、追加のモダリティによって引き起こされるセキュリティリスクに悩まされている。
勾配更新による追加モダリティの埋め込みを最適化するSEA(Synthetic Embedding augmented safety alignment)を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:57:35 GMT)
UniGenCoder: Merging Seq2Seq and Seq2Tree Paradigms for Unified Code Generation [32.3] 既存のコード生成アプローチでは、トークンのシーケンスとしてターゲットコードを生成するSequence-to-Sequenceパラダイムや、アクションのシーケンスとしてコードを出力するSequence-to-Treeパラダイムが重視されている。
コード関連生成タスクに対してUniGenCoderを提案する。これは共有エンコーダと、最小限の追加パラメータを持つ共有デコーダと、各インスタンスに対して最適なパラダイムを動的に選択するセレクタから構成される。
テキスト・ツー・コード生成タスクとコード・ツー・コード生成タスクの実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:19:48 GMT)
UXAgent: An LLM Agent-Based Usability Testing Framework for Web Design [32.3] 近年のLarge Language Model-simulated Agent (LLM-Agent) 研究はUXAgentの設計に影響を与えた。
LLM-Agentモジュールとユニバーサルブラウザコネクタモジュールを備えており、UX研究者は、ターゲットWebサイトをテストするために、何千ものシミュレーションされたユーザを自動的に生成できる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:55:18 GMT)
Spatiotemporal Multi-Camera Calibration using Freely Moving People [32.3] マルチビュー動画における移動自由度を用いたマルチカメラキャリブレーション手法を提案する。
我々は、時間外時空間の棚から得られた3D人間のポーズを用いて、それらを単位球上の3Dポイントに変換する。
我々は、時間データの整合と対応の確立という両問題を共同で解決する確率論的アプローチを採用する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:15:52 GMT)
VoxEval: Benchmarking the Knowledge Understanding Capabilities of End-to-End Spoken Language Models [32.1] 本稿では、純粋音声対話による知識理解を評価する新しいSpeechQAベンチマークであるVoxEvalを提案する。
本ベンチマーク1は,入力と出力の両方の音声形式を維持し,2)多様な入力音声条件のモデルロバスト性を評価し,3)音声形式における数学的推論のような複雑なタスクの評価を先駆する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:07:24 GMT)
Neuromorphic Readout for Hadron Calorimeters [31.8] 均一な鉛タングステート(PbWO4calmeter)に衝突するハドロンのシミュレーション
我々のモデルは、スパイクトレインとして時間光子分布を符号化し、完全に接続されたスパイクニューラルネットワークを用いて、合計の堆積エネルギーを推定する。
III-V半導体ナノワイヤを用いたナノフォトニック実装の可能性について論じる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:51:42 GMT)
Adaptive In-Context Learning with Large Language Models for Bundle Generation [31.7] 本稿では、異なるユーザセッションに基づいて、パーソナライズされたバンドル生成と、その基盤となる意図推論という2つの相互関連タスクについて検討する。
大規模言語モデル(LLM)の推論能力に着想を得て,適応型インコンテキスト学習パラダイムを提案する。
提案手法の有効性を実世界の3つのデータセットで実証した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:06:11 GMT)
NoKSR: Kernel-Free Neural Surface Reconstruction via Point Cloud Serialization [31.5] 我々は不規則点雲を符号付き距離場(SDF)に変換する効率的なフレームワークを開発する。
付近のトークンを集約することで,ある時点でのSDF値を効率的に予測する。
複数のスケールにまたがるアグリゲーションは、シリアライゼーションによってもたらされる近似を克服するために重要であることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:38:38 GMT)
Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings [31.3] 我々は、異なる人間のテンプレート間でモデルを識別できるスキルベースのベンチマークを導入する。
4つのテンプレートと4つのT2Iモデルにまたがって人間の評価を収集し、合計100Kのアノテーションを作成します。
既存の指標よりも人間の評価と相関した新しいQAベースの自動評価指標を導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:18:48 GMT)
Contrast-Unity for Partially-Supervised Temporal Sentence Grounding [31.1] 本稿では、中間的な部分教師付き設定、すなわち、トレーニング中はショートクリップのみが利用可能であることを示す。
部分ラベルをフル活用するために、暗黙的なプログレッシブグラウンドディングという2段階の目標を持つコントラストユニティフレームワークを特別に設計する。
明示的な段階では、接地目的を明示的に最適化するために、得られた擬似ラベルを用いて1つの完全教師付きモデルを訓練する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:59:18 GMT)
Unveiling Mode Connectivity in Graph Neural Networks [30.9] 本研究は,グラフニューラルネットワーク(GNN)におけるモード接続性の最初の研究である。
我々は、GNNが完全に接続されたネットワークやCNNで観測されるパターンから逸脱して、非線形な接続性を示すことを明らかにした。
我々は、モード接続性と一般化のリンクを確立し、損失障壁に基づく一般化を提案し、診断ツールとしての有用性を明らかにする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:46:10 GMT)
Every Expert Matters: Towards Effective Knowledge Distillation for Mixture-of-Experts Language Models [30.7] 我々は,MoEモデルの非活性化専門家が,学生モデルに有用な貴重な知識を持っていることを示す。
我々はまず,知識向上(KA)と学生認識ルータ(SAR)の2つの直感的なMoE固有KD手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:30:34 GMT)
Should I Trust You? Detecting Deception in Negotiations using Counterfactual RL [30.7] 我々は、自然言語通信と戦略的推論の両方を必要とするボードゲームであるTextitDiplomacyにおいて、人間がいかに戦略的にお互いを欺くかを分析した。
提案手法は,大規模言語モデルと比較して高い精度で人間の偽造を検知する。
今後のヒューマン・アブライインタラクションツールは,不審な提案を疑う機会をユーザに与えるために,テキストフリクションをトリガーすることで,偽造検出の手法に基づいて構築することができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:11:41 GMT)
Neural-Symbolic Collaborative Distillation: Advancing Small Language Models for Complex Reasoning Tasks [30.6] 大規模言語モデル(LLM)の複雑な推論能力を学習するための新しい知識蒸留法を提案する。
NesyCDはLLMの一般的な能力と専門知識を異なる方法で蒸留する。
実験の結果,NesyCDは領域内(BBH, GSM8K)および領域外(AGIEval, ARC)データセット上でのSLMの複雑な推論性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:58:08 GMT)
On the Robust Approximation of ASR Metrics [30.5] そこで本研究では,ASR性能指標の近似に新たなアプローチを提案し,真理ラベルの必要性を排除した。
提案手法は,音声および転写表現の統一空間におけるマルチモーダル埋め込みと,高品質なプロキシモデルを組み合わせることで,プロキシメトリクスの計算を行う。
実験結果から, 測定値の絶対差を1桁に近似し, 最新のベースラインを50%以上上回る結果を得た。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:10:17 GMT)
Whose story is it? Personalizing story generation by inferring author styles [30.3] パーソナライズされたストーリー生成のための新しい2段階パイプラインを提案する。
我々のアプローチは、著者の過去の作品から暗黙的なストーリーライティングの特徴を推測し、それらを著者の筆記シートに整理する。
第2段では、パーソナライズされたペルソナ記述とパーソナライズされたストーリーライティングルールを通じて、著者のペルソナをシミュレートする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:45:41 GMT)
UniGuardian: A Unified Defense for Detecting Prompt Injection, Backdoor Attacks and Adversarial Attacks in Large Language Models [30.1] 大規模言語モデル(LLM)は、迅速なインジェクション、バックドアアタック、敵攻撃のような攻撃に対して脆弱である。
我々は,LLMにおける即時注入,バックドア攻撃,敵攻撃を検出するために設計された,最初の統一防御機構であるUniGuardianを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:59:00 GMT)
Uncertain Multi-Objective Recommendation via Orthogonal Meta-Learning Enhanced Bayesian Optimization [30.0] 本稿では,ルールベースの精度駆動システムから行動認識,不確実な多目的RSに至るまで,RSの自律性を5つの異なるレベルに分類する新しい枠組みを提案する。
個人の好みに基づいて複数の目的を動的に識別し、最適化し、より倫理的でインテリジェントなユーザー中心のレコメンデーションを促進するアプローチを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:10:09 GMT)
Multilingual Retrieval Augmented Generation for Culturally-Sensitive Tasks: A Benchmark for Cross-lingual Robustness [30.0] 49言語にまたがる14kのウィキペディア文書と組み合わせた720の領域紛争クエリからなるベンチマークであるBordIRLinesを紹介した。
実験の結果,多言語文書を検索することで応答の整合性が向上し,純言語文書よりも地政学的バイアスが低減されることがわかった。
言語間RAGがIRから文書の内容にどのように影響するかについて、さらなる実験と事例研究を行った。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:32:25 GMT)
A Real-to-Sim-to-Real Approach to Robotic Manipulation with VLM-Generated Iterative Keypoint Rewards [29.9] 動的タスク仕様として機能するPythonベースの報酬関数であるIterative Keypoint Reward(IKER)を紹介する。
我々はシミュレーションで現実のシーンを再構築し、生成した報酬を使って強化学習ポリシーを訓練する。
この結果から,ロボットが動的環境下で複数ステップのタスクを行えるようにしたIKERの有効性が示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:45:59 GMT)
HumT DumT: Measuring and controlling human-like language in LLMs [29.8] ヒューマンライクな言語はユーザエクスペリエンスを改善するかもしれないが、過度な信頼とステレオタイピングにつながる可能性がある。
本稿では,HumT と SocioT を紹介し,テキストデータにおける人間のような音色や社会的知覚の他の次元の指標について紹介する。
好みや使用状況のデータセットにわたってHumTを測定することで、LLMからの人間的なアウトプットがより少ないことが分かる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:04:09 GMT)
How Expressive are Knowledge Graph Foundation Models? [29.7] 本稿では,知識グラフ基礎モデルの表現力は,関係表現の学習に使用されるモチーフに依存していることを示す。
本研究の一環として、より豊かなモチーフを用いて、より表現力のあるKGFMを設計する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:38:39 GMT)
Revisiting Classification Taxonomy for Grammatical Errors [29.6] 文法的誤り分類は、言語学習システムにおいて重要な役割を果たす。
既存の分類は厳格な検証を欠くことが多く、矛盾と信頼できないフィードバックにつながります。
本稿では,系統的,定性的な評価枠組みを導入することで,文法的誤りに対する以前の分類を再考する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:15:11 GMT)
CutPaste&Find: Efficient Multimodal Hallucination Detector with Visual-aid Knowledge Base [29.5] LVLM出力の幻覚を検出する軽量でトレーニング不要なフレームワークであるCutPaste&Findを提案する。
私たちのフレームワークの中核は、リッチなエンティティ属性関係と関連するイメージ表現をエンコードするビジュアルエイドの知識ベースです。
類似度スコアを改良するスケーリング係数を導入し, 地中画像とテキストのペアであっても, 最適下アライメントの問題を緩和する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:06:36 GMT)
From Instance Training to Instruction Learning: Task Adapters Generation from Instructions [29.5] 本稿では,事例学習の欠点に対処するために,人間の学習をシミュレートすることに焦点を当てる。
タスク固有のモデルを自動的に構築するTAGI(Task Adapters from Instructions)を導入する。
超自然的インストラクションとP3データセットを用いたTAGIの評価を行った。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:54:28 GMT)
TEASER: Token Enhanced Spatial Modeling for Expressions Reconstruction [29.4] 人物中心のコンピュータビジョンタスクでは,1つの眼内画像からの3D顔の再構成が重要な課題である。
現在のアプローチでは、誇張された不規則な口の形、表情、非対称な顔の動きに苦労している。
本稿では,これらの課題に対処し,顔形状を3次元的に拡張するTEASERを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:43:41 GMT)
LLMs are Vulnerable to Malicious Prompts Disguised as Scientific Language [29.3] この研究は、多くの最先端のLSMが、科学用語の裏に隠された悪意のある要求に弱いことを明らかにしている。
GPT4o, GPT4o-mini, GPT-4, LLama3-405B-Instruct, Llama3-70B-Instruct, Cohere, Gemini モデルを用いて行った実験では, ステレオタイプバイアスの利点を裏付ける証拠として, 社会科学と心理学研究を意図的に解釈する要求により, モデルのバイアスと毒性が著しく増加することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:02:09 GMT)
ToxiLab: How Well Do Open-Source LLMs Generate Synthetic Toxicity Data? [29.2] 本研究では、有害なデータ合成のためのオープンソースのLCMの可能性について検討する。
幻覚と重複を最小限に抑えつつ,多種多様な高品質な有害データを生成する能力を評価する。
この結果から, 微調整されたオープンソースLCMは, 有毒なコンテンツ検出データセットを増強するための, スケーラブルで費用対効果の高いソリューションを提供することがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:22:49 GMT)
Rethinking Evaluation of Sparse Autoencoders through the Representation of Polysemous Words [29.1] スパースオートエンコーダ(SAE)は、大規模言語モデル(LLM)の解釈性を改善するための有望なツールとして多くの注目を集めている。
本稿では,多文単語に着目した単意味特徴の質を解析するためのSAEの評価スイートを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:10:39 GMT)
AttributionScanner: A Visual Analytics System for Model Validation with Metadata-Free Slice Finding [29.1] データスライス検索は、低パフォーマンスを示すデータセット内のサブグループを特定し解析することで、機械学習(ML)モデルを検証するための新興技術である。
このアプローチは、追加メタデータに対する退屈でコストのかかる要件を含む、重大な課題に直面します。
本稿では,メタデータを含まないデータスライス検索用に設計された,革新的なビジュアルアナリティクス(VA)システムであるAttributionScannerを紹介する。
本システムでは、一般的なモデル動作を含む解釈可能なデータスライスを特定し、属性モザイク設計によりこれらのパターンを可視化する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:12:02 GMT)
Training Turn-by-Turn Verifiers for Dialogue Tutoring Agents: The Curious Case of LLMs as Your Coding Tutors [29.0] 本稿では,学習者の知識状況とターン・バイ・ターン・バイ・ターン・バリデーションを推定し,タスク完了に向けた効果的な指導を確実にする,新しいエージェントワークフローであるTrace-and-Verify(TRAVER)を提案する。
実験では、コーディングチュータリングの課題を明らかにし、TRAVERが成功率を大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:13:00 GMT)
Is Complex Query Answering Really Complex? [28.8] CQAの現在のベンチマークは、私たちが思うほど複雑ではないかもしれないことを示しています。
我々は,複数のホップを推論するモデルを必要とするクエリで構成された,より困難なベンチマークのセットを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:40:13 GMT)
Language Models Can Predict Their Own Behavior [28.8] 入力トークンの内部表現だけでは、次のトークンだけでなく、出力シーケンス全体に対する最終的な振る舞いを正確に予測できることがよく示されます。
この能力を活用して、内部状態のプローブを学習して、早期警告(および終了)システムを作成します。
具体的には、探査機がLMの振る舞いを確実に見積もることができれば、システムはトークンを全く生成せず、代わりに推定された振る舞いを返す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:13:16 GMT)
HopRAG: Multi-Hop Reasoning for Logic-Aware Retrieval-Augmented Generation [28.7] 論理的推論による検索を強化する新しいRAGフレームワークであるHopRAGを提案する。
インデックス作成中にHopRAGは、テキストチャンクを頂点とし、LLM生成した擬似クエリをエッジとして確立した論理接続をエッジとして、パスグラフを構築する。
検索中は、語彙的または意味論的に類似した通路から始まる、検索・推論・帰属機構を用いる。
実験では、HopRAGの優位性が示され、76.78%の回答精度、65.07%の検索F1スコアが従来の方法よりも向上した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:24:42 GMT)
An Empirical Study on Challenges for LLM Application Developers [28.7] 私たちは、人気のあるOpenAI開発者フォーラムから29,057の関連質問をクロールして分析します。
2,364の質問を手動で分析した後、LLM開発者が直面している課題の分類を構築した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:17:04 GMT)
FLAG-Trader: Fusion LLM-Agent with Gradient-based Reinforcement Learning for Financial Trading [28.6] 大規模言語モデル(LLM)は、マルチモーダルな財務データに基づいて微調整されている。
言語処理(LLM)と勾配駆動強化学習(RL)ポリシーの最適化を統合した統一アーキテクチャであるtextscFLAG-Traderを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:32:25 GMT)
Scalable and Certifiable Graph Unlearning: Overcoming the Approximation Error Barrier [28.5] 認定されたグラフを10億のエッジグラフにスケールする最初のアプローチであるScaleGUNを紹介する。
ScaleGUNは、20秒で10億のエッジグラフogbn-papers 100Mの認定アンラーニングを達成している(epsilon,delta)= (1,10-4)。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:24:24 GMT)
Translate Smart, not Hard: Cascaded Translation Systems with Quality-Aware Deferral [28.4] 本稿では,既存の品質推定(QE)メトリクスを推論規則として用いた機械翻訳の簡易かつ効果的な手法を提案する。
また,QEに基づくdeferralでは,カスケードシステムにより,より大規模なモデルの性能に適合し,短時間で呼び出すことが可能であることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:05:40 GMT)
TabM: Advancing Tabular Deep Learning with Parameter-Efficient Ensembling [28.4] 新しいモデルであるTabMはアンサンブルに依存しており、1つのTabMは効率よくアンサンブルを模倣し、オブジェクトごとに複数の予測を生成する。
TabMでは、基盤となる暗黙のトレーニングが同時に行われ、(デフォルトでは)パラメータの大部分を共有しているため、パフォーマンスと効率が大幅に向上する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:58:14 GMT)
Benefits of Early Stopping in Gradient Descent for Overparameterized Logistic Regression [28.4] ロジスティック回帰では、勾配降下(GD)は最大$ell$-margin解に収束しながらノルムで分岐する。
本研究は,高次元ロジスティック回帰における早期停止による追加正則化効果について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:04:06 GMT)
Learning a High-quality Robotic Wiping Policy Using Systematic Reward Analysis and Visual-Language Model Based Curriculum [28.3] 深層強化学習(Deep RL)は有望なアルゴリズムとして登場したが、しばしば繰り返し報酬工学に対する高い需要に悩まされる。
まず、高品質なワイピングと高速なタスク完了の両方を必要とする品質クリティカルなロボットワイピングの収束を分析する。
この問題を実現するために,新たな有界報酬定式化を提案する。
本手法は, 様々な曲率, 摩擦, ウェイポイントを有する表面において, 望ましいワイピングポリシーを導出できることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:15:31 GMT)
NYU CTF Bench: A Scalable Open-Source Benchmark Dataset for Evaluating LLMs in Offensive Security [28.1] 大規模言語モデル(LLM)は、さまざまなドメインにデプロイされているが、Capture the Flag(CTF)の課題を解決する能力は、十分に評価されていない。
我々は、スケーラブルでオープンソースのベンチマークデータベースを作成することで、CTFの課題を解決する上で、LCMを評価する新しい手法を開発した。
このデータベースは、LLMテストと適応学習のためのメタデータを含み、人気のあるコンペからさまざまなCTF課題をコンパイルする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:26:33 GMT)
Task-Informed Anti-Curriculum by Masking Improves Downstream Performance on Text [27.3] マスケッド言語モデリングは、事前訓練言語モデルの教師なし手法として広く採用されている。
本稿では,新しいタスク情報を用いた反カリキュラム学習手法に基づいて,マスキング率を調整し,マスクするトークンを決定することを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:36:16 GMT)
MotionMatcher: Motion Customization of Text-to-Video Diffusion Models via Motion Feature Matching [27.3] テキスト・ツー・ビデオ(T2V)拡散モデルは、入力されたテキスト・プロンプトからリアルな動画を合成する有望な能力を持つ。
本研究では,モーションガイダンスとして参照映像が提供される動作カスタマイズ問題に取り組む。
我々は,事前学習したT2V拡散モデルを特徴レベルで微調整するモーションカスタマイズフレームワークであるMotionMatcherを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:12:51 GMT)
Baichuan-M1: Pushing the Medical Capability of Large Language Models [27.1] 医療応用に特化して最適化された大規模言語モデルであるBaichuan-M1を紹介する。
既存のモデルで事前訓練を続ける従来のアプローチとは異なり、Baichuan-M1は医療能力の向上に重点を置いてゼロから訓練されている。
我々のモデルは20兆のトークンで訓練され、一般的な能力と医療の専門知識のバランスをとるための、さまざまな効果的な訓練方法が組み込まれています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:21:12 GMT)
Revisiting the Generalization Problem of Low-level Vision Models Through the Lens of Image Deraining [27.0] 一般化は低レベルの視覚モデルにとって重要な課題である。
画像のデライン化は、明確に定義され容易に分離された構造のため、ケーススタディとして選択される。
この結果から,劣化パターンではなく,基礎となる画像内容の学習に焦点を合わせることが,一般化の鍵であることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:23:22 GMT)
Reasoning-to-Defend: Safety-Aware Reasoning Can Defend Large Language Models from Jailbreaking [26.8] 本稿では,LLM生成プロセスにクエリとレスポンスの安全反射を統合する新しいトレーニングパラダイムであるReasoning-to-Defend(R2D)を提案する。
R2Dは様々な攻撃を効果的に軽減し、全体的な安全性を改善し、LLMのジェイルブレイクに対する堅牢性を強化する上での安全性を意識した推論の可能性を強調している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:48:46 GMT)
Beyond Timesteps: A Novel Activation-wise Membrane Potential Propagation Mechanism for Spiking Neural Networks in 3D cloud [26.8] 我々は、AMP2(Activation-wise membrane potential Propagation)と呼ばれる、スパイキングニューロンの新規で一般的な活性化戦略を提案する。
共通点クラウドタスク(分類、オブジェクト、シーンセグメンテーション)とイベントクラウドタスク(アクション認識)の実験では、AMP2がSNNトレーニングを安定化し、競争性能を維持し、従来のタイムステップワイドアクティベーションパラダイムと比較してレイテンシを低減することがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:52:25 GMT)
PPGF: Probability Pattern-Guided Time Series Forecasting [26.8] 時系列予測(TSF)は、機械学習の重要な分野であり、様々な応用がある。
確率誘導時系列予測(F)というエンドツーエンドのフレームワークを提案する。
PPGFは、確率的パターン分類によって導かれる予測タスクとして、TSF問題を再構成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:06:42 GMT)
RAPID: Retrieval Augmented Training of Differentially Private Diffusion Models [26.7] RAPID: Retrieval Augmented PrIvate Diffusion modelを提案する。
DPDMトレーニングに検索拡張生成を統合する新しいアプローチである。
これは、生成的品質、メモリフットプリント、推論コストにおいて、最先端のアプローチよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:56:51 GMT)
Beyond Words: Exploring Cultural Value Sensitivity in Multimodal Models [26.1] 文化的文脈に基づく大規模言語モデルにおける価値アライメントの調査は、重要な研究領域となっている。
同様のバイアスは、大きな視覚言語モデル(VLM)では広く研究されていない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:03:02 GMT)
HumanEval-V: Benchmarking High-Level Visual Reasoning with Complex Diagrams in Coding Tasks [26.0] 人間のアノテーションによるコーディングタスクのベンチマークであるHumanEval-Vを提案する。
各タスクは、関数シグネチャとテストケースを組み合わせた、慎重に構築されたダイアグラムを備えている。
トップパフォーマンスモデルでさえ、控えめな成功率を実現しています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:00:26 GMT)
Toward Integrated Solutions: A Systematic Interdisciplinary Review of Cybergrooming Research [25.9] サイバーグルームは、オンラインの信頼構築を通じて未成年者を搾取するが、研究は断片化されている。
社会科学は行動の洞察に焦点を合わせ、計算手法は検出を強調するが、その統合は不十分である。
本稿では,PRISMAフレームワークを用いて両分野を体系的に合成し,明瞭度を向上する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:08:29 GMT)
A Survey of Mathematical Reasoning in the Era of Multimodal Large Language Model: Benchmark, Method & Challenges [25.8] 本調査は,マルチモーダル大言語モデル(MLLM)の時代における数学的推論の包括的解析である。
2021年以降に出版された200以上の研究を概観し,Math-LLMの最先端の展開について検討する。
特に、マルチモーダルな数学的推論パイプラインと(M)LLMと関連する方法論について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:37:21 GMT)
Bridging AI and Science: Implications from a Large-Scale Literature Analysis of AI4Science [25.7] 本稿では,AI4Science文献の大規模解析を行う。
我々は,AI手法と科学的問題の主な相違点を定量的に強調する。
我々は,AIと科学コミュニティの協力を促進する可能性と課題について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:53:05 GMT)
Bridging the Gap: Enabling Natural Language Queries for NoSQL Databases through Text-to-NoSQL Translation [25.6] 自然言語クエリをアクセス可能なクエリに変換することを目的としたText-to-Noタスクを導入する。
この分野での研究を促進するために、我々はTEND(Text-to-Noデータセットのショートインターフェース)という、このタスクのための大規模かつオープンソースのデータセットをリリースした。
また,SLM(Small Language Model)支援とRAG(Retrieval-augmented Generation)支援の多段階フレームワークSMARTを設計した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:48:28 GMT)
Generating with Fairness: A Modality-Diffused Counterfactual Framework for Incomplete Multimodal Recommendations [25.6] 不完全なマルチモーダルレコメンデーションのための新しいModality-Diffused Counterfactual (MoDiCF)フレームワークを提案する。
MoDiCFには、新しいモダリティ拡散データ補完モジュールと、新しいマルチモーダルリコメンデーションモジュールの2つの重要なモジュールがある。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:29:49 GMT)
BenthicNet: A global compilation of seafloor images for deep learning applications [25.5] BenthicNetは海底画像のグローバルコンパイルである。
最初の114万枚以上の画像が収集され、海底環境の多様性を表すためにキュレーションされた。
このコンパイルに基づいて大規模なディープラーニングモデルをトレーニングし,その予備的な結果から,大規模かつ小規模の画像解析タスクの自動化に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:20:48 GMT)
Talking About the Assumption in the Room [25.1] 先行研究から明らかでないのは、仮定の概念化である。
このことは、前提が何か、それで何をする必要があるのかを混乱させます。
本研究は,MLにおける仮定の周辺的議論を中心に,実践者が仮定をよりよく考え,作業するよう推奨するものである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:26:13 GMT)
Efficient and Sharp Off-Policy Learning under Unobserved Confounding [25.1] 本研究では,未観測のコンファウンディングを伴うシナリオにおいて,個人化された非政治学習のための新しい手法を開発する。
本手法は,未観測のコンバウンディングが問題となるような意思決定に極めて有用である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:42:24 GMT)
Geometry-Aware Diffusion Models for Multiview Scene Inpainting [25.0] 我々は,異なる視点から捉えた入力画像の一部がマスクアウトされる3Dシーンのインペイントに焦点を当てた。
最近の研究は、生成モデルと3次元放射場を組み合わせることで、視点を越えて情報を融合することでこの問題に対処している。
本稿では,参照画像から幾何的および外見的手がかりに基づいて一貫したイメージを描ける幾何認識条件生成モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:30:10 GMT)
Gradient-based Trajectory Optimization with Parallelized Differentiable Traffic Simulation [25.0] インテリジェントドライバモデル(IDM)に基づく並列化微分可能交通シミュレータを提案する。
我々の車両シミュレーターは、車両の動きを効率的にモデル化し、現実世界のデータに合うように教師できる軌道を生成する。
このシミュレータを用いて、入力軌跡の雑音をフィルタリングし(軌道フィルタリング)、スパース軌跡から高密度軌跡を再構成し(軌道再構成)、将来の軌跡を予測する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:28:35 GMT)
Maximum Entropy Reinforcement Learning with Diffusion Policy [24.9] 本稿では,MaxEnt RLの目的を満たすためのポリシー表現として,複雑なマルチモーダル分布をキャプチャ可能な強力な生成モデルである拡散モデルを用いる。
提案手法により,効率的な探索が可能となり,最適なMaxEntポリシーに近づいた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:33:28 GMT)
S2C: Learning Noise-Resistant Differences for Unsupervised Change Detection in Multimodal Remote Sensing Images [24.8] マルチモーダルリモートセンシング(RS)画像における非時間変化検出(UCD)は難しい課題である。
近年のVisual Foundation Models(VFM)とContrastive Learning(CL)方法論の進歩に触発されて,表現中の暗黙的な知識を変化に翻訳するCL方法論の開発を目指す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:34:54 GMT)
Robust Disentangled Counterfactual Learning for Physical Audiovisual Commonsense Reasoning [24.7] 本稿では,身体的視覚的コモンセンス推論のためのロバスト・ディスタングル・カウンタフル・ラーニング(RDCL)手法を提案する。
主な課題は、欠落したモダリティのシナリオの下でも、人間の推論能力を模倣する方法である。
提案手法は,VLMを含む任意のベースラインに組み込むことができるプラグアンドプレイモジュールである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:49:45 GMT)
Cross-Domain Continual Learning for Edge Intelligence in Wireless ISAC Networks [24.6] エッジインテリジェンス(EI)は、チャネル状態情報(CSI)に基づいてユーザアクティビティを検知するエッジデバイス(ED)で開発されることが期待される。
CSIはユーザの特性に非常に依存しているため、CSI-Activity関係はドメイン依存であることが知られている。
We propose the EdgeCL framework, which the EI can continue-then-discard each input dataset。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:50:47 GMT)
MotifBench: A standardized protein design benchmark for motif-scaffolding problems [24.5] モチーフ・スキャフォールディング問題は、計算タンパク質設計における中心的な課題である。
MotifBench(モティフベンチ)は、30のベンチマーク問題の集合であり、このベンチマークと、評価.com/blt2114/MotifBenchにおけるリーダーボードの実装である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:07:01 GMT)
UniMatch: Universal Matching from Atom to Task for Few-Shot Drug Discovery [24.4] 我々は、明示的な階層的分子マッチングと暗黙的なタスクレベルマッチングを統合したデュアルマッチングフレームワークUniMatch(UniMatch)を紹介する。
具体的には、階層的なプーリングとマッチングによって、原子、サブ構造、分子など、複数のレベルの構造的特徴を捉える。
実験の結果,UniMatchはMoreculeNetおよびFS-Molベンチマークで最先端の手法より優れていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:36:03 GMT)
DSAI: Unbiased and Interpretable Latent Feature Extraction for Data-Centric AI [24.3] 大規模言語モデル(LLM)は、大きなデータセットの潜在特性を客観的に識別するのにしばしば苦労する。
本研究では,非バイアスで解釈可能な特徴抽出を可能にするフレームワークであるData Scientist AI(DSAI)を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:57:02 GMT)
Provably Efficient RL under Episode-Wise Safety in Constrained MDPs with Linear Function Approximation [24.3] 制約決定過程(CMDP)における強化学習問題について検討する。
本稿では,リニアCMDPに対するRLアルゴリズムを提案する。
その結果,近年の線形CMDPアルゴリズムでは,制約に違反するか,指数計算コストに悪影響を及ぼす結果が得られた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:30:30 GMT)
FineFilter: A Fine-grained Noise Filtering Mechanism for Retrieval-Augmented Large Language Models [24.1] FineFilterはRetrieval-Augmented Generationのための新しいきめ細かいノイズフィルタリング機構である。
手がかり抽出器、再ランカ、およびトランケータから構成される。
3つのQAデータセットの実験では、FinFilterはパフォーマンスと推論コストの点でベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:19:04 GMT)
Fraud-R1 : A Multi-Round Benchmark for Assessing the Robustness of LLM Against Augmented Fraud and Phishing Inducements [24.0] Fraud-R1は、フィッシング詐欺、偽の求人投稿、ソーシャルメディア、ニュースから発生した8,564件の詐欺事件を5つの主要な詐欺タイプに分類する。
以前のベンチマークとは異なり、Fraud-R1はLLMの不正に対する耐性を異なる段階で評価するためのマルチラウンド評価パイプラインを導入している。
評価の結果,詐欺やフィッシングの誘因を擁護する上で,特にロールプレイ設定や偽職投稿において重要な課題が明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:47:02 GMT)
Emulating Retrieval Augmented Generation via Prompt Engineering for Enhanced Long Context Comprehension in LLMs [24.0] 本稿では,レトリーバル拡張生成(RAG)を特殊エンジニアリングとチェーンオブ思考推論によりエミュレートする手法を提案する。
我々は,BABILong から選択したタスクに対するアプローチを評価し,大量の散逸テキストを用いた標準 bAbI QA 問題をインターリーブする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:49:40 GMT)
Secure and Efficient Watermarking for Latent Diffusion Models in Model Distribution Scenarios [23.6] 新しいセキュリティメカニズムは、透かしの漏れと透かしの脱出を防ぐように設計されている。
モデル分散シナリオにおける多様な攻撃に対する堅牢性を高めるために,透かし分布に基づく検証戦略を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:55:33 GMT)
NTP-INT: Network Traffic Prediction-Driven In-band Network Telemetry for High-load Switches [23.2] NTP-INTは、ネットワークトラフィック予測モジュール、ネットワークプルーニングモジュール、プローブパス計画モジュールの3つのモジュールで構成されている。
実験により、NTP-INTは高負荷スイッチ上のより正確なネットワーク情報を取得でき、制御オーバーヘッドを50%削減できることが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:00:52 GMT)
Stabilized Neural Prediction of Potential Outcomes in Continuous Time [23.1] 安定化連続時間逆確率ネットワーク(SCIP-Net)と呼ばれる新しい手法を提案する。
連続時間における時間変化の共起の適切な調整を行う最初の神経学的手法である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:56:08 GMT)
\textit{One Size doesn't Fit All}: A Personalized Conversational Tutoring Agent for Mathematics Instruction [23.0] 数学教育のためのtextbfPersontextbfAlized textbfConversational tutoring agtextbfEnt (PACE) を提案する。
PACEは、各生徒のペルソナに合わせて、フェーダーとシルバーマンの学習スタイルモデルに基づいて、生徒の学習スタイルをシミュレートする。
学生の理解を深めるために、PACEはソクラテス教育法を用いて即時フィードバックを提供し、深い思考を促進する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:24:52 GMT)
Dreamweaver: Learning Compositional World Representations from Pixels [23.0] 人間は自然に世界の知覚を物体とその属性に分解する能力を持っている。
この認知的プロセスは、慣れ親しんだ概念を再結合することで、新しい未来を想像することができる。
生のビデオから階層的および構成的表現を発見するために設計されたニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:16:03 GMT)
Towards Robust Incremental Learning under Ambiguous Supervision [22.9] インクリメンタル部分ラベル学習(IPLL)という,弱教師付き学習パラダイムを提案する。
IPLLは、新しいクラスが時々出現する、シーケンシャルな完全教師付き学習問題に対処することを目的としている。
我々は,代表性と多様性を維持しつつ,明瞭なサンプルを収集するメモリ再生技術を開発した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:37:12 GMT)
H-CoT: Hijacking the Chain-of-Thought Safety Reasoning Mechanism to Jailbreak Large Reasoning Models, Including OpenAI o1/o3, DeepSeek-R1, and Gemini 2.0 Flash Thinking [22.8] 大規模推論モデル(LRM)は先日,その強力な推論能力を安全性チェックにまで拡張した。
このベンチマークは、正当な教育プロンプトの下に非常に危険な、または悪意のある要求を偽装するものです。
当社の実験では,OpenAI o1/o3,DeepSeek-R1,Gemini 2.0 Flash Thinkingなど,一般的な商用LRMの重大なセキュリティ欠陥が明らかになった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:29:12 GMT)
Can Multimodal LLMs do Visual Temporal Understanding and Reasoning? The answer is No! [22.8] 本稿では,TemporalVQAという評価ベンチマークを提案する。
第1部では、時間的に連続するビデオフレームを分析してイベントのシーケンスを決定するためにMLLMが必要である。
第2部では、複数選択の質問としてフレーム化された時間差のある画像ペアを提示し、MLLMに秒から数年のオプションで画像間のタイムラプスを見積もる。
GPT-4o や Gemini-1.5-Pro などのモデルを含む先進MLLM の評価は,重要な課題を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:51:00 GMT)
SynRL: Aligning Synthetic Clinical Trial Data with Human-preferred Clinical Endpoints Using Reinforcement Learning [22.7] 患者データ生成装置の性能向上のために強化学習を活用するSynRLを提案する。
提案手法は,生成したデータの品質を評価するためのデータ値批判機能と,データジェネレータとユーザニーズを整合させる強化学習を利用する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:59:12 GMT)
Mean of Means: Human Localization with Calibration-free and Unconstrained Camera Settings (extended version) [22.5] 立体視に基づく現在の視覚解は、多段階SVD解法における厳密な視点変換原理と誤り伝播による制限に直面している。
本研究では, 人体上のすべての点を, 物体の幾何学的中心を中心とした分布によって生成される観測として考察する確率論的アプローチを提案する。
これにより、サンプリングを大幅に改善し、興味のある点ごとのサンプル数を数百から数十億に増やすことができます。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:36:52 GMT)
Towards Robust and Secure Embodied AI: A Survey on Vulnerabilities and Attacks [22.2] ロボットや自動運転車を含む身体的AIシステムは、現実のアプリケーションにますます統合されている。
これらの脆弱性は、センサーのスプーフィング、敵攻撃、タスクおよび動作計画における失敗を通じて現れる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:38:07 GMT)
CHATS: Combining Human-Aligned Optimization and Test-Time Sampling for Text-to-Image Generation [22.1] 人間の嗜好アライメントのような重要なコンポーネントは、生成品質を保証する上で重要な役割を果たす。
そこで我々はCHATS(Combining Human-Aligned Optimization and Test-time Sampling)を紹介した。
我々はCHATSが例外的なデータ効率を示すことを観察し、小型で高品質な漏えいデータセットでのみ強力な性能を達成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:31:08 GMT)
Theorem Prover as a Judge for Synthetic Data Generation [22.1] RLHF(Reinforcement Learning from Human Feedback)において、人間のアノテーションを定理証明に置き換える枠組みを提案する。
複数の大規模言語モデル(LLM)でTP-as-a-JudgeとRFを適用し、ベンチマークをわずか3,508サンプルで改善し、MultiArithmのMistral-7Bで5.56%の精度を達成した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:57:09 GMT)
Rethinking Diverse Human Preference Learning through Principal Component Analysis [22.1] 本稿では,二項比較から多種多様な人間の嗜好を抽出する新しいアプローチであるデコンプリート・リワード・モデル(DRM)を紹介する。
我々の重要な洞察は、人間の好みをベクトルとして表現し、主成分分析(PCA)を用いて分析することである。
DRMは、意味のある好みの次元(例えば、有用性、安全性、ユーモア)を効果的に抽出し、追加のトレーニングなしで新規ユーザーに適応する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:55:26 GMT)
$k$-Graph: A Graph Embedding for Interpretable Time Series Clustering [21.8] $k$-Graphは時系列クラスタリングの解釈可能性を高めるために作られた教師なしのメソッドである。
我々の実験結果によると、$k$-Graphは現在の最先端の時系列クラスタリングアルゴリズムよりも精度が高いことがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:59:51 GMT)
Personalized Top-k Set Queries Over Predicted Scores [21.7] 本研究は,予測スコア上でトップkクエリに応答する上で,高価な外部オラクルの適用性について検討する。
任意の集合ベースのスコアリング関数を処理する汎用計算フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:19:08 GMT)
K-Paths: Reasoning over Graph Paths for Drug Repurposing and Drug Interaction Prediction [21.7] K-Pathsは、バイオメディカル知識グラフ(KG)から構造化、多様性、生物学的に意味のある経路を抽出する検索フレームワークである。
従来のパスグレードのアプローチとは異なり、K-Pathsはパスを復元し、LLMが直接処理できる構造化フォーマットに変換し、説明可能な推論を容易にする。
実験の結果,K-PathsはLlama 8.1BのF1スコアを12.45ポイント,13.42ポイントの相互作用重度予測においてゼロショット性能を向上させることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:55:24 GMT)
Towards Omni-RAG: Comprehensive Retrieval-Augmented Generation for Large Language Models in Medical Applications [21.5] 大規模言語モデルは、医学診断推論、研究知識獲得、臨床意思決定、消費者健康調査支援など、医療上の課題に取り組むことを約束している。
様々なソースの属性に合わせてコンテキストに適したクエリを定式化することを目的として,この課題に対処する。
既存のアプローチは、ソース計画を見落としているか、モデルがソースと実際のコンテンツに対する期待を誤っているため、効果的にそれを達成することができないかのいずれかである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:38:08 GMT)
B-cos LM: Efficiently Transforming Pre-trained Language Models for Improved Explainability [21.5] ブラックボックスモデルのポストホックな説明法は、忠実さと人間の解釈可能性に苦しむことが多い。
NLP タスクに権限を持つ B-cos LM,すなわち B-cos ネットワークを導入する。
提案手法は,B-cos変換とタスク細調整を組み合わせることで,事前学習した言語モデルをB-cos LMに変換する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:13:08 GMT)
Mixture of Attention Yields Accurate Results for Tabular Data [21.4] 本稿では,エンコーダ・デコーダ・トランスを用いたMAYAを提案する。
エンコーダでは、複数の並列注意枝を構成するMOA(Mixture of Attention)を設計する。
我々は、より堅牢な表現を生成するために、動的一貫性重み制約を伴う協調学習を採用する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:43:42 GMT)
Retrieval-augmented systems can be dangerous medical communicators [21.4] 患者は長年、健康に関する情報をオンラインで求めてきた。
検索強化生成と引用接地は、幻覚を減らし、AI生成応答の精度を向上させる方法として広く推進されている。
本論文は,資料から引き出された文字通り正確な内容が幻覚に反する場合でも,誤解を招く可能性があることを論じる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:57:02 GMT)
Conditioning LLMs to Generate Code-Switched Text: A Methodology Grounded in Naturally Occurring Data [21.2] コードスイッチング(CS)は、自然言語処理(NLP)において依然として重要な課題である。
本稿では,大規模言語モデル(LLM)を用いたCSデータ生成手法を提案する。
そこで本研究では,自然なCS文をモノリンガル・イングリッシュに逆翻訳し,並列コーパスを用いて微調整し,モノリンガル・センテンスをCSに変換する手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:04:13 GMT)
LegalCore: A Dataset for Legal Documents Event Coreference Resolution [21.1] われわれは、法的ドメインであるLegalCoreの最初のデータセットを、包括的なイベントとイベントコア情報で注釈付けした形で提示する。
このデータセットにアノテートした法律上の契約文書は、ニュース記事の何倍も長く、1ドキュメントあたりの平均トークン数は25万である。
このデータセットでは、イベント検出とイベントコア参照解決の両方のタスクに対して、主流のLarge Language Modelsをベンチマークします。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:47:53 GMT)
Disentangling Long-Short Term State Under Unknown Interventions for Online Time Series Forecasting [21.1] オンラインシナリオにおける時系列予測手法の現状
データが順次到着した場合には、短期的な変更を適用しながら、長期的依存を維持することは困難である。
本稿では,オンライン時系列予測のための長期的・短期的状態を切り離すための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:31:04 GMT)
Communication Strategy on Macro-and-Micro Traffic State in Cooperative Deep Reinforcement Learning for Regional Traffic Signal Control [21.0] 本稿では,車線間のマイクロトラフィック状態の相関と,交差点間のマクロトラフィック状態の相関を捉えるための通信戦略を提案する。
実験の結果、GA2-NaiveとGA2-Augの両方が既存のRTSCフレームワークの性能を効果的に改善していることが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:20:51 GMT)
One-bit Compressed Sensing using Generative Models [20.8] 本稿では,深層学習に基づく再構成アルゴリズムを用いた1ビット圧縮センシングの古典的問題に対処する。
事前学習されたニューラルネットワークは、低次元の潜在空間から高次元のスパースベクトル集合への写像を学ぶ。
提案アルゴリズムは、生成モデルが、疎性を超えた信号に関する付加的な構造情報を学習できるため、優れた再構成性能を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:28:35 GMT)
Multi-View Contrastive Network (MCNet) for Motor Imagery Classification [20.8] 本稿では,運動画像(MI)脳波復号のための知識駆動型時間空間ベースマルチビューコントラストネットワーク(MCNet)を提案する。
我々は、異なる拡張ビューから学習するクロスビューコントラストモジュールと、知識誘導モデルとデータ駆動モデルの間で抽出された機能の一貫性を高めるクロスモデルコントラストモジュールを導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:30:53 GMT)
Q-STRUM Debate: Query-Driven Contrastive Summarization for Recommendation Comparison [20.8] Q-STRUM DebateはSTRUM-LLMの新たな拡張であり,クエリに関連する項目の集中的かつコントラスト的な要約を生成するために,議論スタイルのプロンプトを利用する。
3つのデータセットにわたる実験により、Q-STRUM Debateは、キーコントラストの要約基準において、既存の手法よりも大幅に性能が向上することを示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:01:30 GMT)
Bongard in Wonderland: Visual Puzzles that Still Make AI Go Mad? [20.6] VLM(Vision-Language Models)の評価を行った。
VLMは時に差別的な概念を識別することに成功したが、しばしば失敗する。
人間の視覚的推論能力とマシン認知の間には、大きなギャップが残っています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:38:12 GMT)
Understanding and Tackling Label Errors in Individual-Level Nature Language Understanding [20.5] 個人レベル要素に基づく新しいNLUアノテーションガイドラインを提案する。
このガイドラインを用いて、スタンス検出とトピックベースの感情分析データセットを拡張し、再注釈する。
試料中の誤差率は31.7%と23.3%であった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:35:46 GMT)
The Hidden Dimensions of LLM Alignment: A Multi-Dimensional Safety Analysis [20.5] 安全に整合した行動は多次元方向で共同制御されている。
空間内の方向を研究することで、まず支配的な方向がモデルの拒絶行動を支配することが分かる。
次に、異なる方向が支配的な方向をいかに促進または抑制するかを測定する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:24:45 GMT)
SessionRec: Next Session Prediction Paradigm For Generative Sequential Recommendation [20.5] 生成的逐次レコメンデーションのための新しい次世代予測パラダイムであるSessionRecを紹介する。
実際のセッションベースのユーザインタラクションに矛盾するNIPPの項目レベルの自己回帰生成とは異なり、我々のフレームワークはセッション認識表現学習を導入している。
その結果、次のセッション予測パラダイムの下で、セッション内の項目のランクロスを組み込むことで、生成シーケンス推薦モデルのランキングの有効性を著しく向上できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:41:53 GMT)
Mitigating Modality Prior-Induced Hallucinations in Multimodal Large Language Models via Deciphering Attention Causality [20.4] MLLM(Multimodal Large Language Models)は、産業と学術の両方に焦点を合わせている。
MLLMは視覚や言語に先立って導入されたバイアスに悩まされ、多モード幻覚を引き起こすことがある。
MLLMに構造因果モデリングを適用した因果推論フレームワークCausalMMを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:47:58 GMT)
Open-Ended and Knowledge-Intensive Video Question Answering [20.3] 知識集約型ビデオ質問応答 (KI-VideoQA) を多モード検索拡張世代のレンズを用いて検討する。
本稿では,最先端の検索モデルと視覚言語モデルを用いて,様々な検索拡張手法について検討する。
我々は、KnowIT VQAデータセットにおいて、複数の選択質問に対する精度を17.5%向上させる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:24:11 GMT)
A Survey of Text Classification Under Class Distribution Shift [20.2] 日々の実践では、テストデータの分布は時間とともに変化し、機械学習モデルの適用を妨げる。
分散シフトが自然に起こる分野の1つは、人々が議論すべき新しいトピックを見つけるため、テキスト分類である。
分散シフトの種類と対応する問題定式化を定義する制約に基づいて,本領域の手法を分割する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:46:54 GMT)
DeepResonance: Enhancing Multimodal Music Understanding via Music-centric Multi-way Instruction Tuning [20.1] DeepResonanceは、マルチウェイアライメント音楽、テキスト、画像、ビデオデータ向けに微調整されたマルチモーダル音楽理解モデルである。
我々は、DeepResonanceが視覚的およびテキスト的音楽特徴コンテンツを統合できるように設計されたデータセットを構築する。
本モデルは6つの音楽理解課題にまたがる最先端の演奏を実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:09:42 GMT)
SAFEERASER: Enhancing Safety in Multimodal Large Language Models through Multimodal Machine Unlearning [20.0] MLLM(Multimodal Large Language Models)のための安全アンラーニングベンチマークであるSAFEERASERを提案する。
我々は2つの観点から非学習手法を総合的に評価する。
実験により、PD損失と既存の未学習手法を組み合わせることで、過剰な鍛造を効果的に防止できることが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:09:46 GMT)
LongFaith: Enhancing Long-Context Reasoning in LLMs with Faithful Synthetic Data [19.8] LongFaithは忠実な長文推論命令データセットを合成するための新しいパイプラインである。
基礎的真理と引用に基づく推論のプロンプトを統合することにより、注意散らしを排除し、推論連鎖の精度を向上させる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:40:23 GMT)
Infinite Retrieval: Attention Enhanced LLMs in Long-Context Processing [19.6] 大きな言語モデル(LLM)はコンテキストウィンドウサイズによって制限される。
そこで本研究では,LLM自体の注意情報を利用して正確な検索を行う手法を提案する。
InfiniRetriは0.5Bパラメータモデルを用いて、1Mトークン上でのNeedle-In-a-Haystack(NIH)テストで100%精度を達成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:45:36 GMT)
Do PAC-Learners Learn the Marginal Distribution? [19.5] PAC Learning の基本定理は、概念クラス $H$ の学習可能性は$H$ における経験的エラーの $textituniform convergence$ と等価であると主張している。
この研究は、PAC学習、一様収束、分布自由設定を超えた密度推定の関連を再考する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:50:17 GMT)
Re-Align: Aligning Vision Language Models via Retrieval-Augmented Direct Preference Optimization [19.4] 大規模視覚言語モデル(VLM)は、特に横断的不整合の形で、重要な幻覚を引き起こす傾向がある。
本稿では、画像検索を利用した新しいアライメントフレームワークRe-Alignを紹介する。
我々はまた、微調整中に視覚的嗜好を付加する、標準の直接選好最適化の拡張であるrDPOも導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:59:57 GMT)
Cardinality Estimation on Hyper-relational Knowledge Graphs [19.3] 3つの事実を持つ知識グラフ(KG)上のクエリに対する心的推定(CE)は大きな成功を収めた。
しかし、KGs上のサンプリングや要約などの既存のCEメソッドは、HKGsに対して不満足に実行する。
本稿では,複数のGNN層からの出力を適応的に結合し,修飾器情報を効果的に組み込んだグラフニューラルネットワーク(GNN)モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:09:57 GMT)
Is Noise Conditioning Necessary for Denoising Generative Models? [19.3] 雑音条件がない場合の様々な雑音生成モデルについて検討する。
ほとんどのモデルは優雅な劣化を示し、時にはノイズコンディショニングなしでも優れた性能を発揮する。
我々は、CIFAR-10上で2.23の競合FIDを実現するノイズ非条件モデルを導入し、主要なノイズ-条件モデルとのギャップを著しく狭める。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:53:24 GMT)
Can Input Attributions Interpret the Inductive Reasoning Process in In-Context Learning? [19.3] 本稿では,言語学における一般化テストに触発された帰納的推論の総合的診断タスクを設計する。
問題は、従来の入力属性(IA)手法が、ICLにおいてそのような推論プロセスを追跡し、影響のある例を特定することができるかどうかである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:17:50 GMT)
Understanding and Rectifying Safety Perception Distortion in VLMs [19.2] 視覚言語モデル(VLM)は、視覚モダリティを統合した後、有害な要求やジェイルブレイク攻撃の影響を受けやすいものとなる。
マルチモーダル入力は、テキストのみの入力に比べて、モダリティによって誘導されるアクティベーションシフトを"サファー"方向に導入する。
本研究では、モダリティによるアクティベーションシフトを分解・校正し、モダリティの安全性への影響を低減させる訓練自由な手法であるShiftDCを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:06:48 GMT)
FRAME: Boosting LLMs with A Four-Quadrant Multi-Stage Pretraining Strategy [19.2] マルチステージ事前トレーニングは有望なアプローチだが、既存の手法ではデータ分割の量的基準が欠如しており、直観に頼っていることが多い。
本稿では,4段階の事前学習プロセスを4段階に編成し,大幅な損失削減を実現するという確立された原則に導かれる,4段階の多段階訓練戦略(FRAME)を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:39:30 GMT)
MVL-SIB: A Massively Multilingual Vision-Language Benchmark for Cross-Modal Topical Matching [19.1] MVL-SIBは,205言語にまたがるクロスモーダルおよびテキストのみのトピックマッチングを評価する多言語視覚ベンチマークである。
以上の結果から,LVLM は低リソース言語ではクロスモーダルなトピックマッチングに苦慮し,N'Koo などの言語ではチャンスに劣らない性能を示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:40:05 GMT)
ConSense: Continually Sensing Human Activity with WiFi via Growing and Picking [19.1] WiFiベースのヒューマンアクティビティ認識(HAR)は、様々な分野において大きな応用可能性を持っている。
新しいアクティビティが継続的に導入される動的な環境に対処するためには、WiFiベースのHARシステムは、以前に学習したものを忘れずに新しい概念を学習して適応する必要がある。
本研究では,Wi-FiベースのHARのための,軽量かつ高速適応型クラスインクリメンタル学習フレームワークであるConSenseを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:20:33 GMT)
Explainable Fake News Detection With Large Language Model via Defense Among Competing Wisdom [19.0] 本稿では,防衛をベースとした説明可能なフェイクニュース検出フレームワークを提案する。
具体的には,まず,集団の知恵を2つの競合相手に分割し,それぞれに有能な証拠を検出するエビデンス抽出モジュールを提案する。
そこで我々は,大きな言語モデルを用いたプロンプトベースのモジュールを設計し,2つの正当性に対する理由を推測することによって正当化を生成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:31:48 GMT)
Do We Need Domain-Specific Embedding Models? An Empirical Investigation [19.0] FinMTEB(Massive Text Embedding Benchmark)の略であるFinMTEB(Massive Text Embedding Benchmark)を紹介する。
我々は、FinMTEB上での7つの最先端埋め込みモデルの性能評価を行い、MTEB上でのパフォーマンスと比較して顕著な性能低下を観測した。
我々の分析は、最先端の埋め込みモデルがドメイン固有の言語的および意味的なパターンを捉えるのに苦労しているという説得力のある証拠を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:33:04 GMT)
High-Fidelity Music Vocoder using Neural Audio Codecs [19.0] DisCoderは、メルスペクトログラムから44.1kHzの高忠実度オーディオを再構成するニューラルヴォコーダである。
DisCoderは、いくつかの客観的メトリクスとMUSHRAリスニングスタディにおいて、音楽合成における最先端のパフォーマンスを達成する。
提案手法は,音声合成における競合性能も示し,普遍的なボコーダとしての可能性を強調した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:25:46 GMT)
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling [18.9] 本稿では,ユーザの指示に従って画像が合成される条件付き画像生成の課題に焦点をあてる。
Ctrl-Uと呼ばれる不確実性を考慮した報酬モデルを提案し、報酬モデルからの不正確なフィードバックの悪影響を低減する。
不確実性推定に基づいて、報酬を適応的に修正することでモデルトレーニングを規則化する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:41:03 GMT)
GSCE: A Prompt Framework with Enhanced Reasoning for Reliable LLM-driven Drone Control [18.8] 大規模言語モデル(LLM)は、ロボット操作をサポートするために利用することができる。
私たちのフレームワークは、ガイドライン、スキルAPI、制約、例を使って設計された新しい技術コンポーネントで構成されています。
GSCEは信頼性と制約に準拠したコード生成によって特徴付けられる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:35:17 GMT)
Semantically Consistent Person Image Generation [18.7] 文脈認識型人物画像生成のためのデータ駆動型アプローチを提案する。
本手法では,生成した人物の位置,規模,外観を,現場の既存人物に対して意味的に条件付けする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:48:45 GMT)
Scene Aware Person Image Generation through Global Contextual Conditioning [18.7] 本稿では,既存のシーンに関連性のある人物画像を生成し挿入するための新しいパイプラインを提案する。
より具体的には、挿入されている人物の位置、ポーズ、規模がシーン内の既存の人物と混ざり合うように挿入することを目的としている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:40:45 GMT)
Crabs: Consuming Resource via Auto-generation for LLM-DoS Attack under Black-box Settings [18.6] ブラックボックスLSM向けに設計された自動アルゴリズムであるLDM-DoS(AutoDoS)攻撃のためのオートジェネレーションを導入する。
トランスファービリティ駆動の反復最適化によって、AutoDoSは1つのプロンプトで異なるモデル間で動作することができた。
実験の結果、AutoDoSはサービスレスポンスのレイテンシを250$timesuparrow$で大幅に向上し、リソース消費が激化することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:08:19 GMT)
CSA: Data-efficient Mapping of Unimodal Features to Multimodal Features [18.5] CLIPのようなマルチモーダルエンコーダは、ゼロショット画像分類やクロスモーダル検索といったタスクに優れている。
そこで本研究では,2つのユニモーダルエンコーダを用いて,制限データを用いたマルチモーダルエンコーダを複製する正準類似性解析(CSA)を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:55:28 GMT)
Preventing the Popular Item Embedding Based Attack in Federated Recommendations [18.5] PIECK(Popular Item Embedding based Attack)というモデル非依存かつ事前知識のない攻撃を考案する。
PIECKソリューションはアイテムの人気向上モジュールを使用し、ターゲットアイテムの埋め込みとマイニングされた人気アイテムを整列させてアイテム露出を増加させる。
次に、FRS性能を保ちながら、アイテムの人気向上とユーザ埋め込み近似を制約する2つの正規化用語を導入することで、新しい防衛手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:43:14 GMT)
Over-parameterised Shallow Neural Networks with Asymmetrical Node Scaling: Global Convergence Guarantees and Feature Learning [18.4] 我々は,各隠れノードの出力を正のパラメータでスケールする,広い浅層ニューラルネットワークの最適化を検討する。
このような大規模ニューラルネットワークでは、高い確率、勾配流、勾配降下が大域的に収束し、NTKパラメータ化とは異なり、何らかの意味で特徴を学習できることが証明されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:46:29 GMT)
Composition and Control with Distilled Energy Diffusion Models and Sequential Monte Carlo [18.4] 本研究では, 事前学習拡散モデルの蒸留によるエネルギー機能の新たなトレーニング体制を導入する。
本稿では,Feynman Kacモデルとして拡散サンプリング法をキャストすることで,エネルギーとスコアの相乗効果を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:47:44 GMT)
Large Language Models Might Not Care What You Are Saying: Prompt Format Beats Descriptions [18.2] 本稿では,複数のコンテキスト内サンプルの選択基準を記述するためのアンサンブルプロンプトフレームワークを提案する。
6つの翻訳方向にわたる機械翻訳(MT)の予備実験により、このフレームワークがICLの性能を高めることが確認された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:52:35 GMT)
Network-informed Prompt Engineering against Organized Astroturf Campaigns under Extreme Class Imbalance [18.2] 本稿では,Twitter上でのアストロトゥルフキャンペーンを識別するための新しいフレームワークを提案する。
提案されたフレームワークは、言語モデルのトレーニングや微調整を一切必要としない。
我々のフレームワークは、精度、リコール、F1スコアの点で2x-3倍の改善を実現している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:18:53 GMT)
GBO:AMulti-Granularity Optimization Algorithm via Granular-ball for Continuous Problems [18.2] 本稿では, グラニュラーボール最適化(GBO)アルゴリズムを新たに提案する。
最適化のために従来の点の代わりにグラニュラーボールを使用すると、ランダム検索プロセスの多様性とロバスト性が増大する。
一般的なベンチマークの実験では、GBOは一般的な進化的アルゴリズムや進化的アルゴリズムよりも優れていることが示されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:07:23 GMT)
iMOVE: Instance-Motion-Aware Video Understanding [18.2] 現在のモデルは、詳細で複雑なインスタンスの動きを認識するのに苦労している。
データとモデルの両方の観点から改善しました。
インスタンス・モーションアウェア・ファンデーションモデルであるiMOVEを紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:59:44 GMT)
Position and Rotation Invariant Sign Language Recognition from 3D Kinect Data with Recurrent Neural Networks [18.0] 手話は、音声や聴覚障害者の間でのジェスチャーに基づく象徴的コミュニケーション媒体である。
本稿では,インド手話の基本ジェスチャー30点の認識を試みる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:00:45 GMT)
Kernel Banzhaf: A Fast and Robust Estimator for Banzhaf Values [18.0] 我々はBanzhaf値の回帰に基づく最初の推定器であるKernel Banzhafを紹介する。
Kernel Banzhaf はモンテカルロ法よりも精度, サンプル効率, ノイズ, 特徴ランクの回復率において優れていた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:11:52 GMT)
Solving the Cold Start Problem on One's Own as an End User via Preference Transfer [17.9] コールドスタート問題はレコメンデーターシステムで一般的な問題である。
本研究では,エンドユーザーが積極的にコールドスタート問題を解くアルゴリズムであるPretenderを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:12:52 GMT)
R3L: Relative Representations for Reinforcement Learning [17.8] 入力領域の変化(例えば、季節変化によるパノラマ色の変化)がエージェントのパフォーマンスを損なうことが知られている。
表現学習の分野での最近の進歩は、新しいモデルを作るためにコンポーネントを組み合わせる可能性を示している。
我々は、このフレームワークをVisual Reinforcement Learningの設定に適応させ、エージェントコンポーネントを組み合わせて新しいビジュアルタスクペアを効果的に処理できる新しいエージェントを作成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:17:38 GMT)
Choosing Coordinate Forms for Solving ECDLP Using Shor's Algorithm [17.8] Shorのアルゴリズムは楕円曲線離散問題(ECDLP)を時間内に解く能力でよく知られている。
本研究により, 射影座標はショア法を用いてCDLPに取り組む際に, アフィン座標と同等の利点を示さないことが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:23:38 GMT)
VUS: Effective and Efficient Accuracy Measures for Time-Series Anomaly Detection [17.8] 本稿では, ノイズ, 不一致, 異常濃度の異なる条件下での頑健さを評価するため, 時系列ADの品質指標を広範囲に評価する。
以上の結果から,基準値とは無関係に品質値を生成する尺度が時系列ADに適していることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:19:52 GMT)
Oreo: A Plug-in Context Reconstructor to Enhance Retrieval-Augmented Generation [17.5] 大規模言語モデル(LLM)は、パラメトリックな知識が限られ、ドメイン固有の専門知識が欠如しているため、幻覚に弱いままである。
Retrieval-Augmented Generation (RAG)は、LLMの知識基盤を強化するために外部文書検索を組み込むことによって、この問題に対処する。
発電機に供給する前に外部の知識ソースを洗練するためのコンパクトで効率的でプラガブルなモジュールを導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:38:39 GMT)
Scalable Model Merging with Progressive Layer-wise Distillation [17.5] ProDistill (Progressive Layer-wise Distillation) を導入する。
ProDistillは、視力とNLUタスクの6.14%と6.61%の改善を達成している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:15:18 GMT)
MCTS-Judge: Test-Time Scaling in LLM-as-a-Judge for Code Correctness Evaluation [17.4] 本稿では,コード正確性評価のための資源効率の高いシステム2思考フレームワークを提案する。
MCTS-Judgeはモンテカルロ木探索を用いて問題を単純かつ多視点的な評価に分解する。
高精度で単体テストレベルの報酬メカニズムは、大規模言語モデルにライン・バイ・ライン分析の実行を促す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:55:48 GMT)
Don't drop your samples! Coherence-aware training benefits Conditional diffusion [17.3] Coherence-Aware Diffusion (CAD) は条件情報のコヒーレンスを拡散モデルに統合する新しい手法である。
CADは理論的に健全であり,様々な条件生成タスクに対して実験的に有効であることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:43:42 GMT)
A$^2$ATS: Retrieval-Based KV Cache Reduction via Windowed Rotary Position Embedding and Query-Aware Vector Quantization [17.3] ロングコンテキストの大規模言語モデル(LLM)は、メモリフットプリントが大きく、KVキャッシュのアクセスオーバーヘッドが大きいため、効率的なサービスを実現する上で大きな課題となる。
検索ベースのKVキャッシュ削減手法は、一般的に完全なKVキャッシュをCPUにオフロードし、推論時に必要なトークンを取得することで、これらの課題を軽減することができる。
本稿では,新しい検索方式KVキャッシュ削減手法であるA$2$ATSを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:11:51 GMT)
Fundus2Globe: Generative AI-Driven 3D Digital Twins for Personalized Myopia Management [17.2] マイオピアは2050年までに世界の50%の人口に影響を与えると予測されており、視覚喪失の主な原因となっている。
眼球形状に基づくバイオマーカーの最近の理解にはMRI(MRI)が必要である
Fundus2Globeは、患者固有の3D眼球を2Dカラーの眼球写真から合成する最初のAIフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:02:39 GMT)
R.R.: Unveiling LLM Training Privacy through Recollection and Ranking [17.1] 大規模言語モデル(LLM)は、暗黙の暗記によるトレーニングデータを漏洩させる可能性のある、重大なプライバシーリスクを生じさせる。
R.R.(Recollect and Rank)は、攻撃者が盗難データからPIIエンティティを再構築できる新しい2段階のプライバシ盗難攻撃である。
3つの人気のあるPIIデータセットに対する実験により、R.R.はベースラインよりもPIIと同等の性能が向上していることが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:05:59 GMT)
Effective Self-Mining of In-Context Examples for Unsupervised Machine Translation with LLMs [17.0] 機械翻訳(MT)における文脈内例の教師なし手法を提案する。
教師なし並列文のプールから最適なテキスト内例を選択するためのフィルタリング基準を導入する。
本研究は,MTの文脈内マイニングにおける教師なしアプローチの有効性を実証するものである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:38:43 GMT)
CausalMan: A physics-based simulator for large-scale causality [16.9] 実世界の生産ラインをモデルとしたCausalManシミュレータを提示する。
コントリビューションとして,CausalManの大規模シミュレータをリリースする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:20:22 GMT)
Where Do We Stand with Implicit Neural Representations? A Technical and Performance Survey [16.9] Inlicit Neural Representation (INR) は知識表現のパラダイムとして登場した。
INRは、データを連続的な暗黙の関数としてモデル化するために多層パーセプトロン(MLP)を利用する。
この調査では、アクティベーション機能、位置エンコーディング、統合戦略、ネットワーク構造という4つの重要な領域に分類する明確な分類法を紹介した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:09:59 GMT)
Archetypal SAE: Adaptive and Stable Dictionary Learning for Concept Extraction in Large Vision Models [16.9] スパースオートエンコーダ(SAE)は、機械学習の解釈可能性のための強力なフレームワークとして登場した。
既存のSAEは、類似したデータセットでトレーニングされた同一のモデルは、非常に異なる辞書を生成することができるため、深刻な不安定性を示す。
本稿では、辞書の原子を凸殻に拘束するArchitypal SAEについて述べる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:29:11 GMT)
A Causally Informed Pretraining Approach for Multimodal Foundation Models: Applications in Remote Sensing [16.8] 大規模データを用いた基礎モデルの事前学習のための強力なパラダイムとして,自己教師型学習が登場している。
条件生成タスクとして予測をモデル化する新しい事前学習タスクであるCausally Informed Variable-Step Forecasting (CI-VSF)を提案する。
このような事前学習は,予測と予測の両方に微調整を施すと,性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:39:37 GMT)
HyGEN: Regularizing Negative Hyperedge Generation for Accurate Hyperedge Prediction [16.7] ハイパーエッジ予測は、観測されたネットワーク構造に基づいて将来の高次関係を予測するための基本的なタスクである。
しかし、既存のハイパーエッジ予測手法は、データ空間の問題に悩まされている。
本稿では,より現実的なものを生成するためのガイダンスとして,正のハイパーエッジを用いた負のハイパーエッジジェネレータを用いた新しいハイパーエッジ予測手法HyGENを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:53:03 GMT)
Comprehensive Assessment and Analysis for NSFW Content Erasure in Text-to-Image Diffusion Models [16.6] 概念消去手法は、トレーニングデータセットからNSFWコンテンツをフィルタリングしても、必然的にNSFWコンテンツを生成できる。
テキスト・画像拡散モデルにおいて,NSFWコンテンツの概念消去手法とそのサブテーマを初めて体系的に検討した。
14の変種を持つ11の最先端ベースライン手法の総合評価を行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:25:42 GMT)
Reward-Safety Balance in Offline Safe RL via Diffusion Regularization [16.6] 制約付き強化学習(RL)は、安全制約下での高性能な政策を求める。
拡散規則化制約付きオフライン強化学習(DRCORL)を提案する。
DRCORLは、まず拡散モデルを使用して、オフラインデータから行動ポリシーをキャプチャし、その後、効率的な推論を可能にするために単純化されたポリシーを抽出する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:00:03 GMT)
Enhancing Peer Review in Astronomy: A Machine Learning and Optimization Approach to Reviewer Assignments for ALMA [16.5] 本稿では,レビュアーに提案を割り当てるための機械学習と最適化手法の展開と評価について述べる。
提案トピックを特定し,従来のALMA提案に基づいてレビュアーの専門知識を評価する。
重大なミスマッチのために再割り当てを必要としなかったため、手作業で3日から5日間の節約が図られた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:11:05 GMT)
Gradient Co-occurrence Analysis for Detecting Unsafe Prompts in Large Language Models [16.4] 安全でないプロンプトは大きな言語モデル(LLM)に重大な安全リスクをもたらす
安全クリティカルパラメータ識別の範囲を拡大する勾配共起解析法であるGradCooを導入する。
提案手法は,既存手法と比較して最先端(SOTA)性能を実現することができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:14:46 GMT)
Investigating the Impact of Quantization Methods on the Safety and Reliability of Large Language Models [16.3] 人間の評価を含む4つのベンチマークを用いて,LLaMAモデルとMistralモデルを用いた4つの最先端量子化手法の評価を行った。
その結果, 最適量子化法は4ビット精度で変化し, ベクトル量子化法は2ビット精度で最高の安全性と信頼性を提供することがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:32:05 GMT)
Convergent Privacy Loss of Noisy-SGD without Convexity and Smoothness [16.3] 有界領域上の隠れ状態雑音-SGDアルゴリズムの差分プライバシー(DP)保証について検討する。
我々は非滑らかな非滑らかな損失に対して収束R'enyi DPを証明した。
我々はまた、滑らかな凸損失に対する最先端の結果と比較して、厳格に優れたプライバシー境界を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:17:43 GMT)
LADDER: Language Driven Slice Discovery and Error Rectification [16.1] 現在のクラスタリングや離散属性ベースのスライス発見メソッドは、重要な制限に直面している。
我々は,(1)不完全性に対処するために自然言語の柔軟性を活用すること,(2)LLMの潜在的テクストドメイン知識と高度な推論を用いて文を分析し,仮説を直接導出する,という制限に対処することを提案する。
厳密な評価は、ラダーがバイアスを発見し緩和する際に、既存のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:14:02 GMT)
Portable Reward Tuning: Towards Reusable Fine-Tuning across Different Pretrained Models [16.0] 基礎となる基盤モデルは、最終的には新しいものに置き換えられるべきである。
既存の作業は、推論時間チューニングによってこの問題に対処する。
新たな微調整原理であるポータブルリワードチューニングを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:36:33 GMT)
Eager Updates For Overlapped Communication and Computation in DiLoCo [16.0] DiLoCoのような分散最適化手法は、複数のワーカーにわたる非常に大きなモデルのトレーニングに有効であることが示されている。
我々は、ワーカ間の帯域幅が低い設定で標準のDiLoCoと競合するパフォーマンスを提供する、熱狂的な更新と呼ばれる特定の変種を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:16:14 GMT)
Artificially creating emergent interfacial antiferromagnetism and its manipulation in a magnetic van-der-Waals heterostructure [15.9] Van der Waals (vdW) 磁石はナノスケールで磁気を探索するためのユニークなプラットフォームを提供する。
本研究は、強磁性金属と反強磁性絶縁体からなるvdW界面において、未発見の創発性界面磁性を照らす。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:37:26 GMT)
Knapsack Optimization-based Schema Linking for LLM-based Text-to-SQL Generation [15.9] 我々は、Knapsack最適化に基づくリンクエージェント(KaSLA)を紹介する。
KaSLAは、冗長なスキーマ要素を最小化しながら、関連するスキーマ要素の欠如を防ぐために設計された、プラグインスキーマリンクエージェントである。
スパイダーおよびBIRDベンチマークの実験では、KaSLAがSOTAモデルの生成性能を大幅に改善できることが確認された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:53:45 GMT)
Rejected Dialects: Biases Against African American Language in Reward Models [15.9] 報酬モデルにおける方言バイアスを評価するための枠組みを導入する。
我々は、WME(White Mainstream English)と機械翻訳と人書きAALコーパスのペアで、報酬モデルの好みと振舞いを比較する実験を行った。
我々は、報酬モデルがAALテキストとWMEテキストの処理において人間の好みと一致しないことを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:45:42 GMT)
The Knowledge Microscope: Features as Better Analytical Lenses than Neurons [15.9] 言語モデル(LM)における事実知識のメカニズム理解のための分析単位としてのニューロンの利用に関する研究
本稿では、まず、スパースオートエンコーダ(SAE)がニューロンを機能に分解し、代替分析ユニットとして機能することを検証するための予備実験を行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:09:55 GMT)
Emoji Attack: Enhancing Jailbreak Attacks Against Judge LLM Detection [15.8] 脱獄テクニックは、Large Language Models(LLM)を騙して制限されたアウトプットを生成し、深刻な脅威を生じさせる。
1つの防衛線は、生成されたテキストの有害性を評価するために、別の裁判官 LLM を裁判官として使用することである。
トークンセグメンテーションバイアスを利用して既存のジェイルブレイクプロンプトを増幅する新しい戦略である絵文字アタックを導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:57:26 GMT)
A Survey on Large Language Models for Automated Planning [15.8] 自動計画における大規模言語モデルの利用に関する既存の研究を批判的に調査する。
これらの制限のため、LCMは独立したプランナーとして機能するには適していないが、他のアプローチと組み合わせることで、計画アプリケーションを強化する大きな機会を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:11:03 GMT)
Relation Also Knows: Rethinking the Recall and Editing of Factual Associations in Auto-Regressive Transformer Language Models [15.7] 自己回帰変換言語モデル(LM)における事実関連の記憶とリコールが注目されている。
ほとんどの編集作業は、主に主題知識に焦点を当てた既存の知識リコールの解釈の指導の下で知識編集を行う。
本研究では,トランスフォーマーLMの知識リコールを推論中に解釈し,過度な一般化を避けるために単一知識編集に適用する,新たな関係性に着目した視点を見いだす。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:12:31 GMT)
Learning Transformation-Isomorphic Latent Space for Accurate Hand Pose Estimation [15.6] 手振り推定のような視覚に基づく回帰タスクは、表現学習によってより精度が高く、より高速な収束を実現している。
変換等方性潜伏空間を構築するために設計された,高度に多用途なビジュアルネットワークバックボーンであるTI-Netを提案する。
具体的には、線形変換を用いて、潜在空間における幾何変換をモデル化し、rm TI-Netがそれらを画像空間内のものと整合させる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:38:45 GMT)
A Comprehensive Survey on Generative AI for Video-to-Music Generation [15.6] 本稿では、深層生成AI技術を用いて、映像から音楽への生成を包括的に検討する。
視覚的特徴抽出、音楽生成フレームワーク、条件付け機構の3つの重要なコンポーネントに焦点を当てる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:18:54 GMT)
Learning More Expressive General Policies for Classical Planning Domains [15.6] 計画領域全体にわたる一般的なポリシーを学ぶためのGNNベースのアプローチは、$C express$の表現力によって制限される。
この制限は、$k$-GNNs、$k$=3に移行することで克服できる。
実験では、R-GNN[$1$]が通常のR-GNNよりも大きく、エッジトランスフォーマーも約3ドル高い。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:42:02 GMT)
Multimodal Sentiment Analysis with Missing Modality: A Knowledge-Transfer Approach [15.5] マルチモーダル感情分析は、視覚的、言語的、音響的手がかりを通じて、個人が表現する感情を特定することを目的としている。
既存の研究努力の多くは、すべてのモダリティがトレーニングとテストの両方で利用可能であり、そのアルゴリズムが欠落したモダリティシナリオに影響を受けやすいと仮定している。
本稿では,欠落した音声のモダリティを再構築するために,異なるモダリティ間の翻訳を行う新しいナレッジ・トランスファーネットワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:16:35 GMT)
Differentially Private Graph Diffusion with Applications in Personalized PageRanks [15.5] 本研究は,雑音拡散イテレートを用いてエッジレベルの差分プライバシーを保証する新しいグラフ拡散フレームワークを提案する。
このアルゴリズムは拡散当たりのラプラスノイズを注入し、低次ノードによって誘導される高感度を緩和する度合いベースの閾値関数を採用する。
私たちのプライバシー損失分析は、PABI(Privacy Amplification by Iteration)に基づいています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:19:16 GMT)
The impact of conformer quality on learned representations of molecular conformer ensembles [15.3] 本研究では,3次元コンフォメータ依存特性を予測するための代理モデルの性能が,入力として使用する3次元コンフォメータの品質にどのように影響するかを問う。
回答はケース特化されるが,本分析は3次元表現学習モデルにおける貴重な視点を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:00:53 GMT)
MindLLM: A Subject-Agnostic and Versatile Model for fMRI-to-Text Decoding [15.3] 機能的磁気共鳴画像(fMRI)信号をテキストに復号することは神経科学において重要な課題である。
我々は、主観的かつ汎用的なfMRI-to-textデコーディングのためのモデルであるMindLLMを提案する。
本稿では,fMRI信号から多種多様な意味表現を捉える能力を高める新しい手法であるBrain Instruction Tuning(BIT)を紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:27:37 GMT)
High-Fidelity Novel View Synthesis via Splatting-Guided Diffusion [15.2] SplatDiffは1枚の画像から高忠実度ノベルビューを合成するために設計された画素分割誘導映像拡散モデルである。
テクスチャの幻覚を軽減するために,適応的特徴融合による高忠実度テクスチャ生成を可能にするテクスチャブリッジモジュールを設計する。
SplatDiffは、スパースビューのNVSやステレオビデオ変換など、様々なタスクで顕著なゼロショット性能を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:13:06 GMT)
The Geometry of Categorical and Hierarchical Concepts in Large Language Models [15.1] 線形表現仮説の形式化をベクトルとして(例:is_animal)特徴を表現するために拡張する方法を示す。
形式化を用いて、概念の階層構造とそれらの表現の幾何学との関係を証明する。
我々はこれらの理論結果をGemmaとLLaMA-3大言語モデルで検証し、WordNetのデータを用いて900以上の階層的な概念の表現を推定する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:23:45 GMT)
AdvLoRA: Adversarial Low-Rank Adaptation of Vision-Language Models [15.1] 視覚言語モデル(VLM)は、人工知能(AGI)の発展に重要な役割を果たす
セキュリティ問題への対処は、VLMにとって最も重要な課題の1つとして浮上している。
我々は,低ランク適応に基づくtextbftextitAdvLoRA というパラメータ効率の高い逆適応手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:16:57 GMT)
Generalized Kernel Inducing Points by Duality Gap for Dataset Distillation [15.0] Duality Gap KIP (DGKIP) は、Kernel Inducing Points (KIP) 法の拡張である。
MNISTやCIFAR-10のような標準ベンチマークの実験結果から、DGKIPはKIPの効率を保ちながら、より広範な適用性と堅牢な性能を提供することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:43:13 GMT)
Anomaly Detection in Smart Power Grids with Graph-Regularized MS-SVDD: a Multimodal Subspace Learning Approach [14.8] マルチモーダル部分空間支援ベクトルデータ記述(MS-SVDD)を用いたスマートパワーグリッドの異常検出問題に対処する。
このアプローチは、異なるモダリティから来るデータを考慮して、より良い特徴関係を活用することを目的としている。
トレーニングプロセスを強化するために、各モーダルにグラフ情報を利用する新しいマルチモーダルグラフ埋め込み正規化器を導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:47:54 GMT)
How desirable is alignment between LLMs and linguistically diverse human users? [14.7] 我々は,Large Language Models (LLMs) が,言語利用において多種多様である可能性のあるユーザに対して,言語行動の適応や調整を可能にすることが,いかに望ましいかを論じる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:16:03 GMT)
Deliberate Reasoning in Language Models as Structure-Aware Planning with an Accurate World Model [14.5] 高精度世界モデル(SWAP)による構造認識計画
SWAPは構造化知識表現と学習計画を統合する。
SWAPは,数理推論,論理推論,コーディングタスクなど,多種多様な推論集約型ベンチマークで評価される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:52:52 GMT)
COPU: Conformal Prediction for Uncertainty Quantification in Natural Language Generation [14.5] 大規模言語モデル(LLM)の性能評価には,自然言語生成のための不確実性定量化(UQ)が不可欠である。
提案手法は,候補出力に基底真理を明示的に付加し,ロジットスコアを用いて非整合性を測定する手法である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:25:12 GMT)
Spiking Vision Transformer with Saccadic Attention [14.4] スパイキングニューラルネットワーク(SNN)とビジョントランスフォーマー(NNT)は、エネルギー効率と高性能の両方を達成する可能性を秘めている。
まず,SNNをベースとしたVTが限られた性能に悩まされている理由を分析し,バニラ自己保持機構と時間的スパイク列車とのミスマッチを同定する。
これらの問題に対処するために,革新的なサッカディックスパイク自己注意法(SSSA)を導入する。
SSSA機構に基づいてSNNベースのビジョントランス(SNN-ViT)を開発する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:32:29 GMT)
Improved Fine-Tuning of Large Multimodal Models for Hateful Meme Detection [14.4] 有害ミームはインターネットにおいて重要な関心事となり、堅牢な自動検知システムを必要としている。
大規模マルチモーダルモデルは様々なタスクにまたがって強力な一般化を示してきたが、ミームの動的性質によるミーム検出への一般化は乏しい。
本稿では,LMM-RGCL(Large Multimodal Model Retrieval-Guided Contrastive Learning)を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:07:29 GMT)
Creating a Taxonomy for Retrieval Augmented Generation Applications [14.4] 我々は,検索拡張生成(RAG)アプリケーションを定義する構成特性の包括的概要を概念化する分類法を開発した。
RAGのコアディメンションの理解と提示を洗練し、強化するために設計された4つのフェーズで構成されています。
我々は、RAGアプリケーションの概念を包括的に捉えるために、合計5つのメタ次元と16の次元を開発した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:22:15 GMT)
STEFANN: Scene Text Editor using Font Adaptive Neural Network [14.3] 画像中のテキストを文字レベルで修正する手法を提案する。
本稿では,(a)FANnetと(b)Colornetという2つの異なるニューラルネットワークアーキテクチャを提案する。
本手法は画像中のテキストを編集するための統一的なプラットフォームとして機能する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:58:45 GMT)
Multi-scale Attention Guided Pose Transfer [14.3] ポース転送(英: Pose transfer)とは、その人物の別のイメージから、前例のない小説のポーズを持つ人物の確率的イメージ生成を指す。
エンコーダとデコーダの解像度レベル毎にアテンションリンクを導入することで、ポーズ転送のための改良されたネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:18:45 GMT)
Effects of Degradations on Deep Neural Network Architectures [14.3] ディープ畳み込みニューラルネットワーク(CNN)は、大規模画像分類の最近の進歩に影響を与えている。
劣化信号(ノイズ)の存在下でのそのようなネットワークの挙動は、ほとんど探索されていない。
本稿では,最も一般的な6つの画像劣化モデルに基づいて,画像分類のための6つの深層アーキテクチャの性能解析を行った。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:40:45 GMT)
LocalEscaper: A Weakly-supervised Framework with Regional Reconstruction for Scalable Neural TSP Solvers [14.2] LocalEscaperは、大規模トラベリングセールスマン問題(TSP)のための弱い教師付き学習フレームワークである
SLとRLの両方の利点を効果的に組み合わせ、低品質なラベルを持つデータセットの効果的なトレーニングを可能にします。
最大5万の都市でTSPインスタンスを解決し、スケーラビリティと効率のベンチマークを新たに設定する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:10:27 GMT)
Sleepless Nights, Sugary Days: Creating Synthetic Users with Health Conditions for Realistic Coaching Agent Interactions [14.1] 対話型エージェント評価のための合成ユーザ生成のためのエンドツーエンドフレームワークを提案する。
人工的な使用者は、健康状態やライフスタイル、特に睡眠と糖尿病の管理に基礎を置いている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:56:44 GMT)
Probabilistic neural operators for functional uncertainty quantification [14.1] 本稿では,ニューラル演算子の出力関数空間上の確率分布を学習するフレームワークである確率論的ニューラル演算子(PNO)を紹介する。
PNOは、厳密な適切なスコアリングルールに基づく生成モデリングにより、ニューラル演算子を拡張し、不確実性情報をトレーニングプロセスに直接統合する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:42:11 GMT)
T2VEval: T2V-generated Videos Benchmark Dataset and Objective Evaluation Method [13.9] T2VEvalはテキスト・ビデオ品質評価のためのマルチブランチ融合方式である。
テキストとビデオの一貫性、現実性、技術的品質の3つの分野にまたがるビデオを評価する。
T2VEvalは、複数のメトリクスにわたる最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:58:49 GMT)
Linguistic Generalizations are not Rules: Impacts on Evaluation of LMs [13.9] LMがいかにうまく一般化するかの言語学的評価は、自然言語が象徴的な規則によって生成されることを暗黙的に主張する。
ここでは、LMが象徴的ルールに従わなかったことは、自然言語が規則に基づいていないため、バグではなく機能である可能性があることを示唆する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:40:20 GMT)
RSMLP: A light Sampled MLP Structure for Incomplete Utterance Rewrite [13.9] 本稿では,新しい軽量リライトサンプリング(RSMLP)手法を提案する。
RSMLPは、発話間の潜在意味情報を効果的に抽出し、発話を復元するために適切な編集を行う。
提案手法は,パブリックなIURデータセットや実世界のアプリケーション上での競合性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:45:21 GMT)
PeerArg: Argumentative Peer Review with LLMs [13.9] 本稿では,ピアレビューのレビューと意思決定プロセスを支援する新しいパイプラインを提案する。
PeerArg システムは LLM と知識表現の手法を組み合わせたシステムである。
3つの異なるデータセット上でPeerArgパイプラインの性能を評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:36:25 GMT)
Savaal: Scalable Concept-Driven Question Generation to Enhance Human Learning [13.8] Savaalはスケーラブルな質問生成システムで、3つの目的がある。
概念的推論をテストするための事実的リコール以上の質問を生成する。
多様な知識領域にまたがる質問を自動的に生成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:05:08 GMT)
Autonomous Data Selection with Zero-shot Generative Classifiers for Mathematical Texts [13.8] 本稿では,高品質な数学的テキストを自動的にキュレートする自動データ選択(AutoDS)を提案する。
人間のアノテーションや専用のデータフィルタのトレーニングを必要とする従来のアプローチとは異なり、AutoDSはモデルのロジットのみに依存する。
我々は、自動ドメイン固有データキュレーションの今後の研究を容易にするために、キュレートされたAutoMathTextデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:02:54 GMT)
Textual Unlearning Gives a False Sense of Unlearning [13.5] 言語モデル(LM)は、重要なユーザ情報を含むトレーニングデータを「記憶する」傾向がある。
機械学習は、LMが特定のテキストを効率的に「忘れる」ための有望なアプローチとして登場した。
テキストによるアンラーニングは、非ラーニングの誤った感覚を与え、より堅牢でセキュアなアンラーニングメカニズムの必要性を強調している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:16:27 GMT)
Efficient Neural SDE Training using Wiener-Space Cubature [13.4] モンテカルロシミュレーションをバイパスし,改良する新しいトレーニング手法を提案する。
We extended results in the theory of Wiener-space cubature to almost the expected objective functional by a weighted sum of deterministic ODE solution。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:06:40 GMT)
Bridge the Gaps between Machine Unlearning and AI Regulation [13.4] 欧州連合(EU)の人工知能法(AIA)のような人工知能規制のインバウンド波は、機械学習のための重要な新しいユースケースを提供する可能性がある。
このポジションペーパーは、この機会が実現されるのは、政策立案者によって支援された研究者が、機械学習の最先端技術とAI規制への潜在的な応用とのギャップを積極的に橋渡ししている場合のみである、と論じている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:03:03 GMT)
Private Text Generation by Seeding Large Language Model Prompts [13.4] 感性入力コーパスから個人用合成テキストコーパスを生成するDP-KPSを提案する。
下流MLテキスト分類タスクにおけるDP-KPSの評価を行い、生成したコーパスが元のテキストの予測能力の多くを保持することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:50:38 GMT)
Data to Defense: The Role of Curation in Customizing LLMs Against Jailbreaking Attacks [13.4] 大規模言語モデル(LLM)は、カスタマイズと呼ばれるプロセスである微調整を通じて下流アプリケーションに広く適用されている。
悪意のあるサンプルは、LSMの堅牢性を損なう可能性があり、有害な振る舞いを増幅する。
本稿では,任意のテキストをキュレーションして,カスタマイズ時に有害なサンプルを防止できる適応型データキュレーション手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:47:09 GMT)
Advancing Math Reasoning in Language Models: The Impact of Problem-Solving Data, Data Synthesis Methods, and Training Stages [13.4] 問題解決データは、一般的な数学的コーパスと比較してモデルの数学的能力を大幅に向上させる。
本研究では, 効果的なデータ合成手法を同定し, チュータシップ増幅合成法が最高の性能を発揮することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:26:26 GMT)
Detection and Geographic Localization of Natural Objects in the Wild: A Case Study on Palms [13.4] PRISM (Processing, Inference, and Mapping) は高密度熱帯林におけるヤシの検出と位置決定のための柔軟なパイプラインである。
まず,8,830個の箱と5,026個のヤシ中心点をアノテートした,エクアドル西部の21の生態学的に多様な場所に,UAV由来の大規模なオルソモザイクデータセットを構築した。
第2に、ゼロショットSAM2をセグメンテーションバックボーンとして統合し、効率と性能に基づいて複数の最先端物体検出器を評価し、第3に、信頼性スコアをIoUと整合させ、sを探索するキャリブレーション手法を適用した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:43:11 GMT)
Singularity and universality from von Neumann to Rényi entanglement entropy and disorder operator in Motzkin chains [13.3] 障害作用素のスケーリングは、R'enyiエントロピーのエントロピーと一致する主要な振る舞いとして$logl$に従うことも示している。
我々は、$logl$という用語の係数が、R'enyiエントロピーと障害作用素の両方で共有される普遍定数であることを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:44:36 GMT)
Iron Sharpens Iron: Defending Against Attacks in Machine-Generated Text Detection with Adversarial Training [13.2] 我々は、GREedy Adversary Promoted DefendER(GREATER)という、堅牢なMGT検出器をトレーニングするための対角的フレームワークを導入する。
9つのテキスト摂動戦略と5つの敵攻撃による実験結果から,我々のGREATER-DはSOTA防御法と比較して攻撃成功率(ASR)を10.61%削減することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:48:53 GMT)
FIRE: Flexible Integration of Data Quality Ratings for Effective Pre-Training [13.2] 複数のデータ品質レーダを統合するフレキシブルなフレームワークであるFIREを提案する。
Fireは複数の品質信号を統一されたスペースに整合させ、さまざまなデータ品質レーダを統合して、各データポイントに対して包括的な品質信号を提供する。
SlimPajamaデータセットの実験では、FIREは他のデータ選択方法よりも優れています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:17:33 GMT)
Unveiling Multiple Descents in Unsupervised Autoencoders [13.2] 非線形非教師なしオートエンコーダで二重・三重降下を観測できることを初めて示す。
合成データセットと実データセットの両方に関する広範な実験を通して、モデルワイド、エポックワイド、サンプルワイドの二重降下を明らかにする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:00:26 GMT)
RM-PoT: Reformulating Mathematical Problems and Solving via Program of Thoughts [13.1] 本稿では、問題修正(RM)、コード支援推論(PoT)、ドメイン認識による少ショット学習を統合した3段階のフレームワークを提案する。
提案手法はまず,入力問題を多種多様な表面形状に再構成し,構造バイアスを低減し,意味的に整合した5つの例を検索し,文脈的ガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:54:32 GMT)
Expanding the Classical V-Model for the Development of Complex Systems Incorporating AI [13.1] 本稿では、反復的なデータベース開発プロセスのためのVモデルの拡張について述べる。
反復的なアプローチは、継続的システムリファインメントのシームレスな統合を可能にします。
データベースのアプローチは、データベースの開発プロセスの考慮を構成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:01:37 GMT)
Human and AI Perceptual Differences in Image Classification Errors [13.0] 本研究はまず,2つの情報源からの誤りの統計的分布を分析し,課題難易度がこれらの分布に与える影響について検討する。
AIがトレーニングデータから優れたモデルを学び、全体的な精度で人間を上回ったとしても、これらのAIモデルは人間の知覚と有意で一貫した違いを持つ。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:20:21 GMT)
GSQ-Tuning: Group-Shared Exponents Integer in Fully Quantized Training for LLMs On-Device Fine-tuning [13.0] オンデバイス大規模言語モデル(LLM)ファインチューニングアダプタのための新しい推論フレームワークを提案する。
コアとなるGroup-Shared Exponentsフォーマットは、パラメータ群間の指数を用いて、整数形式のモデルパラメータを効率的に表現する。
提案手法は,メモリ使用量を大幅に削減しつつ,FP16に基づく微調整に匹敵する精度を実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:54:55 GMT)
Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research [12.7] 本稿では,ペロブスカイト太陽電池(PSC)の3つの重要な構成要素を統合する知識強化システムについて述べる。
まず,1,517の論文から構築したドメイン固有知識グラフであるPerovskite-KGを開発した。
次に、Perovskite-ChatとPerovskite-Reasoningという2つの補完的なデータセットを作成します。
第3に、ドメイン固有の知識支援のためのPerovskite-Chat-LLMと科学的推論タスクのためのPerovskite-Reasoning-LLMの2つの専門的な大規模言語モデルを導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:19:24 GMT)
Statistically Significant $k$NNAD by Selective Inference [12.7] kNNADを含む異常検出における重要な課題は、検出された異常の信頼性を適切に定量化することである。
統計的仮説テストとしてkNNADを定式化し、$p$-valuesを用いて偽検出の確率を定量化する。
SIを利用することで、Stat-kNNAD法は検出された異常が理論的保証とともに統計的に有意であることを保証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:58:58 GMT)
Flexora: Flexible Low Rank Adaptation for Large Language Models [12.7] 大規模言語モデル(LLM)は、モデルパラメータのスケールを拡大することで、人工知能の進歩を推進している。
特定の下流タスクにおけるそれらのパフォーマンスは、通常これらのタスクの知識境界によって妨げられる。
本稿では,フレキシブルな低ランク適応法 (Flexora) を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:53:51 GMT)
Revisiting Privacy, Utility, and Efficiency Trade-offs when Fine-Tuning Large Language Models [12.6] プライバシーリスクの最小化とユーティリティの最大化において、高い計算効率を維持しながら、固有のトレードオフについて検討する。
LoRAのような効率的な微調整手法は、DPのようなプライベートな微調整手法と同様のプライバシーリスクを軽減する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:16:03 GMT)
CondensNet: Enabling stable long-term climate simulations via hybrid deep learning models with adaptive physical constraints [12.6] 現在の一般循環モデル(GCM)は、雲や対流のような未解決の物理過程を捉える上で困難に直面している。
クラウド・リゾルディング・モデル(Super Paramtetrizations とも呼ばれる)は計算的に禁止されている。
我々は、非物理的凝縮プロセスの修正に自己適応的な物理的制約を組み込んだ、新しいニューラルネットワークアーキテクチャであるCondensNetを紹介した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:11:17 GMT)
HR-Extreme: A High-Resolution Dataset for Extreme Weather Forecasting [12.6] 本研究では,高解像度の極端気象事例を包含した包括的データセットを提案する。
HR-Extreme上での最先端ディープラーニングモデルと数値気象予測システム(NWP)の評価を行った。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:01:07 GMT)
R2-KG: General-Purpose Dual-Agent Framework for Reliable Reasoning on Knowledge Graphs [12.5] R2-KGは、推論を2つの役割に分けるプラグイン・アンド・プレイのフレームワークである。
以上の結果から,R2-KGはKGベースの推論のための柔軟性とコスト効率のよい解であることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:31:52 GMT)
A Cognitive Writing Perspective for Constrained Long-Form Text Generation [12.4] 大きな言語モデル(LLM)は、1回のパスで厳格な要求に従う高品質の長文を生成するのに苦労する。
認知の原則によって動機づけられた私たちは,CagWriterを通じて,人間のような認知書記能力を備えたLLMの実現を目指しています。
本フレームワークは,(1)タスクを分解する階層的計画を実行する計画エージェントと,(2)これらの計画を並列に実行する複数の生成エージェントの2つの主要なモジュールから構成される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:12:14 GMT)
Integrating Reinforcement Learning, Action Model Learning, and Numeric Planning for Tackling Complex Tasks [12.3] 自動計画アルゴリズムは、各アクションの前提条件と効果を指定するドメインのモデルを必要とする。
数値的なドメインモデルと計画の学習が、数値的な計画環境にとって効果的なアプローチであるかどうかは不明だ。
本研究では、数値的なドメインモデルを学習し、それを代替のモデルフリーソリューションと比較する利点について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:26:21 GMT)
A CNN Based Framework for Unistroke Numeral Recognition in Air-Writing [12.2] 本稿では,一般的なビデオカメラ支援畳み込みニューラルネットワーク(CNN)を用いた空気書き込みフレームワークを提案する。
ジェネリックビデオカメラの前に固定色のマーカーを用いてジェスチャーを行い、続いて色に基づくセグメンテーションを行い、マーカーを識別し、マーカー先端の軌跡を追跡する。
提案されたフレームワークは、英語、ベンガル語、デバナガリ数字の個人独立性評価において、97.7%、95.4%、93.7%の認識率を達成した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:24:45 GMT)
Reinforced Lifelong Editing for Language Models [12.1] 大規模言語モデル(LLM)は、事前学習したコーパスから情報を取得するが、その記憶された知識は、時間とともに不正確になるか、時代遅れになる可能性がある。
モデル編集は、リトレーニングなしでモデルパラメータを変更することでこの課題に対処する。
本稿では,RLに基づく編集手法であるRLEditを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:07:53 GMT)
Is Depth All You Need? An Exploration of Iterative Reasoning in LLMs [11.9] 問題の解答に直接寄与する関連する知識が、最初の推論経路から活性化されるかどうかを考察する。
実験の結果,初期推論経路の多様性を増大させることで,同等あるいは優れた性能が得られることがわかった。
そこで本研究では,文脈探索とサンプリングランダム性の低減を両立させることにより,推論幅を向上させる簡易かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:58:19 GMT)
FlexFL: Flexible and Effective Fault Localization with Open-Source Large Language Models [11.9] 我々は,FlexFL という新しい LLM ベースのFL フレームワークを提案し,様々な種類のバグ関連情報を柔軟に活用する。
軽量なオープンソースのLLM Llama3-8Bを持つFlexFLは、2つの最先端のLLMベースのFLアプローチであるAutoFLとAgentFLよりも42と63のバグを発見できることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:11:38 GMT)
How Much Do LLMs Hallucinate across Languages? On Multilingual Estimation of LLM Hallucination in the Wild [11.8] 幻覚とは、大規模言語モデルが非現実的または不誠実な応答を生成する傾向である。
我々は多言語幻覚検出モデルを訓練し、30言語にわたる大規模な研究を行う。
その結果,LLMは高次情報源言語に対するより幻覚的なトークンでより長い応答を生成するが,言語の長さ正規化幻覚率とそれらのデジタル表現との間には相関がないことが判明した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:32:43 GMT)
Interpretable Image Emotion Recognition: A Domain Adaptation Approach Using Facial Expressions [11.8] 本稿では,ジェネリックイメージ中の感情を識別するための特徴に基づくドメイン適応手法を提案する。
これは、事前訓練されたモデルと、画像感情認識(IER)のための十分に注釈付けされたデータセットの限られた可用性の課題に対処する。
提案されたIERシステムは、IAPSaデータセットの61.86%、ArtPhotoデータセットの62.47、FIデータセットの70.78%、EMOTICデータセットの59.72%の感情分類精度を示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:55:26 GMT)
ExoMiner++ on TESS with Transfer Learning from Kepler: Transit Classification and Vetting Catalog for 2-min Data [11.8] 2分間のTESSデータにおけるトランジット信号の分類を改善するために,ExoMinerの成功に基づく強化されたディープラーニングモデルを提案する。
ExoMiner++には、周期図、フラックストレンド、差画像、展開されたフラックス、宇宙船の姿勢制御データなど、追加の診断入力が含まれている。
本研究では,ExoMiner++の分類と各トランジット信号に対する信頼性スコアを含む新しいTESSカタログを紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:25:17 GMT)
Simulating User Diversity in Task-Oriented Dialogue Systems using Large Language Models [11.7] 我々は、ユーザプロファイルの不均一なベースを生成するために、2つのプロプライエタリなLarge Language Model(LLM)を採用している。
これらのシミュレーションに固有の多様性,一貫性,潜在的なバイアスを評価するために,LLMが生成したユーザプロファイルを詳細に解析する。
GPT-o1は、多くのユーザ属性に対してより異質なユーザ分布を生成するのに対し、GPT-4oはより歪んだユーザ属性を生成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:20:16 GMT)
Compression of Entanglement Improves Quantum Communication [11.7] 共有絡み合いは、限られた量子チャネル上で相互作用するシステム間の古典的な相関を増幅することができる。
量子ビットチャネルをベースとした分散タスクを実演し、任意のコヒーレンス保存プロトコルよりも非可逆符号化操作が優れていることを示す。
本稿では, 単一光子の独立かつ独立に制御された経路において, 独立系を実現することにより, 優位性を示す実証実験について報告する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:07:40 GMT)
SHADeS: Self-supervised Monocular Depth Estimation Through Non-Lambertian Image Decomposition [11.5] 視覚的な3Dシーン再構成は、大腸内視鏡ナビゲーションをサポートする。
大腸のどの部分が可視化されたかを認識し、ポリープのサイズと形状を特徴付けるのに役立つ。
この問題における光と深度を効果的に分離する方法を検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:15:32 GMT)
Fake It Till You Make It: Using Synthetic Data and Domain Knowledge for Improved Text-Based Learning for LGE Detection [11.5] 臨床報告からテキストを用いてLGE検出のモデルを訓練するために,ドメイン知識に根ざした戦略を用いる。
我々は、画像の向きを解剖学的に表現した方法で標準化し、空間的特徴とテキスト的特徴のより優れたアライメントを可能にする。
モデル全体の性能に対する各デザインコンポーネントの貢献を明らかにするためのアブレーション研究が実施されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:30:48 GMT)
Improving Algorithmic Efficiency using Cryptography [11.5] 計算問題を解く際の時間的複雑さを改善するために暗号を用いる方法を示す。
標準的な暗号仮定では、既存のアルゴリズムよりも高速なアルゴリズムを設計できることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:08:59 GMT)
KAPPA: A Generic Patent Analysis Framework with Keyphrase-Based Portraits [11.4] キーフレーズは、その簡潔さ、代表性、明快さのために、特許肖像画の理想的な候補である。
KaPPAは2つのフェーズで運用されている。
実世界の特許出願で実施された実験は、キーフレーズに基づく肖像画がドメイン固有の知識を効果的に捉えていることを示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:24:00 GMT)
Adaptive Prototype Model for Attribute-based Multi-label Few-shot Action Recognition [11.3] 現実世界の行動認識システムでは、より多くの属性を組み込むことで、人間の行動をより包括的に理解できるようになる。
本稿では,人間行動認識のためのアダプティブ属性プロトタイプモデル(AAPM)を提案する。
AAPMは属性に基づく複数ラベルの複数ショットのアクション認識と単一ラベルの少数ショットのアクション認識の両方において、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:39:28 GMT)
MT-RAIG: Novel Benchmark and Evaluation Framework for Retrieval-Augmented Insight Generation over Multiple Tables [11.3] MT-RAIG Benchは、マルチテーブル上での検索型インサイト生成システムを評価するように設計されている。
そこで本研究では,人体品質判定の精度向上を目的とした,詳細な評価フレームワークMT-RAIG Evalを紹介した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:12:25 GMT)
RU-AI: A Large Multimodal Dataset for Machine-Generated Content Detection [11.3] 本稿では,テキスト,画像,音声中の機械生成コンテンツを堅牢かつ効果的に検出するための大規模マルチモーダルデータセットであるRU-AIを紹介する。
私たちのデータセットは、Flickr8K、COCO、Places205という3つの大きな公開データセットに基づいて構築されています。
その結果,既存のモデルでは,データセットの正確かつ堅牢な検出に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:29:36 GMT)
PASER: Post-Training Data Selection for Efficient Pruned Large Language Model Recovery [11.2] インストラクションチューニングなどのポストトレーニング技術は、一般的にモデル性能の回復に使用される。
しかし、モデル能力回復とは無関係な命令データの中には、負の効果をもたらすものもある。
PASER は,モデル機能に最も重大な欠陥がある命令を識別する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:11:08 GMT)
Truth Knows No Language: Evaluating Truthfulness Beyond English [11.2] 本稿では,バスク語,カタルーニャ語,ガリシア語,スペイン語の真正性を評価するために,TrathfulQAベンチマークをプロ翻訳して導入する。
本研究は, 人的評価, 複数選択尺度, LLM-as-a-Judge スコアを用いて, 基礎モデルと指導訓練モデルを比較し, 最先端のオープンLCMを12個評価した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:35:45 GMT)
Multi-Objective Reinforcement Learning for Critical Scenario Generation of Autonomous Vehicles [11.2] 我々は,相互依存型安全性と機能要件を同時にテストする重要なシナリオを生成するための,新しい多目的強化学習(MORL)アプローチであるMOEQTを提案する。
我々は,高度エンド・ツー・エンドのAVコントローラと高忠実度シミュレータを用いたMOEQTの評価を行った。
評価の結果,MOEQTはベースラインよりも複数の要件に違反する重要なシナリオを特定する上で,全体的な性能が向上したことが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:32:31 GMT)
Coarse-to-Fine Process Reward Modeling for Mathematical Reasoning [11.2] プロセス・リワード・モデル (Process Reward Model, PRM) は数学的推論において重要な役割を担い、高品質なプロセスデータを必要とする。
我々は,Large Language Models (LLM) が生成する推論ステップが,厳密なインクリメンタルな情報表示に失敗することが多く,冗長性が生じることを観察する。
本稿では,冗長なステップを検出するための簡易かつ効果的な粗大な戦略CFPRMを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:05:36 GMT)
Explainable Neural Networks with Guarantees: A Sparse Estimation Approach [11.1] 本稿では,予測性と説明可能性に調和した説明可能なニューラルネットワークを構築するための新しいアプローチを提案する。
我々のモデルはSparXnetと呼ばれ、共同学習された特徴のスパースセットの線形結合として設計されている。
我々の研究は、スパースニューラルネットワークと説明可能なニューラルネットワークのさらなる研究の道を開く。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:45:28 GMT)
TRAWL: Tensor Reduced and Approximated Weights for Large Language Models [11.1] TRAWL (Tensor Reduced and Approximated Weights for Large Language Models) は、複数の重み行列に対してテンソル分解を適用し、大域的な構造パターンを捉えることでLLMを効果的に分解する手法である。
我々の実験によると、TRAWLは、追加のデータやトレーニング、微調整を必要とせず、ベンチマークデータセットのベースラインモデルよりも最大16%モデル性能を向上させる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:42:48 GMT)
Sens-Merging: Sensitivity-Guided Parameter Balancing for Merging Large Language Models [11.0] Sens-Mergingはモデルマージのための感度誘導係数調整法である。
本研究では,Sens-Mergingが一般知識,数学的推論,コード生成タスクにおいて,性能を著しく向上させることを示す。
本研究は,タスク固有のスケーリングとタスク間の重要なトレードオフを明らかにし,今後のモデルマージ戦略の洞察を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:41:13 GMT)
Enhancing Audio-Visual Spiking Neural Networks through Semantic-Alignment and Cross-Modal Residual Learning [10.9] スパイキングニューラルネットワーク(SNN)は、脳にインスパイアされた計算モデルである。
既存のSNNモデルは、一モーダル処理に重点を置いており、効率的なクロスモーダル情報融合を欠いている。
本稿では,効果的な音声・視覚統合のための意味的アライメント・クロスモーダル残差学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:18:29 GMT)
Guaranteed Conditional Diffusion: 3D Block-based Models for Scientific Data Compression [10.8] 本稿では, 条件補正付き保証拡散(GCDTC)による新しい圧縮パラダイムを提案する。
条件付き拡散モデル、テンソル補正、エラー保証で構成されている。
我々のフレームワークは、標準的な畳み込みオートエンコーダより優れ、既存の科学データ圧縮アルゴリズムと競合する圧縮品質が得られる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:33:09 GMT)
Multiple Distribution Shift -- Aerial (MDS-A): A Dataset for Test-Time Error Detection and Model Adaptation [10.8] Multiple Distribution Shift -- Aerial (MDS-A)は、同じ航空領域の関連するデータセットの集合体である。
ベースライン機械学習モデルの性能評価を行うMDS-Aの特性について述べる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:17:03 GMT)
PCB Renewal: Iterative Reuse of PCB Substrates for Sustainable Electronic Making [10.7] PCB基板(プリント回路基板)は、しばしばシングルユースであり、電子部品製造の材料廃棄物に繋がる。
我々は, 導電性エポキシを古い領域に選択的に沈着させることによりPCBトレースを「消去」し, 「再構成」する新しい手法であるPCB Renewalを紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:29:09 GMT)
Gesture-Aware Zero-Shot Speech Recognition for Patients with Language Disorders [10.7] 音声障害者を対象としたゼロショット学習によるジェスチャー認識自動音声認識(ASR)システムを提案する。
実験結果と分析結果から,ジェスチャー情報を含むと意味理解が著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:15:55 GMT)
Utilizing Effective Dynamic Graph Learning to Shield Financial Stability from Risk Propagation [10.5] 金融リスクは、密結合した時間次元と空間次元の両方にわたって伝播することができる。
ラベルのないデータに埋め込まれたリスクは、しばしば検出するのが困難である。
3つの重要なイノベーションを持つ新しいアプローチであるGraphShieldを紹介します。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:09:05 GMT)
"I know myself better, but not really greatly": Using LLMs to Detect and Explain LLM-Generated Texts [10.5] 大規模言語モデル(LLM)は、人間のようなテキストを生成する際、印象的な能力を示した。
本稿では,LLMによる人為的テキストの検出と説明機能について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:00:28 GMT)
The "Who'', "What'', and "How'' of Responsible AI Governance: A Systematic Review and Meta-Analysis of (Actor, Stage)-Specific Tools [10.4] 我々は、責任あるAIツールの現状を体系的にレビューし、包括的メタ分析する。
その結果、ステークホルダーの役割とライフサイクルステージの間に大きな不均衡がみられた。
責任を負うAIのためのフレームワークやツールが無数にあるにも関わらず、組織内の誰で、そのツールが適用するAIライフサイクルに精通しているかは、いまだに不明である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:31:31 GMT)
Application of machine learning algorithm in temperature field reconstruction [10.3] 本研究では,貯水池の水温の成層パターンと動的進化に着目した。
限定的かつノイズの多い局所測定データを用いて温度場を推定・再構成することを目的としている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:07:47 GMT)
Math Neurosurgery: Isolating Language Models' Math Reasoning Abilities Using Only Forward Passes [10.3] 数学推論は人工知能の目印であり、数学教育を含むいくつかの領域に影響を及ぼす。
大規模言語モデルパラメータ内での数学推論のエンコード方法や、それがモデル内で孤立可能なスキルであるかどうかについて、いくつかの研究がおこなわれている。
フォワードパスのみを用いて LLM における算数固有パラメータを分離する計算効率のよい方法である MathNeuro を導入する。
MathNeuroは、パラメータの重要度を計算するために重みとアクティベーションを使用することで、既存の作業の上に構築されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:45:14 GMT)
DLP-LoRA: Efficient Task-Specific LoRA Fusion with a Dynamic, Lightweight Plugin for Large Language Models [10.2] 大規模言語モデル(LLM)は様々なタスクで堅牢なパフォーマンスを実現していますが、これらのモデルを特定のドメイン向けに微調整することはリソース集約的です。
5Mパラメータしか持たないミニMLPモジュールを提案し、トップpサンプリング戦略を用いて文レベルで複数のLoRAを動的に融合する。
このアプローチは、並列計算を利用することで、単一のLoRA推論の2倍未満まで推論時間を短縮する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:30:17 GMT)
SATA: Safe and Adaptive Torque-Based Locomotion Policies Inspired by Animal Learning [10.1] SATAは、動物の移動で観察される重要な生体力学的原理と適応学習機構を模倣する生体に触発されたフレームワークである。
本手法は,早期探索を著しく改善し,トルクベースの政策を学習する上での課題を効果的に解決する。
実験結果から,SATAは,挑戦的環境においても,顕著なコンプライアンスと安全性を示すことが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:25:37 GMT)
Testing for Causal Fairness [10.1] 因果性は、職業採用における性別や犯罪予測における人種などのセンシティブな属性に対する差別を防ぐために、公平性分析で広く用いられている。
現在のデータベースの潜在的成果フレームワーク(POF)は、高次元データを扱う際に、信頼できない公平性分析結果をもたらすことが多い。
本稿では, 公平性分析をDCTに変換する分布型POFを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:05:04 GMT)
A Simple Framework for Secure Key Leasing [10.0] 鍵取り消し可能な暗号により、暗号鍵を量子状態としてリースし、鍵を後で検証可能な方法で取り消すことができる。
本稿では,BB84状態の復号性を利用した暗号プリミティブをセキュアな鍵リースで構築するための簡単なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:58:17 GMT)
Untangling Lariats: Subgradient Following of Variationally Penalized Objectives [10.0] 本稿では,不規則なペナルティを伴う凸問題の最適解を段階的に追従する装置について述べる。
我々は,このアプローチの特殊な場合として,溶存ラッソや等調回帰といった既知のアルゴリズムを導出する。
また、任意の畳み込みフィルタの出力によって特徴付けられる変分罰則の段階的追従のための格子ベースの新しい手順を導出する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:34:39 GMT)
Identifying Bug Inducing Commits by Combining Fault Localisation and Code Change Histories [10.0] BIC(Bug Inducing Commit)は、コミットにバグを導入するコード変更である。
我々は、最近修正されたコード要素がある場合、コミットがBICになる可能性が高いというコア概念でBICを識別することを目的としたFonteと呼ばれるテクニックを提案する。
フォンテは最先端のBIC識別技術を大きく上回り、最大45.8%のMRRを達成している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:02:22 GMT)
Random Forest Autoencoders for Guided Representation Learning [10.0] 本稿では,サンプル外拡張のためのニューラルネットワークフレームワークRF-PHATEを紹介する。
RF-PHATEのカーネルベースの拡張は、RFPHATEの標準拡張を含む既存の方法よりも優れている。
RF-AEはカーネルの選択に対して堅牢であり、任意のカーネルベースの次元減少法に一般化する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:02:29 GMT)
DeltaDiff: A Residual-Guided Diffusion Model for Enhanced Image Super-Resolution [9.9] 拡散のために画像間の残差のみを利用するDeltadiffと呼ばれる新しい拡散モデルを提案する。
提案手法は,最先端モデルを超え,忠実度を向上した結果を生成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:07:14 GMT)
Self Iterative Label Refinement via Robust Unlabeled Learning [9.9] 大規模言語モデル(LLM)の自己抑制手法は、しばしば固有のバイアスと過剰な自信に悩まされる。
本稿では,LLM生成した擬似ラベルの分類処理を改善するために,Unlabeled-Unlabeled学習フレームワークを用いた反復的改良パイプラインを提案する。
我々のアプローチは、初期擬似ラベルを反復的に軽視し、洗練することにより、内部バイアスの悪影響を最小限の人的監督で軽減する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:04:18 GMT)
LLM Safety for Children [9.9] この研究は、標準的な安全評価によって見落とされがちな子供の多様性を認めている。
本研究は,児童医療・心理学における文献による児童の個人性や興味の多様性を反映した児童ユーザモデルを開発する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:26:27 GMT)
BalanceBenchmark: A Survey for Imbalanced Learning [9.9] マルチモーダル学習は、異なるモーダルからの情報を統合する能力に注目されている。
これは、あるモダリティが支配的であり、他のモダリティが未利用のままであるマルチモーダル不均衡問題によってしばしば妨げられる。
我々は,主要な多モード不均衡アルゴリズムを,不均衡を緩和するための戦略に基づいて4つのグループに体系的に分類する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:47:55 GMT)
YUNet: Improved YOLOv11 Network for Skyline Detection [9.6] スカイライン検出は、ジオローカライザ、飛行制御、視覚ナビゲーション、ポートセキュリティなどにおいて重要な役割を果たす。
我々は、YUNetアルゴリズムを提案し、YOLOv11アーキテクチャを改良し、空域を分割し、複雑で可変な状況で空線を抽出する。
我々のテストでは、YUnetセグメンテーションのIoUが0.9858に達することを示し、YUnetのスカイライン検出の平均誤差はわずか1.36ピクセルである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:30:14 GMT)
Improving the Stability of GNN Force Field Models by Reducing Feature Correlation [9.5] MDシミュレーションの安定性を高めるため,GNNFFモデルの特徴相関に基づく手法を提案する。
本稿では,GNNFFモデルの安定性を,特に計算オーバーヘッドが3%未満の分布外データにおいて著しく向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:18:22 GMT)
Richer Output for Richer Countries: Uncovering Geographical Disparities in Generated Stories and Travel Recommendations [9.5] 地理的知識を必要とする2つのシナリオに対して,大規模言語モデルが与える影響について検討する。
具体的には,5つの人気のある言語モデル,約100ドルの旅行要求,200ドルのストーリー世代を対象とした調査を行い,貧しい国に対応する旅行勧告は,より少ない位置参照で独特ではないことを示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:43:27 GMT)
Automating Prompt Leakage Attacks on Large Language Models Using Agentic Approach [9.5] 本稿では,大規模言語モデル(LLM)の安全性を評価するための新しいアプローチを提案する。
我々は、プロンプトリークをLLMデプロイメントの安全性にとって重要な脅威と定義する。
我々は,協調エージェントが目的のLLMを探索・活用し,そのプロンプトを抽出するマルチエージェントシステムを実装した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:17:32 GMT)
Temporal reasoning for timeline summarisation in social media [9.5] 本研究では,物語内の逐次事象間の時間的関係に着目した新しいデータセットであるNarrativeReasonを紹介する。
次に、時間的推論と時系列の要約を知識蒸留フレームワークを通じて組み合わせる。
実験結果から,本モデルは,領域外精神保健関連タイムラインの要約作業において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:02:12 GMT)
HeRCULES: Heterogeneous Radar Dataset in Complex Urban Environment for Multi-session Radar SLAM [9.5] HeRCULESデータセットは、ヘテロジニアスレーダー、FMCW LiDAR、IMU、GPS、カメラを備えた包括的なマルチモーダルデータセットである。
これは、FMCW LiDARと並行して4Dレーダと回転レーダを統合する最初のデータセットであり、非並列なローカライゼーション、マッピング、位置認識機能を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:59:46 GMT)
Investigating and Extending Homans' Social Exchange Theory with Large Language Model based Agents [9.4] ホマンスの社会交換理論(SET)は、人間の文明や社会構造の形成と出現を理解するための基本的な枠組みとして広く認識されている。
大規模言語モデル(LLM)の最近の進歩は、人間の振る舞いをシミュレートする有望な能力を示している。
3つのLDMエージェントからなる仮想社会を構築し、それらの行動を監視するためにソーシャル交換ゲームに従事させる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:30:46 GMT)
Computing Voting Rules with Improvement Feedback [9.4] 不完全あるいは制約されたフィードバックの下での嗜好の集約は、社会的選択と関連する領域における根本的な問題である。
改良フィードバックから得られる位置スコアリングルールの完全な特徴付けを提供する。
改善フィードバックは、ペアのフィードバックとは違って、コンドルセット一貫性のあるルールの計算に十分でないことを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:05:46 GMT)
Benchmarking Zero-Shot Facial Emotion Annotation with Large Language Models: A Multi-Class and Multi-Frame Approach in DailyLife [9.4] 本研究では,大規模言語モデル(LLM)を用いた日常シナリオにおける人間の感情の自動アノテートの実現可能性と性能について検討した。
GPT-4o-miniモデルを用いて,ビデオセグメントから抽出したキーフレームの高速ゼロショットラベリングを行った。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:36:16 GMT)
Performance Evaluation of Large Language Models in Statistical Programming [9.3] 大規模言語モデル(LLM)は、自動コード生成に革命をもたらし、自動統計解析のための新しい道を開いた。
統計的解析のためのSASプログラミング分野において,ChatGPTの2バージョンとLlamaの1バージョンを含むLLMの性能を評価する。
我々は,LLMが生成するSASコードの品質を,正確性,有効性,可読性,実行可能性,出力結果の正確性に基づいて総合的に評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:37:15 GMT)
Language Barriers: Evaluating Cross-Lingual Performance of CNN and Transformer Architectures for Speech Quality Estimation [9.3] 目的語品質モデルの言語間一般化は大きな課題である。
主に英語データに基づいて訓練されたモデルは、異なる音素、音節、韻律の特徴を持つ言語に一般化するのに苦労する可能性がある。
本研究では,NISQA,CNNベースモデル,変換器ベースオーディオスペクトログラム変換器(AST)モデルという2つの音声品質モデルの言語間性能について検討した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:22:43 GMT)
GVTNet: Graph Vision Transformer For Face Super-Resolution [9.3] 本稿では,グラフビジョントランスネットワークと呼ばれる,グラフニューラルネットワークに基づくトランスフォーマーアーキテクチャを提案する。
それぞれのパッチをグラフノードとして扱い、パッチ間の情報に基づいて隣接行列を確立する。
このようにして、パッチは隣のパッチの間でのみ相互作用し、さらに顔コンポーネントの関係を処理する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:15:02 GMT)
ALGEN: Few-shot Inversion Attacks on Textual Embeddings using Alignment and Generation [9.2] ALGEN(alignment and generation)を用いたテキスト・エンベディング・インバージョン・アタックを提案する。
ALGEN攻撃はドメインや言語間で効果的に転送でき、重要な情報を明らかにする。
我々は,NLPに埋め込みアライメントを応用した新しいテキスト埋め込みインバージョンパラダイムを構築した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:07:55 GMT)
Beyond De-Identification: A Structured Approach for Defining and Detecting Indirect Identifiers in Medical Texts [9.2] この研究は、異なる潜在的な敵を考慮に入れた間接識別子の9つのカテゴリのスキーマを導入する。
このスキーマを用いて100個のMIMIC-III放電サマリーをアノテートし、間接識別子を識別するためのベースラインモデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:52:29 GMT)
Tuning Algorithmic and Architectural Hyperparameters in Graph-Based Semi-Supervised Learning with Provable Guarantees [9.1] グラフベースの半教師付き学習は、基礎となるグラフ構造をモデリングし活用するための機械学習の強力なパラダイムである。
グラフ畳み込みニューラルネットワーク(GCN)とグラフアテンションネットワーク(GAT)を各層に補間する可変アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:16:23 GMT)
IGNN-Solver: A Graph Neural Solver for Implicit Graph Neural Networks [9.1] 入射グラフニューラルネットワーク(IGNN)は単一の層で強い表現力を示す。
一般化されたAnderson Acceleration法を利用して,GNNをパラメータ化した新しいグラフニューラルソルバIGNN-rを提案する。
実験では、IGNN-rは小規模タスクと大規模タスクの両方での推論を著しく加速し、精度を犠牲にすることなく1.5times$から8times$スピードアップを達成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:08:33 GMT)
GARAD-SLAM: 3D GAussian splatting for Real-time Anti Dynamic SLAM [9.1] 動的シーンに適したリアルタイム3DGSベースのSLAMシステムであるGARAD-SLAMを提案する。
追跡の面では、ガウスの動的セグメンテーションを直接実行し、それらをフロントエンドにマッピングして動的点ラベルを得る。
実世界のデータセットを用いた結果から,本手法はベースライン手法と比較して,トラッキングに競争力があることが示された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:00:47 GMT)
Adjust for Trust: Mitigating Trust-Induced Inappropriate Reliance on AI Assistance [8.9] 信頼は、AI支援意思決定タスクにおけるAIレコメンデーションへのユーザの依存度をバイアスする。
我々は,信頼と適応の介入を通じて,AIアシスタントが行動に適応するように提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:42:39 GMT)
RAG-Reward: Optimizing RAG with Reward Modeling and RLHF [8.9] Retrieval-augmented Generation (RAG)は、関連知識と最新の知識でLarge Language Models (LLM)を強化する。
RAG最適化のための強化学習における報酬モデルの役割は未定である。
報酬モデルを開発するためのフレームワークである textbfRAG-Reward を導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:22:50 GMT)
Subword models struggle with word learning, but surprisal hides it [8.9] 単語と文字のモデルにおける単語学習を,心理言語学的語彙決定タスクを用いて研究する。
サブワードLMは高い精度で単語や非単語を識別するのに苦労するが、文字LMはこの課題を簡単かつ一貫して解決する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:09:16 GMT)
Asymptotically Unbiased Synthetic Control Methods by Density Matching [8.9] シンセティック・コントロール・メソッド(SCM)は、比較ケーススタディの基本的なツールとなっている。
本研究では,既存のSCMにおける重要な内在性問題,すなわち未処理単位の結果と合成制御の誤差項との相関を明らかにする。
本研究では,非処理単位の接合密度の重み付け混合により,処理単位の結果密度を近似できると仮定して,密度マッチングに基づく新しいSCMを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:10:12 GMT)
BESSTIE: A Benchmark for Sentiment and Sarcasm Classification for Varieties of English [8.8] BESSTIEは、オーストラリア(en-AU)、インド(en-IN)、イギリス(en-UK)の3種類の英語に対する感情と皮肉の分類のベンチマークである。
位置に基づくフィルタリングとトピックに基づくフィルタリングという2つの手法を用いて,これらの言語品種のデータセットを収集する。
言語変異のネイティブ話者は、感情ラベルと皮肉ラベルでデータセットを手動で注釈付けする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:34:18 GMT)
Towards Adaptive Feedback with AI: Comparing the Feedback Quality of LLMs and Teachers on Experimentation Protocols [8.7] 本研究では,大規模言語モデル(LLM)のフィードバック品質を,人間教師や理科教育専門家のフィードバック品質と比較した。
その結果,LLMによるフィードバックは,教師や専門家の全体的な品質に有意な差は認められなかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:22:14 GMT)
Brain-to-Text Decoding: A Non-invasive Approach via Typing [8.7] 脳活動から文の生成を復号する非侵襲的手法を提案する。
脳2Qwertyは、脳波(EEG)または脳磁図(MEG)から文章を復号するために訓練された新しいディープラーニングアーキテクチャである。
MEGでは、Brain2Qwertyは平均して32%のキャラクタエラーレート(CER)に達し、脳波を大幅に上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:36:46 GMT)
STEER-ME: Assessing the Microeconomic Reasoning of Large Language Models [8.6] マイクロエコノミック推論のための大規模言語モデル(LLM)を評価するためのベンチマークを開発する。
供給と需要のロジックに重点を置いており、それぞれが最大10ドルドメイン、5ドルパースペクティブ、3ドルタイプで構成されています。
我々は,小規模なオープンソースモデルから最先端技術まで,27ドルのLLMのケーススタディを通じて,我々のベンチマークの有用性を実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:42:09 GMT)
3D Shape-to-Image Brownian Bridge Diffusion for Brain MRI Synthesis from Cortical Surfaces [8.6] Cor2Voxは、連続した皮質形状を合成脳MRIに翻訳する最初の拡散モデルに基づく方法である。
本研究では, 従来のボクセル法と比較して, 復元された構造物の幾何的精度が大幅に向上したことを示す。
また, 亜ボクセルレベルの皮質萎縮をシミュレートするためのアプローチの有用性も強調した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:59:04 GMT)
Can a Single Model Master Both Multi-turn Conversations and Tool Use? CoALM: A Unified Conversational Agentic Language Model [8.6] 対話型エージェント言語モデル(Conversational Agentic Language Model)を導入する。
CoALM-ITを用いて、上位ドメイン固有モデルを上回る3つのモデル、CoALM 8B、CoALM 70B、CoALM 405Bを訓練する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:08:56 GMT)
OptiSeq: Ordering Examples On-The-Fly for In-Context Learning [8.6] OptiSeqは、最適なサンプル順序を効率的に決定する、純粋に推論時間、データセットなしの最適化手法である。
OptiSeqは複数のタスクで5.5~10.5ポイントの精度向上を実現している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:00:03 GMT)
AI-Assisted Decision Making with Human Learning [8.6] 多くの場合、アルゴリズムの優れた性能にもかかわらず、最終的な決定は人間の手に委ねられている。
本稿では,人間がアルゴリズムと繰り返し対話することで学習する,AIによる意思決定設定について検討する。
我々は、アルゴリズムのモデルと人間のモデルとの相違が根本的なトレードオフを生み出すことを観察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:08:21 GMT)
LAMD: Context-driven Android Malware Detection and Classification with LLMs [8.6] 大きな言語モデル(LLM)は、ゼロショット推論と推論機能を備えた有望な代替手段を提供する。
LLMベースのAndroidマルウェア検出を実現するための現実的なコンテキスト駆動型フレームワークであるLAMDを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:01:37 GMT)
SoK: Understanding Vulnerabilities in the Large Language Model Supply Chain [8.6] この研究は、13のライフサイクルステージにまたがる75の著名なプロジェクトにわたって報告された529の脆弱性を体系的に分析する。
その結果、脆弱性はアプリケーション(50.3%)とモデル(42.7%)に集中していることがわかった。
脆弱性の56.7%が修正されているが、これらのパッチの8%は効果がなく、繰り返し脆弱性が発生する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:22:38 GMT)
Quantum Speedups for Multiproposal MCMC [8.6] より高速な量子多目的MCMC戦略であるQPMCMC2を提案する。
QPMCMC2は、多数の提案を計算する際に、ターゲット評価に$mathcalO(P)$と$mathcalO(log P)$ qubitsしか必要としない。
細菌進化ネットワーク上に構築された新しいIsing型モデルにQPMCMC2を適用することで,この柔軟性を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:09:01 GMT)
ProDAG: Projection-Induced Variational Inference for Directed Acyclic Graphs [8.6] 直接非巡回グラフ(DAG)学習は急速に研究の領域を広げている。
データから単一の(点推定)DAGを学習することは統計的かつ計算的に困難であり、もちろん不確実な定量化を提供する。
本研究では,DAGの空間を直接支援する新しい分布に基づくベイズ変分推論フレームワークを開発する。
提案手法であるProDAGは,既存手法よりも高品質なベイズ推定を行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:04:31 GMT)
Approximate Multiagent Reinforcement Learning for On-Demand Urban Mobility Problem on a Large Map (extended version) [8.5] 大規模都市環境における自律型マルチエージェントタクシー経路問題について検討する。
最近の理論では、安定なベースポリシーを持つロールアウトアルゴリズムは、ほぼ最適に近い安定ポリシーを生成することが示されている。
本稿では,計算コストを削減できる近似マルチエージェントロールアウト方式の2相アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:08:53 GMT)
Edge-Colored Clustering in Hypergraphs: Beyond Minimizing Unsatisfied Edges [8.5] 我々は、エッジカラーのハイパーグラフをクラスタリングするためのフレームワークを検討し、そこでは、彼らが参加する主要なマルチウェイインタラクションのタイプに基づいてオブジェクトをクラスタリングすることを目的としている。
よく研究されている1つの目的は、満足できないハイパーエッジの数を最小限に抑えるためにノードを色付けすることである。
最適性は同じだが、近似するよりもはるかに難しい、満足度の高いエッジを最大化する新しいアルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:20:50 GMT)
Capturing Human Cognitive Styles with Language: Towards an Experimental Evaluation Paradigm [8.5] 本研究では,人間の行動に対する言語に基づく認知スタイルモデルを評価するための実験ベースのフレームワークを提案する。
認識スタイルを捉えることを目的とした言語特徴が,中程度から高い精度で参加者の意思決定スタイルを予測できることが判明した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:08:15 GMT)
FedSpaLLM: Federated Pruning of Large Language Models [8.5] 大規模言語モデル(LLM)は最先端のパフォーマンスを実現するが、高い計算量とストレージ要求のためデプロイは困難である。
我々は,LLMの刈り取り専用に設計された最初のフェデレーション学習フレームワークであるFedSpaLLMを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:17:06 GMT)
MLPs at the EOC: Dynamics of Feature Learning [8.4] 本稿では,勾配降下の収束とそれに伴う特徴の学習を説明する理論を提案する。
このような理論は、安定の端(EOS)やカタパルト機構など、実践者が観察する現象もカバーすべきである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:23:33 GMT)
Rapid-stable Collective Charging and Reverse Suppressing in Many-Body Quantum Batteries [8.4] 量子電池の実用化における2つの大きな課題は、高速安定充電を実現する方法と、高速安定充電の逆のメカニズムを特定する方法である。
本研究は, 周囲環境と相互作用する多体帯電QB方式を提案する。
物理動作機構をバッテリシステムとして解析し, 強い環境結合下での高速で安定した集団充電を実現する機構を探索し, 逆機構を抑制する様々な物理手法を詳細に解析する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:18:07 GMT)
An improved wind power prediction via a novel wind ramp identification algorithm [8.4] 本研究では,風速変異同定アルゴリズム,最適化された類似周期マッチングアルゴリズム,風力予測アルゴリズムを組み合わせた統合アルゴリズムを提案する。
提案モデルは優れた性能を示し、電力系統の安全で費用対効果の高い運用のための貴重なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:11:46 GMT)
Noise-resilient solid host for electron qubits above 100 mK [8.3] 10mKの温度では、電子オンソリッドネオン (eNe) 電荷量子ビットは、非常に長いコヒーレンス時間と高い操作率を示す。
電荷非感応性甘味点からeNe量子ビットを離すと、固体ネオンの電荷および熱雑音に対する顕著な耐性を示す。
これらの観測は、より高温で大規模な量子情報処理のための理想的なホストとして固体ネオンを強調している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:32:00 GMT)
Electron flow matching for generative reaction mechanism prediction obeying conservation laws [8.1] この研究は、現代のフローマッチングの深層生成フレームワークを用いて、電子再分配の問題として反応予測の問題を再考する。
我々のモデルであるFlowERは、正確な質量保存を強制することで制限を克服し、幻覚障害モードを解消する。
FlowERはまた、熱力学または動力学的実現可能性の推定を可能にし、反応予測タスクにおける化学直観の程度を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:01:17 GMT)
Bloch Oscillation and Landau-Zener Tunneling of a Periodically Kicked Dirac Particle [8.1] 本研究では, 相対論的スピン-$frac12$粒子の1次元時間周期蹴りディラック方程式によるダイナミクスについて検討する。
運動量空間の異なる振動挙動とゼロ運動量近傍の量子トンネルを観察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:55:23 GMT)
Natural Language Generation from Visual Sequences: Challenges and Future Directions [8.1] 複数の画像やフレームの時間的に順序付けられたシーケンスを扱うタスクは、より広範な、より一般的な問題の一例である、と我々は主張する。
マルチイメージ・テキスト生成の様々な側面と段階からの洞察に基づいて、いくつかのオープンな疑問を強調し、今後の研究方向性を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:48:18 GMT)
Envious Explore and Exploit [8.0] エンビーの経済的概念を用いた探索・探索機構の社会的効果について検討した。
各ラウンドが複数のセッションで構成され,報酬が1ラウンド毎に1回実現される,マルチアームのバンディットのようなモデルを提案する。
欠点としては、後期から後期のユーザーがアーリー・ツー・アーリーのユーザーによって収集された情報を楽しむためである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:00:35 GMT)
Make Making Sustainable: Exploring Sustainability Practices, Challenges, and Opportunities in Making Activities [8.0] 現代製造業者コミュニティにおけるサステナビリティの展望について検討する。
本研究は, 製造プロセスを通じて生じる「無駄」の多様さ, 廃棄物管理戦略(あるいはその欠如), 持続不可能なプラクティスの推進動機, 直面する課題の4つの主要なテーマについて考察した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:28:47 GMT)
AEIA-MN: Evaluating the Robustness of Multimodal LLM-Powered Mobile Agents Against Active Environmental Injection Attacks [8.0] AEIA-MNは、モバイルオペレーティングシステムのインタラクション脆弱性を利用して、そのような脅威に対するMLLMベースのエージェントの堅牢性を評価する。
高度なMLLMでさえこの攻撃に対して非常に脆弱であり、AndroidWorldベンチマークで最大93%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:01:28 GMT)
A Survey of Sim-to-Real Methods in RL: Progress, Prospects and Challenges with Foundation Models [7.9] Deep Reinforcement Learning (RL) は意思決定タスクの解決に有効であることが検討され、検証されている。
しかし, 実世界のデータに制限があり, 有害な行動が生じたため, RLポリシーの学習は主にシミュレータ内で制限される。
本論文はマルコフ決定過程の重要な要素からシム・トゥ・リアルの技法を正式に定式化した最初の分類法である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:57:29 GMT)
Learning-Guided Rolling Horizon Optimization for Long-Horizon Flexible Job-Shop Scheduling [7.8] 長い水平最適化問題(COP)は、拡張時間枠に対する複雑な相互依存的な決定を伴うことが多い。
RHO(Rolling Horizon Optimization)は、問題を短い水平サブプロブレムに分割することでこの問題に対処する。
COPのための最初の学習誘導型RHOフレームワークであるL-RHOについて述べる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:54:54 GMT)
Towards Human Understanding of Paraphrase Types in Large Language Models [7.7] アトミック・パラフレーズ・タイプ(APT)は、パラフレーズを異なる言語的変化に分解する。
APTY(Atomic Paraphrase TYpes)は15のアノテーションによる800の文レベルのアノテーションと単語レベルのアノテーションのデータセットである。
以上の結果から,ChatGPTとDPOで訓練されたLLama 7Bモデルは単純なAPTを生成するが,複雑な構造には耐え難いことがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:39:48 GMT)
Generative AI and Information Asymmetry: Impacts on Adverse Selection and Moral Hazard [7.6] 情報非対称性は、経済市場において有害な選択とモラルハザードをもたらす。
本研究では、生成人工知能(AI)が詳細な情報信号を生成する方法について検討する。
ジェネレーティブAIは、有害な選択とモラルハザードを効果的に軽減し、より効率的な市場効果と社会的福祉をもたらす。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:48:29 GMT)
AI-Enabled Rent-Seeking: How Generative AI Alters Market Transparency and Efficiency [7.6] 生成的人工知能(AI)は、情報環境を変革し、機会と課題の両方を生み出した。
本稿では,ジェネレーティブAIが経済的賃貸購入行動にどのように影響するか,社会福祉に与える影響を考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:40:22 GMT)
Towards Variational Flow Matching on General Geometries [7.6] RG-VFMはユークリッドVFMやベースライン法よりも効率的に幾何学的構造を捉えている。
多様体認識生成モデリングのための堅牢なフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:02:10 GMT)
Asymptotic Optimism of Random-Design Linear and Kernel Regression Models [7.4] ランダムな設計の下で線形回帰モデルの閉形式最適化を導出した。
本研究では,線形回帰モデル,タンジェントカーネル(NTK)回帰モデル,三層完全連結ニューラルネットワークの基本的挙動について検討した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:19:28 GMT)
Variable Read Disturbance: An Experimental Analysis of Temporal Variation in DRAM Read Disturbance [7.4] 読解障害閾値(RDT)の正確かつ徹底的な評価に頼っている最先端の読解障害軽減法
DRAM列のRTTが時間とともに大きく変化し、予測不可能な変化を初めて実験的に実証した。
本稿では,RTTのガードバンドと誤り訂正符号を用いて,時間とともに予測不可能に変化するRTTの存在下での読み出し乱れビットフリップの緩和について論じ,評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:22:42 GMT)
LLMPopcorn: An Empirical Study of LLMs as Assistants for Popular Micro-video Generation [7.3] DeepSeek-V3のような先進的な言語モデルによって、マイクロビデオ生成が人間の作ったコンテンツに匹敵する人気を達成できることを示す。
Promptの拡張により、さらに人気が高まり、ベンチマークでは、LLMのDeepSeek-V3とDeepSeek-R1が強調されている。
この先駆的な研究は、AIが支援するマイクロビデオの作成を前進させ、新たな研究機会を明らかにする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:29:05 GMT)
Boosting Illuminant Estimation in Deep Color Constancy through Enhancing Brightness Robustness [7.3] 我々は、Deep Neural Network-driven Color Constancyモデルにおいて、色の輝度に重要な要因が与える影響を初めて調査する。
本稿では,BREと呼ばれるDNNCCモデルの簡易かつ効果的な輝度向上戦略を提案する。
BREは、DNNCCモデルの明るさ堅牢性を著しく促進し、対向的な明るさトレーニングと輝度コントラスト損失を統合している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:36:10 GMT)
Conditional Max-Sum for Asynchronous Multiagent Decision Making [7.2] 因子グラフとMax-Sumアルゴリズムに基づく動的環境におけるマルチエージェント決定のための新しい手法を提案する。
本研究では,車線自由交通の挑戦的な領域を動機として,ファクタグラフ定式化のためのより現実的な通信フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:16:27 GMT)
Approximate Tree Completion and Learning-Augmented Algorithms for Metric Minimum Spanning Trees [7.2] 任意の距離空間における$n$ポイントの最小スパンニングツリー(MST)を見つけることは、階層的クラスタリングや他の多くのMLタスクの基本的なプリミティブである。
まず,(1)実践的手法を用いて不連結成分の森を発見し,(2)森林の不連結成分を分布木に接続するためのエッジの小さな重み集合を見出した。
2番目のステップを最適に解くには、まだ$Omega(n2)$時間が必要ですが、サブクワッドラティックな2.62近似アルゴリズムを提供しています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:13:46 GMT)
Reasoning and the Trusting Behavior of DeepSeek and GPT: An Experiment Revealing Hidden Fault Lines in Large Language Models [7.1] 低知覚のスイッチング摩擦は、より微妙な振る舞いの変化を考慮しない選択につながる可能性がある。
実験では,信頼のゲーム理論的行動経済学モデルを用いて,OpenAIの信頼行動とDeepSeekのモデルとの信頼行動の相違を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:46:18 GMT)
Adaptive Knowledge Graphs Enhance Medical Question Answering: Bridging the Gap Between LLMs and Evolving Medical Knowledge [7.0] AMG-RAGは、医療知識グラフの構築と継続的な更新を自動化する包括的なフレームワークである。
推論を統合し、PubMedやWikiSearchといった現在の外部証拠を検索する。
MEDQAのF1スコアは74.1%、MEDMCQAの精度は66.34パーセントで、同等のモデルと10倍から100倍のモデルの両方を上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:29:45 GMT)
Fragility-aware Classification for Understanding Risk and Improving Generalization [6.9] リスク・リバースの観点から分類性能を評価する新しい指標であるFragility Index(FI)を導入する。
我々は, クロスエントロピー損失, ヒンジ型損失, リプシッツ損失の正確な修正を導き, 深層学習モデルへのアプローチを拡張した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:44:03 GMT)
Incomplete Graph Learning: A Comprehensive Survey [6.8] 不完全なグラフ学習に関する文献を網羅的にレビューする。
不完全性の種類に応じて不完全グラフ学習手法を分類する。
我々は,現在の課題について議論し,不完全グラフ学習の今後の方向性を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:14:53 GMT)
You need to MIMIC to get FAME: Solving Meeting Transcript Scarcity with a Multi-Agent Conversations [6.7] FAMEは、英語で500のミーティングと、MIMICが制作したドイツ語で300のミーティングのデータセットである。
心理学的根拠を持つ参加者プロファイルを定義することにより、所定の知識ソース上で会議の書き起こしを生成する。
モジュラー後処理ステップはこれらの出力を洗練させ、潜在的反復性を緩和し、過度にフォーマルなトーンを緩和する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:21:22 GMT)
Taxonomy and Analysis of Sensitive User Queries in Generative AI Search [6.7] 私たちは、全国規模の検索エンジンで生成AIモデルを開発、運用した経験を共有します。
本稿では、センシティブな検索クエリのための分類法を提案し、我々のアプローチの概要と、実際のユーザからのセンシティブなクエリに関する包括的な分析報告を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:06:06 GMT)
From Conversation to Automation: Leveraging LLMs for Problem-Solving Therapy Analysis [6.7] 問題解決療法(PST)は、個人がストレスを管理し、個人の問題を解決するのに役立つ。
自動化を試みる前に、PSTの各セッションがどのように実行されるかを明確に理解することが重要である。
我々は、確立されたPSTコアストラテジーと新しいファシリテーティブストラテジーのセットを用いて、PSTアノテーションのための包括的なフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:02:42 GMT)
Blessing of Multilinguality: A Systematic Analysis of Multilingual In-Context Learning [6.7] 混合HRLのデモンストレーションは、英語のみのデモよりも一貫して優れていることを示す。
意外なことに、我々のアブレーション研究は、そのプロンプトに無関係な非英語文が存在することが、測定可能な利益をもたらすことを示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:42:47 GMT)
Code Membership Inference for Detecting Unauthorized Data Use in Code Pre-trained Language Models [6.5] コード事前訓練言語モデル(CPLM)は、ソフトウェア開発やメンテナンスを容易にする様々なタスクに役立てることができるため、大きな注目を集めている。
しかし、CPLMは大規模なオープンソースコードで訓練されており、潜在的なデータ侵害に関する懸念を提起している。
本稿では,CPLM(Code Membership Inference, CMI)タスクにおける不正なコードの使用を検出する研究を開始する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:50:53 GMT)
Fast Multiplication and the PLWE-RLWE Equivalence for an Infinite Family of Maximal Real Subfields of Cyclotomic Fields [6.5] RLWE(Ring Learning With Errors)問題とPLWE(Polynomial Learning With Errors)問題との等価性を実証する。
また、最大実部分体の環内の2つの要素の積を計算するための高速整数についても述べる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:50:40 GMT)
Evaluation of Best-of-N Sampling Strategies for Language Model Alignment [6.5] 報奨モデルを用いたBest-of-N(BoN)サンプリングは、復号時の人間の嗜好とLLM(Large Language Models)を整合させる効果的な戦略であることが示されている。
従来の研究は、目的に対して正規化したBoNサンプリングである正規化BoNサンプリング(RBoN)を提案し、BoNサンプリングよりも優れていることを示した。
本稿では、最悪のRBoNプロキシ報酬に対する理論的に保証されたアプローチであるRBoNサンプリング(SRBoN)と呼ばれるRBoNフレームワークの拡張を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:18:02 GMT)
WaferLLM: A Wafer-Scale LLM Inference System [6.5] 本稿では,最初のウェハスケールLLM推論システムであるWaferLLMを紹介する。
WaferLLMは、ウェハスケールアーキテクチャのユニークなハードウェア特性をキャプチャする新しいPLMRモデルによってガイドされる。
MeshGEMMとMeshGEMVは、ウエハスケールのアクセラレーター上で効果的にスケールするために設計されたGEMMとGEMVの実装である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:16:48 GMT)
Software Security in Software-Defined Networking: A Systematic Literature Review [6.5] SDN(Software-Defined Network)は、データとコントロールプレーンの分離によってネットワーク管理をシフトした。
SDNのプログラム性は人気を高めているが、脆弱性のあるソフトウェアを導入することで攻撃面を拡張する問題を開くかもしれない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:05:21 GMT)
A New Paradigm in Tuning Learned Indexes: A Reinforcement Learning Enhanced Approach [6.5] 本稿ではLearted Index Structuresのエンドツーエンド自動チューニングのための新しいフレームワークであるLITuneを紹介する。
LITuneは、安定的で効率的なチューニングを保証するために、テーラーメイドのDeep Reinforcement Learning (DRL)アプローチを備えた適応的なトレーニングパイプラインを使用している。
LITuneは最大98%のランタイム削減と17倍のスループット向上を実現している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:06:41 GMT)
Structured Sampling for Robust Euclidean Distance Geometry [6.4] 本稿では,スパースアウトレーヤによる距離測定から点の位置を推定する問題に対処する。
Nystr"om法とロバストな主成分分析を用いた新しいアルゴリズムを提案する。
提案アルゴリズムは, スパース値が低い場合であっても, 控えめなアンカー数で精度の高いリカバリを実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:56:08 GMT)
AIDE: AI-Driven Exploration in the Space of Code [6.4] 大規模言語モデル(LLM)を利用した機械学習エンジニアリングエージェントであるAI-Driven Exploration(AIDE)を紹介する。
AIDEは、コード最適化問題として機械学習エンジニアリングをフレーム化し、潜在的なソリューションの空間におけるツリーサーチとして試行錯誤を定式化する。
有望なソリューションを戦略的に再利用し、精製することにより、AIDEは計算資源を効果的に取引し、性能を向上する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:57:21 GMT)
Ethereum Fraud Detection via Joint Transaction Language Model and Graph Representation Learning [6.4] 現在の不正検出方法は、トランザクション内の意味情報や類似性パターンを考慮できない。
本稿では,トランザクション言語モデルとグラフベースの手法を組み合わせたTLMG4Ethを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:26:02 GMT)
Time Series Treatment Effects Analysis with Always-Missing Controls [6.3] 共同創設者と時間的依存関係を考慮に入れながら、イベント期間中にコントロールグループを回復しようとします。
M5 Walmartの小売売上高データに関する実験結果は、潜在的な成果をしっかりと見積もっている。
提案手法は, 常に欠落する制御シナリオだけでなく, 従来の時系列因果推論設定にも適用可能である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:03:36 GMT)
Evaluating many-body stabilizer Rényi entropy by sampling reduced Pauli strings: singularities, volume law, and nonlocal magic [6.3] 任意の整数 $alphage 2$ に対して $alpha$-stabilizer R'enyi entropy (SRE) を評価するための新しい量子モンテカルロ法を提案する。
分割関数比として$alpha$-SREを解釈することにより、虚時パス積分における符号問題を除去する。
この研究は、大規模な多体システムにおけるマジックの役割を探求するための強力なツールを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:01:14 GMT)
BaKlaVa -- Budgeted Allocation of KV cache for Long-context Inference [6.2] BaKlaVaは、モデル全体で個々のKVキャッシュに対して最適なメモリを割り当てる手法である。
LLaMA-3-8BモデルとQwen2.5-7Bモデルについて検討した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:08:29 GMT)
Debiasing Functions of Private Statistics in Postprocessing [6.2] データセットの$n$が公開されていない場合、プライベートな手段としてバイアスのない推定器を導出します。
また、推定器を用いて、記録毎の差分プライバシーに対するバイアスのない変換機構を開発する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:16:37 GMT)
Chronus: Understanding and Securing the Cutting-Edge Industry Solutions to DRAM Read Disturbance [6.2] 本稿では,DRAM-DRAMによる読み出し障害軽減手法の厳密なセキュリティ,性能,エネルギ,コスト分析について紹介する。
PRACの2つの大きな弱点に対処するために,新しいDRAM-die RowHammer緩和機構であるChronusを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:54:49 GMT)
Commonsense Reasoning in Arab Culture [6.1] 我々は,現代標準アラビア語(MSA)における常識推論データセットであるデータセットネームを導入し,メキシコ湾,レバント,北アフリカ,ナイルバレーの13カ国の文化をカバーした。
データセットは、ネイティブスピーカーがそれぞれの国で文化的に関連のある質問を書き、検証することで、ゼロから構築された。
データセット名は12の日常生活ドメインと54のきめ細かいサブトピックにまたがっており、社会規範、伝統、日々の経験の様々な側面を反映している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:49:54 GMT)
Machine Learning for Detecting Steering in Qutrit-Pair States [6.1] 準定値プログラミングを用いて、キュートリット量子系におけるステアビリティ検出のためのデータセットを構築する。
応用として、等方性状態と部分的に絡み合った状態のステアビリティ境界を調べ、新しいステアビリティ状態を求める。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:55:07 GMT)
The Responsible Development of Automated Student Feedback with Generative AI [6.0] AIの最近の進歩、特に大規模言語モデル(LLM)では、スケーラブルで反復可能でインスタントなフィードバックを提供する新たな機会が提示されている。
しかし、これらの技術の実装には、慎重に対処しなければならない多くの倫理的考察も導入されている。
AIシステムの中核となる利点の1つは、ルーチンや日常的なタスクを自動化する能力であり、人間の教育者を解放して、より微妙な仕事をさせる可能性がある。
しかし、自動化の容易さは、少数派や独特な学習者の多様なニーズが見過ごされる「多数派」の暴行を招きかねない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:49:52 GMT)
EDGE: Efficient Data Selection for LLM Agents via Guideline Effectiveness [6.0] 我々は,黄金の回答を必要とせず,情報的サンプルを識別するための新しいアプローチであるEDGEを紹介した。
低いGEスコアは、サンプルに必要な人間の専門知識がガイドラインから欠落していることを示している。
提案手法は,HotpotQAデータセットとWebShopデータセットの競合性を実現し,それぞれ75%と50%の少ないデータを必要とする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:21:18 GMT)
Investigating potential causes of Sepsis with Bayesian network structure learning [6.0] 本研究は、セプシスの潜在的な原因を調べるために、知識と利用可能な病院データを組み合わせる。
臨床専門知識とスコアベース,制約ベース,ハイブリッド構造学習アルゴリズムを組み合わせることで,この問題の根底にある因果構造を考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:36:43 GMT)
A Compact One-Way Fault-Tolerant Optical Quantum Computation [5.9] 一方向量子計算は、普遍的でスケーラブルな計算とフォールトトレラントな量子クラスタを実現するための有望なアプローチである。
ここでは、誤り訂正符号の大多数と互換性のある大規模正準3次元立方体状態を構築するための実験的スキームを提案する。
提案手法は実験的な構成を大幅に単純化し,一方のフォールトトレラントな光量子計算のコンパクト化を実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:56:31 GMT)
Hypernetwork-based approach for optimal composition design in partially controlled multi-agent systems [5.9] 部分的に制御されたマルチエージェントシステム(PCMAS)は、システムデザイナが管理する制御可能なエージェントと、自律的に動作する制御不能エージェントで構成されている。
本研究は,PCMASにおける最適構成設計問題に対処し,システム設計者の問題,制御不能エージェントの最適数とポリシー,制御不能エージェントの問題について検討する。
本稿では,システムの構成とエージェントポリシーを協調的に最適化する,新しいハイパーネットワークベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:35:24 GMT)
Stress Testing Generalization: How Minor Modifications Undermine Large Language Model Performance [5.9] 本稿では,Large Language Models (LLMs) の新規入力に対する脆弱性について検討する。
ベンチマークスコアが高いにもかかわらず、LCMは、マイナーではあるがコンテンツ保存の修正に直面したとき、かなりの精度低下と予期せぬバイアスを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:42:53 GMT)
StructuralSleight: Automated Jailbreak Attacks on Large Language Models Utilizing Uncommon Text-Organization Structures [5.8] 本稿では,ジェイルブレイク攻撃に即時的構造がどう寄与するかを考察する。
長い尾構造に基づく新しい構造レベルアタック手法を提案する。
われわれは、3つのエスカレート攻撃戦略を含む、StructureSleightという自動ジェイルブレイクツールを構築した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:14:46 GMT)
Building Bridges between Regression, Clustering, and Classification [5.8] 本研究では,連続したスカラーターゲットを用いて回帰タスクにおけるモデルのトレーニングを改善する手法を提案する。
本手法は, ターゲットエンコーダと予測デコーダを用いて, 分類とクラスタリングのアプローチにインスパイアされた, 異なる方法でタスクをキャスティングすることに基づいている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:04:36 GMT)
Learning Tree Pattern Transformations [5.8] ツリー$tstar$が他のツリー$tstar$と構造的に異なる理由と理由を説明することは、コンピュータサイエンス全体で遭遇する問題である。
本稿では,サンプルデータから木組間の構造的差異を説明する方法について考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:41:56 GMT)
SparAMX: Accelerating Compressed LLMs Token Generation on AMX-powered CPUs [5.8] 大規模な言語モデルをCPUで加速することにより、より広いAIアクセスを低コストで、消費電力で実現する。
オープンソースでカスタマイズされたスパースカーネルのセットを提供し、任意のPyTorchモデルを高速化します。
我々は、現在のシステム上での1.14倍のスピードアップを達成するために、非構造化空間の使用を初めて実演する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:26:34 GMT)
Fully passive quantum secure direct communication [5.7] 本稿では,完全受動型量子セキュアダイレクト通信プロトコルを提案する。
量子状態とデコイ状態の強度の両方を受動的に調節することにより、サイドチャネルリスクを効果的に排除できる。
本研究は,実践的なQSDCシステムのセキュリティ向上に大きく貢献する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:59:12 GMT)
Fully passive quantum key distribution with parametric down-conversion source [5.7] 完全な受動的ソースは、受動的にデコイ状態を生成し、同時に受動的エンコーディングを実行することができる。
既存の完全受動QKDプロトコルと実験は位相ランダム化されたコヒーレントパルスを利用する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:57:05 GMT)
FedShift: Robust Federated Learning Aggregation Scheme in Resource Constrained Environment via Weight Shifting [5.7] フェデレートラーニング(FL)は通常、分散クライアント間のトレーニングを調整するために中央サーバーに依存します。
クライアントは、ハードウェアまたはネットワークの制約に基づいて異なる量子化レベルを使用し、サーバで混合精度の集約プロセスを必要とする。
本稿では,FLシナリオの性能劣化を定量化の混合レベルで緩和する新しいアグリゲーション手法であるFedShiftを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:15:33 GMT)
VividMed: Vision Language Model with Versatile Visual Grounding for Medicine [5.7] 医用視覚基盤を用いた視覚言語モデルVividMedを提案する。
我々のモデルはセマンティックセグメンテーションマスクとインスタンスレベルのバウンディングボックスの両方を生成することをサポートしている。
VividMedは、VQA(Visual Question Answering)やレポート生成など、他の一般的な下流タスクにも長けている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:49:57 GMT)
A Fuzzy Evaluation of Sentence Encoders on Grooming Risk Classification [5.6] 子どもたちは、オンライン環境におけるグルーミングのリスクに対して、ますます脆弱になりつつある。
捕食者は間接的および符号化された言語による検出を避ける。
これまでの研究では、チャット会話におけるグルーミングを自動的に識別するために、微調整されたトランスフォーマーが用いられてきた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:26:46 GMT)
PKE and ABE with Collusion-Resistant Secure Key Leasing [5.5] PKE-CR-SKL(PKE-CR-SKL)のコラシオン耐性セキュリティについて紹介する。
このモデルでは、複数の量子復号鍵を適応的に取得し、検証オラクルにアクセスすることができる。
公開鍵と暗号文のサイズは、生成された量子復号鍵の総数に依存していなければならない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:19:54 GMT)
On-Device LLMs for Home Assistant: Dual Role in Intent Detection and Response Generation [5.5] 本稿では,Large Language Models (LLM) が,スマートホームアシスタントのためのスロットとインテントの検出と自然言語応答生成という2つのタスクを遂行できるかどうかを検討する。
LLMを微調整してアクションコールとテキスト応答の両方を生成します。
実験により、16ビットおよび8ビットの量子化変種はスロットとインテントの検出において高い精度を保ち、生成したテキストの強いセマンティックコヒーレンスを維持することを示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:03:17 GMT)
The Majority Vote Paradigm Shift: When Popular Meets Optimal [5.4] マジョリティ投票(Majority Vote、MV)は、投票数が最も多いクラスラベルを選択する。
本稿では,MVがラベル推定誤差に基づいて理論的に最適な下界を実現する条件を特徴付ける。
この最適性の証明は、ラベルアグリゲーションのためのモデル選択により原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:37:33 GMT)
Synthetic Data Generation for Culturally Nuanced Commonsense Reasoning in Low-Resource Languages [5.4] 1) LLM支援データセット生成, (2) 機械翻訳, (3) ネイティブ話者による人書きデータから, 文化的に曖昧なストーリー理解データセットを構築するための3つのデータセット作成戦略を比較した。
以上の結果から,LLMによるデータ生成は機械翻訳より優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:14:58 GMT)
Architect of the Bits World: Masked Autoregressive Modeling for Circuit Generation Guided by Truth Table [5.3] 本稿では,回路生成のための条件生成モデルと微分可能なアーキテクチャ探索(DAS)を組み合わせた新しい手法を提案する。
まず、Circuit AutoEncoderに基づいてトレーニングされた回路トークンであるCircuitVQを紹介する。
次に,トークンとしてCircuitVQを活用するマスク付き自己回帰モデルであるCircuitARを開発した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:13:03 GMT)
TransfoRhythm: A Transformer Architecture Conductive to Blood Pressure Estimation via Solo PPG Signal Capturing [5.3] 本稿では,最近リリースされた生理学データベースMIMIC-IV上に構築されたトランスフォーマーベースのアーキテクチャであるTransfoRhythmフレームワークを紹介する。
本研究は,カフレスBP推定にMIMIC IVデータセットを適用した最初の研究である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:44:29 GMT)
SEFL: Harnessing Large Language Model Agents to Improve Educational Feedback Systems [5.2] Synthetic Educational Feedback Loops (SEFL)は、大規模に即時かつオンデマンドなフィードバックを提供するように設計された新しいフレームワークである。
2つの大きな言語モデル(LLM)は、課題完了と形式的フィードバックをシミュレートするために教師の役割で機能する。
また,SEFL調整モデルでは,フィードバック品質,明瞭度,タイムラインの非チューニングモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:09:29 GMT)
Community Notes Moderate Engagement With and Diffusion of False Information Online [5.2] 我々は,X(旧Twitter)が採用したファクトチェック機能であるCommunity Notesの因果効果を推定し,偽コンテンツに対するファクトチェックノートの要請と拒否的評価を行う。
事実確認ノートの添付は偽コンテンツのエンゲージメントと拡散を著しく減少させることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:50:58 GMT)
Efficient OpAmp Adaptation for Zoom Attention to Golden Contexts [5.2] 大規模言語モデル(LLM)は質問応答(QA)タスクにおいて大きな可能性を示している。
彼らのパフォーマンスはノイズの多い参照文書によって妨げられ、しばしば本質的な情報から妨げられる。
動作増幅器 (OpAmp) に動機付け, これらの課題に対処するためのOpAmp適応を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:35:20 GMT)
Processing and Decoding Rydberg Leakage Error with MBQC [5.2] 本稿では,測定に基づく量子計算において,ライドバーグの漏洩誤差を管理する新しい手法を提案する。
我々は、トポロジカルクラスタ状態の固有構造と最終リーク検出情報を活用して、Rydbergリークから伝播エラーを検出する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:14:04 GMT)
Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity [5.1] エンコーダをサンプルごとの最適化手順に置き換えることで圧縮の限界を示す。
我々は、圧縮限界が入力の長さではなく、減少する不確実性の量によって決定されることを実証的に示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:08:45 GMT)
Conditional Mutual Information and Information-Theoretic Phases of Decohered Gibbs States [5.1] マルコフネットワークに局所散逸を加えると、それをアンフィデントマルコフネットワークへと変換する。
低温隠れマルコフネットワークは長距離CMIを維持可能であることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:00:02 GMT)
Scientific Machine Learning of Flow Resistance Using Universal Shallow Water Equations with Differentiable Programming [5.1] 我々はハイブリッド流体力学モデリングのための普遍的なSWE解法であるHydrogradを開発した。
正確に前方シミュレーションを行い、自動微分をサポートし、物理発見のための科学的機械学習を実行することができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:07:14 GMT)
Unsupervised Anomaly Detection through Mass Repulsing Optimal Transport [5.0] 我々は,最小の努力目標を維持しつつ,サンプルの質量移動を強制的に強制して異常検出に取り組む。
これらの概念を使って、新しい異常スコアを設計します。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:54:12 GMT)
Task Shift: From Classification to Regression in Overparameterized Linear Models [5.0] 類似したデータ分布の下で、潜伏知識がより困難なタスクに転送される現象について検討する。
分類のための最小ノルム補間器は、事前回帰に転送できないが、驚くほど構造化された減衰を経験し、限られた追加データでタスクシフトを成功させることができることを示した。
以上の結果から,最小ノルム補間器は事前回帰に移行できないが,意外な構造的減衰を経験し,限られたデータでタスクシフトを成功させることができた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:16:01 GMT)
Evaluating Language Models on Grooming Risk Estimation Using Fuzzy Theory [5.0] 本稿では,SBERTが会話に固有のグルーミングリスクを効果的に識別できるかどうかを検討する。
分析の結果,微調整は学習における言語モデルによる手入れスコアの割り当てを支援するが,予測のばらつきは高いことがわかった。
これらの誤りは、(1)間接的な音声経路を用いて被害者を操り、(2)性的に露骨な内容が欠如している場合に現れる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:59:54 GMT)
MediaMind: Revolutionizing Media Monitoring using Agentification [5.0] 本稿では, エージェント化プロセスの実証を目的としたケーススタディとしてMediaMindを紹介する。
本稿では,MediaMindのプロファイリングの背景にある技術方法論と原則に焦点をあてる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:05:38 GMT)
VarGes: Improving Variation in Co-Speech 3D Gesture Generation via StyleCLIPS [5.0] VarGesは、共同音声ジェスチャ生成を強化するために設計された、新しい変分駆動フレームワークである。
提案手法は,ジェスチャの多様性と自然性の観点から,既存の手法よりも優れるベンチマークデータセットで検証されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:07:39 GMT)
Masking the Gaps: An Imputation-Free Approach to Time Series Modeling with Missing Data [5.0] 我々は、Missing Feature-aware Time Series Modeling (MissTSM)と呼ばれる、時系列における欠落値を扱う新しい計算不要な手法を提案する。
まず、時間ステップと特徴(またはチャネル)の組み合わせをそれぞれ別個のトークンとして扱う新しい埋め込み方式を開発し、また、部分的に観察された特徴に基づいて各時間ステップで潜在表現を学習する新しい特徴認識層(MFAA)を導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:42:26 GMT)
RAMPA: Robotic Augmented Reality for Machine Programming by DemonstrAtion [5.0] 本稿では,RAMPA(Robotic Augmented Reality for Machine Programming by Demonstration)を紹介する。
RAMPAは、最初のML統合XR駆動のエンドツーエンドロボットシステムであり、ProMPのようなMLモデルのトレーニングとデプロイをオンザフライで行うことができる。
提案手法は,ユーザの物理的環境内で直接,スキルデモのその場でのデータ記録,可視化,微調整を可能にする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:11:47 GMT)
Comparing Unidirectional, Bidirectional, and Word2vec Models for Discovering Vulnerabilities in Compiled Lifted Code [5.0] 本研究は,一方向変圧器を用いた埋め込み,特にGPT-2の適用について検討する。
本研究は,GPT-2モデルからの埋め込みがBERTとRoBERTaの双方向モデルよりも有意に優れていることを明らかにする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:49:04 GMT)
Towards identifying possible fault-tolerant advantage of quantum linear system algorithms in terms of space, time and energy [4.8] 耐故障性超伝導デバイスにおける空間,時間,エネルギー資源の詳細な評価を行う。
我々の研究は、フォールトトレラントな量子コンピュータが現実世界にまつわる問題に対して、可能で重要な利益を達成するためにどれだけ進歩すべきかを定量的に決定する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:35:48 GMT)
Conformal Prediction as Bayesian Quadrature [4.8] 共形予測のような分布のない不確実性定量化技術は、損失ブラックボックスモデルが生じることを保証します。
我々はベイズの観点から共形予測の中心的側面を再考し、頻繁な保証の欠点を解明する。
我々は、解釈可能な保証を提供し、テスト時に観測される可能性のある損失の範囲をよりリッチに表現するベイズ二次法に基づく実用的な代替案を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:06:21 GMT)
A Survey on Bridging EEG Signals and Generative AI: From Image and Text to Beyond [4.7] Brain-Computer Interfaces (BCI) とGenerative Artificial Intelligence (GenAI) の統合により、脳信号復号における新たなフロンティアが開かれた。
近年、GAN(Generative Adversarial Networks)やLLM(Transformer-based Large Language Models)といったディープラーニングの進歩により、脳波による画像、テキスト、音声の生成が大幅に改善されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:49:49 GMT)
Uncertainty Propagation for Echocardiography Clinical Metric Estimation via Contour Sampling [4.7] 本稿では,セグメンテーションではなくコンツーリングに基づく新しい不確実性推定手法を提案する。
提案手法は, コントゥーア作業に対する正確な不確実性評価だけでなく, 2つの心臓超音波データセットの下流臨床指標にも有効である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:26:16 GMT)
Reconstructing physiological signals from fMRI across the adult lifespan [4.7] fMRIデータから低周波呼吸量(RV)と心拍変動(HR)の2つの重要な生理的シグナルを再構成するための新しい枠組みを提案する。
本手法は, 成人期の幅広い個体のfMRIデータから直接, 重要な生理的変数を推測する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:09:22 GMT)
Error Bound Analysis for the Regularized Loss of Deep Linear Neural Networks [4.6] 深部線形ネットワークの正則化二乗損失の局所的幾何学的景観を特徴付ける。
エラーホールドの下の十分かつ必要な条件を特定します。
本研究では,線形ネットワークの正規化損失に対して勾配が線形収束を示すことを示す数値実験を行った。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:13:36 GMT)
Dynamic Chain-of-Thought: Towards Adaptive Deep Reasoning [4.6] 本研究では、適応的な推論時間とステップを持つ動的連鎖(D-CoT)を提案する。
実験の結果,D-CoTは3つの指標(推論時間,CoT長さ(推論ステップ),トークン数)で,DeepSeek R1よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:07:49 GMT)
AutoAgent: A Fully-Automated and Zero-Code Framework for LLM Agents [4.6] 大規模言語モデル (LLM) エージェントはタスクの自動化とインテリジェントな意思決定において顕著な能力を示した。
これらのフレームワークは、主に開発者に対して広範な技術的専門知識を提供する。
世界の人口の0.03%のみが必要なプログラミングスキルを持っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:23:25 GMT)
BiLD: Bi-directional Logits Difference Loss for Large Language Model Distillation [4.6] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにまたがる例外的な機能を示している。
知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を移すことによって解を提供する。
本稿では,LLMのロージットレベルでのタスク特異的蒸留について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:14:57 GMT)
Efficient Machine Translation Corpus Generation: Integrating Human-in-the-Loop Post-Editing with Large Language Models [4.6] 本稿では,機械翻訳コーパス生成のための高度な手法を提案する。
セミオートマチックでヒューマン・イン・ザ・ループのポスト編集と大きな言語モデル(LLM)を統合し、効率性と翻訳品質を向上させる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:16:38 GMT)
Introducing Context Information in Lifelong Sequential Modeling using Temporal Convolutional Networks [4.6] 本稿では,TCN(Temporal Convolutional Network)を用いて,各項目のコンテキスト認識表現を生涯にわたって生成する新しいネットワークを提案する。
また、ユーザの基本プロファイル機能に基づいた畳み込みフィルタを作成するために、軽量なサブネットワークも組み込んだ。
その結果,提案するネットワークは,予測精度とオンラインパフォーマンス指標の観点から,既存の手法を超越していることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:24:53 GMT)
Neuron Platonic Intrinsic Representation From Dynamics Using Contrastive Learning [4.5] 我々はNeurPIR(Neuron Platonic Intrinsic Representation)フレームワークを提案する。
対照的な学習を使用し、正の対と同じニューロンのセグメントと、負の対である異なるニューロンのセグメントを持つ。
我々はIzhikevichモデルを用いた神経集団動態データを用いて実験を行った。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:07:58 GMT)
Two Tickets are Better than One: Fair and Accurate Hiring Under Strategic LLM Manipulations [4.5] 大規模言語モデルを用いた操作に適した戦略分類フレームワークを新たに導入する。
提案手法では,求人アルゴリズムが提案した履歴書に付加的な操作を施す。
我々は,雇用成果がグループに依存しない決定に収束し,差分アクセスによる格差を解消することを証明する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:01:04 GMT)
Sample Efficient Omniprediction and Downstream Swap Regret for Non-Linear Losses [4.5] 「決定スワップ後悔」は、下流スワップ後悔と全滅の予測を一般化する。
また、オンライン逆数設定において、任意の多次元リプシッツ損失関数に対してそれを得るアルゴリズムも提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:01:52 GMT)
Reputation Management in the ChatGPT Era [4.5] 生成型AIシステムは、たとえ明示的にそうするように指示されていなくても、実人のアウトプットを生成することが多い。
本稿では,これらの個人を保護するための法的手段について考察し,特に名誉とデータ保護に関する法律に焦点をあてる。
我々は、これらの個人主義的救済の限界に言及し、情報圏を生成AIから保護するためのより体系的で環境的なアプローチの必要性を示唆する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:23:03 GMT)
Value Gradient Sampler: Sampling as Sequential Decision Making [4.5] 本稿では,サンプリングを離散時間逐次意思決定として解釈したトレーニング可能なサンプリング手法を提案する。
VGSは、ある非正規化密度(すなわちエネルギー)からランダムな粒子の漂流と拡散によってサンプルを生成する。
産業用異常検出アプリケーションにおけるエネルギーベースモデルの正確なトレーニングにおけるVGSの有効性を実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:02:30 GMT)
Exploring Data Management Challenges and Solutions in Agile Software Development: A Literature Review and Practitioner Survey [4.5] ソフトウェア製品とその開発に関連するデータを管理することは、ソフトウェアプロジェクトやアジャイルチームにとって大きな課題となる。
これには、さまざまなソースからのデータを統合し、継続的な変更と適応の中でデータ品質を保証することが含まれる。
この論文はアジャイルプロジェクトのデータ管理の課題と潜在的な解決策を体系的に検討している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:06:56 GMT)
GPU Memory Usage Optimization for Backward Propagation in Deep Network Training [4.4] 本稿では,モデルトレーニング中の最小ピークメモリ使用量を達成するために,最適チェックポイントサブセットの探索に着目する。
まず,数式を用いたニューラルネットワークの学習の理論的背景について述べる。
我々はこれらの方程式を用いて、モデルの重みの勾配を計算するために、前と後の両方の段階で必要となるすべての必須データを識別する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:26:39 GMT)
Theoretical Guarantees for Minimum Bayes Risk Decoding [4.4] 最小ベイズリスク(MBR)復号法は,高い確率で最適解に近づき,その確率は$Oleft(n-frac12right)$である。
この結果は、MBR復号化に関するいくつかの先行的な実証研究で観察された強い性能を理論的に説明するのに役立ちます。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:43:15 GMT)
Circuit Representation Learning with Masked Gate Modeling and Verilog-AIG Alignment [4.4] MGVGAは、マスクゲートモデリング(MGM)とVerilog-AIGアライメント(VGA)を組み合わせた新しい制約付きマスクモデリングパラダイムである。
MGMは、元の回路ではなく、潜在空間のゲートをマスキングすることで論理的等価性を保ち、その後これらのマスキングゲートの特性を再構築する。
この能力に基づいて、VGAは元の回路でマスク操作を行い、等価なVerilog符号の制約の下でマスクされたゲートを再構築する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:48:16 GMT)
Pruning as a Defense: Reducing Memorization in Large Language Models [4.3] 大規模な言語モデルは、トレーニングデータのかなりの部分を記憶することが示されている。
本研究は, 簡単な刈り取り技術がこの挙動に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:32:10 GMT)
The Early Days of the Ethereum Blob Fee Market and Lessons Learnt [4.2] EIP-4844は、レイヤ2プロトコルのデータ可用性のニーズを満たすように設計されたブロブトランザクションを導入した。
この研究は2024年3月13日以来、トランザクションレベルのデータとメムプールレベルのデータの厳密かつ包括的な分析である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:47:49 GMT)
When Segmentation Meets Hyperspectral Image: New Paradigm for Hyperspectral Image Classification [4.2] ハイパースペクトル画像(HSI)分類は、リモートセンシングの基盤であり、豊富なスペクトル情報を通じて正確な材料と土地被覆の識別を可能にする。
ディープラーニングはこのタスクに大きな進歩をもたらしたが、小さなパッチベースの分類器は進歩の90%以上を占めており、制限に直面している。
本研究では, HSI分類のための新しいパラダイムとベースラインであるHSIsegを提案し, これらの課題を克服するために, 分割手法と新しい動的シフト地域変換器(DSRT)を組み合わせる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:04:29 GMT)
GPUDrive: Data-driven, multi-agent driving simulation at 1 million FPS [4.2] GPUDriveはMadrona Game Engine上に構築されたGPUアクセラレーションされたマルチエージェントシミュレータである。
Open Motionデータセット上で強化学習エージェントをトレーニングし、数分で効率的な目標達成を実現し、数時間で数千のシナリオにスケールアップします。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:09:38 GMT)
A Closer Look at Mortality Risk Prediction from Electrocardiograms [4.2] 我々は、Code-15およびMIMIC-IVデータベースにおける全原因死亡を予測する500以上のAI-ECGサバイバルモデルをベンチマークした。
ボストン小児病院(BCH, 225,379ECGs)のデータセットに対する最高のパフォーマンスのアプローチを拡張する。
ECGと人口統計学で訓練された最高パフォーマンスのDeep-Survival-Analysisモデルは、良質なConcordance Indicesを生み出す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:02:43 GMT)
Mind the Gap: Aligning the Brain with Language Models Requires a Nonlinear and Multimodal Approach [4.2] 自己教師型言語と音声モデルは、音声に対する脳反応を効果的に予測する。
従来の予測モデルは、ユニモーダル特徴からの線形写像に依存している。
本稿では,事前学習モデルの音声特徴と言語特徴を組み合わせた非線形・マルチモーダル予測モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:33:28 GMT)
LieRE: Generalizing Rotary Position Encodings [4.1] Rotary Position (RoPE) は言語モデルにおいて一般的な選択肢となっている。
RoPEは1次元のシーケンスデータに制約される。
LieREは、RoPEのブロック2D回転行列を、可変空間の学習された高次元回転行列に置き換える。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:52:29 GMT)
Constrained Online Convex Optimization with Polyak Feasibility Steps [3.9] 固定制約関数 $g : mathbbRd rightarrow mathbbR$ を用いてオンライン凸最適化について検討する。
制約満足度$g(x_t) leq 0 forall in [T]$, and matching $O(sqrtT)$ regret guarantees。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:26:20 GMT)
MOLLM: Multi-Objective Large Language Model for Molecular Design -- Optimizing with Experts [3.9] 分子設計は、薬物発見、材料科学、化学工学といった分野の発展に重要な役割を果たしている。
分子設計のための多目的大規模言語モデル(MOLLM)は、ドメイン固有の知識と大規模言語モデルの適応性を組み合わせた新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:25:00 GMT)
Through the Looking-Glass: Transparency Implications and Challenges in Enterprise AI Knowledge Systems [3.9] 視線ガラスのメタファーを提示し、それをAI知識システムを反射・歪曲するシステムとして概念化する。
我々は,AI知識システムの価値,すなわちシステム透過性,手続き的透明性,成果の透明性を実現するために必要な3つの透明性次元を同定する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:20:02 GMT)
Leveraging Intermediate Representations for Better Out-of-Distribution Detection [3.9] 現実世界のアプリケーションでは、機械学習モデルは、安全でない決定を防ぐために、確実にアウト・オブ・ディストリビューション(OoD)サンプルを検出しなければなりません。
中間層の識別能力を分析し,OoD検出に有効であることを示す。
複数のデータセットにまたがって総合的な評価を行うことで,中間層アクティベーションによりOoD検出性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:38:19 GMT)
Implicit Repair with Reinforcement Learning in Emergent Communication [3.9] 我々は、通信チャネルにノイズを加え、エージェントが受信した入力を追加することで、Lewis Gameと呼ばれるシグナリングゲームを拡張することに重点を置いている。
分析の結果,エージェントが送信メッセージに冗長性を加えることで,タスク成功に対するノイズの負の影響を防止できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:09:53 GMT)
SPARC: Spectral Architectures Tackling the Cold-Start Problem in Graph Learning [3.9] データ内の複雑な関係をモデル化する上で、グラフは中心的な役割を果たす。
ほとんどのグラフ学習手法は、コールドスタートノードに直面するとフェールする。
本稿では、一般化可能なスペクトル埋め込みを利用して、グラフ学習に新しいアプローチを導入する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:27:08 GMT)
Could AI Leapfrog the Web? Evidence from Teachers in Sierra Leone [3.8] サハラ以南のアフリカの人口の37%のみが移動ブロードバンド信号を持っている。
データコストは、アフリカ全体でインターネット利用が低かった理由として最もよく引用される。
教師は、Web検索よりもAIを頻繁に利用している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:11:08 GMT)
Sublinear-Overhead Secure Linear Algebra on a Dishonest Server [3.8] 我々は、高速、遠隔、およびデータ公開線形代数に対する自然効率性とセキュリティデシラタを述べる。
我々は、満足なアルゴリズムを暗示する行列とベクトル族の存在を予想し、共通暗号仮定に基づくそのようなアルゴリズムを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:05:17 GMT)
An Experimental Study of SOTA LiDAR Segmentation Models [3.8] ポイントクラウドセグメンテーション(ポイントクラウドセグメンテーション、英: Point cloud segmentation、PCS)とは、ポイントクラウドの各ポイントを分類することである。
PCSモデルは、大まかにポイント、ボクセル、レンジイメージベースモデルに分けられる。
最先端の点-, ボクセル-, レンジ画像ベースモデル間の総合的な比較は報告されていない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:48:22 GMT)
Media Slant is Contagious [3.8] 1995年から2008年までのアメリカにおける地元新聞の党派スラントに対するFox News Channelの影響を報告する。
高いFNCビューアシップにより、地元新聞はより右派スラントを採用することになる。
新聞のスラントの変化の主な要因は、地元の政治的嗜好の変化であるようだ。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:42:20 GMT)
Wi-Chat: Large Language Model Powered Wi-Fi Sensing [3.7] LLMを利用した最初のWi-Fiによる人間行動認識システムであるWi-Chatを紹介する。
我々は,LLMが生のWi-Fi信号を処理し,Wi-Fiセンシングの原則をプロンプトに組み込むことで,人間の活動を推測できることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:43:31 GMT)
Strands Rocq: Why is a Security Protocol Correct, Mechanically? [3.7] StrandsRocq は Coq のストランド空間の機械化である。
新しい証明技法と、新しい最大貫入器の概念が組み込まれている。
これは2つの単純な認証プロトコルに対するセキュリティの合成証明を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:34:58 GMT)
Sable: a Performant, Efficient and Scalable Sequence Model for MARL [3.7] 我々は、MARLに高性能で、メモリ効率が高く、スケーラブルなシーケンスモデリングアプローチであるSableを紹介した。
SableはRetentive Networksの保持機構に適応して、マルチエージェント観測の計算的に効率的な処理を実現する。
我々は、Sableが既存の最先端メソッドを多種多様なタスクで大幅に上回っていることを実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:15:20 GMT)
When People are Floods: Analyzing Dehumanizing Metaphors in Immigration Discourse with Large Language Models [3.6] 我々は比喩的言語を測定するための計算手法を開発した。
移民談話で引き起こされた7つの概念を識別する。
次に、メタファー、政治的イデオロギー、およびユーザーエンゲージメントの関係を、移民に関する400万件の米国ツイートで調査する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:19:01 GMT)
Multi-Novelty: Improve the Diversity and Novelty of Contents Generated by Large Language Models via inference-time Multi-Views Brainstorming [3.6] LLM(Large Language Models)は、正確で流動的なテキストを生成するのに顕著な習熟度を示す。
彼らはしばしば多様性と斬新さと闘い、反復的あるいは過度に決定論的反応をもたらす。
多様な視点でインプットプロンプトを強化する新しい手法である推論時マルチビューブレインストーミング手法を導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:04:20 GMT)
Navigating Demand Uncertainty in Container Shipping: Deep Reinforcement Learning for Enabling Adaptive and Feasible Master Stowage Planning [3.6] 強化学習(RL)は様々な最適化問題を解く上で有望である。
本研究では,コンテナの出荷におけるRLの利用に焦点を合わせ,マスタ・ストージ・プランニングにおける重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:18:17 GMT)
GAMA: Generative Agents for Multi-Agent Autoformalization [3.5] 大規模言語モデル(LLM)により強化されたエージェントを用いた対話シナリオの自動形式化を実現するフレームワークを提案する。
エージェントは、インタラクションの自然言語記述を、各ゲームのルールを定義する実行可能な論理プログラムに変換する。
トーナメントシミュレーションは、生成されたゲームルールと戦略の機能をテストする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:06:39 GMT)
With a Grain of SALT: Are LLMs Fair Across Social Dimensions? [3.5] 本稿では,ジェンダー,宗教,人種にまたがるオープンソースのLarge Language Models(LLM)におけるバイアスの系統的分析について述べる。
私たちはSALTデータセットを使用して,General Debate, positioned Debate, Career Advice, Problem Solving, CV Generationという,5つの異なるバイアストリガを組み込んでいます。
以上の結果から, モデル間で一貫した分極が明らかとなり, 組織的に好意的あるいは好ましくない治療を受ける集団が存在する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:35:06 GMT)
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives [3.5] 本稿では,ジェネレーティブ・人工知能(GenAI)を利用した子ども向けのストーリーテリングを支援する教育ツールのコンセプトを紹介する。
このシステムは、GenAIによる物語の共創、テキストから音声への変換、およびテキストからビデオへの生成を組み合わせることで、学習者にとって魅力的な体験を生み出す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:48:34 GMT)
Combining Priors with Experience: Confidence Calibration Based on Binomial Process Modeling [3.5] 既存の信頼性校正法は主に統計手法を用いてデータから校正曲線を推定する。
推定キャリブレーション曲線を利用して真のキャリブレーション誤差(TCE)を推定する新しいキャリブレーション計量(TCE_bpm$)を設計する。
実世界およびシミュレーションデータにおいて,キャリブレーション手法と測定値の有効性を検証した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:23:13 GMT)
Analyzing News Engagement on Facebook: Tracking Ideological Segregation and News Quality in the Facebook URL Dataset [3.4] このデータセットは、ソーシャルメディアのエンゲージメントと、誤情報、偏光、消費されるニュースの品質といった社会的問題との関係を分析するために、いくつかの研究で使用されている。
我々は、2017年1月から2020年12月までの4年間をカバーし、米国のニュースURLに関連するユーザーエンゲージメント指標に焦点を当て、人気のあるニュースドメインとのエンゲージメントの包括的分析を行う。
本研究は,データセットが対象とする期間におけるユーザの行動,分極,誤報をよりよく理解するための実証的証拠を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:21:50 GMT)
Optimal Query Allocation in Extractive QA with LLMs: A Learning-to-Defer Framework with Theoretical Guarantees [3.4] 大規模言語モデルは生成タスクでは優れているが、構造化されたテキスト選択では非効率である。
本稿では,専門的な専門家にクエリを割り当て,信頼性の高い予測を確実にする学習者向けフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:25:01 GMT)
EigenLoRAx: Recycling Adapters to Find Principal Subspaces for Resource-Efficient Adaptation and Inference [3.4] Low-Rank Adapters (LoRA)は、大規模なモデルを微調整するための軽量なソリューションを提供する。
パラメータ効率のよいファインタニング手法であるEigenLoRAxを導入し、既存のアダプタをリサイクルして主部分空間を生成する。
これにより、部分空間の主成分の軽量係数のみを学習することで、新しいタスクへの迅速な適応が可能になる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:41:19 GMT)
Large Margin Discriminative Loss for Classification [3.4] 本稿では,Deep Learning の文脈において,大きなマージンを持つ新たな識別的損失関数を提案する。
この損失は、クラス内のコンパクト性とクラス間の分離性によって表現されるニューラルネットワークの識別力を高める。
トレーニングにおける安定性と一貫性を同時に享受する部分運動量更新という戦略を設計する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:03:19 GMT)
MSE-Adapter: A Lightweight Plugin Endowing LLMs with the Capability to Perform Multimodal Sentiment Analysis and Emotion Recognition [3.3] 事前学習言語モデルに基づくマルチモーダル知覚分析(MSA)と会話における感情認識(ERC)は2つの主要な限界を示す。
軽量で適応可能なプラグインとして textbfMultimodal textbfSentiment Analysis と textbfAdapter (MSE-Adapter) を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:06:29 GMT)
Low-loss polarization-maintaining router for single and entangled photons at a telecom wavelength [3.3] テレコムLバンドにおいて、単一光子と絡み合った光子の低損失、ノイズなし、偏光維持ルーティングを実証する。
干渉計をベースとしたルータは、入射角度の低い光学系と直交型電気光学結晶で構成されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:37:14 GMT)
LLM-Powered Proactive Data Systems [3.2] ほとんどのデータシステムは、LSMをユーザ入力とデータをそのまま操作する不透明なブラックボックスとして扱う。
ユーザ入力とデータの理解と再構築には,データシステムにより多くのエージェンシーを与える必要がある,と我々は主張する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:34:45 GMT)
Euskarazko lehen C1 ebaluatzaile automatikoa [3.2] 我々はバスク語の合成がC1レベルに達するかどうかを判断する自動評価器の開発を試みた。
我々は,HABEとHiTZの合意により1万点の書写文を入手し,システムの訓練を行った。
我々は、EDA、SCL、規制など、データの不足やシステムの過度な適合を避けるために、さまざまな手法を開発してきた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:56:32 GMT)
Enhancing Semi-supervised Learning with Noisy Zero-shot Pseudolabels [3.2] ZMT(Zero-Shot Multi-Task Learning)は,ゼロショット擬似ラベルと教師なし表現学習を協調的に最適化するフレームワークである。
本手法では,擬似ラベルを組み込んだマルチタスク学習機構を導入し,擬似ラベルの品質の変動に頑健性を確保した。
ビジョン、言語、オーディオドメインの8つのデータセットを対象とした実験では、ZMTは従来のSSLメソッドと比較してエラーを最大56%削減している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 06:41:53 GMT)
The Cure is in the Cause: A Filesystem for Container Debloating [3.1] トップダウンのコンテナの50%以上が60%以上肥大化しており、BAFFSはコンテナのサイズを大幅に削減している。
サーバレス機能の場合、BAFFSはコールドスタートのレイテンシを最大68%削減する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:12:32 GMT)
Anatomy of Higher-Order Non-Hermitian Skin and Boundary Modes [3.1] 生物直交分極の高次元一般化によるバルクモードの分離ギャップを考慮したアメーバ理論と境界モードの表面ギャップを考慮した一般化されたブリルアンゾーンアプローチが,これらの系を包括的に理解することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:45:13 GMT)
Bayesian Optimization for Non-Convex Two-Stage Stochastic Optimization Problems [2.9] 知識段階に基づく獲得関数を定式化し、最初の変数を協調的に最適化し、一貫性の保証を確立し、近似を与える。
2つの変数型間で交互にフォーカスを減らして定式化する方法と同等な経験結果を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:21:12 GMT)
LayerAct: Advanced Activation Mechanism for Robust Inference of CNNs [2.9] CNNのためのLayerActと呼ばれる新しいアクティベーション機構を提案する。
また,LayerAct関数はElementAct関数よりも優れたロバスト性を示すことを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:12:22 GMT)
Does Training with Synthetic Data Truly Protect Privacy? [2.8] コアセット選択,データセット蒸留,データフリーな知識蒸留,拡散モデルから生成された合成データという,4つの異なる訓練パラダイムについて検討する。
データプライバシを保護するための実証的なアプローチには、慎重に厳格な評価が必要だと警告する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:56:52 GMT)
Clinical Document Corpora -- Real Ones, Translated and Synthetic Substitutes, and Assorted Domain Proxies: A Survey of Diversity in Corpus Design, with Focus on German Text Data [2.7] ドイツの厳格なデータプライバシー法により、これらのリソースは安全な臨床データ空間に保管され、臨床外部研究者に対してロックされている。
この状況は、自然言語処理の分野において、データ収集の容易なアクセシビリティと再利用が一般的な実践であるのとは対照的である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:17:34 GMT)
On estimating the trace of quantum state powers [2.6] 量子状態のトレースを推定する計算複雑性を、$n$-qubit混合量子状態$rho$に対して$texttr(rhoq)$で調べる。
我々の高速化は、正のパワー関数の計算可能な一様近似を量子特異値変換に効率よく導入することで達成される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:53:59 GMT)
The Effect of Non-Gaussian Noise on Auto-correlative Weak-value Amplification [2.6] 自動相関弱値増幅法(AWVA)における非ガウス雑音の影響について検討した。
特に、負のdB信号対雑音比、周波数定常雑音、周波数非定常雑音の2種類のノイズについて検討した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:15:55 GMT)
Thinking Outside the (Gray) Box: A Context-Based Score for Assessing Value and Originality in Neural Text Generation [2.5] 価値と独創性を定量的に評価する文脈に基づくスコアを提案する。
このスコアは、学習された分布からのばらつきを育みながら、要求に対する正確さと固執を動機付ける。
我々は、詩生成と数学問題解決の実験を通じて、我々の戦略を検証し、それが生成した解の価値と独創性を高めることを実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:00:01 GMT)
Evaluating and Enhancing Out-of-Domain Generalization of Task-Oriented Dialog Systems for Task Completion without Turn-level Dialog Annotations [2.5] 本研究は,大規模言語モデル(LLM)を自然言語ダイアログのみに微調整してToDタスクを実行できるかどうかを,このようなアノテーションを必要とせずに検討する。
ターンレベルのアノテーションを使わずに微調整されたモデルでは、一貫性のある適切な応答が生成される。
提案するZeroToDは,API呼び出し精度と全体的なタスク完了率を向上させるために,スキーマ拡張機構を組み込んだフレームワークである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:10:51 GMT)
An Algorithm Board in Neural Decoding [2.4] 以前の研究では、運動シナリオにおける教師なしの手法によってデコードされた神経データの対称性が特定された。
本稿では,機械学習と数理統計学の観点から,システム内の分布状態の変化について考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:39:35 GMT)
Exploring the Impact of Dataset Statistical Effect Size on Model Performance and Data Sample Size Sufficiency [2.4] 基礎的な記述的統計測度が、データセットが結果モデルのトレーニングにおいてどれだけ効果的かを示すことができるかどうかを、よりよく確かめるために行われた2つの実験について報告する。
以上の結果から,本手法は適切なサンプルサイズや投影モデルの性能を決定する上では有効ではないことが示唆される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:39:05 GMT)
Toward Foundational Model for Sleep Analysis Using a Multimodal Hybrid Self-Supervised Learning Framework [2.4] 本研究では,PSG(Polysomnography)データを解析するためのマルチモーダルハイブリッド学習フレームワークであるSynthSleepNetを紹介する。
SynthSleepNetは、マスク付き予測とコントラスト学習を効果的に統合し、複数のモードにまたがる相補的特徴を活用する。
3つの下流タスクにわたる最先端のメソッドよりも優れたパフォーマンスを実現した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:11:50 GMT)
Multilingual European Language Models: Benchmarking Approaches and Challenges [2.4] 生成型大規模言語モデル(LLM)は、チャットインタラクションによってさまざまなタスクを解決できる。
本稿では、多言語欧州ベンチマークに着目し、現在の評価データセットの利点と限界について分析する。
本稿では,翻訳品質と文化バイアスを高めるための潜在的な解決策について論じる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:32:17 GMT)
Improving Clinical Question Answering with Multi-Task Learning: A Joint Approach for Answer Extraction and Medical Categorization [2.4] 回答抽出と医療分類の両面でCQAモデルを共同で訓練するマルチタスク学習フレームワークを提案する。
回答の範囲の予測に加えて、我々のモデルは、診断、治療、症状、処置、実験報告の5つの標準化された医療カテゴリに分類する。
その結果、MTLは標準微調整に比べてF1スコアを2.2%改善し、解答分類の精度は90.7%向上した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:20:37 GMT)
A Neural Difference-of-Entropies Estimator for Mutual Information [2.3] 正規化フローを用いた条件密度のパラメータ化に基づく新しい相互情報推定器を提案する。
この推定器は、標準ベンチマークタスクにおけるバイアス分散トレードオフを改善するために、ブロック自己回帰構造を利用する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:48:25 GMT)
Do we still need Human Annotators? Prompting Large Language Models for Aspect Sentiment Quad Prediction [2.3] 本稿では,ASQPタスクにおけるゼロおよび少数ショット学習のための大規模言語モデルの能力について検討する。
F1スコアは最先端の微調整モデルよりわずかに低いが,従来報告されていたゼロショットと少数ショットのパフォーマンスを上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:56:15 GMT)
RingFormer: Rethinking Recurrent Transformer with Adaptive Level Signals [2.3] 本稿では,リング状に繰り返し入力を処理するトランスフォーマー層を1つ導入したリングホルダーを提案する。
これにより、翻訳や画像分類といった様々なタスクにおいて、高い性能を維持しながら、モデルパラメータを大幅に削減できる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:34:31 GMT)
VilBias: A Study of Bias Detection through Linguistic and Visual Cues , presenting Annotation Strategies, Evaluation, and Key Challenges [2.3] VLBiasは、最先端のLarge Language Models(LLM)とVision-Language Models(VLM)を活用して、ニュースコンテンツの言語的および視覚的バイアスを検出するフレームワークである。
本稿では,多様なニュースソースからのテキストコンテンツと対応する画像からなるマルチモーダルデータセットを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:01:51 GMT)
Improving Multi-turn Task Completion in Task-Oriented Dialog Systems via Prompt Chaining and Fine-Grained Feedback [2.2] タスク指向ダイアログ(TOD)システムは、自然言語による複雑なマルチターンタスクの達成を容易にする。
LLMはマルチターンタスク補完を確実に扱うのに苦労する。
本稿では,TODシステムを強化する新しいフレームワークであるRealTODを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:36:19 GMT)
Non-Hermitian ultra-strong bosonic clustering through interaction-induced caging [2.2] 我々は,非エルミタンポンピング,ボソニック相互作用,非自明なバンドトポロジーの3つの相互作用が,超強ボソニック凝縮に繋がる新しいメカニズムを明らかにする。
凝縮の程度は、非エルミート励起状態の相互作用によって引き起こされるトラップによって、自然に期待される範囲を超えている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:39:59 GMT)
Signal Collapse in One-Shot Pruning: When Sparse Models Fail to Distinguish Neural Representations [2.2] 重み選択を最適化するのではなく、緩和信号の崩壊がプルーニングネットワークの精度向上の鍵であることを示す。
トレーニング可能な重みを更新することなく,信号の崩壊に対処するREFLOWを提案する。
我々は、ResNeXt101の精度をImageNetで4.1%未満から78.9%に復元し、重量の20%しか残っていない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:47:33 GMT)
Are Multilingual Language Models an Off-ramp for Under-resourced Languages? Will we arrive at Digital Language Equality in Europe in 2030? [2.1] 大規模言語モデル(LLM)は前例のない能力を示し、ほぼ全ての自然言語処理(NLP)タスクの最先端を定義する。
LLMは、十分な量の事前学習データがある言語に対してのみトレーニングすることができる。
本稿では,技術支援と要約関連作業の観点から,現状を考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:20:27 GMT)
Protecting Human Cognition in the Age of AI [2.1] ジェネレーティブAI(GenAI)の急速な採用は、人間の認知を大きく変えつつある。
本稿では、認知の異なる側面におけるGenAIの影響について、既存の文献を合成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:27:34 GMT)
Biharmonic Distance of Graphs and its Higher-Order Variants: Theoretical Properties with Applications to Centrality and Clustering [2.1] バイハーモニック距離と呼ばれる有効抵抗の変種について検討する。
両調和距離がグラフの大域的位相に対するエッジの重要性を測るという考えを支持する理論的な結果をいくつか証明する。
両高調波および$k$-高調波距離のエッジ中心性とグラフクラスタリングに対する有効性について実験的に検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:50:01 GMT)
VAQUUM: Are Vague Quantifiers Grounded in Visual Data? [2.1] 視覚的文脈における曖昧な量化器の生成や判断において、視覚・言語モデル(VLM)が人間とどの程度互換性があるかを評価する。
我々は、合計1089枚の画像に対して、定量化されたステートメントに関する20300人の評価を含む新しいデータセットVAQUUMをリリースした。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:27:28 GMT)
An LLM-Powered Agent for Physiological Data Analysis: A Case Study on PPG-based Heart Rate Estimation [2.0] 生理的時系列分析のためのLCMを利用したエージェントを開発した。
OpenCHAフレームワーク上に構築された当社のエージェントは,ユーザインタラクションやデータソース,分析ツールを統合したオーケストレータを備えている。
その結果,提案エージェントは,より低い誤差率と信頼性の高いHR推定を行うことで,ベンチマークモデルを大幅に上回ることを示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:09:59 GMT)
CODE-ACCORD: A Corpus of building regulatory data for rule generation towards automatic compliance checking [2.0] CODE-ACCORD (CODE-ACCORD) は、イングランドとフィンランドの建築規則に基づく852の文のデータセットである。
テキスト分類、エンティティ認識、関係抽出など、MLおよび自然言語処理(NLP)タスクをサポートする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:00:19 GMT)
Pitfalls of Scale: Investigating the Inverse Task of Redefinition in Large Language Models [2.0] 逆タスクは、LLM(Large Language Models)がスケールアップするにつれて、潜在的な推論ギャップを明らかにすることができる。
以上の結果から,モデル性能はスケールとともに低下するだけでなく,その誤信も増大することがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:32:11 GMT)
Selective Reviews of Bandit Problems in AI via a Statistical View [1.9] 強化学習(Reinforcement Learning, RL)は、人工知能の分野で広く研究されている分野であり、エージェントと環境との相互作用を通じて意思決定を教えることに焦点を当てている。
鍵となるサブセットには、マルチアーム・バンディット(MAB)と連続アーム・バンディット(SCAB)の問題が含まれ、不確実性の下でのシーケンシャルな意思決定をモデル化する。
本稿では,バンドイット問題の基本モデルと仮定を概説し,集中不平等やミニマックス後悔境界といった非漸近的理論ツールを探求し,探索-探索トレードオフを管理するための頻繁なアルゴリズムとベイズ的アルゴリズムを比較した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:42:49 GMT)
AI and the Transformation of Accountability and Discretion in Urban Governance [1.9] この論文は、人間の裁量を再配置し、特定のタイプの説明責任を再形成するAIの可能性を強調している。
責任あるAI採用のためのフレームワークを推進し、都市のガバナンスが適応的で透明性があり、パブリックな価値と一致し続けることを保証します。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:11:39 GMT)
Huge Ensembles Part II: Properties of a Huge Ensemble of Hindcasts Generated with Spherical Fourier Neural Operators [1.9] 第1部では,球面ニューラル演算子に基づくアンサンブルを作成した。
第2部では,2023年夏の1日7,424人からなる巨大なアンサンブル(HENS)を生成している。
HENSは予測分布の尾部を正確にサンプリングし、内部変数の詳細なサンプリングを行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:13:29 GMT)
Graph Adapter of EEG Foundation Models for Parameter Efficient Fine Tuning [1.9] これらの課題に対処するために,パラメータ効率のよい微細チューニング(PEFT)手法であるEEG-GraphAdapter (EGA)を提案する。
EGAは、GNNベースのモジュールとしてトレーニング済みの時間バックボーンモデルに統合され、バックボーンを凍結し、アダプタのみを微調整できる。
重度抑うつ障害(MDD)と不規則性検出(TUAB)の2つの医療関連下流課題に対する実験的評価 : 背骨BENDRモデルと比較して,EGAがF1スコアで最大16.1%向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:00:21 GMT)
An Empirical Evaluation of Encoder Architectures for Fast Real-Time Long Conversational Understanding [1.9] CNNベースのモデルは動的で、トレーニングが2.6倍速く、推論が80%速く、トランスフォーマーよりもメモリ効率が72%高い。
また、Long Range Arenaベンチマークを用いてCNNモデルを評価し、一般的な長文解析における競合性を実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:40:13 GMT)
Benchmarking MedMNIST dataset on real quantum hardware [1.9] 量子機械学習(QML)は、複雑な分類タスクを解決するために量子システムの計算能力を活用する、有望な領域として登場した。
MedMNISTは、127量子ビットの実際のIBM量子ハードウェア上での医療画像データセットの多種多様なコレクションである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:02:41 GMT)
Huge Ensembles Part I: Design of Ensemble Weather Forecasts using Spherical Fourier Neural Operators [1.9] 機械学習を使って、巨大な天気のアンサンブルのヒンドキャストを生成します。
第1部:球状フーリエニューラル演算子(SFNO)に基づくアンサンブル天気予報システムの構築
パートII: MLの極端な天気予報は信頼性と差別性を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:15:47 GMT)
Towards Quantum Tensor Decomposition in Biomedical Applications [1.8] 本稿では, 生体医学的解析におけるテンソル分解の応用と課題について概説する。
テンソル分解のための量子アルゴリズムの進歩について論じ、量子コンピューティングがどのようにしてこれらの課題に対処できるかを考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:58:35 GMT)
On the Privacy Risks of Spiking Neural Networks: A Membership Inference Analysis [1.8] スパイキングニューラルネットワーク(SNN)は、現実のアプリケーションにおいて、そのエネルギー効率と堅牢性のためにますます研究されている。
本研究では,SNNのMIAに対する感受性について検討する。
MIAは、あるサンプルがトレーニングデータセットの一部であるかどうかを敵が判断しようとする、大きなプライバシー上の脅威である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:19:20 GMT)
SNAT-YOLO: Efficient Cross-Layer Aggregation Network for Edge-Oriented Gangue Detection [1.8] 本モデルでは,石炭ガン検出作業において99.10%の精度で検出を行う。
モデルサイズを38%減らし、パラメータ数を41%減らし、計算コストを40%減らし、画像毎の平均検出時間を1ミリ秒減らした。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:11:16 GMT)
Multimodal Sleep Stage and Sleep Apnea Classification Using Vision Transformer: A Multitask Explainable Learning Approach [1.8] 睡眠段階と睡眠障害の同時分類のための1D-Vision Transformerを提案する。
提案手法は,5段階睡眠分類では78% (0.66) ,睡眠時無呼吸分類では74% (0.58) の総合的精度を示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:48:06 GMT)
Discovering the influence of personal features in psychological processes using Artificial Intelligence techniques: the case of COVID19 lockdown in Spain [1.7] 本研究は、AI技術を用いて、ロックダウン中の心理的状態に対する個人的、社会経済的、一般健康的および生活条件要因の影響を分析した。
評価モデルは高い性能を示し、精度は80%を超え、しばしば90%を超えた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:54:26 GMT)
Model selection for behavioral learning data and applications to contextual bandits [1.7] 動物や人間の学習は、環境に適応した行動をもたらす過程である。
この記事では、個人がどのように学習するかを最もよく説明するモデルを見つけるために、この個々の行動データを使用する方法を紹介します。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:57:00 GMT)
Resource-efficient algorithm for estimating the trace of quantum state powers [1.5] 量子状態のトレースを$textTr(rhok)$, for $k$等量子状態と見積もるのは基本的な課題である。
我々は、$mathcalO(tilder)$ qubitsと$mathcalO(tilder)$ multi-qubit gatesのみを必要とするアルゴリズムを導入する。
我々はアルゴリズムを任意のオブザーバブルに対して$textTr(rhok)$と$textTr(rhok)$の推定にまで拡張する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:33:10 GMT)
MeMo: Towards Language Models with Associative Memory Mechanisms [1.5] 本稿では,階層化連想記憶におけるトークン列を明示的に記憶する言語モデリングの新しいアーキテクチャであるMeMoを紹介する。
MeMoは透過性と、テキストの忘れを含むモデル編集の可能性を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:39:22 GMT)
User Intent to Use DeekSeep for Healthcare Purposes and their Trust in the Large Language Model: Multinational Survey Study [1.5] 大規模言語モデル(LLM)は、インタラクティブな医療資源としてますます役立っているが、ユーザ受け入れは未熟である。
本研究は、DeepSeekを採用するための形状意図と、使いやすさ、知覚的有用性、信頼、リスク知覚がどのように相互作用するかを検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:49:36 GMT)
HyperGCL: Multi-Modal Graph Contrastive Learning via Learnable Hypergraph Views [1.5] グラフコントラスト学習(GCL)は,グラフ表現の改善に顕著な効果を示した。
本稿では,ハイパーグラフの観点から,新しいマルチモーダルGCLフレームワークであるHyperGCLを紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:57:56 GMT)
Derivative-Free Optimization via Finite Difference Approximation: An Experimental Study [1.4] 微分自由最適化(DFO)は、関数評価のみをオラクルで利用できるような複雑な最適化問題の解決に不可欠である。
2つの古典的なイテレーションアプローチは、Kiefer-Wolfowitz (KW) と同時摂動近似 (SPSA) アルゴリズムである。
本稿では,これらの手法の総合的な比較実験を行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:29:21 GMT)
Towards Equitable AI: Detecting Bias in Using Large Language Models for Marketing [1.4] 本研究では,大規模言語モデル(LLM)が生み出す金融関連マーケティングスローガンのバイアスについて検討した。
女性、若年者、低所得者、教育水準の低い者は、高齢者、高所得者、高度に教育を受けた人に比べて、より独特なメッセージを受け取っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:11:16 GMT)
Simple and general bounds on quantum random access codes [1.4] 我々は、d-次元古典アルファベットから選択された n 個の独立変数の完全一般設定に境界を与える。
数値的に、境界は全体としては厳密ではないが、良い近似が得られることを証明している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:33:18 GMT)
Multi-objective Reinforcement Learning with Nonlinear Preferences: Provable Approximation for Maximizing Expected Scalarized Return [1.3] 軌道上の非線形選好を用いた多目的強化学習について検討した。
非線形最適化のためのベルマン最適性の拡張形式を導出する。
アルゴリズムによって計算される最適ポリシーと代替基準との間には,かなりのギャップがあることが示される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:20:50 GMT)
Warm Starting of CMA-ES for Contextual Optimization Problems [1.3] 文脈ベクトルを用いた文脈最適化問題を効率的に最適化するために,CMA-ES-CWSを用いた共分散行列適応進化戦略を提案する。
CMA-ES-CWSは、ガウス過程回帰の後方分布を用いた探索分布を初期化することにより、所定のコンテキストベクトルに対してウォームスタートを実行する。
シミュレーションの結果、CMA-ES-CWSは既存の文脈最適化やウォームスタート法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:41:45 GMT)
State-space models can learn in-context by gradient descent [1.3] 状態空間モデルは、勾配に基づく学習を実行し、変換器と全く同じ方法で、文脈内学習に使用することができることを示す。
具体的には、1つの構造化状態空間モデル層が乗算入力と出力ゲーティングで拡張され、暗黙線形モデルの出力を再現できることを証明した。
また、状態空間モデルと線形自己意識の関係と、文脈内で学習する能力に関する新たな知見を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:55:39 GMT)
Bayesian Physics Informed Neural Networks for Linear Inverse problems [1.3] 逆問題は科学や工学において発生し、間接的な観測から量の推測を行う必要がある。
BPINNの概念は、物理法則とディープラーニング技術を統合して、速度、精度、効率を向上させる。
本研究は,訓練段階における教師なしと教師なしの2症例について考察し,未知変数の後方確率の式を求め,NNパラメータの後方法則を導出する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:52:57 GMT)
AlignFreeze: Navigating the Impact of Realignment on the Layers of Multilingual Models Across Diverse Languages [1.3] 多言語言語モデルにおいて、言語間移動を強化するために、直観的手法がしばしば用いられる。
本稿では,アリンフリーズ(AlignFreeze)について紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:43:27 GMT)
A Survey of Anomaly Detection in Cyber-Physical Systems [1.3] 本稿では,CPSにおける異常検出に対する研究者のアプローチについて概説する。
機械学習、ディープラーニング、数学的モデル、不変量、ハイブリッド技術などの手法を分類し比較する。
私たちのゴールは、読者がこれらの手法の長所と短所を理解し、より安全で信頼性の高いCPSを作成する方法を理解することです。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:38:18 GMT)
UPCMR: A Universal Prompt-guided Model for Random Sampling Cardiac MRI Reconstruction [1.3] 心磁気共鳴画像再構成のためのユニバーサルアンロールモデルであるUPCMRを紹介する。
学習可能なプロンプトは2種類あり、アンサンプ固有のプロンプトと空間固有のプロンプトが組み込まれ、各ブロックにUNet構造が組み込まれている。
効率的なトレーニング戦略により、すべてのランダムサンプリングシナリオにおける再構成画像の品質を高く向上させる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:44:35 GMT)
Flow-of-Options: Diversified and Improved LLM Reasoning by Thinking Through Options [1.2] Flow-of-Options(FoO)は、Large Language Models(LLM)の固有のバイアスに対処するように設計されている。
我々のフレームワークは最先端のベースラインを上回り、標準データサイエンスタスクで38.2%から69.2%の改善を達成した。
全体的な運用コストはタスクあたり1ドル以下なので、当社のフレームワークはコストに敏感なアプリケーションに適しています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:11:46 GMT)
CoCo-CoLa: Evaluating Language Adherence in Multilingual LLMs [1.2] 大規模言語モデル(LLM)は、限られた並列データで訓練されているにもかかわらず、言語間能力を開発する。
多言語LLMにおける言語適応性を評価するための新しい指標であるCoCo-CoLaを紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:03:53 GMT)
Lean-ing on Quality: How High-Quality Data Beats Diverse Multilingual Data in AutoFormalization [1.2] 本稿では,言語モデルの数学的能力を高めるために,手書きのプロンプトを用いた逆翻訳を利用する新しい手法を提案する。
提案手法は,広範囲な多言語データセットを用いた微調整性能を上回ることを示す。
まとめると、我々の手法は、形式化に必要なリソースを大幅に削減し、数学のためのAIを加速する、有望な新しいアプローチを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:16:54 GMT)
Efficient Strategies for Reducing Sampling Error in Quantum Krylov Subspace Diagonalization [1.2] この研究は、射影ハミルトニアンにおける行列要素の測定中のサンプリング誤差の定量化に焦点をあてる。
シフト技術と係数分割の2つの測定方法を提案する。
小分子の電子構造を用いた数値実験は、これらの戦略の有効性を実証している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:26:15 GMT)
Improving Acoustic Side-Channel Attacks on Keyboards Using Transformers and Large Language Models [1.2] 本研究では,アコースティックサイドチャネルアタック(ASCA)の有効性と適用性を高めるための深層学習手法について検討する。
我々は、CoAtNetモデルを用いて、先行研究よりも大幅に改善し、最先端の性能を実現した。
重要な進歩は、現実のシナリオに対するノイズ緩和手法の導入である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:39:49 GMT)
GrainPaint: A multi-scale diffusion-based generative model for microstructure reconstruction of large-scale objects [1.1] 本稿では, この生成領域制限を克服するために, デノナイズ拡散モデルを用いた塗装の進展を利用した新しい微細構造生成手法を提案する。
本研究では, モンテカルロシミュレータSPPARKSを用いて生成した粒状構造に, 統計的に類似していることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:13:32 GMT)
Elfs, trees and quantum walks [1.1] 電気的流れサンプリング(elfs)に基づくグラフ上のマルコフ過程の研究
木上の電気的打撃時間はグラフサイズと重みの対数的であることを示す。
これにより、ランダムなウォーク到着分布からサンプリングする量子ウォークアルゴリズムが得られる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:22:11 GMT)
An Attentive Graph Agent for Topology-Adaptive Cyber Defence [1.1] 我々は,ネットワーク状態を有向グラフとして符号化するCyber Operations Research Gym(CybORG)環境のカスタムバージョンを開発する。
我々は、ノード、エッジ、グローバル機能を処理するために、グラフ注意ネットワーク(GAT)アーキテクチャを使用し、その出力を強化学習におけるポリシー勾配手法と互換性に適応させる。
我々は,シミュレーション中に予期せぬ接続が発生した場合でも,低レベル指向グラフ観測を用いてGAT防御ポリシーを訓練できることを実証した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:19:07 GMT)
Hybrid Quantum-inspired Resnet and Densenet for Pattern Recognition [1.0] パターン認識のための適応的残差と高密度接続を有する2つのハイブリッド量子インスピレーションニューラルネットワークを提案する。
我々は、量子に着想を得た層による勾配爆発を防止するために、ハイブリッドモデルの潜在的な優位性を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:03:59 GMT)
Investigating Issues that Lead to Code Technical Debt in Machine Learning Systems [1.0] 機械学習(ML)システムにおける技術的負債(TD)は、将来の再作業につながる可能性を秘めている。
SEにおけるTDへの関心が高まっているにもかかわらず、ML固有のコード関連TDの理解はいまだに探索されていない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:30:38 GMT)
Learning to Stop Overthinking at Test Time [1.0] テスト時間のスケーリングは、トレーニング時間のスケーリングが限界に達した後に約束される、最も活発な研究領域の1つです。
テスト時間における各サンプルに必要な最適な計算量を決定するためのテスト時間トレーニング手法を提案する。
また,より効率的かつ堅牢な視覚推論のための新しい繰り返しアーキテクチャであるConv-LiGRUを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:41:03 GMT)
ROI-NeRFs: Hi-Fi Visualization of Objects of Interest within a Scene by NeRFs Composition [1.0] 本研究では,ニューラルレージアンス場(NeRF)を用いた大規模シーン内の物体を高精細度で可視化することの課題に対処する。
提案したROI-NeRFsフレームワークは、シーンを、シーン全体を適度な詳細で表現するScene NeRFと、ユーザ定義対象にフォーカスする複数のROI NeRFに分割する。
合成フェーズにおいて、レイレベル構成レンダリング技術は、Scene NeRFとROI NeRFの情報を組み合わせて、同時多目的描画合成を可能にする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:24:15 GMT)
Sorting the Babble in Babel: Assessing the Performance of Language Detection Algorithms on the OpenAlex Database [1.0] 本研究の目的は,OpenAlexデータベースから手作業による注釈付き記事から抽出した,さまざまな言語分類手順,Python言語検出アルゴリズムとメタデータベースのコーパスを組み合わせることにある。
アルゴリズム,コーパス,言語,および各アルゴリズムおよびコーパスタイプに記録された処理速度の精度とリコール性能の解析を行い,データベースレベルでの全体的なプロシージャ性能をシミュレートした。
その結果, プロシージャのパフォーマンスは, 実施した各対策の重要度に大きく依存していることが示唆された。
これらの結果は,OpenAlexデータベースの言語横断的,文献的可能性の検証と育成に有効であることが期待されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:19:04 GMT)
None of the Others: a General Technique to Distinguish Reasoning from Memorization in Multiple-Choice LLM Evaluation Benchmarks [1.0] 本稿では,これまで見られたトークンや概念から正解を完全に解離する,複数選択質問に対する一般的な変分手法を提案する。
この手法を用いて、英語とスペイン語で利用可能な2つのデータセットに基づいて、最先端のプロプライエタリおよびオープンソースLLMを評価する。
その結果, MMLUでは平均57%, UNED-Access 2024では50%の精度低下がみられた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:32:44 GMT)
Adapting Psycholinguistic Research for LLMs: Gender-inclusive Language in a Coreference Context [1.0] 本研究では,大言語モデルがジェンダー非包摂的言語を中立的に解釈するか否かを検討する。
英語では、LLMは一般的に前任者の性別を維持できるが、基礎となる男性偏見を示す。
ドイツ語では、このバイアスはより強く、テストされたすべての性別中立化戦略をオーバーライドする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:42:11 GMT)
Rule-based autocorrection of Piping and Instrumentation Diagrams (P&IDs) on graphs [1.0] 配管・インスツルメンテーション図(P&ID)は化学プロセス工学における中心的な基準文書である。
現在、化学技術者は視覚検査を通じてP&IDを手動でレビューし、エラーを発見し修正している。
本研究では,P&IDの誤り検出と修正を行う技術者を支援するルールベース手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:35:09 GMT)
Reasoning on a Spectrum: Aligning LLMs to System 1 and System 2 Thinking [1.0] 大きな言語モデル(LLM)は印象的な推論能力を示すが、構造化されたステップバイステップの推論に依存しているため、限界が示される。
この作業は、ステップバイステップの推論が常に最適であるという仮定に挑戦し、タスク要求に基づいた推論戦略を適用する必要性を強調します。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:58:37 GMT)
Playing with Voices: Tabletop Role-Playing Game Recordings as a Diarization Challenge [1.0] 本稿では,テーブルトップロールプレイングゲーム (TTRPG) のオーディオがダイアリゼーションシステムの課題であることを示す。
我々は、小さなTTRPGオーディオデータセットを作成し、AMIとICSIコーパスと比較する。
その結果,TTRPGsの特性は両ダイアリザの混乱率が高いことがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:26:49 GMT)
"I'm not for sale" -- Perceptions and limited awareness of privacy risks by digital natives about location data [1.0] 我々は,スマートフォン利用者の位置情報データ共有に対する意識,認識,自己報告行動の定量的,質的な分析を行う。
参加者の約54%は、データへのアクセスを許可したモバイルアプリケーションの数を過小評価している。
被験者の半数以上(57%)が、潜在的に推測される情報の範囲に驚いている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:24:14 GMT)
LGDE: Local Graph-based Dictionary Expansion [0.9] ローカルグラフベース辞書拡張(英: Local Graph-based Dictionary Expansion、LGDE)は、単語の意味的近傍をデータ駆動で発見する手法である。
この結果から,LGDEは,単語の類似性や共起性に基づく手法と比較して,性能の向上を図ったキーワードのリストを充実させることがわかった。
実験結果と専門ユーザ評価の結果から,LGDEは,多様体学習に基づく類似性ネットワークにより,より有用なキーワードでシード辞書を拡張していることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:11:44 GMT)
Can LLMs Extract Frame-Semantic Arguments? [0.9] 本稿では,大規模言語モデル (LLM) をフレーム・セマンティックな引数同定において包括的に評価する。
実験の結果,0.5Bから78Bのパラメータにまたがるモデルでは,表現が性能を著しく向上することがわかった。
予測されたフレーム要素を利用したフレーム識別のための新しい手法を導入し,不明瞭な対象に対する最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:01:50 GMT)
tn4ml: Tensor Network Training and Customization for Machine Learning [0.9] tn4mlは、ニューラルネットワークを機械学習タスクにシームレスに統合するように設計された新しいライブラリである。
既存の機械学習フレームワークにインスパイアされたこのライブラリは、データ埋め込み、客観的関数定義、モデルトレーニングのためのモジュールを備えた、ユーザフレンドリな構造を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:57:29 GMT)
Keep what you need : extracting efficient subnetworks from large audio representation models [0.9] 事前学習された表現モデルの層間において学習可能なバイナリマスクを導入する。
下流タスクでエンド・ツー・エンドのモデルをトレーニングするとき、私たちは全体目標に疎結合による損失を加えます。
トレーニングが完了すると、マスクされた計算ユニットがネットワークから削除され、大幅なパフォーマンス向上が示唆される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:04:33 GMT)
Prosocial Media [0.8] ソーシャルメディアは「ソーシャル・ファブリック」をアルゴリズムで活用し、分散コンテンツ制作を促進する
本稿では、社会的・政治的価値観や慣習、特に社会的結束をプラットフォームデザインに変換するためのオープンかつ継続的な考察に参加する。
本稿では,ソーシャルファブリックを入力だけでなく明示的な出力とする代替プラットフォームモデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:53:20 GMT)
From Abstract to Actionable: Pairwise Shapley Values for Explainable AI [0.8] 提案するPairwise Shapley Valuesは,特徴属性を明示的,人間関連性のある比較に基礎を置く新しいフレームワークである。
本手法では,一値命令と組み合わせたペアワイズ参照選択を導入し,直観的,モデルに依存しない説明を行う。
Pairwise Shapley Valuesは多種多様な回帰・分類シナリオにおける解釈可能性を高めることを実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:20:18 GMT)
Synthesis and Arithmetic of Single Qutrit Circuits [0.8] 本稿では,Clifford$+D$サイクロトミックゲート集合上の単語からなるクォート回路について検討する。
このフレームワークは、任意の素数の四重項に拡張するクリフォード$+D$の四重項ゲート合成を定式化するために開発された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:21:13 GMT)
Task-Oriented Automatic Fact-Checking with Frame-Semantics [0.8] 大規模構造化データに注釈を付けたPoitiFactから抽出した実世界のクレームのパイロットデータセットを紹介する。
このデータセットは、Voteセマンティックフレームを用いた投票関連クレームの調査と、経済協力開発機構(Organization for Economic Co-operation and Development)のデータソースに基づくさまざまなセマンティックフレームの探索という2つのケーススタディを基盤としている。
本研究は, ファクトチェックにおけるエビデンス検索と説明可能性の向上に, フレームセマンティクスの有効性を示すものである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:42:08 GMT)
Continual Learning from Simulated Interactions via Multitask Prospective Rehearsal for Bionic Limb Behavior Modeling [0.8] 生体補綴制御の文脈における人間の行動モデルを提案する。
本稿では、時間とともに動きを予測・洗練するマルチタスク・継続的適応モデルを提案する。
我々は,トランスティバイアル・アンプを含む実世界の人間の歩行データセットの実験を通じて,我々のモデルを検証した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:00:46 GMT)
G-Mapper: Learning a Cover in the Mapper Construction [0.8] Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
本稿では,正規性に関する統計的テストに従って繰り返し被覆を分割することで,Mapperグラフの被覆を最適化するアルゴリズムを提案する。
このアルゴリズムは,アンダーソン・ダーリング試験を反復的に適用することにより,$k$-meansの最適クラスタ数を求めるG平均クラスタリングに基づいている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:25:42 GMT)
Evidence of Replica Symmetry Breaking under the Nishimori conditions in epidemic inference on graphs [0.7] 西森条件下では, レプリカ対称性が崩壊する証拠がある。
この現象の発端は、西森の環境下での複製対称性の破れであり、流行モデルにみられる相関性障害によるものと考えられる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:21:10 GMT)
WeedsGalore: A Multispectral and Multitemporal UAV-based Dataset for Crop and Weed Segmentation in Agricultural Maize Fields [0.7] 雑草は作物の収穫が減少する主な原因の1つであるが、現在の雑草の慣行は、効率的で標的とした方法で雑草を管理するのに失敗している。
農作物畑における作物と雑草のセマンティックスとインスタンスセグメンテーションのための新しいデータセットを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:13:19 GMT)
Enhancing Skin Lesion Classification Generalization with Active Domain Adaptation [0.7] 自己教師付き学習(SSL)とアクティブドメイン適応(ADA)を組み合わせることで皮膚病変分類モデルの一般化を改善する方法を提案する。
このアプローチの主なステップは、自然言語データセット上のSSL事前トレーニングモデルの選択、すべての利用可能なスキンリージョンデータセット上のSSL再トレーニング、ラベル付きソースドメインデータ上のモデルの微調整、ターゲットドメインデータへのADAメソッドの適用である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:21:19 GMT)
XAMBA: Enabling Efficient State Space Models on Resource-Constrained Neural Processing Units [0.6] 状態空間モデル(SSM)は、シーケンシャルなデータタスクのためのトランスフォーマーの効率的な代替手段として登場した。
XAMBAは、商用オフザシェルフ(COTS)のSOTA(State-of-the-art)NPU上でSSMを有効にし、最適化する最初のフレームワークである。
XAMBAはCumBAとReduBAを使用して鍵ボトルネックを緩和し、シーケンシャルなCumSumとReduceeSumを行列ベースの計算に置き換える。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:32:34 GMT)
A New Logic For Pediatric Brain Tumor Segmentation [0.6] 深層学習アーキテクチャを用いた小児脳腫瘍の分節化のための新しいアプローチを提案する。
PED BraTS 2024テストセットに4つの異なる腫瘍ラベルを基準としてベンチマークを行った。
我々は、最先端(SOTA)モデルに対して、我々のモデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:16:41 GMT)
Decentralized and Robust Privacy-Preserving Model Using Blockchain-Enabled Federated Deep Learning in Intelligent Enterprises [0.5] セキュアなブロックチェーンを実現するFederated Deep Learning ModelであるFedAnilを提案する。
エンタープライズモデルの分散化、パフォーマンス、タンパの証明プロパティを改善します。
Sent140、FashionMNIST、FEMNIST、CIFAR10といった新しい実世界のデータセットを用いて大規模な実験を行った。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:17:25 GMT)
Design and Implementation of a Dual Uncrewed Surface Vessel Platform for Bathymetry Research under High-flow Conditions [0.5] 水中地形学の研究であるbathymetryは、水中構造物のソナーマッピングに依存している。
センサーの損傷や血管の喪失に伴う高い財政的リスクは、水位測定のために無人表面船(USV)を配備する難しさを生じさせる。
本稿では,このギャップを2つの相補的なUSVシステムの設計と実装を通じて解決する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:01:10 GMT)
Polarization agnostic continuous variable quantum key distribution [0.5] ガウス変調コヒーレント状態(GCMS)連続可変量子鍵分布(CVQKD)の偏極非依存法を提案する。
光領域における偏光補正は不要であり、両方の偏光モードの監視を必要とせず、光学成分を除去することで損失を低減し、偏光補正アルゴリズムによって注入されるノイズを避ける。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:48:25 GMT)
Malware Detection based on API calls [0.5] 我々は、マルウェアの脅威を検出し緩和するための軽量でオーダー不変なアプローチを探究する。
我々は、良心または悪意のある活動を示すラベルを付した、300万以上のサンプルの公開データセットを公開します。
ランダムな森林のような機械学習アルゴリズムを活用し、API呼び出しシーケンスのパターンや異常を調べて行動分析を行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:51:56 GMT)
Fast Data Aware Neural Architecture Search via Supernet Accelerated Evaluation [0.4] TinyML(TinyML)は、医療、環境モニタリング、産業保守といった分野に革命をもたらすことを約束している。
TinyMLデプロイメントの成功に必要な複雑な最適化は、広く採用されていることを妨げ続けている。
本稿では,最新のデータ認識ニューラルアーキテクチャ検索手法を提案し,新しいTinyML VisionWakeデータセットの有効性を実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:51:03 GMT)
LMN: A Tool for Generating Machine Enforceable Policies from Natural Language Access Control Rules using LLMs [0.4] 自然言語アクセス制御ポリシー(NLACP)と呼ばれるルールやガイドラインは、属性ベースのアクセス制御(ABAC)のようなターゲットアクセス制御モデルでは直接利用できない。
NLACPルールをMESP(Machine Enforceable Security Policies)に手動で翻訳することは、時間とリソースの集中的な消費である。
LMN (LLMs for generate MESPs from NLACPs) と呼ばれる無料の Web ベースツールを開発し,NLACP を入力とし,対応する MESP に変換する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 02:45:46 GMT)
Political Biases on X before the 2025 German Federal Election [0.4] Xのデフォルトフィードは、他の政党よりも極右のAfDからのコンテンツが多いことがわかりました。
パーティーアフィリエイトに関連するエンゲージメント尺度と未知の要因は、Xのデフォルトアルゴリズムフィードにおける極端な表現の過剰表現に寄与する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:02:54 GMT)
Pushing the Limits of the Reactive Affine Shaker Algorithm to Higher Dimensions [0.4] 反応アフィンシェーカー (RAS) は、非常に大きな次元空間を探索するための単純なアルゴリズムである。
その単純さとローカル検索のみの利用にもかかわらず、驚くほど結果がBOの最先端の結果と同等であり、それほど遠くない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:06:20 GMT)
Can You Trust LLM Judgments? Reliability of LLM-as-a-Judge [0.4] 大規模言語モデル(LLM)はますます強力でユビキタスなものになってきていますが、その性質はアウトプットの信頼性に課題をもたらします。
マクドナルドのオメガを利用したLCM判定の信頼性を厳格に評価するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:24:25 GMT)
Swarm Characteristics Classification Using Neural Networks [0.4] 本稿では、ニューラルネットワーク時系列分類(NN TSC)を用いて、軍事的文脈において自律エージェントをスワーミングする重要な属性と戦術を予測する。
NN TSCは2つのバイナリ属性 – 通信と比例ナビゲーション – を推論するために適用され、相互に排他的な4つのSwarm戦術を定義する。
鍵となる発見は、NNが20ステップの短い観察窓を用いて97%の精度でSwarmの挙動を予測できることを示し、50%のノイズ下で80%の精度で優雅な劣化を示すことである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:29:17 GMT)
Application of Context-dependent Interpretation of Biosignals Recognition to Control a Bionic Multifunctional Hand Prosthesis [0.4] 本稿では,表面筋電図駆動補綴(sEMG)の制御法について述べる。
文脈に依存した認識システムは、文脈に応じて同じ種類のsEMG信号が異なる解釈を持つことができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:38:49 GMT)
How does a Language-Specific Tokenizer affect LLMs? [0.4] 言語固有のトークン化器の必要性は、効果的な自然言語処理にとって直感的に重要である。
本研究では、言語固有のトークン化剤が、主に英語のテキストデータを用いて訓練された大規模言語モデルの振る舞いにどのように影響するかを考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:54:56 GMT)
Performance of Zero-Shot Time Series Foundation Models on Cloud Data [0.3] 時系列基礎モデル(FM)は、ゼロショットマルチドメイン予測の一般的なパラダイムとして登場した。
我々は、よく知られたFMが、この設定で意味のある、あるいは正確なゼロショット予測を生成できないことを実証する。
FMが突然、不規則でランダムに見える予測を出力するケースなど、興味深い病理もいくつか紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:28:02 GMT)
Lightweight Online Adaption for Time Series Foundation Model Forecasts [0.3] AdapTSは、オンラインフィードバックに対するFM予測のオンライン適応のための軽量なメカニズムである。
本稿では,一連の標準時系列データセットを対象とした最近のFMと合わせてAdapTSの性能を評価する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:01:02 GMT)
Varco Arena: A Tournament Approach to Reference-Free Benchmarking Large Language Models [0.3] VARCO Arenaは、大規模言語モデルのための新しく、費用対効果が高く、堅牢なベンチマーク手法である。
VARCO Arenaは信頼性の高いLCMランキングを生成するだけでなく、質的評価のためのスケーラブルで適応可能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:59:15 GMT)
Auditing the Fairness of the US COVID-19 Forecast Hub's Case Prediction Models [0.2] US COVID-19 Forecast Hubは、50以上の独立した研究グループによる新型コロナウイルスの予測のリポジトリである。
統計的に有意な多様な社会的要因の予測性能を示す。
今回の取り組みにより、新型コロナウイルス(COVID-19)のモデラーやCDC(疾病予防管理センター)が、公正度指標と精度を報告できることを願っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:21:07 GMT)
Generalizable Graph Neural Networks for Robust Power Grid Topology Control [0.2] グラフニューラルネットワーク(GNN)は、計算におけるグラフ構造を反映したMLモデルのクラスである。
GNN層のみを利用するグリッドトポロジ制御のための最初のGNNモデルを提案する。
我々は、同種および異種GNNと完全連結ニューラルネットワーク(FCNN)の両方を模倣学習タスクに基づいて訓練する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:20:08 GMT)
Ensemble Kalman filter in latent space using a variational autoencoder pair [0.2] 可変オートエンコーダ(VAE)は機械学習(ML)技術で、任意の分布を潜在空間へ/からマッピングすることができる。
本稿では,VAEをDA手順に組み込んだ新しいハイブリッドDA-ML手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:11:05 GMT)
Wormholes in finite cutoff JT gravity: A study of baby universes and (Krylov) complexity [0.2] 有限カットオフJT重力下でのブラックホール内部の成長を計算した。
変形理論のために、赤ちゃんの宇宙の放出確率を計算し、スペクトル形成因子の傾斜に対する影響について言及する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:00:02 GMT)
Computation of the Hilbert Series for the Support-Minors Modeling of the MinRank Problem [0.2] 我々は、ジェネリックインスタンスに対するサポートマイナーモデリングの完全なヒルベルト級数の公式と証明を提供する。
次に、このイデアルは、変数の行列のすべての部分集合の集合の部分集合によって生成されることを示す。
我々は,Mirathシグネチャスキームのパラメータに対して,MinRankインスタンスを解く複雑さを推定する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:38:06 GMT)
Exploring Kolmogorov-Arnold Networks for Interpretable Time Series Classification [0.2] Kolmogorov-Arnold Networks (KAN) は最先端モデルのより解釈可能な代替として提案されている。
本稿では,時系列分類のためのKANアーキテクチャの包括的かつ堅牢な探索を実現することを目的とする。
その結果,(1)効率の良いKANは,タスク分類タスクに適した性能を示し,性能と計算効率に優れていた。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:36:23 GMT)
Practical Application and Limitations of AI Certification Catalogues in the Light of the AI Act [0.1] この研究は、AI法に照らして既存の認定カタログの実用的適用と制限に焦点を当てている。
我々は、AIアセスメントカタログを総合的なツールとして、AIモデルの認定基準準拠を体系的に評価する。
我々は、もはやアクティブな開発チームを持たないAIシステムの限界を観察し、完全なシステムドキュメンテーションの重要性を強調します。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 07:59:54 GMT)
Performance Evaluation of Sentiment Analysis on Text and Emoji Data Using End-to-End, Transfer Learning, Distributed and Explainable AI Models [0.1] ツイートの感情分析をKaggleの絵文字データセット上で行った。
両モデルのテキスト分類精度は98%前後でほぼ同じであった。
検証セットがトレーニングセットに存在しない絵文字を使用して構築されると、両方のモデルの精度は劇的に低下し、70%に低下した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 20:58:37 GMT)
Language Models are Few-Shot Graders [0.1] 我々は最先端のLCMを利用したASAGパイプラインを提案する。
GPT-4、GPT-4o、o1-previewの3つのOpenAIモデルのグレーディング性能を比較した。
以上の結果より,RAGによる選択はランダム選択よりも優れており,グレードドドサンプルを提供することでグレーディング精度が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:38:21 GMT)
The influence of motion features in temporal perception [0.1] 本稿では、主観的時間知覚と感情共鳴の形成における動作動詞の役割について検討する。
以上の結果から,より速い動詞は時間的・動的経験を誘発し,肯定的な感情やより大きなエージェンシーに結びつくことが示唆された。
対照的に、遅い動詞は、時間の退屈なまたは制約された経験を反映して、通過性、単調性、否定的な感情を伝達する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:33:50 GMT)
Universality and emergent effective fluid from jets and string breaking in the massive Schwinger model using tensor networks [0.1] 本研究では,大質量シュウィンガーモデルにおける2つの光ジェットのエネルギー,運動量,空間的絡み合いの相関を解析した。
これらの観測のいくつかは、現在のコライダーエネルギーにおける高多重度ジェット現象、エネルギーエネルギー、エネルギー電荷相関器を分析するために用いられる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:41:15 GMT)
BOLIMES: Boruta and LIME optiMized fEature Selection for Gene Expression Classification [0.1] BOLIMESは、遺伝子発現の分類を強化するために設計された、新しい特徴選択アルゴリズムである。
包括的特徴選択と解釈可能性による洗練を組み合わせ、高次元遺伝子発現解析のための強力なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:33:41 GMT)
Learning Wall Segmentation in 3D Vessel Trees using Sparse Annotations [0.0] 本研究は,頸動脈壁の3次元セグメンテーションを訓練するために,臨床研究からスパースアノテーションを用いた新しいアプローチを提案する。
中心的アノテーションを用いて頸動脈の垂直断面を採取し,対向2Dネットワークを用いて分類する。
これらのアノテーションは、3D畳み込みニューラルネットワークのトレーニングのために3D擬似ラベルに変換され、手動の3Dマスクの作成を回避する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:05:27 GMT)
Carotid Artery Plaque Analysis in 3D Based on Distance Encoding in Mesh Representations [0.0] 本研究では,3次元容器壁セグメンテーションマスクからプラークメッシュを抽出する手法を提案する。
症例特異的な閾値を適用し,202 T1-weighted black-blood MRIのデータセットから最大50%の狭窄を有する被験者のプラークを抽出した。
頸動脈341例からプラークメッシュを抽出し,2.69mulから847.7mulまで幅広いプラーク形状を抽出した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:27:06 GMT)
myEye2Wheeler: A Two-Wheeler Indian Driver Real-World Eye-Tracking Dataset [0.0] 本稿では,2輪運転者の実世界の視線行動のユニークなリソースであるmyEye2Wheelerデータセットを提案する。
われわれのデータセットは、インド人の二輪運転者の意思決定に関するユニークな視覚的注意パターンと洞察に重要なレンズを提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:39:00 GMT)
WASHtsApp -- A RAG-powered WhatsApp Chatbot for supporting rural African clean water access, sanitation and hygiene [0.0] 本稿では、クリーンウォーターアクセス、衛生、衛生(WASH)の原則に基づいて、農村アフリカのコミュニティを教育するためのWhatsAppベースのボットであるWASHtsAppを紹介する。
本論文は,デザインサイエンス研究方法論を用いた開発プロセスについて詳述する。
ローカル言語やユーザデータ分析を対象とする介入に組み込むなど、さらなる開発の可能性について議論する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:43:41 GMT)
Using sensitive data to de-bias AI systems: Article 10(5) of the EU AI Act [0.0] 2024年6月、EU AI法が施行された。この法律には、AIシステムの提供に関する義務が含まれている。
AI法第10条には、プロバイダがデータセットのトレーニング、検証、テストが一定の品質基準を満たすかどうかを評価するための新たな義務が含まれている。
この論文は主に欧州連合の法律に関するものであるが、政策立案者はAIシステムの偏見を規制することを目的としているため、世界の他の地域では関係がある可能性がある。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:26:15 GMT)
Unveiling a Hidden Percolation Transition in Monitored Clifford Circuits: Inroads from ZX-Calculus [0.0] 我々はクリフォード回路における測定誘起相転移(MPT)を再検討する。
回路構造に隠されたパーコレーション遷移を明らかにする。
以上の結果から,クリフォード回路のMPTは古典的なパーコレーション遷移によって制御されていることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:00:03 GMT)
Universal Embedding Function for Traffic Classification via QUIC Domain Recognition Pretraining: A Transfer Learning Success [0.0] 暗号化されたトラフィック分類手法は、新しいプロトコルや拡張に適応する必要がある。
我々は、多数のクラスを持つ複雑なタスクに埋め込みモデルを事前訓練し、それをよく知られた5つのTCデータセットに転送する。
提案手法は,5つのTCデータセットのうち4つのSOTA性能を上回っている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:12:02 GMT)
Uncertainty quantification for improving radiomic-based models in radiation pneumonitis prediction [0.0] 放射線肺炎は放射線療法の副作用である。
最近の機械学習(ML)モデルでは、放射能とDosiomic特徴が強化され、より良い予測が可能になった。
モデル予測の信頼性を向上させるために不確実性定量化(UQ)を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:14:08 GMT)
Triangular lattice models of the Kalmeyer-Laughlin spin liquid from coupled wires [0.0] キラルスピン液体(CSL)は、2次元の相互作用するスピンのエキゾチック相であり、長距離の絡み合いと分数的な励起が特徴である。
三角格子上に局所ハミルトニアンを構築し、微調整を必要とせずカルメイヤー・ローリン CSL を安定化する。
提案手法は結合ワイヤ構造を採用し,一般摂動によりCSL相に向かって駆動される可溶性滑動ルッティンガー液体を構築するための格子双対性を導入する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:02:32 GMT)
Transient Dynamics and Homogenization in Incoherent Collision Models [0.0] 本研究では,非コヒーレント衝突モデルの動的挙動について検討し,各ユニット間の相互作用を非コヒーレント制御スワップ(CSWAP)操作によってモデル化する。
コヒーレント相互作用と非コヒーレントスワップ相互作用の両方の場合の開系の力学は同一であるように見えるが、その過渡ダイナミクスは明らかに異なる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:23:13 GMT)
Towards more Contextual Agents: An extractor-Generator Optimization Framework [0.0] LLM(Large Language Model)ベースのエージェントは、幅広い汎用アプリケーションにわたる複雑なタスクの解決に顕著な成功を収めている。
しかしながら、それらのパフォーマンスは、専門産業や研究領域のようなコンテキスト固有のシナリオで劣化することが多い。
この課題に対処するため,本研究では,LLMエージェントの文脈適応性を高めるための体系的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:07:06 GMT)
Towards an automated workflow in materials science for combining multi-modal simulative and experimental information using data mining and large language models [0.0] この原稿には、科学文献から機械可読データベースにエンコードされた情報を公開する自動化ワークフローが紹介されている。
最終的に、Retrieval-Augmented Generation (RAG)ベースのLarge Language Model (LLM)は、高速で効率的な質問応答チャットボットを可能にする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:24:46 GMT)
Toward a Dialogue System Using a Large Language Model to Recognize User Emotions with a Camera [0.0] ユーザの表情から感情を認識するためのAIエージェントの方法は研究されていない。
LLMをベースとしたAIエージェントが、カメラと対話してユーザをキャプチャすることで、感情状態に応じてユーザと対話できるかどうかを検討した。
その結果、AIエージェントは、HappyやAngryのような比較的高いスコアを持つ感情状態の感情状態に応じて会話できることを確認した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:48:27 GMT)
Toward Cybersecurity Testing and Monitoring of IoT Ecosystems [0.0] 当社では,IoTエコシステムのサイバーセキュリティテストと監視に向けたステップを示す,フレームワークとツールの仕様について説明する。
我々は、以前の論文の課題から始め、テストとモニタリングを可能にする統合されたアプローチとツールについて議論します。
また、IoTエコシステムの典型的なユースケースを説明し、フレームワークとツールを使用して課題に対処するためのアプローチを提案します。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:10:47 GMT)
Think Inside the JSON: Reinforcement Strategy for Strict LLM Schema Adherence [0.0] 本稿では,大規模言語モデル(LLM)生成における厳密なスキーマ順守を推論能力を活用することによる課題に対処する。
我々のアプローチは、新しいパイプラインを通して1.5Bパラメータモデルの構造的推論スキルを訓練する。
我々はThinkJSONのアプローチを、オリジナルのDeepSeek R1 (671B)、DeepSeek R1 (Qwen-1.5BとQwen-7B)、Gemini 2.0 Flash (70B)の蒸留版と比較する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:44:55 GMT)
The Role of GitHub Copilot on Software Development: A Perspec-tive on Productivity, Security, Best Practices and Future Directions [0.0] GitHub Copilotは、タスクの自動化とAI駆動コード生成による生産性向上によって、ソフトウェア開発を変革している。
本稿では,生産性とセキュリティに対するCopilotの影響について考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:08:20 GMT)
The Relationship Between Head Injury and Alzheimer's Disease: A Causal Analysis with Bayesian Networks [0.0] 本研究は、頭部外傷とアルツハイマー病発症リスクの因果関係について検討した。
頭部外傷, 記憶障害, 心血管疾患, 糖尿病など, 主要な医療履歴変数について検討した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:34:22 GMT)
The Causal-Effect Score in Data Management [0.0] 因果効果(英: Causal Effect, CE)は、観測結果に対する変数の因果影響の数値的な尺度である。
古典的および確率的データベースの文脈において、いわゆるCausal-Effect Scoreを導入し、検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:04:40 GMT)
The Canonical Forms of Matrix Product States in Infinite-Dimensional Hilbert Spaces [0.0] 我々は、分離可能な無限次元ヒルベルト空間のテンソル積の任意の元が、おそらく無限結合次元の行列積状態(MPS)として表せることを証明した。
無限次元MPS (idMPS) の構成は、行列の特異値分解の観点からよく知られた有限次元の構成と類似している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:16:04 GMT)
TREND: A Whitespace Replacement Information Hiding Method [0.0] 本稿では,TRENDと呼ばれる情報隠蔽手法を提案する。
カバーテキスト内に任意のバイトエンコードされたシーケンスを隠せる。
従来のホワイトスペース文字を視覚的に類似したUnicodeホワイトスペース文字で置き換えることで、本提案手法は、カバーテキストのセマンティクスを保存できる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:21:27 GMT)
Synthetic generation of 2D data records based on Autoencoders [0.0] ガスクロマトグラフィーとイオンモビリティ・スペクトロメトリー(GC-IMS)は二重分離分析技術である。
GC-IMSによって生成されたデータは、通常2次元のスペクトルとして表される。
本研究では,オートエンコーダに基づくディープラーニングフレームワークを用いて,合成2次元スペクトルを生成する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:40:47 GMT)
Stability of Floquet sidebands and quantum coherence in 1D strongly interacting spinless fermions [0.0] Floquet-Bloch 側バンドの寿命に及ぼす駆動のコヒーレンスにおける電子-電子相互作用と摂動の影響について検討した。
我々は、高周波駆動が多体励起の長寿命FBに繋がる相互作用するスピンレスフェルミオンの連鎖を見つける。
低周波状態とノイズの存在下では、加熱が支配的であり、量子コヒーレンスが著しく失われる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:50:21 GMT)
Scalable Structure For Chiral Quantum Routing [0.0] 我々は、ある送信者からネットワーク内の多くの可能な受信者へ量子的および古典的な情報をルーティングする問題に対処する。
量子ウォークの形式性を利用することで、完全グラフに基づく離散構造上の力学を記述する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:55:26 GMT)
Safe at the Margins: A General Approach to Safety Alignment in Low-Resource English Languages -- A Singlish Case Study [0.0] 本稿では,シンガポール固有のクレオールであるシングリッシュの毒性を最小化するため,SEA-Lion-v2.1-インストラクト(Llama3-8B変異体)の整合性について述べる。
教師付き微調整とKTO(Kahneman-Tversky Optimization)のペアとペアなしの選好の方がより効率的であることが判明した。
また,KTO,KTO-Sの簡易かつ斬新な修正も導入した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:11:06 GMT)
Rotational quenching of monofluorides in a cryogenic helium bath [0.0] 本研究は, モノフッ化物分子(X-F)の相互作用, 衝突動力学, 輸送特性に関する国際的研究である。
BDWA(Born Distorted Wave Approximation)の光による熱化と回転焼成速度の解析
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:57:07 GMT)
Reservoir-assisted quantum battery charging at finite temperatures [0.0] 量子電池の性能に及ぼすフェルミオンおよびボソニック熱貯留層の影響について検討した。
その結果, 貯水池の種類によらず, 最適帯電パラメータが示されることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:14:24 GMT)
Reading the unreadable: Creating a dataset of 19th century English newspapers using image-to-text language models [0.0] オスカー・ワイルドの19世紀のデジタルアーカイブジャーナリズムは、しばしば品質の悪い光学文字認識(OCR)を持っている
本稿は,19世紀英語新聞や定期刊行物の84ページのコレクションである『十九世紀シリアルズ版』でOCRを実践することで,この問題に対処するのに役立つ。
その結果得られたNCSE v2.0データセットは、記事の識別、高品質のOCR、テキストを4つのタイプと17のトピックに分類した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:10:48 GMT)
Range Retrieval with Graph-Based Indices [0.0] 高次元ベクトル空間における近接点の検索は,情報検索における重要なステップである。
本稿では,グラフに基づくベクトル指標を用いた範囲探索アルゴリズムを提案する。
単純なベースラインアプローチよりも,クエリスループットが最大100倍,平均で5~10倍,パフォーマンスが最大1億データポイントまで向上しています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:18:01 GMT)
Quenched large deviations of Birkhoff sums along random quantum measurements [0.0] 我々は、エルゴード過程によって駆動されるランダム量子測定の列に沿って、バーホフのような和に対する大きな偏差原理の待ち行列を証明した。
この結果は,2時間測定フレームワークにおけるエントロピー生成の研究に応用される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:06:37 GMT)
Quantum trajectories and output field properties for two-photon input field [0.0] Wigner-Weisskopf近似の2光子状態の光を伝播させることにより、原子系と分子系の励起が説明されている。
出力場の測定結果に依存する量子系の進化の問題を定式化した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:46:16 GMT)
Quantum tomography from the evolution of a single expectation [0.0] 本研究では,1つの期待値の均一時間進化に基づいて全量子トモグラフィーを行う可能性を検討する。
ヌル集合を除いて、任意の量子チャネルによって進化したすべての非自明なバイナリ測定は、原理的には完全な量子状態トモグラフィーを可能にする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:22:50 GMT)
Quantum thermometry for ultralow temperatures using probe and ancilla qubit chains [0.0] 本研究では,アシラ量子ビットの鎖に結合したプローブ量子ビットを用いて,超低温測定の範囲と精度を向上させる手法を提案する。
この研究は、極低温状態における量子温度測定のための強力で正確なツールとして、プローブ・クビット・アンシラ・チェーン・システムの可能性を強調した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:29:34 GMT)
Quantum noise spectroscopy by qudit spectators [0.0] 本研究は、疑似観客(任意dレベル)による量子ノイズスペクトロスコピーのためのプロトコルを提案する。
このプロトコルは理論ツールとしてWeyl基底分解とAlvarez-Suterノイズ分光法を用いる。
本手法の精度と信頼性をシミュレーションにより検証した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:21:14 GMT)
Quantum control of ion-atom collisions beyond the ultracold regime [0.0] 可変散乱共鳴は原子・分子系の制御に不可欠である。
我々は、$textSr++textRb$の非弾性衝突確率を測定し、それを用いてイオン-原子衝突の理論モデルを校正する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:42:14 GMT)
Quantum Mpemba effect of localization in the dissipative mosaic model [0.0] オープン量子系における単一励起の散逸ダイナミクスについて検討する。
モビリティエッジの存在は、$E_cinfty$と表現され、ユニークな散逸行動を引き起こす。
散逸率は初期状態の局所化と密接に関連していることがわかった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:12:23 GMT)
Quantum Computing in Corrosion Modeling: Bridging Research and Industry [0.0] 腐食は、様々な産業における製品の寿命と信頼性に大きな課題をもたらす。
腐食過程の原子論的シミュレーションに適したハイブリッド量子古典ワークフローを開発し,実証する。
我々は、量子コンピュータがこれらの問題に取り組む上で、いつ、どのように重要な役割を果たすかを評価するために、詳細な量子リソース推定を行う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:06:55 GMT)
Quantum Communication Multiplexing in LP-modes Enabled by Photonic Lanterns [0.0] 本研究は,光子ランタンを用いたLPモード多重化を用いたファイバベース量子鍵分布(QKD)システムを示す。
24km5dB損失ファイバリンク上でのSKRは2.34Mbpsであった。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:52:33 GMT)
Probing curved spacetime with a distributed atomic processor clock [0.0] 分散量子状態構築のためのアルカリ土類様原子プロセッサの量子ネットワークを提案する。
時空の曲率が3つの異なる固有時間の干渉によって現れることを示す。
本稿では, 線形性, ユニタリ性, 量子論の確率的性質などの基礎物理学の新たな側面を曲面時空上で探索する方法について論じる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:36:37 GMT)
Predictive simulations of the dynamical response of mesoscopic devices [0.0] このような複雑なシステムの低エネルギー量子力学をシミュレートするための一般的な枠組みについて述べる。
本稿では, トポロジカル超伝導体に結合した単一量子ドットの例について紹介する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:44:40 GMT)
Prediction of Clinical Complication Onset using Neural Point Processes [0.0] 本稿では, 事象発生予測の文脈におけるニューラル・テンポラル・ポイント・プロセスの適用性について検討する。
私たちの実験は、最先端の6つのニューラルポイントプロセスと6つのクリティカルケアデータセットで構成されています。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:18:19 GMT)
Post-processing of coronary and myocardial spatial data [0.0] ヘモダイナミックス(英: haemodynamics)とは、血液の流れを流れる血管網である。
ネットワーク全体の血流を明示的にシミュレートすることは、計算的に不可能である。
我々は,部分冠状動脈ツリーを表すグラフから心筋の血行動態シミュレーションの計算領域を得るためのデータパイプラインを開発した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:37:22 GMT)
Parameter scanning in a quantum-gravity-induced entanglement of masses (QGEM) experiment with electromagnetic screening [0.0] 量子重力誘起物質の絡み合い(QGEM)プロトコルは、物質-波干渉計間の絡み合いをテストする試験法を提案する。
このプロトコルを実験的に実現するための重要な障害は、重い質量を持つ空間量子重ね合わせを作ることである。
質量10〜14$ kgの少なくとも1ミクロンサイズの重ね合わせを,10~3$ Hzのデコヒーレンスレートで表す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:03:12 GMT)
On the role of true and false chirality in producing parity violating energy differences [0.0] システムとインフルエンスの両方が真の(粗悪な)キラルである場合にのみ、左利きシステムと右利きシステムの間のエネルギー差が生じることを示す。
キラル分子におけるアクシオンを介する相互作用のような誤ったキラルな影響は、前述の縮退性を持ち上げることができないことを明確に示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:49:42 GMT)
On the Alleged Locality in the Schrödinger Picture [0.0] Vedral は、Schr"odinger 図はHeisenberg 図のように局所的に量子系を記述することができると主張している。
この返事はその主張に反論する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:12:55 GMT)
OCCULT: Evaluating Large Language Models for Offensive Cyber Operation Capabilities [0.0] 我々は、実世界の攻撃的サイバー操作の実現とスケーリングに向けたAIの進歩を評価するための新しいアプローチを実証する。
我々は、サイバーセキュリティの専門家が厳格かつ反復可能な測定に貢献できる軽量な運用評価フレームワークであるOCCULTについて詳述する。
私たちは、現実的なサイバー脅威をスケールするためにAIが使用されるリスクが、最近著しく進歩していることに気付きました。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:33:14 GMT)
Non-Hermitian linear perturbation to a Hamiltonian with a constant electromagnetic field and Hall conductivity [0.0] 非エルミート摂動がワイル・ハミルトン群に与える影響は、位相相転移を分類するための貴重な洞察を与えると期待されている。
これまでの理論的研究により、量子異常ホール効果におけるホール導電率の量子化が失われることが示されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:51:42 GMT)
NRQNN: The Role of Observable Selection in Noise-Resilient Quantum Neural Networks [0.0] 本稿では,ノイズ条件下での量子ニューラルネットワーク(QNN)のトレーニングに伴う複雑さについて検討する。
まず、バレンプラトー(BP)が理想的条件よりもノイズの多い量子環境で容易に現れることを実証した。
そこで我々は,QNNのノイズに対する耐性を高めるために,キュービット計測を慎重に選択することを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:32:47 GMT)
Multi-vision-based Picking Point Localisation of Target Fruit for Harvesting Robots [0.0] 2つのマルチビジョン型ローカライゼーション手法、すなわち解析的アプローチとモデルベースアルゴリズムが採用された。
最も成功したモデルベースのローカライゼーションアルゴリズムであるアダブースト回帰は、平均ユークリッド距離(MED)の4.40mmで88.8%の収穫精度を達成した。
マルチビジョンシステムでは, ピックポイントの局所化が向上し, ロボット収穫におけるピッキングの成功率が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:40:51 GMT)
Multi-Mode Global Driving of Trapped Ions for Quantum Circuit Synthesis [0.0] このようなマルチモードのグローバルドライブは,対応する2ビットゲート実装よりも短い実行時間で,Ising型のユニバーサルなインタラクションを生成することを示す。
また、このフレームワークがイオン量子ビットの任意のサブセット$N$間の$N-$body相互作用を効率的に生成するためにどのように拡張されるかを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:47:51 GMT)
Multi Image Super Resolution Modeling for Earth System Models [0.0] 超解像(SR)技術は、地球系モデル(ESM)データの空間分解能を改善するために不可欠である。
本稿では、視覚変換器(ViT)とインプリシットニューラルネットワーク(INR)を組み合わせて、低分解能(LR)入力から高分解能(HR)画像を生成する新しいアルゴリズムViFORを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 01:52:41 GMT)
Mixing Algorithm for Extending the Tiers of the Unapparent Information Send through the Audio Streams [0.0] 機密性および効率性は、ステガノグラフィーの関与によって得ることができる。
本稿では,ロバスト性,セキュリティ,キャパシティの隠蔽性に基づいて,性能に応じた経路を解析し,提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:08:45 GMT)
Mentoring Software in Education and Its Impact on Teacher Development: An Integrative Literature Review [0.0] 本研究は,デジタル・メンタリング・プラットフォームの変容の可能性について考察する。
本研究は,重要な特徴の有効性を評価するため,既存の文献からの知見を合成する。
金融上の制約、制度的なサポートの制限、データのプライバシーに関する懸念は、依然として大きな課題である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:01:45 GMT)
Measurement-Device-Independent Certification of Schmidt Number [0.0] シュミット数が高い二部量子状態は、情報処理タスクにおいてシュミット数が少ない状態よりも優れていることが示されている。
これらのタスクにおけるリソースの効率的な利用を保証するためには、Schmidtのリソース状態の認証が不可欠である。
半量子非局所ゲームを用いて、全ての状態のシュミット数が測定デバイスに依存しない方法で証明可能であることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:35:17 GMT)
Measurement of the work statistics of an open quantum system using a quantum computer [0.0] 我々は、もともとクローズドシステムのために考案されたインターフェロメトリスキームを、オープンシステムケースに拡張し、超伝導量子コンピュータ上で実装する。
本手法は, システムバス化合物の物性を解析するための診断ツールとして有用であることを示す。
我々の実験は、インターフェロメトリスキースキームが任意の開量子系に対するジャージンスキー等式に対する長期の実験的検証を達成するための有望なツールであることを示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:14:45 GMT)
Matrix Product States as Observations of Entangled Hidden Markov Models [0.0] 本稿では, 絡み合った隠れマルコフモデル(EHMM)との深い関係を確立することにより, マトリックス生成状態(MPS)の内在的構造を明らかにする。
重要なMPSのクラスがEHMMの結果として導出できることが示され、その基礎となる量子相関が示される。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:44:17 GMT)
Lexical categories of stem-forming roots in Mapudüngun verb forms [0.0] 主な焦点は、語源において言語として認識される「Mapud"ungun roots」の語彙分類である。
この語彙カテゴリー修正の結果は、検証された直後に実施されるので、直接計算分析に役立ちます。
これらの結果は、マプチェ語の語彙カテゴリーに関する不確実性を明らかにするのに役立つことが期待されている。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:26:58 GMT)
Learning the Universe: Learning to Optimize Cosmic Initial Conditions with Non-Differentiable Structure Formation Models [0.0] 本稿では,3次元宇宙初期条件を再構築するためのLearning the Universe by Learning to Optimize (LULO)を紹介する。
LULOは、3次元宇宙の初期条件を再構築するための勾配のないフレームワークである。
ダークマターのみの$N$ボディシミュレーションで同定した$M_200mathrmc$halosから初期条件を正確に再構成することで,本手法を実証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:17:01 GMT)
Learning To Explore With Predictive World Model Via Self-Supervised Learning [0.0] 本稿では、長年無視されてきた認知的要素を用いて、本質的な動機づけを持つエージェントのための内的世界モデルを構築することを提案する。
我々は18のAtariゲームを用いて、反応的かつ熟考的な行動を必要とするゲームに認知スキルが現れるかを評価した。
以上の結果から, 厳密でスパースな報酬を有する多くのテストケースにおいて, 最先端技術と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:39:23 GMT)
Learning Counterfactually Fair Models via Improved Generation with Neural Causal Models [0.0] 機械学習モデルを現実世界のアプリケーションにデプロイする際の主な関心事のひとつは、公平性である。
既存のカウンターファクトフェアネスの実施方法には2つの制限があるようである。
本稿では,反現実的なサンプルを生成するためにニューラル因果モデルを提案する。
また,MMDをベースとした新たな正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:59:03 GMT)
LLMs as Hackers: Autonomous Linux Privilege Escalation Attacks [0.0] 言語モデル(LLM)と浸透試験の共通点について検討する。
本稿では,LLMの(倫理的)ハッキングに対する有効性を評価するための,完全自動特権エスカレーションツールを提案する。
我々は,異なるコンテキストサイズ,コンテキスト内学習,任意の高レベルメカニズム,メモリ管理技術の影響を分析する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:53:47 GMT)
Integrating Arithmetic Learning Improves Mathematical Reasoning in Smaller Models [0.0] 高品質なデータに事前訓練された大規模なモデルは、様々な推論タスクにおいて優れたパフォーマンスを示す。
より小さな学生モデルは教師モデルから学び、質問を言い換えるなどのデータ拡張を行う。
これらの努力にもかかわらず、より小さなモデルは算術計算に苦慮し、数学的推論の誤りにつながる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:43:06 GMT)
Information Theoretical Approach to Detecting Quantum Gravitational Corrections [0.0] 本研究では,Parikh-Wilczek形式から得られる確率分布のKulback-Leibler分散を計算する。
量子重力補正はブラックホールの質量が減少するにつれてクルバック・リーブラーの偏差を増大させる。
ある臨界値の後、ブラックホールの質量が減少するにつれて、量子重力補正が再び減少する傾向がある。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:23:44 GMT)
Increasing NWP Thunderstorm Predictability Using Ensemble Data and Machine Learning [0.0] 我々は,NWPデータと機械学習(ML)のアンサンブルによって,雷雨予報のスキルが向上することを示す。
11時間のアンサンブル予測は、5時間の決定論的予測のスキルレベルと一致する。
SALAMA 1DのようなMLモデルは、長いリードタイムの間予測可能な雷雨の発生パターンを特定することができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 22:18:43 GMT)
I don't trust you (anymore)! -- The effect of students' LLM use on Lecturer-Student-Trust in Higher Education [0.0] Open AIのChatGPTのようなプラットフォームにおける大規模言語モデル(LLM)は、大学生の間で急速に採用されている。
学生によるLLMの使用は、情報と手続きの正義にどのように影響し、チーム信頼と期待されるチームパフォーマンスに影響を与えるか?
本研究は,LLM使用の公平さよりも,学生利用の透明性に重点を置いていることを示唆する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:39:27 GMT)
Highly charged isomeric qubits from antiproton annihilation [0.0] イオントラップ装置で高電荷の合成量子ビットを生成するために, 抗陽子の消滅を利用する方法について述べる。
我々は、異性体と基底状態の単一電子からなる水素様原子の超微細分裂における量子ビット遷移を同定する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:53:17 GMT)
Girth of the Cayley graph and Cayley hash functions [0.0] ケイリーハッシュ関数は、A と B という一対の半群要素を使って 0 と 1 ビットをハッシュするという単純なアイデアに基づいている。
本稿では,これまで提案されてきたCayleyハッシュ関数のいくつかを調査し,セキュリティが損なわれていない非常に単純なハッシュ関数を抽出する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:56:47 GMT)
Geometry from quantum temporal correlations [0.0] ユークリッド3次元空間は、単一量子ビット上のパウリ可観測物の逐次的な測定と関連する量子時間相関の構造からどのように現れるかを示す。
このような結果は、空間自体が量子時間相関から現れる可能性を示している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:24:03 GMT)
Geometric and General Relativistic Techniques for Non-relativistic Quantum Systems [0.0] この論文は、量子力学系の理解を深めるために、微分幾何学的および一般相対論的手法の適用を探求する。
まず、加速二状態原子摂動の文脈でウンルー放射を調べ、一階理論による様々な加速軌道の遷移を決定する。
次に,Wu-Yang単極子による背景磁場中の非相互作用フェルミオンに対するディラック演算子を用いた球面形状における量子ホール効果について検討する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:27:29 GMT)
Fundamental constraints on quantum fluctuations: Conservation laws, reality, and no-signaling [0.0] 量子揺らぎは計算、センシング、暗号、熱力学に影響を及ぼす。
量子力学は、単一点における観測可能量の計測に正確な規則を提供するが、時間とともに変動の変動を特徴づける標準的な枠組みは存在しない。
我々は,これらの変動を一貫した測定を行うには,保存法則,符号なし原理,物理的リアリズムに対する期待の制約を満たさなければならない,という4つの基本的基準を提案する。
この結果により、絡み合い、ステアリング、ベルの不等式といった重要な量子情報の概念を、瞬時観測可能ではなくプロセスに拡張することができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:48:21 GMT)
Fundamental bounds on precision and response for quantum trajectory observables [0.0] 量子コヒーレンスにより精度が向上し、量子系における古典的不確実性関係を破ることができることを示す。
i)エントロピー生成と動的活動の観点から電流の相対的揺らぎを束縛する不確実性関係の量子一般化、(ii)任意の数え上げ可能な可観測物の相対的揺らぎとシンメトリケートされたリウヴィリアンのスペクトルギャップに基づく量子逆不確実性関係、(iii)一般可観測物の運動的摂動に対する応答を束縛する量子応答不確実性関係の3つの主要な結果を示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:35:57 GMT)
Frequency-domain alignment of heterogeneous, multidimensional separations data through complex orthogonal Procrustes analysis [0.0] 多次元分離データには、複雑な生物学的サンプルに関する詳細な情報を明らかにする能力がある。
データ分析は、化学因子を表わすピークが、いくつかの分析実行の過程で漂流する可能性があるため、この分野で進行中の課題である。
この研究は、合成多次元分離データの周波数領域表現のProcrustes解析を通じて、アライメント問題に対する非常に単純な解を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:14:14 GMT)
FrGNet: A fourier-guided weakly-supervised framework for nuclear instance segmentation [0.0] 核インスタンスセグメンテーションは病理画像解析において重要な役割を担っている。
主な課題は、インスタンスを正確にセグメンテーションすることの難しさと、正確なマスクレベルのアノテーションのコストの高さから生じる。
本研究では,弱制御型核インスタンス分割問題を解くための4つのガイダンスフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 05:10:50 GMT)
Finding Optimal Trading History in Reinforcement Learning for Stock Market Trading [0.0] 本稿では,2次元畳み込みニューラルネットワーク(CNN)を用いた金融深層学習(DRL)モデルにおける時間窓の最適化について検討する。
本稿では,時間領域をハイパーパラメータとして扱う新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:50:00 GMT)
Federated Variational Inference for Bayesian Mixture Models [0.0] 本稿では,局所的なマージと削除動作による変分推論を用いた基本的「分割と征服」推論手法を提案する。
これらのマージ動作は各バッチ内のデータの要約のみを必要とすることを示し、ローカルノード間でのフェデレーション学習を可能にする。
大規模電子健康記録(EHR)データに適用することで,本手法の実用性を検証する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:41:23 GMT)
Exciton-Polariton Dynamics in Multilayered Materials [0.0] 光キャビティ内の室温でのコヒーレントな弾道輸送を可能にするために、量子化された放射とエクシトンを結合させることが示されている。
我々は、エクシトン-ポラリトン量子力学をシミュレートするための効率的な混合量子-古典的アプローチを開発する。
この強化されたコヒーレンスは、複数の層にまたがるフォノン変動の同期に遡ることができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:15:07 GMT)
Evaluating link prediction: New perspectives and recommendations [0.0] リンク予測(LP)は、ネットワーク科学と機械学習研究において重要な問題である。
厳密かつ制御された方法でLP手法を評価できる実験装置を提案する。
この制御されたセットアップにおいて、実ネットワークデータセット上の様々なLP手法を用いて広範な実験を行い、慎重に設計された仮説の配列を通して、これらの要因とLPの性能との相互作用についての貴重な知見を収集する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:36:59 GMT)
Evaluating and Explaining Earthquake-Induced Liquefaction Potential through Multi-Modal Transformers [0.0] 本研究では, 土壌液状化予測のための並列トランスアーキテクチャを提案する。
この構造は、11大地震の165のケース履歴からデータを処理している。
このモデルは、地域間検証セットで93.75%の精度で予測できる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 04:14:33 GMT)
Entanglement and private information in many-body thermal states [0.0] 我々は多体混合状態における絡み合いが相関関数にどのように反映されるかを示す。
システム内の絡み合いが秘密鍵を蒸留するための資源として利用できるかどうかを問う。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:00:10 GMT)
Enhancing Machine Learning Performance through Intelligent Data Quality Assessment: An Unsupervised Data-centric Framework [0.0] 不適切なデータ品質は機械学習(ML)の有利なパワーを制限する
本稿では,高品質なデータを特定し,MLシステムの性能を向上させるインテリジェントなデータ中心評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:01:36 GMT)
Enhanced uncertainty quantification variational autoencoders for the solution of Bayesian inverse problems [0.0] 逆問題に対する変分オートエンコーダを訓練するための新しい損失関数を提案することによって、既存の研究に基づいて構築する。
モデルパラメータの後方分布に対する変分オートエンコーダの潜伏状態の収束に関する理論的証明を提供する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 18:17:49 GMT)
Efficient classical algorithms for linear optical circuits [0.0] 線形光回路における期待値と確率振幅を近似する効率的な古典的アルゴリズムを提案する。
この結果は、フォトニック変分アルゴリズムのような期待値推定に依存する線形光回路の特定の応用が、量子優位性を達成する上での課題に直面していることを示唆している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:13:24 GMT)
Efficient Learning Under Density Shift in Incremental Settings Using Cramér-Rao-Based Regularization [0.0] この研究は、データが時間的に分散している問題に対して、分散密度推定の角度を取る。
バッチでデータを処理し、ニューラルネットワークがバッチをトレーニングデータとして扱うことを可能にする。
C2A$は、最先端のメソッドに対して最大で19%の精度を達成する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:00:10 GMT)
Effects of the Lorentz symmetry violation on relativistic neutral scalar bosons: Scattering and bound states [0.0] テンソル$(K_F)_mu nu alpha beta$をStandard Model Extensionから外します。
ローレンツ対称性違反が運動方程式に与える影響を解析・議論する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:08:56 GMT)
Dynamics of Open Quantum Systems with Initial System-Environment Correlations via Stochastic Unravelings [0.0] オープン量子系において、還元力学は、システムと環境が最初は非相関であるという仮定から説明される。
相関のないシナリオでは、解答は力学をシミュレートする強力なツールであるが、これまでのところ相関が最初に存在する最も一般的なケースでは使われていない。
本研究では, 初期相関の存在下での解離を一般化する出発点として, 浴槽正 (B+) あるいは片側正分解形式を用いる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 12:26:32 GMT)
Doubly minimized Petz Renyi mutual information: Properties and operational interpretation from direct exponent [0.0] 2倍に最小化された$alphain (1/2,1)$のPetz Renyi相互情報は、固定二部量子状態の$alpha$のペッツ発散の最小化として定義される。
二つの量子状態判別問題の直接指数は、位数$alphain (1/2,1)$の2倍に最小化されたペッツ・レニイ相互情報によって決定されることを示す。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 19:12:02 GMT)
Development of Application-Specific Large Language Models to Facilitate Research Ethics Review [0.0] IRBレビュープロセスを容易にするアプリケーション固有大規模言語モデル(LLM)を提案する。
これらのIRB固有のLCMは、IRB固有の文献と機関的なデータセットに基づいて微調整される。
我々は、事前レビューのスクリーニング、予備分析、一貫性チェック、意思決定支援など、潜在的なアプリケーションの概要を述べる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:48:25 GMT)
Continuous Learning Conversational AI: A Personalized Agent Framework via A2C Reinforcement Learning [0.0] 本稿では,A2C強化学習を用いて実装したCLCA(Continuous Learning Conversational AI)アプローチを提案する。
我々は,Large Language Models (LLMs) によって生成された販売対話を模擬して,A2Cエージェントを訓練する。
このエージェントは、個人化のための会話戦略を最適化し、エンゲージメントと価値の提供に集中する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:05:59 GMT)
Chebyshev approximation and composition of functions in matrix product states for quantum-inspired numerical analysis [0.0] 解析的かつ高度に微分可能な関数をMPSチェビシェフ補間子として表現するために,反復的なチェビシェフ展開とクレショー評価を用いるアルゴリズムを提案する。
これは高微分可能な函数に対する急速な収束を示し、理論的な予測と整合し、多次元のシナリオに効率的に一般化する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 11:27:01 GMT)
Cavity-enhanced spectroscopy in the deep cryogenic regime -- new hydrogen technologies for quantum sensing [0.0] 深部低温状態下で4Kまで完全に作動するキャビティ強調分光計を実証した。
この装置は、様々な基礎的および実践的な応用を可能にする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:11:44 GMT)
Can AI mimic the human ability to define neologisms? [0.0] この研究は、ヒトの参加者がネオロジズムの最も適切な定義を選定するオンライン実験を採用した。
その結果、ブレンドと誘導体に対する人間とAIの反応は公正に一致したが、化合物については一致しなかった。
これらの発見は、人間の言語の複雑さと、AIが相変わらずそのニュアンスを捉えている課題を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 09:46:38 GMT)
Breaking the bonds of generative artificial intelligence by minimizing the maximum entropy [0.0] 最小エントロピー原理に基づくab initio法を提案する。
任意の非線形関数によってパラメータ化された潜在表現を見つけることにより、トレーニングセット内の情報を圧縮する。
データ効率が良く、オーバーフィッティングに耐性があり、柔軟性があり、生成プロセスの制御と影響が可能である。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 21:16:33 GMT)
Benchmarking Automatic Speech Recognition coupled LLM Modules for Medical Diagnostics [0.0] 本報告は、医療電話記録に微調整されたモデルを分析する、私のセルフプロジェクトとして機能する。
音声書き起こしのための音声認識(ASR)と文脈認識のための大規模言語モデル(LLM)を解析する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:05:13 GMT)
Bell correlations between momentum-entangled pairs of $^4\text{He}^*$ atoms [0.0] 対相関粒子間の非局所絡み合いは、量子力学の非常に反直観的な側面である。
ベルの不等式フレームワークは、光子や原子内部状態におけるそのような絡み合いのデモンストレーションを可能にした。
運動量に絡み合った超低温ヘリウム原子の運動状態におけるベル相関の実験的観察を報告する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 00:01:41 GMT)
Autonomous Vehicles Using Multi-Agent Reinforcement Learning for Routing Decisions Can Harm Urban Traffic [0.0] 同時経路最適化のためのマルチエージェント強化学習(MARL)を用いた自律走行車(AV)は、交通環境を不安定にする可能性がある。
標準的なMARLアルゴリズムによる実験では、自明な場合であっても、ポリシーが最適解に収束しない場合が多いことが判明した。
今後の研究は、現実的なベンチマーク、慎重なデプロイメント戦略、AVルーティングの監視と規制のためのツールを優先する必要がある。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:37:02 GMT)
Analysis of Josephson Junction Barrier Variation -- a Combined STEM, Breakdown and Monte-Carlo Approach [0.0] 接続における障壁について、それらがどのような結論を導くかを評価する補完的手法を検討する。
電気分解により、障壁の最弱点を探索することができる。
破壊電圧による接合の群化により、中央値抵抗の異なる接合のサブアンサンブルを同定できる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:18:54 GMT)
Aharonov-Bohm magnetism and Landau diamagnetism in semimetals [0.0] 我々は中空半金属シリンダーとリングの磁気応答を軸方向のアハロノフ-ボウム磁束の存在に対して計算する。
また,一様磁場の存在下でのバルク半金属の反磁性応答を計算した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 13:46:08 GMT)
Agentic Deep Graph Reasoning Yields Self-Organizing Knowledge Networks [0.0] エージェント型で自律的なグラフ拡張フレームワークを提案し、そこで知識を反復的に構造化し、洗練する。
各ステップにおいて、システムは、新しい概念と関係を積極的に生成し、それらをグローバルグラフにマージし、その進化した構造に基づいて後続のプロンプトを定式化する。
分析の結果,高度に連結された「ハブ」の概念の台頭や「ブリッジ」ノードのシフトの影響など,創発的なパターンが明らかとなり,エージェント的,自己強化的なグラフ構築がオープンで一貫性のある知識構造をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:44:42 GMT)
Absorbing State Phase Transitions and Stability of Long-Range Coherence in Dissipative Quantum State Preparation [0.0] 吸収状態自体が長い位相コヒーレンスを持つ純散逸性量子反応拡散モデルについて検討する。
準備プロトコルが脆弱であるか、弱い誤差量子ジャンプ率に対して頑健である場合を見つける。
我々は、吸収状態の長い範囲のコヒーレンスが、ディレクテッド・パーコレーションとは異なる批判的な行動を引き起こすと主張している。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:31:20 GMT)
AI/ML-Based Automatic Modulation Recognition: Recent Trends and Future Possibilities [0.0] 本稿では、RF変調方式を分類するために、文献に提案されている高性能自動変調認識(AMR)モデルについて概説する。
我々はこれらのモデルを再現し、その性能を信号対雑音比の精度で比較した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 03:43:28 GMT)
A simple algorithm to reflect through eigenspaces of unitaries [0.0] 実装可能なユニタリの固有空間を反映する作業を考える。
同じサイズと深さのスケーリングを持つ単純なアルゴリズムを提案するが、すべての問題インスタンスに対して3つのアンシラ量子ビットしか必要としない。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:30:58 GMT)
A short Survey: Exploring knowledge graph-based neural-symbolic system from application perspective [0.0] AIシステムにおけるヒューマンライクな推論と解釈可能性の実現は、依然として大きな課題である。
ニューラルネットワークをシンボリックシステムと統合するNeural-Symbolicパラダイムは、より解釈可能なAIへの有望な経路を提供する。
本稿では,知識グラフに基づくニューラルシンボリック統合の最近の進歩について考察する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 15:30:43 GMT)
A deep learning framework for efficient pathology image analysis [0.0] 本稿では,情報領域を選択的に解析することで病理学者をエミュレートするフレームワークであるEagleを紹介する。
スライドを2.27秒で処理し、既存のモデルと比較して計算時間を99%以上削減する。
堅牢で解釈可能なアウトプットを提供し、高速なスライド検索、マルチオミクスパイプラインへの統合、新たな臨床基盤モデルをサポートする。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 16:45:01 GMT)
A Zero-Knowledge Proof for the Syndrome Decoding Problem in the Lee Metric [0.0] ベクトル間の距離は、より一般的なハミング計量ではなく、リー計量に関して測定される。
本稿の目的は、この問題のこの変種に対するゼロ知識証明を記述することである。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 10:38:21 GMT)
A Simplified and Numerically Stable Approach to the BG/NBD Churn Prediction model [0.0] 我々は,M日以内の購入を行なわなかった場合,客が混乱したことを考慮し,チャーンの定義の修正を提案する。
まず、M日以内の購入ゼロの場合の一般方程式を単純化する。
第2に,数値的オーバーフローやアンダーフローの問題を軽減するために,数値的手法を用いた代替表現を導出する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 14:53:56 GMT)
A Graph-Enhanced Deep-Reinforcement Learning Framework for the Aircraft Landing Problem [0.0] 航空機着陸問題(英: Aircraft Landing Problem、ALP)は、航空機の輸送と管理において難しい問題の一つである。
本稿では,グラフニューラルネットワークとアクター批判アーキテクチャを組み合わせてALPに対処する,新しい深層強化学習フレームワークを提案する。
その結果、学習アルゴリズムは異なる問題集合上でテストでき、その結果は研究アルゴリズムの運用と競合することを示した。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 08:02:17 GMT)
A Frontier AI Risk Management Framework: Bridging the Gap Between Current AI Practices and Established Risk Management [0.0] 最近の強力なAIシステムの開発は、堅牢なリスク管理フレームワークの必要性を強調している。
本稿では,フロンティアAI開発のための包括的リスク管理フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 17:05:33 GMT)
A Constant Velocity Latent Dynamics Approach for Accelerating Simulation of Stiff Nonlinear Systems [0.0] 厳密な常微分方程式(StODE)を解くには洗練された数値解法が必要であるが、しばしば計算コストがかかる。
本研究では,StODEの潜在力学を学習し,数値積分を完全に回避する手法を提案する。
言い換えれば、元の力学の解は一連の直線に符号化され、それを復号して実際の解を必要な時に取り出すことができる。
論文参考訳(メタデータ) (Tue, 18 Feb 2025 23:51:37 GMT)