Safety at Scale: A Comprehensive Survey of Large Model Safety [298.1] 我々は、敵攻撃、データ中毒、バックドア攻撃、ジェイルブレイクとプロンプトインジェクション攻撃、エネルギー遅延攻撃、データとモデル抽出攻撃、出現するエージェント固有の脅威を含む、大規模なモデルに対する安全脅威の包括的分類を提示する。
我々は、大規模なモデル安全性におけるオープンな課題を特定し、議論し、包括的な安全性評価、スケーラブルで効果的な防御機構、持続可能なデータプラクティスの必要性を強調します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:10:18 GMT)
Learning 4D Panoptic Scene Graph Generation from Rich 2D Visual Scene [122.4] 本稿では,リッチな2次元視覚シーンアノテーションを活用して4次元シーン学習を促進する4D-PSG生成のための新しいフレームワークについて検討する。
本研究では,2次元SGアノテーションから4次元シーンへ空間的時間的特徴を効果的に伝達する2次元から4次元の視覚的シーン伝達学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:16:08 GMT)
MRAG-Bench: Vision-Centric Evaluation for Retrieval-Augmented Multimodal Models [115.2] MRAG-Benchというマルチモーダル検索拡張生成ベンチマークを導入する。
MRAG-Benchは16,130枚の画像と1,353個の人間による複数の質問からなる。
その結果,すべての大規模視覚言語モデル (LVLM) は,テキスト知識と比較して画像で拡張すると改善が見られた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:58:37 GMT)
LLaVA-UHD v2: an MLLM Integrating High-Resolution Semantic Pyramid via Hierarchical Window Transformer [110.4] 視覚変換器 (ViT) は視覚符号化のための多モード大言語モデル (MLLM) に広く用いられている。
我々は、よく設計された視覚言語プロジェクタを導入することで、高度な知覚能力を持つMLLMであるLLaVA-UHD v2を提案する。
ハイウィン変換器は、構築した高精細なセマンティックピラミッドを組み込むことにより、MLLMの多様なマルチモーダルな視覚的粒度を捕捉する能力を高める。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:04:22 GMT)
SWEET-RL: Training Multi-Turn LLM Agents on Collaborative Reasoning Tasks [110.2] 大規模言語モデル(LLM)エージェントは、実世界のタスクでマルチターンインタラクションを実行する必要がある。
LLMエージェントを最適化するための既存のマルチターンRLアルゴリズムは、LLMの一般化能力を活用しながら、複数回にわたって効果的なクレジット割り当てを行うことができない。
本稿では,新たなRLアルゴリズムであるSWEET-RLを提案する。
我々の実験は、SWEET-RLがコルベンチにおける成功率と勝利率を、他の最先端マルチターンRLアルゴリズムと比較して6%向上することを示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:55:08 GMT)
MiniPLM: Knowledge Distillation for Pre-Training Language Models [109.8] MiniPLM は、大規模な教師 LM を用いて、学生言語モデル (LM) を事前訓練するためのフレームワークである。
効率性のために、MiniPLMはオフラインの教師推論を実行する。
柔軟性のために、MiniPLMはトレーニングコーパスのみで動作し、モデルファミリ間のKDを可能にする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:03:30 GMT)
MMDT: Decoding the Trustworthiness and Safety of Multimodal Foundation Models [101.7] MMFM(Multimodal foundation model)は、自律運転、ヘルスケア、バーチャルアシスタントなど、様々なアプリケーションにおいて重要な役割を果たす。
既存のマルチモーダルモデルのベンチマークは、主にこれらのモデルの有用性を評価するか、公平性やプライバシといった限られた視点にのみフォーカスする。
MMFMの安全性と信頼性を総合的に評価するために,最初の統合プラットフォームMMDT(Multimodal DecodingTrust)を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:59:44 GMT)
Towards Long-Horizon Vision-Language Navigation: Platform, Benchmark and Method [94.7] Long-Horizon Vision-Language Navigation (LH-VLN)は、連続したサブタスク間の長期計画と意思決定の一貫性を強調する新しいVLNタスクである。
我々のプラットフォーム、ベンチマーク、メソッドは、ロバストなデータ生成パイプライン、包括的なモデル評価データセット、合理的なメトリクス、新しいVLNモデルでLH-VLNを供給する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:31:16 GMT)
RoomTour3D: Geometry-Aware Video-Instruction Tuning for Embodied Navigation [87.9] Web ベースのルームツアービデオから派生したビデオインストラクションデータセットである RoomTour3D を紹介する。
RoomTour3Dは、オープンエンドの人間の歩行軌跡とオープンワールドのナビゲート可能な指示を生成する。
実験により、RoomTour3Dは複数の視覚・言語ナビゲーションタスクにまたがる大幅な改善が可能であることを実証した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:05:05 GMT)
Beyond the Destination: A Novel Benchmark for Exploration-Aware Embodied Question Answering [87.8] Embodied Question Answeringでは、エージェントが動的に3D環境を探索し、視覚情報を積極的に収集し、質問に答えるために多段階の推論を行う必要がある。
既存のデータセットはしばしばバイアスや事前の知識を導入し、非身体的推論につながる。
探索能力と推論能力の両方を評価するために特別に設計された最大のデータセットを構築します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:56:19 GMT)
POSTA: A Go-to Framework for Customized Artistic Poster Generation [87.2] POSTAは、カスタマイズされた芸術ポスター生成のためのモジュラーフレームワークである。
background Diffusionはユーザ入力に基づいてテーマ付きバックグラウンドを生成する。
設計MLLMはレイアウトとタイポグラフィー要素を生成し、背景スタイルと整合し補完する。
ArtText Diffusionはキーテキスト要素にスタイリングを追加する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:22:38 GMT)
GaussRender: Learning 3D Occupancy with Gaussian Rendering [86.9] GaussRenderは、投影的一貫性を強制することによって3D占有学習を改善するモジュールである。
提案手法は,不整合な2次元プロジェクションを生成する3次元構成をペナライズすることにより,より一貫性のある3次元構造を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:27:29 GMT)
Towards Self-Improving Systematic Cognition for Next-Generation Foundation MLLMs [86.2] MLLM(Multimodal Large Language Models)は、微粒な認識と複雑な推論を伴う課題に直面する。
主流のマルチモーダル事前学習アプローチは、高品質な画像キャプションのトレーニングによる知覚の向上に焦点を当てている。
本稿では,次世代MLLMを構築するための自己学習フレームワークである自己改善認知(SIcog)を紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:22:00 GMT)
Optimal Transport Adapter Tuning for Bridging Modality Gaps in Few-Shot Remote Sensing Scene Classification [80.8] Few-Shot Remote Sensing Scene Classification (FS-RSSC)は,限られたラベル付きサンプルを用いたリモートセンシング画像の分類の課題を示す。
理想的なプラトン表現空間を構築することを目的とした,OTAT(Optimal Transport Adapter Tuning)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:04:24 GMT)
Towards Unified Latent Space for 3D Molecular Latent Diffusion Modeling [80.6] 3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
本稿では,3次元分子を結合した潜在空間から潜在配列に圧縮する多モードVAEを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:56:13 GMT)
When the Future Becomes the Past: Taming Temporal Correspondence for Self-supervised Video Representation Learning [80.1] ビデオ表現学習における時間対応を利用した自己教師型フレームワーク(T-CoRe)を提案する。
T-CoReの実験は、複数の下流タスクに対して一貫して優れた性能を示し、ビデオ表現学習の有効性を実証している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:50:03 GMT)
Right Answer, Wrong Score: Uncovering the Inconsistencies of LLM Evaluation in Multiple-Choice Question Answering [78.9] 大規模言語モデル(LLM)を評価するために最も広く使われているタスクの1つは、Multiple-Choice Question Answering (MCQA)である。
本研究は,MCQA評価戦略の不整合を軽視し,不正確かつ誤ったモデル比較に繋がる可能性がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:45:03 GMT)
StructTest: Benchmarking LLMs' Reasoning through Compositional Structured Outputs [78.8] StructTestは、大規模な言語モデル(LLM)を合成命令に従って構造化出力を生成する能力に基づいて評価する、新しいベンチマークである。
評価はルールベースの評価器を用いて決定的に行われ、新しいタスクやデータセットに容易に拡張できる。
StructTestは、Deepseek-V3/R1やGPT-4oといったトップパフォーマンスモデルでも、依然として難しいままです。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:37:12 GMT)
Universal Scene Graph Generation [77.5] 本稿では,包括的セマンティックシーンを特徴付ける新しい表現であるUniversal Universal SG(USG)を紹介する。
クロスモーダルなオブジェクトアライメントとドメイン外課題の2つの重要なボトルネックに効果的に対処するUSG-Parについても紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:55:06 GMT)
Bootstrap Your Own Context Length [74.6] 長文言語モデルを学習するためのブートストラップ手法を提案する。
提案したデータ合成ワークフローは、短いコンテキスト言語モデル、テキスト検索、文書収集のみを必要とする。
我々は,オープンソースのLlama-3ファミリを用いて実験を行い,最大100万トークンまでコンテキスト長を拡張できることを実証した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:46:34 GMT)
Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass [68.8] 我々は,DUSt3Rに並列に複数のビューを処理することで,効率よくスケーラブルな3D再構成を実現する新しい多視点一般化であるFast3Rを提案する。
Fast3Rは最先端のパフォーマンスを示し、推論速度とエラーの蓄積が大幅に改善された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:35:52 GMT)
Vision-Speech Models: Teaching Speech Models to Converse about Images [67.6] 我々は、MoshiVisを導入し、最近の対話音声LLM、Moshiを軽量適応モジュールを通して視覚的に入力する。
追加の動的ゲーティング機構により、モデルが視覚的な入力と無関係な会話トピックをより簡単に切り替えることができる。
音声とテキストの両方のプロンプトを用いて下流視覚理解タスクのモデルを評価し,MoshiVisとのインタラクションの質的なサンプルを報告する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:40:45 GMT)
Neuron-based explanations of neural networks sacrifice completeness and interpretability [67.5] 我々は、ImageNetで事前訓練されたAlexNetに対して、ニューロンに基づく説明法が完全性と解釈可能性の両方を犠牲にすることを示す。
我々は、最も重要な主成分が、最も重要なニューロンよりも完全で解釈可能な説明を提供することを示す。
この結果から,AlexNet などのネットワークに対する説明手法は,ニューロンを埋め込みの基盤として使用するべきではないことが示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:17:02 GMT)
Cube: A Roblox View of 3D Intelligence [67.4] 膨大な量のデータに基づいてトレーニングされた基礎モデルは、驚くべき推論と生成能力を示している。
本稿では,テキスト・ツー・シェイプ生成,形状・ツー・テキスト生成,テキスト・ツー・シーン生成などに適用可能なトークン化方式について述べる。
我々は、3Dインテリジェンスのための完全に統一された基礎モデルを構築するための私たちの道筋を概説した議論で締めくくります。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:52:17 GMT)
VEGGIE: Instructional Editing and Reasoning of Video Concepts with Grounded Generation [67.3] 本稿では,VEGGIEを紹介する。VEGGIEは,多様なユーザインストラクションに基づいて,ビデオコンセプトの編集,グラウンド化,推論を統一する,シンプルなエンドツーエンドフレームワークである。
VEGGIEは、異なる編集スキルを持つ指導ビデオ編集において高い性能を示し、汎用モデルとして最高の指導ベースラインを達成している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:33:40 GMT)
ArtGS: Building Interactable Replicas of Complex Articulated Objects via Gaussian Splatting [66.3] コンピュータビジョンにおいて、音声で表現されたオブジェクトを構築することが重要な課題である。
既存のメソッドは、しばしば異なるオブジェクト状態間で効果的に情報を統合できない。
3次元ガウスを柔軟かつ効率的な表現として活用する新しいアプローチであるArtGSを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:43:16 GMT)
High-Dimensional Interlingual Representations of Large Language Models [65.8] 大規模言語モデル(LLM)は、多言語データセットに基づいて訓練され、言語間構造の形成を示唆する。
資源レベル, 類型, 地理的地域によって異なる31の多様な言語を探索する。
多言語 LLM は非一貫性な言語間アライメントを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:16:42 GMT)
Decompositional Neural Scene Reconstruction with Generative Diffusion Prior [64.7] 完全な形状と詳細なテクスチャを持つ3次元シーンの分解的再構成は、下流の応用に興味深い。
近年のアプローチでは、この問題に対処するために意味的あるいは幾何学的正則化が取り入れられているが、制約の少ない領域では著しく劣化している。
本稿では,SDS(Score Distillation Sampling)の形で拡散先行値を用いたDP-Reconを提案し,新しい視点下で個々の物体の神経表現を最適化する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:11:31 GMT)
EfficientLLaVA:Generalizable Auto-Pruning for Large Vision-language Models [64.2] マルチモーダル推論の効率を高めるために,大規模視覚言語モデルの自動プルーニング手法を提案する。
提案手法では,所望のプルーニングポリシーを探索するために,少数のサンプルのみを活用する。
視覚的質問応答のためのScienceQA, Vizwiz, MM-vet, LLaVA-Benchデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:07:04 GMT)
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations [64.1] 画像から幾何学的および物質的情報をキャプチャすることは、コンピュータビジョンとグラフィックスの基本的な課題である。
従来の最適化に基づく手法では、密集した多視点入力から幾何学、材料特性、環境照明を再構築するために数時間の計算時間を必要とすることが多い。
IDArbは、様々な照明条件下で、任意の画像に対して本質的な分解を行うために設計された拡散モデルである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:02:48 GMT)
Sample Efficient Reinforcement Learning from Human Feedback via Active Exploration [63.8] 良い政策を最も効率的に特定するために、人間のフィードバックを得るコンテキストをしばしば選択できるという事実を活用します。
本稿では,データを効率的に選択する能動的探索アルゴリズムを提案する。
提案手法は,複数の言語モデルと4つの実世界のデータセットに対する人間の嗜好の限られたサンプルを用いて,ベースラインよりも優れる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:23:52 GMT)
JMMMU: A Japanese Massive Multi-discipline Multimodal Understanding Benchmark for Culture-aware Evaluation [63.8] JMMMU(JMMMU、日本語MMMU)は、日本の文化状況に基づいて、専門家レベルのタスクでLMMを評価するために設計された、日本初の大規模ベンチマークである。
CAサブセットを用いて、日本語で評価すると、多くのLMMのパフォーマンス低下が観察される。
両サブセットを組み合わせることで,一部のLMMはCAサブセットでは良好に機能するが,CSサブセットでは機能しないことが明らかとなり,文化的理解の深みに欠ける日本語の理解が浅かった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:24:14 GMT)
All Seeds Are Not Equal: Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds [63.8] テキスト間拡散モデルは任意のテキストプロンプトからリアルな画像を生成することができる。
彼らはしばしば「2匹の犬」や「ボウルの右側のペンギン」のような作曲のプロンプトに対して矛盾した結果を出す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:39:25 GMT)
VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement [63.4] VideoRepairは、モデルに依存しない、トレーニングなしのビデオリファインメントフレームワークである。
微粒なテキストビデオの誤りを特定し、明示的な空間的およびテキスト的フィードバックを生成する。
VideoRepairは、テキストとビデオのアライメントの指標で、最近のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:39:33 GMT)
MAMM-Refine: A Recipe for Improving Faithfulness in Generation with Multi-Agent Collaboration [63.3] 我々はマルチエージェント・マルチモデル推論を生成にまで拡張し、特に改良による忠実度の向上を図っている。
我々は,各サブタスクに対して固有の評価を設計し,マルチエージェント(複数インスタンス)とマルチモデル(多変数LPMタイプ)の両方がエラー検出やクオリティクスに有効であることを示す。
我々はこれらの知見を、マルチエージェント・マルチモデル・リファインメント(MAMM-Refinement)と呼ばれる最終的な"レシピ"に統合し、マルチエージェント・マルチモデルコラボレーションがパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:46:53 GMT)
Low-Biased General Annotated Dataset Generation [62.0] 低バイアスの一般アノテーション付きデータセット生成フレームワーク(lbGen)を提案する。
高価な手作業による収集ではなく,カテゴリアノテーションを用いた低バイアス画像を直接生成することを目的としている。
実験結果から,手動ラベル付きデータセットや他の合成データセットと比較して,生成した低バイアスデータセットの利用により,一般化能力の安定が図られた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:36:47 GMT)
FlexWorld: Progressively Expanding 3D Scenes for Flexiable-View Synthesis [61.8] 単一イメージからフレキシブルな3Dシーンを生成するためのフレームワークであるFlexWorldを紹介します。
我々のV2Vモデルは、大きなカメラポーズのバリエーションの下で、新しいビューを生成することができる。
その上でFlexWorldは新しい3Dコンテンツを徐々に生成し、グローバルなシーンに統合します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:26:31 GMT)
Probabilistic Modeling of Disparity Uncertainty for Robust and Efficient Stereo Matching [61.7] 本稿では,新しい不確実性を考慮したステレオマッチングフレームワークを提案する。
我々はベイズリスクを不確実性の測定として採用し、データを別々に見積もり、不確実性をモデル化する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:26:37 GMT)
What Makes a Reward Model a Good Teacher? An Optimization Perspective [61.4] 報奨モデルによらず,報酬の分散が低い場合,RLHFの目的は平坦な景観に苦しむことが証明された。
さらに、ある言語モデルでうまく機能する報酬モデルが、低い報酬分散を誘発し、したがって、別の言語モデルに対して平坦な客観的景観をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:54:41 GMT)
Robustness of Nonlinear Representation Learning [60.2] 本研究では,教師なし表現学習の問題を,わずかに不特定な環境で研究する。
混合は線形変換と小さな誤差で識別可能であることを示す。
これらの結果は、実世界のデータに対する教師なし表現学習における識別可能性向上へのステップである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:57:03 GMT)
S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction [59.4] トランスフォーマー再構成バックエンドを備えたスナップショット圧縮撮像器(CASSI)は、高忠実度センシング性能を示す。
空間的およびスペクトル的アテンションデザインは ハイパースペクトルモデリングの限界を示します
パラレルアテンション設計とマスク認識学習戦略により実装された空間スペクトル(S2-)変換器を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:57:52 GMT)
Next Patch Prediction for Autoregressive Visual Generation [58.7] 我々はNext Token Prediction(NTP)パラダイムを新しいNext Patch Prediction(NPP)パラダイムに拡張する。
私たちのキーとなるアイデアは、画像トークンを高い情報密度のパッチトークンにグループ化して集約することです。
NPPは、画像Net 256x256生成ベンチマークにおいて、画像生成品質を最大1.0 FIDスコアで向上させながら、トレーニングコストを約0.6倍に削減できることを示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:16:54 GMT)
Creation-MMBench: Assessing Context-Aware Creative Intelligence in MLLM [58.4] Creation-MMBenchはマルチモーダル大言語モデルの創造性を評価するために設計されたベンチマークである。
ベンチマークは、51のきめ細かいタスクにまたがる765のテストケースで構成されている。
実験結果から,オープンソースのMLLMは,クリエイティブタスクにおけるプロプライエタリなモデルに比べて著しく性能が劣っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:03:25 GMT)
DeCaFlow: A Deconfounding Causal Generative Model [58.4] 因果生成モデル (Causal Generative Model, CGM) は近年, 因果機構をシミュレートする有効な手法として出現している。
私たちは、観測データと因果グラフのみを使用して、単一の償却トレーニングプロセスにおいて、隠れた共同設立者を説明するCGMであるDeCaFlowを紹介します。
我々の知る限りでは、構築された反ファクトクエリが識別可能であり、したがってDeCaFlowによって解決可能であることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:14:16 GMT)
Multi-focal Conditioned Latent Diffusion for Person Image Synthesis [58.0] 遅延拡散モデル(LDM)は高解像度画像生成において強力な機能を示した。
これらの制約に対処する多焦点条件付き潜時拡散法(MCLD)を提案する。
本手法では,顔の同一性やテクスチャ固有の情報を効果的に統合する多焦点条件アグリゲーションモジュールを利用する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:50:10 GMT)
DPFlow: Adaptive Optical Flow Estimation with a Dual-Pyramid Framework [57.7] 最大8Kの解像度入力を一般化できる適応型光フローアーキテクチャDPFlowを提案する。
また,1Kから8Kまでの入力解像度を持つ光フロー評価のための新しいベンチマークであるKubric-NKを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:18:18 GMT)
Robust Federated Learning Over the Air: Combating Heavy-Tailed Noise with Median Anchored Clipping [57.4] 重み付き雑音による有害な影響に対処するため,メディアアンコールド・クリッピング (MAC) と呼ばれる新しい勾配クリッピング法を提案する。
また、MAC下でのアナログオーバー・ザ・エア・フェデレーション学習によるモデルトレーニングの収束率の解析式も導出する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:17:04 GMT)
Multi-Armed Bandits and Quantum Channel Oracles [56.7] 我々は、報酬のランダム性に制限されたアクセスしか持たないバンディットモデルを導入するが、それでも重ね合わせの腕に問い合わせることができる。
これは、オラクルが正の故障確率を持つ場合、非構造化探索ではスピードアップが不可能である、という事前の結果を一般化する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:02:17 GMT)
Predictable Scale: Part I -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining [56.6] 最適な学習速度は、モデルパラメータとデータサイズの両方とのパワー-法則関係に従うが、最適なバッチサイズは、主にデータサイズでスケールする。
この研究は、Mixture-of-Expertsモデルや高密度トランスなど、異なるモデル形状と構造を統一する最初の研究である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:28:25 GMT)
TikZero: Zero-Shot Text-Guided Graphics Program Synthesis [56.4] 本稿では、画像表現を中間ブリッジとして利用して、テキスト理解からグラフィックプログラムを生成するTikZeroを提案する。
グラフィックプログラムとキャプション付き画像の独立したトレーニングを可能にし、ゼロショットテキスト誘導グラフィックプログラムの合成を可能にする。
本手法は,キャプション対応グラフィックスプログラムでのみ動作可能なベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:42:41 GMT)
3+ Seat Risk-Limiting Audits for Single Transferable Vote Elections [56.1] 本稿では,3人以上の議席を持つSTV選挙において,完全ないし部分的RLAを実施するためのアサーションベースのアプローチを提案する。
私たちはしばしば、報告された勝者のほとんど、時にはすべてを検証する部分的な監査を作成することができることを示しています。
我々は,2017年と2022年のスコットランド地方議会選挙から,500人以上の3席と4席のSTV選挙のデータセットを用いて評価を行った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:29:53 GMT)
Forensics-Bench: A Comprehensive Forgery Detection Benchmark Suite for Large Vision Language Models [53.6] Forensics-Benchは、新しい偽検出評価ベンチマークスイートである。
63,292件の厳密にキュレートされたマルチチョイスの視覚的質問からなり、112件の独特な偽造検出をカバーしている。
GPT-4o, Gemini 1.5 Pro, Claude 3.5 Sonnetの22のオープンソースLVLMと3つのプロプライエタリモデルについて徹底的な評価を行った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:21:44 GMT)
Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think [53.3] 認識された非効率性は、これまで気付かれなかった推論パイプラインの欠陥によって引き起こされたことを示している。
タスク固有の損失を伴う単一ステップモデル上でエンドツーエンドの微調整を行い、他の拡散に基づく深さモデルや正規推定モデルよりも優れた決定論的モデルを得る。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:59:31 GMT)
CTSR: Controllable Fidelity-Realness Trade-off Distillation for Real-World Image Super Resolution [52.9] 実世界の画像超解像は、2つの重要な評価基準が元の画像への忠実さと生成された結果の視覚的現実性である、重要な画像処理タスクである。
本稿では,複数の教師モデルの性能上の利点とともに,忠実度と現実性の両方を幾何学的に分解する蒸留方式を提案する。
いくつかの実世界の画像超解像ベンチマークで行った実験により,本手法が既存の最先端手法を超越していることが証明された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:41:40 GMT)
MIRROR: Multi-Modal Pathological Self-Supervised Representation Learning via Modality Alignment and Retention [52.1] 病理組織学と転写学は、腫瘍学の基本的なモダリティであり、疾患の形態学的および分子的側面を包含している。
モーダルアライメントと保持を両立させる新しいマルチモーダル表現学習法であるMIRRORを提案する。
がんの亜型化と生存分析のためのTCGAコホートに関する広範囲な評価は,MIRRORの優れた性能を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:50:30 GMT)
Towards Understanding the Safety Boundaries of DeepSeek Models: Evaluation and Findings [51.7] 本研究は,DeepSeekモデルの最初の包括的安全性評価である。
評価対象は,DeepSeekの最新の大規模言語モデル,マルチモーダル大規模言語モデル,テキスト・ツー・イメージモデルである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:44:37 GMT)
LOCAL: Learning with Orientation Matrix to Infer Causal Structure from Time Series Data [51.5] LOCALは動的因果構造を復元するための効率的で実装が容易で制約のない手法である。
Asymptotic Causal Learning Mask (ACML) と Dynamic Graph Learning (DGPL)
合成および実世界のデータセットの実験では、LOCALが既存の手法よりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:59:43 GMT)
Temporal-Consistent Video Restoration with Pre-trained Diffusion Models [51.5] ビデオ復元(VR)は、劣化したビデオから高品質なビデオを復元することを目的としている。
事前訓練拡散モデル(DM)を用いた最近のゼロショットVR法は,逆拡散時の近似誤差と時間的整合性の欠如に悩まされている。
本稿では,DMのシード空間におけるビデオフレームを直接パラメータ化し,近似誤差を排除した新しいMAP(Posterior Maximum)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:41:56 GMT)
Robust Distribution Alignment for Industrial Anomaly Detection under Distribution Shift [51.2] 異常検出は産業アプリケーションの品質管理において重要な役割を担っている。
既存の方法は、一般化可能なモデルをトレーニングすることで、ドメインシフトに対処しようとする。
提案手法は,最先端の異常検出法や領域適応法と比較して,優れた結果を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:25:52 GMT)
Machine Unlearning in Hyperbolic vs. Euclidean Multimodal Contrastive Learning: Adapting Alignment Calibration to MERU [51.0] 本稿では,双曲型コントラスト学習における機械学習について検討する。
我々は、画像とテキストを双曲空間に埋め込んだモデルであるMERUにアライメントを適用し、セマンティック階層をよりよくキャプチャする。
提案手法では,双曲空間の特異性を利用したエンテーメントキャリブレーションやノルム正規化など,双曲特異成分を導入している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:47:37 GMT)
Subversion Strategy Eval: Can language models statelessly strategize to subvert control protocols? [50.6] 制御プロトコルは、AIが意図的に受け入れられない結果を引き起こすのを防ぐAIシステムをデプロイする計画である。
以前の作業では、人間書きの戦略に従ってAIを使用してプロトコルを変換することでプロトコルを評価していた。
本稿では、制御プロトコルを変換する独自の戦略で、AIシステムがいかにうまく生成し、動作できるかを検討する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:48:03 GMT)
ChemVLM: Exploring the Power of Multimodal Large Language Models in Chemistry Area [50.2] textbfChemVLMは、化学応用のためのオープンソースの化学マルチモーダル大規模言語モデルである。
ChemVLMは、テキストと視覚の化学情報の両方を理解する能力を高めるために、慎重にキュレートされたバイリンガルデータセットで訓練されている。
我々はChemVLMを、様々なタスクにおいて、オープンソースおよびプロプライエタリな多モーダルな大規模言語モデルに対してベンチマークする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:46:58 GMT)
DiST-4D: Disentangled Spatiotemporal Diffusion with Metric Depth for 4D Driving Scene Generation [50.0] 現在の生成モデルは、時空間外挿と空間新規ビュー合成(NVS)を同時にサポートする4次元駆動シーンの合成に苦慮している
本研究では,2つの拡散過程に分散するDiST-4Dを提案する。DST-Tは過去の観測結果から直接,将来の距離深度と多視点RGBシーケンスを予測し,DST-Sは,既存の視点でのみ空間的NVSを訓練し,サイクル整合性を実現する。
実験により、DiST-4Dは時間的予測とNVSタスクの両方において最先端のパフォーマンスを達成し、同時に計画関連評価において競合性能を提供することが示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:49:48 GMT)
LEGION: Learning to Ground and Explain for Synthetic Image Detection [50.0] 提案するSynthScarsは,12,236個の完全合成画像からなる高品質で多様なデータセットである。
4つの異なる画像コンテンツタイプ、3つのアーティファクトカテゴリ、ピクセルレベルのセグメンテーション、詳細なテキスト説明、アーティファクトカテゴリラベルを含んでいる。
人工物の検出,分割,説明を統合するマルチモーダル大規模言語モデル(MLLM)に基づく画像偽造解析フレームワークであるLEGIONを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:37:21 GMT)
Entanglement of Disjoint Intervals in Dual-Unitary Circuits: Exact Results [49.2] 絡み合いのダイナミクスはカオスシステムに期待されるものと一致していることを示す。
多くの保存電荷を持つにもかかわらず、電荷保存二重単位回路は一般にヤン・バクスター積分とはならない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:11:09 GMT)
DPBridge: Latent Diffusion Bridge for Dense Prediction [49.2] DPBridgeは、入力されたRGB画像と高密度信号マップとの直接マッピングを、トラクタブルブリッジプロセスに基づいて確立する生成フレームワークである。
実験により, DPBridgeはフィードフォワードと拡散ベースの両方と比較して, 競争性能が向上することが示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:20:07 GMT)
Contextual Fairness-Aware Practices in ML: A Cost-Effective Empirical Evaluation [48.9] フェアネス・アウェアの実践を文脈的・費用対効果という2つの観点から検討する。
本研究は,文脈が公正な実践の有効性にどのように影響するかを考察する。
本研究の目的は,SE実践者に対して,最小パフォーマンスコストで公正性を実現するプラクティスの選択を指導することである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:10:21 GMT)
DORNet: A Degradation Oriented and Regularized Network for Blind Depth Super-Resolution [48.7] 現実のシナリオでは、キャプチャーされた深度データは、センサーの制限や複雑な撮像環境のために、従来と変わらない劣化に悩まされることが多い。
本稿では,現実のシーンにおける未知の劣化に適応的に対処する新しいフレームワークであるDORNetを提案する。
提案手法は,低解像度深度データの劣化表現をモデル化した自己教師付き劣化学習戦略の開発から始まる。
効率的なRGB-D融合を容易にするために,学習した劣化先行情報に基づいて,RGBコンテンツを奥行きデータに選択的に伝播する劣化指向の特徴変換モジュールを導入する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:57:01 GMT)
PLM: Efficient Peripheral Language Models Hardware-Co-Designed for Ubiquitous Computing [48.3] 我々は、モデルアーキテクチャとエッジシステムの制約を協調的に最適化する共同設計プロセスを通じて開発された、周辺言語モデルであるPLMを紹介する。
PLMはMulti-head Latent Attentionメカニズムを採用し、正方形ReLUアクティベーション機能を採用してスパーシティを促進し、ピークメモリフットプリントを減少させる。
評価の結果, PLMは, 公開されているデータに基づいて訓練された既存の小言語モデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:23:29 GMT)
High-Rank Irreducible Cartesian Tensor Decomposition and Bases of Equivariant Spaces [47.8] カルテシアンテンソルの分解のための経路行列を、小さくて手頃な複雑さを持つランク$n=9$まで構築する。
我々は、経路行列の連結がテンソル積空間と球面直和空間の間の正則な基底行列であることを証明し、活用する。
結果は任意のテンソル積と直和空間に拡張され、対称性を維持しながら異なる空間間の自由な設計が可能となる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:07:51 GMT)
The CLEF-2025 CheckThat! Lab: Subjectivity, Fact-Checking, Claim Normalization, and Retrieval [47.5] CheckThat! Labは、オンラインの偽情報の特定と対策を目的とした技術の開発を進めることを目指している。
2023年版以降、研究と検証の意思決定を支援する補助的なタスクに対処する範囲を拡大した。
2025年版では、コア検証タスクを見直し、補助的な課題も検討している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:06:07 GMT)
Learning to quantify graph nodes [46.9] ネットワーク量子化は、グラフノードのラベルなし部分集合のクラス比率を推定する問題である。
我々は、教師なしノード埋め込みの柔軟性と効率を相乗化する新しい方法であるXNQを紹介する。
広範に評価した結果,これまで最高のネットワーク量子化手法において,我々のアプローチは一貫して,大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:43:12 GMT)
Data-Free Dynamic Compression of CNNs for Tractable Efficiency [46.5] 構造化プルーニング手法は, 精度が大幅に低下することなく浮動小数点演算を低下させる可能性を示唆している。
HASTE(Hashing for Tractable Efficiency)は,データフリーでプラグイン・アンド・プレイのコンボリューションモジュールで,トレーニングや微調整なしにネットワークのテスト時間推論コストを瞬時に低減する。
CIFAR-10とImageNetでは46.72%のFLOPを1.25%の精度で削減した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:35:38 GMT)
Video In-context Learning: Autoregressive Transformers are Zero-Shot Video Imitators [46.4] 環境と相互作用するモデルのための新しいインタフェースとして視覚信号を活用することを検討する。
デモビデオからセマンティクスを推測し,そのセマンティクスを未知のシナリオに模倣する,ゼロショット機能を実現していることがわかった。
その結果,本モデルでは,デモビデオが提供する意味指導と正確に一致した高品質なビデオクリップを生成できることがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:22:15 GMT)
From Commands to Prompts: LLM-based Semantic File System for AIOS [46.3] プロンプト駆動型ファイル管理のためのLSFS(LLM-based semantic file system)を提案する。
従来のアプローチとは異なり、LSFSはLLMを組み込んで、ユーザやエージェントが自然言語のプロンプトを通じてファイルと対話できるようにする。
実験の結果,LSFSはユーザ利便性,サポート対象関数の多様性,ファイル操作の正確性や効率性の観点から,従来のファイルシステムよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:17:47 GMT)
Adaptive Orchestration for Inference of Large Foundation Models at the Edge [46.1] Large Foundation Models (LFMs)は、次世代のEdge AIアプリケーションの新機能をアンロックすることを約束する。
リソース制約のあるヘテロジニアスエッジ環境におけるLFMによる推論は、ワークロードオーケストレーションにおいて大きな課題となる。
本稿では,分散推論処理の管理に特化して設計された,新しい適応型オーケストレーション手法とシステムを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:35:56 GMT)
dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis [45.9] 本稿では,dFLMoE という分散化フェデレーション学習フレームワークを提案する。
私たちのフレームワークでは、クライアントはお互いに軽量なヘッドモデルを直接交換します。
我々は,複数の医療課題に関する枠組みを検証し,その手法が明らかに最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:39:02 GMT)
Recover and Match: Open-Vocabulary Multi-Label Recognition through Knowledge-Constrained Optimal Transport [45.9] 上記の問題に効果的に対処する新しいフレームワークであるRAM(Recover And Match)を紹介します。
RAMは3つの異なるドメインのさまざまなデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:33:44 GMT)
Boosting HDR Image Reconstruction via Semantic Knowledge Transfer [45.7] シーン固有のセマンティクスの活用は、高度に劣化したリージョンを復元するための有望なソリューションを提供する。
これらの先行データは、通常、sRGB Standard Dynamic Range (SDR)画像から抽出される。
本稿では,既存のHDR再構築を促進するために,SDRドメインから派生した意味的知識を自己蒸留により伝達する一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:01:27 GMT)
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning [45.7] 本稿では,DeepSeek-R1モデルの拡張であるSearch-R1を提案する。
7つの問合せデータセットの実験では、検索-R1は26%(Qwen2.5-7B)、21%(Qwen2.5-3B)、10%(LLaMA3.2-3B)の性能を強いベースラインで改善している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:40:12 GMT)
Solla: Towards a Speech-Oriented LLM That Hears Acoustic Context [45.6] 本稿では,音声に基づく質問を理解し,そのコンテキストを同時に聴くように設計された新しいフレームワークであるSollaを紹介する。
Sollaには、音声イベントを効果的に識別し表現するためのオーディオタグモジュールと、音声コンテンツの理解を改善するためのASR支援予測手法が組み込まれている。
本稿では,音声イベント分類,音声キャプション,音声質問応答の3つのタスクを含むSA-Evalというベンチマークデータセットを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:34:21 GMT)
VideoDirector: Precise Video Editing via Text-to-Video Models [45.5] 現在のビデオ編集法は、時間的コヒーレンス生成能力を欠くテキスト・ツー・ビデオ(T2V)モデルに依存している。
本稿では、より正確なピボットインバージョンを実現するために、時空間デカップリングガイダンス(STDG)と複数フレームのヌルテキスト最適化戦略を提案する。
実験結果から,本手法はT2Vモデルの強力な時間生成能力を効果的に活用できることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:32:48 GMT)
SkyLadder: Better and Faster Pretraining via Context Window Scheduling [45.5] より短いコンテキストウインドウで事前訓練されたモデルは、固定トークン予算の下で、長いコンテキストウインドウよりも一貫して優れていることを示す。
そこで我々はSkyLadderを提案する。SkyLadderは、短時間から長期のコンテキストウィンドウ遷移を実装した、シンプルで効果的なアプローチである。
SkyLadderは一般的なベンチマークで最大3.7%、ベースラインよりも最大22%高速なトレーニング速度を実現している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:31:15 GMT)
Uncertainty-Guided Chain-of-Thought for Code Generation with LLMs [45.3] 大規模言語モデル(LLM)の問題解決能力向上に有効な手法として,チェーン・オブ・ソート(CoT)推論が実証されている。
我々は、不確実性を認識したCoT推論機構を組み込むことで、コード生成を向上させるためのUnCert-CoTを導入する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:40:45 GMT)
EgoDTM: Towards 3D-Aware Egocentric Video-Language Pretraining [45.2] EgoDTMは、Egocentric Depth- and Text-aware Modelである。
大規模な3D対応ビデオプレトレーニングと、ビデオテキストのコントラスト学習を通じて、共同でトレーニングを行う。
EgoDTMは軽量な3D認識デコーダを内蔵し、擬似深度マップから3D認識を効率的に学習する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:45:56 GMT)
Understanding the Generalization of In-Context Learning in Transformers: An Empirical Study [45.1] GPT-4やLLaMA-3のような大規模言語モデル(LLM)は、Transformerアーキテクチャの強力なインコンテキスト学習(ICL)機能を利用して、限られた例からリアルタイムで学習する。
本稿では,ICLを用いたトランスフォーマーの一般化能力について,トレーニングデータカバレッジと比較して体系的に検討する。
トランスフォーマーはICLとプロブレム間一般化を欠いているが, タスク内およびプロブレム内一般化に優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:40:45 GMT)
Coherence manipulation in asymmetry and thermodynamics [45.0] 古典的な体制では、熱力学状態変換は自由エネルギーによって支配される。
量子状態において、コヒーレンスと自由エネルギーは2つの独立した資源である。
自由エネルギーの源と組み合わせることで、量子状態に存在する任意の量子コヒーレンスを任意に増幅できることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:09:07 GMT)
Mitigating Object Hallucinations in MLLMs via Multi-Frequency Perturbations [44.8] 大規模言語モデル (MLLM) は視覚的タスクにおいて顕著な性能を示した。
しかし、MLLMによって生成された応答の正しさは、しばしば物体の幻覚によって損なわれる。
これらの幻覚の主な原因は、物体検出における特定の画像周波数特徴に対するモデルの過度な感受性である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:39:45 GMT)
Time-to-Event Pretraining for 3D Medical Imaging [44.5] 本稿では,3次元医用画像モデルのための事前トレーニングフレームワークである,時間とイベントの事前トレーニングを紹介する。
我々は18,945個のCTスキャン(420万枚の2D画像)のデータセットと、何千ものEHR由来のタスクにまたがる時間-時間分布を用いています。
提案手法は,AUROCの平均値が23.7%,HarrellのC-インデックスが29.4%向上し,結果予測が向上する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:33:47 GMT)
MASS: Mathematical Data Selection via Skill Graphs for Pretraining Large Language Models [44.5] 大規模言語モデル(LLM)の事前学習と微調整において高品質なデータが重要な役割を果たす
我々は,textbfSkill グラフを用いて LLM の事前学習を行う textbfMAthematical data textbfSelection フレームワークである MASS を紹介する。
実験により, 異なるモデルサイズにおけるMASSの有効性と有効性を示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:50:21 GMT)
Unveiling the Ignorance of MLLMs: Seeing Clearly, Answering Incorrectly [44.3] MLLM(Multimodal Large Language Models)は、マルチモーダルタスクにおいて顕著な性能を示す。
MLLMは、視覚的内容を理解した場合でも、誤った回答をしばしば生成することを示す。
テキストと視覚的プロンプトを精細化し,デコード中の視覚的コンテンツに焦点を当てることを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:52:59 GMT)
Towards efficient keyword spotting using spike-based time difference encoders [44.3] このニューロンモデルは、周波数とスパイクカウントの時間差を符号化し、ニューロモルフィックプロセッサによる効率的なキーワードスポッティングを行う。
我々は,音声桁のTIdigitsデータセットを用いて,時間的スパイクス信号にフォルマント分解とレートベース符号化を行う。
以上の結果から,TDEはパターンのスケーラブルなイベント駆動処理のための有望なニューロンモデルであることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:43:35 GMT)
Hierarchical Features Matter: A Deep Exploration of Progressive Parameterization Method for Dataset Distillation [44.0] 階層型生成蒸留(H-PD)と呼ばれる新しい生成パラメータ化法を提案する。
提案したH-PDは、等価な時間消費で様々な設定で大幅な性能向上を実現している。
IPC=1, IPC=10の超過圧縮比下での拡散モデルを用いて, 現在の再生蒸留を超越している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:23:38 GMT)
Prototype Perturbation for Relaxing Alignment Constraints in Backward-Compatible Learning [43.8] 近接型原型摂動(NDPP)と最適化型原型摂動(ODPP)の2つの手法を開発した。
我々の手法は最先端のBCLアルゴリズムに対して好適に機能する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:45:48 GMT)
MOFFlow: Flow Matching for Structure Prediction of Metal-Organic Frameworks [42.6] 金属-有機フレームワーク(英: Metal-organic framework、MOF)は、炭素捕獲や薬物の放出といった多くの分野で有望な応用を持つ結晶材料のクラスである。
ab initio計算や深い生成モデルを含む既存のアプローチは、単位セル内の多くの原子のためにMOF構造が複雑になるのに苦労している。
我々はMOF構造予測に適した最初の深部生成モデルMOFFlowを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:42:21 GMT)
Learning Shape-Independent Transformation via Spherical Representations for Category-Level Object Pose Estimation [42.5] カテゴリーレベルのオブジェクトポーズ推定は、特定のカテゴリにおける新しいオブジェクトのポーズとサイズを決定することを目的としている。
既存の対応に基づくアプローチは、通常、原始的な観測点と正規化されたオブジェクト座標の間の対応を確立するために点ベースの表現を採用する。
SpherePoseと呼ばれる新しいアーキテクチャを導入し、3つのコア設計を通して正確な対応予測を行う。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:29:13 GMT)
Layerwise Recurrent Router for Mixture-of-Experts [42.4] Mixture-of-Experts (MoE)アーキテクチャは、トレーニングコストを大幅に増加させることなく、モデルサイズをスケールできる能力で際立っている。
現在のMoEモデルはパラメータ非効率をしばしば表示する。
我々はMixture-of-Experts(RMoE)のためのLayerwise Recurrent Routerを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:24:09 GMT)
A Foundation Model for Patient Behavior Monitoring and Suicide Detection [42.2] ファンデーションモデル(FM)は、様々な領域で顕著な成功を収めてきたが、医療における採用は限られている。
本稿では,ベクトル量子化変分オートエンコーダ(VQ-VAE)を改良した新しいFMを提案する。
我々は,精神科患者の広いコホートで訓練された事前訓練FMが,自殺患者のコホートを微調整することなく,その潜在表現を通して下流作業を行うことを実証した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:01:16 GMT)
From 1,000,000 Users to Every User: Scaling Up Personalized Preference for User-level Alignment [42.0] 大規模言語モデル(LLM)は、伝統的にワンサイズフィットのアプローチによって整列されてきた。
本稿では,LLMのスケーラブルなパーソナライズのための包括的フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:41:46 GMT)
Radon: a Programming Model and Platform for Computing Continuum Systems [41.9] Radonは、エッジからクラウドへの連続体用に設計されたフレキシブルなプログラミングモデルとプラットフォームである。
RadonランタイムはWebAssembly(WASM)をベースとして、言語とデプロイメントに依存しない実行を可能にする。
本稿では,Radonのプロトタイプ実装について述べるとともに,分散キーバリューストアのケーススタディを通じてその有効性を評価する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:38:25 GMT)
Exploiting Prior Knowledge in Preferential Learning of Individualized Autonomous Vehicle Driving Styles [41.9] 自動車両の軌道計画では、一般的に移動地平線上を最適化するモデル予測制御を用いる。
乗客に好まれる運転スタイルをもたらす適切なコスト関数を見つけることは、現在進行中の課題である。
我々は、乗客の好みを反復的にクエリすることでコスト関数の学習に優先的なベイズ最適化を用いる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:47:56 GMT)
CHROME: Clothed Human Reconstruction with Occlusion-Resilience and Multiview-Consistency from a Single Image [41.1] 我々は,1つの隠蔽画像から複数視点の整合性を持つ3次元人体を再構成するための新しいパイプラインを提案する。
そして、3次元再構成モデルを用いて、隠蔽された入力と合成されたビューの両方に条件付き3次元ガウスの集合を予測する。
新規なビュー合成(最大3dbPSNR)と、挑戦的な条件下での幾何学的再構成の両方において、大幅な改善が達成されている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:56:18 GMT)
Machine learning surrogate models of many-body dispersion interactions in polymer melts [40.8] 本稿では,高分子融液中のMBD力を予測するための機械学習サロゲートモデルを提案する。
我々のモデルは、最も関連する原子結合を選択的に保持する、トリミングされたSchNetアーキテクチャに基づいている。
高計算効率で特徴付けられるサロゲートモデルにより、大規模な分子シミュレーションにMBD効果を実践的に組み込むことが可能となる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:15:35 GMT)
MotionStreamer: Streaming Motion Generation via Diffusion-based Autoregressive Model in Causal Latent Space [40.6] テキスト条件付きストリーミングモーション生成では、可変長の歴史的動きと入ってくるテキストに基づいて、次のステップの人間のポーズを予測する必要がある。
既存の方法は、例えば拡散モデルが予め定義された動き長によって制約されるような、ストリーミングモーション生成を達成するのに苦労している。
本研究では,連続因果遅延空間を確率論的自己回帰モデルに組み込む新しいフレームワークであるMotionStreamerを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:32:24 GMT)
DocLayLLM: An Efficient Multi-modal Extension of Large Language Models for Text-rich Document Understanding [40.4] テキストリッチ文書理解(TDU)では,テキストの内容や複雑なレイアウトを含む文書を包括的に分析する必要がある。
本稿では,TDUに特化して設計されたマルチモーダル言語モデル(MLLM)の効率的なマルチモーダル拡張であるDocLayLLMを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:05:04 GMT)
Latent Action Learning Requires Supervision in the Presence of Distractors [40.3] 実世界のビデオには、潜在的なアクション学習を妨げるアクション関連障害が含まれていることが示されています。
LAOMは,潜伏動作の質を8倍に向上する簡易なLAPO修正法である。
我々は、潜在アクション学習中のデータセット全体の2.5%にも満たない、地道的なアクションによる監視を提供することで、下流のパフォーマンスが平均4.2倍向上することを示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:57:58 GMT)
FACTS&EVIDENCE: An Interactive Tool for Transparent Fine-Grained Factual Verification of Machine-Generated Text [39.8] Facts&Evidenceは、複雑なテキストのユーザ主導検証のためのインタラクティブツールである。
個々の主張の信頼性を可視化し、モデル決定と複数の多様な証拠ソースへの帰属を説明する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:14:55 GMT)
LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning [39.5] モデルのサイズ、アーキテクチャ、パフォーマンスのトレードオフについては、まだ未検討のままです。
本稿では,近年の言語モデルと多様な視覚的バックボーンを統合したMLLMの新しいファミリーであるLLaVA-MOREを紹介する。
公平な比較を保証するため、すべてのアーキテクチャで一貫して適用される統一的なトレーニングプロトコルを使用します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:10:12 GMT)
Hierarchical clustering with maximum density paths and mixture models [39.4] 階層クラスタリングは、データの構造を分析するための効果的で解釈可能な手法である。
クラスタの正確な数は不明な環境では特に有用であり、複雑なデータセットを探索するための堅牢なフレームワークを提供する。
提案手法は,まずガウスあるいは学生のt混合モデルを用いてデータをオーバークラスタリングし,次に誘導密度景観に基づいて階層的にクラスタをマージすることで,この制限に対処する。
このアプローチは、最先端のクラスタリング性能と意味のある階層を提供し、探索データ分析に有用なツールである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:37:51 GMT)
CoE: Chain-of-Explanation via Automatic Visual Concept Circuit Description and Polysemanticity Quantification [39.1] 概念に基づく説明手法は、モデル決定に対するグローバルとローカルの両方の洞察を提供することができる。
意味的視覚概念(VC)における固有の多意味性は、概念の解釈可能性を妨げる。
本稿では,これらの問題に対処するためのCoE(Chain-of-Explanation)アプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:13:02 GMT)
UltraFlwr -- An Efficient Federated Medical and Surgical Object Detection Framework [38.9] 医用および外科的対象検出のためのフレームワークであるUltraFlwrを紹介する。
YOLO-PAは1ラウンドあたりの通信オーバーヘッドを最大83%削減する。
医用および外科的対象検出における最初のベンチマークの1つを確立した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:38:04 GMT)
aiXcoder-7B-v2: Training LLMs to Fully Utilize the Long Context in Repository-level Code Completion [38.2] リポジトリレベルのコード補完は、リポジトリの長いコンテキストに基づいたコード補完を目的としています。
既存の研究では、リポジトリから長いコンテキストを入力として抽出し、大規模言語モデルを利用してコードを生成する。
我々はCoLTと呼ばれる新しい微調整手法を提案し、長距離コンテキストが関連する情報を保持することを強調した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:22:58 GMT)
MetaLadder: Ascending Mathematical Solution Quality via Analogical-Problem Reasoning Transfer [37.8] 大規模言語モデル(LLM)は、数学的推論タスクを解く上で有望な能力を示した。
メタプロブレムのリコールとリフレクションを LLM に明示的に促すフレームワークである textbfMetaLadder を提案する。
我々のMetaLadderはLLMの問題解決精度を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:36:35 GMT)
DepthCues: Evaluating Monocular Depth Perception in Large Vision Models [37.7] 本研究では,大規模な事前学習型視覚モデルにおいて,暗黙の深度監視を伴わない深度知覚がどのように起こるかを検討する。
深度キュー理解の評価を目的とした新しいベンチマークDepthCuesを導入する。
我々の分析は、より最近の大型モデルで人間のような深度が現れることを示している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:00:12 GMT)
GOOD: Towards Domain Generalized Orientated Object Detection [37.5] オブジェクト指向物体検出はここ数年で急速に発展してきたが、これらの手法のほとんどは、トレーニングとテスト画像は同じ統計分布下にあると仮定している。
本稿では,任意の対象領域上でのオブジェクト指向物体検出の一般化を探求する領域一般化オブジェクト指向物体検出の課題を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:05:40 GMT)
How Can Time Series Analysis Benefit From Multiple Modalities? A Survey and Outlook [37.5] 時系列分析(TSA)は、データマイニングコミュニティにおいて長年研究されてきたトピックであり、現実世界において大きな意味を持つ。
最近のTSA研究は、新しい研究分野、すなわち、TSAのためのMultiple Modalities(MM4TSA)を形成している。
この調査は、この新興分野の総合的なレビューと詳細な展望を提供する最初のものだ。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:28:56 GMT)
KeyFace: Expressive Audio-Driven Facial Animation for Long Sequences via KeyFrame Interpolation [37.3] KeyFaceは、顔アニメーションのための新しい2段階拡散ベースのフレームワークである。
最初の段階では、モデルは遷移の間のギャップを埋め、スムーズかつ時間的コヒーレンスを保証する。
リアリズムをさらに強化するため、連続的な感情表現を取り入れ、幅広い非音声発声(NSV)を扱う。
実験の結果,KeyFaceは長期間にわたって自然なコヒーレントな顔アニメーションを生成する上で,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:10:34 GMT)
From Image to Video: An Empirical Study of Diffusion Representations [37.1] 拡散モデルは生成モデルに革命をもたらし、画像合成やビデオ合成において前例のないリアリズムを可能にした。
この研究は、視覚的理解のための映像と画像の拡散目標の直接比較として初めて行われ、表現学習における時間情報の役割についての洞察を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:27:28 GMT)
Theoretical Insights into Overparameterized Models in Multi-Task and Replay-Based Continual Learning [36.9] マルチタスク学習(MTL)は,複数のタスクを同時に学習することで,複数のタスクにおけるモデルの一般化性能を向上させることを目的としている。
連続学習(CL)は、以前取得した知識を忘れずに、時間とともに新しい逐次到着タスクに適応する。
MTL設定におけるモデルの性能に及ぼす各種システムパラメータの影響を理論的に記述する。
その結果,バッファサイズとモデルキャパシティがCLセットアップの記憶率に及ぼす影響を明らかにし,最先端のCL手法のいくつかに光を当てるのに役立つことがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:13:46 GMT)
Does Context Matter? ContextualJudgeBench for Evaluating LLM-based Judges in Contextual Settings [36.4] 大規模言語モデル(LLM)-as-judgeパラダイムは、モデル出力の安価で信頼性の高い高速な評価要求を満たすために使われてきた。
実世界の文脈評価シナリオにインスパイアされた8つの分割に対して2,000の挑戦的な応答対を持つ判定ベンチマークであるContextualJudgeBenchを提案する。
我々の総合的研究は、文脈情報とその評価基準が最先端モデルにおいても重要な課題であることを示している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:09:19 GMT)
UPME: An Unsupervised Peer Review Framework for Multimodal Large Language Model Evaluation [36.4] VQA(Visual Question Answering)の課題に対処するためにMLLM(Multimodal Large Language Models)が登場した。
既存の評価手法では、視覚画像のQ&Aペアを設計するために必要な人的負担がかなり大きいため、限界に直面している。
本研究では,モデルが質問を自動的に生成し,他のモデルからの回答のピアレビュー評価を行うことのできる,教師なしピアレビューMLLM評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:15:41 GMT)
V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions [36.3] 気象条件下でのマルチエージェント認識システム上でのLiDARに基づく3次元物体検出のためのドメイン一般化手法であるtextitV2X-DGWを提案する。
本研究の目的は、クリーンな天候下での良好なマルチエージェントのパフォーマンスを維持するだけでなく、クリーンな天気データのみを学習することで、目に見えない悪天候におけるパフォーマンスを向上させることである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:34:05 GMT)
Visual Persona: Foundation Model for Full-Body Human Customization [36.1] テキストから画像へのフルボディのカスタマイズのためのモデルであるVisual Personaを紹介する。
提案手法は,身体構造やシーンのバリエーションに関する文章記述と整合して,全身の外観を詳細に把握する。
Visual Personaは既存のアプローチを一貫して上回り、高品質でカスタマイズされた画像を生成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:45:47 GMT)
A Scalable Crawling Algorithm Utilizing Noisy Change-Indicating Signals [35.5] 提案手法は, (i) 雑音側情報を軽度な仮定で最適に利用するスケーラブルなクローリングアルゴリズム, (ii) 重心集中型計算を使わずにデプロイできる, (iii) 任意の時間間隔で全帯域使用量をスパイクすることなくWebページを一定の総レートでクロールできる,という手法である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:49:08 GMT)
Are formal and functional linguistic mechanisms dissociated in language models? [35.5] 大きな言語モデル(LLM)は、流動的で文法的なテキストを生成するのに優れるが、機能的な言語的タスクには耐え難い。
最近の研究は、形式的および機能的な言語的タスクを成功させるために、LLMはそれぞれ異なるメカニズムを使うべきであることを示唆している。
形式的タスクと機能的タスクの回路間の重なりは実際にほとんどないが、形式的言語的タスク間の重なりもほとんどない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:17:11 GMT)
EXAONE Deep: Reasoning Enhanced Language Models [35.3] 本稿では,様々な推論タスクにおいて優れた機能を示すEXAONE Deepシリーズについて述べる。
我々は、思考プロセスの長いストリームを含む推論特化データセットに基づいてモデルをトレーニングする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:09:24 GMT)
ACE: A Cardinality Estimator for Set-Valued Queries [35.3] 本稿では,設定値データに対する問合せの濃度を推定するアテンションベースカルディナリティ・エストリメータを提案する。
可変サイズのクエリを処理するために、プールモジュールを導入し、次に回帰モデル(MLP)を使用して最終的な濃度推定を生成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:29:15 GMT)
V2X-DG: Domain Generalization for Vehicle-to-Everything Cooperative Perception [35.0] 本稿では,LiDARに基づくV2X協調知覚の領域一般化問題を研究するための最初の研究である。
我々の研究は、ソースドメインだけでなく、他の見えないドメインでも高いパフォーマンスを維持することを目指している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:17:44 GMT)
Mitigating Ambiguities in 3D Classification with Gaussian Splatting [34.9] 本稿では,Gaussian Splatting(GS)ポイントクラウドベースの3D分類を提案する。
GS点雲のスケールと回転係数は表面のタイプを特徴付ける。
コミュニティで最初の実世界のGSポイントクラウドデータセットを構築します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:18:14 GMT)
Ensemble Knowledge Distillation for Machine Learning Interatomic Potentials [34.8] 機械学習原子間ポテンシャル(MLIP)は、原子論シミュレーションと分子特性予測を加速するための有望なツールである。
MLIPの品質は、利用可能なトレーニングデータの量と、そのデータを生成するのに使用される量子化学(QC)レベルの理論に依存する。
本研究では,エネルギーのみのデータセットに学習した際のMLIP精度を向上させるために,アンサンブル知識蒸留(EKD)法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:03:39 GMT)
Survey on Generalization Theory for Graph Neural Networks [34.6] メッセージパッシンググラフニューラルネットワーク(MPNN)は、グラフ上での機械学習の主要なアプローチである。
我々はMPNNの一般化能力に関する既存の文献を体系的にレビューする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:04:24 GMT)
Artificial Replay: A Meta-Algorithm for Harnessing Historical Data in Bandits [34.4] 履歴データを"ウォームスタート"のバンディットアルゴリズムにどのように組み込むかは、オープンな疑問である。
任意のベースバンドアルゴリズムに履歴データを組み込むメタアルゴリズムであるArtificialReplayを提案する。
ArtificialReplayは、完全なウォームスタートアプローチと比較して、履歴データのごく一部しか使用していないことを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:51:24 GMT)
Temporal Regularization Makes Your Video Generator Stronger [34.3] 時間的品質は、フレーム間の一貫した動きと現実的なダイナミクスを保証するため、ビデオ生成の重要な側面である。
本稿では,ビデオ生成における時間的拡張を初めて導入し,FluxFlowを初回調査に導入する。
UCF-101とVBenchベンチマークの実験により、FluxFlowは様々なビデオ生成モデルにおける時間的コヒーレンスと多様性を大幅に改善することが示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:59:32 GMT)
Uncertainty-Aware Diffusion Guided Refinement of 3D Scenes [34.2] 1枚の画像から3Dシーンを再構築することは、問題の本質が過小評価されているため、基本的に不適切な作業である。
本研究では,既存の画像から3D画像へのフィードフォワードネットワークにおいて,これらの制約に対処する。
入力画像の視界を超えた情報不足による性能低下を軽減するため、事前学習された潜伏映像拡散モデルを用いて、強い生成前を活用できる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:14:27 GMT)
Towards Hierarchical Multi-Step Reward Models for Enhanced Reasoning in Large Language Models [33.5] Process Reward Model (PRM) は報酬のハッキングに悩まされており、最良の中間ステップを特定することは不可能である。
個人と連続的な推論のステップを評価する新しい報酬モデル手法である階層リワードモデル(HRM)を提案する。
HRMは、特に前の推論ステップが間違っていた場合に、推論コヒーレンスと自己回帰を評価するのに優れる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:43:56 GMT)
Learning from Mistakes: Iterative Prompt Relabeling for Text-to-Image Diffusion Model Training [33.5] Iterative Prompt Relabeling (IPR) は、反復的な画像サンプリングを通じて画像をテキストにアライメントし、フィードバックでリテラブルを促す新しいアルゴリズムである。
我々はSDv2とSDXLについて徹底的な実験を行い、空間関係の指示に従う能力をテストする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:45:31 GMT)
State Space Model Meets Transformer: A New Paradigm for 3D Object Detection [33.5] インタラクティブなSTate空間モデル(DEST)を用いた新しい3次元オブジェクト検出パラダイムを提案する。
対話型SSMでは,3次元屋内検出タスクにおいて,システム状態が効率的にクエリとして機能する新しい状態依存型SSMパラメータ化法を設計する。
ScanNet V2 と SUN RGB-D データセットの AP50 で GroupFree のベースラインを改善する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:10:18 GMT)
The Pitfalls of Imitation Learning when Actions are Continuous [33.4] 本研究では,連続的な状態・動作制御システムにおいて,専門家のデモレータを模倣する問題について検討する。
ダイナミクスが安定していても、スムーズで決定論的な模倣ポリシーは、指数関数的に大きい実行時に必ずエラーを被ることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:37:53 GMT)
The Bandit Whisperer: Communication Learning for Restless Bandits [33.3] 我々は、レスレスマルチアームバンド(RMAB)における最初のコミュニケーション学習手法を提案する。
我々の設定では、腕は同様の腕からQ関数パラメータを受信し、行動ポリシーを導出し、Q関数の更新を操縦する。
両腕をまたいだメッセージの合体性を考慮し,その合体ユーティリティを分解するQネットワークアーキテクチャを用いて通信戦略を学習する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:28:43 GMT)
TROVE: A Challenge for Fine-Grained Text Provenance via Source Sentence Tracing and Relationship Classification [33.0] 医療、法律、ニュースなどの高度な領域では、コンテンツがどこでどのように作られるかを理解することが不可欠である。
テキストpROVEnance(テキストpROVEnance)チャレンジを導入し、ターゲットテキストの各文を特定のソース文にトレースする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:09:39 GMT)
Object-Centric Pretraining via Target Encoder Bootstrapping [32.9] 実世界のデータからオブジェクト中心モデルをスクラッチからトレーニングするための自己蒸留装置であるTarget BootstrappingによるObject-CEntric Pretrainingを提案する。
OCEBOは、オブジェクト中心のモデルに匹敵する教師なしのオブジェクト発見性能を達成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:06:50 GMT)
SemHiTok: A Unified Image Tokenizer via Semantic-Guided Hierarchical Codebook for Multimodal Understanding and Generation [32.9] SemHiTokは、Semantic-Guided Hierarchical Codebookを介して統合された画像トークンである。
SemHiTokは、他の統一トークン化器と比較して256X256解像度で優れたrFIDスコアが得られることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:24:47 GMT)
EmpathyAgent: Can Embodied Agents Conduct Empathetic Actions? [32.6] 共感は人間同士の相互作用の基本であるが、エンボディード・エージェントが人間のような共感を支えられるかどうかは不明である。
EmpathyAgentは、さまざまなシナリオでエージェントの共感行動を評価し、拡張する最初のベンチマークである。
我々は、EmpathyAgentを用いてLlama3-8Bを訓練し、共感行動を高める可能性があることを発見した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:30:30 GMT)
Scaled Supervision is an Implicit Lipschitz Regularizer [32.4] ソーシャルメディアでは、レコメンダシステムはクリックスルーレート(CTR)をユーザのエンゲージメントを評価するための標準指標としています。
本稿では,既存のCTRモデルを安定的に最適化し,拡張性の向上を図るため,帯域幅のスケーリングが暗黙のリプシッツ正規化器として機能することを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:01:28 GMT)
A Context-Driven Training-Free Network for Lightweight Scene Text Segmentation and Recognition [32.1] テキスト認識システムは、広範囲のトレーニングを必要とする大規模なエンドツーエンドアーキテクチャに依存しており、リアルタイムシナリオでは極めて高価である。
本稿では,冗長計算を最小化しつつ,事前学習したテキスト認識器の強みを生かした,学習不要なプラグイン・アンド・プレイフレームワークを提案する。
提案手法では,文脈に基づく理解と注目に基づくセグメンテーションのステージを導入し,画素レベルの候補テキスト領域を改良する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:51:01 GMT)
StyleLoco: Generative Adversarial Distillation for Natural Humanoid Robot Locomotion [31.3] StyleLocoは、ヒューマノイドの移動を学ぶための新しいフレームワークである。
強化学習の機敏さと人間のような運動の自然な流動性を組み合わせる。
StyleLocoは、ヒューマノイドロボットが多様な移動作業を行うことを可能にすることを実証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:27:44 GMT)
Quasi-$Φ_0$-periodic supercurrent at quantum Hall transitions [31.3] 近年の量子干渉研究により、QHエッジ状態は、高品質のグラフェン弱いリンクの超電流を効果的に媒介できることが示唆されている。
六方晶窒化ホウ素 (hBN) にカプセル化されNb鉛に接触した高移動率CVD結晶グラフェンからなる逆ゲートグラフェンジョセフソン接合を用いる。
超伝導ポケットは、最大2.4TまでのQHオンセットを超えて持続して検出され、Nb接触の上部臨界場に接近する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:22:56 GMT)
One-Shot Medical Video Object Segmentation via Temporal Contrastive Memory Networks [30.8] ワンショットの医療ビデオオブジェクトセグメンテーションでは、第1フレームのマスクアノテーションのみを与えられたビデオを通して、前景と背景のピクセルを分離する必要がある。
そこで本稿では, フレーム間関係を明示的にモデル化するために, フレーム間の埋め込みを分離しながら, 隣接フレームから埋め込みを整列する時間的コントラストメモリネットワークを提案する。
また、このタスクをベンチマークするために、様々なモダリティや解剖学にまたがる多様なマルチソース医療ビデオデータセットを収集します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:17:48 GMT)
Recall Them All: Retrieval-Augmented Language Models for Long Object List Extraction from Long Documents [30.5] ハイリコールは、特定の主題と特定の関係にあるオブジェクトエンティティの長いリストをポップアップさせるのに不可欠である。
本稿では,L3X法を2段階に分けて提案する手法について述べる。(1)大規模言語モデル(LLM)を用いたリコール指向生成と,(2)精度指向の精査による候補の検証と検証を行う。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:31:31 GMT)
A Self-Correcting Vision-Language-Action Model for Fast and Slow System Manipulation [30.2] 自己修正(SC-)VLAフレームワークは、アクションを直接予測する高速システムと、失敗したアクションを反映する遅いシステムを統合する。
高速システムでは,パラメータ効率のよい微調整を取り入れて,モデルにポーズ予測機能を持たせる。
動作が遅いシステムでは,動作不良後の人間の反射を模倣するように設計された,故障訂正のためのチェーン・オブ・ソート・トレーニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:55:48 GMT)
MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement Learning [29.8] 推論は、医用画像解析の進歩における重要なフロンティアである。
我々は、自然言語推論を明示的に生成する医療用VLMであるMedVLM-R1を紹介する。
MedVLM-R1の精度は、MRI、CT、X線ベンチマークで55.11%から78.22%に向上している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:55:33 GMT)
SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding [29.7] ギガピクセル全体の画像を理解可能な最初の視覚言語アシスタントであるSlideChatを紹介する。
その開発をサポートするために、WSIのための最大のインストラクションフォローデータセットであるSlideInstructionを作成しました。
一般的なMLLMと専門的なMLLMと比較して、SlideChatは22のタスクのうち18のタスクで最先端のパフォーマンスを達成する特別な能力を示している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:56:39 GMT)
When Domain Generalization meets Generalized Category Discovery: An Adaptive Task-Arithmetic Driven Approach [29.7] 汎用クラスディスカバリ(GCD)クラスタベースとターゲットドメインの新規クラスは、ベースクラスのみを持つソースドメインからの監視を使用する。
本稿では,GCD(DG-GCD)における領域一般化のパラダイムを紹介する。
我々のソリューションであるDG2CD-Netは、GCDのためのドメインに依存しない差別的な埋め込み空間を構築することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:48:16 GMT)
DLPO: Towards a Robust, Efficient, and Generalizable Prompt Optimization Framework from a Deep-Learning Perspective [29.5] 大規模言語モデル(LLM)は、よく設計されたプロンプトによって、様々なタスクで顕著に成功している。
最近の研究では、自動的なプロンプト最適化を有望な解決策として検討している。
これらの努力にもかかわらず、既存の手法は、堅牢性、効率性、一般化において重要な課題に直面している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:18:01 GMT)
Visual Position Prompt for MLLM based Visual Grounding [29.3] 本稿では,視覚位置プロンプトを備えたMLLMであるVPP-LLaVAを導入し,その接地性能を向上させる。
グローバルVPPは、入力画像に学習可能な軸状の埋め込みをオーバーレイし、構造化空間的手がかりを提供する。
また、0.6Mサンプルを用いたVPP-SFTデータセットを導入し、高品質なビジュアルグラウンドデータをコンパクトなフォーマットに統合し、効率的なモデルトレーニングを行う。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:08:13 GMT)
Do LLMs Have Distinct and Consistent Personality? TRAIT: Personality Testset designed for LLMs with Psychometrics [29.3] 大規模言語モデル(LLM)は会話エージェントとして様々な領域に適応している。
LLMのパーソナリティを評価するために設計された8Kのマルチチョイス質問からなる新しいベンチマークTRAITを紹介する。
LLMは独特で一貫した性格を示し、トレーニングデータの影響を強く受けている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:37:42 GMT)
BiM-VFI: Bidirectional Motion Field-Guided Frame Interpolation for Video with Non-uniform Motions [28.5] 既存のビデオフレーム(VFI)モデルは、一様でない動きのビデオで訓練する際、時間と位置のあいまいさに悩まされる傾向がある。
非一様運動を効果的に記述するための双方向運動場(Bidirectional Motion Field, BiM)を提案する。
BiM-VFIモデルは、最近の最先端のVFI手法を26%、LPIPSとSTLPIPSの45%で大幅に上回っている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:04:14 GMT)
DEIM: DETR with Improved Matching for Fast Convergence [28.2] 我々は,Transformer-based architectures (DETR) を用いたリアルタイムオブジェクト検出における収束の促進を目的としたトレーニングフレームワークDEIMを紹介する。
DETRモデルにおける1対1(O2O)マッチングに固有のスパース監督を緩和するため、DEIMはDense O2Oマッチング戦略を採用している。
Dense O2Oマッチングはコンバージェンスを高速化する一方、パフォーマンスに影響を与える可能性のある低品質のマッチも多数導入されている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:00:35 GMT)
Body-Hand Modality Expertized Networks with Cross-attention for Fine-grained Skeleton Action Recognition [28.2] BHaRNetは、典型的なボディエキスパートモデルをハンドエキスパートモデルで拡張する新しいフレームワークである。
我々のモデルは、協調的な専門化を促進するアンサンブル損失で、両方のストリームを共同で訓練する。
MMNetに触発されて、RGB情報を活用することで、マルチモーダルタスクへのアプローチの適用性を実証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:54:52 GMT)
Speculate, then Collaborate: Fusing Knowledge of Language Models during Decoding [27.8] 大規模言語モデル(LLM)は、特定のドメインで優れていることが多いが、トレーニングの制限のため、他のドメインでは不足している。
テスト時にLLM知識を効率的に融合できる新しいコラボレーティブ・スペキュレイティブ・デコーディング(CoSD)アルゴリズムを提案する。
実験の結果,COSDは既存の手法と比較してベンチマークで最大10%精度が向上していることがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:26:10 GMT)
Representational Similarity via Interpretable Visual Concepts [27.7] 本稿では,2つのネットワークを比較するための解釈可能な表現類似性手法を提案する。
モデルの違いのいくつかの側面は、一方のモデルがもう一方のモデルでうまく表現されていないというユニークな概念に起因していることが示される。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:21:45 GMT)
TripNet: Learning Large-scale High-fidelity 3D Car Aerodynamics with Triplane Networks [27.6] TripNetは、三面体表現を利用した機械学習ベースのフレームワークで、高忠実度CFDシミュレーションの結果を予測する。
TripNetは、業界標準の自動車設計の係数ドラッグ予測、表面場推定、およびフル3次元流れ場シミュレーションにおける最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:30:57 GMT)
PointSFDA: Source-free Domain Adaptation for Point Cloud Completion [27.5] 本稿では,ポイントクラウド補完のための効果的なオープンソースフリードメイン適応フレームワークを提案する。
PointSFDAは、事前訓練されたソースモデルと未ラベルのターゲットデータのみを使用して適応する。
本手法は,ドメイン間の整形における最先端ネットワークの性能を著しく向上させる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:09:45 GMT)
DeepSeek-Inspired Exploration of RL-based LLMs and Synergy with Wireless Networks: A Survey [27.4] 強化学習(RL)に基づく大規模言語モデル(LLM)が注目されている。
無線ネットワークは、RLベースのLLMの強化を必要とする。
無線ネットワークは、RLベースのLLMの効率的なトレーニング、デプロイメント、分散推論のための重要な基盤を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:32:33 GMT)
Attributing Culture-Conditioned Generations to Pretraining Corpora [27.0] 我々は、事前学習データパターンに基づいて、モデルがエンティティと文化を関連付ける方法を分析する。
プレトレーニングデータの高周波カルチャーは記憶されたシンボルでより多くの世代を産み出すのに対し、低周波カルチャーの中には何も生まないものもある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:08:17 GMT)
Reasoning Effort and Problem Complexity: A Scaling Analysis in LLMs [26.5] 大規模言語モデルの推論の取り組みは,問題複雑性とともにどのようにスケールするかを検討する。
この結果から, 推理作業は問題の大きさに応じて規模が大きくなるが, 重大な問題にのみ対処できることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:13:51 GMT)
Neuro Symbolic Knowledge Reasoning for Procedural Video Question Answering [26.0] 本稿では、複雑な推論に手続き的知識を活用するためのモデルに挑戦する、新しいビデオ質問応答データセットを提案する。
視覚的実体を認識し、仮説を生成し、文脈的、因果的、反事実的推論を実行する必要がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:49:14 GMT)
Enforcing Consistency and Fairness in Multi-level Hierarchical Classification with a Mask-based Output Layer [25.8] 分類を強制し、一貫性、公正性、正確な一致を含む目的を最適化するために設計された公正でモデルに依存しないレイヤを導入します。
評価の結果,提案した層は予測の公平性を向上するだけでなく,分類を強制し,一貫した予測と優れた性能をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:30:04 GMT)
DualToken: Towards Unifying Visual Understanding and Generation with Dual Visual Vocabularies [25.8] 再建のために訓練された視覚トークンーは、低レベルの知覚の詳細を捉えるのに優れる。
対照的な学習によって訓練された視覚エンコーダは、言語とよく一致しているが、生成タスクのためにピクセル空間に復号化するのに苦労する。
本稿では,単一のトークン化器内での理解と生成の両方の表現を統一する手法であるDualTokenを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:58:33 GMT)
Sparseformer: a Transferable Transformer with Multi-granularity Token Sparsification for Medical Time Series Classification [25.5] MedTS分類用に特別に設計された変換器であるSparseformerを紹介する。
本稿では,大域的モデリングとトークン圧縮を実現するための,スパーストークンベースのデュアルアテンション機構を提案する。
我々のモデルは、教師あり学習下で7つの医療データセットで12のベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:22:42 GMT)
FAVOR-Bench: A Comprehensive Benchmark for Fine-Grained Video Motion Understanding [25.4] FAVOR-Benchは1,776本の動画からなり,様々な動作の手動アノテーションが組み込まれている。
FAVOR-Trainは17,152の動画と微粒なモーションアノテーションからなるデータセットである。
FAVOR-Train上でQwen2.5-VLを微調整した結果,TVBench,MotionBenchおよびFAVOR-Benchの動作関連タスクに一貫した改善が得られた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:42:32 GMT)
Exploring the Limits of KV Cache Compression in Visual Autoregressive Transformers [25.3] 我々は、Visual Autoregressive TransformerのKV-cache圧縮問題を正式に定義する第一歩を踏み出す。
次に、基本的な負の結果を確立し、シーケンシャルな視覚トークン生成のメカニズムが少なくとも$Omega(n2 d)$メモリを使用する必要があることを証明した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:18:57 GMT)
DCA: Dividing and Conquering Amnesia in Incremental Object Detection [25.1] 本研究は,トランスフォーマーを用いたIODにおける局所化と認識の不均衡を忘れて発見する原因について考察する。
本稿では,トランスフォーマーをベースとしたIODを局所化認識プロセスに再設計するDCA戦略を提案する。
提案手法は,特に長期的段階的なシナリオにおいて,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:17:14 GMT)
MathFlow: Enhancing the Perceptual Flow of MLLMs for Visual Mathematical Problems [25.0] MLLM(Multimodal Large Language Models)は、視覚数学的な問題解決において、その可能性を十分に示していない。
問題解決時に使用される情報を4つのコンポーネントに分類するベンチマークであるFlowVerseを開発した。
我々は、知覚と推論を異なる段階に分離するモジュール型問題解決パイプラインであるMathFlowを紹介した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:46:19 GMT)
Training and Inference Efficiency of Encoder-Decoder Speech Models [25.0] 我々は効率角に焦点を合わせ、これらの音声モデルを効率的に訓練しているかどうかを問う。
ミニバッチサンプリングにおける無視は、パディングに50%以上費やされていることを示す。
モデルアーキテクチャを調整してデコーダからエンコーダにモデルパラメータを転送すると、3倍の推論速度が得られます。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:08:48 GMT)
Generating Multimodal Driving Scenes via Next-Scene Prediction [24.8] 本稿では,4つの主要なデータモダリティを組み込んだマルチモーダル生成フレームワークを提案する。
我々のフレームワークは、拡張シーケンス上で複雑で現実的な運転シーンを効果的に生成し、マルチモーダル整合性を確保し、シーン要素のきめ細かい制御を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:20:16 GMT)
No, of course I can! Refusal Mechanisms Can Be Exploited Using Harmless Fine-Tuning Data [24.8] 安全でないLMを生成するために無害なデータを使用する既存の攻撃は、応答の最初の数個のトークンでモデル拒絶を除去することに依存していることを示す。
我々は、LMの定式的拒絶機構を利用して有害な応答を誘発する新たなデータ汚染攻撃、No, course, I Can Execute' (NOICE)について述べる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:50:21 GMT)
Learning to Negotiate via Voluntary Commitment [24.8] 自律エージェントの部分的なアライメントとコンフリクトは、現実世界のアプリケーションにおいて混合モチベーションシナリオをもたらす。
我々は,エージェントが自発的に将来の計画にコミットできる,コミットメントゲームの一種であるMarkov Commitment Games (MCGs)を提案する。
混合モチベーションの課題に対する実験結果から,より高速な経験的収束と,本手法の帰納率の向上が示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:23:37 GMT)
Implicit Bias of Mirror Flow for Shallow Neural Networks in Univariate Regression [24.4] ネットワーク幅が無限大になる傾向にある場合、ミラーフローは遅延トレーニングを示し、通常の勾配流と同じ暗黙バイアスを有することを示す。
絶対値アクティベーションを持つネットワークの場合、スケールされたポテンシャルを持つミラーフローは、RKHSノルムによって捕捉できない豊富なバイアスのクラスを誘導することを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:13:59 GMT)
LogiAgent: Automated Logical Testing for REST Systems with LLM-Based Multi-Agents [24.2] LogiAgentは、RESTシステムの論理テストのための新しいアプローチである。
ビジネスロジックに基づいて応答を評価する論理的オラクルが組み込まれている。
基本的にはサーバのクラッシュの検出に優れ、最先端の4つのREST APIテストツールと比較してテストカバレッジが優れている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:24:16 GMT)
UTFix: Change Aware Unit Test Repairing using LLM [24.1] UTFixは, 焦点法が変化した場合に, 単体検査を修復するための新しい手法である。
このアプローチでは,静的コードスライスや動的コードスライス,障害メッセージなどのコンテキスト情報を提供することで,言語モデルを利用してユニットテストを修復する。
私たちの知る限りでは、これはPythonプロジェクトの進化におけるユニットテストに焦点を当てた初めての総合的な研究です。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:10:03 GMT)
HandOS: 3D Hand Reconstruction in One Stage [24.1] HandOSは3Dハンドコンストラクションのためのエンドツーエンドフレームワークである。
本稿では,対話型2D-3Dデコーダを提案する。
本研究では,手検出,2次元ポーズ推定,3次元メッシュ再構成のエンドツーエンド統合を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:43:35 GMT)
Contrastive Explanations That Anticipate Human Misconceptions Can Improve Human Decision-Making Skills [24.0] 人々の意思決定能力は、意思決定支援にAIに頼ると、しばしば改善に失敗する。
ほとんどのAIシステムは、AIの決定を正当化する一方的な説明を提供するが、ユーザーの思考を考慮しない。
我々は、AIの選択と予測された、おそらく人間の選択との違いを説明する、人間中心のコントラスト的な説明を生成するためのフレームワークを紹介します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:44:00 GMT)
Learn Your Scales: Towards Scale-Consistent Generative Novel View Synthesis [24.0] 生成的新規なビュー合成法を訓練する際に, スケールあいまいさの影響を理解し, 対処する方法を模索する。
GNVSでは、シーンやオブジェクトの新たなビューは、単一のイメージによって最小限に合成することができ、したがって制限されない。
GNVSにおけるシーンスケールのあいまいさが単一画像からサンプル化した場合の効果について,その効果をモデル上で分離することによって検討した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:56:03 GMT)
GraspCorrect: Robotic Grasp Correction via Vision-Language Model-Guided Feedback [23.5] 最先端の政策モデルでさえ不安定な把握行動を示すことが多い。
視覚言語モデル誘導フィードバックによるグルーピング性能の向上を目的とした,プラグイン・アンド・プレイモジュールであるGraspCorrectを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:25:32 GMT)
Learning Distributions of Complex Fluid Simulations with Diffusion Graph Networks [23.2] 平衡分布から状態を直接サンプリングできるグラフベース潜在拡散モデルを提案する。
これにより、長くて高価な数値シミュレーションを実行することなく、効率的な流量統計のジオメトリを実現できる。
本手法を乱流中の3次元翼模型の圧力予測などの流体力学タスクに適用する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:04:39 GMT)
Reinforcement Learning Outperforms Supervised Fine-Tuning: A Case Study on Audio Question Answering [22.9] 強化学習(RL)は、大規模言語モデル(LLM)の推論能力を大幅に向上させることが示されている。
我々は、音声理解と推論において、特に音声質問応答(AQA)タスクに焦点を当てた一連のRL探索を行う。
実験ではMMAU Test-miniベンチマークで最先端の性能を示し,64.5%の精度を実現した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:33:16 GMT)
GO-N3RDet: Geometry Optimized NeRF-enhanced 3D Object Detector [22.8] GO-N3RDet(GO-N3RDet)は、ニューラルレイディアンスフィールドによって強化されたシーンジオメトリ最適化されたマルチビュー3Dオブジェクト検出器である。
多視点特徴を融合させるために,独自の3次元位置情報埋め込みボクセル最適化機構を導入する。
我々のユニークなモジュールは、NeRFベースのマルチビュー3D検出において、新しい最先端状態を確立するエンドツーエンドのニューラルネットワークを相乗的に形成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:51:00 GMT)
Safety Aware Task Planning via Large Language Models in Robotics [22.7] 本稿では,ロボット作業計画に安全意識を組み込むためのマルチLLMフレームワークであるSAFER(Safety-Aware Framework for Execution in Robotics)を紹介する。
本フレームワークは, 複数段階の安全フィードバックを統合し, リアルタイムリスク評価, プロアクティブエラー訂正, 透過的安全性評価を実現している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:41:10 GMT)
E2ETune: End-to-End Knob Tuning via Fine-tuned Generative Language Model [22.7] E2ETuneは、細調整された生成言語モデルを利用したエンドツーエンドのノブチューナーである。
本稿では,大量のトレーニングデータを効率的に生成する新しいデータ生成フレームワークを提案する。
そして、これらのデータを用いて生成言語モデルを微調整し、エンドツーエンドのノブチューナーを生成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:19:58 GMT)
Diffusion-Based Forecasting for Uncertainty-Aware Model Predictive Control [22.6] 部分的に観測可能なシステムにおける不確実性を考慮した予測と意思決定のための一般的なフレームワークである拡散インフォームドモデル予測制御(DI MPC)を提案する。
本手法では,拡散に基づく時系列予測モデルを用いて,システムのコンポーネントの進化を確率論的に推定する。
本稿は,ニューヨーク州の日々の電力市場において,バッテリ・エナジー・ストレージ・システム(バッテリー・エナジー・ストレージ・システム)が参加するエネルギー仲裁の課題に関する枠組みを評価するものである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:48:26 GMT)
Detect-and-Guide: Self-regulation of Diffusion Models for Safe Text-to-Image Generation via Guideline Token Optimization [22.2] 有害なコンテンツを生成するテキストと画像の拡散モデルに対する懸念が高まっている。
概念アンラーニングや安全ガイダンスのようなポストホックモデルの介入技術は、これらのリスクを軽減するために開発されている。
本稿では,自己診断と詳細な自己制御を行うための安全生成フレームワークであるDector-and-Guide(DAG)を提案する。
DAGは最先端の安全な生成性能を実現し、有害性軽減とテキスト追跡性能を現実のプロンプトでバランスさせる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:37:52 GMT)
DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning [21.8] DeepMeshは、2つの重要なイノベーションを通じてメッシュ生成を最適化するフレームワークである。
データキュレーションと処理の改善とともに、新しいトークン化アルゴリズムが組み込まれている。
複雑な詳細と正確なトポロジを持つメッシュを生成し、精度と品質の両方で最先端の手法より優れています。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:39:30 GMT)
VIPER: Visual Perception and Explainable Reasoning for Sequential Decision-Making [21.6] VIPERはマルチモーダル命令ベースの計画のための新しいフレームワークである。
VLMベースの知覚とLLMベースの推論を統合する。
その結果、VIPERは最先端のビジュアル・インストラクション・ベース・プランナーよりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:05:42 GMT)
ADBM: Adversarial diffusion bridge model for reliable adversarial purification [21.3] 近年,拡散型浄化法(DiffPure)は,敵の事例に対する効果的な防御法として認識されている。
DiffPureは, 元の事前学習拡散モデルを用いて, 逆流浄化を最適に行う。
本稿では,ADBMと呼ばれる新しいAdrialversa Diffusion Bridge Modelを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:26:47 GMT)
Tuning Sequential Monte Carlo Samplers via Greedy Incremental Divergence Minimization [21.2] 本稿では,SMCサンプリング器のMarkovカーネルをチューニングするための一般的な適応フレームワークを提案する。
本稿では,Langevin Monte Carlo (LMC) などのカーネルに適用可能な勾配およびチューニング不要なアルゴリズムを提案する。
我々の実装では、数回のバニラSMC実行を犠牲にして、チューニングされたパラメータの完全なテキストスケジュールを得ることができる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:35:02 GMT)
Comparing Targeting Strategies for Maximizing Social Welfare with Limited Resources [21.0] 政策立案者はランダム化制御試験(RCT)からデータにアクセスされることが滅多にないため、個人が介入の恩恵を受けるであろう正確な見積もりが可能になる。
実践者は、一般的にリスクベースのターゲティングと呼ばれるテクニックを使用します。
現在、どの選択肢が最も効果的な機械学習インフォームドターゲティング戦略につながるかを知らせる実証的な証拠はほとんどない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:34:26 GMT)
SINGAPO: Single Image Controlled Generation of Articulated Parts in Objects [21.0] 本稿では,単一画像から音声オブジェクトを生成する手法を提案する。
提案手法は,入力画像と視覚的に一致した音声オブジェクトを生成する。
実験の結果,本手法は音声によるオブジェクト生成における最先端の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:42:07 GMT)
Derm1M: A Million-scale Vision-Language Dataset Aligned with Clinical Ontology Knowledge for Dermatology [20.7] 本稿では,1029,761個の画像テキストペアからなる皮膚科における最初の大規模視覚言語データセットであるDerm1Mを提案する。
AI研究と臨床応用の進展におけるDerm1Mの可能性を示すために、我々はこのデータセット上で一連のCLIPライクなモデル(DermLIP)を事前訓練した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:30:01 GMT)
Explicit Learning and the LLM in Machine Translation [20.6] 本研究では,大規模言語モデル(LLM)の明示的学習能力について検討する。
制御されたテスト環境として手段によって生成された構築言語を用いて,LLMの文法規則を明示的に学習し適用する能力を評価する実験を設計した。
思考の連鎖を微調整することで、LLMのパフォーマンスは著しく向上するが、類型的に新しい言語的特徴やより複雑な言語的特徴への一般化に苦慮する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:23:04 GMT)
FlowTok: Flowing Seamlessly Across Text and Image Tokens [20.6] FlowTokは、コンパクトな1Dトークン表現に画像をエンコードすることで、テキストとイメージをシームレスに流れるフレームワークである。
256の解像度で遅延空間のサイズを3.3倍に減らし、複雑な条件付け機構やノイズスケジューリングを必要としない。
コンパクトな1Dトークンを中心にした合理化アーキテクチャにより、FlowTokはメモリ効率が高く、トレーニングリソースが大幅に少なくなり、より高速なサンプリング速度を実現し、最先端のモデルに匹敵するパフォーマンスを提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:39:37 GMT)
Empowering Medical Multi-Agents with Clinical Consultation Flow for Dynamic Diagnosis [20.6] コンサルテーションプロセス全体をシミュレートするために,コンサルテーションフローと強化学習(RL)にインスパイアされたマルチエージェントフレームワークを提案する。
本手法は,臨床相談フローと医用教科書から構築した階層的行動集合を取り入れ,意思決定過程を効果的に指導する。
この戦略はエージェントのインタラクションを改善し、動的状態に基づいたアクションの適応と最適化を可能にする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:47:18 GMT)
BigO(Bench) -- Can LLMs Generate Code with Controlled Time and Space Complexity? [20.6] BigO(Bench)は、特定の時間と空間の複雑さでコードを理解し、生成する言語モデルの能力を評価するために設計された、新しいコーディングベンチマークである。
BigO(Bench)には、プロファイリング測定から任意のPython関数のアルゴリズム上の複雑さを推測するツールが含まれている。
このベンチマークで、複数の最先端言語モデルを評価し、複雑さの要求に対処する際の長所と短所を強調した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:19:57 GMT)
ChatStitch: Visualizing Through Structures via Surround-View Unsupervised Deep Image Stitching with Collaborative LLM-Agents [20.5] 本稿では,不明瞭な盲点情報を提示できる最初の協調認識システムChatStitchを紹介する。
複雑なコマンドや抽象的なコマンドを十分に処理するために、ChatStitchでは、大規模言語モデルに基づいたマルチエージェント協調フレームワークを採用している。
人間の最も直感的な知覚を実現するため、ChatStitch氏はSV-UDISを提案している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:25:21 GMT)
Are "Solved Issues" in SWE-bench Really Solved Correctly? An Empirical Study [20.5] 自動問題解決のための最も一般的なベンチマークは、SWE-benchと、その人間のフィルタリングサブセットであるSWE-bench Verifiedである。
本稿では,SWE-bench Verifiedで評価された3つの最先端課題解決ツールによって生成された可塑性パッチの正確性について,詳細な実験的検討を行った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:02:21 GMT)
Reducing Annotation Burden: Exploiting Image Knowledge for Few-Shot Medical Video Object Segmentation via Spatiotemporal Consistency Relearning [20.5] 少数のビデオフレームからのみ利用し,既存のラベル付き画像を利用して,コストのかかるビデオアノテーションを最小化する,極めて低データ方式について検討する。
本モデルでは, 医用画像と希少な医用画像とのギャップを埋めて, この低データ体制下での強力な映像セグメンテーション性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:51:14 GMT)
Advances in 4D Generation: A Survey [20.3] 4D生成は、ユーザ入力に基づいた一貫性のある動的3Dアセットの作成に重点を置いている。
一貫性、制御可能性、多様性、効率、忠実さの5つの主要な課題を要約する。
我々は現在,4D世代の発展を妨げる障害について,詳細な議論を行っている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:05:50 GMT)
Multi-Agent Actor-Critic with Harmonic Annealing Pruning for Dynamic Spectrum Access Systems [19.8] マルチエージェント深層強化学習(MADRL)は、複雑な環境で分散化された意思決定システムを最適化するための強力なツールとして登場した。
リソース制約のあるエッジデバイスにディープラーニングモデルをデプロイすることは、計算コストが高いため、依然として困難である。
独立系アクターグローバル批評家パラダイムに段階的ネットワークプルーニングを統合する新しいMARLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:56:23 GMT)
Language-based Image Colorization: A Benchmark and Beyond [19.7] 画像の自動色付け手法は、色あいさによる高品質な画像の生成に苦慮している。
テキスト記述の効率性と柔軟性をフル活用して色付けを導くために,言語に基づく色付け手法を提案する。
これは、言語ベースの画像色付けフィールドに関する、初めての包括的なレビューとベンチマークである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:09:32 GMT)
Enhancing High-Quality Code Generation in Large Language Models with Comparative Prefix-Tuning [19.5] 大型言語モデル(LLM)は商用コード補完エンジンで広く採用されている。
LLMは、コーディング標準に違反した品質の問題のあるコードを生成する。
制御可能な高品質コード生成のための新しい比較プレフィックスチューニング法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:24:48 GMT)
KoGNER: A Novel Framework for Knowledge Graph Distillation on Biomedical Named Entity Recognition [19.3] 名前付きエンティティ認識(NER)は、情報抽出、質問応答、知識に基づくシステムにおいて重要な役割を果たす。
従来のディープラーニングベースのNERモデルは、ドメイン固有の一般化に苦しむことが多く、データ空間の問題に悩まされる。
我々は、知識グラフをNERモデルに統合する新しいアプローチである、名前付きエンティティ認識(KoGNER)のために蒸留した知識グラフを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:59:36 GMT)
GenM$^3$: Generative Pretrained Multi-path Motion Model for Text Conditional Human Motion Generation [19.3] Generative Pretrained Multi-path Motion Model (GenM$3$)は、統合された動き表現を学習するためのフレームワークである。
大規模なトレーニングを可能にするため、11の高品質なモーションデータセットを統合し、統合する。
GenM$3$はHumanML3Dベンチマークで0.035の最先端のFIDを実現し、最先端のメソッドを大きなマージンで上回る。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:56:52 GMT)
Neuronal Activation States as Sample Embeddings for Data Selection in Task-Specific Instruction Tuning [19.3] 特徴空間における標本の埋め込みとしてニューロン活性化状態を利用するNASと呼ばれる新しいデータ選択法を提案する。
大規模な実験により、NASは、異なるモデル、データセット、選択比において、有効性と堅牢性の両方の観点から、古典的なデータ選択方法より優れていることが示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:35:57 GMT)
High-rate continuous-variable quantum key distribution over 100 km fiber with composable security [19.2] 量子鍵分布(QKD)は、秘密鍵を情報理論のセキュリティで生成する方法を提供する。
CV-QKDは、地下鉄エリア内で高い秘密鍵レート(SKR)を達成するという潜在的な利点と、成熟した通信業界との互換性を提供する。
ここでは、Gbps SKRを10km以内、Mbps SKRを100km以上とする10GHzのシンボルレートの高速マルチキャリア(MC)CV-QKDを初めて実演する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:56:45 GMT)
TF-TI2I: Training-Free Text-and-Image-to-Image Generation via Multi-Modal Implicit-Context Learning in Text-to-Image Models [19.2] トレーニングフリーのテキスト・イメージ・トゥ・イメージ(TF-TI2I)は、追加のトレーニングを必要とせずに最先端のT2Iモデルに適応する。
提案手法は,様々なベンチマークにおいて堅牢な性能を示し,複雑な画像生成タスクの処理の有効性を確認した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:03:19 GMT)
Expanding Chatbot Knowledge in Customer Service: Context-Aware Similar Question Generation Using Large Language Models [19.1] サービスチャットボットは、多様なクエリに対するタイムリーなレスポンスを提供することによって、カスタマーサポートを強化する上で重要な役割を果たす。
多様な顧客からの問い合わせを効果的に処理するためには、意味的一貫性と言語的多様性を維持するための同様の質問で知識ベースを強化することが不可欠である。
本稿では,Large Language Modelsを用いて類似の質問を生成し,知識ベース強化のための質問の最適サブセットを選択する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:22:38 GMT)
1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities [19.0] 自己教師付き学習のスケールアップは言語とビジョンのブレークスルーを加速させたが、強化学習(RL)では同等の進歩がいまだに残されている。
本稿では,ネットワーク深度が重要な要素となる自己教師型RLの構築ブロックについて検討する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:33:57 GMT)
Geometrically-Aware One-Shot Skill Transfer of Category-Level Objects [19.0] 本研究では,ロボットが複雑な物体操作のスキルと制約を1人の人間の実演から伝達することのできる,新しいスキル伝達フレームワークを提案する。
提案手法は,オブジェクト中心のインタラクションに着目したデモンストレーションから幾何学的表現を導出することで,スキル獲得とタスク実行の課題に対処する。
本手法の有効性と適応性を広範囲な実験により検証し,追加の訓練を必要とせず,多様な実環境における技術移転とタスク実行を実証した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:10:17 GMT)
KG-IRAG: A Knowledge Graph-Based Iterative Retrieval-Augmented Generation Framework for Temporal Reasoning [19.0] GraphRAGは、外部知識を必要とするタスクにおいて、LLM(Large Language Models)の性能を高めるのに非常に効果的であることが証明されている。
本稿では,KGと反復推論を統合する新しいフレームワークである知識グラフに基づく反復検索生成(KG-IRAG)を提案する。
KG-IRAGのパフォーマンスを評価するために、3つの新しいデータセットが作成され、従来のRAGアプリケーションを超える可能性を示している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:49:29 GMT)
Ctrl-U: Robust Conditional Image Generation via Uncertainty-aware Reward Modeling [18.9] 本稿では,ユーザの指示に従って画像が合成される条件付き画像生成の課題に焦点をあてる。
Ctrl-Uと呼ばれる不確実性を考慮した報酬モデルを提案し、報酬モデルからの不正確なフィードバックの悪影響を低減する。
不確実性推定に基づいて、報酬を適応的に修正することでモデルトレーニングを規則化する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:41:25 GMT)
Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training [18.9] 本稿では,言語エージェントをオンザフライでリフレクション可能な反復型自己学習フレームワーク,Agent-Rを提案する。
Agent-Rは、正しさに基づいてアクションを報酬または罰揚する従来の方法とは異なり、MCTSを活用して、誤ったトラジェクトリから正しいトラジェクトリを復元するトレーニングデータを構築する。
以上の結果から,Agent-Rは連続的にエラーから回復し,タイムリーなエラー訂正を可能にすることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:28:09 GMT)
Dial-In LLM: Human-Aligned LLM-in-the-loop Intent Clustering for Customer Service Dialogues [18.7] 本稿では,微調整の有効性について検討する。
意味的コヒーレンス評価と意図クラスタ命名におけるLLM
また、アンも提案している。
LLM-ITLクラスタリングアルゴリズムは反復的な発見を容易にする。
コヒーレントな意図のクラスター
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:14:04 GMT)
Aligning Information Capacity Between Vision and Language via Dense-to-Sparse Feature Distillation for Image-Text Matching [18.6] 既存のメソッドは通常、埋め込みの集合を学習し、各ビューのテキストに最適なマッチングを見つけ、類似性を計算する。
本稿では,高密度テキスト蒸留を利用してスパーステキストの情報容量を向上させるDense-to-Sparse Feature Distilled Visual Semantic Embedding (D2S-VSE)を提案する。
提案するD2S-VSEモデルは,大規模なMS-COCOおよびFlickr30Kデータセット上で広範囲に評価されている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:42:24 GMT)
Long Context Modeling with Ranked Memory-Augmented Retrieval [18.4] 関連性に基づいて動的にメモリエントリをランク付けする新しいフレームワークを提案する。
本モデルは,情報検索における学習からランクまでの技術に着想を得て,新しい妥当性スコアとキー値埋め込みのためのポイントワイズ・リグレード・モデルを導入する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:24:01 GMT)
Learning Nash Equilibrial Hamiltonian for Two-Player Collision-Avoiding Interactions [18.4] リスクに敏感な衝突回避インタラクションにおけるNash平衡ポリシの学習の問題点を考察する。
一般的な解法は、与えられたシステム状態と動作の平衡ハミルトニアンを近似するニューラルネットワークを学習することである。
本稿では、均衡政策のよりデータ効率の高い学習への2つの貢献を主張する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:47:07 GMT)
Privacy amplification by random allocation [18.2] 我々は、ユーザのデータがランダムに$k$ステップで使用されるアルゴリズムのプライバシ保証を、差分プライベートステップのシーケンス(またはセット)からランダムに選択されるアルゴリズムについて検討する。
このサンプリング方式のプライバシー保証は、よく研究されている独立性(あるいはPoisson)サブサンプリングのプライバシー保証によって上限に達する可能性があることを実証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:33:33 GMT)
Unlocking the Capabilities of Vision-Language Models for Generalizable and Explainable Deepfake Detection [18.1] 現在の視覚言語モデル(VLM)は、マルチモーダルデータの理解において顕著な能力を示しているが、そのポテンシャルはディープフェイク検出に過小評価されている。
本稿では,VLMの潜在能力を3つのコンポーネントで解き放つ新しいパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:20:03 GMT)
Ultrasound Image-to-Video Synthesis via Latent Dynamic Diffusion Models [17.9] そこで本研究では,超音波画像から可視性超音波映像を合成する手法を提案する。
BUSVベンチマークにおいて,強い定量的結果を示し,映像を視覚的にアピールする。
画像から映像へのアプローチは,超音波ビデオ解析の進歩に有効なデータ拡張ソリューションを提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:58:43 GMT)
pFedFair: Towards Optimal Group Fairness-Accuracy Trade-off in Heterogeneous Federated Learning [17.9] フェデレートされた学習アルゴリズムは、クライアントの集合データに基づいてモデルをトレーニングすることで、クライアントの精度を最大化することを目的としている。
群フェアネス制約は、FL最適化問題の目的関数に組み込むことができる。
このような手法により、不均一なクライアント分布を持つFL設定において、最適な分類精度が得られることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:15:31 GMT)
How to Train Your Dragon: Automatic Diffusion-Based Rigging for Characters with Diverse Topologies [17.7] より多様な骨格トポロジを持つキャラクタのイメージをアニメーション化するために,そのようなモデルの能力を拡張する。
本稿では,様々なトポロジをオンザフライで学習データを効率的にサンプリングする手続き型データ生成パイプラインを提案する。
微調整中、我々のモデルは目立たないターゲットキャラクタに迅速に適応し、新しいポーズのレンダリングをうまく一般化する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:46:36 GMT)
Exploring Model Editing for LLM-based Aspect-Based Sentiment Classification [17.5] 本研究では,大規模言語モデル(LLM)をアスペクトベース感情分類に適応させる効率的な手法として,モデル編集について検討する。
この結果から,特定のアスペクト単語の感情極性を検出するには,異なる中間層表現のセットが不可欠であることが判明した。
我々は,LLMの重要な部分にのみ焦点をあてたモデル編集手法を開発し,より効率的なLLM適応法を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:21:37 GMT)
Improving Adversarial Transferability on Vision Transformers via Forward Propagation Refinement [17.5] We refine two key module of ViTs: attention map and token embeddeds。
注意マップについては,注意マップを多角化した注意マップ分割 (AMD) を提案するとともに,後進伝播時に有益な消滅を暗黙的に課す。
我々は、VTから様々なCNNやVTへ移行した敵の例による広範な実験を行い、FPRが現在最高の(後方)サロゲート改良を平均7.0%向上させることを示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:44:23 GMT)
High-rate discrete-modulated continuous-variable quantum key distribution with composable security [17.3] 構成可能な秘密鍵レート18.93Mbpsの離散変調連続可変量子鍵分布系を25kmのファイバーチャネル上での集団攻撃に対して報告する。
この記録破り率は確率型16QAM変調プロトコルによって達成される。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:59:19 GMT)
Dynamic Bi-Elman Attention Networks (DBEAN): Dual-Directional Context-Aware Representation Learning for Enhanced Text Classification [17.3] 伝統的な手法は複雑な言語構造と意味的依存関係に苦しんだ。
深層学習は、ニュアンス付き特徴抽出と文脈認識予測を可能にすることにより、分野を著しく進歩させてきた。
本稿では,動的双方向エルマン・アテンション・ネットワーク(DBEAN)を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:45:13 GMT)
Value Profiles for Encoding Human Variation [17.2] 本研究では,文脈内実演から圧縮された値の自然言語記述である値プロファイルを用いて個人を表現することを提案する。
デモには最も多くの情報が含まれており、続いて価値プロファイルと人口統計が続く。
値プロファイルは、圧縮された自然言語フォーマットのため、精査性、解釈性、操縦性という点で利点がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:57:49 GMT)
Bonsai: Gradient-free Graph Distillation for Node Classification [17.0] グラフ蒸留は、GNNのスケーラブルなトレーニングを可能にするための有望な道として登場した。
本研究は, 現行のグラフ蒸留技術において, 重大な欠点を明らかにするものである。
本稿では,テキスト計算木がメッセージパッシングGNNの基本処理単位を形成するという観察により,新しいグラフ蒸留法であるボンサイについて述べる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:20:44 GMT)
UI-Vision: A Desktop-centric GUI Benchmark for Visual Perception and Interaction [16.7] UI-Visionは、コンピュータ使用エージェントのオフラインかつきめ細かい評価のための、最初の包括的なライセンス許容ベンチマークである。
オンラインベンチマークとは異なり、UI-Visionは人間のデモの密集した高品質なアノテーションを提供する。
評価の結果,UI-TARS-72Bのような最先端モデルの限界が明らかになった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:26:17 GMT)
3D Occupancy Prediction with Low-Resolution Queries via Prototype-aware View Transformation [16.7] 本稿では,階層化された画像セグメントのプロトタイプをビュー変換に活用し,低解像度のコンテキストを向上する新しい占有ネットワークであるProtoOccを紹介する。
特に、2Dプロトタイプの3Dボクセルクエリへのマッピングは、高レベルなビジュアルジオメトリを符号化し、クエリの解像度の低下から空間情報の損失を補う。
ProtoOcc は 75% のボクセル分解能が低下しても, ベースラインに対する競争性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:14:57 GMT)
FetalFlex: Anatomy-Guided Diffusion Model for Flexible Control on Fetal Ultrasound Image Synthesis [16.6] これらの課題に対処するために、Flexible Fetal USイメージ生成フレームワーク(FetalFlex)を紹介します。
FetalFlexには、制御性を高めるための事前調整モジュールが組み込まれており、一貫したテクスチャと外観を保証するための再塗装戦略が導入されている。
マルチセンターデータセットの実験では、FetalFlexが複数の画像品質メトリクスで最先端のパフォーマンスを達成したことが示されている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:16:19 GMT)
Interpretable High-order Knowledge Graph Neural Network for Predicting Synthetic Lethality in Human Cancers [16.6] 合成致死性(SL)は癌治療において有望な遺伝子相互作用である。
最近のSL予測手法は知識グラフをグラフニューラルネットワーク(GNN)に統合する
DGIB4SL(Diverse Graph Information Bottleneck for Synthetic Lethality)を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:23:11 GMT)
Prada: Black-Box LLM Adaptation with Private Data on Resource-Constrained Devices [16.5] 大きな言語モデル(LLM)は、リソース制約のあるエッジデバイスに格納されたプライベートデータセットを使用して、特別なドメインに適応することができる。
プライバシ保護と効率的なブラックボックスLLM適応システムであるPradaを提案する。
Pradaは、集中的な微調整手法に匹敵するパフォーマンスを実現し、計算オーバーヘッドを最大60%削減し、通信コストを最大80%削減する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:38:51 GMT)
Topology meets Machine Learning: An Introduction using the Euler Characteristic Transform [16.1] 私は、ポイントクラウド、グラフ、メッシュを分析するためのより効率的なモデルをもたらすユースケースを提示します。
本稿では,(1)トポロジカル空間上の関数の学習,(2)データ中のトポロジ的情報に関する知識を生かしたハイブリッドモデルの構築,(3)ニューラルネットワークの質的特性の分析など,トポロジカルな概念が将来どのように使われるか,というビジョンを概説する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:34:15 GMT)
Uncertainty-Aware PPG-2-ECG for Enhanced Cardiovascular Diagnosis using Diffusion Models [16.0] 光胸腺造影(英: Photoplethysmography, PPG)は、血液の体積変動を測定する光学的信号である。
ECGはより包括的な情報を提供し、心臓の状態をより正確に検出することができる。
本稿では, PPG-2-ECG変換に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:10:51 GMT)
Lightweight Software Kernels and Hardware Extensions for Efficient Sparse Deep Neural Networks on Microcontrollers [16.0] 我々は、超低消費電力マルチコアRISC-V MCUをターゲットとした、N:Mプルーニング層のための最適化されたソフトウェアカーネルセットを設計する。
Instruction-Set Architecture (ISA) 拡張を実装し,間接負荷および非ゼロ指標圧縮処理を高速化する。
ResNet18 と Vision Transformer (ViT) で3.21x と 1.81x の高速化を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:10:55 GMT)
Tapered Off-Policy REINFORCE: Stable and efficient reinforcement learning for LLMs [15.8] 強化学習を用いた大規模言語モデルの微調整のための新しいアルゴリズムを提案する。
オフ政治体制における正と負の例を適切に活用することで、テスト時間精度とトレーニングデータの効率が同時に向上することを示す。
この研究の結果として、REINFORCEのベースラインパラメータが、ネガティブな例の存在下でデータセット構成を定義する上で、重要かつ予期せぬ役割を担っていることが判明した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:25:30 GMT)
Optimizing Decomposition for Optimal Claim Verification [15.7] 既存の分解ポリシー、通常は手作りのデモは、原子性の観点から下流の検証器とうまく一致しない。
本稿では,検証者からのフィードバックを利用して,検証者優先の原子性に対する要求を動的に分解する政策を学習する強化学習フレームワークである動的分解を提案する。
実験の結果、動的分解は既存の分解ポリシーより優れており、検証信頼度は0.07向上し、入力クレームの検証器、データセット、原子度の平均で0.12精度が向上していることがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:56:21 GMT)
SPADE: Systematic Prompt Framework for Automated Dialogue Expansion in Machine-Generated Text Detection [15.6] 本稿では,構造化プロンプト手法を用いて,合成ユーザ対話生成のための5つの新しいデータ拡張フレームワークを提案する。
提案手法は14種類の新しい対話データセットを生成し、7つのMGT検出モデルに対してベンチマークを行う。
実世界のエージェントが将来の相手発話の知識を欠いていることを考慮し、オンライン対話検出をシミュレートし、チャット履歴の長さと検出精度の関係について検討する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:32:52 GMT)
Spot the Fake: Large Multimodal Model-Based Synthetic Image Detection with Artifact Explanation [15.4] 本稿では,一般的な合成画像とDeepFake検出タスクの両方を対象とした,大規模マルチモーダルモデルであるFakeVLMを紹介する。
FakeVLMは、本物と偽のイメージを区別し、画像アーティファクトの明確な自然言語説明を提供する。
FakeClueは、7つのカテゴリにわたる10万以上の画像を含む包括的データセットで、自然言語のきめ細かいアーティファクトのヒントで注釈付けされている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:14:44 GMT)
Shushing! Let's Imagine an Authentic Speech from the Silent Video [15.4] 視覚誘導音声生成は、聴覚信号に頼ることなく、顔の外観や唇の動きから真の音声を生成することを目的としている。
近年の進歩にもかかわらず、既存の手法は視覚的手がかりから意味論、音色、感情的な韻律を横断的に統一するのに苦労している。
ImaginTalkは、視覚入力のみを用いて忠実な音声を生成する新しいクロスモーダル拡散フレームワークである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:28:17 GMT)
Comprehensive Review of Reinforcement Learning for Medical Ultrasound Imaging [15.4] この研究は、米国の自律型ソリューション構築におけるRLの可能性を強調し、現在の研究成果の徹底的なレビューを提供することを目的としている。
米国スキャン領域の進歩に関する既存の調査は、主にAIを活用する部分的な自律的なソリューションに焦点を当てている。
このギャップを埋めるために、米国プロセスの段階をRL開発パイプラインに統合する包括的な分類法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:22:27 GMT)
VisNumBench: Evaluating Number Sense of Multimodal Large Language Models [15.3] MLLM(Multimodal Large Language Models)の数値知覚能力は,幅広い視覚的数値的タスクにおいて評価される。
VisNumBench は約 1,900 個の質問応答対で構成されている。
Qwen2.5-VLやInternVL2.5といったオープンソースのモデルを含む、私たちがテストした17のMLLMは、数感覚に関連したタスクにおいて、人間のレベルよりも大幅に低いパフォーマンスを実現しました。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:07:43 GMT)
FP4DiT: Towards Effective Floating Point Quantization for Diffusion Transformers [15.3] トレーニング後の量子化は、トレーニングや微調整を必要とせず、負担を軽減するための軽量な方法である。
W4A6量子化を実現するために浮動小数点量子化を利用するPTQ法であるFP4DiTを導入する。
FP4DiTは整数ベースのPTQをW4A6およびW4A8精度で上回ることを示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:44:21 GMT)
Survey on Modeling of Human-made Articulated Objects [15.3] 3Dモデリングはコンピュータビジョン、グラフィックス、ロボット工学における研究課題である。
本調査は, 調音物体の3次元モデリングにおける現状について概観する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:33:31 GMT)
A New Benchmark for Online Learning with Budget-Balancing Constraints [14.8] 本稿では,オートバイディングなどの実世界の応用と,その基礎となる数学的構造を比較対象とする新しいベンチマークを提案する。
サブリニアな消費パターンが$o(T2)$以内である戦略に対して,サブリニアな後悔は達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:14:20 GMT)
Test-Time Backdoor Detection for Object Detection Models [14.7] オブジェクト検出モデルは、バックドア攻撃に対して脆弱である。
TRACE(Transform Consistency Evaluation)は、オブジェクト検出において、テスト時に有毒なサンプルを検出する新しい方法である。
TRACEは、最先端の防御に対するAUROCの30%の改善を示す広範な実験により、ブラックボックス、普遍的なバックドア検出を実現している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:12:26 GMT)
Duoduo CLIP: Efficient 3D Understanding with Multi-View Images [14.6] Duoduo CLIPは3D表現学習のためのモデルであり、点雲の代わりに多視点画像から形状エンコーディングを学ぶ。
当社のアプローチは,既存のポイントクラウド手法よりも優れた一般化を示すだけでなく,GPU要件やトレーニング時間を短縮する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:55:24 GMT)
Robotic Paper Wrapping by Learning Force Control [14.5] 本研究では,ロボットが包装工程の各ステップを効率的に実行できるように,模倣学習と強化学習を組み合わせた新しい枠組みを提案する。
提案法はアブレーション試験により, 断裂率, ひび割れ率を著しく低減し, 作業完了を実証した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:45:46 GMT)
Leveraging BEV Paradigm for Ground-to-Aerial Image Synthesis [14.5] 地上から地上への画像合成は、対応する地上の景観画像から現実的な空中画像を生成することに焦点を当てている。
本研究では,ストリートビュー画像から航空画像を合成する新しいクロスビュー生成手法であるSkyDiffusionを紹介する。
地上から地上までの多様な画像合成用途のために設計された新しいデータセット「Ground2Aerial-3」を紹介した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:50:20 GMT)
Generalization Guarantees for Representation Learning via Data-Dependent Gaussian Mixture Priors [14.5] 我々は、表現学習型アルゴリズムの一般化誤差に基づいて、予測内およびテール境界を確立する。
本稿では,データ依存型ガウス混合を同時に学習し,それを正規化器として用いるための体系的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:37:44 GMT)
Causal Discovery and Counterfactual Reasoning to Optimize Persuasive Dialogue Policies [14.3] 因果的発見と反ファクト的推論を用いて、システムパースケーション能力と結果の最適化を行う。
PersuasionForGoodデータセットによる実験では,説得結果の計測精度が向上した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:06:10 GMT)
Combat Urban Congestion via Collaboration: Heterogeneous GNN-based MARL for Coordinated Platooning and Traffic Signal Control [14.3] 本稿では,異種グラフ多エージェント強化学習と交通理論に基づく課題に挑戦する革新的な手法を提案する。
我々は、交通流を最適化するために、小隊と信号制御を独自の観測、行動、報酬関数セットで強化学習エージェントとして設計する。
提案手法をSUMOシミュレーションにより評価し,他の適応信号制御法と比較して,走行時間と燃料消費の両面で収束した結果が得られた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:34:29 GMT)
ES-Parkour: Advanced Robot Parkour with Bio-inspired Event Camera and Spiking Neural Network [14.2] スパイキングニューラルネットワーク(SNN)とイベントカメラを導入し、挑戦的な4つのパーキングタスクを実行する。
我々の研究はロボット強化学習を推進し、需要のある環境における新しい可能性を開く。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:27:43 GMT)
Graph-Based Re-ranking: Emerging Techniques, Limitations, and Opportunities [14.1] グラフニューラルネットワーク(GNN)は、グラフ学習において、再ランク付けのための習熟度を示すために提案されている。
トレーニングと評価のための入力グラフ構造をモデル化し、評価する上で、継続的な制限がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:28:54 GMT)
FedSCA: Federated Tuning with Similarity-guided Collaborative Aggregation for Heterogeneous Medical Image Segmentation [14.1] トランスフォーマーベースファンデーションモデル (FM) は近年, 医用画像のセグメンテーションにおいて顕著な性能を示した。
しかし、分離病院内の医療画像データセットが限られているため、これらのモデルをスケールすることは困難である。
本稿では,UnderlinetextbfCollaborative UnderlinetextbfAggregation (FedSCA)を用いたFLFMファインチューニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:27:29 GMT)
NFL-BA: Improving Endoscopic SLAM with Near-Field Light Bundle Adjustment [14.1] 内視鏡ビデオからのSLAMは、自律的なナビゲーション、監視されていない地域へのガイダンス、盲点検出、3D視覚化を可能にする。
既存の高密度SLAMアルゴリズムは、遠距離および静的照明を仮定し、シーン幾何学とカメラパラメータを最適化する。
近接場照明は、既存のSLAMフレームワークの光測定バンドル調整を、屋内や屋外のシーンに比べて低調に行う。
従来の光束調整損失をNFL-BAに置き換えることで,ニューラル暗黙的SLAMと3DGS SLAMを用いて改善できることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:38:44 GMT)
Enabling Inclusive Systematic Reviews: Incorporating Preprint Articles with Large Language Model-Driven Evaluations [14.0] 我々は,事前印刷の出版を予測するための高度なフレームワークであるAutoConfidenceを提案する。
AutoConfidenceは手動のキュレーションへの依存を減らし、予測値の範囲を広げる。
このフレームワークは、エビデンスベースの医療において、プリプリント記事の体系的な取り込みを促進する可能性がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:21:06 GMT)
A Comprehensive Quantification of Inconsistencies in Memory Dumps [13.8] 我々は、メモリ取得プロセス中にOSカーネルが実行する書き込み操作を全て追跡するシステムを開発した。
我々は、異なる取得モード、ファイルシステム、ハードウェアターゲットがダンプ中のカーネル書き込みの頻度にどのように影響するかを定量化する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:02:54 GMT)
Coarse-to-Fine Lightweight Meta-Embedding for ID-Based Recommendation [13.7] 我々は,各ユーザとアイテムがノードとして機能する,新しいグラフニューラルネットワーク(GNN)ベースのレコメンデータを開発した。
粗粒のセマンティクスとは対照的に、きめ細かいセマンティクスはスパースメタ埋め込みによってよく捉えられる。
本稿では,ユーザ/イテムのセマンティクスに基づいて,各粗粒度メタエンベディングと細粒度メタエムとをマッチングすることに焦点を当てた重量ブリッジ更新戦略を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:12:41 GMT)
SAVA: Scalable Learning-Agnostic Data Valuation [13.7] 大規模でWebスクラッドな実際のデータセットには、個々のデータポイントの品質と関連性に影響を与えるノイズの多いアーティファクトが含まれている。
我々は、この問題をデータ評価タスクとして定式化し、クリーンでキュレートされた検証セットの類似性や相似性に応じて、トレーニングセット内のデータポイントに値を割り当てる。
そこで我々は,LAVAのスケーラブルな変種であるSAVAを提案し,その計算をデータポイントのバッチ上で行う。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:02:40 GMT)
ECO: An LLM-Driven Efficient Code Optimizer for Warehouse Scale Computers [13.6] 本稿では,ECO(Efficient Code)について紹介する。
過去1年間、ECOは四半期毎に大幅なパフォーマンスの削減を実現してきた。
平均して、1クォーターあたりのセーブは、500k以上の正規化されたCPUコアに相当する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:52:35 GMT)
Automated Processing of eXplainable Artificial Intelligence Outputs in Deep Learning Models for Fault Diagnostics of Large Infrastructures [13.4] 本研究は, ポストホックな説明と半教師付き学習を組み合わせて, 異常な説明を自動的に識別するフレームワークを提案する。
提案するフレームワークは,送電網インフラ監視のための絶縁体シェルのドローンによる画像に応用される。
2つの欠陥クラスの平均分類精度は8%向上し、メンテナンス作業者は画像の15%しか手動で再分類する必要がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:57:00 GMT)
HAD-Gen: Human-like and Diverse Driving Behavior Modeling for Controllable Scenario Generation [13.3] HAD-Genは、多様な人間のような運転行動をシミュレートする現実的な交通シナリオ生成のためのフレームワークである。
提案手法は, 目標達成率90.96%, オフロードレート2.08%, 衝突速度6.91%を達成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:38:45 GMT)
Fast MLE and MAPE-Based Device Activity Detection for Grant-Free Access via PSCA and PSCA-Net [13.1] 高速で正確なデバイスアクティビティは、大規模なマシンタイプの通信をサポートするための許可なしアクセスにおける重要な課題である。
本稿では,MLEに基づくデバイスアクティビティ検出手法を提案する。
本稿では,計算時間を削減するために,PSCA-Netと呼ばれるディープアンローリングニューラルネットワークの実装を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:31:09 GMT)
ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models [13.0] オープンソースT2Vモデルによる幻覚映像の大規模データセットであるViBeを紹介する。
10種類のT2Vモデルを用いて、837のMSキャプションから3,782本の動画を手動で作成した。
提案するベンチマークには、幻覚映像のデータセットと、ビデオ埋め込みを用いた分類フレームワークが含まれる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:53:09 GMT)
Reliable Radiologic Skeletal Muscle Area Assessment -- A Biomarker for Cancer Cachexia Diagnosis [12.9] 我々はディープラーニングモデル(nnU-Net 2D)を利用したエンドツーエンドの自動パイプラインであるSMAART-AIを開発した。
SMAART-AIには、専門家のレビューのためにSMA予測にフラグを付ける不確実性ベースのメカニズムが組み込まれており、信頼性が向上している。
SMAART-AIは胃食道癌データセットで試験され、Diceスコア97.80%+/-0.93%を達成し、SMAは4つのデータセットすべてで2.48%の絶対誤差で推定した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:07:59 GMT)
GASP: Unifying Geometric and Semantic Self-Supervised Pre-training for Autonomous Driving [12.9] 本稿では,時空における任意の将来点を予測して統一表現を学習する幾何学的,意味論的自己教師型事前学習手法GASPを提案する。
実測値の代わりに幾何学的および意味論的4次元占有場をモデル化することにより、モデルは、時間を通して環境と環境の一般的な表現を学習する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:00:27 GMT)
A Language Vision Model Approach for Automated Tumor Contouring in Radiation Oncology [12.9] 肺がんは世界中でがん関連死亡の原因となっている。
Oncology Contouring Copilot システムは、腫瘍の正確なコントゥーリングのために、腫瘍学者の専門知識を活用するために開発された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:41:37 GMT)
Covering Cracks in Content Moderation: Delexicalized Distant Supervision for Illicit Drug Jargon Detection [12.8] JEDISは,その文脈を解析して違法薬物の用語を検出するためのフレームワークである。
実験の結果,JEDISは薬物ジャーゴン検出におけるF1スコアおよび検出範囲において,最先端の単語ベースラインよりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:26:25 GMT)
R$^2$: A LLM Based Novel-to-Screenplay Generation Framework with Causal Plot Graphs [12.8] 大規模言語モデル(LLM)に基づく脚本に小説を自動的に適応するフレームワークを提案する。
因果組込みプロット線を効果的に抽出してコヒーレントな書き換えを行う。
1) 幻覚の愛着を反復的に発見・排除するA-Aware refinement method (HAR) と, 2 事象因果関係を持つプロット線を効率的に構築する欲求サイクルブレーカリングアルゴリズムに基づく因果プロットグラフ構築法 (CPC) の2つの手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:09:40 GMT)
SpatialBot: Precise Spatial Understanding with Vision Language Models [12.7] 視覚言語モデル (VLM) は2次元画像理解において優れた性能を発揮している。
彼らはまだ、Embodied AIの基盤である空間的理解に苦戦している。
本稿では,RGB画像と深度画像の両方をフィードすることで,空間的理解を向上させるためのSpatialBotを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:09:14 GMT)
MMO-IG: Multi-Class and Multi-Scale Object Image Generation for Remote Sensing [12.5] MMO-IGは、グローバルな面とローカルな面から、教師付きオブジェクトラベルでRS画像を生成するように設計されている。
MMO間の複雑な相互依存性を考慮すると、空間的相互依存知識グラフを構築する。
MMO-IGは、高密度なMMO教師付きラベルを持つRS画像に対して優れた生成能力を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:22:39 GMT)
Multimodal Feature-Driven Deep Learning for the Prediction of Duck Body Dimensions and Weight [12.5] 本研究では、異なるビュー、深度画像、および3D点雲からのマルチモーダルデータ2D RGB画像を活用する革新的な深層学習モデルを提案する。
姿勢や条件の異なる5,000以上のサンプルからなる1,023羽のLinwuアヒルのデータセットを収集し、モデルトレーニングを支援した。
このモデルは平均絶対パーセンテージ誤差(MAPE)が6.33%、R2が0.953で8つの形態パラメータで達成され、強い予測能力を示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:16:56 GMT)
Improving Generalization of Universal Adversarial Perturbation via Dynamic Maximin Optimization [12.3] 深部ニューラルネットワーク(DNN)は、普遍的対向摂動(UAP)に影響を受けやすい
我々は,様々な最適モデル-データペア間でUAPを最適化することを目的とした,動的最大値最適化戦略を導入する。
ImageNetデータセットの実験では、提案されたDM-UAPが、クロスサンプルの普遍性とクロスモデル転送性の両方を著しく強化することを示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:12:16 GMT)
Continual Contrastive Learning on Tabular Data with Out of Distribution [11.9] アウト・オブ・ディストリビューション(OOD)予測は、マシンラーニングにおいて依然として重要な課題である。
本稿では,データ処理における OOD 課題に対処するための新しいフレームワークである Tabular Continual Contrastive Learning (TCCL) を紹介する。
TCTCは、対照的な学習原則と連続的な学習メカニズムを統合し、3成分アーキテクチャを特徴とする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:40:07 GMT)
Exploiting Diffusion Prior for Real-World Image Dehazing with Unpaired Training [11.9] 未ペアトレーニングは、ぼんやりとした鮮明なイメージから学ぶことによって、現実のデハジングに最も効果的なパラダイムの1つである。
空白画像の生成における拡散モデルの強い生成能力に触発され,実世界のデハジングに先立って拡散を利用する。
本稿では,画像とテキストのモダリティの劣化を除去し,拡散モデルの表現能力を適切に活用するための新たな視点を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:13:06 GMT)
What Makes a Good TODO Comment? [11.9] 研究によると、オープンソースコメントの大部分が未解決のまま残されているか、解決に長い時間がかかる。
オープンソースリポジトリにおけるコメントの約46.7%は、低品質である(例えば、曖昧さ、情報不足、開発者にとっては役に立たない)。
高品質なコメントを識別するための基準を提案し,その最適構成に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:55:01 GMT)
Pathways on the Image Manifold: Image Editing via Video Generation [11.9] 我々は、事前訓練されたビデオモデルを用いて、画像編集を時間的プロセスとして再構成し、元の画像から所望の編集へのスムーズな遷移を生成する。
提案手法は,テキストベースの画像編集における最先端の成果を達成し,編集精度と画像保存の両面で有意な改善を示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:30:44 GMT)
CCDP: Composition of Conditional Diffusion Policies with Guided Sampling [11.7] 本稿では,以前に失敗した動作を避けるため,サンプリング分布を改良する改良されたサンプリング戦略を提案する。
本手法は,探索行動の追加を必要とせずに,回復動作を推定できることを実証する。
提案手法では, サンプリングスペースを動的に調整し, 先行サンプルが不足した場合の効率を向上させる低レベルコントローラを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:24:55 GMT)
Enhancing Code LLM Training with Programmer Attention [11.6] プログラマの注意グラフを拡大するための視線追跡経路拡張手法を提案する。
我々はまた、生の修正を学習可能な注意モチーフに洗練するパターン抽象化のステップも導入する。
コード要約のためのCodeXGlueベンチマークでは,CodeBLEUで+7.16が得られた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:44:29 GMT)
Challenges and Trends in Egocentric Vision: A Survey [11.6] エゴセントリックな視覚は、人間の体に装着されたカメラやセンサーを通して、視覚的およびマルチモーダルなデータをキャプチャする。
本稿では,自我中心の視覚理解に関する研究を包括的に調査する。
最新の進歩を要約することで、拡張現実、バーチャルリアリティ、エンボディドインテリジェンスといった分野において、エゴセントリックなビジョン技術の幅広い応用が期待できる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:51:27 GMT)
Partially Observable Reinforcement Learning with Memory Traces [11.6] 指数移動平均の形で観測の歴史をコンパクトに表現するメモリトレースを導入する。
オフラインのオンライン評価の問題に対して,サンプルの複雑性境界を証明した。
特定の環境では、メモリトレースによる学習の方がはるかに効率が良いことが実証された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:38:29 GMT)
DiffPortrait360: Consistent Portrait Diffusion for 360 View Synthesis [11.5] 完全一貫した360度ヘッドビューを生成する新しい手法を提案する。
連続的なビューシーケンスをトレーニングし、バックレファレンス画像を統合することにより、ロバストで局所的な連続的なビュー合成を実現する。
我々のモデルは、リアルタイムで自由視点レンダリングのための高品質なニューラルレイディアンスフィールド(NeRF)を作成するために使用することができる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:47:04 GMT)
SDRT: Enhance Vision-Language Models by Self-Distillation with Diverse Reasoning Traces [11.5] 視覚言語モデルのための新しい自己蒸留フレームワークを提案する。
我々は、多様なコンテキスト内質問を生成するために、視覚的推論タスクに適したプロンプトライブラリを採用する。
次に,2段階の推論手法を用いて推論誘導応答を導出する。
これらの反応は自己蒸留に使用され、モデルが推論プロセスの内部化を可能にする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:35:44 GMT)
Ambient Noise Full Waveform Inversion with Neural Operators [11.4] 近年の研究では、ニューラル演算子と呼ばれる新しい機械学習モデルが、従来の方法よりもはるかに高速にエラストダイナミック波動方程式のオーダーを解くことができることが示されている。
実地震観測データに対するフルウェーブフォームインバージョンに対するニューラル演算子の応用を実証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:10:43 GMT)
MaskHand: Generative Masked Modeling for Robust Hand Mesh Reconstruction in the Wild [11.4] MaskHandは、ハンドメッシュリカバリのための新しい生成マスクモデルである。
あいまいな2D-to-3Dマッピングプロセスの確率分布から学習とサンプリングにより、可塑性3Dハンドメッシュを合成する。
3Dハンドメッシュ再構築において,最先端の精度,堅牢性,現実性を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:49:31 GMT)
SHIRE: Enhancing Sample Efficiency using Human Intuition in REinforcement Learning [11.3] 確率的図形モデル(PGM)を用いた人間の直観を符号化するフレームワークShireを提案する。
ShiREは、評価対象環境の25~78%のサンプル効率を、無視可能なオーバーヘッドコストで達成します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:04:38 GMT)
ClimateGS: Real-Time Climate Simulation with 3D Gaussian Style Transfer [11.2] ClimateGSは3Dガウス表現と物理シミュレーションを統合した新しいフレームワークで、リアルタイムな気候効果のレンダリングを可能にする。
我々は、MipNeRF360とTurps and TemplesのClimateGSを評価し、SOTA 2D/3D法と同等または優れた視覚的品質のリアルタイムレンダリングを実演した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:01:35 GMT)
CAM-Seg: A Continuous-valued Embedding Approach for Semantic Image Generation [11.2] 量子化埋め込みを用いたセグメンテーションマスクのオートエンコーダ精度は連続数値埋め込みよりも8%低い。
セマンティックセグメンテーションのための連続評価組込みフレームワークを提案する。
提案手法では,細粒度のセマンティックな詳細を保存しながら,離散的な潜在表現の必要性を排除している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:06:54 GMT)
Automating Comment Generation for Smart Contract from Bytecode [11.1] 実際には、コンポーネントにブロックチェーンにデプロイされるスマートコントラクトのわずか13%がソースコードに関連付けられている。
本稿では,スマートコントラクトバイトコードを自動的に自然言語記述に翻訳するSmartBT(Smart Contract Bytecode Translator)を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:45:40 GMT)
MMAIF: Multi-task and Multi-degradation All-in-One for Image Fusion with Language Guidance [11.0] 本稿では,マルチタスク,マルチデグラデーション,言語誘導画像融合のための統一的なフレームワークを提案する。
本フレームワークは,1)実世界の画像劣化をシミュレートし,モデルを誘導するインタラクティブなプロンプトを生成する実用的な劣化パイプライン,2)遅延空間で動作するオールインワントランスフォーマー(DiT)と,劣化した入力と生成されたプロンプトの両方に条件付きクリーンなイメージを融合させる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:20:02 GMT)
Quantum Internet: Technologies, Protocols, and Research Challenges [11.0] 量子インターネットの複雑さをナビゲートするガイド。
その重要性、コアコンポーネント、運用メカニズム、生存性に関する予測タイムライン、主要なコントリビュータ、大きな課題、今後の方向性について説明する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:30:15 GMT)
ECLAIR: Enhanced Clarification for Interactive Responses in an Enterprise AI Assistant [11.0] ECLAIR (Enhanced CLArification for Interactive Responses) は対話的曖昧化のための多エージェントフレームワークである。
ECLAIRは、カスタムエージェントが定義された対話的なプロセス、エージェントによるあいまいさ推論の実行、明確化質問の生成、最終応答の洗練にユーザフィードバックを活用することで、あいまいなユーザクエリの明確化を促進する。
実世界の顧客データでテストすると、ECLAIRは標準的な数ショット法と比較して、明確化質問生成の大幅な改善を示している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:13:34 GMT)
ECLAIR: Enhanced Clarification for Interactive Responses [11.0] ECLAIRは、あいまいなユーザクエリの明確化質問を生成し、ユーザの応答に基づいてあいまいさを解決する。
本稿では,複数の下流エージェントからのあいまいさ情報を統合可能な一般化アーキテクチャを提案する。
ECLAIRと数発のプロンプト技術との比較実験を行い、質問生成とあいまいさ解決におけるECLAIRの優れた性能を実証した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:04:00 GMT)
PAPI-Reg: Patch-to-Pixel Solution for Efficient Cross-Modal Registration between LiDAR Point Cloud and Camera Image [10.9] クロスモーダルデータ融合は、異なるセンサーからのデータの正確なアライメントを含む。
カメラ画像とのマッチングのために,点雲を複数の2次元表現に投影するフレームワークを提案する。
画像マッチングタスクにおいて, クロスモーダル差とLiDAR点雲と画像との重複の制限に対処するために, マルチスケールの特徴抽出ネットワークを導入する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:04:01 GMT)
Think Like Human Developers: Harnessing Community Knowledge for Structured Code Reasoning [10.7] 大きな言語モデル(LLM)は、かなり高度な自動コード生成を持っているが、論理的推論を必要とする複雑なコーディングタスクに苦労している。
既存のアプローチは、計算コストの高い強化学習(RL)か、LLMによって合成されたエラーを起こしやすい推論チェーンに依存している。
我々は、ソフトウェアエンジニアリングプラットフォームに関するコミュニティ主導の議論から推論チェーンをマイニングし、再構成し、強化する新しいフレームワークであるSVRCを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:45:13 GMT)
Poly-FEVER: A Multilingual Fact Verification Benchmark for Hallucination Detection in Large Language Models [10.7] 生成AIにおける幻覚、特にLarge Language Models(LLMs)は、多言語アプリケーションの信頼性に重大な課題をもたらす。
幻覚検出のための既存のベンチマークは、主に英語といくつかの広く話されている言語に焦点を当てている。
大規模多言語事実検証ベンチマークであるPoly-FEVERを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:46:09 GMT)
Continual Gesture Learning without Data via Synthetic Feature Sampling [10.6] DFCILは、古いクラスのトレーニングデータが利用できない場合でも、古いクラスの知識を再トレーニングしながら、モデルが新しいクラスを継続的に学習できるようにすることを目的としている。
SFR(Synthetic Feature Replay)を開発した。これは,クラスプロトタイプから合成特徴をサンプリングし,古いクラスを再生し,新しいクラスを増強するものだ。
提案手法は,全ステップにわたる平均精度で最大15%の精度向上を実現し,最先端技術に対する大幅な進歩を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:54:43 GMT)
Enriching Automatic Test Case Generation by Extracting Relevant Test Inputs from Bug Reports [10.6] BRMinerは,バグレポートから関連するインプットを抽出する従来の手法と組み合わせて,LLM(Large Language Models)を利用した新しいアプローチである。
本研究では,Defects4JベンチマークとEvoSuiteやRandoopといったテスト生成ツールを用いたBRMinerの評価を行った。
その結果、BRMinerは60.03%の関連入力レート(RIR)と31.71%の関連入力抽出精度(RIEAR)を達成した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:06:00 GMT)
Developer Perspectives on Licensing and Copyright Issues Arising from Generative AI for Software Development [10.5] コーディングのためのGenAIのライセンスと著作権に関する574人の開発者を対象に調査を行った。
我々の結果は、開発者がGenAIから得られるメリット、AI生成コードの使用を、他の既存のコードとよく似たものとみなす方法を示している。
私たちは、技術がどのように使われているのか、ステークホルダーが解決したいことについて、貴重な洞察を提供しています。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:50:30 GMT)
PSF-4D: A Progressive Sampling Framework for View Consistent 4D Editing [10.3] 4次元編集のためのプログレッシブサンプリングフレームワーク(PSF-4D)を提案する。
時間的コヒーレンスのために、時間とともにフレームをリンクする相関したガウス雑音構造を設計する。
ビュー間の空間的整合性を実現するために、クロスビューノイズモデルを実装している。
提案手法は,外部モデルに頼らずに高品質な4D編集を可能にする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:37:26 GMT)
EdgeRegNet: Edge Feature-based Multimodal Registration Network between Images and LiDAR Point Clouds [10.3] クロスモーダルなデータ登録は、長い間コンピュータビジョンにおいて重要な課題だった。
本稿では,原点雲と画像からのエッジ情報を用いたクロスモーダル登録手法を提案する。
提案手法をKITTIおよびnuScenesデータセット上で検証し,その最先端性能を実証した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:03:41 GMT)
SemanticFlow: A Self-Supervised Framework for Joint Scene Flow Prediction and Instance Segmentation in Dynamic Environments [10.3] 本稿では,全時間点雲のシーンフローとインスタンスセグメンテーションを同時に予測するマルチタスクフレームワークを提案する。
1)静的な背景と動的オブジェクトの最初の粗いセグメンテーションを用いて、共有特徴処理モジュールを介して動きと意味情報を精製するためのコンテキスト情報を提供するマルチタスクスキームの開発,2)シーンフロー推定とインスタンスセグメンテーションの性能を高めるための損失関数セットの開発,そして,交通シーン内の静的および動的オブジェクトの空間的および時間的一貫性を確保することを支援すること,3)粗い学習スキームの開発。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:43:19 GMT)
Taming Flow Matching with Unbalanced Optimal Transport into Fast Pansharpening [10.2] 本稿では,一段階の高品位パンシャーピングを実現するための最適輸送フローマッチングフレームワークを提案する。
OTFMフレームワークは、パンシャーピング制約の厳格な遵守を維持しつつ、シミュレーション不要なトレーニングとシングルステップ推論を可能にする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:10:49 GMT)
When LLMs Meet API Documentation: Can Retrieval Augmentation Aid Code Generation Just as It Helps Developers? [10.2] Retrieval-augmented Generation (RAG) は、学習前の知識を超えて、大規模言語モデルの能力(LLM)を拡大する能力を示している。
検索と生成のための新たな知識として,あまり一般的でないAPIライブラリのドキュメンテーションを使用することの有効性に影響を与える要因について検討する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:08:47 GMT)
FiVL: A Framework for Improved Vision-Language Alignment through the Lens of Training, Evaluation and Explainability [10.2] 本稿では,LVLMを学習するための新しいデータセット構築手法であるFiVLを紹介する。
本稿では,モデルがイメージを実体的証拠として用いる能力を評価するためのベンチマークを示す。
視覚による幻覚を説明できる最強の視覚言語アライメントで注目頭を特定する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:04:30 GMT)
World Models in Artificial Intelligence: Sensing, Learning, and Reasoning Like a Child [10.2] 世界モデルは人工知能(AI)が成果を予測し、その環境を判断し、意思決定を導くのに役立つ。
我々は6つの重要な研究分野、物理情報学習、ニューロシンボリックラーニング、継続学習、因果推論、ヒューマン・イン・ザ・ループAI、そして責任あるAIを、AIの真理化を可能にする上で不可欠なものとして強調する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:50:40 GMT)
The Wisdom of a Crowd of Brains: A Universal Brain Encoder [10.1] 我々は,様々な主題/データセット/マシンのデータに基づいて,共同で学習できるユニバーサル脳エンコーダを提案する。
各画像における各脳軸の反応を予測するための訓練は,脳軸の埋め込みと多段階の深部画像特徴の相互注意を直接計算することで行う。
このボクセル中心のアーキテクチャにより、各脳のボクセルの機能的役割は、自然にボクセル・イメージのクロスアテンションから生じる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:24:48 GMT)
RAG-based User Profiling for Precision Planning in Mixed-precision Over-the-Air Federated Learning [10.0] AIで広く応用されている混合精度コンピューティングは、精度と効率のトレードオフスペースを広く提供する。
MP-OTA-FLは、クライアントが不均一なハードウェアに基づいて適切な精度で動作できるようにする。
本稿では,検索拡張LLMと動的クライアントプロファイリングを統合したRAGベースの高精度計画フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:26:11 GMT)
Quantum advantage in zero-error function computation with side information [10.0] 本稿では,サイド情報を用いたゼロエラー関数計算の問題点について考察する。
Alice and Bob has correlation source $X,Y$ with joint p.m.f. $p_XY(cdot, cdot)$. Bob want to compute $f(X,Y)$ with zero error。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:16:54 GMT)
Efficient Optimization Algorithms for Linear Adversarial Training [9.9] 逆行訓練は摂動に対して堅牢なモデルを学ぶのに使える。
本稿では,線形モデルの対数学習のための最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:55:53 GMT)
Efficient Personalization of Quantized Diffusion Model without Backpropagation [9.9] 拡散モデルは、訓練、微調整、推論のために広範囲な計算とメモリ資源を必要とする。
テキスト・インバージョンによるパーソナライズによる拡散モデルの定量化により,この問題に対処する。
本手法は,前向きパスのみによる安定拡散をパーソナライズするための画像およびテキストアライメントスコアにおける先行手法と同等の性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:45:37 GMT)
DRoPE: Directional Rotary Position Embedding for Efficient Agent Interaction Modeling [9.9] Directional Rotary Position Embedding (DRoPE) は、もともと自然言語処理で開発されたRotary Position Embedding (RoPE) の新規な適応である。
DRoPEは、RoPEの2次元回転変換に均一なIDスカラーを導入することで制限を克服する。
実験的な評価により、DRoPEの性能は良好であり、空間の複雑さは著しく低下した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:23:09 GMT)
The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition [9.9] 350以上のカメラで記録された20時間の野生チンパンジーの挙動を特徴とするPanAf-FGBGデータセットを提示する。
ユニークなのは、すべてのビデオとチンパンジー(前景ビデオ)を、同じカメラの場所から対応するバックグラウンドビデオ(チンパンジーなし)とをペアリングすることです。
この設定により、初めて、分布内および分布外条件を直接評価し、振る舞い認識モデルに対する背景の影響を定量化することができる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:11:51 GMT)
From Isolated Conversations to Hierarchical Schemas: Dynamic Tree Memory Representation for LLMs [9.8] 動的木構造メモリ表現を活用するアルゴリズムであるMemTreeを導入し、情報の組織化、検索、統合を最適化する。
我々のアルゴリズムは、新しい情報や既存の情報のセマンティック埋め込みを比較して、このメモリ構造を動的に適応させ、モデルのコンテキスト認識を強化する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:18:02 GMT)
GReaTER: Generate Realistic Tabular data after data Enhancement and Reduction [9.8] 本稿では,現実的なタブラリデータを生成するためのGReaTERを提案する。
GReaTERは、データセマンティックエンハンスメントシステムとクロステーブル接続方法を含む。
GReaTERはGReaTフレームワークより優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:16:05 GMT)
Multi-Modal Gesture Recognition from Video and Surgical Tool Pose Information via Motion Invariants [9.8] 外科的ジェスチャーをリアルタイムで認識することは、自動化された活動認識、スキルアセスメント、術中援助、そして最終的には外科的自動化への一歩である。
マルチモーダルニューラルネットワークにおける最近の研究では、視覚とキネマティクスのデータの関係が学習されているが、現在のアプローチでは、キネマティクス情報を独立した信号として扱うことができ、ツールチップのポーズには基礎的な関係はない。
JIGSAWSサチューリングデータセットにおいて、不変信号とツール位置を組み合わせることにより、ジェスチャー認識が90.3%の精度で向上することを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:02:58 GMT)
Reward Training Wheels: Adaptive Auxiliary Rewards for Robotics Reinforcement Learning [9.8] 本稿では,ロボット工学RLの補助報酬適応を自動化する教師学生用フレームワークであるReward Training Wheels(RTW)を紹介する。
シミュレーションでは、RTWは専門家が設計した報酬を2.35%のナビゲーション成功率で上回り、オフロードモビリティのパフォーマンスを122.62%向上させる。
物理ロボット実験はRTWの有効性をさらに検証し、完全な成功率(専門家が設計した報酬に対して5/5の試験と2/5の試験)を達成し、車体安定性を47.4%まで向上させた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:45:59 GMT)
FedBEns: One-Shot Federated Learning based on Bayesian Ensemble [9.7] One-Shot Federated Learning (FL)は、複数のクライアントが中央サーバとの1ラウンドの通信でグローバルモデルを協調的に学習することを可能にする、最近のパラダイムである。
我々は,局所的損失関数の固有多モード性を利用して,より優れたグローバルモデルを求めるアルゴリズムであるFedBEnsを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:05:52 GMT)
Graph-Weighted Contrastive Learning for Semi-Supervised Hyperspectral Image Classification [9.6] 本稿では,超画素分割を回避し,ニューラルネットワークを用いてハイパースペクトル画像表現を学習するグラフ重み付きコントラスト学習手法を提案する。
提案手法は,ノードのサブセットのみを一度に処理することで,計算複雑性を低減し,未確認ノードへの一般化を改善することによるミニバッチトレーニングを支援する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:55:52 GMT)
Curiosity-Diffuser: Curiosity Guide Diffusion Models for Reliability [9.4] ニューラルネットワークに基づく模倣ポリシーは幻覚を発生させ、現実世界のアプリケーションの安全性に影響を与える不正確な行動を引き起こす可能性がある。
本稿では,条件拡散モデルの導出を目的としたCuriosity-Diffuserを提案する。
Curiosity-Diffuserはタスクのパフォーマンスを大幅に改善し、トレーニングデータに近い振る舞いを生成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:25:36 GMT)
Learning on One Mode: Addressing Multi-modality in Offline Reinforcement Learning [9.4] オフライン強化学習は、環境と対話することなく、静的データセットから最適なポリシーを学習しようとする。
既存の方法は、しばしば一助的行動ポリシーを仮定し、この仮定が破られたとき、最適以下のパフォーマンスをもたらす。
本稿では,行動方針の単一かつ有望なモードから学習することに焦点を当てた新しいアプローチである,1モードでの模倣学習(LOM)を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:48:52 GMT)
Deep Contrastive Unlearning for Language Models [9.4] 本稿では,Deep-Tuning(DeepCUT)言語モデルのためのDeep Contrastive Unlearningという機械学習フレームワークを提案する。
提案モデルでは,モデルの潜在空間を直接最適化することにより,機械学習を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:58:45 GMT)
Advancing Deep Learning through Probability Engineering: A Pragmatic Paradigm for Modern AI [9.1] 本稿では,Deep Learningにおける確率分布を工学的アーティファクトとして扱う新しい概念であるProbability Engineeringを提案する。
既存の確率分布を洗練させ、その堅牢性、効率性、適応性、信頼性を向上させる新しい手法と制約を導入する。
ケーススタディは、大規模でデータ集約的で信頼性の高いAIシステムの多様性と進化する要件を満たすために、かつて静的オブジェクトとして扱われた確率分布をどのように設計するかを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:48:23 GMT)
FedLWS: Federated Learning with Adaptive Layer-wise Weight Shrinking [9.1] フェデレートラーニング(FL)では,新たなグローバルモデルを生成するために,局所モデルの重み付けアグリゲーションを行う。
我々は,適応層ワイトシンキング(FedLWS)を用いた新しいモデル集約戦略,フェデレートラーニングを提案する。
FedLWSは、レイヤワイズで縮小係数を適応的に設計し、プロキシデータセット上の縮小係数の最適化を避ける。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:10:28 GMT)
VenusFactory: A Unified Platform for Protein Engineering Data Retrieval and Language Model Fine-Tuning [9.0] VenusFactoryは生物データ検索、標準化されたタスクベンチマーク、PLMのモジュール化された微調整を統合した汎用エンジンである。
VenusFactoryは、コマンドライン実行とGradioベースのノーコードインターフェースの両方を選択することで、コンピュータ科学と生物学のコミュニティの両方をサポートする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:19:07 GMT)
Federated Continual 3D Segmentation With Single-round Communication [9.0] フェデレートラーニングは、ローカルデータのプライバシーを維持しながら、分散クライアント間のコラボレーションを促進することを目指している。
このような動的フェデレートされた分析設定では、従来のフェデレートされた通信ラウンドごとのモデルアグリゲーションの通信戦略が最適以下である。
本稿では,マルチモデル蒸留を通じてサーバに1回モデルアグリゲーションを適用した連立連続学習戦略を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:56:34 GMT)
HotSpot: Signed Distance Function Optimization with an Asymptotically Sufficient Condition [8.9] 本稿では,ニューラルサイン付き距離関数を最適化するためのHotSpotを提案する。
エーコナルロスのような既存の損失は、必要だが不十分な制約として振る舞う。
提案手法はより優れた表面再構成とより正確な距離近似を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:10:27 GMT)
Global Group Fairness in Federated Learning via Function Tracking [8.9] 最大平均離散性(MMD)に基づくグローバルフェアネス正規化器の関数追跡方式を提案する。
このスキームは、厳密な収束保証を維持しながら、ほとんどのフェデレーション付き学習アルゴリズムにシームレスに統合される。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:42:37 GMT)
Hard constraint learning approaches with trainable influence functions for evolutionary equations [8.8] 本稿では進化方程式を解くための新しい深層学習手法を開発する。
逐次学習戦略は、大きな時間領域を複数のサブインターバルに分割し、時系列順に1つずつ解決する。
改良されたハード制約戦略は、時間間隔ノードにおけるPINNソリューションの連続性と滑らかさを厳密に保証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:03:59 GMT)
Guardians of Generation: Dynamic Inference-Time Copyright Shielding with Adaptive Guidance for AI Image Generation [8.8] 現代のテキスト画像生成モデルは、トレーニングデータに記憶された著作権のあるコンテンツを不注意に再現することができる。
本稿では,AI画像生成における動的著作権保護のためのモデル非依存推論時間フレームワークであるGuardians of Generationを紹介する。
本手法は, 安定拡散, SDXL, Flux など, 様々な生成モデルを用いて検証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:31:12 GMT)
Paint by Inpaint: Learning to Add Image Objects by Removing Them First [8.4] 我々は、画像にオブジェクトを効果的に付加して、塗布過程を逆転させる拡散モデルを訓練する。
その結果,トレーニングされたモデルは,オブジェクトの追加タスクと一般的な編集タスクの両方において,既存のモデルを上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:48:18 GMT)
Pruning-Based TinyML Optimization of Machine Learning Models for Anomaly Detection in Electric Vehicle Charging Infrastructure [8.3] 本稿では,EVCIを対象とする資源制約環境における異常検出のためのプルーニング手法について検討する。
最適化されたモデルは、モデルのサイズと推論時間の大幅な削減を実現しました。
特に,EVCIでは,プルーニングとFSが重要な異常検出能力を保ちながら,計算効率を向上させることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:18:37 GMT)
SoliDiffy: AST Differencing for Solidity Smart Contracts [8.2] ASTベースのソースコードの相違により、脆弱性検出や自動修復といったタスクが可能になる。
SoliDiffyは、Solidityスマートコントラクトのための最初のAST差分ツールであり、編集スクリプトを生成することができる。
353,262の契約ペアの評価において、SoliDiffyは96.1%の差分成功率を達成し、最先端を越え、編集スクリプトを著しく短縮した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:54:07 GMT)
The Impact of Input Order Bias on Large Language Models for Software Fault Localization [8.2] 大規模言語モデル(LLM)は、ソフトウェア工学のタスクにおいて大きな可能性を示しています。
本研究では,入力順序と文脈サイズがLLM性能に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:08:36 GMT)
A Multi-Agent Approach to Fault Localization via Graph-Based Retrieval and Reflexion [8.2] 従来のフォールトローカライゼーション技術は、広範なトレーニングデータセットと高い計算資源を必要とする。
大規模言語モデル(LLM)の最近の進歩は、コード理解と推論を強化することで、新たな機会を提供する。
LLM4FLは3つの特殊なLLMエージェントを利用するマルチエージェントの故障局所化フレームワークである。
14のJavaプロジェクトから675の障害を含むDefects4Jベンチマークで評価され、LLM4FLはAutoFLよりも18.55%、SoapFLより4.82%、Top-1の精度が18.55%向上した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:22:52 GMT)
Formalizing Complex Mathematical Statements with LLMs: A Study on Mathematical Definitions [8.1] 我々は、ウィキペディア(Def_Wiki)とarXiv論文(Def_ArXiv)から定義を収集する、自動形式化のための2つの新しいリソースを紹介する。
我々は、Isabelle/HOLに定義を形式化する能力を解析し、LLMの範囲を評価した。
以上の結果から, miniF2Fのような既存のベンチマークと比較して, 定義がより困難であることが判明した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:53:49 GMT)
OFL: Opportunistic Federated Learning for Resource-Heterogeneous and Privacy-Aware Devices [8.0] Opportunistic Federated Learning (OFL)は、リソースヘテロジニアスでプライバシを意識したFLデバイス用に明示的に設計された新しいFLフレームワークである。
OFLは、差分的にプライベートでオポチュニティなモデル更新機構を導入することで、強力なセキュリティを提供する。
OFLはモデル性能を満足し、効率とセキュリティを改善し、既存のソリューションより優れている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:12:47 GMT)
Leveraging Perfect Multimodal Alignment and Gaussian Assumptions for Cross-modal Transfer [8.0] 一定の条件下で完全なアライメントが達成可能であることを示す。
次に、クロスモーダル転送と呼ばれるアライメントの特定の応用に対処する。
表現空間から各モダリティを表す異なる部分空間にデータポイントを投影することにより、クロスモーダル転送がどのように実行できるかを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:51:17 GMT)
Approximate Computing Survey, Part II: Application-Specific & Architectural Approximation Techniques and Applications [7.9] 近似コンピューティングは、エネルギー効率と/または性能を改善するために、システムの設計における結果の質を調整できる。
この急進的なパラダイムシフトは、学界と産業の両方から関心を集めている。
重要な側面(例えば、用語と応用)をカバーし、最先端の近似技術についてレビューする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:02:42 GMT)
Kolmogorov-Arnold Network for Transistor Compact Modeling [7.9] NNベースのトランジスタ・コンパクト・モデリングはデバイス・モデリングとSPICE回路シミュレーションの高速化のための変換ソリューションとして登場した。
この研究は、物理学に基づく関数モデリングにおいて高い精度で解釈可能性とシームレスに統合する、画期的なNNアーキテクチャを初めて導入する。
以上の結果から,カナとフカンはゲート電流ドレイン電荷,ソース電荷などの臨界値に対して,常に優れた予測精度を達成できることが判明した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:49:50 GMT)
UntrustVul: An Automated Approach for Identifying Untrustworthy Alerts in Vulnerability Detection Models [7.8] 信頼できない脆弱性の予測を自動で検出するUntrustVulを提案する。
F1スコア82%-94%の信頼できない予測を効果的に検出し、F1スコアで最大321%、信頼性で100%まで脆弱性を検出するモデルの能力を向上させる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:18:45 GMT)
Adaptive Pruning with Module Robustness Sensitivity: Balancing Compression and Robustness [7.7] 本稿では, 対向摂動に対する層次感度を定量化する新しい計量法であるModule Robustness Sensitivity (MRS)を紹介する。
本稿では,任意の対向学習法に適合する適応型プルーニングアルゴリズムであるModule Robust Pruning and Fine-Tuning (MRPF)を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:00:48 GMT)
Deep Polycuboid Fitting for Compact 3D Representation of Indoor Scenes [7.7] 本稿では, 深層学習方式を用いて, ポリクボイドを用いて3次元屋内シーンをコンパクトに表現するための新しい枠組みを提案する。
我々のフレームワークは、Replica、ScanNet、iPhoneで撮影されたシーンなど、現実世界の屋内シーンのデータセットによく当てはまる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:33:28 GMT)
Semi-Gradient SARSA Routing with Theoretical Guarantee on Traffic Stability and Weight Convergence [7.6] そこで本研究では,近似的最適ルーティングポリシーを学習する半漸進的オン・ポリシーアルゴリズムを提案する。
シミュレーションにより、我々のアルゴリズムはニューラルネットワークベースの手法よりもはるかに高速に収束できることを実証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:27:12 GMT)
Online federated learning framework for classification [7.6] 分類のための新しいオンライン・フェデレーション・ラーニング・フレームワークを開発した。
データのプライバシと計算効率を確保しながら、複数のクライアントからのストリーミングデータを処理します。
提案手法は,従来の手法に比べて高い分類精度,計算効率の向上,データストレージ要求の大幅な削減を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:50:19 GMT)
LLM Reasoning Engine: Specialized Training for Enhanced Mathematical Reasoning [7.5] 数学的推論タスクにおける大規模言語モデルの能力を高めるための新しい手法を提案する。
このギャップを埋める必要性に感銘を受け、私たちのアプローチには質問パラフレーズ戦略が組み込まれています。
モデルの学習プロセスを導くために 専門的な訓練目的が 使われています。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:56:49 GMT)
Statistical features of quantum chaos using the Krylov operator complexity [7.3] クリロフ空間を生成するランダム初期作用素のアンサンブル上でのランツォス係数の統計的性質について検討する。
複雑性を特徴づける上で重要な2つの統計量を提案する。
結果として得られる統計は、それぞれウィッシュアート分布と(再スケール)カイ二乗分布である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:25:25 GMT)
Entity-aware Cross-lingual Claim Detection for Automated Fact-checking [7.2] textitEX-Claimは、エンティティ対応の言語間クレーム検出モデルであり、任意の言語で書かれたクレームを扱うためによく一般化される。
提案手法は,27言語にまたがるベースラインを著しく上回り,限られた学習データであっても,最も高い知識伝達率を達成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:00:55 GMT)
Scalable Co-Clustering for Large-Scale Data through Dynamic Partitioning and Hierarchical Merging [7.1] クラスタの行と列を同時にクラスタリングすることで、よりきめ細かいグループを明らかにします。
既存のクラスタリング手法はスケーラビリティが悪く、大規模なデータを扱うことができない。
本稿では,高次元大規模データセットにおける複雑なパターンを明らかにするために,新しい,スケーラブルなコクラスタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:36:56 GMT)
Model Risk Management for Generative AI In Financial Institutions [7.0] 2023年のOpenAIのChatGPTの成功により、金融企業はジェネレーティブAIアプリケーションを探求するようになった。
本稿では,生成型AIモデルのモデルリスク管理における重要な側面について概説する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:52:29 GMT)
Fine-Grained Open-Vocabulary Object Detection with Fined-Grained Prompts: Task, Dataset and Benchmark [6.9] 3F-OVDは、教師付ききめ細かい物体検出をオープン語彙設定に拡張する新しいタスクである。
両方の設定で、データセット上で最先端のオブジェクト検出器をベンチマークします。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:41:46 GMT)
A sharp uniform-in-time error estimate for Stochastic Gradient Langevin Dynamics [6.9] グラディエント・ランゲヴィン・ダイナミクス (SGLD) サンプリングアルゴリズムに対して, 急激な一様誤差推定を行う。
本研究の結果は,関連文献における既存のSGLD分析と比較して,有意な改善とみなすことができる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:14:41 GMT)
Graph Neural Networks for the Offline Nanosatellite Task Scheduling Problem [6.9] 本研究では,グラフニューラルネットワーク(GNN)を用いて,ナノサテライトタスクをより効率的にスケジュールする方法を検討する。
目標は、QoS(Quality-of-Service)を考慮して、軌道上で実行するタスクの最適なスケジュールを見つけることである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:40:40 GMT)
MultiPlaneNeRF: Neural Radiance Field with Non-Trainable Representation [6.9] NeRFは2D画像から3Dオブジェクトを効率的に表現する人気モデルである。
上記の問題を同時に解くモデルとして,MultiPlaneNeRFを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:40:18 GMT)
An Adaptive Testing Approach Based on Field Data [6.8] 本稿では,身体センサネットワーク(BSN)のテストに適したSATF(Self-Adaptive Testing in the Field)戦略であるAdapTAを紹介する。
AdapTAは、現場から収集された実世界データを使用して、社内実験で患者の振る舞いをシミュレートする、前バイブなアプローチを採用している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:12:55 GMT)
Statistical ranking with dynamic covariates [6.7] 本稿では,Plackett--Luceフレームワーク内での一般統計ランキングモデルを提案する。
我々は,最大極大推定(MLE)を計算するための効率的な交互アルゴリズムを開発した。
競馬やテニス競技を含む実世界のデータセットへのモデルの適用を実証するために,数値的研究を行った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:47:32 GMT)
MERGE: Multi-faceted Hierarchical Graph-based GNN for Gene Expression Prediction from Whole Slide Histopathology Images [6.7] MERGE(Multifaceted hiErarchical gRaph for Gene Expressions)を導入し、階層グラフ構築戦略とグラフニューラルネットワーク(GNN)を組み合わせて、スライド画像全体の遺伝子発現予測を改善する。
組織像パッチを空間的特徴と形態的特徴の両方に基づいてクラスタリングすることにより,GNN学習における遠隔組織間の相互作用を促進する。
さらに,STデータ中のアーティファクトを緩和するために必要な異なるデータ平滑化技術の評価を行った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:02:43 GMT)
A Novel Channel Boosted Residual CNN-Transformer with Regional-Boundary Learning for Breast Cancer Detection [6.6] 本研究では, CB-Res-RBCMTという新しいハイブリッドフレームワークを導入する。
提案したRBCMTは,CNN Meet Transformer (CMT) ブロックとステム畳み込みブロックを用いており,その後に新たなRegional and boundary (RB) 特徴抽出操作を行う。
提案されたCB-Res-RBCMTは、95.57%のF1スコア、95.63%の精度、96.42%の感度、標準ハーモナイズドストリジェントBUSIデータセットの94.79%の精度を達成した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:59:02 GMT)
MUSE-VL: Modeling Unified VLM through Semantic Discrete Encoding [6.5] 本稿では,MUSE-VL(Unified Vision-Language Model Semantic)を紹介する。
提案手法は,従来のSOTA Emu3に比べて4.8%向上し,LLaVA-NeXT 34Bを3.7%上回った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:11:06 GMT)
Gaussian Random Fields as an Abstract Representation of Patient Metadata for Multimodal Medical Image Segmentation [6.5] 慢性的な傷は、患者にとって壊滅的な結果をもたらす可能性がある。
このような傷の発見とモニタリングのための深層学習法は、患者と臨床医の両方への影響を減らす可能性がある。
本稿では、患者メタデータをトレーニングワークフローに導入できる新しいマルチモーダルセグメンテーション手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:54:47 GMT)
Towards Fully-Automated Materials Discovery via Large-Scale Synthesis Dataset and Expert-Level LLM-as-a-Judge [6.5] 本研究は,実践的でデータ駆動型資源を提供することで,材料科学コミュニティを支援することを目的としている。
オープンアクセス文献から17Kのエキスパートが検証した合成レシピの包括的データセットを収集した。
AlchemicalBenchは、合成予測に適用された大規模言語モデルの研究をサポートするエンドツーエンドフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:37:27 GMT)
Preference Construction: A Bayesian Interactive Preference Elicitation Framework Based on Monte Carlo Tree Search [6.5] 限定的な相互作用ラウンドにおいて、受講者の選好を効率的に捉えるための新しい選好学習フレームワークを提案する。
まず、参加者の嗜好モデルを予測するための変分ベイズ的アプローチを開発する。
第2に,累積不確実性低減を最大化する適応的問合せ政策を提案する。
第3に、このフレームワークを優先情報としてペア比較を行い、多重基準決定支援に適用する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:16:54 GMT)
Neural Lyapunov Function Approximation with Self-Supervised Reinforcement Learning [6.4] 本稿では,非線形リアプノフ関数のニューラル近似のための新しい,サンプル効率のよい手法を提案する。
提案手法では,データ駆動型ワールドモデルを用いて,都市外軌道からリャプノフ関数を訓練する。
本手法は, 目標条件と目標条件の両方のロボット作業において, より高速な収束と高い近似精度を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:29:25 GMT)
Understanding and Predicting Derailment in Toxic Conversations on GitHub [6.3] この研究は、GitHubの有害性につながる会話の脱線を理解し予測することを目的としている。
このデータセットに基づいて,有害な会話や脱線点の特徴を識別する。
本研究では,エスカレーション前に潜在的に有害な会話を自動的に検出し,対処するための能動的モデレーション手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:54:16 GMT)
Generalized many-body perturbation theory for the electron correlation energy: multi-reference random phase approximation via diagrammatic resummation [6.3] グリーン関数とファインマン図に基づく多体摂動理論(MBPT)は、初期計算のアプローチを強調するための基本的な理論的枠組みを提供する。
しかし、摂動拡大はしばしば強いマルチ参照文字を持つシステムで失敗する。
我々は,強い相関系の相関エネルギーを計算するためのMBPTのダイアグラム的マルチ参照を開発する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:37:13 GMT)
Med-R1: Reinforcement Learning for Generalizable Medical Reasoning in Vision-Language Models [6.2] 視覚言語モデル(VLM)は、自然の場面で高度な推論を行うが、医療画像におけるその役割は未解明のままである。
医用推論におけるVLMの一般化性と信頼性を高めるための強化学習を探求するフレームワークであるMed-R1を紹介する。
Med-R1は、CT, MRI, Ultrasound, Dermoscopy, Fundus Photography, Optical Coherence Tomography, Microscopy, X-ray Imagingの8つの画像モダリティで評価されている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:58:55 GMT)
Behaviour Discovery and Attribution for Explainable Reinforcement Learning [6.1] オフラインRL軌道における行動発見と行動帰属の枠組みを提案する。
本手法は, 意味のある行動セグメントを同定し, より精密で詳細な説明を可能にする。
このアプローチは、最小限の変更で、多様な環境に適応できます。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:06:00 GMT)
Spiking World Model with Multi-Compartment Neurons for Model-based Reinforcement Learning [6.0] 脳にインスパイアされたスパイクニューラルネットワーク(SNN)は、アルゴリズムの設計と知覚の応用において大きな研究の注目を集めている。
しかし、意思決定領域におけるその可能性、特にモデルに基づく強化学習については、未解明のままである。
本稿では,複数の樹状体源からの情報を非線形に積分し,長い逐次入力を動的に処理できるマルチコンパートメントニューロンモデルを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:47:14 GMT)
3D Engine-ready Photorealistic Avatars via Dynamic Textures [6.0] 本稿では,標準的な3Dアセットを用いて,明示的に表現された3Dアバターを構築するエンド・ツー・エンドパイプラインを提案する。
私たちのキーとなるアイデアは、動的に生成されるテクスチャを使用して現実性を高め、基盤となるメッシュ幾何学における欠陥を視覚的に隠蔽することです。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:19:50 GMT)
Performance-bounded Online Ensemble Learning Method Based on Multi-armed bandits and Its Applications in Real-time Safety Assessment [6.0] 本稿では,PB-OEL という名前のマルチアームバンディットに基づくパフォーマンスバウンドオンラインアンサンブル学習手法を提案する。
提案手法は既存の最先端手法よりも優れている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:57:53 GMT)
On the Robustness Tradeoff in Fine-Tuning [6.0] 6つのベンチマークデータセット上で、微調整されたモデルのロバスト性と精度を評価する。
我々は、敵の堅牢性と正確性の間に一貫したトレードオフを観察する。
これらの洞察は、信頼性の高い現実世界のデプロイメントを保証するために、ロバストネスを意識した微調整の必要性を強調している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:35:01 GMT)
MultiBARF: Integrating Imagery of Different Wavelength Regions by Using Neural Radiance Fields [5.9] 我々は,センサや画像処理に慣れていないユーザに対して,データ準備を容易にするMultiBARFを開発した。
センサ画像の2色チャネルをNeRF上に重畳する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:08:29 GMT)
Learning with Expert Abstractions for Efficient Multi-Task Continuous Control [5.8] 連続したマルチタスク環境における意思決定は、計画のための正確なモデルを得るのが困難であることや、試行錯誤から純粋に学習することの非効率さによって、しばしば妨げられる。
本稿では,これらの制約に対処する階層的強化学習手法を提案する。
手続き的に生成した一連の連続制御環境に対する実証評価により,本手法は,サンプル効率,タスク完了率,複雑なタスクへのスケーラビリティ,新しいシナリオへの一般化の観点から,既存の階層的強化学習手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:44:23 GMT)
Distilling 3D distinctive local descriptors for 6D pose estimation [5.8] 3次元局所記述子は幾何学的表面特性の符号化に不可欠である。
GeDiは強力なゼロショット6Dポーズ推定機能を示してきたが、現実のアプリケーションでは計算に実用的ではない。
本稿では,GeDi教師からローカル記述子を回帰するために,効率的な学生モデルを訓練する知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:04:37 GMT)
Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems [5.7] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚を緩和するための有望なフレームワークとして登場した。
本研究では,財務文書の検索を効率化する,効率的なエンドツーエンドRAGパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:21:49 GMT)
Undesirable Memorization in Large Language Models: A Survey [5.7] 記憶化とは、モデルがトレーニングデータからフレーズを保存して再生する傾向をいう。
本稿では, LLM記憶に関する文献を分類し, 粒度, 再現性, 望ましさの3次元にわたって探索する。
我々は、プライバシーとパフォーマンスのバランスをとる方法を含む、近い将来の潜在的研究トピックを特定することで、調査を締めくくっている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:50:38 GMT)
Simultaneous Decoding of Classical Coset Codes over $3-$User Quantum Interference Channel : New Achievable Rate Regions [5.6] 量子干渉チャネル(QIC)を用いた古典情報通信の問題点について検討する。
古典量子容量領域に3ドル(約3,300円)のQICを新たに導入する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:37:45 GMT)
Enhanced ECG Arrhythmia Detection Accuracy by Optimizing Divergence-Based Data Fusion [5.6] ケルネル密度推定(KDE)とクルバック・リーブラー(KL)の発散を利用した特徴量に基づく融合アルゴリズムを提案する。
健常者2000名, 病人2000名から収集した心電図による社内データセットを用いて, PTB-XLデータセットを用いて本手法の検証を行った。
その結果, 本手法は, 統合データセットにおける異常心電図症例の特徴に基づく分類精度を大幅に向上させることを示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:16:48 GMT)
Using machine learning to measure evidence of students' sensemaking in physics courses [5.5] 教育において、問題解決の正しさは、しばしば学生の学習と不適切に混同される。
本研究では,物理問題に対する解法を記述した説明書から,学生の身体感覚形成の証拠を定量化する手法を提案する。
我々は,ロジスティック回帰を用いた3つのユニークな言語エンコーダを実装し,2023年のタフツ大学の入門物理学講座の実際の学生385名について,デプロイ可能性の分析を行った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:49:21 GMT)
Low-Complexity Patch-based No-Reference Point Cloud Quality Metric exploiting Weighted Structure and Texture Features [5.4] PST-PCQAは、低複雑さ、学習ベースのフレームワークに基づく、ノンリファレンスポイントのクラウド品質メトリクスである。
個々のパッチを分析してポイントクラウドの品質を評価し、ローカル機能とグローバル機能を統合して平均オピニオンスコアを予測する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:52:04 GMT)
Edge AI for Real-time Fetal Assessment in Rural Guatemala [5.4] 周産期合併症は、世界中の母体と新生児の健康に重大な負担をもたらす。
我々は,介護現場での意思決定支援を目的とした,AI対応スマートフォンアプリケーションを開発した。
このツールは、機械学習(ML)技術を活用して妊娠中の健康モニタリングを強化することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:40:55 GMT)
A Guide to Misinformation Detection Data and Evaluation [5.3] 文献で最大の(ミス)情報データセットを収集し,75。
我々は,文やクレームからなる36のデータセットと,純粋に段落形式のデータからなる9つのデータセットの質を評価する。
このガイドは、高品質なデータとより良い基盤評価のためのロードマップを提供し、最終的には誤情報検出の研究を改善することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:52:27 GMT)
Evaluating ASR Confidence Scores for Automated Error Detection in User-Assisted Correction Interfaces [5.3] 本研究では、エンド・ツー・エンドのASRモデルの総合的な解析により、誤り検出のための信頼度スコアの信頼性を評価する。
その結果,信頼度スコアは転写精度と相関するが,誤り検出性能は限定的であることがわかった。
これらの知見は、信頼性スコアの限界と、ASR結果のユーザインタラクションと説明可能性を改善するためのより洗練されたアプローチの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:33:40 GMT)
LogLLaMA: Transformer-based log anomaly detection with LLaMA [5.3] 変圧器ベースの大規模言語モデル(LLM)は、ログ異常検出に人気がある。
本稿では,LLaMA2を利用した新しいフレームワークであるLogLLaMAを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:13:37 GMT)
SPILL: Domain-Adaptive Intent Clustering based on Selection and Pooling with Large Language Models [5.3] Selection and Pooling with Large Language Models (SPILL) は、微調整なしでインテントクラスタリングを行うための直感的でドメイン適応的な手法である。
私たちのゴールは、既存の埋め込みを、さらなる微調整なしに、新しいドメインデータセットにより一般化できるようにすることです。
提案手法は,より大規模なモデルを用いて微調整を必要とするモデルであっても,他の最先端の研究と同等の結果が得られる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:48:57 GMT)
BabyLM Challenge: Exploring the Effect of Variation Sets on Language Model Training Efficiency [5.1] 我々は、若干異なる単語や構造で類似した意図を表現する連続的な発話セットである、変分集合(VS)に焦点を当てる。
トレーニングデータ効率に対するVSの影響を評価するため、人工VSの比率が異なるCDSデータを拡張し、これらのデータセットを使用して自動回帰モデルであるGPT-2をトレーニングする。
BLiMPとGLUEスコアはVSの存在から恩恵を受けるが、EWOKスコアはそうではない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:51:54 GMT)
Global Renewables Watch: A Temporal Dataset of Solar and Wind Energy Derived from Satellite Imagery [5.0] このデータセットは、衛星画像から再生可能エネルギー設備を特定するために、ディープラーニングに基づくセグメンテーションモデルをトレーニングすることで作成します。
検出された各特徴について,建設日と前回の土地利用タイプを推定する。
我々の最後の空間データセットは、375,197個の個別の風力タービンと86,410個のソーラーPVの設置を含む。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:38:43 GMT)
Macroeconomic Forecasting with Large Language Models [5.0] 本稿では,従来のマクロ時系列予測手法と比較して,Large Language Models(LLM)の精度を評価する。
本研究は, LLMの長所と短所について, 実世界のシナリオにおける適用性に光を当てながら, マクロ経済時系列の予測における長所と短所について, 貴重な知見を提供するものである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:55:51 GMT)
Predicting Multi-Agent Specialization via Task Parallelizability [5.0] 環境制約がタスクの並列性を制限する場合、スペシャリストチームはジェネラリストよりも優れていることを示す。
また、状態空間が拡大するにつれて、エージェントは理論上より効率的である場合でも、専門家戦略に収束する傾向にあることも観察する。
本研究は,タスクと環境に配慮した特殊化を解釈するための原則的枠組みを提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:33:48 GMT)
Evaluating Time Series Models with Knowledge Discovery [4.9] 時系列データは、医療、地震学、製造業、エネルギーといった様々な重要な領域に存在する最もユビキタスなデータモダリティの1つである。
モデルの性能はRMSE、精度、F1スコアといった特定の評価指標によって評価されることが多い。
モデル評価にドメイン知識を効果的に活用することを目的とした知識発見に基づく評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:48:56 GMT)
xMOD: Cross-Modal Distillation for 2D/3D Multi-Object Discovery from 2D motion [4.9] DIOD-3Dは2Dモーションを用いた3Dデータにおけるマルチオブジェクト発見のための最初のベースラインである。
xMODは、常に2Dモーションキューを使用しながら、2Dと3Dデータを統合したクロスプラットフォームのトレーニングフレームワークである。
提案手法は,全データセットの2次元オブジェクト発見状態と比較すると,大幅な性能向上をもたらす。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:20:35 GMT)
DEPT: Deep Extreme Point Tracing for Ultrasound Image Segmentation [4.8] 超音波画像分割のための特徴誘導極点マスキング(FGEPM)アルゴリズムと統合したDeep Extreme Point Tracing(DEPT)を導入する。
提案手法は,特徴写像に基づくコスト行列上の極端点を接続する最小コストパスを同定し,擬似ラベルを生成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:32:14 GMT)
Navigating MLOps: Insights into Maturity, Lifecycle, Tools, and Careers [4.8] 本稿では,Large Language Model Operations(LLMOps)をさらに取り入れた,MLOpsライフサイクル統合フレームワークを紹介する。
さまざまな成熟度レベルでMLOpsの採用に関連する重要な役割、ツール、コストを概説する。
標準化されたフレームワークを提供することで、MLOpsを効果的に実装するために必要なリソースを明確に定義し、割り当てすることを支援します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:20:14 GMT)
Intelligent Spatial Perception by Building Hierarchical 3D Scene Graphs for Indoor Scenarios with the Help of LLMs [4.8] 本稿では,Large Language Models (LLMs) を利用した室内シナリオのための階層型3次元シーングラフ構築システムを提案する。
提案するフレームワークは、3DSGで構成されており、リッチなメトリック・セマンティック情報を持つ基本層、オブジェクトノードの正確なポイントクラウド表現を特徴とするオブジェクト層、部屋、フロア、ビルディングノードの上位層で構成されている。
LLMの革新的な応用のおかげで、オブジェクトノードだけでなく、部屋ノードのような上位層のノードもインテリジェントで正確な方法でアノテートされる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:40:28 GMT)
LIFT: Latent Implicit Functions for Task- and Data-Agnostic Encoding [4.8] Implicit Neural Representations (INR)は、多様なデータドメインをまたいだタスクモデリングを統合するための強力なパラダイムであることが証明されている。
本稿では,メタラーニングによるマルチスケール情報をキャプチャする新しい高性能フレームワークLIFTを紹介する。
また、残差接続と表現頻度符号化を組み込んだLIFTの強化版であるReLIFTについても紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:00:58 GMT)
Representative Ranking for Deliberation in the Public Sphere [4.7] アルゴリズムのランク付けは、正当な視点の可視性を低下させる。
これらの方法に表現の保証を導入する。
JR の実施は,多様な視点を取り入れることにつながることが判明した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:39:35 GMT)
Self-Vocabularizing Training for Neural Machine Translation [4.7] トレーニングされた翻訳モデルは、元のBPE語彙とは別個のBPE語彙反復を用いて、バイトペア符号化サブセット(BPE)を使用するように誘導される。
我々は,より小さく,より最適な語彙を自己選択する反復的手法である自己語彙学習を提案し,最大1.49BLEUの改善をもたらす。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:09:17 GMT)
A Comprehensive Survey on Integrating Large Language Models with Knowledge-Based Methods [4.7] 大規模言語モデル(LLM)は構造化知識ベースシステムと統合することができる。
本稿では, LLMと知識基盤の関係を調査し, 実際に適用できる方法について検討し, 技術的, 運用的, 倫理的課題について考察する。
これは、データコンテキスト化、モデル精度、知識リソースの利用に関する構造化知識ベースシステムに生成AIを組み込むことの利点を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:27:43 GMT)
TruthLens:A Training-Free Paradigm for DeepFake Detection [4.6] 本稿では,視覚的質問応答(VQA)タスクとしてディープフェイク検出を再定義するトレーニングフリーフレームワークであるTruthLensを紹介する。
TruthLensは最先端の大規模視覚言語モデル(LVLM)を使用して視覚的アーティファクトを観察し記述する。
マルチモーダルアプローチを採用することで、TruthLensは視覚的および意味論的推論をシームレスに統合し、イメージをリアルまたはフェイクとして分類するだけでなく、解釈可能な説明を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:41:32 GMT)
Disentangling Modes and Interference in the Spectrogram of Multicomponent Signals [4.6] 本稿では,マルチコンポーネント信号のスペクトルをモード部と干渉部に分解する方法について検討する。
i) 画像処理におけるテクスチャ・幾何学的分解に着想を得た変分法と, (ii) U-Netアーキテクチャを用いた教師あり学習手法の2つのアプローチを探索する。
数値解析実験は、スペクトル分解における両方のアプローチの利点と限界を示し、強い干渉の存在下での時間周波数解析の強化の可能性を強調している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:36:20 GMT)
Introducing Verification Task of Set Consistency with Set-Consistency Energy Networks [4.5] 自然言語推論の拡張である集合整合性検証(NLI)の課題について紹介する。
提案するSC-Energy(Set-Consistency Energy Network)は,コントラスト・ロス・フレームワークを用いて文集合間の互換性を学習する新しいモデルである。
我々のアプローチは、矛盾を効率的に検証し、論理的矛盾の原因となる特定の言明をピンポイントするだけでなく、既存の手法を著しく上回る。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:07:06 GMT)
Deep quantum Monte Carlo approach for polaritonic chemistry [4.5] 我々は、光学キャビティに閉じ込められた分子の電子的およびフォトニックなシュリンガー方程式を解くために、ディープラーニングの変分量子モンテカルロ法を導入する。
我々は、量子モンテカルロフレームワークにおいて、典型的な電子ニューラルネットワークの波動関数を、結合フェルミオン系とボゾン系を記述するために拡張する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:00:00 GMT)
Relax and penalize: a new bilevel approach to mixed-binary hyperparameter optimization [4.3] 機械学習モデルにおける混合バイナリハイパーパラメータの挑戦的な最適化に取り組む。
混合バイナリソリューションの提供を保証するアルゴリズムフレームワークを提案する。
その結果,本手法は緩和と丸めに基づく最先端の手法と競合することがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:59:35 GMT)
A Comparative Study of Quantum Optimization Techniques for Solving Combinatorial Optimization Benchmark Problems [4.3] 本稿では,NP-hard問題に対する量子最適化手法の評価を目的とした,包括的なベンチマークフレームワークを提案する。
本フレームワークは,多次元クナップサック問題(MDKP),最大独立集合(MIS),二次割当問題(QAP),市場シェア問題(MSP)など,主要な課題に重点を置いている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:33:35 GMT)
Semantic Segmentation of Transparent and Opaque Drinking Glasses with the Help of Zero-shot Learning [4.2] ゼロショットモデルCaGNetの修正版であるTransCaGNetを提案する。
ゼロショット学習を使用して、トレーニング中に与えないガラスカテゴリの意味的なセグメンテーションを作成できます。
また,TransCaGNetではIoUと精度が向上し,ZegClipでは未確認クラスの方が優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:54:14 GMT)
Wild SBOMs: a Large-scale Dataset of Software Bills of Materials from Public Code [4.2] 利用可能なFree and Open Source Software (FOSS)コンポーネントを再利用することで、生産性が向上する。
これらの問題に対処する1つのアプローチは、Software Bill of Materials (SBOM)を使用することである。
野生で生成されたSBOMファイルに基づくSBOMの実践に関する大規模な研究は、いまだに不十分である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:20:28 GMT)
Proceedings of the 3rd Italian Conference on Big Data and Data Science (ITADATA2024) [4.2] イタリアビッグデータ・データ科学会議(イタリア語: Italian Conference on Big Data and Data Science)は、CINIビッグデータ国立研究所とISTI CNRが毎年開催する国際会議である。
これは、ビッグデータとデータサイエンスの分野で働くイタリアの研究者と専門家、および関連する分野(セキュリティとプライバシ、HPC、クラウドなど)をまとめることを目的としている。
データガバナンス、データ処理、データ分析、データレポーティング、データ保護など、ビッグデータとデータサイエンスの理論的および実践的な側面をすべてカバーし、実験的な研究や教訓も学んだ。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:48:18 GMT)
Mitigating Paraphrase Attacks on Machine-Text Detectors via Paraphrase Inversion [4.1] 高品質なパラフレーズは命令調整言語モデルを使って容易に生成できる。
x2013$$は、マシンテキスト検出器の性能を著しく低下させることで知られている。
本稿では,パラフレーズ付きテキストから元のテキストへのパラフレーズとして,この問題をフレーム化する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:32:41 GMT)
A Data-driven Investigation of Euphemistic Language: Comparing the usage of "slave" and "servant" in 19th century US newspapers [4.1] 本研究では,19世紀の米国新聞における「スレーブ」と「サーヴァント」の使用法について,計算手法を用いて検討した。
その結果,「奴隷」は社会経済的・法的・行政的な言葉と関連していることがわかった。
サーヴァント」は北部の新聞で宗教的な言葉と結びついており、南部の新聞は「サーヴァント」を家庭や家族の言葉と結びつけている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:49:22 GMT)
SPNeRF: Open Vocabulary 3D Neural Scene Segmentation with Superpoints [4.0] 幾何学的先行性を利用するゼロショット3Dセグメンテーション手法であるSPNeRFを導入する。
親和性スコアが強化されたプリミティブベースマージ機構を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:45:59 GMT)
Evaluating Bias in Retrieval-Augmented Medical Question-Answering Systems [4.0] Retrieval-Augmented Generation (RAG)モデルを利用した医療QAシステムは、人種、性別、および健康の社会的決定要因に関連するバイアスをもたらす可能性がある。
我々は,RAGに基づくLLMにおける偏りを,人口統計に敏感な問合せと検索の相違点の測定により系統的に評価した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:36:35 GMT)
Digital Simulation of Non-Abelian Parafermions in Superconducting Circuits [4.0] パラフェルミオンは深い非アベリア統計を示し、トポロジカルに順序づけられたシステムで現れる。
この研究は、以前の量子シミュレーションを拡張し、SC量子ビットのツイスト欠陥をキューディット系へ拡張した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:20:25 GMT)
An Approach to Analyze Niche Evolution in XCS Models [4.0] XCSにおけるニッチの進化を識別・追跡するためのアプローチを提案する。
これはXCSの進化的構成要素の根底にある原理を利用する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:47:27 GMT)
Studying and Understanding the Effectiveness and Failures of Conversational LLM-Based Repair [3.9] 自動プログラム修復(APR)は、バグ修正のプロセスを自動化するように設計されている。
会話言語モデル(LLM)を利用した高度なAPR技術は、目覚ましい修復能力を示した。
優位性にもかかわらず、会話型APR技術は依然として多くのバグを修復することができない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:39:32 GMT)
SENAI: Towards Software Engineering Native Generative Artificial Intelligence [3.9] 本稿では,ソフトウェア工学の知識を大規模言語モデルに統合することについて議論する。
本研究の目的は,LLMが単なる機能的精度を超えて生成タスクを実行できる新しい方向を提案することである。
ソフトウェアエンジニアリング ネイティブな生成モデルは、現在のモデルに存在する欠点を克服するだけでなく、現実世界のソフトウェアエンジニアリングを扱うことができる次世代の生成モデルへの道を開くでしょう。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:02:07 GMT)
Your Signal, Their Data: An Empirical Privacy Analysis of Wireless-scanning SDKs in Android [3.8] モバイルアプリは、Bluetooth Low Energy(BLE)とWiFiスキャンパーミッションを使って、近くのデバイスを見つける。
無線インターフェースは位置情報データの隠蔽プロキシとしても機能し、継続的なユーザ追跡とプロファイリングを可能にする。
52個のワイヤレススキャンSDKのシステマティック分析を行い、データ収集のプラクティスとプライバシリスクを明らかにする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:15:02 GMT)
Learning to Play Piano in the Real World [3.8] 我々は,学習アプローチを生かした最初のピアノ演奏ロボットシステムを開発し,実世界における器用なロボットに展開する。
具体的には,Sim2Realを用いて,実世界のデキスタスロボットに学習ポリシーをデプロイする前に,強化学習を用いてシミュレーションのポリシーを訓練する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:56:14 GMT)
Depth-Aware Range Image-Based Model for Point Cloud Segmentation [3.8] PCSは、ポイントを異なる意味のあるグループに分けることを目的としている。
Deeper-Aware Module (DAM) と Fast FMVNet V3 が提案されている。
DAMは、チャネル間の相互依存性を明示的にモデル化することにより、レンジ画像の順序された深さ情報を知覚する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:46:25 GMT)
Robust Transmission of Punctured Text with Large Language Model-based Recovery [3.8] 本稿では,少数の文字を選択・送信し,受信側で欠落した文字を復元する新しいテキスト送信モデルを提案する。
また,LLM回復性能を高めるために送信文字を選択する新しい重要文字抽出器 (ICE) を提案する。
提案モデルでは,異なるデータセットやタスクにまたがるロバストな性能を示し,低信号対雑音比条件下で従来のビットベースの通信よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:16:08 GMT)
Volumetric Reconstruction From Partial Views for Task-Oriented Grasping [3.7] 本稿では,対象物の限定的な部分的視点から適切な把握戦略を推定するためのアプローチを提案する。
R-GAN (Recurrent Generative Adversarial Network) は, 様々な深度スキャンを行うために提案されている。
両腕移動操作ロボットを用いて,全体の把握精度を89%と評価した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:47:50 GMT)
A Role of Environmental Complexity on Representation Learning in Deep Reinforcement Learning Agents [3.7] 我々は,ショートカット利用ナビゲーションタスクにおいて,深層強化学習エージェントを訓練するためのシミュレーション環境を開発する。
初期学習を開始すると,全てのエージェントが閉じたショートカット試験において最適な性能を達成できることがわかった。
その結果、キューの頻繁な提示は、キューに遭遇するエージェントに比べて、個々のノードの活動においてキューの符号化がより良くなったことが判明した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:54:44 GMT)
SparQ: Simulating Scalable Quantum Algorithms via Sparse Quantum State Representations [3.7] We present SparQ, a quantum simulator implement in C++ based by the Feynman-based method。
SparQはレジスタレベルで動作し、量子状態のゼロでないコンポーネントのみを格納する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:23:26 GMT)
Approximation properties of neural ODEs [3.7] 活性化関数がニューラル常微分方程式(ニューラルODE)の流れとして定義される浅部ニューラルネットワークの近似特性について検討する。
連続関数空間におけるそのような浅層ニューラルネットワークの普遍近似特性(UAP)を証明した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:11:28 GMT)
Conjuring Positive Pairs for Efficient Unification of Representation Learning and Image Synthesis [3.6] Unified Self-Supervised Learning (SSL)メソッドは、表現学習と生成モデリングのギャップを埋める。
最近のUnified SSLメソッドは、トレーニング中に外部トークン化器を必要とするセマンティックトークン再構成のみに依存している。
本稿では,新しい統合SSLフレームワークであるSorcenについて紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:53:11 GMT)
Language Model Council: Democratically Benchmarking Foundation Models on Highly Subjective Tasks [3.6] 言語モデル協議会(LMC: Language Model Council)では、LLMのグループが協力してテストを作成し、それに反応し、相互の反応を評価して、民主的な方法でランキングを作成する。
感情的インテリジェンスに関する詳細なケーススタディでは、対人対立に対するオープン・エンド・レスポンスにおいて、20の最近のLCMを相互にランク付けするために配置する。
以上の結果から, LMCは, より分離性が高く, より堅牢なランキングを作成でき, ユーザスタディにより, 個々のLCM審査員よりも人的評価に整合性があることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:25:35 GMT)
HQNN-FSP: A Hybrid Classical-Quantum Neural Network for Regression-Based Financial Stock Market Prediction [3.5] 本研究では、金融トレンド予測を支援するためのハイブリッド量子古典的アプローチの可能性について検討する。
独自の量子ニューラルネットワーク(QNN)レグレシタが導入された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:44:21 GMT)
Cancelable Biometric Template Generation Using Random Feature Vector Transformations [3.5] Cancelable Biometric schemes is designed to extract a identity-serving, non-invertible and as revocable pseudo-identifier from biometric data。
最先端のキャンセル可能なスキームは、ユーザ固有のソルティングまたは多対一変換を使用して元のテンプレートを変換することで擬似識別を生成する。
これらの制限を克服するために、新しいモダリティ非依存のキャンセル可能なバイオメトリックスキームが提案されている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:03:04 GMT)
Speculative MoE: Communication Efficient Parallel MoE Inference with Speculative Token and Expert Pre-scheduling [3.5] MoE(Mixture of Experts)は、現代のトランスフォーマーベースのLLM(Large Language Models)を前例のない規模に拡張可能なニューラルネットワークとして普及している。
最先端のMoE推論フレームワークであるDeepSpeed-MoEは、EP(Expert Parallelism)、TP(Tensor Parallel)、DP(Data Parallelism)を含む3D並列パラダイムを採用している。
本研究の目的は,EPの通信オーバヘッドをSpeculative MoEという技術で戦略的に削減し,DeepSpeed-MoEを向上することである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:03:39 GMT)
Defending Against Gradient Inversion Attacks for Biomedical Images via Learnable Data Perturbation [3.5] 連合学習における勾配反転攻撃に対する防御効果を示す。
提案手法は,再構成画像の分類において,攻撃者の精度を12.5%低下させることで,ベースラインを上回り得る。
その結果,医療データに対する汎用的防衛の可能性が示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 01:53:23 GMT)
Single photon isolation and nonreciprocal frequency conversion in atom-waveguide systems [3.4] 原子導波路系における単一光子レベルの単一光子分離と非相互周波数変換について検討した。
我々の研究は、原子-導波路系における単一光子レベルで光学的非相互性を達成するための新しい視点を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:54:08 GMT)
Optical nonreciprocity induced by quantum squeezing in temperature sensitive optomechanical systems [3.4] マイクロリング光学系における単一光子伝達と光子相関の統計的性質について検討した。
提案プロトコルは,超低温における高精度温度測定における非相互設定の可能性を示唆している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:11:11 GMT)
Non-Markovian dynamics with $Λ$-type atomic systems in a single end photonic waveguide [3.4] 半無限の1次元フォトニック導波路と相互作用する$da$-Lamb型原子の非マルコフ動力学進化について検討する。
適切な条件下では、即時および遅延崩壊速度が平衡に達し、原子-光子結合状態を形成することが示される。
モデルを2原子系に拡張し、2つの空間的に分離された原子の絡み合いのダイナミクスを調べる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:55:03 GMT)
Weighted-Sum of Gaussian Process Latent Variable Models [3.4] 我々は信号分離のための非パラメトリックなアプローチを開発し、信号は潜時変数に応じて変化する可能性がある。
我々の貢献は分光学に特に関係しており、そこでは変化条件が変化し、基礎となる純粋な成分信号がサンプルからサンプルへと変化する可能性がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:25:15 GMT)
Multivariate Gaussian Topic Modelling: A novel approach to discover topics with greater semantic coherence [3.4] 本稿では,新しい多変量ガウス的トピックモデリング(MGD)手法を提案する。
この手法は、まず合成データセットに応用され、vis-a-vis LDAの解釈可能性の利点を示す。
このモデルは LDA に対して 0.436 vis-a-vis 0.294 の平均トピックコヒーレンスを達成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:25:54 GMT)
PRISM: Preference Refinement via Implicit Scene Modeling for 3D Vision-Language Preference-Based Reinforcement Learning [3.3] PRISMは2DベースのPreference-Based Reinforcement Learning(PBRL)の限界を克服するために設計された新しいフレームワークである
中心となるPRISMは、3D Point Cloud-Language Modelを採用し、Chain-of-Thought (CoT)推論を取り入れている。
私たちの経験的成果は、ロボット操作や自律ナビゲーションといったタスクにまたがるものであり、現実世界のアプリケーションに対するPRISMの可能性を強調しています。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:22:21 GMT)
Chain-of-Thought Reasoning In The Wild Is Not Always Faithful [3.0] CoT(Chain-of-Thought)推論は最先端のAI能力を大幅に進歩させたものだ。
人工バイアスのない現実的なプロンプトで不信なCoTが発生することを示す。
具体的には、モデルが二分問題に対する回答において、その暗黙のバイアスを合理化していることが分かる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:20:42 GMT)
The Hardness of Validating Observational Studies with Experimental Data [3.0] 実験データを用いて,観測データから因果効果を推定する手法を提案する。
この定理は, 観測実験において, 補正関数の滑らかさを仮定することなく, 偏差を検出する実験データを用いることができるが, 除去には使用できないことを証明している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:06:23 GMT)
Unification of observational entropy with maximum entropy principles [2.9] 本研究では, 粗粒のエントロピーの定義を導入し, 測定に基づく(観測エントロピー) と最大エントロピーに基づく(ジャイネス) アプローチを結合した粗粒のエントロピーについて述べる。
量子乱数行列モデルと古典的硬球気体のエントロピーの力学について検討する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:00:30 GMT)
A Bird Song Detector for improving bird identification through Deep Learning: a case study from Doñana [2.8] ドナ国立公園(西スペイン)における鳥声自動識別パイプラインの開発
9ヶ所の生息地から461分間の音声を手動でアノテートし,34の授業で3,749のアノテーションを得た。
分類前のバード・ソング・ディテクターの適用により種識別が向上し、鳥類が検出されたセグメントのみを分析する場合、すべての分類モデルが改善された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:19:06 GMT)
Comparing Llama3 and DeepSeekR1 on Biomedical Text Classification Tasks [2.8] 本研究では,オープンソースの2つのLlama3-70BとDeepSeekR1-distill-Llama3-70Bの性能を比較した。
4つのタスクはソーシャルメディアからのデータであり、2つのタスクは電子健康記録からの臨床ノートにフォーカスする。
DeepSeekR1-distill-Llama3-70Bは、ほとんどのタスクで精度が良く、リコールの結果が混在している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:51:52 GMT)
On the Fourier analysis in the SO(3) space : EquiLoPO Network [2.8] 既存のディープラーニングアプローチでは、離散的な回転に制限されたグループ畳み込みネットワークまたは制約付きフィルタ構造を持つステアブル畳み込みネットワークを利用する。
本研究は, 連続SO(3)群における局所パターン配向に対する解析的等価性を実現する, 新たな同変ニューラルネットワークアーキテクチャを提案する。
MedMNIST3Dを用いた多種多様な3次元医用画像データセットの包括的評価により,本手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:43:51 GMT)
LLM Alignment for the Arabs: A Homogenous Culture or Diverse Ones? [2.7] 大きな言語モデル(LLM)は、タスクを自動化し、人間を助けるのに有用なツールである可能性がある。
これらのモデルは英語に精通しており、西洋の文化、規範、価値観と整合している。
アラブ人は時に同じ文化を共有していると仮定される。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:52:59 GMT)
Semi-KAN: KAN Provides an Effective Representation for Semi-Supervised Learning in Medical Image Segmentation [2.7] 半教師付き医療画像セグメンテーション(SSMIS)は、CNNやViTに代わる有効な代替手段を提供する。
Kolmogorov-Arnold Networks (KAN) にヒントを得て,Semi-KANを提案する。
カンはより少ないパラメータで優れた表現学習能力を示す。
そこで本研究では,Semi-KANがベースラインネットワークを超越し,KANレイヤの削減と計算コストの削減を図っている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:27:41 GMT)
Online Imitation Learning for Manipulation via Decaying Relative Correction through Teleoperation [2.7] 本稿では,専門家によって提供される空間オフセットベクトルに基づいて,DEC(Desaying Relative Correction)と呼ばれる補正手法を提案する。
以上の結果から, DRCは標準的な絶対補正法に比べて, 必要な専門家介入率を30%削減できることが示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:06:50 GMT)
Aligning Crowd-sourced Human Feedback for Reinforcement Learning on Code Generation by Large Language Models [2.7] 我々は、Github CopilotやAmazon CodeWhispererといったAIツールを通じて、AI支援プログラミングと大規模言語モデル(LLM)がソフトウェア開発者の能力をどのように改善するかを研究する。
ベイジアン最適化フレームワークは,フィードバック収集負荷を分散することにより,コード生成におけるAIアライメントをサポートすることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:44:47 GMT)
DeepExtractor: Time-domain reconstruction of signals and glitches in gravitational wave data with deep learning [2.6] 我々は、干渉計ノイズを超えるパワーで信号やグリッチを再構成する深層学習フレームワークDeepExtractorを提案する。
3つの実験によりDeepExtractorの有効性を検証した。
DeepExtractorは、シミュレーショングリッチに対して0.9%の中央値のミスマッチを達成し、いくつかのディープラーニングベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:45:31 GMT)
Homogeneous Algorithms Can Reduce Competition in Personalized Pricing [2.6] パーソナライズされた価格設定の文脈における競合に対する相関アルゴリズムの影響について検討する。
本結果は,アルゴリズムが過剰なコミュニケーションを伴わずに価格相関を促進することの容易さを裏付けるものである。
我々は、米国反トラスト法の適用と解釈における結果の影響を分析する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:43:36 GMT)
Unified Enhancement of the Generalization and Robustness of Language Models via Bi-Stage Optimization [2.5] 本稿では,LMの一般化とロバスト性の両方を均一に向上する二段階最適化フレームワークを提案する。
提案手法は,従来の手法と比較して,LMの一般化とロバスト性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:50:36 GMT)
Embedding spatial context in urban traffic forecasting with contrastive pre-training [2.5] 本稿では,交通量グラフの概念を用いて,道路情報と交通情報を組み合わせた新しい手法を提案する。
我々は、この幾何エンコーダを既存のグラフニューラルネットワーク(GNN)ベースのトラフィック予測モデルと統合する方法を紹介し、議論する。
我々は、このハイブリッドモデルが、追加のトラフィックデータをゼロにすることで、一般化と性能を向上させる可能性を実証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:21:22 GMT)
Towards Adaptive Human-centric Video Anomaly Detection: A Comprehensive Framework and A New Benchmark [2.5] 人間中心型ビデオ異常検出(VAD)は、正常から逸脱する人間の行動を特定することを目的としている。
本稿では,Human-centric privacy-enhanced Video Anomaly Detection(Human-centric privacy-enhanced Video Anomaly Detection)データセットと,新しい教師なし連続異常学習フレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:13:10 GMT)
ML-Triton, A Multi-Level Compilation and Language Extension to Triton GPU Programming [2.5] Tritonは、より高いレベルでプログラミングによって、よりユーザフレンドリでポータブルな代替手段を提供するDSLです。
マルチレベルのコンパイルフローとプログラミングインタフェースを備えたML-Tritonを提案する。
提案手法は,Intel GPU上でのエキスパート記述カーネルの95%以上の性能を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:31:39 GMT)
LuGo: an Enhanced Quantum Phase Estimation Implementation [2.5] 本稿では,量子位相推定の性能向上を目的とした新しいフレームワーク,LuGoを紹介する。
LuGoは計算効率とハードウェア要件の両方で大幅に改善されている。
これらの利点により、LuGoはより効率的なQPEの実装の道を開いた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:19:24 GMT)
Mixed precision accumulation for neural network inference guided by componentwise forward error analysis [2.4] ニューラルネットワークの推論のための数学的に確立された混合精度蓄積戦略を提案する。
我々の戦略は、ニューラルネットワークの前方通過におけるエラーの伝播を説明する新しいコンポーネントワイズ・フォワード・エラー分析に基づいている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:19:11 GMT)
Benchmarking direct and indirect dipolar spin-exchange interactions between two Rydberg atoms [2.4] 2つの個々の原子間の様々なスピン交換相互作用の実験的評価
アドレナブル光シフトを用いた新しい双極子結合形共振器
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:25:03 GMT)
Time Series Classification of Supraglacial Lakes Evolution over Greenland Ice Sheet [2.4] グリーンランド氷床(GrIS)は、主に融水流出の増加により、地球規模の海面上昇に重要な役割を果たしている。
本研究では,Reconstructed Phase Spaces (RPSs) の GMM を用いて,その季節的変化に基づいて上部氷河湖を同定する,計算効率のよい時系列分類手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:40:56 GMT)
Spin contrast, finite temperature, and noise in matter-wave interferometer [2.4] 有限温度補正とスピン依存・非依存ノイズが物質波干渉計のコントラストにどのように影響するかを示す。
我々は、Stern-Gerlach型でマクロ的な量子重ね合わせを生成する装置について検討する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:06:49 GMT)
DynFrs: An Efficient Framework for Machine Unlearning in Random Forest [2.3] DynFrsはランダムフォレストにおける効率的な機械学習を可能にするために設計されたフレームワークである。
実験では、DynfrsをExtremely Treesに適用すると、大幅に改善される。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:59:53 GMT)
ANaGRAM: A Natural Gradient Relative to Adapted Model for efficient PINNs learning [2.3] 物理情報ニューラルネットワーク(PINN)はPDE駆動システムの解法として強い関心を集めている。
本稿では,PINNの高速化とトレーニングの精度向上に寄与する自然な勾配法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:47:29 GMT)
Error Bounds on the Universal Lindblad Equation in the Thermodynamic Limit [2.3] これは、バルク散逸の対象となる量子多体系の挙動を解明するために、物理学の様々な分野において中心的な問題である。
これまで、多体系に対するリンドブラッド量子マスター方程式のいくつかの微視的導出が提案されてきた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:49:49 GMT)
Extending the HNLS Condition to Robust Quantum Metrology [2.1] 我々は,磁界に付随するパラメータ$theta$をフルランクマルコフ雑音下で推定する量子センシングプロトコルを開発した。
非自明なCSSコードは、ハミルトニアンがノイズチャネルのリンドブラッド作用素のスパンである場合に限り、ハイゼンベルクスケーリングを達成することができる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:15:41 GMT)
An extensive simulation study evaluating the interaction of resampling techniques across multiple causal discovery contexts [2.1] 本稿では,アルゴリズムのチューニングパラメータに対する特定の値の割り当てをエミュレートする再サンプリング手法を提案する。
また,理論結果を検証し,重要なデータを提供する広範囲なシミュレーション実験の結果についても報告する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:18:18 GMT)
Complexity-theoretic foundations of BosonSampling with a linear number of modes [2.1] 複雑性理論の硬さ論と現在の実験のギャップを埋める。
我々は、Permanentを計算するために、新しい最悪の平均ケースの削減を証明した。
また、飽和状態におけるガウス・ボソン・サンプリングの硬さの証明として、同様の議論を適用する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:42:13 GMT)
Do Chains-of-Thoughts of Large Language Models Suffer from Hallucinations, Cognitive Biases, or Phobias in Bayesian Reasoning? [1.9] CoT(Chain-of-Thought)を用いた推論が可能な大規模言語モデル(LLM)
LLMは自然の周波数、全体オブジェクト、エンボディドといった生態学的に有効な戦略を自律的に説明しない。
それらは、象徴的な推論と、生態学的に有効な戦略の回避または恐怖症に対する永続的なバイアスを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:44:02 GMT)
MMLNB: Multi-Modal Learning for Neuroblastoma Subtyping Classification Assisted with Textual Description Generation [1.9] MMLNBは、病理画像と生成されたテキスト記述を統合して、分類精度と解釈可能性を向上させるマルチモーダル学習モデルである。
本研究は,神経芽腫サブタイプ分類における信頼性と解釈可能性を高める,スケーラブルなAI駆動型デジタル病理フレームワークを作成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:27:16 GMT)
Benchmarking MedMNIST dataset on real quantum hardware [1.9] 量子機械学習(QML)は、複雑な分類タスクを解決するために量子システムの計算能力を活用する、有望な領域として登場した。
MedMNISTは、127量子ビットの実際のIBM量子ハードウェア上での医療画像データセットの多種多様なコレクションである。
本研究では、デバイス対応量子回路、エラー抑制、医用画像分類の緩和など、最近の量子コンピューティングの進歩について検討する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:21:51 GMT)
On the Approximability of Stationary Processes using the ARMA Model [1.8] スペクトル補題を用いて、単位円上の関数近似をランダム変数近似に接続する。
本結果は,Szego,Kolmogorov,Wiener などの古典的無限文における予測誤差よりも,確率変数の近似誤差に着目した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:03:26 GMT)
Universal fault tolerant quantum computation in 2D without getting tied in knots [1.8] 耐故障性のない非クリフォードゲートを2次元で行う方法を示す。
我々は、異なる論理ゲートに対してマクロ画像を提供するパスの枠組みを定式化し、関連する顕微鏡回路を導出する方法を定式化する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:59:46 GMT)
Network Analytics for Anti-Money Laundering -- A Systematic Literature Review and Experimental Evaluation [1.7] 本稿では,Web of Science and Scopus の97論文をもとに,広範囲かつユニークな文献レビューを行う。
我々は、ほとんどの研究はエキスパートベースのルールと手動の機能に依存していると結論付け、ディープラーニングの手法は勢いを増している。
2つの公開データセットに適用し、手動の特徴工学、ランダムウォークベース、ディープラーニング手法を比較した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:04:36 GMT)
Narrative Trails: A Method for Coherent Storyline Extraction via Maximum Capacity Path Optimization [1.7] 大規模テキストコーパスにおけるコヒーレントなストーリーラインを抽出する,効率的かつ汎用的な手法であるNarrative Trailsを提案する。
具体的には、ディープラーニングモデルの潜在空間に埋め込まれた意味レベル情報を用いて、スパースコヒーレンスグラフを構築し、物語を抽出する。
提案手法を2つの異なる物語抽出タスクで定量的に評価することにより,複数の文脈におけるナラティブ・トレイルの一般化可能性と拡張性を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:25:56 GMT)
Transformer neural networks and quantum simulators: a hybrid approach for simulating strongly correlated systems [1.6] ニューラル量子状態(NQS)のハイブリッド最適化手法を提案する。
計算ベースからの射影測定と他の測定設定からの期待値の両方を用いることで、事前学習により状態の符号構造へのアクセスが可能になる。
我々の研究は、ニューラル量子状態の信頼性と効率的な最適化の道を開いた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:40:24 GMT)
Persistent Homology-induced Graph Ensembles for Time Series Regressions [1.6] 永続ホモロジーフィルタに基づくグラフニューラルネットワークのアンサンブルを作成する。
アンサンブルは、注目に基づくルーティング機構を介して、個々の学習者からの信号を集約する。
地震活動予測と交通予測に関する4つの異なる実世界の実験は、我々のアプローチが一本のグラフベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:33:40 GMT)
Probing the topology of the space of tokens with structured prompts [1.6] 本稿では,大規模言語モデルに対して,その(隠された)トークン入力を同型に埋め込む,汎用的で柔軟な手法を提案する。
Llemma-7Bのトークン部分空間を復元し,その有効性を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:01:15 GMT)
Envisioning an AI-Enhanced Mental Health Ecosystem [1.5] ピアサポート、セルフヘルプ介入、プロアクティブモニタリング、データ駆動インサイトなど、さまざまなAIアプリケーションについて検討する。
我々は、AIが人間のプロバイダを置き換えず、責任あるデプロイメントと評価を強調するハイブリッドエコシステムを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:21:38 GMT)
Explainable AI Components for Narrative Map Extraction [1.5] 本稿では,ナラティブマップ抽出のための説明可能な人工知能(XAI)システムの評価を行う。
本システムでは,低レベルの文書関係のための話題クラスタに基づく説明,イベント関係のための接続説明,全体の物語パターンに関する高レベルの構造説明を統合した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:48:00 GMT)
LLM-Aided Customizable Profiling of Code Data Based On Programming Language Concepts [1.5] この作業は、大規模言語モデル(コード-LLM)のコードデータセットのコンテキストにおいて、特にプロファイリングに対処する。
プログラミング言語の概念の観点からコードデータセットを特徴づけることで、より良い洞察とターゲットデータキュレーションが可能になる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:01:00 GMT)
Learning Topology Actions for Power Grid Control: A Graph-Based Soft-Label Imitation Learning Approach [1.4] 我々は、渋滞管理に適したグリッドトポロジを見つけるために、新しいImitation Learning (IL)アプローチを導入する。
単一の最適なアクションを強制するためにハードラベルに依存する従来のILメソッドとは異なり、我々の手法はアクションよりもソフトラベルを構築する。
意思決定をさらに強化するため、電力グリッドの構造特性を符号化するためにグラフニューラルネットワーク(GNN)を統合する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:21:18 GMT)
A Unified Framework for Real-Time Failure Handling in Robotics Using Vision-Language Models, Reactive Planner and Behavior Trees [1.3] 本稿では,リアクティブプランナであるVLM(Vision-Language Models)とBT(Behavior Trees)を組み合わせて,リアルタイムの障害処理を実現する,統合された障害復旧フレームワークを提案する。
当社のアプローチには、実行前の潜在的な障害をチェックする事前実行検証と、実行中の障害を検出し修正するリアクティブ障害処理が含まれている。
我々は、ペグ挿入、オブジェクトソート、引き手の配置といったタスクにおいて、ABB YuMiロボットを用いた実世界の実験を通して、我々のフレームワークを評価する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:40:56 GMT)
Controlled Diagonal Catalyst Improves the Efficiency of Quantum Annealing [1.3] そこで本研究では,ハミルトニアンに局所項を追加することで,小さなエネルギーギャップを持つインスタンスを効率的に解く方法を提案する。
提案手法は,従来の量子アニール法と比較して,時間-解法で近似2乗の高速化を実現する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:20:38 GMT)
SUM Parts: Benchmarking Part-Level Semantic Segmentation of Urban Meshes [1.3] 本稿では,都市型テクスチャメッシュの大規模データセットであるSUM Partsを紹介した。
データセットは、顔とテクスチャベースのアノテーションをサポートする独自のアノテーションツールを使用して作成されました。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:22:23 GMT)
Model Hubs and Beyond: Analyzing Model Popularity, Performance, and Documentation [1.3] 我々はHugging Face上で500Sentiment Analysisモデルを総合的に評価した。
以上の結果から,モデルの人気度は必ずしも性能と相関しないことが明らかとなった。
下流タスクに適したモデルを選択するためのガイドラインのチェックリストを提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:01:33 GMT)
PETIMOT: A Novel Framework for Inferring Protein Motions from Sparse Data Using SE(3)-Equivariant Graph Neural Networks [1.2] 本稿では, スパース実験から推定されるタンパク質の運動の連続的コンパクト表現を目標として, この問題に対する新たな視点を示す。
PETIMOT (Protein sEquence and sTructure-based Inference of MOTions) は,SE(3)-equivariant graph Neural Networkを用いて,事前学習したタンパク質言語モデルからの伝達学習を利用する。
PETIMOTは、Protein Data Bankでトレーニングされ評価されると、最先端のフローマッチングアプローチや従来の物理モデルと比較して、時間と正確性において優れたパフォーマンスを示し、タンパク質のダイナミクス、特に大きな/遅いコンフォメーション変化を捉えている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:25:32 GMT)
Scam Detection for Ethereum Smart Contracts: Leveraging Graph Representation Learning for Secure Blockchain [1.2] 本稿では、グラフィカルな表現学習技術を用いて、取引パターンを見つけ、悪意のある取引契約を識別することを提案する。
私たちの研究は、エコシステムにおける信頼とセキュリティの可能性を拡大します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:38:58 GMT)
SphOR: A Representation Learning Perspective on Open-set Recognition for Identifying Unknown Classes in Deep Learning Models [1.2] 我々は,特徴空間をフォン・ミセス・フィッシャー分布の混合としてモデル化する表現学習手法であるSphORを紹介する。
このアプローチは、トレーニング中に意味的に曖昧なサンプルを使用することを可能にし、未知のクラスからのサンプルの検出を改善する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:03:31 GMT)
Cybersecurity in Vehicle-to-Grid (V2G) Systems: A Systematic Review [1.2] 我々は133のV2Gサイバーセキュリティ研究を特定し、レビューした。
ほとんどの研究は、サイバー脅威からV2Gシステムを保護することに重点を置いている。
7つの研究のみがCRML関数の回復の側面について論じている。
EVユーザーの行動とV2Gシステムのサイバーセキュリティの関連性に注目する人はいない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:55:40 GMT)
RMDM: Radio Map Diffusion Model with Physics Informed [1.2] 無線地図の再構築は高度な応用の実現に不可欠である。
複雑な信号伝達やスパースデータといった課題は 正確な再構築を妨げます
我々は**Radio Map Diffusion Model (RMDM)*を提案し、**Helmholtz方程式**のような制約を組み込んだ物理インフォームドフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:06:01 GMT)
Deep Learning Pipeline for Fully Automated Myocardial Infarct Segmentation from Clinical Cardiac MR Scans [1.2] 本研究の目的は,脳梗塞のセグメンテーションを完全自動で行うディープ・ラーニング・ベースの手法を開発し,評価することである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:42:32 GMT)
Assessing AI vs Human-Authored Spear Phishing SMS Attacks: An Empirical Study [1.1] 本稿では,GPT-4と人文作家が作成したSMSフィッシング(SMSフィッシング)メッセージの有効性について検討する。
実験では、スピアフィッシングメッセージのランク付けと質的なフィードバックの提供、どのメッセージが人間かAIが生成したかを推測した。
結果は、LLM生成メッセージは、人間、特に仕事関連のメッセージよりも説得力が高いと認識されることが多いことを示している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:33:59 GMT)
Event-based backpropagation on the neuromorphic platform SpiNNaker2 [1.1] EventPropはスパイクニューラルネットワーク(SNN)におけるイベントベースのバックプロパゲーションのためのアルゴリズム
本実装では, 微分方程式とその共役の離散バージョンを用いて, 漏洩した積分・発火ニューロンの多層ネットワークを計算した。
我々は,Yin Yangデータセットを用いたSNNのバッチ並列化オンチップトレーニングの概念実証を行った。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:22:45 GMT)
Skin Cancer Machine Learning Model Tone Bias [1.1] 多くのオープンソースの皮膚がん画像データセットは、より軽い皮膚のトーンを持つ国で実施された臨床試験の結果である。
このトーン不均衡のため、機械学習モデルは、より軽いスキントーンのための皮膚がんを検出するのによく機能する。
これらのモデルのトーンバイアスは、公正な懸念をもたらし、人工知能の健康分野に対する公衆の信頼を低下させる可能性がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:12:12 GMT)
A Comprehensive Survey on Architectural Advances in Deep CNNs: Challenges, Applications, and Emerging Research Directions [1.1] CNNは、コンピュータビジョン、自然言語処理、診断、物体検出、音声認識におけるブレークスルーを推進している。
本研究では,空間的利用,マルチパス構造,深さ,幅,次元展開,チャネルの促進,注意機構に基づいてCNNアーキテクチャを分類する統合分類法を提案する。
顔認識、ポーズ推定、行動認識、テキスト分類、統計言語モデリング、疾患診断、放射線分析、暗号通貨の感情予測、1Dデータ処理、ビデオ分析、音声認識におけるCNNの応用を体系的にレビューする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:41:06 GMT)
None of the Others: a General Technique to Distinguish Reasoning from Memorization in Multiple-Choice LLM Evaluation Benchmarks [1.0] 本稿では,これまで見られたトークンや概念から正解を完全に解離する,複数選択質問に対する一般的な変分手法を提案する。
この手法を用いて、英語とスペイン語で利用可能な2つのデータセットに基づいて、最先端のプロプライエタリおよびオープンソースLLMを評価する。
その結果, MMLUでは平均57%, UNED-Access 2024では50%の精度低下がみられた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:15:12 GMT)
Waveguide QED with dissipative light-matter couplings [0.9] 散逸性光物質結合は非エルミート物理学において重要な役割を果たすが、導波路QED系では探索されていない。
反PT対称性ではなく擬エルミート対称性を用いることで、散逸結合の概念を一般化し、導波路QEDの場に適用できることが示される。
結晶導波路におけるフォトニックバンドのチューニング性により、散逸性光-マターカップリングが非標準の3次例外点の出現に繋がることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:04:28 GMT)
When Pigs Get Sick: Multi-Agent AI for Swine Disease Detection [0.9] 豚病の監視は、グローバル農業の持続可能性にとって重要であるが、その効果はしばしば損なわれている。
我々は、タイムリーでエビデンスに基づく疾患の検出と臨床ガイダンスを提供する、AIを利用した新しいマルチエージェント診断システムを導入する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:47:25 GMT)
High Temporal Consistency through Semantic Similarity Propagation in Semi-Supervised Video Semantic Segmentation for Autonomous Flight [0.9] 本稿では,空中データに対する高時間整合性を実現するために,リアルタイム推論に適した軽量なビデオセマンティックセマンティック・セマンティクス手法を提案する。
SSPは、カメラの動きを補うために、グローバルな登録アライメントによる効率的な画像分割モデルの予測を時間的に伝播する。
一般的なアプリケーションで提案される他のビデオ手法よりも、セグメンテーション品質と推論速度のトレードオフが優れている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:12:07 GMT)
Am I eligible? Natural Language Inference for Clinical Trial Patient Recruitment: the Patient's Point of View [0.9] 本研究は、患者が自身の採用プロセスを開始し、所定の臨床試験を受ける資格があるかどうかを判断しようとする事例に対処する。
我々は,NLI4PR(Natural Language Inference for patient Recruitment)という新たなデータセットとタスクを設計する。
TREC 2022 臨床試験トラックデータセットを適用し,患者の医療的プロファイルを提供し,患者言語を用いて手動で書き直して作成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:07:19 GMT)
FLP-XR: Future Location Prediction on Extreme Scale Maritime Data in Real-time [0.9] 本稿では,海上移動データを活用するモデルであるFLP-XRを紹介し,高精度な予測を行うロバストなフレームワークを構築する。
3つの実世界のAISデータセットを用いた大規模な実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:34:50 GMT)
2D transmons with lifetimes and coherence times exceeding 1 millisecond [0.9] 材料改良は超伝導量子ビットの損失とデコヒーレンスを低減するための強力なアプローチである。
最近の研究はタンタル(Ta)を基層としサファイアを基材とするトランスモンコヒーレンスを改善している。
基板を高比抵抗シリコン (Si) で置換するとバルク基板の損失が劇的に減少することを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:16:51 GMT)
Texture-Aware StarGAN for CT data harmonisation [0.9] 本稿では,CTデータ調和のためのテクスチャ対応のStarGANを提案する。
本手法では, 異なる空間的, 角的スケールにわたるテクスチャ情報を調和処理に組み込むマルチスケールテクスチャロス関数を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:50:32 GMT)
Nonlinear Bayesian Update via Ensemble Kernel Regression with Clustering and Subsampling [0.9] 我々は,従来のアンサンブル・カルマンフィルタを,非ガウス先行と非線形測定演算子を特徴とする設定に拡張することを提案する。
このフレームワークでは、観測されたコンポーネントは、まず標準カルマン更新によって分極されるが、観測されていないコンポーネントは非線形回帰法を用いて推定される。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:35:28 GMT)
A Performance Analysis of Lexicase-Based and Traditional Selection Methods in GP for Symbolic Regression [0.9] 本稿では, シンボリック回帰問題において最も関連性の高いレキシケースに基づく選択法について検討する。
評価予算が与えられた場合、epsilon-lexicase選択とダウンサンプリング戦略を組み合わせることで、他の方法よりも優れた結果が得られます。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:36:23 GMT)
Efficient Post-Hoc Uncertainty Calibration via Variance-Based Smoothing [0.8] 従来のディープニューラルネットワークにおいて,事前情報の導入が不確実性推定を改善するか否かを検討する。
私たちの焦点は、入力のサブ部分から意味のある予測ができる機械学習タスクです。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:47:15 GMT)
Logical entanglement distribution between distant 2D array qubits [0.8] 近接する相互作用を持つ2つの2次元量子ビットアレイの表面コードに基づく効率的な論理絡み合い分布プロトコルを提案する。
提案プロトコルの特筆すべき特徴は,エラー推定によるポストセレクションが可能であることである。
我々は,提案プロトコルの性能とトレードオフ関係を数値的に評価し,本プロトコルは実測可能な実験パラメータの忠実性を改善しつつ,論理的絡み合った状態を作成することができることを示した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:39:32 GMT)
Enhanced High-Dimensional Data Visualization through Adaptive Multi-Scale Manifold Embedding [0.8] 本稿では,適応型マルチスケールマニフォールド埋め込み (AMSME) アルゴリズムを提案する。
順序距離を導入することで、高次元空間における次元性の呪いの制約を克服できることが示される。
実験により,AMSMEはクラスタ内トポロジ構造を著しく保存し,クラスタ間分離を改善した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:21:06 GMT)
Smooth InfoMax -- Towards easier Post-Hoc interpretability [0.7] 自己教師型表現学習のための新しい手法であるSmooth InfoMax(SIM)を紹介する。
SIMは、ニューラルネットワークの様々な深さにおける学習された表現に解釈可能性制約を組み込む。
逐次音声データを用いたSIMの性能評価を行い、Greedy InfoMax(GIM)と競合することを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:58:12 GMT)
Universal adapters between quantum LDPC codes [0.7] 量子低密度パリティチェック符号ブロック内で, 共同論理パウリ測定を行うコードアダプタを提案する。
この構成は、$O(tdlog2d)$追加の量子ビットとチェックと$O(d)$時間を使って、$t$weight $O(d)$演算子を合同論理的に測定する。
例えば$t=2$でアダプタを拡張することで、$O(d2)$追加のキュービットとチェックを使用して、Dehnツイストを介して任意のLDPCコード上でターゲット論理CNOTゲートを実行するトーリックコードアダプタを構築します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:34:01 GMT)
Increasing the Robustness of the Fine-tuned Multilingual Machine-Generated Text Detectors [0.7] 人間はもはや、高品質な機械生成テキストと、本物の人間の文章を区別することができない。
本研究は, 検出作業におけるLDMの堅牢な微調整プロセスを提案し, 検出器を難燃性に対してより堅牢にし, アウト・オブ・ディストリビューションデータに対してより一般化できるようにする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:42:33 GMT)
Probabilities of Chat LLMs Are Miscalibrated but Still Predict Correctness on Multiple-Choice Q&A [0.6] チャット用に微調整された15の大規模言語モデル(LLM)について検討する。
最大ソフトマックス確率 (MSPs) は, 多重選択Q&Aにおいて常に誤校正される。
この仮説は、基礎となるQ&Aタスクでよく機能するモデルに対して成り立つことを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:57:23 GMT)
Radio-frequency cascade readout and coherent exchange control of spin qubits fabricated using a 300 mm wafer process [0.6] スピン-スピン交換相互作用を用いた2つの電子スピンのコヒーレント制御を示し、これは$sqrttextSWAP$のようなエンタングゲートの基底となる。
読み出しには、高周波電子カスケードという新しい読み出し技術を導入し、高い利得を提供しながら、キュービット単位セルを単純化する。
機密性の高い分散読み出しと工業レベルの製造の組み合わせは、シリコン量子プロセッサの大規模統合に向けた重要なステップである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:50:18 GMT)
Tensor Completion for Surrogate Modeling of Material Property Prediction [0.6] 我々は、テンソル完備化問題として、ある材料特性の最適化をモデル化する。
データセットの構造を活用し、大量の素材構成の組み合わせをナビゲートします。
本実験では, 材料特性予測タスク全体にわたって, 10~20%の誤差低減を実現するテンソル完成法について検討した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:35:59 GMT)
Most continuous-variable cluster states are too entangled to be useless [0.5] CVクラスタ状態は一般のAMEであり,Cauchy,Vandermonde,完全正,実ブロックコード生成行列を用いて明示的な構成を提供する。
特に,CVクラスタ状態は一般のAMEであり,Cauchy,Vandermonde,完全正,実ブロックコード生成行列を用いた明示的な構成を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:18:13 GMT)
Student's Use of Generative AI as a Support Tool in an Advanced Web Development Course [0.5] 我々は、学部生のためのWeb開発コースにおいて、学習、創造性、生産性のための支援ツールとしてのGenAIの利用を分析する。
学生は、学習と生産性の向上を報告して、異なるタスクでGenAIを使用した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:34:21 GMT)
QEA: An Accelerator for Quantum Circuit Simulation with Resources Efficiency and Flexibility [0.5] 我々は、メモリ管理、システム適応性、実行効率の難しさを克服する状態ベクトルベースのハードウェアアクセラレータであるQEAを紹介する。
0.534Wの電力しか使わないAMD Alveo U280ボード上でQEAを実装し評価する。
実験の結果、QEAは極めて柔軟で、広範囲の量子回路をサポートし、忠実さに優れており、正規化ゲート速度の点で153.16倍の性能を持つCPUや関連技術より優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:31:56 GMT)
An Investigation of Beam Density on LiDAR Object Detection Performance [0.5] 3Dオブジェクト検出は、自動運転の重要なコンポーネントである。
トレーニングデータと推論データのバリエーションは、大幅なパフォーマンス低下を引き起こす可能性がある。
1つの重要な要素はビーム密度であり、スパースで費用対効果の高いLiDARセンサーの推測は現実世界の応用でしばしば好まれる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:38:25 GMT)
Food Delivery Time Prediction in Indian Cities Using Machine Learning Models [0.5] 本研究では,実時間文脈変数を予測モデルに組み込むことでギャップを解消する。
我々は,線形回帰,決定木,バグング,ランダムフォレスト,XGBoost,LightGBMなどの機械学習アルゴリズムを体系的に比較した。
実験の結果、LightGBMモデルの方が予測精度が良く、R2スコアは0.76、Mean Squared Error(MSE)は20.59で、従来のベースラインモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:02:23 GMT)
Machine Learning Techniques for Multifactor Analysis of National Carbon Dioxide Emissions [0.5] この研究は、二酸化炭素排出量に寄与する要因を理解し、最も予測可能な要素を特定することを目的としている。
この分析は、多種多様な国家軌跡を浮き彫りにした、国内固有の排出量推定を提供する。
この研究は、二酸化炭素排出量の正確な表現による政策立案を支援することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:36:08 GMT)
Beacon2Science: Enhancing STEREO/HI beacon data1 with machine learning for efficient CME tracking [0.4] 我々は,ビーコンと科学データとのギャップを埋めて,CMEトラッキングを改善する,"Beacon2Science"と題する新しいパイプラインを提案する。
改良されたビーコン画像は科学データに匹敵するものであり、オリジナルのビーコンデータよりもCMEの可視性が高い。
強化ビーコンデータから抽出したトラックは、科学画像から抽出したトラックに近く、平均誤差は$sim 0.5 circ$で、オリジナルのビーコンデータでは$ $1circ$である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:09:29 GMT)
Improved YOLOv12 with LLM-Generated Synthetic Data for Enhanced Apple Detection and Benchmarking Against YOLOv11 and YOLOv10 [0.4] YOLOv12nは0.916で最高精度、0.969で最高リコール、0.978で最高平均平均精度(mAP@50)を達成した。
この技術は、農業分野における広範な手動データ収集の必要性を減らし、コスト効率のよいソリューションも提供した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:04:39 GMT)
Enhancing Pancreatic Cancer Staging with Large Language Models: The Role of Retrieval-Augmented Generation [0.4] RAGは、信頼性のある外部知識(REK)から関連する情報を取得することにより、大規模言語モデル(LLM)の機能と信頼性を高める技術である。
膵癌ステージング実験において, NotebookLM を内部 LLM である Gemini 2.0 Flash と比較した。
検索したREK抽出液の有効性に基づいて検索精度を定量化した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:29:47 GMT)
Enhancing the automatic segmentation and analysis of 3D liver vasculature models [0.4] 静脈木 - 門脈(開口)と肝(乾燥)の木は、肝解剖学と疾患状態を理解するのに重要である。
本研究の目的は, 血管の3次元分割, 骨格化, およびその後の解析を改善することである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:48:55 GMT)
Heisenberg-limited adaptive gradient estimation for multiple observables [0.4] 量子力学において、一般観測値の期待値を測定することは、固有の統計的不確実性を持つ。
我々は,ルート平均二乗誤差内における一般可観測値の期待値を推定する適応量子アルゴリズムを提案する。
本手法は,量子コンピュータを用いた複雑な量子システムにおいて,様々な物理特性を正確に理解し,予測する新しい手法である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:26:50 GMT)
Hybrid Quantum-Classical Reinforcement Learning in Latent Observation Spaces [0.4] 量子機械学習の最近の進歩は、古典的な制御問題に取り組むために量子法を使うことに関心を喚起している。
本稿では,古典的オートエンコーダと量子エージェントを併用して,この次元課題を解決することを提案する。
遅延空間学習法の性能解析のために, 一連の数値実験を設計する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:17:47 GMT)
ImputeGAP: A Comprehensive Library for Time Series Imputation [0.4] ImputeGAPは時系列計算のための包括的なライブラリである。
多様な計算方法とモジュラーの欠如したデータシミュレーションをサポートしている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:24:20 GMT)
Chasing shadows with Gottesman-Kitaev-Preskill codes [0.3] 本稿では,Gottesman-Kitaev-Preskill(GKP)エラー訂正コードを用いて定義された論理サブシステムのシャドウトモグラフィーを行うタスクについて考察する。
本研究では,連続変数POVMを変位演算子とガウスユニタリでツイリングすることで,論理的シャドウトモグラフィープロトコルを構築する。
光子パリティ測定では、論理的GKPシャドウトモグラフィーはウィグナーサンプリングプロトコルと等価である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:54:03 GMT)
EarthScape: A Multimodal Dataset for Surficial Geologic Mapping and Earth Surface Analysis [0.3] 本研究では,地球表面マッピングと地球表面解析のための新しいAI対応マルチモーダルデータセットであるEarthScapeを紹介する。
EarthScapeは高解像度の空中RGBと近赤外(NIR)画像、デジタル標高モデル(DEM)、マルチスケールDEM起源の地形特徴、水文・インフラベクトルデータを統合している。
EarthScapeは、拡張のためのビジョンを持つ生きたデータセットとして、コンピュータビジョンと地球科学のギャップを埋める。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:23:48 GMT)
Good Actions Succeed, Bad Actions Generalize: A Case Study on Why RL Generalizes Better [0.3] 監視学習(SL)と強化学習(RL)は、複雑なタスクのための汎用エージェントの訓練に広く用いられている。
本稿ではゼロショット一般化の観点からSLとRLを直接比較する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:03:27 GMT)
Sequential learning based PINNs to overcome temporal domain complexities in unsteady flow past flapping wings [0.3] 我々は、Physics-In Neural Networks(PINN)とIBM(Inimmersed boundary method)を組み合わせて、IBA(Inmersed boundary-aware)フレームワークを導入する。
長期統合におけるPINNの主な困難は、時間空間、長い時間領域、豊富なスペクトルコンテンツである。
本研究は,フロー構造相互作用問題の長期統合における従来のPINNの限界を明らかにする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:20:50 GMT)
EmoGRACE: Aspect-based emotion analysis for social media data [0.3] 本稿では,2,621の英語つぶやきからなるABEAトレーニングデータセットを作成した。
その結果得られたデータセットには、Anger、Sadness、Happiness、Fear、Noneクラスのためのアスペクトレベルの感情ラベルが含まれていた。
F1スコアが70.1%, ATEが46.9%, AECが46.9%であった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:48:52 GMT)
Division polynomials for arbitrary isogenies [0.2] 我々は分割の定義を楕円曲線の任意の同型に拡張する。
乗法-n の除算の場合と類似して、古典楕円関数に関連する関係、同一性を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:10:31 GMT)
A Review on Large Language Models for Visual Analytics [0.2] 本稿では,視覚解析の理論的基盤と大規模言語モデル(LLM)の変容の可能性について概説する。
さらに、LLMと視覚分析の相乗効果が、データの解釈、可視化技術、対話的な探索機能をどのように強化するかを考察する。
本稿は,データ探索,可視化向上,自動レポート,洞察抽出支援における機能,強み,限界について論じる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:02:01 GMT)
Dynamic Power Flow Analysis and Fault Characteristics: A Graph Attention Neural Network [0.2] 本稿では, 動的潮流解析と断層特性を考慮した共同グラフ注意ニューラルネットワーク(GAT)とアダプティブ隣人(CAN)によるクラスタリングを提案する。
次に、スマートグリッドのユースケースアプリケーションで提案したフレームワークを評価し、既存の手法と公正に比較する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:17:11 GMT)
A Deep Learning Approach for Augmenting Perceptional Understanding of Histopathology Images [0.2] 本論文は, 病理組織像解析の高度化に向けた新しいアプローチについて述べる。
視覚変換器(Vit)とGpt-2を併用した画像キャプチャ用マルチモーダルモデル
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:18:22 GMT)
Quest Love: A First Look at Blockchain Loyalty Programs [0.2] 我々は10ヶ月で43のユニークなクエストを提供するクエストシステムを分析し、80万のコンプリートを完了させた。
タスク完了と相関する要因についての洞察を提供する。
また,農業とボットの役割や,実際のユーザと自動スクリプトを区別する要因についても論じる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:45:27 GMT)
Borsuk-Ulam and Replicable Learning of Large-Margin Halfspaces [0.1] 我々は、リトルストーン次元が有界で、純粋にDP学習可能で高次元においても共有ランダム性は複製可能である大マージン半空間クラスについて研究する。
リストの複製性とグローバルな安定性は、境界のリトルストーン次元、DP-学習性、共有ランダムな複製性から従わない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:17:13 GMT)
Variational Quantum Eigensolver Approach to Prime Factorization on IBM's Noisy Intermediate Scale Quantum Computer [0.1] 提案アルゴリズムは変分量子固有解法 (VQE) に基づいており, 古典的手法を用いて与えられたハミルトニアン基底状態を求める。
本研究は,IBMの実量子コンピュータと古典シミュレータの両方において,提案手法の性能を評価する数値実験である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:09:49 GMT)
Euclid Quick Data Release (Q1). Active galactic nuclei identification using diffusion-based inpainting of Euclid VIS images [0.1] 拡散モデルは最近、日常の物体の現実的な画像を生成するために機械学習の文献で開発されている。
ソース選択やラベルを使わずに、100万のソースでトレーニングされた拡散モデルを作成します。
本研究では,各光源の中心画素を隠蔽し,拡散モデルに従って光を再構成することにより,中心光分布の予測を行う。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:27:16 GMT)
Benchmarking Large Language Models for Handwritten Text Recognition [0.1] MLLM(Multimodal Large Language Models)は、モデル固有のトレーニングを必要とせずに、さまざまな手書きスタイルを認識するための一般的なアプローチを提供する。
この研究は、トランスクリバスモデルに対する様々なプロプライエタリでオープンソースのLCMをベンチマークし、英語、フランス語、ドイツ語、イタリア語で書かれた近代的および歴史的データセットのパフォーマンスを評価した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:33:29 GMT)
Dynamics of Pseudoentanglement [0.0] 量子絡み合いのダイナミクスは、孤立多体系における熱平衡の出現を説明する上で中心的な役割を果たす。
近年の研究では、多体状態のアンサンブルを記述する擬似絡み合いの概念が導入されている。
量子系の熱平衡を達成するためには、どの程度の絡み合いが必要か?
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:44:44 GMT)
pyTTN: An Open Source Toolbox for Open and Closed System Quantum Dynamics Simulations Using Tree Tensor Networks [0.0] pyTTNは閉および開量子系の力学特性を評価するためのパッケージである。
pyTTNには、ゼロ温度と有限温度の計算を簡単に設定できるいくつかの機能が含まれている。
本報告では,24モードピラジンの光励起ダイナミクスの広範に使用されているベンチマークケースから,パッケージの一連の応用について述べる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:40:49 GMT)
Variational Quantum Annealing for Quantum Chemistry [0.0] VarQAは、量子アニールをサンプリング器として用いる電子構造理論のアルゴリズムである。
変分パラメータの空間を効率的に探索するための「デジタル化器」という戦略を導入する。
最大20ドルのスピン軌道を持つ分子の基底状態ポテンシャルエネルギー表面を評価することにより、VarQAの有効性を実証する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:48:52 GMT)
Using machine learning to map simulated noisy and laser-limited multidimensional spectra to molecular electronic couplings [0.0] 実験的な2次元スペクトルデータに関連する因子が、シミュレーションされた2DESスペクトルを分子間電子カップリングにマッピングするNNの能力にどのように影響するかを示す。
人による2DESデータの解析とは対照的に,ポンプパルスの帯域幅と中心周波数に制約された場合,NNの精度は大幅に向上する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:40:00 GMT)
USAM-Net: A U-Net-based Network for Improved Stereo Correspondence and Scene Depth Estimation using Features from a Pre-trained Image Segmentation network [0.0] 本稿では,立体画像入力とセマンティックセグメンテーションマップを統合し,深度推定性能を向上させる新しい畳み込みニューラルネットワークを提案する。
USAM-Netは、GD(Global difference)の3.61%、EPE(End-Point Error)の0.88など、優れたパフォーマンス指標を実現している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:29:02 GMT)
Two-qubit logic and teleportation with mobile spin qubits in silicon [0.0] 2つの電子スピン間の2量子動作を別々の移動電位ミニマで示す。
相互作用強度は空間分離により高度に調整可能であり,平均2量子ゲート忠実度は約99%に達することがわかった。
平均ゲート忠実度87%の空間分離量子ビット間の条件付き後量子状態テレポーテーションを実装した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:17:31 GMT)
Transport-Related Surface Detection with Machine Learning: Analyzing Temporal Trends in Madrid and Vienna [0.0] 本研究では,都市大気画像解析における機械学習の統合について検討する。
車や歩行者のインフラ面の特定と、歴史的傾向の分析に重点を置いている。
畳み込みアーキテクチャからトランスフォーマーベースの事前訓練モデルへの移行を強調している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:09:02 GMT)
Transfeminist AI Governance [0.0] 記事は、トランスフェミニストレンズを通して人工知能(AI)のガバナンスを再想像する。
トランスフェミニストとフェミニストの倫理理論に基づいて、トランスフェミニストのAIガバナンスへのアプローチを紹介します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:25:59 GMT)
Toward Scalable, Flexible Scene Flow for Point Clouds [0.0] シーンフロー推定(Scene flow Estimation)は、時間的に連続した観測の間の3次元運動を記述するタスクである。
この論文は、2つの重要な特性を持つシーンフロー推定器を構築するための基盤を構築することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:33:14 GMT)
Thermodynamics and Protection of Discrete-Time Crystals [0.0] 熱浴に結合した1次元スピン-1/2鎖における離散時間結晶(DTC)の詳細な熱力学解析を行った。
以上の結果から,DTC符号は環境騒音の存在下で必然的に崩壊することが明らかとなった。
周期的な測定手法によりデコヒーレンスの影響を緩和し, DTCの低調波振動を長期にわたって安定化させることができることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:49:07 GMT)
The localization problem: an antinomy between measurability and causal dynamics [0.0] 一粒子相対論的量子力学における局在問題は70年以上続いている。
この問題の中心には、局所化可能性と相対論的因果関係の根本的な対立がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:28:29 GMT)
The classical limit of quantum mechanics through coarse-grained measurements [0.0] 量子力学の古典的な限界に焦点をあて、粗い粒度の測定によるその出現に焦点を当てる。
このような測定で有効な古典運動学を厳格に導き出す。
我々は、粗粒度観測と、スロット内の古典的値のまわりの量子ハミルトンの線形近似に基づいて導出された力学が、古典的ハミルトン主義者によって効果的に記述されていることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:59:58 GMT)
The category of anyon sectors for non-abelian quantum double models [0.0] 無限体積の任意の有限ゲージ群に対する北エフの量子二重モデルについて検討する。
自己準同型をブレイドされたモノイダル圏に整理し、エノンの融合とブレイディング特性を捉える。
これは、非アーベル異性体を持つ2次元量子格子モデルのクラスに対する完全なDHR構造を初めて確立する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:00:30 GMT)
The Change You Want To Detect: Semantic Change Detection In Earth Observation With Hybrid Data Generation [0.0] 超高分解能(VHR)画像に基づく大規模なバイ時間変化検出は、地球観測に不可欠である。
ほとんどのアプローチでは、時間的および空間的適応に必要な汎用性は示さない。
我々は,大規模なハイブリッドな意味変化検出データセットを作成するための生成パイプラインHySCDGを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:32:37 GMT)
Tensor-Based Foundations of Ordinary Least Squares and Neural Network Regression Models [0.0] 本稿では,通常の最小二乗モデルとニューラルネットワーク回帰モデルの数学的発展に対する新しいアプローチを紹介する。
解析と基本的な行列計算を活用することにより、両方のモデルの理論的基礎は慎重に詳細化され、完全なアルゴリズム形式に拡張される。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:23:33 GMT)
Temporal Encoding Strategies for Energy Time Series Prediction [0.0] 本研究では,時系列データの周期的特徴に正弦波符号化を用いて予測モデルの精度を向上させる手法を提案する。
いくつかの統計的およびアンサンブル機械学習モデルは、提案した正弦波符号化を用いて、エネルギー需要データセットに基づいて訓練された。
結果、ルート平均正方形誤差は12.6%改善し、R2スコアは7.8%増加した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:36:53 GMT)
Technical Report: Aggregation on Learnable Manifolds for Asynchronous Federated Optimization [0.0] フェデレートラーニング(FL)において、クライアントモデルのサーバ側集約に対する最大の課題は、損失ランドスケープ幾何学と計算能力の両方において不均一性である。
本稿では,これらの問題に対処する新しい非同期FLフレームワークであるAsyncManifoldを提案する。
本提案では,一般形式の収束証明を伴い,非線形モード接続に沿って集約を行う概念実証である局所挙動の探索的研究を通じて動機づけた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:09:41 GMT)
Technical Report for the 5th CLVision Challenge at CVPR: Addressing the Class-Incremental with Repetition using Unlabeled Data -- 4th Place Solution [0.0] 本稿では,CVPRにおける第5回CLVisionチャレンジへのアプローチについて概説する。
CIRのシナリオでは、遭遇したクラスは後続の学習経験で再出現し、各経験は全体のクラス分布のサブセットのみを含む。
本手法は, 知識蒸留と擬似ラベル技術を利用して, 学習知識の保持に重点を置いている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:11:57 GMT)
TGV: Tabular Data-Guided Learning of Visual Cardiac Representations [0.0] 医用画像では、1回のスキャンで複数の拡張を行うのではなく、患者全体を異なる表現型と比較することが多い。
臨床的に関連のある表型データを用いて、異なる患者表現型を特定し、より有意義なペアを形成することを提案する。
短軸心MR画像と英国バイオバンクの臨床的特性を用いて,その強度を実証した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:49:55 GMT)
System of stochastic interacting wave functions that model quantum measurements [0.0] 我々は,初期状態が混合した量子系の連続的な測定を記述した非線形進化方程式のシステムを開発する。
応用に十分な条件下で,本システムに対する解の存在と特異性を証明する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:56:33 GMT)
Symmetry-protection Zeno phase transition in monitored lattice gauge theories [0.0] 保護ゲージ理論と不規則状態の間の測定速度によって引き起こされる急激な遷移の存在を示す。
我々の結果は、強い相互作用を持つ高制約量子系の散逸臨界性に光を当てた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:08:12 GMT)
Sustainable Deep Learning-Based Breast Lesion Segmentation: Impact of Breast Region Segmentation on Performance [0.0] 本研究の目的は,乳腺DCE-MRIにおける深層学習に基づく乳房病変の分節(BLS)に対する乳房領域分節(BRS)の影響を明らかにすることである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:42:33 GMT)
Stochastic inflation and entropy bound in de Sitter spacetime [0.0] 因果接続領域内のエントロピーは、その表面積によって境界づけられる。
インフレにおけるハッブルサイズの領域の絡み合いエントロピーの挙動を反映した,インフラトン場の確率分布のシャノンエントロピーを解析した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:37:12 GMT)
Squeezing via self-induced transparency in mercury-filled photonic crystal fibers [0.0] 水銀充填中空コアフォトニック結晶ファイバにおける自己誘起透過性を用いた超短パルスのスクイーズ化について検討した。
フェミオンおよびボゾン水銀同位体の両方を考慮すると, 室温でスクイーズを行うには極短フェムト秒パルスが必要である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:46:24 GMT)
Solving Dicke superradiance analytically: A compendium of methods [0.0] 我々はDicke超放射能問題に対するいくつかの解析的アプローチを提案する。
この問題に対処する複数の手法を探索し、任意の時間とスピン数で有効な解を得る。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:33:05 GMT)
Simulated Non-Abelian Statistics of Majorana Zero Modes from a Kitaev Lattice [0.0] 量子コンピュータ上でのマヨラナゼロモード(MZM)の非アベリア交換をシミュレートする。
スピンハミルトニアンの観点から、2と4のMZMを編むためのプロトコルを詳述する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:45:19 GMT)
Robustness bounds on the successful adversarial examples in probabilistic models: Implications from Gaussian processes [0.0] Adversarial Example (AE) は機械学習の攻撃手法であり、誤分類を引き起こすデータに知覚不能な摂動を加えることで構築される。
我々は, AE の摂動規範, GP で使用されるカーネル関数, トレーニングデータセットに異なるラベルを持つ最も近いペアの距離に依存する AE 攻撃の確率の新たな上限を証明した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:07:12 GMT)
Robust preparation of ground state phases under noisy imaginary time evolution [0.0] 我々は、様々なノイズモデルに基づく非単体ITT「回路」について考察する。
ノイズの存在下では, 基底状態秩序と相転移が持続することがわかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:50:12 GMT)
Robust Support Vector Machines for Imbalanced and Noisy Data via Benders Decomposition [0.0] 本研究では,SVM(Support Vector Machines)をクラス不均衡とノイズに対処するための新しい定式化を提案する。
制約違反の規模を罰する従来のSoft Margin SVMとは異なり、提案モデルは違反の数を定量化し、その頻度を最小化することを目的としている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:03:39 GMT)
Resource-Efficient Quantum Correlation Measurement: A Multicopy Neural Network Approach for Practical Applications [0.0] 本稿では,マルチコピー計測と人工ニューラルネットワークを組み合わせることで,必要な情報を削減する方法を提案する。
我々は, 脱分極チャネルを受けるベル状態の2量子量子相関の測定に成功した。
IBMQプロセッサ上でトランスモン量子ビットを用いて実験を行い,ベルの不等式と2量子絡み状態の負性について定量化した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:36:09 GMT)
Resource Estimation for Delayed Choice Quantum Entanglement Based Sneakernet Networks Using Neutral Atom qLDPC Memories [0.0] 我々は、遅延チョイス量子エンタングルメントスワップを介して、ユーザを接続する中心的なパーティを備えた量子通信ネットワークを設計する。
この手法を従来の曲面符号と比較し、qLDPC符号が資源効率と論理量子ビット数において優れたスケーリングを提供することを示した。
短期的な到達可能なパッチサイズでは、中~高忠実度相関が達成でき、大規模商用量子ネットワークへの道を歩むことができる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:43:25 GMT)
Reinforcement Learning Environment with LLM-Controlled Adversary in D&D 5th Edition Combat [0.0] この研究では、より小さなエージェントにDeep Q-Networks(DQN)を採用し、戦略的AI開発のためのテストベッドを作成している。
高度な言語モデルをRLフレームワークに統合し、戦略的意思決定プロセスの強化に成功しました。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:48:20 GMT)
Regulation of a continuously monitored quantum harmonic oscillator with inefficient detectors [0.0] 制御は、発振器の位置と運動量観測器の監視によって引き起こされるバックアクションを介して行われる。
検出器の測定強度の操作は、ターゲットのガウス量子状態の純度を調節する。
この結果から, 量子相関は定常状態における純度を高めることが示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 21:04:44 GMT)
Reducing Communication Overhead in Federated Learning for Network Anomaly Detection with Adaptive Client Selection [0.0] 連合学習(FL)における通信オーバーヘッドは,ネットワーク異常検出システムにおいて重要な課題となる。
本稿では,バッチサイズ最適化,クライアント選択,非同期更新を組み合わせた適応FLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:29:21 GMT)
Real-world validation of a multimodal LLM-powered pipeline for High-Accuracy Clinical Trial Patient Matching leveraging EHR data [0.0] 臨床試験における患者採用は、複雑な資格基準と労働集約性チャートのレビューによって妨げられている。
EHRから抽出した未処理文書を用いて,患者と医療のマッチングを自動化する統合フリーのLLMパイプラインを提案する。
提案手法は,(1)最も複雑な基準の評価を可能にする新たな推論-LLMパラダイム,(2)画像からテキストへの変換を欠くことなく医療記録を解釈する最新のLCMの視覚的能力,(3)効率的な医療記録検索のためのマルチモーダル埋め込みを活用する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:12:11 GMT)
Random (Un)rounding : Vulnerabilities in Discrete Attribute Disclosure in the 2021 Canadian Census [0.0] 2021年カナダの国勢調査では、独立して確率的に離散的な数値を丸め、独自の形でランダムなラウンドリングを採用している。
ラウンド前に、元のプライベート値を"アンラウンド"し、抽出することが可能であることを示す。
また、1000以上のプライベート属性の潜在的な値を高い精度で推測する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:10:32 GMT)
Quantum metrology using quantum combs and tensor network formalism [0.0] 探索されたチャネル間の任意の量子制御操作による最適な適応量子推定プロトコルを決定するための効率的なアルゴリズムを開発した。
本稿では,推定戦略のテンソルネットワーク表現を導入し,アルゴリズムの時間とメモリ消費を大幅に削減する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:37:46 GMT)
Provably optimal exact gate synthesis from a discrete gate set [0.0] 離散ゲートセットを用いた正確な回路合成法を提案する。
本手法は,一元行列で指定されたゲートの問題をSATインスタンスに変換する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:32:29 GMT)
Prompt engineering and framework: implementation to increase code reliability based guideline for LLMs [0.0] 生成されたコードスニペットの品質と正確性を改善するために,プロンプトテンプレートを導入する。
提案手法はPass@kメートル法においてゼロショット法やチェーン・オブ・ソート法(CoT)法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:33:08 GMT)
Project Jenkins: Turning Monkey Neural Data into Robotic Arm Movement, and Back [0.0] Project Jenkinsは、脳内の神経活動がロボットの動きにどのようにデコードされるかを探る。
我々は、デコード(脳信号をロボットアームの動きに変換する)と符号化(与えられた動きに対応する脳活動のシミュレーション)のモデルを開発する。
ユーザがリアルタイムでジョイスティックの動きから合成脳データを生成できるインタラクティブなWebコンソールを開発した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 03:12:17 GMT)
Preconditioned Block Encodings for Quantum Linear Systems [0.0] Matrixプリコンディショニングは、プリコンディショナー$P$で$A$を乗算することで$kappa$を減らすための、確立された古典的テクニックである。
ブロック符号化のためのプリコンディショナと2つの符号化手法を検討する。
計算流体力学(Computational fluid Dynamics)の実用行列を用いて, サブ正規化因子と条件数$kappa$に対する影響を解析した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:46:19 GMT)
Phases and propagation of closed p-brane [0.0] 我々は、高次大域対称性を持つ実効場理論の枠組みの中で、閉じた$p$-braneの位相と伝播を研究する。
運動項に対する(機能的な)平面波解を見つけ、ブレーンプロパゲータの経路積分表現を導出する。
これらの結果は極めて興味深いものであるが、ボルン=オッペンハイマー近似は点-粒子極限において無効であることも指摘している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:04:07 GMT)
Optimal Symbolic Construction of Matrix Product Operators and Tree Tensor Network Operators [0.0] 本研究では,行列積演算子(MPO)とツリーテンソルネットワーク演算子(TTNO)を構築するための改良されたフレームワークを提案する。
与えられた(ハミルトニアン)作用素は典型的には、テンソルネットワーク構造に変換できる「作用素弦の和」形式の既知の記号を持つ。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:29:36 GMT)
On three-body effects and nuclear fusion [0.0] 閉じ込められた系における励起量子状態の量子制御は核融合を誘導するのに有用かもしれない。
ここでは、これらの量子制御の難易度を%量子衝突状態と、2段階の非単体進化過程を用いた解について論じる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:26:26 GMT)
On the Need and Applicability of Causality for Fairness: A Unified Framework for AI Auditing and Legal Analysis [0.0] アルゴリズム的差別に対処する上での因果推論の重要性について考察する。
ランドマークの事例と規制の枠組みをレビューすることで、原因的主張の証明に固有の課題を説明する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:15:56 GMT)
Omnichain Web: The Universal Framework for Streamlined Chain Abstraction and Cross-Layer Interaction [0.0] DojimaのOmnichain Webは、ブロックチェーンの複雑さを抽象化し、Web2、Web3、AIをブリッジする普遍的なフレームワークを導入している。
OmniRollupはチェーン間のスケーラブルな実行を容易にする一方、Omni Sequencerはアトミックでセキュアなインテント処理を保証する。
線形マイクロチェーンは、AI駆動のトランザクション自動化を可能にし、Web3データストリームとシームレスに統合する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:22:05 GMT)
Nonstabilizerness of a Boundary Time Crystal [0.0] 境界時間結晶はその定常状態の絡み合いにおいて測定誘起相転移を示す。
我々は、異なる解法の下で魔法が不変であることを示します。
これらの発見は、オープンシステムにおける異なる量子リソースがどのように現れるかについての洞察を与える。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:21:22 GMT)
Natural Quantization of Neural Networks [0.0] そこで我々は,ニューロンが量子ビットに対応し,活性化関数が量子ゲートと測定によって実装される,標準的なニューラルネットワークの自然な量子化を提案する。
我々は、このアーキテクチャを標準MNISTデータセットのサブセットでベンチマークし、「量子優位」の仕組みを見つける。
提案した量子ニューラルネットワークは、商用データセット上の現在の量子コンピュータで容易に実現可能である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:57:11 GMT)
Multi-photon enhanced resolution for Superconducting Nanowire Single-Photon Detector-based Time-of-Flight lidar systems [0.0] 本稿では,導波管集積型SNSPDを用いたライダーシステムについて報告する。
単発計測では、低光子数に対して21$,$psの飛行時間信号のジッタが原因でミリモードの分解能が得られた。
マルチショット計測では、0.75$,$mmのサブミリレンジ精度を発見し、スキャン対象のさらなる表面情報を明らかにする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:47:16 GMT)
Measurement-based Simulation of Geometric Gates in Topological Qubits on NISQ Devices [0.0] マヨラナゼロモード(MZM)の断熱交換は、幾何学的に保護されたゲートの非普遍的な集合を可能にする。
マルチキュービットパウリパリティ測定によるMZMY接合の測定に基づくブレイディング
小型回路は、新しい測度に基づく幾何ゲートと、量子ハミルトニアンシミュレーションの計測に基づく実証を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:31:04 GMT)
Mapping AI Avant-Gardes in Time: Posthumanism, Transhumanism, Genhumanism [0.0] ポストヒューマニズムは我々の姿を変え、急進的な未来に属する。
トランスヒューマニズムは我々の姿を変え、過激な過去に対応する。
人類主義は我々の姿を変え、根本的現在に存在している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:03:39 GMT)
Manual Labelling Artificially Inflates Deep Learning-Based Segmentation Performance on RGB Images of Closed Canopy: Validation Using TLS [0.0] フィールドベースの森林在庫に依存する伝統的な方法は、労働集約的であり、空間的範囲に限られている。
我々は、地上レーザー走査(TLS)データから、ボレアルと地中海の森林のドローン画像の高忠実性検証ラベルを生成する。
我々は、広く使われている2つのディープラーニングITCセグメンテーションモデル、DeepForest (RetinaNet) と Detectree2 (マスクR-CNN) の性能を評価する。
両モデルとも, 樹冠木に制限された場合でも, 厳密なIoUしきい値において, 局所化精度が極めて低かった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:17:19 GMT)
Manifold Learning for Hyperspectral Images [0.0] 本論文では,一様多様体近似と投影を用いた隣接グラフの構築により,データセットトポロジを近似する手法を提案する。
このアプローチは、データ内の非線形相関を捕捉し、機械学習アルゴリズムの性能を大幅に改善する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:12:56 GMT)
Loophole-free argument for physicality of electromagnetic potential from causal structure of flux quantization [0.0] ヴァイドマンによる最近の研究は、アハロノフ・ボーム効果が局所場の観点から説明できることを示した。
本稿では,磁束量子化装置における因果構造に基づく電磁ポテンシャルの物理性を示す議論を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:52:28 GMT)
Investigating Cultural Dimensions and Technological Acceptance: The Adoption of Electronic Performance and Tracking Systems in Qatar's Football Sector [0.0] 本研究では,EPTS(Electronic Performance and Tracking Systems)導入における文化的・技術的要因の影響について検討した。
その結果,有効性,イノベーション受容性,パワー距離の低下がEPTS導入を著しく促進することが明らかとなった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:50:09 GMT)
Interpretability of Graph Neural Networks to Assert Effects of Global Change Drivers on Ecological Networks [0.0] ポリニネーターは、自然の生態系や人為的な景観において、植物の繁殖において重要な役割を担っている。
グローバルな変化要因が受粉に与える影響を主張するには、大規模な相互作用、気候、土地利用データが必要である。
グラフニューラルネットワーク(GNN)のような最近の機械学習手法は、そのようなデータセットの分析を可能にするが、それらの結果を解釈することは困難である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:04:53 GMT)
Inspecting the Representation Manifold of Differentially-Private Text [0.0] 様々なプライバシー予算にまたがるパラフレーズテキストの本質的な次元を推定する。
単語レベルの手法は表現多様体を著しく高める。
自己回帰生成は、表現空間をカスケードし拡大する不自然な単語選択からの歪みを伝播させることを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:36:58 GMT)
In-situ tunable interaction with an invertible sign between a fluxonium and a post cavity [0.0] 非線形性は、アシラリー2レベル量子ビットを介してキャビティモードに導入される。
アンシラの急激な加熱は、完全なフォールトトレラントなボソニッククビットへの進行を妨げている。
本研究は, 読み出し共振器を介してフラクソニウムアンシラに結合した3次元後空洞を含む, 量子情報処理のための新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:37:02 GMT)
How Well Can AI Build SD Models? [0.0] 本稿では,AI生成因果写像の評価のための2つの指標について紹介する。
我々は,11種類のLDMを,因果翻訳の能力とユーザの指示に適合する能力で試験した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:48:47 GMT)
High-purity and stable single-photon emission in bilayer WSe$_2$ via phonon-assisted excitation [0.0] フォノン支援励起は、他の量子エミッタプラットフォームで有望であることが示されている。
本研究は、WSe$$$量子エミッタの性能を最適化する上で、フォノンアシスト励起が重要であることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:19:15 GMT)
Geometric contribution to adiabatic amplification in non-Hermitian systems [0.0] 非エルミート系では、ベリー相は虚部を持ち、全波の強度の増幅や減衰に寄与する。
我々は、この経路独立が適切な対称性によって保証される非エルミートハミルトニアンのクラスを列挙する。
この結果から, 断熱過程下での波動関数のノルムの変化を観察することにより, ピーターマン因子を実験的に得ることができる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 05:00:17 GMT)
From Transcripts to Insights: Uncovering Corporate Risks Using Generative AI [0.0] 我々は、政治的、気候的、AI関連のリスクに曝露する、しっかりとしたレベルのリスク対策を開発し、検証する。
GPT 3.5 モデルを用いてリスクサマリーとアセスメントを生成することにより,GPT ベースの尺度が重要な情報内容を有することを示す。
また、生成的AIは、近年の四半期で急増しているAIリスクのような、新たなリスクを検出するのに効果的であることもわかっています。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:25:10 GMT)
From Autonomous Agents to Integrated Systems, A New Paradigm: Orchestrated Distributed Intelligence [0.0] オーケストレーション分散インテリジェンス(ODI)の概念を紹介する。
ODIはAIを、人間の専門知識と連動して働く結束的で組織化されたネットワークとして再認識する。
我々の研究は、重要な理論的意味を概説し、将来の研究と企業イノベーションのための実践的なロードマップを提示します。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 02:01:23 GMT)
Foundation models may exhibit staged progression in novel CBRN threat disclosure [0.0] 基礎モデルが新しい化学、生物、放射線、核(CBRN)の脅威を専門家に開示できる範囲は不明確である。
私は、新しい破滅的な生物脅威を説明する出版物によって提示されるユニークな機会を活用して、小さな制御された研究を行ないました。
ミラーE. coliの放出効果の予測を専門とする大学院生は,ルーリックグレードの精度に有意な差は認められなかった。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:08:01 GMT)
Fault-Tolerant Optical Quantum Computation using 3D Hybrid Cluster States [0.0] 異なる物理系や自由度のハイブリッド化は、実用的で普遍的でスケーラブルでフォールトトレラントな量子計算(FTQC)を実現する上で大きな利点をもたらす
本稿では,離散可変(DV)と連続可変(CV)の双方の強度を利用して,低スケズ閾値の光FTQC方式を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:35:50 GMT)
Exploring Visual Complaints through a test battery in Acquired Brain Injury Patients: A Detailed Analysis of the DiaNAH Dataset [0.0] 本研究は,ABI患者に対するDiaNAHデータセットを用いた視覚障害の訴えについて検討した。
患者は8種類の視覚症状を捉えたCVSアンケートを完了した。
データ不足の課題に対処するため、データ計算に自動機械学習(AutoML)アプローチが採用された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:59:44 GMT)
Exploring Large Language Models for Word Games:Who is the Spy? [0.0] 本研究では,大言語モデル(LLM)がワードゲームに効果的に関与できるかを考察する。
我々は,ロールワードの推測やアイデンティティの曖昧化といったタスクにおいて,LLMの優れたパフォーマンスを実現するためのChain-of-Thought(CoT)ベースのスケジューリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:13:02 GMT)
Experimental realization of entanglement between two Brownian particles [0.0] 座標と粗粒度速度の不確実性関係は、量子絡み合いに似た現象を引き起こす。
相互接続された粒子は、ブラウン量子にインスパイアされた古典的相関の絡み合いを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:23:05 GMT)
Exceptional Eigenvalues and Braak's Conjecture in the Quantum Rabi Model [0.0] 量子ラビモデルのスペクトルは、数値的に計算される必要がある正規固有値と例外固有値として分離することができる。
我々は、量子ラビスペクトルの分布に関するブラック予想を拡張する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:34:50 GMT)
Entanglement between dependent degrees of freedom: Quasiparticle correlations [0.0] 本研究では,自由度に依存する文脈における絡み合いの概念について考察する。
物理的に関係のある応用として、準粒子記述のための量子相関特性を特に研究する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:41:50 GMT)
Enhancing Layer Attention Efficiency through Pruning Redundant Retrievals [0.0] 隣接層間のKL(Kulback-Leibler)のばらつきを利用して冗長性を定量化する手法を提案する。
また、冗長層を正確に識別し、スキップする拡張ベータ量子マッピング(EBQM)手法も導入する。
提案したELAアーキテクチャは,トレーニング効率と全体的なパフォーマンスを両立させ,トレーニング時間の30%削減を実現している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:21:10 GMT)
Enhanced Vascular Flow Simulations in Aortic Aneurysm via Physics-Informed Neural Networks and Deep Operator Networks [0.0] PINN,Deep Operator Networks(DeepONets)およびそれらのPhysical-Informed Extension(PI-DeepONets)について検討した。
我々は3D Navier-Stokes方程式を統合することにより、AAAの特定のユースケースに対処するアプローチに適応する。
それぞれのアプローチの利点と制限は、一連の関連するアプリケーションケースを通して強調されます。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:38:52 GMT)
Engineering negative stress-energy densities with quantum energy teleportation [0.0] 我々は、エネルギー条件に反し、負の局所的な応力-エネルギー密度を持つ場の状態を生成する。
このプロトコルは、量子利子予想を飽和させる方法でスケールするという意味で最適であることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 00:59:00 GMT)
Emergent coding phases and hardware-tailored quantum codes [0.0] 特定のハードウェアアプリケーションに適した量子コードを見つけることは、量子エラー訂正の中心である。
Z$符号に対して、最適符号に劣る2つの実用的な誤り訂正手順を提供し、位相図を質的に変更する。
現在のノイズの多いデバイスに我々のアプローチを適用すれば、堅牢な計算と通信のための量子コードを構築する体系的な方法が得られるでしょう。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:57:12 GMT)
ELTEX: A Framework for Domain-Driven Synthetic Data Generation [0.0] 特殊なドメインで高品質な合成トレーニングデータを生成するためのフレームワークである ELTEX を提案する。
ブロックチェーン関連サイバー攻撃検出におけるELTEXの有効性を示す。
我々の研究は、ドメイン駆動の合成データ生成が、リソース効率の良いモデルと特定のドメインにおけるより大きなアーキテクチャの間の性能ギャップを効果的に橋渡しできることを実証している。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:46:54 GMT)
Direct comparison of stochastic driven nonlinear dynamical systems for combinatorial optimizations [0.0] 組合せ最適化問題は、産業応用において至るところに存在している。
過去数十年間、Isingタイプの問題解決ツールの開発に精力的に取り組んできた。
量子システムと古典システムの制御と操作の最近の進歩は、新しい計算パラダイムを可能にしている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:08:55 GMT)
Direct Analysis of Zero-Noise Extrapolation: Polynomial Methods, Error Bounds, and Simultaneous Physical-Algorithmic Error Mitigation [0.0] ゼロノイズ外挿法(ゼロノイズ外挿法、ZNE)は、人工的に回路ノイズを増幅し、結果をノイズのない回路に外挿する量子誤差緩和法である。
本稿では、これらの課題を包括的に分析し、誤りを定量化するバイアスと分散を提示する。
本稿では,時間ステップサイズと雑音レベルを同時スケーリングすることで,回路とアルゴリズムの誤りを同時に軽減する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 23:54:28 GMT)
Design of Quantum Stream Cipher: Part-I -Lifting the Shannon Impossibility Theorem- [0.0] 本論文は,50年の友情を記念して,晩年のH.P.ユアン教授に捧げるものである。
彼は量子ストリーム暗号の概念を考案し、従来の暗号とは全く異なる概念に基づいて設計されている。
これは、数学的暗号の暗号文を量子ノイズで隠蔽し、あらゆる暗号において前例のない情報理論上のセキュリティを達成することに基づいている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 04:02:08 GMT)
DCAT: Dual Cross-Attention Fusion for Disease Classification in Radiological Images with Uncertainty Estimation [0.0] 本稿では,医用画像解析のための新しい二重対向核融合モデルを提案する。
機能統合と解釈可能性における重要な課題に対処する。
提案されたモデルはAUCの99.75%、100%、99.93%、98.69%、AUPRの99.81%、100%、99.97%、96.36%をそれぞれコビッド19、結核、肺炎胸部X線画像、網膜CT画像で達成した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:18:48 GMT)
Cyber Threats in Financial Transactions -- Addressing the Dual Challenge of AI and Quantum Computing [0.0] 金融セクターは、人工知能(AI)と量子コンピューティングの出現によって増大するサイバー脅威に直面している。
レポートはこれらの脅威、関連するフレームワーク、量子暗号のような可能性のある対策を分析します。
金融業界はサイバーセキュリティに積極的に適応的なアプローチを採用しなければならない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:16:27 GMT)
Crosscap states with tunable entanglement as exact eigenstates of local spin chain Hamiltonians [0.0] スピン鎖ハミルトニアンは特別なゼロエネルギー「クロスキャップ」固有状態を認める。
我々は, 対足動物対が最大でない, 調整可能な絡み合いを持つことを許すことにより, 状態を一般化する。
我々は、サブボリューム法的な絡み合いを持つ正確なゼロモードの族を導出する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:53:22 GMT)
Cooling strongly self-organized particles using adiabatic demagnetization [0.0] レーザー駆動の損失キャビティモードに結合した偏光性粒子のダイナミクスについて検討した。
2段階の冷却プロトコルを用いて、粒子の運動エネルギーをリコイルエネルギーに還元することができることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:07:08 GMT)
Control, Optimal Transport and Neural Differential Equations in Supervised Learning [0.0] Ruiz-Balet and Zuazua (SIAM ReVIEW 2023)
著者は制御理論、最適輸送理論、および神経微分方程式の間の関係に関してオープンな問題を提起する。
本稿では,限界における真の動的最適輸送に収束する神経微分方程式の構成を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:04:36 GMT)
Complex-Phase Extensions of Szegedy Quantum Walk on Graphs [0.0] この研究は、リンク位相と局所任意位相回転(APR)を組み込んだグラフ相Szegedyの量子ウォークを導入する。
我々はこれらの進歩に量子回路を適応させる方法を示し、計算実用性を保証する位相パターンを実現する。
我々の発見は、より汎用的で強力な量子コンピューティングパラダイムへの道のりを照らしている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:28:37 GMT)
Complete classification of integrability and non-integrability of S=1/2 spin chains with symmetric next-nearest-neighbor interaction [0.0] S=1/2量子スピン鎖はシフト不変かつ逆対称な次アネレスト近傍相互作用を持つ。
上記のスピン系のクラスにおける可積分性と非可積分性を分類する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:23:22 GMT)
Combining Static Analysis Techniques for Program Comprehension Using Slicito [0.0] この記事では、開発者がVisual StudioのC#コードでこのような調査を行えるツールであるSLICITOの新バージョンを提案する。
Moldable DevelopmentにインスパイアされたSLICITOは、プログラム分析と視覚化ビルディングブロックのセットを提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 20:10:57 GMT)
Classification of locality preserving symmetries on spin chains [0.0] 量子スピン鎖上の自己同型(量子セルオートマトン)を保存する局所性による有限群$G$の作用を考える。
そのような対称性の異常性は、対称性の安定同値類群とコホモロジー群 $H3(G,U(1))$ の間の同型であることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 10:38:57 GMT)
ChonkyBFT: Consensus Protocol of ZKsync [0.0] ChonkyBFT(チョンキーBFT)は、ZKsyncシステムで使用される、部分的に同期されたビザンチンのフォールトトレラントコンセンサスプロトコルである。
委員会ベースのプロトコルであり、投票は1ラウンドのみであり、単一スロットの終端性、二次通信、n >= 5f + 1 の耐障害性がある。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:17:54 GMT)
ChatGPT or A Silent Everywhere Helper: A Survey of Large Language Models [0.0] Chat Generative Pre-trained Transformer (ChatGPT)は、その高度な機能と広範なアプリケーションに対する顕著な例である。
この調査は、ChatGPTの包括的な分析を提供し、アーキテクチャ、トレーニングプロセス、機能について調査する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:55:08 GMT)
Bridging the Gap: Fusing CNNs and Transformers to Decode the Elegance of Handwritten Arabic Script [0.0] 手書きのアラビア文字認識は、スクリプトの動的文字形式と文脈変化のために難しい作業である。
本稿では、畳み込みニューラルネットワーク(CNN)とTransformerベースのアーキテクチャを組み合わせて、これらの複雑さに対処するハイブリッドアプローチを提案する。
我々のアンサンブルはIFN/ENITデータセットで顕著な性能を示し、文字分類では96.38%、位置分類では97.22%の精度である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 09:20:42 GMT)
Bloated Disclosures: Can ChatGPT Help Investors Process Information? [0.0] ChatGPTのような生成AIツールは、投資家が情報を処理する方法を根本的に変えることができる。
我々は、これらのツールが、株式市場を実験室として利用した複雑な企業情報開示を要約する上での経済的有用性について検討する。
肥大化した開示は、価格効率の低下や情報非対称性の上昇など、資本市場の悪影響と関連していることを示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 16:22:59 GMT)
Beyond the semiclassical approximation in atom interferometry [0.0] 弱無調波トラップにおける原子干渉計の位相シフトを評価するための量子摂動的アプローチについて述べる。
半古典的近似の形式は、アンハーモニック摂動において一階に有効であることが判明した。
位置座標におけるパワー3から6の1次元摂動の解析結果を提供する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:11:28 GMT)
Automated Non-Functional Requirements Generation in Software Engineering with Large Language Models: A Comparative Study [0.0] 非機能要件(NFR)はしばしば見過ごされ、識別が難しく、ソフトウェアの品質に影響を与えます。
我々は、LLM(Large Language Models)を活用して、機能要件(FR)から品質駆動型NFRを導出するフレームワークを開発した。
Denoベースのパイプライン内で独自のプロンプト技術を使用して、システムは機能要件ごとに関連する品質特性を特定し、対応するNFRを生成する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:23:22 GMT)
Application of linear regression method to the deep reinforcement learning in continuous action cases [0.0] LeineらによりLast Squares Deep Q Network (LS-DQN)法が提案された。
本稿では,この制限に対応するために,Double Least Squares Deep Deterministic Policy Gradient (DLS-DDPG)法を提案する。
MuJoCo環境での数値実験により、少なくともいくつかのタスクにおいてLR更新により性能が向上したことが示された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 08:10:54 GMT)
Analytical solution of the open dispersive Jaynes-Cummings model and perturbative analytical solution of the open quantum Rabi model [0.0] ジャイアンス・カミングスと量子ラビモデルは空洞と回路量子力学の基礎である。
実験でよく見られるシナリオは、ボソニックモードが外部の放散熱浴と相互作用するときに生じる。
開分散Jaynes-Cummingsモデルに対するリンドブラッドマスター方程式の新しい解析解を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 12:18:45 GMT)
Adapting tree-based multiple imputation methods for multi-level data? A simulation study [0.0] 木に基づく計算法は、観測間の独立を暗黙的に仮定する。
オルタナティブツリーベースのアプローチは、個々のレベルのデータに対して有望であるが、階層的な文脈では探索されていない。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 22:03:47 GMT)
Accurate, transferable, and verifiable machine-learned interatomic potentials for layered materials [0.0] ツイストされた層状バンダーワールス材料は、しばしば、非ツイストの材料に欠如しているユニークな電子的および光学的特性を示す。
本稿では、層内相互作用と層間相互作用を分離する、マシン学習型原子間ポテンシャルとデータセットキュレーション手法を提案する。
本手法は,様々な層内相互作用モデルや層間相互作用モデルとシームレスに統合し,モワール材料の計算的緩和を可能にする。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:14:02 GMT)
Accurate Automatic 3D Annotation of Traffic Lights and Signs for Autonomous Driving [0.0] 交通信号や道路標識などの交通管理対象の3D検出は、自動運転車にとって不可欠である。
本稿では,信号機や標識の3次元バウンディングボックスアノテーションを自動生成する手法を提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 07:54:57 GMT)
Acceleration Noise Induced Decoherence in Stern-Gerlach Interferometers for Gravity Experiments [0.0] 加速度ノイズは、Stern-Gerlach干渉計のデコヒーレンス問題を引き起こす可能性がある。
本稿では,SGIの解析的時間進化演算子に基づいて,これらのデコヒーレンス機構を理論的に研究する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:56:48 GMT)
AI-driven control of bioelectric signalling for real-time topological reorganization of cells [0.0] 生体電気信号は、細胞の分化、増殖、アポトーシス、組織の形態形成を含む重要な過程を制御するのに重要な役割を果たしている。
近年の研究では、これらのシグナルを調節して組織再生を制御できることが示されている。
本研究の目的は、生体電気信号を用いた新しいバイオメディカル・バイオエンジニアリング応用の開発である。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:56:52 GMT)
AI and Deep Learning for Automated Segmentation and Quantitative Measurement of Spinal Structures in MRI [0.0] 本研究では,MRIスキャンにおける重要な脊髄構造をセグメント化し,計測する自律型AIシステムの開発を行う。
目標は、臨床の作業量を削減し、診断の整合性を高め、評価を改善することである。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:18:20 GMT)
AEJIM: A Real-Time AI Framework for Crowdsourced, Transparent, and Ethical Environmental Hazard Detection and Reporting [0.0] 本稿では,AI環境ジャーナリズム統合モデル(AEJIM)を紹介する。
リアルタイムのハザード検出、クラウドソースによるバリデーション、AI駆動のレポートを組み合わせたフレームワークである。
AEJIMは環境リスクレポートのスピードと精度を向上し、従来の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 19:00:24 GMT)
A quantum monomer-dimer model on Penrose tilings [0.0] 準結晶ペンローズタイリングの最大二量体被覆空間における量子単量体-二量体モデルを定義する。
ダイマーダイマーとバイソンバイソン相関器はともに指数関数的に距離で崩壊することがわかった。
ゲージ理論は閉じ込められた位相にあり、これは系が秩序な位相にあることを意味する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:00:00 GMT)
A heralded single-photon source implemented with second-order nonlinear photonic crystals [0.0] 本研究では, 2次非線形フォトニック結晶を用いた一光子源の実装について検討する。
本研究では,この1光子源の効率と2次強度相関関数 $g(2)(0)$ を評価する。
具体的な例として、非線形媒質がニオブ酸リチウム$mboxLiNbO_3$であり、入射信号の周波数が1014ドルHzである場合を考える。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:01:59 GMT)
A discontinuity-capturing neural network with categorical embedding and its application to anisotropic elliptic interface problems [0.0] 本研究では,予測精度の高い単一ニューラルネットワークにより,片方向の滑らかな関数を近似可能であることを示す。
次に、提案したネットワークモデルを用いて、異方性楕円型インタフェースの問題を解決する。
提案したニューラルネットワークモデルは, 単純かつ浅い構造であるにもかかわらず, 従来のグリッドベース数値法と同等の効率と精度を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 17:21:51 GMT)
A Semantic and Clean-label Backdoor Attack against Graph Convolutional Networks [0.0] グラフ畳み込みネットワーク(GCN)は,ノード分類やグラフ分類などのグラフ構造化タスクにおいて優れた性能を示した。
最近の研究では、GCNはバックドア攻撃と呼ばれる新しいタイプの脅威に弱いことが示されている。
クリーンラベルバックドア攻撃とセマンティックバックドア攻撃はDeep Neural Networks(DNN)に対する2つの新たなバックドア攻撃である
論文参考訳(メタデータ) (Wed, 19 Mar 2025 06:04:55 GMT)
A Scalable Game-Theoretic Approach for Selecting Security Controls from Standardized Catalogues [0.0] 本稿では,攻撃者のプロファイルと設定した予算に基づいて,セキュリティ制御の効果的な組み合わせを選択するゲーム理論的手法を提案する。
我々は,カナダの標準制御カタログである ITSG-33 を用いた,架空のカナダ軍システムへのアプローチを適用した。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 18:26:19 GMT)
A Personalized Data-Driven Generative Model of Human Motion [0.0] 本研究では,個人固有の特徴を捉えたオリジナル動作を生成するための,完全なデータ駆動型アプローチを提案する。
我々のモデルは、訓練した個体の速度分布と振幅エンベロープを効果的に再現し、他の個体と異なる。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 14:03:20 GMT)
A Peek Behind the Curtain: Using Step-Around Prompt Engineering to Identify Bias and Misinformation in GenAI Models [0.0] 我々は、AIシステムに意図しないバイアスと誤情報を導入するインターネットソーストレーニングデータについて論じる。
我々は、研究ツールとセキュリティの脅威の両方として、その二重性を認めながら、潜在的な脆弱性を特定する上で、ステップアラウンドプロンプトが重要な役割を担っていると論じている。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 13:47:28 GMT)
A Foundational individual Mobility Prediction Model based on Open-Source Large Language Models [0.0] 大規模言語モデル(LLM)はドメイン固有のタスクに広く適用されている。
本稿では,基盤となるオープンソースのLCMに基づくモビリティ予測モデルをトレーニングするための,統一的な微調整フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 15:08:37 GMT)
A Foundational Theory for Decentralized Sensory Learning [0.0] 感覚活動の最小値がネットワークの完全報酬信号であることを示す。
この方法では、地球上で最初期の単細胞生物がすでに存在していた可能性が示唆された。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:44:58 GMT)
A Distribution Semantics for Probabilistic Term Rewriting [0.0] 我々は、よく知られた計算形式主義である項書き換えに焦点を当てる。
従来の書き換え規則と確率を組み合わせたシステムを考える。
与えられた削減のために一連の「説明」を計算する方法を示す。
論文参考訳(メタデータ) (Wed, 19 Mar 2025 11:03:59 GMT)