SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines [118.8] 大規模言語モデル(LLM)は、数学、物理学、計算機科学などの学問分野において顕著な熟練性を示している。
しかしながら、人間の知識は200以上の専門分野を含み、既存のベンチマークの範囲をはるかに超えている。
285分野にわたる大学院レベルの知識と推論能力を評価するベンチマークであるSuperGPQAを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:01:09 GMT)
Liquid: Language Models are Scalable and Unified Multi-modal Generators [112.7] Liquidは視覚的理解と生成をシームレスに統合する自動回帰生成パラダイムである。
従来のマルチモーダルな大言語モデル(MLLM)とは異なり、Liquidは単一の大言語モデルを用いてこの統合を実現する。
初めてLiquidは、ビジュアルタスクと言語タスクの統一トレーニングによって必然的にパフォーマンスが低下する、スケーリングの法則を明らかにした。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:08:51 GMT)
LUME: LLM Unlearning with Multitask Evaluations [106.8] Unlearningは、大規模な言語モデル(LLM)から著作権のある、機密性の高い、あるいはプライベートなコンテンツを、完全に再トレーニングすることなく削除することを目的としている。
本研究では,(1)未学習の創造的短編小説,(2)機密情報付き未学習の合成バイオグラフィー,(3)公開バイオグラフィーのコレクションの3つのタスクを特徴とするマルチタスク・アンラーニング・ベンチマーク(LUME)を開発した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:41:34 GMT)
Implicit Search via Discrete Diffusion: A Study on Chess [104.7] 本稿では,DiffuSearchを提案する。DiffuSearchは,離散拡散モデルを用いて未来を探索し,テキストをシンプルに検索するモデルである。
DiffuSearchをChessという古典的なボードゲームでインスタンス化する。
DiffuSearchは、検索不要と明示的な検索強化ポリシーの両方で優れていることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:25:15 GMT)
Dynamic Parallel Tree Search for Efficient LLM Reasoning [102.2] Tree of Thoughts (ToT) は大規模言語モデル(LLM)推論を強化し、分散木としての問題解決を構造化する。
推論における推論経路を動的に最適化することを目的とした,新しい並列化フレームワークであるDynamic Parallel Tree Search (DPTS)を提案する。
Qwen-2.5とLlama-3のMath500とGSM8Kデータセットによる実験では、DPTSは平均で2-4倍効率が向上した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:39:06 GMT)
Fine-Tuning Vision-Language-Action Models: Optimizing Speed and Success [100.2] 視覚言語アクションモデル(VLA)のための最適化された微調整レシピを提案する。
われわれのレシピはOpenVLAの4つのタスクスイートの平均成功率を76.5%から97.1%に引き上げ、アクション生成のスループットを26$times$に向上させた。
実世界の評価において、我々の微調整のレシピにより、OpenVLAはバイマガルALOHAロボット上でデクスタラスで高周波な制御タスクをうまく実行することができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:30:29 GMT)
Protecting multimodal large language models against misleading visualizations [94.7] そこで本研究では,MLLMの性能向上のための6つの推論時間手法を提案する。
この方法は、誤解を招く可視化の性能を15.4から19.6ポイント向上させる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:22:34 GMT)
PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction [94.1] 大きな視覚言語モデル(LVLM)では、画像は豊富な情報を運ぶ入力として機能する。
以前のアプローチでは、LVLMの初期レイヤの前後で画像トークンの数を減らそうとしていた。
本稿では,LVLMの視覚的冗長性低減戦略であるPraamidDropを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:16:33 GMT)
FlexVAR: Flexible Visual Autoregressive Modeling without Residual Prediction [91.1] この研究は、視覚自己回帰モデリングにおける残差予測パラダイムに挑戦する。
新しいフレキシブルなVisual AutoRegressiveイメージ生成パラダイムを提供する。
このシンプルで直感的なアプローチは、視覚分布を素早く学習し、生成プロセスをより柔軟で適応可能にします。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:39:17 GMT)
FINEREASON: Evaluating and Improving LLMs' Deliberate Reasoning through Reflective Puzzle Solving [90.9] FINEREASONは、大規模言語モデルの推論能力を評価するための論理パズルベンチマークである。
状態チェックと状態遷移という2つのタスクを導入し、モデルが現在の状況をどのように評価するかを総合的に評価し、次の動きを計画する。
状態チェックと遷移データに基づいてトレーニングされたモデルでは、GSM8Kで最大5.1%の精度で数学推論が向上することを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:23:25 GMT)
Oryx MLLM: On-Demand Spatial-Temporal Understanding at Arbitrary Resolution [90.3] 画像,ビデオ,3Dシーンの空間的時間的理解のための統合マルチモーダルアーキテクチャであるOryxを提案する。
Oryxは任意の空間サイズと時間長の視覚入力をシームレスかつ効率的に処理するオンデマンドソリューションを提供する。
デザイン機能により、Oryxは低解像度で高圧縮でビデオのような非常に長い視覚的コンテキストに対応できる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:09:46 GMT)
OpenTAD: A Unified Framework and Comprehensive Study of Temporal Action Detection [86.3] 時間的行動検出(TAD)は、人間の行動を特定し、その時間的境界を動画内でローカライズすることを目的とした、基本的なビデオ理解タスクである。
我々は16種類のTADメソッドと9つの標準データセットをモジュール化したTADフレームワークであるtextbfOpenTADを提案する。
1つのモジュールを別の設計で置き換える、フィーチャベースのTADモデルをエンドツーエンドモードでトレーニングする、あるいは2つのモジュールを切り替える、という最小限の労力が必要になります。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:32:27 GMT)
LongSafety: Enhance Safety for Long-Context LLMs [85.5] 長文言語モデル(LLM)のための安全アライメントデータセットである textbfLongSafety を導入する。
実験により,LongSafetyを用いたトレーニングは,短文安全性を向上し,汎用性を保ちながら,長文安全性を向上できることが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:08:46 GMT)
3D-AffordanceLLM: Harnessing Large Language Models for Open-Vocabulary Affordance Detection in 3D Worlds [84.7] 3D Affordance Detectionは、様々なロボットタスクの幅広い応用において難しい問題である。
我々は従来の割当検出パラダイムをテキスト推論改善(IRAS)タスクに再構成する。
本研究では,3次元オープンシーンにおけるアベイランス検出のためのフレームワークである3D-ADLLMを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:29:44 GMT)
How Far Are We on the Decision-Making of LLMs? Evaluating LLMs' Gaming Ability in Multi-Agent Environments [83.8] GAMA($gamma$)-Benchは、マルチエージェント環境における大規模言語モデルのゲーム能力を評価するための新しいフレームワークである。
$gamma$-Benchは8つの古典ゲーム理論シナリオと、LSMの性能を評価するために特別に設計された動的スコアリングスキームを含んでいる。
以上の結果から, GPT-3.5は強い強靭性を示すが, 一般化性は限定的であり, Chain-of-Thoughtのような手法で拡張可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:57:52 GMT)
Ready-to-React: Online Reaction Policy for Two-Character Interaction Generation [82.7] 本稿では,過去観測された動きに基づいて次のキャラクターのポーズを生成するためのオンライン反応ポリシーであるReady-to-Reactを提案する。
各キャラクターは独自の反応ポリシーを「脳」として持っており、実際の人間のようにストリーミングで対話することができる。
われわれのアプローチはスパース信号で制御でき、VRや他のオンラインインタラクティブ環境にも適している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:40:30 GMT)
C-Drag: Chain-of-Thought Driven Motion Controller for Video Generation [81.4] トラジェクティブに基づくモーションコントロールは、制御可能なビデオ生成のための直感的で効率的なアプローチとして登場した。
我々はC-Dragという制御可能なビデオ生成のためのチェーン・オブ・ソート型モーションコントローラを提案する。
本手法は,物体認識モジュールとChain-of-Thoughtベースの動作推論モジュールを含む。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:21:03 GMT)
InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.1] 3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:15:49 GMT)
Mixture of Structural-and-Textual Retrieval over Text-rich Graph Knowledge Bases [78.6] テキストリッチなグラフ知識ベース(TG-KB)は、テキストおよび構造的知識を提供することで、クエリに応答する上でますます重要になっている。
本研究では,これら2種類の知識を計画・推論・組織化フレームワークを用いて検索するための構造・テキスト検索(MoR)の混合を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:42:52 GMT)
ExACT: Teaching AI Agents to Explore with Reflective-MCTS and Exploratory Learning [78.4] ExACTは、エージェントアプリケーションのためのo1のようなモデルを構築するために、テスト時間検索と自己学習を組み合わせるアプローチである。
リフレクティブモンテカルロ木探索(Reflective Monte Carlo Tree Search, R-MCTS)は、AIエージェントがその場で意思決定空間を探索する能力を高めるために設計された新しいテストタイムアルゴリズムである。
次に,探索学習(Exploratory Learning)という,外部探索アルゴリズムに頼らずに,エージェントに推論時間での探索を教える新しい学習戦略を紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:13:19 GMT)
SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model [77.9] 本稿では,SPA-VL と呼ばれる視覚言語モデルのための安全優先アライメントデータセットを提案する。
SPA-VLは6つの有害ドメイン、13のカテゴリ、53のサブカテゴリをカバーし、クエクション、画像、選択された応答、拒否された応答)の4倍体の100,788のサンプルを含んでいる。
実験により、SPA-VLデータセット上のアライメント技術でトレーニングされたモデルは、コア機能を維持しながら、無害性と有用性を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:18:50 GMT)
Computing Game Symmetries and Equilibria That Respect Them [77.7] ゲームにおける対称性の同定と利用の計算について検討する。
ゲーム対称性とグラフ自己同型の間には強い関係がある。
与えられた対称性の集合を尊重するナッシュ均衡を求めることは、ブラウワーの不動点や勾配降下問題と全く同じほど難しいことを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:47:39 GMT)
On Benchmarking Human-Like Intelligence in Machines [77.6] 現在のAI評価パラダイムは、人間のような認知能力を評価するには不十分である、と我々は主張する。
人為的なラベルの欠如、人間の反応の多様性と不確実性の表現の不適切な表現、単純で生態学的に無意味なタスクへの依存。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:21:36 GMT)
EchoScene: Indoor Scene Generation via Information Echo over Scene Graph Diffusion [77.1] シーングラフ上に3次元屋内シーンを生成する対話型かつ制御可能な生成モデルであるEchoSceneを提案する。
既存の手法では、様々なノード数、複数のエッジの組み合わせ、マニピュレータによるノードエッジ操作によるシーングラフの処理に苦労している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:28:21 GMT)
LeanProgress: Guiding Search for Neural Theorem Proving via Proof Progress Prediction [74.8] 証明の進捗を予測する手法であるLeanProgressを紹介します。
実験の結果、LeanProgressは全体の予測精度が75.1%に達することがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:26:11 GMT)
Open3DTrack: Towards Open-Vocabulary 3D Multi-Object Tracking [73.1] オープンな語彙的3Dトラッキングを導入し、3Dトラッキングの範囲を広げて、定義済みのカテゴリを超えてオブジェクトを含める。
本稿では,オープン語彙機能を3次元トラッキングフレームワークに統合し,オブジェクトクラスが見えないように一般化する手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:17:18 GMT)
Thinking Slow, Fast: Scaling Inference Compute with Distilled Reasoners [72.4] 近年の進歩により、大規模言語モデル(LLM)の性能は、テスト時に計算資源をスケーリングすることで大幅に向上することが示されている。
複雑性が低いモデルは、より優れた生成スループットを活用して、固定された計算予算のために同様の大きさのトランスフォーマーを上回りますか?
この問題に対処し、強い四分法的推論器の欠如を克服するために、事前訓練された変換器から純およびハイブリッドのマンバモデルを蒸留する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:08:16 GMT)
NExT-Mol: 3D Diffusion Meets 1D Language Modeling for 3D Molecule Generation [72.2] NExT-Mol: 3D Diffusion Meets 1D Language Modeling for 3D Molecule Generationを提案する。
NExT-Molは1D分子生成のために広範囲に事前訓練された分子LMを使用し、その後、生成された分子の3Dコンホメータを予測する。
我々は,NExT-Molの性能を向上させるために,LMのモデルサイズをスケールアップし,拡散ニューラルアーキテクチャを改良し,三次元トランスファー学習に1Dを適用した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:29:30 GMT)
ByTheWay: Boost Your Text-to-Video Generation Model to Higher Quality in a Training-free Way [72.2] ByTheWayは、追加のパラメータやメモリ増設、サンプリング時間を導入することなく、テキスト・ビデオ生成の品質を向上させるためのトレーニング不要の方法である。
様々なデコーダブロックにまたがる時間的アテンションマップ間の差異を低減することにより、生成されたビデオの構造的妥当性と時間的一貫性を向上させる。
地図のエネルギーを増幅することで、運動の大きさと豊かさを高める。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:05:30 GMT)
Random Latent Exploration for Deep Reinforcement Learning [71.9] RLE(Random Latent Exploration)は、強化学習における単純かつ効果的な探索戦略である。
RLEは、エージェントの行動を混乱させるノイズベースの手法と、新しい行動を試みるエージェントに報酬を与えるボーナスベースの探索を平均的に上回る。
RLEはノイズベースの手法と同じくらい単純であり、複雑なボーナス計算は避けるが、ボーナスベースの手法の深い探索の利点を保っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:47:34 GMT)
K-Edit: Language Model Editing with Contextual Knowledge Awareness [71.7] 知識に基づくモデル編集は、大きな言語モデルの重みを正確に修正することを可能にする。
我々は、文脈的に一貫した知識編集を生成するための効果的なアプローチであるK-Editを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:59:27 GMT)
The Hidden Risks of Large Reasoning Models: A Safety Assessment of R1 [70.9] 本稿では,OpenAI-o3およびDeepSeek-R1推論モデルの総合的安全性評価を行う。
本研究では, 現実の応用における強靭性を評価するために, ジェイルブレイクやインジェクションなどの敵攻撃に対する感受性について検討する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:03:52 GMT)
Erasing Without Remembering: Safeguarding Knowledge Forgetting in Large Language Models [70.8] 大規模言語モデル(LLM)におけるモデル非学習の保護方法について研究する。
私たちの目標は、未学習のモデルが対象とする知識の関連記憶をリコールすることを防止することです。
LLMアンラーニングの保護のための一般化能力を大幅に向上させる摂動に基づくPERMUを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:03:33 GMT)
Uncertainty for Active Learning on Graphs [70.4] 不確実性サンプリングは、機械学習モデルのデータ効率を改善することを目的とした、アクティブな学習戦略である。
予測の不確実性を超えた不確実性サンプリングをベンチマークし、他のアクティブラーニング戦略に対する大きなパフォーマンスギャップを強調します。
提案手法は,データ生成プロセスの観点から基幹的ベイズ不確実性推定法を開発し,不確実性サンプリングを最適クエリへ導く上での有効性を実証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:45:57 GMT)
SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language Model [69.7] 本研究は,地震モニタリングにクロスモーダル転送を利用する最初の基礎モデルであるSeesMoLLMを提示する。
5つの重要なタスクでDiTingとSTEADデータセットの最先端のパフォーマンスを実現する。
優れたパフォーマンスに加えて、SeesMoLLMはトレーニングと推論の両方において軽量モデルに匹敵する効率を維持している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:35:53 GMT)
Following the Autoregressive Nature of LLM Embeddings via Compression and Alignment [69.7] 本稿では,条件付き確率分布を埋め込んだコントラスト学習手法であるAutoRegEmbedを提案する。
本手法は従来のコントラスト学習手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:26:26 GMT)
LTSM-Bundle: A Toolbox and Benchmark on Large Language Models for Time Series Forecasting [69.3] LTSM-Bundleは総合的なツールボックスであり、LTSMをトレーニングするためのベンチマークである。
複数の次元からLTSMをモジュール化し、ベンチマークし、プロンプト戦略、トークン化アプローチ、ベースモデルの選択、データ量、データセットの多様性を含む。
実験により、この組み合わせは最先端のLTSMや従来のTSF法と比較して、ゼロショットと少数ショットのパフォーマンスが優れていることが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:12:38 GMT)
UniTok: A Unified Tokenizer for Visual Generation and Understanding [69.1] 我々は、UniTokを紹介した。UniTokは、個別のビジュアルトークンであり、生成のための細粒度の詳細をエンコードし、理解のための高レベルなセマンティクスをキャプチャする。
本手法は,ドメイン固有の連続トークン化器に適合する,あるいは超過する,統一された離散トークン化器の上限を著しく高める。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:47:01 GMT)
TripoSG: High-Fidelity 3D Shape Synthesis using Large-Scale Rectified Flow Models [69.0] TripoSGは、入力画像に正確に対応した高忠実度3Dメッシュを生成することができる新しい合理化形状拡散パラダイムである。
結果として得られた3D形状は、高解像度の能力によって細部が強化され、入力画像に異常な忠実さを示す。
3Dジェネレーションの分野における進歩と革新を促進するため、我々はモデルを一般公開する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:03:40 GMT)
AutoHete: An Automatic and Efficient Heterogeneous Training System for LLMs [69.0] トランスフォーマーベースの大規模言語モデル(LLM)は、シーケンスモデリングやテキスト生成において例外的な機能を示した。
既存の異種トレーニング手法は、トレーニング可能なモデルの規模を大幅に拡大するが、かなりの通信オーバーヘッドとCPUワークロードを導入している。
本稿では,シングルGPU環境とマルチGPU環境の両方に互換性のある,自動的で効率的なヘテロジニアストレーニングシステムであるAutoHeteを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:46:22 GMT)
Speculative RAG: Enhancing Retrieval Augmented Generation through Drafting [68.9] Speculative RAG(投機的RAG)は、より大規模なジェネラリストLMを利用して、より小さな蒸留専門のLMによって並列に生成された複数のRAGドラフトを効率よく検証するフレームワークである。
提案手法は,より小さな専門家のLMにドラフト作成を委譲することでRAGを加速し,より大きなジェネラリストのLMがドラフトに1回の検証パスを実行する。
PubHealthの従来のRAGシステムと比較して、レイテンシを50.83%削減しながら、最大12.97%の精度向上を実現している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:03:36 GMT)
UniGS: Unified Language-Image-3D Pretraining with Gaussian Splatting [68.4] マルチモーダルプレトレーニングに3Dガウススティング(3DGS)を組み込んだUniGSを提案する。
より汎用的で強力なマルチモーダル表現の学習におけるUniGSの有効性を実証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:30:00 GMT)
Multi-Turn Code Generation Through Single-Step Rewards [68.1] 既存のメソッドはフィードバックなしでコードを生成するか、多ターン報酬を最適化するために複雑な階層的な強化学習を使用する。
我々は,単一ステップの報酬のみを用いて,マルチターンコード生成を解決する,シンプルでスケーラブルなアプローチである$mu$Codeを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:55:05 GMT)
MALT: Improving Reasoning with Multi-Agent LLM Training [66.9] MALT(Multi-Agent LLM Training)は、推論プロセスを生成、検証、改善ステップに分割する、新しいポストトレーニング戦略である。
MATH、GSM8K、CSQAでは、MALTは、それぞれ15.66%、7.42%、9.40%の相対的な改善で同じベースラインLLMを上回っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:25:02 GMT)
G3Flow: Generative 3D Semantic Flow for Pose-aware and Generalizable Object Manipulation [65.9] 本稿では,基礎モデルを活用した動的オブジェクト中心の3D表現であるリアルタイムセマンティックフローを構築する新しいフレームワークG3Flowを提案する。
提案手法は,デジタルツイン生成のための3次元生成モデル,セマンティック特徴抽出のための視覚基盤モデル,連続的なセマンティックフロー更新のためのロバストポーズ追跡を一意に組み合わせたものである。
本研究は,ロボット操作ポリシーのリアルタイムな動的意味的特徴理解におけるG3Flowの有効性を実証するものである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:59:12 GMT)
MetaDesigner: Advancing Artistic Typography Through AI-Driven, User-Centric, and Multilingual WordArt Synthesis [65.8] MetaDesignerがLarge Language Models(LLM)を利用したアートタイポグラフィーのための変換フレームワークを導入
その基盤は、Pipeline、Glyph、Textureエージェントで構成されるマルチエージェントシステムであり、カスタマイズ可能なWordArtの作成をまとめてオーケストレーションしている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:36:29 GMT)
Efficient Gaussian Splatting for Monocular Dynamic Scene Rendering via Sparse Time-Variant Attribute Modeling [64.8] Deformable Gaussian Splattingは、現実世界のダイナミックなシーンを表現する堅牢なソリューションとして登場した。
提案手法は,古典的カーネル表現を用いて計算された密度ガウスの運動流を用いて,スパースアンカーグリッド表現を用いて動的シーンを定式化する。
2つの実世界のデータセットの実験により、EDGSはレンダリング速度を大幅に改善し、より優れたレンダリング品質を実現しています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:53:06 GMT)
LIFT-GS: Cross-Scene Render-Supervised Distillation for 3D Language Grounding [64.3] 我々は3Dで予測を行うフィードフォワードモデルを訓練するが、3Dラベルは必要とせず、2Dでのみ教師される。
トレーニングには、画像とカメラのポーズと2Dラベルが必要だ。
事前学習した2Dモデルから擬似ラベルを使用することで,2Dラベルの必要性を解消できることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:59:11 GMT)
Identifiable Multi-View Causal Discovery Without Non-Gaussianity [63.2] 多視点構造方程式モデル(SEM)の枠組みにおける線形因果発見への新しいアプローチを提案する。
我々は、SEMの構造が非巡回的であること以外は、余計な仮定をすることなく、モデルの全てのパラメータの識別可能性を証明する。
提案手法は,脳領域間の因果グラフの推定を可能にする実データへのシミュレーションおよび応用を通じて検証される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:06:14 GMT)
ThinK: Thinner Key Cache by Query-Driven Pruning [63.1] 大規模言語モデル(LLM)は自然言語処理の分野に革命をもたらし、様々なアプリケーションで前例のない性能を達成した。
本稿では,KVキャッシュのメモリ消費の非効率性に対処する長文シナリオに焦点を当てた。
我々は,最小のチャネルを選択的に切断しながら,注目重量損失を最小限に抑える新しいクエリ依存型KVキャッシュプルーニング手法であるThinKを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:30:43 GMT)
External Large Foundation Model: How to Efficiently Serve Trillions of Parameters for Online Ads Recommendation [63.1] 広告推薦はオンライン広告システムの顕著なサービスであり、積極的に研究されている。
近年の研究では、レコメンデーションモデルのスケールアップと高度な設計が、大幅な性能向上をもたらすことが示されている。
しかし、モデルスケールが大きくなるにつれて、従来の研究は産業規模での2つの基本的な課題を無視することが多いため、産業とのギャップが著しく増大する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:32:37 GMT)
Picking the Cream of the Crop: Visual-Centric Data Selection with Collaborative Agents [62.6] textbfVisual-Centric textbfSelection approach by textbfAgents Collaboration (ViSA)を提案する。
提案手法は,(1)視覚エージェントの協調による画像情報定量化手法により,リッチな視覚情報を持つ画像を選択する方法,(2)高品質な画像に関連する高品質な画像を選択する視覚中心の指示品質評価手法からなる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:37:30 GMT)
UniDepthV2: Universal Monocular Metric Depth Estimation Made Simpler [62.1] ドメインをまたいだ単一の画像からメートル法3Dシーンを再構成できる新しいモデルUniDepthV2を提案する。
UniDepthV2は、追加情報なしで、入力画像から推論時にメートル法3Dポイントを直接予測する。
我々のモデルは擬似球面出力表現を利用し、カメラと深度表現をアンタングル化する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:03:15 GMT)
Swap Regret and Correlated Equilibria Beyond Normal-Form Games [62.0] 「我々は、プロファイルスワップ後悔と呼ぶポリトープゲームのスワップ後悔の新しい変種を提示する。」
プロファイルスワップ後悔は、プレイの書き起こしが与えられた場合、NPハードであることが示されるが、少なくとも$O(sqrtT)$プロファイルスワップ後悔を保証する効率的な学習アルゴリズムを設計することは可能である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:16:26 GMT)
Breaking the Low-Rank Dilemma of Linear Attention [61.6] 線形注意(linear attention)は、複雑性を線形レベルに還元することで、はるかに効率的なソリューションを提供する。
実験により, この性能低下は, 線形アテンションの特徴マップの低ランク性に起因することが示唆された。
我々は,線形複雑性と高効率を維持しつつ,Softmaxの注目性能に匹敵するランク拡張線形注意(RALA)を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:22:41 GMT)
One-for-More: Continual Diffusion Model for Anomaly Detection [61.1] 異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。
われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。
本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:47:27 GMT)
Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids [61.0] 本研究は,ヒューマノイドの具体化におけるコンタクトリッチな操作タスクの集合を解決するために,強化学習を適用する上で重要な課題について検討する。
私たちの主なコントリビューションは、シミュレーション環境を現実世界に近づける自動リアルタイムチューニングモジュールです。
本研究は,3つのヒューマノイド・デキスタラス・オペレーティング・タスクにおいて有望な結果を示し,それぞれのテクニックについてアブレーション研究を行った。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:59:52 GMT)
M-LLM Based Video Frame Selection for Efficient Video Understanding [60.9] 本稿では,ユーザのクエリに関連性の高いフレームを適応的に選択する,軽量なM-LLMベースのフレーム選択手法を提案する。
選択されたフレームは、視覚的推論と質問応答のための凍った下流ビデオM-LLMによって消化される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:44:13 GMT)
Lightweight Vision Transformer with Bidirectional Interaction [59.4] 本研究では,視覚変換器の局所的・グローバル的情報をモデル化するためのFASA機構を提案する。
FASAに基づいて、我々はFAT(Fully Adaptive Transformer)ファミリーという軽量なビジョンバックボーンのファミリーを開発した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:16:17 GMT)
HVI: A New color space for Low-light Image Enhancement [58.8] 水平/垂直インテンシティ(HVI)に基づく低照度画像強調(LLIE)のための新しい色空間を提案する。
HVIは分極されたHSマップと学習可能な強度で定義され、一方後者は黒のアーティファクトを除去するために低照度領域を圧縮する。
色と強度の情報をフル活用するために、新しい色と強度のデカップリングネットワーク(CIDNet)を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:59:51 GMT)
Solving Video Inverse Problems Using Image Diffusion Models [58.5] 本稿では,画像拡散モデルのみを活用する革新的なビデオ逆解法を提案する。
本手法は,映像の時間次元をバッチ次元画像拡散モデルとして扱う。
また、バッチ間の一貫性を促進するバッチ一貫性サンプリング戦略も導入しています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:04:08 GMT)
Enhance-A-Video: Better Generated Video for Free [57.6] 本稿では,DiTをベースとしたビデオのコヒーレンスと品質を高めるためのトレーニング不要な手法を提案する。
我々のアプローチは、リトレーニングや微調整なしに、ほとんどのDiTベースのビデオ生成フレームワークに容易に適用できる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:35:45 GMT)
Ego-VPA: Egocentric Video Understanding with Parameter-efficient Adaptation [57.4] Ego-VPAは、エゴ中心のビデオタスクに対するパラメータ効率の適応である。
Ego-VPAは、わずか0.84%の学習可能なパラメータで軽量な適応を実現している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:37:53 GMT)
Can Large Language Models Detect Errors in Long Chain-of-Thought Reasoning? [57.2] o1-likeモデルは、既存のLarge Language Models(LLM)の推論能力を改善するための長いチェーン・オブ・ソート(CoT)推論ステップを生成する。
DeltaBenchを導入し、異なる推論タスクのために異なるo1-likeモデルから生成された長いCoTを含む。
DeltaBenchに基づいて、生成した長いCoTのきめ細かい分析を行い、異なるo1モデルの有効性と効率を明らかにする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:34:04 GMT)
MICINet: Multi-Level Inter-Class Confusing Information Removal for Reliable Multimodal Classification [57.1] また,Multi-Level Inter-Class Confusing Information removal Network (MICINet) と呼ばれるマルチモーダル分類手法を提案する。
MICINetは、これらのノイズをクラス間統合情報(textitICI)の概念に統合し、グローバルレベルと個人レベルのノイズを除去することで、信頼性の高いノイズ除去を実現している。
4つのデータセットの実験により、MICINetは様々なノイズ条件下で、他の最先端の信頼性の高いマルチモーダル分類方法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:33:28 GMT)
SDPO: Segment-Level Direct Preference Optimization for Social Agents [57.0] 大規模言語モデル(LLM)を利用した社会エージェントは、人間の社会的振る舞いをシミュレートできるが、複雑な社会対話を扱うには不十分である。
マルチターンエージェントの動作を最適化するために,対話内のキーセグメントを動的に選択するセグメントレベル直接参照最適化(SDPO)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:42:17 GMT)
Building Math Agents with Multi-Turn Iterative Preference Learning [56.7] 本稿では,モデル性能をさらに向上させるために,補完的な直接選好学習手法について検討する。
既存の直接選好学習アルゴリズムは、もともとシングルターンチャットタスク用に設計されている。
この文脈に合わせたマルチターン直接選好学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:10:16 GMT)
Alleviating Distribution Shift in Synthetic Data for Machine Translation Quality Estimation [55.7] 本稿では,合成QEデータの分散シフトを緩和する新しいフレームワークであるADSQEを紹介する。
ADSQEは、参照、すなわち翻訳監督信号を使用して、生成プロセスとアノテーションプロセスの両方をガイドする。
実験によると、ADSQEはCOMETのようなSOTAベースラインを教師なしと教師なしの両方で上回っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:11:53 GMT)
A Survey of Graph Transformers: Architectures, Theories and Applications [54.6] 近年の研究では、多種多様なアーキテクチャ、説明可能性の向上、グラフトランスフォーマーの実用化などが提案されている。
グラフ変換器のアーキテクチャは,その構造情報処理戦略に従って分類する。
本稿では,分子,タンパク質,言語,視覚,交通,脳,物質データなど,グラフトランスフォーマーの実用化例を紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:17:29 GMT)
M^3Builder: A Multi-Agent System for Automated Machine Learning in Medical Imaging [54.4] 医療画像における機械学習(ML)の自動化を目的とした,新しいマルチエージェントシステムであるM3Builderを提案する。
M3Builderは、複雑なマルチステップ医療MLに取り組むために、4つの専門エージェントを雇用している。
既存のMLエージェント設計と比較して、M3Builderは医療画像におけるMLタスクの完了に優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:29:46 GMT)
The Dual-use Dilemma in LLMs: Do Empowering Ethical Capacities Make a Degraded Utility? [54.2] 大きな言語モデル(LLM)は、安全のための有害な要求を拒否することと、ユーティリティのための正当な要求を収容することのバランスをとる必要がある。
本稿では,DPO(Direct Preference Optimization)に基づくアライメントフレームワークを提案する。
我々は,DeepSeek-R1をベンチマークでテストした結果を解析し,この高い評価を得たモデルがもたらす批判的倫理的懸念を明らかにする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:51:29 GMT)
LangProBe: a Language Programs Benchmark [53.8] 本稿では,言語プログラムのアーキテクチャと最適化戦略を評価するための,最初の大規模ベンチマークであるLangProBeを紹介する。
最適化された言語プログラムは、モデルへの生の呼び出しよりも高いコスト品質の改善を提供するが、最高のパフォーマンスには人間の判断が依然として必要であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:41:49 GMT)
EgoNormia: Benchmarking Physical Social Norm Understanding [52.9] 我々はEgoNormia $|epsilon|$について紹介する。
規範的行動には、安全、プライバシー、プロキシ、丁寧さ、協力、協調/行動、コミュニケーション/相対性という7つのカテゴリが含まれる。
私たちの研究は、現在の最先端のビジョン言語モデルは、EgoNormiaで最大45%のスコアで、堅牢なノルム理解を欠いていることを実証しています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:54:16 GMT)
Identifying and Mitigating Social Bias Knowledge in Language Models [52.5] 個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:11:06 GMT)
IL-SOAR : Imitation Learning with Soft Optimistic Actor cRitic [52.4] 本稿では、模倣学習のためのSOARフレームワークを紹介する。
これは、コストとポリシーの更新を交互に行うプリミティブデュアルスタイルのアルゴリズムで、専門家によるデモンストレーションからポリシーを学ぶアルゴリズムテンプレートである。
いくつかの MuJoCo 環境では,f-IRL,ML-IRL,CSIL などのソフトアクタ批判に基づく模倣学習アルゴリズムの性能を一貫して向上することが示されている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:03:37 GMT)
Avat3r: Large Animatable Gaussian Reconstruction Model for High-fidelity 3D Head Avatars [52.4] 少数の入力画像から高品質でアニマタブルな3Dヘッドアバターを復元するAvat3rを提案する。
大規模なリコンストラクションモデルをアニマタブルにし、大規模なマルチビュービデオデータセットから3次元以上の人間の頭部を強力に学習する。
トレーニング中に異なる表現の入力イメージをモデルに供給することでロバスト性を高め,不整合入力からの3次元頭部アバターの再構成を可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:00:11 GMT)
GeoEdit: Geometric Knowledge Editing for Large Language Models [52.4] 大規模言語モデル(LLM)における最新の知識を維持するためには、定期的な更新が不可欠である。
幾何学的知識編集(GeoEdit)と呼ばれる新しいフレームワークを提案する。
GeoEditは、新しい知識更新に関連するニューロンと、一般的な知識摂動に関連するニューロンを区別する。
残りのニューロンに対しては、整列方向の古知識と新知識を統合し、反対方向の「forget-then-learn」編集戦略を適用した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:27:48 GMT)
Taxonomy, Opportunities, and Challenges of Representation Engineering for Large Language Models [52.2] RepEはモデルの内部表現を直接操作する。
より効果的で、解釈可能で、データ効率が良く、モデルの振る舞いを柔軟に制御できる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:40:01 GMT)
Efficient Risk-sensitive Planning via Entropic Risk Measures [51.4] 動的プログラミングにより,エントロピーリスク対策(EntRM)のみを効率的に最適化できることを示す。
エントロピーリスクの新たな構造解析と滑らかさ特性により, この最適性を効果的に計算できることを実証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:56:51 GMT)
Dual-branch Graph Feature Learning for NLOS Imaging [51.3] 非視線イメージング(NLOS)は、直接見えない閉塞されたシーンを明らかにする機能を提供する。
xnet法は、アルベド情報回復に特化したアルベド中心の再構築ブランチと、幾何学的構造を抽出する深さ中心の再構築ブランチを統合する。
提案手法は,合成データと実データの間で,既存の手法の中で最も高い性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:49:00 GMT)
SudoLM: Learning Access Control of Parametric Knowledge with Authorization Alignment [51.3] 我々は,特定のパラメトリック知識のアクセス制御をLLMが学べるフレームワークであるSudoLMを提案する。
2つのアプリケーションシナリオの実験は、SudoLMがユーザのパラメトリック知識へのアクセスを効果的に制御し、その汎用性を維持することを実証している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:05:43 GMT)
RRM: Robust Reward Model Training Mitigates Reward Hacking [51.1] リワードモデル(RM)は、大きな言語モデルと人間の嗜好の整合において重要な役割を果たす。
これらのアーティファクトとは無関係に好みを学習する因果的枠組みを導入する。
実験の結果,提案手法は望ましくないアーティファクトをフィルタし,より堅牢な報酬モデルを実現することができた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:30:42 GMT)
Societal Alignment Frameworks Can Improve LLM Alignment [51.0] LLMアライメントの改善には、社会的アライメントフレームワークからの洞察を取り入れる必要がある、と我々は主張する。
次に,LLMアライメントにおける社会的アライメント・フレームワークの不確実性について検討する。
我々は、LLMアライメントに関する代替的な見解を提供し、その目的の未定義の性質を機会としてフレーミングすることで、議論を終わらせる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:26:07 GMT)
Striving for Faster and Better: A One-Layer Architecture with Auto Re-parameterization for Low-Light Image Enhancement [50.9] 我々は、視覚的品質と計算効率の両方から、画像エンハンサーの限界を掘り下げることを目指している。
タスク要求を再考することにより、視覚的品質と計算効率がモデル学習と構造設計に対応する、明示的な接続を構築する。
最終的には、単一の畳み込み層のみを使用して、優れた視覚的品質を維持しながら、効率的な低照度画像強調を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:20:03 GMT)
OverLoCK: An Overview-first-Look-Closely-next ConvNet with Context-Mixing Dynamic Kernels [50.4] 我々はアーキテクチャとミキサーの両方の観点から慎重に考案された、OverLoCKと呼ばれる新しい純粋なConvNetビジョンバックボーンを提案する。
具体的には、意味的に意味のある文脈表現を中層と深層に融合させるバイオミメティックなDeep-stage Decomposition Strategy (DDS)を導入する。
トップダウンコンテキストガイダンスのパワーを完全に解き放つために,新しいtextbfContext-textbfMixing Dynamic Convolution (ContMix) を提案する。
OverLoCKは既存のメソッドよりも顕著なパフォーマンス向上を実現しています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:45:15 GMT)
Re-evaluating Open-ended Evaluation of Large Language Models [50.2] 現在のEloベースのレーティングシステムは、データ、意図的、あるいは偶発的なバイアスの影響を受けやすく、さらに強化できることを示している。
本稿では,3人プレイヤゲームとしての評価を提案し,冗長性に対するロバスト性を確保するために,ゲーム理論の新たな概念を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:07:47 GMT)
Optimus-2: Multimodal Minecraft Agent with Goal-Observation-Action Conditioned Policy [50.1] Optimus-2はMultimodal Large Language Model (MLLM)を組み込んだ新しいMinecraftエージェントである。
GOAPには、各段階における観察と行動の間の因果関係をモデル化するアクション誘導行動が含まれている。
8つのアトミックタスクにわたる25,000のビデオを含み、約30万のゴール-オブザーバ-アクションペアを提供する、高品質なMinecraftのゴール-オブザーバ-アクションデータセットを紹介します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:18:04 GMT)
Mobius: Text to Seamless Looping Video Generation via Latent Shift [50.0] ユーザアノテーションを使わずにテキスト記述から直接シームレスにループするビデオを生成する新しい方法であるMobiusを提案する。
本手法では,事前学習したビデオ遅延拡散モデルを用いて,テキストプロンプトからループ映像を生成する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:33:51 GMT)
Modern DDoS Threats and Countermeasures: Insights into Emerging Attacks and Detection Strategies [49.6] 分散型サービス拒否(DDoS)攻撃は、オンラインサービスとインフラストラクチャに対する重大な脅威として継続する。
本稿は、過去10年間のDDoS攻撃と検出戦略の包括的調査を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:22:25 GMT)
BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning [49.5] 実際の研究から5.1Kの複雑な経路問題を持つデータセットであるBioMazeを紹介する。
CoT法やグラフ拡張推論法などの手法の評価は,LLMが経路推論に苦慮していることを示している。
そこで本稿では,インタラクティブなサブグラフベースのナビゲーションにより推論を強化するLLMエージェントであるPathSeekerを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:17:08 GMT)
New Dataset and Methods for Fine-Grained Compositional Referring Expression Comprehension via Specialist-MLLM Collaboration [49.2] Referring Expression (REC) は、言語理解、画像理解、言語と画像の接点の相互作用を評価するためのクロスモーダルなタスクである。
2つの重要な特徴を持つ新しいRECデータセットを導入する。第一に、オブジェクトカテゴリ、属性、関係性に関する詳細な推論を必要とする、制御可能な難易度で設計されている。
第二に、微粒な編集によって生成された否定的なテキストと画像が組み込まれ、既存のターゲットを拒否するモデルの能力を明示的にテストする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:58:44 GMT)
ChatReID: Open-ended Interactive Person Retrieval via Hierarchical Progressive Tuning for Vision Language Models [49.1] 人物再識別(Re-ID)は、人間中心の知的システムにおいて重要な課題である。
近年の研究では、LVLMと人物Re-IDの統合が成功し、有望な結果が得られている。
本稿では,新規で汎用性の高い一対一のRe-IDフレームワークChatReIDを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:34:14 GMT)
Progressive Mixed-Precision Decoding for Efficient LLM Inference [49.1] 我々は,デコーディングのメモリバウンドネスに対処するために,プログレッシブ・ミックス・プレシジョン・デコーディング(PMPD)を導入する。
PMPDはfp16モデルの行列ベクトル乗算において1.4$-$12.2$times$ Speedupを達成する。
我々の手法は、fp16モデルよりも3.8$-$8.0$times$、均一量子化アプローチよりも1.54$times$のスループット向上をもたらす。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:13:19 GMT)
Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric [48.8] サンプルレベルの「ノーベルティ」に基づく新しい多様性指標を提案する。
我々は,NovellSumが精度よく多様性の変動を捉え,命令調整モデルの性能と0.97の相関性が得られることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:59:58 GMT)
Beyond Worst-Case Dimensionality Reduction for Sparse Vectors [47.9] 我々は、$s$sparseベクトルの最低ケース次元削減を超越して研究する。
任意の集合 $X$ of $s$-sparse vectors in $mathbbRO(s2)$ に対して、$mathbbRO(s2)$ への線型写像が存在し、任意の $ell_p$ ノルムにおいて$X$の99%のベクトルのノルムを正確に保存する。
我々は、$f$の非線形性と$の非負性の両方を示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:17:47 GMT)
ProxyTransformation: Preshaping Point Cloud Manifold With Proxy Attention For 3D Visual Grounding [47.9] エージェントは言語命令に基づいてリアルタイムで3D環境と対話する必要がある。
既存の点雲拡大法は、しばしば多様体を改善するために退屈なプロセスを必要とする。
本稿では,マルチモーダルタスクに適したプロキシ変換を提案し,ポイントクラウド多様体を効率的に改善する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:22:15 GMT)
Reward Shaping to Mitigate Reward Hacking in RLHF [47.7] 人間のフィードバックからの強化学習(RLHF)は、大きな言語モデルと人間の価値の整合に不可欠である。
報酬形成はRLHFを安定させ、報酬ハッキングを部分的に軽減する。
本稿では,報酬形成手法の総合的研究について述べる。
提案手法は,報酬モデル自体に埋め込まれた潜在的嗜好を,強化学習の信号として活用する手法である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:49:19 GMT)
HybridGS: Decoupling Transients and Statics with 2D and 3D Gaussian Splatting [47.7] 画像ごとの過渡的対象に対して2次元ガウスアンを用いて,ハイブリッドGSと呼ばれる新しいハイブリッド表現を提案する。
また、ロバストなトレーニングと高品質なビュー合成を実現するために、単純かつ効果的なマルチステージトレーニング戦略を提案する。
ベンチマークデータセットを用いた実験は、室内および屋外の両方のシーンにおいて、新しいビュー合成の最先端性能を示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:48:54 GMT)
CirT: Global Subseasonal-to-Seasonal Forecasting with Geometry-inspired Transformer [47.7] 重力の循環特性をモデル化する幾何インスパイアされた循環変換器(CirT)を提案する。
地球再分析5(ERA5)再解析データセットの実験は、我々のモデルが先進的なデータ駆動モデルよりも大幅に改善することを示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:26:23 GMT)
4Deform: Neural Surface Deformation for Robust Shape Interpolation [47.5] 本研究では,非構造化データにおける非剛性変形形状間の中間形状を現実的に生成するための新しい手法を開発した。
本手法はユークリッド空間における連続速度場を学習し,訓練中に中間形状の監視を必要としない。
提案手法は, 4次元Kinectシークエンスアップサンプリングや実世界の高分解能メッシュ変形などの新しいアプリケーションを実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:47:49 GMT)
Tight Inversion: Image-Conditioned Inversion for Real Image Editing [47.4] 本稿では,入力画像自体の最も可能な条件を利用する変換手法であるTight Inversionを紹介する。
この厳密な条件は、モデルの出力の分布を狭め、再構築性と編集性の両方を高める。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:51:16 GMT)
MMFakeBench: A Mixed-Source Multimodal Misinformation Detection Benchmark for LVLMs [47.4] マルチモーダル誤報検出法は、しばしばサンプルごとに単一のソースと種類の偽造を仮定する。
混合ソースの誤情報に対するベンチマークが欠如していることは、この分野の進歩を妨げている。
MMFakeBenchは、ミックスソースMDDの最初の包括的なベンチマークである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:19:48 GMT)
GPT4Image: Large Pre-trained Models Help Vision Models Learn Better on Perception Task [47.2] 我々はGPT4Imageと呼ばれる新しい学習フレームワークを提案し、CNNやViTがより良い表現を学ぶのに役立つ大規模な事前学習モデルの知識を抽出する。
本研究では,様々な視覚認知タスクにおける提案アルゴリズムの有効性を検証するために,広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:49:05 GMT)
SubZero: Composing Subject, Style, and Action via Zero-Shot Personalization [46.8] 拡散モデルは、主題やスタイルのパーソナライズされた構成を含む、生成的なタスクにますます人気がある。
SubZeroは、どんなスタイルでも主題を生成し、微調整を必要とせずにアクションを実行する新しいフレームワークである。
提案手法は,最先端の作業に適した手法であるが,課題,スタイル,動作構成など,最先端の作業よりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:33:28 GMT)
Scalable Signature Kernel Computations for Long Time Series via Local Neumann Series Expansions [46.7] シグネチャカーネルは、高次元シーケンシャルデータを解析するための最新の最先端ツールである。
長い高次元時系列の署名カーネルを効率的に計算する新しい手法を提案する。
この手法は、シグネチャカーネルの計算における最先端のアプローチよりも大幅に性能が向上する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:59:20 GMT)
FederBoost: Private Federated Learning for GBDT [45.9] フェデレートラーニング(FL)は、機械学習と人工知能において、新たなトレンドとなっている。
我々は,勾配促進決定木(GBDT)の個人的学習のためのFederBoostというフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:38:05 GMT)
On Conformal Isometry of Grid Cells: Learning Distance-Preserving Position Embedding [45.7] 格子セル応答マップにおける六角形周期パターンの潜在的な説明として,共形アイソメトリ仮説を考察する。
我々は,この仮説が最大距離保存位置埋め込みを学習することにより六角形格子発火パターンにつながることを示す数値実験を行った。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:31:38 GMT)
MobiLLM: Enabling LLM Fine-Tuning on the Mobile Device via Server Assisted Side Tuning [45.5] モバイルデバイスでの大規模言語モデル(LLM)の微調整は、極めて高いメモリ要求と遅いトレーニング速度のため、大きな課題となる。
サーバ支援サイドチューニングにより,モバイル端末上でメモリ効率の高いトランスフォーマーLEMの微調整を可能にするMobiLLMを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:58:02 GMT)
Non-relativistic limit of Dirac Hamiltonians with Aharonov-Bohm fields [45.0] 我々は、アハロノフ-ボーム磁場を持つ自己随伴ディラック作用素とシュル・オーディンガー作用素の族を特徴づける。
我々は、無限光速の非相対論的極限を利用して、前者を後者に接続する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:42:52 GMT)
Efficient and Universal Neural-Network Decoder for Stabilizer-Based Quantum Error Correction [44.7] 本稿では,線形アテンションシーケンスモデリングとグラフニューラルネットワークに基づくユニバーサルデコーダを提案する。
実験により, このデコーダは, 精度と速度の両面において, 特殊アルゴリズムよりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:56:53 GMT)
Generative Gaussian Splatting for Unbounded 3D City Generation [44.2] 3D Gaussian Splatting (3D-GS)は、オブジェクトレベルの3D生成に対して、非常に効率的な代替手段として登場した。
しかし、有限スケールの3Dオブジェクトや人間から無限スケールの3D都市への3D-GSの適応は簡単ではない。
本稿では,1つのフィードフォワードパスで効率よく3D都市を合成するためのガウススティングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:39:54 GMT)
EMS: Adaptive Evict-then-Merge Strategy for Head-wise KV Cache Compression Based on Global-Local Importance [44.1] メモリオーバーヘッドが重要になるにつれて、KVキャッシュの効率的な圧縮が注目されている。
我々は,これらの制限を克服すると同時に,極端な圧縮比下でのKVキャッシュ圧縮を向上するEMSを提案する。
EMSは最低の難易度を一貫して達成し、256のキャッシュ予算の下でLongBench上の4つのLLMで1.28ポイント以上改善し、Needdle-in-a-Haystackタスクのコンテキスト長の2%未満のキャッシュ予算で95%の検索精度を維持している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:29:03 GMT)
MaxInfo: A Training-Free Key-Frame Selection Method Using Maximum Volume for Enhanced Video Understanding [44.0] 現代のビデオ大言語モデル(VLLM)は、ビデオ理解のための一様フレームサンプリングに依存していることが多い。
入力ビデオから最も代表的なフレームを選択し,保持する最大ボリューム原理に基づく学習自由度手法であるMaxInfoを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:12:34 GMT)
Teaching Dense Retrieval Models to Specialize with Listwise Distillation and LLM Data Augmentation [43.8] 標準的な微調整手法は、ドメイン固有のシナリオであっても、改善するよりも、予想外に効率を低下させる可能性があることを示す。
そこで我々は,教師のクロスエンコーダからリストワイズを抽出し,リッチな関連信号を利用して学習者を微調整する訓練戦略を検討する。
また,本研究の結果から,合成クエリはトレーニングユーティリティにおいて人書きクエリと競合する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:07:49 GMT)
Learning with Exact Invariances in Polynomial Time [43.8] 本稿では,カーネル回帰を用いて,正確な不変性(あるいは対称性)を学習するための統計的・計算的トレードオフについて検討する。
提案手法は,元のカーネル回帰問題と同じ過大な集団リスクを実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:49:52 GMT)
Learning to Generalize without Bias for Open-Vocabulary Action Recognition [43.8] オープンボキャブラリ動作認識のための静的デバイアス処理を備えた新しいメタ最適化フレームワークであるOpen-MeDeを紹介する。
我々は,Open-MeDeが,文脈内オープン語彙行動認識に適した最先端の正規化手法を超えるだけでなく,文脈外シナリオではかなり優れていることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:56:58 GMT)
XCOMPS: A Multilingual Benchmark of Conceptual Minimal Pairs [43.5] XCOMPSは17言語をカバーする多言語の概念的最小ペアデータセットである。
我々は,LLMの多言語概念理解をメタ言語的プロンプト,直接確率測定,神経言語学的探索を通じて評価した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:02:13 GMT)
PLeaS -- Merging Models with Permutations and Least Squares [43.2] PLeaSと呼ばれるモデルをマージする2段階の新たなアルゴリズムを提案し、制約を緩和する。
PLeaSはアライメントを最大化することで各層のノードに部分的にマッチする。
また、細調整されたドメインからデータを入手できないという難題に対処するために、我々のメソッドをどのように拡張できるかを実証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:26:01 GMT)
UIFace: Unleashing Inherent Model Capabilities to Enhance Intra-Class Diversity in Synthetic Face Recognition [42.9] 顔認識(FR)はコンピュータビジョンにおいて最も重要な応用の1つである。
UIFaceとして短縮された合成顔認識のためのクラス内多様性を高めるフレームワークを提案する。
実験結果から,本手法は従来の手法に比べてトレーニングデータが少なく,合成データセットの約半分の規模で大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:22:18 GMT)
MonoTAKD: Teaching Assistant Knowledge Distillation for Monocular 3D Object Detection [42.5] 我々はMono3Dにおける3D知覚を高めるためにMonocular Teaching Assistant Knowledge Distillation (MonoTAKD)を導入した。
3次元空間的手がかりを教師モデルと教師アシスタントモデルの違いを捉えた残像として定義することにより,これらの手がかりを学生モデルに活用する。
実験の結果,MonoTAKDはKITTI3Dデータセット上で最先端の性能を達成できた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:56:48 GMT)
ReCon: Enhancing True Correspondence Discrimination through Relation Consistency for Robust Noisy Correspondence Learning [42.3] 本稿では,マルチモーダルデータ間の真の対応を正確に識別するための一般関係一貫性学習フレームワークであるReConを提案する。
ReConは、真の対応判別の有効性を大幅に向上させ、不一致ペアを確実にフィルタリングする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:38:03 GMT)
Selective Use of Yannakakis' Algorithm to Improve Query Performance: Machine Learning to the Rescue [42.2] 本稿では,最適化手法を適用するか否かを判断する決定手順を設計する手法を提案する。
機械学習に基づくソリューションを提案する。
各種データベースシステムに関するいくつかのベンチマークによる実証結果から,本手法が統計的に有意な性能向上をもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:19:54 GMT)
Tailoring transport in quantum spin chains via disorder and collisions [41.9] 異方性XXZスピン鎖の輸送ダイナミクスを形作る際, 障害と時空間異種衝突音の相互作用について検討した。
低速度で発生する空間同質衝突は、その後の高原の形で局在度が設定される領域の成型に有利である。
本研究は,移動および局在のシーケンスを調整可能なストロボスコーププロトコルの設計に応用できる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:53:09 GMT)
Photon-by-photon quantum light state engineering [41.9] 量子光状態の工学における過去数十年の進歩を概観する。
徹底的とは程遠いが、このレビューは、これほど魅力的で急速に進化する分野の入り口となる、十分に広範かつ更新された導入を提供することを目的としている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:38:10 GMT)
Entangling macroscopic light states by delocalized photon addition [41.9] マクロなモードでも高い絡み合いを保てることを示す。
多重モード量子状態の新たな合同統計特性である離散化も、ここで初めて実験的に実証された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:05:36 GMT)
Algebraic Machine Learning: Learning as computing an algebraic decomposition of a task [41.9] 本稿では,学習の分析を容易にする数学を用いた抽象代数に基づく代替基盤を提案する。
このアプローチでは、タスクとデータのゴールは代数の公理として符号化され、これらの公理とそれらの論理結果のみが成立するモデルが得られる。
我々は、MNIST、FashionMNIST、CIFAR-10、医療画像などの標準データセット上でこの新しい学習原則を検証し、最適化された多層パーセプトロンに匹敵する性能を達成する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:13:42 GMT)
Causal Effect Estimation under Networked Interference without Networked Unconfoundedness Assumption [41.8] ネットワーク干渉下で因果効果を推定することは極めて難しい問題である。
ネットワーク推論では,3種類の潜在的共同設立者が同定を妨げている。
識別可能な表現学習技術に基づくネットワーク効果推定器を考案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:07:32 GMT)
Supervised Fine-Tuning LLMs to Behave as Pedagogical Agents in Programming Education [41.7] 本稿では,プログラミング教育のための微調整型大規模言語モデル(LLM)である GuideLM の開発について述べる。
GuideLM は LLM を利用した教育用 C コンパイラ C コンパイラ (DCC) に統合され,音声による誤り説明を生成する。
基礎となるOpenAIモデルと比較し,各モデル毎の400応答の専門的分析を行った。
その結果, GuideLM と GuideLM-mini は, GPT-4o と比較して, ソクラテス的指導の8%, 語学経済の58%が向上した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:23:56 GMT)
GHOST 2.0: generative high-fidelity one shot transfer of heads [41.6] ヘッドスワップは、合成中に頭全体の構造情報を保存する必要があることや、スワップされたヘッドとバックグラウンドの間の不透明なギャップなど、追加の課題を生じさせる。
本稿では,2つの問題固有のモジュールからなるGHOST 2.0を用いて,これらの問題に対処する。
まず、頭部再現のための拡張アリグナーモデルを導入し、複数のスケールで識別情報を保存する。
次に,Blenderモジュールを用いて,再現された頭部を肌の色を伝達し,不一致領域を塗布することで,シームレスに対象の背景に組み込む。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:45:45 GMT)
ARTalk: Speech-Driven 3D Head Animation via Autoregressive Model [41.4] 音声駆動型3D顔アニメーションは、任意の音声クリップから3Dヘッドモデルのリアルな唇の動きと表情を生成することを目的としている。
本研究では,高度に同期した唇の動きと,リアルな頭部ポーズと瞬きをリアルタイムに生成する自己回帰モデルを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:49:01 GMT)
Finite State Automata Inside Transformers with Chain-of-Thought: A Mechanistic Study on State Tracking [41.3] CoT(Chain-of-Thought)は、幅広いタスクにわたる大規模言語モデル(LLM)の性能を大幅に向上させる。
本研究では,Transformer+CoTとその変種の状態追跡機能の評価を行い,CoTの有効性を確認した。
圧縮と区別という2つの指標を提案し、各状態のニューロンセットが100%近い精度を達成することを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:24:51 GMT)
A Survey on Diffusion Models for Anomaly Detection [41.2] 拡散モデル(DM)は、生成AIモデルの強力なクラスとして登場した。
DMADは、ますます複雑で高次元のデータにおける偏差を特定するための有望なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:05:55 GMT)
Foot-In-The-Door: A Multi-turn Jailbreak for LLMs [41.0] 主な課題はjailbreakで、敵はビルトインのセーフガードをバイパスして有害な出力を誘導する。
心理的なフット・イン・ザ・ドアの原則に触発されて,新しいマルチターンジェイルブレイク法であるFITDを導入する。
提案手法は,中間的なブリッジプロンプトを通じてユーザクエリの悪意ある意図を段階的にエスカレートし,それ自身でモデル応答を調整し,有害な応答を誘導する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:49:16 GMT)
No Parameters, No Problem: 3D Gaussian Splatting without Camera Intrinsics and Extrinsics [40.9] 本稿では,カメラの内在性や外在性を必要とすることなく,画像コレクションから3DGSをトレーニングするための共同最適化手法を提案する。
理論的には、カメラの内在性の勾配を導出し、カメラの内在性を訓練中に同時に最適化できるようにする。
グローバルトラック情報を統合し,各トラックに関連するガウスカーネルを選択する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:16:04 GMT)
Residual Deep Gaussian Processes on Manifolds [40.2] 多様体から多様体への隠れ層と任意の最終層をモデル化する方法を示す。
我々のモデルは、非多様体データの推論を高速化する可能性があり、いつ、いつ、そして、それがプロキシ多様体に十分にマッピングできるかを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:40:09 GMT)
Sparse Auto-Encoder Interprets Linguistic Features in Large Language Models [40.1] スパースオートエンコーダ(SAE)を用いた系統的・包括的因果調査を提案する。
6次元から幅広い言語的特徴を抽出する。
本稿では,FRC(Feature Representation Confidence)とFIC(Feature Intervention Confidence)の2つの指標を紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:16:47 GMT)
Limits to the validity of quantum-optical models of the effects of gravitational redshift on photonic quantum states [39.6] 我々は、曲面時空で伝播する光子の量子状態に対する重力赤方偏移の影響を記述する量子光学モデルの妥当性の領域を分析する。
モデルは小さな赤方偏移に対して一貫性があるが、より大きな赤方偏移では失敗する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:16:43 GMT)
Identity-preserving Distillation Sampling by Fixed-Point Iterator [39.4] アイデンティティ保存蒸留サンプリング(IDS)は、結果に望ましくない変化をもたらす勾配を補正する。
IDSはスコア自体を変更するために提案されており、ポーズや構造を含むアイデンティティの保存を促進する。
提案手法は、FPRによる自己補正により、画像間編集および編集可能なニューラル放射場(NeRF)において、与えられたプロンプトに対応する明確で曖昧な表現を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:59:38 GMT)
EdiText: Controllable Coarse-to-Fine Text Editing with Diffusion Language Models [39.2] EdiTextは、制御可能なテキスト編集方法であり、様々なスケールで参照テキストを所望の属性に修正する。
テキスト編集の程度を広範囲に調整できるSDEditベースの編集技術を統合する。
本稿では,参照テキストの微妙な制御を可能にする自己条件付けに基づく,新たな微細な編集手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:04:33 GMT)
NotaGen: Advancing Musicality in Symbolic Music Generation with Large Language Model Training Paradigms [39.0] NotaGenは、高品質なクラシック楽譜を制作する可能性を探究する象徴的な音楽生成モデルである。
1.6万曲の楽譜を事前訓練し、その後「時代劇構成」のプロンプトを条件に、約9Kの高音質のクラシック曲を微調整する。
強化学習のためのCLaMP-DPO法は,人間のアノテーションや事前定義された報酬を必要とせずに,生成品質と制御性をさらに向上する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:02:39 GMT)
Machine learning for cerebral blood vessels' malformations [38.5] 脳動脈瘤と動静脈奇形は、生命を脅かす脳の血行動態である。
脳血流のパラメータは、リスクアセスメントと治療予後のための機械学習支援プロトコルに利用できる可能性がある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:57:27 GMT)
Multimodal Representation Alignment for Image Generation: Text-Image Interleaved Control Is Easier Than You Think [38.3] 本稿では,画像生成モデルにおける任意のテキストイメージインターリーブド制御のための効率的なフレームワークであるDream Engineを提案する。
提案手法は,テキスト・イメージアライメントとマルチモーダル・インターリーブド・インストラクション・チューニングからなる2段階の訓練パラダイムを利用する。
本手法は,GenEvalベンチマークで0.69点の総合スコアを達成し,有効であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:08:39 GMT)
One Model for ALL: Low-Level Task Interaction Is a Key to Task-Agnostic Image Fusion [38.2] 本稿では,デジタル写真融合から低レベルの視覚タスクを活用することを提案する。
提案されたGIFNetは、多様な融合タスクをサポートし、単一のモデルで、目に見えるシナリオと見えないシナリオの両方で高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:55:19 GMT)
MMEvalPro: Calibrating Multimodal Benchmarks Towards Trustworthy and Efficient Evaluation [38.1] MMEvalProは、トリロジー評価パイプラインとより厳格なメトリクスを通じて、Type-Iエラーを避けるために設計されたベンチマークである。
MMEvalProには2,138ドルの質問用三つ子があり、合計6,414ドルの質問がある。
既存のベンチマークと比較すると、最新のLLMとLMMによる実験では、MMEvalProの方が難しいことが示されています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:10:56 GMT)
Navigating the Edge with the State-of-the-Art Insights into Corner Case Identification and Generation for Enhanced Autonomous Vehicle Safety [38.1] 仮想シミュレーションで合成データを利用するいくつかの手法が提案されている。
最も高いリスクデータであるコーナーケース(CC)は、AV制御の開発とテストにおいて最も価値のあるものである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:47:46 GMT)
SV4D: Dynamic 3D Content Generation with Multi-Frame and Multi-View Consistency [38.0] 本稿では,多フレーム・多視点一貫した動的3Dコンテンツ生成のための遅延ビデオ拡散モデルであるStable Video 4D(SV4D)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:52:39 GMT)
Generator Matching: Generative modeling with arbitrary Markov processes [37.7] ジェネレータマッチングは任意のマルコフプロセスを用いた生成モデリングのためのモダリティに依存しないフレームワークである。
拡散モデル、フローマッチング、離散拡散モデルを含む様々な生成的モデリング手法を統合する。
これはマルコフ生成モデルの重ね合わせの構築を可能にし、厳密な方法でマルチモーダルモデルの構築を可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:41:21 GMT)
Robust Gymnasium: A Unified Modular Benchmark for Robust Reinforcement Learning [37.7] 頑健な強化学習のための統一型モジュラーベンチマークであるRobust-Gymnasiumを紹介する。
すべてのキーRLコンポーネントエージェントの観察された状態と報酬、エージェントのアクション、環境にまたがるさまざまな破壊をサポートする。
コミュニティが現在の方法を評価し、堅牢なRLアルゴリズムの開発を促進するために、オープンソースでユーザフレンドリなツールを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:50:25 GMT)
ChatMotion: A Multimodal Multi-Agent for Human Motion Analysis [37.6] ChatMotionは、人間の動作分析のためのマルチモーダルなマルチエージェントフレームワークである。
ユーザ意図を解釈し、複雑なタスクをメタタスクに分解し、モーション理解のための特別な関数モジュールを起動する。
さまざまな視点から人間の動きを分析するために、MotionCoreのような複数の特殊なモジュールを統合している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:55:34 GMT)
Order Doesn't Matter, But Reasoning Does: Training LLMs with Order-Centric Augmentation [37.5] 本稿では,論理的推論における可換性に基づく順序中心のデータ拡張フレームワークを提案する。
秩序中心の拡張を利用することで、モデルはより柔軟で一般化された推論プロセスを開発することができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:25:50 GMT)
SmartPretrain: Model-Agnostic and Dataset-Agnostic Representation Learning for Motion Prediction [37.5] 動作予測のための汎用的でスケーラブルなフレームワークであるSmartPretrainを提案する。
提案手法は対照的かつ再構成的なSSLを統合し,生成的パラダイムと識別的パラダイムの両方の長所を活用する。
SmartPretrainは、データセット、データ分割、主要なメトリクスにわたる最先端の予測モデルのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:20:00 GMT)
ConvCodeWorld: Benchmarking Conversational Code Generation in Reproducible Feedback Environments [37.2] 大規模言語モデル(LLM)は、特に対話的な設定において、コード生成に有用であることが証明されている。
既存のコード生成ベンチマークでは、マルチターンインタラクションで発生するさまざまなフィードバックをキャプチャできない。
コード生成LLMに提供されるフィードバックの質を明示的にモデル化する新しいベンチマークのセットを提示する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:54:32 GMT)
DIN-CTS: Low-Complexity Depthwise-Inception Neural Network with Contrastive Training Strategy for Deepfake Speech Detection [37.0] コントラスト学習戦略(CTS)を訓練した低複雑さDIN(Depthwise-Inception Network)に基づくディープフェイク音声検出(DSD)のためのディープニューラルネットワークアプローチを提案する。
提案システムを評価するため,ASVspoof 2019 LAのベンチマークデータセットについて広範な実験を行った。
提案システムは,ASVspoof 2019 LAチャレンジにおけるシングルシステム提案よりも優れており,リアルタイムアプリケーションの可能性を示している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:09:04 GMT)
CleanMel: Mel-Spectrogram Enhancement for Improving Both Speech Quality and ASR [36.8] 単チャンネルメル-スペクトログラムによるデノナイズ・デノベーション・デノベーション・デノベーションネットワークであるCleanMelを提案する。
提案するネットワークは、ノイズと残響のマイクロホン記録を入力として、対応するMel-spectrogramを予測する。
拡張Mel-spectrogramは、ニューラルボコーダで音声波形に変換するか、ASRに直接使用することができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:28:29 GMT)
Firewalls to Secure Dynamic LLM Agentic Networks [36.7] 本稿では,適応性,セキュリティ,プライバシのバランスをとる制約付きLLMエージェントネットワークの実用設計を提案する。
我々のフレームワークは、以前のシミュレーションからタスク固有のルールを自動で構築し、更新し、ファイアウォールを構築します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:57:55 GMT)
Accurate and Scalable Graph Neural Networks via Message Invariance [36.3] 本稿では,大規模グラフトランスダクティブ学習のための,高精度かつ高速なミニバッチ手法を提案する。
そこで本研究では,TOPが既存のミニバッチ法に比べて,大規模グラフ上での桁違いに高速であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:07:00 GMT)
Completed Feature Disentanglement Learning for Multimodal MRIs Analysis [36.3] 特徴不整合(FD)に基づく手法はマルチモーダルラーニング(MML)において大きな成功を収めた
本稿では,特徴デカップリング時に失われた情報を復元する完全特徴分散(CFD)戦略を提案する。
具体的には、CFD戦略は、モダリティ共有とモダリティ固有の特徴を識別するだけでなく、マルチモーダル入力のサブセット間の共有特徴を分離する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:49:25 GMT)
Multi-Agent Verification: Scaling Test-Time Compute with Multiple Verifiers [36.2] マルチエージェント検証(Multi-Agent Verification、MAV)は、複数の検証器を組み合わせて性能を向上させるテスト時間計算パラダイムである。
我々は,n個のベスト・オブ・nサンプリングと複数の検証器を組み合わせた,単純なマルチエージェント検証アルゴリズムであるBoN-MAVを紹介する。
この結果から,テスト時の言語モデルの性能向上に期待できる新たな次元として,検証者の数を拡大することが確認できた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:53:30 GMT)
PhantomWiki: On-Demand Datasets for Reasoning and Retrieval Evaluation [36.0] PhantomWikiは、多様な問合せ対を持つドキュメントコーパスを生成するパイプラインである。
評価毎に新しいPhantomWikiインスタンスがオンデマンドで生成される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:51:22 GMT)
Learning Mask Invariant Mutual Information for Masked Image Modeling [35.6] Maskedencodes (MAEs) はコンピュータビジョンにおける卓越した自己教師型学習パラダイムである。
近年の研究では、コントラスト学習と特徴表現分析を通じて、MAEの機能の解明が試みられている。
本稿では,情報理論における情報ボトルネックの原理を活用することで,MAEを理解するための新たな視点を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:19:05 GMT)
Why Are Web AI Agents More Vulnerable Than Standalone LLMs? A Security Analysis [35.6] 本研究では,WebAIエージェントの脆弱性の増加に寄与する要因について検討する。
我々は,WebAIエージェントの脆弱性を増幅する3つの重要な要因,(1)ユーザの目標をシステムプロンプトに埋め込んだこと,(2)マルチステップアクション生成,(3)観察能力の3つを特定した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:56:26 GMT)
Cache-of-Thought: Master-Apprentice Framework for Cost-Effective Vision Language Model Inference [35.5] Cache of Thought (CoT)は、大小ビジョン言語モデル(VLM)間の協調推論のためのフレームワークである
CoTはキャッシュ内の大きなVLMから高品質なクエリ結果を管理し、それを新しいマルチモーダル検索とコンテキスト内学習によって選択し、小さなVLMの性能向上を支援する。
我々はCoTを広く評価し、様々な一般的なVQAベンチマークで評価し、CoTは同じ予算でVQA全体のパフォーマンスを7.7%向上させ、特に見習いのVLMの性能を36.6%向上させることを示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:09:20 GMT)
Probabilistic Federated Prompt-Tuning with Non-IID and Imbalanced Data [35.5] 微調整事前学習モデルは、適度なデータで複雑なタスクを解決する機械学習の一般的なアプローチである。
事前訓練されたモデル全体を微調整することは、ローカルデータ分布が多様に歪んだフェデレーションデータシナリオでは効果がない。
提案手法は,フェデレーション学習を分散集合モデリングタスクに変換し,事前学習したモデルを世界規模で微調整するための多様なプロンプトを集約する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:31:34 GMT)
MMKE-Bench: A Multimodal Editing Benchmark for Diverse Visual Knowledge [35.3] 本稿では,MultiModal Knowledge Editing Benchmark であるMMKE-Benchを紹介する。
LMMが現実世界のシナリオで様々な視覚的知識を編集する能力を評価するように設計されている。
ビジュアルエンティティ編集、ビジュアルセマンティック編集、ユーザー固有の編集という3種類の編集タスクが組み込まれている。
知識は2,940点、画像は8,363点、評価質問は自動的に生成され、人間による検証が行われる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:21:28 GMT)
Emergent Symbolic Mechanisms Support Abstract Reasoning in Large Language Models [35.1] オープンソース言語モデルにおける抽象ルール帰納を支援する内部メカニズムについて検討する。
抽象的推論を3つの計算で実装した創発的シンボリックアーキテクチャを同定する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:02:15 GMT)
Can Textual Gradient Work in Federated Learning? [34.8] クライアントがローカルに最適化されたプロンプトをアップロードできるようにする新しいFLパラダイムであるFederated Textual Gradient(FedTextGrad)を導入する。
数値集計用に設計された従来のFLフレームワークとは異なり、FedTextGradはテキストデータを扱うために特別に最適化されている。
本研究は,FLトレーニングにおいて重要な要素(例えば,局所的なステップ)を適切に調整することの重要性を強調した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:03:24 GMT)
Factual consistency evaluation of summarization in the Era of large language models [34.5] 既存の事実整合性メトリクスは、そのパフォーマンス、効率、説明可能性によって制約されます。
大規模言語モデル(LLM)の最近の進歩は,テキスト評価において顕著な可能性を示している。
しかし, 事実整合性評価の有効性は未解明のままである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:26:10 GMT)
Transformers Handle Endogeneity in In-Context Linear Regression [34.5] インストゥルメンタル変数(IV)を用いて内在性を効果的に扱うメカニズムをトランスフォーマーが本質的に持っていることを示す。
提案手法では,事前学習損失の最小化が最小限の余剰損失を達成できることを示す理論的保証を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:56:30 GMT)
3rd Place Solution for VisDA 2021 Challenge -- Universally Domain Adaptive Image Recognition [34.4] 一般的な特徴抽出と領域適応スキームを集約することで、ユニバーサルドメイン適応(UniDA)手法を導入する。
リーダーボードに示すように、我々の提案したUniDAメソッドは、VisDA 2021 Challengeで48.49%のACCと70.8%のAUROCで3位にランクインしている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:41:26 GMT)
Accelerating Training with Neuron Interaction and Nowcasting Networks [34.1] 学習可能な更新ルールは、トレーニングや使用に費用がかかり不安定になる可能性がある。
We propose NiNo to accelerate training based on weight nowcaster network (WNNs)。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:52:21 GMT)
Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation [34.1] 自己回帰(AR)モデリングは、最先端の言語と視覚的生成モデルを支える。
伝統的に、トークン'' は最小の予測単位として扱われ、しばしば言語における離散的なシンボルまたは視覚における量子化されたパッチとして扱われる。
トークンの概念をエンティティXに拡張するフレームワークであるxARを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:59:08 GMT)
Improved Baselines with Synchronized Encoding for Universal Medical Image Segmentation [34.1] SyncSAMは、医用画像符号化を強化するために、畳み込みとトランスフォーマー機能を統合した同期デュアルブランチエンコーダを使用する。
SyncSAMはテストセットで最先端のパフォーマンスを実現し、目に見えないデータセットで強力なゼロショット機能を示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:24:27 GMT)
On the Role of Individual Differences in Current Approaches to Computational Image Aesthetics [33.6] 画像アセスメント(IAA)は、画像の多様性とユーザの主観性によって複雑なタスクである画像美学を評価する。
ジェネリックIAA(GIAA)モデルは平均麻酔スコアを推定し、パーソナライズIAA(PIAA)モデルは転送学習を用いてGIAAを適応し、ユーザ主観性を取り入れる。
この研究はIAAの理論的基盤を確立し、個々の特性を分布形式にエンコードする統一モデルを提案し、個人とグループの両方で評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:01:19 GMT)
Programming Really Is Simple Mathematics [33.4] 本稿では,基本集合論に基づく小数理理論(PRISM)としてのプログラミングの基礎を再構築する。
プログラムとプログラミングの重要な性質を特徴づける数十の定理を導出する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:44:11 GMT)
TRIFFID: Autonomous Robotic Aid For Increasing First Responders Efficiency [33.3] 本稿では,無人航空機と高度人工知能機能を組み合わせたTRIFFIDシステムを提案する。
提案システムは,高度なミッション計画,安全監視,適応型タスク実行機能を提供することで,緊急対応チームを強化する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:07:06 GMT)
Divide-Verify-Refine: Can LLMs Self-Align with Complex Instructions? [33.2] 複雑な命令を単一制約に分割し,適切なツールを作成するためのフレームワークを提案する。
次に、厳密なチェックとテキストガイダンスを提供するツールを使用して応答を検証する。
改良効率を最大化するために,改良レポジトリが改良を成功させる動的数発プロンプトを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:16:18 GMT)
Rethinking Epistemic and Aleatoric Uncertainty for Active Open-Set Annotation: An Energy-Based Approach [32.8] アクティブラーニングは、オープンセットクラスの存在において重大な課題に直面している。
既存のメソッドは、既知のクラスに属する可能性のあるクエリ例を優先順位付けするか、あるいは、非常に不確実な予測を持つクラスのクエリに焦点を当てる。
本研究では,EUとAUを効果的に統合し,優れた性能を実現するための,エネルギーベースのアクティブオープンセットフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:02:58 GMT)
High-dimensional Analysis of Knowledge Distillation: Weak-to-Strong Generalization and Scaling Laws [32.6] 隆起のない高次元回帰のために, このプロセスの鋭い特徴付けを行う。
弱い特徴を捨てることの利点と限界を明らかにする最適代理モデルの形式を同定する。
我々は、リッジレス回帰とニューラルネットワークアーキテクチャの両方に関する数値実験の結果を検証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:49:33 GMT)
Forecasting Whole-Brain Neuronal Activity from Volumetric Video [32.5] 本稿では,ボリュームビデオから直接神経活動を予測する可能性について検討する。
我々は、脳内の離れた領域からの情報を統合するために、大きな受容野を持つモデルを設計する。
最近提案されたゼブラフィッシュの全脳活動予測ベンチマークであるZAPBenchでは,トレースベースの予測手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:54:56 GMT)
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention [32.5] 我々は、アルゴリズムのイノベーションとハードウェアの最適化を統合する、ネイティブにトレーニング可能なスパースアテンションメカニズムであるNSAを紹介する。
NSAは動的な階層的なスパース戦略を採用し、粗粒のトークン圧縮と細粒のトークン選択を組み合わせて、グローバルなコンテキスト認識と局所的精度の両方を維持する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:01:21 GMT)
Continual Memorization of Factoids in Language Models [32.4] 近年の研究では、記憶の微調整は知識の保存に効果がないか、幻覚を悪化させる可能性があることが示されている。
モデルがファクトイドの集合を記憶し、後続のデータセットを微調整する複数の段階を通して保持しなければならない設定を導入する。
特に第2段階でファクトイドを記憶する必要がある場合, LMは忘れることに悩まされている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:08:33 GMT)
Recent Advances on Generalizable Diffusion-generated Image Detection [32.0] 拡散モデルの台頭は生成画像の忠実度と多様性を著しく向上させた。
拡散モデルを利用して高品質なDeepfakeイメージを作成することで、画像認証の課題を提起する。
一般化可能な拡散生成画像検出に関する研究は急速に進んでいる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:14:40 GMT)
On the Optimal Memorization Capacity of Transformers [32.0] 変換器は$tildeO(sqrtN)$パラメータでラベルを記憶でき、$N$の入力シーケンスは$n$である。
また、シーケンス・ツー・シーケンス設定における記憶能力を分析し、$tildeO(sqrtnN)$パラメータが十分であるだけでなく、ハードマックスを持つ変換器にも必要であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:19:55 GMT)
Reducing Tool Hallucination via Reliability Alignment [31.8] 大きな言語モデル(LLM)は、言語生成を超えて、外部ツールと対話し、自動化と現実世界のアプリケーションを可能にする機能を拡張した。
モデルが不適切なツールを選択するか、それらを誤用するツール幻覚は、誤ったタスクの実行、計算コストの増大、システムの信頼性の低下につながる重要な課題を引き起こす。
RelyToolBenchを導入し、特殊なテストケースと新しいメトリクスを統合し、幻覚を意識したタスクの成功と効率を評価する。
最後に、信頼性アライメントフレームワークであるRelignを提案する。このフレームワークは、ツール使用のアクション空間を拡張して、不決定なアクションを含むようにし、LCMがツールの使用を遅らせたり、明確化を求めたり、ツールの選択を調整することを可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:43:54 GMT)
Shared Autonomy for Proximal Teaching [31.7] モータースキルの学習は、パーソナライズされた指導を提供する経験豊富な専門家を必要とすることが多い。
Z-COACHは、解釈可能なタスクサブスキルをターゲットにしたパーソナライズされた指導を提供するための共有自律性を利用する方法である。
ユーザスタディでは、Z-COACHが各学生が最初に行うべきスキルの特定に役立ち、運転時間、行動、スムーズさの全体的な改善につながることを示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:14:17 GMT)
ECCOS: Efficient Capability and Cost Coordinated Scheduling for Multi-LLM Serving [31.6] 大規模言語モデル(LLM)は、システム内のサービスエンドポイントとしてますます多くデプロイされている。
既存のスケジューリングフレームワークは主にレイテンシの最適化をターゲットとしている。
本稿では,マルチLLMサービスのための機能コスト協調スケジューリングフレームワークECCOSを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:35:31 GMT)
SecureGaze: Defending Gaze Estimation Against Backdoor Attacks [31.6] 視線推定モデルは、運転注意監視や人間とコンピュータの相互作用といったアプリケーションで広く利用されている。
視線推定には多くの方法が存在するが、高い性能を達成するためにデータに精通した深層学習に大きく依存している。
この依存により、実践者は、検証されていない公開データセットからトレーニングデータを収集したり、アウトソースモデルのトレーニングをしたり、事前トレーニングされたモデルに依存することを余儀なくされる。
このような攻撃では、敵はトレーニングデータを害してバックドアトリガーを注入し、バックドアの脆弱性を発生させる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:33:49 GMT)
Meta-Reasoner: Dynamic Guidance for Optimized Inference-time Reasoning in Large Language Models [31.6] 大規模言語モデルは、複雑なタスクを解決するために、より長い推論チェーンに依存している。
この試行錯誤アプローチは、しばしば高い計算オーバーヘッドとエラーの伝播をもたらす。
推論時間推論を動的に最適化するフレームワークであるMeta-Reasonerを紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:40:13 GMT)
CUIfy the XR: An Open-Source Package to Embed LLM-powered Conversational Agents in XR [31.5] 大言語モデル (LLM) は音声テキスト (STT) とテキスト音声 (TTS) モデルを備えた非プレーヤ文字 (NPC) を用いており、XR のより自然な対話型ユーザインタフェース (CUI) を促進するために、従来の NPC やプレスクリプトの NPC よりも大きな利点をもたらす。
本稿では,広く使用されているLLM, STT, TTSモデルと音声によるNPCユーザインタラクションを容易にするオープンソース,カスタマイズ可能,拡張可能,プライバシ対応のUnityパッケージCUIfyを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:26:20 GMT)
PhyMPGN: Physics-encoded Message Passing Graph Network for spatiotemporal PDE systems [31.0] 我々は物理符号化されたメッセージパッシンググラフネットワーク(PhyMPGN)という新しいグラフ学習手法を提案する。
我々は,GNNを数値積分器に組み込んで,与えられたPDEシステムに対する時間的時間的ダイナミクスの時間的行進を近似する。
PhyMPGNは、粗い非構造メッシュ上での様々なタイプの時間的ダイナミクスを正確に予測することができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:11:42 GMT)
No Free Lunch Theorem for Privacy-Preserving LLM Inference [30.6] 本研究では,プライバシ保護型大規模言語モデル(LLM)を推定するためのフレームワークを開発する。
プライバシー保護とユーティリティの相互作用を調べるための、しっかりとした理論的基盤を築いている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:55:21 GMT)
Bugfix: a standard language, database schema and repository for research on bugs and automatic program repair [30.5] APR(Automatic Program repair)は、バグを検出するときにプログラムを修正するための提案を提供する、素晴らしいアイデアです。
Bugfixは、標準的な表記法、ツール、インターフェース、バグや修正のデータベースなど、このようなフレームワークを提供するための取り組みである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:48:22 GMT)
What is the Alignment Objective of GRPO? [30.4] 本稿では,GRPOアルゴリズムの定常ポリシを特徴付けるためのフレームワークを提案する。
選好アグリゲーションの正確な形は、報酬選好モデルの定義方法とペナルティ関数から生じる。
二分問題に対する集合的選好の明示的な特徴付けとして,大小2の群に対して,大小2の群に対して,大小の群を限定する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:18:29 GMT)
MFSR: Multi-fractal Feature for Super-resolution Reconstruction with Fine Details Recovery [30.3] フラクタルな特徴は、画像内のマイクロテクスチャ構造とマクロテクスチャ構造のリッチな詳細をキャプチャすることができる。
MFSRと呼ばれる低解像度画像のフラクタル特徴を取り入れた拡散モデルに基づく超解像法を提案する。
様々な顔および自然画像データセットで行われた実験は、MFSRが高品質な画像を生成することを実証している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:12:18 GMT)
Mitigating Unintended Memorization with LoRA in Federated Learning for LLMs [30.1] フェデレートラーニング(FL)は、クライアント間の直接的なデータ露光を回避する共同トレーニングの一般的なパラダイムである。
敵対的かつ正直なクライアントは、単にターゲットのプロンプトを通じて、他の参加者のトレーニングデータを復元することができる。
低ランク適応(LoRA)はFL中の記憶を最大10倍に減少させる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:04:13 GMT)
KEEC: Koopman Embedded Equivariant Control [29.7] 未知の非線形力学を持つシステムを制御する効率的な方法は、適切な埋め込みや表現を見つけることである。
Koopman Embedded Equivariant Control (KEEC) は、クープマン作用素が潜在力学として近似されるような状態とベクトル場の埋め込みを学習する。
本アルゴリズムは,様々な制御領域で実施した実験において,優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:21:09 GMT)
Vital Insight: Assisting Experts' Context-Driven Sensemaking of Multi-modal Personal Tracking Data Using Visualization and Human-In-The-Loop LLM Agents [29.7] Vital Insightは、スマートフォンやウェアラブルからのマルチモーダル受動的センシングデータの人間のループ推論(センスメイキング)と可視化を可能にする、新しいLLM支援のプロトタイプシステムである。
我々は、専門家のそれとのインタラクションを観察し、専門家が直接データ表現とAIをサポートする推論の間をどう移動するかを説明する専門家のセンスメイキングモデルを開発する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:31:58 GMT)
AIR: Complex Instruction Generation via Automatic Iterative Refinement [29.6] 複雑な命令を生成するための現在のアプローチは、しばしば現在の命令要求とは無関係である。
本稿では,制約付き複雑な命令を生成するための,新しい反復修正フレームワークを提案する。
10Kの複雑な命令でAIR-10Kデータセットを構築し、我々のアプローチで生成された命令は、複雑な命令に従うモデルの能力を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:42:10 GMT)
MIH-TCCT: Mitigating Inconsistent Hallucinations in LLMs via Event-Driven Text-Code Cyclic Training [29.6] 本稿では、イベントベースのテキストを利用して対応するコードを生成する新しいフレームワークを提案し、循環学習を用いてコードの論理的一貫性を自然言語に効果的に伝達する。
提案手法は,3つの主要な大規模言語モデル(LLM)と2つの自然言語タスクのカテゴリにおいて,矛盾する幻覚を著しく低減する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:49:15 GMT)
Knowledge Bridger: Towards Training-free Missing Multi-modality Completion [29.1] 「知識ブリッジ」はモダリティに依存しないものであり、欠落したモダリティの生成とランキングを統合している。
一般領域と医療領域をまたいだ実験結果から,本手法は競合する手法よりも一貫して優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:14:11 GMT)
AutoBS: Autonomous Base Station Deployment Framework with Reinforcement Learning and Digital Twin Network [29.0] AutoBSは6Gネットワークに最適なベースステーション(BS)を配置するための強化学習ベースのフレームワークである。
以上より,AutoBSは1つのBSに対して95%,複数のBSに対して90%を達成できた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:32:44 GMT)
Understanding the Limits of Deep Tabular Methods with Temporal Shift [28.7] 本稿では,Fourier級数展開に基づく時間的組込み手法を提案し,時間的パターンを学習し,組み込む。
我々の実験は、この時間的埋め込みと改良されたトレーニングプロトコルを組み合わせることで、時間的データから学習するためのより効果的で堅牢なフレームワークが提供されることを示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:48:53 GMT)
ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routing [28.7] 計算予算を増大させることなく、モデルキャパシティをスケールアップするために、緩やかに活性化されたMixture-of-Experts (MoE)モデルが広く採用されている。
我々は,従来のTopK+Softmaxルーティングの簡易かつ効果的なドロップイン置換を提供する,完全に微分可能なMoEアーキテクチャであるReMoEを提案する。
ReMoEは、さまざまなモデルサイズ、専門家数、粒度のレベルにおいて、バニラTopKのMoEを一貫して上回る。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:33:09 GMT)
Do Retrieval-Augmented Language Models Adapt to Varying User Needs? [28.7] 本稿では,3つのユーザニーズ条件下でALMを体系的に評価する新しい評価フレームワークを提案する。
ユーザインストラクションと検索された情報の性質の両方を変えることで、我々のアプローチは現実世界のアプリケーションの複雑さを捉えます。
本研究は,検索システム開発におけるユーザ中心評価の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:39:38 GMT)
UOOR: Seamless and Traceable Requirements [28.6] 提案手法は,UOORと呼ばれる要求工学手法である。
このメソッドは多くの既知の要件概念を統一し、プロジェクトライフサイクル全体を通してシームレスな変更に対応およびサポートするために完全に設計されたフレームワークに新しいものをいくつか追加します。
UOORアプローチは単なる理論的な提案ではなく、実用のために設計され、重要な実世界のケーススタディであるRoboraceに応用されている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:09:35 GMT)
When Graph meets Multimodal: Benchmarking and Meditating on Multimodal Attributed Graphs Learning [28.6] マルチモーダル分散グラフ(MAG)は、ノードにアタッチされたマルチモーダル属性を通じて広範囲にわたる知識を含む、現実世界のアプリケーションにおいてユビキタスである。
ソーシャルネットワークやeコマースといった多様な研究分野を前進させる可能性にもかかわらず、MAG表現学習(MAGRL)はいまだに未調査である。
我々はまず,テキスト属性と視覚属性の両方を持つ様々な領域からのキュレートされたグラフを特徴付ける,包括的なMAGベンチマークデータセットであるMAGBを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:51:24 GMT)
Image Referenced Sketch Colorization Based on Animation Creation Workflow [28.3] 実世界のアニメーション制作にインスパイアされた拡散型フレームワークを提案する。
本手法では,スケッチをカラー参照として空間誘導とRGB画像を利用し,マスクを用いた参照画像から前景と背景を別々に抽出する。
この設計により、拡散モデルは前景や背景からの情報を独立して統合することができ、干渉を防止し、空間的アーティファクトを排除できる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:04:47 GMT)
Training Robust Graph Neural Networks by Modeling Noise Dependencies [28.1] 実世界のアプリケーションでは、グラフのノード機能は様々なソースからのノイズを含むことが多く、性能が著しく低下する。
本稿では,グラフ構造やノードラベルに伝搬するノイズ依存性の連鎖をノードの特徴として生み出す,より現実的なノイズシナリオ,依存性を意識したグラフ上のノイズ(DANG)を紹介する。
本稿では,DANGのデータ生成プロセス(DGP)における変数間の因果関係を変動推論を用いてキャプチャする,新しいロバストなGNN,DA-GNNを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:30:13 GMT)
Learned Image Transmission with Hierarchical Variational Autoencoder [28.1] 画像伝送のための革新的階層型ジョイントソースチャネル符号化(HJSCC)フレームワークを提案する。
提案手法では,送信側のボトムアップパスとトップダウンパスの組み合わせを利用して,元の画像の複数の階層表現を自動回帰的に生成する。
提案手法は, 周波数歪み特性において既存のベースラインより優れ, チャネルノイズに対するロバスト性を維持している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:30:43 GMT)
PFLlib: A Beginner-Friendly and Comprehensive Personalized Federated Learning Library and Benchmark [28.0] pFLは、各クライアントのグローバルおよびパーソナライズされた目標をFL設定でバランスさせることを目的としています。
PFLlibは、統合ベンチマークプラットフォームを備えた包括的なpFLライブラリである。
PFLlibは、GitHubで1600以上のスターと300のフォークを獲得した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:41:34 GMT)
Say Less, Mean More: Leveraging Pragmatics in Retrieval-Augmented Generation [27.9] Dense Passage Retrievalのような検索拡張生成(RAG)フレームワークに実用的原理を注入し、検索コンテキストの有用性を高めるための、単純で教師なしの手法を提案する。
提案手法はまず,RAGが検索した文書プール内のどの文が,手元にある質問に最も関連があるかを識別し,入力された質問に対処するすべてのトピックをカバーし,そのコンテキスト内でこれらの文をハイライトする。
PubHealthでは19.7%、ARC-Challengeでは10%まで精度が向上している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:55:08 GMT)
Multi-modal Food Recommendation using Clustering and Self-supervised Learning [27.7] CLUSSLは,クラスタリングと自己教師型学習を活用する新しい食品レコメンデーションフレームワークである。
CLUSSLは、各モダリティに特有のグラフを離散的/連続的な特徴で定式化し、意味的特徴を構造的表現に変換する。
異なるユニモーダルグラフから導出されるレシピ表現間の独立性を促進するために,自己指導型学習目標を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:41:12 GMT)
Bayesian Computation in Deep Learning [27.7] 本稿では,ディープラーニングモデルに適用したベイズ計算手法として近似推論手法を紹介する。
本稿では,ベイズニューラルネットワークと深部生成モデルに対する一般的な計算手法について述べる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:22:35 GMT)
Proving Olympiad Inequalities by Synergizing LLMs and Symbolic Reasoning [27.6] 大規模言語モデル(LLM)は、証明システム内で証明ステップを生成することによって、数学的定理を正式に証明することができる。
本稿では,LLMが学習した数学的直観と,記号的手法によって符号化された領域固有の洞察を相乗化する,ニューロシンボリック・戦術生成器を提案する。
複数の数学コンペティションから161の挑戦的不等式を評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:24:25 GMT)
Few-Shot, No Problem: Descriptive Continual Relation Extraction [27.3] AIシステムが現実世界のドメインにおける進化する関係を識別し、適応できるようにする上で、わずかなショットの連続関係抽出は重要な課題である。
従来のメモリベースのアプローチは、しばしば限られたサンプルに過度に適合し、古い知識の強化に失敗する。
本稿では,関係関係記述を生成するために,大規模言語モデルから始まる新しい検索ベースソリューションを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:44:30 GMT)
InterMimic: Towards Universal Whole-Body Control for Physics-Based Human-Object Interactions [27.2] このフレームワークは、単一のポリシーで、何時間も不完全なMoCapデータからしっかりと学習することができる。
実験の結果,InterMimicは複数のHOIデータセットにまたがって,現実的で多様なインタラクションを生成できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:59:12 GMT)
A Survey on Video Analytics in Cloud-Edge-Terminal Collaborative Systems [27.2] クラウドエッジ端末協調(CETC)システムは、効率的なビデオ処理、リアルタイム推論、プライバシ保存分析を可能にする。
この調査では、階層的、分散的、ハイブリッドなフレームワークを含む、基本的なアーキテクチャコンポーネントをまず分析します。
また、適応型タスクオフロードとリソース対応スケジューリングを取り入れたハイブリッドビデオ分析についても検討した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:14:12 GMT)
Multi-Keypoint Affordance Representation for Functional Dexterous Grasping [27.0] 本稿では,機能的デキスタラスグルーピングのためのマルチキーポイントアプライアンス表現を提案する。
本手法は,機能的接触点の局在化により,タスク駆動型グリップ構成を符号化する。
提案手法は,手頃な局所化精度,一貫性の把握,未知のツールやタスクへの一般化を著しく改善する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:54:53 GMT)
Joint Fusion and Encoding: Advancing Multimodal Retrieval from the Ground Up [26.3] 今日のインターネットアプリケーションには情報検索が不可欠である。
伝統的なセマンティックマッチング技術は、細粒なクロスモーダル相互作用を捉えるのにしばしば不足する。
我々は、視覚的およびテキスト的手がかりをゼロから融合する統合検索フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:41:55 GMT)
Walking the Web of Concept-Class Relationships in Incrementally Trained Interpretable Models [25.8] 概念とクラスは複雑な関係の網を形成しており、それは劣化しやすく、経験を通じて保存および拡張する必要がある。
本研究では,マルチモーダルな概念を用いて,学習可能なパラメータの数を増やすことなく分類を行う新しい手法である MuCIL を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:59:29 GMT)
Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts [25.5] Time-MoEは、より大きく、より有能な基礎モデルを予測するために設計された、スケーラブルで統一されたアーキテクチャである。
Time-MoEは、予測毎にネットワークのサブセットだけを活性化することで、計算効率を向上させる。
時系列基礎モデルを24億のパラメータに拡張し,予測精度を大幅に向上させた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:38:14 GMT)
Controllable single-photon scattering in a Rydberg-atom-waveguide system via van der Waals interactions [25.5] 一対のRydberg原子に結合した導波路からなる系における単一光子散乱をコヒーレント場により照らし出す。
我々は、ファンデルワールス相互作用の強さが距離によって変化するため、ライドベルク封鎖とライドベルク反ブロッキング体制の間で遷移する。
我々は、特定の単一光子反射スペクトルに対応する、RydbergブロックとRydbergアンチブロッキングの散乱基準を導出した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:13:26 GMT)
Space Rotation with Basis Transformation for Training-free Test-Time Adaptation [25.4] テスト時間適応のための基底変換を用いた訓練不要な特徴空間回転を提案する。
クラス間の固有の区別を利用することで、元の特徴空間を再構成し、それを新しい表現にマッピングする。
本手法は,性能と効率の両面で最先端技術より優れている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:15:34 GMT)
FlexiDiT: Your Diffusion Transformer Can Easily Generate High-Quality Samples with Less Compute [25.2] 当社のフレームワークでは、事前トレーニングされたDiTモデルを、FlexiDiTと呼ばれる、屈曲可能なモデルに変換することが可能です。
本研究では,単一のエンフレキシブルモデルが画質の低下を伴わずに画像を生成する方法を示す。
我々は、FlexiDiTモデルが最大7,5$%の計算量でサンプルを生成するビデオ生成のために、我々のアプローチをどのように簡単に拡張できるかを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:16:56 GMT)
GenPC: Zero-shot Point Cloud Completion via 3D Generative Priors [24.8] GenPCは、明示的な3D生成先行情報を活用することで、高品質な現実世界のスキャンを再構築するように設計されている。
我々の重要な洞察は、最近のフィードフォワード3D生成モデルは、広範囲のインターネットスケールのデータに基づいて訓練され、ゼロショット設定でシングルビュー画像から3D生成を行う能力を示したことである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:09:57 GMT)
Recommendations by Concise User Profiles from Review Text [24.4] この研究は、非常に疎いインタラクションを持つユーザの難解かつ過小評価されたケースに対処する。
LLMを通して全てのレビューの全文をフィードすることは、信号とノイズの比が弱く、処理されたトークンのコストが高くなる。
このフレームワークは、まず簡潔なユーザプロファイルを計算し、これらのみをトランスフォーマーベースのレコメンデータのトレーニングに投入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:36:08 GMT)
JSONSchemaBench: A Rigorous Benchmark of Structured Outputs for Language Models [24.0] 制約付き復号化は、世代間構造的出力を強制する分野において支配的な技術として出現している。
本稿では,制約に順応した出力の生成効率,生成した出力の多様な品質のカバレッジという,3つの重要な領域にわたる制約付き復号手法を評価するための評価フレームワークを提案する。
我々の研究は、制約付きデコードフレームワークを改善し、制約付きデコード構造生成を評価するための新しい標準を設定するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:37:21 GMT)
Trustworthy AI-Generative Content for Intelligent Network Service: Robustness, Security, and Fairness [23.9] TrustGAINは信頼できるAIGCフレームワークであり、堅牢でセキュアで公正なネットワークサービスを組み込んでいる。
本稿では,ネットワークサービスにおける安全でないコンテンツのロバストな検出を導くための,感情分析に基づく新しい検出手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:09:23 GMT)
Frequency-Adaptive Low-Latency Object Detection Using Events and Frames [23.8] オブジェクト検出のためのFusing EventsとRGBイメージは、悪環境におけるEvent Cameraの堅牢性を活用する。
2つの重要なミスマッチ:低遅延イベント textitvs.high-latency RGB frame と時間的にスパースなラベル。
textbfFrequency-textbfAdaptive Low-Latency textbfObject textbfDetector (FAOD)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:43:29 GMT)
R1-T1: Fully Incentivizing Translation Capability in LLMs via Reasoning Learning [23.7] 本稿では,R1-Translator (R1-T1)について紹介する。
実験の結果,Flores-101 テストセット上では,21言語での翻訳性能が着実に向上し,80の翻訳方向が得られた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:57:00 GMT)
CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving [23.7] 軌道計画は自動運転に不可欠であり、複雑な環境で安全かつ効率的な航法を確保する。
本稿では、強化学習を用いてマルチモーダル軌道を生成するtextbfConsistent textbfauto-textbfregressive textbfPlannerについて紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:26:22 GMT)
Elucidating the solution space of extended reverse-time SDE for diffusion models [23.6] サンプリングプロセスを拡張逆時間SDE(ER SDE)として定式化する。
SDE と VE SDE に対してそれぞれ正確な解と近似解を提供する。
我々は,ER-SDE-rsという効率的な高品質なサンプリング装置を考案した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:11:01 GMT)
LiteASR: Efficient Automatic Speech Recognition with Low-Rank Approximation [23.5] 本稿では,ASRエンコーダの低ランク圧縮方式であるLiteASRを導入する。
評価の結果,Whisperの大容量v3エンコーダサイズを50%以上圧縮し,Whisper媒体サイズと転写精度を比較検討した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:52:21 GMT)
Self-Training Elicits Concise Reasoning in Large Language Models [23.5] チェーン・オブ・シント(CoT)推論により、中間トークンによるさらなる計算を大規模言語モデル(LLM)が利用できるようになった。
自己生成した簡潔な推論経路を利用する簡単な微調整法を提案する。
提案手法は,GSM8KおよびMATH上の5つのモデルファミリに対して,平均精度を維持しつつ,出力トークンの30%削減を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:14:50 GMT)
Evaluating Human Trust in LLM-Based Planners: A Preliminary Study [23.3] 大きな言語モデル(LLM)は、計画タスクにますます使われています。
本研究では,計画ドメイン定義言語(PDDL)ドメインのユーザスタディを通じて,LLMベースのプランナと古典的なプランナの人間信頼を比較した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:10:52 GMT)
Dreamweaver: Learning Compositional World Models from Pixels [23.0] 人間は自然に世界の知覚を物体とその属性に分解する能力を持っている。
この認知的プロセスは、慣れ親しんだ概念を再結合することで、新しい未来を想像することができる。
生のビデオから階層的および構成的表現を発見するために設計されたニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:09:15 GMT)
SurveyX: Academic Survey Automation via Large Language Models [22.6] SurveyXは、自動サーベイ生成のための効率的で組織化されたシステムである。
調査構成過程を, 準備と生成の2段階に分割する。
これは調査組成物の有効性を著しく向上させる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:30:11 GMT)
Twofold Debiasing Enhances Fine-Grained Learning with Coarse Labels [22.6] 粗いきめ細かい教師付き事前訓練は、識別のための重要なきめ細かい特徴の抽出を抑制する。
モデルは、限られたきめ細かいサンプルによって生じる偏りのある分布によって過度に適合する。
本稿では,これらの課題に対処する2次元デバイアス法(TFB)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:41:49 GMT)
Extending the coherence time limit of a single-alkali-atom qubit by suppressing phonon-jumping-induced decoherence [22.6] 電子状態に符号化された量子ビットのコヒーレンス時間は、最も重要なパラメータの1つである。
コヒーレンス時間は電子状態間のエネルギーの相対安定性によって決定される。
光学的に捕捉されたアルカリ原子の2つの基底電子状態に符号化された量子ビットのデコヒーレンスを完全に記述する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:03:12 GMT)
Physics-Driven Data Generation for Contact-Rich Manipulation via Trajectory Optimization [22.2] 本稿では,物理シミュレーション,人間の実演,モデルベース計画を統合した低コストなデータ生成パイプラインを提案する。
コンタクトリッチな操作タスクに挑戦するための拡散ポリシーをトレーニングすることで,パイプラインの有効性を検証する。
トレーニングされたポリシは、バイマガルアイワアーム用のハードウェアにゼロショットでデプロイされ、人間の入力を最小限に抑えて高い成功率を達成する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:56:01 GMT)
DECO: Unleashing the Potential of ConvNets for Query-based Detection and Segmentation [22.2] 本稿では、オブジェクトクエリと画像特徴との相互作用を畳み込み層を介して行うInterConvと呼ばれる新しいメカニズムを提案する。
提案したInterConvでは,バックボーンと畳み込みエンコーダ・デコーダアーキテクチャで構成される検出ConvNet(DECO)を構築している。
我々のDECは、検出精度と走行速度の点で競合性能を達成する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:58:37 GMT)
LLM as a Broken Telephone: Iterative Generation Distorts Information [22.1] この研究は、連鎖した人間のコミュニケーションにおける「壊れた電話」効果にインスパイアされている。
言語の選択や連鎖の複雑さの影響を受け、歪みは時間の経過とともに蓄積する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:46:23 GMT)
Shifting the Paradigm: A Diffeomorphism Between Time Series Data Manifolds for Achieving Shift-Invariancy in Deep Learning [22.1] ディープラーニングモデルは、出力の変化を引き起こす入力シフトに敏感である。
我々は高次元データ多様体から同じ次元の別の多様体にサンプルをマッピングする微分可能関数を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:42:52 GMT)
SSD: A State-based Stealthy Backdoor Attack For Navigation System in UAV Route Planning [22.0] 無人航空機(UAV)はリスクの高い作業を行うためにますます用いられる。
UAVはサイバーセキュリティの脅威をエスカレートする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:17:58 GMT)
SegAnyPET: Universal Promptable Segmentation from Positron Emission Tomography Images [21.9] 本研究は,PET画像からの普遍的プロンプト可能なセグメンテーションのためのモダリティ特異的な3次元基礎モデルであるSegAnyPETを開発する。
また,SegAnyPETは1点または数点のプロンプトポイントのみを用いて,視線と視線を正確にセグメント化できることを示す。
PET画像の最初の基盤モデルとして、SegAnyPETは、分子イメージングのための様々な下流タスクへの応用を推し進めると考えている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:08:05 GMT)
LLM-QE: Improving Query Expansion by Aligning Large Language Models with Ranking Preferences [21.8] 本稿では,Lumge Language Models (LLM) を利用して文書ベースのクエリ拡張を生成する新しいアプローチ LLM-QE を紹介する。
ゼロショット高密度検索モデルであるContrieverの実験は、LLM-QEの有効性を実証し、8%以上の改善を実現した。
LLM-QEは、高密度レトリバーのトレーニングプロセスも改善し、微調整後の5%以上の改善を実現している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:00:36 GMT)
Sensing and Steering Stereotypes: Extracting and Applying Gender Representation Vectors in LLMs [21.7] 大規模言語モデル(LLM)において「ジェンダー」の概念がどのように表現されるかを検討する。
ラベル付きデータなしで確率重み付けにより概念表現を抽出する新しい手法を提案する。
また,モデル予測の高精度なステアリングを可能にするプロジェクションベース手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:24:09 GMT)
Evaluating System 1 vs. 2 Reasoning Approaches for Zero-Shot Time-Series Forecasting: A Benchmark and Insights [21.7] 自己整合性は、最も効果的なテスト時の推論戦略として現れます。
グループ相対的な政策最適化は、訓練後の推論能力を高めるためにより適切なアプローチとして現れる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:27:37 GMT)
Revisiting Self-Consistency from Dynamic Distributional Alignment Perspective on Answer Aggregation [21.6] 自己整合性は、多様なサンプルを集約することで推論を改善する。
復号化温度がランダム性を制御し,応答分布を積極的に形成することを示す。
温度を動的に校正する信頼性駆動機構を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:07:40 GMT)
Fantastic Targets for Concept Erasure in Diffusion Models and Where To Find Them [21.4] 概念消去は拡散モデルにおける有害なコンテンツ生成のリスクを軽減するための有望な手法として現れてきた。
本稿では,各望ましくない概念に合わせて最適な目標概念を動的に選択するAdaptive Guided Erasure (AGE)法を提案する。
その結果, AGEは, 有効消去性能を維持しつつ, 無関係な概念を保存し, 最先端の消去手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:36:38 GMT)
Pursuing Feature Separation based on Neural Collapse for Out-of-Distribution Detection [21.4] 本稿では, NC が生成する ID 特徴の主部分空間に部分空間内の OOD データの特徴を結合する分離損失という, 単純だが効果的な損失を提案する。
我々の検出は, CIFAR10, CIFAR100, ImageNetのベンチマークにおいて, 追加データ拡張やサンプリングを行わずにSOTA性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:21:37 GMT)
Promote, Suppress, Iterate: How Language Models Answer One-to-Many Factual Queries [21.3] 1対多の事実クエリに答えるためには、言語モデルは知識を同時にリコールし、以前の回答を繰り返すことを避ける必要がある。
モデルが最初にすべての回答をリコールし、その後に生成されたものを抑圧する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:23:15 GMT)
R2-T2: Re-Routing in Test-Time for Multimodal Mixture-of-Experts [21.1] 大規模マルチモーダルモデル(LMM)では、非言語的モダリティ(視覚表現など)の知覚は通常、大きな言語モデル(LLM)と同等ではない。
テスト時間における経路重みのベクトルを局所的に最適化する「テスト時間における再ルーティング」(R2-T2)を提案する。
R2-T2は、ベースモデルパラメータを訓練することなく、様々なタスクのベンチマークに挑戦する上で、最先端のLMMの性能を一貫して大幅に改善する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:59:32 GMT)
A Thousand Words or An Image: Studying the Influence of Persona Modality in Multimodal LLMs [21.1] 年齢、性別、職業、場所によって異なる40種類の個人からなる新しいデータセットを作成します。
これは、画像のみ、テキストのみ、画像と小さなテキストの組み合わせ、そしてタイポグラフィー画像の4つのモダリティから構成される。
総合的な実験では、詳細なテキストで表されるペルソナはより言語的な習慣を示すのに対し、タイポグラフィ画像はペルソナとより整合性を示すことが多い。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:25:00 GMT)
High-precision measurement of microwave electric field by cavity-enhanced critical behavior in a many-body Rydberg atomic system [21.1] マイクロ波電界の等価測定感度は,自由空間のそれと比較して桁違いに向上できることを示す。
得られた感度は2.6nV/cm/Hz$1/2$まで向上できる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:01:08 GMT)
ETHIC: Evaluating Large Language Models on Long-Context Tasks with High Information Coverage [21.0] 本稿では,クエリの応答に必要な入力コンテキストの割合を定量化する,情報カバレッジ(IC)と呼ばれる新しい指標を提案する。
ETHICは、LLMがコンテキスト全体を活用する能力を評価するために設計された新しいベンチマークである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:15:49 GMT)
A cavity QED system with defect-free single-atom array strongly coupled to an optical cavity [20.9] 我々は、光学キャビティに強く結合した欠陥のない単一原子配列を持つ新しいキャビティ量子電磁力学プラットフォームを実験的に実現した。
原子配列の位置を正確に制御することにより、アレイ内の全ての原子と光学キャビティとの均一かつ強い結合を実証する。
我々のシステムは分散量子コンピューティングの基礎を確立する大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:12:47 GMT)
Multi-View Contrastive Network (MVCNet) for Motor Imagery Classification [20.8] 本稿では,BCIにおけるMI EEGデコーディングのための知識駆動型時間空間ベースマルチビューコントラストネットワーク(MVCNet)を提案する。
MVCNetは、時間、空間、周波数ドメインからの知識を、複数のビューからのデータ拡張を通じてトレーニングプロセスに統合する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:31:05 GMT)
Inexact Moreau Envelope Lagrangian Method for Non-Convex Constrained Optimization under Local Error Bound Conditions on Constraint Functions [20.8] 最適化問題の解法として不正確なエンベロープグランジアン(iMELa)法を提案する。
iMELa法は、$tilde(-2)$ gradient complexity で $epsilon$-Karush-Kuhn-ilon 点を求めることができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:04:27 GMT)
The Noisy Path from Source to Citation: Measuring How Scholars Engage with Past Research [20.6] 本稿では,大規模な引用忠実度を定量化する計算パイプラインを提案する。
論文の全文を用いて、パイプラインは引用論文における引用と引用論文における対応するクレームを識別する。
準実験を用いて「電話効果」を確立する - 引用論文が原主張に忠実度が低い場合、引用論文と原文を引用する将来の論文は原文に忠実度が低い。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:47:03 GMT)
Adaptive Score Alignment Learning for Continual Perceptual Quality Assessment of 360-Degree Videos in Virtual Reality [20.5] 適応スコアアライメント学習(ASAL:Adaptive Score Alignment Learning)という,VRビデオの知覚品質を評価する新しい手法を提案する。
ASALは相関損失と誤り損失を統合し、人間の主観的評価と知覚品質の予測精度を高める。
我々はVR-VQAとそのCLのための総合的なベンチマークを確立し、新しいデータ分割と評価指標を導入しました。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:29:04 GMT)
Image Fusion for Cross-Domain Sequential Recommendation [20.4] Cross-Domain Sequential Recommendationは、複数のドメインにわたる過去のインタラクションに基づいて、将来のユーザインタラクションを予測することを目的としている。
CDSRの鍵となる課題は、シーケンス内とシーケンス間の両方の相互作用を十分に活用することで、ドメイン間のユーザの好みを効果的に捉えることである。
本稿では、アイテム画像情報を組み込んで視覚的嗜好をよりよく捉えた画像融合(IFCDSR)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:08:16 GMT)
Investigating and Enhancing Vision-Audio Capability in Omnimodal Large Language Models [20.2] 本稿では,OLLMの視覚テキストコンポーネントが教師として,視覚音声コンポーネントが学生として機能する自己知識蒸留(Self-KD)トレーニング手法を提案する。
実験結果から,自己KDはOLLMの視覚音響能力を高める有効な方法であることが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:19:09 GMT)
Bag of Design Choices for Inference of High-Resolution Masked Generative Transformer [20.1] Masked Generative Transformer (MGT) は、DMと自己回帰モデル(ARM)の間の有望な仲介役である
MGTに適した拡張推論手法の提案と再設計を行う。
本稿では,MGTにおけるサンプリングプロセスの高速化を目的としたDMベースのアプローチについて検討する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:51:10 GMT)
Logicbreaks: A Framework for Understanding Subversion of Rule-based Inference [20.1] 我々は命題Hhorn論理の推論としてルール追従を定式化する。
我々は、小さなトランスフォーマーはそのようなルールを忠実に守ることができるが、悪意のあるプロンプトは、データから学んだ理論的構成とモデルの両方を誤解させる可能性があることを証明している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:49:33 GMT)
Demystifying RCE Vulnerabilities in LLM-Integrated Apps [20.0] LangChainのようなフレームワークはLLM統合アプリ開発を支援し、カスタムアクションのためのコード実行ユーティリティ/APIを提供する。
これらの機能は理論的にはリモートコード実行(RCE)脆弱性を導入し、プロンプトインジェクションによるリモートコード実行を可能にする。
以前の研究では、これらのフレームワークのRCE脆弱性や、アプリケーションやエクスプロイトの影響を体系的に調査することはなかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:22:07 GMT)
TAPE: Tailored Posterior Difference for Auditing of Machine Unlearning [20.0] 本稿では,TAPE(TAilored Posterior diffErence)法を提案する。
TAPEは未学習の影モデルを素早く構築することで未学習の後方差を模倣する。
我々は、未学習後の違いのプライベート情報を抽出し、評価するために、リコンストラクタモデルを訓練する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:13:54 GMT)
Student-Informed Teacher Training [19.9] 特権教師による模倣学習は,画像などの高次元入力から複雑な制御行動を学ぶのに有効であることが証明されている。
この枠組みでは、教師は特権的なタスク情報で訓練され、生徒はより限られた観察で教師の行動を予測しようとする。
本研究では,教師と生徒の政策を共同で学習する枠組みを提案し,学生が模倣できる行動を学ぶことを指導する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:54:47 GMT)
Beyond the Tip of Efficiency: Uncovering the Submerged Threats of Jailbreak Attacks in Small Language Models [19.8] 小型言語モデル(SLM)は、高い効率性と計算コストの低いエッジデバイスへの展開において、ますます顕著になっている。
種々のジェイルブレイク攻撃下での13の最先端SLMのセキュリティ性能を評価するための総合的な実証的研究を行った。
我々の実験では、ほとんどのSLMは既存のジェイルブレイク攻撃の影響を受けやすいが、一部のSLMは直接的な有害なプロンプトに対して脆弱である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:44:04 GMT)
Cutting-edge 3D reconstruction solutions for underwater coral reef images: A review and comparison [19.7] フォトグラムに基づくアプローチは、既存のソリューションの中でも際立っている。
海底サンゴ礁の画像に特に適用された最先端のソリューションについて、体系的なレビューは残っていない。
本稿では,これらのアプローチの2つの重要な段階,すなわちカメラポーズ推定と高密度表面再構成に焦点を当てる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:53:15 GMT)
InsTaG: Learning Personalized 3D Talking Head from Few-Second Video [19.6] InsTaGは、3Dトーキングヘッド合成フレームワークで、少数のトレーニングデータから現実的なパーソナライズされた3Dトーキングヘッドを高速に学習することができる。
InsTaGは軽量な3DGS人専用のシンセサイザーをベースとして、高品質で高速な適応を実現している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:58:30 GMT)
DiagramQG: A Dataset for Generating Concept-Focused Questions from Diagrams [19.3] 様々な被験者に対して8,372の図と19,475の質問を含むデータセットであるDiagramQGを紹介した。
本稿では,図式質問生成のための階層的知識統合フレームワーク(HKI-DQG)を強力なベースラインとして提示する。
既存のVQGモデル,オープンソースおよびクローズドソースビジョン言語モデル,およびDiagramQGデータセット上でのHKI-DQGの性能を評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:16:17 GMT)
DiffCSS: Diverse and Expressive Conversational Speech Synthesis with Diffusion Models [19.3] 会話音声合成(CSS)は,文脈的に適切な音声と表現的音声の両方を合成することを目的としている。
DiffCSSは拡散モデルとLMベースのTSバックボーンを利用して,多様な,表現的で,文脈的に一貫性のある音声を生成する,革新的なCSSフレームワークである。
DiffCSSから合成した音声は既存のCSSシステムよりも多様で、文脈的に一貫性があり、表現力が高いことを示す実験結果が得られた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:53:48 GMT)
Knowledge Localization: Mission Not Accomplished? Enter Query Localization! [19.2] 大規模言語モデル(LLM)は、膨大な事実知識を格納するが、それらの知識の保存と表現方法の背後にあるメカニズムはいまだ不明である。
知識ニューロン(KN)理論は、これらのメカニズムを説明するための顕著な理論である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:29:11 GMT)
Med-RLVR: Emerging Medical Reasoning from a 3B base model via reinforcement Learning [19.1] 検証可能な報酬 (RLVR) からの強化学習は, 明確な推論監督なしに, ベース言語モデルから自己進化推論を引き出す能力に注目が集まっている。
医療領域におけるRLVRの初期研究として,MCQA(Med-RLVR)データを検証ラベルとして活用したMed-RLVRを紹介した。
以上の結果から,RLVRは数学やコーディングに有効であるだけでなく,医学的質問応答にも有効であることが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:54:38 GMT)
Quantum information flow in impurity qubits interacting with Bose-Bose mixtures [19.0] 二重井戸ポテンシャルに閉じ込められた1と2つの不純物量子ビットにおける量子情報フローのダイナミクスについて検討する。
二進ボース混合に浸漬された単一量子ビットに対して、系は有限時間スケールでコヒーレンスを維持することを示す。
ボース・ボース混合貯留層に結合した2つの空間分離量子ビットの場合、集合的デコヒーレンスが系の力学に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:17:49 GMT)
Minds on the Move: Decoding Trajectory Prediction in Autonomous Driving with Cognitive Insights [18.9] 運転シナリオでは、車両の軌道は人間の運転者の意思決定プロセスによって決定される。
従来のモデルは人間のドライバーの真の意図を捉えることができず、長期の軌道予測において最適以下の性能をもたらす。
ドライバーの意思決定メカニズムを解釈するために,認知的概念である知覚安全を取り入れた認知情報変換器(CITF)を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:43:17 GMT)
LiD-FL: Towards List-Decodable Federated Learning [18.9] 本稿では,中央サーバが敵のリストを維持できる,リスト記述可能なフェデレーション学習のためのアルゴリズムフレームワークを提案する。
実験結果から,提案アルゴリズムは様々な攻撃において悪意ある多数派に耐えうることが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:47:31 GMT)
Fish-Vista: A Multi-Purpose Dataset for Understanding & Identification of Traits from Images [18.8] 我々は,コンピュータビジョンにおける問題定式化を用いた画像から直接水生生物の視覚特性を分析するために設計された,最初の生物画像データセットであるFish-Visual Trait Analysis(Fish-Vista)を紹介した。
Fish-Vistaには4,154種の魚種にまたがる69,126枚の注釈付き画像が含まれており、種分類、形質識別、形質分類の3つの下流業務に役立てるために作成・整理されている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:06:50 GMT)
Text2VDM: Text to Vector Displacement Maps for Expressive and Interactive 3D Sculpting [18.8] 本稿では,テキスト・ツー・VDMブラシ生成のための新しいフレームワークであるText2VDMを提案する。
生成されたブラシは、メインストリームのモデリングソフトウェアにシームレスに統合できます。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:36:51 GMT)
Accelerating Model-Based Reinforcement Learning with State-Space World Models [18.7] 強化学習(Reinforcement Learning, RL)は、ロボット学習における強力なアプローチである。
しかし、モデルフリーRL(MFRL)は、制御ポリシーをうまく学習するために、多数の環境相互作用を必要とする。
状態空間世界モデルを用いたモデルベースRLの高速化手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:05:25 GMT)
Obtaining Example-Based Explanations from Deep Neural Networks [18.7] EBE-DNNは、非常に集中した例の属性を提供することができる。
埋め込みに使用するレイヤの選択は、その結果の正確性に大きな影響を与える可能性がある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:10:48 GMT)
Variation Matters: from Mitigating to Embracing Zero-Shot NAS Ranking Function Variation [18.7] 本稿では,プロキシ性能指標を表すランダム変数としてランキング関数出力の変動を考慮する。
探索プロセスの間、私たちは最高のアーキテクチャを決定するためにパフォーマンスメトリクスの順序付けを構築しようとしています。
提案手法は,標準ベンチマーク検索空間における探索性能を効果的に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:01:22 GMT)
Vector-Quantized Vision Foundation Models for Object-Centric Learning [18.4] オブジェクト中心学習(OCL)は、画像やビデオの特徴マップをテキストスロットとして知られるオブジェクトレベルの特徴ベクトルに集約することでこれを達成している。
我々は,OCL(Vector-Quantized VFMs for OCL, VQ-VFM-OCL, VVO)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:51:13 GMT)
BatteryLife: A Comprehensive Dataset and Benchmark for Battery Life Prediction [18.4] バッテリライフ予測 (Battery Life Prediction, BLP) は、バッテリ劣化試験によって生成された時系列データに依存する。
目覚ましい進歩にもかかわらず、この研究領域は3つの重要な課題に直面している。
本稿では,BLPの包括的なデータセットとベンチマークであるBatteryLifeを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:53:57 GMT)
Towards Understanding the Fragility of Multilingual LLMs against Fine-Tuning Attacks [18.2] LLM(Large Language Models)は、その安全性に対する幅広い懸念を引き起こしている。
近年の研究では, 微調整によりLLMの安全性の整合性を容易に除去できることが示されている。
我々は,多言語LLMにおける微調整攻撃の理解をさらに進める。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:17:13 GMT)
AI on My Shoulder: Supporting Emotional Labor in Front-Office Roles with an LLM-based Empathetic Coworker [17.9] 私たちはCare-PilotというAIアシスタントを設計しました。
比較分析の結果,様々なシビリティ事件において,ケアパイロットが共感に適応し,共感する能力を示した。
シミュレーション演習でCare-Pilotと対話した20人のCSRにインタビューしたところ、ネガティブな思考、最近の思考、そして顧客を人間化するのに役立ちました。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:53:40 GMT)
The Effects of Multi-Task Learning on ReLU Neural Network Functions [17.8] 本稿では,マルチタスク浅層ReLUニューラルネットワーク学習問題の性質について検討し,最小2乗重みのデータセットに適合するようにネットワークを訓練する。
注目すべきことに、個々のタスクで学んだソリューションは、カーネル回帰問題を解くことによって得られるものと似ており、ニューラルネットワークとカーネルメソッドの間の新しい接続が明らかにされている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:07:09 GMT)
Collab-Overcooked: Benchmarking and Evaluating Large Language Models as Collaborative Agents [17.8] 大規模言語モデル(LLM)ベースのエージェントシステムは、従来のNLPタスクを超えて、現実世界のアプリケーションにおいて大きな進歩を遂げてきた。
本稿では,インタラクティブ環境において,より適用性が高く,課題の多いOvercooked-AIゲーム上に構築された新しいベンチマークであるCollab-Overcookedを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:31:13 GMT)
A Large-Scale Simulation on Large Language Models for Decision-Making in Political Science [17.8] 我々は,大規模投票者の意思決定をシミュレートする理論駆動多段階推論フレームワークを開発した。
我々は、現実の有権者データに校正された合成人格を用いて、最近のアメリカ合衆国大統領選挙の大規模なシミュレーションを行う。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:47:40 GMT)
Systematic Relational Reasoning With Epistemic Graph Neural Networks [17.5] 本稿では,新しいパラメータ効率でスケーラブルなGNNアーキテクチャであるEpiGNN(EpiGNN)を提案する。
本研究では,系統的推論を必要とするリンク予測タスクにおいて,EpiGNNが最先端の結果を得ることを示す。
帰納的な知識グラフの完成のために、EpiGNNは最先端の専門的なアプローチのパフォーマンスに匹敵する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:50:41 GMT)
QPM: Discrete Optimization for Globally Interpretable Image Classification [17.5] 本稿では,グローバルに解釈可能なクラス表現を学習する準プログラミング拡張モデル(QPM)を紹介する。
QPMは、他のクラスにも割り当てられる5つの機能のうち、非常に少ないバイナリの割り当てを持つすべてのクラスを表す。
結果として得られる最適割り当ては、様々な特徴を微調整するために使用され、それぞれが共有一般概念となる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:25:36 GMT)
Bridging the Creativity Understanding Gap: Small-Scale Human Alignment Enables Expert-Level Humor Ranking in LLMs [17.4] 大規模言語モデル(LLM)は、創造的コンテンツを理解する上で、重大な制限を示してきた。
ユーモア理解を3つの構成要素に分解し,それぞれを体系的に改善することで,この課題を再考する。
改良されたアプローチは、キャプションランキングにおいて82.4%の精度を実現し、前回の67%のベンチマークで顕著に改善した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:29:09 GMT)
Inverse Rendering using Multi-Bounce Path Tracing and Reservoir Sampling [17.4] 本稿では,新しい2段階逆レンダリングフレームワークであるMIRReSを紹介する。
提案手法は, ステージ1で明示的な幾何(三角形メッシュ)を抽出し, より現実的な物理ベースの逆レンダリングモデルを導入する。
本手法は,自己陰影や内部反射を含む間接照明を効果的に推定する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:01:14 GMT)
H-CoT: Hijacking the Chain-of-Thought Safety Reasoning Mechanism to Jailbreak Large Reasoning Models, Including OpenAI o1/o3, DeepSeek-R1, and Gemini 2.0 Flash Thinking [17.4] 大規模推論モデル(LRM)は先日,その強力な推論能力を安全性チェックにまで拡張した。
このベンチマークは、正当な教育プロンプトの下に非常に危険な、または悪意のある要求を偽装するものです。
当社の実験では,OpenAI o1/o3,DeepSeek-R1,Gemini 2.0 Flash Thinkingなど,一般的な商用LRMの重大なセキュリティ欠陥が明らかになった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:32:58 GMT)
SoS1: O1 and R1-Like Reasoning LLMs are Sum-of-Square Solvers [17.3] 大規模言語モデル(LLM)は多種多様なタスクにまたがって人間レベルの習熟を実現しているが、厳密な数学的問題解決能力は依然としてオープンな課題である。
本研究では,与えられた1.8%が非負であるか否かを判定する,基本的な難解な問題について検討する。
本研究は, LLMが数学的推論の境界を押し上げ, NP-hard問題に対処する可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:41:43 GMT)
WOFOSTGym: A Crop Simulator for Learning Annual and Perennial Crop Management Strategies [17.3] WOFOSTGymは、強化学習(RL)エージェントを訓練して農業決定を最適化するために設計された作物シミュレーション環境である。
我々のシミュレーターは、23の年中作物と2つの年中作物をサポートし、RLエージェントが複数年・複数年・マルチファーム設定で多様な農業経営戦略を学べるようにしている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:35:09 GMT)
Will AI replace Software Engineers? Hold your Breath [17.2] LLM(Large Language Models)のような人工知能技術は、コード作成において非常に人気がある。
このことが、将来のソフトウェアジョブはLLMによってのみ実行されると推測され、ソフトウェア産業は存在し続けるだろう。
しかし、ソフトウェアエンジニアリングは、コードを生成する以上のものです -- 特に、大規模なソフトウェアをメンテナンスし、信頼性を維持することは、ソフトウェアエンジニアリングの重要な部分です。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:04:02 GMT)
Prompt-driven Transferable Adversarial Attack on Person Re-Identification with Attribute-aware Textual Inversion [17.2] 本稿では,歩行者画像の微細な意味的特徴を損なうために,Attribute-aware Prompt Attack (AP-Attack)を導入する。
AP-Attackは最先端の転送可能性を実現し、従来の手法よりも22.9%上回った。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:32:58 GMT)
Asymptotics of Non-Convex Generalized Linear Models in High-Dimensions: A proof of the replica formula [17.0] 非次元ガウス正規化モデルの最適性を証明するために,アルゴリズムをどのように利用できるかを示す。
また, 負の正則化モデルの最適性を証明するために, テューキー損失を用いる方法を示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:29:43 GMT)
KEDRec-LM: A Knowledge-distilled Explainable Drug Recommendation Large Language Model [16.7] 我々は、オープンソース医薬品知識グラフ、臨床試験データ、PubMed出版物を利用して、説明可能な薬物発見タスクのための包括的なデータセットを構築する。
医用知識の豊富なコーパスから知識を抽出し,医薬品の推薦と合理化を図った教育用LLMである textbfKEDRec-LM を紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:22:33 GMT)
Improving Adversarial Transferability in MLLMs via Dynamic Vision-Language Alignment Attack [16.7] DynVLAアタック(Dynamic Vision-Language Alignment, DynVLA)は,視覚言語コネクタに動的摂動を注入し,様々なモデルの視覚言語アライメントの一般化を促進する手法である。
実験の結果,DynVLAはBLIP2,InstructBLIP,MiniGPT4,LLaVA,およびGeminiなどのクローズドソースモデルなど,さまざまなMLLMの逆例の転送可能性を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:33:19 GMT)
AgentSquare: Automatic LLM Agent Search in Modular Design Space [16.7] 大規模言語モデル(LLM)は、幅広い複雑なタスクを処理できるエージェントシステムの急速な成長をもたらした。
Modularized LLM Agent Search (MoLAS) という新しい研究課題を紹介した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:33:55 GMT)
Enhancing Safety in Reinforcement Learning with Human Feedback via Rectified Policy Optimization [16.4] 我々は,大規模言語モデル(LLM)における有用性と安全性(無害性)のバランスをとるために,RePO(Rectified Policy Optimization)を提案する。
RePOの中核は、修正されたポリシー勾配によって駆動されるポリシー更新メカニズムであり、すべてのプロンプトの厳格な安全違反を罰し、ほぼすべてのプロンプトの安全性を高める。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:28:35 GMT)
LongAttn: Selecting Long-context Training Data via Token-level Attention [16.3] LongAttnはトークンレベルのフレームワークで、データの長距離依存関係を測定する。
オープンソース長文データセット(ArXiv, Book, Code)からLongABC-32Kをフィルタリングする
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:50:10 GMT)
A Survey on Foundation-Model-Based Industrial Defect Detection [16.3] 我々は,基礎モデル手法の比較と議論を行い,体系的な調査を行う。
我々は最近発表された非境界モデル (NFM) の手法を概観した。
FM法は,実際の産業アプリケーションシナリオに則った,少数ショット学習やゼロショット学習に適している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:28:31 GMT)
Mixture of Experts-augmented Deep Unfolding for Activity Detection in IRS-aided Systems [16.3] 本稿では,モデル駆動型深層展開と専門家の混合(MoE)フレームワークを組み合わせた新しいアプローチを提案する。
提案手法は, 3つの専門家設計のうちの1つを自動的に選択し, 未展開の勾配法に適用することにより, デバイスと基地局間のチャネルタイプに関する事前知識を不要にする。
シミュレーションの結果,提案手法は従来の共分散法およびブラックボックスニューラルネットワーク設計を超越していることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:19:28 GMT)
GSA-Forecaster: Forecasting Graph-Based Time-Dependent Data with Graph Sequence Attention [16.2] GSA-Forecasterは、グラフベースの時間依存コンテキストの予測用に設計された新しいディープラーニングモデルである。
GSA-Forecasterはデータグラフ構造を直接アーキテクチャに統合し、空間的依存関係に対処する。
実世界のグラフベースの時間依存データセットを用いて、その性能を検証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:22:25 GMT)
WalnutData: A UAV Remote Sensing Dataset of Green Walnuts and Model Evaluation [16.2] 農業コンピュータービジョンの分野では、緑のクルミに関連するデータセットは存在しない。
我々はUAVを用いて、8つのクルミサンプルプロットからリモートセンシングデータを収集した。
このデータセットには合計30,240イメージと706,208インスタンスが含まれている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:51:56 GMT)
Uncertainty Herding: One Active Learning Method for All Label Budgets [16.2] 様々な低予算・高予算の目的を一般化する目的である不確実性カバレッジを提案する。
本手法は低予算と高予算の両方で確実に有効であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:33:30 GMT)
Real-Time Video Generation with Pyramid Attention Broadcast [16.1] ピラミド・アテンション・ブロードキャスト(PAB)は、リアルタイム、高品質、およびトレーニング不要なDiTベースのビデオ生成方式である。
PABはベースラインと比較して3つのモデルで最大10.5倍のスピードアップを示し、最大720pビデオのリアルタイム生成を実現している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:00:30 GMT)
Entanglement Coordination Rates in Multi-User Networks [16.0] 最適コーディネートレートは、マルチユーザー量子ネットワークの3つの一次設定で決定される。
量子戦略を持つ非局所ゲームにおいて,この結果がもたらす意味について述べる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:44:41 GMT)
ChineseEcomQA: A Scalable E-commerce Concept Evaluation Benchmark for Large Language Models [15.9] 我々は,eコマースの基本的な概念に着目した,スケーラブルな質問応答ベンチマークである textbf ChineseEcomQA を提案する。
基本的な概念は、さまざまなeコマースタスクに適用できるように設計されている。
一般性と特異性を慎重にバランスさせることで、ChinaEcomQAは広範囲にわたるeコマースのコンセプトを効果的に区別する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:36:00 GMT)
The Knowledge Microscope: Features as Better Analytical Lenses than Neurons [15.9] 言語モデル(LM)における事実知識のメカニズム理解のための分析単位としてのニューロンの利用に関する研究
本稿では、まず、スパースオートエンコーダ(SAE)がニューロンを機能に分解し、代替分析ユニットとして機能することを検証するための予備実験を行う。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:45:30 GMT)
MITracker: Multi-View Integration for Visual Object Tracking [15.7] 我々は,マルチビューオブジェクトを効率的に統合する新しいMVOT手法であるMulti-View Integration Tracker(MITracker)を開発した。
MITrackerは任意の視点から任意の長さのビデオフレーム内の任意のオブジェクトを追跡することができる。
MITrackerはMVTrackとGMTDデータセットの既存のメソッドを上回り、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:03:28 GMT)
Relation Also Knows: Rethinking the Recall and Editing of Factual Associations in Auto-Regressive Transformer Language Models [15.7] 自己回帰変換言語モデル(LM)における事実関連の記憶とリコールが注目されている。
ほとんどの編集作業は、主に主題知識に焦点を当てた既存の知識リコールの解釈の指導の下で知識編集を行う。
本研究では,トランスフォーマーLMの知識リコールを推論中に解釈し,過度な一般化を避けるために単一知識編集に適用する,新たな関係性に着目した視点を見いだす。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:21:43 GMT)
Do generative video models understand physical principles? [15.5] AIビデオ生成は、品質とリアリズムが急速に進歩し、革命を遂げている。
ビデオモデルは、物理の法則を発見する「世界モデル」を学ぶのか、それとも、現実の物理原理を理解せずに視覚的リアリズムを達成するための高度なピクセル予測器なのか?
我々は,様々な物理原理の深い理解を得ることによってのみ解決できるベンチマークデータセットであるPhysical-IQを開発することで,この問題に対処する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:10:51 GMT)
Learning High-Degree Parities: The Crucial Role of the Initialization [15.5] 本稿では,通常のニューラルネットワーク上での勾配勾配降下に対して,学習性は初期重み分布に依存することを示す。
ほぼ完全なパリティの正の値は$sigma=O(d-1)$とされ、よりシャープなしきい値現象に関する疑問が指摘される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:08:40 GMT)
Towards Statistical Factuality Guarantee for Large Vision-Language Models [15.5] LVLM出力の事実性に関する有限サンプル分布自由統計保証を実現するためのフレームワークを提案する。
ConfLVLMは、シーン記述においてLLaVa-1.5が生成したクレームの誤り率を87.8%から10.0%に下げ、95.3%の真の正のクレームをフィルタリングする。
さらに, ConfLVLMは高い柔軟性を示し, 画像条件付き自由形式のテキスト生成タスクに対して, 不確実性を考慮した任意のブラックボックスLVLMに適用可能であることを示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:01:22 GMT)
Mitigating the Backdoor Effect for Multi-Task Model Merging via Safety-Aware Subspace [15.5] 本稿では,タスク干渉とバックドア脆弱性を同時に軽減する新しいDAM手法を提案する。
既存のマージ手法と比較して、DAMはパフォーマンスとセキュリティのバランスが良く、攻撃成功率を2-10ポイント削減する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:08:19 GMT)
Herald: A Natural Language Annotated Lean 4 Dataset [15.4] 本稿では,Mathlib4コーパス(形式言語Lean 4における数学の統一ライブラリ)を自然言語に翻訳するための新しいフレームワークを提案する。
私たちはこのパイプラインの結果をHeraldとしてMathlib4で発表します(階層とレトリバルベースのトランスレーショナルリーン)。
また,Heraldを微調整したHerald Translatorを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:01:28 GMT)
Training-free Diffusion Model Alignment with Sampling Demons [15.4] 提案手法は,報酬関数やモデル再学習を介さずに,推論時の復調過程を導出するための最適化手法である。
提案手法は,高報酬に対応する領域の密度を最適化することにより,雑音分布の制御を行う。
実験の結果,提案手法は平均的美学のテキスト・ツー・イメージ生成を著しく改善することがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:13:38 GMT)
From Retrieval to Generation: Comparing Different Approaches [15.3] 我々は,知識集約型タスクに対する検索ベース,生成ベース,ハイブリッドモデルの評価を行った。
我々は、高密度レトリバー、特にDPRは、NQ上でトップ1の精度が50.17%のODQAにおいて高い性能を発揮することを示す。
また、WikiText-103を用いて言語モデリングタスクを解析し、BM25のような検索に基づくアプローチは、生成的手法やハイブリッド手法に比べて難易度が低いことを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:29:14 GMT)
Enhanced Contrastive Learning with Multi-view Longitudinal Data for Chest X-ray Report Generation [15.3] 胸部X線レポート生成を容易にするために,MLRGと呼ばれるマルチビュー縦断データを用いたコントラスト学習を提案する。
具体的には、現在の多視点画像からの空間情報と、長手データからの時間情報を統合する多視点縦コントラスト学習手法を提案する。
本稿では,患者固有の事前知識の欠如に対処するトークン化不在符号化手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:59:04 GMT)
Taxonomy Tree Generation from Citation Graph [15.2] HiGTLは、人為的な指示や好みのトピックによってガイドされる、新しいエンドツーエンドフレームワークである。
我々は,各クラスタに中心的な概念を反復的に生成する,新しい分類ノード言語化戦略を開発した。
実験により、HiGTLはコヒーレントで高品質な概念を効果的に生成することが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:40:39 GMT)
Training LLMs with MXFP4 [15.1] サポート対象ハードウェアのFP8よりも2倍高速なMXFP4 GEMMを用いた,最初のニアロスレストレーニングレシピを提示する。
我々のレシピでは、MXFP4のトレーニングFLOPを1/2$で計算し、バックプロパゲーション時に、FP8よりも$1.3times$、BF16より$1.7times$と見積もることができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:01:31 GMT)
Stochastic Rounding for LLM Training: Theory and Practice [15.1] ラウンドリング(SR)を利用して,低精度表現による数値誤差に対処する。
最大6.7Bパラメータの事前学習モデルによる実験結果から, SR戦略を用いたBF16が, 混合精度戦略(BF16, FP32)より優れていることが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:08:08 GMT)
Learning Dynamics of Deep Linear Networks Beyond the Edge of Stability [14.9] 一定の学習率で勾配勾配勾配を学習した深部ニューラルネットワークは「安定性の最先端」の状態で動作している
EOS以外の損失振動は周期的なカオスへの経路を辿ることを示す。
本結果は,ディープネットワークにおける2つの重要な現象の説明に寄与する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:32:42 GMT)
Bridging the PLC Binary Analysis Gap: A Cross-Compiler Dataset and Neural Framework for Industrial Control Systems [14.8] PLC-BEADは4つの主要な産業用コンパイラにまたがる700以上のPLCプログラムから2431のコンパイル済みバイナリを含むデータセットである。
この新しいデータセットは、それぞれのバイナリを独自のStructured Textソースコードと標準化された機能ラベルと一意にペアリングする。
バイナリコード解析のためのトランスフォーマーベースのフレームワークであるPLCEmbedを用いて,データセットの有用性を実証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:27:37 GMT)
Bridge: A Unified Framework to Knowledge Graph Completion via Language Models and Knowledge Representation [14.8] 我々は、知識グラフ(KG)の構造と意味情報を共同で符号化するブリッジと呼ばれる新しいフレームワークを提案する。
具体的には、PLMのセマンティック知識をよりよく活用するために、PLMによって個別にエンティティと関係を戦略的に符号化する。
我々は、KGとPLMのギャップを埋めるために、BYOLと呼ばれる自己教師付き表現学習法を用いて、3重の異なる2つの視点でPLMを微調整する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:29:15 GMT)
Learning Hamiltonian Density Using DeepONet [14.6] 本稿では,波動方程式のモデル化のための演算子学習手法を提案する。
特に,方程式の定式化に必要な変分微分を計算する方法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:21:21 GMT)
Privacy-preserved LLM Cascade via CoT-enhanced Policy Learning [14.5] 大規模言語モデル(LLM)は、実世界のタスクにまたがる顕著なパフォーマンスのため、デバイス上のアプリケーションにおいて大きな注目を集めている。
我々は,テキストb保存型テキストbfdeferral決定のための,CoT(Chain-of-Thought)強化型テキストbfpolicy学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:56:08 GMT)
BEVDiffuser: Plug-and-Play Diffusion Model for BEV Denoising with Ground-Truth Guidance [14.3] 自律走行作業において,バードアイビュー(BEV)の表現が重要な役割を担っている。
センサーの限界と学習プロセスから生じる固有のノイズは、ほとんど役に立たないままです。
BEVDiffuser は,BEV特徴マップを地中構造オブジェクトレイアウトをガイダンスとして効果的に識別する,新しい拡散モデルである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:11:29 GMT)
Entanglement-Assisted Covert Communication via Qubit Depolarizing Channels [14.3] 我々は、秘密通信のセキュリティ要件の下で、qubit脱分極チャネル上での絡み合い支援通信を検討する。
我々は、$O(sqrtnlog(n))$ Covert bitsが、qubit depolarizing channelの$n$の使用に対して確実に送信可能であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:22:54 GMT)
SCU: An Efficient Machine Unlearning Scheme for Deep Learning Enabled Semantic Communications [14.2] ほとんどのセマンティックトレーニングデータセットは個人的なプライベート情報を含んでいる。
既存の機械学習ソリューションは、訓練されたモデルからデータコントリビューションを取り除く。
本稿では,この問題に対処するための意味的コミュニケーション・アンラーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:49:04 GMT)
Towards Collaborative Anti-Money Laundering Among Financial Institutions [14.1] ルールベースの手法が最初に導入され、現在でも現在の検知システムで広く使われている。
実際には、マネーロンダリングは通常複数の金融機関にまたがる。
複数の施設におけるマネーロンダリング対策を支援するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:22:55 GMT)
CRFU: Compressive Representation Forgetting Against Privacy Leakage on Machine Unlearning [14.1] 効果的なアンラーニング方法は、訓練されたモデルから指定されたデータの情報を除去し、アンラーニングの前後で同じ入力に対して異なる出力を出力する。
本研究では,非学習者のプライバシー漏洩を防ぐためにCRFU(Compressive Representation Forgetting Unlearning scheme)を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:59:02 GMT)
MAMBA4D: Efficient Long-Sequence Point Cloud Video Understanding with Disentangled Spatial-Temporal State Space Models [14.0] 状態空間モデル(SSM)に基づく新しいポイントクラウドビデオ理解バックボーンを提案する。
具体的には,まず空間と時間を4次元ビデオシーケンスで切り離し,設計したマンバブロックと空間的時間的相関を確立する。
提案手法は, 87.5%のGPUメモリ削減と5.36倍の高速化を実現した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:34:16 GMT)
EAIRA: Establishing a Methodology for Evaluating AI Models as Scientific Research Assistants [13.9] 本稿では,アルゴンヌ国立研究所で開発された科学研究アシスタント(EAIRA)として,AIモデルを評価するための多面的手法について述べる。
1) 事実的リコールを評価するための複数の選択質問,2) 高度な推論と問題解決スキルを評価するためのオープンレスポンス,3) 制御された環境における研究助手としての能力の詳細な分析を含むラボスタイル実験,4) 研究者とLLMの相互作用を広範囲の科学的領域や応用において大規模に捉えるフィールドスタイル実験。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:35:57 GMT)
Efficient and Accurate Optimal Transport with Mirror Descent and Conjugate Gradients [13.8] ミラーDescent Optimal Transport (MDOT) は、離散最適輸送(OT)問題を高精度に解くための新しい方法である。
MDOT は既存の OT ソルバの代表的な集合よりもはるかに高速で高精度で実現可能な解が得られることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:17:14 GMT)
Tokens for Learning, Tokens for Unlearning: Mitigating Membership Inference Attacks in Large Language Models via Dual-Purpose Training [13.7] 大規模言語モデル(LLM)は、現代の自然言語処理のバックボーンとなっているが、センシティブなトレーニングデータの漏洩に関するプライバシー上の懸念を生じさせている。
本稿では,トークン固有の特徴を利用して,言語モデリングのトレーニングデータを保護する軽量かつ効果的な経験的プライバシ保護を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:37:45 GMT)
PAPI: Exploiting Dynamic Parallelism in Large Language Model Decoding with a Processing-In-Memory-Enabled Computing System [13.7] PAPI は PIM 対応のヘテロジニアスアーキテクチャで,計算バウンドカーネルやメモリバウンドカーネルを適切なハードウェアユニットに動的にスケジューリングする。
PAPIは最先端の異種加速器と最先端のPIM専用加速器で1.8$times$と11.1$times$を達成している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:03:36 GMT)
Constrained Generative Modeling with Manually Bridged Diffusion Models [13.5] 手動ブリッジは、いわゆる拡散ブリッジを形成するために実際に使用できる制約の種類を拡張するフレームワークである。
我々は,複数の制約を組み合わせる機構を開発し,結果として得られる乗算制約モデルが,すべての制約を尊重する手動ブリッジとして残るようにした。
また、そのような複数の制約を尊重し、データ分布に適合するように適応する拡散モデルを訓練するためのメカニズムも開発している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:41:46 GMT)
The Potential of LLMs in Medical Education: Generating Questions and Answers for Qualification Exams [13.5] 従来の医学教育では、高度な臨床医が、EHRのプロトタイプに基づいて質問や回答を定式化する必要がある。
メインストリームのLSMは,臨床医に近いレベルにおいて,現実のERHで質問や回答を生成できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:47:40 GMT)
RURANET++: An Unsupervised Learning Method for Diabetic Macular Edema Based on SCSE Attention Mechanisms and Dynamic Multi-Projection Head Clustering [13.4] RURANET++は、糖尿病黄斑浮腫(DME)の教師なし学習に基づく自動診断システムである
特徴処理中、トレーニング済みのGoogLeNetモデルは網膜画像から深い特徴を抽出し、PCAベースの次元を50次元に減らして計算効率を向上する。
実験の結果,複数の測定値に対して優れた性能を示し,最大精度(0.8411),精度(0.8593),リコール(0.8411),F1スコアを異常なクラスタリング品質で達成した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:06:57 GMT)
FreCaS: Efficient Higher-Resolution Image Generation via Frequency-aware Cascaded Sampling [13.3] FreCaSはサンプリングプロセスをカスケードステージに分解し、徐々に分解能が向上する。
FreCaSは、画像の品質と生成速度において最先端の手法を大幅に上回っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:43:40 GMT)
Fast Preemption: Forward-Backward Cascade Learning for Efficient and Transferable Proactive Adversarial Defense [13.3] 本稿では,第三者による攻撃前に敵効果を中和する新しい防御法であるFast Preemptionを提案する。
わずか3イテレーションで実行することで、Fast Preemptionは、既存のトレーニング時間、テスト時間、プリエンプティブディフェンスを超えます。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:04:48 GMT)
WaveGAS: Waveform Relaxation for Scaling Graph Neural Networks [13.2] GNNAutoScale(GAS)は、制約付きGPUメモリ下でのトレーニングを可能にするためにグラフパーティショニングを使用する。
ガスは歴史的埋め込みベクターを格納し、それは他のパーティション内のワンホップ隣人から取り出され、重要な情報がパーティション境界を越えて取得されることを保証する。
前回のトレーニングから得られた履歴埋め込みはGAS推定埋め込みと比較して停滞しており、結果としてトレーニングアルゴリズムの近似誤差が生じる。
まず、波形緩和にインスパイアされたWaveGASは、後方通過前にGAS内の複数の前方通過を実行し、歴史的埋め込みと勾配の近似を補正して精度を向上させる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:10:42 GMT)
LISArD: Learning Image Similarity to Defend Against Gray-box Adversarial Attacks [13.2] 対人訓練(AT)と対人蒸留(AD)は、トレーニング段階での対人的な例を含む。
グレーボックス攻撃は、攻撃者がターゲットネットワークのトレーニングに使用するアーキテクチャとデータセットを知っているが、その勾配にはアクセスできないと仮定する。
我々は、モデルがグレーボックス攻撃に弱いという実証的な証拠を提供し、計算コストや時間コストを増大させることなく、ATを含まないグレーボックス攻撃やホワイトボックス攻撃に対して堅牢性を提供する防衛機構であるLISArDを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:02:06 GMT)
Stein's unbiased risk estimate and Hyvärinen's score matching [13.0] 通常の雑音で劣化した観測から信号分布を推定するための2つのG-モデリング手法について検討した。
まず,入力されたEddington/Tweedie Bayes denoiserのリスク推定値(SURE)を最小化して信号分布を選択する。
次に,Hiv"arinen's score matching objective for the implied scoreを最小化して信号分布を選択する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:15:05 GMT)
Do computer vision foundation models learn the low-level characteristics of the human visual system? [12.9] DINOやOpenCLIPといったコンピュータビジョンファウンデーションモデルは、大規模な画像データセット上で自己監督的な方法で訓練される。
自然画像に基づいて訓練された基礎モデルが、人間の視覚システムの低レベル特性の一部を模倣しているかどうかという問題に対処する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:43:56 GMT)
MMSciBench: Benchmarking Language Models on Multimodal Scientific Problems [12.9] MMSciBenchは,テキストのみおよびテキストイメージ形式を用いて数学的および物理的推論を評価するためのベンチマークである。
MMSciBenchを厳密な標準として確立し、複雑な推論と視覚的テキストの統合において重要なギャップを明らかにする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:38:43 GMT)
FIRE: Robust Detection of Diffusion-Generated Images via Frequency-Guided Reconstruction Error [12.9] 拡散モデルは実画像中帯域周波数情報を正確に再構成するのに苦労する。
火災誘導型リコンストラクションエラーは、まず、周波数分解がリコンストラクション誤差に与える影響を調査する。
実験により、FIREは目に見えない拡散モデルに効果的に一般化し、多様な摂動に対する堅牢性を維持することが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:33:18 GMT)
ThermoHands: A Benchmark for 3D Hand Pose Estimation from Egocentric Thermal Images [12.9] 熱画像に基づくエゴセントリックな3Dハンドポーズ推定に焦点をあてた最初のベンチマークであるThermoHandsを紹介する。
熱画像におけるエゴセントリックな3Dハンドポーズ推定に2つのトランスフォーマーモジュールを利用する新しいベースライン手法であるTherFormerを導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:42:22 GMT)
Diffusion Models as Cartoonists: The Curious Case of High Density Regions [12.9] 拡散モデルの高密度領域における画像の種類について検討する。
そこで本研究では,通常の試料より高い確率の画像を連続的に生成する,実用的な高密度サンプリング器を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:41:45 GMT)
Adversarial Robustness in Parameter-Space Classifiers [12.7] Inlicit Neural Representations (INR)は近年,様々な研究分野への関心が高まっている。
分類のために訓練されたパラメータ空間モデルは本質的に敵攻撃に対して堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:41:36 GMT)
Safety Representations for Safer Policy Learning [12.5] 安全クリティカルな応用では、国家空間の探索は破滅的な結果をもたらす可能性がある。
既存の安全な探査手法は、制約を課すことによってこれを緩和しようとする。
状態条件付き安全表現を明示的に学習する手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:10:33 GMT)
Universal Physics Transformers: A Framework For Efficiently Scaling Neural Operators [12.2] ユニバーサル物理変換器(Universal Physics Transformer、UPT)は、幅広い問題に対して効率的かつ統一的な学習パラダイムである。
UPTはグリッドやパーティクルベースの潜在メッシュを使わずに動作し、構造や粒子間の柔軟性を実現する。
メッシュ型流体シミュレーションおよび定常レイノルズ平均Navier-StokesシミュレーションにおけるUTTの適用性と有効性を示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:24:17 GMT)
Do Sparse Autoencoders Generalize? A Case Study of Answerability [12.1] Gemma 2 SAEに対する多様な応答性データセット間のSAE特徴一般化を評価した。
解析の結果,残差ストリームプローブは領域内のSAE特性より優れていることがわかったが,一般化性能は著しく異なる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:45:25 GMT)
Fine-tuning with Very Large Dropout [12.1] この研究は、リッチな表現を得るために、アンサンブルの代わりに非常に高いドロップアウト率を使用することを調査する。
このような脱落率を用いてスクラッチから深層ネットワークを訓練することは事実上不可能であるが、そのような条件下での大規模事前学習モデルの微調整は可能である。
これはまた、リッチ表現の性質や、比較的小さなデータセットを用いて大規模ネットワークを微調整する本質的に線形性に関する興味深い洞察を与える。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:15:53 GMT)
Microwave-coupled optical bistability in driven and interacting Rydberg gases [12.1] マイクロ波電界結合誘起光不安定性を用いて、ライドバーグガスは様々な異なる光学応答を示す。
2つのRydberg状態のマイクロ波カップリングは、ダイナミクスを制御するための追加のハンドルを提供する。
また、マイクロ波制御された非平衡相転移は、マイクロ波電界測定に応用される可能性がある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:17:32 GMT)
PRobELM: Plausibility Ranking Evaluation for Language Models [12.1] PRobELM(PRobELM)は、言語モデルがパラメトリック知識を通じてより妥当なシナリオを識別する能力を評価するために設計されたベンチマークである。
我々のベンチマークは、Wikidata編集履歴から算出したデータセットから構築され、評価されたモデルに対するトレーニングデータの時間的境界を整列するように調整されている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:42:18 GMT)
Recommendations from Sparse Comparison Data: Provably Fast Convergence for Nonconvex Matrix Factorization [12.0] 本稿では,個別に評価するのではなく,各項目のペアを比較してフィードバックを提供するリコメンデータシステムにおいて,新たな学習問題を理論的に分析する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:17:34 GMT)
An Extensive Evaluation of PDDL Capabilities in off-the-shelf LLMs [12.0] 大規模言語モデル(LLM)は、コード生成とチェーン・オブ・シークレット推論に習熟している。
本研究では,計画ドメイン定義言語(PDDL)の理解と生成のためのLLMの可能性を評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:13:07 GMT)
Stealthy Backdoor Attack in Self-Supervised Learning Vision Encoders for Large Vision Language Models [12.0] 我々は、視覚エンコーダを単に妥協させることで、視覚幻覚を大きな視覚言語モデル(LVLM)に誘導できる新たなバックドア脅威を明らかにした。
これらのエンコーダの共有と再利用のため、下流のLVLMの多くはエンコーダからバックドアの振る舞いを継承し、広くバックドアに繋がる可能性がある。
本稿では,新たなトリガ最適化とバックドア学習技術を備えたLVLM用SSLビジョンエンコーダにおいて,この脆弱性を利用する最初の方法であるBadVisionを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:12:40 GMT)
CoT-ICL Lab: A Petri Dish for Studying Chain-of-Thought Learning from In-Context Demonstrations [11.9] CoT-ICL Labは、合成トークン化されたデータセットを生成するためのフレームワークと方法論である。
我々は,言語モデルにおける文脈内学習(ICL)のチェーン・オブ・シント(CoT)を体系的に研究する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:52:22 GMT)
Improving Neuron-level Interpretability with White-box Language Models [11.9] 我々は、CRATE(Coding RAte TransformEr)という、ホワイトボックストランスフォーマーのようなアーキテクチャを導入する。
包括的実験では、ニューロンレベルの解釈可能性において、顕著な改善(最大103%の相対的な改善)が見られた。
CRATEの解釈可能性の向上は、関連するトークンを一貫して一意に活性化する能力の強化によるものである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:22:03 GMT)
Your contrastive learning problem is secretly a distribution alignment problem [11.8] 我々は、視覚と分布アライメントに広く用いられているノイズコントラスト推定損失の接続を構築した。
潜伏剤の分布からより多くの情報を利用することで、本手法は増分標本集合内の関係をより分布に意識した操作を可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:33:08 GMT)
Balanced Rate-Distortion Optimization in Learned Image Compression [11.7] そこで,2つのバランスの取れたR-D最適化手法を導入する。
実験により,2つの提案手法により,RCモデルのR-D性能が向上することが確認された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:00:43 GMT)
GreenDFL: a Framework for Assessing the Sustainability of Decentralized Federated Learning Systems [11.7] 分散フェデレートラーニング(DFL)は、集中的なデータアグリゲーションなしに協調的なモデルトレーニングを可能にする新興パラダイムである。
本研究の目的は、エネルギー消費と二酸化炭素排出量に影響を与える要因を分析し、DFLシステムの持続可能性を評価することである。
ノード選択アルゴリズムやアグリゲーション手法など,サステナビリティを考慮した最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:27:42 GMT)
SEKI: Self-Evolution and Knowledge Inspiration based Neural Architecture Search via Large Language Models [11.7] 本稿では,新しい大規模言語モデル (LLM) に基づくニューラルアーキテクチャ探索 (NAS) 手法であるSEKIを紹介する。
現代のLLMにおけるチェーン・オブ・シント(CoT)パラダイムにインスパイアされたセキは、自己進化と知識蒸留という2つの重要な段階で動作している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:17:49 GMT)
Stackelberg Game Preference Optimization for Data-Efficient Alignment of Language Models [11.5] Stackelberg Game Preference Optimization (SGPO) は、2プレイヤーのStackelbergゲームとしてアライメントをモデル化するフレームワークである。
SGPOをStackelberg Self-Annotated Preference Optimization (SSAPO)アルゴリズムでインスタンス化する。
SSAPOの3ラウンドで,Mistral-7Bで35.82%,Llama3-8B-Instructで40.12%,GPT-4で35.82%の勝利率を達成した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:17:28 GMT)
Structured Packing in LLM Training Improves Long Context Utilization [11.5] 本研究では,意味的相互依存を高めるための学習データの構造化について検討する。
本研究では,SPLiCe(Structured Packing for Long Context)法を提案する。
我々はSPLiCeを様々なサイズのモデルで実証的に検証した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:47:44 GMT)
Sanity Checking Causal Representation Learning on a Simple Real-World System [11.4] 我々は,これらの手法が動作すると期待される,シンプルな実世界のシステムにおいて,因果表現学習の手法を評価する。
CRLに対する異なるアプローチを示す手法を選択し,それらがすべて根底にある因果関係の回復に失敗していることを確認した。
弊社の取り組みは、最先端の理論的約束と、その応用における課題の対比を強調している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:56:54 GMT)
The Lookahead Limitation: Why Multi-Operand Addition is Hard for LLMs [11.4] 自己回帰型大規模言語モデル(LLM)は、様々なタスクで優れた性能を示すが、単純な算術には耐えられない。
LLMの単純な1桁のルックアヘッドは、2つのオペランドの追加に対してかなりうまく機能するが、マルチオペランドの場合は失敗する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:03:27 GMT)
FedICT: Federated Multi-task Distillation for Multi-access Edge Computing [11.4] マルチアクセスエッジ計算(FedICT)のためのMultI-task蒸留法を提案する。
FedICTによるクライアントとサーバ間の双方向蒸留プロセスにおけるローカル・グローバルな知識の活用
FedICTは、さまざまなデータ異種およびモデルアーキテクチャ設定で比較されたベンチマークを著しく上回っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:43:49 GMT)
Optimized quantum entanglement network enabled by a state-multiplexing quantum light source [11.3] 状態多重化量子光源を用いた波長分割多重エンタングルメントネットワークの最適化手法を提案する。
1946.9 bpsのセキュリティキーレートは、BBM92プロトコルを分散状態で実行することで得られる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:07:28 GMT)
Constrained Serial Dictatorships can be Fair [11.3] シークエンスと受信するアイテム数で優先順位のバランスをとる方法は、簡単ではない質問である。
最適シーケンスは,パラメータのサンプリングにより,時間的に正確に計算できるか,あるいは近似することができることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:58:46 GMT)
You Only Click Once: Single Point Weakly Supervised 3D Instance Segmentation for Autonomous Driving [11.3] YoCoフレームワークは、最小限の粗いクリックアノテーションを使用して、3Dの擬似ラベルを生成する。
時間的および空間的なラベル更新モジュールは、信頼できる更新ラベルを生成するように設計されている。
疑似ラベルを高信頼・高IoU予測に置き換えたIoU誘導拡張モジュールを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:33:51 GMT)
Mapping Trustworthiness in Large Language Models: A Bibliometric Analysis Bridging Theory to Practice [11.3] 大規模言語モデル(LLM)は、信頼性、透明性、公平性、倫理的整合性といった問題にまたがる信頼性に関する懸念を提起している。
本研究は,2019年から2025年までの2,006冊の書誌地図解析を行い,理論的議論と実践のギャップを埋めるものである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:02:33 GMT)
Explainable AI for Clinical Outcome Prediction: A Survey of Clinician Perceptions and Preferences [11.2] 説明可能なAI(XAI)技術は、臨床医がAI予測を理解し、予測を意思決定ワークフローに統合するために必要である。
本研究は、ICUの入院記録を用いて、院内死亡率を予測する結果予測モデルに、4つのXAI手法を実装した。
臨床医32名を対象に調査を行い,そのフィードバックと嗜好を4つの手法で収集した。
我々は,これらの知見を,XAI技術がいつより適切か,その潜在的な限界,改善のためのレコメンデーションなどを説明する一連のレコメンデーションに合成する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:30:20 GMT)
SSHNet: Unsupervised Cross-modal Homography Estimation via Problem Redefinition and Split Optimization [11.2] SSHNetは、教師なしのクロスモーダルホモグラフィー推定を2つの教師付きサブプロブレムに再定義する。
本稿では,各サブプロブレム内で各ネットワークを個別に訓練するための効果的な分割最適化手法を提案する。
モデルパラメータの削減とクロスドメイン一般化能力の向上を目的として, 簡易かつ効果的な蒸留訓練手法を用いた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:46:50 GMT)
Attention Distillation: A Unified Approach to Visual Characteristics Transfer [11.2] 我々は、事前学習した拡散ネットワークからの自己注意機能を利用して、生成した画像への参照から視覚的特徴を伝達する。
次に,注意損失をデノジングサンプリングプロセスに統合する改良型ガイダンスを提案する。
実験では, サンプルのスタイル, 外観, テクスチャを合成中の新しい画像に転送する際の, アプローチの異常な性能を実証した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:20:53 GMT)
ChatMol: A Versatile Molecule Designer Based on the Numerically Enhanced Large Language Model [11.2] ゴール指向のデノボ分子設計は、薬物発見において重要な課題である。
そこで我々はChatMolを提案する。ChatMolは多種多様な制約設定における分子設計にLarge Language Modelsを活用する新しいアプローチである。
単一プロパティ、サブ構造プロパティ、マルチプロパティ制約タスクにわたる実験結果は、ChatMolが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:05:45 GMT)
The Future Outcome Reasoning and Confidence Assessment Benchmark [11.1] FOReCAstはモデルを予測し、その信頼性を評価するためのベンチマークである。
ブール問題、時間枠予測、量推定を含む様々な予測シナリオにまたがる。
実世界のアプリケーションに対して、予測精度と信頼性校正の両方を包括的に評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:36:00 GMT)
HALO: Robust Out-of-Distribution Detection via Joint Optimisation [11.1] リアルタイムシナリオにおける機械学習モデルの安全なデプロイには、効果的なアウト・オブ・ディストリビューション(OOD)検出が不可欠である。
近年の研究では、OOD検出手法は敵攻撃に弱いことが示されており、高い精度のアプリケーションにおいて致命的な障害を引き起こす可能性がある。
分類と検出性能を高める新たな損失項を導入する。
私たちのアプローチはHALOと呼ばれ、既存のメソッドを超え、多くのデータセットとアタック設定で最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:40:18 GMT)
BoA: Attention-aware Post-training Quantization without Backpropagation [11.1] トレーニング後の量子化(PTQ)は、リソース制約のあるデバイスに大規模言語モデル(LLM)をデプロイするための有望なソリューションである。
階層間依存関係を考慮し整数重みを最適化する新しいバックプロパゲーションフリーPTQアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:29:08 GMT)
Can a calibration metric be both testable and actionable? [11.1] 動作可能なキャリブレーション間隔を評価することにより,カットオフエラーはテスト可能かつオーバーであり,このギャップを埋めることを示す。
ここでは,カットオフエラーがテスト可能かつオーバーであり,その影響をポストホックキャリブレーション法で評価することで,このギャップを解消できることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:50:24 GMT)
Enhancing 3D Gaze Estimation in the Wild using Weak Supervision with Gaze Following Labels [10.8] 我々は,新しい自己学習弱弱視線推定フレームワーク(ST-WSGE)を紹介する。
画像とビデオのデータセットから静的および動的視線情報を同時に学習できるモダリティに依存しないアーキテクチャであるGaze Transformer (GaT)を提案する。
3次元映像データセットと2次元視線目標ラベルを追従タスクから組み合わせることで,本手法は以下の重要な貢献を達成できる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:35:25 GMT)
NeRFCom: Feature Transform Coding Meets Neural Radiance Field for Free-View 3D Scene Semantic Transmission [10.7] NeRFComは、エンドツーエンドの3Dシーン伝送用に設計された通信システムである。
負のチャネル条件下では、ロバスト性を維持しつつ、自由視点3次元シーン効率の伝送を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:26:16 GMT)
Learning Classifiers That Induce Markets [10.7] ユーザが肯定的な予測を求めると、重要な機能に対する需要が生まれ、機能が購入可能であれば市場が成立し、競争によって価格が上昇する、と私たちは主張する。
本稿では,学習課題の分析を行い,市場価格の計算アルゴリズムを考案し,異なる学習フレームワークを提案し,新しい設定とアプローチを探求する実験を行う。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:49:14 GMT)
TLOB: A Novel Transformer Model with Dual Attention for Stock Price Trend Prediction with Limit Order Book Data [10.7] 制限順序帳(LOB)データに基づく株価トレンド予測(SPTP)は、金融市場における根本的な課題である。
ディープラーニングの進歩にもかかわらず、既存のモデルはさまざまな市場条件にまたがって一般化することができない。
我々は,SoTAの性能を超越していることを示し,複雑な空間アーキテクチャの必要性に挑戦する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:59:09 GMT)
MIND: Towards Immersive Psychological Healing with Multi-agent Inner Dialogue [10.7] 大きな言語モデル(LLM)は、より人間的な相互作用を生み出す可能性があるが、微妙な感情を捉えるのに苦労する。
MIND(Multi-agent INner Dialogue)は、より没入的な心理的癒し環境を提供する新しいパラダイムである。
MINDは従来のパラダイムよりもユーザフレンドリーな体験を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:04:27 GMT)
A Polynomial-Time Approximation for Pairwise Fair $k$-Median Clustering [10.6] すべてのクラスタ$C$とすべてのグループ$i in [ell]$に対して、$C$ from group $i$のポイントの数は、整数$t$の他のグループ$j in [ell]$のポイントの最大$t$の倍でなければならない。
我々は,$ell=2$が一般の均一容量$k$-medianに匹敵する難易度である場合においても,その問題を示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:29:30 GMT)
Exploring Open-world Continual Learning with Knowns-Unknowns Knowledge Transfer [10.4] オープンワールド継続学習(OWCL)は、オープンワールドの仮定の下で運用しながら忘れずに、モデルが新たな知識を漸進的に学習しなければならない、挑戦的なパラダイムである。
非線形ランダムプロジェクション(NRP)を統合する新しいOWCLフレームワークであるtextbfHoliTrans(Holistic Knowns-Unknowns Knowledge Transfer)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:16:01 GMT)
EEE-Bench: A Comprehensive Multimodal Electrical And Electronics Engineering Benchmark [10.3] 大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、科学や数学など様々な分野で有望なスキルを実証している。
実用工学的課題の解決におけるLMMの能力評価を目的としたマルチモーダルベンチマークであるEEE-Benchを提案する。
我々のベンチマークは、アナログ回路や制御システムなど10の必須課題にまたがる2860の慎重に計算された問題からなる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:54:51 GMT)
Highly Parallelized Reinforcement Learning Training with Relaxed Assignment Dependencies [10.2] 本稿では,高スループット分散深層強化学習システムTianJiを提案する。
サブタスクコンポーネント間の割り当て依存関係を緩和し、イベント駆動の非同期通信を可能にする。
TianJiは、関連する比較システムと比較して最大4.37の収束時間加速比を達成する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:23:43 GMT)
Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution [10.1] Inlicit Neural Representation (INR) は、任意スケール超解法 (ASR) に成功している
ASRのためのGSを一般化する2つの新しい手法を開発した。
超解像をレンダリングするために, 効率的な2次元GPU/CUDAに基づくスケール認識を実装した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:07:43 GMT)
DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time [10.1] 実時間DLOモデリングのための微分離散分岐弾性棒
本稿では、実時間(DEFT)におけるFurcated DLOのモデル化のための微分離散分岐弾性ロッドを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:13:17 GMT)
Multi-Scale Neighborhood Occupancy Masked Autoencoder for Self-Supervised Learning in LiDAR Point Clouds [10.0] Masked Autoencoders (MAE) は、視覚以降の自己教師型学習(SSL)において、大きな可能性を秘めている。
自動走行に使用されるLiDARの点雲は、3Dボリュームの大部分を空いているため、MAEにとって特に困難である。
本研究では,マスク付き占有再建を非マスクボクセルの近傍にのみ導入することで,上記の課題を克服する新しい近隣居住環境(NomaE)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:42:47 GMT)
Learning to Double Guess: An Active Perception Approach for Estimating the Center of Mass of Arbitrary Objects [9.8] U-GRAPH: Uncertainty-Guided Rotational Active Perception with Hapticsを紹介する。
従来の手法は単一相互作用に依存しており、F/Tセンサーの固有の不正確さによって制限される。
本手法の顕著な一般化性および伝達性について,限定的な変動を伴う小さなデータセット上でのトレーニングを行いながら,未確認の複雑な実世界のオブジェクト上でも良好に動作することを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:17:25 GMT)
Can Large Language Models Unveil the Mysteries? An Exploration of Their Ability to Unlock Information in Complex Scenarios [9.8] 複雑なシナリオにおける推論のための複数のインプットを統合するための高度なモデルの可能性について検討する。
本稿では,モデル入力を推論に利用し,最小マージンの復号化による推論を強化し,意味的関連データを取得する3つのプラグアンドプレイ手法を提案する。
提案手法では,SOTAクローズドソースモデルよりもCVQAが22.17%向上し,推論モデルの性能が向上する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:58:27 GMT)
ADAGE: Active Defenses Against GNN Extraction [9.7] グラフニューラルネットワーク(GNN)は、薬物発見、トラフィック状態予測、レコメンデーションシステムなど、さまざまな現実世界のアプリケーションで高いパフォーマンスを達成する。
GNNに対する攻撃を盗む脅威ベクトルは、大きく多様である。
我々は、GNN抽出(ADAGE)に対する第1次、第1次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第2次、第
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:56:11 GMT)
Conformal Tail Risk Control for Large Language Model Alignment [9.7] テールイベントの定量化プロセスを自動化するため、汎用的なスコアリングモデルが作成されている。
この現象は、各スコアリングメカニズム間の潜在的な人間と機械のミスアライメントをもたらす。
ブラックボックスモデルのための軽量なキャリブレーションフレームワークを提案し,人間と機械のアライメントを保証可能な保証で保証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:10:54 GMT)
Simulating Bulk Gap in Chiral Projected Entangled-Pair States [9.7] PEPSは, カイラルトポロジカル相におけるバルク励起を確実に特徴付けることができることを示す。
これらの結果から,PEPSはキラルトポロジカルシステムにおける基底状態と励起状態の両方を研究する強力なツールであることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:34:02 GMT)
The Evolution of Dataset Distillation: Toward Scalable and Generalizable Solutions [9.6] この調査は、データセット蒸留の最近の進歩を包括的にレビューする。
我々は、ImageNet-1KやImageNet-21Kのような大規模データセットへのスケーリングに注力する。
効率的かつ効果的な凝縮のためのSRe2Lフレームワークを含む、画期的なイノベーションを強調します。
また、ビデオおよびオーディオ処理、マルチモーダル学習、医用画像、科学計算における新しい応用についても検討する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:16:08 GMT)
Kanana: Compute-efficient Bilingual Language Models [9.6] カナナ(Kanana)は、韓国語のパフォーマンスと英語の競争性能を超越した二言語モデルである。
このレポートでは、計算効率が良いが競争力のあるモデルを実現するために、事前学習で使用されるテクニックについて詳述している。
本報告では, 埋め込み, 検索拡張生成, 関数呼び出しなど, 特定のシナリオへの言語モデル適応に有効なアプローチについて詳述する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:20:53 GMT)
LMHLD: A Large-scale Multi-source High-resolution Landslide Dataset for Landslide Detection based on Deep Learning [9.6] 地すべりは世界でも最も多い自然災害の1つであり、人類社会に重大な脅威をもたらしている。
深層学習(DL)は,大規模災害地域における地すべりの迅速生成手法として有効であることが証明されている。
DLに基づく地すべり検出のための大規模多ソース高分解能地すべり (LMHLD) は世界中のリモートセンシング画像を収集している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:19:42 GMT)
On the Performance Analysis of Momentum Method: A Frequency Domain Perspective [9.6] 本稿では,モーメント法を時間変動フィルタとして解釈する周波数領域解析フレームワークを提案する。
我々の実験はこの視点を支持し、関連するメカニズムをより深く理解する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:33:40 GMT)
LlamaLens: Specialized Multilingual LLM for Analyzing News and Social Media Content [9.5] 大規模言語モデル(LLM)は、様々な分野にわたる汎用タスクソルバとして顕著な成功を収めている。
本研究では,LlamaLens という特殊な LLM を開発し,多言語でニュースやソーシャルメディアのコンテンツを分析することに焦点を当てた。
LlamaLensは23個のテストセットで現在のSOTA(State-of-the-art)よりも優れ、8つのテストセットで同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:01:29 GMT)
PFformer: A Position-Free Transformer Variant for Extreme-Adaptive Multivariate Time Series Forecasting [9.5] PFformerは、単一ターゲットのMSS予測用に設計された、位置のないトランスフォーマーベースのモデルである。
PFformerは、EFE(Enhanced Feature-based Embedding)とAEE(Auto-Encoder-based Embedding)の2つの新しい埋め込み戦略を統合している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:21:27 GMT)
Exponential Topology-enabled Scalable Communication in Multi-agent Reinforcement Learning [9.5] 協調型マルチエージェント強化学習(MARL)のためのスケーラブルな通信プロトコルを開発する。
本稿では,この指数的トポロジを利用して,その小径特性と小径特性を活用し,エージェント間の迅速な情報伝達を実現することを提案する。
MAgentやInfrastructure Management Planningといった大規模協調型ベンチマークの実験は、ExpoCommの優れた性能と堅牢なゼロショット転送性を示している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:15:31 GMT)
HaLoRA: Hardware-aware Low-Rank Adaptation for Large Language Models Based on Hybrid Compute-in-Memory Architecture [9.5] 低ランク適応(LoRA)は、下流タスクに大規模言語モデル(LLM)を適用するためのパラメータ効率の高い微調整法である。
RRAM固有のノイズによる性能劣化に対処するため,ハードウェア対応低ランク適応法(HaLoRA)を考案した。
LLaMA 3.2 1Bと3Bを微調整した実験では、HaLoRAが複数の推論タスクにまたがって有効であることを示し、平均スコアを最大22.7改善した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:20:47 GMT)
NeuralDEM -- Real-time Simulation of Industrial Particulate Flows [9.4] 本稿では、遅い数値DEMルーチンを高速で適応可能なディープラーニングサロゲートに置き換えるエンドツーエンドアプローチを提案する。
NeuralDEMは、高度なエンジニアリングとより高速なプロセスサイクルに多くの新しいドアを開く。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:26:19 GMT)
In-Context Learning with Hypothesis-Class Guidance [9.3] 本稿では,仮説クラスガイダンス(ICL-HCG)を用いたICLを提案する。
i)新しい仮説クラスに対する様々な一般化能力、(ii)異なるモデルアーキテクチャ、(iii)サンプル複雑性、(iv)命令の役割、(vi)仮説の事前学習の効果。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:52:06 GMT)
DPZV: Resource Efficient ZO Optimization For Differentially Private VFL [9.3] Vertical Federated Learning (VFL)は、機能分割されたデータ間で協調的なモデル計算を可能にするが、大規模モデルへのスケーリングではプライバシのリスクに直面する。
差分プライバシーを統合するメモリゼロ効率(DP)フレームワークであるDPZVを提案する。
本フレームワークは,2点推定によるバックパゲーションを排除し,クライアントメモリ使用率を1次推定に比べて90%削減する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:07:16 GMT)
DSRC: Learning Density-insensitive and Semantic-aware Collaborative Representation against Corruptions [9.3] 本研究では,現実世界の環境に典型的な自然汚職の存在下での協調認識手法の堅牢性を評価するために設計された,最初の総合的なベンチマークを紹介する。
本研究では,密度に敏感でセマンティックな協調表現を学習することを目的とした,頑健な協調認識手法DSRCを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:17:17 GMT)
Omni-Scene: Omni-Gaussian Representation for Ego-Centric Sparse-View Scene Reconstruction [9.1] 自律運転のシナリオでは、より実践的なパラダイムはエゴ中心の再構築であり、最小のクロスビューオーバーラップが特徴である。
本稿では,異なる表現の詳細な分析を行い,ネットワーク設計に適したOmni-Gaussian表現を提案する。
実験の結果,エゴ中心の再構築において,この手法は最先端の手法であるピクセルSplatやMVSplatをはるかに上回ることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:53:40 GMT)
SECURA: Sigmoid-Enhanced CUR Decomposition with Uninterrupted Retention and Low-Rank Adaptation in Large Language Models [9.1] SECURAは、パラメータ効率の良い微調整(PEFT)変異体であり、微調整性能を改善しながら破滅的な忘れを軽減している。
その結果,SECURAは4つの質問質問(MCQ)タスクで3.59%,5つの質問回答(QA)タスクで2.51%の改善を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:57:34 GMT)
Accurate Pose Estimation for Flight Platforms based on Divergent Multi-Aperture Imaging System [9.0] 視覚に基づくポーズ推定は、飛行プラットフォームの自律的なナビゲーションにおいて重要な役割を果たす。
カメラ限界の視野と空間分解能は推定精度を推定する。
本稿では,広い視野と高空間分解能の同時観測を実現するため,多様なマルチアパーチャイメージングシステムの設計を行う。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:51:09 GMT)
Beyond Natural Language Perplexity: Detecting Dead Code Poisoning in Code Generation Datasets [9.0] 本稿では,コードの構造に合わせた新しいラインレベルの検出とクリーン化手法であるDePAを提案する。
DePAは既存の方法よりも優れており、検出F1スコアが0.14-0.19向上し、有毒セグメントの局在精度が44-65%向上した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:30:00 GMT)
An Amplitude-Encoding-Based Classical-Quantum Transfer Learning framework: Outperforming Classical Methods in Image Recognition [9.0] 本稿では,AE-CQTL(Amplence-encoding-based classical-quantum transfer learning)フレームワークを提案する。
AE-CQTLフレームワークをベースとして,Transfer Learning Quantum Neural Network (TLQNN)とTransfer Learning Quantum Convolutional Neural Network (TLQCNN)の2つのCQTLニューラルネットワークモデルの設計と実装を行った。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:20:01 GMT)
Private Synthetic Data Generation in Small Memory [8.9] $mathttPrivHP$は、テキスト差分プライバシーを保証する軽量な合成データジェネレータである。
階層の深さ、ノイズの追加、低周波のプルーニングのバランスを保ちながら、頻繁なノイズを保っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:58:38 GMT)
A2-GNN: Angle-Annular GNN for Visual Descriptor-free Camera Relocalization [8.9] 本稿では、ロバストな幾何学的構造表現を効率的に学習するシンプルなアプローチであるアングル・アンヌルグラフニューラルネットワーク(A2-GNN)を紹介する。
提案手法は,視覚的記述自由手法の計算オーバーヘッドを低く抑えながら,最先端の精度を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:25:30 GMT)
Near-Linear Time Projection onto the $\ell_{1,\infty}$ Ball; Application to Sparse Autoencoders [8.9] 本稿では,$ell_1,infty$ norm ballに対する新しいプロジェクションアルゴリズムを提案する。
また,本手法が最高速であることは,生物学的ケースにおいても,一般の場合においても明らかである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:07:49 GMT)
SuPreME: A Supervised Pre-training Framework for Multimodal ECG Representation Learning [8.8] 我々は、表現学習のための$textbfSu$pervised $textbfPre$-training frameworkである$textbfSuPreMEを提案する。
従来の分類ラベルの代わりにテキストベースの心臓クエリを使用することで、SuPreMEは、追加の微調整なしに、見えない疾患のゼロショット分類を可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:29:51 GMT)
Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts [8.8] Mixture-of-experts (MoE) は、大規模な言語モデルを1兆以上のパラメータに拡張するために広く利用されている。
既存の方法は、オーバーラップする計算でMoE層内の通信をパイプライン化することを提案している。
細粒度通信-計算オーバラップを最適化したMOEシステムであるCOMETを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:36:45 GMT)
Exploring experimental limit of deep quantum signal processing using a trapped-ion simulator [8.8] トラップイオン量子シミュレータを用いた深部QSP回路の試作について報告する。
この結果から,関数シミュレーションの精度とハードウェアノイズの同時蓄積との間に重要なトレードオフがあることが判明した。
この研究は量子ハードウェア上でのQSPベースのアルゴリズムのスケーラビリティと限界を理解する上で重要なギャップに対処する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:37:42 GMT)
Formation of Representations in Neural Networks [8.8] 現代のニューラルネットワークにおいて、いかに複雑で構造化され、伝達可能な表現が出現するかは謎のままである。
本稿では、表現の形成を普遍的に支配する6つのアライメント関係の集合を仮定したCRH(Canonical Representation hypothesis)を提案する。
CRHの崩壊はR,W,Gの相互関係の出現につながり,この関係をPAH(Polynomial Alignment hypothesis)と呼ぶ。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:35:09 GMT)
Weakly Supervised Segmentation Framework for Thyroid Nodule Based on High-confidence Labels and High-rationality Losses [8.8] トポロジカルな情報と解剖学的な情報を表現し,多段階の識別特徴を捉えるために,高信頼な擬似ラベルを用いたフレームワークを提案する。
提案手法は,TN3KおよびDDTIデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:48:00 GMT)
Noise-Injected Spiking Graph Convolution for Energy-Efficient 3D Point Cloud Denoising [8.7] スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワーク(ANN)よりも2次元分類タスクにおいて優れたエネルギー効率を示した
本研究では,3次元点群におけるSNNのフルレグレッションポテンシャルを活用するために,ノイズ注入型スパイキンググラフ畳み込みネットワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:04:23 GMT)
Interpreting CLIP with Hierarchical Sparse Autoencoders [8.7] サエマトリオシュカ(MSAE)は複数の粒度の階層的表現を同時に学習する。
MSAEは、CLIPの再構築品質とスパーシリティの間に新しい最先端のフロンティアを確立する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:39:13 GMT)
VerifyPrompt: How to Verify Text-to-Image Models Behind Black-Box API? [8.6] ブラックボックス対象モデルが与えられたホワイトボックス参照T2Iモデルと同一であるかどうかを判定することを目的としたT2Iモデル検証を提案する。
イントレピッドプロンプト(Intrepid prompt)は、他のモデルに対する転送可能性のないターゲットモデルの逆プロンプトである。
IntrepidPromptは、様々なT2Iモデルで90%以上の精度を実現している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:11:34 GMT)
Spatial-Spectral Diffusion Contrastive Representation Network for Hyperspectral Image Classification [8.6] 本稿では,空間スペクトル拡散コントラスト表現ネットワーク(DiffCRN)を提案する。
DiffCRNは、高スペクトル画像分類のための拡散確率モデル(DDPM)とコントラスト学習(CL)の組み合わせに基づく。
広く使われている4つのHSIデータセットを用いて実験を行い、提案したDiffCRNの性能改善を実証した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:34:23 GMT)
Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model [8.6] 本稿では,HSICのICC問題に対処する言語インフォームドハイパースペクトル画像合成法(Txt2HSI-LDM(VAE))を提案する。
高次元超スペクトルデータに対処するために、多変数オートエンコーダ(VAE)を用いて、超スペクトルを低次元の潜在空間にマッピングし、安定な特徴表現を得る。
VAEは、条件言語を入力として拡散モデルによって生成された潜在空間からHSIをデコードし、より現実的で多様なサンプルに寄与する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:35:49 GMT)
Transfer Learning in Latent Contextual Bandits with Covariate Shift Through Causal Transportability [8.6] ある環境から別の環境に知識を移すことは、インテリジェントシステムにとって不可欠な能力である。
本稿では,実際の文脈を隠蔽した潜在文脈の包帯における伝達学習について考察する。
この設定において、古典的バンディットアルゴリズムの知識を全てナビゲートすることで、負の転送が導かれることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:52:23 GMT)
Not All Language Model Features Are One-Dimensionally Linear [8.6] 独立的・非共起的な低次元特徴に分解できるかどうかに基づいて、既約多次元特徴の厳密な定義を開発する。
スパースオートエンコーダを用いて, GPT-2 と Mistral 7B の多次元特徴を自動的に検出する。
我々は、これらの正確な円が、その年の週と月におけるモジュラー算術に関わる計算問題を解くのに使用されるタスクを特定する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:03:59 GMT)
GETS: Ensemble Temperature Scaling for Calibration in Graph Neural Networks [8.5] グラフニューラルネットワークは強力な分類結果を提供するが、しばしばキャリブレーション性能の低下に悩まされる。
温度スケーリングのような既存のポストホック法では、グラフ構造を効果的に利用できない。
入力とモデルアンサンブル戦略を組み合わせた新しいキャリブレーションフレームワークであるグラフアンサンブル温度スケーリングを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:10:46 GMT)
ProtoOcc: Accurate, Efficient 3D Occupancy Prediction Using Dual Branch Encoder-Prototype Query Decoder [8.5] ProtoOccは、3Dボクセルの占有状態とセマンティッククラスを予測するために設計された新しい3D占有予測モデルである。
ProtoOccはOcc3D-nuScenesベンチマークで45.02% mIoUで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:57:16 GMT)
Collaborative Stance Detection via Small-Large Language Model Consistency Verification [8.2] ソーシャルメディア上のスタンス検出は、特定のターゲットに対するツイートで表される態度を特定することを目的としている。
スタンス検出にLLM(Large Language Models)を多用することは、現実のソーシャルメディア監視システムでは現実的ではない。
スモールラージ言語モデル一貫性を用いたtextbfunderlineCollaborative Stance Detectionを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:30:50 GMT)
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription [8.1] マルチモーダル大言語モデル(MLLM)を用いて,ゼロショット設定で多ページ手書き文書の書き起こしを行う。
本稿では,文書全体のOCR出力を第1ページ画像とともに提供することにより,MLLMの書き起こしを向上する新しい手法「+first page」を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:21:18 GMT)
TripCraft: A Benchmark for Spatio-Temporally Fine Grained Travel Planning [7.8] TripCraft は LLM によるパーソナライズされた旅行計画のための,新たなベンチマークを確立している。
パラメータ情報設定は食事スケジューリングを著しく向上させ、7日間のシナリオでは時間的食事スコアが61%から80%に向上する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:33:28 GMT)
Exploring QUIC Dynamics: A Large-Scale Dataset for Encrypted Traffic Analysis [7.8] VisQUICは44,000以上のウェブサイトから10万のQUICトレースをラベル付けした大規模データセットである。
以前のデータセットとは異なり、VisQUICは制御された復号化のためのSSLキーを提供し、複数のQUIC実装をサポートし、新しいイメージベースの表現を導入した。
暗号化されたQUICトラフィックにおいてHTTP/3応答を推定し、観測可能なパケット機能のみを用いて97%の精度を達成するためのベンチマークタスクを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:19:53 GMT)
Long-Context Inference with Retrieval-Augmented Speculative Decoding [7.8] LLM(Long-context Large Language Model)は、従来の検索拡張世代(RAG)に代わる有望な代替手段を提供する。
本稿では、RAGを利用したRAPID(Retrieval-Augmented Speculative Decoding)を提案する。
提案手法は,計算効率を維持しつつ,同一スケールあるいはそれ以上のLLMをRAGドラフトとして機能させる,新たなパラダイムを実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:59:36 GMT)
Finding Local Diffusion Schrödinger Bridge using Kolmogorov-Arnold Network [7.7] 本稿では,拡散路部分空間における局所拡散Schr"odinger Bridges (LDSB) の発見を初めて提案する。
実験の結果,LDSBは同じトレーニング済みのデノナイジングネットワークを用いて,画像生成の品質と効率を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:34:03 GMT)
Word Boundary Information Isn't Useful for Encoder Language Models [7.6] 我々は、4つの異なる訓練尺度でトランスフォーマーエンコーダを訓練し、単語境界情報を含むいくつかの代替手法について検討する。
代替手法による大幅な改善は見つからず、単語境界情報を削除するトークンサの修正は有用な情報の喪失につながるものではないことを示唆している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:58:21 GMT)
A Residual Multi-task Network for Joint Classification and Regression in Medical Imaging [7.5] 本稿では,マルチタスク学習と残差学習を組み合わせた残差マルチタスクネットワーク(Res-MTNet)モデルを提案する。
Res-MTNetはモデルの堅牢性と正確性を高め、より信頼性の高い肺分析ツールを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:02:59 GMT)
Teasing Apart Architecture and Initial Weights as Sources of Inductive Bias in Neural Networks [7.5] メタトレーニングは、アーキテクチャやデータ表現におけるパフォーマンスの違いを大幅に減らしたり、完全に排除できることを示す。
これらの要因は、通常想定されるよりも誘導バイアスの源として重要でない可能性がある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:22:18 GMT)
NANOGPT: A Query-Driven Large Language Model Retrieval-Augmented Generation System for Nanotechnology Research [7.5] ナノテクノロジー研究に適した大規模言語モデル検索・拡張生成システム(LLM-RAG)
システムは、Google Scholarの高度な検索を利用して関連する文献を検索し、Elsevier、Springer Nature、ACS Publicationsからオープンアクセス論文をスクラップする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:40:22 GMT)
RANGE: Retrieval Augmented Neural Fields for Multi-Resolution Geo-Embeddings [7.4] RANGEと呼ばれる新しい検索戦略を提案する。
分類タスクは最大13.1%、回帰タスクは0.145ドルR2$である。
コードはすべてGitHubでリリースされます。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:45:51 GMT)
INFO-SEDD: Continuous Time Markov Chains as Scalable Information Metrics Estimators [7.4] INFO-SEDDは、相互情報やエントロピーを含む離散データの情報理論量の推定方法である。
提案手法では,1つのパラメトリックモデルのトレーニングが必要である。
実験の結果、INFO-SEDDは堅牢であり、埋め込み技術に依存しているニューラルコンペティターよりも優れていた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:15:28 GMT)
When Continue Learning Meets Multimodal Large Language Model: A Survey [7.3] 特定のタスクに対する微調整MLLMは、しばしばモデルの事前知識領域のパフォーマンス低下を引き起こす。
本報告では,本領域における440件の研究論文の概要と分析について述べる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:39:10 GMT)
Spectral Analysis of Representational Similarity with Limited Neurons [7.2] 有限ニューロンサンプリングは、固有ベクトル非局在化による類似性を系統的に過小評価する。
個体群レベルでの類似性を推定し,小さなニューロンサンプルでも正確な分析が可能となった。
我々の理論は, 有限サンプリング制約下でのニューラルネットワーク解釈の実践的戦略として, 合成データセットと実データセットで検証されている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:35:36 GMT)
Poster: Long PHP webshell files detection based on sliding window attention [7.2] 私たちはまずPHPソースコードをOpcodeに変換し、次にOpcode Double-Tuples(ODT)を抽出します。
深層学習手法が長いウェブシェルファイルの検出を困難にしている問題に対処するため,スライディングウィンドウアテンション機構を導入する。
実験の結果,本手法はウェブシェル検出において精度が高いことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:36:55 GMT)
CFTrack: Enhancing Lightweight Visual Tracking through Contrastive Learning and Feature Matching [7.2] CFTrackは、コントラスト学習と特徴マッチングを統合して、識別的特徴表現を強化する軽量なトラッカーである。
我々はCFTrackがNVIDIA Jetson NXプラットフォーム上で毎秒136フレームで動作する、最先端の軽量トラッカーの多くを上回っていることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:46:00 GMT)
Recognition of Dysarthria in Amyotrophic Lateral Sclerosis patients using Hypernetworks [7.2] 変形の認識にハイパーネットを取り入れた最初の研究について述べる。
具体的には、オーディオファイルを使用し、それをlog-Mel Spectrogram、delta、delta-deltaに変換し、トレーニング済みの修正AlexNetモデルに渡します。
その結果,提案手法の精度は82.66%に向上した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:57:37 GMT)
Mixture of Experts for Recognizing Depression from Interview and Reading Tasks [7.2] うつ病は精神疾患であり、心理的、身体的、社会的など様々な症状を引き起こすことがある。
本研究は,自発音声と読み音声の両方を表現できる抑うつ認識タスクにおける最初の研究である。
我々は,因子化に基づく3種類のMoE,すなわち疎化MoEと多線形MoEを用いる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:54:14 GMT)
CNsum:Automatic Summarization for Chinese News Text [7.2] 本稿ではトランスフォーマー構造に基づく中国語ニューステキスト要約モデル(CNsum)を提案する。
実験の結果, CNsumはベースラインモデルよりもROUGEスコアがよいことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:25:34 GMT)
From Tokens to Words: On the Inner Lexicon of LLMs [7.1] 自然言語は単語で構成されているが、現代の大言語モデル(LLM)はサブワードを入力として処理する。
サブワード列をコヒーレントな全単語表現に結合する本質的なデトケン化過程にLLMが関与する証拠を提示する。
以上の結果から, LLMはトークン化のスコープを超えて, 潜在語彙を保っていることが示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:17:40 GMT)
A Multiple Transferable Neural Network Method with Domain Decomposition for Elliptic Interface Problems [7.0] 楕円型インタフェース問題の解法として,新しい多重転送型ニューラルネットワーク (Multi-TransNet) を提案する。
提案手法の精度,効率,ロバスト性を数値的に示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:01:53 GMT)
Beneath the Surface: How Large Language Models Reflect Hidden Bias [7.0] HBB(Hidden Bias Benchmark)は、現実のシナリオにおいて、バイアスの概念が自然主義的、微妙にフレーム化されたコンテキストの中に隠されていることの隠れバイアスを評価するために設計された、新しいデータセットである。
我々は6つの最先端のLarge Language Modelを分析し、モデルが過度なバイアスに反応してバイアスを減らす一方で、ニュアンスドセッティングにおけるバイアスの強化を続けていることを明らかにした。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:25:54 GMT)
DeePen: Penetration Testing for Audio Deepfake Detection [7.0] ディープフェイクは個人、組織、社会全体に重大なセキュリティリスクをもたらす。
私たちは、DeePenと呼ばれる体系的なテスト手法を導入します。
我々の手法は、対象のディープフェイク検出モデルへの事前の知識やアクセスなしに動作します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:26:25 GMT)
WWW: What, When, Where to Compute-in-Memory [6.9] 行列乗算は機械学習(ML)推論において支配的な計算である。
このような乗算処理を効率的に行うために、CiM(Compute-in-Memory)パラダイムが高エネルギー効率のソリューションとして登場した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:50:48 GMT)
OptionZero: Planning with Learned Options [6.9] 複雑な環境下での強化学習において,選択肢のあるプランニングが有効であることが示されている。
MuZero にインスパイアされた我々は OptionZero という新しいアプローチを提案する。
OptionZeroはオプションネットワークをMuZeroに統合し、セルフプレイゲームを通じてオプションの自律的な発見を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:56:52 GMT)
3D Trajectory Reconstruction of Moving Points Based on a Monocular Camera [6.9] 単眼カメラで撮影した画像からポイントの3Dモーションを再構築することは、事前の仮定なしでは不可能である。
本稿では,モノクロカメラを用いて移動点の3次元軌跡を再構成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:01:40 GMT)
Neuroplasticity and Corruption in Model Mechanisms: A Case Study Of Indirect Object Identification [6.9] 下位のメカニズムはタスク固有の微調整によって増幅される。
有害な微調整によるモデル劣化は、特定の回路成分に局所化される。
モデルは、クリーンデータセット上で破損したモデルをトレーニングする際に神経可塑性を示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:44:50 GMT)
SAC-ViT: Semantic-Aware Clustering Vision Transformer with Early Exit [6.9] Vision Transformer (ViT)はグローバルなモデリングに優れていますが、リソース制約のあるデバイスへのデプロイメントの課題に直面しています。
本稿では,セマンティック・アウェア・クラスタリング・ビジョン・トランス (SAC-ViT) を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:24:22 GMT)
Unifying Model Predictive Path Integral Control, Reinforcement Learning, and Diffusion Models for Optimal Control and Planning [6.9] 我々は,Gibs測度の勾配に基づく最適化により,MPPI,RL,拡散モデルを結ぶ統一的な視点を確立する。
まず,MPPIをスムーズなエネルギー関数上の勾配上昇として解釈できることを示す。
次に、ポリシーパラメータを固定初期状態下で制御変数として扱う場合、ポリシー勾配法がMPPIに還元されることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:26:36 GMT)
Revisiting Kernel Attention with Correlated Gaussian Process Representation [6.9] 自己注意ユニットを2つの相関GP(CGP)間の相互共分散としてモデル化した新しい変圧器のクラスを提案する。
これにより、非対称性が注目され、GPベースの変換器の表現能力を高めることができる。
実験により, CGPベースのトランスとスパースCGPベースのトランスの両方が, 最先端のGPベースのトランスよりも優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:21:48 GMT)
Omni-Mol: Exploring Universal Convergent Space for Omni-Molecular Tasks [6.8] 一般論モデルの構築は、近年、様々な科学的領域において顕著な能力を示している。
分子表現の競合は、モデルの最適化に困難をもたらす可能性がある。
本稿では,Omni-Molについて述べる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:55:12 GMT)
TAID: Temporally Adaptive Interpolated Distillation for Efficient Knowledge Transfer in Language Models [6.8] 本稿では,新規な知識蒸留法である$textitTemporally Adaptive Interpolated Distillation (TAID)$を紹介する。
TAIDは,各種モデルサイズおよびアーキテクチャに対して,命令チューニングと事前学習のシナリオにおいて優れた性能を示す。
これらの結果は、TAIDが高性能で効率的なモデルの作成に有効であることを示し、よりアクセスしやすいAI技術の開発を推進している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:41:37 GMT)
Rethinking Multimodal Learning from the Perspective of Mitigating Classification Ability Disproportion [6.6] モダリティの不均衡の存在は、実際には単調モデルよりも期待される優越性を達成できないマルチモーダル学習を妨げている。
持続的なブースティングアルゴリズムを設計することにより、弱いモダリティと強いモダリティの分類能力のバランスをとるために、新しいマルチモーダル学習手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:12:20 GMT)
InPK: Infusing Prior Knowledge into Prompt for Vision-Language Models [6.6] 学習可能なトークンにクラス固有の事前知識を注入するInPKモデルを提案する。
また、テキスト調整に対応するための学習可能なテキスト・ツー・ビジョン・プロジェクション・レイヤも導入する。
実験では、InPKは複数のゼロ/ファウショット画像分類タスクにおいて最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:33:18 GMT)
A Fusion Model for Artwork Identification Based on Convolutional Neural Networks and Transformers [6.6] 本稿では,CNNとトランスフォーマーを組み合わせた融合モデルを提案する。
中国と石油の絵画データセットの実験では、融合モデルは個々のCNNとトランスフォーマーモデルより優れていた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:18:08 GMT)
Climate And Resource Awareness is Imperative to Achieving Sustainable AI (and Preventing a Global AI Arms Race) [6.6] 持続可能なAIの可能性を実現するためには、気候と資源の認識の整合が不可欠である、と我々は主張する。
この対立に対処するために、CARAML(Climate and Resource Aware Machine Learning)フレームワークを紹介します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:54:10 GMT)
HadamRNN: Binary and Sparse Ternary Orthogonal RNNs [6.5] ニューラルネットワークにおけるバイナリおよびスパース3次重みは、より高速な計算とより軽い表現を可能にする。
バニラRNNは、反復重みの変化に非常に敏感であり、これらの重みの双対化と三元化は本質的に困難である。
本稿では,アダマール行列の特性を利用して二進行列および三進行列のサブセットをパラメータ化する手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:26:43 GMT)
Representing Signs as Signs: One-Shot ISLR to Facilitate Functional Sign Language Technologies [6.4] 独立した手話認識は、スケーラブルな言語技術にとって不可欠である。
言語をまたいで一般化し,語彙を進化させるワンショット学習手法を提案する。
我々は、異なる言語から10,235のユニークな記号を含む大きな辞書上で50.8%のワンショットMRRを含む最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:07:51 GMT)
Measuring Non-Hermitian Topological Invariants Directly from Quench Dynamics [6.3] 非エルミタン(NH)位相相と現象は様々な量子系で観測されている。
奇数次元系における様々なNHトポロジ不変量の直接測定のための汎用的で統一的なフレームワークを提案する。
この研究は、量子系におけるNHトポロジカル不変量の直接測定の道を開いた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:41:56 GMT)
A Generative Model Enhanced Multi-Agent Reinforcement Learning Method for Electric Vehicle Charging Navigation [6.3] 本稿では,EVのローカル情報のみを利用する新しい生成モデル拡張型マルチエージェントDRLアルゴリズムを提案する。
実験の結果,提案アルゴリズムは局所的な情報に依存し,既存の局所的な情報に基づく手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:24:51 GMT)
FBChain: A Blockchain-based Federated Learning Model with Efficiency and Secure Communication [6.3] 本稿では、上記の2つの問題を克服するフェデレートラーニング(FBChain)モデルを提案する。
まず、ブロックチェーンの不変性を利用して、ローカルモデルパラメータのグローバルモデルとハッシュ値を格納する。
第二に、Proof of Weighted Link Speed (PoWLS)コンセンサスアルゴリズムは、より重み付きリンク速度の高いノードを包括的に選択し、グローバルモデルとパッケージブロックを集約する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:08:48 GMT)
Risk-aware Integrated Task and Motion Planning for Versatile Snake Robots under Localization Failures [6.3] スネークロボットは、地球と宇宙の応用において、極端な地形や制限された環境を通して移動を可能にする。
この問題に対処するために、間欠的にスケジューリングされたスコープ(BLISS)を用いたブラインドモーションを提案する。
BLISSは、プロピロセプションのみのモビリティと間欠的なスキャンを組み合わせることで、ローカライゼーション障害と衝突リスクの両方に対して耐性がある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:02:51 GMT)
Hyperparameters in Score-Based Membership Inference Attacks [6.2] メンバーシップ推論攻撃(MIA)は、機械学習モデルによるプライバシー漏洩を評価する貴重なフレームワークとして登場した。
本稿では,攻撃者が事前知識を持っていない場合に,MIAのシャドウモデルを訓練するためのハイパーパラメータを選択する手法を提案する。
トレーニングデータを用いたHPOの実行がMIAの脆弱性を増大させるという統計的に有意な証拠は見つからない。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:44:37 GMT)
Data Distributional Properties As Inductive Bias for Systematic Generalization [6.1] ディープニューラルネットワーク (DNN) は系統的一般化 (SG) に苦戦している
SGの推進におけるデータ特性の育成に焦点をあてる研究はほとんどない。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:14:01 GMT)
Bridging Legal Knowledge and AI: Retrieval-Augmented Generation with Vector Stores, Knowledge Graphs, and Hierarchical Non-negative Matrix Factorization [6.0] 大規模言語モデル(LLM)を利用したエージェント生成AI - 検索型生成(RAG)、知識グラフ(KG)、ベクトルストア(VS)
この技術は、膨大な非構造化または半構造化データセット内の関係を推測するのに優れている。
非負行列因子化(Non-Negative Matrix Factorization, NMF)により構築されたRAG, VS, KGを統合した生成AIシステムを導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:35:39 GMT)
Show and Tell: Visually Explainable Deep Neural Nets via Spatially-Aware Concept Bottleneck Models [6.0] 本稿では,視覚ニューラルネットワークを空間的・概念的に解釈可能なモデルに変換する統一的な枠組みを提案する。
この手法をSALF-CBM(Spatially-Aware and Label-Free Concept Bottleneck Model)と呼ぶ。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:27:55 GMT)
CryptoPulse: Short-Term Cryptocurrency Forecasting with Dual-Prediction and Cross-Correlated Market Indicators [5.9] 本稿では、マクロ経済変動、技術的指標、個別の暗号通貨価格変化を取り入れて、翌日の閉値を予測する二重予測機構を提案する。
実験により,提案モデルが最先端の性能を達成し,連続して10つの比較法より優れた結果が得られた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:38:49 GMT)
Vision-Encoders (Already) Know What They See: Mitigating Object Hallucination via Simple Fine-Grained CLIPScore [5.9] 本研究は、物体幻覚の主な原因は、視覚エンコーダの限られた表現能力にあるという以前の主張を再考する。
名詞句レベルでのテキスト埋め込みを組み込むことでオブジェクトレベルの粒度を高めるCLIPScore(F-CLIPScore)を提案する。
F-CLIPScoreの精度は従来のCLIPScoreよりも39.6%向上した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:20:02 GMT)
HALO: Hardware-aware quantization with low critical-path-delay weights for LLM acceleration [5.9] ハードウェア・アウェア・ポスト・トライニング・量子化(PTQ)アプローチにより,様々なハードウェアに適応する汎用フレームワークであるHALOを紹介する。
HALOは平均270%のパフォーマンス向上と51%の省エネを実現しており、いずれも最小限の精度低下である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:08:33 GMT)
In-Model Merging for Enhancing the Robustness of Medical Imaging Classification Models [5.9] In-model merging(InMerge)を提案する。
異なるCNNアーキテクチャに対する本手法の有効性と有効性を示す。
提案したInMerge学習モデルは、典型的に訓練されたモデルをかなりのマージンで上回る。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:52:55 GMT)
Theoretical characterisation of the Gauss-Newton conditioning in Neural Networks [5.9] ニューラルネットワークにおけるガウスニュートン行列(GN)の条件付けを理論的に特徴付けるための第一歩を踏み出す。
我々は、任意の深さと幅の深い線形ネットワークにおいて、GNの条件数に厳密な境界を確立する。
残りの接続や畳み込み層といったアーキテクチャコンポーネントに分析を拡張します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:36:42 GMT)
3D-HGS: 3D Half-Gaussian Splatting [5.8] シーン3D再構成による写真リアル画像のレンダリングは、3Dコンピュータビジョンの基本的な問題である。
本稿では,プラグイン・アンド・プレイカーネルとして使用できる3Dハーフ・ガウスカーネルを紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:52:28 GMT)
A RankNet-Inspired Surrogate-Assisted Hybrid Metaheuristic for Expensive Coverage Optimization [5.8] 大規模カバレッジ最適化タスクを処理するために,RangeNetによるSurrogate支援ハイブリッドメタヒューリスティックを提案する。
我々のアルゴリズムは、EMVOPの最先端アルゴリズムを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:32:30 GMT)
Investigating Neurons and Heads in Transformer-based LLMs for Typographical Errors [5.7] 本稿では,LLMが入力をタイプミスでエンコードする方法について検討する。
本稿では,入力にタイポが含まれている場合にアクティブに機能する入力ニューロンとタイポヘッドを同定する手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:30:07 GMT)
Spatial-RAG: Spatial Retrieval Augmented Generation for Real-World Spatial Reasoning Questions [5.7] 本稿では,空間的タスクにRAGを拡張するフレームワークである空間検索拡張生成(Spatial-RAG)を提案する。
多目的ランキング戦略は空間的制約と意味的関連性のバランスを保ち、LLM誘導ジェネレータはコヒーレント応答を保証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:17:57 GMT)
AI Will Always Love You: Studying Implicit Biases in Romantic AI Companions [5.7] 本研究の目的は,基本ラインに対するペルソナ指定モデル応答を定量的に分析することにより,異なる協調システムに現れるバイアスを測定し,比較することである。
これらの結果は、男女関係のペルソナを大規模言語モデルに割り当てることによって、これらのモデルの反応や特定の状況において、偏りがあり、ステレオタイプ的な方法で著しく変化することを示します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:16:37 GMT)
Unveiling Security Weaknesses in Autonomous Driving Systems: An In-Depth Empirical Study [5.7] 本研究は、オープンソースの自律運転システム(ADS)の繰り返しにおける潜在的なセキュリティの弱点について検討することを目的とする。
私たちは、GitHubのスター数とレベル4の自動運転機能に基づいて、Autoware、AirSim、Apolloの3つの代表的なオープンソースプロジェクトを選択しました。
CodeQLを使用して、これらのプロジェクトの複数のバージョンを分析して脆弱性を特定し、CWE-190やCWE-20といったCWEカテゴリに注目しました。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:57:53 GMT)
Broken Letters, Broken Narratives: A Case Study on Arabic Script in DALL-E 3 [5.6] 本稿では,生成型AIシステムDALL-E3について,書字アラビア文字を正しく表現できないことに着目した。
我々は、エドワード・サイードのオリエンタリズムの概念に照らして、これらの制限、出現するバイアス、およびより広い意味を探求する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:02:40 GMT)
Soft-QMIX: Integrating Maximum Entropy For Monotonic Value Function Factorization [5.5] 本稿では,最大エントロピーRLフレームワークに付加的な局所Q値学習手法を組み込むことにより,QMIXの強化を提案する。
我々のアプローチは、全てのアクションの正しい順序を維持するために、局所的なQ値の推定を制約する。
理論的には,本手法の単調改善と収束性を最適解に証明する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:16:36 GMT)
A Unifying Information-theoretic Perspective on Evaluating Generative Models [5.5] 最近のいくつかのアプローチでは、分類領域から借用された「精度」と「リコール」を利用して、出力の忠実度(リアリズム)と出力の多様性(実データ変動の表現)を個別に定量化している。
我々は、kNN密度推定のアプローチを用いて、kth-nearest-neighbors(kNN)ベースのメトリクスのクラスを情報理論レンズの下に統一する。
高精度クロスエントロピー(PCE)、リコールクロスエントロピー(RCE)、リコールエントロピー(RE)からなる3次元計量を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:25:41 GMT)
RUBIK: A Structured Benchmark for Image Matching across Geometric Challenges [5.5] RUBIKは、よく定義された幾何学的難易度で画像マッチング手法を体系的に評価する新しいベンチマークである。
提案手法を総合的に評価した結果,近年の検出器フリー手法が最高の性能(>47%成功率)を達成する一方で,計算オーバーヘッドが著しく大きいことが判明した。
最高のパフォーマンス方法でさえ、54.8%のペアで成功し、改善の余地がかなり浮かび上がっている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:32:41 GMT)
ProAPO: Progressively Automatic Prompt Optimization for Visual Classification [5.5] 視覚言語モデル(VLM)は、大規模なペア画像テキストデータを用いた訓練により、画像分類に大きな進歩をもたらした。
近年の手法では,大型言語モデル(LLM)が生成する視覚的記述がVLMの一般化を促進することが示されているが,クラス固有のプロンプトはLLMの幻覚によって不正確あるいは識別に欠ける可能性がある。
本稿では,最小限の監督を要さず,かつループを含まない細粒度カテゴリに対して,視覚的に識別可能なプロンプトを見つけることを目的とする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:39:23 GMT)
Topological Autoencoders++: Fast and Accurate Cycle-Aware Dimensionality Reduction [5.4] 我々はトポロジカルオートエンコーダ(TopoAE)の定式化に基づいて構築する。
平面中のリプス濾過のためのPHの正確な計算のための新しい高速アルゴリズムを提案する。
また,Wasserstein距離によって測定された位相的精度と,低次元の周期の視覚的保存とのバランスも向上する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:55:23 GMT)
Graph Probability Aggregation Clustering [5.4] 本稿では,グローバルクラスタリング対象関数と局所クラスタリング制約を統一するグラフベースのファジィクラスタリングアルゴリズムを提案する。
GPACフレームワーク全体は多制約最適化問題として定式化され、ラグランジアン法を用いて解くことができる。
合成,実世界,ディープラーニングのデータセットを用いて行った実験は,GPACがクラスタリング性能において既存の最先端手法を超えるだけでなく,計算効率も優れていることを示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:11:32 GMT)
Large Language Model Strategic Reasoning Evaluation through Behavioral Game Theory [5.4] 本研究では,行動ゲーム理論に基づく評価フレームワークを導入する。
実験の結果,GPT-o3-mini,GPT-o1,DeepSeek-R1がほとんどのゲームを支配しているが,モデルスケールだけでは性能を判断できないことがわかった。
拡張の促進に関して、CoT(Chain-of-Thought)の促進は、特定のレベルのモデルに対してのみ戦略的推論を増大させ、他の場所では限定的な利得を提供するため、普遍的に効果的ではない。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:58:31 GMT)
Algebraic Adversarial Attacks on Integrated Gradients [5.3] パスメソッドは、敵攻撃の影響を受けやすい属性メソッドの一種である。
代数的対数例は、対数例に対する数学的に抽出可能なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:13:57 GMT)
Visual Reasoning at Urban Intersections: FineTuning GPT-4o for Traffic Conflict Detection [5.2] 本研究では,MLLM(Multimodal Large Language Models)を利用した論理的・視覚的推論機能について検討する。
提案手法では,GPT-4oは衝突を検知し,運転者に対して説明や勧告を行うインテリジェントシステムとして機能する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:26:29 GMT)
HazardNet: A Small-Scale Vision Language Model for Real-Time Traffic Safety Detection at Edge Devices [5.2] 本稿では,交通安全を高めるために設計された小型ビジョン言語モデルHazardNetを紹介する。
既存のQwen2-VL-2Bモデルを微調整してHazardNetを構築した。
本稿では,現実のシナリオでHazardNetをトレーニングするために構築された,視覚質問回答データセットHazardQAを紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:21:45 GMT)
An Effective Automated Speaking Assessment Approach to Mitigating Data Scarcity and Imbalanced Distribution [5.2] 自己教師付き学習(SSL)は、従来の手法と比較して星級のパフォーマンスを示している。
しかし、SSLベースのASAシステムは、少なくとも3つのデータ関連の課題に直面している。
これらの課題には、限られた注釈付きデータ、学習者の習熟度レベルの不均一分布、CEFR習熟度レベル間の不均一スコア間隔が含まれる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:19:22 GMT)
Gradient-Guided Annealing for Domain Generalization [5.1] ドメインの一般化効率を向上させるため,GGAアルゴリズムを提案する。
GGAの有効性は、広く受け入れられ、困難な画像分類領域の一般化ベンチマークで評価される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:01:55 GMT)
I see what you mean: Co-Speech Gestures for Reference Resolution in Multimodal Dialogue [5.0] 本稿では,表現ジェスチャを中心としたマルチモーダル参照解決タスクを提案する。
頑健なジェスチャー埋め込みを学習する上での課題を同時に解決する。
本研究は,人間と機械の相互作用のより自然主義的なモデルに向けての一歩となる,参照分解におけるジェスチャーと音声の相補的役割を強調した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:28:12 GMT)
AsymLoRA: Harmonizing Data Conflicts and Commonalities in MLLMs [5.0] AsymLoRAは、知識のモジュール化と相互調整を統一するパラメータ効率のチューニングフレームワークである。
AsymLoRAは、共通点のみを捉えたバニラLoRAと、紛争のみに焦点を当てたLoRA-MoEの両方を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:21:02 GMT)
SAP-DIFF: Semantic Adversarial Patch Generation for Black-Box Face Recognition Models via Diffusion Models [5.0] 敵対的妨害によって攻撃者は正当性を装うことができるため、偽装攻撃は重大な脅威となる。
そこで本研究では,直接画素操作ではなく,潜在空間における意味摂動による逆パッチ生成手法を提案する。
提案手法は,平均攻撃成功率を45.66%向上させ,クエリ数を約40%削減する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:57:29 GMT)
Deep Modeling of Non-Gaussian Aleatoric Uncertainty [5.0] ディープラーニングは、ロボット状態推定システムにおけるアレタリック不確実性を正確にモデル化する、有望な新しい方法を提供する。
本研究では,条件付き確率密度モデリングのための3つの基礎的深層学習手法を定式化し,評価する。
以上の結果から,これらの深層学習手法は複雑な不確実性パターンを正確に把握し,評価システムの信頼性と堅牢性を向上させる可能性を強調した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:35:59 GMT)
Bilevel reinforcement learning via the development of hyper-gradient without lower-level convexity [4.9] 2段階強化学習 (RL) は2段階間問題を特徴とする。
非レベル凸情報は、双レベル最適化手法を開発する上での障害である。
ハイパーグラディエント(Hyper-gradient)は、エクスプロイトと探索の統合として機能する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:52:19 GMT)
Language Independent Stance Detection: Social Interaction-based Embeddings and Large Language Models [4.9] 本稿では,テキストそのものではなく,ソーシャルネットワーク上で利用できるインタラクションに重点を置くことで,姿勢検出の課題に取り組むことを目的とする。
埋め込みを生成することで友達のリツイートなどのソーシャル情報を活用できる新しい手法を提案する。
公開されている7つのデータセットと4つの異なる言語に関する実験により、リレーショナルな埋め込みと差別的なテキストの手法を組み合わせることで、パフォーマンスが大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:17:32 GMT)
Goal-Driven Reasoning in DatalogMTL with Magic Sets [4.9] DatalogMTLは時間的推論のための強力なルールベースの言語である。
本稿では,マジックセット技術を利用したDatalogMTLの新しい推論手法を提案する。
その結果,提案手法は最先端の推論手法よりも大きく,かつ一貫して優れていたことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:13:20 GMT)
GraphSparseNet: a Novel Method for Large Scale Trafffic Flow Prediction [4.9] ディープラーニング、特にグラフNNによる最近の進歩は、複雑なダイナミクスによってこれらの予測の精度を大幅に向上させた。
しかし、GraphSparseNetはモデル複雑さが指数関数的に増大しているため、依然として課題である。
本稿では,GNNトラフィックベース予測モデルの精度とスケーラビリティを両立させる新しいフレームワークであるGraphSparseNetを紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:51:20 GMT)
Quantum walk based Monte Carlo simulation for photon interaction cross sections [4.8] 高エネルギー物理シミュレーションは伝統的に複雑な粒子相互作用をモデル化するモンテカルロ法に依存している。
本稿では、離散時間量子ウォークと量子振幅推定を統合した新しい量子拡張シミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:54:57 GMT)
RetinaRegen: A Hybrid Model for Readability and Detail Restoration in Fundus Images [4.7] RetinaRegenは、可読性クラスフィカチオンモデル、拡散モデル、変分オートエンコーダを統合した網膜画像復元のためのハイブリッドモデルである。
SynFundus-1Mデータセットの既存の特徴は、提案手法がPSNR 27.4521、SSIM 0.9556、LPIPS 0.1911を光学ディスクの可読性ラベルとして達成していることを示している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:41:58 GMT)
ColorDynamic: Generalizable, Scalable, Real-time, End-to-end Local Planner for Unstructured and Dynamic Environments [4.7] 本研究では,ロボットのローカルプランニング問題に対処するColorDynamicフレームワークを提案する。
生センサデータを直接制御コマンドにマッピングする、エンドツーエンドのDeep Reinforcement Learning(DRL)の定式化が確立されている。
時間遷移からオンラインDRL学習を可能にする新しいネットワークであるTransqerが導入された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:01:11 GMT)
STUPD: A Synthetic Dataset for Spatial and Temporal Relation Reasoning [4.7] 本稿では,英語の前置詞から得られる空間的関係を理解するための大規模ビデオデータセットを提案する。
データセットには150Kの視覚的描写(ビデオと画像)が含まれており、30の異なる空間的前置詞感覚で構成されている。
また,空間的関係に加えて,事象・時間的相互作用を描写したビデオからなる10の時間的関係にまたがる50Kの視覚的描写も提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:32:44 GMT)
Highly Entangled 2D Ground State: Tensor Network, Order Parameter and Correlation [4.6] 本稿では,2次元基底状態の最初の例における正確なテンソルネットワーク表現,スピンオーダーパラメータ,色相関関数に関する解析結果を示す。
内脚の収縮規則は、3次元空間における立方体の容器化の観点から、単純な翻訳不変の規則によって規定される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:28:12 GMT)
Quantum Simulation of Boson-Related Hamiltonians: Techniques, Effective Hamiltonian Construction, and Error Analysis [4.5] 本チュートリアルでは,特定のボソニックモデルであるハミルトニアンの符号化とシミュレーションに焦点を当てる。
本稿では,これらの相互作用モデルに対する量子アルゴリズムの開発と,有効ハミルトニアンの構成について論じる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:46:03 GMT)
When does a predictor know its own loss? [4.5] 損失予測の理論的基礎について検討する。
我々の主な貢献は、非自明な損失予測とある種の多重校正との密接な関係を確立することである。
予測器の自己見積を改善することができる損失予測器は、多重校正の失敗を目撃者に与えることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:50:51 GMT)
Hiring under Congestion and Algorithmic Monoculture: Value of Strategic Behavior [4.4] 企業が応募者の共有プールから雇用を競うような環境での戦略的行動の影響について検討する。
面接に合格した者には求職申し込みが与えられ、複数の申し込みを受けた応募者がランダムにその1つを受諾する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:11:11 GMT)
A Novel P-bit-based Probabilistic Computing Approach for Solving the 3-D Protein Folding Problem [4.4] この研究は、タンパク質の折り畳みに取り組むために確率論的計算を適用する最初の試みである。
本稿では,イジングモデルに問題をマッピングするための,多体インタラクションに基づく新しい符号化手法を提案する。
本手法は6アミノ酸の短いペプチド配列のエネルギー景観を著しく単純化することを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:46:25 GMT)
A Full Adagrad algorithm with O(Nd) operations [4.4] この研究は大規模アプリケーションのための効率的で実用的なアルゴリズムを提供する。
この革新的な戦略は、一般的にフルマトリックスメソッドに関連する複雑さとリソース要求を著しく削減する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:37:44 GMT)
Open-Vocabulary Semantic Part Segmentation of 3D Human [4.4] 3次元人間を扱える最初のオープン語彙セグメンテーション法を提案する。
我々のフレームワークは、テキストのプロンプトに基づいて、人間のカテゴリを所望のきめ細かい部分に分類することができる。
本手法はメッシュ,点雲,3次元ガウススプラッティングなど,様々な3次元表現に直接適用することができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:47:05 GMT)
Applying Deep Learning to Ads Conversion Prediction in Last Mile Delivery Marketplace [4.4] ディープニューラルネットワーク(DNN)は、Webスケールのランキングシステムに革命をもたらし、複雑なユーザの振る舞いを捉え、パフォーマンスを向上するブレークスルーを可能にした。
DoorDashでは、ホームページ広告ランキングシステムを従来のツリーベースモデルから最先端のマルチタスクDNNに移行することで、この変革的なパワーを活用しました。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:32:58 GMT)
How Much is Enough? The Diminishing Returns of Tokenization Training Data [4.3] 1GBから900GBまでのデータサイズがトークン化品質に及ぼす影響について検討した。
以上の結果から,データサイズが大きくなるにつれてリターンの低下が明らかとなり,トレーニングデータのスケーリングによってトークン化の品質が向上する,という現実的な限界が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:01:23 GMT)
Naturalistic Computational Cognitive Science: Towards generalizable models and theories that capture the full range of natural behavior [4.3] AIの進歩は、認知科学がますます自然主義的な刺激、タスク、行動を伴う実験を受け入れる機会を提供すると主張する。
本稿では,方法論的実践が自然主義的認知科学の累積的進歩にどのように貢献するかについて,実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:20:54 GMT)
Breakdown of time-independent methods in non-Hermitian scattering systems [4.3] 転送行列法のような時間に依存しない手法は、非エルミート系の散乱特性を分析するために広く用いられている。
散乱行列(S-行列)が複素波数平面の第1次四角形に極を示すと,これらの手法が無効となることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:20:49 GMT)
The Impact of Transparency in AI Systems on Users' Data-Sharing Intentions: A Scenario-Based Experiment [4.2] 透明かつ非透明なデータ処理エンティティがデータ共有の意図にどのように影響するかを検討した。
驚いたことに、我々の結果は、エンティティ間でデータを共有したいという意志に有意な差は示さなかった。
我々は、特に透明なAI状態において、AIに対する信頼の一般的な態度が、有意なポジティブな影響があることを発見した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:28:09 GMT)
On the Importance of Reward Design in Reinforcement Learning-based Dynamic Algorithm Configuration: A Case Study on OneMax with (1+($λ$,$λ$))-GA [4.2] 本稿では,RLエージェントによる環境探索の促進を目的とした報奨形成機構を提案する。
我々の研究は、$(lambda,lambda)$-GAを動的に設定する際のRLの機能を示しているが、RLエージェントのスケーラビリティにおける報酬形成の利点も確認している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:53:28 GMT)
Fiddler: CPU-GPU Orchestration for Fast Inference of Mixture-of-Experts Models [4.2] Fiddlerは、限られたGPUリソースを持つMoEモデルのリソース効率の高い推論システムである。
評価の結果、特定のシナリオを最適化する最先端システムとは異なり、Fiddlerはすべてのシナリオでより優れた性能を発揮することがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:07:37 GMT)
Speculative Decoding and Beyond: An In-Depth Review of Techniques [4.2] シーケンシャルな依存関係は、大規模な自己回帰モデルをデプロイする上で、根本的なボトルネックとなる。
ジェネレーション・リファインメント・フレームワークの最近の進歩は、このトレードオフを著しく緩和できることを示している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:53:45 GMT)
High-Fidelity Relightable Monocular Portrait Animation with Lighting-Controllable Video Diffusion Model [4.2] 既存のポートレートアニメーション法では、内在的(アイデンティティと外観)と外在的(目的と照明)の特徴を分離・操作しないため、ライティング可能なポートレートを実現することができない。
本稿では,高忠実でライティング可能なポートレートアニメーションのためのライティング制御可能なビデオ拡散モデル(LCVD)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:03:36 GMT)
VideoA11y: Method and Dataset for Accessible Video Description [4.1] ビデオの説明は視覚障害者(BLV)にとって、視覚コンテンツにアクセスするのに不可欠である。
我々は,マルチモーダル大言語モデル(MLLM)とビデオアクセシビリティガイドラインを利用して,BLV個人に適した記述を生成するアプローチであるVideoA11yを紹介する。
この手法を用いて,BLVユーザが記述した4万本のビデオの最大かつ最も包括的なデータセットであるVideoA11y-40Kをキュレートした。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:44:31 GMT)
Scalable Coordinated Learning for H2M/R Applications over Optical Access Networks (Invited) [4.1] H2M/R(Human-to-machine/robot)は,産業用5.0。
本稿では,広域にわたるスケーラブルなH2M/R通信について論じる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:56:51 GMT)
Explanatory Debiasing: Involving Domain Experts in the Data Generation Process to Mitigate Representation Bias in AI Systems [4.0] 表現バイアス(Representation bias)は、人工知能(AI)システムにおける最も一般的なバイアスの1つである。
本稿では,表現障害にドメインエキスパートを効果的に巻き込むための汎用設計ガイドラインを紹介する。
この結果から,モデル精度を損なうことなく,ドメインエキスパートの関与による表現バイアスの低減が可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:45:05 GMT)
Digital Simulation of Non-Abelian Parafermions in Superconducting Circuits [4.0] パラフェルミオンは非アベリア統計を示し、トポロジカルに順序付けられたシステムで現れる。
この研究は、超伝導量子ビットの従来のツイスト欠陥の手法をキューディット系に拡張した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:42:18 GMT)
Quantum noise spectroscopy of superconducting dynamics in thin film Bi$_2$Sr$_2$CaCu$_2$O$_{8+δ}$ [4.0] 薄膜Bi$Sr$CaCu$O$_8+delta$(BSCCO)の研究のための強力な非侵襲ツールとしてのダイヤモンド中の窒素空孔中心
ノイズスペクトロスコピーは、バーディーン=クーパー=シュリーファー(BCS)平均場理論と一致して、準粒子が生成する低周波(GHzスケール)磁気ノイズを捕捉する。
本研究は,超伝導体における動的現象を探索するための多目的プラットフォームとして量子ノイズ分光法を確立した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:29:30 GMT)
Probing-RAG: Self-Probing to Guide Language Models in Selective Document Retrieval [4.0] 本稿では,言語モデルの中間層からの隠れ状態表現を利用して,与えられたクエリに対する追加検索の必要性を適応的に決定するProbing-RAGを提案する。
Probing-RAGはモデルの内部認識を効果的に捉え、外部文書の取得に関する信頼性の高い意思決定を可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:49:02 GMT)
CS-PaperSum: A Large-Scale Dataset of AI-Generated Summaries for Scientific Papers [3.9] CS-PaperSumは、31の上位コンピュータサイエンスカンファレンスから91,919件の大規模データセットである。
我々のデータセットは、自動文献分析、研究トレンド予測、AIによる科学的発見を可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:48:35 GMT)
Autoregressive Adaptive Hypergraph Transformer for Skeleton-based Activity Recognition [3.7] 本稿では,自己回帰型適応型ハイパーグラフ変換器(AutoregAd-HGformer)モデルを提案する。
強力な自己回帰学習先を備えたベクトル量子化内相ハイパーグラフは、ハイパーエッジ形成に適したより堅牢で情報的な表現を生成する。
AutoregAd-HGformerにおけるハイブリッド(教師なし、教師なし)学習は、空間的、時間的、チャネル次元に沿った行動依存的な特徴を探索する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:34:59 GMT)
Infinite-dimensional Extension of the Linear Combination of Hamiltonian Simulation: Theorems and Applications [3.6] 我々は、無限次元空間における時間進化作用素をシミュレートするために、ハミルトニアン・シミュレーション(LCHS)の公式を拡張した。
我々は、Inf-LCHS定理の幅広い非エルミート力学への適用性を実証する。
我々の分析は、有限個の量子力学を用いた一般線形力学のシミュレーションに関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:58:32 GMT)
Robust sensitivity control in digital pathology via tile score distribution matching [3.6] 最適輸送とMIL(Multiple Instance Learning)に基づくWSI分類モデルの感度制御のための新しいアプローチを提案する。
本手法は,少数の校正サンプルのみを用いて頑健な感度制御が可能であり,信頼性の高い計算病理システム構築のための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:35:47 GMT)
EchoVideo: Identity-Preserving Human Video Generation by Multimodal Feature Fusion [3.6] 既存の手法は「コピー・ペースト」アーティファクトと類似性の低い問題に苦しむ。
テキストから高レベルなセマンティック機能を統合して、クリーンな顔認証表現をキャプチャするEchoVideoを提案する。
高品質で制御性があり、忠実なビデオを生成するのに優れた結果をもたらす。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:55:41 GMT)
Fast Debiasing of the LASSO Estimator [3.6] 高次元スパース回帰では、textscLasso 推定器は優れた理論的保証を提供するが、偏りのある推定を生成することはよく知られている。
ランダムな準ガウス感知覚行列 $boldsymbolA$ に対する textscLasso 推定値について「脱バイアス法」を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:59:17 GMT)
Swarm Learning: A Survey of Concepts, Applications, and Trends [3.6] ディープラーニングモデルは、中央サーバ上の大規模なデータセットに依存しているため、プライバシとセキュリティの懸念を高めている。
Federated Learning (FL)は、汎用的で大規模な機械学習フレームワークを構築するための新しいアプローチを導入した。
Swarm Learning (SL) は Hewlett Packard Enterprise (HPE) と共同で提案されている。
SLは、セキュアでスケーラブルでプライベートなデータ管理にブロックチェーン技術を活用する、分散機械学習フレームワークである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:21:30 GMT)
Playing Pokémon Red via Deep Reinforcement Learning [3.5] 古典的なゲームボーイJRPGであるPok'emon Redは、エージェントのテストベッドとして重要な課題を提示している。
本稿では,Cerrulean Cityの完成までのゲームの初期セグメントを完了させるベースラインエージェントを実証する,単純化された環境と深層強化学習の方法論を紹介する。
我々の実験には、報酬形成の脆弱性を明らかにする様々な改善が含まれており、エージェントは特定の報酬信号を利用する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:42:23 GMT)
ACE, Action and Control via Explanations: A Proposal for LLMs to Provide Human-Centered Explainability for Multimodal AI Assistants [3.5] 製造分野における人為的パフォーマンス支援のためのマルチモーダルAIシステム構築に関わる課題に対処する。
我々は,LLMが人間の解釈可能な「意味的フレーム」の形で説明を作成できることを示唆している。
これにより、人間とAIシステムが協力し、より正確な人間の活動と行動のモデルを構築するのに役立つ。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:27:57 GMT)
Sketch & Paint: Stroke-by-Stroke Evolution of Visual Artworks [3.5] 本稿では,近接クラスタリング機構を用いて,アートストロークの進化を近似する新しい手法を提案する。
提案アルゴリズムは未知のアートワークにおけるストロークシーケンスを推論する可能性を実証する。
本研究の目的は,視覚芸術の技法の複雑化と,視覚芸術の背景にあるステップバイステップの再構築プロセスの理解を深めることである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:11:58 GMT)
Quantum generative classification with mixed states [3.5] 量子生成分類(QGC)と呼ばれる量子生成多クラス分類戦略を提案する。
このモデルは変動量子アルゴリズムを用いて、混合量子状態を用いてデータセットの特徴とラベルの結合確率密度関数を推定する。
量子生成分類アルゴリズムは、トレーニングデータの核ヒルベルト空間を再現するガウス混合とみなすことができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:56:47 GMT)
Discrete Superconvergence Analysis for Quantum Magnus Algorithms of Unbounded Hamiltonian Simulation [3.5] 空間離散化点が有限個ある完全離散状態において、最初の超収束推定をN$とする。
我々は、離散化数と演算子ノルムによって再スケールされた時間ステップサイズにより、2つのパラメータを同定し、半古典的枠組みを確立する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:43:28 GMT)
Cubic regularized subspace Newton for non-convex optimization [3.5] 我々は、ランダムな部分空間に定常正規化を適用すると解釈できる座標二階SSCNを解析する。
従来の一階法と比較して,大幅な高速化を示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:56:55 GMT)
Incremental Learning with Repetition via Pseudo-Feature Projection [3.5] 本研究では,データ反復による非定型的な漸進的学習戦略の影響について検討する。
提案手法は, 従来のシナリオにおいて, 繰り返しを伴わない競争結果と, 繰り返しを伴わない場合の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:43:35 GMT)
QORT-Former: Query-optimized Real-time Transformer for Understanding Two Hands Manipulating Objects [3.4] 本稿では,2つの手とオブジェクトの3次元ポーズ推定のためのクエリ最適化リアルタイムフレームワークを提案する。
我々は,市販のアクション認識モジュールとリアルタイムの効率を維持しながら,インタラクション認識の最先端を定めている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:12:53 GMT)
PT -symmetry breaking and universal spectral statistics in quantum kicked rotors [3.4] 共振条件下でのPT対称量子キックロータの自然パリティ時間破断特性とスペクトル特性について検討した。
局所化系では、非エルミートパラメータの増大はPT対称性が自発的に壊れた位相からの遷移を誘導する。
非局在化状態において、そのような遷移の存在は、還元された系がPT対称であるかどうかに依存する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:29:15 GMT)
SoRFT: Issue Resolving with Subtask-oriented Reinforced Fine-Tuning [3.4] Subtask-oriented Reinforced Fine-Tuning (SoRFT) は, LLMの問題解決能力を高めるための新しいトレーニング手法である。
SWE-Bench Verified と SWE-Bench Lite を用いたSORFT訓練モデルの評価を行い,オープンソースモデル間でのSOTA(State-of-the-art)性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:19:45 GMT)
Building reliable sim driving agents by scaling self-play [3.3] 1つのGPUでスクラッチからトレーニングすることで、エージェントは1日以内に完全なトレーニングセットを解決します。
彼らは効果的にテストシーンを見えないように一般化し、99.8%のゴール達成率と0.8%以下の衝突とオフロードインシデントを達成した。
我々は、事前訓練されたエージェントをオープンソース化し、バッチ化されたマルチエージェントシミュレータと統合する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:38:26 GMT)
GOD model: Privacy Preserved AI School for Personal Assistant [3.3] 私たちは、デバイス上でAIアシスタントをトレーニングし評価するためのセキュアでプライバシー保護のフレームワークであるGuardian of Data(GOD)を紹介します。
GODは、ユーザデータと自律性を保護しながら贈り物を推奨するなど、アシスタントがユーザニーズをいかに予測できるかを測定します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:33:35 GMT)
Optimization Proxies using Limited Labeled Data and Training Time -- A Semi-Supervised Bayesian Neural Network Approach [3.3] 制約のある最適化問題は、在庫や電力網などの様々な工学システムで発生する。
標準ディープニューラルネットワーク(DNN)ベースの機械学習プロキシは、ラベル付きデータが不足し、トレーニング時間が制限された実用的な環境では有効ではない。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:19:55 GMT)
Shades of Zero: Distinguishing Impossibility from Inconceivability [3.3] 不合理性と不合理性との区別が維持されているかを検討する。
不可能とは容易に区別できることがわかりました。
この区別は、出来事の可能性の主観的な評価では説明できない。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:14:39 GMT)
Detecting Active and Stealthy Typosquatting Threats in Package Registries [3.3] パッケージ混乱攻撃とも呼ばれるタイポスクワット攻撃は、ソフトウェアサプライチェーンを脅かす。
我々はTypoSmartを紹介した。TypoSmartは、タイポスクワット攻撃による課題に対処するために設計されたソリューションである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:25:10 GMT)
Revisit the Stability of Vanilla Federated Learning Under Diverse Conditions [3.2] Federated Learning(FL)は分散機械学習のパラダイムであり、分散化されたクライアント間で協調的なモデルトレーニングを可能にする。
種々の条件下でのバニラFedAvgアルゴリズムの安定性を再検討する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:47:59 GMT)
InstaFace: Identity-Preserving Facial Editing with Single Image Inference [3.2] 本稿では,単一の画像のみを用いてアイデンティティを保存しながら,現実的な画像を生成するための,新しい拡散ベースのフレームワークInstaFaceを紹介する。
InstaFaceは、トレーニング可能なパラメータを追加することなく、複数の3DMMベースの条件を統合することで、3Dの視点を活用する。
本手法は, 身元保存, 光リアリズム, ポーズ, 表情, 照明の効果的な制御において, 最先端のアプローチよりも優れている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:37:09 GMT)
Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application [3.2] 本稿では, 自律誘導, ナビゲーション, タスク分散のための総合的な枠組みを提案する。
我々は,2つの遅延型Deep Deterministic Policy Gradientアルゴリズムを利用して,DRLに基づく指導機構を提唱する。
DRL学習グラフ畳み込みネットワーク(GCN)による協調型UAV間のタスク分散問題に取り組む。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:53:16 GMT)
LIVS: A Pluralistic Alignment Dataset for Inclusive Public Spaces [3.2] Local Intersectional Visual Spaces (LIVS) は、包括的都市計画におけるテキスト・ツー・イメージ(T2I)モデルのアライメントのためのベンチマークである。
30のコミュニティ組織による2年間の参加プロセスを通じて開発されたLIVSは、634の初期の概念にまたがる多様な空間的嗜好をエンコードする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:18:37 GMT)
Physics-Informed Neural Networks for Optimal Vaccination Plan in SIR Epidemic Models [3.2] 本研究は, 制御された感受性-感染-回復(SIR)モデルに対する時間的均質な環境下での最小消去時間を理解することに焦点を当てる。
物理情報ニューラルネットワーク(PINN)を用いて、根絶時間を管理する偏微分方程式(PDE)を解き、対応する最適な予防接種制御を導出する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:59:22 GMT)
CLIP Under the Microscope: A Fine-Grained Analysis of Multi-Object Representation [3.2] 対照的な言語-画像 事前学習モデルはゼロショット分類では優れているが、複雑な多目的シナリオでは課題に直面している。
この研究は、特別なデータセットであるComCOを使用して、これらのコンテキストにおけるCLIPの制限を包括的に分析する。
テキストエンコーダは初期オブジェクトを優先し,画像エンコーダはより大きなオブジェクトを優先する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:34:42 GMT)
Analyzing CLIP's Performance Limitations in Multi-Object Scenarios: A Controlled High-Resolution Study [3.2] コントラスト言語-画像事前学習(CLIP)モデルは,ゼロショット分類タスクにおいて顕著な性能を示した。
本研究では,制御実験による多目的コンテキストにおけるCLIPの性能限界の包括的解析を行う。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:03:10 GMT)
GRACE: A Granular Benchmark for Evaluating Model Calibration against Human Calibration [3.1] 本稿では,人間のキャリブレーションとの比較を取り入れた言語モデルキャリブレーションのベンチマークであるGRACEを紹介する。
GRACEは質問と回答のペアで構成されており、各質問には徐々に容易になる一連の手がかりが含まれている。
私たちは、人間とモデルのチームのタイミング、正確性、信頼性に関する1,749のデータポイントを集めるために、人間対モデルのライブコンペティションを開催しています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:51:45 GMT)
Chitranuvad: Adapting Multi-Lingual LLMs for Multimodal Translation [3.1] マルチモーダルLLMとマルチモーダル翻訳のためのビジョンモジュールを効果的に統合するマルチモーダルモデルであるChitranuvadを紹介する。
提案手法では,適応層によりLLM空間に投影された視覚的表現を視覚的トークン埋め込みとして抽出し,自己回帰的に翻訳を生成する。
私たちは、Indic言語(ヒンディー語、ベンガル語、マラヤラム語への英語翻訳)の3つのトラック(画像キャプション、テキストのみ、およびマルチモーダル翻訳タスク)のすべてに参加し、共有言語における他の言語との競争を継続しながら、これらすべてにおいてヒンディー語に対するSOTA結果を得た。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:14:31 GMT)
FPGA-Accelerated SpeckleNN with SNL for Real-time X-ray Single-Particle Imaging [3.1] X-ray Single-Particle Imaging (SPI) におけるリアルタイムスペックルパターン分類のためのSpeckleNNモデルの特殊バージョンを実装した。
このハードウェアは、高速X線自由電子レーザー(XFEL)施設の検出器近傍での推論に最適化されている。
KCU1500 FPGA上に配備されたこのモデルは、DSPの71%、LUTの75%、FFの48%を使用し、平均消費電力は9.4Wである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:55:06 GMT)
Offline Reinforcement Learning via Inverse Optimization [3.1] 連続状態と行動空間のための新しいオフライン強化学習(ORL)アルゴリズムを提案する。
ORL問題でよく見られる分布変化を緩和するために、我々は頑健で非因果予測制御の専門家を用いる。
既存の文献と異なり、当社の堅牢なMPC専門家は、正確かつトラクタブルな凸修正を楽しみます。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:11:44 GMT)
Educator Attention: How computational tools can systematically identify the distribution of a key resource for students [3.0] 本研究では,教育者の注意パターンの大規模解析を初めて行った。
自然言語処理技術を用いて,学習者の注意の受け手と性質について検討する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:30:18 GMT)
A Selective Homomorphic Encryption Approach for Faster Privacy-Preserving Federated Learning [2.9] フェデレーション学習(Federated Learning)は、分散デバイスやサーバ上でのトレーニングモデルをサポートする機械学習手法である。
我々は,データ漏洩を最小限に抑えるために,選択的暗号化,同型暗号化,差分プライバシー,ビットワイズスクランブルを利用する新しい手法を提案する。
我々の手法はモデル重みに完全同型暗号を適用するよりも90%高速である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:23:54 GMT)
Differentially-private frugal estimation of quantiles [2.9] 量子は、平均や分散のようなモーメントに基づく指標と比較して、基礎となる分布の堅牢な指標である。
ストリームアイテムは非常に高いレートで届き、可能な限り早く処理され、破棄されなければならない。
本稿では,DP-FRUGAL-1U-L,DP-FRUGAL-1U-G,DP-FRUGAL-1U-rho,DP-FRUGAL-2U-SAのフラグアル推定アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:47:15 GMT)
Magnetic Field Detection Using a Two-Qubit System Under Noisy Heisenberg Interaction [2.8] ノイズの多い2量子ビット系を用いた磁界検出器の設計法を提案する。
磁場はデコヒーレンス過程に大きく影響しないが、時間とともに帰還確率に顕著な振動をもたらす。
これらの結果は、実用的な量子ベースの磁場検出器の実現の可能性を示している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:17:55 GMT)
Inversion of Magnetic Data using Learned Dictionaries and Scale Space [2.8] 磁気データインバージョンは地球物理学において重要なツールであり、表面磁場測定から地表面の磁化率分布を推定するために用いられる。
従来の反転アプローチは、解を安定化させるために事前に定義された正則化技術に依存している。
本稿では,これらの課題に対処するために,可変辞書学習とスケールスペース手法を統合するアプローチを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:02:02 GMT)
Automatic Temporal Segmentation for Post-Stroke Rehabilitation: A Keypoint Detection and Temporal Segmentation Approach for Small Datasets [2.7] ストロークは主に高齢者に影響を及ぼし、65歳以上の高齢者では75%が発症する。
現在の評価方法は、主観的、一貫性がなく、時間を要することが多い。
本研究は、一貫性と時間的分析のソリューションを提供することにより、これらの課題に対処することを目的としている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:05:52 GMT)
Back-Projection Diffusion: Solving the Wideband Inverse Scattering Problem with Diffusion Models [2.7] 逆散乱写像を用いて広帯域散乱データを用いて屈折率の後方分布を近似するためのエンドツーエンド確率的フレームワークを提案する。
この枠組みは高精度な再構成を行い、条件付き拡散モデルを利用してサンプルを描画し、波動伝播の基礎物理学の対称性を賞賛する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:10:32 GMT)
Out-of-distribution Generalization for Total Variation based Invariant Risk Minimization [2.7] OOD-TV-IRMは基本的には原始双対最適化モデルである。
そこで我々は,対数学習計画を支援する収束原始双対アルゴリズムを開発した。
実験結果から,OOD-TV-IRMはITM-TVよりも高い性能を示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:11:11 GMT)
Thermodynamically Consistent Lindbladians for Quantum Stochastic Thermodynamics [2.5] 我々は、開量子系の非平衡熱力学を研究するために、量子熱力学のためのリンドブラッドフレームワークを開発した。
我々のアプローチでは、局所的な量子詳細バランス条件を採用し、熱力学的整合性を確保する。
作業と熱の総計統計を導き、最適なプロトコルを決定する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:10:21 GMT)
Low-rank tensor completion via a novel minimax $p$-th order concave penalty function [2.5] 低ランクテンソル完備化(LRTC)はコンピュータビジョンやパターン推定などの分野で大きな注目を集めている。
この問題に対処するために、新しい非タウテンソルランク推定法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:02:58 GMT)
LLMs Have Rhythm: Fingerprinting Large Language Models Using Inter-Token Times and Network Traffic Analysis [2.5] 本稿では, リアルタイムに機能する新しい受動的・非侵襲的な指紋認証手法を提案する。
連続トークン間のITT(Inter-Token Times)時間間隔を測定することで,異なる言語モデルを高精度に識別できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:22:01 GMT)
Explainable, Multi-modal Wound Infection Classification from Images Augmented with Generated Captions [2.5] 糖尿病足部潰瘍(DFU)の感染症は、組織死や手足切断などの重篤な合併症を引き起こす可能性がある。
従来の機械学習手法では、傷のイメージのみを解析することで、感染の特定に重点を置いてきた。
本研究では, 創傷感染検出のための合成キャプション検索を導入し, 感染検出の改善を目指す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:04:00 GMT)
A Counterfactual Analysis of the Dishonest Casino [2.4] 不名誉なカジノは、教育環境においてHMMとグラフィカルモデルを導入するためによく知られた隠れマルコフモデル(HMM)である。
本稿では,HMMプリミティブの範囲を超えて,カジノの不正行為にどの程度の勝利が寄与するかを考察する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:01:51 GMT)
VDT-Auto: End-to-end Autonomous Driving with VLM-Guided Diffusion Transformers [2.3] 動的環境とコーナーケースは、エゴ車の意思決定の堅牢性に重大な課題をもたらす。
本稿では,拡散過程の条件付けのために,環境を幾何学的に,文脈的に解析する新しいパイプラインVDT-Autoを紹介する。
VDT-Autoは平均L2誤差で0.52m, nuScenesオープンループ計画評価で平均衝突速度で21%を達成した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:02:14 GMT)
Shared Stochastic Gaussian Process Latent Variable Models: A Multi-modal Generative Model for Quasar Spectra [2.3] 我々は、観測されたスペクトルの特徴と銀河や太陽系外惑星などの天体の科学的性質の両方を含むデータセットの天体物理学への応用に焦点をあてる。
クエーサーとして知られる非常に明るい銀河のスペクトルとその性質を、複数の観測空間で研究する。
単一のデータポイントは、それぞれ異なる可能性を持つ異なる観察のクラスによって特徴づけられる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:57:23 GMT)
Harvesting Textual and Structured Data from the HAL Publication Repository [2.3] HAL(textitHyper Articles en Ligne)は、フランスの出版社。
本稿では、引用ネットワークとHAL送信記事の全文とのギャップを埋めるユニークなデータセットであるHALvestを紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:33:23 GMT)
Flexible Bivariate Beta Mixture Model: A Probabilistic Approach for Clustering Complex Data Structures [2.1] クラスタリングは分析と機械学習に不可欠である。
k$meansやGaussian Mixture Models (GMM)といった従来のアルゴリズムは、非データで失敗することが多い。
実験コードはhttps://github.com/MB-and-yungpeng/MM-and-FBBMMで公開します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:07:43 GMT)
Engineering morphogenesis of cell clusters with differentiable programming [2.1] 我々は、局所的な相互作用規則と遺伝的ネットワークを発見するために、自動分化の最近の進歩を利用する。
細胞間相互作用のパラメータを解釈可能な遺伝的ネットワークの形で学習できることが示される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:24:52 GMT)
Best Foot Forward: Robust Foot Reconstruction in-the-wild [2.1] 本稿では,SfM (Structure-from-Motion) 再構成を改良した新しいエンドツーエンドパイプラインを提案する。
まず、SE(3)の正準化と視点予測モジュールを用いてスキャンアライメントの曖昧さを解消し、次に、合成強化された点雲で訓練された注意に基づくネットワークを通して、欠落した幾何学を完成させる。
臨床的に検証された解剖学的忠実度を保ちながら,再建指標の最先端性を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:40:20 GMT)
Mixtera: A Data Plane for Foundation Model Training [2.0] 基礎モデルトレーニングのためのデータプレーンであるMixteraを構築、提示します。
Mixteraはトレーニングをボトルネックにせず、256GH200スーパーチップにスケールする。
また、視覚言語モデルにおける混合の役割についても検討する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:55:44 GMT)
Expansion Quantization Network: An Efficient Micro-emotion Annotation and Detection Framework [2.0] 本稿では,ラベル値をエネルギー強度レベルにマッピングする全ラベルおよびトレーニングセットラベル回帰法を提案する。
これにより、マイクロ感情検出とアノテーションのための感情量子化ネットワーク(EQN)フレームワークが確立された。
EQNフレームワークは、エネルギーレベルスコアで自動マイクロ感情アノテーションを実現する最初のフレームワークである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:06:45 GMT)
First-Principles Framework for the Prediction of Intersystem Crossing Rates in Spin Defects: The Role of Electron Correlation [1.9] 本稿では,光スピン偏光サイクルにおいて重要なステップとなる,システム間交差過程を研究するための第1原理フレームワークを提案する。
ダイヤモンド中の窒素空孔中心をケーススタディとして、我々の枠組みが電子相関効果を効果的に捉えることを実証した。
我々は、蛍光寿命の測定を行い、理論と実験の間に優れた一致を見出すことにより、予測を検証した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:01:24 GMT)
Waves and symbols in neuromorphic hardware: from analog signal processing to digital computing on the same computational substrate [1.9] 本稿では,アナログ信号処理と分類的,離散的な計算を切り替えるために,繰り返しスパイクニューラルネットワークを使用するフレームワークを提案する。
ハードウェアソフトなWinner-Take-Allとミックスフィードバックリカレントスパイキングニューラルネットワークを用いて,このフレームワークの堅牢性を実験的に実証した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:55:17 GMT)
Online Meta-learning for AutoML in Real-time (OnMAR) [1.9] 本研究では、リアルタイム(OnMAR)アプローチにおけるAutoMLのためのオンラインメタラーニングを提案する。
OnMARアプローチではメタリアナを使用して、ML設計の精度を予測する。
3つの異なるリアルタイムAutoMLアプリケーションでテストされる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:07:32 GMT)
Robust Multicast Origin Authentication in MACsec and CANsec for Automotive Scenarios [1.9] イーサネットとCAN XLは対称暗号に基づくリンクレベルのセキュリティを提供するが、マルチキャスト送信の原点認証はサポートしていない。
非対称暗号は、リアルタイムな制約と限られた計算資源を持つネットワーク化された組み込み制御システムには適さない。
このような戦略が提示され分析され、マルチキャストのオリジン認証が可能となり、キーチェーンのインターリーブによりフレーム損失に対する堅牢性が向上する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:55:08 GMT)
A Fokker-Planck-Based Loss Function that Bridges Dynamics with Density Estimation [1.8] 力学系モデルと確率密度関数を結びつけるフォッカー・プランク方程式から新しい損失関数を導出する。
密度推定のために,正規化フローモデルとガウス混合モデルを統合する密度推定器を提案する。
これは、最大可能性とスコアマッチングを含む、さまざまなデータベースのトレーニング手法と互換性がある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:11:09 GMT)
Towards AI Accountability Infrastructure: Gaps and Opportunities in AI Audit Tooling [1.8] AI監査ツールの現在のエコシステムと実践者のニーズを比較します。
多くのツールは、標準を設定し、AIシステムを評価するために設計されているが、説明責任のサポートに不足することが多い。
我々は、現在利用可能なリソースは、AI監査実践者のニーズの全範囲をサポートしていないと結論付けている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:24:21 GMT)
Exploring the Decentraland Economy: Multifaceted Parcel Attributes, Key Insights, and Benchmarking [1.8] IITP-VDLandは、Decentraland、OpenSea、Etherscan、Google BigQuery、およびさまざまなソーシャルメディアプラットフォームなどのさまざまなプラットフォームをソースとする、分散パーセルデータセットである。
仮想世界における各パーセルの特異性を測定するために,データセットにキー属性,すなわちRarityスコアを導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:48:51 GMT)
DIPSER: A Dataset for In-Person Student1 Engagement Recognition in the Wild [1.8] 本稿では,教室内環境における学生の注意度を評価するための新しいデータセットを提案する。
このデータセットはRGBカメラのデータを含み、学生1人当たりの姿勢と表情をキャプチャする複数のカメラを備えている。
学生毎の注意・感情ラベルの包括的スイートが提供され、自己報告と4つの異なる専門家による評価によって生成される。
当社のデータセットは、顔と環境カメラのデータ、スマートウォッチのメトリクスを独自に組み合わせ、同じデータセットに表現されていない民族が含まれています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:50:21 GMT)
A finite sufficient set of conditions for catalytic majorization [1.7] 多くの場合、状態ベクトル $x が状態ベクトル $y をメジャー化しない場合、触媒を見つけることができ、別のベクトル $z$ が $x otimes z$ が$y otimes z$ をメジャー化する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:18:07 GMT)
Reference-Based Post-OCR Processing with LLM for Precise Diacritic Text in Historical Document Recognition [1.7] コンテンツ中心の電子書籍を参照ベースとして活用し、不完全なOCR生成テキストを訂正する手法を提案する。
この技術は、ダイアクリティカル言語のための高精度な擬似ページ・ツー・ページラベルを生成する。
パイプラインは、古いドキュメントから様々な種類のノイズを排除し、欠落した文字、単語、乱れたシーケンスといった問題に対処する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:38:51 GMT)
Polish-ASTE: Aspect-Sentiment Triplet Extraction Datasets for Polish [1.7] ポーランド語で表現されたホテルと購入品に関する顧客の意見を含むASTEのための2つの新しいデータセットを提示する。
また,2つのASTE手法と2つの大きな言語モデルを組み合わせた実験を行い,その性能と組立データセットの難しさについて検討した。
新しいデータセットはパーミッシブライセンスの下で利用可能で、英語のデータセットと同じファイルフォーマットで、将来の研究での使用が促進される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:38:04 GMT)
ANPMI: Assessing the True Comprehension Capabilities of LLMs for Multiple Choice Questions [1.6] 様々なプロンプトと選択からなる多重選択ベンチマークは、言語モデルの自然言語理解能力を評価する最も広く使われている手法の一つである。
提案手法を用いて測定された性能は,プロンプトに対するモデルによる理解だけでなく,プロンプトによらず特定の選択に対する固有のバイアスも反映している。
本稿では,ポイントワイド・ミューチュアル・インフォメーション(PMI)を$-log P(Choice)$で正規化するANPMIという新しい計量法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:11:40 GMT)
Inferring Effect Ordering Without Causal Effect Estimation [1.6] 直接的効果推定が不可能な環境で、いつ、なぜ予測が個人を因果効果で確実にランク付けできるかを検討する。
我々は,因果効果ランキングをいつスコアが回復できるかを判断し,場合によっては直接効果評価よりも優れる3つの重要な条件(完全潜時調律,完全潜時調律,潜在単調性)を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:42:13 GMT)
Hierarchy of chaotic dynamics in random modular networks [1.6] ランダムに連結された神経集団のモデルを導入し、その力学を力学平均場理論とシミュレーションを用いて研究する。
分析の結果,最大リアプノフ指数と参加率の低値が特徴の交叉領域で分離された高次元および低次元カオス相を特徴とする豊富な位相図が得られた。
強くモジュール化された接続にノイズを加えるか、ランダムな接続にモジュール化を導入することでカオスを弱めることができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:18:08 GMT)
Redefining the Shortest Path Problem Formulation of the Linear Non-Gaussian Acyclic Model: Pairwise Likelihood Ratios, Prior Knowledge, and Path Enumeration [1.5] 本稿では,LiNGAM-SPPフレームワークの3倍拡張を提案する。
パラメータチューニングの必要性は、kNNベースの相互情報の代わりに、ペアワイズ確率比を用いて排除される。
先行知識の組み入れは、すべての因果順序のグラフ表現に実装されたノードスキッピング戦略によって実現される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:32:41 GMT)
On the interpretability of neural network decoders [1.5] 我々は、NNデコーダの基盤となるデコードロジックを理解するために、機械学習の分野から確立された解釈可能性手法を利用する。
我々は、NNの特定の復号決定がどのように解釈できるかを示し、NNが、シンドロームとフラグキュービットの測定から得られる情報の基本構造を捉えることを学ぶ方法を明らかにする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:55:28 GMT)
Enhancing Transformer with GNN Structural Knowledge via Distillation: A Novel Approach [1.5] 本稿では,GNN教師モデルからトランスフォーマー学生モデルへ大規模構造知識を伝達する新しい知識蒸留フレームワークを提案する。
このフレームワークは、マイクロマクロ蒸留損失とマルチスケール機能アライメントにより、GNNとトランスフォーマーのアーキテクチャギャップを効果的に橋渡しする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:14:47 GMT)
Training Large Neural Networks With Low-Dimensional Error Feedback [1.4] ディープニューラルネットワークのトレーニングは通常、高次元エラー信号のバックプロパゲーションに依存している。
本稿では,低次元誤り信号が効果的な学習に十分であることを示す。
タスク次元の順序における最小誤差次元でさえ、従来のバックプロパゲーションと同等の性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:45:41 GMT)
On Propagation of Information in Quantum Mechanics and Maximal Velocity Bounds [1.4] 我々は、指数誤差境界を持つ状態や観測可能な状態に対する量子情報の伝播の最大速度に一様境界を証明した。
我々の結果は、特にリーブ・ロビンソン境界のfbQMバージョンが量子情報科学に広く応用されていることを示唆している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:42:16 GMT)
Bosonic Quantum Error Correction with Neutral Atoms in Optical Dipole Traps [1.4] ボソニック量子誤差補正符号は、1つまたは複数の調和振動子のヒルベルト空間における論理量子ビットを符号化する。
本稿では,ゴッテマン・キタエフ・プレスキル(GKP)量子ビットの振動モードにおける準備と誤差補正について理論的に検討する。
我々は、閉じ込められた原子の運動状態と内部電子状態を利用して、アンシラ量子ビットとして機能する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:52:11 GMT)
Machine Learning for Fairness-Aware Load Shedding: A Real-Time Solution via Identifying Binding Constraints [1.3] 最適化に基づく負荷層問題に対するミリ秒単位の計算を可能にする効率的な機械学習アルゴリズムを提案する。
3バス玩具の例と現実的なRTS-GMLCシステムの両方に関する数値的研究により,提案アルゴリズムの有効性と有効性を示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:23:19 GMT)
Decoding Reading Goals from Eye Movements [1.3] 本研究は,情報探索と一般読解の2種類の共通読解目標を区別できるかどうかを検討する。
大規模な視線追跡データを用いて、様々なアーキテクチャとデータ表現戦略をカバーする幅広いモデルを用いて、この問題に対処する。
我々は、参加者がテキストを読み終えるずっと前に、正確な予測をリアルタイムで行うことができることを発見した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:47:22 GMT)
Developing robust methods to handle missing data in real-world applications effectively [1.3] このPhDプロジェクトは、多種多様な欠落データメカニズムの影響を調査するために設計された総合的な研究課題を提示する。
主な目的は、MCAR、MAR、MNARメカニズムのユニークな特徴を付加しつつ、欠落したデータを効果的に処理できるロバストな方法論を考案することである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:00:28 GMT)
Dynamic Estimation of Tea Flowering Based on an Improved YOLOv5 and ANN Model [1.2] 茶の花は、茶工場の分類学研究とハイブリッド育種において重要な役割を担っている。
伝統的な茶の花の特徴の観察法は、労働集約的で不正確であるため、茶の花の定量化に有効な枠組みを提案する。
TflosYOLOモデルはYOLOv5アーキテクチャ上に構築され、Squeeze-and-Excitation (SE)ネットワークで拡張された。
TflosYOLOモデルは0.874のmAP50を達成し、YOLOv5、YOLOv7、YOLOv8を上回った。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:26:13 GMT)
Improving the Efficiency of a Deep Reinforcement Learning-Based Power Management System for HPC Clusters Using Curriculum Learning [1.1] 機械学習はノードのオン/オフに最適な時間を決定することを約束している。
本研究では、カリキュラム学習(CL)を統合することで、HPC電力管理のための深層強化学習(DRL)エージェントの性能を向上させる。
実験結果から, 無駄なエネルギー使用量を減らすという点で, 容易にハードなカリキュラムは, 他の訓練命令よりも優れていたことが確認された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:19:22 GMT)
Machine-learning for photoplethysmography analysis: Benchmarking feature, image, and signal-based approaches [1.1] 光胸腺撮影は、様々な臨床応用に適した、広く用いられている非侵襲的な生理学的センシング技術である。
機械学習手法は、機械学習手法によってますます支持され、最も適切な入力表現とモデル選択の疑問が提起される。
本稿では,3種類の入力表現,解釈可能な特徴,画像表現,生波形を網羅した総合的なベンチマーク研究により,このギャップに対処する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:17:16 GMT)
Qini curve estimation under clustered network interference [1.1] 本稿では,クラスタネットワーク干渉によるQini曲線推定の問題に対処する。
異なる条件に適合する3つの異なる推定戦略を導入する。
ベストな見積もり戦略を選択するためのレコメンデーションを提供します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:55:26 GMT)
Efficient Time Series Forecasting via Hyper-Complex Models and Frequency Aggregation [1.0] 時系列予測は、統計学と機械学習における長年の問題である。
本稿では、新しい複合価値アーキテクチャに基づく周波数情報集約(FIA)ネットワークを提案する。
各種時系列ベンチマークを用いてFIA-Netを評価し,提案手法が精度と効率の両面で既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:03:37 GMT)
Test-Time Modality Generalization for Medical Image Segmentation [0.9] 一般的な医用画像のセグメンテーションは、さまざまな臨床現場で一貫したパフォーマンスを確保するために不可欠である。
MASP(Modality-Aware Style Projection)とMSIW(Modality-Sensitive Instance Whitening)の2つのコアコンポーネントからなる新しいテスト時モダリティ一般化(TTMG)フレームワークを紹介する。
MASPは、見た各モダリティに属するテストインスタンスの可能性を推定し、モダリティ固有のスタイルベースを使用して分布にマッピングし、そのプロジェクションを効果的に導く。
MSIWは、モダリティの不変性を保ちながら、モダリティに敏感な情報を選択的に抑制するために訓練中に適用される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:32:13 GMT)
Explain the Black Box for the Sake of Science: the Scientific Method in the Era of Generative Artificial Intelligence [0.9] 我々は、人類の科学的発見のための複雑な推論が、少なくとも人工知能の出現以前には重要な存在であると主張している。
意思決定に使用されるAIシステムの原則を知ることは、ドメインの専門家や科学者と接触するポイントになり得る。
我々は、この分野を、予測AIシステムの解釈可能性に基づいて、領域の専門家が科学的仮説と説明を定式化する、説明可能な科学用AIと定義する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:54:31 GMT)
Mapping the Regulatory Learning Space for the EU AI Act [0.9] EUのAI法は、具体的な執行措置による世界最初の国際的AI規制である。
製品健康と安全の規制のための既存のEU機構を基盤としているが、基本的権利を保護するために拡張されている。
これらの拡張は、AIシステムの認証と執行活動に対して、その技術の技術的な状態がどのように適用されるかという点で不確実性を導入する。
これらの不確実性は、AIの急速に変化する性質と、基本的権利リスク管理における技術状態の相対的な未成熟さと相まって、包括的で迅速な規制学習に強く重点を置くために、AI法の実装を必要としている、と我々は主張する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:46:30 GMT)
CrowdAL: Towards a Blockchain-empowered Active Learning System in Crowd Data Labeling [0.9] このポスターでは、コンセンサスとプライバシの課題に対処するために設計されたブロックチェーンを活用したクラウドALシステムであるCrowdALを紹介している。
CrowdALは、透明性のためのブロックチェーンと、スマートコントラクトを使用して、クラウドワーカーのパフォーマンスとアグリゲートラベリング結果を評価する、タンパー保護インセンティブメカニズムを統合している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:13:03 GMT)
Among Them: A game-based framework for assessing persuasion capabilities of LLMs [0.9] 大規模言語モデル(LLM)と自律AIエージェントは、自動的な説得と社会的影響の可能性を懸念している。
制御環境におけるLLM偽装スキルを評価するためのUs-inspiredゲームフレームワークについて述べる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:26:21 GMT)
Connecting the Persian-speaking World through Transliteration [0.9] ペルソ・アラビア文字で書かれたイラン語とアフガン語の文章は、タジク語話者には読めない。
本稿では,タジク・ファルシ文字への変換器に基づくG2Pアプローチを提案し,新しい図形データセットを用いて,chrF++スコア58.70(Farsi to Tajik)と74.20(Tajik to Farsi)を達成した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:38:36 GMT)
Regional climate projections using a deep learning--based model-ranking and downscaling framework: Application to European climate zones [0.8] 本研究は、深層学習に基づくマルチモデル評価およびダウンスケーリングフレームワークで、結合モデル相互比較プロジェクトフェーズ6(CMIP6)モデルランキング32を提示する。
熱帯・乾燥・温帯・大陸・極圏の気候帯は4季節にわたって調査されている。
4つのモデルは、上位のGCMを0.1$circ$の解像度にダウンスケールするのに貢献する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:27:09 GMT)
Forecasting intermittent time series with Gaussian Processes and Tweedie likelihood [0.8] 本稿では,間欠的時系列の確率的予測にガウス過程(GP)を導入する。
我々は、潜在GP変数と、負二項分布(NegBinGP)とツイーディ分布(TweedieGP)の2種類の予測分布を結合する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:32:12 GMT)
Evaluating the long-term viability of eye-tracking for continuous authentication in virtual reality [0.8] 本研究では,バーチャルリアリティ(VR)環境における連続的認証のための行動バイオメトリクスとしての視線追跡の長期的実現可能性について検討した。
提案手法では,Transformer,DenseNet,XGBoostの3つのアーキテクチャを,短期・長期のデータに基づいて評価し,ユーザ識別タスクの有効性を判定する。
最初の結果は、TransformerモデルとDenseNetモデルの両方が、短期設定で最大97%の精度を達成することを示している。
26ヶ月後に収集されたデータでテストしたところ、モデルの精度は大幅に低下し、いくつかのタスクでは1.78%まで低下した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:32:13 GMT)
Characterizing the effect of retractions on publishing careers [0.8] 論文の撤回は、著作者とその経歴にとって、はるかに大きな影響をもたらす可能性がある。
以上の結果から, 早期養護家作家に不均衡な影響が生じる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:04:51 GMT)
Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions [0.8] 皮膚黒色腫性病変の病理領域に特有な視覚言語モデルを構築した。
以上の結果から, モデル作成報告の品質スコアは, 病理学報告と同等であった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:09:41 GMT)
On the Importance of Text Preprocessing for Multimodal Representation Learning and Pathology Report Generation [0.8] 病理学における視覚言語モデルにより、マルチモーダルケース検索と自動レポート生成が可能となる。
これまで開発されたモデルの多くは、スライド画像全体から推測できない情報を含む病理報告に基づいて訓練されてきた。
視覚言語モデリングのための病理報告からの情報選択がマルチモーダル表現の質や生成レポートにどのように影響するかを検討する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:06:34 GMT)
Sequence Graph Network for Online Debate Analysis [0.7] オンライン討論をモデル化するためのシーケンスグラフアプローチを導入する。
オンライン討論において,シーケンスグラフネットワークは既存の手法よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:33:30 GMT)
Hamiltonian Learning at Heisenberg Limit for Hybrid Quantum Systems [0.7] ハイブリッドスピンボソン系におけるハミルトン学習がハイゼンベルク極限を達成することを実証する。
我々のアルゴリズムは、ハミルトン結合パラメータをルート平均二乗誤差(RMSE)$epsilon$まで推定し、総進化時間スケーリングを$T sim MathcalO(epsilon-1)$とすることができる。
また、分散量子センシングに基づく代替アルゴリズムも提供し、測定あたりの最大進化時間を著しく短縮する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:47:47 GMT)
Systems-of-Systems for Environmental Sustainability: A Systematic Mapping Study [0.7] 本研究は, 環境保全性に着目し, 炭素排出削減, エネルギー効率, 生物多様性保全などの持続的実践にSoSがどのように貢献するかを分析する。
我々は、持続可能性、直面する課題、研究機会におけるSoSの適用領域を特定するために、システマティックマッピングスタディを実施しました。
その結果、ほとんどの研究はスマートシティとスマートグリッドに焦点を当てているが、持続可能な農業や山火事防止といった応用は研究されていないことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:00:27 GMT)
Time series forecasting based on optimized LLM for fault prediction in distribution power grid insulators [0.7] 本稿では,高電圧絶縁体における漏れ電流の増加を予測するためのハイブリッドディープラーニング(DL)モデルを提案する。
提案した最適化LDMは,2.24$times10-4$,1.21$times10-3$と2.24$times10-4$のルート平均二乗誤差で,最先端のDLモデルより優れている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:30:15 GMT)
Generative augmentations for improved cardiac ultrasound segmentation using diffusion models [0.7] この研究は拡散モデルを用いて、データセットの多様性を著しく改善する生成的拡張を生成する。
ビジュアルテストでは、専門家は実際の画像と完全に生成された画像を明確に区別できないことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:57:14 GMT)
A Dataset and Framework for Learning State-invariant Object Representations [0.7] 我々は、任意の視点から記録されたオブジェクト画像の状態をキャプチャし、バリエーションを付加する新しいデータセット、ObjectsWithStateChangeを提案する。
カリキュラム学習が果たす役割に関連するアブレーションは, 対象認識精度が7.9%向上し, 検索mAPが9.2%向上したことを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:26:00 GMT)
Discovering Antagonists in Networks of Systems: Robot Deployment [0.7] カバータスクを実行するロボット群における身体動作に対して,文脈異常検出法を提案し,適用した。
スウォームの正常な動作のシミュレーションを用いて、ロボットの動きの可能性を予測するために正規化フローを訓練する。
適用中、観測された動作の予測可能性は、ロボットエージェントを通常的または対角的と分類する検出基準によって使用される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:16:22 GMT)
Robust Geometrical Dimensions in Uniform Directional Couplers [0.6] 統合フォトニクスは光ネットワーク、センサー、回路のためのスケーラブルなプラットフォームである。
導波管幅、ウエハ高さの変動、温度変化に対する感度などの耐加工性は、その堅牢性と性能に大きな影響を及ぼす。
このような変動に対する耐性を高める指向性カプラの静止幾何学的次元を特定し解析する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:26:04 GMT)
Linear optical quantum computing with a hybrid squeezed cat code [0.6] 本研究では, 圧縮された猫コードと偏光量子ビットを組み合わせた新しいハイブリッドコードを提案する。
シミュレーションにより,ハイブリッドキャットコードに対するハイブリッドキャットコードと圧縮キャットコードの優位性を示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:36:07 GMT)
Continual learning with the neural tangent ensemble [0.6] Nパラメータを持つニューラルネットワークは、N分類器の重み付けアンサンブルとして解釈できることを示す。
過去のデータから各専門家の確率と後続確率を導出する。
驚くべきことに、これらの専門家の後の更新は、スケール化され投影された勾配降下と同等である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:09:51 GMT)
Data Taxonomy Towards the Applicability of the Digital Twin Conceptual Framework in Disaster Management [0.6] Digital Twin (DT)は、重要なインフラの管理に新しいアプローチを提供する。
これらのインフラの複雑さと相互接続性の増加は、ロバストな災害対応と管理戦略の開発を必要とする。
本研究では,その特徴や脆弱性を危機事象と比較するための分類機能と類似性機能を紹介する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:08:03 GMT)
Gender Dynamics in Software Engineering: Insights from Research on Concurrency Bug Reproduction [0.5] 本稿では,この分野における男女比を評価するための文献レビューを行う。
以上の結果から, 女性研究者は, 男性研究者に比べて少なすぎることが示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:15:23 GMT)
The Third Moment of AI Ethics: Developing Relatable and Contextualized Tools [0.5] 採用の共通の障壁は、過度に抽象的な言語、アクセシビリティの低さ、実装のための実践的なガイダンス不足である。
業界関係者との参加型設計を通じて、このギャップを埋めるオープンソースツールを開発しました。
私たちのツールは、具体的で実用的なガイダンスを直感的な形式で提供しながら、規範的な倫理的枠組みをしっかりと根ざしています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:46:33 GMT)
Adaptive H&E-IHC information fusion staining framework based on feature extra [0.5] 乳がんなどの疾患評価においてIHC染色は重要な役割を担っている。
生成モデルに基づくH&E-to-IHC変換は、IHC画像を得るための単純で費用対効果の高い方法を提供する。
ピクセル完全H&E-IHC基底対の欠如は、古典的なL1損失への挑戦である。
特徴抽出器に基づく適応情報強化カラー化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:55:34 GMT)
Quantum machine learning with Adaptive Boson Sampling via post-selection [0.4] 本稿では,Boson Smplingプラットフォームにポストセレクションによる適応性を加えることで,量子機械学習プロトコルの実験的実装について報告する。
実験結果から,適応ボソンサンプリングは次元強化量子機械学習への有効な経路であることが示された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:32:05 GMT)
Are Transformers Truly Foundational for Robotics? [0.4] GPT(Generative Pre-Trained Transformers)は、ロボット工学に革命をもたらすことを誇示している。
ここではその実用性に疑問を呈する。
我々は、この技術のGPT状態と、小さな昆虫の脳がこれらの制約なしに頑健な自律性を達成したこととを対比する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:46:58 GMT)
Sheffield's Submission to the AmericasNLP Shared Task on Machine Translation into Indigenous Languages [0.4] シェフィールド大学のアメリカスNLP 2023への提出について述べる。
我々のアプローチは、NLLB-200の様々なバリエーションを拡張し、訓練し、アンサンブルすることから成り立っている。
特にAymara、Guarani、Kechuaでは大幅に改善され、開発セットでは、すべての言語でベースラインを平均11%向上させています。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:47:57 GMT)
Entanglement buffering with multiple quantum memories [0.4] エンタングルメントバッファ(Entanglement buffer)は、高品質なエンタングルメントを維持するシステムであり、必要に応じて容易に使用できるようにする。
本研究では、2ノードバッファの性能について検討し、各ノードは1つの長寿命量子メモリを持ち、複数の短寿命記憶を格納し、新しい短寿命記憶を発生させる。
新しく生成された絡み合いは、貯蔵された絡み合いを浄化するために使用され、時間の経過とともに劣化する。貯蔵された絡み合いは、浄化や消費の失敗により除去される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:25:43 GMT)
A Systematic Review of Low-Rank and Local Low-Rank Matrix Approximation in Big Data Medical Imaging [0.3] 医療画像データセットの膨大な量と複雑さは、ストレージ、送信、処理のボトルネックである。
低ランク行列近似(LRMA)とその誘導体である局所LRMA(LLRMA)はポテンシャルを示した。
本稿では、LRMAとLLRMAが、欠落したエントリを持つ正規データに対してどのように適用できるかと、欠落した値の予測における不正確さの影響について論じる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:33:45 GMT)
Symmetry defects and gauging for quantum states with matrix product unitary symmetries [0.3] 行列積状態(MPS)に対する行列積ユニタリ(MPU)対称性の有限群の存在の結果について検討する。
我々は、対称性欠陥を推し進め、自由度を測ることによって対称性を測る条件であるブロック独立を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:45:33 GMT)
RIZE: Regularized Imitation Learning via Distributional Reinforcement Learning [0.3] 固定された報酬の割り当ての制限を克服する新しい逆強化学習(IRL)手法を導入する。
最大エントロピーIRLフレームワークを2乗時間差正規化器(TD)と適応目標で拡張し、トレーニング中に動的に調整する。
提案手法は,MuJoCoタスクに挑戦する上での最先端のパフォーマンスを実現し,Humanoidタスクのエキスパートレベルを3つのデモで示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:47:29 GMT)
Remove Symmetries to Control Model Expressivity and Improve Optimization [0.3] まず, 対称性が能力低下につながり, 訓練や推論中に特徴を無視する2つのメカニズムを実証する。
次に、ニューラルネットワークにおける対称性誘起低容量状態のほとんどをすべて除去する、単純で理論的に正当化されたアルゴリズムであるサイアを提案する。
提案手法の顕著な利点は、モデルに依存しず、対称性の知識を必要としないことである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:30:47 GMT)
PI-HMR: Towards Robust In-bed Temporal Human Shape Reconstruction with Contact Pressure Sensing [0.3] 圧力を感知するベッドシートは、リアルタイムのモーションリコンストラクションに有望なソリューションを提供する。
本稿では,トップビューシナリオにおける奥行きの曖昧さを克服する最適化手法SMPLify-IBを紹介する。
圧力列からメッシュを回帰する時間的人体形状推定器PI-HMRを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:42:44 GMT)
Finer Disentanglement of Aleatoric Uncertainty Can Accelerate Chemical Histopathology Imaging [0.3] データ取得速度は、スムーズな臨床移行の制限要因であり続けている。
本稿では,まず組織全体の低情報(LI)含有量を素早くスキャンし,アレータリック不確実性(AU)の高い領域を同定し,高い情報(HI)の詳細を捉えるために,より高品質でそれらを選択的に再画像化する適応戦略を提案する。
胸部組織の赤外分光データを効率よく画像化するために本手法を適用し, 得られたHIデータを用いて, ランダムなベースラインよりも優れたセグメンテーション性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:36:27 GMT)
Scalable Graph Attention-based Instance Selection via Mini-Batch Sampling and Hierarchical Hashing [0.2] インスタンス選択(IS)は、機械学習において重要な特徴を保持しながらデータセットのサイズを減らすために重要である。
本稿では,アテンション機構を用いてインフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・セクション(GAIS)法を提案する。
本稿では,戦略バッチ処理による距離ベースのミニバッチサンプリング手法と,ランダムプロジェクションによる効率的な類似性を実現する階層的ハッシュ手法の2つの方法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:17:53 GMT)
HuAMR: A Hungarian AMR Parser and Dataset [0.2] 本稿では,最初の抽象的意味表現(AMR)データセットであるHuaMRについて紹介する。
HuAMRを作成するために、私たちはLlama-3.1-70Bを使用し、銀標準のAMRアノテーションを自動的に生成しました。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:48:11 GMT)
Polynomial time classical versus quantum algorithms for representation theoretic multiplicities [0.2] 多くの場合、Kronecker係数とplethysm係数も古典的アルゴリズムで計算可能であることを示す。
これは、望まれる超多項式量子スピードアップが達成できるケースを著しく制限する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:39:17 GMT)
SkipPipe: Partial and Reordered Pipelining Framework for Training LLMs in Heterogeneous Networks [0.2] SkipPipeは、大規模言語モデルのエンドツーエンドトレーニング時間を短縮する部分的なパイプラインフレームワークである。
その結果、SkipPipeはフルパイプラインと比較してトレーニング時間を最大55%削減できることがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:34:23 GMT)
An Integrated Deep Learning Framework Leveraging NASNet and Vision Transformer with MixProcessing for Accurate and Precise Diagnosis of Lung Diseases [0.1] NASNet-ViTモデルは、98.9%の精度、0.99の感度、0.989のF1スコア、0.987の特異性を実現している。
これらの結果は,NASNet-ViTが有意な特徴を抽出し,様々な種類の肺疾患を高い精度で認識する上で,高品質な能力を反映している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:17:38 GMT)
MC2SleepNet: Multi-modal Cross-masking with Contrastive Learning for Sleep Stage Classification [0.1] 本研究は、MC2SleepNet (Multi-modal Cross-masking with Contrastive Learning for Sleep Stage Classification Network)を紹介する。
コントラスト学習とクロスマスキングの助けを借りて、マルチモーダルトレーニングのためのCNNとTransformerアーキテクチャの効果的なコラボレーションを促進することを目的としている。
我々のMC2SleepNetは、SleepEDF-78で84.6%、Sleep Heart Health Studyで88.6%の精度で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:23:20 GMT)
Team A at SemEval-2025 Task 11: Breaking Language Barriers in Emotion Detection with Multilingual Models [0.1] 本稿では,チームAからSemEval 2025タスク11に提出された「テキストベース感情検出におけるギャップを埋める」システムについて述べる。
このタスクは、テキストスニペットから話者の知覚された感情を識別することを含み、各インスタンスには喜び、悲しみ、恐怖、怒り、驚き、嫌悪の6つの感情の1つが注がれた。
検討した様々なアプローチの中で, マルチリンガル埋め込みと完全連結層を組み合わせることで, 最高の性能を実現した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:59:01 GMT)
Establishing a Foundation for Tetun Text Ad-Hoc Retrieval: Stemming, Indexing, Retrieval, and Ranking [0.0] 本研究では,アドホック検索タスクに着目したテトゥーンのテキスト検索について検討する。
最初は、ストップワードのリスト、ストローマー、テストコレクションなど、重要な言語リソースの開発から始まります。
次に、文書タイトルとコンテンツの両方を用いて、検索の有効性を評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:02:20 GMT)
The Impact of Unstated Norms in Bias Analysis of Language Models [0.0] 事実バイアス評価はバイアスの定量化に広く用いられている手法である。
テンプレートベースのプローブは非現実的なバイアス測定につながる可能性がある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:11:54 GMT)
cMIM: A Contrastive Mutual Information Framework for Unified Generative and Discriminative Representation Learning [0.0] 本稿では、下流タスクにおける学習表現の有用性を高めることを目的とした、相互情報機械(cMIM)について紹介する。
最初の実験では、MIMが学習した表現は、最先端(SOTA)モデルと比較して差別的な下流タスクには効果が低いことが示された。
本稿では,エンコーダ・デコーダモデルから情報埋め込みを抽出する汎用手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:23:40 GMT)
Web Privacy based on Contextual Integrity: Measuring the Collapse of Online Contexts [0.0] 我々はプライバシの理論をコンテキスト統合として運用し、Webコンテキスト内およびWebコンテキスト間の永続的なユーザ識別を測定する。
健康、金融、ニュース&メディア、LGBTQ、eコマース、アダルト、教育のWebサイトなど、トップ700のWebサイトを27日間クロールする。
これは、Webプライバシをコンテキスト統合(Contextual Integrity)として測定する第一歩であり、コンテキストWebプライバシ調査のための新たな道を開くものだ。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:00:59 GMT)
Visual Adaptive Prompting for Compositional Zero-Shot Learning [0.0] VLM(Vision-Language Models)は、視覚およびテキストデータの共同表現を学習する際、印象的な能力を示す。
CZSLは、トレーニング中に明示的に遭遇しなかった属性やオブジェクトのような新しい視覚的プリミティブの組み合わせに一般化するモデルを必要とする。
意味的特徴と視覚的特徴のギャップを埋める視覚適応型プロンプトシステム(VAPS)を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:17:43 GMT)
Using sensitive data to de-bias AI systems: Article 10(5) of the EU AI Act [0.0] 2024年6月、EU AI法が施行された。この法律には、AIシステムの提供に関する義務が含まれている。
AI法第10条には、プロバイダがデータセットのトレーニング、検証、テストが一定の品質基準を満たすかどうかを評価するための新たな義務が含まれている。
この論文は主に欧州連合の法律に関するものであるが、政策立案者はAIシステムの偏見を規制することを目的としているため、世界の他の地域では関係がある可能性がある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:18:13 GMT)
Using Gaussian Boson Samplers to Approximate Gaussian Expectation Problems [0.0] GBSサンプルを用いた2つの推定器がモンテカルロ(MC)推定器に指数的な高速化をもたらすことを示す。
正確には、指数的スピードアップは、これらの推定器が同じ精度に達することを保証されたサンプルサイズで定義される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:11:57 GMT)
Universal quantum control with error correction [0.0] 我々は、ハミルトニアンシステムにおける任意の種類のエラーに対処するための、普遍的でリアルタイムな制御戦略を提供する。
我々の普遍制御理論は、不完全系の様々な量子タスクの性能を向上させることができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:51:17 GMT)
Tripartite Perspective on the Copyright-Sharing Economy in China [0.0] インターネットとデジタル技術は前例のない方法で著作権共有を促進し、情報の自由な流れと知的財産の排他的性質との間に緊張を生じさせている。
本稿では,著作権生態学の3つのカテゴリ,すなわち許可されていない共有,利他的共有,フリーミアム共有に基づく三部構成の視点を提供する。
法律の影の下では、持続可能な著作権共有モデルは、企業や個人の利益を慎重に調整する必要がある、と結論付けている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:23:09 GMT)
Towards Responsible AI in Education: Hybrid Recommendation System for K-12 Students Case Study [0.0] 本研究は,グラフベースモデリングと行列因数分解を組み合わせたK-12学生のための推薦システムを提案する。
公平性の懸念に対処するために、システムは保護された学生グループ間のフィードバックを分析し、バイアスを検出し、軽減するフレームワークを含む。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:27:30 GMT)
Towards Differential Handling of Various Blur Regions for Accurate Image Deblurring [0.0] 本稿では,異なるぼかし領域に対して差分処理を行うディファレンシャルハンドリングネットワーク(DHNet)を提案する。
具体的には、非線形特性を劣化ネットワークに統合するVolterraブロック(VBlock)を設計する。
モデルがぼやけた領域の様々な劣化度に適応的に対応できるようにするため,分解度認識エキスパートモジュールを考案した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:37:30 GMT)
Topic Classification of Case Law Using a Large Language Model and a New Taxonomy for UK Law: AI Insights into Summary Judgment [0.0] 本稿では,英国における要約判断事例のトピック分類のための新しい分類法の開発と適用について述べる。
機能的なトピックやトレンドを探るために、Large Language Model Claude 3 Opusを使用します。
クロード3オプスはこのトピックを87.13%、F1スコア0.87で正しく分類した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:56:25 GMT)
Thermodynamic speed limit for non-adiabatic work and its classical-quantum decomposition [0.0] オープン量子システムにおける非断熱的作業抽出や消費プロセスの基本コストを定量化する。
非断熱的な研究を古典的および量子的貢献に分解する。
結果は、駆動された2レベルシステムによって数値的に示される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 01:07:30 GMT)
Thermal transport through a single trapped ion under strong laser illumination [0.0] 我々は、レーザー励起により駆動され、異なる温度で作動する熱貯水池と結合した1つの閉じ込められたイオン中の量子熱輸送について研究した。
また, 熱流中における負の差分熱伝導率や非対称性などの現象も明らかにした。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:46:50 GMT)
The limits of knowledge in classical physics resemble the quantum uncertainty relation [0.0] 本稿は、ハミルトン力学における測定過程の最近の分析に基づいている。
私は、観察によって古典的なシステムについて得られる情報に制限があることを証明します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:02:37 GMT)
The likelihood operator and Fisher information in quantum probability [0.0] 我々は、量子ライクフード演算子(LO)の問題と量子フィッシャー情報(QFI)との関係について検討する。
この問題に対する現在のアプローチは、パラメトリッド密度行列 $rho_theta$ とその微分の可換性を暗黙的に仮定する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:54:47 GMT)
The erasure of intensive livestock farming in text-to-image generative AI [0.0] ChatGPTのテキスト・トゥ・イメージ・モデル(DALL-E3)は、牧草地や泥に根ざした豚の乳牛として家畜農業をロマンチックにする強いバイアスをもたらす。
工業国におけるほとんどの養殖動物は屋内で飼育され、1個体当たりの空間は限られており、社会的価値と共鳴することができない。
即時改正の禁止は、現代の農業慣行をより深く反映したイメージを生み出した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:14:04 GMT)
The Illusion of Rights based AI Regulation [0.0] 我々は、EUのAI規制が、特定の文化的、政治的、歴史的文脈の論理的な展開であることを示す。
我々は、EUの規制枠組みとそのルールの物質が普遍的な命令として採用されるべきであると主張する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:05:32 GMT)
Text classification using machine learning methods [0.0] 本稿では,機械学習を用いた製品の自動分類モデルの構築を目的とした実験結果について述べる。
製品名を数値ベクトルの形で持つことにより,自動分類のための機械学習手法のセットを考案した。
その結果,Support Vector Machines,Logistic Regression,Random Forestsの分類プロセスの精度が向上した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:20:38 GMT)
Telephone Surveys Meet Conversational AI: Evaluating a LLM-Based Telephone Survey System at Scale [0.0] 本研究では,テキスト音声(TTS),大言語モデル(LLM),音声音声(STT)を統合したAIによる電話調査システムを提案する。
米国におけるパイロットスタディ (n = 75) とペルーにおける大規模展開 (n = 2,739) の2つの集団でテストを行った。
以上の結果から,AIシステムの質的深度探索は人間のインタビュアーよりも限定的であったが,全体的なデータ品質は構造化項目の人間主導の基準に近づいた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:31:42 GMT)
Systematic analysis of relative phase extraction in one-dimensional Bose gases interferometry [0.0] 相対位相の長手展開と混合により, 相対位相の読み出しを補正する。
ガスの物理量の推定に対する誤差伝搬を数値的に評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:52:08 GMT)
Systematic Review of Cybersecurity in Banking: Evolution from Pre-Industry 4.0 to Post-Industry 4.0 in Artificial Intelligence, Blockchain, Policies and Practice [0.0] プレインダストリー4.0からポストインダストリー4.0まで、銀行のサイバーセキュリティは大きく変化している。
産業後4.0に移行した際、銀行のサイバーセキュリティは、様々な技術を組み合わせたセキュリティ手法の大きな転換点となった。
銀行におけるサイバーセキュリティの現在の課題は、スケーラビリティ、高コスト、そして防衛方法の研究開発のための時間と時間の両方におけるリソースと、ハイテクサイバー犯罪の増大と拡大の脅威にある。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:17:06 GMT)
Sustainable Greenhouse Management: A Comparative Analysis of Recurrent and Graph Neural Networks [0.0] 本研究では,時空間グラフニューラルネットワーク(STGNN)の温室マイクロ気候モデリングへの応用について紹介する。
従来のリカレントニューラルネットワーク(RNN)と比較する。
我々のSTGNNアプローチは、これらの関係を有向グラフとして表現することで、この制限に対処する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:00:00 GMT)
Spatio-temporal tensor-network approaches to out-of-equilibrium dynamics bridging open and closed systems [0.0] 実時間およびテンソルネットワークにおいて,より優れたアルゴリズム戦略の探索に基づく最近のアプローチを概観する。
本稿では,様々な力学系における影響関数の複雑さに注目し,最近の発展について論じる。
我々は、補完的な影響関数の重複を符号化し、オープンおよびクローズド量子系の正確な記述を行うための戦略の展望を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:54:40 GMT)
Show, Don't Tell: Evaluating Large Language Models Beyond Textual Understanding with ChildPlay [0.0] 本研究では,言語問題以外の問題に対する最先端の大規模言語モデルの一般化を評価するためのベンチマークを開発する。
Tic-Tac-Toe、Connect Four、Battleship、Shape Recognition Gameといった単純なゲームを使って、戦略的能力と空間的推論をテストする。
その結果,GPTモデルはいくつかのタスクに対して有意義な応答を提供するが,一般的には性能は良くないことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:47:06 GMT)
Shadow measurements for feedback-based quantum optimization [0.0] 本稿では、Ket量子プログラミングプラットフォームを用いて、最近導入されたFALQON(Fedback-based quantum optimization)アルゴリズムの実装について述べる。
パラメータ推定のフィードバックルーチンには古典的シャドウを用いており、この手法を観測変数の直接推定と比較する。
その結果,MaxCut問題に対するグラフ幾何に依存すると,古典的な影を持つ観測者の期待値を推定するのに要する測定量は,直接観測可能な推定値よりも最大16倍も低いことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:36:30 GMT)
ServoLNN: Lagrangian Neural Networks Driven by Servomechanisms [0.0] 本稿ではサーボメカニズムによって駆動される動的システムをモデル化する新しいアーキテクチャであるServoLNNについて述べる。
アーキテクチャは同時に、エネルギー、パワー、仕事の速度、質量行列、一般化された加速度、一般化された力、およびサーボメカニズムを駆動する一般化された力を見つけることができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:21:17 GMT)
SegLocNet: Multimodal Localization Network for Autonomous Driving via Bird's-Eye-View Segmentation [0.0] SegLocNetはセマンティックセグメンテーションを用いて正確なローカライゼーションを実現するマルチモーダルフリーなローカライゼーションネットワークである。
本手法は,都市環境におけるエゴポーズを,一般化に頼ることなく正確に推定することができる。
私たちのコードと事前訓練されたモデルは公開されます。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:34:55 GMT)
Seedless extractors for device-independent quantum cryptography [0.0] デバイス非依存(DI)量子暗号は、基礎となる量子デバイスを最小限の信頼性で、あるいは特性化したセキュアな暗号を提供することを目的としている。
DIプロトコルの鍵となるステップは、ランダムネス抽出(またはプライバシー増幅)である。
本稿では,シードを必要としないDIプロトコルの抽出手法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:31:22 GMT)
RouteRL: Multi-agent reinforcement learning framework for urban route choice with autonomous vehicles [0.0] RouteRLは、マルチエージェント強化学習(MARL)と顕微鏡的トラフィックシミュレーションを統合する新しいフレームワークである。
提案手法は、行動経路選択モデルを用いてエミュレートされた人間ドライバーと、予め定義された目的のためにポリシーを最適化するMARLエージェントとしてモデル化されたAVの2つのタイプを含む、市内のドライバーエージェントの日々の経路選択をシミュレートする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:13:09 GMT)
Removing Neural Signal Artifacts with Autoencoder-Targeted Adversarial Transformers (AT-AT) [0.0] オートエンコーダをターゲットとした対向変換器(AT-AT)を用いて脳波データからEMG干渉をフィルタリングする機械学習システムを提案する。
67名の被験者から公開された神経データを用いてAT-ATをトレーニングしたところ、システムはより大きなモデルに匹敵するテスト性能を達成できたことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:31:08 GMT)
RacerF: Data Race Detection with Frama-C (Competition Contribution) [0.0] RacerFは、マルチスレッドCプログラムでデータ競合を検出する静的解析器である。
これは、シーケンシャルな振る舞いの分析を行うために、Frama-Cの抽象的インタプリタEVAに依存している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:48:49 GMT)
R-ParVI: Particle-based variational inference through lens of rewards [0.0] 部分的に既知の密度をサンプリングするために, 報酬誘導, 勾配のないParVI法を提案する。
R-ParVIは、確率モデルのクラスに対して、高速で、柔軟で、スケーラブルで、推論を提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:50:22 GMT)
Quantum metrology of rotations with mixed spin states [0.0] 混合最適量子ロトセンサ(OQRs)は、無限小回転を推定するために最大感度を達成するスピン=j$状態である。
混合OQRは純粋な状態と同等の感度を達成でき、反コヒーレント状態の線形部分空間からの状態の混合によって得られる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:26:01 GMT)
Quantum algorithms and lower bounds for eccentricity, radius, and diameter in undirected graphs [0.0] 本稿では,隣接度リストモデルにおける非方向重み付きグラフの直径と半径の量子アルゴリズムを提案する。
直径については、$widetildeO(sqrtmn3/4)$時間において、直径を2/3ドルの比率で近似する量子アルゴリズムを提案する。
また、上記のすべての問題に対して$Omega(sqrtnm)$の量子クエリローバウンドをミニマ探索問題からの還元により確立する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:39:32 GMT)
Quantum Natural Gradient optimizer on noisy platforms: QAOA as a case study [0.0] 横フィールドイジングモデル(TFIM)の基底状態検出におけるQNG(Quantum Natural Gradient)の有効性について検討する。
本分析では,実装置の校正データに基づいて,理想化されたノイズフリー条件と現実的な雑音環境の両方でシミュレーションを行う。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:14:32 GMT)
Quantum LDPC codes for erasure-biased atomic quantum processors [0.0] 量子低密度パリティ・チェック(LDPC)符号は、最近、フォールトトレラント量子コンピューティングへの道筋を示すことが示されている。
支配的エラーが消去である場合、量子LDPC符号は高いしきい値とより強力な論理的誤り抑制を与える。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:23:40 GMT)
QKD as a Quantum Machine Learning task [0.0] 本稿では,量子機械学習(QML)アルゴリズムのユースケースとして,量子鍵分布(QKD)プロトコルを提案する。
BB84プロトコルの量子回路実装に対する盗聴攻撃を最適化するQMLタスクを定義し,検討する。
本稿では,QMLアルゴリズムにおけるQKD後処理の古典的情報を用いて,集団攻撃のQML構築を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:15:43 GMT)
Proposal for many-body quantum chaos detection [0.0] 量子カオス」という用語は、ランダム行列理論で見られるものと類似したスペクトル相関を指す。
この構造が2つの物理量のクエンチダイナミクスによってどのように検出できるかを論じる。
システムがカオスから遠ざかるにつれて、相関穴は消え、可積分性や局所化のシグナルとなる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:10:38 GMT)
Probing quantum properties of black holes with a Floquet-driven optical lattice simulator [0.0] 超低温原子を用いた (1 + 1) 次元ブラックホールと (2 + 1) 次元ブラックホールのアナログ量子シミュレーション手法を提案する。
我々は, ブラックホールの湾曲した形状を符号化した位置依存トンネル振幅を, 駆動系の有効力学によって生成できることを示す。
また、(1+1)Dの模擬ブラックホールのホーキング温度をオンサイト原子集団測定のみに基づいて決定する手法も提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:53:07 GMT)
Probing non-equilibrium steady states of the Klein-Gordon field with Unruh-DeWitt detectors [0.0] 非平衡定常状態(NESS)に結合したUnruh-DeWitt検出器の遷移速度を計算する。
NESSは、2つの半無限熱浴を超表面に沿って熱接触させることから生じる。
得られた遷移速度は、慣性熱平衡状態に結合した検出器の場合と対比する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:54:05 GMT)
Power and temperature dependent model for High Q superconductors [0.0] コプラナー導波管型超伝導共振器の内部品質係数の測定は、超伝導装置の損失を小さくする確立された方法である。
過剰な非平衡準粒子は、回路量子力学で使用される平面超伝導共振器の品質係数を制限することもできる。
ここでは、TLSと準粒子損失を同時に分離する共振器損失を評価するために、2温度・電力・温度依存モデルを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:18:07 GMT)
Postponing the choice: advantage of deferred measurements in quantum information processing [0.0] 同じ系上の2つの任意の量子測定は不可能である。
選択や一部を後段まで延期するメリットについて検討する。
特定のシナリオでは、選択を延期しても追加のコストはかからないが、他のシナリオでは、部分的な延期は、事実上完全な延期と同じである。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:24:27 GMT)
PolyPrompt: Automating Knowledge Extraction from Multilingual Language Models with Dynamic Prompt Generation [0.0] 大規模言語モデル(LLM)の多言語機能を強化するための新しいパラメータ効率フレームワークであるPolyPromptを紹介する。
提案手法では,各言語に対するトリガトークンの集合を勾配に基づく探索により学習し,入力クエリの言語を識別し,推論中にプロンプトにプリコンパイルされた対応するトリガトークンを選択する。
我々は20億のパラメータモデルで実験を行い、15の類型的および資源的多様言語にわたる世界MMLUベンチマークで評価を行い、ナイーブおよびトランスレーショナル・ピペリンベースラインと比較して3.7%-19.9%の精度向上を示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:41:22 GMT)
Persistent Sampling: Enhancing the Efficiency of Sequential Monte Carlo [0.0] 連続モンテカルロサンプリング(SMC)はベイズ推論の強力なツールであるが、高い計算コストに悩まされている。
我々は、SMCを維持し、全ての先行イテレーションから粒子を構成する永続サンプリング(PS)を導入する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:15:38 GMT)
Partial independence suffices to prove real Hilbert spaces insufficient in quantum physics [0.0] 実ヒルベルト空間に基づく量子論は、複素ヒルベルト空間上の量子論の予測を説明できないことを示す。
実量子論において、ソース独立性とベル値とのトレードオフを導出する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:58:14 GMT)
Non-symmetric GHZ states: weighted hypergraph and controlled-unitary graph representations [0.0] また,非対称GHZ状態は局所操作と単一アンシラを用いて効率よく安定化できることを示した。
この結果から,Qubit系およびqudit系における非対称多部交絡の特徴付けと安定化のための体系的アプローチが得られた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:13:20 GMT)
Non-Cooperative Games with Uncertainty [0.0] 本稿では,各プレイヤが共通の事前パラメータを伴わずにグローバルに不確実なパラメータに直面するような,有限非協調ゲームのためのフレームワークを提案する。
我々は、一方的な戦略変更により、プレイヤーが期待するユーティリティを改善できないよう要求することで、「拡張平衡」を定義する。
ブリューワーの不動点定理に基づいて、ナッシュの構成を模倣する不動点論法は存在を保証する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:31:57 GMT)
Neuromorphic Circuits with Spiking Astrocytes for Increased Energy Efficiency, Fault Tolerance, and Memory Capacitance [0.0] 本稿では、スパイキングニューラルネットワーク(SNN)におけるLIFAモデルを紹介する。
我々のコアアーキテクチャは、ニューロン、シナプス、アストロサイト回路で構成され、各アストロサイトは、自己修復のために複数のニューロンをサポートする。
本モデルでは, 耐故障率81.10%, 耐力改善率18.90%を特徴とし, 他の実装をはるかに上回っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:55:29 GMT)
Neural CRNs: A Natural Implementation of Learning in Chemical Reaction Networks [0.0] 本稿では, マスアクション化学反応系における学習の効率的, 自律的, 汎用的な実装であるNeural CRNを提案する。
CRNは純粋にアナログな化学系であり、その化学種の濃度力学において神経計算を符号化する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:18:40 GMT)
NaijaNLP: A Survey of Nigerian Low-Resource Languages [0.0] 3つの言語(Hausa、Yorub'a、Igbo)がナイジェリアの話し言葉の約60%を占めている。
これらの言語は、計算言語学におけるタスクを支援するリソースが不足しているため、低リソースに分類される。
本研究は,ナイジェリアの3大言語を対象とした低リソースNLP(LR-NLP)研究の進展を概観する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:48:51 GMT)
Multi-axis inertial sensing with 2D matter-wave arrays [0.0] 原子干渉計(Atom Interferometery)は慣性力に敏感な精密な測定技術である。
同時光パルス原子干渉計の相関に基づく多軸慣性センシング法について報告する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:04:33 GMT)
Modified FOX Optimizer for Solving optimization problems [0.0] 本研究は, 探索・平衡探索・エクスプロイトを強化するため, 改良型FOX (mFOX) を提案する。
mFOXアルゴリズムの性能は、23の古典的ベンチマーク関数上の12のよく知られたアルゴリズムに対して評価される。
mFOXは、一様問題、制約問題、高次元問題を含む4つの工学的問題に効果的に対処する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:11:05 GMT)
Model-Based Reinforcement Learning for Control of Strongly-Disturbed Unsteady Aerodynamic Flows [0.0] 本稿では,モデルに基づく強化学習(MBRL)手法を提案する。
このモデルの精度とロバスト性は、非常に乱れた環境下での投球翼のシナリオで実証される。
乱れのない環境における垂直軸風力タービンへの適用をAppendixで論じる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:03:38 GMT)
Measurement of Neutron Whispering Gallery States Using a Pulsed Neutron Beam [0.0] 中性子ウィスパーリングギャラリー状態は遠心力と物質電位で束縛された材料表面に局在した量子状態である。
パルス式コールド中性子ビームを用いて, マントルムSiO$コンケーブミラー上に中性子ささやきギャラリー状態を観察した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 03:29:51 GMT)
Low crosstalk modular flip-chip architecture for coupled superconducting qubits [0.0] 本稿では,超伝導量子ビットの配列に対するフリップチップアーキテクチャを提案する。
他のフリップチップアプローチとは対照的に、アーキテクチャの量子ビットチップは電気的に浮かんでいるため、シンプルで完全にモジュール化されたアセンブリが保証される。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:54:27 GMT)
Lotus at SemEval-2025 Task 11: RoBERTa with Llama-3 Generated Explanations for Multi-Label Emotion Classification [0.0] 本稿では、Llama-3を用いて、あいまいな感情表現を明確化する説明コンテンツを生成するマルチラベル感情検出の新しいアプローチを提案する。
説明的文脈を取り入れることで、特に恐怖、喜び、悲しみなどの感情に対してF1スコアを改善し、テキストのみのモデルより優れる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:04:36 GMT)
Local ergotropy dynamically witnesses many-body localized phases [0.0] 多体局在は、強く相互作用し、乱れた多体量子系に特徴的な力学現象である。
局所的なエルゴトロピーは、エルゴディックから局所的な位相への変化を動的に観察することを示す。
これは、従来の研究で分析された局所的な可観測物やエントロピーの代わりに、どのように局所制御を直接活用するかを示すもので、局所化現象の熱力学的マーカーを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:29:06 GMT)
LimeSoDa: A Dataset Collection for Benchmarking of Machine Learning Regressors in Digital Soil Mapping [0.0] 複数のデータセットに関するベンチマーク研究は、一般的に使われている手法の長所と短所を明らかにするために必要である。
LimeSoDaは、さまざまな国の31のフィールドとファームスケールのデータセットで構成されている。
我々は、すべてのデータセットで4つの学習アルゴリズムの予測性能を比較することで、ベンチマークにLimeSoDaを使うことを実証した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:31:36 GMT)
Leveraging Atom Loss Errors in Fault Tolerant Quantum Algorithms [0.0] 量子ビット損失に関連する誤差は、多くの量子ハードウェアシステムにおいて重要なノイズ源となっている。
我々はこれらの誤りを論理アルゴリズムで処理するための理論的枠組みを開発し、復号化手法と回路レベルの最適化を取り入れた。
我々は,小角合成のための玩具モデルを含むテレポーテーションに基づくアルゴリズムをシミュレートし,損失率の増加に伴い論理誤差率を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:59:25 GMT)
Large Language Models as Attribution Regularizers for Efficient Model Training [0.0] 大規模言語モデル(LLM)は、様々な領域で顕著なパフォーマンスを示している。
我々は,LLM生成したグローバルタスク特徴属性を,より小さなネットワークのトレーニングプロセスに組み込む方法を提案する。
我々のアプローチは、数ショットの学習シナリオにおいて優れたパフォーマンスをもたらす。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:55:18 GMT)
Krylov complexity as an order parameter for quantum chaotic-integrable transitions [0.0] クリロフ複雑性は、多体系における量子カオスを特徴付ける新しいパラダイムとして登場した。
最近の知見によると、量子カオス系では、Krylov状態の複雑性は時間進化の過程で顕著なピークを示す。
このKrylov複雑性ピーク(KCP)は量子カオスシステムの目印であり、その高さが量子カオスの秩序パラメータとして機能することを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:00:19 GMT)
Is Mathematics Obsolete? [0.0] これは、AIの時代における数学的および象徴的な推論の価値に関するエッセイである。
AI時代における数学的および記号的推論の価値について書かれている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:23:11 GMT)
Impilict Runge-Kutta based sparse identification of governing equations in biologically motivated systems [0.0] 本研究では,高次暗黙的ルンゲ・クッタ法(IRK)とスパース同定を融合した新しいデータ駆動型フレームワークIRK-SINDyを提案する。
その結果、IRK-SINDyは従来のSINDyやRK4-SINDyフレームワークよりも優れており、特に極度のデータ不足やノイズの条件下では優れていた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:44:37 GMT)
IQP computations with intermediate measurements [0.0] IQP回路の計算モデルを考える(全ての計算ステップがX基底対角ゲートである)。
非適応的あるいは適応的なX基底測定を許すか、あるいは非適応的Z基底測定を許すと、計算力は元のIQPモデルと同じであることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:39:23 GMT)
Hyperdimensional Representation Learning for Node Classification and Link Prediction [0.0] 本稿では,グラフのノード分類とリンク予測のための新しい手法であるHyperdimensional Graph Learner (HDGL)を紹介する。
グラフニューラルネットワーク(GNN)系におけるノード表現の傾き特性を用いた高次元空間へのノード特徴のマッピング
本稿では,ノード分類タスクにおいて,最新のGNN手法と競合する精度を,計算コストを大幅に削減することを示すために,広く使用されているベンチマークデータセットを用いた実験結果について報告する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:21:39 GMT)
High Efficiency Storage of Quasi-Classical and Quantum States in Coupled Resonators [0.0] 結合共振器を用いて量子古典状態と準古典状態の両方を理想的に保存できる光学モデルを提案する。
このプロトコルは、2つのキャビティ間の時間依存性のカップリングに基づいており、あるキャビティから別のキャビティへの外部伝播場を完全に転送できるように注意深く変調されている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:09:14 GMT)
HELENE: An Open-Source High-Security Privacy-Preserving Blockchain Based System for Automating and Managing Laboratory Health Tests [0.0] 本稿では,HELENEという,消費者直販型オープンソースプラットフォームについて紹介する。
HELENEはブロックチェーンと、患者のデータのプライバシを保護する新たな分散型のオラクルによってサポートされている。
具体的には、HELENEは、ヘルステストプロバイダがオークションを通じて競合することを可能にし、患者がサービスに入札し、健康テスト結果のコントロールを維持することを可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:28:29 GMT)
Global Framework for Simultaneous Emulation Across the Nuclear Landscape [0.0] 本研究では,初期多体計算とベイズニューラルネットワークを組み合わせた階層的枠組みを構築した。
我々は、酸素同位体連鎖を用いた開発をベンチマークし、地上エネルギーと核電荷半径の正確な結果を得る。
我々の枠組みは、核力を記述する低エネルギー定数に対して、核結合エネルギーと電荷半径のグローバル感度解析を可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:34:56 GMT)
Geometric Machine Learning on EEG Signals [0.0] 我々は、高次元脳波データに存在する下層の低次元幾何学構造を解明する手法を実証する。
本システムは既存の信号処理や分類ベンチマークと競合する性能を実現する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:19:47 GMT)
Generative adversarial neural networks for simulating neutrino interactions [0.0] 本稿では,ニュートリノ散乱現象を標準モンテカルロ発生器の代替としてシミュレートする新しい手法を提案する。
数GeVのエネルギー領域におけるニュートリノ-炭素衝突をシミュレートするGANモデルを開発した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:28:39 GMT)
Generating long-distance magnetic couplings with flat bands [0.0] スピン鎖の長距離磁気結合は, 平面バンド(FBs)の存在によって引き起こされることを示す。
我々は、我々の予期せぬ発見が、長距離量子通信を可能にする代替ルートを開くことができると信じている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:52:25 GMT)
Forward-Cooperation-Backward (FCB) learning in a Multi-Encoding Uni-Decoding neural network architecture [0.0] 本稿では、新しい概念を学習する人間の性質を模倣したディープニューラルネットワークフレームワークにおいて、前向きコバックワード(FCB)学習を紹介する。
モデルは4つの一般的なデータセットの次元削減性能の観点から正当化されている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:04:16 GMT)
Flash Interpretability: Decoding Specialised Feature Neurons in Large Language Models with the LM-Head [0.0] 本研究では,大きな言語モデルの最終射影層を通じて,ニューロンの重みを直接トークン確率に復号することが可能であることを示す。
これはLlama 3.1 8Bで説明され、LMヘッドを用いて「犬」ニューロンや「カリフォルニア」ニューロンのような特化された特徴ニューロンの例を見つける。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 21:31:36 GMT)
FedMentalCare: Towards Privacy-Preserving Fine-Tuned LLMs to Analyze Mental Health Status Using Federated Learning Framework [0.0] FedCareは、メンタルヘルスケアアプリケーションに大規模言語モデル(LLM)をデプロイするための、プライバシ保護フレームワークである。
われわれのフレームワークは、現実のメンタルヘルスシナリオにLSMをデプロイするためのスケーラブルでプライバシに配慮したアプローチを実証している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:04:19 GMT)
Fault-Resilience of Dissipative Processes for Quantum Computing [0.0] 本稿では,2種類の散逸アルゴリズムの誤差抵抗性に関する2つの主要な結果を示す。
最初の結果は、回路レベルの偏極ノイズの下で、DQEアルゴリズムのバージョンは、コード距離で指数関数的に最終出力状態の地上空間オーバーラップにおける加算誤差を抑えることができるということである。
2つ目の結果は、DQCが標準量子回路モデルよりもノイズに強くないことを証明している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:50:37 GMT)
Fast quantum transfer mediated by topological domain walls [0.0] 指数依存を欠くマルチドメインSSHチェーンとクロイツはしごにおける転送プロトコルを提案する。
また,Creutzはしごの局所化特性の活用方法についても検討する。
これにより、全接続可能な1Dネットワークが提供され、量子情報の目的に役立てることができる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 12:46:19 GMT)
Fast $\ell_1$-Regularized EEG Source Localization Using Variable Projection [0.0] 高速な脳波ソースローカライゼーションに適した可変投影アルゴリズム(VPAL)を提案する。
この解の収束性は、分離凸の広いクラス、潜在的に非滑らかな函数に対して証明する。
提案手法は sLORETA を含む最先端の手法と比較する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:31:59 GMT)
Extending the Hegselmann-Krause Model of Opinion Dynamics to include AI Oracles [0.0] Hegselmann-Krauseモデル(HK)は、コミュニティにおける個人の意見が時間とともにどのように変化するかを記述する。
私はシンプルなHKモデルを拡張して、コミュニティのメンバーの意見を平均化するAI(Artificially Intelligent)Oracleを導入します。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 02:37:04 GMT)
Expertise Is What We Want [0.0] アプリケーションアーキテクチャ、LLE(Large Language Expert)は、LLM(Large Language Models)の柔軟性とパワーと、Expert Systemsの解釈可能性、説明可能性、信頼性を組み合わせたものです。
LLE(Large Language Expert)システムのパワーを強調するために,新たに癌と診断された患者の作業を支援するLLEを構築した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:05:15 GMT)
Experimental realization of a quantum heat engine based on dissipation-engineered superconducting circuits [0.0] 超伝導回路に基づく量子熱エンジンの実験実験を行った。
我々はQCR上の調整駆動により量子オットーサイクルを実装し,冷却と加熱を逐次誘導する。
量子進化のシミュレーションと一致する正の出力パワーと効率を測定する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:34:29 GMT)
Estimating the Percentage of GBS Advantage in Gaussian Expectation Problems [0.0] 本稿では,GBSサンプルを用いてガウス予想問題を近似するアルゴリズムを提案する。
これらのアルゴリズムが標準モンテカルロ法(MC)よりも指数的な高速化を実現する問題空間の空でない部分集合を見つける。
特定の場合において、我々の手法は問題空間の約100%にわたってMCを一貫して上回ります。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 08:15:47 GMT)
Enhancing quantum computations with the synergy of auxiliary field quantum Monte Carlo and computational basis tomography [0.0] Hugginsらによって提案された補助場量子モンテカルロ(QC-AFQMC)アルゴリズム。
ヒドロキシルラジカル,エチレン,窒素分子などの分子系に対するQC-CBT-AFQMCの有効性を示す。
その結果,QC-CBT-AFQMCが量子化学の実用化に有効であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:16:16 GMT)
Enhancing Collaborative Filtering-Based Course Recommendations by Exploiting Time-to-Event Information with Survival Analysis [0.0] マッシブオープンコース(MOOC)は、伝統的な教育の代替として人気がある。
このようなアクセシビリティにもかかわらず、MOOCの登録数は大幅に減少する。
学習者のエンゲージメントを高めるためには、好みやニーズに合わせたコースを推薦することが不可欠である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:29:53 GMT)
Encodings of Observable Subalgebras [0.0] システムの可観測物のサブセットのみを保持するエンコーディングについて検討する。
我々の研究は全 CAR 代数の符号化にも当てはまるが、偶数パリティセクターの符号化にも当てはまる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 23:32:31 GMT)
Electric-field control of photon indistinguishability in cascaded decays in quantum dots [0.0] 量子放出器のデスケードは、絡み合った光子対を作るための簡単な方法を提供する。
カスケードで放出される光子の識別性は、関連する遷移の寿命比によって本質的に制限される。
量子ドット内のビエクシトン・エクシトンカスケードに対して、この比は応用電場によって広く調整可能であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:52:07 GMT)
Efficient mid-term forecasting of hourly electricity load using generalized additive models [0.0] 本稿では,解釈可能なP-スプラインから構築したGAMを用いた新しい予測手法を提案する。
提案手法は,9年以上にわたる欧州24カ国の負荷データを用いて評価した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:12:47 GMT)
Effective Distance of Higher Dimensional HGPs and Weight-Reduced Quantum LDPC Codes [0.0] 重み付きqLDPC符号の有効距離を保った単一アンシラシンドローム抽出回路が存在することを示す。
その結果, 単一アンシラシンドローム抽出回路を用いた場合, 高次元ハイパーグラフ製品コードには問題ないことがわかった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:31:34 GMT)
Disentangling by random pulses [0.0] ランダムショックを受ける量子状態の解析的抽出可能なモデルを提案する。
崩壊速度は衝撃の発生頻度の2倍になる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:54:41 GMT)
Diagnosing COVID-19 Severity from Chest X-Ray Images Using ViT and CNN Architectures [0.0] 3つのソースをマージすることで、大規模なCOVID重症度データセットを作成します。
事前訓練されたDenseNet161モデルは3つの重大度予測問題において最善を尽くした。
平均絶対誤差は0.5676であり, 放射線技師が予測した重症度と比較すると最も高い回帰率を示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:20:09 GMT)
Developmental Support Approach to AI's Autonomous Growth: Toward the Realization of a Mutually Beneficial Stage Through Experiential Learning [0.0] 本研究では,AI自体の倫理的発展を支援する「AI開発支援」アプローチを提案する。
我々は,経験,内観,分析,仮説形成のサイクルに基づく学習フレームワークを構築した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:12:20 GMT)
Deterministic or probabilistic? The psychology of LLMs as random number generators [0.0] 大規模言語モデル(LLM)は、本質的に確率的文脈認識機構を通じてテキスト生成を変換している。
この結果から, 変圧器をベースとしたモデルでは, ランダムな数値出力を誘導すると, 決定論的応答が生じることが判明した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:45:27 GMT)
Demographic Dynamics and Artificial Intelligence: Challenges and Opportunities in Europe and Africa for 2050 [0.0] AI技術の進歩は様々な速度で行われており、アフリカはヨーロッパより遅れている。
人口移動の差し迫った経済的な影響は、移民パターンをより慎重に調べる必要がある。
本稿では2050年までにアフリカ系移民とヨーロッパ人のAI能力の違いについて検討する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:14:37 GMT)
DeepSeek reshaping healthcare in China's tertiary hospitals [0.0] DeepSeekは、2025年1月から中国の第3次病院に広く展開されている、主要なAIシステムである。
継続的な技術進歩により、AIはゲノミクスや放射線学といったマルチモーダルなデータソースを統合することが期待されている。
医療におけるAIの未来は、透明な規制構造、業界協力、適応的なガバナンスフレームワークの開発に依存する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 10:24:58 GMT)
Deep Convolutional Neural Networks for Palm Fruit Maturity Classification [0.0] 本研究の目的は,ヤシ果実のイメージを5つの熟度レベルに正確に分類できるコンピュータビジョンシステムを開発することである。
成熟度に基づいてヤシ果実のイメージを分類するために、深層畳み込みニューラルネットワーク(CNN)を用いる。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:06:30 GMT)
Dam Volume Prediction Model Development Using ML Algorithms [0.0] 南アフリカのロスコップダムのキーダム性能特性を予測するために,3つの機械学習回帰手法を適用した。
最良性能のアプローチは、高体積のランダム森林と低体積のリッジ回帰を組み合わせたしきい値に基づくブレンドモデルであった。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:14:14 GMT)
Correlated and Critical Phenomena in Multipartite Quantum Non-Markovianity [0.0] 非マルコビアン性は常に、システムサイズが臨界しきい値を超えたときに生じる。
サブシステム間距離とシステムサイズは、マルチパーティのオープン量子系におけるメモリ効果の正確な制御として機能する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:45:17 GMT)
Community Detection by ELPMeans: An Unsupervised Approach That Uses Laplacian Centrality and Clustering [0.0] ソーシャルネットワークの最近の増加により、ネットワーク分析のコミュニティはより複雑になっている。
本稿は,この課題に対処する試みとして,ELPMeansという新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 09:07:45 GMT)
Chaos and magic in the dissipative quantum kicked top [0.0] 無限範囲の相互作用量子スピン-1/2モデルについて検討し、周期的蹴りおよび散逸的に環境と結合する。
有限サイズでは、量子軌道を用いて系の力学を記述する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 16:09:22 GMT)
Bisecting K-Means in RAG for Enhancing Question-Answering Tasks Performance in Telecommunications [0.0] 本研究は,遠隔通信領域用に明示的に設計された新しい検索・拡張生成フレームワークを提案する。
このフレームワークは、Bisecting K-Meansクラスタリング技術を用いて、埋め込みベクターをコンテンツによって整理し、より効率的な情報検索を容易にする。
このフレームワークはSmall Language Modelsを用いてテストされ、フィ-2では66.12%、フィ-3では72.13%の精度で性能が向上した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 15:23:18 GMT)
BiRating -- Iterative averaging on a bipartite graph of Beat Saber scores, player skills, and map difficulties [0.0] Beat Saberマップの難易度推定は興味深いデータ解析問題であり、Beat Saberの競争シーンにとって価値のある問題である。
本稿では,プレイヤーのスキルとマップの難易度を2部グラフで反復的に推定する簡単なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 04:07:53 GMT)
Benchmarking Quantum Red TEA on CPUs, GPUs, and TPUs [0.0] 異種ハードウェアプラットフォーム上での多体量子システムのシミュレーションをベンチマークする。
私たちは、NumPyやPyTorch、JAX、ライブラリなど、異なる線形代数バックエンドを比較します。
本稿では,CPU上でパラメータをチューニングする場合に,34の係数の高速化を実現する方法を提案する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 18:25:22 GMT)
AutoPureData: Automated Filtering of Undesirable Web Data to Update LLM Knowledge [0.0] 最新かつ信頼性の高い言語モデルは、一貫して追求され、様々なアプリケーションに欠かせない。
本稿では,Webデータを自動的に収集・浄化するシステムであるAutoPureDataを提案する。
その結果、安全でないテキストを97%の精度で、望ましくないテキストを86%の精度で除去することができた。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 07:17:52 GMT)
Artificial Intelligence in Sports: Insights from a Quantitative Survey among Sports Students in Germany about their Perceptions, Expectations, and Concerns regarding the Use of AI Tools [0.0] この写本は、ドイツのすべての学区のスポーツ学生による定量的調査の結果を提示している。
学生は、AIの普及が批判的な思考スキルを損なうことはないと自信を表明している。
学生は、盗作、講師の準備、彼らのスキルと将来のスキル開発に懸念を持っている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:37:53 GMT)
Applications of the Quantum Phase Difference Estimation Algorithm to the Excitation Energies in Spin Systems on a NISQ Device [0.0] QPDEは、2つの固有状態の量子重ね合わせを利用して、ユニタリ作用素の2つの固有値の違いを計算するために設計された量子アルゴリズムである。
本稿では,様々なスピン系構成のエネルギーギャップを決定するための新しい早期耐故障QPDEアルゴリズムの実装と検証について述べる。
IBM量子プロセッサの計算結果は,85%から93%の範囲で顕著な精度を示し,ハードウェアノイズの存在下においても古典的計算と良好な一致を示した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:31:47 GMT)
Anticoncentration in Clifford Circuits and Beyond: From Random Tensor Networks to Pseudo-Magic States [0.0] 反濃縮は、許容されるヒルベルト空間上で量子状態のアンサンブルがどのように広がるかを記述する。
ランダムな安定化状態の重複分布に対するランダムなクリフォード回路の反集中性について検討する。
我々は,qudit数$T$-statesにポリログを挿入することは,ポーター・トーマス統計に対する重なり合う分布を駆動するのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 19:00:29 GMT)
Angular momentum effects in neutron decay [0.0] 非平面波状態における自由中性子のβ崩壊の興味深い現象について検討する。
解析では、非ゼロ軌道角運動量(OAM)を持つ非偏極渦(ベッセル)中性子、ラゲール・ガウス波パケット、および独自の偏極パターンを特徴とするスピン相関OAM状態の3種類の状態について検討した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 11:21:33 GMT)
An exploration of features to improve the generalisability of fake news detection models [0.0] 既存のNLPおよび教師付き機械学習メソッドは、クロスバリデーションの下ではうまく機能するが、データセットをまたいだ一般化に苦慮する。
この問題は、記事がパブリッシャに基づいてラベル付けされる、粗いラベル付きトレーニングデータに起因している。
本研究は, 粗いラベル付きデータから意味のある特徴を抽出し, 実世界のロバスト性を向上させることを実証した。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:26:56 GMT)
An End-to-End Homomorphically Encrypted Neural Network [0.0] ホモモルフィックニューラルネットワーク(HNN)は、通常のニューラルネットワークに匹敵する精度を維持しながら、完全なプライバシとセキュリティを達成することができる。
微分可能なSoft-Argmaxと呼ばれる新しいレイヤは、暗号化ドメイン内の出力ロジットの校正を可能にする。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 14:09:57 GMT)
Advancing GDP Forecasting: The Potential of Machine Learning Techniques in Economic Predictions [0.0] 本稿では,GDP,特にLSTMネットワークの予測におけるリカレントニューラルネットワークの有効性について検討する。
我々は1995年から2023年までの四半期ルーマニアのGDPデータセットを使用し、LSTMネットワークを構築し、シリーズの次の4つの値に予測する。
機械学習モデルは予測精度と柔軟性の点で従来の計量モデルより一貫して優れていることが示唆された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 06:28:13 GMT)
Advancements in Natural Language Processing for Automatic Text Summarization [0.0] 著者らは抽出的手法と抽象的手法の両方を用いた既存のハイブリッド手法を探求した。
テキスト情報を要約するプロセスは、様々なテキストの複雑な書体によって著しく制約され続けている。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 05:17:36 GMT)
Advanced Deep Learning Techniques for Analyzing Earnings Call Transcripts: Methodologies and Applications [0.0] 本研究の目的は,大規模財務文書から感情を抽出するために自然言語処理をどのように活用できるかを検討することである。
金融感情分析の文脈における各モデルの強みと限界について検討する。
厳密な実験を通じて、精度、精度、リコール、F1スコアなどの重要な指標を用いて、それらの性能を評価する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 00:28:43 GMT)
Adapting Automatic Speech Recognition for Accented Air Traffic Control Communications [0.0] 本研究では,東南アジアアクセントに特化して微調整されたASRモデルの開発について述べる。
本研究は,SEA音声における単語誤り率(WER)0.0982,9.82%を達成し,大幅な改善を実現している。
その結果,ATC通信における非西欧アクセントの転写精度を向上させるため,ノイズロバスト訓練技術と地域特化データセットの必要性が強調された。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 17:35:59 GMT)
APIKS: A Modular ROS2 Framework for Rapid Prototyping and Validation of Automated Driving Systems [0.0] APIKSは、自動運転車ソフトウェアのテストと検証のためのROS2に基づくモジュラーフレームワークである。
それは、小さな概念実証のために特別に設計された、単純化された標準ベースのアーキテクチャを提供する。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 20:29:31 GMT)
AI in Supply Chain Risk Assessment: A Systematic Literature Review and Bibliometric Analysis [0.0] 本研究では,Google Scholar and Web of Scienceの1,903項目をPRISMAガイドラインで選択した54項目について検討した。
その結果,ランダムフォレスト,XGBoost,ハイブリッドアプローチなどのMLモデルは,パンデミック後の文脈におけるリスク予測精度と適応性を大幅に向上させることがわかった。
この研究は、データ品質や解釈可能性といった課題に対処するために、動的な戦略、学際的なコラボレーション、継続的なモデル評価の必要性を強調している。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 22:51:32 GMT)
A novel approach to accounting for correlations in evolution over time of an open quantum system [0.0] 我々は,システム+バス統計演算子の関連する部分に対して,中島-ズワンジグ一般化マスター方程式を変換する。
分子カオス」のような近似は使われていない。
得られた方程式は、浴槽と相互作用する利害関係系の統計演算子に対する完全閉(均一)方程式と等価である。
論文参考訳(メタデータ) (Thu, 27 Feb 2025 13:42:19 GMT)