Humanity's Last Exam [253.7] HumanityのLast Exam(HLE)は、人間の知識の最前線におけるマルチモーダルベンチマークである。
数学、人文科学、自然科学など、数十の科目にわたる3000の質問で構成されている。
各質問には、曖昧で容易に検証できる既知のソリューションがあるが、インターネット検索ではすぐには答えられない。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:07:03 GMT)
Transformers Boost the Performance of Decision Trees on Tabular Data across Sample Sizes [135.7] 本稿では,大規模言語モデルと勾配ブースト決定木を融合させる,シンプルで軽量な手法を提案する。
融合法を LLM-Boost と PFN-Boost と命名した。
多数のベースラインとアンサンブルアルゴリズムに対して最先端の性能を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:39:35 GMT)
Heterogeneous Swarms: Jointly Optimizing Model Roles and Weights for Multi-LLM Systems [102.4] モデルの役割と重みを協調的に最適化し,マルチLLMシステムを設計するアルゴリズムであるヘテロジニアス・スウォームを提案する。
実験により、異種群は12タスクの平均18.5%で15のロールベースおよび/またはウェイトベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:27:11 GMT)
Value-Based Deep RL Scales Predictably [100.2] 本研究は, 地域社会が病的行動に不安を抱いているにもかかわらず, 価値に基づく非政治的RL法が予測可能であることを示す。
SAC、BRO、PQLの3つのアルゴリズムを使って、DeepMind Control、OpenAI gym、IsaacGymの3つのアプローチを検証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:47 GMT)
When One LLM Drools, Multi-LLM Collaboration Rules [98.7] 私たちは、データ、スキル、人々の幅広い多様性を表現するために、マルチLLMコラボレーションを議論しています。
既存のマルチLLM協調手法を,アクセスレベルと情報交換レベルに基づいて階層構造に整理する。
コンポジションインテリジェンスとコラボレーティブAI開発への不可欠な道として,マルチLLMコラボレーションを構想する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:13:44 GMT)
Agency Is Frame-Dependent [94.9] エージェンシーは、目標に向かって成果を操縦するシステムの能力である。
私たちは、エージェンシーは基本的にフレーム依存であると主張している。
我々はあらゆる基礎科学がフレーム依存を必要とすると結論付けている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:34:57 GMT)
BOLT: Bootstrap Long Chain-of-Thought in Language Models without Distillation [88.8] OpenAIのo1は、驚くべき推論機能を示している。
多くのチームがLongCoTと推論機能を再現しようと試みている。
本稿では,o1-likeモデルや高価な人体アノテーションを蒸留することなくLCMのLongCoTキャパシティを実現するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:19:59 GMT)
Ola: Pushing the Frontiers of Omni-Modal Language Model with Progressive Modality Alignment [88.7] Olaはオムニモーダル言語モデルであり、画像、ビデオ、音声の理解間での競合的なパフォーマンスを実現する。
我々は、Olaを、この新興分野における将来の研究を進めるための、完全にオープンなオムニモーダル理解ソリューションにすることを目指している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:55 GMT)
Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3] コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:05:41 GMT)
AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [81.3] 大規模言語モデルに基づくエージェントが注目され、ますます人気が高まっている。
計画能力は LLM ベースのエージェントの重要な構成要素であり、通常は初期状態から望ましい目標を達成する必要がある。
近年の研究では、専門家レベルの軌跡を指導訓練用LLMに活用することで、効果的に計画能力を向上させることが示されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:17:39 GMT)
PartEdit: Fine-Grained Image Editing using Pre-Trained Diffusion Models [81.0] 本稿では,事前学習した拡散モデルに基づくオブジェクト部品に対する最初のテキストベースの画像編集手法を提案する。
提案手法は, 利用者の77~90%に好まれる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:08:43 GMT)
Adaptive Semantic Prompt Caching with VectorQ [78.6] ベクトル類似度メトリクスは、キャッシュ内の埋め込みプロンプトと最も近い隣人の類似度を定量化するために数値スコアを割り当てる。
この1つの大きさの閾値は、異なるプロンプトで不十分であることを示す。
埋め込みの複雑さと不確実性に適応する埋め込み固有のしきい値領域を学習するためのフレームワークであるVectorQを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:16:20 GMT)
Maintaining Structural Integrity in Parameter Spaces for Parameter Efficient Fine-tuning [78.4] さまざまな下流タスクに事前訓練された基礎モデルを適応させることは、人工知能において一般的である。
これを軽減するために、事前訓練されたモデルの重みをより資源効率の良い方法で更新するために、いくつかの微調整技術が開発されている。
本稿では,多次元パラメータ空間用に設計された一般化されたパラメータ効率の微調整フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:57:37 GMT)
Every Call is Precious: Global Optimization of Black-Box Functions with Unknown Lipschitz Constants [72.5] 我々は、リプシッツ連続関数のグローバル最適化のための新しいアプローチであるCall Precious (P)を紹介する。
P はリプシッツ定数を推定する必要性を排除し、従って追加関数を最小化する。
ECは、評価予算に対する非レグレットパフォーマンスを保証します。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:34:40 GMT)
DexterityGen: Foundation Controller for Unprecedented Dexterity [67.2] ツール使用など,ロボットの巧妙な操作スキルを教えることは,大きな課題となる。
現在のアプローチは、人間の遠隔操作(模倣学習)とシミュレート・トゥ・リアル強化学習(sim-to-real reinforcement learning)の2つの戦略に大別できる。
本稿では,手動回転や翻訳などの大規模動きプリミティブをRLで事前学習するDexterityGenを紹介する。
現実の世界では、人間の遠隔操作をコントローラーのプロンプトとして利用し、厳密な振る舞いを生み出す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:49:35 GMT)
MotionCanvas: Cinematic Shot Design with Controllable Image-to-Video Generation [65.7] 本稿では,映像生成の文脈で撮影映像を設計する手法を提案する。
I2V合成において,従来のコンピュータグラフィックスと現代映像生成技術からの洞察を結合することにより,3次元動作制御を実現する能力を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:41:04 GMT)
Unleashing the Power of Task-Specific Directions in Parameter Efficient Fine-tuning [65.3] 本稿では,タスク固有の方向性 (TSD) の概念に着目し,大規模モデルを事前学習状態からPEFTにおけるタスク固有の拡張へ移行させる。
本稿では,微調整過程におけるTSDの影響を最大化し,目標タスクにおけるモデル性能を向上させることを目的とした新しいアプローチであるLoRA-Dashを紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:16:37 GMT)
Decoder-Only LLMs are Better Controllers for Diffusion Models [63.2] 本稿では,大規模言語モデルから意味理解の強みを借りて,テキストから画像への拡散モデルを強化することを提案する。
我々のアダプタモジュールは、テキストから画像への生成品質と信頼性の観点から、最先端のモデルよりも優れている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:17:35 GMT)
Leveraging Reasoning with Guidelines to Elicit and Utilize Knowledge for Enhancing Safety Alignment [63.2] 拒絶訓練(RT)は、様々なOODジェイルブレイク攻撃に対する一般化に苦慮している。
我々は N が増加するにつれて一般化の大幅な改善を観察する。
本稿では,クエリ毎に安全推論を行うためのトレーニングモデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:01:44 GMT)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [62.7] 本稿では,AI生成コンテンツ分類器におけるグループ固有のしきい値最適化アルゴリズムであるFairOPTを紹介する。
我々のアプローチは、属性(例えば、テキストの長さと書き込みスタイル)に基づいて、データをサブグループに分割し、各グループの決定しきい値を学ぶ。
我々のフレームワークは、AIが生成する出力検出において、より堅牢で公平な分類基準の道を開く。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:58:48 GMT)
Confident or Seek Stronger: Exploring Uncertainty-Based On-device LLM Routing From Benchmarking to Generalization [61.0] 大規模言語モデル(LLM)はますますエッジデバイスにデプロイされ、民主化されている。
1つの有望な解決策は不確実性に基づくSLMルーティングであり、SLM上での低信頼応答が発生すると、高い要求を強いLCMにオフロードする。
我々は1500以上の設定でSLMからLLMへの不確実性駆動型ルーティング戦略のベンチマークと一般化を包括的に調査する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:11 GMT)
Recognizing Identities From Human Skeletons: A Survey on 3D Skeleton Based Person Re-Identification [60.9] 3Dスケルトンによる人物の再同定は、パターン認識コミュニティ内で注目を集める重要な研究分野である。
近年のSRID進歩の総合的なレビューと分析を行っている。
様々なベンチマークやプロトコルを用いて、最先端のSRID手法の徹底的な評価を行い、その有効性と効率性を比較した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:44:23 GMT)
Unintentional Unalignment: Likelihood Displacement in Direct Preference Optimization [60.2] 直接選好最適化(DPO)とその変種は、言語モデルと人間の選好の整合にますます利用されている。
以前の研究では、トレーニング中に好まれる反応の可能性が減少する傾向が見られた。
確率変位は破滅的になりうることを示し、確率質量を好ましくない反応から反対の意味の反応へとシフトさせる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:49:59 GMT)
Fully Autonomous AI Agents Should Not be Developed [58.9] 本稿では,完全自律型AIエージェントを開発すべきではないと主張している。
この立場を支持するために、我々は、従来の科学文献と現在の製品マーケティングから、異なるAIエージェントレベルを規定するために構築する。
分析の結果,システムの自律性によって人へのリスクが増大することが明らかとなった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:04:58 GMT)
InfAlign: Inference-aware language model alignment [58.7] 言語モデルのアライメントは、現代の生成言語モデルのトレーニングにおける重要なステップである。
この列車/テストのミスマッチは、推論時間法の観点から標準のRLHFフレームワークを最適化することを示す。
本稿では,ベースモデルに対するアライメントポリシーの予測時間勝利率を最適化することを目的とした,推論対応アライメント(InfAlign)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:15:48 GMT)
Peri-LN: Revisiting Layer Normalization in the Transformer Architecture [57.1] Pre-LNとPost-LNは、大規模なトレーニングの制限にもかかわらず、長い間標準のプラクティスを支配してきた。
いくつかのオープンソースの大規模モデルは、最近、多くの説明なしに第3の戦略を静かに採用し始めた。
Peri-LNは、よりバランスの取れた分散成長、より安定な勾配流、収束安定性を実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:12:02 GMT)
SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation On Diverse Modalities [55.9] Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの完全かつ公平な評価を行う。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:41:53 GMT)
Beyond Sample-Level Feedback: Using Reference-Level Feedback to Guide Data Synthesis [55.7] LLMは、主に高品質なデータセットの命令チューニングのために、自然言語命令に従う際、顕著な能力を示す。
最近のアプローチでは、データ品質を改善するためにフィードバックが組み込まれているが、典型的にはサンプルレベルで運用され、個々のレスポンスに対してフィードバックを生成し、適用している。
本稿では,厳密にキュレートされたシードデータから,高品質な参照サンプルに基づいてフィードバックを収集する新しい手法であるReference-Level Feedbackを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:29:00 GMT)
Multilingual Non-Autoregressive Machine Translation without Knowledge Distillation [55.5] 本稿では,非自己回帰型多言語機械翻訳へのアプローチを提案する。
我々のシステムは近年の非巡回変圧器の進歩を活用している。
また、未知の翻訳方向への一般化を改善するために、ピボットバックトランスレーション手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:16:28 GMT)
Algorithmic causal structure emerging through compression [53.5] 因果関係,対称性,圧縮の関係について検討する。
我々は、学習と圧縮の既知の関係を因果モデルが識別できないような環境に構築し、一般化する。
我々はアルゴリズム因果関係を因果関係の代替的定義として定義する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:50:57 GMT)
GCE-Pose: Global Context Enhancement for Category-level Object Pose Estimation [52.9] モデルフリーなカテゴリレベルのポーズ推定における重要な課題は、特定のカテゴリ内の様々なインスタンスにまたがって一般化されるコンテキストオブジェクトの特徴の抽出である。
GCE-Poseは、カテゴリレベルのグローバルコンテキストを予め統合することにより、新規インスタンスのポーズ推定を強化する手法である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:35:13 GMT)
Targeted Learning for Data Fairness [52.6] データ生成プロセス自体の公平性を評価することにより、公平性推論を拡張する。
我々は、人口統計学的平等、平等機会、条件付き相互情報から推定する。
提案手法を検証するため,いくつかのシミュレーションを行い,実データに適用する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:51:28 GMT)
Factorized Implicit Global Convolution for Automotive Computational Fluid Dynamics Prediction [52.3] 非常に大きな3DメッシュのCFD問題を効率的に解く新しいアーキテクチャであるFactized Implicit Global Convolution (FIGConv)を提案する。
FIGConvは、既存の3DニューラルCFDモデルよりも大幅に改善された2次複雑性の$O(N2)$を達成する。
業界標準のAhmedボディデータセットと大規模DrivAerNetデータセットに対するアプローチを検証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:57:57 GMT)
DocMIA: Document-Level Membership Inference Attacks against DocVQA Models [52.1] DocVQAモデルに特化された2つの新しいメンバーシップ推論攻撃を導入する。
提案手法は,さまざまなDocVQAモデルやデータセットに対して,既存の最先端メンバシップ推論よりも優れている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:58:21 GMT)
Interactive Visualization Recommendation with Hier-SUCB [52.1] 本稿では,従来のインタラクションからユーザフィードバックを学習する対話型パーソナライズドビジュアライゼーションレコメンデーション(PVisRec)システムを提案する。
よりインタラクティブで正確なレコメンデーションのために、PVisRec設定における文脈的半帯域であるHier-SUCBを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:46:29 GMT)
Discovering Physics Laws of Dynamical Systems via Invariant Function Learning [51.8] 我々は、常微分方程式(ODE)によって支配される力学系の基底法則を学習することを考える。
我々はtextbfInvariant textbfFunctions (DIF) のtextbfDisentanglement と呼ばれる新しい手法を提案する。
不変関数の発見は情報に基づく原理によって保証される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:46:50 GMT)
Predicting Large Language Model Capabilities on Closed-Book QA Tasks Using Only Information Available Prior to Training [51.6] 我々は,事前学習データと知識保持に密接に結びついているCBQAタスクの性能予測に焦点をあてる。
1)事前学習プロセス全体,特にデータ構築を習得すること,2)モデルの知識保持を評価すること,3)トレーニング前に利用可能な情報のみを使用してタスク固有の知識保持を予測すること,の3つの課題に対処する。
本稿では,事前学習データ,モデルサイズ,タスク固有の知識保持との関係を定量化する情報理論尺度であるSMIメトリクスを紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:23:53 GMT)
Beyond Binary: Towards Fine-Grained LLM-Generated Text Detection via Role Recognition and Involvement Measurement [51.6] 大規模言語モデル(LLM)は、オンライン談話における信頼を損なう可能性のあるコンテンツを生成する。
現在の手法はバイナリ分類に重点を置いており、人間とLLMのコラボレーションのような現実のシナリオの複雑さに対処できないことが多い。
バイナリ分類を超えてこれらの課題に対処するために,LLM生成コンテンツを検出するための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:19:10 GMT)
ScoreFlow: Mastering LLM Agent Workflows via Score-based Preference Optimization [51.3] エージェントワークフロー最適化のための高性能フレームワークであるScoreFlowを開発した。
ScoreFlowは、量的フィードバックを考慮に入れた直接選好最適化手法の新たな変種であるScore-DPOを組み込んでいる。
質問応答、コーディング、数学的推論を通じて、既存のベースラインよりも8.2%改善されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:47:49 GMT)
AttentionPredictor: Temporal Pattern Matters for Efficient LLM Inference [51.2] 本稿では,最初の学習に基づくクリティカルトークン識別手法であるAttentionPredictorを提案する。
注意予測器は、無視可能なメモリを消費しながら、注意スコアを正確に予測する。
また、トークン時間オーバーヘッドを隠蔽してデコードステージを高速化する、クロストークンクリティカルキャッシュプリフェッチフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:41:46 GMT)
A Survey of Artificial Intelligence in Gait-Based Neurodegenerative Disease Diagnosis [51.1] 神経変性疾患(神経変性疾患、ND)は、伝統的に医学的診断とモニタリングのために広範囲の医療資源と人的努力を必要とする。
重要な疾患関連運動症状として、ヒトの歩行を利用して異なるNDを特徴づけることができる。
人工知能(AI)モデルの現在の進歩は、NDの識別と分類のための自動歩行分析を可能にする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:34:48 GMT)
FE-UNet: Frequency Domain Enhanced U-Net with Segment Anything Capability for Versatile Image Segmentation [50.9] CNNのコントラスト感度関数を実験的に定量化し,人間の視覚システムと比較した。
本稿ではウェーブレット誘導分光ポーリングモジュール(WSPM)を提案する。
人間の視覚系をさらにエミュレートするために、周波数領域拡張受容野ブロック(FE-RFB)を導入する。
本研究では,SAM2 をバックボーンとし,Hiera-Large を事前学習ブロックとして組み込んだ FE-UNet を開発した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:24:34 GMT)
Point2RBox-v2: Rethinking Point-supervised Oriented Object Detection with Spatial Layout Among Instances [50.8] 我々は、ポイントアノテーションからオブジェクト指向オブジェクト検出(OOD)を学習するための検出器であるPoint2RBox-v2を提案する。
中心となる原則は, 1) ガウスの重複損失, 2) ヴォロノイの水害, 3) 一貫性損失の3つである。
私たちのソリューションはエレガントで軽量ですが、特に密集したシーンでは、競争力のあるパフォーマンスが期待できます。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:07:25 GMT)
TD3: Tucker Decomposition Based Dataset Distillation Method for Sequential Recommendation [50.2] 本稿では,メタラーニングフレームワークにおける textbfDataset textbfDistillation 手法である textbfTD3 を紹介する。
TD3は、オリジナルのデータから完全に表現力のある合成配列の要約を蒸留する。
拡張技術により、学習者は合成要約を忠実に適合させ、アンプループでの正確な更新を確実にすることができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:29:46 GMT)
Evaluating Inter-Column Logical Relationships in Synthetic Tabular Data Generation [49.9] 本稿では,論理的関係の保存性を評価するための3つの評価指標を提案する。
実世界の産業データセット上での古典的手法と最先端の手法の両方の性能を評価することにより,これらの指標を検証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:13:26 GMT)
Near-optimal Regret Using Policy Optimization in Online MDPs with Aggregate Bandit Feedback [49.8] オンライン有限水平マルコフ決定過程を逆向きに変化した損失と総括的帯域幅フィードバック(フルバンド幅)を用いて研究する。
この種のフィードバックの下では、エージェントは、軌跡内の各中間段階における個々の損失よりも、軌跡全体に生じる総損失のみを観察する。
この設定のための最初のポリシー最適化アルゴリズムを紹介します。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:03:24 GMT)
Error Diversity Matters: An Error-Resistant Ensemble Method for Unsupervised Dependency Parsing [49.6] 本稿では,誤りの多様性を考慮し,誤りの蓄積を回避できる効率的なアンサンブル選択手法を提案する。
提案手法は,従来のアンサンブル手法と同様に個々のモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:00:42 GMT)
Preserving Knowledge Invariance: Rethinking Robustness Evaluation of Open Information Extraction [49.2] 実世界におけるオープン情報抽出モデルの評価をシミュレートする最初のベンチマークを示す。
我々は、それぞれの例が知識不変のcliqueである大規模なテストベッドを設計し、注釈付けする。
さらにロバスト性計量を解明することにより、その性能が全体の傾きに対して一貫して正確であるならば、モデルはロバストであると判断される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:40:43 GMT)
Dark Distillation: Backdooring Distilled Datasets without Accessing Raw Data [48.7] 攻撃者はデータセットの配布プロセスをインターセプトし、蒸留したデータセットにバックドアを注入し、ユーザーに再配布することができる。
蒸留されたデータセットは、以前はバックドア攻撃に耐性があると考えられていたが、そのような攻撃には弱いままであることを示す。
攻撃方法は効率が良く,特定のケースでは1分以内で悪意ある蒸留データセットを作成できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:14:17 GMT)
Active Task Disambiguation with LLMs [48.5] 本稿では,タスクあいまいさの形式的定義を導入し,ベイズ実験設計のレンズによるタスクあいまいさの問題について考察する。
提案手法により,LLMエージェントは情報ゲインを最大化する目的の質問を生成することができる。
経験的な結果から、この形式の質問選択は、質問空間内でのみ推論に依存するアプローチに比べて、より効果的なタスクの曖昧さをもたらすことが示されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:20:22 GMT)
ImDy: Human Inverse Dynamics from Imitated Observations [48.0] 逆ダイナミクス(ID)は、人間の運動学的観察から駆動トルクを再現することを目的としている。
従来の最適化ベースのIDは高価な実験室のセットアップを必要とし、可用性を制限している。
本稿では、近年進歩的な人間の動作模倣アルゴリズムを利用して、データ駆動方式で人間の逆ダイナミクスを学習することを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:22:04 GMT)
Adapting to Evolving Adversaries with Regularized Continual Robust Training [47.9] 本稿では,各攻撃がモデルロジット空間のサンプルをどの程度乱すかによって,モデルが異なる攻撃に対する頑健さのギャップが限定されていることを示す理論的結果を示す。
われわれの発見とオープンソースコードは、進化する攻撃に対して堅牢なモデルの配備の基礎を築いた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:38:41 GMT)
MedRAG: Enhancing Retrieval-augmented Generation with Knowledge Graph-Elicited Reasoning for Healthcare Copilot [47.8] Retrieval-augmented Generation (RAG)は、プライバシーに敏感な電子健康記録を検索するのに適した手法である。
本稿では,医療領域に対する知識グラフ(KG)により強化されたRAGモデルであるMedRAGを提案する。
MedRAGはより具体的な診断の洞察を提供し、誤診率の低減に最先端のモデルを上回っている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:27:35 GMT)
Great Models Think Alike and this Undermines AI Oversight [47.8] モデル類似性がAI監視の両面に与える影響について検討する。
モデル誤りの重複に基づくLM類似性の確率論的尺度を提案する。
我々の研究は、モデル類似性の報告と修正の重要性を強調します。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:56:01 GMT)
Does Mapo Tofu Contain Coffee? Probing LLMs for Food-related Cultural Knowledge [47.6] FmLAMA(FmLAMA)は、食品関連の文化的事実と食実践のバリエーションに着目した多言語データセットである。
我々は,LLMを様々なアーキテクチャや構成にわたって分析し,その性能を単言語と多言語の両方で評価する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:52:16 GMT)
OpenRANet: Neuralized Spectrum Access by Joint Subcarrier and Power Allocation with Optimization-based Deep Learning [47.5] 次世代RANは、無線セルラーネットワークのためのAIネイティブインターフェースを備える。
本稿では,OpenRANetにおける共同サブキャリア電力配分の課題に対処する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:51:59 GMT)
Safety is Essential for Responsible Open-Ended Systems [47.2] オープンエンドレスネス(Open-Endedness)とは、AIシステムが新規で多様なアーティファクトやソリューションを継続的に自律的に生成する能力である。
このポジションペーパーは、Open-Ended AIの本質的に動的で自己伝播的な性質は、重大な、未発見のリスクをもたらすと主張している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:32:07 GMT)
Lightning-Fast Image Inversion and Editing for Text-to-Image Diffusion Models [46.7] 暗黙の方程式の根を求めることによって問題を定式化し,効率よく解ける手法を考案する。
我々の解法は、数値解析においてよく知られた手法であるNewton-Raphson (NR) に基づいている。
希少物体の画像および生成における改善された結果を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:37:43 GMT)
Rethinking Reward Model Evaluation: Are We Barking up the Wrong Tree? [46.4] RMの精度の違いが、最適化されたポリシー性能のギャップにどのように変換されるかを検討する。
我々は、RM品質の測定に使用する精度が、潜在的なRM過度な最適化を十分に捉えることができないことを認識している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:11:04 GMT)
UniForm: A Unified Diffusion Transformer for Audio-Video Generation [46.1] UniFormは、クロスモーダル整合性を高めるために設計された統合拡散変換器である。
聴覚情報と視覚情報を結合することにより、UniFormは音声と映像を同時に生成することを学ぶ。
実験では, 共同音声合成, オーディオ誘導映像生成, 映像誘導音声生成タスクにおいて, 提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:18:30 GMT)
Recent Advances in Speech Language Models: A Survey [46.0] 音声言語モデル(SpeechLMs)は、テキストから変換することなく音声を生成するエンドツーエンドモデルである。
本稿では,近年のSpeechLM構築手法について概観する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:23:39 GMT)
DeblurDiff: Real-World Image Deblurring with Generative Diffusion Models [45.6] The Latent Kernel Prediction Network (LKPN) is proposed to achieve robust real-world image deblurring。
LKPNは空間的に変化するカーネルを学習し、潜伏空間におけるシャープな画像の復元を誘導する。
提案手法は, ベンチマークおよび実世界の画像において, 最先端の画像デブロアリング法より優れる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:43:32 GMT)
Quantum Implementation of Non-Positive-Operator-Valued Measurements in General Probabilistic Theories by Post-Selected POVMs [45.4] 一般確率論(GPT)の枠組みにおける非正の演算値測定(N-POVM)を扱う。
N-POVM測定は実装可能とはみなされていないが,本論文では,量子論におけるPOVM測定とポストセレクションによるN-POVM測定の実装方法について述べる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:25:32 GMT)
SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference [45.1] 視覚言語モデル (VLM) では、視覚トークンはテキストトークンと比較して情報量が多すぎるにもかかわらず、計算オーバーヘッドがかなり大きい。
本稿では、余分なパラメータや微調整コストを不要とするSparseVLMと呼ばれるテキスト誘導型トレーニングフリートークン最適化機構を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:31:16 GMT)
Reinforcement Learning on AYA Dyads to Enhance Medication Adherence [45.0] 介入の配信をパーソナライズする新しいマルチエージェント強化学習(MARL)手法を提案する。
MARLフレームワークは、各エージェントが1つの介入コンポーネントのデリバリに責任を持つもので、フラット化されたエージェントと比較してより高速な学習を可能にする。
実際の臨床データに基づくダイアディック・シミュレーター環境による評価は,薬剤の付着性を大幅に改善した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:27:35 GMT)
Iterative Importance Fine-tuning of Diffusion Models [44.7] この研究は、$h$-transformを推定することにより、微調整拡散モデルのための自己教師付きアルゴリズムを導入する。
テキスト・画像拡散モデルのクラス条件サンプリングと報酬微調整における本フレームワークの有効性を実証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:37:15 GMT)
Llasa: Scaling Train-Time and Inference-Time Compute for Llama-based Speech Synthesis [44.7] 合成音声に対する列車時間と推論時間計算のスケーリングについて検討する。
実験の結果,Llasa における列車時間計算のスケーリングは,合成音声の自然な性質を常に向上させることがわかった。
探索中に音声理解モデルを検証者として使用し、推論時間のスケーリングによってサンプリングモードが特定の検証者の好みにシフトすることを発見した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:04:00 GMT)
WorldSense: Evaluating Real-world Omnimodal Understanding for Multimodal LLMs [44.3] マルチモーダルビデオ理解を評価する最初のベンチマークであるWorldSenseを紹介する。
音声とビデオの強い結合を特徴とする評価タスクを設計する。
WorldSenseは1,662本のオーディオ視覚同期ビデオの多様なコレクションを含んでいる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:40 GMT)
LLM Alignment as Retriever Optimization: An Information Retrieval Perspective [44.3] 大規模言語モデル(LLM)は、推論、コーディング、コミュニケーションの能力を備えた人工知能に革命をもたらした。
我々の研究は、確立された情報検索(IR)の原則に基づいて、LCMアライメントのための新しい直接最適化手法を導入する。
本稿では,LLMアライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント(LarPO)を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:22:06 GMT)
SWAG: Long-term Surgical Workflow Prediction with Generative-based Anticipation [44.0] 位相認識と予測を組み合わせたSWAG(Surgical Precipative Generation)を提案する。
SWAGは分類タスクと回帰タスクの多角性を示し、外科的ワークフローと予測の間に時間的連続性を生み出す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:54:37 GMT)
PhD Knowledge Not Required: A Reasoning Challenge for Large Language Models [43.2] 一般知識のみを必要とするNPRサンデーパズルチャレンジに基づくベンチマークを提案する。
私たちの研究は、既存のベンチマークでは明らかでない機能ギャップを明らかにしています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:45:16 GMT)
PRISM-TopoMap: Online Topological Mapping with Place Recognition and Scan Matching [42.7] 本稿では,局所的な位置のグラフを保持するトポロジカルマッピング手法であるPRISM-TopoMapを紹介する。
提案手法は,ローカライゼーションとループ閉鎖のために,スキャンマッチングパイプラインと組み合わせて学習可能なマルチモーダル位置認識を行う。
提案手法の広範な実験的評価を,写真リアリスティックな環境と実物ロボットを用いて行い,その技術状況と比較する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:05:24 GMT)
Step Back to Leap Forward: Self-Backtracking for Boosting Reasoning of Language Models [42.7] 遅い思考機構を大きな言語モデルに統合することは、Level 2 AGI Reasonersにとって有望な方法である。
トレーニングと推論の両方において,LLMにバックトラック機能を持たせる自己追跡機構を提案する。
このメカニズムは推論能力を高めるだけでなく、スロー思考のプロセスを自己改善を通じて高速思考に変換することで効率も向上する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:52:43 GMT)
UltraIF: Advancing Instruction Following from the Wild [42.6] 本稿では,オープンソースのデータで複雑な命令に従うことができる大規模言語モデル(LLM)を構築するための,シンプルでスケーラブルなアプローチを提案する。
UltraIFは、実世界のユーザプロンプトを、制約に対する単純なクエリ、制約、および対応する評価質問に分解する。
我々の実験では、LLaMA-3.1-8B-Baseを、ベンチマーク情報なしで5つのインストラクションフォローベンチマークのインストラクションバージョンに追いつくために、初めて、LLaMA-3.1-8B-Baseを調整しました。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:39:16 GMT)
Minimal operational theories: classical theories with quantum features [41.9] システム力学は最小の操作に制約される確率論のクラスを導入する。
具体的には、許容される楽器は、準備、測定、スワップ変換、条件付きテストの組成から派生したものに限られる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:19:40 GMT)
High-dimensional monitoring and the emergence of realism via multiple observers [41.9] 相関はすべての測定モデルの基本的なメカニズムである。
本稿では,弱度と強い非選択性の測定を補間するモデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:17:44 GMT)
sshELF: Single-Shot Hierarchical Extrapolation of Latent Features for 3D Reconstruction from Sparse-Views [41.7] 外向きのビューから屋外のシーンを再構築することは、ビューの重複を最小限に抑えるため、大きな課題となる。
階層外挿による非有界3次元シーン再構成のための高速単発パイプラインを提案する。
latentELFは、隠された領域を忠実に再構築し、リアルタイムレンダリングをサポートし、下流アプリケーションにリッチな機能を提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:58:45 GMT)
Exploring Imbalanced Annotations for Effective In-Context Learning [41.6] 注釈付きデータセットにおける不均衡なクラス分布は、文脈内学習(ICL)の性能を著しく低下させることを示した。
本手法は,アノテートデータセットとテストデータセットの分布差を2成分重みに分解する。
提案手法は,従来の選択手法の有効性を保ちながら,単一のクラスから過剰なデモを選択することを防止する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:57:50 GMT)
StarMAP: Global Neighbor Embedding for Faithful Data Visualization [41.1] 隣の埋め込みはしばしばグローバル構造、例えばクラスタ間類似性を見落とし、正確な視覚化を妨げる。
本稿では,隣接する埋め込みにおける主成分分析(PCA)の利点を取り入れたStarMAP(Star-attracted Manifold Approximation and Projection)を提案する。
StarMAPは、隣接する埋め込みの解釈可能性と計算効率を維持しながら、忠実なグローバル構造を保存する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:43:07 GMT)
OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System [41.1] OneKEは、ドッカー化されたスキーマ誘導知識抽出システムである。
Webと生のPDFブックから知識を抽出することができる。
諸藩(科学、ニュースなど)を支えている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:37:17 GMT)
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference [41.0] KVキャッシュの量子化は、長いコンテキストにおける大規模言語モデル推論のスループットとレイテンシを改善することができる。
現在の方法では、KVキャッシュの量子化に対する階層的感度を見極めること、オンラインのきめ細かい決定のオーバーヘッドが高いこと、異なるLLMや制約に対する柔軟性の低いこと、の3つの未解決問題がある。
粗粒度のKVキャッシュに対して最適なハードウェアフレンドリなKV量子化ペアを適応的に探索する,シンプルで効果的なフレームワークKVTunerを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:26:26 GMT)
Beyond Random Augmentations: Pretraining with Hard Views [40.9] SSL(Self-Supervised Learning)メソッドは、異なる変換にモデルを不変にするために、ランダムなイメージ拡張(ビュー)に依存する。
本稿では,SSLプリトレーニング中に,より困難なサンプルにモデルを公開することにより,ランダムなビュー生成を拡張する学習自由な戦略であるハードビュー事前学習(HVP)を提案する。
HVPはDINO ViT-B/16に新しい最先端技術を設定し、78.8%の線形評価精度(0.6%の改善)に達し、100と300の事前訓練で1%の利得を得た。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:39:59 GMT)
CollagePrompt: A Benchmark for Budget-Friendly Visual Recognition with GPT-4V [40.2] GPT-4Vは、視覚認識タスクにおいて顕著な熟練性を示す。
GPT-4Vの推論に伴う金銭的コストは、その広範囲な使用にとって大きな障壁となる。
本稿では,複数の画像を単一の視覚的プロンプトにコラージュする,予算に優しいコラージュプロンプトタスクを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:55:33 GMT)
N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs [39.8] コンテキスト内学習は、トランスフォーマーのようなモデルが重みを更新することなく、新しいタスクに適応できるようにする。
本研究では,n-gram誘導ヘッドをインコンテキストRLの変換器に統合した。
我々のアプローチは一致し、場合によってはグリッドワールドとピクセルベースの環境でのアルゴリズム蒸留(AD)の性能を上回ります。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:14:27 GMT)
Adapting While Learning: Grounding LLMs for Scientific Problems with Intelligent Tool Usage Adaptation [39.8] 大規模言語モデル(LLM)は、単純な科学的問題を解決する上で有望な能力を示すが、ドメイン固有の微調整でさえも、複雑な言語に対する幻覚を生み出すことが多い。
本稿では,AWL(Adapting While Learning)という2成分微調整手法を提案する。
最初のコンポーネントであるWorld Knowledge Learning (WKL)では、LLMはツール生成ソリューションから学習することで、科学的知識を内部化する。
第2のコンポーネントであるツール・ユース・アダプテーション(TUA)では、WKL学習モデルの精度に基づいて質問を簡単または困難に分類し、ツールに切り替えながら簡単な問題に対する直接的な推論を維持するよう訓練する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:18:46 GMT)
DICE: Distilling Classifier-Free Guidance into Text Embeddings [39.8] テキスト間拡散モデルは高品質な画像を生成することができるが、これらの画像は与えられたテキストプロンプトと密接に一致しないことが多い。
生成過程におけるCFGへの依存を除去する新しいアプローチであるテキスト埋め込み(DICE)を強化することで、CFGを蒸留する。
DICEは、CFGベースの方向を再現するためにテキスト埋め込みを精製することにより、CFGベースのテキスト-画像拡散モデルをCFGフリーバージョンに蒸留する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:39:45 GMT)
Large-Scale Riemannian Meta-Optimization via Subspace Adaptation [39.8] 本稿では,大規模最適化におけるメモリ負荷を大幅に削減する効率的な手法を提案する。
本手法は,主流のディープニューラルネットワークを最適化する場合,モデルメモリ消費量を6桁に削減する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:35:55 GMT)
Transforming Multimodal Models into Action Models for Radiotherapy [39.7] 放射線治療は重要ながん治療であり、腫瘍の保存と健康な組織の根絶のバランスをとるための正確な計画が必要である。
伝統的な治療計画(TP)は、反復的で、時間がかかり、人間の専門知識に依存している。
本稿では,MLM(Multimodal foundation model)を,数発の強化学習アプローチを用いたアクションモデルに変換するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:51:28 GMT)
Broadband biphoton source for quantum optical coherence tomography based on a Michelson interferometer [39.6] 我々は、広帯域の明るいコリニア双光子場を生成するための新しい技術について記述し、実験的に実証する。
光源の最も簡単な応用として、ミシェルソン干渉計を用いた量子光コヒーレンストモグラフィー(Q OCT)を用いる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:41:15 GMT)
IN-Flow: Instance Normalization Flow for Non-stationary Time Series Forecasting [38.5] 固定統計量に依存しない時系列予測のための分離された定式化を提案する。
また、時系列変換のための新しい可逆ネットワークであるインスタンス正規化フロー(IN-Flow)を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:04:26 GMT)
A Generic Method for Fine-grained Category Discovery in Natural Language Texts [38.3] そこで本研究では,新たな目的関数によって導かれる意味的類似テキストの微細なクラスタをうまく検出する手法を提案する。
この方法は対数空間における意味的類似性を利用してユークリッド空間のサンプル分布を導く。
また,リアルタイムアプリケーションをサポートするセントロイド推論機構を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:57:23 GMT)
InfinitePOD: Building Datacenter-Scale High-Bandwidth Domain for LLM with Optical Circuit Switching Transceivers [37.9] 光回路スイッチング(OCS)を用いたトランシーバレベルの接続性と動的切換を統一する新しいトランシーバ中心型HBDアーキテクチャを提案する。
各トランシーバにOCSを埋め込むことで、InfinitePODは再構成可能なポイント・ツー・マルチポイント接続を実現し、トポロジーを可変サイズのリングに適合させることができる。
InfinitePOD は NVL-72 のコストの31%、NVL-72 と TPUv4 よりも 1 桁低い)、ノード故障比 7% 以下の場合のほぼ 0 桁のクロスToR トラフィックを実現し、モデルFLOP の利用率を 3.37 倍改善する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:01:24 GMT)
Conformal Risk Minimization with Variance Reduction [37.7] コンフォーマル予測(CP)は、ブラックボックスモデルにおける確率的保証を達成するための分布自由フレームワークである。
最近の研究は、トレーニング中のCP効率の最適化に重点を置いている。
我々は、この概念を共形リスク最小化の問題として定式化する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:55:50 GMT)
AnyPlace: Learning Generalized Object Placement for Robot Manipulation [37.7] 合成データに基づく2段階の手法であるAnyPlaceを提案する。
私たちのキーとなる洞察は、ビジョン・ランゲージ・モデルを活用することで、ローカルな配置のために、関連する領域のみに焦点を当てるということです。
トレーニングのために、異なる配置構成でランダムに生成されたオブジェクトの完全な合成データセットを生成する。
実世界の実験では、我々の手法が純粋に訓練されたモデルを直接現実世界に転送する方法が示されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:04:13 GMT)
Generative AI and Creative Work: Narratives, Values, and Impacts [37.2] 私たちは、オンラインメディアをレビューし、彼らが伝達するクリエイティブな仕事に対するAIの影響に関する支配的な物語を分析します。
この談話は、人的労働を通じて物質的実現から解放された創造性を促進する。
この言説は、支配的なテクノ実証主義のビジョンに対応し、創造的経済と文化に対する権力を主張する傾向にある。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:26:56 GMT)
G-Designer: Architecting Multi-agent Communication Topologies via Graph Neural Networks [37.0] G-Designerは,マルチエージェントデプロイメントのための適応的,効率的,堅牢なソリューションである。
G-Designerはタスク対応、カスタマイズされた通信トポロジを動的に設計する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:37:52 GMT)
$C^2$: Scalable Auto-Feedback for LLM-based Chart Generation [36.9] 参照不要な自動フィードバックジェネレータを導入し,人的介入のコストを削減した。
最初の実験では、回答者の74%が強く好んでおり、10%がフィードバック後の結果を好んだ。
ChartUIE-8Kは、クエリ、データセット、チャートタイプを増やすことで、データの多様性を大幅に改善する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:56:31 GMT)
ACECODER: Acing Coder RL via Automated Test-Case Synthesis [36.7] 既存のコードデータから広範な(問い合わせ、テストケース)ペアを生成するパイプラインを設計します。
我々は,Bradley-Terry損失を伴う報酬モデルをトレーニングするために,サンプルプログラムのパスレートに基づいて選好ペアを構築した。
RLトレーニングは,80段階の最適化ステップにおいて,HumanEval+を25%以上,MBPP+を6%以上改善できることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:25:25 GMT)
A Tractable Inference Perspective of Offline RL [36.6] オフライン強化学習(RL)タスクの一般的なパラダイムは、まずオフラインのトラジェクトリをシーケンスモデルに適合させ、次に高い期待されたリターンをもたらすアクションのモデルを促すことである。
本稿では,様々な確率的クエリを正確にかつ効率的に応答できるトラクタビリティが,オフラインRLにおいて重要な役割を担っていることを強調する。
本稿では,評価時間における良好なシーケンスモデルと高い期待値とのギャップを埋めるTrifleを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:40:17 GMT)
Language Models "Grok" to Copy [36.5] 本稿では,先行する文脈からテキストをコピーする能力に着目し,言語モデルの事前学習のダイナミクスについて検討する。
本稿では,トランスフォーマーをベースとした言語モデルが,グルーキングと同様の模倣能力を発達させる,という新たな視点を提案する。
グラッキングとコンテキストコピーの関連性は、より効果的な言語モデルトレーニングに有用な洞察をもたらすと我々は主張する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:31:50 GMT)
HD-EPIC: A Highly-Detailed Egocentric Video Dataset [36.0] HD-EPICは、9つのキッチンで41時間のビデオで、69のレシピ、59Kの細かいアクション、51Kのオーディオイベント、20Kのオブジェクトムーブメント、37Kのオブジェクトマスクを3Dに持ち上げる。
平均して、記述されていないビデオの1分間に263のアノテーションがあります。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:25:05 GMT)
DEFAME: Dynamic Evidence-based FAct-checking with Multimodal Experts [36.0] Dynamic Evidence-based FAct-checking with Multimodal Experts (DEFAME)は、オープンドメイン、テキストイメージクレーム検証のためのゼロショットMLLMパイプラインである。
DEFAMEは6段階のプロセスで動作し、ツールと検索深度を動的に選択し、テキストおよび視覚的証拠を抽出し、評価する。
人気のあるベンチマーク VERITE, AVerITeC, MOCHEG の評価では, DEFAME が以前の手法を全て上回っている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:27:38 GMT)
Ensuring Reliability via Hyperparameter Selection: Review and Advances [35.6] 本稿では、Learning-Then-Test(LTT)フレームワークをレビューし、エンジニアリング関連シナリオに適したいくつかの拡張について検討する。
これらの拡張には、異なるリスク測度と統計的保証、多目的最適化、事前の知識と依存構造の導入が含まれる。
本稿は,コミュニケーションシステムへの実証的な応用についても紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:47:21 GMT)
Towards Synergistic, Generalized, and Efficient Dual-System for Robotic Manipulation [35.4] RoboDualは、ジェネラリストとスペシャリストの双方の利点を補う相乗的双対システムである。
拡散変圧器をベースとした多段アクションロールアウトのためのスペシャリストが考案された。
CALVINが26.7%向上し、CALVINが12%向上した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:37:15 GMT)
Articulate-Anything: Automatic Modeling of Articulated Objects via a Vision-Language Foundation Model [35.2] Articulate-Anythingは、テキスト、画像、ビデオを含む多くの入力モダリティから、多種多様な複雑なオブジェクトの明瞭化を自動化する。
本システムでは,メッシュ検索機構を通じて既存の3Dデータセットを,反復的に提案,評価,洗練を行うアクタ・クリティカル・システムとともに活用する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:15:21 GMT)
Automatic quantification of breast cancer biomarkers from multiple 18F-FDG PET image segmentation [35.0] 提案手法は18F-FDG PETから乳腺腫瘍の分節を自動生成するシステムである。
抽出したバイオマーカーにより,癌進展の自動評価が可能となった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:51:28 GMT)
Strassen Attention: Unlocking Compositional Abilities in Transformers Based on a New Lower Bound Method [34.8] 一層ソフトマックス変換器に対する第1の下位境界を無限精度で証明する。
そこで我々は,Strassenの注意を喚起し,この機構により1層トランスフォーマーがこれらの課題をすべて解決できることを示す。
我々の結果は、これらの注意機構をすべて切り離し、その強みと限界を強調するのに役立ちます。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:45:47 GMT)
Low-skilled Occupations Face the Highest Upskilling Pressure [34.8] 我々は,新しい技術がタスクに取って代わるにつれて,仕事の内容をいかに進化させるかを検討する。
近年の研究では、2010年代におけるSTEMの職業にとって、スキル要件の変更が最も重要であることが判明している。
スキル間の距離を考慮に入れれば,低いスキルを持つ職業にとって,スキル変革が最善であることが分かっています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:12:26 GMT)
TourRank: Utilizing Large Language Models for Documents Ranking with a Tournament-Inspired Strategy [34.4] 大規模言語モデル(LLM)は、ゼロショット文書ランキングにますます採用され、賞賛に値する結果をもたらす。
本稿では,FIFAワールドカップなどのスポーツトーナメントに触発されたTourRankという新しい文書ランキング手法を紹介する。
具体的には,1) 競技大会の並列グループステージに似た多段階グループ戦略を導入することで,入力長の制限を克服し,ランキング待ち時間を短縮する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:40:52 GMT)
Self-Interested Agents in Collaborative Machine Learning: An Incentivized Adaptive Data-Centric Framework [34.2] 本稿では,データ中心型協調機械学習のためのフレームワークを提案する。
アービターはエージェントからデータのバッチを収集し、機械学習モデルをトレーニングし、各エージェントにデータコントリビューションを反映する独自のモデルを提供する。
この設定は、共有データ影響モデルの更新を行うフィードバックループを確立し、結果のモデルが将来のデータ共有ポリシーをガイドする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:39:53 GMT)
Scaling Laws in Patchification: An Image Is Worth 50,176 Tokens And More [34.1] 本稿では,パッチ方式による圧縮符号化のパラダイムによる情報損失について検討する。
我々は広範囲にわたるパッチサイズスケーリング実験を行い、パッチ化における興味深いスケーリング法則を興奮的に観察する。
副産物として、より小さいパッチでは、タスク固有のデコーダヘッドは、より密集した予測では重要でないことが分かる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:01:38 GMT)
CPRM: A LLM-based Continual Pre-training Framework for Relevance Modeling in Commercial Search [34.1] CPRMは、大規模言語モデル(LLM)の継続的な事前訓練のために設計されたフレームワークである
本フレームワークは3つのモジュールから構成される: 1) クエリとマルチフィールドアイテムを併用してドメイン知識を強化する,2) コンテキスト内事前学習を適用する,3) 関連するドメイン知識とバックグラウンド情報を生成する,という3つのモジュール。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:12:09 GMT)
CMoE: Fast Carving of Mixture-of-Experts for Efficient LLM Inference [33.9] 大規模言語モデル(LLM)はモデルパラメータのスケーリングによって素晴らしいパフォーマンスを達成するが、これはかなりの推論オーバーヘッドを伴う。
我々は,高密度モデルからMoEモデルを効率的に彫る新しいフレームワークであるCMoEを提案する。
CMoEは、効率的なエキスパートグループ化と軽量適応によって、優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:05:30 GMT)
HMT: Hierarchical Memory Transformer for Efficient Long Context Language Processing [33.7] Hierarchical Memory Transformer (HMT) はモデル長文処理を容易にする新しいフレームワークである。
HMTは、既存のモデルの長文処理能力を一貫して改善する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:35:02 GMT)
Beyond the Final Layer: Hierarchical Query Fusion Transformer with Agent-Interpolation Initialization for 3D Instance Segmentation [33.6] 3Dインスタンスセグメンテーションは、シーン内のオブジェクトインスタンスのセットを予測し、対応するセマンティックラベルを持つバイナリフォアグラウンドマスクとして表現することを目的としている。
トランスをベースとした手法は、エレガントなパイプライン、幾何学的特性のマニュアル選択の削減、性能の向上などにより、注目を集めている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:19:48 GMT)
ExpProof : Operationalizing Explanations for Confidential Models with ZKPs [33.5] ZKP(Zero-Knowledge Proofs)を用いた敵シナリオにおける説明の運用に向けて一歩前進する。
具体的には、一般的な説明可能性アルゴリズムLIMEのZKP対応バージョンについて検討し、ニューラルネットワークとランダムフォレストの性能を評価する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:24:29 GMT)
Efficient Distributed Optimization under Heavy-Tailed Noise [33.0] TailOPTは、潜在的に勾配のばらつきと局所的な更新を伴うヘビーテールノイズに対処するように設計されている。
Bi2Clip$は、インナーとアウターの両方でコーディネートワイドクリッピングを行い、アダプティブライクなパフォーマンスを実現する。
この$Bi2Clip$は、いくつかの言語タスクやモデルにおいて優れたパフォーマンスを示し、最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:47:18 GMT)
Linear Correlation in LM's Compositional Generalization and Hallucination [32.6] 言語モデル(LM)の一般化は、汎用知能の可能性と基本的な知識構成との闘いを対比して、活発に議論されている。
本稿では,知識合成におけるLMの線形相関現象を明らかにする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:44:30 GMT)
From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge [32.6] 人工知能(AI)と自然言語処理(NLP)において、長い間、評価と評価が重要な課題であった。
大規模言語モデル(LLM)の最近の進歩は"LLM-as-a-judge"パラダイムを刺激している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:18:27 GMT)
A Decoding Algorithm for Length-Control Summarization Based on Directed Acyclic Transformers [32.5] 長さ制御の要約は、長さ制限の範囲内で長いテキストを短いテキストに凝縮することを目的としている。
従来のアプローチでは、しばしば自己回帰(AR)モデルを使用し、長さ要件をソフト制約として扱う。
提案手法は,複数の可塑性配列フラグメントを許容し,それらを接続するエンフパスを予測する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:12:55 GMT)
Preference Optimization via Contrastive Divergence: Your Reward Model is Secretly an NLL Estimator [32.1] 本稿では,非推奨の完了を効果的にサンプリングするための理論的ガイダンスを提供する新しいPOフレームワークを開発する。
次に、サンプリング戦略としてコントラスト分散(CD)を選択し、新しいMC-POアルゴリズムを提案する。
OnMC-POは既存のSOTAベースラインより優れており、OnMC-POはさらなる改善をもたらす。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:45:08 GMT)
FairT2I: Mitigating Social Bias in Text-to-Image Generation via Large Language Model-Assisted Detection and Attribute Rebalancing [32.0] 本稿では,T2I生成における社会的バイアスの検出と緩和に,大規模言語モデルを活用する新しいフレームワークであるFairT2Iを紹介する。
以上の結果から,FairT2Iは社会的偏見を緩和し,画像の感度特性の多様性を高めることができた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:22:57 GMT)
ADIFF: Explaining audio difference using natural language [32.0] 本稿では,音声の違いを説明するタスクを包括的に研究し,そのタスクのベースラインであるベンチマークを提案する。
本稿では,AudioCaps と Clotho の音声キャプションデータセットから得られた音声差分説明のための2つの新しいデータセットを提案する。
提案するADIFFは, クロスプロジェクションモジュール, 位置キャプション, 3段階のトレーニングプロセスを導入し, 詳細な説明を行う能力を向上させる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:00:43 GMT)
Hybrid Decentralized Optimization: Leveraging Both First- and Zeroth-Order Optimizers for Faster Convergence [31.6] 分散システムは、よりノイズの多いゼロオーダーエージェントに耐えられるが、最適化プロセスにおいてそのようなエージェントの恩恵を受けることができる。
本研究の結果は,共同最適化作業に貢献しながらも,凸および非零次最適化の目的を達成できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:46:02 GMT)
Semi-rPPG: Semi-Supervised Remote Physiological Measurement with Curriculum Pseudo-Labeling [31.6] Photoplethysmography (r)は、顔画像から心拍数などの生理的信号を監視するための有望な技術である。
現在のr研究は主に、単純な環境で収集されたいくつかの小さな公開データセットに基づいている。
少量のラベル付きデータと豊富なラベル付きデータを活用する半教師付き手法は、このギャップをrラーニングのために埋めることができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:16:08 GMT)
Moner: Motion Correction in Undersampled Radial MRI with Unsupervised Neural Representation [31.4] 放射状MRIにおける運動補正(MoCo)は、被験者の動作の予測不能のため難しい問題である。
剛体動乱k空間データからアーチファクトフリーのMR画像と正確な動きを共同で解き、教師なしのMoCo法であるMonerを提案する。
複数のMRIデータセットの実験では、Monerはドメイン内のデータ上でSOTA MoCo技術に匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:19:51 GMT)
MA4DIV: Multi-Agent Reinforcement Learning for Search Result Diversification [30.9] 検索結果の多様化(SRD)は情報検索とWeb検索において重要かつ広く研究されている問題である。
我々は,MARL(Multi-Agent reinforcement learning)を検索結果のDIVersity(MA4DIV)に導入する。
このアプローチでは、各文書はエージェントであり、検索結果の多様化は複数のエージェント間の協調的なタスクとしてモデル化される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:41:05 GMT)
A Unified and General Humanoid Whole-Body Controller for Fine-Grained Locomotion [30.4] 本稿では,HugWBCを提案する。
HuGWBCは、現実世界のヒューマノイドロボットが、歩行(ランニング)、ジャンプ(ジャンプ)、立ち上がり、ホッピング(ホッピング)などのさまざまな自然歩行を、カスタマイズ可能なパラメータで生成することを可能にする。
HuGWBCはまた、遠隔操作のような外部上体コントローラからのリアルタイム介入をサポートし、ロコ操作を可能にする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:12:14 GMT)
Fine, I'll Merge It Myself: A Multi-Fidelity Framework for Automated Model Merging [30.4] 推論機能は、大きな言語モデルにとって重要なフロンティアである。
機能を効率的に補完する1つの方法は、モデルマージである。
本稿では,マージ戦略のきめ細かい探索を可能にする自動モデルマージフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:47:25 GMT)
Safeguarding connected autonomous vehicle communication: Protocols, intra- and inter-vehicular attacks and defenses [30.2] 本稿では,既存のセキュリティフレームワークとプロトコルを詳細に分析することによって貢献する。
本稿では,CAV通信のセキュリティ向上のためのベストプラクティスを提案する。
主な貢献は、CAVセキュリティ脅威の新しい分類システムの開発である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:43:23 GMT)
Strategic Learning with Local Explanations as Feedback [29.6] アクションレコメンデーション(AR)に基づく説明は、有害な応答に十分である。
エージェント福祉とDM結果のバランスをとるために,予測モデルとARポリシーを協調的に最適化する簡単なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:17:24 GMT)
Exploring Model Invariance with Discrete Search for Ultra-Low-Bit Quantization [28.9] ポストトレーニング量子化(Post-training Quantization)は、より少ないビットを使ってモデルを再トレーニングせずに表現する一般的なテクニックである。
本稿では,異なるモデルの不変性を同時に体系的に探求する統合フレームワークであるInvarExploreを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:00:13 GMT)
Zero-shot Outlier Detection via Prior-data Fitted Networks: Model Selection Bygone! [28.8] FoMo-0Dは、表データの0/0ショットODのための事前訓練されたファンデーションモデルである。
パラメータを微調整することなく、テストサンプルの(より低い/より低い)ラベルを直接予測できる。
57の実世界のデータセットの実験では、FoMo-0Dはベースラインの大部分を著しく上回っている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:40:04 GMT)
FAS: Fast ANN-SNN Conversion for Spiking Large Language Models [28.8] スパイキング大言語モデルを作成する既存の方法は、しばしば性能劣化と比較的高い計算コストに悩まされる。
本稿では, 高速ANN-SNN変換戦略 (FAS) を提案する。
言語と視覚言語の両方のタスクを4つの異なるスケールで実験した結果、FASは予測レイテンシと計算コストを大幅に削減して最先端のパフォーマンスを達成できることが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:08:12 GMT)
LLM The Genius Paradox: A Linguistic and Math Expert's Struggle with Simple Word-based Counting Problems [28.7] LLMは、人間が扱いやすいようないくつかの基本的なタスク、例えば単語トラウベリーの文字数rを数えるのに苦労する。
我々は,高度な数学的およびコーディング推論能力の伝達可能性について,特殊なLCMから単純なカウントタスクまでの測定を行う。
微調整や文脈内学習といった戦略と比較すると、係り受け推論はLLMのタスクをより知覚するのに役立つ最も堅牢で効率的な方法であることがわかる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:38:32 GMT)
BOUQuET: dataset, Benchmark and Open initiative for Universal Quality Evaluation in Translation [28.5] このデータセットは、まず英語以外の言語で手作りされている。
それぞれのソース言語は、世界の人口の半分が一般的に使っている23の言語に代表される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:56:37 GMT)
Deep Height Decoupling for Precise Vision-based 3D Occupancy Prediction [28.1] 本稿では,DHD(Deep Height Decoupling,ディープハイトデカップリング,Deep Height Decoupling,DHD)について述べる。
一般的なOcc3D-nuScenesベンチマークでは,最小入力フレームでも最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:30:21 GMT)
Fast Direct: Query-Efficient Online Black-box Guidance for Diffusion-model Target Generation [27.8] 既存の誘導拡散モデルは、事前コンパイルされたデータセットによるガイダンスモデルのトレーニングに依存するか、客観的関数を微分可能であるように要求する。
我々は,クエリ効率の良いオンラインブラックボックスターゲット生成のための,新規でシンプルなアルゴリズムである$textbfFast Direct$を提案する。
我々のFast Directはデータ多様体上に擬似ターゲットを構築し、拡散モデルのノイズシーケンスを普遍的な方向で更新する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:25:25 GMT)
Provable Sample-Efficient Transfer Learning Conditional Diffusion Models via Representation Learning [27.8] 我々は,表現学習のレンズを通して,伝達学習条件拡散モデルのサンプル効率を理解するための第一歩を踏み出した。
本分析は,ソースタスクからの表現を十分に学習することにより,対象タスクのサンプル複雑度を大幅に低減できることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:39:03 GMT)
Quantitative Insights into Large Language Model Usage and Trust in Academia: An Empirical Study [27.7] 大規模言語モデル(LLM)は、多くの学術分野において、文章、読み、教え、知識検索を変革している。
使用状況の正確な定量化,アウトプットに対するユーザの信頼,デプロイメントの優先順位付けに要する重要な問題に関する懸念などが求められます。
本研究は, 私立R1研究大学の125名の個人を対象に, LLMの使用状況, LLMのアウトプットに対する信頼度, 学界におけるロバストな利用を優先する重要な課題について調査した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:46:35 GMT)
Relational decomposition for program synthesis [27.6] プログラム合成におけるリレーショナルアプローチを提案する。
具体的には、トレーニングのインプット・アウトプットの例を、それぞれ入力事実と出力事実のセットに分解する。
提案手法は,4つの挑戦的合成データセット上で,既製の帰納型帰納論理プログラミング(ILP)システムを用いて実証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:58:03 GMT)
3D Prior is All You Need: Cross-Task Few-shot 2D Gaze Estimation [27.5] 本研究では,未確認デバイス上での2次元視線予測に事前学習した3次元視線推定ネットワークを適用することを目的とした,クロスタスクな2次元視線推定手法を提案する。
このタスクは、3Dと2Dの視線、未知の画面ポーズ、限られたトレーニングデータとのドメインギャップのため、非常に難しい。
我々は,MPIIGaze,EVE,GazeCaptureの各データセットに対して,それぞれノートパソコン,デスクトップコンピュータ,モバイルデバイス上で収集した手法を評価する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:37:09 GMT)
Generative Adversarial Networks Bridging Art and Machine Intelligence [27.5] この本は、確率論、統計学、ゲーム理論を含む数学的および理論的基盤を体系的に扱う。
この本は、ジェネレータや識別器におけるアーキテクチャの強化とタスク固有の適応をさらに検討し、高解像度画像生成における実践的な実装を示している。
結論のセクションでは、自己認識機構、トランスフォーマーベースの生成モデル、拡散モデルとの比較分析など、新たな研究動向に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:46:12 GMT)
EmoBench-M: Benchmarking Emotional Intelligence for Multimodal Large Language Models [27.2] EmoBench-Mは、マルチモーダル大言語モデル(MLLM)の感情知能(EI)能力を評価するために設計された新しいベンチマークである。
EmoBench-M上でのオープンソースとクローズドソース両方のMLLMの評価は、彼らと人間の間に大きなパフォーマンスギャップがあることを示している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:13:35 GMT)
GOProteinGNN: Leveraging Protein Knowledge Graphs for Protein Representation Learning [27.2] GOProteinGNNは、タンパク質知識グラフ情報を統合することにより、タンパク質言語モデルを強化する新しいアーキテクチャである。
我々のアプローチは、個々のアミノ酸レベルとタンパク質レベルの両方で情報の統合を可能にし、包括的で効果的な学習プロセスを可能にします。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:32:41 GMT)
BitAbuse: A Dataset of Visually Perturbed Texts for Defending Phishing Attacks [27.2] フィッシングはしばしば、セキュリティシステムをバイパスするために視覚的に混乱したテキストを通じて犠牲者を狙う。
本稿では,視覚的摂動を付加した実世界のフィッシング事例を含むBitAbuseデータセットを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:04:04 GMT)
Towards Cost-Effective Reward Guided Text Generation [27.1] Reward-guided Text Generation (RGTG) は、人間のフィードバックからオフラインで強化学習を行うための代替手段として登場した。
本稿では、Bradley-Terry損失を用いてトレーニングされた新たな報酬モデルアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:36:44 GMT)
Efficient Few-Shot Continual Learning in Vision-Language Models [26.9] 視覚言語モデル(VLM)は、視覚的質問応答や画像キャプションといったタスクに優れる。
VLMは、CLIPのような事前訓練されたイメージエンコーダの使用によって制限されることが多く、全体的なパフォーマンスを阻害する画像理解エラーを引き起こす。
本稿では,VLM内の画像エンコーダを選択的に更新する,堅牢で効率的なアルゴリズムであるLoRSUを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:20:55 GMT)
SoNIC: Safe Social Navigation with Adaptive Conformal Inference and Constrained Reinforcement Learning [26.6] SoNICは適応型共形推論と制約付き強化学習を統合する最初のアルゴリズムである。
本手法は,従来の最先端RL法よりも11.67%高い96.93%の成功率を達成する。
実験により,疎密な群集と密集した群集の両方と相互作用して,堅牢で社会的に礼儀正しく意思決定できることを示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:55:45 GMT)
On the Trustworthiness Landscape of State-of-the-art Generative Models: A Survey and Outlook [26.5] 拡散モデルと大きな言語モデルは、最先端の生成モデルとして現れている。
本稿は, プライバシ, 2) セキュリティ, 3) 公平性, 4) 責任という4つの基本的な側面において, モデルにまつわる長年の脅威と新興の脅威について検討する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:18:55 GMT)
Time-VLM: Exploring Multimodal Vision-Language Models for Augmented Time Series Forecasting [26.5] Time-VLMは、時間的、視覚的、テキスト的なモダリティを橋渡しして予測を強化する新しいフレームワークである。
本フレームワークは,(1)記憶バンク相互作用を通じて時間的特徴を抽出する検索型学習者,(2)時系列を情報的画像としてエンコードするビジョン型学習者,(3)文脈的テキスト記述を生成するテキスト型学習者,の3つのキーコンポーネントから構成される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:59:45 GMT)
Efficient Nearest Neighbor based Uncertainty Estimation for Natural Language Processing Tasks [26.3] モデル予測の信頼性は、現実世界の安全クリティカルなアプリケーションには不可欠である。
ディープニューラルネットワークは、誤校正などの不確実性推定の問題に悩まされることが多い。
我々は、近隣住民からの距離だけでなく、近隣住民のラベルの比率を用いて、最も近い隣人不確実性推定(k$NN-UE)を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:32:04 GMT)
Global Optimality and Finite Sample Analysis of Softmax Off-Policy Actor Critic under State Distribution Mismatch [26.2] 我々は、非政治アクター批評家アルゴリズムのグローバル最適性と収束率を確立する。
私たちの研究は、政策勾配法の最適性に関する既存の研究を超えています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:34:51 GMT)
ULPT: Prompt Tuning with Ultra-Low-Dimensional Optimization [26.2] 大規模言語モデルは最先端のパフォーマンスを実現するが、そのサイズのため微調整にはコストがかかる。
低次元空間におけるプロンプトを最適化する超低次元プロンプトチューニング(ULPT)を提案する。
提案する理論解析により, ランダム・プロジェクションは高階構造を効果的に捉えることができ, 実験結果から既存のパラメータ効率の手法に比べてUの競合性能が示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:00:29 GMT)
Counterfactual Query Rewriting to Use Historical Relevance Feedback [25.9] 本稿では,ユーザクエリの書き直し手法を提案する。
関連文書から抽出された用語でクエリを拡張するか、あるいは、関連文書を現在のコーパスの上位にランク付けするいわゆるキークエリを導出する。
CLEF LongEvalのシナリオでは、履歴関連フィードバックによるクエリの書き直しにより、検索効率が向上し、計算コストの高いトランスフォーマーベースのアプローチよりも優れた結果が得られる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:05:41 GMT)
Gaze-Assisted Human-Centric Domain Adaptation for Cardiac Ultrasound Image Segmentation [25.5] 提案フレームワークは,GAN法および他の自己訓練法よりも,対象領域においてより効率的に心臓超音波像を分割することができる。
実験の結果,本フレームワークは,GAN法や他の自己訓練法よりも,対象領域でより効率的に心エコー像を分割できることがわかった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:08:34 GMT)
Adaptive Margin Contrastive Learning for Ambiguity-aware 3D Semantic Segmentation [25.3] 本稿では,3Dポイントクラウドセマンティックセマンティックセグメンテーション,すなわちAMContrast3Dの適応的マージン比較学習法を提案する。
我々は,各点のアンビグニティレベルに基づいて適応目標を設計し,低アンビグニティポイントの正しさを確保しつつ,高アンビグニティポイントのミスを許容することを目的とした。
大規模データセットであるS3DISとScanNetの実験結果から,本手法が最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:39:16 GMT)
Orthogonal Representation Learning for Estimating Causal Quantities [25.1] 我々は,表現レベルで定義された因果量に対するNeyman-orthogonal Learningerのクラスを提案し,そのクラスをOR-learnersと呼ぶ。
学習した表現に基づいて因果量の一貫した推定を可能にし、二重ロバスト性や準オーラル効率などの理論的性質を提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:18:48 GMT)
Model-agnostic meta-learners for estimating heterogeneous treatment effects over time [24.9] パーソナライズド医療などの多くの分野において、時間とともにヘテロジニアス治療効果(HTE)を推定することが重要である。
モデルに依存しないメタラーナーをいくつか提案し、任意の機械学習モデルと組み合わせて使用することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:39:27 GMT)
Performative Prediction with Neural Networks [24.9] パフォーマンス予測は、予測するデータに影響を与えるモデルを学習するためのフレームワークである。
繰り返しリスク最小化法を用いて、性能的に安定な分類器を見つけるための標準収束結果は、データの分布がモデルのパラメータに連続であることを仮定する。
この研究では、データ分布はモデルの予測に関してリプシッツ連続であると仮定する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:59:25 GMT)
Verifiable Format Control for Large Language Model Generations [24.8] LLM(Large Language Models)は、一般的な命令に従う能力を満たすことを実証している。
約7B のパラメータを持つ小さな LLM は、よりきめ細かいフォーマット(例えば、検証可能なフォーマット)に苦慮する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:57:36 GMT)
Understanding and Mitigating the Bias Inheritance in LLM-based Data Augmentation on Downstream Tasks [24.7] この研究は、バイアス継承を理解し、分析し、緩和する最初の体系的な研究である。
6種類のバイアスが、異なるバイアス比でどのように現れるかを分析する。
トークンベース,マスクベース,損失ベースの3つの緩和戦略を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:20:58 GMT)
Uni-NaVid: A Video-based Vision-Language-Action Model for Unifying Embodied Navigation Tasks [24.7] 既存のボディードナビゲーションのモデルは、現実の世界で実践的なジェネラリストとして機能するには足りていない。
多様な具体的ナビゲーションタスクを統合するために設計された,ビデオベースの視覚言語アクションモデルであるUni-NaVidを提案する。
Uni-NaVidは、一般的に使われているすべてのナビゲーションタスクの入力および出力データ構成によってこれを達成している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:14:36 GMT)
SMART: Advancing Scalable Map Priors for Driving Topology Reasoning [24.6] トポロジー推論は、車線と交通要素間の接続と関係の包括的理解を可能にするため、自動運転にとって不可欠である。
近年,車両搭載センサを用いた運転トポロジの知覚に成功している。
スケーラブルな車線知覚とトポロジー推論の鍵となる要素は、このセンサ依存的特徴の排除である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:57 GMT)
Learning Real-World Action-Video Dynamics with Heterogeneous Masked Autoregression [24.0] 本稿では,アクション・ビデオ・ダイナミックスをモデル化するためのヘテロジニアス・マスケッド・オートレグレス(HMA)を提案する。
ポストトレーニング後、このモデルは、ポリシーを評価し、合成データを生成するためのビデオシミュレータとして使用できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:38:26 GMT)
SPRec: Self-Play to Debias LLM-based Recommendation [23.9] 大規模言語モデル(LLM)はレコメンデーションシステムにおいて大きな注目を集めている。
SPRecは、過剰勧告を緩和し、追加のデータや手動による介入を必要とせずに公平性を向上させるために設計された新しいセルフプレイフレームワークである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:03:33 GMT)
Twilight: Adaptive Attention Sparsity with Hierarchical Top-$p$ Pruning [23.6] Twilightは、既存のスパースアテンションアルゴリズムに適応性をもたらすフレームワークである。
Twilightは、冗長トークンの少なくとも98%で適応的にプルーし、自己アテンション操作で15.4タイム=アクセラレーション、トークン毎のエンドツーエンドでのアクセラレーションで3.9タイム=アクセラレーションを実現している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:16:00 GMT)
MOL-Mamba: Enhancing Molecular Representation with Structural & Electronic Insights [23.6] MOL-Mambaは構造的および電子的洞察を組み合わせることで分子表現を強化するフレームワークである。
MOL-Mambaは11の化学生物学的分子データセットで最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:31:44 GMT)
Action-Free Reasoning for Policy Generalization [23.3] RAD(Action-free Data)による推論は、ロボットのデモデータとアクションフリーのビデオデータの両方から学習する。
RADはエボディメントギャップを越えて効果的な移動を可能にし、ロボットはアクションフリーのデータでしか見えないタスクを実行できる。
我々は、Bridge V2ベンチマークと互換性のある推論アノテーションを備えた、3,377人の人手によるデモの新しいデータセットをリリースする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:43:23 GMT)
The Cake that is Intelligence and Who Gets to Bake it: An AI Analogy and its Implications for Participation [22.9] 機械学習は、教師なし学習がベースとなり、教師なし学習がアイシングを追加し、強化学習がトップのチェリーとなる。
私たちは、単純な構造的なメタファからAIシステムの完全なライフサイクルまで、この「インテリジェンスであるケーキ」のアナロジーを拡張します。
本稿では、各ステップの社会的影響と、それらが機械学習内の統計的仮定によってどのように束縛されているかを説明する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:53:09 GMT)
Temporally Guided Articulated Hand Pose Tracking in Surgical Videos [22.8] アーティキュレートされた手ポーズ追跡は、多くのアプリケーションで使用可能な可能性を秘めている未発見の問題である。
提案する手ポーズ推定モデルであるCondPoseは,その予測に先立ってポーズを組み込むことで,検出と追跡の精度を向上させる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:04:38 GMT)
How vulnerable is my policy? Adversarial attacks on modern behavior cloning policies [22.5] 本稿では,LfD(Learning from Demonstration)アルゴリズムに対する敵対的攻撃の包括的研究について述べる。
我々は,これらの手法の脆弱性について,標的外,標的外,普遍的摂動に対する検討を行った。
いくつかのロボット操作のシミュレーション実験により、現在の手法のほとんどは敵の摂動に非常に弱いことが判明した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:17:39 GMT)
ReactEmbed: A Cross-Domain Framework for Protein-Molecule Representation Learning via Biochemical Reaction Networks [22.2] この研究は、分子とタンパク質間の相互作用を含む生化学反応を統合することで表現を強化する。
ReactEmbedは、コントラスト学習を通じて統合的な埋め込み空間を作成する新しい方法である。
薬物-標的相互作用,タンパク質-タンパク質相互作用,タンパク質特性予測,分子特性予測など,さまざまなタスクにまたがるReactEmbedの評価を行った。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:18:35 GMT)
Improving Adversarial Robustness via Phase and Amplitude-aware Prompting [22.1] 本稿では,深層ニューラルネットワークのための位相・振幅対応型プロンプティング(PAP)ディフェンスを提案する。
具体的には、各クラスに対して位相レベルおよび振幅レベルのプロンプトを構築し、モデルの頑健な性能に応じてプロンプトの重みを調整する。
テスト中、予測ラベルを用いて各画像に対するプロンプトを選択して、最終的な予測を得るためにモデルに入力されたインプット画像を取得する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:43:34 GMT)
Generalizing Weisfeiler-Lehman Kernels to Subgraphs [22.1] グラフ表現学習は様々な現実世界の問題を解決するのに有効である。
現在のグラフニューラルネットワーク(GNN)は、サブグラフレベルのタスクに対して最適な結果を生成する。
我々は、$k$-hop近傍にWLアルゴリズムを適用することで、サブグラフに一般化されたカーネルであるWLKSを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:51:42 GMT)
"It Warned Me Just at the Right Moment": Exploring LLM-based Real-time Detection of Phone Scams [22.0] 本稿では,スカムコールをモデル化するフレームワークを提案し,LLMに基づくリアルタイム検出手法を提案する。
提案手法の性能評価と,その有効性に影響を及ぼす要因の解析を行った。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:57:05 GMT)
EVQAScore: A Fine-grained Metric for Video Question Answering Data Quality Evaluation [21.8] 本稿では,ビデオキャプションとビデオQAデータ品質の両方を評価するためにキーワード抽出を利用する参照フリー手法EVQAScoreを紹介する。
提案手法は,Kendall相関32.8,Spearman相関42.3,従来のPAC-S++よりも4.7,5.9,動画キャプション評価5.9)。
データ選択にEVQAScoreを用いることで、元のデータボリュームのわずか12.5%でSOTA結果を達成し、以前のSOTA手法であるPAC-Sと100%のデータより優れていた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:12:38 GMT)
SoK: Benchmarking Poisoning Attacks and Defenses in Federated Learning [21.7] フェデレートラーニング(FL)は、データのプライバシを維持しながら協調的なモデルトレーニングを可能にするが、その分散された性質は、それをクライアント側データ中毒攻撃(DPA)とモデル中毒攻撃(MPAs)に公開する。
本稿では、DPAとMPAに対する防御を統一したベンチマークと分析し、これら2つの類似しているがわずかに異なるドメインの区別を明らかにすることを目的とする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:05:00 GMT)
Long-context Language Models Are Not Good At ALL Retrieval Tasks Without Sufficient Steps [21.7] 長期コンテキスト言語モデル (LCLM) は、その広範囲なコンテキストウインドウによって特徴付けられるようになった。
通常の長文検索タスクでは完璧に近いが,2つの基本事例では不十分であることが評価された。
特定のCoTプロンプトによって導かれる十分な数の推論ステップで、うまく対処できることが分かりました。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:56:00 GMT)
Principal Curvatures Estimation with Applications to Single Cell Data [21.5] 多様体学習における一般的な方法は、データセットが下次元多様体上にあるという仮説である。
本研究では,固有曲率の様々な概念を正確に推定するデータ駆動手法であるAdaptive Local PCA(AdaL-PCA)を提案する。
試料表面におけるAdaL-PCAの評価は最先端の結果を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:23:31 GMT)
VICON: A Foundation Model for Multi-Physics Fluid Dynamics via Vision In-Context Operator Networks [21.1] In-Context Operator Networks (ICON) は、数ショットのインコンテキストアプローチを使用して、異なるタイプのPDEをまたいだ演算子を学習する。
我々は,パッチワイズ操作により2次元関数を効率的に処理するビジョントランスフォーマーアーキテクチャを組み込んだITS(Vision In-Context Operator Networks)を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:11:51 GMT)
DiffZOO: A Purely Query-Based Black-Box Attack for Red-teaming Text-to-Image Generative Model via Zeroth Order Optimization [21.0] 適切なコンテンツを生成するためのT2Iモデルの能力を拡張または公開するために、レッドチーム攻撃法が提案されている。
我々は,ゼロ次最適化を勾配近似に応用し,C-PRVとD-PRVの両方を用いて攻撃プロンプトを強化するDiffZOOを提案する。
複数の最先端安全メカニズムの実験により、DiffZOOは以前の作業よりも平均攻撃成功率が8.5%高いことが示されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:37:01 GMT)
Bench4Merge: A Comprehensive Benchmark for Merging in Realistic Dense Traffic with Micro-Interactive Vehicles [20.8] 我々は,統合シナリオにおける動作計画能力を評価するためのベンチマークを開発する。
我々のアプローチには、微小な行動特性を持つ大規模データセットで訓練された他の車両が含まれる。
大規模な実験は、この評価ベンチマークの高度な性質を実証した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:05:26 GMT)
Boosting Source Code Learning with Text-Oriented Data Augmentation: An Empirical Study [20.8] そこで本研究では,自然言語テキストを対象としたデータ拡張手法の有効性について検討する。
以上の結果から,より正確で堅牢なソースコード学習モデルを実現する具体的なデータ拡張手法が明らかとなった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:34:26 GMT)
Biogeochemistry-Informed Neural Network (BINN) for Improving Accuracy of Model Prediction and Scientific Understanding of Soil Organic Carbon [20.2] バイオゲオケミカルインフォームドニューラルネットワーク(BINN)を開発し,ビッグデータから機械的知識を抽出する。
BINNは、米国全体で観測されたSOCプロファイル25,925から、土壌炭素循環を調節する6つの主要なプロセスを予測する。
BINNにおけるニューラルネットワークとプロセスベースモデルの統合により、計算効率は ProDA の50倍以上向上する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:41:16 GMT)
G-Adaptivity: optimised graph-based mesh relocation for finite element methods [20.2] メッシュ再配置(r適応性)は、メッシュ幾何学を最適化し、与えられた計算予算で最適解の精度を得る。
最近の機械学習のアプローチは、そのような古典的な手法のための高速なサロゲートの構築に焦点を当てている。
有限要素法(FEM)における最適メッシュ転位を実現するための,新しい,効果的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:58:00 GMT)
Large Vision-Language Model Alignment and Misalignment: A Survey Through the Lens of Explainability [20.1] LVLM(Large Vision-Language Models)は、視覚情報とテキスト情報の両方を処理する際、顕著な能力を示す。
本調査では,LVLMのアライメントとアライメントについて,説明性レンズを用いて総合的に検討した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:42:25 GMT)
The Order Effect: Investigating Prompt Sensitivity in Closed-Source LLMs [19.8] 本稿では,大規模言語モデル(LLM)における順序感度の程度について検討する。
その結果,入力順序はタスク間の性能に大きく影響し,シャッフルされた入力は出力精度を測定不能に低下させることがわかった。
ショットプロンプトは複雑な効果を示し、部分緩和を提供するが、問題は完全な解決には至らなかった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:14:02 GMT)
MRAMG-Bench: A BeyondText Benchmark for Multimodal Retrieval-Augmented Multimodal Generation [19.7] 本稿では,MRAMG(Multimodal Retrieval-Augmented Multimodal Generation)タスクを紹介する。
このタスクは、コーパス内のマルチモーダルデータを完全に活用して、テキストと画像の両方を組み合わせた回答を生成することを目的としている。
MRAMG-Benchは,統計およびLLMに基づくメトリクスの包括的スイートである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:07:24 GMT)
Mediator: Memory-efficient LLM Merging with Less Parameter Conflicts and Uncertainty Based Routing [19.7] モデルマージ集約 さまざまなタスクに微調整された大きな言語モデルから、より強力なものへ。
本研究では,異なる層がパラメータ衝突のレベルが異なることを観察する。
この洞察に基づいて構築され、大きな矛盾のあるレイヤに対して、新しいタスクレベルのエキスパートルーティングを使用します。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:26:30 GMT)
Variational Control for Guidance in Diffusion Models [19.5] 本稿では,DTM(Diffusion Trajectory Matching)を提案する。
DTMは幅広いガイダンス手法を統一し、新しいインスタンス化を可能にする。
例えば、ImageNetの非線形デブロアリングにおいて、我々のモデルはFIDスコア34.31を達成し、最高の事前訓練されたベースライン(FID 78.07)よりも大幅に改善した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:24:39 GMT)
Understanding Self-Supervised Learning via Gaussian Mixture Models [19.5] 本研究では,ガウス混合モデルにおける自己教師付き学習を自然な文脈で分析する。
ガウスアンが等方的でない場合でも、バニラコントラスト学習が最適の下次元部分空間を見つけることができることを示す。
この設定では、対照的な学習が漁師最適部分空間のサブセットを学習し、学習した表現から全てのノイズを効果的に除去することを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:48:27 GMT)
Fast Video Generation with Sliding Tile Attention [19.5] たった5秒の720P動画を撮ると、945秒の推測時間のうち800秒は注意がかかります。
本稿では,この課題に対処するためにスライディングタイルアテンション(STA)を導入する。
STAは、新しいハードウェア対応のスライディングウィンドウデザインでタイル・バイ・タイルを運用している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:17:09 GMT)
Identify Critical KV Cache in LLM Inference from an Output Perturbation Perspective [19.4] 重要なKVキャッシュエントリを識別するための摂動制約付き選択アルゴリズムを提案する。
提案アルゴリズムは,Llamaモデルにおいて,92%以上のアテンションヘッドにおける低出力摂動を実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:31:47 GMT)
Boosting Knowledge Graph-based Recommendations through Confidence-Aware Augmentation with Large Language Models [19.3] 大きな言語モデル(LLM)は、レコメンデーションタスクのための知識グラフの品質と関連性を改善するための有望な方法を提供する。
本稿では,KG と LLM を組み合わせた新しいフレームワークである LLM Augmentation (CKG-LLMA) を用いた Confidence-aware KG-based Recommendation Framework を提案する。
本フレームワークは,(1)高品質な情報でKGをリッチ化するためのLLMベースのサブグラフ拡張器,(2)ノイズの多い三重項をフィルタリングする信頼性に配慮したメッセージ伝搬機構,(3)ユーザ-テムインタラクションとKGデータを統合するための2視点コントラスト学習手法を含む。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:06:48 GMT)
Collapse or Thrive? Perils and Promises of Synthetic Data in a Self-Generating World [19.3] 生成機械学習モデルは、以前のモデルによって生成されたデータを含むWebスケールデータセットで事前訓練される。
先行研究の中には、ウェブが合成データに圧倒されているため、"モデル崩壊"を警告するものもある。
本稿では,3つの生成モデルタスクセットにまたがるデータ(トレーニング・ワークフロー)の3つの使い方について実験を行った。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:43:54 GMT)
Measuring Physical Plausibility of 3D Human Poses Using Physics Simulation [19.3] 本研究では,任意の3次元姿勢推定モデルから予測された3次元ポーズの物理的妥当性と安定性を捉えるための2つの指標を提案する。
物理シミュレーションを用いて,既存の可視性測定値との相関と運動時の安定性の測定を行う。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:15:49 GMT)
ConceptAttention: Diffusion Transformers Learn Highly Interpretable Features [19.2] ConceptAttentionは、画像内のテキスト概念を正確に特定する高品質な唾液マップを生成する。
ゼロショット画像セグメンテーションベンチマークでは、最先端のパフォーマンスも達成している。
私たちの研究は、FluxのようなマルチモーダルなDiTモデルの表現が、セグメンテーションのようなビジョンタスクや、CLIPのようなマルチモーダルな基礎モデルよりも優れているという最初の証拠に貢献しています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:00 GMT)
Vec2Face: Scaling Face Dataset Generation with Loosely Constrained Vectors [19.0] Vec2Faceは、サンプルベクターのみを入力として使用する総合モデルである。
Vec2Faceは最大300KのIDを生成する。
Vec2Faceは5つの実世界のテストセットにおいて、最先端の精度を92%から93.52%に向上させる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:53:15 GMT)
Beyond Interpolation: Extrapolative Reasoning with Reinforcement Learning and Graph Neural Networks [19.0] 本研究では, アーキテクチャの帰納バイアス, 異なる報酬システム, 逐次推論を実現する上での反復モデリングの役割に焦点をあてる。
これらの要素が、ますます複雑なパズルに対する外挿の成功にどのように貢献するかを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:07:35 GMT)
Mechanisms of Projective Composition of Diffusion Models [18.8] 本研究では,拡散モデルにおける構成の理論的基礎について考察し,分布外分布と長さ一般化に着目した。
作文が「仕事」を意味するかは明らかになっていない。
本研究では,(1)線形スコアの組み合わせが射影合成を確実に達成した場合,(2)逆拡散サンプリングが所望の合成を生成できるか否か,(3)合成が失敗する条件について検討する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:59:54 GMT)
Ensemble Value Functions for Efficient Exploration in Multi-Agent Reinforcement Learning [18.8] マルチエージェント強化学習(MARL)は、エージェントが広い共同行動空間内で探索する必要がある。
EMAXは価値ベースのMARLアルゴリズムをシームレスに拡張するフレームワークである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:31:32 GMT)
On the Benefits of Active Data Collection in Operator Learning [18.0] 対象演算子が線形であるとき,演算子学習のためのアクティブデータ収集戦略について検討する。
アクティブなデータ収集戦略により、共分散カーネルの固有値の減衰率の観点から誤差収束率を確立する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:46:40 GMT)
Controlling Statistical, Discretization, and Truncation Errors in Learning Fourier Linear Operators [18.0] 本稿では,Fourier Neural Operatorアーキテクチャの線形層をモデル問題として,演算子学習の学習理論の基礎について考察する。
まず, 有限標本サイズによる統計的誤差, 演算子の有限階近似からの切り出し誤差, 有限個の領域点上の関数データを扱うことによる離散化誤差の3つの主な誤差を同定する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:22:08 GMT)
Generalization analysis of an unfolding network for analysis-based Compressed Sensing [17.8] 展開ネットワークは、圧縮センシング(CS)分野において有望な結果を示している。
我々は最先端ADMMベースの展開ネットワークの一般化解析を行う。
提案手法は理論的な結果に適合し,ベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:22:03 GMT)
Efficient Over-parameterized Matrix Sensing from Noisy Measurements via Alternating Preconditioned Gradient Descent [17.7] 行列センシング問題の収束を早めるためのプレコンディショニング手法が提案されている。
本稿では,2因子パラメータを交互に更新するAPGDアルゴリズムを提案する。
理論的には、任意の乱数から始まる線形速度で APGD が準最適収束を達成することを証明している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:32:10 GMT)
Training Bilingual LMs with Data Constraints in the Targeted Language [17.6] 本研究では,事前学習データ不足を伴う対象言語における事前学習モデルの性能向上について検討する。
本研究では,データ豊富な補助言語におけるトレーニングとデータ間のパフォーマンスギャップを,対象言語のトレーニングと比較して定量化する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:36:12 GMT)
Dolphin: A Programmable Framework for Scalable Neurosymbolic Learning [17.6] 我々はPythonでニューロシンボリックプログラムをサポートするフレームワークであるDolphinを紹介した。
13のベンチマークでテキスト、画像、ビデオデータにまたがるタスクを網羅し、Dolphinは最先端のアキュラシーに収束する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:52:46 GMT)
On the expressiveness and spectral bias of KANs [17.4] 深層学習モデルであるMLP(Multi-layer perceptron)のアーキテクチャバックボーンの代替として,kanが提案されている。
カンは科学のためのAIの様々なタスクで成功しており、その経験的効率性と精度は、関数回帰、PDE解決、そして多くの科学的な問題で実証されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:49:32 GMT)
The Best Instruction-Tuning Data are Those That Fit [17.4] 事前訓練された大言語モデル(LLM)から強機能を引き出すためには,SFT(Supervised Fine-tuning)データが必要である。
GRAPE*は,対象モデルの特異な特徴を考慮に入れた,新しいSFTフレームワークである。
各命令に対して、様々なLSMからの応答を収集し、ターゲットモデルによって測定された最も高い確率の命令を選択する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:31:21 GMT)
No Images, No Problem: Retaining Knowledge in Continual VQA with Questions-Only Memory [17.4] VQACL(Continuous Learning in Visual Question Answering)は、新しい視覚言語タスク(可塑性)を学習するモデルを必要とする。
既存の手法は、主に一助的なタスクのために設計されており、これらの要求を効果的にバランスをとるのに苦労することが多い。
Intention Distillation (QUAD) を用いたQUestion-only replay(QUestion-only replay with Attention Distillation)を導入する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:37:43 GMT)
On the Expressive Power of Subgraph Graph Neural Networks for Graphs with Bounded Cycles [17.3] この研究は、最大$k$までの距離を持つ隣人からの情報を集約する$k$-hopサブグラフGNNを調査します。
我々は、$k$ホップ部分グラフ GNN がグラフ上の置換不変/同変連続関数を任意の誤差許容範囲内で2k+1$以上のサイクルなしで近似できることを証明した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:25:22 GMT)
What Secrets Do Your Manifolds Hold? Understanding the Local Geometry of Generative Models [17.3] 本研究では,学習多様体の局所幾何学とその生成結果との関係について検討する。
筆者らは,与えられた潜伏像対に対して,局所記述子は生成モデルによる生成美学,多様性,記憶の指標であることを示す定量的および定性的な証拠を提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:30:06 GMT)
Adapting Human Mesh Recovery with Vision-Language Feedback [17.3] 視覚言語モデルを用いて対話的な身体部分記述を生成する。
我々はテキストエンコーダとポーズVQ-VAEをトレーニングし、テキストを共有潜在空間内のボディポーズにアライメントする。
モデルは正確な3D知覚と画像の一貫性を持ったポーズを生成することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:42:00 GMT)
Multi-agent Architecture Search via Agentic Supernet [17.2] 大規模言語モデル(LLM)を利用したマルチエージェントシステムは、個々のエージェントの認知的境界を拡張する。
エージェントの設計を自動化する方法が利用可能であるにもかかわらず、彼らは通常、静的で複雑で、1サイズに適したシステムを見つけ出そうとする。
スーパーネットからクエリ依存エージェントシステムをサンプリングする自動フレームワークであるMASを紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:12:06 GMT)
Taking A Closer Look at Interacting Objects: Interaction-Aware Open Vocabulary Scene Graph Generation [16.9] 対話型OVSGGフレームワークINOVAを提案する。
事前トレーニングでは、対話対象と非対話対象を区別するために、対話対応のターゲット生成戦略を採用している。
INOVAは、相互作用するオブジェクトペアを背景から遠ざけることで堅牢性を高めるために、相互作用一貫性のある知識蒸留を備えている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:18:06 GMT)
HOG-Diff: Higher-Order Guided Diffusion for Graph Generation [16.9] グラフ生成は、複雑な非ユークリッド構造を深く理解する必要があるため、重要な課題である。
本稿では,高次情報を用いた高次誘導拡散モデルを提案する。
我々のモデルは古典的な拡散フレームワークよりも強力な理論的保証を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:51:14 GMT)
TruthFlow: Truthful LLM Generation via Representation Flow Correction [16.6] 大規模言語モデル(LLM)は、一貫して真理応答を生成するのに苦労していることが知られている。
本稿では,クエリ固有の真理表現補正にFlow Matching技術を活用する新しい方法であるTruthFlowを紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:10:14 GMT)
ACCORD: Closing the Commonsense Measurability Gap [16.6] ACCORDは、大規模言語モデル(LLM)の共通理解基盤と推論能力の分離のためのフレームワークである
形式的要素をコモンセンス推論に導入し、典型的な 1 または 2 ホップを超えて、推論の複雑さを明示的に制御し、定量化する。
任意の推論複雑性のベンチマークを自動的に生成するので、将来のLLMの改善に合わせてスケールすることができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:10:47 GMT)
A Theoretical Framework for Data Efficient Multi-Source Transfer Learning Based on Cramér-Rao Bound [16.5] 対象モデルを共同でトレーニングするために、各ソースタスクから必要なソースサンプルの最適な量は何か?
具体的には、クロスエントロピー損失と整合する一般化誤差尺度を導入し、Cram'er-Rao界に基づいて最小化して、各ソースタスクの最適な転送量を決定する。
我々はアーキテクチャに依存しないデータ効率のアルゴリズムOTQMSを開発し、深層多元移動学習モデルの学習のための理論的結果を実装した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:32:49 GMT)
"Short-length" Adversarial Training Helps LLMs Defend "Long-length" Jailbreak Attacks: Theoretical and Empirical Evidence [16.5] 本論では, 対人的ジェイルブレイク攻撃に着目し, 対人的ジェイルブレイク攻撃に対して, 対人的ジェイルブレイク攻撃を$Theta(M)$で防御するには, 対人的ジェイルブレイク攻撃を$Theta(sqrtM)$で防御するには, 対人的ジェイルブレイク攻撃を$Theta(M)$で防御するには十分であることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:44:26 GMT)
Graph-Enhanced EEG Foundation Model [16.3] 本稿では,時間情報とチャネル間情報を統合した新しい脳波基盤モデルを提案する。
我々のアーキテクチャはグラフニューラルネットワーク(GNN)とマスク付きオートエンコーダを組み合わせることで,効率的な事前学習を実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:25:04 GMT)
Aggregate and conquer: detecting and steering LLM concepts by combining nonlinear predictors over multiple layers [16.3] 本稿では,大規模言語モデルの内部アクティベーションにおける意味概念の検出方法を提案する。
提案手法は,所望の出力に対するLPMのステアリングに容易に適用可能であることを示す。
我々は LLM を新たな概念に推し進めることで,我々のアプローチの一般性を強調した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:41:48 GMT)
My LLM might Mimic AAE -- But When Should it? [16.2] 大型言語モデル(LLM)におけるアフリカ系アメリカ人英語の表現について検討する。
LLMの出力にAAEが適切かどうかを判断する上で、黒人は選択と自律性を好む。
LLMは、フォーマルな設定でメインストリームの英語で通信することをデフォルトとし、よりフォーマルな設定でAEの生産に関心を抱いた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:38:29 GMT)
Evaluating Numerical Reasoning in Text-to-Image Models [16.0] 難易度が異なる数値推論課題におけるテキスト・ツー・イメージ・モデルの評価を行った。
もっとも先進的なモデルでさえ、初歩的な数値スキルしか持たないことを示す。
数値推論評価のための新しいベンチマークであるGeckoNumにプロンプト、生成された画像、人間のアノテーションをバンドルする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:42:23 GMT)
Unravelling Causal Genetic Biomarkers of Alzheimer's Disease via Neuron to Gene-token Backtracking in Neural Architecture: A Groundbreaking Reverse-Gene-Finder Approach [15.9] アルツハイマー病(AD)は世界中で5500万人以上に影響を与えるが、重要な遺伝要因はいまだに理解されていない。
ニューラルネットアーキテクチャにおけるリバースジェネレーション・ファインダー(Reverse-Gene-Finder)は、ADオンセットを駆動する新しい因果遺伝子バイオマーカーの解明を目的としている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:24:02 GMT)
Private Federated Learning In Real World Application -- A Case Study [15.9] 本稿では,エッジデバイス上でのPFL(Private Federated Learning)を用いた機械学習モデルトレーニングの実装について述べる。
本稿では,ユーザのプライベートデータを用いたモデルトレーニングの課題に対処するために,PFLを用いた新しいフレームワークを提案する。
このフレームワークは、ユーザーデータが個々のデバイスに留まることを保証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:38:50 GMT)
Multimodal Medical Code Tokenizer [15.8] 既存のトークン化器は、EHRからの医療コードを独立したテキストトークンとして扱う。
医療用語には60,000以上のコードが含まれており、臨床推論に重要な情報を持っている。
我々はMedTokを紹介した。MedTokはマルチモーダルな医療用コードトークンで、コードのテキスト記述とリレーショナルコンテキストを利用する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:58:09 GMT)
LR0.FM: Low-Resolution Zero-shot Classification Benchmark For Foundation Models [15.8] 視覚言語基礎モデル(FM)は、様々なタスクにまたがる顕著なゼロショットの一般化を示す。
低解像度/ピクセル化(LR)画像は、現実世界のシナリオでよく見られる課題であり、まだ探索されていない。
66個のバックボーンと15個のデータセットにわたる10個のFM(s)のゼロショット分類性能に対する低解像度の影響を評価するベンチマークであるLR0.FMを紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:40:42 GMT)
DEALing with Image Reconstruction: Deep Attentive Least Squares [15.7] 本稿では,古典的チコノフ正則化にインスパイアされたデータ駆動型再構成手法を提案する。
本手法は2次問題の系列を解くことによって中間的再構成を反復的に洗練する。
本手法は,先進的なプラグアンドプレイおよび学習正規化手法と同等の性能を実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:43:28 GMT)
Privacy Token: Surprised to Find Out What You Accidentally Revealed [15.7] プライバシーに敏感なドメインにおけるディープラーニングモデルは、プライバシーリスクに関する懸念を増幅している。
トレーニング中にプライベート勾配から直接導出されるプライバシートークンの概念を提案する。
プライバシートークンは、トレーニングデータからのプライベート情報漏洩の程度に関する貴重な洞察を提供する。
我々は、トレーニングデータと勾配の関係を定量化するために、Mutual Information (MI) をロバストな指標として採用する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:33:11 GMT)
ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNs [15.4] 混合精度量子化は、ディープニューラルネットワーク(DNN)の実行を最適化する重要な技術となっている。
異なる逆方向の摂動に耐えるモデルの能力に関する証明可能な保証を提供する認証された堅牢性は、量子化において対処されることはめったにない。
本稿では、革新的な混合精度量子化法であるARQを紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:40:41 GMT)
ColPali: Efficient Document Retrieval with Vision Language Models [15.4] 我々は、複数のドメイン、言語、実用的な設定にまたがる様々なページレベルの検索タスクからなるVisual Document Retrieval Benchmark ViDoReを紹介する。
現代のシステムの本質的な複雑さと性能上の欠点は、ドキュメントページのイメージを直接埋め込むことで文書検索を行うという新しい概念を動機付けている。
文書ページの画像から高品質なマルチベクトル埋め込みを生成するために訓練されたビジョン言語モデルColPaliをリリースする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:57:56 GMT)
Foundation Models in Radiology: What, How, When, Why and Why Not [15.3] 人工知能の最近の進歩は、テキストデータと画像データの両方を解釈、生成できる大規模ディープラーニングモデルの出現を目撃している。
ファウンデーションモデルは近年、学術、産業、規制機関から大きな注目を集めている。
本論は,基礎モデルに関する標準化された用語を確立することを目的としている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:34:37 GMT)
A Novel Characterization of the Population Area Under the Risk Coverage Curve (AURC) and Rates of Finite Sample Estimators [15.3] AURC(Area Under the Risk-Coverage Curve)は、SCシステムの性能を評価するための最前線評価指標として登場した。
有限サンプルシナリオに対する実験的なAURCプラグイン推定器を導出する。
複数のデータセットにまたがる実験により,推定器の有効性を実証的に検証した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:22:18 GMT)
Blackwell's Approachability with Approximation Algorithms [15.3] プレイヤーと相手のベクター値の繰り返しゲームを考える。
プレイヤーのセットのみに近似アルゴリズムが組み込まれている場合、よりシンプルで効率的なアルゴリズムが提供される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:54:00 GMT)
XAttnMark: Learning Robust Audio Watermarking with Cross-Attention [15.2] クロスアテンションロバスト音響透かし(XAttnMark)
本稿では,ジェネレータと検出器間の部分パラメータ共有を利用してギャップを埋めるクロスアテンションロバスト音響透かし(XAttnMark)を提案する。
本研究では, 聴覚マスキング効果の微粒化を捉え, 透かしの受容性を向上する心理音響整列型時間周波数マスキング障害を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:15:08 GMT)
Self-Training Meets Consistency: Improving LLMs' Reasoning with Consistency-Driven Rationale Evaluation [15.1] 大規模言語モデル(LLM)の自己学習アプローチは、自己生成的理性に基づいてモデルをトレーニングすることで推論能力を向上させる。
これまでのアプローチでは、与えられた質問に対する正しい答えをトレーニングに適するように、合理的にラベル付けしてきた。
CREST(Consistency-driven Rationale Evaluation for Self-Training)は,フォローアップ質問を通じて各根拠を更に評価する自己学習フレームワークである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:07:28 GMT)
Understanding and Supporting Formal Email Exchange by Answering AI-Generated Questions [14.9] 電子メールに返信するためのQAベースのアプローチを提案し,評価する。
試作システムであるResQを開発し,12と8人の参加者を対象に制御およびフィールド実験を行った。
その結果、QAベースのアプローチは、電子メールへの返信の効率を改善し、作業負荷を削減できることを示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:27:09 GMT)
Aligner-Encoders: Self-Attention Transformers Can Be Self-Transducers [14.9] 近年採用されているトランス方式のエンコーダは,フォワードパス中に内部的にアライメントを行うことができることを示す。
この新たな現象により、よりシンプルで効率的なモデル"Aligner-Encoder"が実現される。
我々は,芸術の状況に非常に近い性能を実証する実験を行った。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:09:52 GMT)
Fact-Aware Multimodal Retrieval Augmentation for Accurate Medical Radiology Report Generation [14.9] 正確な放射線診断レポートを生成するために,ファクトアウェアなマルチモーダル検索拡張パイプラインを導入する。
私たちはまずRadGraphを活用して実例レポートペアを抽出し、次に実例知識を統合してユニバーサルなマルチモーダルレトリバーをトレーニングします。
実験により,我々のマルチモーダルレトリバーは,言語生成と放射線学固有の指標の両方において最先端のレトリバーより優れていることが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:51:07 GMT)
M$^3$PC: Test-time Model Predictive Control for Pretrained Masked Trajectory Model [14.8] 本稿では,モデル予測制御(MPC)を用いて,モデル自体の予測能力を利用して行動選択を誘導する手法を提案する。
MPCは、追加パラメータトレーニングなしで事前訓練された軌道モデルの意思決定性能を著しく改善する。
私たちのフレームワークは、オフラインからオンライン(O2O)のRLやゴールリーチのRLに適応することができます。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:39:31 GMT)
The Role of Network and Identity in the Diffusion of Hashtags [14.5] この研究は、ハッシュタグカスケードの基礎となるメカニズムを分解するための新しいフレームワークを提供する。
我々は、文化的イノベーションを表す1,337のハッシュタグの新しいデータセットをオンラインでキュレートする。
組み合わせたネットワーク+アイデンティティモデルは,ネットワークやアイデンティティのみのカウンターファクトよりもハッシュタグカスケードをシミュレートした方がよいことを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:42:11 GMT)
The Gradient Puppeteer: Adversarial Domination in Gradient Leakage Attacks through Model Poisoning [14.4] Federated Learning (FL)では、クライアントはデータをローカルに保ちながら、中央サーバと勾配を共有する。
悪意のあるサーバーは、クライアントのデータを共有勾配から再構築するために、故意にモデルを操作できる。
本稿では,AGLAをバックドア中毒として均一にモデル化する理論解析手法を提案する。
我々は,クライアント側検出を回避しつつ,完全な攻撃カバレッジを実現する最初のAGLAであるEGGV(Enhanced Gradient Global Vulnerability)を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:31:14 GMT)
Training Language Models to Reason Efficiently [14.4] 我々は、強化学習を用いて、大きな推論モデルを訓練し、効率的に推論する。
精度を維持しながら不要な計算オーバーヘッドを最小限に抑えるため,本手法はモデルにインセンティブを与える。
2つのオープンウェイトな大推論モデルに対する実験は、ほとんどの精度を保ちながら、推論コストを著しく削減することを示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:18:16 GMT)
PILAF: Optimal Human Preference Sampling for Reward Modeling [14.3] そこで我々は,プライオリティラベリングのための新しい応答サンプリング戦略であるPILAF(Policy-Interpolated Learning for Aligned Feedback)を提案する。
PILAFは、優先学習と基礎となるオラクル報酬の最大化を明確に調整する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:09:00 GMT)
DistrEE: Distributed Early Exit of Deep Neural Network Inference on Edge Devices [13.9] サービス要求の品質を満たすために、モデル推論を早期に終了させることができる分散DNN推論フレームワークであるDistrEEを提案する。
DistrEEは効率的な協調推論を効率的に実現でき、推論レイテンシと精度のトレードオフを効果的に達成できることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:16:54 GMT)
From Principles to Practice: A Deep Dive into AI Ethics and Regulations [13.8] この記事では、欧州連合が提案する画期的なAI規制フレームワークについて、徹底的に分析する。
学術や産業がこれらの原則を守ろうとする技術的努力と戦略を考えると、我々は5つの倫理的原則の相乗効果と矛盾を探求する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:44:29 GMT)
Improving Natural Language Understanding for LLMs via Large-Scale Instruction Synthesis [13.7] 自然言語理解の分野では、指導力の不足が深刻である。
これまでのNLU命令の構築は,主に情報抽出に重点を置いていた。
我々は,NLUタスクのための大規模かつ高品質な合成命令コーパスHumを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:53:40 GMT)
Cross the Gap: Exposing the Intra-modal Misalignment in CLIP via Modality Inversion [13.7] CLIPのような事前訓練されたマルチモーダルビジョンランゲージモデルは、様々なアプリケーションで広く使われている。
これは本質的にはCLIPスタイルのモーダル間コントラスト損失によるもので、モーダル内制約を強制しないためである、と我々は主張する。
画像・画像・テキスト・テキスト検索のモーダル内タスクにおいて、これらのタスクを相互にアプローチすることで性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:58:59 GMT)
Composing Novel Classes: A Concept-Driven Approach to Generalized Category Discovery [13.7] 我々は、ラベルなしデータセットにおける新しいクラスを発見することを目的として、一般化されたカテゴリ発見問題に取り組む。
本稿では,GCDのための新しい概念学習フレームワークであるConceptGCDを紹介し,概念を2つのタイプに分類する。
我々のフレームワークはまず、既知のクラス事前学習モデルにより既知のクラス概念を抽出し、そこから導出可能な概念を生成する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:17:05 GMT)
QExplorer: Large Language Model Based Query Extraction for Toxic Content Exploration [13.5] 本研究では,大規模言語モデルに基づく有毒コンテンツ探索のためのクエリ抽出手法であるQExplorerを提案する。
オフライン実験の結果、自動クエリ抽出の性能は、複数のLLMや人間よりも優れていた。
オンライン展開は有害物の検出を著しく増加させる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:11:58 GMT)
DECT: Harnessing LLM-assisted Fine-Grained Linguistic Knowledge and Label-Switched and Label-Preserved Data Generation for Diagnosis of Alzheimer's Disease [13.4] アルツハイマー病(英: Alzheimer's Disease、AD)は、世界中で5000万人が発症する、不可逆的な神経変性疾患である。
言語障害は認知低下の最も初期の兆候の1つであり、AD患者を正常なコントロール個人と区別するために使用することができる。
患者間対話はそのような障害を検出するために用いられるが、曖昧でうるさい、無関係な情報と混同されることが多い。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:00:25 GMT)
Online Location Planning for AI-Defined Vehicles: Optimizing Joint Tasks of Order Serving and Spatio-Temporal Heterogeneous Model Fine-Tuning [12.8] 車両群集センシング(VCS)は、車両の移動性とセンサーを装備した能力を活用する重要なイネーブラーとして登場した。
この研究は、エッジアシスト車両が注文サービスと基礎モデルの微調整のジョイントタスクを行う、有望なシナリオを探求する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:23:40 GMT)
Classical Simulability of Quantum Circuits with Shallow Magic Depth [12.8] Clifford と $T$ を交互に行う量子回路の古典的シミュラビリティについて検討する。
驚いたことに、わずか1ドルのT$ゲートレイヤーの追加や、単にすべてのT$ゲートを$Tfrac12$に置き換えることで、Pauli評価タスクは、PからGapP完全への急激な複雑さの移行を明らかにしている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:55:38 GMT)
Adaptive Prototype Knowledge Transfer for Federated Learning with Mixed Modalities and Heterogeneous Tasks [12.7] 本稿では,適応型プロトタイプに基づく多モードフェデレート学習(AproMFL)フレームワークを提案する。
我々のAproMFLは、事前の公開データセットなしで適応的に構築されたプロトタイプを通じて知識を伝達する。
サーバはクライアントのプロトタイプを統一されたマルチモーダルプロトタイプに変換し、それらを集約してグローバルプロトタイプを形成する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:28:05 GMT)
Cascaded Learned Bloom Filter for Optimal Model-Filter Size Balance and Fast Rejection [12.6] これらの問題に対処するために,カスケード学習ブルームフィルタ (CLBF) を提案する。
動的プログラミングに基づく最適化は、モデルとフィルタサイズの間の最適なバランスを実現する構成を自動的に選択する。
実世界のデータセットでの実験では、CLBFは最先端のBloomフィルタと比較してメモリ使用量を最大24%削減し、リジェクション時間を最大14倍削減している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:05:41 GMT)
PINS: Proximal Iterations with Sparse Newton and Sinkhorn for Optimal Transport [12.6] 本稿では,Sparse Newton法とSinkhorn法を用いて,大規模OT問題の高精度解を効率的に計算する手法を提案する。
全体空間と大域収束による計算複雑性の低減は厳密な理論解析によって保証される。
提案手法は,正確解に匹敵する精度を達成し,各イテレーションを段階的に高速化し,正規化パラメータに対する感度を低減し,ロバスト性を向上する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:21:48 GMT)
FocalCodec: Low-Bitrate Speech Coding via Focal Modulation Networks [12.4] FocalCodecは、単一のバイナリコードブックを使って音声を圧縮する焦点変調に基づく効率的な低ビットレートである。
デモサンプル、コード、チェックポイントはhttps://lucadellalib.io/focalcodec-web/.com/で公開されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:24:50 GMT)
CAD-Editor: A Locate-then-Infill Framework with Automated Training Data Synthesis for Text-Based CAD Editing [12.3] テキストベースのCAD編集のための最初のフレームワークであるemphCAD-Editorを紹介する。
そこで本研究では,テキストベースのCAD編集の複合的な性質に対処するため,位置-then-infillフレームワークを提案する。
CAD-Editorは定量的にも質的にも優れた性能を発揮することを示す実験を行った。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:57:14 GMT)
Multi-Label Test-Time Adaptation with Bound Entropy Minimization [12.1] 境界エントロピー最小化(BEM)を開発し、複数の上位ラベルの信頼性を同時に向上する。
MSCOCO,VOC,NUSWIDEのマルチラベルデータセット全体にわたって,ML--TTAフレームワークは最新のSOTA手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:52:16 GMT)
Causal Learning for Heterogeneous Subgroups Based on Nonlinear Causal Kernel Clustering [12.0] 不均一な部分群因果学習のための非線形カスラルカーネルクラスタリング法が導入された。
実験結果から,本手法は異種サブグループを同定し,因果学習の促進に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:24:02 GMT)
The Same Only Different: On Information Modality for Configuration Performance Analysis [12.0] 本稿では,構成性能解析における手動とコードの有用性について検討する。
1,694のオプション、106,798のマニュアル、22,859,552行のコードがある。
両タスクのマニュアルとコードモダリティを融合させることが有益であるなど,いくつかの新たな発見と洞察を明らかにした。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:11:29 GMT)
The Elusive Pursuit of Replicating PATE-GAN: Benchmarking, Auditing, Debugging [11.9] PATE-GANは、GAN(Generative Adversarial Networks)とPATEのプライベートトレーニングアプローチを組み合わせた、最も人気のあるアルゴリズムの1つとして登場した。
原著者の3つ(サブセット)を含む6つのオープンソースPATE-GAN実装を分析し,ベンチマークする。
DP監査を含む詳細なプライバシ評価を行い、すべての実装が意図したよりも多くのプライバシをリークしていることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:55:42 GMT)
DFPE: A Diverse Fingerprint Ensemble for Enhancing LLM Performance [11.8] そこで我々は,新しいアンサンブル法であるDiverse Fingerprint Ensemble (DFPE)を提案する。
提案手法は,(1)応答型"フィンガープリント"パターンに基づくクラスタリングモデル,(2)量子化に基づくフィルタリング機構の適用,(3)残余モデルに適応重みを割り当てることである。
MMLU(Massive Multitask Language Understanding)ベンチマークの実験では、DFPEは、全体的な精度が3%、規律レベルの精度が5%向上し、最高のシングルモデルを上回った。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:47:55 GMT)
Harmonious Group Choreography with Trajectory-Controllable Diffusion [11.7] 本稿では,コヒーレントかつ調和の取れたダンス運動を生成するために,トラジェクティブ・コンストラクタブル・ディフュージョン(TCDiff)フレームワークを提案する。
衝突を緩和するために,複数のダンサーに対する無衝突軌道を生成するDance-Trajectory Navigatorを導入する。
また,フレーム間の変位を相対的な前方運動損失に支えて調整するフットワーク適応器を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:22:50 GMT)
Generalize Drug Response Prediction by Latent Independent Projection for Asymmetric Constrained Domain Generalization [11.6] 本稿では,この課題に対処する新しいドメイン一般化フレームワークであるpanCancerDRを提案する。
本研究は,癌細胞株をドメイン特異的な試料として,各がんタイプを異なるソースドメインとして概念化する。
実験により,PanCancerDRは多様なソースドメインからタスク関連機能を効果的に学習できることが実証された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:53:45 GMT)
Augmented Conditioning Is Enough For Effective Training Image Generation [11.6] 実画像の生成プロセスの条件付けとテキストのプロンプトにより、下流トレーニングに有効な合成データセットとして機能する世代を生成することが判明した。
我々は,5つの確立された長尾画像と少数ショット画像の分類ベンチマークにおいて,拡張条件を検証した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:57:33 GMT)
Distributed Event-Based Learning via ADMM [11.5] エージェントがネットワーク上で情報を交換することで目的関数を最小化する,グローバルな分散学習問題を考える。
本手法は, (i) 必要なときにのみ通信をトリガーすることでコミュニケーションを大幅に削減し, (ii) 異なるエージェント間でのデータ分配を行う。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:03:55 GMT)
Regularized Robustly Reliable Learners and Instance Targeted Attacks [11.4] Balcan et al (2022) は、堅牢で信頼性の高い学習者の概念を定義することによって、この問題に対処するアプローチを提案した。
少なくともある興味深いケースでは、トレーニング時間内にサブリニアで出力を生成できるアルゴリズムを設計できることが示されています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:13:46 GMT)
Speak Easy: Eliciting Harmful Jailbreaks from LLMs with Simple Interactions [11.3] 大規模言語モデル(LLM)は、有害な行動を引き起こすジェイルブレイク攻撃に対して脆弱なままである。
悪意のあるユーザは、有害な意図のために、共通のインタラクションパターンを簡単に活用することができます。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:02 GMT)
The Implicit Bias of Structured State Space Models Can Be Poisoned With Clean Labels [11.3] 以前の研究は、構造化状態空間モデル(SSM)の暗黙のバイアスは、低次元の教師によってデータが生成される環境での一般化につながると主張した。
暗黙のバイアスは、多くのトレーニングデータの選択の下で一般化につながるが、トレーニングに含めると暗黙のバイアスが完全に歪む特別な例が存在することを証明している。
この失敗は、教師によってラベル付けされている特別なトレーニング例、すなわちクリーンなラベルを持つにもかかわらず発生します!
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:16:23 GMT)
Rethinking the Residual Distribution of Locate-then-Editing Methods in Model Editing [11.3] 本稿では,Large Language Models (LLMs) の本来の知識を劣化させる位置列編集手法について述べる。
そこで我々は,境界層UpdatE(Blue)戦略を提案し,位置-then-edit法を強化した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:20:17 GMT)
Causal Concept Graph Models: Beyond Causal Opacity in Deep Learning [11.1] 因果不透明性(英: Causal opacity)とは、ディープニューラルネットワーク(DNN)モデルの決定の根底にある「隠れた」因果構造を理解することの難しさを指す。
この研究は、因果概念グラフモデル(Causal Concept Graph Models, Causal CGMs)を導入している。
実験の結果, (i) 因果不透明モデルの一般化性能に一致し, (ii) ループ内修正を誤予測中間推論ステップに適用し, (iii) 介入シナリオと反事実シナリオの分析を支援することができた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:22:15 GMT)
First-ish Order Methods: Hessian-aware Scalings of Gradient Descent [11.1] 勾配降下の鍵となる制限は、自然スケーリングの欠如である。
曲率を考慮することで、適応的なヘッセン対応スケーリング手法により、局所的な単位ステップサイズが保証される。
我々は,この手法が標準リプシッツ仮定のかなり弱いバージョンの下でグローバルに収束することを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:22:23 GMT)
Following Devils' Footprint: Towards Real-time Detection of Price Manipulation Attacks [10.8] 価格操作攻撃は、分散金融(DeFi)アプリケーションにおける悪名高い脅威の1つだ。
本研究では,攻撃前の価格操作攻撃を積極的に識別する新しい手法SMARTCATを提案する。
SMARTCATは91.6%のリコールと100%の精度で既存のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:11:24 GMT)
Efficient Randomized Experiments Using Foundation Models [10.6] 本稿では,複数の基礎モデルからの予測を,統計的に妥当な推測を保ちながら統合する手法を提案する。
我々の推定器は、実験データのみに基づく標準推定器と同じ精度のサンプルサイズを最大20%削減する、かなり精度の高いゲインを提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:54:10 GMT)
Network-Wide Traffic Flow Estimation Across Multiple Cities with Global Open Multi-Source Data: A Large-Scale Case Study in Europe and North America [10.6] 一般的なネットワークの各リンクの動的トラフィック量をキャプチャするネットワーク全体のトラフィックフローは、スマートモビリティアプリケーションの基本である。
既存の研究では、センサのカバー不足を補うために様々な補足データソースを使用し、未観測のトラフィックフローを見積もっている。
我々は,GOMSマップから情報を効果的に抽出し,合成する,注目に基づくグラフニューラルネットワークを開発した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:59:18 GMT)
The ML Supply Chain in the Era of Software 2.0: Lessons Learned from Hugging Face [10.5] 私たちは、人気のあるモデル共有サイトHugging Faceから抽出された760,460モデルと175,000のデータセットを広範囲に分析します。
我々は、Hugging Faceサプライチェーンにおけるドキュメンテーションの現状を評価し、欠陥の実例を報告し、改善のための実用的な提案を提供する。
我々の研究結果は、MLモデル/データセットのライセンス管理の改善など、複数の研究の道のりを動機付けています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:17:05 GMT)
A Retrospective Systematic Study on Hierarchical Sparse Query Transformer-assisted Ultrasound Screening for Early Hepatocellular Carcinoma [10.5] 肝細胞癌(HCC)は、世界第3位のがん関連死亡原因である。
本研究では, 超音波検診におけるHCC診断精度を高めるために, 革新的な階層型スパースクエリトランス (HSQformer) モデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:17:02 GMT)
VTutor: An Open-Source SDK for Generative AI-Powered Animated Pedagogical Agents with Multi-Media Output [10.5] 本稿では、生成AIと高度なアニメーション技術を組み合わせたオープンソースのソフトウェア開発キットVTutorを紹介する。
VTutorを使えば、研究者や開発者は感情的に共鳴し、文脈的に適応的な学習エージェントを設計できる。
このツールキットは、教育において信頼できるAI原則を推進しながら、学習者のエンゲージメント、フィードバック受容性、人間とAIの相互作用を強化する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:27:54 GMT)
Root Defence Strategies: Ensuring Safety of LLM at the Decoding Level [10.5] 大規模言語モデル (LLM) は様々な産業で大きな有用性を示している。
LLMが進むにつれて、不正または悪意のある命令プロンプトによって有害な出力のリスクが増大する。
本稿では, LLMが有害な出力を認識する能力について検討し, 従来のトークンの危険性を評価する能力を明らかにし, 定量化する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:21:00 GMT)
Comparing privacy notions for protection against reconstruction attacks in machine learning [10.5] 機械学習コミュニティでは、再構築攻撃が主要な関心事であり、統合学習(FL)においても特定されている。
これらの脅威に対して、プライバシーコミュニティは、DP-SGDと呼ばれる勾配降下アルゴリズムにおける差分プライバシー(DP)の使用を推奨している。
本稿では,プライバシ保証の異なる概念とメカニズムを比較するための基礎的枠組みを構築した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:04:25 GMT)
Online Learning of Counter Categories and Ratings in PvP Games [10.4] 本稿では,Elo原則を拡張したオンライン更新アルゴリズムを提案する。
提案手法は,各試合後の評価と対応関係を動的に調整し,不透過性に対処しながらスカラー評価の説明可能性を維持する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:57:18 GMT)
Automating a Complete Software Test Process Using LLMs: An Automotive Case Study [10.2] 車両APIテストは、車両の内部システムと外部アプリケーションの相互作用が期待に応えるかどうかを検証する。
本稿では車載APIの自動テストのためのシステムを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:10:01 GMT)
Non-convex composite federated learning with heterogeneous data [10.1] 本稿では,サーバとクライアント間の通信を両立させる非線形合成学習のための革新的なアルゴリズムを提案する。
合成データセットと実データセットの両方の最先端手法よりもアルゴリズムが優れていることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:49:03 GMT)
MambaQuant: Quantizing the Mamba Family with Variance Aligned Rotation Methods [10.1] MambaはTransformersと競合する効率的なシーケンスモデルである。
CNNやTransformerモデルに有効な既存の量子化手法は、Mambaでは不十分である。
本稿では,(1)KLT(Karhunen-Loeve Transformation)拡張回転,(2)チャネル分布に適応可能な回転行列の描画,(2)チャネルの分散を等化して,追加パラメータをモデル重みにマージする,といった学習後の量子化フレームワークであるMambaQuantを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:05:38 GMT)
SplitQuant: Layer Splitting for Low-Bit Neural Network Quantization [10.0] ディープニューラルネットワーク(DNN)の量子化はしばしば、元の値の範囲が量子化値の範囲よりも大きいため、異なる元の値を単一の量子化値にマッピングする。
本稿では,オフ値の保持と量子化の解決を同時に行うためにSplitQuantを提案する。
SplitQuantは2つのBERT-Tinyモデルに適用され、INT2量子化の精度を3.3%pと2.1%pで改善した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:42:45 GMT)
Combining Language and App UI Analysis for the Automated Assessment of Bug Reproduction Steps [10.0] バグレポートは重要な情報を見逃したり、不明瞭に書かれたりすることが多い。
問題となるレポートの最も一般的なコンポーネントの1つは、バグを再現するステップである(S2R)。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:40:53 GMT)
Towards Fair and Robust Face Parsing for Generative AI: A Multi-Objective Approach [10.0] 顔解析における精度,公平性,堅牢性を最適化する多目的学習フレームワークを提案する。
以上の結果から,公平性に配慮したセグメンテーションにより,顔生成におけるフォトリアリズムと一貫性が向上することが示唆された。
以上の結果から,多目的顔解析が人口動態の整合性や頑健性を改善し,高品質なGAN合成を実現することが示唆された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:41:35 GMT)
GUIWatcher: Automatically Detecting GUI Lags by Analyzing Mobile Application Screencasts [10.0] グラフィカルユーザインタフェース(GUI)はモバイルアプリケーションにおいて中心的な役割を果たし、ユーザビリティとユーザ満足度に直接影響を与えます。
遅延や応答性の低いGUIパフォーマンスは、ネガティブなユーザエクスペリエンスとモバイルアプリケーション(アプリ)レーティングの低下につながる可能性がある。
GUIWatcherは,モバイルアプリのテスト中に記録されたスクリーンキャストを分析し,GUIラグを検出するように設計されたフレームワークである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:43:51 GMT)
Controlled LLM Decoding via Discrete Auto-regressive Biasing [9.8] 制御されたテキスト生成は、大きな言語モデルの出力に対してユーザ定義の制約を強制することができる。
離散テキスト領域で完全に動作しながら勾配を利用する制御復号アルゴリズムである離散自己回帰バイアス法を提案する。
提案手法は,計算コストの低減を図るとともに,制約満足度を著しく向上させる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:14:43 GMT)
Position: Untrained Machine Learning for Anomaly Detection [9.8] 1つのサンプルのみに基づく非拘束異常検出は、実際の製造業の動機となる新たな研究課題である。
本稿では,3次元点雲データに基づく非トレーニング異常検出問題の形式的定義を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:46:59 GMT)
House of Cards: Massive Weights in LLMs [9.7] 初期層におけるフィードフォワードネットワークモジュールの中間状態から大量のアクティベーションが生じることを示す。
そこで本研究では,パラメータ効率のよい微調整を行う場合の重みを少なくするために,MacDropと呼ばれるプラグアンドプレイ方式を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:54:35 GMT)
Towards Scalable Defenses against Intimate Partner Infiltrations [9.7] Intimate Partner Infiltration (IPI)はアメリカにおいて広く普及している問題である。
従来のサイバー攻撃とは異なり、IPIの加害者は身近な知識を利用して標準的な保護を回避する。
スマートフォン上での不正アクセスや不審な動作を継続的に監視する自動IPI検出システムであるAIDを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:07:08 GMT)
Thought-Path Contrastive Learning via Premise-Oriented Data Augmentation for Logical Reading Comprehension [9.7] これまでの研究は主に、Chain-of-Thought(CoT)やデータ拡張による論理的推論能力の向上に重点を置いてきた。
本稿では,CoTの論理式を生成するためのPODA(Premise-Oriented Data Augmentation)フレームワークを提案する。
また,本論文では,原案と反実例の推論経路を比較検討する新たな思考経路コントラスト学習手法についても紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:43:15 GMT)
Keep It Light! Simplifying Image Clustering Via Text-Free Adapters [9.7] 本研究では, 深層クラスタリングにおいて, テキストフリーかつ高度に単純化されたトレーニングパイプラインを用いて, より複雑な最先端手法による競合性能を実現することができることを示す。
CIFAR-10、CIFAR-20、CIFAR-100、STL-10、ImageNet-10、ImageNet-Dogsといったベンチマークデータセットの実験は、SCPが高い競争性能を達成することを示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:12:07 GMT)
Towards Unified Music Emotion Recognition across Dimensional and Categorical Models [9.6] 音楽感情認識(MER)における最も重要な課題の1つは、感情ラベルがデータセット間で不均一であるという事実にある。
分類ラベルと次元ラベルを組み合わせた統合マルチタスク学習フレームワークを提案する。
我々の研究は、一つの統合されたフレームワークにおけるカテゴリー的感情ラベルと次元的感情ラベルの組み合わせを可能にすることで、MERに大きな貢献をしている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:20:22 GMT)
Optimizing Transmit Field Inhomogeneity of Parallel RF Transmit Design in 7T MRI using Deep Learning [9.6] 超高磁場(UHF)磁気共鳴イメージング(MRI)は信号対雑音比を高くし、空間分解能を高くする。
UHF MRIは、無線周波数(RF)磁場(B1+)の不均一性などの課題を導入し、不均一なフリップ角と画像強度異常をもたらす。
本研究では,新たな深層学習戦略を通じて,B1+フィールドの均一性を論じる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:12:35 GMT)
Towards a Theoretical Understanding of Synthetic Data in LLM Post-Training: A Reverse-Bottleneck Perspective [9.6] 学習後モデルの一般化能力は生成モデルから得られる情報ゲインによって決定されることを示す。
この分析は、合成データ生成の理論基盤として機能し、後学習モデルの一般化能力との関係を強調している。
ソースコードはhttps://github.com/ZyGan 1999/Towards-a-theoretical-Understanding-of-Synthetic-Data-in-LLM-Post-Trainingで公開しています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:42:17 GMT)
Enhancing Hallucination Detection through Noise Injection [9.6] 大型言語モデル(LLM)は、幻覚として知られる、もっとも不正確な応答を生成する傾向にある。
ベイズ感覚のモデル不確実性を考慮し,検出精度を著しく向上できることを示す。
サンプリング中にモデルパラメータの適切なサブセット、あるいは等価に隠されたユニットアクティベーションを摂動する、非常に単純で効率的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:02:20 GMT)
Synthetic Datasets for Machine Learning on Spatio-Temporal Graphs using PDEs [9.6] 我々は、部分微分方程式(PDE)に基づく合成データセットを作成し、機械学習における時間グラフモデリングを支援する。
より正確には、疫学、大気粒子、津波波の分野で異なる種類の災害や危険をモデル化するための3つの方程式を提示する。
このようなデータセットは、疫学データセット上で複数の機械学習モデルをベンチマークすることで、どのように使用できるかを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:20:32 GMT)
RLPP: A Residual Method for Zero-Shot Real-World Autonomous Racing on Scaled Platforms [9.5] RLベースの残差を持つPure Pursuitコントローラを強化する残差RLフレームワークであるRLPPを提案する。
RLPPはベースラインコントローラのラップタイムを最大6.37%改善し、State-of-the-Artメソッドとのギャップを52%以上縮める。
RLPPはオープンソースツールとして利用可能であり、自律レース研究のさらなる探求と進歩を奨励している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:59:25 GMT)
Large Language Models for Multi-Robot Systems: A Survey [9.3] マルチロボットシステム(MRS)は、調整、スケーラビリティ、現実の適応性など、ユニークな課題を提起する。
このサーベイは、MSSへのLLM(Large Language Models)統合に関する最初の包括的な調査を提供する。
家庭用ロボティクス、建設、構成制御、目標追跡、ロボットゲームなど、さまざまな分野における重要な応用に焦点を当てる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:52:14 GMT)
MedGNN: Towards Multi-resolution Spatiotemporal Graph Learning for Medical Time Series Classification [9.3] 医用時系列分類のための多分解能グラフ学習フレームワークMedGNNを提案する。
まず、動的なマルチスケール埋め込みを学習するために、多分解能適応グラフ構造を構築することを提案する。
次に、時間的モデリングのための有限差分上で自己注意機構を操作するための差分注意ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:34:54 GMT)
Algorithms with Calibrated Machine Learning Predictions [9.2] 予測を伴うアルゴリズムの分野は、リアルタイムのパフォーマンスを改善するためのオンラインアルゴリズムの設計に機械学習のアドバイスを取り入れている。
このギャップを埋めるための原則的かつ実践的なツールとしてキャリブレーションを提案し、2つのケーススタディを通じてキャリブレーションされたアドバイスの利点を実証する。
スキーレンタルでは,最適な予測依存性能を実現するアルゴリズムを設計し,高分散環境では,キャリブレーションされたアドバイスが不確実性に対する代替手法よりも効果的なガイダンスを提供することを示す。
ジョブスケジューリングでは,予測器を用いることで既存の手法よりも大幅な性能向上が期待できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:00:42 GMT)
Learning Electromagnetic Metamaterial Physics With ChatGPT [9.2] ChatGPT、Gemini、LlaMa、Claudeといった大規模言語モデル(LLM)は、インターネットから解析された大量のテキストに基づいて訓練されている。
テキストプロンプトによる吸収スペクトルを予測するために, 最大4万データに微調整したLCMを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:47:23 GMT)
MIDAS: Multi-level Intent, Domain, And Slot Knowledge Distillation for Multi-turn NLU [9.0] MIDASは、マルチレベルインテント、ドメイン、スロット知識の蒸留を多ターンNLUに活用する新しいアプローチである。
本稿では,マルチレベルインテント,ドメイン,スロット知識の蒸留を多ターンNLUに適用したMIDASを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:56:23 GMT)
Expanding Training Data for Endoscopic Phenotyping of Eosinophilic Esophagitis [9.0] 好酸球性食道炎 (EoE) は、好酸球性炎症を主訴に発症した慢性食道疾患である。
近年、EREFSシステムによって誘導されるAI支援内視鏡画像は、侵襲的な組織学的評価への依存を減らすための潜在的な代替手段として出現している。
本研究は,オンラインプラットフォーム,公開データセット,電子教科書の多様な画像集合を用いて学習データを増強することにより,深層学習に基づくEoE表現型分類の性能を向上させることを目的とする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:38:47 GMT)
Logic-Q: Improving Deep Reinforcement Learning-based Quantitative Trading via Program Sketch-based Tuning [9.0] 論理Qと呼ばれるQトレーディングのための普遍的な論理誘導型深層強化学習フレームワークを提案する。
特に、Logic-Qは、スケッチによるプログラム合成を採用し、軽量でプラグアンドプレイの市場トレンド対応のプログラムスケッチを活用して、市場の動向を決定するロジック誘導モデル設計を導入する。
2つの一般的な量的トレーディングタスクの広範囲な評価は、Logic-Qが従来の最先端DRLトレーディング戦略の性能を大幅に改善できることを示している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:40:44 GMT)
Synthetic Poisoning Attacks: The Impact of Poisoned MRI Image on U-Net Brain Tumor Segmentation [9.0] 脳腫瘍分離のためのU-Netモデルのロバスト性およびセグメンテーション精度に及ぼす合成MRIデータの影響について検討した。
合成データ汚染の影響を定量化するために、U-Netモデルを段階的に"汚染された"データセットに訓練する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:21:19 GMT)
Electron hopping induced phonon pumping in opto-mechanical molecular nanocavities [8.9] プラズモニック分子ナノ接合はナノスケールでオプトメカニカルカップリングを示す。
導電性分子における非弾性電子ホッピングにより誘導されるプラズモンを介するフォノンポンプを実証する。
本研究は, プラズモンナノキャビティにおける振動, 光, 電子現象の微視的記述を提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:33:56 GMT)
A Comparison of DeepSeek and Other LLMs [8.6] 比較のために短いテキストを用いて結果を予測するタスクを使用する。
分類精度に関しては、DeepSeekはGemini、GPT、Llamaより優れている。
DeepSeekは比較的遅いが、使用コストは低く、Claudeは他のすべてよりもはるかに高価だ。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:38:25 GMT)
Estimating the Probabilities of Rare Outputs in Language Models [8.6] 小型変圧器言語モデルからのargmaxサンプリングの文脈における低確率推定について検討した。
その結果、重要サンプリングはアクティベーション外挿より優れるが、どちらもナイーブサンプリングより優れていることがわかった。
低確率推定のための新しい手法は、最悪の場合の性能についてより強力な保証を提供するために必要である、と我々は主張する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:43:54 GMT)
Optimized Unet with Attention Mechanism for Multi-Scale Semantic Segmentation [8.4] 本稿では,注目機構と組み合わさった改良されたUnetモデルを提案する。
チャネルアテンションと空間アテンションモジュールを導入し、重要な特徴にフォーカスするモデルの能力を強化する。
改良されたモデルは、mIoUとピクセル精度(PA)でよく機能し、それぞれ76.5%と95.3%に達した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:51:23 GMT)
Security Weaknesses of Copilot-Generated Code in GitHub Projects: An Empirical Study [8.4] GitHub Copilotと他の2つのAIコード生成ツールによって生成されたコードスニペットを分析します。
分析の結果,733個のスニペットが検出され,セキュリティ上の脆弱性の可能性が高め,Pythonの29.5%,JavaScriptの24.2%が影響を受けることがわかった。
生成されたコードのセキュリティ問題を軽減するために提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:17:46 GMT)
Premise-Augmented Reasoning Chains Improve Error Identification in Math reasoning with LLMs [8.2] 大型言語モデル(LLM)の数学的推論を促進させるチェーン・オブ・ソート(CoT)
本稿では,各ステップの前提を識別し,推論の評価を改善するためのフレームワークを提案する。
本研究は,複雑な問題解決課題に対処する前提中心表現の有用性を強調した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:28:59 GMT)
Leading and beyond leading-order spectral form factor in chaotic quantum many-body systems across all Dyson symmetry classes [8.1] ランダム行列理論(RMT)スペクトル相関の出現は,多体連系を周期的に蹴り回した多体系のカオス相に現れることを示す。
スペクトル形成因子 (SFF) と$K(t)$ を解析的に計算した。
我々の導出は、アンサンブル平均を実現するためにのみランダム位相近似を仮定する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:37:18 GMT)
Strong Equivalence in Answer Set Programming with Constraints [8.1] 規則の2つのグループは、非公式に言えば、どのような文脈でも同じ意味を持つならば、強く等価であると考えられる。
強い同値性は、制約のあるヘテロ・アンド・ザールの論理におけるそれらの同値性によって正確に特徴づけられることを示す。
本稿では,制約を扱う複数のクリンゴベースの解集合の言語からHere-and-There言語への制約を制約付きで翻訳する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:43:59 GMT)
Vulnerability-Triggering Test Case Generation from Third-Party Libraries [8.1] VULEUTは、クライアントソフトウェアプロジェクトで一般的に使用されているサードパーティ製ライブラリの脆弱性の悪用を自動検証するように設計されている。
VULEUTはまず、脆弱性条件の到達可能性を決定するためにクライアントプロジェクトを分析する。
次に、Large Language Model (LLM)を活用して、脆弱性確認のためのユニットテストを生成する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:22:14 GMT)
An Investigation of FP8 Across Accelerators for LLM Inference [7.9] NVIDIA H100とIntel Gaudi 2.0という2つのAIアクセラレータ上でのFP8計算の総合的な分析を初めて提供する。
その結果,Gaudi 2はFP8を活用することにより,推論時のスループットと電力効率の向上を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:04:51 GMT)
COMMA: A Communicative Multimodal Multi-Agent Benchmark [7.8] 本稿では,言語コミュニケーションによるマルチモーダルマルチエージェントシステムの協調性能を評価するための新しいベンチマークを提案する。
GPT-4oのようなプロプライエタリなモデルを含む最先端モデルの驚くべき弱点が明らかになった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:55:46 GMT)
Hierarchical Contextual Manifold Alignment for Structuring Latent Representations in Large Language Models [7.8] 潜在トークン表現の組織化は、言語モデルの安定性、一般化、文脈整合性を決定する上で重要な役割を果たす。
コアモデル重みを変化させることなくトークン埋め込みに階層的アライメント手法を導入した。
実験により, 希少なトークン検索, 逆方向, 長距離依存性追跡の改善が示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:01:27 GMT)
Gaussian Process Regression for Inverse Problems in Linear PDEs [7.8] 本稿では,線形偏微分方程式(PDE)に支配される逆問題に対するシステム理論における計算効率のよいアルゴリズムを提案する。
例えば、物理学で広く使われている古典波動方程式のノイズデータから波速を識別する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:20:38 GMT)
Speeding up Speculative Decoding via Approximate Verification [7.8] 投機的復号法 (SD) はLarge Language Models (LLM) を用いた高速推論手法である。
本稿では,SPRINTERを提案する。SPRINTERは,LLMから生成されたトークンが目標のLLMに受け入れられるかどうかを予測するために訓練された,低複雑さの検証器である。
本稿では,SPRINTERの理論解析を行い,生成したトークンの統計的特性と遅延の低減について検討する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:10:53 GMT)
Robotouille: An Asynchronous Planning Benchmark for LLM Agents [7.6] 非同期計画は、時間遅延、多種多様な長期タスクの理由付け、他のエージェントとの協力を必要とするエージェントにとって不可欠である。
我々は、長時間の非同期シナリオを処理するエージェントの能力をテストするために設計されたベンチマーク環境であるRobotouilleを紹介する。
結果から,ReAct(gpt4-o)は同期タスクでは47%,非同期タスクでは11%に過ぎなかった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:50:37 GMT)
Multi-Agent Reinforcement Learning with Focal Diversity Optimization [7.5] MARL-Focal と呼ばれる多エージェント強化学習手法を提案する。
本モデルでは,最高のLCMエージェントと比較して5.51%の性能向上を実現している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:44:26 GMT)
Idioms: Neural Decompilation With Joint Code and Type Prediction [7.4] 我々は,任意のLDMをニューラルデコンパイラに微調整する新たなトレーニングプロセスを導入し,そのデコンパイルと同時に適切なユーザ定義型を生成する。
データ構造の様々な部分がプログラムの異なる部分によって操作できるという直感に触発されて、相互言語的コンテキストが、ユーザ定義型を扱う神経逆コンパイラの能力の向上に役立つことを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:13:40 GMT)
Reed-Muller Codes on CQ Channels via a New Correlation Bound for Quantum Observables [7.4] 我々は、Reed-Muller符号の対称性とネスト構造を用いて復号関数を解析する。
以上の結果から,コードレートがHolevoの容量より小さい場合,2o(sqrtlog N)$ビットの任意のセットを高い確率で復号化可能であることが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:19:24 GMT)
Advanced Object Detection and Pose Estimation with Hybrid Task Cascade and High-Resolution Networks [7.4] 本研究では,既存の6D-VNetフレームワークに基づく6次元オブジェクト検出とポーズ推定パイプラインを提案する。
HTCのマルチステージリファインメントプロセスとHRNetの高解像度表現能力の強みを活用することで,本手法は検出精度を大幅に向上し,推定精度を向上する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:48:34 GMT)
Multi-task Online Learning for Probabilistic Load Forecasting [7.4] 本稿では,オンラインおよび確率的負荷予測のためのマルチタスク学習手法を提案する。
動的類似性を利用して、複数のエンティティの負荷に対する正確な確率的予測を提供する。
実験の結果,提案手法は,現在のマルチタスク学習手法の有効性を著しく向上させることができることがわかった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:47:02 GMT)
Éclair -- Extracting Content and Layout with Integrated Reading Order for Documents [7.4] 本稿では,テキスト抽出ツールである'Eclairについて紹介する。
画像が与えられたら、"Eclairは、バウンディングボックスとその対応するセマンティッククラスとともに、読み順でフォーマットされたテキストを抽出できる。
このベンチマークで'Eclair'は最先端の精度を達成し、主要なメトリクスで他のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:07:22 GMT)
E-LENS: User Requirements-Oriented AI Ethics Assurance [7.3] 本稿では、AI倫理保証ケースの概念をAI倫理保証に導入する。
ユーザ要件、エビデンス、バリデーションの3つの柱が重要なコンポーネントとして提案され、AI倫理保証ケースに統合される。
安全クリティカルシステムの安全保証に使用される3つの柱とハザード分析手法に基づいて、ユーザ要求指向のAI倫理保証ケースを設置する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:37:55 GMT)
Training-Free Restoration of Pruned Neural Networks [7.3] 本研究では,より厳密で頑健なネットワーク復元手法を提案する。
提案手法は,元のネットワークと近似との再構成誤差の定式化に関する理論的解析に基づく。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:30:48 GMT)
Stop treating `AGI' as the north-star goal of AI research [7.3] 我々は、人工知能(AGI)の話題に焦点をあてることが、効果的な目標を選択する能力を損なうと論じている。
AGIの談話によって増大する6つの重要なトラップ、すなわち生産目標設定の障害を特定します。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:49:16 GMT)
Scenario-Based Curriculum Generation for Multi-Agent Autonomous Driving [7.3] 我々は,マルチエージェント交通シナリオフレームワークであるMATS-Gymを導入し,高忠実度運転シミュレータであるCARLAのエージェントを訓練する。
本稿では,交通シナリオ記述への既存のアプローチを1つのトレーニングフレームワークに統合し,教師なし環境設計の技術と一体化して適応型オートクラキュラの自動生成を実現する方法について述べる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:28:13 GMT)
NeuralMOVES: A lightweight and microscopic vehicle emission estimation model based on reverse engineering and surrogate learning [7.3] 輸送部門は温室効果ガスの排出に大きく貢献している。
業界標準の自動車排出シミュレータ(MOVES)は、利用の複雑さ、高い計算要求、そして顕微鏡リアルタイムアプリケーションに適さない問題に直面している。
我々は,車載CO2排出のための高性能軽量サロゲートモデルであるNeuralMOVESを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:26:26 GMT)
L2GNet: Optimal Local-to-Global Representation of Anatomical Structures for Generalized Medical Image Segmentation [7.2] 本稿では, DLS から得られた離散コードと, トレーニング可能な参照に対する最適なトランスポートとアライメントを関連付けて, グローバルな依存関係を学習する L2GNet を提案する。
マルチオーガニックセグメンテーションと心臓データセットの実験は、L2GNetが最先端の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:14:44 GMT)
Student-t processes as infinite-width limits of posterior Bayesian neural networks [7.1] 後部BNNは、モデリングの不確実性をより柔軟にする学生Tプロセスによって近似できることを示す。
我々の証明は、ワッサーシュタイン計量を利用して、学生-t過程近似の収束率の制御を確立する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:37:55 GMT)
PRISM: A Robust Framework for Skill-based Meta-Reinforcement Learning with Noisy Demonstrations [7.1] スキルベースメタRL(PRISM)の優先的リファインメントを提案する。
PRISMは、ノイズの多いデータに近い探索を統合して、オンライントラジェクトリを生成し、それらをオフラインデータと組み合わせる。
ノイズの影響に対処することにより,雑音や準最適データであっても,長時間の作業において,安定したスキル学習と優れたパフォーマンスを確保できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:28:45 GMT)
Fairness Aware Reinforcement Learning via Proximal Policy Optimization [7.1] 本稿では,PPOにおける公正性について,人口統計学的公正性,対実的公正性,条件的統計的公正性から導かれるペナルティ項について紹介する。
我々は,資源収集に焦点を当てた協調的かつ競争的なMASであるAlelopathic Harvestゲームにおいて,我々のアプローチを評価する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:45:55 GMT)
Controllable Emotion Generation with Emotion Vectors [7.0] 本稿では,LLMが出力する感情表現の手法を提案する。
本手法は,知的顧客サービス,文芸創造,ホームコンパニオンロボットなど,LCMが出力する感情を含む分野における幅広い応用可能性を有する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:38:57 GMT)
Enhanced Feature-based Image Stitching for Endoscopic Videos in Pediatric Eosinophilic Esophagitis [7.0] 本稿では,内視鏡的画像縫合性を高めるために,新しい前処理パイプラインを提案する。
提案手法は,4つのステップを踏襲して,内視鏡的映像データを連続した2次元画像に変換する。
小児内視鏡ビデオ20本で行った実験では,画像アライメントと縫合品質が有意に向上することが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:47:28 GMT)
Faster Acceleration for Steepest Descent [7.0] 非ユークリッド滑らか性仮定の下での凸最適化のための新しい高速化一階法を提案する。
我々の方法は、一階のオラクルへの呼び出しで最大$O(d1-frac2p)$のイテレーション改善を提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:24:07 GMT)
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm [6.9] 人間の動きの生成と編集はコンピュータグラフィックスと視覚の重要な要素である。
本稿では,多様なタスクの統一的な定式化を可能にする新しいパラダイムであるMotion-Condition-Motionを紹介する。
このパラダイムに基づいて、ソースモーションからターゲットモーションへのマッピングを学習するために、修正フローを組み込んだ統合フレームワーク、MotionLabを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:03:54 GMT)
Characterizing Bugs in Login Processes of Android Applications: An Empirical Study [6.9] われわれはAndroidアプリにおけるログイン問題に関する実証的研究を行った。
44の人気のオープンソースAndroidレポジトリから361の問題を解析します。
これらの発見は、開発者がログインプロセスをモデル化し、問題の原因を特定するのに役立つ。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:43:16 GMT)
ImprovNet: Generating Controllable Musical Improvisations with Iterative Corruption Refinement [6.9] ImprovNetは、表現力と制御性のある即興演奏を生成するトランスフォーマーベースのアーキテクチャである。
ジャンル固有のスタイルでメロディーを調和させ、短期間の即時継続および補充タスクを実行することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:45:38 GMT)
MXMap: A Multivariate Cross Mapping Framework for Causal Discovery in Dynamical Systems [6.7] 部分的クロスマッピング(PCM)は,3変数系における間接因果関係に対処するために,収束的クロスマッピング(CCM)の拡張として導入された。
本研究では,PCMを多変量設定に拡張し,間接因果関係をより効果的に識別するためにマルチPCMを導入する。
2段階のフレームワークは、(1)初期因果グラフを確立するためのペアワイズCCMテストと(2)間接因果接続を切断してグラフを洗練するためのマルチPCMを組み合わせる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:24:44 GMT)
Pursuing Better Decision Boundaries for Long-Tailed Object Detection via Category Information Amount [6.7] オブジェクト検出では、通常、データセットが長いテール分布を示すかどうかを定義するためにインスタンスカウントが使用される。
この仮定は、不均衡なインスタンス数を持つデータセットのカテゴリバイアスに関する広範な研究につながった。
本稿では,情報量に基づいて各カテゴリの決定空間を動的に調整するために,IGAMロス(Information Amount-Guided Angular Margin)を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:08:18 GMT)
Transfer Learning for Covert Speech Classification Using EEG Hilbert Envelope and Temporal Fine Structure [6.5] Brain-Computer Interfaces (BCI) は、想像された音声を神経活動からデコードすることができる。
BCIは通常、参加者が想像上の言葉を繰り返すような広範なトレーニングセッションを必要とします。
本稿では,過剰音声データで訓練された分類器を隠蔽音声分類に転送することで,これらの課題に対処する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:09:01 GMT)
WaferLLM: A Wafer-Scale LLM Inference System [6.5] 本稿では,最初のウェハスケールLLM推論システムであるWaferLLMを紹介する。
WaferLLMは、ウェハスケールアーキテクチャのユニークなハードウェア特性をキャプチャする新しいPLMRデバイスモデルによってガイドされる。
MeshGEMMとMeshGEMVは、ウエハスケールのアクセラレーター上で効果的にスケールするために設計されたGEMMとGEMVの実装である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:32:19 GMT)
Robust Reward Alignment via Hypothesis Space Batch Cutting [6.4] 本稿では,新鮮かつ幾何学的に解釈可能な視点に基づく,堅牢で効率的な報酬アライメント手法を提案する。
提案手法は,人間の嗜好のバッチに基づいて,報酬仮説空間を「カット」により反復的に洗練する。
未知の誤選好に対処するため, 各バッチに保守的切削手法を導入する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:08:43 GMT)
BLEND: Behavior-guided Neural Population Dynamics Modeling via Privileged Knowledge Distillation [6.4] 本稿では,特権的知識蒸留による行動誘導型ニューラル人口動態モデリングフレームワークBLENDを提案する。
特権情報として行動を考えることにより、行動観察(私的特徴)と神経活動(正規特徴)の両方を入力として扱う教師モデルを訓練する。
学生モデルは神経活動のみを用いて蒸留される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:37:25 GMT)
Efficient IAM Greybox Penetration Testing [6.4] IAMは特権エスカレーション(PE)攻撃を招き、経済的に大きな損失をもたらす可能性がある。
サードパーティのクラウドセキュリティサービスは、ホワイトボックスの侵入テストを使用してこのような問題を検出する。
IAM PEを効率よく検出するための、サードパーティサービスのための最初のグレーボックス浸透試験手法であるTACを導入する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:14:29 GMT)
Probing a Vision-Language-Action Model for Symbolic States and Integration into a Cognitive Architecture [6.3] 我々はOpenVLAの隠された層を探索し、オブジェクトの特性、関係、動作状態の象徴的表現を明らかにする。
実時間状態監視にこれらのシンボル表現を利用する統合DIARC-OpenVLAシステムについて述べる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:11:11 GMT)
Bridging the inference gap in Mutimodal Variational Autoencoders [6.2] マルチモーダル変分オートエンコーダは、観測されたモダリティから観測されていないモダリティを生成するための多目的でスケーラブルな方法を提供する。
エキスパートの混合集合を用いた最近のモデルは、複雑なデータセットにおける生成品質を制限する理論的に基礎的な制限に悩まされている。
本稿では,混合アグリゲーションを導入することなく,結合分布と条件分布の両方を学習できる新しい解釈可能なモデルを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:43:55 GMT)
Adversarial Attacks for Drift Detection [6.2] 本研究は、よく用いられるドリフト検出スキームの欠点について研究する。
ドリフト中のデータストリームを検出せずに構築する方法を示す。
特に,一般的な検出手法に対して,可能なすべての逆数を計算する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:51:23 GMT)
Ontology-Guided, Hybrid Prompt Learning for Generalization in Knowledge Graph Question Answering [6.2] OntoSCPromptは,2段階アーキテクチャを持つ新しい大規模言語モデル(LLM)ベースのKGQAアプローチである。
OntoSCPromptはまず、SPARQLクエリ構造(SELECT、ASK、WHERE、トークン不足のためのプレースホルダーなどのSPARQLキーワードを含む)を生成し、KG固有の情報でそれらを埋める。
両段階で生成されたSPARQLクエリの正しさと実行性を保証するために,タスク固有のデコーディング戦略をいくつか提示する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:47:58 GMT)
Improving the Perturbation-Based Explanation of Deepfake Detectors Through the Use of Adversarially-Generated Samples [6.1] 本稿では, ディテクターによってディープフェイクに分類された入力画像の逆生成サンプルを利用する方法を提案する。
我々は、これらのサンプルをNature Evolution Strategiesに基づいて生成し、元のディープフェイク検出器の決定を反転させ、これらのサンプルを本物として分類することを目的としている。
この考え方を4つの摂動に基づく説明法に適用し,提案手法の性能評価を行う。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:47:34 GMT)
A Self-supervised Multimodal Deep Learning Approach to Differentiate Post-radiotherapy Progression from Pseudoprogression in Glioblastoma [6.0] グリオ芽腫(GBM)に対する放射線治療後のPsPとTrue Progression(TP)の正確な鑑別は最適な治療計画に不可欠である。
本研究では, 日常的な解剖学的MRI画像, 臨床パラメータ, RT治療計画情報からの補完情報を利用して, 予測精度を向上させるマルチモーダル深層学習手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:57:57 GMT)
CAST: Cross Attention based multimodal fusion of Structure and Text for materials property prediction [6.0] グラフニューラルネットワーク(GNN)は、結晶構造をグラフとして表現する能力によって際立っている。
これらの方法は、クリスタルシステムや繰り返しユニット接続といった重要なグローバル情報を失うことが多い。
本稿では,重要な資料情報を保持するために,グラフとテキストのモダリティを統合したマルチモーダル融合モデルであるCASTを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:29:39 GMT)
Divide and Conquer: Provably Unveiling the Pareto Front with Multi-Objective Reinforcement Learning [5.9] 反復パレート参照最適化(IPRO)を導入する。
IPROはParetoフロントを制約付き単目的問題の列に分解する。
問題固有の単目的解法を利用することで、本手法は多目的強化学習を超える応用を約束する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:55:20 GMT)
PGB: One-Shot Pruning for BERT via Weight Grouping and Permutation [5.9] 本稿では,BERT$(PGB)に対する$textitPermutation and Groupingと呼ばれる,BERTのための新しい半構造化ワンショットプルーニング手法を提案する。
PGBは、各重みの重要な群を置換により同定し、他の重み全てを多面的注意層とフィードフォワード層の両方の構造として同定する。
BERT$_textBASE$の実験結果は、PGBが計算コストと精度の保存の観点から最先端の構造化プルーニング法より優れていることを示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:34:41 GMT)
A Fitness-assignment Method for Evolutionary Constrained Multi-objective Optimization [5.8] IcSDE+と呼ばれる単一人口適応型CMOEAを提案する。
IcSDE+は制約違反(c)、シフトベース密度推定(SDE)、目的の和(+)の効率的な融合である
IcSDE+の性能は、異なる特徴を持つ6つのベンチマークスイート上の9つの最先端CMOEAと比較して好意的に比較される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:41:05 GMT)
Unifying and Optimizing Data Values for Selection via Sequential-Decision-Making [5.8] 本研究では,選択に適用されるデータ値を逐次決定問題として再定義可能であることを示す。
本稿では,学習された二部グラフを代理ユーティリティモデルとして用いた効率的な近似手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:03:10 GMT)
Optimal Neural Network Approximation for High-Dimensional Continuous Functions [5.7] 我々は、その近似において任意の精度を達成するために、少なくとも幅$d$、従って少なくとも$d$のニューロンやパラメータを必要とする連続関数の族を示す。
これは、パラメータが$d$で指数関数的に成長するいくつかの近似方法とは異なり、入力次元$d$で線形に成長するという意味で、ユニークな非ゼロパラメータの数が最適であることを示している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:37:37 GMT)
Division-of-Thoughts: Harnessing Hybrid Language Model Synergy for Efficient On-Device Agents [5.6] Division-of-Thoughts(DoT)は、ローカルとクラウドベースの言語モデル間のシナジーを活用する共同推論フレームワークである。
DoTは平均推論時間とAPIコストを66.12%と83.57%削減し、最高のベースライン手法で同等の推論精度を達成している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:40:25 GMT)
Generative Autoregressive Transformers for Model-Agnostic Federated MRI Reconstruction [5.5] FedGATは、生成的自己回帰変換器に基づくモデルに依存しないFL技術である。
マルチサイトMR画像の分布をキャプチャするグローバルな生成前のトレーニングを分散化する。
フレキシブルなコラボレーションをサポートしながら、より優れたサイト内およびサイト間再構築のパフォーマンスを楽しみます。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:45:16 GMT)
An Empirical Study on the Impact of Code Duplication-aware Refactoring Practices on Quality Metrics [5.5] 128のオープンソースJavaプロジェクトから、日々の変更で開発者が適用し、ドキュメント化した332のコミットのコーパスを抽出します。
我々は、これらの操作が共通の最先端の設計品質指標に与える影響を実証的に分析する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:34:25 GMT)
MLPerf Power: Benchmarking the Energy Efficiency of Machine Learning Systems from Microwatts to Megawatts for Sustainable AI [5.5] 機械学習(ML)技術は、さまざまなシステムで電力消費が急増している。
本稿では,マイクロワットからメガワットまでの電力レベルでMLシステムのエネルギー効率を評価するための総合的なベンチマーク手法であるSerf Powerを紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:16:22 GMT)
Saflo: eBPF-Based MPTCP Scheduler for Mitigating Traffic Analysis Attacks in Cellular Networks [5.4] Safloスケジューラは、追加のセキュリティ関連タスクと組み合わせたマルチパス通信を採用している。
セルラーネットワークにおけるビデオ識別とユーザ識別攻撃の精度を大幅に低下させる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:20:07 GMT)
Improving Accuracy and Generalization for Efficient Visual Tracking [5.4] 我々は,OODシークエンスにおいてもトラッキング性能を大幅に向上させる,高効率なSiameseトラッカーであるSiamABCを紹介する。
SiamABCは、ターゲットの動的変動を橋渡しする方法として、新しいアーキテクチャ設計を活用している。
実験の結果,SamABC は OOD セットの精度を保ちながら,OOD セットにおいて顕著な性能向上を示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:25:39 GMT)
Identifying Flaky Tests in Quantum Code: A Machine Learning Approach [5.3] 量子システムの基本的な特徴である不確定性は、量子プログラムにおけるフレキテストの可能性を高める。
量子プログラムにおけるフレキなテストを自動的に検出するために,複数の機械学習モデルを活用する,新しい機械学習プラットフォームを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:43:51 GMT)
Are the Majority of Public Computational Notebooks Pathologically Non-Executable? [5.3] 従来の実行可能性の概念は過度に厳格であり、多くのノートを誤って分類し、実行不可能性を過大評価している、と私たちは主張する。
実行可能性を部分的に改善しても、コードの理解が向上し、動的解析のための経路を提供する。
34,659個のノートを含む42,546個の人気のノートブックのデータセットでは21.3%が本当に手術不能である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:16:20 GMT)
Optimal Control of Fluid Restless Multi-armed Bandits: A Machine Learning Approach [5.2] 流体レスレスマルチアームバンディット(FRMAB)の最適制御のための機械学習手法を提案する。
FRMAB問題の基本特性を導出することにより,効率的な機械学習に基づくアルゴリズムを設計する。
提案手法は高品質な状態フィードバックポリシを出力し,流体問題に対する直接数値アルゴリズムと比較して最大2600万倍の高速化を実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:34:36 GMT)
Rank Also Matters: Hierarchical Configuration for Mixture of Adapter Experts in LLM Fine-Tuning [5.1] 本稿では,大規模言語モデル(LLM)のための専門家のアロケーションとランク設定のための階層型スキームHILOを提案する。
HILOは、層間のアダプタエキスパートの数とランクを動的に調整し、アダプタの粒度の異なるモデルレイヤの表現複雑性に適合する。
複数のベンチマークタスクの実験では、HILOが既存のメソッドよりも精度が高く、トレーニング可能なパラメータが少ないことが示されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:58:03 GMT)
Lexical Substitution is not Synonym Substitution: On the Importance of Producing Contextually Relevant Word Substitutes [5.1] モデルに送信された文脈情報を強化するために,原文を利用した単純な拡張手法であるConCatを導入する。
本研究は,文の類似度とタスクパフォーマンスを指標とした定量的評価を含む。
また,従来手法とは対照的に,利用者が提案した代替品を優先することを示す定性的な人間分析を行った。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:05:50 GMT)
Context Steering: Controllable Personalization at Inference Time [5.1] Context Steering(CoS)は、次のトークン予測におけるコンテキストの影響を増幅する、トレーニング不要なデコーディングアプローチである。
自己回帰型LDMにはCoSが適用可能であることを示し、パーソナライズされたレコメンデーションにおいて高い性能を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:33:08 GMT)
Unpicking Data at the Seams: Understanding Disentanglement in VAEs [5.1] データの切り離し、あるいは統計的に独立した要因を特定することは、機械学習の多くに関係している。
絡み合いは、変分オートエンコーダ(VAE)、生成的逆数ネットワーク(Generative Adversarial Networks)、拡散モデルなど、いくつかの生成パラダイムで生じる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:35:37 GMT)
Revisiting Reliability in Large-Scale Machine Learning Research Clusters [5.0] 信頼性は、大規模な機械学習インフラストラクチャを操作する上での根本的な課題である。
インフラストラクチャ障害に関する何十年もの研究にもかかわらず、さまざまなスケールでのジョブ障害の影響は、まだ不明である。
本稿では,2つの大規模マルチテナントMLクラスタを管理する視点について述べる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:12:21 GMT)
Content-Rich AIGC Video Quality Assessment via Intricate Text Alignment and Motion-Aware Consistency [4.9] 我々はSora-era AIGCビデオの評価のためにtextbfCRAVE (underlineContent-underlineRich underlineAIGC underlineAIGC underlineEvaluator) を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:41:24 GMT)
Optical interference by amplitude measurement [4.8] 我々は、干渉を明らかにするために、フィールド振幅のホモダイン測定による手法の理論と実験の両方を包括的に研究する。
これは、光の干渉経路に区別可能性があるにもかかわらず、古典場と量子場の両方で有効である。
この手法は入力フィールドのコヒーレンス長を超える経路不均衡を持つ非平衡干渉計の干渉を回復するのに特に有用である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:11:33 GMT)
K-COMP: Retrieval-Augmented Medical Domain Question Answering With Knowledge-Injected Compressor [4.8] Retrieval-augmented Question answering (QA)は外部情報を統合し、ドメイン知識に欠ける読者モデルのQA精度を向上させる。
しかし、クローズドドメインのために検索された文書は高い専門知識を必要とするため、読者モデルはテキストを完全に理解することが困難である可能性がある。
本稿では,正しい解答に必要な知識を提供するK-compを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:41:07 GMT)
Steady-state coherence in multipartite quantum systems: its connection with thermodynamic quantities and impact on quantum thermal machines [4.8] マルチパーティイト系の異なるサブシステム間における量子コヒーレンスの一意的な寄与と熱電流に対する寄与について検討する。
提案方式は, 冷蔵庫, エンジン, アクセルとして機能し, 構成設定に非常に敏感である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:26:01 GMT)
DECAF: Learning to be Fair in Multi-agent Resource Allocation [4.8] 本研究では,資源集中配置における公平かつ効率的な政策を学習するための手法を提案する。
提案手法は,マルチエージェントシステムにおける公平性のための新しい,汎用的なフレームワークにおいて,長期的公正性学習に適用される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:29:11 GMT)
Single-Domain Generalized Object Detection by Balancing Domain Diversity and Invariance [4.8] オブジェクト検出のための単一ドメイン一般化(S-DGOD)は、単一のソースドメインから未知のターゲットドメインに知識を転送することを目的としている。
ドメイン間の固有の多様性のため、不変性に過度に重点を置いていると、モデルが実際の画像の違いを見落としてしまう可能性がある。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:41:24 GMT)
Sparsity-Based Interpolation of External, Internal and Swap Regret [4.8] 本稿では,$phi$-regret最小化によるパフォーマンス指標のコンパレータについて検討する。
本稿では,インスタンス適応型$phi$-regretバウンダリを実現する単一アルゴリズムを提案する。
従来の$phi$-regretの最小化から外部後悔の最小化への削減を前提に、我々は後者をさらにオンライン線形回帰に変換することを目的としている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:47:52 GMT)
MD-BERT: Action Recognition in Dark Videos via Dynamic Multi-Stream Fusion and Temporal Modeling [4.7] 本稿では,ガンマ補正やヒストグラムなどの補完的な前処理技術を生の暗黒フレームと組み合わせた新しいマルチストリーム手法を提案する。
ARID V1.0とARID1.5のダークビデオデータセットに関する大規模な実験は、MD-BERTが既存の手法より優れていることを示している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:26:47 GMT)
CraftRTL: High-quality Synthetic Data Generation for Verilog Code Models with Correct-by-Construction Non-Textual Representations and Targeted Code Repair [4.6] 本稿では,従来手法の合成データを用いて,Verilog 符号化における微調整 LLM の解析を行った。
我々は、非テクスト表現の扱いの困難さと、ランダムに「マイナー」ミスを犯すモデルによるトレーニング中の大きな変動の2つを識別する。
我々の微調整されたStarcoder2-15Bは、VerilogEval-Machine, VerilogEval-Human, RTLLMで3.8%、10.9%、pass@1で6.6%、最先端の結果よりも優れています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:39:27 GMT)
UniCP: A Unified Caching and Pruning Framework for Efficient Video Generation [4.6] 効率的なビデオ生成のための統合キャッシング・プルーニングフレームワークUniCPを提案する。
キャッシュウィンドウの調整と冗長なコンポーネントのプルーニングにより、UniCPは計算効率を高め、ビデオディテールの忠実さを維持する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:56:11 GMT)
A Survey on Backdoor Threats in Large Language Models (LLMs): Attacks, Defenses, and Evaluations [4.3] 我々は、トレーニングタイムのホワイトボックスバックドア攻撃という2つのサブディビジョンの1つに対して、機械学習攻撃を分類するために、一般的な分類に適応する。
また,バックドア攻撃に対する防御手法についても検討した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:43:05 GMT)
MPAX: Mathematical Programming in JAX [4.3] MPAXは、線形プログラミングを機械学習に統合するための汎用的で効率的なツールボックスである。
バッチ解決、自動微分、デバイス並列化といった機能とともに、ハードウェアアクセラレーションをネイティブにサポートする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:36:50 GMT)
BiDepth Multimodal Neural Network: Bidirectional Depth Deep Learning Architecture for Spatial-Temporal Prediction [4.3] 本稿では,双方向深度変調を用いたBDMNN(BiDepth Multimodal Neural Network)を提案する。
ケーススタディでは,都市交通予測のための平均二乗誤差を12%削減し,降雨予測を15%改善した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:35:56 GMT)
Large Language Models in Healthcare [4.1] 大規模言語モデル(LLM)は医療の変革を約束する。
彼らの成功には、臨床ニーズに合わせて厳格な開発、適応、評価戦略が必要である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:53:33 GMT)
Had enough of experts? Quantitative knowledge retrieval from large language models [4.1] 大規模言語モデル(LLM)は、説得力のある自然言語配列を生成する能力について広く研究されている。
我々は、専門家のような事前知識を抽出し、欠落したデータを出力することで、LLMを活用してベイズモデルを強化するフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:52:46 GMT)
Syntriever: How to Train Your Retriever with Synthetic Data from LLMs [4.1] ブラックボックスLLMの合成データを用いた検索者のための学習フレームワークであるSyntrieverを提案する。
そこで我々は,LLM選好を正規化して学習するために,部分的なPockett-Luceランキングと呼ばれる選好モデルを提案する。
実験により、Syntrieverは様々なドメインのベンチマークデータセット上で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:19:59 GMT)
On Effects of Steering Latent Representation for Large Language Model Unlearning [4.1] Representation Misdirection for Unlearning (RMU)は、大規模言語モデル(LLM)の学習に有効な方法である。
中間層での表現を忘れることによってトークンの信頼性が低下し,LSMが間違った応答やナンセンスな応答を発生させることを示す。
適応的RMU(Adaptive RMU)は,ほとんどの層で非学習を効果的に行う,シンプルで効果的な代替手法である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:25:18 GMT)
Robust Decision Aggregation with Adversarial Experts [4.0] 我々は、真理と敵の双方の専門家が存在する場合に、堅牢な集約問題を考える。
我々は,最悪の情報構造と敵戦略の下で,後悔を最小化する予測を出力する最適なアグリゲータを見つけることを目的とする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:49:16 GMT)
Quantum noise spectroscopy of superconducting critical dynamics and vortex fluctuations in a high-temperature cuprate [4.0] 超伝導材料の新規かつ強力な量子センシングプラットフォームとして,ダイヤモンド中の窒素空孔中心を導入する。
高T_c$杯レートBi$Sr$CaCu$$O$_8+delta$ (BSCCO)におけるいくつかの低エネルギー現象を探索することにより、我々のアプローチの強みを実証する。
印加磁場が存在しない場合, 臨界温度$T_capprox90$K付近でNV緩和時間の急激な減少が観測された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:00:01 GMT)
Digital Gatekeeping: An Audit of Search Engine Results shows tailoring of queries on the Israel-Palestine Conflict [4.0] 私たちはイスラエルとパレスチナの紛争に焦点を当て、DuckDuckGo、Google、Yahooの3つの検索エンジンの動作を監査するプライバシー保護ツールを開発しました。
従来の調査では、一般的なトピックに対して軽度なパーソナライゼーションしか見つからなかったが、位置情報やブラウジングの嗜好に基づく大きなカスタマイズが見られた。
紛争に関するクエリは、無関係なクエリよりもカスタマイズされ、結果が紛争の描写に関して中立的ではなかった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:05:30 GMT)
Emancipatory Information Retrieval [3.9] 本論文は,コンピュータによる情報アクセスの課題における役割を挑発するものである。
ここでの「解放」という言葉は、すべての人々の普遍的人間化に関する道徳的な懸念を表している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:09:25 GMT)
Analyze Feature Flow to Enhance Interpretation and Steering in Language Models [3.8] 本研究では,スパースオートエンコーダによって発見される特徴を,大規模言語モデルの連続的な層にわたって体系的にマッピングする手法を提案する。
データフリーなコサイン類似性技術を使用することで、各ステージで特定の機能が持続、変換、あるいは最初に現れるかを追跡できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:55:15 GMT)
Understanding Abandonment and Slowdown Dynamics in the Maven Ecosystem [3.8] 4つに1つの図書館は創設年を超えて生き残れない。
放棄された図書館の中には、ライフサイクルの後半に頻繁なリリース活動のバーストを示すものもある。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:21:10 GMT)
Faster computation of nonstabilizerness [3.8] 安定度は、ランクベースのシミュレーターを用いてシミュレーションコストを推定するのに有用なツールである。
安定度を計算するために,より高速な数値アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:13:11 GMT)
ChamaleonLLM: Batch-Aware Dynamic Low-Rank Adaptation via Inference-Time Clusters [3.7] ChamaleonLLMは、大規模言語モデルの推論時適応を可能にする新しいフレームワークである。
クラスタ化されたバッチの集計統計に基づいて,デコーダ重みに対する適応的な修正を動的に生成する。
同様の入力をインテリジェントにグループ化し、ハイパーネットワーク経由でコンテキスト対応の低ランク更新を演算することで、ChamaleonLLMは大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:57:06 GMT)
PixFoundation: Are We Heading in the Right Direction with Pixel-level Vision Foundation Models? [3.7] 画素レベルのMLLMの現在の傾向は、大規模ラベル付きデータに基づいて画素レベルの接地監督を訓練することである。
近年の視覚中心のベンチマークで評価すると,このようなMLLMは視覚的質問応答の弱い能力を示す。
我々は, PixFoundation と呼ばれる任意の MLLM に接続可能な接地情報を抽出するために, 単純なベースラインを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:29:50 GMT)
RWKV-UI: UI Understanding with Enhanced Perception and Reasoning [3.7] RWKVアーキテクチャに基づくビジュアル言語モデルであるRWKV-UIを提案する。
モデルトレーニングでは、Webページレイアウト構造をよりよく理解するための視覚的プロンプトとしてレイアウト検出を導入する。
我々は,Webページの内容を理解し,解釈する能力を高めるために,Chain-of-Thought(CoT)機構に基づく視覚的プロンプトを設計する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:02:40 GMT)
When predict can also explain: few-shot prediction to select better neural latents [3.6] 共平滑化(co-smoothing)は、潜伏変数を推定し、ホールドアウトチャネルに沿って観測を予測するために用いられる。
本研究では,協調平滑化予測フレームワークの限界を明らかにし,その対策を提案する。
基礎的真理をより正確に反映した潜伏変数を生成するために設計された新しい予測指標を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:26:06 GMT)
Knowing When to Stop Matters: A Unified Algorithm for Online Conversion under Horizon Uncertainty [3.6] オンライン変換における重要な課題は、地平線の不確実性の下で意思決定を管理することである。
これらの地平線モデルに対して最適な競合保証を実現する統一アルゴリズムを提案する。
アルゴリズムを学習強化バージョンに拡張し、水平線予測を利用して性能を適応的にバランスさせる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:06:06 GMT)
Mitigating the Participation Bias by Balancing Extreme Ratings [3.6] 我々は、参加バイアスの下で、ロバストな評価集計タスクについて検討する。
私たちの目標は、集計された評価と、基礎となるすべての評価の平均との間の2乗損失を最小化することです。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:58:46 GMT)
Non-Variational Quantum Random Access Optimization with Alternating Operator Ansatz [3.6] 量子ランダムアクセス最適化(QRAO)は、量子最適化の空間要求を減らすために提案されている。
インスタンスに依存しない'固定'パラメータは優れた性能を示し、変分パラメータ最適化の必要性を排除した。
本研究は,早期のフォールトトレラント量子コンピュータ上でのQRAOの実践的実行の道を開くものである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:25:31 GMT)
Detecting Backdoor Attacks via Similarity in Semantic Communication Systems [3.6] 本研究は, セマンティックな類似性を利用してバックドア攻撃を検出する防衛機構を提案する。
意味的特徴空間のずれを分析し,しきい値に基づく検出フレームワークを確立することにより,有毒な試料を効果的に同定する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:22:36 GMT)
An object detection approach for lane change and overtake detection from motion profiles [3.5] 本稿では,移動プロファイルに適用した新しい物体検出手法を用いて,オーバーテイクおよびレーン変更動作の同定を行う。
モデルをトレーニングし、テストするために、ヘテロジニアスなダシュカムビデオから得られたモーションプロファイル画像の内部データセットを作成しました。
標準のオブジェクト検出アプローチに加えて、CoordConvolutionレイヤを含めることで、モデルの性能がさらに向上することを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:36:35 GMT)
Disrupt Your Research Using Generative AI Powered ScienceSage [3.5] $textbfScienceSage$を使えば、研究者は知識ベース(KB)を構築し、保存し、更新し、クエリすることができる。
KBは、ベクターインデックスとナレッジグラフ(KG)インデックスの両方において、与えられたドメインのユーザの知識/情報の符号化を行い、効率的な情報検索とクエリを行う。
同じKBのセットは、$textbfScienceSage$: 'Generate Research Report'、'Chat With Your Documents'、'Chat With Anything'の3つの関数を相互接続する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:24:42 GMT)
From Probability to Counterfactuals: the Increasing Complexity of Satisfiability in Pearl's Causal Hierarchy [3.4] PCHのレベルによって, NPPP, PSPACE, NEXP完全満足度の問題が生じることを示す。
一方、完全言語の場合、すなわち加法、余分化、乗算が可能である場合、反事実レベルの満足度は確率的・因果的なレベルと同じであることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:53:16 GMT)
Pulsed Vector Atomic Magnetometer Using an Alternating Fast-Rotating Field [3.4] パルス87ドルRbのスカラー原子磁気センサに高速回転磁界を印加したベクトル原子磁気センサを導入する。
勾配計モードで作動すると、磁力計は35$mathrmfT/sqrtHz$(0.7部/億)の磁場勾配感度と6$mathrmnrad/sqrtHz$の角度分解能を50$mu$Tの地球磁場強度で達成する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:16:45 GMT)
Many-body adiabatic passage: Instability, chaos, and quantum classical correspondence [3.4] 我々は,低次元カオス(3サイト連鎖)と高次元カオス(3サイト以上)を示すBose-Hubbard鎖におけるSTIRAP様のスキームを考える。
転送プロトコルによって生成されるダイナミクスは、古典的で量子的なカオスフィンガープリントを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:25:45 GMT)
TQ-DiT: Efficient Time-Aware Quantization for Diffusion Transformers [3.4] モデルの量子化は、より低い精度で重みとアクティベーション値を表す。
時間群量子化(TGQ)は、アクティベーションの時間的変動に起因する量子化誤差を低減するために提案される。
提案アルゴリズムは,W8A8でFIDが0.29増加し,元の完全精度モデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:14:52 GMT)
Introducing 3D Representation for Medical Image Volume-to-Volume Translation via Score Fusion [3.4] Score-Fusionは、垂直に訓練された2次元拡散モデルをスコア関数空間に組み込むことで、3次元表現を効果的に学習する新しいボリューム変換モデルである。
Score-Fusionは,3次元医用画像の高分解能・モダリティ変換において,高い精度と容積忠実性が得られることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:31:27 GMT)
Fault Localization via Fine-tuning Large Language Models with Mutation Generated Stack Traces [3.3] 本稿では,スタックトレース情報のみに基づいて障害をローカライズする新たな手法を提案する。
64,369件のクラッシュの微調整によって、コードベースの4100万件の突然変異により、66.9%の精度で、クラッシュの根本原因の位置を正確に予測できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:39:25 GMT)
Global Perspectives of AI Risks and Harms: Analyzing the Negative Impacts of AI Technologies as Prioritized by News Media [3.3] AI技術は経済成長とイノベーションを促進する可能性があるが、社会に重大なリスクをもたらす可能性がある。
これらのニュアンスを理解する一つの方法は、メディアがAIにどう報告するかを調べることである。
我々は、アジア、アフリカ、ヨーロッパ、中東、北アメリカ、オセアニアにまたがる27カ国にまたがる、広く多様なグローバルニュースメディアのサンプルを分析した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:32:31 GMT)
How Reliable are Causal Probing Interventions? [3.2] Causal Probingは、その表現の介入がアウトプットに与える影響を調べることによって、基礎モデルを分析することを目的としている。
近年の研究では、いくつかの主要な因果探索法の理論的根拠に疑問が投げかけられている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:16:28 GMT)
DAPO-QAOA: An algorithm for solving combinatorial optimization problems by dynamically constructing phase operators [3.1] 本稿では,従来のレイヤの出力と近傍探索手法に基づいて位相演算子を構成する動的適応位相演算子 (DAPO) アルゴリズムを提案する。
DAPOは高い近似比を達成し、2量子RZZゲート、特に密度グラフにおいて著しく減少する。
バニラQAOAと比較すると、DAPOは同じ深さでRZZゲートの66%しか使用せず、より良い結果をもたらす。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:24:05 GMT)
Can LLMs Hack Enterprise Networks? Autonomous Assumed Breach Penetration-Testing Active Directory Networks [3.1] 我々は,LLM(Large Language Models)によって駆動される新しいプロトタイプを紹介し,実生活におけるActive Directoryテストベッド内のアカウントを妥協する。
プロトタイプのソースコード、トレース、分析されたログは、集団サイバーセキュリティを強化するためにオープンソースとしてリリースされている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:12:43 GMT)
Consistency of augmentation graph and network approximability in contrastive learning [3.1] 拡張グラフ Laplacian の点次およびスペクトルの整合性について解析する。
ラプラシアンは自然データ多様体上の重み付きラプラス・ベルトラミ作用素に収束することを示す。
これらの整合性は、グラフラプラシアスペクトルが多様体幾何学を効果的に捉えることを保証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:55:51 GMT)
Leveraging Geolocation in Clinical Records to Improve Alzheimer's Disease Diagnosis Using DMV Framework [3.0] アルツハイマー病(AD)早期発見は、タイムリーな介入を可能にし、患者の予後を改善するために重要である。
本稿では,Llama3-70B と GPT-4o を埋め込みモデルとして用いた DMV フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:33:59 GMT)
Too Noisy To Learn: Enhancing Data Quality for Code Review Comment Generation [3.0] オープンソースのデータセットは、自動コードレビュータスクのためのニューラルネットワークのトレーニングに使用される。
これらのデータセットには、クリーニングメソッドにもかかわらず持続する大量のノイズの多いコメントが含まれている。
大規模言語モデル(LLM)を用いて,これらのデータセットをさらにクリーン化する手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:19:12 GMT)
KAN See In the Dark [3.0] 既存の低照度画像強調法は、不均一照明とノイズ効果により、通常の低照度画像と低照度画像との複雑な非線形関係に適合することが困難である。
最近提案されたコルモゴロフ・アルノルドネットワーク(KAN)はスプラインベースの畳み込み層と学習可能なアクティベーション関数を備え、非線形依存を効果的に捉えることができる。
本稿では,kanをベースとしたkan-Blockを設計し,低照度画像強調に革新的に適用し,線形ネットワーク構造に制約された現在の手法の限界を効果的に緩和し,解釈可能性の欠如を解消する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:34:07 GMT)
Debiasing Architectural Decision-Making: An Experiment With Students and Practitioners [3.0] 本研究は, 専門職の様々な段階において, 個人による嫌悪ワークショップを設計し, 評価することを目的とした。
ワークショップは実践者に対して,より重大な影響があることが分かりました。
我々は,実践者のシステムへの愛着が,バイアスに対する感受性の原因であると仮定する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:12:53 GMT)
Statistical guarantees for continuous-time policy evaluation: blessing of ellipticity and new tradeoffs [2.9] 連続時間マルコフ拡散過程における値関数の推定について検討する。
我々の研究は、最小二乗時間差法に対して漸近的でない統計的保証を提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:39:03 GMT)
Bots can Snoop: Uncovering and Mitigating Privacy Risks of Bots in Group Chats [2.8] SnoopGuardはセキュアなグループメッセージングプロトコルで、チャットボットに対するユーザのプライバシを保証する。
SnoopGuardは、$O(log n + m)$メッセージ送信の複雑さを、SoAプロトコルの$O(log n + m)$と比較して達成する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:58:17 GMT)
When Anti-Fraud Laws Become a Barrier to Computer Science Research [2.8] 我々は、コンピュータサイエンス研究のいくつかの領域で発生した反詐欺と偽装の問題を分析・分類する。
我々は、AIシステムの攻撃や監査、法的識別を含む研究の2つの重要な政策分野において、反詐欺法の重要性を強調した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:43:44 GMT)
MuJo: Multimodal Joint Feature Space Learning for Human Activity Recognition [2.8] HAR(Human Activity Recognition)は、人工知能における長年の問題であり、幅広い分野で応用されている。
本研究では,HAR 性能を向上させるため,総合的な Fitness Multimodal Activity データセット (FiMAD) を導入する。
本研究では,MM-Fit,myoGym, MotionSense, MHEALTHなどの実HARデータセットの性能向上を図る。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:37:09 GMT)
A Hybrid Model for Weakly-Supervised Speech Dereverberation [2.7] 本稿では,最小限の音響情報と残響(ウェット)音声を用いた音声認識システムを改善するための新たな学習手法を提案する。
実験結果から,本手法は,最先端技術よりも,音声の残響に使用される様々な客観的指標に対して,より一貫した性能を達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:21:22 GMT)
PINT: Physics-Informed Neural Time Series Models with Applications to Long-term Inference on WeatherBench 2m-Temperature Data [2.7] PINT(Physics-Informed Neural Time Series Models)は、物理制約をニューラルネットワークの時系列モデルに統合するフレームワークである。
ERA5 WeatherBenchデータセットにPINTを適用し,2m温度データの長期予測に着目した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:19:34 GMT)
Deep Meta Coordination Graphs for Multi-agent Reinforcement Learning [2.7] 多エージェント強化学習(MARL)における協調政策学習のための深層メタコーディネートグラフ(DMCG)
DMCGは、エージェント間の高次および間接的な関係をキャプチャする。
その後、グラフ畳み込みネットワークモジュールを使用して、エンドツーエンドで強力な表現を学習する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:35:52 GMT)
Pre-stack and post-stack seismic inversion using quantum computing [2.6] 本研究では, 地震インバージョンに対する量子コンピューティングの新しい応用法を提案する。
これは、P波とS波の両方のインピーダンスを量子アニールを用いて推定する地震データを逆転する最初の例である。
この進歩により、モデルパラメータあたりのキュービット数が大幅に減少する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:33:42 GMT)
Audio-visual cross-modality knowledge transfer for machine learning-based in-situ monitoring in laser additive manufacturing [2.6] 本稿では, LAM in-situ モニタリングのための相互モダリティ知識伝達手法について紹介する。
3つのCMKT法が提案され、セマンティックアライメント、完全教師付きマッピング、半教師付きマッピングである。
LAMインサイト欠陥検出のケーススタディでは,CMKT法とマルチモーダル・オーディオ・ビジュアル・フュージョンを比較した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:57:41 GMT)
DiffNMR2: NMR Guided Sampling Acquisition Through Diffusion Model Uncertainty [2.5] 本稿では,タンパク質NMRデータに基づく拡散モデルに基づく新しいサブサンプリング手法を提案する。
提案手法は, モデル不確実性を用いてアンダーサンプルスペクトルを反復的に再構成し, その後のサンプリングをガイドし, 取得時間を著しく短縮する。
この進歩は、薬物発見から物質科学まで、迅速かつ高分解能のスペクトル分析が不可欠である多くの応用を約束する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:10:28 GMT)
TerraQ: Spatiotemporal Question-Answering on Satellite Image Archives [2.5] TerraQは、衛星アーカイブの質問応答エンジンである。
特定の基準を満たす衛星画像の要求を処理するために構築されている。
リクエストは、専門知識ベースからイメージとメタデータを参照することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:43:17 GMT)
It's All in The [MASK]: Simple Instruction-Tuning Enables BERT-like Masked Language Models As Generative Classifiers [2.4] 生成分類にマスク付き言語モデリングヘッドを利用するエンコーダモデルであるModernBERT-Large-Instructを導入する。
当社のアプローチでは、重度の事前処理を必要としない、意図的な単純なトレーニングループと推論メカニズムを採用しています。
ModernBERT-Large-Instructは、分類と知識に基づくタスクの両方において強力なゼロショット性能を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:47:37 GMT)
Vision-Integrated LLMs for Autonomous Driving Assistance : Human Performance Comparison and Trust Evaluation [2.3] 本研究では,Large Language Model (LLM) を用いた自律運転支援システムを提案する。
YOLOv4 と Vision Transformer (ViT) を組み合わせた視覚アダプタは、包括的な視覚的特徴を抽出する。
このシステムは、状況を説明する上での人間のパフォーマンスを忠実に反映し、適切な応答を生成する上での人間の決定と適度に整合する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:19:28 GMT)
Simulating the Emergence of Differential Case Marking with Communicating Neural-Network Agents [2.2] ディファレンシャル・ケースマーキング(英: Differential Case Marking、DCM)は、文法的ケースマーキングが意味、実用的、その他の要因に基づいて選択的に適用される現象である。
本研究では, エージェントがまず人工言語を習得し, コミュニケーションを行うための枠組みを提案する。
言語やセマンティックな嗜好を事前に経験していない,非常に汎用的なコミュニケーション最適化アルゴリズムとニューラルネットワーク学習者を用いて,学習だけではDCMに結びつかないことを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:00:53 GMT)
Zero-shot Meta-learning for Tabular Prediction Tasks with Adversarially Pre-trained Transformer [2.2] 本稿では、実世界のデータセットを事前学習することなく、表形式の予測タスクでゼロショットメタ学習を行うことのできるAdversarially Pre-trained Transformer(APT)を提案する。
APTは、異なる合成データセットで意図的にモデルに挑戦する敵対的な合成データエージェントで事前訓練されている。
筆者らのフレームワークは,データセットの特徴をフィルタリングすることなく,小さな分類タスクにおける最先端のパフォーマンスと一致していることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:58:11 GMT)
SBOM Challenges for Developers: From Analysis of Stack Overflow Questions [2.1] SBOMの使用に関する解決された質問の比率は15.0%であり、非常に低い。
新しい質問の数は2020年から2023年にかけて着実に増えている。
SBOMユーザには、SBOMツールに3つの大きな課題がある。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:08:29 GMT)
CTD4 -- A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Critics [2.1] CDRL(Categorical Distributional Reinforcement Learning)は,複雑なタスクの学習において,より優れたサンプル効率を示す。
本稿では,連続行動空間に適した連続分布モデル自由RLアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:52:59 GMT)
Multiple Invertible and Partial-Equivariant Function for Latent Vector Transformation to Enhance Disentanglement in VAEs [2.0] 帰納的バイアスを注入するために,Multiple Invertible and partial-equivariant transformation (MIPE-transformation) と呼ばれる新しい手法を提案する。
3Dカー、3D形状、dSpritesデータセットの実験では、MIPE変換は最先端のVAEのアンタングル性能を改善する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:08:12 GMT)
Should Code Models Learn Pedagogically? A Preliminary Evaluation of Curriculum Learning for Real-World Software Engineering Tasks [2.0] 近年の研究では、合成コードの難易度に基づく漸進的な学習により、カリキュラム学習がコード関連タスクのパフォーマンスを向上させることが示されている。
本稿では,コードクローン検出とコード要約のタスクを通じて,事前学習されたコードモデル(CodeT5)がCLの下でどのように学習されるかを検討する。
CodeXGLUEベンチマークに関する実証研究は、これまでの研究と対照的な結果を示し、そのモデルでは破滅的な忘れ込みとショートカット学習の兆候が見られた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:33:08 GMT)
Detection, Retrieval, and Explanation Unified: A Violence Detection System Based on Knowledge Graphs and GAT [2.0] 本稿では,TIO(Three-in-One)システムと呼ばれる新しい暴力検出システムを提案する。
システムは、暴力行為の可能性のある動画に対して、大きな言語モデルによって生成されたテキスト記述とともに、各ビデオフレームを処理する。
知識グラフを構築するための高次元埋め込みを生成するためにImageBindを使用し、推論にGATを使用し、ビデオ埋め込み機能を抽出するために軽量な時系列モジュールを適用している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:58:18 GMT)
A comprehensive survey of contemporary Arabic sentiment analysis: Methods, Challenges, and Future Directions [2.0] 本稿では,ディープラーニングを活用した研究を中心に,アラビア語の感情分析手法を体系的に検討する。
我々は、より広い文脈でアラビア感情分析を行い、アラビア感情分析における研究のギャップを強調した。
アラビア語の感情分析研究における主な課題と今後の方向性について概説する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:23:51 GMT)
SPRINT: An Assistant for Issue Report Management [1.9] SPRINTは、最先端のディープラーニング技術を使用してイシュー管理タスクを合理化するGitHubアプリケーションである。
SPRINTは、新しく報告された問題に似た既存の問題を特定し、問題の深刻度を予測し、問題の解決に修正を必要とする可能性のあるコードファイルを提案する。
その結果、SPRINTは正確で有用であり、有用であることを示し、開発者によるイシューレポートの管理を支援する効果の証拠を提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:29:35 GMT)
Temporal Distribution Shift in Real-World Pharmaceutical Data: Implications for Uncertainty Quantification in QSAR Models [1.9] 機械学習モデルにおける予測の不確実性を推定するいくつかの計算ツールが存在する。
I. I. D. 設定からの逸脱は これらの不確実な定量化方法のパフォーマンスを損なうことが示されている。
我々は,不確実性評価手法の総合的,大規模評価の必要性に対処するために,現実世界の医薬品データセットを用いている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:26:04 GMT)
Archetypal Analysis for Binary Data [1.9] Archetypal analysis (AA) は、アーチタイプを示すデータポイントの凸結合を用いて、異なるパターンを識別する行列分解法である。
AAの既存のほとんどのメソッドは連続データ用に設計されており、データ分散の構造を利用していない。
本稿では,2進データに対するアーキティパル解析のための2つの新しい最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:05:15 GMT)
Enhancing Online Learning Efficiency Through Heterogeneous Resource Integration with a Multi-Agent RAG System [1.9] 本稿では,マルチエージェント検索・拡張生成システム(RAG)のアーリーステージについて紹介する。
特定のリソースタイプに適した特殊なエージェントを使用して、システムは関連する情報の検索と合成を自動化する。
事前のユーザ調査では、システムの強力なユーザビリティと中程度の高機能性を確認し、知識獲得の効率性を向上させる可能性を実証した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:36:17 GMT)
Realistic Image-to-Image Machine Unlearning via Decoupling and Knowledge Retention [1.8] 機械学習モデルは、目に見えないデータに対してかなりよく機能する、と私たちは主張する。
本稿では,モデルパラメータを勾配上昇で分離するフレームワークを提案する。
また、勾配のあるモデル更新に対して$(epsilon, delta)$-unlearningの保証も提供しています。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:46:49 GMT)
Robust Probabilistic Model Checking with Continuous Reward Domains [1.8] 本稿では,離散時間マルコフ連鎖における連続と離散の報酬分布を扱う新しい手法を提案する。
本手法は,真の分布の統計的特性を保ちながら,理論的に有界な誤差で報酬分布を近似する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:03:18 GMT)
Multi-Objective Mobile Damped Wave Algorithm (MOMDWA): A Novel Approach For Quantum System Control [1.7] 我々は,MOMDWA(Multi-Objective Mobile Damped Wave Algorithm)という新しい多目的最適化アルゴリズムを導入する。
我々はMOMDWAが量子制御効率とロバスト性を大幅に向上し,エネルギー使用を最小化し,スムーズな制御パルスを確保できることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:43:21 GMT)
Variational Quantum Optimization with Continuous Bandits [1.7] 本稿では,連続バンディットによる変分量子アルゴリズム(VQA)の新たなアプローチを提案する。
VQAは、量子回路のパラメータを古典的なアルゴリズムで最適化するハイブリッド量子古典アルゴリズムのクラスである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:24:30 GMT)
Backflash Attack on Coherent One-Way Quantum Key Distribution Protocol [1.7] 単光子アバランシェ検出器(SPAD)によって発生した破壊フラッシュを利用して、盗聴者(Eve's)の情報取得を実験的に実証した。
この研究は、キー蒸留エンジン(KDE)を含むQKDシステムを用いてイヴの学習を定量化する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:44:58 GMT)
XMTC: Explainable Early Classification of Multivariate Time Series in Reach-to-Grasp Hand Kinematics [1.6] 本稿では,協調した複数ビューの可視化を取り入れたXMTCツールについて述べる。
複数のシナリオにおいて実世界のHCIデータにXMTCを用いており、早期に優れた分類予測が可能であることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:14:13 GMT)
Scrutinizing the Vulnerability of Decentralized Learning to Membership Inference Attacks [1.6] 分散学習システムにおけるメンバーシップ推論攻撃(MIA)の脆弱性について検討する。
鍵となる発見は、MIAの脆弱性は各ノードが実行した局所モデル混合戦略と大きく相関していることである。
本稿は,MIAに脆弱性を設計することで脆弱性を減らす分散型学習システムを考案した際の教訓をまとめたものである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:47:26 GMT)
Beyond Autoregression: Fast LLMs via Self-Distillation Through Time [1.6] 拡散言語モデルでは,テキスト品質およびLAMBADA自然言語理解ベンチマークにおいて,少なくとも32個のトークンを同時に生成できることを示す。
実際には、1.3Bパラメータスケールでは、キャッシュなしでも拡散モデルはKVキャッシュを使用するARモデルよりも最大8倍高速なトークンを生成することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:26:24 GMT)
Distribution learning via neural differential equations: minimal energy regularization and approximation theory [1.6] 微分常微分方程式(ODE)は、複素確率分布を近似するのに使用できる可逆輸送写像の表現的表現を提供する。
大規模な輸送写像のクラス$T$に対して、写像によって誘導される変位の直線$(1-t)x + t(tTx)$ を実現する時間依存ODE速度場が存在することを示す。
このような速度場は、特定の最小エネルギー正規化を含む訓練対象の最小値であることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:50:21 GMT)
Large Language Models for Education: ChemTAsk -- An Open-Source Paradigm for Automated Q&A in the Graduate Classroom [1.6] 大規模言語モデル(LLM)は、大学院レベルの教育を支援することを約束するが、トレーニングデータと潜在的なコミュニケーションによって制限される。
我々は,LLMと検索拡張生成(RAG)を組み合わせたオープンソースのパイプラインであるChemTAskを開発した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:49:16 GMT)
No Free Lunch in Annotation either: An objective evaluation of foundation models for streamlining annotation in animal tracking [1.5] 動物追跡のためのアノテーションを作成するという面倒な作業に対処する基礎モデルの能力を分析する。
自動アノテーションと手動のアノテートデータを組み合わせた思慮深い組み合わせが重要な戦略であることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:30:17 GMT)
Regulating Reality: Exploring Synthetic Media Through Multistakeholder AI Governance [1.5] 本稿では,各分野の合成メディアを運営している利害関係者に対する,詳細な,半構造化された23のインタビューを分析した。
それは、時間的視点が過去、現在、未来をどのように拡大するかを含む、合成メディアガバナンスに影響を及ぼす重要なテーマを明らかにします。
また、ステークホルダーとオーディエンスと介入の間の信頼の重要な役割を明らかにします。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:56:16 GMT)
Decision Trees That Remember: Gradient-Based Learning of Recurrent Decision Trees with Memory [1.4] 我々はReMeDe Treesを紹介した。ReMeDe Treesは、RNNに似た内部メモリ機構を統合して、シーケンシャルデータにおける長期依存を学習する新しいDTアーキテクチャである。
我々のモデルは、出力生成と状態更新の両方に対して、厳密な軸整列決定ルールを学習し、勾配降下により効率よく最適化する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:11:50 GMT)
SoK: "Interoperability vs Security" Arguments: A Technical Framework [1.4] 大企業の独占力に関する懸念は、近年のメディアや政策論議で顕著に取り上げられている。
米国やEUなどの規制当局は、市場におけるより健全な競争を促進する努力を強化している。
当然のことながら、インターオペラビリティのイニシアチブは、大企業による激しい抵抗に直面している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:21:14 GMT)
LV-XAttn: Distributed Cross-Attention for Long Visual Inputs in Multimodal Large Language Models [1.4] LV-XAttnは,通信オーバーヘッドを最小限に抑えた,分散的かつ正確なクロスアテンション機構である。
LV-XAttnは、既存のアプローチと比較して最大5.58$times$ end-to-endのスピードアップを実現していることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:50:41 GMT)
General theory of slow non-Hermitian evolution [1.4] 非エルミート系は古典物理学と量子物理学の両方で広く使われている。
ここでは、非エルミート系の緩やかな進化に関する一般的な理論を開発する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:55:40 GMT)
Retro-Rank-In: A Ranking-Based Approach for Inorganic Materials Synthesis Planning [1.4] 再合成は、より単純で容易に利用できる前駆体化合物から化学標的化合物の合成を戦略的に計画する。
Retro-Rank-Inは、標的材料と前駆物質を共有潜在空間に埋め込むことにより、レトロ合成問題を再構築する新しいフレームワークである。
我々はRetro-Rank-Inが新しい最先端、特にアウト・オブ・ディストリビューションの一般化と候補セットのランキングを定めていることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:34:37 GMT)
Comparing diversity, negativity, and stereotypes in Chinese-language AI technologies: an investigation of Baidu, Ernie and Qwen [1.3] 我々は、中国の主要検索エンジンBaiduに埋め込まれた社会的偏見を調査し、中国ベースのツールを調査した。
上記のツールにエンコードされた30万以上のビューを,そのようなグループを記述した候補語に誘導することで収集する。
言語モデルは検索エンジンに比べて多種多様な組込みビューを示すが、BaiduとQwenはErnieよりもネガティブなコンテンツを生成することが多い。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:56:01 GMT)
Technical Report: Generating the WEB-IDS23 Dataset [1.1] いくつかの広く使われているデータセットは、十分にきめ細かいラベルを含まない。
モジュラートラフィックジェネレータは 様々な良質で悪意のあるトラフィックをシミュレートできます
データセットは、82のフローレベルの特徴と21のきめ細かいラベルを持つ1200万以上のサンプルをキャプチャする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:33:02 GMT)
On Robust Reinforcement Learning with Lipschitz-Bounded Policy Networks [1.1] より小さなリプシッツ境界を持つポリシネットワークは、乱れやランダムノイズ、ターゲットとなる敵攻撃に対してより堅牢であることを示す。
スペクトル正規化の手法は保守的すぎるため,クリーンな性能に深刻な影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:29:53 GMT)
Autotelic Reinforcement Learning: Exploring Intrinsic Motivations for Skill Acquisition in Open-Ended Environments [1.1] 本稿では, 自己強化学習(RL)の概要を概観し, スキルレパートリーのオープンエンド形成における本質的モチベーションの役割を強調した。
知識ベースと能力ベースの本質的なモチベーションの区別を明確にし、これらの概念が自己定義目標を生成・追求できる自律エージェントの開発にどのように役立つかを説明する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:37:46 GMT)
Adaptation of Task Goal States from Prior Knowledge [1.1] 目標状態における自由と可変性を備えたタスクを定義するためのフレームワークを定義します。
ロボットは、これを使ってタスクの実行を観察し、観察されたタスクとは異なる目標を目標にすることができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:51:04 GMT)
The Phantom of the Elytra -- Phylogenetic Trait Extraction from Images of Rove Beetles Using Deep Learning -- Is the Mask Enough? [1.1] 系統解析は伝統的に労働集約的手作業による形態学的特徴の抽出に依存している。
近年のディープラーニングの進歩は、このプロセスを自動化する可能性を秘めている。
3つの異なる形態素表現を用いてディープラーニングモデルの性能を比較する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:41:50 GMT)
AI Sandbagging: Language Models can Strategically Underperform on Evaluations [1.0] 信頼できる能力評価は、AIシステムの安全性を保証するために不可欠である。
AIシステムの開発者は、AIの実際の能力を説明するための評価のためのインセンティブを持つことができる。
本稿では,現代言語モデルにおけるサンドバッグ機能の評価を行う。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:58:43 GMT)
Color in Visual-Language Models: CLIP deficiencies [1.0] この研究は、現在人工知能において最も影響力のあるVML(ビジュアル言語モデル)であるCLIP(Contrastive Language- Image Pre-training)において、色がどのようにコード化されているかを探る。
a)色の概念にあまり関係のない無彩色刺激に対する明確な偏見、(b)他の視覚情報よりもテキストを優先する傾向である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:38:12 GMT)
Complete FSM Testing Using Strong Separability [1.0] アパルタネス(Apartness)は、構成数学で開発された概念であり、状態分離のための強力な概念として再浮上している。
我々は、ハイブリッドやシステムなど、定量的モデルにおける相違性の根本的な欠点を識別する。
我々は、強い分離性(strong separability)と呼ばれる、密接に関連する代替案を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:54:24 GMT)
Regularization via f-Divergence: An Application to Multi-Oxide Spectroscopic Analysis [1.0] 本稿では,f分割に基づく新しい正規化手法を提案する。
火星のような環境下で収集したスペクトルをキュリオシティ・パーセバランス・ローバーに搭載したリモートセンシング装置を用いて実験を行った。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:37:35 GMT)
PACE: Abstractions for Communicating Efficiently [0.9] 人間は抽象化を導入して使うのが得意です。
この現象を再現しようとするいくつかの計算手法が試みられているが、抽象概念の導入と学習について非現実的な仮定を下している。
我々はこれをコミュニケーションと強化学習のためのニューラルな手法と組み合わせ、新しい抽象化を導入する際の探索と搾取のトレードオフを制御するために、バンディットアルゴリズムを新たに活用する。
私たちの仕事は、人間のようなコミュニケーション抽象化機能を備えた会話エージェントを提供するための第一歩として役立ちます。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:09:59 GMT)
Multimodal Data-Driven Classification of Mental Disorders: A Comprehensive Approach to Diagnosing Depression, Anxiety, and Schizophrenia [0.9] 本研究では、統合失調症、うつ病、不安などの精神疾患を診断するためのマルチモーダルデータ統合の可能性を検討する。
Apache Sparkと畳み込みニューラルネットワーク(CNN)を使用して、ビッグデータ環境のためのデータ駆動型分類パイプラインが開発された。
コヒーレンスの特徴の重要性は比較分析によって強調され、分類精度とロバスト性に大きな改善が見られた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:30:13 GMT)
Innovative Framework for Early Estimation of Mental Disorder Scores to Enable Timely Interventions [0.9] 本稿では,PTSDとうつ病の自動分類のための高度なマルチモーダル深層学習システムについて述べる。
提案手法は, うつ病では92%, PTSDでは93%の分類精度を達成し, 従来の単潮流法よりも優れていた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:57:10 GMT)
Quantum algorithm for large-scale market equilibrium computation [0.9] サブ線形性能を持つ市場均衡計算のための最初の量子ランタイムアルゴリズムを提供する。
提案アルゴリズムは,従来のアルゴリズムと客観的な最適化値に到達しつつ,購入者数や商品数の観点からも,実行時の高速化を実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:40:25 GMT)
OpenSTARLab: Open Approach for Spatio-Temporal Agent Data Analysis in Soccer [0.9] スポーツアナリティクスは、より専門的で洗練されたものになり、詳細なパフォーマンスデータが利用できるようになった。
サッカーでは、イベントと追跡データの効果的な利用は、ゲームのダイナミクスを捕捉し分析するための基本となる。
本稿では,スポーツにおける時間的エージェントデータ分析の民主化を目的としたオープンソースフレームワークであるOpenSTARLabを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:49:07 GMT)
Graph Neural Network-Driven Hierarchical Mining for Complex Imbalanced Data [0.8] 本研究では,高次元不均衡データの階層的マイニングフレームワークを提案する。
データセットの構造化グラフ表現を構築し、グラフニューラルネットワークの埋め込みを統合することにより、提案手法は、サンプル間のグローバルな相互依存性を効果的にキャプチャする。
複数の実験シナリオにまたがる実証実験により,提案手法の有効性が検証された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:26:41 GMT)
The 23andMe Data Breach: Analyzing Credential Stuffing Attacks, Security Vulnerabilities, and Mitigation Strategies [0.8] 2023年10月、23andMeは「ゴーレム」と呼ばれるサイバー犯罪者が組織した重大なデータ漏洩に遭った。
本稿では,攻撃方法とそのユーザおよび企業への影響を批判的に分析し,潜在的な緩和戦略について検討する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:44:26 GMT)
Advanced Predictive Quality Assessment for Ultrasonic Additive Manufacturing with Deep Learning Model [0.8] 本研究では,深層学習に基づく畳み込みニューラルネットワーク(CNN)を用いたプロセス内品質監視手法を開発した。
CNNモデルは、5つのパワーレベルにまたがる熱カップリングを組み込んだサンプルを分類する能力について評価した。
97%を超える高い精度は、UAMプロセス内の条件を特定し分類するシステムの有効性を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:27:43 GMT)
LeAP: Consistent multi-domain 3D labeling using Foundation Models [0.8] この研究は、LeAP(Label Any Pointcloud)を導入し、2D VFMを活用して、あらゆる種類のアプリケーションにおいて、任意のクラスの3Dデータを自動的にラベル付けする。
本手法は,手動ラベリングを使わずに,様々な分野にまたがる高品質な3Dセマンティックラベルを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:24:47 GMT)
On the importance of structural identifiability for machine learning with partially observed dynamical systems [0.8] 我々は、構造的識別可能性分析を用いて、同一のシステム出力に関連付けられたパラメータ構成を明示的に関連づける。
本研究は,機械学習コミュニティから比較的注目されているトピックである,構造的識別可能性の説明の重要性を実証するものである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:06:52 GMT)
Quantum Circuit Design using a Progressive Widening Monte Carlo Tree Search [0.8] 変分量子アルゴリズム(VQA)の最大の課題の1つは、特定の問題や量子ハードウェアに適した量子回路を設計することである。
本稿では、量子回路設計のプロセスを自動化するために、勾配のないモンテカルロ木探索(MCTS)手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:52:11 GMT)
Conditional Diffusion Models are Medical Image Classifiers that Provide Explainability and Uncertainty for Free [0.8] 本研究は,2次元医用画像分類のためのクラス条件拡散モデルの可能性を初めて探求するものである。
そこで我々は,医療拡散分類器の性能向上を図るために,新しい多数決方式を開発した。
CheXpertとISICのメラノーマ皮膚がんデータセットの実験は、基礎と訓練されたスクラッチ拡散モデルが競争力を発揮することを示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 00:37:21 GMT)
Interlayer Dzyaloshinskii-Moriya interactions induced via non-linear phononics in bilayer van der Waals materials [0.8] 本研究では, 非線形フォニックスによる光駆動構造変化が2層ファンデルワールス材料の磁気秩序に及ぼす影響について検討した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:03:15 GMT)
Breaking the Vault: A Case Study of the 2022 LastPass Data Breach [0.7] 攻撃者が機密性の高い顧客データを入手した2022年のLastPassデータ漏洩を調査した。
我々は、攻撃者の方法論と、この事件がLastPassとその顧客に与える影響について論じる。
我々は、将来同様の攻撃に備え、軽減するための解決策を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:33:57 GMT)
From Link Prediction to Forecasting: Addressing Challenges in Batch-based Temporal Graph Learning [0.7] バッチ指向評価の適合性はデータセットの特性に依存することを示す。
連続時間時間グラフの場合、固定サイズのバッチは異なる期間の時間ウィンドウを生成し、不整合な動的リンク予測タスクをもたらす。
離散時間時間時間グラフの場合、バッチのシーケンスはデータに存在しない時間的依存関係を付加することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:09:15 GMT)
Tight Bounds on the Spooky Pebble Game: Recycling Qubits with Measurements [0.6] 我々は,この不気味な小石ゲームが,可逆的アプローチが達成できる範囲を超えて,キュービット数を減少させることを示す。
任意のDAGに対して、スポッキーな小石ゲームに必要な小石の数はPSPACEハードであることが示される。
最小数の小石を使用する二分木を編み出すための時間効率の戦略を構築することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:33:36 GMT)
Sea-cret Agents: Maritime Abduction for Region Generation to Expose Dark Vessel Trajectories [0.6] 船舶の自動識別システム(AIS)を無効にした後、海上産業の悪役が違法行為を行う
機械学習のアプローチは、近い将来、これらの暗黒船の位置を特定することにしか成功しない。
我々は、誘拐、論理プログラミング、ルール学習の概念を組み合わせて、暗い容器の完全なリコールにアプローチする効率的な方法を作成します。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:01:55 GMT)
UltraBones100k: An Ultrasound Image Dataset with CT-Derived Labels for Lower Extremity Long Bone Surface Segmentation [0.6] 本稿では,骨ラベルの自動生成による残響超音波データセットの収集手法を提案する。
提案するラベルは、追跡された骨CTモデルを追跡された超音波画像に正確に重ね合わせることで得られる。
骨分割のためのニューラルネットワークは、収集されたデータセットに基づいてトレーニングされ、その予測は専門家の手動ラベルと比較される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:11:29 GMT)
Tight Bounds on Jensen's Gap: Novel Approach with Applications in Generative Modeling [0.5] 本稿では,ジェンセンのギャップの上下境界を求める新しい手法を提案する。
対数関数と対数正規分布を詳細に研究することにより、実世界のデータセットで訓練された生成モデルの対数類似度を厳密に推定する方法を探索する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:44:31 GMT)
Exponentially Better Bounds for Quantum Optimization via Dynamical Simulation [0.5] 我々は、勾配推定を必要としない連続的な最適化のために、いくつかの量子アルゴリズムを提供する。
我々は、最適化問題を物理系の力学にエンコードし、時間進化をコヒーレントにシミュレートする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:32:26 GMT)
Identifying hard native instances for the maximum independent set problem on neutral atoms quantum processors [0.5] 最大独立集合問題(英: Maximum Independent Set、MIS)は、中性原子量子プロセッサのイジング・ハミルトニアンに自然にマッピングできる基本的な最適化課題である。
NPハード問題と実世界の応用との関係を考えると、MISの量子的優位性を探究する実験的な関心がある。
我々は、複雑性理論結果と密度や木幅などの鍵硬度パラメータの変化を利用して、単位ディスクグラフのハードインスタンスを生成する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:34:59 GMT)
A Critical Analysis of Deployed Use Cases for Quantum Key Distribution and Comparison with Post-Quantum Cryptography [0.4] 量子鍵分散(QKD)は、量子コンピュータが従来の公開鍵暗号システムに侵入する未来の通信を保護する技術として議論されている。
我々は,学術文献や産業報告から得られた実世界のユースケースに着目し,QKDベースのソリューションの総合的なセキュリティ評価を行う。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:11:14 GMT)
MAGA: MAssive Genre-Audience Reformulation to Pretraining Corpus Expansion [0.4] 既存のコーパスから多種多様な文脈に富んだ事前学習データを体系的に合成する textbfMAssive textbfAudience (MAGA) 再構成法を提案する。
我々は、様々なデータ予算のスケーリング戦略でMAGACorpusを評価し、様々なモデルサイズで一貫した改善を実証した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:19:55 GMT)
TabularARGN: A Flexible and Efficient Auto-Regressive Framework for Generating High-Fidelity Synthetic Data [0.4] Tabular Auto-Regressive Generative Network (TabularARGN)は、混合型、多変量、シーケンシャルデータセットを扱う柔軟なフレームワークである。
あらゆる可能な条件付き確率のトレーニングにより、TabularARGNは、カラムの任意のサブセット上で、公平性を認識した生成、計算、条件付き生成などの高度な特徴をサポートする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:18:09 GMT)
Free Energy Risk Metrics for Systemically Safe AI: Gatekeeping Multi-Agent Study [0.4] エージェントおよびマルチエージェントシステムにおけるリスク測定の基礎として,フリーエネルギー原理を考察する。
異なる状況やニーズに対してフレキシブルな累積的リスク露光指標を導入します。
AV艦隊におけるゲートキーパーの導入は,低浸透時であっても,システム安全性の向上の観点から,大きな肯定的な外部性を生み出すことが示されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:38:45 GMT)
Mixture of neural operator experts for learning boundary conditions and model selection [0.4] 本稿では,数値計算による体積のペナル化にインスパイアされた境界条件を与える方法を提案する。
競合する専門家を導入することで、このアプローチはさらにモデル選択を可能にします。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:29:32 GMT)
Learning Reward Machines from Partially Observed Optimal Policies [0.4] 逆強化学習は、最適政策から報酬関数を推定する問題である。
我々の目標は、有限情報を用いて真の報奨機を特定することである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:48:25 GMT)
Out-of-distribution generalisation for learning quantum channels with low-energy coherent states [0.4] チャネルを探索する実験的に単純な方法の1つは、低エネルギーコヒーレント状態を用いることである。
2つのチャネルは低エネルギー入力でも同じように作用するが、高エネルギー入力では非常に異なる。
より一般的な入力状態に対するチャネルの挙動を、より限られた低エネルギーコヒーレント状態の集合に対する作用から外挿することは、分布外一般化の例である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:01:47 GMT)
Model Human Learners: Computational Models to Guide Instructional Design [0.4] 本稿では,2つのA/B実験の結果を正確に予測できる計算モデルについて述べる。
また、そのようなモデルが人間のデータを必要とせずに学習曲線を生成できることも示している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:11:52 GMT)
Performance of quantum annealing for 2-SAT problems with multiple satisfying assignments [0.4] 量子アニールの数値シミュレーションとD-Waveが提供する物理量子アニールのスケーリングとサンプリング性能について検討した。
サンプリングの挙動は理論によって説明でき、解法までの時間のスケーリングの挙動は最小エネルギーギャップのスケーリングの挙動に依存する。
D-Wave量子アニールの対応する結果は、この理想像には適合しないが、量子アニールからの解のスケーリングは平衡確率分布から計算した値と一致することを示唆している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:12:02 GMT)
Precision Agriculture Revolution: Integrating Digital Twins and Advanced Crop Recommendation for Optimal Yield [0.4] 天気予報API(アプリケーションプログラミングインタフェース)、GPSモジュール、NPK(窒素、リン、カリウム)土壌センサーや機械学習推奨モデルなどの農業4.0技術は、この概念を通じて農業生産に革命をもたらすことを目指している。
土壌組成、気象力学、地理座標のリアルタイムデータの組み合わせは、作物の推薦モデルをサポートし、水と殺虫剤の管理を改善するための予測シナリオをシミュレートすることを目的としている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:12:25 GMT)
Experiments with Large Language Models on Retrieval-Augmented Generation for Closed-Source Simulation Software [0.4] Retrieval-Augmented Generation (RAG) は知識集約型タスクの解決策となるかもしれない。
本稿では,RAGのクローズドソースシミュレーションソフトウェアへの適用について検討する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:48:04 GMT)
Efficient simulation of quantum chemistry problems in an enlarged basis set [0.4] 本稿では,量子化学問題の力学をシミュレートする量子アルゴリズムを提案する。
各トロッターステップに新しいキュービットを追加し、拡張されたシステムにおけるダイナミクスのよりシンプルな実装を可能にする。
この結果は水素鎖、小さな分子、FeMoco分子の3つの例で説明します。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:51:11 GMT)
MultiQ&A: An Analysis in Measuring Robustness via Automated Crowdsourcing of Question Perturbations and Answers [0.3] MultiQ&Aは、大規模言語モデルの堅牢性と一貫性を評価するための体系的なアプローチである。
我々の実験は、190万の質問摂動と230万の回答の試験で終わった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:58:48 GMT)
Rule-Based Modeling of Low-Dimensional Data with PCA and Binary Particle Swarm Optimization (BPSO) in ANFIS [0.3] ファジィルールに基づくシステムは、低次元領域でデータを解釈し、透明性と解釈可能性を提供する。
ディープラーニングは複雑なタスクでは優れているが、スパース、非構造化、低次元のデータでは過度に適合する傾向がある。
この解釈可能性は、医療や金融といった分野において重要である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:13:55 GMT)
Thermal Area Law in Long-Range Interacting Systems [0.2] 熱領域法則の最適しきい値として$alpha_c= (D+1)/2$を示す。
興味深いことに、この状態は熱力学的に不安定な状態でさえも含む。
我々はこの条件を数値的に検証し、可積分系と非可積分系の両方に対して定性的に正確であることを示した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:46:12 GMT)
On robust recovery of signals from indirect observations [0.2] 信号集合が凸集合である状況において、どのようにしてソートの「期待できる良い」推定が構成されるかを示す。
我々は、$cal N$ が凸有界集合かスパースベクトルの集合である2つの「不確実集合」を考える。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:15:22 GMT)
Learning Semantics-aware Search Operators for Genetic Programming [0.2] テストベースのプログラム合成における適合性景観は、非常に頑丈であることが知られている。
本稿では,有効な候補プログラムの探索を支援するセマンティックス・アウェア・サーチ・オペレータを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:46:04 GMT)
Electrical Impedance Tomography for Anisotropic Media: a Machine Learning Approach to Classify Inclusions [0.2] 我々は、背景伝導体$OmegasubsetmathbbR2$における1つまたは複数の包含物を特定する問題を考える。
我々のモデルは、ニューラルネットワーク(ANN)とSVM(Support Vector Machines)の機械学習技術と組み合わせて、包含物のサイズ、複数の包含物の存在、および包含物内の異方性を決定するために使用できる。
包含物検出の精度は高いが, 包含物のサイズを予測する際には, 2つの測定値が十分であることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:15:54 GMT)
Formal Proofs as Structured Explanations: Proposing Several Tasks on Explainable Natural Language Inference [0.2] 自然言語推論の基礎となる推論過程をモデル化できる推論フレームワークを提案する。
このフレームワークは、形式論理におけるよく研究された証明システムであるセマンティック・テーブルー法に基づいている。
本稿では、自然言語推論タスクを構造化された説明で定義する方法について述べる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:50:13 GMT)
An Optimized YOLOv5 Based Approach For Real-time Vehicle Detection At Road Intersections Using Fisheye Cameras [0.1] リアルタイム車両検出は都市交通監視の課題である。
魚眼カメラは、広い面積をカバーし、ジャンクションでの360度ビューを提供するために、リアルタイム車両検出の目的に広く利用されている。
車両や街路灯からの光輝き、影、非線形歪み、車両のスケーリング問題、小型車両の適切な位置決めといった課題を克服するため、改良型YOLOv5物体検出方式を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:42:05 GMT)
Primary Care Diagnoses as a Reliable Predictor for Orthopedic Surgical Interventions [0.1] リファラルワークフローの非効率性は、最適な患者と高い医療費に寄与する。
本研究では,プライマリケアの診断項目に基づく手続き的ニーズの予測の可能性について検討した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:15:12 GMT)
Hidden facts in Landau-Zener transitions revealed by the Riccati Equation [0.1] 基本ランダウ・ツェナー問題における2つの確率振幅のダイナミクスを表現する。
i) Riccati方程式の解は、2つの確率振幅の間の橋渡しを提供し、 (ii) Riccati方程式の非線形性を無視することはマルコフ近似と等価であり、 (iii) Riccati方程式はマルコフ近似の失敗の起点を特定する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:51:52 GMT)
A data-driven two-microphone method for in-situ sound absorption measurements [0.1] 本研究では, 無限多孔質スラブの吸音係数を推定するためのデータ駆動手法を提案する。
1D畳み込みネットワークは、2つのマイクロホン位置で測定された音圧間の複素値伝達関数から吸音係数を予測する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:23:28 GMT)
Learning low-dimensional representations of ensemble forecast fields using autoencoder-based methods [0.1] 大規模な数値シミュレーションでは、下流のアプリケーションでは処理が難しい高次元のグリッドデータを生成することが多い。
本稿では,その確率的特性を尊重しつつ,アンサンブル予測の低次元表現を生成する2つのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:16:47 GMT)
Sports and Women's Sports: Gender Bias in Text Generation with Olympic Data [0.1] オリンピックにおける男女同時開催イベントのデータを用いて,言語モデルにおけるジェンダーバイアスの異なる形態を調査する。
ジェンダーが不明瞭な場合、モデルは常に女性に偏見を抱いていることがわかりました。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:01:00 GMT)
YOLOv4: A Breakthrough in Real-Time Object Detection [0.0] YOLOv4は様々なシナリオにおいて優れた検出を実現し、Tesla V100では毎秒65フレームで43.5%APを達成した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:45:18 GMT)
Work in Progress: AI-Powered Engineering-Bridging Theory and Practice [0.0] 本稿では,システム工学の重要なステップを自動化し,改善する上で,生成AIがいかに役立つかを考察する。
INCOSEの"よい要件"基準に基づいて、システム要件を分析するAIの能力を調べる。
この研究は、エンジニアリングプロセスを合理化し、学習結果を改善するAIの可能性を評価することを目的としている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:42:00 GMT)
Wigner-function formalism for the detection of single microwave pulses in a resonator-coupled double quantum dot [0.0] 理論的には単一マイクロ波パルスの光検出を解析する。
我々は、時間-エネルギーの不確実性関係に応じて、入射光子の時間と周波数を検知するトレードオフを見出した。
DQD-共振器ハイブリッド系における電子と相互作用するマイクロ波光子の時間依存性について考察した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:58:29 GMT)
Volume-entangled exact scar states in the PXP and related models in any dimension [0.0] PXPおよび関連するハミルトン族によってホストされたアインシュタイン-ポドルスキー-ローゼン型スカーステートの正確な体積絡み合いを報告した。
我々は、近い将来のRydberg量子デバイスで準備するためのプロトコルを提供することで、我々の状態の潜在的実験的妥当性を指摘する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 02:45:20 GMT)
VideoSAM: A Large Vision Foundation Model for High-Speed Video Segmentation [0.0] 高速ビデオ(HSV)セグメンテーションは、沸騰熱伝達などの科学・産業応用における動的物理過程の解析に不可欠である。
位相検出のための多様なHSVデータセットを微調整したSegment Anything Model (SAM) の特殊適応であるVideoSAMを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:34:11 GMT)
Variational decision diagrams for quantum-inspired machine learning applications [0.0] 決定図(DD)は量子回路をシミュレーションするための効率的なツールとして登場した。
本稿では,変分決定図(VDD)を設計と訓練の代替として導入する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:09:08 GMT)
Variation of sentence length across time and genre [0.0] 本論文の目的は,コーパス・オブ・ヒストリカル・アメリカン・イングリッシュ(COHA)のフルテキスト版を使用するための実践的な側面を提示することである。
英語の文長が過去数世紀で着実に減少しているという、広く信じられている仮定をテストする。
文長の変化と英語の構文的使用の変化とを関連付けること。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:02 GMT)
User-Friendly Game-Theoretic Modeling and Analysis of Multi-Modal Transportation Systems [0.0] マルチモーダルモビリティシステムをモデル化するためのゲーム理論フレームワークを提案する。
このフレームワークにより、ステークホルダーは、完全なモビリティシステムに対するローカルな決定の影響を評価することができる。
このプロジェクトは高校生のSTEMへの関心を高めることを目的としている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:40:24 GMT)
Upgrading Quantum Metrology by Combined Sensitivity Resources in Mixed Linear-Nonlinear Light-Matter Interactions with Bias Field [0.0] この研究は、バイアス場の存在下での線形および非線形光物質結合による混合相互作用が、様々な量子資源を提供することを示す。
これらの感度リソースを組み合わせれば、広く適用されているスクイージングリソースに対して、多くの順序でMPの上界をアップグレードできる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:27:03 GMT)
Tripartite Haar random state has no bipartite entanglement [0.0] 本研究では,EPR様二部晶の絡み合いを三部晶のハールランダム状態から蒸留することは不可能であることを示す。
与えられたEPRフィデリティ耐性に対するEPR様絡み合いのある状態をサンプリングする確率の上限を導出する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:00:01 GMT)
TriNER: A Series of Named Entity Recognition Models For Hindi, Bengali & Marathi [0.0] 本稿では,ヒンディー語,ベンガル語,マラティー語の3言語を対象とした多言語NERモデルの構築について述べる。
我々は、カスタムトランスモデルを訓練し、いくつかの事前訓練されたモデルを微調整し、合計6つの実体群に対してF1スコア92.11を達成する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:37:36 GMT)
Towards experimental demonstration of quantum position verification using true single photons [0.0] ビームスプリッタにおける2光子Hong-Ou-Mandel干渉を用いたプロトコルを実験的に示す。
量子位置検証の実験的実証に向けて、最初の結果を示すことができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:00:30 GMT)
Towards Accurate Mixed Quantum Classical Simulations of Vibrational Polaritonic Chemistry [0.0] 本稿では,従来のMQC手法の限界に対処するため,表面ホッピング (MASH) へのマッピング手法を提案する。
我々は空洞モードの量子的処理を取り入れ、以前の研究でよく用いられる古典的な近似を超えて移動する。
振動分極化学の単一分子モデルの結果、MASHと量子キャビティモードを組み合わせることで、最も正確な速度が得られることが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:50:22 GMT)
Thin ring wing as a means of flow improvement upstream of a propeller [0.0] 論文の主題は、リング型の翼を非常に効果的な受動渦発生器として用いることである。
リング翼の形状と流れの不規則性の関数としての誘導長手渦の強度を推定した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:30:08 GMT)
The Uniformly Rotated Mondrian Kernel [0.0] モンドリアンカーネルはラプラスカーネルの高速なランダムな特徴近似の例である。
このランダムな特徴写像の変動を,一様に回転したモンドリアン過程を用いて検討する。
この等方性核に対する閉形式表現と、一様回転したモンドリアン核の一様収束率を得る。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:24 GMT)
The Ensemble Kalman Update is an Empirical Matheron Update [0.0] Ensemble Kalman Filter (EnKF) は高次元システムにおけるデータ同化法として広く用いられている。
本稿では,EnKF のアンサンブル更新ステップが,ガウス過程回帰の研究で人気の Matheron 更新の実証版と等価であることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:16:27 GMT)
Tensor-Programmable Quantum Circuits for Solving Differential Equations [0.0] フレキシブル行列積演算子表現に基づく偏微分方程式の量子解法を提案する。
これは古典系と量子系の力学を規定する幅広い微分方程式の直接的な実装を可能にする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:23:38 GMT)
Teleportation of unknown qubit via Star type tripartite states [0.0] プロトタイプの$W$ stateは標準的なテレポーテーションには役に立たないことが知られている。
我々は、非プロトタイプの$W$状態の線型重ね合わせとスピンフルプ版を取り、$Star$クラスに属することを示した。
チャネルとして使用するためには、真の三部体の絡み合いが必須ではないことが観察された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:18:30 GMT)
Target Attack Backdoor Malware Analysis and Attribution [0.0] カスタマイズされたバックドアは、無許可のシステム、データベース、およびアプリケーションコマンドを実行するために武装されている。
バックドアマルウェアは、典型的なMalwareが好むライブラリの上に、さまざまなAPI、コマンド、文字列、クエリ言語で設計することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:38:26 GMT)
Symmetry Properties of Quantum Dynamical Entropy [0.0] 累積 AFL エントロピーは一般にカオス力学において遅くて次元境界に飽和するが、この飽和値は分割(測度)が対称性を尊重するときに顕著に低いことを示す。
本研究は, 累積AFLエントロピーと対称性の複雑な関係に注目し, 量子カオスの指標として解釈するには注意が必要であることを示唆する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:00:02 GMT)
Symmetric tensor scars with tunable entanglement from volume to area law [0.0] 可変長距離絡み付き高エネルギー固有状態の構築について検討する。
我々は、2体相関を持つ非可積分スピン-1/2ハミルトニアンのクラスに対して、多くの正確なゼロエネルギー固有状態を求める。
このフレームワークは高次元への自然な拡張を持ち、格子幾何学と内部対称性によって制御される絡み合った状態は、相関した非平衡量子物質の新しいクラスをもたらす。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:33:14 GMT)
Stability of dipolar bosons in a quasiperiodic potential [0.0] 準周期ポテンシャルと双極子相互作用はそれぞれ量子系に長距離秩序を課す。
誘電体ボソニック結晶が準周期ポテンシャルの形で相関障害にどのように反応するかを考察する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:00:00 GMT)
Smart IoT Security: Lightweight Machine Learning Techniques for Multi-Class Attack Detection in IoT Networks [0.0] IoT(Internet of Things)が成長する中で、ネットワークはさまざまなサイバー脅威から保護されることが不可欠である。
本研究は、IoTデバイスのマルチクラス攻撃検出を改善するための、新しい軽量アンサンブルアプローチを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:17:03 GMT)
Sharp electromagnetically induced absorption via balanced interferometric excitation in a microwave resonator [0.0] この研究は、電場や磁気ベクトルポテンシャルを伴わずに、電気スカラーのアハロノフ・ボーム効果を試験できる実験装置を提示する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:34:58 GMT)
Sensor Resistant Instruction Independent Obfuscation for Multiple Programs [0.0] 本研究は,複数プログラムの難読化を実現する命令デコリレーションとして,難読化に関するこれまでの研究を基盤とし,最適化するものである。
センサ耐性計算の特性をさらに向上する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:40:58 GMT)
Rule Generation for Classification: Scalability, Interpretability, and Fairness [0.0] 制約付き分類のためのルールベースの新しい最適化手法を提案する。
ルールにコスト係数を割り当て、追加制約を導入することにより、解釈可能性と公正性に対処する。
提案手法は,一方の局所的解釈可能性と他方の正当性,他方の精度との間に良好な妥協関係を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:20:06 GMT)
Refining resource estimation for the quantum computation of vibrational molecular spectra through Trotter error analysis [0.0] プログラム可能な量子コンピュータ上での振動構造計算に必要な論理量子ビット数や量子ゲート数などの量子資源を推定する。
この研究は、振動構造シミュレーションにおける潜在的な量子優位性を分析するためのガイドとして機能する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:09:39 GMT)
Recurrence in discrete-time quantum stochastic walks [0.0] 線形上の離散時間量子再帰ウォークを解析する。
ランダム性は再発確率を減少させる。
その結果、離散時間量子ウォークは古典的ランダムウォークとユニタリ量子ウォークの両方に優れていた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:17:30 GMT)
Rate Function Modelling of Quantum Many-Body Adiabaticity [0.0] 量子多体系における断熱過程のダイナミクスについて検討する。
特に、断熱速度関数 $f(T, Delta lambda)$ をランプ時間 $T$ に依存して研究する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:03:24 GMT)
Random forests for binary geospatial data [0.0] 既存のバイナリデータに対するランダムフォレストの実装では、地理空間や時系列設定に共通するデータ相関を明示的に説明することはできない。
最近の研究は、一般化最小二乗損失(GLS)を用いた空間共分散を含むランダム森林(RF)をRF-GLSに拡張している。
二進データの場合、GLS損失はGiniの不純物測度の拡張であり、後者は通常の最小二乗損失(OLS)と全く同じである。
一般化された第1段階からの平均関数のRF-GLS推定を組み込む新しいリンク変換手法を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 01:45:58 GMT)
RAMOTS: A Real-Time System for Aerial Multi-Object Tracking based on Deep Learning and Big Data Technology [0.0] UAVビデオにおける多物体追跡(MOT)は、視点の変化、解像度の低さ、小さな物体の存在により困難である。
本稿では,Apache KafkaとApache Sparkを統合したリアルタイムMOTフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:46:18 GMT)
Quantum state tomography on closed timelike curves using weak measurements [0.0] 時系列参照入力とユニタリ相互作用の任意の組み合わせに対して、P-CTC上の一意状態の復元が常に可能であることを示す。
また、この状態は、P-CTC処方薬自体の分析からもたらされる可能性があることを実証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 04:40:40 GMT)
Quantum fluctuation theorem in a curved spacetime [0.0] 本稿では,2点測定方式に基づく一般相対論的詳細量子ゆらぎ定理について報告する。
一般時空を移動する局所量子系において、時空曲率がどのようにエントロピーを生成できるかを実証する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:34:05 GMT)
Quantum Powered Credit Risk Assessment: A Novel Approach using hybrid Quantum-Classical Deep Neural Network for Row-Type Dependent Predictive Analysis [0.0] 本研究では,Row-Type Dependent Predictive Analysis(RTDPA)の適応モデルと量子ディープラーニング技術を組み合わせた銀行部門における信用リスク評価フレームワークを提案する。
提案手法は、信用リスク評価の精度と効率を高めることを目的として、異なる融資カテゴリーに予測モデルを調整する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:57:18 GMT)
Quantification of Biodiversity from Historical Survey Text with LLM-based Best-Worst Scaling [0.0] 本研究は, 過去の調査文献から, 数量推定による種頻度の判定方法を評価する。
本稿では,BWS(Best-Worst Scaling)とLLM(Large Language Models)を用いて,この問題を回帰タスクとして適切にフレーム化可能であることを示す。
このアプローチは、よりきめ細かいマルチクラスアプローチに比べてコスト効率が高く、同様に堅牢である、と結論付けている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:25:16 GMT)
Qualitative differences in the robust controllability of model two-qubit systems [0.0] 連続パラメータを持つ2つのモデルハミルトニアンを考えるが、これは部分的には未知である。
このパラメータの不確実性に対するロバストな制御性を,既存の理論フレームワークを用いて評価する。
我々は、制御パルスを最適化し、パラメータ変動の影響に対する堅牢性を高めるために、不確実性関数にペナルティ項を導入する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:25:15 GMT)
Quadratic spin-phonon coupling and bipolarons in trapped ions [0.0] 捕捉したイオンの結晶中の2次スピンフォノンカップリングの量子シミュレーションを考察する。
イオン結晶フォノンの零点エネルギーによって駆動される移動バイポーラロンの出現を計算する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:34:34 GMT)
Probing quantum chaos through singular-value correlations in sparse non-Hermitian SYK model [0.0] スパース非エルミート的Sachdev-Ye-Kitaev(SYK)モデルにおける特異値のスペクトルについて検討する。
以上の結果から,特異値の統計値と類似のエルミート・ガウスアンサンブルの統計値との一致が明らかとなった。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:54:03 GMT)
Probability Bracket Notation for Probability Modeling [0.0] 確率ブラ(P-bra)、P-ket(P-bra)、P-bracket(P-bracket)、P-identity(P-identity)などを定義することにより、ブラケット表記法(PBN)を提案する。
PBNを用いることで、1つ以上の確率変数の系における正規化や期待といった多くの公式を抽象基底非依存の式で記述できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:42:53 GMT)
Privacy Risks in Health Big Data: A Systematic Literature Review [0.0] 本稿では、医療ビッグデータセキュリティ分野における重要な研究について概説する。
既存の研究を解析することにより、最先端技術が個人のプライバシーを保護しながらデータセキュリティをいかに強化するかを考察する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 06:44:36 GMT)
Polarization entanglement and qubit error rate dependence on the exciton-phonon coupling in self-assembled quantum dots [0.0] マイクロピラーキャビティに埋め込まれた量子ドット放射カスケードによって放出される偏光絡み合った光子対について理論的に検討する。
フォノン結合は2つの励起子状態間の交差結合と同様に1光子と2光子の不整合過程を導入することを示す。
フォノンを介する結合とアクスタークシフトと多光子放出は高温での絡み合いを著しく低下させることが示されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:46:08 GMT)
Partonic distribution functions and amplitudes using tensor network methods [0.0] 粒子分布関数 (PDF) と分布振幅 (DA) はクォークおよびグルーオン場の光円錐相関器として定義される非摂動量である。
1+1次元のNambu-Jona-Lasinioモデルを用いて模擬数値計算を行う。
PDFとDAは、摂動的および非相対論的限界における期待と一致し、大きな量子ビット限界における様々な強い結合度で評価する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:33:28 GMT)
Optimizing Perturbations for Improved Training of Machine Learning Models [0.0] 摂動学習プロセスが準定常状態に達した場合、単一摂動周波数での応答は広い周波数でその振舞いを予測することができることを示す。
本研究により,統計的手法を用いて機械学習モデルの学習プロトコルを最適化することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:53:21 GMT)
Optical forces on atoms subject to higher-order Poincaré vortex modes [0.0] 一般の準軸高次ポアンカー光ベクトルモードに浸漬された原子の光力を考える。
原子との結合は、特定の偏光が波動偏光のスペクトル内にあるようなモードを含む広い範囲のシナリオを引き起こす。
このことは、単位ポアンカー球面上のモードの角座標で表される偏極であるモードオーダー$m$によって支配される様々な物理的状況を引き起こすことを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:18:17 GMT)
OneTrack-M: A multitask approach to transformer-based MOT models [0.0] マルチオブジェクト追跡(MOT)はコンピュータビジョンにおいて重要な問題である。
OneTrack-Mは、計算効率と精度のトラッキングを強化するために設計されたトランスフォーマーベースのMOTモデルである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:02:06 GMT)
On characterizing optimal learning trajectories in a class of learning problems [0.0] 本稿では,学習問題のクラスにおける最適学習軌跡を特徴付けるために,最大原理と動的プログラミングの関係を利用する。
このような学習問題のクラスに対して最適な推定モデルパラメータに導かれる最適な学習軌跡を構築するためのアルゴリズム的レシピを提供する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:54:13 GMT)
Observations of Holographic Quantum-Foam Blurring [0.0] ここでは、時空の「フォアミン」が宇宙距離の点源の画像にどのように加算できるかについて論じる。
ホログラム量子重力と整合した発泡によるぼかしの簡易多波長平均について述べる。
これは測定された測定値のポイントスプレッド関数と、GRB221009Aの高エネルギー局在に適合する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:53:49 GMT)
Nonlocal characteristics of two-qubit gates and their argand diagrams [0.0] 2ビットゲートの非局所部分の正方形固有値のアーガンド図に現れるコードの有用性を示し,その非局所特性について検討する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 07:15:24 GMT)
Nonlinearity and Quantumness in Thermodynamics: From Principles to Technologies [0.0] 熱力学に対する量子力学の影響は、量子コヒーレント進化と熱機械の散発的でオープンな性質との非互換性によって制限されている。
我々は最近,従来のHM関数を,クロスカーやモード間カップリングなど非線形な数モードコヒーレントな閉系に置き換えるパラダイム変更を提案している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:37:25 GMT)
Non-unitary time dynamics of topological modes in open planar quantum systems [0.0] 正方格子型開量子系における位相モードの非単位時間ダイナミクスについて検討する。
このようなリアルタイムランプが存在する場合、これらのモードの生存確率は短い(長い)時間スケールで減少する(増加)。
時間進化の逆コースでは、そのようなトポロジカルモードが初期システムに欠如している場合には、より強いシステムと環境の結合が増加する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:33 GMT)
Making Sense of Touch: Unsupervised Shapelet Learning in Bag-of-words Sense [0.0] 本稿では、t分散隣接操作(t-SNE)データを用いたニューラルネットワークNN-STNEを導入し、シェープレットデータへのマッピングにより入力次元を縮小する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:50:40 GMT)
Low-overhead quantum error correction codes with a cyclic topology [0.0] 非隣り合うデータ量子ビットに絡み合ったアンシラを持つ補正符号の量子回路を構築する方法を示す。
改良されたルックアップテーブルデコーダによってサポートされているニューラルネットワークベースのデコードアルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:45:20 GMT)
Local Properties of the Rapidity Distribution in the Lieb-Liniger Model [0.0] We study the rapidity distribution in the Lieb-Liniger model and derived exact relations for its derivatives at the Fermi level。
後者は、低温および任意の相互作用で系の自由エネルギーを解析的に扱うことができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:17:27 GMT)
Linear-time classical approximate optimization of cubic-lattice classical spin glasses [0.0] 短距離古典スピングラスは線形時間とテンソル-ネットワーク空間で概ね最適化可能であることを示す。
我々のアルゴリズムは大規模並列化に適しており、フォトニック行列乗算ハードウェアによる低消費電力で高速化された実装も可能である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:40:02 GMT)
Lattice stitching by eigenvector continuation for Holstein polaron [0.0] 拡張格子におけるホルシュタインモデルに対する最小固有値と固有ベクトルを構成するアルゴリズムを示す。
これにより、計算ヒルベルト空間は指数的に減少する。
我々は、100個のサイトと32個のサイトフォノンを持つ格子内のホルシュタイン・ポーラロンの基底状態が、11量子ビットの変分量子固有解法によって計算可能であることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 21:00:23 GMT)
LUND-PROBE -- LUND Prostate Radiotherapy Open Benchmarking and Evaluation dataset [0.0] MRI誘導放射線療法を施行した前立腺癌432例に対する、MRIおよび合成CT(sCT)画像、ターゲットおよびOARsセグメンテーション、線量放射線療法を含む、一般に利用可能な臨床データセットが提示される。
また、深層学習(DL)生成セグメンテーション、DLセグメンテーションの不確実性マップ、および4人の放射線腫瘍学者によって手動で調整されたDLセグメンテーションなど、35人の患者による拡張データセットも含んでいる。
本論文は, 自動放射線治療計画, セグメンテーション, サーバ間分析, DLモデル不確実性調査の分野における研究を支援することを目的としている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:44:42 GMT)
LLMs to Support a Domain Specific Knowledge Assistant [0.0] 本研究は、国際金融報告基準(IFRS)を用いたサステナビリティレポートのためのドメイン固有知識アシスタントを開発するためのカスタムアプローチを提案する。
このドメインでは、公開可能なQAデータセットは存在せず、レポートを提供する企業をサポートするための高品質なパイプラインの開発を阻害している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:12:41 GMT)
Krylov fractality and complexity in generic random matrix ensembles [0.0] クリロフ空間法は量子系の動的側面を分析するための効率的なフレームワークを提供する。
適切なランダムな行列アンサンブルに対する三対角行列要素と関連する基底ベクトルの特性を考察する。
本稿では,3つの条件(エルゴード,フラクタル,局所化)における行列要素と基底ベクトルの特性について考察し,遷移点を特定するためのツールを紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:38:40 GMT)
Iterate to Accelerate: A Unified Framework for Iterative Reasoning and Feedback Convergence [0.0] 本稿では,Bregmanの発散による非ユークリッド幾何学,高次演算子平均化,適応フィードバック機構を利用した反復推論のための統一的フレームワークを提案する。
我々の分析は、軽度な滑らかさと収縮性仮定の下では、ミラー降下や動的プログラミングのような古典的手法を統一するだけでなく、大規模言語モデルにおける現代の連鎖推論過程も捉えることを証明している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:24:35 GMT)
Inteligencia artificial para la multi-clasificación de fauna en fotografías automáticas utilizadas en investigación científica [0.0] カメラトラップは何百万もの画像の収集を可能にする。
これらの膨大なデータリポジトリに格納されている貴重な知識の多くは、未解決のままである。
本研究の目的は,動物種をカメラトラップで撮影した写真に分類するニューラルネットワークモデルの構築である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:23:24 GMT)
Integrating Generative Artificial Intelligence in ADRD: A Framework for Streamlining Diagnosis and Care in Neurodegenerative Diseases [0.0] 臨床医の能力を高めることにより,大規模言語モデル (LLM) がより迅速な実践的応用を実現することを提案する。
我々は,LLMが患者と提供者の両方と効果的にコミュニケーションできる能力を活用する,責任あるAI統合のためのフレームワークを提案する。
このアプローチは、標準化された高品質のデータ収集を優先し、患者が遭遇するたびに学習するシステムを実現する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:09:11 GMT)
Improving and benchmarking NISQ qubit routers [0.0] 1次元および2次元格子接続性に基づくランダム量子回路を考慮した様々なルーティング手法をベンチマークする。
本稿では、SWAPと回路深さのオーバーヘッドの影響を捉えるための総合的な指標として、回路の忠実度を紹介する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:31:51 GMT)
Illuminating Spaces: Deep Reinforcement Learning and Laser-Wall Partitioning for Architectural Layout Generation [0.0] 本稿では,人間の設計過程を直感的に模倣する手続き的アプローチを提案する。
SLDにRLを効果的に使用するには、望ましい設計ソリューションを生成するための爆発的空間構成法が必要である。
本稿では,空間分割のための空間分割法である「レーザー壁」を紹介した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 09:35:24 GMT)
How does a Multilingual LM Handle Multiple Languages? [0.0] 本研究では,多言語理解,意味表現,言語間知識伝達の能力について批判的に検討する。
コサイン類似性を用いた一貫性のための多言語単語埋め込みの分析により意味的類似性を評価する。
BLOOM-1.7B と Qwen2 を Named Entity Recognition と文類似性タスクを通して調べ、それらの言語構造を理解する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:08:14 GMT)
Hierarchical Entropic Diffusion for Ransomware Detection: A Probabilistic Approach to Behavioral Anomaly Isolation [0.0] 本稿では,構造的エントロピーに基づく異常分類機構を提案する。
エントロピーの進化の変動を追跡し、良質な暗号プロセスと不正な暗号化の試みを区別する。
さまざまなランサムウェアファミリーにまたがる高い分類精度を維持し、従来のベースとシグネチャ駆動のアプローチより優れている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:55:11 GMT)
HEP-JEPA: A foundation model for collider physics using joint embedding predictive architecture [0.0] 本稿では,高エネルギー粒子衝突器におけるタスクに対するトランスフォーマーアーキテクチャに基づく基礎モデルを提案する。
我々は,ジョイント・エンベディング予測アーキテクチャにインスパイアされた自己監督型戦略を用いて,ジェット機を分類するモデルを訓練する。
我々のモデルは、標準分類ベンチマークタスクのための他のデータセットと相性がいい。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:16:27 GMT)
Graph machine learning for flight delay prediction due to holding manouver [0.0] 本研究は,グラフ問題としての保持操作による飛行遅延の予測をモデル化する。
我々は、高度なグラフ機械学習(Graph ML)技術を活用し、航空交通網の複雑な相互依存を捉える。
我々は、ユーザがリアルタイム遅延予測をシミュレートできるWebベースのツールを通じて、モデルが潜在的に運用に与える影響について論じる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:18:53 GMT)
Geometrical frustration, power law tunneling and non-local gauge fields from scattered light [0.0] 幾何学的形状の分子雲上での非共鳴光子散乱過程を考察する。
解析により、そのようなセットアップはBose-Hubbard Hamiltonianによって適切にモデル化されていることが示された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:58 GMT)
Generalized $η$-pairing theory and anomalous localization in non-Hermitian systems [0.0] 任意の格子上の非エルミートハバードモデルに対して、eta-pairing理論を一般化する。
エルミート類縁類を含まない固有なエタペア現象が見つかる。
我々の一般のeta-pairing理論はまた、ハバードモデルのこれらの対称性を以前にも知られていない統一化を明らかにしている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:13:34 GMT)
Gate teleportation-assisted routing for quantum algorithms [0.0] この研究は、キュービットルーティング効率を改善するために、遠隔ゲートの可能性を探究する。
本稿では,ゲートテレポーテーションを補助するルーティング手法を提案する。
各種ベンチマークアルゴリズムにおいて,ゲートテレポーテーション支援ルーティングを用いた奥行き低減効果を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:18:13 GMT)
Frame-dependent coherence of a quantum state [0.0] 有限次元ヒルベルト空間は典型的には正則基底を用いて記述されるが、より一般的な記述は強フレームを用いて得ることができる。
フレーム依存コヒーレンス(英語版)は、基底依存コヒーレンスと類似して定義されるので、コヒーレンスを定義することができる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:09:21 GMT)
Finding Pegasus: Enhancing Unsupervised Anomaly Detection in High-Dimensional Data using a Manifold-Based Approach [0.0] 本稿では, 理想化された図形 "Finding Pegasus" と, 教師なし異常検出手法を分類した新しい形式的枠組みを提案する。
次に、この知見を用いて、高DRの状況において精度を犠牲にすることなくADリコールを大幅に向上させるAD手法を組み合わせるアプローチを開発する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:53:30 GMT)
Exploring operation parallelism vs. ion movement in ion-trapped QCCD architectures [0.0] イオントラッピング量子電荷結合デバイス(QCCD)アーキテクチャは、単一トラップデバイスをスケールする上で有望な代替手段として登場した。
本稿では,移動オーバーヘッドによる動作の並列性と忠実度損失とのトレードオフについて検討する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:12:31 GMT)
Entanglement witnesses and separability criteria based on generalized equiangular tight frames [0.0] 一般化された等角的測度から作用素を用いて正の写像を構成する。
それらの正当性は、わずかな等角的タイトフレームに対応する偶然の指標の不等式から従う。
これらの地図は、文献で考慮された多くの重要な階級を含む、絡み合った証人を生み出している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:04:01 GMT)
Ensembling Portfolio Strategies for Long-Term Investments: A Distribution-Free Preference Framework for Decision-Making and Algorithms [0.0] 本稿では、長期的富という観点から個別の戦略を上回るために、逐次的ポートフォリオのための複数の戦略をまとめることの問題点について考察する。
我々は,市場条件にかかわらず,戦略を組み合わせるための新たな意思決定枠組みを導入する。
シャープ比の小さなトレードオフがあるにもかかわらず、提案した戦略を支持する結果を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:58:31 GMT)
Enhancing people localisation in drone imagery for better crowd management by utilising every pixel in high-resolution images [0.0] ポイント指向オブジェクトローカライゼーションに特化した新しいアプローチを提案する。
Pixel Distillモジュールは高精細画像の処理を強化するために導入された。
UP-COUNTと名付けられた新しいデータセットは、現代のドローン用途に合わせている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 12:16:22 GMT)
Enhanced Quantum Sensing with Hybrid Exceptional-Diabolic Singularities [0.0] 4モードのボゾン系において,ハイブリッド(二重劣化)異型特異点(HED)近傍で線形摂動を検出する感度が向上したことを報告した。
感度向上は、推定誤差のスケーリングを決定する極次を含む特異応答関数に起因している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:07:02 GMT)
Digital Transformation in the Petrochemical Industry -- Challenges and Opportunities in the Implementation of {IoT} Technologies [0.0] 石油化学産業は、重要な技術、環境、産業安全、財政上の課題に直面している。
1920年代以降、かつて革新的だった技術は廃れていった。
本稿では,産業におけるこれらの技術の研究,開発,実装がもたらす課題と機会について論じる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:50:10 GMT)
DiSHA: Dimension-Sharding Adaptation of Large Language Models with Fast Convergence and Fast Computation [0.0] 本稿では, PEFT設計空間をより少ないトレーニングパラメータに拡張し, より高速な収束を実現する Dimension-Sharding Adaptation (DiSHA) を提案する。
提案するBlock Affine Efficient Computation (Bone)は,高い性能と効率性を実現する計算効率の高い構造である。
実証的な結果から、BoneはDiSHAフレームワークの下で、自然言語理解タスクと自然言語生成タスクの両方において、LoRAの亜種を一貫して上回ります。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 13:42:31 GMT)
Deterministic photonic entanglement arising from non-Abelian quantum holonomy [0.0] 我々は、光の制御された状態の高度に絡み合った重ね合わせを作成し、操作するためのプロトコルを開発する。
我々の計算は、そのような絡み合った重ね合わせの部分集合が極大に絡み合った「体積法則」状態であることを示している。
このエンタングリング機構は,光を用いた決定論的量子情報処理に有効であると考えられる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:01:23 GMT)
Deep Learning-Optimized, Fabrication Error-Tolerant Photonic Crystal Nanobeam Cavities for Scalable On-Chip Diamond Quantum Systems [0.0] キャビティ強化ダイヤモンド色中心量子ビットは、大規模でモジュラーな量子コンピュータに最適である。
しかし、ダイヤモンドのユニークな材料特性はナノフォトニックデバイスの製造に困難をもたらす。
ナノフォトニックデバイスの製造誤差耐性を高めるため,ディープラーニングに基づく最適化手法を開発した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:43:51 GMT)
Decoding AI Judgment: How LLMs Assess News Credibility and Bias [0.0] 大規模言語モデル(LLM)は、ニュースの信頼性を評価するためにますます使われているが、これらの判断の仕方についてはほとんど分かっていない。
本研究では、構造化された専門家主導のレーティングシステムに対して、最先端のLCMの信頼性と政治的分類をベンチマークする。
キーワード頻度, 文脈決定要因, ランク分布を調べることで, LLMが特定の言語特徴と信頼性をどのように関連付けるかを明らかにする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:52:10 GMT)
Cyclic quantum causal modelling with a graph separation theorem [0.0] 我々は、頑健な確率則と新しいグラフ分離特性、p-分離を導入し、これら全てのモデルに対して健全かつ完全であることを証明した。
提案手法は、選択後の量子テレポーテーションプロトコルを利用して、循環因果モデルから非巡回因果モデルにポストセレクションでマッピングする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:51:15 GMT)
Cyclic functional causal models beyond unique solvability with a graph separation theorem [0.0] 本研究では, 有限心身変数を含む全循環型fCMに適用可能な因果モデリングフレームワークを開発する。
我々の確率則は、一意に解けない巡回的 fCM に対しても一意分布を割り当てる。
我々は、新しいグラフ分離特性、p-分離を導入し、これを全ての一貫した有限カルチニティ巡回fCMに対して健全かつ完全であることを証明した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:02:57 GMT)
Convergence and Quantum Advantage of Trotterized MERA for Strongly-Correlated Systems [0.0] トロッタライズされたMERA VQEは、量子コンピュータ上での強い相関関係の量子多体系の効率的な研究にとって有望なルートである。
我々は,MERA層をステージ上に構築し,最適化中に位相図を走査することにより,収束を著しく改善できることを示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 05:34:02 GMT)
Contextual Gradient Flow Modeling for Large Language Model Generalization in Multi-Scale Feature Spaces [0.0] マルチスケールの文脈調整を取り入れた構造的勾配改善フレームワークが導入された。
重み更新の階層的な調整は、従来のバックプロパゲーションの代替となった。
構造最適化戦略は不均一なテキスト分布の適応性を保ちながらオーバーフィッティングを緩和する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:57:40 GMT)
Consumer INS Coupled with Carrier Phase Measurements for GNSS Spoofing Detection [0.0] 慣性測定ユニットは、提供されたナビゲーションソリューションの精度と堅牢性を高めることに成功している。
しかし、否定された文脈における慣性技術に基づく効果的なナビゲーションには、ハイエンドのセンサーが必要である。
そこで本研究では,MEMS INSとハイエンド産業用グレードセンサの性能について述べる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:34:23 GMT)
Comparison of CNN-based deep learning architectures for unsteady CFD acceleration on small datasets [0.0] 本研究では、非定常計算流体力学(CFD)シミュレーションを高速化するための高度な畳み込みニューラルネットワーク(CNN)アーキテクチャの比較を行った。
CNNは, 自己回帰時系列予測において, 予測精度とロバスト性を決定するために, 同一条件下で評価された。
ConvLSTM-UNetは、特に差値計算において、より低い最大誤差と安定した残差を達成する他のモデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:30:49 GMT)
Cognitive AI framework: advances in the simulation of human thought [0.0] Human Cognitive Simulation Frameworkは、人間の認知能力を人工知能システムに統合する大きな進歩を表している。
短期記憶(会話コンテキスト)、長期記憶(対話コンテキスト)、高度な認知処理、効率的な知識管理を融合することにより、コンテキストコヒーレンスと永続的なデータストレージを確保する。
このフレームワークは、継続的学習アルゴリズム、持続可能性、マルチモーダル適応性に関する将来の研究の基礎を築き、Cognitive AIを新興分野におけるトランスフォーメーションモデルとして位置づけている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:43:35 GMT)
Clinicians' Voice: Fundamental Considerations for XAI in Healthcare [0.0] 臨床医との半構造化インタビューを行い,その考え,希望,懸念について考察した。
私たちのサンプルの臨床医は一般的に、臨床実習のためのAIベースのツールの開発について肯定的に考えます。
彼らは、これらがワークフローにどのように適合し、それが臨床医と患者の関係にどのように影響するかを懸念している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:11:13 GMT)
CleanSurvival: Automated data preprocessing for time-to-event models using reinforcement learning [0.0] データ前処理は、機械学習の重要かつ頻繁に無視される側面である。
CleanSurvivalは、プレプロセスパイプラインを最適化するための強化学習ベースのソリューションである。
連続的および分類的変数を処理し、Q-learningを使用して、データ計算、外れ値検出、特徴抽出のどの組み合わせが最適なパフォーマンスを達成するかを選択できる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:33:37 GMT)
Casimir force inadequacy in explaining a strong attractive force in a micrometer-sized narrow-gap re-entrant cavity [0.0] Pateらは、AuまたはNbでコーティングされたSiN膜共振器と結合した狭ギャップ再入射キャビティを有するマクロメカニカルシステムについて検討した。
彼らは、サブ-2-ミクロンギャップに対して、膜有効バネ定数$k_rm eff$が著しく増加したことを観察した。
この力を熱カシミール効果にのみ寄与することは、我々の詳細な計算によって挑戦される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:21:29 GMT)
Can Grammarly and ChatGPT accelerate language change? AI-powered technologies and their impact on the English language: wordiness vs. conciseness [0.0] 本稿では,文法とChatGPTが英語の単語性と簡潔性にどのように影響するかを検討する。
Grammarly と ChatGPT はどちらも、比較的短い文であっても、より簡潔で冗長性が少ないことを示唆している。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:59:26 GMT)
CNN Autoencoders for Hierarchical Feature Extraction and Fusion in Multi-sensor Human Activity Recognition [0.0] 我々は、IMUセンサデータから特徴を抽出し、融合するように設計された階層的教師なし核融合モデルを導入する。
調整されたモデルは、UCI-HAR、DaLiAc、パーキンソン病歩行ダタセットに適用される。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:36:41 GMT)
Building A Unified AI-centric Language System: analysis, framework and future work [0.0] 本稿では,AI中心の統一言語システムの設計について考察する。
多様な自然言語入力を合理化されたAIフレンドリーな言語に翻訳するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 20:32:57 GMT)
Brain Tumor Identification using Improved YOLOv8 [0.0] 我々はMRI画像内の腫瘍を正確に検出する修正されたYou Only Look Once (YOLOv8)モデルを提案する。
提案手法は,非最大抑圧 (NMS) アルゴリズムを実時間検出変換器 (RT-DETR) に置き換える。
2つ目の改善は、通常の畳み込みブロックをゴースト畳み込みに置き換えることである。
3つ目の改善は、YOLOv8のバックボーンに視覚トランスフォーマーブロックを導入して、コンテキスト認識機能を抽出することで実現された。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 03:16:26 GMT)
Black Hole Evaporation in Loop Quantum Gravity [0.0] ホーキングのブラックホール放射率に関するセミナー論文は50年前に出版された。
このコントリビューションの目標は、出現した主流の視点を要約することだ。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:41:16 GMT)
Automated Microservice Pattern Instance Detection Using Infrastructure-as-Code Artifacts and Large Language Models [0.0] この記事では、現在進行中のPhD研究、初期の実験、マイクロサービスパターンインスタンスの自動検出のためのMicroPADと呼ばれるツールのプロトタイプについて紹介します。
プロトタイプでは、Large Language Models(LLM)を使用して、インフラストラクチャ・アズ・コード(IaC)アーティファクトを分析して検出を支援し、コストを低く抑え、検出可能なパターンの範囲を最大化することを目的としている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:22:14 GMT)
Assessing and Prioritizing Ransomware Risk Based on Historical Victim Data [0.0] ランサムウェアの敵が特定のエンティティをターゲットにする可能性が最も高いものを識別するアプローチを提案する。
ランサムウェアは、利益主導のモチベーション、犯罪シンジケートを支援する複雑な経済、そして攻撃の過度な性質を特徴とする、恐ろしいサイバーセキュリティの脅威を生んでいる。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:57:56 GMT)
Any theory that admits a Wigner's Friend type multi-agent paradox is logically contextual [0.0] 一般理論におけるウィグナーの友型マルチエージェントパラドックスと文脈性の関係を証明した。
我々は、そのようなパラドックスの構造的性質を一般理論および量子論に特異的に同定する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 08:43:36 GMT)
Ancient Greek Technology: An Immersive Learning Use Case Described Using a Co-Intelligent Custom ChatGPT Assistant [0.0] 本稿では,構造化事例報告が,没入型学習文学への新たな貢献であることを示す。
本報告では,ChatGPTアシスタントの使用は,最終ILCSのチームメンバーのコヒーレンスと品質を著しく向上させるものである。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 14:35:42 GMT)
Agricultural Field Boundary Detection through Integration of "Simple Non-Iterative Clustering (SNIC) Super Pixels" and "Canny Edge Detection Method" [0.0] 本稿では,Google Earth Engine (GEE) プラットフォームを用いて得られた衛星データを用いて,耕作地の適合性とグリーン指数を決定するための新しい手法を提案する。
2つの強力なアルゴリズム「SNIC(Simple Non-Iterative Clustering) Super Pixels」と「Canny Edge Detection Method」を組み合わせる。
提案手法は, ランダムに選択された農地を精度よく, 確実に分類するのに有効である。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 22:00:41 GMT)
Afrispeech-Dialog: A Benchmark Dataset for Spontaneous English Conversations in Healthcare and Beyond [0.0] Afrispeech-Dialogは、医学的および非医学的アフリカ中心の英語会話を模擬した50のベンチマークデータセットである。
長音のアクセント付き音声に対して,最先端話者ダイアリゼーション(SOTA)とASRシステムを評価し,その性能をネイティブアクセントと比較し,10%以上の性能劣化を見出した。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:33:07 GMT)
Accelerating Dissipative State Preparation with Adaptive Open Quantum Dynamics [0.0] 様々な散発的な状態準備スキームは、基本的な時間的絡み合いのトレードオフに悩まされている。
我々は、このトレードオフを完全に回避するために、最小限の適応力学を使用する方法を示す。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 23:22:22 GMT)
AL-PINN: Active Learning-Driven Physics-Informed Neural Networks for Efficient Sample Selection in Solving Partial Differential Equations [0.0] 偏微分方程式(PDE)の解法として物理情報ニューラルネットワーク(PINN)が誕生した。
サンプル選択を動的に最適化するために、不確実性定量化(UQ)とアクティブラーニング戦略を統合したアクティブラーニング駆動型PINN(AL-PINN)を提案する。
その結果,AL-PINN は従来の PINN と比較して精度が向上し,必要なトレーニングサンプルの数を削減できた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:54:28 GMT)
A Unified Theory of Quantum Neural Network Loss Landscapes [0.0] 量子ニューラルネットワーク(QNN)はランダムにガウス過程として振る舞うことが知られている。
QNNとその最初の2つの導関数が一般に「ウィッシュアートプロセス」と呼ばれるものを形成することを示す。
我々の統合フレームワークは、与えられたQNNモデルの「トレーニング可能性」に対して、ある種の単純な運用定義を提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 16:55:16 GMT)
A Pseudo Markov-Chain Model and Time-Elapsed Measures of Mobility from Collective Data [0.0] 時系列として与えられた時間と空間の集合的移動データから複数区間にわたる時間経過フローを理解するための擬似マルコフ連鎖モデルを開発した。
我々は、ジャイレーション半径など、個々のモビリティデータに類似したモビリティの尺度を開発する。
我々はこれらの対策をNetMob 2024 Data Challengeデータに適用し、都市の統計や通勤パターンと一致する興味深い結果を得る。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 15:46:43 GMT)
A Performance Analysis of You Only Look Once Models for Deployment on Constrained Computational Edge Devices in Drone Applications [0.0] 本研究では,資源制約のあるエッジデバイスやクラウド環境へのオブジェクト検出モデルの展開を評価する。
NVIDIA Jetson Orin Nano、Orin NX、Raspberry Pi 5(RPI5)デバイスは、検出精度、推論速度、エネルギー消費を測定するためにテストされている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:22:01 GMT)
A Methodology for Studying Linguistic and Cultural Change in China, 1900-1950 [0.0] 本稿では,20世紀前半の中国における言語・文化の変化を定量的に研究する。
この時期の中国語と文化の劇的な変化は、テキスト分析に使用されるツールや手法をより深く反映することを求めている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 18:33:50 GMT)
A Memetic NSGA-III for Green Flexible Production with Real-Time Energy Costs & Emissions [0.0] この研究は、生産をリアルタイムエネルギー市場に適用し、グリッドにフレキシブルな消費を提供する産業に焦点を当てている。
本研究では, 省エネ, 省エネ, 排出を最小化し, 実エネルギー市場データを統合するための新しいメメティックNSGA-IIIを提案する。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 10:10:27 GMT)
A Comprehensive Survey of Fuzzy Implication Functions [0.0] ファジィ含意関数はファジィ論理における重要な研究領域である。
本調査は,ファジィ含意関数の多種多様なファジィ族を包括的に概観することを目的とする。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 11:09:24 GMT)
A Classification System Approach in Predicting Chinese Censorship [0.0] バイナリ検閲マーク付き中国語句のクリーン化データセットを構築した。
分類のための4つのロジスティック回帰モデルを導出することができた。
我々は、Fined-Tuned BERTモデルが他の性能戦略を上回っていると結論づけた。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 17:19:14 GMT)
"In order that" -- a data driven study of symptoms and causes of obsolescence [0.0] 本論文は,現在進行中の文法的不定形化の事例研究である。
主に研究されている変数は目的代行詞であり、20世紀初頭から使用頻度が着実に減少していることが示されている。
論文参考訳(メタデータ) (Thu, 06 Feb 2025 19:03:45 GMT)