Towards Expressive Spectral-Temporal Graph Neural Networks for Time Series Forecasting [101.5] スペクトル時間グラフニューラルネットワークは、ほとんどの時系列予測モデルの基礎となる、有望な抽象化である。
我々は、スペクトル時間GNNの表現力を高める理論的枠組みを確立する。
本研究は,GNNをベースとした時系列モデルにおいて,より広範に表現可能なGNNモデルを考案するための道筋をたどるものである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 01:06:33 GMT)
A Causality-aware Paradigm for Evaluating Creativity of Multimodal Large Language Models [100.2] オオギリゲーム(オオギリゲーム)は、ユーモアと連想的思考を必要とする創造的な仕事である。
LoTbenchはインタラクティブで因果性を考慮した評価フレームワークである。
その結果、ほとんどのLLMは制約された創造性を示すが、LLMと人間の間の性能格差は克服できないことがわかった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:09:48 GMT)
CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models [97.2] 本稿では,Large Language Models (LLMs) のコード批判ベンチマークであるCodeCriticBenchを紹介する。
具体的には、CodeCriticBenchには2つの主要なコードタスク(コード生成とコードQA)が含まれています。
さらに、評価プロトコルには、基本的な批評評価と、異なる特性に対する高度な批評評価が含まれる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:36:43 GMT)
Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation [90.0] 複雑な長距離ロボット操作問題を解決するには、高度な高レベルの計画能力が必要である。
インターネット上で事前訓練された視覚言語モデル(VLM)は、原則としてそのような問題に対処するためのフレームワークを提供する。
本稿では,多段階操作タスクにおけるVLMの物理推論能力を高める新しいテストタイムフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:42:15 GMT)
WildLong: Synthesizing Realistic Long-Context Instruction Data at Scale [86.3] WildLongは、実際のユーザクエリからメタ情報を取り出して、スケーラブルなデータを生成する。
クロスドキュメント比較やアグリゲーションといったマルチドキュメント推論をサポートする。
ベンチマーク全体で、既存のオープンソースの長期コンテキスト最適化モデルを上回っている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:59:09 GMT)
GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models [73.2] 大規模言語モデル(LLM)は、自然言語生成において顕著な能力を示してきたが、社会的バイアスを増大させることも観察されている。
GenderCAREは、革新的な基準、バイアス評価、リダクションテクニック、評価メトリクスを含む包括的なフレームワークである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:10:23 GMT)
The Mirage of Model Editing: Revisiting Evaluation in the Wild [70.2] 質問応答アプリケーションにおけるモデル編集の有効性について検討する。
単一の編集実験により、現在行われている編集手法は、以前報告したよりも大幅に悪化していることが示された。
本分析は,既存のモデル編集手法の現実的適用性と評価手法の両面について,基礎的な再検討を行うものである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:01:12 GMT)
SelaVPR++: Towards Seamless Adaptation of Foundation Models for Efficient Place Recognition [69.6] 近年の研究では、事前学習した視覚基盤モデルを用いた視覚的位置認識(VPR)法が有望な性能を達成できることが示されている。
本稿では,基礎モデルのVPRへのシームレスな適応を実現する新しい手法を提案する。
効率の向上と性能向上のために,SelaVPR++と呼ばれるSelaVPRの拡張を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:01:09 GMT)
LLMs Are Biased Towards Output Formats! Systematically Evaluating and Mitigating Output Format Bias of LLMs [69.4] 本稿では,大規模言語モデル(LLM)の性能評価において,形式バイアスを考慮した最初の体系的評価を提案する。
本稿では,複数の質問回答,ラッピング,リスト,マッピングの4つのカテゴリにまたがる経験的形式バイアス評価について述べる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:39:12 GMT)
OpenOmni: Advancing Open-Source Omnimodal Large Language Models with Progressive Multimodal Alignment and Real-Time Self-Aware Emotional Speech Synthesis [68.7] nameは、一様アライメントと音声生成を統合する2段階のトレーニングフレームワークである。
雑用、視覚言語、音声言語ベンチマークで最先端モデルを上回っている。
nameは、非自己回帰モードで1秒のレイテンシでリアルタイムの音声生成を実現する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:04:04 GMT)
Can Indirect Prompt Injection Attacks Be Detected and Removed? [68.7] 間接的インジェクション攻撃の検出・除去の可能性について検討した。
検出のために,既存のLCMとオープンソースの検出モデルの性能を評価する。
そこで本研究では,(1) インジェクション命令を含む部分をセグメント化して除去するセグメンテーション除去法,(2) 抽出モデルを訓練してインジェクション命令を識別・除去する抽出除去法,の2つの直感的手法を評価する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:02:16 GMT)
Compression Scaling Laws:Unifying Sparsity and Quantization [65.1] プレトレーニング中の大規模言語モデル(LLM)のスケーリング挙動に異なる圧縮手法がどう影響するかを検討する。
重みのみの量子化は強力なパラメータ効率乗算器を実現する一方で、重みとアクティベーションの完全な量子化は低ビット幅でのリターンの低下を示す。
以上の結果から,異なる圧縮手法を共通のスケーリング法枠組みの下で統一できることが示唆された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:47:36 GMT)
EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents [63.4] EmbodiedBenchは、視覚駆動型エンボディエージェントを評価するために設計された広範囲なベンチマークである。
我々はEmbodiedBench内のプロプライエタリでオープンソースなMLLMを19件評価した。
MLLMは高レベルのタスクでは優れているが、低レベルの操作には苦労する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:30:59 GMT)
VisFactor: Benchmarking Fundamental Visual Cognition in Multimodal Large Language Models [62.7] 因子関連認知テスト(FRCT)から得られた新しいベンチマークであるVisFactorを紹介する。
VisFactorは視覚関連FRCTサブテストのデジタル化を行い、基本的な視覚認知タスク間でMLLMを体系的に評価する。
GPT-4o, Gemini-Pro, Qwen-VLなどの最先端MLLMの総合評価を行った。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:21:32 GMT)
On Bits and Bandits: Quantifying the Regret-Information Trade-off [62.6] エージェントが蓄積する情報と、それが苦しむ後悔の間のトレードオフについて検討する。
エージェントが蓄積する情報に依存する、最初のベイズ的後悔の低い境界を導入する。
また,エージェントが蓄積する情報量を用いて,後悔の上限を証明した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:06:05 GMT)
A Label-Free Heterophily-Guided Approach for Unsupervised Graph Fraud Detection [60.1] 本稿では,非教師付きGFDのための非教師付きグラフ不正検出手法(HUGE)を提案する。
推定モジュールでは、GFD の臨界グラフ特性をキャプチャする HALO と呼ばれる新しいラベルフリーなヘテロフィリー計量を設計する。
アライメントに基づく不正検出モジュールにおいて、ランキング損失と非対称アライメント損失を有する合同GNNアーキテクチャを開発する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:15:48 GMT)
Class-Conditional Neural Polarizer: A Lightweight and Effective Backdoor Defense by Purifying Poisoned Features [58.4] 最近の研究は、バックドア攻撃に対するディープニューラルネットワークの脆弱性を強調している。
ニューラルポーラライザーベースディフェンス(CNPD)という,軽量なバックドアディフェンス手法を提案する。
CNPDは、バックドアモデルの予測ラベルと、浄化すべき機能を統合する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:11:16 GMT)
DeProPose: Deficiency-Proof 3D Human Pose Estimation via Adaptive Multi-View Fusion [57.8] 欠陥認識型3Dポーズ推定の課題について紹介する。
DeProPoseは、トレーニングの複雑さを減らすために、ネットワークアーキテクチャをシンプルにするためのフレキシブルなメソッドである。
我々は,新しい3次元ポーズ推定データセットを開発した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:22:54 GMT)
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [55.9] Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。
異なる分子エンコーダの相補的な情報を統合するモジュールを導入する。
実験の結果,Moll-LLaMAは分子の一般的な特徴を理解することができることがわかった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:45:09 GMT)
Improving Expressive Power of Spectral Graph Neural Networks with Eigenvalue Correction [55.6] 本稿では,繰り返し入力される固有値の制約からフィルタを解放する固有値補正手法を提案する。
具体的には、提案した固有値補正戦略により、固有値の均一分布が向上し、フィルタの適合能力と表現力が向上する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:18:49 GMT)
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration [54.8] ラベルなしのオフライン軌道データは、効率的な探索戦略を学ぶために利用することができる。
提案手法は,42の長軸,スパース・リワードタスクからなるスイートにおいて,従来戦略よりも一貫して優れていた。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:58:48 GMT)
2-Rectifications are Enough for Straight Flows: A Theoretical Insight into Wasserstein Convergence [54.6] 本稿では, 凝固流のサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する最初の理論的解析を行った。
ガウス流から有限の第一モーメントを持つ任意の一般目標分布への整流の場合、直流を達成するのに2つの整流が十分であることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:24:40 GMT)
A Survey of Graph Transformers: Architectures, Theories and Applications [54.6] 近年の研究では、多種多様なアーキテクチャ、説明可能性の向上、グラフトランスフォーマーの実用化などが提案されている。
グラフ変換器のアーキテクチャは,その構造情報処理戦略に従って分類する。
本稿では, 分子, タンパク質, 言語, 視覚トラフィック, 脳, 物質データなど, グラフトランスフォーマーの実用化について概説する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:55:19 GMT)
MLLM can see? Dynamic Correction Decoding for Hallucination Mitigation [50.7] MLLM(Multimodal Large Language Models)はしばしば幻覚現象を示す。
実験により,MLLMは最終出力のオブジェクトを誤って生成するが,前層の視覚的オブジェクトを認識できることがわかった。
そこで本研究では,MLLMs DeCoの動的補正復号法を提案する。この手法は,適切な先行層を適応的に選択し,最終層に知識を比例的に統合し,出力ロジットを調整する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:14:47 GMT)
AnyDexGrasp: General Dexterous Grasping for Different Hands with Human-level Learning Efficiency [49.9] 我々は,最小限のデータを用いてきめ細やかな把握を学習するための効率的なアプローチを提案する。
提案手法は,40個の訓練対象に対して数百のグリップ試行を行うだけで,人間レベルの学習効率で高い性能を達成できる。
この方法は、ヒューマノイドロボット、人工装具、その他頑丈で汎用的なロボット操作を必要とする領域に対する有望な応用を実証する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:26:06 GMT)
BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning [49.5] 実際の研究から5.1Kの複雑な経路問題を持つデータセットであるBioMazeを紹介する。
CoT法やグラフ拡張推論法などの手法の評価は,LLMが経路推論に苦慮していることを示している。
そこで本稿では,インタラクティブなサブグラフベースのナビゲーションにより推論を強化するLLMエージェントであるPathSeekerを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:38:10 GMT)
Recent Advances in Large Langauge Model Benchmarks against Data Contamination: From Static to Dynamic Evaluation [48.2] データ汚染リスクの低減を目的とした静的・動的ベンチマーク手法の詳細な分析を行う。
本稿では、動的ベンチマークのための最適設計原則のシリーズを提案し、既存の動的ベンチマークの限界を解析する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:18:37 GMT)
Augmenting Black-box LLMs with Medical Textbooks for Biomedical Question Answering [48.2] LLMs Augmented with Medical Textbooks (LLM-AMT)を提案する。
LLM-AMTは、プラグイン・アンド・プレイモジュールを使用して、権威ある医学教科書をLLMのフレームワークに統合する。
検索コーパスとしての医学教科書は,医学領域におけるウィキペディアよりも効果的な知識データベースであることが確認された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:16:52 GMT)
Analysis of Emotion in Rumour Threads on Social Media [47.3] 私たちは、スレッド化された談話における感情と噂のインターフェイスに焦点を当て、このトピックに関する驚くほどまばらな文献に基づいています。
既存のNLPデータセットを用いて、噂と非噂のケースを対比した総合的な分析感情フレームワークを提供する。
我々の枠組みでは、怒り、恐怖、悲観など、より否定的な感情や感情を呈し、非噂はよりポジティブな感情を誘発する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:57:40 GMT)
GS-TransUNet: Integrated 2D Gaussian Splatting and Transformer UNet for Accurate Skin Lesion Analysis [45.0] 本稿では,2次元ガウススプラッティングとTransformer UNetアーキテクチャを組み合わせた皮膚癌自動診断手法を提案する。
セグメンテーションと分類の精度は著しく向上した。
この統合は、新しいベンチマークをこの分野に設定し、マルチタスク医療画像解析手法のさらなる研究の可能性を強調している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 23:28:47 GMT)
Understanding Long Videos with Multimodal Language Models [44.8] LLM(Large Language Models)は、長いビデオ理解ベンチマークにおいて優れたパフォーマンスを達成するために、最近のアプローチを可能にしている。
本研究では,LLMの広範な世界知識と強力な推論能力が,この強みにどのように影響するかを考察する。
得られたマルチモーダルビデオ理解フレームワークは、複数のビデオ理解ベンチマークで最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 23:45:52 GMT)
Automatic Joint Structured Pruning and Quantization for Efficient Neural Network Training and Compression [44.4] 構造化プルーニングと量子化は、ディープニューラルネットワーク(DNN)のサイズを減らすために使用される基本技術である
これらのテクニックを共同最適化を通じて併用することで、より小さく高品質なモデルを作成することができる。
本稿では,任意のDNN上で協調的構造化プルーニングと量子化学習を自動かつ効率的に行うフレームワークGETAを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:28:18 GMT)
Fine-Grained Video Captioning through Scene Graph Consolidation [44.3] 本稿では,動画からフレームレベルのシーングラフを合成し,キャプション生成の中間表現を得るゼロショットビデオキャプション手法を提案する。
提案手法は,まず画像VLMを用いてフレームレベルのキャプションを生成し,それらをシーングラフに変換し,これらのグラフを統合し,包括的なビデオレベルの記述を生成する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:59:05 GMT)
Geometry-Aware 3D Salient Object Detection Network [44.1] 位置対応の3次元有向物体検出ネットワークを提案し,クラスターをスーパーポイントに明示的に向ける。
提案手法はPCSODデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:02:34 GMT)
Direct Multi-Turn Preference Optimization for Language Agents [44.0] エージェントタスクに対するLLM(Large Language Models)の適用は、言語エージェントの開発において重要である。
直接選好最適化(DPO)は、複合誤差の緩和によるこの適応のための有望な手法である。
DPOをマルチターンタスクに適用することは、パーティション関数をキャンセルできないため、課題を提起する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:00:36 GMT)
Adaptive Feature-based Low-Rank Compression of Large Language Models via Bayesian Optimization [42.5] 低ランク圧縮は、大規模言語モデルにおける非必須パラメータを減らすための有望な手法である。
大型モデルの低ランク特性に関する実証的研究を行う。
大規模言語モデルに適した低ランク圧縮手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:29:48 GMT)
OmniCount: Multi-label Object Counting with Semantic-Geometric Priors [42.4] 本稿では,オープン語彙フレームワークを用いた複数のオブジェクトカテゴリの同時カウントを実現するための,より実践的なアプローチを提案する。
我々のソリューションであるOmniCountは、事前訓練されたモデルから意味的および幾何学的な洞察(優先順位)を用いて、ユーザが指定した複数のカテゴリのオブジェクトをカウントすることで際立っている。
OmniCount-191の包括的な評価は、他の主要なベンチマークとともに、OmniCountの例外的なパフォーマンスを示し、既存のソリューションを大幅に上回っている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:31:42 GMT)
RouteLLM: Learning to Route LLMs with Preference Data [41.7] 大きな言語モデル(LLM)は、幅広いタスクにわたって印象的な機能を示すが、どのモデルを使うかの選択は、パフォーマンスとコストのトレードオフを伴うことが多い。
推論において,より強いLLMと弱いLLMを動的に選択する効率的なルータモデルを提案する。
我々は、人間の嗜好データとデータ拡張技術を利用して、これらのルータのためのトレーニングフレームワークを開発し、性能を向上する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:50:33 GMT)
Towards LLM Unlearning Resilient to Relearning Attacks: A Sharpness-Aware Minimization Perspective and Beyond [41.3] 再学習攻撃に対して未学習モデルを堅牢化する方法について検討する。
解析の結果,スムーズさの最適化が再学習攻撃の軽減に重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:04:22 GMT)
RoundTripOCR: A Data Generation Technique for Enhancing Post-OCR Error Correction in Low-Resource Devanagari Languages [41.1] 本稿では,Devanagari言語のための合成データ生成手法であるRoundTripOCRを提案する。
我々は,ヒンディー語,マラティー語,ボド語,ネパール語,コンカニ語,サンスクリット語に対するOCR後のテキスト修正データセットをリリースする。
また,機械翻訳の手法を利用した新しいOCR誤り訂正手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:14:08 GMT)
Dr. Splat: Directly Referring 3D Gaussian Splatting via Direct Language Embedding Registration [41.0] Dr. Splatは3Dガウススプラッティングを利用したオープンな3Dシーン理解のための新しいアプローチである。
本手法は,言語対応のCLIP埋め込みと3Dガウスアンを関連付けることで,総合的な3Dシーン理解を実現する。
実験により、我々のアプローチは既存の3次元知覚ベンチマークよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:01:14 GMT)
Interpretable Retinal Disease Prediction Using Biology-Informed Heterogeneous Graph Representations [40.8] 解釈可能性は、医療診断のための機械学習モデルの信頼性を高めるために不可欠である。
本研究では,確立した機械学習モデルの性能を超える手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:27:47 GMT)
Aligning Language Models Using Follow-up Likelihood as Reward Signal [40.4] そこで本稿では,好ましくない応答を区別するための報奨として,フォローアップ発話の可能性を提案する。
提案した報奨機構であるFollow-up Likelihood as Reward (FLR) は,大規模人やGPT-4アノテートデータに基づいてトレーニングされた強力な報奨モデルの性能と一致する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 09:20:49 GMT)
Intrinsic Model Weaknesses: How Priming Attacks Unveil Vulnerabilities in Large Language Models [40.2] 大規模言語モデル(LLM)は、様々な産業に大きな影響を与えているが、重大な欠陥、有害なコンテンツを生成する可能性に悩まされている。
我々は、不適切なコンテンツを生成する際の脆弱性を明らかにするために、LLMの新たな攻撃戦略を開発し、テストした。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:09:23 GMT)
CODESYNC: Synchronizing Large Language Models with Dynamic Code Evolution at Scale [39.5] 本稿では,古いコードパターンを識別するデータエンジンであるCODESYNCを紹介する。
CODESYNCをベースとしたCODESYNCBENCHは,CODESYNCBENCH(CODESYNCBENCH)という,大規模言語モデルのコード進化と同期する能力を評価するベンチマークである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:46:18 GMT)
Reverse Modeling in Large Language Models [39.2] 人間は前もって読み書きに慣れている。
本稿では,自己回帰型大規模言語モデル (LLM) が逆モデリングに苦しむかを検討する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:25:25 GMT)
AUKT: Adaptive Uncertainty-Guided Knowledge Transfer with Conformal Prediction [38.2] 本研究では,教師の予測の不確実性に基づいて,教師の指導への依存度を動的に調整する新しい枠組みを提案する。
提案手法は,画像分類,模倣誘導型強化学習,自律運転など多岐にわたる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:39:19 GMT)
TabGen-ICL: Residual-Aware In-Context Example Selection for Tabular Data Generation [38.1] TabGen-ICLは反復的に動作し、現在生成されたサンプルと真のデータ分布の間の残余を表す実サンプルのサブセットを取得する。
5つの実世界のデータセットの実験により、TabGen-ICLはランダム選択戦略を著しく上回っていることが示された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:51:58 GMT)
End-to-End Deep Learning for Structural Brain Imaging: A Unified Framework [37.7] すべての処理ステップをひとつの最適化プロセスに統合する統合エンドツーエンドフレームワークであるUniBrainを紹介する。
タスク固有のアノテーションを必要とする従来のアプローチとは異なり、UniBrainは最小限の監視で動作する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:08:24 GMT)
On Computational Limits of FlowAR Models: Expressivity and Efficiency [37.6] FlowARは、フローベースと自動回帰機構を統合する最先端アーキテクチャである。
FlowARモデルが生成する最大の特徴写像が次元$n倍のn倍のc$を持つ場合、FlowARモデルはしきい値回路のファミリーでシミュレート可能であることを示す。
また、FlowARモデル計算がほぼ2次時間で実現できる条件も同定する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:07:35 GMT)
VidLBEval: Benchmarking and Mitigating Language Bias in Video-Involved LVLMs [37.5] 本稿では,既存のビデオ関連LVLMの言語バイアスから,ほとんど探索されていない問題を明らかにする。
ビデオ関連LVLMの言語バイアスを評価するために,まずビデオ言語バイアス評価ベンチマークを収集する。
また,言語バイアスに対処するため,Multi-branch Contrastive Decoding (MCD)を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:04:23 GMT)
VLDBench: Vision Language Models Disinformation Detection Benchmark [37.4] 本稿では、VLDBenchの視覚言語情報検出ベンチマークについて述べる。
これは、unimodal (textonly) と multimodal (text and image) コンテンツの両方にわたる偽情報を検出するための、最初の包括的なベンチマークである。
VLDBenchは厳格な半自動データキュレーションパイプラインを備えており、22のドメイン専門家がアノテーションに300時間以上の時間を割いている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:58:01 GMT)
MuSC: Improving Complex Instruction Following with Multi-granularity Self-Contrastive Training [36.5] より強力なモデルに頼ることなく、複雑な命令アライメントを改善するために、MuSC(Multi-granularity Self-Contrastive Training)フレームワークを提案する。
提案手法は,オープンソースモデルを用いて評価し,提案手法が複雑かつ一般的な命令追従ベンチマークにおいて有意な改善をもたらすことを示す実験結果を得た。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:56:44 GMT)
Reinforcement Learning for Causal Discovery without Acyclicity Constraints [35.8] 我々は、強化学習機械を利用した因果発見の新しいアプローチであるALIASを紹介する。
本手法は,DAGを最適2次複雑度で1ステップで生成する効率的なポリシを特徴とする。
因果発見における最先端技術と比較して, ALIAS の強い性能を示す説得力のある実証的証拠を提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 23:16:56 GMT)
Communication-Efficient Federated Optimization over Semi-Decentralized Networks [35.7] 通信効率は、大規模ネットワークにおいて最も困難なボトルネックの1つである。
本稿では,エージェント間通信とエージェント間通信の両方を行う半分散通信プロトコルの通信効率について検討する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:26:59 GMT)
Audio-FLAN: A Preliminary Release [35.0] 本稿では,音声,音楽,音の領域にまたがる80種類のタスクをカバーする大規模インストラクションチューニングデータセットであるAudio-FLANを紹介する。
Audio-FLANは、理解と生成の両方をシームレスに扱える統一オーディオ言語モデルの基礎を築いている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:24:15 GMT)
Target Speaker Extraction through Comparing Noisy Positive and Negative Audio Enrollments [34.7] 雑音の多い音声の例から対象話者の特徴を抽出することを検討した。
本研究では,複数の話者が存在する場合のターゲット話者抽出に着目した。
実験により,提案課題に対するモデルアーキテクチャの有効性と事前学習法の有効性が示された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:33:44 GMT)
Subsampling Graphs with GNN Performance Guarantees [34.3] グラフデータセットに対する新しいサブサンプリング手法を提案する。
サブサンプルデータ上でのGNNのトレーニングは、完全なデータセットでのトレーニングと比較して、損失のバウンド増加をもたらすことを証明している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:21:16 GMT)
SliceLocator: Locating Vulnerable Statements with Graph-based Detectors [33.4] SliceLocatorは、すべての潜在的な脆弱性トリガリングステートメントから、最も重み付けされたフローパスを選択することで、最も関連性の高いテントフローを特定する。
SliceLocatorは、最先端の4つのGNNベースの脆弱性検知器で一貫して動作することを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:20:42 GMT)
Manta: Enhancing Mamba for Few-Shot Action Recognition of Long Sub-Sequence [33.4] 数ショットのアクション認識では、ビデオの長いサブシーケンスは、アクション全体をより効果的に表現する。
最近のMambaは、長いシーケンスをモデリングする効率を示すが、MambaをFSARに直接適用することは、局所的な特徴モデリングとアライメントの重要性を見落としている。
これらの課題を解決するために,Matryoshka MAmba と CoNtrasTive LeArning フレームワーク (Manta) を提案する。
Mantaは、SSv2、Kineetics、UCF101、HMDB51などの著名なベンチマークで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:03:13 GMT)
Are the Values of LLMs Structurally Aligned with Humans? A Causal Perspective [33.2] 我々は、潜在因果値グラフが大きな言語モデル(LLM)の値次元の根底にあることを論じ、アライメントトレーニングにもかかわらず、この構造は人間の値システムと大きく異なるままである。
これらの因果値グラフを利用して、ロールベースのプロンプトとスパースオートエンコーダ(SAE)ステアリングという2つの軽量なバリューステアリング手法を導出する。
Gemma-2B-ITとLlama3-8B-ITの実験により,本手法の有効性と可制御性を示した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:33:30 GMT)
Beyond Release: Access Considerations for Generative AI Systems [33.1] ジェネレーティブAIリリースの決定は、システムコンポーネントが利用可能かどうかを決定するが、リリースはユーザーやステークホルダーがシステムにどのように関与できるかを変える他の要素の多くに対処しない。
システムコンポーネントへのアクセスは潜在的なリスクとメリットを通知します。
このフレームワークは、システムリリースの決定、調査、ポリシーを伝えるために、システムリリースの状況とリスクベネフィットのトレードオフをよりよく包含します。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:06:12 GMT)
Automatic Detection of Research Values from Scientific Abstracts Across Computer Science Subfields [32.8] 本稿では,CS関連研究をガイドするテクスブテン研究価値を特徴とする詳細なアノテーション手法を提案する。
我々は,32のCS関連サブフィールドと86の人気のある出版会場から10年間に226,600件の論文要約を行った。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:44:27 GMT)
Towards Precise Prediction Uncertainty in GNNs: Refining GNNs with Topology-grouping Strategy [32.3] 我々は**Simi-Mailbox*を導入する。これは、ノードを近隣の類似性とそれ自身の信頼性の両方で分類する新しいアプローチである。
本手法は,非校正GNN予測と比較して最大13.79%の誤差削減を実現する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:40:26 GMT)
Data-Efficient 3D Visual Grounding via Order-Aware Referring [32.0] Vigorは、Order-aware Referringを通じて、新しいData-Efficient 3D Visual Groundingフレームワークである。
本稿では,視覚的接地フレームワークを事前訓練するための参照命令を付加する,注文対応ウォームアップトレーニング戦略を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:04:38 GMT)
Simultaneous Swap Regret Minimization via KL-Calibration [32.0] 我々は,(擬似)KL-キャリブレーション(擬似)と呼ばれる新たな校正の概念を導入する。
我々の研究の技術的貢献は、新しいランダム化されたラウンドリング手順と、ログ損失のスワップ後悔を最小限に抑える不均一な離散化スキームである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:23:18 GMT)
Visual-RAG: Benchmarking Text-to-Image Retrieval Augmented Generation for Visual Knowledge Intensive Queries [30.7] Retrieval-Augmented Generation (RAG) はLarge Language Models (LLM) を拡張するための一般的なアプローチである
Visual-RAGは、証拠として視覚知識を抽出するために、テキスト・ツー・イメージ検索と関連する手がかり画像の統合が必要である。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:23:50 GMT)
Unified Prompt Attack Against Text-to-Image Generation Models [30.2] 攻撃の観点からT2Iモデルのロバスト性を評価するためのフレームワークであるUPAMを提案する。
UPAMはテキストと視覚の両方に対する攻撃を統合する。
また、効率と効率性を改善するために列挙への依存を克服し、勾配ベースの最適化を可能にする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:36:18 GMT)
Using Structural Similarity and Kolmogorov-Arnold Networks for Anatomical Embedding of Cortical Folding Patterns [30.0] 3HG(3-hinge gyrus)は、新たに定義された折りたたみパターンである。
本稿では3HGの解剖学的特徴を組み込んだ自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:30:14 GMT)
Continual Test-Time Adaptation for Single Image Defocus Deblurring via Causal Siamese Networks [29.7] SIDD (Single Image Defocus Deblurring) は、フォーカス内イメージを非焦点画像から復元することを目的としている。
非焦点画像における分布シフトは、一般に既存の手法の性能低下につながる。
本稿では,新しいシームズネットワークを用いた連続テスト時間適応フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:45:32 GMT)
Order-Optimal Projection-Free Algorithm for Adversarially Constrained Online Convex Optimization [29.7] 制約付きオンライン凸最適化(COCO)のための投影型アルゴリズムは、高次元設定においてスケーラビリティの課題に直面している。
本稿では,プロジェクションの必要性を排除しつつ,最先端の性能保証を実現するCOCOのプロジェクションフリーアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 23:18:40 GMT)
Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation [29.7] 自己校正型報酬(TPO)を用いた新しいToken Preference Optimizationモデルを提案する。
具体的には,生画像に条件付された生成トークンのロジスティック分布と劣化したトークンの対数分布の差として,トークンレベルのアンカレート・アンカレート・アンフレワードを導入する。
より正確なトークンレベルの最適化を実現するために,視覚認識型学習目標を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:18:26 GMT)
Generative AI Enables EEG Super-Resolution via Spatio-Temporal Adaptive Diffusion Learning [29.5] HDデバイスは頭皮により多くの電極を配置することで脳波の空間分解能を向上させる。
この技術は、高い取得コストや限られた利用シナリオといった課題を強化する。
本稿では,空間再構成を実現するために適応拡散モデル(STAD)を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:34:32 GMT)
Unified Semantic and ID Representation Learning for Deep Recommenders [28.7] 統一意味・ID表現学習フレームワークを提案する。
我々のフレームワークでは、IDトークンはユニークなアイテム属性をキャプチャし、セマンティックトークンは共有可能な、転送可能な特性を表す。
本フレームワークは,先行層におけるコサイン類似性と最終層におけるユークリッド距離を統合し,表現学習を最適化する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:17:28 GMT)
Time Series Domain Adaptation via Latent Invariant Causal Mechanism [28.3] 時系列領域適応は、ラベル付けされたソースドメインからラベル付けされていないターゲットドメインに複雑な時間依存性を転送することを目的としている。
近年の進歩は、観測変数に対する安定した因果機構を利用して、ドメイン不変時間依存をモデル化している。
しかし、ビデオのような高次元データにおける正確な因果構造をモデル化することは依然として困難である。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:25:58 GMT)
MimeQA: Towards Socially-Intelligent Nonverbal Foundation Models [27.9] 非言語的、社会的相互作用に富んだデータをタップします -- マイムビデオ。
最新のビデオ大言語モデル (vLLMs) を評価し, 全体的な精度は15~30%であった。
我々の分析によると、vLLMは、しばしば想像されたオブジェクトをグラウンディングしたり、テキストプロンプトを過度にリライズしたりしながら、微妙な非言語的相互作用を無視したりする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:05:49 GMT)
On Calibration of LLM-based Guard Models for Reliable Content Moderation [27.6] 大規模言語モデル(LLM)は、有害なコンテンツを生成する可能性や、ガードレールを避けようとするユーザによって、重大なリスクを負う。
既存の研究では、脅威LSMの入力と出力を適度にするためのLLMベースのガードモデルが開発されている。
しかし、これらのガードモデルの信頼性と校正には限定的な注意が払われている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:12:38 GMT)
MIM: Multi-modal Content Interest Modeling Paradigm for User Behavior Modeling [27.3] マルチモーダルコンテンツ興味モデリングパラダイム(MIM)を提案する。
MIMは3つの主要なステージで構成されている。
CTRでは+14.14%、RPMでは+4.12%の大幅な増加を達成した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:40:03 GMT)
LH-Mix: Local Hierarchy Correlation Guided Mixup over Hierarchical Prompt Tuning [27.0] 階層的テキスト分類(HTC)は、各テキストに1つ以上のラベルを割り当てることを目的としている。
これを解決するためには、テキスト固有のローカル階層を組み込むことが不可欠である。
まず、親子関係を捉えるために、まずローカル階層を手動の深さレベルのプロンプトに統合する。
次に、この階層的なプロンプトチューニングスキームにMixupを適用し、兄弟関係およびピア関係における潜時相関を改善する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:53:21 GMT)
GraphCheck: Breaking Long-Term Text Barriers with Extracted Knowledge Graph-Powered Fact-Checking [26.6] 抽出した知識グラフを用いてテキスト表現を強化するファクトチェックフレームワークであるtextbftextitGraphCheckを提案する。
GraphCheckは、既存のメソッドで見過ごされることが多いマルチホップ推論チェーンをキャプチャし、正確で効率的なファクトチェックを可能にする。
特に、GraphCheckは既存のファクトチェッカーよりも優れており、最先端のLCMと同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 09:25:00 GMT)
Causal Learner: A Toolbox for Causal Structure and Markov Blanket Learning [25.9] Causal Learnerは、データから因果構造とマルコフ毛布(MB)を学ぶためのツールボックスである。
シミュレーションされたネットワークデータを生成する機能、最先端のグローバル因果構造学習アルゴリズムのセット、最先端のローカル因果構造学習アルゴリズムのセット、アルゴリズムを評価する機能を統合する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:34:08 GMT)
UniDyG: A Unified and Effective Representation Learning Approach for Large Dynamic Graphs [25.7] 動的グラフに対する統一表現学習手法を提案する。
我々は、UniDyGが9つの動的グラフにまたがる16のベースラインに対して平均14.4%の改善を達成していることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:11:21 GMT)
A Survey on Industrial Anomalies Synthesis [24.6] 本稿では,異常合成手法を包括的にレビューする。
既存の調査では、限られた技術に焦点が当てられ、全体的な視野の欠如とメソッド相互接続の理解に焦点が当てられている。
対照的に、本研究では、手作り、分布ハイブリッドに基づく、生成モデル(GM)ベースの、視覚言語モデル(VLM)ベースの合成において、約40の代表的な手法を網羅した統一的なレビューを行っている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:48:24 GMT)
NatSGLD: A Dataset with Speech, Gesture, Logic, and Demonstration for Robot Learning in Natural Human-Robot Interaction [24.6] このデータセットは、HRIと機械学習の交差点における研究の基盤となるリソースとして機能する。
マルチモーダルなインプットと詳細なアノテーションを提供することで、NatSGLDは、マルチモーダルなインストラクションのフォロー、計画認識、実証から人間に推奨できる強化学習といった分野の探索を可能にする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:27:06 GMT)
PhotoDoodle: Learning Artistic Image Editing from Few-Shot Pairwise Data [24.1] 挿入された要素が背景とシームレスに統合されなければならないため、写真のドーピングは難しい。
提案手法であるPhotoDoodleでは,2段階のトレーニング戦略を採用している。
生成した結果の整合性を高めるために,位置符号化再利用機構を導入する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:30:46 GMT)
OrthoGAN:High-Precision Image Generation for Teeth Orthodontic Visualization [23.7] 正面顔画像における仮想歯列アライメント効果をシミュレーションする効率的なシステムを構築した。
複数モードのエンコーダ・デコーダをベースとした生成モデルを設計し, 歯の整列による顔画像の合成を行う。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:44:08 GMT)
Category-Selective Neurons in Deep Networks: Comparing Purely Visual and Visual-Language Models [23.3] ヒト脳のカテゴリー選択領域は、ハイレベルな視覚処理において重要な役割を担っている。
人工ニューラルネットワーク(ANN)が類似のカテゴリー選択性ニューロンを示すかどうかを検討する。
本研究は、ANNが生物学的ビジョンをどのように反映し、マルチモーダル学習がカテゴリー選択表現にどのように影響するかについての知見を提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:15:51 GMT)
Volume Optimality in Conformal Prediction with Structured Prediction Sets [22.9] コンフォーマル予測(Conformal Prediction)は、将来の観測の予測セットを構築するための、広く研究されている手法である。
まず、任意の分布自由法が自明な解しか見つからないような体積最適性の不可能性を証明する。
次に、ある集合に属する予測集合を制限することにより、体積最適性という新しい概念を導入する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:31:33 GMT)
Can Large Vision-Language Models Detect Images Copyright Infringement from GenAI? [22.9] 我々は,様々な画像サンプルを用いて,最先端のLVLMの著作権検出能力を評価することに注力する。
我々は、よく知られたIPフィギュアの著作権保護に反する正のサンプルと、これらのフィギュアに類似しているが著作権上の懸念を生じさせない負のサンプルからなるベンチマークデータセットを構築した。
実験の結果,LVLMは過度に適合する傾向があり,IP侵害事例として陰性標本の誤分類が生じることが明らかとなった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:41:12 GMT)
BG-GAN: Generative AI Enable Representing Brain Structure-Function Connections for Alzheimer's Disease [22.7] 脳構造-機能結合を表すために,双方向グラフ生成対向ネットワーク (BG-GAN) を提案する。
Balancerと呼ばれる新しいモジュールは、ジェネレータとディスクリミネータ間の最適化を無効にするように設計されている。
実験結果から、生成構造と機能接続の両方がアルツハイマー病(AD)の同定を改善することが示唆された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:17:12 GMT)
SciLitLLM: How to Adapt LLMs for Scientific Literature Understanding [22.1] 大言語モデルの成功にもかかわらず、科学文献理解の課題に直面している。
連続事前学習(CPT)と教師付き微調整(SFT)を統合したハイブリッド戦略を提案する。
我々は科学文献理解に特化したLLMスイートSciLitLLMを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:06:54 GMT)
Agentic Information Retrieval [21.7] 本稿では,大規模言語モデル(LLM)とAIエージェントによって駆動されるIRの変換的次世代パラダイムであるエージェント情報検索(Agentic IR)を紹介する。
エージェントIRにおける中心的なシフトは、静的で事前定義された情報項目から動的で文脈に依存した情報状態への「情報の定義」の進化である。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:23:46 GMT)
Replacing Paths with Connection-Biased Attention for Knowledge Graph Completion [21.7] 知識グラフ(KG)の完成は、KGの既存の事実から推測できる追加の事実を特定することを目的としている。
この研究は、経路エンコーディングを明示的に使用することなく、帰納的設定でのKG補完に焦点を当てている。
接続バイアスによる注意とサブグラフエンコーディングモジュールへのエンティティロールの埋め込みを導入し、高価で時間を要するパスエンコーディングモジュールの必要性を解消する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:52:22 GMT)
Cross-domain Few-shot Object Detection with Multi-modal Textual Enrichment [21.4] クロスドメイン多モードFew-Shotオブジェクト検出(CDMM-FSOD)
メタラーニングベースのフレームワークを導入し、リッチテキストセマンティクスを補助モダリティとして活用し、効果的なドメイン適応を実現する。
提案手法を共通のクロスドメインオブジェクト検出ベンチマークで評価し,既存の複数ショットオブジェクト検出手法を大きく上回っていることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:59:22 GMT)
BlockEmulator: An Emulator Enabling to Test Blockchain Sharding Protocols [20.7] BlockEmulatorはブロックチェーンシャーディングメカニズムをエミュレートするための実験的なプラットフォームである。
軽量なブロックチェーンアーキテクチャを採用しており、開発者は新しいプロトコルやメカニズムの実装のみに集中できる。
GithubでBlockEmulatorをオープンソース化しました。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 09:07:47 GMT)
RewardDS: Privacy-Preserving Fine-Tuning for Large Language Models via Reward Driven Data Synthesis [20.6] 医療や金融といった繊細な分野では、プライバシーの懸念がしばしば生じます。
有望な解決策の1つは、プライベートデータを置き換えることを保証する差分プライバシー(DP)で合成データをサンプリングすることである。
本稿では、報酬プロキシモデルを微調整し、報酬信号を用いて合成データ生成を誘導する新しいプライバシ保護フレームワークであるRewardDSを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:52:23 GMT)
CHAMP: Conformalized 3D Human Multi-Hypothesis Pose Estimators [20.5] CHAMPは2次元キーポイントからシーケンス・ツー・シーケンス・マルチ・ハイプセシスの人間のポーズを学習する新しい方法である。
この結果から, 共形予測フィルタによる仮説に対する単純な平均アグリゲーションを用いることで, 競合する結果が得られることが示唆された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:07:48 GMT)
Keeping up with dynamic attackers: Certifying robustness to adaptive online data poisoning [20.4] 人間のフィードバックを微調整した基礎モデルの台頭は、敵対的なデータ中毒のリスクを高めている。
本稿では, 動的中毒の影響について, 認定境界を計算するための新しい枠組みを提案する。
これらの証明書を使って、堅牢な学習アルゴリズムを設計します。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:40:56 GMT)
StyleShot: A Snapshot on Any Style [20.4] テスト時間チューニングを伴わない汎用的なスタイル転送には,優れたスタイル表現が不可欠であることを示す。
スタイル認識型エンコーダと、StyleGalleryと呼ばれるよく編成されたスタイルデータセットを構築することで、これを実現する。
当社のアプローチであるStyleShotは,テストタイムチューニングを必要とせずに,さまざまなスタイルを模倣する上で,シンプルかつ効果的なものです。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:45:34 GMT)
Interpret and Control Dense Retrieval with Sparse Latent Features [18.8] 本稿では,スパース・オートエンコーダ (SAE) を用いた新しい手法を提案する。
実験結果から, 学習した潜在スパース特徴と再構成された埋め込みはともに, 元の高密度ベクトルとほぼ同じ精度を保っていることが明らかとなった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:56:57 GMT)
Universality in Transfer Learning for Linear Models [18.4] 本稿では,回帰モデルと二分分類モデルの両方において,伝達学習と微調整の問題について検討する。
特に,事前訓練した重み付き線形モデル上での勾配降下(SGD)の利用と,目標分布から設定した小さなトレーニングデータセットについて検討する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:45:59 GMT)
FanChuan: A Multilingual and Graph-Structured Benchmark For Parody Detection and Analysis [17.1] パロディの研究は、利用可能な限られたデータと現在のデータセットの多様性の欠如によって妨げられている。
私たちは、英語と中国語のコーパスから7つのパロディデータセットを構築し、14,755人のアノテートユーザと21,210人のアノテートコメントを作成した。
これらのデータセットを用いて,(1)パロディ検出,(2)パロディを用いたコメント感情分析,(3)パロディを用いたユーザ感情分析の3つの重要な課題について,従来の手法と大規模言語モデル(LLM)を検証した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:52:46 GMT)
SafeRAG: Benchmarking Security in Retrieval-Augmented Generation of Large Language Model [17.0] 我々は、RAGセキュリティを評価するために、SafeRAGというベンチマークを導入する。
まず、アタックタスクを銀のノイズ、コンテキスト間競合、ソフト広告、ホワイト・デニアル・オブ・サービスに分類する。
次に、SafeRAGデータセットを使用して、RAGが遭遇する可能性のあるさまざまな攻撃シナリオをシミュレートします。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:46:28 GMT)
PMAT: Optimizing Action Generation Order in Multi-Agent Reinforcement Learning [16.5] AGPS(Action Generation with Plackett-Luce Sampling)はエージェント決定順序最適化のための新しいメカニズムである。
本稿では,決定順序を最適化した逐次意思決定型MARLアルゴリズムである優先多重エージェント変換器(PMAT)を提案する。
StarCraft II Multi-Agent Challenge、Google Research Football、Multi-Agent MuJoCoといったベンチマークの実験では、PMATが最先端のアルゴリズムより優れていることが示されている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:30:14 GMT)
Co-MTP: A Cooperative Trajectory Prediction Framework with Multi-Temporal Fusion for Autonomous Driving [16.5] Co-MTPは、自律運転のための多時間融合を伴う一般的な協調軌道予測フレームワークである。
将来の領域では、V2Xは周囲の物体の予測結果を提供することができる。
実世界のデータセットV2X-Seq上でのCo-MTPフレームワークの評価を行った。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:38:13 GMT)
P-TA: Using Proximal Policy Optimization to Enhance Tabular Data Augmentation via Large Language Models [16.0] 我々は、GAN(Generative Adversarial Networks)を適用するために、PPO(Maximal Policy Optimization)を提案する。
PPOは、最先端のデータセットに対して合成生成されたデータに基づいてトレーニングされたモデルの精度を約4%向上させる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:27:04 GMT)
Next-Generation Database Interfaces: A Survey of LLM-based Text-to-SQL [15.8] 大規模言語モデル(LLM)は、モデルスケールが増大するにつれて、自然言語理解において重要な能力を示している。
LLMは、テキスト・ツー・リサーチにユニークな機会、改善、ソリューションをもたらすことができる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:22:20 GMT)
SQLong: Enhanced NL2SQL for Longer Contexts with LLMs [15.3] オープンウェイトな大規模言語モデル (LLM) は自然言語 tosql (NL2 タスク) において大幅に性能が向上した。
提案するSQLongは,NL2タスクの長文シナリオにおけるLLM性能を向上させるために設計された,新規で効率的なデータ拡張フレームワークである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 23:23:51 GMT)
SWaT: Statistical Modeling of Video Watch Time through User Behavior Analysis [15.2] 本稿では,ビデオの視聴時の様々なユーザの行動仮定を統計的視聴時間モデルに変換するホワイトボックス統計フレームワークを提案する。
当社のモデルは、2つのパブリックデータセット、大規模なオフライン産業データセット、および数億人のデイリーアクティブユーザを持つ短いビデオプラットフォーム上でオンラインA/Bテストで広範囲にテストしています。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:29:35 GMT)
Logits are All We Need to Adapt Closed Models [15.2] 多くの商用の大規模言語モデル(LLM)は、しばしばクローズドソースであり、開発者は特定のアプリケーションとコンテンツ生成の調整を迅速に行うことができる。
このようなアクセスが利用可能であれば、迅速なエンジニアリングを超えて、より強力な適応技術を可能にするだろう、と私たちは主張する。
ブラックボックスのLCMをアプリケーション固有のコンテンツ生成に向け,トークンレベルの確率再重み付けフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:20:51 GMT)
VPNeXt -- Rethinking Dense Decoding for Plain Vision Transformer [15.1] 我々は、Plain Vision Transformer(ViT)の新しいシンプルモデルであるVPNeXtを紹介する。
同じ均一なパラダイムを共有する多くの関連研究とは異なり、VPNeXt は ViT に基づく密度表現の新しい視点を提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:15:03 GMT)
Entropy-Lens: The Information Signature of Transformer Computations [14.6] 本稿では,解凍型大規模変圧器のモデル非依存化フレームワークであるEntropy-Lensを紹介する。
この結果から, エントロピーに基づくメトリクスは, 現代のトランスフォーマーアーキテクチャの内部構造を明らかにするための基本的ツールとなる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:33:27 GMT)
Few-shot Continual Relation Extraction via Open Information Extraction [14.4] 本稿では,知識グラフ構築のオープン情報抽出の概念を活用する新しい手法を提案する。
提案手法は,すべての可能な関係の組にモデルを公開するだけでなく,モデル知識を多種多様な関係記述で強化する。
KGCの観点から見ると、これは連続学習の設定で探求された最初の研究であり、データが進化するにつれてグラフの効率的な拡張を可能にする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:52:59 GMT)
Certified Causal Defense with Generalizable Robustness [14.2] 本稿では,認証防衛における一般化問題に因果的視点を取り入れた新しい認証防衛フレームワークGLEANを提案する。
本フレームワークは,因果関係と入力とラベル間の素因果関係を乱すために,認証因果関係学習コンポーネントを統合する。
そこで我々は,潜在因果的要因に対する敵対的攻撃に対処するために,因果的に認証された防衛戦略を設計する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:03:26 GMT)
Reasoning About Persuasion: Can LLMs Enable Explainable Propaganda Detection? [14.2] 本稿では,多言語(アラビア語と英語)による説明強調データセットを提案する。
また,ラベル検出と合理化に基づく説明生成のための説明強調LLMも導入した。
本研究は,モデルが相補的に動作し,説明文も生成できることを示唆する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:12:17 GMT)
Automatic Input Rewriting Improves Translation with Large Language Models [14.1] 機械翻訳(MT)ユーザーは、既製のMTシステムを使用すると、よく書かれたテキストが翻訳しやすいという直感に頼っている。
テキストの単純化はMTに依存しない最も効果的な書き直し戦略であることを示す。
人間による評価では、単純化された書き直しとそのMT出力が、ソースとMTの本来の意味を主に保持していることが確認されている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:56:56 GMT)
Feature Space Perturbation: A Panacea to Enhanced Transferability Estimation [13.9] 本稿では,特徴空間を体系的に変更することにより,伝達可能性推定のプロセスを向上させる特徴摂動手法を提案する。
本手法では,クラス間の距離を最小化し,クラス境界を曖昧にするため,クラス内変動を増加させるスプレッド演算と,クラス間の距離を最小化するアトラクション演算を含む。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:07:49 GMT)
Gaussian Process Regression for Improved Underwater Navigation [13.2] ドップラー速度ログ(DVL)は通常、速度測定によってこのドリフトを緩和するために使用される。
本稿では、DVL速度推定を改善するために、多出力ガウス過程回帰(MOGPR)に基づくデータ駆動方式を提案する。
提案手法を実世界のAUVデータを用いて評価し,LSと最先端のディープラーニングモデルであるBeamsNetと比較した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 09:13:41 GMT)
All That Glitters is Not Novel: Plagiarism in AI Generated Research [12.9] 近年、自律的な研究エージェントが新たな研究アイデアを創出できると主張する論文がいくつかある。
このような研究資料のかなりの部分は、巧妙に盗用されている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:00:33 GMT)
Llamba: Scaling Distilled Recurrent Models for Efficient Language Processing [12.8] 我々はLlama-3.xから蒸留した効率の良いリカレント言語モデルのファミリーであるLlambaをMambaアーキテクチャに導入する。
シリーズにはLlamba-1B、Llamba-3B、Llamba-8Bが含まれる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:02:09 GMT)
A Reverse Mamba Attention Network for Pathological Liver Segmentation [12.6] 本稿では、視覚状態空間モデルの能力を向上させる新しいアーキテクチャであるRMA-Mambaを紹介する。
Vision MambaとRMAのターゲット機能の改良を統合することで、アーキテクチャは複数のスケールにわたる優れた機能学習を実現する。
RMA-Mambaの病的肝セグメンテーション領域における効果を実証した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:41:25 GMT)
Uncovering the Hidden Threat of Text Watermarking from Users with Cross-Lingual Knowledge [12.5] 本研究は,言語間知識を持つユーザによるテキスト透かしに対する隠れた脅威に焦点を当てた。
言語学的に豊かな4言語にまたがる4つの透かし手法を評価し,透かしのレジリエンスとテキストの品質を検討した。
我々の焦点は、言語横断的な専門知識を持つ敵を特徴とする現実的なシナリオであり、このような課題に対する現在の透かし手法の妥当性を評価することである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:49:01 GMT)
Improved Margin Generalization Bounds for Voting Classifiers [12.3] 我々は、投票者分類のための新しいマージンベースの一般化を確立する。
新たなマージンベース一般化境界は、最適弱強学習者の導出を可能にする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:44:00 GMT)
SARChat-Bench-2M: A Multi-Task Vision-Language Benchmark for SAR Image Interpretation [12.3] 視覚言語モデル(VLM)は自然言語処理や画像理解において顕著な進歩を遂げている。
本稿では,SARChat-2MというSAR画像のための大規模多モード対話データセットを革新的に提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:28:31 GMT)
Quantum lattice Boltzmann method for simulating nonlinear fluid dynamics [12.3] 量子コンピュータ上での非線形流体力学をシミュレーションするための格子ガスの新たなアンサンブル記述を導入する。
中次元の線形演算に依存する量子格子ボルツマン法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:25:35 GMT)
SmartSpatial: Enhancing the 3D Spatial Arrangement Capabilities of Stable Diffusion Models and Introducing a Novel 3D Spatial Evaluation Framework [12.1] 安定拡散の空間配置機能を促進する革新的なアプローチであるSmartSpatialを導入する。
SmartSpatialは、深度情報注入とクロスアテンション制御を組み込んで、正確なオブジェクト配置を保証する。
We present SmartSpatialEval, a comprehensive evaluation framework that compute space accuracy with qualitative art evaluations。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:22:58 GMT)
FreeTumor: Large-Scale Generative Tumor Synthesis in Computed Tomography Images for Improving Tumor Recognition [12.0] FreeTumorは、データ不足を軽減するために大規模な腫瘍合成を可能にする革新的な生成AI(GAI)フレームワークである。
我々は161,310巻のCT(Computerd Tomography)をキュレートすることで,腫瘍の合成と認識のための最大のトレーニングデータセットを作成する。
合成腫瘍の忠実度を検証するため,13名の検診医をビジュアルチューリングテスト(Visual Turing Test)で診察し,合成腫瘍と実腫瘍の鑑別を行った。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:00:09 GMT)
Improving Neuron-level Interpretability with White-box Language Models [11.9] 我々は、CRATE(Coding RAte TransformEr)という、ホワイトボックストランスフォーマーのようなアーキテクチャを導入する。
包括的実験では、ニューロンレベルの解釈可能性において、顕著な改善(最大103%の相対的な改善)が見られた。
CRATEの解釈可能性の向上は、関連するトークンを一貫して一意に活性化する能力の強化によるものである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:36:25 GMT)
Learning-Based Design of LQG Controllers in Quantum Coherent Feedback [11.5] 本稿では,LQG制御系の設計に適した微分進化アルゴリズムを提案する。
このアルゴリズムには、緩和可能なルール、スケジュールされたペナルティ関数、適応的な検索範囲調整、ベット・アンド・ランの戦略を含む特殊なモジュールが組み込まれている。
提案手法は、物理的に実現可能な制約を受ける性能最適化タスクにおいて、他の線形量子システムに適用する大きな可能性を秘めている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:47:30 GMT)
Sequence-level Large Language Model Training with Contrastive Preference Optimization [11.1] 次のトークン予測損失は,大規模言語モデルにおける自己教師型トレーニングの主目的である。
本稿では,言語モデルにシーケンスレベルの情報を注入可能なコントラスト優先最適化(CPO)手法を提案する。
実験の結果,提案手法は命令追従タスクとテキスト生成タスクの勝利率の観点から,次のトークン予測を超越していることがわかった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:13:27 GMT)
A New Causal Rule Learning Approach to Interpretable Estimation of Heterogeneous Treatment Effect [11.1] 解釈可能性(英語版)は、不均一な治療効果を推定するための統計的学習の適用において重要な役割を果たす。
本研究では, 心房中隔欠損に対するHTEの理解を深めるために, ルールベースのワークフローを活用する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:02:53 GMT)
Multimodal Large Language Models for Text-rich Image Understanding: A Comprehensive Review [11.1] MLLM(Multi-modal Large Language Models)はテキストリッチ画像理解(TIU)分野に新たな次元を導入している。
ほぼすべてのTIU MLLMのタイムライン、アーキテクチャ、パイプラインについて概説する。
次に、主要なベンチマークで選択したモデルの性能についてレビューする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:24:51 GMT)
Don't Do RAG: When Cache-Augmented Generation is All You Need for Knowledge Tasks [11.1] 検索拡張世代(RAG)は,外部知識ソースを統合することで言語モデルを強化する強力なアプローチとして注目されている。
本稿では、リアルタイム検索をバイパスする代替パラダイムであるキャッシュ拡張生成(CAG)を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:48:12 GMT)
FPGA: Flexible Portrait Generation Approach [11.0] 我々は,100万レベルのマルチモーダルデータセットIDZoomをトレーニング用に構築するFPGAと呼ばれる包括的システムを提案する。
FPGA は Multi-Mode Fusion Training Strategy (MMF) と DDIM Inversion based ID Restoration Inference framework (DIIR) から構成される。
DIIRはプラグアンドプレイであり、どんな拡散ベースのポートレート生成にも適用でき、性能が向上する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:25:46 GMT)
White Hat Search Engine Optimization using Large Language Models [10.8] 本稿では,genAIに基づく新しいホワイトハット検索エンジン最適化手法を提案し,その経験的メリットを実証する。
この記事はSymbolic Interaction誌に初めて掲載された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 09:44:00 GMT)
Reinforcement Learning with Knowledge Representation and Reasoning: A Brief Survey [10.6] 強化学習(Reinforcement Learning, RL)は近年, 目覚ましい発展を遂げているが, 複雑な実生活問題に対処する上で, 依然として大きな障害に直面している。
近年,RLにおけるより抽象的な表現と効率的な学習を可能にするKRR(Knowledge Representation and Reasoning)手法への関心が高まっている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:55:10 GMT)
A Comparative Review of the Histogram-based Image Segmentation Methods [10.6] 多くの古典的ヒストグラムに基づく画像分割法が提案され、学術と産業の両方で重要な役割を果たしてきた。
古典的ヒストグラムに基づく画像分割法の原理をまず記述し,その性能を客観的に比較する。
ヒストグラムに基づく画像分割法は,多くの種類の画像のセグメンテーションを専門訓練することなく,汎用的な深層学習法よりも精度が高い。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:12:22 GMT)
High-resolution Rainy Image Synthesis: Learning from Rendering [10.4] 本稿では,高分解能降雨画像合成のための2段階学習パイプラインを提案する。
レンダリング段階では、高解像度のRainy Imageデータセットを作成するためにレンダリングベースの手法を用いる。
学習段階において,高分解能降雨画像生成ネットワーク(HRIGNet)を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:28:50 GMT)
FastRM: An efficient and automatic explainability framework for multimodal generative models [10.2] FastRMは、LVLMの説明可能な関連性マップを効率的に予測する手法である。
FastRMは計算時間を99.8%削減し、メモリフットプリントを44.4%削減した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:35:56 GMT)
BalanceBenchmark: A Survey for Multimodal Imbalance Learning [9.9] マルチモーダル学習は、異なるモーダルからの情報を統合する能力に注目されている。
これは、あるモダリティが支配的であり、他のモダリティが未利用のままであるマルチモーダル不均衡問題によってしばしば妨げられる。
我々は,主要な多モード不均衡アルゴリズムを,不均衡を緩和するための戦略に基づいて4つのグループに体系的に分類する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:19:36 GMT)
Teaching Loop Testing to Young Learners with the Code Critters Mutation Testing Game [9.9] Code Critterのゲームクリッターは、ゲームマップをトラバースしながらブロックベースのコードの短いスニペットを実行する。
この適応は、テスト対象のコードを基本的なシーケンスとブランチに制限し、ループの基本的なプログラミング概念を除外する。
本稿では,Code Crittersのストーリーラインに統合された全く新しいゲームコンセプトを導入し,ループベースのレシピを第2段階のレベルで使用して,クリッタが治療薬の材料を採取する動作をテストする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:18:39 GMT)
Anatomical grounding pre-training for medical phrase grounding [9.7] メディカルファース・グラウンドディング(MPG)は、医療報告に記載された放射線学的所見を医療画像の特定の領域にマッピングする。
医用画像における解剖学的用語を対応する領域と整合させるドメイン内事前訓練タスクとして解剖学的接地を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:24:50 GMT)
Revealing the Pragmatic Dilemma for Moral Reasoning Acquisition in Language Models [9.7] 大規模言語モデル(LLM)は、道徳的認識を必要とするタスクで満足に機能しないことが多い。
現在の学習パラダイムは、LLMが十分な道徳的推論能力を得ることができるか?
性能改善は意味レベルの課題に類似したメカニズムを踏襲し,言論における潜在道徳の実践的性質の影響を受け続けることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:00:53 GMT)
Advances in Continuous Variable Measurement-Device-Independent Quantum Key Distribution [9.5] 連続可変計測デバイス非依存QKD(CV-MDI-QKD)は、受信機から発生するすべてのセキュリティ脅威を効果的に除去することができる。
CV-MDI-QKDは注目され、急速に進歩した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:27:59 GMT)
Towards Optimal Adversarial Robust Reinforcement Learning with Infinity Measurement Error [9.5] 近年の研究は、国家の敵対的堅牢性を達成する上での課題を浮き彫りにしている。
内向的状態適応型マルコフ決定プロセス(ISA-MDP)について紹介する。
DRLの堅牢性の向上は自然環境における性能を損なうものではないことを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:16:01 GMT)
Beyond Pattern Recognition: Probing Mental Representations of LMs [9.5] 言語モデル(LM)は、複雑な推論タスクを解く際、印象的な能力を示している。
我々は,様々なLMの精神モデルについて深く掘り下げることを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:20:28 GMT)
Geometric Kolmogorov-Arnold Superposition Theorem [9.4] コルモゴロフ・アルノルドネットワーク(KAN)は、コルモゴロフ・アルノルド理論(KAT)を実装するための訓練可能なモデルとして導入された。
我々は,KAT と Kan の新たな拡張法を提案し,$O(n)$グループアクションに等分散と不変性を導入し,物理的システムの正確かつ効率的なモデリングを可能にする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:47:33 GMT)
Tracking the Copyright of Large Vision-Language Models through Parameter Learning Adversarial Images [9.4] 大規模視覚言語モデル (LVLM) は画像理解と対話能力に優れていた。
広く利用できるようになったことで、不正使用や著作権侵害に対する懸念が高まっている。
本稿では,LVLMの著作権をオリジナルモデルを変更することなく追跡する学習攻撃(PLA)手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:49:34 GMT)
Composable Strategy Framework with Integrated Video-Text based Large Language Models for Heart Failure Assessment [9.2] 心不全は世界中で大きな死因の1つである。
複雑さと多因子特性のため、かなりの未成熟なニーズが残っている。
心不全における評価と治療の最適化のための構成可能な戦略フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:06:08 GMT)
Pay Attention to Real World Perturbations! Natural Robustness Evaluation in Machine Reading Comprehension [9.1] 本研究では,自然摂動が事前学習したエンコーダ言語モデルの性能劣化をもたらすことを示す。
さらに心配なのは、最先端のエンコーダ言語モデルがこれらのエラーを継承していることだ。
これらの誤りを軽減するため,自然あるいは合成摂動の例をトレーニングすることで,自然摂動に対する頑健性を改善することが可能であることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:04:21 GMT)
Trunk-branch Contrastive Network with Multi-view Deformable Aggregation for Multi-view Action Recognition [9.0] マルチビューアクション認識は、与えられたマルチビューシーンにおけるアクションを特定することを目的としている。
RGBに基づくマルチビュー動作認識のための新しいトランクブランチコントラストネットワーク(TBCNet)を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:10:20 GMT)
Topology-induced symmetry breaking demonstrated in antiferromagnetic magnons on a Möbius strip [8.9] ハミルトニアンによって保存される局所対称性は、位相的に非自明な境界条件のために励起の固有モードにおいて明確に破られる。
この現象は、2つの反強磁性結合スピン鎖からなるM "obius strip"上でのマグノン励起の研究によって実証される。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:52:42 GMT)
Subpixel Edge Localization Based on Converted Intensity Summation under Stable Edge Region [8.9] 我々は、ピクセルレベルの強度が、サブピクセルローカライゼーションの強度モデルにおける局所積分写像として解釈できると仮定して、革新的な視点を取る。
個々のエッジ点の局所化にのみ焦点をあてた限られたロバスト性に対処するため、安定エッジ領域(SER)に基づくアルゴリズムがエッジ近傍での局所的干渉を軽減するために提案される。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:52:42 GMT)
Navigating the Path of Writing: Outline-guided Text Generation with Large Language Models [8.9] 大規模言語モデル(LLM)は、コンテンツ作成プラットフォームにおける人間とのコラボレーションによる生産性向上という、執筆プロセスに影響を与えている。
目標指向で高品質なテキストを生成する上で,LCMをガイドする上で,アウトラインを明示的に利用するフレームワークであるWritePathを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:24:45 GMT)
DD-rPPGNet: De-interfering and Descriptive Feature Learning for Unsupervised rPPG Estimation [8.9] Photoplethysvolution (rmography)は、顔の映像から生理的信号と心拍数を測定することを目的としている。
近年の非教師なしr推定法は、真理r信号に頼ることなく、顔領域からr信号を推定する有望な可能性を示している。
本稿では,真の r 信号の学習のための r 機能内干渉を取り除くために,新しい Deinterfered and Descriptive r Estimation Network (DD-rNet) を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:47:33 GMT)
Network Tomography with Path-Centric Graph Neural Network [8.8] 我々は、優れたネットワークトモグラフィーは、データと(部分的な)事前知識からの適切な帰納バイアスの両方から知識を相乗化する必要があると論じる。
パス中心グラフニューラルネットワークを用いてパス性能メトリクスを予測する新しいフレームワークであるDeep Network Tomography (DeepNT)を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:08:46 GMT)
Investigating the Security & Privacy Risks from Unsanctioned Technology Use by Educators [8.8] 本研究の目的は、インストラクターがなぜ無許可のアプリケーションを使うのか、インストラクターが関連するリスクをどのように知覚するか、そしてそれが施設のセキュリティやプライバシーの姿勢にどのように影響するかを理解することである。
我々は、K-12および高等教育機関のインストラクターや管理者を対象にしたオンライン調査ベースの調査を設計、実施した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:52:58 GMT)
Efficient 4D Gaussian Stream with Low Rank Adaptation [8.7] 連続学習を用いた動的新規ビュー合成のための高度にスケーラブルな手法を提案する。
本手法は,ビデオフレームのチャンクで連続的に動的に再構成し,オフラインSOTA法に匹敵する高画質を維持しながら,ストリーミング帯域幅を90%削減する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:48:52 GMT)
Toward Responsible Federated Large Language Models: Leveraging a Safety Filter and Constitutional AI [8.6] FedLLMでは、トレーニングに使用されるクライアントデータが有害なコンテンツを含んでいる可能性があるため、有害な応答を生成する安全でないLCMが発生する。
この問題を解決するために、FedLLMには2つの有名なRAIメソッド、セーフティフィルタとコンスティチューションAIが組み込まれています。
実験の結果,これらの手法はLLMの安全性を大幅に向上させ,安全性評価のベンチマークであるAdvBenchの20%以上の改善を実現していることがわかった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:12:10 GMT)
Liver Cirrhosis Stage Estimation from MRI with Deep Learning [8.6] マルチシーケンスMRIを用いた肝硬変自動ステージ推定のためのエンドツーエンドディープラーニングフレームワークを提案する。
本手法は,肝硬変進行段階の微妙な組織変化を捉えるために,多段階的特徴学習とシーケンス特異的注意機構を統合した。
我々の最良のモデルは、T1Wで72.8%、T2Wで63.8%の精度を達成し、従来のラジオミクスベースのアプローチよりも大幅に優れている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:50:08 GMT)
MToP: A MATLAB Optimization Platform for Evolutionary Multitasking [8.5] 進化的マルチタスキング(EMT)は、過去10年間に進化的計算の一般的なトピックとして現れてきた。
本稿では,EMTのためのMTO-Platform (MTOP) という,オープンソースの最初の最適化プラットフォームを紹介する。
MToPには50以上のMTEA、200以上のMTO問題、20以上のパフォーマンスメトリクスが含まれている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:01:34 GMT)
Toward Dependency Dynamics in Multi-Agent Reinforcement Learning for Traffic Signal Control [8.3] 適応的な信号制御のためのデータ駆動型アプローチとして強化学習(RL)が出現する。
本稿では,DQN-DPUS(Deep Q-Network)のための動的強化更新戦略を提案する。
提案手法は最適探索を犠牲にすることなく収束速度を向上できることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:29:12 GMT)
Speed and Conversational Large Language Models: Not All Is About Tokens per Second [8.1] オープンウェイト大言語モデル(LLM)の速度と,そのタスクへの依存性について検討し,最も普及しているオープンLLMの速度の比較分析を行った。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:28:55 GMT)
Can ChatGPT Learn to Count Letters? [8.1] 大きな言語モデル(LLM)は、単語中の文字の出現回数をカウントするといった単純なタスクに苦労する。
本稿では,ChatGPTが文字数をカウントできることを学習し,効率的な解法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:31:22 GMT)
MetaSym: A Symplectic Meta-learning Framework for Physical Intelligence [8.0] 本稿では,新しいディープラーニングアーキテクチャ,MetaSymを紹介する。
特に、MetaSymはシンプレクティックエンコーダと自己回帰デコーダから得られる強いシンプレクティックインダクティブバイアスをメタアテンションと組み合わせている。
本研究は, より大規模なモデルを用いて, 数ショット適応下でのモデリング性能を向上し, 最先端のベースラインよりも優れた性能を示すものである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:52:07 GMT)
Policy Verification in Stochastic Dynamical Systems Using Logarithmic Neural Certificates [8.0] 我々は、リーチエイド仕様に関する離散時間システムに対するニューラルネットワークポリシーの検証について検討する。
このような検証タスクに対する既存のアプローチは、ニューラルネットワークの計算済みリプシッツ定数に依存している。
我々は既存のアプローチよりも小さなリプシッツ定数を得るための2つの重要な貢献を提示する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:11:34 GMT)
MemeIntel: Explainable Detection of Propagandistic and Hateful Memes [7.8] 我々は、アラビア語でプロパガンダのミームと、英語で憎しみのあるミームのための説明強化データセットであるMemeIntelを紹介した。
マルチステージ最適化手法を提案し,VLM(Vision-Language Models)を訓練する。
提案手法は,テキストブラベル検出と説明生成の両方において,ベースモデルよりも性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:35:48 GMT)
A Weight Adaptation Trigger Mechanism in Decomposition-based Evolutionary Multi-Objective Optimisation [7.7] 分解に基づく進化アルゴリズム(MOEA)は多目的問題の解法として広く用いられている。
通常の(複合的な)パレートフロントの問題ではうまく機能するが、不規則なパレートフロントではうまく機能しない。
この問題を解決するためにATM-MOEA/Dというアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:50:14 GMT)
TSPDiffuser: Diffusion Models as Learned Samplers for Traveling Salesperson Path Planning Problems [7.6] 旅行セールスパーソンパス計画問題(TSPPP)のための新しいデータ駆動パスプランナを提案する。
障害物マップ内の目的地の集合を考えると, 衝突のない最短経路を効率的に見つけることが目的である。
TSPDiffuser では,大量の TSPPP インスタンスとその各ソリューション上で拡散モデルを訓練し,未知の問題インスタンスに対する可塑性経路を生成する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 09:12:19 GMT)
Multifractal-enriched mobility edges and emergent quantum phases in Rydberg atomic arrays [7.5] アンダーソン局在は障害によって引き起こされる相転移を記述し、局所化状態と拡張状態を区別する。
Lyapunov exponents (LEs) や逆参加比 (IPRs) のようなこれらの状態を区別するための重要な指標は、まだ実験的に検出されていない。
我々はアビラの大域定理を用いて位相境界を解析的に決定する。
我々は,Rydberg原子配列を用いた実験により,18量子ビット未満の局所化,拡張,多フラクタル状態の区別を可能にすることを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:19:47 GMT)
BAP v2: An Enhanced Task Framework for Instruction Following in Minecraft Dialogues [7.4] Minecraft Collaborative Building Task (MCBT)はこの目標に向けて作業するための設定を提供する。
マルチモーダルゲームコンテキストにおける正しいアクションシーケンスの予測に挑戦するビルダーアクション予測(BAP)サブタスクに注目した。
我々は、BAPタスクの評価とデータについて詳しく検討し、主要な課題を発見し、両方の面で大幅な改善を行い、そのタスクのアップグレード版であるBAP v2を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:54:47 GMT)
Fitting networks with a cancellation trick [7.3] 新しいネットワークモデルとしてlogit-DCBMを提案する。
$beta$-model や LSM と同様に、logit-DCBM には非線形因子が含まれており、パラメータの適合は困難である。
R-SCOREは、多くの場合、既存のスペクトルアプローチよりも大幅に改善される。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:51:34 GMT)
Reassessing How to Compare and Improve the Calibration of Machine Learning Models [7.2] 結果の予測確率がモデル予測に基づいてその結果の観測周波数と一致した場合、機械学習モデルを校正する。
キャリブレーションと予測の指標が追加の一般化の指標を伴わない限り、最先端のように見えるような簡単な再校正手法が存在することを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:00:25 GMT)
Concept Distillation from Strong to Weak Models via Hypotheses-to-Theories Prompting [7.1] 概念蒸留(CD)は、複雑なタスクにおいてより弱いモデルを強化するための自動プロンプト最適化手法である。
CDは、(1)ベースプロンプト(初期化)による弱いモデルによるミスの収集、(2)強いモデルを使用してこれらのミスの原因を生成し、弱いモデル(推論)のためのルール/概念を作成し、(3)検証セットのパフォーマンスに基づいてこれらのルールをフィルタリングする。
我々はNL2Codeと数学的推論タスクにおけるCDの評価を行い、より小型で弱い言語モデルに対する顕著な性能向上を観察した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:55:47 GMT)
AdverX-Ray: Ensuring X-Ray Integrity Through Frequency-Sensitive Adversarial VAEs [7.0] AdverX-Rayは画像品質評価層として機能する。
特定のマシンモデルのX線画像からのパッチに基づいて訓練される。
スキャンがトレーニング分布にマッチするかどうか、あるいは同じマシンからスキャンが異なる設定でキャプチャされるかどうかを評価することができる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:32:40 GMT)
Security Analysis of 5G NR Device-to-Device Sidelink Communications [7.0] 本稿では,NR V2Xサイドリンクの総合セキュリティ解析について述べる。
重要な手順にまたがる脆弱性を特定し、妥当な攻撃を実証する。
我々は5Gサイドリンク通信の安全性を高めるための緩和戦略を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:55:32 GMT)
Information-Theoretic Thresholds for the Alignments of Partially Correlated Graphs [7.0] ErdHos-R'enyiグラフモデルでは、ある数を持つ一対の誘導された部分グラフが相関する。
相関ノード数に対する部分回復に最適であることを示す。
可能性の証明として,交差グラフのエッジを2種類の成分に分割する相関関数グラフを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:01:26 GMT)
Navigation-GPT: A Robust and Adaptive Framework Utilizing Large Language Models for Navigation Applications [7.0] 既存のナビゲーション決定支援システムは、未定義のシナリオを扱う場合、しばしば性能が良くない。
この問題に対処するためのLLMアプリケーションのためのデュアルコアフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 01:41:58 GMT)
OptionZero: Planning with Learned Options [6.9] 複雑な環境下での強化学習において,選択肢のあるプランニングが有効であることが示されている。
MuZero にインスパイアされた我々は OptionZero という新しいアプローチを提案する。
OptionZeroはオプションネットワークをMuZeroに統合し、セルフプレイゲームを通じてオプションの自律的な発見を提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:20:15 GMT)
Model-agnostic Coreset Selection via LLM-based Concept Bottlenecks [6.9] Coreset Selection(CS)は、データセット全体の使用に匹敵するモデルパフォーマンスを達成するトレーニングデータのサブセットを特定する。
これらのスコアは計算に非効率的であり、サンプルが一般に学習することが困難であるか、あるいは特定のモデルのためにのみ難しいかを示さないため、解釈が困難である。
本研究は,ダウンストリームモデルに依存しない人間の理解可能なテキスト属性(概念)を用いて,サンプルの難易度を評価するための解釈可能なスコアを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:14:42 GMT)
Are Sparse Autoencoders Useful? A Case Study in Sparse Probing [6.8] スパースオートエンコーダ(SAE)は、大言語モデル(LLM)アクティベーションで表される概念を解釈する一般的な方法である。
もう一つの証拠源は、SAEが既存のベースラインを超えて下流タスクのパフォーマンスを改善していることを示すことである。
SAEを4つの状況下でのLCM活性化の現実的なタスクに適用することで、これを検証する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:54:15 GMT)
AnyBipe: An End-to-End Framework for Training and Deploying Bipedal Robots Guided by Large Language Models [6.6] 本稿では,ロボットの強化学習ポリシーをトレーニングし,展開するためのエンドツーエンドフレームワークを提案する。
このフレームワークは、3つの相互接続モジュールからなる: LLM誘導報酬関数設計モジュール、先行作業を活用するRLトレーニングモジュール、およびsim-to-real同型評価モジュール。
本稿では,これらのモジュールの構築,従来のアプローチに対するアドバンテージを詳述するとともに,二足歩行ロボットの制御戦略を自律的に開発・洗練するフレームワークの能力を実証する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:43:06 GMT)
Continuous Transition between Bosonic Fractional Chern Insulator and Superfluid [6.6] この手紙は、位相的に順序付けられた位相と自発な連続対称性破壊相の間の連続FCI-SF遷移の直接数値的なデモンストレーションを示す。
さらに、チャーンバンドの分散を徐々に平坦化することにより、ゼロフィールドボソニックFCIがSF状態から実現される可能性があることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:48:16 GMT)
FedDA-TSformer: Federated Domain Adaptation with Vision TimeSformer for Left Ventricle Segmentation on Gated Myocardial Perfusion SPECT Image [6.5] 本稿では,MPS を用いた左室セグメンテーションのための "FedDA-TSformer" というドメイン適応と TimeSformer の統合について紹介する。
FedDA-TSformerはMPS画像の空間的特徴と時間的特徴を捉え、空間的注意、時間的注意、および連合学習を利用してドメイン適応を改善する。
提案するFedDA-TSformerモデルでは,マルチセンターの一般化のゲートに対処し,患者のプライバシー保護を保証し,左室セグメンテーションの有効性を示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:47:37 GMT)
Robust Kernel Hypothesis Testing under Data Corruption [6.4] 本稿では,データ破損下でのロバストな置換テストを構築するための一般的な手法を提案する。
最小限の条件下での力の一貫性を証明する。
これは、潜在的な敵攻撃を伴う現実世界のアプリケーションに対する仮説テストの実践的な展開に寄与する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:27:00 GMT)
Towards Fully-Automated Materials Discovery via Large-Scale Synthesis Dataset and Expert-Level LLM-as-a-Judge [6.4] 本研究は,実践的でデータ駆動型資源を提供することで,材料科学コミュニティを支援することを目的としている。
オープンアクセス文献から17Kのエキスパートが検証した合成レシピの包括的データセットを収集した。
AlchemicalBenchは、合成予測に適用された大規模言語モデルの研究をサポートするエンドツーエンドフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:16:23 GMT)
Iterative Flow Matching -- Path Correction and Gradual Refinement for Enhanced Generative Modeling [6.3] 本稿では,フローマッチングが幻覚を発生させる理由を説明し,生成プロセスを改善するための反復的プロセスを提案する。
我々の反復的プロセスは、事実上$textitany$生成モデリング技術に統合することができ、それによって合成画像システムの性能と堅牢性を向上させることができる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:08:06 GMT)
Leveraging Edge Intelligence and LLMs to Advance 6G-Enabled Internet of Automated Defense Vehicles [6.3] この研究は、重要な防衛アプリケーションにおいて、これらの技術の潜在能力をフルに実現しようとするビジョンによって、機会と課題を提示する。
6Gの出現は、IoMDT(Internet of Military Defense Things)の領域内でのIoADV(Internet of Automated Defense Vehicles)の概念を強化する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:37:15 GMT)
CharacterGPT: A Persona Reconstruction Framework for Role-Playing Agents [6.2] 文字ペルソナトレーニング(CPT)を通じて文字ペルソナを動的に再構築するフレームワークである characterGPT を紹介する。
この手法は、物語の進行を反映して、章的な小説の要約から特徴を抽出することで、ペルソナを漸進的に更新する。
我々の枠組みは、キャラクターがオリジナルな物語を生成する、ビッグファイブの人格評価と創造的なタスクを通して評価される。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:46:27 GMT)
TrustChain: A Blockchain Framework for Auditing and Verifying Aggregators in Decentralized Federated Learning [6.1] 本稿では,過去の動作に基づいてアグリゲータを選択し,アグリゲータのアグリゲータのアグリゲータのアグリゲータをスコアリングする,TrustChainというDFL構造を提案する。
提案手法は,ブロックチェーンや異常検出,概念ドリフト分析など,いくつかの原則に依存している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:26:17 GMT)
FedNIA: Noise-Induced Activation Analysis for Mitigating Data Poisoning in FL [6.1] Federated Noise-induced Activation Analysis (FedNIA)は、敵の顧客を特定し排除するための新しい防御フレームワークである。
FedNIAはランダムノイズ入力を注入し、クライアントモデルの階層的なアクティベーションパターンを分析する。
サンプル中毒、ラベルのフリップ、バックドアなど、さまざまなタイプの攻撃に対して防御することができる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 01:16:01 GMT)
Understanding the Impact of Artificial Intelligence in Academic Writing: Metadata to the Rescue [5.9] このコラムは、AIの助けを借りて書かれた学術論文に人工知能(AI)固有のメタデータを含めることを提唱している。
これは、研究を広めるためのツールの使用を分析する試みである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:10:44 GMT)
Conditional Denoising Meets Polynomial Modeling: A Flexible Decoupled Framework for Time Series Forecasting [5.8] 複雑な時間パターンをモデル化するために,CDPM(Conditional Denoising Polynomial Modeling)フレームワークを提案する。
季節成分の変動には,歴史窓からの統計特性に基づく確率的拡散モデルを用いる。
スムーズなトレンドコンポーネントに対しては、歴史的依存関係を組み込んで線形モデルを強化するモジュールが提案されている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:08:49 GMT)
Learning Parameter Sharing with Tensor Decompositions and Sparsity [5.7] 大規模視覚変換器(ViT)と大規模言語モデル(LLM)を圧縮するための細粒度特異共有(FiPS)を導入する。
FiPSは、多層パーセプトロン(MLP)モジュール間でニューロンを表現するために共有塩基とスパース因子を用いる。
実験の結果, 各種Gemma-2およびLlama-3モデルでは, パラメータ予算をDeiT-BおよびSwin-Lで50-75%, Gemma-2およびLlama-3モデルで40-50%削減できることがわかった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:02:33 GMT)
A Comprehensive Review of Recommender Systems: Transitioning from Theory to Practice [5.6] Recommender Systems(RS)は、パーソナライズされたアイテムの提案を提供することで、ユーザーエクスペリエンスを高める上で重要な役割を果たす。
この調査は、2017年から2024年までのRSの進歩を包括的にレビューする。
この調査の第一の目的は、理論を実践と橋渡しすることである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:49:17 GMT)
PKE and ABE with Collusion-Resistant Secure Key Leasing [5.5] PKE-CR-SKL(PKE-CR-SKL)のコラシオン耐性セキュリティについて紹介する。
このモデルでは、複数の量子復号鍵を適応的に取得し、検証オラクルにアクセスすることができる。
公開鍵と暗号文のサイズは、生成された量子復号鍵の総数に依存していなければならない。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:45:24 GMT)
An Expert Ensemble for Detecting Anomalous Scenes, Interactions, and Behaviors in Autonomous Driving [5.4] ほぼ無限の運転シナリオにおける安全性は、完全自動運転の普及に対する主要な懸念の1つとなっている。
エゴセントリックビデオにおけるオンロード異常検出は、複雑でインタラクティブなシナリオによってもたらされる困難のため、依然として難しい問題である。
本稿では,不規則なシーンと予期せぬシーン動作を検出するためのフレームレベルの外観に焦点を当てたシーンエキスパートと,2つの道路参加者間の正常な相対的な動きをモデル化し,異常なインタラクションが出現するたびにアラームを発生させるインタラクションエキスパートと,将来の軌道予測によって個々の物体の異常行動を監視する行動専門家の3つを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:43:23 GMT)
MQADet: A Plug-and-Play Paradigm for Enhancing Open-Vocabulary Object Detection via Multimodal Question Answering [5.3] 既存のオープンボキャブラリ検出器は、複雑な視覚・テクスチャのミスアライメントと長い尾のカテゴリーの不均衡によって制限される。
textbfMQADetは、既存のオープン語彙検出装置を拡張するための普遍的なパラダイムである。
MQADetは、事前訓練されたオブジェクト検出器とシームレスに統合されるプラグイン・アンド・プレイのソリューションとして機能する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:59:39 GMT)
Is Moral Self-correction An Innate Capability of Large Language Models? A Mechanistic Analysis to Self-correction [5.3] 大規模言語モデル(LLM)における自己補正を妨げるボトルネックを特定することを目的としている。
隠れ状態に埋め込まれたモラルにおいて,異なる自己補正成分がどう相互作用するかを検討する。
第2の質問では、望ましい出力と望ましくない出力を区別するために効果的な自己補正を必要とする自己識別フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:36:54 GMT)
MV-CLAM: Multi-View Molecular Interpretation with Cross-Modal Projection via Language Model [5.2] 本稿では,多視点分子表現を統一されたテキスト空間に整列させる新しいフレームワークであるMV-CLAMを提案する。
トークンレベルのコントラスト損失は多様な分子的特徴を保っているのに対して,我々のアプローチはクロスビューの一貫性を保証する。
MV-CLAMは分子推論を強化し、検索とキャプション精度を向上させる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:38:29 GMT)
Analyzing Factors Influencing Driver Willingness to Accept Advanced Driver Assistance Systems [5.2] 本研究では,乗用車におけるADASの運転者の認識,知識源,利用パターンについて検討する。
全国調査では、米国ドライバーの多様なサンプルからデータを収集した。
発見は、社会経済的、人口統計学的、行動的要因がADAS導入に与える影響を強調している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:01:54 GMT)
Nonlinear Assimilation via Score-based Sequential Langevin Sampling [5.1] 本稿ではスコアベースシーケンシャルランゲヴィンサンプリング(SSLS)を提案する。
提案手法は,同化過程を交互に予測・更新ステップに分解する。
特定の条件下での総変動(TV)距離におけるSSLS収束の理論的保証を提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:34:08 GMT)
An Analyst-Inspector Framework for Evaluating Reproducibility of LLMs in Data Science [5.1] LLM(Large Language Models)は、コード生成によるデータサイエンスタスクの可能性を示している。
LLM生成データサイエンスを自動評価・実施する新しいアナリスト・インスペクタフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 01:15:50 GMT)
A Split-Window Transformer for Multi-Model Sequence Spammer Detection using Multi-Model Variational Autoencoder [4.7] 本稿では,MS$2$Dformerと呼ばれる新しいトランスフォーマーを提案する。
マルチモーダル変分オートエンコーダ(MVAE)に基づくユーザ行動トークン化アルゴリズムの設計
公開データセットで事前トレーニングされたMS$2$Dformerのパフォーマンスは、これまでの最先端をはるかに上回っている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:53:08 GMT)
Achieving Instance-dependent Sample Complexity for Constrained Markov Decision Process [4.7] マルコフ決定過程(CMDP)の強化学習問題について考察する。
これは$O(frac1Deltacdotepsiloncdotlog2(1/epsilon))$ sample complexity boundとなる。
本アルゴリズムは一次空間で動作し,CMDP問題に対する一次LPを各期間にオンライン的に解決する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:20:55 GMT)
CAPE: Covariate-Adjusted Pre-Training for Epidemic Time Series Forecasting [4.6] CAPEは、多様な地域からの広範な疾患データセットを活用するために設計された、新しい流行前トレーニングフレームワークである。
下流病のより深い意思決定のために、環境要因を直接モデリングプロセスに統合する。
平均9.9%のフルショット、14.3%のゼロショット設定でトップベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:59:09 GMT)
Unveiling LLM Mechanisms Through Neural ODEs and Control Theory [4.1] 本稿では,ニューラル正規微分方程式(Neural ODE)とロバスト制御理論を組み合わせて,大規模言語モデル(LLM)の解釈可能性と制御性を高める枠組みを提案する。
実験結果から、ニューラルODEと制御理論の統合は出力の一貫性とモデルの解釈可能性を大幅に向上させ、説明可能なAI技術の開発を前進させることが示された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:03:42 GMT)
Multi-Target Federated Backdoor Attack Based on Feature Aggregation [4.0] 本稿では,特徴集約に基づく裏口攻撃のための新しいベンチマークを提案する。
対象クラスに対するバックドアトリガの同時生成を提案する。
パッチベースの手法が失敗しても, 防御方法の検出を回避できるだけでなく, 77.39%の成功率でゼロショットバックドア攻撃を達成できることを示した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:47:52 GMT)
Triad: Vision Foundation Model for 3D Magnetic Resonance Imaging [3.8] 3次元MRIの視覚基礎モデルであるTriadを提案する。
Triadは131,170個のMRIボリュームから堅牢な表現を学ぶために広く使われているオートエンコーダアーキテクチャを採用している。
臓器・腫瘍区分,臓器・癌分類,医用画像登録という3つの課題にまたがってTriadを評価した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:13:01 GMT)
Swallowing the Poison Pills: Insights from Vulnerability Disparity Among LLMs [3.8] 現代の大型言語モデル (LLM) は毒薬攻撃の重大な脆弱性を示す。
我々はこれらの攻撃がLLMの固有のアーキテクチャ特性を悪用していることを実証する。
私たちの研究は、セキュリティの脅威と診断ツールとして毒薬を確立しています。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:34:55 GMT)
EDocNet: Efficient Datasheet Layout Analysis Based on Focus and Global Knowledge Distillation [3.7] 本稿では,文書解析のための文書レイアウト解析機能を実現するためにEDocNetを利用することを提案する。
本訓練方法は、焦点及びグローバル知識蒸留法を採用し、電子機器文書に適したモデルを得る。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:20:42 GMT)
Advanced Chain-of-Thought Reasoning for Parameter Extraction from Documents Using Large Language Models [3.7] 現在の手法は、高次元の設計データを処理し、リアルタイム処理の要求を満たすのに苦労している。
パラメータの抽出とPySpiceモデルの生成を自動化する革新的なフレームワークを提案する。
実験の結果, 3つの手法を併用することにより, 検索精度が47.69%向上し, 処理遅延が37.84%減少した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:19:44 GMT)
Gradient entropy (GradEn): The two dimensional version of slope entropy for image analysis [3.7] 本稿では,2次元への傾斜エントロピーの拡張である勾配エントロピー(GradEn)について述べる。
計算コストを低く抑えつつ,様々な特徴を持つ画像を識別できるGradEnの能力を示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:05:01 GMT)
PixFoundation: Are We Heading in the Right Direction with Pixel-level Vision Foundation Models? [3.7] 画素レベルのMLLMの現在の傾向は、大規模ラベル付きデータに基づいて画素レベルの接地監督を訓練することである。
近年の視覚中心のベンチマークで評価すると,このようなMLLMは視覚的質問応答の弱い能力を示す。
我々は, PixFoundation と呼ばれる任意の MLLM に接続可能な接地情報を抽出するために, 単純なベースラインを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:01:02 GMT)
Large Language Models as Topological Structure Enhancers for Text-Attributed Graphs [3.6] 大規模言語モデル(LLM)は自然言語処理(NLP)の分野に革命をもたらした。
本研究では,LLMの情報検索とテキスト生成機能を活用して,ノード分類設定の下でのテキスト分散グラフ(TAG)のトポロジ構造を洗練・強化する方法について検討する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:40:49 GMT)
Enhanced response at exceptional points in multi-qubit systems for sensing [3.4] パリティ時間-逆対称を持つ$n$同一量子ビット系の例外点について検討する。
Ising-type の相互作用を考慮し、$m le n$ に対して$(m+1)$-th Order 応答を達成するためには、システムは非自明な$m$-body 相互作用を取得する必要があることを解析的に証明する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:27:17 GMT)
Asteroid shape inversion with light curves using deep learning [3.3] 光度データを用いた小惑星の形状インバージョンは、惑星科学や天文学研究において重要な研究領域となっている。
現在の小惑星の逆転法では、広範囲な反復計算が必要であり、この過程は時間を要し、局所的な最適化では立ち往生する傾向にある。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:10:29 GMT)
Retrieval-Augmented Fine-Tuning With Preference Optimization For Visual Program Generation [3.3] 本稿では,視覚プログラム言語(VPL)の生成を促進するための2段階のトレーニング戦略を提案する。
まず,産業用VPLでよく見られるサブルーチンの反復的使用を活用するために,検索強化微調整を用いる。
第2に、モデルをさらに正確な出力に導くために、直接選好最適化(DPO)を適用する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:27:44 GMT)
A new framework for X-ray absorption spectroscopy data analysis based on machine learning: XASDAML [3.3] XASDAMLは、データ処理ワークフロー全体を統合したフレキシブルな機械学習ベースのフレームワークである。
包括的統計分析をサポートし、主成分分析やクラスタリングなどの手法を活用する。
XASDAMLの汎用性と有効性は、銅のデータセットに適用することで実証される。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:50:04 GMT)
A Joint Learning Framework for Bridging Defect Prediction and Interpretation [3.1] 本稿では,欠陥予測と解釈のための共同学習フレームワークを提案する。
予測器からインタプリタへ決定ロジックを伝達するフィードバックループを設計する。
共同学習フレームワークの損失関数には,解釈結果をペナルティ項として組み込む。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:01:46 GMT)
Rewards-based image analysis in microscopy [2.9] イメージングとハイパースペクトルデータの分析は、生物学、医学、化学、物理学などの科学分野において重要である。
現在、このタスクは、認知、空間サンプリング、キーポイント検出、特徴生成、クラスタリング、次元減少、物理に基づく非畳み込みといった複雑な人間設計の反復的なステップに依存している。
過去10年間の機械学習の導入により、教師なし学習によるイメージセグメンテーションやオブジェクト検出、教師なし手法による次元削減といったタスクが加速した。
ここでは、専門家による意思決定の原則を採用し、強い伝達学習を示す報酬ベースの進歩について論じる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:19:38 GMT)
Correlated Dephasing in a Piezoelectrically Transduced Silicon Phononic Waveguide [2.8] 薄膜ニオブ酸リチウム圧電素子によって駆動される小型シリコン単一モード導波路の設計,製造,特性評価を行う。
本装置はシリコン導波路内を伝播するマイクロ波光子とフォノンを直接伝達し,超伝導回路への結合経路を提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:49:15 GMT)
A Hybrid Multi-Factor Network with Dynamic Sequence Modeling for Early Warning of Intraoperative Hypotension [2.8] 過去の生理的信号を用いた術中低血圧(IOH)予測は重要である。
既存のIOH予測手法は、しばしば静的モデリングに依存している。
IOH予測を動的シーケンス予測問題としてモデル化するハイブリッドマルチファクター(HMF)ネットワークを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:06:38 GMT)
Inversion of Magnetic Data using Learned Dictionaries and Scale Space [2.8] 磁気データインバージョンは地球物理学において重要なツールであり、表面磁場測定から地表面の磁化率分布を推定するために用いられる。
従来の反転アプローチは、解を安定化させるために事前に定義された正則化技術に依存している。
本稿では,これらの課題に対処するために,可変辞書学習とスケールスペース手法を統合するアプローチを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:19:52 GMT)
Multilingual != Multicultural: Evaluating Gaps Between Multilingual Capabilities and Cultural Alignment in LLMs [2.5] 大規模言語モデル(LLM)は、グローバル言語全体でますます能力を高めつつある。
しかし、言語間のコミュニケーション能力が必ずしも適切な文化的表現に変換されるとは限らない。
GoogleのGemmaモデルとOpenAIのターボシリーズの2つのモデルを比較します。
言語能力と文化的アライメントの間には、一貫した関係は見つからない。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:02:41 GMT)
Dragen3D: Multiview Geometry Consistent 3D Gaussian Generation with Drag-Based Control [2.5] Dragen3Dは、幾何学的に一貫した制御可能な3D生成を実現する新しいアプローチである。
Anchor-Gaussian Variational Autoencoder (Anchor-GS VAE)を導入し、点雲と1つのイメージをアンカー潜水器にエンコードし、これらの潜水器を3DGSにデコードする。
我々の知る限りでは、幾何学的に制御可能な3Dガウス生成と編集を初めて達成した人物である。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:19:03 GMT)
Polarized Online Discourse on Abortion: Frames and Hostile Expressions among Liberals and Conservatives [2.4] 我々は、1100万以上のユーザーから1年間の妊娠中絶に関連する350万以上のツイートのコーパスを分析した。
我々はリベラル派と保守派が互いに敵対的な表現を使うことをおおむね反映していることを示した。
片方が好むフレームは 相手からの 敵対的な反応を引き起こした
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:02:17 GMT)
Random Tree Model of Meaningful Memory [2.4] 本稿では,各ノードが木葉の圧縮された表現であるキーポイントの階層として物語を表現するために,ランダムツリーの統計的アンサンブルを導入する。
平均リコール長は物語長に比例して増加し,各リコール文では個人がより長いナラティブセグメントを要約するようになっている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:25:11 GMT)
On Neural Inertial Classification Networks for Pedestrian Activity Recognition [2.4] 歩行者活動を認識するには慣性センサーが不可欠である。
近年のディープラーニングの進歩は慣性センシング性能と堅牢性を大幅に改善している。
異なるドメインやプラットフォームは、ディープラーニング技術を使ってネットワーク性能を向上させるが、一般的なベンチマークはない。
本研究の目的は,ニューラルネットワークの慣性分類ネットワークを改善するための10種類のデータ駆動手法を定義し,解析することによって,このギャップを埋めることである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:15:26 GMT)
Optimizing Input Data Collection for Ranking and Selection [2.4] 予算が与えられた入力データとシミュレーションデータを収集する逐次サンプリングアルゴリズムを設計する。
サンプリング予算の増加に伴い,MPBの最適性の後方確率は指数速度で1つに収束することを示す。
シミュレーション出力平均予測を改善するため,カーネルリッジ回帰を用いてOSARを拡張した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:33:43 GMT)
Optimizing Coverage-Driven Verification Using Machine Learning and PyUVM: A Novel Approach [2.4] System-on-Chip(SoC)設計の複雑さは、検証のボトルネックを生み出した。
既存の検証技術は、時間と冗長なシミュレーションの回帰に依存する。
シミュレーション回帰を最適化するために教師付き機械学習(ML)を活用する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:54:23 GMT)
Benchmarking Self-Supervised Methods for Accelerated MRI Reconstruction [2.3] 高アンサンプ測定からMRIを再構築することは、医療画像の高速化に不可欠である。
教師付きディープラーニングアプローチは目覚ましい成功を収めてきたが、完全にサンプル化された真実データに依存している。
本研究は,すべてのフィードフォワード自己監督法から得られた損失関数の総合的レビューと,基礎的真実を伴わない高速MRI再構成に関する最初のベンチマークを提示する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:30:59 GMT)
The GUS Framework: Benchmarking Social Bias Classification with Discriminative (Encoder-Only) and Generative (Decoder-Only) Language Models [2.2] 一般化、不公平、ステレオタイプ(GUSフレームワーク)は、社会的偏見の根底にある重要な言語的要素であると考えられている。
GUSフレームワークは、倫理的基準を維持するために人間が検証する包括的な合成データセットを作成するために、半自動化されたアプローチを採用している。
本手法は,識別的(エンコーダのみ)モデルと生成的(自己回帰的)大規模言語モデルを組み合わせることで,テキスト中のバイアスのあるエンティティを識別する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:08:56 GMT)
Decoding the Issue Resolution Process in Practice via Issue Report Analysis: A Case Study of Firefox [2.2] 本稿では,Mozilla Firefoxのイシューレポートを分析し,実際に実施されているイシュー解決プロセスの理解を深めることを目的としている。
356のFirefoxイシューレポートにある議論を質的かつ定量的に分析し、開発者が様々なソフトウェア問題に対処するためのステージのシーケンスを特定しました。
パターンの複雑さ、イシューレポートタイプ、イシューカテゴリ、イシュー解決時間など、さまざまな次元にわたるプロセスとパターンを分析して、Mozillaのイシュー解決プロセスに関するさまざまな洞察を得た。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:49:50 GMT)
Saarthi: The First AI Formal Verification Engineer [2.2] Devinは、世界初の完全自律型AIソフトウェアエンジニアとして、人工知能(AI)コミュニティで大きな話題を呼んだ。
同様に、完全に自律的なAI形式検証エンジニアであるSaarthiは、所定のRTL設計をエンドツーエンドで検証することができる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:42:50 GMT)
Does Unlearning Truly Unlearn? A Black Box Evaluation of LLM Unlearning Methods [2.0] 大規模言語モデルアンラーニングは、LLMが悪意ある目的のために使用するのを防ぐために学んだ有害な情報を除去することを目的としている。
アンラーニングが一般的なモデル能力に顕著な影響を与えていることを示す。
簡単な方法で5ショットのプロンプトやリフレーズを行うことで、未学習ベンチマークの精度が10倍以上に向上する可能性があることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:54:39 GMT)
To Share or Not to Share: Investigating Weight Sharing in Variational Graph Autoencoders [1.8] 本稿では,変分グラフオートエンコーダ(VGAE)におけるウェイトシェアリング(WS)の実践について検討する。
WSは、VGAEモデル設計とノード埋め込み学習の利点と欠点の両方を提示しています。
我々は、その意味を厳密に分析し、広範囲のグラフとVGAEの変種に関する広範な実験を通して、WSの利点がその欠点を一貫して上回っていることを実証します。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:31:13 GMT)
An Overall Real-Time Mechanism for Classification and Quality Evaluation of Rice [1.7] 本研究は, 包括的米粒評価のためのリアルタイム評価機構を提案する。
1段階のオブジェクト検出アプローチ、深層畳み込みニューラルネットワーク、従来の機械学習技術を統合する。
提案手法により,イネ品種の同定,粒度評価,粒度評価が可能となった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:06:03 GMT)
Benchmarking quantum gates and circuits [1.6] 本稿では,Randomized Benchmarking, Quantum Process Tomography, Gate Set Tomography, Process Fidelity Estimation, Direct Fidelity Estimation, Cross-Entropy Benchmarkingなど,さまざまなベンチマーク手法についてレビューする。
本稿では,実験実行回数を最小限に抑え,SPAMエラーに対するレジリエンスを示し,一貫性と不整合性の両方を効果的に特徴付ける新しいプロトコルである決定論的ベンチマーク(DB)を紹介する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:32:27 GMT)
Guarding the Privacy of Label-Only Access to Neural Network Classifiers via iDP Verification [1.6] ニューラルネットワークは、トレーニングセットのプライベート情報を抽出できるプライバシー攻撃の影響を受けやすい。
いくつかのトレーニングアルゴリズムは、計算にノイズを加えることで、差分プライバシー(DP)を保証する。
我々は,ラベルのみのアクセスを最小限の精度で保護できる,最強のiDP-DBを計算するためのLUCIDを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 09:50:26 GMT)
Make Literature-Based Discovery Great Again through Reproducible Pipelines [1.6] 本研究の主な新規性は、二元的LBD過程の過程を描写したJupyter Notebooksのコレクションである。
ベンチマークデータセットのオープンアクセス、コードの再利用、実行可能なDockerレシピを通じて、LBDのハンズオンエクスペリエンスの恩恵を受けることができる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:38:04 GMT)
Semantic Security with Infinite Dimensional Quantum Eavesdropping Channel [1.5] 本稿では,ワイヤタップチャネルの直接符号化定理の証明法を提案する。
この方法はブロック長の増加とともに指数関数的に減衰する誤差を生じる。
セマンティックセキュリティの量子バージョンを保証する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 23:17:24 GMT)
Optically Detected Magnetic Resonance Imaging and Sensing Within Functionalized Additively Manufactured Microporous Structures [1.4] ダイヤモンド中の窒素空孔中心による量子センシングは、多様な物理パラメータを測定する強力なツールとして登場した。
そこで我々は,NV含有ナノダイヤモンドを用いた多光子リソグラフィー構造を表面官能化することにより,設計用量子センサの汎用的開発手法を示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:13:48 GMT)
OPAQUE: Obfuscating Phase in Quantum Circuit Compilation for Efficient IP Protection [1.3] 量子回路難読化技術は、コンパイル前に量子回路を鍵依存バージョンに変換することによって量子IPを保護する。
OPAQUEは、回転ゲートの角度を秘密鍵として利用する位相ベースの量子回路難読化手法である。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:13:59 GMT)
Examining Racial Stereotypes in YouTube Autocomplete Suggestions [1.3] 我々は、YouTubeのオートコンプリートが、人種に関する情報を探索するユーザーのための情報ソースとしてどのように機能するかを検討する。
批判的談話分析を用いて、人種バイアスが現れる5つの主要な社会文化的文脈を同定する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 23:45:43 GMT)
UNCA: A Neutrosophic-Based Framework for Robust Clustering and Enhanced Data Interpretation [1.3] 統一ニューロソフィッククラスタリングアルゴリズム(UNCA)を提案する。
UNCAは、クラスタリング精度を改善するために、マルチフェイス戦略とニュートロソフィック論理を組み合わせる。
UNCAはいくつかの指標で従来の手法より優れています。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:08:59 GMT)
Facilitating Emergency Vehicle Passage in Congested Urban Areas Using Multi-agent Deep Reinforcement Learning [1.2] 緊急対応時間(ERT)は、都市の安全、医療、火災、犯罪の緊急対応能力の測定に不可欠である。
ニューヨークでは、2014年の7.89分から2024年の14.27分まで医療用ETRが72%増加し、救急車(EMV)の走行が遅れた。
この論文は3つのコントリビューションを通じてEMVのファシリテーションを促進する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:34:32 GMT)
Empirical Analysis on CI/CD Pipeline Evolution in Machine Learning Projects [1.2] この研究は、機械学習(ML)ソフトウェアシステムにおいて、継続的インテグレーションとデリバリ(CI/CD)の構成がどのように進化するかについて、最初の経験的分析を提示する。
我々は508のオープンソースMLプロジェクトから収集した343のコミットを手動で分析し、CI/CD構成変更カテゴリを特定した。
我々は15,634コミットで頻繁なCI/CD構成変更パターンを識別するCI/CD構成変更クラスタリングツールを開発した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:37:19 GMT)
The Hidden Strength of Disagreement: Unraveling the Consensus-Diversity Tradeoff in Adaptive Multi-Agent Systems [1.1] エージェントが独立して情報交換を行う暗黙のコンセンサスは、動的環境においてより効果的である、と我々は主張する。
我々は、暗黙の手法が明示的な手法よりも優れている条件を示す、コンセンサスと多様性のトレードオフを定式化する。
我々は、回復力のある意思決定のために多様性を維持することの価値を強調し、文脈内学習による創発的な調整を強調した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:12:53 GMT)
Benchmarking Online Object Trackers for Underwater Robot Position Locking Applications [1.0] 視覚に基づく水中ロボットのナビゲーションと制御は、最近、水中環境で直面する多くの課題に対処するために注目を集めている。
本稿では,ROVプラットフォームにおける視覚ベースの位置ロックのための,機械学習(ML)ベースの1ショットオブジェクト追跡アルゴリズムを7つ以上導入した,厳密な統一ベンチマークを提案する。
提案システムは,物体追跡アルゴリズムの出力結果を用いて,外乱に対するROVの位置を自動的に補正する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:27:34 GMT)
Decision-tree decoders for general quantum LDPC codes [0.9] 決定木デコーダ (Decision Tree Decoders, DTD) を導入する。
DTDは断層を1つずつ加えて漸進的に補正し、決定木(DT)を通る経路を形成する。
我々は,任意のqLDPCコードに適用可能な2つの明示的なDTDアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:29:14 GMT)
Automated Flow Pattern Classification in Multi-phase Systems Using AI and Capacitance Sensing Techniques [0.9] 本研究では,従来の技術と比較して,容量センサとAI駆動型分類手法を統合した新しいプラットフォームを提案する。
実験の結果,提案手法は1D SENet深層学習モデルを用いて,実験ベースデータセットでは85%以上の精度,パターンベースデータセットでは71%以上の精度を実現している。
この作業は、リアルタイムフロー監視と予測モデリングのためのトランスフォーメーションパスを提供し、産業アプリケーションにおける重要な課題に対処する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:11:29 GMT)
Update hydrological states or meteorological forcings? Comparing data assimilation methods for differentiable hydrologic models [0.9] データ同化(DA)は、より正確な予測のために、ほぼリアルタイムな観測によって水理モデルの内部状態を更新することを可能にする。
そこで我々は,降水データのみに対する調整器の最適化を含む,微分可能なモデルに対する変分DA法を開発した。
我々のDAフレームワークは、体系的な訓練データを必要としないため、河川網全体のDAスキームとして機能する可能性がある。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:08:05 GMT)
Runtime Analysis of Evolutionary Algorithms for Multiparty Multiobjective Optimization [0.9] 本稿では、双方向多目的最適化問題(BPMOP)における進化的アルゴリズムの予測ランタイムに関する最初の理論的解析について述べる。
その結果,MPMOPを解くために従来の多目的最適化アルゴリズムを用いることは,時間を要することと非効率であることがわかった。
擬ブール最適化のための共進化型多目的多目的言語(CoEMPMO)を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:06:36 GMT)
Ensemble ToT of LLMs and Its Application to Automatic Grading System for Supporting Self-Learning [0.8] Ensemble Tree-of-Thought (ToT)は、複数のモデルを統合することでLCM出力を強化するフレームワークである。
評価システムはまずLLMの分解傾向を評価し,次に複数の結果を生成し,シミュレーションによる議論を通じてそれらを統合する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 01:17:46 GMT)
Guardians of the Agentic System: Preventing Many Shots Jailbreak with Agentic System [0.8] 本研究は,3つの検査手法を用いて,逆チューリングテストによりローグエージェントを検出し,マルチエージェントシミュレーションにより知覚的アライメントを解析する。
GEMINI 1.5 Pro と llama-3.3-70B, Deepseek r1 モデルを用いて, 抗ジェイルブレイクシステムを開発した。
GEMINI 1.5 Proの94%の精度など、検出能力は強いが、長時間の攻撃を受けた場合、システムは永続的な脆弱性に悩まされる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 23:35:15 GMT)
Dynamic LLM Routing and Selection based on User Preferences: Balancing Performance, Cost, and Ethics [0.7] 本稿では,タスクを最適大言語モデル(LLM)に動的に選択・ルーティングする,高度なモデルルーティングエンジンであるOptiRouteを紹介する。
OptiRouteは、機能的(例えば、精度、速度、コスト)と非機能的(例えば、有用性、無害性、正直性)の両方の基準を捉え、最適なモデルとタスクを効率的に一致させる。
これにより、クラウドベースのMLプラットフォーム、パーソナライズされたAIサービス、規制業界におけるリアルタイムアプリケーションに理想的になります。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:23:22 GMT)
A graph-theoretic approach to chaos and complexity in quantum systems [0.5] 我々は、textitcommutator graphを通じて、DLAを持つシステムのアンサンブルに対するスクランブル、カオス、複雑さの平均概念を探索する。
DLAとは異なり、可換グラフは短時間のダイナミクスに敏感である。
我々は、可換グラフのグラフ理論的性質を、時間外コレレータ(OTOC)、フレームポテンシャル、系のハミルトニアンのフラストレーショングラフ、力学の下で進化する作用素のクリロフ複雑性にリンクする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:03:03 GMT)
BiPO: Bidirectional Partial Occlusion Network for Text-to-Motion Synthesis [0.5] BiPOは、テキスト間合成を強化する新しいモデルである。
パートベースの生成と双方向の自己回帰アーキテクチャを統合する。
BiPOはHumanML3Dデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:40:05 GMT)
Optimizing Retrieval-Augmented Generation of Medical Content for Spaced Repetition Learning [0.5] 本稿では,ポーランド国家検索試験(PES)にコメント生成を用いたパイプラインを提案する。
このシステムは、これらの生成されたコメントとソース文書を空間的反復学習アルゴリズムと統合し、知識保持を強化する。
医用アノテータによる厳密な評価は、文書の妥当性、信頼性、生成したコンテンツの論理的一貫性などの重要な指標の改善を示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:56:31 GMT)
Multimodal Bearing Fault Classification Under Variable Conditions: A 1D CNN with Transfer Learning [0.5] 軸受の故障は、最大90%の機械的欠陥を構成する。
本研究では,マルチモーダル軸受断層分類手法を提案する。
1次元畳み込みニューラルネットワーク(1D CNN)フレームワーク内の振動と運動相電流信号に依存する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:11:25 GMT)
Deep unrolling for learning optimal spatially varying regularisation parameters for Total Generalised Variation [0.4] このフレームワークは、空間的に変化する2つのTGVパラメータを推論するディープ畳み込みニューラルネットワーク(CNN)と、対応する変動問題を解決するアンロールスキームを組み合わせる。
画像復調とMRI再建の数値的結果は, 最高のTGVスカラーパラメータの場合と比較して, 有意な質的, 定量的改善を示した。
特に、第1次TGV項を重み付けするパラメータは、高次の値が交互に変化する三辺構造を持ち、第2次項を重み付けするパラメータは、エッジ周辺の大きな近傍で小さな値を得る。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:48:11 GMT)
Revisiting the Laplace transform in quantum mechanics: correcting a flawed approach for the stationary Schrödinger equation [0.4] Tsaur と Wang による2014年の研究では、様々なポテンシャルに対する定常シュル・オーディンガー方程式を解くためのラプラス変換に基づく方法が導入された。
本稿では,一次元シュリンガー方程式に対するラプラス変換の利用を再検討し,境界条件や特異点を扱う際の正しい慣行を明らかにする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:11:01 GMT)
The Popularity Hypothesis in Software Security: A Large-Scale Replication with PHP Packages [0.3] 本稿では,ソフトウェアの人気がセキュリティやセキュリティに関係しているという仮説を考察する。
調査対象のデータセットには,PHPで記述された40万近いオープンソースソフトウェアパッケージが含まれている。
その結果、リリース履歴の脆弱性によって影響を受けるパッケージは、単一の脆弱性の影響を受けずにパッケージよりも一般的に人気があることがわかった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:00:57 GMT)
A Layer Selection Approach to Test Time Adaptation [0.3] テスト時間適応(TTA)は、推論中に事前訓練されたモデルを新しいドメインに適応させることによって、分散シフトの問題に対処する。
提案するGALAは,TTA中に最も有益な更新を行うための新しいレイヤ選択基準である。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:31:49 GMT)
Solving Functional Optimization with Deep Networks and Variational Principles [0.3] 機能最適化問題を解くために、変分法を利用してディープニューラルネットワークを設計する方法を示す。
我々のアプローチは、最小時間制御問題のような未知の間隔で定義された関数やサポートテキストエマダッシュである場合に重要である。
地上データに頼ることなく、教師なしでCalVNetを訓練できることが示される。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:00:35 GMT)
Beyond Final Answers: Evaluating Large Language Models for Math Tutoring [0.2] 本稿では,大規模言語モデル(LLM)の正しさと品質を評価するための2つの手法を提案する。
最初のアプローチは、LLM問題解決能力を評価するためのテストベッドとして、大学代数のためのインテリジェントなチュータリングシステムを使用する。
2つ目のアプローチは、LLMを問題解決者ではなく家庭教師として評価する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:43:45 GMT)
Code Summarization Beyond Function Level [0.2] 本研究では,関数レベルを超えたコード要約モデルの有効性について検討した。
微調整された最先端のCodeT5+ベースモデルは、コード要約に優れていた。
リポジトリレベルの要約は有望なポテンシャルを示したが、かなりの計算資源を必要とした。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:31:21 GMT)
Tool or Tutor? Experimental evidence from AI deployment in cancer diagnosis [0.2] 本稿では,AIによる訓練とAIによるタスク完了を補完し,この仮説を肺癌診断の文脈で検証することを提案する。
以上の結果から,AI統合トレーニングとAI支援が独立して診断性能を向上する一方で,それらの組み合わせが最高の精度を示した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 02:47:49 GMT)
Rebalancing the Scales: A Systematic Mapping Study of Generative Adversarial Networks (GANs) in Addressing Data Imbalance [0.2] Generative Adrial Networks (GANs) は、高品質な合成データを生成するデータ前処理技術として大きな可能性を示した。
本研究では、4つのデジタルライブラリから得られる不均衡なデータに対して、GANに基づくサンプリング手法に関する3041の論文を体系的なマッピング手法を用いて分析する。
包括的定量的分析を通じて、データの不均衡の性質を扱うために、アプリケーションドメイン、GAN技術、およびGAN変種として3つの分類写像を導入する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:03:29 GMT)
Contrastive Learning of English Language and Crystal Graphs for Multimodal Representation of Materials Knowledge [0.2] 新たに合成した126kの結晶構造-テキストペアのデータセット上に事前学習したコントラスト言語-結晶モデル(CLaC)を導入する。
CLaCは結晶構造の理解において最先端のゼロショット一般化性能を達成する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:39:46 GMT)
Worst-case Error Bounds for Online Learning of Smooth Functions [0.0] 本研究では,あるスムーズな制約のある実関数のオンライン学習における最悪の誤りについて検討する。
すべての$p, q ge 2$ および $eta ge 1$ に対して $operatornameopttextnf_p, eta (mathcalF_q)$ は有限であることを示す。
また、スムーズな関数のオンライン学習のためのノイズモデルを定義し、学習者は最大1回まで誤ったフィードバックを受けることができる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:43:10 GMT)
Users Favor LLM-Generated Content -- Until They Know It's AI [0.0] 本研究では,コンテンツソースが隠蔽されたり開示されたりした場合に,人間のラングモデルと大規模ラングモデルを用いて,一般的な質問に対する応答を個人がどのように評価するかを検討する。
以上の結果から,参加者はAIによる反応を好む傾向が示唆された。
AIの起源が明らかになると、この選好は著しく低下し、評価的判断が応答の発覚の開示に影響されることが示唆される。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:14:02 GMT)
Unmasking Societal Biases in Respiratory Support for ICU Patients through Social Determinants of Health [0.0] 本研究は,機械的換気の延長と織りの成功という,臨床的に動機づけられた2つの課題に焦点を当てた。
我々は、集中治療室内の呼吸介入における健康上の不平等をよりよく理解するために、人口統計グループおよび健康の社会的決定要因にわたるモデルの予測に関する公正な監査を行う。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:23:15 GMT)
Unitary time evolution in quantum mechanics is a stronger physical postulate than linear time evolution [0.0] 量子力学の公理の数学的に異なるが物理的に等価な2つの定式化について議論する。
時間進化のユニタリ性は、量子力学の論理的に独立で実験的に不可能な公理であると考えるのがよい。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:38:00 GMT)
Two-Step QAOA: Enhancing Quantum Optimization by Decomposing K-hot Constraints in QUBO Formulations [0.0] Two-Step QAOAは、k-hotエンコーディングQUBO定式化の問題を分解することで、QAOAの有効性を向上させることを目的としている。
ソフト制約をハード制約に変換し、初期条件の生成を単純化する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:20:26 GMT)
Transformations of predictions and realizations in consistent scoring functions [0.0] 本研究では,(厳密な)一貫したスコアリング関数の実現と予測変数を変換して構築したスコアリング関数について検討する。
この研究は、理論的な洞察を実践的応用と統合することにより、複雑な予測タスクにおけるスコアリング関数を設計するための原則的な方法論を前進させる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:38:03 GMT)
Subspace Recovery in Winsorized PCA: Insights into Accuracy and Robustness [0.0] 我々はWinsorized principal Component Analysis (WPCA) を用いた部分空間回復の理論的性質について検討する。
我々は,WPCAの精度を詳細に分析し,サンプル数の増加とともに,サンプルサブスペースの整合性も保証されることを示す。
我々は、分解点の古典的な概念を、部分空間値統計に拡張し、WPCAの分解点の下位境界を導出する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:44:31 GMT)
Strengthening DeFi Security: A Static Analysis Approach to Flash Loan Vulnerabilities [0.0] 我々はフラッシュローンによる価格操作の脆弱性を検出する高度なフレームワークであるFlashDeFierを紹介した。
FlashDeFierは、テナントソースとシンクの範囲を広げ、DeFiプロトコルをまたいだデータフローの包括的な分析を可能にする。
著名なDeFiインシデントのデータセットに対してテストされたFlashDeFierは、価格操作の脆弱性の76.4%を特定し、DeFiTainterよりも30%改善している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:18:41 GMT)
Stabilizer Entropy and entanglement complexity in the Sachdev-Ye-Kitaev model [0.0] 本研究では,SYK4+SYK2モデルの基底状態および高励起状態における安定化器R'enyiエントロピー(SRE)と絡み合いエントロピーの相互作用について検討した。
SYK4 は実際には絡み合いと非安定化資源の両方の複雑なパターンによって特徴づけられるが、SYK2 は非普遍的で複雑ではない。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:43:32 GMT)
Spectral Theory for Edge Pruning in Asynchronous Recurrent Graph Neural Networks [0.0] 非同期リカレントグラフニューラルネットワーク(ARGNN)は、生物の複雑で適応的な性質に似た、動的グラフの複雑な依存関係をキャプチャする。
本稿では,ネットワークグラフのラプラシアンの固有値の虚像成分を利用して,グラフスペクトル理論に基づく動的プルーニング手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:05:08 GMT)
Solving Helmholtz problems with finite elements on a quantum annealer [0.0] 有限要素を用いたヘルムホルツ問題の解法は線型系の解法につながる。
本稿では,量子異方体がこの課題にどのように対処できるかを検討する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 20:49:55 GMT)
Sharing quantum nonlocality and teleportation over long distance using optical hybrid states [0.0] その結果,光ハイブリッド状態は,大都市圏でClaus-Horne-Shimony-Holt(CHSH)ベルの不等式に反する偏光絡み状態を効率的に生成できることが示唆された。
さらに、未知偏光量子ビットの量子テレポーテーションにおける情報処理タスクにおける共有絡み状態の品質を評価する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:25:00 GMT)
SBSC: Step-By-Step Coding for Improving Mathematical Olympiad Performance [0.0] マルチターン数学推論フレームワークとしてステップバイステップ符号化(SBSC)を提案する。
コード実行出力と以前のステップのプログラムを活用することで、SBSCは次のサブタスクとそれに対応するプログラムを生成する。
大規模な実験は、競合やオリンピアードレベルの数学問題に対するSBSCの有効性を強調している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:51:26 GMT)
Reasoning about Affordances: Causal and Compositional Reasoning in LLMs [0.0] 本研究では,大規模言語モデル (LLM) と人間による,物価の分野における因果的・構成的推論能力について検討する。
実験1では, GPT-3.5 と GPT-4o を比較し, GPT-4o がヒトと同等であったのに対し, GPT-3.5 は有意に低下していた。
実験2では, GPTモデルに加えて, Distractor と Image という2つの新しい条件を導入し, Claude 3 Sonnet と Claude 3.5 Sonnet の評価を行った。
GPT-4oとClaude 3.5は依然としてかなり上回っているが、ディトラクタ条件は人体とモデル間で性能を著しく低下させた。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:21:47 GMT)
RapidPen: Fully Automated IP-to-Shell Penetration Testing with LLM-based Agents [0.0] RapidPenは完全に自動化された浸透テストフレームワークである。
単一のIPアドレスから始まる脆弱性を自律的に発見し、悪用する。
約0.3-$0.6のラン当たりのコストで200-400秒以内のシェルアクセスを実現した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:57:46 GMT)
RKHS, Berezin and Odzijewicz-type quantizations on arbitrary compact smooth manifold [0.0] Berezin と Odzijewicz 型の量子化では、まずこの量子化を $mathbb CPn$ に明示的に示す。
滑らかなコンパクトな埋め込み多様体上の量子化を$mathbb CPn$から誘導する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:31:10 GMT)
Quantum Phase Space Symmetry and Sterile Neutrinos [0.0] 本研究の目的は、線形正準変換群に対応する量子位相空間の対称性について議論することである。
量子相に付随するLCT群のスピン表現(1, 4)は、ステリルニュートリノの存在を示唆している。
この研究で開発された数学的フォーマリズムはニュートリノ物理学研究の新しい枠組みを提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:59:36 GMT)
Quantum Encoding of Structured Data with Matrix Product States [0.0] 行列積状態(MPS)を用いた量子状態の次元再現表現を形成する。
99.99%の精度で,MPSをベースとした状態合成により,高効率な関数の符号化が可能であることを示す。
また、離散ウェーブレット変換(DWT)表現の近似に基づいて、構造化画像データを符号化する新しい手法を示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:47:22 GMT)
Quantitative Trading using Deep Q Learning [0.0] 強化学習(Reinforcement Learning、RL)は、ロボット工学、ゲーム、自律システムなど、多くの分野で使用されている機械学習のサブフィールドである。
本稿では,RLを量的トレーディングに利用し,RLに基づくトレーディングアルゴリズムに基づくケーススタディを報告する。
その結果、RLは定量取引に有用なツールであり、従来の取引アルゴリズムよりも優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:10:10 GMT)
Predicting Bad Goods Risk Scores with ARIMA Time Series: A Novel Risk Assessment Approach [0.0] 本研究は,時系列予測後の粗悪品の計算を目的とした独自式と時系列ARIMAモデルを統合した新しいフレームワークを提案する。
有機ビールG1リッターの2022-2024のデータセット上で実験結果が検証され、提案手法が従来の統計モデルより優れていることが示された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 09:52:11 GMT)
Optimal Kernel Learning for Gaussian Process Models with High-Dimensional Input [0.0] 一部のシミュレーションモデルでは、出力は入力変数の小さな部分集合(能動変数と呼ばれる)によってのみ大きく影響される。
そこで本研究では,これらの能動変数を同定し,GPモデルの限界を克服し,システム理解を向上させるためのカーネル学習手法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:39:59 GMT)
Market Reaction to News Flows in Supply Chain Networks [0.0] 調査では、世界中の上場企業と日本の上場企業の大規模なサンプルを用いている。
各ニュース記事の正のレベルと負のレベルはFinBERTによって決定される。
プラスニュースは、公表前のニュースで言及された企業の株価の変動率を上昇させる。
プラスニュースは、開示前後のサプライヤーやクライアントの株価も上昇させる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:05:00 GMT)
Mapping out AI Functions in Intelligent Disaster (Mis)Management and AI-Caused Disasters [0.0] 我々は、災害管理におけるAIの役割の概要と、インテリジェント災害管理におけるAIの利用に関する倫理的影響の可能性について概説する。
我々は、プライバシー侵害、偏見、差別など、災害管理におけるAI使用の倫理的影響を予防または緩和する特定の方法を精査する。
次に、IDMにおけるAI使用の倫理的影響の防止における政府の役割について議論し、その欠陥と課題を特定し評価する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:44:57 GMT)
Layer-Wise Evolution of Representations in Fine-Tuned Transformers: Insights from Sparse AutoEncoders [0.0] 微調整事前学習トランスは、特定のタスクにおけるベースモデルの性能を向上させるための強力な技術である。
本稿では,微細チューニングの基礎となるメカニズム,特にBERT変換器について考察する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:29:50 GMT)
LawPal : A Retrieval Augmented Generation Based System for Enhanced Legal Accessibility in India [0.0] インドにおける法的な知識へのアクセスは、認識の欠如、誤報、司法資源へのアクセスの制限によってしばしば妨げられる。
本稿では,ベクトルストア指向FAISSを用いたRAGに基づく法定チャットボットを提案する。
我々のモデルは、法律書、公式文書、インド憲法を含む広範なデータセットを用いて訓練されている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:45:47 GMT)
Lattice-Based Pruning in Recurrent Neural Networks via Poset Modeling [0.0] リカレントニューラルネットワーク(RNN)はシーケンスモデリングタスクの中心であるが、その高い計算複雑性はスケーラビリティとリアルタイムデプロイメントの課題を引き起こす。
本稿では,RNNを部分的に順序付けられた集合(命題)としてモデル化し,対応する依存格子を構成する新しいフレームワークを提案する。
既約ニューロンを同定することにより、格子ベースのプルーニングアルゴリズムは、冗長なニューロンを除去しながら、重要な接続を選択的に保持する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 10:11:38 GMT)
Intelligent Tutors Beyond K-12: An Observational Study of Adult Learner Engagement and Academic Impact [0.0] 本研究では,州立工業大学における成人学習者を対象に,新しい授業システム Apprentice Tutors の採用,利用パターン,有効性について検討した。
本研究は,教師間の知識コンポーネントのスキル改善を通じて,教師の関与の鍵となる時間的パターンを明らかにし,教師内での学習の証拠を提供するものである。
これらの結果は、知的家庭教師が成人学習者にとって有効なツールであり、この人口に対する長期的な影響についてさらなる研究を保証していることを示唆している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:36:22 GMT)
Image Current Detection of Electrons in a Room-Temperature Paul Trap [0.0] マイクロ波帯における室温ポールトラップ中の電子の電流検出について報告する。
この実験を低温で実施することで、ポールトラップ内の単一電子のイメージ電流の検出と基底状態の冷却が可能になる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 13:59:01 GMT)
Hyperparameter Optimization for Randomized Algorithms: A Case Study on Random Features [0.0] 本稿では,高次元に適応し,目的関数のランダム性に頑健なランダムな目的関数を提案する。
EKIは、高次元にスケーラブルで、目的関数のランダム性に対して堅牢な勾配のない粒子ベース複雑性である。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:03:00 GMT)
From Text to Space: Mapping Abstract Spatial Models in LLMs during a Grid-World Navigation Task [0.0] グリッドワールドナビゲーションタスクにおける大規模言語モデル(LLM)の性能と内部アクティベーションに及ぼすテキストベース空間表現の影響について検討する。
実験の結果, 空間のカルデシアン表現は, モデルサイズに比例して高い成功率と経路効率が得られることがわかった。
この研究は、LLMが空間情報をどのように処理するかの理解を深め、より解釈可能で堅牢なエージェントAIシステムの開発に有用な洞察を提供する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 19:09:01 GMT)
Exact solution for a class of quantum models of interacting bosons [0.0] 量子光学において、主焦点はハミルトニアンスペクトルではなく、初期状態の進化である。
本稿では、相互作用するボソンの量子モデルの幅広いクラスに適用可能な、状態進化問題を解決するための単純で一般的な方法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:18:27 GMT)
Ensemble RL through Classifier Models: Enhancing Risk-Return Trade-offs in Trading Strategies [0.0] 本稿では,金融取引戦略におけるアンサンブル強化学習(RL)モデルの利用について検討する。
本稿では,A2C,PPO,SACなどのRLアルゴリズムとSVM,決定木,ロジスティック回帰といった従来の分類器を組み合わせることにより,リスク・リターントレードオフを改善するために,異なる分類器群を統合する方法について検討する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:18:05 GMT)
Energy-Efficient Transformer Inference: Optimization Strategies for Time Series Classification [0.0] 本稿では,トランスアーキテクチャの構造化プルーニングと量子化手法に着目し,最適化手法の体系的検討を行う。
静的量子化は, 分類性能を維持しながらエネルギー消費を29.14%削減することを示した。
L1プルーニングは、精度の低下を最小限に抑えながら、推論速度が1.63%向上する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 16:04:56 GMT)
Efficient inference of quantum system parameters by Approximate Bayesian Computation [0.0] 本稿では,測定データのライブラリーからのサンプリングにより可能性を回避するための近似ベイズ計算(ABC)アルゴリズムを提案する。
本研究では,2レベル原子と光学系をリアルタイムに探索する際に発生する光検出クリックパターンの解釈にABCを適用した。
我々の研究は、量子デバイスと関連する測定方法が複雑でなくても、高速パラメータ推論が可能であることを実証している。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:44:28 GMT)
Diagnosing COVID-19 Severity from Chest X-Ray Images Using ViT and CNN Architectures [0.0] 3つのソースをマージすることで、大規模なCOVID重症度データセットを作成します。
事前訓練されたDenseNet161モデルは3つの重大度予測問題において最善を尽くした。
平均絶対誤差は0.5676であり, 放射線技師が予測した重症度と比較すると最も高い回帰率を示した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:50:42 GMT)
Design and Implementation of a Scalable Clinical Data Warehouse for Resource-Constrained Healthcare Systems [0.0] 本研究は、リソース制限設定における異種EHR統合のために設計された、スケーラブルでプライバシに制限された臨床データウェアハウスであるNCDWを提案する。
このフレームワークは、ICD-11やHL7 FHIRといった標準に適合するように、摂食層を変更することで、開発途上国のさまざまな医療環境に適応することができる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 18:19:30 GMT)
DeepSeek reshaping healthcare in China's tertiary hospitals [0.0] DeepSeekは、2025年1月から中国の第3次病院に広く展開されている、主要なAIシステムである。
継続的な技術進歩により、AIはゲノミクスや放射線学といったマルチモーダルなデータソースを統合することが期待されている。
医療におけるAIの未来は、透明な規制構造、業界協力、適応的なガバナンスフレームワークの開発に依存する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 22:09:17 GMT)
Deep learning approaches to surgical video segmentation and object detection: A Scoping Review [0.0] 2014年から2024年にかけて,解剖学的構造における意味的セグメンテーションと対象検出に関する研究のスコーピングレビューを行った。
第一の目的は,手術ビデオにおける意味的セグメンテーションの最先端性能を評価することである。
第2の目的は、DLモデルの検討、臨床応用への進歩、および手術ビデオにおける臓器・腫瘍の分節化に関する具体的な課題であった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 06:31:23 GMT)
Controlling Structured Output Representations from Attributes using Conditional Generative Models [0.0] 本稿では,条件付き変分オートエンコーダアーキテクチャを再現し,属性を条件付き画像でトレーニングする。
毛髪の色や眼鏡などの特徴の異なる新しい顔と、異なる鳥類種のサンプルを創り出そうとする。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:13:19 GMT)
Commercial scanning nitrogen vacancy magnetometer in a closed-cycle cryostat [0.0] ダイヤモンド中の窒素空孔中心は、そのような用途に量子センシングを利用するための堅牢な手段であることが証明されている。
我々は,2Kから300Kのナノメートル分解能で試料の磁歪場を測定する装置を開発した。
この機器は光学、機械、電子機器を含む全ての機器を制御・同期するソフトウェアインタフェースを備えており、取得した情報をリアルタイムで分析する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 14:58:09 GMT)
Color Information-Based Automated Mask Generation for Detecting Underwater Atypical Glare Areas [0.0] 本研究では,教師なしK平均クラスタリングを用いた呼吸気泡検出アルゴリズムを提案する。
提案手法は水中画像から色データと相対空間座標を融合し,CLAHEを用いて雑音を緩和し,次いで画素クラスタリングを行い,反射領域を分離する。
実験により,水中画像中の呼吸気泡に対応する領域を効果的に検出でき,RGB,LAB,HSV色空間の併用により検出精度が著しく向上することが確認された。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 11:17:20 GMT)
Coarse Set Theory for AI Ethics and Decision-Making: A Mathematical Framework for Granular Evaluations [0.0] 粗い集合論(CST)は、粗い倫理(CE)を定式化する数学的枠組みを導入する
CEは人間の評価やAI分類システムでよく使われる粗粒度決定過程をモデル化する。
CSTは、完全に順序付けられた構造と粗いマッピングを使用して集合間の階層的関係を定義し、AIシステムが決定の粒度を動的に調整できるようにする。
この研究は、グレーディングシステム、自動レコメンデーション、リスクアセスメントにCSTを適用し、公正性を高め、バイアスを減らし、AIによる意思決定における透明性を向上させる可能性を実証する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 05:41:53 GMT)
Celestial Quantum Error Correction II: From Qudits to Celestial CFT [0.0] 我々は、CFT双対上の補正可能なゆらぎとして真空縮退とIR発散をエンコードする。
このフレームワークは、いわゆるクライン時空にキューディットの連鎖を埋め込むことによって物理的に動機づけられる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 08:28:00 GMT)
Blockchain-Based Secure Vehicle Auction System with Smart Contracts [0.0] ブロックチェーン技術のセキュリティを分析し、そのメリットを説明し、その使用を正当化します。
ブロックチェーンとスマートコントラクト技術に基づいて,車両情報を保管・取引する新たなシステムを設計する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:39:12 GMT)
Beyond Words: How Large Language Models Perform in Quantitative Management Problem-Solving [0.0] 本研究では,ゼロショット環境での量的管理決定問題に取り組む際に,Large Language Models (LLM) がどのように機能するかを検討する。
私たちは、20の異なる管理シナリオにわたる5つの主要なモデルによって生成された900のレスポンスを生成しました。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 12:39:39 GMT)
Active Learning Classification from a Signal Separation Perspective [0.0] 本稿では,信号分離の原理に触発された新しいクラスタリングと分類フレームワークを提案する。
実世界のサリナスとインドパインズのハイパースペクトルデータセット上で本手法の有効性を検証した。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:47:03 GMT)
Accelerating Sparse Graph Neural Networks with Tensor Core Optimization [0.0] グラフセンスネットワーク(GNN)は、ソーシャルネットワーク、バイオインフォマティクス、計算、レコメンデーションシステムなどの分野に広く応用されている。
従来の計算手法は、GNNの性能要求を満たすには不十分である。
最近の研究では、CoresとCoresを使った並列アクセラレーションが検討されているが、大きな課題が続いている。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:26:57 GMT)
A Systematic Review of Open Datasets Used in Text-to-Image (T2I) Gen AI Model Safety [0.0] テキスト・ツー・イメージ(T2I)生成AIの安全性を目的とした新しい研究は、しばしばトレーニングと評価のために公開されているデータセットに依存している。
本稿では,T2I研究で使用される主要なデータセットについて,その収集方法,構成,意味的および統語的多様性,およびデータセットにおける害タイプの品質,カバレッジ,分布について概説する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 00:59:04 GMT)
A Supervised Machine-Learning Approach For Turboshaft Engine Dynamic Modeling Under Real Flight Conditions [0.0] 本研究では、レオナルドのAW189P4プロトタイプのターボシャフトエンジンをモデル化するための異なるニューラルネットワークアーキテクチャについて検討する。
これらのモデルは、様々な操作を含む実飛行テストの広範なデータベースで訓練されている。
ニューラルネットワークのアプローチを補完するために,SINDy(Sparse Identification of Dynamics)を用いて低次元力学モデルを導出する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 17:24:18 GMT)
A Review of Artificial Intelligence Impacting Statistical Process Monitoring and Future Directions [0.0] 人工知能(AI)の最近の進歩は、統計プロセス監視(SPM)アプリケーションにAIを採用するという想像力を再活性化させた。
最終的な目的は、統計的プロセス監視(SPM)をスマートプロセス制御(SMPC)に変換することである。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 04:19:58 GMT)
A Quarter of a Century of Neuromorphic Architectures on FPGAs -- an Overview [0.0] FPGAベースのニューロモルフィックアーキテクチャは、コンピューティングの将来について有望な視点を示している。
我々は、研究者が設計に最も近い環境をよりよく理解するのに役立つ、これらのシステムのための新しい分類法を提案する。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 15:25:25 GMT)
A Matter-Wave Quantum Superposition of Inertial and Constant Acceleration Motions [0.0] 重ね合わせで進化する量子物質波の非相対論的ダイナミクスを計算する3つの異なる方法を提案する。
ゲージ変換として古典的に観測不可能な2つの相対位相は、物質波干渉実験で検出できる。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 21:20:17 GMT)
A Fine-Tuning Approach for T5 Using Knowledge Graphs to Address Complex Tasks [0.0] 本研究では知識グラフに基づくT5モデル微調整手法を提案する。
外部知識グラフを導入することにより、モデルの推論能力とコンテキスト理解能力を高める。
実験の結果,知識グラフに基づくT5モデルは,他のベースラインモデルよりもはるかに優れていることがわかった。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 07:53:37 GMT)
2-Adic quantum mechanics, continuous-time quantum walks, and the space discreteness [0.0] p進解析の技法を用いて、量子力学の厳密なバージョンを定式化することができる。
プランクスケールでの物理理論の実験的なテスト可能性は現在不可能である。
我々は、グラフ上の連続時間量子ウォークのスケーリング限界について、シュル「オーディンガー方程式」の大規模なクラスが記述されていることを示す。
論文参考訳(メタデータ) (Sun, 23 Feb 2025 03:10:55 GMT)