Libra-Leaderboard: Towards Responsible AI through a Balanced Leaderboard of Safety and Capability [114.8] Libra-Leaderboardは、LLMを性能と安全性のバランスよく評価することでランク付けするために設計された包括的なフレームワークである。
平均的なパフォーマンスと安全性の指標を持つ従来のアプローチとは異なり、Libra-Leaderboardは総合ランキングを計算するために、距離から最適スコア法を使用している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:03:44 GMT)
YuLan-Mini: An Open Data-efficient Language Model [111.0] 2.42Bパラメータを持つ高い能力を持つベースモデルであるYuLan-Miniは、同様のパラメータスケールのモデルで上位層のパフォーマンスを実現する。
注目すべきは、1.08TトークンでトレーニングされたYuLan-Miniは、はるかに多くのデータを必要とする業界主導のモデルに匹敵するパフォーマンスを達成することだ。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:07:47 GMT)
MaskCLIP++: A Mask-Based CLIP Fine-tuning Framework for Open-Vocabulary Image Segmentation [109.2] オープン語彙画像のセグメンテーションはマスク生成器と視覚言語モデルとの相乗効果によって進歩している。
MaskCLIP++と呼ばれる新しい微調整フレームワークを提案し、このフレームワークは生成されたマスクの代わりにグラウンドトルースマスクを使用する。
我々は,A-847,PC-459,A-150,PC-59,PAS-20データセット上で+1.7,+2.3,+2.1,+3.1,+0.3 mIoUの性能改善を実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:13:08 GMT)
An Instrumental Value for Data Production and its Application to Data Pricing [108.0] 本稿では,データ生成プロセスのインストゥルメンタルな価値を捉えるためのアプローチを開発する。
情報経済学における情報設計と信号の古典的概念とどのように結びつくかを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:53:57 GMT)
On the loss of context-awareness in general instruction fine-tuning [101.0] 事前訓練された大規模言語モデル(LLM)は、指示に従うために教師付き微調整のような訓練後の方法を必要とする。
SFT後におけるコンテキスト認識の喪失について検討し、コンテキスト認識をユーザが提供するコンテキストから情報を取り出し、理解する能力として定義する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:47:02 GMT)
VLABench: A Large-Scale Benchmark for Language-Conditioned Robotics Manipulation with Long-Horizon Reasoning Tasks [100.3] 本稿では、ユニバーサルLCMタスク学習を評価するためのオープンソースのベンチマークであるVLABenchを紹介する。
VLABenchは、タスクのカテゴリごとに強いランダム化と合計2000以上のオブジェクトを備えた、慎重に設計された100のタスクカテゴリを提供する。
このベンチマークは、メッシュとテクスチャ、空間関係、意味的命令、物理法則、知識伝達、推論の理解を含む複数の能力を評価する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:03:42 GMT)
ODMixer: Fine-grained Spatial-temporal MLP for Metro Origin-Destination Prediction [89.5] 具体的には、ODMixerは二重分岐構造を持ち、Channel Mixer、Multi-view Mixer、Bidirectional Trend Learnerが関与する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:53:17 GMT)
Dora: Sampling and Benchmarking for 3D Shape Variational Auto-Encoders [87.2] 提案する鋭いエッジサンプリング戦略と2つのクロスアテンション機構により,VAEの再構築を促進する新しいアプローチであるDora-VAEを提案する。
VAE再建の品質を体系的に評価するために,シャープエッジの密度を通じて形状複雑性を定量化するベンチマークであるDora-benchを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:02:29 GMT)
From Models to Microtheories: Distilling a Model's Topical Knowledge for Grounded Question Answering [86.4] マイクロ理論は、あるトピックに関するLMのコア知識をカプセル化した文である。
一般的なコーパス(例えばウィキペディア)に追加されると、マイクロ理論はコーパスに必ずしも存在しない重要なトピック情報を供給できることを示す。
また, 医療分野での人体評価において, 蒸留された微生物は, 局所的に重要な事実の濃度が有意に高くなることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:23:24 GMT)
Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation [82.0] 本稿では,KG(Amar)フレームワーク上での適応型マルチアスペクト検索手法を提案する。
この方法は、エンティティ、リレーション、サブグラフを含む知識を検索し、検索した各テキストを即時埋め込みに変換する。
提案手法は2つの共通データセットに対して最先端の性能を達成した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:38:04 GMT)
DepthLab: From Partial to Complete [80.6] 不足する値は、幅広いアプリケーションにわたる深度データにとって共通の課題である。
この作業は、イメージ拡散プリエントを利用した基礎深度塗装モデルであるDepthLabと、このギャップを埋めるものだ。
提案手法は,3Dシーンのインペイント,テキストから3Dシーン生成,DUST3Rによるスパースビュー再構成,LiDAR深度補完など,様々なダウンストリームタスクにおいて有用であることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:16:38 GMT)
Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models [80.0] オリエント・アプライシング(Orient Anything)は、1つの画像でオブジェクトの向きを推定するために設計された最初のエキスパートで基礎的なモデルである。
3Dオブジェクトの前面にアノテートするパイプラインを開発することで、正確な向きのアノテーションで2Mイメージを収集する。
本モデルでは,レンダリング画像と実画像の両方において,最先端の向き推定精度を実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:58:43 GMT)
The Key of Understanding Vision Tasks: Explanatory Instructions [77.4] コンピュータビジョン(CV)は自然言語処理(NLP)で観測されるゼロショットタスクの一般化をまだ完全に達成していない
本稿では,ゼロショットタスクの一般化において重要な障壁となる離散的・用語的タスク定義をCVが採用するという考えを考察する。
我々の仮説は、これらの用語的定義により、以前に見いだされたタスクを真に理解せずに、ディープモデルは新しいタスクに一般化するのに苦労する、というものである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:08:25 GMT)
Mulberry: Empowering MLLM with o1-like Reasoning and Reflection via Collective Monte Carlo Tree Search [74.5] 効率的な推論パス探索と学習のための集合モンテカルロ木探索(CoMCTS)を提案する。
我々はMulberry-260kを構築する。Mulberry-260kはマルチモーダルなデータセットで、各質問に対してリッチで明示的で明確に定義された推論ノードのツリーを持つ。
我々は、o1のようなステップバイステップ推論とリフレクション機能を備えたMLLMの一連のモデルであるMulberryを訓練するために、集合SFTを実行する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:07:51 GMT)
Enhancing Online Continual Learning with Plug-and-Play State Space Model and Class-Conditional Mixture of Discretization [72.8] オンライン連続学習(OCL)は、以前に学習したタスクの知識を保持しながら、一度だけ現れるデータストリームから新しいタスクを学習することを目指している。
既存の方法の多くはリプレイに依存しており、正規化や蒸留によるメモリ保持の強化に重点を置いている。
既存のほとんどのメソッドに組み込むことができ、適応性を直接改善できるプラグイン・アンド・プレイモジュールであるS6MODを導入する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:25:21 GMT)
Memory-Efficient Gradient Unrolling for Large-Scale Bi-level Optimization [71.4] 双レベル最適化は階層型機械学習問題に対処するための基本的な数学的枠組みとなっている。
従来の勾配に基づく二段階最適化アルゴリズムは、大規模アプリケーションの要求を満たすには不適である。
両レベル最適化のためのメタ勾配の偏りのない近似を実現するための$(textFG)2textU$を導入する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:44:10 GMT)
Switch-a-View: Few-Shot View Selection Learned from Edited Videos [71.0] ハウツービデオを作成する際に,各時点に表示すべき視点を自動的に選択するモデルであるSwitch-a-Viewを導入する。
このアプローチの鍵となる洞察は、ラベルのない、しかし、人間が編集したビデオサンプルから、そのようなモデルをトレーニングする方法です。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:16:43 GMT)
LLMTreeRec: Unleashing the Power of Large Language Models for Cold-Start Recommendations [67.6] 大規模言語モデル(LLM)は、言語分析タスクとしてレコメンデーションタスクをモデル化し、その膨大なオープンワールド知識に基づいてゼロショット結果を提供する。
しかし、アイテムコーパスの大規模化は、LLMに挑戦し、実際のレコメンデーションシステムにデプロイすることが不可能な、相当量のトークン消費につながる。
LLMレコメンデーションフレームワークLLMTreeRecを導入し、全ての項目をアイテムツリーに構造化し、LLMのアイテム検索の効率を向上させる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:48:26 GMT)
3DEnhancer: Consistent Multi-View Diffusion for 3D Enhancement [66.8] 本稿では,多視点遅延拡散モデルを用いて,多視点一貫性を維持しながら粗い3次元入力を強化する3DEnhancerを提案する。
既存のビデオベースアプローチとは異なり、我々のモデルは多様な視角のコヒーレンスを改善したシームレスなマルチビュー拡張をサポートする。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:36:34 GMT)
Adversarial Score identity Distillation: Rapidly Surpassing the Teacher in One Step [64.5] 生成品質と蒸留効率を向上させるSiDA(SiD with Adversarial Loss)を導入する。
SiDAは実画像と敵対的損失を取り入れており、実画像とSiDによって生成された画像を区別することができる。
SiDAは、スクラッチから蒸留した場合、前者よりもかなり早く収束する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:06:20 GMT)
Long-Form Speech Generation with Spoken Language Models [64.3] SpeechSSMは、テキスト中間子なしで1つの復号セッションで長い形式の音声を学習し、サンプリングする。
新しい埋め込みベースとLLM-judgedメトリクス、長さと時間による品質測定、長文音声処理と生成のための新しいベンチマークであるLibriSpeech-Long。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:56:46 GMT)
LatentCRF: Continuous CRF for Efficient Latent Diffusion [64.0] 本稿では,ニューラルネットワーク層として実装された連続条件ランダムフィールド(CRF)モデルであるLatentCRFを紹介する。
ラテントCRFは、ラテント拡散モデルにおける潜在ベクトル間の空間的および意味的関係をモデル化する。
LDMと比較して画像品質や多様性を損なうことなく,推測効率を33%向上させる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:51:11 GMT)
Improving Factuality with Explicit Working Memory [63.5] 大規模な言語モデルは、幻覚として知られる、事実的に不正確なコンテンツを生成することができる。
EWE(Explicit Working Memory)は、外部リソースからのリアルタイムフィードバックを受信するワーキングメモリを統合することで、長文テキスト生成における事実性を高める新しい手法である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:55:59 GMT)
Omni-MATH: A Universal Olympiad Level Mathematic Benchmark For Large Language Models [63.3] Olympiadレベルでの大規模言語モデルの数学的推論を評価するためのベンチマークを提案する。
既存のOlympiad関連のベンチマークとは違って、我々のデータセットは数学に特化しており、厳密な人間のアノテーションを使った4428の競合レベルの問題の膨大なコレクションを含んでいる。
実験の結果,最も先進的なモデルであるOpenAI o1-miniとOpenAI o1-previewでさえ,60.54%と52.55%の精度で,オリンピアードレベルの問題に悩まされ,オリンピアードレベルの数学的推論において重大な課題が浮き彫りにされていることがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:04:30 GMT)
PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models [63.1] テキスト,画像,構造化されていない3Dオブジェクトから意味のある部分からなる3Dオブジェクトを生成する新しいアプローチであるPartGenを紹介する。
提案手法は, 生成された実物および実物の3次元資産に対して評価し, セグメンテーションおよび部分抽出ベースラインを大きなマージンで上回っていることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:59:43 GMT)
ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.2] ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:46:23 GMT)
DrivingGPT: Unifying Driving World Modeling and Planning with Multi-modal Autoregressive Transformers [61.9] 我々は、インターリーブ画像とアクショントークンに基づくマルチモーダル駆動言語を導入し、共同世界モデリングと計画を学ぶためのDrivingGPTを開発した。
我々のDrivingGPTは、アクション条件付きビデオ生成とエンドツーエンドプランニングの両方において強力なパフォーマンスを示し、大規模なnuPlanとNAVSIMベンチマークにおいて強力なベースラインを達成しています。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:59:37 GMT)
Token Highlighter: Inspecting and Mitigating Jailbreak Prompts for Large Language Models [61.9] 大規模言語モデル(LLM)は、ユーザクエリに対する応答を提供するために、ChatGPTなどのサービスに統合されつつある。
本稿では,Token Highlighterという手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:10:02 GMT)
Uncertainty Quantification in Stereo Matching [61.7] ステレオマッチングのための新しいフレームワークとその不確実性定量化を提案する。
我々は、不確実性と推定データの尺度としてベイズリスクを採用し、個別に不確実性をモデル化する。
我々は,不確実性の少ないデータポイントを選択することにより,予測精度を向上させるために不確実性手法を適用した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:28:20 GMT)
GDM4MMIMO: Generative Diffusion Models for Massive MIMO Communications [61.6] 生成拡散モデル (generative diffusion model, GDM) は、生成モデルの最先端のファミリーの一つである。
GDMは、暗黙の事前知識と堅牢な一般化能力を学ぶ能力を示す。
ケーススタディは、GDMが有望な、効率的な超次元チャネルステートメント情報取得を促進する可能性を示唆している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:42:01 GMT)
CognitionCapturer: Decoding Visual Stimuli From Human EEG Signal With Multimodal Information [61.2] 脳波信号の表現にマルチモーダルデータを完全に活用する統合フレームワークであるCognitionCapturerを提案する。
具体的には、CognitionCapturerは、各モダリティに対してモダリティエキスパートを訓練し、EEGモダリティからモダリティ情報を抽出する。
このフレームワークは生成モデルの微調整を一切必要とせず、より多くのモダリティを組み込むように拡張することができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:03:44 GMT)
An Empirical Study: Extensive Deep Temporal Point Process [61.1] 本稿では,非同期イベントシーケンスを時間的プロセスでモデル化することの課題と最近の研究を概観する。
本稿では,多種類のイベント間の関係を生かしたGranger因果発見フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:36:33 GMT)
Map2Text: New Content Generation from Low-Dimensional Visualizations [60.0] 低次元の可視化における空間座標を新しい、一貫性のある、正確に整列されたテキストコンテンツに変換する新しいタスクであるMap2Textを紹介する。
これによってユーザは、これらの空間的レイアウトに埋め込まれた未発見情報を対話的に、直感的に探索し、ナビゲートすることができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:16:13 GMT)
Efficient Detection Framework Adaptation for Edge Computing: A Plug-and-play Neural Network Toolbox Enabling Edge Deployment [59.6] エッジコンピューティングは、時間に敏感なシナリオでディープラーニングベースのオブジェクト検出をデプロイするための重要なパラダイムとして登場した。
既存のエッジ検出手法では、軽量モデルによる検出精度のバランスの難しさ、適応性の制限、現実の検証の不十分といった課題に直面している。
本稿では,汎用的なプラグイン・アンド・プレイコンポーネントを用いてエッジ環境にオブジェクト検出モデルを適用するエッジ検出ツールボックス(ED-TOOLBOX)を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:28:10 GMT)
Segment-Based Attention Masking for GPTs [57.7] 因果マスキングは、生成プロセスを模倣して、全ての入力トークンにステップバイステップで適用される。
本研究は,プレフィルフェーズにおける既知ブロック構造に基づいて注意を隠蔽する。
LlamaやQwenのようなモデルに統合すると、最先端のパフォーマンスが一貫して達成される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:18:52 GMT)
A Statistical Framework for Ranking LLM-Based Chatbots [57.6] 本稿では、ペア比較分析における特定の課題に対処するために、重要な進歩を取り入れた統計フレームワークを提案する。
まず,人力比較のグルーピング処理能力を高める要因付きタイモデルを提案する。
第2に、フレームワークを拡張して、競合間の共分散層をモデル化することで、パフォーマンス関係に関するより深い洞察を可能にします。
第三に、パラメータ非特異性に起因する最適化の課題を、新しい制約を導入することで解決する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:54:19 GMT)
Efficient Long Context Language Model Retrieval with Compression [57.1] 情報検索のための新しいパラダイムとしてLong Context Language Models (LCLM)が登場した。
本稿では,LCLM検索に適した新しい圧縮手法を提案する。
また,CoLoRはテキスト内サイズを1.91倍に圧縮し,検索性能を6%向上することを示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:30:55 GMT)
SIGMA: Selective Gated Mamba for Sequential Recommendation [56.9] 最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:03:23 GMT)
Towards Modality Generalization: A Benchmark and Prospective Analysis [56.8] 本稿では,モダリティ・ジェネリゼーション(MG)について述べる。
マルチモーダルアルゴリズムを特徴とする包括的ベンチマークを提案し,一般化に着目した既存手法を適用した。
私たちの研究は、堅牢で適応可能なマルチモーダルモデルを進化させる基盤を提供し、現実的なシナリオで目に見えないモダリティを扱えるようにします。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:38:35 GMT)
CLIP4STR: A Simple Baseline for Scene Text Recognition with Pre-trained Vision-Language Model [55.3] CLIP4STRは,CLIPのイメージエンコーダとテキストエンコーダ上に構築された,シンプルで効果的なSTRメソッドである。
モデルサイズ、事前トレーニングデータ、トレーニングデータの観点からCLIP4STRをスケールし、13のSTRベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:27:37 GMT)
Neural Conformal Control for Time Series Forecasting [55.0] 非定常環境における適応性を高める時系列のニューラルネットワーク共形予測手法を提案する。
提案手法は,ニューラルネットワークエンコーダを用いた補助的マルチビューデータを活用することにより,望ましい対象範囲を達成するために設計されたニューラルネットワークコントローラとして機能する。
予測間隔の整合性に優れたキャリブレーションを組み合わさった手法は, 適用範囲と確率的精度の大幅な向上を実証的に示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:56:25 GMT)
Consistency Checks for Language Model Forecasters [54.6] 予測器の性能を,論理的に異なる質問に対する予測の整合性の観点から測定する。
我々は,一連の基本質問を生成し,これらの質問から整合性チェックをインスタンス化し,予測者の予測を導き,予測の整合性を測定する自動評価システムを構築した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:51:35 GMT)
DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation [54.3] DiTCtrlは、MM-DiTアーキテクチャの下で初めてトレーニング不要なマルチプロンプトビデオ生成手法である。
MM-DiTの注意機構を解析し、3次元のフルアテンションがUNetのような拡散モデルにおけるクロス/セルフアテンションブロックと同様の振る舞いを示す。
我々の注意深い設計に基づいて、DiTCtrlによって生成されたビデオは、複数のシーケンシャルプロンプトが与えられた滑らかな遷移と一貫した物体の動きを達成する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:51:19 GMT)
TableRAG: Million-Token Table Understanding with Language Models [53.0] TableRAG(TableRAG)は、LMベースのテーブル理解用に特別に設計された検索拡張生成(RAG)フレームワークである。
TableRAGは、スキーマとセル検索を組み合わせたクエリ拡張を活用して、LMにそれを提供する前に重要な情報をピンポイントする。
以上の結果から,TableRAGは検索精度が向上し,大規模テーブル理解における最先端性能が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:18:49 GMT)
Robust Semi-Supervised Learning in Open Environments [51.7] 半教師付き学習(SSL)は、ラベルが不足しているときにラベルのないデータを活用することで、パフォーマンスを向上させることを目的としている。
不整合なラベル付きデータを利用すると、大幅な性能劣化が発生することが報告されている。
本稿では,SSLにおけるラベル,特徴,データ分散の不整合に関する技術に焦点をあて,この研究の展開を簡潔に紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:13:01 GMT)
Failure Modes of LLMs for Causal Reasoning on Narratives [51.2] 本研究では,大言語モデル(LLM)の因果推論能力について,物語から因果関係を推定する代表的な問題から検討する。
最新の言語モデルでさえ、物語の提示とパラメトリック知識の両方において、信頼できないショートカットに依存していることがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:07:13 GMT)
A Phase Transition in Diffusion Models Reveals the Hierarchical Nature of Data [51.0] 最近の進歩は、拡散モデルが高品質な画像を生成することを示している。
我々はこの現象を階層的なデータ生成モデルで研究する。
t$の後に作用する後方拡散過程は相転移によって制御される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:17:39 GMT)
Toward Robust Hyper-Detailed Image Captioning: A Multiagent Approach and Dual Evaluation Metrics for Factuality and Coverage [50.8] MLLM(Multimodal large language model)は、非常に詳細なキャプションを生成するのに優れるが、幻覚を引き起こすことが多い。
我々は,LLM-MLLM協調を利用して与えられたキャプションを補正するマルチエージェント手法を提案する。
提案手法は, キャプションの精度を向上し, GPT-4Vによるキャプションの精度を向上する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:42:49 GMT)
Is Parameter Collision Hindering Continual Learning in LLMs? [50.6] 大規模言語モデル(LLM)は、複数のタスクを逐次学習する際に破滅的な忘れに悩まされることが多い。
CL問題に対処する上で,非衝突パラメータの構築はより重要な相互依存因子であることを示す。
低衝突速度を利用してLCMのCLを向上する単純なアプローチである非衝突低ランク適応(N-LoRA)を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:56:40 GMT)
An Automatic Graph Construction Framework based on Large Language Models for Recommendation [49.5] 本稿では,大規模言語モデルに基づく自動グラフ構築フレームワークであるAutoGraphを紹介する。
LLMはユーザ好みとアイテムの知識を推論し、セマンティックベクターとして符号化する。
潜在因子は、ユーザ/イテムノードをリンクする余分なノードとして組み込まれ、結果として、深いグローバルビューセマンティクスを持つグラフとなる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:51:29 GMT)
Exact Acceleration of Subgraph Graph Neural Networks by Eliminating Computation Redundancy [49.2] 本稿では,Ego-Nets-Fit-All(ENFA)について述べる。
ENFAはストレージ容量を29.0%から84.5%削減し、トレーニング効率を最大1.66倍向上させることができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:21:03 GMT)
SafeAligner: Safety Alignment against Jailbreak Attacks via Response Disparity Guidance [48.4] SafeAlignerは、ジェイルブレイク攻撃に対する防御を強化するためのデコード段階で実装された方法論である。
安全性を高めるために訓練されたセンチネルモデルと、よりリスクの高い応答を生成するように設計されたイントルーダモデルである。
SafeAlignerは有害なトークンの発生を低減しつつ、有益トークンの可能性を高めることができることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:26:36 GMT)
ICM-Assistant: Instruction-tuning Multimodal Large Language Models for Rule-based Explainable Image Content Moderation [48.2] 従来の画像コンテンツモデレーション(ICM)モデルは、様々な標準に対して正確なモデレーション決定を下すには不十分である。
我々は、簡潔な人間定義ルールを分解する新しいルールベースのデータセット生成パイプラインを設計する。
我々はルールベースのIMMのフレームワークでIMM-Assistantモデルを作成し、実際の実践で容易に適用できるようにします。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:45:36 GMT)
Free the Design Space of Equivariant Graph Neural Networks: High-Rank Irreducible Cartesian Tensor Decomposition and Bases of Equivariant Spaces [47.8] 未知カルトテンソル(ICT)は、同変グラフニューラルネットワークの設計において重要な役割を果たす。
ICT分解とこの同変空間の基底は高次テンソルでは得られない。
この研究は、ICTの分解行列を、小さくて手頃な価格の複雑さで$n=9$まで初めて得る。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:25:38 GMT)
Semantics Disentanglement and Composition for Versatile Codec toward both Human-eye Perception and Machine Vision Task [47.8] 本研究は,人間の目知覚と機械視タスクを同時に強化する革新的セマンティックス Disentanglement と COmposition versatile (DISCOVER) を導入する。
このアプローチはタスク毎のラベルの集合をマルチモーダルな大モデルで導き出し、グラウンドモデルを用いて正確なローカライズを行い、エンコーダ側の画像成分の包括的理解とアンタングル化を可能にする。
復号段階では、これらの符号化されたコンポーネントを生成モデルから先行して活用することにより、画像の総合的な再構成を実現し、人間の視覚知覚とマシンベースの分析タスクの両方のパフォーマンスを最適化する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:32:36 GMT)
Ensuring Consistency for In-Image Translation [47.2] 画像内の機械翻訳タスクでは、画像内に埋め込まれたテキストを翻訳し、翻訳結果を画像形式で表示する。
本稿では,このタスクにおいて,変換一貫性と画像生成一貫性という,2種類の一貫性の維持の必要性を提案する。
本稿では,HCIITと呼ばれる新しい2段階のフレームワークを紹介し,第1段階の多言語多言語大言語モデルを用いたテキスト画像翻訳と第2段階の拡散モデルによる画像バックフィルについて述べる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:50:03 GMT)
BIG-MoE: Bypass Isolated Gating MoE for Generalized Multimodal Face Anti-Spoofing [45.6] マルチモーダル・フェイス・アンチ・スプーフィング(FAS)は、プレゼンテーションアタックに対抗するために不可欠である。
既存の技術は、モダリティバイアスや不均衡、ドメインシフトといった問題に直面している。
本稿では,これらの問題を効果的に解決するためのMixture of Experts(MoE)モデルについて紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:28:28 GMT)
Can Large Language Models Improve the Adversarial Robustness of Graph Neural Networks? [45.6] グラフニューラルネットワーク(GNN)は、特にトポロジの摂動に対して、敵対的な攻撃に対して脆弱である。
LLMに基づく頑健なグラフ構造推論フレームワーク LLM4RGNN を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:08:45 GMT)
Decentralized Intelligence in GameFi: Embodied AI Agents and the Convergence of DeFi and Virtual Ecosystems [45.0] GameFiはゲームと分散ファイナンス(DeFi)の統合
私たちのエコシステムは、高度なエンボディAIエージェントをGameFiプラットフォームに統合することで、この状況を変革することを目的としています。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:56:00 GMT)
Revisiting Jailbreaking for Large Language Models: A Representation Engineering Perspective [43.9] 最近のジェイルブレイク攻撃の急増により、悪意のある入力に晒された場合、Large Language Models(LLM)の重大な脆弱性が明らかになった。
LLMの自己保護能力は,その表現空間内の特定の行動パターンと関係があることが示唆された。
これらのパターンは,数対のコントラストクエリで検出可能であることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:03:45 GMT)
Property Enhanced Instruction Tuning for Multi-task Molecule Generation with Large Language Models [43.4] 分子関連タスクのための大規模言語モデルを改善するための2段階のフレームワークPEITを提案する。
最初のステップでは、PEIT-GENと呼ばれるモデルを事前訓練するために、テキスト記述、SMILES、生化学的特性をマルチモーダル入力として使用します。
2番目のステップでは、既存のオープンソースLCMを合成データで微調整し、PEIT-LLMは分子キャプション、テキストベースの分子生成、分子特性予測、新たに提案したマルチ制約分子生成タスクを処理できる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:48:07 GMT)
ERVD: An Efficient and Robust ViT-Based Distillation Framework for Remote Sensing Image Retrieval [43.3] リモートセンシング画像検索のためのViTベースの蒸留フレームワーク
ERVD: リモートセンシング画像検索のための効率的でロバストなViTベースの蒸留フレームワーク。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:44:26 GMT)
LPViT: Low-Power Semi-structured Pruning for Vision Transformers [43.1] 画像解析タスクのための畳み込みニューラルネットワークの代替手段として、ビジョントランスフォーマー(ViT)が登場した。
ViTの重大な欠点の1つは、リソース集約性であり、メモリフットプリント、複雑性、消費電力が増加することである。
我々は,ViTの資源集約的な問題に対処するため,新しいブロック構造プルーニングを導入し,精度とハードウェアアクセラレーションのバランスのとれたトレードオフを提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:45:51 GMT)
LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding [42.8] LangSurfは3D言語フィールドとオブジェクトの表面を整列する言語組み込みのSurface Fieldである。
提案手法は,オブジェクトを3次元空間に分割することで,インスタンス認識,削除,編集におけるアプローチの有効性を高めることができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:48:55 GMT)
Comparing analytic and data-driven approaches to parameter identifiability: A power systems case study [41.9] 本稿では,パラメータ識別可能性の定量化のための分析的アプローチとデータ駆動手法を比較し,比較する研究について報告する。
我々は、ベンチマーク問題として、パワーシステム領域からのよく理解されたモデルである無限バス同期ジェネレータモデルを使用します。
これらの結果とデータ駆動型多様体学習スキーム:出力拡散(英語版) - マップと幾何調和(英語版) (Geometric Harmonics) を比較した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:33:12 GMT)
Efficient and Context-Aware Label Propagation for Zero-/Few-Shot Training-Free Adaptation of Vision-Language Model [41.6] 視覚言語モデル(VLM)は、さまざまな下流タスクに取り組むために、トレーニング済みの大きなモデルを活用することで、機械学習に革命をもたらした。
ラベル効率適応と推論のためのグラフベースの手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:15:00 GMT)
UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction [41.5] 統一知識グラフリンク予測のための階層表現学習フレームワーク(UniHR)を提案する。
階層型データ表現(HiDR)モジュールと,グラフエンコーダとしての階層型構造学習(HiSL)モジュールで構成される。
我々は,1種類のKGをベースラインとして設計したUniHRよりも優れた性能を示し,HiDR形式の強力な一般化能力とHiSLモジュールの有効性を示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:26:51 GMT)
Prompted Contextual Vectors for Spear-Phishing Detection [41.3] スパイアフィッシング攻撃は重大なセキュリティ上の課題を示す。
本稿では,新しい文書ベクトル化手法に基づく検出手法を提案する。
提案手法は, LLM生成したスピアフィッシングメールの識別において, 91%のF1スコアを達成する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:37:49 GMT)
exLong: Generating Exceptional Behavior Tests with Large Language Models [41.1] ExLongは、例外的な振る舞いテストを自動的に生成するフレームワークである。
これは、スローステートメントにつながるトレース、スローステートメントを保護する条件式、例外的でない振る舞いテストに関する推論を埋め込んでいる。
我々はexLongをテスト生成のための最先端モデル(CAT-LM)と最強基礎モデル(GPT-4o)の1つと比較する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 21:07:48 GMT)
Mitigating Label Noise using Prompt-Based Hyperbolic Meta-Learning in Open-Set Domain Generalization [40.8] オープンセットドメインの一般化は、よく知られたカテゴリを正確に予測するモデルを必要とする難しいタスクである。
ラベルノイズはモデル最適化を誤解させ、新しい領域におけるオープンセット認識の課題を悪化させる。
ラベル付き雑音認識メタラーニングのための双曲型カテゴリのプロトタイプを統合するフレームワークであるHyProMetaを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:00:23 GMT)
LongDocURL: a Comprehensive Multimodal Long Document Benchmark Integrating Understanding, Reasoning, and Locating [40.4] 大規模視覚言語モデル(LVLM)は文書理解能力を大幅に改善した。
既存の文書理解ベンチマークは少数のページしか処理できない。
半自動構築パイプラインを開発し,2,325の高品質な質問応答ペアを収集し,33,000ページ以上の文書を網羅する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:39:32 GMT)
Beyond the Known: Enhancing Open Set Domain Adaptation with Unknown Exploration [40.2] 信頼度の高い未知のインスタンスの集合を抽出することでOSDA技術を改善するための新しい手法を提案する。
我々は、未知のカテゴリの精度を高めながら、他の最先端手法と類似したHスコアを達成することができた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:27:35 GMT)
Exploring Human-in-the-Loop Test-Time Adaptation by Synergizing Active Learning and Model Selection [40.1] 既存のテスト時間適応(TTA)アプローチは、ラベルのないテストデータストリームでモデルに適応することが多い。
能動的学習とモデル選択を相乗化してHILTTAにアプローチすることを提案する。
提案手法は市販のTTA手法と互換性があることを5つのTTAデータセットで示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:47:35 GMT)
Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models [39.7] ファンデーションビジョン言語モデル(VLM)はマルチモーダル表現学習、理解、推論において強力な能力を示す。
VLMにアクションコンポーネントを注入することにより、自然にVLA(Vision-Language-Action Models)を形成し、有望な性能を示すことができる。
本稿では,VLAの性能に大きく影響を及ぼす重要な要因を明らかにするとともに,3つの重要な設計選択に答えることに注力する。
我々はVLAの新たなファミリーであるRoboVLMsを開発し、3つのシミュレーションタスクと実世界の実験で非常に少ない手動設計と新しい最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:43:45 GMT)
AEIOU: A Unified Defense Framework against NSFW Prompts in Text-to-Image Models [39.1] 悪意のあるユーザは、しばしばテキスト・ツー・イメージ(T2I)モデルを使用してNot-Safe-for-Work(NSFW)イメージを生成する。
本稿では,T2IモデルにおけるNSFWプロンプトに対する適応性,効率性,解釈性,最適化性,統一性を備えたフレームワークであるAEIOUを紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:17:45 GMT)
Are We in the AI-Generated Text World Already? Quantifying and Monitoring AIGT on Social Media [39.0] ソーシャルメディアプラットフォームはAIGT(AI-Generated Texts)の存在感が高まっている
その重要性にもかかわらず、ソーシャルメディアにおけるAIGTの流行を評価する体系的な研究はいまだに欠落している。
本稿では,オンラインソーシャルメディアプラットフォーム上でAIGTを定量化し,監視し,分析することを目的とする。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:04:54 GMT)
How Well Do LLMs Generate Code for Different Application Domains? Benchmark and Evaluation [38.9] MultiCodeBenchは、12のソフトウェア開発ドメインと15のプログラミング言語をカバーする2,400のプログラミングタスクで構成されている。
静的解析に基づく依存関係解析ツールを構築し,各タスクの真理における依存関係を抽出する。
我々は、異なるアプリケーション領域にまたがるLLMのコード生成性能を明らかにし、下流の開発者の実践的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:56:08 GMT)
3D Shape Tokenization [38.4] 連続的でコンパクトで、機械学習モデルに組み込むのが容易な3D表現であるShape Tokensを紹介します。
形状トークンは、3次元フローマッチングモデルにおける形状情報を表す条件ベクトルとして機能する。
様々な機械学習モデルにShape Tokensをアタッチすることで、新しい形状を生成し、画像を3Dに変換し、テキストや画像と3D形状をアライメントし、可変、ユーザ指定、解像度で直接形状をレンダリングすることができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:07:12 GMT)
Zero-resource Speech Translation and Recognition with LLMs [38.1] 我々は,ペア音声テキストデータを見たことのない言語において,多言語大言語モデル(LLM)を用いてSTとASRを実行することを提案する。
我々は、事前訓練された多言語音声エンコーダ、多言語LLM、およびLLMのトークン埋め込み空間に音声表現をマッピングする軽量適応モジュールを用いて、これを実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:37:11 GMT)
ChaI-TeA: A Benchmark for Evaluating Autocompletion of Interactions with LLM-based Chatbots [37.8] 本稿では,ChaI-TeA: CHat InTEraction Autocomplete; LLMに基づくインタラクションのための自動評価フレームワークを提案する。
フレームワークにはタスクの正式な定義が含まれており、適切なデータセットとメトリクスが組み合わされている。
フレームワークを使って、適切なデータセットとメトリクスと共にタスクを正式に定義した後、定義したオートコンプリートタスクで9つのモデルをテストします。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:03:36 GMT)
XRAG: eXamining the Core -- Benchmarking Foundational Components in Advanced Retrieval-Augmented Generation [37.8] Retrieval-augmented Generation (RAG) は、Large Language Models (LLMs) の生成能力と関連するデータの検索を相乗化する
我々は,高度なRAGモジュールの基本コンポーネントの性能を徹底的に評価する,オープンソースのモジュールであるXRAGを紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:32:13 GMT)
Beyond Gradient Averaging in Parallel Optimization: Improved Robustness through Gradient Agreement Filtering [36.9] 従来の分散データ-並列勾配勾配は、モデルパラメータの更新に使用されるマクロバッチを計算するために、マイクロバッチの勾配を平均化する。
本研究では,マイクログラディエント間のコサイン距離を計算し,グラディエンス分散を簡易かつ効果的に低減する手法を提案する。
従来のトレーニング手法と比較して,検証精度が最大18.2%向上するケースもある。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:00:11 GMT)
Can LLMs Obfuscate Code? A Systematic Analysis of Large Language Models into Assembly Code Obfuscation [36.1] マルウェアの作者は、マルウェアを検出しにくくするために、しばしばコードの難読化を用いる。
難読化されたコードを生成する既存のツールは、しばしば元のソースコードにアクセスする必要がある。
もし大きな言語モデル(LLM)が新しい難読化アセンブリコードを生成するとしたら?
もしそうなら、これはアンチウイルスエンジンにリスクをもたらし、攻撃者が新しい難読化パターンを作るための柔軟性を高める可能性がある。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:50:01 GMT)
Enhancing LLM-based Hatred and Toxicity Detection with Meta-Toxic Knowledge Graph [36.1] ドメイン固有の有毒な知識の欠如は、偽陰性を引き起こす。
有害な音声に対する大規模言語モデルの過度な感度は、偽陽性をもたらす。
メタ有害知識グラフ上でのグラフ検索を利用して,憎悪や毒性を検出するメタトックスと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:38:57 GMT)
MMFactory: A Universal Solution Search Engine for Vision-Language Tasks [35.3] MMFactoryは、様々な利用可能なモデルにまたがるソリューション検索エンジンのように振る舞う普遍的なフレームワークである。
タスク記述と少数のサンプル出力ペアに基づいて、MMFactoryは多様なプログラム型ソリューションのプールを提案することができる。
MMFactoryはまた、メトリクスを提案し、パフォーマンス/リソース特性をベンチマークすることで、ユーザが独自の設計制約を満たすソリューションを選択することができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:59:16 GMT)
Unlocking Global Optimality in Bilevel Optimization: A Pilot Study [34.0] 双方向最適化は、その重要な役割である非効率性と効率的な応用によって、関心の復活を目撃している。
まず、二段階最適化のための大域収束理論を確立することの課題について考察する。
大域的最適性のための2つの条件を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:17:53 GMT)
Double Spending Analysis of Nakamoto Consensus for Time-Varying Mining Rates with Ruin Theory [33.7] 我々は,中本コンセンサスに対する2倍支出の廃案理論モデルを,$k$-deep確認ルールの下で導入する。
時間変化のマイニングレートは、ピア間ネットワーク遅延の本質的な特性を捉えていると考えられる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:54:30 GMT)
TrackGo: A Flexible and Efficient Method for Controllable Video Generation [33.6] 条件付きビデオ生成に自由形マスクと矢印を利用する新しい手法であるTrackGoを紹介する。
また、時間的自己注意層にシームレスに統合されるように設計された効率的で軽量なアダプタである、制御実装のためのTrackAdapterを提案する。
実験の結果,新しい手法はTrackAdapterによって強化され,FVD,FID,MCスコアなどの重要な指標における最先端のパフォーマンスが得られた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:46:25 GMT)
The Road to Artificial SuperIntelligence: A Comprehensive Survey of Superalignment [33.3] 大規模言語モデル(LLMs)の出現は、人工超知能(ASI)の可能性を引き起こしている。
Superalignmentは2つの主要な目標 – 高品質なガイダンスシグナルを提供するための監視のスケーラビリティと、人間の価値との整合性を確保するための堅牢なガバナンス – に対処することを目指している。
具体的には、ASIの概念、それらがもたらす課題、そしてスーパーアライメント問題に対処する際の現在のアライメントパラダイムの限界について検討する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:54:15 GMT)
Unveiling Visual Perception in Language Models: An Attention Head Analysis Approach [33.2] MLLM(Multimodal Large Language Models)の最近の進歩は、視覚的理解の著しい進歩を示している。
本稿では,4つのモデルファミリーと4つのモデルスケールにまたがる系統的な調査により,この問題に対処することを目的とする。
分析の結果,これらの注意ヘッドの挙動,注意重みの分布,および入力中の視覚的トークンへの集中との間には強い相関関係が認められた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:31:24 GMT)
GPTEval: A Survey on Assessments of ChatGPT and GPT-4 [33.1] 本研究は,ChatGPTとGPT-4の事前評価を徹底的に分析する。
言語と推論能力、科学的知識、倫理的考察に重点を置いている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:58:16 GMT)
Towards Macro-AUC oriented Imbalanced Multi-Label Continual Learning [32.7] 継続学習(CL)においては、既存の研究は主にマルチクラス分類タスクに焦点を当てているが、MLL(Multi-Label Learning)の研究は限られている。
本稿では,マクロAUC指向MLCLの不均衡問題に対処するメモリリプレイ方式を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:30:20 GMT)
HashEvict: A Pre-Attention KV Cache Eviction Strategy using Locality-Sensitive Hashing [32.6] 本稿では,局所性に敏感なハッシュ(LSH)を用いてKVキャッシュを圧縮するアルゴリズムであるHashEvictを紹介する。
HashEvictは、推論、複数選択、長文検索、要約タスクのハイパフォーマンスを維持しながら、KVキャッシュを30%-70%圧縮することができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:04:45 GMT)
From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge [32.6] 人工知能(AI)と自然言語処理(NLP)において、長い間、評価と評価が重要な課題であった。
大規模言語モデル(LLM)の最近の進歩は"LLM-as-a-judge"パラダイムを刺激している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 21:46:31 GMT)
AIGT: AI Generative Table Based on Prompt [32.5] 我々は,AI生成テーブル(AIGT)を導入し,高品質な合成データを生成する。
20のパブリックデータセットと2つの実業界データセットのうち14の面で、最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:51:06 GMT)
AutoSculpt: A Pattern-based Model Auto-pruning Framework Using Reinforcement Learning and Graph Learning [32.1] AutoSculptは、ディープニューラルネットワーク(DNN)のためのパターンベースの自動プルーニングフレームワーク
既存の推論エンジンで認識可能なDNNアーキテクチャ内の規則的なパターンを自動的に識別し、特定する。
最大90%の刈り取り率と約18%の改善を達成し、全てのベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:05:51 GMT)
Tokens, the oft-overlooked appetizer: Large language models, the distributional hypothesis, and meaning [31.6] トークン化は多くの言語モデルの現在のアーキテクチャにおいて必要なコンポーネントである。
トークン化事前学習はバイアスやその他の望ましくないコンテンツのバックドアになり得ることを示す。
トークン化アルゴリズムの目的関数が大規模言語モデルの認知に影響を及ぼす証拠を中継する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:56:50 GMT)
Listening to Patients: A Framework of Detecting and Mitigating Patient Misreport for Medical Dialogue Generation [31.5] 医療対話システムは,患者の誤報告を効果的に検出し,軽減する方法という,2つの重要な課題に対処すべきである,と我々は主張する。
医療対話生成のための患者ミスレポートの検出・緩和フレームワークPaMisを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:46:41 GMT)
TPAoI: Ensuring Fresh Service Status at the Network Edge in Compute-First Networking [30.9] 計算ファーストネットワークでは、ネットワークエッジにおける最新かつ正確なステータス情報を維持することが、リモートサービスへの効果的なアクセスに不可欠である。
本稿では,サービス状態の鮮度を計測して更新決定を最適化することを目的とした新しい指標であるTPAoIを紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:33:44 GMT)
Improving robustness to corruptions with multiplicative weight perturbations [29.9] クリーン画像の精度を損なうことなく、広範囲の汚職に対してDNNの堅牢性を向上する代替手法を提案する。
まず、重み空間における乗法的摂動によって入力摂動が模倣できることを示す。
また,最近提案されたAdaptive Sharpness-Aware Minimization (ASAM) について検討し,逆乗法重み摂動下でのDNNの最適化を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:42:39 GMT)
Defining and Detecting the Defects of the Large Language Model-based Autonomous Agents [29.6] 本研究は,LLMエージェントの欠陥の同定と検出に焦点を当てた最初の研究である。
StackOverflowから6,854件の関連記事を収集し分析し、8種類のエージェント欠陥を定義しました。
以上の結果から,Agentableの総合精度は88.79%,リコール率は91.03%であった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:54:14 GMT)
Graph Structure Learning for Spatial-Temporal Imputation: Adapting to Node and Feature Scales [29.5] 空間時間インプット(GSLI)のためのマルチスケールグラフ構造学習フレームワークについて紹介する。
本フレームワークは,異なる特徴の異なるグローバル空間相関に対応するために,ノードスケールグラフ構造学習を包含する。
我々のフレームワークは、プロミネンスモデリングと統合され、計算過程においてより重要なノードと特徴を強調します。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:34:50 GMT)
EvalMuse-40K: A Reliable and Fine-Grained Benchmark with Comprehensive Human Annotations for Text-to-Image Generation Model Evaluation [29.2] 本研究では,EvalMuse-40Kベンチマークにコントリビュートし,画像テキストアライメントに関連するタスクに対して,微粒な人間のアノテーションを用いた40K画像テキストペアを収集する。
本稿では,T2Iモデルの画像テキストアライメント機能を評価するための2つの新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:08:25 GMT)
Enhancing the Performance of Neural Networks Through Causal Discovery and Integration of Domain Knowledge [28.6] 本研究では,観測変数間の階層的因果構造をニューラルネットワークに符号化し,予測性能を向上させる手法を開発した。
提案手法は、因果性インフォームドニューラルネットワーク(CINN)と呼ばれ、構造因果的知識をニューラルネットワークの層間設計にマッピングする3つのコヒーレントなステップを活用する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:31:05 GMT)
C2F-TP: A Coarse-to-Fine Denoising Framework for Uncertainty-Aware Trajectory Prediction [28.5] C2F-TPは不確実性を考慮した車両軌道予測のための粗大きめのデノケーションフレームワークである。
C2F-TPは、2段階の粗大な予測プロセスが革新的である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:46:32 GMT)
AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation [28.0] 大きな言語モデル(LLM)は、モバイルUIエージェントにエキサイティングな新しい進歩をもたらした。
必要なモデルサイズを減らす方法の1つは、小さなドメイン固有のモデルをカスタマイズすることです。
本稿では,UIタスクの自動化問題をコード生成問題に変換することを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:54:56 GMT)
Accelerating AIGC Services with Latent Action Diffusion Scheduling in Edge Networks [28.0] 現在のAIGCモデルは、主に集中型のフレームワーク内のコンテンツ品質に焦点を当てており、高いサービス遅延とネガティブなユーザエクスペリエンスをもたらす。
高速AIGCサービスのための複数のエッジサーバを編成する新しい遅延アクション拡散に基づくタスクスケジューリング手法であるLAD-TSを提案する。
また,AIGCモデルを改良したプロトタイプエッジシステムであるDEdgeAIを開発し,LAD-TS法の実装と評価を行った。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:40:13 GMT)
FedVCK: Non-IID Robust and Communication-Efficient Federated Learning via Valuable Condensed Knowledge for Medical Image Analysis [27.8] textbfValuable textbfCondensed textbfKnowledge (FedVCK)による新しいフェデレーション学習法を提案する。
我々は、限られた通信予算の中で、非IID問題に効果的に取り組むために、凝縮知識の品質を高め、モデルによって導かれる最も必要な知識を選択する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:20:43 GMT)
Weak Scaling Capability in Token Space: An Observation from Large Vision Language Model [27.6] 本研究では,視覚トークン数と視覚言語モデルの性能の関係について検討する。
本稿では,ユーザ質問トークンを表現に組み込んだ上で,トークン数を効率的に削減する新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:20:24 GMT)
Adapting Whisper for Code-Switching through Encoding Refining and Language-Aware Decoding [27.5] コードスイッチング自動音声認識(ASR)はアクセント、聴覚的類似性、シームレスな言語スイッチによる言語混乱による課題に直面している。
我々は,大規模多言語事前学習音声認識モデルであるWhisperを,エンコーダ部とデコーダ部の両方からCSに適応させる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:08:22 GMT)
Underwater Image Restoration via Polymorphic Large Kernel CNNs [27.4] 水中画像復元(UIR)は、水中環境における画像の複雑な劣化のため、コンピュータビジョンにおいて難しい課題である。
ポリモルフィック大型カーネルCNNを利用した水中画像復元手法であるUIR-Poly Kernelを紹介する。
以上の結果から,設計の整った純粋なCNNアーキテクチャは,より複雑なモデルと効果的に競合することを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:32:27 GMT)
Cluster-wise Graph Transformer with Dual-granularity Kernelized Attention [27.3] グラフを,各クラスタを1つの埋め込みに圧縮することなく,相互接続したノード集合のネットワークとして想定する。
これらのノード間の効果的な情報伝達を実現するために,ノード間クラスタアテンション(N2C-Attn)機構を提案する。
N2C-Attnがクエリとキーの2レベル特徴マップを組み合わせる方法を示し、二重粒度情報をマージする能力を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:50:44 GMT)
Distilling Fine-grained Sentiment Understanding from Large Language Models [27.0] きめ細かい感情分析(FSA)は、膨大な意見テキストからユーザー意見を抽出し、要約することを目的としている。
本稿では,大言語モデル(LLM)から小言語モデル(SLM)への微粒な感情理解の蒸留について検討する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:05:26 GMT)
Hierarchical Classification Auxiliary Network for Time Series Forecasting [26.9] 本稿では,時系列値をトークン化して,クロスエントロピー損失による予測モデルをトレーニングする手法を提案する。
HCANは、異なる階層レベルで多粒度高エントロピー特徴を統合する。
HCANと最先端の予測モデルを統合する実験は、いくつかの実世界のデータセットのベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:28:41 GMT)
Spatio-Temporal Fuzzy-oriented Multi-Modal Meta-Learning for Fine-grained Emotion Recognition [26.9] 細粒度感情認識(FER)は、疾患診断、パーソナライズされたレコメンデーション、マルチメディアマイニングなど、様々な分野で重要な役割を果たしている。
既存のFERメソッドは、現実の応用において3つの重要な課題に直面している: (i) 感情は複雑で時間を要するため正確性を確保するために、大量の注釈付きデータに依存している; (ii) サンプリング期間内の時間的相関が同じであると仮定するため、感情パターンの変化に起因する時間的不均一性を捉えることができない; (iii) 異なるFERシナリオの空間的不均一性、すなわち、感情の分布を考慮しない。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:50:55 GMT)
Video-Panda: Parameter-efficient Alignment for Encoder-free Video-Language Models [26.9] 現在のビデオモデルは、通常、重い画像エンコーダ(300M-1.1Bパラメータ)またはビデオエンコーダ(1B-1.4Bパラメータ)に依存している。
本稿では,ビデオ入力を直接処理する時空間アライメントブロック(STAB)を提案する。
本モデルでは,標準ベンチマークによるオープンエンドビデオ質問応答に対して,エンコーダに基づくアプローチに匹敵する,あるいは優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:59:56 GMT)
An Ensemble Approach to Short-form Video Quality Assessment Using Multimodal LLM [26.6] 多様なコンテンツ、編集スタイル、アーティファクトを特徴とするショートフォームビデオは、学習ベースのブラインドビデオ品質評価モデルに挑戦する。
本稿では,事前学習したマルチモーダル大言語モデルを短時間のビデオ品質評価に有効活用することに焦点を当てる。
本稿では,MLLMと最先端BVQAモデルからの予測を適応的に統合する,軽量な学習ベースアンサンブル手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:13:10 GMT)
Croc: Pretraining Large Multimodal Models with Cross-Modal Comprehension [26.2] 本稿では,Large Language Models (LLM) のための新しい事前学習パラダイムを提案し,その視覚的理解能力を高める。
具体的には、動的に学習可能なプロンプトトークンプールを設計し、ハンガリーのアルゴリズムを用いて、元のビジュアルトークンの一部を最も関連性の高いプロンプトトークンに置き換える。
我々はCrocと呼ばれる新しい基礎モデルを提案し、大規模な視覚言語ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:27:45 GMT)
Guided Real Image Dehazing using YCbCr Color Space [25.8] 本稿では, YCbCr のRGB よりも優れた構造特性を生かした新規な構造ガイドデハジングネットワーク (SGDN) を提案する。
効果的な教師付き学習のために,実世界適応型Hazeデータセットを導入する。
実験により,本手法は複数の実世界の煙・煙・煙のデータセットにまたがって既存の最先端手法を超越していることが示された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:18:19 GMT)
Multimodal joint prediction of traffic spatial-temporal data with graph sparse attention mechanism and bidirectional temporal convolutional network [25.5] 本稿では,二方向時間畳み込みネットワーク(GSABT)を用いたグラフスパース注意機構(Graph Sparse Attention Mechanism)を提案する。
自己注意重みを乗じて空間的局所的特徴を捉えるマルチモーダルグラフを用いて,空間的グローバルな特徴を得るためにTop-Uスパースアテンション機構を用いる。
我々は空間次元と時間次元の両方に柔軟に拡張できる多モード共同予測フレームワークを設計した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:57:52 GMT)
SpikeGS: Reconstruct 3D scene via fast-moving bio-inspired sensors [25.5] Spike Gausian Splatting (SpikeGS)は、スパイクストリームを3DGSパイプラインに統合し、素早く動くバイオインスパイアされたカメラで3Dシーンを再構築するフレームワークである。
SpikeGSは、高時間分解能から詳細な幾何学とテクスチャを抽出するが、スパイクストリームを欠いたテクスチャは、1秒でキャプチャされた3Dシーンを再構成する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:15:48 GMT)
Age Optimal Sampling for Unreliable Channels under Unknown Channel Statistics [25.0] 本研究では,センサが受信機にステータスを転送するシステムについて検討し,受信機は信頼性の高いチャネルを介して送信結果をセンサに送信する。
受信機におけるステータス情報のタイムラインを評価するために、Age of Informationのメトリクスを用いる。
この問題を解決するためにRobins-Monroアルゴリズムを提案し、最適しきい値をほぼ確実に近似できることを実証する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:06:22 GMT)
GUI Testing Arena: A Unified Benchmark for Advancing Autonomous GUI Testing Agent [25.0] 自動GUIテストのプロセス全体を評価するための,形式化された総合的な環境を提案する。
テストプロセスは、テスト意図の生成、テストタスクの実行、GUI欠陥検出という、3つの重要なサブタスクに分割します。
実際のモバイルアプリケーション、人工的に注入された欠陥を持つモバイルアプリケーション、合成データという3つのデータタイプを使用して、異なるモデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:41:47 GMT)
RaCMC: Residual-Aware Compensation Network with Multi-Granularity Constraints for Fake News Detection [24.9] マルチモーダルフェイクニュース検出は、実ニュースや偽ニュースを自動的に識別することを目的としており、このような誤報による有害な影響を軽減している。
疑似ニュース検出のための複数粒度制約を持つ残差認識型補償ネットワークを提案する。
Weibo17、Politfact、GossipCopを含む3つの公開データセットの実験は、提案手法の優位性を明らかにしている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:08:29 GMT)
Addressing Spatial-Temporal Data Heterogeneity in Federated Continual Learning via Tail Anchor [24.7] フェデレートされた連続学習(FCL)により、各クライアントはタスクストリームからその知識を継続的に更新することができる。
本稿では,訓練可能なタイルアンカーと凍結した出力特性を混合して特徴空間における位置を調節するフェデレートタイルアンカー (FedTA) を提案する。
FedTAは既存のFCL法よりも優れているだけでなく、特徴の相対的な位置を効果的に保ち、空間的・時間的変化の影響を受けないままである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:35:40 GMT)
BS-LDM: Effective Bone Suppression in High-Resolution Chest X-Ray Images with Conditional Latent Diffusion Models [24.6] 診断精度を向上させるために骨抑制技術が開発されている。
代替として深層学習に基づく画像生成法が提案されている。
BS-LDMと呼ばれる高分解能CXR画像における骨抑制のためのエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:44:04 GMT)
CORE4D: A 4D Human-Object-Human Interaction Dataset for Collaborative Object REarrangement [24.3] 我々は,新しい大規模4次元人間オブジェクト協調データセットであるCORE4Dを提案する。
現実世界で捉えた1K個の人-物-人間の動作シーケンスにより、我々は様々な新しい物体に動きを増強するための反復的な協調戦略を寄与することにより、CORE4Dを豊かにする。
CORE4Dが提供する広範囲な動きパターンから、人間と物体の相互作用を生成するための2つのタスク、すなわち人-物体の動き予測と相互作用合成をベンチマークする。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:33:24 GMT)
Multilingual Mathematical Reasoning: Advancing Open-Source LLMs in Hindi and English [24.3] 大言語モデル (LLMs) は言語的タスクでは優れているが、特にヒンディー語のような非英語言語では数学的推論に苦慮している。
OpenHathi 7B, LLaMA-2 7B, WizardMath 7B, Mistral 7B, LLeMMa 7B, MAmmoTH 7B, Gemini Pro, GPT-4 などのモデルについて, ゼロショット, 少数ショットチェーン・オブ・シント(CoT)法, 教師付き微調整法を用いて評価を行った。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:07:29 GMT)
Prediction Exposes Your Face: Black-box Model Inversion via Prediction Alignment [24.0] モデル反転(MI)攻撃は、その出力から対象モデルのプライベートトレーニングデータを再構成する。
ブラックボックスMI攻撃のための予測画像P2I手法を提案する。
本手法は,攻撃精度を8.5%向上し,データセットCelebAのクエリ数を99%削減する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:02:07 GMT)
Mining and Transferring Feature-Geometry Coherence for Unsupervised Point Cloud Registration [23.9] そこで本研究では,INEGERと呼ばれる新規な教師なし登録手法を提案し,信頼性の高い擬似ラベルマイニングに高レベルのコンテキスト情報を組み込む。
具体的には,教師がトレーニング中のデータの各ミニバッチに対して動的に適応し,信頼性の高い擬似ラベルを発見するための特徴幾何コヒーレンスマイニングモジュールを提案する。
最後に、密度不変の特徴を学習するための混合密度学生を紹介し、屋外シナリオにおける密度変動と低重なりに関する課題に対処する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:44:24 GMT)
Hardware-aware Circuit Cutting and Distributed Qubit Mapping for Connected Quantum Systems [23.9] DisMapは、チップからチップまでの分散量子システムのための、自己適応的でハードウェア対応のフレームワークである。
量子ビットノイズとエラー率を分析し、仮想システムトポロジを構築し、回路分割を誘導し、分散量子ビットマッピングを行う。
DisMapは20.8%の忠実度向上を実現し、SWAPオーバーヘッドを最大80.2%削減した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:32:06 GMT)
STITCH: Surface reconstrucTion using Implicit neural representations with Topology Constraints and persistent Homology [23.7] スパースおよび不規則に間隔を置いた点雲のニューラル暗黙表面再構成のための新しいアプローチSTITCHを提案する。
連続ホモロジーに基づく新しい微分可能なフレームワークを開発し、トポロジ的損失項を定式化し、1つの2次元多様体オブジェクトの先行を強制する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 22:55:35 GMT)
End-to-End Autonomous Driving through V2X Cooperation [23.4] 先駆的な協調自動運転フレームワークUniV2Xを紹介する。
UniV2Xは様々なビューにまたがるすべてのキー駆動モジュールをシームレスに統合ネットワークに統合する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:51:15 GMT)
Diverse Concept Proposals for Concept Bottleneck Models [23.4] 概念ボトルネックモデルは解釈可能な予測モデルであり、モデル信頼が医療などの重要な優先事項であるドメインでよく使用される。
提案手法は,データを説明する多くの予測概念を同定する。
複数の代替的な説明を提供することで、人間の専門家が彼らの期待に最も合うものを選ぶことができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:12:34 GMT)
L3TC: Leveraging RWKV for Learned Lossless Low-Complexity Text Compression [23.2] 我々はLearned Lossless Low-complexity Text Compression Method (L3TC)を紹介する。
RWKVモデルは、適度な圧縮比で高速な復号速度を達成する。
本稿では,頻繁なトークンをカバーするために,限定語彙を用いた外部認識トークン化手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:20:18 GMT)
Improving Multi-Step Reasoning Abilities of Large Language Models with Direct Advantage Policy Optimization [22.7] ステップレベルのオフライン強化学習アルゴリズムであるDAPO(Direct Advantage Policy Optimization)を導入する。
DAPOは、各ステップにおける推論精度を予測するために批判機能を使用し、それによって高密度信号を生成して生成戦略を洗練させる。
その結果,DAPO は SFT モデルと RL モデルの両方の数学的・コード的能力を効果的に向上し,DAPO の有効性を示すことができた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:39:35 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [22.6] 本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。
このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:29:17 GMT)
SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization [22.6] そこで我々は,より高速な4ビット行列乗算(Matmul)と精度向上手法を併用したSageAttention2を提案する。
実験により、我々のアプローチは様々なモデルにまたがって無視できるエンドツーエンドのメトリクス損失を引き起こすことを確認した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:50:14 GMT)
Sampling Bag of Views for Open-Vocabulary Object Detection [22.0] より強力で効率的な構成構造をサンプリングする概念に基づくアライメント手法を提案する。
オープンボキャブラリCOCOおよびLVISベンチマークにおいて, 従来より2.6ボックスAP50と0.5マスクAPの改良を実現している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:32:38 GMT)
Computer Vision-Driven Gesture Recognition: Toward Natural and Intuitive Human-Computer [21.7] 本研究では,コンピュータビジョンに基づく自然なジェスチャー認識の人間-コンピュータインタラクションへの応用について検討する。
手のひらと各指関節を接続することにより、手の動的かつ静的なジェスチャーモデルを形成する。
実験により,様々なジェスチャーを効果的に認識し,高い認識精度とリアルタイム応答能力を維持できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:13:20 GMT)
CoAM: Corpus of All-Type Multiword Expressions [21.5] MWE(Multiword Expression)は、複数の単語の慣用配列を指す。
MWE識別のための既存のデータセットは、矛盾なく注釈付けされ、単一の種類のMWEに制限されるか、サイズが制限される。
CoAMは、データ品質を向上させるために多段階プロセスを通じて構築された1.3K文のデータセットである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:09:33 GMT)
HTR-JAND: Handwritten Text Recognition with Joint Attention Network and Knowledge Distillation [21.3] 現在の手書き文字認識(HTR)システムは、歴史的文書の複雑さに苦慮している。
本稿では,高度特徴抽出と知識蒸留を組み合わせた効率的なHTRフレームワークであるHTR-JANDを紹介する。
文脈認識型T5後処理による認識精度の向上,特に歴史文書に有効である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:08:24 GMT)
SDM-Car: A Dataset for Small and Dim Moving Vehicles Detection in Satellite Videos [21.1] textbfSmall と textbfDim textbfMoving Cars のデータセットを構築し,衛星ビデオに多数のアノテーションを付加した。
ディム車両の検出精度を向上させるために,画像強調と注意機構に基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:43:27 GMT)
Prompt Tuning for Item Cold-start Recommendation [21.1] コールドスタートフェーズの成功は、アイテムが人気のあるものに移行できるかどうかを決定するため、オンラインレコメンデーションシステムにとって、アイテムコールドスタート問題は不可欠である。
自然言語処理(NLP)においてゼロまたは少数ショット問題に対処するために使用される強力なテクニックであるPrompt Learningは、同様の課題に対処するための推奨システムに適応している。
本稿では,この2つの問題を同時に解決するために,高価値な正のフィードバック(ピンナクルフィードバック)をプロンプト情報として活用することを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:38:19 GMT)
TAB: Transformer Attention Bottlenecks enable User Intervention and Debugging in Vision-Language Models [21.0] MHSA(Multi-head Self-attention)は、トランスフォーマーの主要なコンポーネントであり、言語と視覚の両方で広く使われているアーキテクチャである。
本稿では,従来のMHSAアーキテクチャの後に挿入された新しい1ヘッドトランスフォーマー・アテンション・ボトルネック層を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:28:07 GMT)
Learning Mutual Excitation for Hand-to-Hand and Human-to-Human Interaction Recognition [21.0] 相互励起グラフ畳み込み層を積み重ねた相互励起グラフ畳み込みネットワーク(me-GCN)を提案する。
Me-GCは各レイヤとグラフ畳み込み操作の各ステージで相互情報を学習する。
提案するme-GCは,最先端GCN法およびTransformer法より優れている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:20:02 GMT)
Band Prompting Aided SAR and Multi-Spectral Data Fusion Framework for Local Climate Zone Classification [20.7] 地域気候帯(LCZ)分類は、都市開発と地域気候の間の複雑な相互作用を理解する上で非常に重要である。
近年,LCZ分類性能を向上させるため,合成開口レーダ(SAR)とマルチスペクトルデータの統合に注目が集まっている。
本稿では、LCZ分類、すなわちBP-LCZに対して、補足データ融合フレームワークを促進させる新しいバンドを提案する。
実験結果は,提案したデータ融合フレームワークの有効性と優位性を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:40:07 GMT)
Smooth-Foley: Creating Continuous Sound for Video-to-Audio Generation Under Semantic Guidance [20.7] 本稿では,V2A生成モデルであるSmooth-Foleyを提案する。
フレームアダプタは高解像度のフレームワイドビデオ機能を統合し、テンポラリアダプタは、ビジュアルフレームとテキストラベルの類似性から得られる時間条件を統合する。
その結果,Smooth-Foleyは連続音のシナリオと一般的なシナリオの両方において,既存のモデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:29:46 GMT)
Simple is not Enough: Document-level Text Simplification using Readability and Coherence [20.6] 我々は,コヒーレンスなどの簡易性,可読性,談話性を考慮した簡易化モデルであるSimDocシステムを提案する。
私たちは、シンプルさ、可読性、一貫性をすべて考慮し、トレーニング中に複数の目標を含みます。
本稿では、文書レベルのTSコーパスを用いて、ゼロショット、少数ショット、微調整設定で提案したモデルを評価する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:05:21 GMT)
GNN-Transformer Cooperative Architecture for Trustworthy Graph Contrastive Learning [20.5] グラフ表現学習(GCL)は、グラフ表現学習の分野でホットな話題となっている。
本稿では,信頼できるグラフコントラスト学習のためのGNN変換器協調アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:02:24 GMT)
From Hallucinations to Facts: Enhancing Language Models with Curated Knowledge Graphs [20.4] 本稿では,知識グラフ(KG)を3重化して,経験的データの応答をアンカーすることで,言語モデル幻覚に対処する。
言語学的に流動的な応答を生成し、事実の正確さと文脈的関連性に深く根ざすことを目的としている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:16:10 GMT)
GeneSUM: Large Language Model-based Gene Summary Extraction [20.2] 大規模言語モデル(LLM)を利用した2段階自動遺伝子サプリメント抽出装置であるGeneSUMを提案する。
本手法は, 対象遺伝子文学の冗長性を検索し, 除去し, LLMを微調整し, 要約過程を洗練・合理化する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:20:43 GMT)
Chained Tuning Leads to Biased Forgetting [20.2] 下流タスクでトレーニングされたモデルは、反対の順序でトレーニングされたモデルよりもはるかに安全チューニングを忘れていることを示す。
忘れることが特定のグループの安全情報に悪影響を及ぼすことを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:43:57 GMT)
Investigating Large Language Models for Code Vulnerability Detection: An Experimental Study [20.1] システムのセキュリティ問題に対処し、予防するためには、コードの脆弱性検出が不可欠である。
従来の学習ベースの脆弱性検出方法は、微調整された中規模シーケンスモデルか、スクラッチから小さなニューラルネットワークをトレーニングするどちらかに依存していた。
大規模事前学習言語モデル(LLM)の最近の進歩は、様々なコードインテリジェンスタスクにおいて顕著な機能を示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:20:29 GMT)
Contrastive Representation for Interactive Recommendation [20.0] 対話型レコメンデーション(CRIR)のためのコントラスト表現を提案する。
CRIRは、明示的な相互作用から潜在的、高レベルな選好ランクの機能を効率的に抽出する。
また、CRIRを深層強化学習のバックボーンに適応させるためのデータ活用機構とエージェント訓練機構を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:39:23 GMT)
Towards Global AI Inclusivity: A Large-Scale Multilingual Terminology Dataset [19.9] GISTは2000年から2023年にかけての上位AIカンファレンス論文から抽出された5K語を含む、大規模な多言語AI用語データセットである。
この用語はアラビア語、中国語、フランス語、日本語、ロシア語に翻訳され、LLMを抽出するためのハイブリッドフレームワークと翻訳のための人間の専門知識を組み合わせたものである。
この研究は、AI用語リソースにおける重要なギャップに対処し、AI研究におけるグローバルな傾きとコラボレーションを促進することを目的としている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:50:18 GMT)
SMAC-Hard: Enabling Mixed Opponent Strategy Script and Self-play on SMAC [19.9] トレーニングの堅牢性と評価の包括性を高めるための新しいベンチマークであるSMAC-HARDを提案する。
SMAC-HARDは、カスタマイズ可能な対戦戦略、敵ポリシーのランダム化、MARLのセルフプレイのためのインターフェースをサポートする。
我々は、SMAC-HARD上で広く使われているアルゴリズムと最先端のアルゴリズムを広範囲に評価し、編集・混合戦略相手がもたらす重大な課題を明らかにした。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:16:34 GMT)
Sharper Error Bounds in Late Fusion Multi-view Clustering Using Eigenvalue Proportion [19.5] マルチビュークラスタリング(MVC)は、クラスタリング性能を向上させるために、複数のビューから補完的な情報を統合することを目的としている。
本稿では,複数カーネル$k$-meansの一般化誤差境界を解析するための新しい理論的枠組みを提案する。
雑音と冗長性を軽減するために,複数線形$k$-meansフレームワーク内の低域グラフフィルタリング方式を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:24:08 GMT)
Variational Diffusion Posterior Sampling with Midpoint Guidance [19.4] State-of-the-artアプローチは、後部をターゲットとする代理拡散モデルからサンプリングする問題として問題を定式化する。
前者は事前学習した拡散モデルのスコアに置き換えられるが、誘導項は推定する必要がある。
線形および非線形逆問題に対する広範な実験を通じて提案手法を検証する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:01:20 GMT)
SpikingSSMs: Learning Long Sequences with Sparse and Parallel Spiking State Space Models [19.0] 長いシーケンス学習のためのスパイキング状態空間モデル(SpikingSSM)を開発した。
樹状ニューロン構造にインスパイアされた我々は、神経力学を元のSSMブロックと階層的に統合する。
そこで本研究では,リセット後の膜電位を正確に予測し,学習可能なしきい値に適合する軽量サロゲート動的ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:25:27 GMT)
Flow Matching for Optimal Reaction Coordinates of Biomolecular System [19.0] 反応座標のフローマッチング (FMRC) は, 生体分子可逆力学における最適反応座標 (RC) の同定を目的とした新しい深層学習アルゴリズムである。
FMRCは、疎結合性と分解可能性の数学的原理に基づいている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:53:24 GMT)
Resolution-Robust 3D MRI Reconstruction with 2D Diffusion Priors: Diverse-Resolution Training Outperforms Interpolation [18.9] 2次元スライスで訓練された2次元拡散モデルが3次元MRI再構成に活用され始めている。
既存の方法では、ボクセルサイズが一定であり、ボクセルサイズが変化すると性能が低下する。
本稿では,2次元拡散先行画像を用いた高分解能3次元MRI再構成手法の提案と検討を行う。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:25:50 GMT)
Resolving Ethics Trade-offs in Implementing Responsible AI [18.9] 初歩的なものから複雑なものまで、トレードオフを通じて緊張に対処するための5つのアプローチをカバーします。
いずれのアプローチも、すべての組織、システム、アプリケーションに適していない可能性が高い。
i)緊張の積極的な識別、(ii)倫理的側面の優先順位付けと重み付け、(iii)トレードオフ決定の正当化と文書化からなる枠組みを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:25:21 GMT)
BlockEmulator: An Emulator Enabling to Test Blockchain Sharding Protocols [18.8] BlockEmulatorはブロックチェーンシャーディングメカニズムをエミュレートするための実験的なプラットフォームである。
軽量なブロックチェーンアーキテクチャを採用しており、開発者は新しいプロトコルやメカニズムの実装のみに集中できる。
GithubでBlockEmulatorをオープンソース化しました。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:54:50 GMT)
Unsupervised UAV 3D Trajectories Estimation with Sparse Point Clouds [18.5] 本稿では,時空間シーケンス処理を用いたコスト効率,教師なしUAV検出手法を提案する。
CVPR 2024 UG2+ Challengeの4位にランクインした。
我々は、研究コミュニティ.com/lianghanfang/UnLiDAR-UAV-Estのすべての設計、コード、サンプルデータをオープンソース化する予定です。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:42:13 GMT)
FloNa: Floor Plan Guided Embodied Visual Navigation [17.9] 人間は自然に不慣れな環境で移動するためのフロアプランに頼っている。
既存のビジュアルナビゲーション設定は、この貴重な事前知識を見落としている。
我々はフロアプランビジュアルナビゲーション(FloNa)を紹介し、フロアプランを具体化ビジュアルナビゲーションに組み込む最初の試みである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:42:25 GMT)
ZeroHSI: Zero-Shot 4D Human-Scene Interaction by Video Generation [17.4] 我々は,映像生成とニューラルヒューマンレンダリングを統合することで,ゼロショット4次元人間とシーンのインタラクション合成を可能にする新しいアプローチであるZeroHSIを提案する。
我々の重要な洞察は、最先端のビデオ生成モデルで学んだリッチな動きの先行きを利用して、膨大な量の人間の動きと相互作用を訓練し、異なるレンダリングを使って人間とシーンのインタラクションを再構築することである。
室内および屋外の様々な場面の様々な種類の編集されたデータセットに対して,ZeroHSIの評価を行い,多種多様かつ文脈的に適切なヒューマン・シーンのインタラクションを生成できることを実証した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:55:38 GMT)
Ultra-Low Complexity On-Orbit Compression for Remote Sensing Imagery via Block Modulated Imaging [17.3] 本稿では,リモートセンシング画像圧縮における圧縮センシングの研究を前進させる。
BMI(Block Modulated Imaging)は、1回の露光しか必要とせず、画像取得速度を大幅に向上させる。
本稿では,BMIフレームワークで圧縮された画像の再構成に特化して設計された新しい復号化ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:18:00 GMT)
LangYa: Revolutionizing Cross-Spatiotemporal Ocean Forecasting [17.1] 海洋予報システムであるLangYaを紹介した。
結果は、LangYaが1日から7日間のリードタイムで1つのモデルで予測できることを示した。
既存の数値およびAIベースの海洋予測システムと比較して、LangYaはGlobal Ocean Reanalysis and Simulationバージョン12から27年間の地球海洋データを使用している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:14:39 GMT)
Horizon-Length Prediction: Advancing Fill-in-the-Middle Capabilities for Code Generation with Lookahead Planning [17.0] 本研究では,各ステップに残るミドルトークンの数をモデルに予測する学習目標として,Horizon-Length Prediction (HLP)を提案する。
HLPはファイルレベルとリポジトリレベルの異なるベンチマークでFIMのパフォーマンスを最大24%向上させ、非現実的なポストプロセッシング手法を使わずに改善する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:37:23 GMT)
Online Learning from Strategic Human Feedback in LLM Fine-Tuning [16.4] 人間からのフィードバックからの強化学習(RLHF)は、人間の好みに合わせるために、大規模言語モデル(LLM)を微調整する上で不可欠なステップとなっている。
LLMファインチューニングプロセスにおける戦略的ラベル付け者に対するオンライン学習機構について検討した。
我々は新しい動的ベイズゲームを定式化し、好みのアグリゲーションにおいて人間のラベルの重みを動的に調整する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:17:41 GMT)
Algorithm Design for Continual Learning in IoT Networks [16.4] 連続学習(CL)は、異なるタスクから連続的に生成されたストリーミングデータに対する新しいオンライン学習技術である。
実用的なIoTネットワークでは、データをサンプリングしてさまざまなタスクを学習する自動運転車は、タスクパターンの順序をルーティングし変更することができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:19:59 GMT)
Characterizations of Language Generation With Breadth [16.3] Kleinberg と Mullainathan [KM24] が導入した言語生成の限界について検討する。
KM24は、制限の任意の可算言語コレクションから文字列を生成するアルゴリズムを提案した。
正確な幅を持つ世代はAngluinの同定条件によって特徴づけられることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:24:43 GMT)
Inline-Amplification-Free Time Transfer Utilizing Waveform-Resolved Single-Photon Detection [16.2] 本稿では、波形分解単光子検出手法を提案し、パルス当たり平均光子数0.617の弱い伝送信号に対してトモグラフィーを実験的に実施する。
我々は, 従来の光検出器によって誘導される技術的下界を克服し, 平均速度1秒で95.68 ps, 192.58 psをそれぞれ200km, 300kmの時間偏差を達成した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:41:52 GMT)
Perfect Alignment May be Poisonous to Graph Contrastive Learning [15.7] Graph Contrastive Learning (GCL)は、正のペアの整列と負のペアの分離によってノード表現を学習することを目的としている。
本稿では,アップストリーム性能とダウンストリーム性能の関連性を確立することを目的とする。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:51:43 GMT)
INVESTORBENCH: A Benchmark for Financial Decision-Making Tasks with LLM-based Agent [15.6] InvestorBenchは、大規模言語モデル(LLM)ベースのエージェントを財務的な意思決定コンテキストで評価するためのベンチマークである。
株式、暗号通貨、ETFなどの単一株式を含む、さまざまな金融商品に適用可能な包括的なタスクスイートを提供する。
また,13種類のLDMをバックボーンモデルとして,エージェントフレームワークの推論と意思決定能力の評価を行った。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:22:33 GMT)
CloudLens: Modeling and Detecting Cloud Security Vulnerabilities [15.5] クラウドコンピューティングサービスは、データストレージ、処理、コラボレーションのためのスケーラブルで費用対効果の高いソリューションを提供する。
アクセス制御のミスコンフィグレーションが、クラウドアタックの主要な要因であることが多い。
プランナーは、クラウド内のそのような脆弱性を特定するために攻撃を生成する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:16:58 GMT)
Research on the Proximity Relationships of Psychosomatic Disease Knowledge Graph Modules Extracted by Large Language Models [15.5] 心身障害は、世界的な健康問題において大きな課題である。
我々はBERTモデルとエンティティタイプを確立し、9668トリプルの知識グラフを構築した。
疾患,症状,薬物モジュール間のネットワーク距離を解析した結果,疾患間のネットワーク距離が臨床症状,治療アプローチ,心理的メカニズムの類似度が高いこと,症状間のネットワーク距離が共起する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:24:01 GMT)
Multiple References with Meaningful Variations Improve Literary Machine Translation [15.4] これまでの研究により、合成パラフレーズを用いることで機械翻訳が向上することが示されている。
我々は,パラフレーズ間の意味的類似性を,低,中,高の3つのグループに分類する。
中・高意味の類似性のパラフレーズを使用することで、フィルタされていないデータセットよりも優れる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:49:12 GMT)
The Effectiveness of Local Updates for Decentralized Learning under Data Heterogeneity [15.4] DGT(Decentralized Gradient Tracking)とDGD(Decentralized Gradient Descent)の2つの基本的な分散最適化手法を再検討する。
ローカルDGTが通信複雑性を$tildemathcalO Big(fracLmu(K+1) + fracdelta + mumu (1 - rho) + fracrho (1 - rho)2 cdot fracL+ deltamuBig)$, %zhizeを達成することを証明した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:37:34 GMT)
Efficient Circuit Cutting and Scheduling in a Multi-Node Quantum System with Dynamic EPR Pairs [15.3] solはQiskitを使用して実装され、実量子ハードウェアと各種エミュレータの両方で評価される。
EC2Sは忠実度を最大16.7%向上させ、システム全体の支出を最大99.5%削減する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:59:54 GMT)
SlimGPT: Layer-wise Structured Pruning for Large Language Models [15.3] Batched Greedy Pruning for rapid and near-optimal Pruning
インクリメンタルプルーニング比(Incrmental Pruning Ratio) - 非一様プルーニング戦略で、性能劣化を低減する。
LLaMAベンチマークの実験結果から,SlimGPTは他の手法よりも優れ,最先端の結果が得られた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:49:50 GMT)
MiMoTable: A Multi-scale Spreadsheet Benchmark with Meta Operations for Table Reasoning [15.2] 我々はtextbfMeta textbfoperation for textbfTable reasoning, named as MiMoTable を用いた textbfMulttextbfi-scale spreadsheet ベンチマークを提案する。
まず、MiMoTableのテーブルは、実際のシナリオで使用されるスプレッドシートで、7つのドメインをカバーし、異なるタイプを含む。
既存のベンチマークの難易度を測定するための新しい視点として,MiMoTableにおける各質問の難易度を計測するための6つのカテゴリのメタ操作を用いた新しい基準を定義した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:43:42 GMT)
LiFT: Leveraging Human Feedback for Text-to-Video Model Alignment [15.1] 本稿では,T2Vモデルのアライメントにヒトのフィードバックを活用する新しい微調整手法LiFTを提案する。
我々は,報酬関数を効果的に学習するために,報酬モデルLiFT-Criticを訓練する。
最後に、学習した報酬関数を利用して、報酬重み付き確率を最大化し、T2Vモデルを整列する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:57:46 GMT)
FedGIG: Graph Inversion from Gradient in Federated Learning [15.1] 本稿では、まず、GAAがFGL(Federated Graph Learning)に与える影響を考察し、FedGIG(Graph Inversion from Gradient in Federated Learning)を紹介する。
FedGIGはグラフ構造化データに特化して設計された新しいGIA手法である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:52:21 GMT)
The Numerical Stability of Hyperbolic Representation Learning [15.1] 双曲空間に対する2つの一般的なモデル、すなわちポアンカーの球とローレンツ模型の極限を解析する。
我々は、このユークリッドパラメトリゼーションを双曲型超平面に拡張し、双曲型SVMの性能を向上させる能力を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:28:34 GMT)
Fast and Interpretable Mortality Risk Scores for Critical Care Patients [15.0] GroupFasterRiskは、解釈可能な死亡リスクスコアアルゴリズムである。
ドメインの専門家が選択できるような、同等に優れたモデルが多数生成されます。
GroupFasterRiskのモデルは、現在病院で使われているリスクスコアよりも優れており、ブラックボックスMLモデルと同等である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:19:29 GMT)
Counting-Stars: A Multi-evidence, Position-aware, and Scalable Benchmark for Evaluating Long-Context Large Language Models [14.9] textbfCounting-Starsは、長文LLMのマルチエビデンス検索能力を評価するために設計されたマルチエビデンス、位置認識、スケーラブルなベンチマークである。
我々は, GPT-4 Turbo, Gemini 1.5 Pro, Claude3 Opus, GLM-4, Moonshot-v1 などの長文 LLM の評価実験を行った。
Gemini 1.5 Proは、GPT-4 Turboは、様々なタスクで最も安定したパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:41:28 GMT)
MrSteve: Instruction-Following Agents in Minecraft with What-Where-When Memory [14.9] 我々はPlace Event Memory (PEM)を搭載した新しい低レベルコントローラMrSteveを紹介する。
PEMは、空間的およびイベントベースのデータを整理し、長距離タスクにおける効率的なリコールとナビゲーションを可能にする。
提案手法は既存の手法に比べてタスク解決と探索の効率を大幅に改善する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:44:32 GMT)
Mathematics and Machine Creativity: A Survey on Bridging Mathematics with AI [14.8] 本稿では,人工知能(AI)の数学的研究への応用について概観する。
近年のAIの発展、特に強化学習(RL)と大規模言語モデル(LLM)は、AIが数学に貢献する可能性を実証している。
この調査は、AIと数学の橋渡し、相互利益に関する洞察を提供し、より深い学際的理解を促進することを目的としている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:36:27 GMT)
KunServe: Elastic and Efficient Large Language Model Serving with Parameter-centric Memory Management [14.8] 大きな言語モデル(LLM)は、ロードバーストまたは長期要求下で、貴重なGPUメモリを簡単に絞り込むことができる。
KVCache中心のアプローチは、KVCacheのドロップ、マイグレーション、スワップによってロードスパイクを処理する。
本稿では,レプリケートされたパラメータを選択的に削除して,要求に貴重なメモリを残すパラメータ中心のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:07:46 GMT)
Neuron Empirical Gradient: Connecting Neurons' Linear Controllability and Representational Capacity [14.7] まず、ニューロン活性化と出力トークン確率の線形関係を明らかにする。
PLMにおけるニューロンの経験的勾配が、スキルニューロンの探索による一般的なタスク知識を符号化するかどうかを検討する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:01:24 GMT)
AdaCo: Overcoming Visual Foundation Model Noise in 3D Semantic Segmentation via Adaptive Label Correction [14.5] 本稿では,3次元セマンティックセグメンテーションのためのラベルのない新しい学習手法であるAdaptive Label Correction(AdaCo)を提案する。
AdaCoにはCLGM(Cross-modal Label Generation Module)が組み込まれている。
提案したAdaCoは,3次元セマンティックセグメンテーションタスクにおいて,ラベルなし学習ネットワークの性能制限を効果的に緩和することができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:12:31 GMT)
ErasableMask: A Robust and Erasable Privacy Protection Scheme against Black-box Face Recognition Models [14.1] ブラックボックスFRモデルに対する堅牢で消去可能なプライバシ保護スキームであるErasableMaskを提案する。
具体的には、EasableMaskは、ブラックボックス転送性を高める新しいメタ補助攻撃を導入している。
また、画像品質を劣化させることなく、保護された顔における意味的摂動の消去をサポートする摂動消去機構を提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:15:14 GMT)
SoK: On the Offensive Potential of AI [14.1] ますます多くの証拠が、AIが攻撃目的にも使われていることを示している。
現存する研究は、AIの攻撃的可能性の全体像を描けなかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:02:44 GMT)
On the Effectiveness of Adversarial Training on Malware Classifiers [14.1] 対人訓練(AT)は、対人攻撃に対する学習に基づく分類器の強化に広く応用されている。
従来の研究から、頑健性はATのタスク依存性であることが示唆されていた。
我々は、ATとデータ内の特定の要因によって引き起こされる相互に絡み合った役割を探索する必要がある、より複雑な問題であると主張している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:55:53 GMT)
FairLay-ML: Intuitive Debugging of Fairness in Data-Driven Social-Critical Software [13.5] データ駆動型ソリューションの妥当性を検証し,説明するためのツールであるFairLay-MLを提案する。
FairLay-MLは、データセット、トレーニングされたモデル、所定のデータポイントの決定のロジックを視覚化する。
開発データセットを超えたバグを見つけるための、反ファクトの公平性テストが組み込まれている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:00:36 GMT)
Semantic Hierarchical Prompt Tuning for Parameter-Efficient Fine-Tuning [13.4] Visual Prompt Tuningは、フル微調整に比べて優れたパフォーマンスで知られている。
船は性能を大幅に改善し、VTAB-1kタスクのVT-B/16バックボーンでVPTよりも精度が4.9%向上した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:07:26 GMT)
Clustering-based Image-Text Graph Matching for Domain Generalization [13.3] ドメイン不変の視覚表現は、未確認のタスクドメインにうまく一般化できるモデルをトレーニングするために重要である。
近年の研究では、テキスト記述には高レベルなクラス識別情報が含まれていることが示されている。
我々は、画像領域と対応するテキスト記述間の局所的なアライメントを利用して、ドメイン不変の機能を得ることを提唱する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:40:03 GMT)
LSAQ: Layer-Specific Adaptive Quantization for Large Language Model Deployment [13.2] LSAQ(Layer-Specific Adaptive Quantization)は,大規模言語モデル(LLM)の適応的量子化と動的展開を行うシステムである。
このシステムは、エッジデバイスのリソース可用性に応じて、リアルタイムに量子化戦略を適応的に調整し、異なる精度レベルを異なる重要性の層に割り当てる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:43:15 GMT)
Cross-Attention Graph Neural Networks for Inferring Gene Regulatory Networks with Skewed Degree Distribution [13.1] クロスアテンション複合デュアルグラフ埋め込みモデル(XATGRN)
我々のモデルは、様々なデータセットで既存の最先端メソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:17:31 GMT)
Text-Aware Adapter for Few-Shot Keyword Spotting [13.0] テキスト・アウェア・アダプタ(TA-adapter)と呼ばれる新しい数発転写学習手法を提案する。
実験では、TA-adapterは、Google Speech Commands V2データセットから35の異なるキーワードに対して、大幅なパフォーマンス向上を示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:54:40 GMT)
Go With the Flow: Fast Diffusion for Gaussian Mixture Models [13.0] Schr"odinger Bridges (SB) は、適切なコスト関数を最小化しながら、有限時間で与えられた初期分布を他の最終状態に分配する拡散過程である。
本稿では,ある分布から別の分布へシステムをステアリングするための一組のSBポリシーの潜在メトリゼーションを提案する。
オートエンコーダの空間における画像から画像への変換のような低次元問題におけるこのアプローチの可能性を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:30:14 GMT)
From Pairwise to Ranking: Climbing the Ladder to Ideal Collaborative Filtering with Pseudo-Ranking [13.0] 理想的なコラボレーティブフィルタリングモデルは、ユーザのすべての項目の完全なランキングから学習し、最適なトップKレコメンデーションを作成すべきである。
ほとんどのCFモデルは、完全なランク付けを近似するためにペアワイズ損失関数に依存しており、結果として大きな性能差が生じる。
そこで本研究では,従来のノイズ注入機構によって制御された擬似階調を導入し,ランキング情報の欠如に対処する擬似階調パラダイム(PRP)を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:01:16 GMT)
Distilled Decoding 1: One-step Sampling of Image Auto-regressive Models with Flow Matching [13.0] 自動回帰(AR)モデルは、テキストと画像生成において最先端のパフォーマンスを達成したが、トークン・バイ・トークン・プロセスにより、遅い生成に悩まされている。
トレーニング済みのARモデルは、1、2ステップでアウトプットを生成することができるのか?
本研究では,ガウス分布から事前学習されたARモデルの出力分布への決定論的マッピングを生成するために,フローマッチングを用いたDD(Distilled Decoding)を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:21:15 GMT)
M-Ped: Multi-Prompt Ensemble Decoding for Large Language Models [13.0] 本稿では,大規模言語モデルの生成品質を高めるために設計された,新しいマルチプロンプトアンサンブルデコーディング手法を提案する。
ユニークな入力である$X$を与えられた場合、確率分布を復号し導出するために、バッチモードで$X$のプロンプトの$n$をLLMに送信する。
各トークン予測に対して,この集約された確率を用いて,バッチ内の$n$確率分布を平均化し,トークンを生成することで,アンサンブル確率を算出する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:06:58 GMT)
Dense-Face: Personalized Face Generation Model via Dense Annotation Prediction [12.9] 本稿では,T2Iのパーソナライズ拡散モデルであるDense-Faceを提案する。
本手法は,画像テキストアライメント,アイデンティティ保存,ポーズ制御において,最先端ないし競争的な生成性能を実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:05:21 GMT)
Exploring Parameter-Efficient Fine-Tuning to Enable Foundation Models in Federated Learning [12.8] フェデレートラーニング(FL)は、ローカルデバイス上の生データに一元的にアクセスすることなく、モデルの協調的なトレーニングを可能にするための、有望なパラダイムとして登場した。
最近の最先端の事前訓練モデルは、より有能になりつつ、より多くのパラメータを持ち、"Foundation Models"として知られている。
FLでこれらの強力で手軽に利用できる事前訓練モデルが、通信負荷を同時に軽減しつつ、優れた性能を達成するためのソリューションを見つけることができるだろうか?
具体的には,FedPEFTの性能を,クライアントの安定性,データ分散,プライバシ設定の違いによって体系的に評価する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:57:39 GMT)
Distributed multi-parameter quantum metrology with a superconducting quantum network [12.8] 我々は、低損失配線を持つ超伝導量子ネットワークを用いて、非交換発電機に関連する複数の分散パラメータを推定する。
提案手法は,標準偏差の点から,遠隔ベクトル場の3成分全てを推定する古典的戦略よりも最大6.86dBの改善を実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:41:53 GMT)
GeAR: Graph-enhanced Agent for Retrieval-augmented Generation [12.8] 設計上、従来のスパース・リトリーバーや高密度リトリーバーはマルチホップ検索のシナリオにおいて課題に直面している。
本稿では, (i) グラフ拡張によりRAG性能を向上するGeARと, (ii) グラフ拡張を組み込んだエージェントフレームワークについて述べる。
本評価は,3つのマルチホップ質問応答データセットにおいて,GeARの優れた検索性能を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:45:22 GMT)
Tackling the Dynamicity in a Production LLM Serving System with SOTA Optimizations via Hybrid Prefill/Decode/Verify Scheduling on Efficient Meta-kernels [12.8] 本稿では,多機能なAscendネイティブ,エンドツーエンド生産型大規模言語モデル(LLM)サービスシステムであるXY-Serveを紹介する。
中心となる考え方は、計算をきめ細かいメタプリミティブに分解することで、ワークロードの変動を円滑にする抽象化メカニズムである。
GEMMでは,動的形状変化に適応する仮想パディング方式を導入し,高効率な固定タイルサイズGEMMプリミティブを用いた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:27:44 GMT)
scReader: Prompting Large Language Models to Interpret scRNA-seq Data [12.8] 本稿では,大規模言語モデルの一般的な知識機能と,単一セルオミクスデータ解釈のためのドメイン固有表現モデルを統合する,革新的なハイブリッドアプローチを提案する。
単細胞遺伝子レベルでの遺伝子発現データをプロンプトで入力することにより、様々な種および細胞タイプにわたる遺伝子発現の差分レベルに基づいて、細胞表現を効果的にモデル化する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:28:42 GMT)
Unlocking the Hidden Treasures: Enhancing Recommendations with Unlabeled Data [12.5] コラボレーティブ・フィルタリング(CF)はレコメンダ・システムの基盤となっている。
ニュートラル・ニュートラル・ネガティブ(PNN)学習パラダイムを新たに導入する。
PNNは複雑なユーザの好みを学習するための有望なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:07:55 GMT)
High-accuracy sampling from constrained spaces with the Metropolis-adjusted Preconditioned Langevin Algorithm [12.4] 本稿では,$mathbbRd$の適切な凸部分集合である対象分布から近似サンプリングを行う1次サンプリング法を提案する。
提案手法は,事前条件付きLangevinアルゴリズムの単一ステップで生成したマルコフ連鎖にメトロポリス・ハスティングスフィルタを適用した結果である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:21:23 GMT)
MinsStudio: A Streamlined Package for Minecraft AI Agent Development [12.3] Minecraftは、インテリジェンスとシーケンシャルな意思決定研究のための貴重なテストベッドとして登場した。
本稿では,Minecraftにおける具体的政策開発を効率化するオープンソースソフトウェアパッケージであるMineStudioについて述べる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:01:43 GMT)
Is Large Language Model Good at Triple Set Prediction? An Empirical Study [12.1] このフレームワークは、LLMベースのルールマイニングとLLMベースのトリプルセット予測で構成されている。
実験結果から,LSMが欠落した三重項を予測するために大量の事実知識に従わなければならない場合,幻覚が顕著に発生し,性能が著しく低下することが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:03:07 GMT)
GenAI Content Detection Task 2: AI vs. Human -- Academic Essay Authenticity Challenge [12.1] 学術エッセイ認証チャレンジ(Academic Essay Authenticity Challenge)は、2025年にコリングと共同で行われたGenAIコンテンツ検出共有タスクの一部として開催された。
この課題は、学術的な目的のために、機械生成対人間によるエッセイを検出することに焦点を当てている。
英語とアラビア語の2つの言語がある。
本稿では,タスクの定式化の概要,データセット構築プロセスの詳細,評価フレームワークについて説明する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:33:44 GMT)
Learning Randomized Reductions and Program Properties [12.0] Bitweenは、数値プログラムにおけるランダム化(自己)推論とプログラム特性の自動学習の方法とツールである。
我々は、これらの削減を学習するための理論的枠組みを確立し、科学および機械学習機能におけるBitweenの機能を評価するベンチマークスイートであるRSR-Benchを紹介した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:42:53 GMT)
OMG-HD: A High-Resolution AI Weather Model for End-to-End Forecasts from Observations [11.7] OMG-HDは、観測データソースから直接予測を行うように設計されたAIベースの高解像度天気予報モデルである。
RMSEは温度2mで最大13%,風速10mで17%,比湿度2mで48%,表面圧力で32%向上した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:46:50 GMT)
Unified Stochastic Framework for Neural Network Quantization and Pruning [11.7] 本稿では,パス追従アルゴリズムを用いて量子化とプルーニングを後処理する統合フレームワークを提案する。
提案手法は,経路追従量子化法(SPFQ)に基づいて,プルーニングおよび低ビット量子化方式の適用性を向上させる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:38:01 GMT)
Convolutional Prompting for Broad-Domain Retinal Vessel Segmentation [11.6] 広領域網膜血管分節(BD-RVS)のより困難な課題に挑戦する勇敢な試みを行っている。
本稿では,DCP(Dual Convoltuional Prompting)を提案する。
評価のために、ROSSA、FIVES、IOSTAR、PRIME-FP20、VAMPIREを含む5つのパブリックドメイン固有のデータセットを使用して、幅広いドメインセットを構築します。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:04:07 GMT)
Security Attacks on LLM-based Code Completion Tools [11.5] 大きな言語モデル(LLM)は、コード補完機能が大きく進歩し、新しい世代のコード補完ツール(LCCT)を生み出した。
LCCTには固有の特徴があり、複数の情報ソースを入力として統合し、自然言語の相互作用に対するコード提案を優先順位付けする。
本稿では、これらの特徴を利用して、脱獄とデータ抽出攻撃の訓練という、2つの重大なセキュリティリスクに対する攻撃手法を開発する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:04:50 GMT)
Stochastic Control for Fine-tuning Diffusion Models: Optimality, Regularity, and Convergence [11.4] 拡散モデルは生成モデリングの強力なツールとして登場してきた。
微調整拡散モデルのための制御フレームワークを提案する。
PI-FTは線形速度で大域収束することを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:55:46 GMT)
Expand VSR Benchmark for VLLM to Expertize in Spatial Rules [11.3] 視覚的空間推論は人間の認知の基本的な部分であり、クロスインスタンスの微妙な認識を必要とする。
視覚的位置推論に特化した視覚大言語モデル(VLLM)には、十分な量と品質評価と最適化データセットが不足している。
現状のVLLMでは,言語命令に対する過敏性や視覚的位置情報に対する過敏性の矛盾がみられた。
我々の知る限り、拡散モデルを用いて空間的に位置決めされた画像データを協調的に拡張し、元のビジュアルエンコーディングを統合した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:13:17 GMT)
Molly: Making Large Language Model Agents Solve Python Problem More Logically [11.3] モリーエージェントは、シナリオベースのインタラクションを通じて学習者の質問意図を解析する。
生成段階では、エージェントは生成されたレスポンスを反映して、実際のコンテンツと整合するだけでなく、ユーザのクエリに効果的に答えるようにします。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:08:38 GMT)
Scheme to Detect the Strong-to-weak Symmetry Breaking via Randomized Measurements [11.2] 最近の進歩は、新しい対称性を破るパターンを強調している。
強弱対称性の破れは、典型的にはR'enyi-2相関器のような多重レプリカ相関関数を用いて検出される。
本稿では,ランダム化計測ツールボックスを用いた実験において,強弱対称性の破れを検出するための実用的なプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:41:38 GMT)
Pirates of the RAG: Adaptively Attacking LLMs to Leak Knowledge Bases [11.1] 本稿では,RAGシステムにプライベート知識ベースを漏洩させるブラックボックス攻撃を提案する。
関連性に基づくメカニズムとアタッカーサイドのオープンソース LLM は、(隠された)知識ベースの大部分をリークする効果的なクエリの生成を好んでいる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:03:57 GMT)
Enhancing Space-time Video Super-resolution via Spatial-temporal Feature Interaction [11.0] 時空ビデオ超解像(STVSR)の目的は、ビデオのフレームレートと空間解像度の両方を増加させることである。
近年のアプローチでは、エンドツーエンドのディープニューラルネットワークを用いてSTVSRを解く。
本研究では,空間的・時間的相関を利用してSTVSRを強化する空間的・時間的特徴相互作用ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:40:58 GMT)
DeepCRCEval: Revisiting the Evaluation of Code Review Comment Generation [11.0] 本研究は,先行研究や開発者インタビューから得られた新しい基準を用いて,ベンチマークコメントを実証的に分析する。
評価フレームワークであるDeepCRCEvalは、人間の評価器とLarge Language Models(LLM)を統合し、現在の手法を総合的に再評価する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:53:54 GMT)
Human-Guided Image Generation for Expanding Small-Scale Training Image Datasets [10.9] 特定の実世界のアプリケーションにおけるコンピュータビジョンモデルの性能は、利用可能な少数の画像によって制限される。
より制御可能なデータセット拡張のためのヒューマンガイド画像生成法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:53:54 GMT)
Multi-Point Positional Insertion Tuning for Small Object Detection [10.9] 小さなオブジェクト検出は、画像内の小さなオブジェクトをローカライズし、分類することを目的としている。
訓練済みのオブジェクト検出モデルを微調整することは、計算量とメモリコストがかかる。
本稿では,小物体検出のためのパラメータ効率微調整(PEFT)手法であるMPIチューニングを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:04:47 GMT)
DAE-Fuse: An Adaptive Discriminative Autoencoder for Multi-Modality Image Fusion [10.7] DAE-Fuseは,鮮明で自然な融合画像を生成する2相識別型自動エンコーダフレームワークである。
静止画像からビデオ領域への画像融合技術の拡張を開拓した。
DaE-Fuseは、複数のベンチマークで最先端のパフォーマンスを実現し、医用画像融合のようなタスクに優れた一般化性を持つ。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:22:46 GMT)
An Attention-based Framework with Multistation Information for Earthquake Early Warnings [10.3] 本稿では,地震早期警報システムの強度予測のための深層学習型フレームワークであるSENSEを提案する。
SENSEモデルは、入力局の集合と各局の局所性固有の特性の関係を学習するように設計されている。
本研究は台湾と日本のデータセットに関する広範な実験を行った。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:18:17 GMT)
Exploring Facets of Language Generation in the Limit [10.2] 任意の可算言語コレクションは、その極限において非一様生成の強い特性を持つ生成子を持つことを示す。
我々は,[KM24]の生成アルゴリズムにおける妥当性と幅の緊張関係を,徹底的な生成の定義を導入して定式化する。
また,包括的生成が可能な言語コレクションの正確な特徴付けも提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:57:49 GMT)
Quantum circuit synthesis with SQiSW [10.1] iSWAPゲートの平方根としても知られるSQiSWゲートは、優れた実験性能のためにかなりの注目を集めている。
本研究では,8つのSQiSWゲートのみを用いたトフォリゲートの正確な合成手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:38:07 GMT)
Think or Remember? Detecting and Directing LLMs Towards Memorization or Generalization [10.1] 大規模言語モデル(LLM)における記憶と一般化の基礎的メカニズムについて検討する。
本研究は、特別に設計されたデータセットと実験スケールのLLMを活用したケーススタディとして機能する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:28:56 GMT)
Integrating Random Effects in Variational Autoencoders for Dimensionality Reduction of Correlated Data [10.0] LMMVAEは、従来のVAEラテントモデルを固定部品とランダム部品に分離する新しいモデルである。
その結果, 正方形復元誤差と負の可能性損失は, 未確認データに対して有意に改善した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:43:17 GMT)
UNet--: Memory-Efficient and Feature-Enhanced Network Architecture based on U-Net with Reduced Skip-Connections [9.9] エンコーダ、デコーダ、スキップ接続コンポーネントを備えたU-Netモデルは、様々な視覚タスクにおいて有効であることを示す。
復号ステージの前に、スキップ接続で使われる特徴マップをメモリ内に保持する必要がある。
本稿では,メモリ消費を削減し,ネットワーク性能を向上させるための機能マップを生成する汎用手法とアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:38:34 GMT)
COMO: Cross-Mamba Interaction and Offset-Guided Fusion for Multimodal Object Detection [9.9] 単一モードのオブジェクト検出タスクは、多種多様なシナリオに遭遇する際のパフォーマンス劣化を経験することが多い。
マルチモーダルオブジェクト検出タスクは、様々なモダリティからのデータを統合することで、オブジェクト機能に関するより包括的な情報を提供することができる。
本稿では,CrOss-Mamba相互作用とOffset-Guided融合フレームワークという新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:14:48 GMT)
Image Quality Assessment: Exploring Regional Heterogeneity via Response of Adaptive Multiple Quality Factors in Dictionary Space [9.8] 辞書空間における画像品質を表すための適応型多品質因子(AMqF)フレームワークを提案する。
アダプタを設計することで、フレームワークは人間の視覚知覚に最も適した品質要因を柔軟に分解することができる。
提案手法は、様々な種類の歪み画像を扱う場合、既存の最先端手法よりも優れている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:36:35 GMT)
Do Language Models Understand the Cognitive Tasks Given to Them? Investigations with the N-Back Paradigm [9.6] GPT 3.5の2-backタスクと3-backタスクのパフォーマンス低下は、人間のように動作するメモリ容量の限界を反映している、と我々は主張する。
これらのタスクにおける様々なパフォーマンスレベルのオープンソース言語モデルを解析することにより、タスク理解とタスクセットのメンテナンスの制限を反映していることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:06:52 GMT)
Uncertainty-Participation Context Consistency Learning for Semi-supervised Semantic Segmentation [9.5] 半教師付きセマンティックセグメンテーションは、広範囲なラベル付きデータへの依存を緩和する能力にかなりの注目を集めている。
本稿では、よりリッチな監視信号を探索するために、不確かさ参加型コンテキスト一貫性学習(UCCL)手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:15:44 GMT)
SurvAttack: Black-Box Attack On Survival Models through Ontology-Informed EHR Perturbation [9.5] 生存分析モデルのための新しいブラックボックス攻撃フレームワークであるSurvAttackを紹介する。
本研究は,患者の医療史を通じて,様々な相手行動を伴う医療コードを操作するアルゴリズムを特に開発する。
提案アルゴリズムは,サバイバルモデルを攻撃するための効率的なSA特異的戦略として用いられる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:35:42 GMT)
Singular Value Scaling: Efficient Generative Model Compression via Pruned Weights Refinement [9.5] 生成モデルは、しばしば支配的な特異ベクトルを示し、微調整効率を阻害し、最適以下の性能をもたらす。
SVS(Singular Value Scaling, Singular Value Scaling, SVS)は, 両モデルタイプに適用可能な, プレナードウェイトを精製する多用途技術である。
SVSは、追加のトレーニングコストなしでモデルタイプ間の圧縮性能を改善する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:52:45 GMT)
Elevating Software Trust: Unveiling and Quantifying the Risk Landscape [9.4] SAFER (Software Analysis Framework for Evaluating Risk) と呼ばれるリスク評価フレームワークを提案する。
このフレームワークは、ソフトウェアサプライチェーンのセキュリティリスクを定量化する動的でデータ駆動で適応可能なプロセスの必要性に基づいている。
以上の結果から,SAFERは主観性を軽減し,動的データ駆動重みとセキュリティリスクスコアを取得することが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:22:23 GMT)
Learning to Play Against Unknown Opponents [9.3] 本稿では,戦略的相手に対して,総和ゲームを繰り返し行う学習エージェントの問題点を考察する。
学習エージェントは、自身の支払機能を知っているが、相手の支払機能については不確実である。
エージェントは、自身の全ユーティリティを最大化するために、どのような学習アルゴリズムを実行するべきか?
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:05:06 GMT)
BEADs: Bias Evaluation Across Domains [9.2] Bias Evaluations Across Domains BEADsデータセットは、幅広いNLPタスクをサポートするように設計されています。
本論文の重要な焦点は,GPT4でアノテートされたゴールドラベルデータセットである。
この結果から,BEADは,このデータセットを微調整した場合に,多くのバイアスを効果的に識別できることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:08:40 GMT)
Time-Series Foundation Model for Value-at-Risk Forecasting [9.1] 広範囲で多様なデータセットで事前トレーニングされたファンデーションモデルは、比較的最小限のデータを持つゼロショット設定で使用できる。
TimesFMと呼ばれるGoogleのモデルの性能を従来のパラメトリックモデルと非パラメトリックモデルと比較する。
提案手法のバックテスト結果から,提案手法を改良したTimesFMモデルの方が従来手法より常に優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:23:54 GMT)
Advancing Deformable Medical Image Registration with Multi-axis Cross-covariance Attention [9.1] 変形可能な医用画像登録に最適化されたXCAベースの変圧器ブロックであるMulti-Axis XCA(MAXCA)を提案する。
MAXCAは、多軸設計により、局所的および拡張されたXCAを並列に適用することにより、高解像度画像特徴間のグローバルおよび局所的な長距離依存性をキャプチャすることができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:52:21 GMT)
Towards understanding how attention mechanism works in deep learning [8.8] 本研究では,古典的メトリクスとベクトル空間特性を用いて,多様体学習,クラスタリング,教師あり学習における類似性の計算過程について検討する。
自己認識機構を学習可能な擬似メトリック関数と類似性計算に基づく情報伝達プロセスに分解する。
本稿では,メトリック学習の概念を活用して,望ましいメトリクスをより効果的に学習できるようにすることにより,メトリックアテンションと呼ばれる改良されたアテンション機構を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:52:06 GMT)
Navigating Data Corruption in Machine Learning: Balancing Quality, Quantity, and Imputation Strategies [8.8] 欠落や騒々しいデータを含むデータの破損は、現実世界の機械学習において重大な課題を生じさせる。
本研究では,データ破損がモデル性能に与える影響について検討し,これらの効果を緩和するための戦略を探る。
データセットサイズの増加は軽減されるが,データ破損の影響を完全に克服することはできない。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:04:06 GMT)
From Contextual Data to Newsvendor Decisions: On the Actual Performance of Data-Driven Algorithms [8.7] 本研究では,過去のデータとの関連性と量が,データ駆動型ポリシーの性能に与える影響について検討する。
我々は,「密接な状況下で観察された過去の要求は,分布の密接な関係から生じると考える。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 22:09:41 GMT)
TextMatch: Enhancing Image-Text Consistency Through Multimodal Optimization [8.6] 本稿では,テキスト・ツー・イメージ(T2I)生成と編集における画像テキストの相違に対処する新しいフレームワークであるTextMatchを紹介する。
TextMatchは、大きな言語モデル(LLM)と視覚質問回答モデル(VQA)を使用して、プロンプトと生成された画像間のセマンティック一貫性を評価する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:38:45 GMT)
InstaGraM: Instance-level Graph Modeling for Vectorized HD Map Learning [8.6] オンラインハイデフィニション(HD)マップ構築は、ポーズの正確な推定において重要な役割を果たす。
オンラインHDマップ構築の最近の進歩は、ベクトル化表現について主に研究されている。
グラフモデリングを利用した新しいHDマップ学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:44:03 GMT)
EF-LLM: Energy Forecasting LLM with AI-assisted Automation, Enhanced Sparse Prediction, Hallucination Detection [8.5] 本稿では,時系列予測のためのドメイン知識と時間データを統合するEnergy Forecasting Large Language Model (EF-LLM)を提案する。
EF-LLMの人間とAIのインタラクション能力は、タスクの予測におけるエントリー障壁を低くし、さらなる専門家の関与の必要性を減らす。
我々は、負荷、太陽光発電、風力発電予測のエネルギー予測シナリオで成功している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:24:55 GMT)
The Dark Side of Function Calling: Pathways to Jailbreaking Large Language Models [8.4] 本稿では,大規模言語モデル(LLM)の関数呼び出しプロセスにおける重大な脆弱性を明らかにする。
本稿では,アライメントの相違,ユーザ強制,厳密な安全フィルタの欠如を生かした,新しい"jailbreak function"攻撃手法を提案する。
本研究は,LLMの機能呼び出し機能において,緊急のセキュリティ対策の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:35:05 GMT)
Diff-Instruct*: Towards Human-Preferred One-step Text-to-image Generative Models [8.4] Diff-Instruct* (DI*)は1段階のテキスト・ツー・イメージ生成モデルを構築するための画像データフリーアプローチである。
我々は、人間のフィードバックを用いたオンライン強化学習として、人間の好みのアライメントを定めている。
正規化にKLの発散に依存する従来のRLHFアプローチとは異なり、新しいスコアベース発散正規化を導入する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:22:40 GMT)
MacLight: Multi-scene Aggregation Convolutional Learning for Traffic Signal Control [8.3] 大規模道路網で訓練可能な交通信号制御ポリシーを, 強化学習手法により提案した。
現在のSOTA手法は、道路ネットワークをトポロジカルグラフ構造としてモデル化し、グラフ注意を深層Q-ラーニングに組み込み、局所的およびグローバルな埋め込みをマージしてポリシーを改善する。
交通信号制御(MacLight)のためのマルチシーン・アグリゲーション・コンボリューショナル・ラーニングを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:42:00 GMT)
Concept Complement Bottleneck Model for Interpretable Medical Image Diagnosis [8.3] 本稿では,医用画像診断のための補完的ボトルネックモデルを提案する。
そこで本研究では,概念の相違点を抽出し,それぞれの注意チャンネルで概念をスコアリングするために,概念アダプタを利用することを提案する。
本モデルでは,概念検出と疾患診断の課題において,最先端の競争相手よりも優れていた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:23:50 GMT)
Understanding Artificial Neural Network's Behavior from Neuron Activation Perspective [8.3] 本稿では,ニューロン活性化ダイナミクスのレンズによるディープニューラルネットワーク(DNN)の複雑な動作について検討する。
本稿では,モデルのニューロン活性化パターンをプロセスとして解析する確率的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:01:06 GMT)
VisionGRU: A Linear-Complexity RNN Model for Efficient Image Analysis [8.1] 畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は画像解析の主流モデルである。
本稿では,効率的な画像分類のための新しいRNNアーキテクチャであるVisionGRUを紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:27:11 GMT)
Dissecting CLIP: Decomposition with a Schur Complement-based Approach [8.1] テキスト・ツー・イメージ・モデルの本質的な多様性を定量化し,解釈するために,CLIP埋め込みの応用を拡張した。
画像のCLIP埋め込みにおいて、与えられたプロンプトの影響を無効化するために、Schur補数に基づく分解を用いることを実証する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:07:57 GMT)
OC4-ReID: Occluded Cloth-Changing Person Re-Identification [8.1] Occluded Cloth-Changing Person Re-Identification (OC4-ReID)は、服が変わったときに特定の歩行者を回収する新しい方法である。
OC4-ReIDは衣服の変化と閉塞の2つの課題に同時に対処する。
提案したデータセットおよび2つのCC-ReIDベンチマークデータセットに関する総合的な実験は、提案手法の他の最先端手法に対する優れた性能を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:38:02 GMT)
Spectral Property of Magnetic Quantum Walk on Hypercube [8.0] 磁場によって摂動される量子ウォークは、磁気ポテンシャルに対するスペクトル安定性を持つ。
我々の研究は、磁場によって摂動された量子ウォークが、磁気ポテンシャルに関してスペクトル安定性を持つことを示唆するかもしれない。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:47:29 GMT)
CodeComplex: Dataset for Worst-Case Time Complexity Prediction [8.0] コード時間の複雑さ予測には、変数の入力範囲や条件ループなど、様々な複雑な要素が含まれる。
現在のベンチマークは、限られたデータ、言語制約、不十分なラベリングのために厳格な評価を提供していない。
コード時間の複雑さを予測する上で,LSMの推論能力を評価するために設計された最初の堅牢で広範なデータセットであるCodeComplexを紹介した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:24:05 GMT)
AI Meets Natural Hazard Risk: A Nationwide Vulnerability Assessment of Data Centers to Natural Hazards and Power Outages [7.9] 本研究は,米国における全国規模のDCの脆弱性評価を行うことを目的とする。
研究によると、ディスラプションの不可避な領域にあるDCは、かなりの割合にあることがわかった。
地震、ハリケーン、竜巻は、脆弱な地域では最も直流である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:01:20 GMT)
The Practice of Averaging Rate-Distortion Curves over Testsets to Compare Learned Video Codecs Can Cause Misleading Conclusions [7.7] 平均的な速度歪み曲線が、異なるコーデックの比較評価を誤解させる可能性があることを示す。
テストセットの他の部分と異なるRD特性を持つ単一のビデオは、平均曲線に不均等に影響を及ぼすことができる。
学習したビデオ圧縮コミュニティは、テストセット毎のRD曲線とパフォーマンス指標を報告すべきである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:18:25 GMT)
GIMS: Image Matching System Based on Adaptive Graph Construction and Graph Neural Network [7.7] 本稿では,距離と動的しきい値の類似性に基づくフィルタリング機構を利用する,革新的な適応グラフ構築手法を提案する。
また、トランスフォーマーのグローバルな認識能力を組み合わせて、グラフ構造の表現を強化する。
システム全体のマッチング性能は平均3.8x-40.3x向上した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:05:55 GMT)
Diverse and Effective Red Teaming with Auto-generated Rewards and Multi-step Reinforcement Learning [7.7] 我々は、自動化されたレッドチーム化によって、多種多様な、そして成功した攻撃を生成できる方法を提供する。
本手法は,(1)多様な攻撃目標を自動生成する手法と,(2)これらの目標を効果的に攻撃する手法の2つのステップに分解する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 22:38:46 GMT)
UniPLV: Towards Label-Efficient Open-World 3D Scene Understanding by Regional Visual Language Supervision [7.7] オープンワールド3Dシーン理解のための学習パラダイムとして,ポイントクラウド,イメージ,テキストを統一する強力なフレームワークであるUniPLVを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:40:05 GMT)
Pruning Unrolled Networks (PUN) at Initialization for MRI Reconstruction Improves Generalization [7.6] 本研究では,訓練時に深部画像再構成ネットワークを切断することで,分布変化に対するロバスト性を向上できることを実証する。
実験により、従来の高密度ネットワークと比較して、PUNは様々な実験環境における一般化を改善していることが示された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:01:52 GMT)
Asymptotic Theory for IV-Based Reinforcement Learning with Potential Endogeneity [7.5] データ生成とデータ解析の動的相互作用は、新しいタイプのバイアス、すなわち強化バイアスをもたらすことを示す。
本稿では,そのバイアスを補正するために,計器変数(IV)に基づく強化学習(RL)アルゴリズムのクラスを提案する。
IVRLアルゴリズムの最適ポリシを推論するための公式を提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:20:59 GMT)
Level Up with ML Vulnerability Identification: Leveraging Domain Constraints in Feature Space for Robust Android Malware Detection [7.4] 機能領域におけるAndroidドメイン制約の解釈を新たに導入し,その後にそれらを学ぶ新しいテクニックを紹介した。
種々の回避攻撃に対する経験的評価は、学習領域の制約を用いて、平均89.6%のAEを効果的に検出できることを示唆している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:48:30 GMT)
RA-RLHF: Provably Efficient Risk-Aware Reinforcement Learning Human Feedback [7.4] 強化学習 ヒューマンフィードバックは、エージェントが各エピソードにおける一対の軌跡よりも好みしか受け取らない問題を研究する。
従来のリスク対応の目標とアルゴリズムは、そのような一段階のリワード設定には適用できない。
本稿では,ネストと静的の両方の目的を最適化するアルゴリズムであるRA-RLHFを紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:53:18 GMT)
SongGLM: Lyric-to-Melody Generation with 2D Alignment Encoding and Multi-Task Pre-Training [7.3] SongGLMは2次元アライメント符号化とマルチタスク事前学習を利用する歌詞からメロディ生成システムである。
我々は,20万曲以上の英曲を事前学習と微調整に用いた大規模歌詞・旋律ペアデータセットを構築した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:30:07 GMT)
Bridging Data Islands: Geographic Heterogeneity-Aware Federated Learning for Collaborative Remote Sensing Semantic Segmentation [7.3] 高品質な注釈付きリモートセンシング画像は、しばしば分離され、機関に分散される。
リモートセンシングデータアイランドの問題は、グローバルモデルのトレーニングに独立したデータセットを完全に活用する上での課題を提起している。
我々は、RSSでデータアイランドをブリッジする新しい地理異質性を考慮したフェデレーションラーニング(GeoFed)フレームワークを提案する。
我々のフレームワークは,Global Insight Enhancement(GIE)モジュール,Essential Feature Mining(EFM)モジュール,LoGo(LoGo)モジュールという3つのモジュールで構成されています。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:07:46 GMT)
How "Real" is Your Real-Time Simultaneous Speech-to-Text Translation System? [7.3] シマルST(SimulST)は、話者の音声とソース言語音声を同時に翻訳し、ユーザの理解を深めるために低レイテンシを確保する。
非有界音声への応用を意図したものの、ほとんどの研究は、人間の事前隔離された音声に焦点を当て、タスクを単純化し、重要な課題を見落としている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:26:31 GMT)
Efficient Contrastive Explanations on Demand [7.1] 本稿では,機械学習モデルに対して,いわゆるコントラスト的説明を計算するための新しいアルゴリズムを提案する。
また,本論文では,説明文をリストアップし,最小の対照的な説明文を見つけるための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:24:10 GMT)
Extract Free Dense Misalignment from CLIP [7.0] この研究はCLIP4DMと呼ばれる新しいアプローチを提案する。
我々は、個々のテキストトークンの負の勾配を誤適応を示すために、勾配に基づく属性計算法を改良する。
提案手法は,ゼロショットモデル間の最先端性能と微調整モデルとの競合性能を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:51:05 GMT)
Structure Learning in Gaussian Graphical Models from Glauber Dynamics [7.0] グラウバー力学に基づいてデータをサンプリングする場合, ガウスモデル選択のための最初のアルゴリズムを提案する。
本稿では,提案アルゴリズムの構造学習性能の計算的および統計的複雑さを保証する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:49:13 GMT)
Navigating Heterogeneity and Privacy in One-Shot Federated Learning with Diffusion Models [6.9] フェデレートラーニング(FL)は、複数のクライアントがデータのプライバシを保持しながらモデルをまとめてトレーニングすることを可能にする。
ワンショットフェデレーション学習は、コミュニケーションラウンドの削減、効率の向上、盗聴攻撃に対するセキュリティ向上によるソリューションとして登場した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 22:21:38 GMT)
RSGaussian:3D Gaussian Splatting with LiDAR for Aerial Remote Sensing Novel View Synthesis [6.9] RSGaussianは、空中リモートセンシングシーンのための革新的な新しいビュー合成(NVS)手法である。
LiDARの点雲を3Dガウス散乱法に制約として組み込んでおり、ガウスが幾何ベンチマークに沿って成長して分裂することを保証している。
このアプローチはまた、LiDAR点雲と2D画像の間の画素レベルのアライメントを実現するために、カメラモデルの歪みパラメータを伴う座標変換を導入する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:08:50 GMT)
The Value of AI-Generated Metadata for UGC Platforms: Evidence from a Large-scale Field Experiment [6.9] われわれはアジアの短ビデオプラットフォームで、約100万人のユーザーがアップロードしたビデオのAI生成タイトルにアクセスできるようにするフィールド実験を行った。
以上の結果から,AIによるタイトル提供によってコンテンツ消費が著しく増加し,有効視聴時間が1.6%増加し,視聴時間が0.9%向上した。
このビューワーシップ・ブースト効果は、この生成AI(GAI)ツールを使用することで、タイトルを持つビデオの確率が41.4%増加したことに起因する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:47:27 GMT)
Multi-Agents Based on Large Language Models for Knowledge-based Visual Question Answering [6.7] 知識に基づく視覚質問応答のための投票フレームワークを提案する。
チーム内のさまざまなレベルのスタッフをシミュレートする3つのエージェントを設計し、利用可能なツールをレベルに応じて割り当てます。
OK-VQA と A-OKVQA の実験により,本手法は,それぞれ2.2 と 1.0 の他のベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:24:56 GMT)
Uniform Additivity of Tripartite Optimized Correlation Measures [6.6] 正規化バージョンが計算可能である量子状態の最適化線形エントロピー関数を探索する。
我々はフォン・ノイマンエントロピーの強い部分付加性に頼って、以前に確立された3つの三部式最適化相関測度が加法であることを証明している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:28:29 GMT)
FPPL: An Efficient and Non-IID Robust Federated Continual Learning Framework [6.4] フェデレーション型連続学習(FCL)は、分散化されたフェデレーション型学習環境において、シーケンシャルなデータストリームから学習することを目的としている。
既存のFCLメソッドは通常、典型的なリハーサル機構を使用しており、これはプライバシー侵害や追加の面倒なストレージや計算負荷をもたらす可能性がある。
本研究では,FPPL(Federated Prototype-Augmented Prompt Learning)と呼ばれる,効率的で非IIDな連立型連続学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:58:21 GMT)
OmniHD-Scenes: A Next-Generation Multimodal Dataset for Autonomous Driving [6.4] 高品質なデータセットは、効率的なデータ駆動自律運転ソリューションの開発に不可欠である。
OmniHD-Scenesは大規模なマルチモーダルデータセットであり、全方位全方位高精細データを提供する。
データセットは1501のクリップで構成され、それぞれ約30秒の長さで、合計450K以上の同期フレームと585万以上の同期センサーデータポイントで構成されている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:35:31 GMT)
RAGONITE: Iterative Retrieval on Induced Databases and Verbalized RDF for Conversational QA over KGs with RAG [6.4] SPARQLは複雑な意図と会話型の質問に対して脆弱である。
i)知識グラフから自動的に抽出されたデータベース上のSPARQL結果と、(ii)KG事実の動詞化に関するテキスト検索結果。
パイプラインは反復的な検索をサポートし、どのブランチの結果も満足できないと判断された場合、システムは自動的にラウンドを選択できる。
本稿では,BMW自動車の知識グラフに基づくいくつかのベースラインに対する提案方式の優位性を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:03:42 GMT)
Unpacking Political Bias in Large Language Models: Insights Across Topic Polarization [6.3] 人間社会における普遍的な現象としての政治的偏見は、大規模言語モデルに移される可能性がある。
政治バイアスは、モデルスケールとリリース日とともに進化し、LLMの地域要因にも影響される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:04:54 GMT)
Towards An Unsupervised Learning Scheme for Efficiently Solving Parameterized Mixed-Integer Programs [6.2] 教師なし学習方式でバイナリ変数の自動エンコーダを訓練する。
オフライン学習AEのデコーダパラメータから平面制約を切断するクラスを構築する戦略を提案する。
原始的なMIP問題への統合は、実現可能な領域を縮小したMIPの強化につながる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:05:53 GMT)
Explainable Multi-Modal Data Exploration in Natural Language via LLM Agent [6.1] XMODEは自然言語で説明可能なマルチモーダルデータ探索を可能にするシステムである。
XMODEは、マルチモーダル情報システムの探索を可能にする現実世界のユースケースにインスパイアされている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:42:44 GMT)
Optimal-state Dynamics Estimation for Physics-based Human Motion Capture from Videos [6.1] オンライン環境での運動学観測に物理モデルを選択的に組み込む新しい手法を提案する。
リカレントニューラルネットワークを導入し、キネマティックス入力とシミュレートされた動作を熱心にバランスするカルマンフィルタを実現する。
提案手法は,物理に基づく人間のポーズ推定作業に優れ,予測力学の物理的妥当性を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:10:58 GMT)
Annotating References to Mythological Entities in French Literature [6.0] 我々は,現代・現代フランス文学におけるローマ神話やギリシア神話の実体に言及するための大型言語モデル (LLM) の関連性を探究する。
LLMは、文学作家による神話的参照の使用に関する解釈的な洞察を提供することができることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:29:00 GMT)
Static Code Analyzer Recommendation via Preference Mining [5.9] 静的コードアナライザ(SCA)は、ソフトウェアの品質保証において重要な役割を果たす。
様々な静的解析技術を持つSCAは、偽陽性と偽陰性のレベルが異なる。
あるプロジェクトにおけるより多くの欠陥を検出するために、このプロジェクトをスキャンするためにもっと利用可能なSCAを使用することが可能です。
許容できないコストと過剰な警告を生成するため、あるプロジェクトのために利用可能なSCAを全て呼び出すことは、実際のシナリオでは現実的ではありません。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:36:24 GMT)
Leveraging Convolutional Neural Network-Transformer Synergy for Predictive Modeling in Risk-Based Applications [5.9] 本稿では,CNN(Convolutional Neural Network)とTransformerを組み合わせたディープラーニングモデルを提案する。
その結果、CNN+Transformerモデルは、ランダムフォレストやXGBoostといった従来の機械学習モデルよりも優れていることがわかった。
本研究は、信用デフォルト予測の新しいアイデアを提供し、金融分野におけるリスク評価と知的意思決定を強力に支援する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:07:14 GMT)
Addressing general measurements in quantum Monte Carlo [5.9] 本稿では,一般測定の課題に対処するための普遍的なスキームを提案する。
重み付け経路は物理パラメータに限らず、空間や(想像上の)時間でも機能する。
我々の研究は、量子モンテカルロシミュレーションにおいて複雑な対角線作用素を捕捉する簡単かつ効率的な方法である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:32:14 GMT)
A Divide-Align-Conquer Strategy for Program Synthesis [5.7] 本稿では,大規模プログラムの探索を複数の小さなプログラム合成問題に分割する例によって,構成セグメント化がプログラミングに応用可能であることを示す。
入力と出力における構成部品の構造的アライメントは、プログラム探索を導くのに使用されるペアワイズ対応に繋がる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:00:23 GMT)
A Critical Assessment of Visual Sound Source Localization Models Including Negative Audio [5.7] 本稿では,Visual Sound Source のローカライゼーションモデルの標準評価を達成すべく,新しいテストセットとメトリクスを提案する。
我々は、沈黙、騒音、オフスクリーンの3種類の否定的オーディオについて検討している。
分析の結果,多くのSOTAモデルでは,音声入力に基づいて予測を適切に調整できないことがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:27:09 GMT)
Circuit Folding: Modular and Qubit-Level Workload Management in Quantum-Classical Systems [5.7] 回路編み込み(Circuit knitting)は、量子回路から計算負荷の一部をオフロードする技法である。
本稿では,量子回路内の繰り返し構造を識別・活用する新しいグラフベースシステムであるCiFoldを提案する。
我々のシステムは様々な量子アルゴリズムで広く評価されており、最大で799.2%の量子リソース使用量の削減を実現している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:34:17 GMT)
Physics-Based Dynamic Models Hybridisation Using Physics-Informed Neural Networks [5.6] 物理に基づく力学モデル(PBDM)は複雑な力学系の単純化された表現である。
ハイブリッド蚊群動態モデルがPBDMと物理インフォームドニューラルネットワーク(PINN)を統合していることを示す。
蚊の個体数予測の困難さを含む,蚊の個体数シミュレーションを改良した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:40:21 GMT)
Conditional Deep Canonical Time Warping [5.5] シーケンスの時間的アライメントは、コンピュータビジョンやバイオインフォマティクスなど、多くのアプリケーションにおいて基本的な課題である。
CDCTW(Deep Canonical Temporal Time Warping)は、これらの課題に対処するために、スパース時間データの時間的アライメントを設計する。
本研究は,CDCTWの有効性を各種データセットの広範な実験により検証し,従来の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:35:48 GMT)
Data-driven decision-making under uncertainty with entropic risk measure [5.4] エントロピーリスク尺度は、不確実な損失に関連する尾のリスクを考慮に入れた高い意思決定に広く用いられている。
経験的エントロピーリスク推定器を劣化させるため, 強く一貫したブートストラップ手法を提案する。
検証性能のバイアスが補正されない場合,クロスバリデーション手法は,保険業者のアウト・オブ・サンプルリスクを著しく高める可能性があることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:52:34 GMT)
Multiscale Latent Diffusion Model for Enhanced Feature Extraction from Medical Images [5.4] CTスキャナーモデルと取得プロトコルのバリエーションは、抽出した放射能特性に有意な変動をもたらす。
LTDiff++は医療画像の特徴抽出を強化するために設計されたマルチスケール潜在拡散モデルである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 22:22:53 GMT)
DOFEN: Deep Oblivious Forest ENsemble [5.4] Deep Neural Networks(DNN)は人工知能に革命をもたらし、画像、ビデオ、テキストなど、さまざまなデータタイプに対して素晴らしい成果を上げている。
難解な決定木にインスパイアされた新しいDNNアーキテクチャであるDOFENを提案する。
DOFENは、各カラムの条件をランダムに組み合わせて、ゆるやかな不愉快な決定木(RoODT)を構築し、さらに2段階のRODT森林アンサンブルプロセスで性能を向上させる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:00:20 GMT)
Adapter Merging with Centroid Prototype Mapping for Scalable Class-Incremental Learning [5.3] ACMapはタスク固有のアダプタを単一のアダプタに統合し、タスク間で一定の推論時間を確保する。
このフレームワークは、タスク表現を整列させ、忘れを緩和する共有サブスペースを構築するために、アダプタマージを採用している。
5つのベンチマークデータセットの実験は、ACMapが最先端の精度と一致し、最も高速な既存のメソッドに匹敵する推論時間を維持していることを示している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:57:16 GMT)
PCM Selector: Penalized Covariate-Mediator Selection Operator for Evaluating Linear Causal Effects [5.3] 因果効果を推定する新しい2段階のペナル化回帰手法を提案する。
PCMセレクタは因果効果の一貫性またはバイアスの少ない推定器を提供する。
さらに、PCMセレクタは、バックドア基準よりも因果効果の正確な推定精度を得るために、中間変数に対する変数選択手順を提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:34:05 GMT)
Tackling Intertwined Data and Device Heterogeneities in Federated Learning with Unlimited Staleness [5.0] フェデレートラーニングは、クライアントの異なるローカルデータ分散と、モデルの更新をアップロードする際のレイテンシに起因する、データとデバイスの不均一性によって影響を受ける可能性がある。
本稿では,この変換の精度と計算効率を保証する新しいFLフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:18:23 GMT)
FlameGS: Reconstruct flame light field via Gaussian Splatting [4.9] 本稿では,火炎シミュレーション技術に触発された火炎の新しい表現法を提案する。
実際の画像と予測された2次元投影の間の平均構造的類似度指数は0.96であり、ピーク信号対ノイズ比は39.05である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:00:26 GMT)
Extendible quantum measurements and limitations on classical communication [4.8] 量子状態とチャネルの非拡張性は、量子力学の非閉定理と密接に関連している。
整数 $kge 2$ 毎に $k$-extendible 測定を定義する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:12:45 GMT)
Unveiling the Threat of Fraud Gangs to Graph Neural Networks: Multi-Target Graph Injection Attacks against GNN-Based Fraud Detectors [4.7] 最近の発見は、詐欺がギャングや集団としてますます組織化されていることを示唆している。
本研究では,詐欺集団が不正行為を虚偽化して不正なノードを良心と誤分類することを目的とした攻撃シナリオを設計する。
これらのシナリオに基づいて,実世界の3件の詐欺事件における詐欺集団の攻撃をシミュレートすることにより,GNNベースの詐欺検知器に対する敵攻撃について検討した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:53:24 GMT)
A Pioneering Neural Network Method for Efficient and Robust Fuel Sloshing Simulation in Aircraft [4.7] 本研究では,航空機における燃料スロッシングのシミュレーションを目的とした,最初のニューラルネットワーク手法を提案する。
このモデルは、そのような複雑なシナリオで流体粒子力学を安定にモデル化できる最初のモデルでもある。
我々は、航空機の燃料表面スロッシングのための最初のデータセットであるFueltankデータセットを構築した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:27:53 GMT)
Analytic 3D vector non-uniform Fourier crystal optics in arbitrary $\bar{\bar{\varepsilon}}$ dielectric [4.6] 相互空間における固有解析と実空間における光場伝播の3つの広く用いられている平面波面の比較を行った。
複素線トレーシングに着想を得て、3$times$2遷移行列の明示的な形式を導出する。
我々は、円盤状、環状、三日月状のような形状に配置された無限特異点のような、実空間および相互空間における LCO の新しい領域を発見した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:58:48 GMT)
Molar: Multimodal LLMs with Collaborative Filtering Alignment for Enhanced Sequential Recommendation [4.5] Molarは、複数のコンテンツモダリティとID情報を統合するシーケンシャルなレコメンデーションフレームワークで、協調的な信号を効果的にキャプチャする。
マルチモーダルコンテンツと協調フィルタリングの洞察をシームレスに組み合わせることで、Molarはユーザの関心事とコンテキスト意味論の両方をキャプチャし、より優れた推奨精度をもたらす。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:23:13 GMT)
HAUR: Human Annotation Understanding and Recognition Through Text-Heavy Images [4.5] 視覚質問回答(VQA)タスクは、重要な情報を伝えるために画像を使用し、テキストベースの質問に答える。
データセットとモデルも間もなくリリースされる予定です。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:25:41 GMT)
Linked Data on Geo-annotated Events and Use Cases for the Resilience of Ukraine [4.4] 我々は、2022年2月から2023年4月末にかけてのロシア侵攻によるウクライナの被害に関するデータセットに焦点を当てている。
選択した2つのデータセットをLinked Dataに変換し、追加の地理空間情報でそれらを強化します。
異なるデータセットから同一イベントを検出するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:59:38 GMT)
CypherBench: Towards Precise Retrieval over Full-scale Modern Knowledge Graphs in the LLM Era [4.4] 我々はCypherBenchを紹介した。CypherBenchは11の大規模マルチドメインプロパティグラフを持つ最初のベンチマークで、780万のエンティティと10,000以上の質問がある。
本稿では,Cypher を用いて LLM で効率的にクエリ可能な RDF グラフの上のプロパティグラフビューを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:22:04 GMT)
ConSinger: Efficient High-Fidelity Singing Voice Generation with Minimal Steps [4.3] 最小ステップで高忠実度な歌声合成を実現するために,一貫性モデルであるConSingerに基づく歌声合成手法を提案する。
実験の結果,ConSingerは生成速度と品質の点で,ベースラインモデルと非常に競合していることがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:13:43 GMT)
An Evaluation Framework for Product Images Background Inpainting based on Human Feedback and Product Consistency [4.2] 製品広告アプリケーションでは、プロダクトイメージにおけるAI技術を活用した背景の自動塗り絵が重要なタスクとして現れている。
HFPC(Human Feedback and Product Consistency)は、2つのモジュールに基づいて生成した製品イメージを自動的に評価する。
HFPCは、他のオープンソースのビジュアル品質評価モデルと比較して、最先端(96.4%の精度)を実現している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:21:40 GMT)
Quantile Activation: Correcting a Failure Mode of ML Models [4.0] 機械学習モデルの確立された障害モードは、同じ機能がクラス0とクラス1に属する可能性が高い場合に発生する。
可解ケースは、0 と 1 の確率が文脈分布によって変化するときに現れる。
本稿では、計算コストを大幅に増大させることなく、この問題に対処する単純なアクティベーション関数、量子アクティベーション(QACT)を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:16:49 GMT)
Quantum Bayesian Networks for Machine Learning in Oil-Spill Detection [4.0] 本稿では、量子ベイズネットワーク(QBN)を用いて、不均衡なデータセットを分類する新しいベイズアプローチを提案する。
量子拡張を古典的な機械学習アーキテクチャに統合するという課題を効果的に解決する。
本研究は, 異常の検出・分類において重要な進歩を示し, より効果的かつ正確な環境モニタリング・管理に寄与している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:44:26 GMT)
Convergence of Statistical Estimators via Mutual Information Bounds [3.9] 我々は統計モデルに縛られた新しい相互情報を導入する。
導出境界は、統計的推測において広い範囲の応用を持つ。
また、幅広い推定方法の研究にも使用できる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:42:45 GMT)
ClassifyViStA:WCE Classification with Visual understanding through Segmentation and Attention [3.9] We propose ClassifyViStA, a AI-based framework designed for automated detection and classification of bleeding and non-bleeding frames from WCE video。
このモデルは、分類性能を高めるためにResNet18とVGG16アーキテクチャのアンサンブル上に構築されている。
我々のアプローチは、GI出血の検出を自動化するだけでなく、医療専門家の負担を軽減するための解釈可能なソリューションも提供します。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:45:14 GMT)
Subsampling, aligning, and averaging to find circular coordinates in recurrent time series [3.8] そこで本研究では,再現性を示すと期待されるデータに対して,ロバストな円座標を求めるアルゴリズムを提案する。
本手法は, 合成データセットと神経活動記録の両方で検証する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:52:51 GMT)
How accurate is mechanobiology? [3.8] マイクロスケールの力はしばしば、トラクションフォース顕微鏡のような逆問題を用いて間接的に測定される。
本論文の目的は、この問題を公表し、仮説テストを可能にする一般的な再構築フレームワークの形で、治療に向けた第一歩を提案することである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:52:16 GMT)
A multi-dimension and high-granularity equity measurement for transportation services through accessibility and reliability [3.8] 本稿では,多次元高粒度指数(MDHG)と呼ばれる輸送株式指数を提案する。
MDHG指数は、サービスのアクセシビリティと品質を人口と共に考慮している。
MDHG Indexをテストするために、ニューヨーク市のCiti Bikeの拡張データと、高度に粒度の高い合成人口データセットを結合した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:49:11 GMT)
Optimizing Convolutional Neural Networks for Chronic Obstructive Pulmonary Disease Detection in Clinical Computed Tomography Imaging [3.7] 計算トモグラフィ(CT)画像上で、手動調整と自動ウィンドウ設定最適化(WSO)について検討する。
各画像に対して、強度値を手動で気腫窓設定と「フルレンジ」窓設定にクリップした。
DenseNetは最も効率的なバックボーンであり、WSOのない平均AUCは0.80[0.76, 0.85]に達した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:06:15 GMT)
The optimization of exact multi-target quantum search algorithm based on MindQuantum [3.6] 修正Groverのアルゴリズムに基づいて,最適化されたマルチターゲット探索アルゴリズムを提案する。
提案アルゴリズムは、量子ゲート数を少なくとも21.1%減らし、量子回路の深さを少なくとも11.4%減らし、100%の成功確率を維持する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:39:59 GMT)
Improvement in Sign Language Translation Using Text CTC Alignment [3.5] 本稿では,CTC/AttentionとTransfer Learningを組み合わせた新しい手法を提案する。
共同CTC/Attentionは階層的エンコーディングを導入し、デコード中の注意機構とCTCを統合する。
提案手法は,最先端技術に匹敵する結果を達成し,純アテンションベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:41:32 GMT)
Multi-View Fusion Neural Network for Traffic Demand Prediction [3.5] 時空間の特徴の抽出は交通研究において重要な研究である。
固定空間グラフは、類似しているが直接接続されていないノードに対する空間的特徴の抽出を制限する。
これらの課題に対処するために、マルチビュー融合ニューラルネットワーク(MVFN)アプローチが提案されている。
このモデルは2つのトラフィック要求データセットで検証され、最高の予測精度を達成した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:15:49 GMT)
MixMAS: A Framework for Sampling-Based Mixer Architecture Search for Multimodal Fusion and Learning [3.4] MixMASは、マルチモーダル学習に適したミキサーベースのアーキテクチャ検索のための新しいフレームワークである。
提案手法は,与えられたマルチモーダル機械学習(MML)タスクに対して最適なアーキテクチャを自動選択する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:55:56 GMT)
Revisiting Lesion Tracking in 3D Total Body Photography [3.4] メラノーマは皮膚がんの最も致命的な形態である。
3次元全身写真における皮膚病変の経時的追跡に関する先行研究にもかかわらず、いくつかの課題がある。
本稿では,2組の3次元テクスチャメッシュを取り入れ,全身撮影の文脈における病変と一致し,不整合性病変を同定するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:01:19 GMT)
On the Convergence of the ELBO to Entropy Sums [3.3] 変分下界は、すべての定常的な学習点においてエントロピーの和に等しいことを示す。
静止点におけるエントロピー和に対する ELBO の等式を証明することが、この研究の主な貢献である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:08:11 GMT)
Explaining in Diffusion: Explaining a Classifier Through Hierarchical Semantics with Text-to-Image Diffusion Models [3.3] DiffExは、テキストから画像への拡散モデルの能力を活用して分類器の決定を説明する新しい手法である。
我々の実験は、DiffExがGANと比べ、はるかに広い範囲のセマンティクスをカバーできることを示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:58:28 GMT)
VisionLLM-based Multimodal Fusion Network for Glottic Carcinoma Early Detection [3.1] 本稿では, MMGC-Net として知られる声門癌検出のための視覚大言語モデル (VisionLLM に基づく) マルチモーダル核融合ネットワークを提案する。
我々は、画像エンコーダと追加のQ-Formerを利用して、視覚埋め込みとLarge Language Model Meta AI(Llama3)を抽出し、テキスト埋め込みを得る。
これらのモダリティは喉頭機能融合ブロックを介して統合され、画像特徴とテキスト特徴の包括的統合を可能にして、甲状腺癌識別性能を向上させる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:19:29 GMT)
Deep thermalization in Gaussian continuous-variable quantum systems [3.0] 数モードの小さなサブシステム上でサポートされた純粋状態のアンサンブルについて検討する。
誘導アンサンブルは、測定基準の選択とは無関係に普遍的な形式を実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:40:23 GMT)
Probing Entanglement Scaling Across a Quantum Phase Transition on a Quantum Computer [2.9] 強相関量子物質の研究は、次元と複雑な絡み合い構造のために困難である。
完全連結型イオン量子コンピュータ上にホログラムサブシステムトモグラフィーを実装した。
サブシステムエンタングルメントエントロピーの臨界度における対数法則のスケーリングを初めて実証した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:56:44 GMT)
Refining CNN-based Heatmap Regression with Gradient-based Corner Points for Electrode Localization [2.8] リチウムイオン電池の電極位置検出手法を提案する。
畳み込みニューラルネットワークは、この領域内の極の位置を回帰するために使用される。
後退位置を最適化し、コーナーポイント先行値を用いて補正する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:27:20 GMT)
Mining Frequent Structures in Conceptual Models [2.7] 本稿では,概念モデルにおける頻繁な構造発見問題に対する一般的なアプローチを提案する。
我々は、広く使われている2つの概念モデリング言語に焦点をあてて、我々のアプローチを実装した。
このツールは、効果的なモデリングプラクティスと非効果的なモデリングプラクティスの両方を特定するのに使うことができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:26:06 GMT)
Joint Adaptive OFDM and Reinforcement Learning Design for Autonomous Vehicles: Leveraging Age of Updates [2.6] ミリ波を用いた周波数分割多重化(OFDM)は高分解能センシングと高速データ伝送に適した代替手段である。
本研究では,AVがキュー状態情報(QSI)とチャネル状態情報(CSI)を,通信とセンシングを管理するための強化学習技術とともに利用する自律走行車ネットワークについて考察する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:32:58 GMT)
A Novel Task-Driven Method with Evolvable Interactive Agents Using Event Trees for Enhanced Emergency Decision Support [2.5] 未確立の緊急計画では、複雑なシステムの故障時にオペレーターが圧倒される可能性がある。
本研究は,新たなアプローチを通じて,予期せぬさまざまなインシデントに対するアジャイル意思決定の緊急ニーズに対処する。
EvoTaskTreeは、イベントツリーを使用して緊急意思決定をサポートする、進化可能な対話エージェントを備えたタスク駆動のメソッドである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:53:46 GMT)
A Paragraph is All It Takes: Rich Robot Behaviors from Interacting, Trusted LLMs [2.5] 大規模言語モデル(LLM)は、我々の物理的環境と動物および人間の行動に関するすべての公開知識のコンパクトな表現である。
我々は、ロボットのデータ融合サイクルがわずか1Hzで実行されているにもかかわらず、リッチなロボットの挙動と優れた性能が達成できることを示した。
自然言語をLLM間通信に使用することで、ロボットの推論と意思決定を人間が直接観察することが可能になる。
我々は、対話型AI間のデータバスとして自然言語を使用することと、振る舞い制約を保存するために不変な公開台帳を使用することで、予期しないほどリッチなパフォーマンス、アップグレード性、そして組み合わせ可能なロボットを構築することができることを示唆している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:41:15 GMT)
Video Is Worth a Thousand Images: Exploring the Latest Trends in Long Video Generation [2.4] この記事の執筆時点では、現在最先端のシステムであるOpenAIのSoraは、最大1分間のビデオ制作に制限されている。
本稿では,GANや拡散モデル,ビデオ生成戦略,大規模トレーニングデータセット,長大映像の評価のための品質指標,および既存の映像生成能力の限界に対処するための今後の研究領域について,現在の長大映像生成の状況について検討する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 21:24:41 GMT)
Advancing Explainability in Neural Machine Translation: Analytical Metrics for Attention and Alignment Consistency [2.4] NMTモデル注意パターンの定量的な説明可能性を評価するための体系的枠組みを提案する。
We present a set of metrics attention entropy and alignment agreement and whether it on a English-German test subset from WMT14。
本結果より, より鋭い注意分布は解釈可能性の向上と相関するが, 翻訳品質の向上は必ずしも保証されないことがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:08:33 GMT)
Mobile Traffic Prediction at the Edge Through Distributed and Deep Transfer Learning [2.4] モバイルトラフィック予測のための、完全に分散化されたAIソリューションを調査し、データをローカルに保持できるようにする。
畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)の2つの主要なディープラーニングアーキテクチャが設計されている。
DTLは、トレーニング中の計算複雑性とエネルギー消費を大幅に減らし、CNNではエネルギーフットプリントを60%削減し、RNNでは90%削減する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:05:08 GMT)
Multi-Agent Norm Perception and Induction in Distributed Healthcare [2.4] このモデルにより、エージェントは、集団的傾向を捉える記述的規範と、理想的な振る舞いを規定する規範的規範を同時に学習することができる。
我々は2016年から2020年までの神経医療センターのデータセットを用いて実験を行った。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:30:19 GMT)
Sparse-PGD: A Unified Framework for Sparse Adversarial Perturbations Generation [2.3] この研究は、非構造的および構造的の両方を含む、スパース対向的摂動の研究である。
そこで我々は,Sparse-PGD というホワイトボックス PGD ライクな攻撃手法に基づくフレームワークを提案する。
Sparse-PGDとブラックボックス攻撃を組み合わせることで、非構造的および構造的スパース対向摂動に対するモデルの堅牢性を評価する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:55:43 GMT)
Quo Vadis, Anomaly Detection? LLMs and VLMs in the Spotlight [2.3] ビデオ異常検出(VAD)は,大規模言語モデル(LLM)と視覚言語モデル(VLM)を統合することで,大幅な進歩をみせた。
本稿では,2024年における最先端LLM-/VLM法の詳細について述べる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:05:37 GMT)
Decoherence of quantum superpositions by Reissner-Nordström black holes [2.2] ライスナー・ノルドストロームブラックホールにおける静電荷体に対する脱コヒーレンス効果について検討した。
極端 Reissner-Nordstr"om ブラックホールの場合、量子重ね合わせのデコヒーレンスは完全に抑制される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:14:06 GMT)
ReducedLUT: Table Decomposition with "Don't Care" Conditions [2.2] 本稿では,圧縮プロセスに不注意を注入することにより,LUTのフットプリントを削減する新しい方法であるReduceedLUTを紹介する。
ニューラルネットワークモデルのトレーニングデータ内の未観測パターンを気にせずに置き換えることで、モデルの精度を最小限に抑えることで、より大きな圧縮を可能にします。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:11:01 GMT)
BRIDGE: Bundle Recommendation via Instruction-Driven Generation [2.1] BRIDGEはバンドルレコメンデーションのための新しいフレームワークである。
これは2つの主要なコンポーネント、すなわち相関ベースのアイテムクラスタリングと擬似バンドル生成モジュールで構成されている。
その結果,5つのベンチマークデータセットにまたがる最先端のランキングベース手法よりも,モデルの優位性が検証された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:07:53 GMT)
Real-world Deployment and Evaluation of PErioperative AI CHatbot (PEACH) -- a Large Language Model Chatbot for Perioperative Medicine [2.0] 大規模言語モデル(LLM)は、特に複雑なドメイン固有のタスクのために、医療において強力なツールとして登場しています。
本研究では,PEACH(PEACH:PErioperative AI atbot)の開発と評価について述べる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:14:13 GMT)
HaSPeR: An Image Repository for Hand Shadow Puppet Recognition [2.0] シャドウグラフィー(Shadowgraphy)またはボンボマニー(ombromanie)は、演劇芸術とストーリーテリングの一形態である。
プロとアマチュアの両方の手影人形クリップから抽出した15のクラスに15,000枚の手影人形画像からなる新しいデータセットを提案する。
本研究は,注目型トランスアーキテクチャよりも,スキップ接続型畳み込みモデルの大幅な性能上の優位性を示すものである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:55:15 GMT)
Effects of noise-induced coherence on the performance of a four-level laser heat engine [2.0] 縮退した4段量子熱機関の性能に及ぼすノイズ誘起コヒーレンスの影響について検討する。
最初の線型項 $eta_c/2$ の普遍性は頑健であり、すべての条件に対して一貫して成り立つ。
2次項 $eta_C2/8$ は制御パラメータに課される制約に依存することを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:04:25 GMT)
An Approach To Enhance IoT Security In 6G Networks Through Explainable AI [2.0] 6G通信は、特にIoTにおいて、画期的な機能を提供する6Gによって大きく進化した。
IoTを6Gに統合することで、高度なテクノロジによって導入された脆弱性による攻撃面の拡大という、新たなセキュリティ上の課題が提示される。
本研究は、木に基づく機械学習アルゴリズムを用いて複雑なデータセットを管理し、機能の重要性を評価することで、これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:54:28 GMT)
Revolutionizing Undergraduate Learning: CourseGPT and Its Generative AI Advancements [1.9] 本稿では,教員支援と学部生の教育経験向上を目的とした生成型AIツールであるCourseGPTを紹介する。
Mistral AIのオープンソースのLarge Language Models(LLM)をベースに構築されたCourseGPTは、継続的なインストラクターサポートとコース教材の定期的な更新を提供する。
本稿では,CPR E 431- Basics of Information System Security をパイロットとして利用したCourseGPTの応用例を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:40:25 GMT)
Developing Cryptocurrency Trading Strategy Based on Autoencoder-CNN-GANs Algorithms [1.9] 本稿では、機械学習アルゴリズムを用いて財務時系列の予測と分析を行う。
プロセスは、主契約価格データからランダムなノイズ変動をフィルタリングするデノナイジングオートエンコーダから始まる。
1次元畳み込みは、フィルタリングデータの次元性を減少させ、キー情報を抽出する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:14:34 GMT)
Dissipation alters modes of information encoding in small quantum reservoirs near criticality [1.9] 量子貯水池コンピューティング(QRC)は、時間的機械学習タスクに取り組むために、短期的な量子デバイスを活用するための有望なパラダイムとして登場した。
本稿では, 制御可能な結合, 固有非線形性, 調整可能な光子損失を記述した, 駆動散逸型量子貯水池の最小モデルについて検討する。
鍵となる結果は、動的分岐をマークする臨界点近くで、システムは主に冗長から相乗的エンコーディングへと遷移することを示している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:53:30 GMT)
TimelyLLM: Segmented LLM Serving System for Time-sensitive Robotic Applications [1.9] 本稿では,複数のロボットエージェントにタイムセンシティブな要求を提供するTimelyLLMを提案する。
TimelyLLMは,ロボット計画生成と実行フェーズを最適に活用するセグメント生成とスケジューリングの新しいメカニズムを導入している。
評価の結果,TimelyLLMは時間効率を最大1.97倍に改善し,全体の待ち時間を84%削減した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 22:51:29 GMT)
Re-examining learning linear functions in context [1.9] In-context Learning (ICL) は大規模言語モデル(LLM)を様々なタスクに容易に適応するための強力なパラダイムとして登場した。
合成学習データを用いた制御設定でICLの簡単なモデルについて検討する。
本研究は,線形関数を文脈内で学習するためのアルゴリズム的アプローチをトランスフォーマーが採用する,一般的な物語に挑戦するものである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:03:02 GMT)
Space-time Peer-to-Peer Distribution of Multi-party Entanglement for Any Quantum Network [1.9] 本稿では,ネットワーク層における一般的なグラフ状態分布を効率的に実装するための新しい量子ネットワークプロトコルを提案する。
一般グラフ状態分布問題に対する明示的な数学的モデルを構築した。
我々は、ネットワーク問題におけるメモリ管理のための相対性理論の対称性にインスパイアされた時空量子ネットワークを活用する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:58:40 GMT)
Nationality, Race, and Ethnicity Biases in and Consequences of Detecting AI-Generated Self-Presentations [1.7] 言語スタイルのようなコンテンツは、AI検出において重要な役割を担った。
アジアとヒスパニックの応募者は、国内学生とラベル付けされた場合、AIユーザーと判断される傾向があった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:31:44 GMT)
Point-DeepONet: A Deep Operator Network Integrating PointNet for Nonlinear Analysis of Non-Parametric 3D Geometries and Load Conditions [1.7] この研究は、PointNetをDeepONetフレームワークに統合した演算子ベースの幾何サロゲートであるPoint-DeepONetを提示する。
Point-DeepONet はメッシュパラメータ化や再トレーニングなしに3次元変位と von Mises 応力場を正確に予測する。
1ケースあたり19.32分程度の非線形有限要素解析と比較すると、Point-DeepONetはわずか数秒から約400倍の速さで予測を行う。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:44:58 GMT)
Heterogeneous transfer learning for high dimensional regression with feature mismatch [1.6] 我々は、情報源やプロキシドメインから新たなターゲットドメインに知識を移すことの問題を考察し、おそらく異なる特徴を持つ高次元回帰モデルを学ぶ。
ほとんどの均質移動とマルチタスク学習法は、ターゲットドメインとプロキシドメインが同じ特徴空間を持つと仮定する。
本稿では,プロキシデータのプロジェクションステップを通じて,欠落した特徴と観察された特徴の関係を学習する2段階の手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:29:31 GMT)
Automated Code Review In Practice [1.6] Qodo、GitHub Copilot、CoderabbitなどのAI支援ツールが、大規模な言語モデル(LLM)を使用して自動レビューを提供する。
本研究では,LLMに基づく自動コードレビューツールが産業環境に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:24:45 GMT)
Exploring Graph Mamba: A Comprehensive Survey on State-Space Models for Graph Learning [1.6] この調査は、Graph Mambaに関する最初の総合的研究である。
オリジナルのGraph Mambaアーキテクチャの詳細な説明を提供し、主要なコンポーネントと基盤となるメカニズムを強調している。
グラフマンバとその変種の比較分析を行い、その特徴と潜在的なユースケースについて光を当てる。
Graph Mambaが将来適用可能な潜在的な領域を特定し、これらの分野におけるデータ分析に革命をもたらす可能性を強調します。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:17:14 GMT)
Fréchet regression for multi-label feature selection with implicit regularization [1.6] 従来の明示的正規化手法の代わりに暗黙的正規化を用いる新しい変数選択法を提案する。
提案手法は,モデル間隔を推し進めながら,述語トレーサと応答の非線形相互作用を効果的に捕捉する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:02:28 GMT)
Exploring Flexible Scenario Generation in Godot Simulator [1.6] サイバー物理システム(CPS)は、決定を下し、動的環境の中で相互作用するために設計されたサイバーと物理的コンポーネントを組み合わせたシステムである。
これまでの取り組みは、シーンを生成するために形式言語を使用してシナリオを記述することに重点を置いてきた。
我々は、オープンソースのゲームエンジンであるGodot内のシーンを再構築する、別のアプローチを紹介します。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:55:28 GMT)
Sim911: Towards Effective and Equitable 9-1-1 Dispatcher Training with an LLM-Enabled Simulation [1.6] 大規模言語モデル(LLM)を用いた9-1-1ディスパッチの最初の訓練シミュレーションであるSim911を紹介する。
Sim911は,(1)実世界のシナリオを忠実に反映したシミュレーションを生成するために,アーカイブされたコールデータを利用する知識構築,(2)動的プロンプトとベクトルベースを利用するコンテキスト認識制御生成,(3)低品質応答をフィルタリングしてシステム性能を洗練するループ補正による検証,という3つの技術革新を通じて,トレーニングを強化する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:02:32 GMT)
ZenSVI: An Open-Source Software for the Integrated Acquisition, Processing and Analysis of Street View Imagery Towards Scalable Urban Science [1.5] ストリートビューイメージ(SVI)は、街路の特徴や構築環境を理解し、特徴付けるために、過去10年間に多くの研究で役立っている。
我々は,フリーでオープンソースのPythonパッケージであるZenSVIを開発し,SVI解析の全プロセスを統合し実装する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:13:17 GMT)
Leveraging Deep Learning with Multi-Head Attention for Accurate Extraction of Medicine from Handwritten Prescriptions [1.5] 本稿では,Mask R-CNN と Transformer-based Optical Character Recognition (TrOCR) を組み合わせた医薬名抽出手法を提案する。
提案手法は標準ベンチマークで1.4%の文字誤り率(CER)を達成した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:09:33 GMT)
DelGrad: Exact event-based gradients in spiking networks for training delays and weights [1.5] スパイキングニューラルネットワーク(SNN)は本質的には情報表現と処理のための信号のタイミングに依存している。
我々は,シナプス重みと遅延の両方について,正確な損失勾配を計算するイベントベース手法であるDelGradを提案する。
ノイズの多い混合信号ハードウェア上でSNNに遅延を追加する際のメモリ効率と精度の利点を実験的に示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:41:24 GMT)
Re-assessing ImageNet: How aligned is its single-label assumption with its multi-label nature? [1.5] 我々は、ImageNetとその変種であるImageNetV2上で、事前訓練された最先端ディープニューラルネットワーク(DNN)モデルの有効性を分析する。
以上の結果から,これらの報告された減少は,十分な注意が払われていないデータセットの特徴に起因することが示唆された。
この結果は,ベンチマーク中のImageNetデータセットのマルチラベル性を考慮することの重要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:55:31 GMT)
Learning Low-Level Causal Relations using a Simulated Robotic Arm [1.5] 因果学習により、人間の行動が既知の環境に与える影響を予測することができる。
シミュレーションロボットアームによって生成されたデータに基づいて,前方モデルと逆モデルを学ぶことにより因果関係を研究する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 21:47:37 GMT)
Scalable Quantum-Inspired Optimization through Dynamic Qubit Compression [1.5] ハード最適化の問題は、しばしばイジングモデルにマッピングされ、量子的優位性を持つ潜在的な解を約束するが、短期デバイスにおける制限量子ビット数によって制限される。
我々は,大規模Isingモデルを動的に圧縮し,異なるサイズで利用可能な量子ハードウェアに適合させる,革新的な量子インスパイアされたフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:51:42 GMT)
An Improved Fault Diagnosis Strategy for Induction Motors Using Weighted Probability Ensemble Deep Learning [1.4] 誘導電動機の故障早期検出は, 産業環境での未中断運転の確保に不可欠である。
WPEDL法は振動と電流の特徴から抽出した高次元データを用いて誘導電動機故障を効果的に診断する。
提案モデルは他のモデルよりも優れ,98.89%の精度を実現している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:02:44 GMT)
Pilot-Quantum: A Quantum-HPC Middleware for Resource, Workload and Task Management [1.4] textitPilot-Quantumは、ハイブリッド量子古典環境にわたるリソースとワークロードのアプリケーションレベルの統一管理を提供する。
リソース、ワークロード、タスクを管理するために、もともとHPC用に開発されたPilot Abstraction概念モデルを実装している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:55:46 GMT)
ASP-based Multi-shot Reasoning via DLV2 with Incremental Grounding [1.4] DLV2は知識表現と推論のためのAIツールである。
DLV2の反復的推論への進化から得られた新しい漸進的推論器を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:37:03 GMT)
Generating event descriptions under syntactic and semantic constraints [1.3] イベント記述を生成する3つの異なる方法を比較する。
すべての手法が、自然で典型的で独特な事象記述を確実に生成することがわかった。
提案手法は,下流のアノテーションや分析に十分な品質のイベント記述を自動生成する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:28:41 GMT)
Learning Sign Language Representation using CNN LSTM, 3DCNN, CNN RNN LSTM and CCN TD [1.2] 本研究の目的は,手話授業システムにおいて最適なニューラルネットワークアルゴリズムの評価と同定を行うことである。
3DCNNアルゴリズムは、TTSLデータセットでは91%、ASLデータセットでは83%の精度で、これらのシステムから最高のニューラルネットワークアルゴリズムを実行することが判明した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:47:08 GMT)
Steering spin fluctuations in lattice systems via two-tone Floquet engineering [1.2] パラメトリック共鳴を用いた周期的に変調されたスピン交換を持つ1次元スピン-1/2格子を考える。
分散スピン交換変調から生じる分光力学は、準最大相関状態に達するスピン対のゆらぎをもたらす。
本稿では,相互作用する多体ダイナミクスを制御し,相関するスピン対の空間的および時間的局在を生成するプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:01:46 GMT)
A Many Objective Problem Where Crossover is Provably Indispensable [1.2] 本稿では、進化的多目的最適化(EMO)の理論に対処し、多目的最適化におけるクロスオーバー作用素の役割に焦点を当てる。
我々は、多目的問題クラスと、広く使われているNSGA-IIIの理論解析を併用して、クロスオーバーが実行時に指数的なスピードアップをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:00:37 GMT)
Zero-Shot Conditioning of Score-Based Diffusion Models by Neuro-Symbolic Constraints [1.2] 本研究では,事前学習した無条件スコアベース生成モデルを用いて,任意の論理的制約の下で条件分布からサンプルを抽出する手法を提案する。
ユーザ定義制約の非正規化分布条件から標本化するために,学習したスコアの操作方法を示す。
ソフト論理制約を符号化するための柔軟で数値的に安定なニューロシンボリック・フレームワークを定義する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:32:02 GMT)
Explainable AI for Multivariate Time Series Pattern Exploration: Latent Space Visual Analytics with Temporal Fusion Transformer and Variational Autoencoders in Power Grid Event Diagnosis [1.2] 本稿では、時間融合変換器(TFT)と変分自動符号化器(VAE)の2つの生成AIモデルを統合する新しい視覚分析フレームワークを提案する。
複雑なパターンを低次元の潜在空間に還元し、PCA, t-SNE, UMAPなどの次元還元技術を用いて2次元でDBSCANで可視化する。
このフレームワークは電力グリッド信号データのケーススタディを通じて実証され、多様な根本原因を持つ障害や異常を含むマルチラベルグリッドイベントシグネチャを識別する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:04:52 GMT)
Fundamental Limits in the Search for Less Discriminatory Algorithms -- and How to Avoid Them [1.1] 異なる影響原理は、不公平なデータ駆動型アルゴリズム決定をターゲットとする重要な法的手段を提供する。
本稿では,識別アルゴリズム(LDAs)の探索と使用の限界を表す4つの基本的結果を示す。
この設定で達成できることを制限するネガティブな結果のそれぞれに対して、効果的で低コストな戦略が存在することを示す肯定的な結果を提示します。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:49:48 GMT)
Hypergraph Attacks via Injecting Homogeneous Nodes into Elite Hyperedges [1.1] ハイパーグラフニューラルネットワーク(HGNN)は敵の攻撃に対して脆弱である。
均一ノードをエリートハイパーエッジ(IE-Attack)に注入するハイパーグラフ攻撃(ハイパーグラフ攻撃)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:48:41 GMT)
Discovery of 2D Materials via Symmetry-Constrained Diffusion Model [1.1] 空間群対称性を生成過程に統合する対称性制約拡散モデル(SCDM)を導入する。
このモデルは対称性の原理に固執することを保証するため、2000の候補構造が生成される。
その結果, 対称性の制約を取り入れることで, 生成した2次元材料の有効性が向上することがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:03:33 GMT)
Generalized Orthogonal Procrustes Problem under Arbitrary Adversaries [1.0] 半定値緩和法(SDR)と一般化パワー法(GPM)という反復法を用いて最小二乗推定値を求める。
さらに,低ランク因数分解アルゴリズムを解析し,対応する最適化環境が局所最小化器を含まないことを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:53:59 GMT)
Extracting triples from dialogues for conversational social agents [1.0] トリプル抽出は主にウィキペディアのテキストとデータを使って知識ベースコンプリートのために開発され、テストされている。
共参照、楕円、調整、暗黙的かつ明示的な否定や確認といった現象はウィキペディアのテキストよりも会話において顕著である。
最高精度は完全三重奏で51.14、単発で試験すると三重奏で69.32である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:48:16 GMT)
Evaluating Zero-Shot Multilingual Aspect-Based Sentiment Analysis with Large Language Models [1.0] 我々は,大規模言語モデル(LLM)をゼロショット条件下で評価し,ABSA課題に取り組む可能性を探る。
本稿では,バニラゼロショット,チェーン・オブ・シント(CoT),自己改善,自己議論,自己整合性など,様々な促進策について検討する。
その結果、LLMは多言語ABSAを扱う上での有望性を示すが、一般的には細調整されたタスク固有モデルに欠けることがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:41:40 GMT)
Open-Vocabulary Mobile Manipulation Based on Double Relaxed Contrastive Learning with Dense Labeling [1.0] オープン語彙の指示に基づいて,日常的な物体を特定の家具に搬送するDSRを開発した。
本手法は,室内環境の事前収集画像から対象物と受容物の画像を取得することに焦点を当てる。
本稿では, 正, ラベルなし, 負のサンプルの中から多様で頑健な表現を学習するRelaX-Formerを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:56:48 GMT)
An Empirical Analysis of Federated Learning Models Subject to Label-Flipping Adversarial Attack [0.9] 本稿では,選択したフェデレーション学習モデルに対する敵対的攻撃を実証的に分析する。
各モデルに対して,ラベルフリッピング攻撃をシミュレートし,フェデレートされた10のクライアントとフェデレートされた100のクライアントで広範囲に実験を行った。
ラベルフリップ攻撃における2つのベクトルに対して,モデル固有の堅牢性が異なることが判明した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:47:25 GMT)
Predator Prey Scavenger Model using Holling's Functional Response of Type III and Physics-Informed Deep Neural Networks [0.9] 本稿では,捕食者の捕食行動モデルの作成とシミュレーションを紹介する。
捕食反応について、それぞれの捕食種はHollingのIII型の機能的応答を持つと仮定される。
パラメータ推定には、Adamバックプロパゲーション法を用いて物理インフォームドディープニューラルネットワークを用いる。
ニューラルネットワークの場合、平均二乗誤差と物理インフォームドインフォームドエラーが考慮される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:02:38 GMT)
Superactivation and Incompressibility of Genuine Multipartite Entanglement [0.8] 反直感効果の1つは超活性化現象であり、これは量子状態の2つのコピーが単一コピーレベルで欠落している相関の形式を示す可能性があることを意味する。
我々は,本現象の完全な理解に向けて,真の多部交絡のパラダイムを用いた体系的アプローチを開発する。
単一コピーレベルに還元できないマルチコピーシステムにおける圧縮不能な絡み合いの証拠を提示する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:35:04 GMT)
FameBias: Embedding Manipulation Bias Attack in Text-to-Image Models [0.8] テキスト・ツー・イメージ(T2I)拡散モデルは急速に進歩し、記述と密接に一致した高品質な画像を生成することができる。
最近の研究によると、攻撃者は単純な微調整によってこれらのモデルにバイアスを埋め込むことができる。
本稿では、入力プロンプトの埋め込みを操作し、特定の公開人物を特徴とする画像を生成するT2Iバイアス攻撃であるFairBiasを紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:11:37 GMT)
A Survey on the Principles of Persuasion as a Social Engineering Strategy in Phishing [0.8] 説得の原則と社会工学の攻撃の関連は、サイバーセキュリティにおいて重要なトピックである。
本研究は, フィッシングにおける説得の原理の理解における技術の現状を体系的に要約し, 提示するものである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:19:36 GMT)
Measurement-based quantum computation from Clifford quantum cellular automata [0.7] 測定ベースの量子計算(MBQC)は、局所的な測定によって計算を駆動する量子計算のパラダイムである。
MBQCはクリフォード量子セルオートマトン(CQCA)に基づく量子計算モデルと関連していることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:47:48 GMT)
Generative Modeling: A Review [0.7] 生成的手法(Gen-AI)は機械学習とベイジアン推論のタスクを解くための特定の目標としてレビューされる。
生成モデルは、大規模なトレーニングデータセットをシミュレートし、深層ニューラルネットワークを使用して教師付き学習問題を解決する必要がある。
Gen-AI法の主な利点は、モデルフリーであることと、ディープニューラルネットワークを用いて条件密度や関心の後方量子を推定できることである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 21:27:48 GMT)
Analytical Study of the Non-Hermitian Semiclassical Rabi Model [0.7] $mathcalPT$-breakken フェーズは、幅広い原子周波数の数値的な位相と密接に一致している。
励起状態の集団のダイナミクスを解析することにより、フーリエスペクトルにおけるいくつかの安定振動を観測する。
この分析処理は、この非エルミート原子-場相互作用系の主物理の簡潔で正確な記述を提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:02:34 GMT)
Transpiling Quantum Assembly Language Circuits to a Qudit Form [0.6] マルチコントロールゲートの分解において異なるいくつかのクウディットトランスパイル法の比較を行った。
クォーディットの潜在的な利点を示すトランスパイリング回路のいくつかの例を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:50:31 GMT)
A Multimodal Approach For Endoscopic VCE Image Classification Using BiomedCLIP-PubMedBERT [0.6] 本稿では,マルチモーダルモデルであるBiomedCLIP PubMedBERTの微細調整によるビデオカプセル内視鏡フレームの異常の分類について述べる。
本手法では, 血管拡張症, 出血, エロージョン, エリテマ, 異物, リンパ管拡張症, ポリープ, 潰瘍, ワーム, 正常の10種類の画像に分類する。
分類、精度、リコール、F1スコアなどのパフォーマンス指標は、内視鏡フレームの異常を正確に識別する強力な能力を示している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:12:18 GMT)
Quantum framework for Reinforcement Learning: integrating Markov Decision Process, quantum arithmetic, and trajectory search [0.6] 本稿では、強化学習(RL)タスクに対処する量子フレームワークを提案する。
量子の概念と量子探索アルゴリズムを用いることで、この研究は量子領域内でのエージェント-環境相互作用の実装と最適化を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:28:34 GMT)
3DGraphLLM: Combining Semantic Graphs and Large Language Models for 3D Scene Understanding [0.6] 3Dシーングラフはコンパクトなシーンモデルを表し、オブジェクトに関する情報とそれらの間のセマンティックな関係を格納する。
本研究では,3Dシーングラフの学習可能な表現を構築するための3DGraphLLMを提案する。
学習可能な表現は、3次元視覚言語タスクの実行にLLMの入力として使用される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:21:58 GMT)
ERUP-YOLO: Enhancing Object Detection Robustness for Adverse Weather Condition by Unified Image-Adaptive Processing [0.5] 霧や低照度などの悪天候に対する画像適応型物体検出法を提案する。
本フレームワークでは, 後段物体検出に適した画像強調を行うために, 可変プリプロセッシングフィルタを用いる。
我々は,統一画像処理(ERUP)-YOLOによる拡張ロバストネス(Enhanced Robustness)と呼ばれる提案手法をYOLOv3検出器に適用することにより評価した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:24:27 GMT)
Locally Convex Global Loss Network for Decision-Focused Learning [0.5] 意思決定中心学習(DFL)は、予測モデルを統合してより良い意思決定を行うタスク指向の予測フレームワークである。
意思決定中心学習(DFL)は、予測モデルを統合してより良い意思決定を行うタスク指向の予測フレームワークである。
本稿では,一般DFLで実装可能なグローバルサロゲート損失モデルであるConvex Global Loss Network (LCGLN)を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:19:38 GMT)
Agents on the Bench: Large Language Model Based Multi Agent Framework for Trustworthy Digital Justice [0.5] 本稿では,エージェントベンチという,大規模言語モデルに基づくマルチエージェントフレームワークを提案する。
提案手法では,複数のLCM主体のエージェントを用いて,司法機関の協調的検討と意思決定過程をシミュレートする。
我々の枠組みは、現実世界の司法プロセスをより深く反映し、正確性、公正性、社会的な考慮を向上する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:13:37 GMT)
The Thousand Brains Project: A New Paradigm for Sensorimotor Intelligence [0.5] 私たちは、AIの代替的な補完的な形式を開発するための、現在進行中の研究プロジェクトであるSagare Brains Projectについて概説する。
多様なタスクを素早く学習するのに適した感覚運動エージェントである1000脳システムの初期バージョンを提示する。
我々は、数千の脳システムの設計を動機づける鍵となる原則を概説し、モンティの実装の詳細、そしてそのようなシステムの最初のインスタンス化について述べます。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:32:37 GMT)
Randomized Benchmarking with Synthetic Quantum Circuits [0.5] 我々はRandomized benchmarking(RB)のサンプル効率を高めるための広範なフレームワークを紹介する。
我々の戦略は、任意のベンチマークグループに適用され、入力データと出力データの古典的な後処理を伴う「合成」量子回路を使用する。
実験的な高スピン系の場合,合成RBプロトコルは回転不変誤差率の測定の複雑さを低減できることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:10:00 GMT)
Schödinger Bridge Type Diffusion Models as an Extension of Variational Autoencoders [0.4] 本稿では,SB型モデルを変分オートエンコーダの拡張として再解釈することにより,拡散モデルを構築するための統一的なフレームワークを提案する。
対象関数は, 先行損失とドリフト整合部からなる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:43:14 GMT)
CwA-T: A Channelwise AutoEncoder with Transformer for EEG Abnormality Detection [0.4] CwA-Tは、チャネルワイズCNNベースのオートエンコーダと、効率的なEEG異常検出のためのシングルヘッドトランスフォーマー分類器を組み合わせた、新しいフレームワークである。
TUH異常脳波コーパスを用いて、提案モデルは85.0%の精度、76.2%の感度、91.2%の特異性を達成する。
この枠組みはチャネル設計を通じて解釈可能性を維持しており、神経科学研究や臨床実践における将来の応用の可能性を示している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:56:06 GMT)
Elevating Information System Performance: A Deep Dive into Quality Metrics [0.4] 本研究では、システム品質(SQ)、情報品質(IQ)、サービス品質(SerQ)の関係について検討する。
その結果,SQが高いとIQが向上し,SerQが向上し,ユーザ満足度が向上することが示された。
SerQは、システム全体のパフォーマンスを示す最も関連性の高い指標として現れます。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:50:57 GMT)
LoRaWAN attack in military use case [0.4] 軍事用LoRaWANネットワークに対するリプレイとスニッフの2つの攻撃シナリオについて検討する。
その狙いは、そのようなテクノロジーを批判的な文脈で使用する際に考慮すべきサイバーセキュリティの脅威を強調することである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:13:16 GMT)
The Continuous Logarithm in the Complex Circle for Post-Quantum Cryptographic Algorithms [0.4] 本稿では,複素円の連続対数に基づく新しい暗号手法を提案する。
本稿では,量子後暗号の堅牢かつ適応的な基盤を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:41:15 GMT)
Deep Adaptive Interest Network: Personalized Recommendation with Context-Aware Learning [0.3] 本稿では,Deep Adaptive Interest Network(DAIN)と呼ばれる新しいモデルを提案する。
DAINはユーザの興味を動的にモデル化し、コンテキスト認識学習機構を導入し、正確で適応的なパーソナライズされたレコメンデーションを実現する。
いくつかの公開データセットで実施された実験は、DAINが推奨性能と計算効率の両方で優れていることを示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:15:33 GMT)
Laplace expansions and tree decompositions: polytime algorithm for shallow nearest-neighbour Boson Sampling [0.3] ボーソンサンプリング量子光学実験では、各光子を$m$モード干渉計に送信し、出力の占有パターンを測定する。
我々は,最寄りの浅層回路,すなわち深度$D = MathcalO(log m)$に対して,Cifuentes & Parrilo のアルゴリズムを適用して浅部干渉計の空間性を利用することができるという事実を利用する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:34:26 GMT)
Generating Hard Ising Instances With Planted Solutions Using Post-Quantum Cryptographic Protocols [0.3] 本稿では,パブリックプライベートなMcElieceポスト量子暗号プロトコルに基づくハードインスタンスの生成手法を提案する。
我々のプロトコルは、"バックドア"が悪用されるリスクを伴わずに、量子デバイスをテストし、評価するのに適している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:24:41 GMT)
Detection and Forecasting of Parkinson Disease Progression from Speech Signal Features Using MultiLayer Perceptron and LSTM [0.3] 機械学習技術の応用は、パーキンソン病検出の診断精度の向上に役立つ。
パーキンソン病患者の音声信号の診断機能を用いて,長期記憶LSTMを訓練し,疾患の進行を予測した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:02:43 GMT)
VISION: A Modular AI Assistant for Natural Human-Instrument Interaction at Scientific User Facilities [0.2] 生成AIは、この知識ギャップを埋める機会を提供する。
仮想科学コンパニオン(VISION)のためのモジュラーアーキテクチャを提案する。
VISIONでは低レイテンシでビームラインワークステーション上でLLMベースの動作を行い、X線散乱ビームラインで最初の音声制御実験を行った。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:37:07 GMT)
Tracking Changing Probabilities via Dynamic Learners [0.2] 予測ゲームでは、概念は予測子と予測子の両方として機能し、概念の集合は時間とともに成長する。
我々は,タスクのための多くの予測器,スパース移動平均(SMA)を設計し,研究する。
動的予測と固有学習率をサポートするアイデアの組み合わせが,変化への適応の迅速化という面でのメリットを提供することを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:56:07 GMT)
Weyl-Heisenberg covariant quantization for the discrete torus [0.2] 共変積分量子化は位相空間が$Z_d倍Z_d$である系、すなわち離散周期集合$Z_d=0,1,dotsc d-1$ mod$ d$に移動する系に対して実装される。
位相空間上の(重み)関数から対応する共変積分量子化を導出し、位相空間のポートレートを表示する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:03:20 GMT)
A purely geometrical Aharonov-Bohm effect [0.1] 共変アフィン積分量子化を2次元句読面の運動の研究に応用する。
句読点付近では、量子ゆらぎに影響を及ぼす位相がアフィンベクトルポテンシャルをもたらすことが観察される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:48:19 GMT)
Defect conformal field theory from Sachdev-Ye-Kitaev interactions [0.1] 欠陥点におけるSYK$_q$相互作用と$N$Majorana鎖を結合することにより、境界とインターフェースのCFTの新たなファミリーを導入する。
我々は,欠陥CFTの$g$関数や有効中心電荷など,ユニークな絡み合い特性を計算した。
驚いたことに、伝達係数は、大きな$N$制限で欠陥を横切る有効中心電荷との普遍的関係から逸脱する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:54:36 GMT)
Essential difference between 2D and 3D from the perspective of real-space renormalization group [0.1] 相互情報領域法則は、カダノフのブロックスピン法が2次元(2D)以上で困難であることを示唆している。
テンソルネットワークRGへの跳躍は、後から見れば、相互情報のガイダンスに従い、2Dで効率的である。
しかし、3次元(3D)では、絡み合いは領域法則に従って増大し、3次元ブロックテンソル写像はアプティブRG変換として脅威となる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:55:58 GMT)
AgreeMate: Teaching LLMs to Haggle [0.1] 我々は,自然言語による戦略的価格交渉を行うために,大規模言語モデルを訓練するフレームワークであるAgreeMateを紹介する。
本稿では、疎結合(モジュラー)バルゲインアーキテクチャ内のエージェントとして使用する場合の大規模言語モデルの性能について述べる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 21:57:17 GMT)
Von Neumann Entropy and Quantum Algorithmic Randomness [0.0] 状態 $rho=(rho_n)_n=1infty$ は、$rho_n$ が$n$量子ビット上の密度行列であるような列である。
密度行列のフォン・ノイマンエントロピー$H(d)$は、その固有値分布のシャノンエントロピーである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:09:45 GMT)
Variational quantum state diagonalization with computational-basis probabilities [0.0] 本稿では,変分量子回路の最適化による新しい量子対角化アルゴリズムを提案する。
どちらの場合も、測定確率分布と進化した量子状態の対角化の関係について検討する。
数値シミュレーションと解析的洞察により、変分最適化は入力量子状態を対角化形式に効果的に変換することを示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:13:18 GMT)
VORTEX: A Spatial Computing Framework for Optimized Drone Telemetry Extraction from First-Person View Flight Data [0.0] 本稿では,ドローンテレメトリデータを抽出・解析するVORTEXシステムを提案する。
VORTEXは、PyTorchベースのOCRツールボックスであるMMOCRを使用して、ドローンヘッドアップディスプレイ(HUD)記録からテレメトリ変数を抽出する。
その結果、利用可能なフレームの4.07%を利用する5秒サンプリングレートは、ポイント保持率64%と1秒ベースラインの4.2%以内の平均速度精度で最適なバランスを提供することがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:43:04 GMT)
Unlocking the Potential of Multiple BERT Models for Bangla Question Answering in NCTB Textbooks [0.0] 教育環境におけるテキスト理解の評価は,学生のパフォーマンスの理解とカリキュラムの有効性の向上に不可欠である。
本研究では,国立カリキュラム・テキストブックボード(NCTB)の授業6-10用教科書から,Bangla節に基づく質問応答を自動的に評価する,最先端の言語モデルであるRoBERTa Base,Bangla-BERT,BERT Base-inの能力について検討した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:59:23 GMT)
Universal pulses for superconducting qudit ladder gates [0.0] 我々は、任意の隣接レベル間の一元的回転を発生させる普遍的なパルス構成を提案し、同じコヒーレントな誤差スケーリングはレベルインデックスとは無関係である。
提案手法はトランスモン回路上でテストされ,10~4ドルの誤差を目標とした様々なクディットサイズにおけるゲート忠実度を大幅に向上した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:54:05 GMT)
Unbounded quantum advantage in communication complexity measured by distinguishability [0.0] タスクの複雑さを、それを達成するのに必要な最小限の識別可能性によって測定する。
同じ成功度を達成するために必要となる、最小の識別可能性の古典-量子比が指数関数的にエスカレートすることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:09:15 GMT)
U-Mamba-Net: A highly efficient Mamba-based U-net style network for noisy and reverberant speech separation [0.0] 複雑な環境下での音声分離のための軽量なマンバベースUスタイルモデルU-mamba-netを提案する。
Mambaは、特徴選択機能を組み込んだ状態空間シーケンスモデルである。Uスタイルのネットワークは、対称収縮と拡張パスがマルチ解像度機能を学ぶことができる完全な畳み込みニューラルネットワークである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:51:21 GMT)
Thermalization slowing down of weakly nonintegrable quantum spin dynamics [0.0] 量子多体スピン系の熱分解速度を2つの異なる可積分限界にアプローチして研究する。
どちらの時間スケールも可積分性へのアプローチによって異なることが分かっています。
これにより、量子スピン力学における可積分性の破れの普遍性を確立することができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:54:35 GMT)
The Potential of Convolutional Neural Networks for Cancer Detection [0.0] 畳み込みニューラルネットワーク(CNN)は、医療画像の分析と分類のための強力なツールとして登場した。
本稿では,10種類の癌を検出するためにCNNモデルを応用した最近の研究を包括的に紹介する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:01:36 GMT)
The Jungle of Generative Drug Discovery: Traps, Treasures, and Ways Out [0.0] 新たな$- textit critical$と$textitconstructive -$ view on de novo design evaluation。
広く使用されている評価指標を体系的に調査し、これまで見落とされた重要な落とし穴("traps")を明らかにする。
この結果から,生成的ディープラーニング手法によって提案されるデノボ設計を評価するための新しいレンズが提供されることが期待される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:41:37 GMT)
The $S=\frac{1}{2}$ XY and XYZ models on the two or higher dimensional hypercubic lattice do not possess nontrivial local conserved quantities [0.0] 我々は、モデルがハミルトニアンのような自明なものを除いて局所保存量を持たないことを証明した。
この結果は、モデルが非可積分であることを強く示唆している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:42:23 GMT)
Survey of Pseudonymization, Abstractive Summarization & Spell Checker for Hindi and Marathi [0.0] 本研究の目的は,英語,ヒンディー語,マラティア語でテキスト匿名化,抽象的テキスト要約,スペルチェックなど,さまざまな機能を利用できるプラットフォームを構築することである。
これらのツールの目的は、主にインド地域言語を使用する企業や消費者の顧客に提供することである。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:51:32 GMT)
Structure and statistical properties of the semiclassical Einstein equations [0.0] 我々は、方程式の左辺を、物質の状態が与えられたアインシュタインテンソルの期待値であり、セットアップの各実現における実際の値ではないとみなす。
その結果、半古典的な重力に対する標準的な批判は適用されず、重力は必要な拡張として現れる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:43:01 GMT)
Strong coupling of a chiral molecule with circularly polarised modes inside a cavity [0.0] 空洞内におけるキラル分子と円偏光モードの識別的相互作用を考察する。
両者とも、分子の相対的なハンドネスとキャビティモードに依存する識別成分を得る。
超放射能集合体状態に基づいて、この結果を2つの異なる利き手モードをサポートする空洞に一般化する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:18:04 GMT)
Spread Complexity of High Energy Neutrino Propagation over Astrophysical Distances [0.0] 拡散複雑性は、基底のあらゆる選択における量子状態の最小の拡散を測定する。
複雑性に基づくフレーバー比の定義は、ニュートリノの大量注文に対してわずかながら非ゼロの感度を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:33:04 GMT)
Simple Quantum Gradient Descent Without Coherent Oracle Access [0.0] 変数数に時間対数を持つ量子勾配降下アルゴリズムを開発した。
我々のフレームワークは既存の文献にさらに多くの要素を加え、量子特異値変換の驚くべき柔軟性を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:48:38 GMT)
Sensing force gradients with cavity optomechanics while evading backaction [0.0] 本研究では,コヒーレント駆動機械共振器を用いた力勾配検出と位相感度による動作検出について検討した。
古典的な運動方程式の数値積分によって解かれる光学系の応答は、力勾配の変化に単調な拡張領域を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:16:02 GMT)
RNN-Based Models for Predicting Seizure Onset in Epileptic Patients [0.0] 既存のシステムの精度と誤報率は、静しきい値と基本的な脳波特性に依存しているため、しばしば妥協される。
本稿では,これらの制約を克服するため,新しいリカレントニューラルネットワーク(RNN)を用いた発作発生予測手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:05:01 GMT)
Quasifragmentation functions in the massive Schwinger model [0.0] 我々はKogut-Susskind Hamiltonianを用いた二次元量子電磁力学(QED2)のフェルミオンを導出した。
スピンハミルトニアンの正確な対角化によりクォーク準分数関数 (qFF) を計算する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:43:15 GMT)
Quantum chaos on the separatrix of the periodically perturbed Harper model [0.0] 位相空間上のトーラス上の古典的周期ハミルトニアン系と関連する離散量子系との関係について検討する。
量子系に対するフロケプロパゲータの固有状態を数値計算する。
我々は、セパラトリクスに近いエネルギーを持つ状態で評価された相互作用表現における平均摂動から、関連する量子系の関連式を導出した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:14:55 GMT)
Quantum and classical correlations in shrinking algorithms for optimization [0.0] 最適化問題(COP)の解法として量子コンピューティングを用いる。
本研究では,再帰的に縮小することでCOPを解くアルゴリズムを拡張し,解析する。
量子近似最適化アルゴリズム(QAOA)と古典線形計画法(LP)と半定値計画法(SDP)の相関性を備えたアルゴリズムの性能を比較した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:05:15 GMT)
Quantum Thermodynamics of a Power-Law Potential [0.0] 量子熱機械のスターリングとオットーの数値モデリングの結果について述べる。
完全サイクルにおけるエネルギー交換の低減と性能の効率/係数の表現を導出する。
この発見は、量子熱エンジンの最適化におけるパワーライクなポテンシャルの役割を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 21:11:38 GMT)
Quantum Sieving for Code-Based Cryptanalysis and Its Limitations for ISD [0.0] 上述したサブルーチンの量子変種を設計することで、コードシービングのための最初の量子アルゴリズムを導入する。
我々の量子ウォークアルゴリズムは、局所性に敏感なフィルタリング層を追加することにより、基礎となる探索問題の構造を利用する。
我々の分析は、このフレームワークが量子IDDアルゴリズムの最先端性を上回るように適応されるべきであることを強調している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:20:51 GMT)
Probing critical states of matter on a digital quantum computer [0.0] そこでは, 拡散長スケール上の量子相関により, スケーリング法則が完全に出現するゼロ温度相転移について述べる。
この結果から,古典的手法の限界を超える量子支援テンソルネットワーク収縮への有効な経路が示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:44:44 GMT)
ProCNS: Progressive Prototype Calibration and Noise Suppression for Weakly-Supervised Medical Image Segmentation [0.0] アノテーションコストとモデルパフォーマンスの衝突を軽減するソリューションとして、弱教師付きセグメンテーション(WSS)が登場した。
本稿では,プログレッシブプロトタイプキャリブレーションとノイズ抑圧の原理により考案された2つの相乗的モジュールを包含する新しいWSS手法ProCNSを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:05:27 GMT)
Principal Component Flow Map Learning of PDEs from Incomplete, Limited, and Noisy Data [0.0] 本稿では,力学系の進化をモデル化する計算手法を提案する。
本研究では,高次元非一様格子上の部分観測偏微分方程式(PDE)をモデル化する上での課題に着目する。
本稿では、状態変数や計算領域のサブセットでのみ利用可能なノイズと制限付きデータを用いたPDEモデリングに適したニューラルネットワーク構造を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:05:03 GMT)
Phases and dynamics of quantum droplets in the crossover to two-dimensions [0.0] クロスオーバー領域における超低温原子滴の力学を3次元から2次元に探索する。
主な発見の1つは, 負-正平均場相互作用から平均平均場相互作用への遷移によって, 液滴が大幅に拡張されることである。
クエンチに追従した異方性測地において,複雑なバルクおよび表面密度パターンを形成することが可能であることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:38:06 GMT)
Persuasion and Phishing: Analysing the Interplay of Persuasion Tactics in Cyber Threats [0.0] 本研究では、フェレイラとテレスの研究を拡張し、社会工学における説得原理のユニークなリストを提案する。
メールの内容全体を分析して、フィッシングメールにおける人間の説得の原則を特定した。
本稿では、電子メールのフィッシング戦略に関するさらなる知見を提供し、将来的な解決策は社会技術的原則を活用するべきであることを示唆する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:17:44 GMT)
Parallel Neural Computing for Scene Understanding from LiDAR Perception in Autonomous Racing [0.0] 従来のシーケンシャルネットワークアプローチは、自律エージェントのリアルタイム知識と意思決定要求を満たすのに苦労する可能性がある。
本稿では,真のハードウェア対応並列処理が可能な高度なモデルを開発するための,新しいベースラインアーキテクチャを提案する。
提案モデルでは,LiDARセンサからの生の3Dポイントクラウドデータを入力として,両デバイスの2D Bird’s Eye View Mapに変換する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:56:32 GMT)
On the application of the Rayleigh-Ritz method to a projected Hamiltonian [0.0] 我々は、RRM固有値が、下から投影されたハミルトニアンの値へのアプローチを示す。
また、エネルギーシフトの影響とアイデンティティ演算子の投影についても論じる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:15:21 GMT)
On the Local Complexity of Linear Regions in Deep ReLU Networks [0.0] 低次元特徴表現を学習するReLUネットワークは局所的複雑性が低いことを示す。
特に、局所的な複雑性は、入力データ分布上の関数の総変動の上限として機能することを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:42:39 GMT)
On the ETHOS of AI Agents: An Ethical Technology and Holistic Oversight System [0.0] ETHOSは、AIエージェントのための分散グローバルレジストリである。
システムには、AI固有の法的実体の概念が組み込まれている。
システムは、AIガバナンスに対する協力的で参加的なアプローチの必要性を強調している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:04:18 GMT)
On the Applicability of Zero-Shot Cross-Lingual Transfer Learning for Sentiment Classification in Distant Language Pairs [0.0] 本研究では,XLM-R事前学習モデルを用いて,英語から日本語,インドネシア語への言語間移動学習の適用性を検討した。
本モデルでは,日本語とインドネシア語のデータセットを対象言語を用いて訓練することなく,日本語とインドネシア語のデータセットに比較して最適な結果が得られる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:50:18 GMT)
Noisy Stark probes as quantum-enhanced sensors [0.0] 我々は、ワニエ・スタークプローブのある種のデコヒーレンス強度に対して、量子増強感度が維持可能であることを示した。
これは非相互結合を持つ非エルミート系の2つの例で示される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 14:25:10 GMT)
Neural auto-association with optimal Bayesian learning [0.0] 本稿では,入力層と出力層が同一である自己連想のためのベイズ連想ネットワークについて検討する。
性能は、単純ベイズの仮定に反する入力コンポーネントの微妙な依存関係に依存する可能性があることが判明した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 11:22:18 GMT)
Machine Learning and Deep Learning Techniques used in Cybersecurity and Digital Forensics: a Review [0.0] 機械学習(ML)とディープラーニング(DL)は、サイバーリスクを特定し分析する手法を導入するゲームチェンジ技術として登場した。
本総説では,これらの分野におけるMLおよびDLアプローチのメリットと可能性について概説する。
システム内の侵入を検知したり、マルウェアを分類したり、サイバーセキュリティ攻撃を防いだり、異常を検出し、回復力を高めるために使われるさまざまなAIテクニックをカバーしている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:22:51 GMT)
MERCURY: A fast and versatile multi-resolution based global emulator of compound climate hazards [0.0] コンポウンド気候リスク評価のためのマルチレゾリューションエミュラトR:MERCURYを提案する。
MerCURYは複数変数の多元的エミュレーションのための時間的フレームワークにマルチレゾリューション解析を拡張している。
Wet Bulb Globe temperature, MERCURY's capabilities on the humid-heat metric, Wet Bulb Globe temperature。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:56:21 GMT)
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation [0.0] この論文は、1D$k$-meansクラスタリングの理論と実践を橋渡しし、効率的で健全なアルゴリズムを提供する。
ベンチマークでは、大規模なデータセットのScikit-learnと比較して、4500倍のスピードアップが示されている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 03:43:45 GMT)
Lla-VAP: LSTM Ensemble of Llama and VAP for Turn-Taking Prediction [0.0] 本プロジェクトは,マルチモーダルアンサンブルアプローチを用いて,ターンテイク予測のための既存の戦略を拡張した。
我々は,スクリプト化されたシナリオと記述されていないシナリオの両方において,TRPを識別する精度と効率を改善することを目的としている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:20:38 GMT)
Lattice T-duality from non-invertible symmetries in quantum spin chains [0.0] 我々は、コンパクトボソン CFT の最も単純な双対性、T-双対性、および量子スピン鎖におけるその実現を探求する。
XXモデルの特別な場合、我々は2つの格子 U(1) 対称性を交換する非可逆対称性と関連する正確な格子 T-双対を明らかにする。
我々は、CFTのいくつかの異常がまだ格子上で完全に実現されているか、格子 U(1) 対称性がいかにギャップレス性を強制するかについて議論する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:59:36 GMT)
LMRPA: Large Language Model-Driven Efficient Robotic Process Automation for OCR [0.0] 本稿では,LMRPA(Large Model-Driven Robotic Process Automation Model)を紹介する。
光学文字認識(OCR)タスクの効率と速度を大幅に向上させるように設計されている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:21:36 GMT)
Interplay of ISMS and AIMS in context of the EU AI Act [0.0] EU AI Act(AIA)は、リスク管理システム(RMS)と品質管理システム(QMS)のハイリスクAIシステムの実装を規定している。
本稿では,情報セキュリティ管理システム(ISMS)とAIMS(AIMS)のインターフェースについて検討する。
BSI GrundschutzフレームワークにAIシステムのセキュリティを包括的に保証するために、4つの新しいAIモジュールが提案されている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:13:19 GMT)
Infinitely fast critical dynamics: Teleportation through temporal rare regions in monitored quantum circuits [0.0] 測定速度が時間的に変動する監視量子回路における測定誘起相転移を考察する。
測定レートの空間的に相関した変動は、低測定レートのボリュームロー位相を乱す。
臨界測定速度では、超高速の動力学で絡み合う相転移が起こる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:51:59 GMT)
Improving LLM Abilities in Idiomatic Translation [0.0] NLLBやGPTのような言語モデル(LLM)では、イディオムの翻訳は依然として難しい課題である。
我々のゴールは、慣用的な言語のLLM処理を改善することで、翻訳の忠実度を高めることである。
文化的なニュアンスを維持し、翻訳されたテキストが意図と感情の共鳴を維持することを保証するため、これは大きな社会的影響を持つ。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:38:40 GMT)
Grover's search meets Ising models: a quantum algorithm for finding low-energy states [0.0] 本稿では,障害のあるIsingモデルのディジタル量子シミュレーションにおいて,Groverのアルゴリズムを実装する手法を提案する。
目的状態の位相反転を確実にすることで最適な進化時間を決定する。
この方法は古典的な方法に比べて2次的なスピードアップをもたらす。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:35:24 GMT)
Graph Neural Networks Are Evolutionary Algorithms [0.0] Graph Neural Evolution(GNE)は、グラフ内のノードとして個人をモデル化する新しい進化アルゴリズムである。
GNEは、GA、DE、CMA-ES、SDAES、RL-SHADEといった最先端のアルゴリズムを一貫して上回っている。
GNEはEAとGNNを結びつける概念的および数学的基盤を確立し、両方の分野に新たな視点を提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:27:44 GMT)
Generating Traffic Scenarios via In-Context Learning to Learn Better Motion Planner [0.0] 最先端のモーションプランナーは、慎重にキュレートされたデータセットで訓練される。
このようなシナリオを考慮できないことは、計画立案者に重大なリスクをもたらし、テスト中にインシデントを引き起こす可能性がある。
より堅牢な運動プランナを訓練するための,多様な重要な交通シナリオを生成するための安価な手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 01:52:19 GMT)
Gaussian entropic optimal transport: Schrödinger bridges and the Sinkhorn algorithm [0.0] エントロピー最適輸送問題は、最適輸送問題の正規化版である。
これらの問題はシンクホーンアルゴリズム(反復比例フィッティング法)を用いて一般的に解決される。
より一般的な設定では、シンクホーン反復は非線形条件/共役変換に基づいており、正確な有限次元解は計算できない。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:49:02 GMT)
GCN-ABFT: Low-Cost Online Error Checking for Graph Convolutional Networks [0.0] グラフ畳み込みネットワーク(GCN)は、グラフ構造化データのための機械学習アプリケーションの構築に人気がある。
我々はGCNアクセラレーターにおける重要なアーキテクチャ上の課題に対処する:GCN計算におけるランダムなハードウェア故障に起因するエラーを最小コストで検出する方法。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:27:19 GMT)
From CNN to CNN + RNN: Adapting Visualization Techniques for Time-Series Anomaly Detection [0.0] ディープニューラルネットワークは複雑な問題を解決するのに非常に効果的であるが、しばしば「ブラックボックス」と見なされる。
本稿では,ビデオベースモデルを視覚的に解釈することの難しさを強調し,静的画像の手法を再帰的アーキテクチャに適用できることを実証する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:58:48 GMT)
Fisher information and quantum entropies of a 2D system under a non-central scalar and a vector potentials [0.0] 双極子モーメントを持つクラッツァーポテンシャルからなる非中央ポテンシャルに影響される2次元システムについて検討する。
我々は、フィッシャー情報、シャノンエントロピー、ツァリスエントロピー、レニエントロピーなど、様々な情報理論を探求する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:51:02 GMT)
Extraordinary manifestation of near electrostatic field caused by macroscopic quantum shell effects in submicron hemispherical clusters [0.0] 強静電場がヘミスフェラル形状の孤立無電荷金属ナノクラスターの近傍に存在することを示す。
この物理現象は、サブミクロン金属クラスターにおける量子シェル効果に関連する電子の分布における大規模な空間的不均一性の結果である。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:02:10 GMT)
Exploring Embedding Priors in Prompt-Tuning for Improved Interpretability and Control [0.0] 本稿では,Prompt-Tuningでよく見られる埋没崩壊現象が,モデルの最終性能に与える影響について検討する。
以上の結果から, 先行は調整した埋め込みの位置に強く影響し, モデルが活性化空間の異なる部分からの埋め込みを効果的に扱えることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:18:52 GMT)
EvoPat: A Multi-LLM-based Patents Summarization and Analysis Agent [0.0] EvoPatはマルチLLMベースの特許エージェントで、ユーザーが検索生成(RAG)と高度な検索戦略を通じて特許を分析するのを支援する。
特許要約,比較分析,技術評価などのタスクにおいて,EvoPatがGPT-4より優れていることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 02:21:09 GMT)
Entropy production due to spacetime fluctuations [0.0] 重力波と相互作用する非相対論的量子系を考える。
我々は、この系のゆらぎ関係を定義するために、量子力学に対する一貫したヒストリーアプローチを用いる。
結果として、熱力学的エントロピーは、時空の量子ゆらぎと避けられない相互作用のために、システム内で生成されなければならない。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:53:27 GMT)
Entanglement and quantum discord in the cavity QED models [0.0] 両部量子系における光と物質間の量子相関について検討する。
量子マスター方程式の解法により、開系における散逸ダイナミクスを導出することができる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 20:34:54 GMT)
Entanglement and Coherence Dynamics in Photonic Quantum Memristors [0.0] フォトニック量子メムリスタ(PQM)はその量子コヒーレンスにメムリシブダイナミクスを示す。
私たちは、実量子ビットベースの量子コンピュータ(IBM-Q)上でPQMの回路モデルを構築し、実行します。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:14:07 GMT)
Efficient Aircraft Design Optimization Using Multi-Fidelity Models and Multi-fidelity Physics Informed Neural Networks [0.0] 本研究では,サロゲートモデル,リダクションオーダーモデル(ROM),マルチファイダリティ機械学習技術など,高度な手法について検討する。
概念実証タスクを通じて、低忠実度シミュレーションから高忠実度結果を予測する能力を示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:36:27 GMT)
ERPA: Efficient RPA Model Integrating OCR and LLMs for Intelligent Document Processing [0.0] 本稿では,移民におけるOCRタスクのIDデータ抽出と最適化を目的とした,革新的なロボットプロセス自動化(RPA)モデルであるERPAを提案する。
ベンチマークの結果、ERPAは処理時間を最大94%削減し、IDデータの抽出をわずか9.94秒で完了している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 09:44:43 GMT)
DynaGRAG: Improving Language Understanding and Generation through Dynamic Subgraph Representation in Graph Retrieval-Augmented Generation [0.0] グラフ検索型拡張生成(GRAG)フレームワークを提案する。
提案手法により,下層のセマンティック構造をより包括的に理解することができる。
複数のベンチマークデータセットの実験結果から,提案したGRAGフレームワークの有効性が示された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:06:53 GMT)
Discovery of Quasi-Integrable Equations from traveling-wave data using the Physics-Informed Neural Networks [0.0] PINNは2+1次元非線形偏微分方程式の渦解の研究に用いられる。
保存法則(cPINN)、初期プロファイルの変形、および識別の解像度を改善するための摩擦アプローチを考察する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:11:32 GMT)
Device-independent, high bit-rate quantum random number generator with beam-splitter-free architecture and live Bell test certification [0.0] 本稿では,実時間ベル試験データによる実時間量子性認証付きデバイス非依存型量子乱数生成器(DI-QRNG)を提案する。
我々は46.4秒で9000万の生ビットを生成し、最小エントロピー抽出比は97$%$を超える。
QRNGは1.8Mbpsのビットレートを獲得し、NIST 800-22とTestU01の全てのテストに合格した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:43:54 GMT)
Crosscap Quenches and Entanglement Evolution [0.0] そこで我々は,クロスキャップクエンチ'と呼ばれる新しいクエンチプロトコルを提案する。
我々は共形場理論(CFT)を解析し、絡み合いエントロピーの時間進化における普遍的特徴を導出する。
非可積分スピン系および可積分スピン系における数値シミュレーションによりこれらの知見を検証した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 18:59:58 GMT)
Crime Hotspot Analysis and Mapping Using Geospatial Technology in Dessie City, Ethiopia [0.0] デシー市中心部のHote、Arada、Segnoの地区は「ホットスポット」という犯罪の少ない場所であることが判明した。
-3.231から0.116までの低負のZスコアは、市北部のメナフェシャとブーンブーワの「冷たい場所」に犯罪が集中していることを示している。
犯罪の大半は、北東から南西に流行する殺人を除いて、南北方向を示していた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:33:01 GMT)
Continuous variable entanglement in a cold-atoms mirrorless optical parametric oscillator [0.0] 本研究では、ミラーレス光パラメトリック発振器(MOPO)によるモード間の絡み合いを観察するために、内部と外部の原子自由度の両方を探索する。
このプラットフォームは、量子ネットワーク技術で使用可能な、多くの光学モード間のマルチパーティの絡み合いの生成を可能にする。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 21:10:44 GMT)
Contextual Backpropagation Loops: Amplifying Deep Reasoning with Iterative Top-Down Feedback [0.0] 中間表現を洗練させるためにトップダウンフィードバックを組み込んだ反復的なメカニズムとしてコンテキストバックプロパゲーションループ(CBL)を導入する。
我々の結果は、CBLが現代のディープラーニングアーキテクチャにそのような文脈推論を組み込むための、単純かつ強力な方法を提供することを示唆している。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:24:32 GMT)
Combining GPT and Code-Based Similarity Checking for Effective Smart Contract Vulnerability Detection [0.0] スマートコントラクトの脆弱性識別ツールであるSimisaryGPTを提案する。
similarGPTの主な概念は、検査中のコードとサードパーティのライブラリのセキュアなコードとの類似度を測定することである。
本稿では, トポロジカルオーダを用いた検出シーケンスの最適化により, 論理的コヒーレンスを高め, 検出時の偽陽性を低減することを提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:15:48 GMT)
Can ChatGPT capture swearing nuances? Evidence from translating Arabic oaths [0.0] 30人のアラビア語の誓いが文献から集められた。
30の誓いを最初にChatGPTで翻訳し、ChatGPTで満たされていないギャップの種類で人間の翻訳と比較した。
誓いのChatGPT翻訳はいまだに不満足であり、ChatGPTのさらなる発展の必要性を明らかにしている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:31:03 GMT)
CAG: Chunked Augmented Generation for Google Chrome's Built-in Gemini Nano [0.0] Chunked Augmented Generation (CAG)は、Google Chromeに組み込まれたGemini Nanoモデルのコンテキストウィンドウ制限を克服するために設計されたアーキテクチャである。
この実装は,大規模なドキュメントやデータセットを直接Chrome内で処理する上で,特に有効であることを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 23:49:23 GMT)
Breakdown of the Quantum Distinction of Regular and Chaotic Classical Dynamics in Dissipative Systems [0.0] 孤立系において、量子カオス (quantum chaos) とは、古典的な系がカオスであるときに現れるスペクトルの性質を指す。
オープン量子モデルにおける立方体レベル反発の開始は、古典的極限におけるカオス構造と必ずしも関係がないことを示す。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 08:50:13 GMT)
BoxMAC -- A Boxing Dataset for Multi-label Action Classification [0.0] BoxMACは15のプロボクサーと13のアクションラベルを備えた現実世界のボクシングデータセットである。
本稿では,画像とビデオの両方において,複数の動作を共同認識するための新しいアーキテクチャを提案する。
BoxMACはスポーツとしてのボクシングの発展のための貴重な資源として機能する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 06:20:01 GMT)
Blockchain-Driven Research in Personality-Based Distributed Pair Programming [0.0] 本研究では、ブロックチェーン技術をパーソナリティに基づくペアプログラミング研究に統合し、その一般化性と適応性を高めることを目的とする。
ROMA(Role-Optimization Motivation Alignment)フレームワークの開発において、人間とAIのプログラミングの役割は、個々のBig Fiveパーソナリティの特徴と一致している。
その結果、ブロックチェーンは研究の一般化可能性、提案、透明性を高め、ROMAは個人のモチベーションとチームのパフォーマンスを高めることが示唆された。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 00:39:30 GMT)
Bivariate Matrix-valued Linear Regression (BMLR): Finite-sample performance under Identifiability and Sparsity Assumptions [0.0] 行列値線形回帰モデルでは, mathbbRn×p$の$T$応答$(Y_t)_t=1Tと, mathbbRm×q$の予測子$(X_t)_t=1Tを推定する。
最適化のない明示的な推定器を提案し、その性能を定量化するために非漸近収束率を確立する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:58:39 GMT)
Bidirectional Topic Matching: Quantifying Thematic Overlap Between Corpora Through Topic Modelling [0.0] Bidirectional Topic Matching (BTM) は、コーパス間の主題の重なり合いとばらつきを定量化するクロスコーパス・トピック・モデリングの新しい手法である。
BTMは二重モデルアプローチを採用し、各コーパスごとに個別のトピックモデルをトレーニングし、相互に適用して包括的なクロスコーパス比較を可能にする。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 12:02:43 GMT)
Bayesian Optimization of Bilevel Problems [0.0] 本稿では,上層機能と下層機能の両方がブラックボックスであり,評価に費用がかかる二段階最適化に焦点を当てる。
本稿では,上層および下層関数をガウス過程として,上層および下層決定の組合せ空間上でモデル化するベイズ最適化フレームワークを提案する。
実験の結果,提案アルゴリズムはサンプリング効率が高く,高品質な解を求める既存手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:55:30 GMT)
Applications of Scientific Machine Learning for the Analysis of Functionally Graded Porous Beams [0.0] 本研究では,FG多孔質ビームの解析におけるSciML(SciML)のアプローチについて検討した。
この方法は、ニューラルネットワーク/演算子の出力を変位場への近似とみなす。
神経オペレーターは、機能的にグレードされた材料で多孔質ビームの応答を予測するために訓練されている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 10:45:47 GMT)
An alternative non-unitary implementation for the quantum search algorithm [0.0] グロバー探索アルゴリズムにおける最後の量子状態は、グラマーシュミット過程における正規化マーク量子状態であることを示す。
元のアルゴリズムのマーキング部分である$U_mark$を使っているため、アルゴリズムの複雑さはこの演算子の複雑さによって制限される。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:58:43 GMT)
An Overview and Discussion of the Suitability of Existing Speech Datasets to Train Machine Learning Models for Collective Problem Solving [0.0] このレポートは、新しい機械学習モデルを考案するための既存のデータセットの適合性を特徴としている。
本報告では,音声言語理解のために開発されたデータセット群の解析を行った。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:22:10 GMT)
An Analysis on Automated Metrics for Evaluating Japanese-English Chat Translation [0.0] チャット翻訳におけるNMTモデルのランク付けには、どのモデルが他のモデルより優れているかを判断する上で、すべての指標が一貫したように見える。
一方、ニューラルベースメトリクスは従来のメトリクスよりも優れており、COMETはチャット翻訳における人間の注釈付きスコアとの相関が最も高い。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:54:40 GMT)
Adversarial Attack Against Images Classification based on Generative Adversarial Networks [0.0] 画像分類システムに対するアドリアック攻撃は、機械学習分野において常に重要な問題であった。
生成的敵ネットワークの普及に伴い、フェイク画像技術の誤用によりセキュリティ上の問題が相次いだ。
本研究は, 画像分類システムの弱点を把握し, 対人攻撃能力を向上させることを目的とした, 新たな対人攻撃手法を提案する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:21:50 GMT)
Accelerating process control and optimization via machine learning: A review [0.0] 機械学習タスクにおける意思決定問題の表現における最近の進歩について論じる。
プロセス最適化と制御の高速化を目的とした機械学習の適用に関するオープンな問題について論じる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:24:29 GMT)
Accelerating Post-Tornado Disaster Assessment Using Advanced Deep Learning Models [0.0] 本研究は,先進的な深層学習モデルを用いて,災害後の評価を自動化する革新的なアプローチを導入する。
提案システムは,災害現場の画像や映像を高速に解析するために,最先端のコンピュータビジョン技術を用いている。
実験の結果,ResNet50の精度は90.28%,画像毎の推定時間は1529msであり,有望な性能を示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 04:04:33 GMT)
A region-wide, multi-year set of crop field boundary labels for Africa [0.0] 2017年から2023年の間に撮影された33,746枚のプラネット画像で、フィールドの境界線を定めました。
品質指標では、ラベルの品質は、全フィールド範囲の尺度では適度に高い(0.75)が、個々のフィールドの個数に関して低いことが示されている。
このサンプルは、中央値の畑の大きさと密度の変動を浮き彫りにして、地域の農業特性に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 15:14:58 GMT)
A new economic and financial theory of money [0.0] 電子通貨の評価はマクロ経済学理論と金融政策の基本方程式に基づく。
電子通貨を、サブエコノミーの有形資産に関連付けられた取引株式として捉えていく。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 05:52:29 GMT)
A diagrammatic method to compute the effective Hamiltonian of driven nonlinear oscillators [0.0] 駆動非線形発振器の有効ハミルトニアンを計算するための新しい図解法を提案する。
我々は,シュリーファー・ヴォルフ法のような既存の摂動法とスキームの整合性を示す。
提案手法は,量子システムにおける動的制御の理解に寄与し,将来的な量子情報プロセッサの進化に不可欠な精度を実現する。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 07:05:48 GMT)
A Time Optimization Framework for the Implementation of Robust and Low-latency Quantum Circuits [0.0] 我々は、同じ量子回路内で高速かつロバストな量子ゲートを使用できる代替パルススケジューリング手法を提案する。
IBMQ Brisbaneの実験により、このアプローチは量子回路の実行における絶対的な成功確率を25%以上改善することを示した。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 16:26:05 GMT)
A Review of the Marathi Natural Language Processing [0.0] 本稿では,インド語におけるNLP研究の進展について概説する。
Marathiと、研究コミュニティが利用できる最先端のリソースとツールに焦点を当てている。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 13:33:51 GMT)
A Review of Latent Representation Models in Neuroimaging [0.0] ラテント表現モデルは、高次元のニューロイメージングデータを低次元のラテント空間に還元するように設計されている。
これらの潜伏空間をモデル化することで、研究者は脳の生物学と機能に関する洞察を得ることを望んでいる。
本総説では, 疾患診断や進行モニタリングなどの臨床応用だけでなく, 基礎的脳機構の解明にもこれらのモデルが用いられていることを論じる。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 19:12:11 GMT)
A Comprehensive Guide to Item Recovery Using the Multidimensional Graded Response Model in R [0.0] 本研究では,R の多次元次数応答モデル (MGRM) における項目回復の段階的実証を行う。
研究の目的に合わせて、これらのステップのR符号が詳細な説明とともに提示され、研究者は自分たちの分析手順を再現し、適応することができた。
論文参考訳(メタデータ) (Tue, 24 Dec 2024 17:28:02 GMT)