Combating Multimodal LLM Hallucination via Bottom-up Holistic Reasoning [151.4] マルチモーダル大規模言語モデル(MLLM)は、視覚言語タスクを前進させる前例のない能力を示した。
本稿では,MLLMにおける幻覚に対処するためのボトムアップ推論フレームワークを提案する。
本フレームワークは、認識レベル情報と認知レベルコモンセンス知識を検証・統合することにより、視覚とテキストの両方の入力における潜在的な問題に体系的に対処する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:10:46 GMT)
GEM: A Generalizable Ego-Vision Multimodal World Model for Fine-Grained Ego-Motion, Object Dynamics, and Scene Composition Control [122.7] 一般化可能なエゴビジョン・マルチモーダル世界モデルであるGEMについて述べる。
参照フレーム、スパース機能、人間のポーズ、エゴ軌道を使って将来のフレームを予測する。
私たちのデータセットは、自律運転、エゴセントリックな人間活動、ドローン飛行など、複数の領域にまたがる4000時間以上のマルチモーダルデータで構成されています。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:21:19 GMT)
GDSG: Graph Diffusion-based Solution Generator for Optimization Problems in MEC Networks [109.2] グラフ拡散型ソリューション生成(GDSG)法を提案する。
このアプローチは、おそらく最適な解に収束しながら、最適以下のデータセットを扱うように設計されている。
グラフニューラルネットワーク(GNN)を用いたマルチタスク拡散モデルとしてGDSGを構築し,高品質な解の分布を求める。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:50:43 GMT)
A Survey on Large Language Model based Autonomous Agents [105.3] 大規模言語モデル(LLM)は、人間レベルの知性を達成する上で、顕著な可能性を示している。
本稿では,LLMに基づく自律エージェントの分野を総合的な観点から体系的に検討する。
本稿では、社会科学、自然科学、工学の分野におけるLLMベースの自律エージェントの多様な応用について概観する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:55:51 GMT)
CoVoMix: Advancing Zero-Shot Speech Generation for Human-like Multi-talker Conversations [97.8] CoVoMixは、ゼロショット、人間ライク、マルチスピーカー、マルチラウンド対話音声生成のための新しいモデルである。
対話モデリングと生成の有効性を測定するための総合的なメトリクスセットを考案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:30:54 GMT)
Adapter-Enhanced Semantic Prompting for Continual Learning [91.6] 継続学習(CL)は、モデルが進化するデータストリームに適応できるようにする。
従来のメソッドは通常、再生のために過去のデータを保持したり、新しい知識を学ぶためにモデルに追加のブランチを追加したりします。
本稿では,プロンプトチューニングとアダプタ技術を統合した軽量CLフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:14:55 GMT)
MatFormer: Nested Transformer for Elastic Inference [91.5] MatFormerは、多様なデプロイメント制約にまたがる弾性推論を提供するように設計された、新しいTransformerアーキテクチャである。
MatFormerは、標準的なTransformerモデルにネストフィードフォワードネットワーク(FFN)ブロック構造を組み込むことで、これを実現している。
8億5000万デコーダのみのMatFormer言語モデル(MatLM)により,5億2200万から8億5千万のパラメータにまたがる複数の小さなモデルを抽出できることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:45:36 GMT)
HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3] 本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:04:16 GMT)
OccScene: Semantic Occupancy-based Cross-task Mutual Learning for 3D Scene Generation [84.3] OccSceneは、きめ細かい3D認識と高品質な生成を統一されたフレームワークに統合する。
OccSceneはテキストプロンプトによってのみ、新しい一貫性のある3Dリアルシーンを生成する。
実験により,OccSceneは屋内および屋外の広いシナリオにおいて,リアルな3Dシーン生成を実現することが示された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:26:51 GMT)
Uni-AdaFocus: Spatial-temporal Dynamic Computation for Video Recognition [82.8] 本稿では,映像理解におけるデータ冗長性の現象について検討し,計算効率の向上を目的とした。
この現象に触発され,AdaFocusと呼ばれる空間適応型ビデオ認識手法を導入する。
得られたフレームワークであるUni-AdaFocusは、シームレスに空間的、時間的、サンプルワイドな動的計算を統合する包括的なフレームワークを構築します。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:51:44 GMT)
Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment [81.8] テスト時間適応(TTA)は、これまで見つからなかった、シフトしたターゲットドメイン上でのソースドメイン事前訓練モデルの性能を改善することを目的としている。
従来のTTA手法は、主にターゲットデータストリームに基づいてモデルの重みを適応し、ターゲットデータの量と順序に敏感なモデル性能を実現する。
最近提案された拡散駆動型TTA法は、モデル入力を重みに代えて適応することでこれを緩和し、ソースドメイン上で訓練された無条件拡散モデルにより、ターゲットドメインデータをソースドメインに近似する合成ドメインに変換する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:53:52 GMT)
Hierarchical Memory for Long Video QA [78.7] 本稿では,LOVEU Challenge @ CVPR'24, Track 1 (Long Video VQA) のチャンピオンソリューションについて述べる。
我々は、限られたGPUメモリ(VRAM)で長いビデオを処理できるSTARメモリという階層的なメモリ機構を採用した。
さらに,MovieChat-1K トレーニングセットの映像と音声データを利用して,Flash-VStream がリリースした事前学習重量を微調整し,課題の1位を達成した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:04:12 GMT)
ZeroReg: Zero-Shot Point Cloud Registration with Foundation Models [77.8] 最先端の3Dポイントクラウド登録方法は、トレーニングのためにラベル付き3Dデータセットに依存している。
我々は2次元基礎モデルを用いて3次元対応を予測するゼロショット登録手法であるZeroRegを紹介する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:59:44 GMT)
DETAIL: Task DEmonsTration Attribution for Interpretable In-context Learning [75.7] インコンテキスト学習(ICL)により、トランスフォーマーベースの言語モデルでは、パラメータを更新することなく、いくつかの"タスクデモ"で特定のタスクを学習することができる。
ICLの特徴に対処する影響関数に基づく帰属手法DETAILを提案する。
ホワイトボックスモデルで得られた属性スコアがブラックボックスモデルに転送可能であることを示すことにより、モデル性能を向上させる上で、DETAILの広範な適用性を実験的に証明する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:13:10 GMT)
XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8] 低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:58:09 GMT)
Generics are puzzling. Can language models find the missing piece? [70.1] 本稿では,言語モデルとして言語モデルを活用することで,ジェネリクスの暗黙的定量化と文脈感度について検討する。
ConGenは2873の自然発生文と、文脈における定量化文のデータセットです。
実験の結果, ジェネリックは決定器の量化器よりも文脈に敏感であり, 自然発生ジェネリックの約20%は弱い一般化を表現していることがわかった。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:30:21 GMT)
Redefining Normal: A Novel Object-Level Approach for Multi-Object Novelty Detection [68.1] 我々は、データセットにおける最も支配的なオブジェクトを標準と考え、現実世界のシナリオに対してより効果的である視点を提供します。
我々の最初の貢献であるDeFeND(Dense Feature Fine-tuning on Normal Data)は、高密度特徴微調整を蒸留プロセスに統合する。
このアプローチは、単一対象の新規性検出においてうまく機能するが、複数対象のコンテキストにおける既存の手法をかなり上回る。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:47:09 GMT)
Provably Secure Disambiguating Neural Linguistic Steganography [66.3] サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:59:05 GMT)
3D-Mem: 3D Scene Memory for Embodied Exploration and Reasoning [65.4] エンボディエージェントのための新しい3Dシーンメモリフレームワークである3D-Memを提案する。
3D-Memは、シーンを表現するために、Memory Snapshotsと呼ばれる情報的なマルチビューイメージを使用している。
さらに、Frontier Snapshots-glimpsの未探索領域対応エージェントを導入して、情報的な意思決定を行うことによって、フロンティアベースの探索をさらに統合する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:10:41 GMT)
Partial Identifiability in Inverse Reinforcement Learning For Agents With Non-Exponential Discounting [64.1] 逆強化学習は、エージェントの振る舞いを観察することから、エージェントの好みを推測することを目的としている。
IRLの主な課題の1つは、複数の選好が同じ観察行動を引き起こす可能性があることである。
一般にIRLは、正しい最適ポリシーを特定するのに、$R$に関する十分な情報を推測できないことを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:08:58 GMT)
The Superalignment of Superhuman Intelligence with Large Language Models [64.0] 我々は,この疑問に答えるために,学習の観点からスーパーアライメントの概念について議論する。
スーパーアライメントにおけるいくつかの重要な研究課題、すなわち、弱いから強い一般化、スケーラブルな監視、評価に焦点を当てる。
本稿では,学習者モデルの弱点を露呈しようとする敵対的クエリを生成する攻撃者,最小限の人間専門家とともに,批判モデルによって生成されたスケーラブルなフィードバックから学習することで自己を洗練させる学習者,与えられた質問応答対に対する批判や説明を生成する批判者,そして批判によって学習者を改善することを目的とした,3つのモジュールからなるスーパーアライメントの概念的枠組みを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:34:06 GMT)
Large Concept Models: Language Modeling in a Sentence Representation Space [62.7] 本稿では,概念を命名した明示的な高レベルな意味表現に基づくアーキテクチャの試みを行う。
概念は言語とモダリティに依存しないものであり、フローにおけるより高いレベルの考えや行動を表している。
本モデルでは,多くの言語に対して,ゼロショットの一般化性能が顕著であることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:20:12 GMT)
Can Graph Neural Networks Learn Language with Extremely Weak Text Supervision? [62.1] CLIPパイプラインによる転送可能なグラフニューラルネットワーク(GNN)の構築は、3つの根本的な問題のために難しい。
我々は、マルチモーダル・プロンプト・ラーニングを利用して、事前学習したGNNを下流のタスクやデータに効果的に適応させる。
我々の新しいパラダイムは、グラフプロンプトとテキストプロンプトの両方を同時に学習することで、Large Language Models(LLM)と直接同じ空間にグラフを埋め込む。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:54:47 GMT)
Learning Latent Spaces for Domain Generalization in Time Series Forecasting [60.3] 時系列予測は多くの実世界のアプリケーションにおいて不可欠であるが、見つからない関連ドメインをうまく一般化するモデルの開発はまだ未定である。
本稿では,ドメイン間の時間的依存関係を規定する潜在因子をマイニングすることで時系列予測におけるドメイン一般化の枠組みを提案する。
提案手法では,新しい条件付き$beta$-Variational Autoencoder (VAE) を用いて,時系列データをトレンド周期および季節成分に分解する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:41:53 GMT)
On Characterizing and Mitigating Imbalances in Multi-Instance Partial Label Learning [57.2] 我々は、MI-PLLの文脈において、これまで研究されていない問題に対処するためのコントリビューションを行っている。
最小限の仮定をしながら、クラス固有のMI-PLLのリスク境界を導出する。
我々の理論は、$sigma$が学習の不均衡に大きな影響を及ぼすというユニークな現象を明らかにしている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:02:00 GMT)
Zero-Shot Prompting Approaches for LLM-based Graphical User Interface Generation [53.1] LLMに基づくGUI検索とフィルタリング機構を統合した検索型GUI生成(RAGG)手法を提案する。
また,GUI 生成に Prompt Decomposition (PDGG) と Self-Critique (SCGG) を適用した。
UI/UX経験を持つ100人以上の集団作業者の3000以上のGUIアノテーションを対象とし,SPGGはPDGGやRAGGとは対照的に,より効果的なGUI生成につながる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:17:30 GMT)
PyTorch Frame: A Modular Framework for Multi-Modal Tabular Learning [52.9] PyTorch Frame は PyTorch をベースとした多モード表データの深層学習フレームワークである。
モジュラー方式で多種多様なモデルを実装することにより,PyTorch Frameの有用性を示す。
我々は、グラフニューラルネットワーク(GNN)のためのPyTorchライブラリであるPyTorch GeometricとPyTorch Frameを統合し、関係データベース上でエンドツーエンドの学習を行う。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:49:53 GMT)
Why are state-space models more expressive than $n$-gram models? [51.8] 我々は、$n$-gramルールから生成された言語に対して、次の単語予測タスクを解くことのできる状態空間言語モデルを構築した。
我々の証明は、SSMが記憶能力の新たな理論的結果を用いて$n$-gramルールをエンコードする方法を示している。
我々は、$n$-gramルールから生成された小さなデータセットで実験を行い、フレームワークをどのように適用できるかを示します。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 00:24:59 GMT)
Aligning LLMs with Individual Preferences via Interaction [51.7] 調整可能な大きな言語モデル(LLM)をトレーニングします。
木構造における3K以上の多ターン会話を含む多ターン嗜好データセットを開発した。
評価のために、慎重に選択された100のサンプルと、会話中にカスタマイズされたアライメント性能を測定するために適切に設計されたメトリクスからなるALOEベンチマークを確立する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:40:35 GMT)
Day-Night Adaptation: An Innovative Source-free Adaptation Framework for Medical Image Segmentation [51.5] そこで我々は,DyNA(Day-Night Adaptation)と呼ばれる新しい適応フレームワークを提案する。
日中は、各テストサンプルに凍結モデルを適用するために、低周波プロンプトが訓練される。
夜間,日中から収集したテストデータを再利用し,教師モデルと学生モデルとの知識を橋渡しするグローバルな学生モデルを導入する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:59:19 GMT)
AD-LLM: Benchmarking Large Language Models for Anomaly Detection [50.6] 本稿では,大規模な言語モデルが異常検出にどのように役立つかを評価する最初のベンチマークであるAD-LLMを紹介する。
我々は、ゼロショット検出、LLMの事前訓練された知識を用いて、タスク固有のトレーニングなしでADを実行すること、データ拡張、ADモデルを改善するために合成データとカテゴリ記述を生成すること、LLMを使用して教師なしADモデルを提案するモデル選択の3つの主要なタスクについて検討する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:22:14 GMT)
TransMI: A Framework to Create Strong Baselines from Multilingual Pretrained Language Models for Transliterated Data [50.4] 本稿では,トランスリテライト・マージ文字化 (Transliterate-Merge-literation, TransMI) という,シンプルだが効果的な枠組みを提案する。
TransMIは、既存のmPLMとそのトークン化ツールをトレーニングなしで利用することにより、共通のスクリプトに書き起こされるデータの強力なベースラインを作成することができる。
実験の結果,TransMIはmPLMの非翻訳データ処理能力を保ちつつ,翻訳データを効果的に処理し,スクリプト間のクロスリンガル転送を容易にすることを実証した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:20:21 GMT)
Supervised Score-Based Modeling by Gradient Boosting [49.6] 本稿では,スコアマッチングを組み合わせた勾配向上アルゴリズムとして,SSM(Supervised Score-based Model)を提案する。
推測時間と予測精度のバランスをとるため,SSMの学習とサンプリングに関する理論的解析を行った。
我々のモデルは、精度と推測時間の両方で既存のモデルより優れています。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:02:51 GMT)
Diffusion models as probabilistic neural operators for recovering unobserved states of dynamical systems [49.2] 拡散に基づく生成モデルは、ニューラル演算子に好適な多くの特性を示す。
本稿では,複数のタスクに適応可能な単一モデルを,トレーニング中のタスク間で交互に学習することを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:04:32 GMT)
How Transliterations Improve Crosslingual Alignment [48.9] 近年の研究では、アライメント目的を用いた多言語事前学習言語モデル(mPLM)が言語横断アライメントを改善することが示されている。
本稿では, 言語間のアライメントを明示的に評価し, 翻訳に基づくアプローチにおける重要な要素を同定し, 性能向上に寄与する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:14:11 GMT)
DynamicScaler: Seamless and Scalable Video Generation for Panoramic Scenes [46.9] DynamicScalerは空間的スケーラブルでパノラマ的な動的シーン合成を可能にする。
我々は,局所的な詳細性とグローバルな動き継続性を両立させるため,Global Motion Guidance機構を採用している。
本手法はパノラマシーンレベルの映像生成において,優れた内容と動作品質を実現する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:42:26 GMT)
HeGTa: Leveraging Heterogeneous Graph-enhanced Large Language Models for Few-shot Complex Table Understanding [46.0] HGTは,多種性グラフ(HG)を拡張した大規模言語モデル(LLM)を用いて,数発のTUタスクに対処するフレームワークである。
我々はHGTの有効性を実証的に実証し、いくつかのベンチマークで数発の複雑なTUに対してSOTAよりも優れていることを示した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:24:47 GMT)
GenLit: Reformulating Single-Image Relighting as Video Generation [44.4] 我々は、映像生成モデルに光操作を行うためのグラフィックスエンジンの能力を蒸留するフレームワークであるGenLitを紹介する。
我々は、小さな合成データセットのみに微調整されたモデルが、実際の画像に一般化可能であることを発見した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:40:40 GMT)
Purely quantum algorithms for calculating determinant and inverse of matrix and solving linear algebraic systems [43.5] そこで我々は,行列式と逆行列の計算に$(N-1)倍 (N-1)$行列を求める量子アルゴリズムを提案する。
このアプローチは、N×N$行列の行列式を決定するための既存のアルゴリズムの簡単な修正である。
3つのアルゴリズムすべてに対して適切な回路設計を提供し、それぞれが空間的に$O(N log N)$と見積もられている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:28:54 GMT)
VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping [43.3] ビデオ・フェイス・スワップに特化して設計された初めての拡散型フレームワークを提案する。
提案手法は,VidFaceVAEと組み合わせた特殊設計拡散モデルである。
本フレームワークは,従来の手法と比較して,アイデンティティの保存,時間的整合性,視覚的品質において優れた性能を発揮する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 18:58:32 GMT)
Dual-Schedule Inversion: Training- and Tuning-Free Inversion for Real Image Editing [43.1] 拡散モデルに基づくほとんどのメソッドは、編集の第一段階としてDDIM Inversionを使用する。
そこで本研究では,Dual-Schedule Inversionと呼ばれる新しいインバージョンとサンプリング手法を提案する。
また、Dual-Schedule Inversionとユーザフレンドリーな画像編集のための異なる編集手法を適応的に組み合わせる分類器を設計する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:04:06 GMT)
Simulate and Eliminate: Revoke Backdoors for Generative Large Language Models [42.2] 生成型大規模言語モデル(LLM)は、理解から推論まで、様々な自然言語処理(NLP)タスクを支配している。
悪意のある敵は、毒データをオンラインで公開し、毒データに基づいて事前訓練された被害者のLSMに対するバックドア攻撃を行うことができる。
生成LDMの不要なバックドアマッピングを除去するためにSANDE(Simulate and Eliminate)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:55:43 GMT)
Do Robot Snakes Dream like Electric Sheep? Investigating the Effects of Architectural Inductive Biases on Hallucination [41.7] アーキテクチャに基づく帰納バイアスが幻覚の確率にどのように影響するかを考察する。
発見は、これらの問題を相互によりよく理解することの必要性を強調し、幻覚を扱うためのより普遍的なテクニックをどう設計するかを検討する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:30:24 GMT)
xVal: A Continuous Numerical Tokenization for Scientific Language Models [41.3] 我々は、言語モデル内で数値を継続的にトークン化する戦略であるxValを紹介した。
我々は、テキストとしてフォーマットされたさまざまな科学的データセットに基づいて、スクラッチから特別に修正された言語モデルを訓練する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:07:28 GMT)
RecSys Arena: Pair-wise Recommender System Evaluation with Large Language Models [40.7] 提案するRecSys Arenaでは,2種類のレコメンデーションシステムによるレコメンデーション結果がLLM審査員によって評価され,きめ細かい評価フィードバックが得られる。
我々は多くの異なるLCMが標準オフラインメトリクスと高度に一致した一般的な評価結果を提供することを示した。
AUCやnDCGと同等の性能の異なるアルゴリズムを区別できる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:57:36 GMT)
Aligning Language Models Using Follow-up Likelihood as Reward Signal [40.4] そこで本稿では,好ましくない応答を区別するための報奨として,フォローアップ発話の可能性を提案する。
提案した報奨機構であるFollow-up Likelihood as Reward (FLR) は,大規模人やGPT-4アノテートデータに基づいてトレーニングされた強力な報奨モデルの性能と一致する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:45:04 GMT)
Multi-Agent Inverse Reinforcement Learning in Real World Unstructured Pedestrian Crowds [40.2] 実世界の非構造歩行者群を対象としたマルチエージェント最大エントロピー逆強化学習アルゴリズムを提案する。
われわれのアプローチの鍵は単純だが効果的で数学的トリックであり、いわゆるトラクタビリティ・リレーショナル・トレードオフ・トリック(tractability-rationality trade-off trick)と呼ばれている。
我々の重要な発見は、高密度のSpeedwayデータセットにおいて、単一エージェントIRLよりも2倍改善されたトップ7のベースラインの中で、我々のアプローチが1位であることを示している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:48:49 GMT)
HiMemFormer: Hierarchical Memory-Aware Transformer for Multi-Agent Action Anticipation [39.9] オンラインマルチエージェントアクション予測のためのトランスモデルであるHiMemFormer(HiMemFormer)を提案する。
HiMemFormerは、アクション予測におけるノイズや冗長な情報を避けるために、エージェント固有の好みでグローバルコンテキストを適用する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:39:55 GMT)
Red Teaming GPT-4V: Are GPT-4V Safe Against Uni/Multi-Modal Jailbreak Attacks? [39.9] この研究は、11の異なる安全ポリシーをカバーする1445の有害な質問を含む包括的なジェイルブレイク評価データセットを構築している。
このデータセットに基づいて、11の異なる大言語モデル(LLM)とMLLM(Multimodal Large Language Models)を用いて、広範囲にわたるレッドチーム実験を行う。
GPT4 と GPT-4V は,オープンソースの LLM や MLLM と比較して,ジェイルブレイク攻撃に対する堅牢性が高いことがわかった。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:50:51 GMT)
The Unmet Promise of Synthetic Training Images: Using Retrieved Real Images Performs Better [39.6] すべての合成画像は、最終的にジェネレータを訓練するために使用される上流データに由来する。
我々は, LAION-2Bから直接取得した目標実画像に対して, 安定拡散によって生成されたタスク関連ターゲット合成データを微調整と比較した。
解析の結果,このアンダーパフォーマンスは生成物と,合成画像中のタスク関連視覚的詳細が不正確なためであることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 00:13:20 GMT)
No Argument Left Behind: Overlapping Chunks for Faster Processing of Arbitrarily Long Legal Texts [39.2] 我々は,TransformerとRecurrent Neural Networkアーキテクチャを組み合わせた,長い法律テキストを扱うハイブリッドモデル uBERT を紹介する。
以上の結果から, uBERT は BERT+LSTM よりも高い性能を示し, 長い法律文書処理において ULMFiT よりもはるかに高速であることがわかった。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 23:36:13 GMT)
Facial Surgery Preview Based on the Orthognathic Treatment Prediction [39.0] 現在の可視化手法は、前処理と後処理のデータに制限があるため、しばしば不正確である。
本研究は,高精度かつ効率的な3次元手術後予測を生成する完全自動輪郭測地を開発する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:06:39 GMT)
C$^2$LEVA: Toward Comprehensive and Contamination-Free Language Model Evaluation [38.6] C$2$LEVAは、組織的な汚染防止を特徴とする包括的なベンチマークである。
15のオープンソースおよびプロプライエタリモデルの大規模評価は,C$2$LEVAの有効性を示している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:31:09 GMT)
PGD-Imp: Rethinking and Unleashing Potential of Classic PGD with Dual Strategies for Imperceptible Adversarial Attacks [37.0] 知覚不能な敵対的攻撃は、最近研究の関心を惹きつけている。
本研究は、PGD(共通攻撃と古典攻撃)の可能性を解き放つための、単純かつ効果的な2つの戦略を提案する。
提案したPGD-Imp攻撃は,非目標シナリオと目標シナリオの両方に対して,認識不能な敵攻撃を実現する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:34:22 GMT)
M$^{3}$D: A Multimodal, Multilingual and Multitask Dataset for Grounded Document-level Information Extraction [36.5] 我々はM$3$Dというマルチモーダル多言語マルチタスクデータセットを構築した。
ペア化された文書レベルのテキストとビデオを含み、マルチモーダル情報を豊かにする。
広く使われている2つの言語、すなわち英語と中国語をサポートしている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:43:06 GMT)
DASK: Distribution Rehearsing via Adaptive Style Kernel Learning for Exemplar-Free Lifelong Person Re-Identification [36.1] 生涯人物再識別(LReID)は、破滅的な忘れ込みに苦しむ重要な課題であるが難しい課題である。
既存のLReIDアプローチは通常、この問題を軽減するためにデータ再生と知識蒸留に依存している。
本稿では,知識統合を強化するために,旧領域の分布をモデル化し,リハーサルする新しいパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:17:04 GMT)
Transliterated Zero-Shot Domain Adaptation for Automatic Speech Recognition [35.8] ドメイン適応はゼロショットドメイン適応(ZSDA)の問題に対処できる。
対象のドメイン情報がよりアクセスしやすい別のソース言語から対象のドメイン知識を転送する。
翻訳されたZSDAは、wav2vec 2.0ベースラインと比較して単語エラー率を9.2%削減する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:32:08 GMT)
POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search [34.5] 本稿では,高精度符号化・復号化フレームワークであるParallel Optimal Position Search (POPoS)を紹介する。
Pseudo-range multilaterationは、ヒートマップエラーの修正に使われ、ランドマークのローカライゼーション精度が向上する。
1ステップの並列計算アルゴリズムを導入し、計算効率を高め、処理時間を短縮する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:05:55 GMT)
Paid with Models: Optimal Contract Design for Collaborative Machine Learning [33.1] コラボレーション機械学習(CML)は、参加者間のコスト共有を可能にすることによって、高度なテクノロジを民主化するための有望なパラダイムを提供する。
契約理論は、参加者が貢献に基づいて様々な精度のモデルに報酬を与えることで、実行可能な解決策を示す。
報酬とは違い、報酬としてモデルを使用することは、特に報酬の性質のために、ユニークな課題をもたらす。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:55:16 GMT)
Active Large Language Model-based Knowledge Distillation for Session-based Recommendation [32.3] 大規模言語モデル(LLM)は、正確なセッションベースレコメンデーション(SBR)のための有望な方法を提供する。
しかし、これらの手法は、SBRにおけるtextitLLMベースのKDでは困難に遭遇する。
アクティブな方法を提案する。
持続可能なAIに寄与するSBRにおけるLLMベースのKD法
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:56:13 GMT)
Early Concept Drift Detection via Prediction Uncertainty [31.3] 概念のドリフトは、時間とともにデータ分布が予測不可能な変化を特徴とする。
本稿では,ドリフト検出における誤り率の代替として,予測不確実性指数(PU-index)を導入する。
また,新しいPU-index Bucketingアルゴリズムを用いてドリフトを検出するPU-index-based Drift Detector (PUDD)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:43:53 GMT)
Separate the Wheat from the Chaff: A Post-Hoc Approach to Safety Re-Alignment for Fine-Tuned Language Models [30.9] 大規模言語モデル(LLM)の安全性向上を実現する手法を提案する。
IRRの中核は、保持されたパラメータを再調整しながら、微調整されたモデルから安全でないデルタパラメータを特定し、除去することである。
この結果から,IRRは有害なクエリやジェイルブレイク攻撃などの安全性ベンチマークにおいて,微調整モデルの安全性を著しく向上することが示された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:58:38 GMT)
Entropy-Regularized Process Reward Model [30.3] 大規模言語モデル(LLM)は、複雑な多段階推論を行う上で有望であるが、数学的推論に苦慮し続けている。
KL規則化マルコフ決定プロセス(MDP)を統合したエントロピー規則化プロセス報酬モデル(ER-PRM)を提案する。
MATHとGSM8Kベンチマークの実証実験により、ER-PRMは既存のプロセス報酬モデルより一貫して優れていることが示された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:09:23 GMT)
Empowering LLMs to Understand and Generate Complex Vector Graphics [30.2] 大規模言語モデル(LLM)は、トレーニング中にWebページからベクターグラフィックスの部分的知識を符号化する。
最近の知見は, LLM内の意味的曖昧さとトークン化表現が, ベクトルプリミティブ予測における幻覚を引き起こす可能性を示唆している。
LLM4SVGは、LLMがベクトルグラフィックスをよりよく理解し、生成できるようにすることにより、このギャップを埋める最初のステップであるが、実質的なステップである。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:49:31 GMT)
Light-T2M: A Lightweight and Fast Model for Text-to-motion Generation [30.1] テキスト・トゥ・モーション(T2M)生成は様々なアプリケーションにおいて重要な役割を果たしている。
現在の手法ではパラメータが多数含まれており、推論速度が遅い。
本稿では,軽量で高速なLight-T2Mモデルを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:58:37 GMT)
Sensing for Space Safety and Sustainability: A Deep Learning Approach with Vision Transformers [29.8] 本稿では,衛星物体検出(SOD)タスクと搭載型ディープラーニング(DL)タスクについて論じる。
GELAN-ViTとGELAN-RepViTと呼ばれる2つの新しいDLモデルが提案されている。
これらのモデルは平均平均精度(mAP)と計算コストにおいて最先端のYOLOv9-tを上回っている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:23:27 GMT)
AURORA: Automated Unleash of 3D Room Outlines for VR Applications [29.7] AURORAは、RGB-D画像を利用して、バーチャルリアリティ(VR)シーンとVRシーンの両方を自動的に生成する新しい手法である。
AURORAは、画像処理、セグメンテーション、および3D再構成における高度な技術を統合し、現実的で詳細なインテリアデザインを効率的に作成する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:06:22 GMT)
SHMT: Self-supervised Hierarchical Makeup Transfer via Latent Diffusion Models [29.4] 本稿では,遅延拡散モデルを用いた自己教師付き階層的メイクアップトランスファー(SHMT)手法を提案する。
SHMTは自己教師型の方法で動作し、擬似ペアデータの誤認から解放される。
様々なメイクスタイルに対応するため、階層的なテクスチャの詳細はラプラシアのピラミッドを通して不正確である。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:29:07 GMT)
FisherRF: Active View Selection and Uncertainty Quantification for Radiance Fields using Fisher Information [29.1] 画像を取得するコストは、最も有益な視点を効率的に選択する必要がある。
魚介類情報を活用することにより, 放射場パラメータの観測情報を直接定量化し, 候補視点を選択する。
本手法は、ビュー選択、アクティブマッピング、不確実性定量化など、複数のタスクにおける最先端結果を実現する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:38:25 GMT)
NeuroClips: Towards High-fidelity and Smooth fMRI-to-Video Reconstruction [29.0] 我々は,fMRIから高忠実度・スムーズな映像をデコードする革新的なフレームワークであるNeuroClipsを提案する。
NeuroClipsは、ビデオの再構成にセマンティックサクタを使用し、セマンティックの精度と一貫性を誘導し、低レベルの知覚の詳細を捉えるために知覚再構成器を使用する。
NeuroClipsは8FPSで最大6秒のスムーズな高忠実度ビデオ再構成を実現する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:24:41 GMT)
Context-Aware Assistant Selection for Improved Inference Acceleration with Large Language Models [28.6] 大規模言語モデル(LLM)は、リソース制約の下での使用は禁じられている。
自動回帰生成に付随する高いレイテンシは、高度なコンピューティングインフラストラクチャに依存する大きなLLMをレンダリングする。
復号化支援は これを軽減するのに役立ちましたが 2つのモデルのアライメントに依存しています
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:27:58 GMT)
Fast-and-Frugal Text-Graph Transformers are Effective Link Predictors [28.4] テキスト分散知識グラフにおける帰納的リンク予測のためのテキスト情報と構造情報を統一するトランスフォーマベースのフレームワークであるFast-and-Frugal Text-Graph (FnF-TG) Transformersを提案する。
本研究では,エゴグラフを効果的に符号化することにより,リソース集約型テキストエンコーダへの依存を低減できることを実証する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:37:51 GMT)
HTS-Attack: Heuristic Token Search for Jailbreaking Text-to-Image Models [28.3] テキスト・トゥ・イメージ(T2I)モデルは画像生成と編集において顕著な成功を収めた。
これらのモデルには、特に不適切な、あるいは安全でない(NSFW)コンテンツを生成する場合に、多くの潜在的な問題がある。
本稿では,トークン探索攻撃手法であるHTS-Attackを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:13:26 GMT)
Neeko: Leveraging Dynamic LoRA for Efficient Multi-Character Role-Playing Agent [28.3] Neekoは、効率的なマルチキャラクタ模倣のために設計された革新的なフレームワークである。
本フレームワークは,ロールプレイングのプロセスをエージェント事前学習,複数キャラクタプレイ,文字インクリメンタル学習に分解する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:37:31 GMT)
Navigating Towards Fairness with Data Selection [27.7] ラベルバイアスを効率的かつ柔軟に緩和するデータ選択法を提案する。
提案手法では,ゼロショット予測器をプロキシモデルとして利用し,クリーンなホールトアウトセットでのトレーニングをシミュレートする。
我々のモダリティ非依存手法は,実験評価において,ラベルバイアスの処理と多種多様なデータセット間の公正性向上に効果的かつ効果的であることが証明された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:11:05 GMT)
Relational Diffusion Distillation for Efficient Image Generation [27.1] 拡散モデルの高い遅延は、コンピューティングリソースの少ないエッジデバイスにおいて、その広範な応用を妨げる。
本研究では,拡散モデルの蒸留に適した新しい蒸留法である拡散蒸留(RDD)を提案する。
提案したRDDは, 最先端の蒸留蒸留法と比較すると1.47FID減少し, 256倍の高速化を実現した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:31:35 GMT)
SQLFixAgent: Towards Semantic-Accurate Text-to-SQL Parsing via Consistency-Enhanced Multi-Agent Collaboration [26.2] 本稿では,SQLの誤検出と修復を目的とした,新しい一貫性向上型マルチエージェント協調フレームワークを提案する。
提案したフレームワークを5つのテキスト・テキスト・ベンチマークで評価し,特にBirdベンチマークで3%以上の改善を実現した。
当社のフレームワークは,他の高度なメソッドと比較してトークン効率も高く,競争力も向上しています。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:39:42 GMT)
Golden Noise for Diffusion Models: A Learning Framework [26.1] テキスト・ツー・イメージ拡散モデルは、テキストプロンプトとランダムなガウスノイズを提供することでパーソナライズされた画像を合成する一般的なパラダイムである。
テキスト画像のアライメントが向上し、人の好みが向上する「黄金のノイズ」を人々は見ているが、これらの黄金のノイズを得るための機械学習フレームワークはいまだに欠如している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:48:48 GMT)
Benchmarking and Learning Multi-Dimensional Quality Evaluator for Text-to-3D Generation [26.1] 近年,テキスト・ツー・3D生成は目覚ましい進歩を遂げているが,これらの手法の評価はいまだに困難である。
既存のベンチマークには、異なるプロンプトカテゴリと評価次元に関するきめ細かい評価が欠けている。
まず,MATE-3Dという総合ベンチマークを提案する。
ベンチマークには、単一のオブジェクト生成と複数のオブジェクト生成をカバーする、よく設計された8つのプロンプトカテゴリが含まれており、結果として1,280のテクスチャメッシュが生成される。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:41:44 GMT)
A Comprehensive Survey of Action Quality Assessment: Method and Benchmark [25.7] 行動品質評価(AQA)は、人間の行動の質を定量的に評価し、人間の判断におけるバイアスを減らす自動評価を提供する。
近年のAQAの進歩は革新的手法を導入しているが、類似の手法は異なる領域にまたがることが多い。
統一されたベンチマークと限定的な計算比較の欠如は、AQAアプローチの一貫性のある評価と公正な評価を妨げている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:47:26 GMT)
HAGNN: Hybrid Aggregation for Heterogeneous Graph Neural Networks [25.7] 異種グラフニューラルネットワーク(GNN)は異種グラフの処理に成功している。
近年の研究では、メタパスを持たない単純な同質グラフモデルでも同等の結果が得られることが指摘されている。
ヘテロジニアスグラフにおけるリッチな型意味情報(HAGNN)を包括的に活用するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:14:51 GMT)
Safe Reinforcement Learning using Finite-Horizon Gradient-based Estimation [25.6] セーフ強化学習(Safe RL)の主な側面は、次のポリシーの制約条件を推定することである。
既存の推定方法は無限水平割引利得関数に依存している。
深部安全RLにおける有限水平非分散制約の第一推定法を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:05:23 GMT)
Semantic Steganography: A Framework for Robust and High-Capacity Information Hiding using Large Language Models [25.5] 生成言語ステガノグラフィーは、モデル生成テキストに情報を隠蔽する一般的な技術となっている。
大規模言語モデル(LLM)に基づく意味的ステガノグラフィーフレームワークを提案する。
このフレームワークは複雑なチャネルでの送信に対して堅牢性と信頼性を提供し、テキストレンダリングやワードブロッキングに対する耐性を提供する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:04:23 GMT)
Judging the Judges: A Systematic Study of Position Bias in LLM-as-a-Judge [25.3] 本研究は, 対比較における位置バイアスを検討するための体系的枠組みを提案する。
MTBenchとDevBenchにまたがる12のLLM審査員による実験を行い,22のタスクと約40のソリューション生成モデルについて検討した。
以上の結果から, 有能なLLM裁判官の位置バイアスは, ランダムな確率や, 有意な判断や課題の違いによるものではないことが確認された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:09:20 GMT)
Provably Secure Robust Image Steganography via Cross-Modal Error Correction [23.1] 本稿では,最先端自己回帰(AR)画像生成モデルに基づく高品質で確実かつ堅牢な画像ステガノグラフィー手法を提案する。
我々は、損失画像の復元を支援するため、ステゴ画像からステゴテキストを生成するクロスモーダルな誤り補正フレームワークを用いる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:10:10 GMT)
Neural networks that overcome classic challenges through practice [22.7] 我々はメタラーニングを用いて、インセンティブと実践の問題に対処することで、いくつかの古典的な課題を克服する最近の研究をレビューする。
ニューラルネットワークの4つの古典的な課題、すなわち、体系的な一般化、破滅的な忘れ込み、数発の学習、多段階の推論に対処するためのこの原則の適用についてレビューする。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:26:27 GMT)
Multimodal Class-aware Semantic Enhancement Network for Audio-Visual Video Parsing [22.7] 各オーディオ/視覚セグメントの正確なイベントセマンティクスの取得が不可欠である。
各セグメントは複数のイベントを含むことができ、結果として意味的に混合された全体的特徴をもたらす。
内部および相互関係を符号化するファイングラインド・セマンティック・エンハンスメント・モジュールを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:54:53 GMT)
EDOLAB: An Open-Source Platform for Education and Experimentation with Evolutionary Dynamic Optimization Algorithms [22.4] 既存の文献では、あるEDOAに対して報告された結果は大きく異なる可能性がある。
この矛盾は、通常複雑である多くのEDOAのソースコードが公開されていないために生じることが多い。
我々はEvolutionary Dynamic Optimization LABoratory (EDOLAB)というオープンソースのプラットフォームを開発した。
このプラットフォームは研究を促進するだけでなく、教育目的のために設計された教育モジュールも備えている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:19:17 GMT)
Do Chase Your Tail! Missing Key Aspects Augmentation in Textual Vulnerability Descriptions of Long-tail Software through Feature Inference [22.0] 効果的な脆弱性分析には,テクスト脆弱性記述(TVD)に欠落する重要な側面の増大が不可欠である。
本稿では,長テールソフトウェアにおけるTVDの欠落する重要な側面を補うために,新しいソフトウェア機能推論フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:10:04 GMT)
Learning Robust and Privacy-Preserving Representations via Information Theory [21.8] セキュリティとプライバシの攻撃を緩和し、タスクユーティリティも維持する第一歩を踏み出します。
本稿では,表現学習のレンズを用いて目標を達成するための情報理論フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:51:48 GMT)
GaussianProperty: Integrating Physical Properties to 3D Gaussians with LMMs [21.4] 視覚データに対する物理的特性の推定は、コンピュータビジョン、グラフィックス、ロボット工学において重要な課題である。
教材の物理的特性を3Dガウスアンに割り当てる学習自由フレームワークであるガウスプロパティを紹介する。
物理特性アノテーションを持つ3次元ガウスアンが物理に基づく動的シミュレーションやロボットグルーピングに応用できることを実証する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:44:10 GMT)
Drawing the Line: Enhancing Trustworthiness of MLLMs Through the Power of Refusal [21.3] 既存の手法はMLLMの信頼性を高める手段としての拒絶応答の重要性をほとんど見落としてきた。
InBoL(Information Boundary-Aware Learning Framework)は,MLLMが不十分な情報に遭遇する際のユーザクエリの応答を拒否する,新たなアプローチである。
このフレームワークでは、包括的なデータ生成パイプラインと、適切な拒絶応答を提供するモデルの能力を改善するためのトレーニング戦略が導入された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:17:14 GMT)
Bridging Large Language Models and Optimization: A Unified Framework for Text-attributed Combinatorial Optimization [21.2] Language-based Neural COPsolvr (LNCS)は、多種多様なテキスト対応COPのエンドツーエンド解決のために統一された新しいフレームワークである。
広汎な実験により、LNCSの有効性と一般化性が検証され、現実世界のCOPアプリケーションのための統一的で実用的なフレームワークとしての可能性を強調した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:20:31 GMT)
SEE: Sememe Entanglement Encoding for Transformer-bases Models Compression [20.8] トランスフォーマーベースの大規模言語モデルは画期的な能力を示すが、そのストレージと計算コストは高く、リソース制約のあるシナリオでの応用を制限している。
効率的なアプローチは、圧縮と性能のバランスを達成するために、効率的な専門家由来の知識構造を取り入れながら、冗長なモデルパラメータと計算コストを排除することである。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:01:43 GMT)
Suicide Risk Assessment on Social Media with Semi-Supervised Learning [20.2] ラベル付きおよびラベルなしデータを活用する半教師付きフレームワークを提案する。
擬似ラベル生成の複数の試行において一括して予測されなかった擬似ラベルデータのサブセットを手動で検証する。
本研究は,一部検証済み擬似ラベル付きデータに加えて,地味ラベル付きデータを活用することで,ソーシャルメディア投稿から自殺リスクを評価する能力を大幅に向上する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:12:14 GMT)
Training-and-Prompt-Free General Painterly Harmonization via Zero-Shot Disentenglement on Style and Content References [20.2] トレーニング・アンド・プロンプトフリーの一般絵画調和法(TF-GPH)を提案する。
TF-GPHは、前景の内容と背景像を歪ませる小説『Simisity Disentangle Mask'』を取り入れている。
また,スタイル化とコンテンツ保存の調和を両立させる「類似度強調」機構を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:53:00 GMT)
Classification Drives Geographic Bias in Street Scene Segmentation [20.1] 我々は、より複雑なタスクであるインスタンスセグメンテーションに基づいて、実世界の運転データセットのジオバイアスを調査した。
その結果,ジオビアーゼは局所化誤差よりも分類誤差が原因であることが判明した。
地域別モデルでは, 粗いクラスを用いてジオビアーゼを著しく緩和できることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:33:10 GMT)
Neural Port-Hamiltonian Differential Algebraic Equations for Compositional Learning of Electrical Networks [20.1] 結合力学系のための合成学習アルゴリズムを開発した。
我々は、ポート・ハミルトンDAEの微分および代数的成分における未知項のパラメータ化にニューラルネットワークを用いる。
我々は、個別のN-PHDAEモデルを個別のグリッドコンポーネント向けに訓練し、それらを結合して大規模ネットワークの挙動を正確に予測する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:13:11 GMT)
Curriculum Demonstration Selection for In-Context Learning [20.0] 大規模言語モデル(LLM)は、いくつかのデモでコンテキスト内での学習能力を強く示している。
ICLの新しい実証方法であるCDS(Curriculum Demonstration Selection)を提案する。
CDSは単に類似性を使用するのではなく、複雑さの測定によってサンプルを分割する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:14:03 GMT)
Leveraging Large Vision-Language Model as User Intent-aware Encoder for Composed Image Retrieval [19.9] Composed Image Retrieval (CIR) は、ユーザ意図を記述する参照画像と相対キャプションからなるハイブリッドモダリティクエリを用いて、候補セットからターゲット画像を取得することを目的としている。
我々は,大規模視覚言語モデル(LVLM)を強力なユーザ意図認識エンコーダとして活用する新しいフレームワークであるCIR-LVLMを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:09:02 GMT)
From Easy to Hard: Progressive Active Learning Framework for Infrared Small Target Detection with Single Point Supervision [19.7] 単一点監視による単一フレーム赤外小目標(SIRST)検出は広く注目されている。
環境に適応する生物にインスパイアされた,プログレッシブアクティブラーニング(PAL)フレームワークを構築した。
私たちのPALフレームワークは、全監督タスクとポイント監視タスクの間に、効率的で安定したブリッジを構築することができます。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:08:49 GMT)
From Simple to Professional: A Combinatorial Controllable Image Captioning Agent [19.4] CapAgentは、画像キャプションタスクにおけるユーザの単純さとプロレベルのアウトプットのギャップを埋めるために設計された革新的なシステムである。
CapAgentはユーザが提供する単純な命令を、詳細で専門的な命令に自動的に変換し、正確でコンテキスト対応のキャプション生成を可能にする。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:37:20 GMT)
Managing Project Teams in an Online Class of 1000+ Students [19.4] コンピュータサイエンス(CS)のチームプロジェクトは、学生がコラボレーションスキルを構築し、理論を適用し、現実世界のソフトウェア開発の準備をするのを助ける。
オンライン授業は、大規模にCS教育のアクセシビリティを変革するユニークな機会を提供する。
200以上のプロジェクトチームに対して,コンストラクティブなフィードバックを管理し,評価し,提供するという,私たちのアプローチについて議論します。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:16:32 GMT)
Overview of TREC 2024 Medical Video Question Answering (MedVidQA) Track [19.1] 本稿では,医療ビデオの理解と,自然言語質問に対する視覚的回答を提供するシステム構築に向けた新たな課題を紹介する。
これらのタスクは、公衆および医療専門家に利益をもたらす洗練された下流アプリケーションの開発を支援する可能性がある。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:18:01 GMT)
BlockLLM: Memory-Efficient Adaptation of LLMs by Selecting and Optimizing the Right Coordinate Blocks [19.0] BlockLLMはブロック座標降下にインスパイアされたアプローチである。
微調整と事前訓練の両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:51:18 GMT)
Finding a Wolf in Sheep's Clothing: Combating Adversarial Text-To-Image Prompts with Text Summarization [19.0] テキスト・ツー・イメージモデルは段階的に「Divide-and-Conquer Attack」に弱い
そこで本研究では,テキスト要約を伴う二層化手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:12:36 GMT)
SWE-Search: Enhancing Software Agents with Monte Carlo Tree Search and Iterative Refinement [18.8] SWE-Searchは、MCTS(Monte Carlo Tree Search)と自己改善機構を統合し、ソフトウェアエージェントのパフォーマンスを向上させるマルチエージェントフレームワークである。
本研究は,複雑でダイナミックなソフトウェア工学環境において,エージェント推論と計画を強化する自己評価型検索技術の可能性を強調した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:55:42 GMT)
Learning Normal Flow Directly From Event Neighborhoods [18.8] 正規フロー推定のための新しい教師付き点ベース手法を提案する。
ローカル・ポイント・クラウド・エンコーダを用いて,本手法は生イベントからのイベント当たりの通常の流れを直接推定する。
提案手法は, 異なるデータセット間で転送される場合の最先端手法よりも, より優れた, より一貫性のある性能を実現する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:09:45 GMT)
A Digitalized Atlas for Pulmonary Airway [18.5] AirwayAtlasは、気道解剖を自動抽出するためのエンドツーエンドパイプラインである。
コンパクトな表現であるAirwaySignは、気道分岐の多様な特徴に基づいて生成される。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:35:00 GMT)
Are Expressive Models Truly Necessary for Offline RL? [18.4] シークエンシャルモデリングでは、適切なポリシー性能を確保するために、軌道データの長い地平線を越えて正確なダイナミクスを捉える必要がある。
浅層2層モデルほど単純な軽量モデルは、正確な動的一貫性と逐次モデリングエラーを著しく低減できることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:33:56 GMT)
Edge Contrastive Learning: An Augmentation-Free Graph Contrastive Learning Model [18.0] グラフコントラスト学習(GCL)は、ラベルのないグラフデータから表現を自己管理的に学習することを目的としている。
エッジベースGCLの主な障害の1つは、重い負担である。
エッジコントラストを実現するために,Augmentation Free Edge Contrastive Learning (AFECL)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:16:01 GMT)
Efficient Generation of Targeted and Transferable Adversarial Examples for Vision-Language Models Via Diffusion Models [18.0] 大規模視覚言語モデル(VLM)のロバスト性を評価するために、敵対的攻撃を用いることができる。
従来のトランスファーベースの敵攻撃は、高いイテレーション数と複雑なメソッド構造により、高いコストを発生させる。
本稿では, 拡散モデルを用いて, 自然, 制約のない, 対象とする対向的な例を生成するAdvDiffVLMを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:46:46 GMT)
DyRoNet: Dynamic Routing and Low-Rank Adapters for Autonomous Driving Streaming Perception [17.9] Dynamic Routing Network (DyRoNet) は、自律運転システムにおけるストリーミング知覚のために設計された低ランク拡張動的ルーティングフレームワークである。
DyRoNetは事前訓練された分岐ネットワークを統合し、それぞれ異なる環境条件下で機能するように微調整する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:29:34 GMT)
On Distilling the Displacement Knowledge for Few-Shot Class-Incremental Learning [17.8] FSCIL(Few-shot Class-Incremental Learning)は、データ分散の進化と、現実のシナリオにおけるデータ取得の難しさに対処する。
FSCILでよく見られる破滅的な忘れ事に対処するために、知識の蒸留は、学習されたデータ分布から知識を維持する方法として用いられる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:10:18 GMT)
An Empirical Study of Fault Localisation Techniques for Deep Learning [17.6] 我々は、既存の最先端のフォールトローカライゼーション技術を評価し、比較する。
Dfdは最も効果的なツールであり、ベンチマークの平均リコール率は0.61で精度は0.41である。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:47:03 GMT)
GaLore$+$: Boosting Low-Rank Adaptation for LLMs with Cross-Head Projection [17.3] マルチヘッドアテンションのために低ランクプロジェクションを推定する際の時間消費を大幅に削減するために,クロスヘッド低ランクプロジェクションを用いたGaLore$+$を提案する。
我々の実験によると、GaLore$+$は、バニラのGaLoreに比べて、約4倍の微調整速度を達成しながら、優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:28:13 GMT)
Towards Trustworthy LLMs for Code: A Data-Centric Synergistic Auditing Framework [17.3] DataTrustは、モデル信頼性指標とトレーニングにおけるデータ品質指標を結びつけることを目的としている。
さまざまな利害関係者がDataTrustから得られるメリットを概説する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:37:29 GMT)
StyleBooth: Image Style Editing with Multimodal Instruction [17.3] 原画像が与えられた場合、画像編集は提供された命令に一致した画像を生成することを目的としている。
本稿では,画像スタイルの編集に焦点をあて,画像編集のための総合的なフレームワークであるStyleBoothを提案する。
反復的なスタイル記述のチューニングと編集とユーザビリティのフィルタリングによって、StyleBoothデータセットは、コンテンツ一貫性のあるスタイリング/プレーンイメージペアを提供する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:31:56 GMT)
Understanding and Mitigating Memorization in Diffusion Models for Tabular Data [16.0] メモリ化は、モデルが正確にまたはほぼ同一のトレーニングデータを不注意に複製した場合に発生する。
本稿では,TabCutMixを提案する。
また,TabCutMixは,高品質なデータ生成を維持しつつ,メモリ化を効果的に軽減することを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:04:37 GMT)
LLMs for Literature Review: Are we there yet? [15.8] 本稿では,近年の大規模言語モデルのゼロショット能力について,要約に基づく文献レビューの執筆支援について考察する。
まず LLM を用いて,論文の要約から意味のあるキーワードを抽出する新しい2段階探索手法を提案する。
生成段階では、まずレビューの計画を概説し、次に実際のレビューを生成するためのステップを実行する2段階のアプローチを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:12:26 GMT)
A Progressive Transformer for Unifying Binary Code Embedding and Knowledge Transfer [15.7] 本稿では,バイナリコード埋め込みのための新しいトランスフォーマーベースの手法であるProTSTを紹介する。
ProTSTは、独特の木のような構造に基づく階層的なトレーニングプロセスを採用している。
その結果, ProTSTは従来の2段階トレーニングに比べて14.8%改善した(F1, MRR, Recall@1)。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:04:29 GMT)
Topological Generalization Bounds for Discrete-Time Stochastic Optimization Algorithms [15.5] ディープニューラルネットワーク(DNN)は、顕著な一般化特性を示す。
これらの能力の源泉は依然として解明され、確立された統計的学習理論を否定している。
近年の研究では、訓練軌跡の性質が一般化の指標であることが示されている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:26:17 GMT)
Optimal Top-Two Method for Best Arm Identification and Fluid Analysis [15.4] 最適な腕識別問題に対する最適トップ2型アルゴリズムを提案する。
提案アルゴリズムは$delta rightarrow 0$として最適であることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:24:09 GMT)
Deep Learning-based Approaches for State Space Models: A Selective Review [15.3] 状態空間モデル(SSM)は動的システム解析のための強力なフレームワークを提供する。
本稿では、SSMに対するディープニューラルネットワークに基づくアプローチの最近の進歩を選択的にレビューする。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:04:35 GMT)
Secure Information Embedding in Forensic 3D Fingerprinting [15.2] 3Dプリンティングの流行は公衆の安全に重大なリスクをもたらす。
情報を識別する3Dプリントをタグ付けするために、いくつかのアプローチが取られている。
指紋として知られるこの情報は、様々なビット埋め込み技術を用いてオブジェクトに書き込まれる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:18:27 GMT)
OTLRM: Orthogonal Learning-based Low-Rank Metric for Multi-Dimensional Inverse Problems [14.9] 学習可能な直交変換に基づく新しいデータ駆動型低ランクt-SVDモデルを提案する。
また、生成ネットワークの効率的な表現を利用して低ランク構造を得るSVTの一般化として低ランク解法を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:28:57 GMT)
Semi-Supervised Risk Control via Prediction-Powered Inference [14.9] リスク制御予測セット(RCPS)は、任意の機械学習モデルの出力を変換し、厳密なエラー率制御で予測ルールを設計するツールである。
ラベルのないデータを利用してハイパーパラメータを厳格に調整する半教師付きキャリブレーション手法を導入する。
提案手法は予測駆動型推論フレームワーク上に構築され,リスク管理タスクに慎重に適合する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:00:23 GMT)
EquiFlow: Equivariant Conditional Flow Matching with Optimal Transport for 3D Molecular Conformation Prediction [14.7] 最適輸送を伴う等変条件付き流れマッチングモデルであるEquiFlowを提案する。
修飾エクイフォーマーモデルを用いて、分子配座とそれらの原子および結合特性を高次埋め込みに符号化する。
QM9データセットの実験では、EquiFlowは現在の最先端モデルよりも小さな分子配座を正確に予測している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:48:22 GMT)
AI Across Borders: Exploring Perceptions and Interactions in Higher Education [14.7] 本研究は,北アイルランドとインドにおける高等教育機関に焦点をあてて,学生のAIに対する認識を考察する。
我々は、1211人の学生から、AIに対する認識と認識について、定量的なLikert評価と質的なコメントを収集する。
その結果, (a) コンピュータサイエンスの学生に対する反応は施設によって異なるが, (b) 施設や教科領域の制御後, 性別の影響はみられなかった。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:02:14 GMT)
BarcodeMamba: State Space Models for Biodiversity Analysis [14.5] BarcodeMambaは、生物多様性分析におけるDNAバーコードのパフォーマンスと効率的な基礎モデルである。
本研究は,BarcodeMambaがパラメータの8.3%しか使用していない場合でも,BarcodeBERTよりも優れた性能を示した。
スケーリング調査では、BarcodeBERTのパラメータの63.6%のBarcodeMambaが、1-nearest neighbor(1-NN)探索で70.2%の遺伝子レベルの精度を達成した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:52:18 GMT)
Modality-Driven Design for Multi-Step Dexterous Manipulation: Insights from Neuroscience [14.5] マルチステップデキスタラスな操作は家庭のシナリオでは基本的なスキルであるが、ロボット工学では未探索の領域である。
本稿では,効率的なモダリティ入力に基づく専用ポリシーで操作プロセスの各ステップに対処するモジュール方式を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 23:05:16 GMT)
LAW: Legal Agentic Workflows for Custody and Fund Services Contracts [14.2] 法律契約は、主要な提供者責任、手数料スケジュール、償還権などの重要な側面を管轄する。
オフ・ザ・シェルフの大規模言語モデルでは、長い構造化されていないテキストストリーム、限られたコンテキスト、複雑な法律用語のために、これらの契約を取り込みます。
Lawは、ドメイン固有のツールとテキストエージェントのスイートを編成することで、ユーザクエリに応答するモジュラー設計を特徴としている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:40:57 GMT)
Attacking Byzantine Robust Aggregation in High Dimensions [13.9] 現代のニューラルネットワークやモデルを訓練するには、通常、高次元ベクトルのサンプルを平均化する必要がある。
ポジショニング攻撃は、モデルをトレーニングするのに使われる平均ベクトルを歪ませたりバイアスしたりし、モデルを特定のパターンを学習させたり、何か役に立つものを学ぶのを防いだりする。
我々は,HIDRAと呼ばれる新たな攻撃が,次元非依存バイアスの主張を覆す強力な防御の実現に有効であることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:04:29 GMT)
GraphMoRE: Mitigating Topological Heterogeneity via Mixture of Riemannian Experts [13.7] 実世界のグラフは本質的に複雑で多様なトポロジカルパターンを持ち、トポロジカル不均一性(topological heterogeneity)として知られている。
既存のほとんどの研究は、複雑な幾何学的形状と一致するには不十分な1つの定曲率空間でグラフ表現を学習し、結果として高い歪みを伴う低品質な埋め込みをもたらす。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:52:40 GMT)
Exploring Enhanced Contextual Information for Video-Level Object Tracking [13.6] 映像レベルのコンテキスト情報は、視覚的オブジェクト追跡にとってますます重要になっている。
既存のメソッドは通常、この情報を伝えるためにいくつかのトークンを使用する。
我々はMCITrackと呼ばれる新しいビデオレベルのビジュアルオブジェクト追跡フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:33:37 GMT)
Teola: Towards End-to-End Optimization of LLM-based Applications [13.5] 大規模言語モデル(LLM)ベースのアプリケーションは、エンドツーエンドのレイテンシに寄与する。
既存のフレームワークでは、各モジュールに最適化を限定するタスクモジュールによる粗粒度のオーケストレーションが採用されている。
タスクプリミティブを基本単位として,各クエリのワークフローをプリミティブレベルのデータフローグラフとして表現する,詳細なエンドツーエンドオーケストレーションを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:53:27 GMT)
Making Bias Amplification in Balanced Datasets Directional and Interpretable [13.4] 我々は、方向予測可能性増幅(DPA)と呼ばれる新しい予測可能性に基づくメトリクスを提案する。
DPAは、バランスの取れたデータセットであっても、方向バイアス増幅を測定する。
実験の結果,DPAは指向性バイアス増幅の測定に有効な指標であることがわかった。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:32:54 GMT)
LLM Based Input Space Partitioning Testing for Library APIs [13.1] ライブラリAPIテストのための LLM ベースの入力空間分割テスト手法 LISP を提案する。
LISPを10の人気のあるオープンソースJavaライブラリから抽出した2,205以上のライブラリAPIメソッドで評価する。
平均して、LISPは67.82%のブランチカバレッジを獲得し、EvoSuiteを1.21倍上回っている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:50:50 GMT)
Rethinking MUSHRA: Addressing Modern Challenges in Text-to-Speech Evaluation [13.0] MUSHRAテストは、TSシステムの評価を同時に行うための有望な代替手段である。
人間の参照音声の一致への依存は、現代のTSシステムのスコアを不当に考慮していることを示す。
MUSHRAテストの2つの改良版を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:38:16 GMT)
DisCo-DSO: Coupling Discrete and Continuous Optimization for Efficient Generative Design in Hybrid Spaces [12.7] DisCo-DSOは、生成モデルを用いて離散的かつ連続的な設計変数に関する共同分布を学習する新しいアプローチである。
特に,決定木を用いた強化学習の最先端手法に対するDisCo-DSOの優位性について述べる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:51:54 GMT)
Optimal Rates for Robust Stochastic Convex Optimization [12.6] 我々は、$epsilon$-optimalcontaminationモデルの下で、最小限のリスク(対数因子まで)を達成する新しいアルゴリズムを開発した。
我々のアルゴリズムは、これらの制限的な仮定を取り除きながら最適な速度を達成し、特に、非平滑だがリプシッツの集団リスクには有効である。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 00:52:08 GMT)
The Impact of Auxiliary Patient Data on Automated Chest X-Ray Report Generation and How to Incorporate It [12.6] 本研究は,胸部X線自動レポート生成のための多モーダル言語モデルへの多様な患者データソースの統合について検討する。
MIMIC-CXRおよびMIMIC-IV-EDデータセットを用いて, 診断精度を高めるために, バイタルサイン, 医薬, 臨床歴などの詳細な患者情報を組み込んだ。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:35:23 GMT)
Segment-Level Diffusion: A Framework for Controllable Long-Form Generation with Diffusion Language Models [12.4] トークンレベルの拡散は語順依存性を見落とし、短い出力ウィンドウを強制する一方、パスレベルの拡散は長文の堅牢な表現を学習するのに苦労する。
テキストセグメンテーションによる拡散に基づくテキスト生成を促進するフレームワークであるSegment-Level Diffusion (SLD)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:47:44 GMT)
Defending Against Sophisticated Poisoning Attacks with RL-based Aggregation in Federated Learning [12.4] フェデレート学習は、毒殺攻撃のモデル化に非常に影響を受けやすい。
本稿では,RLに基づくアダプティブアグリゲーション手法であるAdaAggRLを提案する。
4つの実世界のデータセットの実験により、提案された防衛モデルは高度な攻撃に対して広く採用されている防衛モデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:58:49 GMT)
MoRe: Class Patch Attention Needs Regularization for Weakly Supervised Semantic Segmentation [12.3] そこで本研究では,最小のセマンティック関連性を持つパッチ領域を誤動作させる問題に対処するため,MoReを提案する。
以上の結果から,クラスパッチ注意にさらなる正規化を加える必要があることが示唆された。
MoReはアーティファクトの問題を効果的に解決し、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:20:41 GMT)
Fully and partially distributed Quantum Generalized Benders Decomposition for Unit Commitment Problems [12.2] 単位コミットメント(UC)問題に対処するために、ハイブリッド量子古典的一般化ベンダー分解(GBD)アルゴリズムを提案する。
集中型アプローチでは、量子GBDはマスター問題(MP)を量子コンピューティングに適した二次的制約のない2進最適化形式に変換する。
分散システムでは、分散コンセンサス量子GBDは、サブプロブレムを局所的なサブプロブレムに再構成する平均コンセンサス戦略を用いる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:27:36 GMT)
Embracing Large Language Models in Traffic Flow Forecasting [12.1] 交通流の予測は,交通状況や道路網に基づいて将来の交通を予測することを目的としている。
本稿では,Large Language Model Enhanced Traffic Flow Predictor (LEAF) という新しい手法を提案する。
LEAFは2つのブランチを採用し、それぞれグラフとハイパーグラフ構造を用いて異なるフロー時間関係をキャプチャする。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:08:28 GMT)
TrimLLM: Progressive Layer Dropping for Domain-Specific LLMs [11.6] ドメイン固有のユースケースにおけるローカルデプロイメントのための大規模言語モデル(LLM)の専門化は、強力なパフォーマンスを実現する上で必要である。
我々は,現代のLLMで経験的に観察し,検証した層ワイド特殊化現象に基づいてTrimLLMを開発した。
特定のドメインにおけるLLMの能力を維持し、ハードウェアやディープラーニングフレームワークに関係なく、推論スピードアップが達成できることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:47:16 GMT)
Modeling the Heterogeneous Duration of User Interest in Time-Dependent Recommendation: A Hidden Semi-Markov Approach [11.4] ユーザの関心事の変化を追跡するために,隠れたセミマルコフモデルを提案する。
このモデルでは、(最近)関心のある状態に留まるユーザの異なる期間をキャプチャすることができる。
パラメータを推定し,ユーザの行動を予測するためのアルゴリズムを導出する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:17:45 GMT)
The AI Black-Scholes: Finance-Informed Neural Network [11.3] オプションの価格設定では、既存のモデルは原則駆動の手法とデータ駆動のアプローチに分類される。
対照的に、データ駆動モデルは市場データのトレンドを捉えるのに優れています。
本研究は、原理的手法とデータ駆動手法の両方の長所を統合することによって、これらの制限に対処するハイブリッドアプローチを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:40:40 GMT)
ViPOcc: Leveraging Visual Priors from Vision Foundation Models for Single-View 3D Occupancy Prediction [11.3] 本稿では,視覚基盤モデルからの視覚的先行情報を活用して,詳細な3D占有率予測を行うViPOccを提案する。
また,効率的な実例認識光サンプリングのための意味誘導型非重複ガウス混合サンプリング器を提案する。
本実験は,3次元占有予測と深度推定の両方において,ViPOccの優れた性能を示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:04:27 GMT)
Data Laundering: Artificially Boosting Benchmark Results through Knowledge Distillation [11.2] 知識蒸留は言語モデルベンチマークスコアを操作するために変換可能であることを示す。
データロンダリング(Data Laundering)は、金融マネーロンダリングに似た3段階のプロセスである。
提案手法は,真の推論機能を開発することなく,ベンチマーク精度を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:38:48 GMT)
A dataset of questions on decision-theoretic reasoning in Newcomb-like problems [10.8] いわゆるニューコム型問題の決定理論において,自然言語質問のデータセットを導入する。
ニューコムのような問題に対する推論のいくつかの方法は、モデル間のより深い協調を可能にするかもしれない。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:39:07 GMT)
Fast On-device LLM Inference with NPUs [10.8] 我々は、オンデバイスニューラルプロセッシングユニット(NPU)オフロードを利用した最初のLCM推論システムであるllm.npuについて述べる。
llm.npuは3つのレベルでプロンプトとモデルを再構築することで、NPUのオフロード効率を向上させる。
初めて、llm.npuは10億規模のモデルで1000トークン/秒以上のプリフィルを達成した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:26:41 GMT)
Smaller Language Models Are Better Instruction Evolvers [10.6] 小さい言語モデル(SLM)は大きな言語モデル(LLM)よりも効果的な命令を合成できる
命令データの有効性をより正確に評価するために,インストラクション複合認識IFD(IC-IFD)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:07:48 GMT)
Plug-and-Play Priors as a Score-Based Method [10.5] プラグ・アンド・プレイ (pn) 法は, 物理測定モデルと事前学習した深度デノイザを組み込むことにより, 逆問題の解法として広く用いられている。
スコアベース拡散モデル(SBM)は、画像のスコアを表すディープディープデノイザによる画像生成のための強力なフレームワークとして最近登場した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:10:39 GMT)
Assessing the Human Likeness of AI-Generated Counterspeech [10.4] 本稿では,AI生成音声の人間的類似性について検討する。
LLMベースの生成戦略の実装と評価を行う。
言語的特徴、丁寧さ、特異性の違いを明らかにする。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:07:52 GMT)
PromptV: Leveraging LLM-powered Multi-Agent Prompting for High-quality Verilog Generation [10.0] 本稿では,制約に対処し,コード生成品質を向上させるための,新しいマルチエージェント・プロンプト学習フレームワークを提案する。
マルチエージェントアーキテクチャは、コードエラー訂正機能を改善しつつ、変性リスクを効果的に軽減できることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:58:10 GMT)
MMM: Multilingual Mutual Reinforcement Effect Mix Datasets & Test with Open-domain Information Extraction Large Language Models [10.0] 英語,日本語,中国語の21のサブデータセットを含むMultilingual MRE混合データセット(MMM)を提案する。
また,Large Language Models (LLM) を用いたデータセット翻訳手法を提案する。
オープンドメイン情報抽出大言語モデル(OIELLM)を学習するための統合入力出力フレームワークを開発する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:38:29 GMT)
Rethinking Software Misconfigurations in the Real World: An Empirical Study and Literature Analysis [9.9] 本研究では,823個の実世界の誤設定問題に関する実証的研究を行い,ソフトウェア誤設定の根本原因の新たな分類法を提案する。
研究対象は,基本的なソフトウェアから高度なアプリケーションへと変化している。
一方、性能劣化やセキュリティリスクといった非クラッシュなミスコンフィグレーションに関する研究も大きな成長をもたらしている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:53:41 GMT)
Coupling-based Convergence Diagnostic and Stepsize Scheme for Stochastic Gradient Descent [9.7] グラディエントDescent (SGD) の収束挙動は, 段差構成に大きく依存する。
本稿では, トランジェンス定常状態からの遷移を理論的に追跡する新しい結合型診断法を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 23:50:23 GMT)
Sonicmesh: Enhancing 3D Human Mesh Reconstruction in Vision-Impaired Environments With Acoustic Signals [9.6] SonicMeshは、音響信号とRGB画像を組み合わせて、人間のメッシュを再構築する新しいアプローチである。
我々は,効率的な特徴抽出のために既存の手法HRNetを修正した。
また,多次元特徴アライメントの精度を高めるために,普遍的な特徴埋め込み技術を統合する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:04:26 GMT)
AgentPS: Agentic Process Supervision for Multi-modal Content Quality Assurance through Multi-round QA [9.5] textitAgentPSは、エージェントプロセススーパービジョンをMLLMに統合する新しいフレームワークである。
textitAgentPSは、プロプライエタリなTikTokデータセット上でのベースラインMLLMよりも大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:58:00 GMT)
SpearBot: Leveraging Large Language Models in a Generative-Critique Framework for Spear-Phishing Email Generation [9.3] 大規模言語モデル(LLM)は、コンテンツ生成などのタスクを支援する能力が増している。
本稿では,スピアフィッシングメールを生成するための敵対的フレームワークであるSpearBotを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:13:12 GMT)
RAC3: Retrieval-Augmented Corner Case Comprehension for Autonomous Driving with Vision-Language Models [9.3] VLM(Vision-Language Models)はシナリオ理解の促進に重要な役割を果たす。
幻覚や現実世界の接地不足といった課題に直面している。
本稿では,VLMのコーナケースを効果的に処理する能力を向上させるためのフレームワークであるRAC3を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:51:30 GMT)
GNNs-to-MLPs by Teacher Injection and Dirichlet Energy Distillation [9.1] グラフニューラルネットワーク(GNN)は、グラフベースの学習の基本であり、ノード分類タスクにおいて優れている。
近年の研究では、GNNを高速な推論のために多層パーセプトロン(MLP)に蒸留しようとしている。
我々は,教師インジェクションとディリクレエネルギー蒸留技術を用いて,GNNを層状に蒸留する新しい方法であるTINEDを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:18:56 GMT)
Prediction-Enhanced Monte Carlo: A Machine Learning View on Control Variate [9.1] 予測強化モンテカルロ(PEMC)フレームワークを開発した。
PEMCは、コストを意識したばらつきの低減、平均的な知識の不要化を目標としている。
PEMCは2種類のエキゾチックオプション価格問題により有効性を示した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:41:38 GMT)
SceneLLM: Implicit Language Reasoning in LLM for Dynamic Scene Graph Generation [8.8] SceneLLMはビデオフレームを言語信号(シーントークン)に変換するフレームワークである
提案手法は,Action Genome (AG) ベンチマークの最先端結果を実現する。
大規模な実験は、正確な動的シーングラフの理解と生成におけるSceneLLMの有効性を示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:41:31 GMT)
ViLCo-Bench: VIdeo Language COntinual learning Benchmark [8.7] ビデオテキストタスクの連続学習モデルを評価するために設計されたViLCo-Benchを提案する。
データセットは10分間のビデオと、公開されているデータセットから収集された対応する言語クエリで構成されている。
本稿では,自己教師付き学習を取り入れ,長期記憶効果と短期記憶効果を模倣する新しい記憶効率フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:24:12 GMT)
Reliable, Reproducible, and Really Fast Leaderboards with Evalica [8.4] 信頼性と再現性のあるモデルリーダーボードの作成を容易にするオープンソースツールキットであるEvalicaを紹介します。
本稿では,その設計を示し,その性能を評価し,Webインターフェース,コマンドラインインターフェース,Python APIによるユーザビリティを実証する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:22:46 GMT)
Learning Set Functions with Implicit Differentiation [8.3] Ou et al. (2022) は、いわゆる最適部分集合オラクルによって生成されたデータから集合関数を学習する問題を提起した。
これは固定点反復に還元されるが、繰り返しの数が増加するにつれて、自動微分はすぐに計算的に禁止される。
この課題を暗黙の微分で解決し、固定点反復に対する収束条件を検討する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:42:09 GMT)
Bounds on eigenstate thermalization [8.3] 固有状態熱化仮説(ETH)は、多体量子系の全ての固有状態が熱アンサンブルと区別できないと主張している。
ここでは、$m_ast$ のすべての $m$-body 作用素が ETH を満たすような、$m_ast$ 上の上界と下界の存在を示す。
本結果は, 熱および量子ゆらぎを含む数体の演算子に対して, 汎用系がETHを満たすことを示唆している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:04:38 GMT)
Why and How: Knowledge-Guided Learning for Cross-Spectral Image Patch Matching [7.7] 特徴関係学習に基づくクロススペクトル画像パッチマッチングが注目されている。
我々は、記述子学習とメートル法学習の間の安定的で効率的な橋渡しを初めて試みる。
我々は,知識誘導学習ネットワーク(KGL-Net)を構築し,優れた性能向上を実現する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:59:23 GMT)
ChipAlign: Instruction Alignment in Large Language Models for Chip Design via Geodesic Interpolation [7.7] ChipAlign は一般的な命令整列 LLM の強みとチップ固有の LLM を組み合わせる。
ChipAlign は既存のチップ LLM の命令追従能力を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:21:24 GMT)
An Efficient Sign Language Translation Using Spatial Configuration and Motion Dynamics with LLMs [7.6] グロスフリー手話翻訳(英: Gloss-free Sign Language Translation, SLT)は、手話の動画を直接言語文に変換する言語である。
本稿では手話に固有の空間的構成や動きのダイナミクスを捉えることの重要性を強調する。
本稿では,空間と運動に基づく手話翻訳(SpaMo)について紹介する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:18:53 GMT)
Sequence-Level Analysis of Leakage Risk of Training Data in Large Language Models [7.6] 我々はデコード方式,モデルサイズ,プレフィックス長,部分シーケンスリーク,トークン位置の影響を再解析する。
本研究は,LLaMaとOPTの2つの事前学習モデルについて,それぞれコモンクローリングとパイルでトレーニングを行った。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:27:45 GMT)
PoseMamba: Monocular 3D Human Pose Estimation with Bidirectional Global-Local Spatio-Temporal State Space Model [7.3] 単眼ビデオにおける複雑な人間のポーズ推定のための線形相関を用いたSSMに基づく純粋手法を提案する。
具体的には、各フレーム内だけでなく、フレーム間の人間の関節関係を包括的にモデル化する、双方向の時間的・時間的ブロックを提案する。
この戦略により、より論理的な幾何学的順序付け戦略が提供され、結果として局所空間スキャンが組み合わせられる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:49:36 GMT)
SAKA: An Intelligent Platform for Semi-automated Knowledge Graph Construction and Application [7.3] 半自動KG構築・アプリケーション(saka)のためのインテリジェントでユーザフレンドリーなプラットフォームを提案する。
音声データからKGを確立するために,音声に基づくKG情報抽出(AGIE)手法を提案する。
坂プラットフォーム上での半自動KG工法の有効性を実証する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:20:03 GMT)
Set-Valued Sensitivity Analysis of Deep Neural Networks [7.2] 本稿では,ディープニューラルネットワーク(DNN)のセット値マッピングに基づく感度解析フレームワークを提案する。
集合間の距離、集合の収束、集合値写像の微分、解集合全体の安定性などの集合レベルのメトリクスを開発することにより、完全連結ニューラルネットワークの解集合がリプシッツ的な性質を持つことを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:22:38 GMT)
The "Huh?" Button: Improving Understanding in Educational Videos with Large Language Models [7.2] 本稿では,大規模言語モデル(LLM)を教育に利用する簡単な方法を提案する。
具体的には、オンラインビデオに新たな機能を追加することで、個人の理解を改善することを目的としている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:02:16 GMT)
Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes [7.0] 平均回帰マルコフ決定プロセス(MDPs)は、不確実性の下でのシーケンシャルな意思決定の基盤となる枠組みを提供する。
平均再帰型MDPのユニークな構造特性を考察し,これを用いてReward-Extended Differential (RED) 強化学習を導入する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:28:30 GMT)
AI-Driven Innovations in Volumetric Video Streaming: A Review [6.8] ボリュームビデオは6DFを可能にする3Dコンテンツの一形態である。
この3Dデータの新たな形式での展開は、送信とレンダリングにおいて大きな課題となる。
近年、研究者はこれらの課題に対処する様々なAI駆動技術を提案している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:40:46 GMT)
DenoMamba: A fused state-space model for low-dose CT denoising [6.5] 低線量CT(LDCT)は放射線曝露に伴う潜在的なリスクを低くする。
LDCT denoisingは、基礎となる組織信号からの線量減少によって引き起こされるノイズを分離するために、データ駆動画像の事前学習を行うニューラルネットワークモデルに基づいている。
DenoMambaは、状態空間モデリング(SSM)に基づく、医療画像の短距離および長距離コンテキストを効率的にキャプチャする新しいデノナイジング手法である。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:11:59 GMT)
Leveraging Large Language Models for Active Merchant Non-player Characters [6.4] 我々は、現在の商人ノンプレイヤーキャラクタ(NPC)の通過に繋がる2つの重要な課題を強調した。
評価モジュールと交渉モジュールから構成されるMARTと呼ばれる,大規模言語モデル(LLM)に基づく商談フレームワークを提案する。
その結果, 教師付き微粒化 (SFT) や知識蒸留 (KD) などの微粒化法は, より小型のLCMを用いて, アクティブな商店NPCの実現に有効であることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:48:39 GMT)
FlashSparse: Minimizing Computation Redundancy for Fast Sparse Matrix Multiplications on Tensor Cores [6.4] 我々は、スパースワークロードとTCUアーキテクチャのギャップを埋める新しいアプローチであるFlashSparseを提案する。
特に、FlashSparseは、新しいスワップ・アンド・トランスポーション行列乗算戦略により、TCUs上のSpMMとSDDMMのスパース粒度を最小化する。
我々はFlashSparseがスパース行列乗算のための新しい最先端技術(幾何学平均はDTC-SpMMより5.5倍、RoDeより3.22倍)をセットしていることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:12:33 GMT)
SwiftEdit: Lightning Fast Text-Guided Image Editing via One-Step Diffusion [6.4] 我々は,テキスト誘導画像編集を実現するシンプルな,かつ高効率な編集ツールであるSwiftEditを紹介した。
SwiftEditの進歩には、2つの新しいコントリビューションがある。
特にSwiftEditは、従来のマルチステップメソッドよりもはるかに高速な、インスタントテキストガイドの画像編集を可能にする。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:10:39 GMT)
Multilateral Cascading Network for Semantic Segmentation of Large-Scale Outdoor Point Clouds [6.3] Multilateral Cascading Network (MCNet)はこの課題に対処するために設計された。
MCNetは、Multilateral Cascading Attention Enhancement (MCAE)モジュールとPoint Cross Stage partial (P-CSP)モジュールの2つの主要なコンポーネントから構成されている。
その結果,mIoU全体では2.1%,小さめの対象カテゴリーでは平均15.9%の改善が得られた。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:18:36 GMT)
Macro2Micro: Cross-modal Magnetic Resonance Imaging Synthesis Leveraging Multi-scale Brain Structures [6.2] 我々は、GAN(Generative Adversarial Network)を用いて、マクロ構造から脳の微細構造を予測するディープラーニングフレームワークであるMacro2Microを紹介する。
以上の結果から,Macro2MicroはT1強調MRIをFA画像に忠実に変換し,従来法と比較して構造類似度指数測定(Structure similarity Index Measure, SSIM)を6.8%改善した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 18:49:20 GMT)
Data Augmentations Go Beyond Encoding Invariances: A Theoretical Study on Self-Supervised Learning [6.2] 拡張は元のデータと似ていても、多種多様である必要はなく、どちらもあり得ないことを示す。
自己指導型学習において、このような拡張を再構築し、強化選択に関する洞察を与えるアルゴリズムを提供する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 23:55:50 GMT)
An advantage based policy transfer algorithm for reinforcement learning with measures of transferability [5.9] 強化学習(Reinforcement Learning, RL)は, 複雑・高次元環境における逐次的意思決定を可能にする。
本稿では、固定されたドメイン環境に対する非政治アドバンテージベースのポリシー転送アルゴリズムであるAPT-RLを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:27:10 GMT)
Efficient Quantization-Aware Training on Segment Anything Model in Medical Images and Its Deployment [5.9] CVPR 2024 MedSAM on Laptop Challengeは、精度と処理速度の最適なバランスを見つけるために設立された。
医用画像のセグメンション・アプライシング・モデル(Segment Anything Model)を効率的に定量化するための量子化対応訓練パイプラインを提案する。
実験結果から,本手法は精度を保ちながら,ベースライン上での処理速度を大幅に向上することを確認した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:35:07 GMT)
Dynamic Graph Attention Networks for Travel Time Distribution Prediction in Urban Arterial Roads [5.8] 本研究では,動脈回廊沿いの両方向の走行時間分布を同時モデル化する構造的枠組みを提案する。
その結果, サイクル長, グリーンパーセンテージ, 交通密度, 反現実経路など, 効果的な交通変動に対するレジリエンスが示された。
このフレームワークは、動的信号タイミングをサポートし、混雑管理を強化し、現実世界のアプリケーションにおける走行時間の信頼性を向上させる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:30:01 GMT)
OffensiveLang: A Community Based Implicit Offensive Language Dataset [5.8] ヘイトスピーチや攻撃的な言語は、明示的な形と暗黙的な形の両方に存在する。
OffensiveLangはコミュニティベースの暗黙的な攻撃的な言語データセットである。
本稿では、暗黙の攻撃的言語を効果的に生成するプロンプトベースのアプローチを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:56:04 GMT)
Closed dynamical recursion equations for correlation functions and the application on the construction of Liouvillian spectrum in Lindbladian systems [5.8] 開量子系の完全な特徴づけは、典型的にはリウヴィリアスペクトルと相関関数の知識を必要とする。
二次イオビリア超作用素に付随するすべての偶数次相関関数に対して、閉形式の動的再帰方程式を導出する。
また、二次相関関数の閉包に必要な条件を定式化して、四進イオビリアン超作用素についても検討する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:22:34 GMT)
Feature engineering vs. deep learning for paper section identification: Toward applications in Chinese medical literature [5.8] セクション識別は図書館科学、特に知識管理にとって重要な課題である。
中国医学文献分析の文脈における論文セクション識別問題について検討する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:11:14 GMT)
Learning Parameter Sharing with Tensor Decompositions and Sparsity [5.7] 本稿では,大きな視覚変換器モデルを効率よく圧縮する新しいアルゴリズムFiPSを提案する。
FiPSは、多層知覚モジュール間の共有ニューロンを表現するために、共有基底とスパース因子を用いる。
実験により、FiPSはDei-BとSwin-LTを元のパラメータの25-40%まで圧縮し、元のモデルの1パーセンテージ以内の精度を維持した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:12:48 GMT)
Nanoscaling Floating-Point (NxFP): NanoMantissa, Adaptive Microexponents, and Code Recycling for Direct-Cast Compression of Large Language Models [5.7] ナノスケーリング(NxFP)は、最先端のMxFPよりも精度とメモリフットプリントを向上する3つの手法を提案する。
NxFPはメモリフットプリントを最大16%削減し、MxFPと同等のパープレキシティを実現する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:18:20 GMT)
Missing data imputation for noisy time-series data and applications in healthcare [5.6] インパテーション(英: Imputation、すなわち、欠落した値を埋めること)は、ノイズの多い時系列データを扱う一般的な方法である。
本研究では,MICE-RF(Multiple Imputation with Random Forest)や先進的な深層学習アプローチなどの計算手法を比較した。
この結果から,MICE-RFは深層学習法と比較して,欠落したデータを効果的にインプットできることが示唆された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:23:20 GMT)
Towards Context-aware Convolutional Network for Image Restoration [5.3] トランスフォーマーベースのアルゴリズムと注意に基づく畳み込みニューラルネットワーク(CNN)は、いくつかの画像復元タスクにおいて有望な結果を示している。
既存のIR用畳み込み残基は、入力を高次元および非線形の特徴空間にマッピングする限られた能力に遭遇する。
本研究では,文脈認識型畳み込みネットワーク(CCNet)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:29:33 GMT)
Analyzing the Attention Heads for Pronoun Disambiguation in Context-aware Machine Translation Models [5.3] 代名詞不明瞭化のための文脈認識機械翻訳モデルにおけるアテンションヘッドの役割について検討する。
モデルにより特定の頭部が不使用であることが示され、より強い関係の1つに頭だけが参加すれば、モデル性能が向上する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:42:49 GMT)
GENIE: Watermarking Graph Neural Networks for Link Prediction [5.1] グラフニューラルネットワーク(GNN)は、グラフベースの機械学習において、貴重な知的特性となっている。
ウォーターマーキングはディープニューラルネットワークにとって有望なODフレームワークであるが、グラフデータの非ユークリッド性のため、既存の手法ではGNNに一般化できない。
本稿では、リンク予測(LP)のためのGNNを透かし出す最初のスキームであるGENIEを提案する。
提案手法はDWT(Dynamic Watermark Thresholding)を搭載し,既存の透かし方式の実践的問題に対処しながら高い検証確率(>99.99%)を確保する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:46:38 GMT)
Parallel variational quantum algorithms with gradient-informed restart to speed up optimisation in the presence of barren plateaus [4.8] フレミング・ヴィオットの伝統では、平行探索は粒子と呼ばれる。
提案手法では,勾配が小さすぎる領域やうるさい領域に遭遇した場合,フレミング・ヴィオット粒子による探索は停止され,不毛の台地が示唆される。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:42:29 GMT)
Fine-grained Text to Image Synthesis [4.7] 微細なテキストから画像合成は、異なるカテゴリに属するテキストから画像を生成する。
補助分類器は、識別器が画像のクラスを分類するのを手助けし、生成器がより正確なきめ細かい画像を合成するのを手助けする。
我々はCUB-200-2011の鳥のデータセットとオックスフォード102の花のデータセットを用いて,いくつかの最先端手法の評価を行った。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:56:40 GMT)
Cultural Palette: Pluralising Culture Alignment via Multi-agent Palette [4.7] 既存の方法は、微調整後の無形培養への適応性に欠ける。
5大陸にわたる文化地理学から着想を得て,文化アライメントのための多エージェントフレームワークであるカルチャー・パレットを提案する。
これに基づいて、カルチャー・パレットは5つの大陸レベルのアライメントエージェントとメタエージェントを統合する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:30:52 GMT)
Problem-dependent convergence bounds for randomized linear gradient compression [4.7] 分散最適化では、通信モデルの更新がパフォーマンスのボトルネックになる可能性がある。
最適化向上の手段として勾配圧縮法が提案されている。
我々は, 圧縮がスループットに与える影響を, ヘッセン目標のノルムの観点から検討する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 22:18:59 GMT)
A multi-theoretical kernel-based approach to social network-based recommendation [4.5] 我々は,ネットワーク理論に従って,個々の類似点を記述したカーネルの設計と選択を行う。
我々は、カーネルを統一モデルに組み合わせるために、非線形多重カーネル学習アルゴリズムを用いる。
提案手法を実写映画レビューデータセット上で評価する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:23:14 GMT)
Imagined Speech State Classification for Robust Brain-Computer Interface [4.4] 本研究では,機械学習モデルと深層学習モデルの有効性について検討した。
ディープラーニングモデル、特にEEGNetは0.7080、F1スコア0.6718に達した。
これらの知見は、脳-コンピュータインタフェース(BCI)アプリケーションにおける従来の機械学習アプローチの限界を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 23:59:55 GMT)
Phase diagram of Rydberg atoms in a two-leg rectangular ladder [4.3] 格子間隔が$a_x=2a_y$の2脚リドバーグ・ラダーアレイの基底状態位相図を写像する。
翻訳対称性やトップボトム反射対称性を自発的に破壊する様々な密度波位相を同定する。
我々の研究は、Rydberg原子配列の量子シミュレーションへのさらなる応用を動機付けている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:28:59 GMT)
Deep Spectral Clustering via Joint Spectral Embedding and Kmeans [4.3] textbfDeep textbfSpectral textbfClustering (textbfDSC)は、スペクトル埋め込みモジュールとgreedy Kmeansモジュールの2つの主要モジュールから構成される。
前者のモジュールは、ディープニューラルネットワークとパワーイテレーションを使用して、サンプルをスペクトル埋め込み空間に効率的に埋め込むことを学ぶ。
後者のモジュールは、学習したスペクトル埋め込み上のKmeansのクラスタ構造を、グリーディ最適化戦略によって改善する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 06:40:22 GMT)
Populating cellular metamaterials on the extrema of attainable elasticity through neuroevolution [4.2] 材料の異なる機械的特性間のトレードオフは、工学的材料設計における課題を提起する。
我々は、多目的最適化(MOO)問題を効率的に解くために、神経進化アルゴリズムを用いる。
本手法は多分野にわたる多種多様なメタマテリアルの計算的発見のための普遍的な枠組みとして機能する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:18:30 GMT)
Quantum sensitivity of parametric oscillators [4.2] 任意の初期状態の量子統計は、初期状態のダイナミックスにインプリントされ、定常状態の確率で持続可能であることを示す。
我々の研究は、マクロなシステムの量子初期状態に対する感度をテストできる新しい種類の実験への道を開く。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 18:47:25 GMT)
Leveraging Multimodal Protein Representations to Predict Protein Melting Temperatures [4.1] 我々はESM-2、ESM-3、AlphaFoldなどの強力なタンパク質言語モデルに基づくモデルを開発する。
我々は、s571テストデータセット上で新しい最先端性能を求め、ピアソン相関係数(PCC)0.50を得る。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:55:33 GMT)
Unimodal and Multimodal Static Facial Expression Recognition for Virtual Reality Users with EmoHeVRDB [4.1] そこで我々は,顔表情認識(FER)のためのMeta Quest Pro Virtual Reality(VR)ヘッドセットを用いて取得した表情アクティベーション(FEA)をVR環境で活用する可能性を検討した。
その結果, 静的FERタスクに対して最大73.02%の精度を7つの感情カテゴリーで達成した。
我々は、FEAと画像データをマルチモーダルアプローチに統合し、認識精度の大幅な改善を観察した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:49:46 GMT)
Decoding Drug Discovery: Exploring A-to-Z In silico Methods for Beginners [4.1] 本研究の主な目的は、薬物開発プロセスで使用されるシリコ法をレビューすることである。
本稿では, 生物活性化合物の標的同定に必須であるシリカ技術におけるA-to-Zについて, 徹底的に論じる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:02:38 GMT)
Detecting Daily Living Gait Amid Huntington's Disease Chorea using a Foundation Deep Learning Model [3.8] 既存のモデルは、神経変性疾患を持つ個人の歩行を検出するのに苦労することが多い。
我々は、U-NetにインスパイアされたディープラーニングモデルであるJ-Netを開発した。
J-Netは、手首回りの加速度計データを処理して、日常生活中の歩行を検出する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:19:39 GMT)
ProFe: Communication-Efficient Decentralized Federated Learning via Distillation and Prototypes [3.7] 分散フェデレーションラーニング(DFL)は、協力的かつプライバシー保護的な方法でモデルをトレーニングする。
本稿では,知識蒸留,プロトタイプ学習,量子化技術を組み合わせたDFLのための新しい通信最適化アルゴリズムであるProFeを紹介する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:49:29 GMT)
Hierarchical Bidirectional Transition Dispersion Entropy-based Lempel-Ziv Complexity and Its Application in Fault-Bearing Diagnosis [3.7] Lempel-Ziv complexity (LZC) は非線形時系列の不規則性や複雑性を検出する鍵となる尺度である。
Permutation Lempel-Ziv complexity (PLZC) や Dispersion-Entropy based Lempel-Ziv complexity (DELZC) といった既存のLZCベースのメトリクスは主に独立した埋め込みベクトルのパターンに焦点を当てている。
本稿では,二方向性遷移分散エントロピーをベースとしたLZC-Ziv複雑性(BT-DELZC)という新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:00:28 GMT)
Fuzz on the Beach: Fuzzing Solana Smart Contracts [3.7] 本稿では,Solaraスマートコントラクトのためのバイナリのみのカバレッジ誘導型ファジリングアーキテクチャであるFuzzDelSolを提案する。
FuzzDelSolは、スマートコントラクトインタラクションのようなランタイム仕様を忠実にモデル化します。
6049のスマートコントラクトに対する評価は,FuzzDelSolのバグオーラクルが高精度かつリコール可能なバグを発見できることを示している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:30:57 GMT)
NER- RoBERTa: Fine-Tuning RoBERTa for Named Entity Recognition (NER) within low-resource languages [3.5] 本研究は、クルド人NER(KNER)のための事前学習されたRoBERTaモデルの微調整手法を提案する。
実験の結果,SentencePieceトークン化方式で調整したRoBERTaはKNERの性能を大幅に向上することがわかった。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:07:17 GMT)
Can a Neural Model Guide Fieldwork? A Case Study on Morphological Data Collection [3.5] 言語学のフィールドワークは、言語の文書化と保存において重要な要素である。
本稿では,言語学者をフィールドワーク中に指導し,言語学者と話者の相互作用のダイナミクスを説明する新しいモデルを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 00:07:34 GMT)
Minimax Regret Estimation for Generalizing Heterogeneous Treatment Effects with Multisite Data [3.4] 異種集団の多地点データを用いたロバストなCATE(条件平均処理効果)推定手法を開発した。
得られたCATEモデルは、サイト固有CATEモデルの重み付き平均として表される、解釈可能な閉形式解を持つことを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 10:00:07 GMT)
Regularized Dikin Walks for Sampling Truncated Logconcave Measures, Mixed Isoperimetry and Beyond Worst-Case Analysis [3.4] ポリトープ上の対流圏分布から試料を抽出する問題について検討した。
インテリアポイント法とダイキンウォークに基づいて、正規化ダイキンウォークの混合時間を分析する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:43:51 GMT)
ABC3: Active Bayesian Causal Inference with Cohn Criteria in Randomized Experiments [3.3] 本研究では,条件付き平均処理効果における推定誤差を最小化するポリシを,統合後分散の最小化と等価に示す。
理論上、ABC3は治療群と制御群との間の不均衡を最小化し、タイプ1のエラー確率を最小化する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:00:57 GMT)
Multi-Graph Co-Training for Capturing User Intent in Session-based Recommendation [3.1] セッションベースのレコメンデーションは、匿名ユーザセッションのシーケンスに基づいて、ユーザが次に対話するアイテムを予測することに焦点を当てる。
既存の手法のほとんどは、利用可能な豊富な補助情報を見渡すことで、ユーザの現在のインタラクションに大きく依存している。
我々は,現在のセッショングラフだけでなく,類似セッショングラフやグローバルアイテム関係グラフも活用する,新しいモデルであるMulti-Graph Co-Training Model (MGCOT)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:08:07 GMT)
Unpaired Multi-Domain Histopathology Virtual Staining using Dual Path Prompted Inversion [3.1] 本稿では,即時学習を用いた二経路反転仮想染色法を提案する。
我々は,プラグイン・アンド・プレイの視覚的プロンプトアプローチにより,完全なコンテンツスタイルのゆがみを実現する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:09:56 GMT)
Data Collaboration Analysis with Orthogonal Basis Alignment [2.9] Data Collaboration (DC)フレームワークは、マルチソースデータ融合のためのプライバシ保護ソリューションを提供する。
その強みにもかかわらず、DCフレームワークは、生データのマッピングに使用されるベースを整合させるという理論的課題のために、しばしばパフォーマンスの不安定さに直面する。
本研究は,直流フレームワーク内でのベースアライメントのための厳密な理論基盤を確立することで,これらの課題に対処する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:50:07 GMT)
Knowledge Migration Framework for Smart Contract Vulnerability Detection [2.9] 本稿では,効率的な知識マイグレーションを取り入れたスマートコントラクト脆弱性検出フレームワークを提案する。
AF-STipは教師ネットワークをメインモデルとし、スマートコントラクトによって処理された知識を学生モデルに移行する。
このアプローチは、計算オーバーヘッドを同時に削減しつつ、特徴抽出とクラス間の適応のためのモデルの能力を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:01:11 GMT)
Volumetric Mapping with Panoptic Refinement via Kernel Density Estimation for Mobile Robots [2.9] 移動ロボットは通常、軽量ネットワークを使用してRGB画像上にオブジェクトを分割し、深度マップを介してそれらをローカライズする。
非パラメトリックな統計的手法を用いて分割誤差を補修することで3次元シーン再構成における汎視的セグメンテーション品質の問題に対処する。
予測マスクを深度フレームにマッピングし,カーネル密度を用いて分布を推定する。
奥行き知覚の外れ値は、追加のパラメータを必要とせずに拒否される。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:46:23 GMT)
Deployment Pipeline from Rockpool to Xylo for Edge Computing [2.7] Rockpoolフレームワークを介してXyloニューロモルフィックチップ上にスパイキングニューラルネットワークをデプロイすることは、大きな進歩を示している。
この記事では、Rockpoolの機能をXyloのアーキテクチャに統合することを強調する、新しいデプロイメントパイプラインについて説明する。
デジタルスパイキングアーキテクチャやイベント駆動処理モデルなど、Xyloチップのユニークな利点は、リアルタイム・パワーセンシティブなアプリケーションに適していることを示すために強調されている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:19:10 GMT)
Constrained Measurement Incompatibility from Generalised Contextuality of Steered Preparation [2.5] 2部構成のベルのシナリオでは、1つの翼における測定の不整合性は必要であり、非局所性を明らかにするのに十分である。
我々は、自然の任意の実効的理論の許容される測度の不整合性に制限を与える、一般化された文脈性であると主張する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:00:27 GMT)
Image Forgery Localization with State Space Models [2.4] LoMaは,大域的画素依存性モデリングのための選択状態空間(S6)モデルと局所的画素依存性モデリングのための反転残差CNNを利用する,新しい画像フォージェリローカライゼーション手法である。
提案手法では,まず,空間領域をトラバースし,改ざんした画像を順序付きパッチシーケンスに変換するために,アトラス選択的スキャンを用いたMixed-SSMブロックを提案する。
局所的特徴抽出を強化するために補助的畳み込み分岐を導入する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:10:53 GMT)
RoLargeSum: A Large Dialect-Aware Romanian News Dataset for Summary, Headline, and Keyword Generation [2.4] RoLargeSumはルーマニア語のための新しい大規模要約データセットである。
ルーマニアとモルドバ共和国の様々な公開ニュースサイトからクロールされた。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:27:33 GMT)
Temporal-Aware Evaluation and Learning for Temporal Graph Neural Networks [2.3] 時間グラフニューラルネットワーク(TGNN)は、時間グラフから動的情報をモデル化し、学習するために設計されたグラフニューラルネットワークのファミリーである。
本稿では,TGNNの一般的な評価基準について検討し,本質的な時間構造を捉える上でのこれらの指標の故障機構について述べる。
本稿では、モデル時間性能のより洗練された分析を目的とした、新しいボラティリティ対応評価指標(決定ボラティリティクラスタ統計)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:10:49 GMT)
Algorithmic Collusion or Competition: the Role of Platforms' Recommender Systems [2.3] オンラインプラットフォームは通常、消費者が商品を発見し購入する方法に影響を与えるレコメンデーションシステムを展開する。
いくつかの重要なコンポーネントを統合する新しいゲームフレームワークを提案する。
収益最大化レコメンダシステムはアルゴリズムによる共謀を増大させるのに対し,ユーティリティ最大化レコメンダシステムは売り手間の競争力を高めていることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:36:19 GMT)
Seeing the Forest and the Trees: Solving Visual Graph and Tree Based Data Structure Problems using Large Multimodal Models [2.2] 本稿では,大規模マルチモーダルモデル(LMM)による画像のみに基づくグラフおよびツリーデータ構造問題の解法について検討する。
GPT-4o と Gemini 1.5 Flash はそれぞれ木とグラフで最高の性能を示した。
本研究は,構造的および視覚的変動がモデル性能に与える影響を明らかにする。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:15:19 GMT)
Fabrication of low-loss Josephson parametric devices [2.2] GHz帯で動作する低損失ジョセフソンパラメトリックデバイスの作製と特性について報告する。
これらの低損失デバイスは、高性能量子回路の実現において重要な一歩を踏み出した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:04:09 GMT)
Do Tutors Learn from Equity Training and Can Generative AI Assess It? [2.1] 本研究では,教師のスキル向上のためのオンライン授業において,教師のパフォーマンスを評価する。
教師の自己報告による知識への信頼度の増加に伴い,学習の習得率が著しく向上することがわかった。
この作業では、レッスンログデータ、チューター応答、人間のアノテーション用のルーブリック、生成AIプロンプトのデータセットが利用可能になる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:36:40 GMT)
Concept Learning in the Wild: Towards Algorithmic Understanding of Neural Networks [2.1] 本稿では,既存のグラフニューラルネットワーク(GNN)モデルにおける概念学習について検討する。
我々の分析によると、このモデルは人間設計SAT、特に「支援」の概念と一致する重要な概念を学習している。
発見された概念は、ブラックボックスのGNNを「リバースエンジニアリング」し、ホワイトボックスの教科書アルゴリズムとして書き換える。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:37:56 GMT)
Wearable Accelerometer Foundation Models for Health via Knowledge Distillation [2.0] 我々は,2000万分のラベルのないデータを用いて生体信号間で表現的知識を蒸留できることを実証した。
また, 蒸留アセロメトリエンコーダは, 直接アセロメトリデータに基づいて訓練された自己監督型エンコーダや教師型エンコーダに比べて, はるかに有意な情報表現を有することを示した。
我々は、健康のための加速度計の基礎モデルが、あらゆるウェアラブルデバイスからデジタルバイオマーカーを開発する新しい機会を解放するかもしれないと考えている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 18:48:14 GMT)
One-Shot Multilingual Font Generation Via ViT [2.0] フォントデザインは、中国語、日本語、韓国語といったログラフ言語に固有の課題をもたらす。
本稿では,多言語フォント生成のためのビジョントランスフォーマー(ViT)ベースのモデルを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 23:52:35 GMT)
Transparent Networks for Multivariate Time Series [2.0] 我々は,GATSM(Generalized Additive Time Series Model)と呼ばれる,時系列のための新しい透明ニューラルネットワークモデルを提案する。
GATSMは,1)特徴表現を学習する独立した特徴ネットワーク,2)時間ステップの異なる時間パターンを学習する透明な時間モジュールの2つの部分から構成される。
実証実験により、GATSMは既存の一般化加法モデルよりも大幅に優れ、ブラックボックスの時系列モデルに匹敵する性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:56:04 GMT)
From Votes to Volatility Predicting the Stock Market on Election Day [1.9] 選挙日は、市場ボラティリティの強化を特徴とする、そのような重要なシナリオの1つである。
我々のアプローチは、選挙の政治的・経済的影響を分析するために設計された特殊エージェントとともに、大規模言語モデルの文脈的能力を活用する。
最先端のアーキテクチャ上に構築することにより、EDSMFは、このユニークな揮発性日にS&P 500の予測性能を改善することを実証する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:58:20 GMT)
Leveraging Digital Twin Technologies for Public Space Protection and Vulnerability Assessment [1.7] 公共空間の保護を均等に強化するために,Digital Twin-as-a-Security-Service (DTS)アーキテクチャを導入した。
提案されたフレームワークは、Digital Twin(DT)の概念化と、IoT(Internet of Things)、クラウドコンピューティング、ビッグデータ分析、AIなどの最先端技術を組み合わせたものだ。
全体として、アーキテクチャは、大規模で批判的で人気のあるソフトターゲットに対する複雑でハイブリッドで複合的な脅威を扱う可能性を高めている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:48:23 GMT)
Predicting Crack Nucleation and Propagation in Brittle Materials Using Deep Operator Networks with Diverse Trunk Architectures [1.6] 我々は分岐ネットワークとトランクネットワークからなるディープニューラル演算子(DeepONet)を用いて脆性破壊問題を解決する。
最初のアプローチでは,2段階のDeepONetの有効性を示す。
第2のアプローチでは、物理インフォームドされたDeepONetを用いて、エネルギーの数学的表現をトランクネットワークの損失に統合し、物理的一貫性を強制する。
第3のアプローチでは、トランク内のニューラルネットワークをコルモゴロフ・アルノルドネットワークに置き換え、物理損失なしにトレーニングする。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:50:30 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.6] LOLAは160以上の言語で訓練された多言語大言語モデルである。
私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。
学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 00:34:42 GMT)
An Enhanced Text Compression Approach Using Transformer-based Language Models [1.3] テキスト圧縮のための変換器ベースのRejuvenateFormeを提案する。
我々の精巧な前処理技術はLe-Ziv-Welchアルゴリズムを取り入れている。
RejuvenateFormeは、EN-DE、EN-FR、BookCorpus corporaのBLEUスコアが27.31、25.78、50.45に達した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:01:17 GMT)
The generalized CV conjecture of Krylov complexity [1.2] クリロフ複雑性は情報幾何学におけるフビニ・スタディ計量の体積と等しいと推測する。
変位演算子を用いることで、閉系に対する波動関数がよく知られた2モード圧縮状態に対応することが分かる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:34:46 GMT)
SAM-IF: Leveraging SAM for Incremental Few-Shot Instance Segmentation [1.1] SAM-IFはSegment Anything Model(SAM)を利用したインクリメンタルな少数ショットインスタンスセグメンテーション手法である。
提案手法は,既存手法と比較して,競争力はあるものの合理的な結果が得られる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 03:11:41 GMT)
Experimental demonstration of enhanced quantum tomography via quantum reservoir processing [0.9] ボーソニック回路の量子力学プラットフォーム上での連続可変状態再構成のための量子貯水池処理手法を実験的に実証した。
この方法で学習したマップは,複数のテスト状態に対して高い再現性を実現し,システムの理想化されたモデルに基づいて計算されたマップよりも大幅に性能を向上することを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:02:43 GMT)
Non-Markovian Noise Suppression Simplified through Channel Representation [0.9] 任意の非マルコフ量子力学のチャネル表現をChoiチャネルと呼ぶ。
この表現は、非マルコフ雑音の複素力学を理想状態に作用するノイズチャネルの慣れ親しんだ図形に変換する。
パウリツイリング、確率的エラーキャンセル、仮想チャネル浄化を用いた新しいプロトコルを考案した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:26:07 GMT)
How not to Stitch Representations to Measure Similarity: Task Loss Matching versus Direct Matching [0.7] タスク損失マッチングは類似度指標として非常に誤解を招く可能性があると我々は主張する。
これは非常に遠い層の間の非常に高い類似性を示し、その表現は異なる機能特性を持つことが知られている。
さらに驚くべきことに、同一ネットワーク内のレイヤを比較する場合、タスク損失マッチングは、一部のレイヤがそれ自身よりもレイヤに類似していることを示すことが多い。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:18:49 GMT)
Tensor Network Computations That Capture Strict Variationality, Volume Law Behavior, and the Efficient Representation of Neural Network States [0.6] 本稿では,振幅の収縮の計算グラフによって定義されるテンソルネットワーク状態の視点変化を紹介する。
結果として得られる状態のクラスはテンソルネットワーク関数と呼ばれ、テンソルネットワーク状態の概念上の利点を継承し、近似された収縮を収束させる必要から生じる計算的制約を除去する。
テンソルネットワーク関数を用いて、ループグラフ上のエネルギーの厳密な変動推定を計算し、基底状態の表現力を解析し、体積法則の時間進化の側面を捉え、一般的なフィードフォワードニューラルネットワークの効率的なテンソルネットワーク関数へのマッピングを提供する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 09:22:59 GMT)
Flow-based Detection of Botnets through Bio-inspired Optimisation of Machine Learning [0.6] ボットネットは、ボットネット内の他のメンバーと自律的に感染し、伝播し、通信し、調整することができる。
従来の検出手法は、様々なネットワークベースの検出回避手法に不適合になってきている。
本研究では,ボットネットワーク活動のバイナリ分類を容易にするために,ネットワークフローに基づく行動モデルの適用について検討する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:58:10 GMT)
An adversarial feature learning based semantic communication method for Human 3D Reconstruction [0.6] 本稿では,人体3次元再構成のための適応的特徴学習ベースセマンティックコミュニケーション手法(AFLSC)を提案する。
本研究では,2次元画像から空間配置,キーポイント,姿勢,深度情報を抽出するマルチタスク学習に基づく特徴抽出手法を提案する。
また,これらの特徴情報を意味データにエンコードするための,敵対的特徴学習に基づく意味的符号化手法を設計する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:39:18 GMT)
Transformer-Based Bearing Fault Detection using Temporal Decomposition Attention Mechanism [0.4] ベアリング故障検出は予測保守において重要な課題であり、正確かつタイムリーな故障識別はコストダウンや機器の損傷を防ぐことができる。
トランスフォーマーニューラルネットワークの従来の注意機構は、振動データを保持する複雑な時間パターンを捉えるのに苦労することが多く、最適以下の性能をもたらす。
本稿では,時系列データの長期依存性と周期的変動の両方を捉えるために,時間偏差符号化と季節差分解を組み合わせた新しい注意機構である時間分解注意機構(TDA)を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:51:31 GMT)
Unpacking the Resilience of SNLI Contradiction Examples to Attacks [0.4] 我々は,モデルの脆弱性を調べるためにユニバーサル・アドバイサル・アタックを適用した。
分析の結果,含意クラスと中性クラスの精度は著しく低下した。
逆例のある拡張データセット上でモデルを微調整することで、その性能はほぼベースラインレベルに回復した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:47:28 GMT)
A Comparative Study on Dynamic Graph Embedding based on Mamba and Transformers [0.3] 本研究では,変圧器と最近提案されたMambaアーキテクチャを用いた動的グラフ埋め込み手法の比較解析を行った。
グラフ畳み込みネットワークを用いたTransformerG2G Augment、グラフ同型ネットワークエッジ畳み込みを用いたDG-Mamba、GDG-Mambaの3つの新しいモデルを導入する。
複数のベンチマークデータセットに対する実験により,Mambaベースのモデルが,リンク予測タスクにおけるトランスフォーマーベースのアプローチに匹敵する,あるいは優れた性能を達成できることが示されている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:56:56 GMT)
Multidimensional Deconvolution with Profiling [0.3] 多くの実験的文脈において、測定を物理的に解釈するためには、機器効果の影響を統計的に除去する必要がある。
我々はOmniFoldアルゴリズムと同じような反復的な方法で動作し、ニュアンスパラメータを同時にプロファイリングできるProfile OmniFoldアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:05:24 GMT)
Task-Oriented Dialog Systems for the Senegalese Wolof Language [0.2] 大型言語モデル(LLM)は幻覚のような重大なリスクをもたらす。
アフリカ語のような低リソース言語は、これらのシステムではいまだに不足している。
モジュール型タスク指向ダイアログシステム(ToDS)をベースとした,より古典的なアプローチを示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:35:49 GMT)
SoK: On Closing the Applicability Gap in Automated Vulnerability Detection [0.2] 自動脆弱性検出(AVD)は、脆弱性を特定するためにソースコードを自律的に解析することを目的としている。
現在のAVD研究はコアコンポーネントにまたがってどのように分散されているのか、将来の研究対象はソフトウェア開発全体を通してのAVDの実践的適用性のギャップを埋めるための重要な領域であるべきなのか、という2つの主要な研究課題に対処する。
タスクの定式化と粒度,入力プログラム言語と表現,検出アプローチとキーソリューション,評価指標とデータセット,報告パフォーマンスの5つのコアコンポーネントを対象に,79以上のAVD記事と17の実証的研究を体系化する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 14:01:41 GMT)
datadriftR: An R Package for Concept Drift Detection in Predictive Models [0.0] 本稿では,コンセプトドリフトを検出するためのRパッケージであるドリフト器を紹介する。
ドリフト検出とドリフトの背後にある原因の理解を深めることのできるプロファイルドリフト検出(PDD)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:59:49 GMT)
Wasserstein Bounds for generative diffusion models with Gaussian tail targets [0.0] 本稿では,データ分布とスコアベース生成モデルの生成の間のワッサースタイン距離を推定する。
次元で有界な複雑性は、対数定数を持つ$O(sqrtd)$である。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:20:42 GMT)
Using Machine Learning to Distinguish Human-written from Machine-generated Creative Fiction [0.0] 著者のアウトプットに基づいて大規模言語モデルを訓練し、特定のスタイルで「ハムブック」を生成することは、新しい形態の盗作であると考えられる。
本研究では,機械学習の分類モデルを訓練し,人間書きの短いサンプルを機械創作の創作小説と区別した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 12:46:57 GMT)
Unveiling Magnon-Magnon Coupling and Its Dynamic Control in Nanomagnets [0.0] 楕円形マグノンナノディスク内で励起される様々なマグノンモード間の相互作用を数値解析する。
MMCの結果として、この反交差現象を説明する包括的な理論的枠組みが提示された。
我々の数値と理論の組み合わせは、MCCに新たな洞察を与え、量子マグノニクスとマグノンベースの量子情報技術の分野を著しく前進させた。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:21:51 GMT)
Two-dimensional topological paramagnets protected by $\mathbb{Z}_3$ symmetry: Properties of the boundary Hamiltonian [0.0] 我々は、三角形格子上に隙間のないエッジモードを持つ2次元$mathbbZ_3$対称性保護トポロジカル(SPT)3状態ポッツパラマグネットを構築する。
まず、ギャップレスエッジのための顕微鏡格子モデルと密度行列再正規化群(DMRG)アプローチを用いて、低層励起スペクトルの有限サイズスケーリングと絡み合いエントロピーについて検討する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 11:09:52 GMT)
Topology and Spectrum in Measurement-Induced Phase Transitions [0.0] 観測された量子系における位相位相は、そのスペクトルと多体位相不変量により特徴づける。
我々の研究は、トポロジカル位相のバルクエッジ対応を平衡から観測された量子力学へ拡張する道を開く。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:32:16 GMT)
Time-dependent fluorescence by incoherently pumped polar quantum dot driven by a low-frequency monochromatic field [0.0] 逆空間対称性の破れた2レベル量子系からの高周波蛍光放射の時間依存性について検討した。
問題のシステムは1電子2レベル非対称極性半導体量子ドットとしてモデル化された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:07:56 GMT)
Surveying the landscape of optically addressable spin qubits for quantum information and sensing technology [0.0] 量子技術は、特定のタスクをより速く、効率的に、そして従来のタスクよりも高い感度で解決する方法を提供する。
しかし、十分にエラーのないスケール可能な量子プラットフォームの構築には、大きな課題が残っている。
このレビューは、電子スピンまたは核スピンを用いて量子ビットを具現化するいわゆるスピントロニクス(テクスティ.e.スピン-エレクトロニクス)材料に焦点を当てる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:10:00 GMT)
Stationary acoustic black hole solutions in Bose-Einstein condensates and their Borel analysis [0.0] ボース・アインシュタイン凝縮体(BEC)の動力学に関する研究
いわゆるアコースティック(またはアンルー)のブラックホールに対応できるソリューションを見つけました。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:56:22 GMT)
Snowflake: A Distributed Streaming Decoder [0.0] Snowflakeは量子エラー補正デコーダである。
ユニオン・フィールド・デコーダよりも25%精度が高い。
当社のデコーダはストリーミング形式で動作し,ローカル実装も備えています。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:04:15 GMT)
Single vibronic level fluorescence spectra from Hagedorn wavepacket dynamics [0.0] 本研究では,2つのHagedornウェーブパケット間の重なりを効率よく計算するアルゴリズムを開発した。
本研究では, SVLスペクトルに対する変位, 歪み, ダスチンスキー回転の影響について検討した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 20:29:54 GMT)
Self-Similar acoustic white hole solutions in Bose-Einstein condensates and their Borel analysis [0.0] 2次元(円対称)および3次元(球対称)におけるグロス・ピタエフスキー方程式の特異自己相似解について議論する。
これらの解を用いて、凝縮物中の音の局所速度と凝縮物の流速の大きさの交叉を確認し、超音速領域の存在を示し、黒-白穴の音速類似性を示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:44:42 GMT)
SDPERL: A Framework for Software Defect Prediction Using Ensemble Feature Extraction and Reinforcement Learning [0.0] 本稿では,ソフトウェア欠陥予測のための革新的なフレームワークを提案する。
アンサンブル特徴抽出と強化学習(RL)に基づく特徴選択を組み合わせる。
この作業は、ファイルレベルの粒度でこの問題に対処する最近の取り組みの1つだ、と我々は主張する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:16:11 GMT)
Rethinking the Atmospheric Scattering-driven Attention via Channel and Gamma Correction Priors for Low-Light Image Enhancement [0.0] 本稿では,Channel-Prior and Gamma-Estimation Network (CPGA-Net)の拡張版を紹介する。
CPGA-Net+は大気散乱モデルによって駆動される注意機構を組み込んでいる。
ガンマ補正を施したプラグインアテンションによるグローバル画像処理とローカル画像処理の両方に効果的に対処する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:12:41 GMT)
Resilient Cloud cluster with DevSecOps security model, automates a data analysis, vulnerability search and risk calculation [0.0] この記事では、Webアプリケーションをデプロイする主な方法、製品開発の全段階における情報セキュリティのレベルを高める方法について紹介する。
クラウドクラスタはTerraformとJenkinsパイプラインを使用してデプロイされ、脆弱性のプログラムコードをチェックする。
リスクと損失を計算するアルゴリズムは、統計データとFAIR情報リスク評価手法の概念に基づいている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:11:48 GMT)
Research on short-term load forecasting model based on VMD and IPSO-ELM [0.0] 本研究では,変分モード分解(VMD)と改善粒子群最適化(IPSO)アルゴリズムを統合し,エクストリーム学習マシン(ELM)を最適化する高度な統合予測手法を提案する。
シミュレーションの結果,提案手法は従来のELM法, PSO-ELM法, PSO-ELM法と比較して予測精度と収束速度を著しく向上することがわかった。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 04:45:11 GMT)
RIRO: Reshaping Inputs, Refining Outputs Unlocking the Potential of Large Language Models in Data-Scarce Contexts [0.0] 大規模言語モデル (LLM) は、テキスト生成、要約、質問応答といった分野において優れた、かなり高度な自然言語処理を持つ。
それらの能力にもかかわらず、これらのモデルは、小さなドメイン固有のデータセットに微調整された場合、課題に直面します。
本稿では,データスカース環境の性能向上を目的とした新しい2層アーキテクチャRIROを紹介する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:48:37 GMT)
Qudit-inspired optimization for graph coloring [0.0] グラフ色問題(GCP)に対する量子インスピレーションアルゴリズムを提案する。
我々は、グラフ内のノードを表現し、d次元球面座標でパラメータ化した各キューディットを積状態に使用する。
我々は,2つの最適化戦略をベンチマークする: 傾き勾配降下, ランダム状態の立方体開始, コスト関数の最小化のために勾配勾配勾配を用いる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:01:16 GMT)
Propulsion: Steering LLM with Tiny Fine-Tuning [0.0] 本稿では,タスク固有性能を最適化するために,新しいパラメータ最適化手法であるPropulsionを提案する。
物理運動の制御調整の概念にインスパイアされた推進は、事前訓練されたモデルの特定の次元を選択的に再スケールする。
我々の理論解析はニューラル・タンジェント・カーネル(NTK)理論によって支えられ、推進は訓練可能なパラメータがはるかに少ない完全な微調整の性能を近似することを示している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:38:58 GMT)
Physics-Inspired Interpretability Of Machine Learning Models [0.0] 機械学習モデルによる意思決定を説明する能力は、AIの普及に最も大きなハードルのひとつだ。
本研究では,エネルギー景観分野の手法にインスパイアされた入力データの特徴を同定する手法を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:17:01 GMT)
On the application of the Rayleigh-Ritz method to a projected Hamiltonian [0.0] 我々は、よく知られたレイリー・リッツ法を、状態のアンサンブルへの変分原理の拡張のために最近選択されたハミルトン作用素の射影に適用する。
玩具モデルにより、RRM固有値が、ほとんどの場合において、下から射影されたハミルトニアンの値に近づいたことが示される。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 13:29:14 GMT)
On the Generalizability of Iterative Patch Selection for Memory-Efficient High-Resolution Image Classification [0.0] 大きな画像を小さな領域または小さな領域で分類することは、計算とメモリの制約のために困難である。
パッチ選択モジュールとしてIterative Patch Selection (IPS) を用いたメモリ効率の高いクロスアテンショントランスフォーマを用いた新しいテストベッドを用いて,これらの問題を探索する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:25:30 GMT)
On the Ehrenfest theorem and centroids of relativistic particles [0.0] 自由空間における量子粒子の運動量と座標の期待値との相対論的関係を考察する。
平均速度と運動量の間の単純な比例性は、最も単純な二次分散に対してのみ成立する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:27:56 GMT)
Impact of Adversarial Attacks on Deep Learning Model Explainability [0.0] ディープラーニングモデルの説明可能性に対する敵攻撃の影響について検討する。
我々の研究は、モデルが敵攻撃を受けるときのこれらの説明の堅牢性に焦点を当てている。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:41:37 GMT)
Hanprome: Modified Hangeul for Expression of foreign language pronunciation [0.0] 本稿では,ハングルの基本形を変更し,音韻記号の一種として用いる可能性について検討する。
このアプローチの中核的な概念は、アルファベットの基本形を保存し、文字自体ではなくストロークの形だけを変更することである。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:15:58 GMT)
HEANA: A Hybrid Time-Amplitude Analog Optical Accelerator with Flexible Dataflows for Energy-Efficient CNN Inference [0.0] 本稿では、HEANAと呼ばれる新しいハイブリッドTimE Amplitude aNalog光加速器を提案する。
HEANAは、複数のデータフローをサポートするためのHEANAの柔軟性を高めるために、ハイブリッド時間振幅アナログ光乗算器(TAOM)を採用している。
現代CNNの4つの評価から, HEANAはFPS(F frames-per-second)とFPS/W(エネルギー効率)において最大66倍, 84倍の改善を実現していることが示された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:36:10 GMT)
Grassmannian Geometry Meets Dynamic Mode Decomposition in DMD-GEN: A New Metric for Mode Collapse in Time Series Generative Models [0.0] Generative Adversarial Networks (GANs) や Variational Autoencoders (Es) のような生成モデルは、トレーニングデータの完全な多様性をキャプチャできず、モード崩壊につながることが多い。
本稿では,時系列に特有のモード崩壊の定義を導入し,その重大度を定量化するための新しい計量 DMD-GEN を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 19:53:17 GMT)
Generative AI regulation can learn from social media regulation [0.0] 生成的AI規制に関する議論は、ソーシャルメディア規制に関する議論や証拠によって情報が得られると私は主張する。
私は、その類似点と相違点を強調するために、生成的AIとソーシャルメディアの可利用性を比較して比較する。
ソーシャルメディアの進化と規制に基づく具体的な政策勧告について論じる。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 23:00:29 GMT)
Gauge fields induced by curved spacetime [0.0] 私は、周期的時空測度におけるディラックフェルミオン、ゲージ場における非相対論的フェルミオン、格子上の周期的スカラー場におけるディラックフェルミオンの間の拡張双対性(有理性)を発見した。
これは、格子上の時空測度、ゲージ場、スカラー場の間の予期せぬ等価性を示している。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:48:51 GMT)
Fluorescence by a polar quantum system in a polychromatic field [0.0] 逆空間対称性を損なう2レベル量子系の蛍光放射のスペクトル特性について検討した。
問題の系の蛍光挙動は、ある種の光電子トランジスタ効果を示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 16:48:21 GMT)
FBSJNN: A Theoretically Interpretable and Efficiently Deep Learning method for Solving Partial Integro-Differential Equations [0.0] 本稿では, 深層学習に基づく手法を用いて, 部分積分微分方程式(PIDE)のクラスを解くための新しい枠組みを提案する。
この手法はFBNN(Forward-Backward Jump Neural Network)と呼ばれ、理論的に解釈可能であり、数値的に有効である。
数値実験により,FBSJNN法は10~3ドル程度の相対誤差で数値解が得られることが示された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:37:48 GMT)
Exploring Diffusion and Flow Matching Under Generator Matching [0.0] 拡散とフローマッチングは、Generator Matchingの統一されたフレームワークの下で見ることができる。
同じ生成的マルコフフレームワークの下で拡散とフローマッチングの両方をリキャストすることにより、フローマッチングモデルがより堅牢になる理由に関する理論的知見を提供する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:35:31 GMT)
Experimental verification of the quantum nature of a neural network [0.0] システムを量子化する理由と、ニューラルネットワークが量子残基を持つと解釈できる範囲について論じる。
古典的ニューラルネットワークの量子関数規則(マップ)から絡み合いを抽出できる可能性のある実験を提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:25:19 GMT)
Embedded Hyperspectral Band Selection with Adaptive Optimization for Image Semantic Segmentation [0.0] 本稿では,組込みソリューションを提供するハイパースペクトル帯域選択の先駆的アプローチを提案する。
提案手法は,組込み高スペクトル帯域選択 (EHBS) により,事前処理を必要とせずに最適な帯域を選択することができる。
我々は2つの異なるセマンティック・セグメンテーション・ハイパースペクトル・ベンチマーク・データセットの実験を行い、精度と使いやすさの観点からそれらの優位性を実証した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 15:15:40 GMT)
Dual Traits in Probabilistic Reasoning of Large Language Models [0.0] 大規模言語モデルによる後部確率の評価について検討する。
以上の結果から, 最先端モデル間での2つの評価モードの共存が明らかとなった。
二重モードの判断は、人間からのフィードバックから強化学習に使用される対照的な損失関数の結果である可能性があると推測する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 01:33:45 GMT)
DLSOM: A Deep learning-based strategy for liver cancer subtyping [0.0] 肝がんは世界中でがん関連死亡の原因となっている。
本研究は,1,139個の肝癌サンプルの体細胞突然変異の全体像を解析するために,積み重ねオートエンコーダを用いたディープラーニングフレームワークであるDLSOMを紹介する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 23:13:29 GMT)
CFSynthesis: Controllable and Free-view 3D Human Video Synthesis [0.0] CFSynthesisは、カスタマイズ可能な属性で高品質なヒューマンビデオを生成するための新しいフレームワークである。
本手法はテクスチャ-SMPLに基づく表現を利用して,自由視点における一貫した,安定したキャラクタの出現を保証する。
複数のデータセットの結果から,複雑な人間のアニメーションにおいて,CFS合成が最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 05:57:36 GMT)
CATER: Leveraging LLM to Pioneer a Multidimensional, Reference-Independent Paradigm in Translation Quality Evaluation [0.0] Comprehensive AI-assisted Translation Edit Ratio (CATER)は、機械翻訳(MT)の品質を評価するための新しいフレームワークである。
大きな言語モデル(LLM)は、慎重に設計されたプロンプトベースのプロトコルによって使用される。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 17:45:34 GMT)
Bayesian inference of mean velocity fields and turbulence models from flow MRI [0.0] 本研究では, 実効粘度モデルの最も可能性の高いパラメータを学習し, 乱流の平均流れデータから不確かさを推定するアルゴリズムを考案する。
このアルゴリズムは平均流れ場を再構成し、過度に適合することなく最も起こりうる乱流モデルパラメータを学習する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 18:07:36 GMT)
Acoustic black holes, white holes, and wormholes in Bose-Einstein condensates in two dimensions [0.0] ボース・アインシュタイン凝縮体(BEC)の音響(またはウンルー)ブラックホールに対する定常解について検討した。
これらの解では、音の局所速度と流速の等級が交差し、超音速領域が存在することを示す。
特定の外部ポテンシャルに対して、均一密度の音響ブラックホールの構成を見つけ、そのホーキング温度を得る。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 08:24:56 GMT)
A hybrid classical-quantum approach to highly constrained Unit Commitment problems [0.0] 単位コミットメント(UC)問題は、電力産業における重要な最適化課題である。
本稿では,UC問題を時間内に効率的に解くために,新しいハイブリッド量子古典アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 21:21:36 GMT)
A class of entanglement witnesses and a realignment-like criterion [0.0] この枠組みは、絡み合いウィットネス(EW)の構築を容易にする
陽性を示すのに十分な条件が提示される。
正部分転位(PPT)が絡み合った状態の3倍,3倍の4倍の3倍,4倍の3倍の3倍を考慮し,この基準の有効性を示す。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 07:37:44 GMT)
A Contextualized BERT model for Knowledge Graph Completion [0.0] 知識グラフ補完(KGC)のためのコンテキスト化BERTモデルを提案する。
本モデルでは,エンティティ記述や負の三重項サンプリングの必要性を排除し,計算要求を低減し,性能を向上する。
FB15k-237とWN18RRでは,Hit@1が5.3%向上し,4.88%向上した。
論文参考訳(メタデータ) (Sun, 15 Dec 2024 02:03:16 GMT)