Cosmos World Foundation Model Platform for Physical AI [136.1] 物理AIには、自分自身のデジタルツイン、ポリシーモデル、そして世界のデジタルツイン、ワールドモデルが必要です。
私たちは、開発者が物理AIセットアップのためにカスタマイズされた世界モデルを構築するのを助けるために、Cosmos World Foundation Model Platformを紹介します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:55:50 GMT)
Chirpy3D: Continuous Part Latents for Creative 3D Bird Generation [128.2] 現在のメソッドは複雑な詳細を欠いているか、既存のオブジェクトを単純に模倣している。
マルチビュー拡散およびモデリング部を連続分布として使用することで、完全に新しい、かつ可塑性なパーツを生成することができる。
その結果、既存の例を超越した種特異的な細部を持つ新しい3Dオブジェクトを作成できる最初のシステムとなった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:14:11 GMT)
Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos [110.3] Sa2VAは、画像とビデオの両方の基盤的理解のための統一モデルである。
セグメンテーションや会話など、幅広い画像やビデオのタスクをサポートする。
本稿では,複数のタスク,特にビデオオブジェクトのセグメンテーションにおいて,Sa2VAが最先端を実現することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:58:54 GMT)
Comparing Bad Apples to Good Oranges: Aligning Large Language Models via Joint Preference Optimization [105.4] 命令応答対に対して協調的に好みを抽出する新しい軸を提案する。
命令と応答ペアを併用することで、大きな言語モデルのアライメントを大幅に向上させることができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:36:35 GMT)
Exploring Federated Unlearning: Analysis, Comparison, and Insights [101.6] フェデレーション・アンラーニングは、フェデレーション・システムで訓練されたモデルからデータを選択的に除去することを可能にする。
本稿では,既存のフェデレーション・アンラーニング手法について検討し,アルゴリズムの効率,モデル精度への影響,プライバシ保護の有効性について検討する。
フェデレートされたアンラーニング手法を評価するための統一ベンチマークであるOpenFederatedUnlearningフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:31:31 GMT)
GUPNet++: Geometry Uncertainty Propagation Network for Monocular 3D Object Detection [92.4] 我々はGUPNet++(Geometry Uncertainty Propagation Network)を提案する。
トレーニング中の幾何射影の不確実性伝播関係をモデル化し、エンドツーエンドのモデル学習の安定性と効率を向上させる。
実験により,提案手法は画像ベースモノクロ3次元検出におけるSOTA性能を得るだけでなく,簡易なフレームワークで有効性を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:39:25 GMT)
Detecting Neurocognitive Disorders through Analyses of Topic Evolution and Cross-modal Consistency in Visual-Stimulated Narratives [84.0] 神経認知障害(NCD)の早期発見は、時間的介入と疾患管理に不可欠である。
伝統的な物語分析は、しばしば単語の使用法や構文など、ミクロ構造における局所的な指標に焦点を当てる。
本稿では,話題の変化,時間的ダイナミクス,物語の時間的コヒーレンスを分析することによって,特定の認知的・言語的課題を解明することを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:16:26 GMT)
Detecting the Undetectable: Assessing the Efficacy of Current Spoof Detection Methods Against Seamless Speech Edits [82.9] 音声入力編集(SINE)データセットをVoiceboxで作成する。
本手法を用いて編集した音声は従来のカット・アンド・ペースト法よりも検出が困難であることを確認した。
人的困難にもかかわらず, 自己監督型検出器は検出, 局所化, 一般化において顕著な性能を発揮することを示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:17:47 GMT)
SLAM: Towards Efficient Multilingual Reasoning via Selective Language Alignment [78.5] 本稿では,多言語性を扱うレイヤを正確に識別し,微調整する,効率的な多言語推論アライメント手法を提案する。
実験の結果, SLAM法は7Bおよび13BLLMのパラメータの6.5-8%を含む6層のフィードフォワードサブ層のみをチューニングできることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:29:43 GMT)
LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.4] LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:49:04 GMT)
ProSparse: Introducing and Enhancing Intrinsic Activation Sparsity within Large Language Models [74.6] 活性化スパーシリティ(Activation sparsity)とは、活性化出力の間に弱い分散要素が存在することを指す。
本稿では,PLMを高活性化空間にプッシュするために,"ProSparse" という,シンプルで効果的なスペース化手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:26:54 GMT)
Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection [74.0] 本稿では,リモートセンシングオブジェクト検出において,大きなストリップ畳み込みが優れた特徴表現学習者であることを示す。
我々はStrip R-CNNと呼ばれる,シンプルで効率的でパワフルなネットワークアーキテクチャを構築した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:30:54 GMT)
ControlMLLM: Training-Free Visual Prompt Learning for Multimodal Large Language Models [73.3] マルチモーダル大言語モデル(MLLM)に視覚的プロンプトを注入する学習自由手法を提案する。
我々は,エネルギー関数に基づいて学習可能な潜伏変数を最適化し,注目マップにおける参照領域の強度を高める。
提案手法は,参照能力のMLLMへの統合に有望な方向を与え,ボックス,マスク,スクリブル,ポイントによる参照を支援する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:54:18 GMT)
Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control [73.1] Diffusion as Shader (DaS)は、統一アーキテクチャ内で複数のビデオ制御タスクをサポートする新しいアプローチである。
DaSは3D追跡ビデオを制御入力として利用し、ビデオ拡散過程を本質的に3D対応にしている。
DaSは、メッシュ・ツー・ビデオ生成、カメラ制御、モーション転送、オブジェクト操作など、さまざまなタスクにわたる強力なコントロール機能を示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:01:58 GMT)
Dolphin: Closed-loop Open-ended Auto-research through Thinking, Practice, and Feedback [71.9] 我々は,最初のクローズドループオープンエンド自動検索フレームワークであるDolphinを提案する。
ドルフィンは研究アイデアを生成し、実験を行い、実験結果からフィードバックを得て、高品質なアイデアを生成することができる。
我々は,Dolphinが2次元画像分類や3次元点分類といったタスクにおいて,最先端技術に匹敵する手法を自動提案できることを強調した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:31:10 GMT)
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control [66.7] VideoAnydoorは、高忠実度ディテール保存と正確なモーションコントロールを備えたゼロショットビデオオブジェクト挿入フレームワークである。
詳細な外観を保ちながら、微粒な動き制御をサポートするため、我々は画素ワーパーを設計する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:16:57 GMT)
MMAD: The First-Ever Comprehensive Benchmark for Multimodal Large Language Models in Industrial Anomaly Detection [66.1] 本稿では,産業異常検出における最初のフルスペクトルMLLMベンチマークであるMMADを提案する。
産業検査におけるMLLMの7つの重要なサブタスクを定義し,MMADデータセットを生成するための新しいパイプラインを設計した。
MMADを用いて,様々な最先端MLLMの包括的,定量的評価を行った。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:00:57 GMT)
Multi-Source Urban Traffic Flow Forecasting with Drone and Loop Detector Data [61.9] ドローンが捉えたデータは、大規模都市ネットワークのための正確なマルチセンサー移動観測所を作ることができる。
単純なグラフベースモデルHiMSNetは、複数のデータモダリティと学習時間相関を統合するために提案されている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:23:28 GMT)
CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense [61.8] 人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。
この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。
逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:44:57 GMT)
IDEAL: Leveraging Infinite and Dynamic Characterizations of Large Language Models for Query-focused Summarization [59.1] クエリ中心の要約(QFS)は、特定の関心事に答え、より優れたユーザ制御とパーソナライゼーションを可能にする要約を作成することを目的としている。
本稿では,LLMを用いたQFSモデル,Longthy Document Summarization,およびクエリ-LLMアライメントの2つの重要な特徴について検討する。
これらのイノベーションは、QFS技術分野における幅広い応用とアクセシビリティの道を開いた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:09:22 GMT)
Instruction-Following Pruning for Large Language Models [58.3] 我々は、モデルに対する固定的なプルーニングマスクを決定する従来の静的プルーニングアプローチを超えて移動する。
本手法では,プルーニングマスクは入力依存型であり,ユーザ命令に記述された情報に基づいて動的に適応する。
我々の手法は「命令追従プルーニング」と呼ばれ、ユーザ命令を入力とし、与えられたタスクに対して最も関連性の高いモデルパラメータを動的に選択するスパースマスク予測器を導入している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:03:04 GMT)
OpenCodeInterpreter: Integrating Code Generation with Execution and Refinement [58.0] 我々はOpenCodeInterpreterを紹介した。OpenCodeInterpreterは、コードを生成、実行、反復的に精製するためのオープンソースのコードシステムのファミリーである。
我々は,HumanEvalやMBPP,EvalPlusの強化バージョンなど,主要なベンチマークを対象としたOpenCodeInterpreterの総合評価を行った。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:37:04 GMT)
Finer: Investigating and Enhancing Fine-Grained Visual Concept Recognition in Large Vision Language Models [58.0] 詳細な分析では、命令調整されたLVLMはモダリティギャップを示し、同じ概念に対応するテキスト入力と視覚入力の相違を示す。
我々は,LVLMの細粒度視覚理解能力を評価するために,複数の属性中心評価ベンチマークであるFinerを提案し,説明可能性を大幅に改善した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:05:16 GMT)
Bongard-OpenWorld: Few-Shot Reasoning for Free-form Visual Concepts in the Real World [57.8] Bongard-OpenWorldは、マシンビジョンの実際の数ショット推論を評価するための新しいベンチマークである。
これは、現在の数発の推論アルゴリズムにすでに大きな課題を課している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:28:56 GMT)
Continuously Learning New Words in Automatic Speech Recognition [57.0] 音声認識のための自己教師付き連続学習手法を提案する。
文献からのメモリ拡張型ASRモデルを用いて、スライドから新しい単語を復号する。
提案手法により,新たな単語の出現頻度が高くなると,新たな単語のパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:40:58 GMT)
Beyond Factual Accuracy: Evaluating Coverage of Diverse Factual Information in Long-form Text Generation [56.8] ICATは、長文テキスト生成における多様な事実情報のカバレッジを測定するための評価フレームワークである。
原子の事実的クレームと出力で提示されるであろう様々な側面のアライメントを計算する。
私たちのフレームワークは、多様性とカバレッジの解釈可能かつきめ細かな分析を提供します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:43:23 GMT)
Are VLMs Ready for Autonomous Driving? An Empirical Study from the Reliability, Data, and Metric Perspectives [56.5] 視覚言語モデル(VLM)を評価するために設計されたベンチマークデータセットであるDriveBenchを紹介する。
以上の結果から, VLMは視覚的接地ではなく, 一般的な知識やテキストの手がかりから得られる, もっともらしい応答をしばしば生み出すことが明らかとなった。
本稿では,頑健な視覚的接地とマルチモーダル理解を優先する評価指標を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:59:55 GMT)
SceneVTG++: Controllable Multilingual Visual Text Generation in the Wild [55.6] 自然景観画像のテキストは、以下の4つの重要な基準を満たす必要がある。
生成されたテキストは、自然なシーンOCR(Optical Character Recognition)タスクのトレーニングを容易にする。
生成された画像は、テキスト検出やテキスト認識といったOCRタスクにおいて優れている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:51:31 GMT)
LiMoE: Mixture of LiDAR Representation Learners from Automotive Scenes [55.3] LiMoEは、Mixture of Experts(MoE)パラダイムをLiDARデータ表現学習に統合するフレームワークである。
我々のアプローチは3つの段階からなる: Image-to-LiDAR Pretraining, Contrastive Mixture Learning (CML), Semantic Mixture Supervision (SMS)。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:59:58 GMT)
NeuralSVG: An Implicit Representation for Text-to-Vector Generation [54.4] 本稿では,テキストプロンプトからベクトルグラフィックスを生成する暗黙的なニューラル表現であるNeuralSVGを提案する。
生成したSVGの層構造を促進するために,ドロップアウトに基づく正規化手法を導入する。
ニューラルSVGは、構造化された柔軟なSVGを生成する際に、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:50:06 GMT)
Revisiting the Graph Reasoning Ability of Large Language Models: Case Studies in Translation, Connectivity and Shortest Path [53.7] 大規模言語モデル(LLM)のグラフ推論能力に着目する。
グラフ記述変換,グラフ接続,最短パス問題という3つの基本グラフタスクにおけるLLMの能力を再考する。
この結果から,LLMはテキスト記述によるグラフ構造理解に失敗し,これらの基本課題に対して様々な性能を示すことが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:26:34 GMT)
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides [53.2] プレゼンテーションを自動生成する2段階の編集手法を提案する。
PPTAgentはまずプレゼンテーションを分析して,その構造パターンやコンテントスキーマを理解します。
実験の結果,PPTAgentは従来の3次元のプレゼンテーション生成方法よりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:53:01 GMT)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.9] 拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
これらの課題に対処するための影響関数フレームワークを開発する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:28:09 GMT)
LargeAD: Large-Scale Cross-Sensor Data Pretraining for Autonomous Driving [52.8] LargeADは多用途でスケーラブルなフレームワークで、さまざまな現実世界の運転データセットにわたる大規模3D事前トレーニング用に設計されている。
我々のフレームワークは、VFMを利用して2次元画像から意味的にリッチなスーパーピクセルを抽出し、LiDAR点雲に整列して高品質なコントラストサンプルを生成する。
提案手法は,LDARに基づくセグメント化とオブジェクト検出の両面において,線形探索と微調整の両作業において,最先端の手法よりも大幅な性能向上を実現している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:59:59 GMT)
A Survey on Large Language Models with Multilingualism: Recent Advances and New Frontiers [51.8] LLM(Large Language Models)の急速な開発は、自然言語処理における顕著な多言語機能を示している。
LLMのブレークスルーにもかかわらず、多言語シナリオの研究は依然として不十分である。
本調査は,多言語問題に対する研究コミュニティの取り組みを支援することを目的としており,LLMに基づく多言語自然言語処理における中核概念,鍵技術,最新の発展の包括的理解を提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:15:01 GMT)
ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use [51.4] 995のユーザクエリと3,912の関連ツールからなるデータセットであるToolHopを提示する。
ToolHopは、多様なクエリ、意味のある相互依存性、ローカル実行可能なツール、詳細なフィードバック、検証可能な回答を保証する。
5つのモデルファミリーにまたがる14のLSMを評価し、マルチホップツールの使用シナリオを扱う上で重要な課題を明らかにした。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:13:35 GMT)
Neural DNF-MT: A Neuro-symbolic Approach for Learning Interpretable and Editable Policies [51.0] 本稿では、エンドツーエンドポリシー学習のためのニューラルDNF-MTと呼ばれるニューラルシンボリックアプローチを提案する。
ニューラルDNF-MTモデルの微分可能な性質は、訓練にディープアクター批判アルゴリズムを使用することを可能にする。
決定論的ポリシーの2値表現をどのように編集し、ニューラルモデルに組み込むかを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:51:49 GMT)
More is not always better? Enhancing Many-Shot In-Context Learning with Differentiated and Reweighting Objectives [50.8] 大規模言語モデル(LLM)は、パラメータ更新を必要とせずに、数ショットのインコンテキスト学習(ICL)で優れている。
この傾向の主な原因は,NLL最適化目標とインクリメンタルデータノイズの2つである。
DR-ICLは、微分学習とアドバンテージベース再重み付けによりモデル性能を向上させる新しい最適化手法である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:57:08 GMT)
Materialist: Physically Based Editing Using Single-Image Inverse Rendering [50.4] 本稿では、学習に基づくアプローチとプログレッシブな微分可能レンダリングを組み合わせた手法を提案する。
提案手法は,より現実的な光物質相互作用,正確な影,大域的な照明を実現する。
また,全シーン形状を必要とせず,効果的に機能する材料透過性編集手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:52:01 GMT)
The \textit{Questio de aqua et terra}: A Computational Authorship Verification Study [49.6] 本研究は, クエシオの真正性について, 数値的オーサシップ検証(AV)を用いて検討する。
AVシステムのファミリーを構築し、13世紀と14世紀のラテン文字のコーパスを組み立てます。
AVシステムのクエチオへの応用は、その真正性に関する非常に確実な予測を返す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:42:05 GMT)
Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection [49.3] 音声感情認識(SER)は、人間とコンピュータの自然な相互作用が可能な汎用AIエージェントを開発する上で重要な要素である。
英語や中国語以外の言語でラベル付きデータが不足しているため、堅牢な多言語SERシステムの構築は依然として困難である。
本稿では,低SERリソース言語におけるSERの性能向上のための手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:49:48 GMT)
Bayesian Model Parameter Learning in Linear Inverse Problems with Application in EEG Focal Source Imaging [49.2] 逆問題は、関心のシグナルを直接観測できない限定データ問題として記述することができる。
未知の非線形モデルパラメータを含む線形逆問題について検討した。
ベイズモデルに基づく学習手法を用いて,信号の回復とモデルパラメータの推定を行った。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:14:24 GMT)
Not all tokens are created equal: Perplexity Attention Weighted Networks for AI generated text detection [49.2] 大規模言語モデル(LLM)の検出に理論的に魅力的なアプローチを提供する次点分布出力
本稿では,LLMの最後の隠蔽状態を用いて,列長の次トーケン分布のメトリクスに基づく一連の特徴量の重み付けを行うパープレキシティ注意重み付けネットワーク(PAWN)を提案する。
PAWNは、トレーニング可能なパラメータのごく一部を持つ最強のベースラインよりも、競争力があり、より優れた分散性能を示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:00:49 GMT)
Re-Visible Dual-Domain Self-Supervised Deep Unfolding Network for MRI Reconstruction [48.3] 本稿では、これらの問題に対処するために、新しい再視覚的二重ドメイン自己教師型深層展開ネットワークを提案する。
エンド・ツー・エンドの再構築を実現するために,シャンブルとポック・プロキシ・ポイント・アルゴリズム(DUN-CP-PPA)に基づく深層展開ネットワークを設計する。
高速MRIおよびIXIデータセットを用いて行った実験により,本手法は再建性能において最先端の手法よりも有意に優れていることが示された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:29:32 GMT)
Radar Signal Recognition through Self-Supervised Learning and Domain Adaptation [48.3] RFサンプルとラベルを限定した環境下でのレーダ信号認識を強化するための自己教師付き学習(SSL)手法を提案する。
具体的には,各種RF領域のベースバンド内位相および2次(I/Q)信号に対する事前学習マスク付きオートエンコーダ(MAE)について検討する。
ドメイン適応による軽量な自己教師型ResNetモデルでは,1ショットの分類精度が最大17.5%向上していることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:35:56 GMT)
From Dense to Sparse: Event Response for Enhanced Residential Load Forecasting [48.2] 住宅負荷予測のためのイベント応答型知識ガイド手法(ERKG)を提案する。
ERKGは、異なる家電の電力使用状況の推定、負荷系列からのイベント関連スパース知識のマイニングを取り入れている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:54:50 GMT)
High-Rank Irreducible Cartesian Tensor Decomposition and Bases of Equivariant Spaces [47.8] 可逆カルトテンソルの分解行列を、小さくて手頃な複雑さを持つランク$n=9$まで構築する。
スパーリング集合ではなく、同変空間の完備基底を同定する。
我々は結果を任意のテンソル積と直和空間に拡張し、異なる空間間の自由設計を可能にする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:05:17 GMT)
Can LLMs Design Good Questions Based on Context? [47.5] 質問長,タイプ,コンテキストカバレッジ,応答性といった側面に着目したLCMに基づく自動評価手法を提案する。
本研究は,LLM生成した質問の特徴を強調し,質問品質およびダウンストリームアプリケーションにおけるさらなる研究を支援するための洞察を提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:21:17 GMT)
From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [47.2] 本稿では,CGMデータの生成基盤モデルであるGluFormerについて紹介する。
GluFormerは、異なる民族や年齢、5つの国、8つのCGMデバイス、多様な病態状態にまたがる19の外部コホートに一般化する。
CGMデータと12年間のフォローアップを持つ580人の成人の縦断的研究において、GluFormerは血液HbA1C%よりも糖尿病を効果的に発症するリスクが高い個人を特定する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:01:15 GMT)
COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training [47.1] COAT(States and Activations for FP8 Training)は、大規模なモデルをトレーニングする際のメモリフットプリントを大幅に削減するために設計された、新しいFP8トレーニングフレームワークである。
COATは、BF16と比較して、エンドツーエンドのトレーニングメモリフットプリントを1.54倍に効果的に削減する。
COATはまた、BF16と比較して1.43倍のエンドツーエンドのトレーニング速度を達成する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:52:46 GMT)
Dephasing-tolerant quantum sensing for transverse magnetic fields with spin qudits [46.5] 逆磁場の量子センシングのためのデファッシントトレラントプロトコルを提案する。
横方向の駆動を利用することにより、横方向の磁場に周波数が線形である符号化状態間の論理的ラビ振動を誘導する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:16:31 GMT)
SceneBooth: Diffusion-based Framework for Subject-preserved Text-to-Image Generation [46.4] 既存の手法では、しばしば主題表現を学習し、画像生成を誘導するプロンプト埋め込みに組み込む。
本稿では,SceneBooth という新しいフレームワークを主題保存型テキスト・画像生成に適用する。
我々のSceneBoothは、与えられた主題の画像を修正し、テキストプロンプトによってガイドされた背景画像を生成する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:18:15 GMT)
Enhancing Distribution and Label Consistency for Graph Out-of-Distribution Generalization [45.8] グラフOOD一般化のための2種類の一貫性向上を目的とした革新的なアプローチを導入する。
拡張グラフでは,ラベル-グラフ関係の整合性を損なうことなく,トレーニングデータを充実させる。
我々は、他の最先端のベースラインよりもフレームワークの優位性を示すために、現実世界のデータセットに関する広範な実験を行う。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:19:22 GMT)
Entanglement measures for detectability [45.4] 仮説テスト設定に基づく検出性能として,新しい絡み合い対策を提案する。
量子サノフ定理を拡張して絡み合った状態を検出するために、我々の測度がどのように機能するかを明らかにする。
本稿では, この測度の幾何学的構造を用いて, 与えられた絡み合い状態を検出するために, 絡み合いの証人を導出する方法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:40:32 GMT)
Neural Network Prediction of Strong Lensing Systems with Domain Adaptation and Uncertainty Quantification [45.0] MVE(Mean-variance Estimator)は、ニューラルネットワークの予測からアレタリック(データ)の不確実性を得るための一般的なアプローチである。
本研究では、強いレンズデータに対する非教師なし領域適応(UDA)と組み合わせて、MVEの有効性を初めて研究する。
MVE に UDA を追加すると,UDA なしで MVE モデルより約 2 倍精度が向上することがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:01:49 GMT)
Hybrid Machine Learning Model with a Constrained Action Space for Trajectory Prediction [45.0] この研究は、ディープラーニングと運動モデルを組み合わせた新しいハイブリッドモデルを導入する。
加速度やヨーレートなどのオブジェクト属性を予測し、それに基づいて軌道を生成することができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:06:59 GMT)
Dialectal and Low-Resource Machine Translation for Aromanian [45.0] 本稿では,英語,ルーマニア語,ルーマニア語をサポートするニューラルマシン翻訳システムの構築プロセスについて述べる。
主な貢献は、79,000の文対からなるルーマニアとルーマニアの最も広範な平行コーパスの作成である。
そこで本研究では,テキストマイニングと自動評価のための言語に依存しない文埋め込みモデルを含む補助ツール群を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:06:53 GMT)
HuRef: HUman-REadable Fingerprint for Large Language Models [45.0] HuRefは、大きな言語モデルのための人間可読指紋である。
トレーニングやモデルパラメータを公開することなく、ベースモデルを独自に識別する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:38:25 GMT)
ImageFlowNet: Forecasting Multiscale Image-Level Trajectories of Disease Progression with Irregularly-Sampled Longitudinal Medical Images [44.1] ImageFlowNetは、空間的詳細を保存しながら、初期画像から疾患軌跡を予測するために設計された新しいモデルである。
我々は、ODEの定式化を支援し、高レベルの視覚的特徴を含む正規化を動機付ける理論的洞察を提供する。
私たちのコントリビューションには、ImageFlowNetの開発、実世界のデータセットに関する理論的および実証的な検証が含まれています。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:49:42 GMT)
LLaVA-Mini: Efficient Image and Video Large Multimodal Models with One Vision Token [43.1] LLaVA-Miniは最小限の視覚トークンを持つ効率的な大規模マルチモーダルモデルである。
LLaVA-Miniは、FLOPを77%削減し、40ミリ秒以内で低レイテンシ応答を提供し、24GBのメモリを持つGPUハードウェア上で1万フレーム以上のビデオを処理する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:03:14 GMT)
Magic Mirror: ID-Preserved Video Generation in Video Diffusion Transformers [42.9] 撮影レベルの品質とダイナミックな動きで、アイデンティティ保存されたビデオを生成するためのフレームワークであるMagic Mirrorを提示する。
提案手法では,(1)特徴量と特徴量の両方をキャプチャするデュアルブランチ顔特徴抽出器,(2)効率的なアイデンティティ統合のための条件付き適応正規化を併用した軽量なクロスモーダルアダプタ,(3)合成IDペアとビデオデータを組み合わせた2段階のトレーニング戦略を導入する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:48:31 GMT)
InclusiViz: Visual Analytics of Human Mobility Data for Understanding and Mitigating Urban Segregation [41.8] InclusiVizは、都市分離の多段階解析のための新しいビジュアル分析システムである。
我々は、環境特徴を用いた社会集団間の移動パターン予測のためのディープラーニングモデルを構築し、説明可能なAIを付加した。
このシステムは、ユーザーが広範囲にわたる概要から細かな詳細まで、分離パターンを探索できる革新的な可視化技術を統合している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:50:36 GMT)
ZDySS -- Zero-Shot Dynamic Scene Stylization using Gaussian Splatting [41.7] ゲーム映画製作や拡張現実、仮想現実など、様々な現実世界の応用において、模範的なイメージに基づくダイナミックなシーンのスタイリングが不可欠である。
我々は動的シーンのためのゼロショットスタイリングフレームワークであるDySSを紹介した。
本手法は,実世界の動的シーンにおけるテストにおける最先端のベースラインに対する性能とコヒーレンスを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:39:02 GMT)
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling [40.8] ACE++は、様々な画像生成と編集タスクに取り組む命令ベースの拡散フレームワークである。
我々は、強力なテキスト・画像拡散モデルを微調整する作業を最小化するために、2段階のトレーニングスキームを開発する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:47:34 GMT)
Predicting risk of cardiovascular disease using retinal OCT imaging [40.7] 心臓血管疾患(CVD)が世界的に死因となっている。
光コヒーレンストモグラフィー(OCT)は早期のCVDリスク予測の潜在的なツールとして認識されている。
我々は,将来のCVD事象を予測するための追加撮像技術としてのOCTの可能性について検討した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:52:34 GMT)
Align-Pro: A Principled Approach to Prompt Optimization for LLM Alignment [40.7] 大規模言語モデル(LLM)は、様々な社会的および意思決定プロセスに統合されつつある。
人間のフィードバックからの強化学習(RLHF)のような従来の手法は、微調整モデルパラメータによるアライメントを実現する。
対照的に、迅速な最適化はLLMアライメントのためのRLHFの代替となる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:14:39 GMT)
Learning Causal Transition Matrix for Instance-dependent Label Noise [40.6] ノイズラベルのデータ生成過程を因果的観点から検討する。
観測不能な潜在変数は、インスタンス自身、ラベルアノテーションのプロシージャ、あるいはその両方に影響を与える可能性がある。
我々は、この因果関係を明示的にモデル化する新しいトレーニングフレームワークを設計した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:08:39 GMT)
SNR-EQ-JSCC: Joint Source-Channel Coding with SNR-Based Embedding and Query [40.6] 本稿では,SNR-EQ-JSCCと呼ばれる軽量なチャネル適応型セマンティックコーディングアーキテクチャを提案する。
汎用トランスフォーマーモデルに基づいて構築され、信号-雑音比(SNR)をアテンションブロックに埋め込み、チャネル適応(CA)を実現する。
即時SNRフィードバックが不完全である可能性があることを考慮し、平均SNRのみを使用する別の方法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:31:04 GMT)
Exploring Optimal Latent Trajetory for Zero-shot Image Editing [38.7] 我々は、ほぼすべての構造的忠実性を失ったため、ガウス近辺のノイズをさらなる編集の要点として使うのは良い選択ではないと論じる。
本稿では,ZZEditという新しい編集パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:00:36 GMT)
Reasoning-Enhanced Self-Training for Long-Form Personalized Text Generation [38.4] REST-PG(Reasoning-Enhanced Self-Training for Text Personalized Generation)は、応答生成中の個人データを推論するようにLCMをトレーニングするフレームワークである。
個人化された4つの長文テキスト生成タスクからなるLongLaMPベンチマークでREST-PGを評価した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:29:08 GMT)
Anomaly Triplet-Net: Progress Recognition Model Using Deep Metric Learning Considering Occlusion for Manual Assembly Work [38.1] 工場における製品組み立て過程を可視化するために, 閉塞を考慮した進捗認識手法を提案する。
深層学習に基づく物体検出方法を用いて、工場に設置された固定点カメラから取得した画像から目標組立物を検出する。
収穫画像上での深度メートル法学習に基づく分類手法を用いて、製品組み立て作業の進捗状況を大まかな進捗段階として推定する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:12:49 GMT)
A precise asymptotic analysis of learning diffusion models: theory and insights [37.3] 本稿では,2層自動エンコーダによりパラメータ化されたフローモデルや拡散モデルについて考察する。
学習モデルにより生成されたサンプルの分布の低次元投影の厳密な特性を導出する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:56:40 GMT)
ORGANA: A Robotic Assistant for Automated Chemistry Experimentation and Characterization [37.0] ORGANAは、ロボットや実験装置を制御するために、化学者と意思決定を行うロボットシステムである。
スケジュールと並列タスクの実行をサポートしながら、視覚的なフィードバックで複雑なタスクを計画し、実行します。
ユーザ調査によると,ORGANAはフラストレーションと身体的需要を50%以上削減し,使用時の平均80.3%の時間を節約している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:00:50 GMT)
A Value Mapping Virtual Staining Framework for Large-scale Histological Imaging [37.0] 各種条件に適応可能な汎用仮想染色フレームワークを提案する。
そこで本研究では,異なる病態間の仮想色付けの精度を確保するために,値マッピング制約に基づく損失関数を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:45:21 GMT)
Socratic Questioning: Learn to Self-guide Multimodal Reasoning in the Wild [35.9] 軽量マルチモーダル大言語モデル(MLLM)に適した革新的学習・推論フレームワークを考案する。
我々の自己組織化アプローチはMLLMを組織的にガイドし、ターゲット問題に関連する視覚的手がかりに集中させ、幻覚を減らし、きめ細かい画像の詳細を記述できるモデルの能力を高める。
各種ベンチマーク実験により,SQの自己探索,ゼロショット視覚推論,幻覚緩和における顕著な能力を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:55:15 GMT)
MRJ-Agent: An Effective Jailbreak Agent for Multi-Round Dialogue [35.8] 大きな言語モデル(LLM)は、知識と理解能力の貯蓄において優れた性能を示す。
LLMは、ジェイルブレイク攻撃を受けたとき、違法または非倫理的な反応を起こしやすいことが示されている。
本稿では,人的価値に対する潜在的な脅威を識別・緩和する上でのステルスネスの重要性を強調した,複数ラウンドの対話型ジェイルブレイクエージェントを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:46:16 GMT)
Unsupervised Speech Segmentation: A General Approach Using Speech Language Models [35.5] 本稿では,これまで研究されてきた話者ダイアリゼーションに基づく音声に対する教師なしアプローチを提案する。
いくつかの設定を考慮し,提案手法の有効性を実証的に実証した。
提案手法は, 境界検出, セグメント純度, オーバーセグメンテーションに基づく評価基準よりも優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:32:13 GMT)
PromptGuard: Soft Prompt-Guided Unsafe Content Moderation for Text-to-Image Models [34.8] テキスト・ツー・イメージ(T2I)モデルは、特にNSFW(not-safe-for-work)コンテンツの生成において、誤用に対して脆弱であることが示されている。
本稿では,大規模言語モデル(LLM)におけるシステムプロンプト機構からインスピレーションを得る新しいコンテンツモデレーション手法であるPromptGuardを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:39:21 GMT)
TrojanDec: Data-free Detection of Trojan Inputs in Self-supervised Learning [34.6] TrojanDecは、トリガに埋め込まれたテスト入力を識別し、復元する最初のデータフリーメソッドである。
評価の結果,TrojanDecは与えられたテスト入力からトロイの木馬を効果的に識別し,最先端のトロイの木馬攻撃で回収できることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:35:19 GMT)
ConcealGS: Concealing Invisible Copyright Information in 3D Gaussian Splatting [34.4] ConcealGSは、3D-GSフォーマットに暗黙の情報を埋め込む革新的な方法である。
3D-GSに基づく知識蒸留と勾配最適化戦略を導入することで、ConcealGSはNeRFベースのモデルの限界を克服する。
実験の結果、ConcealGSは暗黙の情報を回復するだけでなく、レンダリング品質にもほとんど影響を与えないことが示されている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:06:35 GMT)
ParGo: Bridging Vision-Language with Partial and Global Views [34.2] マルチモーダル大言語モデル(MLLM)のビジョンと言語モダリティを接続する新しい部分言語プロジェクタであるParGoを紹介する。
グローバルアテンションベースのプロジェクタに依存する従来の作業とは異なり、ParGoは個別に訓練された視覚エンコーダとLLMの間の表現ギャップを橋渡しします。
実験の結果,ParGoは他のプロジェクタよりも優れており,特に知覚能力の細部を重視したタスクでは顕著に優れていた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:39:15 GMT)
Demonstrating efficient and robust bosonic state reconstruction via optimized excitation counting [33.1] 本稿では,一般化Q-関数の考え方に基づいて,励起数サンプリング(ORENS)を用いた最適化再構成の効率的かつ堅牢な手法を提案する。
我々の研究は、ボソニックモードを用いた実用的な量子情報処理のための重要かつ価値のあるプリミティブを提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:53:00 GMT)
Effective and Efficient Mixed Precision Quantization of Speech Foundation Models [32.5] 本稿では,音声基礎モデルに対する新しい混合精度量子化手法を提案する。
微調整wav2vec2.0-baseとHuBERT-largeモデルを用いたLibriSpeechデータセットの実験を行った。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:21:52 GMT)
MM-GEN: Enhancing Task Performance Through Targeted Multimodal Data Curation [31.2] MM-Genはタスク固有の高品質な合成テキストを生成するスケーラブルな手法である。
MM-Genによって生成されたデータによる微調整VLMは、大幅な性能向上をもたらす。
人為的なキャプションデータと比較すると、MM-Genは最大1.6倍の改善を実現している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:55:56 GMT)
AE-NeRF: Augmenting Event-Based Neural Radiance Fields for Non-ideal Conditions and Larger Scene [31.1] 非理想的条件からイベントベースNeRFを学習する際の課題を解決するために,AE-NeRFを提案する。
本手法は,イベントベース3次元再構成における新しい最先端技術を実現する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:47:22 GMT)
LLaVA Steering: Visual Instruction Tuning with 500x Fewer Parameters through Modality Linear Representation-Steering [30.5] MLLM(Multimodal Large Language Models)は、大規模言語モデル(LLM)に視覚表現を統合することで、視覚的タスクを大幅に進歩させる。
目的を達成するためにモダリティリニア表現ステアリング(MoReS)を導入する。
MoReSはモデル全体の固有のモダリティを効果的に再バランスさせ、そこでキーとなるアイデアは、各モデル層をまたいだ視覚部分空間の線形変換を通じて視覚表現を操ることである。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:36:54 GMT)
GDSR: Global-Detail Integration through Dual-Branch Network with Wavelet Losses for Remote Sensing Image Super-Resolution [30.2] リモートセンシング画像(RSI)にRWKV(Receptance Weighted Key Value)を導入する。
本稿では,RWKVと畳み込み操作を並列化してSR再構成を行うGDSRを提案する。
さらに,画像中の高頻度の詳細情報を効果的にキャプチャし,特にディテール再構成におけるSRの視覚的品質を向上させる損失関数であるWavelet Lossを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:19:35 GMT)
How to Select Pre-Trained Code Models for Reuse? A Learning Perspective [29.8] 市販の事前訓練コードモデル(PCM)が公開されている。
コードインテリジェンスタスクに広く使用されている100のオープンソースPCMで実験を行い、サイズは425万から30億のパラメータです。
その結果, ブラトフォース微調整を施した2,700時間に対して, 学習ベース選択法は選択時間を100秒に短縮した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:45:24 GMT)
CFFormer: Cross CNN-Transformer Channel Attention and Spatial Feature Fusion for Improved Segmentation of Low Quality Medical Images [29.7] CNN-Transformerモデルは、ローカル情報と長距離依存の両方を効率的にモデル化するCNNとTransformerの利点を組み合わせるように設計されている。
本稿では,Cross Feature Channel Attention (CFCA)モジュールとX-Spatial Feature Fusion (XFF)モジュールを紹介する。
CFCAモジュールは2つのエンコーダからチャネル特徴間の相互作用をフィルタリングし、促進する一方、XFFモジュールは空間的特徴の有意な意味情報の違いを効果的に軽減する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:59:20 GMT)
MotionBridge: Dynamic Video Inbetweening with Flexible Controls [29.0] 我々はMotionBridgeを紹介した。
トラジェクティブストローク、ビデオ編集マスク、ガイドピクセル、テキストビデオなど、柔軟なコントロールが可能だ。
このようなマルチモーダル制御は、よりダイナミックでカスタマイズ可能で、文脈的に正確な視覚的物語を可能にする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:06:07 GMT)
Open-Source Acceleration of Stable-Diffusion.cpp Deployable on All Devices [28.8] 安定拡散(stable-diffusion) Turbo (Sd) は拡散モデルを加速する効率的な推論フレームワークとして現れる。
本研究では、Winogradアルゴリズムを利用して2次元畳み込み処理を高速化するSdの最適化版を提案する。
我々は、個々の畳み込み層に対して最大2.76倍のスピードアップと、全体の画像生成プロセスにおいて最大4.79倍の速度アップを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:27:09 GMT)
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models [28.7] PRMベンチ(PRM Bench)は, PRMの微細な誤差検出機能を評価するための, プロセスレベルのベンチマークである。
PRMBenchは、6,216の慎重に設計された問題と83,456のステップレベルラベルで構成され、複数の次元にわたるモデルを評価する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:33:44 GMT)
AdaptVC: High Quality Voice Conversion with Adaptive Learning [28.3] 鍵となる課題は、ソースと音声スタイルから絡み合った言語コンテンツを抽出することである。
本稿では,アダプタを用いた自己教師型音声特徴の調整により,コンテンツと話者の特徴のアンタングル化を成功させる。
アダプタは、リッチな自己教師付き特徴からニュアンス特徴を動的に符号化するように訓練され、デコーダはそれらを融合して参照に正確に類似した音声を生成する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:03:55 GMT)
PSA-VLM: Enhancing Vision-Language Model Safety through Progressive Concept-Bottleneck-Driven Alignment [28.0] 本稿では,視覚的モダリティの安全性向上を目的とした,プログレッシブなコンセプトベースアライメント戦略であるPSA-VLMを提案する。
提案手法は,VLMの安全性ベンチマークにおいて,最先端の安全性を実現する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:09:52 GMT)
Practical Design and Benchmarking of Generative AI Applications for Surgical Billing and Coding [27.9] 医療請求とコーディングのための生成AIツールを開発するための戦略を提案する。
本研究は、ドメイン固有データに基づいて微調整された小さなモデルが、より大規模な消費者モデルと同等に機能することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:11:12 GMT)
START: A Generalized State Space Model with Saliency-Driven Token-Aware Transformation [27.3] ドメイン一般化(Domain Generalization, DG)は、複数のソースドメインから学習することで、モデルが対象ドメインを見えないように一般化できるようにすることを目的としている。
本稿では,最新技術(SOTA)のパフォーマンスを達成し,CNNやViTと競合する代替手段を提供するSTARTを提案する。
我々のSTARTは、SSMの入力依存行列内の有意なトークンのドメイン固有の特徴を選択的に摂動し、抑制することができるため、異なるドメイン間の差異を効果的に低減できる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:15:19 GMT)
SMIR: Efficient Synthetic Data Pipeline To Improve Multi-Image Reasoning [27.0] マルチイメージ推論のための効率的な合成データ生成パイプラインSMIRを紹介する。
また,新しいマルチイメージ推論評価ベンチマークSMIR-BENCHを提案する。
その結果、データセットでトレーニングされたモデルは、マルチイメージ推論タスクにおいて、最大8%のベースラインモデルより優れていることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:21:21 GMT)
A Survey on LLM-based Multi-Agent System: Recent Advances and New Frontiers in Application [27.0] まず,従来の作業の多くを包含するフレームワーク LLM-MAS の定義について論じる。
複雑なタスクの解決、特定のシナリオのシミュレーション、生成エージェントの評価におけるLLM-MASの様々な応用の概要について述べる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:48:22 GMT)
Adjoint Matching: Fine-tuning Flow and Diffusion Generative Models with Memoryless Stochastic Optimal Control [26.2] 我々は,反復的プロセスを通じてサンプルを生成する動的生成モデルに対して,報酬微調整を最適制御(SOC)として用いた。
提案手法は,報酬の微調整,一貫性の向上,リアリズム,人間の選好報酬モデルへの一般化など,既存の方法よりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:12:27 GMT)
PhishAgent: A Robust Multimodal Agent for Phishing Webpage Detection [26.1] フィッシング攻撃はオンラインセキュリティにとって大きな脅威であり、ユーザーの脆弱性を利用して機密情報を盗む。
フィッシングに対処する様々な方法が開発されており、それぞれ異なるレベルの精度で行われているが、それらもまた顕著な制限に直面している。
本研究では,多モーダル大規模言語モデル(MLLM)とオンラインおよびオフラインの知識ベースを統合した多モーダルエージェントであるPhishAgentを紹介する。
この組み合わせは、ブランドの認知とリコールを強化する幅広いブランドカバレッジにつながる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:56:55 GMT)
Action Quality Assessment via Hierarchical Pose-guided Multi-stage Contrastive Regression [25.7] アクションアセスメント(AQA)は、運動性能の自動的、公平な評価を目的としている。
現在の手法では、動画を固定フレームに分割することに集中しており、サブアクションの時間的連続性を損なう。
階層的なポーズ誘導型多段階コントラスト回帰による行動品質評価手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:20:16 GMT)
Light-weight Fine-tuning Method for Defending Adversarial Noise in Pre-trained Medical Vision-Language Models [25.3] 微調整事前学習型視覚言語モデル(VLM)は、医用画像とテキスト描写相乗効果において顕著な能力を示した。
多くの事前トレーニングデータセットは、患者プライバシの懸念によって制限されており、下流のパフォーマンスに悪影響を及ぼす可能性のあるノイズを含む可能性がある。
本稿では,敵の攻撃を効果的に防御し,微調整時に上流の騒音の影響を是正する手法であるRAN(Creify Adversarial noise)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:12:33 GMT)
T-FREE: Subword Tokenizer-Free Generative LLMs via Sparse Representations for Memory-Efficient Embeddings [24.9] トケナイザは、大規模言語モデルで情報をエンコードするのに不可欠だが、その開発は、最近停滞している。
文字三重項上のスパースアクティベーションパターンを通じて単語を直接埋め込むT-FREEを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:20:17 GMT)
Unity by Diversity: Improved Representation Learning in Multimodal VAEs [24.9] ハード制約をソフト制約に置き換えることで、より優れた潜伏表現が得られることを示す。
既存の手法と比較して、学習した潜在表現の改善と欠落したデータモダリティの計算結果を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:42:16 GMT)
Evaluating Image Caption via Cycle-consistent Text-to-Image Generation [24.5] 画像キャプションモデルのための参照不要自動評価指標であるCAMScoreを提案する。
上記のモダリティギャップを回避するため、CAMScoreはテキスト・ツー・イメージ・モデルを用いてキャプションから画像を生成し、生成した画像を元の画像に対して評価する。
実験結果から,CAMScoreは既存の基準ベースおよび基準フリー指標と比較して,人間の判断との相関が良好であることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:35:34 GMT)
Diverse Rare Sample Generation with Pretrained GANs [24.2] 本研究では,GANを事前学習した高解像度画像データセットから多様な希少サンプルを生成する手法を提案する。
提案手法は,多目的フレームワーク内での遅延ベクトルの勾配に基づく最適化と,特徴空間上の密度推定に正規化フローを利用する。
これにより、レア画像の生成が可能となり、レアリティ、多様性、参照画像との類似性の制御可能なパラメータが提供される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:56:36 GMT)
Abstracted Shapes as Tokens -- A Generalizable and Interpretable Model for Time-series Classification [24.2] 時系列表現学習と分類のための事前学習,一般化,解釈可能なモデルであるVQShapeを提案する。
時系列データに新しい表現を導入することで、VQShapeの潜在空間と形状レベルの特徴との接続を構築できる。
分類タスクでは、VQShapeの表現を使って解釈可能な分類器を構築することができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:00:44 GMT)
Cross-Skeleton Interaction Graph Aggregation Network for Representation Learning of Mouse Social Behaviour [24.1] マウスの社会的行動分析は、行動神経科学においてますますポピュラーな研究領域となっている。
高度に変形可能な体型とあいまいな運動パターンにより、マウス間の複雑な社会的相互作用をモデル化することは困難である。
我々は,自由に相互作用するマウスの豊富な動態を学習するクロス骨格相互作用グラフ集約ネットワーク(CS-IGANet)を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:00:02 GMT)
MULTI: Multimodal Understanding Leaderboard with Text and Images [24.0] そこで本研究では,中国のマルチモーダルデータセットであるMultiについて述べる。
マルチモデルは、画像テキスト理解、複雑な推論、知識リコールを含む実世界の検査基準を用いてモデルを評価する。
Qwen2-VL-72BはMulti-Eliteで76.9%,Multi-Eliteで53.1%の精度で評価された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:05:05 GMT)
MoDec-GS: Global-to-Local Motion Decomposition and Temporal Interval Adjustment for Compact Dynamic 3D Gaussian Splatting [24.0] MoDecGSは、複雑な動きを伴う挑戦的なシナリオにおいて、新しいビューを再構築するためのメモリ効率のよいフレームワークである。
MoDecGSは、現実のダイナミックビデオから動的3Dガウスのための最先端の手法よりも平均70%のモデルサイズ削減を実現している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:43:13 GMT)
Realistic Test-Time Adaptation of Vision-Language Models [24.0] VLM(Vision-Language Models)は、予測性能を改善するために広く活用されている。
トランスダクティブまたはテストタイム適応(TTA)に関する以前の研究は、しばしばデータ分布について強い仮定を下す。
私たちの作業は、これらの好ましいデプロイメントシナリオに挑戦し、より現実的な評価フレームワークを導入します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:17:25 GMT)
Bridged Semantic Alignment for Zero-shot 3D Medical Image Diagnosis [23.6] CT(Computed Tomography)などの3次元医用画像は臨床で広く用いられており,自動診断の可能性が強い。
教師付き学習ベースのアプローチは大きな進歩を遂げているが、広範囲のマニュアルアノテーションに大きく依存している。
視覚言語アライメント(VLA)は、追加アノテーションなしでゼロショット学習を可能にすることで、有望な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:30:52 GMT)
AtMan: Understanding Transformer Predictions Through Memory Efficient Attention Manipulation [23.5] 我々はAtManについて紹介する。AtManは、生成トランスフォーマーモデルの説明を、ほとんど余分なコストで提供する。
AtManは、変換器の注意機構を操作して、入力の関連マップを生成するモード依存摂動法である。
テキストと画像テキストのベンチマーク実験により、AtManはいくつかのメトリクスで現在の最先端の勾配に基づく手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:26:26 GMT)
LHGNN: Local-Higher Order Graph Neural Networks For Audio Classification and Tagging [23.5] この研究は、特徴理解を強化するグラフベースモデルであるLocal-Higher Order Graph Neural Network (LHGNN)を紹介する。
公開されている3つのオーディオデータセットに対するモデルの評価は、Transformerベースのモデルをすべてのベンチマークで上回っていることを示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:45:39 GMT)
On Sequential Bayesian Inference for Continual Learning [23.3] 我々は、連続したベイズ推定を再検討し、真の後部へのアクセスが保証されているかどうかを確認し、ニューラルネットワークにおける破滅的な忘れ込みを防ぐ。
ニューラルネットワークにおける逐次ベイズ推論の実行の困難さを示す破滅的な忘れ込みを防ぐには,このアプローチは失敗する。
本稿では,現在最先端のベイズ連続学習法と競合する,プロトタイプベイズ連続学習という単純なベースラインを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:38:31 GMT)
Harnessing the Zero-Shot Power of Instruction-Tuned Large Language Model in End-to-End Speech Recognition [23.2] 自動音声認識(ASR)におけるテキスト生成プロセスの指導に,命令調整付き大言語モデル(LLM)を用いることを提案する。
提案手法はCTCとアテンションアーキテクチャを併用し,LLMはデコーダのフロントエンド特徴抽出器として機能する。
実験結果から,LLM誘導モデルによる単語誤り率の相対的な増加率は,主要なベンチマークで約13%であった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:15:54 GMT)
Latent Diffusion Bridges for Unsupervised Musical Audio Timbre Transfer [23.2] 音楽の音色伝達は、メロディック構造を保ちながら、音声信号の音色特性を変更することを伴う。
本稿では,CocoChoralesデータセットを用いて訓練した二層拡散ブリッジに基づく新しい手法を提案する。
Fr'echet Audio Distance (FAD) とメロディ保存をVAEGANとGFBと比較して低ピッチ距離 (DPD) で再現できることを示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:45:58 GMT)
Improving Dialectal Slot and Intent Detection with Auxiliary Tasks: A Multi-Dialectal Bavarian Case Study [22.9] スロット・インテント検出(SID)のためのゼロショット変換学習の検討
複数のバイエルン方言に焦点を当て、ミュンヘン方言の新しいデータセットをリリースする。
バイエルンにおける補助的なタスクで訓練されたモデルを評価し,共同マルチタスク学習と中間タスク学習を比較した。
補助タスクは意図分類よりもスロットフィリングに肯定的な効果があり,中間タスクトレーニングはより一貫したパフォーマンス向上をもたらすことがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:21:07 GMT)
Add Noise, Tasks, or Layers? MaiNLP at the VarDial 2025 Shared Task on Norwegian Dialectal Slot and Intent Detection [22.9] スロットとインテント検出は、古典的な自然言語理解タスクである。
低リソースシナリオに対する多くのアプローチは、まだ方言SIDデータには適用されていない。
ノルウェー品種のスロットおよびインテント検出におけるVarDial 2025共有タスクに参加する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:36:35 GMT)
Localize-and-Stitch: Efficient Model Merging via Sparse Task Arithmetic [22.7] ローカライズ・アンド・スティッチ(Localize-and-Stitch)は、モデルをローカライズされた方法でマージする新しいアプローチである。
提案手法は,微調整性能に寄与するスパース領域を効果的に検出できることを実証する。
また,本アルゴリズムはモデル圧縮を容易にし,事前学習した知識を保存する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:37:12 GMT)
Disentangling, Amplifying, and Debiasing: Learning Disentangled Representations for Fair Graph Neural Networks [22.6] 本稿では,新しいGNNフレームワークであるDAB-GNNを提案する。
DAB-GNNは、精度と公正性の最適バランスを達成するという点で、最先端の10のライバルを著しく上回っている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:39:26 GMT)
Unraveling Responsiveness of Chained BFT Consensus with Network Delay [22.3] BFT (Chained Byzantine Fault Tolerant) プロトコルは実用システムにおいてますます採用されている。
本稿では,Markov Decision Processes (MDP) を用いて,3つのチェーンBFTプロトコルの性能をモデル化し,評価する統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:50:15 GMT)
CoMA: Compositional Human Motion Generation with Multi-modal Agents [22.2] CoMAは複雑な人間の動きの生成、編集、理解のためのエージェントベースのソリューションである。
我々のフレームワークは、細かな指示、テキスト誘導モーション編集、自己補正による短い動きシーケンスと長い動きシーケンスの生成を可能にする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:10:25 GMT)
Unexpected Improvements to Expected Improvement for Bayesian Optimization [21.9] 提案するLogEIは,メンバが標準値と同一あるいはほぼ等しい最適値を持つが,数値的最適化が極めて容易な,新たな獲得関数群である。
実験結果から,LogEIファミリーの獲得関数は,標準関数の最適化性能を大幅に向上し,最近の最先端の獲得関数の性能に匹敵する結果が得られた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:11:19 GMT)
Adaptive Homophily Clustering: Structure Homophily Graph Learning with Adaptive Filter for Hyperspectral Image [21.7] ハイパースペクトル画像(HSI)クラスタリングは、ゼロトレーニングラベルによる基本的だが難しい課題である。
本稿では,HSIのための適応フィルタクラスタリング法(AHSGC)を用いたホモフィリ構造グラフ学習を提案する。
AHSGCには高いクラスタリング精度、低い計算複雑性、強い堅牢性が含まれています。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:55:35 GMT)
MTRAG: A Multi-Turn Conversational Benchmark for Evaluating Retrieval-Augmented Generation Systems [21.6] MTRAG: エンドツーエンドのヒューマン生成マルチターンRAGベンチマークを提案する。
完全なRAGパイプラインを評価するために、さまざまな次元にまたがる現実世界のいくつかの特性を反映している。
我々の評価では、最先端のLLM RAGシステムでさえMTRAGに苦戦している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:52:56 GMT)
mFabric: An Efficient and Scalable Fabric for Mixture-of-Experts Training [21.5] Mixture-of-Expert (MoE) モデルは、Emphexperts という名前の異なるモデルをtoken ベースで選択的に活性化することで、従来のモデルより優れている。
このゲート計算は、事前に決められない動的通信を生成し、分散トレーニングプロセスの間、静電的な既存のGPUインターコネクトに挑戦する。
我々は,分散MoEトレーニングを取り入れたトポロジ再構成をアンロックする,mFabricと呼ばれる第一種システムを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:19:40 GMT)
Hyperbolic Contrastive Learning for Hierarchical 3D Point Cloud Embedding [21.5] 双曲型マルチモーダルコントラスト事前学習における3Dポイントクラウドのモダリティを拡張する。
また,階層型3次元埋め込み学習のための細分化,モダリティギャップ,アライメントレギュレータについても検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:38:34 GMT)
Vision Transformer Neural Architecture Search for Out-of-Distribution Generalization: Benchmark and Insights [21.5] 我々は、OoDの一般化に焦点をあてたVT NASのための最初のシステマティックベンチマークであるOoD-ViT-NASを紹介する。
このベンチマークには、8つのOoDデータセットで評価される様々な計算予算の3000のViTアーキテクチャが含まれている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:45:09 GMT)
AllSpark: A Multimodal Spatio-Temporal General Intelligence Model with Ten Modalities via Language as a Reference Framework [21.1] マルチモーダル時間汎用人工知能モデルであるAllSparkを提案する。
私たちのモデルは10の異なるモダリティを統一されたフレームワークに統合します。
実験により、AllSparkは言語を組み込むことで、数ショットの分類タスクで優れていることが示されている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:31:01 GMT)
Information-Maximized Soft Variable Discretization for Self-Supervised Image Representation Learning [20.5] IMSVDは、潜伏空間内の各変数をソフトに識別する。
本稿では,変換不変性,非トラバス性,冗長性最小化表現特徴を学習するための情報理論的目的関数を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:10:52 GMT)
TACLR: A Scalable and Efficient Retrieval-based Method for Industrial Product Attribute Value Identification [19.9] 製品属性値識別(PAVI)の最初の検索手法であるTACLRを紹介する。
製品プロファイルと候補値を埋め込みに符号化し、アイテム埋め込みと類似性に基づいて値を取得することにより、情報検索タスクとしてPAVIを定式化する。
1)正規化された出力を生成しながら暗黙的およびOOD値を効果的に処理し、(2)数千のカテゴリ、数万の属性、および数百万の値にスケールし、(3)高負荷の産業シナリオに対する効率的な推論をサポートする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:45:30 GMT)
Enhancing Remote Sensing Vision-Language Models for Zero-Shot Scene Classification [19.9] リモートセンシングのためのビジョンランゲージモデルは、広範囲の事前トレーニングのおかげで有望な用途を示している。
提案手法は,テキストのプロンプトと親和関係のパッチによる初期予測を利用してこの問題に対処する。
最先端のVision-Language Modelを用いた10のリモートセンシングデータセットの実験では、大幅な精度向上が示されている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:26:03 GMT)
Progressive Document-level Text Simplification via Large Language Models [19.6] 長い文書レベルの単純化(DS)はいまだに未調査である。
本稿では,タスクを階層的に分解してプログレッシブ単純化手法(ProgDS)を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:14:37 GMT)
Exploring Gradient Subspaces: Addressing and Overcoming LoRA's Limitations in Federated Fine-Tuning of Large Language Models [19.5] 本稿ではLow-Rank Adaptation (LoRA)を用いたFLフレームワークの収束と性能保証を批判的に分析する。
直接重み付けはLoRAベースの戦略よりも優れており、微調整モデルでは優れた性能が得られることを示す。
以上の結果から,直接重み付けと併用したGaLoreの方が,FlexLoRAやFFA-LoRAといったフェデレートされたLoRA法よりも,テキストや画像のモダリティが優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:56:49 GMT)
A Survey on Federated Learning in Human Sensing [19.5] Federated Learning(FL)は、ユーザデータを中央サーバに送信することなく、正確なMLモデルを作成することを約束する。
Human Sensingは、機械学習(ML)モデルの基礎として、詳細でしばしばプライバシーに敏感なデータに依存している。
FLは、テキスト予測やサイバーセキュリティなど、さまざまな分野においてその有用性を実証してきたが、ヒューマンセンシングのメリットは未調査である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:56:14 GMT)
Neural Speech and Audio Coding: Modern AI Technology Meets Traditional Codecs [19.4] 本稿では,ニューラル音声および音声符号化システムの領域におけるモデルベースおよびデータ駆動型アプローチの統合について検討する。
既存のコーデックの出力を後処理するように設計されたニューラルネットワークベースの信号エンハンサーを導入している。
本稿では、精神音響学的に校正された損失関数を用いて、エンドツーエンドのニューラルオーディオコーデックを訓練する方法について検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:11:55 GMT)
Gaussian Building Mesh (GBM): Extract a Building's 3D Mesh with Google Earth and Gaussian Splatting [19.4] 最近リリースされたオープンソースの基礎画像セグメンテーションとオブジェクト検出モデル(SAM2+GroundingDINO)
私たちは、その名前、アドレス、地理的座標に基づいて、任意の建物の3Dメッシュを抽出するパイプラインを作成しました。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:49:29 GMT)
Concept Matching with Agent for Out-of-Distribution Detection [19.4] 本稿では,エージェントパラダイムをアウト・オブ・ディストリビューション(OOD)検出タスクに統合する手法を提案する。
提案手法であるConcept Matching with Agent (CMA) は、CLIPに基づくOOD検出プロセスを強化するために、中性プロンプトをエージェントとして利用する。
実験結果から, ゼロショット法とトレーニング要求法の両方よりもCMAの方が優れた性能を示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:53:12 GMT)
Retrieval-Augmented Generation by Evidence Retroactivity in LLMs [19.1] Retroactive Retrieval-Augmented Generation(Retroactive Retrieval-Augmented Generation)は、レトロアクティブ推論パラダイムを構築するための新しいフレームワークである。
RetroRAGは証拠を修正・更新し、推論チェーンを正しい方向にリダイレクトする。
経験的評価は、RetroRAGが既存の手法よりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:57:42 GMT)
AI-Driven Reinvention of Hydrological Modeling for Accurate Predictions and Interpretation to Transform Earth System Modeling [19.0] HydroTraceは、ストリームフローを予測するアルゴリズム駆動のデータに依存しないモデルである。
ナッシュ・サトクリフ効率は98%に達し、目に見えないデータに対して強い一般化を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:59:53 GMT)
AutoFish: Dataset and Benchmark for Fine-grained Analysis of Fish [19.0] このデータセットは、白いコンベアベルト上の様々な星座に配置された視覚的に類似した454種の標本の1,500枚の画像からなる。
データはRGBカメラを使用して制御された環境で収集された。
Mask2Formerアーキテクチャの2つのバリエーションを用いて,ベースラインのインスタンスセグメンテーション結果を確立する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:14:25 GMT)
Highway Graph to Accelerate Reinforcement Learning [18.8] 強化学習アルゴリズムは訓練効率の低下に苦慮することが多い。
状態遷移をモデル化するためのハイウェイグラフを導入する。
提案手法は,既存のRLアルゴリズムよりもはるかに高速に学習する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:26:14 GMT)
Self-adaptive vision-language model for 3D segmentation of pulmonary artery and vein [18.7] 本稿では,言語誘導型自己適応型クロスアテンション・フュージョン・フレームワークを提案する。
提案手法は,3次元CTスキャンのセグメンテーションを生成するための強力な特徴抽出器として,事前訓練したCLIPを採用している。
これまでで最大の肺動脈ベインCTデータセットである局所的データセットを用いて,本手法を広範囲に検証した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:03:02 GMT)
Semantically Cohesive Word Grouping in Indian Languages [18.5] インドの言語は屈折的かつ凝集的であり、通常節なしの語順に従う。
主要なインド諸言語にまたがる文の構造は、その依存関係解析木が考慮されるときに類似している。
本稿では,インド語の文の計算処理や言語処理において,単語グループ化が重要な前処理ステップとなることを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:46:17 GMT)
GraphLoRA: Structure-Aware Contrastive Low-Rank Adaptation for Cross-Graph Transfer Learning [17.9] グラフニューラルネットワーク(GNN)は、様々なグラフ解析タスクを扱うのに顕著な習熟度を示した。
汎用性にもかかわらず、GNNはトランスファービリティにおいて重大な課題に直面し、現実のアプリケーションでの利用を制限している。
グラフ領域によく訓練されたGNNを転送するための有効かつパラメータ効率のよいGraphLoRAを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:00:20 GMT)
Rethinking Adversarial Attacks in Reinforcement Learning from Policy Distribution Perspective [17.8] DAPGD(Dis Distribution-Aware Projected Gradient Descent attack)を提案する。
DAPGDは、ポリシーネットワークを攻撃するために勾配摂動入力として分布類似性を使用する。
実験の結果,DAPGDは3つのロボットナビゲーションタスクのベースラインと比較してSOTAを達成できた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:22:55 GMT)
CaT-BENCH: Benchmarking Language Model Understanding of Causal and Temporal Dependencies in Plans [17.6] 本稿では,調理レシピ計画において,ステップの前後にステップが必ず発生する必要があるかどうかを検証した,ステップ順序予測のベンチマークであるCaT-Benchを紹介する。
我々はSOTA LLMが圧倒されていること(最もゼロショットはF1でわずか0.59)、より頻繁に依存を予測することに偏っていることを発見した。
人間による説明の評価と回答の正しさは、平均して人間はモデル推論と一致しないことを示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:43:28 GMT)
TGGLinesPlus: A robust topological graph-guided computer vision algorithm for line detection from images [17.6] ライン検出は画像処理、コンピュータビジョン、マシンインテリジェンスにおいて古典的で重要な問題である。
本稿では,線検出のためのトポロジカルグラフ誘導アルゴリズムTGGLinesPlusを提案し,実装した。
5つの古典的,最先端のライン検出手法でアルゴリズムをベンチマークし,ベンチマーク結果を質的,定量的に評価した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:41:28 GMT)
KG-TRICK: Unifying Textual and Relational Information Completion of Knowledge for Multilingual Knowledge Graphs [17.4] KG-TRICKは,多言語知識グラフに対するテキストおよびリレーショナル情報補完のタスクを統一する新しいシーケンス・ツー・シーケンス・フレームワークである。
i) KGCとKGEのタスクをひとつのフレームワークに統合することは可能であり、i) 複数の言語からのテキスト情報を組み合わせることは、KGの完全性を改善するのに有用である。
コントリビューションの一環として、KGのテキスト情報補完のための手作業による最大のベンチマークであるWikiKGE10++も紹介します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:21:40 GMT)
3D Annotation-Free Learning by Distilling 2D Open-Vocabulary Segmentation Models for Autonomous Driving [17.4] 2D textbf Open-textbfVocabulary セグメンテーションモデルを用いた新しい3D textbf Annotation-textbfFree フレームワーク AFOV を提案する。
第一段階では、2次元オープン語彙モデルの高品質テキストと画像の特徴を革新的に統合し、TMP(Tri-Modal contrastive Pre-training)を提案する。
第2段階では、点雲と画像の間の空間マッピングを利用して擬似ラベルを生成し、交差を可能にする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:34:12 GMT)
DGSSA: Domain generalization with structural and stylistic augmentation for retinal vessel segmentation [17.4] 網膜血管形態は糖尿病、緑内障、高血圧などの疾患の診断に重要である。
従来のセグメンテーション手法は、トレーニングとテストのデータが同様の分布を共有していると仮定する。
本稿では,網膜血管画像分割のための新しいアプローチ DGSSA を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:47:57 GMT)
Robust Gaussian Processes via Relevance Pursuit [17.4] 本稿では,データポイント固有ノイズレベルを推定することにより,スパースアウトレーヤに対するロバスト性を実現するGPモデルを提案する。
我々は,データポイント固有ノイズ分散において,関連する対数限界確率が強く抑制されるようなパラメータ化が可能であることを,驚くべきことに示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:04:51 GMT)
KNN-MMD: Cross Domain Wireless Sensing via Local Distribution Alignment [17.3] クロスドメイン無線センシングのためのK-Nearest Maximum Neighbors Mean Discrepancy (KNN-MMD)を提案する。
我々のアプローチは、ターゲットドメインからKNNを使用してヘルプセットを構築し、ソースとターゲットドメイン間の局所的なアライメントを可能にすることから始まります。
また、モデルの性能がエポック間で急激に変動するクロスドメイン手法でよく見られる重要な不安定性問題にも対処する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:23:43 GMT)
DehazeGS: Seeing Through Fog with 3D Gaussian Splatting [17.1] DehazeGSは,霧のない背景をメディアから分解・レンダリングできる手法である。
合成と実世界の霧のデータセットの実験は、DehazeGSが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:47:46 GMT)
Forecasting Credit Ratings: A Case Study where Traditional Methods Outperform Generative LLMs [17.1] 大規模言語モデル(LLM)は多くの下流タスクでうまく機能することが示されている。
本稿では,企業信用格付け予測におけるLCMの業績について検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:46:18 GMT)
KGIF: Optimizing Relation-Aware Recommendations with Knowledge Graph Information Fusion [17.0] 本研究は, 自己認識機構を用いて, エンティティと関係埋め込みを明示的にマージするように設計された, 特殊なフレームワークを提案する。
この明示的な融合は、ユーザとイテムの相互作用とアイテムと属性の関係の相互作用を強化し、ユーザ中心とアイテム中心の表現の微妙なバランスを与える。
この研究の貢献には、明示的な情報融合のための革新的な方法、スパース知識グラフの堅牢性の改善、解釈可能な経路可視化を通じて説明可能なレコメンデーションを生成する能力が含まれる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:19:15 GMT)
Siamese-DETR for Generic Multi-Object Tracking [16.9] 従来のマルチオブジェクト追跡(MOT)は、事前に定義されたクローズドセットカテゴリに属するオブジェクトを追跡することに限定されている。
Siamese-DETRは、所定のテキストプロンプトとテンプレート画像を用いて、事前に定義されたカテゴリを超えてオブジェクトを追跡する。
実験によると、Siamese-DETRはGMOT-40データセット上の既存のMOTメソッドを大きなマージンで上回っている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:43:11 GMT)
Learning Informative Latent Representation for Quantum State Tomography [16.7] 量子状態トモグラフィ(Quantum state tomography、QST)は、量子系の完全な状態を再構築する過程である。
近年のディープニューラルネットワーク(DNN)の進歩は、QSTにおけるディープラーニングの出現につながった。
本稿では,不完全な測定データを備えたQSTに適したトランスフォーマーベースのオートエンコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:36:12 GMT)
Deep Sylvester Posterior Inference for Adaptive Compressed Sensing in Ultrasound Imaging [16.6] 必要なスキャンラインの数を最小化することで、フレームレート、視野、エネルギー効率、データ転送速度を大幅に向上させることができる。
本稿では,固有情報ゲインをその場で最大化する適応サブサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:37:14 GMT)
Truthful mechanisms for linear bandit games with private contexts [16.4] 多くの医療やレコメンデーションのアプリケーションでは、エージェントはプライベートなプロファイルを持ち、システムから得るためにコンテキストを誤レポートする可能性がある。
従来の低regretアルゴリズムは、真偽の報告を保証できず、最悪の場合、線形後悔をもたらす可能性があることを示す。
本稿では、線形プログラムを用いて、トンプソンサンプリングからの偏差を最小限に抑えつつ、真性を保証する機構を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:24:53 GMT)
Information Extraction from Clinical Notes: Are We Ready to Switch to Large Language Models? [16.3] 大規模言語モデル(LLM)は生成タスクに優れるが、抽出タスクのパフォーマンスについては議論が続いている。
本研究は,オープンソースLLMを用いた包括的臨床用IEシステムの開発と評価を行った最初の試みである。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:48:36 GMT)
The log concavity of two graphical sequences [16.3] 距離正則グラフの一連の値が対数凹であることを示す。
強正則グラフ、二重符号、完全正則符号の帰結が導出される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:29:26 GMT)
Bridging the Language Gap: Dynamic Learning Strategies for Improving Multilingual Performance in LLMs [15.9] 大規模言語モデル(LLM)は様々なドメインに革命をもたらしたが、それでも非ラテン語スクリプトや低リソース言語に苦戦している。
本稿では,実行時にクエリ毎のプロンプト戦略,埋め込みモデル,LLMを最適化する,新しい動的学習手法を提案する。
提案手法では,事前学習モデルに比べて10~15%の言語性能向上と4倍のゲインを達成できた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:03:46 GMT)
Hermitian and Non-Hermitian Topological Transitions Characterized by Manifold Distance [15.9] 量子情報理論からの忠実度とトレース距離に基づく一般定義を提案する:多様体距離(MD)
異なる位相系を測り、2つの位相相の間の変換の間に普遍的な法則を示すことができる。
奇妙な相関子と比較して、MDはより普遍的であり、非エルミート系や長距離絡み合った状態に適用できる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:05:45 GMT)
Advancing the Understanding of Fine-Grained 3D Forest Structures using Digital Cousins and Simulation-to-Reality: Methods and Datasets [15.8] Boreal3Dは世界最大のフォレストポイントクラウドデータセットである。
1000の非常に現実的で構造的な森林区画を含んでいる。
合成データに基づいて事前訓練されたモデルは、実際の森林データセットに適用した場合のパフォーマンスを著しく向上させることができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:12:55 GMT)
Textualize Visual Prompt for Image Editing via Diffusion Bridge [15.7] 現在の視覚的プロンプト法は、事前訓練されたテキスト誘導画像・画像生成モデルに依存している。
本稿では,画像間の明示的なモデルに依存しない単一のテキスト・ツー・イメージモデルに基づくフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:33:22 GMT)
Constrained Sampling with Primal-Dual Langevin Monte Carlo [15.6] この研究は、正規化定数まで既知の確率分布からサンプリングする問題を考察する。
一般非線形関数の期待値によって定義された統計的制約の集合を満たす。
我々は,目標分布とサンプルを同時に制約する離散時間原始二元Langevin Monte Carloアルゴリズム(PD-LMC)を提唱した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:36:14 GMT)
Transferable Adversarial Examples with Bayes Approach [15.4] ブラックボックスの敵攻撃は、信頼できるAIにおいて最も熱いトピックの1つである。
本稿では,ベイズ的アプローチのレンズを用いた逆例の転送可能性について検討する。
実験は、より移動可能な敵の例を作る上で、BayAtkの有意義な効果を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:52:30 GMT)
Fair Text to Medical Image Diffusion Model with Subgroup Distribution Aligned Tuning [15.2] 医用画像へのテキスト・トゥ・メディカル・イメージ (T2MedI) の潜伏拡散モデルは, 医用画像データの不足を緩和する大きな可能性を秘めている。
しかし、自然画像モデルへのテキストとして、T2MedIモデルは一部のサブグループにも偏りがあり、トレーニングセットの少数派を見渡すことができる。
そこで本研究では,まず,CLIPテキストエンコーダを固定した,事前学習型 Imagen モデルに基づく T2MedI モデルを構築した。
そのデコーダは、C.のRadiology Objectsの医療画像に微調整されている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:01:21 GMT)
CommitShield: Tracking Vulnerability Introduction and Fix in Version Control Systems [15.0] CommitShieldは、コードコミットの脆弱性を検出するツールである。
静的解析ツールのコード解析機能と、大きな言語モデルの自然言語とコード理解機能を組み合わせる。
脆弱性修正検出タスクの最先端メソッドに対して,CommitShieldはリコールを76%~87%改善することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:52:55 GMT)
Can Out-of-Domain data help to Learn Domain-Specific Prompts for Multimodal Misinformation Detection? [14.7] ドメイン固有のPromptチューニングは、トレーニング中にドメイン外のデータを利用して、すべての望ましいドメインの偽ニュース検出を同時に改善する。
大規模なNewsCLIPpingとVERITEベンチマークの実験は、DPODがこの課題に対して最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:08:05 GMT)
MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation [14.5] 音源分離とピッチ推定は音楽情報検索において重要な課題である。
両タスクのモデル非依存型共同学習フレームワークを提案する。
両タスクにおいてMAJLが最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:38:51 GMT)
LightGNN: Simple Graph Neural Network for Recommendation [14.5] グラフニューラルネットワーク(GNN)は、協調的なレコメンデーションにおいて優れたパフォーマンスを示している。
既存のGNNパラダイムは、大規模でノイズの多い実世界のデータセットを扱う場合、スケーラビリティと堅牢性の課題に直面している。
軽量・蒸留方式のGNNプルーニングフレームワークであるLightGNNについて述べる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:05:53 GMT)
A Sequential Optimal Learning Approach to Automated Prompt Engineering in Large Language Models [14.5] 本稿では,自動プロンプトエンジニアリングのための最適学習フレームワークを提案する。
限られた評価予算を効率的に割り当てつつ、効果的なプロンプト機能を逐次識別するように設計されている。
私たちのフレームワークは、より広い範囲のアプリケーションに自動プロンプトエンジニアリングをデプロイするためのソリューションを提供します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:51:10 GMT)
DistPred: A Distribution-Free Probabilistic Inference Method for Regression and Forecasting [14.4] 本稿では、回帰予測タスクのためのDistPredという新しい手法を提案する。
予測分布と対象分布の差分を測定するための適切なスコアリングルールを、微分可能な離散形式に変換する。
これにより、モデルは単一のフォワードパスで多数のサンプルをサンプリングし、応答変数の潜在的分布を推定することができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:17:48 GMT)
Toward Digital Network Twins: Integrating Sionna RT in ns-3 for 6G Multi-RAT Networks Simulations [14.3] この研究は、ns-3とSionna RTの統合を導入し、最初のオープンソースフルスタックDigital Network Twin(DNT)の基礎を確立した。
挑戦的な車両都市シナリオでテストした結果、提案手法は、無線チャネルを正確にモデル化し、そのカスケード効果を高いネットワーク層に与えることを示す。
この研究は6G研究、トレーニング、ネットワーク管理のためのレイトレーシングシミュレーションの変換可能性を強調している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:09:52 GMT)
TabTreeFormer: Tabular Data Generation Using Hybrid Tree-Transformer [14.3] TabTreeFormerは、ツリーベースのモデルを組み込んだハイブリッドトランスフォーマーアーキテクチャである。
マルチモーダル連続分布を捉えるための二重量子化トークン化器を提案する。
実験の結果,TabTreeFormerは優れた忠実度,実用性,プライバシ,効率性を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:46:19 GMT)
Apollo: Band-sequence Modeling for High-Quality Audio Restoration [14.0] 本研究では,高精度オーディオ再生のための生成モデルであるApolloを提案する。
Apollo では、異なる周波数帯域間の関係をモデル化するために、明示的な周波数帯域分割モジュールを使用している。
既存のSR-GANモデルよりも、様々なビットレートや音楽ジャンルで一貫して優れています。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:37:10 GMT)
xMIL: Insightful Explanations for Multiple Instance Learning in Histopathology [13.9] マルチ・インスタンス・ラーニング(MIL)は、弱教師付き機械学習において効果的で広く利用されている手法である。
我々は、説明可能なAI(XAI)のレンズを通してMILを再考し、より一般的な仮定を持つ洗練されたフレームワークであるxMILを紹介した。
提案手法は, バイオマーカー予測タスクにおいて, 特に忠実度が向上し, 従来の説明手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:43:36 GMT)
CausalMob: Causal Human Mobility Prediction with LLMs-derived Human Intentions toward Public Events [13.8] 公共イベントの因果効果を分析するために,因果予測モデルCausalMobを提案する。
大規模な実世界のデータに基づいて、実験結果から、CausalMobモデルが人間の移動予測に優れていることが示された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:30:24 GMT)
Broken inversion symmetry in van der Waals topological ferromagnetic metal iron germanium telluride [13.8] 反転対称性の破れは多くの量子効果にとって重要であり、次世代のスピントロニクスにとって重要なスピン軌道トルクの基礎である。
近年, トポロジカルファンダーワールス (vdW) マグネット鉄テルル化物に, 新規な内在性スピン軌道トルクが確立されている。
ここでは,第2高調波発生法(SHG)により直接測定されたテルル化鉄のインバージョン対称性の破断の証拠を報告する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:53:36 GMT)
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features [13.5] AuxDepthNetはリアルタイムなモノクロ3Dオブジェクト検出のための効率的なフレームワークである。
外部の深度マップや事前訓練された深度モデルへの依存をなくす。
スコアは34.11%(簡単)、25.18%(モデレート)、21.90%(ハード)で、IoU閾値は0.7である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:07:32 GMT)
Some properties and applications of the new quantum $f$-divergences [13.2] 近年、積分表現に基づく量子$f$-divergencesの新しい定義が導入された。
本研究では、これらの量子$f$-divergencesを表現するための代替方法を検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:06:56 GMT)
ChatBug: A Common Vulnerability of Aligned LLMs Induced by Chat Templates [12.9] チャットテンプレートによって導入された共通の脆弱性であるChatBugを特定します。
悪意のあるユーザーは、チャットテンプレートの知識を活用して、大きな言語モデルの安全アライメントを回避できる。
ChatBugの脆弱性を悪用する2つの攻撃を開発した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:42:20 GMT)
Learning to Transfer Human Hand Skills for Robot Manipulations [12.8] 本稿では,人間の手の動きのデモから,ロボットに巧妙な操作課題を教える方法を提案する。
本手法では,人間の手の動き,ロボットの手の動き,物体の動きを3Dでマッピングする関節運動多様体を学習し,ある動きを他者から推測する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:33:47 GMT)
EEG Emotion Copilot: Optimizing Lightweight LLMs for Emotional EEG Interpretation with Assisted Medical Record Generation [12.7] 本稿では,脳波信号から直接感情状態を認識する脳波感情コパイロットについて述べる。
その後、パーソナライズされた診断と治療の提案を生成し、最終的に支援された電子カルテの自動化をサポートする。
提案手法は,医療分野における情動コンピューティングの適用を推し進めることが期待される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:21:43 GMT)
CoReQA: Uncovering Potentials of Language Models in Code Repository Question Answering [12.4] Code Repositoryレベルの質問応答のベンチマークであるCoReQAを紹介する。
CoReQAはGitHubのイシューと4つのプログラミング言語にまたがる176の人気のあるリポジトリからのコメントから構築された。
我々は、現在最先端のプロプライエタリおよび長期コンテキストモデルがリポジトリレベルの問題に効果的に取り組むのに苦労していることを示します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:24:07 GMT)
Coupled Hierarchical Structure Learning using Tree-Wasserstein Distance [12.3] 木-ワッサーシュタイン距離(TWD)を用いた階層構造学習手法を提案する。
提案手法は,TWDのサンプルと特徴を共同で計算し,その潜在階層を木として表現する。
この反復的な手順が収束し, 木質を実証的に向上させることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:54:42 GMT)
Stochastic Process Learning via Operator Flow Matching [12.3] 本研究では,関数空間上での事前学習のための演算子フローマッチング(alg)を開発する。
alg は任意の点集合の値の確率密度を与える。
本手法は, プロセス学習, 機能回帰, 事前学習における最先端モデルより優れている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:12:56 GMT)
Lived Experience Not Found: LLMs Struggle to Align with Experts on Addressing Adverse Drug Reactions from Psychiatric Medication Use [12.2] 精神医学薬の副作用薬物反応(英: Adverse Drug Reactions, ADRs)は、精神疾患患者の入院の主要な原因である。
ADRに関連する問題を解決するための制限に直面している医療システムでは、LLM(Large Language Models)がこのギャップを埋める可能性がある。
我々の研究は、リスクの高いドメイン内の戦略駆動タスクにおけるLCMを評価するための総合的なベンチマークと評価フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:30:02 GMT)
Superpixel Boundary Correction for Weakly-Supervised Semantic Segmentation on Histopathology Images [12.0] 弱教師付きセマンティックセグメンテーション (WSSS) は、ピクセルレベルのものの代わりに画像レベルのラベルを使用することで、アノテーションの要求を減らす。
クラスアクティベーションマップ(CAM)ベースの手法は依然として空間分解能が低く、境界が不明瞭である。
本稿では,スーパーピクセルクラスタリングとフラッドフィルを用いてCAM境界を改良するマルチレベルスーパーピクセル補正アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:54:03 GMT)
λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics [11.9] 学習ベースモデルや,基礎モデルとタスクと動作計画を組み合わせたニューロシンボリックなモジュラーアプローチなど,いくつかのモデルをベンチマークする。
発見は、よりデータ効率のよい学習ベースのMoMaアプローチの必要性を強調している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:57:23 GMT)
Explainable Diagnosis Prediction through Neuro-Symbolic Integration [11.8] 我々は、診断予測のための説明可能なモデルを開発するために、神経象徴的手法、特に論理ニューラルネットワーク(LNN)を用いている。
私たちのモデル、特に$M_textmulti-pathway$と$M_textcomprehensive$は、従来のモデルよりも優れたパフォーマンスを示します。
これらの知見は、医療AI応用における精度と説明可能性のギャップを埋める神経象徴的アプローチの可能性を強調している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:47:06 GMT)
BiasGuard: Guardrailing Fairness in Machine Learning Production Systems [11.8] 本稿では,生産型機械学習システムにおける公正ガードレールとして機能する,新しいアプローチであるBiasGuardを紹介する。
BiasGuardは、最先端の生成AIモデルであるCTGAN(Conditional Generative Adversarial Network)を活用したテスト時間拡張を活用して、反転保護された属性値に基づいて条件付きデータサンプルを合成する。
我々の総合的な実験分析により、BiasGuardは、非緩和ベンチマークと比較して精度を0.09%低下させながら、公平性を31%向上させることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:10:16 GMT)
Visual question answering: from early developments to recent advances -- a survey [11.7] VQA(Visual Question Answering)は、機械が視覚コンテンツに関する質問に答えることを目的とした、進化した研究分野である。
VQAは、インタラクティブな教育ツール、医療画像診断、カスタマーサービス、エンターテイメント、ソーシャルメディアキャプションなど、幅広い用途で注目されている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:00:35 GMT)
Stochastically Constrained Best Arm Identification with Thompson Sampling [11.7] 制約が存在する場合の最適な腕識別の問題について考察する。
我々は、この問題を解決する手段として、トンプソンサンプリング(TS)の一般的なアイデアを探求する。
我々は、TSに基づくサンプリングアルゴリズムを設計し、後方収束率の最適性を確立し、数値例を用いてその優れた性能を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:40:22 GMT)
An Effective Docker Image Slimming Approach Based on Source Code Data Dependency Analysis [11.5] 本稿ではデルタSCALPELという画像スリム化モデルを提案する。
静的データ依存分析を使用して、プロジェクトコードの環境依存を抽出します。
画像サイズを61.4%まで削減し、通常のプロジェクトの運用を保証できる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:28:57 GMT)
Graph-Based Multimodal and Multi-view Alignment for Keystep Recognition [11.4] そこで我々は,エゴセントリックビデオにおける微粒化キーステップ認識のためのフレキシブルなグラフ学習フレームワークを提案する。
提案手法は,既存の手法よりも12ポイント以上精度が高いことを示す。
ヘテロジニアスグラフ上でのナレーション,深さ,オブジェクトクラスラベルなど,複数のマルチモーダル特徴の活用について検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:02:55 GMT)
Vocal Tract Length Warped Features for Spoken Keyword Spotting [11.4] 音声キーワードスポッティング(KWS)のための声道長(VTL)特徴を取り入れたいくつかの手法を提案する。
最初の方法、VTL非依存のKWSは、様々な歪み要因を持つVTL特徴を利用する単一のディープニューラルネットワーク(DNN)をトレーニングする。
第2の方法は、DNNに対するテスト発話(VTLワープなしで)の従来の特徴を評価する。
第3の方法であるVTL連結KWSは、KWSの高次元特徴を形成するためにVTL特徴を歪曲した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:38:28 GMT)
STContext: A Multifaceted Dataset for Developing Context-aware Spatio-temporal Crowd Mobility Prediction Models [11.3] スマートでコンテキスト対応のクラウドフロー予測(STCFP)モデルでは、異常な群衆移動パターンを特定するためにコンテキスト的特徴が使用される。
既存のオープンクラウドフローデータセットには、適切な範囲のコンテキスト機能がない。
コンテキスト対応STCFPモデルを開発するための多面的データセットであるSTContextを作成します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:16:56 GMT)
Women, Infamous, and Exotic Beings: What Honorific Usages in Wikipedia Reveal about the Socio-Cultural Norms [11.3] 我々はベンガル語とヒンディー語ウィキペディアの記事に10,000の実在と架空の人物の記事を載せた。
名誉の使用はヒンディー語よりもベンガル語の方が一貫して一般的である。
両方の言語において、非名誉代名詞の使用は、悪名高い、若く、エキゾチックな存在に対してより一般的に見られる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:47:59 GMT)
MedicalNarratives: Connecting Medical Vision and Language with Localized Narratives [11.2] MedicalNarrativesは、Think-Aloudの研究で収集されたデータと、本質的に類似した医療教育ビデオから収集されたデータセットである。
我々のデータセットは、ビデオと記事から4.7Mの画像テキストペアを含み、100万のサンプルには、トレースとバウンディングボックスの形で密集したアノテーションが含まれている。
MedicalNarrativesの有用性を評価するために、12の医療ドメインにまたがるデータセットを用いて、CLIPアーキテクチャに基づいてGenMedClipをトレーニングする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:32:05 GMT)
Semise: Semi-supervised learning for severity representation in medical image [11.1] SEMISEは、自己教師付き学習と教師付き学習を組み合わせた医療画像における表現学習の方法である。
ラベル付きデータと拡張データの両方を活用することで、SEMISEはデータの不足という課題に対処し、エンコーダが意味のある特徴を抽出する能力を高める。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:03:55 GMT)
MC-VTON: Minimal Control Virtual Try-On Diffusion Transformer [11.0] 拡散モデルに基づく仮想試行法は現実的な試行効果を実現する。
彼らは、複数の条件付き画像入力を処理するために、余分な参照ネットワークまたは追加のイメージエンコーダを使用し、結果としてトレーニングコストが高い。
MC-VTONを提案することで,DiTは本質的なバックボーンを利用することで,最小条件付きトライオン入力を統合できる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:00:07 GMT)
A Diversity-Enhanced Knowledge Distillation Model for Practical Math Word Problem Solving [10.9] 数学語問題(MWP)は自然言語処理において重要な課題である。
本稿では,実用MWP問題解決のための新しい多様性強化知識蒸留(DivKD)モデルを提案する。
そこで本研究では,教師モデルから高品質な知識を選択的に伝達することで,学生が多様な方程式を学習する適応型多様性蒸留法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:18:22 GMT)
Countering Backdoor Attacks in Image Recognition: A Survey and Evaluation of Mitigation Strategies [10.8] 本稿では,画像認識におけるバックドア攻撃に対する既存の緩和策について概説する。
我々は、8つの異なるバックドア攻撃に対して、16の最先端アプローチの広範なベンチマークを行う。
この結果は122,236個の個別実験から得られたものであり、多くのアプローチがある程度の保護を提供する一方で、その性能はかなり異なる可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:23:43 GMT)
WAPTS: A Weighted Allocation Probability Adjusted Thompson Sampling Algorithm for High-Dimensional and Sparse Experiment Settings [10.6] このジレンマに対する一般的な解決策は、Contextual Banditフレームワークである。
その利点にもかかわらず、Contextual Banditアルゴリズムは測定バイアスや「次元の曲線」といった課題に直面している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:55:02 GMT)
BASIC: Semi-supervised Multi-organ Segmentation with Balanced Subclass Regularization and Semantic-conflict Penalty [10.5] BAlanced Subclass regularIzation and semantic-Conflict penalty mechanism (BASIC) を用いた,半教師付きマルチオーガナイゼーション(MoS)のための未バイアス知識の学習を目的とした,革新的な半教師付きネットワークを提案する。
サブクラス内の類似のセマンティック情報とそれに対応するオリジナルクラスを考慮し, 親クラスと矛盾するSCS予測に対して, 重度の罰を課すような, セマンティック・コンフリクトのペナルティ機構を考案した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:08:46 GMT)
On the Consideration of AI Openness: Can Good Intent Be Abused? [10.5] EVE-V1データセットを構築し,200対の質問応答ペアを犯罪行為と関連づけた。
我々はさらに600件の不正関連事例を用いてEVE-V2を開発し、悪意あるモデルの存在を確認した。
この発見は、オープンソースが科学の進歩を加速するパラドックス的ジレンマを浮き彫りにするが、誤用の可能性を最小限に抑えるために非常に注意が必要である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:52:37 GMT)
NesTools: A Dataset for Evaluating Nested Tool Learning Abilities of Large Language Models [10.3] 包括的ネストツール学習評価のギャップを埋めるために、NesToolsを導入します。
NesToolsは、大規模なネストツールコールを構築するための、新しい自動データ生成方法を備えている。
手動によるレビューと改善により、データセットは高品質で、現実世界のシナリオと密接に一致している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:34:06 GMT)
Optimizing Value of Learning in Task-Oriented Federated Meta-Learning Systems [10.3] デバイス間の個別のトレーニングニーズを評価するために、新しいメトリック、学習のメトリック値(VoL)が導入された。
タスクレベルの重み(TLW)は、FMLトレーニングのタスクレベルの考慮と公平性に基づいて定義される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:30:31 GMT)
Finding A Voice: Evaluating African American Dialect Generation for Chatbot Technology [10.3] 本研究では,アフリカ・アメリカン・バーナクラ・イングリッシュ(AAVE)の生成能力について検討する。
異なる方言強度でAAVEのような発話を生成する3つのLLMファミリーの性能を解析した。
AAVE 話者は標準アメリカ英語 (SAE) のチャットボットを好んでおり、AAVE のレベルは様々な特徴の低評価と関連している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:07:01 GMT)
Structure-Preference Enabled Graph Embedding Generation under Differential Privacy [10.2] 構造参照可能なグラフ埋め込み生成であるSE-PrivGEmbをDP下で提案する。
任意の構造を選好するために、非ゼロベクトルの摂動による統一雑音耐性機構を設計する。
提案手法は,構造的等価性とリンク予測タスクにおいて,既存の最先端手法よりも優れる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:43:18 GMT)
Initialization is Critical to Whether Transformers Fit Composite Functions by Reasoning or Memorizing [10.2] トランスフォーマーは様々なタスクにわたって印象的な能力を示してきたが、構成問題におけるパフォーマンスは議論の的となっている。
パラメータ初期化尺度は、モデルが推論(推論に基づく)解を学習するかどうかを決定する上で重要な役割を果たす。
さらに、推論(推論に基づく)ソリューションは、複雑さのバイアスが低く、単一のアンカーに対する個々のマッピングを学習できる重要な要素である、と仮定する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:08:52 GMT)
Rare-to-Frequent: Unlocking Compositional Generation Power of Diffusion Models on Rare Concepts with LLM Guidance [10.1] 拡散モデルの合成生成能力は,大規模言語モデル指導によって著しく向上できることを示す。
本稿では、レア・ツー・頻繁なコンセプトガイダンスを計画し、実行するためのトレーニングフリーアプローチR2Fを提案する。
我々のフレームワークは、事前訓練された拡散モデルやLLMに対して柔軟であり、領域誘導拡散アプローチとシームレスに統合することができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:41:13 GMT)
Fast data inversion for high-dimensional dynamical systems from noisy measurements [10.1] 我々は高次元力学系に対するフレキシブル潜在因子モデルのためのスケーラブルなアプローチを開発する。
カスカディア地域の測地学的な観測に本手法を適用することにより, 地震の地震観測データと独立に一致したスリップの推定値が得られた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:57:08 GMT)
SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving [10.0] 本研究では,大規模言語モデル(LLM)の文脈推論機能を活用することにより,自律運転(AD)における状況認識の高度化の必要性に対処する。
厳密なラベルベースのアノテーションに依存する従来の認識システムとは異なり、リアルタイムのマルチモーダルセンサーデータを統一されたLLM対応の知識ベースに統合する。
実世界のV2Xデータセットを用いた実験結果は、知覚と予測性能の大幅な改善を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:15:46 GMT)
Adapting Installation Instructions in Rapidly Evolving Software Ecosystems [10.0] インストール関連セクションの更新に重点を置いた1,163のコミットでGitHubリポジトリを調査した。
調査の結果,コミットの変更には,プリインストール命令,インストール後のインストレーション命令,ドキュメント提示,外部リソース管理の6つの大きなカテゴリが明らかになった。
そこで本稿では,ドキュメント更新時にドキュメンテーションメンテナが参照するインストール関連セクションをカバーするテンプレートを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:20:45 GMT)
LLM-Powered Multi-Agent System for Automated Crypto Portfolio Management [10.0] 本稿では、暗号通貨投資のための説明可能なマルチモーダルマルチエージェントフレームワークを提案する。
当社のフレームワークでは、データ分析や文献の統合、投資決定といったサブタスクを処理するために、チーム内およびチーム間で協力する特殊なエージェントを使用しています。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:15:11 GMT)
LLM4CVE: Enabling Iterative Automated Vulnerability Repair with Large Language Models [9.9] 大規模言語モデル(LLM)は、多くのソフトウェア欠陥が自動的にパッチを当てられる可能性を開放した。
実世界のコードで脆弱な関数を高い精度で堅牢に修正する反復パイプラインを提案する。
また,Llama 370Bでは,人間の検証による品質スコアが8.51/10,Llama 370Bでは20%に向上した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:21:42 GMT)
Vim-F: Visual State Space Model Benefiting from Learning in the Frequency Domain [9.8] Mambaディープラーニングモデルとして知られる、効率的なハードウェア対応設計のステートスペースモデル(SSM)は、長いシーケンスのモデリングにおいて大きな進歩を遂げた。
周波数領域と空間領域の両方で純粋なマンバエンコーダとスキャンを利用するVim-Fと呼ばれる新しいモデルを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:00:36 GMT)
Koopman Learning with Episodic Memory [9.8] クープマン作用素理論は複雑な実世界の力学系のモデルを学ぶことに成功している。
我々はKoopman法にエピソード記憶機構を組み、類似のダイナミクスが以前に発生した時間帯のグローバルなリコール(あるいは注意)を可能にする。
エピソードメモリを用いたクープマン学習の基本的な実装により,合成および実世界のデータに対する予測が大幅に改善されることが判明した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:11:10 GMT)
Stability and Generalization in Free Adversarial Training [9.8] 本稿では,アルゴリズム的安定性フレームワークを用いた対人訓練における一般化と最適化の相互関係を解析する。
本研究では,バニラ対逆トレーニング法と自由対逆トレーニング法を用いて学習したニューラルネットワークの一般化ギャップを比較した。
実験結果から, 自由対人訓練法は, 同様の反復回数に対して, より小さな一般化のギャップを生じさせる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:49:30 GMT)
On the Mode-Seeking Properties of Langevin Dynamics [9.8] Langevin Dynamicsは確率分布のスコア関数からサンプルを生成することを目的としている。
マルチモーダル分布からのサンプル生成におけるLangevin Dynamicsについて検討する。
本稿では,データベクトルを一定サイズのパッチに分割し,前回のパッチで逐次条件付きパッチを生成するChained Langevin Dynamicsを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:02:36 GMT)
Unlocking the diagnostic potential of electrocardiograms through information transfer from cardiac magnetic resonance imaging [9.8] 本稿では,心電図のみから,費用対効果と総合的な心検診を行うための深層学習戦略を提案する。
提案手法は,マルチモーダルコントラスト学習とマスク付きデータモデリングを組み合わせて,CMR画像からECG表現へのドメイン固有情報転送を行う。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:50:51 GMT)
KAnoCLIP: Zero-Shot Anomaly Detection through Knowledge-Driven Prompt Learning and Enhanced Cross-Modal Integration [9.7] ゼロショット異常検出(ZSAD)は、ターゲットデータセットからのトレーニングサンプルを必要とせずに、異常を識別する。
CLIPのようなビジョン言語モデルはZSADに潜在的な可能性を示すが、制限がある。
視覚言語モデルを活用した新しいZSADフレームワークであるKAnoCLIPを紹介する。
KAnoCLIPは、12の産業および医療データセットにわたるZSADの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:51:41 GMT)
VidFormer: A novel end-to-end framework fused by 3DCNN and Transformer for Video-based Remote Physiological Measurement [9.6] 本稿では、畳み込みネットワーク(CNN)とrタスクのモデルを統合する新しいフレームワークであるVidFormerを紹介する。
5つの公開データセットに対する評価は、VidFormerが現在のSOTA(State-of-the-art)メソッドより優れていることを示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:57:03 GMT)
Explainable Reinforcement Learning via Temporal Policy Decomposition [9.5] 今後期待される成果(EFO)の観点から個別のRL行動を説明する新しい説明可能性アプローチであるTPD(Temporal Policy Decomposition)を提案する。
TPDは、政策の今後の戦略と、与えられた行動に対する予測軌道を明確にする正確な説明を生成し、(ii)報酬構成の理解を改善する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:10:09 GMT)
Multi-armed Bandit and Backbone boost Lin-Kernighan-Helsgaun Algorithm for the Traveling Salesman Problems [9.0] Lin-Kernighan-Helsguan (LKH) は、トラベリングセールスマン問題(TSP)の古典的な局所探索アルゴリズムである。
LKHは、エッジの品質を評価するために従来の距離メートル法を置き換えるために$alpha$-valueを導入した。
そこで本研究では,TSP局所探索プロセス中にバックボーン情報を抽出する手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:45:41 GMT)
What Does a Software Engineer Look Like? Exploring Societal Stereotypes in LLMs [9.0] 本研究では,OpenAIのGPT-4とMicrosoft Copilotが,性別や人種のステレオタイプをいかに強化するかを検討する。
それぞれのLSMを用いて300のプロファイルを生成し,100の性別ベースと50の性別ニュートラルプロファイルで構成された。
分析の結果,両モデルとも男性とコーカサス人のプロファイルが好まれていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:44:41 GMT)
ChronoLLM: A Framework for Customizing Large Language Model for Digital Twins generalization based on PyChrono [8.9] ChronoLlama氏は、オープンソースのLLMをカスタマイズする新しいフレームワーク、特にコード生成のために、マルチ物理シミュレーションのためにPyChronoと組み合わせたフレームワークを紹介した。
この統合は、シミュレーションスクリプトの作成を自動化し、改善することを目的としており、それによってモデルの精度と効率が向上する。
実験結果から,シミュレーション設定速度,生成符号の精度,計算効率の大幅な向上が示唆された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:39:14 GMT)
VTAO-BiManip: Masked Visual-Tactile-Action Pre-training with Object Understanding for Bimanual Dexterous Manipulation [8.9] 両手の DoF の高さと協調性のため、ロボット工学における両面的な操作は依然として重要な課題である。
既存の片手操作技術は、人間のデモンストレーションを利用してRL法を誘導するが、複数のサブスキルを含む複雑な双対タスクに一般化できないことが多い。
VTAO-BiManipは,視覚触覚前訓練と物体理解を組み合わせた新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:14:53 GMT)
Cooperative Search and Track of Rogue Drones using Multiagent Reinforcement Learning [8.8] 本研究は、機密性の高いインフラ施設をターゲットにしたローグドローンを迎撃する問題を考察する。
ローグドローンを確実に検出・追跡・中和できる総合システムを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:22:51 GMT)
Reinforcement Learning for Jump-Diffusions, with Financial Applications [8.7] 本研究では,ジャンプ拡散過程によって制御される系の力学に対する連続時間強化学習について検討する。
本研究では,ジャンプの存在が一般の俳優や批評家のパラメータ化に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:16:43 GMT)
MADation: Face Morphing Attack Detection with Foundation Models [8.6] モーフィング攻撃検知システムは、特定の種類の脅威、モーフィング攻撃を早期に検出することを目的としている。
ファンデーションモデル(FM)は、膨大な量のラベルのないデータから学習し、目に見えない領域に顕著なゼロショットの一般化を達成する。
本研究では,その特異性に適切に適応した場合に,FMがMADタスクで良好に機能する可能性を認識する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:06:57 GMT)
Language and Planning in Robotic Navigation: A Multilingual Evaluation of State-of-the-Art Models [8.6] 本研究では、ロボット工学における視覚・言語ナビゲーション(VLN)領域におけるアラビア語の統合に関する最初の研究について述べる。
我々は、最先端の多言語小言語モデル(SLM)の包括的評価を行う。
我々は,英語とアラビア語の両方で指示を与えると,ナビゲーションタスクの高レベルな計画が可能であることを実証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:01:25 GMT)
To Err is Machine: Vulnerability Detection Challenges LLM Reasoning [8.6] 脆弱性検出という,困難なコード推論タスクを提示する。
最新のSOTA(State-of-the-art)モデルでは,脆弱性検出評価では54.5%のバランスド精度しか報告されていない。
脆弱性検出を克服するためには、新しいモデル、新しいトレーニング方法、あるいはもっと実行固有の事前トレーニングデータが必要になるかもしれない。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:57:38 GMT)
Purification of Noisy Measurements and Faithful Distillation of Entanglement [8.5] 一般量子演算を構成する量子測度が特にノイズとなるような,ノイズを伴うエンタングルメント蒸留について考察する。
本稿では,不完全な局所操作が絡み合を蒸留できることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:34:06 GMT)
Neuromorphic Optical Tracking and Imaging of Randomly Moving Targets through Strongly Scattering Media [8.5] 我々は、通常見えない物体の追跡と画像化のための、エンドツーエンドのニューロモルフィック光学工学と計算手法を開発した。
密度散乱媒質から生じる光をイベントカメラで検出し、画素ワイドの同期スパイク列車に変換する。
本研究では,高密度な乱流媒質中におけるランダムに移動する物体の追跡とイメージング,および空間的静止だが光学的動的物体の像再構成を実演する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:38:13 GMT)
AGGA: A Dataset of Academic Guidelines for Generative AI and Large Language Models [8.4] 本稿では,GAI(Generative AI)とLLM(Large Language Models)の学術的利用に関する80のガイドラインをまとめたデータセットであるAGGAを紹介する。
このデータセットには188,674語が含まれており、要求工学に一般的に適用される自然言語処理タスクの貴重なリソースとして機能している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:12:22 GMT)
Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion [8.4] スコア関数のヤコビアンの固有値のスペクトルを解析し、その不連続性(ギャップ)は異なる部分多様体の存在と次元性を明らかにする。
本研究は, 生成過程における3つの異なる定性相の存在を明らかにした。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:42:21 GMT)
Learning the Language of Protein Structure [8.4] 本稿では,タンパク質構造を離散表現に効果的にトークン化するベクトル量子化オートエンコーダを用いたアプローチを提案する。
学習した表現の有効性を示すために、コードブック上でトレーニングされた単純なGPTモデルにより、新規で多様性があり、設計可能なタンパク質構造を生成することができることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:24:59 GMT)
INFELM: In-depth Fairness Evaluation of Large Text-To-Image Models [8.3] マルチモーダルAIシステムは、人間のような認知をエミュレートすることで、産業応用の可能性を秘めている。
また、有害な内容の増幅や社会的偏見の強化など、重大な倫理的課題も生じている。
本稿では,広く使用されているテキスト・ツー・イメージ・モデルにおける奥行きの公平性評価であるINFELMを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:10:45 GMT)
Exact Decoding of Repetition Code under Circuit Level Noise [8.3] 繰り返し符号は、量子誤り訂正実験の基本的な基礎を形成する。
現在の回路レベルの雑音下での繰り返し符号の復号法は準最適である。
平面と呼ばれる最適極大復号アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:14:01 GMT)
Deep Policy Iteration with Integer Programming for Inventory Management [8.3] 本稿では,大規模なアクセス可能な行動空間と状態依存制約を用いた長期割引報酬問題を最適化するための枠組みを提案する。
提案したプログラム可能なアクター強化学習(PARL)は,ニューラルネットワーク(NN)を利用して値関数を近似するディープ・ポリシー法を用いる。
我々は、提案アルゴリズムを最先端のRLアルゴリズムに対してベンチマークし、一般的に補充を使い、既存の手法を平均14.7%も上回っていることを発見した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:32:52 GMT)
Piano Transcription by Hierarchical Language Modeling with Pretrained Roll-based Encoders [8.2] 両手法の強みを利用するために,事前学習したロールベースエンコーダとLMデコーダを組み合わせたハイブリッド方式を提案する。
本手法は,従来のピアノロール出力0.01,0.022をオンセットオフセット速度F1スコアで上回る。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:13:41 GMT)
Explainable Reinforcement Learning for Formula One Race Strategy [8.2] シミュレーションにおけるレース戦略を制御するための強化学習モデルRSRLを導入する。
RSRLはテストレースの2023年のバーレーングランプリでP5.33の平均フィニッシュポジションを達成した。
次に、一般的な研究で、1つのトラックや複数のトラックのパフォーマンスが、トレーニングによって優先されるかを実証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:54:19 GMT)
Randomly Sampled Language Reasoning Problems Reveal Limits of LLMs [8.1] 我々は,データセットリコールのリスクを回避しつつ,モデルの言語理解能力の測定を試みる。
決定論的有限オートマトン(DFA)により認識される言語タスクの多種族をパラメータ化する。
3 状態 DFA の驚くほど単純な設定であっても、LLM は言語認識と合成の両タスクにおいてパラメータ化されていない ngram モデルより劣ることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:51:30 GMT)
VLM-driven Behavior Tree for Context-aware Task Planning [8.1] 本稿では、視覚言語モデル(VLM)を利用して行動木(BT)を対話的に生成・編集する新しいフレームワークを提案する。
我々のアプローチの重要な特徴は、自己進行型視覚条件による条件制御にある。
われわれのフレームワークを実世界のカフェのシナリオで検証し、その実現可能性と限界を実証した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:06:27 GMT)
Linear Discriminant Analysis with the Randomized Kaczmarz Method [8.0] 超大規模データに対する二分級ガウスモデル線形判別分析(LDA)に対する反復的ランダム化手法を提案する。
我々の実験は、rkLDAがステップサイズとイテレーション数で完全なデータLDAに代わる実行可能な代替手段を提供することを示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:01:50 GMT)
LM-Net: A Light-weight and Multi-scale Network for Medical Image Segmentation [8.0] 現在の医療画像セグメンテーションアプローチは、マルチスケール情報を深く探究するのに限界がある。
本稿では,セグメンテーションの精度を高めるために,新しい軽量マルチスケールアーキテクチャ (LM-Net) を提案する。
提案モデルでは,4.66GのFLOPと5.4Mのパラメータしか必要とせず,従来の手法を超越した最新結果が得られる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:47:15 GMT)
Deep Learning for Ophthalmology: The State-of-the-Art and Future Trends [7.9] 人工知能(AI)の出現は眼科領域において新たな時代を迎えている。
本総説では, 深層学習(DL)の様々な眼環境における最先端の応用について検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:53:14 GMT)
Class-Balance Bias in Regularized Regression [7.8] 本研究では,ラッソ,隆起,弾性ネット回帰の文脈における正規化について検討した。
二つの特徴のクラスが回帰係数に直接影響を与えることを示す。
また、バイナリと通常の機能の混在やインタラクションにも取り組み、初期結果を提供しています。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:35:09 GMT)
Types of dynamical behavior in a quasiperiodic mosaic lattice [7.7] 準周期モザイク格子の力学を研究し、その特異な力学特性を解明する。
以上の結果から, 実効ハミルトニアンは, 大準周期ポテンシャル強度領域において, 動的挙動をうまく記述できることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:09:08 GMT)
Hallucination Detox: Sensitivity Dropout (SenD) for Large Language Model Training [7.7] 本研究では,学習過程と幻覚の出現との関係について検討する。
感性低下(Sensitivity Dropout, SenD)は, 覚醒の軽減を目的としたトレーニングプロトコルである。
さらに,従来のEigenScoreを2倍の速度で近似する,教師なし幻覚検出尺度であるEfficient EigenScore(EES)を開発した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:56:42 GMT)
SpotDiffusion: A Fast Approach For Seamless Panorama Generation Over Time [7.5] 生成モデルを用いて高解像度画像を生成する新しい手法を提案する。
提案手法は,時間とともに重なりのないデノベーションウィンドウをシフトさせ,一段階のシームが次回修正されるようにする。
提案手法は計算効率の向上や推論時間の高速化など,いくつかの重要な利点を提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:35:10 GMT)
Decoupling Learning and Decision-Making: Breaking the $\mathcal{O}(\sqrt{T})$ Barrier in Online Resource Allocation with First-Order Methods [7.5] 意思決定から学習を分離する新しいアルゴリズムフレームワークを導入する。
初めて、この新しいフレームワークで、一階述語メソッドが、$mathcalO(sqrtT)$を後悔できることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:14:56 GMT)
Graph Neural Backdoor: Fundamentals, Methodologies, Applications, and Future Directions [7.4] GNNの強化にもかかわらず、最近の研究はバックドア攻撃に対する潜在的な脆弱性を実証的に実証している。
この調査は、グラフバックドアの原則を探求し、ディフェンダーに洞察を提供し、将来のセキュリティ研究を促進することを目的としている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:13:06 GMT)
"Yeah Right!" -- Do LLMs Exhibit Multimodal Feature Transfer? [7.4] 本研究では,人間同士の会話に特化して訓練された音声+テキストモデルとテキストモデルを用いて,このスキルを伝達する能力を評価する。
具体的には,これらのモデルを用いて,隠蔽型偽装コミュニケーションを検知する能力について検証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:57:59 GMT)
Mixing Times and Privacy Analysis for the Projected Langevin Algorithm under a Modulus of Continuity [7.3] 我々は、予測ランゲヴィンアルゴリズム(LA)の混合時間とノイズグラディエントDescent(SGD)のプライバシー曲線について検討する。
具体的には、射影LAに対する新しい混合時間境界を導出するが、これはいくつかの重要な場合において、次元自由かつ多対数的である。
サブサンプルノイズSGDアルゴリズムのプライバシー曲線の上限を新たに設定する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:46:59 GMT)
Autonomous Alignment with Human Value on Altruism through Considerate Self-imagination and Theory of Mind [7.2] 人間社会におけるアルトゥル的行動は、心の理論(ToM)として知られる他者を共感する人間の能力に由来する。
我々は、自己想像とToM能力を考慮に入れたエージェントを、暗黙の本質的なモチベーションを通じて、人間の利他主義的価値観と自律的に一致させることを約束している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:25:32 GMT)
NeRFs are Mirror Detectors: Using Structural Similarity for Multi-View Mirror Scene Reconstruction with 3D Surface Primitives [7.1] 我々は、NeRFをミラー検出器とみなすことができることを示す方法であるNeRF-MDを提案する。
まず、標準的なNeRFをトレーニングすることで、シーン形状の初期推定を計算する。
次に、第2の訓練段階において、放射場とミラー幾何学を共同で最適化し、その品質を向上する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:59:53 GMT)
Approximation and bounding techniques for the Fisher-Rao distances between parametric statistical models [7.1] 我々はフィッシャー・ラオ距離の数値的ロバストな近似と有界化について考察する。
特に、近似に対する任意の小さな加算誤差を保証するための一般的な方法を得る。
我々は,フィッシャー・ラオ測地線のプロキシとして機能する曲線長をベースとした2つの新しい距離を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:45:58 GMT)
Quantum Linear Multistep Method for Using a Quantum Oracle with Differential Equations [6.9] 本稿では、量子オラクルで使用するIPPの数値解を生成するために、QLMM(quantum linear multistep method)を提案する。
また、所定のIPPに対してQLMMの最適な形式を求める方法を提案する。
計算機シミュレーションにより,例 IVP の QLMM の定式化を導出し,最適化された QLMM からの解が最適化問題に利用できることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:41:39 GMT)
AlphaPO -- Reward shape matters for LLM alignment [6.9] 我々はAlphaPOという新しいDAA手法を導入し、標準的なログ報酬を超えて報酬関数の形状を変えるのに役立つ。
最高のパフォーマンスを持つDAAの1つであるSimPOと比較して、AlphaPOはアライメント性能が7%から10%向上した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:46:42 GMT)
Towards generalization of drug response prediction to single cells and patients utilizing importance-aware multi-source domain transfer learning [6.8] scAdaDrugは、適応型重要度認識表現学習を利用した、新しいマルチソースドメイン適応モデルである。
本モデルは,複数の独立データセット上での薬物応答の予測において,最先端の性能を達成した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:53:48 GMT)
On Local Overfitting and Forgetting in Deep Neural Networks [6.8] 本稿では,検証データ上での深部モデルの忘れ率を推定する新しいスコアを提案する。
従来のオーバーフィッティングの有無にかかわらず,局所的なオーバーフィッティングが発生することを示す。
我々は,1つのネットワークのトレーニング履歴にのみ依存して,忘れられた知識を回復することを目的とした,新たなアンサンブル手法を考案した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:45:04 GMT)
TexHOI: Reconstructing Textures of 3D Unknown Objects in Monocular Hand-Object Interaction Scenes [6.8] 本研究では,物体の表面アルベドに対する環境可視性と間接照明に対する手の影響を予測する新しいアプローチを提案する。
本手法はテクスチャ再構築における最先端手法を超越した手法であり,我々の知る限り,オブジェクトテクスチャ再構築における手動インタラクションを初めて考慮した手法である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:40:55 GMT)
In Search of Trees: Decision-Tree Policy Synthesis for Black-Box Systems via Search [6.7] 決定論的ブラックボックス環境を考慮した最適決定木ポリシーの合成手法を提案する。
我々のアプローチは、与えられた離散化の下で決定木の空間を体系的に探索する特殊探索アルゴリズムである。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:54:58 GMT)
Neural Deconstruction Search for Vehicle Routing Problems [6.6] 本稿では,ニューラルネットワークによって解を分解する反復探索フレームワークを提案する。
本手法は,3つの課題のある車両ルーティング問題に対して,最先端の運用研究手法の性能を超越した手法である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:44:25 GMT)
Supercorrelated decay in a quasiperiodic nonlinear waveguide: From Markovian to non-Markovian transitions [6.5] モビリティエッジ(ME)は、拡張状態から局所化された量子系において重要な境界である。
準周期ポテンシャル変調光子-光子相互作用を持つ1次元Bose-Hubbard鎖について検討する。
2光子部分空間内の二重状態(すなわち強い相互作用によって生じる有界光子対)の ME を同定する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:19:06 GMT)
Mahalanobis k-NN: A Statistical Lens for Robust Point-Cloud Registrations [6.5] Mahalanobis k-NN: 学習ベースのポイントクラウド登録における特徴マッチングの課題に対処するために設計された統計レンズ。
本手法は任意の局所グラフベースの点雲解析手法にシームレスに統合できる。
私たちは、ポイントクラウドの登録によって得られた機能が本質的に差別的能力を持つことができることを、初めて確立しました。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:53:41 GMT)
Gapless Symmetry-Protected Topological States in Measurement-Only Circuits [6.5] 我々は、ギャップレス対称性保護トポロジカル状態(gSPT)の概念を臨界定常状態に一般化する。
我々は、$mathbb Z_4$回路モデルにおける定常gSPT相の実現を実証する。
システムをMajoranaループモデルにマッピングすることで、統一的な理論フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:07:59 GMT)
FgC2F-UDiff: Frequency-guided and Coarse-to-fine Unified Diffusion Model for Multi-modality Missing MRI Synthesis [6.5] 我々は、周波数誘導および粗粒拡散モデル(FgC2F-UDiff)という新しい統合合成モデルを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:42:45 GMT)
Text to Band Gap: Pre-trained Language Models as Encoders for Semiconductor Band Gap Prediction [6.3] 本研究では,半導体材料のバンドギャップを予測するためのエンコーダとしてのトランスフォーマーベース言語モデルについて検討する。
そこで我々は,ChatGPT APIを用いて生成した特徴と自然言語テキストを組み合わせた形式付き文字列の2つの形式で資料記述を生成する。
自然言語処理タスクに基づいて事前訓練されたRoBERTaモデルは,予測タスクのエンコーダとして効果的に動作することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:56:26 GMT)
Non-geodesically-convex optimization in the Wasserstein space [6.2] 確率関数が非測地論であるワッサーシュタイン空間測度における最適化問題のクラスである。
この設定はまた、分布の目標が分布の差分構造であるサンプリング問題も含む。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:50:35 GMT)
Salient Region Matching for Fully Automated MR-TRUS Registration [6.1] 本稿では,完全自動MR-TRUS登録のための領域マッチングフレームワークを提案する。
このフレームワークは、前立腺のセグメンテーション、剛性アライメント、変形可能な登録で構成されている。
提案手法は,いくつかの最先端手法に優れ,良好な登録結果が得られる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:06:07 GMT)
SELMA3D challenge: Self-supervised learning for 3D light-sheet microscopy image segmentation [6.0] 私たちは、MICCAI 2024カンファレンスでSELMA3D Challengeを組織しました。SELMA3Dは、クリアドマウスとヒト脳からの大量の光シート画像を提供します。
本論文では,課題の全段階に5つのチームが参加し,提案手法について概説する。
SELMA3Dは3次元顕微鏡画像セグメンテーションのための自己教師あり学習に焦点を当てた第1回MICCAIチャレンジとして,今後もサポートし,拡張していく。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:43:36 GMT)
Three-dimensional attention Transformer for state evaluation in real-time strategy games [5.6] 3次元空間時間変換器 (TSTF Transformer) アーキテクチャは戦場環境を効率的にモデル化する。
3,150個の対向実験からなるデータセットにおいて、8層TSTF変換器は優れた性能を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:42:38 GMT)
QMA vs. QCMA and Pseudorandomness [5.5] そのようなオラクルは、ある量子擬ランダム性予想が成立するときに存在することを示す。
私たちの結果は、"Win-win"シナリオの確立と見なすことができます。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:49:41 GMT)
Neural Cellular Automata and Deep Equilibrium Models [5.4] 本稿では,ニューラルセルラーオートマタとDeep Equilibrium Modelsという,ディープラーニングにおける2つの新しいパラダイムの関連と相違について論じる。
最後に、このエッセイは、将来の研究のために両方のアプローチの理論的および実践的な側面を組み合わせる方法について推測する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:54:10 GMT)
PlanLLM: Video Procedure Planning with Refinable Large Language Models [5.4] ビデオプロシージャ計画、すなわち、開始とゴール状態のビデオフレームが与えられた一連のアクションステップを計画することは、AIを具現化する上で不可欠な能力である。
最近の研究は、Large Language Models (LLMs) を用いて、リッチなアクションステップ記述テキストを生成し、アクションステップのデコーディングをガイドしている。
ビデオプロシージャ計画のためのLLMを用いたクロスモーダル共同学習フレームワークPlanLLMを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:50:11 GMT)
Imitation Learning of MPC with Neural Networks: Error Guarantees and Sparsification [5.3] 本稿では,ニューラルネットワークを用いた模倣モデル予測制御系における近似誤差の有界化のためのフレームワークを提案する。
本稿では,この手法を用いて,性能保証付き安定型ニューラルネットワークコントローラを設計する方法について論じる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:18:37 GMT)
Online Reinforcement Learning-Based Dynamic Adaptive Evaluation Function for Real-Time Strategy Tasks [5.1] リアルタイム戦略タスクの効果的な評価には、動的で予測不可能な環境に対処するための適応的なメカニズムが必要である。
本研究では,戦場状況変化に対するリアルタイム応答性評価機能の改善手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:36:33 GMT)
Flemme: A Flexible and Modular Learning Platform for Medical Images [5.1] Flemmeは、MedicalイメージのためのFLExible and Modular Learningプラットフォームである。
コンボリューション,トランスフォーマー,状態空間モデル(SSM)に基づくビルディングブロックを用いてエンコーダを構築し,2次元画像パッチと3次元画像パッチの両処理を行う。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:23:54 GMT)
Learning Stochastic Nonlinear Dynamics with Embedded Latent Transfer Operators [5.1] 非線形力学系の演算子に基づく潜在マルコフ表現を考える。
埋め込みは、例えばフィードフォワードニューラルネットワークで構築された再生カーネルを使って同時に学習することができる。
また、非線形系における逐次状態推定の一般化や、演算子に基づくダイナミクスの固有モード分解についても論じる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:14:34 GMT)
Statistical Error Bounds for GANs with Nonlinear Objective Functionals [5.0] 有限サンプル濃度の不等式という形で、$f$と$Gamma$の一般クラスに対して$(f,Gamma)$-GANsの統計的誤差境界を導出する。
結果は、$(f,Gamma)$-GANsの統計的一貫性を証明し、適切な極限でIMM-GANsの既知の結果に還元する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:05:11 GMT)
ISSR: Iterative Selection with Self-Review for Vocabulary Test Distractor Generation [4.9] 本研究は,台湾の大学入学試験における英語語彙の問題に焦点を当てた。
本稿では,自己レビュー(ISSR)フレームワークによる反復的選択を提案する。
実験結果から,ISSRは可塑性分散器の生成において有望な性能を達成し,自己レビュー機構により,問題を無効化可能な分散器を効果的にフィルタすることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:45:02 GMT)
SFADNet: Spatio-temporal Fused Graph based on Attention Decoupling Network for Traffic Prediction [4.9] 本稿では,空間的特徴量に基づいてトラフィックフローを複数のトラフィックパターンに分類する,革新的なトラフィックフロー予測ネットワークであるSFADNetを提案する。
各パターンに対して、残差グラフ畳み込みモジュールと時系列モジュールを用いて、相互アテンション機構に基づく独立適応時間融合グラフを構築する。
大規模な実験結果によると、SFADNetは大規模な4スケールのデータセットで現在の最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:09:50 GMT)
Deep Learning within Tabular Data: Foundations, Challenges, Advances and Future Directions [4.8] タブラルデータはまだ、さまざまな現実世界のアプリケーションで広く使われているデータタイプのひとつだ。
しかし、この領域の効果的な表現学習は、不規則なパターン、不均一な特徴分布、複雑なカラム間の依存関係など、ユニークな課題を生んでいる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:23:36 GMT)
Two-Layer Retrieval-Augmented Generation Framework for Low-Resource Medical Question Answering Using Reddit Data: Proof-of-Concept Study [4.8] 本稿では、健康関連トピックに関連する新たな問題に答える医療質問に対する検索強化世代アーキテクチャを提案する。
筆者らのフレームワークは,大量のユーザ生成ソーシャルメディアデータから医療質問に回答するために,個別の要約と集約された要約を生成する。
GPT-4 と Nous-Hermes-2-7B-DPO を用いて評価すると, 関連性, 長さ, 幻覚, 包括性, コヒーレンスに比較して高いスコアが得られた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:13:50 GMT)
Applying Bayesian Data Analysis for Causal Inference about Requirements Quality: A Controlled Experiment [4.6] 要求仕様の品質がその後のソフトウェアエンジニアリング活動に影響を与えることは一般的に受け入れられている。
要求品質の欠陥がソフトウェアエンジニアリング活動に与える影響について実証的な証拠を提供することを目的としている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:12:47 GMT)
Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding [4.6] 本研究では,この分野でのマルチモーダル理解の技術的欠点を解決するために,多シナリオ推論アーキテクチャを提案する。
この結果は、マルチモーダルデータにおけるこのアーキテクチャの実現可能性を示している。
それは、シナリオを変える際に、ヒューマノイドロボットの自己学習と自律行動の将来の発展を物語っている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:24:45 GMT)
Efficient Sampling for Pauli Measurement-Based Shadow Tomography in Direct Fidelity Estimation [4.5] 同様の戦略は古典的な影から導き出すことができる。
具体的には,GHZおよびW状態を用いてDFEを行うために,パウリ測定を用いた効率的な手法について述べる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:09:13 GMT)
AADNet: Exploring EEG Spatiotemporal Information for Fast and Accurate Orientation and Timbre Detection of Auditory Attention Based on A Cue-Masked Paradigm [4.5] 脳波(EEG)からの聴覚的注意復号は、ユーザがノイズの多い環境でどのソースに出席しているかを推測することができる。
本研究は,実験前の情報漏洩を回避するために,キューメイドの聴覚注意パラダイムを提案する。
短時間の脳波信号から時間情報を活用するために,エンドツーエンドのディープラーニングモデルであるAADNetを提案した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:51:17 GMT)
Influences on LLM Calibration: A Study of Response Agreement, Loss Functions, and Prompt Styles [4.5] Calib-nは、信頼度推定のための補助モデルをトレーニングする新しいフレームワークである。
補助的なモデルベース手法では,数発のプロンプトが最も有効であることが判明した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:48:42 GMT)
Single-molecule Scale Magnetic Resonance Spectroscopy using Nitrogen-Vacancy Centers in Diamond [4.4] 量子センシング、特にダイヤモンド構造内の窒素空孔(NV)中心を利用すると、単分子磁気共鳴の道は有望である。
本総説では, 単一分子スケール磁気共鳴における現状について概説する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:40:44 GMT)
Transfer Learning for Deep-Unfolded Combinatorial Optimization Solver with Quantum Annealer [4.2] ディープ・アンフォールディングと呼ばれるディープラーニング技術を用いて、データセットから内部パラメータを最適化する訓練可能なサンプリングベースCOPソルバが提案されている。
本稿では古典的量子移動学習を提案し、古典的パラメータを古典的に訓練し、学習されたパラメータをQAを用いた解法で用いる。
数値実験の結果,古典量子遷移学習を用いたトレーニング可能な量子COPソルバは,元のソルバよりも収束速度と実行時間を向上することを示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:21:13 GMT)
Generative Style Transfer for MRI Image Segmentation: A Case of Glioma Segmentation in Sub-Saharan Africa [4.2] サブサハラアフリカ(SSA)では、低品質磁気共鳴イメージング(MRI)技術が臨床タスクに機械学習手法の適用性に関する疑問を提起している。
本研究の目的は,3倍のアプローチを用いてSSA人口に適した,堅牢な深層学習に基づく脳腫瘍セグメンテーション(BraTS)手法を提供することである。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:48:30 GMT)
Hierarchical Light Transformer Ensembles for Multimodal Trajectory Forecasting [4.2] 階層型光変圧器アンサンブル(HLT-Ens)という新しい手法を提案する。
HLT-Ensは、新しい階層的損失関数を用いて、トランスフォーマーアーキテクチャのアンサンブルを効率的に訓練する。
我々は、HLT-Ensが、広範囲な実験を通して最先端のパフォーマンスレベルを達成することを実証した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:08:19 GMT)
Measuring the Fitness-for-Purpose of Requirements: An initial Model of Activities and Attributes [4.1] 本稿では,要求に影響を及ぼす活動とその属性の初期モデルを提案する。
我々の長期的な目標は、REフェーズのためにフィットネスを最適化する方法に関するエビデンスベースの意思決定支援を開発することです。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:30:04 GMT)
HYB-VITON: A Hybrid Approach to Virtual Try-On Combining Explicit and Implicit Warping [4.1] 仮想トライオンシステムは電子商取引において大きな可能性を秘めており、顧客は自分自身で衣服を視覚化することができる。
既存の画像ベースの手法は、被写体を直接人体にワープする手法と、被写体をクロスアテンションで再構築する手法の2つのカテゴリに分類される。
本稿では,各手法の利点を組み合わせた新しいアプローチであるHYB-VITONを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:24:43 GMT)
Highly efficient nonvolatile magnetization switching and multi-level states by current in single van der Waals topological ferromagnet Fe3GeTe2 [4.1] 情報を電気的に書き込む能力を持つマルチレベルスピンメモリは、スピントロニクスにおける長期の能力である。
バンダーワールス・トポロジカル強磁性体Fe3GeTe2からなる単材料装置において、不揮発性で高エネルギー効率の磁化スイッチを実現する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:29:41 GMT)
The Faetar Benchmark: Speech Recognition in a Very Under-Resourced Language [4.1] Faetarには標準的な正書法がなく、ベンチマークに含まれるもの以外のテキストや音声のリソースはほとんどない。
コーパスはフィールド録音に由来するが、ほとんどはノイズがあり、5時間しか一致した書き起こしがない。
我々は,現在最先端の多言語音声基礎モデルによる電話誤り率30.4%のベースライン結果について報告する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:32:33 GMT)
Crossover Designs in Software Engineering Experiments: Review of the State of Analysis [4.1] Vegasらは、ソフトウェア工学(SE)研究におけるクロスオーバー設計の実践状況についてレビューした。
本稿では,2015年から2024年にかけてのSE出版物におけるクロスオーバー設計実験の現状について概説する。
明確なガイドラインにもかかわらず、有効性に対する脅威は29.5%に過ぎなかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:00:07 GMT)
LMS-AutoTSF: Learnable Multi-Scale Decomposition and Integrated Autocorrelation for Time Series Forecasting [4.1] 自動相関を組み込んだ新しい時系列予測アーキテクチャであるLMS-AutoTSFを紹介する。
事前定義されたトレンドと季節的なコンポーネントに依存するモデルとは異なり、LMS-AutoTSFはスケール毎に2つの独立したエンコーダを使用する。
このアプローチにおける重要な革新は、時間ステップの差分を計算することによって達成される自己相関の統合です。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:16:49 GMT)
Cyber Spectrum Intelligence: Security Applications, Challenges and Road Ahead [4.0] サイバースペクトルインテリジェンス(SpecInt)は、基本的なスペクトルセンシングとエム信号インテリジェンスを超えた概念として登場している
SpecIntは、従来のスペクトルセンシング技術とAI(Artificial Intelligence)と並列処理を統合して、さまざまな周波数で発生した同時事象を抽出および相関する能力を強化する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:29:15 GMT)
A Live Extensible Ontology of Quality Factors for Textual Requirements [3.9] テキスト要求に対する品質要因のオントロジーを提案する。
これには、品質要素と関連する要素をフレーミングする構造と、中央リポジトリとWebインターフェースが含まれる。
我々は、この知識リポジトリを完成させ、維持するための共同コミュニティの取り組みに、仲間の研究者を招待します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:27:07 GMT)
Helping LLMs Improve Code Generation Using Feedback from Testing and Static Analysis [3.9] 大規模言語モデル(LLM)は人工知能分野における最も有望な発展の1つである。
開発者は定期的にLCMにコードスニペットの生成を依頼し、生産性の向上に加えて、オーナシップ、プライバシ、正確性、セキュリティ問題も導入する。
以前の作業では、商用のLLMによって生成されたコードが、脆弱性やバグ、コードの臭いなど、安全でないことが強調されていた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:30:56 GMT)
Entropy-Guided Attention for Private LLMs [3.8] 本稿では,デコーダのみの言語モデルにおける非線形性の役割を特徴付ける情報理論フレームワークを提案する。
本稿では,新しいエントロピー正規化手法と組み合わせたエントロピー誘導型アテンション機構を提案し,エントロピー過負荷を軽減する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:17:47 GMT)
SelectiveFinetuning: Enhancing Transfer Learning in Sleep Staging through Selective Domain Alignment [3.6] 実用的な睡眠段階分類において、重要な課題は、異なる主題や環境にわたる脳波データの変動である。
脳波の特徴を抽出するために,事前訓練された多分解能畳み込みニューラルネットワーク(MRCNN)を用いる。
選択的なソースデータでモデルを微調整することで、SelectiveFinetuningはターゲットドメインにおけるモデルの性能を向上させる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:08:54 GMT)
VOILA: Complexity-Aware Universal Segmentation of CT images by Voxel Interacting with Language [3.6] LAnguage法(VOILA)を用いた汎用CT画像分割のためのVOxel Interactingを提案する。
ボクセルと言語を共有表現空間に整列し、コサイン類似性に基づいてボクセルを分類する。
我々は,フォアグラウンドとバックグラウンドの相違やターゲットボリュームの変化によるクラス不均衡の影響を軽減するために,Voxel-Language Interactionフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:00:58 GMT)
Signatures of a gravitational quantum vacuum on dynamics of massive particles [3.6] 真空状態における2つの大粒子と量子化重力場との相互作用について検討する。
自由粒子の場合、(i) は純粋にユニタリ力学をもたらすが、(ii) は散逸をもたらす。
線形バネを介して結合された2つの粒子に対して、(i)と(ii)は、微分運動モードの周波数シフト調和ラグにおいて異なるカットオフ依存性をもたらす。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:50:45 GMT)
Context-Alignment: Activating and Enhancing LLM Capabilities in Time Series [3.5] 本研究では,Large Language Models (LLMs) に習熟した言語環境において,時系列(TS)データを言語成分と整合させるコンテキストアライメントを提案する。
このようなコンテキストレベルのアライメントは、DSCA-GNN(Dual-Scale Context-Alignment GNN)によって達成される構造的アライメントと論理的アライメントを含む。
大規模な実験は、特に少数ショットおよびゼロショット予測において、DeCAの有効性とタスク間のコンテキストアライメントの重要性を示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:40:35 GMT)
Hardware-In-The-Loop Training of a 4f Optical Correlator with Logarithmic Complexity Reduction for CNNs [3.4] 本研究は,4f光相関器のハードウェア・イン・ループ・トレーニングにより,MNISTデータセットの前方のみの学習アルゴリズムを評価する。
O(n2) の複雑性では 87.6% の精度で、O(n2 log n) の複雑性では 88.8% の精度でバックプロパゲーションを実現している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:09:16 GMT)
Partial-Label Learning with a Reject Option [3.1] 提案手法は,リジェクションオプション付き最寄りのラベル付き部分ラベル学習アルゴリズムを提案する。
提案手法は,非退行予測の数値と精度の最良のトレードオフを提供する。
リジェクションオプションなしで評価すると、最寄りのアプローチも競合予測性能を達成する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:24:34 GMT)
RecKG: Knowledge Graph for Recommender Systems [3.1] 本研究では,レコメンダシステムのための標準知識グラフRecKGを提案する。
RecKGは、さまざまなデータセットにわたるエンティティの一貫性のある表現を保証する。
実世界のデータセットを標準化するためにRecKGを適用し、その後グラフデータベースを用いてRecKGのアプリケーションを開発する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:55:35 GMT)
A note on cyclic MDS and non-MDS matrices [3.1] 1998年、Daemen et al. は、Rijndaelブロック暗号の拡散層にサーキュラントな最大距離分離行列を導入した。
このブロック暗号は、現在ではAESブロック暗号として広く評価されている。
2016年、LiuとSimは循環行列の置換を変更して巡回行列を導入した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:40:12 GMT)
Unwinding NFTs in the Shadow of IP Law [3.1] IP法は、NFT市場におけるコモンズの悲劇やアンチモンといった課題に、より効果的に対処することができる。
NFTコミュニティはまた、共有リソースを規制する既存のIP法に基づいて、独自の規範とライセンス契約を開発した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:06:31 GMT)
Adaptive deep learning framework for robust unsupervised underwater image enhancement [3.1] ディープラーニングベースの水中画像強化における大きな課題の1つは、高品質なトレーニングデータの可用性の制限である。
本研究では、条件付き変分オートエンコーダ(cVAE)を用いて、深層学習モデルのトレーニングを行う、新しい教師なし水中画像強調フレームワークを提案する。
提案手法は, 定量化と定性化の両面において, 他の最先端手法と比較して, 競争性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:32:53 GMT)
Magnetoelectric effect in van der Waals magnets [3.0] 磁力(ME)効果は磁極の電気的制御を表す。
2次元(2次元)のファンダーワール磁石(vdW)が新しい種類の材料として登場した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:34:15 GMT)
Explainable AI model reveals disease-related mechanisms in single-cell RNA-seq data [3.0] 神経変性疾患(NDD)は複雑で、そのメカニズムがよく理解されていないため、治療が不十分である。
本研究では,病気関連遺伝子を同定する手法を実装し,NNモデルとSHAPを併用した疾患進行の機械的説明を行う。
以上の結果から,DGEとSHAPのアプローチは,遺伝子と経路の共通セットと差分セットの両方を提供し,XAI法の有用性を,より広範な疾患の観点で強化することを示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:35:29 GMT)
Graph Learning for Numeric Planning [3.0] 数値計画課題の解法を学習するための,データ効率と解釈可能な機械学習モデルを提案する。
これには、連続属性と分類属性の両方を持つグラフ用の新しいグラフカーネルを構築することが含まれる。
実験により、グラフカーネルはグラフニューラルネットワークよりもはるかに効率的で一般化され、数値計画が可能であることが示された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:33:00 GMT)
A GPU Implementation of Multi-Guiding Spark Fireworks Algorithm for Efficient Black-Box Neural Network Optimization [3.0] 本稿では,Multi-Guiding Spark Fireworks Algorithm (MGFWA)のGPU高速化版を提案する。
スピードとソリューションの品質の両方において、その優れた性能を示します。
提案した実装は、Swarmインテリジェンスアルゴリズムを高速化するための有望なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:09:07 GMT)
CoStruction: Conjoint radiance field optimization for urban scene reconStruction with limited image overlap [2.9] CoStructionは、カメラのオーバーラップが制限された大きな駆動シーケンスに適した、新しいハイブリッドな暗黙的表面再構成手法である。
本手法は, 複雑な都市シナリオにおける微細構造とともに, 大面積の正確な再構成を実現するためのガイド付きサンプリングに加えて, 両方の放射場を共同で最適化する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:48:47 GMT)
Towards Reliable Testing for Multiple Information Retrieval System Comparisons [2.9] 我々は、シミュレーションおよび実TRECデータを用いて、複数の比較手順の信頼性を評価するために、新しいアプローチを用いる。
実験により、ウィルコクソンとベンジャミン・ホックバーグの補正は、典型的なサンプルサイズの重要度に応じてタイプIの誤差率をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:48:21 GMT)
Deep Learning-based Compression Detection for explainable Face Image Quality Assessment [2.8] 顔画像の有用性に悪影響を及ぼすことで知られている品質コンポーネントには、JPEGやJPEG 2000圧縮アーティファクトがある。
ディープニューラルネットワークは、顔画像の圧縮アーチファクトを検出するために訓練される。
検出精度に関しては、トレーニング中にPSNRラベルを利用するために2~3%の誤差率が得られる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:36:46 GMT)
Explainable Time Series Prediction of Tyre Energy in Formula One Race Strategy [2.7] フォーミュラ1(F1)のレース戦略は、高圧で速いペースで行われる。
レース戦略の中核となる2つの決定は、いつピットストップし、どのタイヤ化合物を選ぶかである。
本研究では,メルセデス・AMGPETRONAS F1チームの歴史的なレースデータを用いて,ディープラーニングモデルを訓練した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:38:48 GMT)
Uncovering Latent Chain of Thought Vectors in Language Models [2.6] 本研究では,特定のタスクから派生した「ステアリングベクトル」を用いて,言語モデルの前方通過をバイアスする,ステアリングベクトルの手法について検討する。
自然言語を介さずに思考の連鎖(CoT)推論を行うための言語モデルに適用する。
このアプローチはCoT応答に対して一貫したステアリングをもたらし、CoTへの微調整モデルの従来の方法よりも計算量が少なくなる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:40:42 GMT)
BabyLMs for isiXhosa: Data-Efficient Language Modelling in a Low-Resource Context [2.6] BabyLMの課題は、参加者にサンプル効率の良い言語モデルを開発することであった。
申請は、子供が開発中に露出する単語の量に制限される、固定された英語コーパスで事前訓練された。
データ効率のよい言語モデリングのための新しいアーキテクチャは、数兆ワードで訓練されたモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:13:45 GMT)
VIEWER: an extensible visual analytics framework for enhancing mental healthcare [2.5] VIEWERは自然言語処理とインタラクティブな可視化技術を利用するオープンソースのツールキットである。
英国最大のNHSメンタルヘルストラストの1つで設計され、実装された。
VIEWERは、標準的な臨床情報システムと比較して、性能とタスク完了速度を著しく改善した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:09:13 GMT)
An In-Depth Analysis of Adversarial Discriminative Domain Adaptation for Digit Classification [2.5] 我々は、ADDA(Adversarial Discriminative Domain Adaptation)と呼ばれる特定の逆学習手法を実装している。
以上の結果から,ADDAはドメイン内性能に最小限の影響を伴って,特定のドメインシフトの精度を著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:15:49 GMT)
ALTBI: Constructing Improved Outlier Detection Models via Optimization of Inlier-Memorization Effect [2.4] 外乱検出(英: Outlier detection, OD)とは、特定のデータや今後のデータから異常な観測(または外乱)を識別するタスクである。
Inlier-memorization (IM) 効果は、生成モデルが初期の学習段階において、アウトリーチよりも前のインリーチを記憶することを示唆している。
IM効果を最大限に活用し,UODタスクに対処する理論的原理的手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:11:20 GMT)
Towards Mitigating Architecture Overfitting on Distilled Datasets [2.3] 本稿では,テキストアーキテクチャオーバーフィッティングの問題を緩和するための一連のアプローチを紹介する。
具体的には、DropPathは、大きなモデルをそのサブネットワークの暗黙のアンサンブルとして表現し、知識蒸留により、各サブネットワークが、小さいが、優れた教師ネットワークと同様に振る舞うことが保証される。
テストネットワークがトレーニングネットワークよりも大きい場合、我々のアプローチは同等あるいはそれ以上のパフォーマンスを実現します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:46:02 GMT)
Fast Structured Orthogonal Dictionary Learning using Householder Reflections [2.3] 理論的には($l_infty$の意味で)近似回復を最適計算複雑性で保証する。
我々は,これらの手法をサンプル限定設定で数値的に検証し,既存の手法と同等以上の性能を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:04:13 GMT)
Transfer learning via Regularized Linear Discriminant Analysis [2.3] 本稿では,正規化ランダム効果線形判別分析による新しい伝達学習手法を提案する。
これらの重みの値とそれに伴う分類誤差率を高次元設定で導出する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:46:47 GMT)
Generation from Noisy Examples [2.3] 生成性は、有限個のノイズのある例の存在によってほとんど影響を受けないことが示される。
有限類と可算類に対して、生成性は有限個のノイズのある例の存在によってほとんど影響を受けないことを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:16:14 GMT)
Rescriber: Smaller-LLM-Powered User-Led Data Minimization for Navigating Privacy Trade-offs in LLM-Based Conversational Agent [2.2] Rescriberは、LLMベースの会話エージェントでユーザ主導のデータ最小化をサポートするブラウザエクステンションである。
我々の研究によると、Rescriberはユーザーが不必要な開示を減らし、プライバシー上の懸念に対処するのに役立ちました。
以上の結果から,LLMによる小型ユーザ向けオンデバイスプライバシコントロールの実現可能性が確認された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:20:13 GMT)
Implicit Guidance and Explicit Representation of Semantic Information in Points Cloud: A Survey [2.2] 本稿では、ポイントクラウドにおける意味情報の統合における多様な応用と最近の進歩について概説する。
暗黙的および明示的な表現を包含する点雲における意味情報の二重の役割について検討する。
結論として,ポイントクラウドにおける意味情報を完全に活用する上で,将来発生する可能性のあるいくつかの課題と潜在的な課題について論じる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:54:23 GMT)
All van der Waals three-terminal SOT-MRAM realized by topological ferromagnet Fe3GeTe2 [2.2] 磁気ファンデルワールス(vdW)材料は、学術的関心と過去数年間の応用の可能性から、大きな注目を集めている。
ここでは、Fe3GeTe2(FGT)の巨大内在性SOTの物理原理と、よく知られた産業適応型トンネル磁気抵抗効果(TMR)効果を用いて、全vdW三端子SOTメモリを実現する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:35:54 GMT)
Synthetic Data Privacy Metrics [2.1] 我々は、敵攻撃のシミュレーションを含む人気のある指標の長所と短所を概観する。
また、生成モデルを修正して、作成するデータのプライバシを高めるための現在のベストプラクティスについてもレビューします。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:02:33 GMT)
Stochastic Neural Network Symmetrisation in Markov Categories [2.1] 我々は、群準同型に沿ってニューラルネットワークをシンメトリする問題を考察する。
これをマルコフ圏の項で定式化する。
シンメトリションのためのフレキシブルで構成的な枠組みを得る。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:35:00 GMT)
Unconditional Latent Diffusion Models Memorize Patient Imaging Data: Implications for Openly Sharing Synthetic Data [2.0] 我々は、合成データ生成のためのCT、MR、X線データセット上で潜時拡散モデルを訓練する。
そして,新たな自己教師型コピー検出手法を用いて,記憶したトレーニングデータの量を検出する。
以上の結果から,全データセットにまたがる驚くほど高い患者のデータ記憶が得られた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:53:44 GMT)
Fuzzy Information Entropy and Region Biased Matrix Factorization for Web Service QoS Prediction [2.0] 本稿では,ユーザ情報エントロピーと領域バイアスに基づく行列分解手法を提案する。
ユーザとサービス間の領域バイアスを行列分解に線形に組み込んで、ユーザとサービス間の非インタラクティブな特徴をキャプチャします。
提案手法は, 行列密度が5%から20%の分野において, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:54:25 GMT)
Catch Causal Signals from Edges for Label Imbalance in Graph Classification [2.0] エッジ情報を利用して、元のグラフから因果部分グラフをアンタングルする。
我々の設計は、ラベルの不均衡問題を伴うグラフ分類タスクの性能改善につながる。
我々は,実単語データセット PTC,Tox21,ogbg-molhiv に対するアプローチを評価した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:28:54 GMT)
Gradient descent in materia through homodyne gradient extraction [2.0] ホモダイン検出の原理に基づく簡易かつ効率的な勾配抽出法を示す。
最適化が必要なパラメータを摂動することで、高度に堅牢でスケーラブルな方法で勾配情報を得ることができる。
ホモジン勾配抽出は原則としてアマチュアで完全に実装することができ、自律的に学習する物質システムの開発を促進する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:39:45 GMT)
From Code to Compliance: Assessing ChatGPT's Utility in Designing an Accessible Webpage -- A Case Study [2.0] 本研究では、Webコンテンツアクセシビリティガイドライン(WCAG)に基づき、ChatGPTによるWebページの生成と改善能力を評価する。
ChatGPTは、インシデント時にアクセシビリティの問題に効果的に対処できるが、デフォルトのコードはコンプライアンスを欠いていることが多い。
その結果,ChatGPTの性能は,簡潔さ,構造化されたフィードバックの提供,視覚支援の導入といった効果的なプロンプトエンジニアリングによって著しく向上することがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:51:46 GMT)
Detection, Retrieval, and Explanation Unified: A Violence Detection System Based on Knowledge Graphs and GAT [2.0] 本稿では,TIO(Three-in-One)システムと呼ばれる新しい暴力検出システムを提案する。
システムは、暴力行為の可能性のある動画に対して、大きな言語モデルによって生成されたテキスト記述とともに、各ビデオフレームを処理する。
知識グラフを構築するための高次元埋め込みを生成するためにImageBindを使用し、推論にGATを使用し、ビデオ埋め込み機能を抽出するために軽量な時系列モジュールを適用している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:21:20 GMT)
CL3DOR: Contrastive Learning for 3D Large Multimodal Models via Odds Ratio on High-Resolution Point Clouds [2.0] 高解点雲上でのOdds比による3次元大規模マルチモーダルモデルのコントラスト学習を提案する。
CL3DORは3Dシーン理解と推論のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:42:32 GMT)
HP-BERT: A framework for longitudinal study of Hinduphobia on social media via LLMs [1.9] 新型コロナウイルスのパンデミックの前後におけるX(Twitter)上でのヒンドゥー恐怖症を経時的に分析する悪用検知・感情分析フレームワークを提案する。
この枠組みはヒンドゥー恐怖の言説の流行と強さを評価し、軽蔑的ジョークや人種差別的発言といった要素を捉えている。
調査にはオーストラリア、ブラジル、インド、インドネシア、日本、英国を含む6カ国のツイートが2740万件含まれている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:22:05 GMT)
DeepVIVONet: Using deep neural operators to optimize sensor locations with application to vortex-induced vibrations [1.9] DeepVIVONetは,海面上昇器の渦誘起振動(VIV)の最適動的再構成と予測のための新しいフレームワークである。
本研究は,沖合いの海面上昇船の挙動を時空間計測により正確に再現する際のDeepVIVONetの有効性を実証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:29:10 GMT)
Private, Auditable, and Distributed Ledger for Financial Institutes [1.9] 本稿では,金融機関の基本的なユースケースに容易に適応できる,個人用,監査可能な,分散台帳(PADL)の枠組みを提案する。
PADLは、広く使われている暗号スキームとゼロ知識証明を組み合わせて、テーブルの台帳のようなトランザクションスキームを提案する。
PADLは参加者のプライバシを維持しつつ,スムーズな相互監査を支援する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:21:24 GMT)
Inductive Construction of Variational Quantum Circuit for Constrained Combinatorial Optimization [1.9] 本稿では,変動量子回路を用いた制約付き最適化手法を提案する。
提案手法は施設配置問題に適用され, 実現可能な解や最適解の確率を増大させることが判明した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:35:27 GMT)
Quantum many-body dynamics for fermionic t-J model simulated with atom arrays [1.9] 本稿では,プログラム可能なRydberg-dressed tweezer配列におけるフェルミオンt-Jモデルを実現するための新しいスキームを提案する。
特に、従来の光学格子や銅酸化物をはるかに超えた、大きなJ/t限界における量子多体力学を探求する。
我々の予測は、ツイーザーアレイにおけるt-Jモデルによるエキゾチックな量子多体ダイナミクスの探索において、新たな地平を開く。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:19:57 GMT)
Deploying Open-Source Large Language Models: A performance Analysis [1.8] 本稿では、利用可能なGPUに応じて、異なるサイズの複数のモデルの性能の比較を行う。
この結果から,大規模言語モデルの展開を希望する私的・公的なグループに貴重な情報を提供する。
そこで本研究では,様々なアプリケーション領域における大規模言語モデルの導入と活用の促進に寄与する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:55:57 GMT)
IntelliChain: An Integrated Framework for Enhanced Socratic Method Dialogue with LLMs and Knowledge Graphs [1.8] 本研究では,ソクラテス教育に適したマルチエージェントシステムの設計とコラボレーションの最適化方法について検討する。
この研究は知識グラフを組み込むことによって、特定の教育内容を扱うLLMの能力を高めた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:32:29 GMT)
Efficient Generative Modeling via Penalized Optimal Transport Network [1.8] 本稿では,Wartherally-penalized Wasserstein (MPW) 距離に基づく多目的深部生成モデルを提案する。
MPW距離を通じて、POTNetは、低次元の辺縁情報を利用して、関節分布の全体的アライメントを導出する。
我々は,MPW損失の一般化誤差に基づく非漸近的境界を導出し,POTNetで学習した生成分布の収束率を確立する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:03:08 GMT)
Exploring the Potential of Large Language Models in Public Transportation: San Antonio Case Study [1.8] 本研究では,サンアントニオの交通システムにおいて,公共交通機関の管理に革命をもたらす大規模言語モデル (LLM) の可能性を探る。
経路計画の最適化,待ち時間を短縮し,パーソナライズされた旅行支援を行う能力について検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:18:55 GMT)
Reading with Intent -- Neutralizing Intent [1.8] ほとんどのベンチマークでは、Wikipediaのようなテキストは中立的で事実的なトーンで書かれている。
RAGシステムはインターネットベースのコンテンツを検索すると、様々なトーンと言語スタイルのテキストに遭遇する。
Intentタスクによる読み上げは、コンテキストパスのさまざまなトーンがモデルパフォーマンスにどのように影響するかを評価することでこの問題に対処する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:33:25 GMT)
Discriminative Representation learning via Attention-Enhanced Contrastive Learning for Short Text Clustering [1.7] 我々は,textbfAttention-textbfEnhanced textbfContrastive textbfLによる識別表現学習という,新しいテキストクラスタリング手法を提案する。
実験の結果,提案したtextbfAECL は最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:17:04 GMT)
Data-driven tool wear prediction in milling, based on a process-integrated single-sensor approach [1.7] 本研究では,ツール摩耗予測のためのデータ駆動手法,特にディープラーニングについて検討する。
この研究は、畳み込みニューラルネットワーク(CNN)、長期記憶ネットワーク(LSTM)、サポートベクターマシン(SVM)、決定木など、いくつかの機械学習モデルを評価する。
ConvNeXtモデルには例外的な性能があり、装着するまで操作された4つのミリングツールのデータを用いてツール摩耗を特定する精度は99.1%である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:35:01 GMT)
KCNet: An Insect-Inspired Single-Hidden-Layer Neural Network with Randomized Binary Weights for Prediction and Classification Tasks [1.7] 嗅覚入力は、それぞれの匂いの混合物を符号化する脳の触覚ローブによって受信される。
我々は,入力層と隠蔽層との間の疎結合,ランダム化,二重みを含む単一隠れ層ニューラルネットワークKCNetを提案する。
臭気の知覚特性を予測する臭気知覚タスクに対して、KCNetが既存のデータ駆動アプローチより優れていることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:29:48 GMT)
Implementing Systemic Thinking for Automatic Schema Matching: An Agent-Based Modeling Approach [1.7] 自動マッチングをシステム的・複雑適応システム(CAS)として利用する方法について述べる。
この取り組みにより、Reflex-SMASと呼ばれるスキーママッチング用のツール(プロトタイプ)が誕生する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:52:08 GMT)
Quantum Error Correction Without Encoding via the Circulant Structure of Pauli Noise and the Fast Fourier Transform [1.6] 本研究では,量子コンピュータの出力分布を補正する手法を紹介する。
より物理的な量子ビットへの論理量子ビットの符号化は不要である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:27:13 GMT)
Lessons from complexity theory for AI governance [1.6] 複雑性理論は、政策立案者にとって中心的な課題となるAIの特徴を照らすのに役立つ。
我々は、AI管理の取り組みが深刻な不確実性によってどのように特徴付けられるかを検討する。
我々は,AIガバナンスのタイミングと構造に関して,複雑性に適合する一連の原則を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:56:40 GMT)
An Empirical Study of Accuracy-Robustness Tradeoff and Training Efficiency in Self-Supervised Learning [1.6] 自己教師付き学習(SSL)は画像表現学習が大幅に進歩しているが、効率の課題は継続する。
我々は、画像当たりの作物数を増やすことの重要性を強調し、堅牢なEMP-SSLフレームワークを再考する。
我々は、コストフリーのマルチクロップ自己監視学習(CF-AMC-SSL)を導入して、マルチクロップSSLにおける自由敵トレーニングによるこのアプローチを拡張した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:50:11 GMT)
Minimum Weighted Feedback Arc Sets for Ranking from Pairwise Comparisons [1.6] 最近の研究は、学習に基づく手法を用いてランク付け問題の最先端を推し進めている。
本稿では,MWFASを解くための効率的なアルゴリズムを提案し,ランキング問題に対処する。
実験の結果,これらの単純で学習不要なアルゴリズムは,学習に基づく手法を高速化するだけでなく,より優れたランキング精度が得られることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:12:47 GMT)
Clinical Insights: A Comprehensive Review of Language Models in Medicine [1.5] 本稿では,医療における言語モデルの進歩と応用について考察し,臨床応用事例に着目した。
テキストと視覚データをテキスト内学習を通じて統合することのできる、最先端の大規模言語とマルチモーダルモデルに、広範囲な微調整を必要とする初期エンコーダベースのシステムから進化について検討する。
この分析は、データのプライバシと運用の自律性を向上するローカルデプロイ可能なモデルと、テキスト生成、分類、情報抽出、会話システムといったタスクにおけるそれらの応用を強調している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:34:04 GMT)
A Distributed Hybrid Quantum Convolutional Neural Network for Medical Image Classification [1.5] 本稿では,量子回路分割に基づく分散ハイブリッド量子畳み込みニューラルネットワークを提案する。
量子回路分割に基づく分散技術を統合することにより、8量子ビットQCNNは5量子ビットのみを用いて再構成できる。
本モデルは,2次・複数分類タスクの3つのデータセットにまたがる高い性能を実現する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:58:40 GMT)
Experimental Test of Quantum Nonlocality from Contextuality [1.4] ベルの不等式は状態に依存しない文脈性集合によって破られる。
両部フォトニック系における軌道角運動量エンタングルメントを用いて非局所性を生成する新しい方法を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:29:10 GMT)
Generating and Detecting Various Types of Fake Image and Audio Content: A Review of Modern Deep Learning Technologies and Tools [1.4] 本稿では,ディープフェイクの発生・検出技術について概観する。
ディープフェイクはプライバシー、セキュリティ、民主主義に重大な脅威をもたらす。
本研究では,顔交換,音声変換,再現,唇同期など,様々なディープフェイク手法について検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:44:45 GMT)
Scam Detection for Ethereum Smart Contracts: Leveraging Graph Representation Learning for Secure Blockchain [1.4] グラフ表現学習を用いて、購入傾向を観察し、不正取引を見つける。
革新的な機械学習バージョンを使用して、請求データをグラフ構造に変換することで、強力な分類性能を実現することができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:47:00 GMT)
An LSTM-based Test Selection Method for Self-Driving Cars [1.3] 本研究は、自動運転車の車線維持システムにおけるテスト選択問題に対処する。
角度や長さなどの道路セグメントの特徴を抽出し,シーケンスとして処理した。
提案したモデルと機械学習ベースのテストセレクタを比較した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:44:06 GMT)
Qudit Clauser-Horne-Shimony-Holt Inequality and Nonlocality from Wigner Negativity [1.2] ウグナー負性性は、キュディット系における非局所性に必要であることを示す。
指定された安定化状態は、ウィグナー負性度に基づいて全てのキュディ状態の不等式を極大に違反する。
また、両部が絡み合ったキュディット状態が、ウィグナーの負性を示すときに、文脈性の証人として機能することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:05:38 GMT)
MedFocusCLIP : Improving few shot classification in medical datasets using pixel wise attention [1.2] 本稿では,CLIP(Contrastive Language- Image Pretraining)における視覚的エンコーダを支援する視覚的プロンプトキューとして,Segment Anything Model 2(SAM2)の高度なセグメンテーション機能を活用することを提案する。
これにより、視覚的に類似したバックグラウンド機能に気を散らすことなく、非常に差別的な領域に集中することができる。
提案手法は,X線,CTスキャン,MRI画像など多種多様な医療データセットを用いて評価し,提案手法の精度(71%,81%,86%,58%)を報告する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:49:12 GMT)
Deep Networks are Reproducing Kernel Chains [1.2] 我々は、ディープニューラルネットワーク関数がニューラルcRKBS関数であることを証明し、逆に有限データセット上で定義されたニューラルcRKBS関数はディープニューラルネットワークに対応する。
このアプローチは経験的リスク最小化問題に対するスパースソリューションを提供し、N$はデータポイントの数である1層あたりのニューロンに限らない。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:01:24 GMT)
BERTopic for Topic Modeling of Hindi Short Texts: A Comparative Study [1.2] 本研究では,ヒンディー語短文のモデル化におけるBERTopicの性能について検討する。
コンテキスト埋め込みを使用することで、BERTopicはデータのセマンティックな関係をキャプチャし、従来のモデルよりも効果的になる可能性がある。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:53:35 GMT)
Gradient descent inference in empirical risk minimization [1.2] 勾配降下法は、現代の統計学習において最も広く使われている反復アルゴリズムの1つである。
本稿では,多種多様な経験的リスク最小化問題における勾配降下の精度,非漸近的特性について述べる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:49:09 GMT)
A Multimodal Lightweight Approach to Fault Diagnosis of Induction Motors in High-Dimensional Dataset [1.1] 誘導電動機(IM)の正確なAIベースの診断システムは、プロアクティブなメンテナンスを強化し、計画外のダウンタイムを軽減し、産業環境における全体的なメンテナンスコストを抑制する可能性を秘めている。
研究者らは、信号処理(SP)、機械学習(ML)、ディープラーニング(DL)、BRB故障のハイブリッドアーキテクチャを用いた様々な故障診断手法を提案している。
本稿では,1,2,3,4のBRB断層を電流信号と振動信号データを用いて診断するために,ShuffleNetV2というトランスファーラーニングに基づく軽量DLモデルを用いて,BRB断層の大規模データを実装する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:40:11 GMT)
Localizing AI: Evaluating Open-Weight Language Models for Languages of Baltic States [1.1] ローカルにデプロイ可能なオープンウェイトLLMがより少ない言語をサポートする範囲を評価する。
Llama3, Gemma2, Phi, NeMoの多言語オープンウェイトモデルのサイズと精度について検討した。
これらのモデルは、最先端の翻訳性能に近づきつつも、少なくとも20語に1回は誤りのある語彙幻覚を起こす傾向にある。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:24:17 GMT)
Critical properties in the non-Hermitian Aubry-Andre-Stark model [1.1] 準周期およびスタークポテンシャルを持つ非エルミートオーブリー・アンドルー・スターク(AAS)モデルにおける局所化遷移の臨界特性について検討する。
有限サイズのスケーリング形式を数値的に検証し,異なる状況下で臨界指数を抽出する。
我々の結果は、エルミート的および非エルミート的 AAS, Aubry-Andre, Stark 模型が異なる普遍性クラスに属することを示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:35:31 GMT)
Learning Lipschitz Operators with respect to Gaussian Measures with Near-Optimal Sample Complexity [1.0] ガウス測度に関して,リプシッツ作用素の近似を期待して検討する。
この研究の主な焦点は、有限個の点標本からリプシッツ作用素の回復である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:07:33 GMT)
Investigating the Impact of Data Selection Strategies on Language Model Performance [1.0] 本研究では,異なるデータ選択手法と特徴型がモデル性能に与える影響について検討する。
我々は,データサブセットの選択が下流タスクに影響を及ぼすか,n-gram特徴が目標分布との整合性を改善するか,埋め込み型ニューラルネットワーク特徴が相補的な利点をもたらすかを評価する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:38:49 GMT)
Interpretable Auto Window Setting for Deep-Learning-Based CT Analysis [0.9] CT (Computed Tomography) におけるウィンドウ設定は, 常にCT解析プロセスにおいて欠かせない部分であった。
本稿では,Tanhアクティベーション関数から派生したプラグイン・アンド・プレイモジュールを提案する。
提案手法の有効性を複数のオープンソースデータセットで検証し,ハードセグメントの目標に対して10%200%のDice改善を実現した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:15:03 GMT)
Deep Learning-based Accelerated MR Cholangiopancreatography without Fully-sampled Data [0.8] 本研究の目的は,3Tおよび0.55Tのディープラーニング(DL)を用いたMRCP(MRCP)の獲得を加速することであった。
我々は,3Tで得られた6倍アンダーサンプルデータを用いて,教師付き(SV)と自己教師付き(SSV)の2つの異なるトレーニング戦略を用いてDL再建を訓練した。
DL再建では3T/0.55TでMRCPの平均取得時間を599/542から255/180秒に短縮した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:46:25 GMT)
Extending Internet Access Over LoRa for Internet of Things and Critical Applications [0.8] ILoRaは、LoRaのバックボーンネットワークを介して、インターネット上のアプリケーションプログラミングインタフェース(API)とWebページへのアクセスを可能にする。
本研究はILoRaの提案と実装を行い,本質的なサービス提供のために公共インターネットを非接続領域に拡張する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:47:49 GMT)
Security by Design Issues in Autonomous Vehicles [0.8] この研究は、AVのコンテキストにおいて、物理的、サイバー、コーディング、コミュニケーションの各側面にまたがる多様なセキュリティレイヤの概要を概説する。
我々は、潜在的な攻撃ベクトルに対する潜在的な解決策に関する洞察を提供し、自動運転車が進化する脅威の風景の中で安全でレジリエントであることを保証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:24:11 GMT)
An Integrated Deep-Cryogenic Temperature Sensor in CMOS Technology for Quantum Computing Applications [0.8] 超伝導(SC)薄膜の臨界電流の温度依存性に基づいて,CMOS技術におけるサブ-1K温度センサを提案する。
回路は1.5uWを放出し、15mK以下の環境温度で動作し、温度分解能は10mK以下である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:25:33 GMT)
Performance of Practical Quantum Oblivious Key Distribution [0.8] 本稿では,ランダム化量子オブリバスト転送の実用的な実現法を提案する。
このプロトコルは、識別不能なセキュリティの概念の下で安全であることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:24:06 GMT)
Interesting Scientific Idea Generation using Knowledge Graphs and LLMs: Evaluations with 100 Research Group Leaders [0.7] 我々は,5800万件の研究論文と大規模言語モデルを用いて研究アイデアを生成するSciMuseを紹介した。
我々は、100以上の研究グループのリーダーが興味に基づいて4,400以上のパーソナライズされたアイデアをランク付けする大規模な評価を行う。
このデータにより,(1)人間の評価に基づいて訓練された教師付きニューラルネットワーク,(2)大規模言語モデルを用いた教師なしゼロショットランキングを用いて,研究の関心を予測できる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:29:45 GMT)
Forecasting high-impact research topics via machine learning on evolving knowledge graphs [0.7] 我々は、研究者がこれまでに出版したことのないアイデアの発症の影響を予測する方法を示す。
我々は、2200万以上の科学論文から構築された大きな進化した知識グラフを開発した。
機械学習を用いることで、進化するネットワークのダイナミックな未来を高精度で予測できる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:19:30 GMT)
Examining Popular Arguments Against AI Existential Risk: A Philosophical Analysis [0.7] メディアが広く報道されているにもかかわらず、既存のリスク談話に対する懐疑論は学術文献で限られた厳格な扱いを受けている。
本稿では,既存のリスクの観点からの3つの共通論点を再構築し,評価する。
よりバランスのとれた学術談話とAI研究のための基盤を提供することを目標としている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:15:26 GMT)
Multimodal Machine Learning Can Predict Videoconference Fluidity and Enjoyment [0.7] ビデオ会議は、しばしば対人会話の流動性と楽しみを欠いている。
本研究では、マルチモーダル機械学習を利用して、ビデオ会議におけるネガティブな経験の瞬間を予測する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:34:22 GMT)
Data Augmentation for Deep Learning Regression Tasks by Machine Learning Models [0.6] 本稿では,回帰タスクにおける深層学習(DL)モデルの性能向上を目的とした各種データ拡張(DA)手法の提案と評価を行う。
我々は、既存の観測を重複させる単純な方法から、データの基盤となる統計的関係を保存するより洗練されたDA戦略まで、さまざまなDA戦略によるニューラルネットワークの性能向上を比較した。
これらのDA戦略の有効性は、30の異なるデータセットで厳格に検証され、複数のイテレーションと3つの異なる自動ディープラーニング(AutoDL)フレームワークを使用した評価が行われた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:40:02 GMT)
Adapting coherent-state superpositions in noisy channels [0.6] 量子非ガウス状態は非線形ボゾン系の基本的な理解に不可欠である。
本研究では,不斉熱損失チャネルの列に対するコヒーレント状態の重ね合わせを適切なスキューズ操作により最適に保護することを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:19:29 GMT)
Standardness Clouds Meaning: A Position Regarding the Informed Usage of Standard Datasets [0.5] 我々は、標準データセットの非批判的な使用に反対し、代わりに彼らの批判的な試験を提唱する。
MNISTデータセットに対して、ラベルが適切に定義されていることを実証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:26:47 GMT)
Simplified projection on total spin zero for state preparation on quantum computers [0.5] 本稿では,多体系のJ=0$状態に投影する簡単なアルゴリズムを提案する。
このアプローチは、単体演算子$J_x$と$J_z$を使って、必要なプロジェクションを実行する。
ゲートの複雑さが小さくなると、この手法は偶数核の近似基底状態を作るのに使うことができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:41:39 GMT)
Temporal Feature Weaving for Neonatal Echocardiographic Viewpoint Video Classification [0.5] 画像分類よりも視点分類を映像分類として扱う方が有利であることを示す。
本稿では,CNN-GRUアーキテクチャを時間的特徴織り方式で提案する。
この分野での今後の取り組みと開発を促進するため、新生児心エコー図データセットを公開します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:05:24 GMT)
Highly sensitive temperature sensing via quadratic optomechanical coupling [0.5] 本研究では,QOM系を強い外界で駆動することにより,機械的感受性を著しく向上させることができることを示す。
メカニカル共振器を光モードに2次結合した高感度温度センサを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:26:04 GMT)
Follow The Approximate Sparse Leader for No-Regret Online Sparse Linear Approximation [0.5] 我々は, 与えられた測定行列の列の線形結合の観点から, 測定列の最良のスパース近似を予測できるような, テキストトンラインスパース線形近似の問題を考察する。
本稿では、このオンライン問題に対処するための効率的なオンラインメタ政治であるFollow-The-Approximate-Sparse-Leaderを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:32:19 GMT)
CI at Scale: Lean, Green, and Fast [0.5] SubmitQueueは、ビルドを投機的に実行し、結果が成功すると変更のみをランドするように設計されたシステムである。
本稿では、リソース使用量の最適化とビルド優先順位の改善に重点を置いたSubmitQueueの拡張について紹介する。
我々は、継続的インテグレーション(CI)リソース使用量を約53%削減し、CPU使用量を44%削減し、P95待ち時間を37%削減した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:04:29 GMT)
Leveraging Hamiltonian Simulation Techniques to Compile Operations on Bosonic Devices [0.4] 特定の操作のクラスを実現するために,厳密に証明されたエラー境界を用いた解析的手法を提案する。
本研究は、ハイブリットボソン量子ビットデバイスをよりよく制御するために、ハミルトンシミュレーションの手法を適用する方法を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:55:48 GMT)
Feasibility of short blocklength Reed-Muller codes for coset coding over real environment [0.4] 我々は、RM符号の階層構造を利用してデータ伝送をセキュアにするためのコセット符号化方式を実装した。
実験結果から,RM符号は実世界のチャネル障害の影響を受けても堅牢なセキュリティを実現することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:33:44 GMT)
Enhancing the automatic segmentation and analysis of 3D liver vasculature models [0.4] 静脈木 - 門脈(開口)と肝(乾燥)の木は、肝解剖学と疾患状態を理解するのに重要である。
本研究の目的は, 血管の3次元分割, 骨格化, およびその後の解析を改善することである。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:31:00 GMT)
TOAST Framework: A Multidimensional Approach to Ethical and Sustainable AI Integration in Organizations [0.4] 本稿では,TOAST(Trustworthy,Optimized,Adaptable,Socio-Technologically harmonious)フレームワークを紹介する。
信頼性、説明責任、技術的進歩、適応性、社会技術的調和に焦点を当てている。
医療ケーススタディにおけるTOASTフレームワークの基盤として,本論文は,その実用性と理論的健全性について,頑健な評価を提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:13:39 GMT)
Flux pinning in superconducting multilayer 2H-NbSe$_2$ nano-step junction [0.3] 超伝導体は、有限バイアスや磁場条件下であっても、散逸のない超電流を示す。
II型超伝導体における超電流とオーミック散逸の相互作用は、渦運動と渦ピンニング力の頑健さによって予測される。
2H-NbSe$$$の原子状薄型2H-NbSe超伝導体における超伝導相転移と渦ダイナミクスの実験的検討を行った。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:09:49 GMT)
End-to-end switchless architecture for fault-tolerant photonic quantum computing [0.3] フォトニクスは、数百万の量子ビットと数十億のゲートを持つ大規模量子計算における最も有望なアプローチの1つである。
本稿では,受動オンチップコンポーネントのみを用いたフォールトトレラント連続変数(CV)量子計算のエンドツーエンドアーキテクチャを提案する。
このアーキテクチャは低光子数分解能しか必要とせず、CV量子コンピューティングにおける高帯域光検出器の利用を可能にする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:21:46 GMT)
Zeno Freezing and Anti-Zeno Acceleration of the Dynamic Evolution of Acoustic Topological Boundary States [0.3] 量子測定は、システムのダイナミクスを効果的に凍結したり、状態間の遷移を増強することで量子状態を制御するために用いられる。
ここでは、位相境界状態の動的進化は、量子ライクな測定(QLM)によって制御できることを示す。
その結果,QLMはトポロジカルな状態と波動伝搬を操作する汎用ツールとして注目されている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:45:49 GMT)
Matrix Calculus (for Machine Learning and Beyond) [0.3] このコースはより一般的なベクトル空間上の函数への微分積分の拡張を導入する。
大規模最適化や機械学習といった実用的な計算応用を強調している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:38:35 GMT)
3D $\mathcal{N}=1$ supergravity from Virasoro TQFT: Gravitational partition function and Out-of-time-order correlator [0.2] 球面とトーラスの分割関数を超ビラソーロTQFTを用いて計算する。
我々は、内積がヒルベルト空間の状態として定義される超共形ブロックに対して成り立つことを証明して形式主義を実証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:51:40 GMT)
IntegrityAI at GenAI Detection Task 2: Detecting Machine-Generated Academic Essays in English and Arabic Using ELECTRA and Stylometry [0.2] 本研究は、アラビア語と英語の学術エッセイにタイポメトリックな特徴を取り入れた、事前訓練されたトランスフォーマーベースのモデルを利用する。
F1スコア99.7%、イングランド・サブタスク26チーム中2位98.4%、アラビア・サブタスク23チーム中1位となった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:19:56 GMT)
From Resource Control to Digital Trust with User-Managed Access [0.2] UMAは、利用制御とトランザクションのコンテキスト化に関する多くの要件を達成できる。
制御の委譲と利用ポリシーの取り消しに対処するために、追加の仕様が必要である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:25:14 GMT)
BTMTrack: Robust RGB-T Tracking via Dual-template Bridging and Temporal-Modal Candidate Elimination [0.2] RGB-Tトラッキングのための新しいフレームワークであるBTMTrackを提案する。
このアプローチの核心は、デュアルテンポレートバックボーンネットワークとTMCE(Temporal-Modal Candidate Elimination)戦略にあります。
提案手法は,LasHeRテストセットの72.3%精度とRGBT210およびRGBT234データセットの競合結果を用いて,最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:32:48 GMT)
Multi-label Cross-lingual automatic music genre classification from lyrics with Sentence BERT [0.1] 本稿では sBERT が生成した多言語文の埋め込みに基づく多言語ジャンル分類システムを提案する。
重なり合う8つのジャンルを持つバイリンガル・ポルトガル語・英語のデータセットを用いて、ある言語で歌詞を訓練し、別の言語でジャンルを予測する能力を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:22:35 GMT)
(De)-Indexing and the Right to be Forgotten [0.1] 忘れられる権利(RTBF)により、個人は、時代遅れまたは有害な情報を公共アクセスから削除するよう要求することができる。
本稿では,情報検索(IR)とデインデクシング(de-indexing)の概念を導入することを目的とする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:46:34 GMT)
MHGNet: Multi-Heterogeneous Graph Neural Network for Traffic Prediction [0.1] MHGNetは、多元グラフをモデリングするための新しいフレームワークである。
STDモジュールはシングルパターンのトラフィックデータをマルチパターンのトラフィックデータに分離する。
Node Clustererは、ノード間のユークリッド距離を利用して、O(N)時間複雑さでクラスタリングを実行する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:10:09 GMT)
Can Explainable AI Assess Personalized Health Risks from Indoor Air Pollution? [0.1] 既存の研究は主に監視に重点を置いており、室内汚染源をピンポイントする精度に欠けていた。
143名の被験者を対象に調査を行ったところ,室内大気汚染に対する意識は限定的であった。
本手法では,決定木,ランダムフォレスト,ナイーブベイズ,SVMモデルを統合し,決定木を用いて99.8%の精度で精度を向上する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:37:13 GMT)
Can Deep Learning Trigger Alerts from Mobile-Captured Images? [0.1] 本研究は,データ拡張手法の検証,大気質予測のためのCNNに基づく回帰モデリング,モバイル技術によるユーザ中心の大気質モニタリングに寄与する。
提案システムは,個人が情報的環境衛生と幸福な意思決定を行うための実践的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:39:43 GMT)
A study on performance limitations in Federated Learning [0.1] 本研究は, 通信ボトルネックとデータ非ID性に着目し, モデルの性能に与える影響について検討する。
Googleは2016年にフェデレートラーニングを導入した。
このプロジェクトは、通信ボトルネックとデータ非ID性、およびモデルの性能への影響に焦点を当てる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:35:41 GMT)
Multilingual Open QA on the MIA Shared Task [0.0] 言語間情報検索(CLIR)は、クエリが異なる低リソースの言語でポーズされている場合でも、任意の言語で関連するテキストを見つけることができる。
オープンな質問応答における経路検索を改善するための,シンプルで効果的な再ランク付け手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:43:09 GMT)
Vision Language Models as Values Detectors [0.0] 本稿では,最先端の大規模言語モデルと人間のアノテータのアライメントについて検討する。
我々は、様々な国内シナリオを描いた12枚の画像を作成し、各画像のキー要素を特定するために14個のアノテーションを登録した。
GPT-4oおよび4つのLLaVA変異体を含む5種類のLLMの出力と比較した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:37:57 GMT)
Zoning in American Cities: Are Reforms Making a Difference? An AI-based Analysis [0.0] 本研究では,形式ベースコード(FBC)の導入と影響について検討する。
FBCは、持続可能な、コンパクトで、複合用途の都市形態を促進することを目指している。
FBCの原則を示す言語パターンを特定するため,2000以上の国勢調査指定地域から区分けされた文書を分析した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:03:38 GMT)
Wigner Function of Observed Quantum Systems [0.0] ウィグナー関数は、古典的な統計力学から受け継がれた道具を用いて量子力学的場を記述する試みとして導入された。
ウィグナー関数は、たとえ検出が有限スペクトル分解能を持つとしても、放射場の量子性を公開することができることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:49:01 GMT)
Where AI Assurance Might Go Wrong: Initial lessons from engineering of critical systems [0.0] クリティカルシステムの観点からは、AIセーフティフレームワークの開発と実装をサポートする可能性がある。
システムとは何か?どのくらい良いのか?
我々は,アシュアランス2.0に基づく保証事例の活用を提唱し,決定の臨界性とシステムの臨界性を評価する意思決定を支援する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:02:23 GMT)
Wavelet-Driven Generalizable Framework for Deepfake Face Forgery Detection [0.0] Wavelet-CLIPは、ウェーブレット変換とViT-L/14アーキテクチャに由来する機能を統合したディープフェイク検出フレームワークで、CLIP方式で事前トレーニングされている。
提案手法は,データ間一般化における平均AUC0.749,不明瞭なディープフェイクに対するロバスト性0.893を達成し,優れた性能を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:44:48 GMT)
Universal topological quantum computing via double-braiding in SU(2) Witten-Chern-Simons theory [0.0] 我々は、$k geq 3, k neq 4$に対して、トポロジカル量子コンピューティングでは1/2$が普遍的であることを示す。
1つの量子ビットの場合、そのような任意の2重層は、既に普遍的であるというより強い結果が証明される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:21:29 GMT)
Universal perspective on nonadiabatic quantum control [0.0] 量子系の2つの任意の状態を結ぶ安定かつ高速な経路は、一般に状態工学プロトコルに必要である。
我々は、時間依存ハミルトニアンを対角化できるアンシラリー図を用いた普遍的な制御フレームワークを構築する。
我々の研究は、有限次元の時間依存量子システムに対して、フルランクの時間進化演算子を提供することができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:34:29 GMT)
Unifying error-correcting code/Narain CFT correspondences via lattices over integers of cyclotomic fields [0.0] シンクロトミック場$Q(zeta_p)$$(zeta_p=efrac2pi ip)$ for general prime $pgeq 3$。
このコードラッチ構造は、三次符号に対するコンストラクションA$_C$や、(後述の一般化後の)バイナリコードのためのコンストラクションAのような、よりよく知られたものの一般化である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:24:25 GMT)
Ultra-cold atoms as quantum simulators for relativistic phenomena [0.0] 本稿の目的は、超低温原子を量子シミュレータとして用いることについての展開をレビューすることである。
この雑誌の読者にとって最も興味深いのは、相対論的量子現象である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:47:08 GMT)
Two transitions in complex eigenvalue statistics: Hermiticity and integrability breaking [0.0] 開量子系は複素エネルギー固有値を持ち、非エルミート確率行列統計に従うことが期待される。
我々は,多体量子スピン鎖Hermitian XXZ Heisenberg模型のスペクトル特性について検討した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:58:58 GMT)
Topology-based deep-learning segmentation method for deep anterior lamellar keratoplasty (DALK) surgical guidance using M-mode OCT data [0.0] 本研究では,トポロジ的損失関数と改良型ネットワークアーキテクチャを統合した,トポロジに基づくディープラーニングセグメンテーション手法を提案する。
このアプローチは、ノイズの効果を効果的に低減し、セグメンテーション速度、精度、安定性を改善する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:57:15 GMT)
Thermodynamics of coupled time crystals with an application to energy storage [0.0] 相互作用する2つの境界時間結晶の熱力学とゆらぎ挙動について検討する。
理論的導出を利用して、時間結晶の量子電池としての応用の可能性を探る。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:00:47 GMT)
The Solo Revolution: A Theory of AI-Enabled Individual Entrepreneurship [0.0] 本稿では,人工知能技術が個人の起業能力をいかに変えるかを説明する理論的枠組みを提案する。
このフレームワークは、AI能力が進歩し続けるにつれて、起業家精神理論、組織設計、市場構造に重大な影響を与えることを示唆している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 01:34:13 GMT)
The Race to Efficiency: A New Perspective on AI Scaling Laws [0.0] 我々は、古典的なAIスケーリング法則を拡張する時間と効率を意識したフレームワークを導入する。
私たちのモデルでは、継続的な効率向上がなければ、高度なパフォーマンスは何千年ものトレーニングや非現実的な大規模なGPUフリートを必要とする可能性がある。
このレースを効率性にフォーマルにすることで、AIスタック全体の漸進的な改善と、フロントエンドGPU投資のバランスをとるための定量的ロードマップを提供します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:36:22 GMT)
Temperature-Dependent Optical Constants of Nanometer-thin Flakes of Fe(Te,Se) Superconductor in the Visible and Near-Infrared Regime [0.0] 単一結晶から剥離したナノメートル厚Fe(Te,Se)フレークの複素平面屈折率測定
可視から近赤外域における高い消光係数は、ナノメートルの薄いFe(Te,Se)を光検出のための有望な材料にする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:13:38 GMT)
Synthetic Data for Portfolios: A Throw of the Dice Will Never Abolish Chance [0.0] 本稿では、特にポートフォリオやリスクマネジメントにおいて、生成モデルの限界についてより深く理解することを目的としている。
私たちは、モデル開発の分離不能な性質と、パラドックスに触れることで望ましいユースケースを強調します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:50:24 GMT)
Symmetry and Generalisation in Machine Learning [0.0] 等変でない任意の予測器に対して、全ての回帰問題に対するテストリスクが厳格に低い同変予測器が存在することを示す。
我々は別の視点を採用し、不変モデルによる学習が軌道代表者の問題に還元されるという共通の直観を定式化する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:14:58 GMT)
Strong and weak symmetries and their spontaneous symmetry breaking in mixed states emerging from the quantum Ising model under multiple decoherence [0.0] 一次元横フィールドイジングモデル(TFIM)に適用された2種類のデコヒーレンス間の相互作用によって生じる現象について検討する。
TFIMの基底状態から様々な混合状態が出現する。
この研究では、Z$対称性の強さと弱さが重要な役割を担い、効率的な順序パラメータを導入する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:23:59 GMT)
Spin and Density Modes in a Binary Fluid of Light [0.0] 光の超流動二成分混合系におけるスピンおよび密度モードの実験的観察について述べる。
レーザーの2つの円偏光成分を非直線熱原子蒸気を介して同軸限界に伝播させることにより、反発相互作用を有する可溶性ボース・ボース混合物を得る。
両偏光の強度と位相を制御することにより、混合の基本モードを選択的に励起することができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:59:02 GMT)
Spin Environment of a Superconducting Qubit in High Magnetic Fields [0.0] 量子非復号化リードアウトとアクティブフィードバックを備えた超伝導量子ビットは、情報エンジンとして使用できる。
グラニュラーアルミニウムナノ接合フラクソニウム(グラルモニウム)のスペクトルとコヒーレンスをTesla以外の分野に耐性を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:51:28 GMT)
Self-Adaptive ERP: Embedding NLP into Petri-Net creation and Model Matching [0.0] 本研究では,企業プロセスモデルとシステム利用分析を用いたカスタマイズを自動化する自己適応ERPフレームワークを提案する。
このフレームワークは、Design Science Research (DSR) と Systematic Literature Review (SLR) を使って構築され、手動による調整への依存を減らす。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:01:59 GMT)
SPECTRE: A Hybrid System for an Adaptative and Optimised Cyber Threats Detection, Response and Investigation in Volatile Memory [0.0] 本研究は,脅威検出,調査,可視化の促進を目的としたモジュール型サイバーインシデント対応システムであるSPECTREを紹介する。
認証ダンピングや悪意のあるプロセスインジェクションといった現実的な攻撃シナリオを安全に再現し、制御された実験を行う。
SPECTREの高度な視覚化技術は、生のメモリデータを実用的な洞察に変換し、Red、Blue、Purpleのチームが戦略を洗練し、脅威に効果的に対応できるようにする。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:05:27 GMT)
SCC-YOLO: An Improved Object Detector for Assisting in Brain Tumor Diagnosis [0.0] 我々は,SCConvアテンション機構をYOLOv9に統合し,新しいSCC-YOLOアーキテクチャを開発した。
SCC-YOLOは脳腫瘍検出の最先端に到達した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:45:39 GMT)
Run-and-tumble chemotaxis using reinforcement learning [0.0] 細菌細胞は、環境中の誘引的な濃度勾配を上昇させるためにラン・アンド・タンブル運動を使用する。
これを動機として,エージェントが1次元に移動し,誘引的勾配が存在する場合の強化学習アルゴリズムを定式化する。
RLの戦略は、異なる種類の誘引的環境において最もよく機能する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:34:12 GMT)
Response to "The measurement postulates of quantum mechanics are not redundant" [0.0] これらの理論のそれぞれがヒルベルト空間の光線ではない純粋状態を含むことを証明している。
また、これらの選択肢が混合状態の有限次元性に反することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:49:45 GMT)
Resonance fluorescence spectra of a driven Kerr nonlinear resonator [0.0] 我々は、Kerr非線形共振器の蛍光スペクトルの特徴を導出する。
超伝導カー非線形共振器の共鳴蛍光スペクトルを実験的に測定した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:54:52 GMT)
Reinforcement Learning for an Efficient and Effective Malware Investigation during Cyber Incident Response [0.0] 本研究は、強化学習RLを用いた事故後マルウェア鑑定の強化に焦点を当てた。
本研究は,ポストインシデント調査モデルと,ポストインシデント調査の迅速化を目的としたMDPポストインシデントマルウェア調査モデルとフレームワークを提案する。
次に,提案フレームワークにおける構造化MDPに基づくRLマルウェア調査モデルを実装した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:04:51 GMT)
Reducing PEC Overhead by Pauli Error Propagation [0.0] 量子エラー軽減は、短期的な量子ユーティリティへのパスとみなされる。
本稿では,クリフォード回路上でのPECのサンプリングオーバーヘッドを低減する手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:37:23 GMT)
Quantum-Enhanced Conformal Methods for Multi-Output Uncertainty: A Holistic Exploration and Experimental Analysis [0.0] 本稿では,多出力分布に対する量子共形法を統一的に活用する手法を提案する。
多出力回帰モデルと共形予測を組み合わせることで、シミュレーションされた量子データと測定データの両方において、カバレッジと間隔セットのサイズを検証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:00:07 GMT)
Quantum information in Riemannian spaces [0.0] この研究は情報理論、幾何学、量子物理学の概念を橋渡しする。
連続および曲線化されたサンプル空間における量子情報の研究に体系的なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:55:14 GMT)
Quantum entanglement as an extremal Kirkwood-Dirac nonreality [0.0] 量子エンタングルメントとKirkwood-Dirac(KD)準確率の異常/非古典的非現実値の関係を論じる。
我々はまず、KD準確率の非現実性に基づいて、純二部体状態に対する絡み合いモノトンを構築する。
次に、凸屋根拡張を用いて、汎用量子状態のための二部構造エンタングルメントモノトンを構築する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:53:30 GMT)
Quantum One-Time Memories from Stateless Hardware, Random Access Codes, and Simple Nonconvex Optimization [0.0] 本稿では,古典的アクセス可能なステートレスハードウェアを用いたワンタイムメモリ(OTM)の構築について述べる。
上記のアプローチとは異なり、我々のアプローチは2つの古典ビットを符号化するためにQRAC(quantum random access code)を利用する。
ハードウェアに対する多くの古典的なクエリに対して、健全さを証明します。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:29:33 GMT)
Quantum Electrodynamics of graphene Landau levels in a deep-subwavelength hyperbolic phonon polariton cavity [0.0] 本研究では, グラフェンランダウの量子電気力学に関する理論的枠組みを構築した。
ポーラリトンの発生について論じ、共鳴量子真空効果の寄与を純粋に静電相互作用の寄与と区別する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:45:55 GMT)
Practical Secure Inference Algorithm for Fine-tuned Large Language Model Based on Fully Homomorphic Encryption [0.0] 完全同型暗号化(FHE)と証明可能なセキュリティ理論とFine-Tuning(PEFT)を組み合わせて,大規模言語モデルの効率的かつセキュアな推論手法を提案する。
本稿では,オープンソースのChatGLM2-6Bを,LoRAによって微調整されたベースモデルとして利用する。
実験結果から,提案方式の予測効率は1.61s/に向上した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:36:41 GMT)
Powerful Design of Small Vision Transformer on CIFAR10 [0.0] ViT(Vision Transformers)は大規模なデータセットで顕著な成功を収めているが、小さなデータセットのパフォーマンスはCNNに劣ることが多い。
本稿では、CIFAR-10をベンチマークとして、小さなデータセットに対するTiny ViTの設計と最適化について検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 00:41:34 GMT)
Photonic quantum generative adversarial networks for classical data [0.0] 生成学習では、ターゲットデータの分布に従う新しいサンプルを作成するためにモデルが訓練される。
線形光回路とフォック空間符号化に基づく量子GANを提案する。
単一光子量子プロセッサ上で実験的にモデルのエンドツーエンドをトレーニングすることで,モデルが画像を生成することを実証する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:40:13 GMT)
Phase space analysis of Bell inequalities for mixed Gaussian states [0.0] 連続変数系におけるベルの不等式違反を評価する。
2モードの加圧熱状態におけるベル不等式違反に対する温度の影響を解析するために,結果を活用する。
また、ベルの不等式違反と混合状態の族に存在する絡み合いの量との間の非単調な関係についても検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:00:01 GMT)
Optimizing Supply Chain Networks with the Power of Graph Neural Networks [0.0] グラフニューラルネットワーク(GNN)は、複雑なリレーショナルデータをモデリングするための変換ツールとして登場した。
本稿では,サプライチェーンネットワークにおける需要予測へのGNNの適用について,サプライグラフデータセットを用いて検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:31:24 GMT)
Optimization of Transformer heart disease prediction model based on particle swarm optimization algorithm [0.0] 本稿では,心疾患予測の精度を向上させるための改良型トランスフォーマーモデルを提案する。
まず、決定木、ランダムフォレスト、XGBoostという3つの主流機械学習分類アルゴリズムを使用します。
その結果、ランダム森林モデルは、92.2%の精度で心臓病の分類を予測するのに最高の性能を示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:09:18 GMT)
Operator Spreading in Random Unitary Circuits with Unitary-invariant Gate Distributions [0.0] 一般のユニタリ不変アンサンブルから基本ゲート操作が引き出されるランダムなユニタリ回路における演算子拡散について検討する。
ハール分散の場合と同様に、より一般的なユニタリ不変ゲート分布で拡散する作用素の長時間挙動はドリフト拡散方程式によって制御される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:00:04 GMT)
Operational meaning of the classical fidelity and the path length in Fisher-Kubo-Mori-Bogoliubov geometry [0.0] 我々は、経路に沿ったほぼ可逆な量子状態輸送における最小エントロピー生成は、フィッシャー-KMB測定値に従って測定された経路長の単純な関数であることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:36:49 GMT)
Neighbor displacement-based enhanced synthetic oversampling for multiclass imbalanced data [0.0] 不均衡なマルチクラスデータセットは、機械学習アルゴリズムに課題を提起する。
既存のメソッドはまだスパースデータに悩まされており、元のデータパターンを正確に表現していない可能性がある。
本稿では,NDESO(Nighbor Displacement-based Enhanced Synthetic Oversampling)と呼ばれるハイブリッド手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 19:15:00 GMT)
Multiparticle quantum walks for distinguishing hard graphs [0.0] 特に、多粒子量子ウォークとよく知られた古典的なWLテストを比較する方法について考察する。
我々は、入力重畳状態を持つ k-QW が k-CFI グラフを区別することを示す理論的証明と実験結果を提供する。
さらに、局所的な入力状態を持つ k-1 QW が k-CFI グラフを区別することを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:30:40 GMT)
Multimodal Multihop Source Retrieval for Web Question Answering [0.0] この研究はマルチモーダルなマルチホップ質問応答(QA)に対する学習と推論の課題を扱う。
文の意味構造に基づくグラフ推論ネットワークを提案し,多元的推論経路を学習する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:53:56 GMT)
Modes, states and superselection rules in quantum optics and quantum information [0.0] 量子光学状態を表現するための便利な方法は、場の単一モードの二次基底である。
このフレームワークは、準古典状態に対する直感的な定義、位相空間表現、普遍ゲートを用いた量子状態操作のための堅牢なツールボックスを提供する。
このアプローチは従来の二次表現の直観的な側面を保ちながら、量子光学からの洞察と対称スピンや角運動量系の知見を統一する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:08:25 GMT)
Model Checking in Medical Imaging for Tumor Detection and Segmentation [0.0] 近年のモデル検査の進歩は、様々な応用において大きな可能性を秘めている。
医用画像は、モデル検査を効果的に適用できる重要な領域として際立っている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:29:43 GMT)
MeshConv3D: Efficient convolution and pooling operators for triangular 3D meshes [0.0] MeshConv3Dは、特殊な畳み込みとフェース崩壊ベースのプール演算子を統合する、3Dメッシュ専用手法である。
3つの異なるベンチマークデータセットで得られた実験結果から,提案手法により,同等あるいは優れた分類結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:41:26 GMT)
Machine learning applications in archaeological practices: a review [0.0] 1997年から2022年にかけて135の論文をレビューした。
自動構造検出とアーティファクト分類が最も顕著なタスクであった。
使用した機械学習手法の要件や注意点が不十分な場合もありました。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:50:05 GMT)
Machine Learning for Identifying Grain Boundaries in Scanning Electron Microscopy (SEM) Images of Nanoparticle Superlattices [0.0] ナノ粒子超格子の走査型電子顕微鏡(SEM)画像における粒界分割の自動化のための機械学習ワークフローを提案する。
我々は、生のピクセルデータをクラスタリングのための超格子配向の説明可能な数値表現に変換する。
この効率性により、ワークフローは大規模なデータセットにスケーラブルになり、データ駆動モデルを意思決定プロセスに統合するための貴重なツールになります。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 22:51:10 GMT)
Local Compositional Complexity: How to Detect a Human-readable Messsage [0.0] 我々は、データがメッセージを伝えるのに役立つ方法で構造化されている場合、高い特定の複雑さの感覚に焦点を当てます。
本稿では、データの最も短い記述を構造化された部分と非構造化された部分に分割して、データの複雑さを測定するための一般的なフレームワークについて述べる。
我々は、局所的な構成性を適切な特定の構造として提案することにより、人間のコミュニケーションを指向したより正確で計算可能な定義を導出する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:04:01 GMT)
Leveraging time and parameters for nonlinear model reduction methods [0.0] 我々は、ゆっくりと崩壊するコルモゴロフ$n$-幅の問題を波状あるいは輸送支配的な問題と考える。
MOR内のこのコルモゴロフ障壁を克服するために、非線形射影が使われ、しばしばオートエンコーダを用いて数値的に実現される。
to-be-reducedシステムの拡張とそのトレーニングデータにより,非線形エンコーダを線形エンコーダに置き換えることが,精度を犠牲にすることなく可能であることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:10:07 GMT)
LENS-XAI: Redefining Lightweight and Explainable Network Security through Knowledge Distillation and Variational Autoencoders for Scalable Intrusion Detection in Cybersecurity [0.0] 本研究は軽量説明可能ネットワークセキュリティフレームワーク(LENS-XAI)を紹介する。
LENS-XAIは、堅牢な侵入検知と、拡張された解釈可能性とスケーラビリティを組み合わせる。
本研究は, 計算効率, 特徴解釈可能性, 実世界の応用性に対処することで, IDSの進歩に大きく貢献する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:43:09 GMT)
Is social media hindering or helping Academic Performance? A case study of Walter Sisulu University Buffalo City Campus [0.0] ソーシャルメディアの過剰使用は、学生の学業成績に悪影響を及ぼす可能性がある。
本研究では,バッファローシティキャンパスのウォルター・シスル大学(WSU)において,ソーシャルメディアが学生の学業成績に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:23:06 GMT)
Interference of interference effects [0.0] 干渉効果として2種類の標準量子力学を示す。
この作業は、全体的な作業視点、なぜこの作業が意図されているのかを意図しています。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 03:47:54 GMT)
Homomorphic Encryption in Healthcare Industry Applications for Protecting Data Privacy [0.0] 本研究は、医療分野における実世界の応用への完全同型暗号化の導入について検討する。
我々は、広範囲なテストと分析を通じて、これらの設定にFHEをデプロイする性能、リソース要件、および生存性を評価する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:42:41 GMT)
Heralded entanglement of on-demand spin-wave solid-state quantum memories for multiplexed quantum network links [0.0] 完全調整可能なリコール時間と15モードの時間多重化による空間的に分離された量子メモリ間の通信の絡み合いを示す。
その結果、スケーラブルな高速量子ネットワークリンクの実装における主要な候補として、アーキテクチャが確立された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 20:26:06 GMT)
HIVEX: A High-Impact Environment Suite for Multi-Agent Research (extended version) [0.0] HIVEXは環境問題に焦点を当てたマルチエージェント研究をベンチマークする環境スイートである。
メインタスクとサブタスクの環境、トレーニング例、ベースラインを提供します。
この作業の実験から得られたトレーニングされたモデルはすべて、Hugging Face上にホストされている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:16:31 GMT)
Graph-Aware Isomorphic Attention for Adaptive Dynamics in Transformers [0.0] 変換器の注意機構をグラフ演算として再構成する。
スパース GIN-Attention はスパース GIN を用いた微調整手法である。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 21:04:14 GMT)
Fully automated workflow for designing patient-specific orthopaedic implants: application to total knee arthroplasty [0.0] 変形性関節症は世界中で約5億2800万人に影響を及ぼし、関節の痛みと硬直を引き起こす。
人工膝関節全置換術における患者固有のインプラント設計のための完全自動化ワークフローを提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:06:13 GMT)
From Newswire to Nexus: Using text-based actor embeddings and transformer networks to forecast conflict dynamics [0.0] 本研究では,テキストベースのアクター埋め込みとトランスフォーマーモデルを用いたコンフリクト予測の分野を推し進める。
我々は、ニュースワイヤテキストと構造化コンフリクトイベントデータを組み合わせて、対立するアクター間のエスカレーションとデエスカレーションを予測する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:45:37 GMT)
Four-body coupler for superconducting qubits based on Josephson parametric oscillators [0.0] ジョセフソンパラメトリック発振器(JPO)に基づく超伝導量子ビットのための4体カプラ回路を提案する。
我々の4体相互作用のカプラは超伝導ループを持ち、磁束量子の半分に設定された外部磁束をスレッディングする磁束量子ビットに類似している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 07:07:34 GMT)
Floquet-Lindblad Master Equation Approach to Open Quantum System Dynamics [0.0] FLiMEFloと呼ばれる新しい解法が展示され、これは周期的(鍵型)ハミルトニアンに適している。
FloiMEは、他の解法よりも高速で高精度でありながら、時間周期システムを効率的かつ正確にシミュレートすることができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:48:43 GMT)
Fixed Points of Deep Neural Networks: Emergence, Stability, and Applications [0.0] 我々はディープニューラルネットワーク(DNN)の固定点群の形成と安定性について述べる。
本稿では、教師付き、半教師付き、教師なし学習におけるそのようなネットワークの応用例を示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 23:23:26 GMT)
FIDLAR: Forecast-Informed Deep Learning Architecture for Flood Mitigation [0.0] 洪水は、ダム、門、ポンプ、貯水池などの水圧構造で極端な気象現象の前に、戦略的に水を放出することで緩和または防止することができる。
地域水管理機関が使用する標準的なアプローチは「ルールベース」手法であり、歴史的およびタイムテストされた人間の経験に基づいて、所定のプレリリース水を指定する。
本研究では,正確な水事前リリースによる高速かつ最適な洪水管理を実現するための予測インフォームド深層学習アーキテクチャ (FIDLAR) を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 04:42:21 GMT)
Extraction Of Cumulative Blobs From Dynamic Gestures [0.0] ジェスチャー認識は、コンピュータが人間の動きをコマンドとして解釈できるCV技術に基づいている。
モーションキャプチャー用のカメラとして、簡単なナイトビジョンカメラが使用できる。
カメラからのビデオストリームは、OpenCVモジュールを実行するPythonプログラムを備えたRaspberry Piに入力される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:59:28 GMT)
Extending ChatGPT with a Browserless System for Web Product Price Extraction [0.0] 本稿では,ChatGPTを拡張したWextractorというシステムを提案する。
Wextractorは、ソーシャル抽出とポインティングパターン抽出の2つの改善により、回答速度が向上した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:24:49 GMT)
Exponential improvements in the simulation of lattice gauge theories using near-optimal techniques [0.0] ハミルトンシミュレーションのための明示的な回路構成とTゲート数および論理キュービット数を提供する。
我々は、非アベリア格子ゲージ理論のシミュレーションのために、トロッター法による時空体積を最大25桁削減することを示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:13:39 GMT)
Exploring Molecule Generation Using Latent Space Graph Diffusion [0.0] 分子グラフの生成は、その離散的な性質と競合する目的のために難しい課題である。
分子グラフの場合、拡散バックボーンとしてのグラフニューラルネットワーク(GNN)は印象的な結果を得た。
自己エンコーダを介して低次元空間に拡散する潜在空間拡散は計算効率を実証している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:54:44 GMT)
Experimental realization of scanning quantum microscopy [0.0] 本稿では,光子対と走査顕微鏡の量子相関を利用して高速で単一モードの量子イメージングを実現する撮像法を提案する。
我々はタマネギ上皮細胞の走査型量子顕微鏡を実演し、生体物理応用のためのスケーラブルな量子顕微鏡への道を開いた。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:34:09 GMT)
Error analysis of quantum operators written as a linear combination of permutations [0.0] 置換の線形結合とビットと位相の反転が固有値の摂動に与える影響を考察する。
線形結合の係数が正のとき、得られた行列の固有値が量子ビットフリップ誤差に耐性があることを観察する。
誤差にはあまり耐性がないが、数値的な証拠は、これらの誤差の比率が小さい場合には固有スペクトルの摂動が非常に小さいことを示している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 08:51:04 GMT)
Entangled Schrödinger cat states, vacuum projector and Bell-CHSH inequality [0.0] エルミートジコトミック演算子は、絡み合った絡み合ったシュリンガー猫状態に対するベル-CHSH不平等の違反を精査するために用いられる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:49:14 GMT)
Enhanced Tuberculosis Bacilli Detection using Attention-Residual U-Net and Ensemble Classification [0.0] Mycobacterium tuberculosisによって引き起こされた結核は、依然として重要な世界的な健康問題であり、タイムリーな診断と治療を必要としている。
蛍光顕微鏡スミア画像からの結核菌の検出法は, 自動化が低く, セグメンテーション性能が不十分で, 分類精度が限られている。
本稿では,セグメント化のためのディープラーニングと分類のためのアンサンブルモデルを組み合わせた,効率的なハイブリッド手法を提案する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:21:13 GMT)
Efficient and Accurate Tuberculosis Diagnosis: Attention Residual U-Net and Vision Transformer Based Detection Framework [0.0] 結核(TB)は予防可能で治療可能であるにもかかわらず、世界的な健康上の脅威であり続けている。
本稿では,結核菌検出のための2段階の深層学習手法を提案する。
最初の段階では、注意ブロックと残差接続を用いた高度なU-Netモデルが、スミア画像の断片化のために提案され、興味領域(ROI)の抽出が可能となった。
抽出したROIはVision Transformerを用いて分類され、TBViTとして特別にカスタマイズされ、画像中のバシリの正確な検出が促進される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:17:43 GMT)
Efficient Protein Ground State Energy Computation via Fragmentation and Reassembly [0.0] 本稿では,既存の量子アルゴリズムを用いた量子シミュレーションを実現するための新しい手法を提案する。
我々のアプローチでは、タンパク質を対応するアミノ酸に分解し、それらを個別にシミュレートし、化学修飾を施した後に再組み立てする。
この手法は, 比較的小さなペプチドの基底状態を再集合により計算し, 平均相対誤差が0.00263 pm 0.01724%であることを示す。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:10:49 GMT)
Echomix: a Strong Anonymity System with Messaging [0.0] Echomixは実践的なミックスネットワークフレームワークであり、関連するプロトコルのスイートである。
グローバルな敵による交通分析に対する抵抗によって、他の匿名システムと区別される。
レイテンシと帯域幅のオーバーヘッドが比較的低い。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:01:11 GMT)
Dissipative evolution of a two-level system through a geometry-based classical mapping [0.0] 分離および相互作用する2レベルシステムのダイナミクスについて検討する。
我々のモデルは、孤立対称二層系を環境支援非対称系に変換する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:02:24 GMT)
Diff-Lung: Diffusion-Based Texture Synthesis for Enhanced Pathological Tissue Segmentation in Lung CT Scans [0.0] セグメンテーションは、健康組織と病理組織の間に有意な階級不均衡があるため、難しい。
本稿では,AIモデルのトレーニング中に適用されたデータ拡張に拡散モデルを活用することにより,この問題に対処する。
本研究は, 本態様の特徴を保ちながら, それぞれの組織タイプに特異的な複雑な詳細を保存しながら, 合成病理組織パッチを作製する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:13:17 GMT)
Demonstration of Quantum Polarization Microscopy using an Entangled-Photon Source [0.0] 本稿では、量子交絡光子源を組み込んだ量子偏光顕微鏡技術の実験的実証を紹介する。
画像コントラストは、信号とアイドラー光子の同時カウントによって構成される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:43:19 GMT)
Dataset-Free Weight-Initialization on Restricted Boltzmann Machine [0.0] フィードフォワードニューラルネットワークでは,データセットフリーの重み初期化手法が開発されている。
制限ボルツマンマシン(RBM)のためのデータセットフリーウェイト初期化法はまだ開発されていない
本研究では,Bernoulli--Bernoulli RBMの統計力学解析に基づくデータセットフリー重量初期化法を導出する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 02:15:42 GMT)
Current Correlations and Conductivity in SYK-Like Systems: An Analytical Study [0.0] 本稿では,G-Sigma$フォーマリズムで表される行動に対する熱予測値を関数ベースで計算する手法を提案する。
種々のSachdev-Ye-Kitaev鎖の電場に対する線形応答を解析した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 10:53:03 GMT)
Cosmological Parameter Estimation with Sequential Linear Simulation-based Inference [0.0] 本研究では,確率をパラメータのガウス線型関数で近似するシミュレーションベース推論の枠組みを開発する。
我々は,最新のニューラルネットワーク密度推定法と競合する$mathcalO(104)$シミュレーションの4、5ラウンド後に収束が達成された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 16:34:47 GMT)
Coherent Control of a Long-Lived Nuclear Memory Spin in a Germanium-Vacancy Multi-Qubit Node [0.0] ダイヤモンド中の負電荷のゲルマニウム空孔中心に強く結合した13ドルの核スピンのコヒーレント制御を示す。
詳細な分析により、システムのダイナミクスをモデル化し、結合パラメータを抽出し、ノイズを特徴づけることができる。
我々は、加熱制限を考慮した18.1秒の達成可能なメモリ時間を推定し、量子リピータノードとして成功したアプリケーションへの道を開く。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:07:42 GMT)
Challenging Excited States from Adaptive Quantum Eigensolvers: Subspace Expansions vs. State-Averaged Strategies [0.0] ADAPT-VQEは分子の基底状態を得るための単一の参照手法である。
MORE-ADAPT-VQEは、避けられた交差と異なる対称性の状態間の交差の両方を正確に記述することができる。
これらの改善は、難しい励起状態問題に対する量子コンピュータの使用に向けた有望な方向を示唆している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 14:38:52 GMT)
Causal Machine Learning Methods for Estimating Personalised Treatment Effects -- Insights on validity from two large trials [0.0] 因果機械学習(ML)手法は、精密医療の進歩に大いに貢献する。
本研究では,17種類の主流因果ML法の内部および外的妥当性について検討した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:44:05 GMT)
Cartan-covariant Quantum Channels and the PPT$^{2}$ conjecture [0.0] カルタン共変チャネルは、SU$(D)$のカルタン分解を形成する共分散リー群を持つことを示す。
完全に正かつ完全に共正なカルタン共変トレース保存写像の領域は、チョイ状態のスペクトル解析によって見つかる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 17:46:43 GMT)
BoRA: Bayesian Hierarchical Low-Rank Adaption for Multi-Task Large Language Models [0.0] 本稿では,マルチタスク大言語モデル(LLM)を微調整する新しい手法であるベイジアン階層型低ランク適応(BoRA)を紹介する。
BoRAは、グローバルな階層的事前を通じてタスクが情報を共有できるベイズ階層モデルを活用することでトレードオフに対処する。
実験の結果,BoRAは個々のモデルアプローチと統一モデルアプローチの両方に優れており,より難易度が低く,タスク間の一般化性が向上していることがわかった。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:28:00 GMT)
Bekenstein Bound for Approximately Local Charged States [0.0] 我々は、場の量子論におけるエネルギー-エントロピー比の不等式をより大きな状態のクラスに一般化する。
この論文で考慮された状態は、QFTの荷電(非真空)表現に収まるか、または考慮中の領域でのみほぼ局所化される。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:06:41 GMT)
Behind Closed Words: Creating and Investigating the forePLay Annotated Dataset for Polish Erotic Discourse [0.0] 本稿では,エロティックなコンテンツ検出のためのポーランド語データセットであるforePLayを紹介する。
このデータセットは、曖昧さ、暴力、社会的受容不能な次元を含む多次元分類を含む24k以上の注釈付き文を特徴としている。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 12:56:27 GMT)
Behavioural Analytics: Mathematics of the Mind [0.0] 複数の言語の引用を解析するための技術の数学的基礎について述べる。
これには、行動要因を理解するベイジアンネットワーク、時系列分析のための状態推定アルゴリズム、分類のための機械学習アルゴリズムが含まれる。
我々は、反暴力運動家、政治家、過激派、テロリストによる英語、フランス語、アラビア語の引用研究の結果を提示する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 11:44:48 GMT)
Applying Large Language Models in Knowledge Graph-based Enterprise Modeling: Challenges and Opportunities [0.0] エンタープライズモデリングにおける大規模言語モデル(LLM)は、最近、学術研究から産業応用へとシフトし始めている。
本稿では,企業モデリングにおける知識グラフに基づくアプローチを採用し,LLMの潜在的なメリットについて検討する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 06:34:17 GMT)
All-microwave Lamb shift engineering for a fixed frequency multi-level superconducting qubit [0.0] ラムシフトは量子電磁力学(QED)における重要な現象である
回路設計におけるQED要求オーバーヘッドやシステムの固有基底の非摂動的再正規化におけるラムシフトを制御するための以前のアプローチや提案。
本研究では、固定周波数トランスモンのラムシフトを制御する全マイクロ波法を提案し、実演する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 05:58:22 GMT)
Advanced Persistent Threats (APT) Attribution Using Deep Reinforcement Learning [0.0] マルウェアの帰属に対するDRLモデルの開発には、広範な研究、反復的なコーディング、多数の調整が含まれていた。
モデルは低い精度で苦労したが、アーキテクチャと学習アルゴリズムの永続的な調整により、精度は劇的に向上した。
トレーニングの終わりまでに、モデルは98%近い精度に達し、マルウェアの活動を正確に認識し、属性付けする強力な能力を示した。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 15:48:15 GMT)
AI-Driven Scenarios for Urban Mobility: Quantifying the Role of ODE Models and Scenario Planning in Reducing Traffic Congestion [0.0] 本稿では,人工知能(AI)駆動技術が交通渋滞動態に与える影響について検討する。
我々は,自動運転車やインテリジェント交通管理といったAIイノベーションが,さまざまな規制枠組みの下での混雑緩和に果たす役割を評価する。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 13:14:25 GMT)
A case study on the transformative potential of AI in software engineering on LeetCode and ChatGPT [0.0] 本研究は,LeetCode ユーザによる Python プログラムのソフトウェア品質と GPT-4o によるソフトウェア品質を比較し,方法論的アプローチを採用する。
この結果から, GPT-4oはコード品質, 可理解性, 実行時において, 限られたスケールでコードを生成する場合に, かなりの障害を生じさせないことが示唆された。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:15:25 GMT)
A Review of Bayesian Uncertainty Quantification in Deep Probabilistic Image Segmentation [0.0] 画像セグメンテーションの進歩は、ディープラーニングベースのコンピュータビジョンの幅広い範囲において重要な役割を担っている。
この文脈において不確かさの定量化が広く研究され、モデル無知(エピステミック不確実性)やデータあいまいさ(アラート不確実性)を表現し、不正な意思決定を防ぐことができる。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 09:34:51 GMT)
A Constructive Approach to Zauner's Conjecture via the Stark Conjectures [0.0] SICPOVMsとしても知られる$mathbbCd$における$d2$複素等角線の構成を示す。
この構成は、すべての次元 d > 3 においてワイル=ハイゼンベルク対称性を持つ SIC の仮定的に完備なリストを与える。
我々は、我々の構成が2つの予想を仮定するすべての場合において有効なSICを与えることを証明している。
論文参考訳(メタデータ) (Tue, 07 Jan 2025 18:16:43 GMT)