Learning Hierarchical Color Guidance for Depth Map Super-Resolution [168.1] 深度マップ超解像(DSR)を実現する階層カラー誘導ネットワークを提案する。
一方、低レベルのディテール埋め込みモジュールは、奥行き特徴の高周波カラー情報を補うように設計されている。
一方,再建過程における意味的一貫性を維持するため,高レベルの抽象的ガイダンスモジュールが提案されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:01:51 GMT)
Rho-1: Not All Tokens Are What You Need [132.3] 以前の言語モデル事前学習手法は、すべてのトレーニングトークンに次トーケン予測損失を均一に適用した。
Rho-1 は選択言語モデリング (SLM) を採用しており、所望の分布に合わせて有用なトークンを選択的に訓練する。
15B OpenWebMathコーパスで継続事前トレーニングを行うと、Rho-1は9つの数学タスクで最大30%のショット精度で絶対的に改善する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:48:03 GMT)
Paloma: A Benchmark for Evaluating Language Model Fit [112.5] 言語モデル (LM) の評価では、トレーニングから切り離されたモノリシックなデータに難易度が報告されるのが一般的である。
Paloma(Perplexity Analysis for Language Model Assessment)は、546の英語およびコードドメインに適合するLMを測定するベンチマークである。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:22:22 GMT)
TACO: Learning Multi-modal Action Models with Synthetic Chains-of-Thought-and-Action [103.6] 複雑・多段階・多モードタスクの性能向上を目的とした多モード大規模アクションモデルであるTACOを提案する。
推論中、TACOはチェーン・オブ・シント・アンド・アクション(CoTA)を生成し、OCR、深さ推定、電卓などの外部ツールを呼び出すことで中間ステップを実行する。
このデータセットにより、TACOは複雑な推論とアクションパスを学習し、直接回答だけでチューニングデータに基づいてトレーニングされた既存のモデルを上回ることができる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:42:04 GMT)
CHIRON: Rich Character Representations in Long-Form Narratives [98.3] 文字のテキスト情報を整理・フィルタリングする新しい文字シートの表現であるCHIRONを提案する。
実験の結果,CHIRONは類似の要約に基づくベースラインよりも優れ,柔軟であることが判明した。
CHIRONから派生したメトリクスは、ストーリーのキャラクター中心性を自動的に推測するために使用することができ、これらのメトリクスは人間の判断と一致している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:20:46 GMT)
Point-aware Interaction and CNN-induced Refinement Network for RGB-D Salient Object Detection [95.8] 我々は,CNNによるトランスフォーマーアーキテクチャを導入し,ポイント・アウェア・インタラクションとCNNによるリファインメントを備えた新しいRGB-D SODネットワークを提案する。
トランスフォーマーがもたらすブロック効果とディテール破壊問題を自然に軽減するために,コンテンツリファインメントとサプリメントのためのCNNRユニットを設計する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:17:32 GMT)
MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models [87.6] この研究は、大規模言語モデルにおける半構造化(あるいはN:M'')のスパーシティを確立する学習可能なプルーニング手法であるMaskLLMを紹介した。
MaskLLMはGumbel Softmaxサンプリングを通じて学習可能な分布としてN:Mパターンを明示的にモデル化する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 12:01:28 GMT)
Street Gaussians without 3D Object Tracker [86.6] 既存の手法では、オブジェクトポーズの労働集約的な手動ラベリングを使用して、標準的な空間内で動的オブジェクトを再構築し、レンダリング中にこれらのポーズに基づいてそれらを動かす。
本研究では,3次元オブジェクト融合戦略における2次元ディープトラッカーの関連性を利用して,安定なオブジェクト追跡モジュールを提案する。
我々は、軌道誤差を自律的に補正し、見逃した検出を回復する暗黙の特徴空間に、モーションラーニング戦略を導入することで、避けられないトラッキングエラーに対処する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:49:42 GMT)
One-for-All: Towards Universal Domain Translation with a Single StyleGAN [86.3] 視覚的に異なる領域間の表現を変換するための新しい翻訳モデルUniTranslatorを提案する。
提案したUniTranslatorは汎用的で、スタイルミキシング、スタイリゼーション、翻訳など様々なタスクを実行できる。
UniTranslatorは、既存の汎用モデルの性能を超越し、代表タスクの特殊モデルに対してよく機能する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:07:32 GMT)
Make-It-Animatable: An Efficient Framework for Authoring Animation-Ready 3D Characters [86.1] 我々は3次元ヒューマノイドモデルを1秒未満でキャラクターアニメーションに対応させる新しいデータ駆動方式であるMake-It-Animatableを提案する。
我々のフレームワークは、高品質なブレンドウェイト、骨、ポーズトランスフォーメーションを生成します。
既存の手法と比較して,本手法は品質と速度の両方において著しく改善されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:13:13 GMT)
Query-guided Prototype Evolution Network for Few-Shot Segmentation [85.8] 本稿では,前景と背景のプロトタイプの生成プロセスにクエリ機能を統合する新しい手法を提案する。
PASCAL-$5i$とミラーリング-$20i$データセットの実験結果は、QPENetが達成した実質的な拡張を示している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:40:04 GMT)
SDDNet: Style-guided Dual-layer Disentanglement Network for Shadow Detection [85.2] 入力シャドウ画像を背景層と影層の合成として扱い、これらの層を独立にモデル化するためのスタイル誘導デュアル層ディスタングルネットワークを設計する。
提案モデルは背景色による有害な効果を効果的に最小化し,32FPSのリアルタイム推論速度を持つ3つの公開データセットに対して優れた性能を示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:09:52 GMT)
DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection [82.9] 既存のディープフェイク検出方法は、目に見えない、または劣化したサンプルに対してうまく一般化できない。
高レベルのセマンティクスは、一般化可能な偽造検出に必要なレシピである。
DeepFake-Adapterは、DeepFake検出のためのパラメータ効率の高い最初のチューニング手法である。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:52:37 GMT)
Rydberg Atomic Quantum Receivers for Classical Wireless Communications and Sensing: Their Models and Performance [78.8] ライドバーグ原子量子受信機(Rydberg atomic quantum receivers, RAQRs)は、高周波(RF)信号の電界を検出するための卓越した溶液である。
本稿では,無線コミュニティにおけるRAQRの超ヘテロダインバージョンについて,エンド・ツー・エンドの受信方式を提案する。
次に,現実的な受信フローに依存する等価なベースバンド信号モデルを開発する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:25:54 GMT)
PrivAgent: Agentic-based Red-teaming for LLM Privacy Leakage [78.3] LLMは、慎重に構築された敵のプロンプトの下で私的情報を出力することに騙される可能性がある。
PrivAgentは、プライバシー漏洩のための新しいブラックボックスレッドチームフレームワークである。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:09:01 GMT)
Do We Need to Design Specific Diffusion Models for Different Tasks? Try ONE-PIC [77.9] 本稿では,超音速拡散モデルに対する単純,効率的,汎用的なアプローチを提案する。
ONE-PICは、追加モジュールを導入することなく、事前訓練された拡散モデルにおける継承された生成能力を向上する。
本手法は,適応プロセスの合理化を図り,低コストで優れた性能を実現する,シンプルで効率的な手法である。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:19:32 GMT)
CharacterBox: Evaluating the Role-Playing Capabilities of LLMs in Text-Based Virtual Worlds [74.0] ロールプレイングは大規模言語モデル(LLM)の重要な機能である
現在の評価手法は, 実演に不可欠なニュアンス特性や動作を適切に把握するに足りていない。
本研究では,キャラクタボックスを提案する。キャラクタボックスは,キャラクタの微粒な挙動を再現するシミュレーションサンドボックスである。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 12:09:35 GMT)
DiffuBox: Refining 3D Object Detection with Point Diffusion [74.0] 本研究では,3次元物体の検出と局所化を確保するために,新しい拡散型ボックス精細化手法を提案する。
この方法は、粗いバウンディングボックスを囲むLiDAR点に条件付きドメインに依存しない拡散モデルを用いて、ボックスの位置、サイズ、方向を同時に洗練する。
結果から,異なるデータセット,オブジェクトクラス,検出器間での大幅な改善が示された。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:25:33 GMT)
ICLEval: Evaluating In-Context Learning Ability of Large Language Models [68.7] In-Context Learning (ICL) は大規模言語モデル(LLM)の重要な能力であり、相互接続された入力の理解と推論を可能にする。
既存の評価フレームワークは主に言語能力と知識に重点を置いており、しばしばICL能力の評価を見落としている。
LLMのICL能力を評価するためにICLEvalベンチマークを導入する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 13:00:40 GMT)
PrefixKV: Adaptive Prefix KV Cache is What Vision Instruction-Following Models Need for Efficient Generation [65.4] キー値(KV)キャッシュは、長い入力シーケンスと出力シーケンスを必要とするが、特に高い推論コストに寄与する。
ここでは,すべてのレイヤのKVキャッシュサイズを決定するという課題を,最適なグローバルプレフィックス設定を探すタスクに再編成するPrefixKVを提案する。
本手法は他の手法と比較して最先端の性能を実現する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 13:23:39 GMT)
A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.3] 本研究では,ガウスプレートの拡散モデルであるSplatDiffusionを導入し,単一画像から3次元構造を生成する。
既存の方法は決定論的フィードフォワード予測に依存しており、2Dデータからの3D推論の本質的な曖昧さを扱う能力を制限する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:21:01 GMT)
RealDex: Towards Human-like Grasping for Robotic Dexterous Hand [64.3] 本稿では,人間の行動パターンを取り入れた手の動きを正確に把握する先駆的データセットであるRealDexを紹介する。
RealDexは、現実のシナリオにおける認識、認識、操作を自動化するためのヒューマノイドロボットを進化させる上で、大きな可能性を秘めている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:38:21 GMT)
Combining Observational Data and Language for Species Range Estimation [63.7] 我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 23:13:46 GMT)
A New Perspective on Time Series Anomaly Detection: Faster Patch-based Broad Learning System [59.4] 時系列異常検出(TSAD)は近年,学術と産業の両方においてホットスポットとなっている。
TSADでは、ディープラーニングの速度が遅いなどの制限のため、ディープラーニングは必須ではない。
コントラスト型パッチベースブロードラーニングシステム(CBLS)を提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:58:18 GMT)
PromptRefine: Enhancing Few-Shot Performance on Low-Resource Indic Languages with Example Selection from Related Example Banks [57.9] 大規模言語モデル(LLM)は、近ごろ、コンテキスト内学習(ICL)を通じて、印象的な数ショットの学習能力を実証した。
ICLのパフォーマンスは、数発のデモの選択に大きく依存しており、最も最適な例の選択は永続的な研究課題である。
本稿では,低リソースのIndic言語におけるICLの性能向上を目的とした,新しい代替最小化手法であるPromptRefineを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:51:31 GMT)
Remix-DiT: Mixing Diffusion Transformers for Multi-Expert Denoising [57.9] 本稿では,低コストで出力品質を向上させる手法であるRemix-DiTを紹介する。
Remix-DiTの目標は、Nモデルの高価なトレーニングを必要とせずに、異なるデノナイジングタイムステップのためにN拡散の専門家を作ることである。
ImageNetデータセットで実施された実験は、Remix-DiTが有望な結果をもたらすことを示した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:52:41 GMT)
HMGIE: Hierarchical and Multi-Grained Inconsistency Evaluation for Vision-Language Data Cleansing [55.0] 我々は階層的・多階層的不整合評価(HMGIE)と呼ばれる適応的評価フレームワークを設計する。
HMGIEは、様々な画像キャプチャー対の精度と完全性の両方をカバーする多粒度評価を提供する。
提案手法の有効性と柔軟性を検証するため,様々なタイプの画像キャプチャー・データセットであるMVTIDを構築した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:47:49 GMT)
GAQAT: gradient-adaptive quantization-aware training for domain generalization [54.3] そこで本研究では,DGのためのGAQAT(Gradient-Adaptive Quantization-Aware Training)フレームワークを提案する。
我々のアプローチは、低精度量子化におけるスケール・グラディエント・コンフリクト問題を特定することから始まる。
GAQATフレームワークの有効性を実験により検証した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:07:21 GMT)
SAME: Learning Generic Language-Guided Visual Navigation with State-Adaptive Mixture of Experts [54.1] 本稿では,多様なナビゲーションタスクを統一的で汎用的なフレームワークに統合する。
本稿では,エージェントによる意思決定の推論を効果的に行うことのできる,新しい状態適応型エキスパート混合モデルを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:12:53 GMT)
MetaFood3D: 3D Food Dataset with Nutrition Values [52.2] このデータセットは、131のカテゴリにまたがって、743の精細にスキャンされ、ラベル付けされた3D食品オブジェクトで構成されている。
我々のMetaFood3Dデータセットはクラス内の多様性を重視しており、テクスチャメッシュファイル、RGB-Dビデオ、セグメンテーションマスクなどのリッチなモダリティを含んでいる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 21:37:07 GMT)
Frequency Perception Network for Camouflaged Object Detection [51.3] 周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:22:35 GMT)
Mixture of Hidden-Dimensions Transformer [50.4] 隠れ次元の空間性について検討し、訓練されたトランスフォーマーがわずかなトークン次元しか利用していないことを観察する。
スパース条件付アクティベーションアーキテクチャであるMoHD(Mixture of Hidden Dimensions)を提案する。
50%のアクティベーションパラメータが減少し、3.7%のハイパフォーマンスを実現し、3倍のパラメータを一定のアクティベーションコストで拡張する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 13:15:22 GMT)
SimGen: Simulator-conditioned Driving Scene Generation [50.0] シミュレーション条件付きシーン生成フレームワークSimGenを紹介する。
SimGenは、シミュレータと現実世界のデータを混ぜることで、多様な運転シーンを生成することを学ぶ。
テキストプロンプトとシミュレータからのレイアウトに基づいて制御性を保ちながら、優れた生成品質と多様性を実現する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 10:25:34 GMT)
Text-to-3D Gaussian Splatting with Physics-Grounded Motion Generation [47.7] 正確な外観と幾何学的構造を持つ3次元モデルを生成する革新的なフレームワークを提案する。
テキスト・ツー・3D生成と物理基底運動合成を統合することにより,本フレームワークはフォトリアリスティックな3Dオブジェクトを描画する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:48:16 GMT)
Diffusion Auto-regressive Transformer for Effective Self-supervised Time Series Forecasting [47.6] 我々はTimeDARTと呼ばれる新しい自己管理手法を提案する。
TimeDARTは、時系列データ内のグローバルシーケンス依存とローカル詳細特徴の両方をキャプチャする。
私たちのコードはhttps://github.com/Melmaphother/TimeDART.comで公開されています。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:59:29 GMT)
Temporally Compressed 3D Gaussian Splatting for Dynamic Scenes [46.6] 時間圧縮3Dガウススティング(TC3DGS)は動的3Dガウス表現を圧縮する新しい技術である。
複数のデータセットにまたがる実験により、T3DGSは最大67$times$圧縮を実現し、視覚的品質の劣化を最小限に抑えることができた。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:03:09 GMT)
Balancing Confidentiality and Transparency for Blockchain-based Process-Aware Information Systems [46.4] 機密性と透明性の両立を目的とした,ブロックチェーンベースのPAISアーキテクチャを提案する。
スマートコントラクトは公開インタラクションを制定、強制、保存し、属性ベースの暗号化技術は機密情報へのアクセス許可を指定するために採用されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:18:36 GMT)
Finite Element Neural Network Interpolation. Part I: Interpretable and Adaptive Discretization for Solving PDEs [45.0] 組込み有限要素ニューラルネットワーク(EFENN)における従来の研究を拡張したスパースニューラルネットワークアーキテクチャを提案する。
EFENNはメッシュベースの構造であるため、完全に接続されたニューラルネットワークよりもトレーニング可能なパラメータをはるかに少なくする必要がある。
EFENNフレームワーク内のFENNIフレームワークは、HiDeNNアプローチの改善をもたらします。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:31:17 GMT)
WATER-GS: Toward Copyright Protection for 3D Gaussian Splatting via Universal Watermarking [44.3] Water-GSは、ユニバーサルな透かし戦略を通じて3DGS著作権を保護するために設計された新しい方法である。
そこで本研究では,3DGS生成モジュールを潜在的な透かしとして,事前学習した透かしデコーダを導入する。
点雲データの実世界の歪みに対して,埋め込み透かしのロバスト性を高めるために,新しい3次元歪み層を実装した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:44:22 GMT)
Jointly RS Image Deblurring and Super-Resolution with Adjustable-Kernel and Multi-Domain Attention [43.4] 現実世界のRS画像は、大域的な低解像度の変性と局所的な変性の複雑な組み合わせに悩まされることが多い。
JRSIDSRタスクに対して、AKMDNetというデュアルブランチ並列ネットワークを提案する。
AKMDNetは2つのメインブランチで構成されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:44:31 GMT)
Efficient Continuous Video Flow Model for Video Prediction [43.2] 拡散や修正フローモデルなどの多段階予測モデルでは、単一ステップ法と比較して新しいフレームをサンプリングする際のレイテンシが高くなる。
本稿では,遅延制約を緩和し,映像予測タスクへのこれらのプロセスの適応を容易にすることを目的とした,多段階プロセスのモデリング手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 12:11:25 GMT)
Transferable Watermarking to Self-supervised Pre-trained Graph Encoders by Trigger Embeddings [43.1] Graph Self-supervised Learning (GSSL)は、基礎グラフエンコーダの事前トレーニングを可能にする。
このようなエンコーダは簡単にプルインできるので、著作権侵害に弱い。
我々はGSSL設定でグラフエンコーダを保護する新しい透かしフレームワークを開発した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 10:22:05 GMT)
More than Marketing? On the Information Value of AI Benchmarks for Practitioners [42.7] 学術分野では、公開ベンチマークは一般的に研究の進展を捉えるのに適した指標と見なされた。
製品や政策において、ベンチマークは実質的な決定を下すのに不十分であることがしばしば見出された。
有効なベンチマークは、意味のある実世界の評価を提供し、ドメインの専門知識を取り入れ、スコープと目標の透明性を維持するべきであると結論付けています。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:35:39 GMT)
Can Multimodal Large Language Models Truly Perform Multimodal In-Context Learning? [42.0] インコンテキスト学習(ICL)機能を持つ大規模言語モデル(LLM)は、いくつかのデモ(デム)がある場合、特定のコンテキストに迅速に適応することができる。
最近、MLLM (Multimodal Large Language Models) もマルチモーダル ICL の機能を示し、画像、クエリ、回答を含むいくつかのマルチモーダルなデモに対してクエリに応答している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:34:23 GMT)
Charting the Shapes of Stories with Game Theory [41.8] 我々はAIを用いて、ストーリーの構造を定量的分析が可能なゲーム理論オブジェクトとしてモデル化する。
我々はシェイクスピアの有名なロメオとジュリエットに提案されたテクニックを実演する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 21:12:16 GMT)
RL Zero: Zero-Shot Language to Behaviors without any Supervision [40.0] そこで本稿では,ゼロショット方式で言語命令をグラウンド化するのではなく,完全に教師なしの代替手段を提案する。
ビデオ言語モデルは、インターネット規模のビデオテキストマッピングから学んだタスクの知識を活用するタスク記述を想像することができる。
教師なしRLエージェントの実観測において,まず,想定されたシーケンスを基礎にすることで,ゼロショット言語とビヘイビアのポリシーを実現できることを示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:31:16 GMT)
CoE: Deep Coupled Embedding for Non-Rigid Point Cloud Correspondences [39.9] 我々は、意味的に類似した点が同様の埋め込みを共有する埋め込み空間において、ポイントごとの高次元埋め込みという新しい形状表現を学習する。
学習された埋め込みは、基礎となる形状の形状を認識し、変形や様々な形状のアーチファクトに対して堅牢である。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:42:35 GMT)
BEV-SUSHI: Multi-Target Multi-Camera 3D Detection and Tracking in Bird's-Eye View [39.8] 本稿では,BEV-SUSHIという3次元物体検出・追跡フレームワークを提案する。
鳥の目視で3Dオブジェクトを検出するために、カメラキャリブレーションパラメータを必要とするマルチビュー画像を集約する。
既存の方法とは異なり、BEV-SUSHIは様々なシーンにまたがって印象的な一般化性を持ち、カメラの設定も様々である。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 22:46:42 GMT)
Improving Deep Learning Optimization through Constrained Parameter Regularization [39.6] 本稿では、従来の重み劣化の代替として、制約付き正規化(CPR)を提案する。
CPRは、L2ノルムのような統計測度上界を強制する。
CPRは従来の重量減少よりも優れ、トレーニング前や微調整時の性能が向上する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:43:44 GMT)
KG-Retriever: Efficient Knowledge Indexing for Retrieval-Augmented Large Language Models [38.9] KG-Retrieverと呼ばれる階層的な知識検索機能を備えた新しい知識グラフベースのRAGフレームワークを提案する。
グラフ構造の結合性は、ドキュメント内およびドキュメント間接続性を強化するために完全に活用されている。
近隣の文書からの粗粒度の協調情報と知識グラフからの簡潔な情報により、KG-Retrieverは5つの公開QAデータセットに対して顕著な改善を達成している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:49:14 GMT)
Revisiting the Role of Texture in 3D Person Re-identification [38.1] 本研究は3次元人物識別のための新しい枠組み(re-ID)を提案する。
UVTexture マッピングを取り入れた3次元人物再IDモデルのテクスチャ強調手法を提案する。
特に、可視化と説明は、アクティベーションマップと属性ベースのアテンションマップによって達成される。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:35:12 GMT)
Memory-enhanced Invariant Prompt Learning for Urban Flow Prediction under Distribution Shifts [37.9] 本稿では,都市流予測のためのメモリ拡張不変確率学習(MIP)という新しいフレームワークを提案する。
MIPは学習可能なメモリバンクを備えており、空間時間グラフ内の因果的特徴を記憶するように訓練されている。
間欠的な変分プロンプトが設定されているため、予測のばらつきを最小限に抑えるために不変学習を用いる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:35:07 GMT)
CEM: A Data-Efficient Method for Large Language Models to Continue Evolving From Mistakes [36.1] 大きな言語モデルを維持し、その欠点に対処するためには、継続的な学習が不可欠です。
本稿では,CPTデータ収集を目的としたデータ効率の高い手法であるCEM法を提案する。
実験の結果、CEMはドメイン内QAタスクとドメイン外QAタスクの両方で複数のモデルの性能を大幅に向上させ、最大29.63%のゲインを達成している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:49:06 GMT)
A Compositional Atlas for Algebraic Circuits [36.0] クエリの大規模なクラスは、半環上の基本演算子(アグリゲーション、製品、および要素ワイドマッピング)の組み合わせに対応することを示す。
分析を応用して、このような多くの合成クエリに対して、新しいトラクタビリティ条件を導出する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:51:46 GMT)
RAGraph: A General Retrieval-Augmented Graph Learning Framework [35.3] 我々は、RAGraph(General Retrieval-Augmented Graph Learning)と呼ばれる新しいフレームワークを紹介する。
RAGraphは、一般的なグラフ基盤モデルに外部グラフデータを導入し、目に見えないシナリオにおけるモデルの一般化を改善する。
推論中、RAGraphは下流タスクにおける重要な類似性に基づいて、似たようなおもちゃのグラフを順応的に検索する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 10:34:41 GMT)
Black Swan: Abductive and Defeasible Video Reasoning in Unpredictable Events [33.5] BlackSwanSuiteは、予期しない事象を推論する視覚言語モデルの能力を評価するためのベンチマークである。
我々は,3,800以上のMCQ,4,900の生成タスク,6,700のye/noタスクからなる総合的なベンチマークスイートをキュレートした。
これらのタスクでは、人間から最大32%のパフォーマンスギャップが見られます。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:19:03 GMT)
Domain Generalization Using Large Pretrained Models with Mixture-of-Adapters [33.4] 本研究は, OODシナリオの処理を改善し, 領域一般化問題に取り組むために, 大規模事前学習モデルの知識を活用することを目的とする。
我々は,大規模モデルで作業しながらOODロバスト性を効果的に維持するために,パラメータ効率のよい微調整(PEFT)技術を用いる。
実験と分析により、最も効果的なアプローチは、多様なモデルを集結させ、事前学習の規模を増大させることであることを確認した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:57:05 GMT)
MBA-RAG: a Bandit Approach for Adaptive Retrieval-Augmented Generation through Question Complexity [30.3] 本稿では,クエリの複雑性に基づいて最適な検索戦略を動的に選択する強化学習ベースのフレームワークを提案する。
提案手法は,検索コストを低減しつつ,複数のシングルホップおよびマルチホップデータセット上でのアート結果の新たな状態を実現する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:17:46 GMT)
DHA: Learning Decoupled-Head Attention from Transformer Checkpoints via Adaptive Heads Fusion [29.5] 大規模言語モデル(LLM)のためのDHA(Decoupled-Head Attention)機構を提案する。
DHAは、様々なレイヤにわたるキーヘッドとバリューヘッドのグループ共有を適応的に構成し、パフォーマンスと効率のバランスを改善する。
我々の実験によると、DHAは97.6%の性能を達成するために、オリジナルのモデルの事前訓練予算のわずか0.25%しか必要としていない。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 13:23:39 GMT)
ADR-BC: Adversarial Density Weighted Regression Behavior Cloning [29.1] イミテーションラーニング(IL)法は、まず報酬やQ関数を定式化し、次にこの形の関数を強化学習フレームワーク内で使用して経験則を最適化する。
本稿では,ADR-BCを提案する。
ADR-BCは、一段階の行動クローニングフレームワークとして、多段階のRLフレームワークに関連する累積バイアスを回避する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:00:34 GMT)
Efficient and Private Marginal Reconstruction with Local Non-Negativity [29.0] 本稿では,限界クエリに対する応答を再構成するための基本的かつ効率的なポストプロセッシング手法ReMを提案する。
拡張GReM-LNNは、一貫性と非負性を満たすガウス雑音の下で境界を再構成する。
既存のプライベートクエリ応答機構を改善するためにReMとGReM-LNNを適用することで、ReMとGReM-LNNの有用性を実証する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:41:06 GMT)
Statistical Tests for Replacing Human Decision Makers with Algorithms [28.6] 各人間の意思決定者のパフォーマンスは、マシン予測のパフォーマンスとベンチマークされる。
我々は、意思決定者のサブセットによる診断を、機械学習アルゴリズムの推奨で置き換える。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:24:30 GMT)
Asymptotics of Linear Regression with Linearly Dependent Data [28.0] 非ガウス共変量の設定における線形回帰の計算について検討する。
本稿では,依存性が推定誤差と正規化パラメータの選択にどのように影響するかを示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 21:32:39 GMT)
Video2Reward: Generating Reward Function from Videos for Legged Robot Behavior Learning [27.2] そこで本研究では,シミュレーションや学習を行うビデオから報酬関数を直接生成する,新しい video2reward 手法を提案する。
本手法は,人間の正規化スコアにおいて,最先端のLCMに基づく報酬生成手法の性能を37.6%以上上回る。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:10:27 GMT)
Uncovering Vision Modality Threats in Image-to-Image Tasks [26.7] 本稿では,様々な画像生成モデルが視覚的モダリティの脅威に直面することを明らかにするために,タイポグラフィー攻撃という手法を用いる。
また,視覚的モダリティの脅威に直面した既存手法の防御性能を評価し,その非効率性を明らかにする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:55:39 GMT)
On the Expressive Power of Modern Hopfield Networks [26.0] 現代のホップフィールドネットワーク(MHN)は、ディープラーニングの強力なツールとして登場した。
MHN は $mathsfDLOGTIME$-uniform $mathsfTC0$ であることを示す。
これらの結果は、現代のホップフィールドネットワークの表現力の限界を示している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:52:41 GMT)
Name Your Style: An Arbitrary Artist-aware Image Style Transfer [25.8] 任意のスタイル転送を制御するために,高度な画像テキストエンコーダを利用するテキスト駆動型画像スタイル転送(TxST)を提案する。
画像テキストモデルからスタイル記述を効果的に抽出するための対照的なトレーニング戦略を導入する。
我々はまた、スタイルやコンテンツの特徴を融合するクロスアテンションを探求する、新しく効率的なアテンションモジュールを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:23:24 GMT)
LLM with Relation Classifier for Document-Level Relation Extraction [25.6] 大規模言語モデル(LLM)は、自然言語処理のための新しいパラダイムを生み出した。
本稿では,この性能ギャップの原因を解明し,関係のないエンティティペアによるLCMによる注意の分散を重要要因とする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:43:20 GMT)
GROOT-2: Weakly Supervised Multi-Modal Instruction Following Agents [25.2] GROOT-2は、弱い監督と潜在変数モデルを組み合わせた新しいアプローチを用いて訓練されたマルチモーダルエージェントである。
GROOT-2の有効性は、ビデオゲームからロボット操作まで、四つの異なる環境で検証されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:47:49 GMT)
AI Planning: A Primer and Survey (Preliminary Report) [24.8] 本稿では,従来のAP問題と表現,およびマルコフ決定過程の定式化による不確実性と時間を扱う拡張について紹介する。
次に、AP問題を解くための最先端技術とアイデアを調査し、問題構造を活用できることに焦点を当てる。
最後に、非構造的な入力から学習し、未知のシナリオや状況に一般化するためのAP内のサブフィールドについて述べる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:00:25 GMT)
Multimodal Fusion Balancing Through Game-Theoretic Regularization [23.0] アンサンブルのような単純なベースラインを超越したマルチモーダルモデルの訓練には,現在のバランス手法が苦戦していることを示す。
マルチモーダルトレーニングにおけるすべてのモダリティが十分にトレーニングされていること、新しいモダリティからの学習が一貫してパフォーマンスを改善することを保証するにはどうすればよいのか?
本稿では,相互情報(MI)分解にインスパイアされた新たな損失成分であるMCRを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:56:16 GMT)
Engagement, User Satisfaction, and the Amplification of Divisive Content on Social Media [22.2] Twitterのエンゲージメントに基づくランキングアルゴリズムは、感情に満ちた、グループ外の敵対的なコンテンツを増幅する。
本稿では,ユーザの指定した嗜好に基づいてコンテンツをランク付けする代替アプローチの意義について考察する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:53:35 GMT)
T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts [21.9] T2I-FactualBench - 知識集約型概念生成の事実性を評価するために設計された概念とプロンプトの数で、これまでで最大のベンチマークである。
T2I-FactualBenchは、個々の知識概念の基本記憶から、複数の知識概念のより複雑な構成まで、三段階の知識集約型テキスト・画像生成フレームワークで構成されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:25:28 GMT)
LLMs-as-Judges: A Comprehensive Survey on LLM-based Evaluation Methods [21.6] 「LLMs-as-judges」は自然言語応答に基づく評価器である。
本稿では,5つの重要な視点から'LLMs-as-judges'パラダイムを包括的に調査する。
我々は,研究と実践の両方において,'LLMs-as-judges'の開発と適用に関する洞察を提供することを目的としている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:07:24 GMT)
EC-Chain: Cost-Effective Storage Solution for Permissionless Blockchains [21.5] EC-Chainは、無許可ブロックチェーンのためのコスト効率のよいストレージソリューションである。
台帳データの場合、EC-Chainは既存の消去符号ベースのストレージ最適化技術を洗練する。
また、実装が容易なデュアルトリー状態管理システムも導入する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:11:27 GMT)
Key-Grid: Unsupervised 3D Keypoints Detection using Grid Heatmap Features [20.9] 我々は、剛体および変形可能な物体の両方に対して、キーグリッド(Key-Grid)を革新的な教師なしキーポイント検出器として導入する。
同定されたキーポイントを利用して,デコーダ部で使用されるグリッドヒートマップと呼ばれる3次元グリッド特徴ヒートマップを形成する。
Key-Gridはキーポイントのセマンティック一貫性と位置精度に関する最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:59:02 GMT)
Towards Learning to Reason: Comparing LLMs with Neuro-Symbolic on Arithmetic Relations in Abstract Reasoning [20.7] この研究は、Ravenのプログレッシブ行列(RPM)の解法における大規模言語モデル(LLM)とニューロシンボリックアプローチを比較する。
解析の結果,算術規則の理解と実行におけるLLMの弱点に根本原因があることが判明した。
我々はARLCがI-RAVENの中心星座でほぼ完全な精度を達成し、算術規則における高い忠実性を示すことを発見した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:45:39 GMT)
TB-HSU: Hierarchical 3D Scene Understanding with Contextual Affordances [20.4] 本研究では,3次元階層的なシーングラフを用いて,機能的可利用性の変化と構造を学習するモデルを構築した。
様々な機能的余裕は、グラフの様々な空間的コンテキストと統合するように設計されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:23:17 GMT)
SpecGen: Automated Generation of Formal Program Specifications via Large Language Models [20.4] SpecGenは、大規模言語モデルに基づく形式的なプログラム仕様生成のための新しいテクニックである。
SV-COMP 279ベンチマークと手動で構築したデータセットを含む2つのデータセット上でSpecGenを評価する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:50:25 GMT)
Ranking of Large Language Model with Nonparametric Prompts [20.0] 大規模言語モデル(LLM)のランキングの推測について考察する。
本稿では,仮説を検証し,言語モデルランキングの信頼区間を構築するための新しい推論フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:34:30 GMT)
Rethinking Annotation for Object Detection: Is Annotating Small-size Instances Worth Its Cost? [19.5] 本研究では,テスト時に入力画像をアップスケールする手法と,トレーニング時にイメージをダウンスケールする手法を評価する。
本手法では, 異なるスケールの入力画像に対して同じ検出器を2回適用する必要があるが, 蒸留により同一のベースライン検出器と同等に機能する単一パス検出器が得られることを示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 10:54:01 GMT)
A Prompt Learning Framework for Source Code Summarization [19.2] 本稿では,PromptCSと呼ばれるコード要約のための効果的なプロンプト学習フレームワークを提案する。
PromptCSはプロンプトエージェントを訓練し、コード要約において大きな言語モデルの可能性を解き放つために連続的なプロンプトを生成する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:30:16 GMT)
Sufficient Context: A New Lens on Retrieval Augmented Generation Systems [19.2] LLMをコンテキストで拡張すると、多くのアプリケーションのパフォーマンスが向上する。
我々は、クエリに答える十分な情報を持つインスタンスを分類すると共に、十分なコンテキストという新しい概念を開発する。
LLMはコンテキストが十分である場合,クエリの応答に優れるが,コンテキストが不適切でない場合,しばしば不適切な回答を出力する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:06:41 GMT)
Graph with Sequence: Broad-Range Semantic Modeling for Fake News Detection [19.0] Breakは偽ニュース検出のための広範囲セマンティクスモデルである。
完全に接続されたグラフを利用して、包括的なセマンティクスをキャプチャする。
構造ノイズと特徴ノイズの両方を最小限に抑えるために、デュアルデノゲーションモジュールを使用している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:35:46 GMT)
Training-Free Bayesianization for Low-Rank Adapters of Large Language Models [19.0] トレーニング自由ベイジアン化(TFB)は、既存の既製のトレーニング済みのLoRAアダプタを、追加のトレーニングなしでベイジアンに変換する。
TFBは既存の手法に比べて精度の高い不確実性推定と一般化を実現していることを示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:49:27 GMT)
Controlling Multiple Errors Simultaneously with a PAC-Bayes Bound [18.9] Kullback-Leibler 分岐をバウンダリングすることで、豊富な情報を提供できる最初の PAC-Bayes 境界を提供する。
我々の境界は、異なる誤分類の重大さが時間とともに変化する可能性がある場合に特に有用である。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:42:09 GMT)
CoherentGS: Sparse Novel View Synthesis with Coherent 3D Gaussians [18.4] 2次元画像空間で制御できる構造付きガウス表現を導入する。
次に、ガウス群、特にその位置を制約し、最適化中に独立に動くのを防ぐ。
我々は,様々な場面における最先端のスパースビュー NeRF ベースのアプローチと比較して,顕著な改善を示した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:07:11 GMT)
PrivacyRestore: Privacy-Preserving Inference in Large Language Models via Privacy Removal and Restoration [18.1] PrivacyRestoreは、推論中のユーザの入力のプライバシを保護するためのプラグイン・アンド・プレイ方式である。
プライバシストアの有効性を評価するために、医療ドメインと法律ドメインをカバーする3つのデータセットを作成します。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:36:53 GMT)
Semantic loss guided data efficient supervised fine tuning for Safe Responses in LLMs [18.0] 有害なプロンプトに対する安全でない応答を生成する大規模言語モデル(LLM)は、彼らのアプリケーションにおいて重要な問題である。
本稿では,この問題を克服し,高品質な人的データを必要とする限界を克服することを目的とする。
負のEarth Mover Distance(EMD)損失と組み合わせたセマンティックコストを用いることで、LLMが安全でない応答を発生させないよう誘導する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:35:14 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Object-Oriented Programming [18.0] オブジェクト指向プログラミング(OOP)は、現代のソフトウェアシステムの複雑さの増大を管理するための重要なパラダイムになっています。
この作業は、これらのドメイン内でOOP技術を統合するための包括的な紹介を提供する。
機械学習システムの構造と効率を高めるために,設計パターンとモジュールプログラミングをどのように利用することができるかを検討する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:27:07 GMT)
RSUniVLM: A Unified Vision Language Model for Remote Sensing via Granularity-oriented Mixture of Experts [17.8] 複数の粒度にまたがる包括的視覚理解のための統一型エンドツーエンドRS VLMであるRSUniVLMを提案する。
RSUniVLMは、変更検出や変更キャプションのインスタンスを含む、マルチイメージ解析において効果的に機能する。
また、RSと一般ドメインの両方の既存のデータセットに基づいて、大規模なRS命令追従データセットを構築した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:11:21 GMT)
RefSAM3D: Adapting SAM with Cross-modal Reference for 3D Medical Image Segmentation [17.7] Segment Anything Model(SAM)は、2Dの自然画像のグローバルなパターンを捉えるのに優れています。
本稿では,3次元画像アダプティブと相互参照プロンプト生成を組み込むことにより,SAMを3次元医用画像に適応させるRefSAM3Dを紹介する。
医療画像における複雑な解剖学的構造を正確に区分する上で,SAMの応用を推し進めた。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 10:22:46 GMT)
Partially Synchronous BFT Consensus Made Practical in Wireless Networks [16.9] 我々は,信頼度の高い1-to-N,N-to-1,N-to-N通信をサポートするReduceeCatchと呼ばれる無線通信プロトコルを提案する。
我々はReduceeCatchを用いて、有線からアドホック無線ネットワークへのシームレスな適応のために、3つの部分同期BFTコンセンサスプロトコルを調整する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:55:32 GMT)
113 km absolute ranging with nanometer precision [16.9] 本研究では, 距離113kmでの航続を成功させる2方向デュアルコムレンジ手法を提案する。
得られた精度は、11.5 $mu$m @ 1.3 ms、681 nm @ 1 s、82 nm @ 21 sである。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:25:23 GMT)
Learning Soft Driving Constraints from Vectorized Scene Embeddings while Imitating Expert Trajectories [16.7] 運動計画の第一の目的は、車両の安全で効率的な軌道を生成することである。
伝統的に、運動計画モデルは、人間の専門家の行動を模倣するために模倣学習を用いて訓練される。
本研究では,制約学習を模倣学習に統合する手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:29:28 GMT)
ULMRec: User-centric Large Language Model for Sequential Recommendation [16.5] ユーザがカスタマイズした好みを大規模言語モデルに統合するフレームワークであるULMRecを提案する。
2つの公開データセットに対する大規模な実験は、ULMRecが既存の手法を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:37:00 GMT)
Investigating social alignment via mirroring in a system of interacting language models [16.3] マルチエージェントシステムにおけるミラーリングがアライメントに及ぼす影響について検討する。
このフレームワークで大規模言語モデルと対話するシステムをシミュレートする。
システム行動は各エージェントの通信範囲に強く影響されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:19:57 GMT)
TLDR: Text Based Last-layer Retraining for Debiasing Image Classifiers [15.7] グループバランスデータセットを用いたLast Layer Retraining(LLR)は,分類器の素早い相関を緩和する上で,効率的であることが示されている。
本研究では,大言語モデルで構築されたテキストデータセットをベースとしたLLRによる画像分類手法を提案する。
この手法をTLDR (Text-based Last layer retraining for Debiasing image classifieRs) と呼び,LLR法と競合する性能を示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:09:57 GMT)
Exploring the Use of LLMs for SQL Equivalence Checking [15.4] 2sqlクエリの等価チェックは難解な問題である。
既存の方法は、有界同値チェックであっても、sqlの小さなサブセットのみを扱うことができる。
本稿では,大言語モデル (LLM) が withsql クエリを推論する能力を示すことができるかどうかを考察する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:50:12 GMT)
LumiGauss: Relightable Gaussian Splatting in the Wild [15.1] 本稿では,LumiGaussについて紹介する。LumiGaussは2次元ガウススプラッティングによるシーンの3次元再構成と環境照明を実現する技術である。
提案手法は高品質なシーン再構成を実現し,新しい環境マップ下でのリアルな照明合成を実現する。
提案手法をNeRF-OSRデータセット上で検証し,ベースライン法よりも優れた性能を示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 13:52:04 GMT)
M$^3$PC: Test-time Model Predictive Control for Pretrained Masked Trajectory Model [14.8] 本稿では,モデル予測制御(MPC)を用いて,モデル自体の予測能力を利用して行動選択を誘導する手法を提案する。
MPCは、追加パラメータトレーニングなしで事前訓練された軌道モデルの意思決定性能を著しく改善する。
私たちのフレームワークは、オフラインからオンライン(O2O)のRLやゴールリーチのRLに適応することができます。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:44:22 GMT)
Efficient Verification of Stabilizer Code Subspaces with Local Measurements [14.5] 一般安定化器符号部分空間に対する2つの効率的な検証方法を提案する。
新しい戦略では、測定設定が大幅に少なくなり、状態コピーの消費も少なくなります。
この研究は、局所測定による安定化符号部分空間の効率的な検証に関する最初の体系的研究に寄与する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:32:30 GMT)
Test-time Cost-and-Quality Controllable Arbitrary-Scale Super-Resolution with Variable Fourier Components [14.3] 任意のスケールファクタとテスト時のコストと品質の制御性を備えた超解像は、様々なアプリケーションに不可欠である。
フーリエ表現を用いたリカレントニューラルネットワーク(RNN)を用いた新しいSR手法を提案する。
我々の手法は、他の最先端の任意のスケールのSR手法よりも低いPSNR低下を実現する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:18:07 GMT)
Jailbreak Large Vision-Language Models Through Multi-Modal Linkage [14.0] 我々は、MML攻撃という新しいジェイルブレイク攻撃フレームワークを提案する。暗号からインスピレーションを得たMMLは、テキストと画像のモダリティをまたいだ暗号化復号プロセスを利用して、悪意のある情報の過剰露出を軽減する。
MMLjailbreaks GPT-4o with attack success rate 97.80% on SafeBench, 98.81% on MM-SafeBench, 99.07% on HADES-Dataset。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:21:57 GMT)
Radiant: Large-scale 3D Gaussian Rendering based on Hierarchical Framework [13.6] 大規模シーン再構成のための階層型3DGSアルゴリズムであるRadiantを提案する。
Radiantは、リビルド品質を最大25.7%改善し、エンドツーエンドのレイテンシを79.6%削減した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:48:00 GMT)
Can large language models be privacy preserving and fair medical coders? [13.5] 差別化プライバシ(DP)は、そのような設定でプライバシを保存するための一般的な方法である。
医用符号化のNLPタスク(ICD分類)にDPを適用する際の2つの重要なトレードオフについて検討する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:27:05 GMT)
EquiJump: Protein Dynamics Simulation via SO(3)-Equivariant Stochastic Interpolants [13.5] EquiJumpは移動可能なSO(3)-同変モデルで、全原子タンパク質の動力学シミュレーションの時間ステップを直接ブリッジする。
提案手法は様々なサンプリング手法を達成し,高速な折りたたみタンパク質の軌道データに基づく既存のモデルと比較した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 23:05:50 GMT)
Rate-Distortion Optimized Skip Coding of Region Adaptive Hierarchical Transform Coefficients for MPEG G-PCC [13.1] 3次元(3D)点雲は3Dオブジェクトやシーンを表現するためにますます人気が高まっている。
この課題に対処するため、Moving Picture Experts Groupは、GeometryベースのPoint Cloud Compression(G-PCC)標準を積極的に開発している。
RAHTの適応スキップ手法を提案し,最後の数層の残余を符号化するか否かを適応的に決定する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:43:44 GMT)
Leveraging Black-box Models to Assess Feature Importance in Unconditional Distribution [13.0] 結果の非条件分布に関連する特徴重要度曲線を計算する近似法を開発した。
我々の近似法はスパースで忠実な結果を生成し,計算効率が高い。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 23:00:21 GMT)
FIPER: Generalizable Factorized Fields for Joint Image Compression and Super-Resolution [12.8] 本稿では,超解法(SR)と画像圧縮の統一表現をFactized Fieldsと呼ぶ。
提案手法は,画像のマルチスケールな視覚的特徴や構造的要素を明示的に捉えるために,基底係数分解を利用する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:16:24 GMT)
Local Linear Convergence of Infeasible Optimization with Orthogonal Constraints [12.4] 効率的な代替手段として、不可能なリトラクションに基づくアプローチが提案された。
本稿では,ニューラルネットワークPL条件のみを用いたスムーズな非自由成分分析のための新しいランディングアルゴリズムを確立する。
数値実験により、ランディングアルゴリズムは、計算オーバーヘッドを大幅に削減した最先端のリトラクションベース手法と同等に動作することを示した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:02:27 GMT)
Fragmented Layer Grouping in GUI Designs Through Graph Learning Based on Multimodal Information [12.3] 産業的なGUI-to-codeプロセスでは、断片化されたレイヤによって生成されたコードの可読性と保守性が低下する可能性がある。
本研究では,設計プロトタイプのマルチモーダル情報に基づいて,断片化層群問題にグラフ学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:31:09 GMT)
A polar coordinate system represents syntax in large language models [12.2] 構文木は、大きな言語モデルの活性化において効果的に表されることもある。
単語埋め込み間の距離と方向の両方から統語的関係を読み取るために訓練された「Polar Probe」を導入する。
まず、私たちの極性プローブは、構文関係のタイプと方向を回復し、構造プローブをほぼ2倍に大きく上回っています。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:37:20 GMT)
Active Sequential Posterior Estimation for Sample-Efficient Simulation-Based Inference [12.0] 逐次的神経後部推定(ASNPE)を導入する。
ASNPEは、シミュレーションパラメータ候補の効用を基礎となる確率モデルに推定するために、推論ループにアクティブな学習スキームをもたらす。
提案手法は,大規模実世界の交通ネットワークにおいて,高度に調整されたベンチマークと最先端の後方推定手法より優れる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:57:26 GMT)
SMI-Editor: Edit-based SMILES Language Model with Fragment-level Supervision [12.0] 本稿では,SMI-Editorを提案する。
SMI-Editorは分子内のサブ構造をランダムに破壊し、結果のSMILESをモデルに戻す。
その後、編集プロセスを通じて元のSMILESを復元しようとする。
実験結果から,SMI-Editorは複数の下流分子タスクにまたがる最先端性能を実現することがわかった。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:32:55 GMT)
Non-Homophilic Graph Pre-Training and Prompt Learning [12.0] 本稿では,好ましくないグラフに対する事前学習と迅速な学習の枠組みであるProNoGを提案する。
まず、既存のグラフ事前学習手法を分析し、事前学習タスクの選択に関する理論的知見を提供する。
第2に,各ノードが特異な非ホモフィル性を示すことを認識し,下流タスクにおけるノード固有のパターンを特徴付ける条件付きネットワークを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:28:09 GMT)
Improving Neuron-level Interpretability with White-box Language Models [11.9] 我々は、CRATE(Coding RAte TransformEr)という、ホワイトボックストランスフォーマーのようなアーキテクチャを導入する。
包括的実験では、ニューロンレベルの解釈可能性において、顕著な改善(最大103%の相対的な改善)が見られた。
CRATEの解釈可能性の向上は、関連するトークンを一貫して一意に活性化する能力の強化によるものである。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 13:38:20 GMT)
FinTruthQA: A Benchmark Dataset for Evaluating the Quality of Financial Information Disclosure [11.1] FinTruthQAは6000の現実世界の財務Q&Aエントリで構成され、各Q&Aは4つの主要な評価基準に基づいて手動でアノテートされた。
我々はFinTruthQA上で,統計的機械学習モデル,事前学習言語モデル,微調整バージョンなど,さまざまなNLP手法をベンチマークした。
FinTruthQAは監査人、規制当局、金融アナリストがリアルタイム監視やデータ駆動意思決定に使用することができる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:47:26 GMT)
Upcycling Noise for Federated Unlearning [10.9] 不明瞭性を伴うフェデレーション・アンラーニング(FUI)
FuIは、ローカルモデルリトラクションとグローバルノイズキャリブレーションの2つの主要なステップで構成されている。
FuIはメインストリームのFU方式に比べて優れたモデル性能と高い効率を実現している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:07:40 GMT)
CLIP-TNseg: A Multi-Modal Hybrid Framework for Thyroid Nodule Segmentation in Ultrasound Images [10.9] 超音波画像における甲状腺結節分節は正確な診断と治療計画に不可欠である。
既存の手法は、セグメンテーションの精度、解釈可能性、一般化の課題に直面しており、それらの性能を妨げている。
この記事では、ニューラルネットワークアーキテクチャにマルチモーダルな大モデルを統合することにより、これらの問題に対処する新しいフレームワークであるCLIP-TNsegを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:10:37 GMT)
Evaluating Automated Radiology Report Quality through Fine-Grained Phrasal Grounding of Clinical Findings [10.5] 本研究は, 多数の臨床所見の位置, 側方性, 重症度を把握した, きめ細かい発見パターンを抽出し, 報告品質評価法を開発した。
次に、テキストと視覚の計測値を組み合わせて、生成されたレポートの品質を評価する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 23:21:54 GMT)
Multimodal Biometric Authentication Using Camera-Based PPG and Fingerprint Fusion [10.4] 本稿では,ビデオから抽出したPSG信号を指紋データと統合し,ユーザ認証の精度を高めるマルチモーダルバイオメトリックシステムを提案する。
システムは、カメラのレンズに指先を数秒で配置し、ユニークな生体特性のキャプチャと処理を可能にする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:09:40 GMT)
SignAvatar: Sign Language 3D Motion Reconstruction and Generation [10.3] SignAvatarは、単語レベルの手話の再構築と生成が可能なフレームワークである。
身体,手,顔の3次元関節回転データからなるASL3DWordデータセットをコントリビュートする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:57:28 GMT)
Evaluating Hallucination in Text-to-Image Diffusion Models with Scene-Graph based Question-Answering Agent [9.7] 有効なテキスト・ツー・イメージ(T2I)評価指標は以下のとおりである: 生成された画像がテキストのプロンプトと一致しないインスタンスを検出する。
抽出したシーングラフを用いて質問応答を行うための大規模言語モデル (LLM) に基づく手法を提案し, 生成された画像に対する評価スコアを用いたデータセットを作成する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:44:38 GMT)
MDiFF: Exploiting Multimodal Score-based Diffusion Models for New Fashion Product Performance Forecasting [9.1] 新しいファッション製品性能予測(NFPPF)のための2段階多モード拡散モデルに基づくパイプライン MDiFFを提案する。
まず、スコアベースの拡散モデルを用いて、異なる服の今後の売上予測を行い、次に、これら複数の予測を軽量な多層パーセプトロン(MLP)で洗練し、最終的な予測を得る。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:15:59 GMT)
Dif4FF: Leveraging Multimodal Diffusion Models and Graph Neural Networks for Accurate New Fashion Product Performance Forecasting [9.1] 本稿では,新しいファッション製品パフォーマンス予測(NFPPF)のための2段階パイプラインであるDif4FFを提案する。
Dif4FFは、まずマルチモーダルスコアに基づく拡散モデルを用いて、様々な衣服の複数の販売軌跡を時間とともに予測する。
予測は強力なGraph Convolutional Network(GCN)アーキテクチャを使って洗練される。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:03:59 GMT)
A Survey on Uncertainty Quantification of Large Language Models: Taxonomy, Open Research Challenges, and Future Directions [9.0] 大規模言語モデル (LLMs) は、信頼性を高く表現した、妥当で、事実的に正しくない応答を生成する。
従来の研究では、LLMが生み出す幻覚やその他の非現実的な反応は、関連するプロンプトに対するLLMの不確実性を調べることによって検出できることが示されている。
本調査は, LLMの健全な特徴と強度, 弱点を識別し, 既存の不確実性定量化手法を幅広く検討することを目的としている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:56:01 GMT)
Enhancing Sample Generation of Diffusion Models using Noise Level Correction [9.0] 提案手法は, 推定雑音レベルと雑音の真の距離を多様体に合わせることで, サンプル生成を向上する手法である。
具体的には,事前学習した騒音レベル補正ネットワークを導入し,騒音レベル推定を改良する。
実験結果から,本手法は,制約のない生成シナリオと制約のない生成シナリオの両方において,サンプルの品質を著しく向上することが示された。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:19:14 GMT)
The Matrix Reloaded: A Mechanized Formal Analysis of the Matrix Cryptographic Suite [9.0] マトリックスで使用される暗号プロトコルであるOlmとMegolmについて検討する。
私たちはVerifpalを使ってオルムとメゴルムの形式モデルとそれらの構成を構築します。
我々はOlmとMegolmに関する様々な特性を証明し、認証、機密性、フォワード・シークレット、およびポスト・コンプロミズ・セキュリティを含む。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:10:33 GMT)
Quamba: A Post-Training Quantization Recipe for Selective State Space Models [8.9] State Space Models (SSM) は、大きな言語モデルのためのTransformerに代わる魅力的な代替品として登場した。
本研究では,入力アクティベーションの最大値を選択的SSMに抑制する静的8ビットSSM量子化法を提案する。
8ビットのウェイトアクティベーションを量子化したMamba 2.8B SSMはハードウェアアクセラレーションの恩恵を受け、Nvidia Orin Nano 8Gでは1.72倍のレイテンシを実現しています。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:27:00 GMT)
Verbosity $\neq$ Veracity: Demystify Verbosity Compensation Behavior of Large Language Models [8.8] 大規模言語モデル(LLM)の好ましくない振る舞いの下位タイプを発見する。
我々はVerbosity Compensation (VC) を不確実性下での人間の鎮静行動と類似しているとしている。
本稿では, 冗長応答を他のモデル生成応答に置き換える, 単純で効果的なカスケードアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 22:11:27 GMT)
Relax and Merge: A Simple Yet Effective Framework for Solving Fair $k$-Means and $k$-sparse Wasserstein Barycenter Problems [8.7] 複数のグループからなるデータセットが与えられた場合、公正性制約は各クラスタに各グループからのポイントの割合を含む必要がある。
我々はRelax と Merge' のフレームワークを提案し、$rho$ は既製のvanilla $k$-means アルゴリズムの近似比である。
PTASが$k$-meansである場合、我々の解は、フェアネス制約にわずかに違反するだけで、$(5+O(epsilon))$の近似比を達成できる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 13:09:43 GMT)
Biological Brain Age Estimation using Sex-Aware Adversarial Variational Autoencoder with Multimodal Neuroimages [8.6] 性対応性差型自動エンコーダ(SA-AVAE)を用いた脳年齢推定のための新しい枠組みを提案する。
我々は、潜在空間をモダリティ固有のコードと共有コードに分解し、モダリティの相補的および共通的な情報を表す。
我々は、学習した潜伏コードに性情報を組み込んで、モデルが脳年齢推定のために性固有の老化パターンをキャプチャすることを可能にする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 12:10:29 GMT)
Detecting outliers by clustering algorithms [8.6] アウトレーヤは、オブジェクト間の類似性を決定するために、しばしばクラスタリングアルゴリズムに干渉する。
我々は,クラスタリングのための新しい外乱検出手法,ODARを提案する。
ODARは、異常値と通常のオブジェクトを特徴変換によって2つの分離クラスタにマッピングする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:33:26 GMT)
EntGPT: Linking Generative Large Language Models with Knowledge Bases [8.6] ELタスクの強化に先進的なプロンプトエンジニアリングを採用したEntGPTを導入する。
この3段階のハードプロンプト法(EntGPT-P)は,バニラプロンプトよりもマイクロF_1スコアを最大36%向上させる。
命令チューニング手法EntGPT-I(EntGPT-I)は,教師付きELタスクの平均2.1%のマイクロF_1スコアを改善する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:56:01 GMT)
Adaptable and Reliable Text Classification using Large Language Models [8.0] 本稿では,Large Language Models(LLMs)を活用した適応的で信頼性の高いテキスト分類パラダイムを提案する。
我々は、4つの多様なデータセット上で、複数のLLM、機械学習アルゴリズム、ニューラルネットワークベースのアーキテクチャの性能を評価した。
システムの性能は、少数ショットや微調整の戦略によってさらに向上することができる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:33:20 GMT)
Efficient Sparse State Preparation via Quantum Walks [7.8] 動的グラフ上の連続時間量子ウォーク(CTQW)は、最近導入された計算の普遍モデルである。
動的CTQWからゲートモデルへのマッピングをアルゴリズムの形で開発し,任意の単一エッジウォークと単一自己ループウォークを変換する。
このマッピングを用いて、動的CTQWに基づく効率的なスパース量子状態準備フレームワークを導入する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:59:09 GMT)
SpectroMotion: Dynamic 3D Reconstruction of Specular Scenes [7.6] 本稿では,3次元ガウススティング(3DGS)と物理ベースレンダリング(PBR)と変形場を組み合わせた新しいアプローチであるSpectroMotionを提案する。
現実の動的スペキュラシーンを合成できる唯一の3DGS法であり、複雑な、動的、およびスペキュラシーンのレンダリングにおける最先端の手法よりも優れている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:56:01 GMT)
SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantization [7.2] 大きな言語モデル(LLM)は、様々なタスクにまたがって素晴らしいパフォーマンスを示すが、推論のためにそれらをデプロイすることは、課題を引き起こす。
SKIM: Scaled K-means clustering wIth Mixed precisionを提案する。
モデルパープレキシティの観点からは、3ビット量子化LLaMAモデルとそれらの完全精度モデルとのギャップを平均16.3%縮小する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:17:57 GMT)
Impact of Sunglasses on One-to-Many Facial Identification Accuracy [7.1] 1対多の顔認証に使われるプローブ画像は、監視ビデオのフレームから収集されることが多い。
ムグショット品質の画像に対するサングラスの精度は、強いぼやけや顕著に低い解像度に類似した量で低下することを示した。
暗いサングラスによる精度劣化を改善するため,すべてのギャラリー画像にサングラスを合成することにより,失った精度の約38%を回復できることを示した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:35:05 GMT)
Unveiling Performance Challenges of Large Language Models in Low-Resource Healthcare: A Demographic Fairness Perspective [7.1] 我々は、6つの多様な医療タスクにまたがる3つの一般的な学習フレームワークを用いて、最先端の大規模言語モデル(LLM)を評価した。
LLMを現実の医療タスクに適用する上での重大な課題と、人口統計群全体での永続的公平性の問題を見出した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:00:45 GMT)
Timely reliable Bayesian decision-making enabled using memristors [7.0] 脳はベイズ定理によってタイムリーに信頼できる意思決定を行う。
ベイズ定理は事象を確率として定量化し、確率規則を通じて決定を下す。
本稿では,メムリスタを用いた確率論的計算手法を提案し,ベイズ定理を実装した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:12:23 GMT)
DM-SBL: Channel Estimation under Structured Interference [6.9] チャネル推定は通信システムの基本課題であり、効率的な復調に不可欠である。
この研究は、ホワイトガウスノイズ(AWGN)と構造化干渉が共存するより困難なシナリオに対処する。
これらのシナリオにおいて正確なチャネル推定を保証するために、遅延領域内のチャネルの間隔と干渉の複雑な構造を併用する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:26:00 GMT)
Future and AI-Ready Data Strategies: Response to DOC RFI on AI and Open Government Data Assets [6.7] 以下は、AIとOpen Government Data Assetsに関する米国商務省の情報要求(RFI)に対する回答である。
当社は、組織やデータの共有に関する公的洞察を求める取り組みについて、省に感謝する。
弊社の回答では、AIと商務省のOpen Government Data Assetsに対するベストプラクティスと重要な考察を概説する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:25:05 GMT)
Securing Social Media Against Deepfakes using Identity, Behavioral, and Geometric Signatures [6.4] ソーシャルメディアへの信頼は、社会的な大きな変化に影響を及ぼす能力によって、懸念が高まっている。
ディープフェイクマルチメディアは共有コンテンツの信頼性を損なう。
既存の検出テクニックは、トレーニングされた特定のタイプのディープフェイクに対してのみ、うまく機能する傾向があります。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:17:21 GMT)
SwiftEdit: Lightning Fast Text-Guided Image Editing via One-Step Diffusion [6.4] 我々は,テキスト誘導画像編集を実現するシンプルな,かつ高効率な編集ツールであるSwiftEditを紹介した。
SwiftEditの進歩には、2つの新しいコントリビューションがある。
特にSwiftEditは、従来のマルチステップメソッドよりもはるかに高速な、インスタントテキストガイドの画像編集を可能にする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:17:10 GMT)
Partition of Unity Physics-Informed Neural Networks (POU-PINNs): An Unsupervised Framework for Physics-Informed Domain Decomposition and Mixtures of Experts [6.2] 本研究では,空間逆を特定の支配物理と同一視する,教師なし学習フレームワークを提案する。
この手法の重要な特徴は、ラベル付きデータを必要としない物理特性の変動を検出する物理残差に基づく損失関数である。
その効果は多孔質熱媒質アブレーションと氷シートモデリングに応用することで実証される。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:07:43 GMT)
Unveiling Non-Hermitian Spectral Topology in Hyperbolic Lattices with Non-Abelian Translation Symmetry [5.9] 我々は、双曲格子(HBL)の相互空間から、開境界条件(OBC)の下でスペクトルを決定するためのアプローチを開発する。
非アベリア翻訳群が許容する状態を含むようにスーパーセルを導入することにより、解析的連続と点ギャップ位相に基づく基底を行い、一様スペクトルを得る。
この手法を単バンド非相互モデルと逆アベリア半金属モデルに適用することにより、高次元の皮膚効果と位相相転移を明らかにする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 10:33:53 GMT)
The Impact of User-Level Explanation Properties on Explanation Goals in Recommender Systems [5.6] Recommender Systems(RS)におけるユーザの透明性、説得性、エンゲージメント、信頼を改善する上で、説明は不可欠である。
本稿では,属性の多様性や人気度などのユーザレベルの説明特性が,説明目標に対するユーザ認識に与える影響について検討する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:03:35 GMT)
UMSPU: Universal Multi-Size Phase Unwrapping via Mutual Self-Distillation and Adaptive Boosting Ensemble Segmenters [5.6] UMSPU(Universal Multi-Size Phase Unwrapping Network)を構築するために,相互自己蒸留機構と適応的なアンサンブルセグメンタを提案する。
実験結果から,UMSPUは画像サイズ制限を克服し,256*256から2048*2048までの画像サイズ(8倍)の高精度化を実現していることがわかった。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:38:29 GMT)
Flex Attention: A Programming Model for Generating Optimized Attention Kernels [5.5] FlexAttentionは、コンパイラ駆動のプログラミングモデルで、数行のPyTorchコードで注目の変種を実装できます。
我々は、FlexAttentionが注意変異の簡易な構成を可能にし、注意変異の爆発を解決する方法を実証する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:46:38 GMT)
LaMoD: Latent Motion Diffusion Model For Myocardial Strain Generation [5.4] 本稿では,標準CMRビデオから高精度なDENSE動作を予測するため,新しいラミネートモーション拡散モデル(LaMoD)を提案する。
実験の結果,提案手法であるLaMoDは標準CMR画像の動作解析の精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:34:49 GMT)
Towards 3D Acceleration for low-power Mixture-of-Experts and Multi-Head Attention Spiking Transformers [5.1] Spiking Neural Networks(SNN)は、エネルギー効率のよいディープラーニングを解き放つ上で重要な、脳にインスパイアされたイベント駆動のメカニズムを提供する。
本稿では,Mixture-of-ExpertsとMulti-Head Attention Spiking Transformerの最初の3Dハードウェアアーキテクチャと設計手法を紹介する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:15:05 GMT)
Shifting NER into High Gear: The Auto-AdvER Approach [5.1] Auto-AdvERは、このドメインにおけるテキストマイニング分析を強化するように設計されている。
コンディション、ヒストリック、セールオプションの3つのラベルからなるスキーマを提案する。
我々は,エンコーダのみのモデルであるBERT,DeBERTaV3,デコーダのみのオープンかつクローズドソースのLarge Language Models (LLMs) を用いて,性能を比較した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:00:06 GMT)
A Comprehensive Assessment Benchmark for Rigorously Evaluating Deep Learning Image Classifiers [4.8] 本稿では,多種多様なデータを用いたベンチマーキング性能について論じる。
現在のディープニューラルネットワークは、最先端のロバスト性を生み出すと信じられている手法で訓練された者を含む、ある種のデータに間違いを犯すことに対して極めて脆弱であることが判明した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 13:38:12 GMT)
AutoURDF: Unsupervised Robot Modeling from Point Cloud Frames Using Cluster Registration [4.7] AutoURDFは、ポイントクラウドフレームから見えないロボットのための記述ファイルを構築するための教師なしのアプローチである。
本研究は,(1)移動部セグメンテーション,(2)身体トポロジ推論,(3)関節パラメータ推定といった課題に階層的に対処する。
以上の結果から,本手法は従来手法の登録精度と身体のトポロジー推定精度に優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:40:55 GMT)
STEAM-EEG: Spatiotemporal EEG Analysis with Markov Transfer Fields and Attentive CNNs [4.7] 本稿では,コンピュータグラフィックス技術と生体信号認識パターンを統合した新しいアプローチを提案する。
提案するフレームワーク(TEAM-EEG)は,MTFを用いて脳波信号のダイナミクスを捉える。
これらの画像は、最先端のコンピュータグラフィックス技術を使ってレンダリングされ、視覚化され、モデル化される。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:07:20 GMT)
GAF-FusionNet: Multimodal ECG Analysis via Gramian Angular Fields and Split Attention [4.7] 本稿では,時系列解析と画像ベース表現を統合した新しいECG分類フレームワークを提案する。
我々は、ECG200、ECG5000、MIT-BIH Arrhythmia Databaseの3つの多様なデータセット上でECG-FusionNetを評価した。
その結果,各データセットの94.5%,96.9%,99.6%の精度が得られた。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:02:16 GMT)
Segment-Level Road Obstacle Detection Using Visual Foundation Model Priors and Likelihood Ratios [4.6] 現在の道路障害物検出方法は各画素にスコアを割り当て、しきい値を適用して最終的な予測を生成する。
道路障害物を直接予測するために,視覚基盤モデルと確率比からセグメントレベルの特徴を利用する新しい手法を提案する。
個々の画素ではなくセグメントに注目することにより,検出精度を高め,偽陽性を低減し,シーンの変動性にロバスト性を高める。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:40:20 GMT)
On the effective transfer of knowledge from English to Hindi Wikipedia [4.4] 英語とヒンディー語の間の知識の共有性を高めるための軽量な枠組みを提案する。
英語のウィキペディアページが最新でない場合、我々のフレームワークはウィキペディア特有のスタイルに適合するように適応します。
本フレームワークは,ヒンディー語ウィキペディアのセクションに対して,自動的および人的判断に基づく評価に基づいて,ヒンディー語ウィキペディア記事の65%と62%を効果的に生成する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:43:21 GMT)
No-Free-Lunch Theories for Tensor-Network Machine Learning Models [4.4] 特定のテンソルネットワーク機械学習モデルの形式化が不可欠で悪名高い、No-free-Lunch定理の厳密な定式化に注力する。
まず、行列積状態、すなわち1次元テンソルネットワーク状態に基づく機械学習モデルに対するノーランチ定理を証明した。
2次元イジングモデルにおける分割関数の計算の難題を回避し、2次元の絡み合ったペア状態の場合のノーランチ定理を証明した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:41:24 GMT)
Convergence analysis of wide shallow neural operators within the framework of Neural Tangent Kernel [4.3] ニューラルタンジェントカーネル(NTK)の枠組みにおける幅の狭いニューラル作用素の勾配降下の収束解析を行う。
過度なパラメータ化の設定の下では、勾配降下は連続時間であるか離散時間であるかに関わらず、大域的な最小値を見つけることができる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:47:28 GMT)
A Dataset and Benchmark for Hospital Course Summarization with Adapted Large Language Models [4.1] 大規模言語モデル(LLM)は、現実世界のタスクを自動化する際、顕著な能力を示しているが、医療応用の能力は示されていない。
臨床ノートと短い病院コースをカプセル化したMIMIC-IV-BHC(MIMIC-IV-BHC)を導入した。
臨床ノートを入力として,3つのオープンソースLSMと2つの独自LSMに対して,プロンプトベース(文脈内学習)と微調整ベースの適応戦略を適用した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:59:15 GMT)
Learning Gentle Grasping from Human-Free Force Control Demonstration [4.1] そこで本研究では,データサイズに制限のある人手と同様の動作を実現するために,理想的な力制御実験から把握する手法を提案する。
提案手法は,人間の実演を伴わない参照力曲線の自動生成に,既知の接触特性を持つ物体を用いる。
この方法は視覚に基づく触覚センサに効果的に適用でき、地面からの物体の緩やかで安定した把握を可能にする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:16:30 GMT)
Trimming Down Large Spiking Vision Transformers via Heterogeneous Quantization Search [3.8] スパイキングニューラルネットワーク(SNN)は、エッジデバイスやニューロモルフィックハードウェアへの展開に適している。
層ワイド量子化によりスパイキング変圧器を圧縮する新しい異種量子化法を提案する。
提案手法は, 精度85.3%, 97.57%, 80.4%を維持しながら, 5.69x, 8.72x, 10.2xの大幅なエネルギー削減を実現する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:34:02 GMT)
Self-Supervised Masked Mesh Learning for Unsupervised Anomaly Detection on 3D Cortical Surfaces [3.7] 脳画像における教師なし異常検出は困難である。
3次元皮質表面における異常検出のための自己教師付きマスクメッシュ学習を提案する。
本フレームワークはアルツハイマー病のバイオマーカーとして知られ, 皮質厚, 皮質容積, 皮質sulcusの特徴の異常を検出することができる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:08:24 GMT)
Efficient Distributed Training through Gradient Compression with Sparsification and Quantization Techniques [3.6] 50倍の圧縮でトップkとDGCを使用するとパフォーマンスが向上し、ベースラインに比べてパープレキシティが最大0.06削減される。
通信時間は全ての圧縮法で減少し、トップkとDGCは高い圧縮比で無視できるレベルまで通信を減少させる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 22:55:55 GMT)
Detecting Fake News on Social Media: A Novel Reliability Aware Machine-Crowd Hybrid Intelligence-Based Method [3.6] ソーシャルメディアプラットフォームにおけるフェイクニュースは、社会システムに重大な脅威をもたらす。
偽ニュース検出のための信頼性認識ハイブリッドインテリジェンス(RAHI)手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:10:21 GMT)
Can OpenAI o1 outperform humans in higher-order cognitive thinking? [3.6] 本研究では,高次認知領域におけるOpenAIのo1-previewモデルの性能を評価する。
o1-preview は Ennis-Weir Critical Thinking Essay Test (EWCTET) で平均24.33得点を達成した
創造的な思考タスクにおいて、モデルは2.98、SD = 0.73の独創性スコアを達成し、人間の平均である1.74(z = 0.71)よりも高い。
o1-previewは構造化タスクに優れていたが、問題解決と適応推論の限界が見られた。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 21:52:03 GMT)
Dynamic Digital Twins of Blockchain Systems: State Extraction and Mirroring [3.5] 本稿では、Digital Twinベースのブロックチェーン管理フレームワークを設計するための取り組みを構成する。
基本システムの条件に適合するようにコンセンサスプロセスを適用することを目的としている。
具体的には、ブロックチェーンシステムを抽出し、それをデジタルツインにミラーリングするという問題に対処する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:54:34 GMT)
Human-Calibrated Automated Testing and Validation of Generative Language Models [3.3] 本稿では,ジェネレーティブ言語モデル(GLM)の評価と検証のための包括的枠組みを提案する。
銀行などの高額な領域に展開される検索・拡張世代(RAG)システムに焦点を当てている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:12:38 GMT)
Choosing the Right Weights: Balancing Value, Strategy, and Noise in Recommender Systems [3.3] 多くのレコメンデータシステムは、クリック、いいね!、シェアなど、異なるユーザの振る舞いの線形重み付けを最適化する。
各潜在的な行動の3つの側面について考察する。
約7000万のURLからなる大規模なデータセットを使用して、当社のフレームワークをFacebook上での重み付け設計に適用する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:19:52 GMT)
DeNVeR: Deformable Neural Vessel Representations for Unsupervised Video Vessel Segmentation [3.2] Deformable Neural Vessel Representations (DeNVeR)は、X線アンギオグラフィービデオにおける血管のセグメンテーションの教師なしアプローチである。
主な貢献は、新しい層ブートストラップ技術、平行血管運動損失、複雑な血管力学をモデル化するためのユーレリア運動場の統合である。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:27:23 GMT)
From Flexibility to Manipulation: The Slippery Slope of XAI Evaluation [3.2] 基礎的真理説明ラベルの欠如は、説明可能な人工知能(XAI)における定量的評価の根本的な課題である
本稿では,この柔軟性を利用して評価結果の操作を行う方法について述べる。
評価結果に大きな変化がある複数のデータセットをまたいだ操作の有効性を実証する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:14:46 GMT)
APS-LSTM: Exploiting Multi-Periodicity and Diverse Spatial Dependencies for Flood Forecasting [2.9] 本稿では,LSTM(APS-LSTM)に基づく適応型周期的空間的自己認識手法を提案する。
APS-LSTMは、多周期性の観点から時間的特徴を学習し、異なる周期分割から様々な空間的依存関係をキャプチャする。
2つの実世界のデータセットの実験は、APS-LSTMの優位性を示している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:02:16 GMT)
Towards Robust Spatio-Temporal Auto-Regressive Prediction: Adams-Bashforth Time Integration with Adaptive Multi-Step Rollout [2.4] 本研究では,科学的機械学習モデルにおける時間内自己回帰予測の誤りに対処する。
本稿では,長期予測の堅牢性を高めるための2段階のAdams-Bashforthスキームの適応性を明らかにする。
我々は、トレーニング中に複数の将来のロールアウトタイムステップを組み込んだ多段階戦略により、時間的予測精度を向上させる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:02:57 GMT)
TransitGPT: A Generative AI-based framework for interacting with GTFS data using Large Language Models [2.4] TransitGPTはLLMを誘導してPythonコードを生成し、クエリに関連するGTFSデータを抽出して操作する。
データ検索、計算、インタラクティブな視覚化を含む幅広いタスクを、ユーザがGTFSやプログラミングに関する広範な知識を必要とせずに実現できる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:35:41 GMT)
WavFusion: Towards wav2vec 2.0 Multimodal Speech Emotion Recognition [2.3] We propose WavFusion, a multimodal speech emotion recognition framework。
WavFusionは、効果的なマルチモーダル融合、モダリティ、差別的表現学習における重要な研究課題に対処する。
本研究は, 精度の高いマルチモーダルSERにおいて, ニュアンスな相互モーダル相互作用を捉え, 識別表現を学習することの重要性を強調した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:43:39 GMT)
Path-based summary explanations for graph recommenders (extended version) [2.3] そこで本稿では,ユーザやユーザグループに対して,項目レコメンデーションのセットを受信した理由を説明する要約説明を提案する。
また,効率的なグラフアルゴリズムを用いて説明を要約する新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:36:07 GMT)
Training neural networks without backpropagation using particles [2.1] ニューラルネットワークは、人間の脳内の生物学的ニューロンを模倣するために、複数の層にまとめられたニューロンのグループである。
勾配降下戦略は局所ミニマの問題を避けることができず、ミニマで立ち往生する。
粒子群最適化 (PSO) は損失関数の探索空間の中で最適な局所最小値を選択するために提案された。
提案手法では、個々のニューロンを個別に訓練することで、勾配降下とPSOアルゴリズムの限界を克服する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:30:48 GMT)
Early Directional Convergence in Deep Homogeneous Neural Networks for Small Initializations [2.0] 本稿では,局所的なリプシッツ均質性と2つ以上の厳密な順序を有すると仮定された深部均一性ニューラルネットワークのトレーニング時に生じる勾配流のダイナミクスについて検討する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 17:30:26 GMT)
From Deterministic to Probabilistic: A Novel Perspective on Domain Generalization for Medical Image Segmentation [1.9] 本稿では,確率論的モデリングとコントラスト学習によってデータ表現品質を向上させる革新的なフレームワークを提案する。
具体的には、決定論的特徴と不確実性モデリングを組み合わせることで、包括的特徴分布を捉える。
提案手法はセグメンテーション性能を著しく向上させ,医用画像セグメンテーションにおける領域一般化問題に対する堅牢な解決策を提供する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:41:04 GMT)
Proximal Iteration for Nonlinear Adaptive Lasso [1.9] 本研究では,ペナルティ係数をテキスト・マックス・ア・ポストリオリ方式で学習するための追加決定変数として扱うアプローチについて検討する。
そこで我々は, 相異なるコスト関数のパラメータとともに, 共同最適化のための近似勾配法を開発した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:19:55 GMT)
CNMBert: A Model For Hanyu Pinyin Abbreviation to Character Conversion Task [1.6] CNMBert はんゆいんの略語を漢字に変換する。
CNMBertは微調整のGPTモデルを超え、60.56 MRRのスコアと10,229サンプルのPinyin短縮テストデータセットで51.09の精度を達成した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:58:51 GMT)
REGE: A Method for Incorporating Uncertainty in Graph Embeddings [1.4] モデル出力の不確実性を表す半径値のグラフ埋め込みを生成するために,データ中の不確実性を測定し,組み込んだREGEを導入する。
実験では、REGEのグラフ埋め込みは、最先端手法に対する平均1.5%(精度)の敵攻撃において、より良い性能を示すことを示した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:09:09 GMT)
A Simple Model of Inference Scaling Laws [1.4] スケーリング法則を推論の文脈で研究し、特に複数の推論による性能向上について検討する。
我々の単純なフレームワークは、推論スケーリングを他の既知のスケーリング法則に組み込むための基盤となる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 22:50:41 GMT)
Constrained Control for Autonomous Spacecraft Rendezvous: Learning-Based Time Shift Governor [1.3] 本稿では, ランデブーやドッキングの際の制約を強制する, TSG(Time Shift Governor)に基づく制御方式を提案する。
TSGは、名目上のクローズドループシステムへのアドオンスキームとして、副宇宙船の目標基準として、時間シフトのチーフ宇宙船軌道を生成する。
TSG実装への我々のアプローチは、過去の副次的および主的宇宙船状態の連続の関数として時間シフトパラメータを近似するLSTMニューラルネットワークを統合する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 21:17:36 GMT)
Federated GNNs for EEG-Based Stroke Assessment [1.3] 本研究では,フェデレートラーニング(FL)とグラフニューラルネットワーク(GNN)を組み合わせて脳卒中重症度を予測する手法を提案する。
本手法により,複数の病院が患者情報を交換することなく,脳波データの共有GNNモデルを共同で訓練することが可能となる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:05:17 GMT)
AI-powered Digital Twin of the Ocean: Reliable Uncertainty Quantification for Real-time Wave Height Prediction with Deep Ensemble [1.2] 再生可能エネルギー源は、低エネルギー密度と非定常性による安定した電力供給の課題に直面している。
ウェーブエネルギー変換器(WEC)はこれらの問題に対処するために信頼性の高いリアルタイム波高予測を必要とする。
本研究では,AIを用いたリアルタイム波高予測モデルを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:22:58 GMT)
Computational models of learning and synaptic plasticity [1.1] 生体内で観察される可塑性現象の多様性を説明するために, シナプス可塑性の数学的モデルが提案されている。
本稿では,いくつかの基本的な学習パラダイムと,それらの実装に使用されるシナプス的可塑性規則について論じる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:03:05 GMT)
Spatiotemporal Density Correction of Multivariate Global Climate Model Projections using Deep Learning [1.1] グローバル気候モデル(GCM)は、地球の気候システム内の複雑な物理過程をシミュレートする数値モデルである。
GCMは、基礎となる物理的プロセスの単純化により、体系的なバイアスに悩まされる。
日降水量と最大温度データの結合分布の密度補正のための半パラメトリック条件密度推定法(SPCDE)を提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:23:07 GMT)
Synthesizing Proteins on the Graphics Card. Protein Folding and the Limits of Critical AI Studies [0.8] 本稿では,タンパク質の折り畳みにおけるトランスアーキテクチャの適用について検討する。
インテリジェントマシンの検索は、インテリジェンスの場所ではなく、形から始めなければならない、と私たちは主張する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 18:24:44 GMT)
Early Diagnosis of Alzheimer's Diseases and Dementia from MRI Images Using an Ensemble Deep Learning [0.8] アルツハイマー病(英語: Alzheimer's Disease, AD)は、認知障害や認知失調を引き起こす進行性神経疾患である。
本研究では,ADの初期段階を正確に検出するために,IR-BRAINNETとModified-DEMNETの2つのCNNを提案する。
また、CNN間のばらつきを低減し、AD検出を向上させるために出力を平均化するアンサンブルモデルも導入した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:27:41 GMT)
Infinite quantum signal processing [0.7] 量子信号処理(QSP)は、次数$d$の真のスカラーを表す。
QSPは多種多様なポリノミカル関数を表現できることを示す。
解析の結果,対象関数の正則性と因子の減衰特性との間には,驚くべき関連性があることが判明した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:54:03 GMT)
Enhancing Webshell Detection With Deep Learning-Powered Methods [0.6] Webshell攻撃はより一般的になり、Webアプリケーションを保護するために堅牢な検出メカニズムが必要である。
この論文は、シグネチャベースのメソッドとディープラーニングアルゴリズムを使用して、既知のWebシェルと未知のWebシェルを検出する、高度なDLパワーソースコードスキャンフレームワークであるASAFを提案する。
第2に、この論文では、WebアプリケーションのリアルタイムHTTPトラフィック分析を使用して、Webシェルを検出するディープニューラルネットワークが導入されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:26:36 GMT)
Real-Time 3D Object Detection Using InnovizOne LiDAR and Low-Power Hailo-8 AI Accelerator [0.6] 本稿では,LiDARセンサからの3次元点雲を用いたリアルタイム3次元物体検出の実現可能性を示す。
精度0.91%のF1で約5Hzの速さでリアルタイム推論に成功した。
この研究は、低コストで低消費電力のハードウェア上で、効率的なリアルタイム3Dオブジェクト検出を実現することを実証している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:19:55 GMT)
Flow-based Detection of Botnets through Bio-inspired Optimisation of Machine Learning [0.6] ボットネットは、ボットネット内の他のメンバーと自律的に感染し、伝播し、通信し、調整することができる。
従来の検出手法は、様々なネットワークベースの検出回避手法に不適合になってきている。
本研究では,ボットネットワーク活動のバイナリ分類を容易にするために,ネットワークフローに基づく行動モデルの適用について検討する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:55:49 GMT)
GEE-OPs: An Operator Knowledge Base for Geospatial Code Generation on the Google Earth Engine Platform Powered by Large Language Models [0.6] 本稿では,Google Earth Engine (GEE) JavaScript APIに適した演算子知識ベースを構築するためのフレームワークを提案する。
本フレームワークは、演算子構文知識テーブル、演算子関係周波数テーブル、演算子頻繁パターン知識テーブル、演算子関係連鎖知識テーブルからなる。
本研究では,演算子の知識抽出において,90%以上の精度,リコール,F1スコアが達成されていることを示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:50:24 GMT)
A Tiered GAN Approach for Monet-Style Image Generation [0.6] 本稿では,多段階プロセスにより画像品質を段階的に改善する階層型GANモデルを提案する。
このモデルはランダムノイズを詳細な芸術表現に変換し、トレーニングにおける不安定性、モード崩壊、出力品質といった共通の課題に対処する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:10:29 GMT)
Comprehensive Evaluation of Multimodal AI Models in Medical Imaging Diagnosis: From Data Augmentation to Preference-Based Comparison [0.5] 本研究では,医療画像診断におけるマルチモーダルモデルの評価フレームワークを提案する。
我々は, パイプラインデータ前処理, モデル推論, 嗜好に基づく評価を導入し, コントロール強化により500症例の初期セットを3,000例に拡大した。
その結果、Llama 3.2-90Bは85.27%の症例でヒトの診断を上回った。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:38:44 GMT)
STONet: A novel neural operator for modeling solute transport in micro-cracked reservoirs [0.5] マイクロクラック型貯水池における汚染物質輸送を効率的にモデル化するニューラルオペレーターであるソルトトランスポート・オペレーター・ネットワーク(STONet)を開発した。
このモデルは異なるネットワークを組み合わせて、異種特性を効果的にエンコードする。
数値実験により, 有限要素法に匹敵する精度が得られた。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:53:47 GMT)
Neural network interpretability with layer-wise relevance propagation: novel techniques for neuron selection and visualization [0.5] 本稿では,選択したニューロンのパーシングを改善する新しいアプローチを提案する。
Visual Geometry Group 16 (VGG16) アーキテクチャをケーススタディとして用いたLRP後方伝播
本手法は、コンピュータビジョンアプリケーションのための、より透明な人工知能(AI)システムの開発を支援する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:49:14 GMT)
Emulating Clinical Quality Muscle B-mode Ultrasound Images from Plane Wave Images Using a Two-Stage Machine Learning Model [0.5] このプロジェクトでは,Varasonics Vantageシステムで取得した筋肉の単一平面波画像を改善するために,2段階の機械学習モデルを実装した。
このモデルは、単一の平面波伝送から28.5 +/- 0.6 FPSのフレームレートで高速な画像形成を提供する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 22:59:02 GMT)
Integrating YOLO11 and Convolution Block Attention Module for Multi-Season Segmentation of Tree Trunks and Branches in Commercial Apple Orchards [0.4] 本研究では、畳み込みブロック注意モジュールとYOLO11アーキテクチャを統合することで、カスタマイズされたインスタンスセグメンテーションモデルを開発した。
モデルは, YOLO11-CBAMを訓練した後, 休眠期および天蓋期の画像間で個別に検証された。
2つの季節データセットを休眠と天蓋の季節画像としてトレーニングしたモデリング手法は、YOLO11-CBAM統合の可能性を示した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:36:22 GMT)
A Comparative Study of Online Disinformation and Offline Protests [0.3] 政治抗議に対する影響は明らかにされていない。
オンラインの偽情報とオフラインの抗議の間には確かに効果があるが、その効果は政治的分極によって部分的に緩和されている。
インターネットの閉鎖はカウントを減少させる傾向にあるが、パラドックス的には、政府によるソーシャルメディアのオンライン監視が欠如しているため、それらも減少する傾向にある。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 07:27:08 GMT)
Multispecies Animal Re-ID Using a Large Community-Curated Dataset [0.2] 我々は、49種、37K個体、および225K画像を含むデータセットを構築し、このデータを用いて、すべての種に対して単一の埋め込みネットワークをトレーニングする。
我々のモデルは、各種で個別に訓練されたモデルより一貫して優れており、トップ1の精度で平均12.5%向上している。
このモデルは、大規模な野生生物モニタリングシステムですでに60種以上で生産されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:56:33 GMT)
Action Recognition based Industrial Safety Violation Detection [0.1] 本稿では,行動認識モデルを用いて実行中の動作をまず理解し,オブジェクト検出技術を用いて違反を検知するシステムを提案する。
これは、テストデータセットである109ビデオのPPEベースのアプローチと比較して、F1スコアの23%改善につながります。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:12:41 GMT)
Hyperedge Anomaly Detection with Hypergraph Neural Network [0.1] 本稿では,ハイパーグラフ内の異常関連を識別するための,エンドツーエンドのハイパーグラフニューラルネットワークモデルを提案する。
提案アルゴリズムはラベル付きデータを必要とせずに教師なしで動作する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 12:52:22 GMT)
Walking behavior induced by $\mathcal{PT}$ symmetry breaking in a non-Hermitian $\rm XY$ model with clock anisotropy [0.0] 非エルミートハミルトニアンによって支配される量子系は、相互作用によって駆動されるゼロ温度相転移を示す。
我々は、$mathcalPT$対称性が破られ、時間進化が非単体となるとき、ベレジンスキー-コステリッツ-Thouless相転移と同様のスケーリング挙動が生じることを示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:19:43 GMT)
UNet++ and LSTM combined approach for Breast Ultrasound Image Segmentation [0.0] この研究は、LSTM層と自己保持機構を統合することで、UNet++アーキテクチャを充実させようとしている。
GTデータセットによるBUSIのデータ増大による提案手法の融合により、精度98.88%、特異度99.53%、精度95.34%、感度91.20%、F1スコア93.74、Dice係数92.74%が達成された。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:39:31 GMT)
Truncation-Free Quantum Simulation of Pure-Gauge Compact QED Using Josephson Arrays [0.0] 量子シミュレーション(Quantum Simulation)は、計算問題を回避するために提案され、実際に用いられている手法の1つである。
格子QEDの局所ヒルベルト空間とジョセフソン接合の正確な類似性に基づくトラニケーションフリー手法を提案する。
提案手法は, 最大2 時間 N$ プラケットの準2次元系をシミュレートし, 完全2次元理論をシミュレートできる近似手法を提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:24:15 GMT)
Toxic behavior silences online political conversations [0.0] 個人は有害な行動に晒されているため、少数派の意見を公然と表現することを控える可能性があるという仮説を考察する。
隠れマルコフモデルを用いて、毒性による沈黙と一致した潜伏状態を特定する。
本研究は、オンライン政治熟考の複雑さを考察し、自己検閲のダイナミクスを考えることの重要性を強調した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:39:20 GMT)
The Illusion-Illusion: Vision Language Models See Illusions Where There are None [0.0] 現代の視覚言語システムの多くは、錯覚を錯覚と勘違いしている。
このような失敗は、すでに文献で議論されている広範な失敗の一部であることを提案します。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:30:51 GMT)
The Helicobacter pylori AI-Clinician: Harnessing Artificial Intelligence to Personalize H. pylori Treatment Recommendations [0.0] Helicobacter pylori(H. pylori)は、世界中で最も一般的な発がん性病原体である。世界中で約2人に1人が感染しており、消化性潰瘍、慢性胃炎、胃癌の主要な原因である。
H. pylori AI-clinicianレコメンデーションシステムを開発した。
このシステムは、Hp-EuRegのH. pylori感染患者数万人のデータに基づいて訓練された。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 12:57:10 GMT)
The Dual Dynamical Foundation of Orthodox Quantum Mechanics [0.0] 行列力学の点から正準可換関係(CCR)を導出する。
シュル・オーディンガーの最初の波動方程式の導出の意味に関する議論。
フォン・ノイマンによるヒルベルト空間上の統一量子力学の構築に対する批判的評価
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:54:08 GMT)
TextClass Benchmark: A Continuous Elo Rating of LLMs in Social Sciences [0.0] TextClass Benchmarkプロジェクトは、テキスト分類タスクのためのLLMと変換器の包括的で公平で動的な評価を提供することを目的としている。
この評価は、NLPやテキスト・アズ・データ・アプローチに関わる社会科学の分野における様々な領域や言語にまたがる。
リーダーボードは、カスタマイズされたEloレーティングシステムを使用して、パフォーマンス指標と相対ランクを示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:00:28 GMT)
SplaXBERT: Leveraging Mixed Precision Training and Context Splitting for Question Answering [0.0] ALBERT-xlargeにコンテキスト分割と混合精度トレーニングを組み込んだSplaXBERTは、長文の問合せタスクにおいて高い効率を達成する。
SQuAD v1.1でテストされ、85.95%、F1スコア92.97%となる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 02:01:27 GMT)
Societal Adaptation to AI Human-Labor Automation [0.0] 本稿では、社会がAIによるヒューマンコラボレーションの自動化にどのように適応できるかを分析する。
脅威モデルは、大量失業とその社会経済的な結果に焦点を当てている。
この分析は、AIの発展方法を形成する「能力改善介入」(CMI)と、社会の調整を支援する「適応介入」(ADI)の両方を探求する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:08:11 GMT)
Semiclassical world is one of infinite many cloneworlds in common spacetime [0.0] 我々は量子重力によって相互作用する量子化された世界のクローンを$N$とみなす。
すべてのクローン世界に対して半古典的アインシュタイン方程式を得る。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:27:50 GMT)
Scaling Laws for Economic Productivity: Experimental Evidence in LLM-Assisted Translation [0.0] 10倍のモデル計算でタスク完了速度が12.3%向上し、グレードは0.18標準偏差、利益は16.1%向上した。
これらの結果は、継続したモデルスケーリングが今後10年間で米国の生産性を少なくとも6.9%向上させることを示唆している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:56:53 GMT)
SLA Management in Reconfigurable Multi-Agent RAG: A Systems Approach to Question Answering [0.0] 現実世界のアプリケーションには、SLA(Service Level Agreements)とQoS(Quality of Service)の要件が多様である。
実世界の質問応答(QA)アプリケーションに適したマルチエージェントRAGに対するシステム指向アプローチを提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:32:13 GMT)
Robust implicit quantum control of interacting spin chains [0.0] 本稿では指数関数的に大きなヒルベルト空間における量子状態への明示的な参照を避けるために量子制御を利用する。
スピン鎖の例制御プロトコルについて, 高絡み合い状態の耐雑音性について論じる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:00:52 GMT)
Quantum network tomography of Rydberg arrays by machine learning [0.0] ライドバーグ原子は、量子計算と量子シミュレーションのための汎用的なプラットフォームであり、制御可能なデコヒーレンスを可能にする。
理論的には、人工ニューラルネットワークを用いた機械学習により、オープン量子力学のモデルを構築するためのテクニックの実証実証も可能であることを実証する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 20:41:34 GMT)
Quantum Annealing and Tensor Networks: a Powerful Combination to Solve Optimization Problems [0.0] この論文の目的は、量子デバイスとテンソルネットワークアルゴリズムを比較することではない。
これらの技術間のシナジーの可能性を探究し、2つのフラッグシップアルゴリズムが将来的にどのように協力するかに焦点を当てる。
本論は, 有限オートマトンを用いたこの問題に対するアプローチを概説し, ケーススタディのMPO構築に応用する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:20:20 GMT)
Point-GN: A Non-Parametric Network Using Gaussian Positional Encoding for Point Cloud Classification [0.0] Point-GNは、効率的で正確な3Dポイントクラウド分類のための新しい非パラメトリックネットワークである。
我々は,ModelNet40とScanObjectNNの2つのベンチマークデータセット上でPoint-GNを評価し,それぞれ85.29%と85.89%の分類精度を達成した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:07:59 GMT)
Optimization of Transformer heart disease prediction model based on particle swarm optimization algorithm [0.0] 本稿では,心疾患予測の精度を向上させるための改良型トランスフォーマーモデルを提案する。
まず、決定木、ランダムフォレスト、XGBoostという3つの主流機械学習分類アルゴリズムを使用します。
その結果、ランダム森林モデルは、92.2%の精度で心臓病の分類を予測するのに最高の性能を示した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:04:39 GMT)
On the Unknowable Limits to Prediction [0.0] ある種の誤りは差分速度で排除できると論じる。
我々は予測可能性が情報集合に依存し、予測不可能性の早期主張に注意を払っていることを論じる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:32:01 GMT)
Nonlocal correlations in quantum energy teleportation: perspectives from their Majorana representations and information thermodynamics [0.0] 本稿では,AliceとBobの量子スピンモデルを用いた量子エネルギーテレポーテーションプロトコルを提案する。
我々のモデルでは、ボブのエネルギー抽出はアリスの射影測定による局所的なエネルギー注入によって活性化される。
抽出されたエネルギーは、アリスとボブのサイトにおけるマヨラナフェルミオンによって定義される非局所相関が有限であるときに正となる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:57:10 GMT)
Nearly Solved? Robust Deepfake Detection Requires More than Visual Forensics [0.0] 最近開発された最先端の検出器は、古典的な敵攻撃の影響を受けやすいことを示す。
我々は、ディープフェイクの重要な「腐った特徴」が、より高度なセマンティクスにあると主張している。
GPT-4oのような大規模ビジュオ言語モデルは、現在の最先端手法よりもゼロショットディープフェイク検出が優れていることを示す。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 14:53:41 GMT)
Mott Transition and Volume Law Entanglement with Neural Quantum States [0.0] ここでは、ニューラルネットワーク隠れフェルミオン決定状態(HFDS)を用いて、障害のある完全に接続されたHubbardモデルにおけるこの遷移を明らかにする。
我々の研究は、強相関電子系とニューラル量子状態の研究の道を開いた。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:26:12 GMT)
Loss tangent fluctuations due to two-level systems in superconducting microwave resonators [0.0] 超伝導マイクロ波共振器は量子コンピューティングとセンシング技術にとって重要である。
12時間から16時間の低消費電力におけるQ_i$の時間変動について検討した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:57:23 GMT)
Local fermion-to-qudit mappings [0.0] 我々は、フェルミオン格子系をシミュレートするための局所フェルミオン-クォーディットマッピングの集合を提案する。
これらのマッピングは、2量子ゲートの観点でより効率的な量子シミュレーションを可能にする。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:17:23 GMT)
Leveraging Time-Series Foundation Model for Subsurface Well Logs Prediction and Anomaly Detection [0.0] ボーリング・ウェルログデータ中の異常を予測・検出するための時系列基礎モデルを提案する。
提案モデルでは,R2が最大87%,平均絶対パーセンテージ誤差(MAPE)が1.95%と高い性能を示した。
このモデルのゼロショット能力は、ドリルの危険性や予期せぬ地質学的形成などの微妙で重要な異常を93%の精度で識別することに成功した。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 15:23:52 GMT)
Leveraging Security Observability to Strengthen Security of Digital Ecosystem Architecture [0.0] 複雑さは、デジタルエコシステムにおける可観測性とセキュリティの両方に重大な課題をもたらします。
可観測性により、組織はパフォーマンスの問題を診断し、リアルタイムで異常を検出することができる。
セキュリティは機密データの保護とサービスの整合性の確保に重点を置いている。
本稿では,デジタルエコシステムアーキテクチャにおける可観測性とセキュリティの相互関係について検討する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:17:29 GMT)
LABIIUM: AI-Enhanced Zero-configuration Measurement Automation System [0.0] 本稿では,実験の合理化とユーザの生産性向上を目的としたAIによる計測自動化システムであるLABIiumを紹介する。
Lab-Automation-Measurement Bridges (LAMBs)はVSCodeやPythonといった標準ツールを使ったシームレスなインスツルメンタ接続を可能にし、セットアップのオーバーヘッドをなくす。
この評価は、LABIiumが研究室の生産性を高め、研究と産業におけるデジタルトランスフォーメーションを支援する能力を強調している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:15:24 GMT)
Interactions Between Artificial Intelligence and Digital Public Infrastructure: Concepts, Benefits, and Challenges [0.0] 人工知能 (AI) とデジタル公共インフラ (DPI) は、国際政策の議論の中心をなす技術開発である。
本稿では,AIとDPIが相互利益のために相互作用する機会と課題について述べる。
我々は、政策立案者がAIとDPIのポジティブな相互作用を強化するためにどのように機能するかについて、重要な視点で結論付けている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 23:25:13 GMT)
Innovative Sentiment Analysis and Prediction of Stock Price Using FinBERT, GPT-4 and Logistic Regression: A Data-Driven Approach [0.0] 本研究では、感情分析と株価指数予測のための最先端AIモデル、すなわちTranssformers (FinBERT)、Generatice Pre-trained Transformer GPT-4、Logistic Regressionの比較パフォーマンスについて検討する。
GPT-4やFinBERTといった高度な自然言語処理モデルと従来の機械学習モデルであるロジスティック回帰を活用することで、市場の感情を分類し、感情スコアを生成し、市場価格の動きを予測することを目指している。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 05:20:31 GMT)
Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space [0.0] 基盤となる生データの効率的なベクトル表現の必要性が高まっている。
事前訓練されたディープニューラルネットワークから特徴表現を抽出するアプローチは、入力データのセマンティック抽象化を提供する強力なアプローチである。
本研究では、地球観測のためのオープンで自由なAI対応データセットのプロビジョニングと標準化に焦点を当てた、既存のコミュニティプロジェクトであるMajor TOMへの拡張提案を行う。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:49:47 GMT)
Exploring Hybrid Quantum-Classical Methods for Practical Time-Series Forecasting [0.0] 戦略計画と資源配分には時系列予測が不可欠である。
時系列予測のための量子ベースの2つのアプローチについて検討する。
これら2つの手法の結果を比較して,実用的予測アプリケーションの有効性と潜在的優位性を評価する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:14:17 GMT)
Exploiting Precision Mapping and Component-Specific Feature Enhancement for Breast Cancer Segmentation and Identification [0.0] 乳房病変の分類・分類のための新しいDeep Learning(DL)フレームワークを提案する。
本稿では,PMAD-LinkNetセグメンテーションフレームワークの高精度マッピング機構(PMM)を提案する。
また、コンポーネント固有の特徴拡張モジュール (CSFEM) を導入し、コンポーネント固有の特徴強化分類器 (CSFEC-Net) を提案する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:08:01 GMT)
Enhancing the Charging Performance of Many-Body Quantum Batteries through Landau-Zener Driving [0.0] ランダウ・ツェナー量子電池は周期駆動と比較してエネルギーデポジションと貯蔵効率が優れている。
ランダウ・ツェナー量子電池の効率は、XY異方性、駆動磁場の大きさ、相互作用強度などの鍵パラメータを最適化することで著しく向上することができる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 04:39:09 GMT)
Enhancing Retail Sales Forecasting with Optimized Machine Learning Models [0.0] 小売売上高予測では、在庫管理と戦略的計画にとって、将来の売上を正確に予測することが不可欠である。
機械学習(ML)の最近の進歩は、より堅牢な代替手段を提供する。
この研究はML、特にランダムフォレスト(RF)、グラディエントブースティング(GB)、サポートベクター回帰(SVR)、XGBoostの力の恩恵を受けている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:40:44 GMT)
Electrocardiogram (ECG) Based Cardiac Arrhythmia Detection and Classification using Machine Learning Algorithms [0.0] 機械学習(ML)と深層学習(DL)は、診断、予後、重篤な健康状態の治療を改善するために、医学の新たな展望を開いている。
本稿では,不整脈心電図(ECG)信号を分類するための予測精度の高いMLモデルの開発に着目する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 08:29:44 GMT)
Efficient Storage of Multidimensional Telecom Photons in a Solid-State Quantum Memory [0.0] 結晶ホスト中のエルビウムイオンは、テレコム量子メモリのための有望なプラットフォームを提供する。
我々は、分極、周波数、時間ビンベースで符号化されたテレコムフォトニック量子ビットの記憶を実証する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 00:47:26 GMT)
Designing Domain-Specific Large Language Models: The Critical Role of Fine-Tuning in Public Opinion Simulation [0.0] 本稿では,英国家庭縦断研究の社会デマトグラフィーデータを統合した,新しい微調整手法を提案する。
多様な合成プロファイルをエミュレートすることで、微調整されたモデルは、事前訓練されたモデルよりも大幅に優れている。
より広範な意味は、医療や教育などの分野にLLMをデプロイすること、包括的でデータ駆動型意思決定を促進することである。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 11:06:45 GMT)
Challenges of learning multi-scale dynamics with AI weather models: Implications for stability and one solution [0.0] 現在のAIベースの天気モデルでは、数週間または数ヶ月以上経つと、短期的な天気予報を正確に行うことができる。
不安定性の原因は不明であり、安定性の地平線を改善するために用いられる手法はアドホックであり、厳密な理論を欠いている。
我々は、気候システムのための長期的物理的に一貫性のあるデータ駆動モデルを開発し、正確な短期予測を実証する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 10:52:38 GMT)
Big data searching using words [0.0] データ検索における単語の近傍構造に関する基本的な考え方を紹介する。
また、ビッグデータ検索におけるビッグデータプライマリを導入し、データ検索における異常検出における近傍構造の適用について論じる。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 16:00:31 GMT)
BERTCaps: BERT Capsule for Persian Multi-Domain Sentiment Analysis [0.0] 提案したBERTCapsulesアプローチは,BERTモデルとCapsuleモデルを組み合わせたものである。
BERTCapsモデルの評価は感情分類では0.9712、ドメイン分類では0.8509である。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 09:08:25 GMT)
Automated LaTeX Code Generation from Handwritten Math Expressions Using Vision Transformer [0.0] 数式表現画像を対応するコードに変換するタスクに,高度なトランスフォーマーアーキテクチャを適用した。
ベースラインとして、現在の最先端CNNエンコーダとLSTMデコーダを利用する。
また、CNNエンコーダをトレーニング済みのResNet50モデルに置き換え、グレースケール入力を組み込むことで、CNN-RNNアーキテクチャの強化についても検討する。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 10:55:44 GMT)
A phase-space view of vibrational energies without the Born-Oppenheimer framework [0.0] ボルン・オッペンハイマー (BO) ハミルトニアン $hat H_rm BO(bm R)$ の対角化はポテンシャルエネルギー面を構築するための最適手段ではないことを示す。
より良いアプローチは位相空間の電子ハミルトニアン $hat H_rm PS(bm R,bm P)$ を対角化することである。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:30:22 GMT)
A Variational Computational-based Framework for Unsteady Incompressible Flows [0.0] 流体力学問題の解法として変分法を用いる別の計算フレームワークを提案する。
第一に、非圧縮性流れにおける圧力-速度結合の慢性的な問題を回避している。
第二に、この手法はアウトフロー境界における非物理的仮定に依存しない。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 03:45:39 GMT)
A Scoping Review of ChatGPT Research in Accounting and Finance [0.0] 本稿では,近年のChatGPTおよび関連言語モデル(LLM)の会計・財務に関する論文のレビューを行う。
本研究の目的は, この2つの領域における研究の現状を理解し, 今後の調査の可能性を明らかにすることである。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 19:45:46 GMT)
A Neural Model of Rule Discovery with Relatively Short-Term Sequence Memory [0.0] いくつかの流体インテリジェンスタスクは、イベントシーケンスにおける規則性の発見を必要とする。
ニューラルネットワークモデルは、比較的短期記憶を持つイベントシーケンスにおいて、流体インテリジェンスや規則性発見を説明するために構築された。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 06:38:41 GMT)
A Comparative Study on Code Generation with Transformers [0.0] 本稿では「トランスフォーマーを用いたコード生成の比較研究」という概念を紹介する。
Transformerアーキテクチャに基づくモデルと、さまざまな問題に対してC++ソースコードを自動生成するNLP方法論。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 21:18:23 GMT)
A Comparative Study of Image Denoising Algorithms [0.0] デジタル画像は、画像処理、ビジョンコンピューティング、ロボティクス、バイオメディカルなど、多くの分野で重要な役割を担っている。
画像は劣化要因によって劣化するか劣化する可能性が高い。
出力性能を改善するために、ロバストで低コストで高速な技術に焦点を当てたいくつかの画像復号アルゴリズムが文献で提案されている。
論文参考訳(メタデータ) (Sat, 07 Dec 2024 01:23:10 GMT)