Diffusion4D: Fast Spatial-temporal Consistent 4D Generation via Video Diffusion Models [116.3] 高速でスケーラブルな4Dコンテンツ生成のための新しいフレームワーク textbfDiffusion4D を提案する。
ダイナミックな3Dアセットの軌道ビューを合成できる4D対応ビデオ拡散モデルを開発した。
提案手法は, 生成効率と4次元幾何整合性の観点から, 従来の最先端技術を超えている。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:47:34 GMT)
Instruction-tuned Language Models are Better Knowledge Learners [106.4] 文書の学習に先立って質問を指導するPIT(Pre-instruction-tuning)を提案する。
大規模な実験とアブレーション研究により、プレインストラクションチューニングはLLMが新しい文書から知識を吸収する能力を著しく向上させることが示された。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:19:48 GMT)
MEMORYLLM: Towards Self-Updatable Large Language Models [101.4] 既存のLarge Language Models (LLM) は通常、デプロイ後も静的のままである。
本稿では,変圧器と固定サイズのメモリプールを備えたモデルMEMORYLLMを紹介する。
MEMORYLLMは、テキスト知識を自己更新し、早期に注入された知識を記憶することができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:06:32 GMT)
ID-to-3D: Expressive ID-guided 3D Heads via Score Distillation Sampling [96.9] ID-to-3D(ID-to-3D)は、不整合表現を用いたIDとテキスト誘導型3次元頭部を生成する方法である。
前例のないアイデンティティ一貫性と高品質なテクスチャと幾何生成を実現する。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:36:45 GMT)
Improved off-policy training of diffusion samplers [93.7] 本研究では,非正規化密度やエネルギー関数を持つ分布からサンプルを抽出する拡散モデルの訓練問題について検討する。
シミュレーションに基づく変分法や非政治手法など,拡散構造推論手法のベンチマークを行った。
我々の結果は、過去の研究の主張に疑問を投げかけながら、既存のアルゴリズムの相対的な利点を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:06:40 GMT)
VMamba: Visual State Space Model [92.8] VMambaは、線形時間複雑性で動作するビジョンバックボーンである。
VMambaのコアには2D Selective Scan (SS2D)モジュールを備えたVisual State-Space (VSS)ブロックのスタックがある。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:31:28 GMT)
4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling [92.0] 現在のテキストから4Dの手法は、シーンの外観の質、立体構造、動きの3方向のトレードオフに直面している。
本稿では,複数の事前学習拡散モデルからの監視信号をブレンドする交互最適化手法であるハイブリッドスコア蒸留法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:15:13 GMT)
A Mean-Field Analysis of Neural Stochastic Gradient Descent-Ascent for Functional Minimiax Optimization [90.9] 本稿では,超パラメトリック化された2層ニューラルネットワークの無限次元関数クラス上で定義される最小最適化問題について検討する。
i) 勾配降下指数アルゴリズムの収束と, (ii) ニューラルネットワークの表現学習に対処する。
その結果、ニューラルネットワークによって誘導される特徴表現は、ワッサーシュタイン距離で測定された$O(alpha-1)$で初期表現から逸脱することが許された。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:22:12 GMT)
Octo: An Open-Source Generalist Robot Policy [88.1] ここでは,Open X-Embodimentデータセットから800kトラジェクトリをトレーニングした,大規模なトランスフォーマーベースのポリシであるOctoを紹介する。
標準のGPUでは数時間以内に、新しいセンサー入力とアクションスペースを備えたロボットセットアップに効果的にカスタマイズできる。
また,アーキテクチャからトレーニングデータに至るまで,Octoモデルの設計決定の詳細な説明を行い,汎用ロボットモデルの構築に関する今後の研究を指導する。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:55:26 GMT)
Splat-SLAM: Globally Optimized RGB-only SLAM with 3D Gaussians [87.5] 3D Splattingは、RGBのみの高密度SLAMの幾何学と外観の強力な表現として登場した。
本稿では,高密度な3次元ガウス写像表現を持つRGBのみのSLAMシステムを提案する。
Replica、TUM-RGBD、ScanNetのデータセットに対する実験は、グローバルに最適化された3Dガウスの有効性を示している。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:26:54 GMT)
An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.3] 現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。
両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:22:38 GMT)
MixCE: Training Autoregressive Language Models by Mixing Forward and Reverse Cross-Entropies [80.8] 自己回帰言語モデルは、データ分布Pに対するモデル分布Qのクロスエントロピーを最小化することにより訓練される。
我々は,前と逆のクロスエントロピーを混合する目的であるMixCEを用いた学習を提案する。
その結果,複雑な復号化戦略を使わずに,より優れた生成テキストが得られることがわかった。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:24:55 GMT)
Image-Text-Image Knowledge Transferring for Lifelong Person Re-Identification with Hybrid Clothing States [78.5] より実践的な課題,すなわち,ハイブリッド衣料状態での生涯的人物識別を提案する。
我々は、生涯学習中に、一連の布変化ドメインと布一貫性ドメインを考慮に入れた。
我々は、"画像-テキスト-画像"閉ループで知識を効果的に調整し、転送し、蓄積するための、$Teata$と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:25:26 GMT)
Automatic Jailbreaking of the Text-to-Image Generative AI Systems [77.0] 本稿では,ChatGPT,Copilot,Geminiなどの商用T2I生成システムの安全性について,ナイーブプロンプトによる著作権侵害について検討する。
安全ガードをバイパスするプロンプトを生成するT2I生成システムに対して,より強力な自動脱獄パイプラインを提案する。
当社のフレームワークは,ChatGPTを11.0%のブロックレートでジェイルブレイクし,その76%で著作権コンテンツを生成する。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:32:24 GMT)
DetermLR: Augmenting LLM-based Logical Reasoning from Indeterminacy to Determinacy [76.6] 非決定性から決定性への進化として推論過程を再考する新しい視点であるDetermLRを提案する。
まず、既知の条件を次の2つのタイプに分類する: 決定的および不決定的前提 これは、推論プロセスのオール方向を提供し、不決定的データを段階的決定的洞察に変換する際のLCMを導く。
我々は、利用可能な施設の保存と抽出、推論メモリによる推論パスの自動化、そしてその後の推論ステップに関する歴史的推論の詳細を保存する。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:47:13 GMT)
Self-Play Preference Optimization for Language Model Alignment [75.8] 近年の進歩は、嗜好の確率で直接作業することで、人間の嗜好をより正確に反映できることを示している。
本稿では,言語モデルアライメントのためのセルフプレイ方式を提案する。
提案手法は,PSPO (textit-play Probabilistic Preference Optimization) と呼ばれ,反復的なポリシー更新を通じてナッシュ均衡を近似する。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:50:05 GMT)
Content and Salient Semantics Collaboration for Cloth-Changing Person Re-Identification [74.1] 衣服を交換する人の再識別は、重複しないカメラで同じ人の衣服の変化を認識することを目的としている。
本稿では、並列間セマンティクスの相互作用と洗練を容易にするコンテンツ・サリアンセマンティクス協調フレームワークを提案する。
我々のフレームワークはシンプルだが有効であり、重要な設計はセマンティックス・マイニング・アンド・リファインメント(SMR)モジュールである。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:17:28 GMT)
Demystify Mamba in Vision: A Linear Attention Perspective [72.9] Mambaは線形計算複雑性を持つ効率的な状態空間モデルである。
我々は,Mambaが線形アテンショントランスフォーマーと驚くほど類似していることを示す。
本稿では,これら2つの鍵設計の利点を線形注意に取り入れた,マンバ様線形注意(MLLA)モデルを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:31:09 GMT)
Towards Efficient LLM Grounding for Embodied Multi-Agent Collaboration [70.1] 本稿では,多エージェント協調のための新しいフレームワークを提案する。これは,効率的な自己調整のための強化アドバンテージフィードバック(Reinforced Advantage feedback, ReAd)を導入する。
強化学習における重み付き回帰を多エージェントシステムに拡張して理論的解析を行う。
Over-AIと難解なRoCoBenchの実験は、ReAdが成功率のベースラインを超え、エージェントの相互作用ステップを著しく減少させることを示している。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:31:15 GMT)
Attractor Memory for Long-Term Time Series Forecasting: A Chaos Perspective [63.6] textbftextitAttraosはカオス理論を長期時系列予測に取り入れている。
本研究では,AttraosがPatchTSTと比較して,パラメータの12分の1しか持たない主流データセットやカオスデータセットにおいて,LTSF法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:51:22 GMT)
Implicit Multimodal Alignment: On the Generalization of Frozen LLMs to Multimodal Inputs [63.3] 大規模言語モデル(LLM)は、マルチモーダルな微調整をせずに、マルチモーダルなタスクにおいて印象的なパフォーマンスを示した。
本研究では,画像,ビデオ,音声,テキストの入力に凍結LDMを公開し,内部表現を解析する。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:31:59 GMT)
KG-FIT: Knowledge Graph Fine-Tuning Upon Open-World Knowledge [63.2] 知識グラフ埋め込み(KGE)技術は、知識グラフ内の実体と関係のコンパクトな表現を学習するために重要である。
本研究では、エンティティクラスタのセマンティックコヒーレントな階層構造を構築するKG-FITを紹介する。
ベンチマークデータセットFB15K-237、YAGO3-10、PrimeKGの実験は、最先端の訓練済み言語モデルに基づく手法よりもKG-FITの方が優れていることを示した。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:04:26 GMT)
vHeat: Building Vision Models upon Heat Conduction [63.0] vHeatは、高い計算効率とグローバルな受容場の両方を同時に達成する、新しいビジョンバックボーンモデルである。
基本的な考え方は、画像パッチを熱源として概念化し、それらの相関の計算を熱エネルギーの拡散としてモデル化することである。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:58:04 GMT)
Continual Multimodal Knowledge Graph Construction [62.8] 現在のマルチモーダル知識グラフ構築(MKGC)モデルは、絶え間なく出現する実体と関係の現実的なダイナミズムに苦慮している。
本研究では,連続的なMKGCドメインの開発を促進するためのベンチマークを紹介する。
マルチメディアデータ処理における既存のMKGCアプローチの欠点を克服するMSPTフレームワークを導入する。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:29:05 GMT)
On Bits and Bandits: Quantifying the Regret-Information Trade-off [62.6] インタラクティブな意思決定タスクでは、情報は直接のインタラクション、間接的なフィードバックの受信、および外部の知識のあるソースから取得することができる。
ビット単位で測定された外部ソースからの情報は、後悔と引き換えに、報酬で測定できることを示す。
エージェントが蓄積する情報に依存する、最初のベイズ的後悔の低い境界を導入する。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:18:38 GMT)
Cocktail: A Comprehensive Information Retrieval Benchmark with LLM-Generated Documents Integration [60.5] LLM(Large Language Models)の普及は、インターネット上のAIGC(AIGC)の流入につながっている。
AIGCの急増が情報検索システムに与える影響は、まだ明らかな疑問である。
我々は、この混合ソースデータランドスケープでIRモデルを評価するのに適したベンチマークであるCocktailを紹介した。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:30:20 GMT)
Learning to Use Tools via Cooperative and Interactive Agents [59.7] ツール学習は、大きな言語モデル(LLM)をエージェントとして、その能力を拡張するために外部ツールを使用する権限を与える。
既存の手法では、1つのLCMベースのエージェントを使用してツールを反復的に選択し実行し、その結果を次のアクション予測に組み込む。
本研究では,協調型対話型エージェントフレームワークであるConAgentsを提案し,ツール学習のワークフローをグラウンディング,実行,監視エージェントにモジュール化する。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:49:56 GMT)
Bayesian Inference with Deep Weakly Nonlinear Networks [58.0] 我々は,完全連結ニューラルネットワークによるベイズ推定が解けることを示す物理レベルの厳密さを示す。
我々はモデルエビデンスを計算し、任意の温度で1/N$で任意の順序に後続する手法を提供する。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:08:04 GMT)
Variance-Reducing Couplings for Random Features: Perspectives from Optimal Transport [57.7] ランダム機能(RF)は、機械学習におけるカーネルメソッドをスケールアップするための一般的なテクニックであり、正確なカーネル評価をモンテカルロ推定に置き換える。
我々は、理論的洞察と数値アルゴリズムを用いて最適な輸送の統一的な枠組みを用いて、ユークリッドおよび離散入力空間上で定義されたカーネルに対して、新しい高性能なRF結合を開発する。
パラダイムとしての分散還元の利点と限界について、驚くほどの結論に達した。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:25:09 GMT)
Multi-Reference Preference Optimization for Large Language Models [56.8] 複数の参照モデルを用いた直接選好最適化のための新しいクローズドフォームの定式化を提案する。
得られたアルゴリズムであるMulti-Reference Preference Optimization (MRPO)は、様々な参照モデルからより広範な事前知識を活用する。
MRPOを微調整したLLMは,データ不足や多量性に関わらず,様々な嗜好データにおいてより一般化されていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:29:04 GMT)
Delving into Multi-modal Multi-task Foundation Models for Road Scene Understanding: From Learning Paradigm Perspectives [56.2] 本稿では,道路シーンに特化して設計されたMM-VUFMの系統解析について述べる。
本研究の目的は,タスク特化モデル,統合マルチモーダルモデル,統合マルチタスクモデル,基礎モデル推進技術など,共通プラクティスの包括的概要を提供することである。
我々は、クローズドループ駆動システム、解釈可能性、エンボディドドライブエージェント、世界モデルなど、重要な課題と今後のトレンドに関する洞察を提供する。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:54:10 GMT)
Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.4] 上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:23:46 GMT)
Chain of Tools: Large Language Model is an Automatic Multi-tool Learner [55.0] Automatic Tool Chain(ATC)は、大規模言語モデル(LLM)がマルチツールユーザとして機能することを可能にするフレームワークである。
次に,ツールの範囲を拡大するために,ブラックボックス探索法を提案する。
包括的な評価のために、ToolFlowという挑戦的なベンチマークを構築しました。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:40:58 GMT)
Multi-Level Additive Modeling for Structured Non-IID Federated Learning [54.5] 我々は、異種クライアント間のより良い知識共有のために、マルチレベル付加モデル(MAM)と呼ばれるマルチレベル構造で編成されたモデルを訓練する。
フェデレートMAM(FeMAM)では、各クライアントは各レベル毎に少なくとも1つのモデルに割り当てられ、そのパーソナライズされた予測は、各レベルに割り当てられたモデルの出力を合計する。
実験により、FeMAMは既存のクラスタリングFLおよびパーソナライズされたFLメソッドを様々な非IID設定で超越していることが示された。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:54:53 GMT)
A Unified Implicit Attention Formulation for Gated-Linear Recurrent Sequence Models [54.5] 効率的なシーケンスモデリングの最近の進歩は、無注意層に繋がった。
我々はこれらのモデルの統一的なビューを示し、暗黙の因果自己注意層のような層を定式化する。
論文参考訳(メタデータ) (Sun, 26 May 2024 09:57:45 GMT)
AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.5] AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:31:24 GMT)
Foundation Policies with Hilbert Representations [54.4] ラベルなしオフラインデータから一般ポリシーを事前学習するための教師なしフレームワークを提案する。
我々の重要な洞察は、基盤となる環境の時間的構造を保存する構造的表現を学習することである。
実験の結果、教師なしのポリシーは、ゴール条件付きおよび一般のRLタスクをゼロショットで解決できることがわかった。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:44:52 GMT)
ZigZag: Universal Sampling-free Uncertainty Estimation Through Two-Step Inference [54.2] 汎用的でデプロイが容易なサンプリング不要のアプローチを導入します。
我々は,最先端手法と同等の信頼性のある不確実性推定を,計算コストを著しく低減した形で生成する。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:10:08 GMT)
Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizer [52.1] 人間の嗜好を学習する際の分布変化と不確実性の一形態として,不一致の原因を同定する。
過度な最適化を緩和するために、まず、逆選択された報酬モデルに最適なポリシーを選択する理論アルゴリズムを提案する。
報奨モデルとそれに対応する最適ポリシーの等価性を用いて、優先最適化損失と教師付き学習損失を組み合わせた単純な目的を特徴とする。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:38:50 GMT)
Inaccurate Label Distribution Learning with Dependency Noise [52.1] 本稿では,依存雑音に基づく不正確なラベル分布学習(DN-ILDL)フレームワークを導入し,ラベル分布学習におけるノイズによる課題に対処する。
本稿では,DN-ILDLがILDL問題に効果的に対処し,既存のLCL法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:58:07 GMT)
Multiplicative Reweighting for Robust Neural Network Optimization [51.7] MW(multiplicative weight)更新は、専門家のアドバイスにより、適度なデータ破損に対して堅牢である。
MWはラベルノイズの存在下でニューラルネットワークの精度を向上することを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:27:35 GMT)
Sp2360: Sparse-view 360 Scene Reconstruction using Cascaded 2D Diffusion Priors [51.4] 潜時拡散モデル(LDM)を用いた360度3次元シーンのスパースビュー再構成に挑戦する。
SparseSplat360は,未完成の細部を埋めたり,新しいビューをクリーンにするために,インペイントとアーティファクト除去のカスケードを利用する手法である。
提案手法は,9つの入力ビューから360度映像全体を生成する。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:01:39 GMT)
M$^3$CoT: A Novel Benchmark for Multi-Domain Multi-step Multi-modal Chain-of-Thought [50.6] MCoT(Multi-modal Chain-of-Thought)は、ステップバイステップ推論において、テキストと視覚の両方のモダリティからの知識を活用するモデルを必要とする。
現在のMCoTベンチマークでは、(1)視覚的モーダル推論の欠如、(2)単段階視覚的モーダル推論の欠如、(3)ドメインの欠如など、いくつかの課題に直面している。
上記の課題に対処するための新しいベンチマーク(M$3$CoT)を導入し、マルチドメイン、マルチステップ、マルチモーダルCoTを推進した。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:56:30 GMT)
A Provably Effective Method for Pruning Experts in Fine-tuned Sparse Mixture-of-Experts [49.4] 本論文は,MoEモデルにおけるエキスパートの刈り取りに有効な手法として,初めて提案するものである。
理論的には、事前訓練されたモデルからルータl2ノルムを小さく変更することで、専門家のプルーニングを優先順位付けすることで、テスト精度の維持が保証される。
我々の理論解析は、単純化されたMoEアーキテクチャ上でのバイナリ分類タスクに重点を置いているが、我々の専門的なプルーニング手法は、大きな視覚的MoEモデルに基づいて検証されている。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:52:58 GMT)
Conjunctive categorial grammars and Lambek grammars with additives [49.2] 基本分類文法を結合操作で強化することにより,新しい分類文法群が提案される。
また、連結な圏文法はランベック計算に自然に結合および共役演算と共役演算を組み込むことが示されている。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:53:56 GMT)
SpinQuant -- LLM quantization with learned rotations [49.1] 重み、アクティベーション、KVキャッシュに適用された後トレーニング量子化(PTQ)技術は、大規模言語モデル(LLM)のメモリ使用量、レイテンシ、消費電力を大幅に削減する。
近年の研究では、回転活性化または重量行列は、外れ値を取り除き、量子化の恩恵をもたらすことが示唆されている。
SpinQuantは同時処理のQuaRotより優れている。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:15:49 GMT)
Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.9] 本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。
公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:58:22 GMT)
Causal-Aware Graph Neural Architecture Search under Distribution Shifts [48.0] Causal-aware Graph Neural Architecture Search (CARNAS)は、アーキテクチャ探索プロセス中に因果グラフ-アーキテクチャ関係をキャプチャする。
本稿では,潜伏空間内の因果部分グラフに介入するグラフ埋め込み干渉法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:55:22 GMT)
A Chinese Dataset for Evaluating the Safeguards in Large Language Models [46.4] 大型言語モデル(LLM)は有害な応答を生み出す。
本稿では,中国のLLMの安全性評価のためのデータセットを提案する。
次に、偽陰性例と偽陽性例をよりよく識別するために使用できる他の2つのシナリオに拡張する。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:15:44 GMT)
AmbigDocs: Reasoning across Documents on Different Entities under the Same Name [46.3] 混乱したエンティティの言及を扱うことは、言語モデル(LM)にとって重要なスキルである。
この機能をテストするために、新しいベンチマークであるAmbigDocsを導入しました。
あいまいな名前とそれに対応する答えの集合を含む質問を生成する。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:00:07 GMT)
Entanglement and Bell inequality violation in vector diboson systems produced in decays of spin-0 particles [45.0] スピン-0粒子の崩壊によって生じる2つのベクトルボソン系の保存とエンタングルメントMP不等式違反について論じる。
この種の模範的な過程として、異常結合を持つ崩壊 $Hto ZZ$ を用いる。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:21:06 GMT)
Entanglement and Bell inequalities violation in $H\to ZZ$ with anomalous coupling [45.0] ヒッグス崩壊によって生じる2つのZ$ボソン系のベル型不等式の絡み合いと違反について論じる。
ZZ$状態が絡み合っていて、ペア(非正則)結合定数のすべての値の不等式に反する。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:12:24 GMT)
Mixture of Experts Using Tensor Products [44.8] マルチタスク学習では、従来の手法では複数のタスクでモデルを同時にトレーニングする。
モジュール型言語モデルが肯定的伝達と体系的一般化を促進できるかどうかを検討する。
具体的には、パラメータ効率とニュアンス付きルーティング手法のバランスをとる新しいモジュラー言語モデル(textttTensorPoly)を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:25:08 GMT)
Guidance with Spherical Gaussian Constraint for Conditional Diffusion [43.1] 拡散モデルの最近の進歩は、訓練を必要とせず、異なる損失関数をガイダンスに利用することで条件付き生成タスクを処理しようとするものである。
これらの手法は一定の成功を収めたが、しばしばサンプルの品質を妥協し、小さなガイダンスのステップサイズを必要とする。
本稿では, 損失誘導を行う際に, サンプリング過程における多様体偏差の基本的な問題を明らかにする。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:26:15 GMT)
tinyBenchmarks: evaluating LLMs with fewer examples [43.0] Open LLM Leaderboard、MMLU、HELM、AlpacaEval 2.0。
実験により,これらのツールと小さなベンチマークは,元の評価結果を確実かつ効率的に再現するのに十分であることを実証した。
論文参考訳(メタデータ) (Sun, 26 May 2024 22:27:23 GMT)
Augmented Risk Prediction for the Onset of Alzheimer's Disease from Electronic Health Records with Large Language Models [42.7] アルツハイマー病(英語: Alzheimer's disease、AD)は、65歳以上のアメリカ人で5番目に多い死因である。
大規模言語モデル(LLM)の最近の進歩は、リスク予測の強化に強い可能性を秘めている。
本稿では,LSMの少数ショット推論能力を活用することでリスク予測を向上する新しいパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:05:10 GMT)
CRoFT: Robust Fine-Tuning with Concurrent Optimization for OOD Generalization and Open-Set OOD Detection [42.3] トレーニングデータにおけるエネルギースコアの最大化は、ドメイン一貫性のあるヘッセンの分類損失につながることを示す。
我々は,両タスクの同時最適化を可能にする統合された微調整フレームワークを開発した。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:28:59 GMT)
Understanding the Effect of using Semantically Meaningful Tokens for Visual Representation Learning [41.8] 視覚言語事前学習フレームワーク内のトランスフォーマーエンコーダに対して意味論的に意味のある視覚トークンを提供する。
テキスト・ツー・イメージ検索タスクと画像・テキスト検索タスク間で学習された表現品質のViTに対する顕著な改善を示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:46:22 GMT)
CPsyCoun: A Report-based Multi-turn Dialogue Reconstruction and Evaluation Framework for Chinese Psychological Counseling [41.7] 中国における心理カウンセリングのための多面的対話再構築・評価フレームワークCPsyCounを提案する。
心理カウンセリングレポートを完全に活用するために、高品質な対話を構築するための2段階のアプローチが考案された。
マルチターン心理相談の効果的な自動評価のための総合評価ベンチマークを開発した。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:18:00 GMT)
MentalManip: A Dataset For Fine-grained Analysis of Mental Manipulation in Conversations [41.7] 心的操作は対人会話において重要な虐待形態である。
本研究は、4000ドルの注釈付き映画対話からなる、$rm M Small entalM Small anip$という新しいデータセットを紹介する。
このデータセットは、精神的な操作の包括的な分析を可能にし、操作に使用されるテクニックと、被害者がターゲットとする脆弱性の両方をピンポイントする。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:27:48 GMT)
A Survey of Multimodal Large Language Model from A Data-centric Perspective [41.3] マルチモーダルな大言語モデル(MLLM)は、従来の大言語モデルの能力を高める。
データはこれらのモデルの開発と改良において重要な役割を担います。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:31:21 GMT)
Discovery and Expansion of New Domains within Diffusion Models [41.3] 拡散モデルの一般化特性を数発のセットアップで検討する。
ドメイン外のターゲットデータを合成するための新しいチューニング不要パラダイムを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:17:35 GMT)
Fair Federated Learning under Domain Skew with Local Consistency and Domain Diversity [40.8] フェデレートラーニング(FL)は、プライバシ保護の協調トレーニングのための新しいパラダイムとして登場した。
ドメインスキューでは、現在のFLアプローチはバイアスがあり、2つのフェアネス問題に直面している。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:29:10 GMT)
Deep Generative Models for Offline Policy Learning: Tutorial, Survey, and Perspectives on Future Directions [40.5] 本稿では,オフライン政策学習における深層生成モデルの適用について,最初の体系的なレビューを行う。
本稿では、変分オートエンコーダ、生成アドリアスネットワーク、正規化フロー、トランスフォーマー、およびリバーサモデルを含む5つの主流の深層生成モデルについて述べる。
各タイプのDGMに基づくオフライン政策学習において、基本スキームを抽出し、DGMの使用状況に基づいて関連作業の分類を行い、アルゴリズムの開発プロセスを整理する。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:23:47 GMT)
Can Class-Priors Help Single-Positive Multi-Label Learning? [40.3] シングル陽性マルチラベル学習(SPMLL)は、典型的には弱教師付きマルチラベル学習問題である。
クラスプライア推定器を導入し、理論上はクラスプライアに収束することが保証されているクラスプライアを推定することができる。
推定されたクラスプライヤに基づいて、分類のための非バイアスリスク推定器が導出され、対応するリスク最小化器が、完全に教師されたデータ上で、最適リスク最小化器にほぼ収束することを保証できる。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:32:00 GMT)
Towards Imitation Learning in Real World Unstructured Social Mini-Games in Pedestrian Crowds [40.2] イミテーションラーニング(IL)戦略は、人間の軌道から学習することで、ロボットの動き計画とナビゲーションのためのポリシーを生成するために用いられる。
動作計画タスクにおける実世界の社会的相互作用シナリオにおける代表的IL手法のベンチマークを行った。
まず、密結合相互作用におけるエージェントの多様な動作モードを学習するために、マルチエージェントコスト関数の学習が必要である。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:48:21 GMT)
Enabling Weak LLMs to Judge Response Reliability via Meta Ranking [38.6] 我々は、$textitMeta Ranking$ (MR) と呼ばれるクロスクエリベースの新しい手法を提案する。
MRは、ターゲットクエリ-レスポンスペアを複数の参照クエリ-レスポンスペアにペアでランク付けすることで、信頼性を評価する。
MRはモデルカスケーディングとインストラクションチューニングの2つの実用的応用において、強力なLLMの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:46:42 GMT)
IEPile: Unearthing Large-Scale Schema-Based Information Extraction Corpus [38.3] IEPileは、約0.32Bのトークンを含む包括的バイリンガル(英語と中国語)IE命令コーパスである。
我々は,既存のIEデータセット33件の収集とクリーニングによってIEPileを構築し,大規模なコーパスを探索するためにスキーマベースの命令生成を導入する。
IEPileはIE向けのLLMの性能を向上し、ゼロショットの一般化を顕著に改善した。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:54:41 GMT)
Attending to Topological Spaces: The Cellular Transformer [37.8] トポロジカルディープラーニングは、入力データにトポロジ的構造を活用することにより、ニューラルネットワークモデルの予測性能を高めることを目指している。
本稿では,グラフベースのトランスをセルコンプレックスに一般化する新しいアーキテクチャであるCellular Transformer(CT)を紹介する。
CTは最先端のパフォーマンスを実現するが、より複雑な拡張を必要としない。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:29:11 GMT)
Decomposing the Neurons: Activation Sparsity via Mixture of Experts for Continual Test Time Adaptation [37.8] 継続的なテスト時間適応(CTTA)は、トレーニング済みのモデルを進化し続けるターゲットドメインに適応させることを目的としている。
我々はCTTAタスクのアダプタとしてMixture-of-Activation-Sparsity-Experts (MoASE)の統合について検討する。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:51:39 GMT)
PPRSteg: Printing and Photography Robust QR Code Steganography via Attention Flow-Based Model [35.8] QRコードステガノグラフィーは、自然な画像に非自然なイメージを埋め込むことを目的としており、復元されたQRコードを認識する必要がある。
本稿では,QRコードをホスト画像に隠蔽する機能を持つPing and Photography Robust Steganography(PPRSteg)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:16:40 GMT)
Contextual Linear Optimization with Bandit Feedback [35.7] 本稿では,帯域フィードバックを用いた文脈線形最適化(CLO)のアルゴリズムのクラスについて検討する。
IERMに対する高速な後悔境界を示し、不特定モデルクラスと最適化推定の柔軟な選択を可能にする。
当社の独立利害理論の副産物は、IERMの完全なフィードバックと不特定政策クラスによる高速な後悔である。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:27:27 GMT)
Triple Preference Optimization: Achieving Better Alignment with Less Data in a Single Step Optimization [35.4] Triple Preference Optimization (TPO) は、大きめの言語モデルと3つの好みを、別個のSupervised Fine-Tuned (SFT)モデルを必要とせずに整合させるように設計されている。
TPOは,SFT,DPO,KTO,IPO,CPO,ORPOといった他の手法によるモデルと比較して,優れた結果が得られることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:18:11 GMT)
SED: Self-Evaluation Decoding Enhances Large Language Models for Better Generation [35.1] 本稿では,モデル生成の高速化を目的とした自己評価復号法であるSEDを提案する。
推測と評価のステップをデコードプロセスに統合し、LCMがより慎重に決定できるようにします。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:43:18 GMT)
Attaining Human`s Desirable Outcomes in Human-AI Interaction via Structural Causal Games [34.3] 人間とAIの相互作用において、顕著なゴールは、AIエージェントの助けを借りて、人間が望ましい結果を達成することである。
我々は、人間とAIの対話プロセスを形式化するために、構造因果ゲーム(SCG)と呼ばれる理論的枠組みを用いる。
我々は、AIエージェントを操り、人間に望ましい結果を得るための、SCGに対する事前政治介入と呼ばれる戦略を導入する。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:42:49 GMT)
FRCNet Frequency and Region Consistency for Semi-supervised Medical Image Segmentation [34.1] 半教師型医用画像分割のための2つの整合正則化戦略を導入する。
提案したFDCとMRSCの助けを借りて,その強力な特徴表現能力を効果的かつ効率的に活用することができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:51:27 GMT)
On the Algorithmic Bias of Aligning Large Language Models with RLHF: Preference Collapse and Matching Regularization [33.3] 選好マッチング(PM) RLHF はBradley-Terry--Luce/Plackett--Luce モデルの下で、大きな言語モデルと報酬モデルの選好分布を整合させる新しいアプローチである。
我々のアプローチの中心はPM正則化器であり、応答上の LLM のポリシー確率分布の負の対数の形を取る。
本稿では,自然言語生成に適した条件付きPM RLHFを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:00:05 GMT)
Text-Free Multi-domain Graph Pre-training: Toward Graph Foundation Models [33.3] テキストフリーなマルチドメイングラフ事前学習・適応フレームワークMDGPTを提案する。
まず、シナジスティックな事前学習のために、ソースドメインにまたがる機能を整列する一連のドメイントークンを提案する。
第2に、統合されたプロンプトと混合プロンプトからなる二重プロンプトを提案し、統合されたマルチドメイン知識でターゲットドメインをさらに適応させる。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:47:23 GMT)
High-Performance Temporal Reversible Spiking Neural Networks with $O(L)$ Training Memory and $O(1)$ Inference Cost [32.4] スパイキングニューラルネットワーク(SNN)は、トレーニング中のメモリ要求を増大させ、推論エネルギーコストを増大させる。
本研究では、トレーニングと推論の課題に共同で取り組むために、SNN(T-RevSNN)のための新しい時間的可逆アーキテクチャを提案する。
T-RevSNNはImageNet上で優れた精度を実現し、メモリ効率、トレーニング時間加速度、推論エネルギー効率を大幅に改善することができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:26:56 GMT)
Realizing Disentanglement in LM Latent Space via Vocabulary-Defined Semantics [32.2] 本稿では,語彙定義意味論(vocabulary-defined semantics)と呼ばれる先駆的アプローチを導入する。
我々は、LM適応の新たな方法として、データ表現のセマンティッククラスタリングを行う。
提案手法は,検索拡張生成とパラメータ効率の微調整の最先端手法より優れている。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:12:35 GMT)
DVI-SLAM: A Dual Visual Inertial SLAM Network [31.1] 本稿では2つの視覚的要素を持つ新しいディープSLAMネットワークを提案する。
提案するネットワークは,両視覚要因の信頼度マップを動的に学習し,調整する。
大規模な実験により,提案手法はいくつかの公開データセットにおいて,最先端の手法を著しく上回っていることが確認された。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:48:04 GMT)
The Stronger the Diffusion Model, the Easier the Backdoor: Data Poisoning to Induce Copyright Breaches Without Adjusting Finetuning Pipeline [30.8] 我々は、生成AIモデルに対する著作権侵害攻撃を形式化し、SilentBadDiffusionというバックドア攻撃手法を提案した。
本手法は, 著作権情報とテキスト参照の接続を有毒データに戦略的に埋め込む方法である。
本実験は, 汚染データの盗みと有効性を示すものである。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:00:10 GMT)
A Preliminary Empirical Study on Prompt-based Unsupervised Keyphrase Extraction [30.6] キーフレーズ抽出作業における異なるプロンプトの有効性を検討した。
設計の複雑なプロンプトは、長いドキュメントに直面したときに単純なプロンプトを設計するよりも優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:37:57 GMT)
Do LLM Agents Have Regret? A Case Study in Online Learning and Games [30.4] 大規模言語モデル(LLM)は(対話的な)意思決定にますます採用されている。
オンライン学習とゲーム理論のベンチマーク決定設定において,それらの相互作用について検討する。
本稿では,教師付きプレトレーニングの損失とは対照的に,教師付き行動のラベルを必要としない新しいインフントレーニングの損失を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 22:32:25 GMT)
A Decision-Language Model (DLM) for Dynamic Restless Multi-Armed Bandit Tasks in Public Health [29.9] 大規模言語モデル(LLM)は、ロボット制御とナビゲーションの領域にまたがる包括的な自動プランナーとして登場した。
本稿では,RMAB ポリシーを動的に微調整する RMAB のための決定言語モデル (DLM) を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 22:46:45 GMT)
Reverse Transition Kernel: A Flexible Framework to Accelerate Diffusion Inference [29.6] DDPMはRTKのガウス近似を用いており、結果としてサブプロブレム当たりの複雑さは低く、多くのセグメントを必要とする。
我々は、よりバランスの取れたサブプロブレム分解を可能にする一般的なRTKフレームワークを開発し、その結果、$tilde O(1)$サブプロブレムとなる。
そこで我々は,2つの高速サンプリングアルゴリズムであるMetropolis-Adjusted Langevin Algorithm (MALA) とUnderdamped Langevin Dynamics (ULD) を用いて,これらの強い対数対数のサブプロブレムの解法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:26:57 GMT)
Semantic-aware SAM for Point-Prompted Instance Segmentation [29.3] 本稿では,Segment Anything (SAM) を用いた費用対効果の高いカテゴリー別セグメンタを提案する。
この課題に対処するために、複数のインスタンス学習(MIL)と整合性を備えたSAMとポイントプロンプトを備えたセマンティック・アウェア・インスタンスネットワーク(SAPNet)を開発した。
SAPNetはSAMによって生成される最も代表的なマスクの提案を戦略的に選択し、セグメンテーションを監督する。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:19:06 GMT)
Unraveling the Smoothness Properties of Diffusion Models: A Gaussian Mixture Perspective [29.3] 拡散過程のリプシッツ連続性と第二運動量特性の理論的理解を提供する。
この結果から, 共通データ分布下での拡散過程のダイナミクスについて, より深い理論的知見が得られた。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:32:27 GMT)
Tensor Attention Training: Provably Efficient Learning of Higher-order Transformers [29.3] テンソルアテンショントレーニングの後方勾配は、ほぼ線形な$n1+o(1)$時間で計算できることを示す。
本結果は,高次変圧器の効率的な訓練の実現可能性を確立し,テンソルアテンションアーキテクチャの実践的応用を促進することができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:59:13 GMT)
Towards Responsible and Safe AI in the Era of Foudnation Models: A Reference Architecture for Designing Foundation Model based Systems [28.8] ファンデーションモデルが将来のAIシステムの基本的なビルディングブロックになる、という広いコンセンサスがある。
基礎モデルをAIシステムに組み込むことは、責任と安全性に関する重要な懸念を提起する。
本稿では,基礎モデルに基づくシステム設計のためのパターン指向参照アーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:51:04 GMT)
Safe and Balanced: A Framework for Constrained Multi-Objective Reinforcement Learning [26.2] 本稿では,多目的学習と制約順守の政策最適化を協調するプライマリベースフレームワークを提案する。
提案手法は,複数のRL目標を最適化するために,新しい自然ポリシー勾配演算法を用いる。
また,提案手法は,安全性の高い多目的強化学習タスクにおいて,最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:42:10 GMT)
Transformers as Decision Makers: Provable In-Context Reinforcement Learning via Supervised Pretraining [25.7] 本稿では,テキスト内強化学習のための教師付き事前学習を理論的に分析する枠組みを提案する。
ReLUに着目した変換器は、最適に近いオンライン強化学習アルゴリズムを効率的に近似できることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:55:19 GMT)
A Slices Perspective for Incremental Nonparametric Inference in High Dimensional State Spaces [25.2] 本研究では,高次元状態空間における漸進的非パラメトリック確率推定法を提案する。
提案手法は高次元表面のスライスを利用して任意の形状の後方分布を効率的に近似する。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:52:56 GMT)
Large Scale Knowledge Washing [24.5] 本稿では,大規模な知識洗浄の問題を紹介し,膨大な事実知識の「学習」に焦点を当てた。
従来のアンラーニング手法は通常、逆損失を定義し、バックプロパゲーションを通じてモデルを更新する。
本稿では,デコーダのみの言語モデルのレイヤを更新し,知識洗浄を行うLAW(Large Scale Washing)を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:29:49 GMT)
The Importance of Directional Feedback for LLM-based Optimizers [23.7] 本研究では,自然言語と数値フィードバックを用いてテキスト空間の問題を解決する対話型言語モデル (LLM) の可能性について検討する。
我々は,過去の最適化トレースから指向性フィードバックを合成し,繰り返しよりも信頼性の高い改善を実現するLLMベースの新しい設計を行う。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:22:35 GMT)
A CMDP-within-online framework for Meta-Safe Reinforcement Learning [23.6] CMDP-within-onlineフレームワークを用いたメタセーフ強化学習(Meta-SRL)の課題について検討する。
我々は,勾配に基づくメタ学習を用いて,目に見えない(最適性ギャップ)と制約違反に対する平均的後悔境界を求める。
本稿では,タスク内最適性ギャップと制約違反の上限において,不正確なオンライン学習を行うメタアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:28:42 GMT)
Fast Summary-based Whole-program Analysis to Identify Unsafe Memory Accesses in Rust [23.1] Rustは40年以上にわたって低レベルのソフトウェアに悩まされてきたメモリ安全性問題を解決する最も有望なシステムプログラミング言語の1つである。
アンセーフなRustコードと直接リンクされたアンセーフな外部ライブラリは、メモリ安全違反自体を導入するだけでなく、セーフなRustと同じモノリシックなアドレス空間で実行されるプログラム全体を侵害する可能性がある。
我々は、安全でないヒープの割り当てと、それらの安全でないヒープオブジェクトへのメモリアクセスの両方を識別するためのプログラム全体をプロトタイプ化した。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:15:28 GMT)
AdaFisher: Adaptive Second Order Optimization via Fisher Information [22.9] 本稿では,適応型プレコンディショニング勾配のためのフィッシャー情報行列に対して,ブロック対角近似を利用する適応型2次のAdaFisherを提案する。
AdaFisher は精度と収束速度の両方において SOTA よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:25:02 GMT)
Compressing Lengthy Context With UltraGist [22.1] 長大な文脈の高品質な圧縮を特徴とするUltraGistという手法を提案する。
UltraGistは、幅広いコンテキスト長と圧縮比をサポートするために効果的に学習できるため、圧縮の柔軟性に寄与する。
これにより、トレーニングプロセスのサンプル効率が向上し、トレーニングデータの使用が最大になる。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:23:56 GMT)
User-Friendly Customized Generation with Multi-Modal Prompts [21.9] 本稿では,各カスタマイズ概念に合わせて,テキストと画像の新たな統合を提案する。
カスタマイズされたテキスト・画像生成のためのパラダイムは,ユーザフレンドリーな既存のファインチューン・ベースの手法を超越している。
論文参考訳(メタデータ) (Sun, 26 May 2024 09:34:16 GMT)
A Circuit Approach to Constructing Blockchains on Blockchains [21.4] 私たちは、特定のブロックチェーンセットを読み込み、書き込みすることで、よりセキュアなオーバーレイブロックチェーンを構築する方法を示します。
1) 2つのブロックチェーン間のシリアルコンポジションは、少なくとも1つのアンダーレイブロックチェーンが安全で、両方のアンダーレイブロックチェーンが稼働している場合、安全であるオーバーレイブロックチェーンを生成する。
結果は同期設定にも拡張される。
論文参考訳(メタデータ) (Sun, 26 May 2024 22:29:33 GMT)
UPAM: Unified Prompt Attack in Text-to-Image Generation Models Against Both Textual Filters and Visual Checkers [21.3] テキスト・ツー・イメージ(T2I)モデルでは、不適切な画像や有害な画像を生成する可能性があるため、セキュリティ上の懸念が高まっている。
攻撃の観点からT2Iモデルのロバスト性を調べる新しいフレームワークであるUPAMを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:43:11 GMT)
VISTANet: VIsual Spoken Textual Additive Net for Interpretable Multimodal Emotion Recognition [21.2] 本稿では、VISTANet(Visual Textual Additive Net)というマルチモーダル感情認識システムを提案する。
VISTANetは、早期と後期の融合のハイブリッドを用いて、画像、音声、テキストのモダリティから情報を融合する。
KAAP技術は、特定の感情のクラスを予測するために、各モダリティとそれに対応する特徴の寄与を計算する。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:29:49 GMT)
Intruding with Words: Towards Understanding Graph Injection Attacks at the Text Level [21.0] グラフニューラルネットワーク(GNN)は、様々なアプリケーションにまたがるが、敵の攻撃に弱いままである。
本稿では,テキストレベルでのグラフインジェクションアタック(GIA)の探索の先駆者となる。
埋め込みレベルで見過ごされた要素であるテキストの解釈可能性(英語版)が、攻撃強度において重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:12:02 GMT)
Amortized Active Causal Induction with Deep Reinforcement Learning [20.7] Causal Amortized Active Structure Learning (CAASL) は、適応的でリアルタイムで、可能性へのアクセスを必要としない介入を選択できるアクティブな介入設計ポリシーである。
このポリシーは,設計環境シミュレータ上での強化学習と,収集したデータから推定した因果グラフの後部への真の因果グラフの接近度を測定する報奨関数を用いて訓練される。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:14:37 GMT)
The AI-DEC: A Card-based Design Method for User-centered AI Explanations [20.7] 我々は,AIの説明の4次元を定義する設計手法であるAI-DECを開発した。
我々は、医療、金融、マネジメント産業の労働者との共同設計セッションを通じて、この手法を評価する。
実世界のシステムにおけるAI説明のユーザ中心設計におけるAI-DECの利用の意味について論じる。
論文参考訳(メタデータ) (Sun, 26 May 2024 22:18:38 GMT)
Multi-Modal UAV Detection, Classification and Tracking Algorithm -- Technical Report for CVPR 2024 UG2 Challenge [20.5] 本報告では, CVPR 2024 UAV追跡・姿勢推定チャレンジにおける課題であるUG2+の初当選モデルについて述べる。
高精度なUAV分類・追跡のためのマルチモーダルなUAV検出・分類・3次元追跡手法を提案する。
本システムでは,最先端の分類手法と高度な後処理手順を統合し,精度と堅牢性を向上する。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:21:18 GMT)
Transfer Learning Under High-Dimensional Graph Convolutional Regression Model for Node Classification [20.2] グラフ畳み込み多相ロジスティック回帰(GCR)モデルと、トランス-GCRと呼ばれるGCRモデルに基づく伝達学習手法を提案する。
我々は,高次元環境下でのGCRモデルで得られた推定値について理論的に保証する。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:30:14 GMT)
Improving Implicit Regularization of SGD with Preconditioning for Least Square Problems [20.0] 最小二乗問題に対する事前条件付き勾配降下(SGD)の一般化性能について検討した。
提案したプレコンディショニング行列は有限標本からのロバストな推定が可能なほど単純であることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:17:59 GMT)
Visualizing the Shadows: Unveiling Data Poisoning Behaviors in Federated Learning [19.4] 本稿では,データ中毒に対するフェデレート学習(FL)システムの感受性について検討する。
我々はラベルフリップによる標的データ中毒攻撃をシミュレートし、モデル性能への影響を分析する。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:58:32 GMT)
Protect-Your-IP: Scalable Source-Tracing and Attribution against Personalized Generation [19.3] 画像著作権のソーストレーシングと属性の統一的なアプローチを提案する。
本稿では,プロアクティブ戦略とパッシブ戦略を融合した革新的な透かし属性法を提案する。
オンラインで公開されている様々なセレブの肖像画シリーズを用いて実験を行った。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:14:54 GMT)
Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems [19.3] ユーザ興味強化(UIE)は、ユーザプロファイルやユーザ履歴の動作シーケンスを含む、ユーザの関心を高める。
UIEは、関心の少ないユーザにおけるモデルパフォーマンスを著しく改善するだけでなく、他のユーザに対するモデルパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:18:53 GMT)
Few-shot Tuning of Foundation Models for Class-incremental Learning [19.2] 本稿では,新しいクラスの基礎モデルを数ショット設定で継続的にチューニングするための新しいアプローチを提案する。
CoACTは、ベンチマーク評価において現在のSOTAよりも13.5%改善されている。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:41:03 GMT)
Policy-based Primal-Dual Methods for Concave CMDP with Variance Reduction [19.0] 目的と制約の両方を状態行動占有度尺度の凹凸関数として定義したコンケーブCMDPについて検討する。
本稿では, 基本変数をポリシー勾配の上昇により更新し, 二次変数を予測下次降下により更新する, 可変生成プライマル・デュアルポリシー勾配を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:58:08 GMT)
Design Editing for Offline Model-based Optimization [18.7] オフラインモデルベース最適化(MBO)は、デザインとスコアのオフラインデータセットのみを使用してブラックボックスの目的関数を最大化することを目的としている。
一般的なアプローチでは、既存の設計とその関連するスコアに関する条件生成モデルをトレーニングし、続いてより高い目標スコアに条件付けされた新しい設計を生成する。
本稿では,2つのフェーズからなるオフラインモデルベース最適化(DEMO)のための新しい設計編集手法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:32:47 GMT)
Ethics Pathways: A Design Activity for Reflecting on Ethics Engagement in HCI Research [18.4] 倫理パスウェイズ(Ethics Pathways)は、研究における過去の倫理的関与の複雑さを理解するためのデザインアプローチを提供する。
このアクティビティには、倫理的なインシデントをリコールすること、状況に関わる利害関係者を説明すること、彼らの行動や投機的な選択肢を振り返ること、リフレクションと感情のウォークスルーという4つの主要なタスクが含まれる。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:16:27 GMT)
I2VEdit: First-Frame-Guided Video Editing via Image-to-Video Diffusion Models [18.4] 本稿では,1フレームからビデオ全体への編集を事前学習した画像対ビデオモデルを用いてプロパガンダすることで,画像編集ツールをビデオに適用可能にする,新しい汎用的ソリューションを提案する。
I2VEditと呼ばれる本手法は,編集範囲に応じて映像の視覚的・運動的整合性を適応的に保持する。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:47:40 GMT)
Let Silence Speak: Enhancing Fake News Detection with Generated Comments from Large Language Models [17.6] コメントはユーザーの意見、姿勢、感情を反映し、モデルは偽ニュースに対する理解を深める可能性がある。
露出バイアスと利用者のコメント意欲が異なるため、現実には多様なコメントを得るのは容易ではない。
我々は,多様なユーザプロファイルを持つLLMに対して,コメントを生成するフィードバック強化検出フレームワークGenFENDを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:09:23 GMT)
Daily Physical Activity Monitoring -- Adaptive Learning from Multi-source Motion Sensor Data [17.6] 医療アプリケーションでは、手首のウェアラブルデバイスのような単一のソースからのデータを使用する機械学習モデルを開発する必要性が高まっている。
しかしながら、単一ソースデータを使用することの制限は、人間の活動の全範囲を捉えるのに失敗するため、モデルの精度を損なうことが多い。
実験室で収集したマルチソースデータを活用することにより,日常的なアプリケーションを対象とした機械学習モデルを最適化するトランスファー学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:08:28 GMT)
INViT: A Generalizable Routing Problem Solver with Invariant Nested View Transformer [17.1] 深い強化学習は、高速ルーティングを学習してルーティング問題を解決するための有望な結果を示している。
解法の大半は、異なるスケールで見えない分布や分布に一般化することに苦しむ。
Invariant Nested View Transformer (INViT) と呼ばれる新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:27:25 GMT)
LTGC: Long-tail Recognition via Leveraging LLMs-driven Generated Content [17.0] 尾の認識は、尾のカテゴリから良い表現を学習し、すべてのカテゴリで不均衡に対処する必要があるため、困難である。
そこで本研究では,生成コンテンツを利用した長期認識を実現するための,新たな生成および微調整フレームワークLTGCを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:22:24 GMT)
Code Repair with LLMs gives an Exploration-Exploitation Tradeoff [16.8] 大きな言語モデル(LLM)でソースコードを反復的に改善し、修復することは、1ショットで構築するには複雑すぎるプログラムを生成する一般的な方法として現れている。
ここでは、リファインメントが探索と露見のトレードオフを露呈していることを示します。ほとんどのテストケースをパスするプログラムをリファイン化したり、考慮の少ないプログラムをリファインダでリファインダすることです。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:00:30 GMT)
Adaptive Activation Steering: A Tuning-Free LLM Truthfulness Improvement Method for Diverse Hallucinations Categories [16.7] 本稿では,適応的アクティベーションステアリング(ACT)について紹介する。
ACT は LLaMA (uparrow$%), LLaMA2 (uparrow$24%), Alpaca (uparrow$36%), Vicuna (uparrow$28%), LLaMA2-Chat (uparrow$19%) の真偽性を大幅に改善する
論文参考訳(メタデータ) (Sun, 26 May 2024 21:39:53 GMT)
Crossmodal ASR Error Correction with Discrete Speech Units [16.6] ASR誤り訂正(AEC)に対するASR後処理手法を提案する。
我々は、事前学習と微調整の戦略を探求し、ASRドメインの不一致現象を明らかにする。
そこで本稿では,AEC品質向上のための単語埋め込みの整合・強化を目的とした,離散音声ユニットの組込みを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:58:38 GMT)
M-RAG: Reinforcing Large Language Model Performance through Retrieval-Augmented Generation with Multiple Partitions [16.2] Retrieval-Augmented Generation (RAG)は、外部データベースから関連するメモリを取得することで、Large Language Models (LLM)を強化する。
既存のRAGメソッドは通常、データベース全体のすべてのメモリを整理する。
本稿では、複数の分割パラダイムをRAG(M-RAG)に導入し、各データベース分割をRAG実行の基本単位とする。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:03:13 GMT)
RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar [15.8] 3D占有に基づく知覚パイプラインは、かなり進歩した自律運転を持つ。
現在の方法では、LiDARやカメラの入力を3D占有率予測に頼っている。
本稿では,4次元イメージングレーダセンサを用いた3次元占有予測手法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:50:13 GMT)
Misinformation is not about Bad Facts: An Analysis of the Production and Consumption of Fringe Content [15.6] 我々は、オンライングループと極右グループがどのように共有し、既存のニュースメディアの記事を活用し、彼らの物語を前進させるかを検討する。
オーストラリアでは、中道派と極右派の両方の政治的傾向を持つニュース出版社が、情報完全性と品質のレベルを同等に含んでいることがわかった。
コミュニケーションスタイルに基づいて誤情報を共有する傾向のあるユーザを特定することができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:15:33 GMT)
Tradeoffs Between Alignment and Helpfulness in Language Models with Representation Engineering [15.5] 本研究では,アライメントの増加とモデルの有用性の低下のトレードオフについて検討する。
フレームワークの条件下では、アライメントは表現工学によって保証される。
本研究は,表現工学ベクトルのノルムにより,有用性が2次的に損なわれることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:07:55 GMT)
RealTCD: Temporal Causal Discovery from Interventional Data with Large Language Model [15.4] 時間因果発見は、観察から直接変数間の時間因果関係を特定することを目的としている。
既存の手法は主に介入対象に大きく依存する合成データセットに焦点を当てている。
本稿では、ドメイン知識を活用して、介入対象のない時間的因果関係を発見できるRealTCDフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:08:00 GMT)
CacheBlend: Fast Large Language Model Serving with Cached Knowledge Fusion [15.3] 大規模な言語モデル(LLM)は、必要なコンテキストを提供するために、入力に複数のテキストチャンクを組み込むことが多い。
プリフィルを高速化するために、テキストのKVキャッシュをプリコンプリートし、コンテキストが別のLCM入力のプレフィックスとして再利用されるときにKVキャッシュを再使用することができる。
我々は,プリコンパイルされたKVキャッシュをプレフィックスの有無にかかわらず再利用し,トークンの小さなサブセットのKV値を選択的に再計算し,再利用されたKVキャッシュを部分的に更新する方式であるCacheBlendを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:00:17 GMT)
Limits of Deep Learning: Sequence Modeling through the Lens of Complexity Theory [15.2] 現在のモデルは、真のマルチステップ推論よりもショートカットに依存しており、タスクの複雑さが増大するにつれてパフォーマンスが低下する。
我々の貢献は、SSMの限界を説明するための複雑性理論に基づく理論的枠組みを提供する。
実験の結果,Chain-of-Thoughtが促進しても,タスクの複雑性が増大するにつれて,大幅なパフォーマンス低下がみられた。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:33:23 GMT)
DPHGNN: A Dual Perspective Hypergraph Neural Networks [15.1] 低次セマンティクスを捉えるための等変演算子学習を導入した新しい双対パースペクティブHGNNであるDPHGNNを提案する。
半教師付きハイパーノード分類タスクのための8つのベンチマークハイパーグラフデータセットに対してDPHGNNをベンチマークする。
DPHGNNはパートナーのEコマース企業によってRTO(Return-to-Origin)予測タスクのためにデプロイされました。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:08:55 GMT)
Gaussian Approximation and Multiplier Bootstrap for Polyak-Ruppert Averaged Linear Stochastic Approximation with Applications to TD Learning [15.0] マルチプライヤブートストラップに基づくパラメータ推定における信頼区間の有効性を検証した。
本稿では,線形関数近似を用いた時間差学習の設定について述べる。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:43:30 GMT)
Fast algorithms for classical specifications of stabiliser states and Clifford gates [14.9] ベクトルが安定化状態であることを迅速に検証し、その仕様を振幅、二次形式、チェック行列として相互変換する方法を示す。
アルゴリズムのサンプル実装をPythonで提供します。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:36:03 GMT)
Revisiting Meta-evaluation for Grammatical Error Correction [14.8] SEEDAはGECメタ評価のための新しいデータセットである。
人間の評価を2つの異なる粒度で補正する。
その結果,既存の研究では編集基準が過小評価されていた可能性が示唆された。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:05:35 GMT)
Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction [14.8] 大規模言語モデル(LLM)は、いくつかのタスクにおいて既存の自動評価指標より優れていることが報告されている。
本研究では, 文法的誤り訂正(GEC)評価におけるLLMの性能について, 従来の研究から着想を得たプロンプトを用いて検討した。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:55:11 GMT)
DyGPrompt: Learning Feature and Time Prompts on Dynamic Graphs [14.6] 動的グラフモデリングのための新しいフレームワークであるDyGPromptを提案する。
まず,タスクの目的と,事前学習タスクと下流タスクの動的変動のギャップに対処する2つのプロンプトを設計する。
第2に,ノードと時間の特徴が相互に特徴付けされていることを認識し,下流タスクにおけるノード時間パターンの進化をモデル化するための2つの条件ネットを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:46:11 GMT)
Incremental Pseudo-Labeling for Black-Box Unsupervised Domain Adaptation [14.6] 対象モデルの一般化能力を向上させるために,高信頼度擬似ラベルを漸進的に選択する手法を提案する。
実験により,提案手法は3つのベンチマークデータセット上で,最先端のブラックボックスによる教師なしドメイン適応性能を実現することを示した。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:41:42 GMT)
LaCon: Late-Constraint Diffusion for Steerable Guided Image Synthesis [14.2] 本稿では,様々な条件を事前学習拡散モデルに同時に組み込むために,遅延制約拡散(LaCon)という代替パラダイムを提案する。
COCOデータセットの実験結果はLaConの有効性と優れた一般化能力を示している。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:13:36 GMT)
ECG Semantic Integrator (ESI): A Foundation ECG Model Pretrained with LLM-Enhanced Cardiological Text [14.1] 本研究は,12誘導ECG信号の学習表現の品質とロバスト性の向上を目的とした,新しいマルチモーダルコントラスト保持フレームワークを提案する。
私たちのフレームワークは、Cardio Query Assistant(CQA)とECG Semantics Integrator(ESI)の2つの重要なコンポーネントで構成されています。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:45:39 GMT)
Disentangling Foreground and Background Motion for Enhanced Realism in Human Video Generation [14.1] 異なる動き表現を用いて動きを分離することで、前景と背景のダイナミクスを同時に学習する手法を提案する。
我々は、この革新的な動きの描写アプローチによって強化された現実世界の動画を訓練する。
誤りを蓄積することなく、より長いシーケンスにビデオ生成をさらに拡張するために、クリップ・バイ・クリップ・ジェネレーション・ストラテジーを採用する。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:53:26 GMT)
Why is parameter averaging beneficial in SGD? An objective smoothing perspective [13.9] 勾配降下(SGD)とその暗黙バイアスは、しばしばミニマの鋭さによって特徴づけられる。
Izmailov et alで実証的に観察された一般用平均SGDアルゴリズムについて検討した。
本研究では,SGDの平均値が局所的な局所最小値を回避するスムーズな目的を効率的に最適化できることを証明した。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:54:08 GMT)
Zeroth-Order Sampling Methods for Non-Log-Concave Distributions: Alleviating Metastability by Denoising Diffusion [13.8] 本稿では,非正規化密度の問合せに基づく非ログコンケーブ分布からのサンプリング問題について考察する。
最初に、ディフュージョン・モンテカルロ(DMC)というフレームワークについて記述し、モンテカルロ推定器で近似されたスコア関数を持つ偏微分拡散過程のシミュレーションに基づく。
我々は、サンプリング拒絶に基づくこのオラクルの実装を提供し、これによりDMCをZODMC(ZerothOrder Diffusion Monte Carlo)と呼ばれる真のアルゴリズムに変換する。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:14:30 GMT)
Looks Too Good To Be True: An Information-Theoretic Analysis of Hallucinations in Generative Restoration Models [13.6] 生成モデルは、しばしば実際のデータと視覚的に区別できない結果を生み出すことができる。
生成モデルは幻覚を生成する - 地上の真実のイメージには存在しない現実的な外観の細部。
完全な知覚品質を達成するには、少なくともこの不確実性が2倍必要であることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:58:51 GMT)
Meta-Task Planning for Language Agents [13.6] 大規模言語モデルベースエージェント(LLMエージェント)は、人工知能(AGI)を実現するための有望なパラダイムとして登場した。
本稿では,メタタスク計画(Meta-Task Planning, MTP)を紹介する。
MTPはTravelPlannerで平均$sim40%$成功率を達成した。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:33:17 GMT)
Learning to Stabilize Online Reinforcement Learning in Unbounded State Spaces [13.5] 多くの強化学習(RL)応用において、我々は望ましい状態に到達し、制御されたシステムを許容範囲内に維持する政策を望んでいる。
本研究では,オンライントレーニング中の所望状態への距離を直接最小化する深いRLアルゴリズムが,しばしば不安定なポリシーをもたらすことを発見した。
1)リアプノフに基づくコスト形成手法と,2)非有界状態空間への状態変換の2つの考え方に基づくアプローチを導入する。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:47:48 GMT)
IAIFNet: An Illumination-Aware Infrared and Visible Image Fusion Network [13.1] 我々はIAIFNetという名前のイルミネーション対応赤外線・可視画像融合ネットワークを提案する。
本フレームワークでは,まず,入力画像の入射照明マップを推定する。
適応微分融合モジュール (ADFM) と有向目標認識モジュール (STAM) の助けを借りて, 画像融合ネットワークは, 照明付赤外線と可視画像の有向的特徴を高画質の融合画像に効果的に統合する。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:19:56 GMT)
Predicting Rental Price of Lane Houses in Shanghai with Machine Learning Methods and Large Language Models [13.1] 上海を含む大都市に住む若者の間では、住宅が重要な関心事となっている。
本研究では,複数線形回帰(MLR),リッジ回帰(RR),ラッソ回帰(LR),決定木(DT),ランダム森林(RF)の5つの従来の機械学習手法を利用する。
この手法を用いて2021年に上海で約2,609レーンの住宅賃貸取引の公開データを調べ、その結果を比較した。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:01:33 GMT)
On Computational Limits of Modern Hopfield Models: A Fine-Grained Complexity Analysis [12.7] 現代のホップフィールドモデルにおけるメモリ検索力学の計算限界について検討する。
我々の重要な貢献は、全ての近代ホプフィールドモデルの効率における相転移の挙動を特徴づけることである。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:18:34 GMT)
Categorical Flow Matching on Statistical Manifolds [12.6] 本稿では,情報幾何学に着想を得たパラメータ化確率尺度の多様体上でのフローマッチングフレームワークを提案する。
我々は,多様体間の微分同相法により数値安定性を克服する効率的なトレーニングとサンプリングアルゴリズムを開発した。
我々は、SFMが、既存のモデルがしばしば失敗するような統計多様体上でより複雑なパターンを学習できることを示した。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:50:39 GMT)
Provably Efficient Off-Policy Adversarial Imitation Learning with Convergence Guarantees [12.4] 本研究では, 外部AILアルゴリズムの収束特性とサンプル複雑性について検討する。
重要サンプリング補正がなくても、$o(sqrtK)$直近のポリシーで生成されたサンプルを再利用しても収束保証を損なわないことを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:17:32 GMT)
RLSF: Reinforcement Learning via Symbolic Feedback [12.2] シンボリックフィードバック(RLSF)による強化学習(Reinforcement Learning)と呼ばれる新しいトレーニング/ファインチューニングパラダイムを提案する。
RLSFでは、学習/微調整されているLLMはRLエージェントと見なされ、環境は推論ツールへのアクセスが可能である。
RLSFに基づくLLMの微調整は、2つの異なるアプリケーションにおいて従来のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:49:59 GMT)
Intelligence as Computation [12.2] この概念化は、インテリジェンス研究のすべての分野に統一された視点を提供することを目的としている。
物理的、神経的、身体的、形態学的、機械的知性など、現在調査中のいくつかの概念化を統一する。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:30:34 GMT)
MambaTS: Improved Selective State Space Models for Long-term Time Series Forecasting [12.1] 選択状態空間モデル(SSM)に基づくMambaは、Transformerの競合相手として登場した。
我々は4つの改善点を提案し、MambaTSに導いた。
8つの公開データセットで実施された実験は、MambaTSが新しい最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:50:17 GMT)
WorldCoder, a Model-Based LLM Agent: Building World Models by Writing Code and Interacting with the Environment [11.8] 我々は,環境とのインタラクションに基づいて,世界の知識を表現したPythonプログラムを構築するモデルベースエージェントを提案する。
我々は,グリッドワールド,タスクプランニングにおいて,我々のアプローチは深層RLに比べてサンプリング効率が良く,ReActスタイルのエージェントよりも計算効率が良く,コードを編集することで,その知識を環境間で伝達することができることを研究した。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:24:04 GMT)
Crossing Linguistic Horizons: Finetuning and Comprehensive Evaluation of Vietnamese Large Language Models [11.6] オープンソースの大言語モデル(LLM)はベトナム語処理において限られた効果を示す。
これらの問題を緩和するため、ベトナム専用にLLMを微調整しました。
以上の結果より, ベトナムでは, 微調整LDMは理解能力と生成能力が向上していることが明らかとなった。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:13:32 GMT)
Don't Fine-Tune, Decode: Syntax Error-Free Tool Use via Constrained Decoding [11.5] 大きな言語モデル(LLM)は多くのタスクで優れていますが、複雑な構文制約のため、外部ツールの使用に失敗することが多いのです。
本研究では,有限状態マシンを用いた復号アルゴリズムTOOLDECを提案する。
実験の結果、TOOLDECはすべての構文エラーを排除し、様々なベースモデルやベンチマークのパフォーマンスが大幅に向上した。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:16:18 GMT)
Rewarded Region Replay (R3) for Policy Learning with Discrete Action Space [11.5] 本稿では,個別な行動空間を持つ環境において,PPOを大幅に改善するRewarded Region Replay (R3)を紹介する。
R3は、ある閾値を超える報酬を持つ過去の成功した軌道を含む再生バッファを使用することで、サンプリング効率を向上させる。
その結果、R3はミニグリッド環境でのPPOよりも顕著に優れており、スパース報酬と離散アクション空間があることがわかった。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:01:29 GMT)
PipeFusion: Displaced Patch Pipeline Parallelism for Inference of Diffusion Transformer Models [11.1] 本稿では,拡散変換器(DiT)モデルを用いた高解像度画像生成手法であるPipeFusionを紹介する。
隣接する拡散ステップからの入力間の高い類似性を活用することで、PipeFusionはパイプラインの待ち時間を排除します。
実験により,既存の DiT 並列手法がOOM を満たす場合の高解像度画像を生成することができることを示した。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:57:33 GMT)
Zamba: A Compact 7B SSM Hybrid Model [11.0] Zambaは7B SSMトランスフォーマーハイブリッドモデルである。
Zambaは、公開データセットから1Tトークンをトレーニングする。
Zambaは、同等のトランスフォーマーモデルよりも推論がかなり速い。
論文参考訳(メタデータ) (Sun, 26 May 2024 22:23:02 GMT)
AI-Generated Text Detection and Classification Based on BERT Deep Learning Algorithm [10.6] 本研究では,BERTアルゴリズムに基づく効率的なAI生成テキスト検出モデルを提案する。
精度は初期94.78%から99.72%に上昇し、損失値は0.261から0.021に減少し、徐々に収束する。
損失値に関しては、トレーニングセットの平均損失は0.0565、テストセットの平均損失は0.0917であり、損失値がわずかに高い。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:26:07 GMT)
GCN-DevLSTM: Path Development for Skeleton-Based Action Recognition [10.6] ビデオにおける骨格に基づく行動認識は、コンピュータビジョンにおいて重要であるが難しい課題である。
本稿では,リー群構造を利用した逐次データ表現法を提案する。
提案するGCN-DevLSTMネットワークは,強いGCNベースラインモデルの改良を一貫して行い,SARタスクの堅牢性に優れたSOTA結果が得られる。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:21:58 GMT)
SymTax: Symbiotic Relationship and Taxonomy Fusion for Effective Citation Recommendation [10.2] 既存の技術は主に引用を推奨するローカルコンテキストに焦点を当てているが、実際の人間の引用行動を考慮できない。
ローカルとグローバルの両方のコンテキストを考慮した3段階のレコメンデーションアーキテクチャであるSymTaxを提案する。
我々は827万の引用コンテキストを含む新規で大規模なArSyTaを構築し、作成プロセスの詳細を説明する。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:51:58 GMT)
Experimental Refrence-Frame-Independent Quantum Key Distribution over 250 km of Optical Fiber [9.8] 我々は、150MHzの繰り返し速度でRFI-QKDシステムを開発することにより、250kmの光ファイバー距離にセキュアな鍵ビットを分散する。
我々は200kmの距離で49.65bit/sの有限鍵秘密鍵レートを達成し、これは最先端システムより3倍以上高い。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:08:49 GMT)
A Systematic Review of Federated Generative Models [9.7] Federated Learning(FL)は、クライアントがデータ上でモデルをトレーニングし、ローカルデータの代わりにモデルを共有することができる分散システムのソリューションとして登場した。
Generative Modelsは、データセットの分布を学習し、元のデータに似た新しいデータサンプルを生成するように設計されている。
FLおよび生成モデル手法とプライバシを考慮した100近い論文を体系的に比較した。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:20:44 GMT)
From Macro to Micro: Boosting micro-expression recognition via pre-training on macro-expression videos [9.5] マイクロ圧縮認識(MER)は、インテリジェント医療や嘘検出に応用される可能性があるため、近年注目を集めている。
我々は、textbfMAcro-expression textbfTO textbfMIcro-expression (MA2MI) と呼ばれる一般化トランスファー学習パラダイムを提案する。
我々のパラダイムでは、ネットワークは将来のフレームを再構築することで、微妙な顔の動きを表現する能力を学ぶことができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:42:06 GMT)
Assessing Empathy in Large Language Models with Real-World Physician-Patient Interactions [9.3] 医療領域へのLarge Language Models(LLMs)の統合は、患者のケアとサポートを大幅に強化する可能性がある。
本研究は、ChatGPTが医師が通常提供するものよりも共感の度合いが高いかどうかを調査する。
マヨクリニックから患者メッセージと医師の回答の非特定データセットを収集し,ChatGPTを用いて代替応答を生成する。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:58:57 GMT)
Reality Only Happens Once: Single-Path Generalization Bounds for Transformers [9.3] 我々は、この設定における非漸近的な統計的保証を、将来的な$t$における変圧器ネットワークのテキスト一般化のバウンダリによって導き出す。
私たちの境界は3つの要素から構成される: (I) 第一に、データ生成マルコフ過程の定常分布と、その時間で$t$の分布とのギャップを定量化する。
次の項は変換器モデルの複雑さを符号化し、十分な時間があれば、最終的には$O(log(N)r/sqrtN)$で$0$に収束する。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:19:32 GMT)
Combining Constrained Diffusion Models and Numerical Solvers for Efficient and Robust Non-Convex Trajectory Optimization [9.3] 本稿では,拡散モデルと数値最適化解法を組み合わせた一般フレームワークを提案する。
局所最適解の真の分布を近似する新しい制約付き拡散モデルを開発する。
実験は、改善された制約満足度と計算効率を4$times$から30$times$Accelerationで検証する。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:52:21 GMT)
Vim4Path: Self-Supervised Vision Mamba for Histopathology Images [9.3] 本稿では、状態空間モデルにインスパイアされたVision Mamba(Vim)アーキテクチャを、DINOフレームワークの計算病理学における表現学習に活用することを提案する。
我々は、パッチレベルとスライドレベルの両方の分類において、Camelyon16データセット上でのVim対ビジョントランスフォーマー(ViT)の性能を評価する。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:09:29 GMT)
Map-based Modular Approach for Zero-shot Embodied Question Answering [9.2] EQA(Embodied Question Answering)は、未確認の環境をナビゲートするオブジェクトを識別する能力を測定するためのベンチマークタスクとして提案されている。
本研究では,フロンティアをベースとした地図作成により,実際のロボットが未知の環境をナビゲートできるモジュール型EQA手法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:10:59 GMT)
Using a Convolutional Neural Network and Explainable AI to Diagnose Dementia Based on MRI Scans [9.0] 畳み込みニューラルネットワークは、6400のMRIスキャンを4つの認知症クラスに分割したオープンソースのデータベースを使用して開発、訓練されている。
モデルの精度は98%に達し、適合性が高く、新しいデータに一般化できることが示されている。
説明可能なAIアルゴリズムは、各畳み込み層における個々のフィルタの出力を可視化することにより開発された。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:06:25 GMT)
Exploring Nutritional Impact on Alzheimer's Mortality: An Explainable AI Approach [9.0] 本稿では、機械学習(ML)と説明可能な人工知能(XAI)技術を用いて、アルツハイマー病(AD)に伴う栄養状態と死亡率との関係について検討する。
その結果,血清ビタミンB12および糖化ヘモグロビンなどの栄養因子が明らかとなった。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:18:47 GMT)
Reinforcement Learning for Jump-Diffusions [8.7] 本研究では,ジャンプ拡散過程によって制御される系の力学に対する連続時間強化学習について検討する。
本研究では,ジャンプの存在が一般の俳優や批評家のパラメータ化に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:33:11 GMT)
Mamba4KT:An Efficient and Effective Mamba-based Knowledge Tracing Model [8.4] 知識追跡は、過去のパフォーマンスを活用して将来のパフォーマンスを予測することによって、学生の学習を促進する。
スマート教育のシナリオにおけるデータ量の増大により、知識追跡モデルの時間と空間消費の観点からも、これは課題となる。
Mamba4KTは知識追跡の効率化と資源利用を初めて検討した。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:26:03 GMT)
The global landscape of academic guidelines for generative AI and Large Language Models [8.4] ジェネレーティブ・人工知能(GAI)とLarge Language Models(LLM)の学界への統合は、その潜在的な教育的利益と倫理的考察に関する世界的な議論を刺激している。
ポジティブな反応は、コラボレーティブな創造性、教育へのアクセスの増加、トレーナーとトレーナーの強化など、いくつかの可能性を強調している。
しかし、ネガティブな反応は、倫理的な複雑さ、イノベーションと学術的整合性のバランス、不平等なアクセス、誤情報リスクに関する懸念を引き起こす。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:28:24 GMT)
Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models [8.4] 本稿では,MedMLLMの未発見の脆弱性について述べる。
既存の医療データと非典型的な自然現象を組み合わせることで、2種類の攻撃を再定義する。
このデータセットと新たな攻撃方法による評価は、セキュリティ機能を強化したMedMLLMでさえ、セキュリティ違反に対して脆弱であることを示している。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:11:21 GMT)
Detail-Enhanced Intra- and Inter-modal Interaction for Audio-Visual Emotion Recognition [8.3] オーディオ・ビジュアル・感情認識(AVER)のための細部強化型イントラモーダル・インターモーダル・インタラクション・ネットワーク(DE-III)を提案する。
我々は,顔の状態変化をよりよく捉えたテクスチャで映像表現を豊かにするために,光学フロー情報を導入する。
融合モジュールは、光学フロー推定を対応するビデオフレームと統合し、顔のテクスチャ変化の表現を強化する。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:31:59 GMT)
Structure-aware Semantic Node Identifiers for Learning on Graphs [8.2] 本稿では,構造認識型セマンティックノード識別子(ID)を離散符号の短いシーケンスで生成する新しいグラフトークン化フレームワークを提案する。
我々は,グラフニューラルネットワーク(GNN)の複数層から連続ノード埋め込みをコンパクトかつ有意義なコードに圧縮するために,ベクトル量子化を用いる。
その結果、ノードIDはグラフデータの高レベルな抽象化を捕捉し、GNNの効率性と解釈可能性を高める。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:22:38 GMT)
Glocal Hypergradient Estimation with Koopman Operator [8.1] 本稿では,「グローバル」品質と「ローカル」効率をブレンドした*glocal*ハイパーグラディエント推定法を提案する。
この目的のために、我々はKoopman演算子理論を用いて超勾配の力学を線形化し、大域超勾配を局所超勾配の軌跡を用いてのみ効率的に近似することができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:15:38 GMT)
Avoiding Catastrophe in Continuous Spaces by Asking for Help [7.9] 公式な後悔の保証のある強化学習アルゴリズムのほとんどは、すべてのミスは可逆的であり、基本的にはあらゆる可能な振る舞いを試すことに依存していると仮定する。
本稿では,大惨事の可能性を最小化することが目的である文脈的盗賊問題の変種を提案する。
本稿では,メンタの動作が1次元状態空間で一定回数変化した場合に,同じ後悔とクエリを保証するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:55:07 GMT)
Synthesizing Programmatic Reinforcement Learning Policies with Large Language Model Guided Search [7.8] LLM誘導検索フレームワーク(LLM-GS)について紹介する。
我々の重要な洞察は、LLMのプログラミングの専門知識と常識推論を活用して、仮定不要でランダムな探索手法の効率を高めることである。
本研究では,プログラム検索空間を効率的に探索し,一貫したプログラム改善を実現するための探索アルゴリズムであるSchduled Hill Climbingを開発した。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:33:48 GMT)
AnyCBMs: How to Turn Any Black Box into a Concept Bottleneck Model [7.7] 概念ボトルネックモデルは、人間の理解可能な概念の層を統合することにより、ニューラルネットワークの解釈可能性を高める。
AnyCBM"は、既存のトレーニングされたモデルを、計算リソースに最小限の影響を伴って、Concept Bottleneck Modelに変換する。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:19:04 GMT)
GPU Based Differential Evolution: New Insights and Comparative Study [7.6] この研究は、GPUベースの微分進化アルゴリズムの文献における主要なアーキテクチャ選択についてレビューする。
新しいGPUベースの数値最適化ベンチマークを導入し、GPUベースのDEMアルゴリズムを評価し比較する。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:40:39 GMT)
Competing for pixels: a self-play algorithm for weakly-supervised segmentation [7.4] 本稿では,領域のイメージセグメンテーションをゲーミフィケーションする新しいWSS手法を提案する。
エージェントは、これらのパッチが枯渇するまでROIを含むパッチを選択します。
この競争的な設定により、過剰または過小区分の最小化が保証される。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:00:17 GMT)
Causal Concept Embedding Models: Beyond Causal Opacity in Deep Learning [7.3] 因果不透明性(英: Causal opacity)とは、ディープニューラルネットワーク(DNN)推論の根底にある「隠れた」因果構造を理解することの難しさを指す。
因果概念埋め込みモデル(Causal Concept Embedding Models, Causal CEMs)は、意思決定プロセスが設計によって因果的に透明である解釈可能なモデルのクラスである。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:15:20 GMT)
Dominant Shuffle: A Simple Yet Powerful Data Augmentation for Time-series Prediction [6.9] 既存の周波数領域拡張は、様々なフルスペクトルノイズで元のデータを妨害する。
我々は、時系列予測のための単純で効果的なデータ拡張である支配的なシャッフルを提案する。
私たちのメソッドは非常にシンプルで強力で、ほんの数行のコードで実装できます。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:00:12 GMT)
DeTox: Toxic Subspace Projection for Model Editing [6.8] 我々は,無調律アライメント(DeTox)を導入し,毒性低減のユースケースで有効性を示す。
DeToxは、モデルパラメータ空間内の有毒な部分空間を識別し、検出された部分空間を投影することでモデル毒性を低減する、サンプル効率のよいモデル編集アプローチである。
DeTox は DPO よりもサンプリング効率が高く,さらにノイズの多いデータに対するロバスト性を示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:46:22 GMT)
GPFL: A Gradient Projection-Based Client Selection Framework for Efficient Federated Learning [6.7] フェデレートラーニングクライアントの選択は、参加者のクライアントを決定するために重要です。
本稿では,局所的およびグローバルな降下方向を比較することで,クライアントの値を測定するGPFLを提案する。
GPFLは、フェデレート学習における事前選択とパラメータ再利用により、より短い計算時間を示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:34:29 GMT)
Cost Function Unrolling in Unsupervised Optical Flow [6.7] この研究は、教師なしコスト関数でよく使われるトータル変分半ノルムの導出に焦点を当てている。
我々は、コストアンロールと呼ばれる新しい反復スキームにおいて、ハードL1スムーズネス制約に対する微分可能なプロキシを導出する。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:49:27 GMT)
Scalable Numerical Embeddings for Multivariate Time Series: Enhancing Healthcare Data Representation Learning [6.6] 独立トークンとして各特徴値を扱う新しいフレームワークであるSCANEを提案する。
SCANEは、異なる機能埋め込みの特性を正規化し、スケーラブルな埋め込みメカニズムを通じて表現学習を強化する。
本研究は,MTSの精度の高い予測出力を実現するために,nUMerical eMbeddIng Transformer (SUMMIT) を開発した。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:06:45 GMT)
An Enhanced Encoder-Decoder Network Architecture for Reducing Information Loss in Image Semantic Segmentation [6.6] 残差接続により拡張された革新的なエンコーダ・デコーダネットワーク構造を導入する。
提案手法では,様々な画像スケールにまたがる複雑な情報保存を効果的に行うために,マルチレジデント接続戦略を採用している。
ネットワークトレーニングの収束率を高め,サンプルの不均衡問題を緩和するために,改良されたクロスエントロピー損失関数を考案した。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:15:53 GMT)
Partial train and isolate, mitigate backdoor attack [6.6] 疑わしいサンプルを分離可能なモデルをトレーニングするために,モデルの一部を凍結する新しいモデルトレーニング方法(PT)を提案する。
そして、これに基づいてクリーンモデルが微調整され、バックドア攻撃に抵抗する。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:54:43 GMT)
ReCODE: Modeling Repeat Consumption with Neural ODE [6.5] 実世界のレコメンデーションシステムでは、リピート消費はユーザーが好みの曲やアーティストの小さなセットを何度も繰り返し聞く一般的な現象である。
本稿では、ニューラルODEを用いて繰り返し消費をモデル化する新しいモデルに依存しないフレームワークであるReCODEを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:40:23 GMT)
MinRank Gabidulin encryption scheme on matrix codes [6.5] 行列符号とMinRank問題に対するMcElieceスキームとNiederreiterフレームの一般化を提案する。
我々の新しいアプローチは、古典的なMcEliece方式よりも、暗号文と公開鍵とのトレードオフを良くすることを可能にする。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:04:01 GMT)
Reconstructing the Image Stitching Pipeline: Integrating Fusion and Rectangling into a Unified Inpainting Model [6.4] 深層学習に基づく画像縫合パイプラインは、登録、融合、整形という3つのカスケードステージに分けられる。
本稿では, 簡易・ロバスト・スティッカー (SRStitcher) を提案する。
SRStitcherは、性能と安定性の両方において最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 13:37:13 GMT)
Pick up the PACE: A Parameter-Free Optimizer for Lifelong Reinforcement Learning [6.4] 生涯学習における重要な課題は、それまでの進歩が新しいタスクへのエージェント適応を妨げる、可塑性の喪失である。
PACEと呼ばれる,事前知識を必要としない生涯学習のためのパラメータフリーを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:38:44 GMT)
Flow Snapshot Neurons in Action: Deep Neural Networks Generalize to Biological Motion Perception [6.4] 生物学的運動知覚(BMP)とは、人間の行動パターンからのみ生物の行動を認識し、認識する能力である。
現在のAIモデルは、一般化性能の低さに苦慮している。
本稿では,ビデオクリップからのパッチレベルの光フローを入力として利用するMotion Perceiver (MP)を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 09:11:46 GMT)
How many samples are needed to train a deep neural network? [6.0] 本稿では,ReLUフィードフォワードニューラルネットワークのトレーニングに必要なデータ量について検討する。
私たちの結果は、ニューラルネットワークが"多くの"トレーニングサンプルを必要とするという一般的な信念を裏付けています。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:07:21 GMT)
Federated Learning: A Cutting-Edge Survey of the Latest Advancements and Applications [6.0] Federated Learning(FL)は、堅牢な機械学習(ML)モデルを開発するためのテクニックである。
ユーザのプライバシを保護するため、FLでは、大量の生データや潜在的機密データを送信するのではなく、モデル更新を送信する必要がある。
このサーベイは、最新のFLアルゴリズムの包括的な分析と比較を提供する。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:37:36 GMT)
Neural Feature Learning in Function Space [5.8] 本稿では,ニューラル特徴抽出器を用いたシステム設計学習フレームワークを提案する。
内部積を備えた関数空間における統計的依存と特徴表現を統一する特徴幾何学を導入する。
データサンプルから最適な特徴を学習するための体系的なアルゴリズム設計を提供するネスト手法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:53:25 GMT)
LoQT: Low Rank Adapters for Quantized Training [5.8] LoQTは、量子化されたモデルを効率的に訓練する手法である。
LoQTは、コンシューマグレードの24GB GPU上で、7Bパラメータまでのモデルの効率的なトレーニングを可能にする。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:29:57 GMT)
Low-resourced Languages and Online Knowledge Repositories: A Need-Finding Study [5.7] 本研究は、人気のあるOKRウィキペディアにおいて、低リソース言語コントリビュータが直面している課題について検討する。
私たちはエチオピアの3つの言語(Afan Oromo、Amharic、Tigrinya)に焦点を当てています。
当社の研究は、低リソースの言語話者にオンライン知識リポジトリをアクセスできるようにする上で、デザイナを支援することを願っています。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:20:26 GMT)
The Reversal Curse: LLMs trained on "A is B" fail to learn "B is A" [5.6] 自己回帰型大言語モデル(LLM)における一般化の驚くべき失敗を示す。
例えば、もしモデルが"Valentina Tereshkovaが最初に宇宙に旅行した女性"で訓練されたとしても、"誰が最初に宇宙に旅行した女性なのか?"という疑問に自動的に答えることはできません。
GPT-3とLlama-1を架空の文で微調整することで、逆曲線の証拠を提供する。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:45:21 GMT)
Past, Present, and Future of Citation Practices in HCI [5.5] 本稿は、2016年のACM CHI Conferenceで紹介された編集方針が、CHIコミュニティを拡大する道のりでどのように開始したかを示す。
もしこのほぼ直線的な傾向が相変わらず続くなら、CHI 2030の記事には平均130の参照が含まれている。
我々のメタリサーチは、資源のデジタルアクセシビリティや学術的圧力などの影響を受けながら、HCIにおける引用実践の性質と意味がどう変化したかについての洞察を提供する。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:22:47 GMT)
Towards Multi-Task Multi-Modal Models: A Video Generative Perspective [5.5] この論文は、さまざまな条件下でビデオやその他のモダリティを生成するマルチタスクモデルを構築するために、我々の努力を年代記している。
我々は、視覚的観察と解釈可能な語彙の双方向マッピングのための新しいアプローチを公表する。
私たちのスケーラブルなビジュアルトークン表現は、生成、圧縮、理解タスクで有益であることが証明されます。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:56:45 GMT)
Planning Robot Placement for Object Grasping [5.3] 物体の摘み取りなどの操作に基づく活動を行う場合、移動ロボットは、実行を成功させる位置で基地を位置決めする必要がある。
この問題に対処するために、顕著なアプローチは、通常、対象のオブジェクトに対する把握ポーズを提供するために、プランナーを高価に把握することに依存する。
そこで我々は,まず環境との衝突を起こさないロボット配置を見つけ,次に最適な配置候補を見出すよう評価する。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:57:32 GMT)
DarijaBanking: A New Resource for Overcoming Language Barriers in Banking Intent Detection for Moroccan Arabic Speakers [5.3] 言語多様性の複雑さをナビゲートすることは、堅牢な自然言語処理システムの開発における中心的な課題である。
本稿では,銀行分野における意図分類の強化を目的とした新しいDarijaデータセットであるtextbfDarijaBankingを紹介する。
DarijaBankingは、Darija、Modern Standard Arabic (MSA)、英語、フランス語で1,800以上の並列な高品質なクエリで構成されており、24のインテントクラスで構成されている。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:33:28 GMT)
IPA: Inference Pipeline Adaptation to Achieve High Accuracy and Cost-Efficiency [5.2] 推論パイプライン適応システムは、ディープラーニングタスク毎のモデル変種を効率的に活用する。
IPAはバッチサイズ、レプリケーション、モデルの変種を動的に設定し、精度を最適化し、コストを最小化し、ユーザ定義の遅延レベル合意を満たす。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:03:03 GMT)
Fast Asymmetric Factorization for Large Scale Multiple Kernel Clustering [5.2] マルチカーネルクラスタリング(MKC)は、クラスタリングのための複数のベースカーネルからの情報の融合を可能にするソリューションとして登場した。
本稿では,局所回帰にインスパイアされた新しいスパースカーネル行列を構築し,メモリ効率を実現するための効率的な多重カーネル概念因子化(EMKCF)を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:29:12 GMT)
A First Look at Kolmogorov-Arnold Networks in Surrogate-assisted Evolutionary Algorithms [5.2] サロゲート支援進化アルゴリズム(SAEA)は高価な問題を解決するための重要な手法である。
本稿では,SAEA内の代理モデルとしてKAN(Kolmogorov-Arnold Networks)を紹介する。
KansはSAEA内での賞賛可能なパフォーマンスを示し、関数呼び出しの数を効果的に減らし、最適化効率を向上する。
論文参考訳(メタデータ) (Sun, 26 May 2024 09:12:44 GMT)
Unveiling the Secrets: How Masking Strategies Shape Time Series Imputation [5.2] 我々は,異なるマスキング戦略が時系列計算モデルに与える影響を評価する。
その結果,ロバストモデル評価には,より高度でデータ駆動型マスキング設計が不可欠であることが示唆された。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:05:12 GMT)
Private Edge Density Estimation for Random Graphs: Optimal, Efficient and Robust [5.0] 本稿では,ErdHos-R'enyiランダムグラフのエッジ密度を推定するアルゴリズムについて述べる。
我々は,アルゴリズムの誤り率を対数的因子まで最適とする情報理論的下界を証明した。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:59:44 GMT)
FAdam: Adam is a natural gradient optimizer using diagonal empirical Fisher information [5.0] 我々はアダムの対角的経験的フィッシャー情報行列(FIM)を厳密に分析した。
我々の分析は、元のAdamアルゴリズムの欠陥を明らかにし、提案された修正に繋がる。
修正アルゴリズムであるFisher Adam (FAdam) は、様々な領域で優れた性能を示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:59:04 GMT)
Building Better AI Agents: A Provocation on the Utilisation of Persona in LLM-based Conversational Agents [4.9] 本稿では,ユニークなペルソナを付与するCAの理屈と意味を考察することから始める。
ペルソナの実装が単に有益であるだけでなく、LCMベースのCAにとって重要なアプリケーションについても検討する。
この論文は、ペルソナ統合に対するニュアンスなアプローチの必要性を強調し、起こりうる潜在的な課題と倫理的ジレンマを強調している。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:36:48 GMT)
Accurate and Nuanced Open-QA Evaluation Through Textual Entailment [4.8] 本稿では,より情報的かつ汎用的な解答を識別するために,解答の包含関係について検討する。
提案するエンテーメントに基づく評価では,回答間の推論ギャップを定量化することにより,ボーナスや部分マークの割り当てが可能である。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:33:27 GMT)
EchoSpike Predictive Plasticity: An Online Local Learning Rule for Spiking Neural Networks [4.6] スパイキングニューラルネットワーク(SNN)は、低電力とメモリを必要とするアプリケーションにおいて、その可能性のために魅力的である。
EchoSpike Predictive Plasticity(ESPP)学習ルールは,オンライン学習ルールのパイオニアである。
ESPPは、エッジでのニューロモルフィックコンピューティングのための生物学的に妥当な自己教師付き学習モデルの開発において、大きな進歩を示している。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:20:51 GMT)
Convergence Conditions of Online Regularized Statistical Learning in Reproducing Kernel Hilbert Space With Non-Stationary Data [4.6] 本研究では,HilbertHSカーネルにおける正規化学習アルゴリズムの収束性について検討した。
独立および非独立に分散したデータストリームに対して、入力データによって引き起こされる限界確率測度が徐々に変化している場合、アルゴリズムは平均二乗整合を達成する。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:09:37 GMT)
Geometry of Critical Sets and Existence of Saddle Branches for Two-layer Neural Networks [4.4] 本稿では,2層ニューラルネットワークにおける臨界点集合の包括的解析を行う。
臨界点が与えられた場合、これらの演算子を使用して、同じ出力関数を表す下層の臨界集合全体を明らかにする。
出力関数がより狭いネットワークで表現できる臨界集合に対して、サドル分岐が存在することを証明する。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:32:28 GMT)
Efficient Probabilistic Modeling of Crystallization at Mesoscopic Scale [4.3] メソスコピックスケールでの結晶化プロセスは、特に材料科学と冶金学に興味がある。
本稿では,メソスコピックスケールでの効率的な結晶成長の確率モデルであるCrystal Growth Neural Emulator (CGNE)を紹介する。
CGNEは、最近の動的システムの最先端確率モデルと比較して、推論時間と性能の向上率を11倍に向上させる。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:37:19 GMT)
STG-MTL: Scalable Task Grouping for Multi-Task Learning Using Data Map [4.3] MTL(Multi-Task Learning)は、従来のSTL(Single-Task Learning)よりも性能が向上し、普及した強力な技術である。
しかし、MTLは指数的なタスクグルーピング数が多いため、しばしば困難である。
本稿では,これらの課題に対処し,課題分類のためのスケーラブルでモジュール化されたソリューションを提供する新しいデータ駆動手法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:52:02 GMT)
Dipolar bosons in a twisted bilayer geometry [4.2] ツイスト2層構造における双極子ボソン間の相互作用について検討する。
ツイスト角 $theta=0.1circ$ では、観測された量子相はツイスト角のないものと一致している。
ツイスト角が$theta=circ$にわずかに増加すると、これらの対の位相が破壊され、固体と超流動領域の相分離が望まれる。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:31:00 GMT)
Multi-State TD Target for Model-Free Reinforcement Learning [4.0] 時間差(TD)学習は、状態または状態-作用ペアの値推定を更新する強化学習の基本的な技術である。
本稿では、その後の複数の状態の推定値を利用する拡張多状態TD(MSTD)ターゲットを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:17:49 GMT)
Development of a Virtual Reality Application for Oculomotor Examination Education Based on Student-Centered Pedagogy [3.9] このワーク・イン・プログレスの論文は、バーチャルリアリティ(VR)による臨床眼科検査の指導に学生中心の教育の利用について論じている。
PowerPointのスライドや実験室の活動のような従来の手法は、医療機器のコストが高いため、ハンズオン体験を提供するには不十分であることが多い。
VRベースのアプリケーションはUnityとHTC Vive Proヘッドセットを使って開発され、実用的な学習のための費用対効果の高いソリューションを提供する。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:53:19 GMT)
Acceleration of Grokking in Learning Arithmetic Operations via Kolmogorov-Arnold Representation [3.8] 本稿では,変圧器モデルによる算術二項演算の学習において発生するグルーキング現象に着目した。
グラッキングを高速化する様々な伝達学習機構を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:29:24 GMT)
Boosting long-term forecasting performance for continuous-time dynamic graph networks via data augmentation [3.8] 本研究では、連続時間動的グラフネットワーク(CTDGN)における長期予測(LTF)に焦点を当てる。
我々は,CTDGNの中間層への埋め込みに不確実性を導入するために不確実性評価を行うプラグイン・アンド・プレイモジュールであるtextbfunderlineUncertainty underlineMixunderlineUp (UmmU)を提案する。
実世界の3つの動的グラフデータセットに関する包括的実験を行い、UmmUが長期予測を効果的に改善できることを実証した。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:47:29 GMT)
CapS-Adapter: Caption-based MultiModal Adapter in Zero-Shot Classification [3.6] CapS-Adapterは、イメージとキャプションの両方の機能を活用して、トレーニング不要シナリオにおける既存の最先端技術を超える革新的な方法である。
提案手法は,19個のベンチマークデータセットのゼロショット分類結果に優れており,従来の先行手法よりも2.19%精度が向上している。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:50:40 GMT)
Probabilistic Contrastive Learning with Explicit Concentration on the Hypersphere [3.6] 本稿では,球面空間に表現を埋め込むことにより,不確実性を比較学習に取り入れる新たな視点を提案する。
我々は、濃度パラメータであるカッパを直接解釈可能な尺度として利用し、不確実性を明示的に定量化する。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:08:13 GMT)
Injective Sliced-Wasserstein embedding for weighted sets and point clouds [3.4] 多重集合と$mathbb$ aRddを$ Euclid$空間分布に埋め込む新しい方法を提案する。
また、$textit$ で$mathd を $mathbb$ にバイリプシッツ方式で埋め込むことも証明しています。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:04:41 GMT)
Improving Health Professionals' Onboarding with AI and XAI for Trustworthy Human-AI Collaborative Decision Making [3.2] 医療・健康を専攻する健康専門家や学生との半構造化面接の結果を報告する。
そこで我々は,脳卒中リハビリテーション評価のためのAIシステムの教材を作成するために,人間とAIのインタラクションガイドラインを構築した。
この結果から,従来のパフォーマンス指標をAIに提示する以外に,参加者はベンチマーク情報を希望していることが判明した。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:30:17 GMT)
Exploring a Multimodal Fusion-based Deep Learning Network for Detecting Facial Palsy [3.2] 本稿では,非構造化データと構造化データを用いて顔の麻痺を検知する多モード融合に基づくディープラーニングモデルを提案する。
我々のモデルはリコールスコアの減少を犠牲にして精度を77.05にわずかに改善した。
論文参考訳(メタデータ) (Sun, 26 May 2024 09:16:34 GMT)
Alistair: Efficient On-device Budgeting for Differentially-Private Ad-Measurement Systems [3.0] 本稿では、既存のプライバシー保護広告計測APIを強化する取り組みについて述べる。
Google、Apple、Meta、Mozillaのデザインを分析し、より厳格で効率的な差分プライバシー(DP)予算コンポーネントでそれらを強化します。
当社のアプローチはAlistairと呼ばれ、明確に定義されたDP保証を強制し、広告主がより正確なプライベートな測定クエリを実行できるようにする。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:27:27 GMT)
Image Deraining with Frequency-Enhanced State Space Model [2.9] 本研究では,降雨除去のための状態空間モデル(SSM)を導入し,DFSSM(Deraining Frequency-Enhanced State Space Model)を提案する。
特定の方向に高強度の周波数成分を発生させる雨害を効果的に除去するために,SSMと並列に周波数領域処理を用いる。
我々は,複数のカーネルサイズを持つ畳み込みを用いて,様々なスケールの劣化を効果的に捕捉する,新しい混合スケールゲート畳み込みブロックを開発した。
論文参考訳(メタデータ) (Sun, 26 May 2024 07:45:12 GMT)
Rethinking Transfer Learning for Medical Image Classification [2.9] 事前訓練された深層モデルからの伝達学習(TL)は、現代の医用画像分類(MIC)における標準的実践である
本稿では,TruncatedTLという,適切なボトム層を再利用・微調整し,残りの層を直接破棄する,新たな戦略をこのファミリーに追加する。
これにより、他の微分TL法と比較して、優れたMIC性能だけでなく、効率的な推論のためのコンパクトモデルが得られる。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:45:01 GMT)
Lost in the Shuffle: Testing Power in the Presence of Errorful Network Vertex Labels [2.8] 2サンプルネットワーク仮説テストは、医学、神経科学、社会学といった様々な分野に適用するための重要な推論タスクである。
これらのテスト手法の多くは、ネットワーク間の通信が既知であるという暗黙の仮定の下で機能する。
このシャッフルによる電力損失は、ランダムドット積とブロックモデルネットワークの文脈で理論的に検討されている。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:19:47 GMT)
Improving Demand Forecasting in Open Systems with Cartogram-Enhanced Deep Learning [2.7] 本研究では,カルトグラム手法を用いてレンタル・リターンパターンを予測するためのディープラーニングフレームワークを提案する。
本手法を韓国ソウル市における自転車レンタル・アンド・リターンデータに適用する。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:58:09 GMT)
On Convergence of the Alternating Directions SGHMC Algorithm [2.6] 目標分布(SGHMC)における勾配オラクルの緩やかな条件下での跳躍フロッグ積分を用いたハミルトンモンテカルロアルゴリズムの収束速度について検討する。
提案手法は, 汎用的な補助分布を用いることにより, 標準HMCを拡張し, 代替方向の新たな手順により実現した。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:40:30 GMT)
Disentangling and Integrating Relational and Sensory Information in Transformer Architectures [2.5] Transformerアーキテクチャは、ニューラルメッセージパス方式を実装してシーケンスを処理する。
この一般的な計算パラダイムでは、2種類の情報が不可欠である。
標準の注意は前者を自然にエンコードするが、後者を明示的にエンコードしない。
論文参考訳(メタデータ) (Sun, 26 May 2024 23:52:51 GMT)
The devil is in discretization discrepancy. Robustifying Differentiable NAS with Single-Stage Searching Protocol [2.4] 勾配に基づく手法は離散化誤差に悩まされ、最終的なアーキテクチャを得る過程を著しく損なう可能性がある。
本稿では,連続的なアーキテクチャの復号化に依存しない新しい単一ステージ探索プロトコルを提案する。
本手法は,Cityscapes検証データセットの検索段階において75.3%の精度で他のDNAS法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:44:53 GMT)
Calculation of Femur Caput Collum Diaphyseal angle for X-Rays images using Semantic Segmentation [2.4] 本稿では,X線画像から大腿骨頭・結腸・下垂角を推定するための深層学習手法について検討する。
本稿では,X線画像から大腿骨CCD角を確実に推定できるディープラーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:00:11 GMT)
Training-Conditional Coverage Bounds under Covariate Shift [2.3] コンフォメーション予測手法の訓練条件カバレッジ特性について検討した。
分割共形法の結果はほぼ仮定なしであるが、完全共形法とJackknife+法の結果は強い仮定に依存する。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:07:16 GMT)
Self-supervised Learning of Dense Hierarchical Representations for Medical Image Segmentation [2.2] 本稿では,高密度下流タスクに適したボクセルワイド粗い表現を学習するための自己教師型フレームワークについて述べる。
我々は、複数のスケールから機能のコントリビューションのバランスをとるためのトレーニング戦略を考案し、学習された表現が粗い詳細ときめ細かい詳細の両方を捉えることを保証する。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:17:57 GMT)
FLTrojan: Privacy Leakage Attacks against Federated Language Models Through Selective Weight Tampering [2.2] 悪意のあるクライアントが、サーバからの協力なしに、FL内の他のユーザのプライバシーに敏感なデータを漏洩させる方法を示す。
提案手法は, 最大71%の個人データ再構成を達成し, 会員推算率を29%向上させる。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:44:52 GMT)
Machine Learning Clifford invariants of ADE Coxeter elements [2.0] A_8$,$D_8$,$E_8$のすべてのコクセター変換を単純根の基底の選択に対して徹底的に計算する。
この計算代数学のパラダイムはデータセットを生成し、データサイエンスの技法を用いて掘り下げることができる。
本論文はクリフォード代数を用いた実験数学におけるポンププライミングの研究である。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:33:55 GMT)
A unified law of robustness for Bregman divergence losses [2.0] 本稿では,ブレグマン分散損失が2乗損失とクロスエントロピー損失の共通一般化を形成することを示す。
我々の一般化は、ブベックとセルクの証明の中心にあるバイアス分散型分解の同定に依存する。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:30:44 GMT)
Decoding Social Sentiment in DAO: A Comparative Analysis of Blockchain Governance Communities [2.0] 本稿では、主要なDeFiプロジェクトの公開フォーラムにおける言論と感情のダイナミクスの進化を深く掘り下げる。
分散化コミュニティの参加者は、Discordの議論において、概して肯定的な感情を表現している。
議論の強度と感情のダイナミクスの間には潜在的な相互作用があり、より高い議論のボリュームは、コード分析によるより安定した感情に寄与する可能性がある。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:47:19 GMT)
Toffoli gates solve the tetrahedron equations [1.8] 特に、分解された散乱作用素は、普遍的な量子計算を提供する積分可能な量子回路をもたらす。
自然な疑問は、この構造をトフォリゲートのような高次のクビットゲートに拡張することである。
そのような作用素のユニタリ族は、ヤン・バクスター作用素の3次元一般化によって構成されることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:03:24 GMT)
Retrieval Augmented Generation using Engineering Design Knowledge [1.7] 大規模言語モデル(LLM)は、設計プロセスにおける知識ベースのアプリケーションに適した事実応答を生成するために、RAG(Retrieval-Augmented Generation)を採用する必要がある。
本稿では,その形態の明示的な事実を識別するデータ駆動手法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:07:07 GMT)
Explorations of Self-Repair in Language Models [1.6] 個人の注意を損なう際には、様々なモデルファミリーやサイズに自己修復が存在していることを示す。
本稿では, 自己修復に寄与する2つのメカニズムを強調し, 最終段階のLayerNormスケーリング因子の変化と, アンチ・エロージャを実装した神経細胞のスパースセットについて述べる。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:47:41 GMT)
3D View Optimization for Improving Image Aesthetics [1.5] 本稿では,3次元操作を応用した先駆的手法を提案する。
提案手法は, 入力画像の補間を行い, そして外挿画像から3Dシーンを再構成し, カメラパラメータと画像アスペクト比を同定し, 審美性を高めて最高の3Dビューが得られるように最適化する。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:59:22 GMT)
Regularized Projection Matrix Approximation with Applications to Community Detection [1.5] 本稿では,アフィニティ行列からクラスタ情報を復元することを目的とした正規化プロジェクション行列近似フレームワークを提案する。
本稿では,それぞれ有界,正,スパースなシナリオに対処する3つの異なるペナルティ関数を探索し,その問題を解決するために乗算器の交互方向法(ADMM)アルゴリズムを導出する。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:18:22 GMT)
State of the Art in Fair ML: From Moral Philosophy and Legislation to Fair Classifiers [1.3] 機械学習は、多くの決定が機械学習アルゴリズムによってなされるにつれて、私たちの生活に永遠に存在している部分になりつつある。
判決はしばしば不公平であり、人種や性別に基づいて保護された集団を差別する。
この研究は、差別、それに対抗する立法府、そして機械学習アルゴリズムをそのような行動から検出し、予防するための戦略について紹介することを目的としている。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:32:06 GMT)
Comments on Friedman's Method for Class Distribution Estimation [1.3] クラス分布推定の目的は、クラスラベルの観測を伴わないテストデータセットにおいて、事前クラス確率の値を決定することである。
クラス分布推定のための線形方程式系を設計するための一般的な枠組みの文脈において、フリードマンの手法の特性と、Friedman(文献ではDeBias法と呼ばれる)によって言及された別のアプローチについて論じる。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:13:51 GMT)
Gamified AI Approch for Early Detection of Dementia [1.1] 本研究は、認知評価ベースのゲームアプリケーションを通じて、健康指標データと顔画像データを用いた早期認知症検出のための頑健な畳み込みニューラルネットワーク(CNN)ベースのモデルを統合する。
ゲームレベル1のMOD-1D-CNNのトレーニング用としてラベル付けされたApollo Diagnostic Center Kolkataの健康測定データ1000と,ゲームレベル2のMOD-2D-CNNモデルのトレーニング用として,認知型または非認知型とラベル付けされた1800の顔データを含む顔画像のデータセットを収集した。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:01:30 GMT)
CNN Autoencoder Resizer: A Power-Efficient LoS/NLoS Detector in MIMO-enabled UAV Networks [1.0] 余分な消費電力を必要とせずにLoS/NLoS検出の精度を向上させるフレームワークとして,CNNオートエンコーダ・リサイザ(CAR)を提案する。
提案手法は、一貫した電力消費レベルを維持しながら、LoS/NLoS信号を検出する平均精度を66%から86%に向上させる。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:12:34 GMT)
Vision-Based Approach for Food Weight Estimation from 2D Images [0.9] この研究は、さまざまな部分、向き、容器の14種類の食品からなる2380の画像のデータセットを用いている。
提案手法は深層学習とコンピュータビジョン技術を統合し,特に食品検出にFaster R-CNN,重量推定にMobileNetV3を用いている。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:03:51 GMT)
Simulating Heavy-Hex Transverse Field Ising Model Magnetization Dynamics Using Programmable Quantum Annealers [0.8] ZNE量子誤差緩和を用いた127量子ビット重ヘックスIBM量子アーキテクチャにネイティブな接続グラフを持つ強磁性体2次元横磁場Isingモデル上でハミルトン動力学シミュレーションを行った。
本研究では,現在の超伝導量子ビット系プログラマブル量子アニールコンピュータ上での磁化を効率的にシミュレートできることを実証する。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:13:20 GMT)
Decision-focused predictions via pessimistic bilevel optimization: a computational study [0.7] 最適化パラメータの不確かさは、重要かつ長年にわたる課題である。
予測モデルを構築して,それを用いた意思決定の文言的指標を測定します。
トラクタビリティを実現するために,様々な計算手法を示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 09:36:07 GMT)
Mimicry and the Emergence of Cooperative Communication [0.7] エージェント間のコミュニケーションは、協調型マルチエージェントシステムの重要な構成要素である。
エージェントが既存の外部から発生する有用な信号を模倣する効果について検討する。
以上の結果から,進化的最適化と強化学習の両方がこの介入の恩恵を受ける可能性が示唆された。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:34:52 GMT)
Variational Quantum Framework for Partial Differential Equation Constrained Optimization [0.6] 本稿では、偏微分方程式(PDE)制約設計最適化問題に対する新しい変分量子フレームワークを提案する。
例えば空力設計では、PDEの制約は運動量、質量、エネルギー収支などの保存則であり、設計変数は車両形状パラメータと材料特性であり、車両への過渡的な熱負荷の影響を最小限に抑えるか、リフトを最大化することである。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:06:43 GMT)
Adoption and Impact of ChatGPT in Computer Science Education: A Case Study on a Database Administration Course [0.5] 本研究は,ChatGPTをデータベース管理学習支援ツールとして使用した37名の学生を対象に,探索的・相関研究を行った。
ChatGPTの使用と有効性は中等度であったが,学生の成績とChatGPT使用率との間には正の相関がみられた。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:51:28 GMT)
Modelling the Impact of Quantum Circuit Imperfections on Networks and Computer Applications [0.3] ポスト量子および量子暗号スキームは、7Gネットワークのための実現可能な量子コンピュータアプリケーションである。
これらのアルゴリズムは、Shorアルゴリズムのような量子コンピュータ上で動作する量子検索アルゴリズムの進歩によって妥協された。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:29:02 GMT)
Detection of decision-making manipulation in the pairwise comparisons method [0.3] 本稿では,ペアワイズ比較法における3つの簡単な操作法を提案する。
次に、適切に構築されたニューラルネットワークを用いてこれらの手法を検出する。
実験の結果,生成したデータに対する提案した解に付随し,かなりの操作検出レベルを示した。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:58:12 GMT)
Graph neural networks with configuration cross-attention for tensor compilers [0.2] 対象の計算グラフの高速な構成のスクリーニングを可能にするニューラルネットワークアーキテクチャであるTGraphを提案する。
我々は、我々の研究に関連するCO$排出量削減の可能性について、AI指向のデータセンターをホストする分野における家計排出量の50%以上に相当すると見積もっている。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:39:19 GMT)
Modeling the Evolutionary Trends in Corporate ESG Reporting: A Study based on Knowledge Management Model [0.1] テク業界の企業1114件のESGレポートを分析し,テキストマイニングによるESGトピックの進化傾向を分析した。
進化の過程において,低環境,中程度のガバナンス,高い社会的特徴に対する均質化効果を発見した。
その結果,ESGレポートでは,企業が産業上の卓越性や専門性にはあまり貢献していないことが示唆された。
論文参考訳(メタデータ) (Sun, 26 May 2024 03:05:06 GMT)
Lagrangian Neural Networks for Reversible Dissipative Evolution [0.0] 最も一般的には、摩擦損失のない保守的なシステムがモデル化されているため、規則化を必要とせずに、システムは前後に進むことができる。
この研究は、進行進化で発生する散逸のために逆方向が悪くなるシステムに対処する。
新規性はMorse-Feshbach Lagrangian(英語版)の使用であり、これは系の次元の数を2倍にすることで散逸力学をモデル化する。
論文参考訳(メタデータ) (Sun, 26 May 2024 21:03:09 GMT)
Zhukovsky-Volterra top and quantisation ideals [0.0] 我々は、Zhukovsky-Volterraトップの2つの異なる量子化を識別するために、量子化理想法を使用する。
最初の型は$so(3)$の普遍包絡代数に対応し、古典的極限におけるリー・ポアソン括弧に繋がる。
2番目のタイプは、4つのパラメトリックな不均一な二次ポアソン鉛筆の量子化と見なすことができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:34:02 GMT)
When does compositional structure yield compositional generalization? A kernel theory [0.0] 固定された潜在的非線形表現を持つカーネルモデルにおける合成一般化の理論を示す。
これらのモデルは、トレーニング中に見られたコンポーネントの結合/結合に割り当てられた値を追加するために機能的に制限されていることを示す。
我々は,この理論を実証的に検証し,一連の構成課題に基づいて訓練された深層ニューラルネットワークの挙動を捉えることを示した。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:50:11 GMT)
W-kernel and essential subspace for frequencist evaluation of Bayesian estimators [0.0] 行列 W とその主空間に焦点をあて、後者を本質部分空間とする。
フィッシャー核とニューラル・タンジェント核の関係が確立され、古典理論との関係が解明される。
2つの応用が議論されている: 近似ブートストラップにおける観測の代表的な集合の選択と次元還元である。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:08:31 GMT)
Tree-like process tensor contraction for automated compression of environments [0.0] アルゴリズムによる環境の自動圧縮(ACE)は、オープン量子システムのクラスをシミュレートする汎用的な方法を提供する。
ACE法の一般性は、高い数値コストで得られる。
2つの部分PT-MPOと大きな内結合を結合する問題は、予備選択法によって解決される。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:32:57 GMT)
Towards Sustainable IoT: Challenges, Solutions, and Future Directions for Device Longevity [0.0] 本研究は、IoTデバイスの早期解体に寄与する様々な難しさについて考察する。
セキュリティの脆弱性やユーザ認識のギャップ、ファッション駆動技術の動向の影響などの要因を調べることで、この論文は立法介入の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:05:01 GMT)
Toward Digitalization: A Secure Approach to Find a Missing Person Using Facial Recognition Technology [0.0] 本稿では, 顔認証技術を用いて, 行方不明者の発見という現実的な課題を, 安全かつ効果的な方法で解決した。
プロセスへの侵入者を邪魔し、行方不明者の発見者と家族の両方に重きを置くことが、この研究の主要な特徴の2つである。
論文参考訳(メタデータ) (Sun, 26 May 2024 20:25:04 GMT)
The Art of Deception: Robust Backdoor Attack using Dynamic Stacking of Triggers [0.0] 近年の研究では、聴覚バックドアが特定の変更を開始メカニズムとして用いる可能性があることが判明している。
DynamicTriggerは動的バックドアアタックを実行するための方法論として紹介されている。
動的音源トリガーによる変動信号のサンプリング率と話者の身元をマスキングすることにより、音声認識システムを欺くことができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:53:32 GMT)
Surface Code Stabilizer Measurements for Rydberg Atoms [0.0] 我々は中性原子を持つ表面符号に対する安定化器の測定について検討する。
基本誤差源の存在下で論理誤差率を最小化するゲートプロトコルを同定する。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:33:05 GMT)
Segmentation of Maya hieroglyphs through fine-tuned foundation models [0.0] マヤのヒエログリフ書の研究は、この古代文明の視覚的物語に埋め込まれた文化的・社会的知識の豊かな歴史を解き放つ。
マヤの人工物専用のオープンソースデジタルライブラリから,マヤのヒエログリフを抽出するための基礎モデルを活用している。
一般に利用可能な基本セグメンテーションモデルの当初の約束にもかかわらず、マヤのヒエログリフを正確にセグメンテーションする効果は当初は限られていた。
論文参考訳(メタデータ) (Sun, 26 May 2024 04:41:17 GMT)
Rethinking of Encoder-based Warm-start Methods in Hyperparameter Optimization [0.0] 本研究では,Liltabパッケージ内に実装されたデータセットのエンコーダに基づく新しい表現を提案する。
一般表現は,要求が抽出中に明示的に考慮されないメタタスクでは十分でないことを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:38:24 GMT)
Qubit dynamics of ergotropy and environment-induced work [0.0] マルコフ的および非マルコフ的進化の下での開系におけるエルゴトロピーのダイナミクスについて検討する。
我々は、オープンシステムシナリオにおける作業の形でエネルギー抽出のリソースとしてエルゴトロピーを使用する。
論文参考訳(メタデータ) (Sun, 26 May 2024 00:38:14 GMT)
Quasi-probabilistic Bit Erasure Causes Bell Non-locality [0.0] 2つの絡み合った量子ビット、すなわちベル非局所性に対するベル-CHSH不等式に対する最大値の不等式は、準確率過程による局所ビット消去の直接的な結果であることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:23:15 GMT)
Quantum ratchet with Lindblad rate equations [0.0] 量子ランダムウォークモデルは、2つの可能な状態の間で変動する1次元周期格子上に成立する。
速度は複数の反転を示すことができ、指向運動を達成するためには格子状態間の非ゼロ遷移速度が必要である。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:07:05 GMT)
Quantum entanglement dynamics of the three-qubit W_zeta quantum state coupled to spin chain with ternary interaction [0.0] 異方性パラメータ,ガンマ,スピン鎖に印加する外部磁場の強度,eta,三重相互作用強度,アルファの負性率の変化について検討した。
これらのパラメータがシステムの絡み合い特性にどのように影響するかを考察し、量子情報処理や量子通信プロトコルにおける影響について考察する。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:06:59 GMT)
Quantum State Diffusion on a Graph [0.0] 量子ウォークは、古典的に定義された一般に有限なグラフ構造を通る量子状態の挙動をしばしば想定している。
本稿では,任意のグラフ上の状態拡散を過小評価する数学的構造について検討する。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:06:42 GMT)
Predicting Likely-Vulnerable Code Changes: Machine Learning-based Vulnerability Protections for Android Open Source Project [0.0] 本稿では,ソースコードの変更に対するセキュリティレビューを選択的にトリガするフレームワークを提案する。
このフレームワークは、コード変更がソースコードリポジトリに送信される前に、コミット前に追加のセキュリティレビューを自動的に要求することができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:17:46 GMT)
On Sequential Loss Approximation for Continual Learning [0.0] 連続学習用オートディフ2次統合(AQC)とニューラル・コンソリデーション(NC)について紹介する。
AQCは前回の損失関数を二次関数に近似し、NCは前回の損失関数をニューラルネットワークに近似する。
本研究では,これらの手法を,正規化に基づく手法が不満足な結果をもたらすクラス増分学習において実証的に研究する。
論文参考訳(メタデータ) (Sun, 26 May 2024 09:20:47 GMT)
Machine learning in business process management: A systematic literature review [0.0] 機械学習(ML)は、明示的にプログラムすることなく、データに基づいてコンピュータプログラムを作成するアルゴリズムを提供する。
MLを使用する3つの頻繁な例は、予測による意思決定のサポート、正確なプロセスモデルの検出、リソース割り当ての改善である。
この研究は、BPMでMLがどのように使われているかについて、初めての徹底的なレビューである。
論文参考訳(メタデータ) (Sun, 26 May 2024 01:12:24 GMT)
Machine Learning and Data Analysis Using Posets: A Survey [0.0] ポセットは、データ分析と機械学習の幅広い応用において、ユビキタスな離散数学的構造である。
データサイエンス領域にポーズを接続する研究は、長年にわたって続けられてきた。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:16:11 GMT)
LaVy: Vietnamese Multimodal Large Language Model [0.0] LLM(Large Language Models)とMLLM(Multimodal Large Language Models)は、複雑な推論と言語理解において印象的な能力を持つ嵐によって世界を席巻している。
ベトナムの大規模言語モデルに関連する作品が多数あり、マルチモーダリティにおける高品質な資源の欠如はベトナムのMLLMの進歩を妨げている。
本稿では,現在最先端のベトナム語MLLMであるLaVyを導入することでこの問題に対処し,また,MLLMのベトナム語視覚言語タスクに対する理解を評価するためのLaVy-Benchベンチマークも導入する。
論文参考訳(メタデータ) (Sun, 26 May 2024 10:27:51 GMT)
KiNETGAN: Enabling Distributed Network Intrusion Detection through Knowledge-Infused Synthetic Data Generation [0.0] 合成ネットワーク活動データ(KiNETGAN)を生成するための知識注入型ジェネレーティブ・アドバイサル・ネットワークを提案する。
弊社のアプローチは、プライバシー問題に対処しながら、分散侵入検知のレジリエンスを高める。
論文参考訳(メタデータ) (Sun, 26 May 2024 08:02:02 GMT)
Integrating GNN and Neural ODEs for Estimating Two-Body Interactions in Mixed-Species Collective Motion [0.0] 本稿では,観測軌道から基礎となる運動方程式を推定するための新しいディープラーニングフレームワークを提案する。
本フレームワークは,グラフニューラルネットワークとニューラルディファレンシャル方程式を統合し,二体相互作用の効果的な予測を可能にする。
論文参考訳(メタデータ) (Sun, 26 May 2024 09:47:17 GMT)
Experimental demonstration of 4-state reference-frame-independent quantum key distribution over 200km [0.0] 参照フレーム独立量子鍵分布(RFI-QKD)は、実用的な用途に特有の利点があるため、広く注目を集めている。
標準のBB84プロトコルと比較して、元の6状態のRFIプロトコルはアリスとボブによって操作されるより多くの量子状態を必要とする。
本稿では、4状態のRFIプロトコルを提案し、AliceとBobはそれぞれチャネル推定を行うために4つの量子状態しか必要としないことを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:02:42 GMT)
Evolution and learning in differentiable robots [0.0] 我々は、異なるシミュレーションを用いて、多数の候補体計画において、行動の個々の神経制御を迅速かつ同時に最適化する。
個体群における各ロボットの機械的構造の変化は,探索の外ループに遺伝的アルゴリズムを適用した。
シミュレーションで発見された非常に微分可能な形態の1つは、物理ロボットとして実現され、その最適化された振る舞いを維持できた。
論文参考訳(メタデータ) (Sun, 26 May 2024 17:24:12 GMT)
Even quantum advice is unlikely to solve PP [0.0] PP $subseteq$ BQP/qpoly ならば、カウント・ヒエラルキーは崩壊する。
これは、PP が量子アドバイスでさえ任意の固定サイズ$nk$の回路を持っていないという関連する無条件の主張を回復させる。
論文参考訳(メタデータ) (Sun, 26 May 2024 02:37:01 GMT)
Estimating Dyadic Treatment Effects with Unknown Confounders [0.0] ダイアディックデータを用いた治療効果を統計的に評価する手法を提案する。
処理が交換可能な分布に従うという仮定の下では、我々の手法は観測不能な共起因子の存在を許容する。
本手法を国際貿易データに適用し、自由貿易協定が二国間貿易フローに与える影響を評価する。
論文参考訳(メタデータ) (Sun, 26 May 2024 12:32:14 GMT)
Effects of external field and potential on non-relativistic quantum particles in disclinations background [0.0] 本研究では,非相対論的量子粒子の時空背景における挙動について検討する。
我々は、関連する波動方程式を解くために解析的手法を用いており、この量子系に対する固有値解の導出につながっている。
本研究の延長として,非ゼロ温度条件下での量子系の熱力学と磁気特性について検討する。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:42:49 GMT)
Distributed agency in second language learning and teaching through generative AI [0.0] ChatGPTは、テキストまたは音声形式のチャットを通じて非公式な第二言語プラクティスを提供することができる。
インストラクタはAIを使って、さまざまなメディアで学習と評価材料を構築することができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 11:00:47 GMT)
Distributed Threat Intelligence at the Edge Devices: A Large Language Model-Driven Approach [0.0] エッジデバイス上の分散脅威インテリジェンスは、リソース制約されたエッジデバイス上でのサイバーセキュリティを強化するための有望なパラダイムである。
このアプローチでは、エッジデバイスに直接軽量機械学習モデルをデプロイして、ネットワークトラフィックやシステムログなどのローカルデータストリームをリアルタイムで分析する。
提案するフレームワークは,ネットワークからエッジデバイスを分離することで,サイバー脅威の検出と緩和において,より優れたセキュリティを提供することにより,エッジコンピューティングのセキュリティを向上させることができる。
論文参考訳(メタデータ) (Sun, 26 May 2024 06:06:08 GMT)
Development of an open education resources (OER) system: a comparative analysis and implementation approach [0.0] このプロジェクトには、LMS(Learning Management Systems)のトップ5の比較分析が含まれている。
主な目的は、非商業ユーザのための教育資源の共有を容易にするWebベースのシステムを作ることである。
論文参考訳(メタデータ) (Sun, 26 May 2024 05:58:45 GMT)
Covariant operator bases for continuous variables [0.0] 我々は、基本的な可観測物上の単項式からなる代替基底を、シンプレクティック変換の下でうまく振る舞うことの重要な性質で研究する。
状態の密度行列が与えられたとき、その基底での膨張係数は、簡潔かつ明示的な正準共変形式の状態を記述する多重極を構成する。
論文参考訳(メタデータ) (Sun, 26 May 2024 19:32:49 GMT)
Bringing UFUs Back into the Air With FUEL: A Framework for Evaluating the Effectiveness of Unrestricted File Upload Vulnerability Scanners [0.0] 無制限ファイルアップロード(UFU)脆弱性は、Webアプリケーションに深刻な影響を与える可能性がある。
各出版物は、その新たな脆弱性スキャナーを、異なる人工または現実世界のアプリケーションに対して評価する。
本研究の目的は、既存のUFUスキャナを複数の新しい検出・エクスプロイト技術で拡張することでこの問題を解決することである。
論文参考訳(メタデータ) (Sun, 26 May 2024 16:27:39 GMT)
Automatically Generating Numerous Context-Driven SFT Data for LLMs across Diverse Granularity [0.0] AugConは、さまざまなレベルの粒度のコンテキスト駆動SFTデータを、多様性、品質、忠実度で自動生成することができる。
コントラスト学習を通じてスコアラーをトレーニングし、CSTと協調してクエリのランク付けと洗練を行う。
その結果、AugConがいくつかの最先端手法に対して高多様性、品質、忠実度SFTデータを生成する際の大きな利点を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:14:18 GMT)
Assessing the query complexity limits of quantum phase estimation using symmetry aware spectral bounds [0.0] 物理と化学のための量子アルゴリズムの計算コストは、ハミルトンのスペクトルと密接に関連している。
量子位相推定アルゴリズムの性能を統一的に理解するための対称性を考慮したスペクトル境界の階層を導入する。
論文参考訳(メタデータ) (Sun, 26 May 2024 18:02:41 GMT)
An Evolutionary Framework for Connect-4 as Test-Bed for Comparison of Advanced Minimax, Q-Learning and MCTS [0.0] 本稿では,RL,Minimax,Monte Carlo木探索(MCTS)という3種類のアルゴリズムの進化的枠組みを考案した。
MCTSが勝利率で最高の結果を得るのに対し,MinimaxとQ-Learningはそれぞれ第2位と第3位にランクされていることを示す。
論文参考訳(メタデータ) (Sun, 26 May 2024 15:11:45 GMT)
A consolidated and accessible security proof for finite-size decoy-state quantum key distribution [0.0] 有限サイズの1-デコイ(および2-デコイ)BB84プロトコルに対して、アクセス可能で包括的なセキュリティ証明を示す。
この研究は、QKDセキュリティの議論と潜在的な脆弱性とデバイス欠陥の特定の基盤となる。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:13:33 GMT)
A Study on Unsupervised Anomaly Detection and Defect Localization using Generative Model in Ultrasonic Non-Destructive Testing [0.0] 構造物における人工材料の劣化は深刻な社会問題となっている。
レーザー超音波可視化試験(LUVT)は、超音波伝搬の可視化を可能にする。
本稿では,異常検出手法を用いたLUVT自動検査手法を提案する。
論文参考訳(メタデータ) (Sun, 26 May 2024 14:14:35 GMT)