Sharing Key Semantics in Transformer Makes Efficient Image Restoration [148.2] 視覚変換器(ViT)の基盤となる自己注意機構は、意味的に無関係なオブジェクトや領域であっても、すべてのグローバルな手がかりを包含する傾向がある。
本稿では,Transformer for IR(すなわちSemanIR)を通じて重要なセマンティクスを共有することで,画像復元の性能を向上させることを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:45:34 GMT)
The RoboDrive Challenge: Drive Anytime Anywhere in Any Condition [136.3] 2024年のRoboDrive Challengeは、駆動認識技術の発展を促進するために作られた。
今年の挑戦は5つの異なるトラックで構成され、11カ国の93の機関から140の登録チームが集まった。
競争は15の最高パフォーマンスのソリューションで頂点に達した。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:49:20 GMT)
Physically Compatible 3D Object Modeling from a Single Image [110.0] 単一画像を3次元物理オブジェクトに変換するフレームワークを提案する。
我々のフレームワークは、リコンストラクションプロセスに物理的な互換性を組み込む。
既存の手法よりも3Dモデルの物理的リアリズムを一貫して強化する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:59:29 GMT)
Transfer Q Star: Principled Decoding for LLM Alignment [105.9] Transfer $Q*$は、ベースラインモデルを通してターゲット報酬$r$の最適値関数を推定する。
提案手法は, 従来のSoTA法で観測された準最適差を著しく低減する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:36:12 GMT)
Enhancing Large Vision Language Models with Self-Training on Image Comprehension [99.9] 本稿では、画像理解に特化して自己学習アプローチを強調する自己学習 on Image (STIC)を紹介する。
まず、ラベルのない画像を用いて、画像記述の好みを自己構築する。
抽出した視覚情報に対する推論をさらに自己改善するため,既存の命令調整データのごく一部をモデルに再利用する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:53:49 GMT)
Unlocking the Power of Spatial and Temporal Information in Medical Multimodal Pre-training [99.3] 我々は,空間的・時間的微粒なモデリングのためのMed-STフレームワークを提案する。
空間モデリングでは、Med-STはMixture of View Expert (MoVE)アーキテクチャを使用して、正面と横の両方のビューから異なる視覚的特徴を統合する。
時間的モデリングのために,フォワードマッピング分類 (FMC) とリバースマッピング回帰 (RMR) による新たな双方向サイクル整合性目標を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:15:09 GMT)
Research on Foundation Model for Spatial Data Intelligence: China's 2024 White Paper on Strategic Development of Spatial Data Intelligence [98.5] 本報告では、これらのモデルの原理、手法、最先端の応用を探求する、空間データインテリジェントな大規模モデルに焦点を当てる。
これは、空間データインテリジェントな大規模モデルの定義、開発履歴、現状、およびトレンドに関する詳細な議論を提供する。
本報告では, 都市環境, 航空宇宙リモートセンシング, 地理, 交通, その他のシナリオにおける空間データ知能大規模モデルの重要技術とその応用を体系的に解明する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:21:34 GMT)
CausalQuest: Collecting Natural Causal Questions for AI Agents [95.3] CausalQuestは、ソーシャルネットワーク、検索エンジン、AIアシスタントから得られる自然発生の質問13,500のデータセットである。
我々は因果問題の定義を定式化し、よりきめ細かい分類のための分類法を確立する。
人類が問う質問の42%は本当に因果関係であり、大多数は与えられた影響の背後にある原因を理解しようとしている。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:55:28 GMT)
SemFlow: Binding Semantic Segmentation and Image Synthesis via Rectified Flow [94.9] セマンティックセグメンテーションとセマンティックイメージ合成のための統合拡散ベースフレームワーク(SemFlow)を提案する。
トレーニング対象が対称であるため、イメージとセマンティックマスクの2つの分布に属するサンプルは、無理なく可逆的に転送することができる。
実験の結果,セマンティックセグメンテーションとセマンティック画像合成タスクにおいて,セマンティックセグメンテーションと競合する結果が得られた。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:34:40 GMT)
MotionFollower: Editing Video Motion via Lightweight Score-Guided Diffusion [94.7] MotionFollowerは、ビデオモーション編集のための軽量なスコア誘導拡散モデルである。
優れたモーション編集性能を提供し、大きなカメラの動きとアクションのみをサポートする。
最新のモーション編集モデルであるMotionEditorと比較して、MotionFollowerはGPUメモリの約80%の削減を実現している。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:57:30 GMT)
Not All Experts are Equal: Efficient Expert Pruning and Skipping for Mixture-of-Experts Large Language Models [90.1] MoE LLMはより少ないパラメータで高いパフォーマンスを実現することができるが、パラメータサイズが大きいためデプロイは困難である。
本稿では主に,プラグ・アンド・プレイ・エキスパートレベルのスペーシフィケーション技術を導入することで,MoE LLMの展開効率を向上させることを目的としている。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:24:16 GMT)
Do LVLMs Understand Charts? Analyzing and Correcting Factual Errors in Chart Captioning [90.1] 生成したチャートキャプションに事実誤りを包括的に分類する。
大規模な人間のアノテーションの取り組みは、様々なチャートキャプションモデルによって作られたキャプションのエラーパターンと頻度に関する洞察を提供する。
分析の結果,GPT-4Vを含む最先端モデルでさえ,事実不正確なキャプションを頻繁に生成していることが判明した。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:27:35 GMT)
OSWorld: Benchmarking Multimodal Agents for Open-Ended Tasks in Real Computer Environments [87.4] マルチモーダルエージェントのための,第1世代のスケーラブルな実コンピュータ環境であるOSWorldを紹介する。
OSWorldは、オープンエンドのコンピュータタスクを評価する統合されたコンピュータ環境として機能する。
オープンドメインの実際のWebおよびデスクトップアプリケーション、OSファイルI/O、複数のアプリケーションにまたがる369のコンピュータタスクのベンチマークを作成します。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:55:12 GMT)
MAP-Neo: Highly Capable and Transparent Bilingual Large Language Model Series [86.3] 私たちはMAP-Neoをオープンソースにしました。これは、4.5Tの高品質トークン上で、スクラッチからトレーニングされた7Bパラメータを持つバイリンガル言語モデルです。
MAP-Neo は,既存の最先端 LLM と比較して性能が劣る初の完全オープンソースバイリンガル LLM である。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:17:21 GMT)
Multi-Prompt Alignment for Multi-Source Unsupervised Domain Adaptation [86.0] マルチプロンプトアライメント(MPA: Multi-Prompt Alignment)は,マルチソースUDAのためのシンプルかつ効率的なフレームワークである。
MPAは、学習したプロンプトを自動エンコードプロセスで認知し、再構築されたプロンプトの合意を最大化することでそれらを調整する。
実験によると、MPAは3つの一般的なデータセットで最先端の結果を達成し、DomainNetの平均精度は54.1%である。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:51:36 GMT)
DevEval: A Manually-Annotated Code Generation Benchmark Aligned with Real-World Code Repositories [83.5] 既存のベンチマークは、現実世界のコードリポジトリと不整合である。
我々はDevEvalという新しいベンチマークを提案し、これは3つの進歩がある。
DevEvalは117のリポジトリから1,874のサンプルを持ち、10の人気のあるドメインをカバーする。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:03:42 GMT)
$\textit{S}^3$Gaussian: Self-Supervised Street Gaussians for Autonomous Driving [82.8] 光リアルなストリートシーンの3D再構成は、現実の自動運転シミュレータを開発する上で重要な技術である。
既存のストリート3DGS法の多くは、静的および動的要素を分解するために、トラックされた3D車両バウンディングボックスを必要とする。
動的および静的な要素を4次元整合性から分解する自己教師付きストリートガウス(textitS3$Gaussian)手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:57:08 GMT)
Hyper-Transformer for Amodal Completion [82.4] アモーダルオブジェクト補完は、可視セグメントと背景情報に基づいてオブジェクトの見えない部分を予測する複雑なタスクである。
我々はHyper-Transformer Amodal Network(H-TAN)と呼ばれる新しいフレームワークを紹介する。
このフレームワークは、動的畳み込みヘッドを備えたハイパートランスを用いて、形状の事前を直接学習し、アモーダルマスクを正確に予測する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:11:54 GMT)
SVFT: Parameter-Efficient Fine-Tuning with Singular Vectors [80.6] 既存の手法と根本的に異なる単純なアプローチであるSVFTを提案する。
SVFTは特異ベクトルの外積のスパース結合として(W)を更新し、これらのスパース結合の係数(スケール)のみを訓練する。
言語とビジョンベンチマークの実験では、SVFTは完全な微調整性能の96%を回復し、パラメータの0.006から0.25%しかトレーニングしていない。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:27:43 GMT)
Uncovering LLM-Generated Code: A Zero-Shot Synthetic Code Detector via Code Rewriting [78.5] そこで本研究では,コードと書き直された変種との類似性に基づいて,ゼロショット合成符号検出器を提案する。
以上の結果から,既存のテキスト用合成コンテンツ検出装置よりも顕著な向上が見られた。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:12:47 GMT)
MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model [78.1] MOFA-Videoは、様々な制御可能な信号を用いて、所定の画像から映像を生成する高度な制御可能な画像アニメーション手法である。
ビデオ生成パイプラインの動作を制御するために,複数のドメイン対応モーションフィールドアダプタを設計する。
我々は手動の軌跡と人間のランドマークの2つのモーションアダプタを個別に訓練する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:22:22 GMT)
Auto Arena of LLMs: Automating LLM Evaluations with Agent Peer-battles and Committee Discussions [77.8] LLM エージェントによる評価プロセス全体を自動化した LLM の自動アリーナを提案する。
最新のLLM17実験において,オートアリーナは人間の嗜好と最も高い相関関係を示した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:19:19 GMT)
SPARE: Symmetrized Point-to-Plane Distance for Robust Non-Rigid Registration [76.4] 本研究では,SPAREを提案する。SPAREは,非剛性登録のための対称化点-平面間距離を用いた新しい定式化である。
提案手法は, 厳密でない登録問題の精度を大幅に向上し, 比較的高い解効率を維持する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:55:04 GMT)
Drug Discovery with Dynamic Goal-aware Fragments [76.1] GEAM (Goal-aware fragment extract, Assembly and Modification) という薬物発見のための分子生成フレームワークを提案する。
GEAMは3つのモジュールから構成されており、それぞれがゴール対応のフラグメント抽出、フラグメントアセンブリ、フラグメント修正を担当している。
GEAMは3つのモジュールの生成サイクルを通じて薬物候補を効果的に発見できることを実験的に実証した。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:03:32 GMT)
The Road Less Scheduled [75.1] 最適化停止ステップTの仕様を必要としない既存の学習率スケジュールは、Tに依存する学習率スケジュールにより大幅に改善される。
本稿では,スケジュールを全面的に活用することで,この停止時間を回避するアプローチを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:50:15 GMT)
GKT: A Novel Guidance-Based Knowledge Transfer Framework For Efficient Cloud-edge Collaboration LLM Deployment [74.4] 本稿では,新規かつ直感的なガイダンスベース知識伝達(GKT)フレームワークを提案する。
GKTは'teacher'として大きな言語モデルを使用し、ガイダンスプロンプトを生成し、より小さな'student'モデルと組み合わせて応答を確定する。
GSM8Kの最大精度は14.18%、GSM8Kの10.72倍、精度は14.00%、CSQAの7.73倍である。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:37:35 GMT)
MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.8] ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:23:13 GMT)
Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in Large Language Models [73.8] Uncertainty of Thoughts (UoT) は、大きな言語モデルを拡張するアルゴリズムであり、効果的な質問をすることで積極的に情報を求めることができる。
医療診断、トラブルシューティング、および20の質問ゲームに関する実験において、UoTは、タスク完了の成功率において平均38.1%のパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:03:35 GMT)
Prismatic VLMs: Investigating the Design Space of Visually-Conditioned Language Models [73.4] 視覚条件付き言語モデル(VLM)は、視覚対話、シーン理解、ロボットタスク計画などのアプリケーションに採用されている。
新しいリリースの量は多いが、イメージ前処理、アーキテクチャ、最適化に関する重要な設計決定は未調査である。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:08:48 GMT)
Cross-Lingual Knowledge Editing in Large Language Models [73.1] 知識編集は、スクラッチから再学習することなく、大きな言語モデルを新しい知識に適応させることが示されている。
ソース言語編集が別のターゲット言語に与える影響は、いまだ不明である。
まず、ZsREを英語から中国語に翻訳することで、大規模な言語間合成データセットを収集する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:49:47 GMT)
Unraveling the Impact of Heterophilic Structures on Graph Positive-Unlabeled Learning [72.0] 実世界の多くのシナリオにおいて、肯定的無ラベル(PU)学習は不可欠であるが、そのグラフデータへの応用は未探索のままである。
グラフ上でのPU学習において重要な課題がエッジヘテロフィリーにあり、クラスプライア推定の既約性前提に直接違反していることを明らかにする。
この課題に対応するために,ラベル伝搬損失(GPL)を用いたグラフPU学習という新しい手法を導入する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:30:44 GMT)
Slight Corruption in Pre-training Data Makes Better Diffusion Models [71.9] 拡散モデル(DM)は、高品質な画像、オーディオ、ビデオを生成する際、顕著な能力を示している。
DMは大規模なデータセットでの広範な事前トレーニングの恩恵を受ける。
しかしながら、事前トレーニングデータセットは、しばしば、データを正確に記述しないような、破損したペアを含んでいる。
本稿では,DMの事前学習データにそのような汚職が及ぼす影響について,初めて包括的研究を行った。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:35:48 GMT)
$E^{3}$Gen: Efficient, Expressive and Editable Avatars Generation [71.7] 本稿では,効率的な,表現的で編集可能なデジタルアバター生成のための3Dガウスモデルを提案する。
本稿では,これらの課題を効果的に解決するために,$E3$Genという新しいアバター生成手法を提案する。
提案手法は,アバター生成における優れた性能を実現し,表現力のあるフルボディポーズ制御と編集を可能にする。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:38:09 GMT)
GaussianPrediction: Dynamic 3D Gaussian Prediction for Motion Extrapolation and Free View Synthesis [71.2] 動的シーンモデリングと将来のシナリオ合成により,3次元ガウス表現を実現する新しいフレームワークを提案する。
GaussianPredictionは、ダイナミックなシーンのビデオ観察を使用して、あらゆる視点から将来の状態を予測できる。
本フレームワークは,合成データセットと実世界のデータセットの両方で優れた性能を示し,将来の環境の予測とレンダリングの有効性を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:47:55 GMT)
Deep Joint Semantic Coding and Beamforming for Near-Space Airship-Borne Massive MIMO Network [70.6] 近距離飛行船搭載通信網は、緊急に信頼性と効率のよい飛行船対Xリンクを必要とする。
本稿では,MIMO(Multiple-Input multiple-output)技術とセマンティックコミュニケーションを統合することを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:46:59 GMT)
Two Optimizers Are Better Than One: LLM Catalyst for Enhancing Gradient-Based Optimization [70.0] 我々は,勾配に基づく最適化と大規模言語モデル(MsLL)が相互補完的であることを示し,協調的な最適化手法を提案する。
私たちのコードはhttps://www.guozix.com/guozix/LLM-catalystでリリースされています。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:24:14 GMT)
HINT: Learning Complete Human Neural Representations from Limited Viewpoints [69.8] 我々は、限られた視野角から詳細な人間のモデルを学習できるNeRFベースのアルゴリズムを提案する。
その結果,数個の視角からでも完全な人間の再構築が可能となり,性能は15%以上向上した。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:43:09 GMT)
SEP: Self-Enhanced Prompt Tuning for Visual-Language Model [68.7] SEP(Self-Enhanced Prompt Tuning)という新しいアプローチを導入する。
SEPは、テキストレベルの埋め込みと視覚レベルの埋め込みの両方を強化するために、差別的な事前知識を明示的に取り入れている。
様々なベンチマークやタスクの総合的な評価は、プロンプトチューニングにおけるSEPの有効性を確認している。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:52:37 GMT)
One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models [67.5] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を改善するための有望な方法である。
本稿では,RAGのためのスケーラブルでプラガブルな仮想トークンを学習する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:44:54 GMT)
3D StreetUnveiler with Semantic-Aware 2DGS [66.9] StreetUnveilerは、混雑した観察から空の通りの3D表現を学習する。
空の街路シーンを、観察された、部分的に観察された、保存されていない領域に分割する。
街路景観データセットを用いた実験により, 空き路の3次元表現の再構築に成功した。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:52:04 GMT)
Neural Optimal Transport with General Cost Functionals [66.4] 一般費用関数の最適輸送計画を計算するニューラルネットワークに基づく新しいアルゴリズムを提案する。
アプリケーションとして,クラス単位の構造を保ちながら,データ分布をマップするコスト関数を構築した。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:11:45 GMT)
LLaMA Pro: Progressive LLaMA with Block Expansion [66.4] 本稿では,トランスフォーマーブロックを拡張したLarge Language Models (LLM) の事前学習手法を提案する。
我々は,新たなコーパスのみを用いて拡張ブロックをチューニングし,大惨な忘れをすることなく,モデル知識を効率的に,効果的に改善する。
本稿では,LLaMA2-7Bの多元的基礎モデルであるLLaMA Pro-8.3Bのコードと数学のコーパスについて実験する。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:45:34 GMT)
Diffusion Policies creating a Trust Region for Offline Reinforcement Learning [66.2] 本稿では,拡散信頼型Q-Learning (DTQL) という2つの政策アプローチを導入する。
DTQLは、トレーニングと推論の両方において反復的なデノレーションサンプリングの必要性を排除し、計算的に極めて効率的である。
DTQLは、D4RLベンチマークタスクの大部分において、他のメソッドよりも優れているだけでなく、トレーニングや推論速度の効率性も示すことができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:04:33 GMT)
Advancing Large Language Models to Capture Varied Speaking Styles and Respond Properly in Spoken Conversations [65.3] 現在の2つの旋回が同じ文であっても、異なるスタイルで話されるときの応答は相変わらず異なる。
本稿では,言語内容と発話スタイルをモデル化できるSpken-LLMフレームワークを提案する。
StyleTalkデータセットを使用してSpoken-LLMをトレーニングし、Spoken-LLMが話し方を学ぶのに役立つ2段階のトレーニングパイプラインを作成します。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:06:34 GMT)
ANAH: Analytical Annotation of Hallucinations in Large Language Models [65.1] 我々は、大言語モデルにおける幻覚の@textbfAN$alytical $textbfA$nnotationを提供するデータセットである$textbfANAH$を提示する。
ANAHは、700以上のトピックをカバーする4.3k LLM応答のための12kの文レベルのアノテーションで構成されている。
幻覚アノテーションの微粒化により, LLMの幻覚が解答に蓄積されることを定量的に確認し, ANAHを用いて幻覚アノテーションを訓練し, 評価する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:54:40 GMT)
Point Cloud Mamba: Point Cloud Learning via State Space Model [64.9] この研究は、ポイントクラウド分析にそのようなアーキテクチャを適用することに焦点を当てている。
我々は,マンバをベースとした点雲法が,変圧器や多層パーセプトロン(MLP)に基づく従来手法よりも優れていることを示す。
Point Cloud Mambaは、最先端(SOTA)のポイントベースメソッドであるPointNeXtを超え、ScanObjectNN、ModelNet40、ShapeNetPart、S3DISデータセット上で新しいSOTAパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:18:17 GMT)
Unveiling the Impact of Coding Data Instruction Fine-Tuning on Large Language Models Reasoning [64.5] Instruction Fine-Tuning (IFT) は事前訓練されたLarge Language Models (LLM) のゼロショット能力を著しく向上させる
IFT段階におけるLLMの推論能力に及ぼす符号化データの影響について検討する。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:20:25 GMT)
Learning Latent Graph Structures and their Uncertainty [64.0] グラフニューラルネットワーク(GNN)は、モデル精度を高めるために帰納バイアスとしてリレーショナル情報を使用する。
課題関連関係が不明なため,下流予測タスクを解きながら学習するためのグラフ構造学習手法が提案されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:49:22 GMT)
Learning Optimal Deterministic Policies with Stochastic Policy Gradients [62.8] 政策勾配法(PG法)は連続強化学習(RL法)問題に対処する手法として成功している。
一般的には、収束(ハイパー)政治は、決定論的バージョンをデプロイするためにのみ学習される。
本稿では,サンプルの複雑性とデプロイされた決定論的ポリシのパフォーマンスのトレードオフを最適化するために,学習に使用する探索レベルの調整方法を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:18:24 GMT)
SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulation [62.6] Segment Anything (SAM) は、一般化可能なシーン理解とシーケンス模倣のための視覚境界モデルである。
我々は,単一パスにおけるアクションシーケンスの予測を可能にする,新しいマルチチャネルヒートマップを開発した。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:32:51 GMT)
OccSora: 4D Occupancy Generation Models as World Simulators for Autonomous Driving [62.5] 自律運転のための3次元世界開発をシミュレートするために,拡散型4次元占有率生成モデルOccSoraを提案する。
OccSoraは、正確な3Dレイアウトと時間的一貫性を備えた16sビデオを生成し、運転シーンの空間的および時間的分布を理解する能力を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:42 GMT)
RIGID: A Training-free and Model-Agnostic Framework for Robust AI-Generated Image Detection [61.0] RIGIDは、堅牢なAI生成画像検出のためのトレーニング不要でモデルに依存しない方法である。
RIGIDは、既存のトレーニングベースおよびトレーニング不要な検出器を著しく上回っている。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:49:54 GMT)
Tool Learning with Large Language Models: A Survey [60.7] 大規模言語モデル(LLM)を用いたツール学習は,高度に複雑な問題に対処するLLMの能力を強化するための,有望なパラダイムとして登場した。
この分野での注目と急速な進歩にもかかわらず、現存する文献は断片化され、体系的な組織が欠如している。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:01:10 GMT)
Small Models, Big Insights: Leveraging Slim Proxy Models To Decide When and What to Retrieve for LLMs [60.4] 本稿では,スリムプロキシモデルを用いた大規模言語モデル (LLM) における知識不足を検知する新しい協調手法であるSlimPLMを提案する。
パラメータがはるかに少ないプロキシモデルを採用し、回答を回答としています。
ヒューリスティックな回答は、LLM内の既知の未知の知識と同様に、ユーザの質問に答えるために必要な知識を予測するのに使用される。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:03:51 GMT)
DVIS-DAQ: Improving Video Segmentation via Dynamic Anchor Queries [60.1] 動的アンカークエリ(DAQ)を導入し、アンカーとターゲットクエリ間の遷移ギャップを短くする。
また,クエリレベルのオブジェクトEmergence and Disappearance Simulation(EDS)戦略を導入する。
実験により、DVIS-DAQは5つの主流ビデオセグメンテーションベンチマーク上で、新しい最先端(SOTA)性能を達成することが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:31:00 GMT)
CoVR: Learning Composed Video Retrieval from Web Video Captions [59.9] Composed Image Retrieval (CoIR) はテキストと画像のクエリを一緒に考えるタスクとして最近人気を集めている。
本稿では,ビデオキャプションペアのトリプレットを生成する,スケーラブルな自動データセット作成手法を提案する。
また、コンポジションビデオ検索(CoVR)を含むタスクの範囲を広げる。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:52:33 GMT)
ETHER: Efficient Finetuning of Large-Scale Models with Hyperplane Reflections [59.8] 本稿では,HypErplane Reflectionsによる高効率微調整を行うETHER変換ファミリを提案する。
特に,既存のPEFT法と極めて少ないパラメータで一致または性能を向上するEtheRと緩和ETHER+を導入する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:26:02 GMT)
Formalizing and Benchmarking Prompt Injection Attacks and Defenses [59.6] 本稿では,迅速なインジェクション攻撃を形式化するフレームワークを提案する。
フレームワークに基づいて、既存のものを組み合わせることで、新たな攻撃を設計します。
我々の研究は、将来のプロンプトインジェクション攻撃と防御を定量的に評価するための共通のベンチマークを提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:09:56 GMT)
RelayAttention for Efficient Large Language Model Serving with Long System Prompts [59.5] 本稿では,長いシステムプロンプトを含むLCMサービスの効率を向上させることを目的とする。
これらのシステムプロンプトの処理には、既存の因果注意アルゴリズムにおいて、大量のメモリアクセスが必要である。
本稿では,DRAMから入力トークンのバッチに対して,DRAMから隠れた状態を正確に1回読み取ることのできるアテンションアルゴリズムであるRelayAttentionを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:09:25 GMT)
Defensive Prompt Patch: A Robust and Interpretable Defense of LLMs against Jailbreak Attacks [59.5] 本稿では,大規模言語モデル(LLM)のための新しいプロンプトベースの防御機構であるDPPを紹介する。
従来のアプローチとは異なり、DPP は LLM の高能率を維持しながら最小の攻撃成功率 (ASR) を達成するように設計されている。
LLAMA-2-7B-ChatおよびMistral-7B-Instruct-v0.2モデルによる実験結果から,DSPの堅牢性と適応性が確認された。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:40:35 GMT)
From Words to Actions: Unveiling the Theoretical Underpinnings of LLM-Driven Autonomous Systems [59.4] 大規模言語モデル (LLM) は、物理世界の意思決定問題を解くことができる。
このモデルの下で、LLM Plannerは、プロンプトを介して言語ベースのサブゴールを反復的に生成することにより、部分的に観測可能なマルコフ決定プロセス(POMDP)をナビゲートする。
我々は,事前学習したLLMプランナーが,文脈内学習を通じてベイズ的集計模倣学習(BAIL)を効果的に行うことを証明した。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:42:54 GMT)
Vision-based Manipulation from Single Human Video with Open-World Object Graphs [58.2] 我々は、人間のビデオから視覚に基づく操作スキルを学ぶために、ロボットに力を与えるオブジェクト中心のアプローチを提案する。
ORIONは,単一のRGB-Dビデオからオブジェクト中心の操作計画を抽出することで,この問題に対処するアルゴリズムである。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:56:54 GMT)
EVEREST: Efficient Masked Video Autoencoder by Removing Redundant Spatiotemporal Tokens [57.4] ビデオ表現学習のための驚くほど効率的なMVAアプローチであるEVERESTを提案する。
リッチなモーション特徴を含むトークンを発見し、事前トレーニングと微調整の両方の間、非形式的なトークンを破棄する。
提案手法は,MVAの計算とメモリ要求を大幅に低減する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:58:39 GMT)
Towards Unified Multi-granularity Text Detection with Interactive Attention [56.8] Detect Any Text"は、シーンテキストの検出、レイアウト分析、ドキュメントページの検出を結合的なエンドツーエンドモデルに統合する高度なパラダイムである。
DATにおける重要なイノベーションは、テキストインスタンスの表現学習を大幅に強化する、粒度横断型アテンションモジュールである。
テストによると、DATは様々なテキスト関連ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:25:23 GMT)
On the Representational Capacity of Recurrent Neural Language Models [56.2] 計算時間を持つ有理重み付きRLMは、有理重み付き遷移を持つ決定論的確率的チューリングマシン(PTM)をシミュレートできることを示す。
また, 実時間計算の制約下では, 決定論的実時間有理PTMをシミュレートできることを示した。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:49:25 GMT)
PDDLEGO: Iterative Planning in Textual Environments [56.1] テキスト環境における計画は、現在のモデルにおいても長年にわたる課題であることが示されている。
我々は,あるサブゴールの部分的な計画に導く計画表現を反復的に構築するPDDLEGOを提案する。
数ショットのPDDLEGOで作成するプランは,Coin Collectorシミュレーションでエンドツーエンドのプランを生成するよりも43%効率がよいことを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:01:20 GMT)
Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.9] タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:53:50 GMT)
Scaling Laws for the Value of Individual Data Points in Machine Learning [55.6] 個々のデータポイントの値のスケーリング行動を調べることによって、新しい視点を導入する。
スケーリング法則を支持するための学習理論を提供し、それが様々なモデルクラスにまたがっていることを実証的に観察する。
私たちの研究は、個々のデータポイントの値のスケーリング特性を理解し、活用するための第一歩です。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:10:24 GMT)
InstructionCP: A fast approach to transfer Large Language Models into target language [55.2] InsCPは命令タグをCPプロセスに統合し、新しい言語を習得する際の会話能力の喪失を防ぐ。
実験の結果,InsCPは人間のフィードバック能力から会話と強化学習を維持していることがわかった。
このアプローチでは、高品質な命令追従データを0.1億トークンしか必要とせず、それによってリソース消費が減少する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:45:13 GMT)
OpenDAS: Domain Adaptation for Open-Vocabulary Segmentation [55.0] オープン語彙セグメンテーションのための新しいタスクドメイン適応を導入する。
本稿では,パラメータ効率のよいプロンプトチューニングと三重奏法に基づくトレーニング戦略を組み合わせたアプローチを提案する。
この結果は,オープン語彙セグメント分類タスクにおいて,他のパラメータ効率適応手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:16:06 GMT)
IReNe: Instant Recoloring in Neural Radiance Fields [54.9] 我々は、NeRFにおける高速、ほぼリアルタイムな色編集を可能にするIReNeを紹介する。
トレーニング済みのNeRFモデルとユーザ対応カラー編集によるトレーニングイメージを併用する。
この調整により、モデルはトレーニング画像からの色変化を正確に表現して、新しいシーンビューを生成することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:30:28 GMT)
MGCP: A Multi-Grained Correlation based Prediction Network for Multivariate Time Series [54.9] 本稿では,マルチグラインド相関に基づく予測ネットワークを提案する。
予測性能を高めるために3段階の相関を同時に検討する。
注意機構に基づく予測器と条件判別器を用いて、粗い粒度の予測結果を最適化する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:32:44 GMT)
Auto-selected Knowledge Adapters for Lifelong Person Re-identification [54.4] Lifelong Person Re-Identificationは、異なる時間と場所にわたる重複しないデータセットから継続的に学習するシステムを必要とする。
リハーサルのない、あるいはリハーサルベースの既存のアプローチは、依然として破滅的な忘れ込みの問題に悩まされている。
本稿では,知識アダプタを採用した新しいフレームワークであるAdalReIDと,生涯学習のためのパラメータフリー自動選択機構を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:42:46 GMT)
DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [54.1] 拡散先行型IQA(DP-IQA)と呼ばれる新しいIQA法を提案する。
トレーニング済みの安定拡散をバックボーンとして使用し、復調するU-Netから多レベル特徴を抽出し、それらをデコードして画質スコアを推定する。
上記のモデルの知識をCNNベースの学生モデルに抽出し、適用性を高めるためにパラメータを大幅に削減する。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:32:35 GMT)
Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Models [54.1] 本稿では,RLによる報酬モデルの最適化により,最先端拡散モデルを微調整するハイブリッド手法を提案する。
我々は、報酬モデルの補間能力を活用し、オフラインデータにおいて最良の設計を上回るアプローチの能力を実証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:57:29 GMT)
Position: Graph Foundation Models are Already Here [53.7] グラフ基礎モデル(GFM)は、グラフ領域において重要な研究トピックとして浮上している。
グラフ語彙の提唱によるGFM開発のための新しい視点」を提案する。
この観点は、将来のGFM設計を、ニューラルネットワークのスケーリング法則に従って前進させる可能性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:38:39 GMT)
Defining Neural Network Architecture through Polytope Structures of Dataset [53.5] 本稿では, ニューラルネットワーク幅の上下境界を定義し, 問題となるデータセットのポリトープ構造から情報を得る。
本研究では,データセットのポリトープ構造を学習したニューラルネットワークから推定できる逆条件を探索するアルゴリズムを開発した。
MNIST、Fashion-MNIST、CIFAR10といった一般的なデータセットは、顔の少ない2つ以上のポリトップを用いて効率的にカプセル化できることが確立されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:13:13 GMT)
Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.4] ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:20:23 GMT)
Investigating the Robustness of LLMs on Math Word Problems [53.0] 大規模言語モデルは数学用語の問題を解くのに優れるが、無関係な情報を含む現実世界の問題に苦戦する。
本稿では,無関係な変数を追加することで,MWPの逆変分を生成するプロンプトフレームワークを提案する。
敵の訓練インスタンスの微調整は、敵のMWPのパフォーマンスを8%向上させる。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:07:13 GMT)
View-Consistent Hierarchical 3D SegmentationUsing Ultrametric Feature Fields [52.1] 我々は3次元シーンを表すニューラル・レージアンス・フィールド内の新しい特徴場を学習する。
本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。
多視点画像と多粒性セグメンテーションを用いた合成データセット上で,本手法といくつかのベースラインの評価を行った。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:14:58 GMT)
Expert Proximity as Surrogate Rewards for Single Demonstration Imitation Learning [52.0] IL(Single-demonstration mimicion Learning)は、複数の専門家による実演の取得がコストのかかる、あるいは実現不可能な実世界のアプリケーションに対して、実践的なアプローチである。
典型的なIL設定とは対照的に、シングルデモレーションILは1つの専門家軌道のみにアクセスするエージェントを含む。
本稿では, この設定におけるスパース報酬信号の問題を強調し, 提案手法であるTransition Discriminator-based IL (TDIL) を用いてこの問題を軽減することを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:14:43 GMT)
A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.8] 水中画像強調(UIE)はコンピュータビジョンの分野で難しい研究課題である。
何百ものUIEアルゴリズムが提案されているが、包括的で体系的なレビューはまだ不足している。
我々は、ベンチマークデータセット上で最先端のアルゴリズムを定量的に定性的に評価する。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:46:40 GMT)
Large Language Model Watermark Stealing With Mixed Integer Programming [51.3] 大きな言語モデル(LLM)の透かしは、著作権に対処し、AI生成したテキストを監視し、その誤用を防ぐことを約束している。
近年の研究では、多数のキーを用いた透かし手法は、攻撃の除去に影響を受けやすいことが示されている。
我々は,最先端のLLM透かしスキームに対する新たなグリーンリスト盗難攻撃を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:11:17 GMT)
GECO: Generative Image-to-3D within a SECOnd [51.2] 本稿では,1秒以内に動作する高品質な3次元生成モデリング手法GECOを紹介する。
GECOは2段階のアプローチにより、現在の手法における不確実性と非効率性の問題に対処する。
実験により,GECOは前例のない効率で高品質な3次元画像生成を実現することが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:58:00 GMT)
Position: Topological Deep Learning is the New Frontier for Relational Learning [51.1] トポロジカルディープラーニング(TDL)は、トポロジカルな特徴を用いてディープラーニングモデルを理解し設計する、急速に進化する分野である。
本稿では,TDLがリレーショナル学習の新たなフロンティアであることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:52:56 GMT)
Decoupling Dynamic Monocular Videos for Dynamic View Synthesis [50.9] 動的モノクロビデオからの動的ビュー合成の課題を教師なしで解決する。
具体的には、動的物体の運動を物体の動きとカメラの動きに分離し、教師なし表面の整合性およびパッチベースのマルチビュー制約によって規則化する。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:21:41 GMT)
Efficient Prompt Optimization Through the Lens of Best Arm Identification [50.6] この作業は、明示的な予算制約の下でプロンプト選択を効率的に行うための、原則化されたフレームワークであるTRIPLEを提供する。
マルチアームバンディット(MAB)における即時最適化と固定予算ベストアーム識別(BAI-FB)の間に確立された新しい接続上に構築されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:40:21 GMT)
The Empirical Impact of Neural Parameter Symmetries, or Lack Thereof [50.5] 本稿では,パラメータ空間対称性を低減した新しいニューラルネットワークアーキテクチャを導入することにより,ニューラルパラメータ対称性の影響について検討する。
重み空間をアライメントすることなく、ネットワーク間の線形モード接続を観測し、ネットワークがより高速で効果的なベイズニューラルネットワークトレーニングを可能にすることを発見した。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:32:31 GMT)
Non-asymptotic Convergence of Discrete-time Diffusion Models: New Approach and Improved Rate [50.0] 我々はDT拡散過程下での分布のかなり大きなクラスに対する収束保証を確立する。
次に、明示的なパラメータ依存を持つ分布の多くの興味深いクラスに結果を専門化します。
そこで本研究では,新しい加速型サンプリング器を提案し,対応する正則サンプリング器の収束率を,全てのシステムパラメータに対して桁違いに向上することを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:18:01 GMT)
Enabling Uncertainty Estimation in Iterative Neural Networks [49.6] 本研究では,アンサンブルのような手法よりもはるかに低い計算コストで最先端の見積もりを提供する不確実性推定手法を開発する。
航空画像における道路検出と2次元および3次元形状の空力特性の推定という2つの応用領域に組み込むことで,その実用的価値を実証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:10:19 GMT)
A Provably Effective Method for Pruning Experts in Fine-tuned Sparse Mixture-of-Experts [49.4] 本論文は,MoEモデルにおけるエキスパートの刈り取りに有効な手法として,初めて提案するものである。
理論的には、事前訓練されたモデルからルータl2ノルムを小さく変更することで、専門家のプルーニングを優先順位付けすることで、テスト精度の維持が保証される。
我々の理論解析は、単純化されたMoEアーキテクチャ上でのバイナリ分類タスクに重点を置いているが、我々の専門的なプルーニング手法は、大きな視覚的MoEモデルに基づいて検証されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:30:42 GMT)
Unveiling Linguistic Regions in Large Language Models [49.3] 大規模言語モデル (LLM) は言語間アライメントと一般化能力を示す。
本稿では,LLMの言語能力に関するいくつかの調査を行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:31:46 GMT)
Uncertainty-guided Optimal Transport in Depth Supervised Sparse-View 3D Gaussian [49.2] 3次元ガウシアンスプラッティングは、リアルタイムな新規ビュー合成において顕著な性能を示した。
これまでのアプローチでは、3Dガウスの訓練に奥行き監視を取り入れ、オーバーフィッティングを軽減してきた。
本研究では,3次元ガウスの深度分布を可視化する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:18:30 GMT)
Safe Multi-agent Reinforcement Learning with Natural Language Constraints [49.0] 安全なマルチエージェント強化学習(MARL)における自然言語制約の役割は重要であるが、しばしば見過ごされる。
自然言語制約付き安全マルチエージェント強化学習(SMALL)という新しいアプローチを提案する。
提案手法は、微調整言語モデルを用いて、自由形式のテキスト制約を解釈し、処理し、セマンティックな埋め込みに変換する。
これらの埋め込みはマルチエージェントのポリシー学習プロセスに統合され、エージェントは報酬を最適化しながら制約違反を最小限に抑えるポリシーを学ぶことができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:57:35 GMT)
SPAM: Stochastic Proximal Point Method with Momentum Variance Reduction for Non-convex Cross-Device Federated Learning [48.1] デバイス間のトレーニングは、クライアントの数が何十億にも達する、学習のサブフィールドです。
標準アプローチとローカルメソッドは、デバイス間の類似性と同じくらい重要な問題になりがちである。
当社の手法は,同種のデータを持つクライアントの客観的かつ実証的なメリットを必要としない,この種の最初の手法である。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:07:30 GMT)
Rethinking Transformers in Solving POMDPs [47.1] 本稿では、部分的に観測可能なマルコフ決定プロセス(POMDP)における一般的なアーキテクチャ、すなわちトランスフォーマーの有効性を精査する。
Transformersがモデル化に苦労する正規言語は、POMDPに再現可能である。
このことはトランスフォーマーがPOMDP固有の帰納バイアスを学習する上で大きな課題となる。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:54:40 GMT)
Lookahead: An Inference Acceleration Framework for Large Language Model with Lossless Generation Accuracy [46.8] 大規模言語モデル(LLM)は、質問応答、翻訳、テキスト要約、対話システムなど、様々なタスクで大きく進歩している。
本稿では,推論プロセスの高速化のための汎用フレームワークを提案する。
我々は、推論加速フレームワークの適用によって達成された顕著な改善を実証するために、広範囲な実験を行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:25:08 GMT)
A Morphology-Based Investigation of Positional Encodings [46.7] 形態と語順は密接に結びついており、後者は位置符号化によってトランスフォーマーモデルに組み込まれている。
言語の形態的複雑さと、事前訓練された言語モデルにおける位置エンコーディングの利用との間には相関があるのだろうか?
本研究は,22の言語と5の下流タスクを対象とする,この問題に対処する最初の研究である。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:44:10 GMT)
Accurate and Reliable Predictions with Mutual-Transport Ensemble [46.4] Kullback-Leibler (KL) を用いた共学習補助モデルの提案とクロスエントロピー損失の適応的正則化
MTEは精度と不確実性の両方を同時に向上させることができる。
例えば、CIFAR-100データセットでは、我々のResNet34/50上のMTEメソッドは、従来の最先端の手法に比べて大幅に改善された。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:15:59 GMT)
Multi-Condition Latent Diffusion Network for Scene-Aware Neural Human Motion Prediction [46.3] 現実世界の人間の動きはゴール指向であり、周囲のシーンの空間的レイアウトの影響を強く受けている。
本稿では,多条件共同推論問題として人間の動作予測タスクを再構成するマルチコンディション遅延拡散ネットワーク(MCLD)を提案する。
我々のネットワークは、現実的かつ多様な予測において最先端の手法よりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:46:08 GMT)
N-Dimensional Gaussians for Fitting of High Dimensional Functions [46.2] 本稿では,ガウス混合モデルに基づく明示表現の課題に取り組む。
局所性感性ハッシュにインスパイアされたN-Dガウスを効率的に束縛する高次元カリング方式を提案する。
適応的洗練とコンパクト化を両立させるため,付加能力の使用を漸進的に導く損失適応密度制御方式を導入する。
これらのツールを使えば、位置や視角を超えた多くの入力次元に依存する複雑な外観を初めて表現することができます。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:56:58 GMT)
Enhancing Adversarial Robustness in SNNs with Sparse Gradients [46.2] スパイキングニューラルネットワーク(SNN)は、そのエネルギー効率の高い操作と生物学的にインスパイアされた構造に対して大きな注目を集めている。
既存の技術は、ANNから適応したものであれ、SNNのために特別に設計されたものであれ、SNNの訓練や強力な攻撃に対する防御に制限がある。
本稿では,SNNの頑健性を高めるための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:39:27 GMT)
TensorKrowch: Smooth integration of tensor networks in machine learning [46.1] PyTorch上に構築されたオープンソースのPythonライブラリであるKrowchを紹介します。
ユーザは任意のテンソルネットワークを構築してトレーニングし、より複雑なディープラーニングモデルにレイヤとして統合することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:03:46 GMT)
Systematic Analysis for Pretrained Language Model Priming for Parameter-Efficient Fine-tuning [46.0] 本稿では,PE手法の少数ショット適応と一般化能力を高めるための汎用PEプライミングフレームワークを提案する。
我々は160種類のNLPタスクを含む数ショットのクロスドメインベンチマークで実験を行った。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:27:21 GMT)
DeepLag: Discovering Deep Lagrangian Dynamics for Intuitive Fluid Prediction [45.8] 本稿では, タングルサム流体力学に対処する新しいラグランジアン・ユーレリア複合パラダイムを提案する。
ユーレアン観測に基づいて未来を予測するのではなく、流体中に隠れたラグランジアン力学を発見するためにDeepLagを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:53:51 GMT)
CV-VAE: A Compatible Video VAE for Latent Generative Video Models [45.7] 可変エンコーダ(VAE)は、OpenAIのビデオの自動時間圧縮において重要な役割を果たす。
現在、潜伏拡散に基づくビデオモデルによく使われる連続ビデオ(3D)VAEが欠けている。
本稿では,静止空間が与えられた画像VAEと互換性のある映像モデル,CV-VAEの映像VAEをトレーニングする方法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:33:10 GMT)
RapVerse: Coherent Vocals and Whole-Body Motions Generations from Text [45.1] 歌詞入力から直接3次元体の動きと歌声を同時に生成する難易度タスクを提案する。
まずRapVerseデータセット(同期ラッピングボーカル、歌詞、高品質な3Dボディーメッシュを含む大規模なデータセット)を収集する。
これら3つのモダリティを統一した方法で変換器モデリングを共同で行うことにより、我々のフレームワークは、シームレスで現実的な声と人間の動きのブレンドを保証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:39 GMT)
Debating with More Persuasive LLMs Leads to More Truthful Answers [45.0] 議論は、非専門家モデルと人間の両方が、それぞれ76%と88%の精度で質問に答えるのを一貫して助けていることに気付きました。
以上の結果から,基礎的真理の欠如によるモデルと議論の整合性に関する実証的証拠が得られた。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:59:34 GMT)
Dipole-dipole interactions mediated by a photonic flat band [45.0] 平面バンド(FB)のフォトニックアナログに分散結合したエミッタ間の光子-双極子相互作用について検討する。
このような光子を媒介とする相互作用の強度は、特徴的な局在長を持つ距離で指数関数的に崩壊する。
1Dと2Dの両方の大規模なFBに対して解析的に導かれる普遍的スケーリング法則により, 局所化長はCLS間の重なりで増大することがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:00:05 GMT)
Multi-View People Detection in Large Scenes via Supervised View-Wise Contribution Weighting [44.5] 本稿では、教師付きビューワイドコントリビューション重み付け手法の開発により、多視点人物検出の改善に焦点をあてる。
モデルの一般化能力を高めるために、大規模な合成データセットが採用されている。
実験により,提案手法が有望な多面的人物検出性能の実現に有効であることを実証した。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:03:27 GMT)
Robust Image Semantic Coding with Learnable CSI Fusion Masking over MIMO Fading Channels [44.2] 既存の意味コミュニケーションフレームワークは、主に単一出力の単一出力ガウスチャネルやレイリーフェディングチャネルを考察している。
学習可能なCSI融合セマンティックコミュニケーションフレームワークを提案し,CSIはセマンティック抽出器によってサイド情報として扱われる。
実験結果は従来のスキームや最先端のSwin TransformerベースのセマンティックコミュニケーションフレームワークよりもLCFSCの方が優れていることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:23:17 GMT)
X-Instruction: Aligning Language Model in Low-resource Languages with Self-curated Cross-lingual Instructions [43.9] 大規模な言語モデルは、英語のような高リソース言語ではうまく反応するが、低リソース言語では苦労する。
そこで本研究では,低リソース言語における英語の命令と応答を併用した言語間命令を新たに構築する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:45:23 GMT)
DITTO-2: Distilled Diffusion Inference-Time T-Optimization for Music Generation [43.6] 制御可能な音楽生成方法は、人間中心のAIベースの音楽生成に不可欠である。
DITTO-2(Distilled Diffusion Inference-Time T-Optimization)を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:40:11 GMT)
Distribution Aligned Semantics Adaption for Lifelong Person Re-Identification [43.3] Re-IDシステムは、空間と時間の変化に適応する必要がある。
LReID(Lifelong person Re-IDentification)メソッドは、古いドメインからの例証の再生と、古いモデルでロジットに知識蒸留を適用することに依存している。
多様な歩行者画像に基づいて大規模に訓練されたRe-IDモデルは、堅牢で一般的な人間の意味知識を得ることができると論じる。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:15:38 GMT)
CLAY: A Controllable Large-scale Generative Model for Creating High-quality 3D Assets [43.3] CLAYは、人間の想像力を複雑な3Dデジタル構造に変換するために設計された3D幾何学および材料生成装置である。
中心となるのは、多解像度変分オートエンコーダ(VAE)と最小遅延拡散変換器(DiT)からなる大規模生成モデルである。
我々はCLAYを、スケッチ的な概念設計から複雑な詳細を持つ生産可能な資産まで、様々な制御可能な3Dアセット作成に活用することを実証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:57:36 GMT)
Fully Test-Time Adaptation for Monocular 3D Object Detection [43.2] モノクロ3Dオブジェクト検出(Mono 3Det)は、単一のRGB画像から3Dオブジェクトを識別することを目的としている。
既存の手法では、トレーニングとテストデータが同じ分布に従っていると仮定することが多いが、実際のテストシナリオでは適用できないことがある。
フルテストタイム適応(Fully Test-time Adaptation)と呼ばれるMono 3Detの新しい適応パラダイムについて検討する。
トレーニングデータやテストラベルにアクセスせずに、テスト時に潜在的なデータ分散シフトを処理して、ラベルのないテストデータに十分にトレーニングされたモデルを適用することを目指している。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:37:57 GMT)
One QuantLLM for ALL: Fine-tuning Quantized LLMs Once for Efficient Deployments [43.1] 大規模言語モデル(LLM)は急速に進歩しているが、かなりのメモリ需要に直面している。
現在の方法では、量子化損失によるパフォーマンス劣化を軽減するために、通常、長いトレーニングが必要です。
我々は、一度限りのフレームワークを大規模言語モデルに拡張する最初の試みを行っている。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:05:15 GMT)
A Point-Neighborhood Learning Framework for Nasal Endoscope Image Segmentation [43.0] 本稿では,PNL(Point-Neighborhood Learning)フレームワークという,弱い半教師付き手法を提案する。
注釈付き点を囲む画素の先行をマイニングするために、単点アノテーションを点近傍と呼ばれる円形領域に変換する。
本手法はセグメンテーションネットワークの構造を変えることなく性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:25:25 GMT)
Sibyl: Sensible Empathetic Dialogue Generation with Visionary Commonsense Knowledge [42.9] 視覚コモンセンス知識を用いた感性共感対話生成(Sibyl)という革新的なフレームワークを提案する。
差し迫った対話の未来に集中するために設計されたこのパラダイムは、LLMを会話の暗黙の要求に向ける。
実験結果から,LLMにコモンセンス知識を習得するためのパラダイムを取り入れることで,その応答の質を総合的に向上することが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:18:20 GMT)
Fourier Controller Networks for Real-Time Decision-Making in Embodied Learning [42.9] 本稿では,周波数領域の新たな視点からタスクについて検討する。
まず、ロボットの軌道の周波数領域におけるエネルギー密度は、主に低周波部分に集中していることを確認する。
本稿では、短時間フーリエ変換(STFT)を用いて、時間変化の特徴を抽出しエンコードする新しいネットワークであるFCNetを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:43:59 GMT)
Xwin-LM: Strong and Scalable Alignment Practice for LLMs [42.5] 我々は,大規模言語モデル(LLM)のためのアライメント手法の総合スイートであるXwin-LMを提案する。
このスイートには、教師付き微調整(SFT)、報酬モデリング(RM)、拒絶サンプリング微調整(RS)、直接選好最適化(DPO)など、いくつかの重要な技術が含まれている。
AlpacaEval と MT-bench の評価は,パイプライン全体において一貫した,重要な改善点を示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:31 GMT)
Robo-Instruct: Simulator-Augmented Instruction Alignment For Finetuning CodeLLMs [42.3] 本稿では,シミュレータによるチェックの正確性を提供しながら,自己指示の多様性を促進するRobo-Instructを紹介する。
Robo-Instructは、小さなオープンウェイトモデルのみを使用してトレーニングデータセットを生成することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:47:54 GMT)
PrivLM-Bench: A Multi-level Privacy Evaluation Benchmark for Language Models [42.2] 言語モデル(LM)のプライバシー漏洩を評価するベンチマークであるPrivLM-Benchを提案する。
DPパラメータのみを報告するのではなく、PrivLM-Benchは実際の使用中に無視された推論データのプライバシに光を当てる。
メインストリームLMのためのGLUEの3つのデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:56:56 GMT)
Contextual Position Encoding: Learning to Count What's Important [42.0] 我々は,新しい位置符号化手法であるコンテキスト位置フロップ(CoPE)を提案する。
CoPEは、モデルによって決定された特定のトークンに位置を増すことによって、状況に応じて位置を条件付けることができる。
一般的な位置埋め込みが失敗するFlip-Flopタスクにおいて,CoPEが選択的コピー,カウント,Flip-Flopタスクを解くことができることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:51:53 GMT)
Large Language Models as Zero-shot Dialogue State Tracker through Function Calling [42.0] 本稿では,大言語モデル(LLM)を用いた対話状態追跡の関数呼び出しによる解法を提案する。
この方法はゼロショットDSTを改善し、広範囲のデータ収集やモデルチューニングなしに多様なドメインに適応できる。
提案手法は,オープン・ソースとプロプライエタリ・LLMの両面において,極めて優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:19:54 GMT)
Fair Machine Learning for Healthcare Requires Recognizing the Intersectionality of Sociodemographic Factors, a Case Study [41.9] 社会経済状態(SES)は、健康上の不平等を制御するための機械学習モデルに一般的に含まれている。
交差する枠組みでは、患者SES、人種、性別が大きな相互作用を持つことが判明した。
SESの増加は、アフリカ系アメリカ人で統合失調症の診断を受ける確率が高いことに関連している。
高いSESは、白人におけるSCZ診断の保護因子として機能する。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:10:35 GMT)
SpecDec++: Boosting Speculative Decoding via Adaptive Candidate Lengths [41.9] SpecDec++は投機的デコードの拡張版で、ハエの候補長を適応的に決定する。
SpecDec++を実装し,llama-2-chat 7Bと70Bモデルペアに適用する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:49:38 GMT)
WebUOT-1M: Advancing Deep Underwater Object Tracking with A Million-Scale Benchmark [41.6] WebUOT-1Mは、複雑で現実的な水中環境から得られた、これまでで最大のUOTベンチマークである。
408のターゲットカテゴリからフィルタリングされた1500のビデオクリップに11万のフレームがあり、そのほとんどが以前のUTTデータセットを上回っている。
WebUOT-1Mには、ビデオシーケンスのための言語プロンプトが含まれており、アプリケーション領域を拡大している。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:25:21 GMT)
Single-loop Stochastic Algorithms for Difference of Max-Structured Weakly Convex Functions [41.4] 非滑らかな非漸近公正問題のクラスを$min_x[yin Yphi(x, y) - max_zin Zpsix(x, z)]$の形で示す。
本稿では,これらの問題を解く最初の方法であるエンベロープ近似勾配SMAGを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:46:44 GMT)
An Efficient and Multi-private Key Secure Aggregation for Federated Learning [41.3] フェデレート学習のための効率的かつ多目的な鍵セキュアアグリゲーション手法を提案する。
具体的には、変種ElGamal暗号を巧みに修正し、同型加算演算を実現する。
高次元深層モデルパラメータに対しては,多次元データを1次元に圧縮する超増進シーケンスを導入する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:46:34 GMT)
TS-Align: A Teacher-Student Collaborative Framework for Scalable Iterative Finetuning of Large Language Models [41.2] TS-Align"フレームワークは、その出力から自動的に抽出されるペアのフィードバックデータを使用してポリシーモデルを微調整する。
最終調整方針は, 平均勝利率69.7%で基本方針モデルを上回っていることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:17:40 GMT)
Contextual Counting: A Mechanistic Study of Transformers on a Quantitative Task [40.9] 本稿では,トランスフォーマーの理解を深めるための新しい玩具問題である文脈カウントタスクを紹介する。
因果的および非因果的トランスフォーマーアーキテクチャを用いた理論的および経験的解析を行った。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:52:23 GMT)
MotionLLM: Understanding Human Behaviors from Human Motions and Videos [40.1] この研究は、人間の行動理解の多様性(ビデオと運動のモダリティ)の領域を掘り下げる。
我々は、人間の動作理解、キャプション、推論のためのフレームワークであるMotionLLMを紹介する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:50 GMT)
Encoding and Controlling Global Semantics for Long-form Video Question Answering [40.1] 我々は、ビデオのグローバルなセマンティクスを効率的に統合するために、状態空間層(SSL)をマルチモーダルトランスフォーマーに導入する。
私たちのSSLには、グローバルなセマンティクスから視覚表現へのフローを制御可能にするゲーティングユニットが含まれています。
長大なビデオQA能力を評価するため,Ego-QAとMAD-QAの2つの新しいベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:10:10 GMT)
NoiseBoost: Alleviating Hallucination with Noise Perturbation for Multimodal Large Language Models [40.1] NoiseBoostは、人間の評価により、密度のキャプション精度を8.1%向上させる。
NoiseBoostは先駆的にMLLMの半教師付き学習を可能にし、ラベルなしデータのパワーを解放する。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:11:27 GMT)
OLLIE: Imitation Learning from Offline Pretraining to Online Finetuning [40.1] 本研究では,静的な実演データから模倣ポリシーを事前学習し,高速な微調整を行うオフライン・オンライン・イミテーション学習(IL)について検討する。
我々は, ほぼ専門的なポリシーを同時に学習する, $textttOLLIE$ という原則付きオフライン IL 手法を提案する。
経験的に、$textttOLLIE$は、$textbf20$チャレンジタスクのベースラインメソッドを一貫して大幅に上回ります。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:11:46 GMT)
SMPLX-Lite: A Realistic and Drivable Avatar Benchmark with Rich Geometry and Texture Annotations [39.7] SMPLX-Liteデータセットは,多視点RGBシーケンス,キーポイントアノテーション,テクスチャ化されたメッシュ,テクスチャ化されたSMPLX-Lite-Dモデルを備えた,最も包括的な衣料アバターデータセットである。
SMPLX-Liteデータセットを用いて、人間のポーズと顔のキーポイントを入力として、条件付き変分オートエンコーダモデルを訓練し、フォトリアリスティックドライビング可能な人間のアバターを生成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:53:39 GMT)
Similarity is Not All You Need: Endowing Retrieval Augmented Generation with Multi Layered Thoughts [39.5] 我々は、類似性は必ずしもパナセアではなく、類似性に完全に依存することは、時として検索拡張生成の性能を低下させるであろうと論じている。
我々はMulti layEred ThoughtsEnhanced Retrieval Augmented GenerationフレームワークであるMetRagを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:50:38 GMT)
Domain Adaptation with Cauchy-Schwarz Divergence [39.4] 教師なし領域適応(UDA)問題にコーシー=シュワルツの発散を導入する。
CS発散は、Kulback-Leibler発散よりも理論上より厳密な一般化誤差を提供する。
距離距離測定および対角訓練に基づくUDAフレームワークにおいて,CSのばらつきが有用であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:01:12 GMT)
Ensemble Learning for Heterogeneous Large Language Models with Deep Parallel Collaboration [39.4] 大規模言語モデル(LLM)は様々なタスクにおいて補完的な強みを示し、LLMアンサンブルの研究を動機付けている。
本稿では,各復号ステップで異なるLLMから得られる情報的確率分布を融合した学習自由アンサンブルフレームワークDeePEnを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:59:56 GMT)
WaveCastNet: An AI-enabled Wavefield Forecasting Framework for Earthquake Early Warning [39.4] 本稿では,大地震の震動を予測するための新しいAI対応フレームワークWaveCastNetを提案する。
WaveCastNetは、新しい畳み込み長表現型メモリ(ConvLEM)モデルをシーケンスからシーケンスへの予測フレームワーク(seq2seq)に統合する。
サンフランシスコ・ベイエリアのシミュレーションデータを用いて, 地震動の強度とタイミングを迅速に予測できることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:18:16 GMT)
How to Leverage Diverse Demonstrations in Offline Imitation Learning [39.2] 不完全な実演を伴うオフライン模倣学習(IL)は、専門家データの不足により注目を集めている。
本稿では, 結果の状態に基づいて正の挙動を識別する, 単純で効果的なデータ選択手法を提案する。
次に、専門家と選択したデータを正しく活用できる軽量な行動クローニングアルゴリズムを考案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:15:09 GMT)
Hypothesis Search: Inductive Reasoning with Language Models [39.0] 最近の研究は「文脈学習」を直接促すことで帰納的推論タスクにおける大規模言語モデルの評価を行っている
これは単純な帰納的タスクではうまく機能するが、Abstraction and Reasoning Corpus (ARC)のような複雑なタスクではうまく機能しない。
本研究では,複数の抽象レベルで明示的な仮説を生成することにより,LLMの帰納的推論能力を向上させることを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:10:00 GMT)
Unsupervised Mutual Learning of Dialogue Discourse Parsing and Topic Segmentation [39.0] 修辞構造とトピック構造は、主に別々にモデル化されるか、または以前の作業で他方を補助する。
本稿では,グローバル・ローカル・コネクティビティを活用した2つの構造物の教師なし相互学習フレームワークを提案する。
また、局所コヒーレンス整合性を確保するために、グラフニューラルネットワークモデルを用いて、レトリック構造をトピック構造に組み込む。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:10:50 GMT)
EMS: Efficient and Effective Massively Multilingual Sentence Embedding Learning [38.9] 我々は,クロスリンガルトークンレベル再構築(XTR)と文レベルのコントラスト学習を訓練目的として,効率的で効果的な多言語文埋め込み(EMS)を導入する。
関連する研究と比較すると,提案したモデルは,非常に少ない並列文とGPU計算資源を用いて効率的に訓練することができる。
我々は、62言語をサポートするモデルトレーニング用コードと、EMS事前訓練文埋め込みモデルをリリースする。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:40:52 GMT)
DeMamba: AI-Generated Video Detection on Million-Scale GenVideo Benchmark [38.6] 我々は,AIが生成した最初のビデオ検出データセットであるGenVideoを紹介する。
大量のビデオがあり、その中にはAIが生成し、実際のビデオが100万本以上含まれている。
我々はデテール・マンバ(Detail Mamba)というプラグイン・アンド・プレイ・モジュールを導入し、AI生成ビデオを特定して検出器を強化する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:36:12 GMT)
Is In-Context Learning Sufficient for Instruction Following in LLMs? [38.3] ICL とAL とのアライメントは,既存のベンチマークのインストラクションの微調整に比べてまだ不十分であることを示す。
我々は,命令微調整のギャップを埋めることなく,性能を著しく改善するICL例に対する欲求選択手法を導出する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:28:56 GMT)
Scaling White-Box Transformers for Vision [38.2] CRATEは、圧縮およびスパース表現を学習するために設計されたホワイトボックストランスフォーマーアーキテクチャである。
我々はCRATE-$alpha$を提案し、CRATEアーキテクチャ設計におけるスパースコーディングブロックの戦略的かつ最小限の修正を特徴としている。
CRATE-$alpha$は、より大きなモデルサイズとデータセットで効果的にスケールできることを示します。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:46:23 GMT)
DiffPhysBA: Diffusion-based Physical Backdoor Attack against Person Re-Identification in Real-World [37.8] 個人再識別システム(ReID)は、バックドア攻撃による重大なセキュリティリスクを引き起こし、敵の追跡や不正行為を回避する。
本稿では、ReIDモデルがデジタルドメインで収集されたデータに基づいて訓練され、物理的環境に展開される実際のシナリオにおいて、バックドア攻撃がどのように展開されるかを検討する。
本稿では, トレーニング不要な類似性誘導サンプリングプロセスを採用し, 生成したトリガと物理トリガの類似性を高める新しい拡散型物理バックドアアタック(DiffPhysBA)手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:22:06 GMT)
Decoherence-assisted quantum key distribution [37.7] 本手法により, BB84プロトコルで盗聴者が取得できる情報量を削減することができることを示す。
我々はAliceとBobが量子ビット誤り率の低い値を与えるスキームに合意できることを実験的に実証した。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:28:07 GMT)
C$^{3}$Bench: A Comprehensive Classical Chinese Understanding Benchmark for Large Language Models [37.4] 古典中国語理解(CCU)は、中国の卓越した文化の保存と探索に重要な価値を持っている。
大規模言語モデル(LLM)のCCU機能を評価するための包括的なベンチマークはない。
C$3$benchは、分類、検索、名前付きエンティティ認識、句読点、翻訳を含む5つの主要なCCUタスクに対して50,000のテキストペアで構成されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:32:05 GMT)
Large Language Models Can Self-Improve At Web Agent Tasks [37.2] 大規模言語モデル(LLM)は、ゼロショットまたは少数ショットの方法でエージェントとして新しい環境をナビゲートする機能を最近デモした。
WebArena ベンチマークを用いて,LLM が長期タスクにおけるエージェントとしての性能を自己向上する方法について検討した。
自己改善手順により,WebArenaベンチマークのベースモデルよりもタスク完了率を31%向上させる。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:52:36 GMT)
Dirichlet Flow Matching with Applications to DNA Sequence Design [37.1] 確率経路としてのディリクレ分布の混合に基づいて, 単純度に基づくディリクレフローマッチングを開発する。
蒸留したディリクレフローマッチングにより,最小性能で一段階のシーケンス生成が可能となる。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:09:41 GMT)
Eclipse Qrisp QAOA: description and preliminary comparison with Qiskit counterparts [36.9] 本稿では,高レベルの量子プログラミング言語であるEclipse Qrispのプレゼンテーションと評価に焦点をあてる。
我々はこの効率を計測し、IBMのQiskitツールキットを用いて2つの代替QAOAアルゴリズムの実装と比較する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:44:28 GMT)
4DHands: Reconstructing Interactive Hands in 4D with Transformers [36.0] 4DHandsは,対話型ハンドメッシュとそのモノクラー入力からの相対移動を回復するための頑健なアプローチである。
我々は新しいトークン化と機能融合戦略を備えたトランスフォーマーベースのアーキテクチャを開発する。
提案手法の有効性を,いくつかのベンチマークデータセットで検証した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:02 GMT)
From Zero to Hero: Cold-Start Anomaly Detection [35.9] 本稿では,ゼロショット誘導を用いた異常検出モデルを用いて,現実的だが過度に探索されたコールドスタート設定について検討する。
我々は,ゼロショット異常検知器を汚染された観測に効果的に適応させる手法であるColdFusionを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:51 GMT)
A Simple and Adaptive Learning Rate for FTRL in Online Learning with Minimax Regret of $Θ(T^{2/3})$ and its Application to Best-of-Both-Worlds [35.9] FTRL(Follow-the-Regularized-Leader)は、さまざまなオンライン学習問題の強力なフレームワークである。
Theta(T2/3)$のミニマックスを後悔する問題に対する適応学習率フレームワークを導入する。
学習率とTsallisエントロピー正規化器によるFTRLは,既存のBest-of-BothWorlds(BOBW)の上界を悪化させることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:13:12 GMT)
KITRO: Refining Human Mesh by 2D Clues and Kinematic-tree Rotation [35.7] KITRO(Kinematic-Tree Rotation)は,深度と人体木構造を明示的にモデル化したメッシュ改良戦略である。
各種データセットおよびベースラインモデルを用いた実験により,KITROは3次元関節推定精度を大幅に向上し,同時に理想的な2次元適合性が得られることが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:44:12 GMT)
Facilitating Human-LLM Collaboration through Factuality Scores and Source Attributions [35.5] 人間はますます大きな言語モデル(LLM)に依存している
LLMは「幻覚」としても知られる不正確な情報や偽の情報を生成する可能性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:23:14 GMT)
GaussianHead: High-fidelity Head Avatars with Learnable Gaussian Derivation [35.4] 本稿では, 異方性3次元ガウスモデルを用いて, 動作する人間の頭部をモデル化する枠組みを提案する。
実験では,高忠実度レンダリング,再現における最先端のアプローチ,クロスアイデンティティの再現,新しいビュー合成タスクを実現できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:19:25 GMT)
On the Limits of Multi-modal Meta-Learning with Auxiliary Task Modulation Using Conditional Batch Normalization [35.4] 少ないショット学習は、新しいタスクに対処できる表現を学習することを目的としている。
近年の研究では、クロスモーダル学習は、数発の分類において表現を改善することが示されている。
言語は豊かなモダリティであり、視覚的な学習を導くのに使うことができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:13:05 GMT)
A Setwise Approach for Effective and Highly Efficient Zero-shot Ranking with Large Language Models [35.2] 本稿では,Large Language Models (LLMs) に基づくゼロショット文書ランキング手法を提案する。
我々のアプローチは、LLMベースのゼロショットランキング(ポイントワイズ、ペアワイズ、リストワイズ)の既存のプロンプトアプローチを補完する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:03:27 GMT)
Visual Perception by Large Language Model's Weights [34.3] 本稿では,視覚情報をモデル重みとして表現するパラメータ空間アライメントパラダイムを提案する。
各入力画像に対して、視覚的特徴を抽出し、特徴を知覚重みに変換し、知覚重みとLLMの重みをマージする視覚エンコーダを用いる。
このようにして、LLMの入力は視覚トークンを必要としないため、入力シーケンスの長さが小さくなり、効率が大幅に向上する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:47 GMT)
Cavity-Enhanced Emission and Absorption of Color Centers in a Diamond Membrane With Selectable Strain [34.0] ダイヤモンド中のIV族色中心は最も有望な光学活性スピン系である。
単結晶ダイヤモンド膜における誘起ひずみにより, 基底状態の分裂を最大で1等級に増大させる。
パーセルによるエミッター寿命の1ns未満の2倍の減少と合わせて、この系は4Kの適度な温度で有望なスピン光子界面となる。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:08:13 GMT)
Sharp Rates in Dependent Learning Theory: Avoiding Sample Size Deflation for the Square Loss [33.2] L2$ と $Psi_p$ の位相が我々の仮説クラス $mathscrF$, $mathscrF$ に同値であるときにいつでも、$mathscrF$ は弱準ガウス類であることを示す。
以上の結果から, 混合への直接的な依存は高次項に還元されるため, この問題は実現可能か否かを判断できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:54:02 GMT)
Texture-guided Coding for Deep Features [33.1] 本稿では,特徴とテクスチャを考察し,その特徴に基づくテクスチャ誘導型特徴圧縮戦略を提案する。
この戦略は、特徴層とテクスチャ層から構成されており、特徴層は、特徴選択モジュールと特徴再構成ネットワークを含む、マシンを提供する。
テクスチャ画像の助けを借りて、視覚的なタスクに関連するチャンネルを選択的に圧縮し、送信し、特徴データを低減し、マシンに高品質な機能を提供する。
本手法は,テクスチャの特徴と特徴をフル活用し,特徴冗長性を排除し,人間の高品質なプレビュー画像を再構成し,意思決定を支援する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:38:44 GMT)
Hallucination-Free? Assessing the Reliability of Leading AI Legal Research Tools [32.8] 本稿では,AI駆動型法律研究ツールの事前登録による実証評価について報告する。
LexisNexis(Lexis+ AI)とThomson Reuters(Westlaw AI-Assisted ResearchとAsk Practical Law AI)によるAI研究ツールは、それぞれ17%から33%の時間で幻覚化している。
それは、AIのアウトプットを監督し検証する法的専門家の責任を知らせる証拠を提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:56:05 GMT)
Breaking the False Sense of Security in Backdoor Defense through Re-Activation Attack [32.7] 防衛後のバックドアモデルの特徴を再検討する。
既存の訓練後防衛戦略から派生した防衛モデルには,元のバックドアが現存していることが判明した。
我々は,これらの休眠バックドアを推論中に簡単に再活性化できることを実証的に示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:45:11 GMT)
Enhancing Multimodal Large Language Models with Vision Detection Models: An Empirical Study [32.6] 本稿では,SOTA(State-of-the-art Object Detection)モデルとOCR(Optical Character Recognition)モデルを用いてMLLMの高機能化に関する実証的研究を行った。
LLaVA-1.5, DINO, PaddleOCRv2, Grounding DINOなどの代表モデルを用いて, 系統的および広範囲な実験を行った。
強化されたLLaVA-1.5は、オリジナルの7B/13Bモデルを10ベンチマークすべてで上回り、正規化平均スコアで最大12.5%向上した。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:09:49 GMT)
Multi-View Spectrogram Transformer for Respiratory Sound Classification [32.3] 視覚変換器に時間周波数特性の異なるビューを埋め込むために、MVST(Multi-View Spectrogram Transformer)を提案する。
ICBHIデータセットによる実験結果から,提案したMVSTは呼吸音の分類方法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:42:03 GMT)
Puff-Net: Efficient Style Transfer with Pure Content and Style Feature Fusion Network [32.1] スタイル転送は、オリジナルの構造を維持しながら、スタイルイメージの芸術的な特徴で画像をレンダリングすることを目的としている。
CNNベースの手法では、入力画像間の大域的情報と長距離依存関係を扱うことは困難である。
我々はPuff-Netと呼ばれる新しいネットワーク、すなわち純粋コンテンツとスタイルの機能融合ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:41:07 GMT)
Gated Fields: Learning Scene Reconstruction from Gated Videos [32.0] ゲーテッド・フィールズ(Gated Fields)は、能動ゲートビデオシーケンスを利用するニューラルシーン再構成法である。
本手法は, ゲート映像の固有深度を生かし, 周囲の照明条件によらず, 精密かつ高密度な幾何再構成を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:26:47 GMT)
Data-Efficient 3D Visual Grounding via Order-Aware Referring [32.0] 3Dビジュアルグラウンドティングは、自然言語記述によって参照される3Dポイントクラウドシーン内でターゲットオブジェクトを特定することを目的としている。
我々は、注文認識参照を介して、新しいデータ効率のよい3DビジュアルグラウンドフレームワークであるVigorを紹介した。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:42:26 GMT)
Exploring Key Factors for Long-Term Vessel Incident Risk Prediction [31.8] 本研究の目的は、特定の日付スタンプが与えられた後年における事故リスクレベルを予測するための重要な要因を掘り下げることである。
事故リスクに影響を及ぼす可能性のある要因の大多数は、最大5年間にわたる船舶の過去の安全性能データから収集されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:12:51 GMT)
Graph as Point Set [31.4] 本稿では,相互接続ノードを独立点の集合に変換するグラフ・ツー・セット変換法を提案する。
これにより、セットエンコーダを使用してグラフから学習することが可能になり、グラフニューラルネットワークの設計空間が大幅に拡張される。
提案手法の有効性を示すために,グラフから変換された点集合を入力として受け入れる変換器アーキテクチャであるPoint Set Transformer (PST)を導入する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:44:49 GMT)
PV-Tuning: Beyond Straight-Through Estimation for Extreme LLM Compression [31.3] 最先端の量子化手法には、限られたキャリブレーションデータに対する圧縮パラメータの微調整(一部)が含まれる。
既存の微調整戦略を一般化し改善する表現に依存しないフレームワークであるPV-Tuningを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:01:49 GMT)
Language Models Need Inductive Biases to Count Inductively [31.3] カウントは一般化の基本的な例であり、ペアノの公理の数学的レンズを通して見るか、数えることを学ぶ子供たちのための認知科学文献を見るかのどちらかである。
この研究は、数えられるようなトレーニング言語モデルに関する広範な経験的な結果を提供する。
従来のRNNは帰納的カウントを自明に達成するが、トランスフォーマーはドメイン外カウントに位置埋め込みを頼らなければならない。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:10:37 GMT)
Universal Online Convex Optimization with $1$ Projection per Round [31.2] 我々は,複数種類の凸関数に対して同時にミニマックスレートを得るユニバーサルアルゴリズムを開発した。
我々は、単純なドメイン上で定義された代理損失を用いて、1ドルのプロジェクションしか必要としない普遍的なOCOアルゴリズムを開発する。
我々の分析は、サロゲート損失に新たな光を当て、元の損失の後悔とサロゲート損失の相違点の厳密な検証を容易にする。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:29:40 GMT)
BayOTIDE: Bayesian Online Multivariate Time series Imputation with functional decomposition [31.1] 交通やエネルギーといった現実のシナリオでは、値やノイズが欠けている巨大な時系列データが広く観測され、不規則にサンプリングされる。
多くの計算法が提案されているが、そのほとんどは局所的な地平線で動作する。
ほとんど全ての手法は、観測は通常のタイムスタンプでサンプリングされ、複雑な不規則なサンプル時系列を扱うことができないと仮定する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:50:32 GMT)
Federated Fine-tuning of Large Language Models under Heterogeneous Tasks and Client Resources [31.0] 大規模言語モデル(LLM)のパラメータ効率の高い微調整には、最近FL(Federated Learning)が適用されている。
本研究では,LLMファインチューニングのための簡易かつ効果的なアグリゲーションスキームFlexLoRAを紹介する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:46:10 GMT)
AutoBreach: Universal and Adaptive Jailbreaking with Efficient Wordplay-Guided Optimization [31.0] 大規模言語モデル(LLM)をジェイルブレイクする新しい手法であるAutoBreachを紹介する。
ワードプレイの汎用性にインスパイアされたAutoBreachは、ワードプレイ誘導マッピングルールサンプリング戦略を使用して、敵のプロンプトを生成する。
AutoBreachは、Claude-3、GPT-3.5、GPT-4 Turboの3つのプロプライエタリなモデルと、Bingchat、GPT-4 Webの2つのLLMのWebプラットフォームを含む、様々なLLMのセキュリティ脆弱性を効果的に識別することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:38:31 GMT)
Federated Learning with Multi-resolution Model Broadcast [30.7] 連合学習では、サーバは定期的にエージェントにモデルをブロードキャストしなければならない。
この目的のために,マルチレゾリューション符号化と変調を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:45:18 GMT)
Phantom: General Trigger Attacks on Retrieval Augmented Language Generation [30.6] 我々は,被害者のRAGシステムに侵入する敵に対して,新たな攻撃面を提案する。
最初のステップは、RAGシステムによって回収されるように設計された有毒な文書を作成することである。
第2のステップでは、毒文書内の特殊に製作された敵文字列が、様々な敵攻撃を誘発する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:19:24 GMT)
TAIA: Large Language Models are Out-of-Distribution Data Learners [30.6] タスク固有の質問応答ペアの微調整は、命令調整された大規模言語モデルの性能を向上させる主要な方法である。
我々はTransformerアーキテクチャを再評価し、微調整中のパラメータ更新がダウンストリーム性能に肯定的な貢献をするわけではないことを発見した。
ulineTraining ulineAllパラメータであるが ulineAttentionのみでulineInferringを行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:57:19 GMT)
Streaming Video Diffusion: Online Video Editing with Diffusion Models [30.6] 本稿では,時間的一貫性を維持しつつ,テキストストリームフレームを編集するオンラインビデオ編集という新しいタスクを提案する。
提案モデルでは,512×512の解像度で15.2FPSのリアルタイム推論速度を実現することにより,高画質動画の編集が可能となる。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:16:33 GMT)
Chatlaw: A Multi-Agent Collaborative Legal Assistant with Knowledge Graph Enhanced Mixture-of-Experts Large Language Model [30.3] ChatlawはMixture-of-Experts(MoE)モデルとマルチエージェントシステムを利用した革新的な法的アシスタントである。
知識グラフと人工スクリーニングを組み合わせることで,MoEモデルをトレーニングするための高品質な法的データセットを構築する。
弊社のMoEモデルは,法律専門家のGPT-4とUnified Exam Qualificationをそれぞれ7.73%,11ポイントで上回っている。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:46:00 GMT)
BAN: Detecting Backdoors Activated by Adversarial Neuron Noise [30.2] ディープラーニングに対するバックドア攻撃は、最近の研究コミュニティで大きな注目を集めている脅威である。
バックドアディフェンスは主にバックドアのインバージョンに基づいており、これは汎用的でモデルに依存しず、実用的な脅威シナリオに適用可能であることが示されている。
本稿では、追加のニューロンアクティベーション情報を導入して、バックドア検出のためのバックドア特徴インバージョンを改善する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:44:45 GMT)
Reconstruction Attacks on Machine Unlearning: Simple Models are Vulnerable [30.2] 線形回帰モデルから削除したデータポイントに対して、ほぼ完璧な攻撃をマウントする方法を示す。
我々の研究は、個人がモデルからデータの削除を要求できる非常に単純なモデルクラスであっても、プライバシリスクが重要であることを強調している。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:27:44 GMT)
A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspective [30.0] 本稿では,オフライン学習におけるアドバンテージ・アウェア政策最適化(A2PO)手法を提案する。
A2POは条件付き変分自動エンコーダを用いて、絡み合った行動ポリシーの動作分布をアンタングルする。
D4RLベンチマークの単一品質データセットと混合品質データセットの両方で実施された実験では、A2POがA2POよりも優れた結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:04:42 GMT)
Harmonic Self-Conditioned Flow Matching for Multi-Ligand Docking and Binding Site Design [30.0] FlowSiteはこのフローモデルを拡張して、タンパク質ポケットの離散残基タイプと分子の結合3D構造を共同で生成する。
HarmonicFlowは, ドッキングの簡易性, 汎用性, 平均試料品質の向上を図っている。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:04:39 GMT)
Characterizing Data Point Vulnerability via Average-Case Robustness [29.9] 対向ロバスト性は標準的なフレームワークであり、二眼レフを通して予測のロバスト性を見る。
我々は、局所的な点数を測定する平均ケースロバストネスと呼ばれる、ロバストネスの相補的な枠組みを考察する。
従来のディープラーニングモデルでは,推定値が正確かつ効率的であることを実証的に示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:33:55 GMT)
Beyond the Answers: Reviewing the Rationality of Multiple Choice Question Answering for the Evaluation of Large Language Models [29.2] 本研究では,大規模言語モデル(LLM)の評価手法として,MCQA(Multiple Choice Question Answering)の限界について検討する。
本稿では,モデルの性能をより正確に反映できるMCQ(Multiple-Choice Questions, MCQA+)のデータセット拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:57:14 GMT)
Efficient LLM-Jailbreaking by Introducing Visual Modality [28.9] 本稿では,大規模言語モデル(LLM)に対するジェイルブレイク攻撃に焦点を当てた。
我々のアプローチは、ターゲットのLLMに視覚モジュールを組み込むことで、MLLM(Multimodal large language model)を構築することから始まる。
我々は, EmbJS をテキスト空間に変換し, ターゲット LLM のジェイルブレイクを容易にする。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:50:32 GMT)
Unique3D: High-Quality and Efficient 3D Mesh Generation from a Single Image [28.8] Unique3Dは、シングルビュー画像から高品質な3Dメッシュを効率的に生成するための、新しい画像間3Dフレームワークである。
我々のフレームワークは、最先端世代の忠実さと強力な一般化性を備えている。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:54 GMT)
A Joint Study of Phrase Grounding and Task Performance in Vision and Language Models [28.7] 視覚的文脈における自然言語の推論を必要とするタスクの鍵は、言葉とフレーズを画像領域に接地することである。
本稿では,タスクのパフォーマンスとフレーズのグラウンド化を共同で研究する枠組みを提案する。
地中表現アノテーションのブルートフォーストレーニングを通じてこの問題に対処する方法を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:16:29 GMT)
Learning to Discuss Strategically: A Case Study on One Night Ultimate Werewolf [28.6] 有名なコミュニケーションゲーム『Werewolf』の変種として、One Night Ultimate Werewolf (ONUW) はプレイヤーが戦略的な議論ポリシーを開発する必要がある。
本稿では、強化学習(RL)によって訓練された議論政策を用いて、適切な議論手法を採用するためのRL命令言語エージェントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:07:06 GMT)
AnalogCoder: Analog Circuit Design via Training-Free Code Generation [28.4] 本稿では,アナログ回路を設計するための訓練不要なLarge Language ModelsエージェントであるAnalogCoderを紹介する。
フィードバック強化フローとドメイン固有のプロンプトが組み込まれており、アナログ回路の自動化および自己修正設計を可能にする。
20個の回路を設計し、標準のGPT-4oより5個多く設計した。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:04:44 GMT)
PiVe: Prompting with Iterative Verification Improving Graph-based Generative Capability of LLMs [28.3] 大規模言語モデルの出力の検証モジュールとして機能するために,小言語モデルをいかに訓練するかを示す。
また,検証モジュールがテキスト・ツー・グラフ生成タスクに対して,よりコスト効率のよいソリューションのために,繰り返し修正をオフラインで適用できることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:23:24 GMT)
Text Guided Image Editing with Automatic Concept Locating and Forgetting [27.7] 画像中の潜在的なターゲット概念を特定するために,Locate and Forget (LaF) と呼ばれる新しい手法を提案する。
本手法はベースラインと比較して,テキスト誘導画像編集作業において質的かつ定量的に優位性を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:36:32 GMT)
FTS: A Framework to Find a Faithful TimeSieve [27.5] 本稿では,TimeSieveにおける不信の識別と修正を目的とした新しいフレームワークを提案する。
我々のフレームワークはモデルの安定性とレジリエンスを高めるために設計されており、その出力が上記の要因の影響を受けないようにしている。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:59:49 GMT)
Near Optimal Decentralized Optimization with Compression and Momentum Tracking [27.5] MoTEFは,Momentum Tracking と Error Feedback との通信を統合する新しい手法である。
我々の分析は、MoTEFが所望のプロパティの大部分と、データの下でかなり既存のメソッドを統合することを実証している。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:51:57 GMT)
Estimating before Debiasing: A Bayesian Approach to Detaching Prior Bias in Federated Semi-Supervised Learning [27.2] Federated Semi-Supervised Learning (FSSL)は、クライアント上のラベル付きデータとラベルなしデータの両方を活用して、モデルを協調的にトレーニングする。
FSSLでは、異種データがモデルに予測バイアスを導入し、モデルの予測がある種のクラスに歪む。
既存のFSSLメソッドは、主にモデルパラメータや出力の一貫性を強化することでこの問題に対処する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:58:01 GMT)
Evaluating Large Language Model Biases in Persona-Steered Generation [26.9] 大規模な言語モデル (LLM) は、不連続な人格に対して、連続した人格よりも9.7%少ないことが示される。
強化学習(Reinforcement Learning from Human Feedback, RLHF)により微調整されたモデルは、特に政治的リベラル派や女性に関連するスタンスに対して、より安定している。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:06:03 GMT)
Uncertainty-aware sign language video retrieval with probability distribution modeling [26.7] 手話ビデオ検索は、聴覚障害者コミュニティの情報アクセスを促進する上で重要な役割を担っている。
我々は、新しい不確実性認識確率分布検索法(UPRet)を提案する。
How2Sign (59.1%)、ENIX-2014T (72.0%)、CSL-Daily (78.4%) の最先端結果を示す実験を行った。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:04:01 GMT)
XPrompt:Explaining Large Language Model's Generation via Joint Prompt Attribution [26.6] LLM(Large Language Models)は複雑なテキスト生成タスクにおいて顕著なパフォーマンスを示す。
生成したコンテンツに対する入力プロンプトの寄与は、まだ人間には明らかでない。
本稿では,共同プロンプト帰属型XPromptに基づく実例説明フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:16:41 GMT)
Exploring Diffusion Models' Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networks [26.4] 拡散モデル(DM)の微調整は重要な進歩であり、トレーニングコストを大幅に削減し、パーソナライズされたAIアプリケーションを可能にする。
トレーニングプロセス中、画像の忠実度は最初改善され、ノイズパターンの出現によって予期せぬ劣化が生じるが、その後、重度のオーバーフィッティングで回復する。
生成したノイズパターンを汚損段階と表現し, 実験結果から, オブジェクト駆動および主観駆動の両方で生成した画像の忠実度, 品質, 多様性を著しく低下させることが実証された。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:47:48 GMT)
PLA4D: Pixel-Level Alignments for Text-to-4D Gaussian Splatting [26.4] テキストからビデオまでのフレームを明示的なピクセルアライメントターゲットとして、静的な3Dオブジェクトを生成し、それらにモーションを注入する。
textbfPLA4Dは、テキストからビデオまでのフレームを明示的なピクセルアライメントターゲットとして利用し、静的な3Dオブジェクトを生成し、それらに動きを注入する新しい手法である。
PLA4Dはオープンソースモデルで完全に実装されており、4Dデジタルコンテンツ作成のためのアクセス可能でユーザフレンドリで有望な方向性を提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:23:01 GMT)
Joint Selective State Space Model and Detrending for Robust Time Series Anomaly Detection [25.6] 深層学習に基づくシーケンスモデルは時系列異常検出タスクに広く利用されている。
TSADの能力は、(i)長距離依存をモデル化する能力と(ii)非定常データの存在下での一般化問題という2つの主要な課題によって制限されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:31:18 GMT)
Learning Discriminative Dynamics with Label Corruption for Noisy Label Detection [25.6] トレーニング信号のダイナミクスに基づいて,誤ラベル付きインスタンスと正しくラベル付けされたインスタンスを識別するDynaCorフレームワークを提案する。
我々の総合的な実験により、DynaCorは最先端のライバルより優れており、様々なノイズタイプやノイズレートに対して強い堅牢性を示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:06:06 GMT)
Divide-and-Conquer Meets Consensus: Unleashing the Power of Functions in Code Generation [25.3] FunCoderは、機能的なコンセンサスに分割と参照の戦略を取り入れたコード生成フレームワークである。
FunCoderは、HumanEval、MBPP、xCodeEval、MATHにおいて、GPT-3.5とGPT-4で、最先端のメソッドを平均で+9.8%上回る。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:31:33 GMT)
An Empirical Study of Training State-of-the-Art LiDAR Segmentation Models [25.3] MMDetection3D-lidarsegは、最先端LiDARセグメンテーションモデルの効率的なトレーニングと評価のための包括的なツールボックスである。
我々は、幅広いセグメンテーションモデルをサポートし、堅牢性と効率を高めるために高度なデータ拡張技術を統合する。
統一されたフレームワークを育むことで、MMDetection3D-lidarsegは開発とベンチマークを合理化し、研究とアプリケーションのための新しい標準を設定します。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:23:21 GMT)
Video-Language Critic: Transferable Reward Functions for Language-Conditioned Robotics [25.2] Video-Language Criticは、簡単に利用可能なクロスボディデータに基づいてトレーニングできる報酬モデルである。
我々のモデルは、スパース報酬のみよりもメタワールドタスクにおける2倍のサンプル効率のポリシートレーニングを可能にします。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:18:06 GMT)
Differentially Private Data Generation with Missing Data [25.2] 我々は、差分プライバシー(DP)合成データの問題点を、欠落した値で定式化する。
本稿では,合成データの有効性を大幅に向上させる3つの効果的な適応戦略を提案する。
全体として、この研究は、プライベートな合成データ生成アルゴリズムを使用する際の課題と機会をより深く理解することに貢献している。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:38:24 GMT)
CL-MRI: Self-Supervised Contrastive Learning to Improve the Accuracy of Undersampled MRI Reconstruction [25.1] コントラスト学習を用いた自己教師付き事前訓練手法を導入し,MRI画像再構成の精度を向上する。
本実験は, 各種加速度因子およびデータセットの再構成精度の向上を実証した。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:18:44 GMT)
Better Generalization with Semantic IDs: A Case Study in Ranking for Recommendations [25.0] 本稿では、ランダムIDの代替としてコンテンツ由来の特徴を用いることを提案する。
我々は、ID機能をコンテンツベースの埋め込みに置き換えるだけで、記憶能力の低下により品質が低下することを示した。
コンテンツ埋め込みと同様に、セマンティックIDのコンパクトさはレコメンデーションモデルにおいて容易に適応できる問題を引き起こす。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:53:39 GMT)
Proof of Quality: A Costless Paradigm for Trustless Generative AI Model Inference on Blockchains [24.9] 生成AIモデルは、自然言語や画像タスクにおいて強力で破壊的な能力を示している。
これらのモデルを分散環境で展開することは 依然として困難です
ブロックチェーンアーキテクチャ上に任意の大規模な生成モデルをデプロイ可能にするために,Emphproof of Quality(PoQ)と呼ばれる新たな推論パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:26:35 GMT)
LIA: Privacy-Preserving Data Quality Evaluation in Federated Learning Using a Lazy Influence Approximation [24.9] フェデレートラーニング(Federated Learning)では、低品質、腐敗、悪意のあるデータを扱うことが不可欠である。
我々は「怠慢な影響」と呼ばれる新しい影響近似を利用した単純で効果的なアプローチを提案する。
提案手法は, 種々のシミュレーションおよび実世界の環境において, バイアスや破損したデータをフィルタすることに成功した。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:33:40 GMT)
Patchscopes: A Unifying Framework for Inspecting Hidden Representations of Language Models [24.8] 我々は、Patchscopesと呼ばれるフレームワークを導入し、LLMの計算に関する幅広い疑問にどのように答えられるかを示す。
本稿では,従来の表現を語彙空間に投影し,LLMに介入する手法の多くを,このフレームワークの例とみなすことができることを示す。
Patchscopesは、事前検査技術を統一するだけでなく、より有能なモデルを使用してより小さなモデルの表現を説明する、マルチホップ推論エラー修正などの新しい可能性も開放している。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:52:08 GMT)
Unity by Diversity: Improved Representation Learning in Multimodal VAEs [24.7] ハード制約をソフト制約に置き換えることで、より優れた潜伏表現が得られることを示す。
既存の手法と比較して、学習した潜在表現の改善と欠落したデータモダリティの計算結果を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:55:49 GMT)
Reconciling Model Multiplicity for Downstream Decision Making [24.3] 2つの予測モデルがほぼ至るところでそれぞれの予測にほぼ一致しているとしても、最も応答性の高い行動が人口のかなりの部分で相違していることが示される。
本稿では,下流決定問題と個別確率予測の両方に関して,予測モデルを校正する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:36:46 GMT)
SegICL: A Multimodal In-context Learning Framework for Enhanced Segmentation in Medical Imaging [24.3] In-Context Learning (ICL) を利用した画像セグメンテーション手法であるSegICLを紹介する。
SegICLはテキスト誘導セグメンテーションを採用し、少量のイメージマスクペアでテキスト内学習を行うことができる。
ショット供給時のセグメンテーション性能はゼロショット設定時の性能の約1.5倍である。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:35:06 GMT)
GenKubeSec: LLM-Based Kubernetes Misconfiguration Detection, Localization, Reasoning, and Remediation [24.3] KCFのミスコンフィグレーション検出のためのルールベース(RB)ツールは静的なルールセットに依存しており、本質的に制限されており、新たに発見されたミスコンフィグレーションを検出できない。
我々は,多種多様なKCFの誤設定を検出するとともに,誤設定の正確な位置を特定し,それらについて詳細な推論を行う,包括的かつ適応的なLLMベースの手法であるGenKubeSecを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:18:52 GMT)
Typography Leads Semantic Diversifying: Amplifying Adversarial Transferability across Multimodal Large Language Models [24.3] 人間の知覚できない摂動を持つ敵対的な例は、伝達可能性として知られる特徴を持っている。
本稿では,タイポグラフィに基づくセマンティックトランスファー攻撃(TSTA)を提案する。
有害な単語挿入と重要な情報保護のシナリオでは、TSTAは優れた性能を示します。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:27:20 GMT)
Beyond Imitation: Learning Key Reasoning Steps from Dual Chain-of-Thoughts in Reasoning Distillation [24.3] 我々はmistaktextbfE-textbfDriven key reasontextbfIng step distillatextbfTion (textbfEDIT)を提案する。
我々は、類似の推論経路を持つ2つのCoTsデータを生成するためのプロンプトを設計する。
実験は、ドメイン内およびドメイン外のベンチマーク推論データセットの両方でEDITの有効性を検証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:32:11 GMT)
Worse than Random? An Embarrassingly Simple Probing Evaluation of Large Multimodal Models in Medical VQA [24.1] 大規模マルチモーダルモデル(LMM)は、医用視覚質問応答(Med-VQA)の分野で著しく進歩している。
本研究は, 医学的診断問題に対するランダムな推測よりも, 簡易な探索評価を前提とした最先端モデルの方が, 精度が低いことを明らかにした。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:56:01 GMT)
Unveiling and Mitigating Backdoor Vulnerabilities based on Unlearning Weight Changes and Backdoor Activeness [23.8] クリーンなデータを学習し、プルーニングマスクを学習するアンラーニングモデルは、バックドアディフェンスに寄与している。
本研究では,重み変化と勾配ノルムの観点から,モデルアンラーニングについて検討する。
最初の段階では、観測1に基づいて、効率的なニューロン量変化(NWC)に基づくバックドア再初期化を提案する。
第2段階では、観測2に基づいて、バニラファインチューニングに代わるアクティブネス対応ファインチューニングを設計する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:41:32 GMT)
Group Robust Preference Optimization in Reward-free RLHF [23.6] そこで本研究では,大規模言語モデルと各グループの嗜好を密に整合させる新しいグループロバスト選好最適化法を提案する。
これを達成するため、GRPOは異なるグループの重要性を適応的かつ順次重み付けし、累積損失が悪化したグループを優先順位付けする。
我々は,最悪のパフォーマンス群の性能向上,グループ間の損失不均衡の低減,確率精度の向上について検討した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:50:04 GMT)
BIDER: Bridging Knowledge Inconsistency for Efficient Retrieval-Augmented LLMs via Key Supporting Evidence [23.6] 本稿では,検索文書をキー・サポート・エビデンス(Key Supporting Evidence)に洗練する手法であるBIDERを紹介する。
我々は,KSEの製作から学習してBIDERを訓練し,その出力をLLMの情報取得の好みに合わせて最大化する。
BIDER は LLM の回答品質を7% 向上させ,検索文書の入力内容長を80% 削減し,既存手法より優れていた。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:26:58 GMT)
PATIENT-Ψ: Using Large Language Models to Simulate Patients for Training Mental Health Professionals [23.5] 多くのメンタルヘルス専門家は、トレーニングと現実世界の患者との相互作用の切り離しを強調している。
本稿では,認知行動療法(CBT)トレーニングのための新しい患者シミュレーションフレームワークであるPatent-Psiを提案する。
我々は,精神保健研修生が CBT の重要なスキルを身につけるための,対話型トレーニングスキームである patient-Psi-TRAINER を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:20:56 GMT)
RIME: Robust Preference-based Reinforcement Learning with Noisy Preferences [23.4] 嗜好に基づく強化学習(PbRL)は、報酬信号として人間の嗜好を活用することにより、報酬工学の必要性を回避する。
雑音の選好から効果的な報酬学習のための頑健なPbRLアルゴリズムであるRIMEを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:24:54 GMT)
SLIDE: A Framework Integrating Small and Large Language Models for Open-Domain Dialogues Evaluation [23.2] 対話評価のためのフレームワークSLIDE(Small and Large Integrated for Dialogue Evaluation)を提案する。
本手法は, 分類タスクと評価タスクの両方において最先端のパフォーマンスを達成し, また, SLIDEは人的評価器との相関性も良好である。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:13:56 GMT)
A Structure-Aware Lane Graph Transformer Model for Vehicle Trajectory Prediction [23.1] Lane Graph Transformer (LGT)モデル。
主な貢献は、地図トポロジー構造を注意機構に符号化することである。
その結果,提案したLGTモデルにより,Argoverse 2データセット上での予測性能が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:57:16 GMT)
Preference Alignment with Flow Matching [23.0] 優先フローマッチング(PFM)は、好みに基づく強化学習(PbRL)のための新しいフレームワークである
事前訓練されたモデルの任意のクラスへの好みの統合を合理化する。
提案手法の標準PbRL目標との整合性を支持する理論的知見を提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:16:22 GMT)
FedSheafHN: Personalized Federated Learning on Graph-structured Data [22.8] 我々はFedSheafHNと呼ばれるモデルを提案し、各クライアントのローカルサブグラフをサーバ構築コラボレーショングラフに埋め込む。
我々のモデルは複雑なクライアント特性の統合と解釈を改善します。
また、高速なモデル収束と効果的な新しいクライアントの一般化も備えている。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:20:22 GMT)
CaRiNG: Learning Temporal Causal Representation under Non-Invertible Generation Process [22.7] 非可逆生成時間データのCAusal RepresentatIonを同一性保証付きで学習するための原則的アプローチを提案する。
具体的には、時間的文脈を利用して失われた潜伏情報を復元し、この理論の条件を適用してトレーニングプロセスの指導を行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:09:47 GMT)
Random Linear Projections Loss for Hyperplane-Based Optimization in Neural Networks [22.3] この研究はRandom Linear Projections (RLP)損失を導入し、これはデータ内の幾何学的関係を利用してトレーニング効率を向上させる新しいアプローチである。
ベンチマークデータセットと合成例を用いて実施した経験的評価では、従来の損失関数でトレーニングされたニューラルネットワークは、従来の損失関数でトレーニングされたニューラルネットワークよりも優れていたことが示されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:17:57 GMT)
Quest: Query-centric Data Synthesis Approach for Long-context Scaling of Large Language Model [22.1] 本稿では,クエストと略されるクエリ中心のデータ合成手法を提案する。
我々は、複数の長文ベンチマークデータセットにおいて、コンテキスト長128kまでの長文データセットを合成し、他のデータ合成方法よりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:50:55 GMT)
PertEval: Unveiling Real Knowledge Capacity of LLMs with Knowledge-Invariant Perturbations [22.0] 本稿では,大言語モデルの知識能力の詳細な探索を行うツールキットPertEvalを提案する。
PertEvalは、静的ベンチマークからオンザフライテストサンプルを生成するために、人間のような再配置技術を使用している。
PertEval は,どのベンチマークと併用しても LLM の真の知識能力を明らかにする重要なツールとして機能することを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:38:32 GMT)
On the Last-Iterate Convergence of Shuffling Gradient Methods [21.9] 対象値に関して勾配法をシャッフルする際の最終点収束率を初めて証明する。
我々の結果は、(ほぼ)既存のラストイテレートの下限と一致するか、あるいは、平均的なイテレートの前の最高の上限と同速である。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:58:52 GMT)
Quantitative Convergences of Lie Group Momentum Optimizers [21.8] 本稿では,新たに提案された2種類の離散化,リーヘビーボールとリーNAG-SCについて検討する。
Lie Heavy-Ball と Lie NAG-SC は、グループ構造の利用により、計算的に安価で実装が容易である。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:01:14 GMT)
LLMGeo: Benchmarking Large Language Models on Image Geolocation In-the-wild [21.7] 画像位置情報のためのクローズドソースおよびオープンソースマルチモーダル言語モデルの評価を行った。
その結果,クローズド・ソース・モデルは位置決め能力に優れており,オープンソース・モデルは微調整により同等の性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:57:29 GMT)
Provably Robust Cost-Sensitive Learning via Randomized Smoothing [21.7] 我々は、ロバストネス認定のためのスケーラブルなフレームワークであるランダム化スムーシングが、コスト感受性のロバストネスの認定とトレーニングに活用できるかどうかを検討する。
まず、ランダム化スムージングの標準的な認証アルゴリズムを適用して、任意のバイナリコスト行列に対して厳密な堅牢性証明を生成する方法について説明する。
そこで我々は,モデル全体の精度を維持しつつ,信頼性の高いコスト感受性を向上するためのロバストなトレーニング手法を開発した。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:37:30 GMT)
Segment, Shuffle, and Stitch: A Simple Mechanism for Improving Time-Series Representations [21.7] 本稿では,Segment, Shuffle, Stitch (S3) と呼ばれるシンプルなプラグアンドプレイ機構を提案し,時系列表現学習を改善する。
S3は、元のシーケンスから重複しないセグメントを生成し、それらを学習方法でシャッフルすることで、そのタスクに最も最適である。
その結果,S3を組み込むことで時系列分類や予測のタスクが大幅に改善され,特定のデータセットの性能が最大68%向上することがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:11:29 GMT)
Eclipse Attack Detection on a Blockchain Network as a Non-Parametric Change Detection Problem [21.6] 本稿では,ブロックチェーンネットワーク上での日食攻撃を識別する非パラメトリックな変化検出アルゴリズムを提案する。
私たちの検出器はブロックチェーン上のスマートコントラクトとして実装することができ、タンパー保護で信頼性の高いソリューションを提供します。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:09:38 GMT)
Towards RGB-NIR Cross-modality Image Registration and Beyond [21.5] 本稿では,RGB(可視)-NIR(近赤外)クロスモダリティ画像登録の領域に着目した。
まずRGB-NIR画像登録(RGB-NIR-IRegis)ベンチマークを示す。
次に、可視画像と赤外線画像の非一貫性な局所的特徴がモデル性能に与える影響を明らかにするために、いくつかの指標を設計する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:25:50 GMT)
Enhancing Low-Resource Relation Representations through Multi-View Decoupling [21.3] 本稿では,MVREという新しいプロンプトに基づく関係表現手法を提案する。
MVREは、各関係を異なる視点に分離し、多視点関係表現を包含する。
提案手法は,低リソース環境下での最先端化を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:56:51 GMT)
GNN-RAG: Graph Neural Retrieval for Large Language Model Reasoning [21.1] 本稿では,LLMの言語理解能力とGNNの推論能力を組み合わせた検索強化世代(RAG)形式の新しい手法であるGNN-RAGを紹介する。
我々のGNN-RAGフレームワークでは、GNNはグラフ情報を抽出するために高密度なサブグラフ推論器として機能する。
実験により、GNN-RAGは2つの広く使用されているKGQAベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:14:24 GMT)
Understanding and mitigating difficulties in posterior predictive evaluation [20.9] このような推定器の信号対雑音比(SNR)が極端に低いことを観察する。
本稿では,SNRの変動プロキシ上でテスト時間に最適化された提案分布を用いて,単純なMCサンプリングを重要サンプリングに置き換えることを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:50:28 GMT)
Learning Optimal Graph Filters for Clustering of Attributed Graphs [20.8] 多くの現実世界のシステムは、システム内の異なるエンティティがノードによって表現され、エッジによって相互作用するグラフとして表現することができる。
グラフィカルな構造を持つ大規模なデータセットを研究する上で重要なタスクはグラフクラスタリングである。
本稿では,FIR(Finite Impulse Response)およびARMA(Autoregressive moving Average)グラフフィルタのパラメータをクラスタリングに最適化したグラフ信号処理手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:01:41 GMT)
RTGen: Generating Region-Text Pairs for Open-Vocabulary Object Detection [20.6] オープン・ボキャブラリ・オブジェクト検出は、地域-セマンティック関係のソリッド・モデリングを必要とする。
拡張性のあるオープン語彙領域-テキストペアを生成するRTGenを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:03:23 GMT)
Generalist Equivariant Transformer Towards 3D Molecular Interaction Learning [20.6] 任意の3次元錯体を集合の幾何学的グラフとして表現し、全ての種類の分子を1つのモデルで符号化することを提案する。
次に、ドメイン固有の階層とドメインに依存しない相互作用物理の両方を効果的に捉えるために、ジェネラリスト同変変換器(GET)を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:38:01 GMT)
Opara: Exploiting Operator Parallelism for Expediting DNN Inference on GPUs [20.5] emphOparaは、GPU上のDeep Neural Network(DNN)推論を高速化する、リソースと干渉対応のスケジューリングフレームワークである。
我々はPyTorchをベースとしたemphOparaのプロトタイプを,emphnon-intrusiveな方法で実装し,オープンソース化する。
代表的DNNとTransformerベースのモデルによるプロトタイプ実験は、emphoparaがPyTorchのデフォルトシーケンシャルな textttCUDA Graph よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:01:06 GMT)
Revisiting CNNs for Trajectory Similarity Learning [20.3] ConvTrajを導入し、1Dと2Dの畳み込みを併用して、トラジェクトリの逐次的および地理的分布の特徴を捉える。
軌道類似度探索において,ConvTrajが最先端の精度を実現することを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:16:03 GMT)
A Geometric Unification of Distributionally Robust Covariance Estimators: Shrinking the Spectrum by Inflating the Ambiguity Set [20.2] 制約的な仮定を課さずに共分散推定器を構築するための原理的手法を提案する。
頑健な推定器は効率的に計算可能で一貫したものであることを示す。
合成および実データに基づく数値実験により、我々の頑健な推定器は最先端の推定器と競合していることが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:01:18 GMT)
Multi-Aspect Controllable Text Generation with Disentangled Counterfactual Augmentation [20.2] マルチアスペクト制御可能なテキスト生成は、複数の側面から生成された属性のテキストを制御することを目的としている。
そこで本研究では,多視点制御可能テキスト生成方式であるMAGICを提案する。
実験により、MAGICは不均衡な特性相関シナリオとバランスの取れた特性相関シナリオの両方において、最先端のベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:25:42 GMT)
Deform3DGS: Flexible Deformation for Fast Surgical Scene Reconstruction with Gaussian Splatting [20.1] この研究は、内視鏡手術中に変形可能な組織に対して、Deform3DGSと呼ばれる新しい高速再構築フレームワークを提示する。
リアルタイム3Dレンダリングの新技術である3D Gaussian Splattingを,ポイントクラウドを統合して手術シーンに導入する。
また,個々のガウスレベルにおける組織変形動態を学習するためのフレキシブルな変形モデリング手法 (FDM) を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:55:14 GMT)
Decision ConvFormer: Local Filtering in MetaFormer is Sufficient for Decision Making [20.1] 決定変換器(DT)はTransformerに基づいた有望なモデルとして登場している。
本稿では,MetaFormer のアーキテクチャに基づく新しい行動系列予測器,Decision ConvFormer (DC) を提案する。
DCは、リソースを少なくしながら、様々な標準RLベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:19:34 GMT)
Approximate Global Convergence of Independent Learning in Multi-Agent Systems [20.0] 本稿では,Q$ラーニングとNatural Act-criticの2つの代表的なアルゴリズムについて,価値ベースのフレームワークとポリシーベースのフレームワークで検討する。
結果は、大域収束を達成する際のILの基本的な限界を特徴づけるエラー項まで、$tildemathcalO(epsilon-2)$のサンプル複雑性を示唆している。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:20:34 GMT)
ChatKBQA: A Generate-then-Retrieve Framework for Knowledge Base Question Answering with Fine-tuned Large Language Models [19.9] 本稿では,新規かつ簡易な生成検索KBQAフレームワークであるChatKBQAを紹介する。
実験の結果,ChatKBQAは標準KBQAデータセット上で新たな最先端性能を実現することがわかった。
この研究は、LLMと知識グラフを組み合わせるための新しいパラダイムとして、解釈可能および知識要求型質問応答のパラダイムと見なすこともできる。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:39:51 GMT)
SoK: Public Blockchain Sharding [19.8] この研究は、パブリックブロックチェーンシャーディングに関する知識の体系化を提供する。
これには、シャーディングシステムのコアコンポーネント、課題、制限、最新のシャーディングプロトコルのメカニズムが含まれている。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:38:40 GMT)
LED: A Large-scale Real-world Paired Dataset for Event Camera Denoising [19.5] イベントカメラは、ノイズ干渉を受けやすい場合に動的シーン情報をキャプチャする点で大きな利点がある。
我々は,高解像度(1200*680)イベントストリームで18K秒の3Kシーケンスを含む,新しいペア化された実世界のイベントデノゲーションデータセット(LED)を構築した。
そこで本研究では,GTを生音から分離して生成する手法として,均質な二重事象を用いた新しい効果的なデノナイジングフレームワーク(DED)を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:02:35 GMT)
GraphAny: A Foundation Model for Node Classification on Any Graph [19.4] 特定のトレーニングを必要とせずに新しいタスクで推論を実行できるファンデーションモデルは、視覚と言語アプリケーションにおける機械学習に革命をもたらした。
本研究では,GraphAnyと呼ばれる帰納的ノード分類のための新しい基盤アーキテクチャを用いて,2つの課題に取り組む。
具体的には、各ノードの注意スコアを学習し、複数のLinearGNNの予測を融合させ、新しいグラフの一般化を保証する。
実証的には、わずか120のラベル付きノードを持つウィスコンシンデータセットでトレーニングされたGraphAnyは、インダクティブな方法で平均67.26%の精度で30の新しいグラフを効果的に一般化することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:43:29 GMT)
Imp: Highly Capable Large Multimodal Models for Mobile Devices [19.3] 大規模言語モデル(LLM)は、オープンワールドのマルチモーダル理解において顕著な汎用性を示している。
それらは通常パラメータ重で計算集約的であり、リソース制約のあるシナリオにおける適用性を妨げます。
本稿では,モデルアーキテクチャ,トレーニング戦略,トレーニングデータの観点から,軽量LMMの体系的研究を行う。
その結果,2B-4Bスケールで高い能力を有するLMMのファミリーであるImpが得られた。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:47:10 GMT)
Towards Hierarchical Multi-Agent Workflows for Zero-Shot Prompt Optimization [19.2] 大規模言語モデル(LLM)は、ユーザの質問に答える上で大きな進歩を見せている。
LLMの出力の品質はプロンプト設計に大きく依存しており、優れたプロンプトによってLLMが非常に難しい問題に正しく答えられる可能性がある。
LLMの階層構造を提案し、まず、正確な指示と正確な単語を階層的に生成し、次に、このプロンプトを用いてユーザクエリの最終回答を生成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:05:45 GMT)
Algorithmic Fairness in Performative Policy Learning: Escaping the Impossibility of Group Fairness [19.2] 我々は,社会分類問題におけるグループフェアネス保証の強化を実現するために,演奏性を活用するアルゴリズム的フェアネスプラクティスを開発した。
このアプローチの重要な利点は、矛盾するグループフェアネス定義の不整合を解決することができることである。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:46:47 GMT)
FairCLIP: Social Bias Elimination based on Attribute Prototype Learning and Representation Neutralization [19.1] 本稿では,CLIPに基づく画像検索における社会的バイアスを取り除くためにFairCLIPを提案する。
FairCLIPは、すべてのCLIPダウンストリームタスクに共通する表現の中立化を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:38:50 GMT)
Learning from Random Demonstrations: Offline Reinforcement Learning with Importance-Sampled Diffusion Models [19.1] 閉ループポリシー評価と世界モデル適応を用いたオフライン強化学習のための新しい手法を提案する。
提案手法の性能を解析し,提案手法と実環境とのリターンギャップに上限を設けた。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:34:31 GMT)
The Power of Few: Accelerating and Enhancing Data Reweighting with Coreset Selection [18.7] 再重み付けにコアサブセット選択を用いる新しい手法を提案する。
戦略的に選択されたコアセットに焦点を当てることで、我々のアプローチは堅牢な表現を提供する。
再校正された重みは、データセット全体に対してマッピングされ、伝播される。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:39:59 GMT)
Recurrent Drafter for Fast Speculative Decoding in Large Language Models [18.3] 本稿では,大規模言語モデルの提供効率向上を目的とした投機的復号化手法を提案する。
我々は、古典的な2モデル投機的復号法と、より最近のシングルモデルアプローチであるMedusaという2つの確立された手法の長所を生かしている。
提案手法がいくつかのポピュラーなオープンソース言語モデルに対して有効であることを実証的に示すとともに,このアプローチの適用に関わるトレードオフを包括的に分析する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:55:19 GMT)
GAN Inversion for Image Editing via Unsupervised Domain Adaptation [18.3] 本稿では,UNDA(Unsupervised Domain Adaptation)のインバージョンプロセス,すなわちUDA-inversionを提案し,HQおよびLQ画像の効果的なインバージョンと編集を行う。
UDA-InversionはFFHQデータセットで22.14のPSNRを実現し、教師付きメソッドと互換性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:47:54 GMT)
Efficient Policy Evaluation with Offline Data Informed Behavior Policy Design [18.3] オンラインモンテカルロ推定器のデータ効率を向上させる新しい手法を提案する。
まず,オンラインモンテカルロ推定器のばらつきを確実に低減する閉形式行動ポリシーを提案する。
次に、以前に収集したオフラインデータから、このクローズドフォームの動作ポリシーを学習するための効率的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:32:53 GMT)
The Fine-Tuning Paradox: Boosting Translation Quality Without Sacrificing LLM Abilities [18.2] 機械翻訳のための微調整大型言語モデル(LLM)は、全体的な翻訳品質が改善されている。
モデルサイズは70億から65億までの範囲で,LLaMAおよびファルコン系のモデルに対して広範な翻訳評価を行う。
フォーマルなステアリングを行う能力の低下、数ショットの例による技術的翻訳の作成、文書レベルの翻訳を行う能力の低下を観察する。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:25:56 GMT)
Sharpness-Aware Minimization Enhances Feature Quality via Balanced Learning [17.7] シャープネス・アウェア最小化(SAM)は勾配降下(SGD)に代わる有望な代替手段として登場した。
SAM はこの効果を,学習機会の残余となる特徴を適応的に抑制することで実現していることを示す。
我々の洞察は、CelebA、Waterbirds、CIFAR-MNIST、DomainBedといった実データの実験によって裏付けられている。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:32:56 GMT)
Iterative Feature Boosting for Explainable Speech Emotion Recognition [17.6] 本稿では,効率的な特徴工学手法に基づく新しい教師付きSER手法を提案する。
特徴の関連性を評価し,特徴セットを洗練させるために,結果の説明可能性に特に注意を払っている。
提案手法は,TESSデータセット上での感情認識において,ヒトレベルのパフォーマンス(HLP)および最先端の機械学習手法より優れる。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:44:27 GMT)
MCDS-VSS: Moving Camera Dynamic Scene Video Semantic Segmentation by Filtering with Self-Supervised Geometry and Motion [17.5] 自動運転車は意思決定に信頼性のあるセマンティックな環境認識に依存している。
本稿では,カメラのシーン形状とエゴモーションを自己教師付きで学習する構造化フィルタモデルMCDS-VSSを提案する。
我々のモデルは自動車シーンを、シーン幾何学、エゴモーション、オブジェクトモーションなどの複数の解釈可能な表現に解析する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:33:14 GMT)
Dataflow-Guided Retrieval Augmentation for Repository-Level Code Completion [17.4] 本稿では,リポジトリレベルのコード補完のためのデータフロー誘導型検索拡張手法DraCoを提案する。
実験では、DraCoの精度と適用効率が向上し、コード精度が3.43%向上し、識別子F1スコアが平均3.27%向上した。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:48:00 GMT)
Machine Unlearning of Pre-trained Large Language Models [17.4] 本研究では,大規模言語モデル(LLM)の文脈における「忘れられる権利」の概念について検討する。
我々は、事前学習されたモデルに焦点をあてて、機械学習を重要なソリューションとして探求する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:44:51 GMT)
Don't drop your samples! Coherence-aware training benefits Conditional diffusion [17.3] Coherence-Aware Diffusion (CAD) は条件情報のコヒーレンスを拡散モデルに統合する新しい手法である。
CADは理論的に健全であり,様々な条件生成タスクに対して実験的に有効であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:57:26 GMT)
ParSEL: Parameterized Shape Editing with Language [17.3] ParSELは、自然言語から高品質な3Dアセットを制御可能な編集を可能にするシステムである。
プログラムパラメータを調整することで、ユーザーは編集の規模を正確に制御して形状のバリエーションを探索できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:55:46 GMT)
CLIP-Guided Source-Free Object Detection in Aerial Images [17.3] 高解像度の空中画像は、しばしばかなりのストレージスペースを必要とし、一般にはアクセスできない。
そこで本研究では,これらの課題に対処する新しいSFOD法を提案する。
自己学習における雑音ラベルを緩和するために,コントラスト言語画像事前学習(CLIP)を用いて擬似ラベルの生成を誘導する。
CLIPのゼロショット分類機能を利用することで、そのスコアを予測された元のバウンディングボックスに集約し、擬似ラベルの洗練されたスコアを得ることができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:55:45 GMT)
Byzantine-Resilient Federated PCA and Low Rank Column-wise Sensing [17.2] 本研究は,フェデレーション・プリンシパル・コンポーネント分析(PCA)とフェデレーション・ローランク・カラム・ワイド・センシング(LRCS)の2つの関連する学習問題を考察する。
ノード攻撃はビザンティンであると仮定され、これは攻撃者は全能であり、共謀できることを意味する。
本稿では,PCA問題の解法として,LRCS問題の鍵となる部分であるSubspace-Medianという,ビザンチン耐性のある通信効率・サンプリング効率のアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:14:15 GMT)
Towards Real World Debiasing: A Fine-grained Analysis On Spurious Correlation [17.1] 既存のベンチマークと実世界のデータセットのバイアス分布を再検討し、データセットバイアスを分析するためのきめ細かいフレームワークを提案する。
その結果,既存の手法では現実のバイアスに対処できないことがわかった。
本稿では,Debias in Destruction (DiD) という,既存のデバイアス法に容易に適用可能な,シンプルかつ効果的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:14:05 GMT)
Diffusion Model Patching via Mixture-of-Prompts [17.0] 拡散モデルパッチング(DMP)は,事前学習した拡散モデルの性能を高めるための単純な手法である。
DMPは、オリジナルのモデルを凍結したまま、モデルの入力空間に小さな学習可能なプロンプトを挿入する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:28:32 GMT)
MixDQ: Memory-Efficient Few-Step Text-to-Image Diffusion Models with Metric-Decoupled Mixed Precision Quantization [16.8] 最近の数ステップの拡散モデルでは、デノナイジングステップを減らして推論時間を短縮している。
Post Training Quantization (PTQ)は、高ビット幅のFP表現を低ビット整数値に置き換える。
しかし、数ステップの拡散モデルに適用する場合、既存の量子化法は画質とテキストアライメントの両方を維持する上で困難に直面している。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:51:10 GMT)
Code Repair with LLMs gives an Exploration-Exploitation Tradeoff [16.8] 大きな言語モデル(LLM)でソースコードを反復的に改善し、修復することは、1ショットで構築するには複雑すぎるプログラムを生成する一般的な方法として現れている。
ここでは、リファインメントが探索と露見のトレードオフを露呈していることを示します。ほとんどのテストケースをパスするプログラムをリファイン化したり、考慮の少ないプログラムをリファインダでリファインダすることです。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:20:19 GMT)
Achievable Fairness on Your Data With Utility Guarantees [16.8] 機械学習の公平性において、異なるセンシティブなグループ間の格差を最小限に抑えるトレーニングモデルは、しばしば精度を低下させる。
本稿では,各データセットに適合する公平性-正確性トレードオフ曲線を近似する計算効率のよい手法を提案する。
そこで我々は,モデルフェアネスを監査するための堅牢な枠組みを実践者に提供し,評価の不確実性を定量化する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:44:40 GMT)
Improving the Fidelity of CNOT Circuits on NISQ Hardware [16.7] 最寄りの相互作用とCNOTゲート誤り率を考慮した改良型CNOT合成アルゴリズムを提案する。
合成CNOT回路の忠実度を平均で2倍(最大9倍)向上させる。
合成したCNOT数を平均で13倍(最大162倍)下げる。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:47:33 GMT)
SimAC: A Simple Anti-Customization Method for Protecting Face Privacy against Text-to-Image Synthesis of Diffusion Models [16.5] 本稿では,既存のアンチ・カストマイゼーション手法とシームレスに統合された最適時間ステップを適応的に探索する手法を提案する。
我々のアプローチはアイデンティティの破壊を著しく増加させ、それによってユーザのプライバシと著作権を保護する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:55:15 GMT)
ORLM: Training Large Language Models for Optimization Modeling [16.3] 大規模言語モデル(LLM)は複雑なオペレーションリサーチ(OR)問題に対処するための強力なツールとして登場した。
この問題に対処するために、最適化モデリングのためのオープンソースのLLMのトレーニングを提案する。
我々は,NL4OPT,MAMO,IndustrialORベンチマークの最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:12:05 GMT)
Continuously Optimizing Radar Placement with Model Predictive Path Integrals [16.1] センサー配置の連続最適化は、様々な軍事・民間用途における正確な目標位置決めに不可欠である。
レーダパラメータとレーダ目標距離を組み込んだレンジ計測モデルを用いる。
我々は、時間とともにレーダーと目標の進化する幾何学を可視化し、最も高い測定情報を得る領域をハイライトする。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:44:38 GMT)
PixelsDB: Serverless and Natural-Language-Aided Data Analytics with Flexible Service Levels and Prices [16.1] PixelsDBは、ユーザが効率的にデータを探索できるオープンソースのデータ分析システムである。
ユーザは、微調整された言語モデルを使った自然言語インターフェースを使用して、sqlクエリを生成およびデバッグできる。
クエリはサーバレスクエリエンジンによって実行され、クエリ緊急時にさまざまなサービスレベルに対してさまざまな価格が提供される。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:48:43 GMT)
PostDoc: Generating Poster from a Long Multimodal Document Using Deep Submodular Optimization [15.9] 長い入力文書からのポスターは、優れたデザイン要素を持つ優れたテンプレート上に提示された1ページで読みやすいマルチモーダル(テキストと画像)の要約と見なすことができる。
本論文では,文書から多モードコンテンツを取り出すために,基底真実の要約に基づいて訓練できる新しいサブモジュール関数を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:16:25 GMT)
Probabilities of Causation for Continuous and Vector Variables [15.5] 因果関係の確率(PoC)は、説明可能な人工知能と実践的な意思決定のための貴重な概念である。
我々はPoCの概念を連続的な治療と結果変数に拡張し、さらにPoCを一般化して複数の治療と複数の結果の間の因果効果を捉える。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:22:26 GMT)
Identification and Estimation of Conditional Average Partial Causal Effects via Instrumental Variable [15.5] 条件付き平均因果効果 (CAPCE) について検討し, 連続処理による因果効果の不均一性を明らかにする。
CAPCE推定器の3つのファミリー(シーブ、パラメトリック、再生、カーネルヒルベルト空間(RKHS))を開発し、それらの統計特性を解析する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:01:44 GMT)
Beyond the Visible: A Survey on Cross-spectral Face Recognition [15.5] クロススペクトル顔認識 (CFR) とは、異なるスペクトル帯から生じる顔画像を用いて個人を認識することを指す。
畳み込みニューラルネットワーク(CNN)の最近の進歩は、CFRシステムの性能を大幅に向上させた。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:07:43 GMT)
CaLa: Complementary Association Learning for Augmenting Composed Image Retrieval [15.5] Composed Image Retrieval (CIR)は、画像とテキストのペアクエリに基づいてターゲットイメージを検索する。
我々は、CIR三重項が、この一次関係を超える付加的な関連を含んでいると論じる。
本稿では,三重項をグラフノードとして扱い,三重項内の2つの新しい関係を同定する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:26:43 GMT)
WW-FL: Secure and Private Large-Scale Federated Learning [15.4] Federated Learning(FL)は、クライアントデバイス上でトレーニングデータを保持することによって、データのプライバシを保証する、大規模分散機械学習の効率的なアプローチである。
最近の研究でFLの脆弱性が発見され、毒殺攻撃によってセキュリティとプライバシーの両方に影響を及ぼした。
データとグローバルモデルのプライバシを保証するために,セキュアなマルチパーティ計算と階層的なFLを組み合わせた,革新的なフレームワークであるWW-FLを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:00:35 GMT)
On Calibration of Object Detectors: Pitfalls, Evaluation and Baselines [15.3] オブジェクト検出器の信頼性の高い使用には、それらを校正する必要がある。
最近のアプローチでは、スクラッチからそれらを訓練して校正された検出器を得るために、新しい損失関数を設計する。
対象検出器の校正と精度を共同で測定する原理的評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:12:14 GMT)
All-In-One Medical Image Restoration via Task-Adaptive Routing [15.3] 我々は、単一のユニバーサルモデルで複数の異なるMedIRタスクに対処することを目的とした、オールインワンの医療画像復元の課題に焦点を当てた。
本稿では,タスク適応型ルーティング戦略を提案する。
提案するtextbfAll-in-one textbfMedical textbfImage textbfRestoration (textbfAMIR) ネットワークは、3つのMedIRタスクで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:34:05 GMT)
Improving the Training of Rectified Flows [14.7] 拡散モデルは画像生成とビデオ生成に大いに期待できるが、最先端モデルからのサンプリングには高コストの数値積分が必要である。
この問題に対処するための1つのアプローチは整流流であり、これは繰り返し、トランケーションエラーの影響を受けにくい滑らかなODEパスを学習する。
我々は,NFEの低い環境下においても,知識蒸留法に対抗して整流を訓練するための改良手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:56:04 GMT)
STHN: Deep Homography Estimation for UAV Thermal Geo-localization with Satellite Imagery [14.7] 粗大から細い深部ホログラフィー推定手法を用いたUAV熱ジオローカライズ手法を提案する。
この方法は、UAVの最後の位置から半径512メートル以内で、信頼性の高い熱的位置決めを可能にする。
本研究は,UAV熱ジオローカライゼーション性能と幾何雑音の影響に対するロバスト性を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:41:12 GMT)
Language Models Represent Beliefs of Self and Others [14.6] 本稿では,言語モデルのニューラルアクティベーションを通じて,様々なエージェントの観点から,信念の状態を線形に復号化できることを述べる。
我々は,モデルにおけるToMパフォーマンスの劇的な変化を観察し,社会的推論プロセスにおけるそれらの重要な役割を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:43:01 GMT)
GUARD: Role-playing to Generate Natural-language Jailbreakings to Test Guideline Adherence of Large Language Models [14.6] 主要な安全策の1つは、リリース前にジェイルブレイクで大規模言語モデルを積極的にテストすることである。
我々は,人間の世代スタイルでジェイルブレイクを発生させるための,新しい直感的かつ直感的な戦略を提案する。
我々の異なる役割のシステムは、この知識グラフを利用して新しいジェイルブレイクを生成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:14:26 GMT)
Back to the Basics on Predicting Transfer Performance [14.5] 本稿では、転送可能性スコアリングのためのロバストなベンチマークガイドラインと、複数のスコアリングを組み合わせるためのしっかりとした手法を提案する。
総括的,微粒化,医用画像的データセットを含む11データセットの文献から13スコアを広範囲に評価した。
この結果から,異なる情報ソースを組み合わせることで,様々な領域間での転送可能性の確実な予測が可能となる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:55:50 GMT)
Fill in the Gap! Combining Self-supervised Representation Learning with Neural Audio Synthesis for Speech Inpainting [14.4] 本稿では,音声信号の欠落部分を周囲の文脈から再構成する音声認識用SSLモデルについて検討する。
その目的のために、SSLエンコーダ、すなわち HuBERT とニューラルヴォコーダ、すなわち HiFiGAN を組み合わせてデコーダの役割を演じる。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:41:39 GMT)
Few for Many: Tchebycheff Set Scalarization for Many-Objective Optimization [14.4] 多目的最適化は、競合する目的を1つのソリューションで最適化できない現実の多くのアプリケーションで見られる。
本稿では,多数の目的をカバーできるいくつかの代表解を見つけるために,新しいTchebycheff集合スカラー化法を提案する。
このようにして、それぞれの目的は、小さな解集合の少なくとも1つの解によってうまく対応できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:04:57 GMT)
Conversational Agents to Facilitate Deliberation on Harmful Content in WhatsApp Groups [13.8] WhatsAppグループは有害なコンテンツの拡散の温床となっている。
プラットフォームのエンドツーエンドの暗号化を考えると、モデレーションの責務はグループ管理者とメンバーにある。
WhatsAppグループにおける有害コンテンツに対する議論の促進における会話エージェントの役割について検討する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:07:07 GMT)
Cross-Training with Multi-View Knowledge Fusion for Heterogenous Federated Learning [13.8] 本稿では,多視点情報を活用したクロストレーニング手法により,フェデレーション学習を促進する新しい手法を提案する。
具体的には、FedCTと呼ばれる提案手法には、3つの主要なモジュールが含まれており、整合性を考慮した知識放送モジュールはモデルの割り当て戦略を最適化することを目的としている。
多視点知識誘導表現学習モジュールは、グローバルな視点とローカルな視点の両方から融合した知識を活用し、モデル交換前後の局所的な知識の保存を強化する。
ミックスアップベースの機能拡張モジュールは、豊富な情報を集約して、機能空間の多様性をさらに高める。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:27:30 GMT)
Instruct Once, Chat Consistently in Multiple Rounds: An Efficient Tuning Framework for Dialogue [13.8] マルチラウンド対話チューニング(Midi-Tuning)フレームワークを提案する。
エージェントとユーザを、大きな言語モデル上に構築された2つのアダプタで個別にモデル化する。
我々のフレームワークは従来の微調整よりも優れており、対話の整合性を改善する大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:57:36 GMT)
How Multilingual Are Large Language Models Fine-Tuned for Translation? [13.6] 並列テキスト上での微調整大型言語モデル(LLM)は、大量の並列データに対して教師あり方式で訓練された専用翻訳システムより優れていることが示されている。
翻訳の微調整は、ゼロショット言語、ゼロショット言語ペア、英語を含まない翻訳タスクのLLMのMT機能にどのように影響しますか?
翻訳の微調整により、ゼロショット言語でも平均で翻訳品質が向上するが、関連する言語ペアによる影響は不均一である。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:08:20 GMT)
Meta-Task Planning for Language Agents [13.6] 大規模言語モデルベースエージェント(LLMエージェント)は、人工知能(AGI)を実現するための有望なパラダイムとして登場した。
本稿では,メタタスク計画(Meta-Task Planning, MTP)を紹介する。
MTPはTravelPlannerで平均$sim40%$成功率を達成した。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:40:06 GMT)
Understanding Adam Optimizer via Online Learning of Updates: Adam is FTRL in Disguise [13.3] 本稿では,オンライン学習の観点から,Adamのアルゴリズムコンポーネントの利点について考察する。
私たちは、AdamがFTRL(Follow-the-Regularized-Leader)と呼ばれる原則付きオンライン学習フレームワークに対応していると考えています。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:49:45 GMT)
VividDream: Generating 3D Scene with Ambient Dynamics [13.2] 一つの入力画像やテキストプロンプトから周囲のダイナミックスを持つ探索可能な4Dシーンを生成する方法であるVividDreamを紹介する。
VividDreamは、さまざまな実画像とテキストプロンプトに基づいて、魅力的な4D体験を提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:24 GMT)
Reasoning about concepts with LLMs: Inconsistencies abound [13.0] 大きな言語モデル(LLM)は、しばしばその知識に重大な矛盾を示し、示す。
特に,多種多種多種多種多様のLCMの軽量化を図り,その性能を著しく向上させることができた。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:38:54 GMT)
Performance of NPG in Countable State-Space Average-Cost RL [12.9] 状態空間が任意に大きい強化学習環境における政策最適化手法を検討する。
モチベーションは、通信ネットワーク、マッチングマーケット、その他のキューシステムにおける制御問題から生じる。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:29:52 GMT)
Context Injection Attacks on Large Language Models [12.9] ChatGPTやLlama-2のような大規模言語モデル(LLM)は、現実世界のアプリケーションで広く使われている。
提案手法は,製造コンテキストを導入し,無効な応答を誘発することを目的としたコンテキストインジェクション攻撃を行うための体系的手法である。
我々のコンテキスト作成戦略、受け入れ推論、および単語匿名化は、攻撃者にカスタマイズされたプロンプトテンプレートで構造化可能な誤解を招くコンテキストを効果的に生成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:36:47 GMT)
Jailbreaking Large Language Models Against Moderation Guardrails via Cipher Characters [12.6] JAMBenchは、モデレーションガードレールをトリガーし、評価するために設計された有害な行動ベンチマークである。
JAMは、ジェイルブレイクの成功率(sim$$times$19.88)とフィルターアウト率(sim$$times$1/6)を、ベースラインよりも高く達成している。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:38:36 GMT)
Why Larger Language Models Do In-context Learning Differently? [12.6] 大規模言語モデル(LLM)は、インコンテキスト学習(ICL)の重要な能力を備えた、AIの強力なツールとして登場した。
最近の謎の観測では、異なるスケールのモデルが異なるICLの挙動を持つ可能性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:11:35 GMT)
SeamlessExpressiveLM: Speech Language Model for Expressive Speech-to-Speech Translation with Chain-of-Thought [12.5] 本研究は,S2STのための単一言語モデルであるSeamlessExpressiveLMを提案する。
我々は、複雑なソースからターゲットへの音声マッピングを、チェーン・オブ・シークレット・プロンプトで中間生成ステップに分解する。
モデルはまずターゲットのセマンティックコンテンツを翻訳し、次に話者スタイルをマルチストリーム音響ユニットに転送する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:28:31 GMT)
Faces of the Mind: Unveiling Mental Health States Through Facial Expressions in 11,427 Adolescents [12.5] うつ病や不安などの気分障害は、しばしば表情を通して現れる。
11,427人の被験者の顔映像を分析した。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:02:40 GMT)
Distilling Robustness into Natural Language Inference Models with Domain-Targeted Augmentation [12.5] 本稿では,学生モデルの配布外領域におけるロバスト性を改善するための2つの補完手法について検討する。
第一のアプローチは、ターゲットの分布にマッチする未ラベルの例で蒸留を増強する。
第2の方法は、目標分布に類似したトレーニングセット内のデータポイントをサンプリングする。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:00:14 GMT)
Twin Deformable Point Convolutions for Point Cloud Semantic Segmentation in Remote Sensing Scenes [12.5] 双変形点畳み込み(TDConvs)と呼ばれる新しい畳み込み作用素を提案する。
これらの演算子は、緯度-経度面と高度方向の変形可能なサンプリングポイントを学習することで適応的な特徴学習を実現することを目的としている。
既存のベンチマークの実験では、TDConvsが最高のセグメンテーション性能を達成していると結論付けています。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:31:03 GMT)
Research on Credit Risk Early Warning Model of Commercial Banks Based on Neural Network Algorithm [12.3] この研究は、特にバックプロパゲーション(BP)ニューラルネットワークのような高度なニューラルネットワーク技術を利用して、商業銀行の信用リスクをプリエンプションする新しいモデルを開発した。
研究結果は、このモデルが信用リスク管理の予測と精度を効果的に向上させることを示唆した。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:13:30 GMT)
Spectral Truncation Kernels: Noncommutativity in $C^*$-algebraic Kernel Machines [12.1] スペクトルトランケーションに基づく正定値カーネルの新しいクラスを提案する。
truncationパラメータ$n$は、性能向上につながる支配要因であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:12:25 GMT)
Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning [12.1] オフラインの強化学習では、アウト・オブ・ディストリビューションの課題が強調される。
既存の手法は、しばしば政策規則化を通じて学習されたポリシーを制約する。
適応アドバンテージ誘導政策正規化(A2PR)を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:20:55 GMT)
Croissant: A Metadata Format for ML-Ready Datasets [12.1] Croissantは、MLツールやフレームワークでのデータの使用方法を簡単にするデータセットのメタデータフォーマットである。
すでに、数十万のデータセットにまたがる、人気のあるデータセットリポジトリがサポートしている。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:20:04 GMT)
Benchmarking and Improving Detail Image Caption [12.1] 視覚言語モデル (LVLM) は視覚理解の基本的な課題とされてきた。
本稿では,人間専門家が注釈付けした高品質な評価データセットをキュレートすることで,詳細な画像キャプションタスクのベンチマークを行う。
また、CAPTUREと呼ばれるより信頼性の高いキャプション評価指標も設計する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:06:07 GMT)
Estimating Human Poses Across Datasets: A Unified Skeleton and Multi-Teacher Distillation Approach [12.0] 本稿では,多教師による知識蒸留と骨格の統一的表現を融合した新しい手法を提案する。
私たちのネットワークは、それぞれ17と16のキーポイントを含むCOCOとMPIIデータセットで共同でトレーニングされています。
我々のジョイントモデルの平均精度は70.89と76.40で、1つのデータセットでトレーニングし、両方で評価すると53.79と55.78だった。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:14:39 GMT)
Density Descent for Diversity Optimization [12.0] 本稿では,特徴空間の連続密度推定に基づいてCMA-ESを用いて特徴空間を探索するアルゴリズムである密度 Descent Search (DDS)を提案する。
いくつかの標準多様性最適化ベンチマークでは、DSはノベルティサーチ(NS)や他の最先端のベースラインよりも優れている。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:13:44 GMT)
Parrot: Efficient Serving of LLM-based Applications with Semantic Variable [11.9] Parrotは、LLMベースのアプリケーションのエンドツーエンドエクスペリエンスに焦点を当てたサービスシステムである。
Semantic Variableはリクエストのプロンプトで入出力変数に注釈を付け、複数のLLMリクエストを接続する際にデータパイプラインを生成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:46:36 GMT)
Is Synthetic Data all We Need? Benchmarking the Robustness of Models Trained with Synthetic Images [11.7] 本稿では,3種類の合成クローンモデル,すなわち,教師付き,自己監督型,マルチモーダル型の最初のベンチマークを行う。
合成クローンは、実際のデータで訓練されたモデルよりも、敵対的および現実的なノイズの影響を受けやすいことがわかりました。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:37:34 GMT)
Applications of Generative AI (GAI) for Mobile and Wireless Networking: A Survey [11.7] ジェネレーティブAI(GAI)は強力なAIパラダイムとして登場した。
本研究はモバイルおよび無線ネットワークにおけるGAIの役割に関するチュートリアルである。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:06:40 GMT)
FCOM: A Federated Collaborative Online Monitoring Framework via Representation Learning [11.6] 逐次的に観測された分散データから代表モデルを推定するための新しい協調的 UCB アルゴリズムを提案する。
本手法の有効性は,アルツハイマー病における理論解析,シミュレーション研究,分散型認知劣化モニタリングを通じて明らかにした。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:49:14 GMT)
Enhancing Reinforcement Learning with Label-Sensitive Reward for Natural Language Understanding [11.5] ラベルセンシティブ・リワード(RLLR)で強化された新しい強化学習フレームワークを提案する。
提案手法は,RL中におけるニュアンス付きラベルセンシティブな意味的特徴を適切に捉え,自然言語の理解を向上させることを目的としている。
8つのタスクにまたがる5つの多様な基礎モデルの実験は、有望な結果を示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:19:31 GMT)
Grade Like a Human: Rethinking Automated Assessment with Large Language Models [11.4] 大規模言語モデル(LLM)は自動階調に使われてきたが、人間と同等のパフォーマンスを達成できていない。
本稿では,次のキーコンポーネントを含むすべてのグルーピング手順に対処するLLMに基づくグルーピングシステムを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:08:15 GMT)
Domain Generalisation via Imprecise Learning [11.3] アウト・オブ・ディストリビューションの一般化は、経験的データから学習するだけでなく、一般化の様々な概念の中から決定するからである。
Inrecise Domain Generalization frameworkを導入し、不正確なリスク最適化を特徴とし、学習者が不正確なままでいられるようにする。
理論的および実証的な証拠の両方によって支持され、我々の研究は、不正確さをドメインの一般化に組み込むことの利点を示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:11:03 GMT)
Would I Lie To You? Inference Time Alignment of Language Models using Direct Preference Heads [11.3] 言語モデリングヘッドの出力分布に直接影響を及ぼすことなく、補助的な報酬ヘッドを通して人間の嗜好信号を学習できる微調整フレームワークであるDirect Preference Heads (DPH)を導入する。
GLUE, RACE, および GPT4All 評価スイート上で本モデルを評価し, スーパービジョンファインチューニング (SFT) やダイレクトパラメータ最適化 (DPO) のみを用いたモデルよりも高いスコアが得られることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:38:52 GMT)
Individualized Dynamic Latent Factor Model for Multi-resolutional Data with Application to Mobile Health [11.2] 低解像度の時系列のアンサンプル計測を補間するために、不規則な多重解像度時系列データに対する個別化動的潜在因子モデルを提案する。
我々の理論は、B-スプライン近似法の積分誤差と収束率に制限を与える。
シミュレーションとスマートウォッチデータへの適用は,既存手法と比較して,提案手法の優れた性能を示すものである。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:33:45 GMT)
An Empirical Study of Pre-trained Model Selection for Out-of-Distribution Generalization and Calibration [11.1] アウト・オブ・ディストリビューション(OOD)の一般化タスクでは、微調整された事前学習モデルが一般的な戦略となっている。
本研究では,事前学習モデルサイズ,事前学習データセットサイズ,トレーニング戦略が一般化と不確実性校正にどのように影響するかを検討した。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:30:02 GMT)
SparseDrive: End-to-End Autonomous Driving via Sparse Scene Representation [11.0] 我々はSparseDriveという新しいエンドツーエンドの自動運転パラダイムを提案する。
SparseDriveは対称なスパース認識モジュールとパラレルモーションプランナーで構成されている。
動作予測と計画について,これら2つの課題の相似性を概観し,運動プランナの並列設計に繋がる。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:13:56 GMT)
Deciphering Human Mobility: Inferring Semantics of Trajectories with Large Language Models [10.8] 本稿では,ユーザの職業カテゴリー,活動,シーケンス,軌道記述の3つの重要な側面を通じて意味推論を定義する。
本稿では,トラジェクトリデータのセマンティック分析を活用するために,大規模言語モデルを用いたトラジェクトリ意味推論(TSI-LLM)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:55:48 GMT)
From One to Many: Expanding the Scope of Toxicity Mitigation in Language Models [10.8] 言語モデルが多言語機能を取り入れているため、私たちの安全対策はペースを保ちます。
言語間で十分なアノテートされたデータセットがないため、私たちは翻訳データを用いて緩和手法を評価し、強化する。
これにより,翻訳品質と言語間移動が毒性軽減に及ぼす影響を検討することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:37:11 GMT)
Do spectral cues matter in contrast-based graph self-supervised learning? [10.8] スペクトル領域に関する一見矛盾する仮定やアプローチに基づく手法は、学習性能の顕著な向上を示している。
本研究は, スペクトル特性と現代の方法論の学習結果との関係について, 徹底的な研究を行う。
これらの単純で効果的な戦略が常に優れた性能をもたらすことを示す証拠が提示される。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:30:34 GMT)
MM-Lego: Modular Biomedical Multimodal Models with Minimal Fine-Tuning [10.8] マルチモーダルレゴ(MM-Lego)は、モジュール式で汎用的な融合およびモデルマージフレームワークである。
本研究では,MM-Legoをモデルマージ法としてエンド・ツー・エンドの融合モデルと組み合わせることができることを示す。
6つのベンチマークされたマルチモーダルバイオメディカルタスクに対して、最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:14:01 GMT)
QClusformer: A Quantum Transformer-based Framework for Unsupervised Visual Clustering [10.6] 我々はQClusformerを紹介した。QClusformerは、Quantumマシンを利用した、教師なしの視覚クラスタリング問題に対処する先駆的なTransformerベースのフレームワークである。
具体的には、量子の観点から、自己アテンションモジュールやトランスフォーマーブロックを含むトランスフォーマーアーキテクチャを設計する。
本稿では、教師なし視覚クラスタリングタスクに適したTransformerアーキテクチャに基づく変種であるQClusformerを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:07:57 GMT)
Evaluating the Effectiveness and Robustness of Visual Similarity-based Phishing Detection Models [10.3] 我々は、最先端の視覚的類似性に基づくアンチフィッシングモデルを包括的に精査し、評価する。
分析の結果,一部のモデルでは高い精度を維持しているが,他のモデルではキュレートされたデータセットの結果よりも顕著に低い性能を示した。
我々の知る限り、この研究は、実世界におけるフィッシング検出のための視覚的類似性に基づくモデルの最初の大規模かつ体系的な評価である。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:28:36 GMT)
HQ-DiT: Efficient Diffusion Transformer with FP4 Hybrid Quantization [10.3] 拡散変換器(DiT)は、最近、優れた視覚生成能力に対して大きな注目を集めている。
DiTは高いパラメータカウントと実装コストを持ち、携帯電話などのリソース制限されたデバイスでの使用を著しく制限している。
4ビット浮動小数点(FP)の精度をDiT推論の重みとアクティベーションの両面に利用した,効率的なポストトレーニング量子化法であるDiT(HQ-DiT)のハイブリッド浮動小点量子化を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:56:11 GMT)
Stratified Avatar Generation from Sparse Observations [10.3] AR/VRデバイスから3Dフルボディアバターを推定することは、没入感のある体験を生み出す上で不可欠である。
本稿では,Skinned Multi-Person Linear (SMPL)モデルで定義されたキネマティックツリーの性質に着想を得た。
本研究では,従来のフルボディアバター再建パイプラインを2段階に分離する階層化手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:25:42 GMT)
A Multi-Perspective Analysis of Memorization in Large Language Models [10.3] 大規模言語モデル(LLM)は様々な分野で前例のない性能を示す。
LLMはそれらをトレーニングするのと同じコンテンツを生成することができる。
この研究は、様々な観点から記憶を包括的に議論した。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:13:19 GMT)
Goals as Reward-Producing Programs [10.3] 本研究では,無限個の目標プログラム上での適合度関数を用いた目標生成モデルを構築した。
モデルの内部のフィットネススコアは、プレイしやすく、人間らしく評価されたゲームを予測する。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:46:04 GMT)
MotionDreamer: Zero-Shot 3D Mesh Animation from Video Diffusion Models [10.3] ビデオ拡散モデルから抽出された動きに基づいて,任意の3次元形状を自動アニメーションする手法を提案する。
既存のコンピュータグラフィックスパイプラインと互換性のあるメッシュベースの明示的な表現を活用します。
我々の時間効率ゼロショット法は,多種多様な3次元形状を再アニメーションする優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:30:38 GMT)
Towards Uncertainty-Aware Language Agent [10.2] 不確実性認識言語エージェント(Uncertainty-Aware Language Agent, UALA)は、不確実性定量化を用いてエージェントと外部世界の相互作用を編成するフレームワークである。
我々の実験では、UALAは、外部世界への依存度を著しく低くしながら、パフォーマンスを大幅に改善することを示した。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:26:38 GMT)
Collective Variable Free Transition Path Sampling with Generative Flow Network [10.2] 我々は,集団変数(CV)に頼ることなく,生成フローネットワーク(GFlowNets)を用いて遷移経路のサンプルを作成することを提案する。
TPS-GFNと呼ばれる我々の手法は、従来のCVフリー機械学習手法よりも現実的で多様な遷移経路を生成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:32:42 GMT)
Understanding Encoder-Decoder Structures in Machine Learning Using Information Measures [10.1] 機械学習(ML)におけるエンコーダデコーダ設計の役割をモデル化し理解するための新しい結果を提案する。
我々は、機械学習における予測構造を表現するために、情報満足度(IS)と相互情報損失(MIL)という2つの主要な情報概念を用いる。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:58:01 GMT)
Automatic Dance Video Segmentation for Understanding Choreography [10.1] 本研究では,ダンスビデオを自動的に各動作に分割する手法を提案する。
トレーニングデータセットを構築するために、AIST Dance Video Databaseでセグメンテーションポイントをアノテートしてビデオをダンスする。
評価の結果,提案手法は高い精度でセグメンテーション点を推定できることがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:19:01 GMT)
Learning Latent Dynamic Robust Representations for World Models [9.8] Visual Model-Based Reinforcement Learning (MBL)は、環境の基盤となるダイナミクスに関する知識をエージェントに伝えることを約束する。
ドリーマーのような時空エージェントは、観測空間に無関係なノイズが存在する場合、しばしば視覚的なピクセルベースの入力に苦しむ。
本研究では,世界モデルにおけるタスク固有の環境の内在的側面を捉えるために,アテンポ的マスキング戦略と潜在的再構築を併用して適用する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:40:02 GMT)
Quantum accelerated cross regression algorithm for multiview feature extraction [9.7] マルチビュー特徴抽出(MvFE)は、機械学習、画像処理、その他の分野に広く応用されている。
この課題に対処するために、MvFEのための量子加速クロスレグレッションアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:57:56 GMT)
InferCept: Efficient Intercept Support for Augmented Large Language Model Inference [9.7] 本稿では,拡張LDMを対象とした最初のLLM推論フレームワークであるInferCeptについて述べる。
InferCeptは、LLMインターセプションによるGPUリソースの無駄を最小化し、より多くのリクエストを処理するために保存されたメモリを割り当てる。
InferCeptはサービス全体のスループットを1.6x-2x改善し、最先端のLCM推論システムと比較して毎秒2倍のリクエストを処理します。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:18:03 GMT)
Infinite 3D Landmarks: Improving Continuous 2D Facial Landmark Detection [9.6] 具体的なアーキテクチャ変更の組み合わせによって,その正確性と時間的安定性が向上することを示す。
ランドマーク検出器とともにトレーニングされた空間変圧器ネットワークの使用を教師なしで解析する。
ランドマーク予測器の出力ヘッドを変更して標準3次元空間のランドマークを推定することにより、精度をさらに向上できることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:54:26 GMT)
Statistical and Computational Guarantees of Kernel Max-Sliced Wasserstein Distances [9.6] カーネル最大スライシング (KMS) ワッサーシュタイン距離は、この目的のために開発された。
KMS の 2$-Wasserstein 距離の計算は NP-hard であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:23:39 GMT)
Tag-LLM: Repurposing General-Purpose LLMs for Specialized Domains [9.6] 大規模言語モデル(LLM)は、自然言語の理解と生成に顕著な能力を示した。
本研究は、汎用LLMを特殊領域の効率的なタスク解決器に再利用する方法を探求する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:37:06 GMT)
Phase transition and multistability in Dicke dimer [9.5] 2つのディック空洞の間の光子ホッピングは、定常状態と動的過程の豊富な量子相を誘導する。
我々は,光子ホッピングが量子位相を制御し,マルチスタブルな振る舞いを誘導する便利な,強力なツールであることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:34:41 GMT)
Source Code Foundation Models are Transferable Binary Analysis Knowledge Bases [9.4] 人間指向バイナリリバースエンジニアリング(Human-Oriented Binary Reverse Engineering)は、ソースコードに関連する可読性のあるコンテンツにバイナリコードを持ち上げることを目的としている。
本稿では,バイナリソースエンコーダデコーダモデルと,バイナリ解析のためのブラックボックスLCMを組み込んだ新しいプローブ・アンド・リカバリフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:17:44 GMT)
EMAG: Ego-motion Aware and Generalizable 2D Hand Forecasting from Egocentric Videos [9.3] 2次元手の位置を予測するための既存の手法は視覚的表現に依存しており、主に手動物体の相互作用に焦点を当てている。
本研究では,エゴモーション認識と一般化可能な2次元手指予測手法であるEMAGを提案する。
我々のモデルは、データセット間の評価において、事前メソッドを7.0$%上回る。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:15:18 GMT)
How the Future Works at SOUPS: Analyzing Future Work Statements and Their Impact on Usable Security and Privacy Research [9.3] 2019年のSOUPS手続きから27件の論文をレビューし、今後の作業内容について分析した。
我々は、SoUPS 2019の手続きのほとんどの論文には、将来の作業内容が含まれています。しかし、それらはしばしば、具体的でも曖昧で、見つけやすいものではありません。
我々は、将来の作業内容の実用性を改善するために、使用可能なセキュリティとプライバシのコミュニティへの勧告で締めくくります。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:07:18 GMT)
New Quantum Algorithms for Computing Quantum Entropies and Distances [9.2] 我々は、幅広い量子エントロピーと距離を計算するための一連の量子アルゴリズムを提案する。
提案したアルゴリズムは、低ランクの場合において、先行する最良(および量子)のアルゴリズムよりも著しく優れている。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:25:21 GMT)
BeerReview: A Blockchain-enabled Peer Review Platform [9.1] BeerReviewはブロックチェーン対応のピアレビュープラットフォームである。
これは堅牢なソリューションを提供し、専門家や学者が盗作やセキュリティ上の脅威を心配することなく、レビュープロセスに積極的に参加できるようにする。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:19:13 GMT)
Can't make an Omelette without Breaking some Eggs: Plausible Action Anticipation using Large Video-Language Models [9.0] 実世界において有効なアクションシーケンスを予測するための大規模ビデオ言語モデルであるPlausiVLを紹介する。
本研究では,2つの目的関数,対実的に基づく可視的行動系列学習損失と長期的行動繰り返し損失の2つを導入することで,行動系列の可視性に関する理解を深める。
我々は,Ego4DとEPIC-Kitchens-100の2つの大規模データセットに対するアプローチを評価し,行動予測の課題の改善を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:50:08 GMT)
KerasCV and KerasNLP: Vision and Language Power-Ups [8.9] KerasCVとKerasNLPはコンピュータビジョンと自然言語処理のためのKeras APIの拡張である。
これらのドメインパッケージは、使いやすさとパフォーマンスを重視した高速な実験を可能にするように設計されている。
ライブラリは完全にオープンソース(Apache 2.0ライセンス)で、GitHubから入手できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:58:34 GMT)
Diffusion On Syntax Trees For Program Synthesis [8.9] 大規模言語モデルは一度に1つのトークンを生成する。
彼らの自己回帰生成プロセスは、プログラムの出力を観察するフィードバックを欠いている。
文脈自由文法の構文木で動作する神経拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:31:16 GMT)
DNPM: A Neural Parametric Model for the Synthesis of Facial Geometric Details [8.8] 3次元顔モデリングでは、3DMMが最も広く使われているパラメトリックモデルであるが、アイデンティティや表現入力のみから詳細な幾何学的詳細を生成することはできない。
そこで我々は, 深層ニューラルネットワークを用いて, 詳細やしわを符号化した顔変位図から潜時符号を抽出するDNPMというニューラルパラメトリックモデルを提案する。
DNPMとDetailed3DMMは、音声駆動の詳細な3D顔アニメーションと、劣化画像からの3D顔再構成の2つのダウンストリームアプリケーションに役立つことを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:57:55 GMT)
A Pixel Is Worth More Than One 3D Gaussians in Single-View 3D Reconstruction [8.4] シングルビュー画像から3Dシーン表現を学習することは、コンピュータビジョンにおける長年の根本的な問題である。
本稿では,1つの画素が1つ以上の3次元ガウス値を持つ階層型スプラッター画像法を提案する。
提案手法は,ShapeNet-SRNおよびCO3Dデータセットを用いて,最先端の性能を検証した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:52:52 GMT)
Uncovering Bias in Large Vision-Language Models at Scale with Counterfactuals [8.4] 大規模視覚言語モデル(LVLM)によるテキストに含まれる社会的バイアスについて検討する。
異なる対物集合の画像を条件付けしながら、同一のオープンエンドテキストプロンプトを持つLVLMを提案する。
我々は,この逆ファクト・ジェネレーション・セッティングに基づいて,様々なモデルが生成したテキストを大規模に評価し,一般的なLVLMから5700万以上の応答を生成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:27:56 GMT)
A Multimodal Dangerous State Recognition and Early Warning System for Elderly with Intermittent Dementia [8.3] このシステムは、アンチロススマートヘルメット、クラウドコンピューティングモジュール、および介護者のモバイルデバイス上のインテリジェント早期警告アプリケーションを含む。
このスマートヘルメットは、ミニチュアカメラモジュール、GPSモジュール、および5G通信モジュールを統合し、高齢者のファーストパーソン画像と位置情報を収集する。
クラウドコンピューティングモジュールにおいて、私たちのチームは、高齢者が行方不明になるリスクを正確に評価するために、シーン情報と位置情報に基づくマルチモーダルな危険な状態認識ネットワークを初めて提案しました。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:12:18 GMT)
Randomized Exploration for Reinforcement Learning with Multinomial Logistic Function Approximation [8.3] 多項ロジスティック(MNL)関数近似を用いた強化学習について検討した。
頻繁な後悔の保証を有するランダムな探索を伴う確率的効率のアルゴリズムを提案する。
数値実験により提案アルゴリズムの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:39:19 GMT)
Near-optimal Per-Action Regret Bounds for Sleeping Bandits [8.3] 睡眠中の包帯に対して, 行動毎のほぼ最適な後悔境界を導出する。
合計で$K$、最大で$A$の武器が各ラウンドで$T$以上の場合、最もよく知られている上限は$O(KsqrtTAlnK)$である。
本研究は睡眠専門家のアドバイスで盗賊の設定まで拡張し,その過程でEXP4を一般化する。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:18:21 GMT)
P$^2$-ViT: Power-of-Two Post-Training Quantization and Acceleration for Fully Quantized Vision Transformer [8.2] ビジョントランスフォーマー(ViT)はコンピュータビジョンタスクでは優れているが、メモリ消費と計算集約性がある。
この制限に対処するため、従来の研究はViT調整量子化アルゴリズムを探索してきたが、浮動小数点スケーリング係数は保たれた。
本稿では,最初のアンダーラインPower-of-Two(PoT)アンダーラインポストトレーニング量子化およびアクセラレーションフレームワークであるemphP$2$-ViTを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:26:36 GMT)
Knockout: A simple way to handle missing inputs [8.1] 完全入力を用いた条件分布と部分入力を用いた限界分布の両方を同時に学習する効率的な方法を提案する。
我々のアプローチは一般的であり、低次元および高次元の入力にも適用できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:47:34 GMT)
Physics-Based Rigid Body Object Tracking and Friction Filtering From RGB-D Videos [8.0] 本稿では,RGB-D画像から剛体物体を3次元追跡し,物体の物理的特性を推定する手法を提案する。
実世界のデータセット上で、我々のアプローチを実証し、評価する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:46:20 GMT)
Perplexed by Perplexity: Perplexity-Based Data Pruning With Small Reference Models [8.0] 大規模テキストデータセットの高品質なサブセットを小言語モデルで決定できるかどうかを検討する。
複数のデータセットの合成において、プレトレーニングデータのパープレキシティに基づくプルーニングは、ダウンストリームタスクのパフォーマンスを著しく改善できることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:50:20 GMT)
Lazy Safety Alignment for Large Language Models against Harmful Fine-tuning [7.9] 安全アライメントを備えた大規模言語モデル(LLM)は、有害なデータと混在するデータセットを微調整することで、脱獄することができる。
調整段階の状態を分離して、アライメントとユーザデータセットを最適化することで、脱獄効果を緩和できることを示す。
textbfLazy(textbfi) textbfalignment(textbfLisa)を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:03:37 GMT)
Designing an Evaluation Framework for Large Language Models in Astronomy Research [7.8] 大規模言語モデル(LLM)は科学的研究の仕方を変えつつある。
現在、天文学におけるLLMの使用を評価する基準はない。
天文学研究者がLLMとどのように相互作用するかを評価するための実験設計について述べる。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:00:21 GMT)
S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs [7.8] 投機的復号法(SD)は、LLM推論で実現可能な相当な高速化のために、かなりの量の研究の注目を集めている。
本研究では,Skippy Simultaneous Speculative Decoding (S3D)を提案する。
提案手法は,最小限のアーキテクチャ変更とデータトレーニングを必要としながら,最高のパフォーマンス・メモリ比の1つを達成した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:54:35 GMT)
Arbitrary State Preparation via Quantum Walks [7.8] 動的グラフ上の連続時間量子ウォーク(CTQW)は、最近導入された計算の普遍モデルである。
動的CTQWからゲートモデルへのマッピングをアルゴリズムの形で開発し,任意のエッジウォークと単一セルフループウォークを変換する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:28:23 GMT)
ExU: AI Models for Examining Multilingual Disinformation Narratives and Understanding their Spread [7.7] ExUプロジェクトは、多言語情報分析のためのAIベースのモデルの開発に焦点を当てている。
本稿では,ExUプロジェクトの提案を概説し,ファクトチェックを支援するツールの設計に関するユーザ要件調査の結果を要約する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:13:57 GMT)
Quality-Diversity Actor-Critic: Learning High-Performing and Diverse Behaviors via Value and Successor Features Critics [7.6] QDAC(Quality-Diversity Actor-Critic)は、アクターに批判的な深層強化学習アルゴリズムである。
他の品質多様性手法と比較すると、QDACは性能が著しく高く、振る舞いも多様である。
また、学習したスキルを活用して、他のベースラインよりも5つの摂動環境に適応できることも示しています。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:35:02 GMT)
Simultaneous identification of models and parameters of scientific simulators [7.5] 本研究は,本質的なモデルコンポーネントを特定するためのシミュレーションベースの推論フレームワークを開発する。
いかなる構成シミュレータにも、評価を必要とせずに適用することができる。
非識別のモデルコンポーネントとパラメータを明らかにします。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:15:22 GMT)
AI-enabled prediction of NMR spectroscopy: Deducing 2-D NMR of carbohydrate [7.5] 高度な機械学習と予測アルゴリズムを駆使したAI駆動NMR予測は、NMRスペクトルの解釈を根本的に変えた。
本手法は, 単糖由来の小分子, オリゴ糖, および多糖類の両方に有効である。
2次元NMRの生成に関わる複雑な性質を考えると、我々の目標は、NMRスペクトル分析の精度、効率、理解性を高めるために、AIの可能性を完全に活用することである。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:18:46 GMT)
CurbNet: Curb Detection Framework Based on LiDAR Point Cloud Segmentation [7.5] 本稿では,ポイントクラウドセグメンテーションを利用した検出を抑える新しいフレームワークであるCurbNetを紹介する。
我々はセマンティックKITTIをベースとした3D-Curbデータセットを開発した。
xy平面上の凹凸特性の不均一分布と、z軸に沿った高周波特性への依存による課題に対処するため、マルチスケール・チャネルアテンション(MSCA)モジュールを導入する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:53:21 GMT)
EgoSurgery-Phase: A Dataset of Surgical Phase Recognition from Egocentric Open Surgery Videos [7.4] EgoSurgery-Phaseという位相認識のための新しいエゴセントリックオープン手術ビデオデータセットを導入する。
このデータセットは、9つの異なる手術フェーズにまたがる15時間の実際の手術ビデオで構成されている。
動画の他に、EgoSurgery-Phaseは視線を提供しています。私たちが知る限り、これは外科的位相認識のための、最初のオープンな手術ビデオデータセットです。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:53:19 GMT)
Near-Optimal Algorithms for Differentially Private Online Learning in a Stochastic Environment [7.4] 本研究では,バンディットとフルインフォメーションの両方のフィードバックの下で,オンライン学習環境における個人差分問題について検討する。
差分的な私的盗賊に対しては、UTBとトンプソンサンプリングに基づくアルゴリズムを同時に提案し、最適な$O左(sum_j: Delta_j>0 fracln(T)min leftDelta_j, epsilon right)$ minimax lower boundとする。
同じ差分プライベートなフル情報設定に対しては、$epsilon$-differentially も提示する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:17:20 GMT)
Towards Deeper Understanding of PPR-based Embedding Approaches: A Topological Perspective [7.4] まず、PPR関連行列を分解する最先端の埋め込み手法がクローズドフォームフレームワークに統合可能であることを示す。
そして,この戦略によって生成された埋め込みを逆転して,グラフトポロジ情報をよりよく復元できるかどうかを考察する。
我々の知る限りでは、PPRベースのノード埋め込みアプローチの解釈可能性に焦点を当てた最初の研究である。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:02:23 GMT)
A Staged Approach using Machine Learning and Uncertainty Quantification to Predict the Risk of Hip Fracture [7.3] 本研究は, 高齢者および中高年者における股関節骨折リスクの予測に焦点をあてる。
本稿では,高度な画像と臨床データを組み合わせて予測性能を向上させる新しいステージドモデルを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:01:02 GMT)
Xmodel-VLM: A Simple Baseline for Multimodal Vision Language Model [7.1] 本稿では,最先端のマルチモーダル視覚言語モデルであるXmodel-VLMを紹介する。
コンシューマGPUサーバへの効率的なデプロイのために設計されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:33:03 GMT)
Position: Tensor Networks are a Valuable Asset for Green AI [7.1] 本稿では,テンソルネットワーク(TN)とグリーンAIの基本的な関係を紹介する。
我々は、TNは強力な数学的バックボーンと固有対数圧縮ポテンシャルのため、グリーンAIにとって価値があると論じる。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:53:16 GMT)
Oja's Algorithm for Sparse PCA [7.1] Oja's algorithm for streaming principal Component Analysis (PCA) for $n$ datapoints achieve the same sin-squared error $O(r_mathsfeff/n)$ as the offline algorithm in $O(d)$ space and $O(nd)$ time。
単純なシングルパスプロシージャは、$O(d)$ space と $O(nd)$ time の規則性条件下でのミニマックス誤差を達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:23:03 GMT)
Can the accuracy bias by facial hairstyle be reduced through balancing the training data? [7.1] トレーニングセットが大きくなると、すべての顔の毛髪の認識精度が向上するが、トレーニングセットのサイズに関わらず、顔の毛髪の毛髪が引き起こされる精度の変動が持続することを示す。
以上の結果から, 顔の毛髪は, クリーニングヘア画像と顔の毛髪画像の精度のギャップを生じさせ, この影響はアフリカ系アメリカ人とコーカサス人の間で大きく異なる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:50:39 GMT)
Detecting Out-of-Distribution Through the Lens of Neural Collapse [7.0] アウト・オブ・ディストリビューション(OOD)検出は、AIの安全なデプロイに不可欠である。
ニューラル・コラプス(Neural Collapse)に触発されて、OOD試料の特徴と比較して重量ベクトルに近づいた分布内分布(ID)サンプルの特徴が明らかになった。
我々は,OOD検出における重みベクトルへの特徴近接を利用して,OODサンプルをフィルタする特徴ノルムを用いて,この視点を補うことを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:59:12 GMT)
Improved Out-of-Scope Intent Classification with Dual Encoding and Threshold-based Re-Classification [7.0] 現在の手法は、予測不可能なアウトリーチ分布で困難に直面している。
本稿では,これらの課題に対処するため,Dual for Threshold-Based Re-Classification (DETER)を提案する。
我々のモデルは以前のベンチマークより優れており、未知のインテントに対するF1スコアの13%と5%に向上しています。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:46:42 GMT)
SLM as Guardian: Pioneering AI Safety with Small Language Models [6.8] より大型のモデルにセーフガード機能を組み込むことで、トレーニングコストの上昇と意図しない有用性の低下が問題となった。
本稿では、有害なクエリ検出とセーフガード応答生成の両方に、より小さなLSMを利用する。
提案手法の有効性を実証し,LLMと比較して,有害なクエリ検出およびセーフガード応答性能を同等又は超過する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:03:15 GMT)
SPOT: Text Source Prediction from Originality Score Thresholding [6.8] 対策は誤報を検出することを目的としており、通常、あらゆる情報の関連性を認識するために訓練されたドメイン固有モデルを含む。
情報の有効性を評価する代わりに,信頼の観点からLLM生成テキストを調べることを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:51:01 GMT)
Accuracy of training data and model outputs in Generative AI: CREATe Response to the Information Commissioner Office Consultation [6.7] CREATeは、生成AIの正確性に関する証拠を求めるICOの呼びかけを歓迎している。
私たちは、データ保護法とAI規制の側面を強調して喜んでいます。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:34:49 GMT)
Intuitionistic Quantum Logic Perspective: Static and Dynamic Revision Operators [6.6] 我々は、量子力学に基づくリビジョン理論(自然リビジョン理論)の探求に焦点をあてる。
D"oringとCoeckeによって提案された2つの直観主義量子論理フレームワークの利点を組み合わせる。
量子システムにおける2つの推論モードに対応する2種類のリビジョン演算子(静的および動的リビジョン)を導入する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:13:42 GMT)
Private Mean Estimation with Person-Level Differential Privacy [6.6] 個人が複数のサンプルを持っている場合の個人平均推定について検討する。
我々のアルゴリズムは、よく知られたノイズクラッピング平均法に基づいているが、我々の設定に対する解析は、独立なベクトル値の有界モード変数の和のテールに新しい境界を必要とする。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:20:35 GMT)
Online network topology shapes personal narratives and hashtag generation [6.6] 個人のネットワーク化されたグループは、政治、科学、道徳に関する集合的な議論の中心となる物語を直接貢献し、運営することができます。
本研究では,災害イベントのテキストベースの物語を参加者のネットワークで解釈し,近隣のネットワークと一致するハッシュタグを生成するためのインセンティブを得た,物語とハッシュタグ生成に関するオンラインネットワーク実験の結果を報告する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:10:26 GMT)
DepesRAG: Towards Managing Software Dependencies using Large Language Models [6.5] ソフトウェア依存関係の管理は、ソフトウェア開発における重要なメンテナンスタスクである。
近年のLarge Language Models (LLM) の進歩により、様々なデータソースから情報を取得することができる。
提案手法は,概念検索拡張生成(RAG)手法の実証である。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:05:44 GMT)
CodeTailor: LLM-Powered Personalized Parsons Puzzles for Engaging Support While Learning Programming [6.4] 生成AIは、ほとんどのイントロレベルのプログラミング問題に対するソリューションを作成することができる。
学生はこれらのツールを使って、コードを生成するだけで、エンゲージメントが減り、学習が制限される。
学生にパーソナライズされた支援を提供するために,大規模言語モデル(LLM)を活用するシステムであるCodeTailorを紹介する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:46:29 GMT)
Robust Kernel Hypothesis Testing under Data Corruption [6.4] データ破損下での頑健な置換テストを構築するための2つの一般的な方法を提案する。
最小限の条件下での力の一貫性を証明する。
これは、潜在的な敵攻撃を伴う現実世界のアプリケーションに対する仮説テストの実践的な展開に寄与する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:23:16 GMT)
Open-Set Domain Adaptation for Semantic Segmentation [6.4] 対象ドメインが未知のクラスを含むセマンティック(OSDA-SS)を初めて導入する。
これらの問題に対処するため,BUS を作成したBundary and Unknown Shape-Aware Open-set Domain adaptationを提案する。
我々のBUSは、新しい拡張浸食に基づくコントラスト損失を用いて、未知のクラスと未知のクラスの境界を正確に識別することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:55:19 GMT)
Explainable Data-driven Modeling of Adsorption Energy in Heterogeneous Catalysis [6.3] 本研究の目的は,物理研究とデータ駆動手法のギャップを埋めることである。
我々は、ポストホックXAI分析とシンボリック回帰という2つのXAI技術を採用している。
私たちの仕事は、機械学習技術とXAIを統合する堅牢なフレームワークを確立します。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:06:14 GMT)
Low-dimensional approximations of the conditional law of Volterra processes: a non-positive curvature approach [6.3] ボルテラ過程のボラティリティによる条件付き進化を予測することは、数学的な財政において重要な課題である。
我々は、ボルテラ過程のクラス法則を非正断面曲率の低次元統計多様体に投影する安定次元還元法を開発する。
次に、多様体の幾何に合わせた逐次的に深層学習モデルを導入し、ボルテラ過程の予測条件則を近似することができることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:32:06 GMT)
Federated Causal Inference from Observational Data [6.3] 分散化されたデータソースは、現実世界のアプリケーションで広く使われており、因果推論の深刻な課題となっている。
本稿では,分散データソースから因果効果を推定する枠組みを提案する。
提案フレームワークは,ソース間の生データの交換を回避し,プライバシ保護因果学習に寄与する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:19:34 GMT)
Linguistic Landscape of Generative AI Perception: A Global Twitter Analysis Across 14 Languages [6.3] 私たちは14の言語で680万以上のツイートを分析しました。
本研究は,言語固有のニュアンスを伴って,生成AIの認識のグローバルな傾向を明らかにした。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:19:16 GMT)
Enhancing Performance for Highly Imbalanced Medical Data via Data Regularization in a Federated Learning Setting [6.2] 本手法の目的は,心血管疾患予測のためのモデル性能を向上させることである。
本手法は, 心臓血管疾患予測のための4つのデータセットにまたがって評価され, 異なるクライアントに分散している。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:15:38 GMT)
Enhancing Consistency and Role-Specific Knowledge Capturing by Rebuilding Fictional Character's Persona [6.2] アシスタントAPIは、情報抽出部が毎回異なるため、検索でしばしば達成できない。
Assistants APIへの入力としてペルソナドキュメントを使用することで、一貫性のあるペルソナを維持するのは難しい。
CharacterGPTは、Assistants APIの欠点を軽減する新しいペルソナ再構築フレームワークである。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:44:16 GMT)
Significance of Chain of Thought in Gender Bias Mitigation for English-Dravidian Machine Translation [6.2] 本稿では,Dravidian 族に属する Telugu や Kannada などの言語を対象とした機械翻訳システムにおける性別バイアスについて検討する。
複数の形式がバイアスを低減できるのに対して、個人中心の文は歴史的ステレオタイプによってバイアスを維持できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:26:57 GMT)
FaceLift: Semi-supervised 3D Facial Landmark Localization [6.2] 本稿では,手書きの2Dランドマークを直接持ち上げることで3Dランドマークを学習する,新しい半教師付き学習手法を提案する。
我々は、3D対応のGANを利用して、より優れたマルチビュー一貫性学習と、堅牢なクロスジェネリゼーションのためのマルチフレームビデオを作成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:58:15 GMT)
Confidence-Aware Sub-Structure Beam Search (CABS): Mitigating Hallucination in Structured Data Generation with Large Language Models [6.1] LLM(Large Language Models)における信頼度推定手法は主に、個々のトークンレベルや出力シーケンスレベル全体の信頼度に重点を置いている。
本稿では、構造化データ生成におけるサブ構造レベルで動作する新しい復号法である、信頼性対応サブ構造ビームサーチ(CABS)を提案する。
その結果、CABSは、製品属性生成の問題で平均90%の精度で、構造化データ生成における従来のトークンレベルのビーム探索を16.7%リコールした。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:21:05 GMT)
Promptus: Can Prompts Streaming Replace Video Streaming with Stable Diffusion [6.1] 本稿では,Stable Diffusionによるビデオコンテンツの代わりにプロンプトをストリーミングするシステムであるPromptusを提案する。
その結果, Promptus は VAE と H.265 と比較して知覚品質を0.111 と 0.092 (LPIPS) で向上させることができることがわかった。
われわれの研究は、シャノン限界を超えた効率的なビデオ通信のための新しいパラダイムを開拓する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:16:48 GMT)
May the Dance be with You: Dance Generation Framework for Non-Humanoids [6.0] 人間の映像からダンスを学ぶための非ヒューマノイドエージェントのための枠組みを提案する。
1)光学的フローと音楽の関係を知覚する報酬モデルを訓練する。
実験結果から、生成したダンスの動きが音楽のビートと適切に一致できることが判明した。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:43:55 GMT)
Boost Your Own Human Image Generation Model via Direct Preference Optimization with AI Feedback [6.0] 直接選好最適化(DPO)を利用した人体画像生成に特化した新しいアプローチを提案する。
具体的には、コストのかかる人的フィードバックを必要とせずに、人間の画像生成モデルを訓練するための特殊なDPOデータセットを構築するための効率的な方法を提案する。
本手法は,画像のパーソナライズ・テキスト・ツー・イメージ生成など,画像生成の汎用性と有効性を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:18:05 GMT)
How (not) to Build Quantum PKE in Minicrypt [5.9] 量子ランダムオラクルモデル(QROM)における完全QPKEの可能性を再検討する。
我々の研究は、Impagliazzo と Rudich の結果の完全かつ非条件量子化に向けて大きな一歩を踏み出した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:44:03 GMT)
Policy Trees for Prediction: Interpretable and Adaptive Model Selection for Machine Learning [5.9] 予測モデルやアンサンブルを適応的に選択するための解釈可能なポリシーを導出するツリーベースアプローチであるOP2T(Optimal Predictive-Policy Trees)を導入する。
提案手法は,モデル出力へのアクセスを前提としてのみ,解釈可能かつ適応的なモデル選択と拒否を可能にする。
構造化データと非構造化データの両方を用いた回帰および分類タスクを含む実世界のデータセットに対する我々のアプローチを評価する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:21:33 GMT)
Inconsistency Handling in Prioritized Databases with Universal Constraints: Complexity Analysis and Links with Active Integrity Constraints [5.9] 本稿では,普遍的な制約を備えた一貫性のないデータベースを修復・クエリする問題を再考する。
我々は対称的な差分修復を採用しており、削除と事実の追加の両方を一貫性の回復に利用することができる。
より単純な否定的制約と、事実の削除のみに基づいて定義された、既存の最適修復の概念が、よりリッチな設定に適切に拡張可能であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:36:16 GMT)
Structure Gaussian SLAM with Manhattan World Hypothesis [5.9] 幾何学的精度と完全性を高めるRGB-DシステムであるManhattan Gaussian SLAM(MG-SLAM)を提案する。
MG-SLAMは、構造されたシーンから導かれた融合した線分をシームレスに統合することにより、テクスチャレス屋内領域におけるロバストな追跡を確実にする。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:16:17 GMT)
Knowledge-grounded Adaptation Strategy for Vision-language Models: Building Unique Case-set for Screening Mammograms for Residents Training [5.8] 自然画像とテキストペアに事前訓練された視覚言語モデル(VLM)は、医学的文脈に適用した場合、大きな障壁となる。
本稿では, 選択的サンプリング法と強陰性マイニング法を用いて, VLMを医療領域に適応させるフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:04:36 GMT)
Trust-based Consensus in Multi-Agent Reinforcement Learning Systems [5.8] マルチエージェント強化学習(MARL)における信頼できないエージェントの問題について検討する。
本稿では、分散的信頼機構である強化学習に基づく信頼合意(RLTC)を提案する。
高いコンセンサスの成功率によって証明されるように、信頼できないエージェントを効果的に扱えることを実証的に実証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:04:27 GMT)
Knowledge Graph Tuning: Real-time Large Language Model Personalization based on Human Feedback [5.8] 大規模言語モデル(LLM)をパーソナライズするための知識グラフチューニング(KGT)を提案する。
KGTは、ユーザのクエリとフィードバックからパーソナライズされた事実知識を抽出し、LLMパラメータを変更することなくKGを最適化する。
GPT-2、Llama2、Llama3を含む最先端のLLMによる実験では、KGTはレイテンシとGPUメモリコストを削減しつつ、パーソナライズ性能を著しく改善している。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:57:03 GMT)
CoSy: Evaluating Textual Explanations of Neurons [5.7] ディープニューラルネットワーク(DNN)の複雑な性質を理解する上で重要な側面は、潜在表現の中で学習された概念を説明する能力である。
潜在ニューロンのテキスト説明の質を評価するための新しいフレームワークであるCoSyを紹介する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:04 GMT)
Complexity of Deciding Injectivity and Surjectivity of ReLU Neural Networks [5.5] ReLU層の単射率を決定するためのcoNP完全性を証明する。
1次元出力を持つ2層ReLUネットワークのサージェクティビティも特徴付ける。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:14:34 GMT)
Intelligent Go-Explore: Standing on the Shoulders of Giant Foundation Models [5.4] Go-Exploreは、ハード探索問題を解決するために設計されたアルゴリズムの強力なファミリーである。
本稿では,従来の Go-Explore の範囲を大きく広げる Intelligent Go-Explore (IGE) を提案する。
IGEには人間のような能力があり、新しい状態がいかに面白く、あるいは有望であるかを直感的に識別する能力がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:48:44 GMT)
Hiding Your Awful Online Choices Made More Efficient and Secure: A New Privacy-Aware Recommender System [5.4] 本稿では,プライバシを意識した機械学習アルゴリズムを実用的スケーラビリティと効率のために組み合わせた,プライバシを意識した新たなレコメンデーションシステムを提案する。
メモリ制約の低消費電力SOC(System on Chip)デバイスであっても,1億エントリを含むデータセットのプライベートレコメンデーションを初めて計算可能にする。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:08:42 GMT)
Variance reduction techniques for stochastic proximal point algorithms [5.4] 本稿では,近点アルゴリズムにおける分散低減手法の統一化研究を提案する。
本稿では,SVRG,SAGA,およびそれらの変種を滑らかで凸関数の近位バージョンとして指定できる汎用的近位アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:26:54 GMT)
CSANet: Channel Spatial Attention Network for Robust 3D Face Alignment and Reconstruction [5.2] 私たちのモデルのバックボーンは、分離可能な畳み込みによってBottle-Neck構造によって構築されます。
コーディネート・アテンション・メカニズムと空間群ワイド・エンハンスメントを統合し,より代表的な特徴を抽出する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:20:37 GMT)
Autonomous Driving with Spiking Neural Networks [5.2] Spiking Autonomous Driving (名前)は、自律運転システムによって直面するエネルギー問題に対処する最初の統合スパイキングニューラルネットワーク(SNN)である。
SADはエンドツーエンドでトレーニングされており、知覚、予測、計画という3つの主要なモジュールで構成されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:57:54 GMT)
Jina CLIP: Your CLIP Model Is Also Your Text Retriever [5.1] Contrastive Language-Image Pretraining (CLIP) は、一般的な埋め込み空間における画像とテキストを固定サイズのベクトルにマッピングすることで、モデルをトレーニングするために広く使われている。
本稿では,この問題に対処する新しいマルチタスクコントラストトレーニング手法を提案し,テキスト画像とテキストテキスト検索の両タスクにおける最先端性能を実現するために,jina-clip-v1モデルをトレーニングするために使用する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:07:54 GMT)
Medication Recommendation via Dual Molecular Modalities and Multi-Substructure Distillation [5.0] 医薬推奨は、患者の医療履歴とバイオメディカル知識を組み合わせることで、医師が薬の組合せをより正確かつ安全に決定するのを手助けする。
分子知識に基づく既存のアプローチは、分子の原子的幾何学構造を見落とし、薬の高次元的特性と本質的な物理的性質を捉えられなかった。
3次元分子構造と原子特性を組み込んだBiMoRecを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:13:08 GMT)
Statistical Properties of Robust Satisficing [5.0] Robust Satisficing(RS)モデルは、堅牢な最適化に対する新たなアプローチである。
本稿では,RSモデルの理論的特性を包括的に解析する。
実験の結果,RSモデルは小サンプル体制における基礎的経験的リスクを常に上回ることがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:57:28 GMT)
Deep Modeling of Non-Gaussian Aleatoric Uncertainty [5.0] ディープラーニングは、ロボット推定システムにおけるアレタリック不確実性を正確にモデル化する、有望な新しい方法を提供する。
本研究では,条件付き確率密度モデリングのための3つの基礎的深層学習手法を定式化し,評価する。
以上の結果から,これらの深層学習手法は複雑な不確実性パターンを正確に把握し,評価システムの信頼性と堅牢性を向上させる可能性を強調した。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:13:17 GMT)
Dynamic feature selection in medical predictive monitoring by reinforcement learning [5.0] 多くの既存特徴選択手法は時系列情報を効果的に活用するには不十分である。
我々は、最大限のコスト制約の下でポリシーを最適化するために強化学習を採用する。
我々の手法は、微分不可能な予測モデルとシームレスに統合できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:21:11 GMT)
Bilevel reinforcement learning via the development of hyper-gradient without lower-level convexity [4.9] 2段階強化学習 (RL) は2段階間問題を特徴とする。
低レベルの凸性の本質的な過度勾配を特徴付ける。
モデルベースとモデルフリーの2段階強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:24:20 GMT)
Phase Transitions in the Anisotropic Dicke-Stark Model with A-square terms [4.8] 標準等方性ディックモデルにおける超ラジカル相転移の禁止
SRPTは0温度と有限温度の両方で起こりうることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:43:36 GMT)
Leveraging Structure Between Environments: Phylogenetic Regularization Incentivizes Disentangled Representations [4.8] 因果表現学習は、経路活性化のような潜伏変数の推測を可能にすることによって科学的理解を促進することができる。
我々は複数の関連するデータセット(環境)とタスクから潜伏変数を推定する手法を開発した。
木に基づく規則化(TBR)は,予測誤差を最小化し,関連する環境を規則化し,類似の予測子を学習する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:08:14 GMT)
Robust Explainer Recommendation for Time Series Classification [4.8] 時系列分類は、人間の活動認識、スポーツ分析、一般的な感覚といった分野に共通する課題である。
近年,サリエンシマップの形での説明を提供するため,時系列に多種多様な手法が提案され,適用されている。
本稿では,時系列分類のための説明手法を定量的に評価し,ランク付けするための新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:26:06 GMT)
Learning Robust Correlation with Foundation Model for Weakly-Supervised Few-Shot Segmentation [4.7] 既存の数ショットセグメンテーション(FSS)は、正確なピクセルマスクの下で学習支援-クエリ相関と見えないカテゴリのセグメンテーションのみを考慮する。
本稿では、より困難なシナリオとして、分類(画像レベル)のみを提供するWS-FSS(弱教師付き小ショットセグメンテーション)を考える。
生成されたマスクが不正確なときに、堅牢なサポートクエリ情報を学ぶ必要がある。
本研究では,多情報ガイダンスを用いた相関強化ネットワーク(CORENet)を基礎モデルで設計し,相関関係の堅牢さを学習する。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:42:58 GMT)
Experimental demonstration of magnetic tunnel junction-based computational random-access memory [4.6] 「計算ランダムアクセスメモリ(CRAM)が登場し、この基本的限界に対処している」
CRAMは、データがメモリを離れることなく、メモリセルを直接使用するロジック操作を実行する。
テクノロジーは、マシンインテリジェンスの電力とエネルギーを消費する応用に大きな影響を与える可能性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:17:30 GMT)
Relation Modeling and Distillation for Learning with Noisy Labels [4.6] 本稿では,自己教師型学習を通して,サンプル間の関係をモデル化する関係モデリングと蒸留の枠組みを提案する。
提案手法は,ノイズの多いデータに対する識別表現を学習し,既存の手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:47:27 GMT)
FlexiDrop: Theoretical Insights and Practical Advances in Random Dropout Method on GNNs [4.5] 本稿ではFlexiDropと呼ばれるグラフニューラルネットワーク(GNN)のための新しいランダムドロップアウト手法を提案する。
本研究では, モデル複雑性と一般化能力のトレードオフを理論的にバランスさせることにより, ドロップアウト率を適応的に調整できることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:48:44 GMT)
Enhancing Sufficient Dimension Reduction via Hellinger Correlation [4.4] 単一インデックスモデルにおける十分次元還元(SDR)の新しい理論と手法を開発する。
私たちの研究は、依存関係の尺度としてのHellinger相関の導入によって動機付けられています。
本研究では,提案手法が既存のSDR法を大幅に向上し,性能を向上することを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:29:12 GMT)
Single-electron qubits based on quantum ring states on solid neon surface [4.3] 固体ネオン表面(eNe)に閉じ込められた単一電子は、電荷量子ビットのための有望なプラットフォームとして最近出現している。
表面のバンプが自然に電子に結合し、ユニークな量子リング状態を形成することを示す。
また、電子の励起エネルギーを極小磁場で調整し、量子ビット演算を容易にすることも示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:40:39 GMT)
DataSP: A Differential All-to-All Shortest Path Algorithm for Learning Costs and Predicting Paths with Context [4.2] 本稿では,トラジェクトリからの遅延コストの学習を容易にするために,DataSPを提案する。
コンテキスト特徴からの複雑な遅延コスト関数は、ニューラルネットワーク近似を通じてアルゴリズムで表現することができる。
データSPは,グラフ上での経路予測において,最先端の機械学習手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:04:17 GMT)
Interpretable classifiers for tabular data via discretization and feature selection [4.2] 表データから人間の解釈可能かつ正確な分類器を即座に計算する手法を提案する。
この手法を13の実験によって実証し、ランダムな森林、XGBoost、および文献における同じデータセットに対する既存の結果と同等の精度で結果を得る。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:12:54 GMT)
Testing in the Evolving World of DL Systems:Insights from Python GitHub Projects [4.2] 本研究では、GitHubのDLプロジェクトにおけるテストプラクティスについて調査する。
テスト自動化、テストの種類(ユニットテスト、インテグレーション、システムなど)、テストスイートの成長率、さまざまなプロジェクトバージョンにおけるテストプラクティスの進化といった側面に焦点を当てています。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:58:05 GMT)
Automated Multi-Task Learning for Joint Disease Prediction on Electronic Health Records [4.2] 本稿では,タスクグループとアーキテクチャの最適構成を同時に検索できるAutoDPという自動手法を提案する。
ハンドクラフトと自動化された最先端の手法の両方に対して大幅な性能向上を実現し、同時に検索コストを同時に維持する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:44:00 GMT)
SEA Cache: A Performance-Efficient Countermeasure for Contention-based Attacks [4.1] 既存のセキュアキャッシュ設計であるCEASER-SHキャッシュを拡張し,SEAキャッシュを提案する。
両方のキャッシュにおける新しいキャッシュ構成は論理的連想性であり、キャッシュラインをマッピングされたキャッシュセットだけでなく、その後のキャッシュセットにも配置することができる。
8の論理的連想性を持つCEASER-SHキャッシュと比較すると、通常の保護ユーザに対して1の論理的連想性を持つSEAキャッシュ、高保護ユーザに対して16のSEAキャッシュは、通常の保護下でのユーザに対して約0.6%減少し、競合ベースの攻撃に対するより優れたセキュリティを提供するCycles Per Instructionペナルティを持つ。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:12:53 GMT)
Gradient Inversion of Federated Diffusion Models [4.1] 拡散モデルは、非常に高解像度の画像データを生成する欠陥生成モデルになりつつある。
本稿では,勾配反転攻撃のプライバシーリスクについて検討する。
本稿では,未知データの最適化をコーディネートする三重最適化GIDM+を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:00:03 GMT)
SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems [4.0] 本稿では,言語がシミュレートされたシステムと対話するために使用される代理モデリングのための学習フレームワークを提案する。
システムの言語記述を「システムキャプション」または「システムキャプション」と呼ぶ。
複素エネルギーシステムの実世界の2つのシミュレータに対して,マルチモーダルテキストと時系列回帰モデルを訓練する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:12:04 GMT)
Unraveling hydrodynamization using ultracold 1D gases [4.0] 数種類の高エネルギークエンチの変種の後すぐに1次元ボース気体の量子進化を研究する。
我々の発見には普遍的な性格があり、これは突然の高エネルギークエンチの後、相互作用する多体量子系の短時間の挙動に適用できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:00:01 GMT)
Efficient Trajectory Inference in Wasserstein Space Using Consecutive Averaging [3.9] 軌道推論は、そのような観測から連続的な過程を再構築する挑戦を扱う。
ワッサーシュタイン空間に直交する連続平均化による点雲のB-スプライン近似法を提案する。
コンバージェンス保証を提供し、シミュレーションセルデータ上でテストすることで、我々の手法を厳格に評価する。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:19:20 GMT)
Flexible SE(2) graph neural networks with applications to PDE surrogates [3.8] 表現を主軸に整合させることで、SE(2) の等式を保ちながら多くの制約を回避できることが示される。
流体流動シミュレーションのサロゲートとして本モデルを適用し,非同変モデルに対して徹底的なベンチマークを行い,データ効率と精度の両面で有意な向上を示した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:39:15 GMT)
The Merit of River Network Topology for Neural Flood Forecasting [3.7] 気候変動は河川の洪水を悪化させ、その頻度と強度はかつてないほど高くなる。
予測システムは通常、正確な川の排出予測に依存している。
河川ネットワークの既知のトポロジを予測モデルに組み込むことで,ゲージ間の隣接関係を活用できる可能性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:45:45 GMT)
Benchmarking Skeleton-based Motion Encoder Models for Clinical Applications: Estimating Parkinson's Disease Severity in Walking Sequences [3.7] PD患者の歩行パターンを解析するための大規模人間の動作データセットを訓練した一般人動作エンコーダ。
運動障害社会の予測能力について,6つの事前訓練されたヒト運動エンコーダモデルの評価を行った。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:40:23 GMT)
A Novel Approach for Automated Design Information Mining from Issue Logs [3.6] DRMinerは、オープンソースコミュニティにおける開発者のライブディスカッションから、潜在設計の根拠を自動的に掘り下げる新しい方法である。
私たちはJiraのCassandra、Flink、Solrリポジトリからイシューログを取得し、それを注釈付けして厳格なスキームで処理します。
DRMinerは設計の合理性についてF1スコアを65%獲得し、GPT-4.0よりも7%向上した。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:20:04 GMT)
Algebraic and Statistical Properties of the Ordinary Least Squares Interpolator [3.4] 我々は最小$ell$-norm OLS補間器について結果を提供する。
ガウス・マルコフの定理の拡張のような統計的結果を示す。
我々はOLS補間器の特性をさらに探求するシミュレーションを行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:43:44 GMT)
Planetary Causal Inference: Implications for the Geography of Poverty [3.4] 近年、EOデータを用いた空間経済効果の予測だけでなく、原因や効果についても研究が進められている。
本稿では、まず、因果領域におけるEO-ML分析への関心の高まりについて述べる。
因果MLパイプラインでEOデータを使用する4つの方法について議論する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:48:10 GMT)
Game Generation via Large Language Models [3.4] 本稿では,大言語モデル(LLM)を用いたゲーム生成について検討する。
ゲーム記述言語に基づいて,ゲームルールとレベルを同時に生成するLLMベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:17:00 GMT)
Just Rewrite It Again: A Post-Processing Method for Enhanced Semantic Similarity and Privacy Preservation of Differentially Private Rewritten Text [3.4] 本稿では,書き直したテキストを元のテキストと整合させることを目標とした,簡単な後処理手法を提案する。
以上の結果から,このような手法は,従来の入力よりも意味論的に類似した出力を生成するだけでなく,経験的プライバシ評価において平均的なスコアがよいテキストを生成することが示唆された。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:41:33 GMT)
Nadine: An LLM-driven Intelligent Social Robot with Affective Capabilities and Human-like Memory [3.4] Nadineプラットフォームのためのインテリジェントで堅牢なソーシャルロボティクスシステムを開発するための当社のアプローチについて説明する。
我々は,Large Language Models(LLMs)を統合し,これらのモデルの強力な推論と命令追従機能を巧みに活用することで,これを実現する。
このアプローチは、人間のような長期記憶や洗練された感情評価を実装しない、現在最先端のLCMベースのエージェントと比較して、斬新である。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:55:41 GMT)
Efficacy of ByT5 in Multilingual Translation of Biblical Texts for Underrepresented Languages [3.3] 本研究では,ByT5をベースとした多言語翻訳モデルの開発と評価を行った。
我々は、文字ベースおよび形態学的に豊かな言語の複雑なニュアンスを捉えるために、モデルを訓練した。
BLEUスコアで測定し,サンプル翻訳を補足した結果,本モデルが神文へのアクセシビリティを向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:42:45 GMT)
Enhancing Plant Disease Detection: A Novel CNN-Based Approach with Tensor Subspace Learning and HOWSVD-MD [3.3] 本稿では,トマト葉病の検出・分類のための最先端技術を紹介する。
本稿では,高次白色特異値分解(Higher-Order Whitened Singular Value Decomposition)と呼ばれる部分空間学習領域における高度なアプローチを提案する。
このイノベーティブな手法の有効性は、2つの異なるデータセットに関する包括的な実験を通じて厳密に検証された。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:46:56 GMT)
Soft Partitioning of Latent Space for Semantic Channel Equalization [3.3] 本研究では,タスク構造が意味空間と行動空間の1対1マッピングを伴うシナリオにおける意味空間分割の役割について検討する。
本稿では, ソフトデコーダの出力を利用して, セマンティック空間の構造をより包括的に理解する分割の原子を導出するソフトな基準を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:16:19 GMT)
Resilience of Deep Learning applications: a systematic literature review of analysis and hardening techniques [3.3] このレビューは、2019年1月から2024年3月までに発行された220の科学論文に基づいている。
著者らは、研究の類似点と特異点を解釈し、強調するために分類フレームワークを採用している。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:02:53 GMT)
Abstract Weighted Based Gradual Semantics in Argumentation Theory [3.3] 段階的意味論と受容可能性度を結びつける4つの重要な問題を導入する。
まず、逆問題を再検討し、議論フレームワークの引数重みを特定して、特定の最終的な受容可能性の度合いを導いた。
第三に、議論の受理度が考慮されるのではなく、選好時に議論の重みが見つかるかどうかを問う。
第4に、この空間に「ギャップ」が存在するかどうかを問う、有効な受容可能性次数の空間の位相を考える。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:16:50 GMT)
Learning 3D Robotics Perception using Inductive Priors [3.2] この論文は、構造化された帰納的バイアスと設計アプローチとアルゴリズムの先行による学習のトピックをカバーしている。
3つの異なるロボット認識問題における事前知識の活用を実証する。
ロボット工学の3D知覚タスクを解くためのこれらの先行研究を行い、それらをディープラーニングモデルに効率的にエンコードする方法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:51 GMT)
PGA-SciRE: Harnessing LLM on Data Augmentation for Enhancing Scientific Relation Extraction [3.1] 関係抽出(RE)は、テキストに言及されたエンティティのペア間の関係を認識することを目的としている。
本稿では,学術領域におけるREモデルの性能向上のためのPGAというフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:07:54 GMT)
Optimizing Photometric Light Curve Analysis: Evaluating Scipy's Minimize Function for Eclipse Mapping of Cataclysmic Variables [3.1] 日食マッピング法はPythonおよび本質的なライブラリを用いて徹底的に研究・実装されている。
この分析は、ガウス重み付けのばらつき、ディスク画像の解像度、光曲線におけるデータ点数、制約度など、計算時間と画質に影響を与えるいくつかの要因について示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:57:52 GMT)
A Hardware-Efficient EMG Decoder with an Attractor-based Neural Network for Next-Generation Hand Prostheses [3.0] 現在の商用のロボット義手(RPH)は、基本的なオン/オフコマンドによる限定的な制御を提供する。
機械学習の最近の進歩は、より高い自由度で指の動きを復号できる。
本稿では,次世代携帯型RPHのオンチップ動作復号化を実現するために,新たなアトラクタベースニューラルネットワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:38:28 GMT)
GaussianRoom: Improving 3D Gaussian Splatting with SDF Guidance and Monocular Cues for Indoor Scene Reconstruction [3.0] ニューラルネットワークSDFと3DGSを統合した統合フレームワークを提案する。
このフレームワークには学習可能なニューラルネットワークSDFフィールドが組み込まれており、ガウスの密度化と刈り取りをガイドしている。
本手法は, 表面再構成と新しいビュー合成の両面において, 最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:46:59 GMT)
YotoR-You Only Transform One Representation [3.0] YotoR(You Only Transform One Representation)は、Swin TransformerとYoloRアーキテクチャを組み合わせた、オブジェクト検出のための新しいディープラーニングモデルである。
自然言語処理の革命的技術であるTransformersは、コンピュータビジョンにも大きな影響を与え、精度と計算効率を高める可能性を提供している。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:27:56 GMT)
Efficient Stimuli Generation using Reinforcement Learning in Design Verification [3.0] Reinforcement Learning (RL) は、Reinforcement Learning (RL) の助けを借りて効率的な刺激を生成するために提案され、Design Under Verification (DUV) の最大コードカバレッジに到達する。
本稿では,Reinforcement Learning (RL) の助けを借りて効率的な刺激を生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:23:04 GMT)
Tight Characterizations for Preprocessing against Cryptographic Salting [2.9] ソルティングはプリミティブに少量の暗号ランダム性を供給することで前処理攻撃に対抗する戦略である。
暗号ソルトに対する前処理の一般的な特徴と厳密な特徴について述べる。
我々の証明は、ソルトゲームにおける一様でないセキュリティと、メモリレスアルゴリズムの直接積定理との間の新しい接続を生かしている。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:34:25 GMT)
Image Deraining with Frequency-Enhanced State Space Model [2.9] 本研究では,降雨除去のための状態空間モデル(SSM)を導入し,DFSSM(Deraining Frequency-Enhanced State Space Model)を提案する。
特定の方向に高強度の周波数成分を発生させる雨害を効果的に除去するために,SSMと並列に周波数領域処理を用いる。
我々は,複数のカーネルサイズを持つ畳み込みを用いて,様々なスケールの劣化を効果的に捕捉する,新しい混合スケールゲート畳み込みブロックを開発した。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:57:57 GMT)
Training-efficient density quantum machine learning [2.9] 量子機械学習は強力でフレキシブルで効率的にトレーニング可能なモデルを必要とする。
トレーニング可能なユニタリの集合にランダム化を組み込んだ学習モデルである密度量子ニューラルネットワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:40:28 GMT)
Student Answer Forecasting: Transformer-Driven Answer Choice Prediction for Language Learning [2.9] 近年の研究では、学生の特定の解答選択に対するパフォーマンスよりも、解答の正しさに焦点が当てられている。
MCQStudentBertは,学生の回答履歴の文脈的理解と質問や回答のテキストを統合した回答予測モデルである。
この作業は、よりパーソナライズされたコンテンツ、モジュール化、そして粒度の細かいサポートへの扉を開く。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:09:43 GMT)
Entropy annealing for policy mirror descent in continuous time and space [2.8] 本研究では、エントロピー規則化値関数の勾配に基づいてポリシーを更新する連続時間ポリシーミラー降下ダイナミクスを解析する。
固定エントロピーレベルでは、力学は正規化問題の最適解に指数関数的に収束する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:02:18 GMT)
Spatiotemporal Predictions of Toxic Urban Plumes Using Deep Learning [2.8] コンピュータモデルは通常、流体方程式を解くことによって有毒なプラムの輸送を予測するために用いられる。
本稿では,プラムの挙動を管理する数学的方程式から着想を得たSTGasNetという新しい学習モデルを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:18:20 GMT)
SPA: Towards A Computational Friendly Cloud-Base and On-Devices Collaboration Seq2seq Personalized Generation [2.8] 大規模な言語モデルは、低リソースのデバイスにかなりのメモリストレージを必要とする。
本稿では,デバイス上で高速な推論を行う軽量アーキテクチャであるSPA(Side on Adaption)を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:21:23 GMT)
HLOB -- Information Persistence and Structure in Limit Order Books [2.8] 本稿では,制約順序書の中間価格変化予測のための大規模ディープラーニングモデルについて紹介し,HLOBと命名する。
我々は、NASDAQ取引所で取引された15株を含む3つの現実世界のLimit Order Bookデータセット上で、9つの最先端のディープラーニング代替品に対して、我々のモデルをテストした。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:29:36 GMT)
Privacy Issues in Large Language Models: A Survey [2.7] これは、大規模言語モデル(LLM)におけるプライバシー問題に焦点を当てたAI研究の活発な領域に関する最初の調査である。
私たちは、プライバシのリスクを強調し、トレーニングや推論プロセスにプライバシを構築しようと試み、著作権の問題を軽減するために、レッドチームでモデルを設計する作業に重点を置いています。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:26:05 GMT)
Exact quantum dynamics for two-level systems with time-dependent driving [2.7] 時間依存シュル・オーディンガー方程式は、非常に稀な場合にのみ正確に解ける。
量子ビットに対するシュリンガー方程式のほぼ無限個の解析支援解を生成する方法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:36:45 GMT)
Federated and Transfer Learning for Cancer Detection Based on Image Analysis [2.7] 本稿では,画像解析に基づくがん検出におけるフェデレートラーニング(FL)とトランスファーラーニング(TL)の役割について論じる。
FLは、集中的なデータ共有を必要とせずに、複数のサイトに分散したデータ上での機械学習モデルのトレーニングを可能にする。
TLは、あるタスクから別のタスクへの知識の転送を可能にする。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:07:30 GMT)
Detecting Errors in a Quantum Network with Pauli Checks [2.7] 量子エラー検出方式であるPauli check sandwiching (PCS) を分散マルチパーティプロトコルにすることで量子ネットワークに適用する。
PCSは距離1の符号であり、標準的な量子誤り訂正と検出方法よりも少ないリソースを必要とする。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:53:32 GMT)
Identifiability of a statistical model with two latent vectors: Importance of the dimensionality relation and application to graph embedding [2.7] 統計モデルの識別可能性は、教師なし表現学習における鍵となる概念である。
本稿では,非線形ICAを一般化した1つの補助データを持つ2つの潜在ベクトルの統計モデルを提案する。
意外なことに,提案モデルの不確定性は,ある条件下ではEmphlinear ICAと同一であることが証明された。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:11:20 GMT)
Automated Generation and Tagging of Knowledge Components from Multiple-Choice Questions [2.7] 我々はGPT-4を用いて、化学とE-ラーニングにおけるマルチチョイス質問(MCQ)のためのKCを生成する。
我々は,Large Language Model (LLM) によるKCと人間によるKCの相違について分析した。
また,その内容に基づいて類似したKCをクラスタリングする帰納的アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:57:49 GMT)
Growing Tiny Networks: Spotting Expressivity Bottlenecks and Fixing Them Optimally [2.6] 機械学習タスクでは、ある機能空間内で最適な関数を探索する。
この方法で、トレーニング中の機能の進化を、選択したアーキテクチャで表現可能な領域内に配置させます。
表現力のボトルネックによる望ましいアーキテクチャ変更に関する情報は, 後処理の % から抽出可能であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:23:56 GMT)
Dual sparse training framework: inducing activation map sparsity via Transformed $\ell1$ regularization [2.6] 本稿では,Transformed $ell1$ regularizationに基づいて,アクティベーションマップの間隔を推定する手法を提案する。
以前の方法と比較すると、transformed $ell1$ はより高い空間性を実現し、異なるネットワーク構造に適応できる。
デュアルスパーストレーニングフレームワークは、計算負荷を大幅に削減し、実行時に必要なストレージを削減できる可能性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:11:21 GMT)
Multi-Region Markovian Gaussian Process: An Efficient Method to Discover Directional Communications Across Multiple Brain Regions [2.6] 主なカテゴリはガウス過程(GP)と線形力学系(LDS)である。
マルチ出力GP, Multi-Region Markovian Gaussian Process (MRM-GP) をミラーする LDS を作成する。
我々の研究は、LDSとマルチ出力GPの接続を確立し、ニューラル記録の潜在空間内の周波数と位相遅延を明示的にモデル化する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:35:58 GMT)
Simulator-Free Visual Domain Randomization via Video Games [2.6] ドメインランダム化(Domain randomization)は、視覚的に異なる領域にまたがる視覚モデルの伝達可能性を改善する効果的な手法である。
本稿では,ドメインランダム化のためのビデオ理解フレームワークであるBehAVEを紹介する。
BehAVEの下では、ビデオゲームの本質的なリッチな視覚的多様性がランダム化の源として機能する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:04:36 GMT)
AgentClinic: a multimodal agent benchmark to evaluate AI in simulated clinical environments [2.6] 本稿では,臨床シミュレーション環境における大規模言語モデル(LLM)の評価のためのベンチマークであるAgentClinicを提案する。
本ベンチマークでは,医師は対話や活動的データ収集を通じて患者の診断を明らかにする必要がある。
偏見の導入は, 医師の診断精度を大幅に低下させるとともに, 患者エージェントのコンプライアンス, 信頼度, フォローアップ意欲を低下させる。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:56:17 GMT)
Scalable Detection of Salient Entities in News Articles [2.6] 本研究は, 微調整事前学習型変圧器モデルを用いて, 効率的かつ効果的に有意な実体検出を行うための新しいアプローチについて検討する。
また,それらの精度に影響を与えることなく,これらのモデルの計算コストを効果的に削減するための知識蒸留技術についても検討する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:16:27 GMT)
VQA Training Sets are Self-play Environments for Generating Few-shot Pools [2.6] 本稿では,タスクメトリクスを報酬として計算環境を構築するために,既存のトレーニングセットを直接利用できる手法を提案する。
提案手法は、ゼロショットプロンプトから始まり、トレーニングセット上のタスクメトリックを最大化する少数ショット例を選択することにより、反復的にそれらを洗練する。
我々の実験では、GeminiがScreenAIのようなより小型で特殊なモデルを使って、トレーニングセットのパフォーマンスを反復的に改善する方法を実証している。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:38:58 GMT)
Identifying Drivers of Predictive Aleatoric Uncertainty [2.5] 本稿では,予測的アレタリック不確実性を説明するための簡単なアプローチを提案する。
我々は、ガウス出力分布にニューラルネットワークを適用することにより、不確実性を予測分散として推定する。
我々は、実世界のデータセットを含むニュアンスなベンチマーク分析を用いて、この結果の定量化を行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:48:06 GMT)
OTMatch: Improving Semi-Supervised Learning with Optimal Transport [2.4] 我々はOTMatchと呼ばれる新しい手法を提案する。OTMatchはクラス間の意味的関係を利用して、最適輸送損失関数を用いて分布を一致させる。
実験結果から,本手法のベースライン上における改善が示され,半教師付き環境での学習性能向上に意味的関係を活用する上でのアプローチの有効性と優位性が示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:53:23 GMT)
Efficient Information Reconciliation for High-Dimensional Quantum Key Distribution [2.4] 本稿では,高次元QKDシステムにおける2つの新しい和解手法を提案する。
これらの手法は非バイナリLDPC符号とカスケードアルゴリズムに基づいており、q-ary対称チャネル上のSlepian-Wolf境界に近い効率を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:36:11 GMT)
Video Question Answering for People with Visual Impairments Using an Egocentric 360-Degree Camera [2.4] 本稿では,視覚障害者が直面する日常的課題,例えば情報へのアクセス制限,ナビゲーションの困難,社会的相互作用への障壁について論じる。
これらの課題を軽減するために、我々は新しい視覚的質問応答データセットを導入する。
ビデオは360度エゴセントリックなウェアラブルカメラで撮影され、周囲全体を観察することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:02:05 GMT)
SurgiTrack: Fine-Grained Multi-Class Multi-Tool Tracking in Surgical Videos [2.4] この研究は、外科的ツールトラッキングの新しい標準を設定し、最小侵襲の手術に対してより適応的で正確な支援を行うためのダイナミックな軌跡を提供する。
本稿では,ツール検出にYOLOv7を活用する新しいディープラーニング手法であるSurgiTrackを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:59:10 GMT)
Heidelberg-Boston @ SIGTYP 2024 Shared Task: Enhancing Low-Resource Language Analysis With Character-Aware Hierarchical Transformers [2.3] この研究は、13の歴史的言語に対するPoSタグ、形態的タグ付け、および補題化に焦点を当てている。
我々は、Sunなど(2023年)の階層的トークン化手法を適用し、DeBERTa-V3アーキテクチャの利点と組み合わせる。
私たちのモデルは制約付きサブタスクで1位を獲得し、制約のないタスクの勝者のパフォーマンスレベルにほぼ到達しました。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:23:34 GMT)
IsraParlTweet: The Israeli Parliamentary and Twitter Resource [2.2] IsraParlTweetは、1992-2023年のKnesset(イスラエル議会)と2008-2023年のKnessetのメンバーによるTwitter投稿のリンクコーパスである。
IsraParlTweetは、さまざまな量的および質的な分析を行い、イスラエルの政治談話に関する貴重な洞察を提供するために使用することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:21:15 GMT)
Comparing Quantum Annealing and Spiking Neuromorphic Computing for Sampling Binary Sparse Coding QUBO Problems [2.2] 画像と超完全で非正規基底が与えられた場合、与えられた入力を最もよく再構成する最小のベクトル集合を示すスパース二進ベクトルを求める。
これにより二次二元最適化問題 (QUBO) が得られ、その最適解は一般にNPハードである。
次に、小さな埋め込みによるペガサスチップ接続を備えたD-Waveアニーラーと、Intel Loihi 2のスパイクニューロモルフィックプロセッサの両方に実装することで、スパース表現QUBOを解決する。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:56:15 GMT)
Understanding Memory-Regret Trade-Off for Streaming Stochastic Multi-Armed Bandits [2.2] P$-passストリーミングモデルにおけるマルチアームバンディット問題について検討する。
最適後悔を$m, n$および$P$で完全に特徴づける。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:56:48 GMT)
Applications of interpretable deep learning in neuroimaging: a comprehensive review [2.1] 本研究は,解釈可能な深層学習法(iDL)の神経画像応用に関する文献を体系的にレビューした。
文献で最もよく使われているiDLアプローチは、神経画像データに最適である可能性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:52:13 GMT)
Out-of-distribution Reject Option Method for Dataset Shift Problem in Early Disease Onset Prediction [2.1] 本稿では,データセットのシフト効果を低減させるために,予測(ODROP)のアウト・オブ・ディストリビューション・リジェクションオプションを提案する。
ODROPは、OOD検出モデルを統合して、予測フェーズからOODデータを阻止する。
本研究は、OOD検出を実際の健康・医療データに適用し、疾患予測モデルの精度と信頼性を大幅に向上させる可能性を実証した最初のものである。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:14:01 GMT)
Coherent Control of Spontaneous Emission for a giant driven $Λ $-type three-level atom [2.0] 巨大原子を持つ量子光学は、原子スケールで光メモリデバイスを実装するための新しいアプローチを提供する。
1次元導波路と相互作用する単一駆動3レベル原子の緩和ダイナミクスについて検討した。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:03:08 GMT)
Sparse Matrix in Large Language Model Fine-tuning [2.0] 本稿では,PEFTとフル微調整性能の差を最小限に抑えるために,スパースサブ行列を選択する手法を提案する。
実験では,本手法が他のPEFTベースラインを一貫して上回ることを示した。
また,訓練可能なパラメータの数が増加するにつれて,LoRAとDoRAの性能が低下する傾向を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:08:51 GMT)
Mining experimental data from Materials Science literature with Large Language Models: an evaluation study [2.0] 本研究は,大規模言語モデル (LLM) の教材科学における科学的資料から構造化情報を抽出する能力を評価することを目的としている。
我々は,情報抽出における2つの重要な課題に焦点をあてる: (i) 研究材料と物性の名前を付けたエンティティ認識(NER) と, (ii) それらのエンティティ間の関係抽出(RE) である。
これらのタスクの実行におけるLCMの性能は、BERTアーキテクチャとルールベースのアプローチ(ベースライン)に基づいて従来のモデルと比較される。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:28:08 GMT)
Towards a Better Evaluation of Out-of-Domain Generalization [1.8] ドメイン・ジェネリゼーション(Domain Generalization, DG)とは、未確認のテスト分布において高い性能を達成するアルゴリズムとモデルを考案することである。
平均測度は、モデルを評価し、アルゴリズムを比較するための代表的な尺度として使われてきた。
我々は,平均値に対するロバストな代替手段として,最悪の+ギャップ測度を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:27:46 GMT)
On Vessel Location Forecasting and the Effect of Federated Learning [1.7] 船舶位置予測は海洋の認識にとって最も重要な作戦の1つである。
プライバシーの懸念と制限が高まるにつれ、トレーニングデータの断片化がますます進んでいる。
LSTMニューラルネットワークに基づく効率的なVLFソリューションを,NautilusとFedNautilusの2つの変種で提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:23:48 GMT)
From Symbolic Tasks to Code Generation: Diversification Yields Better Task Performers [1.7] コードに関連するタスクを超えて、より多様な命令セットがコード生成のパフォーマンスを向上させることを示す。
我々の観察から,命令調整セットのより多様な意味空間が,命令に従う能力とタスクの実行能力を大幅に向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:54:07 GMT)
Few-shot fault diagnosis based on multi-scale graph convolution filtering for industry [1.7] マルチスケールグラフ畳み込みフィルタ(MSGCF)を用いた故障診断手法を提案する。
MSGCFは、グラフ畳み込みフィルタブロックにローカル情報融合モジュールとグローバル情報融合モジュールを統合することで、従来のグラフニューラルネットワークフレームワークを強化する。
パーダーボルン大学ベアリングデータセット(PU)の実験では、提案したMSGCF法が精度において代替アプローチを上回ることが示されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:51:29 GMT)
Reconciling Safety Measurement and Dynamic Assurance [1.7] 安全ケースアプローチにおける動的保証を容易にする新しい枠組みを提案する。
主な焦点は安全アーキテクチャであり、その基盤となるリスク評価モデルは、安全性の測定から運用リスクへの具体的なリンクを与える。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:48:00 GMT)
ShelfHelp: Empowering Humans to Perform Vision-Independent Manipulation Tasks with a Socially Assistive Robotic Cane [1.7] 私たちは、ShelfHelpと呼ぶ概念実証型社会支援ロボットシステムを紹介します。
ShelfHelpには、新しいビジュアルプロダクトロケータアルゴリズムと、音声操作指導コマンドを自律的に発行する新しいプランナーが含まれている。
そこで本研究では,初級ユーザを対象に,望まれる商品を検索するための効果的な操作指導を行うシステムの成功例を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:42:54 GMT)
Breaking Indistinguishability with Transfer Learning: A First Look at SPECK32/64 Lightweight Block Ciphers [1.6] MIND-Cryptは、深層学習(DL)と伝達学習(TL)を用いてブロック暗号の不明瞭性に挑戦する新しい攻撃フレームワークである。
本手法は,同じ鍵を用いて暗号化された2つのメッセージの暗号文を用いたDLモデルのトレーニングを含む。
TLでは、トレーニング済みのDLモデルを特徴抽出器として使用し、これらの機能はXGBoostのような浅い機械学習のトレーニングに使用される。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:40:13 GMT)
Extending the Massive Text Embedding Benchmark to French [1.6] 本稿では,フランス語の文埋め込みに関する最初の大規模ベンチマークを提案する。
22の既存のデータセットを使いやすいインターフェースで収集するだけでなく、8つのタスクに対するグローバルな評価のために、3つの新しいフランス語データセットも作成します。
全てのタスクにおいてモデルが最良でない場合でも、文類似性に基づいて事前訓練された大規模多言語モデルは特によく機能することがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:34:37 GMT)
Geometric Visualizations of Single and Entangled Qubits [1.6] 我々は、これらの状態の性質をジオメトリでエンコードする1-および2-キュービット系の部分空間の写像を作成する。
これらの写像は、入門レベルでの量子力学と量子情報の基本概念を理解するのに特に有用である。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:37:34 GMT)
Threshold-Independent Fair Matching through Score Calibration [1.6] 我々は、スコアベースのバイナリ分類におけるバイアスを評価するために、最近のメトリクスを使用して、エンティティマッチング(EM)に新しいアプローチを導入する。
このアプローチは、しきい値の設定に依存することなく、等化オッズ、等化オッズ、人口比率などの様々なバイアスメトリクスの適用を可能にする。
本稿では,データクリーニングにおける公正性の分野,特にEM内での公正性に寄与する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:37:53 GMT)
Transformers and Slot Encoding for Sample Efficient Physical World Modelling [1.5] 本研究では,世界モデリングのためのトランスフォーマーとスロットアテンションパラダイムを組み合わせたアーキテクチャを提案する。
得られたニューラルアーキテクチャについて述べるとともに、既存のソリューションよりも、サンプル効率とトレーニング例よりも性能の変動を低減できることを示す実験結果を報告する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:48:04 GMT)
Estimating Population Burden of Stroke with an Agent-Based Model [1.5] ストロークは世界中で死と障害の主な原因の1つである。
脳卒中予防の主な目的は、リスクの高い個人をターゲットにすることである。
本研究では,エージェントを前ストロークとストロークで追従するエージェントモデルを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:49:37 GMT)
Error Analysis of Shapley Value-Based Model Explanations: An Informative Perspective [1.5] 共有値属性(Shapley Value Attribution, SVA)は、モデルの出力に対する各機能の貢献を定量化する、説明可能なAI(XAI)メソッドとして、ますます人気が高まっている。
最近の研究によると、SVAを実装する既存の方法にはいくつかの欠点があり、バイアスや信頼性の低い説明がなされている。
本稿では,SVAの説明誤差を観察バイアスと構造バイアスの2つの構成要素に分解する,新しい誤差理論解析フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:56:53 GMT)
Weights Augmentation: it has never ever ever ever let her model down [1.5] 本稿では,重量増大の概念を,重量探査に焦点をあてて提案する。
ウェイト増強戦略(Weight Augmentation Strategy, WAS)とは、損失関数の計算に使用できるネットワークに対して、ランダムに変換されたウェイト係数のトレーニングと変換を行う手法である。
我々の実験結果は、VGG-16、ResNet-18、ResNet-34、GoogleNet、MobilementV2、Efficientment-Liteといった畳み込みニューラルネットワークが、ほとんど、あるいは全くコストがかからないことを示しています。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:57:06 GMT)
SpATr: MoCap 3D Human Action Recognition based on Spiral Auto-encoder and Transformer Network [1.5] SpATr(Spiral Auto-Encoder and Transformer Network)と呼ばれる3次元動作認識のための新しいアプローチを提案する。
スパイラル畳み込みに基づく軽量オートエンコーダを用いて,各3次元メッシュから空間幾何学的特徴を抽出する。
提案手法は,Babel,MoVi,BMLrubの3つの顕著な3次元行動データセットを用いて評価した。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:33:08 GMT)
HOLMES: to Detect Adversarial Examples with Multiple Detectors [1.5] HOLMESは、高い精度と偽陽性率の低い複数の攻撃から、テクスチュンシンの敵の例を識別することができる。
我々の効果的で安価な戦略は、オリジナルのDNNモデルを変更したり、内部パラメータを必要としたりしない。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:22:55 GMT)
Q-learning as a monotone scheme [1.5] 強化学習法における安定性の問題が続いている。
単調なスキームの意味において,正確なQ-ラーニングの収束基準を解釈する。
単調性特性に対する関数近似の結果について論じる。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:22:36 GMT)
MSSC-BiMamba: Multimodal Sleep Stage Classification and Early Diagnosis of Sleep Disorders with Bidirectional Mamba [1.4] 本研究では,ディープラーニング技術を用いた自動睡眠ステージングと睡眠障害分類モデルを開発した。
睡眠状態分類モデルMSSC-BiMambaを設計し,PSG(Polysomnography)とPSG(Multiple-lead sleep monitoring)の特徴を考察した。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:16:53 GMT)
ESG-FTSE: A corpus of news articles with ESG relevance labels and use cases [1.4] 環境・社会・ガバナンス(ESG)関連アノテーションによるニュース記事からなる最初のコーパスであるESG-FTSEについて述べる。
これにより、投資の資格を社会的責任として評価するESGスコアが上昇した。
量的手法はESGのスコアを改善するために適用することができ、そのため、責任ある投資を行うことができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:19:02 GMT)
Disentangling and Mitigating the Impact of Task Similarity for Continual Learning [1.4] 部分的に類似したタスクの継続的な学習は、人工知能ニューラルネットワークの課題となる。
高い入力特徴類似性と低い読み出し類似性は、知識伝達と保持の両方において破滅的である。
フィッシャー情報量に基づく重み正規化は,タスクの類似性にかかわらず,保持率を著しく向上させる。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:40:07 GMT)
DenseSeg: Joint Learning for Semantic Segmentation and Landmark Detection Using Dense Image-to-Shape Representation [1.3] 本稿では,ランドマークとセマンティックセグメンテーションの併用学習を可能にする画像と形状の濃密な表現を提案する。
本手法では,解剖学的対応の表現による任意のランドマークの抽出を直感的に行うことができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:49:59 GMT)
An Automatic Question Usability Evaluation Toolkit [1.2] 多重選択質問(MCQ)を評価するには、労働集約的な人的評価か、可読性を優先する自動化方法のいずれかが必要となる。
MCQの総合的かつ自動化された品質評価のために,IWFルーブリックを利用したオープンソースツールであるSAQUETを紹介する。
94%以上の精度で,既存の評価手法の限界を強調し,教育評価の質向上の可能性を示した。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:04:53 GMT)
Mitigating annotation shift in cancer classification using single image generative models [1.2] 本研究は乳房マンモグラフィー領域における癌分類におけるアノテーションシフトをシミュレートし,解析し,緩和する。
本研究では, 影響のあるクラスに対して, 単一画像生成モデルに基づくトレーニングデータ拡張手法を提案する。
本研究は、深層学習乳癌分類におけるアノテーションシフトに関する重要な知見を提供し、ドメインシフトの課題を克服するための単一画像生成モデルの可能性を探る。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:02:50 GMT)
Don't Get Hijacked: Prevalence, Mitigation, and Impact of Non-Secure DNS Dynamic Updates [1.1] DNS動的更新は本質的に脆弱なメカニズムである。
非セキュアなDNS更新は、ゾーン中毒と呼ばれる新しいタイプの攻撃を受けやすいドメインを残します。
我々は,コンピュータセキュリティインシデント対応チームの通知を含む総合的なキャンペーンを実施した。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:23:53 GMT)
Retrieval Augmented Structured Generation: Business Document Information Extraction As Tool Use [1.1] ビジネス文書情報抽出(Business Document Information extract, BDIE)は、非構造化情報の塊を下流システムが解析および使用可能な構造化形式に変換する問題である。
本稿では,BDIEがツール利用問題として最もよくモデル化されていることを論じる。
本稿では,BDIE ベンチマーク上での KIE および LIR タスク上でのSOTA (Retrieval Augmented Structured Generation) の結果を得るための,BDIE のための新しい汎用フレームワークである Retrieval Augmented Structured Generation (RASG) を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:54:42 GMT)
Exploring the Practicality of Federated Learning: A Survey Towards the Communication Perspective [1.1] Federated Learning(FL)は、プライバシ保護、分散機械学習の大幅な進歩を提供する、有望なパラダイムである。
しかし、FLシステムの実践的な展開は、通信オーバーヘッドという大きなボトルネックに直面している。
本研究は,通信効率FLにおける様々な戦略と進歩について検討する。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:21:33 GMT)
An Efficient All-to-All GCD Algorithm for Low Entropy RSA Key Factorization [1.1] 本研究は,現在最高のバッチGCDアルゴリズムよりも効率的である,新しい全対全バッチGCDアルゴリズムについて述べる。
実際には、提案したバイナリツリーバッチGCDアルゴリズムの実装は、標準の剰余木バッチGCD手法と比較して約6倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:36:52 GMT)
Finding Outliers in Gaussian Model-Based Clustering [1.0] クラスタリング(英: Clustering)または教師なし分類(英: unsupervised classification)は、しばしば外れ者によって悩まされるタスクである。
クラスタリングでは、アウトレーヤの処理には多くの作業があります。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:26:06 GMT)
Effects of Dataset Sampling Rate for Noise Cancellation through Deep Learning [1.0] 本研究では,従来のノイズキャンセリング手法の優れた代替手段として,ディープニューラルネットワーク(DNN)の利用について検討する。
ConvTasNETネットワークは、WHAM!、LibriMix、MS-2023 DNS Challengeなどのデータセットでトレーニングされた。
高サンプリングレート(48kHz)でトレーニングされたモデルは、トータル・ハーモニック・ディストーション(THD)と生成ニューラルコーデック(WARP-Q)の値に対するはるかに優れた評価指標を提供した。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:20:44 GMT)
Zero-Shot Hierarchical Classification on the Common Procurement Vocabulary Taxonomy [1.0] 欧州連合は共通の分類(共通調達語彙(Common Procurement Vocabulary, CPV)を提示した。
CPVラベルが義務付けられている契約は、すべての公共行政活動と比較して少数である。
ラベル記述のみに依存し,ラベル分類を尊重する事前学習言語モデルに基づくゼロショットアプローチを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:34:10 GMT)
Guardians of DNS Integrity: A Remote Method for Identifying DNSSEC Validators Across the Internet [0.9] 本稿ではDNSSEC検証リゾルバを識別する新しい手法を提案する。
ほとんどのオープンリゾルバはDNSSEC対応であるが、IPv4の18%(IPv6の38%)は受信した応答を検証している。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:58:18 GMT)
Is My Data in Your Retrieval Database? Membership Inference Attacks Against Retrieval Augmented Generation [0.9] 本稿では,RAGシステムに対して,メンバーシップ推論攻撃(MIA)を行うための効率的かつ使いやすい手法を提案する。
本研究は, データベースのプライバシとセキュリティを保護するために, デプロイされたRAGシステムにセキュリティ対策を実装することの重要性を強調した。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:46:36 GMT)
Nonuniqueness and Convergence to Equivalent Solutions in Observer-based Inverse Reinforcement Learning [0.9] オンラインおよびリアルタイムに決定論的逆強化学習(IRL)問題を解決する上で重要な課題は、複数のソリューションの存在である。
非特異性は等価解の概念の研究を必要とする。
IRL問題のほぼ等価解に収束する正規化履歴スタックオブザーバを開発した。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:31:41 GMT)
A novel fault localization with data refinement for hydroelectric units [0.9] スパースオートエンコーダ(SAE)-生成逆数ネットワーク(GAN)-ウェーブレット雑音低減(WNR)-多様体ブースト深層学習(SG-WMBDL)に基づくフォールトローカライゼーション手法を提案する。
非線形および非滑らかな特性を含む信号を考慮すると、軟弱しきい値と局所線形埋め込み(LLE)を併用した改良WNRが利用される。
実験の結果,SG-WMBDLは,他のフロンティア法と比較して高精度かつ高精度に水力発電ユニットの故障を見つけることができることがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:33:49 GMT)
FMARS: Annotating Remote Sensing Images for Disaster Management using Foundation Models [0.9] FMARS(Foundation Model s in Remote Sensing)は、VHR画像と基礎モデルを高速で堅牢なアノテーションに活用する方法論である。
災害管理に焦点をあて,19件の災害イベントの事前画像から得られたラベルを用いた大規模データセットを提供する。
実世界のシナリオへの転送可能性を高めるために、Unsupervised Adaptation (UDA) 技術を用いて、生成されたラベルのセグメンテーションモデルを訓練する。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:45:02 GMT)
ReMatch: Retrieval Enhanced Schema Matching with LLMs [0.9] 本稿では,検索強化大言語モデル(LLM)を用いたスキーママッチングのためのReMatchという新しい手法を提案する。
大規模な実世界のスキーマに対する実験結果から,ReMatchが効果的なマーカであることが示された。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:33:46 GMT)
Mitigating the Impact of Labeling Errors on Training via Rockafellian Relaxation [0.9] ニューラルネットワークトレーニングのためのRockafellian Relaxation(RR)の実装を提案する。
RRは、分類タスク間で堅牢なパフォーマンスを達成するために、標準的なニューラルネットワーク手法を強化することができる。
RRはラベル付け誤りと/または逆方向の摂動の両方によるデータセットの破損の影響を軽減することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:13:01 GMT)
Deep Latent Variable Modeling of Physiological Signals [0.9] 潜時変動モデルを用いた生理モニタリングに関する高次元問題について検討する。
まず、光学的に得られた信号を入力として、心の電気波形を生成するための新しい状態空間モデルを提案する。
次に,確率的グラフィカルモデルの強みと深い敵対学習を組み合わせた脳信号モデリング手法を提案する。
第3に,生理的尺度と行動の合同モデリングのための枠組みを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:36:30 GMT)
Use of a Multiscale Vision Transformer to predict Nursing Activities Score from Low Resolution Thermal Videos in an Intensive Care Unit [0.9] 看護婦の過度な介護労働負荷は、より貧しい患者のケアと労働者のバーンアウトの増加に関係している。
これまでの作業では、コンピュータビジョンを使用して介護者と患者の相互作用時間を受動的に導き、スタッフの作業量を監視することで、AmI(Ambient Intelligence)を利用してきた。
本研究は、MViTv2を用いてICU内のNASを受動的に予測し、スタッフの作業負荷を自動的に監視する可能性を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:39:15 GMT)
A multi-module silicon-on-insulator chip assembly containing quantum dots and cryogenic radio-frequency readout electronics [0.8] 量子処理ユニットは、デジタルおよびアナログ電子モジュールを含むより大きな情報処理システムのモジュールである。
ここでは、シリコン量子デバイスの多重読み出しのための低温多モジュールアセンブリを提案する。
それぞれのモジュールを個別に表示し、(i)35dB以上の利得、118MHzの帯域幅、4.2K以下のノイズ温度、(ii)1.1dB以下の挿入損失、0-2GHzのノイズ温度、1.1K以下のノイズ温度、(iii)シングル電子ボックス(SEB)電荷センサを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:28:35 GMT)
Non-intrusive data-driven model order reduction for circuits based on Hammerstein architectures [0.8] 我々は非線形CMOS微分増幅器のための擬似ハマースタインモデルを開発した。
我々は直流(DC)と過渡スパイス(Xyce)回路シミュレーションデータの組み合わせでこのモデルを訓練する。
シミュレーションの結果,ハマースタインモデルがディファレンシャルアンプ回路の効果的なサロゲートであることが示唆された。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:47:48 GMT)
Utilizing Weak-to-Strong Consistency for Semi-Supervised Glomeruli Segmentation [0.8] 本稿では,複数の実世界のデータセット上で検証された弱強整合性フレームワークに基づく,糸球体セグメンテーションのための半教師付き学習手法を提案する。
3つの独立したデータセットに対する実験結果は、既存の教師付きベースラインモデルと比較して、アプローチの優れた性能を示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:19:21 GMT)
GasTrace: Detecting Sandwich Attack Malicious Accounts in Ethereum [0.8] サンドイッチ攻撃を検知・防止するためのカスケード分類フレームワークであるGasTraceを提案する。
GasTraceの精度は96.73%、F1スコアは95.71%である。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:55:21 GMT)
Stochastic Gradient Descent-like relaxation is equivalent to Metropolis dynamics in discrete optimization and inference problems [0.7] SGDライクなアルゴリズムの力学は、適切に選択された温度のメトロポリスモンテカルロと非常によく似ていることを示す。
この等価性により、モンテカルロアルゴリズムの性能と限界に関する結果を用いて、SGDライクなアルゴリズムのミニバッチサイズを最適化できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:11:51 GMT)
Leveraging Open-Source Large Language Models for encoding Social Determinants of Health using an Intelligent Router [0.7] SDOH(Social Determinants of Health)は、患者の健康に重要な役割を担っている。
大規模言語モデル(LLM)は、EHRから構造化されていないデータを抽出することを約束する。
我々は,言語モデルルータを用いたSDOH符号化のためのインテリジェントルーティングシステムを導入し,医療記録データをオープンソースLLMに転送する。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:33:28 GMT)
Hybrid Reinforcement Learning Framework for Mixed-Variable Problems [0.7] 離散変数選択のためのRLと連続変数調整のためのベイズ最適化を組み合わせたハイブリッド強化学習(RL)フレームワークを提案する。
提案手法は,従来のRL,ランダム探索,スタンドアローンベイズ最適化を有効性と効率で常に上回っている。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:42:33 GMT)
Novel oracle constructions for quantum random access memory [0.6] 量子辞書エンコーダ(quantum dictionary encoder)やデータアクセスオラクル( data access oracles)としても知られる量子(ランダムアクセス)メモリを設計する新しい方法を提案する。
プロパティ $mathcalW_f で、oracles を $mathcalO_f$ で構築します。
我々の構成は、整数値関数と見なされる$f$のウォルシュ・アダマール変換に基づいている。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:30:16 GMT)
FaceMixup: Enhancing Facial Expression Recognition through Mixed Face Regularization [0.6] ディープラーニングソリューションは、現実世界のアプリケーションに課題をもたらす。
データ拡張(DA)アプローチは、目立ったソリューションとして現れています。
混合顔成分規則化に基づく簡易かつ包括的顔データ拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:09:05 GMT)
Recurrent Deep Kernel Learning of Dynamical Systems [0.6] デジタル双対は計算効率の低い低次モデル(ROM)を必要とし、物理的資産の複雑な力学を正確に記述することができる。
データから低次元の潜伏空間を発見するために,データ駆動型非侵入型深層学習法(SVDKL)を提案する。
その結果,本フレームワークは, (i) 測定値の復調と再構成, (ii) システム状態のコンパクトな表現の学習, (iii) 低次元潜在空間におけるシステム進化の予測, (iv) 不確実性をモデル化できることがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:49:02 GMT)
SECURE: Benchmarking Generative Large Language Models for Cybersecurity Advisory [0.6] 大規模言語モデル(LLM)はサイバーセキュリティの応用の可能性を示しているが、幻覚や真実性の欠如といった問題により信頼性が低下している。
本研究は、これらのタスクに関する7つの最先端モデルを評価し、サイバーセキュリティの文脈におけるその強みと弱点に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:35:06 GMT)
Improving SMOTE via Fusing Conditional VAE for Data-adaptive Noise Filtering [0.6] 変分オートエンコーダ(VAE)を用いたSMOTEアルゴリズムの拡張フレームワークを提案する。
本稿では,VAEを用いて低次元潜在空間におけるデータ点密度を体系的に定量化し,クラスラベル情報と分類困難度を同時に統合する手法を提案する。
いくつかの不均衡データセットに関する実証的研究は、この単純なプロセスが従来のSMOTEアルゴリズムを革新的に改善することを示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:06:02 GMT)
Length independent generalization bounds for deep SSM architectures with stability constraints [0.6] 長距離シーケンスでトレーニングされた多くの最先端モデルは、状態空間モデル(SSM)とニューラルネットワークを組み合わせたシーケンシャルブロックで構成されている。
我々は、安定したSSMブロックを持つこの種のアーキテクチャを保持でき、入力シーケンスの長さに依存しないPACバウンダリを提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:32:46 GMT)
Recurrent neural network wave functions for Rydberg atom arrays on kagome lattice [0.5] ライドバーグ原子配列実験は、強力な量子シミュレータとして機能する能力を示した。
本稿では,2次元リカレントニューラルネットワーク(RNN)を用いて,カゴメ格子上のRydberg原子配列の基底状態について検討する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:00:06 GMT)
Tight concentration inequalities for quantum adversarial setups exploiting permutation symmetry [0.5] 量子状態に対する我々の片側濃度の不等式は、置換不変量として$N$-qudit系を必要とすることを示す。
簡単な量子情報処理タスクにおいて,境界の厳密さを数値的に示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:05:00 GMT)
A Search for Classical Subsystems in Quantum Worlds [0.5] 我々は、サブシステムの準古典的記述を許容する大域ヒルベルト空間の分解を発見するための体系的なアプローチをとる。
エネルギー固有ベクトルが分離可能な分解において、すべてのハミルトニアンがポインタ基底を持つことを示す。
我々は、ハミルトニアンがそのような分解を行うことができるいくつかの解析形式を導出する。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:05:35 GMT)
Quantum-classical tradeoffs and multi-controlled quantum gate decompositions in variational algorithms [0.5] 短期量子コンピュータの計算能力は、ゲート演算のノイズの多い実行と物理量子ビットの限られた数によって制限される。
ハイブリッド変分アルゴリズムは、問題の解決に使用される量子資源と古典的リソースの間の幅広いトレードオフを可能にするため、短期量子デバイスに適している。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:24:09 GMT)
ENTIRe-ID: An Extensive and Diverse Dataset for Person Re-Identification [0.5] ENTIRe-IDデータセットは、37種類のカメラから445万枚以上の画像で構成されている。
このデータセットは、ドメインの可変性とモデルの一般化の課題に取り組むために一意に設計されている。
この設計により、ReIDモデルの現実的で堅牢なトレーニングプラットフォームが保証される。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:26:47 GMT)
Bridging eResearch Infrastructure and Experimental Materials Science Process in the Quantum Data Hub [0.4] 本稿では,量子材料を扱う研究者を対象としたコミュニティアクセス型研究基盤であるQuantum Data Hub (QDH)を紹介する。
QDHはNational Data Platformと統合され、FAIRの原則に準拠しながら、ユーザビリティ、ナビゲートビリティ、解釈可能性、タイムラインに関するUNITの新たな原則を提案している。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:35:57 GMT)
Who Writes the Review, Human or AI? [0.4] 本研究では,AIによる書評と人間による書評を正確に区別する手法を提案する。
提案手法は移動学習を利用して,異なるトピック間で生成したテキストを識別する。
実験の結果、元のテキストのソースを検出でき、精度96.86%に達することが示されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:38:44 GMT)
Fast leave-one-cluster-out cross-validation by clustered Network Information Criteria (NICc) [0.4] 本稿では,ネットワーク情報量規準(NICc)のクラスタ化推定手法を提案する。
NICcは, クラスタアウトのずれを解消し, オーバーフィッティングを他の推定値よりも効果的に防止できることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:10:02 GMT)
subMFL: Compatiple subModel Generation for Federated Learning in Device Heterogenous Environment [0.3] フェデレートラーニング(FL)は、分散デバイスと異種デバイスを持つシステムで一般的に用いられる。
計算能力の異なる異種デバイスをFLプロセスに参加可能なモデル圧縮手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:49:34 GMT)
Cavity-enhanced narrowband spectral filters using rare-earth ions doped in thin-film lithium niobate [0.2] 集積非線形光学プラットフォームにおいて、希土類イオンを用いた共振器型スペクトルフィルタリングを実演する。
13.0dBの13.0dBの7MHzライン幅から、20.4dBの24MHzライン幅までの帯域通過フィルタを実現する。
このような多用途統合スペクトルフィルタは、光信号処理や光メモリのオン・ア・チップの基本的な構成要素として機能する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:37:45 GMT)
Deep Reinforcement Learning for Intrusion Detection in IoT: A Survey [0.2] 最新のDRLベースのIDS手法は、無線センサネットワーク(WSN)、ディープQネットワーク(DQN)、ヘルスケア、ハイブリッド、その他の技術を含む5つのカテゴリに分類されている。
最も重要なパフォーマンス指標、すなわち、精度、リコール、精度、偽陰性率(FNR)、偽陽性率(FPR)、F測定について詳述する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:19:23 GMT)
Learning Task-relevant Sequence Representations via Intrinsic Dynamics Characteristics in Reinforcement Learning [0.2] DRLフレーム上の固有動的特徴駆動シーケンス表現学習法(DSR)を提案する。
状態遷移に関連する力学方程式をモデル化することで、エンコーダの最適化を制約する。
CARLAシミュレーターにおいて、現実の自律運転タスクにおいて最高のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:31:03 GMT)
Decoherence-free many-body Hamiltonians in nonlinear waveguide quantum electrodynamics [0.2] 導波管量子電磁力学は、無限範囲の相互作用と量子エミッターの非コヒーレンスな部分空間をホストする。
ここでは、パラメトリックゲインを包含する非線形導波路を持つエミッタアレイを組み込むことにより、多体相互作用ハミルトニアンのユニークなクラスが得られることを示す。
我々は、これらのハミルトンアンを用いて、グローバルなスクイーズドライブのみを使用して、基底状態からデコヒーレンスフリーな状態をコヒーレントに生成することを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:45:32 GMT)
Towards Ontology-Enhanced Representation Learning for Large Language Models [0.2] 本稿では,知識を参照オントロジーで注入することで,埋め込み言語モデル(埋め込み言語モデル)の関心を高める新しい手法を提案する。
言語情報(概念同義語と記述)と構造情報(is-a関係)は、包括的な概念定義の集合をコンパイルするために使用される。
これらの概念定義は、対照的な学習フレームワークを使用して、ターゲットの埋め込み-LLMを微調整するために使用される。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:01:10 GMT)
Towards Socially and Morally Aware RL agent: Reward Design With LLM [0.2] 本研究は,RL法を安全に探索する上で,大規模言語モデルによる道徳と社会規範の理解を活用する能力について研究する。
この研究は、人間のフィードバックに対する言語モデルの結果を評価し、直接報酬信号として言語モデルの能力を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:40:30 GMT)
Improving Object Detector Training on Synthetic Data by Starting With a Strong Baseline Methodology [0.1] 本稿では,合成データを用いた学習における事前学習対象検出器の性能向上手法を提案する。
提案手法は,実画像の事前学習から得られた有用な特徴を忘れずに,合成データから有能な情報を抽出することに焦点を当てる。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:31:01 GMT)
Quantum generalizations of Glauber and Metropolis dynamics [0.1] メトロポリスのサンプリングに匹敵する効率よく実装可能な離散時間量子を提示する。
また、より詳細なバランスの取れた力学の高コヒーレントな量子一般化を与える。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:57:04 GMT)
Quantum Zeno Effect on Genuine Tripartite Nonlocality and Entanglement in Quantum Dissipative System [0.1] 真の三部体非局所性(GTN)は、Svetlichnyの不等式に違反することで定量化することができる。
任意の3量子ビット量子状態に対するGTNの高精度量子化を実現する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:33:40 GMT)
Scalable Test Generation to Trigger Rare Targets in High-Level Synthesizable IPs for Cloud FPGAs [0.1] 本研究では,HLSで開発されたクラウドIPを対象とした高度なテスト手法を提案する。
FPGA ベースのクラウド IP の特徴とクラウド関連脅威を組み込んだ HLS ベンチマークによる評価により,本フレームワークの有効性を実証した。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:10:11 GMT)
Rapid Wildfire Hotspot Detection Using Self-Supervised Learning on Temporal Remote Sensing Data [0.1] 衛星ネットワークや高度なAIモデルからリモートセンシングされたデータを活用して、ホットスポットを自動的に検出することは、山火事モニタリングシステムを構築する効果的な方法である。
本稿では,欧州の火災イベントに関連するリモートセンシングデータの時系列を含む新しいデータセットと,多時期データを解析し,潜在的にほぼリアルタイムにホットスポットを識別できる自己監視学習(SSL)モデルを提案する。
我々は、我々のデータセットといくつかの火災イベントを含む熱異常のデータセットであるThrawsを用いて、モデルの性能を訓練し、評価し、F1スコア63.58を得る。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:31:46 GMT)
Landslide mapping from Sentinel-2 imagery through change detection [0.1] 地すべりは、最も重要で破壊的なジオハザードの1つである。
本稿では,Sentinel-2画像を用いた地すべりのマッピング手法について検討する。
本稿では,DEM(Digital Elevation Model)データとSentinel-2バイテンポラル画像ペアを融合する新たなディープラーニングアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:33:32 GMT)
Urban Air Pollution Forecasting: a Machine Learning Approach leveraging Satellite Observations and Meteorological Forecasts [0.1] 大気汚染は公衆衛生、特に都市部において重大な脅威となる。
本研究では, センチネル5P衛星のデータ, 気象条件, トポロジカル特性を統合し, 5つの主要な汚染物質の将来レベルを予測する機械学習モデルを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:02:53 GMT)
LLaMEA: A Large Language Model Evolutionary Algorithm for Automatically Generating Metaheuristics [0.0] 本稿では,Large Language Model Evolutionary Algorithm (LLaMEA) フレームワークを紹介する。
一連の基準とタスク定義(検索空間)が与えられた後、LLaMEAは実行時評価からパフォーマンスメトリクスとフィードバックに基づいてアルゴリズムを反復的に生成し、変更し、選択する。
我々は,このフレームワークを用いて,新しいブラックボックスメタヒューリスティック最適化アルゴリズムを自動生成する方法を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:10:59 GMT)
mRNA secondary structure prediction using utility-scale quantum computers [0.0] 最大60ヌクレオチドの配列長を持つ量子コンピュータ上でmRNA二次構造を解く可能性について検討した。
この結果は、量子コンピュータ上でmRNA構造予測問題の解法が可能であることを示す十分な証拠となる。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:58:17 GMT)
Zeno Effect Suppression of Gauge Drift in Quantum Simulations [0.0] 格子ゲージ理論は、物理空間よりも大きいヒルベルト空間を持つ。
本研究は, このゲージドリフトをゼノ効果により抑制する方法を提案する。
我々は、この手法を$mathbbZ$ゲージ理論玩具モデルで実証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:50:45 GMT)
You Need to Pay Better Attention: Rethinking the Mathematics of Attention Mechanism [0.0] Scaled Dot Product Attention (SDPA)は多くの現代のディープラーニングモデルのバックボーンです。
本稿では、最適化、効率性、スーパーアテンションの3つの強化されたアテンションメカニズムを紹介する。
Super Attentionは値に新しい線形変換を導入し、それを左から変換する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:46:22 GMT)
Witnessing entanglement of remote particles with incomplete teleportation [0.0] 共通参照フレームまたは整列座標系を持つことは、2つのリモートパーティが所有する2つのパーティ状態における絡み合いを目撃する際の推定値の1つである。
そこで本研究では,座標系を事前のアライメントを必要とせずに,局所的な測定により共有状態の絡み合いを観測できるようにする方法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 04:08:15 GMT)
Vocabulary Attack to Hijack Large Language Model Applications [0.0] 大規模言語モデル(LLM)は、ますます多くのアプリケーションを駆動している。
彼らはモデルに機密情報、特定の偽情報、または攻撃的な行動を明らかにすることを望んでいます。
モデル語彙から単語を挿入することで,これらのシステム外へのアプローチを提案する。
対象モデルとは異なるモデルを用いて攻撃を行うことが可能であることを実証した。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:28:31 GMT)
Visual Attention Analysis in Online Learning [0.0] オンライン授業中に収集した眼球運動データを可視化・解析するツールを開発した。
このツールはVAAD(Visual Attention Analysis Dashboardの頭字語)と名付けられた。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:27:40 GMT)
Unitary Quantum Algorithm for the Lattice-Boltzmann Method [0.0] 本稿では,Lattice-Boltzmann法に基づく計算流体力学の量子アルゴリズムを提案する。
我々の量子アルゴリズムは非線形性を捉えている。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:07:02 GMT)
Unifying Emergent Hydrodynamics and Lindbladian Low Energy Spectra across Symmetries, Constraints, and Long-Range Interactions [0.0] 我々は,様々な対称性,制約,相互作用範囲を有するブラウン乱数回路における電荷輸送を管理する創発的流体力学を同定する。
我々のアプローチは、ランダムなユニタリ時間進化の下で保存された作用素の力学を定性的に理解するための汎用的で汎用的なフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:53:16 GMT)
Unified Explanations in Machine Learning Models: A Perturbation Approach [0.0] XAIとモデリング技術の不整合は、これらの説明可能性アプローチの有効性に疑念を投げかけるという望ましくない効果をもたらす可能性がある。
我々はXAI, SHapley Additive exPlanations (Shap) において, 一般的なモデルに依存しない手法に対する系統的摂動解析を提案する。
我々は、一般的な機械学習とディープラーニングの手法のスイートと、静的ケースホールドで生成された説明の正確さを定量化するためのメトリクスの中で、動的推論の設定において、相対的な特徴重要度を生成するアルゴリズムを考案した。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:04:35 GMT)
Uncertainty relations for overcomplete measurements from generalized equiangular tight frames [0.0] 本研究は, 一般化された等角的強みによる過完全測定の不確実性について検討することを目的とする。
互いに偏りのない基底の$d+1$の存在は、素パワーである$d$に対して証明される。
不確実性の量を定量的に記述するために、Tsallis と R'enyi のエントロピーと、別の結果の確率を用いる。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:57:21 GMT)
Tropical Expressivity of Neural Networks [0.0] ディープラーニングの分野で活発に研究されている特定の量は、線形領域の数である。
情報のキャパシティと表現性について検討し,その評価を行う。
我々の研究は、熱帯幾何学の豊かな理論を生かして、この関係を築き、拡張している。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:45:03 GMT)
Time and distance constraints for mass and charge interferometry [0.0] Mariらによって同定された質量および電荷干渉計の制約を再解析し拡張する。
我々は、コヒーレント干渉に要する時間に対する制約を2倍に拡張できることを示す。
我々は、その解析を1つの干渉計が別の干渉計によって生成された重力場や電場を測定する実験に拡張する。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:54:05 GMT)
The uncertainty of quantum states with respect to the projective measurement [0.0] 不確実性関係は量子論の特徴的な特徴である。
この研究において、不確実性は量子状態の本質的な性質とみなす。
本稿では, 忠実度に基づく幾何不確実性と呼ばれる新しい不確実性尺度を提案し, 幾何コヒーレンスとリンクする。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:47:19 GMT)
The Relative Value of Prediction in Algorithmic Decision Making [0.0] アルゴリズムによる意思決定における予測の相対的な価値は何か?
我々は,拡張アクセスの相対値を決定する,単純でシャープな条件を同定する。
本稿では,これらの理論的洞察を用いて,アルゴリズムによる意思決定システムの設計を現実的に導く方法について述べる。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:32:27 GMT)
The Kosmosis Use-Case of Crypto Rug Pull Detection and Prevention [0.0] 暗号資産不正を防ぐための現在の手法は、ブロックチェーンネットワーク内のトランザクショングラフの分析に基づいている。
我々は、新しいブロックチェーンとソーシャルメディアデータが利用可能になるにつれて、知識グラフを漸進的に構築することを目的としたKosmosisアプローチを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:17:57 GMT)
The Impact of Ontology on the Prediction of Cardiovascular Disease Compared to Machine Learning Algorithms [0.0] 本稿では,最も顕著な機械学習アルゴリズムと,オントロジーに基づく機械学習分類を比較し,レビューする。
これらの結果は, F-Measure, Accuracy, Recall, Precision などの混乱行列から生成された評価値を用いて評価した。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:40:27 GMT)
Text clustering with LLM embeddings [0.0] テキストの埋め込みとクラスタリングアルゴリズムの違いが、テキストデータセットのクラスタリングに与える影響について検討する。
LLMの埋め込みは構造化言語の微妙さを捉えるのに優れており、BERTはパフォーマンスの軽量なオプションをリードしている。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:17:55 GMT)
Temporal Grounding of Activities using Multimodal Large Language Models [0.0] 画像ベースとテキストベースの大規模言語モデル(LLM)を時間的活動局所化のための2段階的アプローチで組み合わせることの有効性を評価する。
提案手法は既存のビデオベースLLMよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:11:02 GMT)
Taming the Bloch-Redfield equation: Recovering an accurate Lindblad equation for general open quantum systems [0.0] この研究は、Bloch-Redfieldフレームワークを数学的に堅牢なリンドブラッド方程式に変換する以前の試みに基づいている。
本手法は,具体的な物理環境から導出したリンドブラッド方程式を得るための効果的で一般的な手順を提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:23:10 GMT)
Synthetic Patients: Simulating Difficult Conversations with Multimodal Generative AI for Medical Education [0.0] 効果的な患者中心コミュニケーションは、医師にとって重要な能力である。
調味剤提供者と医療研修生の双方は、センシティブな話題に関する会話をリードする自信を減らした。
本稿では,ビデオによる会話の対話的リアルタイムシミュレーションを支援するための,新しい教育ツールを提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:02:08 GMT)
Symmetries in Overparametrized Neural Networks: A Mean-Field View [0.0] 我々は,超並列化ニューラルネットワーク(NN)の学習力学を,法学におけるデータ対称性の下で平均フィールドスチューデント(MF)ビューで表現する。
我々は、対称データに対して、DA、FAおよび自由学習モデルが全く同じMFダイナミクスに従うことを示し、人口リスクを最小限に抑える。
また、SI法に対する最適の到達可能性についても反例を挙げる。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:32:18 GMT)
Strategies to Counter Artificial Intelligence in Law Enforcement: Cross-Country Comparison of Citizens in Greece, Italy and Spain [0.0] 本稿では、法執行機関(LEA)による人工知能利用に対する市民の対策について検討する。
3つの国(ギリシャ、イタリア、スペイン)の情報に基づいて、我々は10の特定の対策戦略の可能性において格差を示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:55:10 GMT)
Statistical physics of principal minors: Cavity approach [0.0] 行列の主小数の和を計算する。
これは量子フェルミオン系の臨界挙動の研究に関係している。
対角行列のクラスでは(有限温度の)相転移は見られなかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:09:49 GMT)
Stabilizer operators and Barnes-Wall lattices [0.0] 選択後の安定化回路で実装可能な矩形行列の簡単な記述を与える。
我々は、ある非直交基底で表現された $mathbbZ[exp(ifrac2pi2m)]$ のエントリを持つ場合、選択後の安定化回路で実装可能であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:17:16 GMT)
SpiDy.jl: open-source Julia package for the study of non-Markovian stochastic dynamics [0.0] SpiDy.jl は古典的スピンベクトルと発散環境に接触する調和振動子ネットワークの非マルコフ力学を解く。
ユーザに対してJuliaノートを提供して,様々な数学的手法をガイドし,複雑なシミュレーションの迅速なセットアップを支援する。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:16:07 GMT)
Spectral Mapping of Singing Voices: U-Net-Assisted Vocal Segmentation [0.0] 本研究では,音楽スペクトログラムから発声成分を分離する手法を提案する。
我々は、短い時間フーリエ変換(STFT)を用いて、詳細な周波数時間スペクトログラムに音声波を抽出する。
我々は,歌唱音声成分を正確に分析・抽出することを目的とした,スペクトル画像のセグメント化のためのUNetニューラルネットワークを実装した。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:47:53 GMT)
Space-time superpositions as fluctuating geometries [0.0] ブラックホールの重ね合わせは、時空状態と量子状態に対する標準的定式化を組み合わせて幾何学的に記述することができる。
弱体限界の詳細な解析により、一般の半古典状態におけるニュートンポテンシャルに対する量子補正が明らかになる。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:58:00 GMT)
SolNet: Open-source deep learning models for photovoltaic power forecasting across the globe [0.0] SolNetは、新しい汎用多変量太陽発電予測器である。
我々はSolNetがデータスカース設定よりも予測性能を向上させることを示す。
転校学習実践者に対するガイドラインと考察を行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:29:58 GMT)
Simulating and comparing the quantum and classical mechanically motion of two hydrogen atoms [0.0] 光学キャビティに2つの2層人工原子を持つTavis-Cummings-Hubbardモデルの改良版について述べる。
これら2つの原子(核)の運動は、量子的および古典的機械的に比較される。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:43:57 GMT)
Signatures of Quantum Phase Transitions in Driven Dissipative Spin Chains [0.0] 駆動散逸性量子スピン鎖は基底状態の量子相転移に対して特異な感度を示すことを示す。
我々は,散逸の解消にともなう多角的分析手法を開発した。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:25:15 GMT)
Signal-noise separation using unsupervised reservoir computing [0.0] 本稿では,時系列予測に基づく信号雑音分離手法を提案する。
元の信号と再構成信号の差から雑音分布を推定する。
この方法は機械学習アプローチに基づいており、決定論的信号か雑音分布のどちらかについて事前の知識を必要としない。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:47:45 GMT)
Should we necessarily treat masses as localized when analysing tests of quantum gravity? [0.0] 最近提案された「量子重力」のテーブルトップテストでは、非相対論的速度で質量の重ね合わせを作成し、分離し、再結合する。
分析は、干渉実験が十分に小さな加速を必要とする場合、無視可能な重力放射が生成されることを示唆している。
論文参考訳(メタデータ) (Thu, 30 May 2024 22:17:08 GMT)
Separation and Collapse of Equilibria Inequalities on AND-OR Trees without Shape Constraints [0.0] 指向性アルゴリズムは、ランダム化された複雑さを達成することが知られている。
任意のAND-OR木に対して、ランダム化深度優先アルゴリズムは方向性アルゴリズムと同じ平衡を持つことを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:13:46 GMT)
Robust Experimental Signatures of Phase Transitions in the Variational Quantum Eigensolver [0.0] 変分量子固有解法(VQE)は量子古典アルゴリズムの候補として広く考えられている。
本研究では、複数のIBMデバイスを用いて、複数の位相様領域を持つ有限サイズのスピンモデルを探索する。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:00:42 GMT)
Repeated measurements and random scattering in quantum walks [0.0] 量子ウォークにおけるランダム散乱の効果を有限グラフ上で検討し, 繰り返し測定の結果と比較した。
繰り返し測定とランダム散乱は、量子ウォークを制御するための効率的なツールを提供すると結論付けている。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:27:55 GMT)
Realization of a Rydberg-dressed extended Bose Hubbard model [0.0] 有効1次元拡張Bose-Hubbardモデル(eBHM)を実現する。
本研究は,低充填域における遠距離反発結合対と半充填域における運動的に拘束された「ハードロッド」の相関平衡ダイナミクスについて検討した。
本研究は,光格子型量子シミュレータにおけるRydbergドレッシングの汎用性を示すものである。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:07:59 GMT)
Quarkonium Polarization in Medium from Open Quantum Systems and Chromomagnetic Correlators [0.0] 非相対論的QCD(pNRQCD)とオープン量子システムフレームワークを用いて,クォーコニアのスピン依存型インジウムダイナミクスについて検討した。
量子光学限界における偏光依存性を持つクォーコニアに対するボルツマン輸送方程式を導出する。
また、スピン-シンガレットとスピン-トリップレット重クォーク-反クォーク対の間の転移を記述するリンドブラッド方程式を導出する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:33:38 GMT)
Quantum encoder for fixed Hamming-weight subspaces [0.0] 本稿では,実データベクトルあるいは複素データベクトルの$d=binomnk$の正確な$n$-qubit計算基底振幅エンコーダを解析形式で提示する。
また,市販のトラップイオン量子コンピュータ上で,本手法の実証実験を行った。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:26:41 GMT)
Quantum Circuit Tensors and Enumerators with Applications to Quantum Fault Tolerance [0.0] 本稿では,安定化符号に対するポアソン公式の類似式を導入し,誤り経路の数を正確に計算する手法を提案する。
回路列挙器は, チャネルのプロセス行列と関連していることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:53:11 GMT)
Pulse Engineering via Projection of Response Functions [0.0] 本稿では,最適忠実度を持つ所望の演算の実装を目的とした,量子システムの反復最適制御法を提案する。
方法の更新ステップは、制御演算子に対する忠実度の線形応答と、対応する演算子のモード関数への投影に基づく。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:55:06 GMT)
Protecting backaction-evading measurements from parametric instability [0.0] 総和と差分周波数から2つのポンプを変形させることにより,系の安定化とBAE性能の回復が可能であることを示す。
また, 弱い信号検出実験で得られた加速度は, このデチューニング技術によってのみ達成可能であることを示した。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:06:15 GMT)
Polarized sub-meV Photoluminescence in 2D PbS Nanoplatelets at Cryogenic Temperatures [0.0] 720nm(1.7 eV)で励起発光を示す2次元(2D)PbSナノプレートレット(NPL)
本報告では, 低温PLの総合的な解析を行った。
4Kでは,1個のPbS NPLの特異なPL特性が観察され,線路幅が0.6mVまで狭いゼロフォノン線と,直線偏光度90%までの範囲で観測された。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:28:57 GMT)
Phase Transitions in Quantum Many-Body Scars [0.0] 本稿では,高励起量子多体散乱状態において発生する量子多体系における相転移のタイプを提案する。
このようなスカー状態の相転移は、親ハミルトニアンの熱スペクトルにスカー状態として、相転移を経る行列積状態(英語版)を埋め込むことで実現できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:51:01 GMT)
Performance Examination of Symbolic Aggregate Approximation in IoT Applications [0.0] シンボリックアグリゲート近似(SAX)は時系列データに対する一般的な次元削減手法である。
本稿では,SAXアルゴリズムに基づく次元の低減と形状認識手法を提案する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:24:00 GMT)
Path integral derivation of the thermofield double state in causal diamonds [0.0] ユークリッド経路積分形式を用いた因果ダイヤモンドの熱場二重状態の導出を行う。
静的ダイヤモンド観測者によって検出された温度は、この経路積分法によって導出される熱場二重温度と一致する。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:25:28 GMT)
Partial symplectic quantum tomography schemes. Observables, evolution equations, and stationary states equations [0.0] 量子力学における部分シンプレクティック条件および結合確率表現について考察する。
最も興味深い物理作用素の対応規則を見つけ、作用素の双対記号の式を導出する。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:25:09 GMT)
Optimizing cnn-Bigru performance: Mish activation and comparative analysis with Relu [0.0] アクティベーション関数(AF)はニューラルネットワークの基本コンポーネントであり、データ内の複雑なパターンや関係をキャプチャすることができる。
本研究は, 侵入検知システムの性能向上におけるAFの有効性を照らすものである。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:48:56 GMT)
Optimization of entanglement depends on whether a black hole is extremal [0.0] 我々は、質量を持たない最小結合のスカラー場と相互作用する2つの検出器を、1+1$の次元 Reissner-Nordstr "om black hole spacetime で考える。
本研究では,非極端・極端シナリオにおける絡み合い条件と絡み合い,コンカレンスの測定について検討する。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:51:01 GMT)
Optimal Control of Bipartite Quantum Systems [0.0] 高速局所ユニタリ制御を受ける閉二部量子系について検討した。
極端に絡み合った状態と積状態の時間-最適生成に特に焦点が当てられる。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:18:17 GMT)
Online antisemitism across platforms [0.0] この説明可能なAIは、プラットフォーム間でのオンラインソーシャルメディアメッセージにおいて、英語とドイツの反ユダヤ的表現である非人間化、言葉による攻撃、陰謀を識別する。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:26:06 GMT)
On the interpretation of quantum theory as games between physicists and nature played in Minkowski spacetime [0.0] 2019年、ミンコフスキー時空でゲーム理論の特殊相対性理論への一般化としてゲームを紹介した。
ナッシュリリアを含む多くの概念は自然に時空ゲームに拡張される。
我々は、戦略プレシーブの観点から、そのようなゲームの特別なケースを定式化する。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:19:27 GMT)
On the Connection Between Non-negative Matrix Factorization and Latent Dirichlet Allocation [0.0] 一般化Kullback-Leibler分散(NMF)と潜在Dirichletアロケーション(LDA)を併用した非負行列分解は、非負データ次元化のための2つの一般的なアプローチである。
分解の両行列の列に正規化制約のあるNMFと1つの行列の列に先行するディリクレがLDAと同値であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 23:54:17 GMT)
Non-locality of conjugation symmetry: characterization and examples in quantum network sensing [0.0] 量子ネットワーク上で共役対称測定を行うのに必要な非局所資源を解析する。
我々は、与えられた多部共役が局所的に実装可能な対称測度を持つことができる条件を導出する。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:49:45 GMT)
Neural Networks for Extreme Quantile Regression with an Application to Forecasting of Flood Risk [0.0] 本稿では,ニューラルネットワークと極値理論を組み合わせたEQRNモデルを提案する。
本研究では,スイス・アーレ流域の洪水リスク予測に本手法を適用した。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:47:46 GMT)
Monogamy of nonlocality from multipartite information causality [0.0] 情報因果性の物理的原理は、非局所性の範囲を理解し制限する有望な手段を提供する。
最近提案された情報因果関係の多部的定式化は, より強固な無信号モノガミー関係を示唆することを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:52:00 GMT)
Monogamy of Nonlocal Games [0.0] 2ドル以上のゲームが2ドル以上の頂点を持つグラフ上のベル非局所性に違反できない場合を特徴付けます。
CHSHゲームは2つの分散シナリオでのみ非局所性を示す。
無限個のグラフに非局所性を示す2ドルのプレイヤゲームを提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:39:12 GMT)
Measurements conspire nonlocally to restructure critical quantum states [0.0] 臨界量子基底状態の局所的な測定が長距離相関に与える影響について検討する。
空間の延長領域上で行われる任意の局所的な測定は、長距離相関において遷移を駆動するために共謀できることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 06:03:59 GMT)
Measurement-Induced Phase Transition in Free Bosons [0.0] 量子多粒子ダイナミクスと連続モニタリングの競合は、測定誘起相転移を引き起こす。
長距離結合を有する連続監視自由ボソンにおける絡み合い構造について検討した。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:31:43 GMT)
Literature Filtering for Systematic Reviews with Transformers [0.0] 特定のトピックに関する重要な研究項目を特定するのに必要な時間に関して、負担が増大する。
本研究では,自然言語記述として提案される研究課題に適合する汎用フィルタリングシステムを構築する方法を提案する。
以上の結果から, バイオメディカル文献に基づいて事前学習したトランスフォーマーモデルにおいて, 特定のタスクを微調整したトランスフォーマーモデルにより, この問題に対する有望な解決策が得られた。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:55:49 GMT)
Lifelong learning challenges in the era of artificial intelligence: a computational thinking perspective [0.0] 人工知能(AI)の急速な進歩は、職場での人間とAIのコラボレーションにAIを活用するために必要な教育と労働力のスキルに大きな課題をもたらした。
本稿では,AI時代の生涯学習の課題を,計算的思考の観点から概観する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:46:11 GMT)
KNOW: A Real-World Ontology for Knowledge Capture with Large Language Models [0.0] KNOWは、パーソナルAIアシスタントなどの実世界の生成AIユースケースにおいて、大きな言語モデル(LLM)を拡張するために日々の知識を捉えるように設計された最初のオントロジーである。
モデル化された概念の初期の範囲は、時空(場所、イベント)と社会的(人、グループ、組織)に限られています。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:32:14 GMT)
Iterative Learning Control of Fast, Nonlinear, Oscillatory Dynamics (Preprint) [0.0] 非線形でカオス的で、しばしばアクティブな制御方式では速すぎる。
そこで我々は,反復的,軌道最適化,パラメータ調整による代替能動制御システムを開発した。
特定の要件を満たす限り、コントローラは情報不足や制御不能なパラメータに対して堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:27:17 GMT)
Is Complexity an Illusion? [0.0] すべての制約は、弱さに関係なく、同じくらい単純な形を取ることができる。
もし関数が形式の有限部分集合で表されるなら、単純さと一般化の間に相関関係を強制することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:38:42 GMT)
Investigating pump harmonics generation in a SNAIL-based Traveling Wave Parametric Amplifier [0.0] トラベリングウェーブパラメトリック増幅器(TWPA)は、非常に望ましい量子制限特性とブロードバンド特性のために弱いマイクロ波信号を含む実験に広く用いられている。
しかし、TWPAsのブロードバンド特性は、増幅性能を低下させる可能性のあるハーモニクス生成のような急激な非線形過程の活性化を認めるという欠点がある。
そこで本研究では,SNAIL(Superconducting Asymmetric Inductive Element)を用いたJosephson TWPAデバイスを,ポンプの第2および第3高調波の発生とともに増幅挙動に着目して実験的に検討した。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:35:23 GMT)
Inpaint Biases: A Pathway to Accurate and Unbiased Image Generation [0.0] Inpaint Biasesフレームワークは,画像生成の精度を高めるために,ユーザ定義マスクとインペイント技術を利用する。
我々は,このフレームワークが生成した画像のユーザ意図に対する忠実度を大幅に改善し,モデルの作成能力を向上することを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:58:56 GMT)
Implementation of B$^α$ Gates [0.0] イオントラップシステムにB$alpha$ゲートを実装する実験手法を提案する。
このスキームの実装が成功すると、B$alpha$ gatesはイオントラップ量子コンピュータの量子計算に利用できる。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:23:18 GMT)
Image Coding for Machines with Edge Information Learning Using Segment Anything [0.0] 画像中の対象部品のエッジ情報のみを符号化・復号化することに焦点を当てたICMの手法を提案する。
これは、Segment Anythingによって生成されたエッジ情報を使用してトレーニングされた、学習された画像圧縮(lic)モデルである。
画像認識のための画像圧縮において,SA-ICMが最高の性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:38:18 GMT)
Hybrid Quantum Algorithm for Simulating Real-Time Thermal Correlation Functions [0.0] 実時間量子熱相関関数を計算するために,hPIMC (Path Integral Monte Carlo) アルゴリズムを提案する。
本稿では,最近開発された確率Imaginary-Time Evolution (PITE)アルゴリズムを用いて,仮想時間進化の構成要素を正確に行うことができることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:30:13 GMT)
Higher-order incompatibility improves distinguishability of causal quantum networks [0.0] 量子テスタ(quantum testers)として知られる非互換な高次量子論的テスト手順は、それと互換性のある量子ネットワークよりも因果量子ネットワークの区別が優れている。
互換性のないテスタに独占的にアクセスできる場合には,レシーバがゲームに勝つのがよいことを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:11:19 GMT)
Hierarchical Object-Centric Learning with Capsule Networks [0.0] 畳み込みニューラルネットワークの制限に対処するために、カプセルネットワーク(CapsNets)が導入された。
この論文はCapsNetsの興味深い側面を調査し、その潜在能力を解き放つための3つの重要な疑問に焦点を当てている。
論文参考訳(メタデータ) (Thu, 30 May 2024 09:10:33 GMT)
From Forest to Zoo: Great Ape Behavior Recognition with ChimpBehave [0.0] ChimpBehaveは動物園で飼育されているチンパンジーの2時間以上のビデオ(約193,000フレーム)を特徴とする新しいデータセットだ。
ChimpBehaveは、アクション認識のためのバウンディングボックスやビヘイビアラベルに細心の注意を払ってアノテートする。
我々は、最先端のCNNベースの行動認識モデルを用いてデータセットをベンチマークする。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:11:08 GMT)
Few-Photon SUPER: Quantum emitter inversion via two off-resonant photon modes [0.0] 本研究では、2つの光子モードを量子エミッタに非共鳴的に結合する拡張Jaynes-Cummingsモデルについて検討する。
我々は、共振子外光子を1つのモードから別のモードに移動させながら、エミッタの完全な反転につながる少数の光子散乱機構を同定する。
我々の結果は、最近開発された量子EmitteRのSwing-UPとして知られる非共鳴量子制御スキームの量子化アナログとして理解することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:32:18 GMT)
Fate of many-body localization in an Abelian lattice gauge theory [0.0] 我々は、ラダー幾何学上のランダムなカップリングを持つハミルトニアンの物質フリー$U(1)$量子リンクゲージ理論の中間スペクトル固有状態の多体局在の運命を論じる。
$p(mathcalD)$ for $L_x times L_y$ lattices, with $L_y=2$ and $4$, as a function of (less) disorder strength。
L_y=4$の広いはしごの場合、$p(mathcalD)$はローカライズする傾向が低く、MBLが2つに欠けていることを示唆している。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:00:02 GMT)
Fast Topological Signal Identification and Persistent Cohomological Cycle Matching [0.0] コホモロジー手法を用いてトポロジカルな頻度とサイクルマッチングを決定する問題について検討する。
我々はこれを、幅広い実生活、大規模、複雑なデータセットで実証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:08:22 GMT)
Fairness in AI-Driven Recruitment: Challenges, Metrics, Methods, and Future Directions [0.0] ビッグデータと機械学習は、従来の採用プロセスに急激な変革をもたらした。
AIベースの採用の頻度を考えると、人間の偏見がこれらのシステムによって決定される可能性があるという懸念が高まっている。
本稿では、AIによる採用におけるバイアスの種類を議論することで、この新興分野の包括的概要を提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 05:25:14 GMT)
Exploring the Potential of Polynomial Basis Functions in Kolmogorov-Arnold Networks: A Comparative Study of Different Groups of Polynomials [0.0] 本稿では,ゴットリーブモゴロフネットワーク(KAN)モデルにおける18の異なる特徴とその潜在的な応用について述べる。
本研究は,手書き桁分類などの複雑なタスクに対するkanモデルにおける基本関数としての theseDistincts の適合性を検討することを目的とする。
総合的精度,Kappa,F1スコアを含むkanモデルの性能指標を評価し,比較した。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:40:16 GMT)
Evaluation of Semantic Search and its Role in Retrieved-Augmented-Generation (RAG) for Arabic Language [0.0] 本稿では,アラビア語のセマンティックサーチにおいて,単純かつ強力なベンチマークの確立に尽力する。
これらの指標とデータセットの有効性を正確に評価するために、検索拡張生成(RAG)の枠組み内で意味探索の評価を行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:16:39 GMT)
Estimating Coherent Contributions to the Error Profile Using Cycle Error Reconstruction [0.0] 本稿では,ハード・コンピューティング・サイクルの誤差プロファイルに対するコヒーレント・コントリビューションの詳細な推定値を得るための,スケーラブルでサイクル中心の方法論を提案する。
ibmq_guadalupe, ibmq_manila, ibmq_montrealの3つのIBMチップ上で概念実証実験を行う。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:51:45 GMT)
Ensemble Model With Bert,Roberta and Xlnet For Molecular property prediction [0.0] 本稿では,分子特性を高精度に予測するための新しい手法を提案する。
我々はアンサンブル学習を採用し,BERT,RoBERTa,XLNetの微調整を行う。
この革新は、コスト効率が高く、資源効率のよいソリューションを提供し、分子領域におけるさらなる研究を推し進める可能性がある。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:03:58 GMT)
Enhancing Antibiotic Stewardship using a Natural Language Approach for Better Feature Representation [0.0] 抗生物質耐性菌の急速な出現は、世界的な医療危機として認識されている。
本研究は, 抗生物質スチュワードシップ改善のための臨床意思決定支援システムの利用について検討する。
EHRシステムは、データの効率的な合成と利用を複雑にし、多くのデータレベルの課題を提示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:53:53 GMT)
Easy Problems That LLMs Get Wrong [0.0] 大規模言語モデル(LLM)の限界を評価するために設計された包括的な言語ベンチマークを導入する。
一連の簡単な質問を通じて、人間が簡単に管理するタスクを実行するための、よく考えられたモデルの重大な制限を明らかにする。
論文参考訳(メタデータ) (Thu, 30 May 2024 02:09:51 GMT)
Digital Inheritance in Web3: A Case Study of Soulbound Tokens and the Social Recovery Pallet within the Polkadot and Kusama Ecosystems [0.0] 本研究では,ソウルバウンドトークンとソーシャルリカバリパレットを用いたデジタル継承の枠組みを提案する。
この結果は、ソウルバウンドトークンとソーシャルリカバリパレットがデジタル継承計画の作成に有望なソリューションを提供する一方で、テスタのデジタルエグゼキュータや開発者にとって重要な考慮がもたらされることを示唆している。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:50:09 GMT)
Detecting Hallucinations in Large Language Model Generation: A Token Probability Approach [0.0] LLM(Large Language Models)は、幻覚と呼ばれる不正確な出力を生成する。
本稿では,トークンから得られる4つの数値的特徴と,他の評価者から得られる語彙的確率を用いた教師付き学習手法を提案する。
この方法は有望な結果をもたらし、3つの異なるベンチマークで複数のタスクで最先端の結果を上回る。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:00:47 GMT)
Deep Learning for Computing Convergence Rates of Markov Chains [0.0] Deep Contractive Drift Calculator (DCDC)は、マルコフ連鎖の収束をワッサーシュタイン距離における定常性にバウンドするための、最初の汎用的なサンプルベースアルゴリズムである。
DCDCは,処理ネットワークから生じる現実的なマルコフ連鎖の収束境界と,ステップサイズを一定に最適化できることを示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:26:51 GMT)
Deep Learning Approaches for Detecting Adversarial Cyberbullying and Hate Speech in Social Networks [0.0] 本稿では、ソーシャルネットワークサイトテキストデータ中の敵対的攻撃コンテンツにおけるサイバーいじめの検出、特にヘイトスピーチを強調することに焦点を当てる。
100の固定エポックを持つLSTMモデルは、高い精度、精度、リコール、F1スコア、AUC-ROCスコアが87.57%、88.73%、88.15%、91%の顕著な性能を示した。
論文参考訳(メタデータ) (Thu, 30 May 2024 21:44:15 GMT)
CycleFormer : TSP Solver Based on Language Modeling [0.0] 本稿では,CycleFormerと呼ばれるトラベリングセールスマン問題(TSP)に対するトランスフォーマーモデルを提案する。
限定的で静的な典型的な言語モデルのトークンセットとは異なり、TSPのトークンセット(ノード)は無制限で動的である。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:23:02 GMT)
Critical metrology of minimally accessible anisotropic spin chains [0.0] 局所的および準局所的な測定がシステムのグローバルな特性を特徴づけるためにどのように利用されるかを示す。
特に、単一のスピンの密度行列について、関連するパラメータの古典的(磁化)および量子フィッシャー情報を評価する。
論文参考訳(メタデータ) (Thu, 30 May 2024 17:45:27 GMT)
Convolutional L2LFlows: Generating Accurate Showers in Highly Granular Calorimeters Using Convolutional Normalizing Flows [0.0] 我々はL2LFlowsを拡張して、横方向の9倍のプロファイルでシャワーをシミュレートする。
畳み込み層とU-Net型接続を導入し,マスク付き自己回帰フローから結合層へ移行する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:25:19 GMT)
Contrastive Learning and Mixture of Experts Enables Precise Vector Embeddings [0.0] 本稿では,類似度指標として共引用を用いてニッチデータセットを組み立てることにより,科学文献のベクトル埋め込みを改善する。
本研究では,複数層のパーセプトロン区間を拡大し,複数の異なる専門家にコピーする,新たなMixture of Experts(MoE)拡張パイプラインを事前訓練されたBERTモデルに適用する。
私たちのMOEの変種は、N$の専門知識を持つ科学ドメインよりも優れていますが、標準的なBERTモデルは1つのドメインでしか排他的ではありません。
論文参考訳(メタデータ) (Thu, 30 May 2024 19:55:58 GMT)
Constrained or Unconstrained? Neural-Network-Based Equation Discovery from Data [0.0] 我々はPDEをニューラルネットワークとして表現し、物理情報ニューラルネットワーク(PINN)に似た中間状態表現を用いる。
本稿では,この制約付き最適化問題を解くために,ペナルティ法と広く利用されている信頼領域障壁法を提案する。
バーガーズ方程式とコルトヴェーグ・ド・ヴライス方程式に関する我々の結果は、後者の制約付き手法がペナルティ法より優れていることを示している。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:55:44 GMT)
Computational Dualism and Objective Superintelligence [0.0] 性能に関する客観的な主張を行うためには、計算双対性を避ける必要がある。
環境のあらゆる側面が既約状態間の関係であるパンコンピュテーションの代替案を提案する。
これによって私たちは、インテリジェンスに関する客観的な主張を行うことができ、それは"一般化"し、原因を特定し、適応する能力である、と我々は主張する。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:26:25 GMT)
Comparison of non-decoy single-photon source and decoy weak coherent pulse in quantum key distribution [0.0] 我々は、SPSの非デコイ効率的なBB84プロトコルを分析し、その光子統計を$g(2)(0)$と平均光子数で部分的に特徴付ける。
その結果, 平均光子数$langle n rangle = 0.5$ および $g(2)(0) = 3.6%$ の非デコイSPSは, 2-デコイWCP上での鍵生成を促進できることがわかった。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:39:38 GMT)
Comparative Microscopic Study of Entropies and their Production [0.0] ボルツマン-表面,ギブス-体積,カノニカル,粗粒度観測,絡み合い,対角形)および3つの微視的温度定義(ボルツマン,ギブス,カノニカルエントロピーに基づく)の時間進化について検討した。
これは、シュレーディンガー方程式の数値積分に基づいて、ここでランダム行列理論でモデル化されたエネルギーを交換する2つの系の根元的非平衡設定のために行われる。
論文参考訳(メタデータ) (Thu, 30 May 2024 07:58:31 GMT)
Coherent coupling of circular Rydberg qubits to inner shell excitations [0.0] 二価原子は、ライドバーグ原子に基づく量子シミュレーションと計算における制御を前進させる優れた手段を提供する。
準安定な4D$_3/2$レベルと非常に高いn$丸いRydberg量子ビット間の電気四極子結合の測定を報告する。
本研究は,Rydberg原子における電子-電子相互作用の弱さを実証し,高励起円状量子ビットの光制御のための量子シミュレーションツールボックスを拡張した。
論文参考訳(メタデータ) (Thu, 30 May 2024 20:54:35 GMT)
Classical and Quantum Properties of the Spin-Boson Dicke Model: Chaos, Localization, and Scarring [0.0] ディックモデル(Dicke model)は、1950年代に標準から超ラジアント相への遷移を説明するために導入されたモデルである。
本論では, 古典的, 量子的両面からよりよく理解された特性と現象を取り上げ, モデル分離版に焦点をあてる。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:00:04 GMT)
Chirp asymmetry in Zeeman electromagnetically induced transparency [0.0] 電磁誘導透過(EIT)を示す3レベルシステムは、効果的な共役対称性と置換対称性を示す。
共役対称性の破れはチャープ非対称性を区別し、周波数に対する微分応答は周波数の減少に対して増加する。
本稿では,この理論をバッファーガスセルの87Rbを用いた実験と比較する。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:19:04 GMT)
Canonical Typicality For Other Ensembles Than Micro-Canonical [0.0] 最大固有値 $|rho|$ of $rho$ が小さいときは常に測定の集中が証明される。
分離可能なヒルベルト空間 $mathcalH$ 上の任意の密度行列 $rho$ に対して、GAP$(rho)$ は単位球面上で最も広がる確率測度である。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:04:28 GMT)
Can No-Reference Quality-Assessment Methods Serve as Perceptual Losses for Super-Resolution? [0.0] 知覚的損失は、ディープ・ニューラル・ネットワーク・ベースの手法を構築する上で重要な役割を果たす。
本稿では,非参照画像品質評価法を知覚的損失として用いたビデオ超解像モデルの直接最適化について検討する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:04:58 GMT)
CRIS: Collaborative Refinement Integrated with Segmentation for Polyp Segmentation [0.0] 本稿では,マスクの改良とセマンティックセマンティックセグメンテーションを融合したアプローチを提案する。
確立したベンチマークデータセットを総合評価することで,提案手法の優位性を実証する。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:56:01 GMT)
Bexcitonics: Quasi-particle approach to open quantum dynamics [0.0] 我々は、ボゾン熱浴に結合したオープン量子系の力学を捉えるための準粒子アプローチを開発する。
ベキシトニックな性質は、相関系の基底力学とその数値収束の粗い粒度のビューを提供する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:21:46 GMT)
Audio2Rig: Artist-oriented deep learning tool for facial animation [0.0] Audio2Rigは、以前アニメーションされたショーのシーケンスを利用して、オーディオファイルから顔と唇のシンクリグアニメーションを生成する新しいディープラーニングツールだ。
マヤに拠点を置き、調整なしにあらゆるプロダクション・リグから学び、高品質でスタイリッシュなアニメーションを生成する。
提案手法は優れた結果を示し,番組スタイルを尊重しながら細かなアニメーションの細部を生成する。
論文参考訳(メタデータ) (Thu, 30 May 2024 18:37:21 GMT)
Atomistic compositional details and their importance for spin qubits in isotope-purified silicon-germanium quantum wells [0.0] SiGe28$Si/SiGeヘテロ構造における同位体組成の深さ分布を解析した。
この量子井戸(QW)のヘテロ構造において、スピン-エチョ縮退時間と谷エネルギー分割が単一のスピン量子ビットに対して観測されている。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:57:18 GMT)
Analysis of a multi-target linear shrinkage covariance estimator [0.0] 我々は, 精密かつ実証的な平均値で, オラクルとテライトボナの多ターゲット線形収縮推定器を導出する。
様々な状況において、他の標準推定値よりも優れていることを実証的に示す。
論文参考訳(メタデータ) (Thu, 30 May 2024 14:16:32 GMT)
Analysing the Public Discourse around OpenAI's Text-To-Video Model 'Sora' using Topic Modeling [0.0] 本研究の目的は,1,827件のRedditコメントコーパスでトピックモデリング分析を行うことで,ソラを取り巻く支配的なテーマや物語を明らかにすることである。
コメントは2024年2月のソラの発表から2ヶ月にわたって収集された。
結果は、産業や雇用、公共の感情や倫理的懸念、クリエイティブな応用、メディアやエンターテイメント分野のユースケースに対するソラの潜在的影響に関する顕著な物語を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 30 May 2024 01:55:30 GMT)
AI with Alien Content and Alien Metasemantics [0.0] この章では、セマンティックとメタセマンティックの観点から、AIにおける異星のコンテンツに関する疑問を探求する。
意味論とメタセマンティックな質問に対する可能な応答の論理空間をレイアウトする。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:17:15 GMT)
AI Safety: A Climb To Armageddon? [0.0] 本稿では,最適化,緩和,ホロリズムの3つの対応戦略について検討する。
この議論の驚くべき堅牢性は、AIの安全性に関するコア前提の再検討を迫られる。
論文参考訳(メタデータ) (Thu, 30 May 2024 08:41:54 GMT)
A relativistic statistical field theory on a discretized Minkowski lattice with quantum-like observables [0.0] 離散化ミンコフスキー格子上の揺らぎ複素数値スカラー場に対して相対論的統計場理論を構築する。
可観測物のヒルベルト空間は、変動する複素数値スカラー場の函数から構成され、内部積は函数の期待値によって定義される。
その後、ヒルベルト空間からボソニック・フォック空間が構成され、フォック空間に作用する作用素が定義される。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:41:25 GMT)
A random-key GRASP for combinatorial optimization [0.0] 本稿ではランダムキーGRASPのための問題非依存コンポーネントと問題依存デコーダについて述べる。
概念実証として、ランダムキーGRASPは5つのNPハード最適化問題でテストされる。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:06:27 GMT)
A momentum space formulation for some relativistic statistical field theories with quantum-like observables [0.0] その後、ヒルベルト空間からボソニック・フォック空間が構成され、フォック空間に作用する作用素が定義される。
例えば、場作用素は一般に可換ではないし、自由体論の特定の場合において、微小因果性条件を満たすように示せる。
論文参考訳(メタデータ) (Thu, 30 May 2024 16:46:24 GMT)
A coherence sweet spot with enhanced dipolar coupling [0.0] 我々は、妥協のないシングルトリップレット(ST)量子ビットを示し、そこでは、キュービットは駆動場に最大に結合する。
我々は、双極子結合を最大化し、デコヒーレンスを最大化するスピンキュービットスイーツスポットを実証した。
これらの発見は、次世代量子ビット技術のためのナノマテリアルの工学的発展の道を開いた。
論文参考訳(メタデータ) (Thu, 30 May 2024 03:09:04 GMT)
A Triumvirate of AI Driven Theoretical Discovery [0.0] 近い将来、AIに取って代わられる危険はないが、人間の専門知識とAIアルゴリズムのハイブリッドは、理論的な発見の不可欠な部分になる、と我々は主張する。
論文参考訳(メタデータ) (Thu, 30 May 2024 11:57:00 GMT)
A Survey Study on the State of the Art of Programming Exercise Generation using Large Language Models [0.0] 本稿では,Large Language Models (LLM) のプログラミング演習生成能力について分析する。
調査研究を通じて,技術の現状を定義し,その強みと弱みを抽出し,評価行列を提案した。
論文参考訳(メタデータ) (Thu, 30 May 2024 15:49:34 GMT)
A Random Forest-based Prediction Model for Turning Points in Antagonistic event-group Competitions [0.0] 本稿では, ランダムフォレストに基づく, 対角的事象群の旋回点の予測モデルを提案する。
このモデルは、敵対的なイベントグループの競争状況の転換点を効果的に予測することができる。
論文参考訳(メタデータ) (Thu, 30 May 2024 13:13:48 GMT)
A Quantitative Study of SMS Phishing Detection [0.0] 参加者187名を対象に,スマイシング検出に関するオンライン調査を行った。
我々は16のSMSスクリーンショットを提示し、異なる要因がスマイシング検出における意思決定プロセスに与える影響を評価した。
参加者は偽のメッセージで67.1%、本物のメッセージで43.6%の精度で、偽のメッセージから本物のメッセージを見つけるのが困難であることが判明した。
論文参考訳(メタデータ) (Thu, 30 May 2024 00:03:56 GMT)
A New Benchmark for Evaluating Automatic Speech Recognition in the Arabic Call Domain [0.0] この研究は、アラビア語における電話会話の課題に対処するために、アラビア語音声認識のための包括的なベンチマークを導入する試みである。
我々の研究は、アラビア方言の幅広い範囲を包含するだけでなく、コールベースのコミュニケーションの現実的な条件をエミュレートする堅牢なベンチマークを確立することを目的としている。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:17:51 GMT)
A Multi-Branched Radial Basis Network Approach to Predicting Complex Chaotic Behaviours [0.0] 本稿では,複雑でカオス的な振る舞いを特徴とする物理誘引器の動的特性を予測するために,多分岐ネットワークアプローチを提案する。
その結果,実世界の36,700の時系列観測データから得られた100の予測値に対して,アトラクタの軌道の予測に成功した。
論文参考訳(メタデータ) (Thu, 30 May 2024 10:16:04 GMT)
A Deep Reinforcement Learning Approach for Trading Optimization in the Forex Market with Multi-Agent Asynchronous Distribution [0.0] この研究は、最先端の非同期アドバンテージ・アクター・クリティカル(A3C)アルゴリズムを用いたマルチエージェント(MA)RLフレームワークの適用を先導する。
ロックとロックなしの2つの異なるA3Cが提案され、単一通貨とマルチ通貨で訓練された。
以上の結果から,両モデルが近似政策最適化モデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 30 May 2024 12:07:08 GMT)