Revisiting Zeroth-Order Optimization for Memory-Efficient LLM
Fine-Tuning: A Benchmark [170.5] 本稿では、微調整時のメモリコスト低減のためのソリューションとして、BPフリーゼロオーダー最適化(ZO)への移行を提案する。
従来のZO-SGD法とは異なり、我々の研究はより広い範囲のZO最適化手法に探索を広げる。
本研究は,タスクアライメントの重要性,前方勾配法の役割,アルゴリズムの複雑さと微調整性能のバランスについて,これまで見過ごされてきた最適化原理を明らかにした。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:08:48 GMT)
Towards 3D VR-Sketch to 3D Shape Retrieval [128.5] 入力モダリティとしての3Dスケッチの利用について検討し、検索を行うVRシナリオを提唱する。
この新しい3DVR-Sketchから3D形状の検索問題に対する最初のスタンプとして、私たちは4つのコントリビューションを行います。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:59:16 GMT)
Momentor: Advancing Video Large Language Model with Fine-Grained
Temporal Reasoning [107.0] 本稿では,微細な時間的理解作業を実現するためのビデオLLMであるMomentorを提案する。
Moment-10MでMomentorをトレーニングし、セグメントレベルの推論とローカライゼーションを可能にします。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:04:38 GMT)
SciAgent: Tool-augmented Language Models for Scientific Reasoning [102.7] ツール強化科学推論という新しいタスク設定を導入する。
この設定は、スケーラブルなツールセットでLarge Language Modelsを補完する。
約3万のサンプルと約6,000のツールを含むツール拡張トレーニングコーパスであるMathFuncを構築した。
MathFunc上に構築したSciAgentは,科学的な問題解決のためのツールを検索し,理解し,必要に応じて利用する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:19:44 GMT)
Can LLMs Reason with Rules? Logic Scaffolding for Stress-Testing and
Improving LLMs [95.4] 大規模言語モデル(LLM)は、様々な推論タスクにおいて、印象的な人間的なパフォーマンスを実現している。
しかし、その根底にある推論規則の熟達性は、人間の能力に欠ける。
本稿では,推論ルールベースであるULogicを構築するための,推論ルール生成フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:38:51 GMT)
MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific
Data Visualization [88.7] MatPlotAgentは、科学的データ可視化タスクを自動化するために設計された、モデルに依存しないフレームワークである。
MatPlotBenchは、100人の検証されたテストケースからなる高品質なベンチマークである。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:28:28 GMT)
Anchor Points: Benchmarking Models with Much Fewer Examples [88.0] 6つの人気のある言語分類ベンチマークでは、多数の点の正しいクラスに対するモデル信頼度はモデル間で強く相関している。
Anchor Point Selectionは,データセット全体にわたるモデル動作をキャプチャする,データセットの小さなサブセットを選択する手法である。
平均絶対誤差が低いデータセットの他のすべての点について、クラスごとの予測モデルを推定するために、いくつかのアンカーポイントを使用することができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:37:47 GMT)
TALL: Thumbnail Layout for Deepfake Video Detection [84.1] 本稿では,Thumbnail Layout(TALL)という,シンプルだが効果的な戦略を紹介する。
TALLはビデオクリップを予め定義されたレイアウトに変換し、空間的および時間的依存関係の保存を実現する。
視覚変換器の成功に触発されて,我々はTALLをSwin Transformerに組み込み,効率的かつ効果的なTALL-Swin法を構築した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:58:02 GMT)
Nonparametric Classification on Low Dimensional Manifolds using
Overparameterized Convolutional Residual Networks [82.0] 非パラメトリック分類の観点から重量減衰を訓練したConvResNeXtsの性能について検討した。
我々の分析は、ConvResNeXtsにおいて無限に多くのビルディングブロックを許容し、重み減衰がこれらのブロックに空間性を暗黙的に強制することを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:29:20 GMT)
Perils of Self-Feedback: Self-Bias Amplifies in Large Language Models [79.5] セルフフィードバックは、特定のタスクにおいて大きな言語モデル(LLM)を改善し、他のタスクを悪化させる。
近年の研究では、自己フィードバックは特定のタスクにおいて大きな言語モデル(LLM)を改善する一方で、他のタスクを悪化させることが示されている。
本稿は、LSMの自己バイアス(自称世代を好む傾向)を正式に定義する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:10:39 GMT)
Interactive Garment Recommendation with User in the Loop [77.4] 我々は,服を作るために補完的なアイテムを推奨するので,ユーザ反応を統合することでユーザプロファイルをその場で構築することを提案する。
本稿では,適切な衣服を提案し,ユーザのフィードバックを取り入れて推薦を改善することができる強化学習エージェントを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:01:28 GMT)
Graph Out-of-Distribution Generalization via Causal Intervention [74.8] 本稿では,ノードレベルの分散シフトの下で頑健なグラフニューラルネットワーク(GNN)をトレーニングするための,概念的に単純だが原則化されたアプローチを提案する。
本手法は,環境推定器と熟練GNN予測器を協調する因果推論に基づく新たな学習目標を提案する。
本モデルでは,様々な分散シフトによる一般化を効果的に向上し,グラフOOD一般化ベンチマーク上での最先端の精度を最大27.4%向上させることができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:49:22 GMT)
PsySafe: A Comprehensive Framework for Psychological-based Attack,
Defense, and Evaluation of Multi-agent System Safety [73.5] 大規模言語モデル(LLM)で拡張されたマルチエージェントシステムは、集団知能において重要な能力を示す。
しかし、悪意のある目的のためにこのインテリジェンスを誤用する可能性があり、重大なリスクが生じる。
本研究では,エージェント心理学を基盤とした枠組み(PsySafe)を提案し,エージェントのダークパーソナリティ特性がリスク行動にどう影響するかを明らかにする。
実験の結果,エージェント間の集団的危険行動,エージェントが危険な行動を行う際の自己反射,エージェントの心理的評価と危険な行動との相関など,いくつかの興味深い現象が明らかになった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:36:39 GMT)
LoRA-Flow: Dynamic LoRA Fusion for Large Language Models in Generative
Tasks [72.9] LoRAは、ダウンストリームタスクやドメイン毎に大きな言語モデル(LLM)をカスタマイズするために軽量モジュールを使用している。
動的重みを利用して異なるLoRAの影響を調整するLoRA-Flowを提案する。
6つの生成タスクに対する実験により、我々の手法はタスクレベルの融合重みでベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:41:25 GMT)
Continual Learning on Graphs: Challenges, Solutions, and Opportunities [72.8] 本稿では,既存の連続グラフ学習(CGL)アルゴリズムの総合的なレビューを行う。
従来の連続学習手法と比較し,従来の連続学習手法の適用性を分析した。
アクセス可能なアルゴリズムの包括的なリストを含む、最新のリポジトリを維持します。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:24:45 GMT)
When Do LLMs Need Retrieval Augmentation? Mitigating LLMs'
Overconfidence Helps Retrieval Augmentation [72.1] 大規模言語モデル(LLM)は、特定の知識を持っていないことを知るのが困難であることが判明した。
Retrieval Augmentation (RA)はLLMの幻覚を緩和するために広く研究されている。
本稿では,LLMの知識境界に対する認識を高めるためのいくつかの手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:57:19 GMT)
Visual Concept-driven Image Generation with Text-to-Image Diffusion
Model [69.9] テキスト・ツー・イメージ(TTI)モデルでは、複雑で想像力のあるシーンの高解像度画像を生成するという印象的な結果が示されている。
近年のアプローチでは、これらの手法をパーソナライズ技術で拡張し、ユーザ認証の概念の統合を可能にしている。
しかし、人間の被写体のような複数の相互作用する概念を持つ画像を生成する能力は、1つにまたがったり、複数にまたがったりする概念は、いまだに説明がつかないままである。
これらの課題に対処する概念駆動型TTIパーソナライズフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:28:37 GMT)
Re-Dock: Towards Flexible and Realistic Molecular Docking with Diffusion
Bridge [69.8] Re-Dockは、幾何学多様体に拡張された新しい拡散橋生成モデルである。
我々はNewton-Euler方程式にインスパイアされたエネルギー-幾何学マッピングを提案し、結合エネルギーとコンフォーメーションを共モデリングする。
アポドックやクロスドックといった設計済みのベンチマークデータセットの実験は、現在の手法よりもモデルの有効性と効率性が優れていることを示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 05:04:50 GMT)
UltraLink: An Open-Source Knowledge-Enhanced Multilingual Supervised
Fine-tuning Dataset [69.3] オープンソースの大規模言語モデル(LLM)は、様々な分野において大きな強みを持っている。
本研究では,オープンソースの多言語教師付き微調整データセットを構築する。
結果として得られたUltraLinkデータセットは、5つの言語にわたる約100万のサンプルで構成されている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:56:45 GMT)
Token-Level Adversarial Prompt Detection Based on Perplexity Measures
and Contextual Information [67.8] 大規模言語モデルは、敵の迅速な攻撃に影響を受けやすい。
この脆弱性は、LLMの堅牢性と信頼性に関する重要な懸念を浮き彫りにしている。
トークンレベルで敵のプロンプトを検出するための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:04:27 GMT)
Aligning Modalities in Vision Large Language Models via Preference
Fine-tuning [67.6] 本研究では,幻覚の問題をアライメント問題とみなし,好みのチューニングで対処する。
具体的には,AIモデルを用いたフィードバックデータを生成するPOVIDを提案する。
提案手法は,好ましくないデータを生成するための2段階のアプローチである。
広範ベンチマークを用いた実験では、幻覚を減らすだけでなく、標準ベンチマークでのモデル性能を向上させることができ、従来の手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 00:56:16 GMT)
Attractor Memory for Long-Term Time Series Forecasting: A Chaos
Perspective [66.8] 本稿では,カオス理論を長期時系列予測(LTSF)タスクに導入する。
我々のモデルである textbftextitAttraos はカオス理論をLTSFに組み込み、未知の高次元カオス力学系からの観測として実世界の時系列を知覚する。
歴史的力学構造を記憶し、周波数を拡大した局所進化戦略によって予測する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 05:35:01 GMT)
Prospector Heads: Generalized Feature Attribution for Large Models &
Data [63.3] 本稿では,特徴帰属のための説明に基づく手法の,効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:01:28 GMT)
Poisoned Forgery Face: Towards Backdoor Attacks on Face Forgery
Detection [62.6] 本稿では,バックドア攻撃による顔偽造検出の新たな脅威について紹介する。
バックドアをモデルに埋め込むことで、攻撃者は検知器を騙して偽造された顔の誤予測を発生させることができる。
我々は,顔偽造検知器に対するクリーンラベルバックドア攻撃を可能にするemphPoisoned Forgery Faceフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:31:05 GMT)
Visual In-Context Learning for Large Vision-Language Models [62.6] 大規模視覚言語モデル(LVLM)では、言語間相互作用や表現格差の課題により、ICL(In-Context Learning)の有効性が制限されている。
本稿では,視覚的記述型検索,意図的画像要約,意図的記述型合成を含む新しい視覚的記述型学習(VICL)手法を提案する。
提案手法は'Retrieval & Rerank'パラダイムを用いて画像を検索し,タスク意図とタスク固有の視覚的パーシングで画像を要約し,言語による実演を構成する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:43:38 GMT)
Rethinking the Roles of Large Language Models in Chinese Grammatical
Error Correction [62.4] 中国語の文法的誤り訂正(CGEC)は、入力文中のすべての文法的誤りを修正することを目的としている。
CGECの修正器としてのLLMの性能は、課題の焦点が難しいため不満足なままである。
CGECタスクにおけるLCMの役割を再考し、CGECでよりよく活用し、探索できるようにした。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:40:34 GMT)
InfuserKI: Enhancing Large Language Models with Knowledge Graphs via
Infuser-Guided Knowledge Integration [61.6] 大規模言語モデル(LLM)は、様々な領域にまたがる顕著なオープンジェネレーション機能を示している。
新しい知識を注入すると、以前に獲得した知識を忘れるリスクが生じる。
Infuser-Guided Knowledge Integration フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:36:26 GMT)
The Butterfly Effect of Model Editing: Few Edits Can Trigger Large
Language Models Collapse [61.5] 単一の編集でさえモデル崩壊を引き起こし、様々なベンチマークタスクで大幅なパフォーマンス低下を示す。
編集後の大規模言語モデルのベンチマークは、過激な時間とリソース集約である。
提案手法は,下流タスク性能と強い相関を示す広範な実験により検証され,サロゲート指標としてパープレキシティを用いる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:00:46 GMT)
DreamSmooth: Improving Model-based Reinforcement Learning via Reward
Smoothing [60.2] DreamSmoothは、与えられたタイミングでの正確な報酬ではなく、時間的に滑らかな報酬を予測することを学ぶ。
本研究では,DreamSmoothが長時間のスパース・リワードタスクにおいて最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 00:59:14 GMT)
Syntactic Language Change in English and German: Metrics, Parsers, and
Convergences [59.3] 本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:46:16 GMT)
Cobra Effect in Reference-Free Image Captioning Metrics [58.4] 視覚言語事前学習モデル(VLM)を活用した参照フリー手法の普及が出現している。
本稿では,基準自由度に欠陥があるかどうかを考察する。
GPT-4Vは生成した文を評価するための評価ツールであり,提案手法がSOTA(State-of-the-art)の性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:36:23 GMT)
EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction [58.4] EasyToolは、多種多様で長いツールドキュメントを統一的で簡潔なツール命令に変換するフレームワークである。
トークン使用量を大幅に削減し、現実のシナリオにおけるツール利用のパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:26:53 GMT)
ViTEraser: Harnessing the Power of Vision Transformers for Scene Text
Removal with SegMIM Pretraining [58.2] シーンテキスト除去(STR)は、自然のシーンにおけるテキストストロークを視覚的に一貫性のある背景に置き換えることを目的としている。
最近のSTRアプローチは反復的な改善や明示的なテキストマスクに依存しており、結果としてテキストローカライゼーションの精度に高い複雑さと感度をもたらす。
そこで我々は, ViTEraser という, 単純なyet- Effective ViT-based text eraser を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:58:09 GMT)
Efficient Weighting Schemes for Auditing Instant-Runoff Voting Elections [57.7] AWAIREは、適応的に重み付けされたテスト統計量であり、本質的には、テストに有効な仮説のセットを「学習」する。
我々は,計画と設定を幅広く探究し,有効利用のための効率的な選択を特定し,推奨する。
現在のAWAIRE実装の制限は、少数の候補を扱うことの制限である。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:13:01 GMT)
Leaving the Nest: Going Beyond Local Loss Functions for
Predict-Then-Optimize [57.2] 本手法は,文献から得られた4つの領域において,最先端の成果が得られることを示す。
提案手法は, 局所性仮定が破られた場合, 既存手法よりも200%近く性能が向上する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 20:18:07 GMT)
BESA: Pruning Large Language Models with Blockwise Parameter-Efficient
Sparsity Allocation [56.3] 大規模言語モデル(LLM)は、テキスト要約、テキスト質問応答など、様々なタスクにおいて優れたパフォーマンスを示してきた。
SparseGPTやWandaといった既存のソリューションは、重み付けによってこの問題を緩和しようと試みている。
本稿では,ブロックワイド再構成損失を適用して,ブロックワイドパラメータ効率の空間割当(BESA)と呼ばれる新しいLCMプルーニング手法を提案する。
BESAは最先端のパフォーマンスを実現し、たった5時間で単一のA100 GPU上で7Bから70Bパラメータを持つLLaMA1やLLaMA2のようなLLMを効率よく刈り取る
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:44:15 GMT)
Logical Closed Loop: Uncovering Object Hallucinations in Large
Vision-Language Models [55.6] オブジェクト幻覚(Object Hallucination)とは、LVLMが画像に存在しない物体を主張する現象である。
本稿では,物体の幻覚検出と緩和,すなわちLogicCheckGPTのための論理閉ループベースのフレームワークを提案する。
プラグアンドプレイ法として、既存のすべてのLVLMにシームレスに適用することができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:28:39 GMT)
Competition of Mechanisms: Tracing How Language Models Handle Facts and
Counterfactuals [55.2] 解釈可能性の研究は、経験的成功と大規模言語モデルの内部動作に関する科学的理解のギャップを埋めることを目的としている。
個別のメカニズムの代わりに複数のメカニズムの相互作用に焦点を当てたメカニズムの競合の定式化を提案する。
本研究は, 種々のモデル成分間の機構とその競合の痕跡を示し, 特定の機構の強度を効果的に制御する注意位置を明らかにした。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:26:51 GMT)
Advancing Translation Preference Modeling with RLHF: A Step Towards
Cost-Effective Solution [54.7] 人間のフィードバックによる強化学習の活用による翻訳品質の向上について検討する。
強力な言語能力を持つ報酬モデルは、翻訳品質の微妙な違いをより敏感に学習することができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:51:49 GMT)
A Wolf in Sheep's Clothing: Generalized Nested Jailbreak Prompts can
Fool Large Language Models Easily [54.2] 大きな言語モデル(LLM)は有用で安全な応答を提供するように設計されている。
ジェイルブレイク」と呼ばれる 敵のプロンプトは 保護を回避できる
有効なジェイルブレイクプロンプトを生成するためにLLM自体を活用する自動フレームワークであるReNeLLMを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:06:51 GMT)
Bridging Evolutionary Algorithms and Reinforcement Learning: A
Comprehensive Survey [53.9] 進化的強化学習(ERL)は進化的アルゴリズム(EA)と強化学習(RL)を統合して最適化する。
本調査では,ERLの多様な研究分野について概観する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 13:57:20 GMT)
Modelling Political Coalition Negotiations Using LLM-based Agents [53.9] 我々は、新しいNLPタスクとして連立交渉を導入し、それを大規模言語モデルに基づくエージェント間の交渉としてモデル化する。
我々は、欧州政党の宣言とこれらの国における多数の選挙に関する連立協定を含む多言語データセット「POLCA」を導入する。
本稿では、政党間の連立交渉の過程をシミュレートし、その結果を予測するために、階層的なマルコフ決定プロセスを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:28:06 GMT)
Vision-Flan: Scaling Human-Labeled Tasks in Visual Instruction Tuning [53.9] 現在までに最も多種多様なビジュアル・インストラクション・チューニング・データセットであるVision-Flanを構築している。
本稿では、VLMをVision-Flan上で微調整し、さらにGPT-4合成データに基づいて調整する2段階の命令チューニングフレームワークを提案する。
この2段階のチューニングフレームワークは、従来の1段階の視覚的チューニングフレームワークよりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:38:44 GMT)
Empowering Many, Biasing a Few: Generalist Credit Scoring through Large
Language Models [53.6] 大規模言語モデル(LLM)は、複数のタスクにまたがる強力な一般化能力を持つ信用スコアリングタスクにおいて大きな可能性を秘めている。
クレジットスコアリングのための LLM を探索する,初のオープンソース包括的フレームワークを提案する。
そこで我々は,各種金融リスク評価タスクの煩雑な要求に合わせて,指導チューニングによる最初の信用・リスク評価大言語モデル(CALM)を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:24:17 GMT)
Benchmark Self-Evolving: A Multi-Agent Framework for Dynamic LLM
Evaluation [52.0] 本稿では,大規模言語モデル(LLM)を動的に評価するベンチマーク自己進化フレームワークを提案する。
マルチエージェントシステムを用いて、元のインスタンスのコンテキストや質問を操作し、信頼性の高い新しいインスタンスをフレーミングする。
我々のフレームワークは、異なるモデル間の性能の相違を拡大し、様々なタスクで同じモデル内で性能の相違を拡大します。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:40:06 GMT)
MORL-Prompt: An Empirical Analysis of Multi-Objective Reinforcement
Learning for Discrete Prompt Optimization [49.6] RLベースの手法は、ユーザーが指定した報酬関数の集合を最大化するプロンプトの探索に使用できる。
現在の技術は報酬関数の平均値の最大化に重点を置いており、必ずしも報酬間の均衡を達成するプロンプトに繋がるとは限らない。
本稿では,RLに基づく離散的なプロンプト最適化に,多目的最適化のためのいくつかの手法を適用する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:25:09 GMT)
TrustAgent: Towards Safe and Trustworthy LLM-based Agents through Agent
Constitution [48.8] 本稿では, エージェント・コンスティチューションをベースとしたエージェント・フレームワークであるTrustAgentについて述べる。
本研究では,計画立案戦略が計画立案に先立ってどのように安全知識を注入するか,計画立案戦略が計画立案時の安全性を高めること,計画立案後の検査による安全性を確保することを実証する。
我々は,安全性と利便性の複雑な関係,およびモデル推論能力と安全エージェントとしての有効性について検討する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:11:55 GMT)
FactPICO: Factuality Evaluation for Plain Language Summarization of
Medical Evidence [48.7] 本稿では,医療用テキストのプレーン言語要約のためのファクトPICOを提案する。
3つのランダム化制御試験(RCT)から生成される抽象語の345のプレーン言語要約で構成されている。
本研究は,これらのサマリーにおけるRCTの重要要素の事実と,それらに関する報告された知見について評価する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:45:01 GMT)
Poisoning Federated Recommender Systems with Fake Users [48.7] フェデレーテッド・レコメンデーションは、フェデレーテッド・ラーニングにおける顕著なユースケースである。
本稿では,攻撃対象のアイテムを宣伝するために,PisonFRSという偽ユーザによる新たな毒殺攻撃を導入する。
複数の実世界のデータセットに対する実験では、PoisonFRSが攻撃者-チョセンアイテムを真のユーザの大部分に効果的にプロモートできることが示されている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:34:12 GMT)
Stumbling Blocks: Stress Testing the Robustness of Machine-Generated
Text Detectors Under Attacks [48.3] 一般的な機械生成テキスト検出器の強靭性について,編集,パラフレージング,プロンプト,コジェネレーションの様々なカテゴリの攻撃下で検討する。
我々の攻撃はジェネレータLSMへの限られたアクセスを前提としており、異なる予算レベルで異なる攻撃に対する検出器の性能を比較する。
全ての検知器を平均すると、全ての攻撃で性能は35%低下する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:36:00 GMT)
EventRL: Enhancing Event Extraction with Outcome Supervision for Large
Language Models [48.1] EventRLは、大規模言語モデル(LLM)のイベント抽出を強化するために開発された強化学習手法である。
FSP(Few-Shot Prompting)やSFT(Supervised Fine-Tuning)といった既存手法に対するEventRLの評価を行った。
以上の結果から,EventRLはイベントの識別・構造化性能を向上させることにより,従来の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:41:06 GMT)
Deciphering the lmpact of Pretraining Data on Large Language Models
through Machine Unlearning [47.9] 大規模言語モデルの事前学習データの5つの主要なカテゴリから,48のデータセットが与える影響を系統的に分析した。
本研究は,LLMの性能に対する複数コーパスの寄与に関する実証的な結果を提供する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:36:05 GMT)
LongAgent: Scaling Language Models to 128k Context through Multi-Agent
Collaboration [47.9] textscLongAgentはマルチエージェントのコラボレーションに基づいており、128Kのコンテキストにスケールする。
LLaMA-7Bでインスタンス化されたエージェントチームは、128k長のテキスト検索やマルチホップ質問応答といったタスクにおいて、GPT-4に比べて大幅に改善されている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:46:52 GMT)
Contextual Multinomial Logit Bandits with General Value Functions [47.1] MNL(Contextual multinomial logit)バンドレットは、オンライン小売や広告など、現実のアソシエーションレコメンデーション問題の多くをキャプチャする。
我々は、文脈的盗賊の研究の最近の動向からアイデアを借りて、基礎的真理を含む一般値関数クラスを持つ文脈的MNL盗賊を考察する。
具体的には、計算と逆の設定の両方を考慮し、それぞれが異なるトレードオフを持つ一連のアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 20:32:08 GMT)
In-Context Learning with Transformers: Softmax Attention Adapts to
Function Lipschitzness [46.9] In the role of softmax attention in a ICL setting where each context encodes a regression task。
注意ユニットは、事前学習タスクのランドスケープに適応した最寄りの予測器を実装するために使用するウィンドウを学習する。
また、低ランク線形問題において、注目部は推論の前に適切な部分空間に投影することを学ぶ。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:37:32 GMT)
ALLaVA: Harnessing GPT4V-synthesized Data for A Lite Vision-Language
Model [46.5] 本研究の目的は、従来のLVLMとリソースフレンドリーなライトバージョンのパフォーマンスギャップを埋めることである。
合成データセットは、GPT-4Vの詳細なキャプションを生成する能力を活用して作成される。
結果、12ベンチマークで最大3B LVLMの競合性能が得られる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:26:49 GMT)
Benchmarking Knowledge Boundary for Large Language Model: A Different
Perspective on Model Evaluation [46.1] 言語モデルに対する質問や限定的なパラフレーズをクエリとして評価することは,信頼性が高く,包括的ではない,と我々は主張する。
本稿では,知識境界という概念を導入し,素早い知識と素早い知識の両方を包含する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:48:15 GMT)
Fight Hardware with Hardware: System-wide Detection and Mitigation of Side-Channel Attacks using Performance Counters [45.5] キャッシュベースのサイドチャネル攻撃を悪用しようとする悪意のあるアプリケーションをシステム全体で検出するカーネルレベルのインフラを提案する。
このインフラストラクチャは、マシン上で動作するすべてのアプリケーションから実行時に情報を集めるために、ハードウェアパフォーマンスカウンタに依存している。
これらの測定から高レベルの検出指標が導出され、悪意のあるアプリケーションを迅速に検出する可能性の最大化が図られる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:45:38 GMT)
Learning From Failure: Integrating Negative Examples when Fine-tuning
Large Language Models as Agents [44.1] 大規模言語モデル(LLM)は、検索エンジンのようなツールを介して環境と対話するエージェントとして機能することに成功した。
LLMは、トレーニングやアライメントにおいてツールの使用に特化せず、エージェントとしての有効性を制限している。
本稿では,大規模な言語モデルが適切なデータクリーニングと微調整戦略によって失敗から学習できることを論じる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:10:07 GMT)
OUTFOX: LLM-Generated Essay Detection Through In-Context Learning with
Adversarially Generated Examples [44.1] OUTFOXは、LLM生成テキスト検出器の堅牢性を改善するフレームワークであり、検出器と攻撃者の両方が互いの出力を考慮できるようにする。
実験の結果,提案した検出器は攻撃者が生成したテキストの検出性能を最大41.3点F1スコアまで向上させることがわかった。
この検出器は最先端の検知性能を示し、96.9ポイントのF1スコアまで到達し、既存の検出器を非攻撃テキストで打ち負かした。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:25:13 GMT)
Metacognitive Retrieval-Augmented Large Language Models [43.6] 本稿ではメタRAG(MetaRAG)について紹介する。
これを統合することで、MetaRAGはモデルが応答戦略を監視し、評価し、計画することを可能にする。
経験的評価は、MetaRAGが既存の手法よりも著しく優れていることを示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:41:31 GMT)
Ploutos: Towards interpretable stock movement prediction with financial
large language model [43.5] PloutosはPloutosGenとPloutosGPTで構成される新しい金融フレームワークである。
PloutosGenには、テキストや数値など、さまざまなモーダルデータを分析し、異なる観点から定量的戦略を提供する、複数の主要な専門家が含まれている。
PloutosGPTのトレーニング戦略は、GPT-4を誘導して合理性を生成するリアビューミラープロンプト機構と、LLMを微調整するための動的トークン重み付け機構を活用する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:28:18 GMT)
LightDiC: A Simple yet Effective Approach for Large-scale Digraph
Representation Learning [42.7] 磁気ラプラシアンに基づくダイグラフ畳み込みのスケーラブルな変種であるLightDiCを提案する。
LightDiCは、最も代表的な大規模データベースで満足な結果を提供する最初のDiGNNである。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:40:24 GMT)
Can Deception Detection Go Deeper? Dataset, Evaluation, and Benchmark
for Deception Reasoning [42.0] GPT-4を用いて被疑者と警察官のロールプレイをシミュレートする。
尋問中、容疑者は犯罪の責任を逃れるために警察官に嘘をつき、警察官は真実を知り、証拠を収集する。
このデータセットは、現在の大規模言語モデルの複雑な推論能力を評価するためにも使用できる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:52:54 GMT)
Symbol-LLM: Towards Foundational Symbol-centric Interface For Large
Language Models [41.9] シンボルデータの集合を大規模言語モデルのトレーニングに直接注入することは問題となる。
本研究では、データとフレームワークの観点からこれらの課題に取り組み、Symbol-LLMシリーズモデルを導入する。
シンボル中心タスクとNL中心タスクの広範な実験は、Symbol-LLMシリーズモデルのバランスと優れた性能を示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:24:12 GMT)
Capturing many-body correlation effects with quantum and classical
computing [40.8] 我々は、X線光電子分光に関連するコアレベル状態の同定におけるQPE(Quantum Phase Estor)の有効性を示す。
我々は,QPE予測を,正確な対角化およびリアルタイムな運動方程式結合クラスタの定式化と比較し,検証する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:26:45 GMT)
AutoPRM: Automating Procedural Supervision for Multi-Step Reasoning via
Controllable Question Decomposition [40.7] 我々は,大規模言語モデル(LLM)の微調整を効率的に行う,新しい自己教師型フレームワークを提案する。
具体的には、AutoPRMは複雑な問題を制御可能なスイッチでより管理可能なサブクエストに分解する。
また、報酬の改ざんを回避するための文脈誘導復号法を提案し、従属問題の解法を導出する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:28:16 GMT)
PolypNextLSTM: A lightweight and fast polyp video segmentation network
using ConvNext and ConvLSTM [40.0] PolypNextLSTMは、最小パラメータオーバーヘッドで優れたPolypセグメンテーション性能の時間情報を利用する。
我々の第一の斬新さはPolypNextLSTMであり、パラメータの最もリーンで最速のモデルとして際立っている。
SUN-SEGデータセットの評価は、容易に検出できるポリプシナリオと難しいポリプシナリオにまたがる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 13:24:48 GMT)
Impact of temporal correlations, coherence, and postselection on
two-photon interference [39.9] 2光子干渉は量子フォトニクスにおいて必須の資源であるが、達成は容易ではない。
光子対のカスケード生成は、2光子干渉を行うためのこれらの源の能力に悪影響を及ぼす固有の時間的相関を含む。
このような相関関係がデコヒーレンスや時間的ポストセレクションとどのように相互作用し、時間的ポストセレクションが2光子干渉の可視性を改善するかについて報告する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:37:11 GMT)
GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via
Blender-Oriented GPT Planning [39.6] GPT4Motionは、コヒーレントな物理モーションでビデオを制作するためのトレーニング不要のフレームワークである。
GPT、Blenderの物理シミュレーション強度、テキスト・画像拡散モデルの優れた画像生成能力を利用する。
GPT4Motionは、動きのコヒーレンシと実体の整合性を維持する上で、高品質な動画を効率よく生成できることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:52:54 GMT)
On Diversified Preferences of Large Language Model Alignment [39.2] 本研究では,多彩な嗜好が報酬モデルに及ぼす影響について検討する。
その結果,様々な選好データが報酬モデルのキャリブレーション性能に悪影響を及ぼすことがわかった。
本稿では,RMの校正性能を高めるための多目的リワード学習手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:09:02 GMT)
DocLens: Multi-aspect Fine-grained Evaluation for Medical Text
Generation [39.0] 本稿では, 医療用テキストの完全性, 簡潔性, 帰属性を評価するための指標セットを提案する。
メトリクスは、インストラクションフォロー(プロプライエタリとオープンソースの両方)や教師付きエンタテインメントモデルなど、さまざまなタイプの評価者によって計算できる。
総合的な人間の研究によると、DocLensは既存の指標よりも医療専門家の判断とかなり高い一致を示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 20:39:06 GMT)
WOMD-LiDAR: Raw Sensor Dataset Benchmark for Motion Forecasting [39.0] 動作予測タスクのための大規模で高品質な多種多様なLiDARデータを用いて,Open Motionデータセットを拡張した。
新しいデータセットWOMD-LiDARは10万枚以上のシーンで構成され、それぞれ20秒にまたがる。
実験の結果,LiDARデータは動き予測タスクの改善をもたらすことがわかった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:23:01 GMT)
Engineering an Exact Pseudo-Boolean Model Counter [38.9] そこで我々は,代数的決定図を用いた知識コンパイル手法に依存する,最初の正確なPseudo-BooleanモデルカウンタPBCountを提案する。
PBCountは1513インスタンスのカウントを計算できるが、現状のアプローチでは1013インスタンスしか処理できない。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:49:00 GMT)
From Denoising Diffusions to Denoising Markov Models [38.3] デノイング拡散は、顕著な経験的性能を示す最先端の生成モデルである。
本稿では、この手法を広い範囲に一般化し、スコアマッチングのオリジナル拡張につながる統一フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:25:54 GMT)
Mitigating Catastrophic Forgetting in Multi-domain Chinese Spelling
Correction by Multi-stage Knowledge Transfer Framework [37.6] 中国語のspelling Correctionは、与えられた文中のスペルエラーを検出し、修正することを目的としている。
本稿では,マルチドメインシナリオに適応する際のCSCモデルの鍵となる欠陥に焦点をあてる。
モデルに依存しない新しい多段階知識伝達フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:46:46 GMT)
OctoPack: Instruction Tuning Code Large Language Models [37.0] 命令で大きな言語モデル(LLM)を微調整すると、自然言語タスクのパフォーマンスが大幅に向上する。
コードを使ったインストラクションチューニングを適用し、Gitコミットの自然な構造を活用し、コードと人間の命令をペアで変更する。
我々は、CommitPackを他の自然および合成コード命令と比較し、OpenAI出力で訓練されていないモデル間で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:46:06 GMT)
Temporal Disentangled Contrastive Diffusion Model for Spatiotemporal
Imputation [36.8] C$2$TSDは、トレンド情報と季節情報を条件付き特徴として取り入れ、モデル一般化性を改善するために対照的な学習を採用する新しいアプローチである。
3つの実世界のデータセットに対する実験は、様々な最先端ベースラインよりもC$2$TSDの方が優れた性能を示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:59:04 GMT)
Can We Evaluate Domain Adaptation Models Without Target-Domain Labels? [36.1] 教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ラベル豊富なソースドメインでトレーニングされたモデルをラベルなしのターゲットドメインに適応させる。
現実のシナリオでは、ターゲットドメインラベルがないため、UDAモデルの性能を評価するのは難しい。
これらの問題に対処するため,textitTransfer Scoreと呼ばれる新しいメトリクスを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:14:50 GMT)
DictLLM: Harnessing Key-Value Data Structures with Large Language Models
for Enhanced Medical Diagnostics [36.1] DictLLMは、医学実験室報告のようなキーバリュー構造化データのモデリングを改善するために設計された革新的なフレームワークである。
診断自動生成のための総合的な実世界医療実験室レポートデータセットを用いて,様々なLCMモデルを用いた実験を行った。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:10:02 GMT)
ModelGPT: Unleashing LLM's Capabilities for Tailored Model Generation [35.2] 本稿では,ユーザが提供するデータやタスク記述に適したAIモデルを決定・生成するフレームワークであるModelGPTを提案する。
ユーザの要求に応じて、ModelGPTは、以前のパラダイムよりも少なくとも270倍高速に、調整済みのモデルを提供することができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:24:34 GMT)
Optimal Parallelization Strategies for Active Flow Control in Deep
Reinforcement Learning-Based Computational Fluid Dynamics [34.8] 本研究では、DRLに基づくアルゴリズムを並列設定で最適化することに焦点を当てる。
我々は、AFC問題に使用される既存の最先端DRLフレームワークを検証し、その効率ボトルネックについて議論する。
並列効率を約49%から約78%に向上させ,60コアで約47倍の高速化を実現した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:07:30 GMT)
SMEMO: Social Memory for Trajectory Forecasting [34.5] 本稿では、外部記憶装置として機能するエンドツーエンドのトレーニング可能なワーキングメモリに基づくニューラルネットワークを提案する。
提案手法は,異なるエージェントの動き間の説明可能な因果関係を学習し,軌跡予測データセットの最先端結果を得ることができることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:35:03 GMT)
In-Context Example Ordering Guided by Label Distributions [34.3] 最適化問題としてコンテキスト内注文を定式化する。
ラベルの比率から学習するという考えに触発され、モデルの確率予測によって導かれる文脈内サンプル注文の原則を2つ提案する。
提案手法は, 分類精度の向上, モデルの誤校正の低減, 文脈内事例の選択により, ベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:08:10 GMT)
Robust Graph Matching Using An Unbalanced Hierarchical Optimal Transport
Framework [33.8] 本稿では,不均衡な階層的最適輸送フレームワークに基づく,新しい頑健なグラフマッチング手法を提案する。
グラフマッチングにおいて、クロスモーダルアライメントを利用するための最初の試みを行う。
様々なグラフマッチングタスクの実験は、最先端の手法と比較して、我々の手法の優越性と堅牢性を示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:21:29 GMT)
Federated Fine-tuning of Large Language Models under Heterogeneous
Language Tasks and Client Resources [33.3] 大規模言語モデル(LLM)のパラメータ効率の高い微調整には、最近FL(Federated Learning)が適用されている。
本研究では,LLMファインチューニングのための簡易かつ効果的なアグリゲーションスキームFlexLoRAを紹介する。
1,600以上のクライアントが多様なNLPタスクを実行し,FlexLoRAの有効性を検証した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:32:59 GMT)
KMMLU: Measuring Massive Multitask Language Understanding in Korean [33.3] KMMLUは、人文科学からSTEMまで、45科目にわたる35,030名のエキスパートレベルの多重選択質問を備えた、韓国の新しいベンチマークである。
既存の英語のベンチマークから翻訳された以前の韓国のベンチマークとは異なり、KMMLUはオリジナルの韓国の試験から収集される。
最高の一般公開モデルはKMMLUで50.54%、平均62.6%よりもはるかに低い。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:41:07 GMT)
Learning the Topology and Behavior of Discrete Dynamical Systems [32.0] ブラックボックスシステムの振る舞いと基盤となるトポロジを学習する問題に焦点をあてる。
一般に、この学習問題は計算的に難解であることが示される。
この結果は、離散力学系の挙動とトポロジーの両方を学ぶための理論的基盤を提供する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:31:26 GMT)
Don't Go To Extremes: Revealing the Excessive Sensitivity and
Calibration Limitations of LLMs in Implicit Hate Speech Detection [31.8] 本稿では,暗黙のヘイトスピーチを検出し,その応答に自信を表現できる大規模言語モデルを提案する。
1) LLMは, 公平性問題を引き起こす可能性のあるグループやトピックに対して過度な感受性を示し, ヘイトスピーチとして良心的発言を誤分類する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 00:04:40 GMT)
MLCopilot: Unleashing the Power of Large Language Models in Solving
Machine Learning Tasks [31.7] 我々は、新しいフレームワークを導入することで、機械学習と人間の知識のギャップを埋めることを目指している。
本稿では、構造化された入力を理解するためのLLMの能力を拡張し、新しいMLタスクを解くための徹底的な推論を行う可能性を示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:22:49 GMT)
One Prompt To Rule Them All: LLMs for Opinion Summary Evaluation [31.6] 我々は,Op-I-Promptが,人間との平均スピアマン相関を0。
我々の知る限り、我々は、意見要約領域において、クローズドソースモデルとオープンソースモデルの両方において、LCMを評価対象として調査した最初の人物です。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:13:52 GMT)
Group Orthogonalization Regularization For Vision Models Adaptation and
Robustness [31.4] 同じ層内のフィルタ群間の正則性を促進する計算効率の良い正規化手法を提案する。
実験により,近年の拡散モデルと視覚変換器(ViT)の適応手法に組み込むと,この正規化により下流タスクの性能が向上することが示された。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:01:06 GMT)
Finding Nontrivial Minimum Fixed Points in Discrete Dynamical Systems [31.2] 影響を受けるノードの最小数でシステムの非自明な固定点を求めるという新しい最適化問題を定式化する。
この計算難易度に対処するため,この問題を効率的に解決できる特別な事例をいくつか挙げる。
大規模ネットワーク上での問題を解くため,グリーディ選択法とともに汎用的なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:24:19 GMT)
Large Language Model-driven Meta-structure Discovery in Heterogeneous
Information Network [30.6] 不均一情報ネットワーク(HIN)は、多様なタイプのノード間の複雑な関係を捉えることで人気が高まっている。
これまでの努力は、説明可能性を見越して、優れた経験的予測性能を持つメタ構造を探すことに集中していた。
本稿では,LLM推論を進化過程に統合したReasoning meta-STRUCTure search(ReStruct)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:21:12 GMT)
Multimodal Clinical Trial Outcome Prediction with Large Language Models [30.5] 臨床試験の結果を予測するために, LIFTED(Multimodal Mixed-of-Experts)アプローチを提案する。
LIFTEDは、異なるモダリティデータを自然言語記述に変換することで統一する。
そして、LIFTEDは統合ノイズ耐性エンコーダを構築し、モーダル固有の言語記述から情報を抽出する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:56:03 GMT)
Demystifying Instruction Mixing for Fine-tuning Large Language Models [29.7] 本研究は,NLPダウンストリームタスク,コーディング,一般的なチャットという,命令を3つの主要なタイプに分類する。
特定の命令型は特定のアプリケーションに対してより有利であるが、他の領域に悪影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:13:36 GMT)
Structure-Aware Sparse-View X-ray 3D Reconstruction [28.9] スパースビューX線3次元再構成のための構造対応X線ニューラルラジオ密度場(SAX-NeRF)を提案する。
X3Dの実験では、SAX-NeRFは、新しいビュー合成とCT再構成において、従来のNeRF法を12.56と2.49dBで上回っている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:18:34 GMT)
Quantum State Tomography for Matrix Product Density Operators [28.8] 実験的測定から量子状態の再構成は、量子デバイスの検証とベンチマークに不可欠である。
ノイズや中間スケールの量子コンピュータによって生成される状態のような多くの物理量子状態は通常、構造化される。
圧縮センシングのツールと経験過程の理論を用いて,MPOの安定回復の理論的保証を確立する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:02:44 GMT)
Neuromorphic Face Analysis: a Survey [28.8] イベントカメラ(英: event camera)またはニューロモルフィックセンサー(英: Neuromorphic sensor)は、生物学的視覚系の機能を模倣する撮像装置の一種である。
これらの特性は、有効性とプライバシー保護の観点から、人間の顔のモデリングにおいて興味深いことが証明されている。
本稿では,ニューロモルフィック顔分析分野における機能,課題,新たな応用について概説する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:17:25 GMT)
MCE: Mixed Cantonese and English Audio Dataset [28.1] Whisper-MCEの素晴らしい結果を紹介します。
Whisper-MCEは14.28%のMER(Mix Error Rate)を達成したが、これはオリジナルのモデルよりも35.13%低かった。
また、共通音声zh-HKでは12.61%の文字誤り率(CER)を達成した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:24:56 GMT)
Consistency-guided Prompt Learning for Vision-Language Models [27.8] CoPromptは視覚言語モデルのための新しい微調整手法である。
トレーニング可能なモデルと事前訓練されたモデルの予測に一貫性の制約を課す。
入力空間と出力空間の両方でチューニングの柔軟性が向上する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:29:14 GMT)
Measuring Privacy Loss in Distributed Spatio-Temporal Data [26.9] 本稿では,情報提供者による位置復元攻撃に対する代替プライバシ損失を提案する。
実データと合成データに関する我々の実験は、分散環境での個人のプライバシー侵害に対する直感を反映していることを示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:53:14 GMT)
Stealthy Attack on Large Language Model based Recommendation [26.0] 大規模言語モデル (LLM) はレコメンダシステム (RS) の進歩を推進している。
本研究では,レコメンデーションモデルにLSMを導入することで,項目のテキスト内容に重点を置いているため,新たなセキュリティ脆弱性が生じることを明らかにした。
攻撃者は、テストフェーズ中に単にテキストの内容を変更するだけで、アイテムの露出を大幅に向上させることができることを実証する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:51:02 GMT)
LEIA: Facilitating Cross-Lingual Knowledge Transfer in Language Models
with Entity-based Data Augmentation [26.0] 言語間で整列したウィキペディアのエンティティ名を利用する言語適応チューニング手法であるLEIAを紹介する。
この方法は、ターゲット言語コーパスを英語のエンティティ名で拡張し、左から右への言語モデリングを用いてモデルを訓練することを含む。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:24:34 GMT)
The Impact of Domain Knowledge and Multi-Modality on Intelligent
Molecular Property Prediction: A Systematic Survey [25.6] 様々なベンチマークに基づいて,近年のディープラーニング手法を検証,定量的に分析する。
分子情報の統合はMPPの回帰と分類のタスクをそれぞれ3.98%と1.72%改善する。
また,1次元情報と2次元情報とを同時に活用することで,MPPを4.2%まで大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:13:38 GMT)
A Statistical Framework for Measuring AI Reliance [25.5] 人間はしばしば人工知能(AI)システムの助けを借りて意思決定をする。
研究者は、補完的なパフォーマンスを達成する上で重要な要素として、人間がAIに適切に依存していることを確認する。
本稿では、統計的決定理論に基づく信頼の形式的定義を提案し、AIの予測に従う確率として信頼の概念を分離する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:56:56 GMT)
Self-Supervised Curriculum Generation for Autonomous Reinforcement
Learning without Task-Specific Knowledge [25.2] 現在の強化学習アルゴリズムを現実世界のシナリオに適用する際の大きなボトルネックは、各エピソード間の環境をリセットする必要があることである。
本稿では,タスク固有の知識を使わずにエージェントの学習進捗に適応したカリキュラムを生成する新しいARLアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:39:35 GMT)
Boosting Semi-Supervised 2D Human Pose Estimation by Revisiting Data
Augmentation and Consistency Training [25.0] 本稿では,半教師付き学習(SSL)方式でラベルのない余分な画像を抽出することにより,ポーズ推定器の精度を高めることを目的とする。
本稿では,多彩な拡張を繰り返す未ラベル画像の強化,マルチパス予測の逐次的生成,および1つのネットワークを用いた非教師なし一貫性損失の最適化を提案する。
最先端のSSLアプローチと比較して、我々の手法はパブリックデータセットに大幅な改善をもたらす。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:27:59 GMT)
Semi-supervised Batch Learning From Logged Data [24.8] 我々は,リスク最小化フレームワークを構築し,妥当性スコアへのアクセスも想定している。
本稿では,一部のサンプルにフィードバックが欠落している問題に対する学習手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:26:01 GMT)
PROGrasp: Pragmatic Human-Robot Communication for Object Grasping [24.2] 対話型オブジェクトグラスピング(IOG)は、人間とロボットの自然言語による対話を通じて、望ましいオブジェクトを識別し、把握するタスクである。
Pragmatic-IOG タスクとそれに対応するデータセット Intention-oriented Multi-Modal Dialogue (IM-Dial) を導入する。
Prograspは、視覚的なグラウンドニング、質問、オブジェクトの把握、そして最も重要なのは、実用的推論の解答解釈のモジュールを組み込むことで、Pragmatic-IOGを実行する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:42:59 GMT)
PreAct: Predicting Future in ReAct Enhances Agent's Planning Ability [24.2] これは$textbfpre$dictionと$textbfrea$soningと$textbfact$ionを統合したエージェントフレームワークです。
実験の結果,PreActは複雑なタスクを遂行する上でReActのアプローチよりも優れており,Reflexion法と組み合わせることでPreActを併用できることがわかった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:15:38 GMT)
MAL: Motion-Aware Loss with Temporal and Distillation Hints for
Self-Supervised Depth Estimation [24.0] Motion-Aware Loss(モーション・アウェア・ロス)は、複数フレームの自己監督型単眼深度推定手法にシームレスに統合するために設計された新しいプラグアンドプレイモジュールである。
MALは、KITTIとCityScapesベンチマークでそれぞれ4.2%と10.8%の深さ推定誤差を減少させる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:34:15 GMT)
Robust Visual Question Answering: Datasets, Methods, and Future
Challenges [23.6] 視覚的な質問応答には、画像と自然言語の質問に与えられた正確な自然言語の回答を提供するシステムが必要である。
従来の一般的なVQA手法は、答えを予測する前に画像のグラウンド化など適切な振る舞いを学ぶのではなく、トレーニングデータに存在するバイアスを記憶する傾向がある。
VQAのロバスト性を評価するために,様々なデータセットとデバイアス法が提案されている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:00:19 GMT)
Neighborhood-Enhanced Supervised Contrastive Learning for Collaborative
Filtering [23.6] 協調フィルタリング(CF)技術は、データの分散性の課題に直面している。
コントラスト信号とコントラスト損失を効果的に組み合わせた2つのユニークな教師付きコントラスト損失関数を開発した。
グラフベースの協調フィルタリングモデルをバックボーンとして使用することにより,レコメンデーションモデルの性能を効果的に向上する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:46:51 GMT)
Online Local False Discovery Rate Control: A Resource Allocation
Approach [23.2] 我々は、オンラインリソース割り当て問題として問題を定式化し、決定を受理/退避する。
我々は、小さな対数バッファが$Omega(sqrtT)$または$Omega(T)$から$O(ln2T)$への後悔を減らすのに十分であることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:11:54 GMT)
Contrast-Phys+: Unsupervised and Weakly-supervised Video-based Remote
Physiological Measurement via Spatiotemporal Contrast [22.7] 教師なし設定と教師なし設定の両方でトレーニングできるContrast-Phys+を提案する。
我々は3DCNNモデルを用いて複数のリズム信号を生成し、rの事前知識を対照的な損失関数に組み込む。
コントラスト-Phys+は、部分的に利用可能あるいは不一致のGT信号を使用する場合でも、最先端の教師付き手法より優れている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:04:48 GMT)
Sampling from the Mean-Field Stationary Distribution [22.5] 平均場SDEの定常分布からのサンプリングの複雑さについて検討する。
私たちの主な洞察は、この問題の2つの重要な側面を分離することです。
我々のアプローチは概念的にシンプルであり、その柔軟性はアルゴリズムと理論の両方に最先端の技術を取り入れることができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:04:05 GMT)
Efficient Multimodal Learning from Data-centric Perspective [22.4] 本稿では, フレキシブルビジョンと言語バックボーンを備えた軽量MLLMのファミリであるBunnyを紹介し, 凝縮学習データから効率的なマルチモーダル学習を実現する。
注目すべきは、Bunny-3Bは最先端の大規模なMLLM、特にLLaVA-v1.5-13Bを複数のベンチマークで上回ることです。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:09:10 GMT)
On Sampling with Approximate Transport Maps [22.0] 輸送地図は、非自明な測地による分布のサンプリングを容易にし、それらを扱いやすい分布に変換する。
このアプローチのポテンシャルは、ターゲットに向かって参照分布をプッシュするようにトレーニングされたディープニューラルネットワークでパラメータ化されたマップである正規化フロー(NF)の開発によって高まっている。
NF型サンプリング器は先日,フローから引き出された (i) モンテカルロ法または (ii) フローベース再パラメータ化法をブレンドした(マルコフ連鎖)モンテカルロ法を提案した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:56:53 GMT)
MIKE: A New Benchmark for Fine-grained Multimodal Entity Knowledge
Editing [21.8] マルチモーダル知識編集は、マルチモーダル大言語モデル(MLLM)の能力向上における重要な進歩である
現在のベンチマークは主に粗粒度知識に焦点が当てられており、細粒度(FG)マルチモーダル実体知識の複雑さはほとんど解明されていない。
このギャップを埋めるために、我々はFGマルチモーダルエンティティ知識編集用に特別に設計された総合的なベンチマークとデータセットであるMIKEを紹介する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:15:03 GMT)
The Effectiveness of Random Forgetting for Robust Generalization [21.2] 我々は,FOMO(Fordt to Mitigate Overfitting)と呼ばれる新しい学習パラダイムを導入する。
FOMOは、重みのサブセットをランダムに忘れる忘れ相と、一般化可能な特徴の学習を強調する再学習相とを交互に扱う。
実験の結果, FOMOは最良と最終ロバストなテスト精度のギャップを大幅に減らし, 頑健なオーバーフィッティングを緩和することがわかった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:14:40 GMT)
Integrating Pre-Trained Language Model with Physical Layer
Communications [21.0] 本稿では,物理層(PHY)通信機能と統合されたデバイス上での実用的なAI通信フレームワークを提案する。
我々のフレームワークは、チャネルノイズによるエンドツーエンドトレーニングを取り入れ、レジリエンスを高め、ベクトル量子化変分オートエンコーダ(VQ-VAE)を効率よく堅牢な通信に組み込み、事前学習エンコーダ・デコーダ変換を用いて一般化能力を向上させる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:27:51 GMT)
Enhancing Energy Sector Resilience: Integrating Security by Design Principles [20.8] セキュリティ・バイ・デザイン(Security by Design, Sbd)とは、セキュリティ・アタックに不注意なシステムを開発・保守するための概念である。
本報告では,産業用制御システムにおけるSbDの実装に関するセキュリティ要件について述べる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:04:22 GMT)
Ask One More Time: Self-Agreement Improves Reasoning of Language Models
in (Almost) All Scenarios [20.8] textbfSelf-Agreementは、ほとんどすべてのシナリオに適用できる一般化可能なアンサンブル最適化手法である。
6つの公開推論ベンチマークと優れた一般化能力で、同時に顕著なパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:06:34 GMT)
LoRETTA: Low-Rank Economic Tensor-Train Adaptation for
Ultra-Low-Parameter Fine-Tuning of Large Language Models [20.6] モデル性能を維持しながら計算効率のよい微調整を実現するために,様々なパラメータ効率の微調整技術が提案されている。
テンソル-トレイン分解によりトレーニング可能なパラメータを大幅に削減するフレームワークであるLoRETTAを提案する。
LoRETTAは、LLaMA-2-7Bモデルで最大100倍のパラメータで、最も広く使われているPEFT法よりも同等または優れた性能を実現している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:20:00 GMT)
Learning to Incorporate Texture Saliency Adaptive Attention to Image
Cartoonization [20.6] マンガ・テクスチュア・サリエンシ・サンプラー (CTSS) モジュールを提案し, トレーニングデータからマンガ・テクスチュア・サリエントパッチを動的にサンプリングする。
大規模な実験により,画像のマンガ化を促進・強化する上で,テクスチャ・サリエンシー適応型学習が重要であることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:13:12 GMT)
Contextual Pre-Planning on Reward Machine Abstractions for Enhanced
Transfer in Deep Reinforcement Learning [20.3] 深層強化学習(DRL)エージェントは、訓練されたタスクに過度に適合し、小さな環境変化に適応できない傾向にある。
我々は、報酬機(RM)を用いた現在の課題を表現するための新しい手法を提案する。
提案手法は, エージェントに対して, 現在の抽象状態からの最適遷移の記号表現を提供し, それらの遷移を達成するための報酬を与える。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:58:39 GMT)
LightHGNN: Distilling Hypergraph Neural Networks into MLPs for
$100\times$ Faster Inference [19.4] ハイパーグラフネットワーク(HGNN)は近年注目され,高次相関モデルにおける優位性から良好な性能を示した。
本稿では,HGNNのハイパーグラフ依存性を解消するために,HGNNと推論効率のよいMulti-Layer Perceptron(MLP)のギャップを埋めることを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:20:02 GMT)
Solving Data-centric Tasks using Large Language Models [19.2] 大きな言語モデル(LLM)は、StackOverflowのようなヘルプフォーラムを急速に置き換えている。
本稿では,どのデータがプロンプトに含まれるべきか,という質問に対する回答に2つの貢献をする。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:19:21 GMT)
A Note on Bias to Complete [18.7] 社会的偏見の最小化は社会的結合を強化し、共通の理解を促進し、より良い意思決定を促進する。
動的環境における新しいバイアスタイプ(例えば社会的地位)を発見することにより、バイアスの定義を再考する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:20:33 GMT)
Invertible Fourier Neural Operators for Tackling Both Forward and
Inverse Problems [18.5] 前方および逆問題の両方に対処する可逆フーリエニューラル演算子(iFNO)を提案する。
我々は,入力空間内の固有構造を捕捉し,後部推論を可能にする変分自動エンコーダを統合した。
5つのベンチマーク問題に対する評価は,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:16:43 GMT)
A Multi-Aspect Framework for Counter Narrative Evaluation using Large
Language Models [18.4] カウンター物語は、憎しみに満ちた主張を否定し、遭遇をエスカレートするように設計されたヘイトスピーチの文脈に反応する。
従来の対物的評価のための自動メトリクスは、人間の判断と一致していない。
そこで本稿では,LLMが生成した対物的候補に対して,スコアとフィードバックを提供するための新たな評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:56:07 GMT)
Self-seeding and Multi-intent Self-instructing LLMs for Generating
Intent-aware Information-Seeking dialogs [18.1] 大規模言語モデル (LLM) は合成データの生成に有効であることが示されている。
本稿では,新しい自己探索型多目的自己指導方式であるSOLIDを提案する。
我々は、SOLIDとSOLID-RLを使用して300万以上の意図認識ダイアログを生成し、既存のデータセットのサイズを超える。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:20:43 GMT)
Verifiably Following Complex Robot Instructions with Foundation Models [18.1] ロボットが表現的・長期的指示に従うことを可能にするために,動作計画(LIMP)のための言語指導基盤を提案する。
LIMPは、インストラクターの意図したモチベーションとロボットのアライメントを明らかにする説明可能な命令表現を構築する。
実環境におけるLIMPを,35の複合時間的語彙命令の集合で実証する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:05:54 GMT)
Unveiling the Secrets of Engaging Conversations: Factors that Keep Users
Hooked on Role-Playing Dialog Agents [17.8] ボットが果たす役割を具現化する程度は保持率に限られた影響を与え、各ターンの長さは保持率に大きく影響する。
本研究は,ロールプレイングモデルによるユーザエンゲージメントの重要な側面を明らかにし,ロールプレイング目的の大規模言語モデルの開発において,今後の改善に向けた貴重な洞察を提供する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:42:41 GMT)
Towards Versatile Graph Learning Approach: from the Perspective of Large
Language Models [17.7] 大きな言語モデル(LLM)は、豊富な知識と人間のような知性のために潜在的な解決策を提供する。
本稿では LLM を用いた多目的グラフ学習手法の設計のための新しい概念的プロトタイプを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:43:21 GMT)
LAiW: A Chinese Legal Large Language Models Benchmark [17.7] 一般および法的ドメイン LLM は LegalAI の様々なタスクにおいて高いパフォーマンスを示している。
われわれは、法的な実践の論理に基づいて、中国の法的LLMベンチマークLAiWを最初に構築しました。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 05:36:14 GMT)
How Far Can We Extract Diverse Perspectives from Large Language Models? [17.7] 主観的トピックに対する多様な視点を生み出すための大規模言語モデルの能力について検討する。
本研究は, 人間の価値観を生かし, 評価基準に基づくプロンプト手法を提案する。
LLMはタスク主観性の度合いに応じて多様な意見を生成することができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:50:59 GMT)
Recipe Generation from Unsegmented Cooking Videos [17.3] 本稿では,未解決の調理ビデオからレシピ生成に取り組む。
我々の課題は、出来事を徹底的に検出し、それらに対する文を生成することを目的とした高密度ビデオキャプション(DVC)と似ている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:15:21 GMT)
Exploring Large Language Models for Knowledge Graph Completion [17.1] 我々は知識グラフのトリプルをテキストシーケンスとみなし、知識グラフLLMと呼ばれる革新的なフレームワークを導入する。
提案手法では,三重項の実体的記述と関係的記述をプロンプトとして利用し,その応答を予測に利用する。
種々のベンチマーク知識グラフを用いた実験により,三重分類や関係予測といったタスクにおいて,本手法が最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:35:34 GMT)
NestedSGX: Bootstrapping Trust to Enclaves within Confidential VMs [17.1] 本稿では、仮想マシン特権レベル(VMPL)を活用し、ゲストVM内でハードウェアエンクレーブの作成を可能にするNestedSGXを紹介する。
Intel SGXと同様、NestedSGXは、悪意のあるコードのロードを信頼していないゲストOSだと考えている。
これは、エンクレーブ内で実行される信頼され測定されたコードだけがリモートで検証可能であることを保証します。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:15:02 GMT)
Knowledge-to-SQL: Enhancing SQL Generation with Data Expert LLM [16.8] 既存のモデルは、データベーススキーマに従ってthesqlを生成するために、Large Language Modelsの能力に依存している。
我々は,あらゆるタイプのテキスト・トゥ・モデルに対して,適切な知識を利用する知識・ツー・データエキスパート・フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:10:04 GMT)
Multi-view Feature Augmentation with Adaptive Class Activation Mapping [16.5] 画像分類のために構築されたエンドツーエンドで訓練可能な機能拡張モジュールを提案する。
モデルロバスト性を改善するために,多様なマルチビューローカル機能をサンプリングし,アンサンブルする。
実験では、マルチビュー機能拡張モジュールによって達成された一貫性と顕著なパフォーマンス向上が示されています。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:09:05 GMT)
Chain-of-Instructions: Compositional Instruction Tuning on Large
Language Models [16.2] チェーン・オブ・インストラクション(CoI)と呼ばれる新しい構成命令の概念を提案する。
従来の単一命令タスクの解法とは異なり,提案手法では各サブタスクを段階的に解き,最終的な解答に到達するまで解き明かす。
CoIチューニングは、複数のサブタスクからなる命令を処理するモデルの能力を改善する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:10:40 GMT)
TASER: Temporal Adaptive Sampling for Fast and Accurate Dynamic Graph
Representation Learning [16.1] TGNN(Temporal Graph Neural Networks)は、様々なハイインパクトアプリケーションで最先端の性能を実証している。
TGNNは、時間遅延リンクや歪んだ相互作用分布のような実世界の動的グラフで見られる一般的なノイズの傾向にある。
本稿では,TGNNの精度,効率,スケーラビリティに最適化された最初の適応サンプリング手法であるTASERを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:47:35 GMT)
scInterpreter: Training Large Language Models to Interpret scRNA-seq
Data for Cell Type Annotation [15.7] 本研究は、単一細胞RNAシークエンシングデータにおいて、細胞型を解釈し、区別する機能を備えた大規模言語モデルの訓練および適応方法に焦点を当てる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 05:39:00 GMT)
DDIPrompt: Drug-Drug Interaction Event Prediction based on Graph Prompt
Learning [15.7] 我々はDDIPromptを提案し、高度に不均衡な事象分布と稀な事象に対するラベル付きデータの不足を克服する。
最初の課題を解決するために、DDIPromptは、構造的および対話的な近接性の両方を考慮して、薬物間のリンクを増設する。
2つ目の課題は、推論中にプロトタイプ強化プロンプト機構を実装することである。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:22:01 GMT)
How Susceptible are Large Language Models to Ideological Manipulation? [15.7] 大規模言語モデル(LLM)は、大衆の認識や情報との相互作用に大きな影響を与える可能性がある。
このことは、これらのモデル内のイデオロギーを容易に操作できれば生じる可能性のある社会的影響に関する懸念を提起する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:36:19 GMT)
Fine-grained and Explainable Factuality Evaluation for Multimodal
Summarization [15.4] マルチモーダル要約は入力テキストと画像に基づいて簡潔な要約を生成することを目的としている。
マルチモーダル要約モデルの現実性を評価するために,2つのきめ細かな説明可能な評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:03:25 GMT)
Evaluating Adversarial Robustness of Low dose CT Recovery [15.4] 低線量CT回復のための異なる深層学習手法と古典的手法のロバスト性を評価する。
データ一貫性を奨励するモデルベースネットワークを含むディープネットワークは、未ターゲティング攻撃の影響を受けやすいことを示す。
結果として得られた再構成は、元の測定値と高いデータ整合性を持つため、これらの局所攻撃は、CT回復問題の解空間を探索するために使用できる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:57:01 GMT)
VoltSchemer: Use Voltage Noise to Manipulate Your Wireless Charger [15.2] VoltSchemerは、攻撃者が市販のワイヤレス充電器を制御できるようにする一連の革新的な攻撃だ。
トップセラーのCOTSワイヤレス充電器9台に対する攻撃を成功させたVoltSchemer攻撃の有効性と実用性を示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:50:27 GMT)
DePT: Decomposed Prompt Tuning for Parameter-Efficient Fine-tuning [15.0] ソフトプロンプトを短いソフトプロンプトと2つの異なる学習率で最適化された低ランク行列に分解するDePTを提案する。
DePTは、いくつかのシナリオにおいて、完全な微調整ベースラインを含む最先端のPEFTアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:02:23 GMT)
virtCCA: Virtualized Arm Confidential Compute Architecture with TrustZone [14.9] ARMは近日中に予定されているARMv9-Aアーキテクチャの一部として、Confidential Compute Architecture (CCA)を導入した。
我々は、既存のARMプラットフォームで利用可能な成熟したハードウェア機能であるTrustZoneを使用してCCAを促進するアーキテクチャである virtCCAを提案する。
virtCCAはAPIレベルでのCCA仕様と完全に互換性がある。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:53:44 GMT)
Thyroid ultrasound diagnosis improvement via multi-view self-supervised
learning and two-stage pre-training [14.9] 甲状腺結節の分類とセグメンテーション性能を限定的な手動ラベルで改善する多視点コントラスト自己監督法を提案した。
提案手法は,同じ結節の横方向と縦方向のビューを一致させることで,結節領域にもっと焦点を合わせることができる。
また,ImageNetおよび甲状腺超音波画像の事前訓練を利用するために,2段階の事前訓練も導入した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:56:29 GMT)
Counter-intuitive: Large Language Models Can Better Understand Knowledge
Graphs Than We Thought [14.5] 本稿では、知識グラフ(KG)を用いて、大規模言語モデル(LLM)推論機能の実現と幻覚の低減を図る。
我々は、複雑な質問応答(CQA)を用いて、LLMのKG知識の理解能力を評価する。
初期の期待とは対照的に,LLMは乱雑でノイズが多く,線形化されたKGの知識を効果的に扱えることが明らかとなった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:44:03 GMT)
Yet another Improvement of Plantard Arithmetic for Faster Kyber on
Low-end 32-bit IoT Devices [14.3] 我々は、定数によるプランタード乗算の入力範囲が、TCHES2022の元の設計より少なくとも2.14倍大きいことを示す。
NTT/INTTの最適化手法を提案する。
我々のNTT/INTT実装は、最先端の作業と比べてかなりのスピードアップを示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 05:49:49 GMT)
Evaluating the Utility of Conformal Prediction Sets for AI-Advised Image
Labeling [14.0] ディープニューラルネットワークは、より一般的にハイテイクな予測ドメインにデプロイされる。
実世界の意思決定を定量化するための実践的な課題を実証的に指摘する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:52:23 GMT)
Balanced Training of Energy-Based Models with Adaptive Flow Sampling [14.0] エネルギーベースモデル (EBMs) は、非正規化ログ密度を直接パラメータ化する汎用密度推定モデルである。
我々は、異なる種類の生成モデル、正規化フロー(NF)を用いたESMのための新しい最大可能性トレーニングアルゴリズムを提案する。
本手法はトレーニング中にNFをEMMに適合させ,NF支援サンプリング方式によりESMの正確な勾配が常に得られるようにする。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:58:47 GMT)
A Survey of What to Share in Federated Learning: Perspectives on Model
Utility, Privacy Leakage, and Communication Efficiency [13.9] フェデレートラーニング(FL)は、クライアント間の協調トレーニングのための安全なパラダイムとして登場した。
本稿では, モデル, 合成データ, 知識をそれぞれ共有する3つの共有手法を用いて, FL法の新しい分類法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:16:41 GMT)
OptEx: Expediting First-Order Optimization with Approximately
Parallelized Iterations [13.9] ほぼ並列化されたイテレーション (OptEx) で高速化された一階最適化を導入する。
OptExは、並列コンピューティングを活用して、その反復的ボトルネックを軽減することで、FOOの効率を高める最初のフレームワークである。
我々は、カーネル化された勾配推定の信頼性とSGDベースのOpsExの複雑さを理論的に保証する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:19:02 GMT)
On the Roles of LLMs in Planning: Embedding LLMs into Planning Graphs [13.9] 市販の計画フレームワークにおける大規模言語モデル(LLM)の計画能力について考察する。
LLMを2段階の計画グラフに組み込んだ新しいLLMベースの計画フレームワークを提案する。
様々な計画領域において提案手法の有効性を実証的に示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:53:32 GMT)
TDE-3: An improved prior for optical flow computation in spiking neural
networks [13.8] 運動検出は、ロボットシステムが環境を知覚し、ナビゲートするのに必要となる主要なタスクである。
バイオインスパイアされたニューロモーフィック・タイムディファクション(TDE-2)は、イベントベースのセンサーとプロセッサをスパイクニューラルネットワークと組み合わせ、リアルタイムかつエネルギー効率の良いモーション検出を提供する。
本稿では, テクスチャ環境下でのTDE-3の方向選択性を高めるために, さらなる抑制入力を付加した3点TDE(TDE-3)を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:42:19 GMT)
A Study on Chinese Social Perspective regarding ChatGPT for Education
and Beyond [13.7] 本研究は,中国国民がChatGPTの教育的・一般目的の可能性をどう捉えているかを検討する。
GPT-4以前、一部のソーシャルメディア利用者は、AIの進歩は教育や社会に恩恵をもたらすと信じていたが、ChatGPTのような先進的なAIは人間を劣悪に感じるだろうと信じていた。
本稿では,ChatGPT型モデルの教育等における倫理的適用を確保するために,トレンドシフトの徹底的な分析とロードマップを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:48:02 GMT)
Question Answering Over Spatio-Temporal Knowledge Graph [13.4] 時空間知識グラフ質問応答(STKGQA)を組み込んだ1万の自然言語質問からなるデータセットを提案する。
質問から時間的・空間的な情報を抽出することにより、質問をよりよく理解し、STKGから正確な回答を得られる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:44:48 GMT)
A Curious Case of Searching for the Correlation between Training Data
and Adversarial Robustness of Transformer Textual Models [13.4] 既存の研究によると、微調整されたテキスト変換モデルは最先端の予測性能を実現するが、敵対的なテキスト摂動にも弱い。
本稿では,トレーニングデータとモデルロバスト性との間にも強い相関関係があることを証明したい。
様々な入力微調整コーパス特性を表す13の異なる特徴を抽出し,それらを用いて微調整モデルの対角的堅牢性を予測する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 05:58:25 GMT)
Doubly Robust Inference in Causal Latent Factor Models [13.2] 本稿では,観測不能な条件下での平均処理効果を推定するための新しいフレームワークを紹介する。
有限サンプルおよび頑健な重み付け保証を導出し、新しい推定器の誤差がパラメトリック速度で平均ゼロガウス分布に収束することを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:13:46 GMT)
BGE Landmark Embedding: A Chunking-Free Embedding Method For Retrieval
Augmented Long-Context Large Language Models [13.2] 大規模言語モデル(LLM)は、多くの重要なアプリケーションを扱うためにコンテキストの拡張を要求する。
既存のアプローチはコストがかかり、コンテキスト拡張の品質が劣る傾向がある。
拡張可能な埋め込みは、典型的なトークン埋め込みの強化である。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:41:01 GMT)
Deep Learning Predicts Prevalent and Incident Parkinson's Disease From
UK Biobank Fundus Imaging [13.1] パーキンソン病は世界最速の神経疾患である。
現在の診断法は高価で、可用性は限られている。
我々は、パーキンソン病の診断検査として、しばしば脳への窓と呼ばれる網膜基底像を強調した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:50:49 GMT)
PASCL: Supervised Contrastive Learning with Perturbative Augmentation
for Particle Decay Reconstruction [13.1] 高エネルギー物理学では、衝突で生じる粒子は階層木構造の形で崩壊する。
本研究では,木構造を推定し,衝突イベントを再構成するグラフに基づくディープラーニングモデルを提案する。
特に、最小共通祖先世代(LCAG)行列と呼ばれるコンパクトな行列表現を用いて、粒子崩壊木構造を符号化する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:38:34 GMT)
Balanced Data, Imbalanced Spectra: Unveiling Class Disparities with
Spectral Imbalance [12.4] クラス格差の潜在的な源として,特徴量におけるスペクトル不均衡の概念を導入する。
高次元混合モデル設定におけるクラスごとの誤差の正確な式を導出する。
我々はこの現象を11種類の最先端事前訓練エンコーダで研究した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:59:54 GMT)
Filter-free high-performance single photon emission from a quantum dot
in a Fabry-Perot microcavity [11.9] Purcell-enhanced single quantum dots (QDs) を用いた共鳴励起は、高性能な固体単一光子源を実現するための重要な戦略である。
伝統的に、これは偏光フィルタリングを含み、達成可能な偏光方向とフォトニック状態のスケーラビリティを制限する。
我々は, モノリシックファブリペロマイクロキャビティと決定的に結合したQDの空間直交共振励起を用いて, この問題に対処することに成功している。
得られた光源は、高い抽出効率が0.87、純度が0.9045(4)、識別性が0.963(4)の単一光子を同時に生成する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:31:09 GMT)
Gaussian Splatting with NeRF-based Color and Opacity [11.8] 本研究では、3Dオブジェクトの形状のGS表現と、色と不透明度のNeRFに基づく符号化を利用するハイブリッドモデルであるビューングディビジョン・ガウス・スティング(VDGS)を提案する。
私たちのモデルは、影、光の反射、そして3Dオブジェクトの透明性をよりよく表現しています。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:46:42 GMT)
Decoding News Narratives: A Critical Analysis of Large Language Models
in Framing Bias Detection [11.6] GPT-3.5 Turbo、GPT-4、Flan-T5モデルは、ゼロショット、少数ショット、説明可能なプロンプト手法によってニュース見出しのフレーミングバイアスを検出する。
特にGPT-4は、関連するドメイン内の様々な例を示す場合、いくつかのシナリオでパフォーマンスが向上することを示した。
FLAN-T5の貧弱な性能は、より小さなモデルではフレーミングバイアスを識別するために追加のタスク固有の微調整が必要になることを示している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:27:48 GMT)
GNNavi: Navigating the Information Flow in Large Language Models by
Graph Neural Network [11.1] 大きな言語モデル(LLM)は、デモによるプロンプトが適用されると、強力なインコンテキスト学習(ICL)能力を示す。
プロンプトベースの微調整は、低データシナリオにおいて効果的な微調整法であることが証明されているが、計算資源に対する高い要求は、その実用性を制限する。
GNNaviはグラフニューラルネットワークレイヤを使用して、プロンプト処理中に情報フローの集約と分布を正確にガイドする。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:13:05 GMT)
Accelerating local laplacian filters on FPGAs [11.1] 局所ラプラシアンフィルタリングは、単純なガウスピラミッドとラプラシアンピラミッドの構築を含むエッジ対応画像処理技術である。
本稿では,ローカルラプラシアンフィルタアルゴリズムの並列性を完全に活用したハードウェアアクセラレータを提案する。
Virtex-7 FPGAでは、最適化されたベースラインCPU実装と比較して、1MBの画像を処理するための7.5倍のスピードアップが得られる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:49:23 GMT)
SAC3: Reliable Hallucination Detection in Black-Box Language Models via
Semantic-aware Cross-check Consistency [11.1] 幻覚検出は現代言語モデル(LM)の信頼性を理解するための重要なステップである
我々は,LMの自己整合性に基づく既存の検出手法を再検討し,(1)質問レベルと(2)モデルレベルの2種類の幻覚を明らかにする。
本稿では, 自己整合性チェックの原理に基づいて, セマンティック・アウェア・クロスチェック整合性(SAC3)という, サンプリングに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:13:47 GMT)
Data Distribution Distilled Generative Model for Generalized Zero-Shot
Recognition [10.8] 本稿では,D$3$GZSLというエンドツーエンド生成GZSLフレームワークを紹介する。
このフレームワークは、目に見えないデータと合成されたデータを、それぞれ非分配データとアウト・オブ・ディストリビューションデータとみなしている。
提案手法は,確立されたGZSLベンチマーク間で有効性を実証し,主要な生成フレームワークにシームレスに統合する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:54:28 GMT)
URLBERT:A Contrastive and Adversarial Pre-trained Model for URL
Classification [10.6] URLはWebコンテンツの理解と分類において重要な役割を果たす。
本稿では,URL分類や検出タスクに適用された最初の事前学習型表現学習モデルであるURLBERTを紹介する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:51:20 GMT)
Dueling Over Dessert, Mastering the Art of Repeated Cake Cutting [10.5] 我々は,アリスとボブという2人の選手の間で,ケーキ上での個人的評価の相違を繰り返す公平な分割の設定について検討する。
我々は2つのバージョンを考える: シーケンシャル: ボブがアリスのカットポイントを左と右を選ぶ前に観察し、同時に、ボブが選択した後のみ彼女のカットポイントを観察する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:33:10 GMT)
Multi-task Meta Label Correction for Time Series Prediction [10.1] マルチタスク・フレームワークを用いたメタラーニングによる時系列データに対するラベル補正手法を開発した。
その結果,提案手法は既存のラベル補正手法よりも有効で正確であることがわかった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:48:23 GMT)
Ain't Misbehavin' -- Using LLMs to Generate Expressive Robot Behavior in
Conversations with the Tabletop Robot Haru [9.3] 本稿では,大規模言語モデル(LLM)を利用して,表現行動を伴うロボット応答を生成する,完全自動会話システムを提案する。
提案したシステムを用いて,ボランティアが社会ロボットとチャットし,そのフィードバックを分析し,チャットテキストの厳密な誤り解析を行う。
最も否定的なフィードバックは、会話に限られた影響を及ぼす自動音声認識(ASR)エラーによるものだった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:35:52 GMT)
Region Feature Descriptor Adapted to High Affine Transformations [9.1] 本稿では,アフィン変換をシミュレートした領域特徴記述子を提案する。
既存の古典的記述子に比べて精度と堅牢性が高い。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 04:12:34 GMT)
A Robust Error-Resistant View Selection Method for 3D Reconstruction [9.1] 本稿では,頑健なエラー耐性ビュー選択法を提案する。
エラー耐性行列の各行のソート結果は、各ビューの候補ビューセットを決定する。
提案手法は,TUMデータセットとDTUデータセットの絶対軌道誤差の平均29.40%,および5.07%の減少を示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:49:13 GMT)
Deep-Lock: Secure Authorization for Deep Neural Networks [9.1] ディープニューラルネットワーク(DNN)モデルは、いくつかのビジネスモデルにおいて価値のある知的特性(IP)と見なされている。
このようなDNNモデルのIP盗難や不正使用の防止は、業界で重要な懸念事項となっている。
そこで本研究では,ロックされたモデルが正しい秘密鍵を適用した場合にのみ正しく機能することを保証する,汎用的で軽量なキーベースモデルロック方式を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:32:50 GMT)
Vaccine: Perturbation-aware Alignment for Large Language Model [8.6] ユーザがアップロードした有害なデータのいくつかは、微調整を簡単に騙してアライメントが壊れたモデルを生成することができる。
本稿では,ユーザが微調整を行う際のセキュリティリスクを軽減するために,摂動を考慮したアライメント手法であるVaccineを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:25:38 GMT)
SpeCrawler: Generating OpenAPI Specifications from API Documentation
Using Large Language Models [8.4] SpeCrawlerは、さまざまなAPIドキュメントからOpenAPI仕様を生成する包括的なシステムである。
本稿では,実証的証拠とケーススタディに支えられたSpeCrawlerの方法論について考察する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:33:24 GMT)
What's the Plan? Evaluating and Developing Planning-Aware Techniques for
LLMs [8.1] 大きな言語モデル(LLM)は、計画機能を必要とするアプリケーションにますます使われています。
我々は,新しいハイブリッド・メソドであるSimPlanを紹介し,その性能を新たな挑戦的な設定で評価する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:42:49 GMT)
Variance estimation in graphs with the fused lasso [7.7] 一般グラフの分散を連続的に推定できる相補的ケースに対する線形時間推定器を開発する。
我々の推定器は,平均信号が標準スケーリングと全く異なる場合,チェーンと2次元グリッドグラフの最小値が得られることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:16:44 GMT)
Combinatorial Client-Master Multiagent Deep Reinforcement Learning for
Task Offloading in Mobile Edge Computing [7.6] ユーザデバイス(UD)はタスクの計算要求を実行する能力に制限がある。
モバイルエッジコンピューティング(MEC)は、UDのコンピューティング需要の増加に対応するための有望な技術として登場した。
MECのタスクオフロードは、UDとMECサーバ間でタスクを分散することで、UDの要求を満たす戦略である。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:17:15 GMT)
CPN: Complementary Proposal Network for Unconstrained Text Detection [7.5] 本稿では,セマンティックおよび幾何学的情報をシームレスに統合し,優れた性能を実現する補完的提案ネットワークを提案する。
補完的な提案と特徴の両方を活用することで、CPNは同等のコストで最先端のアプローチよりも優れたマージンを持つ。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:43:53 GMT)
LiRaFusion: Deep Adaptive LiDAR-Radar Fusion for 3D Object Detection [7.5] 3次元物体検出のためのLiDAR-レーダー融合のためのLiRaFusionを提案する。
我々は,結合ボクセル特徴符号化のための早期融合モジュールと,特徴写像を適応的に融合させる中核融合モジュールを設計する。
既存の手法に比べてLiRaFusionが顕著な改善を達成できることを示すため,我々はnuScenesを広範囲に評価する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:29:28 GMT)
Extensible Embedding: A Flexible Multipler For LLM's Context Length [6.9] 大規模言語モデル(LLM)は、多くの重要なアプリケーションを扱うためにコンテキストの拡張を要求する。
既存のアプローチはコストがかかり、コンテキスト拡張の品質が劣る傾向がある。
高い柔軟性とコスト効率でLLMコンテキストの高品質な拡張を実現するExtensible Embeddingを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:50:19 GMT)
You Still See Me: How Data Protection Supports the Architecture of ML
Surveillance [6.7] 人間のデータは機械学習のバックボーンを形成する。
データ保護法は、MLシステムの管理方法に強く依存している。
データ保護技術は、しばしば監視のインフラをサポートする方法で実施されている、と私たちは主張する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:59:25 GMT)
Improving saliency models' predictions of the next fixation with humans'
intrinsic cost of gaze shifts [6.3] 我々は,次の視線目標を予測し,視線に対する人的コストを実証的に測定するための原則的枠組みを開発する。
我々は、人間の視線嗜好の実装を提供する。これは、人間の次の視線目標に対する任意の正当性モデルの予測を改善するために使用できる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:18:38 GMT)
MasonPerplexity at Multimodal Hate Speech Event Detection 2024: Hate
Speech and Target Detection Using Transformer Ensembles [6.3] 本稿では,EACL 2024のケース2024におけるマルチモーダル・ヘイト・スピーチ・イベント検出における共有タスクに対するMasonPerplexityの提出について述べる。
サブタスクAにはXLM-roBERTa-largeモデル、サブタスクBにはXLM-roBERTa-base、BERTweet-large、BERT-baseを組み合わせたアンサンブルアプローチを用いる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:39:55 GMT)
Learning Memory Kernels in Generalized Langevin Equations [6.2] 一般化ランゲヴィン方程式におけるメモリカーネル学習のための新しい手法を提案する。
このアプローチは最初、軌道データから相関関数を推定するために正規化Prony法を使用し、続いてRKHS正則化を伴うソボレフノルムに基づく損失関数の回帰を行う。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:01:49 GMT)
Challenging the Black Box: A Comprehensive Evaluation of Attribution
Maps of CNN Applications in Agriculture and Forestry [6.1] 本研究では,農業・林業におけるニューラルネットワークの説明可能性,特に肥料処理の分類と木材の識別について検討する。
これらのモデルの不透明な性質は、しばしば「ブラックボックス」と見なされ、最先端の属性マップ(AM)の広範囲な評価によって解決される。
調査の結果、AMは重要な機能を一貫して強調しておらず、ドメインの専門家が重要とみなす機能と誤解することが多いことが判明した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:16:43 GMT)
Studying Differential Mental Health Expressions in India [6.1] インドの個人によって行われたRedditのメンタルヘルス投稿を分析し、世界の他のユーザーと比較して、インド特有のオンライン言語の変化を特定する。
西洋のサンプルとは異なり、インドにおけるメンタルヘルスの議論は悲しみを表し、否定を使い、現在に焦点を当てており、仕事と達成に関連している。
2人の臨床心理学者が、ソーシャルメディアの投稿から得られた知見を検証し、インド人が一般的であるメンタルヘルスの議論に関連するトップ20のトピックの95%を発見した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:56:56 GMT)
MultiCorrupt: A Multi-Modal Robustness Dataset and Benchmark of
LiDAR-Camera Fusion for 3D Object Detection [6.0] 自動走行のためのマルチモーダル3Dオブジェクト検出モデルは、nuScenesのようなコンピュータビジョンベンチマークでは例外的な性能を示した。
しかし、密集したLiDAR点雲や精密に校正されたセンサーアレイへの依存は、現実世界のアプリケーションに課題をもたらす。
我々は,10種類の汚職に対してマルチモーダル3Dオブジェクト検出器の堅牢性を評価するためのベンチマークであるMultiCorruptを紹介する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:56:13 GMT)
Class-Aware Pruning for Efficient Neural Networks [5.9] ディープニューラルネットワーク(DNN)の実行における計算コスト削減のために、プルーニングが導入されている。
本稿では,DNNを圧縮するクラスアウェアプルーニング手法を提案する。
実験結果から, このクラス認識プルーニング技術は, 重量とFLOPを著しく削減できることがわかった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:53:29 GMT)
Metric-Learning Encoding Models Identify Processing Profiles of
Linguistic Features in BERT's Representations [5.9] メトリックラーニングモデル(MLEM)は、ニューラルネットワークが処理対象の理論的特徴をどのように表現するかを理解するための新しいアプローチである。
MLEMは、他のドメイン(例えば視覚)や人間の脳などの他の神経系に拡張することができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:57:53 GMT)
Developing Autonomous Robot-Mediated Behavior Coaching Sessions with
Haru [5.8] 本研究では,自律対話が行動変化コーチングにおける人間とロボットの相互作用に与える影響について検討した。
本稿では,テーブルトップ型ソーシャルロボット「はる」の利用に焦点をあて,ポジティブな行動変化を促すためのTiny Habits法の実装について検討する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:33:54 GMT)
Teacher as a Lenient Expert: Teacher-Agnostic Data-Free Knowledge
Distillation [5.7] 教師に依存しないデータフリー知識蒸留法(TA-DFKD)を提案する。
我々の基本的な考え方は、教師モデルに、そのクラスをジェネレータに強制する厳格な監督者ではなく、サンプルを評価するための優れた専門家の役割を割り当てることである。
本手法は,既存のDFKD法よりも優れた性能を示しながら,教師モデル間での堅牢性と訓練安定性の両立を実現している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:13:57 GMT)
Multi-dimensional Evaluation of Empathetic Dialog Responses [5.4] 話者の視点から表現された意図と聴取者の視点から認識された共感の両方を測定するための多次元共感評価フレームワークを提案する。
内部の顧客サービス対話の分析に提案されたフレームワークを適用すると、2つの次元が相互接続されていることがわかる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 00:32:33 GMT)
A novel Fourier neural operator framework for classification of
multi-sized images: Application to 3D digital porous media [5.4] 様々なサイズで画像の分類を行うための新しいディープラーニングフレームワークを提案する。
提案するネットワークをマルチサイズの画像で同時にトレーニングする。
導入したフレームワークの有効性を示し、その性能を直感的なアプローチと比較する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:31:29 GMT)
An Elementary Predictor Obtaining $2\sqrt{T}$ Distance to Calibration [5.1] オンライン予測器は, 対向的な設定でキャリブレーションまでの距離が$O(sqrtT)$であることを示す。
極端に単純で効率的で決定論的なアルゴリズムで、キャリブレーション誤差から最大2sqrtT$までの距離を求める。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 00:53:05 GMT)
Numerical Claim Detection in Finance: A New Financial Dataset,
Weak-Supervision Model, and Market Analysis [5.0] ファイナンシャルドメインにおけるクレーム検出タスクのための新たな財務データセットを構築した。
本稿では,対象物の専門家(SME)の知識を集約関数に組み込んだ,新たな弱スーパービジョンモデルを提案する。
我々は、新しい測度楽観主義を構築することによって、提案したモデルの実用性を実証する」。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:55:26 GMT)
Hieros: Hierarchical Imagination on Structured State Space Sequence
World Models [4.9] ヒエロス(Hieros)は、時間的抽象世界表現を学習し、潜在空間における複数の時間スケールでの軌跡を想像する階層的な政策である。
我々は,Atari 100kベンチマークにおいて,平均および中央値の正規化人間のスコアにおいて,この手法が技術状況より優れていることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 13:42:53 GMT)
Learning Conditional Invariances through Non-Commutativity [4.8] 目的領域に非可換的に向くような不変条件を緩和することにより, 条件付き不変条件の学習に最適で, サンプル効率のよい学習方法が示される。
非可換性は$varphi*$の代わりに$Phi*_tau$への最適化を導いており、$mathcalH$-divergenceを0とする。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:12:18 GMT)
Utilizing BERT for Information Retrieval: Survey, Applications,
Resources, and Challenges [4.6] 本調査は、情報検索(IR)にBERTのような事前訓練されたトランスフォーマーエンコーダを適用するアプローチに焦点を当てる。
i) 長文処理, (ii) 意味情報の統合, (iii) 有効性と効率のバランス, (iv) 用語の重み付け予測, (v) クエリ拡張, (vi) 文書拡張の6つの高レベルカテゴリに分類した。
特定のタスクに対して、細かな調整されたBERTエンコーダは依然としてパフォーマンスが良く、デプロイメントコストも低いことが分かりました。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:22:40 GMT)
Model-Free $\mu$-Synthesis: A Nonsmooth Optimization Perspective [4.5] 本稿では,重要なポリシー検索ベンチマーク,すなわち$mu$- synthesisを再考する。
本研究では, 段階的な探索手法が, 実際に顕著な数値的な結果をもたらしていることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:17:17 GMT)
Quantum Image Denoising with Machine Learning: A Novel Approach to
Improve Quantum Image Processing Quality and Reliability [3.9] 量子画像処理(QIP)は、画像の操作と解析に量子コンピューティングの利点を活用することを目的としている。
QIPは量子ビットの制限と量子マシンにおけるノイズの存在という2つの課題に直面している。
本稿では,量子処理された画像のノイズを特定し,修正する機械学習モデルを用いて,QIPにおけるノイズ問題に対処する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:55:54 GMT)
Sequential Recommendation on Temporal Proximities with Contrastive
Learning and Self-Attention [3.7] 逐次リコメンデータシステムは、過去のインタラクションからユーザの好みを識別し、後続の項目を最適に予測する。
最近のモデルでは、類似の時間枠中に暗黙的に発生するユーザの行動の類似性を無視することが多い。
本稿では,時間的近接性を考慮したコントラスト学習と自己認識手法を含む,TemProxRecという逐次レコメンデーションモデルを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:38:02 GMT)
Underestimation of lung regions on chest X-ray segmentation masks
assessed by comparison with total lung volume evaluated on computed
tomography [3.7] 肺マスクの作成には明確な基準や基準が欠如しており、アノテータ間の主観性が高い。
肺X線マスクは心臓,縦隔,横隔膜の輪郭に沿って生成され,肺のかなりの部分を取り除いた。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:51:29 GMT)
Technical Report: On the Convergence of Gossip Learning in the Presence
of Node Inaccessibility [3.5] Gossip Learning (GL) は、Flying Ad-Hoc Networks (FANETs) のようなリソース制約のある無線ネットワークに適している。
動的ネットワークトポロジの下で,アクセス不能ノードがGLに与える影響を定式化し検討する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:34:42 GMT)
Cross-Attention Fusion of Visual and Geometric Features for Large
Vocabulary Arabic Lipreading [3.5] リップリーディングは、唇とその周辺領域の動きを分析することによって、音声の認識に視覚データを使用する。
近年の深層学習に基づく研究は,口域から抽出した視覚的特徴を唇輪郭の目印点と統合することを目的としている。
本稿では,ビデオ中の音声単語を予測するために,大語彙アラビア語彙に対するクロスアテンション融合に基づくアプローチを提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:22:58 GMT)
Recent Developments in Machine Learning Methods for Stochastic Control
and Games [3.4] 近年,制御問題やゲームを解決するため,機械学習に基づく計算手法が開発されている。
我々は,高次元や構造が非常に複雑である場合においても,そのような問題を解く可能性を解き明かした深層学習手法に焦点をあてる。
本稿では,これらの手法について紹介し,機械学習と制御とゲームのクロスロードにおける最先端の成果を要約する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:18:07 GMT)
FGeo-HyperGNet: Geometry Problem Solving Integrating Formal Symbolic
System and Hypergraph Neural Network [3.2] これは、我々の一連の研究の5番目の記事であり、我々は、人間のような幾何学的推論を自動的に実行するニューラルシンボリックシステムを構築しました。
フォーマルなgeo7kデータセットでは、ステップワイズ精度87.65%、全体的な精度85.53%を達成しました。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 05:23:15 GMT)
Can ChatGPT Support Developers? An Empirical Evaluation of Large
Language Models for Code Generation [3.2] 開発者によるChatGPTとの会話から収集したデータセットであるDevGPTにおける会話の実証分析を行った。
この結果から,LLM生成コードを使用する現在の実践は,高レベルな概念を示すか,ドキュメントに例を示すかのどちらかに制限されていることが示唆された。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 20:48:09 GMT)
From Prejudice to Parity: A New Approach to Debiasing Large Language
Model Word Embeddings [3.1] DeepSoftDebiasは、ニューラルネットワークを使ってソフトデバイアスを行うアルゴリズムだ。
我々は、このアルゴリズムを様々なSOTAデータセット、精度メトリクス、難解なNLPタスクで徹底的に評価する。
DeepSoftDebiasは、性別、人種、宗教の偏見を減らし、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:53:41 GMT)
Interpretable Short-Term Load Forecasting via Multi-Scale Temporal
Decomposition [3.1] 本稿では,ニューラルネットワークの線形結合を学習し,それぞれが入力時間の特徴に付随する解釈可能なディープラーニング手法を提案する。
ケーススタディはベルギーの中央グリッド負荷データセット上で実施されており、提案モデルは頻繁に適用されるベースラインモデルよりも精度がよいことを示した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:55:59 GMT)
Shaping Human-AI Collaboration: Varied Scaffolding Levels in Co-writing
with Language Models [2.8] 本稿では,大規模言語モデルから得られる様々な足場が共筆過程をいかに形成するかを考察する。
この結果は,AIを活用した筆記ツールの設計に幅広い影響を及ぼす。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:27:42 GMT)
Search Engines Post-ChatGPT: How Generative Artificial Intelligence
Could Make Search Less Reliable [2.8] 我々は、生成人工知能(GenAI)が生成したコンテンツを生成、インデックス化、配布し始めるにつれて、検索エンジンの進化する性質について議論する。
我々の議論は、GenAI統合の初期段階、特に事実上の矛盾とバイアスに関する課題を強調します。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:10:18 GMT)
An International and Multidisciplinary Teaching Experience with Real Industrial Team Project Development [2.6] 本稿では,欧州委員会が出資した国際協力プロジェクトの設計,目的,経験,成果について述べる。
IPは、少なくとも3カ国の大学生とスタッフを集結させる、短い研究プログラムである。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 00:14:21 GMT)
ChatDiet: Empowering Personalized Nutrition-Oriented Food Recommender
Chatbots through an LLM-Augmented Framework [2.4] ChatDietは、パーソナライズされた栄養指向の食品レコメンデーションチャットボット用に特別に設計された、新しいフレームワークである。
ChatDietは、オーケストラが補完する個人モデルと人口モデルを統合し、シームレスに関連する情報を検索し、処理する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:07:17 GMT)
A Transition System Abstraction Framework for Neural Network Dynamical
System Models [2.4] 本稿では,ニューラルネットワーク力学系モデルのためのトランジションシステム抽象化フレームワークを提案する。
このフレームワークは、データ駆動型ニューラルネットワークモデルをトランジションシステムに抽象化し、ニューラルネットワークモデルを解釈可能にする。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:49:18 GMT)
Evaluating Efficacy of Model Stealing Attacks and Defenses on Quantum
Neural Networks [2.3] 量子機械学習(QML)モデルのクラウドホスティングは、さまざまな脆弱性に公開する。
モデル盗難攻撃は、最大$0.9times$と$0.99times$クローンテスト精度を達成するクローンモデルを生成することができる。
これらの攻撃を防御するために、我々は現在のノイズの多いハードウェアのユニークな特性を活用し、犠牲者モデルの出力を摂動させる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:35:30 GMT)
SpikingBERT: Distilling BERT to Train Spiking Language Models Using
Implicit Differentiation [2.3] 大型言語モデル(LLMs)は、ヒト脳よりもニューロンとシナプスが桁違いに少ない。
本稿では,脳内のシナプス情報の流れから動機づけを引き出すことにより,従来のLMの計算コストを削減することを目的とした,バイオインスパイアされたスパイク言語モデルを提案する。
我々の研究は、GLUEベンチマークで複数の異なるタスクにおいて、運用上のスパイクするLMアーキテクチャのパフォーマンスを実証する最初のものである。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:40:31 GMT)
PassViz: A Visualisation System for Analysing Leaked Passwords [2.3] PassVizは、漏洩したパスワードを2次元空間で視覚化し分析するためのコマンドラインツールである。
本稿では、PassVizを用いて、漏洩したパスワードのさまざまな側面を視覚的に分析し、これまで知られていなかったパスワードパターンの発見を容易にする方法を示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:12:45 GMT)
Instruction Fine-Tuning: Does Prompt Loss Matter? [2.2] 本稿では,命令の微調整におけるPLWの効果について検討する。
短時間補完データセットで微調整したモデルの性能はPLWと統計的に有意な負の二次関係を持つことがわかった。
非ゼロのPLWはトレーニング中にトレーニング済みのモデル重みから外れないようにし、高いPLWは過度な適合を減少させると結論付けた。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:12:55 GMT)
Why Lift so Heavy? Slimming Large Language Models by Cutting Off the
Layers [2.1] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクに対処する際、優れた能力を持っている。
これらのモデルの厳密なサイズは、ストレージ、トレーニング、推論において、層積み重ねによる数十億のパラメータを含むため、課題を生じさせる。
レイヤが少なくても、LLMは、特にテキスト分類タスクのプロンプトベースの微調整において、類似またはより良いパフォーマンスレベルを維持していることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 20:47:10 GMT)
Granularity at Scale: Estimating Neighborhood Socioeconomic Indicators
from High-Resolution Orthographic Imagery and Hybrid Learning [1.8] オーバーヘッド画像は、コミュニティ情報が不足しているギャップを埋めるのに役立つ。
機械学習とコンピュータビジョンの最近の進歩により、画像データのパターンから素早く特徴を抽出し、検出することが可能になった。
本研究では, 人口密度, 中央値世帯所得, 教育達成率の2つのアプローチ, 教師付き畳み込みニューラルネットワークと半教師付きクラスタリングについて検討する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:56:37 GMT)
Visualizing Entanglement in multi-Qubit Systems [1.8] 我々は、数量子ビットのアンサンブルの表現として、次元円記法を利用する。
分離性に関する数学的条件は、量子状態の対称性条件を可視化することにつながることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:02:15 GMT)
SDiT: Spiking Diffusion Model with Transformer [1.8] スパイキングニューラルネットワーク(SNN)は消費電力が低く、生物解釈可能な特性を持つ。
我々は、主流拡散モデルにおいてよく使われるU-net構造を置き換えるためにトランスフォーマーを利用する。
比較的低い計算コストと短いサンプリング時間で高品質な画像を生成することができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 13:42:11 GMT)
Statistical Optimality of Divide and Conquer Kernel-based Functional
Linear Regression [1.7] 本稿では,対象関数が基礎となるカーネル空間に存在しないシナリオにおいて,分割・コンカレント推定器の収束性能について検討する。
分解に基づくスケーラブルなアプローチとして、関数線形回帰の分割・収束推定器は、時間とメモリにおけるアルゴリズムの複雑さを大幅に減らすことができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:16:35 GMT)
On Double Descent in Reinforcement Learning with LSTD and Random
Features [1.6] 時間差分法(TD)アルゴリズムは深層強化学習(RL)において広く用いられている
ネットワークサイズと$l$-regularizationが性能に与える影響を理論的に分析する。
本研究では,2重降下現象,すなわちパラメータ/状態比の急激な低下を観察する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:34:45 GMT)
SymTC: A Symbiotic Transformer-CNN Net for Instance Segmentation of
Lumbar Spine MRI [1.5] 椎間板疾患 (intervertebral disc disease) は、しばしば間欠的または持続的な腰痛を引き起こす。
ディープニューラルネットワーク(DNN)モデルは、個々のインスタンスのより効率的なイメージセグメンテーションで臨床医を支援する。
本稿では,Transformer と CNN の強みを組み合わせた,革新的な腰椎MR画像分割モデルである SymTC を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 05:51:37 GMT)
Multi-Task Inference: Can Large Language Models Follow Multiple
Instructions at Once? [1.3] マルチタスク推論は、全体の推論時間を平均1.46倍に削減する。
驚いたことに、Llama-2-Chat-70BやGPT-4のような最先端のLCMでは、マルチタスク推論によるパフォーマンスが7.3%、12.4%向上した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:25:19 GMT)
ChatGPT in Linear Algebra: Strides Forward, Steps to Go [1.1] 当社の関心分野における近年のChatGPTのプロセスを振り返る。
このソフトウェアが教師のアシスタントになるのか、それとも人間の教師の代わりになるのか、という問題に対処する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:35:01 GMT)
Compression Repair for Feedforward Neural Networks Based on Model
Equivalence Evaluation [1.0] 本稿では,2つのニューラルネットワークの等価性評価に基づいて,圧縮フィードフォワードニューラルネットワーク(FNN)の修復手法を提案する。
提案手法の有効性と利点を示すため,本手法をMNISTデータセットに適用した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:41:38 GMT)
Real-Time Neural Materials using Block-Compressed Features [0.9] 本稿では、リアルタイムレンダリングパイプラインで使用するように設計された特徴量とデコーダを備えたニューラルマテリアルモデルを提案する。
我々のフレームワークはハードウェアベースのブロック圧縮(BC)テクスチャフォーマットを利用して学習した特徴を記憶し、そのモデルに空間と規模で連続的に材料情報を出力するように訓練する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:41:26 GMT)
Tool-Augmented LLMs as a Universal Interface for IDEs [0.8] 自然言語対話とコード生成の両方が可能な大規模言語モデル(LLM)は、統合開発環境(IDE)の概念の陳腐化を論じる。
ユーザコマンドで複数のIDE機能を含む複雑なアクションを実行でき、オプションやアクションを検索する際の面倒な作業のユーザエクスペリエンスを削除できるモデルを構想する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:32:28 GMT)
Introspective Planning: Guiding Language-Enabled Agents to Refine Their
Own Uncertainty [0.7] 大規模言語モデル(LLM)は高度な推論能力を示し、ロボットが自然言語の指示を理解し、高レベルの行動を戦略的に計画することを可能にする。
LLMの幻覚は、ロボットがユーザーの目標と不一致の計画を確実に実行したり、極端な場合、安全ではない可能性がある。
本稿では,ロボットタスク実行のための不確実性を考慮した計画作成において,LLMを指導する体系的手法としての内省的計画の概念を考察する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:01:01 GMT)
Autocorrect for Estonian texts: final report from project EKTB25 [0.7] このプロジェクトは2021-2023年にエストニア語技術プログラムによって資金提供された。
その主な目的はエストニア語のための綴りと文法の修正ツールを開発することだった。
エストニア語をサポートする商用言語モデルであるGPT4が作成された。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:20:57 GMT)
A Fast Algorithm to Simulate Nonlinear Resistive Networks [0.7] 線形不等式制約を持つ二次計画問題として,非線形抵抗ネットワークのシミュレーションのための新しい手法を提案する。
シミュレーション手法は既存のSPICEシミュレーションよりも優れており,150倍高速で最大325倍のネットワークをトレーニングすることができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:33:48 GMT)
IRFundusSet: An Integrated Retinal Rundus Dataset with a Harmonized
Healthy Label [0.6] 統合網膜ファンドセット(IRFundusSet)は、複数の公開データセットを統合し、調和させ、キュレートするデータセットである。
IRFundusSetはPythonパッケージで構成されており、調和を自動化し、PyTorchアプローチに従ってデータセットオブジェクトを活用する。
10の公開データセットが46064の画像で検討され、そのうち25406が新しいis_normalラベルのためにキュレートされ、3515はソース全体で健全であると見なされている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:32:36 GMT)
Simplifying Hyperparameter Tuning in Online Machine Learning -- The
spotRiverGUI [0.5] Online Machine Learning (OML)はBatch Machine Learning (BML)の代替品である
OMLはシーケンシャルな方法でデータを処理することができ、特にデータストリームに役立ちます。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:12:15 GMT)
Optimizing Performance of Feedforward and Convolutional Neural Networks
through Dynamic Activation Functions [0.5] ディープラーニングトレーニングアルゴリズムは近年,音声やテキスト,画像ビデオなど,多くの分野で大きな成功を収めています。
深い層と深い層が提案され、152層ほどのresnet構造で大きな成功を収めた。
浅層畳み込みニューラルネットワーク(CNN)はまだ活発な研究であり、いくつかの現象はまだ説明されていない。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:53:54 GMT)
An Empirical Categorization of Prompting Techniques for Large Language
Models: A Practitioner's Guide [0.3] 本研究では,学術的,実践的両面から最もよく知られたプロンプト技術について検討する。
本稿では,それぞれのカテゴリについて概説し,その独特な貢献を明確化し,実践的応用について紹介する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:03:56 GMT)
To use or not to use proprietary street view images in (health and
place) research? That is the question [0.2] この記事では、Googleストリートビューイメージの使用に関する現在のプラクティスに疑問を呈する。
私たちの懸念は、画像の大量ダウンロードを禁止しているGoogleのサービス規約にあります。
オープンなデータ原則に固執し、将来の研究にオープンなイメージソースを活用することが不可欠である。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 08:26:22 GMT)
Orbital angular momentum spectrum and entanglement in rotating
accelerated reference frame [0.2] 量子場理論は、線形加速された観測者の観点からは、慣性空空間は熱粒子で満たされている可能性があることを示している。
本稿では, 回転加速基準フレームにおけるOAMスペクトルについて検討し, 線形加速の場合とスペクトルの相違について検討する。
回転加速オブザーバーが実際にこれらの粒子をどう知覚するかを理解するために、ウンルー・デウィット検出器とその詳細バランスを研究した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:26:03 GMT)
RadarScenes: A Real-World Radar Point Cloud Data Set for Automotive
Applications [0.2] このデータセットの目的は、新しい(機械学習に基づく)レーダー認識アルゴリズムの開発を可能にすることである。
追加情報とダウンロード手順は、データセットのWebサイト(www.radar-scenes.com)で見ることができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:43:09 GMT)
Utilizing Deep Learning for Enhancing Network Resilience in Finance [0.0] 本稿では、金融業界の保護対策を改善するため、高度な脅威検出にディープラーニングを用いる。
検出技術は主に統計的機械学習手法を使用する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:29:45 GMT)
Using rule engine in self-healing systems and MAPE model [0.0] 本研究では,ルールエンジンを用いた故障修復手法を提案する。
mRUBISのシミュレーションにより,本手法は運用環境において効率がよいことを示した。
これにより、失敗の反響を減らし、デジタル技術への信頼を高めます。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 13:03:11 GMT)
Time-System Entanglement and Special Relativity [0.0] 量子時間のPage-Woottersメカニズムは有望な出発点である。
この時間系の絡み合いがローレンツ加速の速さにどのように依存するかを考察する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:52:42 GMT)
Theoretical foundations for programmatic reinforcement learning [0.0] プログラムRLはポリシーの表現をプログラムとして研究し、制御ループのような高次構造を含むことを意味する。
機械学習と形式的手法のコミュニティの交差点で多くの注目を集めているが、プログラム的RLに関する理論的側面については、ほとんど知られていない。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:02:39 GMT)
The noisy Werner-Holevo channel and its properties [0.0] このチャネルは, ランダムな角度によるランダムな方向の四重項状態の回転として実現可能であることを示す。
我々は、このチャネルを詳細に研究し、その様々な特性を導出する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:41:34 GMT)
Summation formulas generated by Hilbert space eigenproblem [0.0] シュル」オミルチ様無限級数や級数のある種のクラスが閉形式で計算可能であることを示す。
我々は、ヒルベルト空間の固有プロブレムに基づく一般的なフレームワークを提供し、異なる正確な可解量子モデルに適用することができる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:54:28 GMT)
Space and Time Continuous Physics Simulation From Partial Observations [0.0] 大規模機械学習に基づくデータ駆動方式は、より直接的かつ効率的に長距離依存関係を統合することにより、高い適応性を約束する。
我々は流体力学に焦点をあて、正規格子や不規則格子の形で計算と予測の固定的サポートに基づく文献の大部分の欠点に対処する。
本研究では,空間的・時間的領域の連続的な領域において,スパース観測を訓練しながら予測を行う新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 09:24:37 GMT)
Secure quantum imaging with decoy state heralded single photons [0.0] 我々は、デコイ状態の1光子源(HSPS)を用いた量子セキュアイメージングについて研究する。
HSPSは低光子数構造において優れた性能を持つため、量子鍵分布プロトコルを統合するのに理想的な候補である。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:43:05 GMT)
Saturability of the Quantum Cram\'{e}r-Rao Bound in Multiparameter
Quantum Estimation at the Single-Copy Level [0.0] 量子クラム・ラオ境界(Quantum Cram'er-Rao bound, QCRB)は、量子パラメータ推定における精度の最終的な下界である。
本稿では, 部分可換性を示唆し, ほぼ十分である新しい必要条件を導出する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 12:30:04 GMT)
ResMGCN: Residual Message Graph Convolution Network for Fast Biomedical
Interactions Discovering [0.0] 本稿では,バイオメディカル相互作用予測のためのResidual Message Graph Convolution Network (ResMGCN)を提案する。
タンパク質・タンパク質・薬物・薬物・標的・遺伝子・疾患の相互作用を含む4つのバイオメディカル相互作用ネットワークデータセットの実験を行った。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:46:18 GMT)
Optimal Quantum State Tomography via Weak Value [0.0] 任意のd次元量子系に対して、密度行列の実部と虚部を測定するのに使用される最適な強度を求める。
状態トモグラフィーの最適効率についても平均二乗誤差を用いて検討した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:20:34 GMT)
Opening the black box of language acquisition [0.0] 我々は、学習言語のための、より透明で認知的に妥当なアーキテクチャを提案する。
ディープラーニングの代わりに、シーケンスメモリとチャンキングに基づいた最小限の認知アーキテクチャを使用します。
その結果、モデルがこれらの人工言語をスクラッチから学習し、学習を支援する文法情報を抽出できることが示唆された。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:11:58 GMT)
On efficient normal bases over binary fields [0.0] バイナリフィールド拡張は、暗号、コードベースの暗号、エラー訂正コードの基本である。
本稿では,異なる範囲における演算の効率的な実装を示すために,$mathbbF_2n$ over $mathbbF$を探索する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:06:20 GMT)
Non-classicality Primitive in a Quasi-probabilistic Toy Model [0.0] 局所アリスとボブが古典的ランダム性を共有する準確率的玩具モデルにおいて、基本的非古典的効果を示す。
ボブが決定論的に準確率演算を行うなら、アリスとボブはそれをシミュレートするために古典的なコミュニケーションを必要とする。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 14:52:14 GMT)
Monte Carlo with kernel-based Gibbs measures: Guarantees for
probabilistic herding [0.0] 本研究では、カーネルのハーディングと同じ最悪のエラーを最小限に抑えるために、二次ノード上の結合確率分布について検討する。
最悪のケースではないものの、より高速な収束が可能であるという、初期の実験的な証拠を提供する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:39:00 GMT)
Microscopic derivation of transition-state theory for complex quantum
systems [0.0] 一般化ハミルトニアンに基づく遷移状態理論の基本式を導出する。
また、遷移確率は、広範囲の崩壊幅にわたって第2貯水池の状態の崩壊特性とは無関係であることがわかった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:28:36 GMT)
Improved Indoor Localization with Machine Learning Techniques for IoT
applications [0.0] 本研究では, 教師付き回帰器, 教師付き分類器, RSSIを用いた屋内位置推定のためのアンサンブル手法の3段階に機械学習アルゴリズムを適用した。
実験の結果は、屋内環境におけるローカライズ精度とロバスト性の観点から、異なる教師付き機械学習技術の有効性に関する洞察を与える。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 02:55:19 GMT)
Gauging Public Acceptance of Conditionally Automated Cars in the United
States [0.0] スマートシティの要素、条件付き自動走行車(SAEレベル3)を調べ、米国での公衆の受け入れに影響を与える要因を調査した。
米国における358人の参加者を対象に、L3技術の概要と、条件付き自動走行車の認識を捉えるための一連の質問が提示された。
その結果, 社会的影響, パフォーマンス・期待感, ヘドニック・モチベーション, ファシリテーティング・コンディション, 努力・期待感によって, 重要度が低下する順に, テクノロジーの受容が決定された。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 03:50:34 GMT)
Frequency-Dependent Vibronic Effects in Steady State Energy Transport [0.0] 電子と分子内における高周波振動自由度の間の相互作用は、自然光ハーベスティングシステムにおいてユビキタスである。
近年の研究では、分子内振動ドナーと受容体の周波数差がエネルギー輸送を促進することが示されている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 21:55:50 GMT)
Fast-forwarding molecular ground state preparation with optimal control
on analog quantum simulators [0.0] 電子動力学の最適制御は、化学的精度で分子基底状態を作成することができることを示す。
我々は、分子ハミルトニアンにすでに存在する相互作用の観点からのみ、分子進化の特定のパラメータ化を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:05:36 GMT)
Extraction of nonlinearity in neural networks and model compression with
Koopman operator [0.0] 制限された非線形性は手書き数字の分類に十分であることを示す。
本稿では,資源制約のある環境での大規模ネットワーク処理に有用であるディープニューラルネットワークのモデル圧縮手法を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:54:35 GMT)
Explaining the Machine Learning Solution of the Ising Model [0.0] パラメーターから結果を説明することは もっとも重要な課題です
ここでは、強磁性イジングモデルに対してこれをどのように達成できるかを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 20:47:33 GMT)
EventNet-ITA: Italian Frame Parsing for Events [0.0] EventNet-ITAは、イタリア語のイベントフレームを付加した、大規模なマルチドメインコーパスである。
フレームパーシングのための効率的なマルチラベルシーケンスラベリング手法を提案し,評価する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:29:44 GMT)
Entanglement: Balancing Punishment and Compensation, Repeated Dilemma
Game-Theoretic Analysis of Maximum Compensation Problem for Bypass and Least
Cost Paths in Fact-Checking, Case of Fake News with Weak Wallace's Law [0.0] 本研究ノートは、フェイクニュースの普及と効果的な事実確認に関連する問題を解決するための新しいアプローチについて整理したものである。
最小コストのルーティング問題に着目して、ニュース提供者間の情報伝達のダイナミクスをモデル化するために、メッツラー関数とメッツラー行列を用いて議論を行う。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 18:26:50 GMT)
Entanglement-enhanced quantum metrology: from standard quantum limit to
Heisenberg limit [0.0] エンタングルメント強化量子メートル法は、測定精度を高めるために量子エンタングルメントの利用を探求する。
量子操作と検出のための技術の急速な進歩により、多粒子の絡み合った状態の生成、操作、検出が可能になった。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 22:40:38 GMT)
Enabling Software Defined Optical Networks [0.0] 論文では、SDONの必要性を調査し、ハードウェアを含むSDONソリューションがどのようなものかを説明する。
また、GMPLSの制限を克服するために、このソリューションの一部としてOpenFlowをどのように使用できるかについても説明している。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:53:43 GMT)
Empirical Density Estimation based on Spline Quasi-Interpolation with
applications to Copulas clustering modeling [0.0] 密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎的な手法である。
本稿では,擬似補間による密度の単変量近似を提案する。
提案アルゴリズムは人工データセットと実データセットで検証される。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 11:49:38 GMT)
Dynamic planning in hierarchical active inference [0.0] 人間の脳が認知決定に関連する運動軌跡を推論し、導入する能力について述べる。
この研究は、ニューラルネットワークと強化学習を中心とした従来の見解とは距離を置き、アクティブ推論においてまだ探索されていない方向に向かっている。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:32:53 GMT)
Driving superconducting qubits into chaos [0.0] Kerr-cat量子ビットは、エラー保護された量子情報のエンコーディングと操作に対する利点を提供する。
非線形性の増大はゲート時間の短縮を可能にするが、カオスを引き起こして量子ビットを溶かすこともできる。
パラメトリック量子計算の危険領域は、駆動超伝導回路による量子カオスの研究の場でもある。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:14:07 GMT)
Decoherence from Horizons: General Formulation and Rotating Black Holes [0.0] 地平線を殺すことは、近くの全ての量子重ね合わせに基本的なデコヒーレンスの割合を与える。
バイフルケートキリング地平線近傍のキリング観測者に対する正確なデコヒーレンス率の式を導出した。
我々はデコヒーレンスが極端極限で完全に消滅することを発見した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 16:49:05 GMT)
Communication Cost in Simulating Unknown Entangled States [0.0] 観測者間で共有される任意の$n$-qubit状態における射影局所測定のアンサンブル統計を普遍的にシミュレートする方法を示す。
我々の手法は、量子非局所性をシミュレートするために設計されたプロトコルに由来する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:01:37 GMT)
CoRe Optimizer: An All-in-One Solution for Machine Learning [0.0] 連続レジリエント収束(CoRe)は、他の最先端の1次勾配に基づく収束アルゴリズムと比較して優れた性能を示した。
CoReは、調査されたすべてのアプリケーションにおいて、最高の、または競争的なパフォーマンスを得る。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 00:33:34 GMT)
Bulk and boundary entanglement transitions in the projective gauge-Higgs
model [0.0] 量子多体スピン系では、マルチキュービットパウリのエンタングリング効果と単一キュービットパウリの測定のアンタングリング効果との相互作用は2つの競合効果をもたらす可能性がある。
2+1)$d $mathbbZ$ Fradkin-Shenker Hamiltonianモデルに関連する測定ベースモデルを数値的に検討する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 23:44:51 GMT)
Anyons in a highly-entangled toric xy model [0.0] 「位相秩序」は1972年から古典的xyモデルの振る舞いを記述するために使われてきた。
実際、量子$xy$トポロジカル位数は、群 G=Z に適用された北エフの量子二重模型の無限格子極限であることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 17:45:00 GMT)
Alpha Zero for Physics: Application of Symbolic Regression with Alpha
Zero to find the analytical methods in physics [0.0] 我々は,Alpha Zeroアルゴリズムを用いた記号回帰を用いた物理解析手法の開発フレームワークを提案する。
実演として、AZfPはFloquetシステムの高周波展開を導出できることを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 07:54:38 GMT)
A tripartite entanglement in de Sitter spacetime [0.0] ド・ジッター空間における三分割交絡状態の量子相関について検討する。
大きな膨張率では、三部構成の相互情報は大きな負の値を持つ。
この結果と局所的な測定から情報を回収する課題を関連づける。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 06:20:40 GMT)
A topological behavior of quantum particles originated from the
classicality of their flow velocity [0.0] 量子粒子を古典流体として記述することから自然に生じる新しい量子効果を提案する。
量子ポテンシャルが消滅した場合,波動関数の振幅の最大値は領域の境界に沿ってどのように存在するかを示す。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 15:31:23 GMT)
A Multispectral Automated Transfer Technique (MATT) for machine-driven
image labeling utilizing the Segment Anything Model (SAM) [0.0] 本稿では,Multispectral Automated Transfer Technique (MATT) と呼ぶ手法について概説する。
RGB画像からSAMセグメンテーションマスクを変換することで、高精度で効率よくマルチスペクトル画像のセグメンテーションとラベルを自動で行うことができる。
本研究は,多スペクトル物体検出モデルを高速に分割,ラベル付け,訓練するための新しいオープンソース手法を提供することにより,多スペクトル物体検出の研究に大きく貢献する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 01:01:13 GMT)
5G Cellular -- An Energy Efficiency Perspective [0.0] 本研究の目的は,エネルギー効率の観点から5Gを実現することにある。
改良や修正によって5Gセルのエネルギー効率が向上する5Gセル内の特定の領域を指摘する努力がなされる。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 20:01:55 GMT)
3D Point Cloud Compression with Recurrent Neural Network and Image
Compression Methods [0.0] 多くのAVアプリケーションでは、LiDARポイントクラウドデータの保存と送信が不可欠である。
データの幅と秩序のない構造のため、ポイントクラウドデータを低ボリュームに圧縮することは困難である。
圧縮アルゴリズムが空間相関を効率的に活用できる新しい3D-to-2D変換を提案する。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 19:08:19 GMT)
$\alpha$-Divergence Loss Function for Neural Density Ratio Estimation [0.0] 本稿では、簡潔な実装と安定な最適化を提供する$alpha$-divergence損失関数($alpha$-Div)を提案する。
提案した損失関数の安定性を実証的に検証し,DREタスクの推定精度について検討した。
論文参考訳(メタデータ) (Sun, 18 Feb 2024 10:53:18 GMT)