DataComp-LM: In search of the next generation of training sets for language models [200.5] DataComp for Language Models (DCLM)は、制御されたデータセット実験のためのテストベッドであり、言語モデルを改善することを目的としている。
我々は、Common Crawlから抽出された240Tトークンの標準化コーパス、OpenLMフレームワークに基づく効果的な事前学習レシピ、53の下流評価スイートを提供する。
DCLMベンチマークの参加者は、412Mから7Bパラメータのモデルスケールでの重複、フィルタリング、データ混合などのデータキュレーション戦略を実験することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:22:45 GMT)
Low-Redundant Optimization for Large Language Model Alignment [126.3] 大規模言語モデル(LLM)は、複雑なタスクやシナリオにおいて、人間の好みに合わせるのに依然として苦労しています。
我々は、最も有用な教師付き信号を用いて、最も関連性の高いニューロンを最適化することに焦点を当てた、textbfALLOという低輝度アライメント手法を提案する。
10個のデータセットに対する実験結果から、ALLOの有効性が示された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:34:40 GMT)
ChatGLM: A Family of Large Language Models from GLM-130B to GLM-4 All Tools [119.3] 本報告は, GLM-4, GLM-4-Air, GLM-4-9B を含む GLM-4 言語シリーズに主眼を置いている。
GLM-4モデルは、主に中国語と英語で10兆のトークンと、24言語からの小さなコーパスで事前訓練されている。
高品質なアライメントは、教師付き微調整と人間のフィードバックからの学習を含む、多段階のポストトレーニングプロセスを通じて達成される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:58:21 GMT)
Evaluating Text-to-Visual Generation with Image-to-Text Generation [113.1] VQAScore(VQAScore)は、アライメントスコアを生成するビジュアル・クエクション・アンサーリング(VQA)モデルである。
これは、多くの(8)画像テキストアライメントベンチマークで最先端の結果を生成する。
我々は1,600の合成テキストプロンプトを備えたより難しいベンチマークであるGenAI-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:09:55 GMT)
Inference via Interpolation: Contrastive Representations Provably Enable Planning and Inference [110.5] 時系列データを考えると、“今後どうなるか?”や“どうやって来たのか?”といった質問に答えるにはどうすればよいでしょう?
これらの質問は、学習された表現の観点から、いかにコンパクトで閉じた形状の解が得られるかを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:40:32 GMT)
RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models [107.0] 大規模言語モデル(LLM)におけるロールプレイング能力をベンチマークし、評価し、拡張するフレームワークであるRoleLLMを紹介する。
Context-InstructとRoleGPTによって、168,093サンプルでロールプレイする最初の体系的できめ細かい文字レベルのベンチマークデータセットであるRoleBenchを作成します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:08:24 GMT)
MAVEN-Arg: Completing the Puzzle of All-in-One Event Understanding Dataset with Event Argument Annotation [104.6] MAVEN-Argは、イベント検出、イベント引数抽出、イベント関係抽出をサポートする最初のオールインワンデータセットである。
EAEベンチマークでは、(1)162のイベントタイプと612の引数ロールをカバーする包括的なスキーマ、(2)98,591のイベントと290,613の引数を含む大規模なデータスケール、(3)EAEのすべてのタスク変種をサポートする包括的なアノテーションの3つの利点がある。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:15:39 GMT)
AvaTaR: Optimizing LLM Agents for Tool-Assisted Knowledge Retrieval [94.0] 大言語モデル(LLM)エージェントは、外部のツールや知識を活用して精度を高め、幻覚を減らすという印象的な能力を示した。
本稿では、LLMエージェントを最適化して提供するツールを効果的に利用し、与えられたタスク/ドメインの性能を向上させる新しいフレームワークであるAvaTaRを紹介する。
AvaTaRは、4つの課題にまたがる最先端のアプローチを一貫して上回り、新規事例に適用した場合に強力な一般化能力を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:39:57 GMT)
VIA: A Spatiotemporal Video Adaptation Framework for Global and Local Video Editing [91.6] VIAは、グローバルおよびローカルなビデオ編集のための統合されたVIdeoフレームワークである。
また,VIAは長時間の映像編集を一貫した時間で行うことができ,映像編集作業に長大な可能性を秘めていることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:51:37 GMT)
Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.9] 大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:38:59 GMT)
Efficient Prompting for LLM-based Generative Internet of Things [88.8] 大規模言語モデル(LLM)は、様々なタスクにおいて顕著な能力を示す。
本稿では,テキストベースの生成IoT(GIoT)システムを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:26:33 GMT)
NTIRE 2024 Challenge on Night Photography Rendering [85.1] 課題の目標は、夜間に撮影された生のカメラ画像を処理するソリューションを見つけることだった。
アルゴリズムの速度も、その出力の質とともに測定された。
トップクラスの参加者のソリューションは、夜間撮影における最先端の技術を効果的に表現している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:56:25 GMT)
Semi-Supervised Coupled Thin-Plate Spline Model for Rotation Correction and Beyond [84.6] 制御点が限られている複数のTPSを、より柔軟で強力な変換に繰り返し結合するCoupledTPSを提案する。
注記コストを考慮に入れた半教師付き学習手法を開発し、ラベルのないデータを活用することにより、ワープ品質を向上させる。
実験は、回転補正のための既存の最先端解よりもCoupledTPSの優位性と普遍性を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:29:39 GMT)
The Lie Derivative for Measuring Learned Equivariance [84.3] 我々は、CNN、トランスフォーマー、ミキサーアーキテクチャにまたがる数百の事前訓練されたモデルの同値性について検討する。
その結果,不等式違反の多くは,不等式などのユビキタスネットワーク層における空間エイリアスに関連付けられることがわかった。
例えば、トランスはトレーニング後の畳み込みニューラルネットワークよりも同種である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:01:13 GMT)
A Survey on Human Preference Learning for Large Language Models [81.4] 近年の多目的大言語モデル(LLM)の急激な増加は、より有能な基礎モデルと人間の意図を優先学習によって整合させることに大きく依存している。
本調査では、選好フィードバックのソースとフォーマット、選好信号のモデリングと使用、および、整列 LLM の評価について述べる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:18:33 GMT)
MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.5] モデルマージは、同じトレーニング済みモデルから細調整された複数のシングルタスクモデルをマルチタスクモデルに結合する効果的なアプローチである。
既存のモデルマージ手法は、平均的なタスク精度の向上に重点を置いている。
Amortized Pareto Front (MAP) を用いた新しい低計算アルゴリズム Model Merging を導入する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:24:11 GMT)
How Graph Neural Networks Learn: Lessons from Training Dynamics [80.4] グラフニューラルネットワーク(GNN)の関数空間におけるトレーニングダイナミクスについて検討する。
GNNの勾配勾配勾配最適化は暗黙的にグラフ構造を利用して学習関数を更新する。
この発見は、学習したGNN関数が一般化した時期と理由に関する新たな解釈可能な洞察を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:34:39 GMT)
Beyond Natural Language: LLMs Leveraging Alternative Formats for Enhanced Reasoning and Communication [79.8] 自然言語(NL)は長年、人間の認知とコミュニケーションの主要なフォーマットであった。
本研究では,異なる文脈における非NLフォーマットの有用性を検討することで,NLのデフォルト利用に挑戦する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:06:39 GMT)
Abstraction-of-Thought Makes Language Models Better Reasoners [79.7] AoT(Abstraction-of-Thought)と呼ばれる新しい構造化推論形式を導入する。
AoTのユニークな点は、推論プロセス内での抽象化のさまざまなレベルに対する明示的な要件にある。
提案するAoTコレクションは,AoT推論プロセスを用いた348kの高品質サンプルからなる汎用微調整データセットである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:46:44 GMT)
LSKNet: A Foundation Lightweight Backbone for Remote Sensing [78.3] 本稿では,軽量なLarge Selective Kernel Network (LSKNet) バックボーンを提案する。
LSKNetはその大きな空間受容場を調整し、リモートセンシングシナリオにおける様々なオブジェクトの範囲をモデル化する。
我々の軽量LSKNetは、標準リモートセンシング分類、オブジェクト検出、セマンティックセグメンテーションベンチマークに基づいて、最先端のスコアを設定しています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:08:24 GMT)
A Survey on Large Language Models for Recommendation [77.9] 大規模言語モデル(LLM)は自然言語処理(NLP)の分野で強力なツールとして登場した。
本調査では,これらのモデルを2つの主要なパラダイム(DLLM4Rec)とジェネレーティブLSM4Rec(GLLM4Rec)に分類する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:07:01 GMT)
AutoSurvey: Large Language Models Can Automatically Write Surveys [77.0] 本稿では,総合的な文献調査を自動作成する手法であるAutoSurveyを紹介する。
従来の調査論文は、膨大な量の情報と複雑さのために、課題に直面している。
我々の貢献には、調査問題に対する総合的な解決策、信頼性評価方法、AutoSurveyの有効性を実証する実験的な検証が含まれる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:11:31 GMT)
Extracting Training Data from Unconditional Diffusion Models [76.9] 拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:20:12 GMT)
ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.8] ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:49:41 GMT)
Stealth edits for provably fixing or attacking large language models [76.5] 我々は,大規模言語モデルを編集するための新しい手法と理論基盤を明らかにする。
モデル編集可能性の評価や、悪意のある攻撃に対する感受性を明らかにするために、新しい理論をどのように利用できるかを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:43:18 GMT)
Pride and Prejudice: LLM Amplifies Self-Bias in Self-Refinement [75.7] 大規模言語モデル(LLM)は、特定のタスクの自己フィードバックを通じてパフォーマンスを向上し、他のタスクを劣化させる。
我々は、LSMの自己バイアス(自称世代を好む傾向)を正式に定義する。
我々は、翻訳、制約付きテキスト生成、数学的推論の6つのLCMを解析する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:41:07 GMT)
Taxonomy Completion with Probabilistic Scorer via Box Embedding [75.7] 以前のアプローチでは、ユークリッド空間のベクトルとして概念を組み込んでおり、分類学における非対称関係をモデル化することは困難である。
ボックス内埋め込み空間内に2つの特殊な幾何学的スコアラを設計するために,ボックス封じ込めと中心クローズネスを活用するフレームワークであるTaxBoxを開発した。
これらのスコアラーは挿入操作とアタッチメント操作用に調整されており、概念間の本質的な関係を効果的に捉えることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:20:35 GMT)
Insert or Attach: Taxonomy Completion via Box Embedding [75.7] 以前のアプローチでは、ユークリッド空間のベクトルとして概念を組み込んでおり、分類学における非対称関係をモデル化することは困難である。
ボックス内埋め込み空間内に2つの特殊な幾何学的スコアラを設計するために,ボックス封じ込めと中心クローズネスを活用するフレームワークであるTaxBoxを開発した。
これらのスコアラーは挿入操作とアタッチメント操作用に調整されており、概念間の本質的な関係を効果的に捉えることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:20:35 GMT)
A Survey on In-context Learning [75.4] In-context Learning (ICL) は自然言語処理(NLP)の新しいパラダイムとして登場した。
まず、ICLの形式的定義を示し、関連する研究との相関を明らかにする。
次に、トレーニング戦略、迅速なデザイン戦略、関連する分析を含む高度なテクニックを組織化し、議論する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:19:31 GMT)
Uncertainty-Aware AB3DMOT by Variational 3D Object Detection [74.8] 不確実性推定は統計的に正確な予測を提供する効果的なツールである。
本稿では,変分ニューラルネットワークを用いたTANet 3Dオブジェクト検出器を提案し,不確実性のある3Dオブジェクト検出を行う。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:58:52 GMT)
Adversarial Attacks on Multimodal Agents [74.0] 視覚対応言語モデル(VLM)は、現在、実環境でのアクションを可能にする自律的なマルチモーダルエージェントの構築に使用されている。
攻撃エージェントは、環境への限られたアクセスと知識により、以前の攻撃よりも困難であるにもかかわらず、マルチモーダルエージェントが新たな安全リスクを生じさせることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:32:48 GMT)
OlympicArena: Benchmarking Multi-discipline Cognitive Reasoning for Superintelligent AI [73.8] 我々は,11,163のバイリンガル問題を含む,テキストのみとインターリーブされたテキストイメージのモダリティを紹介する。
これらの課題には、7つのフィールドと62の国際オリンピック大会にわたる幅広い規律が含まれており、データ漏洩について厳格に調査されている。
我々の評価によると、GPT-4oのような先進モデルでさえ、複雑な推論とマルチモーダル統合における現在のAI制限を反映して、全体的な精度は39.97%しか達成していない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:20:53 GMT)
Do LLMs Play Dice? Exploring Probability Distribution Sampling in Large Language Models for Behavioral Simulation [73.6] 人間のシーケンシャルな意思決定過程をエミュレートするエージェントとして、大きな言語モデル(LLM)を採用する研究が増えている。
このことは、確率分布を理解するためにLLMエージェントの容量に関する好奇心を喚起する。
分析の結果, LLM エージェントは確率を理解できるが, 確率サンプリングに苦慮していることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:27:45 GMT)
Fast Rates for Bandit PAC Multiclass Classification [73.2] 我々は,帯域幅フィードバックを用いたマルチクラスPAC学習について検討し,入力を$K$ラベルの1つに分類し,予測されたラベルが正しいか否かに制限する。
我々の主な貢献は、問題の無知な$(varepsilon,delta)$PACバージョンのための新しい学習アルゴリズムを設計することである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:54:04 GMT)
CELA: Cost-Efficient Language Model Alignment for CTR Prediction [71.9] CTR(Click-Through Rate)予測は、レコメンダシステムにおいて最重要位置を占める。
最近の取り組みは、プレトレーニング言語モデル(PLM)を統合することでこれらの課題を緩和しようとしている。
CTR予測のためのtextbfCost-textbfEfficient textbfLanguage Model textbfAlignment (textbfCELA)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:43:12 GMT)
Automatic benchmarking of large multimodal models via iterative experiment programming [71.8] 本稿では,LMMの自動ベンチマークのための最初のフレームワークであるAPExを紹介する。
自然言語で表現された研究の質問に対して、APExは大きな言語モデル(LLM)と事前定義されたツールのライブラリを活用して、手元にあるモデルの一連の実験を生成する。
調査の現在の状況に基づいて、APExはどの実験を行うか、結果が結論を引き出すのに十分かどうかを選択する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:43:46 GMT)
Foundation Models for Time Series Analysis: A Tutorial and Survey [70.4] ファンデーションモデル(FM)は、時系列分析のためのモデル設計のパラダイムを根本的に変えてきた。
本調査は,時系列解析のためのFMの概要を包括的かつ最新のものにすることを目的としている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:10:07 GMT)
Unified Active Retrieval for Retrieval Augmented Generation [69.6] Retrieval-Augmented Generation (RAG)では、検索は必ずしも役に立たない。
既存のアクティブ検索手法は2つの課題に直面している。
彼らは通常、様々な種類の命令を扱うのに苦労する単一の基準に頼っている。
それらは特殊で高度に区別された手順に依存しており、それらを組み合わせることでRAGシステムはより複雑になる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:09:02 GMT)
Challenges to Evaluating the Generalization of Coreference Resolution Models: A Measurement Modeling Perspective [69.5] 本稿では, マルチデータセット評価が, 正確に測定されている要因を混同するリスクについて述べる。
これにより、これらの評価からより一般化可能な結論を引き出すのが難しくなる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:19:36 GMT)
SpatialRGPT: Grounded Spatial Reasoning in Vision Language Model [68.1] VLMの空間知覚と推論能力を高めるために空間領域GPT(SpatialRGPT)を導入する。
推測中、ユーザが指定した領域の提案が提供されると、SpatialRGPTは相対的な方向と距離を正確に知覚できる。
本研究では,空間的推論タスクにおける局所的プロンプトと非局所的プロンプトの双方において,空間的RGPTにより性能が著しく向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:24:46 GMT)
Ask-before-Plan: Proactive Language Agents for Real-World Planning [68.1] プロアクティブエージェントプランニングでは、ユーザエージェントの会話とエージェント環境のインタラクションに基づいて、言語エージェントが明確化のニーズを予測する必要がある。
本稿では,明確化,実行,計画の3つのエージェントからなる新しいマルチエージェントフレームワーク,Clarification-Execution-Planning(textttCEP)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:07:28 GMT)
Getting More from Less: Large Language Models are Good Spontaneous Multilingual Learners [67.9] 大きな言語モデル(LLM)は印象的な言語機能を示している。
本研究では,LLMの自然多言語アライメント改善について検討する。
質問翻訳データ(すなわち注釈付き回答なし)に基づいて学習したLLMは、英語と幅広い言語との整合を促進できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:30:01 GMT)
Structured Prediction in Online Learning [66.4] オンライン学習環境における構造化予測のための理論的・アルゴリズム的枠組みについて検討する。
このアルゴリズムは教師付き学習環境からの最適アルゴリズムの一般化であることを示す。
本稿では,非定常データ分布,特に逆データを含む2番目のアルゴリズムについて考察する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:45:02 GMT)
Can Large Language Models Always Solve Easy Problems if They Can Solve Harder Ones? [65.4] 大きな言語モデル(LLM)は印象的な機能を示しているが、それでも矛盾する問題に悩まされている。
我々はConsisEvalベンチマークを開発し、各エントリは厳密な難易度で2つの質問から構成される。
相対的整合性スコアによる整合性向上の可能性を分析する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:25:47 GMT)
BPO: Supercharging Online Preference Learning by Adhering to the Proximity of Behavior LLM [64.4] 選好からの直接アライメント(DAP)は、事前コンパイルされたオフライン選好データセットからヒトデシダラタに大型言語モデル(LLM)をアライメントするための有望なパラダイムとして登場した。
オンライントレーニングのパワーをフル活用するために、特定のオンラインDAPアルゴリズムを開発する必要性を強調します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:41:40 GMT)
Adaptive Selection for Homogeneous Tools: An Instantiation in the RAG Scenario [62.6] ツール学習に関する現在の研究は、主に様々な選択肢から最も効果的なツールを選択することに焦点を当てており、しばしば費用対効果を見落としている。
本稿では,タスクの達成に必要な性能と関連するコストの両方を予測し,同種ツールの選択に対処する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:24:09 GMT)
Bridging Local Details and Global Context in Text-Attributed Graphs [62.5] GraphBridgeは、コンテキストテキスト情報を活用することで、ローカルおよびグローバルな視点をブリッジするフレームワークである。
提案手法は最先端性能を実現し,グラフ対応トークン削減モジュールは効率を大幅に向上し,スケーラビリティの問題を解消する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:35:25 GMT)
Jump to Conclusions: Short-Cutting Transformers With Linear Transformations [60.4] トランスフォーマーベースの言語モデルは、各層で入力の隠れ表現を生成するが、予測には最終層表現のみを使用する。
これは、モデルの内部決定過程と、その中間表現の有用性を曖昧にする。
線形変換を用いた簡単な鋳造法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:58:27 GMT)
Navigating the Labyrinth: Evaluating and Enhancing LLMs' Ability to Reason About Search Problems [59.7] 我々は,11種類の検索問題を含む新しいベンチマークであるSearchBenchを紹介する。
もっとも先進的なLCMでさえ、これらの問題をエンドツーエンドのテキストで解決することができないことを示す。
LLMにその問題を解決するコードを生成するように指示することは助けになるが、GPT4のパフォーマンスは11.7%向上した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:44:58 GMT)
Voxel Mamba: Group-Free State Space Models for Point Cloud based 3D Object Detection [59.3] 3Dボクセルをシリアライズして複数のシーケンスにグループ化し、トランスフォーマーに入力するシリアライズベースの手法は、3Dオブジェクト検出においてその効果を実証している。
グループフリー戦略を用いて、ボクセルの全空間を1つのシーケンスにシリアライズするVoxel SSMを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:49:56 GMT)
The Heterophilic Snowflake Hypothesis: Training and Empowering GNNs for Heterophilic Graphs [59.0] ヘテロフィリー・スノーフレーク仮説を導入し、ヘテロ親和性グラフの研究をガイドし、促進するための効果的なソリューションを提供する。
観察の結果,我々のフレームワークは多種多様なタスクのための多目的演算子として機能することがわかった。
さまざまなGNNフレームワークに統合することができ、パフォーマンスを詳細に向上し、最適なネットワーク深さを選択するための説明可能なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:16:00 GMT)
Zero-Shot Neural Architecture Search: Challenges, Solutions, and Opportunities [58.7] ゼロショットNASアプローチの背景にある主要な考え方は、ネットワークパラメータを訓練することなく、与えられたネットワークの精度を予測できるプロキシを設計することである。
本稿では,SOTA (State-of-the-art) ゼロショットNASアプローチを総合的にレビューし,比較することを目的とする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:09:26 GMT)
ABNet: Attention BarrierNet for Safe and Scalable Robot Learning [58.5] バリアベースの手法は、安全なロボット学習における主要なアプローチの1つである。
本稿では,より大規模な基本安全モデルを段階的に構築するスケーラブルなAttention BarrierNet(ABNet)を提案する。
2次元ロボット障害物回避、安全なロボット操作、視覚に基づくエンドツーエンド自動運転におけるABNetの強みを実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:37:44 GMT)
The Future of Consumer Edge-AI Computing [58.4] Deep Learningは、主にデバイス間のハードウェアアクセラレーションによって、消費者のエンドに急速に浸透している。
将来を見据えて、孤立したハードウェアが不十分であることは明らかです。
本稿では,コンシューマエッジにおける計算資源とデータアクセスの再編成と最適化を目的とした,EdgeAI-Hubデバイスを中心とした新しいパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:15:55 GMT)
Latent Intuitive Physics: Learning to Transfer Hidden Physics from A 3D Video [58.0] 本稿では,物理シミュレーションのための伝達学習フレームワークである潜在直観物理学を紹介する。
単一の3Dビデオから流体の隠れた性質を推測し、新しいシーンで観察された流体をシミュレートすることができる。
我々は,本モデルの有効性を3つの方法で検証する: (i) 学習されたビジュアルワールド物理を用いた新しいシーンシミュレーション, (ii) 観測された流体力学の将来予測, (iii) 教師付き粒子シミュレーション。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:37:44 GMT)
Exploring and Benchmarking the Planning Capabilities of Large Language Models [57.2] 古典的計画領域と自然言語シナリオの両方を含むベンチマークスイートを構築した。
第2に、LLM計画の強化にICL(In-context Learning)を用いることについて検討し、文脈長の増大と計画性能の向上の直接的な関係について検討する。
第3に、最適計画パスに対する微調整LDMの正の効果と、モデル駆動探索手法の導入の有効性を実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:57:06 GMT)
Evaluating $n$-Gram Novelty of Language Models Using Rusty-DAWG [57.1] 本研究では,現代のLMがトレーニングデータから$n$-gramを生成できる範囲について検討する。
LM生成テキストの新規性を人文テキストと比較する。
より大きなLMとより制約のある復号法はどちらも新規性を低下させる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:31:19 GMT)
Reconfidencing LLMs from the Grouping Loss Perspective [56.8] 大規模言語モデル(LLM)は、自信のある音調で幻覚的な答えを生じさせる可能性がある。
近年の研究では、不確実性制御はキャリブレーションを超えて行わなければならないことが示されている。
そこで我々は,MistralとLLaMAの回答に対する信頼度を評価するために,知識ベースから導出した新しい評価データセットを構築した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:31:56 GMT)
Order-Optimal Instance-Dependent Bounds for Offline Reinforcement Learning with Preference Feedback [56.7] 我々は、暗黙の報酬が未知パラメータの線形関数である、好みフィードバックによるオフライン強化学習について検討する。
そこで我々は,UnderlineLocally Underline Underline Weights あるいは sc RL-LOW を用いたアルゴリズムを提案する。
我々は,sc RL-LOWの次数次最適性を示すため,単純な後悔マッチングの指数において,下限と上限が順序的に一致することが観察された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:03:12 GMT)
Immiscible Diffusion: Accelerating Diffusion Training with Noise Assignment [56.6] 現在の方法では、各画像がノイズ空間全体に拡散し、ノイズ層内の各点で全ての画像が混合される。
Inmiscible Diffusionを提案する。これはノイズデータマッピングのランダムな混合を改善するためのシンプルで効果的な方法である。
我々のアプローチは極めて単純で、各画像の拡散可能な領域を制限するために1行のコードしか必要としない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:20:42 GMT)
VoCo-LLaMA: Towards Vision Compression with Large Language Models [56.2] VLM(Vision-Language Models)は、様々なマルチモーダルタスクにおいて顕著な成功を収めている。
LLMを用いて視覚トークンを圧縮する最初の方法であるVoCo-LLaMAを提案する。
提案手法は, 576$times$の圧縮比で最小性能損失を達成し, 最大94.8$%のFLOPと69.6$%の高速化を実現した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:05:12 GMT)
Transformers Can Represent $n$-gram Language Models [56.1] 本稿では,言語モデルの単純かつ歴史的なクラスであるトランスフォーマーLMと$n$-gram LMの関係に注目した。
ハードまたはスパースアテンション機構を用いたトランスフォーマーLMは,任意の$n$-gram LMを正確に表現できることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:08:24 GMT)
Embodied Question Answering via Multi-LLM Systems [55.6] EQA(Embodied Question Answering)は,ユーザの質問に答える環境を探索するエージェントが関与する重要な問題である。
本研究では,複数の大規模言語モデル(LLM)をベースとしたエージェントが家庭環境に関する質問に独立して答えるマルチエージェントフレームワークとして,EQAを考察する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:18:46 GMT)
Quantum Compiling with Reinforcement Learning on a Superconducting Processor [55.1] 超伝導プロセッサのための強化学習型量子コンパイラを開発した。
短絡の新規・ハードウェア対応回路の発見能力を示す。
本研究は,効率的な量子コンパイルのためのハードウェアによるソフトウェア設計を実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:49:48 GMT)
Influence Maximization via Graph Neural Bandits [54.5] IM問題を多ラウンド拡散キャンペーンに設定し,影響を受けやすいユーザ数を最大化することを目的とした。
IM-GNB(Influence Maximization with Graph Neural Bandits)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:54:33 GMT)
Event3DGS: Event-Based 3D Gaussian Splatting for High-Speed Robot Egomotion [54.2] Event3DGSは高速移動下で高忠実度3D構造と外観を再構築することができる。
複数の合成および実世界のデータセットの実験は、既存のイベントベースの高密度な3Dシーン再構築フレームワークと比較して、Event3DGSの優位性を示している。
また, 構造的精度を損なうことなく, 外観の忠実度をより高められるように, フレームベースで数回の動特性測定を再構成プロセスに組み込むことも可能である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:06:14 GMT)
ChatLog: Carefully Evaluating the Evolution of ChatGPT Across Time [54.2] ChatGPTは大きな成功をおさめ、インフラ的な地位を得たと考えられる。
既存のベンチマークでは,(1)周期的評価の無視,(2)きめ細かい特徴の欠如という2つの課題に直面する。
2023年3月から現在まで,21のNLPベンチマークに対して,さまざまな長文ChatGPT応答を大規模に記録した常時更新データセットであるChatLogを構築している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:33:25 GMT)
AITTI: Learning Adaptive Inclusive Token for Text-to-Image Generation [53.7] 我々は適応的包摂トークンを学習し、最終的な生成出力の属性分布をシフトする。
本手法では,明示的な属性仕様やバイアス分布の事前知識は必要としない。
提案手法は,特定の属性を要求されたり,生成の方向を編集するモデルに匹敵する性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:22:23 GMT)
Edge Classification on Graphs: New Directions in Topological Imbalance [53.4] 異なるクラスにまたがるエッジの歪んだ分布から生じる新しいトポロジカル不均衡問題」を同定する。
本稿では,各エッジのトポロジ的不均衡を測定する新しいトポロジ的指標であるトポロジカルエントロピー(TE)を紹介する。
TEをベースとした(合成)エッジのトレーニングに重点を置くため、トポロジカルリウェイトリングとTEウェッジベースのMixupという2つの戦略を開発した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:49:25 GMT)
ALEXR: An Optimal Single-Loop Algorithm for Convex Finite-Sum Coupled Compositional Stochastic Optimization [53.1] ALEXRと呼ばれる,効率的な単ループプリマルデュアルブロックコーディネートアルゴリズムを提案する。
本研究では, ALEXR の凸面および強凸面の収束速度を滑らか性および非滑らか性条件下で確立する。
本稿では,ALEXRの収束速度が,検討されたcFCCO問題に対する1次ブロック座標アルゴリズムの中で最適であることを示すために,より低い複雑性境界を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:31:08 GMT)
Learning to Extract Structured Entities Using Language Models [52.3] 機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、より多くの洞察を提供するさまざまなメトリクスの使用を可能にします。
本稿では,言語モデル(LM)のパワーを活用し,効率と効率を向上させる新しいモデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:11:27 GMT)
TSI-Bench: Benchmarking Time Series Imputation [52.3] TSI-Benchは、ディープラーニング技術を利用した時系列計算のための総合ベンチマークスイートである。
TSI-Benchパイプラインは、実験的な設定を標準化し、計算アルゴリズムの公平な評価を可能にする。
TSI-Benchは、計算目的のために時系列予測アルゴリズムを調整するための体系的なパラダイムを革新的に提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:07:33 GMT)
A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.8] 水中画像強調(UIE)はコンピュータビジョンの分野で難しい研究課題である。
何百ものUIEアルゴリズムが提案されているが、包括的で体系的なレビューはまだ不足している。
我々は、ベンチマークデータセット上で最先端のアルゴリズムを定量的に定性的に評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:07:41 GMT)
MeshXL: Neural Coordinate Field for Generative 3D Foundation Models [51.2] 本稿では,現代の大規模言語モデルを用いた3次元メッシュ生成のプロセスに対処する,事前学習型自己回帰モデルの生成ファミリを提案する。
MeshXLは高品質な3Dメッシュを生成することができ、さまざまなダウンストリームアプリケーションの基盤モデルとしても機能する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:03:10 GMT)
Improving Text-To-Audio Models with Synthetic Captions [51.2] 本研究では,テクスタイディオ言語モデルを用いて,高精度で多様な音声キャプションを大規模に合成する音声キャプションパイプラインを提案する。
このパイプラインを利用してAudioSetと命名されたAudioSetの合成キャプションのデータセットを作成し、これらの合成キャプション上でのテキスト音声モデルの事前学習の利点を評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:02:15 GMT)
ViDSOD-100: A New Dataset and a Baseline Model for RGB-D Video Salient Object Detection [51.2] まず、注釈付きRGB-D video SODOD(DSOD-100)データセットを収集し、合計9,362フレーム内に100の動画を含む。
各ビデオのフレームはすべて、高品質なサリエンシアノテーションに手動で注釈付けされる。
本稿では,RGB-Dサリアンオブジェクト検出のための新しいベースラインモデル,attentive triple-fusion network (ATF-Net)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:09:43 GMT)
AI-Assisted Human Evaluation of Machine Translation [51.1] 我々の研究では、自動品質推定でスパンアノテーションをプリフィルすることでアノテーションを補助します。
AIアシストによって、アノテーションごとの時間を半分に削減しながら、より詳細なアノテーションが得られます。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:12:11 GMT)
HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.6] そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:11:07 GMT)
PruningBench: A Comprehensive Benchmark of Structural Pruning [50.2] PruningBenchは、構造的プルーニングのための最初の包括的なベンチマークである。
多様な構造的刈り取り技術の有効性を評価するために、統一的で一貫したフレームワークを採用している。
将来のプルーニングメソッドの実装を容易にするために、簡単に実装可能なインターフェイスを提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:37:26 GMT)
On Efficiently Representing Regular Languages as RNNs [49.9] RNNは、人間の言語で広く使われている有界階層構造を効率的に表現できることを示す。
これは、RNNの成功が階層をモデル化する能力と結びついていることを示唆している。
我々は,RNNが従来主張していたより大規模なLMを効率的に表現できることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:14:18 GMT)
Incentive-Aware Recommender Systems in Two-Sided Markets [49.7] 最適性能を達成しつつエージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。
我々のフレームワークは、このインセンティブを意識したシステムを、両側市場におけるマルチエージェントバンディット問題としてモデル化する。
どちらのアルゴリズムも、エージェントが過剰な露出から保護する、ポストフェアネス基準を満たす。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:45:41 GMT)
GW-MoE: Resolving Uncertainty in MoE Router with Global Workspace Theory [49.5] モデルのスケールアップに有効な方法として,Mixture-of-Experts (MoE) が実証されている。
本稿では,この問題に対処する新しい微調整手法GW-MoEを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:03:51 GMT)
Memorization in Self-Supervised Learning Improves Downstream Generalization [49.4] 自己教師付き学習(SSL)は、ラベルのないデータで純粋に高性能エンコーダを訓練する能力により、最近大きな注目を集めている。
SSL内での暗記を定義するためのフレームワークであるSSLMemを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:49:32 GMT)
PANDA: Preference Adaptation for Enhancing Domain-Specific Abilities of LLMs [49.3] 大規模言語モデルは、しばしばドメイン固有の最先端モデルによって達成されるパフォーマンスに欠ける。
LLMのドメイン固有の機能を強化する1つの潜在的アプローチは、対応するデータセットを使用してそれらを微調整することである。
LLM(PANDA)のドメイン固有能力を高めるための優先度適応法を提案する。
実験の結果,PANDA はテキスト分類や対話型意思決定タスクにおいて LLM のドメイン固有性を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:08:37 GMT)
Multimer states in multilevel waveguide QED [49.2] 導波路に結合した有限周期原子配列における自発放出の相互作用と準定常固有状態の相互作用を理論的に研究する。
計算の結果,原子ポテンシャルの非調和性によって引き起こされる特異な多重化効果が明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:27:41 GMT)
Measuring Psychological Depth in Language Models [48.9] 本稿では,文学理論に根ざした新たな枠組みである心理的深度尺度(PDS)を紹介する。
PDS(0.72 クリッペンドルフのα)に基づいて人間が一貫して物語を評価できることを示し、我々の枠組みを実証的に検証する。
驚いたことに、GPT-4のストーリーはRedditから入手した高評価の人文記事と統計的に区別できない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:51:54 GMT)
Equivariance via Minimal Frame Averaging for More Symmetries and Efficiency [48.8] 最小フレーム平均化(Minimum Frame Averaging、MFA)は、証明可能な最小限のフレームを構築するための数学的フレームワークである。
その結果, 多様なタスクにまたがって, MFAによる対称性の符号化の有効性と効果が示された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:37:05 GMT)
Evaluating Transparency of Machine Generated Fact Checking Explanations [48.8] 本研究では,大規模言語モデルを用いた説明生成における人間計算と機械選択による証拠の影響について検討する。
驚いたことに、機械選択された証拠を用いて、大きな言語モデルが類似またはより高品質な説明を生成することがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:13:13 GMT)
Scalable and Flexible Causal Discovery with an Efficient Test for Adjacency [48.8] 因果グラフに2つの変数が隣接しているかどうかを評価するために,スケーラブルで柔軟な手法を構築した。
微分可能隣接テストは指数関数的な数のテストを、証明可能な等価な緩和問題に置き換える。
DAT, DAT-Graphに基づくグラフ学習手法も構築し, 介入したデータから学習する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:52:29 GMT)
Large Language Models Are Zero-Shot Time Series Forecasters [48.7] 時系列を数値桁の列として符号化することにより、テキストの次トーケン予測として時系列予測をフレーム化することができる。
GPT-3 や LLaMA-2 のような大規模言語モデル (LLM) は、ダウンストリームタスクでトレーニングされた目的構築された時系列モデルの性能に匹敵する、あるいはそれ以上のレベルにおいて、驚くほどゼロショット・エクスポレート・時系列を生成できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:48:38 GMT)
Offline Imitation Learning with Model-based Reverse Augmentation [48.6] 本稿では,自己ペースの逆拡張によるオフラインImitation Learningという,新しいモデルベースフレームワークを提案する。
具体的には、オフラインのデモからリバース・ダイナミック・モデルを構築し、専門家が観察した状態につながる軌道を効率的に生成する。
後続の強化学習法を用いて,拡張軌道から学習し,未観測状態から未観測状態へ移行する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:27:02 GMT)
A Hopfieldian View-based Interpretation for Chain-of-Thought Reasoning [48.5] CoT(Chain-of-Thought)は、大規模言語モデルの推論性能を高める上で重要な位置を占めている。
本稿では,CoTの精度を制御するためのリード・アンド・コントロル手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:07:13 GMT)
MAGNOLIA: Matching Algorithms via GNNs for Online Value-to-go Approximation [48.3] 問題に複雑な最適オンラインアルゴリズムをエミュレートするグラフニューラルネットワーク(GNN)を導入する。
我々は、このGNNが様々なタスクにまたがってハイウェイトマッチングを返すことを実証的に示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:06:04 GMT)
Assistive Large Language Model Agents for Socially-Aware Negotiation Dialogues [48.0] 我々はLarge Language Models(LLM)に基づく支援エージェントを開発する。
2つのLLMエージェントをロールプレイに参加させることで、ビジネス交渉をシミュレートする。
第3のLLMは、交渉結果を改善するための基準に違反した発話を書き換える仲介役として機能する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:10:16 GMT)
HumanSplat: Generalizable Single-Image Human Gaussian Splatting with Structure Priors [47.6] HumanSplatは、単一の入力画像から、任意の人間の3次元ガウススプティング特性を予測する。
HumanSplatは、フォトリアリスティックなノベルビュー合成を実現するために、既存の最先端の手法を超越している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:05:33 GMT)
Silent Signals, Loud Impact: LLMs for Word-Sense Disambiguation of Coded Dog Whistles [47.6] 犬の笛は、特定の聴衆に二次的な意味を持ち、しばしば人種的・社会経済的差別のために武器化された符号化通信の一種である。
本稿では,Large Language Models (LLMs) を用いた標準音声からの犬笛の単語センスの曖昧化手法を提案する。
我々はこの手法を利用して、フォーマルで非公式なコミュニケーションに使用される犬の口笛の16,550個の高信頼符号化されたサンプルのデータセットを作成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:11:11 GMT)
Lower Bounds on the Expressivity of Recurrent Neural Language Models [47.5] ニューラルLMの表現能力の研究は、形式言語を認識できる能力に主に焦点を絞っている。
本稿では, RNN LM の表現能力について, 線形有界精度を持つ RNN LM が任意の正則な LM を表現可能であることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:42:32 GMT)
On-Policy Fine-grained Knowledge Feedback for Hallucination Mitigation [47.5] 幻覚は、大きな言語モデルが応答生成プロセス中に知識の境界から逸脱する振る舞いを示すときに起こる。
従来の学習ベースの手法は、知識境界の検出とインスタンスレベルのフィードバックによるモデル微調整に重点を置いている。
幻覚軽減のための詳細なフィードバックに基づくオンライン強化学習手法である RLFH を紹介する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:43:49 GMT)
Self-Control of LLM Behaviors by Compressing Suffix Gradient into Prefix Controller [47.4] Self-Controlは、人間の明示的なアノテーションを使わずに、大規模言語モデル(LLM)の振る舞いを制御する新しい方法である。
自己制御は、モデルの隠された状態に関するモデルの自己判断の勾配を計算する。
実験では、感情変調、無害性の確保、複雑な推論の強化など、複数の領域にまたがる自己制御の有効性を実証した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:58:38 GMT)
Augmenting Biomedical Named Entity Recognition with General-domain Resources [47.2] ニューラルネットワークに基づくバイオメディカル名前付きエンティティ認識(BioNER)モデルのトレーニングは通常、広範囲でコストのかかる人的アノテーションを必要とする。
GERBERAは、一般ドメインのNERデータセットをトレーニングに利用した、単純なyet効率の手法である。
我々は,81,410インスタンスからなる8つのエンティティタイプの5つのデータセットに対して,GERBERAを体系的に評価した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:33:39 GMT)
Update Selective Parameters: Federated Machine Unlearning Based on Model Explanation [46.9] モデル説明の概念に基づく、より効率的で効率的なフェデレーション・アンラーニング・スキームを提案する。
我々は、未学習のデータに対して、すでに訓練済みのモデルの中で最も影響力のあるチャネルを選択します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:43:20 GMT)
BEV-TSR: Text-Scene Retrieval in BEV Space for Autonomous Driving [46.8] 本稿では,BEV-TSRフレームワークを提案する。BEV-TSRフレームワークは,バードアイビュー空間内の対応するシーンを検索するために,記述テキストを入力として利用する。
我々は,大言語モデル(LLM)を用いてテキスト入力の意味的特徴を抽出し,知識グラフの埋め込みを取り入れ,言語埋め込みの意味的豊かさを高める。
マルチレベルnuScenes-Retrievalの実験結果によると、BEV-TSRは、例えば85.78%と87.66%のトップ1の精度をシーン・トゥ・テキスト・ツー・シーンで達成している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:20:51 GMT)
Learning Discriminative Features for Crowd Counting [46.8] 群集カウントのための学習識別機能フレームワークを提案する。
このフレームワークは、マスク付き特徴予測モジュールと、教師付き画素レベルのコントラスト学習モジュールとから構成される。
提案したモジュールは、クラウドカウントやオブジェクト検出など、様々なコンピュータビジョンタスクにおいて有用である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:50:34 GMT)
What If We Recaption Billions of Web Images with LLaMA-3? [46.2] 我々はLLaMA-3搭載のLLaVA-1.5を微調整し、DataComp-1Bデータセットから13億枚の画像を取得する。
この拡張データセットであるRecap-DataComp-1Bは、先進的な視覚言語モデルのトレーニングにおいて大きなメリットがあることを確認した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:47:26 GMT)
Unique Security and Privacy Threats of Large Language Model: A Comprehensive Survey [46.2] 大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
これらのモデルは、強力な言語理解と生成能力を示すために、広大なデータセットでトレーニングされている。
プライバシーとセキュリティの問題は、そのライフサイクルを通じて明らかになっている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:37:06 GMT)
Benchmarking Zero-Shot Recognition with Vision-Language Models: Challenges on Granularity and Specificity [45.9] 本稿では,ゼロショット認識における視覚言語モデル(VLM)の評価のための新しいベンチマークを提案する。
我々のベンチマークは、意味的粒度レベルにおける概念理解におけるVLMの一貫性と、テキストの特異性に対する応答を検証した。
発見によると、VLMは微粒な概念を適度に好み、特異性に苦しむ。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:12:47 GMT)
LLM4MSR: An LLM-Enhanced Paradigm for Multi-Scenario Recommendation [45.3] 本稿では,LLM 拡張パラダイム LLM4MSR を提案する。
具体的には,まず LLM を利用してシナリオ相関やユーザ間の関心事など多段階の知識を明らかにする。
KuaiSAR-small、KuaiSAR、およびAmazonデータセットに関する我々の実験は、LLM4MSRの2つの重要な利点を検証した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:59:36 GMT)
Rapid Language Adaptation for Multilingual E2E Speech Recognition Using Encoder Prompting [45.2] 自己条件CTCフレームワーク内にエンコーダプロンプト技術を導入し、ゼロショット方式でCTCモデルの言語固有の適応を可能にする。
提案手法は,低リソース言語では平均28%,低リソース言語では41%の誤差を著しく低減することを示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:38:58 GMT)
Finding Task-specific Subnetworks in Multi-task Spoken Language Understanding Model [45.2] ニューラルネットワークプルーニングによるマルチタスク音声言語理解モデルにおけるタスク特定作業の探索を提案する。
プレナードモデルでは,以前トレーニングしたタスクの性能劣化を最小限に抑えつつ,追加のASRやICデータに適応することに成功した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:39:41 GMT)
The Fermionic Entanglement Entropy and Area Law for the Relativistic Dirac Vacuum State [45.0] ミンコフスキー時空の有界空間領域における自由ディラック場に対するフェルミオンエンタングルメントエントロピーを考える。
領域法則は、体積が無限大に近づき、正規化の長さが0になるような制限の場合において証明される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:36:37 GMT)
Problem-Solving in Language Model Networks [45.0] この研究は、マルチエージェント論争の概念をより一般的なネットワークトポロジに拡張する。
質問応答の正確さ、影響、コンセンサス、および集団に対する偏見の影響を測定する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:59:14 GMT)
DetectBench: Can Large Language Model Detect and Piece Together Implicit Evidence? [44.6] 本稿では,長いコンテキスト内で暗黙的な証拠を検出し,まとめる能力を検証するために,DeuterBenchというベンチマークを提案する。
ベンチマークには3,928の多重選択質問が含まれており、平均的なトークンは1問あたり944である。
各質問には平均4.55個の暗黙の証拠が含まれており、解法は正しい解を見つけるためには7.62個の論理ジャンプが必要である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:08:01 GMT)
DrVideo: Document Retrieval Based Long Video Understanding [44.3] DrVideoは、長いビデオ理解のために設計されたドキュメント検索ベースのシステムである。
長いビデオをテキストベースの長いドキュメントに変換して、キーフレームを検索し、これらのフレームの情報を増やす。
その後、エージェントベースの反復ループを使用して、欠落した情報を継続的に検索し、関連するデータを拡大し、最終的な予測を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:59:03 GMT)
CompA: Addressing the Gap in Compositional Reasoning in Audio-Language Models [44.1] 提案するCompAは,実世界の音声サンプルの大部分を収録した,専門家による2つのベンチマークのコレクションである。
まず,現在のALMはランダムな確率よりもわずかに優れた性能を示し,構成的推論に苦しむことを示す。
次に,新しい学習法を用いてCLAPを微調整し,合成推論能力を向上させるCompA-CLAPを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:03:28 GMT)
From Complex to Simple: Enhancing Multi-Constraint Complex Instruction Following Ability of Large Language Models [43.9] 複雑な制約の強化に有効なトレーニングデータについて検討する。
複数の制約を含む命令でLLMを訓練することで、複雑な命令の理解が促進されることが判明した。
提案手法は,汎用的な命令に従うモデルの能力を向上し,ドメイン外,ドメイン内,対向的な設定で効果的に一般化する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:16:36 GMT)
Efficient and Long-Tailed Generalization for Pre-trained Vision-Language Model [43.7] そこで本研究では,Candleと呼ばれる,効率的かつ長期にわたる一般化を実現するための新しいフレームワークを提案する。
Candleは11の多様なデータセットに関する広範な実験を通じて、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:07:13 GMT)
Identifying and Mitigating Privacy Risks Stemming from Language Models: A Survey [43.1] 大規模言語モデル(LLM)は,近年,大規模化と広範囲なトレーニングデータによるパフォーマンス向上を図っている。
機械学習モデルのトレーニングデータ記憶は、特にLLMに関して、モデルサイズに合わせてスケールする。
記憶されたテキストシーケンスは、LSMから直接リークされる可能性があり、データのプライバシに深刻な脅威をもたらす。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:14:34 GMT)
AGLA: Mitigating Object Hallucinations in Large Vision-Language Models with Assembly of Global and Local Attention [42.9] LVLM(Large Vision-Language Models)は、物体の幻覚に関する一般的な問題に直面している。
本稿では, 種々のLVLMについて検討し, 物体幻覚の根本原因としての識別的局所像の特徴に着目した。
我々は,物体の幻覚を緩和する訓練不要でプラグアンドプレイなアプローチである,グローバル・ローカル・アテンションのアセンブリー(AGLA)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:38:41 GMT)
A Video is Worth 256 Bases: Spatial-Temporal Expectation-Maximization Inversion for Zero-Shot Video Editing [42.7] ビデオ編集法は通常、通常の2D DDIMインバージョンや、編集前のナイーブな時空間 DDIMインバージョンを適用する。
本稿では,STEM(Spatial-Temporal expectation-Maximization)インバージョンを提案する。
我々の逆転は、2つの最先端のビデオ編集方法において一貫した改善を達成できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:47:29 GMT)
High-Resolution Document Shadow Removal via A Large-Scale Real-World Dataset and A Frequency-Aware Shadow Erasing Net [42.3] ドキュメントをカジュアルな機器でキャプチャすると、シャドウが発生することが多い。
自然なシャドウ除去のアルゴリズムとは異なり、文書シャドウ除去のアルゴリズムはフォントや数字の詳細を高精細な入力で保存する必要がある。
より大規模な実世界のデータセットと、慎重に設計された周波数対応ネットワークを介して、高解像度のドキュメントシャドウ除去を処理します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:13:00 GMT)
Causal Discovery Inspired Unsupervised Domain Adaptation for Emotion-Cause Pair Extraction [42.3] 本稿では、教師なし領域適応設定における感情原因ペア抽出の課題に取り組む。
因果発見に触発されて、変分オートエンコーダフレームワークにおける新しい潜伏モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:01:30 GMT)
Long-range interactions in Weyl dense atomic arrays protected from dissipation and disorder [41.9] 長距離相互作用は多くの量子現象や技術において重要な資源である。
これらの原子性メタマテリアルの分極性バンドを設計して、周波数分離されたワイル点の対を特徴付ける方法を示す。
これらのワイル励起は、その隙間のない性質により同時に長距離である相互作用、ワイル点の位相的保護によるロバストな相互作用、そしてそれらの部分ラジアン性により非コヒーレンスのない相互作用を仲介することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:15:16 GMT)
Multi-Sender Persuasion: A Computational Perspective [41.9] マルチベンダーの説得問題を考察する。
計算経済学、マルチエージェント学習、機械学習で広く使われている。
我々は,このゲームの非線形かつ不連続なユーティリティを近似するために,新しい微分可能なニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:37:14 GMT)
GeoBench: Benchmarking and Analyzing Monocular Geometry Estimation Models [41.8] 識別的および生成的事前学習により、強力な一般化能力を持つ幾何推定モデルが得られた。
幾何推定モデルの評価と解析のための,公平で強力なベースラインを構築した。
多様なシーンと高品質なアノテーションを用いた幾何推定タスクにおいて,より困難なベンチマークを用いて,単色幾何推定器の評価を行った。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:44:12 GMT)
VRSBench: A Versatile Vision-Language Benchmark Dataset for Remote Sensing Image Understanding [41.7] 本稿では、VRSBenchと呼ばれるリモートセンシング画像理解のためのVersatile視覚言語ベンチマークを提案する。
このベンチマークは29,614枚の画像と29,614個の人間認証された詳細なキャプション、52,472個のオブジェクト参照、123,221個の質問応答ペアで構成されている。
さらに,画像キャプション,視覚的グラウンド,視覚的質問応答という3つの視覚言語課題に対して,このベンチマークの最先端モデルについて検討した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:15:21 GMT)
MM-SafetyBench: A Benchmark for Safety Evaluation of Multimodal Large Language Models [41.7] 我々は,Multimodal Large Language Models (MLLM) がクエリ関連画像によって容易に損なわれることを観察した。
画像ベース操作に対するMLLMの安全性クリティカルな評価を行うためのフレームワークであるMM-SafetyBenchを紹介する。
我々の研究は、潜在的に悪意のある悪用に対して、オープンソースのMLLMの安全性対策を強化し、強化するための協力的な努力の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:16:56 GMT)
GroPrompt: Efficient Grounded Prompting and Adaptation for Referring Video Object Segmentation [41.7] Referring Video Object (RVOS) は、ビデオ全体を通してクエリ文によって参照されるオブジェクトをセグメント化することを目的としている。
本稿では,テキスト・アウェア・プロンプト・コントラスト・ラーニング(TAP-CL)を提案する。
提案したTAP-CLにより、GroPromptフレームワークは時間一貫性はあるがテキスト対応の位置プロンプトを生成することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:54:17 GMT)
MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation [41.3] 心電図(Electrocardiogram、ECG)は、心臓の状態をモニタリングするための主要な非侵襲的診断ツールである。
最近の研究は心電図データを用いた心臓状態の分類に集中しているが、心電図レポートの生成は見落としている。
LLMとマルチモーダル命令を用いてECGレポート生成に取り組む最初の試みであるMultimodal ECG Instruction Tuning (MEIT) フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:15:09 GMT)
More Efficient Randomized Exploration for Reinforcement Learning via Approximate Sampling [41.2] 最近提案されたFeel-Good Thompson Sampling (FGTS) アプローチを用いて,様々な近似サンプリング手法を組み込んだアルゴリズムフレームワークを提案する。
我々の後悔分析は、既存のランダム化アルゴリズムを超越した次元性への後悔の最もよく知られた依存性をもたらす。
我々のアルゴリズムは、RLの深い文献から得られる他の強いベースラインに匹敵する、あるいは同等の性能を達成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:32:10 GMT)
Enhancing Diagnostic Reliability of Foundation Model with Uncertainty Estimation in OCT Images [41.0] 光コヒーレンストモグラフィー(OCT)における11個の網膜状態を検出するために,不確実性推定(FMUE)を用いた基礎モデルを開発した。
FMUEは2つの最先端アルゴリズムであるRETFoundとUIOSよりも96.76%高いF1スコアを獲得し、しきい値戦略を98.44%に改善した。
我々のモデルは、F1スコアが高い2人の眼科医(95.17%対61.93% &71.72%)より優れている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:04:52 GMT)
The Limits of Pure Exploration in POMDPs: When the Observation Entropy is Enough [40.8] そこで本研究では,観測上のエントロピーを最大化するための簡単なアプローチについて検討する。
観測エントロピーの正規化を計算し、原理的性能を向上させるために、後者の知識をどのように活用できるかを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:00:13 GMT)
Adaptive Token Biaser: Knowledge Editing via Biasing Key Entities [40.8] ATBiasはICEを強化するために設計された新しいデコード技術である。
ATBiasはICEのパフォーマンスを大幅に向上させ、最先端のICEメソッドよりも最大32.3%向上した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:18:06 GMT)
Evolving AI Collectives to Enhance Human Diversity and Enable Self-Regulation [40.8] 大きな言語モデルの振る舞いは、相互作用する言語の言語によって形作られます。
この能力とその増加傾向は、意図的または意図的に相互に「プログラム」する、というオンラインポータビリティを増大させます。
我々は、AIのクロスモーダル化の機会について議論し、自由なAI集団の作成と維持に関連する倫理的問題と設計上の課題に対処する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:28:46 GMT)
Nash CoT: Multi-Path Inference with Preference Equilibrium [40.5] 大型言語モデル(LLM)の推論能力を高めるための強力な技術として、チェーン・オブ・シント(CoT)プロンプトが登場した。
我々は、シンボリック言語デコーディングを優先コンセンサスゲームとして概念化し、各ローカルパス内にバイプレイヤゲームシステムを構築し、ナッシュチェーン・オブ・ソート(ナッシュCoT)を紹介した。
我々は,アラビア推論,コモンセンス質問応答,推論など,さまざまな推論タスクにおいて,推論パスを減らしながら,自己整合性と比較して同等あるいは改善された性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:46:13 GMT)
Enhancing Zero-Shot Facial Expression Recognition by LLM Knowledge Transfer [40.5] 大規模言語モデル(LLM)からタスク知識を伝達することにより、ゼロショットFERを向上させる新しい手法Exp-CLIPを提案する。
具体的には、事前訓練された視覚言語エンコーダに基づいて、初期共同視覚言語空間を顔行動の表現をキャプチャする空間にマッピングするプロジェクションヘッドを組み込む。
衝突しない顔データから、Exp-CLIPは、7つの範囲のFERデータセット上でCLIPモデルや他のいくつかの大きなビジョン言語モデル(LVLM)よりも優れたゼロショット結果を達成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:30:13 GMT)
AIM: Attributing, Interpreting, Mitigating Data Unfairness [40.4] 既存の公正機械学習(FairML)の研究は、モデル予測における差別バイアスの軽減に重点を置いている。
トレーニングデータからバイアスや偏見を反映したサンプルの発見という,新たな研究課題について検討する。
サンプルバイアスの測定と対策のための実用的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:02:45 GMT)
Interpretable Catastrophic Forgetting of Large Language Model Fine-tuning via Instruction Vector [39.8] 微調整された大きな言語モデルは、一般的な能力を失う可能性がある。
本稿では,そのような忘れ物の背後にある本質的なメカニズムについて考察する。
我々は,原図の保存を目的としたIV誘導学習を開発し,破滅的な忘れを緩和する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:05:08 GMT)
Autonomous navigation of catheters and guidewires in mechanical thrombectomy using inverse reinforcement learning [39.7] カテーテルとガイドワイヤの自律ナビゲーションは、血管内手術の安全性と効果を高め、手術時間と手術者の放射線被曝を減少させる。
本研究では,RTL (Inverse RL) を用いたMT血管内自律ナビゲーションの実現可能性について検討した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:00:55 GMT)
Formal-LLM: Integrating Formal Language and Natural Language for Controllable LLM-based Agents [39.5] 大規模言語モデル(LLM)により、AIエージェントは複雑なタスクを解決するためのマルチステッププランを自動的に生成し実行することができる。
しかし、現在のLLMベースのエージェントは、しばしば無効または実行不可能な計画を生成する。
本稿では,自然言語の表現性と形式言語の精度を統合することで,LLMをベースとしたエージェントのための新しいフォーマルLLM'フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:44:03 GMT)
Hopping Too Late: Exploring the Limitations of Large Language Models on Multi-Hop Queries [39.4] 大規模言語モデル(LLM)が複雑な多段階問題をいかに解決するかを考察する。
我々は、潜在ステップが内部でどのように計算されるかを理解することが、全体的な計算を理解する上で重要であることを発見した。
後層からの隠れ表現を以前の層にパッチバックする「バックパッチ」解析手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:44:13 GMT)
TroL: Traversal of Layers for Large Language and Vision Models [39.3] 大言語とビジョンモデル(LLVM)は、大言語モデル(LLM)の一般化力によって駆動されている。
GPT-4VのようなクローズドソースLLVMと互換性のある既存のオープンソースLLVMは、大きすぎると考えられていることが多い。
1.8B, 3.8B, 7B LLMモデルサイズ, Traversal of Layers (TroL) を持つLLVMファミリーを新たに提案する。
我々は、TroLが単純な層トラバースアプローチを採用しているが、より大きなモデルサイズを持つオープンソースのLLVMよりも効率的に性能を向上することを示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:42:00 GMT)
CodeNav: Beyond tool-use to using real-world codebases with LLM agents [38.6] ユーザクエリを解決するために、これまで見つからなかったコードリポジトリをナビゲートし、活用するLLMエージェントであるCodeNavを提示する。
CodeNavは自動的にターゲットのコードブロックをインデックスし、検索する。
関連するコードスニペットを見つけ、インポートし、実行フィードバックを伴うソリューションを反復的に生成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:10:38 GMT)
A Generic Method for Fine-grained Category Discovery in Natural Language Texts [38.3] そこで本研究では,新たな目的関数によって導かれる意味的類似テキストの微細なクラスタをうまく検出する手法を提案する。
この方法は対数空間における意味的類似性を利用してユークリッド空間のサンプル分布を導く。
また,リアルタイムアプリケーションをサポートするセントロイド推論機構を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:27:46 GMT)
Jailbreaking Leading Safety-Aligned LLMs with Simple Adaptive Attacks [38.3] 近年のLLMでさえ、単純な適応型ジェイルブレイク攻撃に対して堅牢ではないことが示されている。
我々は,Vicuna-13B,Mistral-7B,Phi-3-Mini,Nemotron-4-340B,Llama-2-Chat-7B/13B/70B,Llama-3-Instruct-8B,Gemma- 7B,GPT-3.5,GPT-4,R2D2の攻撃成功率の約100%を達成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:29:04 GMT)
Cross-Lingual Unlearning of Selective Knowledge in Multilingual Language Models [38.1] 事前訓練された言語モデルは、プライベートデータや著作権データを含む膨大な量の情報を記憶し、重大な安全上の懸念を提起する。
センシティブなデータを除いた後、これらのモデルをリトレーニングすることは違法に高価であり、機械学習は実用的で費用対効果の高い代替手段となる。
本稿では,多言語モデルにおける機械学習の先駆的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:40:18 GMT)
Why is plausibility surprisingly problematic as an XAI criterion? [38.0] われわれは,XAIの共通基準である妥当性を初めて批判的に検討する。
それは、AIの説明がいかに人間に納得させるかを測定する。
XAIアルゴリズムの評価や最適化の基準として可視性を使うことは推奨しません。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:38:32 GMT)
SUPER: Selfie Undistortion and Head Pose Editing with Identity Preservation [37.9] Superは、クローズアップ顔作物の歪みを排除し、頭部のポーズを調整する新しい方法である。
我々は,カメラパラメータと顔潜時符号を最適化することにより,顔画像の3D GANインバージョンを行う。
得られた潜伏符号から深度を推定し、深度誘導型3Dメッシュを作成し、更新されたカメラパラメータでレンダリングし、歪んだポートレートを得る。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:14:14 GMT)
Self-Supervised Time-Series Anomaly Detection Using Learnable Data Augmentation [37.7] 本稿では,学習可能なデータ拡張に基づく時系列異常検出(LATAD)手法を提案する。
LATADは、比較学習を通じて時系列データから識別的特徴を抽出する。
その結果、LATADは最先端の異常検出評価に匹敵する、あるいは改善された性能を示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:25:56 GMT)
The Evolution of Language in Social Media Comments [37.7] 本研究では,34年間のユーザコメントの言語的特徴について検討し,その複雑さと時間的変化に着目した。
8つのプラットフォームとトピックから約3億の英文コメントのデータセットを利用する。
本研究は, テキスト長のほぼ普遍的な減少, 語彙の豊かさの低下, 反復性の低下を特徴とするソーシャルメディアプラットフォームとトピック間の複雑性パターンの整合性を明らかにした。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:30:13 GMT)
Uncertainty Quantification on Clinical Trial Outcome Prediction [37.2] 本稿では,不確実性の定量化を臨床治験結果の予測に取り入れることを提案する。
私たちの主な目標は、ニュアンスドの違いを識別するモデルの能力を強化することです。
我々は目的を達成するために選択的な分類手法を採用した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:09:46 GMT)
SNAP: Unlearning Selective Knowledge in Large Language Models with Negative Instructions [37.2] 命令追従型大規模言語モデル(LLM)は、個人または著作権のある情報を故意に開示する。
SNAPは,情報を選択的に学習するための革新的なフレームワークである。
我々は,NLPベンチマークにおけるフレームワークの評価を行い,提案手法が元のLLM能力を維持していることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:54:05 GMT)
A Rate-Distortion View of Uncertainty Quantification [36.9] 教師付き学習では、入力がトレーニングデータに近接していることを理解することは、モデルが信頼できる予測に達する十分な証拠を持っているかどうかを判断するのに役立つ。
本稿では,この特性でディープニューラルネットワークを強化するための新しい手法であるDistance Aware Bottleneck (DAB)を紹介する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:41:43 GMT)
CITADEL: Context Similarity Based Deep Learning Framework Bug Finding [36.3] 本稿では,CITADELを提案する。CITADELは,効率と有効性の観点から,バグの発見を高速化する手法である。
これは、まず既存のバグレポートを収集し、問題のあるAPIを特定することで機能する。
CITADELが生成したテストケースの35.40%はバグを引き起こすことができ、その割合は0.74%、1.23%、および3.90%を大きく超える。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:51:16 GMT)
Towards a Client-Centered Assessment of LLM Therapists by Client Simulation [35.7] 本研究は、シミュレーションクライアントの関与によるLLMセラピストのクライアント中心評価に焦点を当てる。
倫理的には、人間に頻繁にクライアントを模倣させ、潜在的に有害なLCM出力に晒すことは危険であり、安全ではない。
クライアントシミュレーションによりLLMセラピストを評価するクライアント中心のアプローチであるClientCASTを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:46:55 GMT)
Insect Identification in the Wild: The AMI Dataset [35.4] 昆虫は世界の生物多様性の半分を占めるが、世界の昆虫の多くは姿を消している。
この危機にもかかわらず、昆虫の多様性と豊かさに関するデータはいまだに不十分である。
昆虫認識のための大規模な機械学習ベンチマークを初めて提供します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:57:02 GMT)
Taiyi-Diffusion-XL: Advancing Bilingual Text-to-Image Generation with Large Vision-Language Model Support [35.2] 中国語と英語のバイリンガル・テキスト・ツー・イメージ・モデルであるTaiyi-Diffusion-XLを提案する。
CLIPとStable-Diffusion-XLの能力をバイリンガル連続事前学習のプロセスにより拡張する。
両言語画像テキスト検索においてCLIPモデルが優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:17:18 GMT)
Holmes-VAD: Towards Unbiased and Explainable Video Anomaly Detection via Multi-modal LLM [35.1] Holmes-VADは、正確な時間的監督と豊富なマルチモーダル命令を活用する新しいフレームワークである。
大規模なマルチモーダルVAD命令チューニングベンチマークであるVAD-Instruct50kを構築した。
VAD-Instruct50kデータセットに基づいて、解釈可能なビデオ異常検出のためのカスタマイズされたソリューションを開発する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:19:24 GMT)
Statistical Uncertainty in Word Embeddings: GloVe-V [35.0] 本稿では,GloVeの近似的,使いやすい,スケーラブルな再構成誤差分散推定手法を提案する。
分散を伴う埋め込み(GloVe-V)の価値を示すために,本手法がコアワード埋め込みタスクにおいて,原理的仮説テストを実現する方法について述べる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:35:02 GMT)
JailGuard: A Universal Detection Framework for LLM Prompt-based Attacks [35.0] 本稿では, LLM と MLLM をまたいだジェイルブレイクおよびハイジャック攻撃の普遍的検出フレームワークである JailGuard を提案する。
JailGuardは、攻撃は本質的に、メソッドやモダリティに関わらず、良心的な攻撃よりも堅牢ではない、という原則に基づいている。
15の既知の攻撃タイプにわたる11,000のデータ項目を含む、最初の総合的なマルチモーダルアタックデータセットを構築します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:21:02 GMT)
Mathador-LM: A Dynamic Benchmark for Mathematical Reasoning on Large Language Models [34.8] 大規模言語モデル(LLM)の数学的推論を評価するための新しいベンチマークであるMathador-LMを紹介する。
Mathador-LMはMathadorのゲームにインスパイアされており、そのゲームの目的は、与えられた基本数の集合の基本的な算術演算を用いてターゲット数に到達することである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:02:12 GMT)
PFID: Privacy First Inference Delegation Framework for LLMs [34.6] 本稿では,LPMのためのPFIDという新しいプライバシ保護フレームワークを提案する。
モデルのシャーディングと特異値分解を通じてユーザデータをローカライズすることで、重要なプライバシー上の懸念に対処する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:27:09 GMT)
P-Tailor: Customizing Personality Traits for Language Models via Mixture of Specialized LoRA Experts [34.4] オープン性,良心性,外向性,同意性,神経症など,さまざまな特徴を表現するために,専門的な LoRA の専門家を学ぶ。
我々は、P-Tailorとパーソナリティ損失専門化を統合し、異なるパーソナリティ特性を専門化する専門家を奨励する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:25:13 GMT)
Adversarial Attacks on Large Language Models in Medicine [34.2] 医療アプリケーションへの大型言語モデルの統合により、医療診断、治療勧告、患者医療の進歩が期待できる。
LLMの敵対的攻撃に対する感受性は重大な脅威となり、繊細な医学的文脈で有害な結果をもたらす可能性がある。
本研究では,3つの医療課題における2種類の敵攻撃に対するLDMの脆弱性について検討した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:24:30 GMT)
GaitGS: Temporal Feature Learning in Granularity and Span Dimension for Gait Recognition [34.1] GaitGSは、時間的特徴を粒度とスパン次元の両方で同時に集約するフレームワークである。
本手法は,2つのデータセットに対して98.2%,96.5%,89.7%のランク1精度を達成し,最先端の性能を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:15:39 GMT)
LLMs Are Prone to Fallacies in Causal Inference [34.0] 近年の研究では, LLMから因果事実を効果的に抽出できることが示されている。
本研究は、モデルが記憶できる事前学習データにおいて、この成功が明示的に記述された因果事実に限られているかどうかを考察する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:14:07 GMT)
Can Tool-augmented Large Language Models be Aware of Incomplete Conditions? [33.7] 本研究では,大規模言語モデルが不完全条件を識別し,いつツールの使用を控えるかを適切に判断できるかどうかを検討する。
特定ツールの利用に必要な追加情報と適切なツールの欠如を識別するために,ほとんどのLCMが課題であることを確認した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:28:06 GMT)
Learned Image Compression for HE-stained Histopathological Images via Stain Deconvolution [33.7] 本稿では,一般的なJPEGアルゴリズムがさらなる圧縮に適していないことを示す。
Stain Quantized Latent Compression, a novel DL based histopathology data compression approach。
提案手法はJPEGのような従来の手法と比較して,下流タスクの分類において優れた性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:47:17 GMT)
Watch Out! Simple Horizontal Class Backdoor Can Trivially Evade Defense [33.3] 本研究では,水平クラスバックドア(HCB)として考案された,新しい,シンプルで汎用的なバックドア攻撃について紹介する。
HCBは、クラスに関係なく、トリガーが無害な特徴と共に提示されるときに起動される。
MNIST, 顔認識, 交通標識認識, 物体検出, 医療診断など, 様々なタスクにおける攻撃性能の実験により, HCBの高効率性と有効性が確認された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:59:02 GMT)
MAC: A Benchmark for Multiple Attributes Compositional Zero-Shot Learning [33.1] 合成ゼロショット学習(CZSL)は、意味的プリミティブ(属性とオブジェクト)を無視して学習し、見知らぬ属性オブジェクトの合成を認識することを目的としている。
我々は18,217のイメージと11,067のコンポジションを含む多属性合成データセットを紹介した。
我々のデータセットは、より深い意味理解と高次属性関連をサポートし、CZSLタスクのより現実的で挑戦的なベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:24:48 GMT)
EmoLLMs: A Series of Emotional Large Language Models and Annotation Tools for Comprehensive Affective Analysis [33.0] EmoLLMs はオープンソースの命令追従型 LLM の第1シリーズであり,インストラクションデータを用いた各種 LLM の微調整に基づく感情分析を行う。
EmoLLMは、感情分析タスクにおいて、ChatGPTレベルおよびGPT-4レベルの一般化機能を実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:24:03 GMT)
Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting [33.0] 3D Gaussian Splatting(3DGS)は、高品質な3D再構成によるリアルタイムレンダリングが可能な有望な技術として登場した。
その可能性にもかかわらず、3DGSは針のようなアーティファクト、準最適ジオメトリー、不正確な正常など、課題に直面している。
正規化として有効なランクを導入し、ガウスの構造を制約する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:38:29 GMT)
PRePair: Pointwise Reasoning Enhance Pairwise Evaluating for Robust Instruction-Following Assessments [32.5] 我々は、望ましくない好みに対して、ポイントワイズ評価がより堅牢性を示すことを示した。
本稿では,一対評価にポイントワイド推論を統合するハイブリッド手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:43:04 GMT)
Improving Multi-modal Recommender Systems by Denoising and Aligning Multi-modal Content and User Feedback [32.1] マルチモーダルレコメンダシステム(DA-MRS)を提案する。
DA-MRSは、マルチモーダルノイズを軽減するために、まず、モーダル間の一貫したコンテント類似性によって決定されるアイテム-テムグラフを構成する。
DA-MRSは、ユーザフィードバックを認知するために、観測されたフィードバックの確率とマルチモーダルコンテンツとを関連付け、識別されたBPR損失を考案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:05:32 GMT)
Top-Down Bayesian Posterior Sampling for Sum-Product Networks [32.0] Sum-product Network(SPN)は、基本確率演算の正確かつ高速な評価を特徴とする確率モデルである。
本研究では,大規模SPN上で効率的に実装可能なベイズ学習手法を開発することを目的とした。
提案手法は,20以上のデータセットの数値実験において,学習時間の複雑性を向上し,計算速度を100倍以上に高速化し,予測性能に優れることを示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:36:45 GMT)
Understanding the Difficulty of Solving Cauchy Problems with PINNs [32.0] PINNは微分方程式の解法における古典的手法と同等の精度を達成できないことが多い。
L2$残差と初期条件誤差の和を最小化することは、真の解を保証するのに十分でないことを示す。
我々は,大域的最小値が存在しない場合,機械の精度がエラーの原因となることを示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:33:29 GMT)
RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented Generation [31.7] 本稿ではRichRAGという新しいRAGフレームワークを提案する。
これには、入力された質問の潜在的なサブアスペクトを特定するサブアスペクトエクスプローラー、これらのサブアスペクトに関連する多様な外部文書の候補プールを構築するレトリバー、および生成リストワイズローダが含まれる。
2つの公開データセットの実験結果から,我々のフレームワークがユーザに対して包括的かつ満足な応答を効果的に提供できることが証明された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:52:51 GMT)
TriSAM: Tri-Plane SAM for zero-shot cortical blood vessel segmentation in VEM images [31.0] VEM画像における皮質血管のセグメンテーションに特化して設計された,第1級パブリックベンチマークであるBvEMを紹介する。
私たちのBvEMベンチマークは、成体マウス、マカク、ヒトの3匹の哺乳類のvEM画像量に基づいています。
我々は,TriSAMと呼ばれる,強力なセグメンテーションモデルSAMを3次元セグメンテーションに活用したゼロショット皮質血管セグメンテーション法を開発した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:53:12 GMT)
A Super-human Vision-based Reinforcement Learning Agent for Autonomous Racing in Gran Turismo [30.7] 本稿では,センサ入力が車に純粋に局所的な,最初のスーパーヒューマンカーレースエージェントについて紹介する。
訓練時にのみグローバルな機能を活用することで、学習エージェントはタイムトライアルで最高の人間ドライバーより優れたパフォーマンスを発揮することができる。
得られたエージェントは、Gran Turismo 7において、複数のトラックと車上で評価される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:49:27 GMT)
Imagination Augmented Generation: Learning to Imagine Richer Context for Question Answering over Large Language Models [30.4] Imagination-Augmented-Generation (IAG)は、知識不足を補うために人間の能力をシミュレートする。
我々は、質問応答(IMcQA)のためのよりリッチなコンテキスト手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:21:24 GMT)
Refiner: Restructure Retrieval Content Efficiently to Advance Question-Answering Capabilities [30.1] 大規模言語モデル(LLM)はパラメトリックな知識によって制限され、知識集約的なタスクに幻覚をもたらす。
我々は、RAGの検索後のプロセスで機能するエンドツーエンドの抽出・再構成パラダイムである$textitRefiner$を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:44:27 GMT)
Accelerated Stochastic Min-Max Optimization Based on Bias-corrected Momentum [30.0] 1次アルゴリズムは、$varepsilon-stationary pointを見つけるのに少なくとも$mathcalO(varepsilonepsilon-4)$ complexityを必要とする。
本稿では,高効率な変動複雑性を生かした新しい運動量アルゴリズムを提案する。
本手法の有効性は実世界のデータセットを用いてロジスティック回帰を用いて検証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:14:52 GMT)
Fighting Against the Repetitive Training and Sample Dependency Problem in Few-shot Named Entity Recognition [30.0] 名前付きエンティティ認識(NER)システムは、いくつかのラベル付きトレーニング例を使用してエンティティを認識する。
現在のスパン検出器は、ガイドトレーニングのための広範囲な手動ラベリングに依存している。
オープンドメインのウィキペディアデータに基づいて事前トレーニングした足場スパン検出器を導入する。
大型言語モデル(LLM)を利用して、信頼性の高いエンティティ型参照をセットし、各タイプの少数ショットサンプルへの依存をなくす。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:45:14 GMT)
The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation [29.7] 本稿では,線形関数近似を用いたオフラインRL問題について検討する。
我々の構造的前提は、MDPはベルマン誤差が低いということである。
我々は、$sqrtvarepsilon_mathrmBE$によるサブ最適性のスケーリングは、どんなアルゴリズムでも改善できないことを示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:23:39 GMT)
Linear Bellman Completeness Suffices for Efficient Online Reinforcement Learning with Few Actions [29.7] ベルマンが成り立つと仮定し、これらの回帰問題が十分に特定されていることを保証している。
数作用が定数であるとき、線形ベルマンの下でRLの最初の特別なアルゴリズムを与える。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:27:49 GMT)
PDSS: A Privacy-Preserving Framework for Step-by-Step Distillation of Large Language Models [29.6] PDSSはサーバクライアントアーキテクチャで動作し、クライアントは合理生成のためにサーバのLCMにプロンプトを送信する。
生成された合理性はクライアントによってデコードされ、タスク固有の小言語モデルのトレーニングを強化するために使用される。
各種テキスト生成タスクにおけるPDSSの有効性を示す実験により,タスク固有のSLMを訓練し,性能を向上させることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:48:14 GMT)
On the Empirical Complexity of Reasoning and Planning in LLMs [29.6] Chain-of-Thought(CoT)、tree-of-Thought(ToT)、および関連するテクニックは、大規模言語モデル(LLM)を用いた複雑な推論タスクにおいて、実際に驚くほどうまく機能する。
この研究は、実験ケーススタディを実行し、パフォーマンスの利点を機械学習における十分に確立されたサンプルと計算の複雑さの原則に結びつけることによって、根本的な理由を追求する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:03:35 GMT)
A Framework of SO(3)-equivariant Non-linear Representation Learning and its Application to Electronic-Structure Hamiltonian Prediction [29.5] 本稿では,物理システムにディープラーニングを適用する上で重要な課題に対処する理論的および方法論的枠組みを提案する。
物理学における共変理論に着想を得て、SO(3)-不変量とSO(3)-同変量とそれらの表現の間の数学的関係を探求する。
我々は、最先端の予測精度に劇的なブレークスルーを示し、ハミルトン人の予測は最大40%、下流の物理量の予測は最大76%改善した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:08:17 GMT)
From Instance Training to Instruction Learning: Task Adapters Generation from Instructions [29.5] 本稿では,事例学習の欠点に対処するために,人間の学習をシミュレートすることに焦点を当てる。
タスク固有のモデルを自動的に構築するTAGI(Task Adapters from Instructions)を導入する。
超自然的インストラクションとP3データセットを用いたTAGIの評価を行った。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:14:28 GMT)
Self-supervised Graph Neural Network for Mechanical CAD Retrieval [29.3] GC-CADは、機械的CAD検索のための、自己教師付きコントラストグラフニューラルネットワークに基づく手法である。
提案手法は, 精度を向上し, ベースライン法よりも100倍の効率向上を実現している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:29:12 GMT)
WebCanvas: Benchmarking Web Agents in Online Environments [29.3] WebCanvasは、Webエージェントのための革新的なオンライン評価フレームワークである。
我々は、推論のためのモジュールを備えたエージェントフレームワークをオープンソースとして公開し、コミュニティがオンライン推論と評価を行うための基盤を提供します。
ベストパフォーマンスエージェントは,Mind2Web-Liveテストセット上でのタスク成功率23.1%,タスク完了率48.8%を達成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:58:33 GMT)
Do More Details Always Introduce More Hallucinations in LVLM-based Image Captioning? [29.2] LVLM(Large Vision-Language Models)は、視覚的コンテキストと言語的コンテキストを統合することで、詳細なコンテンツを生成する。
LVLMを使用して記述を生成すると、出力テキストが入力画像内の実際のオブジェクトを誤って表現するオブジェクト幻覚(OH)の課題に直面します。
本稿では,新しい復号化戦略である微分ビーム復号法(DBD)と信頼性の高い新しい評価指標を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:33:56 GMT)
Enhancing Visible-Infrared Person Re-identification with Modality- and Instance-aware Visual Prompt Learning [29.2] MIP(Modality-aware and Instance-aware Visual Prompts)ネットワークについて紹介する。
MIPは、不変情報と特定情報の両方を効果的に利用して識別するように設計されている。
提案するMIPは,ほとんどの最先端手法よりも優れている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:39:03 GMT)
"You Gotta be a Doctor, Lin": An Investigation of Name-Based Bias of Large Language Models in Employment Recommendations [29.2] 我々はGPT-3.5-TurboとLlama 3-70B-Instructを利用して、人種や性別を強く示す320のファーストネームを持つ候補者の雇用決定と給与勧告をシミュレートする。
以上の結果から,40の職種にまたがる他の人口集団よりも,白人女性の名前を持つ候補者を雇用する傾向が示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:11:43 GMT)
From Insights to Actions: The Impact of Interpretability and Analysis Research on NLP [28.9] 解釈可能性と分析(IA)研究は、NLP内の成長するサブフィールドである。
我々は,IA研究がNLPの幅広い分野に与える影響を定量化する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:45:07 GMT)
Understanding Help-Seeking and Help-Giving on Social Media for Image-Based Sexual Abuse [28.6] 画像ベースの性的虐待(IBSA)は、人々のデジタル安全に対する脅威が増大している。
本稿では,ソーシャルメディア上でのIBSA支援の取り組みと支援について考察する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:23:00 GMT)
LFMamba: Light Field Image Super-Resolution with State Space Model [28.4] LFMambaと呼ばれる光フィールド画像の超解像のためのSSMネットワークを提案する。
LFベンチマーク実験の結果, LFMambaの性能は良好であった。
LFMambaは、状態空間モデルによるLFの効果的な表現学習に光を当てていると期待している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:13:19 GMT)
GADePo: Graph-Assisted Declarative Pooling Transformers for Document-Level Relation Extraction [28.4] 本稿では,共同テキストグラフ変換モデルとグラフ支援宣言型プール(GADePo)仕様を導入する。
GADePoにより、プールプロセスはドメイン固有の知識や望ましい結果によってガイドされるが、Transformerによって学習される。
提案手法は,手書きプーリング関数により達成された結果よりも一貫した有望な結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:28:04 GMT)
Towards Exact Gradient-based Training on Analog In-memory Computing [28.4] アナログ加速器に関する推論は近年研究されているが、トレーニングの観点は過小評価されている。
近年の研究では、非理想デバイスでのモデルトレーニングに適用した場合、勾配降下(SGD)アルゴリズムの「ワークホース」が不正確に収束することが示されている。
本稿では,アナログデバイス上での勾配に基づくトレーニングの理論的基礎について述べる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:43:59 GMT)
FedMKT: Federated Mutual Knowledge Transfer for Large and Small Language Models [28.3] FedMKTは、大小の言語モデルのためのパラメータ効率の良い相互知識伝達フレームワークである。
我々は,FedMKTがLLMとSLMの両方の性能を同時に向上させることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:17:00 GMT)
LEVI: Generalizable Fine-tuning via Layer-wise Ensemble of Different Views [28.1] ファインチューニングは、新しい下流タスクで事前訓練された基礎モデルのパワーを活用するために使用される。
近年の研究では、微調整されたモデルから目に見えない分布への一般化の課題が観察されている。
そこで本研究では,タスク固有モデルを用いて,事前学習したモデルを階層的に適応的に組み立てる,一般化可能なファインチューニング手法LEVIを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:56:54 GMT)
Make Your Home Safe: Time-aware Unsupervised User Behavior Anomaly Detection in Smart Homes via Loss-guided Mask [28.0] 自動エンコーダに基づく教師なしユーザ動作異常検出フレームワークであるSmartGuardを提案する。
まず、Los-Guided Dynamic Mask Strategy (LDMS) を設計し、モデルの頻繁な振る舞いの学習を促す。
次に,3段階の時間認識位置埋め込み (TTPE) を提案する。
第3に,騒音を考慮した重み付き再構成損失(NWRL)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:52:26 GMT)
ERASER: Machine Unlearning in MLaaS via an Inference Serving-Aware Approach [27.9] 多くの機械学習手法が提案され、訓練されたモデルからデータ所有者のデータを非学習要求で除去する。
ERASERは、推論サービス問題に対処する適切な未学習実行タイミングを戦略的に選択する。
推論待ち時間の99%と、推論オフブリビオンベースラインでの計算オーバーヘッドの31%を効果的に節約できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:46:06 GMT)
InterIntent: Investigating Social Intelligence of LLMs via Intention Understanding in an Interactive Game Context [27.7] 大規模言語モデル(LLM)は、人間の社会的知性を模倣する可能性を実証している。
我々は,ゲーム環境における意図を理解し,管理する能力をマッピングすることで,LLMの社会的知性を評価する新しい枠組みであるInterIntentを開発した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:02:15 GMT)
Effective Generation of Feasible Solutions for Integer Programming via Guided Diffusion [27.4] 実現可能なソリューションは、問題解決プロセスを大幅にスピードアップできるため、プログラミング(IP)にとって不可欠です。
完全実現可能なソリューションをエンド・ツー・エンドで生成する新しいフレームワークを提案する。
我々は,IP問題の典型的な4つのデータセット上で,我々の枠組みを実証的に評価し,高い確率で完全な実現可能な解を効果的に生成することを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:33:05 GMT)
InstructCMP: Length Control in Sentence Compression through Instruction-based Large Language Models [27.3] InstructCMPは文圧縮タスクへのアプローチであり、命令によって長さ制約を考慮できる。
長さプライミングを適用することで、ゼロショット設定と微調整設定の両方において、インストラクトCMPの性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:35:52 GMT)
Fixed Design Analysis of Regularization-Based Continual Learning [27.2] 固定設計における2つの線形回帰タスクを伴う連続学習(CL)問題を考察する。
通常の最小の正方形パラメータを計算し、第1のデータセットに適合し、次に第2のデータセットに適合する別のパラメータを計算する。
以上の結果から,異種タスク(正確な類似度測定)による大惨な忘れ込みが生じる可能性があり,十分に調整された$ell$-regularizationがこの問題を部分的に軽減できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:57:26 GMT)
LoRA-drop: Efficient LoRA Parameter Pruning based on Output Evaluation [27.1] Low-Rank Adaptation (LoRA)は、現在最も一般的に使われている言語である。
効率的な微細チューニング法(PEFT)。
各レイヤの補助パラメータを導入し、限られたコンピューティングリソースの下で事前訓練されたモデルを微調整する。
しかし、より大きなモデルにスケールアップする際には、依然としてリソース消費の課題に直面している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:13:12 GMT)
Attention Score is not All You Need for Token Importance Indicator in KV Cache Reduction: Value Also Matters [27.1] 本稿では,トークンの重要性を評価するために,注目スコアと$ ell_1 $ 値ベクトルのノルムを併用したバリューアウェアトークンプルーニング(VATP)を提案する。
LLaMA2-7B-chatとVicuna-v1.5-7Bの16のLongBenchタスクに対する実験は、VATPの優れた性能を示している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:01:11 GMT)
Fast and Slow Generating: An Empirical Study on Large and Small Language Models Collaborative Decoding [27.0] 大きな言語モデルと小さな言語モデル(SLM)の協調的復号化は、これらの課題に対処するための新しいアプローチを提供する。
デュアルプロセス認知理論に着想を得たこれらの手法を,FS-GEN(Fast and Slow Generating)と呼ばれる統合フレームワークに統合する。
本稿では、投機的復号化、コントラスト的復号化、エミュレータやプロキシの微調整など、FS-GENフレームワーク内のいくつかの手法について検討する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:59:28 GMT)
Mitigate Negative Transfer with Similarity Heuristic Lifelong Prompt Tuning [26.9] 本稿では,Simisity Heuristic Lifelong Prompt Tuning(SH)フレームワークを提案する。
SHは、学習可能な類似度メトリックを利用することで、タスクを2つの異なるサブセットに分割する。
実験の結果,SHは生涯学習ベンチマークにおいて最先端技術よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:57:49 GMT)
Deep Proxy Causal Learning and its Application to Confounded Bandit Policy Evaluation [26.5] プロキシ因果学習(英: Proxy causal learning、PCL)は、治療の因果効果を未観察の結束の有無で推定する方法である。
そこで本研究では,PCLの新しい手法であるDFPV(Deep Feature proxy variable method)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:40:30 GMT)
Low-Resource Machine Translation through the Lens of Personalized Federated Learning [26.4] 異種データを用いた自然言語処理に適用可能な新しい手法を提案する。
大規模多言語機械翻訳共有タスクのデータセットを用いて,低リソース機械翻訳タスク上で評価を行った。
MeritFedは、その効果に加えて、トレーニングに使用する各言語の影響を追跡するために適用できるため、高度に解釈可能である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:50:00 GMT)
Is Efficient PAC Learning Possible with an Oracle That Responds 'Yes' or 'No'? [26.3] 本研究では,与えられたデータセットに対する経験的リスクを最小化する仮説を計算したERMの実行能力が,効率的な学習に必要かどうかを検討する。
バイナリ分類のためのPACの実際の設定において、概念クラスは1ビットしか返さないオラクルを用いて学習可能であることを示す。
また,本研究の結果は,オラクルを少し強化した学習環境や,部分的な概念,マルチクラス,実価値の学習環境にまで及んでいる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:18:17 GMT)
Variational Distillation of Diffusion Policies into Mixture of Experts [26.3] 本研究は, 拡散反応をエキスパート混合体 (MoE) に蒸留する新しい方法である変動拡散蒸留 (VDD) を導入する。
拡散モデル(英: Diffusion Models)は、複雑なマルチモーダル分布を正確に学習し、表現する能力があるため、生成モデリングにおける現在の最先端技術である。
VDDは、事前学習した拡散モデルをMoEモデルに蒸留し、拡散モデルの表現性を混合モデルの利点と組み合わせる最初の方法である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:15:05 GMT)
Addressing Shortcomings in Fair Graph Learning Datasets: Towards a New Benchmark [26.2] 我々は,幅広い要件を満たす合成,半合成,実世界のデータセット群を開発し,導入する。
これらのデータセットは、関連するグラフ構造や、モデルの公正な評価に不可欠なバイアス情報を含むように設計されている。
データセット全体にわたるグラフ学習手法による広範な実験結果から,これらの手法の性能をベンチマークする上での有効性が示された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:55:04 GMT)
Slot State Space Models [26.2] 本稿では,情報分離の保存・促進を目的として,独立したメカニズムをSSMに組み込む新しいフレームワークであるSlotSSMを紹介する。
実験では,対象中心の映像理解,3次元視覚推論,映像予測タスクにおけるモデルの評価を行った。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:59:14 GMT)
Byzantine-Robust Decentralized Federated Learning [26.0] フェデレーション・ラーニング(FL)は、複数のクライアントがプライベートデータを公開せずに、共同で機械学習モデルをトレーニングすることを可能にする。
分散学習(DFL)アーキテクチャは、クライアントがサーバーレスとピアツーピアの方法でモデルを協調的にトレーニングできるように提案されている。
悪意のあるクライアントは、近隣のクライアントに慎重に構築されたローカルモデルを送信することでシステムを操作できる。
本稿では,DFLにおける毒殺対策として,BALANCE (Byzantine-robust averaging through local similarity in decentralization) というアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:46:08 GMT)
COT: A Generative Approach for Hate Speech Counter-Narratives via Contrastive Optimal Transport [25.7] 本研究では, コントラッシブ・最適輸送に基づく新しい枠組みを提案する。
ターゲットインタラクションの維持と、反ナラティブの生成における多様化の促進という課題を効果的に解決する。
提案手法は,複数の側面から評価された現在の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:24:26 GMT)
Liar, Liar, Logical Mire: A Benchmark for Suppositional Reasoning in Large Language Models [25.7] 我々は騎士とナイフパズルの原理に基づく仮定推論のベンチマークである$textitTruthQuest$を紹介した。
評価の結果、Llama 3やMixtral-8x7Bのような大規模言語モデルはこれらのタスクを解くのにかなりの困難を呈している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:24:22 GMT)
Single-photon and two-photon blockade in a three-wave mixing system with a two-level atom [25.5] 本稿では,高周波共振器内に2レベル原子を埋め込んだ3波長混合系において,従来の光子遮断 (CPB) と2光子遮断 (2PB) について述べる。
原子と高周波モード光子の結合係数を調整することにより、高周波モードで単一光子遮断と2光子遮断を切り替えることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:24:24 GMT)
Federated Learning with a Single Shared Image [25.3] フェデレートラーニング(FL)は、複数のマシンがプライベートトレーニングデータを共有することなく、機械学習モデルを協調的にトレーニングすることを可能にする。
1つの一般的な方法であるFedDFは、共通の共有データセットを使用して、このタスクに取り組むために蒸留を使用する。
本稿では,この知識蒸留法を,単一の共有画像にのみ依存するように改良する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:26:09 GMT)
SciAssess: Benchmarking LLM Proficiency in Scientific Literature Analysis [25.2] 大規模言語モデル(LLM)は、自然言語の理解と生成に革命をもたらした。
既存のベンチマークでは、科学文献分析においてLLMの熟練度を適切に評価することができない。
SciAssessは科学文献分析におけるLLMの総合的な評価を目的としたベンチマークである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:45:33 GMT)
PCIE_LAM Solution for Ego4D Looking At Me Challenge [25.0] 本報告では,CVPR2024におけるEgo4D Looking At Me Challengeのソリューションについて述べる。
課題の主な目的は、現場の人がカメラ着用者を見ているかどうかを正確に判断することである。
提案手法は,0.81mAPと0.93の精度で,私の挑戦に対する第1位を達成した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:16:32 GMT)
As Advertised? Understanding the Impact of Influencer VPN Ads [25.0] 我々は、新しいVPN広告検出モデルを用いて、217人の参加者の広告露出をYouTubeウォッチ履歴を通じて計算する。
VPN広告への露出は、VPNブランドとの親密さと(ハイパボリックな)脅威に対する信頼の高まりと大きく相関していることがわかった。
多くの参加者は、しばしば広告に現れるVPNの事実モデルと誤解を招くメンタルモデルの両方に同意するが、VPN広告とこれらのメンタルモデルとの間に顕著な相関は見つからない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:22:37 GMT)
Towards Audio Codec-based Speech Separation [24.8] 音声分離は波形マスキングタスクである。
そこで我々は,NAC の埋め込み空間内で SS を行う,Audio Codec ベースの SS の新たなタスクを提案する。
推論では、CodecformerはMACの52倍の削減を実現し、Sepformerのクラウドデプロイメントに匹敵する分離性能を実現している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:29:24 GMT)
Toward Human-AI Alignment in Large-Scale Multi-Player Games [24.8] 我々はXboxのBleeding Edge(100K+ゲーム)から広範囲にわたる人間のゲームプレイデータを解析する。
人間のプレイヤーは、戦闘飛行や探索飛行行動において多様性を示す一方で、AIプレイヤーは均一性に向かう傾向にある。
これらの大きな違いは、ヒューマンアラインアプリケーションにおけるAIの解釈可能な評価、設計、統合の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:23:37 GMT)
SHIELD: Evaluation and Defense Strategies for Copyright Compliance in LLM Text Generation [24.6] 大規模言語モデル (LLMs) は機械学習を変容させたが、著作権を侵害するテキストを生成する可能性があるため、法的に重大な懸念を提起した。
本稿では,手法の評価,攻撃戦略の検証,著作権テキストの発生防止を目的としたリアルタイム防衛を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:00:03 GMT)
Scalable Ensembling For Mitigating Reward Overoptimisation [24.6] ヒューマンフィードバックからの強化学習は、強力な命令追従モデルのための言語モデリングにおける大幅な進歩を可能にした。
ポリシーが学習したプロキシ"報酬モデルに過度に適合する傾向にあるため、これらのモデルの整合性は依然として急進的な課題である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:53:08 GMT)
NoiSec: Harnessing Noise for Security against Adversarial and Backdoor Attacks [24.6] 機械学習に対する悪意のあるデータ操作攻撃は、安全クリティカルなアプリケーションにおける信頼性を損なう。
NoiSecは、リコンストラクションベースの検出器で、テスト入力からノイズを取り除き、基礎となる特徴をノイズから抽出し、それらを利用して、系統的な悪意のある操作を認識する。
NoiSecは高い検出性能を維持し、偽陽性率を1%に抑える。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:44:51 GMT)
Cross-Problem Learning for Solving Vehicle Routing Problems [24.2] 既存のニューラルネットワークは、特定の車両ルーティング問題(VRP)に対して、スクラッチから深いアーキテクチャを訓練することが多い。
本稿では,異なる下流VRP変種に対するトレーニングを実証的に支援するクロスプロブレム学習を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:03:08 GMT)
Multi-Modal and Multi-Agent Systems Meet Rationality: A Survey [24.1] 合理性(Rationality)とは、論理的な思考と、証拠や論理的な規則に沿った決定によって特徴づけられる、理性によって導かれる性質である。
最近の研究は、一貫性と信頼性を高めるために、様々な種類のデータやツールと協調して働く複数のエージェントの強みを活用する試みである。
本稿では,マルチモーダルシステムとマルチエージェントシステムが,現状調査によって合理性に向かって進んでいるかを理解することを目的とする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:22:39 GMT)
Demystifying the Recency Heuristic in Temporal-Difference Learning [24.1] 強化学習の相対性は、獲得した報酬に間に合った刺激を強く強化すべきである、という仮定である。
本稿では,TD学習における電流の応用に関する数学的意味を分析する。
以上の結果から,信頼度に基づく信用割当が学習を促進するという,最初の理論的証拠が得られた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:23:29 GMT)
Transforming Surgical Interventions with Embodied Intelligence for Ultrasound Robotics [24.0] 本稿では,超音波ロボットと大規模言語モデル(LLM)とドメイン固有知識強化を組み合わせた,新しい超音波身体情報システムを提案する。
まず、LLMを超音波ロボットと統合して、医師の言葉による指示を正確に動作計画に解釈する。
以上の結果から,提案システムは超音波スキャンの効率と品質を向上し,自律型医療スキャン技術のさらなる進歩の道を開くことが示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:22:16 GMT)
Biased Pareto Optimization for Subset Selection with Dynamic Cost Constraints [23.7] コスト制約付きサブセット選択は、与えられた予算を超えることなく、単調な目的関数を最大化するための基底セットからサブセットを選択することを目的としている。
我々は、動的環境に適した偏り選択とウォームアップ戦略でPOMCを強化したBPODCを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:14:51 GMT)
What Are the Odds? Language Models Are Capable of Probabilistic Reasoning [23.5] 本稿では,言語モデル(LM)の確率論的推論能力を,理想化および実世界の統計分布を用いて評価することに集中する。
本研究では,パーセンタイルの推定,サンプルの描画,確率の計算という3つのタスクにおいて,最先端のLMの体系的評価を行う。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:51:24 GMT)
RAG-RLRC-LaySum at BioLaySumm: Integrating Retrieval-Augmented Generation and Readability Control for Layman Summarization of Biomedical Texts [23.5] 本稿では,RAG-RLRC-LaySumフレームワークについて紹介する。
RAG-RLRC-LaySumフレームワークは、科学的知識を効果的に民主化し、生物医学的な発見への公的な関与を高める。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:52:50 GMT)
When Graph Neural Network Meets Causality: Opportunities, Methodologies and An Outlook [23.5] グラフニューラルネットワーク(GNN)は、さまざまなグラフ構造化データ内の複雑な依存関係をキャプチャする強力な表現学習ツールとして登場した。
GNNは、分布シフトへの感受性、特定の人口への偏見、説明責任の欠如など、信頼性に関する深刻な懸念を提起している。
因果学習技術をGNNに統合することは、多くのGNNの信頼性の問題を軽減することができるため、多くの画期的な研究を引き起こしている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:19:31 GMT)
Variational optimization of the amplitude of neural-network quantum many-body ground states [23.5] ニューラルネットワーク量子状態(NQS)は、従来の手法とディープラーニング技術を組み合わせることで、変動的に最適化される。
そこで我々は,量子多体変動波関数を実数値振幅ニューラルネットワークと手形構造の乗算に分割した。
その結果,複素数値NQSの符号構造を最適化することが困難であることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:50:24 GMT)
Causal Graph Discovery with Retrieval-Augmented Generation based Large Language Models [23.4] 因果グラフの回復は、伝統的に統計的推定に基づく手法や、興味のある変数に関する個人の知識に基づいて行われる。
本稿では,大言語モデル(LLM)を利用して,一般的な因果グラフ復元タスクにおける因果関係を推定する手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:51:50 GMT)
Synergizing Foundation Models and Federated Learning: A Survey [23.4] 本稿では,フェデレートラーニング(FL)とファンデーションモデル(FM)の融合の可能性と課題について論じる。
FLは、さまざまな参加者からのデータ可用性の障壁を破る、共同学習パラダイムである。
プライバシを保護しながら、分散データセットを使用して、幅広いドメイン固有のタスクにFMをカスタマイズし、適応する有望なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:58:09 GMT)
Interpretable Preferences via Multi-Objective Reward Modeling and Mixture-of-Experts [23.3] 人からのフィードバックから強化学習(RLHF)が,大規模言語モデルと人間の嗜好を整合させる主要な手法として登場した。
多次元絶対値データを用いて報酬モデル(RM)を訓練するための2段階の手法を提案する。
我々は、Llama-3 8BでArmoRMを効率よく訓練し、ArmoRMの上部の浅い部分からなるゲーティングネットワークを構築した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:58:28 GMT)
Talk With Human-like Agents: Empathetic Dialogue Through Perceptible Acoustic Reception and Reaction [23.1] PerceptiveAgentは、より深い意味またはより微妙な意味を識別するために設計された共感的マルチモーダル対話システムである。
PerceptiveAgentは入力音声から音響情報を知覚し、自然言語で記述された話し方に基づいて共感応答を生成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:19:51 GMT)
MOYU: A Theoretical Study on Massive Over-activation Yielded Uplifts in LLMs [23.0] MYU(Massive Over-activation Yielded Uplifts)は、大規模言語モデル固有の特性である。
Massive Over-activation Yielded Uplifts (MOYU) は、これらのモデルにおける推論を加速するために設計された、巧妙だが未探索の戦略である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:57:33 GMT)
PATIENT-Ψ: Using Large Language Models to Simulate Patients for Training Mental Health Professionals [22.9] patient-Psiは認知行動療法(CBT)トレーニングのための新しい患者シミュレーションフレームワークである。
我々は,精神保健研修生が CBT の重要なスキルを身につけるための,対話型トレーニングスキームである patient-Psi-TRAINER を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:33:48 GMT)
Advances in 3D Neural Stylization: A Survey [22.8] 現代の人工知能は、デジタルアートを作るための斬新で変革的なアプローチを提供する。
本稿では,ニューラルネットワークの表現力による3Dアセット作成と操作のスタイル化の進歩について報告する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:31:56 GMT)
RIGL: A Unified Reciprocal Approach for Tracing the Independent and Group Learning Processes [22.4] 個人レベルとグループレベルの両方で知識状態をトレースする統合相互モデルであるRIGLを提案する。
本稿では,学生と集団の相互作用を同時にモデル化するための時間フレーム対応の相互埋め込みモジュールを提案する。
動的グラフモデリングと時間的自己注意機構を組み合わせた関係誘導型時間的注意ネットワークを設計する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:16:18 GMT)
Debate as Optimization: Adaptive Conformal Prediction and Diverse Retrieval for Event Extraction [22.4] イベント抽出のための最適化(DAO)システムとして,マルチエージェントの議論を提案する。
Diverse-RAG(DRAG)とAdaptive Conformal Prediction(AdaCP)の2つの新しいモジュールを紹介する。
実験により, 教師付きアプローチと無調律LPM法の性能ギャップが著しく低減された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:53:49 GMT)
Can LLMs Learn New Concepts Incrementally without Forgetting? [22.0] 大規模言語モデル(LLM)は様々なタスクで目覚ましい成功を収めていますが、それを忘れずに漸進的に学習する能力は未熟です。
概念1K(Concept-1K)は,最近出現した1023個の概念を網羅した新しいデータセットである。
概念1Kをテストベッドとして使うことで、私たちは「LLMは人間のように忘れることなく、段階的に新しい概念を学ぶことができるのか?」という疑問に答えることを目指しています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:56:44 GMT)
Let Me Teach You: Pedagogical Foundations of Feedback for Language Models [21.9] 自然言語フィードバック(NLF)は、大規模言語モデル(LLM)と人間の嗜好を整合させるメカニズムとして、ますます人気が高まっている。
FELTはフィードバック空間の様々な特徴を概説し、これらの変数に基づいてフィードバックコンテンツ分類を行う。
我々は、分類をコミュニティに公開し、分類を将来の研究にマッピングするためのガイドと例を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:55:12 GMT)
Bayesian-LoRA: LoRA based Parameter Efficient Fine-Tuning using Optimal Quantization levels and Rank Values trough Differentiable Bayesian Gates [21.8] 自然言語処理では、単一のモデルを事前訓練し、下流のタスクのために微調整するのが一般的である。
B-LoRAは、特定の下流タスクで事前訓練されたモデルを微調整することができ、ローランク行列ごとに最適なランク値と量子化レベルを求めることができる。
B-LoRAはベースラインよりも同等かそれ以上で動作し、ベースラインに対するビット演算の総量を約70%削減する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:26:30 GMT)
Convergence of Kinetic Langevin Monte Carlo on Lie groups [21.8] 結果の速度論的ラウンジビン型サンプリングダイナミクスを微妙に識別し,Lie群MCMCサンプリング器を提案する。
これは、曲線空間上での動力学ランゲヴィンの初めての収束結果であり、凸性を必要としない、あるいは少なくとも明示的には、イソペリメトリのような一般的な緩和を必要としない最初の定量的結果である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:08:24 GMT)
Spatial-Temporal Large Language Model for Traffic Prediction [21.7] 交通予測のための時空間大言語モデル(ST-LLM)を提案する。
ST-LLMでは,各位置の時間ステップをトークンとして定義し,空間的位置とグローバルな時間的パターンを学習するための空間的時間的埋め込みを設計する。
実トラフィックデータセットの実験において、ST-LLMは最先端のモデルより優れた空間時空間学習器である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:50:31 GMT)
Instruction Data Generation and Unsupervised Adaptation for Speech Language Models [21.6] 本稿では,多モーダル大規模言語モデルの訓練と評価を行うために,合成サンプルを生成する3つの方法を提案する。
このようなシステムの性能を高めるための重要な戦略として、合成データ生成が出現する。
我々は、未ラベルの音声データを用いて、利用可能な書き起こしに匹敵する品質の合成サンプルを生成する可能性を強調した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:27:00 GMT)
Evaluating the design space of diffusion-based generative models [21.5] この記事では、生成プロセス全体について、初めて定量的に理解する。
勾配降下下での復調スコアマッチングの非漸近収束解析を行う。
分散爆発モデルに対する精密サンプリング誤差解析も提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:56:10 GMT)
Evolutionary Spiking Neural Networks: A Survey [21.3] 従来のニューラルネットワーク(ANN)に代わる計算効率の良い代替手段として、スパイキングニューラルネットワーク(SNN)が注目を集めている。
ユニークな情報伝達機構とSNNニューロンモデルの複雑さは、ANN向けに開発された従来の手法をSNNに適用するための課題を提起する。
近年,これらの課題に対処するために進化的計算手法を利用した新しいパラダイムが出現している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:27:55 GMT)
Theoretical Understanding of In-Context Learning in Shallow Transformers with Unstructured Data [21.2] 大規模言語モデル(LLM)は、文脈内学習(ICL)を通じて推論段階で概念を学習できる強力なモデルである。
本稿では,トランスアーキテクチャにおける各コンポーネントの役割を考察し,アーキテクチャの成功を説明する理論的理解を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:11:32 GMT)
Implicit Bias of Mirror Flow on Separable Data [21.2] 線形分離可能な分類問題に対して,ミラー降下の連続時間,すなわちミラーフローについて検討する。
指数的尾尾損失とポテンシャルに対する軽度の仮定では、イテレートは$phi_infty$-maximumマージンに向かって収束する。
関数 $phi_infty$ はミラーポテンシャルの $textithorizon 関数$ であり、無限大でその形を特徴づける」
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:30:51 GMT)
Language and Multimodal Models in Sports: A Survey of Datasets and Applications [21.0] 自然言語処理(NLP)とマルチモーダルモデルの最近の統合は、スポーツ分析の分野を進歩させてきた。
この調査は、2020年以降のこれらのイノベーションを駆動するデータセットとアプリケーションの包括的なレビューを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:59:26 GMT)
MolecularGPT: Open Large Language Model (LLM) for Few-Shot Molecular Property Prediction [20.9] 数発の分子特性予測のための分子GPTを提案する。
10のダウンストリーム評価データセットで競合するコンテキスト内推論機能を示す。
また、最先端のLCMベースラインを最大16.6%向上させ、ゼロショットでの回帰指標(例えばRMSE)で199.17を減少させる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:54:47 GMT)
BaFTA: Backprop-Free Test-Time Adaptation For Zero-Shot Vision-Language Models [20.9] 本稿では,視覚言語モデルの試験時間適応のためのバックプロパゲーションフリーアルゴリズムBaFTAを提案する。
BaFTAは、投影された埋め込み空間内のオンラインクラスタリングを使用して、クラスセントロイドを直接推定する。
我々は,BaFTAが最先端の試験時間適応手法を効率と効率の両方で一貫して上回っていることを実証した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:48:45 GMT)
LayerMerge: Neural Network Depth Compression through Layer Pruning and Merging [20.8] 既存の深度圧縮法では、冗長な非線形活性化関数を除去し、連続する畳み込み層を単一の層にマージする。
これらの手法は、マージされたレイヤのカーネルサイズが大きくなるという重大な欠点に悩まされる。
畳み込み層とアクティベーション関数を併用することにより,この問題に対処できることを示す。
本稿では,どのアクティベーション層と畳み込み層を除去するかを選択するディープ圧縮手法であるLayerMergeを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:55:15 GMT)
Enhancing Single-Slice Segmentation with 3D-to-2D Unpaired Scan Distillation [20.6] 本研究では, 事前学習した3次元モデルを用いて, 2次元単一スライスセグメンテーションを向上する新しい3D-to-2D蒸留フレームワークを提案する。
同じデータ入力を必要とする従来の知識蒸留法とは異なり、我々のアプローチでは、2次元の学生モデルをガイドするために、コントラストのない3次元CTスキャンを採用しています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:06:02 GMT)
Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game [20.6] 我々は,最先端の大規模言語モデル(LLM)の性能を,専門家や初心者に対して評価する。
以上の結果から,最高性能のLPMであるGPT-4oでもゲーム全体の8%しか解けないことがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:02:28 GMT)
Agriculture-Vision Challenge 2024 -- The Runner-Up Solution for Agricultural Pattern Recognition via Class Balancing and Model Ensemble [20.6] CVPR 2024の農業ビジョンチャレンジは、セマンティックセマンティックセマンティクスモデルを活用してピクセルレベルのセマンティクスセマンティクスラベルを作成することを目的としている。
本稿では,モザイクデータ拡張手法を提案する。
提案手法は,テストセットにおいて平均mIoU(mIoU)スコア0.547を達成し,この課題において第2位を確保した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:59:04 GMT)
MedThink: Inducing Medical Large-scale Visual Language Models to Hallucinate Less by Thinking More [20.6] 大規模視覚言語モデル(LVLM)は多モード医療生成タスクに適用される。
LVLMは、重要なモデル幻覚に悩まされる。
本稿では,人間の認知過程を模倣して微細な命令ペアを構築する手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:20:46 GMT)
GMP-AR: Granularity Message Passing and Adaptive Reconciliation for Temporal Hierarchy Forecasting [20.6] 時間的粒度の異なる時系列予測は、現実世界の応用において広く用いられている。
時間階層情報を利用して予測性能を向上させる新しい粒度メッセージパッシング機構(GMP)を提案する。
また、より現実的な制約に固執しつつ、タスクベースの目標を達成するための最適化モジュールも導入する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:33:03 GMT)
UrbanLLM: Autonomous Urban Activity Planning and Management with Large Language Models [20.1] UrbanLLMは、都市関連クエリを管理可能なサブタスクに分解することで問題を解決する。
サブタスクごとに適切なAIモデルを特定し、与えられたクエリに対する包括的な応答を生成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:41:42 GMT)
Is Your HD Map Constructor Reliable under Sensor Corruptions? [20.0] 運転システムは、しばしば正確な環境情報のために高精細(HD)マップに頼っている。
現在のHDマップコンストラクタは理想的な条件下ではよく機能するが、現実の課題に対するレジリエンスはよく理解されていない。
この研究は、HDマップ構築手法の堅牢性を評価するために設計された最初の総合的なベンチマークであるMapBenchを紹介する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:28:02 GMT)
Timeline-based Sentence Decomposition with In-Context Learning for Temporal Fact Extraction [20.0] 本稿では,自然言語テキストから時間的事実を抽出する方法について述べる。
本稿では,大規模言語モデル(LLM)と文脈内学習を用いたタイムラインに基づく文分解手法を提案する。
実験の結果, TSDRE は HyperRED-Temporal データセットと ComplexTRED データセットの両方で最先端の結果が得られることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:22:29 GMT)
MedSyn: Text-guided Anatomy-aware Synthesis of High-Fidelity 3D CT Images [19.7] 本稿では,テキスト情報によって誘導される高品質な3次元肺CT画像を作成するための革新的な手法を提案する。
現在の最先端のアプローチは、低解像度の出力に限られており、放射線学レポートの豊富な情報を不活用している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:26:53 GMT)
Segment Anything Model is a Good Teacher for Local Feature Learning [19.7] 局所的な特徴の検出と記述は多くのコンピュータビジョンタスクにおいて重要な役割を果たす。
データ駆動型局所特徴学習手法は、訓練にピクセルレベルの対応に頼る必要がある。
本研究では,SAMFeatを教師として導入し,局所的な特徴学習の指導を行う。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:11:59 GMT)
Interface Design for Self-Supervised Speech Models [19.6] 我々は、上流と下流を結ぶインターフェースを提案することにより、SSLモデル利用のための一般的なフレームワークを拡張します。
上流モデルの深さと対数的にスケールする畳み込みインタフェースは、他の多くのインタフェース設計よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:13:48 GMT)
Multilingual Synopses of Movie Narratives: A Dataset for Story Understanding [19.5] 我々はM-SYMON(Multilingual Synopses of Movie Narratives)という大規模多言語ビデオストーリーデータセットを構築した。
M-SYMONには、7つの言語からの13,166本の映画要約ビデオと、101.5時間のビデオの詳細なビデオテキスト対応のマニュアルアノテーションが含まれている。
SyMoNからの注釈付きデータのトレーニングは、Clip AccuracyとSentence IoUのスコアでそれぞれ15.7と16.2でSOTA法を上回ります。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:44:50 GMT)
Defending Against Social Engineering Attacks in the Age of LLMs [19.4] 大きな言語モデル(LLM)は、人間の会話パターンをエミュレートし、チャットベースのソーシャルエンジニアリング(CSE)攻撃を促進する。
本研究では,CSE脅威に対するファシリテーターとディフェンダーの両立能力について検討した。
メッセージレベルと会話レベルの両方の検出を改善するモジュール型ディフェンスパイプラインであるConvoSentinelを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:39:40 GMT)
SAGDFN: A Scalable Adaptive Graph Diffusion Forecasting Network for Multivariate Time Series Forecasting [19.1] 本稿では、複雑な空間的時間的相関を捉えるために、スケーラブルな適応グラフ拡散予測ネットワーク(SAGDFN)を提案する。
SAGDFNは、空間相関に関する事前の知識を必要とせず、数千のノードのデータセットにスケーラブルである。
207ノードの1つの実世界のデータセットで、最先端のベースラインと同等のパフォーマンスを達成し、2000ノードの3つの実世界のデータセットで、最先端のベースラインをかなり上回っている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:19:51 GMT)
Beyond Under-Alignment: Atomic Preference Enhanced Factuality Tuning for Large Language Models [19.0] 様々な選好学習アルゴリズムによって調整された異なるモデルの事実性を評価する。
textbfAtomic textbfPreference textbfEnhanced textbfFactuality textbfTuning を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:07:30 GMT)
BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity [19.0] BIOSCAN-5Mは、500万以上の昆虫の標本のマルチモーダル情報を含む包括的データセットである。
マルチモーダルデータ型が分類とクラスタリングの精度に与える影響を示すための3つのベンチマーク実験を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:45:21 GMT)
In-Context Learning of Energy Functions [19.0] 本研究では,このような制限を伴わずに,より汎用的な文脈内学習法を提案する。
その考え方は、制約のない任意のコンテキスト内エネルギー関数 $E_thetaICL(x|mathcalD)$ を学ぶことである。
本手法が人工データに有効であることを示す予備的証拠を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:54:43 GMT)
Improving Medical Reasoning through Retrieval and Self-Reflection with Retrieval-Augmented Large Language Models [19.0] Self-BioRAGは、説明文の生成、ドメイン固有の文書の検索、生成したレスポンスの自己参照を専門とする、バイオメディカルテキストに信頼できるフレームワークである。
84kのバイオメディカル・インストラクション・セットを用いて、カスタマイズされた反射トークンで生成された説明を評価できるセルフビオRAGを訓練する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:10:15 GMT)
Nova: Generative Language Models for Assembly Code with Hierarchical Attention and Contrastive Learning [18.6] 大規模な言語モデル(LLM)はアセンブリコードに直接一般化しない。
本研究は,セマンティクスをより効果的に捉えるために,注目要約を構築する階層的注意機構を提案する。
また、LCMを訓練してアセンブリ最適化を学ぶために、対照的な学習目標を設計する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:48:16 GMT)
Spatially Resolved Gene Expression Prediction from Histology via Multi-view Graph Contrastive Learning with HSIC-bottleneck Regularization [18.6] 本稿では,HSIC-bottleneck Regularization (ST-GCHB) を用いたマルチビューグラフ比較学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:07:25 GMT)
FuseGen: PLM Fusion for Data-generation based Zero-shot Learning [18.5] FuseGenは、新しいデータ生成ベースのゼロショット学習フレームワークである。
合成データセットからのサブセット選択のための新しい基準を導入する。
選択されたサブセットは、各PLMに対してコンテキスト内フィードバックを提供し、データセットの品質を向上する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:55:05 GMT)
Sample-efficient Imitative Multi-token Decision Transformer for Generalizable Real World Driving [18.3] 我々はSimDT(SimDT)を提案する。
SimDTでは、マルチトークン予測、模倣的なオンライン学習、優先されたエクスペリエンスリプレイをDecision Transformerに導入している。
結果は、Waymaxベンチマークの一般的な模倣および強化学習アルゴリズムを上回る。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:27:14 GMT)
Online Learning with Set-Valued Feedback [18.1] 学習者は1つのラベルを予測するが、フィードバックとしてラベルのテキストセットを受け取る。
単一ラベルフィードバックによるオンラインマルチクラス学習とは異なり、決定論的かつランダムなオンライン学習は、実現可能な設定においてもテキストと同等であることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:11:04 GMT)
$TrIND$: Representing Anatomical Trees by Denoising Diffusion of Implicit Neural Fields [17.9] 解剖学的木は臨床診断と治療計画において中心的な役割を果たす。
木構造を表現する伝統的な方法は、解像度、柔軟性、効率性の面で欠点を示す。
本稿では,暗黙の神経表現を用いて解剖学的木を表現するための新しいアプローチである$TrIND$を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:32:30 GMT)
Exploring Intra and Inter-language Consistency in Embeddings with ICA [17.9] 独立成分分析(ICA)は、独立鍵特徴を識別することによって、より明確な意味軸を生成する。
これまでの研究では、ICAが言語全体にわたって普遍的な意味軸を明らかにする可能性を示している。
セマンティック軸の整合性は、一つの言語内と複数の言語にまたがる2つの方法で検討した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:24:50 GMT)
Interacting Mathieu equation, synchronization dynamics and collision-induced velocity exchange in trapped ions [17.6] 我々は、ハミルトニアン方程式に基づくクーロン相互作用と閉じ込められたイオンの動力学を研究する。
変調の存在下では、離れたイオン間の速度の交換を示す同期ダイナミクスが観察できる。
この減衰を伴う多体マチュー方程式の動力学は量子シミュレーションに応用できるかもしれないと推測されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:26:49 GMT)
Symmetric Multi-Similarity Loss for EPIC-KITCHENS-100 Multi-Instance Retrieval Challenge 2024 [17.6] CVPR 2024におけるEPIC-KITCHENS-100 Multi-Instance Retrieval Challengeのチャンピオンソリューションを提案する。
この課題は、相関行列を提供することによって、従来のビジュアルテキスト検索タスクとは異なる。
我々は,より正確な学習目標を提供する新しい損失関数,Symmetric Multi-Similarity Lossを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:10:20 GMT)
Capturing Knowledge Graphs and Rules with Octagon Embeddings [17.5] 領域ベースの知識グラフ埋め込みは、関係を幾何学的領域として表現する。
既存のアプローチは、構成をモデル化する能力に厳しく制限されている。
我々の八角形埋め込みは、非自明なルールベースを適切に捕捉できることを示します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:29:55 GMT)
Accelerating optimization over the space of probability measures [17.3] ユークリッド空間における運動量に基づくアプローチに類似したハミルトン流アプローチを導入する。
我々は、連続的な時間設定において、このアプローチに基づくアルゴリズムが任意に高次収束率を達成できることを実証した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:33:01 GMT)
A transformer boosted UNet for smoke segmentation in complex backgrounds in multispectral LandSat imagery [17.1] 煙突は、密度、色、照明、雲、干し草、霧などの背景の変化による検出の課題を示す。
本稿では、スペクトルパターンをキャプチャする仮想バンド構成モジュールからなるVTrUNetと呼ばれる新しいセグメンテーションモデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:38:24 GMT)
A machine learning pipeline for automated insect monitoring [17.0] カメラトラップは、これまでは地上の脊椎動物をモニタリングするために用いられていました。
われわれは、カメラトラップによるマウスの自動監視のための、完全なオープンソースの機械学習ベースのソフトウェアパイプラインについて説明する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:51:16 GMT)
Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models? [17.0] 大規模言語モデル、特に多言語モデルは設計され、主張され、様々な言語の母語話者に適応することが期待されている。
これらのモデルを微調整し評価する現在の実践は、翻訳に大きく依存しているため、この意図を間違える可能性があると仮定する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:43:47 GMT)
DrugWatch: A Comprehensive Multi-Source Data Visualisation Platform for Drug Safety Information [16.5] DrugWatchは、薬物安全性研究のための、使いやすくてインタラクティブなマルチソース情報可視化プラットフォームである。
ユーザーは薬の副作用とその統計情報を理解したり、関連する医療報告を柔軟に検索したり、自分の医療文書に注釈を付けることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:58:12 GMT)
Apple Tasting: Combinatorial Dimensions and Minimax Rates [16.5] エンファップル味覚フィードバックに基づくオンライン二項分類では、学習者は1を予測した場合のみ真のラベルを観察する。
実現可能な設定では、期待されるミスの回数が$Theta$または$Theta(T)$であることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:54:41 GMT)
Can LLMs Recognize Toxicity? Definition-Based Toxicity Metric [16.4] 本稿では,Large Language Models (LLMs) に基づくロバストなメトリクスを導入し,与えられた定義に従って毒性を柔軟に測定する。
以上の結果から,F1スコアの従来の指標を12ポイント改善し,有毒度を測定できることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:35:12 GMT)
Mitigating Privacy Risk in Membership Inference by Convex-Concave Loss [16.4] 機械学習モデルは、トレーニングセットにサンプルがあるかどうかを推測することを目的とした、メンバシップ推論攻撃(MIA)の影響を受けやすい。
既存の作業では、勾配上昇を利用してトレーニングデータの損失分散を拡大し、プライバシリスクを軽減する。
本稿では,勾配降下によるトレーニング損失分布の分散化を可能にする新しい手法であるConvex-Concave Lossを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:51:47 GMT)
A generalizable framework for low-rank tensor completion with numerical priors [16.4] 本稿では、低ランクテンソル完備化のための最初の一般化可能なフレームワークである一般化CP分解完了(GCDTC)フレームワークを提案する。
Smooth Poisson Completion (SPTC) アルゴリズムは GCDTC フレームワークのインスタンス化であり,その性能は現状を超える。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:32:19 GMT)
Erase to Enhance: Data-Efficient Machine Unlearning in MRI Reconstruction [16.1] 本稿では,MRIタスクにおいて機械学習が可能であり,バイアス除去に有用であることを示す。
異なる臓器のデータセット間でどの程度の共有知識が存在するかを研究するためのプロトコルを構築しました。
本研究は, トレーニングデータを組み合わせることで, 幻覚や画像品質の低下につながることを明らかにした。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:20:08 GMT)
HistGen: Histopathology Report Generation via Local-Global Feature Encoding and Cross-modal Context Interaction [16.1] HistGenは、病理組織学レポート生成のための学習可能なフレームワークである。
スライド画像全体(WSI)と局所的およびグローバルな粒度からの診断レポートを整列させることで、レポート生成を促進することを目的としている。
WSIレポート生成実験の結果,提案手法は最先端モデル(SOTA)よりも大きなマージンで優れていた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:58:43 GMT)
Cephalometric Landmark Detection across Ages with Prototypical Network [16.1] 本稿では,CeLDAを提案する。
本手法は,画像特徴とランドマークプロトタイプを比較することで,ランドマーク検出のためのプロトタイプネットワークを利用する。
我々の知る限り、これは年齢層間での脳波のランドマーク検出のための統合ソリューションとデータセットを開発するための最初の取り組みである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:04:52 GMT)
MegActor: Harness the Power of Raw Video for Vivid Portrait Animation [16.0] MegActorは生のビデオの力を利用して、鮮やかな肖像画のアニメーションを作る。
本稿では,一貫した動きと表情を持つビデオを生成するための合成データ生成フレームワークを提案する。
さらに,運転映像への参照画像の外観の移動を図り,運転映像における顔の詳細の影響を排除した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:36:11 GMT)
SwinGNN: Rethinking Permutation Invariance in Diffusion Models for Graph Generation [16.0] 置換同変ネットワークに基づく拡散モデルは、グラフデータの置換不変分布を学習することができる。
我々は、効率的なエッジツーエッジ2-WLメッセージパッシングネットワークを利用する、$textitSwinGNN$と呼ばれる不変な拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:55:32 GMT)
DART-Math: Difficulty-Aware Rejection Tuning for Mathematical Problem-Solving [15.8] 本稿では,難解なクエリを合成フェーズに割り当てるDART(Difficulty-Aware Rejection Tuning)を提案する。
DARTは、合成フェーズ中に難しいクエリをより多くのトライアルに割り当て、難しいサンプルのより広範なトレーニングを可能にする。
データセットのさまざまなベースモデルを7Bから70Bまで微調整し、DART-MATHと呼ばれる一連の強力なモデルを作成しました。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:14:02 GMT)
BadSampler: Harnessing the Power of Catastrophic Forgetting to Poison Byzantine-robust Federated Learning [15.8] 本稿では,破滅的な忘れ物の導入によるビザンチン・ローバストFLの中毒問題に対処する。
最初に、一般化エラーを正式に定義し、破滅的な忘れ物との関係を確立し、BadSamplerという名前のクリーンラベルデータ中毒攻撃の開発への道を開く。
そこで我々は,この攻撃を最適化問題として定式化し,Top-$kappa$ サンプリングとメタサンプリングという2つのエレガントな逆サンプリング戦略を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:43:56 GMT)
Privacy Preserving Federated Learning in Medical Imaging with Uncertainty Estimation [15.6] 機械学習(ML)と人工知能(AI)は、特に医療において顕著な進歩を加速している。医療画像では、MLモデルは、疾患の診断、治療計画、治療後のモニタリングを改善するという約束を持っている。
患者のデータを取り巻くプライバシーに関する懸念は、正確で堅牢で一般化可能なモデルの開発とトレーニングに必要な大規模なトレーニングデータセットの組み立てを妨げる。
フェデレートラーニング(FL)は魅力的なソリューションとして登場し、データ(医療画像など)ではなくモデルトレーニング情報(段階的)を共有することで、組織がMLモデルのトレーニングに協力できるようにする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:35:52 GMT)
Code-Optimise: Self-Generated Preference Data for Correctness and Efficiency [15.6] Code-Optimiseは、正確性(パス、フェール)とランタイムの両方を学習信号として組み込んだフレームワークです。
私たちのフレームワークは軽量で堅牢で、オーバーフィッティングを減らすためのソリューションを動的に選択します。
副生成物として、生成した溶液の平均長はMBPPで48%、HumanEvalで23%減少する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:05:37 GMT)
BTS: Building Timeseries Dataset: Empowering Large-Scale Building Analytics [15.5] 建築は人間の健康に重要な役割を担い、住民の快適さ、健康、安全、安全に影響を及ぼす。
世界のエネルギー消費に大きく貢献し、総エネルギー使用量の3分の1を占める。
しかし、分析を構築する研究は、複数のビルディング操作におけるアクセス可能で、利用可能な、そして包括的な現実世界のデータセットが欠如していることによって妨げられている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:54:13 GMT)
Unveiling Implicit Table Knowledge with Question-Then-Pinpoint Reasoner for Insightful Table Summarization [15.5] 高品質なテーブルサマリを生成するには、暗黙の知識が重要です。
本稿では,新しいテーブル推論フレームワークであるQQ-then-Pinpointを提案する。
私たちの研究は、洞察力のある知識をセルフクエストできるプラグアンドプレイのテーブル推論器の構築に重点を置いています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:55:09 GMT)
DCS Chain: A Flexible Private Blockchain System [15.4] この研究は、DCS Chainという新しいプライベートブロックチェーンシステムを導入している。
中心となる考え方は、DCSメトリクスを定量化し、これらの3次元にわたってブロックチェーンのパフォーマンスを動的に調整することだ。
全体として、当社のシステムはDCS定量化、コンセンサスプロトコル調整、通信ネットワークシミュレーションなど、ブロックチェーン必需品の包括的なスイートを提供しています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:04:24 GMT)
"False negative -- that one is going to kill you": Understanding Industry Perspectives of Static Analysis based Security Testing [15.4] 本稿では,SASTを利用する開発者が経験した仮定,期待,信念,課題について質的研究を行う。
私たちは、さまざまなソフトウェア開発の専門知識を持つ20人の実践者と、深く、半構造化されたインタビューを行います。
私たちは、SASTに関連する開発者の認識と欲求に光を当てた17ドルの重要な発見を特定します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:46:47 GMT)
An Empirical Study on the Fairness of Foundation Models for Multi-Organ Image Segmentation [15.4] 肝臓, 腎臓, 脾臓, 肺, 大動脈などの臓器の3次元MRIおよびCTのベンチマークデータセットを前向きに収集する。
本研究では, 性別, 年齢, 身体集団指数(BMI)などの人口統計の詳細を文書化し, 曖昧さの分析を容易にする。
様々な要因を考慮に入れた包括的分析により,これらの基礎モデルにおいて重要な公平性に関する懸念が浮かび上がっている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:14:04 GMT)
Flee the Flaw: Annotating the Underlying Logic of Fallacious Arguments Through Templates and Slot-filling [15.3] 一般的な非公式な論理的誤字に対して、説明可能なテンプレートを4つ導入する。
LOGICデータセットから抽出した400の誤った議論に対して注釈研究を行う。
我々は、最先端の言語モデルが誤検出テンプレートの発見に苦労していることを発見した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:44:45 GMT)
Benchmarking Multi-Image Understanding in Vision and Language Models: Perception, Knowledge, Reasoning, and Multi-Hop Reasoning [15.3] マルチイメージMIRBベンチマークを導入し、複数の画像を比較し、分析し、推論する視覚言語モデルの能力を評価する。
私たちのベンチマークには、知覚、視覚世界知識、推論、マルチホップ推論の4つのカテゴリが含まれています。
オープンソースVLMはシングルイメージタスクにおいてGPT-4Vに接近することを示したが、マルチイメージ推論タスクでは大きなギャップが残っている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:02:18 GMT)
SFedCA: Credit Assignment-Based Active Client Selection Strategy for Spiking Federated Learning [15.3] フェデレーション学習のスパイクにより、リソースに制約のあるデバイスは、ローカルデータを交換することなく、低消費電力で協調的にトレーニングできる。
既存のスパイキングフェデレーション学習手法では、クライアントのアグリゲーションに対してランダムな選択アプローチを採用しており、不偏なクライアントの参加を前提としている。
本研究では,グローバルなサンプル分布バランスに寄与するクライアントを鑑定するために,クレジット割当に基づくアクティブクライアント選択戦略であるSFedCAを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:56:22 GMT)
Generating Educational Materials with Different Levels of Readability using LLMs [15.1] 本研究は,学習資料を特定の読みやすさレベルに書き換えつつ,意味を保ちながら書き直すことを目的としたレベル付きテキスト生成タスクを提案する。
我々は,GPT-3.5,LLaMA-2 70B,Mixtral 8x7Bを用いて,ゼロショットと少数ショットのプロンプトによって,様々な可読性レベルのコンテンツを生成する能力を評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:55:10 GMT)
What Matters in Learning Facts in Language Models? Multifaceted Knowledge Probing with Diverse Multi-Prompt Datasets [15.1] 我々は,大規模言語モデルの知識理解能力を評価するために,知識探索フレームワークBELIEF(-ICL)を導入する。
既存のデータセットよりも多様なプロンプトを持つMyriadLAMAを半自動生成します。
PLMの事実理解能力を正確かつ包括的に評価する上で,BELIEFsの有効性を検証した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:11:35 GMT)
MLEM: Generative and Contrastive Learning as Distinct Modalities for Event Sequences [14.9] 本研究では,イベントシーケンスに対する自己教師付き学習手法の適用について検討する。
これは、銀行、eコマース、ヘルスケアといった様々なアプリケーションにおいて重要なモダリティである。
MLEM(Multimodal-Learning Event Model)と呼ばれる新しい手法を開発した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:26:41 GMT)
How Well Do Multi-modal LLMs Interpret CT Scans? An Auto-Evaluation Framework for Analyses [14.9] 本研究ではGPTRadScore'という新しい評価フレームワークを紹介する。
GPT-4 with Vision (GPT-4V)、Gemini Pro Vision、LLaVA-Med、RadFMといったマルチモーダルLCMの、将来的な発見のための記述を生成する能力を評価する。
GPT-4に基づく分解手法を用いて、GPTRadScoreは生成した記述をゴールドスタンダードのレポート文と比較し、その精度を身体部分、位置、発見の種類で分析する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:43:18 GMT)
D2O:Dynamic Discriminative Operations for Efficient Generative Inference of Large Language Models [14.7] LLM(Large Language Models)における効率的な推論は、キー値(KV)キャッシュのメモリ要求の増加によって妨げられる。
従来のKVキャッシュ消去戦略は、注意点に基づく重要度の低いKVペアを優先し、コンテキスト損失や幻覚などの問題を引き起こす。
本稿では,KVキャッシュサイズを微調整せずに最適化するための2段階判別手法である動的識別操作(D2O)を紹介する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:01:51 GMT)
How Susceptible are Large Language Models to Ideological Manipulation? [14.6] 大規模言語モデル(LLM)は、大衆の認識や情報との相互作用に大きな影響を与える可能性がある。
このことは、これらのモデル内のイデオロギーを容易に操作できれば生じる可能性のある社会的影響に関する懸念を提起する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:14:02 GMT)
SelfCP: Compressing Over-Limit Prompt via the Frozen Large Language Model Itself [14.5] 長いプロンプトは、大規模言語モデルを使用する場合のハードウェアコストを大幅に上回る。
本稿では,自己圧縮器(SelfCP)を用いて,許容プロンプトを未修正のまま高密度ベクトルに圧縮する手法を提案する。
SelfCPは12$times$ over-mitプロンプトを高密度トークンで置き換えることで、メモリコストの削減と推論スループットの向上を実現している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:50:30 GMT)
A Survey of Fragile Model Watermarking [14.5] モデルの脆弱な透かしは、改ざんを検出する強力なツールとして徐々に現れてきた。
本稿では, モデルフラクタブルウォーターマーキングの創業以来の課題について概説する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:42:03 GMT)
The Solution for CVPR2024 Foundational Few-Shot Object Detection Challenge [14.3] 本稿では,視覚言語モデル(VLM)をオブジェクト検出に活用したFSOD(Foundational Few-Shot Object Detection)タスクの強化手法を提案する。
マルチモーダル大言語モデル(MM-LLM)を統合したVLM+フレームワークを提案する。
これらの参照表現を用いて、トレーニングセット内のすべての画像に対して擬似ラベルを生成し、元のラベル付きデータと組み合わせてVLMを微調整する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:03:02 GMT)
SRGS: Super-Resolution 3D Gaussian Splatting [14.3] 本稿では,高分解能(HR)空間における最適化を実現するために,超解像3Dガウススティング(SRGS)を提案する。
サブピクセル制約はHR空間における視点の増大のために導入され、多重低解像度(LR)ビューのサブピクセル・クロスビュー情報を利用する。
MIP-NeRF 360 や Tanks & Temples のような挑戦的なデータセットにおいて,HRNVS のレンダリング品質は LR 入力のみで向上する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:31:01 GMT)
Linear Convergence of Black-Box Variational Inference: Should We Stick the Landing? [14.2] ブラックボックス変分推論は、完全な変分族仕様の下で幾何学的(伝統的に「線形」と呼ばれる)速度で収束する。
また、正規閉形式エントロピー勾配推定器の既存解析を改善した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:33:56 GMT)
IR2QSM: Quantitative Susceptibility Mapping via Deep Neural Networks with Iterative Reverse Concatenations and Recurrent Modules [14.2] 深層学習に基づくQSM再構成のための新しいIR2QSM法を提案する。
リバースコンカニオンとミドルリカレントモジュール拡張U-netを4回繰り返して設計する。
IR2QSMを従来のアルゴリズムや最先端のディープラーニング手法と比較するためのシミュレーションおよびin vivo実験を行った。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:17:45 GMT)
CoSLight: Co-optimizing Collaborator Selection and Decision-making to Enhance Traffic Signal Control [14.1] 既存の作業は主に近隣の交差点を協力者として選択している。
我々は,共同作業者選択を学習すべき第2の方針として分離することを提案する。
具体的には、リアルタイムで選択ポリシーは、フェーズレベルと交差点レベルの特徴に応じて、最適なチームメイトを適応的に選択する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:43:01 GMT)
Pushing the Frontier on Approximate EFX Allocations [14.1] 本研究では, 付加的評価関数を持つエージェント群に対して, 分割不可能な商品群を割り当てる問題について検討する。
正確なEFXアロケーションが存在することが分かっている設定の厳密な一般化のために、我々は存在結果を得る。
この結果から, 近似EFXアロケーションの存在と計算のフロンティアを推し進めることができた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:01:37 GMT)
A Comprehensive Survey on AI-based Methods for Patents [14.1] AIベースのツールは、特許サイクルにおける重要なタスクを合理化し、強化する機会を提供する。
この学際的な調査は、AIと特許分析の交差点で働く研究者や実践者のリソースとして機能することを目的としている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:58:56 GMT)
BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models [14.0] 大規模言語モデル(LLM)は、しばしば推論中に過剰な自信に悩まされる。
本稿では,LLMパラメータの平均値と共分散値を連続的に調整するアルゴリズムであるバックプロパゲーション(BLoB)によるベイズ低ランク適応を提案する。
その結果,分布内および分布外の両方で評価した場合,BLoBの有効性を一般化と不確実性評価の観点から検証した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:15:04 GMT)
AgentReview: Exploring Peer Review Dynamics with LLM Agents [13.8] 本稿では,最初の大規模言語モデル(LLM)に基づくピアレビューシミュレーションフレームワークであるAgentReviewを紹介する。
本研究は、レビュアーの偏見による紙の判断の37.1%の顕著な変化を含む、重要な洞察を明らかにした。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:22:12 GMT)
Fast post-process Bayesian inference with Variational Sparse Bayesian Quadrature [13.4] 本稿では,既存の目標密度評価から高速な後続近似を得る手段として,プロセス後ベイズ推定の枠組みを提案する。
この枠組みでは,ブラックボックスと潜在的ノイズの可能性のあるモデルに対して,プロセス後近似推定法である変分スパースベイズ近似(VSBQ)を導入する。
本手法は,計算神経科学による難解な合成シナリオと実世界の応用について検証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:53:56 GMT)
Towards Enhancing the Reproducibility of Deep Learning Bugs: An Empirical Study [13.2] 本稿では,ディープラーニングのバグを再現する上で重要な課題について検討する。
重要な問題を改善する可能性のある編集動作と有用な情報を特定します。
165件のバグのうち148件を再現しました。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:42:46 GMT)
IPEval: A Bilingual Intellectual Property Agency Consultation Evaluation Benchmark for Large Language Models [13.1] IPEvalは、IPの作成、アプリケーション、保護、管理の4つの主要な領域にわたる2657の多重選択質問で構成されている。
評価手法には、ゼロショット、5秒ショット、および7つのLLMタイプに対するCoT(Chain of Thought)が含まれる。
GPTシリーズやQwenシリーズのようなモデルによる英語のパフォーマンスは優れており、中国語中心のLLMは中国語テストで優れている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:18:18 GMT)
Unusual charge density wave introduced by Janus structure in monolayer vanadium dichalcogenides [13.1] 物質の対称性は電荷密度波(CDW)を持つ遷移金属ジアルコゲナイド(TMD)のエキゾチック量子特性を決定する
逆対称性を破って、人工的に構築された格子であるヤヌス構造は、CDW状態と関連する性質をチューニングする機会を与える。
ここでは,VTe2の表面セレン化を用いて単層膜Janus VTeSeを作製した。
走査型トンネル顕微鏡では、回転対称性が3倍の異常なルート13-root13 CDW状態が観察され、特徴付けられる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:20:38 GMT)
Toward Exploring the Code Understanding Capabilities of Pre-trained Code Generation Models [13.0] 私たちは、事前訓練されたコード生成モデルからコード理解タスクへの知識の移行の先駆者です。
CL4Dはデコーダのみのモデルの表現能力を向上させるために設計された,コントラスト学習手法である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:52:14 GMT)
Estimating Knowledge in Large Language Models Without Generating a Single Token [12.9] モデルが特定のエンティティについてどの程度の知識を持つのかを、内部計算からのみ推定できるかどうかを考察する。
実験により、内部の主題表現を訓練した単純なプローブであるKEENが、両方のタスクで成功することが示された。
KEENはシンプルで軽量であるため、大きな言語モデルにおけるエンティティ知識のギャップとクラスタを特定するために利用することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:45:50 GMT)
SportQA: A Benchmark for Sports Understanding in Large Language Models [12.9] SportQAは、スポーツ理解の文脈で大規模言語モデル(LLM)を評価するために特別に設計されたベンチマークである。
SportQAには3つの難易度で70,000以上の複数の質問が含まれている。
以上の結果から,LSMは基本的なスポーツ知識において有能な性能を示す一方で,より複雑なシナリオベースのスポーツ推論に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:29:51 GMT)
LMPT: Prompt Tuning with Class-Specific Embedding Loss for Long-tailed Multi-Label Visual Recognition [12.6] 本稿では,クラス固有の埋め込み損失(LMPT)を即時チューニングするLTMLの統一フレームワークを提案する。
LTMLにおける従来の最先端手法とゼロショットCLIPを大きく上回っている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:45:57 GMT)
Teleporter Theory: A General and Simple Approach for Modeling Cross-World Counterfactual Causality [12.6] 世界の反事実的アプローチは、観測データを超えた因果関係の理解を拡張します。
対実変数と実世界の変数を含むクロスワールド変数の連関は、グラフィカルモデルの構築に挑戦する。
本稿では,カウンターファクトの汎用的でシンプルなグラフィカルな表現を確立するために,新しいテレポーター理論を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:49:27 GMT)
Bayesian Networks and Machine Learning for COVID-19 Severity Explanation and Demographic Symptom Classification [12.4] 新型コロナウイルスの隠れた情報を蒸留する3段階のデータ駆動方式を提案する。
第1段階では、バイエルンネットワーク構造学習法を用いて、新型コロナウイルスの症状の因果関係を同定する。
第2段階として、アウトプットは教師なし機械学習(ML)アルゴリズムをトレーニングするための有用なガイドとして機能する。
最終段階は、クラスタリングから得られたラベルを活用して、人口統計学的症状識別モデルをトレーニングする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:20:19 GMT)
PCIE_EgoHandPose Solution for EgoExo4D Hand Pose Challenge [12.3] 課題の主な目的は、RGBエゴセントリックなビデオ画像を用いて、21個の3D関節を含む手ポーズを正確に推定することである。
タスクの複雑さに対処するため,Hand Pose Vision Transformer (HP-ViT)を提案する。
HP−ViTは、MPJPEおよびRLE損失関数を利用して、3Dにおける関節位置を推定するViTバックボーンとトランスフォーマーヘッドとを備える。
提案手法は25.51MPJPEと8.49PA-MPJPEでハンドポースの1位を獲得した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:41:32 GMT)
A Compass for Navigating the World of Sentence Embeddings for the Telecom Domain [12.1] パブリックモデルとドメイン適応型から得られた複数の埋め込みを評価した。
我々は、微調整により平均ブートストラップの精度が向上し、信頼区間が短縮されるのを観察する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:03:34 GMT)
TabularFM: An Open Framework For Tabular Foundational Models [12.0] 基礎モデル(FM)は大量のデータから一般化されたパターンを学習することができる。
FMに関するほとんどの研究は、主にテキストや画像のような非構造化データや、時系列のような半構造化データに焦点を当てている。
このギャップに対応するために、構造化データのためのFMを開発する最先端の手法を取り入れたTabularFMというフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:36:03 GMT)
Block Circulant Codes with Application to Decentralized Systems [12.0] C_textBC[mu,lambda,omega,rho]$ with blocklength $n=mu(rho+omega)$ and dimension $k=muomega$。
ローカルコードはすべて$cal C_textBC[mu,lambda,omega,rho]$は$[rho+lambdaomega,lambdaomega,rho+1]$ generalized Reed-Solomon (RS)である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:22:20 GMT)
CM2-Net: Continual Cross-Modal Mapping Network for Driver Action Recognition [11.9] 本稿では,新たにやってくる各モダリティを継続的に学習する連続的クロスモーダルマッピングネットワーク(CM2-Net)を提案する。
我々は,識別的・情報的特徴を地図化するために,累積クロスモーダルマッピング・プロンプト(ACMP)を開発した。
Drive&Actデータセットで行った実験は、ユニモーダルドライバとマルチモーダルドライバの両方でCM2-Netの性能上の優位性を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:10:58 GMT)
Online Anchor-based Training for Image Classification Tasks [11.8] 我々はtextitOnline Anchor-based Training (OAT) という新しいアンカーベーストレーニング手法を提案する。
OAT法は、アンカーに基づくオブジェクト検出手法で提供される知見に導かれ、定義されたアンカーに対するクラスラベルのパーセンテージ変化を学習するためのモデルを訓練することを提案する。
OAT法の有効性を4つのデータセットで検証した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:31:39 GMT)
City-LEO: Toward Transparent City Management Using LLM with End-to-End Optimization [11.7] 本稿では,都市管理の効率化と透明性を高めるため,大規模言語モデル(LLM)に基づくエージェント(City-LEO)を提案する。
ヒューマンライクな意思決定プロセスでは、City-LEOは予測と最適化を相乗化するためにエンド・ツー・エンド(E2E)モデルも組み込んでいる。
計算結果から,City-LEOは実規模最適化問題に対するベンチマークにおいて優れた性能を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:16:58 GMT)
The Effectiveness of a Simplified Model Structure for Crowd Counting [11.6] 本稿では,単純な構造のみを用いて,高性能なクラウドカウントモデルを構築する方法について論じる。
本稿では,バックボーンネットワークとマルチスケール機能融合構造のみからなる,そのシンプルで効率的な構造を特徴とするFuss-Free Network(FFNet)を提案する。
提案するクラウドカウントモデルは,広く使用されている4つの公開データセットに対してトレーニングおよび評価を行い,既存の複雑なモデルに匹敵する精度を実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:16:55 GMT)
Jailbreak Paradox: The Achilles' Heel of LLMs [11.6] 基礎モデルの脱獄に関する2つのパラドックスを紹介する。
第一に、完璧なジェイルブレイク分類器を構築することは不可能であり、第二に、より弱いモデルは、より強い(パーレト支配的な意味で)モデルがジェイルブレイクされているかどうかを一貫して検出できない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:14:35 GMT)
Unleashing the Potential of Open-set Noisy Samples Against Label Noise for Medical Image Classification [11.6] クラス間の高い類似性は、開集合ノイズサンプルの同定を複雑にする。
一般的な手法では、ラベルノイズ軽減のためにオープンセットノイズサンプルのポテンシャルを最大限に活用することはできない。
本稿では,拡張ノイズ・ロバスト・コントラスト・オープンな特徴拡張フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:54:28 GMT)
Retrieval Meets Reasoning: Dynamic In-Context Editing for Long-Text Understanding [11.5] 動的インテキスト編集による情報検索を再現する新しい手法を提案する。
長大な文脈を拡張可能な外部知識として扱うことにより,本手法は対話的に関連情報を収集・統合する。
実験結果から,提案手法はコンテキスト限定LLMを効果的に活用し,マルチホップ推論に有効であることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:54:28 GMT)
Preventing Model Collapse in Gaussian Process Latent Variable Models [11.5] 本稿では,線形フーリエVMのレンズによるモデル崩壊に対する射影分散の影響を理論的に検討する。
我々は、スペクトル混合(SM)カーネルと微分可能乱数特徴(RFF)カーネル近似を統合することにより、カーネルの柔軟性が不十分なため、モデル崩壊に取り組む。
提案したVMは、アドバイスRFLVMと呼ばれ、さまざまなデータセットで評価され、さまざまな競合モデルよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:56:13 GMT)
Large Language Model as a Universal Clinical Multi-task Decoder [11.4] 本稿では,臨床用マルチタスクデコーダとして,事前学習された大規模言語モデルを用いた新しいパラダイムを提案する。
我々はこのフレームワークを数百のタスクにまたがって検証し、マルチタスク予測の容易性を示す。
新しいタスクへの例外的な適応性を示し、いくつかのケースでは印象的なゼロショットのパフォーマンスと、少数のシナリオではデータ効率が優れている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:58:36 GMT)
Data Poisoning to Fake a Nash Equilibrium in Markov Games [11.4] マルチエージェント強化学習(MARL)におけるオフラインデータ中毒攻撃の特徴について述べる。
我々は、一意なナッシュ集合、すなわち、それらのQ関数によって指定されたゲームの集合を提案する。
ユニークなナッシュセットは、データ中毒がセット内のすべてのプレイをプッシュした場合に限り、攻撃が成功するため、攻撃の中心となる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:39:02 GMT)
Contextualizing Argument Quality Assessment with Relevant Knowledge [11.4] SPARKは、関連する知識による文脈化に基づく議論品質を評価するための新しい手法である。
我々は、大きな言語モデルを利用してフィードバックを提供したり、隠れた仮定を推測したり、同様の品質の議論を提供したり、あるいは反論をしたりする4つの拡張を考案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:11:21 GMT)
Joint Optimization of Piecewise Linear Ensembles [11.3] ツリーアンサンブルは多くの予測タスクで最先端のパフォーマンスを達成する。
線形アンサンブル(JOPLEN)の組合せ最適化を提案する。
JOPLENは、余剰プロモーティング行列ノルムや部分空間ノルムを含むいくつかの一般的な罰則を非線形予測に適用することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:40:09 GMT)
Ents: An Efficient Three-party Training Framework for Decision Trees by Communication Optimization [11.3] セキュアなマルチパーティ計算に基づく意思決定ツリーのためのマルチパーティトレーニングフレームワークにより、複数のパーティが、プライバシ保護を備えた分散プライベートデータ上で、高性能モデルをトレーニングすることができる。
決定木のための既存のマルチパーティトレーニングフレームワークは、通信オーバーヘッドが大きいため、コミュニケーションの非効率性を実証する。
本稿では,コミュニケーション最適化による意思決定木のための効率的な3要素学習フレームワークであるEntsを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:24:16 GMT)
STEMO: Early Spatio-temporal Forecasting with Multi-Objective Reinforcement Learning [11.3] 本稿では,多目的強化学習に基づく早期時相予測モデルを提案する。
提案手法は,3つの大規模実世界のデータセットに対して優れた性能を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:16:33 GMT)
Pretraining Strategy for Neural Potentials [11.3] 本稿では,グラフニューラルネットワーク(GNN)のマスク事前学習手法を提案する。
GNNは、分子からマスクされた原子に関連する空間情報を回収し、原子の力場に移動して微調整することで事前訓練される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:19:42 GMT)
Enhancing Spatio-temporal Quantile Forecasting with Curriculum Learning: Lessons Learned [11.2] 問題時間データ(ST)データのトレーニングモデルは、データ自体の複雑で多様な性質のため、オープンな積み重ねとなる。
モデルの性能が元のSTデータに基づいて直接訓練されることを保証することは困難である。
本稿では,空間的,時間的,定量的な視点を対象とする3種類のカリキュラム学習を取り入れた革新的パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:23:10 GMT)
Detecting Errors through Ensembling Prompts (DEEP): An End-to-End LLM Framework for Detecting Factual Errors [11.1] 本稿では,テキスト要約における事実誤り検出のためのエンドツーエンドフレームワークを提案する。
我々のフレームワークは、様々なLCMプロンプトを使用して、事実の矛盾を識別する。
我々は、アンサンブルされたモデルを校正し、テキストが実際に一貫した、あるいは幻覚のない、経験的に正確な確率を生成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:59:37 GMT)
Identifying Performance-Sensitive Configurations in Software Systems through Code Analysis with LLM Agents [10.9] PerfSenseは、最小限のオーバーヘッドでパフォーマンスに敏感な設定を識別するフレームワークである。
PerfSenseは、開発者とパフォーマンスエンジニアをシミュレートするために、LLM(Large Language Models)を使用している。
PerfSenseはパフォーマンスに敏感な構成の分類において平均64.77%の精度を達成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:22:48 GMT)
Accelerating Depthwise Separable Convolutions on Ultra-Low-Power Devices [10.7] 分離可能な畳み込みブロックを構成する深さと点の異なるカーネルを融合させる方法を模索する。
我々のアプローチは、異なるデータレイアウトを組み合わせることで、メモリ転送に要する時間を最小化することを目的としている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:32:40 GMT)
Code Agents are State of the Art Software Testers [10.7] ユーザ問題をテストケースに形式化するLLMベースのコードエージェントについて検討する。
私たちは人気のあるGitHubリポジトリに基づいた新しいベンチマークを提案し、現実世界の問題、地味なパッチ、ゴールデンテストを含む。
LLMは一般的に、コード修復用に設計されたCode Agentsを使って、関連するテストケースを生成するのに驚くほどうまく機能します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:54:37 GMT)
Advancing Cross-Domain Generalizability in Face Anti-Spoofing: Insights, Design, and Metrics [10.6] 本稿では,ゼロショットデータ領域の一般化におけるアンチ・スプーフィング性能の向上に向けた新たな視点を提案する。
従来のフレームワイドのスプーフィング予測に先立ち、ビデオワイドの予測のためにフレームレベルの確率を集約するニュアンス付き計量計算を導入する。
最終モデルは、データセット全体で既存の最先端メソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:15:22 GMT)
Generative Artificial Intelligence-Guided User Studies: An Application for Air Taxi Services [10.6] 本研究では,大規模言語モデル(LLM)を用いて,ユーザエクスペリエンスのための生成AI仮想シナリオを作成する。
主な貢献は、OpenAIのGPT-4モデルとAIイメージとビデオジェネレータを使用して仮想ATJを設計することであった。
LLMは,エアタクシーに対する参加者の態度を著しく改善する環境を特定し,提案する能力を示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:00:18 GMT)
Research and Implementation of Data Enhancement Techniques for Graph Neural Networks [10.6] 実用工学の応用では、より多くのデータが得られない状況や、データを取得するコストが高すぎる状況によって、いくつかのデータが影響を受ける。
本稿では、まず、グラフニューラルネットワークのデータ強化技術の要点を解析し、同時にグラフニューラルネットワークの奥行きの合成を紹介する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:07:38 GMT)
Leveraging Generative Models for Covert Messaging: Challenges and Tradeoffs for "Dead-Drop" Deployments [10.4] 自然言語テキストの生成モデルは、メッセージ転送ビットをモデルからサンプルのシーケンスにエンコードし、最終的にはもっともらしい自然言語のカバーテキストを生成する。
このようなパイプラインの自然な適用、すなわち、大規模でパブリックなインターネットプラットフォーム上での"デッドドロップ"の隠蔽メッセージングを考慮することで、これらの課題を具体化します。
このモデルベースのフォーマット変換暗号化パイプラインにシステムを実装し、その性能と(ヒューリスティックな)セキュリティを実証分析する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:52:51 GMT)
UBENCH: Benchmarking Uncertainty in Large Language Models with Multiple Choice Questions [10.3] UBENCHは、大きな言語モデルを評価するためのベンチマークである。
これには、知識、言語、理解、推論能力に関する3,978の質問が含まれている。
また,15個のLPMの信頼性を評価し,GLM4が最も優れていることを発見した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:50:38 GMT)
Entropy Constraints for Ground Energy Optimization [10.2] 量子多体系の基底エネルギーに対する下界を求めるために,フォン・ノイマンエントロピー制約を用いることを検討した。
基底エネルギー上の証明を得るための既知の方法は、典型的には局所可観測物の一貫性を使用し、半定値プログラミング緩和として表現される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:41:06 GMT)
Connected Speech-Based Cognitive Assessment in Chinese and English [10.2] 本稿では,コネクテッド音声の分析による認知機能評価のための新しいベンチマークデータセットと予測タスクを提案する。
このデータセットは、認知障害のレベルが異なる中国語と英語の話者のための音声サンプルと臨床情報で構成されている。
予測タスクは、軽度の認知障害診断と認知テストスコア予測を含む。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:41:48 GMT)
Accelerating Speculative Decoding using Dynamic Speculation Length [10.2] DISCOは投機的ルックアヘッド(SL)を動的に選択する新しい手法である。
4つのデータセットによる実験により、disCOは最高の静的SLベースラインに比べて平均10%のスピードアップに達することが示された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:34:35 GMT)
The Wisdom of a Crowd of Brains: A Universal Brain Encoder [10.1] 我々は,様々な主題/データセット/マシンのデータに基づいて,共同で学習できるユニバーサル脳エンコーダを提案する。
各画像における各脳軸の反応を予測するための訓練は,脳軸の埋め込みと多段階の深部画像特徴の相互注意を直接計算することで行う。
このボクセル中心のアーキテクチャにより、各脳のボクセルの機能的役割は、自然にボクセル・イメージのクロスアテンションから生じる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:17:07 GMT)
Pattern or Artifact? Interactively Exploring Embedding Quality with TRACE [10.1] TRACEは次元還元技術によって生成された2次元埋め込みの質を分析するツールである。
インタラクティブなブラウザベースのインターフェースにより、ユーザは様々な埋め込みを探索し、ポイントワイドな埋め込み品質を視覚的に評価することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:57:31 GMT)
Revisiting Non-separable Binary Classification and its Applications in Anomaly Detection [10.0] XOR の線形分類が可能であることを示す。
我々は、SVMの目的に適合し、マージン内または外にあるデータを識別する等分性分離を提案する。
分類器はスムーズな近似でニューラルネットワークパイプラインに統合できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:46:32 GMT)
Equivariant Frames and the Impossibility of Continuous Canonicalization [10.0] 非重み付きフレーム・アブラッシングは滑らかで非対称な関数を不連続な対称関数に変えることができることを示す。
我々は、点クラウド上の$SO(2)$,$SO(3)$,$S_n$の作用に対して、効率的で連続的な重み付きフレームを構築する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:07:34 GMT)
Retrieval-Augmented Generation for Generative Artificial Intelligence in Medicine [10.0] Retrieval-augmented Generation (RAG) により、モデルが外部知識の検索を利用してより正確なコンテンツを生成することができる。
RAGは、生成的AIを医療アプリケーションに接続する方法を開拓し、医療に株式、信頼性、パーソナライゼーションのイノベーションをもたらすことが期待されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:53:37 GMT)
Non-autoregressive Generative Models for Reranking Recommendation [9.9] 推薦システムでは、項目間のリスト内相関をモデル化することで、リランクが重要な役割を果たす。
本研究では, 効率と効率性を高めるために, 提案するレコメンデーション(NAR4Rec)の再評価のための非自己回帰生成モデルを提案する。
NAR4Recは、毎日3億人のアクティブユーザーがいる人気ビデオアプリKuaishouに完全にデプロイされている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:45:02 GMT)
Using LLMs to Aid Annotation and Collection of Clinically-Enriched Data in Bipolar Disorder and Schizophrenia [9.8] 本稿では、メンタルヘルス研究の強化を目的としたシーケンシャル・ツー・シークエンス・タスクにおける現代言語モデルの応用について述べる。
そこで本研究では,小モデルにおいて,ドメイン固有の臨床変数のアノテーション,メンタルヘルス機器のデータ収集が可能であること,そして,より優れた商用大規模モデルの実現が期待できることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:00:24 GMT)
Data Plagiarism Index: Characterizing the Privacy Risk of Data-Copying in Tabular Generative Models [9.8] 本稿では,データプラジャリズム指標(Data Plagiarism Index)と呼ばれる新しい類似度指標とメンバーシップ推論攻撃を提案する。
DPIはデータコピーの直感的な定義を評価し,それに対応するプライバシリスクを特徴付ける。
DPIによって識別されるデータコピーは、一般的な高性能アーキテクチャに対して、プライバシと公正性の両方の脅威をもたらす。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:05:24 GMT)
Generalization bounds for mixing processes via delayed online-to-PAC conversions [9.8] 統計的学習アルゴリズムの一般化誤差を非i.d.設定で検討する。
我々は,遅延フィードバックによるオンライン学習の削減に基づく,このシナリオの分析フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:31:15 GMT)
FLUX: Fast Software-based Communication Overlap On GPUs Through Kernel Fusion [9.7] 本稿では,GPUに依存する計算で通信遅延を著しく隠蔽する新しいFlux法を提案する。
Fluxは核融合によって最大96%の通信を重複させる可能性がある。
全体としては、様々なGPU世代と相互接続を持つ128GPUのクラスタ上で、Megatron-LM上でのトレーニングのために、最大1.24倍のスピードアップを達成することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:25:56 GMT)
LightPAL: Lightweight Passage Retrieval for Open Domain Multi-Document Summarization [9.7] Open-Domain Multi-Document Summarization (ODMDS) は多様な情報ニーズに対処するために重要である。
既存のアプローチは、まず関連するパスを見つけ、次に言語モデルを使って要約を生成するが、ODMDSでは不十分である。
ODMDSの軽量パス検索手法であるLightPALを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:57:27 GMT)
Scalable Rule Lists Learning with Sampling [9.7] 大規模データセットからほぼ最適なルールリストを学習するための新しいアプローチを提案する。
本アルゴリズムは,最適規則リストの近似を効率的に取得するためにサンプリングを用いる。
我々のアルゴリズムは、最先端の正確なアプローチに対して最大2桁の速度で、ほぼ最適なルールリストを識別する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:15:00 GMT)
Dual-Task Vision Transformer for Rapid and Accurate Intracerebral Hemorrhage Classification on CT Images [9.6] 脳内出血 (ICH) は、脳血管の破裂によって引き起こされる疾患である。
ICHと正常分類のためのデータセットを構築し,出血位置に基づく3種類のICH画像分類を行った。
ネットワーク内に2つの多層認識(MLP)ベースのデコーダを組み込んで,ICHの存在を同時同定した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:51:17 GMT)
STG4Traffic: A Survey and Benchmark of Spatial-Temporal Graph Neural Networks for Traffic Prediction [9.5] 本稿では,グラフ学習戦略と一般的なグラフ畳み込みアルゴリズムの体系的なレビューを行う。
次に、最近提案された空間時間グラフネットワークモデルの長所と短所を包括的に分析する。
ディープラーニングフレームワークPyTorchを用いたSTG4Trafficという研究を構築し,2種類のトラフィックデータセットに対して,標準化されたスケーラブルなベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:11:01 GMT)
Tracing the Unseen: Uncovering Human Trafficking Patterns in Job Listings [9.5] 我々は、米国内の8つの関連地域から収集された4千万件の求人情報を分析した(2006-2024)。
広告機会の種類,好ましくない接触の態様,投稿頻度を調べた結果,不審な広告を特徴付けるパターンが明らかになった。
この研究は、オンラインの求人ボードとコミュニケーションプラットホームが、人間のトラフィックのファシリテーターを知らないままにするための、より深い研究の必要を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:18:15 GMT)
Visually Robust Adversarial Imitation Learning from Videos with Contrastive Learning [9.2] C-LAIfOは、ビデオからの模倣学習のために設計された計算効率の良いアルゴリズムである。
我々は、視覚的相違のある専門家ビデオから模倣の問題を解析する。
我々のアルゴリズムはこの空間内で完全に模倣を行う。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:56:18 GMT)
Domain adaptation strategies for 3D reconstruction of the lumbar spine using real fluoroscopy data [9.2] 本研究は整形外科手術における手術ナビゲーション導入における重要な障害に対処するものである。
これは、少数の蛍光画像から脊椎の3次元解剖モデルを生成するためのアプローチを示す。
これまでの合成データに基づく研究の精度に匹敵する84%のF1スコアを達成しました。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:00:46 GMT)
Exploiting and Securing ML Solutions in Near-RT RIC: A Perspective of an xApp [9.2] Open Radio Access Networks (O-RAN) は破壊的な技術として登場している。
O-RANは、5Gと6Gのデプロイメント以上のネットワークプロバイダにとって魅力的なものだ。
RAN Intelligent Controllers (RIC)上でxAppsやrAppsのような機械学習(ML)ソリューションなどのカスタムアプリケーションをデプロイする能力は、ネットワーク機能やリソースの最適化において大きな可能性を秘めている。
しかし、O-RANとRCCのオープン性、初期標準、分散アーキテクチャは、複数の攻撃ベクトルを通じて悪用可能な脆弱性を多数導入している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:12:57 GMT)
Security and Privacy of 6G Federated Learning-enabled Dynamic Spectrum Sharing [9.2] フェデレートラーニング(FL)を利用したスペクトルセンシング技術が注目されている。
本稿では,FL対応6Gシナリオにおけるスペクトル共有技術の最新動向について概説する。
そして、6Gの実用的な攻撃ベクトルを特定し、AIによるセキュリティとプライバシの脅威を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:54:15 GMT)
Mixture of Scales: Memory-Efficient Token-Adaptive Binarization for Large Language Models [9.2] 我々はMixture of Scales(BinaryMoS)と呼ばれる新しいバイナライズ手法を導入する。
従来の方法とは異なり、BinaryMoSはバイナリ重み付けに複数のスケーリングエキスパートを使用し、各トークンにこれらの専門家を動的にマージして、スケーリングファクタを適応的に生成する。
実験の結果,BinaryMoSは様々な自然言語処理タスクにおいて従来のバイナライズ手法を超え,さらに2ビット量子化手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:32:23 GMT)
Attack on Scene Flow using Point Clouds [9.1] 本稿では,シーンフローネットワークに特化して,敵のホワイトボックス攻撃を導入する。
実験結果から, 生成した逆数例は平均点誤差において最大33.7の相対劣化が得られることがわかった。
この研究は、一次元または色チャネルの点雲を標的とする攻撃が、平均的な端点誤差に与える影響も明らかにしている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:40:23 GMT)
Differentiable All-pole Filters for Time-varying Audio Systems [9.1] 我々は時間変化のある全極フィルタを再表現し、勾配自体をバックプロパゲートする。
この実装は、効率の良い勾配評価のためにポール付きフィルタを含むオーディオシステムに応用することができる。
本研究では,位相器,時間変化型減算合成器,フィードフォワード圧縮器を用いて実世界の動的オーディオシステムをモデル化するための学習効率と表現能力を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:37:25 GMT)
Privacy in Speech Technology [9.0] 本論文は,音声技術に関するプライバシー問題に関するチュートリアルである。
モデルの脅威、ユーザのプライバシ保護のためのアプローチ、プライバシ保護メソッドのパフォーマンスの測定。
また、改善が緊急に必要となる、さらなる開発のためのラインも提示する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:00:26 GMT)
An Investigation of Neuron Activation as a Unified Lens to Explain Chain-of-Thought Eliciting Arithmetic Reasoning of LLMs [8.9] 大型言語モデル (LLM) は、Chain-of-Thoughtプロンプトによって引き起こされるときに強い算術的推論能力を示す。
我々は、先行研究による観察を統一的に説明するために、レンズとしての「ニューロン活性化」について検討する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:49:24 GMT)
Cycle-Correspondence Loss: Learning Dense View-Invariant Visual Features from Unlabeled and Unordered RGB Images [8.8] 本稿では、ビュー不変な高密度記述子学習のためのCCL(Cycle-Cor correspondingence Loss)を紹介する。
鍵となるアイデアは、新しい画像に対する予測を使って、有効なピクセル対応を自律的に検出することである。
評価の結果、他の自己教師付きRGB専用手法よりも優れており、教師付き手法の性能にアプローチしていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:44:56 GMT)
ADR: Attention Diversification Regularization for Mitigating Overfitting in Multiple Instance Learning based Whole Slide Image Classification [8.7] MIL(Multiple Instance Learning)は、スライド画像全体(WSI)の解析に有効であることを示した。
本稿では,MILの性能と注意値のエントロピーの関係を明らかにする。
本稿では,注意値の高エントロピーを促進する手法である注意多様性規則化(ADR)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:01:17 GMT)
Accelerating Complex Disease Treatment through Network Medicine and GenAI: A Case Study on Drug Repurposing for Breast Cancer [8.7] 本研究は、現実世界の証拠資料を調査することによって再活用できる薬物の予測を専門とするネットワークを導入することを目的とする。
本稿では、高度に構成されたChatGPTプロンプトエンジニアリングシステムによって強化された多層ネットワークメディカルアプローチを提案する。
本稿では,現実の証拠と疾患特異的シグナル伝達経路を結びつける新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:40:00 GMT)
Scalable MatMul-free Language Modeling [8.7] MatMul操作は大規模言語モデルから完全に除去可能であることを示す。
提案するMatMulフリーモデルは,最先端のトランスフォーマーと同等の性能を実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:30:06 GMT)
EMO-KNOW: A Large Scale Dataset on Emotion and Emotion-cause [8.6] 我々は15年間で980万件のツイートから導かれた感情原因の大規模なデータセットを紹介した。
データセットの新規性は、その幅広い感情クラスと抽象的な感情原因に由来する。
私たちのデータセットは、異なる人々の多様な感情反応を考慮に入れた感情認識システムの設計を可能にします。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:26:33 GMT)
Supporting Human Raters with the Detection of Harmful Content using Large Language Models [8.6] 大規模言語モデル (LLMs) は, 人間の判断と比較して90%の精度を達成できることを実証した。
人間の評価とLLMを統合した5つのデザインパターンを提案する。
提案した手法を現実世界のレビューキューで試行することで、利用可能な人間のレーダ容量の最適化が41.5%向上したことを共有しています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:12:50 GMT)
Growing Trees on Sounds: Assessing Strategies for End-to-End Dependency Parsing of Speech [8.6] 音声解析における2つの解析パラダイムの性能評価を目的とした一連の実験について報告する。
我々はこの評価をフランス語の大きな木バンクで行い、現実的な自発的な会話を特徴とする。
その結果, (i) グラフに基づく手法は, (ii) パラメータが30%少ないにもかかわらず, (ii) 音声から直接解析することで, パイプライン手法よりも優れた結果が得られることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:46:10 GMT)
Rationale-based Ensemble of Multiple QA Strategies for Zero-shot Knowledge-based VQA [8.5] K-VQA(Knowledge-based Visual Qustion-Awering)は、画像に描かれているもの以外の背景知識の活用を必要とする。
現在のゼロショットK-VQA法は、通常、イメージを単一のタイプのテキスト決定コンテキストに変換し、テキストベースのモデルを使用して、それに基づいて質問に答える。
本稿では,複数問合せ戦術の動的アンサンブルを実現するために,Rationale を用いたアンサーコンテキスト戦術のアンサンブル(REACT)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:06:38 GMT)
Class-specific Data Augmentation for Plant Stress Classification [8.4] 本稿では,遺伝的アルゴリズムを用いたクラス固有の自動データ拡張手法を提案する。
葉に症状がみられるダイズ(Glycine max (L.) Merr)ストレス分類に対するアプローチの有用性を実証した。
本手法は,ダイズ葉のストレスデータセットにおいて,平均クラス毎の精度97.61%,全体的な精度98%を達成し,高い性能を示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:01:25 GMT)
Aqulia-Med LLM: Pioneering Full-Process Open-Source Medical Language Models [8.3] 我々はAquilaをベースとしたバイリンガル医療用LLMであるAquila-Medを提案する。
我々は,中国語と英語の大規模医療データセットを構築し,事前トレーニングを継続し,高品質なSFTデータセットを構築した。
Aquila-Medは、シングルターン、マルチターンダイアログ、医療マルチチョイスの質問で顕著な結果を得る。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:30:07 GMT)
A Comprehensive Taxonomy and Analysis of Talking Head Synthesis: Techniques for Portrait Generation, Driving Mechanisms, and Editing [8.2] トーキングヘッド合成は、特定のコンテンツによって駆動される静止画像からポートレートビデオを生成する高度な方法である。
本調査は,3つの重要な領域 – ポートレート生成,駆動機構,編集技術 – に分類し,その技術を体系的にレビューする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:39:51 GMT)
W-Net: A Facial Feature-Guided Face Super-Resolution Network [8.0] Face Super-Resolutionは、高解像度 (HR) の顔画像を低解像度 (LR) の顔画像から復元することを目的としている。
既存手法は, 再建効率が低く, 事前情報の利用が不十分であるため, 理想的ではない。
本稿では,この課題に対処するため,W-Netと呼ばれる新しいネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:37:31 GMT)
What Did I Do Wrong? Quantifying LLMs' Sensitivity and Consistency to Prompt Engineering [8.0] 分類タスク,すなわち感度と一貫性の2つの指標を導入する。
第一に、感度はプロンプトの言い換えによる予測の変化を測定する。
第二に、一貫性は、同じクラスの要素の言い換えで予測がどのように変化するかを測定する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:59:24 GMT)
Chumor 1.0: A Truly Funny and Challenging Chinese Humor Understanding Dataset from Ruo Zhi Ba [7.9] われわれは、中国のRedditのようなプラットフォームであるRuo Zhi Ba(RZB)をベースとしたデータセットであるChumorを構築した。
ジョークごとの説明に注釈を付け,2つの最先端LCM, GPT-4o, ERNIE Botに対する人間の説明を評価する。
評価の結果,SOTA LLMにおいてもChumorは難易度が高く,人間によるChumorのジョークの説明はLLMによる説明よりもはるかに優れていることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:22:05 GMT)
A Single Graph Convolution Is All You Need: Efficient Grayscale Image Classification [7.8] 画像のベクトル化ビューを用いた新しいグレースケール(単一チャネル)画像分類手法を提案する。
単一の畳み込み層が精度を向上し、モデルの性能のばらつきを低減することが判明した。
ベンチマークグレースケール画像データセットによる実験結果から,提案モデルの有効性が示された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:36:51 GMT)
LaMDA: Large Model Fine-Tuning via Spectrally Decomposed Low-Dimensional Adaptation [7.8] 低ランク適応(LoRA)は、ファインチューン大言語モデル(LLM)のデフォルトのアプローチとなっている。
我々はスペクトル分解低次元適応(LaMDA)による大型モデル微調整を導入する。
LaMDAはトレーニング可能なパラメータとピークGPUメモリフットプリントを大幅に削減する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:52:59 GMT)
OccamLLM: Fast and Exact Language Model Arithmetic in a Single Step [7.7] 大規模言語モデル(LLM)は、複雑な算術演算を正確に実行する上で、依然として課題に直面している。
本研究では,テキスト単一自動回帰ステップの正確な演算を可能にするフレームワークを提案し,より高速でセキュアで解釈可能なLLMシステムを実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:51:42 GMT)
Large Language Models Play StarCraft II: Benchmarks and A Chain of Summarization Approach [7.7] VoyageやMetaGPTのような大規模言語モデル(LLM)エージェントは、複雑なタスクを解く大きな可能性を示す。
本稿では,生観測処理のための単一フレーム要約と,ゲーム情報解析のための多フレーム要約を含む要約手法を提案する。
1. LLMはStarCraft IIのシナリオに対処するのに必要な知識と複雑な計画能力を持っている; 2. 人間の専門家は、LLMエージェントのパフォーマンスは、StarCraft IIを8年間プレイした平均的なプレイヤーのそれに近いと考えている; 3. LLMエージェントはAIで構築されたエージェントを倒すことができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:07:37 GMT)
PCA-Relax: Deep-learning-based groupwise registration for motion correction of cardiac $T_1$ mapping [7.7] テンプレートの必要性を省略し,すべてのベースラインイメージを同時に登録する,新しいディープラーニングベースのグループワイド登録フレームワークを提案する。
我々は,PCA-Relax''とよばれる手法と,他のベースライン法を社内の心臓MRIデータセット上で広範囲に評価した。
提案したPCA-Relaxは, 確立されたベースライン上での登録とマッピングの性能をさらに向上させた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:00:23 GMT)
Faithful Density-Peaks Clustering via Matrix Computations on MPI Parallelization System [7.6] 密度ピーククラスタリング(DP)は任意の形状のクラスタを検出し、非ユークリッド空間データをクラスタリングする能力を持つ。
本稿では,2種類のベクトル状距離行列と逆前ノードファイリングポリシを併用した忠実かつ並列なDP法を提案する。
本手法は,コミュニティ検出などの非ユークリッドデータをクラスタリングすると同時に,大規模ユークリッドデータをクラスタリングする場合の精度において,最先端の手法よりも優れる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:05:45 GMT)
Unlocking the Potential of Early Epochs: Uncertainty-aware CT Metal Artifact Reduction [7.5] CT(Computerd tomography)では、患者の金属インプラントの存在は、再建された画像に破壊的なアーティファクトをもたらすことが多い。
本稿では,初期トレーニング重量の復元結果から算出した不確実性画像が,高周波領域を効果的に強調することを発見した。
本稿では,MARネットワークを金属加工領域に集中させるために,不確実性画像を適応重みとして利用する不確実性制約(UC)損失を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:36:58 GMT)
On the Robustness of Language Models for Tabular Question Answering [7.5] 大規模言語モデル(LLM)は、特定の訓練なしにテーブル理解タスクに取り組むことが示されている。
我々は、ウィキペディアベースの$textbfWTQ$および財務報告ベースの$textbfTAT-QA$TQAデータセット上でLLMの堅牢性を評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:41:15 GMT)
Intermediate Distillation: Data-Efficient Distillation from Black-Box LLMs for Information Retrieval [7.4] textit Intermediate Distillationは、大規模な言語モデルをブラックボックスとして扱い、革新的なLLM-ranker-retrieverパイプラインを通じて知識を蒸留する。
提案手法は,1000のトレーニングインスタンスしか持たないレトリバーモデルの性能を大幅に向上させることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:41:41 GMT)
An Experimental Characterization of Combined RowHammer and RowPress Read Disturbance in Modern DRAM Chips [7.4] 我々は、RowHammerとRowPressを組み合わせたパターンを、3大DRAMメーカーすべてから84個の実DDR4 DRAMチップで特徴付けている。
以上の結果から,このRowHammerパターンとRowPressパターンの組み合わせは,最先端のRowPressパターンと比較して,最初のビットフリップを誘導するのに要する時間(最大46.1%高速)を著しく小さくすることがわかった。
その結果,両面パターンの2つの攻撃行のうちの1つからRowPressが引き起こした読み出し障害効果が,他方よりもはるかに重要であるという重要な仮説が得られた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:57:45 GMT)
PSLM: Parallel Generation of Text and Speech with LLMs for Low-Latency Spoken Dialogue Systems [7.3] テキストと音声の両方を処理するマルチモーダル言語モデルは、音声対話システムに応用できる可能性がある。
音声応答を生成するには、事前に書かれた応答を生成する必要があり、音声シーケンスはテキストシーケンスよりもかなり長い。
本研究では,テキストと音声の並列生成を支援するために,言語モデルの入力シーケンスと出力シーケンスを拡張することで,これらの問題に対処する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:23:54 GMT)
A data-centric approach for assessing progress of Graph Neural Networks [7.2] グラフニューラルネットワーク(GNN)はノード分類タスクにおいて最先端の結果を得た。
主な改善点はマルチクラスの分類であり、各ノードが複数のラベルを持つ場合に焦点を当てない。
マルチラベルノード分類を研究する上での第一の課題は、公開データセットの不足である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:41:40 GMT)
Active Adaptive Experimental Design for Treatment Effect Estimation with Covariate Choices [7.2] 本研究では,平均治療効果(ATE)を効率的に推定するための適応実験を設計する。
適応実験の各ラウンドでは、実験者が実験ユニットをサンプリングし、治療を割り当て、その結果を直ちに観察する。
実験の最後に、実験者は収集されたサンプルを用いてATEを推定する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:20:08 GMT)
When Are Bias-Free ReLU Networks Like Linear Networks? [7.2] バイアスのないReLUネットワークは線形ネットワークと同じ学習力学を持つことを示す。
バイアスのないReLUネットワークは2層ネットワークよりも表現力が高いが、深い線形ネットワークと多くの類似点を共有している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:43:58 GMT)
MaskPure: Improving Defense Against Text Adversaries with Stochastic Purification [7.1] コンピュータビジョン設定では、ノイズ除去処理は入力画像の浄化に有用であることが証明されている。
いくつかの初期の研究は、NLP設定における敵攻撃を緩和するためにランダムノイズ化とデノイズ化の使用について検討している。
我々は拡散過程にインスパイアされた入力浄化テキストの手法を拡張した。
われわれの新しい手法であるMaskPureは、他の現代の防御法と比べて頑丈さを上回ったり、一致させたりします。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:27:13 GMT)
Gap-Free Clustering: Sensitivity and Robustness of SDP [7.0] ブロックモデル(SBM)におけるグラフクラスタリングについて,大クラスタと小クラスタの両方の存在下で検討した。
以前の凸緩和アプローチは正確な回復を達成するため、$o(sqrtn)$の小さなクラスタを許可しないか、最小の回復クラスタと最大の非回復クラスタの間のサイズギャップを必要とする。
本研究では,これらの要求を除去し,クラスタサイズによらず,大規模クラスタを確実に復元する半定値プログラミング(SDP)に基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:13:53 GMT)
Scan-to-BIM for As-built Roads: Automatic Road Digital Twinning from Semantically Labeled Point Cloud Data [7.0] 意味的ラベル付きポイントクラウドデータ(PCD)に基づく道路gDT自動作成のための新しいスキャン・ツー・ビルディング情報モデリングフレームワークを提案する。
提案手法は, 平均距離誤差1.46cm, 処理速度6.2m, 総距離1200mである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:48:37 GMT)
Hierarchical Associative Memory, Parallelized MLP-Mixer, and Symmetry Breaking [6.9] トランスフォーマーは、自然言語処理における主要なニューラルネットワークモデルとして、自らを確立している。
最近の研究は、MetaFormersで説明されているようなアテンションモジュールを他のメカニズムに置き換えることを検討している。
本稿では,Krotovの階層型連想メモリとMetaFormersを統合し,Transformerブロックの包括的表現を可能にする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:42:19 GMT)
Depth Anywhere: Enhancing 360 Monocular Depth Estimation via Perspective Distillation and Unlabeled Data Augmentation [6.8] ラベルのない360度データを効果的に活用する新しい深度推定フレームワークを提案する。
提案手法では,教師モデルとして最先端の視点深度推定モデルを用いて擬似ラベルを生成する。
我々は、Matterport3DやStanford2D3Dといったベンチマークデータセットに対するアプローチを検証し、深さ推定精度を大幅に改善した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:59:31 GMT)
Unsupervised explainable activity prediction in competitive Nordic Walking from experimental data [6.8] 本研究は,ノルディックウォーキングにおいて,スポーツ選手の活動に関する予測を自動説明し,正しい,正しく,不正な行為と不正行為を区別することに焦点を当てた。
提案したソリューションは、平均して100パーセント近いパフォーマンス指標を達成した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:29:07 GMT)
MBBQ: A Dataset for Cross-Lingual Comparison of Stereotypes in Generative LLMs [6.8] 生成的大規模言語モデル(LLM)は有害なバイアスやステレオタイプを示すことが示されている。
MBBQは、オランダ語、スペイン語、トルコ語でよく見られるステレオタイプを測定するデータセットである。
その結果、文化的な変化を抑えながら、英語以外の言語では、英語よりも偏見に悩まされていることが確認された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:33:33 GMT)
Neural Approximate Mirror Maps for Constrained Diffusion Models [6.8] 拡散モデルは視覚的に拘束力のある画像を作成するのに優れているが、トレーニングデータに固有の微妙な制約を満たすのに苦労することが多い。
一般制約に対するニューラル近似ミラーマップ(NAMM)を提案する。
MDMのような生成モデルは、学習されたミラー空間で訓練され、そのサンプルは逆写像によって設定された制約に復元される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:36:09 GMT)
Probabilistic Conceptual Explainers: Trustworthy Conceptual Explanations for Vision Foundation Models [6.7] 本稿では, 信頼度, 安定度, 疎度, マルチレベル構造, パーシモニーの5つのViTを説明するデシラタを提案する。
PACE(ProbAbilistic Concept Explainers)と呼ばれる変分ベイズの説明フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:17:57 GMT)
Can Large Language Models Code Like a Linguist?: A Case Study in Low Resource Sound Law Induction [6.7] 本稿では,大規模言語モデルのプログラミング能力を利用した言語に依存しない手法を提案する。
音響変化例からPython音声法則プログラムを生成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:46:04 GMT)
Plug-and-Play Grounding of Reasoning in Multimodal Large Language Models [6.7] MLLMにおけるプラグ・アンド・プレイグラウンドのための新しいフレームワークであるP2Gを紹介する。
P2Gは、画像内の重要な視覚的およびテキスト的要素への推論のオンザフライグラウンド化に専門家エージェントを使用している。
高解像度画像におけるオブジェクト間関係とテキスト内容の理解におけるMLLMの習熟度を評価するためのベンチマークであるP2GBを開発する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:57:14 GMT)
DASSF: Dynamic-Attention Scale-Sequence Fusion for Aerial Object Detection [6.6] 元のYOLOアルゴリズムは、異なるスケールのターゲットを認識する能力の弱いため、全体的な検出精度が低い。
本稿では,空中画像のターゲット検出のための動的アテンションスケール系列融合アルゴリズム(DASSF)を提案する。
DASSF法をYOLOv8nと比較すると,平均平均精度(mAP)は9.2%,2.4%増加した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:26:44 GMT)
Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges [6.6] 審査員として機能する様々な大規模言語モデル(LLM)の性能について検討する。
LLMの客観的知識推論のベンチマークとしてTriviaQAを利用する。
Llama-370B と GPT-4 Turbo はどちらも人間に優れた整合性があることが判明した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:49:54 GMT)
Probabilistic Temporal Prediction of Continuous Disease Trajectories and Treatment Effects Using Neural SDEs [6.6] 神経差分方程式(NSDE)による疾患進行の持続的時間的進化をモデル化するための最初の因果時間的枠組みを提示する。
本研究は,将来のMS障害(EDSSなど)と治療効果を正確に予測するための,不確実性に基づく因果学習(DL)モデルとして,最初の成功例を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:22:55 GMT)
From RAGs to rich parameters: Probing how language models utilize external knowledge over parametric information for factual queries [6.4] Retrieval Augmented Generation (RAG) は、あるユーザプロンプトに対する応答を増やすために、外部コンテキストを使って言語モデルを推論する能力を強化する。
このアプローチは、検索、質問/回答、チャットボットにおける言語モデルの様々な応用における実践的な応用により、人気が高まっている。
本稿では,RAGパイプラインを機械的に検討し,言語モデルがショートカットをとっており,パラメトリックメモリを最小限に頼りながら,文脈情報のみを活用することに強いバイアスを持つことを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:46:08 GMT)
ToxiCloakCN: Evaluating Robustness of Offensive Language Detection in Chinese with Cloaking Perturbations [6.4] 本研究では,現在最先端の大規模言語モデル (LLM) の体系的摂動データにおける攻撃的内容の同定における限界について検討する。
我々の研究は、検出メカニズムを回避するために使用される進化的戦術に対抗するために、攻撃言語検出におけるより高度な技術が緊急に必要であることを強調している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:44:56 GMT)
Automatic generation of insights from workers' actions in industrial workflows with explainable Machine Learning [6.4] 労働者の生産性に正確に匹敵するものは存在しない。
製造プロセスからのデータと作業者のパフォーマンスを組み合わせたMLソリューションが必要である。
本稿では、専門家と専門家の区別に説明可能なMLを適用することを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:55:11 GMT)
HARE: HumAn pRiors, a key to small language model Efficiency [6.3] 人間の先駆者は、ディープラーニングでデータを効率的に活用する上で重要な役割を担います。
既存のSmall Language Modelは、主にWebスクラッドな大規模トレーニングデータに依存している。
我々は、データ構築に人類の優先事項を活用する原則を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:59:03 GMT)
Investigating Annotator Bias in Large Language Models for Hate Speech Detection [6.3] 本稿では,ヘイトスピーチデータに注釈をつける際に,Large Language Models (LLMs) に存在するバイアスについて考察する。
具体的には、これらのカテゴリ内の非常に脆弱なグループを対象として、アノテータバイアスを分析します。
我々は、この研究を行うために、私たちのカスタムヘイトスピーチ検出データセットであるHateSpeechCorpusを紹介します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:21:16 GMT)
What makes two models think alike? [6.2] 本稿では,メタラーニング符号化モデル(MLEM)に基づく新しい手法を提案する。
MLEMは、類似性と相違の原因となる特定の言語的特徴を特定することによって、透過的な比較を提供する。
このアプローチは、音声や視覚などの他の領域や、人間の脳を含む他の神経系にも直接拡張できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:45:50 GMT)
SNN4Agents: A Framework for Developing Energy-Efficient Embodied Spiking Neural Networks for Autonomous Agents [6.1] スパイキングニューラルネットワーク(SNN)は、イベントベースのカメラやデータ変換前処理からのスパイクを使用して、スパース計算を効率的に行う。
本稿では,エネルギー効率の良いSNNを設計するための最適化手法からなるSNN4Agentsという新しいフレームワークを提案する。
我々のフレームワークは、68.75%のメモリ節約、3.58倍のスピードアップ、4.03倍のエネルギー効率で高い精度(84.12%の精度)を維持することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:36:11 GMT)
Reinforcement Learning from Multi-role Debates as Feedback for Bias Mitigation in LLMs [6.1] LLMをロールプレイングシナリオに組み込むことで、バイアスを認識し緩和する能力が向上することがわかった。
本稿では,フィードバックを代替する新たなバイアス緩和手法であるReinforcement Learning from Multi-role Debates as Feedback (RLDF)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:19:40 GMT)
RITA: A Real-time Interactive Talking Avatars Framework [6.1] RITAは、生成モデルに基づいて構築された高品質なリアルタイム対話型フレームワークを提供する。
当社のフレームワークは,ユーザのアップロードした写真からリアルタイム対話を行うデジタルアバターへの変換を可能にする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:53:15 GMT)
CollabStory: Multi-LLM Collaborative Story Generation and Authorship Analysis [5.9] 私たちはCollabStoryと呼ばれる、初めてLLM生成のコラボレーティブなストーリーデータセットを生成します。
オープンソース命令チューニング LLM を用いて,32k 以上のストーリーを生成する。
我々は、人間と人間の複数著者によるタスクや分析の標準となるPANタスクを拡張した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:35:12 GMT)
MegaVul: A C/C++ Vulnerability Dataset with Comprehensive Code Representation [5.8] MegaVulは、MegaVulという名前の新しい大規模かつ包括的なC/C++脆弱性データセットである。
CVEデータベースから脆弱性のクロール可能な記述情報をすべて収集し、28のGitベースのWebサイトから脆弱性関連のコード変更をすべて抽出しました。
MegaVulには、2006年1月から2023年10月までの169の異なる脆弱性タイプにまたがる、992のオープンソースリポジトリから収集された17,380の脆弱性が含まれている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:03:18 GMT)
Deep Temporal Deaggregation: Large-Scale Spatio-Temporal Generative Models [5.8] 本稿では,最新技術よりもパフォーマンスとスケールが大幅に向上する時系列の変圧器に基づく拡散モデルTDDPMを提案する。
これは、いくつかのシーケンス長、標準データセット、評価尺度にまたがる新しい包括的なベンチマークで評価される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:16:11 GMT)
SafeInfer: Context Adaptive Decoding Time Safety Alignment for Large Language Models [5.7] 安全に整合した言語モデルは、しばしば脆弱で不均衡な安全メカニズムを示す。
文脈適応型デコード型安全アライメント戦略であるSafeInferを提案する。
HarmEvalは、広範な安全性評価のための新しいベンチマークである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:03:23 GMT)
Authorship Obfuscation in Multilingual Machine-Generated Text Detection [5.7] オーサシップ難読化(AO)法は、機械生成テキスト(MGT)検出を回避できる。
我々は、11言語でよく知られた10のAO法と37のMGT検出法をベンチマークした。
その結果, ホモグリフ攻撃が特に成功した全てのテスト言語において, テストされたAOメソッドが自動検出の回避を引き起こす可能性が示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:54:59 GMT)
SeTAR: Out-of-Distribution Detection with Selective Low-Rank Approximation [5.6] ニューラルネットワークの安全なデプロイには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
トレーニング不要なOOD検出手法であるSeTARを提案する。
SeTARは、単純なグリーディ探索アルゴリズムを用いて、モデルの重量行列のポストホックな修正によるOOD検出を強化する。
私たちの研究は、OOD検出のためのスケーラブルで効率的なソリューションを提供し、この分野で新しい最先端を設定します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:55:13 GMT)
Discounted Adaptive Online Learning: Towards Better Regularization [5.6] 敵対的非定常環境におけるオンライン学習について検討する。
適応的アルゴリズム(例:Optimal)を提案し,適応的でないベースラインを広く改良する。
また、(Gibbs and Candes, 2021)スタイルのオンライン共形予測問題についても検討する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:47:21 GMT)
Harnessing spontaneous emission of correlated photon pairs from ladder-type giant atoms [5.5] はしご型三層巨大原子は高効率で強い相関性を持つ光子対を自然に放出することを示す。
局所位相を最適結合配列に符号化することにより、指向性2光子相関転写を実現することができる。
このような相関した光子対は、量子情報処理に大きな可能性を持つ。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:03:00 GMT)
Nonreciprocal Bundle Emissions of Quantum Entangled Pairs [5.5] サニャック効果を誘導するために共振器を回転させることで、非相互フォトンフォノンとフォトンマグノン超ラビ振動が得られる。
このような超ラビ振動に対する散逸チャネルを開くことで、絡み合った光子-フォノン対と光子-マグノン対の方向束放出を実現することができる。
この非相互放出は、精度で制御できるフレキシブルスイッチであり、異なる絡み合ったペアの同時放出は、異なる方向から共振器を駆動することで、反対方向にも現れる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:57:17 GMT)
UIFV: Data Reconstruction Attack in Vertical Federated Learning [5.4] Vertical Federated Learning (VFL)は、参加者が生のプライベートデータを共有することなく、協調的な機械学習を促進する。
近年の研究では、学習プロセス中にデータ漏洩によって、敵が機密性を再構築する可能性のあるプライバシーリスクが明らかにされている。
我々の研究は、実用的なVFLアプリケーションに真の脅威をもたらす、VFLシステム内の深刻なプライバシー上の脆弱性を露呈する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:18:52 GMT)
Knowledge Fusion By Evolving Weights of Language Models [5.4] 本稿では,複数のモデルを統一モデルに統合するアプローチについて検討する。
本稿では進化的アルゴリズムに触発されたEvolverという知識融合手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:12:34 GMT)
Statistics-Informed Parameterized Quantum Circuit via Maximum Entropy Principle for Data Science and Finance [5.4] 我々は最大エントロピー原理を用いて統計インフォームドパラメタライズド量子回路(SI-PQC)を設計する。
SI-PQCはトレーニング可能なパラメータを持つ静的構造を備えており、奥行き最適化回路のコンパイルを可能にする。
様々な量子アルゴリズムで準備と学習を行うための効率的なサブルーチンとして、SI-PQCは入力ボトルネックに対処する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:40:44 GMT)
SparseRadNet: Sparse Perception Neural Network on Subsampled Radar Data [5.3] レーダー生データは、しばしば過剰なノイズを含むが、レーダー点雲は限られた情報しか保持しない。
本稿では,適応的なサブサンプリング手法と,空間パターンを利用したネットワークアーキテクチャを提案する。
RADIalデータセットの実験により,SparseRadNetはオブジェクト検出における最先端(SOTA)性能を超え,自由空間セグメンテーションにおけるSOTA精度に近づいた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:35:59 GMT)
Predicting Award Winning Research Papers at Publication Time [5.3] 我々は、出版時に利用可能な情報にのみ依存して受賞する研究論文の可能性を予測する。
我々はArnetMinerの引用グラフを考慮した実験を行い、受賞論文の真理は32のコンピュータサイエンスカンファレンスから最高の論文賞の収集から得られた。
注目すべきは、高いリコールと低い偽陰性率は、そのモデルが賞を得ない論文を特定するのにいかにうまく機能するかを示している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:09:10 GMT)
DefSent+: Improving sentence embeddings of language models by projecting definition sentences into a quasi-isotropic or isotropic vector space of unlimited dictionary entries [5.3] 本論文は,DefSent として知られる以前の会議報告において,大幅な改善を示すものである。
そこで本稿では,制約を満たさない進入埋め込みを段階的に構築する手法を提案する。
その結果、定義文は無限辞書エントリの準等方的あるいは等方的ベクトル空間に投影できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:40:11 GMT)
General Distribution Learning: A theoretical framework for Deep Learning [5.3] 本稿では,機械学習と統計的タスクに対処する新しい理論フレームワークを提案する。
従来の統計機械学習とは別に、GD Learningは真の分布に焦点を当てている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:54:46 GMT)
ROOT-SGD: Sharp Nonasymptotics and Near-Optimal Asymptotics in a Single Algorithm [5.3] 我々は、textsf-SGD がCram'r-Rao 共因子の極限に収束することを証明する。
軽度で一点のヘッセン連続性条件が課されるとき、テキストsf-SGDの再スケールされた最後の反復は、幅広いステップサイズの選択に対してクラムラー・ラオ補因子との極限に収束することを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:03:10 GMT)
Composited-Nested-Learning with Data Augmentation for Nested Named Entity Recognition [5.2] Nested Named Entity Recognition (NNER)は、重複したエンティティ認識に対処することに焦点を当てている。
データ拡張は、アノテートされたコーパスの不足に対処するための効果的なアプローチである。
ネストワードとネストラベルを組み合わせてネストしたエンティティをモデル化する複合-ネスト-ラベル分類法(CNLC)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:46:18 GMT)
Competitive Learning for Achieving Content-specific Filters in Video Coding for Machines [5.2] 本稿では,人間指向のビデオ/イメージをマシンビジョンタスクに適応させるために,コンテンツ固有の後処理フィルタの協調最適化の有効性について検討する。
本稿では,競争学習の原則に基づく新しい学習戦略を提案する。
OpenImagesデータセットの実験では、BDレートが-41.3%から-44.6%に改善された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:45:57 GMT)
Knowledge Graphs in Practice: Characterizing their Users, Challenges, and Visualization Opportunities [5.1] 本研究は,19人の知識グラフ(KG)実践者へのインタビューから得られた知見を提示する。
我々は、KGの作成、探索、分析において、KG実践者が経験した重要な課題を特定する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:47:40 GMT)
Articulatory Encodec: Vocal Tract Kinematics as a Codec for Speech [5.1] 調音エンコーデックは音声のニューラルデコードの新しい枠組みである。
音声音声から音声特徴を推測し、音声特徴から音声音声を合成する。
これは普遍的で高性能な調音推論と合成の初めての実証である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:38:17 GMT)
Information-theoretic generalization bounds for learning from quantum data [5.1] 古典量子データに基づくトレーニングにより量子学習を記述するための数学的定式化を提案する。
我々は,古典的および量子的情報理論量の観点から,量子学習者の期待する一般化誤差を証明した。
我々の研究は、量子学習に関する量子情報理論的な視点を統一するための基礎を築いた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:47:54 GMT)
News Without Borders: Domain Adaptation of Multilingual Sentence Embeddings for Cross-lingual News Recommendation [5.0] 多言語ニュース消費者は ニュースレコメンデーターシステムに 挑戦している
既存のニューラルニュースレコメンダは、ゼロショットの言語間転送でかなりのパフォーマンス損失を被る。
我々は、事前訓練された大規模多言語文エンコーダ(SE)からドメイン特化されたニュース適応文エンコーダ(NaSE)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:01:53 GMT)
Formatics & dairy industry coalition: AI trends and present challenges [5.0] この研究は、AIを活用可能な産業上の課題を包括的に記述し、乳製品産業に焦点を当てている。
結論は、牛のモニタリングと農家に対する新しいアプローチを、彼らのニーズに先進的な技術ソリューションを提案して適用する上で有効である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:39:21 GMT)
Fighting Randomness with Randomness: Mitigating Optimisation Instability of Fine-Tuning using Delayed Ensemble and Noisy Interpolation [4.9] 雑音補間による遅延アンサンブル(DENI)と呼ばれる新しい緩和戦略を提案する。
DENIと3つのモデル,4つのチューニング戦略,7つのテキスト分類データセットの9つの代表的な緩和戦略を比較した。
DENIは,コストのごく一部を使用しながら,最良性能の緩和戦略(Ensemble)より優れていることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:20:36 GMT)
EUvsDisinfo: a Dataset for Multilingual Detection of Pro-Kremlin Disinformation in News Articles [4.9] EUvsDisinfoは、親クレムリンのテーマに関連する信頼できる、偽情報の多言語データセットである。
EUvsDisinfoプロジェクトのリーダーである専門家によって書かれたデバンク記事から直接引用されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:43:22 GMT)
QueerBench: Quantifying Discrimination in Language Models Toward Queer Identities [4.8] 我々は、LGBTQIA+の個人に関する英語大言語モデルによって生成された文の完成によって引き起こされる潜在的害を評価する。
この分析は、大きな言語モデルはLGBTQIA+コミュニティ内の個人に対してより頻繁に差別的行動を示す傾向があることを示している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:40:29 GMT)
Time Series Modeling for Heart Rate Prediction: From ARIMA to Transformers [4.7] 本研究では、LSTMを含む高度なディープラーニングモデルを用いて、MIT-BIHデータベースから心拍数時系列を予測する。
結果は、ディープラーニングモデル、特にPatchTSTが、複数のメトリクスで従来のモデルを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:55:37 GMT)
Head Pose Estimation and 3D Neural Surface Reconstruction via Monocular Camera in situ for Navigation and Safe Insertion into Natural Openings [4.6] 我々は、ベースプラットフォームとして3Dスライダを選択し、センサーとしてモノクルカメラを使用しました。
神経放射場(NeRF)アルゴリズムを用いて頭部の3次元モデル再構成を行った。
個々の頭部ポーズは、シングルカメラビジョンによって取得され、リアルタイムで3Dスライダ内で生成されたシーンに送信される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:42:09 GMT)
Improving the Evaluation and Actionability of Explanation Methods for Multivariate Time Series Classification [4.6] MTSCに適用された属性手法の評価手法であるInterpretTimeの分析に焦点をあてる。
元の論文結果を再現し、方法論のいくつかの重大な弱点を示し、その精度と効率を両立させるアイデアを提案する。
SHAPやFeature Ablationのような摂動に基づく手法は、データセット、分類器、タスクのセットや、勾配に基づく方法よりも優れていることが分かりました。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:18:46 GMT)
Learning Diffusion at Lightspeed [4.5] 観測データから拡散項を学習する既存のモデルは、複雑な二段階最適化問題に依存する。
既存のアーキテクチャの複雑さを完全に回避する新しいシンプルなモデル JKOnet* を提案する。
JKOnet*は、基礎となる拡散過程のポテンシャル、相互作用、および内部エネルギー成分を回収する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:44:07 GMT)
Recurrence over Video Frames (RoVF) for the Re-identification of Meerkats [4.5] 本稿では、Perceiverアーキテクチャに基づく繰り返しヘッドを用いて、ビデオクリップから埋め込みを反復的に構築するRecurrence over Video Frames (RoVF)という手法を提案する。
我々は、ウェリントン動物園で収集されたミーアカットのデータセット上で、DINOv2トランスフォーマーアーキテクチャに基づいて、この手法と様々なモデルを検証した。
提案手法は,最高の DINOv2 モデル (42%$) よりも高い 49%$ のトップ1再同定精度を実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:44:19 GMT)
Is the System Message Really Important to Jailbreaks in Large Language Models? [4.5] ジェイルブレイク(Jailbreak)とは、LSMが悪意ある質問をきっかけに発生した予期せぬ、潜在的に有害な反応のこと。
既存の研究はジェイルブレイクプロンプトの生成に重点を置いているが、システムメッセージの設定は実験によって大きく異なる。
メインストリームのLLMで実験を行い、さまざまなシステムメッセージ(ショート、ロング、ノー)でジェイルブレイクプロンプトを生成します。
本稿では,システムメッセージ進化アルゴリズム (SMEA) を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:22:19 GMT)
Can Go AIs be adversarially robust? [4.5] 簡単な防御によって,KataGoの最悪の性能が向上するかどうかを検討する。
これらの防御はいずれも、適応的な攻撃に耐えられるものではないことが分かっています。
我々の結果は、Goのような狭い領域でさえ、堅牢なAIシステムの構築は難しいことを示唆している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:57:49 GMT)
Variables are a Curse in Software Vulnerability Prediction [4.5] 本稿では、名前依存と呼ばれる新しいタイプのエッジ、名前依存に基づく抽象構文グラフ、および3プロパティ符号化方式と呼ばれる効率的なノード表現手法を紹介する。
これらの技術により、コードから具体的な変数名を取り除き、ディープラーニングモデルにより、多様なコード表現に隠されたソフトウェアの機能を学ぶことができます。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:02:29 GMT)
Efficient mapping of phase diagrams with conditional normalizing flows [4.4] 位相図全体を対象とした深層生成機械学習モデルを開発した。
同じ足場上での固相と液相を扱うために、置換同変アーキテクチャを用いる。
我々は、レナード・ジョーンズ系に対する固液共存線を予測することによって、我々のアプローチを実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:05:04 GMT)
CherryRec: Enhancing News Recommendation Quality via LLM-driven Framework [4.4] 我々は,textitCherryRecという名前のLarge Language Models (LLMs) を用いたニュースレコメンデーションフレームワークを提案する。
CherryRecは、レコメンデーションプロセスを加速しながら、レコメンデーションの品質を保証する。
提案手法の有効性を,ベンチマークデータセット上での最先端のベースライン手法と比較することにより検証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:33:38 GMT)
Local Recovery of Two-layer Neural Networks at Overparameterization [4.4] グローバルミニマ付近の2層ニューラルネットワークの損失景観構造について検討する。
対象関数を復元するパラメータの集合を決定し,その周りの勾配流を特徴付ける。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:29:30 GMT)
TADM: Temporally-Aware Diffusion Model for Neurodegenerative Progression on Brain MRI [4.4] 時間的認識拡散モデル(TADM)は,スキャン間の強度差による構造変化の分布を学習する。
トレーニング中、モデルのトレーニングプロセスを洗練するために、トレーニング済みのBrain-Age Estimator(BAE)を活用することを提案する。
我々のアプローチは、患者の結果を予測したり、患者に対する治療を改善するといった応用に役立ちます。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:00:49 GMT)
Multilingual Prosody Transfer: Comparing Supervised & Transfer Learning [4.4] 本研究は,事前学習したモノリンガルテキスト音声モデルを多言語条件に適応させる学習手法の評価に焦点をあてる。
その結果,スーパービジョンファインチューニング (SFT) と比較して,TLは性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:14:21 GMT)
CrossVoice: Crosslingual Prosody Preserving Cascade-S2ST using Transfer Learning [4.4] CrossVoiceは、高度なASR, MT, TTS技術を用いて、トランスファー学習による言語間韻律の保存を行う新しいカスケードベースの音声音声翻訳システムである。
我々は、CrossVoiceと直接S2STシステムを比較し、Fisher Es-En、VoxPopuli Fr-EnなどのタスクにおけるBLEUスコアの改善と、ベンチマークデータセットCVSS-T、IndicTTSの韻律保存について総合的な実験を行った。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:26:48 GMT)
Online-Adaptive Anomaly Detection for Defect Identification in Aircraft Assembly [4.4] 異常検出は、データ内の確立されたパターンから逸脱を検出する。
本稿では,移動学習を用いたオンライン適応型異常検出のための新しいフレームワークを提案する。
実験結果は0.975を超える検出精度を示し、最先端のET-NETアプローチよりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:11:44 GMT)
ROCOv2: Radiology Objects in COntext Version 2, an Updated Multimodal Image Dataset [4.4] 本稿では,放射線画像と関連する医療概念とキャプションからなるマルチモーダルデータセットである,COntext version 2 (ROCOv2)について紹介する。
2018年に公開されたROCOデータセットの更新版であり、2018年以来、PMCに35,705の新しいイメージが追加されている。
このデータセットは79,789枚の画像で構成され、ImageCLEFmedical Caption 2023のコンセプト検出とキャプション予測タスクにおいて、小さな修正が加えられている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:58:39 GMT)
Towards Goal-oriented Prompt Engineering for Large Language Models: A Survey [4.4] 大規模言語モデル(LLM)は、様々な下流タスクで顕著なパフォーマンスを示している。
本稿では,人為的仮定に基づく設計プロンプトの限界を明らかにすることを目的とする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:58:37 GMT)
Finite-Time Error Analysis of Soft Q-Learning: Switching System Approach [4.4] ソフトQラーニングは、エントロピー正規化マルコフ決定問題を解くために設計されたQラーニングのバリエーションである。
本稿では,ソフトQ-ラーニングアルゴリズムの有限時間制御理論解析を新規かつ統一的に提供することを目的とする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:45:03 GMT)
Research on Dangerous Flight Weather Prediction based on Machine Learning [4.4] 危険天候が飛行安全に与える影響は極めて重要である。
航空気象サービスの主な課題は、気象データを効果的に利用して、航空危険気象の早期警報能力を改善する方法である。
この研究では、有害な飛行天候を予測するために、サポートベクターマシン(SVM)モデルを用いている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:08:15 GMT)
RS-GPT4V: A Unified Multimodal Instruction-Following Dataset for Remote Sensing Image Understanding [4.3] 新しいLaGDパラダイムの下では、古いデータセットはもはや新しいタスクには適していない。
我々は、RSI理解のための高品質で多様なマルチモーダル命令追従データセットを設計した。
実験結果から, RS-GPT4Vによる微調整MLLMは, きめ細かい情報を記述できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:34:28 GMT)
Informed along the road: roadway capacity driven graph convolution network for network-wide traffic prediction [4.2] 本研究では,道路駆動グラフ畳み込みネットワーク(RCDGCN)モデルを導入し,静的キャパシティ特性を時間的設定に組み込んでネットワーク全体のトラフィック状態を予測する。
その結果, RCDGCN の精度は, ベースライン法よりも優れていた。
本研究は,交通システム管理にRCCGCNを用いることの可能性を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:04:23 GMT)
TREE: Tree Regularization for Efficient Execution [4.2] 本稿では,決定木の訓練中に不均一な確率分布を報知することにより,経路長を削減する手法を提案する。
具体的には,CARTアルゴリズムの不純物を規則化し,低不純物だけでなく,分割基準の評価にも高い非対称分布を求める。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:01:06 GMT)
ScenEval: A Benchmark for Scenario-Based Evaluation of Code Generation [4.2] 本稿では,この手法をコード生成のための大規模言語モデルを用いて実証する。
ScenEvalと呼ばれるベンチマークは、教科書、オンラインチュートリアルウェブサイト、Stack Overflowの問題から構築されている。
実験の結果,ChatGPTの性能はコーディングタスクの複雑さによって低下することがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:02:20 GMT)
Benchmarks and Metrics for Evaluations of Code Generation: A Critical Review [4.2] 大言語モデル(LLM)は、自然言語入力からプログラムコードを生成することを含むプログラミングタスクを支援するために開発された。
本稿では、これらのツールのテストおよび評価に関する既存の研究について批判的なレビューを行う。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:25:34 GMT)
MMUTF: Multimodal Multimedia Event Argument Extraction with Unified Template Filling [4.2] テキストプロンプトを介してテキストと視覚のモダリティを接続する統合テンプレートフィリングモデルを提案する。
我々のシステムはテキストEAEのSOTAを+7%上回り、マルチメディアEAEの2番目に高いシステムよりも一般的に優れている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:14:17 GMT)
Evaluating the Data Model Robustness of Text-to-SQL Systems Based on Real User Queries [4.1] 本論文は,テキスト・ツー・システムのデータモデルロバスト性について,実際に評価した最初の事例である。
サッカーDBはFIFAワールドカップ2022の文脈で9ヶ月にわたって展開されたシステムである。
データはすべて、システムにライブで質問された実際のユーザ質問に基づいています。これらの質問のサブセットを手動でラベル付けし、3つの異なるデータモデルに翻訳しました。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:10:01 GMT)
EEG2Rep: Enhancing Self-supervised EEG Representation Through Informative Masked Inputs [4.0] 本稿では,脳波からの自己教師型表現学習のための自己予測手法であるtextitEEG2Repを紹介する。
生の脳波からマスク入力を予測する代わりに、EEG2Repは潜在表現空間におけるマスク入力を予測する。
EEG2Repは、EEGデータに存在する重要な課題に対処するノイズに対して堅牢である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:31:49 GMT)
A Mel Spectrogram Enhancement Paradigm Based on CWT in Speech Synthesis [4.0] 連続ウェーブレット変換(CWT)に基づくメルスペクトル拡張パラダイムを提案する。
このパラダイムはより詳細なウェーブレット・スペクトログラムを導入しており、これは後処理ネットワークがデコーダによって出力されるメル・スペクトログラムを入力として取るのと同様である。
実験結果から,メルスペクトル拡張パラダイムを用いて合成した音声は,ベースラインモデルと比較してそれぞれ0.14と0.09の改善がみられた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:34:44 GMT)
A Neural Column Generation Approach to the Vehicle Routing Problem with Two-Dimensional Loading and Last-In-First-Out Constraints [4.0] 2次元負荷制約 (2L-CVRP) を持つ車両ルーティング問題は, 実用的, アルゴリズム的に重要な課題である。
本稿では,高度な機械学習技術,特に注意と再発機構の新たな組み合わせを統合した,正確なアルゴリズムを提案する。
提案アルゴリズムは、標準テストベッドにおけるオープンインスタンスの解決に成功し、機械学習モデルの導入による大幅な改善を実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:58:29 GMT)
Exploring Sensing Devices for Heart and Lung Sound Monitoring [4.0] 本稿では, 心臓と肺の音響特性について紹介するとともに, 聴診器の進化史について概説する。
本稿では、ECMセンサの基本概念と、この技術に基づく最近の聴診器について論じる。
ECMに基づくシステムの限界に対応するため、我々はマイクロエレクトロメカニカルシステム(MEMS)の可能性を探る。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:28:23 GMT)
Perturbation-based Effect Measures for Compositional Data [4.0] 構成的特徴に対する既存の効果測定は、現代の多くの応用には不十分である。
両問題に対処する仮説データ摂動に基づくフレームワークを提案する。
摂動依存再パラメータ化を導出することにより, 摂動効果の平均を効率的に推定できることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:21:48 GMT)
Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models [3.9] 本稿では,2次元画像データのみを用いて3次元シーン上での潜時拡散モデルを提案する。
我々は,スクラッチからでもスパースインプットビューからでも,わずか0.2秒で3Dシーンを生成することができることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:14:29 GMT)
On Differentially Private Subspace Estimation in a Distribution-Free Setting [3.9] 多くのデータセットは固有の低次元構造を持っている。
もし低次元構造を少量の勾配でプライベートに同定できたら、高周囲次元の支払いを避けることができる。
入力データセットにおける乗法的特異値ギャップの関数として定量化する最初の尺度を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:37:11 GMT)
Breaking the Ceiling of the LLM Community by Treating Token Generation as a Classification for Ensembling [3.9] 本稿では,Large Language Model (LLM) による各トークンの生成を,アンサンブルのための分類(GaC)として扱う。
実験では、試験、数学、推論などいくつかのベンチマークで最先端のLCMをアンサンブルし、我々の手法が既存のコミュニティのパフォーマンスを損なうことを観察する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:17:26 GMT)
XXLTraffic: Expanding and Extremely Long Traffic Dataset for Ultra-Dynamic Forecasting Challenges [3.8] XXLTrafficは、最も長いタイムパンとセンサーノード数の増加で利用可能な公開トラフィックデータセットである。
我々のデータセットは、既存の時間的データ資源を補完し、この領域における新しい研究の方向性につながる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:06:22 GMT)
Generative Pretrained Hierarchical Transformer for Time Series Forecasting [3.7] 予測のための新しい生成事前学習型階層型トランスフォーマーアーキテクチャ,textbfGPHTを提案する。
主流の自己教師付き事前学習モデルと教師付きモデルを用いて,8つのデータセット上で十分な実験を行う。
その結果、GPHTは、従来の長期予測タスクにおいて、様々な微調整およびゼロ/フェーショット学習設定のベースラインモデルを上回ることを示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:09:45 GMT)
Vernacular? I Barely Know Her: Challenges with Style Control and Stereotyping [3.7] 大規模言語モデル(LLM)は、教育や学習のアプリケーションでますます使われている。
GPT-3.5, GPT-4, GPT-4o, Llama-3, Mistral-instruct- 7Bの5種類の最先端モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:51:30 GMT)
Encoding Matching Criteria for Cross-domain Deformable Image Registration [3.7] 画像特徴と構造特徴の一致基準をモデル化する登録指向エンコーダを提案する。
ワンショット学習を用いてSを更新することにより、本手法は異なる領域に効果的に適応できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:33:22 GMT)
Accel-NASBench: Sustainable Benchmarking for Accelerator-Aware NAS [3.6] 本稿では,ベンチマーク構築のコストをかなりのマージンで削減する,訓練プロキシの検索を可能にする手法を提案する。
ベンチマークは正確で,最先端のハードウェア対応モデルをコストゼロで検索できることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:51:50 GMT)
ChangeViT: Unleashing Plain Vision Transformers for Change Detection [3.6] ChangeViTは、大規模な変更のパフォーマンスを高めるために、プレーンなViTバックボーンを採用するフレームワークである。
このフレームワークは3つの一般的な高解像度データセット上で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:59:08 GMT)
DELRec: Distilling Sequential Pattern to Enhance LLM-based Recommendation [3.5] 逐次レコメンデーション(SR)タスクは、ユーザの過去のインタラクションと好みの変化を関連付けることで、レコメンデーションの精度を高める。
従来のモデルは、トレーニングデータ内のシーケンシャルなパターンをキャプチャすることだけに集中し、外部ソースからアイテムタイトルに埋め込まれたより広いコンテキストやセマンティックな情報を無視することが多い。
DelRecは、SRモデルから知識を抽出し、LLMがより効果的なシーケンシャルレコメンデーションのためにこれらの補足情報を容易に理解し利用できるようにすることを目的としている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:00:59 GMT)
PlanRAG: A Plan-then-Retrieval Augmented Generation for Generative Large Language Models as Decision Makers [3.5] 我々は意思決定QAを、意思決定問題に対する最良の決定、$d_best$に答えるタスクとして定義する。
決定QAを検証できるベンチマークは存在しないので、決定QAベンチマークDQAを提案する。
我々はまた、反復計画列検索拡張(PlanRAG)と呼ばれる新しいRAG手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:25:35 GMT)
Weighted Sum of Segmented Correlation: An Efficient Method for Spectra Matching in Hyperspectral Images [3.5] 本研究では,ライブラリの様々なセグメントとテストスペクトル間の相関指標を算出する重み付き相関法について紹介する。
この手法の有効性は、地球と火星の両面のハイパースペクトル画像における鉱物の同定に評価されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:51:00 GMT)
Improving Signed Propagation of Graph Neural Network Under Multiple Classes [3.4] マルチクラスグラフにおける署名伝達を改善するための2つの新しい戦略を導入する。
提案手法はキャリブレーションとロバスト性の確保を両立させ,不確実性を低減させる。
6つのベンチマークグラフデータセットに対する広範な実験により,本定理の有効性を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:48:38 GMT)
MCSD: An Efficient Language Model with Diverse Fusion [3.4] MCSDモデルは線形スケーリングと高速推論速度を備えた効率的な言語モデルである。
推論過程を反復表現に定式化し、空間複雑性を$O(1)$に、時間複雑性を$O(N)$に分割する。
実験の結果, MCSDはトランスフォーマーに比べてスループットが高く, メモリ消費も低いことがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:08:01 GMT)
EarDA: Towards Accurate and Data-Efficient Earable Activity Sensing [3.4] 測定可能なデバイスは振幅やパターンに大きな変化を示し、特に動的で予測不能な頭部運動の存在下では顕著である。
本稿では,異なるセンサ位置をまたいだドメインに依存しない特徴を抽出するドメイン適応システムであるEarDAを提案する。
ヒューマンアクティビティ認識タスクでは88.8%の精度を達成し、ドメイン適応のないメソッドよりも43%改善した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:13:43 GMT)
MiSuRe is all you need to explain your image segmentation [3.4] 画像セグメンテーションのためのサリエンシマップを生成するアルゴリズムとしてMiSuReを提案する。
MiSuReが生成したサリエンシマップの目標は、無関係な領域を排除し、画像分割決定に不可欠な入力画像内のこれらの領域のみをハイライトすることである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:45:54 GMT)
Traffic Prediction considering Multiple Levels of Spatial-temporal Information: A Multi-scale Graph Wavelet-based Approach [3.3] 本研究では,複雑な交通ネットワークにおける交通状態を予測するためのグラフウェーブレット時間畳み込みネットワーク(MSGWTCN)を提案する。
シアトルのハイウェイネットワークやニューヨーク市マンハッタンの高密度道路ネットワークなど、モデルのパフォーマンスを調べるために、2つの実世界のデータセットが使用されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:05:47 GMT)
Inverse Optimization for Routing Problems [3.3] Inverse Optimization (IO) を用いたルーティング問題における意思決定者の行動学習手法を提案する。
提案手法の柔軟性と実世界の可能性を示し,ルーティング問題における意思決定者の判断から学ぶ。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:18:16 GMT)
Think-then-Act: A Dual-Angle Evaluated Retrieval-Augmented Generation [3.2] 大型言語モデル(LLM)は時相の誤りや幻覚的内容の生成といった課題に直面していることが多い。
二重角評価による検索拡張生成フレームワーク textitThink-then-Act を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:51:34 GMT)
Biorthogonal topological charge pumping in non-Hermitian systems [3.2] 量子化された電荷ポンプは、生物直交形式の下でのみ保証されることを示す。
我々は、損失環境下で量子化された電荷ポンプが観測された最近の実験について詳細に論じる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:17:20 GMT)
Limited quantum advantage for stellar interferometry via continuous-variable teleportation [3.2] 連続可変(CV)量子情報形式における恒星干渉法について考察する。
直接干渉法(DI)、局所ヘテロダイン測定、CVテレポーテーションに基づく戦略の3つの主要な戦略を特徴付ける。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:19:12 GMT)
Automated MRI Quality Assessment of Brain T1-weighted MRI in Clinical Data Warehouses: A Transfer Learning Approach Relying on Artefact Simulation [3.1] 本研究では,臨床データウェアハウス内における3次元勾配エコーT1強調脳MRIの自動品質制御のための革新的な転写学習手法を提案する。
まず、低コントラストを誘発し、ノイズを加え、動き人工物を導入することにより、研究データセットからの画像を意図的に破壊する。
3つのアーティファクト固有のモデルは、これらの破損した画像を用いて事前訓練され、異なる種類のアーティファクトを検出する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:53:07 GMT)
Restorer: Solving Multiple Image Restoration Tasks with One Set of Parameters [3.1] 複数の画像復元タスクのための統一的で効果的なソリューションを設計することに注力する。
以上の目的に基づき,U-Netアーキテクチャを用いたTransformer Network Restorerを提案する。
本稿では,Restorerが複数の実世界のイメージ復元タスクのバックボーンとして機能する可能性を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:18:32 GMT)
A Characterization of Semi-Involutory MDS Matrices [3.1] 対称暗号において、計算学的に単純な逆数を持つ最大距離分離行列は広い用途を持つ。
AES、SQUARE、SHARK、およびPHOTONのようなハッシュ関数のような多くのブロック暗号は拡散層にMDS行列を使用する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:57:46 GMT)
TourLLM: Enhancing LLMs with Tourism Knowledge [3.0] 我々はカルトゥールという文化・観光分野のための教師付き微調整データセットを構築した。
このデータセットは、観光知識ベースQAデータ、旅行情報データ、観光多様性QAデータという3つの部分から構成される。
カートゥールで微調整されたQwenベースのモデルであるTourLLMを提案し,アトラクションや旅行計画に関する情報の質を向上させる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:15:46 GMT)
Towards an Automatic Framework for Solving Optimization Problems with Quantum Computers [3.0] 従来の最適化問題を量子解法に自動的に変換するフレームワークが提案されている。
このフレームワークは、ソリューションの妥当性と品質を分析するための手段を提供する。
これは量子コンピューティングソリューションの自動化に向けた大きな進歩を表している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:56:10 GMT)
On the Diminishing Returns of Width for Continual Learning [2.9] フィードフォワードネットワーク(FFN)において、幅が直接記憶に関連があることを証明するために連続学習理論を解析する。
具体的には, ネットワーク幅の増大と, ネットワーク幅の増大が収率の低下を実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:22:10 GMT)
Investigating the Role of Explainability and AI Literacy in User Compliance [2.9] XAIの導入により,ユーザのコンプライアンスが向上する一方で,AIリテラシーの影響も受けていることがわかった。
また,AIリテラシーXAIとユーザのコンプライアンスの関係は,ユーザのメンタルモデルが介在していることも確認した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:28:12 GMT)
CleanGen: Mitigating Backdoor Attacks for Generation Tasks in Large Language Models [2.9] 我々は,大規模言語モデルにおける生成タスクに対するバックドア攻撃を軽減するために,CleanGenという新しい推論時間ディフェンスを開発した。
CleanGenは、最先端(SOTA)のLLMと互換性がある。
以上の結果から,CreateGenは5つのSOTAベースライン防御よりも攻撃成功率(ASR)が低いことが示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:10:38 GMT)
On the Principles behind Opinion Dynamics in Multi-Agent Systems of Large Language Models [2.8] 対話型大言語モデル(LLM)の集団内における意見の進化について研究する。
我々は、他のLSMの意見とコンセンサスを求めるLLMの傾向に基づいて、意見交換を促進するバイアスを識別する。
これらのバイアスは、意見の変化に対する説得力のある理由の欠如、議論への参加意欲、割当値の配分などの影響を受けている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:37:23 GMT)
Orangutan: A Multiscale Brain Emulation-Based Artificial Intelligence Framework for Dynamic Environments [2.8] 本稿では,脳に触発された新しいAIフレームワーク,Orangutanを紹介する。
複数のスケールで生体脳の構造と計算機構をシミュレートする。
物体観察時の人眼球運動をシミュレートする感覚運動モデルを開発した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:41:57 GMT)
User Centric Evaluation of Code Generation Tools [2.8] 本稿では,大規模言語モデル(LLM)のユーザビリティを評価するために,ユーザ中心の手法を提案する。
ベンチマークのテストケースにメタデータが含まれており、その使用を記述し、LLMの使用を模倣する多段階的なプロセスでテストを実行し、ユーザビリティを反映した品質属性セットに基づいてLLM生成ソリューションを測定し、ツールとしてLLMを使用する際のユーザエクスペリエンスに基づいたパフォーマンスを評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:45:05 GMT)
GFM4MPM: Towards Geospatial Foundation Models for Mineral Prospectivity Mapping [2.8] 本研究では,ラベルのない地理空間データのみを用いて,バックボーンニューラルネットワークを自己教師型で学習する自己教師型アプローチを提案する。
以上の結果から,自己超越が学習特徴の堅牢性を促進し,予測精度が向上することが示唆された。
我々は、説明可能な人工知能技術を利用して、個々の予測が地質学的観点から解釈できることを実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:24:28 GMT)
A variational Bayes approach to debiased inference for low-dimensional parameters in high-dimensional linear regression [2.7] 疎線形回帰における統計的推測のためのスケーラブルな変分ベイズ法を提案する。
我々のアプローチは、平均場近似をニュアンス座標に割り当てることに依存している。
これは前処理のステップに過ぎず、平均場変動ベイズの計算上の優位性を保っている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:27:44 GMT)
Can We Trust Large Language Models Generated Code? A Framework for In-Context Learning, Security Patterns, and Code Evaluations Across Diverse LLMs [2.7] 大規模言語モデル(LLM)は、ソフトウェア工学における自動コード生成に革命をもたらした。
しかし、生成されたコードのセキュリティと品質に関する懸念が持ち上がっている。
本研究は,LLMの行動学習をセキュアにするための枠組みを導入することで,これらの課題に対処することを目的とする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:29:34 GMT)
DLP: towards active defense against backdoor attacks with decoupled learning process [2.7] バックドア攻撃に対する防御のための一般的な訓練パイプラインを提案する。
トレーニング中, 清潔なサブセットと有毒なサブセットで異なる学習行動を示すモデルを示す。
提案手法の有効性は,様々なバックドア攻撃やデータセットにまたがる数多くの実験で実証されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:04:38 GMT)
Recognition of Dynamic Hand Gestures in Long Distance using a Web-Camera for Robot Guidance [2.6] 本研究では,最大20mの遠距離からの動的ジェスチャー認識モデルを提案する。
このモデルはSlowFastとTransformerアーキテクチャ(SFT)を統合し、ビデオフレームでキャプチャされた複雑なジェスチャシーケンスを効果的に処理し分類する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:17:28 GMT)
Is persona enough for personality? Using ChatGPT to reconstruct an agent's latent personality from simple descriptions [2.6] パーソナリティ(Personality)は、人間の認知の基本的な側面であり、行動、思考、感情に影響を与える様々な特徴を含んでいる。
本稿では,社会デコグラフィとパーソナリティ型情報を含む簡単な記述のみに基づいて,これらの複雑な認知属性を再構築する大規模言語モデル(LLM)の機能について考察する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:32:57 GMT)
Self-Distillation for Model Stacking Unlocks Cross-Lingual NLU in 200+ Languages [2.5] 機械翻訳モデル(MT)は優れた多言語表現を生成し、低リソース言語でも強力な翻訳性能が得られる。
本研究は,MTエンコーダをサンプル効率のよい自己蒸留法により,言語バックボーンに直接組み込むことにより,両世界のベストを得られる。
MT-LLMは、MTエンコーダから固有の多言語表現アライメントを保持しており、低リソース言語は英語中心のLLMに埋め込まれた豊富な知識を取り入れることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:00:20 GMT)
Benchmarking Label Noise in Instance Segmentation: Spatial Noise Matters [2.5] 本研究は,各種モデルによるセグメンテーションマスクの品質について光を当てる。
ラベルノイズによる学習に対処するために設計された一般的な手法の有効性に挑戦する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:54:48 GMT)
Real-space topological invariant for time-quasiperiodic Majoranas [2.5] システムスペクトルローカライザを活用することで、時準周期のマヨラナを同定できる実空間位相不変量を導入する。
2つの非共振周波数で駆動されるキタエフ連鎖に着目した数値シミュレーションを行い,本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:36:37 GMT)
Under the Hood of Tabular Data Generation Models: the Strong Impact of Hyperparameter Tuning [2.5] 本研究では,モデル統合評価の実践的ニーズに対処する。
高速な最適化を実現するために,各モデルに対する探索空間の削減を提案する。
ほとんどのモデルでは、データセット固有の大規模チューニングによって、オリジナルの構成よりもパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:27:38 GMT)
UAV-based Intelligent Information Systems on Winter Road Safety for Autonomous Vehicles [2.2] 限られた車線幅は、道路の容量を減らし、自動運転車による深刻な事故のリスクを高めることができる。
本研究では,無人航空機と自律走行車の観点から道路幅を区分し,推定するモデルを提案する。
提案するアプローチは、自動運転車に最新かつ正確な洞察を与え、冬の風景における適応性と意思決定能力を高めるために必要である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:53:37 GMT)
Sensitivity and Bandwidth of a Point-Source-Interferometry-based Inertial Measurement Unit Employing Large Momentum Transfer and Launched Atoms [2.2] 大運動量移動(LMT)を用いた点源干渉計による加速度計と回転検出の感度を理論的に解析する。
本稿では3軸の回転と加速度を計測できる慣性測定ユニット(IMU)の設計について述べる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:26:28 GMT)
A Deep Dive Into the Factors Influencing Financial Success: A Machine Learning Approach [2.1] 本稿では、機械学習アルゴリズムとアプローチを用いて、個別の経済的成功に寄与する様々な社会経済的要因について考察する。
労働統計局による1997年度全国縦断調査の結果を調査する。
このデータセットは、収入変数と個人の社会経済変数からなる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:04:42 GMT)
LOOC: Localizing Organs using Occupancy Networks and Body Surface Depth Images [2.1] 本研究では, 人体外から採取した単一深度画像から, 67の解剖学的構造を正確に位置決めするために, 占有ネットワークを用いた新しい手法を提案する。
本研究の貢献は,隠蔽構造定位のための占有ネットワークの適用,奥行き画像から解剖学的位置を推定する堅牢な手法,詳細な3次元解剖学的アトラスの作成等である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:57:36 GMT)
Adaptive Mean Estimation in the Hidden Markov sub-Gaussian Mixture Model [2.1] まず, 高次元設定における既存の結果の限界について検討し, 中心推定問題に対する最小限の最適手順を提案する。
我々の手順は、$sqrtdelta d/n + d/n$ ではなく、$sqrtdelta d/n + d/n$ という順序の最適値に達することを示し、$delta in(0, 1)$ はラベル間の依存パラメータである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:48:21 GMT)
How structured are the representations in transformer-based vision encoders? An analysis of multi-object representations in vision-language models [2.0] そのような抽象表現の極端な形は記号である。
この研究は、視覚エンコーダにおけるそのような構造化された表現の状態を推定する。
マルチオブジェクトシーンにおける基本的な下流タスクにおいて、これらのモデルの障害モードを引き起こすネットワークダイナミクスを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:27:36 GMT)
Estimating class separability of text embeddings with persistent homology [2.0] 本稿では、トポロジ的観点からテキストデータセットのクラス分離性を推定する教師なし手法を提案する。
本手法を応用して, 組込みの分離性向上を図り, トレーニングプロセスが停止した場合の検知方法について述べる。
その結果,本手法のクラス分離性の推定値と教師付き手法のクラス分離性の推定値が一致していることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:43:18 GMT)
Hierarchical Prompting Taxonomy: A Universal Evaluation Framework for Large Language Models [2.0] 大規模言語モデル(LLM)をより正確に評価するための5つの独特なプロンプト戦略からなる階層型プロンプトフレームワーク(HPF)を用いた分類法を提案する。
また、各タスクに適切なプロンプト戦略の選択を自動化するAdaptive Hierarchical Promptフレームワークについても紹介する。
本研究では,Llama 3 8B,Phi 3 3.8B,Mistral 7B,Gemma 7Bの4つの命令調整LDMを用いて,手動および適応的階層的プロンプトフレームワークを比較した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:12:27 GMT)
Memory Sequence Length of Data Sampling Impacts the Adaptation of Meta-Reinforcement Learning Agents [2.0] メタRLエージェントの探索と適応性に及ぼすデータサンプリング戦略の影響について検討する。
解析の結果,長メモリおよび短メモリシーケンスサンプリング戦略がメタRLエージェントの表現能力および適応能力に影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:41:40 GMT)
From Image to UML: First Results of Image Based UML Diagram Generation Using LLMs [2.0] ソフトウェア工学のプロセスでは、システムはまずモデリング言語を使って指定される。
大規模言語モデル(LLM)は、与えられた図面からUMLモデルの形式表現を生成するために使用される。
より具体的には、クラス図の画像を画像に表される実際のモデルに変換するための異なるLCMの能力を評価した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:34:43 GMT)
Location-based Radiology Report-Guided Semi-supervised Learning for Prostate Cancer Detection [1.9] 本稿では,臨床情報の自動抽出による半教師付き学習(SSL)の新たな手法を提案する。
本手法は無注釈画像を用いて前立腺病変の検出を改善することができることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:08:42 GMT)
Formal description of ML models for unambiguous implementation [1.9] 我々は、訓練されたモデルのトレース可能な分散と並列化の最適化を可能にするために、nnef言語を拡張することを提案する。
このような仕様が Xavier プラットフォーム上で cuda でどのように実装できるかを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:56:18 GMT)
Instruction Fine-Tuning: Does Prompt Loss Matter? [1.8] 教師あり指導微調整(SIFT)におけるPLWの効果について検討する。
PLWの小さな値(0.01 - 0.5)を使用することで、複数選択および短世代ベンチマークにおいてより良い結果が得られた。
この研究は、SIFTにPLWパラメータを提供することの重要性について、APIプロバイダに警告する役割を果たしている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:37:08 GMT)
To smooth a cloud or to pin it down: Guarantees and Insights on Score Matching in Denoising Diffusion Models [1.8] 微分拡散モデル(Denoising diffusion model)は、最近多くの領域で最先端の結果を得た生成モデルのクラスである。
我々は、F"ollmer flow"に似た既知の接続を利用して、F"ollmer drift"の確立されたニューラルネットワーク近似結果を拡張し、拡散モデルとサンプリング器をデノナイズする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:01:52 GMT)
Open-Source Web Service with Morphological Dictionary-Supplemented Deep Learning for Morphosyntactic Analysis of Czech [1.8] チェコ語形態素解析のためのオープンソースのWebサービスを提案する。
このシステムは、推論時の高精度な形態素辞書による深層学習モデルと再構成を組み合わせる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:14:58 GMT)
Nutmeg and SPICE: Models and Data for Biomolecular Machine Learning [1.7] 機械学習ポテンシャルを学習するための量子化学計算の集合であるSPICEデータセットのバージョン2について述べる。
我々は、その上にNutmegと呼ばれるポテンシャルエネルギー関数のセットを訓練する。
彼らは、電荷と極性分子のパフォーマンスを改善するために新しいメカニズムを使用し、大規模な電荷分布の基準を提供するために、事前計算された部分電荷をモデルに注入した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:54:21 GMT)
Transversal CNOT gate with multi-cycle error correction [1.7] スケーラブルでプログラム可能な量子コンピュータは、コンピュータが合理的な時間枠で達成できない計算集約的なタスクを解く可能性を持ち、量子優位性を達成する。
現在の量子プロセッサのエラーに対する脆弱性は、実用的な問題に必要な複雑で深い量子回路の実行に重大な課題をもたらす。
我々の研究は、現在の世代の量子ハードウェアを用いた超伝導体ベースのプロセッサにおいて、論理的CNOTゲートとエラー検出を併用できる可能性を確立した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:50:15 GMT)
Spatial Sequence Attention Network for Schizophrenia Classification from Structural Brain MR Images [1.7] 本研究は、統合失調症患者の分類のための深層学習手法を紹介する。
我々はSSA(Spatial Sequence Attention)と呼ばれる多様な注意機構を実装することでこれを実現している。
本研究は, 統合失調症分類のための既存のSqueeze & Excitation Networkよりも注意機構が優れていることを示すものである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:55:41 GMT)
Improving global awareness of linkset predictions using Cross-Attentive Modulation tokens [1.7] Cross-Attentive Modulation (CAM)トークンは、コンテキスト対応の計算を可能にするためにノードとエッジレベルの変調を条件付けるために使用されるクロスアテンティブユニットを導入している。
いくつかの置換不変アーキテクチャで実装し、私たちの仕事のメリットを証明するベンチマークをベンチマークします。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:51:49 GMT)
CLST: Cold-Start Mitigation in Knowledge Tracing by Aligning a Generative Language Model as a Students' Knowledge Tracer [1.7] 学生の知識トレーサとして生成言語モデルを整列させることにより、知識追跡におけるコールドスタート緩和を提案する(T)。
我々は、自然言語処理タスクとしてKTタスクをフレーム化し、自然言語で問題解決データを表現した。
各種ベースラインモデルを用いたデータ不足状況におけるCLSTの性能評価を行った。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:53:50 GMT)
Deep self-supervised learning with visualisation for automatic gesture recognition [1.7] ジェスチャーは非言語コミュニケーションの重要な手段であり、視覚的モダリティにより、人間が対話中に情報を伝達し、人々や人間と機械の相互作用を促進する。
本研究では, 深層学習を用いた手指の認識方法として, 教師あり学習法, 自己教師あり手法, 3次元移動骨格データに適用した可視化技術について検討する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:44:55 GMT)
Investigating Data Usage for Inductive Conformal Predictors [1.7] 帰納的共形予測器(ICP)は、点予測の代わりに予測セットを生成するアルゴリズムである。
限られた開発データや高価な開発データへのアクセスは、データを分割する最も効率的な方法に関するオープンな疑問である。
本研究は、この問題を探索し、トレーニングセットと校正セットの重複を許容する事例について考察する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:35:35 GMT)
Self-Adaptive Physics-Informed Neural Networks using a Soft Attention Mechanism [1.6] 非線形偏微分方程式(PDE)の数値解に対するディープニューラルネットワークの有望な応用として、物理情報ニューラルネットワーク(PINN)が登場した。
そこで本研究では,PINNを適応的にトレーニングする方法として,適応重みを完全にトレーニング可能とし,各トレーニングポイントに個別に適用する手法を提案する。
線形および非線形のベンチマーク問題による数値実験では、SA-PINNはL2エラーにおいて他の最先端のPINNアルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:09:32 GMT)
Unleashing the potential of prompt engineering in Large Language Models: a comprehensive review [1.6] 大規模言語モデル(LLM)の能力を解き放つ上で,迅速なエンジニアリングが果たす重要な役割について論じる。
この調査は、ロールプロンプト、ワンショット、少数ショットプロンプトといった、プロンプトエンジニアリングの基本原則を解明する。
本稿では,異なる視点からプロンプト手法の有効性を評価し,異なる手法を用いて評価する方法について議論する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:21:12 GMT)
Tomography of clock signals using the simplest possible reference [1.6] 有限サイズの系上の物理過程によって生成される全ての待ち時間分布は、崩壊エンベロープによって束縛されることが保証される。
運用可能な情報のみを用いて配信を再構築する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:00:03 GMT)
Does Context Help Mitigate Gender Bias in Neural Machine Translation? [1.5] 我々は、英語からドイツ語へのステレオタイプ専門職の翻訳と、バスク語からスペイン語への非形式的文脈による翻訳を分析している。
以上の結果から, 文脈認識モデルは女性用語の翻訳精度を著しく向上させることができるが, 性別バイアスの維持や増幅も可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:44:13 GMT)
A Comparative Study of Continuous Sign Language Recognition Techniques [1.5] CSLR(Continuous Sign Language Recognition)は、ポーズなしで連続的に実行される手話ジェスチャーのシーケンスの解釈に焦点を当てる。
本研究では,近年の深層学習C SLR手法を実証的に評価し,その性能を様々なデータセットや手話で評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:51:44 GMT)
Learned Compression of Encoding Distributions [1.5] エントロピーボトルネックは多くの学習された圧縮モデルで使用される共通成分である。
特定の入力に対する潜在データ分布と一致するように符号化分布を適応させる手法を提案する。
提案手法は,Kodakテストデータセット上でのBjontegaard-Delta(BD)レートの7.10%向上を実現する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:05:51 GMT)
Exact Community Recovery (under Side Information): Optimality of Spectral Algorithms [1.5] 一般の2つのコミュニティブロックモデルにおいて,コミュニティの正確な回復の問題について検討する。
正確な回復の情報理論的限界に対する側情報の影響を統一的に分析する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:48:59 GMT)
Positional Encoding Helps Recurrent Neural Networks Handle a Large Vocabulary [1.5] 位置符号化は入力データ上の時間指標の高次元表現である。
RNNは、データポイントの時間情報を自身でエンコードすることができ、位置エンコーディングの使用は、一見冗長/不要なように見える。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:53:53 GMT)
SDNIA-YOLO: A Robust Object Detection Model for Extreme Weather Conditions [1.5] 本研究では,スタイリゼーションデータ駆動型ニューラルイメージ適応型YOLO(SDNIA-YOLO)を提案する。
開発されたSDNIA-YOLOは、現実世界の霧(RTTS)と低照度(ExDark)テストセットで、少なくとも15%のmAP@.5が大幅に改善された。
実験はまた、極度の気象条件をシミュレートするスタイリングデータの顕著な可能性を強調した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:36:44 GMT)
Provable Guarantees for Model Performance via Mechanistic Interpretability [1.4] 本稿では,モデル性能に関する形式的保証を導出し,コンパクトに証明するために,機械的解釈可能性を用いることを提案する。
提案手法は, 最大K$タスクで訓練した151個の小型変圧器の精度について, 下限を正式に証明して試作する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:36:07 GMT)
What is in the Chrome Web Store? Investigating Security-Noteworthy Browser Extensions [1.2] この論文は、Chrome Web Store(CWS)の全体像を提供するための最初の試みである。
我々はChromeStatsが提供する履歴データを活用して、CWSのグローバルなトレンドとセキュリティへの影響を調査します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:25:06 GMT)
Sparsifying dimensionality reduction of PDE solution data with Bregman learning [1.2] 本稿では,エンコーダ・デコーダネットワークにおいて,パラメータ数を効果的に削減し,潜在空間を圧縮する多段階アルゴリズムを提案する。
従来のAdamのようなトレーニング手法と比較して、提案手法はパラメータが30%少なく、潜在空間が著しく小さいため、同様の精度が得られる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:45:30 GMT)
The Influencer Next Door: How Misinformation Creators Use GenAI [1.2] 我々は、非専門家がGenAIをリミックス、再パッケージ、そして(再)コンテンツの制作に利用し、彼らの個人的ニーズや欲求に応えていることに気付きました。
我々は、これらの突発的GenAIの使用が、新しいまたは加速された誤情報障害をいかに生み出すかを分析する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:29:48 GMT)
The Power of LLM-Generated Synthetic Data for Stance Detection in Online Political Discussions [1.2] オンライン政治議論において、合成データを利用して姿勢検出エージェントを訓練し、改善する方法を示す。
我々はMistral-7Bモデルにより、特定の議論のための合成データを生成する。
本研究は,合成データと非ラベルデータセットの最も情報性の高いサンプルを組み合わせることによる影響について検討する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:36:21 GMT)
A quantum algorithm to simulate Lindblad master equations [1.1] マルコフマスター方程式の族をシミュレートする量子アルゴリズムを提案する。
このアプローチでは、リンドブラッドマスター方程式の2階積公式を用いる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:08:11 GMT)
Gaussian Process on the Product of Directional Manifolds [1.1] 円核はフォン・ミーゼス分布に従って初めて提示される。
超トロイダルフォン・ミゼス核 (HvM) はハイパートリル上でGPを確立するために提案されている。
計算結果から,HvMベースのGPは従来のカーネル設計のパラメトリックモデルやGPよりも優れた追従精度が得られることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:40:03 GMT)
Embeddings between Barron spaces with higher order activation functions [1.1] 活性化関数の異なるバロン空間間の埋め込みについて検討する。
特定の関心の活性化関数は、$operatornameRePU_s(x)=max(0,x)s$によって与えられる整流電力単位(operatornameRePU$)である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:33:24 GMT)
Assessing AI vs Human-Authored Spear Phishing SMS Attacks: An Empirical Study Using the TRAPD Method [1.1] 本稿では,スピアフィッシングメッセージ生成におけるLarge Language Models(LLMs)の利用に対する懸念の高まりについて考察する。
我々のパイロット研究は、GPT-4と人間の著者が作成したSMSフィッシング(SMSフィッシング)メッセージの有効性を比較した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:47:16 GMT)
PARAFAC2-based Coupled Matrix and Tensor Factorizations with Constraints [1.1] AO(Alternating Optimization)とADMM(Alternating Direction Method of Multipliers)を用いたPARAFAC2ベースのCMTFモデルに適合するフレキシブルなアルゴリズムフレームワークを提案する。
様々なシミュレーションと実際のデータセットの実験は、提案したフレームワークの有用性と汎用性を示している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:05:31 GMT)
Additive regularization schedule for neural architecture search [1.0] 本稿では,ニューラルネットワーク構造最適化の問題について検討する。
加法要素の集合を含む損失関数を構成する方法を提案する。
提案手法は、効率的なニューラルネットワーク構造を発見し、低複雑性の正確なネットワークを提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:32:13 GMT)
Discussion Graph Semantics of First-Order Logic with Equality for Reasoning about Discussion and Argumentation [1.0] 議論と議論に関する推論に等しい一階述語論理の議論グラフ意味論を定式化する。
我々は、一階述語論理式(等式付き)のセマンティクスをトップダウンで定式化することで、一般性を達成する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:32:00 GMT)
Performant ASR Models for Medical Entities in Accented Speech [0.9] 我々は、93のアフリカアクセントの英語臨床データセットを用いて、複数のASRモデルを厳格に評価した。
分析の結果, 単語誤り率 (WER) が低いモデルではあるものの, 臨床的実体の誤差は高く, 患者の安全性に重大なリスクが生じる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:19:48 GMT)
Measuring Information Diffusion in Code Review at Spotify [0.9] ソフトウェアエンジニアリングのコアプラクティスとして、コードレビューの性質は、しばしば研究の対象となっている。
以前の研究では、コードレビューが参加者が情報を交換したり拡散したりするためのコミュニケーションネットワークを形成することが判明した。
ソフトウェア工学では人気があるが、この理論を裏付ける確証的な研究は存在しない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:29:09 GMT)
Uncovering communities of pipelines in the task-fMRI analytical space [0.9] 同様の結果、特に特定のパラメータを共有するパイプラインのサブセットがあることが示されています。
これらのパイプライン・ツー・ピペリンパターンは参加者のグループ間で安定しているが、異なるタスクをまたぐものではない。
コミュニティ間の差異を可視化することにより、パイプライン空間は主に脳の活性化領域の大きさによって駆動されることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:52:28 GMT)
Simulating nonlinear optical processes on a superconducting quantum device [0.9] 非線形波動相互作用問題をハミルトンシミュレーション問題に変換する量子化法を開発した。
超伝導デバイス上で2つの量子ビットを用いたアプローチを実証する。
この研究は、近未来の量子コンピューティングプラットフォームにおけるプラズマ問題がどのように解決されるかのポイント例を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:46:46 GMT)
PIPPIN: Generating variable length full events from partons [0.9] 本稿では,パルトンレベルの情報から検出器レベルでのフルイベントを直接生成するための新しい手法を提案する。
パートンと再構成されたオブジェクト空間間の多重度変動に対処するために、変換器、スコアベースモデル、正規化フローを用いる。
本手法は, この2つの空間間の遷移の複雑さに対処し, 極めて正確な結果を得る。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:47:28 GMT)
Topological Materials for Near-Field Radiative Heat Transfer [0.8] トポロジカル材料は量子状態と電磁エネルギーを持ち、ナノレーザーや量子フォトニクスシステムの恩恵を受けることができる。
表面モードをサポートするサブ波長系における近接場熱放射は、ナノスケール熱管理やエネルギー変換など様々な応用がある。
本研究では, 周期的および準周期的ナノ粒子アレイ, ディラック, ワイル半金属系材料, 大域対称性の破れた構造, およびその他のトポロジカル絶縁体などのトポロジカルな効果を近接場熱伝達に与える。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:03:45 GMT)
Ranking with Ties based on Noisy Performance Data [0.8] 我々は,その性能の測定がノイズにさらされている場合に,その性能に基づいて対象物群をランク付けする問題を考察する。
このシナリオでは、パフォーマンスは繰り返し測定され、結果として各オブジェクトに対する様々な測定結果が得られます。
部分ランク付けの助けを借りて,オブジェクト間の性能差を調査する方法を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:44:14 GMT)
Stackelberg Games with $k$-Submodular Function under Distributional Risk-Receptiveness and Robustness [0.8] 本研究では,不確実性や攻撃を受けやすいデータを用いた特徴選択などの機械学習問題に適用可能な,逆向き文脈における部分モジュラ最適化について検討する。
我々は、攻撃者(またはインターディクタ)とディフェンダーの間のStackelbergゲームに焦点を当て、攻撃者は$k$-submodular関数を最大化するディフェンダーの目的を最小化することを目的としている。
本稿では、分散リスク-Averse $k$-SIPと分散リスク-Receptive $k$-SIPと、それを解くための有限収束正確なアルゴリズムを紹介する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:30:46 GMT)
Vanishing Variance Problem in Fully Decentralized Neural-Network Systems [0.8] フェデレートラーニングとゴシップラーニングは、データプライバシの懸念を軽減するために考案された方法論だ。
本研究では,分散補正モデル平均化アルゴリズムを提案する。
シミュレーションの結果,Gossip学習は,フェデレート学習に匹敵する収束効率を実現することができることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:16:52 GMT)
Retrieve to Explain: Evidence-driven Predictions with Language Models [0.8] 本稿では,検索に基づく言語モデルであるRetrieve to Explain (R2E)を紹介する。
R2Eは、ドキュメントコーパスから取得した証拠に基づいて、研究質問に対するすべての可能な回答をスコアし、ランク付けする。
薬物標的同定の課題を科学的文献から評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:42:54 GMT)
Data Set Terminology of Deep Learning in Medicine: A Historical Review and Recommendation [0.8] 医学とディープラーニングに基づく人工知能工学は、数十年にわたる歴史を持つ2つの異なる分野を表している。
このような歴史によって、特定の方法が適用される一連の用語がもたらされる。
このレビューは、これらの用語の歴史的文脈を与え、これらの用語が医療AIの文脈で使用されるときの明確さの重要性を強調することを目的としている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:49:49 GMT)
OPFData: Large-scale datasets for AC optimal power flow with topological perturbations [0.8] 我々は現在までに解決されたAC-OPF問題の最も手軽に利用できるコレクションを提示する。
このコレクションは、既存の利用可能なデータセットよりも桁違い大きく、高容量のデータ駆動モデルのトレーニングを可能にする。
トポロジ的摂動(トポロジ的摂動、トポロジ的摂動、トポロジ的摂動、トポロジ的摂動、トポロジ的摂動、トポロジ的摂動(トポロジ的摂動、トポロジ的摂動、トポロジ的摂動、トポロジ的摂
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:46:21 GMT)
Training Diffusion Models with Federated Learning [0.7] 画像生成のための拡散ベースモデルのトレーニングは、一部のビッグテック企業によって主に制御されている。
本研究では,局所データを公開せずに拡散モデルの独立的かつ協調的な訓練を可能にする拡散モデル手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:02:48 GMT)
Projection Methods for Operator Learning and Universal Approximation [0.7] 任意のバナッハ空間上の連続作用素に対するリーレー・シャウダー写像を用いた新しい普遍近似定理を得る。
バナッハ空間において、複数の変数を持つ関数の$Lp$を演算子学習法として導入し、研究する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 04:44:05 GMT)
Towards Understanding Variants of Invariant Risk Minimization through the Lens of Calibration [0.7] 本稿では,Information BottleneckをベースとしたITMが,異なる環境における一貫したキャリブレーションを実現することを示す。
私たちの経験的証拠は、環境全体にわたって一貫した校正を示すモデルも十分に校正されていることを示している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:49:58 GMT)
Online Parameter Estimation for Continuously Monitored Quantum Systems [0.7] 量子力学系における量子軌道に沿った静的パラメータや遅いパラメータのオンライン(リアルタイム,シングルショット)推定の問題について考察する。
ログ型関数の勾配に基づくアプローチを用いて未知パラメータの最大推定値を計算するアルゴリズムを定式化する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:36:43 GMT)
An Optimal Transport Approach for Network Regression [0.6] 我々は、Fr'echet平均に基づく距離空間上の一般化回帰モデルにおける最近の発展の上に構築する。
本稿では,ワッサーシュタイン計量を用いたネットワーク回帰手法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:03:07 GMT)
MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts [0.6] MultiSocial データセットには 472,097 のテキストが含まれており、そのうち約58k が人文で書かれている。
このベンチマークを用いて、ゼロショットの既存の検出手法と微調整形式を比較した。
以上の結果から,微調整された検出器はソーシャルメディア上でのトレーニングに問題はないことが示唆された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:26:09 GMT)
The troublesome kernel -- On hallucinations, no free lunches and the accuracy-stability trade-off in inverse problems [0.6] 人工知能(AI)にインスパイアされた手法は、計算科学と工学を根本的に変え始めている。
方法が幻覚、偽物、現実的に見える人工物、不安定性、すなわちデータの摂動に対する感受性に苦しむという経験的証拠が増えている。
本稿ではこれらの現象の理論的基礎を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:18:47 GMT)
Sharp detection of low-dimensional structure in probability measures via dimensional logarithmic Sobolev inequalities [0.6] 本稿では、所定の基準測度$mu$の摂動として、目標測度$pi$を同定し、近似する手法を提案する。
我々の主な貢献は、多元対数ソボレフ不等式(LSI)と、このアンザッツとの近似との接続を明らかにすることである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:02:44 GMT)
Challenges with Differentiable Quantum Dynamics [0.5] 微分可能な量子力学は、複素数値初期値問題の自動微分を必要とする。
我々は,科学計算ライブラリにおける複雑で微分可能な数値積分の広範なサポートの必要性を実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:28:38 GMT)
W2E (Workout to Earn): A Low Cost DApp based on ERC-20 and ERC-721 standards [0.5] We present our DApp named W2E - Workout to Earn, a mobile DApp incentivizing exercise through tokens and NFT awards。
We deploy W2E into various-based networks, including testnets, Layer 2 network, and private network, to survey gas efficiency and execution time。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:40:11 GMT)
Mixing Artificial and Natural Intelligence: From Statistical Mechanics to AI and Back to Turbulence [0.5] この論文は、科学研究におけるAIの役割を反映しており、特に乱流研究に焦点を当てている。
これは、ディープニューラルネットワークの革新的利用を通じて、ラグランジアンモデルによる乱流の減少にAIが与える大きな影響を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:37:50 GMT)
Mixing Natural and Synthetic Images for Robust Self-Supervised Representations [0.5] 本稿では,実画像と合成画像を組み合わせた自己教師付き学習(SSL)事前学習フレームワークであるDiffMixを紹介する。
実験によると、DiffMixはさまざまなデータセットやドメイン転送タスクに対してSSLメソッドSimCLR、BarlowTwins、DINOを強化する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:49:11 GMT)
Curating Grounded Synthetic Data with Global Perspectives for Equitable AI [0.5] 我々は,実世界の多様性を基盤として,戦略的多様化を通じて充実した合成データセットを作成するための新しいアプローチを導入する。
我々は12の言語と125の国にまたがる包括的なニュース記事の集合を用いてデータを合成し、言語的・文化的表現の広さを確実にする。
予備的な結果は、従来のNERベンチマークのパフォーマンスが最大7.3%向上したことを示している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:58:42 GMT)
Deriving Hematological Disease Classes Using Fuzzy Logic and Expert Knowledge: A Comprehensive Machine Learning Approach with CBC Parameters [0.5] 本稿では、ファジィ論理則を応用して、専門分野の知識に基づく病気のクラスを導出する手法を提案する。
Fuzzy Logic Rulesは、あいまいさを扱う能力で有名な計算技術です。
予備結果は高い精度のレベルを示し、ファジィ論理を診断プロセスに統合する利点を裏付けるものである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:16:32 GMT)
Optimized QUBO formulation methods for quantum computing [0.5] 実世界の金融シナリオにインスパイアされたNPハード最適化問題に対して,我々の手法を適用する方法について述べる。
2つのD波量子異方体にこの問題の事例を提出し、これらのシナリオで使用される標準手法と新しい手法の性能を比較した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:14:31 GMT)
Architecture and protocols for all-photonic quantum repeaters [0.5] 全フォトニック量子リピータ方式は、光子損失と運用上のエラーに対するレジリエンスを約束する。
本稿では,新しいエミッタ・フォトニック・キュービット・ビルディングブロックと RGS プロトコルを提案する。
提案するビルディングブロックは,エンドノードに必要な量子メモリの総数を大幅に削減する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:06:48 GMT)
Segmentation and Characterization of Macerated Fibers and Vessels Using Deep Learning [0.5] 木製顕微鏡画像の自動深層学習セグメンテーション手法を開発した。
このモデルは32,640×25,920ピクセルの画像を分析し、有効な細胞検出とセグメンテーションを示し、mAP_0.5-0.95の78 %を達成する。
画像解析のためのユーザフレンドリーなWebアプリケーションを作成し、Google Colabで使用するコードを提供します。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:02:49 GMT)
Hypergraph: A Unified and Uniform Definition with Application to Chemical Hypergraph [0.5] 本稿では,非指向性,指向性,ネスト性を持つハイパーグラフの概念を統一するハイパーグラフの新たな定義を提案する。
具体的には、ハイパーエッジを単純なハイパーエッジ、ネストハイパーエッジ、あるいは有向ハイパーエッジと定義する。
この新たな定義の統一性とパワーは、可視化とともに、高次相関を表現するためにハイパーグラフを使うことを促進するべきである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:25:28 GMT)
GPT Czech Poet: Generation of Czech Poetic Strophes with Language Models [0.4] チェコ語で詩を生成するための新しいモデルを提案する。
詩文中のストロフェパラメータを明示的に指定することで生成プロセスの指導がモデルの有効性を強く向上することを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:19:45 GMT)
An Embedded Diachronic Sense Change Model with a Case Study from Ancient Greek [0.4] コーパスが小さく粗い古代の言語では、このような変化を正確にモデル化することは困難である。
本稿では,単語埋め込みと単語埋め込みを組み合わせた組込みチェインモデルであるEDiSCを紹介し,優れたモデル性能を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:23:46 GMT)
Reinforcement-Learning based routing for packet-optical networks with hybrid telemetry [0.4] このアルゴリズムは,FEC前BERで測定したリンク負荷変化やリンク劣化に対する最適ポリシーを再計算することにより,ネットワーク条件の変化に動的に適応することを示した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:32:12 GMT)
QOG:Question and Options Generation based on Language Model [0.4] 質問-オプション生成(QOG)は、与えられたコンテキストの一連の質問-オプションペアを生成するタスクである。
微調整シーケンス・ツー・シーケンス言語モデル(LM)に基づく3つの異なる手法を用いてQOGモデルを開発する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:09:58 GMT)
Symmetry Protected Two-Photon Coherence Time [0.4] 本研究では, 後方自発4光波混合から発生した2光子の対称性保護2光子コヒーレンス時間について, 87$Rbの原子で観察した。
この結果は、フォトニック量子状態の操作と制御における対称性の重要な役割を強調している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:44:22 GMT)
First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models [0.3] 本研究では,フローチャートに関連するタスクに対して,MLLMを様々な次元にわたって評価する最初の包括的手法であるFlowCEを提案する。
GPT4oモデルでさえ56.63のスコアしか得られないことがわかった。
オープンソースモデルの中で、Phi-3-Visionは49.97という最高スコアを獲得した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:03:31 GMT)
DeformTime: Capturing Variable Dependencies with Deformable Attention for Time Series Forecasting [0.3] 入力空間から相関時間パターンを捕捉しようとするニューラルネットワークアーキテクチャであるDeformTimeを提案する。
これまでに確立されたベンチマークを用いて,6つのMTSデータセットに関する広範な実験を行った。
その結果,DeformTimeはMSS予測タスクの大部分にわたる従来の競合手法と比較して精度が向上することがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:42:52 GMT)
Efficient algorithms for implementing incremental proximal-point methods [0.3] 機械学習において、モデルトレーニングアルゴリズムは、各計算ステップにおけるトレーニングセットのごく一部を観察する。
いくつかの研究ストリームは、よく知られた近位作用素による勾配よりもコスト関数に関するより多くの情報を活用する試みである。
近似演算子のアルゴリズム効率とソフトウェアモジュール性の両方を達成するために凸双対性理論を利用する新しいアルゴリズムフレームワークを考案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:35:53 GMT)
A Systematization of the Wagner Framework: Graph Theory Conjectures and Reinforcement Learning [0.3] アダム・ゾルト・ワグナー(Adam Zsolt Wagner)はReinforcement Learning (RL) を用いたグラフ理論の予想を解き放つアプローチを提案した。
様々なRLアルゴリズムを用いた4つの異なるシングルプレイヤーグラフ構築ゲームを提案する。
また、任意の予想に対して最も適切なニューラルネットワークアーキテクチャを選択するための原則的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:40:20 GMT)
Attention Networks for Personalized Mealtime Insulin Dosing in People with Type 1 Diabetes [0.3] 本稿では,自己注意型エンコーダネットワークを用いた強化学習エージェントが,この直感的な処理を効果的に模倣し,強化する方法を実証する。
その結果、センサー強化ポンプのシナリオでは16.5から9.6に、自動インスリンデリバリーのシナリオでは9.1から6.7に、血糖リスクは著しく低下した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:59:32 GMT)
High-Performance Hybrid Algorithm for Minimum Sum-of-Squares Clustering of Infinitely Tall Data [0.3] 本稿では,Infinitely Tall Data (MSSC-ITD) の最小二乗クラスタリングという,クラスタリング問題の新しい定式化を提案する。
現代の高性能コンピューティング技術を利用することで、HPClustは、有効性、計算効率、拡張性といった主要なクラスタリング指標を強化する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:19:56 GMT)
Physics-inspired spatiotemporal-graph AI ensemble for the detection of higher order wave mode signals of spinning binary black hole mergers [0.3] 準円、回転、不要な二元ブラックホールの融合を検出するための新しいAIモデルを提案する。
これらのAIモデルは、ハイブリッド拡張ニューラルネットワークを組み合わせて、重力波の短距離時間情報と長距離時間情報を正確にモデル化する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:18:22 GMT)
Rethinking Knee Osteoarthritis Severity Grading: A Few Shot Self-Supervised Contrastive Learning Approach [0.3] 現在はKelgren-Lawrence (KL) システムを用いて, 膝関節症(OA)の重症度を0から4に分類している。
近年の研究では、KLグレーティングシステムの主観性に関して懸念が高まっている。
本研究は、連続的な階調スケールを持つ自動システムの予備的な結果を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:36:18 GMT)
MAGIC: Generating Self-Correction Guideline for In-Context Text-to-SQL [0.3] 本稿では,自己補正ガイドライン作成を自動化する新しいマルチエージェント手法であるMAGICを紹介する。
MAGICは、マネージャ、修正、フィードバックエージェントの3つの特殊エージェントを使用する。
我々の実験によると、MAGICのガイドラインは、人間の作ったものよりも優れています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:06:06 GMT)
Comparison of Discrete Variable and Continuous Variable Quantum Key Distribution Protocols with Phase Noise in the Thermal-Loss Channel [0.2] 熱損失流路におけるDV-QKDおよびCV-QKDプロトコルに対する位相雑音の影響について検討する。
CV-QKDはDV-QKDに比べ,低相雑音では高い熱雑音では高い損失を許容できることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:34:03 GMT)
$S^3$ -- Semantic Signal Separation [0.2] ニューラル埋め込み空間における理論駆動型トピックモデリング手法を提案する。
S3$は、トピックを意味空間の独立した軸として概念化し、これらをブラインドソース分離で明らかにする。
我々のアプローチは、最も多種多様な、高度に一貫性のあるトピックを提供し、事前処理を必要とせず、これまでで最速の文脈に敏感なトピックモデルであることが示されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:12:18 GMT)
Iterative assembly of $^{171}$Yb atom arrays with cavity-enhanced optical lattices [0.1] 個々のアドレス可能な原子の大きな配列を組み立て、維持することは、中性原子ベースの量子コンピュータとシミュレータの継続的なスケーリングの鍵となる要件である。
我々は,光ツイーザとキャビティ強化光学格子の相乗的組み合わせに基づく,原子配列の組立のための新しいパラダイムを実証する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:55:22 GMT)
Tensor networks for non-invertible symmetries in 3+1d and beyond [0.1] ZX-ダイアグラムを用いて、3+1d格子$mathbbZ$ゲージ理論でウェグナー双対性を実装する非可逆作用素を定義する。
さらに、双対性を維持しながら$mathbbZ$ゲージ理論を変形し、トーラス上に9つの正確な基底状態を持つモデルを求める。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:00:15 GMT)
How Safe Am I Given What I See? Calibrated Prediction of Safety Chances for Image-Controlled Autonomy [0.1] 本稿では,生成的世界モデルに基づく学習パイプラインのファミリーを提案する。
安全インフォームドされた潜伏表現と欠落する安全ラベルを学習する上での課題を克服する。
画像制御システムの2つのケーススタディにおいて,提案した学習パイプラインを広範囲に評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:30:36 GMT)
Cyclic 2.5D Perceptual Loss for Cross-Modal 3D Image Synthesis: T1 MRI to Tau-PET [0.0] アルツハイマー病は認知低下とタウタンパク質などのバイオマーカーによって特徴づけられる認知症の最も一般的な形態である。
Tau-positron emission tomography (Tau-PET) は早期AD診断に有用であるが, 高いコスト, 限られた可用性, 侵襲性などによりアクセスし難い。
ニューラルネットワークを用いた画像合成により、よりアクセスしやすいT1強調磁気共鳴イメージング(MRI)画像からタウPET画像を生成することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:59:10 GMT)
Who Checks the Checkers? Exploring Source Credibility in Twitter's Community Notes [0.0] ソーシャルメディアプラットフォーム上での誤情報拡散は重大な懸念となっている。
この研究は、クラウドソースのファクトチェックにおける潜在的な役割にもかかわらず、Twitter Community Notesの特定の機能に焦点を当てている。
引用された情報源の大部分は、左派であり、高い事実性を持つニュースメディアであり、プラットフォームの事実チェックにおける潜在的なバイアスを示唆している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:47:58 GMT)
YOLO9tr: A Lightweight Model for Pavement Damage Detection Utilizing a Generalized Efficient Layer Aggregation Network and Attention Mechanism [0.0] 本稿では,舗装損傷検出のための軽量物体検出モデルYOLO9trを提案する。
YOLO9trはYOLOv9アーキテクチャに基づいており、機能抽出とアテンション機構を強化する部分的なアテンションブロックを備えている。
このモデルは、最大136FPSのフレームレートを実現し、ビデオ監視や自動検査システムなどのリアルタイムアプリケーションに適合する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:30:21 GMT)
Why quantum correlations are shocking [0.0] 量子システム間の相関が、我々の古典的な直観を揺るがす理由について、単純な最小主義者の議論がなされる。
この議論は2つの基本的な物理的仮定に依存し、標準的な実験可能なベルの不等式を回復させる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:11:35 GMT)
WRDScore: New Metric for Evaluation of Natural Language Generation Models [0.0] 仮定に頼らずに精度とリコールを計測する新しい指標を提案する。
予測シーケンスと参照シーケンスの直接重複を測定することは、これらの微妙さを捉えることはできない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:53:24 GMT)
Variational quantum simulation: a case study for understanding warm starts [0.0] システムサイズで指数関数的に消滅する損失を特徴とするバレンプラトー現象は、変動量子アルゴリズムのスケーリングに挑戦する。
我々は、量子実時間と想像時間進化のための短い深度回路を学習するための反復的変分法に焦点をあてる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:45:36 GMT)
VIRL: Volume-Informed Representation Learning towards Few-shot Manufacturability Estimation [0.0] 本研究は,3次元幾何エンコーダの事前学習のためのボリュームインフォームド表現学習手法であるVIRLを紹介する。
VIRLによって事前訓練されたモデルでは,データ制限による一般化性の向上が大幅に向上した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:30:26 GMT)
Unmasking the Veil: An Investigation into Concept Ablation for Privacy and Copyright Protection in Images [0.0] クマリらによる「テキスト・トゥ・イメージ拡散モデルにおけるAblating Concepts in Text-to- Image Diffusion Models」で紹介された事前学習モデルにおける概念アブレーションの研究を拡大する。
本稿では,新しい概念アブレーション,すなわち「商標アブレーション」を導入する。
この変種は、記憶の原理とインスタンスアブレーションを組み合わせて、モデル出力におけるプロプライエタリまたはブランディングされた要素のニュアンスな影響に取り組む。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:22:29 GMT)
Universal Early-Time Growth in Quantum Circuit Complexity [0.0] 時間非依存ハミルトニアンのユニタリ時間進化作用素に対する量子回路の複雑性は、早い段階で線形であることが示される。
連続極限における場の理論の複雑さの格子間隔の早期挙動と依存性を抽出することができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:27:36 GMT)
Uncorrelated photon pair generation from an integrated silicon nitride resonator measured by time resolved coincidence detection [0.0] 窒化ケイ素マイクロ共振器の自発4波混合により発生する信号とアイドラー光子対の結合時間強度を測定した。
この技術は、光子寿命がポンプパルスの持続時間を超える任意の高Q光学キャビティに適用できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:28:19 GMT)
Uncertainty relations based on state-dependent norm of commutator [0.0] 我々は、B'ottcher-Wenzel不等式の一般化を利用して、通勤者の状態依存ノルムに基づく2つの不確実性関係を導入する。
第1の関係は数学的に証明され、第2の関係は数値的な証拠によって強く支持される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:16:45 GMT)
Three-outcome multipartite Bell inequalities: applications to dimension witnessing and spin-nematic squeezing in many-body systems [0.0] 我々は,多体スピン-1系やSU(3)モデルにおける非局所相関の探索に自然に適していることを示す。
具体的には,この不等式を実験的に実施したベル相関証人から,集団スピン成分の測定に基づいて導出する方法を示す。
スピン1ボース-アインシュタイン凝縮体で生成できるようなスピンネマティック圧縮状態におけるこれらの証人の応用を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:44:44 GMT)
Thermodynamics and entanglement entropy of the non-Hermitian SSH model [0.0] トポロジカル相転移は様々な系で見られ、スケーリング関係を通して熱力学的な記述と深く関連していることが示されている。
本稿では、臨界モデルの中心電荷と非相互シュリーファー・ヘーガーモデルの熱力学を捉えるエンタングルメントエントロピーについて検討する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:34:11 GMT)
The Role of Spin-Orbit Coupling on the Linear Absorption Spectrum and Intersystem Crossing Rate Coefficients of Ruthenium Polypyridyl Dyes [0.0] 太陽エネルギー変換に分子染料をうまく利用するには、効率的な電荷注入が必要であり、十分な寿命を持つ状態(トリプレットなど)を形成する必要がある。
この性質を推定する分子構造要素は見いだすことができるが、計算予測は色素増感剤の構造-不純物関係を特定するのに有用である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:18:49 GMT)
The Local Account of Bell Nonlocality [0.0] 私は、ユニタリ量子論のハイゼンベルク図の中で、ベルの不等式は局所的に相互作用する現実の局所的要素に反することを示した。
アリス族と適切に相互作用するあらゆるものが交互に浮き彫りになり、あらゆる実用目的のために独立して自律的な世界を生み出す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:31:45 GMT)
The Duan-Kimble cavity-atom quantum memory loading scheme revisited [0.0] 我々はよく知られたデュアン・キンブルの絡み合いスキームを再検討する。
単一光子量子ビットは、強く結合された光学キャビティ内の単一原子量子ビットからなる量子メモリで絡み合わされる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:58:10 GMT)
Temporal Entanglement Profiles in Dual-Unitary Clifford Circuits with Measurements [0.0] 本研究では,空間的ユニタリティを保った確率的測定により,両単位クリフォード回路の時間的絡みについて検討した。
我々は,無測定状態における時間的絡み合い障壁を正確に特徴づけ,弾道的成長と崩壊と容積法的なピークを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:45:56 GMT)
Symbolic, numeric and quantum computation of Hartree-Fock equation [0.0] 本稿では,記号的,数値的,古典的,量子的アルゴリズムを用いたハイブリッド計算によって,分子のHar-Fock電子計算を行う方法について論じる。
量子位相推定(QPE)アルゴリズムにより、より高度で正確な量子計算のために入力データに使用される量子状態にこれらのルートを記録できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:06:16 GMT)
Supervised Autoencoder MLP for Financial Time Series Forecasting [0.0] この調査は2010年1月1日から2022年4月30日までの取引資産としてS&P500指数、EUR/USD、BTC/USDに焦点を当てている。
具体的には、シャープとインフォメーション比を用いて、ノイズ増大と三重障壁ラベルがリスク調整されたリターンに与える影響を具体的に調べる。
その結果、教師付きオートエンコーダは、バランスの取れたノイズ増大とボトルネックサイズにより、戦略の有効性を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:33:36 GMT)
Suitability of CCA for Generating Latent State/ Variables in Multi-View Textual Data [0.0] 本研究は、潜伏状態の発見におけるCAAの可能性を示すことによって、さらに一歩前進する。
本研究で論じるCAAの解釈は,テキストデータのマルチビュー特性を利用する。
本研究では,CCAを用いた自動短解像作成(ASAG)タスクの実行モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:37:24 GMT)
Structure-Aware Code Vulnerability Analysis With Graph Neural Networks [0.0] 本研究では,ソフトウェアコードの脆弱性検出におけるグラフニューラルネットワーク(GNN)の有効性について検討する。
主な焦点は、脆弱なコードセグメントを特定し、それらの固定バージョンと区別する際のGNNの一般的な適用性を評価することである。
実験により、特定のグラフ要素のプルーニングや特定の種類のコード表現の排除など、特定のモデル構成がパフォーマンスを著しく向上させることが示された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:44:30 GMT)
Stability of Data-Dependent Ridge-Regularization for Inverse Problems [0.0] データ依存型および空間変化型正規化強度を持つ画素ベースのリッジ正規化器を学習する。
本研究は,再建が最大ポステリオリアプローチを形成することを証明している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:49:54 GMT)
Skin Cancer Images Classification using Transfer Learning Techniques [0.0] 良性期における皮膚癌の早期診断は、がん死亡率の低下に重要である。
これまで,様々な深層学習モデルを用いた皮膚癌診断の課題に対処してきた。
本研究は, 良性および悪性期における皮膚癌検出のバイナリ分類に, 5種類の事前学習型トランスファーラーニングアプローチを適用した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:48:20 GMT)
Simulating spin biology using a digital quantum computer: Prospects on a near-term quantum hardware emulator [0.0] 我々はトロタライゼーションを利用してコヒーレントなラジカル対スピンダイナミクスをデジタルゲートベースの量子シミュレーションにマッピングする。
原型系の結合スピンダイナミクスを忠実に再現するのに十分である約15のトロッターステップを同定する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:09:31 GMT)
Simple Cracking of (Noise-Based) Dynamic Watermarking in Smart Grids [0.0] 動的透かしとその関連プロトコルのスペクトル特性を解析する。
デジタル双対法に触発された簡単な攻撃を提示する。
安全で認証された通信がないため、動的透かしは条件付きでも条件付きでもない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:24:22 GMT)
Saliency Attention and Semantic Similarity-Driven Adversarial Perturbation [0.0] SASSP(Saliency Attention and Semantic similarity driven adversarial Perturbation)は、文脈的摂動の有効性を改善するために設計された。
提案手法は,単語選択と摂動のための3段階の戦略を取り入れたものである。
SASSPは高い攻撃成功率と低い単語摂動率を得た。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:07:27 GMT)
SCORE: A 1D Reparameterization Technique to Break Bayesian Optimization's Curse of Dimensionality [0.0] この呪文を破り、高次元景観におけるBOの線形時間複雑性を維持するための1次元再パラメータ化手法が提案されている。
SCOREと呼ばれるこの高速でスケーラブルなアプローチは、大域的に最小のニードル・ア・ヘイスタック最適化関数を見つけることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:28:29 GMT)
Runtime Verification on Abstract Finite State Models [0.0] マルチスレッドJavaプログラムの実行から有限状態モデルを抽出する方法を示し、精度特性のランタイム検証を実行する。
本論文の主な貢献は,プロパティ保存抽象モデルのオンラインプロパティチェックを通じて,実行時検証の効率性を示すことである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:32:31 GMT)
Robustness of contextuality under different types of noise as quantifiers for parity-oblivious multiplexing tasks [0.0] 我々は分析的および数値的なツールを用いて、異なる種類の雑音下でのPOMシナリオにおける文脈性のロバスト性を推定する。
我々は,任意の$n$-to-1 POMシナリオにおいて,文脈性から偏極へのロバスト性と成功率の関係を一般化する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:43:43 GMT)
Review and Prospect of Algebraic Research in Equivalent Framework between Statistical Mechanics and Machine Learning Theory [0.0] この論文は、統計力学と場の量子論の両方において代数研究の先駆者であるアラキ・フジヒロ教授の記憶に捧げられている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:49:17 GMT)
Reinforcement Learning for Corporate Bond Trading: A Sell Side Perspective [0.0] 社債トレーダーは、テキスト優先の市場価格にスプレッドを追加して引用を提供する
不正な債券については、市場価格の観測が困難であり、トレーダーはしばしば利用可能なベンチマーク債の価格に頼っている。
本稿では,データ駆動方式による最適入札分散商法の推定にアプローチし,強化学習を用いて学習できることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:02:35 GMT)
Realizing string-net condensation: Fibonacci anyon braiding for universal gates and sampling chromatic polynomials [0.0] 本稿では,短期量子プロセッサにも適するスケーラブルな動的文字列ネットワーク準備(DSNP)手法を提案する。
DSNPはFibonacci string-net condensate(Fib-SNC)の作成と操作を可能にする
我々は、Fid-SNCの基礎となる2つの位相場の量子論に関連する2つの種類のエノンの電荷を測定する。
この結果から,スケーラブルDSNPがフォールトトレラントな普遍量子計算への扉を開くことができるという原理が確立された。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:38:07 GMT)
Quantum theory of a potential biological magnetic field sensor: radical pair mechanism in flavin adenine dinucleotide biradicals [0.0] 近年の研究では、フラビンアデニンジヌクレオチド(FAD)が生体磁場センサとして機能する可能性が示唆されている。
本研究では,FAD分子内のフラビンアデニンバイラジカルに対するラジカル対機構(RPM)の詳細な量子理論モデルを構築した。
我々のモデルの予測は実験と一致している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:40:10 GMT)
Quantum geometry of bosonic Bogoliubov quasiparticles [0.0] 本稿では,シンプレクティックな量子幾何テンソル(SQGT)を提案する。
シンプレクティックベリー曲率をボゴリューボフ・ブロッホ波パケットの一般化されたシンプレクティック異常速度項に接続する。
ボソニックなボゴリューボフ・ハルダンモデルについて実験を行った。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:01:04 GMT)
Quantum Tensor Product Decomposition from Choi State Tomography [0.0] 単位系のテンソル積分解を計算するために,小さなサブシステムと大きなサブシステム(環境)に不均衡なパーティションを分割するアルゴリズムを提案する。
この量子アルゴリズムは、演算子非局所性、サブシステム上での効果的なオープン量子力学、低ランク近似の発見、量子回路ユニタリの低深度コンパイルに使用できる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:11:07 GMT)
Quantum Systems Other Than the Universe [0.0] ユニタリダイナミクスは物理学において特別な位置を占め続けていると私は主張する。
Michael Cuffaro 氏と Stephan Hartmann 氏が最近提唱した Open Systems View とは対照的です。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:04:45 GMT)
Quantum Computed Green's Functions using a Cumulant Expansion of the Lanczos Method [0.0] 本稿では,多体グリーン関数行列をスピン軌道ベースで計算する量子計算法を提案する。
我々は,量子量子コンピュータのH1-1におけるグリーン関数の計算を実演する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 11:26:56 GMT)
Prediction of the Realisation of an Information Need: An EEG Study [0.0] 本研究は,質問応答(Q/A)タスクにおいて,14項目にわたる脳波データ内のINの実現を予測できる能力について検討した。
脳波データは、73.5%の精度で全被験者にわたるINの実現をリアルタイムに予測するのに十分である。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:13:04 GMT)
Predicting the energetic proton flux with a machine learning regression algorithm [0.0] 最大1時間前に陽子束を予測できる機械学習回帰アルゴリズムを提案する。
このアプローチは、深宇宙と地球近傍の両方の環境における放射線リスクの監視システムを改善するのに役立つかもしれない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:54:50 GMT)
Polynomially restricted operator growth in dynamically integrable models [0.0] 各ハミルトニアンが同値関係を定義することを示し、作用素空間を同値類に分割する。
本稿では,同値クラスの次元を判定し,木上のXY$チェインやキタエフモデルなど,様々なモデルに対して評価する手法を提案する。
我々の手法は、自由フェルミオンに還元できない$XY$-$ZZ$モデルを含む、シミュラブル量子力学の新しいケースを明らかにするために用いられる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:37:47 GMT)
Path Percolation in Quantum Communication Networks [0.0] 量子通信ネットワークでは、リンクは異なるノードに位置する量子ビット間の絡み合いを表す。
ランダムに選択されたノード対が最短経路を介して通信するモデルを提案する。
このようなパスを使用するたびに、すべてのリンクが削除され、相関したパーコレーションプロセスが生成される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:07:01 GMT)
Parallel two-qubit entangling gates via QND interaction controlled by rotation [0.0] 本稿では、多モード光と軌道角運動量と原子アンサンブルの間の量子非破壊(QND)相互作用におけるエンタングリングおよび非局所操作の解析を行う。
プロトコルは、2つのQND演算と原子スピンコヒーレンスを回転させ、それらの間の光からなる。
このプロトコルは、幅広い2量子ビット演算を提供するが、選択された自由度のマルチモードの性質は、複数の2量子ビットシステム上での並列演算の実装を可能にする。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:30:13 GMT)
On the relation between quantum walks and absolute zeta functions [0.0] グラフ上のGroverウォークの時間発展行列によって決定されるゼータ関数を扱う。
量子ウォークによって与えられるゼータ函数は、グラフの辺数に依存する絶対自己同型な重みであることを示す。
量子ウォークに基づくゼータ関数に対する絶対ゼータ関数を考える。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:17:08 GMT)
On instabilities in neural network-based physics simulators [0.0] ニューラルネットワークによって生じる長時間の力学は、しばしば非物理的または不安定である。
トレーニング力学の収束速度は不均一であり, データのエネルギー分布に依存することを示す。
トレーニング中にデータに合成ノイズを注入すると、トレーニングダイナミクスが減衰し、学習したシミュレータを安定させることができる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:25:14 GMT)
Noncompletely Positive Quantum Maps Enable Efficient Local Energy Extraction in Batteries [0.0] 完全正のトレース保存マップによる量子電池からのエネルギー抽出は、CPTP局所受動的状態の概念につながる。
NCPTPを用いたCPTP局所受動状態から効率よくエネルギーを抽出できるが、共有電池の同じ部分の物理的に実現可能なマップからエネルギーを抽出できることを示す。
任意の双極子状態が、任意のが固定されたハミルトニアンに対して、一方の党における非完全正のトレース保存演算を用いてエネルギーを供給できない必要条件と分離条件を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:57:57 GMT)
Non-interferometric rotational test of the Continuous Spontaneous Localisation model: enhancement of the collapse noise through shape optimisation [0.0] 最近の短距離重力実験で測定された回転騒音に対して連続自発局所化モデルのパラメータを上界に導出する。
テーブルトップ実験であるにもかかわらず, 崩壊パラメータの関連値については, LIGOの値よりも1桁も弱いことが判明した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:43:25 GMT)
Non-hermitian Floquet perspective on high harmonic generation and above threshold ionization spectra from Photon statistics [0.0] 我々は、高調波発生スペクトル(HGS)と吸収された紫外線(XUV)光子数との一致を示す。
これは、吸収された奇妙なIR光子と放出されたXUV光子の総エネルギーを保存し、IR光子のポストセレクションによって達成される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:47:30 GMT)
Next Generation of Phishing Attacks using AI powered Browsers [0.0] 精度98.32%、精度98.62%、リコール97.86%、F1スコア98.24%であった。
15日間にわたるゼロデイフィッシング攻撃検出テストでは、以前は目に見えない脅威を識別するモデルの能力が明らかにされた。
このモデルは、Googleの安全なブラウジングによる検出を回避したフィッシングURLをうまく検出した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:24:36 GMT)
New Reservoir Computing Kernel Based on Chaotic Chua Circuit and Investigating Application to Post-Quantum Cryptography [0.0] このプロジェクトは、チュアに本拠を置く貯水池コンピュータのアカデミアにおける2番目の事例であると考えられている。
ポスト量子暗号のような現実世界の課題に最初に適用される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:07:59 GMT)
Never Gonna Give You Up: Exploring Deprecated NULL Ciphers in Commercial VoWiFi Deployments [0.0] 多くのオペレーターがVoice over Wi-Fi(VoWiFi)を使って、顧客は自分のコアネットワークを公開インターネット上でダイアルできる。
WiFiまたはインターネットドメイン上の悪意あるアクターから保護するために、トラフィックは一連のIPsecトンネルを介して送信される。
クライアント側とサーバ側の両方で、商用のVoWiFiデプロイメント内のセキュリティ構成を分析したいと思っています。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:32:38 GMT)
Neural Bayes estimators for censored inference with peaks-over-threshold models [0.0] ニューラルベイズ推定器を用いた確率自由推定の進歩に基づいて、検閲されたピーク・オー・スレッショルドモデルのための高効率な推定器を開発する。
我々の新しい手法は、空間的極端依存モデルに対する従来の検閲された可能性に基づく推論手法に挑戦する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:55:37 GMT)
Navigating Knowledge Management Implementation Success in Government Organizations: A type-2 fuzzy approach [0.0] 本研究は,政府組織における知識管理システムの実現における重要な成功要因と失敗要因を明らかにすることを目的とする。
この研究は、協力、オープンな雰囲気、スタッフのトレーニング、創造性と革新、組織の制約の排除、報酬政策、役割モデリング、フォーカスを含む、政府機関における知識管理システムにおける重要な成功要因を強調している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:22:32 GMT)
Majorization in some symplectic weak supermajorizations [0.0] シンプレクティック固有値は、いくつかの古典的固有値の不等式のアナログを満たすことが知られている。
本書簡の目的は,多角化によるシンプレクティック・弱い超並列化関係の飽和に必要かつ十分な条件を確立することである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:23:52 GMT)
Machine Learning and Optimization Techniques for Solving Inverse Kinematics in a 7-DOF Robotic Arm [0.0] 本稿では,7自由度マニピュレータの複雑さを考察し,その解法として13の最適化手法を提案する。
アルゴリズム研究の分野に貢献する新しい手法が提案されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 21:23:51 GMT)
Lindblad quantum dynamics from correlation functions of classical spin chains [0.0] 我々は,スピン-1/2 XXZ鎖における磁化輸送と,積分性破壊的摂動を伴わない接続上に構築する。
オープン量子系の時間発展は古典的相関関数に基づいて記述できることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:36:47 GMT)
Language-Driven Active Learning for Diverse Open-Set 3D Object Detection [0.0] 多様なオープンセット3Dオブジェクト検出のための言語駆動型アクティブラーニングフレームワークであるVisLEDを提案する。
本手法は,ラベルのないプールから多種多様な情報的データサンプルを検索するために,能動的学習手法を活用する。
VisLED-Queryingは、ランダムサンプリングを一貫して上回り、競合性能を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:34:33 GMT)
Investigating pump harmonics generation in a SNAIL-based Traveling Wave Parametric Amplifier [0.0] トラベリングウェーブパラメトリック増幅器(TWPA)は、非常に望ましい量子制限特性とブロードバンド特性のために弱いマイクロ波信号を含む実験に広く用いられている。
しかし、TWPAsのブロードバンド特性は、増幅性能を低下させる可能性のあるハーモニクス生成のような急激な非線形過程の活性化を認めるという欠点がある。
そこで本研究では,SNAIL(Superconducting Asymmetric Inductive Element)を用いたJosephson TWPAデバイスを,ポンプの第2および第3高調波の発生とともに増幅挙動に着目して実験的に検討した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:39:44 GMT)
Intersubjectivity and value reproducibility of outcomes of quantum measurements [0.0] 量子力学解析は、各測定値がその結果として単一の値を決定するという見解を覆すことを示す。
第2の見解を広く支持するのとは対照的に、量子力学は第1のケースのみが起こると予測する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:30:47 GMT)
Interpreting Bias in Large Language Models: A Feature-Based Approach [0.0] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクで顕著なパフォーマンスを示した。
本稿では, 特徴量に基づく新しい解析手法により, LLM内のバイアスの伝播について検討する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:28:15 GMT)
Integrating Representational Gestures into Automatically Generated Embodied Explanations and its Effects on Understanding and Interaction Quality [0.0] 本研究では,異なる種類のジェスチャーが相互作用の質や聴取者の理解にどのように影響するかを検討する。
我々のモデルは、学習した音声駆動モジュールが生成したビートジェスチャーと、手動でキャプチャした象徴的ジェスチャーを組み合わせる。
発見は、象徴的なジェスチャー単独の使用もビートジェスチャーの組み合わせも、理解の観点からはベースラインやビートのみの状態よりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:23:00 GMT)
Integrated Planning in Hospitals: A Review [0.0] 本稿では,病院における各種資源の総合的な計画に関する運用研究・管理科学文献に焦点を当てる。
関連文献を収集し,不確実性モデリングや実生活データの利用など,さまざまな側面について分析する。
我々は、異なるリソース中心の統合アプローチを分類し、文献のギャップを指摘するために、高いレベルの分類を提供する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:02:43 GMT)
Integrability of open boundary driven quantum circuits [0.0] 開境界条件を持つ量子ビット(スピン1/2)の二重量子回路のヤン・バクスター積分性の問題に対処する。
我々はこの解を用いて、2ステップの離散時間フロケダイナミクスを持つ変換行列形式から積分可能な回路を構築する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:08:46 GMT)
Heat Pulses in Electron Quantum Optics [0.0] メソスコピック導体における熱パルスのフロケ散乱理論を定式化する。
熱パルスの断熱放出は、線形応答において熱伝導量子によって与えられる熱電流につながる。
電流を生成するために、電子-ホール対称性を破り、熱電効果を可能にするマッハ-ツェンダー干渉計を用いる。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 23:50:27 GMT)
Growth in products of matrices: fastest, average, and generic [0.0] ランダム行列積に関する3つの疑問に答える。
第3の質問に対して、リャプノフ指数の上界を生成する非常に単純な方法を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:49:09 GMT)
Graph Neural Networks in Histopathology: Emerging Trends and Future Directions [0.0] グラフニューラルネットワークの病理組織学への応用は急速に成長してきた。
階層型GNN,適応型グラフ構造学習,マルチモーダルGNN,高次GNNの4つのトレンドを特定した。
本研究は,本研究の成果を踏まえ,今後の方向性を推し進めるものである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 17:23:50 GMT)
Gauging modulated symmetries: Kramers-Wannier dualities and non-invertible reflections [0.0] 変調対称性(Modulated symmetries)は、非一様で空間的に変調された方法で作用する内部対称性である。
本稿では,有限アベリア変調対称性のゲージングを1+1$次元で体系的に研究する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:00:00 GMT)
Fuzzy Convolution Neural Networks for Tabular Data Classification [0.0] 畳み込みニューラルネットワーク(CNN)は、様々な領域における顕著な性能のために、多くの注目を集めている。
本稿では,表データに適したファジィ畳み込みニューラルネットワーク(FCNN)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:36:13 GMT)
Free to play: UN Trade and Development's experience with developing its own open-source Retrieval Augmented Generation Large Language Model application [0.0] UNCTADは、独自のオープンソースのRetrieval Augmented Generation (RAG) LLMアプリケーションを探索、開発している。
RAGは、大規模言語モデルを組織のドメインや作業に意識し、より有用なものにします。
アプリを生成するために開発された3つのライブラリ、ドキュメント処理と統計解析用のnlp_pipeline、ローカルなRAG LLMを実行する local_rag_llm、ユーザインターフェース用の streamlit_rag は、DockerfilesでPyPIとGitHubで公開されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:23:54 GMT)
Extracting work from coherence in a two-mode Bose-Einstein condensate [0.0] 2モードのボース=アインシュタイン凝縮体における数状態コヒーレンスから作業をどのように抽出できるかを示す。
我々は、(コヒーレンスから)量子的貢献と(古典的な)作業出力への貢献を特徴づける。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:00:46 GMT)
Exploring the Impact of a Transformer's Latent Space Geometry on Downstream Task Performance [0.0] 事前学習の利点の多くは、潜在空間表現の幾何学的特徴によって捉えられる可能性がある。
量子化セル密度の測定値と平均GLUE性能との間には強い線形関係があることが判明した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:17:30 GMT)
Exact Synthesis of Multiqutrit Clifford-Cyclotomic Circuits [0.0] 3ntimes 3n$ のユニタリ行列 $U$ はクリフォード・シクロトミックゲートの次数$3k$ 上の$n$-量子回路で表せることを証明している。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 19:22:07 GMT)
Evolution Dynamics Toward the Limit Cycle of a Quantum Self-Sustained Oscillator [0.0] 準調和極限サイクルを持つ量子レイリー・ヴァン・デル・ポル(RvdP)発振器の進化について検討する。
極限サイクルへの1つの進化は、他のサイクルよりもずっと長くかかり、最小時間パラメータが存在するかもしれない。
得られたダイナミクスを,コヒーレンス崩壊と固有状態占有の再分配の観点から記述する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:05:11 GMT)
Envelope-function theory of inhomogeneous strain in semiconductor nanostructures [0.0] ストレインは半導体ヘテロ構造においてユビキタスな特徴であり、デバイスの性質を改善するために異なる方法で設計することができる。
ここでは、Bir と Pikus の理論を不均一ひずみの場合に一般化する。
問題の相対論的効果と計量的側面を完全に説明することにより、完備エンベロープ関数ハミルトニアンを導出する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:56:36 GMT)
Entanglement swapping in critical quantum spin chains [0.0] 多くの量子ビット状態間の量子情報の転送は、量子科学と技術における基本的な重要性の主題である。
両鎖間の絡み合いはベル状態の測定によってのみ引き起こされる。
交換された絡み合いは対数的スケーリングを示し、その係数は境界条件変化作用素のスケーリング次元によって決定される普遍的な値を取ることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:04:58 GMT)
Ensuring Both Positivity and Stability Using Sector-Bounded Nonlinearity for Systems with Neural Network Controllers [0.0] 完全連結FFNN制御の下で線形系の大域的指数的安定性を示す安定性定理を提案する。
提案手法は,高非線形系における安定性確保の課題を効果的に解決する。
出力フィードバック制御データに基づいて訓練されたFFNNによって管理される線形システムにおいて,本手法の実践的適用性を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 16:05:57 GMT)
Enhanced Gradient Boosting for Zero-Inflated Insurance Claims and Comparative Analysis of CatBoost, XGBoost, and LightGBM [0.0] CatBoostは、予測性能に基づいた自動クレーム頻度モデルを開発するための最良のライブラリである。
そこで我々は, インフレ確率$p$と分布平均$mu$の関係を仮定した, ゼロ膨張ポアソン強化木モデルを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:09:18 GMT)
Dynamic Normativity: Necessary and Sufficient Conditions for Value Alignment [0.0] 我々は,人的目標と価値を人工システムで従うことができるような方法で表現する上での課題に,不必要な敵意を伴わない「調整」の問題を見出した。
この研究は、AIシステム開発に規範的理論をもたらす、しっかりとした哲学的基礎と実践的な実装を必要とする技術的哲学的問題としてのアライメントに対処する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:15:06 GMT)
Driven-Dissipative Dynamics of Ultracold Atoms Trapped in an Array of Harmonic Potentials [0.0] ハーモニックポテンシャルの配列に閉じ込められた超低温原子の気体の力学について検討する。
これらの閉じ込められた超低温原子の基底と励起エネルギーレベルは、切り離されたラマンレーザーによって互いに結合される。
ひとたびラマンレーザーで励起されると、これら閉じ込められた超低温の原子は地上のエネルギーレベルに戻るが、必ずしも元のトラップ位置に戻るわけではない。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 01:44:27 GMT)
Dichroic cavity mode splitting and lifetimes from interactions with a ferromagnetic metal [0.0] 時間反転対称性の破れがキャビティモードの双対応答に繋がることを示す。
1つの偏極しか持たないモードの寿命の短縮は、円偏極キャビティの工学と制御に使用できる可能性がある。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 15:16:47 GMT)
DAOs' Business Value from an Open Systems Perspective: A Best-Fit Framework Synthesis [0.0] 分散型自律組織(DAO)は、革新的な組織構造を新たに生み出している。
本研究は、オープンシステムの観点から、組織のビジネス適用可能性の体系的なレビューを適用する。
4つの中核的なビジネス要素からなる新しいビジネスフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:48:10 GMT)
Curvature effects on stimulated parametric down-conversion process: an analog model [0.0] パラメトリックダウンコンバージョンプロセスの量子特性に対する空間曲率の影響について検討する。
上記プロセスの入力ビームとして, 2モード球コヒーレント状態を用いる。
線形エントロピーにより測定されたパラメトリックダウン変換過程の出力状態の絡み合いを計算した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 10:36:48 GMT)
Correction formulas for the two-qubit Mølmer-Sørensen gate [0.0] LDパラメータにおいて,誤りを最大4次まで明示的な解析式を提供する。
駆動強度の解析的再正規化により,これらの誤差を部分的に補償できることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:54:34 GMT)
Contraction rates for conjugate gradient and Lanczos approximate posteriors in Gaussian process regression [0.0] 我々は確率的数値の分野から最近提案された近似アルゴリズムのクラスを分析する。
数値解析結果とカーネル行列のスペクトルのアート集中結果の状態を組み合わせ、最小値の収縮率を求める。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 14:50:42 GMT)
ClaudesLens: Uncertainty Quantification in Computer Vision Models [0.0] シャノンエントロピーに基づく異なるコンピュータビジョンモデルの出力の不確かさを定量化し評価する方法を提案する。
我々は、シャノンエントロピーが、人工知能における不確実性を定量化するSOTA(State-of-the-art)手法において、最終的にはより大きな役割を果たすと考えている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 18:58:54 GMT)
Chip-Scale Point-Source Sagnac Interferometer by Phase-Space Squeezing [0.0] 相空間のスクイージングは原子の有利な源であることが示され、運動量の拡散は減少する。
回転検出が可能な点源原子干渉計におけるそのような音源の影響を解析する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:55:23 GMT)
Certified ML Object Detection for Surveillance Missions [0.0] 本稿では,機械学習オブジェクト検出コンポーネントを含むドローン検出システムの開発プロセスについて述べる。
その目的は、ED 324 / ARP 6983標準の勧告によって必要とされる、許容可能なパフォーマンス目標に達し、十分な証拠を提供することである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:42:22 GMT)
CHG Shapley: Efficient Data Valuation and Selection towards Trustworthy Machine Learning [0.0] 本稿では,モデル学習におけるモデル精度に基づく各データサブセットの有用性を近似したCHG Shapleyを提案する。
リアルタイムデータ選択にはCHG Shapleyを用い,その有効性を示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:38:31 GMT)
Bounds and Bugs: The Limits of Symmetry Metrics to Detect Partisan Gerrymandering [0.0] 平均メディア差とパルティザンバイアス(Partisan Bias)は、ジェリーマンダーの検出を目的とした対称性の指標である。
本研究では,地域地図が特定の政党が獲得した地区数が極端に多い場合に,どちらの指標も確実に検出できないことを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 00:39:30 GMT)
Boundary effect and correlations in fermionic Gaussian states [0.0] 境界効果関数は、境界からの距離の関数として基底状態の変化を定量化する。
一次元自由フェルミオンモデルに対する境界効果関数の数値解析を行う。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 05:34:40 GMT)
Bayesian Data Selection [0.0] 例えば、セミ教師付き学習、アクティブラーニング、マルチアームのバンディット、ベイズ最適化などがある。
意思決定問題としてデータ選択をフレーミングすることで、このようなデータ追加を意思決定理論に組み込む。
半教師付き学習における自己学習の具体例について,各ベイズ基準を導出する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:40:15 GMT)
Background resilient quantitative phase microscopy using entangled photons [0.0] 本稿では, 位相勾配を用いた量子ベースの定量的位相顕微鏡法を提案する。
画像分解能は2.76,mu$mで、位相精度は少なくともラムダ/30$で、位相感度は810,nmの波長でラムダ/100$であることを示す。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:07:27 GMT)
Attack and Defense of Deep Learning Models in the Field of Web Attack Detection [0.0] 本稿では,WADにおけるバックドア攻撃について紹介し,5つの方法と対応する防御法を提案する。
textCNN, biLSTM, littlebertモデルによるテストでは, 微調整によって再現可能な87%以上の攻撃成功率を示している。
今後の研究は、WADのバックドア防衛に焦点を当てるべきである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 13:34:02 GMT)
Asymmetric dynamical localization and precision measurement of BEC micromotion [0.0] 非零初期運動量で起動されるボース=アインシュタイン凝縮体(BEC)は、小さな初期電流を持つ移動体において非対称局在運動量分布を生成する。
BECを蹴り動かして動く光学格子に利用することにより、初期時間力学における非対称性を測定し、量子系のマイクロモーション現象を正確に特徴づけ、定量化する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:41:40 GMT)
Applying Ensemble Methods to Model-Agnostic Machine-Generated Text Detection [0.0] そこで本研究では,機械が生成したテキストを,そこから派生した大きな言語モデルが未知の場合に検出する問題について検討する。
生成型(またはベース)言語モデルと識別型(またはスコアリング型)言語モデルとが同一である場合に高い精度で、ゼロショットモデルを用いてテキスト検出を行う。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:58:01 GMT)
Analysing India's Cyber Warfare Readiness and Developing a Defence Strategy [0.0] 強力なサイバー防衛対策の需要は、特にインドなどの国々で増大している。
この文献レビューは、インドのサイバー防衛能力に重大な欠陥があることを明らかにしている。
本研究は,サイバー専門家を養成するための教育枠組みを提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 12:55:07 GMT)
All holographic systems have scar states [0.0] 我々は、$mathcalN=4$ Super Yang-Millsを含むすべてのホログラフィック量子場理論は不足状態であると主張する。
それらの存在は、重力における非トポロジカルで地平線のないソリトン解の存在と結びついている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 02:56:18 GMT)
Aligning Models with Their Realization through Model-based Systems Engineering [0.0] 本稿では,モデルに基づくシステム工学の適用を通じて,モデルとそれらの実現を整合させる手法を提案する。
私たちのアプローチは、モデルと実装をよりシームレスに統合し、ビジネスとITの整合性を高めます。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:50:36 GMT)
A hybrid atom tweezer array of nuclear spin and optical clock qubits [0.0] データ量子ビットとしてフェルミオン171mathrmYb$の核スピン量子ビットと、アンシラ量子ビットとしてボソニック174mathrmYb$の光クロック量子ビットからなるハイブリッドシステムの実現を提案する。
撮像光からの核スピン量子ビットのコヒーレンスへの影響に関するクォービット間のクロストークを174mathrmYb$で評価した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 03:49:12 GMT)
A Step Towards a Universal Method for Modeling and Implementing Cross-Organizational Business Processes [0.0] この研究は、より正確で統一されたビジネスプロセスモデル実行の基礎となる。
特定のBPMN要素をPASSと互換性のあるフォーマットに変換するプロトタイプトランスレータの開発について説明する。
これらのモデルはソースコードに変換され、bespokeワークフロー環境で実行される。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 06:19:44 GMT)
A Novel Algorithm for Community Detection in Networks using Rough Sets and Consensus Clustering [0.0] 社会的、生物学的、技術的システムのような複雑なネットワークは、しばしばコミュニティ検出の課題に挑戦する。
本研究は,ネットワークコミュニティの構造を効果的に識別するための,新しい粗いクラスタリングに基づくコンセンサスコミュニティフレームワーク(RC-CCD)を提案する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 09:01:21 GMT)
A GKP qubit protected by dissipation in a high-impedance superconducting circuit driven by a microwave frequency comb [0.0] 本稿では,GKP量子ビットの生成,保護,制御を行う新しい手法を提案する。
マイクロ波周波数コムを用いてジョセフソン回路をパラメトリック変調し、高いインピーダンス回路モードの散逸ダイナミクスを強制する。
符号化されたGKP量子ビットは、超伝導回路をプレーグする全ての支配的なデコヒーレンスチャネルに対して、準粒子中毒に対して堅牢に保護されている。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 20:43:25 GMT)
A Flexible Cryptographic Infrastructure for High-security SDR-based Systems [0.0] 軍用ソフトウェア定義無線(SDR)システムは、将来のネットワーク中心の運用において重要な要素である。
従来の無線装置とは異なり、この論文に記述されている暗号基盤を持つSDRシステムは、より高いセキュリティレベルに達する。
利点は、トランク化された無線システムと、将来標準化される連帯広帯域のような、さらなる波形を展開できることである。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 07:00:50 GMT)
A Cutting-Edge Deep Learning Method For Enhancing IoT Security [0.0] 本稿では,Deep Learning-integrated Convolutional Neural Networks (CNN) とLong Short-Term Memory (LSTM) ネットワークを用いたモノのインターネット(IoT)環境侵入検知システム(IDS)の革新的な設計を提案する。
われわれのモデルはCICIDS 2017データセットに基づいて、ネットワークトラフィックを良性または悪意のいずれかとして分類する精度99.52%を達成した。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 08:42:51 GMT)
"It answers questions that I didn't know I had": Ph.D. Students' Evaluation of an Information Sharing Knowledge Graph [0.0] 学際的なPhDプログラムは、学生が必要とする重要な情報が容易に入手できないため、困難である。
複数の情報源から抽出した臨界カテゴリとその関係情報を含む知識グラフを提案する。
本研究では,情報交換と意思決定を容易にするための参加型知識グラフのユーザビリティを評価する。
論文参考訳(メタデータ) (Tue, 18 Jun 2024 22:38:26 GMT)