Suppress Content Shift: Better Diffusion Features via Off-the-Shelf Generation Techniques [119.0] 拡散機能は、コンテンツシフトと呼ばれる隠れた、普遍的な現象によって妨げられていることがわかりました。
本稿では,拡散モデルに固有の特徴として内容変化の原因を見いだし,拡散特性にこの現象が存在することを示唆する。
本稿では,本手法の有効性を効果的に評価し,提案手法の実装を行うための実践的ガイドラインであるGATEを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:39:27 GMT)
Suppress Content Shift: Better Diffusion Features via Off-the-Shelf Generation Techniques [119.0] 拡散機能は、コンテンツシフトと呼ばれる隠れた、普遍的な現象によって妨げられていることがわかりました。
本稿では,拡散モデルに固有の特徴として内容変化の原因を見いだし,拡散特性にこの現象が存在することを示唆する。
本稿では,本手法の有効性を効果的に評価し,提案手法の実装を行うための実践的ガイドラインであるGATEを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:39:27 GMT)
Suppress Content Shift: Better Diffusion Features via Off-the-Shelf Generation Techniques [119.0] 拡散機能は、コンテンツシフトと呼ばれる隠れた、普遍的な現象によって妨げられていることがわかりました。
本稿では,拡散モデルに固有の特徴として内容変化の原因を見いだし,拡散特性にこの現象が存在することを示唆する。
本稿では,本手法の有効性を効果的に評価し,提案手法の実装を行うための実践的ガイドラインであるGATEを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:39:27 GMT)
Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.9] G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:57:51 GMT)
Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.9] G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:57:51 GMT)
Learning Linear Attention in Polynomial Time [115.7] 線形注意を持つ単層変圧器の学習性に関する最初の結果を提供する。
線形アテンションは RKHS で適切に定義された線形予測器とみなすことができる。
我々は,すべての経験的リスクが線形変換器と同等のトレーニングデータセットを効率的に識別する方法を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:15:09 GMT)
Not All Diffusion Model Activations Have Been Evaluated as Discriminative Features [115.3] 拡散モデルは当初、画像生成のために設計されている。
近年の研究では、バックボーンの内部シグナルはアクティベーションと呼ばれ、様々な識別タスクの高密度な特徴として機能することが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:19:45 GMT)
Not All Diffusion Model Activations Have Been Evaluated as Discriminative Features [115.3] 拡散モデルは当初、画像生成のために設計されている。
近年の研究では、バックボーンの内部シグナルはアクティベーションと呼ばれ、様々な識別タスクの高密度な特徴として機能することが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:19:45 GMT)
Not All Diffusion Model Activations Have Been Evaluated as Discriminative Features [115.3] 拡散モデルは当初、画像生成のために設計されている。
近年の研究では、バックボーンの内部シグナルはアクティベーションと呼ばれ、様々な識別タスクの高密度な特徴として機能することが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:19:45 GMT)
Harnessing Webpage UIs for Text-Rich Visual Understanding [112.0] テキストベース大規模言語モデル(LLM)を用いたWebページUIからの汎用マルチモーダル命令の合成を提案する。
これらの命令はUIスクリーンショットと組み合わせて、マルチモーダルモデルのトレーニングを行う。
我々は、100万のWebサイトから730万のサンプルを含むデータセットであるMultiUIを紹介し、多様なマルチモーダルタスクとUIレイアウトをカバーした。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:01:01 GMT)
Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition [110.8] 生成音声の書き起こし誤り訂正(GenSEC)の課題について紹介する。
この課題は、(i)ASR後の転写補正、(ii)話者タグ付け、(iii)感情認識という、3つのASR後の言語モデリングタスクを含む。
本稿では,ベースライン評価から得られた知見と,今後の評価設計における教訓について論じる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:11:35 GMT)
Learning Linear Attention in Polynomial Time [109.7] 線形注意を持つ単層変圧器の学習性に関する最初の結果を提供する。
線形アテンションは RKHS で適切に定義された線形予測器とみなすことができる。
我々は,すべての経験的リスクが線形変換器と同等のトレーニングデータセットを効率的に識別する方法を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:15:09 GMT)
Scene Prior Filtering for Depth Super-Resolution [97.3] テクスチャ干渉とエッジ不正確性を緩和するScene Prior Filtering Network(SPFNet)を導入する。
我々のSPFNetは、実データと合成データの両方で広範囲に評価され、最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:04:40 GMT)
Diverging Preferences: When do Annotators Disagree and do Models Know? [92.2] 我々は,4つのハイレベルクラスにまたがる10のカテゴリにまたがる相違点の分類法を開発した。
意見の相違の大部分は、標準的な報酬モデリングアプローチに反対している。
本研究は,選好の変化を識別し,評価とトレーニングへの影響を緩和する手法を開発する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:32:22 GMT)
Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning [90.0] 拡散モデルが自己回帰的アプローチを損なう困難なサブゴールをどのように学習するかを示す。
学習時の難易度に基づいてサブゴールを優先する多粒性拡散モデリング(MDM)を提案する。
Countdown、Sudoku、Boolean Satisfiability Problemsといった複雑なタスクでは、MDMは検索テクニックを使わずに自己回帰モデルよりも優れている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:48:53 GMT)
Efficiently Computing Susceptibility to Context in Language Models [88.5] 現代の言語モデルの強みの1つは、クエリに応答する際のユーザ・インプット・コンテキストからの情報を組み込む能力である。
彼らは、その文脈の微妙な変化に等しく敏感ではない。
Du et al. (2024) はそのような感度を測定するための情報理論の計量を与える。
そこで本研究では,フィッシャー情報に基づく効率的な感受性推定法であるFisher susceptibilityを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:40:47 GMT)
Timer: Generative Pre-trained Transformers Are Large Time Series Models [83.0] 本稿では,大規模時系列モデル(LTSM)の早期開発を目的とした。
事前トレーニング中に、最大10億のタイムポイントを持つ大規模なデータセットをキュレートします。
多様なアプリケーションのニーズを満たすため,予測,計算,時系列の異常検出を統一的な生成タスクに変換する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:19:55 GMT)
Conversational Recommender System and Large Language Model Are Made for Each Other in E-commerce Pre-sales Dialogue [80.5] 会話推薦システム(CRS)は、ユーザ表現を学習し、対話コンテキストに基づいて正確なレコメンデーションを提供するが、外部知識に依存している。
大規模言語モデル(LLM)は、微調整後の事前販売の対話を模倣する応答を生成するが、正確なレコメンデーションのためのドメイン固有の知識は欠如している。
本稿では,eコマース事前販売対話におけるLCMとCRSの組み合わせの有効性について検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:56:18 GMT)
LabSafety Bench: Benchmarking LLMs on Safety Issues in Scientific Labs [80.5] 実験室の事故は人命と財産に重大なリスクをもたらす。
安全訓練の進歩にもかかわらず、実験員はいまだに無意識に安全でない慣行に従事している可能性がある。
様々な分野におけるガイダンスのための大きな言語モデル(LLM)に対する懸念が高まっている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:21:05 GMT)
NaturalBench: Evaluating Vision-Language Models on Natural Adversarial Samples [79.8] 視覚自動モデル(VLM)は、人間が容易に答えられるような自然なイメージや疑問に苦戦している。
我々は,1万個の人間検証VQAサンプルを用いて,VLMを確実に評価するための新しいベンチマークであるNaturalBenchを提案する。
LLaVA-OneVision, Cambrian-1, Llama3.2-Vision, Molmo, Qwen2-VL, および GPT-4o lag の 50%-70% 遅れ(90%以上)を示した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:58:21 GMT)
Teaching AI Agents to Search with Reflective-MCTS and Exploratory Learning [78.4] エージェントアプリケーションのためのo1のようなモデルを構築するために,リフレクティブモンテカルロ木探索(R-MCTS)と探索学習(Exploratory Learning)を提案する。
R-MCTSは、AIエージェントがその場で決定空間を探索する能力を高めるために設計された、新しいテストタイムアルゴリズムである。
次に,探索学習(Exploratory Learning)という,外部探索アルゴリズムに頼らずに,エージェントに推論時間での探索を教える新しい学習戦略を紹介する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:27:37 GMT)
Improving Autonomous AI Agents with Reflective Tree Search and Self-Learning [78.4] Reflective Monte Carlo Tree Search (R-MCTS)は、AIエージェントの能力を高めるために設計された新しいテストタイムアルゴリズムである。
R-MCTSは1)従来のMCTSを拡張し、対照的な反射を取り入れ、エージェントは過去の相互作用から学ぶことができる。
自己学習によりGPT-4oを微調整することでエージェントの性能を向上させる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:27:37 GMT)
ExACT: Teaching AI Agents to Explore with Reflective-MCTS and Exploratory Learning [78.4] ExACTは、エージェントアプリケーションのためのo1のようなモデルを構築するために、テスト時間検索と自己学習を組み合わせるアプローチである。
リフレクティブモンテカルロ木探索(Reflective Monte Carlo Tree Search, R-MCTS)は、AIエージェントがその場で意思決定空間を探索する能力を高めるために設計された新しいテストタイムアルゴリズムである。
次に,探索学習(Exploratory Learning)という,外部探索アルゴリズムに頼らずに,エージェントに推論時間での探索を教える新しい学習戦略を紹介する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:27:37 GMT)
Revisiting BPR: A Replicability Study of a Common Recommender System Baseline [78.0] 我々は,BPRモデルの特徴を考察し,その性能への影響を示し,オープンソースのBPR実装について検討する。
分析の結果,これらの実装とオリジナルのBPR論文の矛盾が明らかとなり,特定の実装に対して最大50%の性能低下がみられた。
BPRモデルは、トップnのレコメンデーションタスクにおける最先端メソッドに近いパフォーマンスレベルを達成でき、特定のデータセット上でもパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:25:29 GMT)
Retraining with Predicted Hard Labels Provably Increases Model Accuracy [77.7] リトレーニングは、与えられた(ノイズの多い)ラベルで最初にトレーニングすることで得られる人口の精度を向上させることができる。
予測ラベルが与えられたラベルにマッチするサンプルを選択的にリトレーニングすることで、ラベルDP訓練が大幅に改善されることを実証的に示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:43:02 GMT)
Wireless Human-Machine Collaboration in Industry 5.0 [75.8] ワイヤレス・ヒューマン・マシン・コラボレーションは産業5.0にとって重要な進歩である。
安定性解析は、閉ループ系がモデルランダム性の下でどのように振る舞うかを証明している。
本稿では,マシンと人体制御のための2つの無線ループを組み込んだ基本WHMCモデルを確立する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:44:10 GMT)
You Shall Know a Tool by the Traces it Leaves: The Predictability of Sentiment Analysis Tools [75.0] 感情分析ツールが同じデータセットで一致しないことを示す。
感傷的アノテーションに使用される感情ツールは,その結果から予測できることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:27:38 GMT)
Aggregation Artifacts in Subjective Tasks Collapse Large Language Models' Posteriors [74.0] In-context Learning (ICL) は、Large Language Models (LLM) を用いた自然言語処理の主要な手法となっている。
本研究は,低アグリゲーション,異質なアノテーションを組み合わせたアグリゲーションの結果が,プロンプトに有害なノイズを生じさせるアノテーションのアーティファクトに繋がるかどうかを考察する。
この結果から,アグリゲーションは主観的タスクのモデル化において不明瞭な要因であり,代わりに個人をモデリングすることを重視することが示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:17:41 GMT)
XForecast: Evaluating Natural Language Explanations for Time Series Forecasting [72.6] 時系列予測は、特に正確な予測に依存するステークホルダーにとって、意思決定を支援する。
伝統的に説明可能なAI(XAI)メソッドは、機能や時間的重要性を基盤とするものであり、専門家の知識を必要とすることが多い。
時系列データにおける複雑な因果関係のため,予測NLEの評価は困難である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:16:39 GMT)
LLM Critics Help Catch Bugs in Mathematics: Towards a Better Mathematical Verifier with Natural Language Feedback [72.0] 本研究では,自然言語フィードバック型検証器Math-Minosを提案する。
実験の結果,少量の自然言語フィードバックが検証器の性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:59:24 GMT)
A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.8] 自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:03:05 GMT)
Teaching Models to Balance Resisting and Accepting Persuasion [69.7] 大規模言語モデル(LLM)は説得に影響を受けやすいため、モデルが対向的インターロケータに直面するとリスクが生じる可能性がある。
モデルを一方だけに最適化すると、もう一方のパフォーマンスが低下することを示す。
PBT(Persuasion-Balanced Training)を導入する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:49:36 GMT)
Explainable Graph Neural Networks Under Fire [69.2] グラフニューラルネットワーク(GNN)は通常、複雑な計算挙動とグラフの抽象的性質のために解釈性に欠ける。
ほとんどのGNN説明法は、ポストホックな方法で動作し、重要なエッジと/またはノードの小さなサブセットの形で説明を提供する。
本稿では,これらの説明が信頼できないことを実証する。GNNの一般的な説明手法は,敵対的摂動に強い影響を受けやすいことが判明した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:03:08 GMT)
ClearSR: Latent Low-Resolution Image Embeddings Help Diffusion-Based Real-World Super Resolution Models See Clearer [68.7] 本稿では、拡散に基づく実世界の超解像(Real-ISR)に対する潜在低分解能画像(LR)埋め込みの利点を活かす新しい手法であるClearSRを提案する。
提案モデルでは,複数のテストセット上で複数の測定値にまたがる性能が向上し,既存の手法よりもLR画像でより一貫したSR結果が得られる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:35:57 GMT)
Learning autonomous driving from aerial imagery [67.1] フォトグラムシミュレーターは、生成済みの資産を新しいビューに変換することによって、新しいビューを合成することができる。
我々は、ニューラルネットワーク場(NeRF)を中間表現として使用し、地上車両の視点から新しいビューを合成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:09:07 GMT)
Prompt Tuning of Deep Neural Networks for Speaker-adaptive Visual Speech Recognition [66.9] 話者適応型視覚音声認識(VSR)のためのディープニューラルネットワーク(DNN)の即時チューニング手法を提案する。
我々は、事前訓練されたモデルパラメータを変更する代わりに、ターゲット話者の適応データを微調整する。
提案手法の有効性を単語レベルのVSRデータベースと文レベルのVSRデータベースで評価した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:58:45 GMT)
Vision-Language Navigation with Energy-Based Policy [66.0] 視覚言語ナビゲーション(VLN)は、人間の指示に従って行動を実行するエージェントを必要とする。
共同状態-行動分布をモデル化するためのエネルギーベースナビゲーションポリシー(ENP)を提案する。
ENPはR2R、REVERIE、RxR、R2R-CEで有望なパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:01:36 GMT)
PredFormer: Transformers Are Effective Spatial-Temporal Predictive Learners [65.9] 本稿では、予測学習のための純粋なトランスフォーマーベースのフレームワークであるPredFormerを提案する。
PredFormerは、リカレントフリーでトランスフォーマーベースの設計で、シンプルかつ効率的である。
合成および実世界のデータセットに関する実験は、PredFormerが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:28:28 GMT)
PredFormer: Transformers Are Effective Spatial-Temporal Predictive Learners [65.9] 本稿では、予測学習のための純粋なトランスフォーマーベースのフレームワークであるPredFormerを提案する。
PredFormerは、リカレントフリーでトランスフォーマーベースの設計で、シンプルかつ効率的である。
合成および実世界のデータセットに関する実験は、PredFormerが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:28:28 GMT)
Contextual Bandits with Packing and Covering Constraints: A Modular Lagrangian Approach via Regression [65.9] 本稿では,線形制約付きコンテキスト帯域(CBwLC)について考察する。これは,アルゴリズムが全消費の線形制約を受ける複数のリソースを消費するコンテキスト帯域の変種である。
この問題はknapsacks (CBwK) を用いてコンテキスト的帯域幅を一般化し、制約のパッケージ化とカバー、および正および負のリソース消費を可能にする。
本稿では,回帰オラクルに基づくCBwLC(CBwK)のアルゴリズムについて述べる。このアルゴリズムは単純で,計算効率が良く,統計的に最適である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:00:10 GMT)
Asymptotically Optimal Change Detection for Unnormalized Pre- and Post-Change Distributions [65.4] 本稿では,非正規化前および後の変化分布のみがアクセス可能である場合にのみ,変化を検出する問題に対処する。
提案手法は,最適性能を示すことが知られている累積サム統計量の推定に基づく。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:13:29 GMT)
Everything is Editable: Extend Knowledge Editing to Unstructured Data in Large Language Models [65.1] 現実世界の知識の大部分は、構造化されていない形式で保存される。
ローカル層キーバリューストレージや項駆動最適化のような技術は、構造化されていない知識を扱うのに有効ではない。
本研究では,非構造化知識編集手法,すなわちUnKEを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:32:49 GMT)
On Efficient Variants of Segment Anything Model: A Survey [63.1] Segment Anything Model (SAM) は画像分割タスクの基本モデルであり、多様なアプリケーションにまたがる強力な一般化で知られている。
これを解決するために、精度を犠牲にすることなく効率を高めるために様々なSAM変種が提案されている。
この調査は、これらの効率的なSAM変種に関する最初の包括的なレビューを提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:42:50 GMT)
On Efficient Variants of Segment Anything Model: A Survey [63.1] Segment Anything Model (SAM) は画像分割タスクの基本モデルであり、多様なアプリケーションにまたがる強力な一般化で知られている。
これを解決するために、精度を保ちながら効率を高めるために様々なSAM変種が提案されている。
この調査は、これらの効率的なSAM変種に関する最初の包括的なレビューを提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:42:50 GMT)
FLEdge: Benchmarking Federated Machine Learning Applications in Edge Computing Systems [62.5] フェデレートラーニング(FL)は,ネットワークエッジ上での分散ディープラーニングのプライバシ強化を実現する上で,有効なテクニックとなっている。
本稿では,既存のFLベンチマークを補完するFLEdgeを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:44:31 GMT)
Double-Condensing Attention Condenser: Leveraging Attention in Deep Learning to Detect Skin Cancer from Skin Lesion Images [61.4] 皮膚がんはアメリカ合衆国で最も一般的な種類のがんであり、5人に1人のアメリカ人に影響を与えると推定されている。
近年の進歩は,SIIM-ISICメラノーマ分類チャレンジのアートパフォーマンスの状況から,皮膚がん検出に強い効果を示している。
本稿では,皮膚病変画像の皮膚癌検出に効率的な自己注意構造を活用し,皮膚病変画像からの皮膚癌検出をカスタマイズしたDC-ACを用いたディープニューラルネットワーク設計を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:34:02 GMT)
Temporal Fair Division of Indivisible Items [61.2] 分割不可能なアイテムが順次到着し,即時かつ無効に割り当てられなければならない公平な分割モデルについて検討する。
オンラインフェアディビジョンに関する以前の研究は、これらの制約の下で近似的なうらやみのない結果が得られないことを示してきた。
各ラウンドにおける累積割り当てが1項目までの時間的エンビーフリーネス(TEF1)に近似することを確実にすることを目指している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:43:36 GMT)
Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.3] 検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:42:25 GMT)
DRL Optimization Trajectory Generation via Wireless Network Intent-Guided Diffusion Models for Optimizing Resource Allocation [58.6] 本稿では、無線通信ネットワークの異なる状態変化に対応するために、カスタマイズされた無線ネットワークインテント(WNI-G)モデルを提案する。
大規模シミュレーションにより、動的通信システムにおけるスペクトル効率と従来のDRLモデルの変動の安定性が向上する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:04:38 GMT)
Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment [57.0] 本研究では,視覚言語アライメントを改善するための細粒度検証器として,モデル自身のビジュアルエンコーダを利用する新たな自己アライメント手法であるFiSAOを提案する。
ビジョンエンコーダからのトークンレベルのフィードバックを活用することで、FiSAOは視覚言語アライメントを大幅に改善する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:34:32 GMT)
VLFeedback: A Large-Scale AI Feedback Dataset for Large Vision-Language Models Alignment [55.8] 本稿では,視覚言語モデルの整合性向上のためのAIフィードバックの有効性について検討する。
最初の大規模視覚言語フィードバックデータセットであるVLFeedbackを紹介する。
我々は、VLFeedback上で直接選好最適化によって微調整されたLVLMであるSilkieを訓練する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:10:38 GMT)
VLFeedback: A Large-Scale AI Feedback Dataset for Large Vision-Language Models Alignment [55.8] 本稿では,視覚言語モデルの整合性向上のためのAIフィードバックの有効性について検討する。
最初の大規模視覚言語フィードバックデータセットであるVLFeedbackを紹介する。
我々は、VLFeedback上で直接選好最適化によって微調整されたLVLMであるSilkieを訓練する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:10:38 GMT)
Towards Robust Transcription: Exploring Noise Injection Strategies for Training Data Augmentation [55.8] 本研究では,SNR(Signal-to-Noise Ratio)レベルにおける白色雑音の影響について検討した。
この研究は、様々な音環境における一貫した性能を維持する転写モデルの開発に向けた予備的な研究として、貴重な洞察を与えてくれることを願っている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:31:36 GMT)
Open Domain Question Answering with Conflicting Contexts [55.7] あいまいでオープンなドメインの質問の25%は、Google Searchを使って検索すると、コンフリクトのあるコンテキストにつながります。
我々はアノテータに正しい回答の選択についての説明を依頼する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:32:50 GMT)
Multi-LLM QA with Embodied Exploration [55.6] 未知環境における質問応答におけるマルチエンボディードLEMエクスプローラ(MELE)の利用について検討する。
複数のLSMベースのエージェントが独立して家庭用環境に関する質問を探索し、回答する。
各問合せに対して1つの最終回答を生成するために,異なるアグリゲーション手法を解析する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:27:07 GMT)
RA-BLIP: Multimodal Adaptive Retrieval-Augmented Bootstrapping Language-Image Pre-training [55.5] 近年,MLLM (Multimodal Large Language Models) が注目されている。
検索拡張技術はLLMとMLLMの両方に有効なプラグインであることが証明されている。
本研究では,MLLMの新しい検索支援フレームワークであるRA-BLIP(Retrieval-Augmented Bootstrapping Language-Image Pre-training)を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:45:19 GMT)
SurgeryV2: Bridging the Gap Between Model Merging and Multi-Task Learning with Deep Representation Surgery [54.9] モデルマージに基づくマルチタスク学習(MTL)は、複数のエキスパートモデルをマージしてMTLを実行するための有望なアプローチを提供する。
本稿では,統合モデルの表現分布について検討し,「表現バイアス」の重要な問題を明らかにする。
このバイアスは、マージされたMTLモデルの表現と専門家モデルの間の大きな分布ギャップから生じ、マージされたMTLモデルの最適下性能に繋がる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:49:40 GMT)
Explaining Modern Gated-Linear RNNs via a Unified Implicit Attention Formulation [54.5] 効率的なシーケンスモデリングの最近の進歩は、Mamba、RWKV、および様々なゲートRNNのような注意のないレイヤーを生み出している。
我々はこれらのモデルの統一的なビューを示し、暗黙の因果自己注意層のような層を定式化する。
筆者らのフレームワークは,異なるレイヤに対する類似の基盤となるメカニズムを比較検討し,説明可能性の手法を直接適用する手段を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:20:11 GMT)
REEF: Representation Encoding Fingerprints for Large Language Models [53.7] REEFは、被疑者モデルと被害者モデルの表現との中心となるカーネルアライメントの類似性を計算し、比較する。
このトレーニング不要のREEFは、モデルの一般的な能力を損なうことなく、シーケンシャルな微調整、プルーニング、モデルマージ、置換に堅牢である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:27:02 GMT)
Preview-based Category Contrastive Learning for Knowledge Distillation [53.6] 知識蒸留(PCKD)のための新しい予見型カテゴリーコントラスト学習法を提案する。
まず、インスタンスレベルの特徴対応と、インスタンスの特徴とカテゴリ中心の関係の両方の構造的知識を蒸留する。
カテゴリ表現を明示的に最適化し、インスタンスとカテゴリの表現を明確に関連付けることができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:31:00 GMT)
Movie101v2: Improved Movie Narration Benchmark [53.5] 映像の自動ナレーションは、視覚障害者を支援するために、映像に合わせたプロット記述を生成することを目的としている。
映画ナレーションに特化して設計されたデータ品質を向上した大規模バイリンガルデータセットであるMovie101v2を紹介する。
新しいベンチマークに基づいて,GPT-4Vを含む多数の視覚言語モデルをベースライン化し,ナレーション生成における課題の詳細な分析を行う。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:44:05 GMT)
Rethinking Distance Metrics for Counterfactual Explainability [53.4] 本研究では, 反事実を参照領域から独立して引き出すのではなく, 基礎となるデータ分布からの参照と共同してサンプリングする, 反事実生成手法のフレーミングについて検討する。
我々は、幅広い設定に適用可能な、反ファクト的な類似性のために調整された距離メートル法を導出する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:06:50 GMT)
The multimode conditional quantum Entropy Power Inequality and the squashed entanglement of the extreme multimode bosonic Gaussian channels [53.3] 不等式はボゾン量子モードの最も一般的な線形混合の出力の最小条件フォン・ノイマンエントロピーを決定する。
ボソニック量子系は、量子状態における電磁放射の数学的モデルを構成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:59:50 GMT)
A Complexity-Based Theory of Compositionality [53.0] AIでは、構成表現は配布外一般化の強力な形式を可能にすることができる。
ここでは、構成性に関する直観を考慮し、拡張する構成性の公式な定義を提案する。
この定義は概念的には単純で量的であり、アルゴリズム情報理論に基礎を置いており、あらゆる表現に適用できる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:37:27 GMT)
Mitigating Embedding Collapse in Diffusion Models for Categorical Data [52.9] 我々は,学習を安定させる埋め込み空間内の連続拡散フレームワークであるCATDMを紹介する。
ベンチマーク実験により、CATDMは埋没崩壊を緩和し、FFHQ、LSUN教会、LSUNベッドルームにおいて優れた結果をもたらすことが示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:12:33 GMT)
Make LLMs better zero-shot reasoners: Structure-orientated autonomous reasoning [52.8] 本稿では,Large Language Models (LLM) の質問をよりよく理解するための構造指向分析手法を提案する。
複雑な質問応答タスクの信頼性をさらに向上するために,多エージェント推論システム,構造指向自律推論エージェント(SARA)を提案する。
大規模な実験により,提案システムの有効性が検証された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:30:33 GMT)
RAG-ConfusionQA: A Benchmark for Evaluating LLMs on Confusing Questions [52.3] 会話AIエージェントはRetrieval Augmented Generation(RAG)を使用して、ユーザからの問い合わせに対して検証可能なドキュメント地上応答を提供する。
本稿では,与えられた文書コーパスから,文脈に乱れた多様な質問を効率的に生成する,新しい合成データ生成手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:11:29 GMT)
Beyond Binary: Towards Fine-Grained LLM-Generated Text Detection via Role Recognition and Involvement Measurement [51.6] 大規模言語モデル(LLM)は、オンライン談話における信頼を損なう可能性のあるコンテンツを生成する。
現在の手法はバイナリ分類に重点を置いており、人間とAIのコラボレーションのような現実のシナリオの複雑さに対処できないことが多い。
バイナリ分類を超えてこれらの課題に対処するために,LLM生成コンテンツを検出するための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:14:10 GMT)
How to Evaluate Reward Models for RLHF [51.3] 我々は、RLHF(Reinforcement Learning from Human Feedback)を通して強力な言語モデルを生成する能力を定量化する報酬モデルのための新しいベンチマークを導入する。
我々は,プロキシタスクの報酬モデルを評価することにより,下流LLM性能の予測モデルを構築した。
大規模クラウドソースによる人選好プラットフォーム上でのエンドツーエンドのRLHF実験をローンチした。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:38:21 GMT)
SudoLM: Learning Access Control of Parametric Knowledge with Authorization Alignment [51.3] 我々は,特定のパラメトリック知識のアクセス制御をLLMが学べるフレームワークであるSudoLMを提案する。
2つのアプリケーションシナリオの実験は、SudoLMがユーザのパラメトリック知識へのアクセスを効果的に制御し、その汎用性を維持することを実証している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:59:51 GMT)
DAWN: Dynamic Frame Avatar with Non-autoregressive Diffusion Framework for Talking Head Video Generation [50.7] 本稿では,動的長大映像のオール・アット・オンス生成を可能にするフレームワークであるDAWNを提案する。
DAWNは,(1)潜在動作空間における音声駆動型顔力学生成,(2)音声駆動型頭部ポーズと点滅生成の2つの主要成分から構成される。
本手法は, 唇の動きを正確に表現し, 自然なポーズ・瞬き動作を特徴とする実写映像と鮮明な映像を生成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:19:02 GMT)
MetaAlign: Align Large Language Models with Diverse Preferences during Inference Time [50.4] 大規模言語モデル(LLM)は、広範なテキストコーパスから広範な知識と顕著な能力を取得する。
LLMをより使いやすくするためには、それらを人間の好みに合わせることが不可欠である。
提案手法は,LLMが推論時に指定される様々な明示的あるいは暗黙的な選好と動的に整合するのを支援することを目的としている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:31:13 GMT)
Distance between Relevant Information Pieces Causes Bias in Long-Context LLMs [50.4] LongPiBenchは、複数の関連する情報を含む位置バイアスを評価するために設計されたベンチマークである。
これらの実験によると、現在のほとんどのモデルは「中間の失われた」問題に対して堅牢であるが、関連する情報片の間隔に関する重大なバイアスが存在する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:41:19 GMT)
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.3] 本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:26:46 GMT)
Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.3] 本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
実験の結果、CagView-3-PlusとIdeogram 2のスコアは0.2/1となった。
UNet や Transformer の相互モーダルアライメントは,セマンティックなバリエーションを扱う上で重要な役割を担っていることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:26:46 GMT)
How Do Multilingual Models Remember? Investigating Multilingual Factual Recall Mechanisms [50.1] 大規模言語モデル(LLM)は、事前訓練中に取得した膨大な事実知識を格納し、取得する。
これらのプロセスが他の言語や多言語 LLM にどのように一般化されるのかという問題は未解明のままである。
言語がリコールプロセスにおいてどのような役割を果たすのかを考察し,言語に依存しない,言語に依存したメカニズムの証拠を明らかにする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:39:34 GMT)
A Fundamental Trade-off in Aligned Language Models and its Relation to Sampling Adaptors [50.0] 一致した言語モデルからコーパスをサンプリングする場合,文字列の平均報酬と平均ログ類似度との間にはトレードオフが存在することを示す。
我々は、この現象を形式的に処理し、サンプリングアダプタの選択が、どれだけの確率で報酬を交換できるかを選択できるかを実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:43:40 GMT)
Neural Signed Distance Function Inference through Splatting 3D Gaussians Pulled on Zero-Level Set [49.8] 多視点表面再構成における符号付き距離関数(SDF)の推測は不可欠である。
本稿では3DGSとニューラルSDFの学習をシームレスに融合する手法を提案する。
我々の数値的および視覚的比較は、広く使用されているベンチマークの最先端結果よりも優れていることを示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:48:06 GMT)
LoGU: Long-form Generation with Uncertainty Expressions [49.8] 不確実性を伴う長文生成(LoGU)の課題について紹介する。
不確実性抑制と不確実性誤認の2つの主要な課題を特定します。
当社のフレームワークでは,原子的クレームに基づく不確実性を改善するため,分割・分散戦略を採用している。
提案手法が精度を向上し,幻覚を低減し,応答の包括性を維持できることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:15:35 GMT)
CRAB: Cross-environment Agent Benchmark for Multimodal Language Model Agents [49.7] Crabは、クロス環境タスクをサポートするように設計された最初のベンチマークフレームワークである。
私たちのフレームワークは複数のデバイスをサポートし、Pythonインターフェースで簡単に任意の環境に拡張できます。
実験の結果、GPT-4oの1剤が38.01%の最高完成率を達成することが示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:29:39 GMT)
On the Use of Proxies in Political Ad Targeting [49.6] 我々は、主要な政治広告主がプロキシ属性をターゲットとして緩和を回避したことを示す。
本研究は政治広告の規制に関する議論に重要な意味を持つ。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:15:13 GMT)
Unified Convergence Analysis for Score-Based Diffusion Models with Deterministic Samplers [49.2] 決定論的サンプリングのための統合収束分析フレームワークを提案する。
我々のフレームワークは$tilde O(d2/epsilon)$の反復複雑性を実現する。
また,Denoising Implicit Diffusion Models (DDIM) タイプのサンプルについて詳細な分析を行った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:37:36 GMT)
Synthesizing Post-Training Data for LLMs through Multi-Agent Simulation [48.2] ポストトレーニングは、大きな言語モデルが人間の指示に従うことを可能にするために不可欠である。
マルチエージェントシミュレーションを利用して、さまざまなテキストベースのシナリオを自動的に生成する。
本稿では,シナリオ駆動型命令生成器MATRIX-Genを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:01:39 GMT)
2D-TPE: Two-Dimensional Positional Encoding Enhances Table Understanding for Large Language Models [48.1] 既存の方法はしばしば2次元のテーブル構造をトークンの列に平らにする。
2D-TPEは、計算効率を保ちながら本質的な空間情報を失うリスクを効果的に軽減する。
5つのベンチマークによる大規模な実験は、2D-TPEが強いベースラインより優れていることを示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:15:29 GMT)
2D-TPE: Two-Dimensional Positional Encoding Enhances Table Understanding for Large Language Models [48.1] 既存の方法はしばしば2次元のテーブル構造をトークンの列に平らにする。
2D-TPEは、計算効率を保ちながら本質的な空間情報を失うリスクを効果的に軽減する。
5つのベンチマークによる大規模な実験は、2D-TPEが強いベースラインより優れていることを示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:15:29 GMT)
2D-TPE: Two-Dimensional Positional Encoding Enhances Table Understanding for Large Language Models [48.1] 既存の方法はしばしば2次元のテーブル構造をトークンの列に平らにする。
2D-TPEは、計算効率を保ちながら本質的な空間情報を失うリスクを効果的に軽減する。
5つのベンチマークによる大規模な実験は、2D-TPEが強いベースラインより優れていることを示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:15:29 GMT)
Error Span Annotation: A Balanced Approach for Human Evaluation of Machine Translation [48.1] Error Spanを紹介します。
ESA - DAの継続的な評価と高レベルの評価を組み合わせる人間評価プロトコル。
MQM のマーキングのエラー重大度。
ESAは、高価なMQM専門家の必要なしに、同じ品質レベルでMQMよりも高速で安価なアノテーションを提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:20:43 GMT)
Quantization Effects on Neural Networks Perception: How would quantization change the perceptual field of vision models? [48.0] 本研究では,量子化が視覚モデルの空間認識能力に与える影響について検討する。
ImageNetから1万の画像のデータセットを利用する。
我々はCAMの微妙な変化と、Salientオブジェクトマップとのアライメントを同定する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:51:50 GMT)
From Introspection to Best Practices: Principled Analysis of Demonstrations in Multimodal In-Context Learning [47.8] マルチモーダル ICL では,タスクごとにモダリティが異なることが示される。
タスク固有のモダリティの影響に導かれ、ICL性能を高めるためのモダリティ駆動型実証戦略を推奨する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:37:33 GMT)
Integrating Deep Learning with Fundus and Optical Coherence Tomography for Cardiovascular Disease Prediction [47.7] 心血管疾患(CVD)のリスクのある患者の早期発見は、効果的な予防ケア、医療負担の軽減、患者の生活の質の向上に不可欠である。
本研究は、網膜光コヒーレンス断層撮影(OCT)と眼底写真との併用による、将来の心疾患の特定の可能性を示すものである。
そこで我々は,MCVAE(Multi- Channel Variational Autoencoder)に基づく新たなバイナリ分類ネットワークを提案し,患者の眼底画像とOCT画像の潜伏埋め込みを学習し,個人を将来CVDを発症する可能性のあるものとそうでないものとの2つのグループに分類する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:37:51 GMT)
Supervised Fine-Tuning Achieve Rapid Task Adaption Via Alternating Attention Head Activation Patterns [47.6] 本研究では,SFTプロセスがLLMを下流タスクに適応させるプロセスについて,注意パターンの観点から検討する。
LLMは、SFT中にタスク固有のアテンションヘッドを選択的に活性化し、(2)複雑なタスクのアクティベーションパターンは基本的なタスクパターンの組み合わせであり、(3)少数のパラメータの変化は、少数のサンプル上でSFT後のアクティベーションパターンに大きな影響を与える。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:38:47 GMT)
BlackDAN: A Black-Box Multi-Objective Approach for Effective and Contextual Jailbreaking of Large Language Models [47.6] BlackDANは、多目的最適化を備えた革新的なブラックボックス攻撃フレームワークである。
ジェイルブレイクを効果的に促進する高品質なプロンプトを生成する。
コンテキスト関連性を維持し、検出可能性を最小限にする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:03:05 GMT)
BlackDAN: A Black-Box Multi-Objective Approach for Effective and Contextual Jailbreaking of Large Language Models [47.6] BlackDANは、多目的最適化を備えた革新的なブラックボックス攻撃フレームワークである。
ジェイルブレイクを効果的に促進する高品質なプロンプトを生成する。
コンテキスト関連性を維持し、検出可能性を最小限にする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:03:05 GMT)
Does Mapo Tofu Contain Coffee? Probing LLMs for Food-related Cultural Knowledge [47.6] FmLAMA(FmLAMA)は、食品関連の文化的事実と食実践のバリエーションに着目した多言語データセットである。
我々は,LLMを様々なアーキテクチャや構成にわたって分析し,その性能を単言語と多言語の両方で評価する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:19:22 GMT)
Personalized Image Generation with Large Multimodal Models [47.3] そこで我々はPersonalized Image Generation Framework(PSH)を提案し,ユーザの視覚的嗜好やニーズをノイズの多いユーザ履歴やマルチモーダルな指示から捉える。
パーソナライズされたステッカーとポスター生成にPigeonを応用し,様々な生成ベースラインよりも定量的な結果と人的評価が優れていることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:20:46 GMT)
BlockFound: Customized blockchain foundation model for anomaly detection [47.0] BlockFoundは、異常なブロックチェーントランザクション検出のためのカスタマイズされた基盤モデルである。
ブロックチェーントランザクションのユニークなデータ構造をモデル化するための、一連のカスタマイズデザインを紹介します。
BlockFoundは、Solana上の異常なトランザクションを高精度に検出する唯一の方法である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:05:06 GMT)
BlockFound: Customized blockchain foundation model for anomaly detection [47.0] BlockFoundは、異常なブロックチェーントランザクション検出のためのカスタマイズされた基盤モデルである。
ブロックチェーントランザクションのユニークなデータ構造をモデル化するための、一連のカスタマイズデザインを紹介します。
BlockFoundは、Solana上の異常なトランザクションを高精度に検出する唯一の方法である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:05:06 GMT)
BlockFound: Customized blockchain foundation model for anomaly detection [47.0] BlockFoundは、異常なブロックチェーントランザクション検出のためのカスタマイズされた基盤モデルである。
ブロックチェーントランザクションのユニークなデータ構造をモデル化するための、一連のカスタマイズデザインを紹介します。
BlockFoundは、Solana上の異常なトランザクションを高精度に検出する唯一の方法である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:05:06 GMT)
SPRIG: Improving Large Language Model Performance by System Prompt Optimization [46.0] 大きな言語モデル(LLM)は多くのシナリオで印象的な機能を示しているが、そのパフォーマンスはプロンプトの選択に依存している。
本研究では,モデルの性能を最大化するために,既定成分からのプロンプトを反復的に構築する編集に基づく遺伝的アルゴリズムであるSPRIGを提案する。
47種類のタスクの集合に対して,システムプロンプトの性能を評価し,一般化性を確保する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:51:44 GMT)
SRAP-Agent: Simulating and Optimizing Scarce Resource Allocation Policy with LLM-based Agent [45.4] 本稿では,大規模言語モデル(LLM)を経済シミュレーションに統合する,革新的なフレームワークSRAP-Agentを提案する。
我々は、SRAP-Agentの有効性と有効性を検証するために、広範な政策シミュレーション実験を行う。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:43:42 GMT)
Transport properties and quantum phase transitions in one-dimensional superconductor-ferromagnetic insulator heterostructures [45.0] 最近製造された半導体-超伝導-強磁性絶縁体ハイブリッドに着想を得た1次元電子ナノデバイスを提案する。
FMI層長をオレンジ色または/またはグローバルバックゲート電圧を印加することにより、スピン及びフェルミオンパリティ変化QPTを調整可能であることを示す。
以上の結果から,これらの効果は実験的に利用可能であり,ハイブリッドナノワイヤにおける量子相転移の研究のための堅牢なプラットフォームを提供する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:25:50 GMT)
Hard Region Aware Network for Remote Sensing Change Detection [44.3] 変化検出(CD)は、都市管理や災害評価など、様々な現実世界の応用に不可欠である。
本稿では,ハード領域マイニングによる高精度な変化マップを提供するHRANetと呼ばれる新しい変化検出ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:14:57 GMT)
Can Few-shot Work in Long-Context? Recycling the Context to Generate Demonstrations [44.2] In-Context Learning (ICL) の例は少ないが、長いコンテキストでLLMのパフォーマンスを向上させるための魅力的なソリューションである。
そこで本稿では,コンテキストのリサイクルにより,長時間のQAタスクの少数例を自動的に生成する手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:07:53 GMT)
Spirit LM: Interleaved Spoken and Written Language Model [43.9] テキストと音声を自由に混合する基礎的マルチモーダル言語モデルであるSpirit LMを紹介する。
Spirit LMには、音声音声ユニット(HuBERT)を使用するベースバージョンと、ピッチとスタイルユニットを使用して表現性をモデル化するExpressiveバージョンの2つのバージョンがある。
我々は、Spirit LMがモダリティを越えて数ショットで新しいタスクを学習できることを実証した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:18:41 GMT)
Which LLMs are Difficult to Detect? A Detailed Analysis of Potential Factors Contributing to Difficulties in LLM Text Detection [43.7] 我々は、不均衡なデータセットで分類器を訓練するためにLibAUCライブラリを使用してAIGテキスト分類器を訓練する。
We results in the Deepfake Text dataset shows that AIG-text detection are various across domain。
学生エッセイに焦点をあてたIvy Pandaデータセットでは, LLMのOpenAIファミリは, 分類者が人文と区別することが極めて困難であった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:42:37 GMT)
Fisher Information-based Efficient Curriculum Federated Learning with Large Language Models [43.3] 本稿では,2つの新しい手法を用いたフィッシャー情報に基づく効率的なカリキュラムフェデレート学習フレームワーク(FibecFed)を提案する。
まず,各装置内のデータを適応的にサンプリングし,FL微調整プロセスの有効性を向上させるための漁師情報に基づく手法を提案する。
第2に,グローバルアグリゲーションのための適切なレイヤとLoRAによるローカル更新のためのスパースパラメータを動的に選択する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:22:02 GMT)
Fisher Information-based Efficient Curriculum Federated Learning with Large Language Models [43.3] 本稿では,2つの新しい手法を用いたフィッシャー情報に基づく効率的なカリキュラムフェデレート学習フレームワーク(FibecFed)を提案する。
まず,各装置内のデータを適応的にサンプリングし,FL微調整プロセスの有効性を向上させるための漁師情報に基づく手法を提案する。
第2に,グローバルアグリゲーションのための適切なレイヤとLoRAによるローカル更新のためのスパースパラメータを動的に選択する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:22:02 GMT)
Personalizing Low-Rank Bayesian Neural Networks Via Federated Learning [43.1] パーソナライズド・フェデレーション・ラーニング(PFL)における不確かさの定量化
本稿では,グローバルな決定論的モデルとパーソナライズされた低ランクベイズ補正を学習する新しいBPFL法であるLR-BPFLを提案する。
我々は、LR-BPFLを様々なデータセットで評価し、キャリブレーション、精度、計算およびメモリ要求の観点からその利点を実証した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:50:54 GMT)
Toward a Method to Generate Capability Ontologies from Natural Language Descriptions [43.1] この貢献は、Large Language Models (LLMs) を用いた能力オントロジーモデリングを自動化する革新的な方法である。
我々のアプローチでは、能力の自然言語記述しか必要とせず、事前に定義されたプロンプトに自動的に挿入される。
提案手法は,最初の自然言語記述と最終的な人間のレビューと修正を行う必要があるため,手作業を大幅に削減する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:34:39 GMT)
On the Use of Large Language Models to Generate Capability Ontologies [43.1] 大規模言語モデル(LLM)は、自然言語テキスト入力から機械解釈可能なモデルを生成することができることを示した。
本稿では,LLMを用いて機能を実現する方法について検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:03:02 GMT)
EcomEdit: An Automated E-commerce Knowledge Editing Framework for Enhanced Product and Purchase Intention Understanding [42.4] 知識編集(KE)は、大規模言語モデル(LLM)における事実情報の修正と更新を目標とし、計算コストのかかる微調整なしに精度と関連性を保証する。
ECOMEDITは、Eコマース関連の知識とタスクに適した、Eコマースの知識自動編集フレームワークである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:31:22 GMT)
ProReason: Multi-Modal Proactive Reasoning with Decoupled Eyesight and Wisdom [42.0] 本稿ではProReasonという新しいビジュアル推論フレームワークを紹介する。
ProReasonは、マルチランプロアクティブな知覚と分離されたビジョン推論機能を備えている。
実験の結果、ProReasonは既存のマルチステップ推論フレームワークとパッシブピアメソッドの両方より優れていることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:22:06 GMT)
Isolated Causal Effects of Natural Language [41.6] 我々は、孤立因果効果の正式な推定フレームワークを導入する。
孤立効果推定と非焦点言語近似の精度を評価するための指標を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:32:38 GMT)
A Systematic Study of Cross-Layer KV Sharing for Efficient LLM Inference [41.1] キー値(KV)キャッシュは大規模言語モデル(LLM)の効率的な推論に有効であることが判明した。
本稿では,近年の手法とその新しいバリエーションを網羅する統一フレームワークを提案する。
KVキャッシュのサイズを2倍にすると、ほとんどの構成は、標準的なトランスよりも競合性能と高いスループットを達成することができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:01:14 GMT)
Distribution Guidance Network for Weakly Supervised Point Cloud Semantic Segmentation [40.2] 弱監督下で特徴空間を規制することで補助的制約を与える新しい視点を導入する。
本研究では,弱教師付き学習部と分散アライメント部とからなる分散誘導ネットワーク(DGNet)を開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:27:05 GMT)
Distribution Guidance Network for Weakly Supervised Point Cloud Semantic Segmentation [40.2] 弱監督下で特徴空間を規制することで補助的制約を与える新しい視点を導入する。
本研究では,弱教師付き学習部と分散アライメント部とからなる分散誘導ネットワーク(DGNet)を開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:27:05 GMT)
Soft-Label Integration for Robust Toxicity Classification [39.2] この研究は、クラウドソースアノテーションとソフトラベル技術を統合する、新しい双方向最適化フレームワークを導入している。
GroupDROは、アウト・オブ・ディストリビューション(OOD)リスクに対する堅牢性を高めるために使用される。
実験の結果,提案手法は,平均および最悪のグループ精度において,既存のベースライン法よりも優れていた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:36:03 GMT)
AutoPal: Autonomous Adaptation to Users for Personal AI Companionship [39.0] 本稿では、パーソナルAIコンパニオンにおける自律的適応の必要性を強調する。
エージェントのペルソナを制御可能かつ真正に調整できる階層型フレームワークであるAutoPalを考案する。
実験はAutoPalの有効性を示し、AIコンパニオンにおける自律的適応性の重要性を強調している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:10:13 GMT)
TreeBoN: Enhancing Inference-Time Alignment with Speculative Tree-Search and Best-of-N Sampling [39.0] 推論時アライメントは、追加のトレーニングや微調整を必要とせずに、大きな言語モデルの性能を向上させる。
Best-of-N (BoN) サンプリングは、単純だが強力なアプローチであり、複数のレスポンスを生成し、最良のものを選択する。
我々は、投機的木探索戦略をBest-of-N(BoN)サンプリングに統合する新しいフレームワークであるTreeBoNを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:38:21 GMT)
A Modular-based Strategy for Mitigating Gradient Conflicts in Simultaneous Speech Translation [38.7] 同時音声翻訳(SimulST)は、ストリーミング音声入力を継続的に処理しながら、ターゲット言語テキストを生成する。
本稿では,より微細なモジュラレベルでの衝突を検知し,勾配予測を用いて解決するMGCM(Modular Gradient Conflict Mitigation)戦略を提案する。
実験の結果,MGCMは特に中・高遅延条件下で,SimulSTの性能を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:32:45 GMT)
MOS: Model Synergy for Test-Time Adaptation on LiDAR-Based 3D Object Detection [38.6] 3次元検出器のための新しいオンラインテスト時間適応フレームワークを提案する。
これまでのテストバッチから長期的知識を活用することで、我々のアプローチは破滅的な忘れを軽減し、多様なシフトに効果的に適応します。
提案手法は,3つのデータセットと8種類の汚職に対して,既存のテスト時間適応戦略に対して厳格に検証した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:40:19 GMT)
Simple Opinion Dynamics for No-Regret Learning [38.6] 分散GOSSIPモデルにおける協調的マルチエージェントバンディット設定について検討する。
この設定のために、メモリレスおよび時間に依存しないプロトコルのファミリーを導入・分析する。
定常的な報酬設定のために、これらの単純なプロトコルが世界の最高の振る舞いを示すことを初めて証明する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:00:31 GMT)
Flow-based Sampling for Entanglement Entropy and the Machine Learning of Defects [38.2] 生成モデルを用いて格子量子場理論におけるR'enyiエンタンジメントエントロピーを数値計算する新しい手法を提案する。
本稿では,2つのレプリカを接続する格子欠陥を取り巻くニューラルネットワークアーキテクチャを用いて,フローベースのアプローチとレプリカのトリックを組み合わせる方法について述べる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:51:25 GMT)
DistRL: An Asynchronous Distributed Reinforcement Learning Framework for On-Device Control Agents [38.0] DistRLは、モバイルデバイス制御エージェントのオンラインRLファインチューニングの効率を高めるために設計された、新しいフレームワークである。
平均して、DistRLはトレーニング効率を3倍改善し、主要な同期マルチマシンメソッドよりも2.4倍高速なトレーニングデータ収集を可能にする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:19:56 GMT)
Scalable Drift Monitoring in Medical Imaging AI [37.2] 我々は,スケーラブルなドリフトモニタリングのための拡張フレームワークであるMCC+を開発した。
それは、医療画像AIモデルのためのリアルタイムドリフト検出を導入したCheXstrayフレームワークの上に構築されている。
MMC+は、継続的パフォーマンス監視の信頼性と費用対効果を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:26:30 GMT)
MicroDreamer: Efficient 3D Generation in $\sim$20 Seconds by Score-based Iterative Reconstruction [37.1] 本稿では,NFEの削減のために,異なる3次元再構成過程を模倣した効率的かつ汎用的なアルゴリズムであるスコアベース反復再構成(SIR)を提案する。
我々は,様々な3次元表現や3次元生成タスクに適用可能な,MicroDreamerと呼ばれる効率的な手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:13:44 GMT)
MoDification: Mixture of Depths Made Easy [36.3] 深さの混合(MoD)は、遅延とメモリの両方を減少させるのに最適である。
MoDificationは、レイテンシの最大1.2倍の高速化とメモリの1.8倍の削減を実現している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:22:07 GMT)
Optimization-based Causal Estimation from Heterogenous Environments [35.7] CoCoは、純粋な予測と因果推論のギャップを埋める最適化アルゴリズムである。
本稿では,本手法の理論的基礎を説明し,シミュレーションおよび実データに対する有効性を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:46:28 GMT)
Contextual Linear Optimization with Bandit Feedback [35.7] 文脈線形最適化(CLO)は、ランダムコスト係数の不確実性を低減するために予測的文脈特徴を用いる。
我々は,帯域幅フィードバックを用いたCLOのためのオフライン学習アルゴリズムのクラスについて検討する。
IERMに対する高速な後悔境界を示し、不特定モデルクラスと最適化推定の柔軟な選択を可能にする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:02:28 GMT)
Making LLMs Vulnerable to Prompt Injection via Poisoning Alignment [35.6] 攻撃者はLSMのアライメントプロセスに毒を盛ることで、即時注射攻撃の成功を促進できることを示す。
具体的には,有毒なアライメントサンプルを戦略的に生成する手法であるPoisonedAlignを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:52:16 GMT)
Provable In-context Learning for Mixture of Linear Regressions using Transformers [34.5] 線形回帰モデルの学習混合物の文脈における変換器の文脈内学習能力について理論的に検討する。
2つの混合の場合、高いSNR系では$mathcaltildeO((d/n)1/4)$、低信号-雑音比(SNR)系では$mathcaltildeO(sqrtd/n)$の順序で、オラクル予測子に対して精度の高い変換器が存在することを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:28:47 GMT)
EvoPress: Towards Optimal Dynamic Model Compression via Evolutionary Search [33.9] 本稿では, 与えられた入力範囲において, 確実に最適である動的圧縮に対する新しい, 汎用的なアプローチを提案する。
これらの理論的保証は、Llama, Mistral, Phiモデルの動的圧縮に高い競争力を与えることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:46:37 GMT)
ASTPrompter: Weakly Supervised Automated Language Model Red-Teaming to Identify Likely Toxic Prompts [33.8] 凍結したディフェンダーから有害な出力を誘導するプロンプトを発見することができるレッドチームタスクの強化学習式を提案する。
我々は,GPT-2,GPT-2 XL,TinyLlamaディフェンダーから毒性を誘発する可能性(低難易度)のプロンプトを生成できることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:14:46 GMT)
A Distance-based Anomaly Detection Framework for Deep Reinforcement Learning [33.6] 深層強化学習(RL)システムでは、異常な状態が予測不能な行動や安全でない行動を引き起こす可能性があり、重大なリスクを引き起こす。
深部RLアルゴリズムのための新しいMahalanobis distance-based anomaly detection framework, textitMDXを提案する。
MDXは、オフラインとオンラインの両方の設定において、ランダム、逆境、およびアウト・オブ・ディストリビューション(OOD)状態のアウトレイラに同時に対処する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:32:27 GMT)
FINED: Feed Instance-Wise Information Need with Essential and Disentangled Parametric Knowledge from the Past [33.4] 提案するFINED to Feed Instance-wise information need with Essential and Disentangled parametric knowledge from past data for recommendation enhancement。
我々は,過去のデータから任意の順序の知識パターンを抽出する知識抽出器と,任意の順序パターンを記憶する知識エンコーダを訓練する。
プロセス全体は提案した2つの制約によって規則化され、パラメトリック知識ベースの性能は、そのサイズを増大させることなく向上する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:07:06 GMT)
An Evolved Universal Transformer Memory [33.3] 従来の手法では, コンテクストの特定の部分を手作業によるルールで取り除き, 現代的な基礎モデルのエスカレーションコストを相殺することを提案した。
ニューラルアテンション記憶モデル(NAMM)によるこのトレードオフを克服する。
私たちは、個々のレイヤとアテンションヘッドの最も関連性の高い情報に焦点を当てた、さまざまな潜伏したコンテキストを提供するように進化しています。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:53:14 GMT)
Efficient charge-preserving excited state preparation with variational quantum algorithms [33.0] 本稿では、対称性と対応する保存電荷をVQDフレームワークに組み込むために設計された電荷保存型VQD(CPVQD)アルゴリズムを紹介する。
その結果、高エネルギー物理学、核物理学、量子化学への応用が示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:30:14 GMT)
Do Not Design, Learn: A Trainable Scoring Function for Uncertainty Estimation in Generative LLMs [32.7] Learnable Response Scoring (LARS)は、トークンと確率の間の複雑な依存関係をキャプチャするために教師付きデータを活用する、新しいスコアリング機能である。
実験の結果,LARSは既存のスコアリング機能よりも優れており,最大16%のAUROCスコアが向上した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:28:29 GMT)
BenTo: Benchmark Task Reduction with In-Context Transferability [32.6] 本稿では,大規模言語モデル(LLM)のベンチマークに使用するタスクを効率的に削減する方法を検討する。
In-context Learning (ICL) による2つのタスク間の伝達可能性を推定する実用的な指標を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:15:21 GMT)
Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis [32.5] 大規模言語モデルのアンラーニングは、セキュリティとプライバシの懸念に対処する可能性から、注目を集めている。
この研究の多くは、機密コンテンツを含む事前定義されたインスタンスの削除を対象とする、インスタンスレベルの未学習に集中している。
本稿では,対象モデルからエンティティ関連知識を完全に消去することを目的とした,エンティティレベルのアンラーニングという新しいタスクを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:00:57 GMT)
Starbucks: Improved Training for 2D Matryoshka Embeddings [32.4] 我々は,Matryoshkaライクな埋め込みモデルの新たなトレーニング戦略であるStarbucksを提案する。
微調整相について、我々は、小さなサイズから大きなサイズの層次元対の固定されたリストを提供する。
また,サブレイヤとサブディメンジョンにマスク付きオートエンコーダ言語モデリングを適用する,新しい事前学習戦略を導入する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:36:37 GMT)
UniMTS: Unified Pre-training for Motion Time Series [32.4] 動作時系列の最初の統合事前学習手順であるUniMTSを紹介する。
我々は,大規模言語モデルによって強化されたテキスト記述と動作時系列を整合させる,対照的な学習フレームワークを採用している。
本モデルでは,18の動作時系列分類ベンチマークデータセットに対して,例外的な一般化性を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:39:13 GMT)
Storyboard guided Alignment for Fine-grained Video Action Recognition [32.0] 微細なビデオアクション認識は、ビデオテキストマッチング問題として概念化することができる。
i) 異なるグローバルなセマンティクスを持つビデオは、類似したアトミックなアクションや外観を共有し、(ii) ビデオ内のアトミックなアクションは、瞬間的、遅い、あるいは、グローバルなビデオセマンティクスと直接的に関係しない、という2つの観察に基づく多粒度フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:40:41 GMT)
Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens [31.6] 言語モデルは、トレーニングデータセットで過去のトークンが与えられた次のトークンの可能性を最大化するためにしばしば訓練される。
推論時間の間は、前述したトークンを入力として次のトークンを予測することによって、テキストを逐次かつ自動回帰的に生成する。
本稿では、モデル自己生成に基づく2つの簡単なアプローチを提案し、この訓練時間と推論時間との相違に対処する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:48:27 GMT)
What's New in My Data? Novelty Exploration via Contrastive Generation [31.3] 創成による新規発見の課題(CGE)について紹介する。
CGEは、これらの特性を示す例を生成することによって、微調整データセットの新たな特性を特定することを目的としている。
本実験では,CGEが有害な言語や新しい自然言語,プログラミング言語などの新規なコンテンツの検出に有効であることを実証した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:24:05 GMT)
PTR: A Pre-trained Language Model for Trajectory Recovery [31.1] そこで我々は, PTR と呼ばれるフレームワークを提案し, 限られた高密度軌跡データの問題を緩和する。
PTRは明示的な軌道プロンプトを組み込み、複数のサンプリング間隔を持つデータセットでトレーニングされる。
また、軌道点を符号化し、観測点と欠点の両方の埋め込みをPLMに理解可能な形式に変換する軌道埋め込み器を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:38:12 GMT)
Biometric Authentication Based on Enhanced Remote Photoplethysmography Signal Morphology [31.0] リモート・フォトプレソグラフィー (Remote Photoplethhymography) は、顔画像から心臓の信号を計測する非接触法である。
近年の研究では、各個人が生体認証識別子として使用できる独自のc信号形態を持っていることが示されている。
提案手法では,rの認証モデルをトレーニングするために,対象ID付き顔画像のみを識別する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:23:00 GMT)
Advancing Histopathology with Deep Learning Under Data Scarcity: A Decade in Review [30.9] 病理組織学における深層学習の応用について概説する。
われわれは過去10年間にデータ不足によって引き起こされた課題に注目している。
未調査の研究機会を特定します。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:29:48 GMT)
DMGNN: Detecting and Mitigating Backdoor Attacks in Graph Neural Networks [30.8] 我々は,DMGNNを,アウト・オブ・ディストリビューション(OOD)およびイン・ディストリビューション(ID)グラフバックドア攻撃に対して提案する。
DMGNNは、偽説明に基づいてラベル遷移を予測することによって、隠されたIDとOODトリガを容易に識別できる。
DMGNNは最新技術(SOTA)防衛法をはるかに上回り、モデル性能のほとんど無視できる劣化を伴って攻撃成功率を5%に低下させる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:08:03 GMT)
CAPE: A Chinese Dataset for Appraisal-based Emotional Generation using Large Language Models [30.4] 認知評価理論に基づく感情コーパスという中国のデータセットであるCAPEを作成するための2段階の自動データ生成フレームワークを提案する。
このコーパスは、多様な個人的・状況的要因を考慮し、文脈的に適切な感情的反応を伴う対話を生成する。
我々の研究は、会話エージェントにおける感情表現を前進させる可能性を示し、よりニュアンスで有意義な人間とコンピュータの相互作用の道を開いた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:33:18 GMT)
Nova: An Iterative Planning and Search Approach to Enhance Novelty and Diversity of LLM Generated Ideas [30.4] 我々は,大規模言語モデル(LLM)の創造的可能性を高めるために,拡張計画と探索手法を導入する。
我々の枠組みは、特に新規性と多様性において、生成したアイデアの質を大幅に高める。
本手法は,スイスのトーナメント評価において,170枚のシード論文に基づいて,少なくとも2.5倍以上の上位のアイデアを生成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:04:36 GMT)
Towards Satellite Non-IID Imagery: A Spectral Clustering-Assisted Federated Learning Approach [29.6] 低軌道(LEO)衛星は、様々なモノのインターネット(IoT)アプリケーションを実現するために、豊富な地球観測データ(EOD)を集めることができる。
効率的なEDD処理機構を実現するためには,1) 衛星と地上局の接続が間欠的であるため,大規模なデータを地上に送信することなく観測データを処理すること,2) 非独立で同一の(非IID)衛星データを処理すること,の課題を検討する必要がある。
軌道を用いたスペクトルクラスタリングによるクラスタリング型自己知識蒸留(OSC-FSKD)を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:04:25 GMT)
Towards Verifiable Text Generation with Evolving Memory and Self-Reflection [29.5] 検証可能なテキスト生成は、大規模な言語モデルに対して、精度検証のための引用付きコンテンツを生成するよう促す。
しかし、フォーカスシフト現象、クレームを正しい引用と整合させるために必要な複雑な推論、検索された文書の精度と幅の間のジレンマのため、検証可能なテキスト生成は簡単ではない。
本稿では、記憶と自己回帰を進化させる検証可能なテキスト生成のための革新的なフレームワークであるVTGを紹介する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:02:46 GMT)
Swiss Army Knife: Synergizing Biases in Knowledge from Vision Foundation Models for Multi-Task Learning [29.3] ビジョン・ファンデーション・モデル (VFM) は、多くの下流タスクにおいて卓越した性能を示した。
それら固有の表現バイアスのため、VFMは異なる視覚タスクにまたがる利点と欠点を示す。
本稿では,VFM 委員会からの知識を適応的に蒸留し,マルチタスク学習を強化する,新規で汎用性の高い "Swiss Army Knife" (SAK) ソリューションを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:32:39 GMT)
LLM The Genius Paradox: A Linguistic and Math Expert's Struggle with Simple Word-based Counting Problems [28.7] LLMは、人間が扱いやすいようないくつかの基本的なタスク、例えば単語トラウベリーの文字数rを数えるのに苦労する。
我々は,高度な数学的およびコーディング推論能力の伝達可能性について,特殊なLCMから単純なカウントタスクまでの測定を行う。
微調整や文脈内学習といった戦略と比較すると、係り受け推論はLLMのタスクをより知覚するのに役立つ最も堅牢で効率的な方法であることがわかる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:17:16 GMT)
Efficient and reversible optical-to-spin conversion for solid-state quantum memories [28.6] 光子の長期化と効率的な量子記憶は、量子リピータおよびネットワーク応用の鍵となる要素である。
原子周波数コムメモリにおけるバック・フォー・フォス・光スピン変換のモデル化と計測について述べる。
提案手法と結果により,ミリ秒の時間スケールで151Eu3+:Y2SiO5の光子状態の長期保存が可能となる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:47:34 GMT)
Formal Explanations for Neuro-Symbolic AI [28.4] 本稿では,ニューロシンボリックシステムの決定を説明するための公式なアプローチを提案する。
これはまず、説明が必要な神経情報の個々の部分のサブセットを特定するのに役立つ。
これに続いて、階層的な形式的な説明の簡潔さを促進するために、互いに独立して、これらの個々の神経入力のみを説明する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:08:31 GMT)
MixEval-X: Any-to-Any Evaluations from Real-World Data Mixtures [28.1] 我々はMixEval-Xを紹介した。これは、様々な入力と出力のモダリティで評価を最適化するように設計された、世界初の実世界ベンチマークである。
実世界のタスク分布を再構築するために,マルチモーダルベンチマークと適応修正パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:56:52 GMT)
A Survey of Mamba [27.9] 近年,基礎モデル構築の代替手段として,Mambaという新しいアーキテクチャが登場している。
本研究では,マンバモデルの発展,多様なデータにマンバを適応させる技術,およびマンバが優れている応用について検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:46:43 GMT)
Efficiently Quantifying and Mitigating Ripple Effects in Model Editing [27.6] 大規模な言語モデルは、時代遅れまたは誤った情報の修正に不可欠である。
これらのモデルを編集すると、しばしば、隠れた空間におけるリップル効果と呼ばれる複雑な問題が発生する。
本稿では,モデルの適応とその後の編集の影響を定量的に評価する新しい評価手法を提案する。
さらに,このリップル効果を緩和するモデル編集法であるSelective Impact Revision(SIR)を導入する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:06:39 GMT)
Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models [27.3] MVTrajは、軌道表現学習のための新しい多視点モデリング手法である。
GPSから道路網、関心点まで多様な文脈知識を統合し、軌跡データのより包括的な理解を提供する。
実世界のデータセットに対する大規模な実験により、MVTrajは様々な空間ビューに関連するタスクにおいて、既存のベースラインを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:33:19 GMT)
Agents4PLC: Automating Closed-loop PLC Code Generation and Verification in Industrial Control Systems using LLM-based Agents [27.1] Agents4PLCは、PLCコード生成とコードレベルの検証を自動化する新しいフレームワークである。
まず、検証可能なPLCコード生成領域のベンチマークを作成する。
そして、自然言語の要件から、人間によって記述された形式仕様と参照PLCコードへ移行する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:51:13 GMT)
Towards Lifelong Dialogue Agents via Relation-aware Memory Construction and Timeline-augmented Response Generation [27.0] 本稿では,生涯対話エージェントのフレームワークであるTheanineを紹介する。
テアニンは記憶の除去を放棄し、その時間的および原因=効果の関係に基づいてそれらをリンクすることで大規模な記憶を管理する。
本稿では,G-Evalの限界と,メモリ拡張ダイアログエージェントの測定における人的努力に対処する,反事実駆動型評価手法であるTeaFarmを紹介する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:54:21 GMT)
Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding [26.7] Video-XLは、時間スケールの効率的なビデオ理解のために設計された、超長い視覚言語モデルである。
我々のモデルは、人気のある長大映像理解ベンチマークにおいて有望な結果を得る。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:03:08 GMT)
Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding [26.7] Video-XLは、時間スケールの効率的なビデオ理解のために設計された、超長い視覚言語モデルである。
我々のモデルは,限られた画像データで訓練されているにも関わらず,一般的な長大映像理解ベンチマークにおいて有望な結果が得られる。
我々は、ビデオ要約、監視異常検出、広告配置識別などの長大なビデオアプリケーションにとって、ビデオ-XLが貴重なツールになることを期待している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:03:08 GMT)
ACCEPT: Adaptive Codebook for Composite and Efficient Prompt Tuning [26.4] 複合・効率的なプロンプトチューニングのための適応型コードブック(ACCEPT)を提案する。
本手法では,すべてのソフトプロンプトが,学習可能なコードブックベクトルの集合を各部分空間で共有できる,製品量子化(PQ)の概念について述べる。
言語モデルのパラメータのわずか0.3%をチューニングすることで、17の多様な自然言語タスクにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:56:32 GMT)
I run as fast as a rabbit, can you? A Multilingual Simile Dialogue Dataset [26.4] シミュラ(simile)とは、2つの異なるもの(テノールと車両と呼ばれる)を共通の性質で比較する言語である。
現在のシミュレート研究は、通常、三重項(テノール、資産、車両)または一文のシミュレートに焦点を当てている。
複雑なシミュレート現象の研究を容易にするために, 新規で高品質なマルチリンガル・シミュレート・ダイアログ(MSD)データセットを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:12:45 GMT)
DaRePlane: Direction-aware Representations for Dynamic Scene Reconstruction [26.4] DaRePlaneは、6つの異なる方向からダイナミクスをキャプチャする新しい表現手法である。
DaRePlaneは様々な複雑なダイナミックシーンのための新しいビュー合成において最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:19:10 GMT)
Implicit Regularization of Sharpness-Aware Minimization for Scale-Invariant Problems [26.4] この研究は均衡性という概念を導入し、2つの変数の平方ノルムの差として定義される。
我々は,スケール不変問題に適した資源効率のSAM変種である平衡性認識正規化(BAR)を開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:19:18 GMT)
Variational Distillation of Diffusion Policies into Mixture of Experts [26.3] 本研究は, 拡散反応をエキスパート混合体 (MoE) に蒸留する新しい方法である変動拡散蒸留 (VDD) を導入する。
拡散モデル(英: Diffusion Models)は、複雑なマルチモーダル分布を正確に学習し、表現する能力があるため、生成モデリングにおける現在の最先端技術である。
VDDは、事前学習した拡散モデルをMoEモデルに蒸留し、拡散モデルの表現性を混合モデルの利点と組み合わせる最初の方法である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:28:06 GMT)
When LLMs Go Online: The Emerging Threat of Web-Enabled LLMs [26.3] 個人データを含むサイバー攻撃における大規模言語モデル(LLM)の誤用に関連するリスクについて検討する。
具体的には,サイバーアタックの実施を指示されたLLMエージェントがいかに強力かを理解することを目的としている。
本稿では,PII(Personally Identible Information)の収集,偽造投稿の生成,スピアフィッシングメールの作成の3つの攻撃シナリオについて検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:16:34 GMT)
Fine-Tuning Pre-trained Language Models for Robust Causal Representation Learning [26.3] プレトレーニング言語モデル(PLM)の微調整は、様々な領域で有効であることが示されている。
本研究では, 分解仮定に基づいて, いわゆる因果前ドア調整によりロバスト表現を導出可能であることを示す。
そこで本研究では,表現学習に微調整機構と因果関係を導入することにより,領域一般化問題に光を当てる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:06:23 GMT)
SciAssess: Benchmarking LLM Proficiency in Scientific Literature Analysis [26.1] SciAssessは、科学文献分析におけるLarge Language Models(LLM)の総合的な評価のためのベンチマークである。
記憶機能評価(L1)、記憶機能評価(L2)、分析・推論機能評価(L3)により,LLMの有効性を徹底的に評価することを目的とする。
それは、生物学、化学、材料、医学など、様々な科学分野から引き出された様々なタスクを含んでいる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:52:17 GMT)
DiTFastAttn: Attention Compression for Diffusion Transformer Models [26.1] 拡散変換器(DiT)は画像および映像生成において優れるが、自己注意演算子による計算上の課題に直面している。
本稿では,DiTの計算ボトルネックを軽減するための後処理圧縮手法であるDiTFastAttnを提案する。
その結果,画像生成ではFLOPの最大76%を削減し,高分解能(2k x 2k)世代で最大1.8倍の高速化を実現した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:05:21 GMT)
Computational Grounding of Responsibility Attribution and Anticipation in LTLf [26.0] 責任(Responsibility)とは、行動や戦略に関する反現実的な推論を含む多面的な概念である。
我々は, 勝敗, 支配的, 最善戦略の合成を含む, 反応合成の概念との関連性を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:38:33 GMT)
Towards Faithful Natural Language Explanations: A Study Using Activation Patching in Large Language Models [25.8] 大きな言語モデル(LLM)は、その答えを正当化するために説得力のある自然言語説明(NLE)を生成することができる。
近年,NLEの忠実度を測定するための様々な手法が提案されている。
これらのアプローチは、確立された忠実性の定義に従って包括的でも正しくも設計されていない、と我々は主張する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:45:42 GMT)
A Large Language Model-Driven Reward Design Framework via Dynamic Feedback for Reinforcement Learning [25.8] CARDは報酬関数コードを反復的に生成し改善するリワードデザインフレームワークである。
CARDにはコードの生成と検証を行うCoderが含まれており、Evaluatorはコードを改善するためにCoderをガイドする動的なフィードバックを提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:51:51 GMT)
A Tighter Complexity Analysis of SparseGPT [25.7] SparseGPT[Frantar, Alistarh ICML 2023]のランニングタイムを$O(d3)$から$O(domega + d2+a+o)$に改善する。
この実行時間は,[Deng, Song, Weinstein 2022; Brand, Song, Zhou ICML 2024]のような反復メンテナンス問題における遅延更新動作の分析によるものだ。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:36:03 GMT)
Dialetto, ma Quanto Dialetto? Transcribing and Evaluating Dialects on a Continuum [25.7] イタリア語方言における音声とテキストのパフォーマンスを測定し,地理的な特徴の相違を実証的に観察する。
この格差は(-0.5)言語的に最もパフォーマンスの高い方言とほぼ類似している。
さらに, 地学的手法を用いて, 見えない場所でのゼロショット性能を予測し, 地理的情報の導入により予測性能を大幅に向上する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:39:42 GMT)
Preference-Based Planning in Stochastic Environments: From Partially-Ordered Temporal Goals to Most Preferred Policies [25.7] マルコフ決定過程としてモデル化されたシステムは、時間的に拡張された一連の目標に対して部分的に順序づけられた選好を考慮に入れている。
部分的に順序づけられた選好を計画するために、時間的目標に対する選好をMDPの政策に対する選好にマッピングする順序理論を導入する。
順序付けの下で最も好まれるポリシーは、MDP内の有限経路上の非支配確率分布を誘導する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:50:57 GMT)
A Survey on Computational Solutions for Reconstructing Complete Objects by Reassembling Their Fractured Parts [25.6] 完全な対象をその部分から再構成することは、多くの科学領域における根本的な問題である。
この文脈で既存のアルゴリズムを提供し、それらの類似点と汎用アプローチとの相違点を強調する。
アルゴリズムに加えて、この調査では既存のデータセット、オープンソースソフトウェアパッケージ、アプリケーションについても記述する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:53:07 GMT)
Unraveling and Mitigating Retriever Inconsistencies in Retrieval-Augmented Large Language Models [25.3] Retrieval-augmented Large Language Models (RALMs) は、元の検索自由言語モデル (LMs) を一貫して上回るものではない。
提案実験により, この例レベルの性能不整合性は, 検索強化と検索不要のLMの間だけでなく, 異なる検索者の間にも存在することが明らかとなった。
本稿では,異なる知識ソースから適応的に検索し,予測不能な読み出し誤りを効果的に低減できるトレーニング可能なフレームワークであるEnsemble of Retrievers(EoR)を紹介する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:54:37 GMT)
Vital Insight: Assisting Experts' Sensemaking Process of Multi-modal Personal Tracking Data Using Visualization and LLM [25.3] Vital Insightは、ビジュアライゼーションと大規模言語モデルによる直接表現と間接推論を組み合わせたエビデンスベースの「センスメイキング」システムである。
我々は、マルチモーダルトラッキングの専門家14名とともに、ユーザテストセッションにおいて、Vital Insightを評価し、設計上の意味を合成し、AIが支援する推論と直接データ表現を反復的に移動して洞察を探索、検索、質問、検証する専門家のセンスメイキングモデルを開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:56:35 GMT)
Cyber Attacks Prevention Towards Prosumer-based EV Charging Stations: An Edge-assisted Federated Prototype Knowledge Distillation Approach [25.2] 本稿では,1)ネットワークトラフィック(NT)データに対するサイバーアタック検出と,2)サイバーアタック介入の2つの側面について述べる。
本稿では,各クライアントを専用ローカルエッジサーバ(DLES)上に配置するエッジ支援型プロトタイプ知識蒸留(E-FPKD)手法を提案する。
実験分析により、提案したE-FPKDは、NSL-KDD、UNSW-NB15、IoTID20データセット上で最大のODCを達成可能であることが示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:26:24 GMT)
Synergizing In-context Learning with Hints for End-to-end Task-oriented Dialog Systems [25.1] LLM(Large Language Model)ベースのTODシステムは、コンテキスト内例を通してタスクを学習する能力のため、限られたデータでも優れている。
低データ設定におけるアライメントを改善するために,タスク固有のヒントでLLMを相乗化するSyncTODを提案する。
ChatGPTでは、SyncTODは低データ設定でLLMベースのベースラインやSoTAモデルよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:14:50 GMT)
Object Pose Estimation via the Aggregation of Diffusion Features [25.1] 画像から物体のポーズを推定することは、3Dシーン理解において重要な課題である。
最近のアプローチは、目に見えないオブジェクトを扱う場合、大幅なパフォーマンス低下を経験します。
粒度の異なる拡散特性を効果的に捕捉・集約できる3つの異なるアーキテクチャを提案する。
提案手法は,3つのベンチマークデータセットに対して,最先端の手法よりもかなりの差がある。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:21:56 GMT)
Train & Constrain: Phonologically Informed Tongue-Twister Generation from Topics and Paraphrases [25.0] 大言語モデル(LLM)から音韻的に情報を得た舌ねじれ音を生成するパイプラインを提案する。
生成されたデータセットに基づいてトレーニングした小型モデルの自動評価と人的評価の結果を示す。
本稿では,自動回帰言語モデルに統合可能な,音素認識型制約付き復号モジュール(PACD)を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:25:44 GMT)
Train & Constrain: Phonologically Informed Tongue-Twister Generation from Topics and Paraphrases [25.0] 大言語モデル(LLM)から音韻的に情報を得た舌ねじれ音を生成するパイプラインを提案する。
生成されたデータセットに基づいてトレーニングした小型モデルの自動評価と人的評価の結果を示す。
本稿では,自動回帰言語モデルに統合可能な,音素認識型制約付き復号モジュール(PACD)を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:25:44 GMT)
Disentangling Heterogeneous Knowledge Concept Embedding for Cognitive Diagnosis on Untested Knowledge [24.4] 異義性認知診断(DisKCD)と呼ばれる認知診断のための新しい枠組みを提案する。
コースの成績、課題のエクササイズ、学習リソースを活用して、学生、演習、知識概念の潜在的表現を学習する。
我々は,学生,演習,テストされた知識概念(TKC),UKCを通じて異種関係グラフネットワークを構築した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:57:01 GMT)
From Solitary Directives to Interactive Encouragement! LLM Secure Code Generation by Natural Language Prompting [24.3] SecCodeは、テキストのみのNLプロンプトでセキュアなコード生成のために、革新的なインタラクティブな励ましプロンプト(EP)技術を活用するフレームワークである。
1) NL Prompts を用いたコード生成,2) コード脆弱性の検出と修正,提案したプロモーションプロンプトの利用,3) 脆弱性のクロスチェッキングとコードセキュリティリファインメント。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:32:08 GMT)
Hierarchical Conditional Multi-Task Learning for Streamflow Modeling [24.0] 階層型条件付きマルチタスク学習(HCMTL)は,流れの因果関係に基づく土壌水と積雪の連成モデルである。
HCMTLの長期にわたる排水流域での優れた性能は、ドメイン固有の因果知識を深層学習に統合することで、予測精度と解釈可能性の両方が向上することを示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:14:57 GMT)
Coherence-Driven Multimodal Safety Dialogue with Active Learning for Embodied Agents [24.0] M-CoDAL(M-CoDAL)は、安全クリティカルな状況下でのコミュニケーションをよりよく理解するために、実施エージェント向けに設計されたマルチモーダル対話システムである。
提案手法は,2K Reddit画像から抽出した1Kの安全違反を含む,新たに作成されたマルチモーダルデータセットを用いて評価する。
このデータセットで得られた結果は、我々のアプローチが会話の安全性だけでなく、安全状況、ユーザーの感情、および会話の安全性の解決を改善することを実証している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:26:06 GMT)
MambaSCI: Efficient Mamba-UNet for Quad-Bayer Patterned Video Snapshot Compressive Imaging [23.7] 既存のカラービデオSCI再構成アルゴリズムは、従来のベイアパターンに基づいて設計されている。
MambaSCIは計算コストとメモリコストの削減で最先端の手法を超越している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:02:57 GMT)
E3D-GPT: Enhanced 3D Visual Foundation for Medical Vision-Language Model [23.6] 3次元医用視覚言語モデルの開発は、疾患の診断と患者の治療に有意な可能性を秘めている。
自己教師付き学習を用いて3次元視覚特徴抽出のための3次元視覚基盤モデルを構築した。
本研究では,3次元空間畳み込みを高精細画像の特徴の集約・投影に応用し,計算複雑性を低減した。
本モデルは,既存の報告生成法,視覚的質問応答法,疾患診断法と比較して,優れた性能を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:31:40 GMT)
MediTOD: An English Dialogue Dataset for Medical History Taking with Comprehensive Annotations [23.4] 本研究は,医学史研究のための英語における医師と患者との対話のデータセットであるMedictoDを紹介する。
医療領域に合わせたアンケートに基づくラベリング手法を考案する。
そして、医療専門家は高品質の包括的なアノテーションでデータセットを作成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:38:22 GMT)
How Do Training Methods Influence the Utilization of Vision Models? [23.4] すべての学習可能なパラメータが、ニューラルネットワークの決定関数に等しく寄与するわけではない。
アーキテクチャとタスクの複雑さがこの現象にどのように影響するかを調べる以前の研究を再考する。
本研究により, 学習手法は, 与えられた課題に対する決定関数にどの層が重要になるかに強く影響を与えることが明らかとなった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:54:46 GMT)
MlingConf: A Comprehensive Study of Multilingual Confidence Estimation on Large Language Models [23.4] 本稿では,多言語信頼度推定(MlingConf)の大規模言語モデル(LLM)に関する包括的調査を紹介する。
このベンチマークは、LAタスクのための4つの厳密にチェックされ、人間によって評価された高品質な多言語データセットと、言語の特定の社会的、文化的、地理的コンテキストに合わせて調整されたLSタスクからなる。
LAのタスクでは、英語が他の言語よりも言語的優位性を示す一方で、LSタスクでは、質問関連言語を用いてLSMを誘導し、多言語的信頼度推定において言語的優位性を改善することが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:19:51 GMT)
A Comprehensive Study of Multilingual Confidence Estimation on Large Language Models [23.4] 本稿では,多言語信頼度推定(MlingConf)の大規模言語モデル(LLM)に関する包括的調査を紹介する。
このベンチマークは、LAタスクのための4つの厳密にチェックされ、人間によって評価された高品質な多言語データセットと、言語の特定の社会的、文化的、地理的コンテキストに合わせて調整されたLSタスクからなる。
LAのタスクでは、英語が他の言語よりも言語的優位性を示す一方で、LSタスクでは、質問関連言語を用いてLSMを誘導し、多言語的信頼度推定において言語的優位性を改善することが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:34:12 GMT)
Laplace Transform Based Low-Complexity Learning of Continuous Markov Semigroups [23.0] 本稿ではマルコフ半群の無限小生成器(IG)のスペクトル分解を通してマルコフ過程を学習するためのデータ駆動型アプローチを提案する。
物理インフォームドカーネルレグレッションを含む既存の技術は計算コストが高く、スコープが限られている。
本稿では,移動演算子のラプラス変換を特徴とするIGの分解能を利用する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:02:06 GMT)
Crossroads of Continents: Automated Artifact Extraction for Cultural Adaptation with Large Multimodal Models [22.9] DALL-E 3によって生成され、人間によって検証される大規模なデータセットであるDalleStreetを紹介する。
我々は,オープンソース(LLaVA)とクローズドソース(GPT-4V)の両方のモデルを用いて,地理的サブリージョンレベルでの文化的理解の相違を見出した。
以上の結果から,LMMの文化的能力の微妙なイメージが浮かび上がっており,文化認識システムの開発の必要性が浮かび上がっている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:39:15 GMT)
Debiasing Mini-Batch Quadratics for Applications in Deep Learning [22.9] 二次近似は、機械学習の手法の基本的な構成要素を形成する。
トレーニングセット全体の計算が(ディープラーニングに典型的な)難易度の高い場合、関連する量はミニバッチ上で計算される。
このバイアスは体系的な誤りを生じさせ, (ii) 理論的に説明し, (iii) 深層学習におけるラプラス近似による2次最適化と不確実性の関係を説明し, (iv) 偏見戦略の開発と評価を行う。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:37:05 GMT)
P3: A Policy-Driven, Pace-Adaptive, and Diversity-Promoted Framework for data pruning in LLM Training [22.6] 本稿では、反復データプルーニングによるタスク固有の微調整プロセスの最適化を目的とした適応型フレームワークであるP3を紹介する。
P3は、政策駆動型困難度測定、ペース適応選択、多様性促進の3つの主要な構成要素で構成されている。
我々は,従来のデータプルーニング手法に対して,P3を推論シナリオであるAPPSとMATHで検証し,大幅な改善を示した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:52:38 GMT)
Graph Contrastive Learning via Cluster-refined Negative Sampling for Semi-supervised Text Classification [22.5] グラフコントラスト学習(GCL)はテキスト分類タスクに広く応用されている。
既存のGCLベースのテキスト分類手法は、しばしば負のサンプリングバイアスに悩まされる。
本稿では,クラスタ教師付き負サンプリングによるグラフコントラスト学習の革新的なGCL手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:03:49 GMT)
Pseudo-label Refinement for Improving Self-Supervised Learning Systems [22.3] 自己教師付き学習システムは、人間のアノテーションを必要とせずに、クラスタリングベースの擬似ラベルを使用して監督する。
クラスタリング手法によって生じるこれらの擬似ラベルのノイズは、学習プロセスに難題となり、性能が劣化する。
本稿では,この問題に対処する擬似ラベル改良アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:47:59 GMT)
Game Theory with Simulation in the Presence of Unpredictable Randomisation [22.2] そこで我々は,あるエージェントが,その混合戦略を学習するために,一方のエージェントが他方のエージェントをシミュレートするために固定費用を支払うことができるゲーム理論の環境で,その問題を研究する。
純粋ストラテジーシミュレーションの先行研究とは対照的に、混合ストラテジーシミュレーションが両プレイヤーに改善をもたらすことはないことを証明した。
我々は,シミュレータが信頼レベルを拡大するオプションがある場合,混合戦略シミュレーションは社会福祉を改善することができることを確認した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:17:18 GMT)
SciLitLLM: How to Adapt LLMs for Scientific Literature Understanding [22.1] 大言語モデルの成功にもかかわらず、科学文献理解の課題に直面している。
連続事前学習(CPT)と教師付き微調整(SFT)を統合したハイブリッド戦略を提案する。
我々は科学文献理解に特化したLLMスイートSciLitLLMを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:04:53 GMT)
PertEval: Unveiling Real Knowledge Capacity of LLMs with Knowledge-Invariant Perturbations [22.0] 本稿では,大言語モデルの知識能力を探索するツールキットPertEvalを紹介する。
PertEvalは、静的ベンチマークからオンザフライテストサンプルを生成するために、人間のような再配置技術を採用している。
我々の発見は、より堅牢で真に理解できるLSMを前進させる洞察を与えてくれる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:57:08 GMT)
Joint Verification and Refinement of Language Models for Safety-Constrained Planning [22.0] 本研究では,実行可能計画を生成する手法を開発し,タスク関連安全仕様に対して正式に検証する。
自然言語で高レベルなタスク記述が与えられた場合、提案手法は言語モデルに問い合わせ、実行可能なロボットプログラムの形式で計画を生成する。
その後、生成されたプランをオートマトンベースの表現に変換し、仕様に対するオートマトンの公式な検証を可能にする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:16:30 GMT)
BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities [21.7] BiGRは、生成訓練のためのコンパクトなバイナリ潜在符号を用いた、新しい条件付き画像生成モデルである。
BiGRは、同じフレームワーク内で生成と識別を統一する最初の条件付き生成モデルである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:59:04 GMT)
Hyper-multi-step: The Truth Behind Difficult Long-context Tasks [21.7] Long-context Language Model (LCLM) はますます人気が高まっている。
長いコンテキストのベンチマークでは、最も先進的なLCLMでさえ完成に苦しむ課題が提示される。
本研究は, 主に2つの基本課題から生じる難易度を示す実験を行った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:09:31 GMT)
Hyper-multi-step: The Truth Behind Difficult Long-context Tasks [21.7] Long-context Language Model (LCLM) はますます人気が高まっている。
長いコンテキストのベンチマークでは、最も先進的なLCLMでさえ完成に苦しむ課題が提示される。
本研究は, 主に2つの基本課題から生じる難易度を示す実験を行った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:09:31 GMT)
Croc: Pretraining Large Multimodal Models with Cross-Modal Comprehension [21.5] 本稿では,Large Language Models (LLM) のための新しい事前学習パラダイムを提案し,その視覚的理解能力を高める。
具体的には、動的に学習可能なプロンプトトークンプールを設計し、ハンガリーのアルゴリズムを用いて、元のビジュアルトークンの一部を最も関連性の高いプロンプトトークンに置き換える。
我々はCrocと呼ばれる新しい基礎モデルを提案し、大規模な視覚言語ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:44:25 GMT)
MiCEval: Unveiling Multimodal Chain of Thought's Quality via Image Description and Reasoning Steps [21.3] 本稿では,各推論ステップと記述の質を評価することによって,推論チェーンの正しさを評価するためのフレームワークを提案する。
MiCEvalは詳細なデータセット上に構築されており、各ステップを正確性、妥当性、情報性に応じて評価するアノテーションを備えている。
実験の結果、MiCEvalを用いた段階的評価は、既存の方法に比べて人間の判断とより密接に一致していることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:57:40 GMT)
Synthesizing Sentiment-Controlled Feedback For Multimodal Text and Image Data [21.2] 我々は,大規模な制御可能なマルチモーダルフィードバック合成データセットを構築し,制御可能なフィードバック合成システムを提案する。
このシステムは、テキスト入力と視覚入力のためのエンコーダ、デコーダ、および制御性ブロックを備えている。
CMFeedデータセットには、画像、テキスト、投稿に対する反応、関連スコアによる人間のコメント、これらのコメントに対する反応が含まれている。
これらの反応はモデルに特定の感情でフィードバックを生成するよう訓練し、感情分類の精度は77.23%であり、制御不能な精度より18.82%高い。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:50:53 GMT)
CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only [21.1] 本稿では,スクリーンショット画像のみを通して環境を知覚するエージェントを提案する。
大規模言語モデルの推論能力を活用することで,大規模人間の実演データの必要性を解消する。
AgentはMiniWoB++の平均成功率は94.5%、WebShopの平均タスクスコアは62.3である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:01:07 GMT)
Zero-shot Generalist Graph Anomaly Detection with Unified Neighborhood Prompts [21.1] グラフ異常検出(GAD)は、通常のパターンから著しく逸脱したグラフ内のノードを特定することを目的としている。
既存のGADメソッドは、教師付きでも教師なしでも、ワン・モデル・フォー・ワン・データセットのアプローチである。
ゼロショット・ジェネラリストのGADがUNPromptに近づき、一対一検出モデルを訓練する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:23:59 GMT)
MolecularGPT: Open Large Language Model (LLM) for Few-Shot Molecular Property Prediction [20.9] 数発の分子特性予測のための分子GPTを提案する。
10のダウンストリーム評価データセットで競合するコンテキスト内推論機能を示す。
また、最先端のLCMベースラインを最大15.7%増加させ、ゼロショット下の回帰指標(例えばRMSE)で17.9減少させる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:19:41 GMT)
Skill Generalization with Verbs [20.9] ロボットは人間が発する自然言語コマンドを理解できることが必須である。
本稿では,動詞を用いた新しいオブジェクトに対する操作スキルの一般化手法を提案する。
実ロボット上で2つの異なる対象カテゴリの新規インスタンスに適用した5つの動詞コマンドの実行に有効なトラジェクトリを生成することができることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:12:18 GMT)
Integrating spoken instructions into flight trajectory prediction to optimize automation in air traffic control [20.7] 現在の航空交通管制システムでは、交通予測のための音声指示を考慮できない。
本稿では,制御意図を情報処理ループに統合する自動化パラダイムを提案する。
3段階のプログレッシブ・マルチモーダル・ラーニング・パラダイムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:15:51 GMT)
Aligning AI Agents via Information-Directed Sampling [20.6] バンドアライメントの問題は、環境と人間と相互作用することで、長期にわたる期待される報酬を最大化することである。
本研究では,これらのトレードオフを,Beta-Bernoulli banditに類似した玩具帯状アライメント問題において理論的,実証的に検討する。
我々は、現在の慣行を反映した単純な探索アルゴリズムと、トンプソンサンプリングのような有望なアルゴリズムの両方が、この問題に対する許容できる解決策を提供していないことを実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:23:41 GMT)
ERDDCI: Exact Reversible Diffusion via Dual-Chain Inversion for High-Quality Image Editing [20.5] 拡散モデル(DM)は実画像編集に成功している。
近年のDMは、しばしば局所線形化の仮定に依存している。
ERDDCIは、新しいDual-Chain Inversion (DCI) を用いて関節推論を行い、正確な可逆拡散過程を導出する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:52:03 GMT)
Deep Implicit Optimization for Robust and Flexible Image Registration [20.3] ディープネットワークの層として最適化を取り入れることで,古典的手法と学習的手法のギャップを埋める。
繰り返し最適化によるエンド・ツー・エンドの識別を暗黙的に行うことで、学習した特徴は登録とラベル認識である。
我々のフレームワークは、ドメイン内のデータセットで優れたパフォーマンスを示し、ドメインシフトに依存しない。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:38:03 GMT)
PAPL-SLAM: Principal Axis-Anchored Monocular Point-Line SLAM [20.2] 本稿では,直線構造情報の利用と直線SLAMシステムにおけるラインの最適化について述べる。
主軸に類似した方向の線を固定し、$n+2$パラメータで$n$ラインを最適化し、両方の問題を一緒に解決する。
本研究では,異なる世界仮説に容易に拡張可能なシーン構造情報について考察する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:32:34 GMT)
Improving Reward Models with Synthetic Critiques [20.2] リワードモデル(RM)は、人間のフィードバックからの強化学習を通じて言語モデルを整合させる上で重要な役割を担っている。
本稿では,大規模言語モデルが生成する合成自然言語批判を用いて,新たなフィードバックを提供する手法を提案する。
本研究では,異なる事前学習モデルによるRMの性能とデータ効率の向上を実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:43:02 GMT)
UniG: Modelling Unitary 3D Gaussians for View-consistent 3D Reconstruction [20.1] ビュー一貫性を持つ3次元再構成と新しいビュー合成モデルUniGを提案する。
UniGはスパース画像から3Dガウスの高忠実度表現を生成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:02:28 GMT)
Understanding Likelihood Over-optimisation in Direct Alignment Algorithms [20.0] ダイレクトアライメントアルゴリズム(DAA)は、ヒューマンフィードバックによるオンライン強化学習の代替として登場した。
これらのアルゴリズムは、より良い(好ましくない)完了を生成する可能性を高めつつ、悪い(好ましくない)完了を阻止することを目的としている。
本研究は,最先端DAAにおける完成可能性とモデル性能の関係について検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:41:53 GMT)
Estimating the Causal Effects of T Cell Receptors [20.0] 患者に対するT細胞受容体配列の因果的影響を推測する手法を提案する。
我々のアプローチは、患者の環境や生活史など、保存されていない共同設立者に対して正当である。
デモでは、TCRが新型コロナウイルスの重症度に与える影響を分析するために使用します。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:45:14 GMT)
DiSCo Meets LLMs: A Unified Approach for Sparse Retrieval and Contextual Distillation in Conversational Search [19.7] 会話検索(英語: Conversational Search, CS)は、コーパスから関連文書を会話コンテキスト内で検索するタスクである。
現在の手法では、人間が書き直したクエリから埋め込みを蒸留してコンテキストモデリングタスクを学習することでこの問題に対処している。
本稿では,従来の目的を緩和し,検索とコンテキストモデリングを統一する新しい蒸留法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:03:17 GMT)
Zero-shot Action Localization via the Confidence of Large Vision-Language Models [19.7] 真のZEro-shot Action Localization法(ZEAL)を提案する。
具体的には、大規模言語モデル(LLM)の組み込みアクション知識を活用して、アクションを詳細に記述する。
我々は、訓練をせずに、挑戦的なベンチマークでゼロショットアクションローカライゼーションの顕著な結果を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:51:14 GMT)
Encode-Store-Retrieve: Augmenting Human Memory through Language-Encoded Egocentric Perception [19.6] メモリ拡張のための有望な道は、エゴセントリックなビデオをキャプチャして保存するために、拡張現実のヘッドマウントディスプレイを使用することである。
現在の技術では、大量のデータを効率的にエンコードして保存する能力が欠けている。
本稿では,ビデオデータの自然言語エンコーディングを活用し,ベクトルデータベースに格納するメモリ拡張エージェントを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:24:54 GMT)
"We Demand Justice!": Towards Social Context Grounding of Political Texts [19.6] ソーシャルメディアの談話は、しばしば「政治的スペクトルの対立する側が使用する、見事に類似した言語」で構成されている。
本稿では、そのような曖昧な文を計算環境で完全に理解するために必要なコンテキストを定義する。
本論文では,テキストの現実的コンテキストを理解する必要がある2つの挑戦的データセットを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:54:58 GMT)
Diffusion Curriculum: Synthetic-to-Real Generative Curriculum Learning via Image-Guided Diffusion [19.5] 品質の低いデータや少ないデータは、実際にディープニューラルネットワークをトレーニングする上で大きな課題となっている。
拡散カリキュラム(DisCL)は、訓練段階ごとに画像合成のイメージガイダンスレベルを調整する。
DisCLは、多様性や品質に弱いかもしれない高感度画像を学習するウォームアップとして、高品質な画像から特徴を学ぶことに焦点を当てている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:28:38 GMT)
Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learning [19.5] 心電図(ECG)の解釈には専門知識が必要である。
本研究は,数発のECG質問応答のための新しいマルチモーダルメタラーニング手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:48:01 GMT)
Spectral Representations for Accurate Causal Uncertainty Quantification with Gaussian Processes [19.4] ヒルベルト空間のスペクトル表現を通して制限に対処する手法IMPspecを導入する。
ヒルベルト空間回帰理論(英語版)において結果を拡張することにより、このモデルの後方が明示的に得られることを示す。
また、スペクトル表現を学習して後方校正を最適化する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:06:49 GMT)
Paths-over-Graph: Knowledge Graph Enpowered Large Language Model Reasoning [19.4] 我々は,KGから知識推論経路を統合することで,Large Language Models(LLM)推論を強化する新しい手法であるPaths-over-Graph(PoG)を提案する。
PoGは3段階の動的マルチホップパス探索を通じて、マルチホップとマルチエンタリティの問題に取り組む。
実験では、GPT-3.5-TurboのPoGは、GPT-4のToGを最大23.9%上回った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:57:19 GMT)
CausalChat: Interactive Causal Model Development and Refinement Using Large Language Models [19.4] 因果関係は変数間の複雑な関係をモデル化するために多くの分野で広く使われている。
近年のアプローチでは、人間の集団参加を通じて、群衆の知恵を活用して因果ネットワークの構築が試みられている。
我々は,OpenAIのGPT-4のような大規模言語モデルが大量の文献を取り込み,学習した因果的知識を活用するという,異なるアプローチを採用する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:33:32 GMT)
Fact, Fetch, and Reason: A Unified Evaluation of Retrieval-Augmented Generation [19.3] 新たなアプリケーションは、Large Language Models(LLMs)を使用して、検索強化世代(RAG)機能を強化している。
FRAMESは,LLMが現実的な応答を提供する能力をテストするために設計された高品質な評価データセットである。
本稿では,最先端のLLMでもこの課題に対処し,0.40の精度で検索を行なわないことを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:37:34 GMT)
Fact, Fetch, and Reason: A Unified Evaluation of Retrieval-Augmented Generation [19.3] 新たなアプリケーションは、Large Language Models(LLMs)を使用して、検索強化世代(RAG)機能を強化している。
FRAMESは,LLMが現実的な応答を提供する能力をテストするために設計された高品質な評価データセットである。
本稿では,最先端のLLMでもこの課題に対処し,0.40の精度で検索を行なわないことを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:37:34 GMT)
Privacy for Free in the Over-Parameterized Regime [19.3] ディファレンシャル・プライベート勾配降下(DP-GD)は、トレーニングデータのプライバシを保証してディープラーニングモデルをトレーニングする一般的なアルゴリズムである。
本研究では,2次損失を持つ一般的なランダム特徴モデルにおいて,十分大きな$p$に対して,プライバシが無償で取得可能であること,すなわち$left|R_P right| = o(1)$,プライバシパラメータ$varepsilon$が一定の順序を持つ場合に限らず,強いプライベート設定$varepsilon = o(1)$ が得られることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:01:11 GMT)
Graph Neural Network Enhanced Retrieval for Question Answering of LLMs [19.2] 既存の検索方法は、参照文書を通路に分割し、それらを分離して扱う。
しかし、これらの節はしばしば相互に関連しており、例えば連続した節や同じキーワードを共有している節などである。
本稿では,グラフニューラルネットワーク(GNN)を利用した新しい検索手法GNN-Retを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:20:38 GMT)
SPFresh: Incremental In-Place Update for Billion-Scale Vector Search [19.2] 位置ベクトル更新をサポートするシステムであるSPFreshを紹介する。
SPFreshの中心は軽量なインクリメンタルリバランシングプロトコルであるLIREである。
LIREでは,グローバルリビルドに基づくソリューションに対して,クエリレイテンシと精度が向上する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:24:18 GMT)
Convergence of Manifold Filter-Combine Networks [18.6] 多様体ニューラルネットワーク(MNN)をよりよく理解するために,Manifold Filter-Combine Networks (MFCNs)を導入する。
スパースグラフによる多様体の近似に依存する高次元点雲上でのMFCNの実装法を提案する。
我々は,データ点数が無限大になる傾向にあるため,この手法は極限に収束するという意味で一貫したものであることを証明した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:40:58 GMT)
Montessori-Instruct: Generate Influential Training Data Tailored for Student Learning [18.6] 我々は,教師言語モデルの学習プロセスに向けて,教師言語モデルのデータ合成能力を調整した新しいデータ合成フレームワークであるMontessori-Instructを提案する。
モンテッソーリ・インストラクトは標準合成法を18.35%、46.24%で大幅に上回っている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:50:15 GMT)
Measuring Diversity: Axioms and Challenges [18.5] 既存の多様性対策を体系的に検討し、場合によっては望ましくない行動を探る。
信頼できる多様性尺度の3つの望ましい性質(公理)を定式化する: 単調性、一意性、連続性。
望ましい性質をすべて備えた測度の2つの例を構築し、公理のリストが自己矛盾ではないことを証明した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:59:54 GMT)
Reasoning, Memorization, and Fine-Tuning Language Models for Non-Cooperative Games [18.4] ゲームにおける学習済み言語モデルの能力を高めるために,思考のツリーとマルチエージェントフレームワークを統合する手法を開発した。
ベンチマークアルゴリズムに対して65%の勝利率を示し、微調整後の10%の改善を加えました。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:28:22 GMT)
Variable Aperture Bokeh Rendering via Customized Focal Plane Guidance [18.4] 提案手法は,主流のボケモデルよりもはるかに軽量な4.4Mパラメータで,最先端の競合性能を実現している。
提案手法は,主流のボケモデルよりもはるかに軽量な4.4Mパラメータで,最先端の競合性能を実現している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:04:23 GMT)
FedSN: A Federated Learning Framework over Heterogeneous LEO Satellite Networks [18.2] 多数の低軌道軌道(LEO)衛星が打ち上げられ、SpaceXなどの商業企業によって宇宙に投入された。
LEO衛星が搭載するマルチモーダルセンサにより、通信だけでなく、空間変調認識やリモートセンシング画像分類など、さまざまな機械学習アプリケーションにも機能する。
本稿では,これらの課題に対処するための一般FLフレームワークとしてFedSNを提案し,LEO衛星上でのデータ多様性について検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:38:11 GMT)
MultiChartQA: Benchmarking Vision-Language Models on Multi-Chart Problems [18.2] チャート関連タスクの既存のベンチマークは、実世界のマルチチャートシナリオの複雑さを捉えるのに不足している。
直接質問応答,並列質問応答,比較推論,シーケンシャル推論の4つの重要な領域でMLLMの能力を評価するベンチマークであるMultiChartQAを紹介する。
本研究は,マルチチャート理解の課題と,この分野での進歩を促進するためのマルチチャートQAの可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:15:50 GMT)
TGB 2.0: A Benchmark for Learning on Temporal Knowledge Graphs and Heterogeneous Graphs [18.2] テンポラルグラフベンチマーク2.0 (TGB 2.0) は、テンポラルグラフ上の将来のリンクを予測する手法を評価するための新しいベンチマークフレームワークである。
TGB 2.0は、最大5300万のエッジを持つ5つのドメインにまたがる8つの新しいデータセットを提示することで、包括的な評価を容易にする。
1)エッジタイプの情報を活用することは高いパフォーマンスを得るために不可欠であり、2)単純なベースラインはより複雑な手法と競合することが多く、3)ほとんどのメソッドは我々の最大のデータセット上で動作しない。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:50:56 GMT)
Geometry-Aware Generative Autoencoders for Warped Riemannian Metric Learning and Generative Modeling on Data Manifolds [18.2] 本稿では,多様体学習と生成モデルを組み合わせた新しいフレームワークであるGeometry-Aware Generative Autoencoder (GAGA)を紹介する。
GAGAは、シミュレーションおよび実世界のデータセットにおける競合性能を示し、単一セルの集団レベルの軌道推定における最先端の手法よりも30%改善されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:27:10 GMT)
MoR: Mixture of Ranks for Low-Rank Adaptation Tuning [18.1] Low-Rank Adaptation (LoRA) は研究を推進し、その性能を完全な微調整と整合させる。
MoEスタイルのLoRAメソッドはパラメータと推論遅延を大幅に増加させる。
入力に基づいて異なるタスクのランク特化情報を学習するMixture of Ranks(MoR)を導入する。
MoRは1.31%のパフォーマンス向上を実現し、標準手法に比べて93.93%のパラメータしか使用していない。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:05:01 GMT)
Embedded Prompt Tuning: Towards Enhanced Calibration of Pretrained Models for Medical Images [18.1] 医用画像分類タスクに基礎モデルを適用する際の微調整手法の有効性について検討する。
拡張チャネルにプロンプトトークンを埋め込む組込みプロンプトチューニング(EPT)手法を提案する。
EPTは、数ショットの医用画像分類タスクにおいて、いくつかの最先端の微調整方法よりも顕著に優れている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:50:27 GMT)
On the Regularization of Learnable Embeddings for Time Series Processing [18.1] 時系列処理のための局所学習可能な埋め込みの学習を規則化する手法について検討する。
この文脈では,局所的パラメータと大域的パラメータの共適応を防ぐ手法が特に有効であることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:30:20 GMT)
TimeSeriesExam: A time series understanding exam [18.1] TimeSeriesExamは700以上の質問で構成され、104の慎重にキュレートされたテンプレートを使用して手続き的に生成される。
我々は、TimeSeriesExam上で7つの最先端LCMをテストし、時系列理解能力の総合的な評価を初めて提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:37:14 GMT)
AI on My Shoulder: Supporting Emotional Labor in Front-Office Roles with an LLM-based Empathetic Coworker [17.9] Pro-Pilotは、クライアントサービス代表者(CSR)が悪質なクライアントと対話しながら感情を調整できるように設計されたAIアシスタントである。
比較分析では,様々なシビルティインシデントに適応し,共感を示すPro-Pilotの能力を示す。
シミュレーション演習でPro-Pilotと対話した20人のCSRにインタビューしたところ、ネガティブな思考、最近の思考、そして顧客を人間化するのに役立ちました。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:22:07 GMT)
Revisiting SLO and Goodput Metrics in LLM Serving [17.8] サービスレベル目標(SLO)と出力-LLMサービスの性能を評価するために、1秒あたりのSLOを満たす要求数を導入します。
既存のメトリクスは、ユーザーエクスペリエンスの性質を捉えていない。
本稿では,ユーザエクスペリエンスの性質を反映したSLOとグッドプットを含む,統一されたメトリクスフレームワークスムーズなグッドプットを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:05:37 GMT)
GraphInsight: Unlocking Insights in Large Language Models for Graph Structure Understanding [17.7] 大規模言語モデル(LLM)は、グラフ記述シーケンスのプロンプトを通じてグラフィカルな構造情報を理解するのに苦労する。
マクロおよびマイクロレベルのグラフィカル情報に対するLLMの理解を改善するための新しいフレームワークであるGraphInsightを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:11:28 GMT)
Large Language Models Are Overparameterized Text Encoders [17.6] 大規模言語モデル(LLM)は、教師付きコントラスト訓練で微調整されたテキスト埋め込みモデルとして高い性能を示す。
我々は,LLMの最後の$p%のレイヤーを1000ステップの指導訓練前に刈り取ることで,メモリと推論時間の比例的に削減できることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:26:45 GMT)
A dataset for cyber threat intelligence modeling of connected autonomous vehicles [17.6] 本稿では,車両のサイバーセキュリティ知識マイニングに着目したサイバー脅威情報コーパスの作成について報告する。
提案したデータセットは、既存のアルゴリズムの性能を評価し、自動車分野におけるサイバー脅威情報モデリングの研究を進めるための貴重なリソースとなる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:55:12 GMT)
Path-based Explanation for Knowledge Graph Completion [17.5] GNNベースの知識グラフ補完モデルの結果に対する適切な説明は、モデルの透明性を高める。
KGCタスクを説明するための既存のプラクティスは、インスタンス/サブグラフベースのアプローチに依存している。
我々は、GNNベースのモデルを探索する最初のパスベースのKGC説明器であるPower-Linkを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:58:39 GMT)
Emergence in non-neural models: grokking modular arithmetic via average gradient outer product [16.9] グラッキングはニューラルネットワークや勾配降下に基づく最適化に特有ではないことを示す。
この現象はRecursive Feature Machinesを用いてモジュラー算術を学習する際に発生する。
この結果から,タスク関連の特徴を学習することで,創発が純粋に引き起こされることが示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:13:15 GMT)
AnomalyNCD: Towards Novel Anomaly Class Discovery in Industrial Scenarios [16.8] AnomalyNCDは、既存の異常検出手法と互換性のある多クラス異常分類フレームワークである。
異常特有の特徴を学習し、自己管理的な方法で異常を分類する。
本手法は,MVTec ADおよびMTDデータセットの最先端処理よりも優れる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:07:12 GMT)
One size doesn't fit all: Predicting the Number of Examples for In-Context Learning [16.7] In-context Learning (ICL)は、ラベル付きデータのトレーニングセットに少数の局所的な例(入力と意味的に類似しているもの)を追加するプロセスを指す。
私たちの作業は、この'one fits all'アプローチの制限を軽減し、数ショットの推論で使用する各データインスタンスの例数を動的に予測します。
テキスト分類ベンチマーク実験の結果,AICLが標準ICLを最大17%上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:10:05 GMT)
With Ears to See and Eyes to Hear: Sound Symbolism Experiments with Multimodal Large Language Models [16.6] 視覚言語モデル (VLM) は, 正書法や画像のみからの抽象的推論により, 暗黙的に音による現象を理解できることを示す。
我々は,古典的キキ・ブーバやミル・マール形状の再現,等級記号課題などの実験を行った。
以上の結果から, VLMは人体ラベルとの一致のレベルが異なることが示され, サイリコ実験ではVLMと人体ラベルとの対応がより重要となる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:42:06 GMT)
Addressing Blind Guessing: Calibration of Selection Bias in Multiple-Choice Question Answering by Video Language Models [16.3] ビデオ言語モデル(VLM)は、複雑なビデオ中心の質問に答えるように設計されている。
現在のベンチマークでは、選択バイアスのため、VLMの完全な推論能力の取得に失敗している。
本研究は,ビデオ-テキスト LLM モデルにおける選択バイアスについて,初めて焦点を絞った研究である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:52:22 GMT)
DFlow: Diverse Dialogue Flow Simulation with Large Language Models [16.2] 本稿では,合成対話の多様性を高めるために,新たなデータ拡張手法を提案する。
我々は、15の異なる領域に3,886の対話フローからなるタスク指向対話データセットを生成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:35:28 GMT)
Graph Neural Patching for Cold-Start Recommendations [16.1] コールドスタートレコメンデーション(GNP)のためのグラフニューラルパッチについて紹介する。
GNPは2つの機能を持つカスタマイズされたGNNフレームワークである。GWarmerは、既存の温かいユーザ/イベントの協調シグナルをモデリングし、Patching Networksは、GWarmerのコールドスタートレコメンデーションのパフォーマンスをシミュレートし、拡張する。
3つのベンチマークデータセットに対する大規模な実験は、温かみと寒さの両方のユーザ/イテムを推奨するGNPの優位性を確認している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:44:12 GMT)
What Do VLMs NOTICE? A Mechanistic Interpretability Pipeline for Gaussian-Noise-free Text-Image Corruption and Evaluation [16.0] 視覚言語モデル(VLM)における可読性評価パイプライン
SVO-Probes、MIT-States、Facial Expression Recognitionデータセットに関する実験により、VLM意思決定における重要な洞察が明らかになった。
この研究は、より透明で解釈可能なマルチモーダルシステムへの道を開いた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:25:49 GMT)
Few-Shot Joint Multimodal Entity-Relation Extraction via Knowledge-Enhanced Cross-modal Prompt Model [16.0] JMERE(Joint Multimodal Entity-Relation extract)は、ソーシャルメディア投稿において、エンティティとそれらの関係をテキストイメージペアから抽出することを目的とした課題である。
JMEREの既存の方法は大量のラベル付きデータを必要とする。
textbfKnowledge-textbfEnhanced textbfCross-modal textbfPrompt textbfModelを紹介する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:14:54 GMT)
A Communication and Computation Efficient Fully First-order Method for Decentralized Bilevel Optimization [16.0] 本稿では,分散バイレベル最適化のための完全一階分散手法である$textC2$DFBを提案する。
$textC2$DFBは計算効率と通信効率の両方です。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:00:45 GMT)
Better Batch for Deep Probabilistic Time Series Forecasting [15.3] 本稿では,確率的予測精度を高めるために,誤り自己相関を取り入れた新しいトレーニング手法を提案する。
本手法は,モデルトレーニングのためのD$連続時系列セグメントのコレクションとしてミニバッチを構築する。
各ミニバッチ上で時間変化の共分散行列を明示的に学習し、隣接する時間ステップ間の誤差相関を符号化する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:52:45 GMT)
Class-RAG: Content Moderation with Retrieval Augmented Generation [15.3] 検索拡張生成(Class-RAG)を用いた分類手法を提案する。
従来の微調整モデルと比較して、クラスRAGは意思決定の柔軟性と透明性を示している。
以上の結果から,検索ライブラリのサイズによってクラスRAG性能が向上することが示唆され,ライブラリサイズの増加はコンテンツモデレーションを改善するための実用的で低コストなアプローチであることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:07:36 GMT)
Survey on Modeling of Human-made Articulated Objects [15.3] 3Dモデリングはコンピュータビジョン、グラフィックス、ロボット工学における研究課題である。
本調査は, 調音物体の3次元モデリングにおける現状について概観する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:59:09 GMT)
Plug-and-Play Posterior Sampling under Mismatched Measurement and Prior Models [15.1] 後方サンプリングは、逆問題を解決するための強力なベイズ的アプローチであることが示されている。
近年,モンテカルロサンプリングの有望な手法として,プラグ・アンド・プレイアンプレイのランゲヴィンアルゴリズムが登場している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:41:23 GMT)
X-Fi: A Modality-Invariant Foundation Model for Multimodal Human Sensing [14.5] 現在の人間の感覚は主にカメラとLiDARに依存しており、それぞれに独自の強度と限界がある。
既存のマルチモーダル・フュージョン・ソリューションは、一般に固定されたモダリティの組み合わせのために設計されている。
この問題に対処するために、すべてのモダリティ(X-Fi)に対するモダリティ不変基盤モデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:57:51 GMT)
X-Fi: A Modality-Invariant Foundation Model for Multimodal Human Sensing [14.5] 現在の人間の感覚は主にカメラとLiDARに依存しており、それぞれに独自の強度と限界がある。
既存のマルチモーダル・フュージョン・ソリューションは、一般に固定されたモダリティの組み合わせのために設計されている。
この問題に対処するために、すべてのモダリティ(X-Fi)に対するモダリティ不変基盤モデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:57:51 GMT)
A Mirror Descent Perspective of Smoothed Sign Descent [14.2] 回帰問題に対する安定性定数$varepsilon$のスムーズな符号降下のダイナミクスについて検討する。
双対力学の研究により、収束解をブレグマン発散関数を最小化する近似KKT点として特徴づける。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:52:21 GMT)
Deep Learning-based MRI Reconstruction with Artificial Fourier Transform (AFT)-Net [14.1] 複合価値ディープラーニングフレームワーク-Artificial Fourier Transform Network (AFTNet)を導入する。
AFTNetは、ドメイン変換における画像逆問題の解決に容易に利用できる。
AFTNetは既存のアプローチに比べ,MRIの高速化に優れることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:41:06 GMT)
Stochastic Gradient Descent Jittering for Inverse Problems: Alleviating the Accuracy-Robustness Tradeoff [14.1] SGDジッタリング(SGDjittering)と呼ばれる,再構成時に繰り返しノイズを注入する簡易かつ効果的なMBAトレーニング手法を提案する。
理論的には、SGDジッタリングは平均二乗誤差トレーニングよりも一般化されるが、平均ケース攻撃ではより堅牢である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:57:01 GMT)
Feint and Attack: Attention-Based Strategies for Jailbreaking and Protecting LLMs [14.1] 大規模な言語モデル(LLM)の脆弱性にアクセスするのに、jailbreak攻撃を使用することができる。
注意重みの分布は、根本原因を分析するために導入された。
アテンションベースアタック(ABA)と呼ばれる効果的なジェイルブレイク攻撃戦略が提案されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:02:13 GMT)
Learning With Multi-Group Guarantees For Clusterable Subpopulations [14.0] 予測問題に対する標準的なデシプラタムは、パフォーマンス保証が人口よりも平均的に維持されるべきである。
しかし、意味のあるサブポピュレーションを構成するものは何だろうか?
個人の分布から自然に現れるクラスターに関して、関連するサブポピュレーションは定義されるべきである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:38:55 GMT)
Dynamic Negative Guidance of Diffusion Models [13.9] 負のプロンプティング(NP)は、一定の指導尺度の仮定によって制限されていることを示す。
我々は、ほぼ最適時間とガイダンスの状態依存変調に依存する、Dynamic Negative Guidanceと呼ばれる原則的手法を導出する。
以上の結果から,DNGを安定拡散法を用いてNPよりも正確で侵襲的なガイダンスを得ることが可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:02:21 GMT)
LayerSkip: Enabling Early Exit Inference and Self-Speculative Decoding [13.7] 大規模言語モデル(LLM)の高速化のためのエンドツーエンドのソリューションを提案する。
また,すべての変圧器層が同じ出口を共有できる早期の出口損失を,早期の層で低落率,後期の層で高落率,早期の出口損失に適用した。
このトレーニングレシピは、モデルに補助的なレイヤやモジュールを追加することなく、初期のレイヤでの早期退避の精度を高めることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:02:31 GMT)
Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model [13.4] 本稿では,単一のCF画像から動的FFAビデオを生成するGANモデルであるFundus2Videoを紹介する。
FVDは1497.12、PSNRは11.77である。
これらの結果から,Fundus2VideoはFFA検査の強力な非侵襲的代替品であり,多彩な網膜生成基盤モデルであると考えられた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:41:44 GMT)
Experimenting on Markov Decision Processes with Local Treatments [13.2] マルコフ決定過程(MDP)をモデル化した力学系におけるランダム化実験について検討する。
我々のゴールは、比較的短期的な観察による長期累積報酬に対する治療・制御政策の影響を評価することである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:19:30 GMT)
CSKV: Training-Efficient Channel Shrinking for KV Cache in Long-Context Scenarios [13.1] KVキャッシュ圧縮のための訓練効率の高いチャネルシンキング技術であるCSKVを紹介する。
CSKVは、モデル長文機能を維持しながら、KVキャッシュのメモリオーバーヘッドを80%削減できることを示す。
我々の手法は量子化とシームレスに組み合わせることでメモリオーバーヘッドをさらに低減し、最大95%の圧縮比を達成することができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:30:35 GMT)
Developer Reactions to Protestware in Open Source Software: The cases of color.js and es5.ext [13.0] そこで我々は,2つの有名な抗議ウェア,すなわち color.js と es5-ext について検討した。
デモウェアの議論の分類を確立させることで、スタンスを表現し、技術的な緩和指示を提供するポストを特定できる。
この研究は、研究者と開発者の両方に洞察を与えながら、抗議ウェアの議論の微妙な風景に光を当てている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:52:15 GMT)
A Cross Attention Approach to Diagnostic Explainability using Clinical Practice Guidelines for Depression [13.0] そこで我々は,一般的なトランスフォーマーモデルにおける注目度を高め,臨床医が理解可能な分類説明を生成する手法を開発した。
臨床医が患者と対話する際の専門知識をどのように頼っているかに触発され、関連する臨床知識を活用して患者の入力をモデル化する。
うつ病の診断に臨床実習ガイドライン(CPG)を用いてメンタルヘルス(MH)の文脈でこのようなシステムを開発する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:21:49 GMT)
PARIKSHA: A Large-Scale Investigation of Human-LLM Evaluator Agreement on Multilingual and Multi-Cultural Data [12.9] 我々は,90Kの人的評価と30KのLLMに基づく評価を行うことで,10言語にわたる30のモデルを評価した。
GPT-4o や Llama-3 70B のようなモデルは、ほとんどの Indic 言語で一貫して最適である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:51:55 GMT)
Neural Combinatorial Clustered Bandits for Recommendation Systems [12.8] 深層ニューラルネットワークを用いて未知の報酬関数を推定する。
従来のニューラルネットワークとは違って、NeUClustはニューラルネットワークを使用してスーパーアームの報酬を推定し、スーパーアームを選択する。
Neuclustは、他の文脈行列やニューラルバンディットアルゴリズムよりも後悔と報奨を達成している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:37:28 GMT)
Are High-Degree Representations Really Unnecessary in Equivariant Graph Neural Networks? [12.8] E(3)対称性を取り入れた等価グラフニューラルネットワーク(GNN)は、様々な科学的応用において大きな成功を収めている。
本稿では、$k$-fold回転や正則多面体を含む対称構造上の同変GNNの表現性について検討する。
我々は,高次ステアブルベクトルを組み込んだEGNNの高次バージョンであるHEGNNを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:09:00 GMT)
Unlabeled Action Quality Assessment Based on Multi-dimensional Adaptive Constrained Dynamic Time Warping [12.6] 本稿では,動作品質評価のためのMED-ACDTW法を提案する。
提案手法では2次元および3次元の空間次元と複数の人体特徴を用いてテンプレートとテストビデオの特徴を比較する。
適応的制約スキームは、行動品質評価の判別可能性を約30%向上させる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:00:26 GMT)
Leveraging Large Language Models for Enhancing Public Transit Services [12.6] 本稿では,公共交通機関におけるLarge Language Models (LLM) の利用について検討する。
Tweet Writer, Trip Advisor, Policy Navigatorの3つのトランジットLDMアプリケーションが提供されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:33:47 GMT)
A Lightweight Multi Aspect Controlled Text Generation Solution For Large Language Models [12.6] 大規模言語モデル(LLM)は、命令のチューニングで顕著な能力を示す。
目標タスクの高品質なチューニングデータがない場合には、理想的なタスクを達成できない。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:32:00 GMT)
LEAD: Latent Realignment for Human Motion Diffusion [12.4] 私たちのゴールは、自然言語から現実的な人間の動きを作り出すことです。
動作合成では,HumanML3DおよびKIT-ML上でLEADを評価し,現実主義,多様性,テキストモーションの整合性の観点から,最先端技術に匹敵する性能を示す。
動作テキストの逆変換では,従来のVAEと比較して分布外特性を捕捉する能力が改善された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:43:05 GMT)
Discrete Messages Improve Communication Efficiency among Isolated Intelligent Agents [12.0] 本研究では,コミュニケーション媒体としての言語の有効性を検討することを目的とする。
エージェントが異なるデータに晒されるシナリオでは、個別のトークンからなる文を通して通信することで、エージェント間通信の効率が最高のものになる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:22:19 GMT)
Identifiability of Sparse Causal Effects using Instrumental Variables [12.0] 本稿では,共変量$X$の応答に対する因果効果が疎い線形モデルを考える。
観測された分布から因果係数が同定可能な条件を提供する。
推定器として、空間IVを提案し、モデルが同定可能であれば因果効果を常に推定することを証明する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:15:56 GMT)
Medical AI for Early Detection of Lung Cancer: A Survey [11.9] 肺がんは世界中で致死率と死亡率の主要な原因の1つである。
コンピュータ支援診断システム(CAD)は肺結節の検出と分類に有効であることが証明されている。
深層学習アルゴリズムは肺結節解析の精度と効率を大幅に改善した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:45:42 GMT)
Real-time Fake News from Adversarial Feedback [11.7] ファクトチェックWebサイトのクレームなど,従来の情報源に基づく偽ニュース検出の評価は,LCMベースの検出器の時間経過とともに精度が向上することを示す。
このことは、こうした情報源で偽ニュースの大半を形成する一般的な政治的主張が、表面的な浅層パターンによって容易に分類されることを示唆している。
我々は、RAGベースの検出器からの自然言語フィードバックを利用して、リアルタイムニュースをフェイクニュースに反復的に修正する新しいパイプラインを開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:47:11 GMT)
CoMAL: Collaborative Multi-Agent Large Language Models for Mixed-Autonomy Traffic [11.7] CoMALは、交通の流れを最適化するために、自動運転車間のコラボレーションによって、混在する自律交通問題に対処するために設計されたフレームワークである。
CoMALは大きな言語モデル上に構築されており、対話的な交通シミュレーション環境で動作する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:53:44 GMT)
SIMformer: Single-Layer Vanilla Transformer Can Learn Free-Space Trajectory Similarity [11.4] 本稿では,単一層ベニラ変換器エンコーダのみを特徴抽出器として使用する,シンプルで正確かつ高速でスケーラブルなモデルを提案する。
我々のモデルは、次元問題の呪いを著しく軽減し、有効性、効率性、スケーラビリティにおいて最先端の技術を上回ります。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:30:17 GMT)
SeerAttention: Learning Intrinsic Sparse Attention in Your LLMs [11.3] 本研究では,従来の注意を学習可能なゲートで強化する新しい注意機構を開発し,注意マップ内の重要なブロックを適応的に選択し,残りのブロックがスパースであると推定する。
SeerAttentionは32k長の顕著な90%のパリシティ比を達成でき、FlashAttention-2の5.67倍のスピードアップを提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:01:11 GMT)
3-D Magnetotelluric Deep Learning Inversion Guided by Pseudo-Physical Information [11.3] 近年,ジョイントデータ駆動と物理駆動を併用したDLインバージョン法が注目されている。
本稿では、ニューラルネットワーク(NN)の前方モデリングを通して擬似物理情報を導入し、損失のこの部分を計算する。
本研究では,3次元MTインバージョンにおけるフィールドデータ環境をシミュレートし,マスキングとノイズ付加を含む新しい入力モードを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:23:18 GMT)
3-D Magnetotelluric Deep Learning Inversion Guided by Pseudo-Physical Information [11.3] 近年,ジョイントデータ駆動と物理駆動を併用したDLインバージョン法が注目されている。
本稿では、ニューラルネットワーク(NN)の前方モデリングを通して擬似物理情報を導入し、損失のこの部分を計算する。
本研究では,3次元MTインバージョンにおけるフィールドデータ環境をシミュレートし,マスキングとノイズ付加を含む新しい入力モードを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:23:18 GMT)
Inverse Reinforcement Learning from Non-Stationary Learning Agents [11.2] 本研究では,このエージェントが最適方針を学習している間に収集した軌跡データを用いて学習エージェントの報酬関数を学習する逆強化学習問題について検討する。
本稿では,学習者の政策パラメータを推定し,その報酬関数を推定する逆強化学習法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:02:44 GMT)
CPT: Competence-progressive Training Strategy for Few-shot Node Classification [11.2] グラフニューラルネットワーク(GNN)はノード分類に大きな進歩を遂げているが、その成功はトレーニングデータ内のクラス毎の十分なラベル付きノードに依存している。
伝統的なエピソディックなメタラーニングアプローチはこの領域で有望であるが、固有の制限に直面している。
メタラーナーのプログレッシブ・コンピテンスにタスクの難易度を合わせる2段階のカリキュラム学習手法であるCPTを紹介する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:45:18 GMT)
HiCo: Hierarchical Controllable Diffusion Model for Layout-to-image Generation [11.1] レイアウト・画像生成のためのtextbfHierarchical textbfControllable (HiCo) 拡散モデルを提案する。
我々の重要な洞察は、レイアウトの階層的モデリングを通じて空間的ゆがみを実現することである。
自然シーンにおける多目的制御可能なレイアウト生成の性能を評価するため,HiCo-7Kベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:36:10 GMT)
LED: Light Enhanced Depth Estimation at Night [10.9] 低照度環境における深度推定を大幅に改善する新しいコスト効率のアプローチであるLED(Light Enhanced Depth)を導入する。
LEDは、現代の車両で利用できる高解像度ヘッドライトによって投影されるパターンを利用する。
49,990の注釈付き画像からなるNighttime Synthetic Driveデータセットをリリースする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:22:11 GMT)
WaterMax: breaking the LLM watermark detectability-robustness-quality trade-off [10.9] ウォーターマーキング(英: Watermarking)は、大規模言語モデルの誤用を解消する技術的手段である。
本稿では,生成したテキストの品質を維持しつつ,高い検出性を享受する新しい透かし方式であるWaterMaxを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:05:57 GMT)
Unlearning Backdoor Attacks for LLMs with Weak-to-Strong Knowledge Distillation [10.9] W2SDefenseは、バックドア攻撃から防御する弱い学習アルゴリズムである。
我々は3つの最先端言語モデルと3つの異なるバックドア攻撃アルゴリズムを含むテキスト分類タスクについて実験を行った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:39:32 GMT)
Enhancing Large Language Models' Situated Faithfulness to External Contexts [10.7] 大きな言語モデル(LLM)は、しばしば外部情報をコンテキストとして拡張される。
正しいコンテキストと間違ったコンテキストの両方を提供する場合、オープンソースモデルとプロプライエタリモデルの両方が、外部情報に過度に依存する傾向にあることを示す。
自己ガイド型信頼推論(SCR)とルールベース信頼推論(RCR)の2つのアプローチを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:59:47 GMT)
Multi-Task Dynamic Pricing in Credit Market with Contextual Information [10.4] 我々は、信用市場において多数の金融証券を購入し販売するブローカーが直面する動的価格問題について検討する。
これらの証券の価格設定の課題の1つは、頻度の低い取引であり、個別の価格設定に不十分なデータをもたらす。
本稿では、これらの共有構造を証券間で活用し、学習による価格の精度を高めるマルチタスク動的価格設定フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:37:36 GMT)
GLANCE: Global Actions in a Nutshell for Counterfactual Explainability [10.3] 2つのアルゴリズムからなる多目的かつ適応的なフレームワークであるGLANCEを紹介する。
C-GLANCEは、特徴空間と反現実的アクションの空間の両方を考慮するクラスタリングアプローチを採用している。
T-GLANCEは柔軟性を高めるための追加機能を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:05:18 GMT)
Analyzing Context Utilization of LLMs in Document-Level Translation [10.2] 大規模言語モデル(LLM)は機械翻訳においてますます強力な競争相手となっている。
文章の外部からの文脈なしには、いくつかの単語を翻訳できない文書レベルの翻訳について研究する。
LLMの改良された文書翻訳性能は代名詞翻訳性能に必ずしも反映されないことがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:52:10 GMT)
Node Identifiers: Compact, Discrete Representations for Efficient Graph Learning [10.0] 本稿では、高コンパクト(典型的には6-15次元)、離散(int4型)、解釈可能なノード表現を生成する新しいエンドツーエンドフレームワークを提案する。
ベクトル量子化を用いることで、グラフニューラルネットワーク(GNN)の複数層からの連続ノード埋め込みを離散コードに圧縮する。
これらのノードIDはグラフデータの高レベルな抽象化をキャプチャし、従来のGNN埋め込みに欠けている解釈性を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:56:10 GMT)
Unveiling Large Language Models Generated Texts: A Multi-Level Fine-Grained Detection Framework [10.0] 大型言語モデル (LLM) は文法の修正、内容の拡張、文体の改良によって人間の書き方を変えてきた。
既存の検出方法は、主に単一機能分析とバイナリ分類に依存しているが、学術的文脈においてLLM生成テキストを効果的に識別することができないことが多い。
低レベル構造, 高レベル意味, 深層言語的特徴を統合することで, LLM生成テキストを検出する多レベルきめ細粒度検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:25:00 GMT)
Learning to Control the Smoothness of Graph Convolutional Network Features [9.9] 本稿では,グラフ畳み込みネットワーク(GCN)が所望の滑らかさでノード特徴を学習するための新しい戦略を提案する。
我々はReLUの入力と出力の幾何学的関係を確立する。
幾何学的洞察に基づいて、我々はグラフ畳み込み層のメッセージパッシングプロセスを学習可能な用語で拡張し、ノードの特徴の滑らかさを調節する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:57:27 GMT)
MedReadMe: A Systematic Study for Fine-grained Sentence Readability in Medical Domain [9.9] 我々は、手動で注釈付けされた可読性評価と4,520文の詳細な複合スパンアノテーションからなる新しいデータセットMedReadMeを導入する。
これは650の言語的特徴と、自動的な複雑な単語とジャーゴン識別を網羅する定量的分析をサポートする。
既存の可読性式に1つの特徴を加えることで、人間の判断との相関を著しく改善できることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:33:22 GMT)
Koopman Learning with Episodic Memory [9.8] 我々は,非自律時間列予測のために開発されたクープマン法をエピソードメモリ機構で装備する。
エピソードメモリを用いたクープマン学習の基本的な実装は,合成および実世界のデータの予測において,大幅な改善をもたらすことが判明した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:18:47 GMT)
Show and Guide: Instructional-Plan Grounded Vision and Language Model [9.8] MM-PlanLLMは,最初のマルチモーダル計画追従言語モデルである。
会話ビデオモーメント検索と視覚インフォームドステップ生成という,2つの重要なタスクを通じて,クロスモダリティを実現する。
MM-PlanLLMは、新しいマルチタスク・マルチステージアプローチを用いて訓練される。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:27:44 GMT)
Show and Guide: Instructional-Plan Grounded Vision and Language Model [9.8] MM-PlanLLMは,最初のマルチモーダル計画追従言語モデルである。
会話ビデオモーメント検索と視覚インフォームドステップ生成という,2つの重要なタスクを通じて,クロスモダリティを実現する。
MM-PlanLLMは、新しいマルチタスク・マルチステージアプローチを用いて訓練される。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:27:44 GMT)
Show and Guide: Instructional-Plan Grounded Vision and Language Model [9.8] MM-PlanLLMは,最初のマルチモーダル計画追従言語モデルである。
会話ビデオモーメント検索と視覚インフォームドステップ生成という,2つの重要なタスクを通じて,クロスモダリティを実現する。
MM-PlanLLMは、新しいマルチタスク・マルチステージアプローチを用いて訓練される。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:27:44 GMT)
Transfer Reinforcement Learning in Heterogeneous Action Spaces using Subgoal Mapping [9.8] 本稿では,専門家エージェントポリシーと学習者エージェントポリシーのサブゴールマッピングを学習する手法を提案する。
タスクの分散のために,Long Short Term Memory (LSTM) ネットワークをトレーニングすることで,このサブゴールマッピングを学習する。
提案手法は,与えられたタスクの分布に基づくサブゴールマッピングを効果的に発見できることを実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:08:41 GMT)
Dynamic Data-Driven Digital Twin Testbed for Enhanced First Responder Training and Communication [9.7] この研究は、公共安全技術に適したデジタルツインテストベッドの開発に焦点を当てている。
デジタル世界では、シミュレートされた無線通信が組み込まれている。
仮想世界は、ファーストレスポンダのトレーニングにも役立ちます。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:23:31 GMT)
Inferring Change Points in High-Dimensional Regression via Approximate Message Passing [9.7] 信号と変化点位置の両方を推定するための近似メッセージパッシング(AMP)アルゴリズムを提案する。
パラメータ数$p$がサンプル数$n$に比例する高次元極限において、その性能を厳格に特徴づける。
高次元極限における変化点上のベイズ後部分布を効率よく計算するために,我々のAMPイテレートをどのように利用できるかを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:23:26 GMT)
Improving Vision Transformers by Overlapping Heads in Multi-Head Self-Attention [9.4] MHSA(Multi-Head Self-Attention)は、アテンション機構を独立して適用することにより、各ヘッドが異なる表現を学習できるようにする。
マルチオーバーラップ型自己認識(MOHSA)を導入し、クエリー、キー、値の2つの頭と頭が重なり合うようにする。
提案手法の最適性能を十分に検討するために,重なり合う比の様々なパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:41:55 GMT)
Fact Recall, Heuristics or Pure Guesswork? Precise Interpretations of Language Models for Fact Completion [9.4] 本研究では,LMが異なる振る舞いを示すことを期待できる4つの異なる予測シナリオについて検討する。
本稿では,各シナリオを例に,データセット構築のためのPrISMというモデル固有のレシピを提案する。
それぞれのシナリオに対してCTは異なる結果を生成するが、混合例の集合上の集約は、最強の計測信号によるシナリオの結果のみを表すことができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:08:07 GMT)
The Propensity for Density in Feed-forward Models [9.4] 本研究は, 幅を変えながら, 完全連結, 畳み込み, 残差モデルの効果について検討する。
性能を劣化させることなく刈り取ることができる重量の割合はモデルサイズに大きく変化しないことがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:40:44 GMT)
A Hybrid Defense Strategy for Boosting Adversarial Robustness in Vision-Language Models [9.3] 本稿では,複数の攻撃戦略と高度な機械学習技術を統合した,新たな敵訓練フレームワークを提案する。
CIFAR-10 や CIFAR-100 などの実世界のデータセットで行った実験により,提案手法がモデルロバスト性を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:47:46 GMT)
Kernel Density Estimators in Large Dimensions [9.3] カーネルによる密度$hatrho_hmathcal D(x)=frac1n hdsum_i=1n Kleft(fracx-y_ihright)$の推定は帯域幅$h$に依存する。
本稿では,Kullback-Leibler分散に基づく帯域幅の最適しきい値が,本論文で同定された新しい統計体系に含まれることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:19:04 GMT)
Investigating the Capabilities of Deep Learning for Processing and Interpreting One-Shot Multi-offset GPR Data: A Numerical Case Study for Lunar and Martian Environments [9.2] 地中レーダー(GPR)は、過去10年間に惑星科学で人気を博してきた、成熟した物理手法である。
GPRはルナーと火星のミッションの両方に使われ、地球外惑星の表面地質に関する重要な情報を提供している。
本稿では,GPRデータの解釈・処理におけるディープラーニングの可能性について検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:38:29 GMT)
Rethinking Transformer for Long Contextual Histopathology Whole Slide Image Analysis [9.1] ヒストホイルスライド画像(英語版)(WSI)解析は、医師の日常業務における臨床がん診断のゴールドスタンダードとなっている。
従来の手法では、スライドレベルラベルのみを与えられたスライドレベルの予測を可能にするために、マルチパスラーニングが一般的であった。
大規模なWSIにおける長いシーケンスの計算複雑性を軽減するため、HIPTではリージョンスライシング、TransMILでは完全な自己アテンションの近似を採用している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:12:36 GMT)
Do LLMs estimate uncertainty well in instruction-following? [9.1] 大規模言語モデル(LLM)は、ユーザ指示に従うことができるため、さまざまなドメインにわたるパーソナルAIエージェントとして価値のあるものになり得る。
命令追従の文脈におけるLCMの不確実性推定能力の最初の体系的評価について述べる。
以上の結果から,既存の不確実性手法は,特にモデルが後続の命令で微妙な誤りを犯した場合に困難であることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:32:10 GMT)
On the convergence of dynamic implementations of Hamiltonian Monte Carlo and No U-Turn Samplers [9.0] 我々は、動的MCと呼ばれるMCMCアルゴリズムの一般クラスを考える。
この一般的なフレームワークは、特定のケースとしてNUTSを包含していることを示す。
HMCに類似した条件下では、NUTSは幾何学的にエルゴード的であることも示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:19:33 GMT)
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation [9.0] MIRAGE --Model Internals-based RAG Explanations -- このモデル内部を用いたプラグアンドプレイアプローチは、質問応答アプリケーションにおける忠実な回答属性である。
提案手法を多言語QAデータセット上で評価し,人間の回答属性と高い一致性を見いだした。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:16:57 GMT)
SGD and Weight Decay Secretly Minimize the Rank of Your Neural Network [8.8] ミニバッチSGDとウェイト崩壊によるトレーニングは、ウェイト行列のランク最小化へのバイアスを引き起こす。
このバイアスは、より小さなバッチサイズ、より高い学習率、より強いウェイト崩壊によってより顕著になる。
このバイアスと一般化の関係を実証的に検討し、テスト性能に限界効果があることを見出した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:32:39 GMT)
Benchmarking Deep Reinforcement Learning for Navigation in Denied Sensor Environments [8.8] センサデニアル効果を有するナビゲーションタスクにおいて、よく使われるDRLアルゴリズムと新興DRLアルゴリズムのベンチマークを示す。
本研究では,DreamerV3が視覚的エンド・ツー・エンドナビゲーションタスクにおいて,動的ゴールで他の手法よりも優れていることを示す。
頑健性を向上させるために,敵の訓練を用い,否定された環境における性能向上を実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:14:28 GMT)
Distributionally and Adversarially Robust Logistic Regression via Intersecting Wasserstein Balls [8.7] 逆堅牢最適化(Adversarially robust optimization, ARO)は、テスト中に敵の攻撃に対して防御する訓練モデルのデファクトスタンダードとなっている。
その頑丈さにもかかわらず、これらのモデルはしばしば過度なオーバーフィットに悩まされる。
学習における経験的分布を, (i) あいまいさ集合内の最悪のケース分布, (ii) 補助的データセットから派生した経験的分布の混合に置き換える2つの方法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:43:28 GMT)
ViLCo-Bench: VIdeo Language COntinual learning Benchmark [8.7] ビデオテキストタスクの連続学習モデルを評価するために設計されたViLCo-Benchを提案する。
データセットは10分間のビデオと、公開されているデータセットから収集された対応する言語クエリで構成されている。
本稿では,自己教師付き学習を取り入れ,長期記憶効果と短期記憶効果を模倣する新しい記憶効率フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:20:34 GMT)
Shape Transformation Driven by Active Contour for Class-Imbalanced Semi-Supervised Medical Image Segmentation [8.6] 我々は,より小さな臓器を拡大し,異なる臓器にまたがる不均衡なクラス分布を緩和する,能動輪郭(STAC)によって駆動される形状変換を開発する。
活性輪郭法における曲線進化理論にインスパイアされたSTACは、レベルセット関数として符号付き距離関数(SDF)を用い、SDFの最急降下方向のボクセルを変形する。
2つのベンチマークデータセットによる実験結果から,提案手法は最先端の手法よりも著しく優れていることが示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:52:51 GMT)
Simultaneously Solving FBSDEs with Neural Operators of Logarithmic Depth, Constant Width, and Sub-Linear Rank [8.5] フォワード・バックワード微分方程式(FBSDEs)は、最適制御、ゲーム理論、経済学、数学ファイナンスの中心である。
Small'' NOs は FBSDEs の構造された族に対する解演算子を均一に近似できることを示す。
また、同様の深さ、幅、ランクの畳み込みNOは、解作用素を楕円型PDEの広いクラスに近似することができることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:01:40 GMT)
Boosting Graph Pooling with Persistent Homology [8.5] GNN層にPH機能を鼻で接続すると、解釈可能性の低い限界改善が得られる。
本研究では,PHの濾過操作が自然にグラフプーリングを切断的に整列させるという観察に動機づけられた,グローバルなトポロジ的不変性を PH を用いてプール層に注入する新しいメカニズムについて検討する。
実験では,この機構をグラフプーリング手法の集合に適用し,複数の一般的なデータセットに対して一貫した,実質的な性能向上を観察する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:09:14 GMT)
Almost-Linear RNNs Yield Highly Interpretable Symbolic Codes in Dynamical Systems Reconstruction [8.5] 本稿では,時系列データから動的システム(DS)のPWL表現を自動的かつ堅牢に生成する,ニアリカレントニューラルネットワーク(AL-RNN)を提案する。
AL-RNNは、動的システム再構成(DSR)のための任意のSOTAアルゴリズムで効率的に訓練できる
我々は,ロレンツとR"オスラー系に対して,AL-RNNが純粋にデータ駆動方式で,対応するカオスアトラクションの位相的に最小のPWL表現を発見することを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:44:12 GMT)
On the Sparsity of the Strong Lottery Ticket Hypothesis [8.5] 最近の研究で、任意のニューラルネットワークを正確に近似できるランダムニューラルネットワークの$N$ containsworksが示されている。
古典的セッティングにおけるStrong Lottery Ticket仮説の最初の証明を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:57:37 GMT)
FedSpaLLM: Federated Pruning of Large Language Models [8.5] 大規模言語モデル(LLM)は最先端のパフォーマンスを実現するが、高い計算量とストレージ要求のためデプロイは困難である。
我々は,LLMの刈り取り専用に設計された最初のフェデレーション学習フレームワークであるFedSpaLLMを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:33:12 GMT)
Multi-modal Pose Diffuser: A Multimodal Generative Conditional Pose Prior [8.3] MOPEDは、SMPLポーズパラメータの先行として、新しいマルチモーダル条件拡散モデルを利用する最初の方法である。
本手法は,画像やテキストなどのマルチモーダル入力の条件付けが可能な,強力な非条件ポーズ生成を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:29:19 GMT)
Automated Genre-Aware Article Scoring and Feedback Using Large Language Models [8.1] 本稿では,高度知的物品スコアリングシステムの開発に焦点をあてる。
著作物の全体的な品質を評価し、様々なジャンルに合わせた詳細な特徴ベースのスコアを提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:13:51 GMT)
Design and Prototype of a Unified Framework for Error-robust Compression and Encryption in IoT [8.1] IoT(Internet of Things)は、データ取得にリソース制約のあるデバイスに依存している。
データ圧縮と機密性はしばしばこれらの装置のエネルギー効率を欠いている。
我々は,圧縮,秘密保持,エラー回復を組み合わせたEMCRUST方式を開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:00:06 GMT)
GenEOL: Harnessing the Generative Power of LLMs for Training-Free Sentence Embeddings [8.0] トレーニング不要な埋め込み手法は、事前訓練された大規模言語モデル(LLM)を直接利用してテキストを埋め込む。
そこで本研究では,LLMを用いて意味を保った文の多種多様な変換を生成する手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:36:53 GMT)
Locate-then-edit for Multi-hop Factual Recall under Knowledge Editing [8.0] location-then-edit パラダイムは知識編集において大きな可能性を秘めている。
従来手法では,知識を新たに編集したマルチホップのファクトリコール作業に苦慮していた。
浅層層と深層層層の両方を編集する新しい位置編集手法 IFMET を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:53:46 GMT)
Locate-then-edit for Multi-hop Factual Recall under Knowledge Editing [8.0] location-then-edit パラダイムは知識編集において大きな可能性を秘めている。
従来手法では,知識を新たに編集したマルチホップのファクトリコール作業に苦慮していた。
浅層層と深層層層の両方を編集する新しい位置編集手法 IFMET を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:53:46 GMT)
Less is More: Selective Reduction of CT Data for Self-Supervised Pre-Training of Deep Learning Models with Contrastive Learning Improves Downstream Classification Performance [7.9] 現在の知見は、医用画像における対照的な事前トレーニングの可能性を示している。
医用画像の類似性は、医用画像領域における対照的な学習の成功を妨げていると仮定する。
医療用事前学習データセットの冗長性を同定・低減するために, 深層埋め込み, 情報理論, ハッシュに基づく様々な戦略を検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:08:05 GMT)
Do LLMs "know" internally when they follow instructions? [7.9] この次元に沿った表現の修正は、ランダムな変化に比べて、命令追従の成功率を改善することを示す。
また、この次元は、タスクや命令の固有の困難さよりも、プロンプトの表現に密接に関連していることも判明した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:55:14 GMT)
Step Guided Reasoning: Improving Mathematical Reasoning using Guidance Generation and Step Reasoning [7.7] ステップバイステップのChain-of-Thought(CoT)推論は、大規模言語モデル(LLM)の数学的能力を向上させる。
モデル微調整を伴わないステップ誘導推論法を提案する。
AMC23データセットの精度は30%から57.5%に向上し,91.7%に向上し,MATHデータセットのレベル5問題では55.8%に向上し,43%から67%に向上した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:38:24 GMT)
Reinforcement Learning with Lookahead Information [7.7] エージェントが報酬や移行の実現を現在の状態で観察し、どの行動をとるかを決定するという強化学習問題について検討する。
これまでの研究は、このルックアヘッド情報が収集された報酬を大幅に増加させることを示している。
我々は、ルックアヘッド情報を組み込むことができる確率効率の高い学習アルゴリズムを設計する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:42:37 GMT)
Theories of synaptic memory consolidation and intelligent plasticity for continual learning [7.6] シナプスの可塑性機構は 内部状態を維持し 進化させなければならない
可塑性アルゴリズムは 内部の状態を利用して 個々のシナプスで 可塑性をインテリジェントに制御する必要がある
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:15:42 GMT)
IncEventGS: Pose-Free Gaussian Splatting from a Single Event Camera [7.5] IncEventGSは、単一のイベントカメラを備えたインクリメンタルな3Dガウススプレイティング再構成アルゴリズムである。
我々は,IncEventGSにおける従来のSLAMパイプラインの追跡とマッピングのパラダイムを活用する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:26:30 GMT)
IncEventGS: Pose-Free Gaussian Splatting from a Single Event Camera [7.5] IncEventGSは、単一のイベントカメラを備えたインクリメンタルな3Dガウススプレイティング再構成アルゴリズムである。
我々は,IncEventGSにおける従来のSLAMパイプラインの追跡とマッピングのパラダイムを活用する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:26:30 GMT)
CountCrypt: Quantum Cryptography between QCMA and PP [7.4] 我々は、BQP = QCMAであるが量子計算古典通信鍵交換、QCCCコミットメント、および2ラウンドの量子鍵分布が存在する量子オラクルを構築する。
また、QCCC鍵交換、QCCCコミットメント、および2ラウンドの量子鍵分布が、すべて片道パズルの構築に利用できることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:04:27 GMT)
TotalVibeSegmentator: Full Body MRI Segmentation for the NAKO and UK Biobank [7.4] 本稿では, 容積補間呼吸保持検査(VIBE)画像に基づいて, 大規模な疫学データセットのためのトルソセグメンテーションネットワークを提案する。
NAKO(85名)とUK Biobank(16名)のサブセットを用いて, ホールドアウトセット(12名)におけるDice-scoreの評価を行った。
腹部のDiceスコアは0.90点,膵は0.70点であった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:18:36 GMT)
What's under the hood: Investigating Automatic Metrics on Meeting Summarization [7.2] 会議要約は、オンライン交流の増加を考慮した重要な課題となっている。
現在のデフォルトのメトリクスは、観測可能なエラーをキャプチャするのに苦労しており、相関が弱い。
特定のエラーに正確に反応するのはサブセットのみであり、ほとんどの相関関係は、エラーが要約品質に与える影響を反映していないか、あるいは失敗していることを示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:34:41 GMT)
MCSFF: Multi-modal Consistency and Specificity Fusion Framework for Entity Alignment [7.1] 知識グラフの強化と質問応答システムの改善には,MMEA(Multi-modal entity alignment)が不可欠である。
既存の方法は、しばしばそれらの相補性を通じてモダリティを統合することにフォーカスするが、各モダリティの特異性を見落としている。
本稿では,モダリティの相補性と特異性の両方を革新的に統合するマルチモーダル一貫性・特異性融合フレームワーク(MCSFF)を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:35:25 GMT)
Fast proxy centers for Jeffreys centroids: The Jeffreys-Fisher-Rao and the inductive Gauss-Bregman centers [7.1] ジェフリーズ・セントロイド(英: Jeffreys centroid)は、測度空間上の互いに絶対連続な確率分布の集合の中心性である。
ジェフリーズ・セントロイドは圏分布や正規分布の集合に対して閉形式では利用できない。
本稿では,新しいジェフリーズ・フィッシャー・ラオ中心とガウス算術幾何学的二重列平均の原理を一般化した新しい帰納的中心を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:37:38 GMT)
DiscoGraMS: Enhancing Movie Screen-Play Summarization using Movie Character-Aware Discourse Graph [7.0] 映画脚本を映画キャラクタ対応の談話グラフ(CaD Graph)として表現する新しいリソースであるDiscoGraMSを紹介する。
このモデルは、スクリーンプレイの内容をより包括的で忠実に表現することで、すべての健全な情報を保存することを目的としている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:56:11 GMT)
Automated Road Extraction from Satellite Imagery Integrating Dense Depthwise Dilated Separable Spatial Pyramid Pooling with DeepLabV3+ [6.9] 道路抽出はリモートセンシングアプリケーションのサブドメインである。
DeepLabシリーズはセマンティックセグメンテーションの習熟度で知られており、道路の様々な性質に起因するこれらの課題に対処している。
本研究では, DenseDDSSPPと適切に選択されたバックボーンネットワークとSqueeze-and-Excitationブロックを組み合わせることで, 効率的な高密度特徴写像が生成されることを仮定する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:14:07 GMT)
Decomposing The Dark Matter of Sparse Autoencoders [6.9] この研究は、ダークマターを研究対象として研究する。
誤差ベクトルの約半分であるSAE暗黒物質の多くは、初期活性化ベクトルから線形に予測できる。
また,トークン単位のSAEエラーノルムのスケーリング挙動が著しく予測可能であることも確認した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:58:53 GMT)
SensorBench: Benchmarking LLMs in Coding-Based Sensor Processing [6.8] 大規模言語モデル(LLM)は、知覚データを処理する上で有望な能力を持ち、センサーシステムを開発するための副操縦士としての可能性を示している。
我々は,定量化のための総合的なベンチマークであるSensorBenchを構築した。
以上の結果から,LLMは単純なタスクでかなりの習熟度を示す一方で,構成タスクの処理において固有の課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:29:49 GMT)
SensorBench: Benchmarking LLMs in Coding-Based Sensor Processing [6.8] 大規模言語モデル(LLM)は、知覚データを処理する上で有望な能力を持ち、センサーシステムを開発するための副操縦士としての可能性を示している。
我々は,定量化のための総合的なベンチマークであるSensorBenchを構築した。
以上の結果から,LLMは単純なタスクでかなりの習熟度を示す一方で,構成タスクの処理において固有の課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:29:49 GMT)
Optimizing Attention with Mirror Descent: Generalized Max-Margin Token Selection [6.8] アルゴリズムは、$ell_p$-normの目的を持つハードマージンSVMに収束することを示す。
具体的には、これらのアルゴリズムは、$ell_p$-normの目的を持つ一般化されたハードマージンSVMに収束することを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:32:06 GMT)
CaTs and DAGs: Integrating Directed Acyclic Graphs with Transformers and Fully-Connected Neural Networks for Causally Constrained Predictions [6.7] CFCN(Causal Fully-Connected Neural Networks)とCaT(Causal Transformers)を紹介する。
CFCNsとCaTsは、DAG(Directed Acyclic Graph)によって規定された、予め定義された因果制約の下で動作する
これらのモデルは、基盤となる構造的制約に固執しながら、従来のニューラルネットワークの強力な関数近似能力を保持します。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:10:16 GMT)
Nearly query-optimal classical shadow estimation of unitary channels [6.7] 古典的影推定は、量子状態と量子過程の物性を学習するための強力なツールである。
量子実験において未知のユニタリチャネルをクエリすることで、$mathcalU$の古典的な記述を学ぶことがゴールである。
我々のプロトコルは、アウト・オブ・タイム・オーダの相関子のような多くの非線形特性を同時に予測するためにも適用できる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:25:40 GMT)
MCQG-SRefine: Multiple Choice Question Generation and Evaluation with Iterative Self-Critique, Correction, and Comparison Feedback [6.7] 医療事例を高品質なUSMLEスタイルの質問に変換する枠組みを提案する。
MCQG-SRefineは、専門家主導のプロンプトエンジニアリングと反復的な自己批判と自己補正フィードバックを統合している。
複雑でコストのかかる専門家評価プロセスを置き換えるため, LLM-as-Judge を用いた自動計測手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:42:01 GMT)
Predicting time-varying flux and balance in metabolic systems using structured neural-ODE processes [6.7] 動的フラックスバランス解析の代替として,新しいデータ駆動型フレームワークを開発した。
提案するフレームワークはエンドツーエンドで、構造化されたニューラルODEプロセスモデルをトレーニングして、フラックスとバランスサンプルを推定する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:41:41 GMT)
A Novel Method to Metigate Demographic and Expert Bias in ICD Coding with Causal Inference [6.5] 因果推論(DECI)によるICD符号化におけるデモグラフィックとエキスパートのバイアスを軽減する新しい手法を提案する。
我々は,3つの異なる経路でモデルが予測するICD符号化において,因果関係に基づく新しい解釈を提供する。また,DECによる反ファクト推論は,人口統計学と専門家の偏見を緩和する。実験結果から,DECが最先端のモデルより優れており,正確で偏りのないICD符号化の大幅な進歩をもたらすことが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:36:57 GMT)
Automatic Classification of Sleep Stages from EEG Signals Using Riemannian Metrics and Transformer Networks [6.4] 睡眠医学において、被験者の睡眠の進化を評価するには、脳波(EEG)信号の高価な手作業によるスコアが伴うことが多い。
本研究では,Symmetric Definite Positive (SPD) の性質を犠牲にすることなく,学習した信号的特徴をそれらの行列に組み込む新しい方法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:49:52 GMT)
Liger Kernel: Efficient Triton Kernels for LLM Training [6.4] 大規模言語モデル(LLM)を大規模に効果的に訓練することは、ますます増大する計算要求によって引き起こされる、恐ろしい挑戦となる。
LLMトレーニング用に開発されたTritonカーネルのオープンソースセットであるLiger- Kernelを紹介する。
カーネル操作の融合や入力チャンキングといったカーネル最適化技術により、カーネルはトレーニングのスループットが平均20%向上し、GPUメモリ使用量が60%削減された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:21:17 GMT)
EasyRec: Simple yet Effective Language Models for Recommendation [6.3] EasyRecは、テキストベースの意味理解を協調的な信号とシームレスに統合する、効果的で使いやすいアプローチである。
EasyRecでは、コントラスト学習と協調的な言語モデルチューニングを組み合わせた、テキストビヘイビアアライメントフレームワークを採用している。
この研究は、プラグイン・アンド・プレイコンポーネントとしてEasyRecをテキスト強化協調フィルタリングフレームワークにシームレスに統合する可能性を強調している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:50:57 GMT)
EasyRec: Simple yet Effective Language Models for Recommendation [6.3] EasyRecは、テキストベースの意味理解を協調的な信号とシームレスに統合する、効果的で使いやすいアプローチである。
EasyRecでは、コントラスト学習と協調的な言語モデルチューニングを組み合わせた、テキストビヘイビアアライメントフレームワークを採用している。
この研究は、プラグイン・アンド・プレイコンポーネントとしてEasyRecをテキスト強化協調フィルタリングフレームワークにシームレスに統合する可能性を強調している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:50:57 GMT)
Algorithmic Challenges in Ensuring Fairness at the Time of Decision [6.2] 社会的文脈におけるアルゴリズムによる意思決定は、帯域幅フィードバックの下で最適化される。
最近の訴訟は、アルゴリズムによる価格設定の慣行を展開している企業を非難している。
凸最適化の文脈において、遠心自由というよく研究された公正性の概念を導入する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:29:47 GMT)
Improving Retrieval in Sponsored Search by Leveraging Query Context Signals [6.2] 本稿では,クエリをリッチなコンテキスト信号で拡張することで,クエリ理解を強化する手法を提案する。
我々は、Web検索のタイトルとスニペットを使って、現実世界の情報にクエリを接地し、GPT-4を使ってクエリの書き直しと説明を生成する。
我々の文脈認識アプローチは文脈自由モデルよりも大幅に優れている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:59:54 GMT)
Streaming Deep Reinforcement Learning Finally Works [6.1] ストリーミング学習は、リソース制限、通信制限、プライバシに敏感なアプリケーションに理想的だ。
深いRLでは、学習者はたいてい、バッチ更新とバッファの再生を使い、計算コストが高く、ストリーミング学習と互換性がない。
本稿では,バッチRLの予測と制御の両面において,ストリームバリアを克服し,サンプル効率にマッチするストリーム-xアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:00:29 GMT)
Comparing Differentiable and Dynamic Ray Tracing: Introducing the Multipath Lifetime Map [6.1] これらの課題に対処するために、微分可能および動的レイトレーシングフレームワークが登場した。
この2つのテクニックの概要と、NVIDIAのUniBoの3DSCATとSionnaの2つの最先端ツールの比較分析について述べる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:23:29 GMT)
ST-MoE-BERT: A Spatial-Temporal Mixture-of-Experts Framework for Long-Term Cross-City Mobility Prediction [6.1] 我々はST-MoE-BERTと呼ばれる人間の移動パターンを予測する頑健な手法を提案する。
本手法は,Mixture-of-ExpertsアーキテクチャとBERTモデルを統合し,複雑な移動力学を捉える。
本稿では,GEO-BLEUおよびDTWにおける提案手法の有効性について述べる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:32:18 GMT)
HR-Bandit: Human-AI Collaborated Linear Recourse Bandit [6.0] 本稿では,探索と利用のバランスをとることで,行動選択と特徴修正の両方を最適化するRecourse Linear UCB(textsfRLinUCB$)アルゴリズムを提案する。
我々はこれをHuman-AI Linear Recourse Bandit(textsfHR-Bandit$)に拡張する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:41:19 GMT)
Critical Questions Generation: Motivation and Challenges [6.0] 本稿では,議論文を処理し,それによる批判的な質問を生成する新しいタスクを提案する。
議論理論において、CQは、欠落している可能性のある情報を指差して、議論の盲点を埋めるように設計されたツールである。
LLMを用いたCQs生成の研究には,大規模な実験のための参照データセットが必要である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:46:38 GMT)
Towards Effective Planning Strategies for Dynamic Opinion Networks [6.0] 介入計画には、キーノードの特定と制御の実行が含まれる。
ネットワークサイズが大きくなると、この問題は計算的に難解になる。
正確な情報を伝達するためのキーノードを識別するための新しいランキングアルゴリズム(検索)を導入する。
また、強化学習(RL)に基づく動的計画フレームワークも開発している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:13:56 GMT)
Tell me what I need to know: Exploring LLM-based (Personalized) Abstractive Multi-Source Meeting Summarization [6.0] ミーティングの要約はデジタルコミュニケーションにおいて重要であるが、既存のソリューションはサリエンス識別に苦慮している。
これらの問題に対処する以前の試みは、関連する補足的リソース(例えばプレゼンテーションスライド)と書き起こしを併用することで、モデルの限られたコンテキストサイズによって妨げられている。
本研究では,3段階の大規模言語モデルによる補足材料を考慮したマルチソース会議要約について検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:40:48 GMT)
SymBa: Symbolic Backward Chaining for Structured Natural Language Reasoning [5.9] 我々はシンボリック・ソルバとLLMを統合した新しい後方連鎖システムSymBaを提案する。
SymBa では、解法が証明過程を制御し、解法が証明を完成させるために新しい情報を必要とする場合にのみ LLM が呼び出される。
完全性を活用して、SymBaは、ベースラインと比較して、導出性、リレーショナル、および算術的推論ベンチマークの大幅な改善を実現している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:10:26 GMT)
Redesigning Service Level Agreements: Equity and Efficiency in City Government Operations [5.9] 市役所運営におけるSLA(Service Level Agreements)の設計について検討する。
SLAは、ポットホールや倒木などのインシデントに一定時間以内に応答することを約束します。
我々は,政策を最適化するシミュレーション最適化フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:49:39 GMT)
More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing [5.8] Conditionally Overlapping Mixture of ExperTs (COMET) は、モジュラーでスパースなアーキテクチャを、指数関数的に重複する専門家数で誘導する一般的なディープラーニング手法である。
画像分類,言語モデリング,回帰といったタスクにおけるCOMETの有効性を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:26:38 GMT)
More Experts Than Galaxies: Conditionally-overlapping Experts With Biologically-Inspired Fixed Routing [5.8] Conditionally Overlapping Mixture of ExperTs (COMET) は、モジュラーでスパースなアーキテクチャを、指数関数的に重複する専門家数で誘導する一般的なディープラーニング手法である。
画像分類,言語モデリング,回帰といったタスクにおけるCOMETの有効性を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:26:38 GMT)
ANT: Adaptive Noise Schedule for Time Series Diffusion Models [5.8] 時系列拡散モデル(ANT)のための適応ノイズスケジュールを提案する。
非定常性を表す統計に基づいて、所定のTSデータセットの適切なノイズスケジュールを自動的に決定する。
我々は、様々なドメインのデータセットに基づいて、TS予測、精細化、生成を含む様々なタスクにまたがる手法を検証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:16:54 GMT)
High-Dimensional Tensor Discriminant Analysis with Incomplete Tensors [5.7] 本稿では,テンソル高次元線形判別分析において,不完全データを用いたテンソル分類の新しい手法を提案する。
判別テンソルの低ランク構造を利用して,高次元テンソル予測器を不要成分で管理するLDA-MDアルゴリズムを提案する。
提案手法は,データ不足のかなりの割合であっても,シミュレーションや実データ解析において優れた性能を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:00:16 GMT)
UniAutoML: A Human-Centered Framework for Unified Discriminative and Generative AutoML with Large Language Models [5.7] 我々は、人間中心のAutoMLフレームワークであるUniAutoMLを紹介し、AutoMLを識別的タスクと生成的タスクの両方に統一する。
UniAutoMLの人間中心の設計は、自然言語の対話を容易にする対話型ユーザインタフェース(CUI)を革新的に特徴付けている。
この設計により、AutoMLトレーニングプロセス全体の透明性とユーザコントロールが向上し、ユーザがトレーニング対象のモデルをシームレスに分解あるいは修正できるようになる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:03:01 GMT)
Towards Robust Knowledge Representations in Multilingual LLMs for Equivalence and Inheritance based Consistent Reasoning [5.7] 推論と言語スキルは人間の知性の基盤を形成し、問題解決と意思決定を促進する。
大規模言語モデル(LLM)の最近の進歩は、印象的な言語機能と突発的な推論行動をもたらし、アプリケーションドメインで広く採用されている。
我々は、LLMが「等価性」と「継承性」という2つの基礎的関係を用いて、合理的な表現を持つかどうかを評価することに注力する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:34:21 GMT)
Domain Adaptive Safety Filters via Deep Operator Learning [5.6] 本稿では,環境パラメータから対応するCBFへのマッピングを学習する自己教師型深層演算子学習フレームワークを提案する。
動的障害物を含むナビゲーションタスクの数値実験により,本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:10:55 GMT)
Polyhedral Complex Derivation from Piecewise Trilinear Networks [5.6] 神経表面表現学習の発展は、非線形位置符号化を取り入れている。
これは、Continuous Piecewise Affine関数に基づいたメッシュ抽出技術を適用する際の課題である。
本稿では,超曲面から平面への変換を示す理論的洞察と解析メッシュ抽出について述べる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:44:05 GMT)
Towards Unsupervised Validation of Anomaly-Detection Models [5.4] 本研究は,実世界の協調的意思決定機構に触発されて,異常検出モデルの自動検証に新たなパラダイムを提案する。
我々は、モデル選択とモデル評価という、一般的に使われている、教師なしの2つのモデル検証タスクに焦点を当てる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:27:04 GMT)
Supervised Chain of Thought [5.4] Chain of Thought (CoT)は複雑な推論タスクを解決するための有望なアプローチを提供する。
ワンプロンプト・フォー・オールアプローチは、正しい推論ステップを生成するためにモデルに重大な課題をもたらす。
タスク固有の監督が、プロンプト空間を正確にナビゲートし、最適な性能を達成するためにいかに重要であるかを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:25:27 GMT)
Planning In Natural Language Improves LLM Search For Code Generation [5.4] 自然言語における問題解決のための新しい探索アルゴリズムであるPlanSearchを提案する。
PlanSearchはHumanEval+、MBPP+、LiveCodeBenchで強力な結果を示している。
すべてのモデル、検索アルゴリズム、および分析されたベンチマークにおいて、検索によるパフォーマンス向上を正確に予測できることが示される。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:53:07 GMT)
How hard can it be? Quantifying MITRE attack campaigns with attack trees and cATM logic [5.3] サイバーセキュリティの専門家は どのリスクが最も脅かされているかを評価するのに 適切なツールボックスを 装備しなければなりません
我々は、MITRE知識ベース上でのデータ駆動方式を用いて攻撃キャンペーンの可能性を定量化し、そのような枠組みを構築した。
本稿では,cATM形式論理に基づく比較を行うための計算フレームワークを提案し,これをオープンソースのPythonツールに実装する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:34:24 GMT)
How hard can it be? Quantifying MITRE attack campaigns with attack trees and cATM logic [5.3] サイバーセキュリティの専門家は どのリスクが最も脅かされているかを評価するのに 適切なツールボックスを 装備しなければなりません
我々は、MITRE知識ベース上でのデータ駆動方式を用いて攻撃キャンペーンの可能性を定量化し、そのような枠組みを構築した。
本稿では,cATM形式論理に基づく比較を行うための計算フレームワークを提案し,これをオープンソースのPythonツールに実装する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:34:24 GMT)
On the Influence of Shape, Texture and Color for Learning Semantic Segmentation [5.2] 近年では、画像分類のための既成の深層ニューラルネットワーク(DNN)の形状とテクスチャバイアスを研究する一連の研究が生まれている。
我々はこれらの疑問をセマンティックセグメンテーション(セマンティックセグメンテーション)で研究し、ピクセルレベルでの質問に対処する。
3つのデータセットについて検討した結果, テクスチャや形状が学習の成功を左右しないが, 形状と色の組み合わせは異なるが, テクスチャなしでは驚くほど強い結果が得られることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:52:02 GMT)
Quantum-classical correspondence of non-Hermitian spin-orbit coupled bosonic junction [4.9] 対称性を破る相転移点の近傍では、古典的(平均場)と量子力学の対応が崩壊しがちであることを示す。
平均場と多粒子モデルの両方において、SOC効果はスピンアップ成分とスピンダウン成分の間の同期周期振動を大幅に促進することができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:46:28 GMT)
Contractivity and linear convergence in bilinear saddle-point problems: An operator-theoretic approach [4.9] 凸凹型双線型サドル点問題 $min_x max_y f(x) + ytop Ax - g(y)$ について検討する。
この問題の解決策は多くの機械学習タスクの中核にある。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:43:10 GMT)
FAME: Towards Factual Multi-Task Model Editing [4.9] 大規模言語モデル(LLM)は、幅広い知識を組み込んで、様々なタスクで非常によく機能する。
提案するFAMEは,モデル編集の実用性を高めるために設計された,現実的で包括的でマルチタスクなデータセットである。
次に,新しいキャッシング機構を用いて実世界との同期を確保するモデル編集手法であるSKEMEを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:02:03 GMT)
RAZOR: Refining Accuracy by Zeroing Out Redundancies [4.7] ディープラーニング領域では、追加データの有用性はその情報性に依存している。
RAZORは,より小さいが十分な情報的部分集合を抽出するために設計された,新しいインスタンス選択手法である。
文学における多くの技術とは異なり、RAZORは教師なしと教師なしの両方の設定で操作できる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:04:31 GMT)
LatentExplainer: Explaining Latent Representations in Deep Generative Models with Multi-modal Foundation Models [4.7] textitLatentExplainerは、深層生成モデルにおける潜伏変数の意味論的意味のある説明を自動的に生成するフレームワークである。
我々のアプローチは潜伏変数を摂動させ、生成されたデータの変化を解釈し、マルチモーダルな大言語モデル(MLLM)を用いて人間の理解可能な説明を生成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:39:35 GMT)
A Statistical Machine Learning Approach for Adapting Reduced-Order Models using Projected Gaussian Process [4.7] 適切な直交分解(POD)は、低次元の部分空間にまたがる最適基底モードを計算する。
本稿では,予測ガウス過程 (pGP) を提案し,PODベースを教師付き統計学習問題として適用する問題を定式化する。
パラメータ変化に対してPODベースを適用するために提案したpGPの利点を示す数値的な例を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:02:43 GMT)
Understanding the difficulty of low-precision post-training quantization of large language models [4.6] 高いパラメータ数を持つ大規模言語モデルは計算コストが高いが、その重みを非常に低い数値精度に圧縮することで、はるかに効率的にすることができる。
同じデータ制約下では、前者のアプローチは後者よりもほぼ常に悪化しており、数値精度が非常に低い場合に特に顕著な現象である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:16:52 GMT)
Cooperative non-reciprocal emission and quantum sensing of symmetry breaking [4.4] エネルギーと情報の非相互伝播は、幅広い量子技術応用に不可欠である。
反対称的(対称的)コヒーレントと対称的(対称的)散逸的相互作用の相互作用が非相互結合をもたらすことを示す。
我々は、時間変調外付けドライブや複雑なエンジニアリングを必要とせず、クビットアンサンブルにおける協調的非相互輸送を実現するための道を開いた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:18:11 GMT)
SylloBio-NLI: Evaluating Large Language Models on Biomedical Syllogistic Reasoning [4.4] SylloBio-NLIは自然言語推論のための多様なシロメトリクスを体系的にインスタンス化するフレームワークである
有効結論の特定と28のシロメトリックスキーム間の証拠の抽出について,Large Language Models (LLMs) の評価を行った。
バイオメディカル・シロジック推論はゼロショットLLMでは特に困難であり, 一般化したモダスポネンでは70%, 解離性シロジズムでは23%の精度が得られた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:02:41 GMT)
The S2 Hierarchical Discrete Global Grid as a Nexus for Data Representation, Integration, and Querying Across Geospatial Knowledge Graphs [4.4] 本稿では,KnowWhereGraphにおけるGoogleのS2幾何の実装について概説する。
最終的にこの研究は、スケーラブルなGeoKGを構築するためのDGGSフレームワーク、特にS2の可能性を示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:30:05 GMT)
Non-Invasive Qualitative Vibration Analysis using Event Camera [4.3] イベントカメラは、リアルタイムな構造評価と微妙な動き解析に有望な機能を提供する。
しかし、静止カメラや孤立した動きを含むシナリオにおいて、運動倍率に関する我々の研究は大きな課題を明らかにした。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:51:10 GMT)
Imperceptible Rhythm Backdoor Attacks: Exploring Rhythm Transformation for Embedding Undetectable Vulnerabilities on Speech Recognition [4.2] 近年,音声認識システムにおいて,典型的なバックドア攻撃が研究されている。
攻撃者は、良質な音声スペクトログラムにいくつかの組み込まれた変更を加えたり、ピッチや音色などの音声成分を変更したりする。
データ中毒のステルス性を改善するために,ランダム・スペクトログラム・リズム・トランスフォーメーション (Random Spectrogram Rhythm Transformation) と呼ばれる非ニューラルかつ高速なアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:17:06 GMT)
Learning diffusion at lightspeed [4.2] 観測データから拡散項を学習する既存のモデルは、複雑な二段階最適化問題に依存する。
既存のアーキテクチャの複雑さを回避できる新しいシンプルなモデル JKOnet* を提案する。
JKOnet*は単純な二次的損失を最小限に抑え、サンプル効率、計算複雑性、精度で他のベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:09:52 GMT)
A Data-Adaptive Prior for Bayesian Learning of Kernels in Operators [4.1] 我々は、常に最小限の雑音を持つ安定な後部を実現するために、データ適応型を前もって導入する。
数値実験により、固定された先行は、4種類の誤りのいずれかが存在する場合、分岐した後部平均に繋がることが示された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:06:45 GMT)
Debug Smarter, Not Harder: AI Agents for Error Resolution in Computational Notebooks [4.0] 計算ノートブックのエラー解決に特化して設計されたAIエージェントを提案する。
我々はそれと対話してノートブック環境を探索できるエージェントシステムを開発した。
コストの比較とユーザスタディの実施により,既存のシングルアクションソリューションに対するアプローチを評価した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:55:34 GMT)
Beyond Discretization: Learning the Optimal Solution Path [4.0] 本稿では,解経路を基底関数の集合でパラメータ化し,エンフィングル最適化問題を解く手法を提案する。
我々の手法は、離散化よりも相当に複雑化している。
また、機械学習に共通する特殊なケースに対して、より強力な結果を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:23:42 GMT)
Machine Learning Aided Modeling of Granular Materials: A Review [3.9] AIの幅広いカテゴリのサブセットとしての機械学習は、粒状材料の研究コミュニティでかなりの注目を集めている。
この研究は、粒状物質の機械学習支援研究における最近の進歩の詳細なレビューを提供する。
粒状物質の挙動を学習するための異なるニューラルネットワークをレビューし、比較する。
ニューラルネットワークと数値計算を組み合わせた実用工学・境界値問題のマクロシミュレーションについて論じる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:53:04 GMT)
Residual-INR: Communication Efficient On-Device Learning Using Implicit Neural Representation [3.8] Residual-INRはフォグコンピューティングに基づく通信効率の高いデバイス上での学習フレームワークである。
データ転送を最大5.16倍に削減する。
また、CPUを使わずにデバイス上での学習を加速し、精度を犠牲にすることなく最大2.9倍のスピードアップを達成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:15:51 GMT)
Enhanced Prompt-leveraged Weakly Supervised Cancer Segmentation based on Segment Anything [3.8] がんなどの疾患の病理診断は、従来、医師や病理医による形態学的特徴の評価に頼っていた。
近年,診断支援ツールとしてコンピュータ支援診断(CAD)システムの進歩が注目されている。
本稿では,クラスアクティベーションマップとSAMに基づく擬似ラベルを組み合わせ,弱教師付きセマンティックセマンティックセグメンテーション(WSSS)モデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:01:27 GMT)
Entity Matching using Large Language Models [3.7] 本稿では, PLM ベースのマーカに代わる, タスク固有の訓練データ依存モデルとして, LLM (Generative Large Language Model) を用いて検討する。
GPT4は一致判定のための構造化された説明を生成でき、一致した誤りの原因を自動的に特定できることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:21:31 GMT)
Collaboratively adding new knowledge to an LLM [3.7] 半協調と完全協調の2つの設定について検討する。
LoRAは、新しい知識獲得と古い知識の保持の両方を考慮に入れた場合、ほとんどの場合、すべてのパラメータの完全なチューニングよりも優れている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:04:51 GMT)
Harnessing Shared Relations via Multimodal Mixup Contrastive Learning for Multimodal Classification [3.7] マルチモーダルデータに固有のニュアンス付き共有関係を抽出するマルチモーダル混合コントラスト学習手法であるM3CoLを提案する。
我々の研究は、堅牢なマルチモーダル学習のための共有関係の学習の重要性を強調し、将来の研究に有望な道を開く。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:31:49 GMT)
DRACO-DehazeNet: An Efficient Image Dehazing Network Combining Detail Recovery and a Novel Contrastive Learning Paradigm [3.6] Detail RecoveryとContrastive DehazeNetは、特定のデハズされたシーンコンテキストへの拡張を調整した、詳細なイメージリカバリネットワークである。
大きな革新は、新しい四重項損失に基づくコントラストデハージングパラダイムによって達成された、限られたデータで効果的にトレーニングできることである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:48:31 GMT)
Efficient Arbitrary Precision Acceleration for Large Language Models on GPU Tensor Cores [3.6] 大規模言語モデル(LLM)は広く応用されているが、効率的な推論では課題に直面している。
本稿では、並列計算を容易にし、対称量子化をサポートする新しいバイポーラ-INTデータフォーマットを提案する。
ビットレベルで分解・復元する任意の精度行列乗算方式を実装し,フレキシブルな精度を実現する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:01:18 GMT)
Kibble-Zurek behavior in a topological phase transition with a quadratic band crossing [3.6] Kibble-Zurek (KZ) メカニズムは、連続対称性を破る遷移でシステムを駆動する際のスケーリングの振る舞いを記述している。
これまでの研究では、KZ様のスケーリング挙動は、Qi-Wu-Zhangモデル(2D)とSu-Schrieffer-Heegerモデル(1D)のトポロジ的遷移にも関係していることが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:42:10 GMT)
Harnessing Causality in Reinforcement Learning With Bagged Decision Times [3.6] バッグは連続した決定時間の有限列を含む。
遷移力学は、バッグ内の非マルコフ的かつ非定常的である。
バッグ内のすべてのアクションは、バッグの端で観察された1つの報酬に共同で影響します。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:51:37 GMT)
Oblivious Monitoring for Discrete-Time STL via Fully Homomorphic Encryption [3.5] 本稿では,サーバから算術データを隠蔽するオンラインモニタリングプロトコルを提案する。
このプロトコルは、例えば、距離、速度などを組み合わせた安全測定を計算できるように、暗号化された値上での操作を可能にする。
本プロトコルは,信号時間論理(STL)に対する離散時間実数値信号のオンラインモニタリングを可能にする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:39:21 GMT)
Assistive AI for Augmenting Human Decision-making [3.4] この論文は、人間の監視を維持しながら、AIが意思決定の複雑なプロセスを支援する方法を示している。
私たちのフレームワークの中心は、プライバシ、説明責任、信頼性の原則です。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:16:07 GMT)
Universal approximation results for neural networks with non-polynomial activation function over non-compact domains [3.3] ユークリッド空間の非コンパクト部分集合上の関数空間内のニューラルネットワークに対する普遍近似結果を導出する。
非ポリノミカルアクティベーション関数を持つニューラルネットワークにより、十分に正規かつ可積分なフーリエ変換を持つ関数を近似するための次元非依存の速度を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:53:20 GMT)
DRACO: Differentiable Reconstruction for Arbitrary CBCT Orbits [3.3] 本稿では,円錐線CT(CBCT)画像を任意の軌道に再構成する新しい手法を提案する。
提案手法では, 任意の軌道に最適化されたシフト可変FBPアルゴリズムをディープラーニング手法により適用した。
提案手法は、特にロボットC-アームCTシステムにおいて、介入医療画像の大幅な進歩である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:59:36 GMT)
FedECA: A Federated External Control Arm Method for Causal Inference with Time-To-Event Data in Distributed Settings [3.2] 外部制御アーム(ECA)は、実験薬の初期臨床開発を知らせることができる。
ECAは、規制承認の有効な証拠を提供することができる。
ECAを実装する上での大きな課題は、現実世界または歴史的な臨床試験データにアクセスすることである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:04:36 GMT)
Interfacing Gottesman-Kitaev-Preskill Qubits to Quantum Memories [3.2] 共振器を介した制御変位ゲートに基づく量子メモリとGKP量子ビット状態のインタフェースを提案する。
我々は、このプロトコルを拡張して、Acillary optical quadrature-squeezed light の要求を回避することにより、GKPクラスター状態の生成を実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:21:02 GMT)
Entangling Quantum Memories at Channel Capacity [3.2] 光周波数またはマイクロ波チャネルを介する量子メモリのエンタングは、短い範囲と長い範囲に量子ビットをリンクする鍵である。
空洞補助型メモリフォトンインタフェースは,ゴッテマン・キタエフ・プレスキル(GKP)フォトニッククイディットと物質記憶の絡み合わせに利用できることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:41:25 GMT)
Speciesism in Natural Language Processing Research [3.1] 本研究の目的は、NLP研究において、種族主義、すなわち非ヒト動物に対する差別が存在するかどうかを検討することである。
本研究の結果は,それぞれ研究者,データ,モデルに種分化が存在することを示唆している。
具体的には、(a)NLP研究者のうち、(a)AIで社会バイアスを研究する者でさえ、(b)NLPデータの中で、(c)OpenAI GPT、(c)NLPモデル、最近のNLPモデルを評価するために使用されるデータセットに注釈付けされたデータに種主義バイアスが固有のものであることを示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:09:41 GMT)
Safeguarding Blockchain Ecosystem: Understanding and Detecting Attack Transactions on Cross-chain Bridges [3.1] クロスチェーン橋への攻撃は2021年以来、43億ドル近くを失った。
本稿では,2021年6月から2024年9月までに発生した49件を含む,これまでで最大のクロスチェーン橋攻撃事件を収集する。
クロスチェーンビジネスロジックに対する攻撃を検出するためのBridgeGuardツールを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:25:05 GMT)
ENOT: Expectile Regularization for Fast and Accurate Training of Neural Optimal Transport [3.0] 最適な輸送計画の正確かつ効率的に推定する新しい手法を提案する。
expectile Regularized Neural Transport Optimal (ENOT) と呼ばれる。
ENOTは二重ポテンシャルの学習過程に結合条件を強制する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:26:27 GMT)
A Lipschitz spaces view of infinitely wide shallow neural networks [3.0] 我々は、パラメータ空間と双対対対の符号付き測度を用いて、浅いニューラルネットワークの平均場パラメトリゼーションを再考する。
コンパクト性は強いカントロビッチ=ルビンシュタインノルムで証明され、そうでない場合には好ましくない振る舞いを示すいくつかの例を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:41:37 GMT)
Signal-SGN: A Spiking Graph Convolutional Network for Skeletal Action Recognition via Learning Temporal-Frequency Dynamics [3.0] 骨格に基づく行動認識では、グラフ畳み込みネットワーク(GCN)はその複雑さと高エネルギー消費のために制限に直面している。
本稿では、骨格配列の時間次元をスパイキング時間ステップとして活用するSignal-SGN(Spiking Graph Convolutional Network)を提案する。
実験により,提案モデルが既存のSNN法を精度で上回るだけでなく,学習時の計算記憶コストも低減できることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:12:00 GMT)
Unscrambling disease progression at scale: fast inference of event permutations with optimal transport [2.9] 疾患進行モデルでは、慢性変性状態として、患者の特徴の変化の群レベルの時間的軌跡を推定する。
本研究では,Birkhoff polytopeに属する事象の潜在置換行列として,最適な輸送からモデル疾患進行へのアイデアを活用する。
実験は、シミュレーションにおけるノイズに対する速度、精度、堅牢性の増加を実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:44:29 GMT)
How Does Data Diversity Shape the Weight Landscape of Neural Networks? [2.9] 本稿では, ニューラルネットワークのパラメータ空間に対する降雨量, 重量減衰量, 騒音増大の影響について検討する。
我々は、多様なデータが、ドロップアウトと同様の方法で重量景観に影響を与えることを観察する。
合成データにより、実際の入力データにより多くの多様性がもたらされ、アウト・オブ・ディストリビューションテストインスタンスの性能が向上する、と結論付けている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:57:05 GMT)
Symmetry-enhanced Counterdiabatic Quantum Algorithm for Qudits [2.9] 量子ビットの代わりにキューディットを利用する対称性を持つディジタル化反断熱量子アルゴリズムを提案する。
第一に、回路深さの圧縮は反断熱プロトコルによって達成される。
第二に、問題に関する情報は量子ビットを量子ビットに置き換えることで圧縮され、問題のより効率的な表現が可能となる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:37:06 GMT)
Symmetry-enhanced Counterdiabatic Quantum Algorithm for Qudits [2.9] 量子ビットの代わりにキューディットを利用する対称性を持つディジタル化反断熱量子アルゴリズムを提案する。
第一に、回路深さの圧縮は反断熱プロトコルによって放射される。
第二に、問題に関する情報は量子ビットを量子ビットに置き換えることで圧縮され、問題のより効率的な表現が可能となる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:37:06 GMT)
Interpreting Microbiome Relative Abundance Data Using Symbolic Regression [2.8] 本稿では,大腸癌(CRC)を中心に,マイクロバイオームの相対的存在量データに対するシンボルレグレッションの適用について検討する。
749種にまたがる1万種以上の標本をコホートから71種類の研究に利用した。
以上の結果から,SRは予測性能だけでなく,モデル解釈可能性も優れていることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:35:51 GMT)
Action Selection Learning for Multi-label Multi-view Action Recognition [2.8] 本研究は,映像レベルのラベルが弱い広帯域領域を撮影するために,カメラを分散した実世界のシナリオに焦点を当てた。
本稿では,多視点行動選択学習法(MultiASL)を提案する。
MM-Officeデータセットを用いた実世界のオフィス環境における実験は,既存手法と比較して提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:46:30 GMT)
Optimization Dynamics of Equivariant and Augmented Neural Networks [2.8] 対称データに基づくニューラルネットワークの最適化について検討する。
アーキテクチャを制約する戦略を、データ拡張を使用する戦略と同等に扱う戦略と比較する。
後者の状況においても, 定常点が拡張トレーニングにおいて不安定であることは明らかだが, 明らかな同変モデルに対しては安定である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:31:27 GMT)
The Traveling Bandit: A Framework for Bayesian Optimization with Movement Costs [2.8] 提案手法はBOの移動コストを理論的に保証する。
本手法は,従来のBO法に匹敵する遅延性能を維持しつつ,時間とともに平均移動コストを効果的に削減する。
このフレームワークはまた、移動コストを伴う様々な帯域設定で幅広い応用を約束する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:14:25 GMT)
Enabling Unit Proofing for Software Implementation Verification [2.7] 本稿では,方法論とツールの両面から,単体証明フレームワークの研究課題を提案する。
これにより、エンジニアはコードレベルの欠陥を早期に発見できる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:37:36 GMT)
Evaluating Privacy Measures in Healthcare Apps Predominantly Used by Older Adults [2.7] 急速な成長は 健康情報のプライバシーに関する懸念も高めています
規制コンプライアンスやデータ処理プラクティス,プライバシ重視のユーザビリティなど,さまざまな面で28のヘルスケアアプリを評価しました。
私たちの分析では、プライバシー基準に従っている場合、HIPAAに明示的に準拠しているアプリは25%に過ぎず、わずか18%に過ぎなかった。
驚いたことに、これらのアプリケーションの79%は違反プロトコルを欠いているため、データ漏洩が発生した場合に高齢者を危険にさらしている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:01:14 GMT)
Evaluating the evaluators: Towards human-aligned metrics for missing markers reconstruction [2.7] アニメーションデータは、複数のカメラを用いて光学マーカーの位置を確立する光学的モーションキャプチャシステムを通して取得されることが多い。
これは、マーカー再構成の欠如に対する機械学習ベースのソリューションへの関心を喚起した。
この分野の進展を推し進める、より相関性の高い指標のセットを導入し、評価する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:44:35 GMT)
Learning Social Cost Functions for Human-Aware Path Planning [2.7] 本稿では,一般的な社会的シナリオを認識し,それに対応するために従来のプランナーのコスト関数を変更する新しい手法を提案する。
我々のアプローチでは、ロボットはタスクごとに異なるモジュールを持つのではなく、単一の学習モデルで異なる社会的規範を学習することができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:25:46 GMT)
Predicting Accurate Lagrangian Multipliers for Mixed Integer Linear Programs [2.7] 我々は、降下を回避し、局所的な最適化を効果的に減らし、深層学習アプローチを導入する。
提案手法は, 連続緩和とラグランジアン境界とのギャップの最大85%を解消し, 降下に基づくラグランジアン法において, 高品質なウォームスタートを提供することを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:32:20 GMT)
On Subjective Uncertainty Quantification and Calibration in Natural Language Generation [2.6] 大規模言語モデルは多くの場合、不確実な定量化が困難になるような自由形式の応答を生成する。
この研究はベイズ決定論の観点からこれらの課題に対処する。
本稿では,モデルの主観的不確実性とそのキャリブレーションを原理的に定量化する方法について論じる。
提案手法はブラックボックス言語モデルに適用できる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:55:27 GMT)
DomainLynx: Leveraging Large Language Models for Enhanced Domain Squatting Detection [2.6] ドメイン・スクワットはインターネットのセキュリティにとって重大な脅威となり、攻撃者はますます高度な技術を用いている。
本研究では,Large Language Models (LLMs) を利用した新しい複合AIシステムであるDomainLynxを紹介した。
2億900万のドメインから34,359のスクワットドメインを検出し、ベースラインの手法を2.5倍上回った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:01:03 GMT)
DomainLynx: Leveraging Large Language Models for Enhanced Domain Squatting Detection [2.6] ドメイン・スクワットはインターネットのセキュリティにとって重大な脅威となり、攻撃者はますます高度な技術を用いている。
本研究では,Large Language Models (LLMs) を利用した新しい複合AIシステムであるDomainLynxを紹介した。
2億900万のドメインから34,359のスクワットドメインを検出し、ベースラインの手法を2.5倍上回った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:01:03 GMT)
DomainDynamics: Lifecycle-Aware Risk Timeline Construction for Domain Names [2.6] DomainDynamicsは、ライフサイクル段階を考慮してドメイン名のリスクを予測するように設計された新しいシステムである。
マルウェアやフィッシングインシデントから85,000以上の実際の悪意のあるドメインを含む実験で、DomainDynamicsは82.58%の検出率を獲得し、偽陽性率は0.41%だった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:59:13 GMT)
DomainDynamics: Lifecycle-Aware Risk Timeline Construction for Domain Names [2.6] DomainDynamicsは、ライフサイクル段階を考慮してドメイン名のリスクを予測するように設計された新しいシステムである。
マルウェアやフィッシングインシデントから85,000以上の実際の悪意のあるドメインを含む実験で、DomainDynamicsは82.58%の検出率を獲得し、偽陽性率は0.41%だった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:59:13 GMT)
An Integrated Deep Learning Model for Skin Cancer Detection Using Hybrid Feature Fusion Technique [2.6] 皮膚がんはDNA損傷によって引き起こされる重篤で致命的な病気である。
本研究では,皮膚病変の正確な分類を実現するための,Deep Learning(DL)に基づくハイブリッドフレームワークを提案する。
我々は92.27%の精度、92.33%の感度、92.22%の特異性、90.81%の精度、91.57%のF1スコアを達成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:19:13 GMT)
Controllable Discovery of Intents: Incremental Deep Clustering Using Semi-Supervised Contrastive Learning [2.5] 制御可能なインテント発見(CDI)フレームワークドメインと事前知識は、教師なしのコントラスト学習のシーケンスを用いて組み込まれている。
このディープ・クラスタリング・プロセスが、どのようにしてヒューマン・イン・ザ・ループによる漸進的な発見戦略の一部となるかを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:24:02 GMT)
Takin-ADA: Emotion Controllable Audio-Driven Animation with Canonical and Landmark Loss Optimization [2.5] Takin-ADAは、リアルタイムオーディオ駆動のポートレートアニメーションのための新しい2段階のアプローチである。
不要な表現のリークを低減しつつ、微妙な表現伝達を高める特殊な損失関数を導入する。
第2段階は、高度なオーディオ処理技術を使用して、リップシンク精度を向上させる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:39:56 GMT)
Optimizing Retrieval-Augmented Generation with Elasticsearch for Enhanced Question-Answering Systems [2.4] 本研究の目的は,大規模言語モデル(LLM)の精度と品質を,検索型拡張生成(RAG)フレームワークに統合することにより改善することである。
この実験では、テストデータセットとしてSQuAD(Stanford Question Answering dataset)バージョン2.0が使用されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:17:49 GMT)
Self-supervised contrastive learning performs non-linear system identification [2.4] 自己教師型学習は潜在空間においてシステム識別を行うことができることを示す。
非線形観測モデルの下で線形・切替線形・非線形力学を明らかにするためのフレームワークであるDynCLを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:59:25 GMT)
Combining Hough Transform and Deep Learning Approaches to Reconstruct ECG Signals From Printouts [2.4] この研究は、2024年のGeorge B. Moody PhysioNet Challengeに対する私たちのチームの勝利の貢献を示します。
チャレンジには2つの目標があった: 印刷物から心電図信号を再構成し、それらを心臓病に分類する。
本モデルでは, CV信号対雑音平均比17.02, 隠しセットにおける公式チャレンジスコア12.15を達成し, 競技における第1位を確保した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:36:24 GMT)
Rationale Behind Essay Scores: Enhancing S-LLM's Multi-Trait Essay Scoring with Rationale Generated by LLMs [2.3] 本稿では,Rationale-based Multiple Trait Scoring (RMTS)について紹介する。
RMTSは、プロンプトエンジニアリングに基づく大規模言語モデル(LLM)と、より小さな大規模言語モデル(S-LLM)を用いた微調整ベースのエッセイスコアモデルを統合する。
ASAP、ASAP++、Feedback Prizeなどのベンチマークデータセットの実験では、RMTSが特性特異的スコアリングにおいて最先端のモデルとバニラS-LLMを著しく上回っていることが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:35:17 GMT)
A Bioinformatic Approach Validated Utilizing Machine Learning Algorithms to Identify Relevant Biomarkers and Crucial Pathways in Gallbladder Cancer [2.3] 胆嚢癌(GBC)は胆道系腫瘍の中で最も多い疾患である。
GBCにおけるバイオマーカーの役割について最近の研究はほとんどない。
バイオマーカーの同定には機械学習(ML)とバイオインフォマティクス(バイオインフォマティクス)を用いた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:51:19 GMT)
JAMUN: Transferable Molecular Conformational Ensemble Generation with Walk-Jump Sampling [2.3] 本稿では、任意のタンパク質のボルツマン分布を効率的に抽出する目的に向けて、ユニバーサルノイズを用いたウォークジャンプ加速分子アンサンブル(JAMUN)を提案する。
ウォーク・ジャンプサンプリングを点雲に拡張することにより、JAMUNは従来の分子動力学や最先端のML手法よりも桁違いに速い速度でアンサンブル生成を可能にする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:21:25 GMT)
Tight bounds on Pauli channel learning without entanglement [2.3] 我々は,絡み合いのない学習アルゴリズムを,主利得システムと補助システムとを分離可能な状態,測定,操作のみを利用するものとみなしている。
これらのアルゴリズムは、中間回路の測定と古典的なフィードフォワードにインターリーブされたメインシステムに量子回路を適用するものと等価であることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:18:05 GMT)
Neural Real-Time Recalibration for Infrared Multi-Camera Systems [2.2] 赤外線マルチカメラシステムのリアルタイム再校正には、学習のない、あるいはニューラルネットワーク技術は存在しない。
動的リアルタイムキャリブレーションが可能なニューラルネットワークに基づく手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:37:37 GMT)
Learning to refine domain knowledge for biological network inference [2.2] 摂動実験により、生物学者は興味のある変数間の因果関係を発見することができる。
これらのデータの空間性と高次元性は因果構造学習アルゴリズムに重大な課題をもたらす。
そこで本研究では,データ観測に基づくドメイン知識の補修アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:53:23 GMT)
Identifying treatment response subgroups in observational time-to-event data [2.2] 本研究は、観察研究における治療応答サブグループを特定するための、新しい結果誘導手法を提案する。
本手法は, 個別化と平均処理効果推定の中間に位置する。
実験では, ランダム化処理と観察処理の両方において, 結果誘導サブグループ分析の最先端手法を著しく上回る結果を得た。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:32:18 GMT)
Identifying treatment response subgroups in observational time-to-event data [2.2] 本研究は、観察研究における治療応答サブグループを特定するための、新しい結果誘導手法を提案する。
本手法は, 個別化と平均処理効果推定の中間に位置する。
実験では, ランダム化処理と観察処理の両方において, 結果誘導サブグループ分析の最先端手法を著しく上回る結果を得た。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:32:18 GMT)
MomentumSMoE: Integrating Momentum into Sparse Mixture of Experts [2.2] 我々は、MomentumSMoEと呼ばれるSMoEの新しいファミリーを提案する。
我々は,MomentumSMoEがSMoEよりも安定で頑健であることを証明する。
我々は、視覚用スパースMoEモデル(V-MoE)や汎用言語モデル(GLaM)など、多くの種類のスパースMoEモデルに対するMomentumSMoEの適用性を実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:20:22 GMT)
A Survey of Multi-Agent Deep Reinforcement Learning with Communication [2.1] 多エージェント深部強化学習(MADRL)の分野では、エージェントはコミュニケーションによって全体的な学習性能を向上させることができる。
既存のComm-MADRLアプローチを区別し分類するための体系的で構造的なアプローチが欠如している。
そこで我々は,Comm-MADRLアプローチを解析,開発,比較可能な9次元モデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:14:58 GMT)
The Devil is in the Details: Analyzing the Lucrative Ad Fraud Patterns of the Online Ad Ecosystem [2.1] 悪質な俳優たちは、制限を回避し、Webサイトを好ましくない、あるいは違法なコンテンツでサポートできる相当な収入を生み出す方法を見つけた。
識別子プーリングは、広告収入を、信頼できるドメインから好ましくないコンテンツを提供する悪名高いドメインにリダイレクトする方法を示す。
我々は、サプライチェーンの透明性とパブリッシャーと広告ネットワーク間のビジネス関係を向上するWebモニタリングサービスを公開する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:58:06 GMT)
2D-3D Deformable Image Registration of Histology Slide and Micro-CT with ML-based Initialization [2.1] 軟部組織CTの画質は低かったため,組織スライドとmuCTとの相関が困難であった。
本稿では,新しい2D-3Dマルチモーダルデフォルマブル画像登録法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:51:43 GMT)
Utilizing Large Language Models for Event Deconstruction to Enhance Multimodal Aspect-Based Sentiment Analysis [2.1] 本稿では,イベント分解のためのLarge Language Models (LLMs)を導入し,マルチモーダル・アスペクト・ベース・センチメント分析(MABSA-RL)のための強化学習フレームワークを提案する。
実験の結果,MABSA-RLは2つのベンチマークデータセットにおいて既存手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:40:45 GMT)
Smolyak algorithm assisted robust control for quantum systems with uncertainties [2.1] コスト削減と精度向上を目的として,ロバストな量子制御手法を開発した。
我々の結果は、信頼性とセキュアな量子コンピューティングと通信に寄与することができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:40:59 GMT)
Surpassing the fundamental limits of distillation with catalysts [2.1] 量子触媒は、これまで知られていた蒸留オーバーヘッドの基本的な限界を超えることができることを示す。
特に, マジック状態蒸留では, コードベースの低オーバーヘッド蒸留プロトコルをワンショット設定に推し進めることが可能であることが示唆された。
オーバヘッドと成功確率の間の時空のトレードオフを可能にすることを実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:41:52 GMT)
Enabling Scalable Evaluation of Bias Patterns in Medical LLMs [2.1] 大規模言語モデル(LLMs)は、多くの医学的課題に大きく貢献する可能性を示している。
主な関心領域の1つは、医学的応用におけるLSMの偏りのある行動に関連しており、個人の不公平な治療につながっている。
本稿では,厳密な医学的証拠に基づく検査ケースの自動生成により,そのようなバイアス評価をスケールアップする手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:17:03 GMT)
SignAttention: On the Interpretability of Transformer Models for Sign Language Translation [2.1] 本稿では,トランスフォーマーを用いた手話翻訳モデルの最初の包括的解釈可能性解析について述べる。
モデル内の注意機構について検討し,視覚入力を逐次グルースで処理・調整する方法について考察する。
この研究はSLTモデルのより深い理解に寄与し、より透明で信頼性の高い翻訳システムを開発するための道を開いた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:38:37 GMT)
Diffusion-based Semi-supervised Spectral Algorithm for Regression on Manifolds [2.1] 本研究では,高次元データの回帰解析に挑戦する拡散スペクトルアルゴリズムを提案する。
本手法では,熱カーネルの局所的推定特性を用いて,この障害を克服するための適応型データ駆動型アプローチを提案する。
我々のアルゴリズムは完全にデータ駆動方式で動作し、データ固有の多様体構造内で直接動作する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:29:04 GMT)
Parallel Backpropagation for Inverse of a Convolution with Application to Normalizing Flows [2.0] 非可逆的畳み込みの逆は、正規化フローで現れる重要な操作である。
正方形画像に対して,動作時間$O(sqrtn)$の高速並列バックプロパゲーションアルゴリズムを提案する。
従来のモデルと比較して,次元毎に類似したビットでサンプリング時間を大幅に改善した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:35:33 GMT)
Can Large Language Models Generate Geospatial Code? [1.8] 本稿では,大規模言語モデルの地理空間コード生成能力を評価するフレームワークであるGeoCode-Evalを紹介する。
ベンチマークデータセットであるGeoCode-Benchを開発し、5000のマルチチョイス、1500のフィリング・イン・ザ・ブランク、1500の真偽質問、1000の主観的タスクで構成された。
GeoCode-Benchを用いて、3つの商用クローズドソースLCM、4つのオープンソース汎用LCM、14の特殊コード生成モデルを評価した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:49:24 GMT)
Dating ancient manuscripts using radiocarbon and AI-based writing style analysis [1.8] 我々は,Dead Sea Scrollsの新しい放射性炭素年代測定サンプルに基づいて,AIに基づく年代予測モデルであるEnochを紹介する。
エノクは放射性炭素による年代を、放射性炭素年代測定と比較して27.9年から30.7年の様々なMAEで予測することができる。
その後、135点の未確認の写本の日付を推定するために用いられ、この標本の79パーセントがパレオグラフィーによるポストホック評価に基づいて「現実的」であるとされた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:57:30 GMT)
Identifying built environment factors influencing driver yielding behavior at unsignalized intersections: A naturalistic open-source dataset collected in Minnesota [1.8] 多くの要因が、交通量、車両速度、道路特性など、ドライバーと歩行者の相互作用の結果に影響を与える。
ミネソタ州を横断する18の無署名の交差点で、ビデオデータから収集された大規模なオープンソースデータセットを紹介した。
3000以上のインタラクションをドキュメント化したこのデータセットは、ドライバと歩行者のインタラクションと、50以上の異なるコンテキスト変数の詳細なビューを提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:11:32 GMT)
Predictive variational inference: Learn the predictively optimal posterior distribution [1.8] バニラ変量推論はベイズ後部分布に最適な近似を求めるが、正確なベイズ後部分布でさえモデル的不特定の下では意味がないことが多い。
本稿では,最適後続密度から標本を探索する一般推論フレームワークである予測変分推論(PVI)を提案する。
この枠組みは、可能性エクササイズモデルと可能性フリーモデルの両方に適用できる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:44:57 GMT)
$\textbf{Only-IF}$:Revealing the Decisive Effect of Instruction Diversity on Generalization [1.7] トレーニングデータがセマンティックドメインで十分に分散されている場合、textbfonlyが$であることを示す。
例えば$textit$textbfspecialist$$と$textit$textbf generalist$$$モデルの微調整などです。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:18:50 GMT)
$\textbf{Only-IF}$:Revealing the Decisive Effect of Instruction Diversity on Generalization [1.7] トレーニングデータがセマンティックドメインで十分に分散されている場合、textbfonlyが$であることを示す。
例えば$textit$textbfspecialist$$と$textit$textbf generalist$$$モデルの微調整などです。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:18:50 GMT)
$\textbf{Only-IF}$:Revealing the Decisive Effect of Instruction Diversity on Generalization [1.7] トレーニングデータがセマンティックドメインで十分に分散されている場合、textbfonlyが$であることを示す。
例えば$textit$textbfspecialist$$と$textit$textbf generalist$$$モデルの微調整などです。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:18:50 GMT)
Reply to "Comment on "Unified Framework for Open Quantum Dynamics with Memory"" [1.6] 一般化量子マスター方程式(GQME)の離散時間メモリカーネル(mathcal K$)と経路積分の離散時間影響関数(I$)の直接的かつ明示的な関係を示す。
要約すると、Makriの2020年の論文から、$I$と$mathcal K$を明示的に接続する方程式の集合が見つからなかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:27:57 GMT)
Tackling domain generalization for out-of-distribution endoscopic imaging [1.6] 我々は、画像のスタイル情報とコンテンツ情報の両方を利用して、堅牢で一般化可能な特徴表現を保存する。
提案手法は, ベースラインであるDeepLabv3+よりも13.7%向上し, 最新のSOTA(State-of-the-art)手法よりも8%改善した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:45:13 GMT)
SatSwinMAE: Efficient Autoencoding for Multiscale Time-series Satellite Imagery [1.6] 衛星時系列データのための時間情報を統合するために,SwinEモデルを拡張した。
このアーキテクチャでは、階層的な3D Masked Autoencoder (MAE) と Video Swin Transformer ブロックを採用している。
提案手法は, 既存の基盤モデルに対して, 評価された下流タスクすべてに対して, 大幅な性能向上を図っている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:25:52 GMT)
Dynamic transition of the density-matrix topology under parity-time symmetry [1.6] 密度行列トポロジーは対応する開系力学において遷移を起こすことができる。
隠れパリティ時間対称性がさらに促進できることが示される。
注目すべきことに、動的遷移はパリティ時対称性が破れた状態でも周期的に起こることがある。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:48:55 GMT)
Transferring Tactile Data Across Sensors [1.6] 本稿では,触覚センサ間のデータ変換手法について紹介する。
我々は、BioTac信号をDIGITセンサーに変換することで、アプローチを実証する。
筆者らのフレームワークは,信号データを対応する3次元変形メッシュに変換する第2のステップと,これら3次元変形メッシュを1つのセンサから別のセンサへ変換する第3のステップと,出力画像を生成する第3のステップで構成されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:15:47 GMT)
PReP: Efficient context-based shape retrieval for missing parts [1.5] 本稿では,学習手法を創造的に活用するパイプラインであるPart Retrieval Pipeline(PReP)と,トレーニングされた分類モデルを用いて,データベースからの潜在的置換部品の適合性を測定する。
低パラメータサイズと計算要求のため、数秒で数千の予備部品の倉庫をソートすることができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:51:31 GMT)
Communication-Efficient Distributed Deep Learning via Federated Dynamic Averaging [1.5] Federated Dynamic Averaging (FDA)は通信効率の良いDDL戦略である。
FDAは従来のアルゴリズムと最先端のアルゴリズムと比較して、通信コストを桁違いに削減している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:05:18 GMT)
A simplicity bubble problem and zemblanity in digitally intermediated societies [1.4] 社会におけるビッグデータと機械学習の普遍性について論じる。
以上の結果から, 公式な知識だけでは, 迷走神経所見の可能性がさらに低下しない天井があることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:05:54 GMT)
Practical Light Clients for Committee-Based Blockchains [1.4] ほとんどのライトクライアントが1週間以上オフラインであることは滅多にありません。
軽クライアントのための最小限の通信コストと計算コストを実現する新しい実用システムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:10:00 GMT)
Practical Light Clients for Committee-Based Blockchains [1.4] ほとんどのライトクライアントが1週間以上オフラインであることは滅多にありません。
軽クライアントのための最小限の通信コストと計算コストを実現する新しい実用システムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:10:00 GMT)
Misleading Ourselves: How Disinformation Manipulates Sensemaking [1.4] 本稿では、オンライン視聴者が新規、不確実、曖昧な情報を理解する能力を破壊することによって、偽情報がどのように機能するかを説明する。
正確な説明にまつわるもっともらしい説明に対する感覚の指向がいかにして操作に弱いかを説明する。
我々は、ひとつのイベントだけでなく、未来の多くのイベントに対して、どのように深層物語がセンスメイキングを形作るかを実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:52:58 GMT)
A Scientific Machine Learning Approach for Predicting and Forecasting Battery Degradation in Electric Vehicles [1.4] 我々は,Scientific Machine Learningフレームワークを用いて,電池劣化の予測と長期予測を行う新しい手法を提案する。
我々は、予測と予測の両方が実用的な条件を反映していることを保証するために、地中真実データを組み込んだ。
我々のアプローチは、エネルギーシステムの持続可能性に貢献し、よりクリーンで責任あるエネルギーソリューションへの世界的移行を加速させる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:57:59 GMT)
Building Trust in Black-box Optimization: A Comprehensive Framework for Explainability [1.4] 代理最適化(SO)は共通の解決法であるが、その独自性は説明可能性と透明性の欠如につながっている。
EmphInclusive Explainability Metrics for Surrogate Optimization (IEMSO)を提案する。
これらのメトリクスは、SOアプローチの透明性、信頼性、説明可能性を高める。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:20:17 GMT)
Error Free Quantum Target Finding: When Sequential Detection Meets High Dimensional Entanglement [1.4] 本稿では,高次元ベル状態を用いたLidarアプリケーションにおける目標探索と測位のための新しい手法を提案する。
この結果は、偽陽性を抑制する高次元エンタングルメントの相乗効果と、エネルギー使用を最適化する逐次決定規則に起因している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:20:54 GMT)
Using Sentiment and Technical Analysis to Predict Bitcoin with Machine Learning [1.3] 本研究は,暗号通貨予測における感情指標の重要性に関する予備研究である。
我々は、Fear & Greedy Index、市場感情の指標、技術分析指標、および機械学習アルゴリズムの可能性を組み合わせることで、Bitcoin価格を予測する新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:13:07 GMT)
Modelling 1/f Noise in TRNGs via Fractional Brownian Motion [1.3] この論文は、原子時計物理学者バーンズとアランの基礎研究に基づいている。
TRNG(True Random Number Generators)において、1/fのノイズをモデル化し、暗号化セキュリティを評価するための、高度にスケーラブルで数値的に正確なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:38:34 GMT)
MultiOrg: A Multi-rater Organoid-detection Dataset [1.3] このデータセットは、400以上の高解像度の2D顕微鏡画像と、6万以上のオルガノイドのアノテーションからなる。
さらに、私たちはオルガノイド検出のためのベンチマークを提供し、人気のある画像視覚化ツールであるNapariの、容易にインストール可能でインタラクティブなプラグインを通じて、最高のモデルを利用できるようにします。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:05:03 GMT)
Advocating Character Error Rate for Multilingual ASR Evaluation [1.3] 本稿では,単語誤り率(WER)の限界を評価指標として記述し,文字誤り率(CER)を主指標として提唱する。
我々は,CERがWERが直面している課題の多くを回避し,書き込みシステム全体の一貫性を示すことを示す。
以上の結果から,多言語ASR評価においてCERを優先的に,少なくとも補足すべきであることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:54:56 GMT)
Advocating Character Error Rate for Multilingual ASR Evaluation [1.3] 本稿では,単語誤り率(WER)の限界を評価指標として記述し,文字誤り率(CER)を主指標として提唱する。
我々は,CERがWERが直面している課題の多くを回避し,書き込みシステム全体の一貫性を示すことを示す。
以上の結果から,多言語ASR評価においてCERを優先的に,少なくとも補足すべきであることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:54:56 GMT)
Spatio-Temporal Analysis of Concurrent Networks [1.2] 多くの大規模システムは、人間と自律的ソフトウェアエージェントが協力するサイバー物理システムのネットワークである。
人間の協力を安全にするためには、システムは厳格なリアルタイムおよび実空間特性を持つプロトコルに従う必要がある。
本稿では,時間-時間特性のモデル化と,解析ツールを用いたモデルチェックとシミュレーションについて述べる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:40:24 GMT)
Impact of imperfect annotations on CNN training and performance for instance segmentation and classification in digital pathology [1.2] 病理組織像における核の検出・分節化・分節化を併用した作業において,ノイズアノテーションが最先端CNNモデルの訓練・性能に与える影響について検討した。
この結果から, モデル性能の過度な適合や維持を回避する上で, 注釈付き小セットの有効利用が有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:51:10 GMT)
Categorical composable cryptography: extended version [1.2] 我々は、カテゴリ理論の観点から、暗号のシミュレーションパラダイムを定式化する。
抽象攻撃に対してセキュアなプロトコルが対称なモノイダルカテゴリを形成することを示す。
我々のモデルは、計算セキュリティ、設定された仮定、および様々な攻撃モデルを組み込むことができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:47:36 GMT)
SYNOSIS: Image synthesis pipeline for machine vision in metal surface inspection [1.2] 本研究では,表面検査のための画像合成手法を詳細に記述した完全なパイプラインを提案する。
パイプラインは、加工およびサンドブラスト加工されたアルミニウム表面に対して詳細に評価されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:46:12 GMT)
Individualized Multi-Treatment Response Curves Estimation using RBF-net with Shared Neurons [1.1] 反応曲線の非パラメトリックモデリングは、共有された隠れニューロンを持つ放射基底関数(RBF)-ネットに依存している。
本手法をMIMICデータに適用し, 在宅中絶患者に対するICU滞在時間と12時間SOFAスコアに対する異なる治療方法の効果に関する興味深い知見を得た。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:11:15 GMT)
Quantum Universally Composable Oblivious Linear Evaluation [1.1] 本稿では, 量子オブリバスト転送に依存しない線形評価のための量子プロトコルを提案する。
我々のプロトコルは高次元量子状態を用いて、素数次元と素数次元のガロア場上の f (x) を鮮明に計算する。
量子ユニバーサルコンポーザビリティの枠組みにおいて,静的なセキュリティを持つプロトコルを実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:02:33 GMT)
Overcoming Slow Decision Frequencies in Continuous Control: Model-Based Sequence Reinforcement Learning for Model-Free Control [1.1] 本稿では、与えられた入力状態に対するアクションのシーケンスを生成するために設計されたRLアルゴリズムであるSequence Reinforcement Learning(SRL)を紹介する。
SRLは、異なる時間スケールで動作するモデルとアクタークリティカルアーキテクチャの両方を利用することで、アクションシーケンスを学習する際の課題に対処する。
我々は,SRLを一連の連続制御タスクで評価し,その性能が最先端のアルゴリズムに匹敵することを示した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:35:53 GMT)
Overcoming Slow Decision Frequencies in Continuous Control: Model-Based Sequence Reinforcement Learning for Model-Free Control [1.1] 本稿では、与えられた入力状態に対するアクションのシーケンスを生成するために設計されたRLアルゴリズムであるSequence Reinforcement Learning(SRL)を紹介する。
SRLは、異なる時間スケールで動作するモデルとアクタークリティカルアーキテクチャの両方を利用することで、アクションシーケンスを学習する際の課題に対処する。
我々は,SRLを一連の連続制御タスクで評価し,その性能が最先端のアルゴリズムに匹敵することを示した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:35:53 GMT)
English offensive text detection using CNN based Bi-GRU model [1.1] FacebookやTwitterのようなソーシャルネットワークサイトは、ワンクリックで大量のコンテンツを共有できるプラットフォームを提供している。
これらのプラットフォームは、アップロードされたコンテンツに制限を課していない。
テキストが攻撃的であるか否かを分類する新しいBi-GRU-CNNモデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:45:39 GMT)
English offensive text detection using CNN based Bi-GRU model [1.1] FacebookやTwitterのようなソーシャルネットワークサイトは、ワンクリックで大量のコンテンツを共有できるプラットフォームを提供している。
これらのプラットフォームは、アップロードされたコンテンツに制限を課していない。
テキストが攻撃的であるか否かを分類する新しいBi-GRU-CNNモデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:45:39 GMT)
CELI: Controller-Embedded Language Model Interactions [1.1] Controller-Embedded Language Model Interactions (CELI)は、制御ロジックを直接言語モデルプロンプトに統合するフレームワークである。
CELIは既存のプロンプトエンジニアリングとワークフロー最適化の限界に対処する。
ケーススタディでは、さまざまな領域で顕著なパフォーマンス改善が示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:29:56 GMT)
Transversal non-Clifford gates for quantum LDPC codes on sheaves [1.1] 量子コンピューティングの大きな目標は、フォールトトレラントな量子コンピュータを構築することである。
1つのアプローチは、非クリフォードゲートをサポートする量子低密度パリティチェック(qLDPC)コードである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:31:19 GMT)
Blockchain-Based Trust and Transparency in Airline Reservation Systems using Microservices Architecture [1.0] 本研究は,分散データベースやトランザクションの永久記録,プログラムのコードを通じて実行されるトランザクション条項など,ブロックチェーン技術の主要なコンポーネントについて検討する。
その結果、コンセンサスプロセスと耐性データ生成の結果、予約のバリエーションが30%減少し、データ同期が向上した。
システムのアーキテクチャには1ポイントの障害はなく、信頼性は98%を超えている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:58:22 GMT)
A Hybrid Feature Fusion Deep Learning Framework for Leukemia Cancer Detection in Microscopic Blood Sample Using Gated Recurrent Unit and Uncertainty Quantification [1.0] 白血病は、顕微鏡で血液や骨髄の腫れを分析して診断され、さらなる細胞化学的検査によって確認される。
深層学習は、白血病細胞の検出を補助する、顕微鏡スミア画像を分類する高度な方法を提供している。
本研究では,急性リンパ性白血病(ALL)の分類のためのハイブリッドディープラーニングモデルを構築した。
提案手法は、ALL-IDB1データセットで100%、ALL-IDB2データセットで98.07%、組み合わせたデータセットで98.64%という顕著な検出精度を達成した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:23:34 GMT)
Multifidelity Kolmogorov-Arnold Networks [1.0] マルチフィデリティ・コルモゴロフ・アルノルドネットワーク(KAN)は、低フィデリティモデルと少量の高フィデリティデータを用いて、高フィデリティデータのモデルを正確に訓練する。
トレーニングデータを用いることなく, 物理インフォームド・カン(PIKAN)の精度向上に多元性 Kan が有効であることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:23:51 GMT)
The pretty bad measurement [1.0] かなり良い測定値とかなり悪い測定値の両方が、それぞれのタスクについて盲目で推測するよりも、常に悪いことであることを示す。
応用として、量子状態異常検出問題にかなり悪い測定を適用し、かなり悪い量子ビットを避ける方法を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:55:48 GMT)
Adapting Multilingual LLMs to Low-Resource Languages using Continued Pre-training and Synthetic Corpus [1.0] ヒンディー語と英語の両方をサポートするバイリンガルSLMであるNemotron-Mini-Hindi 4Bを紹介する。
ベースモデルとインストラクションモデルの両方がヒンディー語のベンチマークで最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:35:19 GMT)
Quantum LDPC Codes with Transversal Non-Clifford Gates via Products of Algebraic Codes [0.9] 我々は、長さ$N$、次元$Kgeq N1-epsilon$、距離$Dgeq N1/r/namepoly(log N)$、安定化器重量$wleqoperatorname(log N)$をサポートする量子LDPC符号の明示的な無限族を構築する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:52:59 GMT)
Transfer Learning on Transformers for Building Energy Consumption Forecasting -- A Comparative Study [0.9] 本研究では,トランスフォーマーアーキテクチャへのトランスファーラーニング(TL)の適用について検討した。
バニラトランスフォーマーアーキテクチャに加えて、時系列予測用に特別に設計されたInformerとPatchTSTについても実験を行った。
実験結果から、TLは一般的に有用であるが、特に対象ドメインにデータがない場合には、TL戦略を慎重に選択して最大限の利益を得る必要があることが明らかとなった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:26:04 GMT)
Similarity and Quality Metrics for MR Image-To-Image Translation [0.9] 合成画像評価のための11の類似度(参照)と12の品質(非参照)を定量的に分析した。
本研究では,11種類の歪みおよび典型的なMRアーチファクトに対する感度について検討し,各計量および歪みに対する異なる正規化法の影響を解析した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:25:31 GMT)
Generalization Error in Quantum Machine Learning in the Presence of Sampling Noise [0.9] Eigentask Learningはサンプリングノイズの存在下で学習するためのフレームワークである。
入力トレーニングデータセットと出力計測サンプリングショットの両方が有限である場合、汎用量子機械学習システムのトレーニングおよび一般化誤差を算出する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:48:24 GMT)
Asymptotic relaxation in quantum Markovian dynamics [0.8] 有限時間間隔で非マルコフ性を示す任意のマスター方程式は、我々のアプローチにより等しく扱うことができることを示す。
発見はマルコフのケースを超えたより一般的な緩和理論の展開の道を開く。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:20:04 GMT)
Explicit error bounds with commutator scaling for time-dependent product and multi-product formulas [0.8] 我々は、スムーズな時間依存ハミルトニアンに対する一般的なPFの明示的な誤差を導出する。
私たちの結果は、量子コンピュータの様々な応用に光を当てます。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:48:21 GMT)
Privacy-Preserving Decentralized AI with Confidential Computing [0.8] 本稿では、Atoma Network内のCC(Confidential Computing)を用いた分散人工知能(AI)におけるプライバシ保護について述べる。
CCはハードウェアベースのTrusted Execution Environments (TEE)を活用して、機密データ処理の分離を提供する。
私たちはどのようにしてTEEをAtomaの分散フレームワークに統合できるかを検討します。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:33:05 GMT)
Self-Satisfied: An end-to-end framework for SAT generation and prediction [0.7] 高速SAT問題生成のためのハードウェアアクセラレーションアルゴリズムと幾何SAT符号化を導入する。
これらの進歩により、何千もの変数と数万の節でSAT問題へのアプローチをスケールできます。
私たちの研究の基本的な側面は、SATデータの本質と、機械学習モデルのトレーニングに適合する可能性に関するものです。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:25:54 GMT)
Frequency- and dissipation-dependent entanglement advantage in spin-network Quantum Reservoir Computing [0.7] 線形および非線形メモリタスクにおける量子貯水池計算(QRC)のためのIsingスピンネットワークの性能について検討する。
量子絡み合いにより、スピンネットワーク量子貯水池はより多くの時間的特徴を記憶することができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:23:27 GMT)
syren-new: Precise formulae for the linear and nonlinear matter power spectra with massive neutrinos and dynamical dark energy [0.7] 現在および将来の大規模構造調査は、ニュートリノ質量とダークエネルギーの状態の方程式を制約することを目的としている。
宇宙パラメータの関数として線形および非線形物質パワースペクトルに対する正確かつ解釈可能な記号近似を構築した。
本研究は, 線形および非線形物質パワースペクトルに対する電流シンボル近似の精度, 速度, 適用範囲を大幅に改善する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:22:38 GMT)
MK-SGN: A Spiking Graph Convolutional Network with Multimodal Fusion and Knowledge Distillation for Skeleton-based Action Recognition [0.6] 本稿では,MK-SGN(Multimodal Fusion and Knowledge Distillation)を用いたスポーキンググラフ畳み込みネットワークを提案する。
提案手法は、スパイキングニューラルネットワーク(SNN)のエネルギー効率とGCNのグラフ表現能力とを融合することにより、認識精度を維持しながらエネルギー消費量を削減する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:17:29 GMT)
Stochastic Error Cancellation in Analog Quantum Simulation [0.6] シミュレータの実際のハミルトニアンが対象のハミルトニアンと異なる誤差モデルを考える。
誤差キャンセルにより、誤差は線形ではなく、キュービット数の平方根としてスケールすることを示す。
また,時間進化の終端における目標状態とノイズの存在下で得られる実状態との間には,誤りの解消が生じることも示している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:29:55 GMT)
Beyond the Labels: Unveiling Text-Dependency in Paralinguistic Speech Recognition Datasets [0.6] 本稿では、機械学習モデルが真にパラ言語的特徴を特定することを学んでいるという前提を批判的に評価する。
これらのデータセットの語彙的重複を調べ、機械学習モデルの性能をテストすることにより、特性ラベル付けにおける重要なテキスト依存性を明らかにする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:46:05 GMT)
ViConsFormer: Constituting Meaningful Phrases of Scene Texts using Transformer-based Method in Vietnamese Text-based Visual Question Answering [0.6] テキストベースのVQAの主な課題は、シーンテキストの意味と情報を活用することである。
近年の研究では、画像中のシーンテキストの空間的情報を考慮することでこの問題に対処している。
ベトナム語で書かれたシーンテキストからの情報を効果的に活用する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:00:03 GMT)
KeyInst: Keyword Instruction for Improving SQL Formulation in Text-to-SQL [0.6] KeyInstは、最後のクエリの一部である可能性が高いピボットキーワードに関するガイダンスを提供する。
SQLの定式化評価に特化して設計されたベンチマークであるStrucQLを開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:45:36 GMT)
On time series clustering with k-means [0.6] 時系列クラスタリングアルゴリズムは、様々な方法で構成されたk平均で表されることが多い。
この変数は、k-平均はその構成に非常に敏感であることが知られているため、研究を比較するのが困難である。
本稿では,エンドツーエンドアプローチを採用したTSCLの標準ロイドモデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:24:07 GMT)
Bin-Conditional Conformal Prediction of Fatalities from Armed Conflict [0.5] 両条件共形予測(bin-conditional conformal prediction)と呼ぶ共形予測アルゴリズムを新たに導入する。
この手法により,任意の予測モデルに対して,個々のレベルの予測間隔を得ることができる。
両条件共形予測アルゴリズムを用いて、武装紛争による死亡率の予測を行う。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:41:42 GMT)
Comparative Evaluation of Clustered Federated Learning Method [0.5] CFL(Clustered Federated Learning)は、クライアントを均質なグループに分割することを目的としている。
本稿では,2つの最先端CFLアルゴリズムの性能について,フェデレートラーニング(FL)におけるデータ不均一性の分類法を提案する。
我々の目的は、CFLのパフォーマンスとデータ異種シナリオの関係をより明確に理解することである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:01:56 GMT)
Can Large Language Models Generate Geospatial Code? [0.5] 本稿では,大規模言語モデルの地理空間コード生成能力を評価するフレームワークであるGeoCode-Evalを紹介する。
ベンチマークデータセットであるGeoCode-Benchを開発し、5000のマルチチョイス、1500のフィリング・イン・ザ・ブランク、1500の真偽質問、1000の主観的タスクで構成された。
GeoCode-Benchを用いて、3つの商用クローズドソースLCM、4つのオープンソース汎用LCM、14の特殊コード生成モデルを評価した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:49:24 GMT)
Many-body enhancement of energy storage in a waveguide-QED quantum battery [0.5] 量子電池として機能する導波路-QED系の異なる構成について検討する。
集合的な効果は、電池の自己放電時間を遅くする可能性がある。
どちらの構成でも、集合効果は光学系のエネルギー保護特性を高めるために用いられる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:56:26 GMT)
Timeseria: an object-oriented time series processing library [0.4] TimeseriaはPythonで実装されたオブジェクト指向の時系列処理ライブラリである。
時系列データを操作しやすくし、その上に統計的および機械学習モデルを構築することを目指している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:18:01 GMT)
Timeseria: an object-oriented time series processing library [0.4] TimeseriaはPythonで実装されたオブジェクト指向の時系列処理ライブラリである。
時系列データを操作しやすくし、その上に統計的および機械学習モデルを構築することを目指している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:18:01 GMT)
Constrained Recurrent Bayesian Forecasting for Crack Propagation [0.4] 本稿では,レール上のひび割れ長さの時間的変化を予測するために,頑健なベイズ多水平法を提案する。
鉄道整備におけるモデルの信頼性を高めるため、具体的な制約が組み込まれている。
この結果から,予測精度と制約コンプライアンスのトレードオフが明らかとなり,モデルトレーニングにおける不確実な意思決定プロセスが浮き彫りになった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:15:53 GMT)
Efficient Annotator Reliability Assessment and Sample Weighting for Knowledge-Based Misinformation Detection on Social Media [0.3] 本研究は,誤情報検出に対する知識に基づくアプローチを取り入れ,自然言語推論の手法と類似した問題をモデル化する。
EffiARAアノテーションフレームワークは、アノテーション間の合意とアノテーション間の合意を利用して、各アノテーションの信頼性を理解することを目的としている。
本研究は,アノテータ信頼度を用いたサンプル重み付けが,アノテータ間およびアノテータ内合意とソフトラベルトレーニングの両方を活用することにより,最良であることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:54:40 GMT)
The State of Factoring on Quantum Computers [0.3] 本稿では,デジタルおよびアナログ量子コンピュータにおけるファクタリング整数の現状について報告する。
ディジタル量子コンピュータでは、ショアの因数分解が失敗することを正式に証明できる誤りの影響について研究する。
アナログ量子コンピュータでは、3つの因数分解法を実験的に検証し、ランダムな推測よりも絶対的かつ指数的に優れたスケーリング性能を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:01:45 GMT)
LUCI in the Surface Code with Dropouts [0.3] 本稿では,耐故障性回路を構築するためのフレームワークLUCIを提案する。
LUCIは格子的に不完全な量子ビットカップラを持つ表面符号回路に適応するために使用することができる。
LUCI は 1-in-a-trillion の論理符号ブロック誤り率に到達するために,物理量子ビットをほとんど必要としないことを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:29:37 GMT)
Boosting K-means for Big Data by Fusing Data Streaming with Global Optimization [0.3] K平均クラスタリングはデータマイニングの基盤であるが、その効率は大量のデータセットに直面すると悪化する。
可変近傍探索(VNS)メタヒューリスティックを利用して,K平均クラスタリングをビッグデータに最適化する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:43:34 GMT)
Flame quality monitoring of flare stack based on deep visual features [0.3] 燃焼効率のモニタリングは環境保護にとって非常に重要である。
従来のセンサーによる監視方法は高価であるだけでなく、厳しい燃焼環境でも容易に損傷する。
本稿では,炎と煙の面積比,火のRGB情報,火の角度など,視覚的特徴のみを用いて火の質を監視することを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:49:56 GMT)
CybORG++: An Enhanced Gym for the Development of Autonomous Cyber Agents [0.2] CybORG++は、ネットワーク防御に焦点を当てた強化学習研究のための高度なツールキットである。
CAGE 2 CybORG環境上に構築され、重要な改善が導入されている。
MiniCAGEはパフォーマンスを劇的に改善し、並列イテレーションの実行を最大1000倍高速化する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:04:07 GMT)
From Test-Taking to Test-Making: Examining LLM Authoring of Commonsense Assessment Items [0.2] LLMをコモンセンス評価項目の著者とみなす。
我々はLLMに対して、コモンセンス推論のための顕著なベンチマークのスタイルでアイテムを生成するよう促す。
元のCOPAベンチマークの回答に成功するLCMも、自分自身の項目のオーサリングに成功していることがわかった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:42:23 GMT)
Not Sure Your Car Withstands Cyberwarfare [0.2] 本論文は, 車両の運転者データ保護を良好に評価することを目的としている。
同社は、BMWやメルセデスといった主要自動車メーカーのプライバシーポリシーのギャップを分析することで、その目標を要件レベルで追求している。
いずれのブランドも、いかに多くの記事に準拠しているかについては、いまだに不正確であり、従ってコンプライアンスは、しばしば検証不可能である。
これらの発見の解釈は、サイバー戦争が勃発すれば、あなたの車があなたの車に逆らう可能性があるという、あり得ない可能性である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:29:39 GMT)
Novel Development of LLM Driven mCODE Data Model for Improved Clinical Trial Matching to Enable Standardization and Interoperability in Oncology Research [0.2] がんの費用は2023年だけで2080億ドルを超える。
腫瘍学における臨床試験および臨床医療に関する伝統的な手法は、しばしば手作業、時間、データ駆動アプローチの欠如である。
本稿では,がん領域の標準化,相互運用,交換を効率化するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:31:35 GMT)
Enhancing In-vehicle Multiple Object Tracking Systems with Embeddable Ising Machines [0.1] フレキシブルな割り当て機能を備えた車内複数物体追跡システムについて述べる。
このシステムは、シミュレート・バイフルケーション(simulated bifurcation)と呼ばれる量子インスパイアされたアルゴリズムに基づく埋め込み可能なIsingマシンに依存している。
車両搭載型コンピューティングプラットフォームを用いて,拡張機能を備えたリアルタイムシステムワイドスループット(平均23フレーム/秒)を実演する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:18:27 GMT)
An abstract structure determines the contextuality degree of observable-based Kochen-Specker proofs [0.1] この記事では、与えられた可換関係を満たす超グラフ頂点にパウリ可観測物を割り当てることで得られるコチェン=スペクターの定理の証明に焦点を当てる。
最初の結果は、与えられたハイパーグラムの条件を満たすこれらの量子ラベリングが本質的に同じ文脈性を持っていることである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:45:31 GMT)
Good Parenting is all you need -- Multi-agentic LLM Hallucination Mitigation [0.1] 本研究では,大規模言語モデル(LLM)エージェントによるAI生成コンテンツの幻覚の検出と修正能力について検討する。
各種のプライマリエージェントとレビューエージェントの組み合わせを含む4900回のテスト実行では、高度なAIモデルは幻覚を識別する上でほぼ完璧に正確であることを示した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:18:18 GMT)
Universal quantum computation using Ising anyons from a non-semisimple Topological Quantum Field Theory [0.1] 新たに発見された2+1次元の位相量子場理論の非半単純アナログを用いた位相量子計算の枠組みを提案する。
非半単純理論はIsingフレームワークを拡張する新しいエノン型を導入することを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 21:03:07 GMT)
You Only Look Twice! for Failure Causes Identification of Drill Bits [0.0] 本研究では,異なるブレードの画像を用いたドリルビット故障の原因について検討した。
このプロセスでは、カッターにそれぞれの位置と損傷タイプをアノテートする。
完全な自動パイプラインの統合は、24の障害原因の100%をうまく特定しました。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:39:49 GMT)
Wigner-function formalism for the detection of single microwave pulses in a resonator-coupled double quantum dot [0.0] 理論的には単一マイクロ波パルスの光検出を解析する。
我々は、時間-エネルギーの不確実性関係に応じて、入射光子の時間と周波数を検知するトレードオフを見出した。
DQD-共振器ハイブリッド系における電子と相互作用するマイクロ波光子の時間依存性について考察した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:35:42 GMT)
Wide-field microwave magnetic field imaging with nitrogen-vacancy centers in diamond [0.0] マイクロ波(MW)磁場のマイクロスケール横方向分解能の非侵襲イメージングは、様々な用途において重要である。
NV中心磁力計は、$mu$mスケールの解像度、ミリスケールの視野、高感度、そして様々なサンプルと互換性のない非侵襲イメージングを提供する理想的なツールとして登場した。
本研究は, 差動レービ周波数測定に基づく新しいNV磁気メトリープロトコルを実証し, 弱いMW磁場の画像化にNV広視野イメージング能力を拡張した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:00:35 GMT)
WeSpeR: Population spectrum retrieval and spectral density estimation of weighted sample covariance [0.0] 重み付きサンプル共分散のスペクトル分布$F$が$mathbbR*$の連続密度を持つことを示す。
計算手順を提案し、$F$のサポートを判定し、その上で効率的なグリッドを定義する。
我々はこの手法を用いて、スペクトル密度を推定し、真のスペクトル共分散スペクトルを検索する$textitWeSpeR$アルゴリズムを設計する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:26:51 GMT)
Wave turbulence in driven dipolar gases [0.0] 誘導された3次元双極子気体の非平衡乱流応答は、超固体-超流動相転移を動的に横切ることによって監視される。
我々は、ロートン最小値に付随する高層モーメントを持続する超固体が乱流の出現を促進することを観察した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:33:34 GMT)
Using sensitive data to debias AI systems: Article 10(5) of the EU AI Act [0.0] EUの新しいAI法は2024年6月に発効した。
プロバイダがトレーニング、検証、テストデータセットが一定の品質基準を満たすかどうかを評価するための新たな義務。
第10条(5)AI法の新たな規定により、プロバイダは機密データを収集して義務を果たすことができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:30:40 GMT)
Two-dimensional many-body localized systems coupled to a heat bath [0.0] 本研究では,2次元多体局在系と有限熱浴とのカップリング効果について数値解析を行った。
具体的には、超低温ボソンの2成分を用いた光学格子実験をシミュレートする。
共振器の存在と整合した多体局在状態における量子的相互情報の分布を観察する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:47:13 GMT)
Transfer Learning Adapts to Changing PSD in Gravitational Wave Data [0.0] 重力波データのノイズは、信号の識別において大きな課題となる。
従来のノイズ抑圧法は、データ中の非ガウス効果に完全に対処するのに不足することが多い。
複雑な雑音の中で重力波を正確に検出する新しい訓練手法を開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:08:01 GMT)
Topological obstruction to the training of shallow ReLU neural networks [0.0] 損失ランドスケープの幾何学と単純なニューラルネットワークの最適化軌跡との相互作用について検討する。
本稿では,勾配流を用いた浅部ReLUニューラルネットワークの損失景観におけるトポロジカル障害物の存在を明らかにする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:17:48 GMT)
Toolshed: Scale Tool-Equipped Agents with Advanced RAG-Tool Fusion and Tool Knowledge Bases [0.0] 強化されたツール表現を格納するように設計されたツール知識ベース(ベクトルデータベース)であるToolshed Knowledge Basesを紹介する。
RAG-Tool Fusion(Advanced RAG-Tool Fusion)も提案する。
このアプローチでは,ToolEシングルツール,ToolEマルチツール,Seal-Toolsベンチマークデータセットの46%,56%,絶対的な改善を実現しています。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:44:22 GMT)
Tighter Lower Bounds on Quantum Annealing Times [0.0] 量子アニール器がターゲットハミルトニアンの基底状態を作るのに必要な時間に基づいて下界を導出する。
境界はアニールの力学の知識なしで計算可能であり、場合によってはシステムのサイズに合わせてスケールする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:00:07 GMT)
This Candidate is [MASK]. Letters of Reference and Job Market Outcomes using LLMs [0.0] ランダムな森林を用いて、手紙の品質と長さの両方が、雇用市場の成功を予測できることを示します。
顧問による書状は、他の審判による書状と同じくらい重要と思われる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:03:46 GMT)
The Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency, and Usability in Artificial Intelligence [0.0] モデルの完全性とオープン性に基づいて機械学習モデルを評価する3階層分類システムであるモデルオープンネスフレームワーク(MOF)を紹介する。
各MOFクラスに対して、モデル開発ライフサイクルのコード、データ、ドキュメントコンポーネントを定義します。
さらに、モデルオープンネスツール(MOT)は、MOF分類システムに対するモデルのオープン性と完全性を評価するために、ユーザフレンドリーなリファレンス実装を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:20:22 GMT)
Tailoring fusion-based photonic quantum computing schemes to quantum emitters [0.0] 核融合に基づく量子計算は、核融合ゲートによって小さなフォトニック資源状態が同時に絡み合って測定される、有望な量子計算モデルである。
本稿では,量子エミッタの能力とノイズモデルに合わせた融合型アーキテクチャを提案する。
本研究は,光子損失の8%,エミッタの光子識別率の4%,メモリエラーのはるかに高いスピンノイズ閾値といった,物理誤差機構に対する高い耐性を実現することができることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:18:15 GMT)
Tailoring fusion-based photonic quantum computing schemes to quantum emitters [0.0] 核融合に基づく量子計算は、核融合ゲートによって小さなフォトニック資源状態が同時に絡み合って測定される、有望な量子計算モデルである。
その結果,光子損失の8%,エミッタの光子識別率の4%,コヒーレンス時間よりはるかに低いスピンノイズ閾値が得られた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:18:15 GMT)
TIMeSynC: Temporal Intent Modelling with Synchronized Context Encodings for Financial Service Applications [0.0] NMT変換器は、コンテキストを符号化し、長距離依存を表現するための次の最良のアクションを復号することで、最先端のシーケンシャルな表現学習を実現する。
本稿では,金融サービスアプリケーションにおけるコンテキストおよびシーケンシャルな意図予測の課題に対処するエンコーダ・デコーダ・トランスフォーマモデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:05:47 GMT)
Systematic many-fermion Hamiltonian input scheme and spectral calculations on quantum computers [0.0] 本稿では、相対論的あるいは非相対論的な多重フェルミオン系の一般第二量子化ハミルトニアンに対する新しい入力スキームを提案する。
入力方式に基づいて,将来の量子ハードウェア上でのスペクトル計算のためのハイブリッド量子古典的フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:55:24 GMT)
Synthetic Data Generation in Cybersecurity: A Comparative Analysis [0.0] GANベースの手法、特にCTGANとCopulaGANは、忠実性と実用性の観点から非AIおよび従来のAIアプローチより優れている。
本研究は,サイバーセキュリティネットワークトラフィックデータに特化して,これらの手法の比較評価を行うことにより,この分野に寄与する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:19:25 GMT)
SwaQuAD-24: QA Benchmark Dataset in Swahili [0.0] 本稿では,Swahili Question Answering (QA)ベンチマークデータセットの作成を提案する。
このデータセットは、スワヒリの言語的多様性と複雑さを捉える高品質で注釈付き質問応答ペアを提供することに重点を置いている。
データプライバシ、バイアス緩和、インクリシティといった倫理的配慮が、データセット開発の中心である。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:49:24 GMT)
Strong photon coupling to high-frequency antiferromagnetic magnons via topological surface states [0.0] 反強磁性マグノンとマイクロ波共振器光子との強い結合性を示す。
この結果により、高周波キャビティマグンの周波数の利用が促進され、量子情報技術への組み入れが可能となる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:00:08 GMT)
Strain-induced dynamic control over the population of quantum emitters in two-dimensional materials [0.0] 本稿では、WSe2単層膜を圧電体柱に集積するハイブリッド半導体圧電素子を提案する。
本研究は,2次元材料に基づく単一光子源の輝度を動的に制御する方法を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:59:09 GMT)
Stochastic parameter optimization analysis of dynamical quantum critical phenomena in long-range transverse-field Ising chain [0.0] 一次元長次元逆場イジングモデルの量子相転移について検討する。
シミュレーションでは, 臨界点と普遍性に関する事前知識がなくても, サンプリング対象のパラメータを自動的に決定する。
後者の2つの普遍性境界として$sigma = 7/4$を支持する数値的な証拠を得ることに成功した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:32:22 GMT)
Stochastic Quasi-Newton Optimization in Large Dimensions Including Deep Network Training [0.0] 大規模設計空間上で定義される非滑らかでおそらくは非滑らかな目的関数に対する新しい次元を提案する。
FINDER (Derivative-free Evolutionary Recursion and Derivative-free filtering equations to reach a derivative-free update that has similar with the Newton)
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:25:28 GMT)
Spoofing of Quantum Channels Enables Low-Rank Projective Simulation [0.0] 我々は、シンクホーンのようなアルゴリズムが、正しい結果の限界を生成する最小許容クラウスランクを見つけるのにどのように役立つかを示す。
一般的な$d$次元量子系の場合、これはクラウス階数を$d2$から$d$の理論的最小値に下げる。
コードが利用可能であり、オープンソースである私たちの発見を数値的に示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:02:46 GMT)
Spectral and Rhythm Features for Audio Classification with Deep Convolutional Neural Networks [0.0] 畳み込みニューラルネットワーク(CNN)はコンピュータビジョンで広く使われている。
デジタル画像から抽出したスペクトルおよびリズムの特徴を音響的分類に用いることができる。
メルスケール分光図、メル周波数ケプストラム係数(MFCC)のような異なるスペクトルおよびリズム特徴表現
ESC-50データセットと2,000のラベル付き環境オーディオ記録を用いて実験を行った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:47:40 GMT)
Spectral and Rhythm Features for Audio Classification with Deep Convolutional Neural Networks [0.0] 畳み込みニューラルネットワーク(CNN)はコンピュータビジョンで広く使われている。
デジタル画像から抽出したスペクトルおよびリズムの特徴を音響的分類に用いることができる。
メルスケール分光図, メル周波数ケプストラム係数 (MFCC) などのスペクトル・リズム特性の異なる表現について検討した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:47:40 GMT)
Solving the 2D Advection-Diffusion Equation using Fixed-Depth Symbolic Regression and Symbolic Differentiation without Expression Trees [0.0] 本稿では,固定深さのシンボルレグレッションと表現木を含まない記号微分を用いた2次元対流拡散方程式の解法を提案する。
異なる初期条件と境界条件を持つ2つのケースに適用され、その精度と近似解を効率的に見つける能力を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:11:17 GMT)
Social Dynamics of Consumer Response: A Unified Framework Integrating Statistical Physics and Marketing Dynamics [0.0] 本研究では,物理と社会心理学から派生した理論的枠組みを適用し,消費者行動の複雑な性質を考察する。
本稿では, 広告費と消費者反応の関係を, 対称性, スケーリング法則, 位相遷移といった概念を用いて捉える。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:33:19 GMT)
Simulating Time-dependent Hamiltonian Based On High Order Runge-Kutta and Forward Euler Method [0.0] H(t) = sum_i=1m gamma_i(t) H_i$ where $gamma_i(t)$ is bounded, Computable function of time $t$, and each $H_i$ is time-dependent。
我々の量子アルゴリズムは、時間間隔をサブインターバルに分割する高次ルンゲ・クッタ法とフォワード・オイラー法に基づいている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:31:57 GMT)
Side-gate modulation of supercurrent in InSb nanoflag-based Josephson junctions [0.0] InSbナノフラッグを用いたジョセフソン接合の接合部近傍にサイドゲートを配置した実験結果について報告する。
サイドゲートは、消散系と消散系の両方において、ジャンクションを介して効率よく電流を変調できることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:54:43 GMT)
Sentiment Analysis Based on RoBERTa for Amazon Review: An Empirical Study on Decision Making [0.0] 現状の自然言語処理(NLP)技術を利用して、Amazon製品レビューの感情分析を行う。
我々は、レビューの感情のトーンを正確に反映した感情スコアを導出するために、トランスフォーマーベースのモデルRoBERTaを採用している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 22:46:27 GMT)
Rank Suggestion in Non-negative Matrix Factorization: Residual Sensitivity to Initial Conditions (RSIC) [0.0] 我々はResidual Sensitivity to Intial Conditions (RSIC)と呼ばれる新しいアプローチを導入する。
RSICは、異なる初期化に対する相対残差の感度を分析することによって、潜在的に複数の興味の階級を提案する。
単一細胞遺伝子発現データ,画像データ,テキストデータなど,多様なデータセットを用いてRSICを評価し,現在ある最先端のランク決定手法と比較した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:18:57 GMT)
Quenching from superfluid to free bosons in two dimensions: entanglement, symmetries, and quantum Mpemba effect [0.0] 超流動相から自由ボソン状態への急激なクエンチ後の2次元光学格子中のボソンの非平衡ダイナミクスについて検討した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:00:01 GMT)
Quantum-annealing-inspired algorithms for multijet clustering [0.0] 電子-陽電子衝突イベントにおいて、複数のジェットをクラスタリングするための新しい量子アニール型アルゴリズムを導入する。
これらの量子アニーリングにインスパイアされたアルゴリズムの1つ、弾道的シミュレートされた分岐は、量子アニーリングアプローチによるマルチジェットクラスタリングで以前に観測された問題を克服する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:31:04 GMT)
Quantum information capacity in a 1D topological system [0.0] 1次元Su-Schrieffer-Hegger(SSH)トポロジカル絶縁体の温度効果について検討した。
熱アンサンブルのための量子情報処理(QIP)能力に着目した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:03:46 GMT)
Quantum evolution: terrestrial fine-tuning of magnetic parameters [0.0] 地球上の全ての生命は、磁場を含む特定の環境条件に結合した進化を共有している。
生体系に対する弱磁場の影響の1つのメカニズムはラジカル対機構であることが示唆されている。
ラジカル対のメカニズムは、磁場が化学反応の収量にどのように影響するかを記述するためにスピン化学の文脈で始まった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:12:40 GMT)
Quantum computation of SU(2) lattice gauge theory with continuous variables [0.0] SU(2)格子ゲージ理論の量子計算フレームワークを提案する。
離散キュービットの代わりに連続変数を活用してゲージ場の無限次元ヒルベルト空間を表現する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:29:39 GMT)
Quantum Entanglement, Quantum Teleportation, Multilinear Polynomials and Geometry [0.0] 量子状態は、分解できない多重線型絡み合いと関連していることを示す。
特に,ベル状態が非線形実マルチ線形フレームワークと関連していることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:47:44 GMT)
Pull-in features of nanoswitches in the Casimir regime with account of contact repulsion [0.0] ナノスウィッチのカンチレバー先端は静電気、弾性、ファンデルワールス(カシミール)および接触反発力によって考慮される。
ナノスウィッチは、電圧のオン/オフ時にプルインを伴わない安定した循環挙動を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:06:55 GMT)
Probing the massive scalar mode in the levitated sensor detector of gravitational wave [0.0] 最近設計された重力波の重力波検出装置 citeAggarwal は、スカラーモードとテンソルモードの両方を異なる周波数で検出する確率が高いことを示す。
光ビームの強度を調整することにより、高調波電位トラップの周波数を広く変化させることができる。
センサ質量の力学は、適切な検出器フレームにおける測地偏差方程式に従うことを実証する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:57:35 GMT)
Phenomenological quantum mechanics: deducing the formalism from experimental observations [0.0] ヒルベルト空間の構造に基づく完備かつ完備な形式主義を導出することは可能であることを示す。
得られた形式的記述(二軌道形式主義)は、標準的な状態中心の形式主義とは全く異なることが判明した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:17:30 GMT)
Parallel transport in rotating frames and projective holonomic quantum computation [0.0] 射影ゲートを用いた非線形ホロノミック量子計算のためのフレームワークを開発した。
我々は、等ホロノミック不等式を射影ゲートに拡張し、射影ホロノミック量子ゲートの最小実行時間を確立する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:39:24 GMT)
Optimizing importance weighting in the presence of sub-population shifts [0.0] トレーニングデータとテストデータの間の分散シフトは、機械学習モデルの性能を著しく損なう可能性がある。
トレーニングデータの有限標本サイズによる推定モデルのばらつきの増大を無視するため,既存の重み付けは準最適であると主張する。
重みとモデルパラメータを同時に最適化する二段階最適化手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:21:10 GMT)
Optimized continuous dynamical decoupling via differential geometry and machine learning [0.0] 連続的動的デカップリングのための最適設計フィールドを開発するための戦略を導入する。
一般の1量子ビット量子ゲートの忠実度を最大化する最適連続体構成を得る。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:45:28 GMT)
Optimal DLT-based Solutions for the Perspective-n-Point [0.0] パースペクティブn-point(Newton)を解くための修正直線形(DLT)アルゴリズムを提案する。
この修正は、線形系における異なる測定を解析的に重み付けし、計算負荷を無視できるほど増加させる。
当社のアプローチは、パフォーマンスとランタイムの両方の改善をクリアします。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:04:58 GMT)
On Debiasing Text Embeddings Through Context Injection [0.0] 我々は,そのバイアスを定量化し,文脈注入にどう反応するかを定量化することにより,19種類の埋め込みモデルのレビューを行う。
より高いパフォーマンスモデルはバイアスを捉えやすいが、コンテキストを組み込むのが優れていることも示している。
検索タスクでは,埋め込みのバイアスが望ましくない結果をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:26:55 GMT)
Noise resilience in adaptive and symmetric monitored quantum circuits [0.0] 本研究では,対称性遮断音の存在下での対称性保護吸収状態と電荷吸収遷移の運命について検討する。
ノイズの純効果は、コヒーレントかつ非コヒーレントな対称性破壊効果をもたらす。
現在の量子ハードウェアでは避けられないノイズがあるにもかかわらず、我々の発見は対称性が保護された位相を観測するための楽観的な展望を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:00:33 GMT)
Neuro-Symbolic Traders: Assessing the Wisdom of AI Crowds in Markets [0.0] 私たちは、深層生成モデルを使用して購入/販売決定を行う仮想トレーダーの形式を開発します。
我々の枠組みでは、ニューロシンボリックトレーダーは、視覚言語モデルを使用して資産の基本的価値のモデルを発見するエージェントである。
これは過去のデータと比べて価格の抑制につながっており、将来の市場の安定へのリスクを浮き彫りにしている」と述べた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:37:52 GMT)
Mind the Gap: Foundation Models and the Covert Proliferation of Military Intelligence, Surveillance, and Targeting [0.0] 我々は、個人識別可能な情報がISTAR能力に寄与するのを防ぐことができないことが、敵による軍事AI技術の使用と普及に繋がることを示した。
我々は、軍事システムを確保し、AI兵器の普及を制限するためには、軍用AIシステムと個人データを商業基盤モデルから絶縁する必要があると結論付けている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:04:30 GMT)
Metric Flows with Neural Networks [0.0] 我々は、ニューラルネットワーク勾配降下によって誘導されるリーマン計量の空間における流れの理論を開発する。
これは部分的には、Calabi-Yauメトリクスをニューラルネットワークで近似する進歩によるものである。
有限幅におけるよく学習された数値測定値が,特徴学習と関連するNTKの進化を示すことを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 20:21:22 GMT)
Megastable quantization in generalized pilot-wave hydrodynamics [0.0] 調和ポテンシャルの古典粒子は連続エネルギースペクトルを生じさせ、対応する量子粒子は数え切れないほど無限の量子化されたエネルギーレベルを示す。
近年、歩行液滴として生成する古典的非マルコフ波動粒子は、様々な流体力学的量子アナログを示すことが示されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:59:56 GMT)
Measuring the Angular Momentum of a Neutron Using Earth's Rotation [0.0] 地球回転と軌道角運動量(OAM)のカップリングは、スピンエコー干渉計を用いて発生した絡み合った中性子で観測される。
測定された結合は理論の5%以内であり、不確実性は7.2%である。
検出されたビームの逆OAMは4098 + 295 hbar A-1で、以前の中性子実験より5桁低い。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 10:45:20 GMT)
Maximizing Purity and Heralding Efficiency of Type-I Down-Converted Photons Using Beam Focal Parameters [0.0] タイプIのダウンコンバージョンでは、生成した光子は線形ポンプ分極に垂直な同じ線形分極を持つ。
非線型幾何学は、これらの指標を同時に最適化する自由度を与えることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:57:05 GMT)
Lower Complexity Adaptation for Empirical Entropic Optimal Transport [0.0] エントロピック最適輸送(EOT)は、非正規化最適輸送(OT)に代わる有効で計算可能な代替手段を示す
EOTコストの実証的なプラグイン推定のための新しい統計的境界を導出する。
この手法は経験的プロセス理論を用いており、単一関数クラス上の EOT の二重定式化に依存している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:30:19 GMT)
Local Thermal Operations and Classical Communication [0.0] 制御と通信量に応じて順序付けられたLTOCCの階層構造を導入する。
我々は、対称局所熱演算と古典的通信の詳細な解析を行う。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:47:02 GMT)
Large Language Models, scientific knowledge and factuality: A framework to streamline human expert evaluation [0.0] 本研究は,生物医学的背景知識と対話するための大規模言語モデルの可能性を探るものである。
フレームワークには3つの評価ステップが含まれており、それぞれが流布、即応的なアライメント、セマンティック・コヒーレンス、事実的知識、生成した応答の特異性という3つの側面を逐次評価する。
この研究は、ChatGPT、GPT-4、Llama 2を含む11の最先端のLLMを2つのプロンプトベースタスクで持つ能力に関する体系的な評価を提供する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:49:35 GMT)
Intrinsic mixed state topological order in a stabilizer system under stochastic decoherence [0.0] toric code state change to an intrinsic mixed state topological-ordered state (IMTO) state。
本研究は,2種類のフェミオン性エノンの存在を明らかにし,得られた臨界指数はIMTOとパーコレーションの強い関係を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:13:24 GMT)
Improving Graph Neural Networks by Learning Continuous Edge Directions [0.0] グラフニューラルネットワーク(GNN)は、従来、非指向グラフ上の拡散に似たメッセージパッシング機構を採用している。
私たちのキーとなる洞察は、ファジィエッジ方向をグラフのエッジに割り当てることです。
ファジィエッジを持つグラフを学習するためのフレームワークとして,Continuous Edge Direction (CoED) GNNを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 01:34:35 GMT)
Hyper-multi-step: The Truth Behind Difficult Long-context Tasks [0.0] Long-context Language Model (LCLM) はますます人気が高まっている。
長いコンテキストのベンチマークでは、最も先進的なLCLMでさえ完成に苦しむ課題が提示される。
本研究は, 主に2つの基本課題から生じる難易度を示す実験を行った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:09:31 GMT)
Hyper-multi-step: The Truth Behind Difficult Long-context Tasks [0.0] Long-context Language Model (LCLM) はますます人気が高まっている。
長いコンテキストのベンチマークでは、最も先進的なLCLMでさえ完成に苦しむ課題が提示される。
本研究は, 主に2つの基本課題から生じる難易度を示す実験を行った。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:09:31 GMT)
Human-Centric eXplainable AI in Education [0.0] 本稿では,教育現場における人間中心型eXplainable AI(HCXAI)について検討する。
学習成果の向上、ユーザ間の信頼の向上、AI駆動ツールの透明性確保における役割を強調している。
ユーザ理解とエンゲージメントを優先するHCXAIシステムの開発のための包括的なフレームワークを概説する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:02:47 GMT)
How to be a Copenhagenistic-QBistic Everettist? [0.0] より広い物理画像の文脈で量子計測を行おうとする。
このようにして、量子力学の主流解釈において、量子測定のどの側面が重要であるかを理解したい。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:49:19 GMT)
Hip Fracture Patient Pathways and Agent-based Modelling [0.0] デジタルソリューションは、日々の医療提供に影響を与えることなく、患者フローを最適化するための有望なソリューションを提供する。
エージェント・ベース・シミュレーションを用いて医療資源を最適化することを目的とした現在進行中のプロジェクトについて概説する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:15:50 GMT)
Hidden topology in flat-band topological insulators: strong, weak and square-root topological states [0.0] 本研究では、局所的な隠れキラル対称性によって保護された、未調査のトポロジカルな状態のクラスについて検討する。
それらのトポロジカル不変量が初めて導出され、これらの未同定対称性が標準キラル対称性と共に作用し、エンドモードの保護を増大させることができることを示す。
局所的な隠れ対称性により、ダイヤモンドネックレス鎖は、強、弱、正方形の3種類の位相的端モードを持つことが示される。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:46:07 GMT)
Hardness results for decoding the surface code with Pauli noise [0.0] 曲面符号に対する量子極大極大復号法(QMLD)と退化量子極大復号法(DQMLD)はそれぞれNP-hardと#P-hardであることを示す。
我々は、式を立方体依存のパウリノイズモデルと、公式の満足度特性を符号化するシンドロームの集合に変換する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 23:39:10 GMT)
HOUND: High-Order Universal Numerical Differentiator for a Parameter-free Polynomial Online Approximation [0.0] 本稿では,高次微分方程式系として表される数値微分器を紹介する。
微分器の順序を適度に選択することで、付加的な白色雑音を持つ信号に対して誤差はゼロに収束することを示した。
この数値微分の顕著な利点は、信号の特定の特性に基づいたチューニングパラメータを必要としないことである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:42:01 GMT)
Greedy receiver for photon-efficient optical communication [0.0] 局所最適グリードアルゴリズムに基づく新しい受信機を導入し、パルス位置変調に適用する。
受信機は、これまで提案された全ての信号強度系における戦略の誤差確率を低減し、検出プロセスの数値最適化による結果に匹敵する結果を得る。
深宇宙光通信のフォトン・スターベド状態特性において、グリーディ受信機は状態判別誤差の確率に基づいて量子最適ヘルストロームに接近する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:31:39 GMT)
Granger Causality in Extremes [0.0] 時系列における極端な事象から因果関係を特定するための厳密な枠組みを導入する。
本フレームワークは, 因果尾係数を利用して, 主に極端な事象から因果関係を推定するように設計されている。
また,データから極端にグランガー因果性が存在することを検出する新しい推論手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 03:31:01 GMT)
Global Inequalities in the Production of Artificial Intelligence: A Four-Country Study on Data Work [0.0] 労働力は人工知能の発展において大きな役割を担っているが、ほとんど認識されていない。
オンラインプラットフォームと下請け業者のネットワークは、AI生産の影の中でタスクを実行するためにデータワーカーを募集する。
本研究は、ベネズエラ、ブラジル、マダガスカル、フランスの富裕国における労働条件とデータ労働者のプロフィールを比較して、結果として生じる複雑さを明らかにする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:23:17 GMT)
Generative AI, Pragmatics, and Authenticity in Second Language Learning [0.0] 生成的AI(Artificial Intelligence)を言語学習と教育に統合する上で、明らかなメリットがある。
しかし、AIシステムが人間の言語に耐える方法のため、人間と同じ社会的認識を持つ言語を使えるような、生きた経験が欠けている。
言語や文化のバイアスは、そのトレーニングデータに基づいて構築されており、主に英語であり、主に西洋の情報源から来ている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:58:03 GMT)
General theory of cavity-mediated interactions between low-energy matter excitations [0.0] 空洞量子力学工学は低エネルギーの物質特性を高める方法として提案されている。
共振器共振器と共振器共振器共振器共振器による低エネルギー物質励起と共振器共振器共振器共振器共振器の有効相互作用について検討した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:29:49 GMT)
G-NeuroDAVIS: A Neural Network model for generalized embedding, data visualization and sample generation [0.0] G-NeuroDAVISと呼ばれる新しい生成モデルは、一般化された埋め込みを通して高次元データを視覚化することができる。
G-NeuroDAVISは教師なしと教師なしの両方の設定で訓練できる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:14:08 GMT)
Frontier AI Ethics: Anticipating and Evaluating the Societal Impacts of Language Model Agents [0.0] 一部の者は、すでに広くデプロイされているAIシステムのよく知られた病理を複製したとして、ジェネレーティブAIシステムを批判している。
私はこれらの特定のシステムを区別する点に注意を払っています。
私は「言語モデルエージェント」の略奪的展望がもたらす潜在的社会的影響と規範的疑問について考察する
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:43:09 GMT)
Flux qubit-based detector of microwave photons [0.0] フラックス量子ビット型検出器を用いたマイクロ波光子の検出理論について述べる。
我々は、電磁場がコヒーレントな状態であるような半古典的近似を考える。
我々の理論は、クォーディットの駆動散逸力学の理論記述に有用かもしれない。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:37:32 GMT)
Flexi-Fuzz least squares SVM for Alzheimer's diagnosis: Tackling noise, outliers, and class imbalance [0.0] アルツハイマー病(英語: Alzheimer's disease、AD)は、認知症の主要な原因である神経変性疾患である。
ADの早期診断には多数の機械学習アルゴリズムが提案されている。
彼らはしばしばノイズ、アウトリーフ、クラス不均衡の問題に悩まされる。
我々はFlexi-Fuzzと呼ばれる新鮮で堅牢で柔軟な会員制を導入する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 06:47:39 GMT)
Extreme Precipitation Nowcasting using Multi-Task Latent Diffusion Models [0.0] 降水予測の新しい手法であるマルチタスク潜水拡散モデル(MTLDM)を導入する。
我々は分解技術を用いてレーダー画像を分解し、サブイメージを別々に予測する。
この方法では、事前に5-80分までの実際の降水領域を一貫した予測が可能となる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 00:50:56 GMT)
Explainable AI in Handwriting Detection for Dyslexia Using Transfer Learning [0.0] 本稿では,手書き解析による失読症検出のための説明可能なAI(XAI)フレームワークを提案する。
我々の手法は最先端の手法を超越し、試験精度は0.9958である。
この枠組みは診断精度を向上するだけでなく、教育者、臨床医、両親の信頼と理解を促進する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:14:54 GMT)
Experimental protocol for observing single quantum many-body scars with transmon qubits [0.0] 単一量子多体傷(Single quantum many-body scars)は、局所観測可能な熱期待値を再現できないエネルギー固有状態である。
本稿では, 固定周波数, 固定結合型超伝導量子ビットのアーキテクチャにおいて, 単一障害を観測するためのプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:11:11 GMT)
Evaluating Quantized Large Language Models for Code Generation on Low-Resource Language Benchmarks [0.0] 本研究では,Lua符号生成タスクにおける5つの量子化符号LLMの性能を評価する。
その結果, 4ビット整数精度で量子化されたモデルは, 性能とモデルサイズとの最良のトレードオフをもたらすことが示唆された。
量子化は、70億のパラメータを持つ小さなLLMのアクセシビリティを高めるが、これらのLLMは全体的な低性能を示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:50:59 GMT)
Evaluating Progress in Web3 Grants: Introducing the Grant Maturity Index [0.0] 本稿では,Web3助成プログラムの成熟度と運用性を評価するための新しい評価フレームワークであるGrant Maturity Index(GMI)を紹介する。
GMIは、Arbitrum、Mantle、Taiko Labs、Optimismの4つの主要なLayer 2助成プログラムに適用されている。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:05:26 GMT)
Evaluating Gender, Racial, and Age Biases in Large Language Models: A Comparative Analysis of Occupational and Crime Scenarios [0.0] 本稿では,Large Language Models(LLMs)におけるバイアスについて検討する。
LLMは、様々な職業において、男性よりも頻繁に女性キャラクターを描いていることが判明した。
性別と人種の偏見を減らそうとする努力は、しばしば1つのサブクラスを超越する結果をもたらす。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:41:03 GMT)
Evaluating Gender, Racial, and Age Biases in Large Language Models: A Comparative Analysis of Occupational and Crime Scenarios [0.0] 本稿では,Large Language Models(LLMs)におけるバイアスについて検討する。
LLMは、様々な職業において、男性よりも頻繁に女性キャラクターを描いていることが判明した。
性別と人種の偏見を減らそうとする努力は、しばしば1つのサブクラスを超越する結果をもたらす。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:41:03 GMT)
Entanglement detection with classical deep neural networks [0.0] 本稿では,量子絡みの検出と分類を自律的に行う手法を提案する。
マルチ層パーセプトロンを用いて、2ビット系と3ビット系の両方のエンタングルメントを効果的に同定する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:58:32 GMT)
Entanglement between dependent degrees of freedom: Quasi-particle correlations [0.0] 我々は、依存する自由度という文脈における絡み合いの概念を探求する。
準粒子記述のための量子相関特性を特に研究する。
量子相関の資源性に関する新たな洞察は、従属自由度というほとんど議論されていない文脈の中で提供される。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:50:35 GMT)
Enhancing Retrieval Performance: An Ensemble Approach For Hard Negative Mining [0.0] 本研究は,クロスエンコーダモデルのトレーニングプロセスにおいて,ハードネガティブが果たす重要な役割を説明することに焦点を当てる。
我々は,企業データセット上でのクロスエンコーダ・リランクモデルの効率的なトレーニングのための強硬な負のマイニング手法を開発した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:23:39 GMT)
Enhancing AI Accessibility in Veterinary Medicine: Linking Classifiers and Electronic Health Records [0.0] 本稿では,医学における機械学習と電子健康記録(EHR)の統合について述べる。
Annaは、EHR実験データのML分類結果をリアルタイムで提供する、フリーソフトウェアソリューションである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:27:07 GMT)
Enhanced microscale NMR spectroscopy of low-gyromagnetic ratio nuclei via hydrogen transfer [0.0] NV中心を用いた低磁気比核における微小スケールでの化学シフトとJカップリングを検出する方法を提案する。
提案プロトコルは,13ドルCを含むシナリオに対して,1桁以上の感度向上を実現し,より低いジャイロ磁気比を持つ原子核の感度向上を実現している。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:05:35 GMT)
Embodied Exploration of Latent Spaces and Explainable AI [0.0] 本稿では,演奏者がニューラルオーディオ合成モデルと組み合わさった相互作用によって,そのようなモデルの潜伏空間を探索する方法について検討する。
私たちはパフォーマンスの背景と状況を提供し、説明可能なAIシステムの開発に貢献するための具体的プラクティスの可能性を強調します。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:40:34 GMT)
Elements of disinformation theory: cyber engagement via increasing adversary information consumption [0.0] 敵がネットワーク制御システム(NCS)に対する監視キャンペーンを行っている場合を考える。
敵の意図をよりよく理解するために、ディフェンダーは、実際の制御システムをエミュレートする「ハニーポット」に敵を誘導する。
我々は、この知識をセンサ読み取りのスプーフに利用し、敵がスプーフされていることを(理論的に)検出することを困難にしながら、敵が消費する情報の量を最大化する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:18:45 GMT)
Effects of Soft-Domain Transfer and Named Entity Information on Deception Detection [0.0] 偽造はいくつかのテキストのみのドメインで起こる。
8つのデータセットを用いて分類器の性能を評価する。
精度は11.2%まで向上した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:35:13 GMT)
Dissipative Quantum Hopfield Network: A numerical analysis [0.0] 本稿では,ホップフィールドニューラルネットワークの量子バージョンを広範囲にシミュレーションする。
このシステムは与えられた$Omega$の周波数で$N$ qubitsのネットワークであり、リンドブラッドジャンプ作用素を介して結合される。
我々の研究は、小型システムでは、ハミルトニアンの量子範囲が貯蔵容量に負の影響を及ぼすことを示した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:44:44 GMT)
Digital Humanities in the TIME-US Project: Richness and Contribution of Interdisciplinary Methods for Labour History [0.0] TIME-USプロジェクトは、大きな技術進歩によって引き起こされた変革を反映している。
研究期間中にフランスで女性によって行われた職業活動の痕跡を含む様々な資料を動員した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:13:10 GMT)
Deep Radar Inverse Sensor Models for Dynamic Occupancy Grid Maps [0.0] 本稿では,レーダー検出から極性測定格子へのマッピングを学習するために,深層学習に基づく逆センサモデル(ISM)を提案する。
私たちのアプローチは、視野の限られたレーダーから極性スキームで1フレームの計測グリッドを学習する最初の方法です。
これにより、ネットワークの再トレーニングや360度センサのカバレッジの必要なしに、1つ以上のレーダーセンサーを柔軟に使用することが可能になります。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:29:23 GMT)
Deep Learning Applications in Medical Image Analysis: Advancements, Challenges, and Future Directions [0.0] 人工知能のサブセットであるディープラーニングの最近の進歩は、医療画像の分析に大きな革命をもたらした。
CNNは多次元医用画像から自律的に学習する能力に顕著な能力を示した。
これらのモデルは、病理学、放射線学、眼科、心臓学など、様々な医学分野に利用されてきた。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 02:57:14 GMT)
Constructive Interpolation and Concept-Based Beth Definability for Description Logics via Sequents [0.0] 本稿では,概念に基づくBeth Definability Properties (CBP) を確立するための構築的手法を提案する。
高い表現力を持つDL RIQをケーススタディとして、シークエント計算からインターポーラントをどのように計算できるかを示す。
これは、記述論理の文脈内で補間子と定義を計算するための最初のシーケントベースのアプローチである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:22:32 GMT)
Combining Entropy and Matrix Nuclear Norm for Enhanced Evaluation of Language Models [0.0] 大規模言語モデル(LLM)は進歩を続けており、正確で効率的な評価指標の必要性がより強くなっている。
伝統的なアプローチは、情報的ではあるが、しばしば計算要求と解釈可能性の制限に直面している。
本稿では,2つの確立された手法を統合した新しいハイブリッド評価手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:03:52 GMT)
Code switching revisited: low-overhead magic state preparation using color codes [0.0] 本稿では,3Dカラーコードを用いた2Dカラーコード上に高忠実度マジック状態を作成するプロトコルを提案する。
これらの修正がマジック状態の忠実度を著しく向上させることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:39:50 GMT)
Code switching revisited: low-overhead magic state preparation using color codes [0.0] 本稿では,3Dカラーコードを用いた2Dカラーコード上に高忠実度マジック状態を作成するプロトコルを提案する。
これらの修正がマジック状態の忠実度を著しく向上させることを示す。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 05:39:50 GMT)
Clustering of timed sequences -- Application to the analysis of care pathways [0.0] 典型的なケアパスの発見は、クラスタリングによって達成できる。
タイムスタンプされたイベントのシーケンスで表されるクラスタリングケアパスの難しさは、意味的に適切なメトリックとクラスタリングアルゴリズムを定義することである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 15:38:16 GMT)
Circuit QED theory of direct and dual Shapiro steps with finite-size transmission line resonators [0.0] 有限サイズの伝送線路共振器に結合したジョセフソン接合部の直接及び二重シャピロステップの発生について検討する。
双対の場合、(近似的な)電荷相双対性は仮定せず、ジョセフソン接合に対する完全なマルチバンド力学を含む。
両ステップがこれらの揺らぎに非常に敏感であることを示し、ジャンクションと伝送路の重要な物理パラメータを同定する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:33:29 GMT)
Catalytic enhancement in the performance of the microscopic two-stroke heat engine [0.0] 2ストロークエンジンという,顕微鏡で作動する熱機関のモデルについて考察する。
作業を生成し、2つの離散ストロークで熱を交換し、時間的に分離する。
触媒と呼ばれる補助的非平衡系は、エンジンの作業体に組み込むことができる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:37:39 GMT)
CUT-E as a $1/N$ expansion for multiscale molecular polariton dynamics [0.0] 分子分極は、N$分子のアンサンブルと光学モードの集団結合が個々の光子と分子線幅を超えたときに起こる。
最近開発されたボゾン化技術に基づくCUT-Eの新規な導出法を提案する。
我々は、物理学の他の分野においてユビキタスな1/N$拡張とのつながりを定めており、この形式主義のこれまで解明されていなかった重要な側面がある。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:56:48 GMT)
Backdoored Retrievers for Prompt Injection Attacks on Retrieval Augmented Generation of Large Language Models [0.0] Retrieval Augmented Generation (RAG)は、大規模言語モデルと最新の情報検索を組み合わせることでこの問題に対処する。
本稿では、誤報以外の有害な目的に焦点をあて、RAGに対する即時注射攻撃について検討する。
我々は,既存のコーパス中毒技術を構築し,高密度レトリバー部品の微調整を目的とした新しいバックドアアタックを提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 14:02:34 GMT)
BANTH: A Multi-label Hate Speech Detection Dataset for Transliterated Bangla [0.0] 我々は,37.3kサンプルからなるバングラヘイト音声データセットであるBanTHを紹介する。
サンプルはYouTubeコメントからソースされ、各インスタンスに1つ以上のターゲットグループをラベル付けする。
実験により、さらに事前訓練されたエンコーダが、BanTHデータセット上で最先端のパフォーマンスを実現していることが明らかになった。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 09:50:41 GMT)
Automating Video Thumbnails Selection and Generation with Multimodal and Multistage Analysis [0.0] この論文は、従来の放送コンテンツに対するビデオサムネイル選択を自動化する革新的なアプローチを提示している。
本手法は,サムネイルの多様性,代表的,審美的満足度に関する厳格な基準を定めている。
我々は、候補フレームを選択したり、新しい画像を生成することができる洗練された多段階パイプラインを導入する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 16:04:15 GMT)
Automated Placement of Analog Integrated Circuits using Priority-based Constructive Heuristic [0.0] われわれは,いわゆるポケット,合併の可能性,デバイス間のパラメトリジブルな最小距離を必要とする,特定の種類のアナログ配置に注目した。
我々の解は回路の境界ボックスの周長と近似ワイヤ長を最小化する。
本手法は,手作業による設計を伴い,合成された産業事例と実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実物実
論文参考訳(メタデータ) (Fri, 18 Oct 2024 07:16:59 GMT)
Auto Detecting Cognitive Events Using Machine Learning on Pupillary Data [0.0] 瞳孔の大きさは認知作業負荷の貴重な指標であり、自律神経系によって支配される注意の変化と覚醒を反映している。
本研究では、機械学習を用いて個人が経験した認知イベントを自動的に検出する可能性について検討する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 04:54:46 GMT)
Asymptotic spectrum of weighted sample covariance: a Marcenko-Pastur generalization [0.0] 重み付きサンプル固有値の極限密度を特徴付ける方程式を、重み付きサンプル共分散行列に対して一般化し、Marcenko-Pastur定理を導出する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:14:37 GMT)
Are AI Detectors Good Enough? A Survey on Quality of Datasets With Machine-Generated Texts [0.0] AIフラグメントを備えた膨大な数の検出器とコレクションが出現し、いくつかの検出方法は認識品質を99.9%まで向上させた。
検出器は実際に非常に信頼性が高いのか、あるいは評価データセットの質が低いことから高いベンチマークスコアを得るのか?
本稿では,AI生成コンテンツ検出専用のコンペからのデータセットを体系的にレビューし,AI生成フラグメントを含むデータセットの品質を評価する手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 17:59:57 GMT)
An explainable machine learning approach for energy forecasting at the household level [0.0] 生産と消費の適切なバランスを見つける鍵となるため、電力の予測は繰り返し研究の話題となっている。
ほとんどの論文は国内規模や地域規模に重点を置いているが、家庭レベルでの関心は少ない。
本稿では,家庭レベルでの電力使用予測の課題を特に対象とする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:29:10 GMT)
An algorithm for clustering with confidence-based must-link and cannot-link constraints [0.0] 我々はPCCCアルゴリズム(Pairwise-Confidence-Constraints-Clustering)を導入する。
PCCCアルゴリズムは、オブジェクトのペアに提供された情報を考慮しながら、反復的にオブジェクトをクラスタに割り当てる。
既存のアルゴリズムとは異なり、我々のアルゴリズムは最大6万のオブジェクト、100のクラスタ、数百万のnot-link制約を持つ大規模インスタンスにスケールする。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 12:20:54 GMT)
Advancing Physics Data Analysis through Machine Learning and Physics-Informed Neural Networks [0.0] 本研究は,物理データ解析のための機械学習(ML)アルゴリズムについて評価する。
これらの手法をシミュレーションシナリオの実験的生存性を識別する二項分類タスクに適用する。
XGBoostは、そのスピードと有効性のために評価された機械学習アルゴリズムの中で好まれる選択として登場した。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 11:05:52 GMT)
Advanced Underwater Image Quality Enhancement via Hybrid Super-Resolution Convolutional Neural Networks and Multi-Scale Retinex-Based Defogging Techniques [0.0] この研究は、提案されたアプローチの有効性をさらに説明するために、現実世界の水中データセットに関する広範な実験を行っている。
海洋探査、水中ロボティクス、自律水中車両といったリアルタイムの水中アプリケーションでは、ディープラーニングと従来の画像処理技術を組み合わせることで、計算効率の良いフレームワークと優れた結果が得られる。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:40:26 GMT)
Acceleration Noise Induced Decoherence in Stern-Gerlach Interferometers for Gravity Experiments [0.0] 加速度ノイズは、Stern-Gerlach干渉計のデコヒーレンス問題を引き起こす可能性がある。
本稿では,SGIの解析的時間進化演算子に基づいて,これらのデコヒーレンス機構を理論的に研究する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 13:13:45 GMT)
A.I. go by many names: towards a sociotechnical definition of artificial intelligence [0.0] 人工知能(AI)の定義は永続的な課題であり、技術的曖昧さと様々な解釈に悩まされることが多い。
このエッセイは、研究に明快さを必要とする研究者にとって不可欠である、AIの社会技術的定義を論証するものである。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 08:03:20 GMT)
A novel approach towards the classification of Bone Fracture from Musculoskeletal Radiography images using Attention Based Transfer Learning [0.0] 我々は,X線スキャンで骨骨折を検出するために,注意に基づく移動学習モデルを構築した。
本モデルでは, フラクチャー分類の90%以上を最先端の精度で達成する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 19:07:24 GMT)
A Liquid-Core Fiber Platform for Classical and Entangled Two-Photon Absorption Measurements [0.0] 2光子吸収測定のためのトルエン充填ファイバプラットフォームを導入する。
7.3 nLの励起体積しか持たないため、従来の2光子吸収(C2PA)を1.75 nWの平均レーザーパワーで測定する。
論文参考訳(メタデータ) (Fri, 18 Oct 2024 18:53:30 GMT)