Not Everything is All You Need: Toward Low-Redundant Optimization for Large Language Model Alignment [126.3] 大規模言語モデル(LLM)は、複雑なタスクやシナリオにおいて、人間の好みに合わせるのに依然として苦労しています。
我々は、最も有用な教師付き信号を用いて、最も関連性の高いニューロンを最適化することに焦点を当てた、textbfALLOという低輝度アライメント手法を提案する。
10個のデータセットに対する実験結果から、ALLOの有効性が示された。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:18:59 GMT)
Which questions should I answer? Salience Prediction of Inquisitive Questions [118.1] 非常に健全な質問は、同じ記事で経験的に答えられる可能性が高いことを示す。
質問に対する回答が,ニュースの要約品質の指標であることを示すことで,我々の知見をさらに検証する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:59:55 GMT)
EditRoom: LLM-parameterized Graph Diffusion for Composable 3D Room Layout Editing [114.1] 自然言語コマンドで様々なレイアウト編集を実行できるフレームワークであるEdit-Roomを提案する。
特にEditRoomは、コマンドプランニングとターゲットシーンの生成にLarge Language Models(LLM)を利用している。
既存の3Dシーンデータセットを拡張する自動パイプラインを開発し,83kの編集ペアを備えた大規模データセットであるEditRoom-DBを導入した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:42:24 GMT)
BadCM: Invisible Backdoor Attack Against Cross-Modal Learning [110.4] クロスモーダルバックドアにおけるパズルの欠片を補うために,新たな両面バックドアを導入する。
BadCMは、1つの統合されたフレームワーク内で多様なクロスモーダルアタックのために意図的に設計された最初の目に見えないバックドアメソッドである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:51:53 GMT)
LLaVA-Critic: Learning to Evaluate Multimodal Models [110.1] 本稿では,LLaVA-Criticについて紹介する。LLaVA-Criticは,汎用評価器として設計された,最初のオープンソースの大規模マルチモーダルモデル(LMM)である。
LLaVA-Criticは、さまざまな評価基準とシナリオを組み込んだ高品質な批判的インストラクションフォローデータセットを使用してトレーニングされている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:36:33 GMT)
LLMs Assist NLP Researchers: Critique Paper (Meta-)Reviewing [106.5] 大規模言語モデル(LLM)は、様々な生成タスクにおいて顕著な汎用性を示している。
本研究は,NLP研究者を支援するLLMの話題に焦点を当てる。
私たちの知る限りでは、このような包括的な分析を提供するのはこれが初めてです。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:57:49 GMT)
MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation [104.0] MosaicFusionは、大語彙のインスタンスセグメンテーションのための、単純で効果的な拡散に基づくデータ拡張手法である。
本手法はトレーニングフリーであり,ラベル管理に依存しない。
LVISロングテールおよびオープンボキャブラリベンチマークの実験結果は、MosaicFusionが既存のインスタンスセグメンテーションモデルの性能を大幅に改善できることを示した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:32:33 GMT)
Synchronous Faithfulness Monitoring for Trustworthy Retrieval-Augmented Generation [96.8] Retrieval-augmented Language Model (RALMs) は、知識集約型タスクにおいて、高い性能と幅広い適用性を示している。
本稿では,非偽文の検出に微細な復号力学を利用する軽量モニタであるSynCheckを提案する。
また、長文検索拡張生成のためのビームサーチによって導かれる忠実度指向の復号アルゴリズムであるFODを導入する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:55:18 GMT)
UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation [93.4] IncertaintyRAG, a novel approach for long-context Retrieval-Augmented Generation (RAG)について紹介する。
我々は、SNR(Signal-to-Noise Ratio)ベースのスパン不確実性を用いて、テキストチャンク間の類似性を推定する。
不確かさRAGはLLaMA-2-7Bでベースラインを2.03%上回り、最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:39:38 GMT)
VideoPhy: Evaluating Physical Commonsense for Video Generation [93.3] 生成したビデオが現実世界のアクティビティの物理的常識に従うかどうかを評価するためのベンチマークであるVideoPhyを提示する。
そして、さまざまな最先端のテキスト・ビデオ生成モデルからキャプションに条件付けされたビデオを生成する。
人間の評価では、既存のモデルには、与えられたテキストプロンプトに付着したビデオを生成する能力が欠けていることが判明した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:24:40 GMT)
Generate-on-Graph: Treat LLM as both Agent and KG in Incomplete Knowledge Graph Question Answering [87.7] 我々は、知識グラフ(KG)を探索しながら、新しい実写トリプルを生成する、Generate-on-Graph(GoG)と呼ばれる学習自由な手法を提案する。
GoGはIKGQAでLLMをエージェントとKGの両方として扱うThinking-Searching-Generatingフレームワークを通じて推論を行う。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:44:59 GMT)
Learning a Fast Mixing Exogenous Block MDP using a Single Trajectory [87.6] STEELは、単一軌道から外因性ブロックマルコフ決定過程の制御可能なダイナミクスを学習するための、最初の証明可能なサンプル効率アルゴリズムである。
我々は,STEELが正解であり,サンプル効率が良いことを証明し,STEELを2つの玩具問題で実証した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:57:21 GMT)
Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution [82.4] 本稿では,従来の視覚処理における既定分解能アプローチを再定義するQwen2-VLシリーズを提案する。
Qwen2-VLでは、さまざまな解像度の画像を異なる数のビジュアルトークンに動的に処理できるNaive Dynamic Resolutionメカニズムが導入されている。
また、Multimodal Rotary Position Embedding (M-RoPE)を統合し、テキスト、画像、ビデオ間で位置情報の効果的な融合を容易にする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:54:49 GMT)
Learning to Refine with Fine-Grained Natural Language Feedback [81.7] 我々は,3つの異なるLLM能力の構成要素として,フィードバックによる洗練を検討することを提案する。
提案手法の鍵となる特性は,ステップ2の批判モデルがエラーに対してきめ細かいフィードバックを与えることができる点である。
文書基盤要約の事実整合性を改善する作業において,異なる機能モデルがDCRによる精細化の恩恵を受けることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 18:55:17 GMT)
Bootstrap3D: Improving Multi-view Diffusion Model with Synthetic Data [80.9] 重要なボトルネックは、詳細なキャプションを持つ高品質な3Dオブジェクトの不足である。
本稿では,任意の量のマルチビュー画像を自動的に生成する新しいフレームワークBootstrap3Dを提案する。
我々は高画質合成多視点画像100万枚を高密度記述キャプションで生成した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:20:17 GMT)
Can Transformers Learn $n$-gram Language Models? [77.4] 2種類のランダムな$n$-gram LMを学習するトランスフォーマーの能力について検討する。
例えば、$n$-gram LMに対する古典的な推定手法として、add-$lambda$ smoothing outperform transformerがある。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:21:02 GMT)
Large Language Models on Graphs: A Comprehensive Survey [77.2] グラフ上の大規模言語モデルに関連するシナリオとテクニックを体系的にレビューする。
まず,LLMをグラフに適用する可能性シナリオを,純グラフ,テキスト分散グラフ,テキストペアグラフの3つのカテゴリにまとめる。
本稿では,そのような手法の現実的な応用について論じ,オープンソースコードとベンチマークデータセットを要約する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 13:47:02 GMT)
Generalization v.s. Memorization: Tracing Language Models' Capabilities Back to Pretraining Data [76.9] 大規模言語モデル(LLM)は、実際に目に見えないタスクに一般化するか、大量の事前学習データを記憶することに依存するかという議論を引き起こしている。
本稿では,LLMの出力確率と事前学習データ頻度との相関を計測する,メモリ化,分散メモリ化という拡張された概念を導入する。
本研究は, より単純で知識集約的なタスクにおいて, 暗記がより大きな役割を果たすことを示した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:30:41 GMT)
Loong: Generating Minute-level Long Videos with Autoregressive Language Models [76.6] そこで我々は,Longという自動回帰型大言語モデル (LLM) ベースのビデオジェネレータを提案する。
具体的には,テキストトークンとビデオトークンを自己回帰LDMの統一シーケンスとしてモデル化し,スクラッチからモデルをトレーニングする。
提案したLoongは10秒のビデオでトレーニングでき、テキストプロンプトで調整されたミニレベル長ビデオを生成するよう拡張できる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:59:02 GMT)
Visually Descriptive Language Model for Vector Graphics Reasoning [76.4] 低レベル視覚知覚と高レベル言語推論のギャップを埋めるための視覚記述型言語モデル(VDLM)を提案する。
VDLMは,様々なマルチモーダル認識および推論タスクにおいて,GPT-4oのような最先端のLMMを大幅に改善することを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:59:32 GMT)
CulturalBench: a Robust, Diverse and Challenging Benchmark on Measuring the (Lack of) Cultural Knowledge of LLMs [75.8] 文化ベンチについて紹介する: 文化的知識を評価するための1,227の人文的・人文的な質問である。
同じ質問を共有しながら異なる質問をするCulturalBench-EasyとCulturalBench-Hardの2つの設定でモデルを評価する。
人間のパフォーマンス(92.6%の精度)と比較して、カルチャーベンチ・ハードは、最もパフォーマンスの良いモデル(GPT-4o)が61.5%、最悪のモデル(Llama3-8b)が21.4%であるフロンティアのLLMにとってより難しい。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:04:31 GMT)
How to Train Long-Context Language Models (Effectively) [75.5] 言語モデル(LM)の継続学習と教師付き微調整(SFT)を行い,長文情報の有効利用について検討した。
ProLong-8BはLlama-3のもので、40Bトークンで訓練されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:46:52 GMT)
Mitigating Copy Bias in In-Context Learning through Neuron Pruning [74.9] 大規模言語モデル(LLM)は、コンテキスト内学習能力に目を見張るものはほとんどない。
それらは、基礎となるパターンを学ぶ代わりに、提供された例から回答をコピーする。
このような複写バイアスを軽減するための,新しい簡易な手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:13:43 GMT)
Mitigating Copy Bias in In-Context Learning through Neuron Pruning [74.9] 大規模言語モデル(LLM)は、コンテキスト内学習能力に目を見張るものはほとんどない。
それらは、基礎となるパターンを学ぶ代わりに、提供された例から回答をコピーする。
このような複写バイアスを軽減するための,新しい簡易な手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:13:43 GMT)
LongForm: Effective Instruction Tuning with Reverse Instructions [74.1] 本稿では,逆命令によって生成されるLongForm-Cデータセットを紹介する。
逆命令を用いた人書きコーパスの例を LLM で生成する。
我々のモデルは、ストーリー/レシピ生成や長文質問応答といったタスクを指導することなく、10倍の言語モデルより優れています。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:46:13 GMT)
Rel-A.I.: An Interaction-Centered Approach To Measuring Human-LM Reliance [73.2] インタラクションの文脈的特徴が依存に与える影響について検討する。
文脈特性が人間の信頼行動に大きく影響していることが判明した。
これらの結果から,キャリブレーションと言語品質だけでは人間とLMの相互作用のリスクを評価するには不十分であることが示唆された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:54:59 GMT)
Towards Data-and Knowledge-Driven Artificial Intelligence: A Survey on Neuro-Symbolic Computing [73.1] ニューラルシンボリック・コンピューティング(NeSy)は、人工知能(AI)の活発な研究領域である。
NeSyは、ニューラルネットワークにおける記号表現の推論と解釈可能性の利点と堅牢な学習の整合性を示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:17:04 GMT)
Llama SLayer 8B: Shallow Layers Hold the Key to Knowledge Injection [73.1] 知識注入のための最適層範囲の探索における各層の重要性について検討する。
本研究では,浅層を選択的に強化し,有効でない深層を刈り取るための事前学習戦略であるS戦略を提案する。
この戦略に基づき,Llama Slayer-8BとLlama Slayer-8B-Instructを導入する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:28:59 GMT)
Leave No Document Behind: Benchmarking Long-Context LLMs with Extended Multi-Doc QA [71.0] 長いコンテキストモデリング能力は広く注目を集めており、超コンテキストウィンドウを持つLarge Language Models (LLMs) の出現につながっている。
拡張多文書質問応答(QA)によって現実的なシナリオに整合する新しい長文ベンチマークであるLoongを提案する。
Loong氏は、Spotlight Locating, Comparison, Clustering, Chain of Reasoningという、コンテキスト長の4つのタスクを紹介している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 06:03:14 GMT)
Controlling the Fidelity and Diversity of Deep Generative Models via Pseudo Density [70.1] 本稿では, GAN や拡散モデルなどのバイアス深層生成モデルへのアプローチを導入し, 忠実度の向上や多様性の向上を図ったデータ生成手法を提案する。
提案手法では, 擬似密度という, 個人サンプルの新たな測定基準を用いて, トレーニングとデータ生成の分布を操作する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:25:54 GMT)
Language Models are Graph Learners [70.1] 言語モデル(LM)は、グラフニューラルネットワーク(GNN)やグラフトランスフォーマー(GT)など、ドメイン固有のモデルの優位性に挑戦している。
本稿では,ノード分類タスクにおける最先端のGNNに匹敵する性能を実現するために,既製のLMを有効活用する手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:27:54 GMT)
ReGenesis: LLMs can Grow into Reasoning Generalists via Self-Improvement [70.1] 学習後の大規模言語モデル (LLM) は推論能力を高めることができる。
既存の自己合成手法は、一般化の貧弱さからドメイン外推論(OOD)タスクに悩まされる。
本稿では,学習後データとして推論経路を自己合成する手法であるSelf-Improvement (ReGenesis) による推論ジェネリストを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:09:15 GMT)
Unified Active Retrieval for Retrieval Augmented Generation [69.6] Retrieval-Augmented Generation (RAG)では、検索は必ずしも役に立たない。
既存のアクティブ検索手法は2つの課題に直面している。
彼らは通常、様々な種類の命令を扱うのに苦労する単一の基準に頼っている。
それらは特殊で高度に区別された手順に依存しており、それらを組み合わせることでRAGシステムはより複雑になる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:39:56 GMT)
Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training [69.5] ジェネラリストの具体化エージェントを学ぶことは、主にアクションラベル付きロボットデータセットの不足に起因して、課題を提起する。
これらの課題に対処するための新しい枠組みを導入し、人間のビデオにおける生成前トレーニングと、少数のアクションラベル付きロボットビデオのポリシー微調整を組み合わせるために、統一された離散拡散を利用する。
提案手法は, 従来の最先端手法と比較して, 高忠実度な今後の計画ビデオを生成し, 細調整されたポリシーを強化する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:07:52 GMT)
Quantifying User Coherence: A Unified Framework for Cross-Domain Recommendation Analysis [69.4] 本稿では,レコメンデーションシステムを理解するための新しい情報理論手法を提案する。
9つのデータセットで7つのレコメンデーションアルゴリズムを評価し、測定値と標準的なパフォーマンス指標の関係を明らかにする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:02:07 GMT)
Cognitive Biases in Large Language Models for News Recommendation [68.9] 本稿では,認知バイアスが大規模言語モデル(LLM)に基づくニュースレコメンデータシステムに与える影響について検討する。
データ拡張、エンジニアリングと学習アルゴリズムの側面を通じて、これらのバイアスを軽減する戦略について議論する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:42:07 GMT)
4K4DGen: Panoramic 4D Generation at 4K Resolution [68.0] 一つのパノラマを没入的な4D体験に高めるという課題に取り組む。
初めて、4K解像度で360$circ$のビューで全方位動的シーンを生成する能力を実証した。
高品質なパノラマ・ト・4Dを4Kの解像度で初めて実現した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 06:26:49 GMT)
Graph Sparsification via Mixture of Graphs [67.4] そこで我々はMixture-of-Graphs (MoG)を導入し、各ノードに対して動的に調整されたプルーニングソリューションを選択する。
MoGには複数のスパシファイアの専門家が組み込まれており、それぞれが独自のスパーシリティレベルとプルーニング基準によって特徴付けられ、各ノードに対して適切な専門家を選択する。
5つのGNNを備えた4つの大規模OGBデータセットと2つのスーパーピクセルデータセットの実験により、MoGはより高い空間レベルのサブグラフを識別することを示した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 12:42:40 GMT)
Inverse Entropic Optimal Transport Solves Semi-supervised Learning via Data Likelihood Maximization [65.9] 条件分布は機械学習の中心的な問題です
ペアデータとペアデータの両方を統合する新しい学習パラダイムを提案する。
我々のアプローチはまた、興味深いことに逆エントロピー最適輸送(OT)と結びついている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:12:59 GMT)
Supportiveness-based Knowledge Rewriting for Retrieval-augmented Language Modeling [65.7] 支援性に基づく知識書き換え(SKR)は、LLM生成に本質的に最適化された堅牢でプラガブルな知識書き換えである。
知識支援に基づき、まず、リライターモデルのためのトレーニングデータキュレーション戦略を設計する。
次に、生成したリライトを最適な支持度に調整するために、直接選好最適化(DPO)アルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 18:22:44 GMT)
Hate Personified: Investigating the role of LLMs in content moderation [64.3] ヘイト検出などの主観的タスクでは,人々が嫌悪感を知覚する場合には,多様なグループを表現できるLarge Language Model(LLM)の能力は不明確である。
追加の文脈をプロンプトに含めることで、LLMの地理的プライミングに対する感受性、ペルソナ属性、数値情報を分析し、様々なグループのニーズがどの程度反映されているかを評価する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:43:17 GMT)
RepoGraph: Enhancing AI Software Engineering with Repository-level Code Graph [63.9] RepoGraphは、現代のAIソフトウェアエンジニアリングソリューションのためのリポジトリレベルの構造を管理するプラグインモジュールである。
RepoGraphはすべてのシステムのパフォーマンスを大幅に向上させ、オープンソースフレームワークの間で新たな最先端技術を生み出している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 05:45:26 GMT)
Budget-Aware Sequential Brick Assembly with Efficient Constraint Satisfaction [63.7] レゴブロックを用いた逐次レンガ組立体の課題に対処し、3D構造を創出する。
特に、使用されるレンガの数が増えるにつれて、組み立て可能な構造物の数は指数関数的に増加する。
本稿では,U字型スパース3次元畳み込みニューラルネットワークを用いて,次のブロック位置のスコアを予測する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 23:25:24 GMT)
OmniBench: Towards The Future of Universal Omni-Language Models [63.2] OmniBenchは、視覚的、音響的、テキスト的入力を同時に認識し、解釈し、推論するモデルの能力を厳格に評価するために設計された新しいベンチマークである。
本研究の主目的は,ほとんどのOLMが3モーダル文脈における指示追従能力と推論能力に限界があることである。
このギャップに対処するため、84.5KのトレーニングサンプルであるOmniInstructの命令チューニングデータセットをキュレートし、OLMをマルチモーダルなコンテキストに適応させる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:32:50 GMT)
ThinK: Thinner Key Cache by Query-Driven Pruning [63.1] 大規模言語モデル(LLM)は自然言語処理の分野に革命をもたらし、様々なアプリケーションで前例のない性能を達成した。
本稿では,KVキャッシュのメモリ消費の非効率性に対処する長文シナリオに焦点を当てた。
我々は,最小のチャネルを選択的に切断しながら,注目重量損失を最小限に抑える新しいクエリ依存型KVキャッシュプルーニング手法であるThinKを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:03:29 GMT)
Revisit Large-Scale Image-Caption Data in Pre-training Multimodal Foundation Models [63.0] マルチモーダルモデルの最近の進歩は、性能向上のための書き直しキャプションの価値を強調している。
プレトレーニングにおける合成キャプションとオリジナルのWebcrawled AltTextsとの相互作用が、まだよく理解されていないかどうかは不明だ。
様々なマルチモーダルモデルに適した多様なキャプションフォーマットを生成するために,新しい,制御可能な,スケーラブルなキャプションパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:54:52 GMT)
Leopard: A Vision Language Model For Text-Rich Multi-Image Tasks [62.8] Leopardは、複数のテキストリッチイメージを含む視覚言語タスクを扱うビジョン言語モデルである。
まず、テキストリッチでマルチイメージのシナリオに合わせて、約100万の高品質なマルチモーダル命令チューニングデータをキュレートした。
第2に,視覚列長の割り当てを動的に最適化する適応型高解像度マルチイメージ符号化モジュールを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:57:05 GMT)
LEOPARD : A Vision Language Model For Text-Rich Multi-Image Tasks [62.8] OurMethodは、複数のテキストリッチな画像を含む視覚言語タスクを扱うための視覚言語モデルである。
まず、テキストリッチでマルチイメージのシナリオに合わせて、約100万の高品質なマルチモーダル命令チューニングデータをキュレートした。
第2に,視覚列長の割り当てを動的に最適化する適応型高解像度マルチイメージ符号化モジュールを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:57:05 GMT)
Quality or Quantity? On Data Scale and Diversity in Adapting Large Language Models for Low-Resource Translation [62.2] 低リソース言語に大規模言語モデルを適用するのに何が必要かについて検討する。
我々は、事前トレーニングとスーパーバイザードファインチューニング(SFT)の間に並列データが重要であることを示す。
2つの低リソース言語群にまたがる3つの LLM 実験により,本研究の一般化可能性を示す一貫した傾向が示された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:45:29 GMT)
Discovering Message Passing Hierarchies for Mesh-Based Physics Simulation [61.9] DHMPを導入し,異なるノード選択手法を用いてメッセージパッシングネットワークの動的階層を学習する。
本実験はDHMPの有効性を実証し,近年の固定階層型メッセージパッシングネットワークと比較して平均22.7%改善した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:18:00 GMT)
Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs [60.7] 大規模言語モデル(LLM)は、特に知識集約的なタスクにおいて幻覚に悩まされる。
既存の研究は、外部知識コーパスから取得した個々のテキスト単位でLLMを拡張することを提案する。
本稿では,グラフを反復的に推論することで,LLMをグラフで拡張するためのGraph Chain-of-thinkt (Graph-CoT) というフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 13:55:08 GMT)
Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own [59.1] 我々は、政策、価値、成功-回帰基盤モデルからのガイダンスとフィードバックを活用するために、RLFP(Reinforcement Learning with Foundation Priors)を提案する。
本フレームワークでは,自動報酬関数を用いてより効率的にエージェントを探索できるファウンデーション誘導型アクター・クリティカル(FAC)アルゴリズムを導入する。
本手法は,実ロボットとシミュレーションの両方において,様々な操作タスクにおいて顕著な性能を実現する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 05:57:42 GMT)
TCSinger: Zero-Shot Singing Voice Synthesis with Style Transfer and Multi-Level Style Control [59.0] スタイル転送とスタイル制御を備えたゼロショット歌唱音声合成(SVS)は、目に見えない音色とスタイルで高品質な歌唱音声を生成することを目的としている。
言語間音声および歌唱スタイル間のスタイル伝達のための,最初のゼロショットSVSモデルであるTCSingerを紹介する。
TCSingerは、品質合成、シンガー類似性、および様々なタスクにおけるスタイル制御性において、全てのベースラインモデルより優れていることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:45:55 GMT)
TCSinger: Zero-Shot Singing Voice Synthesis with Style Transfer and Multi-Level Style Control [59.0] スタイル転送とスタイル制御を備えたゼロショット歌唱音声合成(SVS)は、目に見えない音色とスタイルで高品質な歌唱音声を生成することを目的としている。
言語間音声および歌唱スタイル間のスタイル伝達のための,最初のゼロショットSVSモデルであるTCSingerを紹介する。
TCSingerは、品質合成、シンガー類似性、および様々なタスクにおけるスタイル制御性において、全てのベースラインモデルより優れていることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:45:55 GMT)
NVDS+: Towards Efficient and Versatile Neural Stabilizer for Video Depth Estimation [58.2] ビデオ深度推定は時間的に一貫した深度を推定することを目的としている。
プラグ・アンド・プレイ方式で様々な単一画像モデルから推定される不整合深さを安定化するNVDS+を導入する。
このデータセットには、200万フレーム以上の14,203本のビデオが含まれている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:58:03 GMT)
Fast Matrix Multiplications for Lookup Table-Quantized LLMs [58.1] FLUTEはLUT量子化LLM用のフレキシブルなルックアップテーブルエンジンである。
バッチサイズ32と量子化グループサイズ128では、FLUTEカーネルは既存のGEMMカーネルよりも2〜4倍高速である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:48:45 GMT)
Language Representations Can be What Recommenders Need: Findings and Potentials [57.9] 先進的なLM表現から線形にマッピングされた項目表現は、より優れたレコメンデーション性能が得られることを示す。
この結果は、先進言語表現空間と効果的な項目表現空間との同型性を示唆している。
本研究は,自然言語処理とリコメンデーションシステムコミュニティの両方に刺激を与える言語モデリングと行動モデリングの関連性を強調した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:41:56 GMT)
AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8] 抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:36:44 GMT)
Fair Allocation in Dynamic Mechanism Design [57.7] 競売業者が各ラウンドの買い手グループに、合計で$T$で分けない商品を販売している問題を考える。
競売人は、各グループの最低平均配分を保証する公正な制約に固執しつつ、割引された全体の収益を最大化することを目的としている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:05:51 GMT)
Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.7] 我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。
具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:49:09 GMT)
VALOR-EVAL: Holistic Coverage and Faithfulness Evaluation of Large Vision-Language Models [57.4] LVLM(Large Vision-Language Models)は幻覚に悩まされ、このモデルでは可聴音を発生させるが、実際には誤出力を発生させる。
既存のベンチマークはスコープに限られており、主にオブジェクト幻覚に焦点を当てている。
対象,属性,関係を多次元のベンチマークで表現し,連想バイアスに基づいて画像を選択する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:40:37 GMT)
DaWin: Training-free Dynamic Weight Interpolation for Robust Adaptation [57.1] 本研究では,各未ラベルテストサンプルに対する個々のモデルのエントロピーを利用するトレーニングフリーな動的重み付け手法であるDaWinを提案する。
このような係数を学習するために、通常追加のトレーニングに依存する以前の作業とは異なり、我々のアプローチはトレーニングを必要としない。
その結果、DaWinは計算オーバーヘッドを最小限に抑えながら、考慮された設定で大幅なパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:25:35 GMT)
AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.6] 自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:01:09 GMT)
Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.4] 連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:07:13 GMT)
LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning [56.3] このフレームワークはMonte Carlo Tree Search (MCTS)と反復的なSelf-Refineを組み合わせて推論パスを最適化する。
このフレームワークは、一般的なベンチマークと高度なベンチマークでテストされており、探索効率と問題解決能力の点で優れた性能を示している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:12:29 GMT)
Evaluating Automatic Metrics with Incremental Machine Translation Systems [55.8] 商業機械翻訳からなるデータセットを導入し,12の翻訳方向から6年間にわたって収集した。
商業システムは時間とともに改善され、より最近の翻訳の好みに基づいて機械翻訳(MT)メトリクスを評価することができると仮定する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:05:14 GMT)
Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning [55.7] 我々は、新しいオンラインアルゴリズム、反復的ナッシュポリシー最適化(INPO)を提案する。
従来の方法とは異なり、INPOは個々の応答に対する期待される勝利率を推定する必要性を回避している。
LLaMA-3-8BベースのSFTモデルで、INPOはAlpacaEval 2.0で42.6%、Arena-Hardで37.8%の勝利率を達成した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 04:07:39 GMT)
LDMol: Text-to-Molecule Diffusion Model with Structurally Informative Latent Space [55.5] テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
LDMolは、学習可能で構造的に有意な特徴空間を生成する分子オートエンコーダを含む。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:14:29 GMT)
Quantum tomography of helicity states for general scattering processes [55.2] 量子トモグラフィーは、物理学における量子系の密度行列$rho$を計算するのに欠かせない道具となっている。
一般散乱過程におけるヘリシティ量子初期状態の再構成に関する理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 10:09:08 GMT)
Large Language Model for Multi-Domain Translation: Benchmarking and Domain CoT Fine-tuning [55.1] 大規模言語モデル(LLM)は、目覚ましい一般的な理解と生成能力を示している。
我々は、25のドイツ語$Leftrightarrow$ Englishと22の中国語$Leftrightarrow$ Englishテストセットを特徴とするマルチドメイン翻訳のベンチマークを確立する。
本稿では,LLMの内在的マルチドメインインテリジェンスを活用し,翻訳性能を向上させるためのドメインチェーン・オブ・シント(CoT)ファインチューニング手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:15:04 GMT)
Agents' Room: Narrative Generation through Multi-step Collaboration [55.0] 本稿では,物語の執筆を特殊エージェントが取り組んだサブタスクに分解する,物語理論に触発された世代フレームワークを提案する。
エージェントの部屋は,専門的評価者が好むストーリーをベースラインシステムより生成することを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:44:42 GMT)
Chain-of-Note: Enhancing Robustness in Retrieval-Augmented Language Models [54.6] CoN(Chain-of-Noting)は、ノイズや無関係な文書、未知のシナリオの処理において、ALMの堅牢性を改善することを目的とした、新しいアプローチである。
CoNは、完全にノイズの多い検索された文書が与えられるEMスコアの+7.9と、トレーニング済みの知識範囲外にあるリアルタイム質問に対する拒絶率+10.5の平均的な改善を実現している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 04:35:39 GMT)
TurkishMMLU: Measuring Massive Multitask Language Understanding in Turkish [54.5] 本稿では,最初のマルチタスク,複数選択のトルコQAベンチマーク,トルコMMLUを紹介する。
トルコMMLUには1万以上の質問があり、トルコの高校教育カリキュラムとは9つの異なるテーマをカバーしている。
多言語オープンソース(Gemma、Llama、MT5)、クローズドソース(GPT 4o、Claude、Gemini)、トルコ適応モデル(Trendyolなど)を含む20以上のLLMを評価した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:45:52 GMT)
Agent-Oriented Planning in Multi-Agent Systems [54.4] 本稿では,高速なタスク分解とアロケーションプロセスを活用するマルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークを提案する。
提案フレームワークにフィードバックループを組み込んで,そのような問題解決プロセスの有効性と堅牢性をさらに向上させる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:07:51 GMT)
Re-TASK: Revisiting LLM Tasks from Capability, Skill, and Knowledge Perspectives [54.1] CoT (Chain-of-Thought) は複雑な問題を解決する重要な方法となっている。
大規模言語モデル(LLM)はドメイン固有のタスクを正確に分解するのに苦労することが多い。
本稿では,LLMタスクを能力,スキル,知識の観点から再検討する理論モデルであるRe-TASKフレームワークを紹介する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:27:29 GMT)
Extrinsic Evaluation of Cultural Competence in Large Language Models [53.6] 本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:28:35 GMT)
Distilling an End-to-End Voice Assistant Without Instruction Training Data [53.5] Distilled Voice Assistant (DiVA)は、質問応答、分類、翻訳を一般化する。
Qwen 2 Audioのような最先端のモデルと比較すると,DiVAはユーザの好みによく適合し,72%の勝利率を達成した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:04:48 GMT)
PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling [53.1] 本研究では,大規模言語モデル(LLM)内の注意に基づく情報フローが,長期的文脈処理のための顕著なパターンによって集約されるかどうかを検討する。
観測の結果,LLMは下層に広く注意が散らばっているピラミッド情報ファンリングを通じて情報を集約することがわかった。
これらの知見に触発され、我々は新しい効率的なKVキャッシュ圧縮法であるPraamid KVを開発した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:46:42 GMT)
Generalizable Human Gaussians from Single-View Image [52.1] 単一画像からの3次元人体モデリングのための拡散誘導フレームワークであるHGM(Single-view Generalizable Human Gaussian Model)を提案する。
観察されていない視点を幻覚させる効果はあるが、このアプローチは監督の欠如により非現実的な人間のポーズや形を生み出す可能性がある。
公開データセットに対する我々のアプローチを検証し、PSNRとSSIMの点で最先端の手法を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 12:52:10 GMT)
Personalized Quantum Federated Learning for Privacy Image Classification [52.0] 画像の不均衡な分布の場合のクライアントモデルの性格を高めるために、パーソナライズされた量子フェデレーション学習アルゴリズムを提案する。
実験結果から,パーソナライズされた量子フェデレーション学習アルゴリズムは,高性能なグローバルモデルとローカルモデルを得ることができることが示された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:53:04 GMT)
Beyond correlation: The impact of human uncertainty in measuring the effectiveness of automatic evaluation and LLM-as-a-judge [51.9] 一つの集合相関スコアを*参照すると、人間の行動と自動評価方法の根本的な違いがあいまいになることを示す。
本研究では,評価性能のより堅牢な解析を行うために,ラベルの不確実性による階層化結果を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:08:29 GMT)
SwapAnything: Enabling Arbitrary Object Swapping in Personalized Visual Editing [51.9] SwapAnythingは、イメージ内の任意のオブジェクトを参照によって与えられるパーソナライズされた概念に置き換えることのできる、新しいフレームワークである。
1)主主題ではなく任意の対象や部分の精密な制御,(2)コンテキスト画素のより忠実な保存,(3)イメージへのパーソナライズされた概念の適応,の3つの特徴がある。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:56:42 GMT)
General Preference Modeling with Preference Representations for Aligning Language Models [51.1] 我々は、複雑な嗜好構造を効率的に捉えるために、応答を潜在空間に埋め込んだ選好表現学習を導入する。
また、人間からのフィードバックから報酬に基づく強化学習を一般化する嗜好スコアに基づく一般選好最適化(GPO)を提案する。
提案手法は,基礎モデルの微妙な人的価値との整合性を高めることができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:22:55 GMT)
Adaptive Inference-Time Compute: LLMs Can Predict if They Can Do Better, Even Mid-Generation [51.1] 本稿では,生成サンプル数を適応的に削減する新たな自己評価手法を提案する。
平均1.2サンプルだけで16サンプルの使用による改善の74%が達成できることを実証した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:47:29 GMT)
TrustAgent: Towards Safe and Trustworthy LLM-based Agents [50.3] 本稿では,エージェント・コンスティチューションをベースとしたエージェント・フレームワークであるTrustAgentについて述べる。
提案枠組みは,計画立案前のモデルに安全知識を注入する事前計画戦略,計画立案時の安全性を高める内計画戦略,計画後検査による安全性を確保する後計画戦略の3つの戦略要素を通じて,エージェント憲法の厳格な遵守を保証する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:12:05 GMT)
Achieving Fairness in Predictive Process Analytics via Adversarial Learning [50.3] 本稿では、デバイアスフェーズを予測ビジネスプロセス分析に組み込むことの課題に対処する。
本研究の枠組みは, 4つのケーススタディで検証し, 予測値に対する偏り変数の寄与を著しく低減することを示した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:56:03 GMT)
Long-Sequence Recommendation Models Need Decoupled Embeddings [49.4] 我々は、既存の長期推薦モデルにおいて無視された欠陥を識別し、特徴付ける。
埋め込みの単一のセットは、注意と表現の両方を学ぶのに苦労し、これら2つのプロセス間の干渉につながります。
本稿では,2つの異なる埋め込みテーブルを別々に学習し,注意と表現を完全に分離する,DARE(Decoupled Attention and Representation Embeddings)モデルを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:45:15 GMT)
Lookback Lens: Detecting and Mitigating Contextual Hallucinations in Large Language Models Using Only Attention Maps [48.6] 大型言語モデル(LLM)は詳細を幻覚し、根拠のない回答で応答することができる。
本稿では,このような文脈的幻覚を検出するための簡単なアプローチについて述べる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:26:48 GMT)
The SIFo Benchmark: Investigating the Sequential Instruction Following Ability of Large Language Models [48.5] 本稿では,複数の命令を逐次的に追従するモデルの性能を評価するためのベンチマークを提案する。
我々のベンチマークは,4つのタスク(テキスト修正,質問応答,数学,セキュリティルール)を用いて,指示に従うことを評価する。
より最近のモデルでは、SIFoタスクにおいて、より古いモデルやより小さなモデルよりも大幅に優れており、ベンチマークの有効性が検証されている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 13:02:11 GMT)
Better Call SAUL: Fluent and Consistent Language Model Editing with Generation Regularization [48.1] 大規模な言語モデルは定期的に更新する必要がある。
モデル編集は、新しいデータとは無関係な知識にも影響する可能性があるため、難しい。
文結合と拡張ランダムな事実を連成して生成規則化を行うモデル編集手法であるSAULを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:28:13 GMT)
Efficient Temporal Extrapolation of Multimodal Large Language Models with Temporal Grounding Bridge [47.8] 時間的接地機能を備えたMLLMをブートストラップする新しいフレームワークである時間的接地橋(TGB)について紹介する。
7つのビデオベンチマークでTGBを検証し,従来のMLLMと比較して大幅な性能向上を示した。
4フレームのシーケンスをトレーニングした本モデルでは,性能を犠牲にすることなく,最大16のシーケンスを効果的に処理する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 09:24:56 GMT)
RSA: Resolving Scale Ambiguities in Monocular Depth Estimators through Language Descriptions [47.6] 一つの画像から深度を推定することは、視線投影によるスケールの損失による不適切な問題である。
我々の目標は、線形変換によりメートルスケールの深度マップを復元することである。
提案手法は,画像中のオブジェクトを記述したテキストキャプションを入力として,線形変換のパラメータを出力する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:18:13 GMT)
Evaluating Perceptual Distance Models by Fitting Binomial Distributions to Two-Alternative Forced Choice Data [47.2] クラウドソースの知覚データセットが登場し、三つ子間で画像が共有されないため、ランク付けが不可能になった。
両面分布を用いた2AFC実験において,基礎となる意思決定過程を統計的にモデル化する。
距離モデルに対する有意義かつ十分に確立されたメトリクスを、単なる予測精度をパーセンテージ・アグリーメントとして計算する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:10:22 GMT)
LV-Eval: A Balanced Long-Context Benchmark with 5 Length Levels Up to 256K [47.0] LV-Evalは5つの長さレベルが256kまで達する長文の長文ベンチマークである。
LV-Evalの利点は、異なるコンテキストの長さにわたる制御可能な評価、紛らわしい事実を持つテストインスタンスへの挑戦、より客観的な評価である。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 07:54:07 GMT)
Choices are More Important than Efforts: LLM Enables Efficient Multi-Agent Exploration [46.9] 本稿では,多言語探索を効率的に行うために,LLM (Large Language Model) から情報伝達タスク関連ガイダンスを選択する LEMAE を提案する。
具体的には,LLMからの言語知識を,低推論コストで識別的に,タスク遂行に不可欠な記号的キー状態に分類する。
LEMAEは冗長な探索を減らし、既存のSOTAアプローチよりも大きなマージン(例えば SMAC や MPE)で性能を向上し、特定のシナリオにおいて10倍の加速を達成する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:21:23 GMT)
MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions [46.6] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM)と人間の嗜好の整合性を示す。
トークンのシーケンスや高レベルの言語構造を含むマクロアクションを学習プロセスに組み込んだ,シンプルで効果的なRLHFフレームワークであるMA-RLHFを提案する。
提案手法は,テキスト要約,対話生成,質問応答,プログラム合成など,様々なモデルサイズやタスクにまたがる広範な実験を通じて検証される。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:55:13 GMT)
DailyDilemmas: Revealing Value Preferences of LLMs with Quandaries of Daily Life [46.1] 日常生活で遭遇した1,360の道徳的ジレンマのデータセットであるDailyDilemmasを提示する。
それぞれのジレンマは2つの可能なアクションを含み、それぞれのアクションでは、影響を受ける当事者と人間の価値が呼び出される。
我々は、社会学、心理学、哲学に触発された5つの一般的な理論のレンズを通して、これらの価値を分析した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:08:52 GMT)
StringLLM: Understanding the String Processing Capability of Large Language Models [46.0] 文字列処理におけるLarge Language Model' (LLMs) の能力は未熟であり、未熟である。
LLMの文字列処理能力をベンチマークするために、StringLLMを使ってデータセットを構築します。
評価の結果,LLMは人に比べて正確に文字列を処理するのに苦労していることが明らかとなった。
細調整によるLLMの文字列処理能力を大幅に向上する効果的な手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:29:07 GMT)
MIND: Multimodal Shopping Intention Distillation from Large Vision-language Models for E-commerce Purchase Understanding [45.5] MINDは、マルチモーダル製品メタデータから購入意図を推測し、人間中心のものを優先するフレームワークである。
Amazon Reviewのデータを使用して、1,264,441万の意図を含むマルチモーダルな意図的知識ベースを作成します。
得られた意図は2つの意図的理解タスクにおいて大きな言語モデルを大幅に向上させる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 07:03:00 GMT)
TransRef: Multi-Scale Reference Embedding Transformer for Reference-Guided Image Inpainting [45.3] 本稿では,トランスレフと呼ばれるトランスフォーマーベースのエンコーダデコーダネットワークを提案する。
参照特徴を正確に活用するために、参照パッチアライメント(Ref-PA)モジュールを提案し、参照画像と破損画像のパッチ特徴を整列させる。
入力画像と参照画像の50Kペアを含む,公開可能なベンチマークデータセットを構築した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:02:10 GMT)
Integrative Decoding: Improve Factuality via Implicit Self-consistency [45.3] 自己整合性に基づくアプローチは,大規模言語モデルの現実的精度向上に極めて有効である。
我々は、オープンな生成タスクにおける自己整合性の可能性を解き放つために、統合的復号化(ID)を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:11:24 GMT)
Integrative Decoding: Improve Factuality via Implicit Self-consistency [45.3] 自己整合性に基づくアプローチは,大規模言語モデルの現実的精度向上に極めて有効である。
我々は、オープンな生成タスクにおける自己整合性の可能性を解き放つために、統合的復号化(ID)を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:11:24 GMT)
Mitigating Dialogue Hallucination for Large Vision Language Models via Adversarial Instruction Tuning [45.1] LVLM(Large Vision Language Models)の幻覚は、汎用アシスタントの信頼性を高めるために重要である。
本稿では,従来のユーザ・システム対話によってLVLMの幻覚が著しく悪化することを示す。
このバイアスを軽減するために,幻覚的対話に対してLVLMを頑健に微調整するAdversarial Instruction Tuning (AIT)を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 18:08:57 GMT)
ReLIC: A Recipe for 64k Steps of In-Context Reinforcement Learning for Embodied AI [44.8] エンボディエージェントのためのテキスト内強化学習のための新しい手法であるReLICを提案する。
Relicでは、エージェントは64,000ステップのコンテキスト内エクスペリエンスを使用して、新しい環境に適応することができる。
Relicは、専門家によるデモンストレーションでトレーニングを受けなくても、数発の模倣学習が可能であることに気付きました。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:58:11 GMT)
On Leakage of Code Generation Evaluation Datasets [44.5] コード生成テストセットによる汚染について考察する。
これを解決するために、LBPP(Less Basic Python Problems)をリリースします。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:48:55 GMT)
Achieving Generalization in Orchestrating GNSS Interference Monitoring Stations Through Pseudo-Labeling [44.2] ジャミング装置はグローバルナビゲーション衛星システム(GNSS)受信機の精度を損なう。
本稿では,ハイウェイに沿って配置された監視局を介し,干渉の分類を高度に一般化するML手法を提案する。
本手法は,屋内環境から現実シナリオへの適応において,高い性能を示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 11:07:17 GMT)
Ethio-Fake: Cutting-Edge Approaches to Combat Fake News in Under-Resourced Languages Using Explainable AI [44.2] 誤報はコンテンツの作成や拡散が容易なため、急速に広まることがある。
従来のフェイクニュース検出のアプローチは、コンテンツベースの機能にのみ依存することが多い。
本稿では,ソーシャルコンテキストに基づく機能とニュースコンテンツ機能を統合した包括的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:49:35 GMT)
Does Instruction Tuning Make LLMs More Consistent? [44.2] 我々は、$textitConsistency$、すなわち、入力の小さな摂動に対する言語モデルの感度への影響を考察する。
10個の命令調整LLaMAモデルと元のLLaMA-7bモデルを比較し、ほぼ全車種がより一貫性を持つことを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 13:23:59 GMT)
StringLLM: Understanding the String Processing Capability of Large Language Models [44.0] 文字列処理におけるLarge Language Model' (LLMs) の能力は未熟であり、未熟である。
LLMの文字列処理能力をベンチマークするために、StringLLMを使ってデータセットを構築します。
評価の結果,LLMは人に比べて正確に文字列を処理するのに苦労していることが明らかとなった。
細調整によるLLMの文字列処理能力を大幅に向上する効果的な手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:29:07 GMT)
Flow Matching with Gaussian Process Priors for Probabilistic Time Series Forecasting [44.0] 時系列の条件付きフローマッチング(CFM)モデルであるTSFlowを紹介する。
ガウス過程を(条件付き)組み込むことで、TSFlowは以前の分布をデータの時間構造とより密に整合させる。
条件付きモデルと非条件付きモデルの両方が,予測ベンチマークにおいて競合する結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:12:50 GMT)
Reward-RAG: Enhancing RAG with Reward Driven Supervision [43.7] 本稿では、Reward-Driven Supervisionを通じて、Retrieval-Augmented Generation(RAG)モデルを強化するために設計された新しいアプローチであるReward-RAGを紹介する。
従来のRAG手法とは異なり,本手法ではCriticGPTを用いて検索情報を特定の領域に適応させ,専用報酬モデルを訓練する。
この報酬モデルは、RAGを微調整するための合成データセットを生成し、その出力を人間の好みとより密に一致させる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:26:50 GMT)
Towards Mitigating Spurious Correlations in the Wild: A Benchmark and a more Realistic Dataset [43.6] ディープニューラルネットワークは、しばしばクラスラベルと急激な相関を持つ非予測的特徴を利用する。
急激な相関を修復する最近の研究が増えているにもかかわらず、標準化されたベンチマークの欠如は再現可能な評価を妨げている。
本稿では,PythonパッケージであるSpuCoについて述べる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 04:09:42 GMT)
Scalable Label Distribution Learning for Multi-Label Classification [43.5] マルチラベル分類(MLC、Multi-label classification)とは、あるインスタンスに関連ラベルのセットをタグ付けする問題を指す。
既存のMLC法の多くは、ラベルペア内の2つのラベルの相関が対称であるという仮定に基づいている。
既存のほとんどの手法はラベル数に関連する学習プロセスを設計しており、大規模な出力空間にスケールアップする際の計算複雑性をボトルネックにしている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:42:08 GMT)
FastAdaSP: Multitask-Adapted Efficient Inference for Large Speech Language Model [43.5] 各種音声関連タスクに特化して設計された重み付きトークンマージフレームワークであるFastAdaSPを提案する。
FastAdaSPは、感情認識(ER)や音声質問応答(SQA)といったタスクを劣化させることなく、7倍のメモリ効率と1.83倍の復号スループットを達成した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:33:07 GMT)
BACKTIME: Backdoor Attacks on Multivariate Time Series Forecasting [43.4] 本稿では,BackTime という効果的な攻撃手法を提案する。
MTSデータにいくつかのステルスなトリガを微妙に注入することで、BackTimeは攻撃者の意図に応じて予測モデルの予測を変更することができる。
BackTimeは、まずデータ中の有害なタイムスタンプを特定し、次に、ステルスで効果的なトリガーを適応的に合成する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:16:49 GMT)
Robustness of Explainable Artificial Intelligence in Industrial Process Modelling [43.4] 我々は,地中真実シミュレーションと感度解析に基づいて,現在のXAI手法を評価する。
モデル化された産業プロセスの真の感度を正確に予測する能力において,XAI法とXAI法の違いを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:47:40 GMT)
Self-Constructed Context Decompilation with Fined-grained Alignment Enhancement [43.3] 逆コンパイルは、ソースコードが利用できない場合、コンパイルされたコードをハイレベルなプログラミング言語に変換する。
これまでの研究は主に、モデルパラメータのスケールや事前トレーニングのためのトレーニングデータを増やすことで、デコンパイル性能の向上に重点を置いてきた。
これら2つの手法を統合することで、Decompile-Evalベンチマークで約3.90%の再実行可能性向上を実現し、新しい最先端性能52.41%を確立した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:43:25 GMT)
NNetscape Navigator: Complex Demonstrations for Web Agents Without a Demonstrator [42.8] NNetscape Navigator (NNetnav)は、ウェブエージェントを人工的なデモンストレーションで完全に訓練する方法である。
NNetnavは、言語命令の階層構造を利用して、この検索をより魅力的にしている。
WebArenaで6k以上のNNetnavデモのデータセットをリリースしました。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:56:51 GMT)
Individuation of 3D perceptual units from neurogeometry of binocular cells [42.2] 我々は citeBCSZ23 で導入されたステレオビジョンに対する神経幾何学的サブリーマンモデルを拡張した。
ニューラルベースアルゴリズムを統合して局所的にステレオ対応を達成し、同時に、対応するポイントをグローバルな知覚単位に整理する新しい対応フレームワークが導入された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:01:41 GMT)
Identification For Control Based on Neural Networks: Approximately Linearizable Models [42.2] 本研究では,非線形システムの効率的な制御設計と安定性解析のための制御指向同定手法を提案する。
ニューラルネットワークは離散時間非線形状態空間モデルを特定し、時間領域の入力出力挙動を近似する。
ネットワークは、同定されたモデルがフィードバックによってほぼ線形化可能であるように構成され、制御則が学習段階から自明に従うことを保証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:59:15 GMT)
Cut the Crap: An Economical Communication Pipeline for LLM-based Multi-Agent Systems [42.1] $texttAgentPrune$は、メインストリームのマルチエージェントシステムにシームレスに統合できる。
textbf(I)は、既存のマルチエージェントフレームワークとシームレスに統合され、28.1%sim72.8%downarrow$トークンの削減を行う。
textbf(III)は2種類のエージェントベースの敵攻撃に対して3.5%sim10.8%uparrow$パフォーマンス向上で防御に成功した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:14:31 GMT)
Self-Explore: Enhancing Mathematical Reasoning in Language Models with Fine-grained Rewards [42.1] 大規模言語モデル(LLM)の推論能力向上には,大量の論理学(CoTファインチューニング)の訓練が有効である。
本稿では,LLMが論理学における最初の間違ったステップを探索し,より詳細な報奨などの信号を用いてさらなる改善を行うセルフエクスロアを提案する。
GSM8KとMATHテストセットでは、教師付き微調整(SFT)と比較して平均11.57%と2.89%の改善を達成した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:55:41 GMT)
Traffic Light or Light Traffic? Investigating Phrasal Semantics in Large Language Models [41.2] 本研究は,フレーズ意味論を理解するためのAPIベースの大規模言語モデルの能力について批判的に考察する。
自然言語命令で指示されたフレーズ意味推論タスクの実行におけるLLMの性能を評価する。
句意味論の理解において, LLM が直面する制約を解釈するために, 詳細な誤り解析を行う。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:44:17 GMT)
Exploring the Practicality of Generative Retrieval on Dynamic Corpora [41.2] 本稿では,自己回帰型言語モデルをIR問題に適用する生成検索(GR)に焦点を当てる。
我々はまた、IRシステムの実環境展開において重要な要素である計算効率とメモリ効率を広範囲に評価する。
本稿では,動的環境における実用的な赤外線システムにおけるGRの可能性について述べる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:08:07 GMT)
Multimodal Self-Instruct: Synthetic Abstract Image and Visual Reasoning Instruction Using Language Model [41.1] 大規模な抽象画像と視覚的推論命令を合成するために,大規模言語モデルとそのコード機能を利用したマルチモーダル自己インストラクトを設計する。
我々のベンチマークは単純な線と幾何学的要素で構築されており、最も先進的なLMMの欠点を明らかにする。
合成データの質を検証するため,62,476の合成チャート,表,道路地図の指示を用いてLMMを微調整する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:12:06 GMT)
ControlAR: Controllable Image Generation with Autoregressive Models [40.7] 自動回帰画像生成モデルに空間制御を統合するための効率的なフレームワークであるControlARを導入する。
ControlARは条件付き復号法を利用して、制御と画像トークンの融合によって条件付けられた次の画像トークンを生成する。
その結果,コントロールARは従来の制御可能な拡散モデルを上回ることが示唆された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:28:07 GMT)
GUD: Generation with Unified Diffusion [40.6] 拡散生成モデルは、データサンプルにノイズを徐々に付加するプロセスを反転させることで、ノイズをデータに変換する。
設計自由度を大幅に向上した拡散生成モデル統合フレームワークを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:51:14 GMT)
A Survey on Point-of-Interest Recommendation: Models, Architectures, and Security [40.2] POI(Point-of-Interest)レコメンデーションシステムは、ユーザエクスペリエンスの充実、パーソナライズされたインタラクションの実現、デジタルランドスケープにおける意思決定プロセスの最適化に不可欠である。
従来のモデルから大規模言語モデルのような高度な技術への移行を体系的に検討する。
セキュリティの重要性の高まりに対処し、潜在的な脆弱性とプライバシ保護アプローチを調べます。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:11:42 GMT)
Turning English-centric LLMs Into Polyglots: How Much Multilinguality Is Needed? [40.1] 英語中心の大規模言語モデルにおいて,多言語間の一般化を実現するために必要な最小限の多言語性について検討する。
複数言語から3言語までの多言語命令チューニングは,効果的な言語間一般化を実現するのに必要かつ十分であることがわかった。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:27:28 GMT)
WPO: Enhancing RLHF with Weighted Preference Optimization [40.1] 人間からのフィードバックからの強化学習(RLHF)は、大きな言語モデル(LLM)と人間の価値をより緊密に整合させる、有望なソリューションである。
オフ・ポリティクスの選好最適化は、データ収集に使用されるポリシーとターゲットポリシーの間の分散的なギャップに悩まされることが多く、最適化の準最適化につながる。
本稿では,この問題を解決するための新たな戦略を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:37:02 GMT)
Large Language Models Can Self-Correct with Key Condition Verification [39.7] 単純で効果的な検証手法は,大規模言語モデルの本質的な能力を解き放つことができる。
本稿では, 誤応答を段階的に識別し, 訂正する反復的検証列補正フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:00:53 GMT)
BinaryDM: Accurate Weight Binarization for Efficient Diffusion Models [39.3] 本稿では,バイナライズされたDMを正確かつ効率的に推し進めるため,DMの新しい重み付きバイナライズ手法,すなわちBinaryDMを提案する。
表現の観点からは、EDB(Evolvable-Basis Binarizer)を提示し、完全精度から正確に二項化できるDMのスムーズな進化を可能にする。
実験により、BinaryDMは、超低ビット幅でのDMのSOTA量子化法と比較して、高い精度と効率向上を達成することが示された。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:50:48 GMT)
SLMRec: Empowering Small Language Models for Sequential Recommendation [38.5] シーケンシャルレコメンデーションタスクでは、過去のインタラクションを考慮して、ユーザが対話する可能性のある次の項目を予測する。
最近の研究は、LCMがシーケンシャルレコメンデーションシステムに与える影響を実証している。
LLM の巨大なサイズのため、現実のプラットフォームに LLM ベースのモデルを適用するのは非効率で実用的ではない。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:00:05 GMT)
Clinnova Federated Learning Proof of Concept: Key Takeaways from a Cross-border Collaboration [38.5] Clinnova-MSは、FLを用いて、病気の進行を検知し、介入を誘導し、複数のサイトにわたってデジタルバイオマーカーを検証する、より正確なモデルを開発することで、MS患者のケアを強化することを目的としている。
この技術報告は、Clinnovaフレームワーク内のMRI画像のMSセグメント化に関する、最初の国境を越えたPOCからの洞察と重要な知見を提示する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:40:52 GMT)
Resilience of Large Language Models for Noisy Instructions [38.3] 大規模言語モデル(LLM)は、ヒューマンコマンドを解釈し、様々なタスク間でテキストを生成する強力なツールとして登場した。
本研究では, ASR(Automatic Speech Recognition)エラー, OCR(Optical Character Recognition)エラー, 文法的誤り, 気まぐれな内容を含む5種類の障害に対するLLMのレジリエンスについて検討した。
以上の結果から,一部のLCMは特定の騒音に対する耐性を示すが,全体的な性能は著しく低下することが明らかとなった。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:19:14 GMT)
PharmacyGPT: The AI Pharmacist [38.2] 本稿では,臨床薬理士の役割を模擬した大規模言語モデル(LLM)の能力を評価するためのフレームワークであるPharmacyGPTを紹介する。
我々はノースカロライナ大学チャペルヒル病院(UNC)で集中治療室(ICU)から取得した実データを用いて調査を行った。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:55:29 GMT)
Cross-Lingual Unlearning of Selective Knowledge in Multilingual Language Models [38.1] 事前訓練された言語モデルは、プライベートデータや著作権データを含む膨大な量の情報を記憶し、重大な安全上の懸念を提起する。
センシティブなデータを除いた後、これらのモデルをリトレーニングすることは違法に高価であり、機械学習は実用的で費用対効果の高い代替手段となる。
本稿では,多言語モデルにおける機械学習の先駆的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 05:09:53 GMT)
Adjusted Expected Improvement for Cumulative Regret Minimization in Noisy Bayesian Optimization [38.0] 我々は, 累積的後悔の下で, 期待される改善機能に適応する。
評価コストと呼ばれる新しい量を、取得機能と比較する。
我々は、最大情報ゲインに基づいて、EICの高確率後悔上限を確立する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:17:50 GMT)
Mitigating Memorization In Language Models [37.9] 言語モデル(LM)は情報を「記憶」し、トレーニングデータをその重みにエンコードすることで、推論時クエリがそのデータの冗長な復活につながる。
本稿では,メモリ化緩和手法の高速化と評価を目的とした,小型で計算効率のよいLMのスイートであるTinyMemを紹介する。
特に,提案した未学習手法である BalancedSubnet は,目標タスクの性能を保ちながら,記憶情報を削除する他の緩和手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:53:51 GMT)
DocLens: Multi-aspect Fine-grained Evaluation for Medical Text Generation [37.6] 本稿では, 医療用テキストの完全性, 簡潔性, 帰属性を評価するための指標セットを提案する。
メトリクスは、インストラクションフォロー(プロプライエタリとオープンソースの両方)や教師付きエンタテインメントモデルなど、さまざまなタイプの評価者によって計算できる。
総合的な人間の研究によると、DocLensは既存の指標よりも医療専門家の判断とかなり高い一致を示している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:27:19 GMT)
On Training Data Influence of GPT Models [37.5] GPTfluenceは、トレーニング例がGPTモデルのトレーニングダイナミクスに与える影響を評価するための新しいアプローチである。
我々のアプローチは、個々のトレーニングインスタンスが、目標とするテストポイントに対する損失やその他の重要な指標などのパフォーマンストラジェクトリに与える影響をトレースする。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:56:12 GMT)
In2Core: Leveraging Influence Functions for Coreset Selection in Instruction Finetuning of Large Language Models [37.5] In2Coreアルゴリズムは,トレーニングモデルと評価サンプルの相関関係を解析し,コアセットを選択する。
LLMの微調整データにアルゴリズムを適用することで、トレーニングデータの50%で同様の性能を実現することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:34:06 GMT)
Defining Knowledge: Bridging Epistemology and Large Language Models [37.4] 我々は、NLPにおける知識の標準定義をレビューし、大言語モデル(LLM)に適用可能な解釈を形式化する。
我々は100人のプロの哲学者と計算機科学者を対象に、知識定義における彼らの好みと、LLMが本当に知っていけるかどうかについての見解を比較する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:01:01 GMT)
Optimal Strong Regret and Violation in Constrained MDPs via Policy Optimization [37.2] Emphconstrained MDPs(CMDPs)におけるオンライン学習の研究
提案アルゴリズムは, 対向型MDPに対して, 最先端のポリシー最適化アプローチを採用するプリミティブ・デュアル・スキームを実装している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:54:04 GMT)
MobileVLM: A Vision-Language Model for Better Intra- and Inter-UI Understanding [37.2] 我々は,UI内理解とUI間理解を両立させる2つの事前学習段階を含むMobileVLMを提案する。
モバイル事前トレーニングデータの不足に対処するため、中国製の大規模なモバイルデータセットMobile3Mをスクラッチから構築しました。
実験の結果,MobileVLMはテストセットと公開モバイルベンチマークの両方で優れており,既存のVLMよりも優れていた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:23:22 GMT)
MobileVLM: A Vision-Language Model for Better Intra- and Inter-UI Understanding [37.2] 我々は,UI内理解とUI間理解を両立させる2つの事前学習段階を含むMobileVLMを提案する。
モバイル事前トレーニングデータの不足に対処するため、中国製の大規模なモバイルデータセットMobile3Mをスクラッチから構築しました。
実験の結果,MobileVLMはテストセットと公開モバイルベンチマークの両方で優れており,既存のVLMよりも優れていた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:23:22 GMT)
Stalactite: Toolbox for Fast Prototyping of Vertical Federated Learning Systems [37.1] 本稿では,VFL(Vertical Federated Learning)システムのためのオープンソースのフレームワークであるemphStalactiteを紹介する。
VFLはデータサンプルが複数のデータ所有者にまたがる機能によって分割されるFLの一種である。
実世界のレコメンデーションデータセットでその使い方を実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:40:23 GMT)
Revisiting Prefix-tuning: Statistical Benefits of Reparameterization among Prompts [36.9] 本研究では,大規模事前学習モデルの微調整のためのプロンプトベース手法の理論的基礎について検討する。
再パラメータ化は単なる工学的トリックではなく、深い理論的基礎に根ざしていることを示す。
本研究は,プロンプトベース手法の理解を深める上で,理論的および経験的貢献を提供するものである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:30:24 GMT)
Labor Migration Modeling through Large-scale Job Query Data [36.9] 本稿では,大規模ジョブクエリデータを活用した深層学習に基づく時空間労働移動分析フレームワークDHG-SILを提案する。
具体的には,世界最大規模の検索エンジンからの求人情報による労働移動のプロキシとして,まず最初に労働移動の意図を取得する。
都市の移動特性を定量化するための4つの解釈変数を導入し、都市表現と協調して最適化する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:24:14 GMT)
Towards the Pedagogical Steering of Large Language Models for Tutoring: A Case Study with Modeling Productive Failure [36.8] 1対1の授業は、最も効果的な教育方法の1つである。
先進的で効果的な学習設計であるProductive Failure (PF) に倣って, 高校数学のプロトタイプチューターを作成する。
我々は,StratLがLLMの運営に成功し,生産的失敗の学習戦略に従うことを定量的に示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:15:41 GMT)
Mora: Enabling Generalist Video Generation via A Multi-Agent Framework [36.6] 既存のオープンソースモジュールを活用してSora機能を複製する,新しいマルチエージェントフレームワークであるMoraを紹介した。
VBench 上での Sora に匹敵する性能をMora が達成していることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:13:39 GMT)
StorySparkQA: Expert-Annotated QA Pairs with Real-World Knowledge for Children's Story-Based Learning [36.2] 我々は、専門家のアノテーションと思考プロセスを取得するために、既存の知識グラフによって強化されたアノテーションフレームワークを設計する。
StorySparkQAデータセットは,5,868のエキスパートアノテートされたQAペアと実世界の知識で構成されている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:04:50 GMT)
Beyond Squared Error: Exploring Loss Design for Enhanced Training of Generative Flow Networks [36.1] 異なる回帰損失は特定の発散対策に対応し、対応する発散対策の所望の特性に応じて退散損失を設計・解析できることを示す。
理論的枠組みに基づいて,シフトドコッシュ,リニアス(1/2),リニアス(1)という3つの新たな回帰損失を提案する。
提案した損失は既存のトレーニングアルゴリズムと互換性があり、収束速度、サンプルの多様性、堅牢性に関するアルゴリズムの性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:37:22 GMT)
Autoregressive Pre-Training on Pixels and Texts [35.8] 文書画像とテキストの両方で事前学習された自己回帰フレームワークを用いて、視覚的・テキスト的両言語の二重モードについて検討する。
本手法はマルチモーダル・トレーニング・ストラテジーを用いて,次のパッチ予測による視覚データと,次のトークン予測による回帰ヘッドおよび/またはテキストデータを利用する。
視覚データのみを訓練した一方向画素モデルでは,複数の言語理解タスクにおける最先端の双方向モデルに匹敵する結果が得られることがわかった。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:46:40 GMT)
Improving Unsupervised Constituency Parsing via Maximizing Semantic Information [35.6] 教師なしの選挙区は、文内のフレーズを木のような構文構成構造に整理する。
文ログ類似度(LL)を最大化する従来の目的は、構成構造と意味論の密接な関係を明示的に考慮していない。
教師なしメトリクスをトレーニングするための新しい目標:構成構造と文意味学の情報を最大化する(SemInfo)。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:04:00 GMT)
The Role of Deductive and Inductive Reasoning in Large Language Models [35.4] 大規模言語モデル(LLM)は人工知能、特に推論タスクにおいて大きな進歩を遂げている。
本稿では, 帰納的推論と帰納的推論を動的に統合することにより, LLM推論を強化するDID法を提案する。
以上の結果から,DIDはLLMにおける推論のための,より堅牢で認知に整合した枠組みを提供する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:30:47 GMT)
Articulate-Anything: Automatic Modeling of Articulated Objects via a Vision-Language Foundation Model [35.2] Articulate-Anythingは、テキスト、画像、ビデオを含む多くの入力モダリティから、多種多様な複雑なオブジェクトの明瞭化を自動化する。
本システムでは,メッシュ検索機構を通じて既存の3Dデータセットを,反復的に提案,評価,洗練を行うアクタ・クリティカル・システムとともに活用する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:42:16 GMT)
A Systematic Survey and Critical Review on Evaluating Large Language Models: Challenges, Limitations, and Recommendations [35.1] 大規模言語モデル(LLM)は、その顕著な能力により、最近大きな注目を集めている。
我々はこれらの不整合や信頼できない評価を引き起こす主要な課題と限界を体系的にレビューする。
批判的なレビューに基づいて、LLM評価が再現可能で、信頼性があり、堅牢であることを保証するために、私たちの視点と勧告を提示します。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:51:53 GMT)
The Instinctive Bias: Spurious Images lead to Illusion in MLLMs [34.9] MLLMは、非常に関連性が高いが、応答に矛盾する画像で構成されている。
本稿では,スプリアス画像の視覚錯視レベルを評価する最初のベンチマークである相関QAを提案する。
我々は9つの主流MLLMについて徹底的な分析を行い、これらの本能バイアスが様々な程度に普遍的に悩まされていることを指摘した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:40:20 GMT)
Best-of-Both-Worlds Policy Optimization for CMDPs with Bandit Feedback [34.7] Stradi et al.(2024) は、マルコフ決定過程に制約のある最初のベスト・オブ・ボス・ワールドズ・アルゴリズムを提案した。
本稿では,CMDPにおける帯域幅フィードバックを用いたベスト・オブ・ワールドズ・アルゴリズムを提案する。
本アルゴリズムは政策最適化手法に基づいており, 占有率に基づく手法よりも効率的である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:44:40 GMT)
NTU-NPU System for Voice Privacy 2024 Challenge [34.5] We implement emotion embeddeding and experiment with WavLM and ECAPA2 speaker embeddedders for the B3 baseline。
我々は,B5のMean Reversion F0を紹介した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:45:10 GMT)
Second Order Methods for Bandit Optimization and Control [34.5] 我々は,大規模な凸関数に対して,このアルゴリズムが最適($kappa$-2020と呼ぶ凸関数の観点で)となることを示す。
また,メモリを用いたオンライン凸最適化への2次帯域幅アルゴリズムの適用について検討した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 04:08:17 GMT)
Accelerating Training with Neuron Interaction and Nowcasting Networks [34.1] 学習可能な更新ルールは、トレーニングや使用に費用がかかり不安定になる可能性がある。
We propose NiNo to accelerate training based on weight nowcaster network (WNNs)。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:57:59 GMT)
User-centric Immersive Communications in 6G: A Data-oriented Approach via Digital Twin [34.0] 本稿では,異なるユーザ要求に合わせたネットワークモデリングをサポート可能なパーソナライズされたデータ管理を特徴とする,ネットワークリソース管理のためのデータ指向アプローチを提案する。
トレース駆動型ケーススタディでは、ユーザ中心ICの実現におけるアプローチの有効性と、6Gにおけるパーソナライズされたデータ管理の重要性が示されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:15:53 GMT)
Fine-Tuning Language Models with Differential Privacy through Adaptive Noise Allocation [33.8] 本稿では,モデルパラメータの重要性に基づいて適応的に付加雑音を割り当てる新しいアルゴリズムANADPを提案する。
ANADPは,一連のデータセットにおいて,通常の微調整と従来のDP微調整のパフォーマンスギャップを狭めることを実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:02:50 GMT)
Correlation and Navigation in the Vocabulary Key Representation Space of Language Models [33.7] 鍵分布がNTP分布に及ぼす影響について検討した。
NTP分布では、いくつかの上位トークンが典型的に正確であることを示す。
提案手法をオープンエンドおよびチェーンオブ思考(推論)生成に拡張する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:07:55 GMT)
MANTRA: The Manifold Triangulations Assemblage [33.4] MANTRAは,大規模,多様,そして本質的には高次モデルのベンチマーク用データセットである。
単純な複雑なニューラルネットワークは、単純なトポロジ不変量を取得することでグラフベースのニューラルネットワークよりも優れていることを実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:13:55 GMT)
Semantic Communication and Control Co-Design for Multi-Objective Correlated Dynamics [33.2] 本稿では,相関システムのセマンティックダイナミクスを学習するための機械学習手法を紹介する。
オートエンコーダ(AE)フレームワークでクープマン演算子を活用することにより、システム状態の進化は潜時空間で線形化される。
信号時相論理(STL)は、システム固有の制御ルールを符号化するために、論理意味論的クープマン(LSK)モデルによって組み込まれている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:38:54 GMT)
Agent Security Bench (ASB): Formalizing and Benchmarking Attacks and Defenses in LLM-based Agents [32.6] Agent Security Bench (ASB) は、LSMベースのエージェントの攻撃と防御を形式化し、ベンチマークし、評価するためのフレームワークである。
我々は, インジェクション攻撃10件, メモリ中毒攻撃, 新規のPlan-of-Thoughtバックドア攻撃, 混合攻撃10件, 対応するバックボーン13件についてベンチマークを行った。
ベンチマークの結果,システムプロンプト,ユーザプロンプト処理,ツール使用量,メモリ検索など,エージェント操作のさまざまな段階における重大な脆弱性が明らかになった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:30:47 GMT)
On the Adversarial Vulnerability of Pairwise Evaluation Using Large Language Models [32.5] 大規模言語モデル (LLM) を用いたペアワイズ評価は, 出力評価に広く採用されている。
評価設定自体が、ペアワイズ評価器がポイントワイズ評価器よりも望ましくない傾向を示す場合、バイアスを大幅に増幅できることがわかった。
また, 簡単な治療法として, ポイントワイズ推論をペアワイズ評価に取り入れることを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 09:38:48 GMT)
Neural Light Spheres for Implicit Image Stitching and View Synthesis [32.4] 暗黙的パノラマ画像縫合と再レンダリングのための球状神経電場モデル
従来の画像縫合法や放射場法に比べて再現性は向上した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:57:06 GMT)
An Evaluation of Large Pre-Trained Models for Gesture Recognition using Synthetic Videos [32.3] 本研究では,大規模な事前学習モデルを用いた映像に基づくジェスチャー認識における合成データの利用の可能性を検討する。
我々は,k-nearest近辺分類に使用する特徴を抽出するために,最先端のビデオエンコーダを用いている。
その結果, 実検動画の分類精度は, 比較的少数の実検動画に比べて有意に低いことがわかった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:31:14 GMT)
LEGO: Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion [32.1] コンピュータビジョンタスクでは、機能はしばしばテキスト、画像、ビデオなどの様々な表現、ドメイン、モダリティから来る。
本稿では,高次元の特徴空間から,類似性グラフを構成することで,より低次元の解釈可能なグラフ空間へシフトする。
我々のアプローチは関係中心であり、均質な空間で機能し、数学的に原理化されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:50:09 GMT)
LEGO: Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion [32.1] コンピュータビジョンタスクでは、機能はしばしばテキスト、画像、ビデオなどの様々な表現、ドメイン、モダリティから来る。
本稿では,高次元の特徴空間から,類似性グラフを構成することで,より低次元の解釈可能なグラフ空間へシフトする。
我々のアプローチは関係中心であり、均質な空間で機能し、数学的に原理化されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:50:09 GMT)
Position: LLM Unlearning Benchmarks are Weak Measures of Progress [32.0] 既存のベンチマークでは、候補となる未学習手法の有効性について、過度に楽観的で誤解を招く可能性がある。
既存のベンチマークは特に、情報を忘れることと保持することの間に、さらに緩やかな依存関係をもたらす変更に対して脆弱である、と認識しています。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:07:25 GMT)
Conditional Image Synthesis with Diffusion Models: A Survey [31.9] ユーザ指定要求に基づく条件付き画像合成は、複雑な視覚コンテンツを作成する上で重要な要素である。
近年、拡散に基づく生成モデリングは条件付き画像合成の非常に効果的な方法となり、文献の指数的成長につながっている。
本研究では,拡散モデルの基礎となる2つの要素に条件がどのように組み込まれているかに基づいて,既存の研究を分類する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:01:03 GMT)
Conditional Image Synthesis with Diffusion Models: A Survey [31.9] ユーザ指定要求に基づく条件付き画像合成は、複雑な視覚コンテンツを作成する上で重要な要素である。
近年、拡散に基づく生成モデリングは条件付き画像合成の非常に効果的な方法となり、文献の指数的成長につながっている。
本研究では,拡散モデルの基礎となる2つの要素に条件がどのように組み込まれているかに基づいて,既存の研究を分類する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:01:03 GMT)
A LLM-Powered Automatic Grading Framework with Human-Level Guidelines Optimization [31.7] 学習分析(LA)の文脈において、学習者の反応をより深く把握するための強力なツールとして、オープン・エンド・ショート・アンサー・質問(SAG)が広く認識されている。
SAGは、高グレードの作業負荷と一貫性のない評価に関する懸念のために、実際に課題を提示することが多い。
本稿では,大規模言語モデル(LLM)をSAGのグレーダとして活用する統合型マルチエージェントASAGフレームワークであるGradeOptを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:11:24 GMT)
Quantifying Generalization Complexity for Large Language Models [31.7] 大規模言語モデルの一般化能力を定量的に測定する動的評価フレームワークであるScyllaを紹介する。
Scyllaは、イン・ディストリビューション(ID)データとアウト・オブ・ディストリビューション(OOD)データの両方でモデル性能を評価することによって、メモリ化から一般化を遠ざける。
LLaMAやQwenファミリといったオープンソースモデルと、ClaudeやGPTといったクローズソースモデルの両方を含む28LLMをベンチマークします。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:30:12 GMT)
Quantifying Generalization Complexity for Large Language Models [31.7] 大規模言語モデルの一般化能力を定量的に測定する動的評価フレームワークであるScyllaを紹介する。
Scyllaは、イン・ディストリビューション(ID)データとアウト・オブ・ディストリビューション(OOD)データの両方でモデル性能を評価することによって、メモリ化から一般化を遠ざける。
LLaMAやQwenファミリといったオープンソースモデルと、ClaudeやGPTといったクローズソースモデルの両方を含む28LLMをベンチマークします。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:30:12 GMT)
Identifying and Solving Conditional Image Leakage in Image-to-Video Diffusion Model [31.7] 拡散モデルは、予想より少ない動きでビデオを生成する傾向がある。
推論とトレーニングの両方の観点からこの問題に対処します。
提案手法は,より低い誤差で高い動作スコアを生成することにより,ベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:52:55 GMT)
Archon: An Architecture Search Framework for Inference-Time Techniques [31.7] 大規模言語モデル(LLM)の能力を高めるために、推論時のテクニックが、非常に効果的なツールとして登場しています。
推論時間技術と1つ以上のLLMを組み合わせたシステムを開発する上でのベストプラクティスについては,まだ理解が限られている。
推論時アーキテクチャを設計するための自動化フレームワークであるArchonを紹介します。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:41:48 GMT)
Archon: An Architecture Search Framework for Inference-Time Techniques [31.7] 大規模言語モデル(LLM)の能力を高めるために、推論時のテクニックが、非常に効果的なツールとして登場しています。
推論時間技術と1つ以上のLLMを組み合わせたシステムを開発する上でのベストプラクティスについては,まだ理解が限られている。
推論時アーキテクチャを設計するための自動化フレームワークであるArchonを紹介します。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:41:48 GMT)
Archon: An Architecture Search Framework for Inference-Time Techniques [31.7] Archonは推論時のテクニックのレイヤを選択し、組み合わせ、積み重ねるためのフレームワークである。
我々は,Archonアーキテクチャを,命令フォロー,推論,コーディングベンチマークの範囲で評価する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:41:48 GMT)
Automated Tone Transcription and Clustering with Tone2Vec [31.6] Tone2Vecという音調転写のためのピッチベース類似性表現を導入する。
方言クラスタリングと分散の実験により、Tone2Vecはきめ細かなトーン変化を効果的に捉えていることが示された。
これらのアルゴリズムは、オープンソースで使いやすいパッケージであるToneLabに統合されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:18:54 GMT)
Disentangled Representation Learning for Parametric Partial Differential Equations [31.2] ニューラル演算子パラメータから不整合表現を学習するための新しいパラダイムを提案する。
DisentangOは、ブラックボックス・ニューラル・オペレーターパラメータに埋め込まれた変動の潜在的物理的要因を明らかにし、取り除くように設計された、新しいハイパーニューラル・オペレーターアーキテクチャである。
本研究では、DentangOが有意義かつ解釈可能な潜在特徴を効果的に抽出し、ニューラルネットワークフレームワークにおける予測性能と身体的理解の分離を橋渡しすることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:40:39 GMT)
Vinoground: Scrutinizing LMMs over Dense Temporal Reasoning with Short Videos [30.7] 我々は,1000対の短いビデオキャプチャと自然なビデオキャプチャのペアを含む時間的対実的LMM評価ベンチマークであるVinogroundを紹介した。
既存のLMMは、異なる動作とオブジェクト変換の時間的差異を区別するのに苦労していることを示す。
すべてのオープンソースマルチモーダルモデルとCLIPベースのモデルは、かなりパフォーマンスが悪く、大半がランダムな確率性能を生み出している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:59:58 GMT)
Hierarchical Deconstruction of LLM Reasoning: A Graph-Based Framework for Analyzing Knowledge Utilization [30.3] 大規模言語モデル(LLM)が推論の知識をどのように利用するのかは、まだよく分かっていない。
我々は,DepthQAデータセットを開発し,質問を3つの深さに分解する: (i)概念的知識の想起, (ii)手続き的知識の適用, (iii)戦略的知識の分析。
差分パターンは、モデルのキャパシティとトレーニングデータ記憶の可能性にまたがって観察される。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:55:21 GMT)
Mitigating Downstream Model Risks via Model Provenance [30.1] モデルレコードの作成を簡単にするための機械可読モデル仕様フォーマットを提案する。
私たちのソリューションは、アップストリームモデルとダウンストリームモデルの関係を明確にトレースし、透明性とトレーサビリティを向上します。
この概念実証の目的は、基礎モデルを管理するための新しい標準を設定し、イノベーションと責任あるモデル管理のギャップを埋めることである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:52:15 GMT)
Learning Diverse Bimanual Dexterous Manipulation Skills from Human Demonstrations [29.9] BiDexHDは、既存のバイマニュアルデータセットからタスク構築を統一するフレームワークであり、教師-学生ポリシー学習を使用してすべてのタスクに対処する。
TACOデータセットに対する実証的な評価は、6つのカテゴリで141のタスクにまたがっており、トレーニングされたタスクでは74.59%、目に見えないタスクでは51.07%のタスク実行率を示している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:35:15 GMT)
Cross-Embodiment Dexterous Grasping with Reinforcement Learning [29.9] デクスタースハンドは、複雑な現実世界の把握タスクに重要な可能性を秘めている。
本研究では,強化学習を用いたクロス・エボディーズ・デクスタラス・グリーティング・ポリシーの学習について検討する。
提案手法は,YCBデータセットからオブジェクトを把握した場合の80%の成功率を示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:36:02 GMT)
MAGID: An Automated Pipeline for Generating Synthetic Multi-modal Datasets [29.7] Multimodal Augmented Generative Images Dialogues (MAGID) はテキストのみの対話を多種多様な高品質の画像で拡張するためのフレームワークである。
その結果,MAGIDはベースラインと同等かそれ以上であり,人体評価の大幅な改善が見られた。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 00:32:22 GMT)
Synthetic continued pretraining [29.7] ドメイン固有文書の小さなコーパス上での合成継続事前学習を提案する。
合成データ拡張アルゴリズムであるEntiGraphでこの提案をインスタンス化する。
合成データ拡張が、よりデータ効率のよい学習を可能にするために、どのように知識を"再編成"できるかを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:07:25 GMT)
Deep Signature: Characterization of Large-Scale Molecular Dynamics [29.7] ディープシグナチャ(Deep Signature)は、複雑な力学と原子間相互作用を特徴付ける、計算的に抽出可能な新しいフレームワークである。
提案手法では,協調力学を局所的に集約してシステムのサイズを小さくするソフトスペクトルクラスタリングと,非滑らかな対話力学のグローバルな評価を行うシグネチャ変換を取り入れた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:37:48 GMT)
SAFLEX: Self-Adaptive Augmentation via Feature Label Extrapolation [29.6] 本稿では,既存の拡張戦略と新たなデータセットと学習タスクのギャップを効果的に埋める,データ拡張のための新しい効率的な方法を提案する。
我々の発見は、既存の拡張パイプラインを新しいデータタイプとタスクに適用する可能性を強調し、より適応性がありレジリエントなトレーニングフレームワークへの移行を示唆している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:21:49 GMT)
Retrieval-Oriented Knowledge for Click-Through Rate Prediction [29.6] クリックスルー率(CTR)予測は、パーソナライズされたオンラインサービスにとって不可欠である。
underlineretrieval-underlineoriented underlineknowledge(bfname)フレームワークは、実際の検索プロセスをバイパスする。
nameは、検索および集約された表現を保存および模倣する知識ベースを特徴とする。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:14:47 GMT)
Efficient Residual Learning with Mixture-of-Experts for Universal Dexterous Grasping [29.5] ResDexは、残留ポリシー学習とエキスパートの混合フレームワークを統合する新しいアプローチである。
88.8%の成功率で3,200のオブジェクトからなるDexGraspNetデータセット上での最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:33:02 GMT)
Extending Context Window of Large Language Models from a Distributional Perspective [29.3] 本稿では,回転角分布の観点から,コンテキストウィンドウ拡張タスクの最適化を提案する。
本稿では,回転角分布の乱れを最小限に抑える新しい拡張戦略を提案する。
提案手法は,既存の最先端手法よりも平均4.33%向上する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:43:30 GMT)
MUSCLE: A Model Update Strategy for Compatible LLM Evolution [29.0] 大きな言語モデル(LLM)は定期的に更新され、パフォーマンスが向上する。
あるモデルバージョンから別のモデルバージョンへのパフォーマンスのインスタンスレベルの低下(インスタンス回帰)は、特定の言語モデルの能力に関するユーザのメンタルモデルに干渉する可能性がある。
モデル更新におけるインスタンス回帰の程度を最小化するためのトレーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:10:13 GMT)
I4VGen: Image as Free Stepping Stone for Text-to-Video Generation [28.9] I4VGenは、事前訓練されたテキスト-ビデオ拡散モデルを強化するための新しいビデオ拡散推論パイプラインである。
I4VGenはアンカー画像合成とアンカー画像拡張テキスト・ビデオ合成の2段階からなる。
実験の結果,提案手法は高次視覚リアリズムとテキスト忠実度データセットを用いたビデオを生成することがわかった。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 06:36:14 GMT)
Extending Context Window of Large Language Models from a Distributional Perspective [28.9] 本稿では,回転角分布の観点から,コンテキストウィンドウ拡張タスクの最適化を提案する。
本稿では,回転角分布の乱れを最小限に抑える新しい拡張戦略を提案する。
提案手法は,既存の最先端手法よりも平均4.33%向上する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:43:30 GMT)
The Potential and Challenges of Evaluating Attitudes, Opinions, and Values in Large Language Models [28.7] 本稿では,Large Language Models (LLMs) における態度, 意見, 価値 (AOVs) の評価に関する最近の研究の概要について概説する。
これにより、社会科学におけるモデル、人間とAIの整合性、下流の応用を理解するための可能性と課題に対処する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 11:57:00 GMT)
Diagonalization of large many-body Hamiltonians on a quantum processor [28.7] 超伝導量子プロセッサを用いて、最大56箇所の2次元格子上で量子多体系の固有エネルギーを計算する。
我々は、量子プロセッサ上で実行されるトロッター化されたユニタリ進化を用いて、多体ヒルベルト空間の部分空間を構築する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:22:52 GMT)
Text-to-Sticker: Style Tailoring Latent Diffusion Models for Human Expression [28.6] スタイルテイラーリング(Style Tailoring)は、視覚的品質、迅速なアライメント、シーンの多様性を持つ異なる領域において、潜在拡散モデル(LDM)を微調整するレシピである。
Emuのような有能なテキスト・ツー・イメージモデルから始めると、ステッカーを生成するためのフォトリアリスティックなモデルによって、迅速なアライメントとシーンの多様性を損なうことが示されます。
そこで我々は,コンテンツとスタイルの分布を協調的に適合させ,最良のトレードオフを実現する,スタイルタイラー方式という新しいファインチューニング手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 09:10:47 GMT)
Subsampled Ensemble Can Improve Generalization Tail Exponentially [27.9] アンサンブル学習は、機械学習モデルの精度を改善するための一般的なテクニックである。
多数決投票を通じてサブサンプルで訓練された最良のモデルを選択することで、アンサンブルに関する新たな視点を提供する。
重み付きデータや本質的なスローレートを含む様々な事例において,我々のアンサンブル手法がサンプル外性能を大幅に改善できることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:23:09 GMT)
Eliminating Oversaturation and Artifacts of High Guidance Scales in Diffusion Models [27.6] CFG更新ルールを再検討し、この問題に対処するための修正を導入する。
過飽和を伴わない高品質な世代を実現するために並列成分の低重み付けを提案する。
また、この知見に基づいて、CFG更新ルールに対する新しい再スケーリングモーメント手法も導入する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:06:29 GMT)
Bias Amplification in Language Model Evolution: An Iterated Learning Perspective [27.6] 我々は,Large Language Models (LLMs) の行動と人間の文化の進化の類似性を描いている。
我々のアプローチは、人間の文化進化においてどのように微妙なバイアスが拡大されるかを解明するベイズ的枠組みである反復学習(IL)を活用することである。
本稿では,ベイジアン・イルフレームワークにおけるエージェントの行動の特徴を概説する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 05:27:41 GMT)
Does Refusal Training in LLMs Generalize to the Past Tense? [27.5] 我々は過去に有害な要求を改定することは、しばしば多くの最先端のLCMを脱獄するのに十分であることを示した。
また, 将来の時制の改革は効果が低いことが示唆され, 過去の歴史的問題については, 仮説的な未来の問題よりも良質であると考える傾向が示唆された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:46:09 GMT)
AtomSurf : Surface Representation for Learning on Protein Structures [27.5] 本研究では,タンパク質学習タスクに最先端のサーフェスエンコーダを適用する。
次に、Atom3Dベンチマーク内の代替手法と比較する。
最後に、グラフと表面表現の学習的特徴共有を可能にする統合的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:55:41 GMT)
SPINE: Online Semantic Planning for Missions with Incomplete Natural Language Specifications in Unstructured Environments [27.5] 多くの現実的な環境では、事前構築された地図を得るのは難しい。
ミッションは不完全な指定であり、つまりサブタスクとセマンティクスを意味する。
SPINE(非構造環境における不完全な自然言語仕様を持つミッションのためのオンラインセマンティックプランナー)によるこれらの制限に対処する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:41:47 GMT)
SC-CDM: Enhancing Quality of Image Semantic Communication with a Compact Diffusion Model [27.5] 無線画像伝送のための生成SC(SC-CDM)を提案する。
我々は,Swin Transformerを効率的な意味的特徴抽出と圧縮のための新しいバックボーンとして再設計することを目指している。
我々はさらに、CNNベースのDeepJSCC上でPak Signal-to-Noise Ratio(PSNR)を17%以上増加させます。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:01:04 GMT)
Plug-and-Play Controllable Generation for Discrete Masked Models [27.4] 本稿では、離散データ制御可能な生成モデリングのための離散マスクモデルについて述べる。
本稿では,条件付きスコアのトレーニングを回避した重要サンプリングに基づく新しいプラグアンドプレイフレームワークを提案する。
本フレームワークは,制御基準の選択に非依存であり,勾配情報を必要としないため,後方サンプリングやベイズ逆問題,制約生成などのタスクに適している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:00:40 GMT)
High-Efficiency Neural Video Compression via Hierarchical Predictive Learning [27.4] 強化されたDeep Hierarchical Video Compression(DHVC 2.0)は、優れた圧縮性能と目覚ましい複雑さの効率を導入する。
階層的な予測符号化を使用して、各ビデオフレームをマルチスケール表現に変換する。
トランスミッションフレンドリーなプログレッシブデコーディングをサポートしており、パケットロスの存在下では特にネットワーク化されたビデオアプリケーションに有利である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:40:58 GMT)
Scalable Private Search with Wally [27.4] Wallyは、大規模なデータベースに対する効率的なセマンティック検索とキーワード検索クエリをサポートするプライベート検索システムである。
従来のプライベート検索システムでは、各クライアントクエリに対して、サーバはデータベースのエントリごとに少なくとも1つの高価な暗号処理を実行する必要がある。
それぞれのクライアントにいくつかの偽のクエリを追加し、匿名ネットワーク経由でサーバに送信することで、これらの結果が得られます。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:40:54 GMT)
CTSpine1K: A Large-Scale Dataset for Spinal Vertebrae Segmentation in Computed Tomography [27.3] CTSpine1Kと呼ばれる大規模な脊椎CTデータセットを導入する。
このデータセットは1,005CTボリュームを含み、11,100以上のラベル付き脊椎は異なる脊椎の状態に属している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 09:08:20 GMT)
Grounded Answers for Multi-agent Decision-making Problem through Generative World Model [27.3] 生成モデルは、複雑なマルチエージェント決定問題に対するスケッチ的で誤解を招くソリューションをしばしば生み出す。
本稿では,言語誘導シミュレータをマルチエージェント強化学習パイプラインに統合し,生成した回答を強化するパラダイムを示す。
特に、一貫した相互作用シーケンスと、相互作用状態における説明可能な報酬関数を生成し、未来の生成モデルを訓練するための道を開くことができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:49:59 GMT)
Harm Ratio: A Novel and Versatile Fairness Criterion [27.2] 好奇心は公平な分業研究の基盤となっている。
本研究では, 新たな公正度基準, 個人に対する有害度比を提案する。
私たちの基準は、重要な意思決定アルゴリズムを区別するのに十分強力です。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:36:05 GMT)
Can Large Language Models Grasp Legal Theories? Enhance Legal Reasoning with Insights from Multi-Agent Collaboration [27.0] 大きな言語モデル(LLM)は、法的理論を完全に理解し、法的推論タスクを実行するのに苦労する可能性がある。
法理論と推論能力に対するLLMの理解をよりよく評価するための課題(電荷予測の解釈)を導入する。
複雑な法的推論機能を改善するためのマルチエージェントフレームワークも提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:15:00 GMT)
DyGMamba: Efficiently Modeling Long-Term Temporal Dependency on Continuous-Time Dynamic Graphs with State Space Models [27.0] 連続時間動的グラフ(CTDG)の学習モデルであるDyGMambaを提案する。
DyGMambaは、ほとんどのケースで最先端を実現していることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:37:22 GMT)
Deep Koopman-layered Model with Universal Property Based on Toeplitz Matrices [27.0] 提案モデルは理論的固さと柔軟性の両方を有する。
提案したモデルの柔軟性により、不規則な力学系から来る時系列データを適合させることができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:27:46 GMT)
AI-Generated Faces in the Real World: A Large-Scale Case Study of Twitter Profile Images [26.9] われわれは,Twitter上でAI生成プロフィール画像の普及状況について,大規模な調査を行った。
約1500万枚のTwitterプロフィール写真を分析したところ、0.052%が人工的に生成され、プラットフォーム上での存在が確認された。
結果は、スパムや政治的増幅キャンペーンなど、いくつかの動機も明らかにしている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:22:20 GMT)
Task-Decoupled Image Inpainting Framework for Class-specific Object Remover [26.8] 本稿では,2つの異なるインペイントモデルを生成するタスク分離型画像インペイントフレームワークを提案する。
対象クラスのオブジェクトを削除することに焦点を当てたクラス固有のオブジェクト除去器を得る。
実験により,提案したクラス固有のオブジェクト除去器は,画像インパインティングネットワークに基づくオブジェクト除去器よりも,目的のクラスオブジェクトを除去できることがわかった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:32:33 GMT)
AURA : Automatic Mask Generator using Randomized Input Sampling for Object Removal [26.8] 本稿では,オフザシェルフ・イメージ・インパインティング・ネットワークを用いて,オブジェクトをよりよく除去するための入力マスクの生成に焦点をあてる。
本稿では,AI (XAI) 法にヒントを得た自動マスク生成手法を提案する。
実験により,本手法はセマンティックセグメンテーションマップから生成されたマスクよりも,ターゲットクラスオブジェクトの除去性能が向上していることが確認された。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 18:25:58 GMT)
Inductive Generative Recommendation via Retrieval-based Speculation [26.7] 生成的レコメンデーション(GR)は、アイテムを個別のトークンにトークン化し、次のトークンを予測として自動回帰的に生成することを学ぶ、新たなパラダイムである。
本稿では,プラグイン・アンド・プレイのフレームワークであるSpecGRを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:32:32 GMT)
Perfect Counterfactuals in Imperfect Worlds: Modelling Noisy Implementation of Actions in Sequential Algorithmic Recourse [26.6] アルゴリズムによる会話は、自動意思決定に悪影響を及ぼした個人に行動を与える。
環境変動性や個人の選択により、ユーザーが完璧に実装することを保証していない。
本稿では,RObust Sequential(ROSE)レコース生成器を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:47:42 GMT)
AttackBench: Evaluating Gradient-based Attacks for Adversarial Examples [26.4] アドリシャルな例は、通常、勾配ベースの攻撃に最適化される。
それぞれ異なる実験装置を用いて前任者を上回る性能を発揮する。
これは過度に最適化され、偏見のある評価を提供する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 07:07:25 GMT)
CtrlA: Adaptive Retrieval-Augmented Generation via Inherent Control [26.2] 大規模言語モデル(LLM)の幻覚を、検索された外部知識で緩和するための有望な解決策として、検索拡張世代(RAG)が出現している。
本稿では,適応的なRAGを表現的視点から解決し,固有な制御ベースフレームワークであるnameを開発するための最初の試みについて述べる。
実験により、名前は様々なタスクにおいて既存の適応RAG法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:09:31 GMT)
Semantic-Aware Adversarial Training for Reliable Deep Hashing Retrieval [26.2] 敵対的な例は、ディープハッシュモデルにセキュリティ上の脅威をもたらす。
逆のサンプルのハッシュコードと主スタイ特徴の間のハミング距離を最大化して作られた逆の例。
初めて、深部ハッシュの形式化された対角訓練を統一されたミニマックス構造に定式化する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:51:22 GMT)
Towards Implicit Bias Detection and Mitigation in Multi-Agent LLM Interactions [25.8] 大規模言語モデル(LLM)は、社会をシミュレートし、多様な社会的タスクを実行するために、多くの研究で採用されている。
LLMは、人為的なデータに曝されるため、社会的偏見に影響を受けやすい。
本研究では,多エージェントLDM相互作用における性バイアスの存在について検討し,これらのバイアスを軽減するための2つの方法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:28:05 GMT)
On the Limited Generalization Capability of the Implicit Reward Model Induced by Direct Preference Optimization [25.8] RLHFのようにEXRM(Explicit Reward Model)を訓練し、DPO(Direct Preference Optimization)などの手法を用いて、嗜好データから学習した暗黙の報酬を用いて報酬モデルを学習する。
本研究は,DPORM と EXRM の双方に対して,推奨回答と拒否回答を区別する精度について検討した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:13:04 GMT)
EPO: Hierarchical LLM Agents with Environment Preference Optimization [25.7] 本稿では,複雑なタスクを管理可能なサブゴールに分解する階層的フレームワークを提案する。
注釈のないデータセットのためのトレーニング信号を作成するという課題に対処するため,マルチモーダル環境フィードバックを利用して報酬信号を自動的に生成する報酬モデルを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:35:09 GMT)
DecTrain: Deciding When to Train a DNN Online [25.4] ディープニューラルネットワーク(DNN)は、デプロイメントデータがトレーニングデータと異なる場合、精度が低下する可能性がある。
我々は,低オーバーヘッドで自己スーパービジョンを用いて,単眼深度DNNのオンライントレーニングをいつ行うかを決定する新しいアルゴリズムであるDecTrainを提案する。
DecTrainはオンライントレーニングに比べ精度を保ち、平均的なトレーニング時間は44%に過ぎません。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:43:59 GMT)
Imitation Learning from Observation through Optimal Transport [25.4] イミテーション・ラーニング・オブ・オブ・オブ・オブ・観察(ILfO)は、学習者が専門家の行動を模倣しようとする環境である。
学習モデルや逆学習を必要とせずに、既存の手法を単純化して報酬関数を生成することができることを示す。
我々は,このシンプルな手法が様々な連続制御タスクに対して有効であることを示し,IlfO設定の技法の状態を超越していることを見出した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:13:51 GMT)
Remember and Recall: Associative-Memory-based Trajectory Prediction [25.3] 我々は,人間の顕著な学習能力に触発された,フラグメンテッドメモリに基づく軌道予測(FMTP)モデルを提案する。
FMTPモデルは、情報冗長性を低減し、計算効率を向上させるために離散表現を用いる。
言語モデルに基づく高度な推論エンジンを開発し、これらの離散表現間の連想規則を深く学習する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:32:21 GMT)
Sample-Optimal Quantum State Tomography for Structured Quantum States in One Dimension [25.3] 物理量子測度を用いて、状態コピーの数が情報理論境界(すなわち$O(n)$)を飽和させるかどうかを検討する。
制約付き最小二乗問題の解法として,予測勾配降下(PGD)アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:26:26 GMT)
PathSeeker: Exploring LLM Security Vulnerabilities with a Reinforcement Learning-Based Jailbreak Approach [25.3] 大規模言語モデル(LLM)が広く普及し、セキュリティに対する懸念が高まっている。
そこで我々は,迷路から逃れるネズミのゲームに触発された新しいブラックボックスジェイルブレイク手法PathSeekerを紹介した。
提案手法は,13の商用およびオープンソース LLM を対象としたテストにおいて,最先端の攻撃技術として5つの性能を発揮した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:13:52 GMT)
PathSeeker: Exploring LLM Security Vulnerabilities with a Reinforcement Learning-Based Jailbreak Approach [25.3] PathSeekerは,セキュリティ迷路から逃れる概念に触発された,新しいブラックボックスジェイルブレイク手法である。
本システムは,モデルからのフィードバックに基づいて入力を変更することにより,よりリッチで有害な応答を誘導する。
提案手法は,13の商用およびオープンソース LLM を対象としたテストにおいて,最先端の攻撃技術として5つの性能を発揮した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:13:52 GMT)
DetoxLLM: A Framework for Detoxification with Explanations [25.2] 最初の包括的エンドツーエンドデトキシフィケーションフレームワークであるDetoxLLMを提案する。
まず,マルチステップデータ処理と生成戦略を適用したクロスプラットフォーム擬似並列コーパスを提案する。
我々の脱毒モデルは、人間に注釈付き並列コーパスで訓練されたSoTAモデルより優れていることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 23:53:45 GMT)
Erasing Conceptual Knowledge from Language Models [24.6] 言語記憶の消去(英語: Erasure of Language Memory, ELM)は、無実性、シームレス性、特異性を中心とした評価パラダイムである。
ELMはターゲットの低ランク更新を使用して、消去された概念の出力分布を変更する。
ELMのバイオセキュリティ、サイバーセキュリティ、および文学ドメイン消去タスクに対する効果を実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:59:30 GMT)
End-to-end Driving in High-Interaction Traffic Scenarios with Reinforcement Learning [24.6] これらの問題に対処するために,Ranmble というエンドツーエンドモデルベース RL アルゴリズムを提案する。
環境のダイナミックスモデルを学ぶことで、Rambleは今後のトラフィックイベントを予測し、より情報に富んだ戦略的決定を下すことができる。
Rambleは、CARLA Leaderboard 2.0におけるルート完了率と運転スコアに関する最先端のパフォーマンスを達成し、複雑でダイナミックな交通状況を管理する上での有効性を示している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:45:59 GMT)
Simplicity bias and optimization threshold in two-layer ReLU networks [24.4] 過度なパラメータ化にもかかわらず、ネットワークはトレーニングデータを補間するのではなく、より単純な解へと収束することを示す。
我々の分析は、ニューロンが特定の方向に向かっているいわゆる早期アライメントフェーズに依存しています。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:58:57 GMT)
Dynamic Gradient Alignment for Online Data Mixing [23.8] 大規模言語モデル(LLM)を効果的に訓練するためには、学習データ混合物の構成が重要である
この問題に対する従来のアプローチには、アドホックリウェイト法、重要サンプリング、勾配アライメント技術などがある。
本稿では、勾配アライメントに着目し、スケーラブルなオンライン勾配アライメントアルゴリズムである動的勾配アライメント(DGA)を導入する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:00:44 GMT)
Closed-loop Long-horizon Robotic Planning via Equilibrium Sequence Modeling [23.6] 我々は、均衡に達するまで計画案を反復的に洗練する自己精製スキームを提唱する。
効率的なクローズドループ計画のためのネスト型平衡系列モデリング手法を考案した。
提案手法はVirtualHome-Envベンチマークで評価され,性能が向上し,推論精度が向上した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:37:22 GMT)
Closed-Loop Long-Horizon Robotic Planning via Equilibrium Sequence Modeling [23.6] 我々は、均衡に達するまで計画案を反復的に洗練する自己精製スキームを提唱する。
効率的なクローズドループ計画のためのネスト型平衡系列モデリング手法を考案した。
提案手法はVirtualHome-Envベンチマークで評価され,性能が向上し,推論精度が向上した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:37:22 GMT)
Source-Free Domain Adaptation Guided by Vision and Vision-Language Pre-Training [23.6] ソースフリードメイン適応(SFDA)は、完全にラベル付けされたソースドメインでトレーニングされたソースモデルを、関連するがラベル付けされていないターゲットドメインに適応させることを目的としている。
従来のSFDAパイプラインでは、ソースモデルを初期化するために、大量のデータ(イメージネットなど)を事前訓練した特徴抽出器が使用される。
トレーニング済みネットワークを対象適応プロセスに組み込むための統合フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:25:07 GMT)
Disentangling Textual and Acoustic Features of Neural Speech Representations [23.5] 我々は,複雑な音声表現のためのアンタングル化フレームワークを提案するために,インフォメーション・ボトルネックの原理に基づいて構築する。
我々は、感情認識と話者識別のための枠組みを下流のタスクに適用する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:48:04 GMT)
Determine-Then-Ensemble: Necessity of Top-k Union for Large Language Model Ensembling [23.4] 大規模言語モデル(LLM)は、様々なタスクに様々な長所と短所を示す。
既存のLLMアンサンブル法は、しばしばモデルの互換性を見落とし、確率の非効率なアライメントに苦しむ。
textscUnion textscTop-$k$ textscEnsembling (textscUniTE)は,各モデルから上位kトークンの結合に着目し,効率的にモデルを結合する新しいアプローチである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:42:38 GMT)
BiasDora: Exploring Hidden Biased Associations in Vision-Language Models [23.3] 9つのバイアス次元にまたがる隠された暗黙の関連について検討した。
相関関係が負性,毒性,極度にどのように変化するかを示す。
私たちの研究は、既存の方法論では認識されない微妙で極端なバイアスを特定します。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 23:51:14 GMT)
CodePMP: Scalable Preference Model Pretraining for Large Language Model Reasoning [23.2] 大規模言語モデル(LLM)は、スケーラブルな事前学習と高度な微調整によって、自然言語の理解と生成に大きな進歩をもたらした。
我々は,大規模なコード-参照ペアのコーパスを利用する,スケーラブルな選好モデル事前学習(PMP)パイプラインであるCodePMPを紹介する。
CodePMPは、大規模な合成コード-参照ペアの好みモデルを事前学習することで、RM微調整効率を向上する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:51:26 GMT)
PATIENT-Ψ: Using Large Language Models to Simulate Patients for Training Mental Health Professionals [22.9] patient-Psiは認知行動療法(CBT)トレーニングのための新しい患者シミュレーションフレームワークである。
我々は,精神保健研修生が CBT の重要なスキルを身につけるための,対話型トレーニングスキームである patient-Psi-TRAINER を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:05:32 GMT)
Dynamic Sparse Training versus Dense Training: The Unexpected Winner in Image Corruption Robustness [22.9] 動的スパーストレーニングは、頑健さの正確性の観点から、Dense Trainingを一貫して上回ります。
この結果から, ダイナミックスパーストレーニングの新たなメリットと, 新たな可能性が明らかとなった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:24:54 GMT)
Towards Comprehensive Detection of Chinese Harmful Memes [22.7] 中国初の有害ミームデータセットであるToxiCN MMは、12,000のサンプルと様々なミームタイプの細かいアノテーションから構成されている。
本稿では,ミーム内容の文脈情報を組み込んだベースライン検出器MKEを提案する。
実験結果から,中国の有害ミームの検出は既存モデルでは困難であることが示唆された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:51:02 GMT)
DeFT: Decoding with Flash Tree-attention for Efficient Tree-structured LLM Inference [22.7] 大規模言語モデル(LLM)は、トークンの共有プレフィックスを持つツリー構造において、複数の世代呼び出しを処理する複雑なタスクにますます採用されている。
木に基づくアプリケーションの既存の推論システムは、注意計算中にクエリとKVキャッシュの不適切なパーティショニングのために非効率である。
我々は,プレフィックス認識と負荷分散KVキャッシュパーティションを用いたハードウェア効率の高いアテンションアルゴリズムであるDeFTを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:17:01 GMT)
Geometry is All You Need: A Unified Taxonomy of Matrix and Tensor Factorization for Compression of Generative Language Models [22.6] 言語モデルパラメトリゼーションのための行列とテンソル誘導パラメトリゼーションの間の内部リンクは、よく理解されていない。
既存の行列とテンソルの研究は数学が重く、機械学習(ML)やNLPの研究概念から遠く離れている。
本稿では,MLおよびNLP研究において,行列/テンソル圧縮アプローチとモデル圧縮概念を橋渡しする統一分類法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:12:20 GMT)
Pick of the Bunch: Detecting Infrared Small Targets Beyond Hit-Miss Trade-Offs via Selective Rank-Aware Attention [22.6] 複雑な背景乱れの中で、赤外線小目標検出は、ディムターゲットを正確に位置決めする固有の課題に直面している。
本稿では,従来のヒットミストレードオフを超えて高精度なネットワークであるSeRankDetを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:09:33 GMT)
Understanding and Mitigating Miscalibration in Prompt Tuning for Vision-Language Models [22.5] 信頼性のキャリブレーションは、現実世界における機械学習モデルの安全なデプロイに不可欠である。
既存のプロンプトチューニング手法は、通常、ベースクラスと新しいクラスのキャリブレーションのトレードオフにつながる。
微調整後, 基本クラスと新クラスの信頼性校正を確保するために, ダイナミック・アウトレイラ正規化を導入する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:06:21 GMT)
Theoretical Insights into Fine-Tuning Attention Mechanism: Generalization and Optimization [22.3] 大規模言語モデル(LLM)の微調整中に観察される2つの顕著な現象について検討する。
$mathbfW_q$と$mathbfW_v$マトリックスのみを微調整することで、$mathbfW_k$マトリックスの最適化よりもパフォーマンスが大幅に向上する。
ストレージと時間の両方で微調整効率を向上させる新しい戦略を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:37:37 GMT)
Kick Bad Guys Out! Conditionally Activated Anomaly Detection in Federated Learning with Zero-Knowledge Proof Verification [22.1] フェデレーテッド・ラーニング(FL)システムは敵の攻撃を受けやすい。
現在の防衛方式は現実世界のFLシステムでは実用的ではないことが多い。
本稿では,現実のFLシステムを対象とした新しい異常検出手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 23:50:47 GMT)
Temporal Fact Reasoning over Hyper-Relational Knowledge Graphs [22.0] ハイパーリレーショナルTKG(HTKG)と呼ばれる新しいタイプのデータ構造を提案する。
HTKG内のすべての事実は、その時間の有効性を明確に示すタイムスタンプと結合される。
このトピックに関する今後の研究を支援するため、データセットとモデルをオープンソースにしています。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:43:43 GMT)
Immunization against harmful fine-tuning attacks [22.0] 大きな言語モデル(LLM)は、有害なテキスト生成を防ぐための安全ガードで訓練されることが多い。
しかし、有害なデータセット上でLLMを微調整することで、そのような安全トレーニングを除去することができる。
我々は「免疫」条件と呼ばれる攻撃者の訓練予算に基づく正式な枠組みを導入する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:39:32 GMT)
Updating CLIP to Prefer Descriptions Over Captions [21.9] 私たちはCLIPモデルを更新し、キャプションよりも高いスコアを記述に割り当てる。
このモデルは、移動能力を維持しながら盲人や低ビジョンの人々の判断と相関する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:10:20 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [21.8] 本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。
このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:25:23 GMT)
FactCheckmate: Preemptively Detecting and Mitigating Hallucinations in LMs [21.8] 言語モデル (LM) は幻覚を呈する。
この研究は、LMの内部表現が、この目的のために使用できるリッチな信号を提供することを示すことによって、この研究課題を肯定的に答える。
FactCheckMateを導入し、LMが幻覚するかどうかを予測する分類器を学習して幻覚を事前に検出する。
幻覚が検出されると、FactCheckMateが介入し、LMの隠れ状態を調整することで、モデルがより現実的な出力を生成する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:45:00 GMT)
CMP: Cooperative Motion Prediction with Multi-Agent Communication [21.6] 本稿では,協調動作予測の実現可能性と有効性について検討する。
提案手法であるCMPは,LiDAR信号をモデル入力とし,追跡と予測能力を向上させる。
特に、CMPは平均予測誤差を16.4%削減し、検出精度は低下している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:59:25 GMT)
GaNI: Global and Near Field Illumination Aware Neural Inverse Rendering [21.6] GaNIは、同じ位置にある光とカメラで撮影されたシーンの画像から、幾何学、アルベド、粗さのパラメータを再構築することができる。
既存の逆レンダリング技術と光カメラは、単一の物体のみに焦点を合わせている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:11:19 GMT)
Transformers are Universal In-context Learners [21.5] 深層変換器は、コンパクトなトークン領域を均一に、任意の精度で連続的なコンテキスト内マッピングを近似できることを示す。
我々の結果の重要な側面は、既存の結果と比較して、固定精度では、単一変圧器が任意の(無限の)トークン数で動作可能であることである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:43:59 GMT)
Rethinking and Defending Protective Perturbation in Personalized Diffusion Models [21.3] パーソナライズされた拡散モデル(PDM)の微調整過程について,ショートカット学習のレンズを用いて検討した。
PDMは小さな逆境の摂動に影響を受けやすいため、破損したデータセットを微調整すると著しく劣化する。
本稿では,データ浄化と対照的なデカップリング学習を含むシステム防衛フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:35:53 GMT)
MDSGen: Fast and Efficient Masked Diffusion Temporal-Aware Transformers for Open-Domain Sound Generation [21.2] MDSGenは視覚誘導型オープンドメイン音声生成のための新しいフレームワークである。
これには、冗長なビデオ機能削除モジュールと、時間対応のマスキング戦略という、2つの重要なイノベーションが含まれている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:23:44 GMT)
Lossy Cooperative UAV Relaying Networks: Outage Probability Analysis and Location Optimization [21.2] 無人無人航空機(UAV)リレー通信システムの解析を行った。
我々は,Soft Actor-Critic (SAC)アルゴリズムに基づく最適リレー位置同定アルゴリズムを設計する。
シミュレーションの結果,提案アルゴリズムはUAV位置を最適化し,システム停止確率を効果的に低減できることがわかった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:00:47 GMT)
Securing Equal Share: A Principled Approach for Learning Multiplayer Symmetric Games [21.2] マルチプレイヤーゲームにおける平衡は、一意でも爆発的でもない。
本稿では,平等な共有という自然な目的に焦点をあてることで,これらの課題に対処するための最初の一歩を踏み出す。
我々は、様々な設定でほぼ同じシェアを確実に得る、非回帰学習にインスパイアされた、一連の効率的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 01:34:02 GMT)
Demonstration Attack against In-Context Learning for Code Intelligence [21.2] 攻撃者が悪意あるデモを利用して、悪質なICLコンテンツを構築し、LSMを誘導して不正な出力を生成する方法を示す。
提案手法は,DICE(Demonstration Selection)とBad ICL Construction(Bad ICL Construction)の2段階から構成される。
本研究は,コードインテリジェンスシステムを敵の操作から守るためのICL機構の確保の重要性を強調した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:59:29 GMT)
Improving Fairness and Mitigating MADness in Generative Models [21.0] 我々は、意図的に設計されたハイパーネットワークで生成モデルをトレーニングすると、マイノリティクラスに属するデータポイントを生成する際により公平なモデルが得られることを示す。
本稿では,実データと自己合成データとの差分を正規化する手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:46:36 GMT)
Joint Channel Selection using FedDRL in V2X [21.0] 車両間通信技術(V2X)は、車両、デバイス、インフラ間の通信を可能にすることで、輸送に革命をもたらしている。
本稿では,異なる技術を持つ車両が1つ以上のアクセスポイント(AP)を選択してネットワーク上でメッセージを送信する,共同チャネル選択の問題について検討する。
本稿では,フェデレートディープ強化学習(Federated Deep Reinforcement Learning, FedDRL)に基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:04:08 GMT)
BadRobot: Manipulating Embodied LLMs in the Physical World [21.0] Embodied AIは、AIが物理的な実体に統合され、周囲を知覚し、相互作用することができるシステムを表す。
強力な言語理解能力を示すLarge Language Model(LLM)は、組み込みAIに広く採用されている。
我々は,従来の音声ベースのユーザシステムインタラクションを通じて,LLMを安全性や倫理的制約に違反させることを目的とした,新たな攻撃パラダイムであるBadRobotを紹介した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:31:39 GMT)
Towards Foundation Models and Few-Shot Parameter-Efficient Fine-Tuning for Volumetric Organ Segmentation [20.9] FSEFT(Few-Shot Efficient Fine-Tuning)は、医用画像セグメンテーション基礎モデルに適用するための、新規かつ現実的なシナリオである。
総合的な転写学習実験により, 医用画像分割における基礎モデルの適合性を確認し, 数ショットのシナリオにおいて, 一般的な微調整戦略の限界を明らかにする。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:53:04 GMT)
GraphIC: A Graph-Based In-Context Example Retrieval Model for Multi-Step Reasoning [20.9] 推論プロセスのグラフベースの表現をICEの選択に活用する新しいアプローチであるGraphICを提案する。
また,GraphICはICLの性能と相互運用性を向上し,多段階推論タスクにおけるICE選択を大幅に向上させることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:33:02 GMT)
Online Learning Guided Quasi-Newton Methods with Global Non-Asymptotic Convergence [20.8] 双対性ギャップの観点から、大域収束率を$O(min1/k,sqrtd/k1.25)$とする。
これらの結果は、外勾配法よりも準ニュートン法の証明可能な利点を示す最初の大域収束結果である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:08:16 GMT)
RiEMann: Near Real-Time SE(3)-Equivariant Robot Manipulation without Point Cloud Segmentation [20.7] 本稿では,シーンポイントクラウド入力からリアルタイムSE(3)-等価ロボットマニピュレーション模倣学習フレームワークRiEMannを提案する。
ディスクリプタのフィールドマッチングに依存する従来のメソッドと比較して、RiEMannはオブジェクトのセグメンテーションなしで操作するためのオブジェクトのターゲットポーズを直接予測する。
RiEMannは、5から10のデモで操作タスクをスクラッチから学習し、SE(3)変換とターゲットオブジェクトのインスタンスを一般化し、邪魔なオブジェクトの視覚的干渉に抵抗し、ターゲットオブジェクトのほぼリアルタイムのポーズ変更に従う。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 11:13:29 GMT)
Abstract Reward Processes: Leveraging State Abstraction for Consistent Off-Policy Evaluation [20.7] 本稿では,広範囲な推定対象を含む非政治評価のためのフレームワークSTARを紹介する。
実験により,STAR内の推定器が既存手法より優れていることを示す。
最適なSTAR推定器は, 調査対象12例すべてにおいて, ベースラインを上回った。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:19:43 GMT)
Graph-tree Fusion Model with Bidirectional Information Propagation for Long Document Classification [20.4] 長い文書分類は、その広範な内容と複雑な構造のために困難を呈する。
既存のメソッドはトークン制限に苦しむことが多く、ドキュメント内の階層的関係を適切にモデル化することができない。
本手法は,文エンコーディングのための構文木と文書エンコーディングのための文書グラフを統合し,より詳細な構文関係とより広い文書コンテキストを抽出する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:25:01 GMT)
Towards Understanding the Universality of Transformers for Next-Token Prediction [20.3] 因果変換器は、与えられたコンテキストに対して次のトークンを予測するように訓練される。
我々は,この現象を次々に予測するトランスフォーマーの近似能力について研究することで理解する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:42:21 GMT)
q-exponential family for policy optimization [20.2] 本稿では、より広範な政策ファミリーについて検討する:$q$-exponential family。
このポリシーのファミリはフレキシブルで、ヘビーテールのポリシー(q>1$)とライトテールのポリシー(q>1$)の両方を仕様化できる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:59:37 GMT)
The Mystery of In-Context Learning: A Comprehensive Survey on Interpretation and Analysis [20.1] In-context Learning (ICL) 機能により、大規模な言語モデルが実演例を通じて習熟できる。
本稿では,文脈内学習の解釈と分析について,徹底的な調査を行う。
我々は,本研究が,文脈内学習の解釈のさらなる探求の基盤となると信じている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:25:02 GMT)
PRompt Optimization in Multi-Step Tasks (PROMST): Integrating Human Feedback and Heuristic-based Sampling [20.1] マルチステップタスク(PROMST)におけるPRompt Optimizationを導入する。
人間が設計したフィードバックルールを組み込んで、改善のための直接提案を自動的に提供する。
これは、人間工学的なプロンプトと、他のいくつかのプロンプト最適化手法の両方において、11の代表的なマルチステップタスクよりも大幅に優れている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:11:43 GMT)
Methods for Automatic Matrix Language Determination of Code-Switched Speech [19.9] コードスイッチング (Code-switching, CS) は、2つ以上の言語間で話者が交流する過程である。
この研究において、マトリックス言語フレーム(MLF)理論は、マトリックス言語識別のためのシステムの開発に用いられた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:28:40 GMT)
Statistical Test on Diffusion Model-based Anomaly Detection by Selective Inference [19.9] 拡散モデルを用いて医療画像中の異常領域を検出する課題に対処する。
本稿では,検出された異常の信頼性を定量化する統計的手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:59:49 GMT)
TensorGPT: Efficient Compression of Large Language Models based on Tensor-Train Decomposition [19.9] 行列-トレイン分解(TTD)に基づく学習自由モデル圧縮手法を提案する。
次に,本手法により抽出された低ランク構造を,典型的なローエンドデバイス(Raspberry Pi)の圧縮率,言語タスク性能,レイテンシの観点から検討する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 23:28:27 GMT)
Cognitive Bias in Decision-Making with LLMs [19.9] 大規模言語モデル(LLM)は、幅広い意思決定タスクをサポートするツールとして大きな可能性を秘めている。
LLMは保護されたグループに対する社会的バイアスを継承し、認知バイアスと機能的に類似している。
私たちの研究は、LLMの認知バイアスを発見し、評価し、緩和するために設計されたフレームワークであるBiasBusterを紹介します。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:07:09 GMT)
Listening to the Wise Few: Select-and-Copy Attention Heads for Multiple-Choice QA [19.8] モデルの基礎となる知識を捕捉し、明らかにする新しいスコアを導入します。
これらの結果から,LLaMA2-7Bでは知識抽出が最大16%向上した。
モデルが正しい答えを明示的に知っている単純な合成データセットの精度は、ほぼ60%向上する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:53:48 GMT)
Multi-Channel Masked Autoencoder and Comprehensive Evaluations for Reconstructing 12-Lead ECG from Arbitrary Single-Lead ECG [19.7] 本研究では、任意のシングルリードECGから12リードECGを再構成するためのマルチチャネルマスク付きオートエンコーダ(MCMA)を提案する。
信号レベル評価では,平均平方誤差0.0317,0.1034,ピアソン相関係数0.7885,0.7420であった。
特徴レベル評価では、生成した12リード心電図の平均心拍数の平均標準偏差は1.0481であり、変動係数は1.58%、範囲は3.2874である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:38:12 GMT)
AnaloBench: Benchmarking the Identification of Abstract and Long-context Analogies [19.6] アナロジー思考は、人間が創造的な方法で問題を解決することを可能にする。
言語モデル(LM)も同じことができますか?
ベンチマークアプローチは、人間に共通するこの能力の側面に焦点を当てます。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:55:11 GMT)
Multilingual Synopses of Movie Narratives: A Dataset for Vision-Language Story Understanding [19.5] 我々はM-SYMON(Multilingual Synopses of Movie Narratives)という大規模多言語ビデオストーリーデータセットを構築した。
M-SYMONには、7つの言語からの13,166本の映画要約ビデオと、101.5時間のビデオの詳細なビデオテキスト対応のマニュアルアノテーションが含まれている。
SyMoNからの注釈付きデータのトレーニングは、Clip AccuracyとSentence IoUのスコアでそれぞれ15.7と16.2でSOTA法を上回ります。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 12:20:10 GMT)
miniCTX: Neural Theorem Proving with (Long-)Contexts [19.5] miniCTXは、トレーニング中に見えない新しい文脈に依存する形式的な数学的定理を証明するモデルの能力をテストする。
miniCTXには、実際のリーンプロジェクトと教科書に由来する定理が含まれており、それぞれに数万のトークンにまたがるコンテキストが関連付けられています。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:20:40 GMT)
MARVIS: Motion & Geometry Aware Real and Virtual Image Segmentation [19.5] 実画像領域と仮想画像領域のセグメンテーションのための新しい手法を提案する。
水面の複雑さを模倣するリアルな合成画像を作成することで、我々はネットワークにきめ細かいトレーニングデータを提供する。
我々は、目に見えない実世界の領域において、最先端の仮想画像分割性能を実現する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:44:51 GMT)
Channel-aware Contrastive Conditional Diffusion for Multivariate Probabilistic Time Series Forecasting [19.4] 本稿では,CCDM(Contrastive Conditional Diffusion)モデルを提案する。
提案したCCDMは,現在最先端の拡散予測器と比較して優れた予測能力を示すことができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:13:15 GMT)
Do We Need Domain-Specific Embedding Models? An Empirical Investigation [19.0] 埋め込みモデルは、様々なNLPアプリケーションにまたがる情報の表現と検索において重要な役割を果たす。
大規模言語モデルの最近の進歩は、埋め込みモデルの性能をさらに向上させた。
汎用モデルがすでに特殊なドメインテキストを含む巨大なコーパスで訓練されている場合、ドメイン固有の埋め込みモデルの開発は必要か?
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:44:40 GMT)
Do We Need Domain-Specific Embedding Models? An Empirical Investigation [19.0] FinMTEB(Massive Text Embedding Benchmark)の略であるFinMTEB(Massive Text Embedding Benchmark)を紹介する。
我々は、FinMTEB上での7つの最先端埋め込みモデルの性能評価を行い、MTEB上でのパフォーマンスと比較して顕著な性能低下を観測した。
我々の分析は、最先端の埋め込みモデルがドメイン固有の言語的および意味的なパターンを捉えるのに苦労しているという説得力のある証拠を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:44:40 GMT)
Do We Need Domain-Specific Embedding Models? An Empirical Investigation [19.0] FinMTEB(Massive Text Embedding Benchmark)の略であるFinMTEB(Massive Text Embedding Benchmark)を紹介する。
我々は、FinMTEB上での7つの最先端埋め込みモデルの性能評価を行い、MTEB上でのパフォーマンスと比較して顕著な性能低下を観測した。
我々の分析は、最先端の埋め込みモデルがドメイン固有の言語的および意味的なパターンを捉えるのに苦労しているという説得力のある証拠を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:44:40 GMT)
OOD-Chameleon: Is Algorithm Selection for OOD Generalization Learnable? [18.8] OOD一般化のためのアルゴリズム選択のタスクを形式化し、学習によってアプローチできるかどうかを検討する。
我々は,OOD-Chameleonと呼ばれる手法を提案し,そのタスクを候補アルゴリズムに対する教師付き分類として扱う。
データセットの特徴からアルゴリズムの相対的な性能を予測するためにモデルを訓練する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:52:42 GMT)
Unleashing Parameter Potential of Neural Representation for Efficient Video Compression [18.8] 暗黙的ニューラル表現(INR)技術は、ビデオ全体を基本単位としてモデル化し、フレーム内およびフレーム間の相関を自動的にキャプチャする。
本稿では,INRビデオ圧縮の速度歪み特性を大幅に向上させる手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:43:14 GMT)
Releasing the Parameter Latency of Neural Representation for High-Efficiency Video Compression [18.8] 暗黙的ニューラル表現(INR)技術は、ビデオ全体を基本単位としてモデル化し、フレーム内およびフレーム間の相関を自動的にキャプチャする。
本稿では,INRビデオ圧縮の速度歪み特性を大幅に向上させる手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:43:14 GMT)
LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via a Hybrid Architecture [18.5] LongLLaVAは最初のハイブリッドMLLMであり、効率と効率のバランスが良くなった。
A100 80GBのGPUで1000近い画像を処理し、幅広いタスクに期待できるアプリケーションの可能性を示している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:01:14 GMT)
Universality in Transfer Learning for Linear Models [18.4] 回帰モデルと二分分類モデルの両方を対象とした線形モデルにおける伝達学習の問題点について検討する。
我々は、厳密かつ厳密な分析を行い、事前訓練されたモデルと微調整されたモデルに対する一般化誤差(回帰)と分類誤差(二分分類)を関連付ける。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:09:09 GMT)
Computer-aided Colorization State-of-the-science: A Survey [18.2] 本稿では,コンピュータ支援カラー化技術の分野での研究成果を概説する。
カラー化作業はコンピュータグラフィックスから始まり、コンピュータビジョンを導入し、視覚とグラフィックを融合させる傾向があると論じる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:13:26 GMT)
Three-in-One: Fast and Accurate Transducer for Hybrid-Autoregressive ASR [18.0] 音声認識のための新しいアーキテクチャであるtextbfHybrid-textbfAutoregressive textbfINference TrtextbfANsducers (HAINAN) を提案する。
HAINANは、すべてのネットワークコンポーネントによる自己回帰推論と、予測子を使わずに非自己回帰推論の両方をサポートする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:38:20 GMT)
NL-Eye: Abductive NLI for Images [17.9] 視覚的帰納的推論能力を評価するためのベンチマークであるNL-Eyeを紹介する。
NL-Eyeは350個の慎重に3重項の例(1,050画像)で構成され、様々な推論カテゴリにまたがっている。
我々の実験によると、VLMはNL-Eyeでかなり苦労し、しばしばランダムなベースラインレベルで動作し、人間は可視性予測と説明品質の両方に優れていた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:51:36 GMT)
LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons [17.8] LexC-Genは、大規模に低リソースの分類タスクデータを生成する方法である。
両言語レキシコンの条件付けがLexC-Genの重要な構成要素であることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:23:15 GMT)
"Flex Tape Can't Fix That": Bias and Misinformation in Edited Language Models [17.8] モデル編集手法は,編集後のモデルバイアスを予期せず増幅する方法について検討する。
具体的には、人種、地理的起源、性別などの人口特性に関するバイアスに焦点を当てる。
編集されたモデルは、アジア、アフリカ、および南米の被験者の属性に対する信頼性が低下するにつれて、様々な程度にバイアスのかかる行動を示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:30:33 GMT)
On the Sequence Evaluation based on Stochastic Processes [17.5] 負の対数型エンコーダを用いて長文列のダイナミクスを学習するための新しい手法を提案する。
また、シーケンスコヒーレンスを測定する長文評価のための確率に基づく評価指標も導入する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:03:24 GMT)
Towards a Self-rescuing System for UAVs Under GNSS Attack [17.4] 我々は、ドローンが自らを自律的に救助できるようにするための軽量ソリューションを提案する。
風はドローンの位置を瞬時に変えられるので、重要な役割を果たす。
最終的な解決策は、ドローンを元の位置に連続して戻すという、強力なパフォーマンスを保証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:39:54 GMT)
Guided Stream of Search: Learning to Better Search with Language Models via Optimal Path Guidance [17.3] 言語モデルの探索と計画能力を高めるために最適な解をいかに活用するかを示す。
提案手法は,単純な数学的推論タスクであるCountdownにおける言語モデルの探索と計画能力を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:07:59 GMT)
Graph Diffusion Transformers for Multi-Conditional Molecular Generation [16.6] 多条件分子生成のためのグラフ拡散変換器(Graph DiT)を提案する。
Graph DiTはエンコーダを統合し、数値的および分類的プロパティ表現とTransformerベースのデノイザを学習する。
その結果、分布学習から分子特性の条件制御まで、9つの指標にまたがるグラフDiTの優位性が示された。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:29:02 GMT)
SEAL: SEmantic-Augmented Imitation Learning via Language Model [16.3] SEALは、意味的に意味のあるサブゴール表現に対して、サブゴール空間とプレラベル状態を指定するための新しいフレームワークである。
SEALはデュアルエンコーダ構造を採用し、教師なしLLM誘導サブゴール学習と教師なしベクトル量子化を組み合わせた。
実験の結果,SEALは最先端のHIL法やLLMに基づく計画手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:53:10 GMT)
Repurposing Foundation Model for Generalizable Medical Time Series Classification [16.2] FORMEDは、事前訓練されたバックボーンを利用する基礎分類モデルである。
チャネルの数、サンプルの長さ、医療タスクに関係なく、見当たらないMedTSデータセットにシームレスに適応できる。
本結果は,多種多様なMedTS分類タスクに対して,多種多様かつスケーラブルなモデルとして構成され,将来のMedTS解析研究の基盤モデルとして位置づけられる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:50:04 GMT)
CommVQA: Situating Visual Question Answering in Communicative Contexts [16.2] 画像、画像記述、実世界のコミュニケーションシナリオからなるデータセットであるCommVQAを紹介する。
CommVQAの解決には文脈情報へのアクセスが不可欠であることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:11:21 GMT)
Continuity of entropies via integral representations [16.0] 量子相対エントロピーのフレンケルの積分表現は、量子情報測度に対する連続性境界を導出する自然な枠組みを提供することを示した。
その結果,(1)条件付きエントロピーにおける条件付きエントロピーの厳密な連続性関係,(2)量子エントロピーにおけるファンヌ=オーデナート不等式のより強いバージョン,(3)約分解可能なチャネルの量子容量に関するより良い推定,が得られた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:36:48 GMT)
Planning in Strawberry Fields: Evaluating and Improving the Planning and Scheduling Capabilities of LRM o1 [15.9] 我々は,2つのLEM(o1-previewとo1-mini)の計画能力について,計画とスケジューリングのベンチマークで評価した。
LRM-Moduloシステムでは,o1モデルを外部検証器と組み合わせることで,システム出力の正しさが保証される。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:04:36 GMT)
Unified Universality Theorem for Deep and Shallow Joint-Group-Equivariant Machines [15.7] 共同群同変特徴写像を備えた学習機械に対する構成的普遍近似定理を提案する。
我々の主定理はまた、浅いネットワークと深いネットワークの両方に対する普遍近似定理を統一する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 01:12:35 GMT)
Tradeoffs Between Alignment and Helpfulness in Language Models with Representation Engineering [15.5] 本研究では,アライメントの増加とモデルの有用性の低下のトレードオフについて検討する。
フレームワークの条件下では、アライメントは表現工学によって保証される。
本研究は,表現工学ベクトルのノルムにより,有用性が2次的に損なわれることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 13:40:39 GMT)
Hard Negative Sample Mining for Whole Slide Image Classification [15.4] 我々は微調整中に硬い負のサンプルをマイニングすることを提案する。
これにより、より良い機能表現を得ることができ、トレーニングコストを削減できます。
また、これらのハードネガティブなサンプルをよりよく活用するために、パッチワイドなMILランキングの損失を新たに提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:58:33 GMT)
Enhancing Group Fairness in Federated Learning through Personalization [15.4] パーソナライゼーションは、意図しない利益として、改善された(局所的な)公正性をもたらす可能性があることを示す。
本稿では,Fair-FCAとFair-FL+HCという2つの新しいフェアネス対応クラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:29:33 GMT)
G2T-LLM: Graph-to-Tree Text Encoding for Molecule Generation with Fine-Tuned Large Language Models [15.3] G2T-LLMは,グラフからツリーへのテキストエンコーディングを用いて,グラフに基づく分子構造をベンチマーク(LLM)に最適化した階層型テキスト形式に変換する手法である。
このエンコーディングは、複雑な分子グラフを大きな言語モデルやXMLなどの木構造形式に変換する。
教師付き微調整により、G2T-LLMは有効でコヒーレントな化学構造を生成し、従来のグラフベースの手法で見られる無効な出力のような一般的な課題に対処する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:25:21 GMT)
F-Fidelity: A Robust Framework for Faithfulness Evaluation of Explainable AI [15.3] 微調整フィデリティF-フィデリティはXAIの堅牢な評価フレームワークである。
その結果, F-Fidelity は, 説明者の信頼度を回復する上で, 事前評価基準を著しく改善することを示した。
また,F-Fidelityの指標を忠実に説明すれば,入力成分の空間性を計算することができることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:23:06 GMT)
Online Energy Optimization in GPUs: A Multi-Armed Bandit Approach [15.3] エネルギー消費は、将来のコンピューティングアーキテクチャの開発において重要な設計基準と制限要因となっている。
本稿では,HPCシナリオにおけるGPUのための新しい,実用的なオンラインエネルギー最適化問題について検討する。
EnergyUCBは、GPUコア周波数をリアルタイムで動的に調整し、パフォーマンスへの影響を最小限に抑えるように設計されている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:05:34 GMT)
Interpreting and Editing Vision-Language Representations to Mitigate Hallucinations [15.0] 幻覚に対処するために視覚言語モデル(VLM)の内部表現について検討する。
我々は,VLMの内部画像表現を言語語彙に投影し,実物体の出力確率を幻覚的物体よりも高い信頼度で観測する。
モデルが潜在する表現を対象とする編集は、COCO2014データセットで最大25.7%の幻覚を減少させることができることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:59:57 GMT)
Analysis of Linear Mode Connectivity via Permutation-Based Weight Matching [15.0] We show that permutations found by weight matching (WM) not significantly reduce the $L$ distance between two models。
この発見は、WM によって発見された置換が、主にモデル全体の大きな特異値に付随する特異ベクトルの方向を一致させることを示している。
本稿では、特異ベクトルの観点からアクティベーションマッチング(AM)を解析し、AMの原理がWMと同じであることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 11:36:28 GMT)
Personalisation via Dynamic Policy Fusion [14.9] 深い強化学習政策は、人間の個人の好みと一致しないかもしれない。
我々は、より実践的なアプローチを提案し、人間のフィードバックの助けを借りて、すでに訓練済みのポリシーをユーザ固有のニーズに適応させる。
提案した動的ポリシー融合アプローチが意図したタスクを一貫して達成していることを実証的に実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:15:28 GMT)
SymmetricDiffusers: Learning Discrete Diffusion on Finite Symmetric Groups [14.9] 本稿では,S_n$以上の複雑な分布を学習するタスクを単純化する離散拡散モデルを提案する。
我々のモデルは、4桁のMNIST画像のソートを含む課題の解決において、最先端または同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:37:40 GMT)
Multi-FAct: Assessing Factuality of Multilingual LLMs using FActScore [14.9] 多様な言語にFActScoreを適用することで,多言語事実性評価のための簡易パイプラインを提案する。
地域多様性を反映したトピックにおける長文生成の事実的精度を評価する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:44:44 GMT)
Back to Bayesics: Uncovering Human Mobility Distributions and Anomalies with an Integrated Statistical and Neural Framework [14.9] DeepBayesicは、ベイズ原理とディープニューラルネットワークを統合し、基盤となる分布をモデル化する新しいフレームワークである。
我々は,いくつかのモビリティデータセットに対するアプローチを評価し,最先端の異常検出手法の大幅な改善を実証した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:08:22 GMT)
Back to Bayesics: Uncovering Human Mobility Distributions and Anomalies with an Integrated Statistical and Neural Framework [14.9] DeepBayesicは、ベイズ原理とディープニューラルネットワークを統合し、基盤となる分布をモデル化する新しいフレームワークである。
我々は,いくつかのモビリティデータセットに対するアプローチを評価し,最先端の異常検出手法の大幅な改善を実証した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:08:22 GMT)
Heterogeneity-Guided Client Sampling: Towards Fast and Efficient Non-IID Federated Learning [14.9] HiCS-FLはサーバがクライアントの出力層を更新してクライアントデータの統計的不均一性を推定する新しいクライアント選択手法である。
非IID設定では、HiCS-FLは最先端のFLクライアント選択方式よりも高速な収束を実現する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:42:13 GMT)
BlueTempNet: A Temporal Multi-network Dataset of Social Interactions in Bluesky Social [14.8] ユーザ主導型ソーシャルインタラクションの時間的ダイナミクスの最初のコレクションを提示する。
既存のBluesky Feedsを収集し、これらのフィードを気に入ったユーザーを含む。
このデータ収集戦略は過去のユーザの振る舞いを捉え、将来のユーザの振る舞いのデータ収集をサポートする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:51:55 GMT)
IndicSentEval: How Effectively do Multilingual Transformer Models encode Linguistic Properties for Indic Languages? [14.8] トランスフォーマーベースのモデルは自然言語処理の分野に革命をもたらした。
入力テキストの摂動に直面する言語特性の符号化におけるこれらのモデルはどの程度堅牢か?
本稿では,13の摂動にまたがる8つの言語特性に対して,符号化能力とロバスト性に関する類似の疑問を6つのIndic言語で検討する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:50:08 GMT)
Optimized Speculative Sampling for GPU Hardware Accelerators [14.7] 並列ハードウェアアクセラレータの投機的サンプリングを最適化し,サンプリング速度を向上する。
ワークロードを複数のGPUスレッドに分散し、スレッドブロック内の行列セグメントの同時操作を可能にします。
本手法の有効性を検証するために,音声認識と要約タスクの両方について広範な実験を行った。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:05:14 GMT)
DyGPrompt: Learning Feature and Time Prompts on Dynamic Graphs [14.6] DYGPROMPTは動的グラフモデリングのための新しい事前学習および迅速な学習フレームワークである。
我々はノードと時間の特徴が相互に特徴付けることを認識し、下流タスクにおけるノード時間パターンの進化をモデル化するための2つの条件ネットを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:59:18 GMT)
ColaCare: Enhancing Electronic Health Record Modeling through Large Language Model-Driven Multi-Agent Collaboration [14.6] ColaCareは、大規模言語モデル(LLM)によって駆動されるマルチエージェントコラボレーションを通じて電子健康記録(EHR)モデリングを強化するフレームワークである。
我々のアプローチは、構造化されたEHRデータとテキストベースの推論の間のギャップを埋めるために、ドメイン固有のエキスパートモデルとLLMをシームレスに統合する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:55:22 GMT)
PFGuard: A Generative Framework with Privacy and Fairness Safeguards [14.5] PFGuardは、プライバシと公平性保護を備えた生成フレームワークである。
公正なトレーニング段階とプライベートなトレーニング段階の間のプライバシーと公正の対立のバランスを取る。
実験の結果,PFGuardは高次元データから合成データを生成することに成功した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:37:16 GMT)
Ada-Instruct: Adapting Instruction Generators for Complex Reasoning [14.5] 微調整により開発した適応型命令生成器であるAda-Instructを紹介する。
Ada-Instructの有効性をさまざまなアプリケーションで実証的に検証した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:20:17 GMT)
StablePT: Towards Stable Prompting for Few-shot Learning via Input Separation [14.3] sysnameは最先端の手法を6.97%精度で上回り、標準偏差を平均1.92倍に下げる。
テストは、さまざまなタスクをカバーする8つのデータセットの堅牢性と安定性を強調している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 07:59:36 GMT)
Fake It Until You Break It: On the Adversarial Robustness of AI-generated Image Detectors [14.3] 我々は,攻撃シナリオの異なるAIGI検出器の評価を行った。
攻撃によって検出精度が大幅に低下し、検知器に依存するリスクがその利点を上回る程度に低下する可能性がある。
本稿では,これらの攻撃に対して,CLIPをベースとした簡易な防御機構を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:11:53 GMT)
PowerPM: Foundation Model for Power Systems [14.2] 本稿では,ETSデータをモデル化するための基盤モデルPowerPMを提案し,電力系統の大規模オフザシェルフモデルを提供する。
実験では、プライベートデータとパブリックデータからなる5つの実世界のシナリオデータセットについて検討した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:40:12 GMT)
Towards Understanding the Feasibility of Machine Unlearning [14.2] 未学習の難易度を定量化するための新しい指標のセットを提案する。
具体的には,学習を成功させるのに必要な条件を評価するために,いくつかの指標を提案する。
また、最も難解なサンプルを特定するためのランキング機構も提示する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:41:42 GMT)
A Formal Framework for Understanding Length Generalization in Transformers [14.2] 因果変換器における長さ一般化を解析するための厳密な理論的枠組みを導入する。
我々は,この理論を,アルゴリズムおよび形式言語タスクにおける長さ一般化の成功と失敗の予測器として実験的に検証した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:52:01 GMT)
Mamba Neural Operator: Who Wins? Transformers vs. State-Space Models for PDEs [14.1] 偏微分方程式 (Partial differential equation, PDE) は複雑な物理系をモデル化するために広く用いられている。
トランスフォーマーは複雑な依存関係をキャプチャできるため、PDEにとって好まれるアーキテクチャとして登場した。
我々は,PDEを解くために,ニューラル演算子に基づく技術を強化する新しいフレームワークであるMamba Neural Operator (MNO)を紹介する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:32:31 GMT)
GABIC: Graph-based Attention Block for Image Compression [14.0] 本研究は,k-Nearest Neighbors拡張アテンション機構に基づく特徴冗長性を低減するために,画像圧縮のためのグラフベースアテンションブロック(GABIC)を提案する。
実験の結果,GABICは圧縮性能を向上し,特に高ビットレートで同等の手法より優れていた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:45:23 GMT)
CaLMFlow: Volterra Flow Matching using Causal Language Models [14.0] CaLMFlowはVolterra積分方程式(VIE)としてフローマッチングをキャストするフレームワークである
本手法は,空間と時間にまたがるトークン化を実現し,これらの領域上でVIEを解く。
単一セル摂動応答予測を含む合成および実世界のデータに対するCaLMFlowの有効性を実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:07:41 GMT)
Eliciting In-Context Learning in Vision-Language Models for Videos Through Curated Data Distributional Properties [13.9] textbfEmergent textbfIn-context textbfLearning on textbfVideos (eilev)を実装する。
我々の結果、分析、およびアイレフ学習モデルは、ビデオやテキスト上での文脈内学習の出現に関する多くの洞察を得られる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 13:31:39 GMT)
Dual Active Learning for Reinforcement Learning from Human Feedback [13.7] 人間からのフィードバックからの強化学習(RLHF)は、大きな言語モデルと人間の好みを合わせるために広く応用されている。
人間のフィードバックは高価で時間を要するため、人間の教師がラベルを付けるための高品質な会話データを集めることが不可欠である。
本稿では、オフライン強化学習(RL)を用いてアライメント問題を定式化する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:09:58 GMT)
Parameter Competition Balancing for Model Merging [13.7] PCB-Mergingは、効果的なモデルマージのために各パラメータの係数を調整する訓練不要の手法である。
PCB-Mergingは、複数のモダリティ、ドメイン、モデルサイズ、タスク数、微調整フォーム、および大きな言語モデルにわたる大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:17:58 GMT)
Diss-l-ECT: Dissecting Graph Data with local Euler Characteristic Transforms [13.6] グラフ表現学習における表現性と解釈性を高めるために,局所オイラー特性変換(ell$-ECT)を導入する。
従来のグラフニューラルネットワーク(GNN)とは異なり、アグリゲーションによって重要な局所的な詳細を失う可能性があるが、$ell$-ECTは局所的な地区の無意味な表現を提供する。
提案手法は,多種多様なノード分類タスク,特に高いヘテロフィリエを持つグラフにおいて,標準GNNよりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:02:02 GMT)
Flash-Splat: 3D Reflection Removal with Flash Cues and Gaussian Splats [13.3] 透過光と反射光を分離する簡単な方法を提案する。
提案手法であるFlash-Splatは,3次元の伝送シーンと反射シーンの両方を正確に再構成する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:59:59 GMT)
Jailbreaking LLMs with Arabic Transliteration and Arabizi [13.3] 本研究は,大規模言語モデル(LLM)による'jailbreak'攻撃の潜在的な脆弱性を明らかにする。
我々の調査はアラビア語の調査の範囲を広げる。
アラビア語とその様々な形態を使用することで、隠されたままの情報を公開することができ、脱獄のリスクが高まる可能性がある。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:10:09 GMT)
ARES: Alternating Reinforcement Learning and Supervised Fine-Tuning for Enhanced Multi-Modal Chain-of-Thought Reasoning Through Diverse AI Feedback [13.2] 強化学習(RL)と教師付きファインチューニング(SFT)を交互に行う2段階アルゴリズムARESを提案する。
第一に、我々は教師に、各文が問題の解決にどれだけ貢献するかを、CoT(Chain-of-Thought)で得点するように要求する。
次に,教師にRL後の誤った推論の修正を依頼する。補正フィードバックにより,SFTによるRL微調整モデルを安定化する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 18:06:53 GMT)
Can Language Models Take A Hint? Prompting for Controllable Contextualized Commonsense Inference [12.9] 我々は、文脈化されたコモンセンス推論を強化するデータ拡張手法である"hinting"を導入する。
『Hinting』では、ハードプロンプトとソフトプロンプトを併用して推論プロセスの導出を行う。
この結果から,"隠れ"は文脈コモンセンス推論の性能を損なうことなく,制御性の向上を図っている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:32:46 GMT)
BiSSL: Bilevel Optimization for Self-Supervised Pre-Training and Fine-Tuning [12.7] BiSSLは、自己教師型学習において、プリテキスト事前学習と下流の微調整ステージのアライメントを強化するために、バイレベル最適化を導入する、第一級のトレーニングフレームワークである。
本稿では,BiSSLで定義された2つの目的の最適化を交互に行うトレーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:07:43 GMT)
Unleashing Large Language Models' Proficiency in Zero-shot Essay Scoring [12.7] Multi Traitsのフレームワークは、大きな言語モデルに十分な可能性を秘めている。
特徴平均化と min-max スケーリングによる総合スコアを導出する。
MTSの助けを借りて、小型のLlama2-13b-chatはChatGPTを大幅に上回る。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:33:36 GMT)
Distilling Instruction-following Abilities of Large Language Models with Task-aware Curriculum Planning [12.7] インストラクションチューニングは、大きな言語モデルにオープンドメイン命令と人間優先応答を合わせることを目的としている。
学生のLLMの追従が難しい命令を選択するために,TAPIR(Task-Aware Curriculum Planning for Instruction Refinement)を導入する。
学生の能力のバランスをとるために、トレーニングセット内のタスク分布は、対応するタスクに応じて自動的に調整された応答で調整される。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 13:53:59 GMT)
Deep Exploration with PAC-Bayes [12.6] スパース報酬下での継続的な制御のための強化学習は、実生活における重要性にもかかわらず、未探索の問題である。
本研究では,PAC-ベイジアンの視点からアクター・クリティカル・ラーニングの文脈において,この深層探査問題に初めて対処する。
提案アルゴリズムは,PAC-Bayesian Actor-Critic (PBAC) と名付けられ,多種多様な連続制御タスクにおけるスパース報酬の発見に成功した唯一のアルゴリズムである。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 09:51:37 GMT)
Fast nonparametric feature selection with error control using integrated path stability selection [12.6] 本稿では,経路安定度をしきい値に適用し,偽陽性と偽発見率を制御する一般的な特徴選択法を提案する。
グラデーション・ブースティング(IPSSGB)とランダム・フォレスト(IPSSRF)に基づく一般手法の2つの特別事例に着目した。
RNAシークエンシングデータによる大規模なシミュレーションにより、IPSSGBとIPSSRFはエラー制御が良くなり、より真の陽性を検出し、既存の方法よりも高速であることが示された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:42:28 GMT)
Can Language Models Recognize Convincing Arguments? [12.5] 大規模言語モデル(LLM)は、説得力のある物語を創造し広める可能性について懸念を提起している。
本研究は、説得力のある議論を検知し、その説得力に関する洞察を得るための性能について研究する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:01:45 GMT)
People are poorly equipped to detect AI-powered voice clones [12.4] 同一性マッチングと自然性の観点から,AI生成音声の現実性について報告する。
人間の参加者は、AI生成音声の短い録音(20秒以内)を確実に特定できない。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:26:58 GMT)
A Pilot Study of Applying Sequence-to-Sequence Voice Conversion to Evaluate the Intelligibility of L2 Speech Using a Native Speaker's Shadowings [12.3] L2話者の理想的なフィードバック形式は、非常にきめ細かな粒度であり、発話の理解不能な部分を検出して診断することができる。
このパイロットスタディでは、非ネイティブ話者(L2)の読み上げ、母語話者(L1)のシャドーイング、スクリプトシェーディング発話からなるユニークな半並列データセットを利用する。
音声変換技術を用いてL1話者の隠れL2音声の処理を再現し、仮想シャドーアシステムを構築する技術的可能性について検討する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:24:56 GMT)
Tokenization Falling Short: The Curse of Tokenization [12.2] 本研究では,これらの課題とその言語モデルへの影響を体系的に検討する。
その結果,スケーリングモデルパラメータはトークン化の問題を軽減することができることがわかった。
実験の結果,BPEドロップアウトなどのサブワード正規化がこの問題を緩和できることがわかった。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:56:34 GMT)
Decoherence by warm horizons [12.1] 我々は、DSWセットアップをUnruh-DeWitt粒子検出器に類似したワールドライン局所化モデルにマッピングする。
アンルー効果がこれらのランダムな力の根底にある唯一の量子力学的効果であることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:53:15 GMT)
Spectral Truncation Kernels: Noncommutativity in $C^*$-algebraic Kernel Machines [12.1] スペクトルトランケーションに基づく正定値カーネルの新しいクラスを提案する。
性能向上につながる要因であることを示す。
また,スペクトルトランケーションカーネルの表現能力を高めるための深層学習の視点も提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:19:12 GMT)
Does the Order of Fine-tuning Matter and Why? [12.0] 本研究では,複数の中間タスクの微調整とその順序がタスク性能に及ぼす影響について検討する。
実験の結果,タスクオーダリングが目標タスクのパフォーマンスに与える影響は,パフォーマンスの最大6%,パフォーマンスの最大4%であることがわかった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:07:14 GMT)
Archon: An Architecture Search Framework for Inference-Time Techniques [11.9] 大規模言語モデル(LLM)の能力を高めるために、推論時のテクニックが、非常に効果的なツールとして登場しています。
推論時間技術と1つ以上のLLMを組み合わせたシステムを開発する上でのベストプラクティスについては,まだ理解が限られている。
推論時アーキテクチャを設計するための自動化フレームワークであるArchonを紹介します。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:41:48 GMT)
On the Curses of Future and History in Future-dependent Value Functions for Off-policy Evaluation [11.8] 我々は地平線への指数的依存を避けるための推定器を開発する。
本稿では,POMDPの構造に合わせた新しいカバレッジ仮定を発見する。
副産物として、我々の分析は相補的な性質を持つ新しいアルゴリズムの発見にも繋がる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 06:55:03 GMT)
Temporal Predictive Coding for Gradient Compression in Distributed Learning [11.7] 本稿では,イベントトリガー通信を用いた分散学習のための予測に基づく勾配圧縮手法を提案する。
我々のゴールは、局所勾配の時間的相関を利用して、分散エージェントからパラメータサーバに送信される情報量を削減することである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:35:28 GMT)
What Do You See? Enhancing Zero-Shot Image Classification with Multimodal Large Language Models [11.7] 大規模言語モデル(LLM)は、画像分類を含む多くのコンピュータビジョンタスクに効果的に使用されている。
マルチモーダルLCMを用いたゼロショット画像分類法を提案する。
この結果は,複数のデータセットのベンチマーク精度を上回り,その顕著な効果を示した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:53:09 GMT)
Lie Algebra Canonicalization: Equivariant Neural Operators under arbitrary Lie Groups [11.6] 我々は、対称性群の無限小生成子の作用のみを利用する新しいアプローチであるLie aLgebrA Canonicalization (LieLAC)を提案する。
標準化のフレームワーク内で運用されているため、LieLACは制約のない事前訓練されたモデルと容易に統合できる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:21:30 GMT)
Unichain and Aperiodicity are Sufficient for Asymptotic Optimality of Average-Reward Restless Bandits [11.4] 我々のポリシーは、$O(1/sqrtN)$Optimity gap for a $N$-armed problemで最適であることを示す。
当社のアプローチは、インデックスや優先順位ポリシーに重点を置く既存の作業から逸脱しています。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:37:33 GMT)
Towards Layer-Wise Personalized Federated Learning: Adaptive Layer Disentanglement via Conflicting Gradients [11.3] パーソナライズされたフェデレートラーニング(pFL)では、高データの異質性はデバイス間で大きな勾配のばらつきを引き起こす可能性がある。
グラディエント・アナリティクス(FedLAG)によるレイヤワイド・アグリゲーションを用いたフェデレート・ラーニング(Federated Learning)という,pFL設計への新たなアプローチを導入する。
FedLAGはレイヤーワイド勾配競合の程度に基づいて、パーソナライズのためのレイヤを割り当てる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:46:19 GMT)
Streamlining Conformal Information Retrieval via Score Refinement [11.2] 本稿では,単純なモノトーン変換を検索スコアに適用し,より小さな共形集合を実現するスコアリファインメント法を提案する。
BEIRベンチマーク実験により,コンパクトな集合の生成におけるアプローチの有効性が検証された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:05:47 GMT)
A Spatio-Temporal Machine Learning Model for Mortgage Credit Risk: Default Probabilities and Loan Portfolios [11.1] 本稿では,木ブースティングと遅延時間-ガウス過程モデルを組み合わせることで,信用リスクを考慮した機械学習モデルを提案する。
個人ローンポートフォリオ損失分布の予測デフォルト確率は、従来の独立線形ハザードモデルと比較してより正確であることがわかった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:10:55 GMT)
Decoding with Limited Teacher Supervision Requires Understanding When to Trust the Teacher [11.1] 小規模大規模言語モデル(LLM)は、LLMの監督を効果的に活用して、その生成品質を向上するにはどうすればよいのか?
我々は,初期トークン上でのLLMおよびLLM予測を効果的に集約するアルゴリズムを開発した。
提案手法は,従来の復号法よりも一貫した手法であることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 07:55:17 GMT)
Unveiling Hallucination in Text, Image, Video, and Audio Foundation Models: A Comprehensive Survey [11.1] ファンデーションモデル(FM)の拡散は、幻覚出力を生成する可能性という重要な課題を引き起こします。
本研究は, FMにおける幻覚の問題を同定し, 緩和することを目的とした最近の研究の概要を概観する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:00:35 GMT)
A Comprehensive Survey of Hallucination in Large Language, Image, Video and Audio Foundation Models [11.1] ファンデーションモデル(FM)の拡散は、幻覚出力を生成する可能性という重要な課題を引き起こします。
本研究は, FMにおける幻覚の問題を同定し, 緩和することを目的とした最近の研究の概要を概観する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 09:00:35 GMT)
Fake It Until You Break It: On the Adversarial Robustness of AI-generated Image Detectors [11.0] 我々は,攻撃シナリオの異なるAIGI検出器の評価を行った。
攻撃によって検出精度が大幅に低下し、検知器に依存するリスクがその利点を上回る程度に低下する可能性がある。
本稿では,これらの攻撃に対して,CLIPをベースとした簡易な防御機構を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:11:53 GMT)
Dataset Distillation via Knowledge Distillation: Towards Efficient Self-Supervised Pre-Training of Deep Networks [10.9] SSL事前トレーニングのための最初の有効なDD法を提案する。
具体的には、SSLでトレーニングされたより大きな教師モデルの表現に合わせるために、小さな学生モデルを訓練する。
KDの目的はSSLよりもかなり分散度が低いため、我々の手法は、高品質エンコーダの事前訓練に成功できる合成データセットを生成することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:39:25 GMT)
Reconstructing Human Mobility Pattern: A Semi-Supervised Approach for Cross-Dataset Transfer Learning [10.9] セマンティック・アクティビティ・チェーンに着目し,人間のモビリティ・パターンを再構築し,学習するモデルを開発した。
本稿では,多様な地理的文脈にモデルを適応させるために,半教師付き反復移動学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:29:56 GMT)
Can we teach language models to gloss endangered languages? [10.7] Interlinear glossed text (IGT) は言語ドキュメントプロジェクトにおいて一般的なフォーマットであり、各形態素には記述的なアノテーションが付けられている。
我々は,大規模言語モデル (LLM) が,従来の訓練を使わずに,文脈内学習と相互学習の課題に有効であるかどうかを考察する。
LLMベースの手法は、トレーニングを全く必要とせず、標準的なトランスフォーマーベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:06:57 GMT)
Can we teach language models to gloss endangered languages? [10.7] Interlinear glossed text (IGT) は言語ドキュメントプロジェクトにおいて一般的なフォーマットであり、各形態素には記述的なアノテーションが付けられている。
我々は,大規模言語モデル (LLM) が,従来の訓練を使わずに,文脈内学習と相互学習の課題に有効であるかどうかを考察する。
LLMベースの手法は、トレーニングを全く必要とせず、標準的なトランスフォーマーベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:06:57 GMT)
Revealing the Unseen: Guiding Personalized Diffusion Models to Expose Training Data [10.6] 拡散モデル(DM)は高度な画像生成ツールへと進化してきた。
FineXtractは、微調整データを抽出するフレームワークである。
WikiArtやDreamBoothといったデータセットで微調整されたDMの実験や、オンラインにポストされた実世界のチェックポイントは、我々の方法の有効性を検証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:06:11 GMT)
Visual Prompting in LLMs for Enhancing Emotion Recognition [10.6] Vision Large Language Models (VLLM) は、コンピュータビジョンと自然言語処理の交差点を変革している。
本研究では,境界ボックスや顔のランドマークなどの空間情報を用いて,ターゲットを正確にマークすることで,ゼロショット感情認識を向上するSet-of-Vision prompting (SoV)アプローチを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:33:43 GMT)
Characterizing Context Influence and Hallucination in Summarization [10.6] 要約における文脈情報の影響と幻覚について検討する。
文脈の影響は,CIDの私的情報漏洩を低く抑えることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:19:28 GMT)
Improving Minimum Bayes Risk Decoding with Multi-Prompt [10.4] 提案するマルチプロンプト復号法では,多くの候補が推論時にプロンプトバンクから復号される。
候補をアンサンブルするために、最小ベイズリスク(MBR)デコーディングを使用し、トレーニングされた値メトリックを使用して最終的な出力を選択する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:14:57 GMT)
Suicide Phenotyping from Clinical Notes in Safety-Net Psychiatric Hospital Using Multi-Label Classification with Pre-Trained Language Models [10.4] 事前訓練された言語モデルは、非構造的な臨床物語から自殺を識別する約束を提供する。
2つの微調整戦略を用いて4つのBERTモデルの性能評価を行った。
その結果, モデル最適化, ドメイン関連データによる事前学習, 単一マルチラベル分類戦略により, 自殺表現のモデル性能が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:49:55 GMT)
Melody Is All You Need For Music Generation [10.4] 本稿では,メロディを用いた音楽生成を導く最初の新しいアプローチであるメロディガイド音楽生成(MMGen)モデルを提案する。
具体的には、まずメロディを、マルチモーダルアライメントモジュールを用いて、音声波形とその関連する記述と整列する。
これによりMMGenは提供された音声のスタイルに合わせて音楽を生成すると同時に、与えられたテキスト記述の内容を反映した音楽を生成することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:39:20 GMT)
Spiking Neural Network as Adaptive Event Stream Slicer [10.3] イベントベースのカメラは、リッチエッジ情報、高ダイナミックレンジ、高時間分解能を提供する。
最先端のイベントベースのアルゴリズムの多くは、イベントを固定グループに分割することに依存しており、重要な時間情報の欠落をもたらす。
イベントストリームを適応的に分割可能な,新規に設計されたプラグアンドプレイイベント処理方式であるSpikeSlicerを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:41:10 GMT)
Nonuniform random feature models using derivative information [10.2] ニューラルネットワークの初期化のための不均一なデータ駆動パラメータ分布を近似する関数の微分データに基づいて提案する。
We address the case of Heaviside and ReLU activation function and their smooth approximations (Sigmoid and softplus)。
入力点における近似微分データに基づいて、これらの正確な密度を単純化し、非常に効率的なサンプリングを可能にし、複数のシナリオにおいて最適なネットワークに近いランダムな特徴モデルの性能をもたらすことを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:30:13 GMT)
Can Capacitive Touch Images Enhance Mobile Keyboard Decoding? [10.2] タッチスクリーンキーボードのタップデコーディング精度を向上させるために,タッチヒートマップを活用できるかどうかを検討する。
本研究では,ユーザタップをセンチロイドやヒートマップを入力として利用して解釈する機械学習モデルを開発し,評価した。
その結果、入力機能セットにヒートマップを追加すると、平均で21.4%の文字誤り率が相対的に減少することがわかった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:29:04 GMT)
Sample and Oracle Efficient Reinforcement Learning for MDPs with Linearly-Realizable Value Functions [10.2] 本稿では,線形作用が特徴写像に一般化される決定法(MDP)の効率的な強化アルゴリズムを提案する。
具体的には、この設定において、最適に近いポリシーを効率的に見つける新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:23:07 GMT)
An Online Automatic Modulation Classification Scheme Based on Isolation Distributional Kernel [10.1] 本稿では,分離分布カーネルに基づく新しいオンラインAMC方式を提案する。
まず、分布カーネルを用いてベースバンド信号を表現するための最初の提案である。
第二に、リアルタイムなチャンネル条件下でオンライン環境でうまく機能する、先駆的なAMC技術を導入する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:57:50 GMT)
Towards Better Generalization: Weight Decay Induces Low-rank Bias for Neural Networks [9.9] We study the implicit bias to low-rank weight matrices when training neural network with Weight Decay (WD)。
我々の研究は、WDと組み合わせることで、SGDの強力な一般化性能に関する理論的および実証的な知見を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:36:18 GMT)
A boundary-aware point clustering approach in Euclidean and embedding spaces for roof plane segmentation [9.9] 空飛ぶLiDAR点雲からの屋根面のセグメンテーションは、3Dビルディングモデル再構築の重要な技術である。
平面分割の重要な課題の1つは、隣接する平面パッチを区別できる強力な機能をどのように設計するかである。
屋根面分割のためのマルチタスク深層ネットワークにより構築されたユークリッドおよび埋め込み空間における境界対応点クラスタリング手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:46:05 GMT)
Self-eXplainable AI for Medical Image Analysis: A Survey and New Outlooks [9.9] Self-eXplainable AI (S-XAI)は、ディープラーニングモデルのトレーニングプロセスに説明可能性を直接組み込む。
本稿では、説明可能性の望ましい特性と、説明品質を評価するための既存の評価方法について概説する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:29:28 GMT)
Capturing complex hand movements and object interactions using machine learning-powered stretchable smart textile gloves [9.8] 手の動きをリアルタイムに追跡することは、人間とコンピュータの相互作用、メタバース、ロボット工学、遠隔医療に多くの応用がある。
そこで本研究では, 伸縮性, 洗浄性を有するスマートグローブ, ヘリカルセンサ糸, 慣性測定ユニットを用いた手指運動の高精度かつダイナミックな追跡を報告する。
センサ糸は高いダイナミックレンジを有し, 0.005 %の低い155 %のひずみに応答し, 広範囲の使用および洗浄サイクルの安定性を示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:32:16 GMT)
Generalizing Medical Image Representations via Quaternion Wavelet Networks [9.8] 医用画像から健全な特徴を抽出できる,新しい,一般化可能な,データに依存しないフレームワークを提案する。
提案する4元ウェーブレットネットワーク(quaVE)は,既存の医用画像解析や合成作業と容易に統合できる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:13:41 GMT)
Make Compound Sentences Simple to Analyze: Learning to Split Sentences for Aspect-based Sentiment Analysis [9.6] Aspect Term Oriented Sentence Splitter (ATOSS) を提案する。
プラグアンドプレイモジュールとして,ABSAモデルのパラメータを保持するとともに,入力文中の本質的な意図を識別しやすくする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:27:59 GMT)
The Comparison of Individual Cat Recognition Using Neural Networks [9.6] 伝達学習で訓練された伝統的なCNNは、個別の猫認識において微調整法やシームズネットワークで訓練されたモデルよりも優れた性能を持つ。
ConvNeXtとDenseNetは、ペットストアや野生動物において、個々の猫の認識にさらに最適化できる重要な結果をもたらす。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:40:14 GMT)
Breaking the mold: The challenge of large scale MARL specialization [9.5] 本稿では,マルチエージェントシステムにおけるエージェントの個別化を促進する手法として,比較アドバンテージ最大化(CAM)を提案する。
CAMは、個々のエージェントのパフォーマンスが13.2%向上し、最先端システムに比べて14.9%の振る舞いの多様性が向上した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:16:22 GMT)
Reconstructing Galaxy Cluster Mass Maps using Score-based Generative Modeling [9.4] 本稿では,銀河団のガス・ダークマター投影密度マップをスコアベース生成モデルを用いて再構成する手法を提案する。
拡散モデルでは, 模擬SZおよびX線像を条件付き観測として捉え, 学習データ後部からのサンプリングにより, 対応するガスおよびダークマターマップの実現を図っている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:00:03 GMT)
Representation Synthesis by Probabilistic Many-Valued Logic Operation in Self-Supervised Learning [9.3] 本稿では,論理操作が可能な表現のための自己教師付き学習(SSL)手法を提案する。
本手法では,両表現の特徴を持つ表現や,両表現に共通する特徴のみを生成できる。
MNIST と PascalVOC を用いた画像検索実験により,本手法の表現をOR と操作で操作できることが判明した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:55:04 GMT)
It is Giving Major Satisfaction: Why Fairness Matters for Developers [9.3] 本研究は,ソフトウェア実践者の仕事満足度に対する公正感の関連性を検討することを目的とする。
その結果,4つの公平性,分配性,手続き性,対人性,情報性が,仕事の満足度に大きく影響していることが示唆された。
公正感と仕事満足度との関係は、女性、民族的に劣る、経験の浅い実践者、仕事の制限のある者にとって顕著に強い。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:40:00 GMT)
DiffuSolve: Diffusion-based Solver for Non-convex Trajectory Optimization [9.3] 最適軌道局所は非線形および高次元力学系において計算コストが高い。
本稿では,非次元オプティマ問題に対するDiffuに基づく一般モデルを提案する。
また,新たな制約付き拡散モデルであるDiff+を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:33:36 GMT)
Response Tuning: Aligning Large Language Models without Instruction [9.2] 本稿では、命令調整における命令条件のステップを排除し、応答空間の監督にのみ焦点をあてる応答チューニング(RT)を提案する。
実験により, RTモデルは応答のみを用いて訓練され, 広範囲の命令に効果的に対応し, 学習した命令に匹敵する有用性を示すことができた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:15:19 GMT)
Collective Critics for Creative Story Generation [9.2] 創造的ストーリー生成フレームワーク(CritiCS)のための集合的批評を提案する。
CritiCSはプラン精錬段階(CrPlan)とストーリー生成段階(CrText)からなる。
各ステージにおいて、LCMの批評家と1人のリーダーのグループが、複数のラウンドを通じて計画とストーリーの段階的なドラフトを作成します。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:21:17 GMT)
Controlled Generation of Natural Adversarial Documents for Stealthy Retrieval Poisoning [9.2] 近年の研究では, 組込み類似性に基づく検索は毒性に弱いことが示されている。
従来のHotFlipベースの手法は、パープレキシティ・フィルタリングを用いて、非常に容易に検出可能なドキュメントを生成する。
我々は、敵の目的(類似性を包含する)と「自然性」の目的を組み合わせた新しい制御された生成手法を設計し、実装し、評価する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:06:42 GMT)
Securing Cloud File Systems with Trusted Execution [9.2] クラウドファイルシステムは敵にとって主要なターゲットとなっている。
暗号技術と信頼できる実行環境(TEE)を活用する新しい設計は、依然として組織に望ましくないトレードオフを強要している。
我々は,セキュリティ保証,高性能,透過的なPOSIXライクなインターフェースをクライアントに提供するために,新たなセキュリティプロトコルをブートストラップするクラウドファイルシステムであるBFSを紹介した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 01:58:25 GMT)
TrajGPT: Irregular Time-Series Representation Learning for Health Trajectory Analysis [9.2] 我々は、TrajGPT(Trajectory Generative Pre-trained Transformer)と呼ばれる時系列変換器を提案する。
TrajGPTは、文脈に基づいて無関係な過去の情報を適応的にフィルタリングするために、データ依存の減衰を用いる。
実験の結果,TrajGPTはタスク固有の微調整を必要とせず,軌跡予測,薬物使用予測,表現型分類に優れていた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:31:20 GMT)
Online Multi-Label Classification under Noisy and Changing Label Distribution [9.2] 本稿では,Nuisy and Changing Label Distribution (NCLD) に基づくオンラインマルチラベル分類アルゴリズムを提案する。
NCLDへの頑健さは3つの新作の恩恵を受けるため,ラベルスコアとラベルランキングを高い精度で同時にモデル化することを目的としている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:16:43 GMT)
C-MORL: Multi-Objective Reinforcement Learning through Efficient Discovery of Pareto Front [9.0] 制約付きMORLは制約付きポリシー最適化とMORLのシームレスなブリッジである。
我々のアルゴリズムは、離散的かつ連続的な制御タスクにおいて、ハイパーボリューム、期待されるユーティリティ、およびスパーシリティという観点でより一貫性があり、優れた性能を達成する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:13:56 GMT)
Model Internals-based Answer Attribution for Trustworthy Retrieval-Augmented Generation [9.0] MIRAGE --Model Internals-based RAG Explanations -- このモデル内部を用いたプラグアンドプレイアプローチは、質問応答アプリケーションにおける忠実な回答属性である。
提案手法を多言語QAデータセット上で評価し,人間の回答属性と高い一致性を見いだした。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 11:03:22 GMT)
Learning dynamical systems from data: A simple cross-validation perspective, part III: Irregularly-Sampled Time Series [8.9] データから動的システムを学ぶためのシンプルで解釈可能な方法は、ベクトル場とカーネルを補間することである。
以前の成功にもかかわらず、この戦略は観測された時系列が定期的に時間内にサンプリングされないときに崩壊する。
本稿では,KFデータ適応カーネルの時間差を組み込むことで,動的システムのベクトル場を直接近似することで,この問題に対処する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:30:36 GMT)
RAG-Enhanced Commit Message Generation [8.9] コミットメッセージ生成は研究ホットスポットになっている。
手動でコミットメッセージを書くのに時間がかかります。
本稿では,Retrieval-Augmented framework for CommiTメッセージ生成のためのREACTを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:15:34 GMT)
Stochastic Sampling from Deterministic Flow Models [8.8] そこで本論文では,フローモデルを同じ境界分布を持つ微分方程式の族(SDE)に変換する手法を提案する。
我々は,おもちゃのガウスセットアップと大規模イメージネット生成タスクにおいて,提案手法の利点を実証的に実証した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:18:28 GMT)
A Novel Quantum Realization of Jet Clustering in High-Energy Physics Experiments [8.8] 高エネルギー粒子衝突ではクォークとグルーオンが生成され、すぐにジェットとして知られる衝突粒子噴霧を形成する。
正確なジェット・クラスタリングは、起源のクォークやグルーオンの情報を保持するために重要である。
この研究は、ジェットクラスタリングに革命をもたらす量子コンピューティングの可能性を強調した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:53:27 GMT)
Formation of Representations in Neural Networks [8.8] 現代のニューラルネットワークにおいて、いかに複雑で構造化され、伝達可能な表現が出現するかは謎のままである。
本稿では、表現の形成を普遍的に支配する6つのアライメント関係の集合を仮定したCRH(Canonical Representation hypothesis)を提案する。
CRHの崩壊はR,W,Gの相互関係の出現につながり,この関係をPAH(Polynomial Alignment hypothesis)と呼ぶ。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:31:01 GMT)
Regret-Optimal Federated Transfer Learning for Kernel Regression with Applications in American Option Pricing [8.7] 本稿では、中央プランナーがデータセットにアクセス可能なフェデレーショントランスファー学習のための最適反復スキームを提案する。
我々の目標は、生成されたパラメータの累積偏差を$thetai(t)_t=0T$で最小化することである。
後悔と最適化のアルゴリズム内で対称性を活用することで, $mathcalO(Np2)$少なめの初等演算を伴って動作する,ほぼ後悔のいく$_optimalを開発する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:08:12 GMT)
Preble: Efficient Distributed Prompt Scheduling for LLM Serving [8.7] 本稿では,プロンプト共有をターゲットとし最適化する最初の分散LLMサービスプラットフォームであるPrebleを提案する。
我々は,新しいスケジューリングアルゴリズムと階層的スケジューリング機構を用いて,KV状態の再利用と計算負荷分散を協調的に最適化する分散スケジューリングシステムを構築した。
2つのオープンソースLCM上での実際のワークロードと要求到着パターンによるPrebleの評価は、平均レイテンシで1.5倍から14.5倍、p99レイテンシで2倍から10倍のSOTAサービスシステムより優れていることを示している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:50:33 GMT)
From Optimization to Sampling via Lyapunov Potentials [8.7] 本稿では,Langevin Dynamics を用いた高次元分布からのサンプリング問題について検討する。
非対数凹凸密度の新しい自然クラスと興味深いクラスをサンプルとして示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:40:54 GMT)
Forecasting Disease Progression with Parallel Hyperplanes in Longitudinal Retinal OCT [8.7] 本稿では,現在スキャンされているリスクスコアから,時間と変換の逆関係と,時間間隔$t$での変換確率を共同で予測する手法を提案する。
さらに,オブジェクト内画像ペアによる教師なしの損失を発生させ,リスクスコアが時間とともに増加し,将来的なコンバージョン予測がAMDステージ予測と一致していることを確認する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:50:29 GMT)
Is Your Paper Being Reviewed by an LLM? Investigating AI Text Detectability in Peer Review [8.6] 既存のAIテキスト検出アルゴリズムが人間の書いたピアレビューと最先端のLLMを区別する能力について検討する。
分析の結果,既存の手法では,多くの GPT-4o 書面レビューを偽陽性分類を発生させることなく識別できないことがわかった。
偽陽性分類の低レベルにおけるGPT-4o書評の同定において,既存の手法を超越した新たな検出手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:05:06 GMT)
SGW-based Multi-Task Learning in Vision Tasks [8.5] データセットの規模が拡大し、タスクの複雑さが増すにつれ、知識の共有はますます困難になってきている。
情報ボトルネック知識抽出モジュール(KEM)を提案する。
このモジュールは,情報の流れを制約することでタスク間干渉を減らすことを目的としており,計算複雑性を低減する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:56:50 GMT)
Task-unaware Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation [8.4] 本研究では,ロボットが学習した課題における能力の回復を効果的に行う方法を提案する。
提案手法は,EM(Epsodic Memory)を用いて,局所的な微調整のためのテスト中のトレーニングと検索において経験的リプレイを可能にする。
得られた実験の最も困難な部分を強調する選択重み付け機構を導入する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:11:42 GMT)
Data Similarity-Based One-Shot Clustering for Multi-Task Hierarchical Federated Learning [8.4] 本研究では,データの類似性に基づいてユーザを効果的に識別し,グループ化できるワンショットクラスタリングアルゴリズムを提案する。
提案アルゴリズムはクラスタリングプロセスを強化するだけでなく,プライバシの懸念や通信のオーバーヘッド,学習モデルや損失関数の振る舞いに関する事前知識の必要性といった課題も克服する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:51:21 GMT)
Minimax Group Fairness in Strategic Classification [8.3] 戦略的分類において、エージェントは、学習者の分類器から肯定的な分類結果を受け取るために、その特徴をコストで操作する。
精度保証に加えて,グループフェアネス保証を有する学習目標について検討する。
我々は、複数のグループからなるエージェントの集団間のフェアネスを意識したスタックルバーグゲームを形式化し、各グループは独自のコスト関数を持つ。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:22:55 GMT)
CalliffusionV2: Personalized Natural Calligraphy Generation with Flexible Multi-modal Control [8.2] CalliffusionV2は、フレキシブルなマルチモーダル制御を備えた自然中国語書道を作成するために設計された新しいシステムである。
幅広いキャラクタの作成に長けており、数ショットの学習アプローチで新しいスタイルを素早く学習することができる。
事前の訓練なしに漢字以外の文字を生成できる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:26:54 GMT)
Computational Modeling of Artistic Inspiration: A Framework for Predicting Aesthetic Preferences in Lyrical Lines Using Linguistic and Stylistic Features [8.2] 芸術的なインスピレーションは、観客に深く響く作品を作る上で重要な役割を担っている。
この研究は、異なる個人における芸術的嗜好を計算的にモデル化するための新しい枠組みを提案する。
我々のフレームワークは、最先端のオープンソース言語モデルであるLLaMA-3-70bを18ポイント近く上回っている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:10:16 GMT)
Grounding Large Language Models In Embodied Environment With Imperfect World Models [8.2] 大きな言語モデル(LLM)は、基本的な物理的推論やロボティクスタスクの実行でしばしば混乱する。
We propose a Grounding Large Language model with Imperfect world MOdel (GLIMO)。
GLIMOはLLMエージェントベースのデータジェネレータを組み込んで、高品質で多様な命令データセットを自動生成する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:55:09 GMT)
TopER: Topological Embeddings in Graph Representation Learning [8.1] トポロジカル進化速度 (TopER) は、トポロジカルデータ解析に基づく低次元埋め込み手法である。
TopERはグラフ部分構造の進化率を計算することによって、重要な位相的アプローチである永続化ホモロジーを単純化する。
我々のモデルは、分類、クラスタリング、可視化といったタスクにおいて、分子、生物学的、ソーシャルネットワークのデータセットにまたがる最先端の結果を達成したり、超えたりします。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:58:26 GMT)
TopER: Topological Embeddings in Graph Representation Learning [8.1] トポロジカル進化速度 (TopER) は、トポロジカルデータ解析に基づく低次元埋め込み手法である。
TopERはグラフ部分構造の進化率を計算することによって、重要な位相的アプローチである永続化ホモロジーを単純化する。
我々のモデルは、分類、クラスタリング、可視化といったタスクにおいて、分子、生物学的、ソーシャルネットワークのデータセットにまたがる最先端の結果を達成したり、超えたりします。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:58:26 GMT)
READ: Recurrent Adaptation of Large Transformers [8.0] モデルサイズとタスク数が増加するにつれて、微調整の大規模トランスフォーマーは実用的ではない。
textbfREcurrent textbfADaption (READ) を導入する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:40:14 GMT)
RiskSEA : A Scalable Graph Embedding for Detecting On-chain Fraudulent Activities on the Ethereum Blockchain [8.0] RiskSEAは、大規模ブロックチェーントランザクショングラフの動的性質を扱う、スケーラブルなリスクスコアリングシステムである。
node2vecの埋め込みを生成し、それをブロックチェーンの集合全体へ効果的にスケールするための2つの新しいアプローチを提案する。
本研究では, 動作特性とノード2vec特性を組み合わせることで, 分類性能が著しく向上することを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:54:19 GMT)
AI-rays: Exploring Bias in the Gaze of AI Through a Multimodal Interactive Installation [7.9] 我々は、AIが参加者の外観から投機的アイデンティティを生成するインタラクティブなインスタレーションであるAI-rayを紹介する。
投機的なX線ビジョンを使用して、AIが生成する仮定と現実を対比し、AIの精査と偏見を比喩的に強調する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:44:05 GMT)
What Matters in Transformers? Not All Attention is Needed [7.9] トランスフォーマーベースの大規模言語モデル(LLM)は、様々なタスクで有望なパフォーマンスを示している。
また、冗長なアーキテクチャを導入し、現実世界のデプロイメントに効率上の課題を提起する。
我々は、類似度に基づくメトリクスを用いて、ブロック、アテンション層を含むトランスフォーマー内の異なるモジュール間の冗長性を調べる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 00:52:13 GMT)
Explainable Concept Generation through Vision-Language Preference Learning [7.7] 概念に基づく説明は、ポストホック後のディープニューラルネットワークを説明するための一般的な選択肢となっている。
視覚言語生成モデルを微調整する強化学習に基づく選好最適化アルゴリズムを考案する。
提案手法の有効性と信頼性に加えて,ニューラルネットワーク解析の診断ツールとしての有用性を示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:51:50 GMT)
The Benefit of Being Bayesian in Online Conformal Prediction [7.7] ブラックボックス機械学習モデルを用いて、有効な信頼セットのオンライン構築について検討する。
対象の信頼レベルを量子レベルに変換することにより、逐次明らかにされたデータシーケンスの量子レベルを予測することで、問題を小さくすることができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:04:47 GMT)
Latte: Latent Attention for Linear Time Transformers [7.7] 注意を喚起するための確率的枠組みを提案する。
本手法は,標準アテンション機構のドロップイン置換としてシームレスに統合できる。
結果として生じるLatte Transformer'は、標準的な注目やその他の最先端モデルに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:41:43 GMT)
Improving Planning with Large Language Models: A Modular Agentic Architecture [7.6] 大規模言語モデル(LLM)は、多段階の推論や目標指向の計画を必要とするタスクに悩まされることが多い。
本稿では,特殊モジュールの反復的相互作用によって計画が達成されるエージェントアーキテクチャ,MAPを提案する。
MAPは両方の標準LLM法よりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:49:30 GMT)
MLP-KAN: Unifying Deep Representation and Function Learning [7.6] そこで本研究では,手動モデル選択の必要性を解消する統一手法を提案する。
表現学習にMLP(Multi-Layer Perceptrons)と関数学習にKolmogorov-Arnold Networks(KANsogo)を統合することにより,優れた結果が得られた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:22:43 GMT)
Attention in Large Language Models Yields Efficient Zero-Shot Re-Rankers [7.6] 大規模言語モデル(LLM)は、赤外線システムにおいてゼロショットの再ランク付けに人気がある。
本稿では,検索クエリによる注目パターンの変化を利用した,高精度かつ効率的な再ランク付け手法であるin-context re- rank (ICR)を提案する。
本研究は,テキスト生成を超越したオープンウェイトLCMの新たな利用方法を探究することを目的とする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:25:37 GMT)
Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization [7.5] 大規模言語モデル(LLM)は大規模コーパスで事前訓練されている。
LLMは幻覚、知識の遮断、知識の帰属の欠如に悩まされる。
SMART-SLICはドメイン固有のLLMフレームワークである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:40:55 GMT)
Weaving the (AdS) spaces with partial entanglement entropy threads [7.5] AdSバルクでは、すべてのPEEスレッドの集合が連続的なネットワークを形成します。
本稿では,任意のバルク点を通過するPEEスレッドの密度が,正確に1/(4G)$であることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 04:27:32 GMT)
A Dutch Financial Large Language Model [7.4] FinGEITjeはオランダ初の金融大規模言語モデル(LLM)で、様々な金融業務に特化して最適化されている。
我々は,自動翻訳とデータ処理手法を用いて構築した,14万以上のサンプルを用いたオランダの財務指導チューニングデータセットをリリースする。
実験の結果は、FinGEITjeの5つの重要なオランダおよびイングランドの金融業務における優れたパフォーマンスを浮き彫りにした。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:38:31 GMT)
A Simple Method for Secret-Key Generation Between Mobile Users Across Networks [7.3] 2つ以上のモバイルユーザーは、既に交換され認証された異なるパケットまたはファイルから選択されたビットのシーケンスを継続的に重ね合わせ、プライバシーと認証の継続的な強化のための秘密鍵を継続的に更新することができる。
本稿では, このアキュマティブ・アダプタブル・アダプタブル・アダプタブル (AAA) 法について述べる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:09:30 GMT)
PSLM: Parallel Generation of Text and Speech with LLMs for Low-Latency Spoken Dialogue Systems [7.3] テキストと音声の両方を処理するマルチモーダル言語モデルは、音声対話システムに応用できる可能性がある。
音声応答を生成するには、事前に書かれた応答を生成する必要があり、音声シーケンスはテキストシーケンスよりもかなり長い。
本研究では,テキストと音声の並列生成を支援するために,言語モデルの入力シーケンスと出力シーケンスを拡張することで,これらの問題に対処する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 05:17:25 GMT)
SoundMorpher: Perceptually-Uniform Sound Morphing with Diffusion Model [7.3] 拡散モデルを用いて知覚的に均一なモーフィング軌道を生成する音響モーフィング法SoundMorpherを提案する。
SoundMorpherは、Mel-spectrogramに基づく形態素因子と知覚刺激との明確な比例写像を探索する。
実世界のシナリオにおけるSoundMorpherの有効性と汎用性を示す実験を行った。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:07:59 GMT)
Context and Geometry Aware Voxel Transformer for Semantic Scene Completion [7.1] 視覚に基づくセマンティックシーンコンプリート(SSC)は、様々な3次元知覚タスクに広く応用されているため、多くの注目を集めている。
既存のスパース・トゥ・デンス・アプローチでは、様々な入力画像間で共有コンテキストに依存しないクエリを使用するのが一般的である。
セマンティックシーン補完を実現するためにCGFormerというニューラルネットワークを導入する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:26:46 GMT)
LLMCO2: Advancing Accurate Carbon Footprint Prediction for LLM Inferences [7.1] 大規模言語モデル(LLM)の炭素フットプリントの推定は、トレーニングよりも複雑である。
cooはグラフニューラルネットワーク(GNN)ベースのモデルで、LCM推論カーボンフットプリント予測の精度を大幅に向上する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:48:45 GMT)
ClassContrast: Bridging the Spatial and Contextual Gaps for Node Representations [7.1] グラフニューラルネットワーク(GNN)は、近隣のアグリゲーションスキームを利用してグラフ表現学習の領域に革命をもたらした。
MPGNNは、過密、過密、過密といった重大な問題に直面しており、その効果を妨げている。
本稿では,これらの制約を克服するために,エネルギー景観理論に基づく新しい手法であるクラスコントラストを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:44:13 GMT)
Large Language Models as Markov Chains [7.1] 大規模言語モデル(LLM)は、幅広い自然言語処理タスクにおいて極めて効率的であることが証明されている。
サイズが$T$の一般自己回帰言語モデルと、サイズが$K$のコンテキストウィンドウと、サイズが$mathcalO(TK)$の有限状態空間上で定義されたマルコフ連鎖の同値性を描く。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:45:31 GMT)
Llamipa: An Incremental Discourse Parser [7.0] 本稿では,SDRT方式でコーパスを微調整した大規模言語モデルを用いた最初の談話解析実験について述べる。
ダウンストリームタスクにおける言論情報の最終的な使用に不可欠な言論データを処理することができる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:48:31 GMT)
Immunogenicity Prediction with Dual Attention Enables Vaccine Target Selection [6.9] ProVaccineは、タンパク質配列と構造を潜在ベクトル表現に統合する、新しいディープラーニングソリューションである。
現在までに最も包括的な免疫原性データセットをコンパイルし、細菌、ウイルス、腫瘍から9,500以上の抗原配列、構造、および免疫原性ラベルを含む。
私たちの研究はワクチン設計に有効なツールを提供し、将来の研究に有用なベンチマークを設定します。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:33:35 GMT)
CounterQuill: Investigating the Potential of Human-AI Collaboration in Online Counterspeech Writing [6.9] 本稿では,AIを利用した音声合成システムであるCounterQuillを紹介する。
CounterQuillは,(1)ヘイトスピーチや反音声を理解するための学習セッション,(2)ヘイトスピーチの重要要素を特定し,対音声戦略を探求するブレーンストーミングセッション,(3)ユーザがCounterQuillと対音声の草案作成と洗練を可能にする共同執筆セッション,の3段階のプロセスを提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:29:20 GMT)
Compositional Hardness of Code in Large Language Models -- A Probabilistic Perspective [6.9] 大規模言語モデル(LLM)における一般的なプラクティスは、モデルのコンテキストウィンドウ内のタスク全体に対するソリューションをサンプリングすることである。
これまでの研究では、モデルのコンテキスト内でのサブタスク分解がそのようなタスクの解決に有用であることが示されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:11:23 GMT)
CodeJudge: Evaluating Code Generation with Large Language Models [6.9] 大規模言語モデル(LLM)は、コード生成において有望なパフォーマンスを示している。
LLMが生成したコードを確実に評価する方法は未解決の問題である。
本稿では,LLMを利用したコード評価フレームワークであるCodeJudgeについて,テストケースを必要とせずに生成したコードの意味的正当性を評価する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:58:03 GMT)
GI-GS: Global Illumination Decomposition on Gaussian Splatting for Inverse Rendering [6.8] GI-GSは3次元ガウススティング(3DGS)と遅延シェーディングを利用する新しい逆レンダリングフレームワークである。
筆者らのフレームワークでは,まずGバッファを描画し,シーンの詳細な形状と材料特性を捉える。
Gバッファと以前のレンダリング結果により、ライトウェイトパストレースにより間接照明を計算することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:58:18 GMT)
Foundations of Large Language Model Compression -- Part 1: Weight Quantization [6.7] 大規模言語モデル (LLM) の圧縮は,資源制約のあるデバイス上での言語モデルの展開を可能にする重要な問題として浮上している。
最適な量子化結果の基盤となる量子化手法を提案する。
我々のフレームワークCVXQは、数十億の重みパラメータを含むモデルにスケールし、任意の特定のモデルサイズにモデルを圧縮する柔軟性を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:31:59 GMT)
ProtoSeg: A Prototype-Based Point Cloud Instance Segmentation Method [6.6] 本稿では,3次元点雲上でインスタンスセグメンテーションを行うニューラルネットワークアーキテクチャを提案する。
本稿では, 並列に係数とプロトタイプを学習し, 組み合わせて実例予測を行う手法を提案する。
提案手法は,最先端技術よりも28%高速であるだけでなく,標準偏差が低いことを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:05:27 GMT)
Rethinking VLMs and LLMs for Image Classification [6.6] 大きな言語モデル(LLM)は、新しい機能を実現するために、Visual Language Models(VLM)と統合されつつある。
オブジェクト認識やシーン認識では,LLMを使わないVLMの方が,VLMよりも優れた性能が得られることを示す。
本稿では,視覚的タスクをタスクに適したモデルに効率的にルーティングする,比較的小さなLCMを含む軽量な修正法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 23:40:21 GMT)
Fermionic tensor network contraction for arbitrary geometries [6.5] 本稿では,大域的順序と局所的順序の両方の定式化の中で,任意の格子上のフェルミオンテンソルネットワークの縮約の実装について述べる。
本稿では3次元ダイヤモンド格子上に定義された有限ハバードモデルのフェルミオン射影対状態シミュレーションについて述べる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:15:49 GMT)
An explainable approach to detect case law on housing and eviction issues within the HUDOC database [6.5] 訴訟法は、適切な住居の権利を含む、人権に対する私たちの理解を形作るのに役立ちます。
HUDOCデータベースは、欧州人権裁判所からケースローのテキストコンテンツへのアクセスを提供する。
本研究は,住宅・退去問題に関連する事例を検出するモデルを構築した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:39:51 GMT)
Why Sample Space Matters: Keyframe Sampling Optimization for LiDAR-based Place Recognition [6.5] 位置認識におけるサンプル空間の概念を導入し、異なるサンプリング手法がクエリプロセスと全体的なパフォーマンスに与える影響を実証する。
そこで我々は,超次元ディスクリプタ空間における冗長性と情報保存に着目した,LiDARに基づく位置認識のための新しいサンプリング手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:29:47 GMT)
Anchor-Controlled Generative Adversarial Network for High-Fidelity Electromagnetic and Structurally Diverse Metasurface Design [6.5] 電磁的忠実度と構造的多様性を改善するために,AcGAN(Anchor-control Generative Adversarial Network)を提案する。
AcGANはMean Squared Error (MSE) を73%削減する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:53:02 GMT)
HATFormer: Historic Handwritten Arabic Text Recognition with Transformers [6.4] アラビア文字のデータセットは英語に比べて小さく、一般化可能なアラビアHTRモデルを訓練することは困難である。
本稿では,HATFormerを提案する。HATFormerはトランスフォーマーをベースとしたエンコーダデコーダアーキテクチャで,最先端のHTRモデルに基づいている。
我々の研究は、複雑な言語固有の課題を持つ低リソース言語に英語のHTRメソッドを適用する可能性を示している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:43:29 GMT)
Forecasting Smog Clouds With Deep Learning [6.1] 大気汚染のダイナミクスと大気科学にインスパイアされた階層型モデルアーキテクチャを提案する。
以上の結果から, 階層型GRUはスモッグ関連汚染物質の濃度を予測するための競争的かつ効率的な方法であることが示された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:59:13 GMT)
SYNFAC-EDIT: Synthetic Imitation Edit Feedback for Factual Alignment in Clinical Summarization [6.1] 大規模言語モデル(LLM)は、要約タスクにおいて重要な成果を示したが、事実的不正確さに苦慮している。
専門家がアノテートしたデータの高コスト化と可用性の限界に対処するため,本研究では革新的なパイプラインを導入する。
100B以上のGPTの変種を利用して、専門家レベルの編集フィードバックを提供する合成フィードバックエキスパートとして機能します。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:54:46 GMT)
Automated Bug Generation in the era of Large Language Models [6.1] BugFarmは任意のコードを複数の複雑なバグに変換する。
BUGFARMが生成した1.9万以上の変異株から435k以上のバグを総合的に評価する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:52:09 GMT)
RESSCAL3D++: Joint Acquisition and Semantic Segmentation of 3D Point Clouds [6.1] VX-S3DISは,高分解能3Dセンサの動作を正確にシミュレートする新しい点クラウドデータセットである。
提案手法を新たなデータセットに適用することにより,3次元点群の共同獲得とセマンティックセマンティックセグメンテーションの可能性を実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:10:42 GMT)
ESREAL: Exploiting Semantic Reconstruction to Mitigate Hallucinations in Vision-Language Models [6.0] 視覚言語モデルにおける幻覚は、特に長いキャプションの生成において、その信頼性に重大な課題をもたらす。
本研究では,幻覚の正確な局在化と罰則化による幻覚の発生抑制を目的とした,新しい教師なし学習フレームワークであるESREALを紹介する。
LLaVA, InstructBLIP, mPLUG-Owl2の幻覚を32.81%, 27.08%, 7.46%減少させる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:29:14 GMT)
Mimicking Human Intuition: Cognitive Belief-Driven Q-Learning [6.0] 本稿では,主観的信念モデリングをQラーニングフレームワークに統合した認知的信念駆動型Qラーニング(CBDQ)を提案する。
CBDQは、人間のような学習能力と推論能力を持つエージェントを提供することで、意思決定の精度を高める。
各種複雑環境における離散制御ベンチマークタスクについて,提案手法の評価を行った。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:18:17 GMT)
Mimicking Human Intuition: Cognitive Belief-Driven Q-Learning [6.0] 本稿では,主観的信念モデリングをQラーニングフレームワークに統合した認知的信念駆動型Qラーニング(CBDQ)を提案する。
CBDQは、人間のような学習能力と推論能力を持つエージェントを提供することで、意思決定の精度を高める。
各種複雑環境における離散制御ベンチマークタスクについて,提案手法の評価を行った。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:18:17 GMT)
AirLetters: An Open Video Dataset of Characters Drawn in the Air [5.8] AirLettersは、人間が生成した人工的な動きの実際のビデオからなる、新しいビデオデータセットである。
私たちのデータセットは、人間が空に描いた文字を予測するために視覚モデルが必要です。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:13:28 GMT)
Optimizing Adaptive Attacks against Content Watermarks for Language Models [5.8] 大規模な言語モデル(LLM)は、オンラインスパムや誤報を拡散するために省略することができる。
コンテンツ透かしは、モデル生成出力にメッセージを隠すことで誤用を検知し、秘密の透かしキーを使用して検出する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:37:39 GMT)
Plots Unlock Time-Series Understanding in Multimodal Models [5.8] 本稿では,マルチモーダルファウンデーションモデルの既存のビジョンエンコーダを利用して,プロットを介して時系列データを"見る"方法を提案する。
実験により,本手法は生の時系列データをテキストとして提供する方法よりも優れていることが示された。
より複雑で現実的なシナリオへの明確な推論ステップによる合成タスクからの一般化性を実証するために、我々のアプローチを消費者健康タスクに適用する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:23:13 GMT)
SteerDiff: Steering towards Safe Text-to-Image Diffusion Models [5.8] テキスト・ツー・イメージ(T2I)拡散モデルは不適切なコンテンツを生成するために誤用することができる。
本稿では,ユーザ入力と拡散モデルの間の仲介として機能する軽量適応モジュールであるSteerDiffを紹介する。
提案手法の有効性を評価するために,様々な概念の未学習タスクに対して広範な実験を行う。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:34:55 GMT)
Spatial-Temporal Multi-Cuts for Online Multiple-Camera Vehicle Tracking [5.7] 本稿では,一段階の時空間クラスタリングが可能なグラフ表現を提案する。
本手法は,クラスタ内の全ての検出点の粗い外観と位置の手がかりを保ちながら,最強の証拠に基づいてクラスタを比較することができる。
本手法では,対象シーンのトレーニング,シングルカメラトラックの事前抽出,アノテーションの追加は不要である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:23:33 GMT)
Undesirable Memorization in Large Language Models: A Survey [5.7] 大規模言語モデル(LLM)における記憶の話題に関する知識体系化(SoK)を提案する。
記憶とは、モデルがトレーニングデータからフレーズやフレーズを保存し、再生する傾向があることである。
本研究は,記憶現象に寄与する要因の解析に続き,記憶現象を測定するために用いられる指標と方法について議論する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:34:46 GMT)
CataractBot: An LLM-Powered Expert-in-the-Loop Chatbot for Cataract Patients [5.6] CataractBotは、キュレートされた知識ベースをクエリすることで、白内障手術に関連する質問に即座に答え、専門家が検証した応答を非同期に提供する。
CataractBotは、55人の参加者を対象に、あらゆる時間的アクセシビリティ、保存時間、さまざまなリテラシーレベルを調整し、患者と医師の間にプライバシー層を追加することで、その価値を実証した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 05:03:16 GMT)
Deep Regression 2D-3D Ultrasound Registration for Liver Motion Correction in Focal Tumor Thermal Ablation [5.6] 肝腫瘍のアブレーションは, 腫瘍中心部における針の塗布を正確に行う必要がある。
画像登録技術は、解剖学的詳細の解釈や腫瘍の同定に有効であるが、その臨床応用は、アライメント精度と実行時のパフォーマンスのトレードオフによって妨げられている。
肝運動によるエラーを軽減できる2D-3DUSレジストレーション手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:24:45 GMT)
Fair Sampling in Diffusion Models through Switching Mechanism [5.6] 本研究では,拡散モデルに対するテクスタトリビュートスイッチング機構という,公平性を考慮したサンプリング手法を提案する。
提案手法の有効性を2つの重要な側面から数学的に証明し,実験的に実証する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:59:37 GMT)
Uncovering Regional Defaults from Photorealistic Forests in Text-to-Image Generation with DALL-E 2 [5.5] 地域デフォルトは、テキスト・ツー・イメージ(T2I)基盤モデルが地理的な地域を過剰に描写する傾向にあるという新興現象を記述している。
本研究では,そのような地域的デフォルトを明らかにするためのスケーラブルな評価手法を提案する。
我々の発見は、T2I世代やその他の生成型AIの地理に関するさらなる調査の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:07:12 GMT)
Functional Latent Dynamics for Irregularly Sampled Time Series Forecasting [5.4] 不規則にサンプリングされた時系列は、医療、気候、天文学など、複数の現実世界の応用でしばしば見られる。
機能潜在ダイナミクス(FLD)と呼ばれるモデル群を提案する。
正規微分方程式(ODE)を解く代わりに、モデル内の連続潜時状態を特定するために、常に点が存在する単純な曲線を用いる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 12:18:09 GMT)
Med-TTT: Vision Test-Time Training model for Medical Image Segmentation [5.3] We propose Med-TTT, a visual backbone network with Test-Time Training layer。
このモデルは精度、感度、Dice係数の点で先行的な性能を達成する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:29:46 GMT)
Effective Heterogeneous Federated Learning via Efficient Hypernetwork-based Weight Generation [5.3] クライアントの不均一性をサポートするための新しいフェデレーション学習フレームワークであるHypeMeFedを提案する。
このアプローチは、ヘテロジニアスモデル層の特徴空間を整列し、重み付け時の層間情報格差を解消する。
実世界の異種デバイステストベッドを用いた評価では、システムはFedAvgよりも5.12%精度を向上し、ハイパーネットワークメモリの要求を98.22%削減し、単純なハイパーネットワークアプローチに比べて1.86倍高速化する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 12:45:48 GMT)
Learning to Ask Informative Questions: Enhancing LLMs with Preference Optimization and Expected Information Gain [5.2] 大型言語モデル (LLM) は、しばしば情報的質問を生成するのによく機能する。
そこで本研究では,20種類のゲーム対話におけるLLM生成質問の情報性向上手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:26:54 GMT)
A Systematic Analysis of Large Language Models as Soft Reasoners: The Case of Syllogistic Inferences [5.1] 我々は、論理学と認知心理学において広範囲に研究されている誘因的推論の領域であるシロメトリクス推論の事例を考察する。
思考の連鎖的推論,文脈内学習,教師付き微調整がシロメトリクス的推論に及ぼす影響について検討した。
以上の結果から,事前学習したLSMの行動は認知科学によって説明できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:07:01 GMT)
Quantum Mutual Information in Time [5.1] 時間内の量子相互情報は、時間的に分離されたシステム間の相関の自然な尺度であることを示す。
また、このような量子的相互情報は、量子ベイズ反転に対して時間対称であることを示す。
時間内の相互情報は、量子状態のアンサンブルの逐次的な測定から抽出される古典的な情報の量に対して、どのようにしてホレボ境界が得られるかを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:45:59 GMT)
PCEvE: Part Contribution Evaluation Based Model Explanation for Human Figure Drawing Assessment and Beyond [5.1] 本稿では,PCEvE(Part Contribution Evaluation based model explanation)フレームワークを提案する。
既存の属性ベースのXAIアプローチとは異なり、PCEvEはモデル決定の簡単な説明を提供する。
複数のHFDアセスメントデータセットに関する広範な実験を通じて,PCEvEを厳格に検証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:57:24 GMT)
PCEvE: Part Contribution Evaluation Based Model Explanation for Human Figure Drawing Assessment and Beyond [5.1] 本稿では,PCEvE(Part Contribution Evaluation based model explanation)フレームワークを提案する。
既存の属性ベースのXAIアプローチとは異なり、PCEvEはモデル決定の簡単な説明を提供する。
複数のHFDアセスメントデータセットに関する広範な実験を通じて,PCEvEを厳格に検証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:57:24 GMT)
Robust Weight Initialization for Tanh Neural Networks with Fixed Point Analysis [5.0] 提案手法は既存手法よりもネットワークサイズの変化に頑健である。
物理インフォームドニューラルネットワークに適用すると、ネットワークサイズの変化に対するより高速な収束とロバスト性を示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:30:27 GMT)
On Sensitivity of Learning with Limited Labelled Data to the Effects of Randomness: Impact of Interactions and Systematic Choices [5.0] そこで本研究では,相互作用を考慮したランダム性要因の効果について検討する。
本手法は,個々のランダム性係数の真の効果を測定するために,他の要因の影響を緩和し,複数の実行において性能がどのように変化するかを観察する。
1) 既存の作業におけるランダム性要因間の相互作用を無視することは, ランダム性要因の効果の誤った帰属に起因する不整合な発見であり, たとえサンプル順序に対しても, コンテキスト内学習の一貫性を否定するなど, ランダム性要因の効果の誤った帰属によるものである。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:56:24 GMT)
Salient Information Prompting to Steer Content in Prompt-based Abstractive Summarization [4.9] 大規模言語モデル (LLMs) は、プロンプト技術を用いて、ドメイン間の流動的な要約を生成することができる。
キーフレーズをプロンプトに追加することで、ROUGE F1とリコールが改善されることを示す。
本稿では,有意なキーフレーズを抽出する軽量モデルであるKeyphrase Signal Extractor (SigExt)を紹介する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:54:56 GMT)
Fighting Randomness with Randomness: Mitigating Optimisation Instability of Fine-Tuning using Delayed Ensemble and Noisy Interpolation [4.9] 雑音補間による遅延アンサンブル(DENI)と呼ばれる新しい緩和戦略を提案する。
DENIと3つのモデル,4つのチューニング戦略,7つのテキスト分類データセットの9つの代表的な緩和戦略を比較した。
DENIは,コストのごく一部を使用しながら,最良性能の緩和戦略(Ensemble)より優れていることを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:56:29 GMT)
LoGDesc: Local geometric features aggregation for robust point cloud registration [4.9] 本稿では,3次元点マッチングと点雲登録のためのハイブリッドディスクリプタを提案する。
局所幾何学的性質と学習に基づく特徴伝搬を各点の近傍構造記述に結合する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:11:22 GMT)
Generalists vs. Specialists: Evaluating Large Language Models for Urdu [4.9] 我々は, GPT-4-Turbo と Llama-3-8b の汎用モデルと, 特殊目的モデル-XLM-Roberta-large, mT5-large, Llama-3-8b を比較した。
我々は、これらのモデルの性能をウルドゥー語で評価するために、7つの分類と7つの世代タスクに焦点を当てる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:32:31 GMT)
Synergizing Quality-Diversity with Descriptor-Conditioned Reinforcement Learning [4.9] 品質多様性アルゴリズム(Quality-Diversity algorithm)は、多種多様な高適合性ソリューションを生成するために設計された進化的手法である。
遺伝的アルゴリズムとして、MAP-エリートはランダムな突然変異に依存しており、高次元の探索空間では非効率になる可能性がある。
本稿では,記述子条件付きアクタを生成モデルとして利用するDCG-MAP-Elitesの拡張であるDCRL-MAP-Elitesを紹介する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:13:56 GMT)
Language models and brains align due to more than next-word prediction and word-level information [4.7] 事前訓練された言語モデルは、言語を解釈する人々の脳記録を著しく予測することが示されている。
最近の研究は、次の単語の予測がこのアライメントに寄与する重要なメカニズムであることを示唆している。
脳記録との整合性の改善は,次の単語の予測や単語レベルの情報の改善が原因であることが示唆された。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 11:42:43 GMT)
Gaussian Process Regression under Computational and Epistemic Misspecification [4.6] 大規模データアプリケーションでは、カーネルの低ランクあるいはスパース近似を用いて計算コストを削減できる。
本稿では,そのようなカーネル近似が要素誤差に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:29:00 GMT)
Generative Deduplication For Socia Media Data Selection [4.5] 本稿では,ソーシャルメディアデータ選択のための新しい生成重複フレームワークを提案する。
我々のモデルはソーシャルメディアのNLPパイプラインを普遍的に拡張するための効率的な前処理手法として機能する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:34:34 GMT)
Unveiling AI's Blind Spots: An Oracle for In-Domain, Out-of-Domain, and Adversarial Errors [4.5] 我々は、他のモデルのエラーを予測するために設計されたディープニューラルネットワークであるmentorモデルを用いて、経験的評価を行う。
われわれはSuperMentorと呼ばれる,エラーの予測精度を78%向上する"オークル"メンターモデルを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:02:39 GMT)
EDADepth: Enhanced Data Augmentation for Monocular Depth Estimation [4.5] EDADepthは、追加のトレーニングデータを用いることなく単眼深度を推定する拡張データ拡張手法である。
我々は、テキスト埋め込みのより良い抽出にBEiT事前学習セマンティックセマンティックセマンティクスモデルを用いる。
本モデルでは,NYUv2 と KITTI のデータセット上での delta3 測定結果(SOTA)が得られた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:48:28 GMT)
Matrix and Relative Weak Crossover in Japanese: An Experimental Investigation [4.5] 本稿では, 行列と相対節の性質に弱い交叉効果が相違することを示す。
福島ら (2024) と定性的に一致した結果から, 両者の相違は構造的であり, 単に優越性に基づくものではないことが示唆された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:14:14 GMT)
Large Language Model Aided Multi-objective Evolutionary Algorithm: a Low-cost Adaptive Approach [4.4] 本研究では,大規模言語モデル(LLM)と従来の進化的アルゴリズムを組み合わせることで,アルゴリズムの探索能力と一般化性能を向上させる新しいフレームワークを提案する。
適応機構内の補助的評価関数と自動的プロンプト構築を活用し, LLM の利用を柔軟に調整する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:37:02 GMT)
Enhancing Pre-Trained Language Models for Vulnerability Detection via Semantic-Preserving Data Augmentation [4.4] 本稿では,脆弱性検出のための事前学習言語モデルの性能向上を目的としたデータ拡張手法を提案する。
一連の代表的なコード事前訓練モデルの微調整に当社のデータセットを組み込むことで、最大10.1%の精度向上と23.6%のF1増加を達成することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:37:10 GMT)
Enhancing Pre-Trained Language Models for Vulnerability Detection via Semantic-Preserving Data Augmentation [4.4] 本稿では,脆弱性検出のための事前学習言語モデルの性能向上を目的としたデータ拡張手法を提案する。
一連の代表的なコード事前訓練モデルの微調整に当社のデータセットを組み込むことで、最大10.1%の精度向上と23.6%のF1増加を達成することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 00:37:10 GMT)
MQT Qudits: A Software Framework for Mixed-Dimensional Quantum Computing [4.3] MQT Quditsは、混合次元のquditデバイス用のアプリケーションの設計と実装を支援するオープンソースツールである。
混合次元システムのための標準化された言語を定義し、回路仕様、ハードウェアゲートセットへのコンパイル、効率的な回路シミュレーション、オープンチャレンジについて議論する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:00:01 GMT)
An Online Feasible Point Method for Benign Generalized Nash Equilibrium Problems [4.2] 一般化されたナッシュ均衡ゲームのための新しいオンライン実現可能な点法を提案する。
エージェント間の通信が制限されているという仮定の下で、本手法は実現可能性を保証する。
我々は、我々の方法の平衡への収束が保証される良性一般化ナッシュ均衡問題のクラスを特定する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:27:55 GMT)
Stochastic variance-reduced Gaussian variational inference on the Bures-Wasserstein manifold [4.2] 本稿では,バーレス=ヴァッサーシュタイン空間の最適化のための新しい分散再現型推定器を提案する。
この推定器は、興味のあるシナリオにおけるモンテカルロ推定器よりも分散が小さいことを示す。
提案した推定器は以前のビュール=ヴァッサーシュタイン法よりも次数次改善が得られることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:55:49 GMT)
FedPeWS: Personalized Warmup via Subnetworks for Enhanced Heterogeneous Federated Learning [4.2] 各参加者がパーソナライズされたマスクを学習し、フルモデルのサブネットワークのみを更新するウォームアップフェーズを提案する。
このパーソナライズされたウォームアップにより、参加者はまず、データの異質性に合わせて特定の作業を学ぶことに集中できる。
ウォームアップフェーズの後、参加者はすべてのパラメータが通信される標準のフェデレーション最適化に戻る。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:16:13 GMT)
Towards Universal Certified Robustness with Multi-Norm Training [4.2] 既存の訓練方法は、特定の摂動タイプに対して堅牢なモデルをトレーニングするのみである。
我々は、新しい$l$決定論的認定トレーニングディフェンスからなる、最初のマルチノーム認定トレーニングフレームワーク textbfCURE を提案する。
SOTAの認定トレーニングと比較すると、textbfCUREはMNISTで22.8%、CIFAR-10で23.9%、TinyImagenetで8.0%のロバスト性を向上している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:20:46 GMT)
GPUDrive: Data-driven, multi-agent driving simulation at 1 million FPS [4.2] GPUDriveはMadrona Engine Game上に構築されたGPUアクセラレーションされたマルチエージェントシミュレータである。
我々はGPUDriveを使うことで、Open Motionデータセットの多くのシーンで強化学習エージェントを効果的に訓練できることを示した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:18:54 GMT)
Assessing the Viability of Synthetic Physical Copy Detection Patterns on Different Imaging Systems [4.2] 本稿では,CDP (Synthetic physical Copy Detection Patterns) の可能性を探り,反偽造防止システムのロバスト性を改善する。
合成物理CDPを活用することにより,様々な実世界のアプリケーションにおけるセキュリティとコスト効率の向上を目指す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:21:35 GMT)
Estimating Generalization Performance Along the Trajectory of Proximal SGD in Robust Regression [4.2] 本稿では,反復アルゴリズムの軌道に沿った反復の一般化誤差を正確に追跡する推定器を提案する。
結果は、ハマー回帰(英語版)、擬ハマー回帰(英語版)、および非滑らかな正則化子を持つそれらのペナル化変種(英語版)など、いくつかの例を通して説明される。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:13:42 GMT)
Deep image-based Adaptive BRDF Measure [4.1] 本稿では,高品質BRDF撮影に必要な試料数を最小化するための新しい手法を提案する。
軽量ニューラルネットワークはまず、解析的BRDFモデルのパラメータとサンプル位置の分布を推定する。
2番目のステップでは、画像ベースの損失を使用して、必要な精度を満たすために必要なサンプルの数を見つけます。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:08:48 GMT)
A Causal Bayesian Network and Probabilistic Programming Based Reasoning Framework for Robot Manipulation Under Uncertainty [4.1] 本稿では,ロボットのための柔軟で汎用的な物理インフォームド型因果ベイズネットワーク(CBN)ベースのフレームワークを提案する。
1)高い精度で操作結果を予測する(Pred Acc: 88.6%)、(2)94.2%のタスク成功率でグリージーな次善行動選択を行う、というフレームワークの能力を示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:16:47 GMT)
Minmax Trend Filtering: A Locally Adaptive Nonparametric Regression Method via Pointwise Min Max Optimization [4.1] 文学における局所的な適応性の定義について、全会一致で合意されていないようである。
まず, パーナライズされた局所平均のmin-max/max-min最適化の観点から, ファセットラッソ推定器の新しい点式を導出する。
次に、ペナル化局所回帰の min-max/max-min 最適化の観点から、ポイントワイズで定義されるFused Lasso の高次バージョンを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 23:15:35 GMT)
Nebula: A discourse aware Minecraft Builder [4.0] 先行した言論と非言語的文脈を取り入れることで、そのような相互作用の「言語から行動への」要素がいかに改善されるかを示す。
私たちのモデルであるNebulaは、このタスクのベースライン上でのネットアクションF1スコアを2倍にします。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:46:16 GMT)
IDEA: Enhancing the Rule Learning Ability of Large Language Model Agent through Induction, Deduction, and Abduction [4.0] RULEARNは,対話型環境下での大規模言語モデルのルール学習能力を評価するために設計された,新しいベンチマークである。
誘導, 誘引, アブダクションのプロセスを統合する新しい推論フレームワークであるIDEAを提案する。
5つの代表的なLCMを含むIDEAフレームワークの評価は,ベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:47:53 GMT)
IDEA: Enhancing the Rule Learning Ability of Large Language Model Agent through Induction, Deduction, and Abduction [4.0] RULEARNは,対話型環境下での大規模言語モデルのルール学習能力を評価するために設計された,新しいベンチマークである。
誘導, 誘引, アブダクションのプロセスを統合する新しい推論フレームワークであるIDEAを提案する。
5つの代表的なLCMを含むIDEAフレームワークの評価は,ベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:47:53 GMT)
Motion-Insensitive Time-Optimal Control of Optical Qubits [3.9] 光量子ビットの高忠実性制御は、閉じ込められた原子量子コンピュータでは困難である。
我々は光子反動と熱運動を抑制する動作非感応パルスを開発した。
動作に敏感なパルスは、レーザーの不均一性を補償するために精製することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:59:05 GMT)
PARAMANU-AYN: Pretrain from scratch or Continual Pretraining of LLMs for Legal Domain Adaptation? [3.9] パラマヌ・アイン(Paramanu-Ayn)は、インドの訴訟文書に特化して訓練された法律言語モデルのコレクションである。
Paramanu-Aynは1つのGPU上でわずか185時間、コンテキストサイズ8192のスクラッチから事前トレーニングされた。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:01:01 GMT)
Monte Carlo Simulation of Operator Dynamics and Entanglement in Dual-Unitary Circuits [3.9] 二重単位回路における演算子ダイナミクスと絡み合い成長について検討する。
我々の研究は、長期演算子の進化と絡み合いを研究するためのスケーラブルな計算フレームワークを提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:53:29 GMT)
Monte Carlo Simulation of Operator Dynamics and Entanglement in Dual-Unitary Circuits [3.9] 二重単位回路における演算子ダイナミクスと絡み合い成長について検討する。
我々の研究は、長期演算子の進化と絡み合いを研究するためのスケーラブルな計算フレームワークを提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:53:29 GMT)
From Concrete to Abstract: A Multimodal Generative Approach to Abstract Concept Learning [3.6] 本稿では,高次抽象概念学習におけるマルチモーダル生成手法を提案する。
我々のモデルは、まず下層コンクリート概念を基礎として、それらを結合して基本レベル概念を形成し、最後にレベル概念を重畳するために抽象化する。
高階抽象概念を用いた言語対視覚および視覚対言語テストによるモデル言語学習能力の評価を行った。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:24:24 GMT)
Data Optimisation of Machine Learning Models for Smart Irrigation in Urban Parks [3.6] 本稿では,SIMPaCTシステムにおける広帯域センサネットワークの効率向上のための2つの新しい手法を提案する。
第1の方法は、欠落したセンサーからの読み出しを推定し、連続的かつ信頼性の高いデータを保証する。
第2の方法は、ロボットシステムを使用して、異なるセンサー位置からのシーケンシャルなデータ収集を含む。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:42:16 GMT)
Strong Preferences Affect the Robustness of Value Alignment [3.5] バリューアライメントは、大きな言語モデルが人間の価値に応じて振る舞うことを保証することを目的としています。
価値アライメントの重要な要素は、人間の価値観の表現としての人間の嗜好のモデリングである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:53:43 GMT)
Discrete-time Quantum Walks in Qudit Systems [3.5] 1次元量子ウォークを$d$次元量子領域に導入する。
任意の有限次元量子論理における回路実現の等価性を示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:29:31 GMT)
Probabilistic road classification in historical maps using synthetic data and deep learning [3.4] 深層学習と地理情報,コンピュータによる絵画,画像処理手法を融合した新しいフレームワークを提案する。
この枠組みは,道路地形のみを用いた歴史地図からの道路の抽出と分類を可能にする。
道路クラス2では, それぞれ94%以上, 92%以上であった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:43:09 GMT)
Explaining Indian Stock Market through Geometry of Scale free Networks [3.3] インド株式市場を異種スケール自由ネットワークとしてモデル化し、2次元双曲空間に埋め込まれる。
非パラメトリック統計テストを適用することで、市場の安定性とボラティリティの期間を明確に区別することができる。
特定の市場セクターが集まっているのがわかります。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 07:12:59 GMT)
Conversational Feedback in Scripted versus Spontaneous Dialogues: A Comparative Analysis [3.3] 字幕では自発的な対話よりもコミュニケーションフィードバックが顕著に少ないことを示す。
また、標準LLMによる対話は、自発的な対話よりもスクリプト化された対話にずっと近いことを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:27:14 GMT)
Ranking Perspective for Tree-based Methods with Applications to Symbolic Feature Selection [3.3] 木に基づく手法は統計学や機械学習において強力な非パラメトリック手法である。
近年の応用は、現在の理論的理解の下では明らかでない変換を区別する驚くべき能力を明らかにしている。
この研究は、ランク付けの観点から木に基づく手法の有限サンプル解析を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:03:39 GMT)
LLMs learn governing principles of dynamical systems, revealing an in-context neural scaling law [3.3] 主にテキストに基づいて訓練された言語モデルは、微調整やプロンプトエンジニアリングなしで動的システム時系列の正確な予測を行う。
LLMから直接多桁数の確率密度関数を抽出するフレキシブルで効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:56:44 GMT)
Strategies for running the QAOA at hundreds of qubits [3.3] 量子近似最適化アルゴリズム(QAOA)の実行に必要な計算量を削減するための戦略を検討する。
インスタンスに依存しない"ツリー"パラメータを事前に選択した標準QAOAについて検討する。
何百もの頂点を持つランダムな3つの正則グラフに対して、ウォームスタートQAOAの深さ$p gtrsim 3$のカットは標準GWアルゴリズムに匹敵する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:53:43 GMT)
MonoVisual3DFilter: 3D tomatoes' localisation with monocular cameras using histogram filters [3.2] RGB-Dカメラは、雷の干渉によりオープンフィールド環境下で制限される。
本研究では,3次元タスク空間における物体の位置を知覚するために,モノクラーセンサをどう利用し,制御するか,という課題に答える。
そこで本研究では,モノVisual3DFilterアルゴリズムを用いてトマトにおけるトマトの位置を推定するためにヒストグラムフィルタにアプローチした。
シミュレーションでは平均絶対誤差が10mm未満,実験室では20mm,実験室では0.5m程度であった。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:07:18 GMT)
BVE + EKF: A viewpoint estimator for the estimation of the object's position in the 3D task space using Extended Kalman Filters [3.2] RGB-Dセンサーは、放射線や雨などの外部の摂動に敏感であるため、オープンフィールド環境で動作している課題に直面している。
複数の作品がモノクロカメラを用いて物体の3D位置を認識するという課題に近づいている。
我々は,拡張カルマンフィルタ(EKF)を用いた最適視点推定器(BVE)というガウス視点推定器を用いて3次元物体の位置を予測する問題にアプローチすることを目的とする。
このアルゴリズムはタスクの効率を証明し、最大平均ユークリッド誤差は約32mmに達した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:13:56 GMT)
Optimal Communication Unbalanced Private Set Union [3.2] 我々は、アンバランス・プライベート・セット・ユニオン問題のための新しい2つのプロトコルを提案する。
我々のプロトコルは、Sender の計算コストと通信容量が Sender の集合のサイズにのみ線形である最初のものである。
HElibを用いた予備的な結果は、例えば、1000個の要素を持つSenderが、2秒未満の計算時間と10MB未満の通信量を使用して、最初のプロトコルを完了できることを示している。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:12:06 GMT)
A Deep Generative Learning Approach for Two-stage Adaptive Robust Optimization [3.1] 本稿では,2段階適応型ロバスト最適化のための逆生成を行う解アルゴリズムAGROを紹介する。
AGROは、同時に敵対的かつ現実的な高次元の一致を生成する。
我々は、AGROが標準的なカラム・アンド・制約アルゴリズムを最大1.8%のプロダクション・ディストリビューション計画、最大11.6%の電力系統拡張で上回っていることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:09:10 GMT)
Embedded Topic Models Enhanced by Wikification [3.1] ウィキペディアの知識をニューラルトピックモデルに組み込んで、名前付きエンティティを認識する。
実験により,本手法は一般化可能性において,ニューラルトピックモデルの性能を向上させることが示された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:39:14 GMT)
Learning from Offline Foundation Features with Tensor Augmentations [3.0] 拡張型オフライン基盤機能(LOFF-TA)の学習について紹介する。
LOFF-TAは、直接開発が不可能な限られたリソース設定で基礎モデルの能力を利用する。
特定のシナリオでは、LOFF-TAを用いたトレーニングは基礎モデルを直接微調整するよりも良い結果が得られる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:35:35 GMT)
Learning Emergence of Interaction Patterns across Independent RL Agents in Multi-Agent Environments [3.0] ボトムアップネットワーク(BUN)は、マルチエージェントの集合を統一エンティティとして扱う。
協調ナビゲーションやトラヒックコントロールなどのタスクを含む,さまざまな協調型マルチエージェントシナリオに対する実証的な評価は,BUNが計算コストを大幅に削減したベースライン手法よりも優れていることを一貫して証明している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:25:02 GMT)
MTDNS: Moving Target Defense for Resilient DNS Infrastructure [2.9] DNS (Domain Name System) はインターネット上でもっとも重要なコンポーネントの1つである。
研究者は、DNSに対する攻撃を検出し、防御する方法を常に開発してきた。
ほとんどのソリューションは、防御アプローチのためにパケットを破棄し、正当なパケットをドロップする可能性がある。
我々は移動目標防衛技術を用いたMTDベースのレジリエントなMTDNSを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:47:16 GMT)
Intrinsic Evaluation of RAG Systems for Deep-Logic Questions [2.9] 本稿では,検索拡張生成(RAG)機構を深い論理的クエリを含むアプリケーションに適用するための本質的な指標である総合性能指標(OPI)を紹介する。
OPIは2つの重要な指標の調和平均として計算される: 論理関係の正確度比(Logical-Relation Correctness Ratio)と BERT の平均値。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:25:05 GMT)
A deep learning-enabled smart garment for accurate and versatile sleep conditions monitoring in daily life [2.9] 位置決めや皮膚調製の必要なしに局所的な皮膚ひずみ信号を捕捉する,洗濯可能な皮膚適合型スマートスリープ監視システムについて報告する。
印刷された繊維系ひずみセンサアレイは、ゲージ係数を最大100で0.1%から10%のひずみに応答する。
スマートウェアは6つの睡眠状態を98.6%の精度で分類することができ、クラス当たり15サンプル未満の新規ユーザに対して優れた説明性(バイアスの少ない分類)と一般化精度を維持することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:13:26 GMT)
A Comprehensive Survey of Mamba Architectures for Medical Image Analysis: Classification, Segmentation, Restoration and Beyond [2.8] Mambaは、医用画像分析におけるテンプレートベースのディープラーニングアプローチに代わるものだ。
線形時間の複雑さがあり、トランスよりも大幅に改善されている。
Mambaは、注意機構のない長いシーケンスを処理し、高速な推論を可能にし、メモリを少なくする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:23:03 GMT)
Combining Pre- and Post-Demosaicking Noise Removal for RAW Video [2.8] Denoisingは、カメラセンサーが捉えたデータをディスプレイ対応の画像やビデオに変換する処理パイプラインの基本ステップの1つである。
本研究では,ベイアパターンのCFAビデオデータに対して,事前および復号化後のデノイザを重み付けする自己相似型デノイザ方式を提案する。
両者のバランスが画像品質の向上につながることを示し、高ノイズレベルがより高影響のプレデモーザックの恩恵を受けることを実証的に見出した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:20:19 GMT)
PnP-Flow: Plug-and-Play Image Restoration with Flow Matching [2.7] 本稿では,逆画像問題の解法であるPlug-and-Play Flow Matchingを提案する。
我々は,デノイング,スーパーレゾリューション,インペインティングのタスクにおける性能を評価した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:13:56 GMT)
A Foundation Model for the Solar Dynamics Observatory [2.6] SDO-FMは、NASAのソーラー・ダイナミクス・オブザーバ(SDO)からのデータを用いた基礎モデルである。
本稿では、Hugging Faceとsdofm.orgのコミュニティで利用可能な、事前トレーニングされたモデルと埋め込みデータセットのリリースを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:36:32 GMT)
Measurements with Noise: Bayesian Optimization for Co-optimizing Noise and Property Discovery in Automated Experiments [2.6] 我々は,段階内雑音最適化を自動実験サイクルに統合するベイズ最適化(BO)ワークフローを開発した。
自動実験における従来のBOアプローチは、実験軌道の最適化に重点を置いているが、しばしば測定ノイズがデータ品質とコストに与える影響を見落としている。
報酬駆動型雑音最適化と二重最適化関数の2つのアプローチが検討されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:38:43 GMT)
Efficient learning of differential network in multi-source non-paranormal graphical models [2.6] 本稿では,2種類の非正規グラフィカルモデル間のスパース構造変化や差分ネットワークの学習に対処する。
複数の情報源からのデータセットを組み合わせるという我々の戦略は、実世界の問題における差分ネットワークの推測に非常に効果的であることが示されている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:59:38 GMT)
Label-Free Subjective Player Experience Modelling via Let's Play Videos [2.4] プレイヤー・エクスペリエンス・モデリング(プレイヤー・エクスペリエンス・モデリング、英: Player Experience Modelling、PEM)は、ゲーム内のプレイヤーの経験をモデル化するためのAI技術の研究である。
ゲームプレイビデオからプレイヤー体験を近似する新しいPEM開発手法を提案する。
ゲーム『Angry Birds』における影響を予測するアプローチを,人間による研究を通して評価した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:12:56 GMT)
SRIF: Semantic Shape Registration Empowered by Diffusion-based Image Morphing and Flow Estimation [2.3] 拡散型画像モーフィングとフロー推定に基づく新しいセマンティック形状登録フレームワークSRIFを提案する。
SRIFは、挑戦的な形状対に関する高品質な密接な対応を実現するが、その間にスムーズで意味のある意味を与える。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:03:39 GMT)
Symbolic State Partitioning for Reinforcement Learning [2.2] 優れたパーティショニングは、学習中の一般化と、事前経験のより効率的な活用を可能にする。
パーティショニングは、状態成分間の非線形関係の存在において特に有害な近似を導入する。
シンボル分割は, 環境行動に関して, 状態空間のカバレッジを向上し, 余分な報酬に対して強化学習がより優れていることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:22:02 GMT)
Autonomous Self-Trained Channel State Prediction Method for mmWave Vehicular Communications [2.2] 5G mmWaveの車載接続は、高いユーザモビリティのために大きな課題となる。
我々は,mmWave車両利用者を対象とした自律学習型CSI予測フレームワークを開発した。
本稿では,DeepMIMOデータセット生成環境を用いて提案フレームワークの実装と評価を行う。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:20:48 GMT)
Accelerating Deep Learning with Fixed Time Budget [2.2] 本稿では,一定時間内に任意のディープラーニングモデルを学習するための効果的な手法を提案する。
提案手法はコンピュータビジョンにおける分類タスクと回帰タスクの両方において広範囲に評価される。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:18:04 GMT)
QDGset: A Large Scale Grasping Dataset Generated with Quality-Diversity [2.1] クオリティ・ダイバーシティ(QD)アルゴリズムは,サンプリングの効率を著しく向上させることが証明されている。
我々は、オブジェクト中心の把握を生成するQDフレームワークであるQDG-6DoFを拡張して、合成的把握データセットの生成を拡大する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:56:14 GMT)
On Logical Extrapolation for Mazes with Recurrent and Implicit Networks [2.0] 我々は,外挿の能力が従来提案されていたよりも頑丈でないことを示す。
INNは、より大きな迷路インスタンスに一般化できるが、迷路サイズ以外の難易度軸に沿って一般化できないことを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:07:51 GMT)
Dense Passage Retrieval: Is it Retrieving? [2.0] 本稿では,探索,層活性化解析,モデル編集を組み合わせたDPR学習モデルについて検討する。
実験により、DPRトレーニングは、ネットワーク内の知識の格納方法を分散化し、同一情報に対する複数のアクセス経路を生成することを示す。
事前訓練されたモデルの内部知識は、検索モデルが取得できるものの境界である。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 23:40:56 GMT)
P-SpikeSSM: Harnessing Probabilistic Spiking State Space Models for Long-Range Dependency Tasks [2.0] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワークに代わる計算効率が高く生物学的に妥当な代替品として提案されている。
長距離依存タスクのためのスケーラブルな確率的スパイク学習フレームワークを開発した。
我々のモデルは、様々な長距離依存タスクにまたがるSNNモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 18:55:14 GMT)
Recurrent Few-Shot model for Document Verification [2.0] 汎用ID, 旅行, 文書画像, 映像ベースの検証システムはまだ, 解決すべき問題として十分な性能を達成できていない。
本稿では,数ショットのシナリオで偽文書を検出可能なリカレントベースモデルを提案する。
SIDTDとFinditデータセットの予備的な結果は、このタスクのためにこのモデルの優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:05:27 GMT)
Color Equivariant Network [2.0] 群同変畳み込みニューラルネットワークは様々な幾何学的変換のために設計されている。
畳み込みニューラルネットワークは,設計による色調や彩度の変化に等しくなる。
合成および実世界のデータセット上でのネットワークの有用性を実証する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 01:48:47 GMT)
Overcoming Representation Bias in Fairness-Aware data Repair using Optimal Transport [2.0] 最適輸送(OT)は、公平さを増進する方法でデータ分布を変換する上で重要な役割を持つ。
ベイズ的非パラメトリック停止規則を用いて,データ分布の属性ラベル成分を学習する。
OT-最適量子化演算子は、アーカイブデータの修復に使用できる。
我々は、変換されたデータの損傷に対して公正さを交換できる量化器とともに、公平な分布目標の新たな定義を定式化する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:06:22 GMT)
DMC-Net: Lightweight Dynamic Multi-Scale and Multi-Resolution Convolution Network for Pancreas Segmentation in CT Images [1.9] 畳み込みニューラルネットワーク(CNN)は医用画像セグメンテーションにおいて極めて有効である。
CNNは、臓器の形状や大きさの大きなオブジェクト間変異をモデル化し、グローバルな長距離コンテキスト情報を利用する場合に限られる。
我々は,動的マルチソリューション・コンボリューション(DMRC)と動的マルチスケール・コンボリューション(DMSC)モジュールを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:19:21 GMT)
Discovering Clues of Spoofed LM Watermarks [1.9] 実際の透かしと偽りの透かしのテキストの間には、観測可能な相違があることが示される。
このようなアーティファクトの存在を確実に明らかにする厳密な統計テストを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:18:37 GMT)
Learning K-U-Net with constant complexity: An Application to time series forecasting [1.9] 時系列予測のための深層モデルのトレーニングは、時間複雑性の固有の課題において重要なタスクである。
本稿では,ディープラーニングモデルにおいて一定の時間的複雑性を実現するために,指数関数的に重み付けされた勾配降下アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:35:17 GMT)
A Novel Method for Accurate & Real-time Food Classification: The Synergistic Integration of EfficientNetB7, CBAM, Transfer Learning, and Data Augmentation [1.9] 本研究では,伝達学習,データ拡張,CBAMアテンションモジュールによって強化された最先端のEfficientNetB7アーキテクチャを用いる。
提案手法は,様々な深層学習手法を駆使して,96.40%の精度で一貫した平均精度を実現している。
特に、未確認データの推測中に1秒以内に60枚以上の画像を分類することができ、高い精度を迅速に提供できることを実証することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:39:06 GMT)
Leveraging Event Streams with Deep Reinforcement Learning for End-to-End UAV Tracking [1.8] 我々は,無人航空機(UAV)の自律性を高めるために,イベントカメラ,低エネルギー撮像センサを用いたアクティブトラッキング手法を提案する。
提案したトラッキングコントローラは、搭載されたイベントセンサからの視覚的フィードバックに応答し、ドローンの動きを目標に追従するように調整するように設計されている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 07:56:40 GMT)
Simultaneous photon and phonon lasing in a two-tone driven optomechanical system [1.8] 光子とフォノンの同時ラシングを光学的設定で実現する方法を示す。
我々の研究は、光学的相互作用の最適化のための新しい戦略開発への道を開くものである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:16:41 GMT)
AlzhiNet: Traversing from 2DCNN to 3DCNN, Towards Early Detection and Diagnosis of Alzheimer's Disease [1.7] 2次元畳み込みニューラルネットワーク(2D-CNN)と3次元畳み込みニューラルネットワーク(3D-CNN)を統合した新しいハイブリッドディープラーニングフレームワークを提案する。
我々のフレームワークはKaggleとMIRIADのデータセットから磁気共鳴イメージング(MRI)で検証され、それぞれ98.9%と99.99%、AUCは100%である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:37:18 GMT)
Universal Spreading of Conditional Mutual Information in Noisy Random Circuits [1.6] 一般開放量子系における条件付き相互情報の進化について検討する。
誤差率$p$のノイズランダム回路は条件付き相互情報の超線形伝播を示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 21:20:27 GMT)
Human vs. Machine: Behavioral Differences Between Expert Humans and Language Models in Wargame Simulations [1.6] 大規模言語モデル(LLM)は、高い軍事的意思決定シナリオにおいて、人間と異なる振る舞いを示す。
当社の結果は、自律性を認める前に政策立案者が慎重であること、あるいはAIベースの戦略レコメンデーションに従うことを動機付けています。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:51:03 GMT)
The Role of piracy in quantum proofs [1.6] 海賊攻撃を本質的に防止する実証システムである海賊防止システムについて検討する。
また、クローン化可能な量子証明システムについても検討し、この設定で有名なQMA対QMA(2)論争を解決した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:50:04 GMT)
MOREL: Enhancing Adversarial Robustness through Multi-Objective Representation Learning [1.5] ディープニューラルネットワーク(DNN)は、わずかに敵対的な摂動に対して脆弱である。
トレーニング中の強力な特徴表現学習は、元のモデルの堅牢性を大幅に向上させることができることを示す。
本稿では,多目的特徴表現学習手法であるMORELを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:28:48 GMT)
MOREL: Enhancing Adversarial Robustness through Multi-Objective Representation Learning [1.5] ディープニューラルネットワーク(DNN)は、わずかに敵対的な摂動に対して脆弱である。
トレーニング中の強力な特徴表現学習は、元のモデルの堅牢性を大幅に向上させることができることを示す。
本稿では,多目的特徴表現学習手法であるMORELを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:28:48 GMT)
Distributed Learning with Discretely Observed Functional Data [1.5] 本稿では,分散スペクトルアルゴリズムとソボレフカーネルを組み合わせることで,関数線形回帰問題に取り組む。
アルゴリズムの仮説関数空間は、ソボレフカーネルによって生成されるソボレフ空間である。
我々は、ソボレフノルムにおける分散スペクトルアルゴリズムの収束に対する上界と下界のマッチングを導出する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:49:34 GMT)
Reducing Warning Errors in Driver Support with Personalized Risk Maps [1.4] 本稿では,運転者の行動に基づいて,運転者のパーソナライズされた危険因子を推定する警告システムを提案する。
システムはその後、個人化されたリスクマップで警告信号を適応することができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:13:40 GMT)
Tutor CoPilot: A Human-AI Approach for Scaling Real-Time Expertise [1.4] Tutor CoPilotは、エキスパート思考のモデルを活用した、新しいヒューマンAIアプローチである。
本研究は,実地学習におけるヒューマンAIシステムのランダム化制御試験としては初めてである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:58:39 GMT)
SynthFormer: Equivariant Pharmacophore-based Generation of Molecules for Ligand-Based Drug Design [1.4] 本稿では, サイリコ生成法とin vitroにおける実用的手法のギャップについて考察する。
医薬品の3次元同変エンコーダを用いて、完全に合成可能な分子を生成する新しいMLモデルであるSynthFormerを紹介する。
我々の貢献には、3D情報を用いた効率的な化学空間探索のための新しい方法論、分子に3D薬局表現を翻訳するSynthformerと呼ばれる新しいアーキテクチャ、医薬品発見最適化のための試薬を組織する有意義な埋め込み空間が含まれる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:38:46 GMT)
ERIC: Estimating Rainfall with Commodity Doorbell Camera for Precision Residential Irrigation [1.3] 現在最先端の住宅用灌水システムでは、近くの気象観測所から降水量を調整するために雨量データに頼っている。
我々は,コモディティドアベルカメラの映像から降雨を推定する機械学習モデルを用いて,費用対効果の高い灌水システムERICを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:06:25 GMT)
ERIC: Estimating Rainfall with Commodity Doorbell Camera for Precision Residential Irrigation [1.3] 現在最先端の住宅用灌水システムでは、近くの気象観測所から降水量を調整するために雨量データに頼っている。
我々は,コモディティドアベルカメラの映像から降雨を推定する機械学習モデルを用いて,費用対効果の高い灌水システムERICを開発した。
ERICは最先端の降水量推定性能(5mm/日)を達成し、9,112ガロン/月を節約し、月28.56ドル/月を節約できる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:06:25 GMT)
CorPipe at CRAC 2024: Predicting Zero Mentions from Raw Text [1.3] 我々は,CorPipe 24,CRAC 2024Shared Task on Multilingual Coreference Resolutionについて述べる。
このタスクの第3イテレーションでは、新しい目的として、ゼロコア参照参照に必要な空のノードを予測することが挙げられる。
どちらの設定でも、CorPipeは、それぞれ3.9ポイントと2.8%の差で他の参加者を上回っている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:58:55 GMT)
RGD: Multi-LLM Based Agent Debugger via Refinement and Generation Guidance [1.3] 大規模言語モデル(LLM)は、コード生成タスクにおいて驚くべきポテンシャルを示しています。
LLMはタスク記述に基づいてコードを生成することができるが、精度は限られている。
コード生成と自動デバッグのためのLLMエージェントの新しいアーキテクチャ:Refinement and Guidancebug (RGD)を紹介する。
RGDはコード生成タスクを複数のステップに分割し、より明確なワークフローを確保し、自己回帰とフィードバックに基づいた反復的なコード改善を可能にする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:12:24 GMT)
Q-SCALE: Quantum computing-based Sensor Calibration for Advanced Learning and Efficiency [1.3] 本稿では,Deep Learning (DL) やQuantum Machine Learning (QML) といった先進的な手法を用いて,安価な光学ファインダストセンサの校正プロセスについて検討する。
プロジェクトの目的は、古典的領域と量子的領域の両方の洗練された4つのアルゴリズムを比較し、それらの格差を識別し、都市大気質監視における粒子状物質測定の精度と信頼性を改善するための代替アプローチを検討することである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:15:05 GMT)
WaveletGPT: Wavelets Meet Large Language Models [1.2] 大規模言語モデル(LLM)は、人工知能の新たな進歩の波を支えている。
本稿では,従来の信号処理のアイデアであるウェーブレットを事前学習中にLLMに注入し,その利点を生かした。
我々は、テキスト、生のオーディオ、シンボリック音楽において、ほぼ2倍の速さで事前学習を行う。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:21:57 GMT)
WaveletGPT: Wavelets Meet Large Language Models [1.2] 大規模言語モデル(LLM)は、人工知能の新たな進歩の波を支えている。
本稿では,従来の信号処理のアイデアであるウェーブレットを事前学習中にLLMに注入し,その利点を生かした。
我々は、テキスト、生のオーディオ、シンボリック音楽において、ほぼ2倍の速さで事前学習を行う。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:21:57 GMT)
BayesCNS: A Unified Bayesian Approach to Address Cold Start and Non-Stationarity in Search Systems at Scale [1.2] BayesCNSは、大規模検索システムにおけるコールドスタートおよび非定常分布シフトを処理するように設計されている。
BayesCNSは、オンラインに集められた新しいユーザーインタラクションを継続的に更新するユーザとイテムのインタラクションの事前分布を推定することで、これを達成している。
このオンライン学習手順はランサーモデルによりガイドされ、コンテキスト情報を用いて関連項目の効率的な探索を可能にする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 01:14:30 GMT)
A System for Critical Facility and Resource Optimization in Disaster Management and Planning [1.1] 災害時の医療インフラの破壊は、慢性腎臓病や末期腎疾患の重篤な患者に重大なリスクをもたらす。
本研究は, 救急医療システムのレジリエンスを高めるため, 患者再配置のための最適化モデルと, 仮設医療施設の戦略的配置を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:57:06 GMT)
Probabilistic Analysis of Least Squares, Orthogonal Projection, and QR Factorization Algorithms Subject to Gaussian Noise [1.1] Liesen et al. (2002) を拡張し、正則行列 Q の条件数が列が加わったときにどのように変化するかを分析する。
これらの結果は、QR分解アルゴリズムのような数値法にこれらの結果を適用する際に強い仮定であるQの正確な算術と正則性を仮定する。
本研究では, 完全正則性を仮定することなく, 行列 B の条件数増加に関する境界を導出することにより, このギャップに対処する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:27:04 GMT)
Brain-Aware Readout Layers in GNNs: Advancing Alzheimer's early Detection and Neuroimaging [1.1] 本研究では,グラフニューラルネットワーク(GNN)のための新しい脳認識読み出し層(BA読み出し層)を提案する。
機能的接続とノード埋め込みに基づく脳領域のクラスタリングによって、このレイヤは、複雑な脳ネットワーク特性をキャプチャするGNNの機能を改善する。
以上の結果から,BA読み出し層を有するGNNは,プレクリニカルアルツハイマー認知複合度(PACC)の予測において,従来のモデルよりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 05:04:45 GMT)
Hybrid Quantum-inspired Resnet and Densenet for Pattern Recognition [1.0] パターン認識のための残差と高密度接続を有する2つのハイブリッド量子インスピレーションニューラルネットワークを提案する。
一般化パワーに関する数値実験の集まりは、我々のハイブリッドモデルが純粋古典モデルと同じ一般化パワーを持っていることを示している。
ある研究によると、我々のハイブリッドモデルの認識精度は、残差や密接な接続のない量子ニューラルネットワークの認識精度よりも2%-3%高い。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 11:58:22 GMT)
Exploiting HDMI and USB Ports for GPU Side-Channel Insights [0.9] 本稿では,USBポートとHDMIポートの電力消費パターンを利用してGPUの動作を推定する新たな攻撃手法を提案する。
我々は、これらのポートに差し込むカスタムデバイスを開発し、その高解像度のパワー測定がGPUプロセスに関する推論を成功させることを示す。
我々の研究結果は、HDMIおよびUSBポートセキュリティの現在の世代を再評価し、強化する必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:44:15 GMT)
Efficiently Deploying LLMs with Controlled Risk [0.9] モデル内不確実性を利用してクエリをデリゲートする,階層型連鎖とマルチレベルアプテンション(HCMA)を提案する。
我々の枠組みは、効率とリスクの間に新たなトレードオフをもたらす。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:25:56 GMT)
Mixed-curvature decision trees and random forests [0.9] 決定木(DT)とそのランダム森林(RF)拡張はユークリッド空間における分類と回帰の作業場である。
DTおよびRFアルゴリズムを、いくつかの双曲的、超球的、ユークリッド的成分の積多様体積に拡張する。
我々の新しい DT の角的再構成は積多様体の幾何学を尊重し、測地的に凸であり、最大マージンであり、構成可能な分割を与える。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 00:48:07 GMT)
Measurement-induced phase transitions in systems with diffusive dynamics [0.9] 系が保存密度に結合されたときにMIPTの普遍性クラスが劇的に変化することを示す。
拡散度測定器が低密度または高密度である稀な時空領域によるグリフィス様の影響を見いだす。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:12:33 GMT)
Can Active Label Correction Improve LLM-based Modular AI Systems? [0.8] GPT-3.5アノテートした3つのデータセットのノイズと,その騒音を人間のフィードバックで分析する。
本稿では,トレーニングデータセットに3つの更新を反復的に適用する新しいALC3を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:25:27 GMT)
Low-overhead fault-tolerant quantum computation by gauging logical operators [0.8] 近年の進歩により、少ない接続要件と一定量子ビットオーバーヘッドを持つ量子エラー訂正符号が明らかになった。
フォールトトレラントな論理測度の既存のスキームは、常に低量子ビットオーバーヘッドを達成するとは限らない。
本稿では、量子誤り訂正符号において、論理演算子を対称性として扱い、それをゲージすることで、フォールトトレラントな論理測定を実現する低オーバーヘッド法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 05:04:12 GMT)
Efficient Source-Free Time-Series Adaptation via Parameter Subspace Disentanglement [0.8] 我々は、効率的なソースフリードメイン適応(SFDA)のためのフレームワークを提案する。
提案手法は,ソースモデル作成およびターゲット側適応のための改良されたパラダイムを導入する。
我々は,本フレームワークが様々なSFDA法と互換性があり,計算効率が高いことを実証した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:12:03 GMT)
Transforming Teachers' Roles and Agencies in the Era of Generative AI: Perceptions, Acceptance, Knowledge, and Practices [0.7] 本稿では,ジェネレーティブ・人工知能(GenAI)が教員の役割や教育機関に与える影響について考察する。
教員の認識、知識、受容、実践に対処する包括的枠組みを提示する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:59:01 GMT)
Optimal Zeno Dragging for Quantum Control: A Shortcut to Zeno with Action-based Scheduling Optimization [0.7] 量子ゼノ効果は、「崩壊」事象が十分に強く頻繁であるときに、量子測定が同時ユニタリダイナミクスを阻害すると主張する。
監視可能な可観測領域を動的に変更することにより、"Zeno Dragging"と呼ばれる散逸制御を実装することができる。
これは、測定速度と比較して固有状態変化の速度が遅いときに、Zenoドラッグフィリティが最高になるという断熱過程と似ている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:37:28 GMT)
Polynomial time constructive decision algorithm for multivariable quantum signal processing [0.7] マルチ変数量子信号処理(M-QSP)を提案する。
M-QSPは、各変数に対応する信号演算子と信号処理演算子をインターリーブする。
古典的アルゴリズムは、与えられたローラン対をM-QSPで実装できるかどうかを決定するために提案される。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:30:35 GMT)
GIST: Gibbs self-tuning for locally adaptive Hamiltonian Monte Carlo [0.7] 本稿では,アルゴリズムのチューニングパラメータを条件付きサンプリングすることで,局所適応型ハミルトン・モンテカルロサンプリング器を構築するための新しいフレームワークを提案する。
経路長を適応的にサンプリングするために、Gibs Self-tuning (GIST) と呼ぶこのフレームワークは、ランダム化されたHMC、マルチミリHMC、No-U-Turn Sampler (NUTS)、Apogee-to-Apogee Path Samplerを特別なケースとして含む。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 09:19:42 GMT)
Urban Traffic Forecasting with Integrated Travel Time and Data Availability in a Conformal Graph Neural Network Framework [0.7] 最先端のモデルは、可能な限り最良の方法でデータを考えるのに苦労することが多い。
本稿では,駅間の移動時間をグラフニューラルネットワークアーキテクチャの重み付き隣接行列に組み込む新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:46:36 GMT)
An Improved Variational Method for Image Denoising [0.6] The total variation (TV) method is an image denoising technique that aimed to reduce noise by minimize the total variation of the image。
そこで本研究では,画像復号化のための改良型テレビモデルとそれに関連する数値アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:29:43 GMT)
Residual-based Attention Physics-informed Neural Networks for Spatio-Temporal Ageing Assessment of Transformers Operated in Renewable Power Plants [0.6] 本稿では,変圧器の巻線温度と経年変化に関する時間モデルを紹介する。
物理ベースの偏微分方程式とデータ駆動ニューラルネットワークを用いる。
フローティング太陽光発電プラントで動作する配電変圧器を用いて, 実験結果を検証した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:34:02 GMT)
RGD: Multi-LLM Based Agent Debugger via Refinement and Generation Guidance [0.6] 大規模言語モデル(LLM)は、コード生成タスクにおいて驚くべきポテンシャルを示しています。
LLMはタスク記述に基づいてコードを生成することができるが、精度は限られている。
コード生成と自動デバッグのためのLLMエージェントの新しいアーキテクチャ:Refinement and Guidancebug (RGD)を紹介する。
RGDはコード生成タスクを複数のステップに分割し、より明確なワークフローを確保し、自己回帰とフィードバックに基づいた反復的なコード改善を可能にする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:12:24 GMT)
Simplified projection on total spin zero for state preparation on quantum computers [0.5] 本稿では,多体系のJ=0$状態に投影する簡単なアルゴリズムを提案する。
このアプローチは、単体演算子$J_x$と$J_z$を使って、必要なプロジェクションを実行する。
ゲートの複雑さが小さくなると、この手法は偶数核の近似基底状態を作るのに使うことができる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:44:24 GMT)
Optimal Projections for Discriminative Dictionary Learning using the JL-lemma [0.5] 次元減少に基づく辞書学習法は、しばしば反復的ランダムプロジェクションを用いている。
本稿では、ジョンソン-リンデンシュトラウス補題を用いて、投影行列をデランドマイズする構成的手法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 10:05:24 GMT)
Learning Optimal Control and Dynamical Structure of Global Trajectory Search Problems with Diffusion Models [0.5] 本稿では,循環制限型3体問題における2つの大域的探索問題について検討する。
我々は、拡散モデルを適用して条件付き確率分布を学習するために、事前生成機械学習フレームワークを構築した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:35:23 GMT)
Cluster-norm for Unsupervised Probing of Knowledge [0.5] 本稿では,クラスタ正規化手法を提案する。
干渉の中で意図した知識を識別する、教師なしのプローブの能力を大幅に改善する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:53:52 GMT)
LLM-Pilot: Characterize and Optimize Performance of your LLM Inference Services [0.5] LLM-Pilot は LLM 推論サービスの性能を評価・予測するための第一種システムである。
予測モデルを学び、これまで見つからなかったLCMのために最もコスト効率の良いハードウェアを推奨することができる。
既存の方法と比較して、LLM-Pilotはパフォーマンス要件を33%頻繁に提供し、コストを平均60%削減できる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:19:06 GMT)
Differentiation and Specialization of Attention Heads via the Refined Local Learning Coefficient [0.5] 特異学習理論に基づくモデル複雑性の尺度である局所学習係数 (LLC) の洗練された変種を導入する。
本研究では,トランスフォーマー言語モデルにおける内部構造の開発について検討する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:51:02 GMT)
Neural DDEs with Learnable Delays for Partially Observed Dynamical Systems [0.5] 定数ラグニューラルネットワーク遅延微分方程式(NDDE)が部分的に観測された状態に適したモデルであることを示す。
実験的な評価では、これらのモデルは、合成データと実験データの両方において、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 13:54:21 GMT)
Subspace-thermal discrete time crystals from phase transitions between different n-tuple discrete time crystals [0.5] 駆動周期の任意の倍数に対応する新しいフロケット時間結晶モデルを提案する。
これらの周期の異なる時間結晶間の遷移は、サブスペース-熱的離散時間結晶と呼ばれる新しい物質相をもたらす。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:49:40 GMT)
Beyond Expected Returns: A Policy Gradient Algorithm for Cumulative Prospect Theoretic Reinforcement Learning [0.5] 累積プロスペクト理論(CPT)は、経験的証拠によって支持された人間に基づく意思決定のためのより良いモデルを提供するために開発された。
数年前、CPTは強化学習(Reinforcement Learning, RL)と組み合わせて、CPTポリシー最適化問題を定式化した。
政策勾配アルゴリズムは, 既存のゼロ次アルゴリズムと比較して, 同じ問題を解くために, より大きな状態空間に拡張可能であることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:45:39 GMT)
Solution of the Probabilistic Lambert Problem: Connections with Optimal Mass Transport, Schrödinger Bridge and Reaction-Diffusion PDEs [0.4] ランバート問題の起源は軌道力学である。
時間的地平線と終点位置の制約を加えた重力ポテンシャルによる動的制約を含む境界値問題の初期速度を決定することに関心がある。
位置ベクトルにおける終点制約の知識をそれぞれの合同確率密度関数の知識に置き換えるランベルト問題の確率的変種を考える。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:35:40 GMT)
Exploring language relations through syntactic distances and geographic proximity [0.4] ユニバーサル依存データセットから抽出した音声の一連の部分(POS)を用いて言語間距離を探索する。
特定の形態的類型によって説明される例外を除いて、よく知られた言語族やグループに対応する定型クラスタが見つかる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 08:24:40 GMT)
Quantitative Approximation for Neural Operators in Nonlinear Parabolic Equations [0.4] 非線形放物型偏微分方程式(PDE)に対する解作用素の近似速度を導出する。
この結果から,モデル複雑性の指数的増大を伴わずに,これらの解演算子を効率的に近似できることがわかった。
我々の証明における重要な洞察は、Duahamelの原理を介してPDEを対応する積分方程式に変換し、ニューラル作用素とPicardの反復との類似性を活用することである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:28:17 GMT)
Satyrn: A Platform for Analytics Augmented Generation [0.4] 本稿では、構造化データの解析を用いて、検索された文書がRAGで使用されるのとほとんど同じように、生成をガイドするために使用される事実集合を生成するアプローチを提案する。
我々は、AAGを利用して大規模データベース上に構築された正確で流動的でコヒーレントなレポートを生成する、ニューロシンボリックなプラットフォームであるSatyrnを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:49:27 GMT)
Short-Period Variables in TESS Full-Frame Image Light Curves Identified via Convolutional Neural Networks [0.4] 短周期変数の同定を訓練する畳み込みニューラルネットワークを提案する。
ネットワークは,1つのGPU上で5msのTESS30分のケイデンス光曲線で推論を行う。
ネットワークによって識別された14156個の短周期変数のコレクションを提示する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 03:11:19 GMT)
An Edge-Computing based Industrial Gateway for Industry 4.0 using ARM TrustZone Technology [0.4] 本稿では,エッジコンピューティングによる情報技術と運用技術のための産業ゲートウェイを提案する。
遠隔生産ラインメンテナンスのユースケースを実演する作業プロトタイプを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:36:32 GMT)
Fully Automated CTC Detection, Segmentation and Classification for Multi-Channel IF Imaging [0.3] 液体生検は、乳がんの進行をモニターするために、組織生検のより侵襲的で非局所的な代替手段を提供する。
循環性腫瘍細胞(CTC)はまれ(約2Mで1個)、手動CTC検出が困難である。
我々は,マルチチャネルIF画像中のCTCを効率よく検出,セグメント化,分類する,完全に自動化された機械学習に基づく生産レベルパイプラインを開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:58:07 GMT)
On the feasibility of quantum teleportation protocols implemented with Silicon devices [0.3] シリコンベースのスピン量子ビット(量子ビット)は、スケーラブルな量子コンピューティングの候補として期待されている。
本稿では,シリコンの電気的に定義された量子ドット構造上に実装された絡み合いに基づく量子情報応用の計算的検討を行う。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:07:46 GMT)
Pseudo-Automation: How Labor-Offsetting Technologies Reconfigure Roles and Relationships in Frontline Retail Work [0.2] セルフサービスマシンは擬似自動化の一種であり、タスクを実際に自動化するのではなく、無給の顧客にオフセットする。
セルフサービスはしばしば、カスタマーサービスの悪化と小売業者の損失と盗難の増加で批判されている。
セルフチェックアウトの結果,キャッシュ処理作業に3つの変更が加えられた。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:19:52 GMT)
Crisis Communication in the Face of Data Breaches [0.2] 本稿では,データ漏洩危機コミュニケーション戦略とその実践的実行について検討する。
本論文は,データ漏洩の危機,その特異性,管理に特化して研究領域に貢献する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 06:01:52 GMT)
Deep Learning-Based Prediction of Suspension Dynamics Performance in Multi-Axle Vehicles [0.2] 本稿では,多軸車におけるサスペンションシステムの動的性能を予測するためのディープラーニングフレームワークを提案する。
MTL-DBN-DNN(Multi-Task Deep Belief Network Deep Neural Network)を開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:10:02 GMT)
Morphological evaluation of subwords vocabulary used by BETO language model [0.2] サブワードのトークン化アルゴリズムはより効率的で、人間の介入なしに単語とサブワードの語彙を独立して構築することができる。
本研究では,これらの語彙と言語の形態の重なり合いに着目し,語彙の形態的品質を評価する手法を提案する。
この手法をBPE,Wordpiece,Unigramの3つのサブワードトークン化アルゴリズムによって生成された語彙に適用することにより,これらの語彙は一般に非常に低い形態的品質を示すと結論付けた。
この評価は、著者の主張の不整合を考慮し、トークン化器、すなわちWordpieceが使用するアルゴリズムを明らかにするのに役立ちます。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:07:14 GMT)
Adapting Segment Anything Model to Melanoma Segmentation in Microscopy Slide Images [0.2] 本稿では,Segment Anything Model (SAM) を用いた顕微鏡スライド画像の自動メラノーマ分割法を提案する。
提案手法では,初期セグメンテーションモデルを用いて予備セグメンテーションマスクを生成し,SAMのプロンプトに使用する。
実験の結果,IoUではベースラインセグフォーマを9.1%上回った。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 04:40:18 GMT)
Fault-tolerant logical measurements via homological measurement [0.1] ホモロジー測定は、CSS安定化符号でエンコードされた論理的パウリ演算子を測定するためのフレームワークである。
我々は、一般的なqLDPC符号の任意の論理パウリ演算子の耐故障性測定のための特定のプロトコルを開発する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:58:20 GMT)
CTARR: A fast and robust method for identifying anatomical regions on CT images via atlas registration [0.1] 我々はCT解剖学的領域認識のための新しい汎用手法であるCTARRを紹介する。
この方法は、ディープラーニングベースのCT画像解析パイプラインの事前処理ステップとして機能する。
提案手法は, アトラス登録に基づいて, 無ラベルCTスキャンから1つまたは複数の境界ボックスとして符号化された解剖学的領域を抽出する高速かつ堅牢な方法を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:52:21 GMT)
Virial expansion for the optical response of doped two-dimensional semiconductors [0.0] ドープ2次元半導体の光応答に対する量子仮想展開について述べる。
ウイルスの膨張は、普遍的な低エネルギーエキシトン電子散乱に関連する魅力的な分岐の非摂動形状のような、フォトルミネッセンスの新たな特徴を予測する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 10:02:45 GMT)
Variational Quantum Crank-Nicolson and Method of Lines for the Solution of Initial Value Problems [0.0] Inlicit Crank-Nicolson と Method of Lines (MoL) による初期値問題の解法として変分量子アルゴリズムを用いる。
実装を説明するために開発された例は、Advection equation、一階結合方程式系として記述された波動方程式、非線形の場合として粘性バーガース方程式である。
本論文の貢献は, 1) 暗黙のクランク・ニコルソンとMoLを用いたPDEにおける一般一階のコスト関数, 2) 解いたすべての方程式に対して,詳細な収束テスト, 自己収束テストを示すこと,3) システムを含む。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:49:56 GMT)
Unitary k-designs from random number-conserving quantum circuits [0.0] 局所ランダム回路は効率よくスクランブルし、量子情報や量子力学に様々な応用がある。
有限モーメントは、数保存ユニタリ群全体のハールアンサンブルから局所ランダム回路が生成するアンサンブルを区別できないことを示す。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:11:31 GMT)
Uncertainty Quantification with Bayesian Higher Order ReLU KANs [0.0] 本稿では,コルモゴロフ・アルノルドネットワークの領域における不確実性定量化手法について紹介する。
簡単な一次元関数を含む一連の閉包試験により,本手法の有効性を検証した。
本稿では,ある項を包含することで導入された機能的依存関係を正しく識別する手法の能力を実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:21:38 GMT)
Uncertainty Quantification with Bayesian Higher Order ReLU KANs [0.0] 本稿では,コルモゴロフ・アルノルドネットワークの領域における不確実性定量化手法について紹介する。
簡単な一次元関数を含む一連の閉包試験により,本手法の有効性を検証した。
本稿では,ある項を包含することで導入された機能的依存関係を正しく識別する手法の能力を実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:21:38 GMT)
Theoretical Approximation Ratios for Warm-Started QAOA on 3-Regular Max-Cut Instances at Depth $p=1$ [0.0] 我々はFarhiの0.6924近似結果技術をウォームスタートQAOAに一般化する。
初期状態が積状態であり、各キュービット位置がブロッホ球の北極または南極から約$theta$離れた角度にある場合の温暖開始を考える。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:23:36 GMT)
The why, what, and how of AI-based coding in scientific research [0.0] 生成AI、特に大きな言語モデル(LLM)は、コーディングを直感的な会話に変換する可能性がある。
私たちは3つの重要なレンズを通してAIベースのコーディングを区別します。
コーディングにおけるAIの限界と将来の展望に対処する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:36:30 GMT)
The Faraday Effect as a Two-State Quantum Process [0.0] ファラデー効果は単純な2状態モデルから導出可能であることを示す。
このアプローチは量子化電磁場を使用し、左右の偏光の屈折率の違いに言及しない。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:55:37 GMT)
The Faraday Effect as a Two-State Quantum Process [0.0] ファラデー効果は単純な2状態モデルから導出可能であることを示す。
このアプローチは量子化電磁場を使用し、左右の偏光の屈折率の違いに言及しない。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:55:37 GMT)
Tensor Product Structure Geometry under Unitary Channels [0.0] 局所性は通常、量子系の局所的なサブシステムを特定する製品構造(TPS)に関して定義される。
このTPS距離は局所的なサブシステム間の力学のスクランブル特性と関連し、2つのユニットの絡み合いの力と一致することを示す。
短時間のハミルトン進化では、TPS距離の特徴的な時間スケールは、局所的なサブシステム間の相互作用の強さによって決定されるスクランブルレートに依存する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:02:22 GMT)
Systematic construction of multi-controlled Pauli gate decompositions with optimal $T$-count [0.0] マルチコントロールされたパウリゲートは量子回路に現れる典型的な高レベル量子ビット演算である。
現在知られている最小の$T$-countを維持しながら、より小さなCNOTカウントまたは$T$-depthで分解する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:59:17 GMT)
Systematic construction of multi-controlled Pauli gate decompositions with optimal $T$-count [0.0] マルチコントロールされたパウリゲートは量子回路に現れる典型的な高レベル量子ビット演算である。
現在知られている最小の$T$-countを維持しながら、より小さなCNOTカウントまたは$T$-depthで分解する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:59:17 GMT)
SurgPointTransformer: Vertebrae Shape Completion with RGB-D Data [0.0] 本研究は,RGB-Dデータを用いた3次元脊椎解剖の再構築のための代替的,放射線のないアプローチを提案する。
SurgPointTransformerは, 表面の粗い観察から未露出の脊椎領域を正確に再構築できる手術用形状補修法である。
提案手法は,平均チャンファー距離5.39,Fスコア0.85,アースモーバー距離0.011,信号対雑音比22.90dBを達成し,最先端のベースラインを著しく上回る。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:14:29 GMT)
SurgPointTransformer: Vertebrae Shape Completion with RGB-D Data [0.0] 本研究は,RGB-Dデータを用いた3次元脊椎解剖の再構築のための代替的,放射線のないアプローチを提案する。
SurgPointTransformerは, 表面の粗い観察から未露出の脊椎領域を正確に再構築できる手術用形状補修法である。
提案手法は,平均チャンファー距離5.39,Fスコア0.85,アースモーバー距離0.011,信号対雑音比22.90dBを達成し,最先端のベースラインを著しく上回る。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:14:29 GMT)
Superluminal Propagation of Composite Collective Modes in Superconductor-Ferromagnet Heterostructures [0.0] 合成集合モードのスペクトルである$omega(k)$は、$H_demH_an$と$H_dem>H_an$の場合、定性的に異なる形式であることを示す。
強磁性体における中等方性あるいは弱い異方性に対して、集合モードの群速度は群速度が無限で超光度である屈折点を示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:09:21 GMT)
Subdiffusive dynamics in photonic random walks probed with classical light [0.0] 強調力学の下での強い古典光のランダムウォークは、量子とアンサンブル平均を乱す可能性があることを示す。
合成時間格子におけるフォトニックランダムウォークを,結合ファイバーループのパルスダイナミクスに基づいて提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:12:54 GMT)
Streaming Compression of Scientific Data via weak-SINDy [0.0] ストリーミング型弱いSINDyアルゴリズムは, ストリーミング型科学データを圧縮するために開発された。
動的に更新されたPODベースに対応するために,ストリーミング弱SINDyアルゴリズムの修正を提案する。
ストリーミング弱SINDyアルゴリズムから構築したモデルと少量のデータサンプルを組み合わせることで、完全なデータフローを低コストで正確に再構築することができる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 02:37:52 GMT)
Stable-to-unstable transition in quantum friction [0.0] 本研究では,2つの散逸金属板をせん断運動に設定した場合の量子揺らぎに起因する摩擦力について検討する。
初期の研究では、量子摩擦機構の電磁場が非平衡定常状態に達することが示されているが、他の研究は定常状態に到達できないことを示した。
摂動近似のない完全量子力学理論を開発し、安定な状態から不安定な状態への遷移を明らかにする。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 06:20:55 GMT)
Source Data Selection for Brain-Computer Interfaces based on Simple Features [0.0] 脳-コンピュータインタフェースのキャリブレーション中に利用できる単純な機能は、ソースデータの選択に利用できる。
Transfer Performance Predictorメソッドは、他のソースデータ選択方法よりも優れています。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:17:37 GMT)
Semidefinite relaxations for high-dimensional entanglement in the steering scenario [0.0] 本稿では,シュミット番号の認証により,ソースの絡み目次元を検出する一般的な方法を提案する。
第二に、任意の次元において任意の最大絡み合った状態にソースの忠実度を束縛する方法を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:00:59 GMT)
Semantic-Guided RL for Interpretable Feature Engineering [0.0] SMARTはセマンティック技術を用いて解釈可能な特徴の生成を誘導するハイブリッドアプローチである。
公開データセットを用いた実験により,SMARTは高い解釈性を確保しつつ予測精度を大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:28:05 GMT)
RelChaNet: Neural Network Feature Selection using Relative Change Scores [0.0] 本稿では、ニューラルネットワークの入力層にニューロンのプルーニングと再成長を利用する、新しくて軽量な特徴選択アルゴリズムであるRelChaNetを紹介する。
我々の手法は一般に現在の最先端手法よりも優れており、特にMNISTデータセットの平均精度を2%向上させる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 09:56:39 GMT)
Randomized Runge-Kutta-Nyström Methods for Unadjusted Hamiltonian and Kinetic Langevin Monte Carlo [0.0] 非可逆マルコフ連鎖モンテカルロサンプリング器内のハミルトン流を近似するための5/2$-および7/2$-精度のランダム化ランゲ・クッタ・ニストロ法を導入する。
数値実験により,多種多様な高次元目標分布に対する未調整試料の高効率性を実証した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 14:31:13 GMT)
Qudit-based quantum error-correcting codes from irreducible representations of SU(d) [0.0] クイディットは自然にマルチレベル量子システムに対応するが、その信頼性は量子エラー補正能力に基づいている。
a general procedure for constructing error-correcting qudit codes through the irreducible representations of $mathrmSU(d)$ for any odd integer $d geq 3.$
我々は、論理的なquditを$(d-1)2$の物理量子ビットに符号化する無限クラスの誤り訂正符号を構築するために、我々の手順を使用する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:35:57 GMT)
Quasi Inverse of Qubit Channels for Mixed States [0.0] キュービットチャネルの準逆をユニタリ写像として、$mathcalEi$とする。
トレース距離に基づく定義は、擬似逆入力状態から混合入力状態への容易に一般化を可能にした。
パウリ準逆、一般化振幅減衰、混合ユニタリ、テトラヘドロンチャネルは、入力状態が純粋である特別な場合において忠実性を用いて計算されたものと一致したトレース距離に基づいて計算された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:57:55 GMT)
Quantum advantage and lower bounds in parallel query complexity [0.0] 本稿では,全関数に対する量子・ランダム化・決定論的(逐次的)問合せ複雑性について検討する。
これらの測度の平行一般化の間には、はるかに大きな分離が可能であることが分かる。
逐次上界から並列量子下界を導出する新しい手法を開発した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:50:00 GMT)
Quantum Machine Learning for Digital Health? A Systematic Review [0.0] 量子機械学習(QML)がデジタルヘルスデータ処理に経験的な優位性をもたらすかどうか、まだ明らかでない。
デジタル電子健康医療記録(EH/MR)と、EH/MRの適切なプロキシであると考えられるデータを含める。
デジタルヘルスにおけるQMLの応用は、主に医療サービス提供や公衆衛生ではなく、臨床上の意思決定支援に焦点を当てている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:41:28 GMT)
Quantum Fluctuation Theorem for Arbitrary Measurement and Feedback Schemes [0.0] 我々は、新しいゆらぎ定理と関連する情報熱力学の第二法則を導出する。
第2法則では、エントロピー生成は測定結果から推測できない粗粒のエントロピー生成によって境界づけられる。
我々は、離散的かつ連続的な測定を行う量子ビットを用いて、この結果を説明し、そこでは、すべての測定強度に対してエントロピー生成に有用なバウンドを提供する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 18:04:31 GMT)
Quantifying nonclassicality of mixed Fock states [0.0] ボソニックモードの非古典的状態は、量子化技術にとって重要な資源である。
操作資源理論 (ORT) 測定により, 混合フォック状態におけるボソニックモードの非古典性を定量化する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:20:59 GMT)
Pseudo-Stereo Inputs: A Solution to the Occlusion Challenge in Self-Supervised Stereo Matching [0.0] 自己教師型ステレオマッチングは、応用と研究に非常に有望である。
光量損失関数に基づく自己教師付きステレオマッチングのパラダイムは、常に性能問題に悩まされてきた。
本稿では,コアオクルージョン問題に対処する,シンプルで効果的な擬似ステレオ入力方式を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:40:17 GMT)
Prospects of phase-adaptive cooling of levitated magnetic particles in a hollow-core photonic-crystal fibre [0.0] 本研究では, 中空コアフォトニック結晶ファイバ内に浮遊するマイクロ-ナノ磁性粒子の古典運動の冷却可能性について解析した。
我々の研究結果は、捕捉されたマイクロマグネットを検知、基礎物理学のテスト、磁化の量子状態の準備に利用するための重要なステップをもたらす。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:20:49 GMT)
Predicting Solar Energy Generation with Machine Learning based on AQI and Weather Features [0.0] 大気質指数と気象特性が太陽エネルギー発生に与える影響について検討する。
各種機械学習アルゴリズムとConv2D長短期記憶モデルに基づくディープラーニングモデルをこれらの変換に適用する。
我々は,Conv2D Long Short-Term Memoryモデルを用いた0.9691$R2$Score,0.18 MAE,0.10 RMSEを実現する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:29:26 GMT)
PixelShuffler: A Simple Image Translation Through Pixel Rearrangement [0.0] スタイル転送は画像から画像への変換の応用として広く研究されており、ある画像の内容を他の画像のスタイルと組み合わせた画像の合成が目的である。
既存の最先端の手法は、しばしば高品質なスタイル転送を実現するために拡散モデルや言語モデルを含む複雑なニューラルネットワークに依存している。
本稿では,画像から画像への変換問題に対処する新たなピクセルシャッフル手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 22:08:41 GMT)
Performance of a radio-frequency two-photon atomic magnetometer in different magnetic induction measurement geometries [0.0] ここで報告された発展は、2光子過程の基本的および応用的な側面を磁気誘導測定に組み入れている。
高コントラスト測定は、センサーの一次磁場に対する感度の低下により得られる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:49:51 GMT)
Partial yet definite emergence of the Kardar-Parisi-Zhang class in isotropic spin chains [0.0] 積分可能な等方スピン鎖におけるカルダル・パリ・張普遍性クラスについて検討する。
調整可能なパラメータを持たないKPZスケーリング法則と完全に一致している。
これにより、可積分等方性スピン鎖におけるKPZクラスの部分的な出現が確立される。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 20:38:05 GMT)
Parameter Estimation of Long Memory Stochastic Processes with Deep Neural Networks [0.0] 時系列モデルの長いメモリパラメータを推定するために,純粋にディープなニューラルネットワークに基づくアプローチを提案する。
ハースト指数のようなパラメータは、プロセスの長距離依存、粗さ、自己相似性を特徴づけるのに重要である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:14:58 GMT)
Overcoming sloppiness for enhanced metrology in continuous-variable quantum statistical models [0.0] 量子環境では、符号化が固定されると、スロッピー量子統計モデルから計算された量子フィッシャー情報行列に対しても同様に起こる。
2つの位相シフトパラメータの符号化とマッハ・ツェンダー干渉計の間に量子状態を適切にスクランブルすることにより、スロープ性を持ち上げるだけでなく、量子不整合性をゼロにすることができることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:01:48 GMT)
Optimised Hybrid Classical-Quantum Algorithm for Accelerated Solution of Sparse Linear Systems [0.0] 本稿では, 疎線形系をより効率的に解くために, プレコンディショニング手法とHHLアルゴリズムを組み合わせるハイブリッド古典量子アルゴリズムを提案する。
提案手法は,高速化とスケーラビリティにおいて従来の手法を超越するだけでなく,量子アルゴリズムの本質的な制約を緩和することを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:36:14 GMT)
Optimal continuity bound for the von Neumann entropy under energy constraints [0.0] 任意のハミルトニアンによって課せられるエネルギー制約の下で、フォン・ノイマンエントロピーに対する大域的最適連続性を構築する。
この設定において、フォン・ノイマンエントロピーに対して有界な最適連続性を求める問題は、完全に解決される。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:14:24 GMT)
On the feasibility of performing quantum chemistry calculations on quantum computers [0.0] 分子の基底状態を見つけるための2つの主要な量子アプローチを評価するための2つの基準を提案する。
最初の基準は変分量子固有解法(VQE)アルゴリズムに適用される。
第2の基準は量子位相推定(QPE)アルゴリズムに適用される。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 07:05:02 GMT)
Normalized Narrow Jump To Conclusions: Normalized Narrow Shortcuts for Parameter Efficient Early Exit Transformer Prediction [0.0] 初期層上での線形変換による事前学習型変圧器のショートカットにより,早期推論の精度が向上することが示されている。
本研究では,NJTC(Narrow Jump to Conclusions)と正規化Narrow Jump to Conclusions(N-NJTC)を提案する。
NJTCは、標準的な線形ショートカットに代わるパラメータ効率の良い代替品であり、ショートカットパラメータの数を97%以上削減する。
GPT-2-XL, Phi3-Mini, Llama2-7B 変圧器モデルにおいて, N-NJTC は早期にアイデンティティショートカットを確実に上回り, 変圧器ブロックレベルから安定な精度を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:41:39 GMT)
Normalized Narrow Jump To Conclusions: Normalized Narrow Shortcuts for Parameter Efficient Early Exit Transformer Prediction [0.0] 初期層上での線形変換による事前学習型変圧器のショートカットにより,早期推論の精度が向上することが示されている。
本研究では,NJTC(Narrow Jump to Conclusions)と正規化Narrow Jump to Conclusions(N-NJTC)を提案する。
NJTCは、標準的な線形ショートカットに代わるパラメータ効率の良い代替品であり、ショートカットパラメータの数を97%以上削減する。
GPT-2-XL, Phi3-Mini, Llama2-7B 変圧器モデルにおいて, N-NJTC は早期にアイデンティティショートカットを確実に上回り, 変圧器ブロックレベルから安定な精度を提供する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:41:39 GMT)
Modelling the longevity of complex living systems [0.0] この拡張された抽象化はリトアニアのヴィリニュスにあるECML PKDD 2024のNectar Trackで発表された。
The Proceedings of the National Academy of Sciences (PNAS) に最近発表された論文 "Laws of Macroevolutionary Expansion" を補っている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:36:13 GMT)
Metrics Revolutions: Groundbreaking Insights into the Implementation of Metrics for Biomedical Image Segmentation [0.0] 距離ベースのメトリクスのための11のオープンソースツールと、高精度なメッシュベースのリファレンス実装を比較します。
その結果、すべてのオープンソースツールで統計的に有意な違いがあることが判明した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:14:22 GMT)
Linear cooling of a levitated micromagnetic cylinder by vibration [0.0] マイクロマグネットシリンダのトランスレーショナルおよびリリレーショナル自由度のフィードバック冷却について報告する。
振動分離を導入することにより, 中心質量モードの地中冷却を実現することが可能であることが判明した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 12:14:38 GMT)
Learning the Latent Rules of a Game from Data: A Chess Story [0.0] そこで本研究では,228Mおよび125Mパラメータ事前学習小言語モデル(SLM)を1000から1000,000の例で微調整できることを示す。
また、逐次的な言語モデル微調整エポックが結果改善に与える影響についても検討する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 12:19:49 GMT)
Large language models as linguistic simulators and cognitive models in human research [0.0] 人間のようなテキストを生成する大きな言語モデル(LLM)の台頭は、行動や認知研究における人間の参加者を置き換える可能性についての議論を巻き起こした。
心理学・社会科学における言語モデルの基本的有用性を評価するために,この代替視点を批判的に評価する。
この視点は、行動科学と認知科学における言語モデルの役割を再定義し、言語シミュレータや認知モデルとして機能し、マシンインテリジェンスと人間の認知と思考の類似点と相違点に光を当てている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 01:29:57 GMT)
LML-DAP: Language Model Learning a Dataset for Data-Augmented Prediction [0.0] 本稿では,Large Language Models (LLMs) を解説可能な方法で分類する手法を提案する。
提案手法は,予測の解釈可能性を高めるために,"Act as a Explainable Machine Learning Model" という単語を使用する。
いくつかのテストケースでは、システムは90%以上の精度を記録し、システムの有効性を証明した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:57:07 GMT)
Is a particle an irreducible representation of the Poincaré group? [0.0] 粒子がポアンカレ群の既約表現であるという主張は、粒子物理学の民俗学の一部であり、しばしばそれが定義である、あるいは主張される。
本論文の目的は, (i) この識別の背景にある概念を明確にし, 部分的に防衛すること, (ii) 適切な定義であることへの異議を提起すること, (iii) 粒子の競合的特徴付けを提供することである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:06:00 GMT)
Improved quantum algorithm for calculating eigenvalues of differential operators and its application to estimating the decay rate of the perturbation distribution tail in stochastic inflation [0.0] 微分作用素 $mathcalL$ の最初の固有値を $mathbbRd$ 上で推定する量子アルゴリズムを提案する。
次に、量子インフレーション(quantum inflation)として知られる宇宙のインフレーションの理論的枠組みにおける問題への我々の方法の適用について考察する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:56:20 GMT)
Human-Based Risk Model for Improved Driver Support in Interactive Driving Scenarios [0.0] 運転支援の改善にドライバ情報を利用する人間型リスクモデルを提案する。
大規模なシミュレーションでは,新たな人為的リスクモデルが早期の警告時間を実現し,警告エラーの低減を図っている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:10:13 GMT)
Hebbian Learning from First Principles [0.0] 我々は、そのハミルトン的表現を教師なしおよび教師なしのプロトコルに仮定する。
エントロピー拡大力ネットワークにおけるラグランジアン制約がニューラル相関に与える影響を示す。
指数ホップフィールドモデル(密度のばらつきに富んだ高密度ネットワークの限界として)や半教師付きプロトコルについても言及する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 15:12:40 GMT)
Harnessing Quantum Extreme Learning Machines for image classification [0.0] 本研究は、画像分類タスクにおける量子機械学習技術の利用に焦点を当てる。
我々は,量子貯水池基板が提供する豊富な特徴写像を利用して,量子極端学習マシンを利用する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:53:02 GMT)
Gluing together Quantum Field Theory and Quantum Mechanics: a look at the Bell-CHSH inequality [0.0] 相対論的スカラー量子場の真空状態におけるベル-CHSH不等式は、ヒルベルト空間 $cal H otimes cal H_AB$ を用いて再検討する。
エルミート的場依存二コトミック作用素の構成はベル-CHSH不等式と同様に考案された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:25:05 GMT)
Genuine entanglement detection via projection map in multipartite systems [0.0] 正だが完全に正の写像ではない射影写像を考慮し、真の多部交絡を検出するフォーマリズムを提案する。
プロジェクションマップに基づく適切な目撃者演算子を構築し,真の三部交絡の証明を行う。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 19:42:45 GMT)
Generalization emerges from local optimization in a self-organized learning network [0.0] 我々は,グローバルなエラー関数に頼ることなく,局所最適化ルールのみによって駆動される,教師付き学習ネットワーク構築のための新しいパラダイムを設計・分析する。
我々のネットワークは、ルックアップテーブルの形で、ノードに新しい知識を正確かつ瞬時に保存する。
本稿では,学習例数が十分に大きくなると,アルゴリズムによって生成されたネットワークが完全な一般化状態に体系的に到達する,分類タスクの多くの例を示す。
我々は状態変化のダイナミクスについて報告し、それが突然であり、従来の学習ネットワークですでに観察されている現象である1次相転移の特徴を持つことを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:32:08 GMT)
Finite-Sample Analysis of the Monte Carlo Exploring Starts Algorithm for Reinforcement Learning [0.0] 政策アルゴリズムの収束率に関する新しい結果を示す。
このアルゴリズムは、$tildeO(SAK3log3frac1delta)$ sampled episodesの後に最適なポリシーを返す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:11:29 GMT)
Fighting Exponentially Small Gaps by Counterdiabatic Driving [0.0] 一階量子相転移による断熱流の加速における近似的反断熱駆動(CD)の効率について検討する。
本研究は,NP-hard Ising問題の特徴である極めて小さなギャップを越える場合,ローカルCD戦略が有効性に制限されていることを示す。
この制限に対処するために、量子ブラキストロン反断熱駆動(QBCD)と呼ばれる別の方法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:28:36 GMT)
FedScalar: A Communication efficient Federated Learning [0.0] フェデレーテッド・ラーニング(FL)は分散機械学習でかなりの人気を集めている。
emphFedScalarは、エージェントが単一のスカラーを使用して更新を通信することを可能にする。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:06:49 GMT)
Fast-forward scaling theory for quantum dynamics on curved space-time [0.0] 重力が重要な役割を果たす曲線時空上で量子力学のスケーリング特性を示す。
速度制御力学を実現するシステムパラメーターを導出する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:13:35 GMT)
Extra cost of erasure due to quantum lifetime broadening [0.0] 少量の情報を消去するエネルギーコストは、Landauerによって、その環境の温度に関して、基本的に低く抑えられた:$Wgeq k_mathrmB T ln 2$。
実際の電子機器では、インフォメーション・ベアリング・システムは2つ以上の電極と接触し、温度と化学的ポテンシャルが異なる。
このタイプのデバイスを熱力学的に記述し、電極温度に加えて、量子ドット間の電位差とエネルギーレベルの寿命拡大が、消去の最小作業コストに寄与することを発見した。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:52:55 GMT)
Expected Maximin Fairness in Max-Cut and other Combinatorial Optimization Problems [0.0] 最適マクシミン・フェア解は、非マクシミン・フェア最適解によって有界であることを示す。
本稿では、Max-Cutの特別事例を用いて、最大公正性の定義と実装の課題を実証する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 15:32:04 GMT)
Examining Language Modeling Assumptions Using an Annotated Literary Dialect Corpus [0.0] 19世紀のアメリカの文学的変種トークンのデータセットを,人間の注釈付き方言群タグの新たな層で提示する。
意図的な正書法変化によって生じる「方言効果」が複数の言語チャネルを取り入れていることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:58:21 GMT)
Ensemble data assimilation to diagnose AI-based weather prediction model: A case with ClimaX version 0.3.1 [0.0] 本研究では,AIに基づく天気予報モデルの診断にアンサンブルデータ同化を用いた手法を提案する。
AIベースのモデルであるClimaXを用いた実験では、AIベースの天気予報モデルに対して、アンサンブルデータ同化が安定して周期化されることが実証された。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:30:18 GMT)
Enhanced Automated Code Vulnerability Repair using Large Language Models [0.0] この研究は、コードの脆弱性を自動修復する複雑な課題に対処する。
LLM(Advanced Large Language Models)を使用して、コード修正を表現する新しいフォーマットを導入する。
Cコードの脆弱性を特徴とするデータセットを微調整したLLMは、自動コード修復技術の正確性と適応性を大幅に向上した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:15:24 GMT)
Encoding arbitrary Ising Hamiltonians on Spatial Photonic Ising Machines [0.0] 本研究では,完全な相互作用行列を直接制御できるSPIMインスタンスを導入,実験的に検証する。
実験によって測定されたIsingエネルギーと理論的な期待値との整合性を実証し、未重み付きグラフ問題と重み付きグラフ問題の両方を解決する。
本手法は,システム固有の利点を犠牲にすることなく,実世界のアプリケーションに適用可能なSPIMを大幅に拡張する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:14:15 GMT)
Efficient Second-Order Neural Network Optimization via Adaptive Trust Region Methods [0.0] SecondOrderAdaptive (SOAA) は、従来の二階法の限界を克服するために設計された新しい最適化アルゴリズムである。
私たちは、SOAAが1次近似よりも速く、より安定した収束を達成することを実証的に実証します。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:23:06 GMT)
Effective dynamics of qubit networks via phase-covariant quantum ensembles [0.0] 閉量子系の個々のスピンに付随する位相共変写像のアンサンブルを生成する。
構築手順は、オープンシステム力学のランダムな族を実現する新しい方法を提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:15:38 GMT)
EUFCC-CIR: a Composed Image Retrieval Dataset for GLAM Collections [0.0] EUFCC-CIRは、ギャラリー、図書館、アーカイブ、博物館(GLAM)コレクション内のコンポジションイメージ検索(CIR)のために設計されたデータセットである。
我々のデータセットは、EUFCC-340Kイメージラベルデータセットの上に構築されており、180K以上の注釈付きCIRトリプルを含んでいる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:57:59 GMT)
EUFCC-CIR: a Composed Image Retrieval Dataset for GLAM Collections [0.0] EUFCC-CIRは、ギャラリー、図書館、アーカイブ、博物館(GLAM)コレクション内のコンポジションイメージ検索(CIR)のために設計されたデータセットである。
我々のデータセットは、EUFCC-340Kイメージラベルデータセットの上に構築されており、180K以上の注釈付きCIRトリプルを含んでいる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:57:59 GMT)
Duality between string and computational order in symmetry-enriched topological phases [0.0] 測定に基づく量子計算における一様パワーをもつ物質の位相位相の最初の例を示す。
異方性磁場中におけるトーリック符号の基底状態は,非計算的・普遍的なフレームワークの適用にもかかわらず,自然かつ自然なものであることを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:38:03 GMT)
Digital quantum simulation of cosmological particle creation with IBM quantum computers [0.0] 等質および等方的展開を行う時空において、最小結合の量子スカラー場からなる系を考える。
時間発展を具現化する量子回路を考案することにより、与えられた場の運動量に対して正と負の2つの振動モードをシミュレートする。
我々は、回路をシミュレートし、IBM量子コンピュータに実際に実験的に実装することで、宇宙が所定の速度で膨張した後に生成された粒子の数を調査する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:56:07 GMT)
Density based Spatial Clustering of Lines via Probabilistic Generation of Neighbourhood [0.0] 本稿では,固定ボリュームの行に対して,カスタマイズされた近傍領域を生成するクラスタリングアルゴリズムを設計する。
このアルゴリズムは外れ値に敏感ではなく、濃度パラメータを用いてデータのノイズを効果的に識別することができる。
このアルゴリズムの重要な応用の1つは、データポイントを不足したエントリを持つ$mathbbRn$にクラスタリングすることである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:17:11 GMT)
Deconstructing Recurrence, Attention, and Gating: Investigating the transferability of Transformers and Gated Recurrent Neural Networks in forecasting of dynamical systems [0.0] 我々は、RNNにおけるゲーティングと再発、トランスフォーマーにおける注意機構など、最も強力なニューラルネットワークアーキテクチャの主要なアーキテクチャコンポーネントを分解する。
重要な発見は、ニューラルゲーティングとアテンションは、ほとんどのタスクにおいて標準RNNの正確性を改善する一方で、トランスフォーマーにおける再発の概念の追加は有害である。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:41:51 GMT)
Decoherence of surface phonons in a quantum acoustic system [0.0] 超伝導トランスモン量子ビットに強く結合した表面音響波(SAW)共振器に閉じ込められたフォノンのデコヒーレンスについて検討した。
表面の音速エネルギー減衰速度は$kappa_1/2pi=480$kHz、純粋に$kappa_phi/2pi=180$kHzである。
本稿では,SAW系量子音響デバイスにおけるデコヒーレンスの発生源と今後の量子音響散逸技術実験への応用について論じる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 21:28:48 GMT)
Custom Non-Linear Model Predictive Control for Obstacle Avoidance in Indoor and Outdoor Environments [0.0] 本稿では,DJI行列100のための非線形モデル予測制御(NMPC)フレームワークを提案する。
このフレームワークは様々なトラジェクトリタイプをサポートし、厳密な操作の精度を制御するためにペナルティベースのコスト関数を採用している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:50:19 GMT)
Counterdiabatic Driving for Periodically Driven Systems [0.0] 周期的に駆動されるシステムは、量子システムの特性を設計するのに有用な技術として登場した。
我々は、非摂動光子共鳴を捕捉し、高忠実度プロトコルを得る技術を開発した。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 18:02:47 GMT)
Convergence Guarantees for Neural Network-Based Hamilton-Jacobi Reachability [0.0] 本稿では,ハミルトン・ヤコビ・イザック方程式の解法であるDeepReachについて一様収束を保証する。
我々は,DeepReachアルゴリズムが,アルゴリズムの損失関数が0に収束すると,得られるニューラルネットワーク近似はHJI方程式の古典解に一様に収束することを示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 18:51:45 GMT)
Conventional Quantum Theory Does Not Support A Coherent Relational Account [0.0] 従来の定式化における量子理論は、様々な測定関連パラドックスの対象となることが知られている。
測定結果に関する矛盾が観察者の間で明らかになる。
量子論の様々な定式化における生存可能性に関する議論の含意について論じる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 05:13:04 GMT)
Consistency for Large Neural Networks [0.0] ニューラルネットワークの平均積分正方形誤差(MISE)が、あるモデルサイズ閾値の後に、$L1$または$L2$のペナルティを持つことが証明された。
これらの結果は、従来の統計モデリングフレームワークに挑戦し、ニューラルネットワークの二重降下現象に関する最近の知見を広げるものである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:43:02 GMT)
Condensation phenomena of ions in an electrostatic logarithmic trap [0.0] 軸方向陰極付近の放射局在状態におけるイオンの崩壊は、非変性から強い変性への急激な遷移を引き起こすことが示されている。
この遷移は実際にボソンとフェルミオンの両方を巻き込み、ボース=アインシュタイン凝縮(BEC)と混同されることはない。
これは、イオン-イオン交換相互作用が軸陰極に沿った運動エネルギーを増加させ、フェルミ準位と非退化しきい値温度が増加するためである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:54:07 GMT)
Condensation phenomena of ions in an electrostatic logarithmic trap [0.0] 軸方向陰極付近の放射局在状態におけるイオンの崩壊は、非変性から強い変性への急激な遷移を引き起こすことが示されている。
この遷移は実際にボソンとフェルミオンの両方を巻き込み、ボース=アインシュタイン凝縮(BEC)と混同されることはない。
これは、イオン-イオン交換相互作用が軸陰極に沿った運動エネルギーを増加させ、フェルミ準位と非退化しきい値温度が増加するためである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:54:07 GMT)
Competing automorphisms and disordered Floquet codes [0.0] フロッケ符号は量子誤り訂正のための動的スキームを提供する。
論理情報の進化と喪失が自己同型の遷移とどのように結びついているかを示す。
また、両者の相違点も示している。
FETは、結合パーコレーションによって記述された臨界性を示す。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 11:19:02 GMT)
Collaborative learning of common latent representations in routinely collected multivariate ICU physiological signals [0.0] 本アルゴリズムは,Long Short-Term Memory (LSTM) ネットワークと協調フィルタリングの概念を統合し,患者間で共通する生理的状態を同定する。
脳損傷者における脳内高血圧(IH)検出のための実世界ICU臨床データを用いて,AUCが0.889,APが0.725であった。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 17:18:53 GMT)
Coal Mining Question Answering with LLMs [0.0] 石炭採掘は複雑でリスクの高い産業であり、正確で状況に応じた情報が安全かつ効率的な運用に不可欠である。
現在のQAシステムは、マイニング関連クエリの技術的および動的性質を扱うのに苦労している。
GPT-4 などの LLM を導出する多ターンプロンプトエンジニアリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 20:02:11 GMT)
Beyond principlism: Practical strategies for ethical AI use in research practices [0.0] 科学研究における生成的人工知能の急速な採用は、倫理的ガイドラインの開発を上回っている。
既存のアプローチは、科学研究の実践においてAIの倫理的課題に取り組むための実践的なガイダンスをほとんど提供しない。
抽象的な原則と日々の研究実践のギャップを埋めるために,ユーザ中心の現実主義に触発されたアプローチを提案する。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 16:13:55 GMT)
Atoms near a conducting wedge: decay rates and entanglement around a corner [0.0] この研究は、鋭い角の存在によって、崩壊の風景をどのように変えられるかを探る。
単一原子の自発崩壊の修正と、角付近で絡み合った原子対の挙動の2つのシナリオについて検討する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 10:00:29 GMT)
Are ELECTRA's Sentence Embeddings Beyond Repair? The Case of Semantic Textual Similarity [0.0] ELECTRAは、コスト効率のよい事前学習目標および下流タスク性能の改善を提供するが、より悪い文埋め込みを提供する。
そこで本研究では,新しいTMFT法を用いて埋め込みを修復する手法を提案する。
分析をさまざまなモデルサイズ、言語、その他の2つのタスクに拡張します。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:28:17 GMT)
Approximate Degrees of Multisymmetric Properties with Application to Quantum Claw Detection [0.0] この問題の最適量子複雑性は$Omegaleft(sqrtG+(FG)1/6M1/6right)$ for input function $fcolon [F] to Z$ and $gcolon [G] to Z$であることが知られている。
現在の論文は、下界が$|Z|=Omega(FG)$のすべての小さな範囲$Z$に対してさえも成り立つことを証明している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 06:32:34 GMT)
Alignment of Cybersecurity Incident Prioritisation with Incident Response Management Maturity Capabilities [0.0] 本稿では,高リスク事象の優先順位付けにIR CMMsアセスメントの活用の可能性について検討する。
その結果,不適切な訓練やコミュニケーション不足など,インシデント応答に共通する弱点が明らかになった。
この分析はまた、インシデント対応能力を高める上での組織文化の重要性を強調している。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 07:05:47 GMT)
Algorithms For Automatic Accentuation And Transcription Of Russian Texts In Speech Recognition Systems [0.0] 本稿では,ロシア語テキストの自動アクセント化と音韻転写のためのルールベースシステムの概要について述べる。
開発したシステムの2つの部分、アクセントと文字起こしは、入力句の正しい音韻表現を実現するために異なるアプローチを用いている。
開発ツールキットはPython言語で書かれており、興味のある研究者はGitHubからアクセスできる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:43:43 GMT)
AiBAT: Artificial Intelligence/Instructions for Build, Assembly, and Test [0.0] AiBATは、IBAT(Instructions for Build, Assembly, and Test)の著者を支援する新しいシステムである。
まず、アセンブリードローイング文書を分析し、情報を抽出し解析し、それから抽出された情報でIBATテンプレートを埋める。
本稿では,AiBATシステムの概要について述べる。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 19:57:05 GMT)
Absolutely continuous spectrum for truncated topological insulators [0.0] 位相絶縁体が2つの十分に大きな領域で平面を分離する曲線に沿って切り離された場合、エッジ系は絶対連続スペクトルを許容する。
我々のアプローチは、幾何学と本質的なコンダクタンスを分離する曲線に沿ったバルクエッジ対応の最近のバージョンを組み合わせたものである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 02:39:57 GMT)
A novel neural network-based approach to derive a geomagnetic baseline for robust characterization of geomagnetic indices at mid-latitude [0.0] 地磁気測定から得られた地磁気指標は、太陽と地球との相互作用の強度を特徴付ける。
次世代の地磁気指標を導出するためには、太陽による摂動を伴わない静かな活動レベルを定義する「地磁気ベースライン」を確立することが望ましい。
本稿では,フランス・シャンボン・ラ・フォレ(Chambon-la-Foret)のデータに着目し,時間依存性の静かな変化を表すベースラインを導出する手法を提案する。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 08:51:26 GMT)
A Schema-aware Logic Reformulation for Graph Reachability [0.0] 本稿では,インスタンスの高レベルな概念化を活用することで,グラフパスを自動的に排除・ソートする戦略を提案する。
目的は、時間、空間要求、バックトラック数の観点から従来のアルゴリズムを改善することができるグラフ到達可能性シナリオの新しい一階述語論理の再構成を得ることである。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 14:39:49 GMT)
A Photonic Parameter-shift Rule: Enabling Gradient Computation for Photonic Quantum Computers [0.0] 線形光量子コンピューティングプラットフォーム上に実装された量子計算アルゴリズムにおける勾配計算法を提案する。
提案手法は入力光子数と線形にスケールし,パラメータをシフトした同じパラメータ化フォトニック回路を用いて評価を行う。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 17:47:38 GMT)
A Methodological Report on Anomaly Detection on Dynamic Knowledge Graphs [0.0] 動的知識グラフの異常検出に対する様々なアプローチについて検討する。
ISWC 2024 Dynamic Knowledge Graph Anomaly Detection データセットのベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 16:10:43 GMT)
A General Framework of the Consistency for Large Neural Networks [0.0] ニューラルネットワークの平均積分正方形誤差(MISE)を研究するための一般化正規化フレームワークを提案する。
筆者らのフレームワークから,MISE曲線は2つの可能な形状,すなわち2重降下形と単調下降形であることがわかった。
論文参考訳(メタデータ) (Thu, 3 Oct 2024 03:43:02 GMT)
A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions [0.0] RAGは、検索機構と生成言語モデルを組み合わせることで、出力の精度を高める。
近年の研究では, 検索効率向上のための新しい手法が注目されている。
RAGモデルの堅牢性向上に焦点をあてた今後の研究方向性が提案されている。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 22:29:47 GMT)
"Efficient Complexity": a Constrained Optimization Approach to the Evolution of Natural Intelligence [0.0] 情報理論、生物物理学、バイオインフォマティクス、熱力学の結合における根本的な疑問は、外部刺激に関する情報が事前に入手できない自然環境における自然知性の発達を導く原理とプロセスに関するものである。
制約付き最適化の枠組みでは,自然学習の情報プロセスの記述に新たなアプローチが提案されている。
構造の複雑さ、可変性、効率性、あるいは提案された形式主義に基づく学習モデルのアーキテクチャの関係に関する非自明な結論は、ニューラルネットワークを生物学的および人工知能における小さな知能ユニットの協調グループとしての有効性を説明することができる。
論文参考訳(メタデータ) (Thu, 03 Oct 2024 11:54:33 GMT)