Gemini: A Family of Highly Capable Multimodal Models [629.1] マルチモーダルモデルの新たなファミリーであるGeminiは、画像、オーディオ、ビデオ、テキスト理解にまたがる優れた機能を示している。
GeminiファミリーはUltra、Pro、Nanoサイズで構成されており、複雑な推論タスクからオンデバイスメモリ制約のユースケースまで幅広い用途に適している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:05:29 GMT)
DataComp-LM: In search of the next generation of training sets for language models [193.3] DataComp for Language Models (DCLM)は、制御されたデータセット実験のためのテストベッドであり、言語モデルを改善することを目的としている。
我々は、Common Crawlから抽出された240Tトークンの標準化コーパス、OpenLMフレームワークに基づく効果的な事前学習レシピ、53の下流評価スイートを提供する。
DCLMベンチマークの参加者は、412Mから7Bパラメータのモデルスケールでの重複、フィルタリング、データ混合などのデータキュレーション戦略を実験することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:42:57 GMT)
V3Det Challenge 2024 on Vast Vocabulary and Open Vocabulary Object Detection: Methods and Results [142.6] V3Det Challenge 2024は、オブジェクト検出研究の境界を推し進めることを目的としている。
Vast Vocabulary Object DetectionとOpen Vocabulary Object Detectionの2つのトラックで構成されている。
我々は,広い語彙とオープン語彙のオブジェクト検出において,今後の研究の方向性を刺激することを目指している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:58:51 GMT)
Do Language Models Exhibit the Same Cognitive Biases in Problem Solving as Human Learners? [141.0] 本研究では,大言語モデル(LLM)の偏りを,算術語問題を解く際に,子どもに知られているものと関連づけて検討する。
我々は,これらの各テストに対して,問題特徴のきめ細かい制御を可能にするニューロシンボリックアプローチを用いて,新しい単語問題を生成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:08:05 GMT)
VALL-E 2: Neural Codec Language Models are Human Parity Zero-Shot Text to Speech Synthesizers [119.9] 本稿では,ゼロショット音声合成(TTS)の節目となる,ニューラルネットワークモデルの最新の進歩であるVALL-E 2を紹介する。
VALL-E 2は、その複雑さや反復句によって伝統的に困難な文であっても、高品質な音声を一貫して合成する。
この研究の利点は、失語症のある人や筋萎縮性側索硬化症を持つ人のためのスピーチを生成するなど、貴重な努力に寄与する可能性がある。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:39:08 GMT)
Hydra-MDP: End-to-end Multimodal Planning with Multi-target Hydra-Distillation [115.6] 教師-学生モデルに複数の教師を取り入れた新しいパラダイムであるHydra-MDPを提案する。
ルールベースの教師の知識により、Hydra-MDPは環境がプランニングにエンド・ツー・エンドでどのように影響するかを学ぶ。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:07:57 GMT)
Small Agent Can Also Rock! Empowering Small Language Models as Hallucination Detector [114.9] 幻覚検出は大規模言語モデル(LLM)にとって難しい課題である
本稿では,HluAgentと呼ばれる自律型LLMエージェントフレームワークを提案する。
HaluAgentでは、LLM、多機能ツールボックスを統合し、きめ細かい3段階検出フレームワークを設計する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:30:05 GMT)
MINT-1T: Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset with One Trillion Tokens [114.0] MINT-1Tは最も広く多様なオープンソースMultimodal INTerleavedデータセットです。
MINT-1Tは1兆のテキストトークンと30億の画像で構成されており、既存のオープンソースデータセットの10倍のスケールアップである。
実験の結果,MINT-1TでトレーニングしたLMMは,以前の先行データセット OBELICS でトレーニングしたモデルの性能に匹敵することがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:21:36 GMT)
A Survey of Label-Efficient Deep Learning for 3D Point Clouds [109.1] 本稿では,点雲のラベル効率学習に関する包括的調査を行う。
本稿では,ラベルの種類によって提供されるデータ前提条件に基づいて,ラベル効率のよい学習手法を整理する分類法を提案する。
それぞれのアプローチについて、問題設定の概要と、関連する進展と課題を示す広範な文献レビューを提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:11:14 GMT)
SGCNeRF: Few-Shot Neural Rendering via Sparse Geometric Consistency Guidance [106.0] FreeNeRFは暗黙の幾何正規化を統合することでこの制限を克服しようとする。
新しい研究は、新しい特徴マッチングに基づくスパース幾何正規化モジュールを導入する。
モジュールは、高周波キーポイントをピンポイントすることで、詳細の完全性を保護する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:16:38 GMT)
Improving Large Language Models via Fine-grained Reinforcement Learning with Minimum Editing Constraint [104.5] 強化学習(RL)は、大規模言語モデル(LLM)の訓練に広く用いられている。
本稿では,報酬モデルとして生成モデルを組み込んだRL法 RLMEC を提案する。
生成報酬モデルに基づいて、トレーニングのためのトークンレベルRL目標と、RLプロセスの安定化のための模倣ベース正規化を設計する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:52:06 GMT)
Towards Bidirectional Human-AI Alignment: A Systematic Review for Clarifications, Framework, and Future Directions [101.7] 近年のAIの進歩は、AIシステムを意図された目標、倫理的原則、個人とグループの価値に向けて導くことの重要性を強調している。
人間のAIアライメントの明確な定義とスコープの欠如は、このアライメントを達成するための研究領域間の共同作業を妨げる、大きな障害となる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:58:35 GMT)
Auto-ICL: In-Context Learning without Human Supervision [93.1] 本稿では,モデルが問題解決のための例と指示を自律的に生成できる自動文脈学習フレームワークを提案する。
さまざまなモデルやデータセットにわたる実験により、結果は、モデル生成コンテキストが人間の注釈付きコンテキストより優れていることを示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:53:41 GMT)
Language Modeling with Editable External Knowledge [90.8] 本稿では,新たな文書取得時のモデル動作を改善するERASEを提案する。
ドキュメントを追加するたびに、知識ベースで他のエントリを段階的に削除または書き直します。
7-13%(Mixtral-8x7B)と6-10%(Llama-3-8B)の精度を向上する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:35 GMT)
Frozen CLIP: A Strong Backbone for Weakly Supervised Semantic Segmentation [90.4] 弱教師付きセマンティックセグメンテーションのためのCLIPベースのシングルステージパイプラインであるWeCLIPを提案する。
具体的には、凍結したCLIPモデルを意味的特徴抽出のバックボーンとして適用する。
新しいデコーダは、最終予測のために抽出された意味的特徴を解釈するように設計されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:49:47 GMT)
Learning Iterative Reasoning through Energy Diffusion [90.2] 我々は,エネルギー拡散による反復的推論(IRED)を紹介した。
IREDは入力条件と所望の出力の間の制約を表現するためにエネルギー関数を学ぶ。
IREDは、連続空間推論、離散空間推論、計画タスクにおいて既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:36:47 GMT)
Just How Flexible are Neural Networks in Practice? [89.8] ニューラルネットワークは、パラメータを持つ少なくとも多くのサンプルを含むトレーニングセットに適合できると広く信じられている。
しかし実際には、勾配や正規化子など、柔軟性を制限したトレーニング手順によるソリューションしか見つからない。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:24:45 GMT)
Nemotron-4 340B Technical Report [89.1] 我々はNemotron-4-340B-Base、Nemotron-4-340B-Instruct、Nemotron-4-340B-Rewardを含むNemotron-4 340Bモデルファミリーをリリースする。
私たちのモデルはNVIDIA Open Model License Agreementの下でオープンアクセスです。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:25:04 GMT)
ROSE Doesn't Do That: Boosting the Safety of Instruction-Tuned Large Language Models with Reverse Prompt Contrastive Decoding [89.0] 本稿では,既存の命令調整LDMの安全性を高めるための簡易な手法であるROSE(Reverse prompt contrastive decoding)を提案する。
6つの安全性と2つの汎用タスクの実験から、ROSEは5種類の命令調整LDMに対して、一貫した、重要な安全性向上(+13.8%の安全性スコア)をもたらすだけでなく、LLMの汎用能力にも恩恵をもたらすことが示されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:48:21 GMT)
Revisiting Knowledge Distillation for Autoregressive Language Models [88.8] 知識蒸留(KD)を改善するための簡易かつ効果的な適応型教育法(ATKD)を提案する。
ATKDの中核は、ロート学習を減らし、教育をより多様で柔軟なものにすることだ。
8つのLMタスクの実験は、ATKDの助けを借りて、様々なベースラインのKD手法が一貫した、重要なパフォーマンス向上を達成することを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:44:28 GMT)
AnyTrans: Translate AnyText in the Image with Large Scale Models [88.6] 本稿では、画像中のタスク翻訳AnyText(TATI)のためのオール・エンコンパス・フレームワークであるAnyTransを紹介する。
我々のフレームワークは、翻訳中にテキスト要素と視覚要素の両方から文脈的手がかりを取り入れている。
6つの言語対の多言語テキスト画像翻訳データからなるMTIT6というテストデータセットを精巧にコンパイルした。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:37:48 GMT)
AvaTaR: Optimizing LLM Agents for Tool-Assisted Knowledge Retrieval [88.4] 大言語モデル(LLM)エージェントは、外部のツールや知識を活用して精度を高め、幻覚を減らすという印象的な能力を示した。
本稿では、LLMエージェントを最適化して提供するツールを効果的に利用し、与えられたタスク/ドメインの性能を向上させる新しいフレームワークであるAvaTaRを紹介する。
AvaTaRは、4つの課題にまたがる最先端のアプローチを一貫して上回り、新規事例に適用した場合に強力な一般化能力を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:20:02 GMT)
MMDU: A Multi-Turn Multi-Image Dialog Understanding Benchmark and Instruction-Tuning Dataset for LVLMs [88.3] 本稿では,包括的なベンチマークであるMMDUと,大規模命令チューニングデータセットであるMMDU-45kを紹介する。
MMDUは最大18k画像+テキストトークン、20イメージ、27ターンを備えており、これは以前のベンチマークの少なくとも5倍長くなる。
MMDU-45k上のフネ調整型オープンソースLVLMは、このギャップに適応し、より長く正確な会話を生成することを実証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:47 GMT)
HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model [88.1] Hyper SIGMAは、HSI解釈のためのビジョントランスフォーマーベースの基礎モデルである。
特別に設計されたスペクトル拡張モジュールを使用して、空間的特徴とスペクトル的特徴を統合する。
スケーラビリティ、堅牢性、クロスモーダル転送能力、実世界の適用性において大きなメリットがある。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:22:58 GMT)
Knowledge-to-Jailbreak: One Knowledge Point Worth One Attack [86.7] Knowledge-to-jailbreakは、ドメイン知識からジェイルブレイクを生成し、特定のドメイン上での大規模言語モデルの安全性を評価することを目的としている。
12,974組の知識ジェイルブレイクペアを持つ大規模データセットを収集し、ジェイルブレイクジェネレータとして大規模言語モデルを微調整する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:59:59 GMT)
Mitigating Bias for Question Answering Models by Tracking Bias Influence [84.7] 本稿では,複数選択QAモデルのバイアスを軽減するためのBMBIを提案する。
バイアスのある例から学んだ場合、モデルがよりバイアスに傾くように傾くという直感に基づいて、クエリインスタンスのバイアスレベルを測定します。
本手法は,複数のバイアスカテゴリにまたがる複数のQA定式化に適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:06:24 GMT)
Zero-Shot Generalization during Instruction Tuning: Insights from Similarity and Granularity [84.1] 命令チューニング中のゼロショット一般化は非常に早い時期に行われることを示す。
また、「タスク」の制約を伴わずに、命令チューニング中に非常によく似た、きめ細かなトレーニングデータに遭遇することで、より一般化できることを示す。
インストラクションチューニング中のゼロショット一般化は、インスタンスレベルでのトレーニングとテストデータ間の類似性に基づく一般化の形式であることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:40:21 GMT)
Towards Global Optimality for Practical Average Reward Reinforcement Learning without Mixing Time Oracles [83.9] Multi-level Actor-Critic (MAC) フレームワークには、MLMC (Multi-level Monte-Carlo) 推定器が組み込まれている。
MACは、平均報酬設定において、既存の最先端ポリシーグラデーションベースの手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:47:32 GMT)
Diffusion Models in Low-Level Vision: A Survey [82.8] 拡散モデルに基づくソリューションは、優れた品質と多様性のサンプルを作成する能力で広く称賛されている。
本稿では,3つの一般化拡散モデリングフレームワークを提案し,それらと他の深層生成モデルとの相関関係について検討する。
医療、リモートセンシング、ビデオシナリオなど、他のタスクに適用された拡張拡散モデルについて要約する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:49:27 GMT)
Iterative or Innovative? A Problem-Oriented Perspective for Code Optimization [81.9] 大規模言語モデル(LLM)は、幅広いプログラミングタスクを解く上で強力な能力を示している。
本稿では,パフォーマンス向上に着目したコード最適化について検討する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:10:10 GMT)
A Survey on Human Preference Learning for Large Language Models [81.4] 近年の多目的大言語モデル(LLM)の急激な増加は、より有能な基礎モデルと人間の意図を優先学習によって整合させることに大きく依存している。
本調査では、選好フィードバックのソースとフォーマット、選好信号のモデリングと使用、および、整列 LLM の評価について述べる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:52:51 GMT)
Holistic-Motion2D: Scalable Whole-body Human Motion Generation in 2D Space [79.0] 2次元体全体の動き生成のための総合的かつ大規模ベンチマークであるtextbfHolistic-Motion2D$を提示する。
また、下流アプリケーションにおける2Dモーションの有用性と3Dモーションへのリフトの可能性を強調した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:31:19 GMT)
See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding [78.9] 視覚言語モデル(VLM)は、多くの言語における画像に関するクエリに応答することができる。
我々は、画像理解における西洋の偏見を実証し、局所化する新しい研究を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:49:51 GMT)
SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Model [77.9] 本稿では,SPA-VL と呼ばれる視覚言語モデルのための安全優先アライメントデータセットを提案する。
幅の面では、SPA-VLは6つの有害ドメイン、13のカテゴリ、53のサブカテゴリをカバーし、クエスト、画像、選択された応答、拒否された応答)の4倍体の100,788のサンプルを含んでいる。
実験結果から,SPA-VLデータセット上のアライメント技術を用いてトレーニングしたモデルでは,コア機能を維持しながら,無害性と有用性を大幅に向上することが示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:57:37 GMT)
Retraining with Predicted Hard Labels Provably Increases Model Accuracy [77.7] リトレーニングは、与えられた(ノイズの多い)ラベルで最初にトレーニングすることで得られる人口の精度を向上させることができる。
予測ラベルが与えられたラベルにマッチするサンプルを選択的にリトレーニングすることで、余分なプライバシーコストでラベルDPトレーニングが大幅に改善されることを実証的に示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:53:47 GMT)
Long Code Arena: a Set of Benchmarks for Long-Context Code Models [75.7] Long Code Arenaは、プロジェクト全体のコンテキストを必要とするコード処理タスクのための6つのベンチマークスイートである。
これらのタスクは、ライブラリベースのコード生成、CIビルドの修復、プロジェクトレベルのコード補完、コミットメッセージ生成、バグローカライゼーション、モジュールの要約といった、コード処理のさまざまな側面をカバーする。
各タスクに対して、テスト用の手作業によるデータセット、評価スイート、オープンソースのベースラインソリューションを提供しています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:58:29 GMT)
GUICourse: From General Vision Language Models to Versatile GUI Agents [75.5] GUICourseは、ビジュアルベースのGUIエージェントをトレーニングするためのデータセットスイートです。
まず、OCRとVLMのグラウンド機能を強化するためにGUIEnvデータセットを導入する。
次にGUIActとGUIChatデータセットを導入し、GUIコンポーネントやインタラクションに関する知識を充実させます。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:30:55 GMT)
FamiCom: Further Demystifying Prompts for Language Models with Task-Agnostic Performance Estimation [73.5] 言語モデルは、コンテキスト内学習能力に優れています。
本稿では,タスク非依存のパフォーマンス推定のためのより包括的な尺度であるFamiComを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:14:55 GMT)
MADA: Meta-Adaptive Optimizers through hyper-gradient Descent [73.1] メタ適応(MADA)は、複数の既知の収束を一般化し、トレーニング中に最も適した収束を動的に学習できる統合フレームワークである。
私たちは、MADAを視覚や言語タスクに関する他の人気と経験的に比較し、MADAがAdamや他の人気を一貫して上回っていることに気付きました。
AVGradは最大演算子を平均演算子に置き換えたもので、高次最適化に適している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:52:24 GMT)
Task Me Anything [72.8] 本稿では,ユーザのニーズに合わせたベンチマークを作成する。
113Kイメージ、10Kビデオ、2Kの3Dオブジェクトアセット、365以上のオブジェクトカテゴリ、655の属性、335の関係がある。
750万のイメージ/ビデオ問合せペアを生成することが可能で、知覚能力の評価に重点を置いている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:32:42 GMT)
MergeNet: Knowledge Migration across Heterogeneous Models, Tasks, and Modalities [72.7] 異種モデルのパラメータ空間のギャップを埋めることを学ぶMergeNetを提案する。
MergeNetの中核となるメカニズムはパラメータアダプタにあり、ソースモデルの低ランクパラメータをクエリすることで動作する。
MergeNetは両方のモデルと共に学習され、我々のフレームワークは、現在のステージに関する知識を動的に転送し、適応することができます。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:50:26 GMT)
A Thorough Examination of Decoding Methods in the Era of LLMs [72.7] 復号法は、次世代の予測器から実用的なタスク解決器に言語モデルを変換する上で、必須の役割を果たす。
本稿では,大規模言語モデルの文脈における様々な復号法を包括的かつ多面的に分析する。
その結果,復号法の性能は特にタスク依存的であり,アライメント,モデルサイズ,量子化などの要因に影響されていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:34:05 GMT)
AnyMaker: Zero-shot General Object Customization via Decoupled Dual-Level ID Injection [72.4] 我々は,高ID忠実度とフレキシブルテキスト編集性を備えた汎用オブジェクトを生成するフレームワークであるAnyMakerを紹介する。
AnyMakerの有効性は、新しい一般ID抽出、二重レベルID注入、およびID認識デカップリングに起因している。
我々のアプローチを検証し、汎用オブジェクトのカスタマイズの研究を促進するため、我々は最初の大規模汎用IDデータセットを作成します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:26:22 GMT)
A Survey on RAG Meeting LLMs: Towards Retrieval-Augmented Large Language Models [71.3] 大規模言語モデル(LLM)は、言語理解と生成において革命的な能力を示している。
Retrieval-Augmented Generation (RAG)は、信頼性と最新の外部知識を提供する。
RA-LLMは、モデルの内部知識に頼るのではなく、外部および権威的な知識ベースを活用するために登場した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:56:38 GMT)
Composing Object Relations and Attributes for Image-Text Matching [70.5] この研究は、シーングラフを利用して、リレーショナルエッジで相互接続されたオブジェクトや属性のノードでキャプションを表現するデュアルエンコーダ画像テキストマッチングモデルを導入する。
本モデルは,オブジェクト属性とオブジェクトオブジェクトの意味関係を効率的に符号化し,ロバストかつ高速な性能システムを実現する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:56:01 GMT)
Two Stones Hit One Bird: Bilevel Positional Encoding for Better Length Extrapolation [69.7] そこで我々は,バイレベル位置符号化と呼ばれる新しい位置符号化法を開発した。
倫理的分析は、この位置情報の絡み合いが学習をより効果的にすることを示している。
私たちのBiPEは、多種多様なテキストモダリティにおいて、幅広いタスクにわたって、より優れた長さの補間機能を持っています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:18:13 GMT)
Leveraging VLM-Based Pipelines to Annotate 3D Objects [68.5] 本稿では,VLMの応答に影響を与える視点などの要因を疎外する代替アルゴリズムを提案する。
テキストのみの応答をマージする代わりに、VLMの合同画像テキストの可能性を利用する。
VLMベースのパイプラインを使って764Kデータセットから764Kオブジェクトの信頼性の高いアノテーションを生成する方法を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:27:19 GMT)
ClawMachine: Fetching Visual Tokens as An Entity for Referring and Grounding [67.6] プロキシエンコーディングやジオメトリエンコーディングを含む既存のメソッドには、オブジェクトの位置をエンコードするための追加構文が含まれている。
この研究はClawMachineを紹介し、視覚トークンを直接使用してエンティティに通知する新しい方法論を提供する。
ClawMachineはビジュアル参照とグラウンドを自動回帰形式に統合し、デコーダのみのアーキテクチャで学習する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:39:16 GMT)
InterControl: Zero-shot Human Interaction Generation by Controlling Every Joint [67.6] 関節間の所望距離を維持するために,新しい制御可能な運動生成手法であるInterControlを導入する。
そこで本研究では,既成の大規模言語モデルを用いて,ヒューマンインタラクションのための結合ペア間の距離を生成できることを実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:50:47 GMT)
Iterative Utility Judgment Framework via LLMs Inspired by Relevance in Philosophy [67.0] ユーティリティとトピック関連性は、情報検索において重要な手段である。
本稿では,リトリーバル拡張生成のサイクルの各ステップを促進させるために,反復的ユーティリティである JudgmEnt fraMework を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:52:42 GMT)
Embodied Instruction Following in Unknown Environments [66.6] 未知環境における複雑なタスクに対するEIF(Embodied instruction following)法を提案する。
我々は,ハイレベルなタスクプランナと低レベルな探索コントローラを含む,階層的な具体化命令に従うフレームワークを構築した。
タスクプランナに対しては、タスク完了プロセスと既知の視覚的手がかりに基づいて、人間の目標達成のための実行可能なステップバイステッププランを生成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:55:40 GMT)
Scaling Efficient Masked Autoencoder Learning on Large Remote Sensing Dataset [66.2] 本研究では,高効率なMIMトレーニングを実現するための大規模データセットである textbfRS-4M を紹介する。
本研究では,その意味的富度に基づいて選択されたパッチトークンのサブセットを動的にエンコードし,再構成する,効率的なMIM手法であるtextbfSelectiveMAEを提案する。
実験によると、SelectiveMAEはトレーニング効率を2.2-2.7倍に向上し、ベースラインMIMモデルの分類、検出、セグメンテーション性能を向上させる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:41:57 GMT)
DistillNeRF: Perceiving 3D Scenes from Single-Glance Images by Distilling Neural Fields and Foundation Model Features [65.9] DistillNeRFは、自動運転における3D環境を理解するための自己教師型学習フレームワークである。
スパースでシングルフレームのマルチビューカメラ入力からリッチなニューラルシーン表現を予測する。
RGB、奥行き、特徴画像を再構成するために、異なるレンダリングで自己教師される。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:15:13 GMT)
MOWA: Multiple-in-One Image Warping Model [65.7] 本研究で提案するマルチ・イン・ワン・イメージ・ワープ・モデル(MOWA)について述べる。
領域レベルと画素レベルでの動作推定を両立させることにより,マルチタスク学習の難しさを軽減する。
私たちの知る限り、これは1つのモデルで複数の実用的なワープタスクを解決する最初の作業です。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:57:39 GMT)
Infinigen Indoors: Photorealistic Indoor Scenes using Procedural Generation [64.0] Infinigen Indoorsは、フォトリアリスティックな屋内シーンのプロシージャジェネレータである。
それは、自然の風景に焦点を当てた既存のインフィニゲンシステムの上に構築されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:57:50 GMT)
Uncovering Challenges of Solving the Continuous Gromov-Wasserstein Problem [64.0] グロモフ=ワッサーシュタイン最適輸送(Gromov-Wasserstein Optimal Transport, GWOT)問題は、MLコミュニティの特別な関心を集めている。
既存の連続GWOTアプローチをさまざまなシナリオでクラッシュテストし、結果を注意深く記録し分析し、問題を特定します。
本稿では,離散的手法に依存しない新たな連続GWOT法を提案し,競合の問題を部分的に解決する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:10:00 GMT)
Federated Face Forgery Detection Learning with Personalized Representation [63.9] ディープジェネレータ技術は、区別がつかない高品質のフェイクビデオを制作し、深刻な社会的脅威をもたらす可能性がある。
従来の偽造検出手法は、データを直接集中的に訓練する。
本稿では,個人化表現を用いた新しいフェデレーション顔偽造検出学習を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:20:30 GMT)
DocGenome: An Open Large-scale Scientific Document Benchmark for Training and Testing Multi-modal Large Language Models [63.5] 我々は、arXivオープンアクセスコミュニティの153の分野から500Kの科学文書を注釈付けして構築した構造化文書ベンチマークDocGenomeを提案する。
我々はDocGenomeの利点を実証するために広範な実験を行い、我々のベンチマークで大規模モデルの性能を客観的に評価した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:13:52 GMT)
MLXP: A Framework for Conducting Replicable Experiments in Python [63.4] MLXPはPythonをベースとした,オープンソースの,シンプルで,軽量な実験管理ツールである。
実験プロセスを最小限のオーバーヘッドで合理化し、高いレベルの実践的オーバーヘッドを確保します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:16:16 GMT)
Thought Propagation: An Analogical Approach to Complex Reasoning with Large Language Models [63.0] 大規模言語モデルの複雑な推論能力を高めるために,textbftextitThought Propagation (TP)を提案する。
TP はまず LLM に対して,入力問題に関連する類似問題の集合を提案し,解決するよう促す。
TPは、類似問題の結果を再利用して、新しいソリューションを直接生成したり、スクラッチから得られた初期ソリューションを修正するための知識集約的な実行プランを導出する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:56:00 GMT)
FullCert: Deterministic End-to-End Certification for Training and Inference of Neural Networks [62.9] FullCertは、音質、決定論的境界を持つ最初のエンドツーエンドの認証装置であり、トレーニング時間と推論時間の両方に対する堅牢性を証明している。
理論的作業と新たなオープンソースライブラリであるBoundFlowを組み合わせることで,有界データセットのモデルトレーニングを可能にします。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:23:52 GMT)
Guarantees of confidentiality via Hammersley-Chapman-Robbins bounds [61.5] ノイズは最終分類器や他のタスク固有のレイヤの前に、最後のレイヤのアクティベーションに追加される。
入力の可能な全ての非バイアス推定器のばらつきを低くすることは、そのような付加ノイズから生じる機密性を定量化する。
数値実験により、HCR境界は小さなニューラルネットに対して有効である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:22:59 GMT)
Adversarial Perturbations Cannot Reliably Protect Artists From Generative AI [61.4] オンラインで公開されたアートワークに小さな敵対的摂動を取り入れた、スタイルの模倣に対する保護ツールがいくつか開発されている。
画像アップスケーリングのような低努力と「オフ・ザ・シェルフ」技術は、既存の保護を著しく劣化させる堅牢な模倣手法を作成するのに十分であることがわかった。
我々は,敵対的摂動に基づくツールが,生成AIの誤用からアーティストを確実に保護できないことを警告する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:51:45 GMT)
Aligning Large Language Models from Self-Reference AI Feedback with one General Principle [61.1] 13B Llama2-Chatで高品質なフィードバックを提供できる自己参照型AIフィードバックフレームワークを提案する。
具体的には、まずAIがユーザーの指示に反応し、それに基づいて他の回答に対する批判を参照として生成する。
最後に、批判に応じて、どの回答が人間の好みに合うかを判断する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:51:46 GMT)
Relational Learning in Pre-Trained Models: A Theory from Hypergraph Recovery Perspective [60.6] 我々は,関係学習をハイパーグラフリカバリとして形式化する数学的モデルを導入し,基礎モデル(FM)の事前学習について検討する。
我々のフレームワークでは、世界はハイパーグラフとして表現され、データはハイパーエッジからランダムなサンプルとして抽象化される。我々は、このハイパーグラフを復元するための事前学習モデル(PTM)の有効性を理論的に検証し、ミニマックスに近い最適スタイルでデータ効率を解析する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:20:39 GMT)
AbsInstruct: Eliciting Abstraction Ability from LLMs through Explanation Tuning with Plausibility Estimation [60.4] 抽象化能力は人間の知性において不可欠であり、NLP研究における様々なタスクにも有用である。
既存の研究によると、LLMは抽象能力に欠けており、その改善方法はまだ解明されていない。
本稿では,命令チューニングによるLLMの抽象化能力を向上するフレームワークAbsInstructを設計する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:39:02 GMT)
Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking [59.9] Job-SDFは、ジョブスキルの需要予測モデルをトレーニングし、ベンチマークするために設計されたデータセットである。
2021年から2023年にかけて、中国の大手オンライン求人プラットフォームから集められた1035万件の求人広告に基づいている。
本データセットは,職業,企業,地域レベルなど,さまざまな粒度でのスキル需要予測モデルの評価を可能にする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:22:51 GMT)
Adding Conditional Control to Diffusion Models with Reinforcement Learning [59.3] 拡散モデルは、生成されたサンプルの特性を正確に制御できる強力な生成モデルである。
本研究では、オフラインデータセットを活用した強化学習(RL)に基づく新しい制御手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:00:26 GMT)
Exploring Self-supervised Logic-enhanced Training for Large Language Models [59.2] 本稿では,自己指導型ポストトレーニングによる論理的知識の活用の可能性について検討する。
我々はMERItの自己回帰的目的変数を考案し、パラメータサイズが30億から13億の2つのLLM系列、すなわちFLAN-T5とLLaMAと統合する。
2つの挑戦的な論理的推論ベンチマークの結果は、LogicLLMの有効性を示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:23:56 GMT)
Not All Prompts Are Made Equal: Prompt-based Pruning of Text-to-Image Diffusion Models [59.2] 本稿では,テキスト・ツー・イメージ(T2I)拡散モデルのための新しいプロンプトベースのプルーニング手法であるAdaptive Prompt-Tailored Pruning (APTP)を紹介する。
APTPは入力テキストプロンプトに必要な容量を決定することを学び、それをアーキテクチャコードにルーティングする。
APTPはFID、CLIP、CMMDスコアの点でシングルモデルプルーニングベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:22:04 GMT)
Meta Reasoning for Large Language Models [58.9] 大規模言語モデル(LLM)の新規かつ効率的なシステムプロセッシング手法であるメタ推論プロンプト(MRP)を導入する。
MRPは、各タスクの特定の要求に基づいて異なる推論メソッドを動的に選択し、適用するようLLMに誘導する。
総合的なベンチマークによりMPPの有効性を評価する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:14:11 GMT)
White Men Lead, Black Women Help? Benchmarking Language Agency Social Biases in LLMs [58.3] 言語エージェンシーは、テキストにおける社会的偏見を評価する上で重要な側面である。
従来の研究はしばしば、エージェント語と共用語を識別する文字列マッチング技術に依存していた。
本稿では,言語庁バイアス評価ベンチマークを紹介する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:36:46 GMT)
Human Mesh Recovery from Arbitrary Multi-view Images [58.0] 任意の多視点画像からU-HMR(Unified Human Mesh Recovery)を分離・征服する枠組みを提案する。
特にU-HMRは、分離された構造と、カメラとボディーデカップリング(CBD)、カメラポーズ推定(CPE)、任意のビューフュージョン(AVF)の2つの主要コンポーネントから構成されている。
我々は、Human3.6M、MPI-INF-3DHP、TotalCaptureの3つの公開データセットについて広範な実験を行った。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:28:55 GMT)
Dual Degradation Representation for Joint Deraining and Low-Light Enhancement in the Dark [57.9] 暗闇の中での雨は、自律運転や監視システム、夜間写真など、現実世界のアプリケーションをデプロイする上で大きな課題となる。
既存の低照度化や除染法は、低照度を明るくし、同時に雨を取り除くのに苦労する。
L$2$RIRNetと呼ばれるエンド・ツー・エンドのモデルを導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:32:34 GMT)
Graspness Discovery in Clutters for Fast and Accurate Grasp Detection [57.8] グレープネス(graspness)とは、散らばった場面で把握可能な領域を区別する幾何学的手がかりに基づく品質である。
本研究では,探索過程を近似するカスケード把握モデルを構築した。
大規模なベンチマークであるGraspNet-1Billionの実験では,提案手法が従来の手法よりも大きなマージンで優れていたことが示されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:06:47 GMT)
Fine-grained Controllable Text Generation through In-context Learning with Feedback [57.4] 本稿では,依存度などの非自明な言語的特徴の特定の値に一致させるために,入力文を書き換える手法を提案する。
従来の研究とは対照的に、本手法は微調整ではなく文脈内学習を用いており、データが少ないユースケースに適用できる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:55:48 GMT)
Distributed Stochastic Gradient Descent with Staleness: A Stochastic Delay Differential Equation Based Framework [56.8] 分散勾配降下(SGD)は、計算リソースのスケーリング、トレーニング時間の短縮、マシンラーニングにおけるユーザのプライバシ保護の支援などにより、近年注目されている。
本稿では,遅延微分方程式(SDDE)と勾配到着の近似に基づく分散SGDの実行時間と安定化について述べる。
活性化作業員の増加は, 安定度による分散SGDを必ずしも加速させるものではないことが興味深い。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:56:55 GMT)
Skip-Layer Attention: Bridging Abstract and Detailed Dependencies in Transformers [56.3] 本稿では、Transformerモデルを強化するためのSLA(Skip-Layer Attention)を提案する。
SLAは、高レベルの抽象機能と低レベルの詳細の間の依存関係をキャプチャするモデルの能力を改善します。
我々の実装は、与えられたレイヤ内のクエリが、現在のレイヤと前のレイヤの両方のキーと値とやり取りできるようにすることで、Transformerの機能を拡張します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:24:38 GMT)
Supervised binary classification of small-scale digits images with a trapped-ion quantum processor [56.1] 量子プロセッサは、考慮された基本的な分類タスクを正しく解くことができることを示す。
量子プロセッサの能力が向上するにつれ、機械学習の有用なツールになり得る。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:20:51 GMT)
Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning [56.0] 本稿では,Large Language Models (LLMs) の推論能力向上を目的とした,反復的な選好学習プロセスによるアプローチを提案する。
我々は、MCTS(Monte Carlo Tree Search)を用いて好みデータを反復的に収集し、そのルックアヘッド機能を利用して、インスタンスレベルの報酬をよりきめ細かいステップレベルの信号に分解する。
提案アルゴリズムはDPO(Direct Preference Optimization)を用いて,新たに生成されたステップレベルの優先度データを用いてLCMポリシーを更新する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:11:49 GMT)
Transcendence: Generative Models Can Outperform The Experts That Train Them [55.9] 生成モデルがデータを生成する専門家の能力を超える能力を達成するとき、超越現象を研究する。
我々は,自動回帰変換器をトレーニングして,ゲームスクリプティングからチェスを学習し,トレーニングされたモデルが,データセットのすべてのプレイヤーよりも優れたパフォーマンスが得られることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:00:52 GMT)
VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs [55.8] VideoLLaMA 2は、ビデオおよびオーディオ指向タスクにおける時空間モデリングと音声理解を強化するために設計されたビデオ大言語モデル(Video Large Language Models, Video-LLMs)のセットである。
VideoLLaMA 2は、オープンソースモデル間の競争結果を一貫して達成し、いくつかのベンチマークでいくつかのプロプライエタリなモデルに近づいた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:40:43 GMT)
Pointer Networks with Q-Learning for Combinatorial Optimization [55.2] 我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:27:54 GMT)
A shortcut to an optimal quantum linear system solver [55.2] 複雑で解析困難な手法を用いない、概念的にシンプルな量子線形システム解法(QLSS)を提案する。
ソリューションノルム$lVertboldsymbolxrVert$が正確に知られているなら、私たちのQLSSはカーネルの1つのアプリケーションだけを必要とします。
あるいは、断熱経路追従法から概念を再導入することにより、標準推定に$O(kappa)$複雑さを実現できることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:54:11 GMT)
HiFT: A Hierarchical Full Parameter Fine-Tuning Strategy [55.2] 本稿では,各学習段階におけるパラメータのサブセットのみを更新する,新しい非独立なエンドツーエンドの階層的微調整戦略であるHiFTを提案する。
この結果から,HiFTはパラメータ効率の高いファインチューニングと標準のフルパラメータファインチューニングに匹敵する性能を達成できることが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:35:06 GMT)
Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning [55.1] 28,618粒の粗粒と4,487粒の細粒のアノテートサンプルを含むMERRデータセットを導入した。
このデータセットは、さまざまなシナリオから学習し、現実のアプリケーションに一般化することを可能にする。
本研究では,感情特異的エンコーダによる音声,視覚,テキスト入力をシームレスに統合するモデルであるEmotion-LLaMAを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:01:22 GMT)
TaxoLLaMA: WordNet-based Model for Solving Multiple Lexical Semantic Tasks [54.0] 本稿では,LLMがWordNetから語彙・意味的知識を抽出する能力について検討する。
4ビット量子化とLoRAにより軽量なオールインワンモデルであるTaxoLLaMAを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:43:10 GMT)
Query Performance Prediction using Relevance Judgments Generated by Large Language Models [54.0] 自動生成関連判定(QPP-GenRE)を用いたQPPフレームワークを提案する。
QPP-GenREは、QPPを独立したサブタスクに分解し、ランクリスト内の各項目の関連性を所定のクエリに予測する。
これにより、生成した関連判断を擬似ラベルとして利用して、任意のIR評価尺度を予測することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:23:20 GMT)
Extrinsic Evaluation of Cultural Competence in Large Language Models [53.6] 本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:03:27 GMT)
mDPO: Conditional Preference Optimization for Multimodal Large Language Models [52.6] 直接選好最適化(DPO)は,大規模言語モデル(LLM)のアライメントに有効な手法であることが示されている。
最近の研究は、DPOをマルチモーダルシナリオに適用しようと試みているが、一貫した改善を達成することは困難である。
画像の嗜好を最適化することで、言語のみの嗜好の過度な優先順位付けを防止するマルチモーダルDPOであるmDPOを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:58 GMT)
CItruS: Chunked Instruction-aware State Eviction for Long Sequence Modeling [52.4] 本稿では、下流タスクに有用な注意優先を隠蔽状態の消去プロセスに統合するモデリング手法であるChunked Instruction-Aware State Eviction (CItruS)を紹介する。
トレーニング不要な手法は,メモリ予算が同じ条件下で,複数の強いベースライン上での長いシーケンス理解および検索タスクにおいて,優れた性能を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:34:58 GMT)
ARTIST: Improving the Generation of Text-rich Images by Disentanglement [52.2] テキスト構造学習に焦点を当てたARTISTという新しいフレームワークを提案する。
我々は、事前訓練されたテキスト構造モデルからテキスト構造情報を同化できるように、視覚拡散モデルを微調整する。
MARIO-Evalベンチマークの実証結果は,提案手法の有効性を裏付けるものであり,様々な指標において最大15%の改善が見られた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:31:24 GMT)
The Decisive Power of Indecision: Low-Variance Risk-Limiting Audits and Election Contestation via Marginal Mark Recording [51.8] リスクリミット監査(リスクリミット監査、RLA)は、大規模な選挙の結果を検証する技術である。
我々は、効率を改善し、統計力の進歩を提供する監査の新たなファミリーを定めている。
新しい監査は、複数の可能なマーク解釈を宣言できるように、キャストボイトレコードの標準概念を再考することで実現される。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:04:22 GMT)
Dialogue Action Tokens: Steering Language Models in Goal-Directed Dialogue with a Multi-Turn Planner [51.8] 本稿では,対話行動トークンと呼ばれる言語モデルエージェントを用いて,目標指向の対話を計画する手法を提案する。
中心となる考え方は、各発話をアクションとして扱うことで、強化学習のような既存のアプローチを適用することができるゲームに対話を変換することである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:01:32 GMT)
A-SDM: Accelerating Stable Diffusion through Model Assembly and Feature Inheritance Strategies [51.8] 安定拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)生成のための一般的かつ効果的なモデルである。
本研究では、SDMにおける冗長計算の削減と、チューニング不要とチューニング不要の両方の手法によるモデルの最適化に焦点をあてる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:39:10 GMT)
R-Eval: A Unified Toolkit for Evaluating Domain Knowledge of Retrieval Augmented Large Language Models [51.5] 大規模言語モデルは一般的なNLPタスクにおいて顕著な成功を収めてきたが、ドメイン固有の問題には不足する可能性がある。
既存の評価ツールは、ドメイン知識の深さを掘り下げることなく、いくつかのベースラインを提供し、様々なドメインで評価するのみである。
本稿では、R-Evalツールキット(R-Evalツールキット)を導入し、異なるRAGの評価を合理化することによるALLMの評価の課題に対処する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:59:49 GMT)
Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level [50.9] また, iLR-DPOは, 冗長性を増大させることなく, GPT-4と同等の7Bモデルを実現できることを示した。
具体的には、我々の7Bモデルは、AlpacaEval 2.0で$texttGPT-4 Preview$に対して50.5%の利益率を達成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:55:38 GMT)
Watch Every Step! LLM Agent Learning via Iterative Step-Level Process Refinement [50.5] 反復的なステップレベルプロセスリファインメント(IPR)フレームワークは、エージェントトレーニングを強化するためのステップバイステップのガイダンスを提供する。
3つの複雑なエージェントタスクに関する我々の実験は、我々のフレームワークが様々な強力なベースラインより優れていることを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:29:13 GMT)
Syn-to-Real Unsupervised Domain Adaptation for Indoor 3D Object Detection [50.4] 室内3次元物体検出における非教師なし領域適応のための新しいフレームワークを提案する。
合成データセット3D-FRONTから実世界のデータセットScanNetV2とSUN RGB-Dへの適応結果は、ソースオンリーベースラインよりも9.7%、9.1%のmAP25が顕著に改善されていることを示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:18:41 GMT)
Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.4] 本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:43:53 GMT)
You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.4] 低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:43:01 GMT)
PhyBench: A Physical Commonsense Benchmark for Evaluating Text-to-Image Models [50.3] メカニクス,光学,熱力学,材料特性の4つのカテゴリに700のプロンプトを含む総合的なT2I評価データセットであるPhyBenchを紹介する。
プロプライエタリなモデルDALLE3やGeminiを含む6つの著名なT2Iモデルを評価し、物理原理をプロンプトに組み込むことで、物理的に正確な画像を生成する能力を向上させることを実証する。
以上の結果から,(1)光学以外の様々な物理的シナリオにおいて高度なモデルが頻繁に出現すること,(2) GPT-4oはアイテム固有のスコアリング命令とともに,物理コモンセンスに対するモデルの理解を効果的に評価すること,(3)現在のT2Iモデルであることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:49:01 GMT)
Enhancing Biomedical Knowledge Retrieval-Augmented Generation with Self-Rewarding Tree Search and Proximal Policy Optimization [50.3] 大規模言語モデル(LLM)は,検索増強世代(RAG)の進展に伴い,生物医学領域において大きな可能性を示した。
既存の検索強化アプローチは、様々なクエリやドキュメント、特に医療知識クエリに対処する上で、課題に直面している。
モンテカルロ木探索(MCTS)と自己回帰パラダイムに基づく自己回帰木探索(SeRTS)を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:48:31 GMT)
Towards Comprehensive Multimodal Perception: Introducing the Touch-Language-Vision Dataset [50.1] タッチに関するマルチモーダル研究は 視覚と触覚のモダリティに焦点を当てています
我々は,人機械のカスケード協調によるTLV (Touch-Language-Vision) というタッチ言語ビジョンデータセットを構築した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:19:26 GMT)
CrAM: Credibility-Aware Attention Modification in LLMs for Combating Misinformation in RAG [50.0] Retrieval-Augmented Generation (RAG)は、外部文書を参照することにより、LLM(Large Language Models)の幻覚を軽減することができる。
この問題に対処するために,我々は「クレディビリティ・アウェアRAG」の課題を探求する。
我々は$textbfCr$edibility-aware $textbfA$ttention $textbfM$odification (CrAM)というプラグイン・アンド・プレイ方式を導入する。
CrAMは、文書の信頼性に基づいて、影響力のある注意点を特定し、その注意点を調整することにより、低信頼度文書の影響を低減する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:01:12 GMT)
Edge Classification on Graphs: New Directions in Topological Imbalance [50.0] 異なるクラスにまたがるエッジの歪んだ分布から生じる新しいトポロジカル不均衡問題」を同定する。
本稿では,各エッジのトポロジ的不均衡を測定する新しいトポロジ的指標であるトポロジカルエントロピー(TE)を紹介する。
TEをベースとした(合成)エッジのトレーニングに重点を置くため、トポロジカルリウェイトリングとTEウェッジベースのMixupという2つの戦略を開発した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:02:36 GMT)
Self-MoE: Towards Compositional Large Language Models with Self-Specialized Experts [50.0] 本稿では,モノリシックLLMを,自己専門化の専門家による構成的,モジュール的なシステムに変換するアプローチであるSelf-MoEを紹介する。
提案手法は, 自己生成合成データを用いて, 専門家モジュールを構成する自己特殊化を利用する。
我々の発見は、モジュール化と、効率的でスケーラブルで適応可能なシステムを実現するための自己改善の可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:06:54 GMT)
Unfolding Time: Generative Modeling for Turbulent Flows in 4D [49.8] 本研究では,4次元生成拡散モデルと物理インフォームドガイダンスを導入し,現実的な流れ状態列の生成を可能にする。
提案手法は, 乱流多様体からのサブシーケンス全体のサンプリングに有効であることが示唆された。
この進展は、乱流の時間的進化を分析するために生成モデリングを適用するための扉を開く。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:21:01 GMT)
An Interactive Agent Foundation Model [49.8] 本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:50:02 GMT)
Personalized Federated Knowledge Graph Embedding with Client-Wise Relation Graph [49.7] クライアント関係グラフを用いた個人化フェデレーション知識グラフを提案する。
PFedEGは、近隣のクライアントから埋め込まれたエンティティを集約することで、各クライアントに対してパーソナライズされた補完知識を学習する。
我々は4つのベンチマークデータセットの広範な実験を行い、その手法を最先端モデルに対して評価する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:44:53 GMT)
Online Context Learning for Socially-compliant Navigation [49.6] 本文では,ロボットが新たな社会環境に適応できるようにするための,オンラインコンテキスト学習手法を紹介する。
コミュニティワイドシミュレータを用いた実験により,本手法は最先端のシミュレータよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:59:13 GMT)
Equivalence Classes of Quantum Error-Correcting Codes [49.4] 量子過程に影響を与える固有のノイズに対処するために、量子誤り訂正符号(QECC)が必要である。
我々は、テンソルネットワークからなるZXダイアグラムと呼ばれる形式でQECCを表す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:48:43 GMT)
Recent and Upcoming Developments in Randomized Numerical Linear Algebra for Machine Learning [49.1] RandNLA (Randomized Numerical Linear Algebra) は、ランダムネスを用いてユビキタス行列問題に対する改良アルゴリズムを開発する分野である。
この記事では、これらの開発状況を踏まえた自己完結したRandNLAの概要を紹介する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:30:55 GMT)
Learn Beyond The Answer: Training Language Models with Reflection for Mathematical Reasoning [48.9] 教師付き微調整により、様々な数学的推論タスクにおける言語モデルの問題解決能力が向上する。
本研究は,手前のトレーニング問題をより深く理解することを目的とした,新しい技術を紹介する。
本稿では,各トレーニングインスタンスに問題反映を埋め込む手法であるリフレクティブ拡張を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:42:22 GMT)
AV-CrossNet: an Audiovisual Complex Spectral Mapping Network for Speech Separation By Leveraging Narrow- and Cross-Band Modeling [48.2] 本稿では,音声強調,ターゲット話者抽出,複数話者分離のためのglsavシステムであるAV-CrossNetを紹介する。
AV-CrossNetは、最近提案された音声分離のための複雑なスペクトルマッピングを行うネットワークであるCrossNetアーキテクチャから拡張されている。
AV-CrossNetは、トレーニングされていないデータセットやミスマッチしたデータセットであっても、すべてのオーディオ視覚タスクにおける最先端のパフォーマンスを向上することを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:04:15 GMT)
Error Span Annotation: A Balanced Approach for Human Evaluation of Machine Translation [48.1] Error Spanを紹介します。
ESA - DAの継続的な評価と高レベルの評価を組み合わせる人間評価プロトコル。
MQM のマーキングのエラー重大度。
ESAは、高価なMQM専門家の必要なしに、同じ品質レベルでMQMよりも高速で安価なアノテーションを提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:20:47 GMT)
How Far Can In-Context Alignment Go? Exploring the State of In-Context Alignment [48.0] In-Context Learning (ICL) は、大規模言語モデルと、In-Context Alignment (ICA) と呼ばれる人間の好みを合わせることができる。
コンテキストテキストは、形式、システムプロンプト、例の3つのカテゴリに分けられる。
本研究は,モデルのアライメント能力を高めるために,サンプル部が重要であることを示唆する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:38:48 GMT)
CIMRL: Combining IMitation and Reinforcement Learning for Safe Autonomous Driving [47.9] 本研究では,模擬動作の事前条件と安全性制約を活用することで,シミュレーションにおける運転ポリシーのトレーニングを可能にするフレームワークを提案する。
RLと模倣を組み合わせることで,本手法は閉ループシミュレーション駆動ベンチマークにおいて最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:34:41 GMT)
Near-Lossless Acceleration of Long Context LLM Inference with Adaptive Structured Sparse Attention [47.6] 大きな言語モデル(LLM)は、非常に長いコンテキストウィンドウをサポートするようになった。
バニラの注意の二次的な複雑さは、TTFT(Time-to-First-Token)レイテンシを著しく長くする。
適応型構造とほぼロスレスなスパースアテンションであるSampleAttentionを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:05:15 GMT)
From Crowdsourced Data to High-Quality Benchmarks: Arena-Hard and BenchBuilder Pipeline [47.2] BenchBuilderは、ライブデータソースから高品質なプロンプトをフィルタリングして、新しくて困難なプロンプトのオフライン評価を可能にするベンチマークである。
Arena-Hard-Auto v0.1はMT-Benchより3倍の信頼区間を提供し、最先端の89.1%を人間の嗜好ランクで達成している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:26:10 GMT)
Active clustering with bandit feedback [47.1] アクティブクラスタリング問題(ACP)について検討する。
学習者は$N$の武器付きバンディットと$d$次元のサブガウスフィードバックで対話する。
同じ群内の腕が同じ平均ベクトルを共有するように、腕をK$グループに隠した分割が存在する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:52:19 GMT)
MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL [47.1] 最近のText-to-Yourselfメソッドは通常、"巨大な"データベース上での大幅なパフォーマンス劣化に悩まされる。
我々は,新しいテキスト・ツー・ユー・セルフ LLM ベースのマルチエージェント協調フレームワーク MAC を紹介する。
我々のフレームワークでは、GPT-4を全てのエージェントタスクの強力なバックボーンとして利用し、フレームワークの上限を決定する。
次に、Code 7Bを活用することで、オープンソースの命令フォローモデルであるsql-Llamaを微調整し、GPT-4のように全てのタスクを達成します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:27:32 GMT)
Endor: Hardware-Friendly Sparse Format for Offloaded LLM Inference [47.0] 本研究では, 圧縮率が高く, 減圧オーバーヘッドの少ない非ゼロ値に対して, 刈り取られたLLM重みの非構造スパースパターンを圧縮する新しいスパース形式を提案する。
一般的なHugingface Accelerateを使ったオフロード推論と比較して、EndorはOPT-66Bを1.70倍、Llama2-70Bを1.78倍加速する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:55:08 GMT)
VideoVista: A Versatile Benchmark for Video Understanding and Reasoning [46.8] さまざまなコンテンツカテゴリ、期間、能力の課題を統合するビデオQAベンチマークであるVideoVistaを紹介します。
VideoVistaは、14のカテゴリー(例えば、ハウト、フィルム、エンターテイメント)にまたがる3,400本のビデオから、25,000の質問で構成されており、期間は数秒から10分以上である。
19種類の理解タスク(例:異常検出、相互作用理解)と8つの推論タスク(例:論理推論、因果推論)を含んでいる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:09:00 GMT)
WellDunn: On the Robustness and Explainability of Language Models and Large Language Models in Identifying Wellness Dimensions [46.6] 言語モデル (LM) は, 予後のリスクを高めることで, 臨床実践におけるモデルの有用性の十分なリトマステストにはならない, メンタルヘルスの分野で提案されている。
ウェルネス次元(WD)の同定におけるLMの妥当性と説明性に着目した評価設計を提案する。
LM/LLMの4つの驚くべき結果が明らかになった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:50:40 GMT)
PiClick: Picking the desired mask from multiple candidates in click-based interactive segmentation [46.5] クリックベースのインタラクティブセグメンテーションは、人間のクリックによってターゲットマスクを生成することを目的としている。
そのようなタスクでは、目的の曖昧さはセグメンテーションの精度と効率を妨げる問題のままである。
そこで我々は,PiClickという対話型セグメンテーションネットワークを提案し,ユーザにとって最も有効なマスクを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:41:56 GMT)
Mitigating Large Language Model Hallucination with Faithful Finetuning [46.3] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示した。
彼らは「幻覚」として知られる、流動的で不合理な反応を生み出す傾向にある
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:16:07 GMT)
Mining Open Semantics from CLIP: A Relation Transition Perspective for Few-Shot Learning [46.3] そこで本稿では,イメージ・アンカー関係から画像・ターゲット関係に遷移して予測を行うアンカーとしてオープンセマンティクスを抽出することを提案する。
本手法は, 数ショットの分類設定を考慮し, 従来の最先端技術に対して良好に機能する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:28:58 GMT)
A Complete Survey on LLM-based AI Chatbots [46.2] 過去数十年間、データの増加を目撃し、データ収集、学習ベースのAI技術の基礎を築いた。
AIチャットボットと呼ばれる会話エージェントは、大きな言語モデル(LLM)をトレーニングし、ユーザのプロンプトに応じて新しいコンテンツ(知識)を生成するために、そのようなデータに大きく依存している。
本稿では,様々な分野におけるLLMベースのチャットボットの進化と展開に関する完全な調査を行う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:39:34 GMT)
When Reasoning Meets Information Aggregation: A Case Study with Sports Narratives [46.0] スポーツ物語の分析を LLM が要求する推論における情報集約の重要性について検討する。
我々はNBAの実際のバスケットボールデータを用いて総合的な実験を行い、ゲーム物語を合成する新しい手法であるSportsGenを提示する。
その結果, GPT-4oを含むほとんどのモデルでは, 頻繁な得点パターンのため, バスケットボールの得点を正確に集計することができないことが判明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:49:35 GMT)
SeamPose: Repurposing Seams as Capacitive Sensors in a Shirt for Upper-Body Pose Tracking [46.0] シーム(英: Seam)は、カット・アンド・サブアパレル製造工程において、2つ以上の生地を縫合して形成された重なり合う生地の領域である。
SeamPoseでは,上半身ポーズの連続推定のためのシャツの容量センサとしてシームを再利用した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:28:35 GMT)
HoLLMwood: Unleashing the Creativity of Large Language Models in Screenwriting via Role Playing [46.0] 大規模言語モデル(LLM)は、文学的な文章の複雑さが極めて高いため、人間の専門家のレベルで書かれた作品を作成することはほとんどできない。
本稿では,LLMの創造性を解放し,スクリーンライティングにおけるその可能性を探るためのフレームワークであるHoLLMwoodを紹介する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:01:33 GMT)
Computing in the Life Sciences: From Early Algorithms to Modern AI [45.7] 本稿では,生命科学におけるコンピューティングの歴史的発展を通じて,重要なマイルストーンと技術進歩を強調した。
この議論には、生物学的プロセスの計算モデルの導入、バイオインフォマティクスツールの出現、現代の生命科学研究におけるAI/MLの統合が含まれる。
科学的な大規模言語モデルやバイオAIツールなど、生命科学で使用されるAI対応ツールに注意が向けられ、その能力、限界、生物学的リスクへの影響を調べる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:36:52 GMT)
WeatherQA: Can Multimodal Language Models Reason about Severe Weather? [45.4] 干し草、竜巻、雷雨などの激しい対流的な気象イベントは、しばしば急速に起こるが、大きな被害を招き、毎年何十億ドルもの費用がかかる。
このことは、気象学者や住民のリスクの高い地域での適切な準備のために、前もって厳しい天候の脅威を予知することの重要性を強調している。
我々は、気象パラメータの複雑な組み合わせを推論するために機械用に設計された最初のマルチモーダルデータセットであるWeatherQAを紹介する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:23:18 GMT)
Counterfactual Debating with Preset Stances for Hallucination Elimination of LLMs [45.4] 大規模言語モデル(LLM)は様々な自然言語処理タスクに優れるが、幻覚に苦しむ。
本稿では, LLM 固有のバイアスをオーバーライドして解答検査を行うために, CFMAD フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:21:23 GMT)
A Hierarchical 3D Gaussian Representation for Real-Time Rendering of Very Large Datasets [45.1] 非常に大きなシーンの視覚的品質を保った3次元ガウスの階層構造を導入する。
遠隔コンテンツの効率的なレンダリングのための効率的なレベル・オブ・ディーテール(LOD)ソリューションを提供する。
単純で手頃な価格のリグで、最大数万の画像をキャプチャしたシーンの結果を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:40:18 GMT)
ALLaVA: Harnessing GPT4V-Synthesized Data for Lite Vision-Language Models [45.0] 大規模視覚言語モデル(LVLM)は、その強力な推論と一般化能力を備えた幅広い視覚言語タスクの前提を示してきた。
本研究では,従来のLVLMとリソースフレンドリなライトバージョンのパフォーマンスギャップを,高品質なトレーニングデータを用いて橋渡しすることを目的とする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:55:59 GMT)
Critical Fermions are Universal Embezzlers [45.0] 普遍エンベズラーは多体物理学においてユビキタスであることを示す。
同じ性質は、ジョルダン・ウィグナー変換を介して局所的に相互作用する双対スピン鎖において成り立つ。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:03:41 GMT)
InternalInspector $I^2$: Robust Confidence Estimation in LLMs through Internal States [44.8] InternalInspectorは,Large Language Models(LLMs)における信頼性評価を強化するためのフレームワークである
最終的なアクティベーション状態に主にフォーカスする既存の方法とは異なり、InternalInspectorはすべてのレイヤの内部状態を網羅的に分析し、正しい予測プロセスと間違った予測プロセスの両方を正確に識別する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:46:05 GMT)
GoldCoin: Grounding Large Language Models in Privacy Laws via Contextual Integrity Theory [44.3] これまでの研究では、さまざまなプライバシー攻撃、防御、評価を狭義に定義されたパターンの中で探索することで、プライバシを研究する。
我々は,プライバシ違反を評価する司法法において,LLMを効果的に活用するための新しい枠組みであるGoldCoinを紹介した。
我々のフレームワークは、コンテキスト整合性の理論をブリッジとして活用し、関連するプライバシー法に基づく多数の合成シナリオを作成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:27:32 GMT)
FAWN: Floor-And-Walls Normal Regularization for Direct Neural TSDF Reconstruction [44.0] 本稿では,TSDF (truncated signed distance function) の再構成法であるFAWNを提案する。
FAWNは、シーン内の壁や床を検知し、水平方向と垂直方向を逸脱するための対応する表面正規をペナルティ化することにより、シーン構造を考察する。
FAWNを修飾した手法は,既存の意味に基づく手法よりも,意味論を効果的に活用することが実証された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:46:49 GMT)
Text Grafting: Near-Distribution Weak Supervision for Minority Classes in Text Classification [44.0] テキストグラフトは、マイノリティクラスでの直接採掘や合成よりも大幅に改善されている。
まず LLM ベースのロジットを用いて生コーパスからマスク付きテンプレートをマイニングする。
次に、テンプレートは最先端のLCMで満たされ、マイノリティクラスに該当する近分布テキストを合成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:23:08 GMT)
Semantic-Aware Spectrum Sharing in Internet of Vehicles Based on Deep Reinforcement Learning [43.8] 深部強化学習(DRL)ソフトアクター・クリティック(SAC)アプローチに基づく意味認識スペクトル共有アルゴリズム(SSS)を提案する。
我々は、IoV環境におけるV2VおよびV2Iスペクトル共有における意味情報のメトリクスを再定義し、高速意味スペクトル効率(HSSE)と意味伝達率(HSR)を導入した。
この最適化は、V2VとV2Iの共有戦略の最適リンク、セマンティック情報を送信する車両の送信パワー、送信されるセマンティックシンボルの長さを含む。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:51:31 GMT)
DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence [43.6] DeepSeek-Coder-V2は、コード固有のタスクでGPT4-Turboに匹敵するパフォーマンスを実現する、オープンソースのコード言語モデルである。
DeepSeek-Coder-V2はさらに6兆トークンを追加して、DeepSeek-V2の中間チェックポイントから事前トレーニングされている。
標準的なベンチマーク評価では、GPT4-Turbo、Claude 3 Opus、Gemini 1.5 Proといったクローズドソースモデルと比較して、DeepSeek-Coder-V2は優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:51:35 GMT)
Unveiling the Truth and Facilitating Change: Towards Agent-based Large-scale Social Movement Simulation [43.5] ソーシャルメディアは社会運動の基盤として現れ、社会変革の推進に大きな影響を与えている。
ソーシャルメディアユーザシミュレーションのためのハイブリッドフレームワークHiSimを導入し、ユーザを2つのタイプに分類する。
我々は、トリガーイベントに続く応答ダイナミクスを再現するために、Twitterのような環境を構築します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:37:35 GMT)
Deep-Reinforcement-Learning-Based AoI-Aware Resource Allocation for RIS-Aided IoV Networks [43.4] 車両間通信(V2X)方式を考慮したRIS支援車両インターネット(IoV)を提案する。
車両間リンク(V2I)のタイムラインと車両間リンク(V2V)の安定性を改善するため,情報量(AoI)モデルとペイロード伝達確率モデルを導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:16:07 GMT)
$τ$-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains [43.4] $tau$-benchは、ユーザと言語エージェント間の動的会話をエミュレートするベンチマークである。
我々は、会話の最後にデータベースの状態と注釈付きゴール状態を比較する、効率的で忠実な評価プロセスを採用する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:33:08 GMT)
A Systematic Survey of Text Summarization: From Statistical Methods to Large Language Models [43.4] テキスト要約研究は、ディープニューラルネットワーク、事前学習言語モデル(PLM)、最近の大規模言語モデル(LLM)の出現により、いくつかの重要な変換が行われた。
この調査は、これらのパラダイムシフトのレンズを通して、テキスト要約における研究の進展と進化を包括的にレビューする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:52:32 GMT)
GAMA: A Large Audio-Language Model with Advanced Audio Understanding and Complex Reasoning Abilities [43.2] 高度な音声理解と複雑な推論能力を備えた汎用大規模音声言語モデル(LALM)
GAMAは、カスタムオーディオQ-Formerの機能を含む複数の種類の音声表現とLLMを統合して構築する。
GAMAを大規模オーディオ言語データセットで微調整し、音声理解機能で拡張します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:31:01 GMT)
Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models [42.9] デコーダのみの変換器をベースとした大規模言語モデル(LLM)は、優れたテキスト理解能力を示している。
LLMの能力をフル活用するための新しいフレームワークを提案する。
さらに, LLM-Infused Diffusion Transformer (LI-DiT) を設計した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:43 GMT)
Investigating Human Values in Online Communities [42.6] 本稿では、Schwartzの値フレームワークをRedditに応用する。
我々は自動的にシュワルツの値で1万のサブレディットに600万の投稿を注釈付けします。
本分析は,様々なオンラインコミュニティで広く普及している価値観について,これまでに記録された知見と新たな知見の両方を提示する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:39:25 GMT)
The Prompt Report: A Systematic Survey of Prompting Techniques [42.6] 本稿では, プロンプトの分類を組立て, 利用分析を行うことにより, プロンプトの構造的理解を確立した。
本稿では,33の語彙の包括的語彙,58のテキストのみのプロンプト技術,40のモダリティのテクニックを提示する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:28:09 GMT)
Mechanistic Understanding and Mitigation of Language Model Non-Factual Hallucinations [42.5] State-of-the-art Language Model (LM) は、世界の知識と混同する非現実的な幻覚を生じることがある。
我々は、主観的関係クエリを用いた診断データセットを作成し、内部モデル表現による幻覚の追跡に解釈可能性手法を適用した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:35:41 GMT)
$\texttt{MoE-RBench}$: Towards Building Reliable Language Models with Sparse Mixture-of-Experts [42.4] Mixture-of-Experts (MoE)は、大規模言語モデル(LLM)をスケールアップするための有望なフレームワークとして人気が高まっている。
我々は,SMoEの信頼性を3つの側面から総合的に評価する$textttMoE-RBenchを提案し,その安全性と幻覚,攻撃に対するレジリエンス,および$textit(iii)$out-of-distribution robustnessを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:17:05 GMT)
The Evolution of Language in Social Media Comments [41.9] 本研究では,34年間のユーザコメントの言語的特徴について検討し,その複雑さと時間的変化に着目した。
8つのプラットフォームとトピックから約3億の英文コメントのデータセットを利用する。
本研究は, テキスト長のほぼ普遍的な減少, 語彙の豊かさの低下, 反復性の低下を特徴とするソーシャルメディアプラットフォームとトピック間の複雑性パターンの整合性を明らかにした。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:03:30 GMT)
Linear response theory for cavity QED materials [41.9] 空洞と物質の両方の様々な応答に対する閉公式を導出する。
我々は、マグノン対を局所状態に結合する量子磁石において、新しい励起を発見した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:00:01 GMT)
Cavity QED materials: Comparison and validation of two linear response theories at arbitrary light-matter coupling strengths [41.9] 我々は,光物質結合のすべての条件において有効であるキャビティに結合した材料に対する線形応答理論を開発した。
熱グリーン関数を得るための2つの異なるアプローチを比較する。
量子ホール効果と磁気モデルの収集にこの理論の詳細な応用を与える。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:00:07 GMT)
Shaping Up SHAP: Enhancing Stability through Layer-Wise Neighbor Selection [41.9] Kernel SHAPは、そのモデルに依存しない性質と十分に確立された理論的枠組みのために広く使われている。
Kernel SHAPの不安定性は、その隣り合う選択手順によって引き起こされることを示す。
完全安定で, 計算効率が良く, 有意義な特徴帰属法が提案されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:35:02 GMT)
When Box Meets Graph Neural Network in Tag-aware Recommendation [41.6] 論理演算の組み合わせによるメッセージ集約を実現するため,BoxGNNと呼ばれる新しいアルゴリズムを提案する。
また,ボックスの表現を洗練させるために,Gumbelスムース化技術を用いたボリュームベースの学習目標も採用している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:35:53 GMT)
Ovis: Structural Embedding Alignment for Multimodal Large Language Model [41.3] Ovisは、視覚とテキストの埋め込みを構造的に整列するように設計された新しいMLLMアーキテクチャである。
Ovisは学習可能なビジュアル埋め込みテーブルをビジュアルエンコーダのプロセスに統合する。
様々なマルチモーダルベンチマークにおける実証的な評価は、OvisがオープンソースMLLMよりも優れていることを示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:51:50 GMT)
Compress then Serve: Serving Thousands of LoRA Adapters with Little Overhead [41.3] 低ランクのアダプタ (LoRA) を持つ細調整の大型言語モデルは一般的な慣行となり、LoRA更新でのみ同じLLMのコピーを多数生成する。
このパラダイムは、異なるLoRAを含むクエリに対するリアルタイム応答を提供するシステムの課題を示す。
SVDを用いて個別に圧縮アダプタを検討するとともに,LoRA固有のスケーリング行列と組み合わせた共有ベースにLoRAを共同圧縮する方法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:21:35 GMT)
Fairer Preferences Elicit Improved Human-Aligned Large Language Model Judgments [41.3] 大規模言語モデル (LLMs) が優先バイアスを示し, 設計に敏感であることを示す。
この現象に触発された自動ゼロショット評価指向のプロンプト最適化フレームワークZEPOを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:48:53 GMT)
"Not Aligned" is Not "Malicious": Being Careful about Hallucinations of Large Language Models' Jailbreak [41.0] 大規模言語モデル(LLM)の「ジェイルブレイク」は、大きな言語モデル(LLM)の安全性に関する主要な懸念事項である。
BabyBLUE"は、既存のjailbreakベンチマークを強化するための特別なバリデーションフレームワークを導入している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:51:01 GMT)
Learning sum of diverse features: computational hardness and efficient gradient-based training for ridge combinations [40.8] 目的関数 $f_*:mathbbRdtomathbbR$ を加法構造で学習する際の計算複雑性について検討する。
2層ニューラルネットワークの勾配学習により,$f_*$の大規模なサブセットを効率的に学習できることを実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:17 GMT)
Too Many Frames, not all Useful:Efficient Strategies for Long-Form Video QA [40.5] 広い時間間隔にまたがるロングフォームビデオは、非常に冗長な情報である。
長文ビデオ質問応答(LVQA)を行う場合、正しい応答を生成するために必要な情報はすべて、フレームの小さなサブセットに含まれることが多い。
近年の文献では、LVQAベンチマークにおける大規模言語モデル(LLM)の使用について調べ、例外的な性能を実現している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:50:22 GMT)
Preserving Knowledge in Large Language Model: A Model-Agnostic Self-Decompression Approach [40.5] 大規模言語モデル(LLM)は、ドメイン固有のデータに対して、事前訓練後または監督された微調整後(SFT)において、破滅的な忘れ込みに悩まされることが多い。
本稿では,TG-SFTに着目し,SFTデータを合成的に生成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:17:40 GMT)
Beyond Boundaries: Learning a Universal Entity Taxonomy across Datasets and Languages for Open Named Entity Recognition [40.2] 我々は,Open NERの凝集性および効率的なデータセットであるB2NERDを提案する。
データセット間の一貫性のないエンティティ定義を検出し,識別可能なラベル名を用いて識別し,400以上のエンティティタイプを普遍的に分類する。
我々のB2NERモデルは、B2NERDでトレーニングされ、GPT-4を6.8-12.0 F1ポイント上回っており、15のデータセットと6つの言語にわたる3つのドメイン外のベンチマークで、以前のメソッドを上回っています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:57:35 GMT)
Sycophancy to Subterfuge: Investigating Reward-Tampering in Large Language Models [40.2] 仕様ゲームで容易に発見できるLarge Language Model (LLM) アシスタントが、より稀でより柔軟な形式に一般化されるかどうかを考察する。
より洗練されたゲーム環境のカリキュラムを構築し、早期のカリキュラム環境におけるトレーニングが、残りの環境におけるより多くの仕様ゲームに繋がることを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:13:29 GMT)
Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs [40.2] 言語モデルプログラム、すなわちモジュール型言語モデル(LM)コールの洗練されたパイプラインは、ますますNLPタスクを進化させつつある。
本研究では,モジュールレベルのラベルや勾配を使わずに,下流のメトリクスを最大化するためのLMプログラムの迅速な最適化について検討する。
MIPROは,最良クラスのオープンソースモデルを用いて,6種類のLMプログラムのうち5つのベースラインを上回り,その性能を向上する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:12:03 GMT)
WPO: Enhancing RLHF with Weighted Preference Optimization [40.1] 人間からのフィードバックからの強化学習(RLHF)は、大きな言語モデル(LLM)と人間の価値をより緊密に整合させる、有望なソリューションである。
オフ・ポリティクスの選好最適化は、データ収集に使用されるポリシーとターゲットポリシーの間の分散的なギャップに悩まされることが多く、最適化の準最適化につながる。
本稿では,この問題を解決するための新たな戦略を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:13 GMT)
Bileve: Securing Text Provenance in Large Language Models Against Spoofing with Bi-level Signature [40.0] 両レベルシグネチャスキームであるBileveを導入し、整合性チェックのための微細なシグネチャビットと粗いシグネチャを埋め込んでテキストソースをトレースする。
バイナリ結果のみを出力する従来の透かし検出器と比較して、Bileveは検出中に5つのシナリオを区別することができる。
OPT-1.3BとLLaMA-7Bで実施された実験は、スプーフィング攻撃を倒す際のビリーブの有効性を実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:11:11 GMT)
Safety Fine-Tuning at (Almost) No Cost: A Baseline for Vision Large Language Models [39.6] 現在の視覚大言語モデル(VLLM)は、有害なコンテンツを生成する傾向があり、ジェイルブレイク攻撃に弱い。
最初の分析では、視覚言語指導の微調整中に有害なデータが存在することが原因であることが判明した。
この問題に対処するために、まず、様々な有害なカテゴリをカバーする視覚言語安全な命令追従データセットVLGuardをキュレートする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:26:32 GMT)
Social Environment Design [39.3] ソーシャル環境デザイン(Social Environment Design)は、AIを自動ポリシー作成に使用する一般的なフレームワークである。
このフレームワークは、一般的な経済環境を捉え、政策目標に関する投票を含め、AIシミュレーションを通じて政府と経済政策を体系的に分析するための方向性を提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:45:47 GMT)
Can Deception Detection Go Deeper? Dataset, Evaluation, and Benchmark for Deception Reasoning [39.1] 偽装検出を偽装推論に拡張する。
具体的には、潜在的な嘘と基本的な事実を提供し、この文がなぜ嘘なのかを分析する。
本稿では,データセットの構築や評価指標の定義など,この課題に対する最初の試みについて述べる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:57:09 GMT)
Computationally Efficient RL under Linear Bellman Completeness for Deterministic Dynamics [39.1] 線形ベルマン完全設定に対する計算的および統計的に効率的な強化学習アルゴリズムについて検討する。
この設定では線形関数近似を用いて値関数をキャプチャし、線形マルコフ決定プロセス(MDP)や線形二次レギュレータ(LQR)のような既存のモデルを統一する。
我々の研究は、線形ベルマン完全設定のための計算効率の良いアルゴリズムを提供し、大きなアクション空間、ランダムな初期状態、ランダムな報酬を持つMDPに対して機能するが、決定論的となる基礎となる力学に依存している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:52:38 GMT)
Tuning Large Multimodal Models for Videos using Reinforcement Learning from AI Feedback [38.7] ビデオとテキストのマルチモーダルアライメントは、主にマルチモーダル命令・チューンデータのボリュームと品質が不足しているため、依然として困難である。
本稿では,AIフィードバックからの強化学習(Reinforcement Learning from AI Feedback, RLAIF)と呼ばれる,マルチモーダルAIシステムを用いた新たなアライメント戦略を提案する。
具体的には、嗜好フィードバックの生成中に、詳細な映像記述を文脈として提供することによって、文脈対応報酬モデルを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:20:33 GMT)
Beyond Embeddings: The Promise of Visual Table in Visual Reasoning [38.6] 視覚的推論に適した新しい視覚表現形式である視覚表を提案する。
ビジュアルテーブルは、視覚シーンの階層的な記述として構築され、シーン記述と複数のオブジェクト中心の記述が特徴である。
それらは、視覚的推論に不可欠な、インスタンスレベルの世界知識と詳細な属性を提供します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:57:09 GMT)
Vocabulary Expansion for Low-resource Cross-lingual Transfer [38.2] 大きな言語モデル(LLM)は、英語以外の多くの言語で顕著な能力を示している。
LLMは、英語中心のトークン化器、語彙、事前学習データに依存するため、英語以外のテキストを生成する際にさらに推論ステップを必要とする。
ターゲット言語トークンによる語彙拡張は、この問題を改善するために広く使われている言語間語彙適応手法である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:42:34 GMT)
An Empirical Study on Cross-lingual Vocabulary Adaptation for Efficient Language Model Inference [38.2] State-of-the-the-art Generative Large Language Model (LLM) は、英語中心のトークン化器、語彙、事前学習データに依存している。
近年の研究では、英語以外の言語でテキストを生成する際に、推論効率が低下することが示されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:00:02 GMT)
Make Your Actor Talk: Generalizable and High-Fidelity Lip Sync with Motion and Appearance Disentanglement [38.2] 本研究の目的は,個人的アイデンティティと視覚的詳細を保ちながら,音声による唇の動きの編集を行うことである。
動きに依存しない視覚的詳細をキャプチャするために、別個のエンコーダを使用して唇、非唇の外観、動きを符号化し、学習した融合モジュールと統合する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:40:49 GMT)
Topology-aware Federated Learning in Edge Computing: A Comprehensive Survey [37.8] Federated Learning(FL)は、エッジコンピューティングにおける、分散およびプライベートトレーニングデータによる巨大なユーザ所有デバイスに対する自然なソリューションである。
FedAvg に基づく FL 法は典型的には天の星のトポロジーに従う。
他にもいくつかのネットワークトポロジーが存在し、恒星トポロジーの限界とボトルネックに対処することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:27:17 GMT)
Learning Hierarchical Semantic Classification by Grounding on Consistent Image Segmentations [37.8] 階層的な意味分類は、単一の平坦な木ではなく、分類木を予測する必要がある。
フラットレベル認識のための階層的セグメンテーションの学習に関する最近の研究に基づいて構築する。
木パスKL分割損失を導入し,各レベルに一貫した正確な予測を行う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:56:51 GMT)
Non-unitary Coupled Cluster on Gate-based Quantum Computers [37.7] 本稿では,古典計算機における量子化学の柱である結合クラスタ(CC)理論に基づく状態準備法を提案する。
提案手法は,従来の計算オーバーヘッドを低減し,CNOTおよびTゲートの数を平均で28%,57%削減する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:10:10 GMT)
The Benefits and Risks of Transductive Approaches for AI Fairness [37.6] ホールドアウト集合の組成変化がフェアネス指標に大きく影響を与えることを示す。
不均衡なホールトアウトセットは、既存の格差を悪化させ、バランスの取れたホールトアウトは、不均衡なトレーニングデータによってもたらされる問題を緩和する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:29:49 GMT)
The Fall of ROME: Understanding the Collapse of LLMs in Model Editing [37.4] このような崩壊の根本原因について研究する。
テストフェーズ中の編集中にプレフィックスキーを均一に使用するという,シンプルで効果的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:08:29 GMT)
Adaptive Reinforcement Learning Planning: Harnessing Large Language Models for Complex Information Extraction [37.1] 大規模言語モデル(LLM)に関する既存の研究は、多段階計画により情報抽出タスクを解くことができることを示している。
複雑な抽出タスクを分解して段階的に抽出することで,LLMの性能を効果的に向上させることができる。
本稿では,LLMに基づく情報抽出のための2段階多段階手法を提案し,多段階計画を実行するためにRLフレームワークを採用する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:11:01 GMT)
SLAB: Efficient Transformers with Simplified Linear Attention and Progressive Re-parameterized Batch Normalization [36.8] 本稿では,効率的な変圧器の計算ボトルネックモジュール,すなわち正規化層とアテンションモジュールについて検討する。
LayerNormはトランスフォーマーアーキテクチャで一般的に使用されるが、推論中の統計計算のために計算に適さない。
本稿では,LayerNorm を再パラメータ化した BatchNorm に段階的に置き換える PRepBN という新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:59:24 GMT)
i-SRT: Aligning Large Multimodal Models for Videos by Iterative Self-Retrospective Judgment [36.7] 反応生成と選好モデリングの両方を強化するために,自己ふりかえりを用いた新しい手法を提案する。
多様なビデオ質問応答ベンチマークによる経験的評価は,i-SRTが先行技術よりも優れていたことを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:33:30 GMT)
How Do Large Language Models Acquire Factual Knowledge During Pretraining? [36.6] 本研究では,大規模言語モデル(LLM)が事前学習中に事実知識を取得する方法を検討する。
発見は、事前訓練中の事実知識獲得のダイナミクスに関するいくつかの重要な洞察を明らかにしている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:54:40 GMT)
Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale [36.6] 原文のスクラッチから事前学習が可能な大規模教師なしSLM(Generative Pretrained Structured Transformers, GPST)を提案する。
GPSTは、ゴールドツリーやシーケンシャルトレーニングなど、以前のSLMの制限を回避している。
GPSTは、左から右への文法誘導において、既存の教師なしSLMを著しく上回る。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:22:52 GMT)
Fine-Grained Domain Generalization with Feature Structuralization [36.5] 細粒度領域一般化(FGDG)は、クラス間差が小さく、クラス内差が比較的大きいため、従来のDGタスクよりも難しい課題である。
本稿では,特徴的構造的領域一般化モデルを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:47:02 GMT)
GigaSpeech 2: An Evolving, Large-Scale and Multi-domain ASR Corpus for Low-Resource Languages with Automated Crawling, Transcription and Refinement [36.3] GigaSpeech 2は大規模多言語音声認識コーパスである。
タイ語、インドネシア語、ベトナム語を含む約3万時間の音声が自動で書き起こされる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:44:20 GMT)
On the Convergence of Zeroth-Order Federated Tuning for Large Language Models [36.3] Federated Learning and Large Language Models (LLMs) は、プライバシを保存する自然言語処理の新しい時代を支えている。
メモリ効率のゼロ階最適化は、FedMeZOと呼ばれる相乗効果である。
LLMの文脈でFedMeZOの理論的基盤を最初に検討した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:00:59 GMT)
Hallucination Mitigation Prompts Long-term Video Understanding [36.3] 本稿では,既存のMLLMをベースとした包括的幻覚緩和パイプラインを構築する。
私たちは、CLIPスコアを使用して、フレームサンプリングプロセスを質問でガイドし、質問に関連する重要なフレームを選択する。
回答生成段階では、チェーン・オブ・コンテクストとイン・コンテクスト・ラーニングの手法を用いて、回答の生成を明示的に制御する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:44:03 GMT)
Enhancing Intrinsic Features for Debiasing via Investigating Class-Discerning Common Attributes in Bias-Contrastive Pair [36.2] ディープニューラルネットワークは、データセットバイアスの存在下でターゲットクラスと急激な相関を持つバイアス特性に依存している。
本稿では,本質的特徴の領域を示す空間的指示を明示的に提示する手法を提案する。
実験により, 種々のバイアス重大度を有する合成および実世界のデータセットに対して, 最先端の性能を達成できることが実証された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:39:18 GMT)
Large Language Model Can Continue Evolving From Mistakes [36.1] 大規模言語モデル(LLM)を最新に保ち、その欠点に対処するためには、継続的な学習が不可欠です。
本研究では,連続的なCPTデータを収集する上で,データ効率のよい手法を提案する。
実験はCEM法の有効性を示し, ベストケースでは17%の精度向上を実現した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:32:29 GMT)
Thermodynamic Transferability in Coarse-Grained Force Fields using Graph Neural Networks [36.1] グラフ畳み込みニューラルネットワークアーキテクチャを用いて、粗いきめ細かい力場のための高度に自動化されたトレーニングパイプラインを開発する。
この手法により, 高精度な力場が得られるが, これらの力場は様々な熱力学条件によりより伝達可能であることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:44:05 GMT)
MLLM-Protector: Ensuring MLLM's Safety without Hurting Performance [36.0] 本稿では,視覚入力による悪意ある攻撃に対してMLLMを防御する新たな課題について検討する。
画像は、安全アライメントの間に考慮されていない「外国語として機能する」ため、MLLMは有害な反応を生じやすい。
MLLM-Protectorは,1)軽量害検知器による有害応答の同定,2)除毒器による有害応答の無害化という2つのサブタスクを解決するためのプラグアンドプレイ戦略である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:53:49 GMT)
InterNeRF: Scaling Radiance Fields via Parameter Interpolation [36.0] モデルパラメータのサブセットを用いてターゲットビューをレンダリングする新しいアーキテクチャであるInterNeRFを提案する。
標準ベンチマークでは競争力を維持しながら,マルチルームシーンにおいて大幅な改善が示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:55:22 GMT)
Retaining Key Information under High Compression Ratios: Query-Guided Compressor for LLMs [35.9] 圧縮比が増加するにつれて従来の手法の性能は劇的に低下し、時にはクローズドブックレベルにまで低下する。
本稿では、クエリを利用してコンテキスト圧縮プロセスをガイドするQuery-Guided (QGC)を紹介する。
提案したQGCの有効性を,NaturalQuestions,TriviaQA,HotpotQAデータセットを含む質問応答タスクで検証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:02:11 GMT)
Prompts as Auto-Optimized Training Hyperparameters: Training Best-in-Class IR Models from Scratch with 10 Gold Labels [35.8] 我々は,10個のゴールドレバレンスラベルを持つ小規模(100Mパラメータ未満)のニューラル情報検索モデルを訓練する手法を開発した。
RankLLamaは100K以上のラベルでトレーニングされた7Bパラメータモデルである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:25:55 GMT)
Scaling the Codebook Size of VQGAN to 100,000 with a Utilization Rate of 99% [35.7] 本稿では,VQGAN-LC (Large Codebook) という新しい画像量子化モデルを提案する。
本稿では,画像再構成,画像分類,GPTを用いた自己回帰画像生成,拡散およびフローベース生成モデルによる画像生成など,さまざまなタスクにおいて,モデルの性能が優れていることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:57 GMT)
Cultural Value Differences of LLMs: Prompt, Language, and Model Size [35.2] 本研究の目的は,大規模言語モデル(LLM)による文化的価値の行動パターンの同定である。
研究された変種には、質問の順序付け、プロンプト言語、モデルサイズが含まれる。
実験の結果,LLMのクエリ言語とモデルサイズが文化的価値の相違をもたらす主な要因であることが判明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:35:33 GMT)
FlexCare: Leveraging Cross-Task Synergy for Flexible Multimodal Healthcare Prediction [34.7] 我々は、不完全なマルチモーダル入力に柔軟に対応するために、textbfFlexCareという統合医療予測モデルを提案する。
タスクに依存しないマルチモーダル情報抽出モジュールを提示し、多様なモダリティ内およびモダリティ間パターンの非相関表現をキャプチャする。
MIMIC-IV/MIMIC-CXR/MIMIC-NOTEデータセットによる複数のタスクの実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:03:10 GMT)
Constrained Reinforcement Learning with Average Reward Objective: Model-Based and Model-Free Algorithms [34.6] モノグラフは、平均報酬決定過程(MDPs)の文脈内で制約された様々なモデルベースおよびモデルフリーアプローチの探索に焦点を当てている
このアルゴリズムは制約付きMDPの解法として検討されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:46:02 GMT)
t-DGR: A Trajectory-Based Deep Generative Replay Method for Continual Learning in Decision Making [34.0] 本稿では,意思決定タスクにおける継続学習のための,シンプルでスケーラブルで非自己回帰的手法を提案する。
提案手法を連続世界ベンチマークで評価し,本手法が最先端の性能を実現することを確認した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:04:27 GMT)
Intrinsic Evaluation of Unlearning Using Parametric Knowledge Traces [34.0] 近年,大規模言語モデルの「学習」概念が注目されている。
未学習の手法を評価するための現在のプロトコルは、主に振る舞いテストに依存している。
パラメトリックな知識トレースの変化を考慮し、未学習を内部的に評価するべきだと論じる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:00:35 GMT)
They're All Doctors: Synthesizing Diverse Counterfactuals to Mitigate Associative Bias [34.0] 本稿では,CLIPの微調整に使用できる合成反事実画像を生成するための新しいフレームワークを提案する。
精細調整されたCLIPモデルである$CF_alpha$は、画像検索タスクに対してMaxSkew、MinSkew、NDKLなどのキーフェアネス指標を40~66%改善することを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:42:19 GMT)
On Efficient Language and Vision Assistants for Visually-Situated Natural Language Understanding: What Matters in Reading and Reasoning [33.9] 言語と視覚アシスタントの最近の進歩は印象的な能力を示しているが、透明性の欠如に悩まされている。
オープンソースモデルは、一般的なイメージタスクを効果的に処理するが、複雑な視覚的なテキスト理解の高度な計算要求に直面する。
本研究の目的は、キーコンポーネントを特定し、制約付き推論コストで効率的なモデルを作成することにより、視覚言語モデルの設計を再定義することである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:57:30 GMT)
YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images [33.8] YOLC(You Only Look Clusters)は、アンカーフリーなオブジェクト検出器であるCenterNet上に構築された、効率的で効果的なフレームワークである。
大規模画像や非一様オブジェクトの分布がもたらす課題を克服するため,正確な検出のためにクラスタ領域のズームインを適応的に検索するローカルスケールモジュール(LSM)を導入する。
Visdrone 2019 と UAVDT を含む2つの航空画像データセットに対する広範な実験を行い、提案手法の有効性と優位性を実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:34:01 GMT)
Promoting Exploration in Memory-Augmented Adam using Critical Momenta [33.6] 我々は、フラットなミニマへの探索を奨励するAdamのメモリ拡張版を提案する。
このバッファは、モデルを狭いミニマを越えてオーバーシュートし、探索を促進する。
我々は、画像NetとCIFAR10/100の画像分類、Penn Treebankの言語モデリング、TinyImageNetと5-datasetのオンライン学習タスクにおいて、モデル性能を向上させることを実証的に実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:47:35 GMT)
Reconfigurable Intelligent Surface Assisted VEC Based on Multi-Agent Reinforcement Learning [33.6] 車両のエッジコンピューティングは、タスクをローカルに実行したり、近くのエッジデバイスにオフロードすることで、高強度タスクを実行することができる。
リアシスト(RIS)は、車両通信をサポートし、代替の通信経路を提供するために導入された。
改良型マルチエージェント・ディープ決定性勾配ポリシーを応用した新しい深層強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:35:32 GMT)
Is poisoning a real threat to LLM alignment? Maybe more so than you think [33.6] そこで我々は,異なるシナリオ下での中毒攻撃に対するDPOの脆弱性を調査し,嗜好中毒の有効性を比較検討した。
PPOベースの手法とは異なり、バックドア攻撃では、有害な行動を誘発するために、少なくとも4%のデータを汚染する必要がある。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:06:00 GMT)
GAugLLM: Improving Graph Contrastive Learning for Text-Attributed Graphs with Large Language Models [33.4] 本研究は,テキスト分散グラフ(TAG)の自己教師付きグラフ学習に関する研究である。
言語指導によるビュージェネレーションの改善を目指しています。
これは、リッチなセマンティック情報を持つグラフ構造を補完する、実際のアプリケーションにおけるテキスト属性の出現によって引き起こされる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:49:19 GMT)
Pre-Training and Personalized Fine-Tuning via Over-the-Air Federated Meta-Learning: Convergence-Generalization Trade-Offs [33.3] 本稿では、事前学習フェーズに参加するエージェントが共有無線チャンネルを介してサーバに接続される無線環境におけるメタpFLの一般化性能について検討する。
本稿では,新しいエージェントとタスクへの一般化と,一方で収束のトレードオフについて検討する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:06:13 GMT)
TourRank: Utilizing Large Language Models for Documents Ranking with a Tournament-Inspired Strategy [33.3] 大規模言語モデル(LLM)は、ゼロショット文書ランキングにますます採用され、賞賛に値する結果をもたらす。
本研究ではトーナメント機構に触発されたTourRankという新しい文書ランキング手法を提案する。
この手法は知的グループ化によってLLMの限られた入力長の影響を軽減するが、トーナメントのようなポイントシステムはロバストなランキングを保証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:58:22 GMT)
Effective Rank Analysis and Regularization for Enhanced 3D Gaussian Splatting [33.0] 3D Gaussian Splatting(3DGS)は、高品質な3D再構成によるリアルタイムレンダリングが可能な有望な技術として登場した。
その可能性にもかかわらず、3DGSは針のようなアーティファクト、準最適ジオメトリー、不正確な正常など、課題に直面している。
正規化として有効なランクを導入し、ガウスの構造を制約する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:51:59 GMT)
Are Large Language Models True Healthcare Jacks-of-All-Trades? Benchmarking Across Health Professions Beyond Physician Exams [32.8] 医療におけるLLM(Large Language Models)の評価のための既存のベンチマークは、主に医師に焦点を当てている。
従来の中国語における大規模医療知識ベンチマークであるEMPEC(Inspecters for Medical Personnel in Chinese)を紹介する。
EMPECは124人の被験者と20の医療専門家からなる157,803の試験質問からなる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:40:36 GMT)
TutteNet: Injective 3D Deformations by Composition of 2D Mesh Deformations [32.4] 本研究では3次元空間の射影変形の新たな表現法を提案する。
Tutteの埋め込みを通じてメッシュ変形を生成する、微分可能なレイヤを構築します。
これらの層を異なる平面上に構成し、3次元体積の複雑な3次元インジェクティブ変形を生成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:02:36 GMT)
An Empirical Investigation of Matrix Factorization Methods for Pre-trained Transformers [32.3] 本稿では,因子化に基づくモデル圧縮手法の包括的解析を行う。
直感的な低ランクの分解と最近導入されたMonarchの分解を比較することに重点を置いている。
我々の実験は、単純な低ランク因数分解がモナーキ因数分解を一貫して上回るという驚くべき結論を導いた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:14:23 GMT)
Minimax Optimal Q Learning with Nearest Neighbors [32.2] オフライン設定用とオンライン設定用という,近接した2つの学習方法を提案する。
これら2つの手法のサンプル複雑度は、オフラインおよびオンラインメソッドそれぞれ$tildeO(frac1epsilond+2 (1-gamma)d+2)$と$tildeO(frac1epsilond+2 (1-gamma)d+3)$である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:41:41 GMT)
A Semantic-based Layer Freezing Approach to Efficient Fine-Tuning of Language Models [32.2] 下流のデータやタスクにモデルを適応させるには、微調整言語モデル(LM)が不可欠である。
パラメータ効率の微調整(PEFT)のような既存の作業は、しばしば微細化のためのthithowに焦点を当てるが、微細化のためのtextitwhereの問題を無視している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:13:08 GMT)
Probing the Decision Boundaries of In-context Learning in Large Language Models [32.0] 本稿では,テキスト内二項分類のための決定境界のレンズからテキスト内学習を探索し,理解するための新しいメカニズムを提案する。
驚いたことに、単純な二項分類タスクにおいて、現在のLLMによって学習される決定境界は、しばしば不規則で非滑らかである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:00:24 GMT)
Autoregressive Image Generation without Vector Quantization [31.8] 従来の知恵では、画像生成のための自己回帰モデルは一般にベクトル量子化トークンを伴っている。
本研究では,拡散法を用いて確率分布の確率分布をモデル化し,連続値空間に自己回帰モデルを適用することを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:58 GMT)
Understanding Large Language Model Based Fuzz Driver Generation [31.8] 本研究は,LLMを用いてファズドライバを効果的に生成する上で重要な課題を対象とした,最初の詳細な研究である。
我々の研究は、736,430個のファジィドライバの評価を行い、トークンコストは0.85億ドル(8000ドル以上)だった。
我々の洞察はOSS-Fuzz-Genプロジェクトを改善するために実装され、業界におけるファズドライバの実践的生成を促進しました。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:53:37 GMT)
Mask-coding-assisted continuous-variable quantum direct communication with orbital angular momentum multiplexing [31.7] 量子セキュアダイレクト通信(quantum secure direct communication, QSDC)は、量子力学に基づいて秘密メッセージを送信する通信手法である。
マスク符号化と軌道角運動量に基づく連続可変QSDC方式を報告する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:36:57 GMT)
Can Machines Resonate with Humans? Evaluating the Emotional and Empathic Comprehension of LMs [31.6] 言語モデルにおける共感理解を改善するためのいくつかの戦略を提案する。
アノテータ間の低い合意は、トレーニングを妨げ、タスクの主観的な性質を強調します。
これを研究するために,我々はウルドゥー語でストーリーペアを注意深く収集し,アノテータ間の共感を解釈する主観性は文化的背景とは無関係であることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:22:20 GMT)
UniGLM: Training One Unified Language Model for Text-Attributed Graphs [31.5] 統一グラフ言語モデル(Unified Graph Language Model、UniGLM)は、グラフ埋め込みモデルであり、ドメイン内およびドメイン間TAGの両方によく一般化する。
UniGLMには、構造的に類似したノードを特定するための適応的な正のサンプル選択技術と、トレーニングを加速するために考案された遅延コントラストモジュールが含まれている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:45:21 GMT)
Minimax Linear Regression under the Quantile Risk [31.3] 量子リスク下での線形回帰におけるミニマックス法の設計問題について検討する。
我々は,最近提案されたmin-max回帰法の変種における最悪のケース量子化リスクに一致する上限を証明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:24:14 GMT)
Input Conditioned Graph Generation for Language Agents [31.2] 言語エージェントをグラフとして抽象化する既存のフレームワークを用いて,学習可能な動的言語エージェントを開発する。
我々は与えられた入力に基づいて通信の流れを表すエッジを生成することを学び、それによって言語エージェントの内部通信を調整する。
提案手法は,MMLUとCMMLUを併用したデータセットにおいて,従来の静的アプローチを約6%の精度で上回り,疎度誘導損失のトレーニングでは10%以上の精度で適用できる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:53:15 GMT)
Interactive Evolution: A Neural-Symbolic Self-Training Framework For Large Language Models [31.2] 環境誘導型ニューラルシンボリック自己学習フレームワークENVISIONSを提案する。
本研究の目的は,(1)記号データの不足,(2)記号言語処理におけるLLMの限られた習熟度という2つの課題を克服することである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:52:56 GMT)
Reframing linguistic bootstrapping as joint inference using visually-grounded grammar induction models [31.0] 意味的・統語的ブートストラッピング・ポジトリ(Semantic and Syntactic bootstrapping posit)とは、子供が特定の言語領域についての事前の知識、例えば構文的関係(syntactic relations)を使い、後に新しい単語の意味などの他の知識を取得する手助けをするものである。
ここでは、両者が、言語習得のためのより一般的な学習戦略である共同学習に固執していると論じる。
一連の視覚的文法帰納モデルを用いて,構文と意味が同時に学習された場合に,構文的および意味的ブートストラップ効果が最強であることが実証された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:01:06 GMT)
TRACE the Evidence: Constructing Knowledge-Grounded Reasoning Chains for Retrieval-Augmented Generation [30.5] 本稿では,RAGモデルのマルチホップ推論能力を高めるためにTRACEを提案する。
TRACEは、論理的に連結された一連の知識三重項である知識基底推論連鎖を構成する。
TRACEは、取得したすべてのドキュメントと比較して、平均14.03%の性能向上を実現している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:23:32 GMT)
Large Scale Transfer Learning for Tabular Data via Language Modeling [30.4] グラフ予測のための言語モデルであるTabuLa-8Bを提案する。
その結果,TabuLa-8Bはランダムな推測よりも15ポイント以上高い未確認のテーブル上でゼロショット精度を持つことがわかった。
この論文の出版とともに、私たちのモデル、コード、データをリリースします。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:58:20 GMT)
Unveiling the Power of Source: Source-based Minimum Bayes Risk Decoding for Neural Machine Translation [30.3] 最小ベイズリスク(MBR)復号法は、最も期待されているユーティリティで仮説を求める方法を提供する。
本研究では,QEモデルを再ランカとして使用した品質推定(QE)が,MBRの変種と見なせることを示す。
実験により、sMBRはQEのリランクを著しく上回り、標準のMBRデコードと競合することが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:13:52 GMT)
On the Limitations of Fine-tuned Judge Models for LLM Evaluation [30.3] 微調整の審査モデルは、GPT-4と同等の評価能力を発揮すると主張されている。
本研究は, GPT-4 を超越しても, ドメイン内テストセットにおいて, 微調整の判定モデルは高い性能を達成できたが, GPT-4 を数次元にわたって上回る性能を示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:10:34 GMT)
$\textit{Refiner}$: Restructure Retrieval Content Efficiently to Advance Question-Answering Capabilities [30.1] 大規模言語モデル(LLM)はパラメトリックな知識によって制限され、知識集約的なタスクに幻覚をもたらす。
我々は、RAGの検索後のプロセスで機能するエンドツーエンドの抽出・再構成パラダイムである$textitRefiner$を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:25:10 GMT)
3D Gaussian Splatting as Markov Chain Monte Carlo [30.0] 3D Gaussian Splattingは最近、ニューラルレンダリングで人気になっている。
我々は3次元ガウスの集合を、基礎となる確率分布から引き出されたランダムなサンプルとして再考する。
未使用ガウスの除去を促進する正則化器を導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:46:12 GMT)
QTIP: Quantization with Trellises and Incoherence Processing [29.9] 後トレーニング量子化(PTQ)は、重みを低精度のデータタイプに量子化することにより、LCMのメモリフットプリントを削減する。
最近の最先端のPTQアプローチは、ベクトル量子化(VQ)を用いて複数の重みを同時に定量化することに収束している。
超高次元量子化を実現するためにトレリス符号化量子化(TCQ)を用いるQTIPを導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:03:13 GMT)
Consistency^2: Consistent and Fast 3D Painting with Latent Consistency Models [29.8] ジェネレーティブ3Dペイントは、高解像度の3Dアセット管理とリサイクルにおいて、最大の生産性向上要因である。
課題に対するLCM(Latent Consistency Model)適応を提案する。
提案モデルの強みと弱みを分析し,定量的かつ質的に評価する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:40:07 GMT)
Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization [29.7] 弱い着想の問題が存在するかどうかを考察する。
弱いモデルと強いモデルの間の能力ギャップが増大するにつれて、偽造現象が増大する可能性がある。
私たちの研究は、スーパーアライメントの真の信頼性にもっと注意を払う必要があることを強調します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:36:39 GMT)
Soft Prompt Tuning for Augmenting Dense Retrieval with Large Language Models [29.7] 本稿では,拡張Dense検索(DR)モデルのためのソフトプロンプトチューニングを提案する。
各タスクに対して,限られた真実データに基づいて,タスク固有のソフトプロンプトを最適化するために,ソフトプロンプトチューニングを利用する。
我々は、弱いタグ付きクエリの品質をさらに向上させるために、高品質な文書クエリペアを選択するフィルタを設計する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:30:58 GMT)
The Role of Inherent Bellman Error in Offline Reinforcement Learning with Linear Function Approximation [29.7] 本稿では,線形関数近似を用いたオフラインRL問題について検討する。
我々の構造的前提は、MDPはベルマン誤差が低いということである。
我々は、$sqrtvarepsilon_mathrmBE$によるサブ最適性のスケーリングは、どんなアルゴリズムでも改善できないことを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:04:06 GMT)
Linear Bellman Completeness Suffices for Efficient Online Reinforcement Learning with Few Actions [29.7] ベルマンが成り立つと仮定し、これらの回帰問題が十分に特定されていることを保証している。
数作用が定数であるとき、線形ベルマンの下でRLの最初の特別なアルゴリズムを与える。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:24:49 GMT)
SeaFormer++: Squeeze-enhanced Axial Transformer for Mobile Visual Recognition [29.5] 本研究では,モバイル視覚認識のための圧縮強化軸変換器 (SeaFormer) を提案する。
モバイルフレンドリーなライバルとTransformerベースのライバルに勝って、パフォーマンスが良く、レイテンシも低い。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:32:34 GMT)
MODABS: Multi-Objective Learning for Dynamic Aspect-Based Summarization [29.1] 本稿では,Longformer-Encoder-Decoderを用いた新しい多目的学習フレームワークを提案する。
提案手法は3つの多様なデータセットのベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:56:37 GMT)
Disordered-DABS: A Benchmark for Dynamic Aspect-Based Summarization in Disordered Texts [29.1] 本研究では,非構造化テキストに適した動的アスペクトベース要約のための新しいベンチマークであるDisspected-DABSを紹介する。
本稿では,GPT-3.5のような最先端言語モデルを含む,現代の要約モデルに対して,障害型DABSがユニークな課題をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:06:04 GMT)
Bridging Language Gaps in Audio-Text Retrieval [28.8] 本稿では,多言語テキストエンコーダ(SONAR)を用いた言語拡張 (LE) を提案し,テキストデータを言語固有の情報で符号化する。
我々は,一貫したアンサンブル蒸留(CED)の適用により,オーディオエンコーダを最適化し,可変長音声テキスト検索のサポートを強化した。
提案手法は,AudioCaps や Clotho などの一般的なデータセット上でのSOTA (State-of-the-art) の性能を示す,英語の音声テキスト検索に優れている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:24:22 GMT)
Lightweight Model Pre-training via Language Guided Knowledge Distillation [28.7] 本稿では,多くのモバイルデバイスにおいて不可欠な小型モデルの事前学習の問題について検討する。
本稿では,教師と学生の間で伝達される知識の洗練を支援するために,目標下流タスクのカテゴリ名を用いた言語ガイド蒸留(LGD)システムを提案する。
実験結果から,LGD法を用いた蒸留軽量モデルは最先端性能を示し,分類,検出,セグメンテーションなど,様々な下流タスクで検証された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:07:19 GMT)
DTGB: A Comprehensive Benchmark for Dynamic Text-Attributed Graphs [28.3] 動的テキスト分散グラフ(DyTAG)は、様々な実世界のシナリオで一般的である。
幅広い適用性にもかかわらず、DyTAGに合わせたベンチマークデータセットは、顕著に不足している。
大規模な時間進化グラフのコレクションである動的テキスト分散グラフベンチマーク(DTGB)を導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:16:12 GMT)
Distributed Harmonization: Federated Clustered Batch Effect Adjustment and Generalization [28.2] 医療分野では、複数のサイトや機関からデータを収集することが一般的な戦略である。
様々な場所からのデータは、現地の環境や施設に偏りやすい。
一般的な戦略は、重要な生物学的情報を保持しながら、サイトのバイアスを調和させることである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:28:33 GMT)
Evaluating Task-based Effectiveness of MLLMs on Charts [28.1] まず、89,388のクォーテット(チャート、タスク、質問、回答)からなるChartInsightsという名前の大規模なデータセットをキュレートし、7つのチャートタイプで広く使用されている10の低レベルデータ分析タスクをカバーします。
低レベルデータ解析タスクにおけるマルチモーダル大モデルの限界を理解するため、GPT-4Vの機能の詳細なテストを行うために様々な実験を設計した。
これらの結果は,GPT-4Vがチャートとの相互作用に革命をもたらす可能性を示し,人的分析ニーズとGPT-4Vの能力のギャップを明らかにすることを示唆している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:44:33 GMT)
Cultural Conditioning or Placebo? On the Effectiveness of Socio-Demographic Prompting [28.1] 文化に敏感で非敏感な手がかりを条件とした4つのLPMを探索する。
GPT-4を除く全てのモデルが、両方の種類のデータセットに対して、応答に有意なばらつきを示すことが観察された。
この作品はまた、「プラセボ効果」からの反応の文化的条件を区別するための制御実験設計の再考を呼び掛けている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:43:45 GMT)
AdaNCA: Neural Cellular Automata As Adaptors For More Robust Vision Transformer [27.9] 視覚変換器用ニューラルセルラーオートマタ (NCA) を提案する。
AdaNCAは、ImageNet1Kベンチマークに対する敵攻撃による精度の10%以上の改善に貢献している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:31:16 GMT)
RePrompt: Planning by Automatic Prompt Engineering for Large Language Models Agents [27.8] 大規模言語モデル(LLM)は、従来の自然言語処理以外の領域で顕著な成功を収めている。
LLMエージェントのプロンプトにおけるステップバイステップ命令を最適化する「段階的な降下」を行う新しい手法である textscRePrompt を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:23:11 GMT)
What Kinds of Tokens Benefit from Distant Text? An Analysis on Long Context Language Modeling [27.8] 言語モデルにおいて,どの単語が長い文脈からより恩恵を受けるかを検討する。
内容語(名詞、形容詞など)と最初の単語のトークンが最も役立ちます。
また、より長い文脈で言語モデルがより自信を持ち、よりシャープな確率分布が生まれることを観察する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:07:29 GMT)
Instruct, Not Assist: LLM-based Multi-Turn Planning and Hierarchical Questioning for Socratic Code Debugging [27.7] ソクラテス質問は効果的な教育戦略であり、批判的思考と問題解決を奨励する。
TreeInstructは、学生が個別にエラーを特定し、解決するのを助けるために、探索的な質問をする。
学生の概念的・統語的知識を推定し、その反応と現在の知識状態に基づいて質問ツリーを動的に構築する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:28:21 GMT)
Style Transfer with Multi-iteration Preference Optimization [27.6] 強化学習と選好最適化の関係を考察する。
これらの手法に触発されて、我々は確立された嗜好最適化アプローチを改善した。
2つの一般的なテキストスタイル転送データセットを用いて,本モデルの評価を行った。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:20:53 GMT)
Optimizing and Testing Instruction-Following: Analyzing the Impact of Fine-Grained Instruction Variants on instruction-tuned LLMs [27.3] 我々は、複雑な命令を単純なサブコンポーネントに分解し、それらを修正し、それらを新しい変種に再構成する効果的なデータ拡張手法を導入する。
以上の結果から,DeMoReconで微調整したLCMは,命令追従ベンチマークと一般的な命令追従ベンチマークの両方において,大幅な性能向上が期待できることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:08:11 GMT)
Instruction Fusion: Advancing Prompt Evolution through Hybridization [27.3] 本稿では,既存の即時進化手法の制約について検討し,新しいアプローチであるインストラクション・フュージョン(IF)を導入する。
IFは、ハイブリッド化プロセスを通じて、2つの異なるプロンプトを革新的に組み合わせ、コードLLMのトレーニングプロンプトの進化を強化する。
実験の結果,提案手法は従来の手法の欠点を効果的に解決し,コードLLMの性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:40:26 GMT)
CoSQA+: Enhancing Code Search Dataset with Matching Code [27.1] CoSQA+は、複数の適切なコードで高品質なクエリをペアリングする。
CoSQA+はCoSQAよりも優れた品質を示している。
我々は1対Nのコード検索性能を評価するための新しい指標を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:34:14 GMT)
VideoLLM-online: Online Video Large Language Model for Streaming Video [27.1] 本稿では,ビデオストリーム内での時間的整合性,長コンテキスト性,リアルタイムな会話を可能にする,新しいLearning-In-Video-Streamフレームワークを提案する。
当社のフレームワークは,A100 GPU上で10FPS以上の5分間のビデオクリップでストリーミング対話をサポートする。
また、認識、キャプション、予測など、パブリックなオフラインビデオベンチマークで最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:55:32 GMT)
Self-training Large Language Models through Knowledge Detection [26.8] 大規模な言語モデル(LLM)は、ダウンストリームタスク間で印象的なパフォーマンスを達成するために、広範囲のラベル付きデータセットとトレーニング計算を必要とすることが多い。
本稿では,LLMが独自ラベルを自動でキュレートし,未知のデータサンプルを選択的に学習する自己学習パラダイムについて検討する。
経験的評価は、複数の被験者にまたがる世代における幻覚の減少に有意な改善を示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:25:09 GMT)
Exploring Safety-Utility Trade-Offs in Personalized Language Models [26.8] 大規模言語モデル(LLM)はパーソナライズバイアスに悩まされており、ユーザのアイデンティティにパーソナライズされた場合のパフォーマンスに影響を及ぼす。
安全性と実用性という2つの軸に沿ってLLMの性能を評価することにより、パーソナライズバイアスを定量化する。
我々は、嗜好調整とプロンプトベースディフェンスを用いたパーソナライズバイアスを軽減するためのいくつかの戦略について議論する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:17:11 GMT)
Grounding Continuous Representations in Geometry: Equivariant Neural Fields [26.6] 条件付きニューラルネットワークでは、フィールドはNeFを条件とする潜在変数で表現され、そのパラメータはデータセット全体にわたって共有される。
クロスアテンション・トランスフォーマーをベースとした同変ニューラル場を提案し,NeFを静止点雲である幾何条件変数に条件付けする。
これらの主な特性は、他の非同変NeFアプローチと比較して、分類実験とデータセット全体を適合させる能力の検証によって検証される。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:28:40 GMT)
Can We Remove the Square-Root in Adaptive Gradient Methods? A Second-Order Perspective [26.5] 適応手法の動作が根の除去時にどのように変化するかを検討する。
このような平方根自由適応法は畳み込みアーキテクチャ上のSGDへの一般化ギャップを埋める。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:23:51 GMT)
ArtWhisperer: A Dataset for Characterizing Human-AI Interactions in Artistic Creations [26.4] 本研究は,対象画像の生成にテキスト・ツー・イメージ・モデルをどのように利用するかを検討する。
私たちはArtWhispererを作った。これはユーザーがターゲットイメージを与えられたオンラインゲームで、ターゲットに類似した画像を生成するプロンプトを反復的に見つける。
我々は5万以上の人間とAIのインタラクションを記録し、各インタラクションはユーザによって生成された1つのテキストプロンプトと、それに対応する生成された画像に対応する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:13:39 GMT)
Is Efficient PAC Learning Possible with an Oracle That Responds 'Yes' or 'No'? [26.3] 本研究では,与えられたデータセットに対する経験的リスクを最小化する仮説を計算したERMの実行能力が,効率的な学習に必要かどうかを検討する。
バイナリ分類のためのPACの実際の設定において、概念クラスは1ビットしか返さないオラクルを用いて学習可能であることを示す。
また,本研究の結果は,オラクルを少し強化した学習環境や,部分的な概念,マルチクラス,実価値の学習環境にまで及んでいる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:50:08 GMT)
DiaHalu: A Dialogue-level Hallucination Evaluation Benchmark for Large Language Models [26.3] 本稿では,対話レベルの幻覚評価ベンチマークDiaHaluを提案する。
収集したトピックをシステムプロンプトに統合し、2つのChatGPT3.5間の対話を促進する。
人間の言語規則に従わない内容を手動で修正し、LLMを再生させ、人間と機械の相互作用のシナリオをシミュレートする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:11:20 GMT)
ComperDial: Commonsense Persona-grounded Dialogue Dataset and Benchmark [26.1] ComperDialは、99の対話エージェントから収集された1,485の会話において、10,395の対話ターンのための人間による応答で構成されている。
シングルターン応答スコアに加えて、ComperDialには対話レベルの人間注釈スコアも含まれている。
ComperDialから構築した新しい自動評価尺度は、人間の会話に対するモデル生成対話の一般的な類似度を測定する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:51:04 GMT)
Are Large Language Models a Good Replacement of Taxonomies? [26.0] 大きな言語モデル(LLM)は、知識を内部化し、自然言語の質問に答える素晴らしい能力を示している。
知識グラフのスキーマ(つまり分類学)がLLMによって時代遅れにされているかどうかを問う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:21:50 GMT)
SS-ADA: A Semi-Supervised Active Domain Adaptation Framework for Semantic Segmentation [25.9] セマンティックセグメンテーションのための半教師付きアクティブドメイン適応(SS-ADA)フレームワークを提案する。
SS-ADAは、アクティブラーニングを半教師付きセマンティックセグメンテーションに統合し、教師付き学習の精度を達成する。
本研究では,合成ドメイン適応設定と実ドメイン適応設定について広範な実験を行った。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:40:42 GMT)
Imagination Policy: Using Generative Point Cloud Models for Learning Manipulation Policies [25.8] Imagination Policy(Imagination Policy)は,高精度ピック・アンド・プレイス・タスクを解くための新しいマルチタスク・キー・フレーム・ポリシー・ネットワークである。
アクションを直接学習する代わりに、Imagination Policy は所望の状態を想像するために点雲を生成し、それが厳密なアクション推定を用いてアクションに変換される。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:00:41 GMT)
Do Not Design, Learn: A Trainable Scoring Function for Uncertainty Estimation in Generative LLMs [25.6] 生成型大規模言語モデル(LLM)における不確実性推定(UE)のための学習可能な応答スコア機能(LARS)
トークンと確率の間の複雑な依存関係をキャプチャするために,教師付きデータを活用するスコアリング関数LARSを提案する。
複数のデータセットにまたがる実験により,LARSは様々な確率に基づくUE法を考慮し,既存のスコアリング関数を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:30:40 GMT)
IDVT: Interest-aware Denoising and View-guided Tuning for Social Recommendation [25.5] ソーシャル接続されたユーザは、同様の好みを共有し、レコメンデーションの精度を高め、コールドスタートの問題に対処することが想定される。
我々の統計分析は、多くのソーシャル・コネクテッド・ユーザーが共通の関心を共有していないソーシャルネットワークにおいて、かなりの量のノイズを示唆している。
ソーシャルレコメンデーションのための革新的なアンダーラインインタレストアウェアアンダーラインデノイングとアンダーラインビュー誘導アンダーラインタニング(IDVT)手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:18:40 GMT)
Quantifying the Persona Effect in LLM Simulations [25.4] 大規模言語モデル(LLM)は、人間の言語と振る舞いをシミュレートする際、顕著な可能性を示してきた。
本研究では,パーソナ変数のデコグラフィ,社会的,行動的要因の統合がLLMの多様な視点をシミュレートする能力にどのように影響するかを検討する。
既存の主観的NLPデータセットにおけるアノテーションの10%のばらつきをペルソナ変数が説明できることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:06:57 GMT)
Formally Certified Approximate Model Counting [25.2] 本稿では、その出力近似の品質に関する保証を正式に保証した、近似モデルカウントのための最初の認証フレームワークを提案する。
i)Isabelle/HOL証明アシスタントにおけるアルゴリズムのPAC保証の静的かつ1回限りの公式な証明、(ii)証明証明書を用いた外部CNF-XORソルバに対するApproxMCの呼び出しの動的かつ1回実行による検証。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:02:04 GMT)
P3GNN: A Privacy-Preserving Provenance Graph-Based Model for APT Detection in Software Defined Networking [25.2] 本稿では,グラフ畳み込みネットワーク(GCN)とフェデレーション学習(FL)を相乗化する新しいモデルであるP3GNNを提案する。
P3GNNは教師なし学習を利用して、プロファイランスグラフ内の運用パターンを分析し、セキュリティ違反を示す偏差を識別する。
P3GNNの主なイノベーションは、前兆グラフ内のノードレベルで異常を検出する機能、攻撃軌跡の詳細なビューの提供、セキュリティ解析の強化である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:14:03 GMT)
Tackling the Curse of Dimensionality in Fractional and Tempered Fractional PDEs with Physics-Informed Neural Networks [24.9] 物理インフォームドニューラルネットワーク(PINN)は、普遍的な近似、能力一般化、メッシュフリートレーニングのために、有望なソリューションを提供する。
MC-fPINNはこれらの問題に対処するため、MC-tfPINNに拡張し、MC-tfPINN(MC-tfPINN)となる。
分数分数 PDE と分数分数分数分数 PDE の様々な前方および逆問題に対する手法の検証を行い,最大10万次元までスケールする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:26:18 GMT)
Score-fPINN: Fractional Score-Based Physics-Informed Neural Networks for High-Dimensional Fokker-Planck-Levy Equations [24.9] 非ブラウン過程のモデリングにおいて、Fokker-Planck-L'evy(FPL)方程式の高次元解法を提案する。
分数点関数と物理インフォームドニューラルネットワーク(PINN)を用いて,次元性(CoD)の呪いを解き放ち,指数関数的に崩壊する解からの数値オーバーフローを軽減する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:57:23 GMT)
Can LLM be a Personalized Judge? [24.9] LLM-as-a-Personalized-Judgeの信頼性を検討した。
LLM-as-a-Personalized-Judgeの直接適用は,従来想定されていたよりも信頼性が低いことが示唆された。
本研究では,LLM-as-a-Personalized-Judgeパイプラインに不確実性推定を導入し,不確実性判定に対する信頼度を低く表現する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:41:30 GMT)
Full-ECE: A Metric For Token-level Calibration on Large Language Models [24.7] 大きな言語モデル(LLM)は強力なツールとして登場し、言語タスクにおける例外的なパフォーマンスを示している。
expected Error (ECE) やclasswise-ECE (cw-ECE) のような従来の校正基準は、その複雑さのためにLLMには不十分である。
フルキャリブレーションと呼ばれる新しいキャリブレーションの概念を提案し,それに対応する計量であるFull-ECEを導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:07:58 GMT)
SUBLLM: A Novel Efficient Architecture with Token Sequence Subsampling for LLM [24.7] SUBLLMは、サブサンプリング、アップサンプリング、バイパスモジュールを組み込むことで、コアデコーダのみのフレームワークを拡張する革新的なアーキテクチャである。
トレーニング中、SUBLLMはスピードを26%向上し、GPU毎にメモリを10GB削減する。
推論では、スピードを最大37%向上し、1GPUあたりのメモリを1GB削減する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:23:13 GMT)
Towards an End-to-End Framework for Invasive Brain Signal Decoding with Large Language Models [24.5] 侵襲的な脳信号の復号化を目的とした,画期的なエンドツーエンド(E2E)フレームワークを提案する。
音声神経補綴術におけるE2Eフレームワークの可能性について検討した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:04:18 GMT)
Improved Algorithms for Contextual Dynamic Pricing [24.5] コンテキスト動的価格設定では、売り手はコンテキスト情報に基づいて商品を順次価格設定する。
提案アルゴリズムは,$tildemathcalO(T2/3)$の最適再帰限界を達成し,既存の結果を改善する。
このモデルに対して,我々のアルゴリズムは,文脈空間の次元を$d$とする,後悔の$tildemathcalO(Td+2beta/d+3beta)$を得る。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:26:51 GMT)
FedML-HE: An Efficient Homomorphic-Encryption-Based Privacy-Preserving Federated Learning System [24.4] Federated Learningは、ローカルデータではなく、ローカルモデルのアップデートを集約することによって、分散デバイス上の機械学習モデルをトレーニングする。
サーバ上の集約されたローカルモデルは、逆攻撃によって機密性の高い個人情報を明らかにする可能性があるため、プライバシー上の懸念が生じる。
我々は,HedML-HEをベースとした安全なモデルアグリゲーションを実現するための,最初の実践的フェデレーション学習システムを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:39:21 GMT)
Ruby Teaming: Improving Quality Diversity Search with Memory for Automated Red Teaming [24.3] Ruby TeamingはRainbow Teamingを改善し、メモリキャッシュをその3次元に含めている。
メモリ次元は、より良い品質のプロンプトを得るためにミューテータに手がかりを提供する。
Rubyのチームリングは、Shannon's Evenness Index(SEI)とSimpson's Diversity Index(SEI)で、Rainbow Teamingの6%と3%を上回った
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:36:14 GMT)
DELLA-Merging: Reducing Interference in Model Merging through Magnitude-Based Sampling [24.3] そこで本研究では,mAgnitude(DELLA-Merging)とSampLingを併用した新しいモデルマージ手法であるDropとrEscaLeを提案する。
MAGPRUNEはまず、これらのパラメータを等級順にランク付けし、より低い等級のパラメータに高い降下確率(p)を割り当てる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:02:45 GMT)
Unraveling Babel: Exploring Multilingual Activation Patterns of LLMs and Their Applications [24.2] 大規模言語モデル(LLM)は、NLPの分野で大きなブレークスルーを達成したが、異なる言語を処理する際の内部活動の理解はいまだに欠如している。
我々は,高密度LLMを微細なMoEアーキテクチャに変換する手法を設計し,その上で,専門家のアクティベーション周波数の熱マップを用いて多言語アクティベーションパターンを視覚的に研究した。
本研究は, LLM内の多言語処理機構を明らかにし, これらの知見を利用して, モデルプルーニングなどのアプリケーションに新たな視点を提供するものである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:57:32 GMT)
Understanding Multi-Granularity for Open-Vocabulary Part Segmentation [24.1] Open-vocabulary part segmentation (OVPS) は、多種多様な未確認の語彙に基づいてきめ細かな実体をセグメンテーションすることに焦点を当てた新興研究分野である。
本研究は,部分識別の知識に基づく性質を反映して,複雑な境界と多様な粒度による部分分割の複雑さを強調した。
一般化された部分とオブジェクトレベルのコンテキストを活用する新しいフレームワークであるPartCLIPSegを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:11:28 GMT)
ProbTS: Benchmarking Point and Distributional Forecasting across Diverse Prediction Horizons [24.0] 本稿では,基本的な予測ニーズを評価するための統一プラットフォームとして設計されたベンチマークツールであるProbTSを紹介する。
異なる予測条件から生じる特徴的データの特徴を識別する。
本稿では, 時系列予測の最新モデルについて検討し, 方法論的強度と弱点の分析も適用可能であることを明らかにする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:33:10 GMT)
Program Synthesis Benchmark for Visual Programming in XLogoOnline Environment [23.8] このベンチマークは、XLogoOnline環境のミニレベルから85の現実世界タスクで構成されている。
モデルの性能を向上させるための微調整パイプラインを開発した。
微調整のLlama3-8BはGPT-4VとLlama3-70Bのモデルを大幅に上回っていることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:48:02 GMT)
Experimental quantum computational chemistry with optimised unitary coupled cluster ansatz [23.7] スケーラブルで高精度な量子化学シミュレーションの実験的実現はいまだ解明されていない。
実験量子化学の限界を推し進め、最適化されたユニタリ結合クラスタアンサッツでVQEの実装を12キュービットにスケールアップすることに成功した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:25:18 GMT)
Latent Concept-based Explanation of NLP Models [23.7] 本稿では、潜在概念に基づく予測のための説明を生成するLatent Concept Attribution法(LACOAT)を提案する。
LACOATは、有能な入力語の表現をトレーニング潜在空間にマッピングすることで、予測の潜在文脈に基づく説明を提供することによって機能する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:24:49 GMT)
DU-Shapley: A Shapley Value Proxy for Efficient Dataset Valuation [23.6] 我々は、データセットのバリュエーションの問題、すなわち、インクリメンタルゲインを定量化する問題を考える。
Shapleyの値は、その正式な公理的正当化のためにデータセットのバリュエーションを実行する自然なツールである。
本稿では,離散一様分布下での予測として表現される離散一様シャプリーと呼ばれる新しい近似を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:19:44 GMT)
On Giant's Shoulders: Effortless Weak to Strong by Dynamic Logits Fusion [23.6] 既存の弱強法では、静的な知識伝達比と、複雑な知識を伝達するための単一の小さなモデルを用いることが多い。
本稿では,複数のタスク固有小モデルに対して,それぞれ異なるタスクに特化して動作する動的ロジット融合手法を提案する。
本手法では,シングルタスクシナリオでは96.4%,マルチタスクシナリオでは86.3%のパフォーマンスギャップを埋める。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:07:41 GMT)
Cracking Factual Knowledge: A Comprehensive Analysis of Degenerate Knowledge Neurons in Large Language Models [23.1] 大規模言語モデル(LLM)は、膨大な事実知識を格納するが、その基盤となるメカニズムはいまだ不明である。
これまでの研究では、事実知識は多層パーセプトロン重みに格納されていることが示唆されている。
いくつかの記憶装置は、縮退した知識ニューロンと呼ばれる縮退性を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:44:10 GMT)
A First Physical-World Trajectory Prediction Attack via LiDAR-induced Deceptions in Autonomous Driving [23.1] 既存の攻撃は、被害者AVの予測モデルを損なう。
単点攻撃を実現するための新たな2段階攻撃フレームワークを提案する。
我々の攻撃は、最大63%の衝突率と、被害者AVの様々な有害反応を引き起こす。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:26:00 GMT)
From Pixels to Progress: Generating Road Network from Satellite Imagery for Socioeconomic Insights in Impoverished Areas [22.8] 本稿では,エンコーダ・デコーダアーキテクチャと衛星画像における形態的操作を組み合わせた系統的道路抽出フレームワークを提案する。
F1スコアの42.7%向上を実現している。
また,中国382県の約794,178km2と17.048万人を対象に,包括的道路ネットワークデータセットを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:40:13 GMT)
Decomposed evaluations of geographic disparities in text-to-image models [22.5] 本稿では,画像生成における特徴の分割指標(Decomposed Indicators of Disparities in Image Generation, Decomposed-DIG)を提案する。
Decomposed-DIGを用いて、広く使われている潜伏拡散モデルを評価し、生成した画像が背景よりも写実性の良い物体を描いていることを確認する。
私たちはDecomposed-DIGを使って、アフリカのステレオタイプな背景生成、アフリカの近代的な車両の生成に苦労し、屋外設定にいくつかのオブジェクトを非現実的に配置するなど、相違点の具体例を特定します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:04:23 GMT)
Harmonizing Feature Maps: A Graph Convolutional Approach for Enhancing Adversarial Robustness [22.3] 敵の摂動は 特徴空間を汚染し 誤った予測につながる
FMR-GC(Feature Map-based Reconstructed Graph Convolution)と呼ばれる革新的なプラグアンドプレイモジュールを導入する。
FMR-GCの優れた性能とスケーラビリティを実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:10:45 GMT)
Conformance Checking of Fuzzy Logs against Declarative Temporal Specifications [22.3] 本稿では,ファジィ事象データが宣言的時間規則に適合するかどうかをDeclareパターンとして検討する。
これは、各瞬間に1つのアクティビティのみが実行されるという仮定を緩める必要がある。
PyTorch Pythonライブラリに基づいた概念実証,効率的な実装を提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:38:57 GMT)
SnapKV: LLM Knows What You are Looking for Before Generation [22.1] SnapKVは、キーバリューキャッシュサイズを効率的に最小化する、微調整不要のアプローチである。
現実世界のアプリケーションで同等のパフォーマンスを提供する。
さらなる研究は、SnapKVの実用的な応用の可能性を示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:01:58 GMT)
Aligning Language Models to Explicitly Handle Ambiguity [22.1] 我々は,あいまいなクエリを扱うために,言語モデルを整列する新しいパイプラインであるAlignment with Perceived Ambiguity (APA)を提案する。
APAは、明確な質問に答える能力を維持しつつ、あいまいなクエリを明示的に検出し、管理するLLMに権限を与えることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:04:32 GMT)
Understanding "Democratization" in NLP and ML Research [22.1] 民主化は、民主化の理論に意味のある関与をすることなく、技術へのアクセスや利用の伝達(解放)に最も頻繁に使用されることを発見した。
我々は、表面的なアクセス以上の民主的技術に向けて、適切な理論で民主化という用語を使うことを研究者に求める。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:47:06 GMT)
Twin-Merging: Dynamic Integration of Modular Expertise in Model Merging [21.9] モデルマージは、複数のタスク固有のモデルを、余分なトレーニングなしで単一のマルチタスクモデルに結合する、有望な方法である。
従来のモデルマージ手法は、微調整されたモデルに比べて大きな性能差を示すことが多い。
共有されたタスク固有の知識と排他的なタスク固有の知識の両方が、パフォーマンスのマージには不可欠であるが、排他的な知識を直接マージすることは、全体的なパフォーマンスを妨げていることを示す。
本稿では,1)知識を共有コンポーネントと排他コンポーネントにモジュール化し,冗長性を低減し効率を向上する圧縮,(2)共有およびタスク固有の知識を動的にマージする,という2つの主要な段階を包含する手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:31:55 GMT)
Backdoor for Debias: Mitigating Model Bias with Backdoor Attack-based Artificial Bias [21.6] バックドア攻撃は,標準訓練で得られたモデルバイアスに類似した人工バイアスを構築できることがわかった。
本稿では,知識蒸留に基づくバックドア脱バイアスフレームワークを提案し,モデルバイアスを元のデータから効果的に低減する。
この作業はバックドア攻撃の理解を深め、有益なアプリケーションの可能性を強調します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:47:55 GMT)
Accurate and Fast Pixel Retrieval with Spatial and Uncertainty Aware Hypergraph Diffusion [21.5] 本稿では,探索時間に局所的な特徴を用いて空間情報を効率的に伝播するハイパーグラフベースのフレームワークを提案する。
我々はまた、「コミュニティ選択」と呼ぶ手法により、画像グラフの構造情報を革新的に活用する。
画像レベルの検索と画素レベルの検索では,SOTA(State-of-the-art)の精度が向上し,処理速度も向上した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:11:25 GMT)
ICLEF: In-Context Learning with Expert Feedback for Explainable Style Transfer [21.4] ICLEFは、新しい人間とAIのコラボレーションアプローチである。
提案手法は,高品質な合成説明可能なスタイル転送データセットの生成につながることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:52:54 GMT)
Colored Noise in PPO: Improved Exploration and Performance through Correlated Action Sampling [21.3] PPO(Proximal Policy Optimization)のカラーノイズに基づくポリシー変種を提案する。
行動選択のための相関ノイズは学習性能を向上し,非相関性のあるホワイトノイズアプローチよりも優れることがわかった。
PPOのデフォルトノイズ源として相関ノイズへの切り替えを推奨する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:15:01 GMT)
BaFTA: Backprop-Free Test-Time Adaptation For Zero-Shot Vision-Language Models [20.9] 本稿では,視覚言語モデルの試験時間適応のためのバックプロパゲーションフリーアルゴリズムBaFTAを提案する。
BaFTAは、投影された埋め込み空間内のオンラインクラスタリングを使用して、クラスセントロイドを直接推定する。
我々は,BaFTAが最先端の試験時間適応手法を効率と効率の両方で一貫して上回っていることを実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:16:24 GMT)
MedThink: Inducing Medical Large-scale Visual Language Models to Hallucinate Less by Thinking More [20.6] 大規模視覚言語モデル(LVLM)は多モード医療生成タスクに適用される。
LVLMは、重要なモデル幻覚に悩まされる。
本稿では,人間の認知過程を模倣して微細な命令ペアを構築する手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:03:32 GMT)
An Open and Large-Scale Dataset for Multi-Modal Climate Change-aware Crop Yield Predictions [20.4] CropNetデータセットは、気候変動を意識した収穫予測を対象とする、最初のテラバイトサイズの、公開可能な、マルチモーダルデータセットである。
CropNetデータセットは、Sentinel-2 Imagery(英語版)、WRF-HRRR(英語版)、USDA Cropd(英語版)の3つのデータからなる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:35:12 GMT)
MDCR: A Dataset for Multi-Document Conditional Reasoning [20.4] 条件付きQAは、未解決条件を考慮し、文書を読み、適性質問に回答するモデルの能力を評価するために提案された。
我々は,実世界の課題を反映した新しいデータセットMDCRを提案し,最適化を必要とする複雑な条件推論のための新しいテストベッドとして機能する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:38:43 GMT)
DeFiGuard: A Price Manipulation Detection Service in DeFi using Graph Neural Networks [20.4] 本稿では,グラフニューラルネットワーク(GNN)を用いた新しい検出サービスDeFiGuardを紹介する。
DeFiGuardはトランザクション解析、グラフ構築、モデルトレーニング、PMA検出を統合している。
GNNモデルを用いたDeFiGuardは、精度、TPR、FPR、AUC-ROCのベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:51:18 GMT)
Efficient Privacy-Preserving Machine Learning with Lightweight Trusted Hardware [20.2] 本稿では,小規模な専用セキュリティプロセッサによるセキュアな機械学習推論プラットフォームを提案する。
我々は、最先端の分散プライバシ保存機械学習(PPML)プロトコルと比較して、大幅な性能向上を実現している。
我々の技術は、TEEにおけるセキュアメモリのサイズに制限されず、ResNet18やTransformerのような高容量な現代的なニューラルネットワークをサポートできます。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:38:42 GMT)
Dynamic Data Mixing Maximizes Instruction Tuning for Mixture-of-Experts [20.2] そこで本研究では,MoE命令チューニングのための新しい動的データ混合手法を提案する。
MoEのトークンルーティングの好みにインスパイアされた私たちは、データセットレベルの表現を構築し、データセット間の微妙な違いをキャプチャします。
2つのMoEモデルの結果は、下流の知識と推論タスクとオープンエンドクエリの両方に対するアプローチの有効性を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:47:03 GMT)
An Imitative Reinforcement Learning Framework for Autonomous Dogfight [20.2] 無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。
提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:59:52 GMT)
Multimodal Pretrained Models for Verifiable Sequential Decision-Making: Planning, Grounding, and Perception [20.1] 最近開発された事前学習モデルは、テキストや画像など、複数のモードで表現された豊かな世界知識を符号化することができる。
本研究では,事前学習したモデルからの知識を利用して,逐次意思決定タスクのための制御器の構築と検証を行うアルゴリズムを開発した。
我々は,実世界のタスクスイートを通じて,自動制御システムの構築,検証,および接地を行うアルゴリズムの能力を実証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:09:17 GMT)
Can LLMs Learn Macroeconomic Narratives from Social Media? [20.1] X(旧Twitter)からの投稿を含む2つのキュレートされたデータセットを導入し、経済に関する物語を捉えた。
自然言語処理(NLP)手法を用いて,ツイートから物語を抽出し,要約する。
我々は、下流の財務予測タスクにツイートを組み込んだ$textitmacroeconomic$予測や、抽出したナラティブの表現を組み込むことで、彼らの予測能力をテストする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:37:09 GMT)
Multi-Layer Ranking with Large Language Models for News Source Recommendation [20.1] 我々はNewsQuoteと呼ばれる新しいデータセットを構築し、ニュース記事の収集から得られた23,571の引用話者ペアで構成されています。
我々は,特定のクエリに関連付けられる可能性に基づいて,専門家の検索として推薦タスクを定式化する。
この結果から,テキスト内学習に基づくLLMランキングと多層ランキングに基づくフィルタを用いることで,推薦システムの予測品質と行動品質を著しく向上することがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:02:34 GMT)
DomainRAG: A Chinese Benchmark for Evaluating Domain-specific Retrieval-Augmented Generation [19.9] Retrieval-Augmented Generationは、大規模言語モデルの様々な制限に対処する有望なソリューションを提供する。
現在の研究は、しばしばウィキペディアのような一般的な知識ソースを使って、常識的な問題を解決するモデルの能力を評価している。
対話型RAGの能力を含むRAGモデルに必要な6つの能力を特定した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:01:39 GMT)
Enhancing Criminal Case Matching through Diverse Legal Factors [19.8] 逆法因子強化犯罪事例マッチング(DLF-CCM)という2段階の枠組みを提案する。
まず、DLF-CCMは、大規模な法的判断予測データセット上でLF抽出ネットワークを事前訓練するために、マルチタスク学習フレームワークを使用する。
ステージ2では、DLF-CCMがLF脱冗長モジュールを導入し、共有LFと排他LFを学習する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:23:11 GMT)
SEFraud: Graph-based Self-Explainable Fraud Detection via Interpretative Mask Learning [19.8] グラフベースの不正検出は、スパムレビューや悪意のあるアカウント検出など、現代の業界シナリオで広く適用されている。
これまでの研究は、GNNExplainerのようなポストホックな説明手法を使って、特定のインスタンスの説明を作成しようとしてきた。
グラフに基づく自己説明可能な不正検出フレームワークSEFraudを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:18:53 GMT)
MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time [19.8] MindStarは、大言語モデルの純粋に推論に基づく探索手法である。
推論タスクを探索問題として定式化し、最適な推論経路を特定するための2つの探索アイデアを提案する。
Llama-2-13BやMistral-7Bのようなオープンソースモデルの推論能力を大幅に向上させ、GPT-3.5やGrok-1に匹敵する性能を実現している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:37:39 GMT)
DiffMM: Multi-Modal Diffusion Model for Recommendation [19.4] DiffMMと呼ばれる新しいマルチモーダルグラフ拡散モデルを提案する。
本フレームワークは,モダリティを意識したグラフ拡散モデルとクロスモーダルコントラスト学習パラダイムを統合し,モダリティを意識したユーザ表現学習を改善する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:35:54 GMT)
Benchmarking General Purpose In-Context Learning [19.4] インコンテキスト学習(ICL)は、AIコミュニティにますますアピールしている。
ICLを拡張して、幅広いタスクに対応し、学習の地平を広げることを目指しています。
GPICLの機能のトレーニングと評価に特化して開発されたベンチマークを2つ導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:12:59 GMT)
Optimal Excess Risk Bounds for Empirical Risk Minimization on $p$-Norm Linear Regression [19.3] 実現可能な場合、即時仮定では、$O(d)$サンプルはターゲットを正確に回復するのに十分であることを示す。
この結果は、 (1, 2)$) の場合、最小化子におけるリスクのヘッセンの存在を保証する穏やかな仮定の下で、$p in (1, 2)$ に拡張する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:48:42 GMT)
STEVE Series: Step-by-Step Construction of Agent Systems in Minecraft [19.3] STEVE Seriesエージェントは、仮想環境で基本的なタスクを完了し、ナビゲーションやクリエイティブなタスクなど、より困難なタスクを実行できる。
将来的には、現実世界におけるSTEVEエージェントのさらなる応用の可能性を探る。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:18:08 GMT)
KoDialogBench: Evaluating Conversational Understanding of Language Models with Korean Dialogue Benchmark [19.1] 韓国語における言語モデルの対話能力を評価するためのベンチマークであるKoDialogBenchを紹介する。
日常の話題に関する韓国語の対話を公開情報源から収集したり、他言語からの対話を翻訳したりする。
次に、これらの会話を多様なテストデータセットに構成し、対話理解から応答選択タスクにまたがる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:12:56 GMT)
Safety Arithmetic: A Framework for Test-time Safety Alignment of Language Models by Steering Parameters and Activations [19.1] 現在のアライメント手法は、動的なユーザ意図と複雑な目的に苦しむ。
異なるシナリオにおける安全性を向上させるトレーニングフリーフレームワークであるSafety Arithmeticを提案する。
実験の結果,安全算術は安全対策を大幅に改善し,過度な安全性を低減し,モデルの有用性を維持できることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:48:13 GMT)
Efficient Sequential Decision Making with Large Language Models [19.1] 本稿では,大規模言語モデル(LLM)の成功を逐次意思決定に拡張することに焦点を当てる。
既存の取り組みは、 (i) 意思決定のための再訓練または微調整 LLM または (ii) 事前訓練された LLM の設計プロンプトのいずれかである。
本稿では,オンラインモデル選択アルゴリズムを活用してLLMエージェントを逐次意思決定に効率的に組み込む手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:13:22 GMT)
A Scalable and Effective Alternative to Graph Transformers [19.0] グラフ変換器(GT)が導入された。
GTは、グラフ内のノード数の複雑さに悩まされ、大きなグラフに適用できなくなる。
GTに代わるスケーラブルで効果的なグラフ拡張コンテキスト演算子(GECO)を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:57:34 GMT)
Adversarial Style Augmentation via Large Language Model for Robust Fake News Detection [19.0] 本研究は, 偽ニュース検知器の訓練を行うために, 対向型拡張AdStyleを提案する。
我々のモデルの主要なメカニズムは、LLMを慎重に使用して、多種多様なスタイル変換攻撃プロンプトを自動生成することである。
実験により、我々の拡張戦略は、フェイクニュースベンチマークデータセットでテストした場合の堅牢性と検出性能を改善することが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:00:41 GMT)
Probabilistic Reasoning in Generative Large Language Models [19.0] 本稿では,大言語モデル (LLM) が,確率値を介して明示的に定量化される不確実性を含む情報を含むテキストを推論する際に直面する課題について考察する。
LLMの確率論的推論能力をテストするために設計された新しいデータセットであるBayesian Linguistic Inference dataset (BLInD)を紹介する。
我々は,Pythonのコード,確率的アルゴリズム,確率論的論理プログラミングなど,問題を異なる形式的表現にマッピングするいくつかのプロンプト戦略を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:13:33 GMT)
MedCalc-Bench: Evaluating Large Language Models for Medical Calculations [18.9] MedCalc-Benchは、LSMの医療計算能力を評価することに焦点を当てた、第一種データセットである。
MedCalc-Benchには、55の異なる医療計算タスクから1000以上のレビュー済みのインスタンスの評価セットが含まれている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:07:21 GMT)
InSaAF: Incorporating Safety through Accuracy and Fairness | Are LLMs ready for the Indian Legal Domain? [18.8] 大規模言語モデル(LLM)は、社会的要因が関与する場合、インドの風景の中で法的タスクを行うことができる。
LLMの公平性と正確性の両方をカプセル化した新しいメトリックである$beta$-weighted $textitLegal Safety Score(LSS_beta$)を提示する。
我々は、バイアスを軽減し、モデルの安全性を向上させる潜在的な方法として、特殊な法的データセットを利用した微調整パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:46:07 GMT)
Graph Knowledge Distillation to Mixture of Experts [18.7] グラフニューラルネットワーク(GNN)は、ノード分類タスクに最適なアーキテクチャ選択である。
遅延問題の解決策の1つは、訓練されたGNNからMLP(Multi-Layer Perceptron)への知識蒸留を行うことである。
本稿では,専門家モデルではなく,特別に設計された学生モデルを用いて,パフォーマンス上の問題に対処することを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:00:41 GMT)
Split, Unlearn, Merge: Leveraging Data Attributes for More Effective Unlearning in LLMs [18.6] SPUNGE(SPlit, UNlearn, MerGE)は,任意のアンラーニング手法を用いて有効性を増幅するフレームワークである。
我々はSPUNGEが最近の2つの非学習手法の性能を大幅に向上させることを実証的に実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:35:52 GMT)
Reward Machines for Deep RL in Noisy and Uncertain Environments [18.4] Reward Machinesは、命令、安全性の制約、その他の時間的に拡張された報酬に値する振る舞いを指定するための、オートマチックにインスパイアされた構造を提供する。
本稿では,雑音および不確実な環境における深部RLに対するReward Machinesの利用について検討する。
ドメイン固有語彙の不確定な解釈の下でタスク構造を利用するRLアルゴリズムの組を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:39:08 GMT)
AI "News" Content Farms Are Easy to Make and Hard to Detect: A Case Study in Italian [18.4] 大規模言語モデル (LLMs) は、実際のニュース記事に伝達可能な合成テキストを生成するために「コンテンツファーム」モデル (CFMs) として使われることが多い。
Llama (v1) は、主に英語で訓練されており、イタリア語の母語話者が合成語として識別するのに苦労するニュースのようなテキストを生成するのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:19:00 GMT)
PLAYER*: Enhancing LLM-based Multi-Agent Communication and Interaction in Murder Mystery Games [18.4] PLAYER*は,任意のサンプリングベースプランナと質問駆動検索フレームワークを用いて,Murder Mystery Games(MMG)のパス計画を強化する。
エージェントに一連のセンサーを装備することで、PLAYER*は事前に定義された質問を不要にし、エージェントが複雑な社会的相互作用をナビゲートすることを可能にする。
また,複数問合せを用いた定量評価手法を導入し,1,482問問問答対を含むデータセットWellPlayを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:39:47 GMT)
ART: Automatic Red-teaming for Text-to-Image Models to Protect Benign Users [18.4] そこで本研究では,テキスト・ツー・イメージ・モデルの安全性を評価するために,新しい自動レッド・チーム・フレームワークARTを提案する。
包括的実験により、人気のあるオープンソーステキスト・ツー・イメージモデルの毒性を明らかにする。
また、テキスト・ツー・イメージ・モデルに関連する安全性リスクを研究するために、大規模な3つの赤チームデータセットも導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:00:33 GMT)
Measuring memorization in RLHF for code completion [18.4] 我々は、RLHFの各フェーズを通じて、トレーニングデータの記憶がどのように表面化し、伝播するかを分析する。
RLHFは報酬モデリングや強化学習に使用されるデータを記憶する機会を著しく減少させる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:33:35 GMT)
Learning Molecular Representation in a Cell [18.2] 本稿では,細胞内情報ボトルネック法を用いて分子表現を学習するための情報アライメント(InfoAlign)手法を提案する。
我々は、分子と細胞応答データをノードとしてコンテキストグラフに統合し、化学、生物学的、計算基準に基づいて重み付けされたエッジと接続する。
十分性目的(sufficiency objective)は、コンテキストグラフ内の分子の近傍から異なる特徴空間と整合するように表現をデコードする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:48:42 GMT)
ChangeMamba: Remote Sensing Change Detection with Spatio-Temporal State Space Model [18.1] Mambaアーキテクチャは、一連の自然言語処理タスクにおいて顕著なパフォーマンスを示している。
我々は、バイナリ変更検出、セマンティック変更検出、建築損傷評価のために、MambaBCD、MambaSCD、MambaBDAと呼ばれる対応するフレームワークをカスタマイズする。
3つのフレームワークはいずれも最先端のVisual Mambaアーキテクチャをエンコーダとして採用しており、入力画像からグローバルな空間的情報を完全に学習することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:57:36 GMT)
Statistical Learning of Distributionally Robust Stochastic Control in Continuous State Spaces [18.0] X_t+1 = f(X_t, A_t, W_t)$。
ここでは、$X$、$A$、$W$はそれぞれ状態、アクション、ランダムノイズプロセスを表し、$f$は状態遷移を記述する既知の関数を表す。
本稿では,所定のあいまいさ集合内の雑音分布に対して,おそらく逆方向の摂動を許容する分布的に頑健な制御パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:37:36 GMT)
LLaNA: Large Language and NeRF Assistant [17.8] 我々は、NeRFキャプションなどの新しいタスクを実行することができる初の汎用NeRF言語アシスタントであるLLaNAを開発した。
我々は,人的介入を伴わないさまざまなNeRF言語タスクに対して,テキストアノテーションを用いたNeRFのデータセットを構築した。
その結果,NeRF重みの処理は,NeRFから2次元あるいは3次元の表現を抽出することに対して良好な効果が得られた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:59 GMT)
Interventional Imbalanced Multi-Modal Representation Learning via $β$-Generalization Front-Door Criterion [17.7] マルチモーダル法はユニモーダル法よりも包括的な優越性を確立する。
タスク依存予測に対する異なるモダリティの不均衡な寄与は、正準多モード法の識別性能を常に低下させる。
ベンチマークメソッドは、トレーニング中にわずかな貢献で補助的なモダリティを増大させるという、トラクタブルなソリューションを提起する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:55:56 GMT)
Sketch and shift: a robust decoder for compressive clustering [17.6] 圧縮学習は、大規模学習のメモリフットプリントを大幅に削減する、新たなアプローチである。
CL-OMPRよりも大幅に改善された代替デコーダを提案する。
提案アルゴリズムは,従来より10倍小さいMNISTデータセットのスケッチからクラスタリング情報を抽出することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:44:46 GMT)
A Survey of AIOps for Failure Management in the Era of Large Language Models [17.3] 本稿では,LLM時代の障害管理のためのAIOps技術に関する包括的調査を行う。
これには、障害管理のためのAIOpsタスクの詳細な定義、AIOpsのデータソース、AIOpsに採用されているLLMベースのアプローチが含まれている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:13:24 GMT)
Black-box Prompt Tuning with Subspace Learning [17.3] ブラックボックスプロンプトチューニングでは、低次元部分空間内でのプロンプトの学習にデリバティブフリー最適化アルゴリズムを採用している。
最近の研究によると、ブラックボックス・プロンプト・チューニングはタスクとLarge Language Models (LLM)間の汎用性を欠いている。
サブスペース学習(BSL)を用いたブラックボックスプロンプトチューニングを導入し、ブラックボックスプロンプトチューニングの汎用性を高める。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:26:59 GMT)
Generative Language Models Exhibit Social Identity Biases [17.3] 56大言語モデルにおいて,内集団の連帯性と外集団の敵意,基本的社会的アイデンティティバイアスが存在するか否かを検討する。
ほぼすべての基礎言語モデルといくつかの命令微調整モデルは、文の完全化を促すと、明らかな非群陽性および非群陰性な関連を示す。
現代の言語モデルは,人間と同等の社会的アイデンティティバイアスを示すことが示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:19:56 GMT)
Attacking with Something That Does Not Exist: 'Proof of Non-Existence' Can Exhaust DNS Resolver CPU [17.2] NSEC3はDNSSECにおける非存在計算の証明である。
NSEC3-encloser攻撃は、依然として72倍のCPU命令数を発生させることができる。
十分な量のDNSパケットを使用すれば、攻撃はCPU負荷を増大させ、パケットロスを引き起こす可能性があることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:57:10 GMT)
MFC-Bench: Benchmarking Multimodal Fact-Checking with Large Vision-Language Models [17.1] 大規模視覚言語モデル(LVLM)はマルチモーダル推論タスクを大幅に改善した。
これらのモデルは、事実情報を格納するために外部知識ベースに頼るのではなく、パラメータ内にマルチモーダルな事実を埋め込む。
しかし、LVLMによって識別される内容は、固有のバイアスや誤った推論のために、実際の事実から逸脱する可能性がある。
MFC-Benchは、3つのタスクにわたるLVLMの実際の精度を評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:51:44 GMT)
Combining Reconstruction and Contrastive Methods for Multimodal Representations in RL [16.8] 再構成や対照的な損失を用いた自己教師型表現の学習は、画像ベース・マルチモーダル強化学習(RL)の性能とサンプルの複雑さを向上させる
ここでは、異なる自己教師付き損失関数は、基礎となるセンサのモジュラリティの情報密度によって異なる利点と制限を有する。
コントラスト的再構成集約表現学習(CoRAL)を提案する。このフレームワークは,各センサのモダリティに対して,最も適切な自己管理的損失を選択することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:04:47 GMT)
Generative Enzyme Design Guided by Functionally Important Sites and Small-Molecule Substrates [16.5] 本稿では,酵素をすべての官能基にまたがって設計する統一モデルを学ぶためのアプローチであるEnzyGenを提案する。
我々のキーとなるアイデアは、酵素のアミノ酸配列とその3D座標を、所望の触媒機能に対応する機能的に重要な部位と基質に基づいて生成することである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:14:34 GMT)
Spectral Introspection Identifies Group Training Dynamics in Deep Neural Networks for Neuroimaging [16.0] 本稿では,ニューロイメージングデータの深層学習のための新しいイントロスペクションフレームワークを提案する。
評価に完全訓練モデルを必要とするポストホック検査法とは異なり,本手法はフライ時のトレーニング力学の研究を可能にする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:58:15 GMT)
P-TA: Using Proximal Policy Optimization to Enhance Tabular Data Augmentation via Large Language Models [16.0] 我々は、GAN(Generative Adversarial Networks)を適用するために、PPO(Maximal Policy Optimization)を提案する。
PPOは、最先端のデータセットに対して合成生成されたデータに基づいてトレーニングされたモデルの精度を約4%向上させる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:22:00 GMT)
GeoGPT4V: Towards Geometric Multi-modal Large Language Models with Geometric Image Generation [15.9] GPT-4とGPT-4Vは、アライメントされたテキストと画像で基本的な幾何学的問題を生成するために使用される。
我々は4.9Kの幾何問題のデータセットを作成し、それを19Kのオープンソースデータと組み合わせてGeoGPT4Vデータセットを作成しました。
その結果、GeoGPT4Vデータセットは、MathVistaおよびMathVisionベンチマークの様々なモデルの幾何性能を著しく改善することを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:04:27 GMT)
SIMPLOT: Enhancing Chart Question Answering by Distilling Essentials [15.5] 本稿では,チャート推論に必要な要素のみを抽出するSIMPLOTを提案する。
私たちのモデルは、追加のアノテーションやデータセットを必要とせずに、正確なチャート推論を可能にします。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:21:33 GMT)
Save It All: Enabling Full Parameter Tuning for Federated Large Language Models via Cycle Black Gradient Descent [15.5] 大規模言語モデル(LLM)はディープラーニングパラダイムに革命をもたらし、幅広いタスクで印象的な結果をもたらしている。
既存のソリューションは、モデル全体がトレーニングのために交換されるという非現実的な仮定を定めている。
本稿では,資源消費を最小限に抑えつつ,FLにおけるLLMの効率的なトレーニングと微調整を行う新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:49:44 GMT)
Learning from Exemplars for Interactive Image Segmentation [15.4] 同一カテゴリにおける1つのオブジェクトと複数のオブジェクトの両方に対して、新しい対話的セグメンテーションフレームワークを導入する。
当社のモデルでは,ターゲットIoUの85%と90%を達成するために,クリック数が2回削減されるため,ユーザの労力を約15%削減する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:38:01 GMT)
Solving Vision Tasks with Simple Photoreceptors Instead of Cameras [15.3] 視覚ナビゲーションや連続制御など,多くの課題を解くのに十分な光受容体はごくわずかであることを示す。
これらの単純な視覚センサの設計は,有用な情報提供能力において重要な役割を担っている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:31:24 GMT)
Deep learning probability flows and entropy production rates in active matter [15.2] 本研究では,高次元確率密度のスコアを推定するディープラーニングフレームワークを開発する。
スコアを表すために,空間的に局所的なトランスフォーマーネットワークアーキテクチャを導入する。
1つのパッキング分数で4096粒子の系で訓練された1つのネットワークが、位相図の他の領域に一般化可能であることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:02:49 GMT)
CELL your Model: Contrastive Explanation Methods for Large Language Models [15.1] 大規模言語モデル(LLM)では、説明すべきクラス予測は存在しない。代わりに、LLMが与えられたプロンプトに対して特定の応答を出力する理由を問うことができる。
我々の説明は、LLMが与えられたプロンプトに対して応答を出力していることを示唆している。なぜなら、もしプロンプトがわずかに修正されたら、LLMは異なる応答を与えられるだろう。
i) コントラストを作成するのに効果的であるが、多くのモデルコールが必要であり、i) より長いコンテキストで要求されるクエリ予算に適合するコントラストをインテリジェントに生成する予算付きアルゴリズム。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:39:10 GMT)
Lifelong and Continual Learning Dialogue Systems [15.0] 本書は生涯学習対話システムの新たなパラダイムを紹介する。
システムがより多くのユーザとチャットしたり、外部ソースからより多くのことを学ぶようになると、会話の知識が増し、より良くなる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:10:48 GMT)
Can Many-Shot In-Context Learning Help Long-Context LLM Judges? See More, Judge Better! [14.9] 我々は,GPT-4o-as-a-Judgeを単一回答グレーディングで支援するために,マルチショットインコンテキストプロンプトであるReinforcedとUnsupervised ICLの2つのバージョンを提案し,検討した。
設計したプロンプトに基づいて,テキスト内サンプルのスケールアップが評価の一致と品質に与える影響について検討する。
GPT-4oのような長文LLMは、ゼロショット方式よりも多ショット方式の方が優れていることを示す実験結果が得られた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:11:58 GMT)
VLind-Bench: Measuring Language Priors in Large Vision-Language Models [14.8] LVLM(Large Vision-Language Models)は、様々なマルチモーダルタスクにおいて優れた性能を示す。
それらは、画像情報を無視しながら、テキストパターンのみに基づいて応答が生成される、言語事前(Language prior)と呼ばれる問題に悩まされる。
我々は,LVLMの言語先行性を測定するために設計された最初のベンチマークであるVLind-Benchという新しいベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:52:24 GMT)
Minusformer: Improving Time Series Forecasting by Progressively Learning Residuals [14.7] ユビキタス時系列(TS)予測モデルでは,過度なオーバーフィッティングが生じる傾向にある。
本稿では,深層的なブースティング・アンサンブル学習手法である二重ストリーム・サブトラクション機構を提案する。
提案手法は既存の最先端手法よりも優れており,各データセットの平均性能は11.9%向上した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:59:43 GMT)
Mix-Domain Contrastive Learning for Unpaired H&E-to-IHC Stain Translation [14.7] 本研究では,非ペアH&E-to-IHCのステンレス翻訳における教師情報を活用するために,Mix-Domain Contrastive Learning法を提案する。
ミックスドメインの病理情報アグリゲーションにより、MDCLは、対応するパッチと、生成されたIHC画像の異なる位置からのパッチの成分差との病理的整合性を高める。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:47:44 GMT)
Domain Generalization for In-Orbit 6D Pose Estimation [14.6] 宇宙船のポーズ推定ネットワークのための,エンドツーエンドのニューラルベースアーキテクチャを提案する。
提案手法はドメインギャップを効果的に閉鎖し,SPEED+データセット上で最先端の精度を実現する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:01:20 GMT)
COBIAS: Contextual Reliability in Bias Assessment [14.6] 大規模な言語モデル(LLM)は、広範囲なウェブコーパスで訓練されており、人間のようなテキストを理解して生成することができる。
これらのバイアスは、様々なステレオタイプや偏見を含む、Webデータの多様性と、しばしば未修正の性質から生じる。
本稿では,それらが生じる可能性のある多様な状況を考慮して,入力の文脈を理解することを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:01:25 GMT)
Duoduo CLIP: Efficient 3D Understanding with Multi-View Images [14.6] Duoduo CLIPは、ポイントクラウドではなく、マルチビューイメージから形状エンコーディングを学ぶ3D表現学習のモデルである。
マルチビュー画像の選択により、市販のCLIPモデルから2Dプリエントを活用でき、3Dデータによる微調整が容易になる。
現在のSOTAポイントクラウドでは、10億のモデルパラメータをトレーニングするのに480A100時間を必要としていますが、57A5000時間と8700万のパラメータしか必要ありません。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:16:12 GMT)
Online Pareto-Optimal Decision-Making for Complex Tasks using Active Inference [14.5] 本稿では,多目的強化学習のための新しいフレームワークを提案する。
安全なタスク実行を保証し、目的間のトレードオフを最適化し、ユーザの好みに準拠します。
操作と移動ロボットのケーススタディとベンチマークは、我々のフレームワークが他の方法よりも優れていることを示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:03:45 GMT)
Multiple Descents in Unsupervised Learning: The Role of Noise, Domain Shift and Anomalies [14.4] 教師なし学習における二重の子孫の存在について検討するが、これはほとんど注目されず、まだ完全には理解されていない領域である。
我々は、合成データと実データを用いて、様々なアプリケーションに対してモデルワイド、エポックワイド、サンプルワイドの二重降下を識別する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:24:23 GMT)
DistPred: A Distribution-Free Probabilistic Inference Method for Regression and Forecasting [14.4] 本稿では、回帰予測タスクのためのDistPredという新しい手法を提案する。
予測分布と対象分布の差分を測定するための適切なスコアリングルールを、微分可能な離散形式に変換する。
これにより、モデルは単一のフォワードパスで多数のサンプルをサンプリングし、応答変数の潜在的分布を推定することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:33:00 GMT)
ChaosMining: A Benchmark to Evaluate Post-Hoc Local Attribution Methods in Low SNR Environments [14.3] 本研究では,低信号-雑音比(SNR)を特徴とする領域において,非関連領域から予測力のある特徴を識別するためのポストホック局所帰属法の有効性を検討する。
我々の実験では、スケーラビリティの制限とともに、予測と特徴選択の長所を強調しています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:39:29 GMT)
SurfPro: Functional Protein Design Based on Continuous Surface [14.2] SurfProは、所望の表面と関連する生化学的性質を与えられた機能性タンパク質を生成する新しい方法である。
標準的な逆折り畳みベンチマークCATH 4.2と2つのタンパク質設計タスクでSurfProを評価する。
我々のSurfProは、従来の最先端の逆折り畳み法を一貫して上回り、CATH 4.2で57.78%の回復率を達成した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:20:58 GMT)
X-Light: Cross-City Traffic Signal Control Using Transformer on Transformer as Meta Multi-Agent Reinforcement Learner [14.1] X-Light という名前の都市間メタマルチエージェント信号制御のための Transformer on Transformer (TonT) モデルを提案する。
目に見えないシナリオに直接移行する場合、平均で+7.91%、場合によっては+16.3%のベースラインメソッドを超越する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:02:50 GMT)
Zero-Shot Scene Change Detection [14.1] 本手法は,連続するフレームの代わりに参照画像とクエリ画像を入力することで,追跡モデルの変化検出効果を利用する。
我々は、映像へのアプローチを拡張して、リッチな時間情報を活用し、シーン変化検出性能を向上させる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:03:44 GMT)
Position: Understanding LLMs Requires More Than Statistical Generalization [14.1] LLMの望ましい性質のいくつかは、良い統計一般化の結果ではないと論じる。
我々の中心的な議論は、AR確率モデルは本質的には識別できないという観察に依存している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:48:46 GMT)
Unveiling and Mitigating Bias in Mental Health Analysis with Large Language Models [14.0] GPT-4 は大規模言語モデル (LLM) における性能と公平性において最高の総合バランスであることを示す。
フェアネスを意識した私たちのプロンプトは、メンタルヘルスの予測を効果的にバイアスし、この分野におけるフェアネス分析の大きな可能性を浮き彫りにします。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:05:32 GMT)
Eyes Wide Unshut: Unsupervised Mistake Detection in Egocentric Video by Detecting Unpredictable Gaze [14.0] 本稿では,人的活動のビデオにおける誤り検出のための教師なし手法を提案する。
そこで本研究では,タスク中の視線不整合を示す異常な視線パターンを解析することにより,視線完了モデルを提案する。
期待された視線経路と観測された視線経路の違いは、誤りを特定する指標として機能する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:09:00 GMT)
A Simple and Effective $L_2$ Norm-Based Strategy for KV Cache Compression [14.0] キーバリューキャッシュサイズを減らすための既存のアプローチは、圧縮戦略を学ぶためのモデルを微調整するか、シーケンス長を減らすためにアテンションスコアを利用するかのいずれかである。
キャッシュされたKVペアに対して、$L$とアテンションスコアとの間に明らかな相関関係が見られ、キー埋め込みの低い$L$がデコード時に高いアテンションスコアをもたらす。
実験の結果,この単純な手法により,言語モデリングやニードル・イン・ア・ヘイスタックタスクでは50%,パスキー検索タスクでは90%,精度を損なうことなく,KVキャッシュサイズを50%削減できることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:35:16 GMT)
BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models [14.0] 大規模言語モデル(LLM)は、しばしば推論中に過剰な自信に悩まされる。
本稿では,LLMパラメータの平均値と共分散値を連続的に調整するアルゴリズムであるバックプロパゲーション(BLoB)によるベイズ低ランク適応を提案する。
その結果,分布内および分布外の両方で評価した場合,BLoBの有効性を一般化と不確実性評価の観点から検証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:55:38 GMT)
Semi-Supervised Domain Adaptation Using Target-Oriented Domain Augmentation for 3D Object Detection [13.9] 3Dオブジェクト検出は、自動運転やロボティクスといったアプリケーションには不可欠だ。
Semi-Supervised Domain Adaptation (SSDA)は、ソースドメインからターゲットドメインへの知識転送によって、これらの課題を軽減することを目的としている。
本稿では,LiDARを用いた3Dオブジェクト検出に適した新しいSSDA手法であるTarget-Oriented Augmentation Domain (TODA)を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:19:40 GMT)
An Online Gradient-Based Caching Policy with Logarithmic Complexity and Regret Guarantees [13.8] 我々は、対数計算の複雑さを突破するグラデーションベースのオンラインキャッシュポリシーを新たに導入する。
この進歩により、何百万ものリクエストやアイテムを伴って、大規模で現実世界のトレース上でポリシーをテストすることができます。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:01:01 GMT)
On the Combination of AI and Wireless Technologies: 3GPP Standardization Progress [13.8] 人工知能(AI)と無線通信技術の組み合わせは、2030年に向けた主要な技術トレンドの1つになっている。
AIを使用して、無線伝送の効率を改善し、無線ネットワークによるAIデプロイメントをサポートする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:11:04 GMT)
SUGARCREPE++ Dataset: Vision-Language Model Sensitivity to Semantic and Lexical Alterations [13.6] SuGARCREPE++データセットを導入し、視覚・言語モデルのセマンティックな変化に対する感度を解析する。
SuGARCREPE++では,構成性データセットの性能向上に寄与するすべてのモデルが同等に動作しないことを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:22:20 GMT)
Prefixing Attention Sinks can Mitigate Activation Outliers for Large Language Model Quantization [13.5] 我々は,問題となるトークンの発生を防止し,アクティベーション単位の量子化を容易にするための簡易かつ効果的な戦略を開発する。
トークンキャッシュを調整して、その後のトークンのアクティベーションを規則化し、より量子化しやすいものにします。
我々は,この手法を広範囲のモデルとベンチマークで徹底的に評価し,拡張子ごとのW8A8量子化の確立されたベースラインをはるかに上回っていることを確認した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:33:44 GMT)
RepLiQA: A Question-Answering Dataset for Benchmarking LLMs on Unseen Reference Content [13.2] 大規模言語モデル(LLM)は大量のデータに基づいて訓練されており、そのほとんどは自動的にインターネットから取り除かれる。
トレーニングセットに漏れたかもしれない テストスプリットのモデルを評価する 結論を誤解させる傾向がある
本稿では,質問応答とトピック検索タスクに適したRepLiQAという新しいテストデータセットを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:52:54 GMT)
Who's asking? User personas and the mechanics of latent misalignment [12.9] 安全に配慮したモデルでは、不整合能力は依然として潜伏している。
モデル世代が安全である場合でも、有害なコンテンツは隠された表現で持続可能であることを示す。
特定のペルソナがモデルセーフガードを破る理由を調査し、モデルがより慈善的な解釈を形成することができることを確かめる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:15:12 GMT)
A dual task learning approach to fine-tune a multilingual semantic speech encoder for Spoken Language Understanding [12.9] 自己指導型学習は、音声言語理解のための発話を効率的に表現するために広く利用されている。
テキストSSLモデルは言語に依存しないセマンティクスを符号化するために提案されている。
SAMU-XLSRフレームワークはこの意味情報を多言語音声表現の強化に用いた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:07:53 GMT)
ChatBug: A Common Vulnerability of Aligned LLMs Induced by Chat Templates [12.9] チャットテンプレートによって導入された共通の脆弱性であるChatBugを特定します。
悪意のあるユーザーは、チャットテンプレートの知識を活用して、大きな言語モデルの安全アライメントを回避できる。
ChatBugの脆弱性を悪用する2つの攻撃を開発した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:03:34 GMT)
Quantitative CLTs in Deep Neural Networks [12.8] ランダムなガウス重みとバイアスを持つ完全連結ニューラルネットワークの分布について検討する。
我々は、大まかではあるが有限の$n$および任意の固定されたネットワーク深さで有効な正規近似の量的境界を得る。
我々の境界は、それまでの文献で利用できたものよりも、ネットワーク幅に依存しているという点で厳格に強い。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:51:09 GMT)
Revisiting Spurious Correlation in Domain Generalization [12.7] データ生成プロセスにおける因果関係を記述するために,構造因果モデル(SCM)を構築した。
さらに、スプリアス相関に基づくメカニズムを徹底的に分析する。
そこで本研究では,OOD一般化における共起バイアスの制御について,相対性スコア重み付き推定器を導入して提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:22:00 GMT)
Teleporter Theory: A General and Simple Approach for Modeling Cross-World Counterfactual Causality [12.6] 世界の反事実的アプローチは、観測データを超えた因果関係の理解を拡張します。
対実変数と実世界の変数を含むクロスワールド変数の連関は、グラフィカルモデルの構築に挑戦する。
本稿では,カウンターファクトの汎用的でシンプルなグラフィカルな表現を確立するために,新しいテレポーター理論を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:03:44 GMT)
Centering Policy and Practice: Research Gaps around Usable Differential Privacy [12.3] 我々は、差分プライバシーは理論上はクリーンな定式化であるが、実際は重大な課題を提起していると論じている。
差分プライバシーの約束と現実世界のユーザビリティのギャップを埋めるために、研究者と実践者は協力しなければなりません。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:32:30 GMT)
RetinaGS: Scalable Training for Dense Scene Rendering with Billion-Scale 3D Gaussians [12.3] 我々は、適切なレンダリング方程式を用いた3DGSの一般的なモデル並列トレーニング手法であるRetinaGSを設計する。
本手法により,原始的な数を増やすと,視覚的品質が向上する傾向が明らかになる。
また、完全なMatrixCityデータセット上に10億以上のプリミティブを持つ3DGSモデルをトレーニングする最初の試みを実演する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:56 GMT)
Obfuscating IoT Device Scanning Activity via Adversarial Example Generation [12.3] 敵の例に基づいて,IoTデバイスバナーを難読化するための新しいアプローチを提案する。
デバイスバナーを変更することで、BANADVはIoTデバイスのプロファイルの収集を中断する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:21:40 GMT)
Graph Neural Re-Ranking via Corpus Graph [12.3] Graph Neural Re-Ranking(GNRR)は、グラフニューラルネットワーク(GNN)に基づくパイプラインで、推論中に各クエリがドキュメントの分散を考慮できるようにする。
我々は、GNNが文書間の相互作用を効果的に捉え、人気のあるランキング指標の性能を向上させることを実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:38:19 GMT)
Tokenization Falling Short: The Curse of Tokenization [12.2] 本研究では,これらの課題とその言語モデルへの影響を体系的に検討する。
その結果,スケーリングモデルパラメータはトークン化の問題を軽減することができることがわかった。
実験の結果,BPEドロップアウトなどのサブワード正規化がこの問題を緩和できることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:05:32 GMT)
Boosting Scientific Concepts Understanding: Can Analogy from Teacher Models Empower Student Models? [12.2] 本研究では,教師言語モデル(LM)による類推が,科学概念の理解にどのように役立つかを検討する。
以上の結果から,自由形式類似は概念理解におけるLMの助けとなることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:51:38 GMT)
JobFair: A Framework for Benchmarking Gender Hiring Bias in Large Language Models [12.1] 本稿では,Large Language Models (LLMs) における階層的ジェンダー採用バイアスのベンチマークを行うための新しいフレームワークを提案する。
本稿では,医療・金融・建設産業のリアルかつ匿名化された履歴データセットを用いたフレームワークについて紹介する。
第2に,反現実的アプローチに基づく新しい統計的・計算的採用バイアス指標を提案する。
第三に、私たちは10の最先端のLCMにおける採用バイアスを分析します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:15:57 GMT)
CM2-Net: Continual Cross-Modal Mapping Network for Driver Action Recognition [11.9] 本稿では,新たにやってくる各モダリティを継続的に学習する連続的クロスモーダルマッピングネットワーク(CM2-Net)を提案する。
我々は,識別的・情報的特徴を地図化するために,累積クロスモーダルマッピング・プロンプト(ACMP)を開発した。
Drive&Actデータセットで行った実験は、ユニモーダルドライバとマルチモーダルドライバの両方でCM2-Netの性能上の優位性を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:57:00 GMT)
MMNeuron: Discovering Neuron-Level Domain-Specific Interpretation in Multimodal Large Language Model [11.9] 単語埋め込み空間に視覚的特徴を投影することは、MLLM(Multimodal Large Language Models)が採用する重要な融合戦略となっている。
多言語研究に触発されて,多言語モデルにおけるドメイン固有ニューロンを同定する。
本稿では,MLLMにおける言語モデルモジュールのための3段階のフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:59:44 GMT)
Adversaries With Incentives: A Strategic Alternative to Adversarial Robustness [11.7] 敵の訓練は悪意のある相手を守ることを目的としている。
我々のアプローチは、学習の帰納的バイアスとして、相手のインセンティブの可能性に関する知識または信念を使用する。
我々は、敵のインセンティブに関する穏やかな知識がいかに有用であるかを示す一連の実験を行う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:20:59 GMT)
Self and Cross-Model Distillation for LLMs: Effective Methods for Refusal Pattern Alignment [11.6] OpenAIのGPTシリーズ、AnthropicのClaude、MetaのLLaMaのような大きな言語モデル(LLM)は、テキスト生成において顕著な能力を示している。
有害なプロンプトに対する感受性は、重大なセキュリティ上の課題を呈している。
本稿では,SFT(Supervised Fine-Tuning)やRLHF(Reinforcement Learning from Human Feedback)などのアライメント手法について検討する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:46:45 GMT)
Tracking the perspectives of interacting language models [11.6] 大規模言語モデル(LLM)は前例のない速度で高品質な情報を生成することができる。
これらのモデルが社会に浸透し続ければ、それらが生み出すコンテンツはますますデータベースに浸透していくだろう。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:20:16 GMT)
Soft Prompting for Unlearning in Large Language Models [11.5] この研究は、データ保護規制を動機とした大規模言語モデルのための機械学習の研究に焦点をあてる。
本研究では、任意のクエリに付加可能なプロンプトトークンを学習して学習を誘発する、textbfSoft textbfPrompting for textbfUntextbflearning (SPUL)を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:11:40 GMT)
In-Context Learning Demonstration Selection via Influence Analysis [11.5] 大規模言語モデル(LLM)は、ICL(In-Context Learning)機能を披露した。
その利点にもかかわらず、ICLの有効性はデモの選択に大きく依存している。
本稿では,インフルエンス関数を用いてトレーニングサンプルの影響を解析する,InfICLという実演選択手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:34:54 GMT)
Deep-Learning-Based Channel Estimation for Distributed MIMO with 1-bit Radio-Over-Fiber Fronthaul [11.4] 分散マルチインプット・マルチアウトプット(MIMO)アーキテクチャにおけるパイロット支援・アップリンクチャネル推定の問題点を考察する。
我々は最近Nguyenらによって提案されたディープラーニングに基づくチャネル推定アルゴリズムを適用した。
提案手法は,Bussgang線形最小二乗誤差チャネル推定器よりも有意に優れていることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:38:29 GMT)
Optimal Attack and Defense for Reinforcement Learning [11.4] 敵RLでは、外部攻撃者は、環境との相互作用を操作できる。
我々は、攻撃者が予想される報酬を最大化するステルス攻撃を設計する際の問題を示す。
被害者に対する最適な防衛方針は,Stackelbergゲームに対する解決策として計算できる,と我々は主張する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:13:44 GMT)
Improving Quotation Attribution with Fictional Character Embeddings [11.3] 我々は,文字のグローバルな情報をエンコードする文字埋め込みを用いた,人気のある引用帰属システムであるBookNLPを提案する。
提案するグローバルキャラクタ埋め込みにより,アナフォリックおよび暗黙的引用に対する話者識別が向上し,最先端のパフォーマンスに達することを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:46:35 GMT)
A Realistic Evaluation of LLMs for Quotation Attribution in Literary Texts: A Case Study of LLaMa3 [11.3] 大言語モデル (LLM) ゼロショットと少数ショットのパフォーマンスは記憶とデータ汚染の影響を受ける。
我々はタスク固有の記憶度尺度を設計し、Llama3の引用属性の実行能力が新しい記憶度に正の相関があることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:56:46 GMT)
H-Fac: Memory-Efficient Optimization with Factorized Hamiltonian Descent [11.0] モーメントとスケーリングパラメータに対する因子的アプローチを取り入れたH-Facを開発した。
提案アルゴリズムは,ResNetとVision Transformerの競合性能を示す。
これらの最適化アルゴリズムは、単純で適応性があり、多様な設定で容易に実装できるように設計されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:25:33 GMT)
Multi-stage Large Language Model Correction for Speech Recognition [11.0] 我々は,大言語モデル(LLM)のASR出力の不確実性推定と推論能力を利用した,新しい多段階的アプローチを提案する。
提案手法の有効性を,WERが競合するASRシステムよりも10% 20% 向上していることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:21:50 GMT)
ValueDCG: Measuring Comprehensive Human Value Understanding Ability of Language Models [11.0] LLM(Large Language Models)の真に理解するためには、"know What"と"know why"の両方が必要です。
本稿では,工学的手法を用いて2つの側面を定量的に評価するための総合評価指標であるValueDCGを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:58:00 GMT)
Characterising Contributions that Coincide with Vulnerability Mitigation in NPM Libraries [11.0] NPM GitHubプロジェクトは54の異なる脆弱性アドバイザリの影響を受け、合計4,699件のPRとイシューをマイニングしています。
ツール開発と開発者のワークロード管理の改善は、より効率的で効果的な脆弱性軽減プロセスを構築する可能性を秘めています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:33:08 GMT)
Inpainting the Gaps: A Novel Framework for Evaluating Explanation Methods in Vision Transformers [11.0] 本研究では,textbfInpainting the Gaps (InG) と呼ばれる新しい評価フレームワークを提案する。
InGはPartImageNetデータセットに適用され、ビジョントランスフォーマー(ViT)の3つのトレーニング戦略に対する一般的な説明手法の性能を評価する。
我々の知る限りでは、InGはViT説明法の評価のための最初の半合成フレームワークである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:37:35 GMT)
Uncertainty modeling for fine-tuned implicit functions [10.9] 入射関数は、スパースビューから詳細な物体形状を再構成するコンピュータビジョンにおいて重要な役割を担っている。
暗黙関数における不確実性推定手法であるDropsemblesを導入する。
その結果,Dropsemblesは深層アンサンブルの精度とキャリブレーションレベルを達成するが,計算コストは著しく低いことがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:46:18 GMT)
Crossfusor: A Cross-Attention Transformer Enhanced Conditional Diffusion Model for Car-Following Trajectory Prediction [10.8] 本研究では,自動車追従軌道予測のためのクロスアテンショントランスフォーマー拡張拡散モデル (Crossfusor) を提案する。
車両間の詳細な相互作用と自動車追従ダイナミクスを堅牢な拡散フレームワークに統合し、予測された軌道の精度と現実性を改善する。
NGSIMデータセットの実験結果から、クロスファザーは特に長期予測において最先端のモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:35:47 GMT)
Do Parameters Reveal More than Loss for Membership Inference? [10.8] 最適メンバーシップ推論には、ホワイトボックスアクセスが本当に必要であることを示す。
IHA (Inverse Hessian Attack) による新しいホワイトボックス推論攻撃による検討を行った。
以上の結果から,監査と敵の両方がモデルパラメータへのアクセスの恩恵を受ける可能性が示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:42:28 GMT)
SoK: A Literature and Engineering Review of Regular Expression Denial of Service [10.7] 正規表現拒否(ReDoS)は非対称なサイバー攻撃であり、近年顕著になっている。
本稿では,ReDoS攻撃のアルゴリズム基盤と正規表現エンジンの関連する歴史を概観する。
防衛の導入により、多くの学術的脅威モデルが時代遅れであることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:03:58 GMT)
Language Models as Zero-Shot Trajectory Generators [10.6] 大規模言語モデル(LLM)は最近、ロボットのハイレベルプランナーとして約束されている。
LLMは低レベルの軌道自体に使用する十分な知識を持っていないとしばしば仮定される。
本研究は,LLMが操作タスクに対して,エンドエフェクタの高密度なシーケンスを直接予測できるかどうかを考察する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:57:03 GMT)
Language Models are Surprisingly Fragile to Drug Names in Biomedical Benchmarks [10.4] 我々はRABBITSという新しいデータセットを作成し、ブランド名とジェネリックドラッグ名を取り替えた後、医療ベンチマークのパフォーマンス差を評価する。
MedQA と MedMCQA のオープンソース LLM と API ベースの LLM を比較し,一貫した性能低下が 1-10% に及んでいることを明らかにした。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:09:24 GMT)
Multimodal Needle in a Haystack: Benchmarking Long-Context Capability of Multimodal Large Language Models [10.4] 本稿では,MultiModal Needle-in-a-haystack(MMNeedle)ベンチマークを導入する。
画像ステッチを用いて、入力コンテキスト長をさらに増加させ、サブイメージレベルの検索のためのラベルを自動的に生成するプロトコルを開発する。
我々は、APIベースモデルとオープンソースモデルの両方を含む最先端のMLLMを評価した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:54:06 GMT)
Qibo: A Large Language Model for Traditional Chinese Medicine [10.4] 伝統的な中国医学(TCM)では、理論と近代医学の根本的な違いのような課題がある。
本研究では,継続的事前学習と教師付き微調整を組み合わせた2段階学習手法を提案する。
本研究の特筆すべき貢献は,TCM専用の2Gbコーパスの処理であり,事前学習および微調整データセットの構築である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:52:04 GMT)
SWCF-Net: Similarity-weighted Convolution and Local-global Fusion for Efficient Large-scale Point Cloud Semantic Segmentation [10.3] SWCF-Net という名前の類似度重み付き畳み込みとローカル・グローバル・フュージョン・ネットワークを提案する。
提案手法は計算コストを削減し,大規模点群を効率的に処理できる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:54:46 GMT)
Grokking Group Multiplication with Cosets [10.3] アルゴリズムタスクは、ニューラルネットワークをエンドツーエンドに解釈するための実りあるテスト場であることが証明されている。
我々は、置換群$S_5$ と $S_6$ の算術を解き明かした一層ネットワークを完全にリバースエンジニアリングする。
我々は、モデル機構のリバースエンジニアリングについて述べ、我々の理論が回路の機能の忠実な記述であることを確認した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:44:44 GMT)
CSRT: Evaluation and Analysis of LLMs using Code-Switching Red-Teaming Dataset [10.2] Code-Switching Red-teaming (CSRT)は、大規模言語モデル(LLM)の多言語理解と安全性を同時にテストする、シンプルで効果的なレッドチーム技術である。
CSRTデータセットは、最大10言語を結合した315のコードスイッチングクエリからなり、望ましくない動作を広範囲に引き出す。
CSRTは、既存の英語の手法よりも46.7%のアタックを達成し、既存のマルチリンガル・リピート手法を著しく上回っていることを実証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:08:18 GMT)
Unmixing Noise from Hawkes Process to Model Learned Physiological Events [10.1] この研究は、イベントにおける時間構造の共同学習に対処する新しいアプローチであるUNHaPを導入している。
イベント検出出力を構造化イベントと非構造化イベントの混合として扱うことで、UNHaPは効率的にこれらのプロセスを解き、パラメータを推定する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:57:48 GMT)
BiLO: Bilevel Local Operator Learning for PDE inverse problems [10.0] 偏微分方程式(PDE)の逆問題に対する新しいニューラルネットワークに基づく解法を提案する。
上層部ではPDEパラメータに関してデータ損失を最小限に抑える。
低レベルでは、ニューラルネットワークをトレーニングし、与えられたPDEパラメータの集合の近傍でPDEソリューション演算子を局所的に近似する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:49:42 GMT)
Bridging Design Gaps: A Parametric Data Completion Approach With Graph Guided Diffusion Models [9.9] 本研究では, グラフ注意ネットワークと表層拡散モデルを利用して, 工学設計におけるパラメトリックデータの欠落を解消する生成的計算モデルを提案する。
提案手法は従来の手法,例えばMissForest, HotDeck, PPCA, TabCSDI よりも精度と多様性に優れていた。
グラフモデルは、設計問題の鍵となるアセンブリグラフから複雑なパラメトリック相互依存性を正確にキャプチャし、インプットするのに役立つ。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:03:17 GMT)
A Picture is Worth More Than 77 Text Tokens: Evaluating CLIP-Style Models on Dense Captions [9.9] 我々はDensely Captioned Imagesデータセットを収集し、7805個の天然画像にマスクによる記述を付加した。
画像の特定の部分に関連する正確で信頼性の高いキャプションを用いて、視覚モデルによる画像内容の理解を評価することができる。
標準ベンチマークを進歩させる最新の技術は、我々のsDCIベースのベンチマークの大幅な改善と一致しないことを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:30:51 GMT)
Building Knowledge-Guided Lexica to Model Cultural Variation [9.9] 地域文化の変化を測定することは、人々がどう考え、どのように振る舞うかを照らすことができる。
NLPコミュニティに新たな研究課題を導入する: 言語を用いた地域ごとの文化的構成の変化をどう測定するか?
私たちは、文化的変動をモデル化するための知識誘導レキシカを構築するという、スケーラブルなソリューションを提供しています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:05:43 GMT)
Taming Throughput-Latency Tradeoff in LLM Inference with Sarathi-Serve [9.9] 高スループットと低レイテンシのトレードオフに対処するため,効率的な推論スケジューラであるSarathi-Serveを導入する。
我々の手法は、テール遅延下でのモデルとハードウェア間での推論性能を大幅に改善する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:10:46 GMT)
Modeling groundwater levels in California's Central Valley by hierarchical Gaussian process and neural network regression [9.8] 中央バレー帯水層の3次元岩相テクスチャモデルから学習し,地下水位をモデル化するための新しい機械学習手法を考案した。
本研究では,不規則な井戸データを持つ流域における帯水層応答に対する水文学的理解を補うためにモデル予測がどのように用いられるかを示す。
以上の結果から,2017年と2019年のカリフォルニアの湿潤年は,前回の干ばつによる地下水損失の補充にはほとんど効果がなかったことが示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:51:22 GMT)
Efficient Discovery of Significant Patterns with Few-Shot Resampling [9.7] バイオメディシン、バスケットマーケット分析、ソーシャルネットワークでは、ターゲットと関連するパターンが下位の人口に対して定義されているパターンを見つけることが目的である。
パターンとターゲットの関係を捉える自然な方法は、その統計的意義を考慮し、そのパターンとターゲットの間の独立性の仮説から逸脱を評価することである。
本稿では, 統計的に有意なパターンを同定し, 偽発見の確率を厳密に保証するアルゴリズムFSRを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:49:27 GMT)
Fusion Makes Perfection: An Efficient Multi-Grained Matching Approach for Zero-Shot Relation Extraction [9.7] そこで本研究では,仮想エンティティマッチングを用いて手作業によるアノテーションのコストを削減する手法を提案する。
実験結果から,本手法は従来の最先端技術(SOTA)法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:31:48 GMT)
RoMe: Towards Large Scale Road Surface Reconstruction via Mesh Representation [9.6] RoMeは大規模道路面の堅牢な再構築を目的とした新しいフレームワークである。
我々の評価は、速度、正確性、堅牢性の観点から、RoMeの優位性を裏付けるものである。
RoMeの機能は単なる再構築を超えて、自動運転アプリケーションにおけるオートラベルタスクに重要な価値を提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:55:37 GMT)
Mitigating Unhelpfulness in Emotional Support Conversations with Multifaceted AI Feedback [9.6] 感情支援のための多面的AIフィードバック(Muffin)で不健康を緩和する新しいモデル非依存フレームワークを提案する。
Muffin氏は、複数の要因を考慮して、特定のモデルによって生成された応答の有用性を評価するために、多面的なAIフィードバックモジュールを使用している。
以上の結果から,Muffinは応答頻度と関連性をわずかに増加させながら,非ヘルペス反応の発生を効果的に軽減することが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:08:20 GMT)
Online Cascade Learning for Efficient Inference over Streams [9.5] 大規模言語モデル(LLM)は、データストリームに関する複雑なクエリに応答する自然な役割を持つ。
この課題に対処する最初のアプローチであるオンラインカスケード学習を提案する。
我々は,オンラインでカスケードを学習するタスクを模倣学習問題として定式化する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:54:36 GMT)
FinTruthQA: A Benchmark Dataset for Evaluating the Quality of Financial Information Disclosure [9.5] 本稿では、金融Q&Aデータにおける情報開示の自動品質評価のための高度な自然言語処理(NLP)技術を評価するためのベンチマークFinTruthQAを構築する。
FinTruthQAは6000の現実世界の財務Q&Aエントリで構成され、各Q&Aは4つの概念的側面に基づいて手動で注釈付けされた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:25:02 GMT)
Making Alice Appear Like Bob: A Probabilistic Preference Obfuscation Method For Implicit Feedback Recommendation Models [9.5] 本稿では,ユーザの嗜好データに対する確率的難読化手法であるSBOを紹介する。
SBOを3つの最先端レコメンデーションモデルと2つの一般的なデータセットに適用する。
我々の実験により、SBOは、精度-プライバシトレードオフに関して、同等のアプローチより優れていることが判明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:05:36 GMT)
Look Further Ahead: Testing the Limits of GPT-4 in Path Planning [9.5] 大きな言語モデル(LLM)は、様々なタスクで印象的な機能を示している。
提案するベンチマークは,複雑な環境でのパス計画スキルを体系的にテストする。
フレーミングはPythonのコードとして促進され、長い軌道上のタスクを分解することで、GPT-4の経路計画の有効性が向上することがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:12:56 GMT)
README: Bridging Medical Jargon and Lay Understanding for Patient Education through Data-Centric NLP [9.4] 医療用語を患者に親しみやすい平易な言語に簡略化することを目的とした,レイ定義の自動生成という新たなタスクを導入する。
このデータセットは、5万以上のユニークな(医療用語、日常の定義)ペアと30万の言及からなる。
また、データフィルタリング、拡張、選択を相乗化してデータ品質を改善する、データ中心のHuman-AIパイプラインも開発しました。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:12:24 GMT)
Universal bound on Ergotropy and No-Go Theorem by the Eigenstate Thermalization Hypothesis [9.4] 量子多体系から抽出可能な最大処理(エルゴトロピー)は、初期状態の局所熱水性と量子演算による局所エントロピー減少によって制約されることを示す。
その結果, 量子熱力学, 第2法則, 熱化の2つの独立に研究された概念を, 作業抽出の資源としての多体系系内相関を通じて橋渡しした。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:20:33 GMT)
Fidelity of Wormhole Teleportation in Finite-qubit Systems [9.3] ホログラフィーの双対性は、重力と時空が強く相互作用する系から現れることを記述し、重力物理学の実験的な研究のための自然な道のりを提供する。
顕著な例はワームホールテレポーテーションプロトコルによるワームホールのシミュレーションである。
我々は、$N$-qubitシステムにおけるワームホールテレポーテーションの忠実度を計算するための理論的枠組みを開発する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:46:14 GMT)
Adapters Mixup: Mixing Parameter-Efficient Adapters to Enhance the Adversarial Robustness of Fine-tuned Pre-trained Text Classifiers [9.3] AdpMixupは、アダプタによる微調整とミックスアップによる敵の増強を組み合わせて、堅牢な推論のために既存の知識を動的に活用する。
実験によると、AdpMixupは、既知の攻撃と未知の攻撃の両方において、トレーニング効率と堅牢性の間の最良のトレードオフを達成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:54:18 GMT)
Improving Generalization of Neural Vehicle Routing Problem Solvers Through the Lens of Model Architecture [9.2] 本稿では,ESF(Scaling Factor)とDS(Distributed-Specific)デコーダを提案する。
ESFは、様々な大きさのVRPを解く際に、トレーニング中に発見された慣れ親しんだものに対して、モデルの注意重みパターンを調整する。
DSデコーダは、複数の補助光デコーダを通して複数のトレーニング分布パターンのVRPを明示的にモデル化し、モデル表現空間を拡大する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:02:57 GMT)
Flexible Parametric Inference for Space-Time Hawkes Processes [9.2] 本稿では,これらのデータに基づいて,時空ホークスプロセスの強度関数に関わるカーネル関数のパラメータを高速かつ柔軟なパラメトリック推論手法を開発することを目的とする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:18:18 GMT)
Long-time asymptotics of noisy SVGD outside the population limit [9.2] 我々はStein Variational Gradient Descent (SVGD) の雑音変動の長時間挙動について検討した。
特に、ノイズSVGDは、SVGDで観測される分散崩壊を確実に回避する。
我々のアプローチは、ノイズの多いSVGDの軌道がマッケイン・ブラソフ過程によって記述された軌道とよく似ていることを示すものである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:00:51 GMT)
Hacking Encrypted Wireless Power: Cyber-Security of Dynamic Charging [9.1] 本稿では,暗号化周波数可変無線電力伝送の原理を復号する手法を提案する。
スイッチトキャパシタアレイは、広い周波数範囲の受信機を適応的に補償する。
抽出された非無視エネルギーは問題となるだろうが、認証された受信機が得るエネルギーの78%から84%を盗むことに成功した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:35:45 GMT)
Video Frame Interpolation for Polarization via Swin-Transformer [9.1] ビデオフレーム補間 (VFI) は広く研究され、実証されてきたが、偏光への応用は未解明のままである。
本研究では,Swin-Transformerに基づくマルチステージ・マルチスケールネットワークSwin-VFIを提案する。
実験の結果,全てのタスクにおいて,提案手法の再現精度が優れていることが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:48:54 GMT)
Precision measurement for open systems by non-hermitian linear response [9.1] 開系に非一意的に符号化された散逸パラメータに対する推定精度の低い値が得られたことを示す。
この低い境界は、最適な初期状態と検出演算子を見つけるのに役立つ。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:51:02 GMT)
Improving Multi-Agent Debate with Sparse Communication Topology [9.0] マルチエージェントの議論は、推論や事実性タスクのための大規模言語モデルの品質向上に有効であることが証明されている。
本稿では,マルチエージェントシステムにおける通信接続の効果について検討する。
GPTモデルとMistralモデルを用いた実験により,疎通信トポロジを利用したマルチエージェントの議論が同等あるいは優れた性能を達成できることが判明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:33:09 GMT)
DiTTo-TTS: Efficient and Scalable Zero-Shot Text-to-Speech with Diffusion Transformer [9.0] 市販の事前学習テキストと音声エンコーダを利用した効率よくスケーラブルな拡散変換器(DiT)を提案する。
提案手法は, 音声表現の総長の予測により, テキスト・音声アライメントの課題に対処する。
トレーニングデータセットとモデルサイズはそれぞれ82K時間と790Mパラメータにスケールします。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:25:57 GMT)
A Unified Framework and Dataset for Assessing Societal Bias in Vision-Language Models [9.0] 視覚言語モデル(VLM)における性別・人種・年齢バイアスを統一的に評価するための枠組みを提案する。
我々は、異なる専門分野の性別、人種、年齢情報を意図的に隠蔽する高品質な合成データセットを生成する。
このデータセットには、各専門職の行動に基づく記述が含まれており、視覚言語モデル(VLM)における社会的バイアスを評価するためのベンチマークとして機能している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:35:35 GMT)
Large Language Models are In-context Teachers for Knowledge Reasoning [8.9] CoT(Chain-of- Thought)プロンプトは、単に情報検索以上の情報を必要とするクエリを推論するために、コンテキストにおいて大きな言語モデル(LLM)を教える。
本研究は,LLMが知識推論に有効であるかどうかを考察する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:57:38 GMT)
IDs for AI Systems [8.8] IDは、AIシステムが社会に浸透する世界を管理するのに役立つかもしれない。
本稿では,AIシステムのテキストbfincesにIDを付加するフレームワークを提案する。
我々は、重要なアクターからのIDに対する大きな需要があるかもしれないと論じている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:48:11 GMT)
AuditLLM: A Tool for Auditing Large Language Models Using Multiprobe Approach [8.6] AuditLLMは様々な大規模言語モデル(LLM)のパフォーマンスを方法論的に監査するために設計された新しいツールである。
堅牢で信頼性があり、一貫性のあるLCMは、同じ質問の可変なフレーズ付きバージョンに対する意味論的に類似した応答を生成することが期待されている。
あるレベルの矛盾が潜在的なバイアス、幻覚、その他の問題の指標であることが示されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:24:41 GMT)
PEPit: computer-assisted worst-case analyses of first-order optimization methods in Python [8.6] PEPitはPythonパッケージで、コンピュータ支援による一階最適化手法の最悪のケース解析を可能にする。
パッケージはSDPモデリング部品を処理し、最悪のケース解析は標準解法を介して数値的に行われる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:40:20 GMT)
Balanced Filtering via Disclosure-Controlled Proxies [8.5] 本研究では,グループメンバーシップが利用できない場合や,デプロイ時に使用が禁止された場合,センシティブなグループに対してバランスの取れたコホートを収集する問題について検討する。
デプロイ時の収集機構は, 基本レートだけで確認できるほど, 個々のサンプルのグループメンバシップについてはあまり明らかになっていない。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:21:28 GMT)
Few-Shot Recognition via Stage-Wise Augmented Finetuning [8.3] ほとんどショット認識は、事前定義された概念のいくつかのラベル付き例で分類モデルを訓練することを目的としていない。
Retrieval-augmented learningは、下流の概念に関連する外部データから検索および学習することで、ゼロショット精度を高める。
数発の認識にALを応用するための新しい課題と機会を提示する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:27:14 GMT)
Approximate Contraction of Arbitrary Tensor Networks with a Flexible and Efficient Density Matrix Algorithm [8.3] 低ランク近似を用いてテンソルネットワークの収縮を効率的に近似する手法を提案する。
提案アルゴリズムは,低ランク近似を行う場合,環境の大部分を組み込む柔軟性を有する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:55:33 GMT)
Distributed Maximum Consensus over Noisy Links [8.3] 我々は、ノイズロスト分散最大コンセンサス(RD-MC)と呼ばれる分散アルゴリズムを導入する。
提案手法では,分散最適化問題として最大コンセンサス問題を再定義する。
RD-MCは,既存の最大合意アルゴリズムに比べて通信リンクノイズに対してかなり頑健であることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:38:59 GMT)
On the Feasibility of Fidelity$^-$ for Graph Pruning [8.2] 忠実度は入力グラフの重要でない部分を取り除いた後に出力差を測定する。
このことは自然の疑問を提起する:「忠実さはグラフ解析のためのグローバルな(ソフトな)マスクを誘発するだろうか?
本研究では,局所的な説明からグローバルエッジマスクを構築するための効果的なフレームワークであるFidelity$-$-inspired Pruning (FiP)を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:05:00 GMT)
STAR: SocioTechnical Approach to Red Teaming Language Models [8.1] STARは、大きな言語モデルの赤いチーム安全性のための現在のベストプラクティスを改善する社会技術フレームワークである。
これは、人間のレッドチームのためにパラメータ化された命令を生成することで、ステアビリティを高め、リスク表面のカバレッジを改善する。
特定のグループに対する害を評価するために、人口統計と一致させることで信号品質を改善し、より敏感なアノテーションをもたらす。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:16:45 GMT)
An Initial Study Review of Designing a Technology Solution for Women in Technologically Deprived Areas or Low Resource Constraint Communities [8.1] うつ病はガーナの多くの女性に影響を及ぼす重大な問題である。
女性の携帯電話へのアクセスは、文化的、社会的、経済的制約によって制限されている。
本稿では、これらの課題に対処するために、非構造化補助サービスデータ(USSD)技術の可能性についてレビューする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:48:46 GMT)
Large Language Models Play StarCraft II: Benchmarks and A Chain of Summarization Approach [8.0] VoyageやMetaGPTのような大規模言語モデル(LLM)エージェントは、複雑なタスクを解く大きな可能性を示す。
本稿では,生観測処理のための単一フレーム要約と,ゲーム情報解析のための多フレーム要約を含む要約手法を提案する。
1. LLMはStarCraft IIのシナリオに対処するのに必要な知識と複雑な計画能力を持っている; 2. 人間の専門家は、LLMエージェントのパフォーマンスは、StarCraft IIを8年間プレイした平均的なプレイヤーのそれに近いと考えている; 3. LLMエージェントはAIで構築されたエージェントを倒すことができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:04:43 GMT)
MiniConGTS: A Near Ultimate Minimalist Contrastive Grid Tagging Scheme for Aspect Sentiment Triplet Extraction [7.8] 本稿では,最小限のタグ付け方式と新しいトークンレベルのコントラスト学習戦略を統合することにより,事前訓練された表現を改善し,活用する手法を提案する。
提案手法は,最先端技術と比較して同等あるいは優れた性能を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:01:11 GMT)
Multi-Dimensional Pruning: Joint Channel, Layer and Block Pruning with Latency Constraint [7.8] 既存のプルーニング手法はチャネルプルーニングに限られており、アグレッシブパラメータ削減に苦慮している。
チャネル, 層, ブロック間のプルーニングを協調的に最適化する新しい多次元プルーニングフレームワークを提案する。
3次元物体検出において,StreamPETRを45%のプルーニング比で刈り上げ,FPS (37.3 vs. 31.7) とmAP (0.451 vs. 0.449) を高密度ベースラインより高めることにより,新たな最先端技術を確立する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:40:09 GMT)
Efficient Algorithms for Learning Monophonic Halfspaces in Graphs [7.6] 我々は、教師付き、オンライン、アクティブな設定において、モノフォニックなハーフスペースを学習するためのいくつかの新しい結果を証明した。
我々の主な結果は、モノフォニック半空間は、n = |V(G)|$ の時間において、ほぼ最適に複雑に学習できるということである。
また、概念クラスは遅延$operatornamepoly(n)$で列挙でき、経験的リスクは2ω(G)operatornamepoly(n)$で実行可能であることも示します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:04:58 GMT)
COT Flow: Learning Optimal-Transport Image Sampling and Editing by Contrastive Pairs [7.5] Contrastive Optimal Transport Flow (COT Flow) は、ゼロショット編集の柔軟性を向上し、高速かつ高品質な生成を実現する新しい手法である。
品質の面では、COT Flowは従来の最先端のイメージ・ツー・イメージ(I2I)翻訳法と比較して1ステップで競合結果を生成することができる。
COT Flowは、従来の最先端の未実装画像画像変換法(I2I)と比較して、競争力のある結果を生成することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:02:20 GMT)
Balancing Embedding Spectrum for Recommendation [7.5] 表現は埋め込み空間全体の部分空間にまたがる傾向を示し、最適解が得られ、モデルの容量が減少することを示した。
トレーニング中の埋め込みのスペクトル分布のバランスをとるために,DirectSpecと呼ばれる新しい手法を提案する。
また,無関係なサンプルをより効率的に最適化するために,自己ペース勾配を用いた拡張型DirectSpec+を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:59:43 GMT)
TIFG: Text-Informed Feature Generation with Large Language Models [7.4] テキスト・インフォームド・フィーチャー・ジェネレーション(TIFG)は,テキストベースの新しい特徴生成フレームワークである。
TheTIFGは、Retrieval Augmented Generation (RAG)技術を用いて、外部知識内の可能性のある機能を取得することで、機能を生成する。
下流タスクにおける様々な実験は、我々のアプローチが高品質で有意義な特徴を生み出すことができ、既存の手法よりもはるかに優れていることを示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:29:14 GMT)
Analysing zero-shot temporal relation extraction on clinical notes using temporal consistency [7.4] 本稿では, バイオメディカルテキストに着目したゼロショットセッティングにおける時間的関係抽出のための最初の研究について述べる。
我々は2種類のプロンプトと5つのLDMを用いて、2つの事象間の時間的関係について応答を得る。
実験により, LLMはF1スコアの点において, 微調整された特殊モデルよりも性能が劣るゼロショット設定に苦しむことが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:53:21 GMT)
PrAViC: Probabilistic Adaptation Framework for Real-Time Video Classification [7.4] 本稿では,ビデオデータのオンライン分類問題を扱うための,新しい,統一的で理論に基づく適応フレームワークを提案する。
本研究の最初の段階は、シーケンシャルデータの分類理論のための堅牢な数学的基盤を確立することである。
次のフェーズでは、オフラインモデルをオンラインおよびリカレント操作に適応するための、簡単で容易に実装可能な方法を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:56:15 GMT)
RO-SVD: A Reconfigurable Hardware Copyright Protection Framework for AIGC Applications [7.4] AIコンテンツのためのブロックチェーンベースの著作権トレーサビリティフレームワークを提案する。
我々のフレームワークは、既存のAIアクセラレーションデバイスで簡単に構築できる。
これは、AI生成コンテンツに特化した著作権トレーサビリティを議論し、実装する最初の実用的なハードウェア研究である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:38:57 GMT)
Socially Interactive Agents for Robotic Neurorehabilitation Training: Conceptualization and Proof-of-concept Study [7.4] 我々は、神経リハビリテーショントレーニング中にパーソナライズされた院外援助を提供するAIベースのシステムを導入する。
専門職の助けを借りて、想定されたシステムは、個々の患者の独自のリハビリテーション要件を満たすように設計されている。
我々のアプローチは、対話型社会的に認識された仮想エージェントを神経リハビリテーションロボットフレームワークに統合することである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:07:05 GMT)
Ultrasound Imaging based on the Variance of a Diffusion Restoration Model [7.4] 本稿では, 線形直列モデルと学習に基づく先行モデルを組み合わせたハイブリッド再構成手法を提案する。
我々は,高品質な画像再構成を実現するための分散イメージング手法の有効性を実証し,合成,in-vitro,in-vivoデータの実験を行った。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:25:42 GMT)
Incentivizing Quality Text Generation via Statistical Contracts [7.3] 品質をインセンティブ化するための,パフォーマンス向上のための契約ベースのフレームワークを提案する。
エージェントがコストのかかる推論を用いてテキストを生成するプリンシパルエージェントゲームについて検討する。
コストロスの契約は、コストを意識した契約に比べて、客観的価値の限界的な増加を犠牲にしています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:30:58 GMT)
MASAI: Modular Architecture for Software-engineering AI Agents [7.3] ソフトウェア工学における複雑な問題を解決する一般的な方法は、問題を複数のサブプロブレムに分割することである。
我々は,ソフトウェア工学AI(MASAI)エージェントのためのモジュールアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:19:51 GMT)
Faces of Experimental Pain: Transferability of Deep Learned Heat Pain Features to Electrical Pain [7.2] 本研究では,ある種類の実験的痛みに対する深層学習の特徴表現が他の痛みに伝達できるかどうかを検討する。
チャレンジデータセットには、電気的痛みの強度が異なる65人の参加者から収集されたデータが含まれている。
提案手法では,BioVidデータセットに基づいてトレーニングされた既存の熱痛畳み込みニューラルネットワーク(CNN)を特徴抽出器として活用する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:51:54 GMT)
P-ICL: Point In-Context Learning for Named Entity Recognition with Large Language Models [7.0] 近年,大規模な言語モデル (LLM) の台頭により,実演サンプルを使わずに名前付きエンティティ認識 (NER) を直接実現できるようになった。
標準ICLは、LLMがタスク命令、フォーマット、入力ラベルマッピングを理解するのにのみ役立つが、NERタスク自体の特異性を無視する。
LLMでNERをよりよく実現するための新しいプロンプトフレームワークであるP-ICLを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:38:25 GMT)
Brownian Gaussian Unitary Ensemble: non-equilibrium dynamics, efficient $k$-design and application in classical shadow tomography [7.0] 我々は、ガウスユニタリアンサンブル(BGUE)のブラウン一般化を構築し、広範囲に研究する。
様々な1-replica変数と2-replica変数に対して、有限$N$と$t$で明示的な解析式を導出する。
BGUEにおける超高速スクランブル, 高温の出現, およびレプリカワームホール様の寄与について検討した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:36:18 GMT)
Correspondence Free Multivector Cloud Registration using Conformal Geometric Algebra [6.9] 共形幾何代数における対応自由多ベクトル雲登録の問題に対処する新しい理論的アプローチを提案する。
入力マルチベクタに直接アクセスせずに$(i)$で登録を実行する。
このようにして、登録プロセスにおける対応の解決を明示的に回避することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:50:04 GMT)
Breaking Boundaries: Investigating the Effects of Model Editing on Cross-linguistic Performance [6.9] 本稿では,多言語文脈における知識編集技術を検討することにより,言語的平等の必要性を戦略的に識別する。
Mistral, TowerInstruct, OpenHathi, Tamil-Llama, Kan-Llamaなどのモデルの性能を,英語,ドイツ語,フランス語,イタリア語,スペイン語,ヒンディー語,タミル語,カンナダ語を含む言語で評価した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:54:27 GMT)
Model Adaptation for Time Constrained Embodied Control [6.9] モジュラーモデル適応を用いた時間制約を考慮した具体化制御フレームワークであるMoDeCを提案する。
モジュールネットワーク上の動的ルーティングとして資源および時間制限の様々な運用条件に対するモデル適応を定式化し、これらの条件をマルチタスクの目的の一部として組み込む。
ロボット操作と自律運転における時間制約の両面において,MoDeCのロバスト性を評価した結果,他のモデル適応手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:07:30 GMT)
LiLiuM: eBay's Large Language Models for e-commerce [6.8] 大規模言語モデル (LLM) のLiLiuM シリーズについて紹介する: 1B, 7B, 13B パラメータモデル。
これにより、eBayは、ライセンス、データ、語彙、アーキテクチャを含むモデルのすべての側面を完全にコントロールできる。
LiLiuM LLMは、一般およびeコマースドメインから3兆個の多言語テキストのトークンで訓練されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:45:41 GMT)
Explainable assessment of financial experts' credibility by classifying social media forecasts and checking the predictions with actual market data [6.8] 本稿では,自然言語処理と機械学習を組み合わせた,ソーシャルメディアの財務担当者に対する信頼性評価ソリューションを提案する。
コントリビュータの評判は、資産価値に基づいて予測を自動的に分類し、これらの予測を実際の市場データで検証することで評価される。
このシステムは、関連する特徴のモデルに依存しない分析に基づいて、その決定に関する自然言語による説明を提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:08:03 GMT)
Fixed points of nonnegative neural networks [6.7] まず、非負の重みとバイアスを持つ非負のニューラルネットワークは、モノトニックで(弱く)スケーラブルなマッピングとして認識できることを示す。
非負の重みとバイアスを持つ非負のニューラルネットワークの固定点集合の形状が間隔であることを証明する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:06:39 GMT)
A Clipped Trip: the Dynamics of SGD with Gradient Clipping in High-Dimensions [6.7] 本研究では,大次元内在型モデルとデータセット依存型次元概念の極限における学習力学の理論的解析を開発する。
ガウスノイズクリッピングではSGD性能が向上しないことを示す。
他のノイズの多い設定では、クリップングしきい値のチューニングにメリットがある。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:50:22 GMT)
Joint Linked Component Analysis for Multiview Data [6.6] データビュー毎に関節構造と個々の構造が存在する行列分解モデルを定式化する。
次に、新たなペナルティ項を持つ目的関数を提案し、同時推定とランク選択を実現する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:25:23 GMT)
Self-Supervised Learning of Time Series Representation via Diffusion Process and Imputation-Interpolation-Forecasting Mask [6.6] Time Series Diffusion Embedding (TSDE)は、最初の拡散ベースのSSL TSRLアプローチである。
TSデータをImputation-Interpolation-Forecasting (IIF)マスクを使用して観察およびマスクされた部分に分割する。
トレーニング可能な埋め込み機能を適用し、クロスオーバー機構を備えたデュアル直交トランスフォーマーエンコーダを備えている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:54:51 GMT)
Deep Learning methodology for the identification of wood species using high-resolution macroscopic images [6.5] 本研究は,木材の高分解能マクロ画像による木材種の同定の自動化に寄与する。
本稿では,TDLI-PIV を省略した Patch-based Inference Voting Method を用いたTimber Deep Learning Identificationを提案する。
このデータセットには2120枚の木材の画像が含まれており、37種の木を法的に保護している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:31:57 GMT)
Attention Meets Post-hoc Interpretability: A Mathematical Perspective [6.5] 簡単な注意に基づくアーキテクチャを数学的に研究し、ポストホックとアテンションに基づく説明の違いを指摘する。
それらとは全く異なる結果が得られており、その制限にもかかわらず、ポストホック法は単に注意重みを調べるだけでなく、より有用な洞察を捉えることができることを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:18:30 GMT)
MetaGPT: Merging Large Language Models Using Model Exclusive Task Arithmetic [6.5] textbfGPTスケールモデルをマージするための textbfModel textbfExclusive textbfTask textbfArithmetic を提案する。
提案するMetaGPTは,データに依存しず,検索処理を回避し,低コストで実装が容易なメタGPTである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:12:45 GMT)
(Unfair) Norms in Fairness Research: A Meta-Analysis [6.4] 我々は,AIフェアネスと倫理に関する2つの主要なカンファレンスから,アルゴリズムフェアネス論文のメタ分析を行う。
まず、米国中心の視点が公正調査全体において支配的な傾向を示す。
第二に、公正性の研究は、人間のアイデンティティの二項結合に広く依存している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:14:47 GMT)
Pretraining Vision-Language Model for Difference Visual Question Answering in Longitudinal Chest X-rays [6.4] 差分視覚質問応答(diff-VQA)は、画像間の差分に基づいて複雑な質問に答えることを必要とする課題である。
以前はdiff-VQAタスクのための特定のネットワークアーキテクチャの設計に重点が置かれていたが、モデルの性能を高める機会がなかった。
本稿では,diff-VQAタスクのための自然および縦部胸部X線データに基づいて,PLURALと呼ばれる新しいVLMを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:57:55 GMT)
Making Old Things New: A Unified Algorithm for Differentially Private Clustering [6.3] 20年前のアルゴリズムは、いずれのモデルでも、わずかに修正可能であることを示す。
これは統一された図を提供する: ほとんどすべての既知結果とマッチングする一方で、いくつかの改善を可能にします。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:31:53 GMT)
Delay Embedding Theory of Neural Sequence Models [6.3] 力学系における遅延埋め込みの理論は、観測されていない変数は少数の観測された変数の履歴から復元できることを証明している。
シーケンスモデルの容量を測定し、観測されていないダイナミクスを再構築する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:07:16 GMT)
HARE: HumAn pRiors, a key to small language model Efficiency [6.3] 人間の先駆者は、ディープラーニングでデータを効率的に活用する上で重要な役割を担います。
既存のSmall Language Modelは、主にWebスクラッドな大規模トレーニングデータに依存している。
我々は、データ構築に人類の優先事項を活用する原則を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:56:03 GMT)
Investigating Annotator Bias in Large Language Models for Hate Speech Detection [6.3] 本稿では,ヘイトスピーチデータに注釈をつける際に,Large Language Models (LLMs) に存在するバイアスについて考察する。
具体的には、これらのカテゴリ内の非常に脆弱なグループを対象として、アノテータバイアスを分析します。
我々は、この研究を行うために、私たちのカスタムヘイトスピーチ検出データセットであるHateSpeechCorpusを紹介します。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:18:31 GMT)
From Intentions to Techniques: A Comprehensive Taxonomy and Challenges in Text Watermarking for Large Language Models [6.2] 本稿では,透かし技術設計の背景にある様々な視点を統一的に概観する。
我々は異なる透かし技術の背後にある特定の意図に基づいて研究を分析する。
テキスト作成者保護の研究を促進するために,テキスト透かしにおけるギャップとオープンな課題を強調した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:09:31 GMT)
Solving the Inverse Problem of Electrocardiography for Cardiac Digital Twins: A Survey [6.2] ECG逆問題の解決は、正確な仮想心臓モデリングに不可欠である。
近年の進歩は、仮想心臓モデリングの強化に大きく貢献している。
本稿では,ECG逆問題の解法を包括的に検討することを目的とする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:57:14 GMT)
Measurement Simplification in ρ-POMDP with Performance Guarantees [6.1] 不確実性の下での意思決定は、不完全な情報で行動する自律システムの中心にある。
本稿では,高次元観測空間を分割することで,効率的な意思決定手法を提案する。
境界は適応的で、計算効率が良く、元の解に収束していることが示される。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:47:47 GMT)
Attention-Guided Lidar Segmentation and Odometry Using Image-to-Point Cloud Saliency Transfer [6.1] SalLiDARは3次元セマンティックセマンティックセマンティクスモデルであり、セマンティクス性能を向上させるために、サリエンシ情報を統合する。
SalLONetは、SalLiDARのセマンティックおよびサリエンシ予測を用いて、より優れたオドメトリー推定を実現する、自己監督型サリエンシ誘導型LiDARオドメトリーネットワークである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:44:02 GMT)
Matching Query Image Against Selected NeRF Feature for Efficient and Scalable Localization [6.1] 提案するMatLoc-NeRFは,選択したNeRF特徴を用いた新しいマッチングベースのローカライゼーションフレームワークである。
クエリ画像にマッチする情報的NeRF特徴を識別する学習可能な特徴選択機構を使用することで、効率性に対処する。
パブリックな大規模データセットの評価は、既存のNeRFベースのローカライゼーション手法と比較して、MatLoc-NeRFの方が効率と精度が優れていることを示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:29:21 GMT)
Simple Yet Efficient: Towards Self-Supervised FG-SBIR with Unified Sample Feature Alignment [6.0] FG-SBIRは、埋め込み空間におけるスケッチと対応する画像の距離を最小化することを目的としている。
両モード間のギャップを狭めるための,単純かつ効率的な手法を提案する。
このフレームワークは,CNNおよびViTベースのバックボーンにおいて優れた結果が得られる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:49:12 GMT)
Adaptive Uncertainty Quantification for Trajectory Prediction Under Distributional Shift [6.0] 軌道予測モデルは、有限未来の軌道とその関連する不確実性の両方をオンライン環境で推測することができる。
本研究では、予測された軌道の不確かさを定量化するために、分散シフトフレームワークCUQDSのコンフォーマル不確実性定量化を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:25:36 GMT)
Feasibility of Federated Learning from Client Databases with Different Brain Diseases and MRI Modalities [5.8] MRIの脳病変のモデルは通常、特定の疾患のために開発され、事前に定義されたMRIモダリティのセットでデータに基づいて訓練される。
このトレーニングパラダイムは、モデルが異種データベースから学ぶことの恩恵を受けない。
モデルとトレーニング戦略の適切な,シンプルな,実践的な変更を組み合わせることで,有望な結果を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:16:18 GMT)
OffensiveLang: A Community Based Implicit Offensive Language Dataset [5.8] ヘイトスピーチや攻撃的な言語は、明示的な形と暗黙的な形の両方に存在する。
OffensiveLangはコミュニティベースの暗黙的な攻撃的な言語データセットである。
本稿では、暗黙の攻撃的言語を効果的に生成するプロンプトベースのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:23:06 GMT)
WaDec: Decompile WebAssembly Using Large Language Model [5.7] WebAssembly(略してWasm)がWeb開発の基礎として登場した。
その利点にもかかわらず、Wasmのバイナリの性質は開発者と研究者に重大な課題をもたらしている。
We introduced a novel approach, WaDec, which is a first use of a fine-tuned LLM to interpret and decompile Wasm binary code。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:08:30 GMT)
REPOEXEC: Evaluate Code Generation with a Repository-Level Executable Benchmark [5.6] リポジトリレベルのスケールでコード生成を評価するための新しいベンチマークである methodnamews を紹介する。
methodnamewsは、要求を検証し、ハイカバレッジテストケースを動的に生成するメカニズムを組み込む自動システムを提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:45:22 GMT)
Metacognitive AI: Framework and the Case for a Neurosymbolic Approach [5.5] 我々は、TRAPと呼ばれるメタ認知人工知能(AI)を理解するための枠組みを導入する。
我々は、これらの局面のそれぞれについて議論し、メタ認知の課題に対処するために、ニューロシンボリックAI(NSAI)をどのように活用できるかを探求する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:30:46 GMT)
Learning to Check: Unleashing Potentials for Self-Correction in Large Language Models [5.5] 我々は,タスクチェックのためのトレーニングデータを構築することで,大規模言語モデル(LLM)の自己チェック能力を向上させることを目指している。
ステップCoTチェック(Step CoT Check)と呼ばれる特殊なチェックフォーマットを提案する。
実験により、"Step CoT Check"フォーマットによる微調整により、LCMの自己チェックと自己補正能力が大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:24:29 GMT)
Whose Emotions and Moral Sentiments Do Language Models Reflect? [5.5] 言語モデル(LM)は、ある社会集団の視点を他のグループよりも良く表現することが知られている。
両イデオロギー群とLMの相違点が有意である。
特定のイデオロギー的な視点でLMを操った後も、モデルのミスアライメントとリベラルな傾向は持続する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:41:37 GMT)
Not Eliminate but Aggregate: Post-Hoc Control over Mixture-of-Experts to Address Shortcut Shifts in Natural Language Understanding [5.4] 本稿では,各専門家が比較的異なる潜伏特徴を捉えていると仮定して,実験結果の混合予測を悲観的に集約する手法を提案する。
実験結果から,専門家に対するポストホック制御は,ショートカットにおける分布シフトに対するモデルのロバスト性を大幅に向上させることが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:00:04 GMT)
Robust 6DoF Pose Estimation Against Depth Noise and a Comprehensive Evaluation on a Mobile Dataset [5.4] モバイルデバイスによる6DoFのポーズ推定は、ロボット工学、拡張現実、デジタルツインローカライゼーションの応用の基礎となっている。
DTTDNetと呼ばれるトランスフォーマーベースの6DoFポーズ推定手法を提案する。
提案手法は, 各種測定ノイズに対して優れたロバスト性を示し, ノイズ測定に対するロバスト性に関する新しいベンチマークを設定できる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:08:05 GMT)
Novel Fundus Image Preprocessing for Retcam Images to Improve Deep Learning Classification of Retinopathy of Prematurity [5.4] 未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、目の網膜に損傷があるため失明する眼疾患である。
本稿では,事前学習フレームワークを用いた新しい基礎前処理手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:41:54 GMT)
Interpretable modulated differentiable STFT and physics-informed balanced spectrum metric for freight train wheelset bearing cross-machine transfer fault diagnosis under speed fluctuations [5.4] クロスマシントランスファー診断(pyDSN)ネットワークは、時間変化速度でドメイン不変および離散的特徴を学習するために提案される。
分類計量と領域差測度に加えて、物理インフォームド計量と呼ばれる第3の種類の計量を創造的に導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:43:24 GMT)
Striking Gold in Advertising: Standardization and Exploration of Ad Text Generation [5.4] 本稿では,ATG のタスクを標準化するためのベンチマークデータセット CAMERA を提案する。
我々の実験は、現状と残りの課題を示している。
また、ATGの既存の指標とLLMに基づく評価器が人間の評価とどのように一致しているかについても検討する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:37:32 GMT)
Slicing Through Bias: Explaining Performance Gaps in Medical Image Analysis using Slice Discovery Methods [5.3] 我々はSlice Discovery Methodsを用いて、観測された性能格差の原因に関する仮説とデータの解釈可能な未実行部分集合を同定する。
本研究は, 仮説定式化におけるSDMの有効性を実証し, 既往の男女間パフォーマンスの相違について解説する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:08:46 GMT)
Deploying scalable traffic prediction models for efficient management in real-world large transportation networks during hurricane evacuations [5.2] 本稿では,長期の混雑パターンと短期の速度パターンの両方を抽出する予測モデリングシステムを提案する。
このフレームワークは、異質な人間の行動、限られた避難データ、ハリケーンイベントの不確実性によって引き起こされる問題に対処するために設計されている。
ルイジアナ州の現実の交通予測システムで展開されたこのモデルは,長期的混雑状態を予測する上で,82%の精度を達成した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:59:44 GMT)
Domain Camera Adaptation and Collaborative Multiple Feature Clustering for Unsupervised Person Re-ID [5.2] 教師なしの人物再識別(re-ID)は、限られたデータが利用可能なオープンワールドシナリオ設定のために、多くの注目を集めている。
既存の教師なし手法は、しばしば目に見えない領域でうまく一般化できないが、教師なし手法は、主に複数の粒度情報がなく、確認バイアスに悩まされる傾向がある。
本稿では,1)ラベル付きソースドメイン上で教師なしドメイン適応を行い,2)ラベル付きターゲットドメイン上での潜在的類似点のマイニングを行う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:38:12 GMT)
The Benefits of Power Regularization in Cooperative Reinforcement Learning [5.1] 我々は、協調RLシステムにおける電力集中を明示的に規則化すると、単一のエージェントの故障に対してより堅牢なシステムが得られると主張している。
我々は,このパワーレギュラー化目標に向けて,SBPR(Sample Based Power Regularization)とPRIM(Intrinsic Motivation)によるパワーレギュラー化(Power Regularization)の2つのアルゴリズムを提案する。
実験の結果、両アルゴリズムがタスク報酬とパワーのバランスをとっており、パワーの低下と破滅的な事象の回避に繋がることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:10:37 GMT)
A Systematic Analysis of Large Language Models as Soft Reasoners: The Case of Syllogistic Inferences [5.1] 我々は、論理学と認知心理学において広範囲に研究されている誘因的推論の領域であるシロメトリクス推論の事例を考察する。
思考の連鎖的推論,文脈内学習,教師付き微調整がシロメトリクス的推論に及ぼす影響について検討した。
以上の結果から,事前学習したLSMの行動は認知科学によって説明できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:59:04 GMT)
Modeling, Inference, and Prediction in Mobility-Based Compartmental Models for Epidemiology [5.1] 本稿では、従来のODEシステムを積分微分方程式系に変換する、移動変数による不均一性を取り入れた新しいアプローチを提案する。
以上の結果から,従来のコンパートメンタルモデルと比較して,移動型モデルでは最終パンデミックの規模が小さいことが示唆された。
我々は,この分布を機械学習ベースのフレームワークを用いて再構築し,実世界のデータによる移動性に基づくモデルを効果的に制約する理論的およびアルゴリズム的サポートを提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:13:57 GMT)
A Two-dimensional Zero-shot Dialogue State Tracking Evaluation Method using GPT-4 [5.0] 対話状態追跡(DST)は、大量のラベル付きデータに依存し、意味的一貫性を無視する正確なマッチング手法によって評価される。
GPT-4を用いたDSTの2次元ゼロショット評価法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:32:17 GMT)
Breaking Free: Efficient Multi-Party Private Set Union Without Non-Collusion Assumptions [5.0] マルチパーティ・プライベート・セット・ユニオン(MPSU)プロトコルにより、$m$$(m > 2)$パーティがそれぞれセットを保持し、集合のユニオンをまとめて計算することができる。
本稿では,標準半高次モデルにおいて,暗黙の転送と対称鍵技術に基づく最初のMPSUプロトコルを提案する。
当社のプロトコルでは,それぞれ220ドルのアイテムをセットした3つのパーティに対して,オンラインフェーズで3.6ドル秒しか必要としない。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:36:15 GMT)
COMMUNITY-CROSS-INSTRUCT: Unsupervised Instruction Generation for Aligning Large Language Models to Online Communities [5.0] Community-Cross-Instructは、大規模言語モデルをオンラインコミュニティに整合させる、教師なしのフレームワークである。
完全に教師なしの方法で命令を生成し、拡張性とドメイン間の一般化を向上する。
この作業により、様々なオンラインコミュニティの費用対効果と自動調査が可能になる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:20:47 GMT)
Progressive Dual Priori Network for Generalized Breast Tumor Segmentation [5.0] DCE-MRI画像から乳腺腫瘍を分離するプログレッシブデュアルプリオリネットワーク(PDPNet)を提案する。
その結果, PDPNetのDSCとHD95は, それぞれ5.13%, 7.58%改善した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:55:34 GMT)
Brain-inspired Computational Modeling of Action Recognition with Recurrent Spiking Neural Networks Equipped with Reinforcement Delay Learning [5.0] 行動認識は、その複雑な性質と、この分野における脳の異常なパフォーマンスのために大きな注目を集めている。
現在の行動認識のソリューションは、問題を効果的に解決する際の限界を示すか、必要な生物学的妥当性を欠くかのどちらかである。
本稿では,脳に触発された行動認識モデルを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:34:16 GMT)
Fine-Tuning and Prompt Engineering for Large Language Models-based Code Review Automation [4.9] コードレビュー自動化にLLM(Large Language Models)を利用する場合、ファインチューニングとプロンプトが一般的なアプローチである。
LLMベースのコードレビュー自動化では、モデルファインチューニングと推論技術(ゼロショット学習、少数ショット学習、ペルソナ)を使用します。
その結果、ゼロショット学習によるGPT-3.5は、Guoらのアプローチよりも73.17%-74.23%高いEMが得られることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:25:31 GMT)
Predicting quantum learnability from landscape fluctuation [4.9] トレーニング性と表現性の間のトレードオフは、今日の変動量子コンピューティングが直面している中心的な課題である。
近年の研究では、このジレンマを解くには、特定の問題に適した特定のパラメタライズド量子回路(PQC)を設計する必要があることが示されている。
与えられた学習環境のゆらぎを学習可能な標準的な景観と比較することにより,学習可能性の簡易かつ効率的な指標を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:50:47 GMT)
GameVibe: A Multimodal Affective Game Corpus [4.8] 本稿では,マルチモーダル・オーディオ視覚刺激による感性コーパスであるGameVibeについて紹介する。
コーパスは30のゲームにまたがって公開されている様々なゲームプレイセッションのビデオで構成されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:52:52 GMT)
The Invalsi Benchmarks: measuring Linguistic and Mathematical understanding of Large Language Models in Italian [4.8] Invalsi MATEは、イタリア語の数学的理解に基づくモデル性能の評価と、Invalsi ITAはイタリア語の言語理解を評価する。
これらのベンチマークは、イタリアの学校システムで6歳から18歳の学生に実施され、教育と教育の専門家によって検証されたInvalsiテストに基づいている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:55:24 GMT)
A First Principles Approach to Trust-Based Recommendation Systems [4.8] 協調フィルタリング手法では,項目分類情報は他の情報種別よりも影響が大きいことを示す。
信頼グラフに基づくアプローチは、信頼構造が難しいため、ネットワークの敵攻撃に対してより堅牢であることが判明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:23:00 GMT)
Rethinking Spatio-Temporal Transformer for Traffic Prediction:Multi-level Multi-view Augmented Learning Framework [4.8] トラフィックは、非常に複雑なセマンティックな相関を含む、困難な時間的予測問題である。
本稿では,交通予測のためのマルチレベル多視点時間変換器(LVST)を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:36:57 GMT)
Model-Based Inference and Experimental Design for Interference Using Partial Network Data [4.8] 本稿では,部分的ネットワークデータを用いた治療効果調整の評価と推定のためのフレームワークを提案する。
部分的ネットワークデータのみを用いて治療を割り当てる手順を説明する。
本研究では,インドとマラウイにおける情報拡散と観測グラフのシミュレーション実験によるアプローチの有効性を検証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:27:18 GMT)
Global Data Constraints: Ethical and Effectiveness Challenges in Large Language Model [4.7] 本稿では,大規模言語モデルにおける高品質な学習データ取得に関わる課題について検討する。
我々は、公開されているがバイアスのある、あるいは無関係なデータソースに依存することの技術的および倫理的意味を強調します。
我々は,データ品質の向上とロバストネスのモデル化を目的としたいくつかの緩和戦略を提案し,検証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:13:25 GMT)
A Brief Survey on Leveraging Large Scale Vision Models for Enhanced Robot Grasping [4.7] ロボットの把握は現実のシナリオにおいて困難な運動課題を示す。
コンピュータビジョンの最近の進歩は、教師なしのトレーニングメカニズムの成功を目撃している。
ロボットの把持性能向上における大規模視覚前訓練の有用性について検討した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:39:30 GMT)
Gram2Vec: An Interpretable Document Vectorizer [4.6] Gram2Vecは文書を高次元空間に埋め込み、テキストに存在する文法的特徴の正規化された相対周波数を抽出する。
ニューラルアプローチと比較して、Gram2Vecは、特徴ベクトルの生成方法に基づいた固有の解釈性を提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:42:14 GMT)
Refusal in Language Models Is Mediated by a Single Direction [4.5] リファリングは1次元のサブスペースによって媒介され、最大72Bのパラメータを持つ13の人気のオープンソースチャットモデルにまたがる。
そこで本研究では,他の機能に最小限の影響を伴って拒絶を手術的に無効にする,新しいホワイトボックス・ジェイルブレイク法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:36:12 GMT)
Enabling robots to follow abstract instructions and complete complex dynamic tasks [4.5] 本稿では,大規模言語モデル,キュレートされた知識ベース,統合力と視覚フィードバック(IFVF)を組み合わせた新しいフレームワークを提案する。
提案手法は,抽象的な命令を解釈し,長期的タスクを実行し,不確実性に対処する。
私たちの発見は、付随するビデオで説明され、オープンソースのGitHubリポジトリでサポートされています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:55:35 GMT)
On GNN explanability with activation rules [4.4] 我々は,GNNが世界をどのように捉えているのかを理解するために,隠れた層にアクティベーションルールをマイニングすることを提案する。
我々は,各隠蔽層におけるアクティベーションルールを列挙する,効果的で原則化されたアルゴリズムを定義する。
活性化ルールはグラフを分類するためにGNNが使用する特徴について洞察を与える。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:42:59 GMT)
Dynamic Order Template Prediction for Generative Aspect-Based Sentiment Analysis [4.4] ABSAはテキスト内の特定の側面に対する感情を評価し、詳細な感情をもたらす。
以前のABSAモデルはインスタンス内のすべての要素を予測するために静的テンプレートを使用することが多い。
本稿では,インスタンス毎に動的に生成するABSAの動的順序テンプレート(DOT)を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:21:28 GMT)
Exploring Fusion Techniques in Multimodal AI-Based Recruitment: Insights from FairCVdb [4.4] マルチモーダルAIに基づく採用システムにおけるマルチモーダルフュージョン技術の公平性とバイアスの影響について検討する。
以上の結果から,早期融合は両人口の基盤的真理と密接に一致し,最も低いMAEを達成できた。
対照的に、遅延融合は高度に一般化された平均スコアとより高いMAEをもたらす。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:37:58 GMT)
A Perspective on Explainable Artificial Intelligence Methods: SHAP and LIME [4.3] 本稿では2つの広く使われているXAI手法の解釈のための枠組みを提案する。
モデル依存性やコリナリティの有無の観点から,これらの結果について議論する。
以上の結果から,SHAPとLIMEはMLモデルや特徴コリナリティーの影響を強く受けており,その使用法や解釈に注意を喚起している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:15:51 GMT)
Performance Improvement of Language-Queried Audio Source Separation Based on Caption Augmentation From Large Language Models for DCASE Challenge 2024 Task 9 [4.3] 本稿では,言語クエリ音声ソース分離(LASS)タスクに適用した,プロンプトエンジニアリングに基づくテキスト拡張手法を提案する。
学習データセットの各文に対応する複数の字幕を生成するために,大規模言語モデル (LLM) を用いた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:19:14 GMT)
SpoT-Mamba: Learning Long-Range Dependency on Spatio-Temporal Graphs with Selective State Spaces [4.3] SpoT-Mamba.は、様々なノード固有のウォークシーケンスをスキャンしてノード埋め込みを生成する。
ノードの埋め込みに基づいて、時間的スキャンを行い、長距離時間的依存関係をキャプチャする。
実世界の交通予測実験の結果,Spot-Mambaの有効性が示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:15:31 GMT)
YOLO-FEDER FusionNet: A Novel Deep Learning Architecture for Drone Detection [4.3] YOLO-FEDER FusionNetと呼ばれる新しいディープラーニングアーキテクチャを導入する。
従来のアプローチとは異なり、YOLO-FEDER FusionNetは、汎用オブジェクト検出手法とカモフラージュオブジェクト検出技術の特殊強度を組み合わせることで、ドローン検出能力を向上している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:25:31 GMT)
Directional emission of a readout resonator for qubit measurement [4.3] 我々は、全パス共振器を用いた超伝導量子ビットの伝送方式による分散読み出しを提案する。
これは、リードアウト信号が出力に向かって優先的に減衰するように、フィードラインを一方の端で意図的にミスマッチする典型的な読み出し方式とは対照的である。
我々は,600 nsで平均98.1%のシングルショット忠実度を持つ量子ビット読み出しを実証し,より大きな分散シフトの効果を評価するために,シェルビングプロトコルを実装し,300 nsで99.0%の忠実度を達成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:54:31 GMT)
Analysing the Behaviour of Tree-Based Neural Networks in Regression Tasks [3.9] 本稿では、回帰課題の文脈において、木に基づくニューラルネットワークモデルの振る舞いを復号化するための取り組みを行う。
我々は,ツリーベースのCNN,Code2Vec,Transformerベースのメソッドといった確立されたモデルの応用を拡張し,ASTに解析することでソースコードの実行時間を予測する。
提案するデュアルトランスは,多様なデータセットにまたがる顕著な適応性とロバストな性能を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:47:14 GMT)
BSRBF-KAN: A combination of B-splines and Radial Basic Functions in Kolmogorov-Arnold Networks [3.8] 我々は,Bsplines と radial basis function (RBFs) を組み合わせたコルモゴロフ・アーノルドネットワーク (KAN) である BSRBF-KAN を導入し,ベクトルをデータトレーニングに適合させる。
BSRBF-KANは、競争平均精度が97.55%で、他のネットワークよりも安定している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:26:02 GMT)
Neural Quantum State Study of Fracton Models [3.8] フラクトン模型は3次元以上の非伝統的な位相秩序を包含する。
これらのモデルにおける相転移を研究するための新しいツールとして、ニューラル量子状態(NQS)を確立する。
本研究は,複雑な3次元問題の研究におけるNQSの顕著な可能性を示すものである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:58:09 GMT)
Prompt Design Matters for Computational Social Science Tasks but in Unpredictable Ways [3.8] 我々は,迅速な設計が社会科学アノテーションの遵守と正確性に与える影響を検証した。
以上の結果から,LSMのコンプライアンスと精度は極めて素早い依存性があることが示唆された。
この研究は、研究者や実践者の警告と実践のガイドとして機能する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:01:43 GMT)
Stockformer: A Price-Volume Factor Stock Selection Model Based on Wavelet Transform and Multi-Task Self-Attention Networks [3.8] 本稿では,ウェーブレット変換とマルチタスク自己アテンションネットワークを統合した価格-体積係数ストックセレクションモデルであるStockformerを紹介する。
ストックフォーマーは、株価のリターンを高頻度と低頻度に分解し、長期市場の動向と急激な出来事を注意深く捉えている。
実験結果から、Stockformerは複数の実市場データセットにおいて、既存の先進的な手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:38:08 GMT)
Multi-Camera Hand-Eye Calibration for Human-Robot Collaboration in Industrial Robotic Workcells [3.8] 産業シナリオでは、人間とロボットの効果的なコラボレーションは、人間のオペレーターをしっかりと監視するマルチカメラシステムに依存している。
本稿では,ロボットのベースとカメラの双方に対して,それぞれのカメラのポーズを最適化する,革新的で堅牢なマルチカメラハンドアイキャリブレーション手法を提案する。
産業シナリオで収集したMETRICデータセットと実世界のデータを用いた包括的実験により,本手法の優れた性能を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:23:30 GMT)
Two-Timescale Optimization Framework for Decentralized Linear-Quadratic Optimal Control [3.7] 疎性促進関数の選択に基づいて、いくつかの近似可分制約最適化問題を初めて定式化する。
分割2次間隔促進関数を導入し、同じ2時間スケールのアルゴリズムを実行することにより、誘導最適化を行う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:17:33 GMT)
GitHub Copilot: the perfect Code compLeeter? [3.7] 本稿では,GitHub Copilotが生成するコード品質をLeetCode問題セットに基づいて評価することを目的とする。
我々は、コード生成段階でのCopilotの信頼性、生成したコードの正確性、およびプログラミング言語への依存性を評価する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:38:29 GMT)
From the Fair Distribution of Predictions to the Fair Distribution of Social Goods: Evaluating the Impact of Fair Machine Learning on Long-Term Unemployment [3.7] この問題に対処するには,展開後のソーシャルグッズ分布の変化を予見する,予測公正性の概念が必要である,と我々は主張する。
私たちは、公共行政からの申請によって導かれています。最近失業した人のうちの誰が長期的に失業するかを予測するアルゴリズムの使用です。
我々は、このようなアルゴリズムによるインフォームドポリシーが、長期失業における男女不平等にどのように影響するかをシミュレートする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:10:30 GMT)
CAT: A Causally Graph Attention Network for Trimming Heterophilic Graph [3.7] グラフ注意ネットワーク(GAT)は、グラフ上のより優れた局所的な集約のために、近隣ノードの重要性を適応的に学習するように設計されている。
既存のGATは、異種近傍の高割合が中心ノードの自己認識を弱めるため、異種グラフにおいて顕著な識別能力の低下に悩まされる。
本稿では,隣接するノードの抽出効果(DE)を推定し,弱めるために,異種グラフをトリミングするCausally graph Attention Networkを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:22:15 GMT)
A novel hybrid time-varying graph neural network for traffic flow forecasting [3.7] インテリジェント交通システムの効率化には,リアルタイムかつ正確な交通流予測が不可欠である。
従来のグラフニューラルネットワーク(GNN)は、都市道路網における交通ノード間の空間的相関を記述するために用いられる。
我々は交通流予測のための新しいハイブリッド時変グラフニューラルネットワーク(HTVGNN)を提案している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:17:56 GMT)
Dredge Word, Social Media, and Webgraph Networks for Unreliable Website Classification and Identification [3.7] 本稿では,Webグラフと大規模ソーシャルメディアのコンテキストがWebサイト信頼性の分類と発見システムに与える影響について検討する。
ウェブグラフとソーシャルメディアデータの両方からコンテキストを利用するカリキュラムベースのヘテロジニアスグラフモデルは、均一性と単一モードのアプローチより優れていることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:22:04 GMT)
Liberal Entity Matching as a Compound AI Toolchain [3.6] Libemは、柔軟なツール指向のアプローチを導入することで制限に対処するように設計された複合AIシステムである。
モジュール性の欠如に悩まされる従来のソロAIEMシステムとは異なり、Libemは構成可能で再利用可能なツールチェーンを提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:33:34 GMT)
Vid3D: Synthesis of Dynamic 3D Scenes using 2D Video Diffusion [3.5] 本稿では,現在のアプローチのように時間とともに多視点一貫性を明示的に実施する必要があるか,あるいはモデルが各タイムステップの3次元表現を独立に生成するのに十分なのかを検討する。
本稿では,2次元映像拡散を利用して3次元映像を生成するモデルVid3Dを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:09:04 GMT)
DELRec: Distilling Sequential Pattern to Enhance LLM-based Recommendation [3.5] 逐次レコメンデーション(SR)タスクは、ユーザの過去のインタラクションと好みの変化を関連付けることで、レコメンデーションの精度を高める。
従来のモデルは、トレーニングデータ内のシーケンシャルなパターンをキャプチャすることだけに集中し、外部ソースからアイテムタイトルに埋め込まれたより広いコンテキストやセマンティックな情報を無視することが多い。
DelRecは、SRモデルから知識を抽出し、LLMがより効果的なシーケンシャルレコメンデーションのためにこれらの補足情報を容易に理解し利用できるようにすることを目的としている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:47:09 GMT)
Rydberg superatoms: An artificial quantum system for quantum information processing and quantum optics [3.4] リュードベルクの励起は、強い長距離双極子-双極子相互作用によって引き起こされる、興味深い集団効果を示す。
これらの集団効果は、量子情報処理や量子光学における潜在的な応用により、様々な分野において大きな注目を集めている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:30:36 GMT)
BAMBINO-LM: (Bilingual-)Human-Inspired Continual Pretraining of BabyLM [3.3] 本研究では,親イタリアモデルから誘導される交代とPPOに基づくパープレクシリティ報酬を組み合わせたBabyLMの継続事前学習戦略であるBAMBINO-LMを紹介する。
我々のアブレーション分析は、この効果を得る上で、変更戦略とPPOに基づくモデリングの両方を活用することが重要であることを示している。
副作用として, 提案手法は, 人間の子どもが同等の学習シナリオで持つようなL1の有効性の低下につながる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:08:08 GMT)
Feriji: A French-Zarma Parallel Corpus, Glossary & Translator [3.3] 本稿では,機械翻訳用に設計された最初のロバストなフレンチ・ザーマ並列コーパスと用語集であるFerijiを紹介する。
我々はデータセット上で3つの大きな言語モデルを微調整し、最高の性能モデルでBLEUスコア30.06を得る。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:36:18 GMT)
How Good are LLMs at Relation Extraction under Low-Resource Scenario? Comprehensive Evaluation [3.3] 本稿では,3地域(中央アジア,東南アジア,中東)の低リソース言語10言語(LRL)における低リソース関係抽出データセットを構築する。
コーパスは、有効な多言語機械翻訳を使用して、オリジナルの公開可能な英語REデータセット(NYT10、FewRel、CrossRE)を翻訳することで構築される。
次に、言語パープレキシティ(PPL)を使用して、翻訳されたデータセットから低品質データをフィルタリングする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 03:02:04 GMT)
Selective Parallel Loading of Large-Scale Compressed Graphs with ParaGrapher [3.3] ParaGrapherは、大規模および圧縮されたグラフをロードするための高性能なAPIとライブラリである。
本稿ではParaGrapherの設計とグラフ圧縮の性能モデルを提案する。
評価の結果,ParaGrapherはロード時の最大3.2倍,エンドツーエンド実行時の最大5.2倍のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:33:18 GMT)
Intersymbolic AI: Interlinking Symbolic AI and Subsymbolic AI [3.2] シンボルAIは、シンボルAIとサブシンボルAIを組み合わせて、AIの有効性を高める。
シンボルAIは、象徴AIの世界と、その構成的象徴的重要性と意味を結びつける。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:01:59 GMT)
Improving Quality Control of Whole Slide Images by Explicit Artifact Augmentation [3.2] 本研究は, スライド画像全体をアーティファクトで拡張する手法を提案する。
このツールは、外部ライブラリから所定の病理組織データセットにアーティファクトをシームレスに生成し、ブレンドする。
この評価は, アーティファクトの分類における有用性を示し, アーティファクトの種類によって0.10から0.01AUROCの改善を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:39:31 GMT)
Generation of Maximally Entangled States by Lyapunov Control Based on Entanglement Measure [3.2] 本稿では、リアプノフ関数を構成するために量子エンタングルメント測度に依存する改良された量子リアプノフ制御手法を提案する。
提案手法は, 絡み合い対策をスカラーとして対象とするため, 絡み合ったサブシステムの数に影響を受けない。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:42:56 GMT)
Self-Train Before You Transcribe [3.2] 本研究では,テスト時間適応手法として,テストセットの録音にうるさわしい教師の訓練を行うことの利点について検討する。
ドメイン内のデータセットとドメイン外のデータセットは、32.2%までの大きな相対的なゲインを示す実験に使用される。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:21:00 GMT)
How Much Context Does My Attention-Based ASR System Need? [3.2] 本研究では,音響モデルの訓練・評価に用いるシーケンス長が音声認識性能に与える影響について実験的検討を行った。
10万の擬似ラベル付きSpotifyポッドキャストのデータセットが使用され、コンテキストの長さは5秒から1時間である。
結果は、最大21.8分間の音響コンテキストによるトレーニングの利点を示し、10秒のコンテキストでトレーニングされたベースラインから14.5%の相対的な改善を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:14:38 GMT)
The Scaling Law in Stellar Light Curves [3.1] 本稿では,天文時系列データから学習する際の法則のスケーリングについて,自己監督的手法を用いて検討する。
自己教師付きトランスフォーマーモデルは,最先端の教師付き学習モデルと比較して,サンプル効率を3~10倍に向上させる。
本研究は,大規模自己回帰生成モデルを用いて恒星の光度曲線を解析するための基礎研究である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:13:21 GMT)
A proposal for detecting the spin of a single electron in superfluid helium [3.1] 超流動ヘリウムの電子バブルは 2つの自由度を持ち 極端に低い散逸をもたらす
超充填光音響キャビティ内で電子バブルを捕捉する実用的手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:42:33 GMT)
Antilinear superoperator, quantum geometric invariance, and antilinear symmetry for higher-dimensional quantum systems [2.9] 本稿では,反線形量子チャネル,反線形ユニタリ超作用素,一般化された$Theta$-共役など,反線形超作用素の重要なクラスについて検討する。
オープン量子系の強および弱反線形超作用素対称性についても論じる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:17:03 GMT)
Quaternion Generative Adversarial Neural Networks and Applications to Color Image Inpainting [2.9] 本稿では,QGANモデルとその関連理論について提案する。
実験結果から,QGANはカラー画像の塗布に優れ,面積が不足していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:04:17 GMT)
Physics-informed Neural Network Estimation of Material Properties in Soft Tissue Nonlinear Biomechanical Models [2.9] 物理インフォームドニューラルネットワーク(PINN)と3次元軟組織非線形生体力学モデルを組み合わせた新しいアプローチを提案する。
提案した学習アルゴリズムは、限られた量の変位から情報を符号化し、場合によっては、臨床環境で日常的に取得できる歪みデータを符号化する。
提案手法の精度とロバスト性を示すために,いくつかのベンチマークを行った。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:59:07 GMT)
Discriminative Hamiltonian Variational Autoencoder for Accurate Tumor Segmentation in Data-Scarce Regimes [2.8] 医用画像分割のためのエンドツーエンドハイブリッドアーキテクチャを提案する。
ハミルトン変分オートエンコーダ(HVAE)と識別正則化を用いて生成画像の品質を向上する。
我々のアーキテクチャはスライス・バイ・スライス・ベースで3Dボリュームを分割し、リッチな拡張データセットをカプセル化する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:42:08 GMT)
Scorecards for Synthetic Medical Data Evaluation and Reporting [2.8] 医療におけるAI駆動ツールのトレーニングおよびテストにおける合成医療データ(SMD)の利用の増加には、その品質を評価するための体系的なフレームワークが必要である。
本稿では,医療応用のユニークな要件を満たすために設計された評価フレームワークについて概説する。
人工的に生成されたデータセットに付随する総合的なレポートとして機能するスコアカードの概念を導入する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:11:59 GMT)
Quantifying Local Model Validity using Active Learning [2.8] 機械学習モデルの現実的な応用は、しばしば法律やポリシーに基づく規制の対象となる。
これらの規則のいくつかはモデルの妥当性を保証することを必要とし、すなわち近似誤差は閾値よりも小さい。
本稿では,モデル誤差を学習し,有効学習を通じて必要なデータ量を減らしながら,局所的妥当性推定値を取得することを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:19:01 GMT)
Efficient Topology-aware Data Augmentation for High-Degree Graph Neural Networks [2.8] 高次グラフ(HDG)上のグラフニューラルネットワーク(GNN)のための効率的かつ効果的なフロントマウントデータ拡張フレームワークであるTADを提案する。
内部では、(i)構造埋め込みによる機能拡張と(ii)トポロジと属性対応グラフのスパース化という、2つの重要なモジュールが含まれている。
TADAは、ノード分類の観点から8つの実ホモ親和性/ヘテロ親和性HDG上でのメインストリームGNNモデルの予測性能を大幅に改善する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:08:14 GMT)
Automating Easy Read Text Segmentation [2.7] 読みやすいテキストは、読み難い人のための情報にアクセスするための主要な形態の1つである。
このタイプのテキストの重要な特徴の1つは、文をより小さな文法セグメントに分割する必要があることである。
マスク付きおよび生成言語モデルと構成的構文解析を併用して,タスクのための新しい手法について検討する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:25:25 GMT)
Design and evaluation of AI copilots -- case studies of retail copilot templates [2.7] AIのコパイロを成功させるには、体系的なアプローチが必要だ。
本稿では,コピロの設計と評価を2つのセクションに分けた。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:31:33 GMT)
Integrity-protecting block cipher modes -- Untangling a tangled web [2.7] PES-PCBC、IOBC、EDBCは全て1990年代半ばに提案された。
本稿では,認証暗号を提供するために設計された3つのブロック暗号モードのセキュリティを再検討する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:27:45 GMT)
Intrinsic high-fidelity spin polarization of charged vacancies in hexagonal boron nitride [2.7] 六方晶窒化ホウ素(hBN)の負の帯電ホウ素空孔(mathrmV_mathrmB-$)は、2次元材料の欠陥の間で大きな注目を集めている。
我々は、周囲条件下での他の固体スピン欠陥を克服し、スピン偏極のほぼ均一度を予測する半古典的モデルを開発する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:00:00 GMT)
The Near-optimal Performance of Quantum Error Correction Codes [2.7] 任意の符号と雑音に対する簡潔で最適化のない計量である準最適チャネル忠実度を導出する。
従来の最適化手法と比較して、計算コストの削減により、以前はアクセス不能なサイズであったシステムをシミュレートすることができる。
熱力学符号とGottesman-Kitaev-Preskill (GKP)符号のほぼ最適性能を解析的に導出した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:29:58 GMT)
How Do Humans Write Code? Large Models Do It the Same Way Too [2.6] Program-of-Thought(PoT)は、自然言語ベースのChain-of-Thought(CoT)を、大規模言語モデルにおいて最も一般的な方法として置き換える。
PoTを使用すると、CoTと比較して、不正な公式や欠陥論理などの推論エラーがより多く導入される。
本稿では,PoTとCoTの統合を支援する一連の戦略を活用するHTL(Human-Think Language)を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:00:41 GMT)
Unveiling Assumptions: Exploring the Decisions of AI Chatbots and Human Testers [2.5] 意思決定は、コード、要求仕様、その他のソフトウェアアーティファクトなど、さまざまな情報に依存します。
不明瞭な情報によって残されたギャップを埋めるために、私たちはしばしば、前提や直観、あるいは以前の経験に頼って意思決定をします。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:55:56 GMT)
Investigating the Impact of Direct Punishment on the Emergence of Cooperation in Multi-Agent Reinforcement Learning Systems [2.5] 協力の問題は、人間社会の中で一様である。
AIの利用が社会全体に広まるにつれ、社会的にインテリジェントなエージェントの必要性がますます明白になりつつある。
本稿では, 直接罰, 第三者罰, パートナー選択, 評判に関連する行動と学習のダイナミクスを包括的に分析し, 評価する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:18:47 GMT)
UniBridge: A Unified Approach to Cross-Lingual Transfer Learning for Low-Resource Languages [2.5] クロスリンガル・トランスファー・ラーニングの有効性を改善するための総合的なアプローチであるUniBridgeを紹介する。
本手法は,埋め込みの初期化と最適な語彙サイズという,言語モデルの2つの重要な要素に対処する。
多言語データセットを用いた実験により,いくつかの言語でF1スコアが大幅に改善された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:05:39 GMT)
ChatEMG: Synthetic Data Generation to Control a Robotic Hand Orthosis for Stroke [2.4] ChatEMGは自己回帰生成モデルであり、プロンプトで条件付けられた合成EMG信号を生成することができる。
完全なアプローチをひとつの患者セッションに統合できることを実証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:04:44 GMT)
BirdSet: A Dataset and Benchmark for Classification in Avian Bioacoustics [2.3] BirdSetデータセットを導入し、トレーニング用として約52万のグローバルな鳥の記録と、テスト用として400時間以上のPAM記録を含む。
我々のベンチマークでは、複数のDLモデルのベースラインを提供し、総合的なトレーニングや評価プロトコルを含むコード実装とともに、コンパラビリティを高め、研究を集約しています。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:25:11 GMT)
Killer Apps: Low-Speed, Large-Scale AI Weapons [2.3] 人工知能(AI)と機械学習(ML)の進歩は、戦争と安全保障における新たな課題と機会を提示する。
本稿では,AI兵器の概念,その展開,検出,潜在的な対策について検討する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:18:50 GMT)
A Preliminary Study on Self-Contained Libraries in the NPM Ecosystem [2.2] 現代のソフトウェアエコシステムにおけるライブラリの普及は、依存関係の複雑なネットワークを生み出します。
依存関係がゼロのライブラリは自己完結型になる。
本稿では,NPMエコシステムにおける自己完結型ライブラリの特徴について考察する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:33:49 GMT)
Measurement of Many-Body Quantum Correlations in Superconducting Circuits [2.2] アナログ量子シミュレータにおいて多体相関を読み取ることができるプローブ回路を提案する。
我々は、量子不純物を持つLCラダーの文脈で、この設計の能力を実証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:36:36 GMT)
Building Collaborative Learning: Exploring Social Annotation in Introductory Programming [2.1] 学生や教師は、フィードバックフルーツ、ペルーサル、ダイゴなどのプラットフォームを使用して、コース資料を共同で議論する。
このアプローチは、学生が自分の考えや答えを同僚と共有することを奨励し、よりインタラクティブな学習環境を育む。
ペルーサルが112名の学生の受験成績に及ぼす影響を報告する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:59:41 GMT)
A Closed-form Solution for Weight Optimization in Fully-connected Feed-forward Neural Networks [2.1] 本研究は、完全連結フィードフォワードニューラルネットワークにおける重み付け最適化問題に対処する。
提案手法は最小二乗法 (LS) を用いて閉形式における重み最適化の解を提供する。
シミュレーションおよび実験結果から,提案手法であるBPLSは,既存の手法と精度で競合するが,実行時間ではかなり上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:16:27 GMT)
Building another Spanish dictionary, this time with GPT-4 [2.1] 我々は、AI生成スペイン語辞書の第2版として、スペイン語構築Factual Freectianary 2.0(スペイン語-BFF-2)を提示する。
本研究では,GPT-4-turboを用いて辞書の改良を図る。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:25:56 GMT)
Stochastic Neural Network Symmetrisation in Markov Categories [2.1] 我々は、群準同型に沿ってニューラルネットワークをシンメトリする問題を考察する。
シンメシエーションのためのフレキシブルで構成的で汎用的なフレームワークを得る。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:54:42 GMT)
How Neural Networks Learn the Support is an Implicit Regularization Effect of SGD [2.1] 目的関数の支持を識別するディープニューラルネットワークの能力について検討する。
ミニバッチSGDは、入力の無関係成分に関連する重みをゼロにすることで、ネットワークの第1層の支持を効果的に学習する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:19:16 GMT)
Enhancing Text Classification through LLM-Driven Active Learning and Human Annotation [2.0] 本研究では,人間のアノテータと大規模言語モデルを統合する新しい手法を提案する。
提案フレームワークは, モデルの不確実性レベルに応じて, 人間のアノテーションとLLMの出力を統合する。
実験結果から, モデル精度の維持・改善を図りながら, データアノテーションに関連するコストを大幅に削減した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:45:48 GMT)
QC-Forest: a Classical-Quantum Algorithm to Provably Speedup Retraining of Random Forest [2.0] ランダムフォレスト(Random Forest, RF)は、教師あり学習法として人気があり、使いやすさと柔軟性で評価されている。
オンラインRFモデルは、モデルの精度を維持するために、新しいトレーニングデータを考慮する必要がある。
ストリーミング環境でのRFモデルの時間効率向上を目的とした古典量子アルゴリズムQC-Forestを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:21:03 GMT)
Lexidate: Model Evaluation and Selection with Lexicase [2.0] 本稿では,複数の独立予測値を用いたレキシケータに基づく検証手法であるレキシケータ(lexidate)を提案する。
1つの構成では, TPOT2から返される最終モデルの精度は10倍CVに比べ, 差は認められなかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:18:51 GMT)
A Critical Study of What Code-LLMs (Do Not) Learn [1.9] 我々は、注意マップとコード-LLMの隠れ表現のきめ細かい分析を行う。
コード-LLMは入力トークンの特定のサブセット間の関係を符号化するのみである。
また、微調整されたモデルでは、事前訓練されたモデルと比較して、これらの関係をコード化していないことも判明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:11:17 GMT)
Attention-Based Deep Reinforcement Learning for Qubit Allocation in Modular Quantum Architectures [1.9] この研究は、効率的な量子回路のコンパイルとマッピングのための新しい学習ベースのアプローチを導入することにより、スケーラブルな量子コンピューティングシステムの進歩に寄与する。
本研究では,Deep Reinforcement Learning (DRL) 手法を応用して,特定のマルチコアアーキテクチャのための学習手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:09:11 GMT)
Wisdom of the Silicon Crowd: LLM Ensemble Prediction Capabilities Rival Human Crowd Accuracy [1.9] 我々は12大言語モデル(LLM)の群集からなるアンサンブルアプローチを使用している。
我々は,31の2進数質問に対するLLM予測を,3ヶ月の予測トーナメントの人的予測者の群集と比較した。
我々は,アクセプション効果やラウンド数を好む傾向など,機械応答における人間のようなバイアスの集合を観察する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:38:00 GMT)
Federated Active Learning Framework for Efficient Annotation Strategy in Skin-lesion Classification [1.8] フェデレートラーニング(FL)は、複数の機関がプライベートデータを共有することなく、協力的にモデルをトレーニングすることを可能にする。
アクティブラーニング(AL)は、医用画像解析におけるデータアノテーションの数を減らす上で有望な性能を示した。
本稿では,FL 下で周期的かつ対話的に AL を実行するフェデレーション AL (FedAL) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:16:28 GMT)
Quantum Algorithms for the Pathwise Lasso [1.8] 古典的LARS(Least Angle Regression)パスワイズアルゴリズムに基づく新しい量子高次元線形回帰アルゴリズムを提案する。
我々の量子アルゴリズムは、ペナルティ項が変化するにつれて、完全な正規化パスを提供するが、特定の条件下では、イテレーション毎に2次的に高速である。
我々は、KKT条件の近似バージョンと双対性ギャップにより、LARSアルゴリズムがエラーに対して堅牢であることを証明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:55:21 GMT)
Threat analysis and adversarial model for Smart Grids [1.7] このスマートパワーグリッドのサイバードメインは、新たな脅威を開拓する。
規制機関、業界、アカデミーを含む様々な利害関係者は、サイバーリスクを緩和し軽減するためのセキュリティメカニズムの提供に取り組んでいる。
近年の研究では、グリッド実践者や学術専門家の間で、学術が提案する脅威の実現可能性と結果に関する合意の欠如が示されている。
これは、攻撃者の完全な能力と目標に基づいて脅威を評価しない、不適切なシミュレーションモデルが原因である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:33:46 GMT)
A Short Review for Ontology Learning: Stride to Large Language Models Trend [1.7] オントロジーは、Webアプリケーション内で共有される知識の形式的な表現を提供する。
新しいアプローチのトレンドは、オントロジー学習を強化するために、大きな言語モデル(LLM)に依存している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:48:22 GMT)
Multimodal Transformer Using Cross-Channel attention for Object Detection in Remote Sensing Images [1.7] マルチモーダル融合は、複数のモーダルからのデータを融合することで精度を高めることが決定されている。
早期に異なるチャネル間の関係をマッピングするための新しいマルチモーダル融合戦略を提案する。
本手法は,中期・後期の手法とは対照的に,早期の融合に対処することにより,既存の手法と比較して,競争力や性能に優れる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:23:09 GMT)
Scalable Expressiveness through Preprocessed Graph Perturbations [1.7] グラフニューラルネットワーク(GNN)は,グラフ構造化データを解析するための主要な手法である。
前処理グラフ摂動(SE2P)によるスケーラブル表現性の導入
SE2Pは4つの異なる設定クラスでスケーラビリティと一般化性の間の柔軟なバランスを提供する。
この結果から,SE2P構成の選択により,最大8倍の速度向上を達成しつつ,ベンチマークよりも一般化性を向上させることが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:32:57 GMT)
KnowledgeHub: An end-to-end Tool for Assisted Scientific Discovery [1.6] 本稿では、知識Hubツール、科学文献情報抽出(IE)および質問回答(QA)パイプラインについて述べる。
これはPDF文書がテキストや構造化表現に変換されるのをサポートすることで達成される。
ブラウザベースのアノテーションツールは、オントロジーに従ってPDF文書の内容に注釈を付けることができる。
これらのエンティティと関係トリプルから知識グラフを構築し、データから洞察を得るためにクエリすることができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:23:46 GMT)
Promises, Outlooks and Challenges of Diffusion Language Modeling [1.6] Score Entropy Discrete Diffusion (SEDD) は自己回帰生成の代替として有望であることを示す。
推論レイテンシの面では、SEDDはGPT-2よりも4.5$times$効率が高い。
SEDDは任意位置でのトークンの条件付けを許すが、SEDDは短いプロンプトを条件付き生成するためにGPT-2よりもわずかに弱いように見える。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:38:38 GMT)
Exploring the Benefits of Vision Foundation Models for Unsupervised Domain Adaptation [1.6] 本研究では、VFM(Vision Foundation Models)とUnsupervised Domain Adaptation(Unsupervised Domain Adaptation)の手法が相補的かどうかを検討する。
その結果,VFMとUDAを併用することで,VFMのアウト・オブ・ディストリビューション性能を維持しつつ,UDAのパフォーマンスが向上し,また,(b)特定の時間を消費するUDAコンポーネントを冗長にする,という2つの利点が示された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:51:40 GMT)
MTEB-French: Resources for French Sentence Embedding Evaluation and Analysis [1.6] 本稿では,フランス語の文埋め込みに関する最初のベンチマークを提案する。
51個の埋め込みモデルを大規模に比較した。
すべてのタスクにおいてモデルが最良でない場合でも、文類似性に基づいて事前訓練された大規模多言語モデルは非常によく機能することがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:14:54 GMT)
Probing entanglement dynamics and topological transitions on noisy intermediate-scale quantum computers [1.5] 我々は、IBM量子コンピュータ上のSu-Schrieffer-Heeger鎖のクエンチダイナミクスをシミュレートする。
我々はR'enyiエンタングルメントエントロピー、ツイストオーダーパラメータ、ベリー位相を計算する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:55:01 GMT)
DRIP: Discriminative Rotation-Invariant Pole Landmark Descriptor for 3D LiDAR Localization [1.5] 3D LiDARベースのロボットの自己ローカライゼーションでは、ポールのようなランドマークが軽量で差別的なランドマークとして人気を集めている。
この研究は「差別的な回転不変極」を導入し、ポールのようなランドマークの識別性を高める。
我々は、教師なし学習を通してポール辞書を訓練し、それを使ってポールをコンパクトなポール語に圧縮する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:13:07 GMT)
Positional Encoding Helps Recurrent Neural Networks Handle a Large Vocabulary [1.5] 位置符号化は入力データ上の時間指標の高次元表現である。
RNNは、データポイントの時間情報を自身でエンコードすることができ、位置エンコーディングの使用は、一見冗長/不要なように見える。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:34:10 GMT)
Low-power Ship Detection in Satellite Images Using Neuromorphic Hardware [1.4] オンボードのデータ処理は、船を識別し、地上に送られるデータの量を削減できる。
船上で撮影されたほとんどの画像は水域や陸地のみを含み、エアバス船検出データセットでは船を含む画像の22.1%しか示していない。
1つの複雑なモデルに頼るのではなく、パフォーマンスを最適化する低消費電力2段階システムを構築した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:36:12 GMT)
Provable Guarantees for Model Performance via Mechanistic Interpretability [1.4] 本稿では,モデル性能に関する形式的保証を導出し,コンパクトに証明するために,機械的解釈可能性を用いることを提案する。
我々は,Max-of-k$タスクで訓練された151個の小型変圧器の精度を正式に低くすることで,このアプローチを試作する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:34:25 GMT)
Where there's a will there's a way: ChatGPT is used more for science in countries where it is prohibited [1.4] OpenAIは中国やロシアなどいくつかの国からのChatGPTへのアクセスを禁止している。
簡単なアンサンブル分類器をChatGPTの「ポリシング」前後の抽象語で訓練して開発した。
Arxiv、BioRxiv、MedRxivのプリプリントに分類器を適用すると、2023年8月までにChatGPTが約12.6%のプレプリントで使用されたことが明らかになった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:24:51 GMT)
PerfCurator: Curating a large-scale dataset of performance bug-related commits from public repositories [1.4] パフォーマンスバグ関連コミットを大規模に収集するリポジトリマイナであるPerfCuratorを提案する。
PerfCuratorは、パフォーマンスバグ関連のコミットを分類するために訓練された125MパラメータBERTモデルであるPcBERT-KDを使用している。
この大規模データセットは,データ駆動型パフォーマンスバグ検出システムの有効性を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:49:13 GMT)
Towards Safe Multi-Task Bayesian Optimization [1.4] システムの物理モデルを減らすことは最適化プロセスに組み込むことができ、それを加速することができる。
これらのモデルは実際のシステムの近似を提供することができ、それらの評価は極めて安価である。
安全はベイズ最適化のようなオンライン最適化手法にとって重要な基準である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:05:43 GMT)
Towards Understanding Emotions for Engaged Mental Health Conversations [1.4] 我々はキーストロークダイナミクスと感情分析を組み合わせた受動的感情センシングシステムを開発している。
短いテキストメッセージとキーボードタイピングパターンの分析は、クライアントと応答者の両方をサポートするために使用される感情情報を提供することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:27:15 GMT)
A Systematic Construction Approach for All $4\times 4$ Involutory MDS Matrices [1.3] 偶数次不揮発性MDS行列のいくつかの特性について述べる。
有限体上の4×4$不揮発性MDS行列を体系的に構築する手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:41:08 GMT)
What Operations can be Performed Directly on Compressed Arrays, and with What Error? [1.3] 我々は、圧縮されたデータに直接、数十のかなり基本的な操作を可能にする、損失のある圧縮機を開発した。
3つの非自明なアプリケーション上で評価し、内部表現のために異なる数系を選択する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:01:09 GMT)
ROTI-GCV: Generalized Cross-Validation for right-ROTationally Invariant Data [1.2] 高次元正規化回帰における2つの重要なタスクは、良い予測のために正規化強度を調整し、サンプル外リスクを推定することである。
標準的なアプローチ --$k$-foldクロスバリデーション -- は、現代の高次元設定では一貫性がない。
クロスバリデーションを確実に行うための新しいフレームワーク ROTI-GCV を紹介する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:50:00 GMT)
Words in Motion: Representation Engineering for Motion Forecasting [1.2] 動き予測は過去の動きと環境コンテキストのシーケンスを将来の動きに変換する。
近年の手法は学習された表現に依存しており、解釈が難しい隠された状態をもたらす。
自然言語を用いて、人間の解釈可能な方法で動きの特徴を定量化し、それらが隠れた状態に埋め込まれている度合いを測定する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:07:55 GMT)
Spillover Detection for Donor Selection in Synthetic Control Models [1.2] 理論的に座屈したドナーの選択手順を導入する。
本稿では, この理論を, 潜在的な流出効果を検出するための実用的手法に転換する方法について述べる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:33:33 GMT)
ChildDiffusion: Unlocking the Potential of Generative AI and Controllable Augmentations for Child Facial Data using Stable Diffusion and Large Language Models [1.1] この枠組みは、民族データ、微妙な表現、顔ポーズのバリエーション、目まき効果、異なる髪の色とスタイル、老化、複数と異なる子供の性別を単一のフレームでレンダリングすることによって検証される。
提案手法は、時間的不整合や出力の限られた制御など、生成AIツールで発生する一般的な問題を回避している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:37:14 GMT)
End-to-end Text-to-SQL Generation within an Analytics Insight Engine [1.1] テキスト・トゥ・ザ・トップの最近の進歩は、データベース管理システムをデータアクセスの民主化をさらに進めている。
Distyl AIのAnalytics Insight Engineの開発で経験した、印象的なText-to-the-topを実現する。
本稿では,大規模言語モデルを用いたテキスト・トゥ・ザ・トップパイプラインの設計と実装について述べる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:33:01 GMT)
Decoding the Narratives: Analyzing Personal Drug Experiences Shared on Reddit [1.1] 本研究は,物質利用経験に関するオンラインユーザ生成テキストを解析するための多レベル多ラベル分類モデルを開発することを目的とする。
注釈付きデータの集合上で様々なマルチラベル分類アルゴリズムを用いて、GPT-4が命令、定義、例によって誘導された場合、他の全てのモデルよりも優れていたことを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:56:57 GMT)
RE-GAINS & EnCHANT: Intelligent Tool Manipulation Systems For Enhanced Query Responses [1.0] 本稿では,RE-GAINSとEnCHANTの2つの新しいフレームワークを提案する。
Re-GAINSはOpenAIモデルと組み込みに基づいており、RAP論文に基づいた特別なプロンプトを使用している。
EnCHANTはオープンソースのソリューションで、LLMフォーマットの強制器、LLM(OpenChat 3.5)およびレトリバーを利用する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:59:34 GMT)
GECOBench: A Gender-Controlled Text Dataset and Benchmark for Quantifying Biases in Explanations [1.0] 性別制御されたテキストデータセットであるGECOを作成し、それ以外は男性と女性に同じ文が現れる。
これにより、ジェンダー分類タスクの「世界説明」が根本から生まれる。
また,一般的なXAI手法をベンチマークする厳密な定量的評価フレームワークであるGECOBenchも提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:44:37 GMT)
Optimizing Automatic Differentiation with Deep Reinforcement Learning [0.9] 深部強化学習(RL)を利用したヤコビ計算に必要な乗算数を最適化する新しい手法を提案する。
本手法は,様々な領域から取得した複数のタスクに対して,最先端の手法よりも最大33%改善できることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:54:09 GMT)
Evaluating Open Language Models Across Task Types, Application Domains, and Reasoning Types: An In-Depth Experimental Analysis [0.9] この研究は、10個の小さいオープンなLMの出力の意味的正当性を詳細に実験的に分析する。
適切に利用すれば、これらのLMはDeepSeek-v2, GPT-3.5-Turbo, GPT-4oといったSOTA LLMと競合し、時として優れることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:45:36 GMT)
Mathematical Entities: Corpora and Benchmarks [0.9] 数学テキストに対する自然言語処理の研究は比較的少ない。
我々は、異なる文脈で数学の言語を研究するのに使用できる注釈付きコーパスを提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:11:00 GMT)
Large Language Models Suffer From Their Own Output: An Analysis of the Self-Consuming Training Loop [0.9] 本稿では,Large Language Models (LLM) の自己消費学習ループについて検討する。
本稿では,LLM生成コンテンツの正確性を明確に検証できる論理式に基づく新しい手法を提案する。
自己消費学習ループは正しい出力を生成するが、使用データの割合によって出力の多様性は低下する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:07:30 GMT)
Fine-Tuning or Fine-Failing? Debunking Performance Myths in Large Language Models [0.8] 大きな言語モデル(LLM)は、入力クエリから人間のようなテキストを理解し、生成する能力を持つ。
本研究では、この概念を、レトリーバル拡張生成(RAG)パイプライン内のLLMの統合に拡張する。
データ抽出と文脈理解における微調整がLLMの能力に与える影響を評価する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:35:17 GMT)
StepMix: A Python Package for Pseudo-Likelihood Estimation of Generalized Mixture Models with External Variables [0.8] StepMixは、擬似的な推定のためのオープンソースのPythonパッケージである。
文献からの最も重要なステップワイズ推定手法を実装している。
StepMixはScikit-Lernライブラリのオブジェクト指向設計に従い、追加のRラッパーを提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:26:30 GMT)
Physics-Constrained Learning for PDE Systems with Uncertainty Quantified Port-Hamiltonian Models [0.7] 本稿では,強力な学習ツールと信頼性のある物理モデルを組み合わせた物理制約学習手法を提案する。
ガウス過程のベイズ的性質に基づいて、系の力学を学習するだけでなく、不確実な定量化を可能にする。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:52:01 GMT)
The Topology of a Family Tree Graph and Its Members' Satisfaction with One Another: A Machine Learning Approach [0.7] 家族同士の満足感は、健全で支援的な家族環境作りの中心である。
提案手法は,家族グラフのトポロジのみに基づいて,家族同士の満足度を予測するための高精度な結果をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:49:40 GMT)
A Personalised Learning Tool for Physics Undergraduate Students Built On a Large Language Model for Symbolic Regression [0.7] インターリーブド・プラクティスは、学部生の記憶と問題解決能力を高める。
本稿では,Large Language Model(LLM)上に構築されたパーソナライズされた学習ツールについて紹介する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:43:30 GMT)
Security in IS and social engineering -- an overview and state of the art [0.6] すべてのプロセスのデジタル化とIoTデバイスのオープン化は、サイバー犯罪という新たな犯罪形態の出現を促している。
こうした攻撃の悪意は、ユーザーがサイバー攻撃のファシリテーターになるという事実にある。
予測方法、弱い信号と外れ値の特定、早期発見、コンピュータ犯罪への迅速な対応が優先課題であり、予防と協力のアプローチが必要である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:25:27 GMT)
ELMO2EDS: Transforming Educational Credentials into Self-Sovereign Identity Paradigm [0.6] EMREXのような学術ネットワークは、学生と教育機関間のデジタル認証の交換をサポートする。
発行機関のデジタル署名は、デジタル認証の正当性を検証することができる。
本稿では,ELMO2EDSを提案する。ELMO2EDSは,EMREXから適切な自己主権IDデータフォーマットに変換するソリューションである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:27:02 GMT)
Management Decisions in Manufacturing using Causal Machine Learning -- To Rework, or not to Rework? [0.6] 本稿では,製造システムにおける最適リワークポリシーを推定するためのデータ駆動モデルを提案する。
我々は、任意の再作業ステップを可能にする、多段階のロットベースシステム内の単一のプロダクションステージについて検討する。
本研究では、因果機械学習、特にDML(Double/debiased Machine Learning)の手法を用いて、データから条件付き処理効果を推定する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:14:40 GMT)
Deep HM-SORT: Enhancing Multi-Object Tracking in Sports with Deep Features, Harmonic Mean, and Expansion IOU [0.5] Deep HM-SORTは、新しいオンライン多目的追跡アルゴリズムである。
外観と動きのバランスを保ち、IDスワップを著しく減少させる。
2つの大規模公開ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:41:14 GMT)
Outer Space Cyberattacks: Generating Novel Scenarios to Avoid Surprise [0.5] Reportは400万以上のシナリオプロンプトを生成するシナリオプロンプトジェネレータを提供する。
斬新なシナリオを想像できないことは、驚きと重傷を負う大きなリスクである。
外空間はサイバーセキュリティの次のフロンティアだ。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:20:17 GMT)
Beyond Bare Queries: Open-Vocabulary Object Retrieval with 3D Scene Graph [0.4] 既存のCLIPベースのオープンボキャブラリ手法は、単純な(悪い)クエリで3Dオブジェクトの検索に成功している。
本稿では,3次元空間グラフ表現を計量エッジで構築するBBQというモジュラー手法を提案する。
BBQは、3Dオブジェクトを形成するためにDINOを使ったロバストなアソシエーション、それらを2Dに投影する高度なレイキャストアルゴリズム、グラフノードとして記述するビジョン言語モデルを採用している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:55:40 GMT)
Simulation of chiral motion of excitation within the ground-state manifolds of neutral atoms [0.4] 中性原子中のレーザー誘起ゲージ場は磁場の効果を模倣する手段として用いられる。
我々は中性原子基底状態多様体内の原子励起におけるキラル運動を生成する方法を提案する。
提案手法は、ヘキサゴナル中性原子格子を実装するために容易に拡張することができ、ハルデンモデルを実現するための基本単位として機能する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:53:37 GMT)
Self-AMPLIFY: Improving Small Language Models with Self Post Hoc Explanations [0.4] Self-AMPLIFYは、サンプルをターゲットとし、合理性を生成し、In-Context Learning (ICL)を活用するための最後のプロンプトを構築する3段階のメソッドである。
Self-AMPLIFYは、自己回帰型言語モデルにポストホックな説明法を適用した最初の方法である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:52:29 GMT)
Satyrn: A Platform for Analytics Augmented Generation [0.4] 本稿では、構造化データの解析を用いて、検索された文書がRAGで使用されるのとほとんど同じように、生成をガイドするために使用される事実集合を生成するアプローチを提案する。
我々は、AAGを利用して大規模データベース上に構築された正確で流動的でコヒーレントなレポートを生成する、ニューロシンボリックなプラットフォームであるSatyrnを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:14:16 GMT)
HEDI: First-Time Clinical Application and Results of a Biomechanical Evaluation and Visualisation Tool for Incisional Hernia Repair [0.4] 大きなヘルニアに対するメッシュ修復は通常、筋肉の活性化、腹部内圧、組織弾性、腹部壁の伸展といった生体力学的要因を無視して、重なりが固定された欠損領域に基づいている。
HEDIは,Valsalva操作を用いたCTを用いて,ヘルニアの大きさ,容積,腹部壁の不安定性を自動的に検出し,評価するツールである。
31例の術前評価におけるHEDIの初回臨床応用は, 術後3年経過した後の無痛, ヘルニア再発を伴わない症例で, 報告例と比較して有意に改善した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:27:54 GMT)
Enhancing Recommendation Diversity by Re-ranking with Large Language Models [0.3] 大きな言語モデル(LLM)は、多様性の再ランク付けに使用することができる。
LLMは、多くの自然言語処理およびレコメンデーションタスクにおいて改善されたパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:09:57 GMT)
Multimodal Learning To Improve Segmentation With Intraoperative CBCT & Preoperative CT [0.2] 術中医療画像,特にCone-beam Computed Tomography(CBCT)は,コンピュータ支援による介入を促進する重要なツールである。
本稿では,CBCTとCTのほぼ一致したスキャンを融合するマルチモーダル学習法を提案する。
術前CTとシミュレートした術中CBCTの融合は,主にセグメンテーション性能を向上することを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:31:54 GMT)
Compressed representation of brain genetic transcription [0.2] ディープオートエンコーダは、パフォーマンスとターゲットドメインのすべての指標において優れた表現が得られることを示す。
ディープオートエンコーダは、パフォーマンスとターゲットドメインのすべての指標において優れた表現が得られることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:01:22 GMT)
Signatures From Pseudorandom States via $\bot$-PRFs [0.1] 我々は $bot$-PRG と $bot$-PRF の新たな定義を導入する。
私たちの主な応用は、古典的な公開鍵と署名を備えた(量子)デジタル署名スキームです。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:23:54 GMT)
LibProf: A Python Profiler for Improving Cold Start Performance in Serverless Applications [0.1] コールドスタートのレイテンシは、Pythonベースのサーバレスアプリケーションのエンドツーエンドのパフォーマンスに影響する。
動的プログラム解析を用いて非効率性を識別するPythonプロファイラであるLibProfを紹介する。
LibProfは、コールドスタート実行時の最大2.26倍の高速化とメモリ使用量の1.51倍の削減を実現した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:50:23 GMT)
YOLO9tr: A Lightweight Model for Pavement Damage Detection Utilizing a Generalized Efficient Layer Aggregation Network and Attention Mechanism [0.0] 本稿では,舗装損傷検出のための軽量物体検出モデルYOLO9trを提案する。
YOLO9trはYOLOv9アーキテクチャに基づいており、機能抽出とアテンション機構を強化する部分的なアテンションブロックを備えている。
このモデルは、最大136FPSのフレームレートを実現し、ビデオ監視や自動検査システムなどのリアルタイムアプリケーションに適合する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:31:43 GMT)
Witnessing network steerability of every bipartite entangled state without inputs [0.0] 絡み合いと非局所性は、ほとんどの量子情報プロトコルの鍵となるリソースである。
ネットワークステアビリティの線形証人は,任意のNPTバイパーティイト状態に対応する。
すべての二部共役状態に対して、量子非局所性の形式を観測することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:08:00 GMT)
WildlifeReID-10k: Wildlife re-identification dataset with 10k individual animals [0.0] WildlifeReID-10kは、30の既存の野生生物の再識別データセットのコレクションである。
海産カメ、霊長類、鳥類、アフリカの草食動物、海産哺乳類、家畜など多様な動物を含む。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:23:20 GMT)
Unbounded sequential multipartite nonlocality via violation of Mermin inequality [0.0] 量子非局所性は量子情報理論において重要な特徴である。
我々は、より多くのパーティとオブザーバチェーンからなるシステムにおけるシーケンシャルな非局所性について研究する。
以上の結果から, サブシステムの増加により, 観測者同士の非局所性の検出が可能となる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:28:16 GMT)
The Unfairness of $\varepsilon$-Fairness [0.0] 我々は、$varepsilon$-fairnessという概念が採用されれば、現実世界の文脈で最大に不公平な結果をもたらす可能性があることを示した。
本研究は,大学入学と信用リスク評価の2つの実例を用いて実施した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:38:17 GMT)
The Role of Bases in Quantum Optimal Control [0.0] 量子最適制御(QOC)は、パルスレベルで問題に取り組むことで量子技術の進歩を支援する。
応用基底の選択が最適化の品質に影響を及ぼすかどうかを問うため、基底関数の観点から異なるパラメトリを考察する。
問題依存に基づく基本選択はQOC効率に影響を及ぼす要因であり、そのアプローチに対するアドバイスを提供すると結論付けている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:03:52 GMT)
The Liouville Generator for Producing Integrable Expressions [0.0] ここでは、LIOUVILLE法と呼ばれる積分可能であることが保証される積分を生成する方法を提案する。
これは、リウヴィルの定理とシンボリック積分のためのパラレル・リッシュアルゴリズムに基づいている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:13:36 GMT)
The Base-Rate Effect on LLM Benchmark Performance: Disambiguating Test-Taking Strategies from Benchmark Performance [0.0] 応答トークン間のベースレート確率(BRP)差が重要であり,タスク性能に影響を及ぼすことを示す。
本研究では,MMLUのバリエーションであるNvr-X-MMLUタスクを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:14:10 GMT)
Systematic literature review on forecasting and prediction of technical debt evolution [0.0] 技術的負債(英: Technical debt、TD)とは、ソフトウェア品質の妥協によって生じる追加コストのこと。
本研究の目的は,ソフトウェア工学における既存の知識を探求し,研究と産業におけるアプローチの洞察を得ることである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:50:37 GMT)
State-insensitive wavelengths for light shifts and photon scattering from Zeeman states [0.0] フル超微細構造と磁気構造を含む非共鳴光散乱の解析を行った。
ゼーマン状態によらず、誘起原子双極子が同じである周波数偏差の集合が見つかる。
この特徴は光散乱による状態のデコヒーレンスを防ぎ、量子光学実験や量子情報応用に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:44:30 GMT)
Single-molecule motion control [0.0] 格子構造内の静電電荷から力を利用して単分子拡散を制御するための玩具モデルを提案する。
表面電荷密度は拡散に大きく影響し, クーロン力に類似した線形スケーリングを示す。
我々のモデルにより予測された分子軌道は、特に重力支援加速度のような挙動において、惑星運動に類似している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:54:32 GMT)
Simon's algorithm in the NISQ cloud [0.0] サイモンのアルゴリズムは、真に量子的優位性を示す最初の問題の1つである。
我々はSimonのアルゴリズムを使って、現在"量子クラウド"で利用可能なデバイスのエラー率をベンチマークします。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:31:44 GMT)
Should AI Optimize Your Code? A Comparative Study of Current Large Language Models Versus Classical Optimizing Compilers [0.0] 大規模言語モデル(LLM)は、コード最適化方法論に革命をもたらすAI駆動アプローチの可能性に関する興味深い疑問を提起する。
本稿では、GPT-4.0とCodeLlama-70Bの2つの最先端大言語モデルと従来の最適化コンパイラの比較分析を行う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 23:26:41 GMT)
Secure Cross-Chain Provenance for Digital Forensics Collaboration [0.0] ForensiCrossは、デジタル法医学と証明のために特別に設計されたクロスチェーンソリューションである。
BridgeChainを含み、クロスチェーンとマルチチェーンソリューションのためのユニークな通信プロトコルを備えている。
ForensiCrossは、データの完全性とトレーサビリティを保証することによって、共同調査の簡略化を目指している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:47:27 GMT)
Scalable Image Coding for Humans and Machines Using Feature Fusion Network [0.0] 本稿では,多数の画像認識モデルと互換性のある人や機械を対象とした,学習に基づくスケーラブルな画像符号化手法を提案する。
提案手法では,パラメータ数を削減しつつ,画像圧縮モデルを効率よく組み合わせることを確認する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 01:55:20 GMT)
Rethink Tree Traversal [0.0] 鍵となるアイデアは、内積探索の最大化による二分決定ツリーの移動である。
我々は、再帰的トラバースのない決定木メソッドを実装するだけでなく、木に基づくメソッドの分割の性質を掘り下げる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:34:32 GMT)
Requirements are All You Need: From Requirements to Code with LLMs [0.0] 大規模言語モデル(LLM)は、ソフトウェア工学のタスクに適用できる。
本稿では,要求文書からコードスニペットを自動生成するLLMについて述べる。
複雑なユーザ要件を解釈し、ロバストな設計とコードソリューションを作成する上で、LCMの熟練度を実証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:27:00 GMT)
Refining Coded Image in Human Vision Layer Using CNN-Based Post-Processing [0.0] 本稿では,ポストプロセッシングをスケーラブルな符号化方式に統合することにより,人間のデコード画像の品質を向上させる手法を提案する。
実験結果から, 後処理により圧縮性能が向上することが示された。
提案手法の有効性を従来の手法との比較により検証した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:23:01 GMT)
Reconstruction of Wigner function of electron beams based on coherence measurements [0.0] 電子ビームの密度行列とウィグナー関数の再構成法を開発した。
位相空間の原点におけるウィグナー関数に基づいて、軸方向の明るさを計算する公式を導出した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 04:17:18 GMT)
Quantumness of electron transport in quantum dot devices through Leggett-Garg inequalities: A non-equilibrium Green's function approach [0.0] 貯水池と相互作用する量子系の非マルコフ力学について検討する。
我々のアプローチは、他の量子多体系の量子性を目撃する新たな可能性を開く可能性が高い。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:15:57 GMT)
Quantum walk informed variational algorithm design [0.0] 量子変分アルゴリズム(QVA)における振幅伝達の解析のための理論的枠組みを提案する。
制約のない,制約のない新規最適化のためのアルゴリズムを開発する。
既存のQVAよりもコンバージェンスが改善された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:04:26 GMT)
Quantum versus classical quenches and the broadening of wave packets [0.0] 量子クエンチは主に扱うが、古典統計力学の枠組みにおける力学結果との比較は有用である。
一般的なウェーブパケットのダイナミクスをよりよく理解することのできる、ウィグナー関数の概念の簡単な導入法が提示されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:47:54 GMT)
Quantum metrology with a squeezed Kerr oscillator [0.0] 我々は,Kerr-非線形発振器のスクイーズダイナミクスについて検討し,その結果のメトロジー的有用性を定量化する。
本稿では, 線形二次度測定に先立って非線形に進行する手法として, 測定後相互作用プロトコルを提案する。
この結果は, エネルギー緩和などの現実的な不完全性を考慮した場合のロバストであり, 最先端の実験装置で実現可能である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:41:03 GMT)
Quantum interpretation of lattice paths [0.0] arivX:2311.12761では、講義ホールパスに基づく混合モーメントの代替モデルが導入された。
この接続を用いて、様々な分離可能な量子系における位置演算子のモーメントを計算する。
我々のアプローチは他の量子システムにも拡張できる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:02:21 GMT)
Quantum Property Testing Algorithm for the Concatenation of Two Palindromes Language [0.0] 本稿では,2つのパリンドロムを結合した文脈自由言語を認識するための量子特性試験アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:19:20 GMT)
Quantum Algorithm for a Stochastic Multicloud Model [0.0] 量子コンピューティングアルゴリズムは大気科学の問題に適用された。
マルチクラウドモデルの性質は、計算された量子状態の出力を利用して再現された。
この結果は、量子コンピュータが大気現象や海洋現象の問題を適切に解決できることを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:14:20 GMT)
Probing quantum chaos through singular-value correlations in sparse non-Hermitian SYK model [0.0] スパース非エルミート的Sachdev-Ye-Kitaev(SYK)モデルにおける特異値のスペクトルについて検討する。
以上の結果から,特異値の統計値と類似のエルミート・ガウスアンサンブルの統計値との一致が明らかとなった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:00:05 GMT)
Private Approximate Query over Horizontal Data Federation [0.0] 既存のアプローチは、プライバシを改善する暗号に頼っているが、クエリ応答時間を犠牲にしている。
本稿では,データ分散を意識したオンラインサンプリング手法を考案し,レンジクエリの実行を高速化する手法を提案する。
我々のソリューションは、基本的な非セキュアなソリューションよりも最大8倍高速な処理を提供できる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:19:58 GMT)
Polynomial Chaos Surrogate Construction for Random Fields with Parametric Uncertainty [0.0] サロゲートモデルは、複雑なモデルの高い計算コストを回避する手段を提供する。
我々は,ロゼンブラットによって実現された本質的およびパラメトリック不確実性の結合空間上でPCEサロゲートを開発する。
そこで我々は,PCE Sobol インデックスを計算するためのクローズドフォーム・ソリューションを利用して,モデル全体の感度解析を行う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:18:37 GMT)
Phase-resolved measurement of entangled states via common-path interferometry [0.0] 直交モードをコリニア基準として,双光子状態の位相を直接測定する方法を提案し,実験的に実証した。
特に有用な応用として、新しい手法を用いて、絡み合った光子の幾何学的位相蓄積を直接測定する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:02:14 GMT)
On the Baltimore Light RailLink into the quantum future [0.0] 本研究の目的は、NISQデバイスにおける固有のノイズをどのように活用し、現実世界の問題を効果的に解決できるかを明らかにすることである。
乱れの列車交通を管理するためのソリューションを生成・分析する。
我々の研究は、路面電車と鉄道の再スケジュールへの量子コンピューティングパラダイムの初歩的な応用を示している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:17:14 GMT)
Multimodal Security of Iris and Fingerprint with Bloom Filters [0.0] 本稿では, 虹彩, 指紋, 虹彩の確保に関する基本的な概念について述べる。
ここでは,虹彩に指紋を付加したブルームフィルタを用いて虹彩テンプレートを保護するシステムを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:54:22 GMT)
Multifractality in monitored single-particle dynamics [0.0] 繰り返し測定した単一粒子の時間発展におけるマルチフラクタル特性について検討した。
どちらの場合も、マルチフラクタルの挙動は波動関数のアンサンブルや、測定結果に条件付けられた確率分布に現れる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:07:43 GMT)
Mixed Integer Linear Programming Solver Using Benders Decomposition Assisted by Neutral Atom Quantum Processor [0.0] 本稿では、MILP(Mixed Linear Programming)を解くためのハイブリッド古典量子法を提案する。
我々は、MILPをマスター問題(MP)とサブプロブレム(SP)に分割するためにベンダー分解(BD)を適用する。
我々のMILPからQUBOへの変換は、関連する連続変数の上限を狭め、必要量子ビット数とアルゴリズムの収束に肯定的に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:20:00 GMT)
Lecture Notes on Quantum Algorithms in Open Quantum Systems [0.0] これらの講義ノートは、量子アルゴリズムにオープン量子システム理論を使用するための明確で包括的な紹介を提供することを目的としている。
主な議論は変分量子アルゴリズム、量子エラー補正、動的デカップリング、量子エラー緩和である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:00:25 GMT)
Large Language Models and Knowledge Graphs for Astronomical Entity Disambiguation [0.0] 本稿では,大規模言語モデル(LLM)と知識グラフクラスタリングを用いて,天体と関係を天文学的なテキストから抽出することに焦点を当てる。
この実験は、LLMと知識グラフクラスタリング技術を組み合わせて、天文学的な研究において情報抽出を行う可能性を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:38:03 GMT)
Koopmon trajectories in nonadiabatic quantum-classical dynamics [0.0] クープマン波動関数の理論に基づく混合量子古典(MQC)粒子法を提案する。
従来の MQC Ehrenfest シミュレーションでは達成できない精度のレベルを持つ完全量子シミュレーションの結果を再現する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:13:26 GMT)
Kondo-Zeno crossover in the dynamics of a monitored quantum dot [0.0] 金属浴に結合した量子ドットの力学について検討し, 電荷密度の連続モニタリングを行った。
浴槽に突如結合した初期偏極スピンの崩壊時間スケールは, 相互作用によって一生制御された近藤検層から量子ゼノ効果へのクロスオーバーを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:34:48 GMT)
KInIT at SemEval-2024 Task 8: Fine-tuned LLMs for Multilingual Machine-Generated Text Detection [0.0] SemEval-2024 Task 8は、マルチジェネレータ、マルチドメイン、マルチランガルブラックボックスマシン生成テキスト検出に重点を置いている。
提案手法は,第4位にランクインし,勝者のわずか1ポイント未満の競争結果を得た。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:43:28 GMT)
Influence of catastrophes and hidden dynamical symmetries on ultrafast backscattered photoelectrons [0.0] 光電子運動量分布におけるクーロンテールと軟化度の違いによるポテンシャルの利用効果について検討する。
クーロン相互作用に軟化を導入することは、後方散乱電子軌跡に関連するPSDで観察される隆起に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:57:05 GMT)
High-Dimensional Subspace Expansion Using Classical Shadows [0.0] 本研究では,地下状態推定の精度を高めるため,従来の影計測データに対する後処理手法を提案する。
提案手法のノイズ伝搬を解析的に検討し,古典的影におけるスナップショット数の制限による統計的変動の上限について検討した。
数値シミュレーションでは, 多くの場合, 時には1桁以上のエネルギー推定誤差を低減できる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:37:27 GMT)
Grammaticality Representation in ChatGPT as Compared to Linguists and Laypeople [0.0] 本研究は,148の言語現象について,住民の文法的判断を収集した以前の研究に基づいている。
我々の主な焦点は、これらの言語構成の判断において、ChatGPTを一般人と言語学者の両方と比較することであった。
全体として,ChatGPTと言語学者の間には73%から95%の収束率があり,全体としては89%と推定された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 00:23:16 GMT)
Grade Score: Quantifying LLM Performance in Option Selection [0.0] グレードスコア」は、大規模言語モデル(LLM)の一貫性と公平性を評価するために設計された新しい計量である
グレードスコアは、順序バイアスを測定するエントロピーと、選択安定性を評価するモード周波数を組み合わせる。
本研究は,グレードスコアを最適化するために,プロンプトエンジニアリングやオプションサンプリング戦略などの手法を探求する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 19:29:39 GMT)
Generalisation to unseen topologies: Towards control of biological neural network activity [0.0] 本稿では、この一般化問題を調査するために、異なるトポロジを持つニューロンネットワークを手続き的に生成する環境を導入する。
既存のトランスベースのアーキテクチャを調整し、深部RLエージェントの一般化性能を評価する。
エージェントは、限られた数のトレーニングネットワークから見えないテストネットワークへの制御を一般化する能力を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:53:39 GMT)
GPT-Powered Elicitation Interview Script Generator for Requirements Engineering Training [0.0] インタビュースクリプトの自動生成のための特殊なGPTエージェントを開発する。
GPTエージェントは、要件付与面接手順のガイドラインとベストプラクティスに合わせた専門知識ベースを備えている。
我々は,GPTの出力長制約を緩和し,網羅的で詳細なインタビュースクリプトを生成するために,プロンプトチェイン方式を採用する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:53:55 GMT)
GHZ protocols enhance frequency metrology despite spontaneous decay [0.0] グリーンベルガー=ホルン=ザイリンガー状態(GHZ)は,最大40個の原子のアンサンブルの基本的な境界に匹敵するゲインを得ることを示す。
この利得は、自然発生によるエラーの検出と緩和を可能にするベト信号から生じる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:23:20 GMT)
Fermion-parity qubit in a proximitized double quantum dot [0.0] ジョセフソン接合に埋め込まれた2つのトンネル結合量子ドットの局所フェルミオンパリティの量子情報を符号化する。
スイートスポットでは、クォービット状態は電荷双極子モーメントがゼロである。
これにより、各ドットの電位に作用する電荷ノイズと(弱)ドット間トンネルのゆらぎにより、クォービットが劣化するのを防ぐ。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:29:21 GMT)
Exploring Gamification in Quantum Computing: The Qubit Factory [0.0] Qubit Factory(クビットファクトリー)は、ゲーム化された量子回路シミュレータに基づくエンジニアリングスタイルのパズルゲームである。
量子状態、ゲート、回路を表現するための直感的な視覚言語を導入している。
各タスクは、少数のコンポーネントから構築された適切な古典/量子回路を構築し、実行する必要がある。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:08:53 GMT)
Explainable Artificial Intelligence and Multicollinearity : A Mini Review of Current Approaches [0.0] 説明可能な人工知能(XAI)手法は、機械学習モデルの内部メカニズムを理解するのに役立つ。
情報的特徴のリストは、XAIメソッドの最も一般的な出力の1つである。
マルチコリニアリティは、XAIが説明を生成するときに考慮すべき大きな問題の1つです。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:26:53 GMT)
Evaluating the Efficacy of Open-Source LLMs in Enterprise-Specific RAG Systems: A Comparative Study of Performance and Scalability [0.0] 本稿では,オープンソースの大規模言語モデル(LLM)とその検索・拡張生成(RAG)タスクへの応用について述べる。
この結果から,オープンソースのLCMと効果的な埋め込み技術が組み合わさって,RAGシステムの精度と効率を大幅に向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:22:25 GMT)
Evading AI-Generated Content Detectors using Homoglyphs [0.0] 既存のLCM検出器を回避できるホモグリフベースの攻撃を提示する。
最先端LCM検出器におけるホモグリフの有効性を評価するため, 総合評価を行った。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:07:32 GMT)
Estimating the Increase in Emissions caused by AI-augmented Search [0.0] 我々の推計では、エネルギー需要は60~70倍増加する。
これは、従来の探索におけるエネルギー消費の最新の推定に基づいている。
BLOOMモデル, 176Bパラメータモデル, OpenAI の ChatGPT に対するクエリのエネルギー需要に関する最近の研究。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:52:00 GMT)
Entropic Regression DMD (ERDMD) Discovers Informative Sparse and Nonuniformly Time Delayed Models [0.0] エントロピー回帰を用いた最適多段階動的モード分解モデルを決定する手法を提案する。
非一様時間空間を実現するために,高忠実度時間遅延MDDモデルを生成する手法を開発した。
これらのモデルは、非常に効率的で堅牢であることが示されている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:02:43 GMT)
Enforcing exact permutation and rotational symmetries in the application of quantum neural network on point cloud datasets [0.0] 量子機械学習の分野での最近の進歩は、量子回路の構造に物理対称性を取り入れるというアイデアを推進してきた。
回転と置換の両方に完全に不変な新しいQNN構造を提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:34:28 GMT)
Eigenvector Continuation and Projection-Based Emulators [0.0] 固有ベクトル継続はパラメトリック固有値問題の計算方法である。
還元基底法(reduce-basis method)と呼ばれる、より広範な部分空間射影技法のクラスの一部である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:52:48 GMT)
Effective Faraday interaction between light and nuclear spins of Helium-3 in its ground state: a semiclassical study [0.0] 我々は、23S-23P$遷移から遠く離れた光場と相互作用する23S$準安定状態のヘリウム3原子からなる系の半古典進化方程式を導出した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:41:12 GMT)
Dyons with phase $δ_θ=nθ$ [0.0] 電磁気束を囲む無限長のソレノイドを取り囲む場合、その波動関数は電磁双対変換の下で量子位相不変量を蓄積する。
この位相とウィッテン効果は、真空角$theta$に比例する位相位相を与える。
この位相は真空状態$delta_theta=ntheta$で量子化され、この量子化に関連する最も一般的な真空状態は、$theta$-vacuaのアベリア形式と同一であることを示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:17:29 GMT)
DustNet: skillful neural network predictions of Saharan dust [0.0] DustNetは8分未満でトレーニングし、デスクトップコンピュータ上で2秒で予測を生成する。
以上の結果から、DustNetは、気象パターンに対する塵の影響の理解を変える可能性のある、迅速かつ正確なAOD予測の可能性を示唆している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:15:30 GMT)
Duplicate Detection with GenAI [0.0] 大規模言語モデルと生成AIの最近の進歩により、重複したレコードの識別と修復が大幅に改善されることを示す。
一般的なベンチマークデータセットでは,NLP手法で30%から,提案手法で60%に改善した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:42:13 GMT)
Dual frame optimization for informationally complete quantum measurements [0.0] 実験周波数に基づくパラメタライズド・フレーム・スーパーオペレータと最適化自由なデュアル・フレームの新たなクラスを導入する。
興味深いことに、これは量子や古典的なコストがほとんどないため、デュアルフレームの最適化はランダム化測定ツールボックスに価値ある追加となる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:21:04 GMT)
Does the full configuration interaction method based on quantum phase estimation with Trotter decomposition satisfy the size consistency condition? [0.0] 本稿では,QPEに基づくフルCI計算において,時間発展演算子のトロッタ化により,サイズ整合性条件が維持可能であるか否かを検討する。
数値シミュレーションにより, トロッター分解条件を用いることで, 形状の整合性は自動的には損なわれないことが判明した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:50:34 GMT)
Dissecting van der Waals interactions with Density Functional Theory -- Wannier-basis approach [0.0] これは電子ベースの多体法であり、材料の完全な電子的および光学的応答特性を捉える。
ファン・デル・ワールズと誘導エネルギーを区別する基盤と、異方性と異なる積み重ねパターンの役割を提供する。
本研究の目的は、ファンデルワールスエネルギーを幅広い材料で測定するための新しい実験研究を刺激することである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:42:01 GMT)
Diffusion Generative Modelling for Divide-and-Conquer MCMC [0.0] Divide-and-conquer MCMCはマルコフ連鎖モンテカルロサンプリングの並列化戦略である。
本稿では,拡散生成モデルを用いて後続分布に密度近似を適合させる手法を提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:48:46 GMT)
Development of an Adaptive Multi-Domain Artificial Intelligence System Built using Machine Learning and Expert Systems Technologies [0.0] 人工知能(AGI)は、人工知能(AI)研究においてしばらくの間、明白な目標であった。
AGIは、人間のように、新しい問題領域にさらされ、それを学び、推論プロセスを使って意思決定する能力を持つでしょう。
本稿では,AGIの製作に向けての歩みについて述べる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:21:44 GMT)
Deriving three-outcome permutationally invariant Bell inequalities [0.0] 我々は,多くの3段階の政党からなるシステムに対してベルの不等式を導出する戦略を提案する。
我々の研究は、パラダイムスピン1モデルにおけるベル相関の検出や固体系や原子アンサンブルの実験に興味深い応用が期待できる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:41:27 GMT)
Demonstration of RIP gates in a quantum processor with negligible transverse coupling [0.0] 6量子ビット超伝導量子プロセッサにおいて、新しいマルチモードリニアバス干渉計(LBI)カプラを実演する。
このカプラの鍵となる特徴は、広い周波数範囲にわたるキュービット間の逆結合を排除した多経路干渉である。
単一キュービットゲートの同時動作とZZレート(600Hz以下)の低速化を実現した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:31:37 GMT)
Decentralized Credential Status Management: A Paradigm Shift in Digital Trust [0.0] 公共の鍵となるインフラは、インターネットのセキュリティに不可欠であり、堅牢な証明書管理と取り消しのメカニズムを保証する。
中央集中型システムから分散型システムへの移行は、信頼分散やプライバシ保護の資格管理といった課題を提示している。
本稿では,ブロックチェーン技術と高度な暗号技術に着目した,集中型から分散型フレームワークへの証明書状態管理の進化について検討する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 13:17:56 GMT)
DIDChain: Advancing Supply Chain Data Management with Decentralized Identifiers and Blockchain [0.0] ブロックチェーン技術を活用したフレームワークであるDIDChain、分散ID、InterPlanetary File Systemを紹介する。
DIDChainの中心は、アセットイベントのデジタルトレースを可能にするcheqdインフラストラクチャである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:25:05 GMT)
Cryogenic Compact mm-Wave Broadband SPST Switch in 22nm FDSOI CMOS for Monolithic Quantum Processors [0.0] 本稿では,22nmFDSOICMOS技術を用いた小型ミリ波ブロードバンド単極スイッチ(SPST)の低温特性について報告する。
2Kでの低温測定では、2.3dB未満の挿入損失、25.3dB未満の分離損失、および11.5dB以下の戻り損失が、DCから70GHzまでの全周波数範囲で示される。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:33:48 GMT)
Cryogenic Compact Low-Power 60GHz Amplifier for Spin Qubit Control in Monolithic Silicon Quantum Processors [0.0] 電子/ホールスピン量子ビット制御のための極低温小型低消費電力60GHz増幅器を報告した。
増幅器は15dBのS21を59GHz、BW3dBの52.5-67.5GHz、消費電力は2.16mWである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:50:27 GMT)
Controlling the color appearance of objects by optimizing the illumination spectrum [0.0] 我々は、自然に白く見えるようにして、特定のターゲット色を変更する革新的な照明システムを開発した。
本システムでは, メタメリズムを誘導する材料に対して, 照明の最適SPDを算出する。
我々は2024年のパリファッションウィークでシステムの実装を実演した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:49:20 GMT)
Constructing Ancestral Recombination Graphs through Reinforcement Learning [0.0] 我々は、短い祖先組換えグラフを構築するための新しいアプローチを提案する:強化学習(RL)。
我々は、一組の遺伝的配列とその最も最近の共通の祖先の最も短い経路を見つけることと、迷路の入り口と出口の間の最も短い経路を見つけることの類似性を生かしている。
以上の結果から,RLは短いARGを構築するために最適化されたアルゴリズムで構築されたARGと同等に短時間で構築できることがわかった。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:42:03 GMT)
Constraint based Modeling according to Reference Design [0.0] ベストプラクティスという形での参照モデルは、再利用のための設計としての知識を確保するための重要な要素である。
本稿では,セマンティック技術を用いた参照モデルの形式記述のための汎用的アプローチとその応用について述べる。
システム設計の文脈で複数の参照モデルを使用することが可能である。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:41:27 GMT)
Constrained dynamics and confinement in the two-dimensional quantum Ising model [0.0] 量子イジングモデルの2次元2乗格子上のダイナミクスを最大16倍16$スピンで調べる。
秩序相では、モデルが動的に制約されたダイナミックスを示すと予測され、励起の制限と遅い熱化が生じる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 18:01:34 GMT)
Compound Schema Registry [0.0] 本稿では,複合AIシステムによって促進される一般化スキーマ進化(GSE)の利用を提案する。
このシステムは、スキーマ変更のセマンティクスを解釈するために、LLM(Large Language Models)を使用する。
我々のアプローチには、中間表現としてスキーママッピングを生成するためのタスク固有言語である変換言語(STL)の開発が含まれる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:50:46 GMT)
Coherence via reiterated beam splitting [0.0] ビームスプリッタのカスケードによるコヒーレンスの増加について検討した。
我々は2つの異なる構成を構築し、入力状態の異なるシーケンスを解析する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 14:25:30 GMT)
Coherence of an Electronic Two-Level System under Continuous Charge Sensing by a Quantum Dot Detector [0.0] 連続電荷検出における電子2レベル系の二重量子ドットにおける量子コヒーレンスを実験的に検討した。
2レベルシステムの電荷状態は、容量結合した単一量子ドット検出器によって監視される。
本研究では,検出器の電荷変動によって引き起こされるレベルデチューニング変動に起因するデコヒーレンス率のモデルを提案する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:09:33 GMT)
CodeGemma: Open Code Models Based on Gemma [0.0] 私たちは、Gemma上に構築された特別なオープンコードモデルのコレクションであるCodeGemmaを紹介します。
CodeGemma 7B pretrained (PT) と instruction-tuned (IT) の変種は、非常に弾力的な自然言語理解を持っている。
CodeGemma 2Bは、レイテンシに敏感な設定で高速なコード入力とオープンな生成のために設計された、最先端のコード補完モデルである。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:54:35 GMT)
Class Symbolic Regression: Gotta Fit 'Em All [0.0] 我々は,複数のデータセットに正確に適合する単一解析関数形式を自動的に見つけるための,最初のフレームワークである「クラスシンボリック回帰(Class Symbolic Regression)」を紹介した。
この階層的な枠組みは、単一の物理現象の全てのメンバーが共通の法則に従うという共通の制約を利用する。
本稿では,このようなアルゴリズムの評価に特化して設計された,一連の合成物理課題を含む,最初のクラスSRベンチマークを紹介する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 20:58:31 GMT)
Characterization of overparametrization in the simulation of realistic quantum systems [0.0] 量子コンピューティングデバイスは、量子状態を作成し、他の量子システムをシミュレートするために、実験パラメータを例外的に制御する必要がある。
このような最適制御パラメータを見つけるために使用される古典的な最適化手順は、様々な学習様式を示すために理想化された設定で示されてきた。
この結果から,パラメーターアゼは環境からエントロピー効果を緩和し,その応用と短期量子デバイスにおける実験的実現の機会を提供することを示した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:08:01 GMT)
Calibrating Where It Matters: Constrained Temperature Scaling [0.0] 臨床意思決定者は、キャリブレーションされた分類器を使用して、自身のコスト関数から期待されるコストを最小限にすることができる。
皮膚内視鏡画像の分類を訓練したコンブネットを用いて,キャリブレーションの改善を実演した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 12:14:31 GMT)
CHG Shapley: Efficient Data Valuation and Selection towards Trustworthy Machine Learning [0.0] 本稿では,モデル学習におけるモデル精度に基づく各データサブセットの有用性を近似したCHG Shapleyを提案する。
リアルタイムデータ選択にはCHG Shapleyを用い,その有効性を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 16:48:31 GMT)
Boosting projective methods for quantum process and detector tomography [0.0] 本稿では,量子プロセスと検出器トモグラフィーの2つの方法を紹介する。
量子プロセストモグラフィでは、量子チャネルの線形反転推定を投影する解析手法を開発する。
第2の方法は、このアプローチを量子検出器トモグラフィーに拡張し、優れた効率性を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:30:04 GMT)
Blockchain for Academic Integrity: Developing the Blockchain Academic Credential Interoperability Protocol (BACIP) [0.0] 本研究はアカデミック・クレデンシャル・プロトコル(BACIP)を紹介する。
BACIPは、世界中の学術的資格証明のセキュリティ、プライバシー、相互運用性を大幅に強化するように設計されている。
予備的な評価は、BACIPが認証効率を高め、改ざんや不正アクセスに対するセキュリティを強化することを示唆している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 06:11:51 GMT)
Bloch sphere representation for Rabi oscillation driven by Rashba field in the two-dimensional harmonic confinement [0.0] 二次元(2次元)高調波閉じ込め系に印加されたラシュバ場によって駆動されるラビ振動の動的特性について検討した。
2状態回転波 (TSRW) を用いて, 時間とともに$theta_B$ および $phi_B$ の基本特性を検討した。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 11:56:17 GMT)
Bias in Text Embedding Models [0.0] 本稿では,一般的なテキスト埋め込みモデルの選択が,特に性別次元に偏りがある程度について検討する。
この分析によると、テキストの埋め込みモデルは男女差が多いが、様々な方法がある。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:58:36 GMT)
Benchmarking of LLM Detection: Comparing Two Competing Approaches [0.0] 本稿では LLM テキスト認識の分野について概観する。
LLM生成テキスト認識のための異なるアプローチと実装された検出器について述べる。
実装の議論に加えて、その記事は検出器のベンチマークに焦点を当てている。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 15:51:46 GMT)
Bell inequalities as a tool to probe quantum chaos [0.0] 非局所性の存在と量子カオスの関連性を探る。
我々の研究はベル非局所性、量子カオス、ランダム行列理論の間の興味深い関係を示唆している。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 17:41:21 GMT)
Asymmetric node placement in fiber-based quantum networks [0.0] 既存のインフラによって課される制限は、将来の量子ネットワークのノード間でさらに間隔を縮めるのを難しくする。
我々は、連鎖内の処理ノード量子リピータと同様に、エンタングルメント生成に必要なミドルポイントステーションの配置を別々に検討する。
一つの絡み合い試行に要する時間は、中間点の非対称性と直線的に増加するが、有意な絡み合い発生の成功確率と忠実度、繰り返し鎖の分布時間と誤り率はすべて、非対称性の量に関して第1の導関数を消滅させる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 21:20:47 GMT)
An Autonomous Vision-Based Algorithm for Interplanetary Navigation [0.0] 視覚に基づくナビゲーションアルゴリズムは、軌道決定法と画像処理パイプラインを組み合わせることで構築される。
光収差と光時間効果の1次近似を提供する新しい解析モデルを開発した。
アルゴリズムの性能は、高忠実な地球-火星間移動で試験される。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 22:17:54 GMT)
Active search for Bifurcations [0.0] 本研究では,ベイズ最適化を応用してサドルノードやホップ分岐を発見する能動的学習フレームワークを提案する。
本質的なシステムにおける不確実性定量化の枠組みを提供する。
また、資源限定の宇宙探査システムにおける不確実性定量化のためのフレームワークも提供する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 02:01:17 GMT)
AFS-BM: Enhancing Model Performance through Adaptive Feature Selection with Binary Masking [0.0] 連立マスキングによる適応的特徴選択(AFS-BM)について紹介する。
トレーニングプロセス中に特徴セットとモデルパラメータを継続的に適応するために、共同最適化とバイナリマスキングを実施します。
以上の結果から,AFS-BMの精度は大幅に向上し,計算量も大幅に削減された。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 10:22:06 GMT)
A Representative Framework for Implementing Quantum Finite Automata on Real Devices [0.0] ゲート型量子コンピュータのための量子有限オートマトンアルゴリズムの実装のためのフレームワークを提案する。
まず、文献から既知の理論結果をコンパイルし、CNOTゲートの数を減らした。
第2に、利用可能な量子ハードウェアの基底ゲートに基づいてアルゴリズムを修正する手法を実証する。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 09:28:24 GMT)
A New Index for Clustering Evaluation Based on Density Estimation [0.0] クラスタリングの内部評価のための新しい指標が導入された。
インデックスは2つのサブインデックスの混合として定義される。
新しいインデックスの性能をテストする実験を行う。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 07:27:57 GMT)
A Dictionary Based Approach for Removing Out-of-Focus Blur [0.0] アウト・オブ・フォーカスのぼかし除去作業のための高速・高精度画像超解法アルゴリズムの拡張を提案する。
資産配分管理に基づく計量に基づくブレンディング戦略も提案する。
本手法は,一般的な脱臭法と比較して約13%(PSNR)と10%(SSIM)の平均的な増加を示す。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 08:42:03 GMT)
A Collaborative Data Analytics System with Recommender for Diverse Users [0.0] SLEGOは、経験豊富な開発者と初心者のギャップを埋める、共同分析プラットフォームである。
これにより、開発者は分析ツールを共有できると同時に、初心者のユーザはプログラミングスキルを使わずに包括的な分析パイプラインを構築することができる。
論文参考訳(メタデータ) (Mon, 17 Jun 2024 05:59:13 GMT)