Fugu-MT 論文翻訳(概要): Self-supervised Rubik's Cube Solver

論文の概要: Self-supervised Rubik's Cube Solver

arxiv url: http://arxiv.org/abs/2106.03157v1
Date: Sun, 6 Jun 2021 15:38:50 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-13 13:35:58.755721
Title: Self-supervised Rubik's Cube Solver
Title（参考訳）: 自己監督型ルービックキューブ溶液
Authors: Kyo Takano
Abstract要約: この研究は、ディープニューラルネットワーク(DNN)が、自己教師付き学習によってのみ問題を解決できることを実証している。 1000ドル(約1万1000円)のルービックキューブのインスタンスで試し、DNNはそれらをほぼ最適に解決しました。他の問題や現実世界のアプリケーションには、その単純さ、安定性、堅牢性によって有用である可能性がある。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This work demonstrates that deep neural networks (DNNs) can solve a combinatorial problem merely through self-supervised learning. While researchers have employed explicit logic, heuristics, and reinforcement learning to tackle combinatorial problems, such methods are often complex and costly to implement, requiring lots of knowledge, coding, and adjustments. Hence, in the present study, I propose a robust and straightforward method of self-supervised learning to solve a combinatorial problem. Specifically, taking Rubik's Cube as an example, this work shows that a DNN can implicitly learn convoluted probability distributions of optimal choices from randomly generated combinations. Tested on $1,000$ Rubik's Cube instances, a DNN successfully solved all of them near-optimally. Although the proposed method is validated only on Rubik's Cube, it is potentially useful for other problems and real-world applications with its simplicity, stability, and robustness.
Abstract（参考訳）: この研究は、ディープニューラルネットワーク(DNN)が、自己教師付き学習によってのみ組合せ問題を解くことを実証している。研究者は、組合せ問題に取り組むために明示論理、ヒューリスティック、強化学習を取り入れているが、そのような手法は、しばしば複雑で、実装にコストがかかり、多くの知識、コーディング、調整が必要となる。そこで本研究では,組合せ問題を解くための自己教師あり学習のロバストで簡単な手法を提案する。具体的には、ルビックキューブを例として、DNNがランダムに生成された組合せから最適な選択の複雑な確率分布を暗黙的に学習できることを示す。 1000ドルのrubikのキューブインスタンスでテストしたところ、dnnはこれらすべてをほぼ最適に解決できた。提案手法はルービックキューブでのみ検証されるが, 単純性, 安定性, 堅牢性を有する他の問題や実世界の応用に有用である可能性がある。

関連論文リスト

CubeRobot: Grounding Language in Rubik's Cube Manipulation via Vision-Language Model [1.644433638087587]
3x3ルービックキューブを解くのに適した視覚言語モデル(VLM)であるCubeRobotを紹介する。 VLM生成計画クエリからタスク関連機能を抽出するパラダイムとして,デュアルループのVisionCoTアーキテクチャとメモリストリームを組み込んだ。低レベルのルービックキューブの復元作業では、キューブロボットは100%の精度を達成し、中程度のタスクでは100%に似ており、高レベルのタスクでは80%の精度を達成した。
論文参考訳（メタデータ） (2025-03-25T02:23:47Z)
A Machine Learning Approach That Beats Large Rubik's Cubes [32.8176720435354]
本稿では,非常に大きなグラフ上でのパスフィニング問題に対する,機械学習に基づく新しいアプローチを提案する。 4x4x4 と 5x5x5 のルービック立方体に対する解を見つけることで、その効率性を実証する。
論文参考訳（メタデータ） (2025-02-18T20:22:38Z)
Node Classification and Search on the Rubik's Cube Graph with GNNs [55.2480439325792]
本研究では3x3x3ルービックのルービック問題を解くための深部幾何学モデルの応用に焦点を当てた。まず、立方体のグラフ表現と距離をモデルの最適化目的として定義することから始める。距離近似タスクはノード分類問題として再構成され、グラフニューラルネットワーク(GNN)を用いて効果的に処理される。
論文参考訳（メタデータ） (2025-01-30T18:52:43Z)
Solving Rubik's Cube Without Tricky Sampling [0.6445605125467574]
ルービックキューブはその広大な州空間とまばらな報酬構造を持ち、強化学習にとって重要な課題である。従来の研究では、解決された状態からコスト・ツー・ゴーの見積を伝播し、探索手法を取り入れることによって、この問題に対処していた。本稿では, ポリシ勾配法を用いて, ほぼ解決状態サンプリングに依存することなく, ルービックキューブを解く新しいRLアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-11-29T09:56:40Z)
Solving a Rubik's Cube Using its Local Graph Structure [13.219469732742354]
ルービックスキューブには6つの面と12の可能なアクションがあり、小さくて制約のないアクション空間に繋がる。ルービックスキューブはグラフとして表すことができ、立方体の状態はノードであり、作用はエッジである。グラフ畳み込みネットワークに基づいて、スクランブルされたルービックスキューブの解を見つけるための新しい探索アルゴリズムを設計する。
論文参考訳（メタデータ） (2024-08-15T05:39:52Z)
AlphaMapleSAT: An MCTS-based Cube-and-Conquer SAT Solver for Hard Combinatorial Problems [13.450216199781671]
本稿では,新しいモンテカルロ木探索法であるAlphaMapleSATを紹介する。対照的に、我々の重要な革新は、演能的に駆動されるMCTSベースのルックアヘッドキューブ技術であり、効率的な立方体を見つけるためにより深い探索を行う。
論文参考訳（メタデータ） (2024-01-24T19:37:10Z)
A Novel Normalized-Cut Solver with Nearest Neighbor Hierarchical Initialization [107.07093621337084]
正規化カット(N-Cut)は、スペクトルクラスタリングの有名なモデルである。 1)正規化ラプラシア行列の連続スペクトル埋め込みを計算する; 2)$K$-meansまたはスペクトル回転による離散化。有名な座標降下法に基づく新しいN-Cut解法を提案する。
論文参考訳（メタデータ） (2023-11-26T07:11:58Z)
On Solving the Rubik's Cube with Domain-Independent Planners Using Standard Representations [7.470087627607195]
本稿では,人気のあるPDDL言語における最初のルービックキューブ表現について述べる。 1つの比較実験で、DeepCubeAは様々な複雑さを持つ全ての問題を解き、78.5%しか最適計画ではないことがわかった。我々の研究は、表現的選択と計画最適性の間のトレードオフに関する貴重な洞察を提供する。
論文参考訳（メタデータ） (2023-07-25T14:52:23Z)
Multi-Phase Relaxation Labeling for Square Jigsaw Puzzle Solving [73.58829980121767]
本稿では,大域最適化に基づく二乗ジグソーパズルの解法を提案する。この手法は完全に自動化されており、事前情報を前提とせず、未知または未知のピースオリエンテーションでパズルを扱うことができる。
論文参考訳（メタデータ） (2023-03-26T18:53:51Z)
Learning To Dive In Branch And Bound [95.13209326119153]
グラフニューラルネットワークを用いて特定の潜水構造を学習するためのL2Diveを提案する。我々は、変数の割り当てを予測するために生成モデルを訓練し、線形プログラムの双対性を利用して潜水決定を行う。
論文参考訳（メタデータ） (2023-01-24T12:01:45Z)
Learning to Optimize Permutation Flow Shop Scheduling via Graph-based Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文参考訳（メタデータ） (2022-10-31T09:46:26Z)
The Machine Learning for Combinatorial Optimization Competition (ML4CO): Results and Insights [59.93939636422896]
ML4COは、キーコンポーネントを置き換えることで最先端の最適化問題を解決することを目的としている。このコンペティションでは、最高の実現可能なソリューションを見つけること、最も厳密な最適性証明書を生成すること、適切なルーティング設定を提供すること、という3つの課題があった。
論文参考訳（メタデータ） (2022-03-04T17:06:00Z)
Winning solutions and post-challenge analyses of the ChaLearn AutoDL challenge 2019 [112.36155380260655]
本稿では,ChaLearnのAutoDLチャレンジシリーズの結果と今後の課題について述べる。その結果,一般的なニューラルネットワーク探索(NAS)は実用的ではなかったものの,DL手法が支配的であったことが示唆された。メタラーナー"、"データインジェクタ"、"モデルセレクタ"、"モデル/ラーナー"、"評価器"を特徴とする、ハイレベルなモジュール化組織が登場した。
論文参考訳（メタデータ） (2022-01-11T06:21:18Z)
CubeTR: Learning to Solve The Rubiks Cube Using Transformers [0.0]
ルービックス立方体は、可能な構成の五重項に対して単一の解状態を持ち、非常にスパースな報酬をもたらす。提案モデルであるCubeTRは、より長いアクションシーケンスに参加し、スパース報酬の問題に対処する。
論文参考訳（メタデータ） (2021-11-11T03:17:28Z)
Learning by Fixing: Solving Math Word Problems with Weak Supervision [70.62896781438694]
数学用語問題(mwps)の従来のニューラルネットワークソルバは、完全な監視によって学習され、多様なソリューションを生み出すことができない。 MWPを学習するためのテキスト弱教師付きパラダイムを提案する。この手法は最終回答のアノテーションのみを必要とし、単一の問題に対して様々な解決策を生成できる。
論文参考訳（メタデータ） (2020-12-19T03:10:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。