Google DeepMind、Webとロボットから学びロボット制御するVLAモデル「RT-2」公開─事前トレーニングにないタスクでも動作 | 知財図鑑
米Google傘下のGoogle DeepMindは米国時間7月28日、Webとロボットデータの両方から学習してロボットの動作指示に変換するAIモデル「RT-2(Robotic Transformer 2)」を公開した。
RT-2は、Web上のテキストや画像、ロボットの言語コマンド・カメラ画像・タスクアクションなどのデータを学習し、ロボットの行動を制御する、世界初の視覚-言語-行動(VLA:vision-language-action)モデルだ。
https://chizaizukan.com/news/RqbFUsPWULatuv8uyteu5/