Добавить новость
News in English





160*600

Новости сегодня на DirectAdvert

Новости сегодня от Adwile

Актуальные новости сегодня от ValueImpression.com


Опубликовать свою новость бесплатно - сейчас


NVIDIA adds Cosmos Policy to its world foundation models

Cosmos Policy represents an early step toward adapting world foundation models for robot control and planning, NVIDIA says. | Source: NVIDIA

NVIDIA Corp. is continuously expanding its NVIDIA Cosmos world foundation models, or WFMs, to tackle problems in robotics, autonomous vehicle development, and industrial vision AI. The company recently introduced Cosmos Policy, its latest research on advancing robot control and planning using Cosmos WFMs.

Cosmos Policy is a new robot control policy that post-trains the Cosmos Predict-2 world foundation model for manipulation tasks. It directly encodes robot actions and future states into the model, achieving state-of-the-art (SOTA) performance on LIBERO and RoboCasa benchmarks, said NVIDIA.

The company obtained Cosmos Policy by fine-tuning Cosmos Predict, a WFM trained to predict future frames. Instead of introducing new architectural components or separate action modules, Cosmos Policy adapts the pretrained model directly through a single stage of post-training on robot demonstration data.

The NVIDIA researchers defined a policy as the system’s decision-making brain that maps observations (such as camera images) to physical actions (like moving a robotic arm) to complete tasks.

What’s different about Cosmos Policy?

The breakthrough of Cosmos Policy is how it represents data, explained NVIDIA. Instead of building separate neural networks for the robot’s perception and control, it treats robot actions, physical states, and success scores just like frames in a video.

All of these are encoded as additional latent frames. These are learned using the same diffusion process as video generation, allowing the model to inherit its pre-learned understanding of physics, gravity, and how scenes evolve over time. “Latent” refers to the compressed, mathematical language a model uses to understand data internally (rather than raw pixels).

As a result, a single model can:

  • Predict action chunks to guide robotic movement using hand-eye coordination (i.e., visuomotor control)
  • Predict future robot observations for world modeling
  • Predict expected returns (i.e. value function) for planning

All three capabilities are learned jointly within one unified model. Cosmos Policy can be deployed either as a direct policy, where only actions are generated at inference time, or as a planning policy, where multiple candidate actions are evaluated by predicting their resulting future states and values.

More about Cosmos Predict

Recent work in robotic manipulation has increasingly relied on large pretrained backbones to improve generalization and data efficiency, NVIDIA noted. Most of these approaches build on vision-language models (VLMs) trained on large-scale image–text datasets and fine-tuned to predict robot actions.

These models learn to understand videos and describe what they see, but they do not learn how to physically perform actions. A VLM can suggest high-level actions like “Turn left” or “Pick up the purple cup,” but it does not know how to carry them out precisely.

In contrast, WFMs are trained to predict how scenes evolve over time and generate temporal dynamics with videos. These capabilities are directly relevant to robot control, where actions must account for how the environment and the robot’s own state change over time.

Cosmos Predict is trained for physical AI using a diffusion objective over continuous spatiotemporal latents, enabling it to model complex, high-dimensional, and multimodal distributions across long temporal horizons.

NVIDIA said this design makes Cosmos Predict a suitable foundation for visuomotor control:

  • The model already learns state transitions through future-frame prediction.
  • Its diffusion formulation supports multimodal outputs, which is critical for tasks with multiple valid action sequences.
  • The transformer-based denoiser can scale to long sequences and multiple modalities.

Cosmos Policy is built on post-trained Cosmos Predict2 to generate robot actions alongside future observations and value estimates, using the model’s native diffusion process. This allows the policy to fully inherit the pretrained model’s understanding of temporal structure and physical interaction while remaining simple to train and deploy.



Inside the early results

Cosmos Policy is evaluated across simulation benchmarks and real-world robot manipulation tasks, comparing against diffusion-based policies trained from scratch, video-based robot policies, and fine-tuned vision-language-action (VLA) models.

Cosmos Policy is evaluated on LIBERO and RoboCasa, two standard benchmarks for multi-task and long-horizon robotic manipulation. On LIBERO, Cosmos Policy consistently outperforms prior diffusion policies and VLA-based approaches across task suites, particularly on tasks that require precise temporal coordination and multi-step execution.

ModelSpatial SR (%)Object SR (%)Goal SR (%)Long SR (%)Average SR (%)
Diffusion Policy78.392.568.350.572.4
Dita97.494.893.283.692.3
π096.898.895.885.294.2
UVA------90.0--
UniVLA96.596.895.692.095.2
π0.598.898.298.092.496.9
Video Policy------94.0--
OpenVLA-OFT97.698.497.994.597.1
CogVLA98.698.896.695.497.4
Cosmos Policy (NVIDIA)98.1100.098.297.698.5

On RoboCasa, Cosmos Policy can achieve higher success rates than baselines trained from scratch, demonstrating improved generalization across diverse household manipulation scenarios.

Model# Training Demos per TaskAverage SR (%)
GR00T-N130049.6
UVA5050.0
DP-VLA300057.3
GR00T-N1 + DreamGen300 (+10000 synthetic)57.6
GR00T-N1 + DUST30058.5
UWM100060.8
π030062.5
GR00T-N1.530064.1
Video Policy30066.0
FLARE30066.4
GR00T-N1.5 + HAMLET30066.4
Cosmos Policy (NVIDIA)5067.1

In both benchmarks, initializing from Cosmos Predict provides a significant performance advantage over training equivalent architectures without video pretraining, said the NVIDIA researchers.

When deployed as a direct policy, Cosmos Policy already matches or exceeds state-of-the-art performance on most tasks. When enhanced with model-based planning, the researchers said they observed a 12.5% higher task completion rate on average in two challenging real-world manipulation tasks.

Cosmos Policy is also evaluated on real-world bimanual manipulation tasks using the ALOHA robot platform. The policy can successfully execute long-horizon manipulation tasks directly from visual observations, said NVIDIA.

The post NVIDIA adds Cosmos Policy to its world foundation models appeared first on The Robot Report.


Загрузка...

Загрузка...

Читайте на сайте

Другие проекты от 123ru.net








































Другие популярные новости дня сегодня


123ru.net — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 123ru.net.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.



Новости 24/7 Все города России




Загрузка...


Топ 10 новостей последнего часа






Персональные новости

123ru.net — ежедневник главных новостей Вашего города и Вашего региона. 123ru.net - новости в деталях, свежий, незамыленный образ событий дня, аналитика минувших событий, прогнозы на будущее и непредвзятый взгляд на настоящее, как всегда, оперативно, честно, без купюр и цензуры каждый час, семь дней в неделю, 24 часа в сутки. Ещё больше местных городских новостей Вашего города — на порталах News-Life.pro и News24.pro. Полная лента региональных новостей на этот час — здесь. Самые свежие и популярные публикации событий в России и в мире сегодня - в ТОП-100 и на сайте Russia24.pro. С 2017 года проект 123ru.net стал мультиязычным и расширил свою аудиторию в мировом пространстве. Теперь нас читает не только русскоязычная аудитория и жители бывшего СССР, но и весь современный мир. 123ru.net - мир новостей без границ и цензуры в режиме реального времени. Каждую минуту - 123 самые горячие новости из городов и регионов. С нами Вы никогда не пропустите главное. А самым главным во все века остаётся "время" - наше и Ваше (у каждого - оно своё). Время - бесценно! Берегите и цените время. Здесь и сейчас — знакомства на 123ru.net. . Разместить свою новость локально в любом городе (и даже, на любом языке мира) можно ежесекундно (совершенно бесплатно) с мгновенной публикацией (без цензуры и модерации) самостоятельно - здесь.



Загрузка...

Загрузка...

Экология в России и мире




Путин в России и мире

Лукашенко в Беларуси и мире



123ru.netмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

123ru.net — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.






Здоровье в России и мире


Частные объявления в Вашем городе, в Вашем регионе и в России






Загрузка...

Загрузка...





Друзья 123ru.net


Информационные партнёры 123ru.net



Спонсоры 123ru.net