H-EmbodVis

university

https://github.com/H-EmbodVis

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

HyperbolicCurve new activity 1 day ago

H-EmbodVis/VEGA-3D-Spatial-Reasoning:Add model card, pipeline tag, and links to paper/code

LMD0311 authored a paper about 2 months ago

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

LMD0311 submitted a paper 2 months ago

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

View all activity

Papers

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models

View all Papers

H-EmbodVis 's papers 6

Submitted by

Xin Zhou

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

H-EmbodVis

64 2

Submitted by

Dingkang Liang

116

When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models

H-EmbodVis

68 4

Submitted by

Dingkang Liang

157

Out of Sight but Not Out of Mind: Hybrid Memory for Dynamic Video World Models

H-EmbodVis

259 4

Submitted by

Dingkang Liang

Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding

H-EmbodVis

419 5

Submitted by

Dingkang Liang

Towards Generalizable Robotic Manipulation in Dynamic Environments

H-EmbodVis

219 2

Submitted by

Dingkang Liang

Cook and Clean Together: Teaching Embodied Agents for Parallel Task Execution

H-EmbodVis

362 2

AI & ML interests

Recent Activity

Papers

Team members 7

HERMES++: Toward a Unified Driving World Model for 3D Scene Understanding and Generation

When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models

Out of Sight but Not Out of Mind: Hybrid Memory for Dynamic Video World Models

Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding

Towards Generalizable Robotic Manipulation in Dynamic Environments

Cook and Clean Together: Teaching Embodied Agents for Parallel Task Execution