Edit Models filters

Model Tree

Apps

llama.cpp

LM Studio

Inference Providers

OVHcloud AI Endpoints

Misc

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

Models

603

Base only

Active filters: modelopt

nvidia/llama-nemotron-embed-vl-1b-v2-fp8

sakamakismile/Qwen3.6-27B-Text-NVFP4-MTP

Text Generation • 17B • Updated Apr 29 • 594k • 71

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated 27 days ago • 1.2M • 73

nvidia/GLM-5.1-NVFP4

Text Generation • 382B • Updated 11 days ago • 56.3k • 32

LilaRest/gemma-4-31B-it-NVFP4-turbo

Text Generation • 33B • Updated Apr 10 • 111k • 290

sakamakismile/Huihui-Qwen3.6-27B-abliterated-NVFP4-MTP

Text Generation • 17B • Updated 7 days ago • 142k • 56

AEON-7/Gemma-4-12B-it-AEON-Abliterated-K4-FP8

Text Generation • 12B • Updated about 12 hours ago • 139 • 6

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 8.75k • 31

nvidia/Kimi-K2.6-NVFP4

Text Generation • Updated 23 days ago • 830k • 32

0xSero/Step-3.7-Flash-173B

Image-Text-to-Text • 104B • Updated 1 day ago • 533 • 4

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 409k • 53

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP-XS

Text Generation • 17B • Updated 3 days ago • 71.3k • 41

nilayparikh/Qwen3.6-27B-Text-NVFP4-MTP-GGUF

Text Generation • Updated 8 days ago • 5.89k • 8

AxionML/Gemma-4-12B-FP8

Image-Text-to-Text • 12B • Updated 4 days ago • 4.67k • 3

vrfai/gemma-4-12B-it-nvfp4

Text Generation • 8B • Updated 1 day ago • 1.49k • 3

0xSero/Step-3.7-Flash-148B

Image-Text-to-Text • 90B • Updated 1 day ago • 262 • 3

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated Mar 30 • 859k • 100

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Apr 29 • 497k • 253

cosmicproc/Qwen3.5-4B-NVFP4

Image-Text-to-Text • 3B • Updated Apr 15 • 2.42k • 4

AEON-7/gemma-4-31B-it-speculator.eagle3-NVFP4

Text Generation • 2B • Updated 7 days ago • 6.65k • 3

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-FP8

Any-to-Any • 33B • Updated May 5 • 91.1k • 50

lukealonso/MiMo-V2.5-NVFP4

179B • Updated 28 days ago • 31.6k • 19