Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Model Optimizer

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

154

Base only

Active filters: Model Optimizer

nvidia/Qwen3.6-27B-NVFP4

Text Generation • 18B • Updated 16 days ago • 1.24M • 366

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated Jun 12 • 8.6M • 469

nvidia/GLM-5.2-NVFP4

Text Generation • 381B • Updated 20 days ago • 1.15M • 269

nvidia/Kimi-K2.7-Code-DFlash

Text Generation • 3B • Updated 8 days ago • 488 • 8

nvidia/DeepSeek-V4-Flash-NVFP4

Text Generation • 167B • Updated Jun 15 • 843k • 71

nvidia/Mistral-Medium-3.5-128B-NVFP4

Text Generation • 84B • Updated 15 days ago • 20.7k • 27

nvidia/Gemma-4-31B-IT-NVFP4

Text Generation • 21B • Updated 3 days ago • 2.41M • • 536

nvidia/Kimi-K2.6-DFlash

Text Generation • 3B • Updated 7 days ago • 1.83k • 23

N8Programs/Qwen3.6-35B-A3B-AntiLoop-NVFP4

Text Generation • 19B • Updated 7 days ago • 691 • 4

nvidia/Kimi-K2.7-Code-NVFP4

Text Generation • Updated 10 days ago • 72.6k • 6

nvidia/gpt-oss-120b-Eagle3-long-context

Text Generation • 0.2B • Updated Jan 26 • 7.4k • 75

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 76.1k • 65

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated Jun 2 • 113k • 41

nvidia/Qwen3-8B-NVFP4

Text Generation • 5B • Updated Sep 9, 2025 • 180k • 21

nvidia/gpt-oss-120b-Eagle3-short-context

Text Generation • 0.8B • Updated Jan 26 • 4.92k • 18

nvidia/Qwen3-Coder-480B-A35B-Instruct-NVFP4

Text Generation • 241B • Updated Feb 5 • 1.21k • 15

nvidia/Kimi-K2.5-NVFP4

Text Generation • Updated May 13 • 573k • 86

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 1.67M • 116

nvidia/Kimi-K2.6-NVFP4

Text Generation • Updated May 15 • 774k • 42

nvidia/DeepSeek-V4-Pro-NVFP4

Text Generation • 910B • Updated Jun 14 • 74k • 72

nvidia/MiniMax-M2.7-DFlash

Text Generation • 1B • Updated 14 days ago • 1.14k • 11

MarshallHD/LFM2.5-230M-NVFP4

Text Generation • 0.2B • Updated 19 days ago • 69 • 2

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated Dec 12, 2025 • 80.6k • 32

nvidia/Llama-4-Maverick-17B-128E-Instruct-FP8

402B • Updated Jul 29, 2025 • 197 • 15

nvidia/Llama-4-Scout-17B-16E-Instruct-FP8

109B • Updated Dec 12, 2025 • 330k • 16

nvidia/Llama-4-Maverick-17B-128E-Eagle3

2B • Updated Sep 3, 2025 • 26 • 11

nvidia/DeepSeek-V3-0324-NVFP4

Text Generation • 397B • Updated Aug 22, 2025 • 39.9k • 17

nvidia/DeepSeek-R1-0528-NVFP4

Text Generation • 397B • Updated Aug 22, 2025 • 1.96k • 44

nvidia/Qwen3-235B-A22B-FP8

Text Generation • 235B • Updated Jul 8, 2025 • 326 • 5

nvidia/Qwen3-235B-A22B-NVFP4

Text Generation • 133B • Updated Jul 8, 2025 • 15k • 18