mazula (M. Aziz Ulak)

liked a Space 3 months ago

Qwen3-ASR Demo

🎙

132

Transcribe audio to text with multi-language timestamps

liked a Space 7 months ago

Wan2.2 Animate

👁

5.11k

Wan2.2 Animate

liked a model 9 months ago

openai/gpt-oss-120b

Text Generation • 120B • Updated Aug 26, 2025 • 3.59M • • 4.72k

liked a Space 10 months ago

Dia 1.6B

👯

1.77k

Generate realistic dialogue from a script, using Dia!

liked a model 10 months ago

pyannote/speaker-diarization-3.1

Automatic Speech Recognition • Updated May 10, 2024 • 10.3M • 1.78k

liked a Space 11 months ago

PuLID-FLUX

🤗

2.08k

Generate custom images from text and a reference photo

liked a Space about 1 year ago

Open VLM Leaderboard

🌎

1.01k

VLMEvalKit Evaluation Results Collection

liked a model about 1 year ago

mistralai/Mistral-Small-3.1-24B-Instruct-2503

Updated Dec 22, 2025 • 526k • 1.36k

liked a Space about 1 year ago

Sesame CSM

🌱

862

Conversational speech generation

liked 2 models about 1 year ago

kyutai/mimi

Feature Extraction • 96.2M • Updated Jul 2, 2025 • 636k • • 298

bigscience/bloom

Text Generation • 176B • Updated Jul 28, 2023 • 6.62k • 5k

liked 2 Spaces about 1 year ago

Kokoro TTS

❤

3.3k

Upgraded to v1.0!

Wan2.1

💻

2.08k

Wan: Open and Advanced Large-Scale Video Generative Models

liked 2 models over 1 year ago

tencent/HunyuanVideo

Text-to-Video • Updated Mar 6, 2025 • 1.13k • • 2.16k

MattyB95/AST-VoxCelebSpoof-Synthetic-Voice-Detection

Audio Classification • 86.2M • Updated Jan 31, 2024 • 122k • 4

liked a Space over 1 year ago

FLUX.1 [Schnell]

🏎

5.06k

Generate images from text prompts with FLUX.1 Schnell

liked 2 Spaces almost 2 years ago

StyleTTS 2

🗣

726

Efficient, fast, and natural text to speech with StyleTTS 2!

Omni-Zero

🧛

462

Restylize & repose person ID

liked a model about 2 years ago

meta-llama/Meta-Llama-3-8B

Text Generation • 8B • Updated Sep 27, 2024 • 3.35M • • 6.52k

liked a Space about 2 years ago

NaturalSpeech3 FACodec

🏃

178

Convert and reconstruct speech files

M. Aziz Ulak PRO

AI & ML interests

Organizations

Qwen3-ASR Demo

Wan2.2 Animate

openai/gpt-oss-120b

Dia 1.6B

pyannote/speaker-diarization-3.1

PuLID-FLUX

Open VLM Leaderboard

mistralai/Mistral-Small-3.1-24B-Instruct-2503

Sesame CSM

kyutai/mimi

bigscience/bloom

Kokoro TTS

Wan2.1

tencent/HunyuanVideo

MattyB95/AST-VoxCelebSpoof-Synthetic-Voice-Detection

FLUX.1 [Schnell]

StyleTTS 2

Omni-Zero

meta-llama/Meta-Llama-3-8B

NaturalSpeech3 FACodec

M. Aziz Ulak PRO

AI & ML interests

Organizations

mazula's activity

Qwen3-ASR Demo

Wan2.2 Animate

Dia 1.6B

PuLID-FLUX

Open VLM Leaderboard

Sesame CSM

Kokoro TTS

Wan2.1

FLUX.1 [Schnell]

StyleTTS 2

Omni-Zero

NaturalSpeech3 FACodec