Derry Pratama

ibndias

·

https://derrylab.com

AI & ML interests

None yet

Recent Activity

new activity 1 day ago

AliesTaha/fable-traces:🚩 Report: Spam

liked a model 29 days ago

zai-org/GLM-5.1

updated a dataset 2 months ago

ibndias/distilabel-example

View all activity

Organizations

ibndias 's models 19

ibndias/qwen3-0.6b-reasoning-safeguard

1B • Updated Nov 11, 2025 • 6

ibndias/Anonymizer-0.6B-Q4_K_M-GGUF

0.6B • Updated Nov 10, 2025 • 5

ibndias/kanana-safeguard-8b-Q2_K-GGUF

Text Generation • 8B • Updated Nov 6, 2025 • 16

ibndias/kanana-safeguard-8b-Q4_K_M-GGUF

Text Generation • 8B • Updated Nov 6, 2025 • 5

ibndias/Qwen2.5-1.5B-Open-R1-Distill

Text Generation • 2B • Updated Apr 28, 2025 • 4

ibndias/gemma-3-1b-reasoning-grpo

Text Generation • 1.0B • Updated Apr 7, 2025 • 8

ibndias/DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation • 2B • Updated Feb 24, 2025 • 4

ibndias/Qwen-2.5-7B-Simple-RL

Updated Feb 21, 2025

ibndias/Qwen2.5-1.5B-Open-R1-GRPO

Text Generation • 2B • Updated Feb 12, 2025 • 3

ibndias/Qwen2.5-1.5B-Open-R1-GRPO1st

Text Generation • 2B • Updated Feb 10, 2025 • 7

ibndias/taxi-v3

Reinforcement Learning • Updated Jan 7, 2025

ibndias/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jan 7, 2025

ibndias/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 6, 2025

ibndias/Nous-Hermes-2-MoE-2x34B

Text Generation • 61B • Updated Mar 5, 2024 • 87

ibndias/NeuralHermes-MoE-2x7B

Text Generation • 13B • Updated Mar 5, 2024 • 86 • 1

ibndias/mistral-7b-gtfobins-lora

Text Generation • 7B • Updated Nov 17, 2023 • 2

ibndias/llama2-gtfobins-lora-3ep

Updated Nov 16, 2023 • 2

ibndias/mistral-gtfobins-lora-3ep

Updated Nov 16, 2023 • 1

ibndias/llama2-lora-gtfobins-1ep

Updated Nov 16, 2023 • 1