Pedro Ribeiro's picture

Pedro Ribeiro

BRlkl

·

AI & ML interests

None yet

Recent Activity

updated a model about 5 hours ago

BRlkl/TCC-state

updated a model about 5 hours ago

BRlkl/GRPO-6-harder_87

published a model about 5 hours ago

BRlkl/GRPO-6-harder_87

View all activity

Organizations

BRlkl 's models 154

BRlkl/distill-sft-grpo-4_70-full

Text Generation • 4B • Updated Mar 27 • 55 •

BRlkl/distill-sft-qwen3-4b-full

Text Generation • 4B • Updated Mar 27 • 58 •

BRlkl/distill-sft-qwen3-0.6b-full

Text Generation • 0.6B • Updated Mar 27 • 57 •

BRlkl/distill-sft-qwen3-8b-full

Text Generation • 8B • Updated Mar 27 • 59

BRlkl/distill-sft-qwen3-32b-full

BRlkl/GRPO-5-sft-bootstrap-2

BRlkl/GRPO-5-sft-bootstrap

BRlkl/GRPO-5_50

BRlkl/GRPO-5_40

BRlkl/GRPO-5_30

BRlkl/GRPO-5_20

BRlkl/GRPO-5_10

BRlkl/GRPO-4_70

Text Generation • 4B • Updated Mar 15 • 7

BRlkl/GRPO-4_60

Text Generation • 4B • Updated Mar 13 • 2

BRlkl/GRPO-4_50

Text Generation • 4B • Updated Mar 12 • 3

BRlkl/GRPO-4_40

Text Generation • 4B • Updated Mar 11 • 4

BRlkl/GRPO-4_30

Text Generation • 4B • Updated Mar 6 • 3

BRlkl/GRPO-4_20

Text Generation • 4B • Updated Mar 5 • 4

BRlkl/GRPO-4_10

Text Generation • 4B • Updated Mar 4 • 2

BRlkl/GRPO-3_40

Text Generation • 4B • Updated Mar 3 • 6

BRlkl/GRPO-3_20

Text Generation • 4B • Updated Mar 1 • 3

BRlkl/orchestrator-qwen3-4b-full

Text Generation • 4B • Updated Feb 26 • 9 •

BRlkl/GRPO-2.1

BRlkl/GRPO-2.1_100

BRlkl/GRPO-2.1_50

BRlkl/GRPO-2

BRlkl/GRPO-2_100

BRlkl/GRPO-2_50

BRlkl/GRPO-1

BRlkl/GRPO-1_100