4 16 174

Turbo Pascal

TurboPascal

AI & ML interests

None yet

Recent Activity

upvoted a paper about 15 hours ago

QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management

liked a dataset 5 days ago

MaziyarPanahi/Nemotron-Cascade-2-SFT-Data-Small

liked a dataset 5 days ago

nvidia/Nemotron-Cascade-2-SFT-Data

View all activity

Organizations

upvoted a paper about 15 hours ago

QwenLong-L1.5: Post-Training Recipe for Long-Context Reasoning and Memory Management

Paper • 2512.12967 • Published Dec 15, 2025 • 111

upvoted 2 papers 8 days ago

GLM-5: from Vibe Coding to Agentic Engineering

Paper • 2602.15763 • Published Feb 17 • 119

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

Paper • 2601.22975 • Published Jan 30 • 110

upvoted an article 6 months ago

Article

Training and Finetuning Reranker Models with Sentence Transformers v4

Mar 26, 2025

•

188

upvoted a collection 7 months ago

BGE

Collection

31 items • Updated Feb 4 • 152

upvoted a paper 9 months ago

Skywork-Reward-V2: Scaling Preference Data Curation via Human-AI Synergy

Paper • 2507.01352 • Published Jul 2, 2025 • 60

upvoted a collection 10 months ago

GTE models

Collection

General Text Embedding Models Released by Tongyi Lab of Alibaba Group • 20 items • Updated 29 days ago • 36

upvoted 2 papers 12 months ago

AdaMMS: Model Merging for Heterogeneous Multimodal Large Language Models with Unsupervised Coefficient Optimization

Paper • 2503.23733 • Published Mar 31, 2025 • 10

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published Mar 28, 2025 • 45

upvoted 2 articles about 1 year ago

Article

Open-source DeepResearch – Freeing our search agents

Feb 4, 2025

•

1.32k

Article

Efficient LLM Pretraining: Packed Sequences and Masked Attention

Oct 7, 2024

•

upvoted a paper about 1 year ago

DebCSE: Rethinking Unsupervised Contrastive Sentence Embedding Learning in the Debiasing Perspective

Paper • 2309.07396 • Published Sep 14, 2023 • 1

upvoted 2 papers over 1 year ago

How to Train Long-Context Language Models (Effectively)

Paper • 2410.02660 • Published Oct 3, 2024 • 2

Differential Transformer

Paper • 2410.05258 • Published Oct 7, 2024 • 182

upvoted 2 papers about 2 years ago

MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs

Paper • 2402.15627 • Published Feb 23, 2024 • 36

Nemotron-4 15B Technical Report

Paper • 2402.16819 • Published Feb 26, 2024 • 46

Turbo Pascal

AI & ML interests

Recent Activity

Organizations

TurboPascal's activity

Training and Finetuning Reranker Models with Sentence Transformers v4

Open-source DeepResearch – Freeing our search agents

Efficient LLM Pretraining: Packed Sequences and Masked Attention