Skip to content

Top New Best Ask Show Jobs

Deepseek R1 Zero learns to reason using reinforcement learning on base model [pdf] | Better HN

Deepseek R1 Zero learns to reason using reinforcement learning on base model [pdf] (opens in new tab)

(github.com)

6 pointsvirde1y ago0 comments

0 comments

No comments yet.