Skip to content

Top New Best Ask Show Jobs

NicoConstant | Better HN

NicoConstant

53 karmaJoined March 13, 20262 submissions

Recent submissions

1

Real-time LLM Inference on Standard GPUs: 3k tokens/s per request (opens in new tab)

(blog.kog.ai)

51NicoConstant10h ago34

2

Kog AI – Building a Real-Time Inference Stack on AMD Instinct GPUs [video] (opens in new tab)

(youtube.com)

8NicoConstant14d ago0