helloericsf on Hacker News

1

Context Engineering for AI Agents: Lessons (opens in new tab)

(manus.im)

120helloericsf8mo ago4

2

Context Engineering for AI Agents: Lessons (opens in new tab)

(manus.im)

3helloericsf10mo ago0

3

Better than DeepSeek R1? MiniMax-M1:open-weight hybrid-attention reasoning model (opens in new tab)

(huggingface.co)

6helloericsf11mo ago0

4

kit - Code Intelligence Toolkit (opens in new tab)

(github.com)

1helloericsf1y ago0

5

DeepSeek Open Source Optimized Parallelism Strategies, 3 repos (opens in new tab)

(github.com)

103helloericsf1y ago8

6

DeepSeek Open Source DeepGEMM – FP8 GEMM Library(300 lines for 1350+ FP8 TFLOPS) (opens in new tab)

(twitter.com)

4helloericsf1y ago1

7

Alibaba Open Source Large-Scale Video Generative Models: Wan2.1 (opens in new tab)

(twitter.com)

8helloericsf1y ago2

8

DeepSeek open source DeepEP – library for MoE training and Inference (opens in new tab)

(github.com)

536helloericsf1y ago71

9

DeepSeek Open Source FlashMLA – MLA Decoding Kernel for Hopper GPUs (opens in new tab)

(github.com)

441helloericsf1y ago108

10

New Qwen2.5-Max Outperforms DeepSeek V3 in Benchmarks (opens in new tab)

(twitter.com)

3helloericsf1y ago2

11

Longest context up to 4M, MiniMax-01 hybrid 456B Open source model (opens in new tab)

(github.com)

19helloericsf1y ago1

helloericsf

Recent submissions

Context Engineering for AI Agents: Lessons (opens in new tab)

Context Engineering for AI Agents: Lessons (opens in new tab)

Better than DeepSeek R1? MiniMax-M1:open-weight hybrid-attention reasoning model (opens in new tab)

kit - Code Intelligence Toolkit (opens in new tab)

DeepSeek Open Source Optimized Parallelism Strategies, 3 repos (opens in new tab)

DeepSeek Open Source DeepGEMM – FP8 GEMM Library(300 lines for 1350+ FP8 TFLOPS) (opens in new tab)

Alibaba Open Source Large-Scale Video Generative Models: Wan2.1 (opens in new tab)

DeepSeek open source DeepEP – library for MoE training and Inference (opens in new tab)

DeepSeek Open Source FlashMLA – MLA Decoding Kernel for Hopper GPUs (opens in new tab)

New Qwen2.5-Max Outperforms DeepSeek V3 in Benchmarks (opens in new tab)

Longest context up to 4M, MiniMax-01 hybrid 456B Open source model (opens in new tab)

Recent submissions

Context Engineering for AI Agents: Lessons (opens in new tab)

Context Engineering for AI Agents: Lessons (opens in new tab)

Better than DeepSeek R1? MiniMax-M1:open-weight hybrid-attention reasoning model (opens in new tab)

kit - Code Intelligence Toolkit (opens in new tab)

DeepSeek Open Source Optimized Parallelism Strategies, 3 repos (opens in new tab)

DeepSeek Open Source DeepGEMM – FP8 GEMM Library(300 lines for 1350+ FP8 TFLOPS) (opens in new tab)

Alibaba Open Source Large-Scale Video Generative Models: Wan2.1 (opens in new tab)

DeepSeek open source DeepEP – library for MoE training and Inference (opens in new tab)

DeepSeek Open Source FlashMLA – MLA Decoding Kernel for Hopper GPUs (opens in new tab)

New Qwen2.5-Max Outperforms DeepSeek V3 in Benchmarks (opens in new tab)

Longest context up to 4M, MiniMax-01 hybrid 456B Open source model (opens in new tab)