Skip to content

Top New Best Ask Show Jobs

karinemellata | Better HN

karinemellata

59 karmaJoined July 7, 20207 submissions

Recent submissions

1

Alignment is not free: How model upgrades can silence your confidence signals (opens in new tab)

(variance.co)

121karinemellata1y ago67

2

We used sparse autoencoders to explain LLM moderation flags of violent threats (opens in new tab)

(variance.co)

6karinemellata1y ago0