Skip to content

Top New Best Ask Show Jobs

0 comments

No comments yet.

New Anthropic research: Alignment faking in large language models | Better HN

New Anthropic research: Alignment faking in large language models (opens in new tab)

(twitter.com)

8 pointscasslin1y ago0 comments