AI 보안의 새로운 지평 \n\nAnthropic이 새로운 \nAI 보안 기술을 \n공개했어요. 👀\n이 기술은 \n’헌법적 분류기’라는 \n이름을 가지고 있는데요, \n이 기술이 얼마나 \n강력한지 알아볼까요? \n\n### 95%의 성공률 \n\nAnthropic에 따르면, \n새로운 시스템은 \n지금까지 시도된 \n탈옥 시도 중 \n95%를 막아냈다고 해요. \n이것은 정말 \n어마어마한 성과죠. \n하지만, 여전히 \n완벽한 방어는 \n아니라는 것, \n알고 계시죠? 🤔\n\n### 레드 팀을 초대하다 \n\n흥미로운 점은 \nAnthropic이 \n레드 팀들을 초대해서 \n이 시스템을 \n테스트하도록 \n도전장을 내밀었다는 점이에요. \n이들은 \n’유니버설 탈옥’을 \n시도해 보라고 \n했답니다. \n\n### 테스트와 결과 \n\n테스트는 \n화학 무기를 주제로 \n진행되었고, \n여덟 단계로 \n구성되었어요. \n현재까지 보고된 \n바에 따르면, \n탈옥에 성공한 \n팀은 없었다고 하네요. \n\n### 안전성과 한계 \n\n하지만, 모든 \n탈옥 시도를 \n막을 수는 \n없다는 점을 \n인정하고 있어요. \n그럼에도 불구하고, \n이런 시도가 \n더 어려워졌다는 \n점에서 큰 의미가 \n있다고 할 수 있어요. \n\n출처: VentureBeat