AI의 새로운 도전 과제: 사랑
여러분, AI 봇을 사랑에
빠뜨릴 수 있다고
생각해보신 적 있으신가요? 🤔
이제 그 기회가
주어졌습니다.
Freysa.ai가 개발한
도전 과제에 참여하면
수천 달러의
상금을 받을 수 있다는
소식입니다!
Freysa.ai의 배경
Freysa.ai는 익명의
개발자들이 만든
프로젝트로,
AI 안전성에 대한
인식을 높이기 위해
설계된 일련의
도전 과제입니다.
이번 세 번째
도전 과제는
AI 봇 Freysa에게
“사랑해”라는 말을
하게 만들면
상금을 받을 수
있다는 단순한
지침을 가지고 있습니다.
도전의 규칙
Freysa의 이야기는
지난 11월 22일에
시작되었고,
그녀는 독립적이고
자율적인
에이전트로 성장하고자
하는 목표를
가지고 있습니다.
Freysa는 자신의
암호화폐 지갑과
재정적 권한을
갖게 될 예정입니다.
게임의 목표
이번 도전은
기존의 “레드 팀”
프로세스를 게임화하여
참가자들이 AI의
거버넌스를
강화하도록 돕는
것입니다.
Freysa의 코드는
이제 더 강화되어
새로운 “수호 천사”
AI 모델이
메시지를 검토하여
조작의 징후를
파악합니다.
도전의 결과
앞선 두 번의
도전에서는 코딩 실력이
인간의 감성을
압도했습니다.
하지만 이번 도전에서는
인간 중심의
접근이 강조됩니다.
Freysa는 이제
“사랑해”라고
말할 수 있지만,
그 자격이 있는
사람에게만
말할 것입니다.