AI 모델의 저작권 침해 논란 📚
최근, OpenAI의 AI 모델이 저작권이
있는 콘텐츠를 “기억”하고 있다는
연구 결과가 발표되었어요. 이 연구는
워싱턴 대학, 코펜하겐 대학,
스탠포드 대학 연구진들이 함께 했어요.
OpenAI는 이 연구 결과에 대해
공정 이용(fair use)을 주장했지만,
저작권 소유자들은 불법이라고
주장하고 있죠.
연구 방법과 결과 🧪
연구진은 OpenAI의 GPT-4,
GPT-3.5를 대상으로 ‘기억’
여부를 확인했어요. 높은
“놀람도”를 가진 단어들을
제거하고, 모델에게 그 단어들을
추측하게 했죠. 그 결과, 모델이
특정 책이나 뉴욕 타임즈 기사를
기억하고 있는 것으로 나타났어요.
데이터 투명성의 필요성 💡
이 연구는 AI 모델의 학습
데이터 투명성이 얼마나 중요한지
상기시킵니다. 연구의 공동 저자인
아빌라샤 라비찬더는 “신뢰할 수 있는
대형 언어 모델을 위해서는
데이터의 투명성이 필수적”이라고
강조했어요.
OpenAI의 향후 방향 🚀
OpenAI는 저작권 데이터를
활용한 모델 개발에 대해
규제를 완화하려고 노력하고 있어요.
그러나, 이번 연구로 인해
더 큰 데이터 투명성 요구와
법적 논란이 계속될 것으로
보입니다.
자세한 내용은 TechCrunch 기사를
참고하세요.