AI

MLCommons와 Hugging Face, AI 연구 위한 대규모 음성 데이터셋 공개

MLCommons와 Hugging Face의 협업 🎤

MLCommons가 AI 개발 플랫폼인
Hugging Face와 손을 잡고
세계에서 가장 큰
공개 도메인 음성 데이터셋을
공개했습니다. 이 데이터셋의 이름은
‘Unsupervised People’s Speech’로,
89개 이상의 언어에 걸쳐
백만 시간 이상의
오디오를 포함하고 있습니다.

음성 기술 R&D 지원 목표 🎯

MLCommons는 다양한
음성 기술 분야의 연구 및 개발을
지원하기 위해 이 프로젝트를
추진했다고 밝혔습니다.
“영어 이외의 언어를 위한
자연어 처리 연구를 지원하여
전 세계적으로 더 많은 사람들이
의사소통 기술을 사용할 수
있도록 돕고자 합니다.”
라고 그들은 블로그에
적었습니다.

데이터셋의 잠재적 위험 🚨

하지만, ‘Unsupervised People’s Speech’와
같은 AI 데이터셋에는
몇 가지 위험 요소가
내포되어 있습니다. 특히,
Archive.org에서 가져온
이 데이터셋은 미국식
영어가 대부분이라
편향된 결과를 초래할
가능성이 있습니다.

라이선스 문제와 창작자 권리 ⚖️

또한, 이 데이터셋에는
AI 연구 목적으로 사용되는
자신의 목소리를
몰랐던 사람들의
녹음도 포함될 수 있습니다.
MLCommons는 모든 녹음이
공개 도메인 또는
Creative Commons 라이선스
아래에 있다고 말하지만,
실수로 잘못된 자료가
포함될 가능성이 있습니다.

MLCommons는 이 데이터셋의
품질을 유지하고
개선하기 위해 노력하겠다고
밝혔지만, 개발자들은
신중하게 접근할 필요가
있습니다.

출처: TechCrunch

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다