새로운 AI 혁신
ElevenLabs가 새로운
음성-텍스트 모델
Scribe를 출시했습니다.
이 모델은 다국어를
지원하며, 현재까지
가장 높은 정확도를
자랑합니다. 😮
Scribe의 특징
이 모델은 단순히
음성을 텍스트로
변환하는 것을
넘어, 오디오를
이해합니다.
비언어적 사건들을
탐지하고,
여러 발화자를
구별할 수 있습니다.
다국어 지원
99개의 언어를
지원하며,
세르비아어, 광둥어,
말라얄람어 등
기존에 부족했던
언어에서도
뛰어난 성능을
보입니다.
실제 활용
기업의 자동 문서화,
회의 기록,
콘텐츠 접근성을
위해 유용한 도구로
자리잡을 것입니다.
또한 실시간
통신 도구로도
적합하게
개발 중입니다.
경쟁과의 차별점
Hume AI의 Octave와
경쟁하며,
다른 기능을
제공하지만,
각자의 강점을
살리고 있습니다.
ElevenLabs는 정밀한
음성 인식을,
Hume AI는
표현력 있는
음성 생성을
중점으로 두고
있습니다.
출처: VentureBeat