AI

마이크로소프트의 드래곤 코파일럿, 의료 AI 비서로 등장

드래곤 코파일럿이란? 마이크로소프트가 새로운 AI 시스템인 드래곤 코파일럿을 발표했어요. 이 시스템은 의료 환경에서 사용될 수 있는, 음성 인식과 주변 듣기 기능을 제공한다고 합니다. 🩺 Nuance와의 협력 드래곤 코파일럿은 마이크로소프트가 2021년에 인수한 AI 음성 회사인 Nuance의 기술을 바탕으로 만들어졌습니다. 이 시스템은 임상 방문을 듣고, 메모를 작성하는 기능을 제공합니다. 사용자 경험 개선 마이크로소프트의 발표에 따르면, 이 시스템은

기사 읽기
AI

ElevenLabs, 혁신적 음성-텍스트 모델 출시!

새로운 AI 혁신 ElevenLabs가 새로운 음성-텍스트 모델 Scribe를 출시했습니다. 이 모델은 다국어를 지원하며, 현재까지 가장 높은 정확도를 자랑합니다. 😮 Scribe의 특징 이 모델은 단순히 음성을 텍스트로 변환하는 것을 넘어, 오디오를 이해합니다. 비언어적 사건들을 탐지하고, 여러 발화자를 구별할 수 있습니다. 다국어 지원 99개의 언어를 지원하며, 세르비아어, 광둥어, 말라얄람어 등 기존에 부족했던 언어에서도 뛰어난 성능을 보입니다. 실제

기사 읽기
모바일

아이폰 음성 인식 오류, ‘트럼프’로 오인

오늘 여러 아이폰 사용자들이 흥미로운 현상을 발견했어요. 음성 인식 기능을 통해 ‘인종차별주의자’ 라는 말을 하면, ‘트럼프’라는 단어가 짧게 나타났다가 수정되는 현상입니다. 🧐 문제의 발견 아이폰에서 내장된 음성 인식 기능을 사용하여 메시지를 보낼 때, ‘인종차별주의자’ 라는 단어를 말하면 일부 기기에서 잠깐 ‘트럼프’로 해석되었다가, 곧바로 수정되는 현상이 나타났습니다. 이 오류는 항상 발생하지는 않지만, 테스트 결과 다른 단어보다

기사 읽기
AI

타임켓, 혁신적 번역 OS ‘바벨 OS’ 공개

AI로 새로운 번역의 시대를 열다 타임켓이 드디어 그들의 최초 운영 체제인 바벨 OS를 공개했어요. 이 시스템은 AI를 활용하여 실시간으로 번역을 가능하게 해주는 이어버드에 사용되죠. 이번 혁신으로 번역 소프트웨어의 새로운 기준이 세워졌답니다. ⚡️ 번역의 속도와 감정까지 바벨 OS는 번개처럼 빠르게 번역할 뿐 아니라, 진짜 사람 같은 감정과 억양까지 전달할 수 있어요. 40개가 넘는 언어를 지원하며, 사용자의

기사 읽기
AI

AI로 개인정보 보호하는 aiOla의 새로운 오픈소스 기술

AI로 음성 정보 보호하기 aiOla는 최근 혁신적인 AI 음성 변환 모델을 공개했는데요. 이 모델은 음성을 텍스트로 변환하면서 동시에 개인정보를 보호하는 기능을 가지고 있습니다. 그렇다면 어떻게 가능할까요? 🤔 Whisper-NER의 등장 aiOla의 새로운 모델인 Whisper-NER은 OpenAI의 Whisper를 기반으로 개발되었어요. 이 모델은 자동 음성 인식(ASR)과 이름 엔티티 인식(NER)을 통합하여 개인정보를 자동으로 차단합니다. 🔍 직접 사용해보기 이 모델의 데모는

기사 읽기
AI

OpenAI의 Whisper, 환각 문제 연구자들 우려 표명

OpenAI의 Whisper, 환각 문제 발생 여러분, 오늘은 조금 복잡한 이야기 들고 왔어요. OpenAI의 음성 인식 도구인 Whisper가 환각 문제로 논란이 되고 있답니다. 이게 무슨 말인가 싶으시죠? 🤔 환각이란? 환각이라는 건 쉽게 말해, 존재하지 않는 정보를 만들어 내는 거예요. Whisper가 음성을 텍스트로 변환하면서, 실제로 존재하지 않는 정보를 삽입하는 현상이 발견됐다고 하네요. 연구자들의 발견 Associated Press에 따르면,

기사 읽기
AI

마이크로소프트, 코파일럿에 음성과 시각 기능 추가 – 대대적 개편

마이크로소프트가 오늘 코파일럿 경험의 대대적인 개편을 공개했습니다. 이번 개편으로 음성과 시각 기능이 추가되어 AI 비서가 더욱 개인화된 경험을 제공하게 되었습니다. 새로운 기능: 음성 및 시각 코파일럿의 새로운 기능은 가상 뉴스 프레젠터 모드로 헤드라인을 읽어주는 모드입니다. 또한, 사용자가 보고 있는 내용을 코파일럿이 인식할 수 있도록 했으며, 자연스러운 대화를 가능하게 하는 음성 기능이 추가되었습니다. 마이크로소프트는 이번 개편을

기사 읽기
AI

구글의 제미니, 안드로이드에서 음성 채팅 모드 무료 출시!

제미니 라이브 음성 채팅 안녕하세요, 여러분! 🎉 구글이 드디어 안드로이드 사용자들을 위해 제미니 라이브 음성 채팅 모드를 무료로 제공하기 시작했어요. 이 소식, 정말 기대되죠? 😍 어떻게 사용할 수 있나요? 제미니 앱이나 오버레이를 통해 이 대화형 AI 챗봇에 접근할 수 있어요. 지난달 픽셀 9 런칭 행사에서 처음 발표된 제미니 라이브는 이제까지는 구독자만 사용 가능했죠. 이제는 누구나

기사 읽기