이번 주는 OpenAI에게
매우 혼란스러운
일주일이었습니다.
임원들이 떠나고
대규모 자금 조달
소식이 있었지만,
스타트업은 다시
돌아와 2024 DevDay에서
개발자들을 설득하며
AI 모델로 도구를
만들도록 노력하고
있습니다.
화요일에 회사는
여러 새로운 도구를
발표했는데, 그 중
하나는 ‘실시간 API’의
공개 베타 버전입니다.
이 API를 사용하면
지연 시간이 거의
없는 AI 생성 음성
응답을 제공하는
앱을 만들 수
있습니다.
비록 ChatGPT의
고급 음성 모드는
아니지만, 거의
비슷합니다.
OpenAI의 최고 제품
책임자인 Kevin Weil은
이벤트 전에 기자들과의
브리핑에서 최근
기술 책임자 Mira Murati
및 최고 연구 책임자
Bob McGrew의 이탈이
회사의 진행에
영향을 미치지 않을
것이라고 말했습니다.
“Bob과 Mira는
훌륭한 리더들이었고,
그들에게서 많은 것을
배웠습니다. 그들은
오늘날 우리가
여기에 있게 한 중요한
부분입니다,”라고
Weil은 말했습니다.
“그리고 우리는
속도를 늦추지 않을
것입니다.”
OpenAI는 또
다른 C-suite 개편을
진행 중이며, 이는
작년 DevDay 이후의
혼란을 상기시킵니다.
회사는 여전히
개발자들에게 자신들이
최고의 AI 앱 개발
플랫폼을 제공한다고
설득하려 하고 있습니다.
리더들은 스타트업이
AI 모델로 작업하는
개발자가 300만 명
이상이라고 말하지만,
OpenAI는 점점
경쟁이 치열해지는
공간에서 운영되고
있습니다.
OpenAI는 지난 2년
동안 개발자가
API에 접근하는
비용을 99%
절감했다고
언급했지만,
이는 Meta와 Google
같은 경쟁자들이
계속해서 가격을
낮추고 있기
때문일 가능성이
큽니다.
OpenAI의 새로운
기능 중 하나인
실시간 API는
개발자들에게
앱에서 거의
실시간으로
음성 대 음성
경험을 구축할
기회를 제공합니다.
OpenAI는 여섯 개의
음성을 제공하며,
이 음성은 ChatGPT에서
제공하는 음성과
다릅니다.
저작권 문제를
방지하기 위해
타사 음성을 사용할
수 없습니다.
(Scarlett Johansson을
모티브로 한 음성은
어디에서도 사용할
수 없습니다.)
브리핑 동안,
OpenAI의 개발자
경험 책임자 Romain Huet은
실시간 API로
구축된 여행 계획
앱의 데모를
공유했습니다.
이 응용 프로그램은
사용자가 런던 여행에
대해 AI 비서와
구두로 대화하고
저지연 응답을
받을 수 있게
했습니다.
실시간 API는
여러 도구에
접근할 수 있어,
앱이 답변할 때
지도에 레스토랑
위치를 주석으로
달 수 있었습니다.
다른 시점에서,
Huet은 실시간 API가
인간과 전화로
대화하여 이벤트에
음식을 주문하는
방법을 보여주었습니다.
Google의 악명 높은
Duo와 달리, OpenAI의
API는 직접 레스토랑
또는 상점에 전화할 수
없습니다; 그러나
Twilio와 같은
통화 API와
통합할 수는
있습니다.
눈에 띄게,
OpenAI는 이러한
통화에서 AI 모델이
자동으로 자신을
식별하도록 하는
공개를 추가하지
않고 있습니다.
이 AI 생성 음성은
매우 현실적으로
들리기 때문에,
개발자가 이
공개를 추가하는
책임을 져야 할
것으로 보입니다.
이는 새로운
캘리포니아 법에
의해 요구될 수
있습니다.
DevDay 발표의
일환으로, OpenAI는
API에서 이미지와
텍스트를 사용하여
GPT-4o 애플리케이션을
미세 조정할 수 있는
비전 미세 조정도
소개했습니다.
이론적으로 이는
개발자들이 시각적
이해가 필요한 작업에
대한 GPT-4o의
성능을 향상시키는
데 도움이 될
것입니다.
OpenAI의 제품 API
책임자 Olivier Godement는
개발자들이 저작권이
있는 이미지(예: Donald Duck의
사진), 폭력을
묘사한 이미지,
또는 OpenAI의
안전 정책을
위반하는 이미지를
업로드할 수 없다고
TechCrunch에
말했습니다.
OpenAI는 AI 모델
라이선스 공간에서
경쟁자들이 이미
제공하는 것을
맞추기 위해
경쟁하고 있습니다.
프롬프트 캐싱
기능은 Anthropic이
몇 달 전에
출시한 기능과
유사하여, 개발자가
API 호출 사이에
자주 사용되는
컨텍스트를 캐싱하여
비용을 절감하고
지연 시간을
개선할 수
있습니다.
OpenAI는 이 기능을
사용하여 개발자가
50%를 절감할 수
있다고 말하지만,
Anthropic은 90%
할인을 약속합니다.
마지막으로,
OpenAI는 개발자가
GPT-4o mini와 같은
작은 모델을
미세 조정하기 위해
o1-preview 및 GPT-4o와
같은 더 큰 AI 모델을
사용할 수 있는
모델 증류 기능을
제공하고 있습니다.
작은 모델을
실행하면 일반적으로
더 큰 모델을
실행하는 것보다
비용이 절감되지만,
이 기능을 통해
개발자는 이러한
작은 AI 모델의
성능을 향상시킬
수 있습니다.
모델 증류의
일환으로, OpenAI는
개발자가 OpenAI의
API 내에서
미세 조정 성능을
측정할 수 있는
베타 평가 도구를
출시하고 있습니다.
DevDay는
발표되지 않은
사항들로 인해
더 큰 파장을
일으킬 수 있습니다.
예를 들어,
작년 DevDay에서
발표된 GPT 스토어에
대한 소식은
없었습니다.
마지막으로 들은
바에 따르면,
OpenAI는 가장
인기 있는 GPT
제작자들과 함께
수익 공유 프로그램을
시험하고
있었지만,
그 이후로는
많은 발표가
없었습니다.
또한, OpenAI는
올해 DevDay에서
새로운 AI 모델을
출시하지
않을 것이라고
말했습니다.
OpenAI o1(미리보기
또는 미니
버전이 아님)
또는 스타트업의
비디오 생성 모델인
Sora를 기다리는
개발자는 조금 더
기다려야
할 것입니다.
TechCrunch의
최고의 기사를
매일 및 일요일에
받아보세요.
스타트업은 TechCrunch의
핵심이므로 최고의
기사를
주간으로
받아보세요.
최신 핀테크 뉴스와
분석은 매주 화요일에
제공됩니다.
TechCrunch Mobility는
운송 뉴스와 통찰력을
제공하는
목적지입니다.
이메일을 제출하면
이용 약관과
개인정보 보호
정책에 동의하게
됩니다.
출처: TechCrunch