AI

구글의 데이터젠마: 통계 쿼리에서 환각 문제 해결!

구글의 새로운 모델, 데이터젠마

안녕하세요, 여러분! 오늘은 구글이 새롭게 선보인 AI 모델, 데이터젠마(DataGemma)에 대해 이야기해볼게요. 😃

구글이 통계 데이터와 관련된 질문에서 발생하는 환각 문제를 해결하기 위해 개발한 이 모델은 정말 흥미로운 발전이에요.

데이터젠마란?

데이터젠마는 오픈 소스, 지침 조정 모델로, 구글이 만든 데이터 커먼스(Data Commons) 플랫폼의 방대한 실세계 데이터를 바탕으로
정확한 답변을 제공하도록 설계되었어요. 🧠

이 모델은 기존의 젬마(Gemma) 모델 가족을 기반으로 하며, 통계 쿼리에서의 환각 문제를 줄이는 데 초점을 맞추고 있습니다.

두 가지 접근 방식

데이터젠마는 두 가지 방식으로 사용자 질문에 대한 사실적 정확도를 높이는데요. 첫 번째는 RIG(검색 인터리브 생성) 방식입니다.

이 방식은 모델이 생성한 초기 값을 데이터 커먼스에 저장된 관련 통계와 비교함으로써 정확도를 높여요. 🌐

두 번째는 RAG(검색 보강 생성) 방식으로, 원래의 통계 질문을 사용해 관련 변수를 추출한 후 데이터 커먼스에 쿼리를 실행해 관련 통계 답변을 가져오는 방식입니다.

성능 테스트 결과

테스트 결과, RIG 방식은 기본 모델들의 사실성을 5-17%에서 약 58%로 향상시켰어요.

반면 RAG 방식은 조금 더 낮은 성능을 보였지만 여전히 기본 모델보다는 나았죠. 데이터젠마는 통계 응답을 성공적으로 처리하는 데 있어 큰 발전을 보여주고 있습니다. 📊

결론

구글은 데이터젠마와 함께 RIG 및 RAG 방식의 공개를 통해
더 많은 연구를 촉진하고, 더욱 강력하고 정확한 모델을 구축하기 위한 길을 열기를 기대하고 있습니다.

이러한 발전이 AI 기술을 더욱 발전시키고, 기업의 의사결정에 큰 도움이 될 거라 믿어요! 🥳

출처: 테크크런치

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다