AI

구글 딥마인드, 새로운 벤치마크로 LLM 정확성 향상

사실성 향상과 환각 감소 구글 딥마인드가 새로운 벤치마크를 도입했다는 소식이다. 이번 벤치마크는 대규모 언어 모델 (LLM)의 사실성을 향상시키고 환각 문제를 줄이기 위해 고안되었다고 한다.🧠 LLM이 복잡한 작업을 수행할 때나, 사용자가 특정 세부 정보를 찾을 때 사실과 다른 응답을 제공하는 문제가 발생한다. 이 문제를 해결하기 위해 구글 딥마인드 연구진은 FACTS Grounding이라는 새로운 벤치마크를 소개했다. FACTS Grounding

기사 읽기
AI

메타, 새로운 확장형 메모리 레이어 제안!

메모리 레이어의 혁신\n오늘날 기업들은 다양한 애플리케이션에 LLM(대형 언어 모델)을\n도입하면서 새로운 도전에 직면하고 있습니다. 그 중 하나는\n모델의 사실적 지식을 향상시키고 환각을 줄이는 것입니다.\n메타 AI의 연구진이 제안한 ‘확장형 메모리 레이어’는\n이 문제를 해결할 수 있는 여러 솔루션 중 하나로 주목받고 있습니다.\n\n### 메모리 레이어의 작동 방식\n전통적인 언어 모델은 매개변수에 방대한 정보를\n암호화하는 ‘밀집 레이어’를 사용합니다. 그러나 확장형 메모리 레이어는\n더 많은

기사 읽기
AI

애플, 2026년 ‘LLM 시리’ 출시 준비 중!

애플의 새로운 시리, ‘LLM 시리’란? 🧐 애플이 더 똑똑한 버전의 시리, ‘LLM 시리’를 준비 중이라고 합니다. 블룸버그 보도에 따르면, 애플은 이 신형 시리를 챗봇인 ChatGPT와 경쟁하기 위해 설계 중이라고 하는데요. LLM이란? ‘LLM’은 ‘Large Language Model’의 약자로, 대규모 언어 모델을 의미해요. 이 기술을 통해 시리가 사람처럼 대화를 이어가고, 더 복잡한 작업을 수행할 수 있게 됩니다. 😮

기사 읽기
스타트업

Converge Bio, 바이오텍 LLM 혁신으로 5.5백만 달러 유치!

바이오텍과 AI의 만남 🚀 바이오텍 산업에서도 이제 AI가 필수로 자리잡고 있습니다. 그러나 항상 쉽지만은 않죠. Converge Bio는 이 문제를 해결하기 위해 나섰습니다. 바로 바이오텍 LLM을 실제로 작동하게 만드는 도구를 개발했기 때문입니다. 데이터 강화의 중요성 단순한 모델은 충분하지 않습니다. 데이터를 보강하고 결과를 설명할 수 있어야 하죠. Converge Bio는 이 부분에 집중하고 있습니다. “모델은 단지 모델일 뿐”이라며

기사 읽기
AI

마이크로소프트의 비트넷 아키텍처: LLM 효율성을 극대화하다

비트넷 아키텍처의 혁신적 접근 마이크로소프트가 새로운 비트넷(BitNet) 아키텍처를 통해 대규모 언어 모델(LLM)의 효율성을 극대화하고 있습니다. 🌀 비트넷은 1비트 LLM을 사용하여 모델의 가중치를 단 1비트로 표현함으로써, 메모리와 계산 자원을 크게 줄일 수 있습니다. 기존 LLM의 한계 전통적인 LLM은 16비트 부동 소수점 숫자(FP16)를 사용해 매개변수를 표현합니다. 이로 인해 많은 메모리와 계산 자원이 필요하게 됩니다. 비트넷 a4.8의 혁신

기사 읽기
보안

오픈소스 LLM, 사이버 보안의 판도 변화

오픈소스 LLM의 부상 오픈소스 대형 언어 모델(LLM)이 사이버 보안의 판도를 바꾸고 있습니다. 🛡️ 이러한 모델들은 신속한 혁신을 촉진하며, 스타트업과 기존 벤더들이 시장에 더 빨리 진입할 수 있도록 도와주고 있습니다. LLaMA 2, Falcon, StableLM과 같은 모델들이 그 대표적인 예입니다. 이러한 모델들은 비용 효율성, 유연성, 투명성을 이유로 점점 더 많은 채택을 받고 있습니다. 사이버 보안에서의 도전과 응전

기사 읽기
AI

구글 딥마인드, LLM의 자체 교정 능력 크게 향상시키다

대형 언어 모델(LLM)이 복잡한 작업에서 점점 더 효과적으로 변하고 있지만, 여전히 첫 시도에서 정답을 찾지 못하는 경우가 많습니다. 그래서 LLM이 자신의 실수를 찾아 교정할 수 있도록 하는 ‘자체 교정’에 대한 관심이 커지고 있습니다. 하지만 현재의 자체 교정 시도는 한계가 있으며, 실제 상황에서 자주 충족되지 않는 요구 사항이 있습니다. 구글 딥마인드의 혁신: SCoRe 구글 딥마인드의 연구진은

기사 읽기
AI

대화형 AI 구축, 비용은 얼마일까?

대화형 AI 구축: 비용과 고려사항 대화형 AI를 구축하려면, 어떤 비용이 드는지 궁금하신 분들이 많죠? 🤔 사실, 최근 마케팅, 영업, 고객 서비스 분야에서 40% 이상이 생성형 AI를 도입하고 있어요. IT와 사이버 보안에 이어 두 번째로 많이 사용되고 있다고 하니, 그 필요성은 더욱 커지고 있습니다. 대화형 AI의 확산 대화형 AI는 비즈니스와 고객 간의 소통을 원활하게 해주는 특징

기사 읽기
AI

AI 모델의 새로운 시대: DataGemma로 현실 데이터를 연결하다!

AI 모델의 새로운 가능성✨ 여러분, AI의 발전이 정말 놀랍지 않나요? 최근에 발표된 DataGemma는 대규모 언어 모델(LLM)과 구글의 데이터 커먼즈를 연결하는 혁신적인 오픈 모델이에요. 이 모델은 LLM의 ‘환각’ 문제를 해결하기 위한 첫걸음이라고 할 수 있죠. 환각 문제란?🤔 LLM은 거대한 텍스트를 분석하고 요약할 수 있지만, 가끔은 잘못된 정보를 자신감 있게 제공하는 경우가 있어요. 이런 현상을 환각이라고 하는데

기사 읽기
AI

하이퍼라이트, 가장 강력한 오픈소스 LLM ‘Reflection 70B’ 공개!

새로운 AI의 기준 하이퍼라이트의 CEO, 매트 슈머가 오늘 ‘Reflection 70B’를 공식 발표했습니다. 이 모델은 메타의 오픈소스 Llama 3.1-70B를 기반으로 하며, 독특한 오류 자체 수정 기술을 활용하고 있죠. 성능의 왕좌에 올라 Reflection 70B는 외부 벤치마크에서 뛰어난 성능을 보여주며, 현재 “세계 최고의 오픈소스 AI 모델”로 자리 잡고 있습니다. 오류 인식 및 수정 슈머는 이 모델의 차별점이 바로

기사 읽기