AI

로봇 훈련을 혁신할 1X의 생성 모델 출시

로봇공학 스타트업인 1X 테크놀로지스가 새로운 생성 모델을 개발했어요. 이 모델은 로봇 시스템을 시뮬레이션에서 더 효율적으로 훈련할 수 있게 해준답니다.

새로운 도전과제

로봇 공학에서 가장 큰 도전 중 하나는 ‘월드 모델’을 학습하는 것이에요. 이 모델은 로봇의 행동에 따라 세상이 어떻게 변하는지를 예측하죠. 물리적 환경에서 로봇을 직접 훈련하는 것은 비용과 위험이 크기 때문에, 로봇 공학자들은 주로 시뮬레이션 환경에서 제어 모델을 훈련해요. 하지만 시뮬레이션과 실제 환경의 차이로 인해 다양한 도전 과제가 발생합니다. 🤖

‘로봇 공학자들은 보통 실제 세계의 ‘디지털 트윈’을 만들어서 무조코, 불릿, 아이작과 같은 강체 시뮬레이터를 사용해 동적 환경을 시뮬레이션합니다,’라고 1X 테크놀로지스의 AI 부사장인 에릭 장이 말했어요. ‘하지만 디지털 트윈은 물리적 및 기하학적 부정확성을 가지고 있어 훈련과 실제 배치 환경이 달라지는 ‘sim2real gap’을 초래하죠.’

새로운 접근 방식

이 간극을 해소하기 위해 1X의 새로운 모델은 로봇으로부터 직접 수집한 원시 센서 데이터를 학습해 실제 세계를 시뮬레이션해요. 회사의 로봇들로부터 수집된 수천 시간의 비디오와 액추에이터 데이터를 통해, 이 모델은 현재 세계의 관찰을 기반으로 로봇이 특정 행동을 취할 경우 무엇이 일어날지를 예측할 수 있답니다.

실생활 데이터

이 데이터는 가정과 사무실에서 다양한 모바일 조작 작업을 수행하고 사람들과 상호작용하는 EVE 휴머노이드 로봇들로부터 수집되었어요. ‘우리는 여러 1X 사무실에서 모든 데이터를 수집했으며, 데이터를 주석 달고 필터링하는 안드로이드 오퍼레이터 팀이 있습니다,’라고 장이 말했어요. ‘실제 데이터로부터 직접 시뮬레이터를 학습함으로써, 상호작용 데이터가 증가함에 따라 동적 환경은 실제 세계와 더 가까워질 것입니다.’

이 학습된 월드 모델은 특히 객체 상호작용을 시뮬레이션하는 데 유용해요. 회사에서 공유한 비디오에서는 로봇이 상자를 잡는 비디오 시퀀스를 성공적으로 예측하는 모델을 볼 수 있어요. 이 모델은 또 강체, 물체 떨어뜨리기 효과, 부분 관측 가능성, 변형 가능한 물체 (커튼, 세탁물), 관절 물체 (문, 서랍, 커튼, 의자)와 같은 비트리비얼 객체 상호작용도 예측할 수 있어요.

앞으로의 과제

하지만 환경 변화는 여전히 도전 과제입니다. 모든 시뮬레이터와 마찬가지로, 로봇이 작동하는 환경이 변화함에 따라 생성 모델도 업데이트가 필요해요. 연구자들은 이 모델이 세상을 시뮬레이션하는 방식이 업데이트를 더 쉽게 만들 것이라고 믿고 있어요. ‘생성 모델 자체가 훈련 데이터가 오래되면 sim2real 갭이 생길 수 있습니다,’라고 장이 말했어요. ‘하지만 이는 완전히 학습된 시뮬레이터이기 때문에, 실제 세계에서 신선한 데이터를 제공하면 모델을 손으로 튜닝하지 않아도 수정할 수 있습니다.’

1X의 새로운 시스템은 OpenAI Sora와 Runway와 같은 혁신에 영감을 받았어요. 이들은 올바른 훈련 데이터와 기법을 사용해 생성 모델이 일종의 월드 모델을 학습하고 시간 동안 일관성을 유지할 수 있음을 보여주었죠. 하지만 이러한 모델들이 텍스트에서 비디오를 생성하도록 설계된 반면, 1X의 새로운 모델은 생성 단계에서 행동에 반응할 수 있는 생성 시스템의 트렌드에 속합니다. 예를 들어, 구글의 연구자들은 최근 유사한 기법을 사용해 게임 DOOM을 시뮬레이션할 수 있는 생성 모델을 훈련했어요.

결론

인터랙티브 생성 모델은 로봇 제어 모델과 강화 학습 시스템을 훈련하는 데 무수한 가능성을 열어줄 수 있어요. 하지만 생성 모델에 내재된 몇 가지 도전 과제는 여전히 존재해요. 예를 들어, 모델이 명시적으로 정의된 월드 시뮬레이터로 구동되지 않기 때문에 때때로 비현실적인 상황을 생성할 수 있어요. 예를 들어, 1X에서 공유된 예제에서는 모델이 공중에 떠 있는 물체가 떨어질 것이라는 예측을 실패하거나, 한 프레임에서 물체가 사라지는 경우도 있어요. 이러한 도전 과제를 해결하려면 여전히 많은 노력이 필요해요.

한 가지 해결책은 더 많은 데이터를 계속 수집하고 더 나은 모델을 훈련하는 것입니다. ‘지난 몇 년 동안 생성 비디오 모델링에서 극적인 발전을 보았으며, OpenAI Sora와 같은 결과는 데이터와 컴퓨팅을 확장하면 매우 멀리 갈 수 있음을 시사합니다,’라고 장이 말했어요. 동시에 1X는 커뮤니티가 이 노력에 참여하도록 장려하고 있으며, 모델과 가중치를 공개할 예정이에요. 회사는 또한 모델을 개선하기 위한 대회를 개최하고, 우승자에게 상금을 지급할 예정입니다.

출처

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다