연구2026년 4월 30일 AM 04:06

센스타임, 오픈소스 'SenseNova U1' 공개… 이미지를 텍스트 변환 없이 직접 추론하는 'NEO-Unify' 아키텍처, 캄브리콘·비런 등 中 칩 10곳 호환

안면 인식 기술로 잘 알려진 중국 AI 기업 센스타임(SenseTime)이 화요일 오픈소스 신모델을 공개했다. 회사는 이 모델이 미국 경쟁사 최상위 모델들보다 이미지를 훨씬 빠르게 생성·해석할 수 있다고 주장했다. 'SenseNova U1'은 중국 AI 개발 경쟁에서 선두권에서 밀려난 센스타임이 잃어버린 입지를 되찾는 데 도움이 될 수 있다.

모델의 핵심은 이미지를 먼저 텍스트로 변환하지 않고 곧장 '읽어내는(read)' 능력이다. 이는 처리 속도를 높이고 필요한 컴퓨팅 자원을 줄여준다. 센스타임 공동창업자이자 수석과학자인 다후아 린(Dahua Lin)은 와이어드(WIRED) 인터뷰에서 "모델의 추론 과정은 더 이상 텍스트에 국한되지 않으며 이미지로도 추론이 가능하다"고 말했다. 홍콩중문대학교 정보공학과 교수이기도 한 린은 이미지를 직접 처리할 수 있는 모델이 향후 로봇이 물리 세계를 더 잘 이해하도록 만들 것이라고 밝혔다.

딥시크(DeepSeek)의 최신 플래그십 모델처럼, 센스타임은 U1이 중국산 칩에서도 구동될 수 있다고 강조했다. 린은 "여러 중국 국내 칩 제조사가 신모델 호환 최적화를 마쳤다"고 말했다. 출시 당일 캄브리콘(Cambricon)과 비런 테크놀로지(Biren Technology)를 포함해 10개 중국 칩 설계사가 자사 하드웨어가 U1을 지원한다고 공식 발표했다.

이러한 유연성은 미국의 수출 통제로 중국 기업들이 세계 최첨단 AI 칩, 특히 학습용 칩 접근이 제한된 상황에서 의미가 크다. 현재 이러한 칩은 주로 엔비디아(Nvidia) 등 서구 기업이 개발하고 있다. 린은 "앞으로도 더 다양한 칩에서 학습이 가능하도록 추진하겠다"면서도 "이터레이션 속도를 보장하기 위해 여전히 최고 수준의 칩을 사용해야 할 수도 있다"고 인정했다.

센스타임은 U1을 허깅페이스(Hugging Face)와 깃허브(GitHub)에 무료로 공개했다. 이는 중국 기업들이 오픈소스 AI에서 가장 활발한 기여자 중 하나로 부상하고 있음을 보여주는 또 하나의 신호다. 2014년 설립된 센스타임은 안면 인식과 자율주행 등에 쓰이는 컴퓨터 비전 분야에서 세계적 강자였으나, ChatGPT 등 자연어 처리(NLP) 기반 AI가 업계의 주류로 떠오르면서 수익성에 어려움을 겪었고, 딥시크·미니맥스(MiniMax) 같은 신생 중국 스타트업에 뒤처졌다.

센스타임은 SenseNova-U1을 누구나 사용할 수 있도록 공개해 국내외 AI 플레이어들과의 격차를 좁히겠다는 입장이다. 린은 회사가 작년에 오픈소스에 집중하기로 결정했으며, 그 이유는 연구자들로부터 받는 유용한 피드백이 빠른 이터레이션을 가능하게 하기 때문이라고 밝혔다. 그는 "요즘 시대에는 오픈소스냐 클로즈드소스냐가 승부를 가르지 않으며, 이터레이션 속도가 핵심"이라고 설명했다.

오픈소스 노선은 지정학 갈등의 영향 없이 국제 연구자들과의 협업을 이어가는 데도 도움이 된다. 센스타임은 자사 안면 인식 기술이 중국 신장 지역의 위구르족 등 소수민족 감시·구금에 활용된 의혹과 관련해 미국 정부로부터 반복적으로 제재를 받아왔다. 이로 인해 미국 기업들은 라이선스 없이는 센스타임에 투자하거나 일부 기술을 판매할 수 없다(센스타임은 의혹을 부인해왔다).

동봉된 기술 보고서에서 센스타임은 SenseNova-U1이 현재 시장의 모든 오픈소스 모델보다 더 높은 품질의 이미지를 생성한다고 주장했다. 성능은 알리바바의 Qwen, 바이트댄스의 Seedream 등 중국 클로즈드 모델과 유사한 수준이지만, 1주 전 출시된 GPT-Image-2.0 같은 업계 선두 주자에는 여전히 뒤처진다. 다만 모델의 주된 셀링 포인트는 이미지를 위 모델들보다 훨씬 빠르게 생성하는 능력으로, 센스타임이 올해 초 미리 공개했던 'NEO-Unify'라는 혁신적 기술 구조에 기반한다.

허깅페이스의 AI 연구자 아디나 야케푸(Adina Yakefu)는 "이는 더 야심 찬 접근이지만 여전히 상당한 실용적 과제가 남아 있다"며 "오픈소스로 공개해 커뮤니티가 더 폭넓게 탐색·테스트할 수 있게 된 점은 긍정적"이라고 평가했다. 모델은 PC와 휴대폰에서도 구동될 만큼 작아 다양한 시나리오에 활용될 가능성이 있다. 린은 이 기술이 특히 로봇이 시각 세계를 통합적으로 판단할 때 유용할 것이라며, 센스타임이 직접 로봇을 만들지는 않지만 또 다른 공동창업자가 이끄는 스타트업 ACE 로보틱스(ACE Robotics)와 긴밀히 협력 중이고 지리공간 이해(geospatial understanding)에 특화된 모델도 개발하고 있다고 덧붙였다.

센스타임, 오픈소스 'SenseNova U1' 공개… 이미지를 텍스트 변환 없이 직접 추론하는 'NEO-Unify' 아키텍처, 캄브리콘·비런 등 中 칩 10곳 호환

관련 기사