정부 주도 AI 파운데이션 모델 1차 평가 임박중국 오픈소스 활용 변수···주주 실망감 확대
12일 글로벌 AI 모델 플랫폼 허깅페이스에 따르면 네이버클라우드 측이 독자 AI 모델 프로젝트 결과물로 선보인 하이퍼클로바X 시드 32B로 업계의 주목을 받으며 유력 후보로 평가받았다. 해당 모델은 지난해 12월 말 허깅페이스 공개 후 불과 보름이 안 돼 3만522회가 다운로드됐다. 경쟁사인 SK텔레콤(8785회), 업스테이지(4391회), LG AI연구원(4384회), NC AI(4269회)를 훨씬 앞지른 수치다.
그러나 하이퍼클로바X 시드 32B 싱크는 모델 구성 요소 중 하나인 비전 인코더와 오디오 인코더에 알리바바의 '큐원 2.5(Qwen 2.5 vl)' 언어모델을 유사한 수준으로 차용한 것이 약점으로 작용하고 있다는 지적이 나온다. 비전 인코더 레이어는 큐원 2.5 모델과 코사인 유사도 99.5%를 기록했으며, 오디오 인코더는 사실상 원본과 동일한 것으로 나타났다.
네이버가 활용한 큐원 2.5 비전 인코더는 아파치 2.0 라이선스가 적용된 오픈소스다. 상업적 이용을 포함해 여러 범위에서 자유롭게 활용할 수 있다는 의미로, 수정을 거쳐 사용할 경우 해당 사실을 포함해 라이선스 내용을 명시해야 한다. 그러나 오픈소스를 제공했던 큐원 측이 돌연 입장을 바꿔 사용 허가를 거두면 네이버는 모델 운영이 어려워지게 된다. 이 경우 소버린 AI 주권을 강조하며 독자 AI 모델을 선발한 취지 자체가 무색해질 수 있다.
네이버는 중국 오픈소스를 사용한 점은 인정하지만 AI의 핵심인 언어 모델은 직접 개발했다는 점을 강조했다. 또 차용 논란이 벌어진 인코더 역시 자체 기술로 교체할 수 있다고 설명했다. 자체 인코더를 적용할 기술력이 있는데도 큐원 모델을 빌려쓴 점에 대해서는 "이는 기술적 자립도가 부족해서가 아니라 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 고도의 엔지니어링 판단"이라는 입장이다.
해외 오픈소스 차용 논란이 불거진 건 다른 업체도 마찬가지지만, 네이버가 유독 주목받는 건 이런 높은 유사성 때문이다. 업스테이지는 중국 기업 지푸AI의 모델, SK텔레콤은 딥시크 모델의 '추론(인퍼런스) 코드'가 유사하단 의혹이 제기됐다. 그러나 업스테이지 측은 검증 절차를 공유하고 학습 로그를 공개하며 자체 개발을 증명한 바 있다. 의혹을 불러일으킨 측이 "검증이 엄밀하지 못했다"고 사과하며 논란은 일단락됐다. SK텔레콤은 독자성을 따질 때 보는 '학습 코드'와 다르다며 "업계도 프롬 스크래치(데이터 수집, 모델 설계, 학습 전 과정을 자체 수행) 훼손 요소로 보지 않는다"고 설명했다.
앞서 정부는 참여 기업들을 대상으로 해외 AI 모델을 미세조정(파인튜닝)해 개발하면 독자 모델로 보지 않겠다고 공지한 바 있다. 사업 공모 안내서에도 독자 AI 파운데이션 모델을 '모델의 설계부터 사전학습 과정 등을 수행한 국산 모델(타사 모델에 대한 라이센싱 이슈 부재)'이라고 정의했다. 하지만 모델의 구성요소에 오픈소스를 활용하면 안 된다는 지침을 제시하지는 않았다. 현재 과기정통부는 이번 논란에 대해 별다른 가이드라인을 제시하지 않은 채 1차 단계평가를 진행 중이다.
네이버의 1차 탈락 가능성이 높아진 점에 대해 일부 주주들은 실망감을 드러내는 분위기다. 한 네이버 주주는 "국내 대표 IT 기업인 네이버가 당연히 경쟁력을 드러낼 줄 알았던 사업인데, 탈락 가능성이 언급되는 것만으로도 놀랍다"며 "기대가 컸던 만큼 실망도 크다"고 말했다.
관련기사
뉴스웨이 유선희 기자
point@newsway.co.kr
저작권자 © 온라인 경제미디어 뉴스웨이 · 무단 전재 및 재배포 금지





댓글