2024년 04월 26일 금요일

  • 서울 15℃

  • 인천 16℃

  • 백령 13℃

  • 춘천 15℃

  • 강릉 22℃

  • 청주 17℃

  • 수원 17℃

  • 안동 13℃

  • 울릉도 16℃

  • 독도 16℃

  • 대전 15℃

  • 전주 16℃

  • 광주 16℃

  • 목포 15℃

  • 여수 16℃

  • 대구 17℃

  • 울산 16℃

  • 창원 16℃

  • 부산 16℃

  • 제주 14℃

전문가 칼럼 챗GPT와 동아시아 언어의 생태계

전문가 칼럼 양승훈 양승훈의 테크와 손끝

챗GPT와 동아시아 언어의 생태계

등록 2023.02.13 06:00

챗GPT와 동아시아 언어의 생태계 기사의 사진

대학에서 전산실 실습 수업을 담당하다 보니 학생들 모니터 화면을 보게 되곤 한다. 20대 초반의 대학생들은 실습을 위한 콘솔 화면을 한 편에, 축구나 게임, 혹은 각자 관심있는 주제의 유튜브 화면을 다른 한 편에 띄워 놓고 채팅창 역시도 띄워놓고 있는 경우가 많다. 교수가 지나가면 '알트(Alt)+탭(Tab)' 키를 눌러 다시 프로그래밍을 위한 콘솔을 띄우지만, 멀티태스킹 자체를 막을 순 없다.
 
그런데 종종 잔소리를 하게 될 때가 있는데, 그건 웹브라우저 때문이다. 마이크로소프트(이하 MS)가 윈도우 3.1시절부터, 즉 1990년대초부터 탑재해 온 '인터넷 익스플로러'를 구태여 띄워서 쓰고 있는 학생들이 보여서다. 구글에서 개발한 '구글 크롬'도 있고, 익스플로러의 차세대 모델인 'MS 엣지'도 있지만 구태여 익스플로러를 쓴다. 손에 익었기 때문일테고, 컴퓨터의 성능이 좋아지니 웹브라우저 간 차이를 신경 쓰지 않아도 되기 때문일 수 있다.
 
익스플로러는 너무나 리소스를 많이 잡아먹어 속도가 느리고, 이상한 액티브X(Active X) 같은 것을 설치해야만 할 때가 많고, 우리가 원하는 웹사이트가 접속이 안 될 때가 많다고 구구절절하게 이야기를 한다. 2022년 6월15일로 MS가 지원을 종료했다는 말도 잊지 않는다. 학생들은 "근데 컴퓨터에 왜 깔려 있어요?"하고 묻는다.
 
2000년대까지만 해도 MS는 한동안 혁신적인 제품의 출시보다는 'MS 오피스'를 통해 안정적으로 기업에 필요한 사무 솔루션을 제공하는 회사로만 보였었다. 기존 사용자들의 작업환경이 안정적으로 운영되어야 하므로 버전업을 하더라도 기존에 사용하던 프로그램들과의 호환성 유지를 위해 기존 프로그램들을 죽이기보다는 '개선'하는 방향이 MS의 방향이었다. 또 프로그램들의 코드를 개발자들에게 공개하기보다는 '저작권'을 지키기 위해 소송을 불사하는 회사였다. MS 창업자 빌게이츠의  커리어 말년이 윈도우즈에 익스플로러를 끼워 판 내용으로 벌어진 '반독점재판'이었다는 점은 상징적이다. 익스플로러의 세계에는 개방성이 없었고 MS는 철저한 장사꾼으로만 보였다.
 
MS가 달라진 지 이미 10년이 다 되어간다. 3대 CEO 사티아 나델라의 MS는 오픈소스 생태계에 대한 개방성으로 회사의 혁신역량을 끌어올렸다. 이른바 개방형 혁신(open innovation)이다. MS 엣지를 필두로 가장 많이 쓰는 프로그래밍 콘솔인 비주얼 스튜디오 코드도 오픈소스 생태계에 문호를 열었다. 개방형 혁신을 상징적으로 보여주는 것은 MS가 2018년 개발자의 작업공유 플랫폼 깃허브(Github)를 인수한 것이다. 절대 다수의 개발자들은 자신이 작성한 코드를 공유하고 프로젝트에 함께하는 다양한 개발자들과 의견을 공유하며 코드를 고치고 이를 제품으로 벼려가는 오픈소스 생태계의 일하는 방식이 몸이 배어 있다. MS는 수천만 개발자의 일하는 방식을 자사의 생태계 안에 흡수한 것이다. 더불어 전세계 구직자의 SNS인 링크드인(LinkedIn)을 2016년에 인수했었는데, 수많은 개발자들은 대학생 때부터 MS 비주얼 스튜디오로 작업해 MS깃허브에서 작업물을 공유하고 MS의 구인구직 포털(LinkedIn)에서 취업준비와 이직까지 진행하며 MS 유니버스를 벗어나지 못하게 되는 셈이다. 그 와중에 작업물들이 산출하는 데이터가 MS 애저(Azure)에 누적되어 딥러닝 등 머신러닝의 분석으로 MS의 인공지능(AI)의 수준을 향상시키는 재료가 된다는 것도 공공연한 사실이다.
 
그런 의미에서 챗(Chat)GPT는 MS 유니버스의 선순환이 만들어낸 결과물이라 볼 수 있다. 자발적으로 참여하는 수많은 오픈소스 개발자들의 집단지성, 플랫폼의 향상되는 완성도, 오래된 기업형 비즈니스(B2B) 경험으로 단련된 기업 맞춤형 사업 창출능력. (추후 기술적인 내용만으로 글을 쓸 예정이다.) 이제 모든 직장인들이 두루 쓰는 MS 오피스 여기저기에 ChatGPT가 마치 자동차의 자율주행기능처럼 보조 역할을 담당하게 될 것이다.
 
채팅 기반 AI 서비스 챗GPT를 활용해 보고서와 논문을 고쳐보고, 궁금한 내용을 질문을 해보면서 매일 깜짝 놀라는 중에 구글이 적극적으로 GPT 시장에 진출한다는 이야기가 들리는 가운데, 네이버도 '서치GPT'를 통해 신사업에 진출한다는 이야기를 들었다. 오픈소스에 대한 개방성 외에도 한국어가 가지고 있는 제약들이 떠오른다. 전세계에서 8000만명 밖에 쓰지 않는 언어를 가지고 AI에 학습을 시켜서 10억 명이 훨씬 넘게 사용하는 영어로 생성되는 데이터를 이길 수 있을까? 이를 위해서는 무엇을 할 수 있을까. 이 지점에서 네이버의 '파파고(Papago)'를 생각해 본다. 한국어-중국어, 한국어-일본어 번역에 있어서는 구글보다 품질이 우수하다는 평을 듣곤 한다. 단순히 데이터를 많이 학습시키는 것 이상으로 분석 방식에 공을 들이면 경쟁력을 가질 수도 있다는 것이다.

 
챗GPT가 인간의 일을 얼마나 대체할 것이냐에 대한 논쟁이 뜨거운 가운데, GPT 시장에서 영어 생태계와 좀 다른 동아시아 특히 한국의 언어 생태계에 어느 회사의 인공지능이 어떻게 적응할 지 살펴보는 것도 큰 의미가 있지 않을까 싶다.


ad

댓글