2024년 05월 19일 일요일

  • 서울 21℃

  • 인천 23℃

  • 백령 18℃

  • 춘천 20℃

  • 강릉 27℃

  • 청주 23℃

  • 수원 22℃

  • 안동 22℃

  • 울릉도 19℃

  • 독도 19℃

  • 대전 23℃

  • 전주 23℃

  • 광주 22℃

  • 목포 22℃

  • 여수 22℃

  • 대구 25℃

  • 울산 24℃

  • 창원 25℃

  • 부산 26℃

  • 제주 25℃

IT 데이터양에만 치중한 생성형AI, 환각현상에 '발목'···해법은?

IT 인터넷·플랫폼

데이터양에만 치중한 생성형AI, 환각현상에 '발목'···해법은?

등록 2023.10.05 07:00

강준혁

  기자

지난달 27일 구글 바드, 복수 답변제 도입최근 네이버는 업데이트 통해 답변 구체화"초기 AI, 양에 치중해 오류···질적 개선해야"

생성형 인공지능(AI) 업계가 '할루시네이션' 현상(주어진 데이터 또는 맥락에 근거하지 않은 잘못된 정보나 허위 정보를 생산하는 것·환각 효과)을 개선하기 위한 노력에 주력하고 있다. 기업들은 답변 신뢰도를 높이기 위해 바쁜 행보를 이어가고 있으나, 업계에서는 이런 오류가 많은 데이터를 빠르게 끌어 모으려는 각 사의 욕심에서 시작된 만큼 근본적인 개선을 위해선 학습 내용 개선부터 이뤄져야 한다는 지적도 나온다.

가파른 성장을 거듭하던 생성형 AI 시장이 할루시네이션 리스크에 제동이 걸린 가운데, AI를 운영하는 회사들은 각자 이를 개선해 신뢰도를 끌어올리기 위해 총력을 다하고 있다. 사진=홍연택 기자가파른 성장을 거듭하던 생성형 AI 시장이 할루시네이션 리스크에 제동이 걸린 가운데, AI를 운영하는 회사들은 각자 이를 개선해 신뢰도를 끌어올리기 위해 총력을 다하고 있다. 사진=홍연택 기자

5일 정보기술(IT) 업계에 따르면 최근 구글의 챗봇 '바드'(Bard)는 신뢰도 향상을 위해 '복수 답안제'를 채택했다. 이용자에게 2개 답안을 제시해 선택할 수 있도록 했다. 이를 통해 이용자 입장에선 좋은 품질의 답변을, 바드는 이용자 피드백을 실시간으로 얻을 수 있다.

구글은 바드의 신뢰도 향상을 위한 노력을 지속해왔다. 지난 5월 정식 버전 공개 땐 답변의 출처 정보를 함께 제공, 사용자가 바드의 대답에서 출처와 일치하는 부분을 곧바로 확인할 수 있도록 했다. 출처를 클릭하면 해당 글로 이동할 수 있도록 하는 안전장치도 뒀다.

이 같은 노력은 업계 선두 주자인 오픈AI '챗GPT'도 진행 중이다. 챗GPT는 학습 데이터를 개선하는 데 보다 비중을 두고 있다. 그간 이뤄진 학습 데이터 개선을 보면 ▲데이터 오류 검증 ▲데이터 편향 제거 ▲새로운 데이터 추가가 있다. 오픈AI가 학습 데이터 개선에 이처럼 공들이는 이유는 광범위한 학습 데이터량에 있다. 오픈AI는 생성형 AI 고도화 방안으로 데이터량에 무게를 둔 탓에 그 정확도에 대해 항상 지적이 있었다.

이와 함께 모델 자체의 개선도 진행했다. 챗GPT가 생성한 텍스트의 정확성을 검증하는 기능, 상황에 부합하는지 판단하는 기능, 텍스트의 사실 여부를 검증하는 기능 등이 있다.

국내도 할루시네이션을 방지하기 위해 노력을 기울이고 있다. 국내 대표 초거대 언어모델(LLM)을 보유한 네이버의 대화형 AI '클로바X'의 지난달 26일 업데이트 내용을 살펴보면 '보다 구체적이고 상세한 답변 제공'이란 항목이 있다. 이 역시 답변 신뢰도를 높이기 위한 전략의 일환으로, 네이버는 이전보다 자세한 답변을 내놓기 위해 서비스 고도화 작업을 이어가겠다는 목표다.

한 업계 전문가는 "할루시네이션은 생성형 AI 기술이 빠르게 성장하자 기업들이 기술 고도화를 위한 전략으로 데이터 량에 치중한 결과"라며 "지금까지 나온 챗봇들은 그런 학습 데이터를 기반으로 만들어진 터라 일정 부분 한계점이 존재할 수밖에 없다"라고 설명했다.

그러면서 "지금 시장에 나와 있는 AI들은 지속적으로 피드백을 받아 개선하는 데 무게를 둬야 하고 새롭게 시장에 나오는 AI들은 학습(데이터)의 질에 좀 더 신경을 써야 한다"면서 "단순히 초거대AI의 덩치를 키우는 방식보단 데이터 범위를 한정해 학습 내용의 개선에 우선적으로 치중해야 할 것"이라고 덧붙였다.
ad

댓글