[열린라디오 YTN]
■ 방송 : YTN 라디오 FM 94.5 (20:20~21:00)
■ 방송일 : 2023년 3월 25일 (토요일)
■ 진행 : 최휘 아나운서
■ 대담 : 김덕진 미래사회IT연구소장
네이버? 구글? 이제는 챗GPT가 검색엔진을 대신한다
* 아래 텍스트는 실제 방송 내용과 차이가 있을 수 있으니 보다 정확한 내용은 방송으로 확인하시기 바랍니다.
◇ 최휘 아나운서(이하 최휘)> 오늘 뉴미디어 트렌드, IT 분야로 만나봅니다. 김덕진 미래사회IT 연구소장님 전화 연결돼 있습니다. 소장님 나와 계시죠?
◆ 김덕진 미래사회IT연구소장(이하 김덕진)> 안녕하세요, 반갑습니다. 김덕진입니다.
◇ 최휘> 저희가 지난달에 했던 방송에서 챗gpt 정말 대단하다, 이런 이야기를 나눴는데 그 사이에 더 진화를 했더라고요. 이젠 이미지도 해석을 한다고요?
◆ 김덕진> 이게 진짜 변화의 속도가 엄청나서, 저는 변화를 계속 보고 있는데도 일주일이 거의 10년 치 변화가 나오는 것 아닌가라고 할 정도로 정말 변화의 속도가 빠른 것 같아요. 특히나 이 변화의 속도에 가장 정점을 찍은 게 최근에 나온 오픈AI의 ‘gpt 4’라고 볼 수 있을 것 같습니다. 챗gpt라는 게 gpt 1, 2, 3 중에 ‘gpt 3.5’였거든요. ‘gpt 3.5’ 나온 지 거의 세 달 정도밖에 안 됐는데 그다음 버전인 gpt 4가 이제 챗gpt에 적용이 되면서 단순히 우리가 알고 있었던 기존의 방식뿐만 아니라 이른바 눈도 생겼습니다. 그래서 이미지도 읽고요. 그 안에 있는 내용으로 해석을 해서 서로 인간과 대화하는 수준이 되다 보니까 이거는 도대체 어디까지 진화할 것인가에 대한 또 사람들에게 놀라움을 주고 있는 것이죠.
◇ 최휘> 지난해 말에 나온 게 챗gpt 3.5버전이었던 거예요?
◆ 김덕진> gpt 3.5가 탑재된 챗gpt라고 보시면 될 거요.
◇ 최휘> 그럼 이번에 나온 gpt 4가 텍스트뿐만 아니라 이제는 이미지 사진도 해석을 하고 답을 내놓는다는 건데, 어느 범주까지 이해를 하는 거예요?
◆ 김덕진> 예시를 그냥 우리가 한번 생각해 보면 될 것 같은데요. 챗gpt한테 아무런 정보를 주지 않고 사진을 한 장 줍니다. 그런데 그 사진에 달걀이나 밀가루 그다음에 우리가 알고 있는 우유, 이런 것들이 들어 있는 사진이에요. 그런데 그 사진에 우유는 어느 정도 잘려 있고 조금만 보이고 이런 형태인데, 그냥 이 이미지를 주면서 얘한테 ‘이걸로 어떤 음식을 만들 수 있을까? 이 재료들을 뭘 만들 수 있니?’라고 물어보는 거예요. 그랬더니 갑자기 그걸 보고 답변을 이렇게 합니다. ‘팬케이크을 만들 수 있고요. 오믈렛을 만들 수 있고요. 머핀을 만들 수 있습니다’ 이런 얘기를 하는 거예요. 그리고 또 이제 테스트로 한 번 더 보여줬던 이미지가 어떤 거냐면, 우리가 인터넷 같은 데 보면 되게 수많은 풍선들이 하나의 끈에 달려 있어서 뭔가 딱 자르면 날아갈 것 같은 이런 이미지들이 있잖아요. 그런 이미지를 그냥 줍니다. 그러고 나서 얘한테 ‘줄이 끊어지면 어떻게 될까?’ 그러니까 풍선 이야기 아무것도 안 하고 그냥 ‘줄이 끊어지면 어떻게 될까?’라고 물어봐요. 그러면 갑자기 ‘풍선이 날아가겠죠’라고 대답을 해요. 그러니까 이 사진에 있는 모든 맥락을 이해하고 있다는 건데요. 그런데 이번에 gpt 4에 대한 기술 노트를 보면 이렇게 이미지를 이해하는 것도 잘하지만 원래 더 잘하는 건 뭐냐. 우리가 보통 보는 논문이나 회사에서 많이 보는 문서들 있잖아요. 그 문서에 들어 있는 표나 혹은 그래프 이런 것들을 더 잘 본다는 겁니다. 이번에 또 예시로 나왔던 게 뭐였냐 하면, 아주 복잡한 물리학 문제 시험이 있어요. 물리학 시험의 텍스트랑 그다음에 어떤 물리학에 대한 원리에 대한 어떤 도식 그림 같은 게 있는 건데, 그 그림을 주고 나서 ‘문제를 단계별로 풀어볼래?’라고 물어봤더니 정답을 마치 우리가 이른바 일타 강사가 하나하나 설명을 하듯이 이것을 정답을 한 단계 한 단계씩 설명해 주는 모습을 보여줍니다. 이게 참 의미가 있는 게, 우리가 알고 있는 구글 있잖아요. 구글이 실제로 텍스트로 검색하는 걸 오픈하고 거기서 이미지로 검색할 수 있는 것까지 진화하는 데 3년 정도 걸렸거든요. 그런데 챗gpt는 텍스트로 대화할 수 있는 거 나오고 3개월 만에 이런 이미지를 읽을 수 있는 게 나오다 보니까 많은 사람들을 더 놀라게 하고 있는 것이라고 볼 수 있습니다.
◇ 최휘> 그럼 지금 전 세계 많은 사람들이 검색 엔진으로 조금 전 말씀하신 구글이나 네이버, ‘초록창’을 이용하는데 챗gpt가 이걸 대신한다거나 변화시킬 가능성도 있을까요?
◆ 김덕진> 이 부분에 있어서는 지금 많은 해석들이 나오고 있는데요. 챗gpt만으로는 그게 쉽지 않을 수 있지만 결국에는 챗gpt의 지금은 투자사라고 할 수 있는 곳이죠, 오픈AI의 투자사라고 할 수 있는 마이크로소프트가 가지고 있는 ‘빙(Bing)’이라고 하는 검색 엔진이 구글의 파이를 계속적으로 뺏고 있다고 하는 건 사실이라고 볼 수 있을 것 같습니다. 실제로 우리가 오픈AI에서 만든 챗gpt 사이트에서 쓸 수 있지만 빙이라고 하는 마이크로소프트의 검색 엔진에도 이 챗gpt가 이번에 들어갔거든요. 그리고 이것을 쓰기 위해서는, 어떻게 보면 플랫폼적인 전략이라고 볼 수 있을 것 같은데, 우리가 보통 요즘에는 인터넷 브라우저를 대부분 구글에서 만든 크롬을 쓰시고 그리고 검색 엔진은 구글을 쓰잖아요. 그리고 이메일도 G메일을 쓰시는 분들이 많습니다. 그런데 이 말씀드렸던 MS에서 만든 빙 안에 들어가 있는 챗gpt를 쓰기 위해서는 일단은 브라우저를 크롬이 아닌 엣지를 설치를 해야 돼요. 그러니까 마이크로소프트에서 인터넷 익스플로어 이후에 나온 브라우저였는데 이게 점유율이 상당히 낮죠. 그런데 이제 엣지를 써야지만 쓸 수 있고, 그다음에 이메일로 마이크로소프트 계정을 신청을 해야 합니다. 그 얘기인 즉, 이제 너네가 마이크로소프트 거를 쓰기 위해서라면 브라우저도 마이크로소프트 거 써야 되고, 그리고 검색도 마이크로소프트 것을 써야 되고, 또 이메일 주소도 마이크로소프트로 새로 만들어야 되니까 어떻게 보면 구글이 지금까지 10년 이상 차지하고 있었던 검색시장의 독점성을 구글이 이 챗gpt를 기반으로 한 여러 가지 서비스를 통해서 가져오겠다라고 하는 모습들을 실제로 보여주고 있고요. 그리고 말씀드렸던 빙 자체가 아주 짧은 시간에 사용자 수가 전 세계 1억 명을 돌파했거든요. 그 정도로 파이 싸움에서 마이크로소프트가 어떻게 보면 정말 마음을 먹고 이번에 제대로 공격하고 있구나라고 볼 수 있을 것 같습니다.
◇ 최휘> 챗gpt가 검색 시장의 판도를 조금씩 바꾸고 있다, 이렇게 볼 수 있을 것 같고. 지금 이미지를 읽을 수 있고 또 표나 인포그래픽 등 해석까지도 지금 가능한 상태인 거잖아요?
◆ 김덕진> 네, 그렇죠. 그게 정확하게 표현하면, 아직까지 일반인들한테 우리까지는 공개되지 않았는데 베타 서비스이기는 하지만 일부들이나 아니면 개발자들이 보여주는 시연은 지금 보고 있는 상황인 것이죠.
◇ 최휘> 이것 말고도 지금 챗gpt 4 버전에서 업그레이드된 부분이 있나요?
◆ 김덕진> 많이 있습니다. 일단은 제일 놀라웠던 것 중에 하나인데, 우리가 보통 창작, 창의의 영역을 gpt가 어느 정도 할 수 있다는 건 알고 있었잖아요. 그런데 얘한테 일반적인 사람들이 생각할 때 상당히 어려울 만한 조건을 줘도 상당히 대답을 잘합니다. 예를 들면 이런 거예요. 글자로 얘한테 이렇게 질문을 합니다. 우리가 아는 신데렐라 있잖아요. 신데렐라 이야기를 줄거리를 적어줬으면 좋겠는데, 그냥 적어주지 말고 글자의 반복 없이 알파벳 순서대로. 그러니까 A, B, C, D 이걸 다 써서 그 단어를 가지고 줄거리를 써 주라는 거죠. 우리로 치면 마치 우리가 삼행시하듯이 A부터 Z까지 스물 몇 글자를 활용을 해서 싹 이어서 쓰라고 하는데, 실제로 그것을 받았을 때 아주 자연스럽게 A부터 Z까지를 다 쓰면서 문장을 만들어냅니다. 그리고 그 문장의 내용이 이상하지 않고 아주 또 잘 정리가 돼서 나와요. 그러니까 마치 우리가 힙합 가사 같은 거 보면 라임을 맞추거나 이렇게 해서 어떠한 키워드들을 쓰는 것들이 있잖아요. 그 정도의 창작 능력을 보여주고 있고요. 실제로 이런 작곡뿐만 아니라 예를 들면 우리가 작사, 그러니까 어떤 음악의 어떤 가사를 쓰거나 대본을 쓰거나 이럴 때도 충분히 활용해 볼 수 있는 수준이라고 볼 수 있을 것 같고요. 그것뿐만 아니라 더 많이 기억하고 더 길게 대답을 하는데 명령어처럼 챗gpt한테 예를 들면 ‘어떤 책을 요약해줘’라고 할 수도 있다는 거예요. 그런데 얘가 질문으로 받아들이는 게 2만 5천 단어까지 받아들이게 됩니다. 그 정도 단어면 한 50페이지 분량이거든요. 그러니까 그냥 챗gpt한테, 영어 기준이긴 하지만, 책 50페이지를 그냥 주고 그거를 ‘다섯 줄로 요약해줘’ 아니면 ‘한 페이지로 요약해줘’ 그러면 이거를 대답을 한다는 거예요. 이렇게 되니까 이거를 우리가 요약기로 실제로 이번에 데모로 보여줬던 것들이 위키피디아에는 아주 긴 글을 주고, 그 긴 글에 있는 리한나라고 하는 어떤 연예인의 어떤 일대기 중에서 ‘슈퍼볼 공연이 왜 특별했는지 설명해 줘’ 그랬더니 그걸 설명을 해 주는 거예요. 어떻게 보면 우리가 알고 있는 논문이나 연구 리포트 이런 걸 주고 그거에 대한 내용을 정리해 달라거나 그 내용에서 중요한 걸 뽑아달라고 하면 뽑아주는 거죠. 그 정도 수준이 있고요. 또 한 가지 하나 더 의미 있는 게, 얘가 정말로 비서처럼 고차원적인 추론이 가능해졌다는 겁니다. 예를 들면 이런 겁니다. 우리가 보통 급할 때 비서를 쓰시는 분들이 카카오톡이나 이런 걸로 ‘나 오늘 3시부터 4시까지 일정 있으니까 써주세요’ 이런 식으로 하다 보면 솔직히 우리가 카카오톡 대화 내용만 보더라도 상당히 헷갈릴 때들이 많잖아요. 그런데 예를 들어서 gpt4는 앞에 A라는 사람은 11시부터 3시까지 일정이 있고, B라는 사람은 4시부터 일정 3개 정도를 주고, ‘이 세 사람이 같이 30분 동안 미팅을 하려면 어떤 시간에 하면 좋을까요?’라고 물어보는 거예요. 그럼 사람이 봐도 헷갈리는 건데, 이제 기존에 있었던 gpt 3.5 버전의 챗gpt는 뭔가 정답을 내주기는 하는데 그 정답이 틀린 정답을 내주거든요. 근데 gpt 4는 그거를 일목요연하게 정리를 해줍니다. 예를 들면 ‘A라는 사람은 11시부터 3시까지 일정이 됩니다’ 이런 식으로 정리를 해주는 거죠. 그다음에 ‘결론적으로 3명이 공통적으로 이용 가능한 시간이 오후 12시부터 12시 반입니다’ 이렇게 아주 깔끔하게 정리를 해줘요. 그렇게 되니까 인간보다 훨씬 더 추론 능력을 갖고 비서처럼 쓸 수 있는 것이 아닌가라는 것들을 보게 되고요. 그래서인지 여러 가지 시험 결과들이 나왔는데, 예를 들면 생물올림피아드 경시대회를 기존 챗gpt한테 시켰더니 하위 31%였다고 그래요. 그런데 이번에 이게 상위 1%까지 올라갔다고 합니다. 이 정도의 공부 능력이고, 그다음에 또 우리나라 입장에서 한 가지 더 놀라운 것은 언어의 이해도가 또 급상승했다는 거예요.
◇ 최휘> 챗gpt가 영어를 제외한 언어 능력은 아쉽다는 평가가 있었는데, 이 부분도 업그레이드가 된 거예요?
◆ 김덕진> 이 부분이 상당히 우리나라에게 주는 의미가 있는데요. 예를 들면 한국어 기준으로 봤을 때 보통 언어에 대한 인지가 다 다르게 됩니다. 그러니까 그 두 가지가, 데이터가 없는 것도 있지만 일단 우리가 번역을 하더라도 번역 품질의 차이가 나잖아요. 그런데 이번에 gpt 4의 벤치마크 결과들을 보면 한국어를 이제 gpt 4가 받아들여서 이해하는 수준이 우리가 써 본 gpt 3.5가 영어를 받아들이는 것보다 더 높은 수준의 한국어를 이해할 수 있다는 거예요. 기존에 우리가 써왔었던 챗gpt인 gpt 3.5가 영어를 이해하는 게 70% 정도거든요. 그런데 이번에 gpt 4는 한국어를 이해하는 게 77%까지 상승이 됐습니다. 그러니까 기존에 우리가 쓰는 영어만큼보다 훨씬 더 이제는 한국어도 잘 대화하는 gpt 4가 나왔다라고 우리가 볼 수 있는 것이죠.
◇ 최휘> 한국어 이해 능력도 향상이 됐군요. 그럼 지난 방송에서 저희가 gpt를 ‘인턴 사원’에 소장님이 비유를 해 주셨는데, 이번에 진화한 버전은 비서나 똑똑한 사람으로 비유를 해도 무리가 아닐까요?
◆ 김덕진> 글쎄요. 하지만 저는 여전히 인턴은 뗄 수 없다라고 말씀드리고 싶어요. 그러니까 좀 더 똑똑해졌지만 인턴을 뗄 수 없다라는 얘기는 어떤 거냐면, 그럼에도 불구하고 책임은 우리가 져야 될 요소들이 많다는 겁니다. 이른바 우리가 ‘할루시네이션(hallucination)’이라고 표현을 하죠. 환각 현상이라는 건데, 여전히 챗gpt는 어느 정도 개선이 됐기는 했지만 그래도 본인이 모르는 것들이 자기가 아는 것처럼 얘기하는 부분들이 분명히 존재해요.
◇ 최휘> 그러니까 오답을 내놓는다는 거죠?
◆ 김덕진> 네, 그렇습니다. 그런데 이게 오답이 오답이라고 얘기를 하는 것이 아니죠. 물론 이번에 gpt 4가 되면서 이른바 많은 사람들이 그걸 훈련을 시켜서 많이 좋아졌다라고 이야기를 하고 있습니다. 하지만 우리가 인공지능을 활용할 때는 언제나 생각해야 할 것이 인공지능의 답변은 생성형이기 때문에 항상 틀릴 수 있다라는 것을 전제조건으로 가져야 한다는 거예요. 그렇기 때문에 저는 쉽사리 인턴을 뛰는 것은 오히려 위험하다. 그래서 그것보다는 똑똑해진 비서이니까 예전보다 더 적극적으로 활용하되 최종 결정은 여전히 사람이 해야 된다라는 얘기를 드립니다.
◇ 최휘> 여전히 100% 신뢰할 수는 없다, 여전히 한계가 있다. 이렇게 정리를 해보겠습니다. 오늘 뉴미디어 트렌드 여기까지 듣겠습니다. 감사합니다.
◆ 김덕진> 감사합니다.
◇ 최휘> 지금까지 미래사회IT연구소의 김덕진 소장과 함께했습니다.
YTN 신동진 (djshin@ytn.co.kr)
[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]