'404 Not Found' - 온라인에서 하이퍼링크를 눌렀을 때 파일을 찾지 못 하면 뜨는 오류 코드
온라인에 남은 기록은 영원할까? 최근 미국 싱크탱크 연구소 퓨 리서치 센터는 2013년에 존재한 웹페이지 중 1/4은 10년이 지나면 더 이상 '접근 불가' 상태가 된다며 온라인에만 공유되는 정보의 한계를 지적하는 내용의 보고서를 발간했다.
17일 보고서에 따르면, 2023년 존재하는 웹페이지는 8%만이 사용할 수 없는 상태지만 2013년 존재했던 웹사이트는 38%가 접속이 불가능했다. 오래된 콘텐츠의 경우 이러한 추세는 더욱 가파르게 증가한다.
보고서는 이러한 현상에 대해 '디지털 붕괴'라고 표현했다. 2013년부터 2023년 사이 한 시점에 존재한 정부 및 뉴스 웹사이트, 위키피디아 페이지의 '참조'에 표시되는 링크를 조사한 결과 뉴스 웹페이지의 23%에는 깨진 링크가 하나 이상 포함돼 있었다. 정부 웹페이지의 약 21%가량에도 깨진 링크가 하나 이상 포함된 것으로 나타났다. 특히 시 단위의 지방 정부 웹사이트의 경우, 링크가 깨질 확률이 더 높게 나타났다. 위키피디아 페이지는 '참조' 부분에 더 이상 존재하지 않는 주소를 하나 이상 링크한 경우가 54%에 이르렀다.
소셜 미디어의 디지털 붕괴도 예외는 아니었다. 센터가 2023년 봄 동안 X(당시 트위터)에서 실시간 트윗 샘플을 수집하고 3개월 동안 추적한 결과 트윗 5개 중 1개는 게시된 지 몇 달 만에 더 이상 타 사이트에 공개적으로 표시되지 않았다. 이 중 60%는 원래 트윗을 게시한 계정이 '비공개'로 설정되거나 정지, 또는 완전히 삭제된 경우였다. 나머지 40%는 계정 자체는 존재하나 개별 트윗을 삭제해 버린 경우였다.
터키어나 아랍어로 작성된 트윗은 다른 언어로 설정된 트윗보다 더 자주 사라지는 경향을 띠었다. 트윗의 1%는 1시간 이내에 삭제되고, 하루 안에 3%, 일주일 안에 10%, 한 달 안에 15%가 삭제됐다.
연구진이 '접근 불가능'이라고 판단한 온라인 페이지의 기준은 '페이지가 더 이상 호스트 서버에 존재하지 않거나, 호스트 서버 자체가 존재하지 않는 경우',
'페이지 주소는 살아있지만, 내용이 변경된 경우', '페이지가 존재하지만, 특정 사용자(시각 장애인 등)가 읽기 어려운 경우' 등이다. 연구진은 이 중 '페이지가 더 이상 존재하지 않는 경우'를 집중적으로 분석했다.
이번 연구는 현대 생활의 방대한 '저장소' 역할을 하는 인터넷에 올라오는 정보들이 영원할 거라는 생각과 달리 불완전하며 일시적이라는 걸 보여준다. 이 때문에 전문가들은 온라인에서 사라지는 정보들을 따로 기록하고 보존하려는 노력이 필요하다고 본다. 포털이나 플랫폼 등에 의존할 경우 해당 서비스가 문을 닫으면 기록이 모조리 사라질 수 있다는 점도 지적한다.
결국 개인이 올린 콘텐츠들, 예를 들어 대기업 온라인 플랫폼에 의존하는 글, 그림 자료 등은 쉽게 사라지고 반대로 밈(meme)이나 유머 등은 여러 사이트로 공유되기 때문에 오랜 시간이 지나도 살아남는 현상이 일어난다. 이는 결과적으로 온라인에 올라오는 자료나 정보의 질적 하락을 부르는 요인이다. 온라인에 올라오는 모든 정보는 물리적으로 따로 보관하거나 수집·아카이빙을 해야 오래 보존할 수 있다.
우리나라의 경우 정부 기관의 온라인 페이지는 국가기록원에서 수집하고 있다. YTN이 국가기록원에 '수집하는 온라인 홈페이지 및 링크가 있냐'고 묻자 "중앙부처 홈페이지만 수집하고 있다"고 답했다.
'웹 수집기'가 수집할 수 있는 범위 내에서 1년에 한 번 중앙부처 홈페이지를 기록한다. 웹 수집기는 일종의 소프트웨어 프로그램으로, 작동하는 특정 날짜의 홈페이지를 그대로 기록한다. 수집기는 홈페이지 안의 URL 주소도 딸 수 있지만, 수집하려는 홈페이지가 URL 주소를 표기하지 않거나 다른 기술을 사용해 막을 경우 가져오지 못한다는 한계가 있다.
디지털뉴스팀 최가영 기자
YTN 최가영 (weeping07@ytn.co.kr)
[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]