IA, 27억개 웹사이트 저장할때 방통위는 옛 정통부 기록 없애

동아일보

입력 2012-07-25 03:00 수정 2012-07-25 11:35

|
폰트
|
뉴스듣기
|
기사공유 | 
  • 페이스북
  • 트위터
■ 온라인 기록 보관실 美 ‘인터넷 아카이브’ 가보니

1994년부터 2008년까지 한국 정보기술(IT) 산업을 진두지휘했던 정보통신부는 이제 인터넷상에 존재하지 않는다. 어떤 검색엔진으로도 정통부 홈페이지가 검색되지 않는 것이다. 심지어 옛 정통부가 운영하던 소셜네트워크서비스(SNS) ‘싸이월드’의 ‘정통부 미니홈피’에 올라온 콘텐츠마저 모두 사라졌다.

2008년 2월 출범한 방송통신위원회는 옛 정통부의 인터넷 기록을 모두 없앴다. “옛 정통부 기능이 방통위, 지식경제부, 행정안전부, 문화체육관광부로 분산되면서 담당부서로 소관 자료가 이관됐기 때문”이라는 설명과 함께. 웹사이트는 존재하지 않지만 그 자료는 개별 부처가 보관하고 있으니 원한다면 자료를 찾아볼 수 있다는 얘기다.

하지만 국민은 인터넷에서 정통부 기록이 사라져 과거 정통부가 어떤 자료를 갖고 있었는지 알 방법조차 없다. 인터넷 기록에 소홀한 한국 인터넷의 현실이다.


○ 인터넷에만 존재하는 자료의 보존

“이곳과 네덜란드 암스테르담, 이집트 알렉산드리아 도서관까지 세 곳에 똑같은 데이터가 나뉘어 저장돼 있어요. 하지만 이것으로는 부족해요. 6곳으로 늘리는 게 목표입니다.”

인터넷 아카이브(IA)의 창업자 브루스터 케일 씨는 지난달 30일 미국 샌프란시스코 사무실에서 동아일보 기자와 만나 “다음 세대에게 훼손되지 않은 지식을 최대한 남겨주기 위해 이 일을 시작했다”며 인터넷 아카이브의 역할을 설명했다.

인터넷 아카이브는 1996년 미국 샌프란시스코에 설립된 일종의 온라인 기록보관실이다. 책이나 신문, 필름 등 다른 매체로 기록되지 않은 채 인터넷에만 올라온 이른바 ‘디지털 온리(digital only)’ 정보를 모아 컴퓨터에 백업하는 일을 하는 비영리기구다.

1990년대 이전에는 인류가 생산해낸 대부분의 지식이 책, 인쇄물, 필름의 형태로 도서관에 저장됐다. 하지만 인터넷 발달과 함께 정보가 컴퓨터에 저장되면서 위험이 생겼다. 디지털 정보는 예상치 못한 순간에 전기가 끊기거나 해커의 공격, 거대한 자기(磁氣)폭풍 등에 쉽게 손상되기 때문이다. 케일은 “이런 일이 벌어지면 인류가 다시 퇴보하게 되지 않을까 걱정했다”고 말했다.

그는 세계 최대의 인터넷 순위사이트인 알렉사닷컴과 초기 검색엔진이었던 와이즈(WAIS)의 창업자이기도 하다. 와이즈를 아메리칸온라인(AOL)에, 알렉사닷컴을 전자상거래업체 아마존에 팔아 억만장자가 되자 그 돈으로 공익적인 일을 하겠다며 인터넷 아카이브를 만든 것이다.

인터넷 아카이브는 지금까지 세계 14개국 수천 개의 공공기관과 대학, 도서관 등이 기증한 약 27억 개의 웹사이트를 저장해 왔다. 또 종이책이나 필름 등이 시간의 흐름에 따라 훼손될 것에 대비해 책과 신문, 영화와 음악 등을 디지털로 변환해 저장하고 있다. 지난해부터는 이렇게 보관한 디지털 자료가 만에 하나 손상될 상황에 대비해 출간되는 종이책을 한 권씩 기증받거나 사들인 뒤 화물 컨테이너에 저장하고 있다. 노아의 방주처럼 인터넷 아카이브를 ‘지식의 방주’로 만든 셈이다.

브루스터 케일 씨가 인터넷 아카이브(IA)의 서버실에서 온라인의 정보를 저장하는 원리에 대해 설명하고 있다. 샌프란시스코=김상훈 기자 sanhkim@donga.com
○ 세계가 인터넷 기록 보존 노력

인터넷 아카이브의 이런 시도가 사회적 주목을 받자 미국 정부도 나섰다. 2000년부터 미국 의회 도서관은 ‘미국 대통령 선거’나 ‘이라크 전쟁’처럼 특정 주제에 관한 웹사이트를 검색해 인터넷에만 존재하는 자료를 따로 보관하기 시작했다.

2003년에는 프랑스 국립도서관의 주도로 세계 각국 도서관이 제휴해 ‘국제 인터넷 보존 컨소시엄’(IIPC·International Internet Preservation Consortium)도 구성됐다. 유럽 각국 도서관을 비롯해 세계 42개국 국립도서관이 회원이다.

한국 국립중앙도서관도 2008년 IIPC의 정회원이 됐다. 하지만 국립중앙도서관의 온라인 자료는 아직 턱없이 적은 상태다. 지난해 국립중앙도서관의 온라인 디지털 자료 보존 사업인 ‘오아시스’(oasis.go.kr)는 13만3834건의 자료를 추가로 수집하는 데 그쳤다. 이는 2010년의 15만1087건보다 오히려 줄어든 수치다. 미국의 인터넷모니터회사 핑덤에 따르면 지난해 새로 만들어진 웹사이트만 세계적으로 3억 개를 넘었다.

샌프란시스코=김상훈 기자 sanhkim@donga.com








라이프



모바일 버전 보기