141: tweet overflow

파일 시스템에 기반한 개인 정보 시스템의 한계

이 글은 2016년 8월 1일에 다른 블로그에 공개했던 글을 옮겨온 것이다.


광역적인 맥락에서 정보 시스템은 구글로 대표되며, 구글이 다루지 않는 전문 분야들은 각 분야 별로 별도의 데이터베이스가 구축되어 있다. 하지만 이러한 광역적 정보 시스템의 개인의 정보 시스템을 대체할 수 있냐고 묻는다면 그렇지 않다고 생각한다. 왜냐하면 구글은 정말로 광역적인 맥락만을 수용하기 때문에, 각 개인의 고유한 정보와 맥락들까지 모두 포용할 수는 없기 때문이다.

이러한 관점에서 2000년 중후반에는 광역적인 정보 시스템이나 유사 서비스들에서 이른바 개인화라고 불리는, 개인의 맥락을 덧씌우는 작업이 활발하게 진행되었다. 하지만 여기서 말하는 개인화는 개인의 정보나 맥락을 온전하게 포함하지 못 하며 근본적인 두 시스템(광역 정보 시스템과 개인 정보 시스템)의 차이와 개인 정보 문제 때문에 완결을 이루지 못 한 채로 시들어져 갔다. 개인화는 개인 정보 시스템을 완결하지 못 했고, 재미있게도 개인 정보 시스템은 구글이 급속하게 성장하면서 정보 시스템으로서 실질적인 발전을 이룩하는 동안에, 거의 아무런 발전도 하지 못 했다.

아직도 대부분의 사람들은 개인 정보 시스템의 기반으로 파일 시스템을 사용한다. 예를 들어 어떤 디자이너를 상상해보자. 이 디자이너는 포토샵(Photoshop)과 일러스트레이터(Illustrator)를 주로 사용한다. 하나의 작업을 할 때마다 작업 내용을 담고 있는 자체 포맷(예를 들어, psd)와 최종 퍼블리싱 포맷(예를 들어, png)으로 다수의 파일을 생산해낸다. 이러한 작업물들은 처음부터 파일 시스템에 저장된다는 전제에서 생산된다. 이 디자이너는 파일 관리에 고충을 겪어와서 자신만의 디렉터리 관리 방법을 정해서 사용하고 있다.

2016/09/낰욧 기획사/봉투 디자인/20160902 초기 시안.ai
2016/09/낰욧 기획사/봉투 디자인/20160921 최종 디자인.ai
2016/09/낰욧 기획사/봉투 디자인/20160921 최종 디자인.png
2015/05/낰욧 블로그/로고 디자인/20150513 디자인.psd

아마 현실에서 이 정도로만 파일이 관리되면, 충분할 지 모른다. 이러한 접근 방법은 하나의 디렉터리에서 모든 맥락을 소실한 채 이름만으로 파일만을 관리하는 것보다 훨씬 더 구조적이다. 하지만 디렉터리 깊이가 깊어짐에 따라서 파일들을 일일히 탐색하는데 고충이 생길 수도 있다. 이 디자이너에게 파일 시스템은 자신의 작업물 전체를 저장하고 관리하고 기억하고 탐색하는 개인 정보시스템이다. 하지만 이 시스템은 효율적이지 않다.

안타깝게도 컴퓨터 위에서 모든 작업은 파일 기반으로 이루어지고, 파일이라는 것은 서로 다른 애플리케이션들이 작업을 공유할 수 있는 기반이기도 하다. 하지만 파일 시스템의 근본적인 원시성에 대해서 이야기해볼 필요가 있다. 파일 시스템은 근본적으로 정보의 가치를 극대화하기 위해서 만들어진 시스템이 아니라, 컨텐츠를 특정한 단위(파일)로 저장하기 위해서 설계된 시스템이다. 파일엔 메타데이터를 유연하게 담기 위한 충분한 공간이 준비되어있지 않으며, 만약 그러한 파일 시스시템이 있다고 하더라도 그것을 인덱스하고 검색하기 위한 기능들이 내장되어있지 않다.

이러한 근본적인 한계를 극복하기 위해서 각 운영체제들은 파일 시스템에 덧씌워 별도로 파일을 인덱스하고 검색할 수 있는 인터페이스를 제공한다. 각 시스템에서 제공하는 이러한 기능들을 충분히 활용하고 있다면 이미 그 사람은 개인 정보 시스템에 있어서 충분히 파워유저라고 할 수 있다. 하지만 이러한 접근은 근본적인 한계가 있는 접근이다. 첫번째로 이러한 레이어는 운영체제 간에 공유되지 않는다. 두번째로 운영체제는 기본적으로 모든 종류의 파일 형식들을 지원하지 않는다. 즉, 파일 내부에 포함된 내용이나 메타 데이터들을 모두 적절히 처리할 수 있는 것은 아니다. 마지막으로 여전히 파일 시스템 기반의 경로에 지나치게 의존적이다.

파일 시스템을 개인 정보 시스템으로 이해한다면, 이 시스템은 개인이 가진 정보를 유용하게 한다는 맥락을 포함하지 않는다는 점을 인지할 필요가 있다. 파일 시스템은 철저히 데이터를 구조적으로 저장한다는 맥락에서 설계되었다. 하지만 정보 시스템의 본질적인 가치는 정보의 저장에 있지 않다. 앞선 디자이너의 예에서 다음 파일을 찾고 싶다고 가정해보자.

2016/09/낰욧 기획사/봉투 디자인/20160902 초기 시안.ai

이 디자이너는 분명히 구조적으로 폴더 시스템을 잘 활용하고 있다. 하지만 이러한 디렉터리 구조는 얕은 경로에서 작업 시기를 정확히 알고 있어야만 해당하는 주제를 찾을 수 있도록 구성이 되어있다. 단순 이름 검색이 가능하다고 하더라도 실제로 찾고 있는 파일인지를 확인하는 방법은 경로를 확인하거나 실제로 열어보는 일이다.

다시 광역적인 정보 시스템을 생각해보자. 구글과 같은 거대한 검색엔진은 우리가 상상할 수도 없을만큼 많은 정보를 매일 인덱스하고 검색 가능하게 해준다. 이 때 우리에게 중요한 것은 실제 데이터가 어디에 있는 지가 아니다. 구글 덕분에 우리는 정보를 검색할 때 정보의 위치(즉, 파일시스템의 경로)를 완전히 무시한 채, 키워드만으로 어떤 정보에 이르는 새로운 경로를 가질 수 있게 된다. 구글이 가진 근본적인 가치는 무수히 많은 문서 중에서 가장 가치 있는 문서로 정렬을 해준다는 점이다. 우리는 때때로 나중에 필요한 것들을 로컬 파일 시스템에 저장해놓곤 한다. 하지만 어떤 정보가 필요할 때 그것을 파일 시스템에서 찾는 것보다, 구글에서 다시 검색하는 게 더 빠른 경우가 자주 발생한다. 즉, 구글의 본질적인 가치는 이 세상의 모든 정보를 저장하는 것이 아니라, 이전 글(정보 과잉과 개인을 위한 정보 관리 도구)에서 이야기했듯이, 기록된 것을 유용하게 하는 능력의 진화에 있다.

버니바 부시가 지적했듯이 정보 과잉이 디지털 시대의 전유물이라고 생각하는 것은 착각에 불과하다. 정보 과잉은 이미 1900년대 초반부터 시작되었다. 앞서 이야기했듯이 광역적 정보 시스템의 본질적 가치는 정보의 양이 많아지는 속도보다 기록된 것을 유용하게 하는 능력을 빠르게 증가시키는 일이다.

안타깝게도 파일 시스템에 기반한 개인 정보 시스템이란 한 수십년 동안 정체중인 것으로 보인다. 추측컨데, 개인 정보 시스템에 있어서 정보 과잉이란 깊게 논의되지 않았던 게 아닐까 싶다. 개인 정보 시스템은 광역적인 정보 시스템과는 본질적인 차이가 하나 있다. 광역적 정보 시스템은 매우 탐욕적이라서 수집하고자 하는 모든 대상을 가능한 한 모두 수집하려고 한다. 이러한 탐욕성은 구글 북스와 같은 시스템에서 여실히 드러난다. 하지만 개인 정보 시스템은 지극히 개인적으로 정보(파일)을 늘려나간다. 그것은 개인의 창작물일 수도 있으며, 타인이 생산한 정보들일 수도 있다. 파일 시스템에 파일이 추가되는 것은 철저히 개인의 행동에 의해서 이루어진다. 즉, 파일 시스템은 시스템이 가진 정보를 유용하게 하는 능력보다도, 소유자가 파일 시스템 전체를 충분히 파악하고 있는 동안에만 유용하다. 그리고 바로 그러한 사실에 의존적으로 존재해왔던 셈이다.

나는 파일 시스템의 한계를 여실히 드러냈던 사례 중에 하나가 NAS(network attached storage)였다는 생각이 든다. NAS는 기존 파일 시스템에 기반해 파일을 통째로 넣을 수 있는 보조장치에 불과하고 결코 개인 정보 시스템은 아니다. 저장장치를 확장해주는 동시에, 지나치게 많은 파일들을 가질 수 있게 만들어준다는 점과 레이턴시의 증가로 컴퓨터를 개인 정보 시스템으로 활용하고자 할 때 더 지옥 같은 경험을 만들어준다.

예를 들어 사진을 관리하고자 한다면 NAS보다는 구글 포토스(Google Photos)어도비 라이트룸(Adobe Lightroom) 같은 모델이 훨씬 던 미래적이고, 개인 정보 시스템에 가까울 것이다. 중요한 것은 사진 수만-수십만 장을 한 파일 시스템에 저장하는 것이 아니다. 오히려 저장 장치는 파일의 경로에 의존하지 않도록 분산화될 수 있어야하고, 이것들을 관리하는 데이터베이스와 그것을 유용하게 하는 소프트웨어가 필요하다. 어도비 라이트룸은 데이터베이스를 구축하고, 메타데이터를 통해서 사진들을 분류하고 관리할 수 있도록 도와준다. 구글 포토스는 (다른 제약을 가지고 있지만) 좀 더 급진적이다. 사진을 분석하고 새로운 메타데이터를 생성해내서, 수동으로 태그나 메타데이터를 관리하지 않더라도 사진을 탐색할 수 있는 새로운 접근을 가능하게 해준다.

파일 시스템 위에서 개인들은 정보 과잉에 시달리고 있다. 이는 자신들이 가진 정보를 충분히 유용하게 만드는 능력이 없기 때문에 발생하는 일이다. 이는 개인의 한계가 아니라 소프트웨어적인 한계이다. 이런 맥락에서 보더라도 데스크탑에서 개인 정보 시스템을 구축하는 가장 근본적인 접근은 파일 시스템을 벗어나는 일이라고 생각한다. 운영체제의 접근이 성공적이진 못 했지만, 여전히 파일 시스템에 의존적이라고 할 지라도, 그 위에 하나 이상의 레이어가 덧씌워져야 함은 분명하다. 이러한 방향에서 서비스나 애플리케이션들이 존재하지 않는 것은 아니다. 앞서 보았듯이 어도비 라이트룸 같은 경우는 기존의 저작물 생산 도구들과는 확연이 다른 방향에서 개인 데이터베이스를 구축하는 데 초점을 맞추고 있다. 구글 포토스 역시 최근에 알파고가 보여준 것과 비슷한 맥락에서 정보에 대한 새로운 패러다임을 제시한다. 좀 더 범용적인 도구로는 에버노트(Evernote)데본싱크(Devonthink)와 같은 도구들이 있을 것이다. 이러한 소프트웨어들은 파일 시스템을 극복하고 어떻게 개인이 구축한 좀 더 많은 정보들을 유용하게 만들 수 있는 지를 보여준다.

개인 정보 시스템은 이제 첫 걸음을 시작했을 뿐이다. 앞으로도 이러한 소프트웨어에 대한 필요는 갈수록 늘어갈 것이다.

, nacyot.

블로그nacyot이 운영합니다.