제목 시맨틱 웹
DATE : 2008.09.12

시맨틱 웹(Semantic Web)은 현재의 인터넷과 같은 분산환경에서 리소스(웹 문서, 각종 화일, 서비스 등)에 대한 정보와 자원 사이의 관계-의미 정보(Semantics)를 기계(컴퓨터)가 처리할 수 있는 온톨로지형태로 표현하고, 이를 자동화된 기계(컴퓨터)가 처리하도록 하는 프레임워크이자 기술이다. 웹의 창시자인 팀 버너스 리가 1998년 제안했고 현재 W3C에 의해 표준화 작업이 진행중이다.



시맨틱 웹과 현재 웹의 차이


기존의 HTML로 작성된 문서는 컴퓨터가 의미정보를 해석할 수 있는 메타 데이터보다는 사람의 눈으로 보기에 용이한 시각정보에 대한 메타데이터와 자연어로 기술된 문장으로 가득 차 있다. 예를 들어 <em>바나나</em>는 <em>노란색</em>이다. 라는 예에서 볼 수 있듯 <em>이라는 태그는 단지 바나나노란색이라는 단어를 강조하기 위해 사용된다. 이 HTML을 받아서 처리하는 기계(컴퓨터)는 바나나 라는 개념과 노란색 이라는 개념이 어떤 관계를 가지는지 해석할 수 없다. 단지 <em> 태그로 둘러싸인 구절을 다르게 표시하여 시각적으로 강조를 할 뿐이다. 게다가 바나나가 노란색이라는 것을 서술하는 예의 문장은 자연어로 작성되었으며 기계는 단순한 문자열로 해석하여 화면에 표시한다.


시맨틱 웹은 XML에 기반한 시맨틱 마크업 언어를 기반으로 한다. 가장 단순한 형태인 RDF는 <Subject, Predicate, Object>의 트리플 형태로 개념을 표현한다. 위의 예를 트리플로 표현하면 <urn:바나나, urn:색, urn:노랑>과 같이 표현할 수 있다. 이렇게 표현된 트리플을 컴퓨터가 해석하여 urn:바나나 라는 개념은 urn:노랑 이라는 urn:색 을 가지고 있다는 개념을 해석하고 처리할 수 있게 된다. 보다 구체적인 예로 네이버가 NHN 소유임을 나타내는 트리플은 <http://naver.com, urn:wikipedia-ko:소유, http://nhncorp.com> 과 같이 된다. 시맨틱 웹은 이러한 트리플 구조에 기반하여 그래프 형태로 의미정보인 온톨로지를 표현한다.



시맨틱 웹 언어


시맨틱 웹에서 Subject, Predicate, Object는 XML의 URI 형태로 표현되며, 이는 웹 환경에 산재한 자원에 대한 온톨로지를 기술하는데 목적이 있다. 현재 시맨틱 웹 온톨로지를 기술하는 표준 언어로 W3C에서 제안한 RDF, OWL 그리고 ISO에서 제안한 TopicMaps 등이 있으나 국지적으로는 N3, N-Triple 또는 인공지능 분야에서 예전부터 쓰이던 KIF 형태로도 온톨로지가 작성된다.



시맨틱 웹의 이상


지금과 같이 사람만이 웹에 산재한 정보의 의미를 파악하는 것이 아닌, 자동화된 기계가 해석할 수 있는 일종의 표준 의미정보 교환의 수단 이 되는 것이 시맨틱 웹의 목적이다. 시맨틱 웹의 이상향은, 인터넷에 방대한 양의 온톨로지가 산재하고, 이를 자동으로 해석하여 처리할 수 있는 에이전트 소프트웨어에 사람 또는 에이전트가 질의를 하면, 컴퓨터가 자동으로 분산된 온톨로지를 탐색하고 추론하여 원하는 결과를 돌려주는 것이다.



시맨틱 웹에 대한 오해


현재 통용되는 웹 2.0이라는 용어는 오라일리 미디어(O'Reilly Media)에 의해 만들어졌으며 XML, AJAX, 시맨틱 웹과 같은 특정 기술을 지칭하는 말이 아닌, 현재 인터넷 업계의 신기술이 지향하는 경향을 일컫는 말이다. 1998년에 팀 버너스 리""가 시맨틱 웹을 제안했을 때 "차세대 웹"이라는 표현을 사용하여 많은 사람들이 웹 2.0과 혼동한다.


시맨틱 웹을 통한 인터넷에 존재하는 모든 지식을 공유한다는 말과 같은 표현은 시맨틱 웹을 지나치게 확대 해석하는 전형적인 예이다. A 온톨로지와 B 온톨로지에 같은 개념에 대해서 서로 상충하는 관계를 가지는 경우는 얼마든지 일어날 수 있다. 시맨틱 웹의 온톨로지는 해당 분야(Domain)에 대해서만 유효하면 된다. 예를 들어 관공서 온톨로지에 개의 사체는 음식물 폐기물로 분류되어 쓰레기 봉투에 넣어야 하는 폐기대상이 될 수 있지만 동물병원 온톨로지에는 동물전용 화장터로 보내서 화장을 해야 하는 대상으로 분류될 수 있다. 따라서 해당 분야에 적합한 온톨로지를 선별하여 활용해야 한다.


시맨틱 웹은 HTML로 대표되는 현존 웹을 대체하는 것이 목적이 아니다. 기존 웹과 함께 의미정보를 포함하는 메타 데이터를 기술하는 시맨틱 웹이 공존하며 정보에 대한 자동화된 접근성을 높이려는 데 목적이 있다.



시맨틱 웹의 응용


대중적으로 가장 널리 알려진 시맨틱 웹의 활용 예는 RSS이다. RSS(RDF Site Summary) 첫 버전인 0.9와 1.0은 바로 RDF로 작