XML(eXtensible Markup Language)은 W3C에서 개발된, 다른 특수한 목적을 갖는 마크업 언어를 만드는데 사용하도록 권장하는 다목적 마크업 언어이다. XML은 SGML의 단순화된 부분집합으로, 다른 많은 종류의 데이터를 기술하는 데 사용할 수 있다. XML은 주로 다른 종류의 시스템, 특히 인터넷에 연결된 시스템끼리 데이터를 쉽게 주고 받을 수 있게 하여 HTML의 한계를 극복할 목적으로 만들어졌다.
확장 마크업 언어 Extensible Markup Language | |
상태 | Published, W3C 권고 |
---|---|
시작 연도 | 1996년 |
최초 출판일 | 1998년 2월 10일 |
마지막 버전 | 1.1 (제2판) 2006년 9월 29일 |
조직 | W3C |
편집장 | 팀 브레이, 진 파올리, 마이클 스퍼버그-맥퀸, 이브 메일러, 프랑소이스 예게우, 존 W. 코원 |
기초가 되는 표준 | SGML |
관련 표준 | W3C XML 스키마 |
분야 | 직렬화 |
약어 | XML |
웹사이트 | www |
파일 확장자 | .xml |
---|---|
인터넷 미디어 타입 | application/xml |
개발 | W3C |
포맷 종류 | 마크업 언어 |
웹사이트 | http://www.w3c.org |
기계는 인간의 언어를 읽거나 이해할 수 없는 계산기에 불과하므로 XML과 같은 구조화된 마크업 언어들은 인간의 읽고 분석하여 이해하는 능력과 컴퓨터의 단순한 계산적인 판독 능력 사이에 타협점을 만들어 줄 수 있다. W3C가 만든 XML 1.0 Specification과 몇몇 다른 관련 명세들과 모든 자유 개방형 표준에서 정의되었다.
W3C는 XML 설계 목표에서 단순성과 일반성, 그리고 인터넷을 통한 사용 가능성을 강조했다. XML은 텍스트 데이터 형식으로 유니코드를 사용해 전 세계 언어를 지원한다. XML을 설계할 때는 주로 문서를 표현하는데 집중했지만, 지금은 임의의 자료구조를 나타내는 데 널리 쓰인다. 대표적인 예가 웹 서비스이다.
많은 API가 개발되어 XML 데이터를 처리하고자 하는 소프트웨어 개발자들이 활용하고 있다. 또한, 여러 가지 스키마 시스템이 있어서 XML 기반 언어의 정의를 보다 쉽게 할 수 있도록 도와준다.
XML은 SGML의 애플리케이션 프로파일이다.
동적 정보 표시를 위한 SGML의 다재다능함은 인터넷의 성장 이전인 1980년대 말에 초기 디지털 미디어 출판사들에 의해 인지되었다. 1990년대 중순, 일부 SGML 실천자들은 당시 새로운 월드 와이드 웹을 경험하였고 웹이 성장할수록 마주칠 가능성이 있던 문제들 중 일부를 SGML이 해결해줄 것이라 믿었다. 댄 커널리는 1995년 당시 직원으로 있었을 때 SGML을 W3C의 활동 목록에 추가하였다. 작업은 1996년 중순 썬 마이크로시스템즈의 엔지니어 존 보삭이 선언문을 만들고 협업자들을 모집하였을 때 시작되었다. 보삭은 SGML과 웹에 모두 경험이 있는 사람들의 작은 공동체와 잘 어울렸다.
주요 디자인 결정은 1996년 7월과 11월 사이 도달했으며, 당시 XML 사양의 최초 워킹 드래프트가 출판되었다. 추가 디자인 작업이 1997년에 계속되었으며 XML 1.0은 1998년 2월 10일 W3C 권고안이 되었다.
XML에서의 기본 개념에는 10가지가 있다.
XML 기반 언어는 다음과 같다.
이들 언어들은 단일하게 규정된 방식으로 정의되었기 때문에, 사전 정보가 없어도 이들 언어로 작성된 문서에 대해 수정이나 유효성 검사를 하는 프로그램도 제작할 수 있다.
이 절의 내용은 XML 명세에 기반한다. XML에 나타나는 모든 요소의 목록이 아니다. 가장 많이 쓰이는 핵심 요소만을 소개한다.
<
로 시작하여 문자 >
로 끝나거나, 문자 &
로 시작하여 문자 ;
로 끝나며, 마크업이 아닌 문자열은 내용이다. 그러나, CDATA 절에서, 구분자 와 ]]>
는 마크업으로 분류되고, 그들 사이의 텍스트는 내용으로 구분된다. 추가로, 가장 바깥 엘리먼트의 앞과 뒤의 공백(whitespace)은 마크업으로 분류된다.
<
로 시작하여 >
로 끝나는 마크업 구조. 태그는 세 가지 종류가 있다:
Hello, world.
(see hello world). 다른 예는
. src="madonna.jpg" alt='Foligno Madonna, by Raphael'/>
number="3">Connect A to B.
XML 문서는 완전히 유니코드 문자로만 이루어진다. 소수의 일부 특별히 제외된 제어 문자(control characters)를 제외하면, 유니코드에 정의된 어떤 문자든 XML 문서 내용에 나타날 수 있다.
XML은 문서를 구성하는 유니코드 문자들의 인코딩을 인식하고 맞게 출력하는 기능을 포함한다.
유니코드 문자 집합은 저장 또는 전송을 위해 여러 방법으로 부호화될 수 있다("인코딩"). Unicode itself defines encodings that cover the entire repertoire; 잘 알려진 것으로 UTF-8과 UTF-16이 있다. 유니코드 이전에 ASCII나 ISO/IEC 8859 같은, 많은 텍스트 인코딩 방식이 있었다. 이들의 문자 집합은 대개 유니코드 문자 집합의 부분집합이다.
XML은 유니코드가 정의한 어떤 인코딩이든 사용하는 것을 허용하며, 문자들이 유니코드에 나타나는 다른 인코딩도 사용할 수 있다. XML은 또한 XML 프로세서가 안정적으로, 사전지식 없이, 어느 인코딩이 사용되고 있는지 결정하는 메커니즘을 제공한다. UTF-8 또는 UTF-16이 아닌 인코딩은 XML 파서에 인식되지 못할 가능성이 있다.
주석은 다른 마크업의 밖이라면 어디서나 나타날 수 있다. XML 선언 전에는 올 수 없다. ""로 끝난다. 문자열 "
--
" (하이픈 두 개)는 주석 안에서는 허용되지 않는다; 즉 주석은 겹쳐질(nested) 수 없다. 주석 내에서는 앰퍼샌드(ampersand, &)가 특별한 의미를 갖지 않는다. 따라서 엔티티나 문자 참조에 이를 쓸 수 없고, 문서 인코딩에 쓰인 문자 집합 이외의 문자를 주석 내에서는 표현할 방법이 없게 된다.
유효한 주석의 예: ""
XML 1.0 (Fifth Edition)과 XML 1.1은 거의 모든 유니코드 문자의 이름, 애트리뷰트, 주석, 문자 데이터, 처리 명령어에 대한 직접 사용을 지원한다.(XML 자체에 대한 특별한 기호적 의미가 있는, 예를 들어 "<" 같은 문자는 제외). 아래는 잘 구성된(well-formed) XML 문서로 한자와 키릴 문자를 포함하고 있다:
<俄语>данные
XML 문서에는 두 가지 수준의 수정 절차가 있다:
XML 명세는 XML 문서를 well-formed 텍스트로 정의한다. 이는 명세에 제공된 문법 규칙들을 만족한다는 뜻이다. 긴 목록 중 핵심을 짚어 보면,
<
나 &
같은 특수 문법 문자 중 어떤 것도, 원래의 마크업 경계 식별 목적 이외의 목적으로 나타나지 않는다.!"#$%&'()*+,/;<=>?@[\]^`{|}~
. 또 공백 문자도 포함할 수 없으며, -
, .
, 또는 숫자로 시작할 수 없다.잘 구성됨에 더하여, XML 문서에는 유효성(validity)이라는 것이 있다. 이는 문서가 Document Type Definition (DTD)에 대한 참조를 포함하고, 문서의 엘리먼트들과 애트리뷰트들이 그 DTD에 선언되어 있으며 DTD가 명시하는 문법 규칙을 따른다는 것을 의미한다.
XML 프로세서는 유효화하는validating 또는 유효화하지 않는non-validating으로, 유효성 검증 여부에 따라 분류한다. 유효성 오류를 조사하는 프로세서는 그것을 보고할 수 있어야 하지만, 정상 처리를 계속할 수도 있다.
DTD는 schema 또는 문법의 예이다. XML 1.0의 초판 발표 이래로, XML을 위한 스키마 언어 분야의 연구가 많이 이루어졌다. 그런 스키마 언어들은 전형적으로 어떤 문서에서 사용되어도 좋은 엘리먼트의 종류, 그 엘리먼트들에 적용되어도 좋은 애트리뷰트의 종류, 나타나는 순서, 허용 가능한 부모-자식 관계 등을 제한한다.
XML을 위한 가장 오래된 스키마 언어는 SGML에서 유래한 문서 형식 정의(Document Type Definition, DTD)이다.
DTD의 장점:
DTD의 제한점:
DTD의 후계자로서 W3C에 의해 기술된 새로운 스키마 언어가 XML Schema이다. XSD는 DTD보다 XML 언어 기술에 훨씬 강력하다. 더 풍부한 데이터타이핑 시스템을 사용하며 XML 문서 논리 구조에 더 세세한 제약을 가할 수 있다. XSD도 XML-기반 형식을 사용하므로, 일반적인 XML 도구로 처리할 수 있다.
This article uses material from the Wikipedia 한국어 article XML, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). 별도로 명시하지 않은 경우, 내용은 CC BY-SA 4.0에 따라 사용할 수 있습니다. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki 한국어 (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.