随着电子商务向纵深发展,网上的信息量骤然增加,传统的数据处理技术已经不能适应高速发展的网络商务。这就需要一种新的电子商务数据交换技术。但是,HTML过于简单,随着Web文件内容的增多和形式多样化,越来越显得不适应,原因是HTML定义了唯一的文件类型,并且标记集不能被改动,简单易用却牺牲了语言性能。在这种情况下,XML诞生了。
XML命名为可扩展标记语言(eXtensible Markup Language)的原因主要是有别于HTML那种单一固定的语法,要让制作页面时,有一个更具弹性、更容易添加新功能,而又不失统一标准的语言格式。XML是互联网联合组织(World Wide Web Committee,W3C)创建的一组规范,以便软件开发人员和内容创作者在网页上组织信息,其目的不仅在于满足不断增长的网络需求,同时还希望藉此能够确保在通过网络进行信息交互合作时具有良好的可靠性和可操作性。
XML是SGML (Standard Generalized Markup Language,标准广义标记语言 )的一个精简的子集。SGML是用来定义电子表格中如何对文件的结构和内容进行描述的国际标准,标准号为 ISO-8879。设计目的是满足各种不同的页面制作的需要。由于SGML设计非常复杂,使用不太方便,因此并未得到普及和大规模的应用。XML精简了 SGML的功能,大大减少了SGML的复杂性,因此受到广大用户的欢迎。XML大大丰富了 HTML的描述功能,可以描述非常复杂的 Web页面,如复杂的数学方程式、化学方程式等。 XML主要包含三个要素:模式(Schema)、可扩展样式语言(XSL)和可扩连接语言(XLL)。模式(Schema)规定了XML文件的逻辑结构,定义了XML文件中的元素、元素的属性以及元素和元素属性之间的关系,它可以帮助XML的分析程序校验XML标记的合法性。
XSL是用于规定XML文档样式的语言,它能在客户端使Web浏览器改变文档的表示法,从而不需再与服务器进行交互通信。XLL将进一步扩展目前Web上已有的简单链接。 XML是一种元标记的自描述语言,所谓元标记就是开发者可以根据自己的需要定义自己的标记,比如开发者可以定义如下标记<book><name>来描述一本书,任何满足XML命名规则的名称都可以作为标记。因而,XML文档有明确语义,并且是结构化的,这为不同的应用程序打开了大门。通过XML的模式(Schema)可以严格地统一规范这些标记,而且,XML文档独立于平台,XML只定义信息的内容而不定以信息的表达形式,因此,XML可用于数据交换。 XML是一种极端标准化的语言规范,它带有一个XML 语法分析器。该分析器使用 DTD(Document Type Definition,文件类型定义)来确定一个文件是否是规范化的。它不允许有任何形式的变通,即使是一个小错误也会导致整个文件通不过 XML语法分析器的检查。另外,XML的数据结构使得用户很容易将文件的属性映射到数据结构或对象分级结构中,这就使客户端的浏览器和数据库之间来回传输文件变得可靠。
XML之所以适合电子商务发展的需要,是因为它有如下优点:1.异构商务应用间的数据共享
传统电子商务应用由于缺乏系统的兼容性,使不同的应用间的数据描述变得很困难,而XML的灵活性,扩展性以及自我描述等特性,使电子商务的异构应用间的数据共享成为可能。
2.电子商务数据检索
随着电子商务的发展,强大的数据检索已成为其内在的需求,尤其和信息获取有关的应用,如电子书籍、应用软件等。用户只要在此类XML的文档中定义一系列有意义的标记,这样基于这些标记就可以按照任意的条件进行复杂的查询和检索,甚至实现计算机自动检索。
3.不同来源的商务数据集成
商务数据库的发展速度可谓惊人,而这些数据库是不兼容的、复杂的。而XML能够将不同来源的结构化的数据结合在一起,通过在中间层的服务器上对从后端数据库和其他应用处来的数据进行集成,就可以对数据进行多样的搜索和集成。
4.数据本地计算和处理
传统WEB技术侧重服务器的应用,提出客户的概念,这样就加大了服务器的负担。而XML数据可以在客户端用应用软件解析、编辑和处理,这样就减轻了服务器端的压力。使用者可以用不同的方法显示、处理数据:文档对象模式允许用脚本或其他编程语言处理数据。
5.数据的多样显示
商务数据发到桌面后,往往希望能够用多种方式显示。由于数据显示与内容分开:HTML描述数据的外观,而XML描述数据本身,使数据更合理地根据用户的需求表现出来。另外CSS和XSL为数据的显示提供了公布的机制,可以定义各种XSL或CSS对XML文档进行多种样式的显示。
6.开放的技术和行业标准
XML为电子商务的发展已经制定了一系列标准:在Internet上进行国际性商业间购物的标准OBI(Open Buying on the Internet)、在Web上向消费者售物的一致的、可共同操作的环境规则OTP(Open Trading Protocol)、企业站点间的在线资产交换标准ICE(Internet Content and Exchange)等。