XML技术与数据库的发展趋势分析

作者&投稿:褒芬 (若有异议请与网页底部的电邮联系)
~

  数据库技术及其应用系统经历了从层次数据库 网状数据库到关系数据库以及面向对象数据库的发展 在传统的商业和事务处理领域内逐步成熟 取代了原有的基于文件系统的数据处理方式 成为计算机信息系统中的重要基础和支柱 但随着Internet的飞速发展 Web的出现改变了人们习惯的处理方式 也给数据库技术提出了必须面对的重要问题 即如何有效地存储和管理Web上的数据(文档) 使其既能被高效地操作和维护 又能在Internet平台上方便地表示和交换

  XML技术自出现以来发展非常迅速 在许多领域内得到广泛的支持而有着广阔的应用前景 例如电子数据交换 电子商务等更是将XML作为一种基础性 支柱性的技术来看待

   数据库简史

  数据库系统是随着计算机技术的不断发展 在特定的历史时期 特定的需求环境下出现的 在 年的第一台计算机到 世纪 年代这漫长的 年里 计算机操作系统主要局限于文件的操作 对数据的管理也主要是通过文件系统来实现 进行计算所需要的各种数据存放在各自的文件里 使用这些数据时将文件打开 读取文件中的数据到内存中 当计算完毕后 将计算结果仍旧写入到文件中去 它的不足主要集中在无法对数据进行有效的统一管理 针对文件系统的重要缺点 人们逐步发展了以统一管理数据和共享数据为主要特征的系统 即数据库系统 年 美国通用电气公司开发成功了世界上的第一个数据库系统IDS(IntegratedDataStore) IDS奠定了网状数据库的基础 并得到了广泛的发行和应用 成为数据库系统发展史上的一座丰碑 年 美国国际商用机器公司(IBM)也推出世界上第一个层次数据库系统IMS(InformationManagement System) 同样在数据库系统发展史上占有重要的地位

   年代初 E F Codd在总结前面的层次 网状数据库优缺点的基础上 提出了关系数据模型的概念及关系代数和关系演算 在 年代 关系数据库系统无论从理论上还是实践上都取得了丰硕的成果 在理论上确立了完整的关系模型理论 数据依赖理论和关系数据库的设计理论 在实践上 世界上出现了很多著名的关系数据库系统 比较著名的如SystemR INGRES Oracle等

  与文件系统相比 数据库系统有几个方面的特点 向用户提供高级的接口 向用户提供非过程化的数据库语言(即SQL语言) 查询的处理和优化 并发控制 数据的完整性约束

  进入 年代之后 计算机硬件技术的飞速提高促使计算机应用不断深入 产生了许多新的应用领域 例如计算机辅助设计 计算机辅助制造 计算机辅助教学 办公自动化 智能信息处理 决策支持等 这些新的领域对数据库系统提出了新的要求 但由于应用的多元化 不能设计出一个统一的数据模型来表示这些新型的数据及其相互关系 因而出现了百家争鸣的局面 产生了演绎数据库 面向对象数据库 分布式数据库 工程数据库 时态数据库 模糊数据库等新型数据库的研究和应用

   XML简介

  XML推荐标准 版发布于 年 月 之后迅速在全球掀起了XML应用的浪潮 XML是一种描述型的标记语言 与HTML同为SGML(标准通用标记语言 ISO 国际标准)的一种应用 由于XML在可扩展性 可移植性和结构性等方面的突出优点 它的应用范围突破了HTML所达到的范围

  一篇XML文档由标记和内容组成 XML中有六种标记 元素(elements) 属性(attributes) 实体引用(entityreferences) 注释(ments) 处理指令(processinginstructions)和CDATA段(CDATAsections) XML与HTML最显著的不同是XML文档中引入了 文档类型声明 (Document Type Declarations) DTD使文档可以与分析器交流关于它的内容的元信息 DTD的出现 赋予了XML文档可扩展性 结构性和可验证性 使XML具备了类似于数据库的一些性质 可以利用XML来组织和管理信息 又可以与HTML一样在浏览器中方便地表示 在Internet上高效地传递和交换 考虑到与HTML的兼容 DTD并不是XML文档必需的成份 具有DTD的XML文档称作 Valid 否则就是 Well formed

  目前 处理XML文档的方式主要有SAX与DOM两种 SAX(SimpleAPIforXML)是一种基于流的 以事件处理方式工作的接口 SAX 在 年 月发布 增强了许多功能 包括对名字空间的支持 DOM(Document Object Model)则是在对XML文档进行分析后 在内存中建立起一个完整的树结构 然后在此基础上进行各种操作 简单地比较来看 SAX对系统资源要求低 速度快 但对文档的操作是只读的 DOM的处理能力强大 但要求大量的系统资源 尤其是对于大的文档 而后还出现了Xpath和Xpointer用以完成XML的搜索和转换 XSL XSLT和SOAP用以完成XML的远程对象访问 XML Query Languages的出现使XML查询语言可用于任何XML文档

   XML与数据库

  XML文件是数据的集合 它是自描述的 可交换的 能够以树型或图形结构描述数据 XML提供了许多数据库所具备的工具 存储(XML文档) 模式(DTD XMLschema RE AXNG等) 查询语言(XQuery XPath XQL XML QL QUILT等) 编程接口(SAX DOM JDOM)等 但XML并不能完全替代数据库技术 XML缺少作为实用的数据库所应具备的特性 高效的存储 索引和数据修改机制 严格的数据安全控制 完整的事务和数据一致性控制 多用户访问机制 触发器 完善的并发控制等 因此 尽管在数据量小 用户少和性能要求不太高的环境下 可以将XML文档用作数据库 但却不适用于用户量大 数据集成度高以及性能要求高的作业环境

  随着Web技术的不断发展 信息共享和数据交换的范围不断扩大 传统的关系数据库也面临着挑战 数据库技术的应用是建立在数据库管理系统基础上的 各数据库管理系统之间的异构性及其所依赖操作系统的异构性 严重限制了信息共享和数据交换范围 数据库技术的语义描述能力差 大多通过技术文档表示 很难实现数据语义的持久性和传递性 而数据交换和信息共享都是基于语义进行的 在异构应用数据交换时 不利于计算机基于语义自动进行正确数据的检索与应用 数据库属于高端应用 需要昂贵的价格和运行环境 而随着网络和Internet的发展 数据交换的能力已成为新的应用系统的一个重要的要求 XML的好处是数据的可交换性(portable) 同时在数据应用方面还具有如下优点 ( )XML文件为纯文本文件 不受操作系统 软件平台的限制 ( )XML具有基于Schema自描述语义的功能 容易描述数据的语义 这种描述能为计算机理解和自动处理 ( )XML不仅可以描述结构化数据 还可有效描述半结构化 甚至非结构化数据

   XML文件的存储

  XML文件的存储方式有三大类 ( )将文件存储于文件系统(StoringDocumentsinthe File System) ( )将文件存储于BLOB(Storing Documents in BLOBs) 利用数据库的事务管理 安全 多用户访问等优点 此外许多关系数据库提供的检索工具可以进行全文检索 近似检索 同义词检索和模糊检索 其中某些工具将会支持XML 这样就可消除将XML文件作为纯文本检索所带来的问题 ( )将文件存储于原生XML数据库(Native XML Databases NXD) NXD是专用于存储XML文件的数据库 支持事务管理 安全 多用户访问 编程API和查询语言等 与其它数据库的唯一区别在于其内部模型是基于XML的 其中 最重要的存储方式当属原生XML数据库

   原生XML数据库

  原生XML数据库(NativeXMLDatabases)为XML文档定义了一个(逻辑)模型 并根据该模型存取文件 这个模型至少应包括元素 属性 PCDATA和文件顺序 其例子有XPath数据模型 XMLIn foset以及DOM所用的模型和SAX 的事件 它以XML文件作为其基本存储单位 对底层的物理存储模型没有特殊要求 例如 它可以建在关系型 层次型或面向对象的数据库之上 或者使用专用的存储格式 比如索引或压缩文件

  NXD最适于存储以文档为中心的文件 这是由于NXD保留了文件 顺序 处理指令 注释 CDA TA块以及实体引用等 而支持XML的数据库XED(XML enableddatabase)无法做到 XED是在原有数据库基础上扩展了XML支持模块 完成XML数据和数据库之间的格式转换和传输 从存储粒度上 可以把整个XML文档作为RDBMS表中一行 或把XML文档进行解析后 存储到相应的表格中 为了支持W C的一些XML操作标准 Xpath XED提供一些新的原语(如Oracle iR 增加了一些数据包来操作XML数据等) 并优化了XML处理模块

  NXD一般采用层次数据存储模型 保持XML文档的树形结构 省掉了XML文档和传统数据库的数据转换过程 NXD还适用于存储 天然格式 为XML的文件 NXD还可以存储半结构化数据 在某种特定情形下提高存取速度以及存储没有DTD的文件(良构的文件)

   原生XML数据库的结构

  原生XML数据库的结构可分为两大类 基于文本的和基于模型的

  基于文本的NXD(Text BasedNativeXMLDatabases)将XML作为文本存储 它可以是文件系统中的文件 关系数据库中的BLOB或特定的文件格式 基于文本的NXD与层次结构的数据库很相似 当存取预先定义好层次的数据时 它比关系数据库更胜一筹 和层次结构的数据库一样 当以其它形式比如转置层次存取数据时 NXD也会遇到麻烦 这个问题的严重程度尚未可知 很多关系数据库都使用逻辑指针 使相同复杂度的查询以相同的速度完成

  基于模型的NXD(Model BasedNativeXMLDatabases)是根据文件构造一个内部模型并存储这个模型 有些数据库将该模型存储于关系型和面向对象的数据库中 例如在关系型数据库中存储DOM时 就会有元素 属性 PCDATA 实体 实体引用等表格 其他数据库使用了专为这种模型优化了的存储格式 使用专用存储格式的基于模型的NXD如果以文件的存储顺序读取文件 其性能与基于文本的NXD相似

   原生XML数据库的特性

  原生XML数据库的特性(FeaturesofNativeXML Databases)有 ( )文件集(Document Collections) 支持集合(Collection)的概念 其作用相当于关系数据库中的表和文件系统中的文件夹 ( )查询语言(Query Languages) 最常用的有XPath(对多个文件的查询作了扩充)和XQL 以及专有的查询语言 ( )更新和删除(Updates and Deletes) NXD对文件的更新和删除方式从简单的替换或删除现有文件 到修改当前活动的DOM树 以及用于指定如何修改文件片断的语言 ( )事务 锁定和并发(Transactions Locking and Concurrency) 支持事务处理 锁定通常是对整个文档的 所以多用户并发性相对较低 问题的大小取决于应用程序以及 文件 的构成 ( )原生数据库提供应用程序接口API(Application Programming Interfaces APIs) ( )NXD的一个重要特性是它可以为XML文档提供 往返车票(round trip) 可以将XML文件存放在NXD中 而且再取回 同样的 文件 对于以文档为中心的应用程序来说非常重要 因为CDATA部分 实体用法 注释和处理指令是这些文档不可缺少的组成部分 特别是对于法律和医学文件 按规定这些文档必须要保持原样 ( )外部数据(Remote Data) 某些NXD可包含有外部数据 它来自存储在数据库中的文档 通常这些数据通过OD BC OLE DB或JDBC从关系数据中取出 模型可以是基于表格的或对象 关系型映射 ( )支持元素和属性的索引

   结论

  XML技术的出现 使数据处理从文件方式到数据库系统再到文件方式的循环 但新的文件方式已经与最初的文件系统有了本质的区别 格式化文档 XML和关系数据库在数据应用和数据管理方面各有优势

lishixinzhi/Article/program/net/201311/12776




数据挖掘与机器学习的区别
由于统计学往往醉心于理论的优美而忽视实际的效用,因此,统计学界提供的很多技术通常都要在机器学习界进一步研究,变成有效的机器学习算法之后才能再进入数据挖掘领域。从这个意义上说,统计学主要是通过机器学习来对数据挖掘发挥影响,而机器学习和数据库则是数据挖掘的两大支撑技术。从数据分析的角度来看,...

【常用】程序员个人年终工作总结范文
优点:能熟练的运用数据库技术进行开发。特别是对sql数据库的操作,经过这么长时间的积累,基本上能合理的设计和新建数据库,同时在数据结构上也加强了对数据库的理解。通过项目的实践现在能熟练使用和编写多种sql语句。还掌握了一些关数据库优化sql语句优化的方法,能进行一些简单的优化。缺点:数据是一门...

ML9&1名词解释
而“9&1”中的“1”象征核心价值——“延续美丽,经典永恒”,这九重功效包括净肤、提质、增色、亮光、塑形、提升触感、防护、原生保养和保持新品状态,体现了对奢侈品全方位的呵护。ML9&1洗护工艺的创新之处在于它超越了一次性服务的框架,运用现代数据库营销技术和客户关系管理系统,为每位奢侈品用户...

目前和互联网相关的好工作有哪些?
负责开发、规划、设计、维护和支持您的业务需要的云系统,以支持ML驱动的算法和增强的数据分析功能。因此,根据项目的规模和所需的经验水平,平均薪金往往在12万至19.5万美元之间。 ·数据库架构师。数据库的质量是一切的基础,这就是为什么这个职位仍然是薪水最高的技术职位之一。这些架构师将与软件设计...

大数据方面核心技术有哪些?
大数据技术的体系庞大且复杂,基础的技术包含数据的采集、数据预处理、分布式存储、数据库、数据仓库、机器学习、并行计算、可视化等。1、数据采集与预处理:FlumeNG实时日志收集系统,支持在日志系统中定制各类数据发送方,用于收集数据;Zookeeper是一个分布式的,开放源码的分布式应用程序协调服务,提供数据同步...

“LOGML”代表什么?
LOGML的缩写词在计算机科学中属于Computing领域,特别是Software子领域,表明它主要用于软件开发过程中的日志记录和解析。它的流行度反映了它在现代软件工程中的实用性和重要性。在实际应用中,例如Web服务、云计算环境或数据库审计中,LOGML能够帮助开发者和运维人员更好地理解和管理复杂的日志数据,提高问题...

大数据技术有哪些
大数据技术主要包括:Hadoop、Spark、NoSQL数据库和数据挖掘工具。Hadoop是Apache软件基金会开发的一个开源框架,主要用于处理和存储大规模数据。它采用了分布式文件系统HDFS,使得数据可以在多台服务器上分布式存储和处理,极大地提高了数据处理的效率和容错性。此外,Hadoop的核心组件MapReduce是一种编程模型,...

别以为你是技术开发人员就可以不会大数据
8.数据工程和数据科学是一个大的分支。虽然对数据科学的基本知识只需要有所掌握,但对不同数据技术的深入了解却是必要的。尽管NoSQL很受欢迎,但SQL仍然是查询数据的标准。开发人员需要了解不同的部署选项——云本地、容器和流行的部署选项。对数据库和系统概念(如一致性保证、事务边界、系统体系结构、...

人工智能,机器学习与深度学习,到底是什么关系
所以,如果把人工智能与机器学习当成两个学科来看,三者关系如下图所示: 如果把深度学习当成人工智能的一个子学科来看,三者关系如下图所示 六、数据挖掘与机器学习的关系 数据挖掘主要利用机器学习界提供的技术来分析海量数据,利用数据库界提供的技术来管理海量数据。 机器学习是数据挖掘的一种重要方法,但机器学习是另一...

要学数据挖掘需要哪些基础
可视化技术等。数据挖掘从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息,数据挖掘主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据;作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。

伊吾县17177035077: XML语言及相关技术的发展前沿是怎样的?
调伟阿端: XML发展前沿比较好的...除了楼上所说的确点,但他的优点还是在的...传输数据方便 xml可以像任何一个数据库写入数据,主流的编程语言都支持xml文件,甚至像sql server都有专门的工具支持,而同样取数据html难度相当的大,他的重复代码很多..很难提取...而且要提取必须由客户根据源码设置字段来提取,更恶心的是你换了一种html...又得从新来...亲身经历过从html源码里和XML取数据的飘过

伊吾县17177035077: xml的前景好吗? -
调伟阿端: 永远不会过时的. XML的简单使其易于在任何应用程序中读写数据,这使XML很快成为数据交换的唯一公共语言,虽然不同的应用软件也支持其它的数据交换格式,但不久之后他们都将支持XML,那就意味着程序可以更容易的与Windows,Mac OS,Linux以及其他平台下产生的信息结合,然后可以很容易加载XML数据到程序中并分析他,并以XML格式输出结果.

伊吾县17177035077: 网络管理技术的发展趋势 -
调伟阿端: 通过现阶段网络管理软件中的一些技术热点,我们可以去展望今后在网络管理中出现的一些新的技术,以期带动网络网络管理水平整体性能的提升: 分布式技术 分布式技术一直是推动网络管理技术发展的核心技术,也越来越受到业界的重视....

伊吾县17177035077: 什么是xml
调伟阿端:XML与Access,Oracle和SQL Server等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,XML仅仅是展示数据.事实上XML与其他数据表现形式最大的不同是:他极其简单.这是一个看...

伊吾县17177035077: xml数据库的特点 -
调伟阿端: 与传统数据库相比,XML数据库具有以下优势: 1、XML数据库能够对半结构化数据进行有效的存取和管理.如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理. 2、提供对标签和...

伊吾县17177035077: 什么是XML? -
调伟阿端: XML是eXtensible Markup Language的缩写.扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握...

伊吾县17177035077: Oracle11g全新特性是怎么完全解析XML?
调伟阿端: 新的管理功能 在Oracle 11g当中,用户可以获得多个方面的性能提升.在2006年10... 当XML面世之时,也许没有哪个数据库厂商会对这种技术给以足够的关注,然而在今天...

伊吾县17177035077: 数据库技术的发展方向和前景 -
调伟阿端: 一个是面向对象数据库:现在的数据库主流是二维表,与面向对象的编程进行协作非常麻烦,所以如果数据库能直接存取对象,那将会引起编程的革命. 一个是非结构化数据库:现在的二维表里只能存若干种指定类型的数据,每次都要指定类型、范围等非常不便,查询也非常笨.比如,我要在100人的合影中查出某个人,在目前的数据库中是不可想象的,但非结构化数据库正是这方面的高手. 目前这些技术都还不能实用,但你的问题是数据库技术的发展方向和前景,那么它们就正是这个问题的答案

伊吾县17177035077: 数据库的发展前景怎么样?
调伟阿端: 在信息化时代,数据库成为企业经营管理必不可少的工具.经过了一个世纪的发展,目前数据库行业已经进入到快速发展阶段,非关系型的数据库盛行,“数据上云”新模式诞生,市场规模达到665亿美元.未来,随着海量数据的爆发,全球数...

伊吾县17177035077: 有没有关于数据库历史或应用方面的长文章
调伟阿端: 数据库的历史 数据模型是数据库系统的核心和基础.因此,对数据库技术发展阶段的划分应该以数据模型的发展演变作为主要依据和标志.总体说来,数据库技术从开始到...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网