当今的公司正面临不断增加的数据管理工作的挑战。越来越多的商务程序实现了自动化;更多的历史记录和分析工作被捕获并保存下来;新的规章制度正在改变商业模式。简言之,数据量在不断增加。用于处理孤立程序的专用系统必须连接起来以生成报表。例如,兼并和收购迫使商务程序(风险分析)和数据(客户信息)进行集成。不同的商业单位必须共享信息以获得新的收入增长点,而公司也必须与商业伙伴、供应商和客户交流信息。全球商务意味着管理分布式数据库并提供全天候的可用性。成本居高不下、经济停滞、竞争压力增加迫使企业提高运行效率,这通常意味着员工数量减少,同时数据维护及访问任务的复杂性日益增加。
当数据管理所带来的挑战日益增加时,信息的重要性就被提升到前所未有的高度。各种形式的信息—数据库、电子数据表、文档管理系统、文本文件、网页、图表和图像—就成为企业共同的财富。因此,对数据库和其他各种来源的数据进行管理的需求,以及为非IT专家的商业用户提供更便捷的方式访问这些数据的需求都在日益增加。
高效查询需要更好引擎
更多的数据需要存储,更多的业务需要处理,更多的分析需要完成,而且没有喘息时间,这些都期待着所有的数据管理要素继续改进。研究具有更快的载入和检索速度的存储方法仍将打头阵。快速数据访问研究包括新型索引(例如,能够迅速适应新数据类型的通用索引结构)。解决海量业务数据高效处理和复杂查询的工作也正在进行中。
业务压力要求适应更多环境的高可用性。热备用系统瞬时切换已成为高端配置的标准,并将更为普及。总之,用户可以从一系列的“服务质量”承诺中选择在性能、可用性以及费用之间所需的权衡。同时,通过使用减少冗余硬件和备份信息,研究和开发人员将使那些权衡更容易实现。
关于电子商务的需要已有很多著述。如今,越来越多的公司使用Web服务器、J2EE、.NET和XML的复杂混合体在网上从事商务活动。在该环境内外获取数据通常需要通过诸如 JDBC这样的接口实现数据访问,并将结果转换为XML,然后将XML打包作为Web服务响应。目前,可以这种方式转移数据,但这确实有些令人乏味。将来,数据库会被更加直接地植入Web,使其成为Web应用基础架构的无缝元件。
数据及处理集成的基础即是对XML的稳定性支持,包括支持XML 作为基本的数据类型。XML Extender 允许用户保存和检索XML数据,通过它DB2能够支持XML。将来,IBM会在引擎中引入更多的这种支持以优化访问。目前,通过对SQL语言(SQL/XML)的标准化扩展,可以将关系数据以XML文件的形式返回。由此,可将数据以电子商务业务中数据交换所需的类型返回,所交换的文档可在 RDBMS中安全储存。
尽管XML显然将成为电子商务数据交换的标准,关系数据库并不会从此消失。仅支持XML的数据库并不能代替无处不在的关系系统,一部分原因是将全部数据进行转换所需的费用,另一部分原因是比XML数据库更为成熟的关系技术的出现。相反,未来的数据库能够为XML提供全面的关系能力和真正的本地支持。
分布式数据与信息集成
如今的企业通常是高度分布的,某个职能部门可能分散于好几个地点。某大型制药公司可能在几个不同国家都有研究实验室,实验室里的科学家们则需要共享实验和仿真信息。IBM的数据管理开发团队就分布在四个国家的七个地点,并在世界各地其他一些地方也有相关的研究机构。开发者需要在这些不同工作地点之间共享所需的技术规范、代码、状态和信息。
独立的机构会选择不同的基础架构。在某些盛行兼并和收购的行业里,功能相同的部门却拥有完全不同的IT基础架构,这并不少见。业务运转通常仍需在这些不同的地区和系统间共享信息。
最常用的信息集成方法可能是:通过使用专门的应用实现对感兴趣的资源的硬连接访问,然后手动合并查询结果。应用集成框架、业务流程集成工作流程系统以及Web服务都为程序员提供高级提取服务,使其能够方便地从额外的来源获取数据。当然,合并数据(即执行关联)仍需手动编程。
对于那些需要复杂分析的应用,许多公司选择将需要的数据“拉入”(从数据来源处复制)单独的数据仓库(数据中心)。这样做可以使SQL “全身心”地投入到分析中,并且也无需通过应用处理分散的数据。
并不是所有的数据都能进入数据仓库。有时数据变化太快,有时该数据不为本企业所有(如归其商业伙伴或某一信息服务机构所有),有时该数据的格式不对,不能存贮到关系型数据库系统中或被其搜索到。这时 DB2 数据仓库和数据中心就可大显其道,可将那些各自为政的异构型分布数据源联合起来。数据联合让用户查询分布式数据时更为简便,就好像这些数据存贮在单一数据库中,同时应用也变得更简易并且拥有单一数据库的功能,而无需复制与维护成本。
信息集成很有可能成为大多数公司追逐的热点,你也许可以看见不同的技术成熟并且融合。某一特定集成问题的解决方案将涉及到数据仓库(用于可以存贮于关系型系统的关键数据)与数据联合(用于集成不适合数据仓库的数据)之间的集成。丰富的元数据设施简化了从不同的数据源中映射、清除数据,同时简化了将数据关联在一起的过程。它们将得到其它类型集成的补充,并且这些集成之间能够协同工作。挖掘工具将与整个虚拟数据库共同工作,而不用考虑数据是在本地还是来自外部数据源。缓存与查询处理得以加强,消除了性能之间的差异,使得用户真正受益。
最大限度地利用分布式数据的发展动向,加上处理大型计算任务的需求及重新利用现有软硬件资源之渴望,完美的网络计算环境将出现在你面前。数据管理在网络计算中承担什么角色呢?网络计算实际上提供了一个虚拟计算机,以供应用运行。在网络中单独的数据库系统可作为共享资源。然而,数据管理的作用更为广泛。联合数据库系列能够为虚拟计算机提供单独的虚拟数据库,因此通过标准数据库编程界面编写标准的数据库应用,应用就可以尽量利用网络的功能。数据联合将发现并查询相关的数据源,并进行大规模的集成。通过将不同的数据源作为非共享并行处理器中的节点,网络可使查询与数据计算进行得更快。
自主系统走出想象空间
人体是自主系统最生动的实例,它可以自身调节以适应外部环境。如果温度过高,人体会出汗降温。如果运动需要更多的氧气,人体就加快呼吸频率和心率。
自我恢复、自我调整、自我配置系统对网络必不可少;“普通”的IT环境也会从此类系统中受益。人力成本占数据库系统拥有成本的大部分。DBA(数据库管理员)的工作职责繁重,包括数据逻辑设计、物理数据布局、物理访问结构决策、内存分配和性能调整、监控和调节。随着数据库自主功能增强,DBA能够专注于更加复杂和感兴趣的问题,同时节省员工的时间和费用。
尽管这听起来像科学幻想,但已经迈出了第一步。例如:DB2 UDB Configuration Advisor(数据库配置顾问)可减少甚至消除单调费时的系统配置任务,可满足希望的性能目标,并且无需频繁手工调整与性能有关的配置参数。Health Center(健康中心)自动评估DB2 UDB系统的状态,提醒DBA系统的日志空间或内存可能将耗尽。系统可自动采取措施,增加空间和内存以保持数据库正常运行,并且无需DBA的干预。
(责任编辑:郁单曰)