信息网格[编辑]
信息网格是网格计算模型的核心组件。它使最终用户和应用程序可以获得对任何信息源的安全访问,不管它在什么地方。这种访问可以通过内部网、Internet、甚至在一个外部网(extranet)环境中的本地和分布式网络进行。信息网格提供了对异质文件、数据库和存储系统的访问,并且它支持共享数据以用于处理和大规模的协作。
Internet 在 20 世纪 90 年代初出现以来,IBM 一直积极地参与一种最新信息技术的市场开拓和培养,从而获得发展动力。这种新技术就是网格计算。IBM 将网格计算定义为在开放标准的支持下,通过异质资源的网络进行的分布式计算。虽然网格计算侧重于如何通过虚拟化技术、作业调度和负载平衡来优化 IT 基础设施,但还有另一个同等重要的组件:信息网格。
网格计算获得了越来越多的应用,问题开始改变了。虽然网格实现最初关注的可能是加快应用程序的处理时间,但是现在面临的是新的挑战 —— 在网格中移动数据。这些挑战是要保证可以容易地访问输入数据(如果有的话),并在将这些数据传输到分布式环境中的计算位置时不会产生网络带宽问题。
信息网格解决了以下难题:
由于以下原因产生的现有数据资源和资产的碎片:
异质环境。
未充分利用的计算和存储资源。
笨拙的数据访问和糟糕的集成。
数据安全和保护。
对分散型系统和资源的复杂管理。
IT 基础设施的高昂的总成本。
灵活和难于改变的系统。
信息网格解决了管理信息的问题,这些信息跨越异质硬件和软件资源,包括数据库、文件和存储设备。
虽然对数据的考虑对于许多不同的环境都是有效的,但是分布式环境提出了独特的挑战。为了讨论对这些挑战的可能解决方案,我们要描述一个虚构的场景,并将重点放到如何用分布式环境中的数据和处理中心解决特定的问题。
下面就是这个场景:一个金融机构在地理位置上有分布在全球的分支机构。在洛杉矶办事处,财务顾问为本地客户的需要提供支持,并为每个本地客户档案创建和管理财务信息。信息是以文件和数据库格式维护的。
在纽约办事处有一个大型数据中心,在这里存储并处理 Standard & Poor 的历史数据。
在芝加哥有另一个大型数据中心,在这里存储和处理关于商品市场的信息。每一个地区的数据都是用存储区域网络(Storage Area Network)技术管理的。
在我们的场景中,一个财务顾问收到了她的客户的一个电话。为了解决客户的需要,这位顾问希望能够读取客户的财务档案的当前数据。她提交了一个作业(一个档案分析应用程序),这个作业发送到网格环境中运行。在这种情况下,这个作业被调度到在芝加哥地区执行,因为芝加哥的处理器的当前利用率要低于纽约。
在作业开始时,过程必须从洛杉矶地区获取本地客户数据。第一个 I/O 从文件系统中获取数据。第二个 I/O 获取在关系数据库中以表的形式管理的数据。
当作业从洛杉矶地区获取了它所需要的所有数据后,处理就在芝加哥地区继续进行。
我们现在遇到了计算中的一个常见问题:访问以不同格式存储的数据的需要。这是一个挑战出于好几个理由。应用程序必须执行多个 I/O 请求以获取数据,这种要求延缓了作业的执行。第二,构建和维护这种类型的应用程序 —— 如档案分析 —— 的程序员必须了解这些不同的格式,并且必须确定如何在它们的应用程序中将分散的数据结合到一起。
下一个问题 —— 数据资源利用 —— 源自混合多个厂商的不同存储和文件系统,这通常是由于公司合并和收购所产生的。管理员手工管理跨越这些不同的存储设备放置的数据成本是很高的。在许多情况下,当作业试图从这些设备获取数据时就会出现瓶颈。
第 3 个挑战:网络带宽
财务分析师的档案分析应用程序还需要处理在纽约地区管理的数据。不过,因为引用了大量数据,在芝加哥地区的处理会因为等待从纽约获取的数据而减慢。最后一个问题的发生是因为在纽约和芝加哥之间没有足够的网络带宽,不能满足传输由档案分析应用程序所要求的大量数据的传输需要。
一个优化的信息网格将实现前述的解决方案,因为它们解决了访问数据、管理异质文件和存储系统时会遇到的许多主要潜在问题,并消除了为远程处理提供数据的网络影响。这些解决方案将为信息网格中的分布式计算提供虚拟环境的最大优势。下面的两个选项显示了在前面讨论的档案分析场景中使用这些解决方案,并使档案分析应用程序支持网格计算的结果。
网络营销词典内容均由网友提供,仅供参考。如发现词条内容有问题,请发邮件至info # wm23.com。