对象存储
对象存储服务是一种海量、安全、低成本、高可靠的云存储服务,适合存放任意类型的文件。支持目录层次结构,但与传统的文件存储系统不同,它采用的是无目录层次结构,这样就可以容纳海量数据且支持HTTP/HTTPS协议访问。对象存储特点包括容量和处理能力弹性扩展,提供多种存储类型供选择,并全面优化存储成本。
对象存储简介[ ]
对象存储是一种以非结构化格式(称为对象)存储和管理数据的技术。现代组织需要创建和分析大量非结构化数据,例如照片、视频、电子邮件、网页、传感器数据和音频文件。云对象存储系统将这些数据分布在多个物理设备上,但允许用户从单个虚拟存储库有效地访问内容。对象存储解决方案非常适合用于构建需要扩展和灵活性的云原生应用程序;还可以使用这些解决方案导入现有数据存储以进行分析、备份或存档。
元数据对于对象存储技术至关重要。使用对象存储,对象保存在单个存储桶中,而不是作为文件夹内的文件保存。相反,对象存储整合了构成文件的数据片段,将所有用户创建的元数据添加到该文件,并附加自定义标识符。这将创建一个称为存储桶的平面结构,而不是分层或分级存储。这使可以根据存储桶的功能和特征来检索和分析其中的任何对象,而无论文件类型如何。
对象存储是数据湖的理想存储,因为它为大量数据提供了一种架构,每条数据都存储为一个对象,并且对象元数据提供了一个唯一标识符以便于访问。这种架构消除了传统存储的扩展限制,这也是为什么对象存储是云存储的原因。
对象存储的主要优势是近乎无限的可扩展性以及为数据湖、云原生应用程序、分析、日志文件和机器学习(ML)等使用场景存储大量数据的成本较低。对象存储还提供更高的数据持久性和弹性,因为它可以在多台设备上、跨多个系统,甚至跨多个数据中心和区域存储对象。这可以实现近乎无限的规模,同时提高数据的弹性和可用性。
对象存储应用场景[ ]
分析[ ]
可以在云对象存储中收集和存储几乎无限的、任何类型的数据,并执行大数据分析以获得有关运营、客户和所服务的市场的宝贵见解。
数据湖[ ]
数据湖使用云对象存储作为其基础,因为它具有几乎无限的可扩展性和高持久性。可以无缝、无中断地将存储从 GB 增加到 PB 的内容,只需为使用的内容付费。它具有可扩展的性能、易于使用的功能、原生加密和访问控制功能。
云原生应用程序数据[ ]
云原生应用程序使用容器化和无服务器等技术,以快节奏和灵活的方式来满足客户的期望。这些应用程序通常由称为微服务的小型、松散耦合的独立组件组成,这些组件通过共享数据或状态进行内部通信。云存储服务为此类应用程序提供数据管理,并为云环境中持续存在的数据存储挑战提供解决方案。利用对象存储,可以添加任意数量的内容,而且能在任何位置访问内容,因此,可以更快地部署应用程序并接触更多的客户。
数据存档[ ]
云对象存储非常适合长期数据留存。可以使用能够优化数据持久性、加快检索速度、加强安全性与合规性并且提升数据可访问性的解决方案来取代本地的磁带和磁盘存档基础设施,从而获得高级分析及业务情报能力。还可以以经济高效的方式归档大量富媒体内容,并长时间保留强制性监管数据。
富媒体[ ]
加速应用程序并降低存储视频、数字图像和音乐等富媒体文件的成本。借助对象存储,可以创建经济高效的全局复制架构,通过使用存储类和复制功能将媒体交付给分布式用户。
备份和恢复[ ]
可以将对象存储系统配置为复制内容,这样就可以在物理设备发生故障时使用复制的对象存储设备。这可确保系统和应用程序继续运行而不会中断。还可以跨多个数据中心和地理区域复制数据。
ML[ ]
在机器学习(ML)中,“教”计算机进行预测或推理。使用算法来训练模型,然后将模型集成到应用程序中,以实时和大规模地生成推理。由于规模和成本效率的原因,机器学习需要对象存储,因为生产模型通常从数百万到数十亿个示例数据项中学习,并在短短 20 毫秒内生成推理结果。
云存储类型[ ]
文件存储[ ]
许多应用程序需要共享文件访问。传统上,这是由网络附属存储(NAS)服务提供的。常见的文件级协议包括用于 Windows 服务器的服务器消息块(SMB)和 Linux 实例中的网络文件系统(NFS)。文件存储适用于非结构化数据、大型内容存储库、媒体存储、主目录和其他基于文件的数据。
比较对象存储和文件存储[ ]
对象存储和文件存储之间的主要区别在于数据结构和可扩展性。文件存储被组织成具有目录和文件夹的层次结构。文件存储还遵循严格的文件协议,例如 SMB、NFS 或 Lustre。对象存储使用带有元数据的平面结构和每个对象的唯一标识符,使用标识符可以更轻松地在潜在的数十亿个对象中找到特定对象。
由于这些结构上的差异,文件存储和对象存储具有不同的扩展能力。对象存储可提供近乎无限的扩展性,可扩展到 PB 级和数十亿个对象。由于固有的层次结构和路径,文件存储会遇到扩展限制。
数据块存储[ ]
数据库或 ERP 系统等其他企业应用程序通常需要针对每个主机的专用低延迟存储。这种存储与直接连接存储(DAS)或存储区域网络(SAN)类似。基于数据块的云存储解决方案使用各个虚拟服务器进行预置,可提供高性能工作负载所需的超低延迟。
比较对象存储和数据块存储[ ]
对象存储最适合用于大量非结构化数据,尤其是当持久性、无限存储、可扩展性和复杂的元数据管理是影响整体性能的相关因素时。
数据块存储可在各种使用案例中提供低延迟和高性能值。其功能主要用于结构化数据库存储、VM 文件系统卷,以及大量读取和写入负载。