RAID-M
RAID-M: 高性能磁碟矩阵式海量存储器,RAIN-M是由一名博士生髮明的高性能网路连线磁碟矩阵存储器的名称。
RAIN-M释义
RAID-M: 高性能磁碟矩阵式海量存储器
RAIN-M
RAIN-M是由一名博士生髮明的高性能网路连线磁碟矩阵存储器的名称。设备针对日益严重的I/O瓶颈问题, 基于多通道I/O和并行访问的思想, 提出构造高性能磁碟矩阵式海量存储器RAID-M的方法. 理论分析表明, 不同级别RAID-M在性能、空间利用率和可靠性方面各有优点, 可以满足各种套用目标. RAID-M样机的顺序读数据性能和顺序写数据性能均突破了PCI汇流排瓶颈的限制。此设备在卖出时价格高达800万元。
简介
网路频宽与处理器性能基本上保持了同步增长, 但磁碟I/O性能的增长却是严重滞后的. 在过去10年, 区域网路的频宽平均每16个月就增长一倍;而在1984年到1999 年这 15 年间, 磁碟的容量虽然增长了 1000 倍, 但传输速率仅增长了40 倍, 亦即每年仅增长 20%多.未来每 10 年, 磁碟的容量将增长 100 倍,而传输速率仅会增长 10倍.目前, 硬碟典型容量为 160 GB, 典型I/O性能为 30 MB/s,将整个硬碟的数据读出需要1.5 h. 到2020年, 单条网路连结的频宽可以达到400 Tbps, 单个硬碟的容量可达到 1PB, 而那时磁碟的I/O性能只能达到 2.5 Gbps,将整个硬碟数据读出居然需要 932 h!磁碟I/O性能的滞后会成为计算机系统乃至网路传输整体性能提升的瓶颈.为了克服I/O瓶颈问题, 美国加州大学Berkeley分校提出了廉价冗余磁碟阵列RAID (redundant array of inexpensive disks)的概念, 目前已成为数据存储的主流技术. RAID使用一组磁碟同时进行I/O操作而获得更大的I/O吞吐量, 并依靠存储冗余信息来保障数据的安全性. 早期的RAID大多作为伺服器的附属存贮设备而存在, 以伺服器为中介提供数据存贮和访问服务. 近年来, RAID已经从网路伺服器中逐步分离出来, 以网路连线存储系统的方式提供服务, 这方面研究的代表是TickerTAIP, RAID-II, 网 络连 接安全 磁碟NASD (network-attached secure disks), 活动磁碟等.
另外一个研究高性能I/O的热点, 是集合计算机集群中各个结点的存贮能力和并行处理能力, 形成一个单一编址的海量存储器. 例如, 黄锴等人于 2000 年提出的RAID-x, 就是通过中间件软体将各个结点的磁碟和RAID虚拟成一个大的RAID, 利用结点之间的相互映象或校验实现RAID 1 或RAID 5 等机制. 类似的系统还有分散式磁碟冗余阵列RADD (redundant arrays of distributed disks)、Petal、Swarm、MAID (massive arrays of idle disks)等. 当然, 这类系统虽然有较高的并行吞吐能力, 也是要付出代价的: 集群结点会因为分担I/O任务而增加额外的负担, 另外还会增加管理上的开销.最近几年, 高性能计算机汇流排和 I/O 控制技术得到了普及, 包括: 主机板集成RAID 控制器技术、多 PCI 汇流排技术、PCI-X、串列 ATA 磁碟数据接口(SATA), 等等. 不久的将来, PCI-X 2.0, PCI Express, Infiniband 等新一代 I/O 技术将把 I/O 频宽从 MB/s 量级时代带到 GBps 量级时代. 本文就是在新的背景下, 基于多通道I/O 和并行访问思想提出构造磁碟矩阵, 达到大幅度提高存储器 I/O 性能和容量的目标.