为什么要学习hadoop

Reading time ~1 minute

关系型数据库碰到了什么问题?

加入我们有一个1T的文件,要存入磁盘,磁盘的写入速度是100MB/s,写入一块磁盘需要2.5小时,关系型数据库写入的瓶颈就是磁盘的最大写入速度。
我们可以换更快的磁盘,但是速度的提升时有限的。为了解决这个问题,有人提出了下面想法。 ## 把数据分割开写入多块磁盘?
如果我们把数据分割成10份,分别写入10快磁盘,那么我们花费的时间就是原来的1/10,如果我们写入60块磁盘,那么时间就是原来的1/60.对于一次写入,
多次读的应用是很合适的。我们写入数据的速度可以通过增加磁盘线性扩展。 >   `hadoop就这样产生了。他提供了一个快速保存大数据的方案。事实上,基本上所有的nosql都是这样的模型。`

taste是个玄学

Published on November 16, 2022

印度工人

Published on August 30, 2022