主要用于存储文件使用的500G服务器磁盘怎么迎接下一波存储可能会占满的风险?
不是大神,小白想法:单机的话应该只能说去除冗余数据,比如leveldb存储时候我记得在每个sstable中会把相同前缀做成公用前缀来减少存储成本,不过这个就需要保证数据有序才可能有公用前缀,如果有多台服务器肯定考虑hbase之类的分布式存储了虽然占用网络io,但是如果单机数据量很大情况下效率可能还不如分布式io过来的数据,甚至如果不需要任务发布机器归纳数据时候也可以直接讲数据返回给客户端减少一次网络io,小白想法,有错误谢谢指出
Copyright © 广州京杭网络科技有限公司 2005-2024 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有