请回顾操作系统课程
我们十年前的努力
往后的路
https://www.sandisk.com/business/datacenter/resources/solution-briefs/red-hat-ceph-storage-on-the-infiniflash-all-flash-storage-platform
伴随规模扩展前来的幽灵
https://www.pdl.cmu.edu/Workload/index.shtml
https://github.com/kanripo/KR1a0140/
例如,考虑一个系统,在这个系统中,每个服务器通常的响应时间为10毫秒,但第99百分位的响应时间将达到一秒。如果一个用户请求仅在一个这样的服务器上处理,那么100个用户请求中会有一个请求变慢(一秒)。右图描述了在这种假设情景中,非常小的延迟异常所导致的服务级别延迟的影响。如果一个用户请求必须并行地从100个这样的服务器收集响应,则63%的用户请求将需要超过一秒的时间(在图表中标记为“x”)。即使对于只有万分之一的请求在单个服务器上经历超过一秒延迟的服务,有2,000个这样的服务器的服务也会导致近五分之一的用户请求需要超过一秒的时间(在图表中标记为“o”)。
来自长尾的麻烦,同时也意味着样本缺乏,仅从统计学入手难免自相矛盾
首先,优化尾延迟(也就是最坏情况下的延迟)会使Amdahl's Law变得更重要。Amdahl's Law是计算机科学中的一个概念,它描述的是并行计算中加速比的极限。在优化平均性能时,一些部分性能的提升可能不会对整体性能有太大影响,但在优化尾部延迟时,每个部分都可能成为瓶颈,因此需要考虑Amdahl's Law,确保系统的每个部分都得到充分优化。 其次,队列理论可以提供准确的基础理论,以指导如何设计未来交互式服务的硬件。队列理论是研究等待过程(队列)的数学理论,它可以帮助我们预测和控制系统中的延迟。在设计交互式服务的硬件时,我们需要考虑如何减少延迟,提高系统的响应能力,队列理论可以帮助我们实现这一目标。 最后,随着服务响应能力和可预测性变得越来越关键,找到计算和内存资源之间的平衡也变得越来越重要。计算和内存是计算机系统的两个核心资源,它们之间的平衡直接影响到系统的性能。如果计算资源过多,而内存资源不足,那么系统可能会因为内存瓶颈而无法充分发挥计算资源的能力。反之亦然。因此,我们需要根据应用的需求,找到计算和内存资源之间的平衡,以实现最优的系统性能。
TODO: 浓缩提炼至每页一个问题及创新
黑盒白盒各有不足
不要逃避关联结构,要迎难而上
研究的神坑…人类历史上一直在努力,从仰望星空制定历法就已经开始了……