大数据存储系统与管理实验

场景	传统文件痛点	对象存储解法
手机相册备份	小文件多，目录深，延迟高	扁平名空间，毫秒级 GET
AI 训练	千万样本，随机读取	前缀并行，带宽线性叠加
医疗影像	单文件 > 5 GB，合规保存 15 年	分片上传，多副本/EC，WORM
直播回放	流量突增 10 倍	边缘缓存 + 回源，自动扩容
大数据分析	格式杂，schema 常变	元数据随对象走，schema-on-read

实验报告（<学号>-lab.md）模板

姓名：XXX
班级：XXXX 班
学号：^U2023\d{5}$
日期：2025-10-dd

---

# 实验简介

…介绍实验软硬件环境，实验目的和主要实验内容条目…

# 实验内容

## 实验1：搭建对象存储

…实验过程，基本功能测试…

…(可选) 应用集成测试…

## 实验2：观测分析性能

…实验案例，实验负载生成，实验观测，数据分析…

**请注意：确保实验数据完整、可信，观测数据是系统的"指纹"，不应有两人份测试数据相同**

## (可选)实验3：尝试建模预测

…求解实际问题，达成额外成就…

# 实验小结

…实验结论和收获…

Operation	SQL	HTTP
Create	INSERT	PUT / POST
Read (Retrieve)	SELECT	GET
Update (Modify)	UPDATE	PUT / POST / PATCH
Delete (Destroy)	DELETE	DELETE

$组成部分$	$基础★$	$进阶_1★★$	$困难_2★★★$
$Server$	Minio Server	mock-s3	Ceph
$Client$	Minio Client	osm/s3cmd/aws-{cli\|shell}	boto3/awssdk
$Benchmark_3$	预置负载范例	选题观察分析	编制实验程序研究
评分标准	每项25分	每项30分	每项35分

大数据存储系统与管理

对象存储技术实验

授课教师

需要锻炼的背景能力

计算机专业基础技能

需要掌握的背景概念

对象存储是什么？

从“文件柜”到“仓库”

为什么对象存储成了云时代的“默认硬盘”？

本课程与对象存储的关系

学习内容

Lab 0 建立实验环境

实验报告（<学号>-lab.md）模板

Lab 1 搭建对象存储

实践基本功能

【扩展探索】应用集成

Lab 2 观测分析性能

影响性能的主要因素

尾延迟问题

Lab 3 尝试建模预测

【扩展探索】baseline

启动MinIO

创建测试桶

运行s3bench采集数据

解析延迟数据

回归模型拟合

预测新负载

进一步探索

评分构成

作业提交

提交日期

提交内容

往年作业参考

模范作业