OctopusDB

module

v0.0.0-...-a38de57 Latest Latest Go to latest Published: Apr 17, 2022 License: MIT

Details

Valid go.mod file

The Go module system was introduced in Go 1.11 and is the official dependency management solution for Go.
Redistributable license

Redistributable licenses place minimal restrictions on how software can be used, modified, and redistributed.
Tagged version

Modules with tagged versions give importers more predictable builds.
Stable version

When a project reaches major version v1 it is considered stable.
Learn more about best practices

Separating Keys from Values. Distributed Database System. Support Graph Query.

接收到用户写入请求后，首先写入wal和memtable：wal用做预写日志，持久化，memtable是kv存储的内存结构，通常使用跳表实现
后台主要有两个任务：将memtable刷到磁盘，以及对sst文件做合并
1. 内存中同一时刻只有一个活跃的memtable接收写入请求，其他都为immemtable。当内存中的memtable大小达到阈值之后，会转变为sst并刷到磁盘上
2. sst就是有序存储的数据文件，SST 的末尾是若干个索引块，记录每个数据块开头的 key，以便快速定位 key 的位置。SST 中可能含有 Bloom Filter 等结构加速查询。
第0层包含多个SST文件，每个文件包含的key范围可能重复，从L1层开始，同一层的文件内key不会重复，后台线程会对超出容量的SST文件做合并

SET(k,v)-->内存表大小达到阈值-->flush到磁盘sst文件

从读写两个角度分析sst的使用场景：
1. 写入kv导致内存大小达到阈值，需要flush，写入sst文件
2. 初始化db，需要加载sst文件，构建内存索引
需要考虑的问题：
1. 如何序列化：从内存到磁盘，序列化是不可避免的问题
2. 通用的序列化思路：meta ｜ index ｜ data
3. 如何高效的读写？使用mmap技术，磁盘--用户空间直接映射，用户操作内存[]byte，系统负责异步写磁盘

作用：存储sst文件层级信息的元数据文件，因此在flush（新建sst文件），merge（sst文件合并时），都需要对manifest进行更新
单独使用此类型文件来记录sst的元信息，也是为了加快数据库的恢复
序列化结构： magicNum | version | length of change | crc | change 前四个字段都是定长, change是通过pb进行序列化的