标签设计方案
创始人
2024-05-09 06:44:42
0

设计目标: 400W用户 200个标签

总涉及标签数据 8亿条数据

1. mysql表结构设计

IDuid身份标签ID状态
1111
2121
3221
4330

采用一对多的存储方式 即一个用户对应多条身份标签

2. mysql分表设计 2000W数据分一个表(不涉及大数据量存储 所以2000W数据为一个表)

分表数量 为40个表

根据用户ID取模分片 保证数据均匀落表(同时保证同一用户的身份信息在同一个表上)(缺点:扩容需要做大数据量数据迁移)

3. nosql存储方式

redis bitmaps存储方式
存储key值设计下面为准

耗费内存预估

  1. 按照400W用户 200个标签来设计的话
    单个标签预计消耗内存0.5M
    对于存储所有的标签的key值 大约100M的空间足以支持

  2. 如果需要单独存储用户下面所有的标签 耗费的内存 :
    单个用户耗费的内存 0.0000248M
    400W用户耗费内存 99.2M左右

{// 所有身份标签ID为1的用户身份标识"userlab:1":{"01001001"},// 所有身份标签ID为2的用户身份标识"userlab:2":{"01001001"},// 用户ID为1的用户所有的标签状态位"useralllab:user:1":{"0101101011010010001"}
}

4.洗标签方式

采用redis队列+go协程来进行洗标签。结合go高并发来实现标签的快速清洗入库以及存储bitmaps

相关内容

热门资讯

Kubernetes集群Nod... Kubernetes集群Node管理一、查看集群信息二、查看节点信息2.1 查看集群节点信息2.2 ...
Python基本函数、传参和流... def 定义函数 for 遍历 while 循环 if else 条件控制 默认值传参数 可变值传参...
九种查找算法-插值查找 插值查找   一、什么是插值查找 (1)插值查找算法类似于二分查找&#x...
Puppeteer之Pyppe... 前言 本文是该专栏的第4篇,结合项目案例让你熟练使用pyppeteer,后面会持续分享Pyppet...
【深度学习笔记】CNN网络各种... FLOPs 这里先注意一下FLOPs的写法,不要弄混了: FLOPS(全大写):是floating...
Linux查看log日志命令总... 目录1,动态实时查看日志1.1 tail -f filename1.2 追踪特定内容日...
Elasticsearch 索... 1、创建\更新索引模板 PUT _template/logging_template {   "in...
语义分割------FCN、d... 一、个人理解 语义分割,其实就是为图片中的每个像素打上相应的标签,即将其所代表的语义具现化,呈现出的...
C++标准模版库中线程的使用 文章目录线程的基本使用最基础的使用方法在创建线程时传参再看看join线程与线程之间的同步 线程是程序...
CMMI之度量与分析(MA) 目的度量与分析(Measurement and Analysis, MA...