宝塔服务器面板,一键全能部署及管理,送你10850元礼包,点我领取

MPP架构概念

1.什么是MPP

MPP Massively Parallel Processing),即大规模 并行处理

什么是并行处理?

在数据库集群中,首先每个节点都有独立的磁盘存储系统和内存系统,其次业务数据根据数据库模型和应用特点划分到各个节点上,MPP是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果。

什么是大规模?

每台数据节点通过专用网络或者商业通用网络互相连接,彼此协同计算,作为整体提供数据库服务。整个集群称为非共享数据库集群,非共享数据库集群有完全的可伸缩性、高可用、高性能、优秀的性价比、资源共享等优势。

MPP 处理数据的思路

面对海量数据和计算时,采用大事化小的思路,对数据进行分割,数据分割后单独存储,数据处理消耗的资源也是相互隔开的,对于MPP数据库来讲,整个数据库由多个完全独立的数据库构成,各个拥有完整的数据存储、数据管理、数据操作能力。基于网络实现节点互联,形成一个整体对外提供服务,节点间互不干扰,即Share Nothing,不共享磁盘和计算能力。

2.MPP架构特性

MPP 具备以下技术特征:
● 任务并行执行;

● 数据分布式存储本地化);

● 分布式计算;

● 高可用、易维护:数据通过副本提供冗余保护,自动故障探测和管理,自动同步元数据和业务数据。提供图形化工具,以简化管理员对数据库的管理工作;

● 高并发:读写不互斥,支持数据的边加载边查询,单个节点并发能力大于 300 用户;

● 高扩展、高可靠:支持集群节点的扩容和缩容,支持全量、增量的备份/恢复;

● 行列混合存储:提供行列混合存储方案,从而提高了列存数据库特殊查询场景的查询响应耗时;

● 标准化:支持SQL92 标准,支持 C API、ODBC、JDBC、ADO.NET 等接口规范。

3.Master和Worker

“worker”进程天生就是来”干活”的,真正负责处理请求的进程就是你看到的”worker”进程,那么”master”进程有什么用呢?
“master”进程其实是负责管理”worker”进程的,除了管理” worker”进程,master”进程还负责读取配置文件、判断配置文件语法的工作,“master进程”也叫”主进程”,一般”master”进程只能有一个,而”worker”进程可以有多个,worker”进程的数量可以由管理员自己进行定义