集群(Cluster): 是由多臺物理服務器(如果為虛擬機也視為物理服務器)組成的一個系統,他們通過網絡互聯,并作為一個整體來提供一系列服務。集群是物理資源的集合。
實例(instance) :特指用戶可以存取(一系列關聯)數據對象的資源集合;即包括一套GTM/CN/DN的邏輯集合。實例是邏輯資源集合。
運維管理控制系統(OSS-Operation and Maintenance Service): 簡稱管控
數據庫 :稱呼軟件主體時是數據庫;
庫: 稱呼create database的database為庫;有時候語境原因,數據庫可能替代庫,請注意。
分表(Distributed): 這里借用的DRDS概念,即在將一張邏輯上的表拆分到多個物理或邏輯獨立的分片(sharding)上,使得數據“物理”分散的一種方案。與之對應的是分表鍵(Distributed key)。
分片(sharding) :數據拆分的邏輯最小區塊,與之對應的是分片鍵(shard key)。
注意: 基于上述定義可知,Distributed在邏輯上略等于sharding,一種是從表物理分布形式稱呼,一種是從表的邏輯分布形式稱呼。
分區(partition): 大表的數據分成稱為分區的許多小的子集,分區是一種在單機數據庫中特有的方案,不應與分表、分片的意義重合。
邏輯表,表: 一個邏輯上統一的表,就create table語法創建的表,他可以是分表,單表。
注意: 在部分分布式數據庫中,還有region(區)的概率,但這個region與公有云的物理位置地區region重復,原則上我們不使用區(region)或分區這個詞。如確實需要描述,應先聲明其中文: 邏輯分片(region): 基于某一種分布式規則,負責維護集群的一段(邏輯上不再拆分)的連續數據區域。有一些分布式數據庫是基于文件大小進行分區,有些著采用數據的屬性(如字段區域、hash規則)等區域。
普通表、單表: 就create table語法創建的表,這里借用的DRDS概念,即僅在一個物理或邏輯的分片上存儲的表。也就是傳統單機數據庫的表。
邏輯表【≥】分表【≥】分片【≥】分區。
廣播表、復制表: 這里借用的DRDS概念,即在每個物理或邏輯的分片存放有相同表,并基于某種機制(通常是分布式事務)同時更新。
節點組(node group) :通常是指物理上的一組節點,在teledb中,特指基于node group語法組成的節點。
一組DN節點: 默認情況下也指是基于主從架構則為一主多從結構的DN節點,請注意術語區別節點組功能。
節點(node): 網絡中,物理或邏輯上的一個實體。
邏輯節點: 是指這個實體是邏輯上獨立的。通常是指CN或者DN的一個進程的集合就是一個邏輯節點。
物理節點: 是指這個實例是物理上獨立的。通常是指一臺獨立的服務器(虛擬機)。由于當前虛擬化(含cgroup)技術,一臺物理節點上可能存在多個邏輯節點。
注意: 一個節點組上可能承載一個或多個分片,但一個分片不能被多個節點組再進行拆分。
事務、普通事務、單機事務: 一個具有ACID特性的系列操作,通常一個事務有唯一的事務ID。若未特殊指明,事務通常是指單機事務或單機事務與分布式事務的統稱。
分布式事務(distributed transaction): 是指在分布式數據庫上執行的,需要多個物理或邏輯上不同的數據協同的具有ACID特性的操作集合。在實際情況下,分布式事務可能被拆分為多個 子事務 。
只讀節點【替換原來只讀平面】 ,如果是CN節點只讀,就稱為 只讀CN節點 。
讀寫節點【替換原來的讀寫平面】
主DN、主CN(主節點) :即DN的負責讀寫的主節點
備DN、備CN(備節點) :即DN負責同步數據,參與高可用切換(但不參與寫)的節點。在mysql中,也稱為 從節點 ,這里與備與從等義。
只讀實例 :是指參與數據同步但不參與高可用切換的邏輯上的節點組合(在讀擴展場景較常見的概念)
災備實例 :是指參與數據同步,但參與主備之間高可用切換,但參與在主機房災難情況下,切換過來的的邏輯上的節點組合(在異地容災能力常見的概念)
注意除非某個只讀節點或災備節點與主節點共享同一套GTM,否則均稱為只讀實例和災備實例稱為XX實例。例如,備DN若開啟只讀能力,可以叫做只讀節點。
利用率(Utilization rate) :是指有效利用資源(人力、物力、財力等)的百分比。它通常用于衡量資源的有效利用程度,反映在一定條件下,資源的投入與產出的比例關系。例如,辦公區域的利用率、機器設備的利用率等。
使用率(Usage rate) :是指使用資源的程度或頻率。它通常用于衡量在一段時間內,資源被使用的次數或時間。例如,圖書館的使用率、健身房的使用率等。
占用率(Occupancy rate) :是指占用資源的人或事物所占的比例。它通常用于衡量在一定時間內,資源被占用的程度。例如,房屋的占用率、車位的占用率等。
如上,一般說百分比的%就叫:CPU利用率、內存利用率,一般是長期占用的比例的%磁盤占用率,次/分這種單位的,就是使用率。
熱備(在線備份) 在數據庫運行時直接備份,即備份時對數據庫操作沒有任何影響的備份。 溫備(在數據庫運行時加全局讀鎖備份) 保證了備份數據的一致性,但對性能有影響。在當前技術下,熱備和溫備通常等意,原則上不稱呼溫備。
冷備(離線備份) 在數據庫停止時進行備份。
全量備份(Full Backup) :也稱為完全備份,指對某個指定時間點的所有數據和對應的結構進行一個完全的備份。
增量備份(Incremental Backup) :在上一次全備份或上一次增量備份后,以后每次的備份只需備份與前一次相比增加或者被修改的文件。
差異備份(Differential Backup): 與增量備份類似,差異備份是備份的是自上一次完整備份以來的所有更改數據,而不是自上一次備份以來的所有更改。(通常不使用差異備份這個詞)。
日志備份: 單獨對數據庫日志進行的一種備份。日志備份與增量備份主要是備份文件的差異,一個是log的集合;一個是文件系統文件的集合;但有些技術實現的時候可能重復。
區域Region :是指地理的物理位置。
可用區(Availability zone,AZ) :可用區是指在某一地域內,具有獨立電力和網絡的物理區域。同一可用區內實例之間的網絡延時更小。
數據中心(Data Center,簡稱DC) 是指一種擁有完善的設備(包括高速互聯網接入帶寬、高性能局域網絡、安全可靠的機房環境等)、專業化的管理、完善的應用服務平臺。
機房: 存放相關互聯網設備的一個房間
機架: 存放相關互聯網設備的一個架子
宿主機、母機: 因為有虛擬化概念,所以宿主機、母機特指軟件安裝所在的物理服務器。
國密: 指符合中國國家標準的商用密碼算法;通常簡寫為SM。
GTM: 全局事務管理器(Global Transaction Manager)(簡稱GTM),負責管理集群事務信息,同時管理集群的全局對象,比如序列等。
Coordinator :協調節點(簡稱CN),對外提供接口,負責數據的分發和查詢規劃,多個節點位置對等,每個節點都提供相同的數據庫視圖;在功能上CN上只存儲系統的全局元數據,并不存儲實際的業務數據。
Datanode: 數據節點(簡稱DN),處理存儲本節點相關的元數據,每個節點還存儲業務數據的分片。在功能上,DN節點負責完成執行協調節點分發的執行請求。
MPP: 大規模并行處理(Massively Parallel Processing)
OLAP: 聯機分析處理(On-Line Analytical Processing)
OLTP :聯機事務處理(On-line Transaction Processing)
HTAP: 混合事務/ 分析處理(Hybrid ?Transactional/Analytical Processing
行存: 數據按照邏輯順序相同的方式來來進行文件存儲,一行中的所有列數據按照順序存儲在物理磁盤上,這種格式的好處很明顯,如果同時訪問一行中的多列數據時,一般只需要一次磁盤IO,比較適合OLTP類型的負載。
列存: 表中的每列數據存儲為一個獨立的磁盤文件,比如例子中,“姓名”,“部門”,“薪酬”,“家庭信息”每列中的數據都為一個獨立的數據文件,這中格式在一次需要訪問表中少數列時相比行存能夠節省大量的磁盤IO,在聚合類場景下尤其高效,因此多用在OLAP類系統中。
share nothing: 各個處理單元都有自己私有的CPU/內存/硬盤等,不共享資源的集群架構
Shard map: 存儲在CN/DN節點中的記錄數據塊與shard之間映射關系的位圖。
Xlog:TeleDB數據庫中DN節點的WAL日志文件。
三權分立: 把傳統數據庫系統DBA的角色分解為三個相互獨立的角色,安全管理員,審計管理員,數據管理員,這個三個角色之間相互制約,消除出系統中的超級權限,從系統角色設計上了解決了數據安全問題
列級加密: 針對指定列做單獨的加密操作
文件加密: 以數據庫內部標準塊block為加密計算的最小單位
透明數據脫敏: 在用戶無感知的情況下,對非授權用戶返回被脫敏的數據。其中,無感知是指用戶使用的查詢操作變化,也無需增加額外的運算操作;非授權用戶的解釋為,以訪問表為例,用戶具備該表的查詢權限,但需要限制對某些字段真實值的獲得;脫敏是指通過某種運算法則,在真實數據返回給訪問終端前,按照既定規則,將原始數據映射到另一種形式(可以支持多種變化),該映射規則對查詢用戶不可見,且轉換后的形式不能做逆向操作(即轉換為原始數據)
數據傾斜: 分布式系統中,數據集中存儲在某些DN節點組中,而另外一些DN節點組數據較少,導致性能、容量在分布式系統中分布不均衡。
冷熱分離: 對熱數據和冷數據采用不同的存儲設備,就可以大大降低業務的使用成本。
在線擴容: 通過先搬遷存量數據,再搬遷增量數據最后選擇合適的時機切換路由的方式來擴容實例,將實例擴容對業務的影響降低在毫秒級。
災難disaster、故障: 由于人為或自然的原因,造成信息系統嚴重故障、癱瘓或其數據嚴重受損,使信息系統支持的業務功能停頓或服務水平達到不可接受的程度,并持續特定時間的突發性事件。
災難恢復disaster recovery、故障恢復: 為了將信息系統從災難造成的不可運行狀態或不可接受狀態恢復到可正常運行狀態,并將其支持的業務功能從災難造成的不正常狀態恢復到可接受的狀態而設計的活動和流程。
災難恢復能力disaster recovery capability、故障恢復能力 :在災難發生后利用災難恢復資源和災難恢復預案及時恢復和繼續運作的能力。
災難恢復預案disaster recovery plan: 定義信息系統災難恢復過程中所需的任務、行動、數據和資源的文件。用于指導相關人員在預定的災難恢復目標內恢復信息系統支撐的關鍵業務功能。
風險分析risk analysis: 確定影響信息系統正常運行的風險,評估對單位業務運營至關重要的功能,定義降低潛在危險控制手段的流程。
注:風險分析經常涉及對特殊事件發生可能性的評估。
業務影響分析business impact analysis: 分析業務功能及其相關信息系統資源,評估特定災難對各業務功能的影響,確定信息系統可接受的RTO和RPO目標。
業務連續性business continuity: 在中斷事件發生后,組織在預先確定的可接受的水平上連續交付產品或提供服務的能力。
恢復時間目標recovery time objective;RTO: 災難發生后,信息系統從停頓到必須恢復的時間要求。
恢復點目標recovery point objective;RPO: 災難發生后,數據必須恢復到的時間點要求。
系統可用性system availability: 在要求的外部資源得到保證的前提下,分布式事務數據庫在規定的條件下和規定的時刻或時間區間內(不包括計劃內服務中斷時間)處于可執行規定功能狀態的能力。
注:一般按允許計劃外年服務中斷時間、可用程度至少達到“n個九”來衡量。
生產系統production system: 正常情況下支持單位生產運行的信息系統。包括主數據、主數據處理系統和主網絡。
生產中心production center: 生產系統所在的數據中心。
同城數據中心data center in the same city: 能夠抵御因供電供水中斷、水淹、火災、網絡故障、硬件損毀、交通中斷等災難同時影響的數據中心。
注意一般情況下與生產中心距離為數十公里以內。
異地數據中心data center in the different city: 能夠抵御因戰爭、洪水、海嘯、臺風、地震等大范圍區域性災害同時影響的數據中心。
說明一般情況下與生產中心距離為數百公里以上。
演練exercise : 基于災難恢復預案進行的演習。
注意形式包括桌面演練、模擬演練、實戰演練等。
租戶(Tenant) :在云計算中,租戶是一個邏輯概念,表示使用系統或計算資源的用戶。在公有云平臺上注冊賬戶之后,每個人或企業就成為一個租戶,云平臺會以租戶為基本單位來為其分配資源。比如在系統中創建的賬戶與統計信息,以及在系統中設置的各式數據和用戶所設置的客戶化應用程序環境等,都屬于租戶的范圍。
用戶(User) :用戶是指需要使用云計算服務的個人或組織。是客觀存在的主體。
客戶(Customer) :客戶是購買云服務的個人或組織,比如公司的雇員或者個人。
賬號(Account) :這可以是在云平臺上注冊的賬戶,例如在天翼云、華為云等平臺上注冊的賬戶。請注意,本文不區分“賬號”與“帳號”,二者等義不做特殊區分。