亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

  • 發布文章
  • 消息中心
點贊
收藏
評論
分享
原創

Apache Doris 1.2 版本新特性介紹

2023-04-27 09:47:42
153
0

本文介紹Doris版本演進規劃和V1.2版本的新特性。
Apache Doris是一個現代化的MPP分析型數據庫產品。僅需亞秒級響應時間即可獲得查詢結果,有效地支持實時數據分析。Apache Doris的分布式架構非常簡潔,易于運維,并且可以支持10PB以上的超大數據集。
Apache Doris可以滿足多(duo)種(zhong)數(shu)據(ju)(ju)分(fen)析(xi)需求,例如固(gu)定歷史報表,實(shi)時數(shu)據(ju)(ju)分(fen)析(xi),交互(hu)式數(shu)據(ju)(ju)分(fen)析(xi)和探索式數(shu)據(ju)(ju)分(fen)析(xi)等。

 

Doris-1.1版本回顧:

 

特性

1.0版本

1.1版本

優化效果

1

性能優化

正式(shi)發(fa)布向量化引擎,查(cha)詢(xun)性能提升,但不穩定

默認開啟向量化引擎

查詢性能提升:
1. SSB整體提升3倍;

2.TPCH整(zheng)體提升(sheng)4.5倍。

2

Compaction優化

高頻數據導入(ru)場景會出現版本堆積(-235)錯誤(wu):導入(ru)速(su)度大于(yu)后端數據merge速(su)度時會阻塞導入(ru)

1. 優化compaction選擇(ze)版(ban)本的策略,避免一次處理選擇(ze)大量版(ban)本而導致線程阻塞(sai)

2. 主動compaction,杜(du)絕(jue)版本堆積錯誤

高(gao)QPS數(shu)據導入場景下,處理延時由200ms降(jiang)低至50ms

3

LTS與發版周期

/

1.1版本未(wei)發布較(jiao)多新功能,主要做bug修復和性能優化。

2位版本:(2-3個月(yue))包(bao)括BUG修復和功能(neng)更新(如1.1->1.2)

3位版本:(2-3周)包(bao)括BUG修(xiu)復(fu)和穩定優化(hua)(如1.2.1->1.2.2)

 

發版迭代計劃:

        用戶在進行版本升級時,需要滿足舊版本bug修復需求,但對新功能的不確定性存在顧慮,所以doris探索LTS(Long-Term-Support)版本的維護,每2-3月更新大版本(2位版本),每2-3周更新小版本(3位版本),3位版本更新代碼變化不大,可回滾,可通過3位版本更新修復緊急問題。

 

Doris-1.2版本新功能特性:

發布時間:2022年8月

 

特性

1.1版本

1.2版本

優化效果

1

冷熱分離

采用本地盤(pan)/云磁(ci)盤(pan)實現(xian)數據存儲:

3副本;

單位存儲成本高,無彈性(xing);

難以根據業務需求(qiu)來計算(suan)存儲(chu)成本;

云磁盤甚至達到9副本

1. 支持對(dui)象存儲:糾刪碼(ma);單(dan)位存儲成本低;無限付費;按(an)需付費

2. Rowset級別的冷熱分(fen)離(Tablet下以(yi)不同Rowset存儲冷數據和(he)熱數據)

3. 冷數據支(zhi)持導入、查詢(xun)、schema change

4. 創建存(cun)儲策略,制定數據(ju)冷卻的(de)時間和位置,支(zhi)持分區級別(bie)

5. 后續(xu)優(you)化:當前(qian)對象(xiang)存(cun)儲(chu)副本(ben)數和本(ben)地副本(ben)數一致(zhi),后續(xu)會優(you)化為單副本(ben);通(tong)過緩(huan)存(cun)機制使得(de)對象(xiang)存(cun)儲(chu)中的(de)歷史數據第(di)一次查詢時間可能(neng)較長,但(dan)進行第(di)二次查詢的(de)性(xing)能(neng)等同于本(ben)地盤效(xiao)果

 

1. 存儲成本降(jiang)低70%;

2. 場景:可(ke)以將歷史數據冷存到對(dui)象存儲上,犧牲查詢性能以換取存儲成本的降低。

2

New unique key

Unique 模型,數據按主鍵做更新,merge-on-read機制,計算(suan)和查(cha)詢過程中進(jin)行(xing)大量歸并、排序、比較(jiao)等(deng)操(cao)作,無法了解非KEY列的謂詞下推,性能較(jiao)差

1. 基于主鍵(jian)索引(yin),在(zai)做數據導入時(shi)在(zai)索引(yin)中查(cha)找(zhao)并標(biao)記(ji)狀態記(ji)錄(lu)在(zai)delete bitmap中,數據讀(du)取時(shi)先通過delete bitmap過濾,減(jian)少(shao)讀(du)取時(shi)的歸(gui)并排序

2. 高頻導入場景,會(hui)產生(sheng)多個(ge)(ge)版本數據,如果每個(ge)(ge)版本查找主(zhu)(zhu)鍵(jian)效率較低(di),通過添加索(suo)引可快速檢索(suo)所(suo)需主(zhu)(zhu)鍵(jian)

3. merge-on-write,將歸并等(deng)處理放在寫入階段,提升查(cha)詢階段的性能

1. 寫(xie)入性能降低30%;

(append->append+lookup)

2. 查(cha)詢(xun)性能提升10倍,接近明細模(mo)型的查(cha)詢(xun)效(xiao)率

3. 適合場(chang)(chang)景:對寫入(ru)壓力不大,查(cha)詢性能要(yao)求高的場(chang)(chang)景

3

Light schema change

無法支持上游schema變更(如加減列),schema同步延遲(chi)在分鐘級別,會造成數據堆積

1. 輕量級schema change

2. 只修改FE元數據

3. 毫秒級的加減(jian)列更新(xin)

4. 底(di)層數據不動

5. tablet下(xia)放(fang)到rowset級別,對應(ying)標記schema,寫(xie)入rowset時(shi),如果schema變更,會(hui)使用新(xin)的(de)(de)schema寫(xie)新(xin)的(de)(de)rowset,數(shu)據查詢時(shi)保(bao)證每一(yi)個rowset的(de)(de)schema自解釋

1. 支(zhi)持同步(bu)元數據變更

2. 適合(he)場(chang)景(jing):上游(you)(you)數據(ju)通過(guo)CDC同步到下游(you)(you),上游(you)(you)業務(wu)數據(ju)經常變(bian)更,schema變(bian)更情況的場(chang)景(jing)

4

New mem tracker

內存統計(ji)不(bu)完善,大查詢會(hui)導致進(jin)程OOM,BE掛掉

1. 自動(dong)統計(ji)內存開銷(xiao)

2. 進程(cheng)級內存限(xian)制(zhi),防止OOM

3. 查詢級別內存限制

4. 查詢內存超限時會自(zi)動(dong)取消(xiao)查詢

5. 算子級別(bie)內存統(tong)計(ji),提升可觀測(ce)性

通過(guo)內存限制,避(bi)免進程OOM,減(jian)少集(ji)群節(jie)點故障

 

5

Multi catalog

查詢外表需手動創建外表table,使用不方(fang)便

1. 對(dui)應(ying)多(duo)數據源的catalog

2. 只(zhi)需建(jian)立連(lian)接就(jiu)可以自動同步外(wai)表

支持多種外部數據源的聯邦查詢
0條評論
0 / 1000
趙****媛
4文(wen)章數
0粉絲數
趙****媛
4 文章 | 0 粉絲(si)
趙****媛
4文章數
0粉絲數
趙****媛
4 文章 | 0 粉絲
原創

Apache Doris 1.2 版本新特性介紹

2023-04-27 09:47:42
153
0

本文介紹Doris版本演進規劃和V1.2版本的新特性。
Apache Doris是一個現代化的MPP分析型數據庫產品。僅需亞秒級響應時間即可獲得查詢結果,有效地支持實時數據分析。Apache Doris的分布式架構非常簡潔,易于運維,并且可以支持10PB以上的超大數據集。
Apache Doris可以滿(man)足多種(zhong)數據分(fen)(fen)析需求(qiu),例如(ru)固定(ding)歷史報(bao)表(biao),實(shi)時數據分(fen)(fen)析,交互式數據分(fen)(fen)析和探索式數據分(fen)(fen)析等。

 

Doris-1.1版本回顧:

 

特性

1.0版本

1.1版本

優化效果

1

性能優化

正式(shi)發布向量化(hua)引擎,查(cha)詢性能提升,但不穩定

默認開啟向量化引擎

查詢性能提升:
1. SSB整體(ti)提升3倍;

2.TPCH整體提(ti)升4.5倍。

2

Compaction優(you)化

高頻數據(ju)導(dao)入(ru)場景會出現(xian)版本堆積(-235)錯誤:導(dao)入(ru)速(su)度(du)大于后端數據(ju)merge速(su)度(du)時會阻塞導(dao)入(ru)

1. 優化compaction選擇(ze)版本(ben)的策略,避免一(yi)次處(chu)理選擇(ze)大量版本(ben)而導致線程(cheng)阻塞

2. 主動compaction,杜絕(jue)版本堆積錯誤(wu)

高QPS數據導入場景下(xia),處理(li)延時由200ms降低(di)至50ms

3

LTS與發版周期

/

1.1版本(ben)未(wei)發布較多(duo)新功能(neng),主要做bug修復和性能(neng)優(you)化(hua)。

2位版本:(2-3個月(yue))包括(kuo)BUG修復和功能更新(如1.1->1.2)

3位版本:(2-3周)包括BUG修復和穩定(ding)優化(如1.2.1->1.2.2)

 

發版迭代計劃:

        用戶在進行版本升級時,需要滿足舊版本bug修復需求,但對新功能的不確定性存在顧慮,所以doris探索LTS(Long-Term-Support)版本的維護,每2-3月更新大版本(2位版本),每2-3周更新小版本(3位版本),3位版本更新代碼變化不大,可回滾,可通過3位版本更新修復緊急問題。

 

Doris-1.2版本新功能特性:

發布時間:2022年8月

 

特性

1.1版本

1.2版本

優化效果

1

冷熱分離

采(cai)用(yong)本地盤(pan)(pan)/云磁盤(pan)(pan)實現數據(ju)存(cun)儲:

3副本;

單位(wei)存(cun)儲成(cheng)本高,無(wu)彈(dan)性;

難(nan)以根據(ju)業(ye)務需求(qiu)來計算存儲(chu)成本;

云(yun)磁盤甚至(zhi)達到9副本

1. 支持對象存(cun)(cun)儲:糾刪(shan)碼(ma);單位(wei)存(cun)(cun)儲成本低;無限付(fu)費;按需(xu)付(fu)費

2. Rowset級別的冷熱分離(li)(Tablet下以不同Rowset存儲冷數據和熱數據)

3. 冷數據支持導入、查詢、schema change

4. 創(chuang)建(jian)存儲策略,制定數據(ju)冷卻的時間和位置,支持分區級別

5. 后(hou)續(xu)優化(hua):當(dang)前(qian)對象存儲副本(ben)數(shu)(shu)和本(ben)地副本(ben)數(shu)(shu)一致,后(hou)續(xu)會優化(hua)為(wei)單副本(ben);通過緩存機制(zhi)使(shi)得對象存儲中的歷史(shi)數(shu)(shu)據第一次查詢時間可(ke)能較長,但進行第二次查詢的性能等同于本(ben)地盤(pan)效(xiao)果

 

1. 存儲成(cheng)本降(jiang)低70%;

2. 場景(jing):可以將(jiang)歷史數據冷(leng)存(cun)到對象存(cun)儲上,犧(xi)牲查(cha)詢(xun)性能以換(huan)取存(cun)儲成本的降低(di)。

2

New unique key

Unique 模型,數(shu)據按(an)主鍵做更新,merge-on-read機制,計算和(he)查(cha)詢過程中進行大量(liang)歸并、排序、比較等操作,無(wu)法(fa)了解非KEY列(lie)的謂詞下推,性能較差

1. 基于主鍵索引,在(zai)(zai)做數據(ju)導入時(shi)(shi)在(zai)(zai)索引中查找并標記狀(zhuang)態記錄(lu)在(zai)(zai)delete bitmap中,數據(ju)讀取(qu)時(shi)(shi)先(xian)通過delete bitmap過濾,減(jian)少讀取(qu)時(shi)(shi)的歸并排序(xu)

2. 高頻導入場景,會產生多個版本數據,如果(guo)每個版本查找(zhao)主(zhu)鍵效率較低,通過添(tian)加索引可快(kuai)速檢(jian)索所需(xu)主(zhu)鍵

3. merge-on-write,將歸并(bing)等處理放在寫(xie)入階段,提升查詢階段的性(xing)能

1. 寫入性能降低30%;

(append->append+lookup)

2. ;查(cha)詢(xun)性能提(ti)升(sheng)10倍,接近明細模型的查(cha)詢(xun)效率

3. 適合場景(jing):對寫入(ru)壓力不大,查詢性能要求高的場景(jing)

3

Light schema change

無(wu)法支持上游schema變更(如加減(jian)列),schema同步延遲在分鐘級別,會造成數(shu)據堆積

1. 輕量(liang)級schema change

2. 只修改(gai)FE元(yuan)數據

3. 毫(hao)秒級的加(jia)減列更新(xin)

4. 底層數據不(bu)動

5. tablet下(xia)放到rowset級別(bie),對應標記schema,寫(xie)入rowset時,如果schema變更,會使用新(xin)的(de)schema寫(xie)新(xin)的(de)rowset,數據(ju)查詢時保證每(mei)一個rowset的(de)schema自解釋(shi)

1. 支持(chi)同步元數據變更

2. 適(shi)合場景:上(shang)游(you)(you)數(shu)(shu)據通過(guo)CDC同步到下游(you)(you),上(shang)游(you)(you)業務數(shu)(shu)據經常變更,schema變更情況(kuang)的場景

4

New mem tracker

內存統計不完(wan)善,大查詢會導致進程OOM,BE掛掉

1. 自動(dong)統計內存開銷

2. 進程級(ji)內(nei)存限制,防(fang)止OOM

3. 查詢級(ji)別內存限(xian)制

4. 查(cha)詢內存超(chao)限時會(hui)自動取消查(cha)詢

5. 算子(zi)級別內存統計,提(ti)升可(ke)觀測(ce)性

通過內(nei)存限制,避免進程OOM,減少(shao)集群節點故(gu)障

 

5

Multi catalog

查(cha)詢(xun)外表需手(shou)動創建外表table,使(shi)用不方便(bian)

1. 對應多數據源的catalog

2. 只需建立(li)連接就可以自動同步(bu)外表

支持多種外部數據源的聯邦查詢
文章來自個人專欄
文章 | 訂(ding)閱(yue)
0條評論
0 / 1000
請輸入你的評論
0
0