亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

點贊

評論

原創

Apache Doris 1.2 版本新特性介紹

2023-04-27 09:47:42

153

本文介紹Doris版本演進規劃和V1.2版本的新特性。
Apache Doris是一個現代化的MPP分析型數據庫產品。僅需亞秒級響應時間即可獲得查詢結果，有效地支持實時數據分析。Apache Doris的分布式架構非常簡潔，易于運維，并且可以支持10PB以上的超大數據集。
Apache Doris可以滿足多(duo)種(zhong)數(shu)據(ju)(ju)分(fen)析(xi)需求，例如固(gu)定歷史報表，實(shi)時數(shu)據(ju)(ju)分(fen)析(xi)，交互(hu)式數(shu)據(ju)(ju)分(fen)析(xi)和探索式數(shu)據(ju)(ju)分(fen)析(xi)等。

Doris-1.1版本回顧：

	特性	1.0版本	1.1版本	優化效果
1	性能優化	正式(shi)發(fa)布向量化引擎，查(cha)詢(xun)性能提升，但不穩定	默認開啟向量化引擎	查詢性能提升： 1. SSB整體提升3倍； 2.TPCH整(zheng)體提升(sheng)4.5倍。
2	Compaction優化	高頻數據導入(ru)場景會出現版本堆積（-235）錯誤(wu)：導入(ru)速(su)度大于(yu)后端數據merge速(su)度時會阻塞導入(ru)	1. 優化compaction選擇(ze)版(ban)本的策略，避免一次處理選擇(ze)大量版(ban)本而導致線程阻塞(sai) 2. 主動compaction，杜(du)絕(jue)版本堆積錯誤	高(gao)QPS數(shu)據導入場景下，處理延時由200ms降(jiang)低至50ms
3	LTS與發版周期	/	1.1版本未(wei)發布較(jiao)多新功能，主要做bug修復和性能優化。	2位版本：（2-3個月(yue)）包(bao)括BUG修復和功能(neng)更新（如1.1->1.2） 3位版本：（2-3周）包(bao)括BUG修(xiu)復(fu)和穩定優化(hua)（如1.2.1->1.2.2）

發版迭代計劃：

用戶在進行版本升級時，需要滿足舊版本bug修復需求，但對新功能的不確定性存在顧慮，所以doris探索LTS(Long-Term-Support)版本的維護，每2-3月更新大版本（2位版本），每2-3周更新小版本（3位版本），3位版本更新代碼變化不大，可回滾，可通過3位版本更新修復緊急問題。

Doris-1.2版本新功能特性：

發布時間：2022年8月

	特性	1.1版本	1.2版本	優化效果
1	冷熱分離	采用本地盤(pan)/云磁(ci)盤(pan)實現(xian)數據存儲： 3副本；單位存儲成本高，無彈性(xing)；難以根據業務需求(qiu)來計算(suan)存儲(chu)成本；云磁盤甚至達到9副本	1. 支持對(dui)象存儲：糾刪碼(ma)；單(dan)位存儲成本低；無限付費；按(an)需付費 2. Rowset級別的冷熱分(fen)離（Tablet下以(yi)不同Rowset存儲冷數據和(he)熱數據） 3. 冷數據支(zhi)持導入、查詢(xun)、schema change 4. 創建存(cun)儲策略，制定數據(ju)冷卻的(de)時間和位置，支(zhi)持分區級別(bie) 5. 后續(xu)優(you)化：當前(qian)對象(xiang)存(cun)儲(chu)副本(ben)數和本(ben)地副本(ben)數一致(zhi)，后續(xu)會優(you)化為單副本(ben)；通(tong)過緩(huan)存(cun)機制使得(de)對象(xiang)存(cun)儲(chu)中的(de)歷史數據第(di)一次查詢時間可能(neng)較長，但(dan)進行第(di)二次查詢的(de)性(xing)能(neng)等同于本(ben)地盤效(xiao)果	1. 存儲成本降(jiang)低70%； 2. 場景：可(ke)以將歷史數據冷存到對(dui)象存儲上，犧牲查詢性能以換取存儲成本的降低。
2	New unique key	Unique 模型，數據按主鍵做更新，merge-on-read機制，計算(suan)和查(cha)詢過程中進(jin)行(xing)大量歸并、排序、比較(jiao)等(deng)操(cao)作，無法了解非KEY列的謂詞下推，性能較(jiao)差	1. 基于主鍵(jian)索引(yin)，在(zai)做數據導入時(shi)在(zai)索引(yin)中查(cha)找(zhao)并標(biao)記(ji)狀態記(ji)錄(lu)在(zai)delete bitmap中，數據讀(du)取時(shi)先通過delete bitmap過濾，減(jian)少(shao)讀(du)取時(shi)的歸(gui)并排序 2. 高頻導入場景，會(hui)產生(sheng)多個(ge)(ge)版本數據，如果每個(ge)(ge)版本查找主(zhu)(zhu)鍵(jian)效率較低(di)，通過添加索(suo)引可快速檢索(suo)所(suo)需主(zhu)(zhu)鍵(jian) 3. merge-on-write，將歸并等(deng)處理放在寫入階段，提升查(cha)詢階段的性能	1. 寫(xie)入性能降低30%；（append->append+lookup） 2. 查(cha)詢(xun)性能提升10倍，接近明細模(mo)型的查(cha)詢(xun)效(xiao)率 3. 適合場(chang)(chang)景：對寫入(ru)壓力不大，查(cha)詢性能要(yao)求高的場(chang)(chang)景
3	Light schema change	無法支持上游schema變更（如加減列），schema同步延遲(chi)在分鐘級別，會造成數據堆積	1. 輕量級schema change 2. 只修改FE元數據 3. 毫秒級的加減(jian)列更新(xin) 4. 底(di)層數據不動 5. tablet下(xia)放(fang)到rowset級別，對應(ying)標記schema，寫(xie)入rowset時(shi)，如果schema變更，會(hui)使用新(xin)的(de)(de)schema寫(xie)新(xin)的(de)(de)rowset，數(shu)據查詢時(shi)保(bao)證每一(yi)個rowset的(de)(de)schema自解釋	1. 支(zhi)持同步(bu)元數據變更 2. 適合(he)場(chang)景(jing)：上游(you)(you)數據(ju)通過(guo)CDC同步到下游(you)(you)，上游(you)(you)業務(wu)數據(ju)經常變(bian)更，schema變(bian)更情況的場(chang)景(jing)
4	New mem tracker	內存統計(ji)不(bu)完善，大查詢會(hui)導致進(jin)程OOM，BE掛掉	1. 自動(dong)統計(ji)內存開銷(xiao) 2. 進程(cheng)級內存限(xian)制(zhi)，防止OOM 3. 查詢級別內存限制 4. 查詢內存超限時會自(zi)動(dong)取消(xiao)查詢 5. 算子級別(bie)內存統(tong)計(ji)，提升可觀測(ce)性	通過(guo)內存限制，避(bi)免進程OOM，減(jian)少集(ji)群節(jie)點故障
5	Multi catalog	查詢外表需手動創建外表table，使用不方(fang)便	1. 對(dui)應(ying)多(duo)數據源的catalog 2. 只(zhi)需建(jian)立連(lian)接就(jiu)可以自動同步外(wai)表	支持多種外部數據源的聯邦查詢

0條評論

0 / 1000

趙****媛

4文(wen)章數

0點贊數

0粉絲數

趙****媛

4 文章 | 0 粉絲(si)

Ta的熱門文章查看更多(duo)

Apache Doris 1.2 版本新特性介紹 Doris多租戶與資源管理的介紹與實踐 mv丟失隱藏文件的排查與解決方案使用jenkins進行流水線編譯

趙****媛

4文章數

0點贊數

0粉絲數

趙****媛

4 文章 | 0 粉絲

原創

Apache Doris 1.2 版本新特性介紹

數據倉庫服務數據倉庫服務翼MapReduce

2023-04-27 09:47:42

153

本文介紹Doris版本演進規劃和V1.2版本的新特性。
Apache Doris是一個現代化的MPP分析型數據庫產品。僅需亞秒級響應時間即可獲得查詢結果，有效地支持實時數據分析。Apache Doris的分布式架構非常簡潔，易于運維，并且可以支持10PB以上的超大數據集。
Apache Doris可以滿(man)足多種(zhong)數據分(fen)(fen)析需求(qiu)，例如(ru)固定(ding)歷史報(bao)表(biao)，實(shi)時數據分(fen)(fen)析，交互式數據分(fen)(fen)析和探索式數據分(fen)(fen)析等。

Doris-1.1版本回顧：

	特性	1.0版本	1.1版本	優化效果
1	性能優化	正式(shi)發布向量化(hua)引擎，查(cha)詢性能提升，但不穩定	默認開啟向量化引擎	查詢性能提升： 1. SSB整體(ti)提升3倍； 2.TPCH整體提(ti)升4.5倍。
2	Compaction優(you)化	高頻數據(ju)導(dao)入(ru)場景會出現(xian)版本堆積（-235）錯誤：導(dao)入(ru)速(su)度(du)大于后端數據(ju)merge速(su)度(du)時會阻塞導(dao)入(ru)	1. 優化compaction選擇(ze)版本(ben)的策略，避免一(yi)次處(chu)理選擇(ze)大量版本(ben)而導致線程(cheng)阻塞 2. 主動compaction，杜絕(jue)版本堆積錯誤(wu)	高QPS數據導入場景下(xia)，處理(li)延時由200ms降低(di)至50ms
3	LTS與發版周期	/	1.1版本(ben)未(wei)發布較多(duo)新功能(neng)，主要做bug修復和性能(neng)優(you)化(hua)。	2位版本：（2-3個月(yue)）包括(kuo)BUG修復和功能更新（如1.1->1.2） 3位版本：（2-3周）包括BUG修復和穩定(ding)優化（如1.2.1->1.2.2）

發版迭代計劃：

Doris-1.2版本新功能特性：

發布時間：2022年8月

	特性	1.1版本	1.2版本	優化效果
1	冷熱分離	采(cai)用(yong)本地盤(pan)(pan)/云磁盤(pan)(pan)實現數據(ju)存(cun)儲： 3副本；單位(wei)存(cun)儲成(cheng)本高，無(wu)彈(dan)性；難(nan)以根據(ju)業(ye)務需求(qiu)來計算存儲(chu)成本；云(yun)磁盤甚至(zhi)達到9副本	1. 支持對象存(cun)(cun)儲：糾刪(shan)碼(ma)；單位(wei)存(cun)(cun)儲成本低；無限付(fu)費；按需(xu)付(fu)費 2. Rowset級別的冷熱分離(li)（Tablet下以不同Rowset存儲冷數據和熱數據） 3. 冷數據支持導入、查詢、schema change 4. 創(chuang)建(jian)存儲策略，制定數據(ju)冷卻的時間和位置，支持分區級別 5. 后(hou)續(xu)優化(hua)：當(dang)前(qian)對象存儲副本(ben)數(shu)(shu)和本(ben)地副本(ben)數(shu)(shu)一致，后(hou)續(xu)會優化(hua)為(wei)單副本(ben)；通過緩存機制(zhi)使(shi)得對象存儲中的歷史(shi)數(shu)(shu)據第一次查詢時間可(ke)能較長，但進行第二次查詢的性能等同于本(ben)地盤(pan)效(xiao)果	1. 存儲成(cheng)本降(jiang)低70%； 2. 場景(jing)：可以將(jiang)歷史數據冷(leng)存(cun)到對象存(cun)儲上，犧(xi)牲查(cha)詢(xun)性能以換(huan)取存(cun)儲成本的降低(di)。
2	New unique key	Unique 模型，數(shu)據按(an)主鍵做更新，merge-on-read機制，計算和(he)查(cha)詢過程中進行大量(liang)歸并、排序、比較等操作，無(wu)法(fa)了解非KEY列(lie)的謂詞下推，性能較差	1. 基于主鍵索引，在(zai)(zai)做數據(ju)導入時(shi)(shi)在(zai)(zai)索引中查找并標記狀(zhuang)態記錄(lu)在(zai)(zai)delete bitmap中，數據(ju)讀取(qu)時(shi)(shi)先(xian)通過delete bitmap過濾，減(jian)少讀取(qu)時(shi)(shi)的歸并排序(xu) 2. 高頻導入場景，會產生多個版本數據，如果(guo)每個版本查找(zhao)主(zhu)鍵效率較低，通過添(tian)加索引可快(kuai)速檢(jian)索所需(xu)主(zhu)鍵 3. merge-on-write，將歸并(bing)等處理放在寫(xie)入階段，提升查詢階段的性(xing)能	1. 寫入性能降低30%；（append->append+lookup） 2. ;查(cha)詢(xun)性能提(ti)升(sheng)10倍，接近明細模型的查(cha)詢(xun)效率 3. 適合場景(jing)：對寫入(ru)壓力不大，查詢性能要求高的場景(jing)
3	Light schema change	無(wu)法支持上游schema變更（如加減(jian)列），schema同步延遲在分鐘級別，會造成數(shu)據堆積	1. 輕量(liang)級schema change 2. 只修改(gai)FE元(yuan)數據 3. 毫(hao)秒級的加(jia)減列更新(xin) 4. 底層數據不(bu)動 5. tablet下(xia)放到rowset級別(bie)，對應標記schema，寫(xie)入rowset時，如果schema變更，會使用新(xin)的(de)schema寫(xie)新(xin)的(de)rowset，數據(ju)查詢時保證每(mei)一個rowset的(de)schema自解釋(shi)	1. 支持(chi)同步元數據變更 2. 適(shi)合場景：上(shang)游(you)(you)數(shu)(shu)據通過(guo)CDC同步到下游(you)(you)，上(shang)游(you)(you)業務數(shu)(shu)據經常變更，schema變更情況(kuang)的場景
4	New mem tracker	內存統計不完(wan)善，大查詢會導致進程OOM，BE掛掉	1. 自動(dong)統計內存開銷 2. 進程級(ji)內(nei)存限制，防(fang)止OOM 3. 查詢級(ji)別內存限(xian)制 4. 查(cha)詢內存超(chao)限時會(hui)自動取消查(cha)詢 5. 算子(zi)級別內存統計，提(ti)升可(ke)觀測(ce)性	通過內(nei)存限制，避免進程OOM，減少(shao)集群節點故(gu)障
5	Multi catalog	查(cha)詢(xun)外表需手(shou)動創建外表table，使(shi)用不方便(bian)	1. 對應多數據源的catalog 2. 只需建立(li)連接就可以自動同步(bu)外表	支持多種外部數據源的聯邦查詢

文章來自個人專欄

文章 | 訂(ding)閱(yue)

0條評論

0 / 1000

請輸入你的評論

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

智算服務

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云

Apache Doris 1.2 版本新特性介紹

Apache Doris 1.2 版本新特性介紹

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

活動

智算服務

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云

Apache Doris 1.2 版本新特性介紹

Apache Doris 1.2 版本新特性介紹