如今,越來越多企業在云中運行應用,其中不乏任務關鍵型的Tier 1應用。無論IT架構還是管理人員,都不得不面臨這樣的靈魂拷問:如何確保業務技術在云中運行時具備高可用性,并按要求執行,滿足業務目標預期?
要回答這個問題,企業IT首先必須明確:確保云中應用程序在線并正常工作,責任主體是自己而不是云供應商。初始默認狀態下,應用程序在云中運行時并不會具備高可用性、擴展性和彈性,IT需要自己構建并實現相關功能。
云中的共擔責任
云供應商有幾種方法,可為其提供的服務構建容錯能力。企業要想確保任務關鍵型應用在云中高可用,就必須了解云供應商是如何管理容錯的,并且清楚云服務在什么情形下可能失效。以下是云責任共擔模型中關于此部分內容的概要:
|
云中共擔責任 |
云供應商 |
企業自己 |
|
負責提供集成彈性和容錯能力的服務以防止故障 |
負責管理應用程序,確保其具有高可用性并防止故障 |
在云中,無論基礎架構(硬件、網絡、設施),還是軟件(管理和數據平面),任何類型的故障都可能導致應用程序不可用,對業務產生重大影響。這種情況下,企業將不得不實施故障轉移,或尋求其他解決方法。謹記:企業在云中運行的應用程序發生停機或性能下降的狀況時,并不一定是因云服務商發生故障或服務中斷導致,二者并沒有必然的聯系。
大多數云供應商的IaaS產品都提供可選項,幫助用戶將一定程度的彈性嵌入到云環境中:
? 在可用區或區域模型中可部署基礎架構,有助于保護其免受局部故障的影響。
? 監控服務,這些服務可以提醒用戶故障,并幫助了解系統和服務何時可能降級。
但無論如何,云中應用程序的可用性和彈性如何構建、水平如何.......這一系列問題仍完全取決于最終用戶。
云應用高可用和彈性設計
關于如何為云應用設計高可用和彈性,以下是需要重點考慮的幾個關鍵事項:

1,清楚地了解可以承受的停機時間。
2,聚焦應用程序所支持的業務服務,設計可滿足最低業務需求的高可用方案,以便在主(活動)應用程序發生故障時及時接管。
3,尋找具備可見性和修復功能的解決方案,適用于故障概率最高的云服務(如網絡或計算實例故障)。
4,在輔助環境(第二站點)中定期測試應用程序和系統,驗證彈性策略的有效性。
5,自動化的高可用和災難恢復操作可以顯著提高應用程序正常運行時間,提升整體運營效率。
最后,上一張方案架構圖,歸納云中高可用和應用彈性應覆蓋的關鍵應用場景。

組件支持管理各種存儲,包括SAN、本地閃存、SSD、DAS和S3。代理為與云中應用程序關聯的網絡、存儲和復制資源提供監視和故障轉移功能。
? 從本地遷移到云或從云遷移到云。
? 云中高可用或災難恢復。
? 從本地到云或跨云的災難恢復。
此外,應用程序遷移向導支持用戶自動將工作負載跨操作系統平臺遷移到公有云。
跨多云環境,將經濟高效的平臺獨立性與一致的應用程序高性能與可用性相結合? 美哉,妙哉。