如何查看所有集群?
MRS所有的集群都展示在“集群列表”頁面中,進入“集群列表”頁面,可查看所有集群。集群數量較多時,可采用翻頁顯示,您可以查看任何狀態下的集群。
- 現有集群:包括除了“失敗”和“已刪除”狀態以外的所有集群。
- 歷史集群:僅包含“已刪除”狀態的集群,目前界面只顯示6個月內創建且已刪除的集群,若需要查看6個月以前刪除的集群,請聯系技術支持人員。
- 失敗任務管理:僅包含“失敗”狀態的任務。
?集群創建失敗的任務
?集群刪除失敗的任務
?集群擴容失敗的任務
?集群縮容失敗的任務
如何查看MRS服務的操作日志信息?
“操作日志”頁面記錄了用戶對集群和作業的操作的日志信息。目前,MRS界面記錄的日志信息分為以下幾類:
- 集群操作
?創建集群、刪除集群、擴容集群和縮容集群等操作
?創建目錄、刪除目錄和刪除文件等操作
- 作業操作:創建作業、停止作業和刪除作業等操作
- 數據操作:IAM用戶任務、新增用戶、新增用戶組等操作
記錄用戶操作的日志信息如下圖所示:
日志信息


如何查看MRS集群配置信息?
- 集群創建完成后在MRS控制臺單擊集群名稱進入集群基本信息頁面,可以查看到集群的基本配置信息。其中,節點的實例規格和容量決定了該集群對數據的分析處理能力。節點實例規格越高,容量越大,集群運行速度越快,分析處理能力越強,相應的成本也越高。
- 在基本信息頁面,單擊“前往Manager”,跳轉至MRS集群管理頁面。用戶可在集群管理頁面查看和處理告警信息、修改集群配置等。
如何在MRS集群中手動添加組件?
已經創建的MRS 3.1.0及之前版本集群不支持安裝新的組件。如果需要使用當前集群未安裝的組件,則需要重新創建一個集群,并且選擇所需要的組件。
MRS 3.1.2-LTS.3及之后版本的自定義類型集群支持手動添加組件。
MRS集群中安裝的組件能否刪除?
不可以刪除。
已經創建的MRS 3.1.0及之前版本集群中的組件不可以刪除,如果不使用的話可以登錄Manager頁面在服務管理中找到對應的組件將其停止。
MRS是否支持變更MRS集群節點?
MRS管理控制臺不支持變更集群節點,也不建議用戶在ECS管理控制臺直接修改MRS集群節點。如果手動在ECS管理控制臺對集群節點執行停止ECS、刪除ECS、修改或重裝ECS操作系統,以及修改ECS規格的操作,可能影響集群穩定運行。
如果您對MRS集群節點進行了上述操作,MRS會自動識別并直接刪除發生變更的集群節點。您可以登錄MRS管理控制臺,通過擴容恢復已經刪除的節點。請勿在擴容過程中對正在擴容的節點進行操作。
如何取消集群風險告警的消息通知?
1.登錄MRS服務控制臺。
2.單擊集群名稱進入集群詳情頁面。
3.選擇“告警管理 > 消息訂閱規則”。
4.在待修改的規則所在行的“操作”列單擊“編輯”,在“訂閱規則”中取消對應風險告警。
5.單擊“確定”完成修改。
為什么MRS集群顯示的資源池內存小于實際集群內存?
在MRS集群中,MRS默認為Yarn服務分配集群內存的50%,用戶從邏輯上對Yarn服務的節點按照資源池進行分區管理,所以集群中顯示的資源池總內存僅有集群總內存的50%。
如何配置knox內存?
以root用戶登錄集群Master節點。
1.在Master節點執行如下命令打開gateway.sh文件。
su omm
vim /opt/knox/bin/gateway.sh
2.將“APP_MEM_OPTS=""” 修改為 “APP_MEM_OPTS="-Xms256m -Xmx768m"” 保存并退出文件。
3.在Master節點執行如下命令重啟knox進程。
sh /opt/knox/bin/gateway.sh stop
sh /opt/knox/bin/gateway.sh start
4.在其他Master節點上重復執行如上步驟。
5.執行ps -ef |grep knox命令可查看已設置的內存信息。
knox內存


MRS集群安裝的Python版本是多少?
以root用戶登錄任意一個Master節點,然后執行python3命令即可獲取MRS集群安裝的Python版本。
如何查看各組件配置文件路徑?
常用組件配置文件路徑如下所示:
| 組件 | 配置文件目錄 |
|---|---|
| ClickHouse | 客戶端安裝路徑 /ClickHouse/clickhouse/config |
| Flink | 客戶端安裝路徑 /Flink/flink/conf |
| Flume | 客戶端安裝目錄 /fusioninsight-flume- xxx /conf |
| HBase | 客戶端安裝路徑 /HBase/hbase/conf |
| HDFS | 客戶端安裝路徑 /HDFS/hadoop/etc/hadoop |
| Hive | 客戶端安裝路徑 /Hive/config |
| Hudi | 客戶端安裝路徑 /Hudi/hudi/conf |
| Kafka | 客戶端安裝路徑 /Kafka/kafka/config |
| Loader | 客戶端安裝路徑 /Loader/loader-tools- xxx /loader-tool/conf 客戶端安裝路徑 /Loader/loader-tools- xxx /schedule-tool/conf 客戶端安裝路徑 /Loader/loader-tools- xxx /shell-client/conf 客戶端安裝路徑 /Loader/loader-tools- xxx /sqoop-shell/conf |
| Oozie | 客戶端安裝路徑 /Oozie/oozie-client- xxx /conf |
| Spark2x | 客戶端安裝路徑 /Spark2x/spark/conf |
| Yarn | 客戶端安裝路徑 /Yarn/config |
| ZooKeeper | 客戶端安裝路徑 /Zookeeper/zookeeper/conf |
MRS集群節點時間信息不正確如何處理?
- 若集群內節點時間不正確,請分別登錄集群內時間不正確的節點,并從步驟2開始執行。
- 若集群內節點與集群外節點時間不同步,請登錄集群外節點,并從步驟1開始執行。
1.執行vi /etc/ntp.conf命令編輯NTP客戶端配置文件,并增加MRS集群中Master節點的IP并注釋掉其他server的地址。
server master1_ip prefer
server master2_ip
增加Master節點的IP


2.執行service ntpd stop命令關閉NTP服務。
3.執行 /usr/sbin/ntpdate 主Master節點的IP地址 命令手動同步一次時間。
4.執行service ntpd start或systemctl restart ntpd命令啟動NTP服務。
5.執行ntpstat命令查看時間同步結果。
如何查詢MRS節點的啟動時間?
登錄當前節點,執行如下命令查詢節點啟動時間:
date -d "$(awk -F. '{print $1}' /proc/uptime) second ago" +"%Y-%m-%d %H:%M:%S"


節點互信異常如何處理?
當Manager報“ALM-12066 節點間互信失效”告警,或者發現節點間無ssh互信時,可參考如下步驟操作。
- 分別在互信集群的兩端節點執行ssh-add -l確認是否有identities信息。


- 如果沒有identities信息,執行ps -ef|grep ssh-agent找到ssh-agent進程,并kill該進程等待該進程自動重啟。


- 執行ssh-add -l查看是否已經添加identities信息,如果已經添加,請手動ssh確認互信是否正常。


- 如果有identities信息,需要確認/home/omm/.ssh/authorized_keys中是否有對端節點/home/omm/.ssh/id_rsa.pub文件中的信息,如果沒有手動添加對端節點信息。
- 檢查/home/omm/.ssh目錄下的文件權限是否正確。
- 排查日志文件 “/var/log/Bigdata/nodeagent/scriptlog/ssh-agent-monitor.log”。
- 如果用戶把omm的家目錄刪除了,需要聯系MRS支撐人員修復。
如何調整manager-executor進程內存?
問題現象
MRS服務在集群的Master1和Master2節點上部署了manager-executor進程,該進程主要用于將管控面對集群的操作進行封裝,比如作業的提交、心跳上報、部分告警信息上報、集群創擴縮等操作。當客戶從MRS管控面提交作業,隨著任務量的增大或者任務并發較高,有可能會導致Executor內存不足,導致占用CPU較高、Executor進程OOM等問題。
解決步驟
1.通過root用戶登錄Master1或Master2其中任意一節點,執行以下命令切換到omm用戶。
su - omm
2.執行以下命令,修改“catalina.sh”腳本,搜索“JAVA_OPTS” ,找到類似如下的配置JAVA_OPTS=“-Xms1024m -Xmx4096m”,將其修改為需要的值大小,保存修改。
vim /opt/executor/bin/catalina.sh
3.重啟manager-executor進程,該進程在Master1和Master2節點上為主備部署,同一時刻只有一個節點上運行該進程,首先確認節點上是否有該進程,如果有該進程則進行重啟操作。
a.分別登錄Master1節點和Master2節點,執行以下命令確認當前節點是否存在該進程。當有輸出時則進程存在。
ps -ef | grep "/opt/executor" | grep -v grep
b.重啟命令如下。
sh /opt/executor/bin/shutdown.shsh /opt/executor/bin/startup.sh