“源端主機網絡繁忙,無法連接api網關”該如何處理?
Agent無法正常啟動,Linux系統提示“SMS.0201 Failed to start sms agent! Please check the network connection with below commands!”,Windows系統提示“SMS.0201 源端主機網絡繁忙,無法連接api網關”。該問題通常是由于源端沒有通公網,或者沒有按照要求配置hosts,無法與iam或者sms通信導致。需要排查源端網絡。
1.登錄源端服務器。
2.檢查源端是否能正常訪問互聯網,若無法訪問,請處理后重新啟動Agent。可參考彈性公網IP Ping不通檢查源端的DNS,防火墻,安全組、本地網絡等。
3.如果使用了代理服務器,請檢查代理服務器是否正常。
常見代理問題:代理賬號密碼錯誤、代理服務器與公網不同、防火墻或其他軟件限制。
不需要單獨創建消費組、生產者和消費者,在使用時自動生成,實例創建后,直接使用即可。
金山云列舉查詢對象不完整,該如何處理?
金山云SDK獲取系統編碼為GBK,導致程序運行編碼UTF-8字符亂碼,從而查詢數據參數亂碼,導致列舉對象缺失。
步驟 1 配置環境變量。
名稱:JAVA_TOOL_OPTIONS
值:-Dfile.encoding=UTF-8
步驟 2 重啟 RDA軟件服務。
遷移過程中是否可以釋放/修改彈性公網IP(EIP)?
不可以。
使用主機遷移服務公網遷移,源端遷移Agent會記錄遷移開始時的目的端EIP,并在遷移和同步過程中通過該EIP進行數據傳輸。在遷移/同步過程中,釋放/修改目的端EIP,會造成遷移/同步任務失敗。
在遷移正常完成后,并且確認后續不再進行數據同步,才可以釋放/修改目的端EIP。
“與目的服務器建立SSH連接失敗”該如何處理?
Linux文件級遷移時,源端會和目的端服務器建立一個SSH連接用于傳輸數據。如果無法成功建立SSH連接,則會提示該錯誤。建議您參考本章節操作步驟排查SSH無法連接的原因。
- 檢查目的端是否被關機
- 檢查目的端安全組22端口是否被關閉或指定了一個非源端IP
- 檢查遷移過程中目的端是否更換了VPC或者IP
- 檢查源端防火墻出口方向是否有安全攔截
- 檢查源端或目的端主機是否存在安全告警或者EIP被凍結
- 檢查源端/root/.ssh/known_hosts記錄的公鑰和目的端的公鑰是否不一致
- 檢查是否安裝ssh客戶端
- 檢查目的端sshd服務是否正常運行或監聽端口是否被改為其他非22端口
- 檢查是否使用了與目的端服務器未聯通的內網進行遷移
“無法連接目的虛擬機,請檢查目的虛擬機IP是否可達,或者8899、8900端口是否開放”該如何處理?
windows系統遷移時,目的端服務器需要開放8899端口與服務端通信,開放8900端口與源端通信。如果建立通信失敗,則會提示該錯誤。建議您參考本章節操作步驟排查“無法連接目的虛擬機”的原因。
- 目的端Peagent異常
- 檢查源端網絡是否可以連通目的端
- 檢查目的端安全組是否開放8899、8900端口
- 檢查目的端網絡ACL是否禁用了8899、8900端口
源端連通專線/VPN或內網VPC對等連接,還需要連通公網嗎?
源端服務器和目的端服務器之間連通專線/VPN或內網VPC對等連接只用于數據流的傳輸,源端服務器和主機遷移服務端之間控制流需要通過公網傳輸,因此源端必須連通公網。

1)、控制流:源端服務器和主機遷移服務端之間遷移指令的交互過程。
遷移指令交互包括:
步驟②:源端服務器上的遷移Agent向主機遷移服務注冊自身連接狀態,并將源端服務器信息上報到主機遷移服務,完成遷移可行性檢查。
步驟④:遷移Agent獲取并執行主機遷移服務發送的遷移指令。
2)、數據流:源端服務器上磁盤數據的遷移過程。
磁盤數據遷移包括:
步驟⑤:遷移源端服務器系統盤。
步驟⑥:遷移源端服務器數據盤。
遷移進度卡住或過慢該怎么辦?
遷移過程中,進度條變化很慢或者沒變化。該現象可能由多個原因造成,如網絡帶寬、源端存在大量小文件、linux文件遷移同步階段差異比較等。
· 檢查源端及目的端帶寬,遷移過程中盡可能提高帶寬。在不影響業務的情況下,盡可能提供充裕的帶寬給遷移進程。
· 檢查源端是否存在大量小文件,請盡可能清理一些可刪除文件。
· Linux文件級遷移同步過程中,如果同步進度長時間在6%,請耐心等待,遷移進程正在對目的端和源端進行差異比較并同步。
· 檢查管理控制臺上“遷移實時狀態”是否為“連接斷開”。如果連接正常,請耐心等待。如果連接失敗,請檢查后重新發起任務。
遷移需要多長時間?
首先使用iperf測試源端到目的端服務器的TCP速度。

其中:
· T表示遷移時間,單位為h。
· C表示源端服務器所有使用數據量,單位為GB。
· S表示源端到目的端服務器的TCP速度,單位為Mbit/s。
· U表示網絡利用率,與網絡質量(抖動、時延、丟包)有關,通常在50%~80%之間。
例如:遷移源端服務器所有使用數據量為100GB,iperf測試出來的TCP速度為100Mbit/s,網絡利用率為70%,那么遷移時間為:
遷移時間T = 100GB * 1000*8 / 100Mbit/s/ 3600 /70%≈ 3.17h
遷移速度由源端帶寬決定還是目的端帶寬決定?
遷移速度取決于源端的出口帶寬和目的端的入云帶寬。取兩者中較小值進行遷移。
如何處理“權限不夠,請添加相應細粒度權限”?
問題描述:遷移過程中提示“SMS.0204權限不夠,錯誤原因:xxx,請添加相應細粒度權限”。具體的錯誤原因與缺失的細粒度權限有關。
問題原因和解決方案:
1、 目的端賬戶余額不滿足大于100元的條件,余額不足會導致遷移失敗,請充值或申請權限,然后重新發起遷移任務。
2、 主機遷移服務在遷移過程中會用到ECS,VPC,IMS,EVS等的相關權限,缺少其中的某些權限會導致遷移失敗。請檢查權限并在IAM控制臺創建用戶組,授予“SMS
FullAccess”、"OBS OperateAccess"、“ECS FullAccess”、“VPC FullAccess”權限。
遷移需要在控制機,源端和目標端分別開放哪些端口?
請參考RDA 控制臺頁面,配置管--網絡設置—通信矩陣菜單項,開放對應端口:
新建遷移任務需要對目的端服務器做哪些準備?
遷移前,若選擇遷移到已有服務器,請做以下準備工作:
- 確保天翼云上有滿足條件的彈性云服務器。
- 確保源端服務器可以訪問目的端服務器(即彈性云服務器),即要有可用的EIP,或者配置VPN、專線。
- 確保目的端服務器所在VPC安全組配置準確。需配置目的端服務器所在VPC安全組,如果是Windows系統需要開放TCP的8899端口、8900端口和22端口;如果是Linux系統,塊級遷移開放8900端口和22端口,文件級遷移開放22端口。
- 遷移過程中禁止操作目的端彈性云服務器(包括關機、重啟、掛載磁盤、卸載磁盤、修改密碼等),否則會導致遷移失敗。
如何配置目的端服務器安全組規則?
- 登錄管理控制臺。
- 單擊控制臺左上角,選擇區域和項目。
- 選擇“計算 > 彈性云主機”。
- 在彈性云服務器列表,單擊待變更安全組規則的彈性云服務器名稱。系統跳轉至該彈性云服務器詳情頁面。
- 選擇“安全組”頁簽,并單擊,查看安全組規則。
- 單擊“更改安全組規則”。系統跳轉至安全組頁面。
- 在“入方向規則”頁簽下,單擊“添加規則”,配置安全組入方向的訪問規則。
- 單擊“確定”,完成安全組規則配置。
源端連通專線/VPN或內網VPC對等連接,還需要連通公網嗎?
源端服務器和目的端服務器之間連通專線/VPN或內網VPC對等連接只用于數據流的傳輸,源端服務器和主機遷移服務端之間控制流需要通過公網傳輸,因此源端必須連通公網。
圖 主機遷移工作原理

1、控制流:源端服務器和主機遷移服務端之間遷移指令的交互過程。
遷移指令交互包括:
步驟②:源端服務器上的遷移Agent向主機遷移服務注冊自身連接狀態,并將源端服務器信息上報到主機遷移服務,完成遷移可行性檢查。
步驟④:遷移Agent獲取并執行主機遷移服務發送的遷移指令。
2、數據流:源端服務器上磁盤數據的遷移過程。
磁盤數據遷移包括:
步驟⑤:遷移源端服務器系統盤。
步驟⑥:遷移源端服務器數據盤。
“域名解析失敗”該如何處理?
創建遷移任務后,開始遷移時,錯誤&風險提示“SMS.0302 域名%s解析失敗”。出現該問題是因為有域名解析失敗,只有所有域名解析成功,源端服務器才能與RDA主機遷移服務建立聯系,進行遷移。如果有域名解析失敗,則會提示該錯誤。
導致域名解析失敗的原因有:
- 本地網絡故障。
- 云解析服務器的解析記錄異常。
- 域名解析記錄在DNS被修改或者緩存。
“域名聯通失敗”該如何處理?
問題描述
創建遷移任務后,開始遷移時,錯誤&風險提示“SMS.0303 域名%s聯通失敗”。
問題分析
遷移時,需要所有域名聯通,如果有域名聯通失敗,則會提示該錯誤。
導致域名聯通失敗的原因有:
- 網絡處于異常狀態,比如超時、斷網、網絡不通等情況下可能會導致域名聯通失敗。
- 防火墻安全攔截。
- 源端存在安全告警或者EIP被解綁/凍結。
- 安全組出方向規則關閉。
解決方案
- Ping一下其他域名。若能Ping通,則排除網絡異常;若Ping不通,請檢查本地網絡狀態。
- 檢查源端防火墻出口方向是否有安全攔截,如果有攔截,放行后繼續遷移。
- 檢查源端是否存在安全告警或者EIP被解綁/凍結。如果存在解綁情況,可選擇重新綁定或使用VPC/內網;如果存在凍結情況,請聯系ECS或EIP服務技術支持。
- 檢查源端是否關閉出方向規則。
如何查看剩余遷移時間?
遷移剩余時間是根據您的剩余數據量與遷移過程中的實際遷移速率計算得來,由于您遷移的過程中的速率存在一定的波動,因此剩余遷移時間無法被準確計算,且會隨之波動。您可參考以下方式查看剩余遷移時間。
- 登錄RDA控制臺。
- 在左側導航樹中,選擇“遷移服務器”。進入服務器列表頁面。
- 單擊服務器名稱前的按鈕,即可查看預測的剩余遷移時間。
如何加快遷移速度?
- 需要提升您的網絡速率。如果網絡速率小于500kbit/s,您需要排查以下三個方面:
- 如果源端服務器在數據中心,請您排查源端服務器所在網絡到公網的帶寬、交換設備、路由設備、安全設備(防火墻等)、網絡線路、協議網絡相關因素等是否有限制或者使用不正確。如果有問題,需要您聯系網絡專業人員修復。建議您源端服務器所在網絡到天翼云公網的網絡速率大于10Mbit/s。
- 排查源端出口帶寬和目的端入云帶寬大小,擴大兩者之間較小的帶寬,也可根據需求將兩者同時擴大。
- 確保源端服務器與目的端服務器的OS設置正確。對于Windows系統,您可以使用
perfmon命令調用資源監視器監控網絡;對于Linux系統,推薦使用sar工具監控或者使用/proc/net/dev監控網卡的速度。如果網速較慢,說明您的OS配置可能不正確。需要提醒的是,您的OS服務、進程等不能對網卡做限速。
- 如果您源端服務器有大量的文件(例如50萬個100KB的文件),并且這些文件是殘留的無用數據,請提前刪除再做遷移。
- 請排查您源端服務器的I/O讀寫性能、CPU性能。Windows可以使用
perfmon命令調用資源監視器監控CPU和I/O讀寫性能,Linux使用top/ps和iostat/iotop來監控CPU和I/O性能。如果您的源端I/O讀寫性能、CPU性能差,建議您增加I/O和CPU的資源或者減少服務器運行的負載。
為什么遷移進度條進度時快時慢?
在主機遷移的過程中,除了遷移還包含了模塊初始化、備份、清理等各種操作,這些操作也會推動進度條的增長,而這些操作的用時難以準確預估,因此會導致遷移進度條增速時快時慢。該現象屬于正常現象,請耐心等待遷移完成即可。
Iperf的測試網絡的方法?
前提條件
- 保證源端與目的端網絡連通,以及天翼云上目的端服務器的安全組規則允許Iperf測試端口開放。
- 該測試需要在遷移前進行,而且在源端服務器上運行的業務對網絡影響不大,否則測試數據不準。
測試步驟
- 根據源端服務器的OS類型下載對應iperf版本。
- 在源端服務器和目的端服務器(或者目的端服務器同一Region下的其他彈性云服務器)某一個目錄下解壓iperf工具。例如在Windows操作系統的iperf工具:
- 在目的端服務器上,以命令行方式運行iperf(服務端模式運行,以Windows操作系統為例):
-
執行以下命令,進入iperf目錄。
cd /d path其中,path指2中iperf工具解壓后在目的端服務器中的路徑。
-
執行以下命令,以服務端運行iperf。
iperf3 -p port -s其中,port表示iperf工具的服務端監聽端口,建議Windows操作系統使用8900端口(8900為目的端服務器使用的數據傳輸端口),Linux操作系統使用22端口(22為目的端服務器使用的數據傳輸端口)。您測試的時候也可以使用其他端口,但要保證目的端服務器安全組規則允許開放該TCP或者UDP端口。以Windows操作系統使用8900端口為例,當回顯信息為Server listening on 8900時,表明服務端已經運行就緒。
-
- 在源端服務器上,以命令行方式運行iperf(客戶端模式運行),測試TCP帶寬和UDP的抖動、丟包率和帶寬(以Windows操作系統為例)。
-
執行以下命令,進入iperf目錄
cd /d path其中,path指2中iperf工具解壓后在源端服務器中的路徑。
-
執行以下命令,運行iperf工具,測試TCP帶寬。
iperf3 -c target_IP -p port -t time其中,-c是客戶端模式運行。
target_IP 表示目的端服務器(即以服務端模式運行iperf的服務器)的IP地址。
port表示連接目的端服務器的端口。
time表示測試總時間,默認單位為秒。以Windows操作系統使用8900端口為例,iperf客戶端連接到iperf服務端成功后會進行帶寬(Bandwidth)測試,測試結束后查看結果即可:
-
執行以下命令,運行iper測試UDP的抖動、丟包率和帶寬。
iperf3 -c target_IP -p port -u -t time其中,-u表示測試UDP的抖動、丟包率和帶寬。
target_IP 表示目的端服務器(即以服務端模式運行iperf的服務器)的IP地址。
port表示連接目的端服務器的端口。
time表示測試總時間,默認單位為秒。以Windows操作系統使用8900端口為例,iperf客戶端連接到iperf服務端成功后會測試UDP的抖動(Jitter)、丟包率(Lost/Total Datagrame)和帶寬(Bandwidth),測試結束后查看結果即可。
-
若需要測試網絡時延,可以使用ping命令。
ping target_iPtarget_IP 表示目的端服務器(即以服務端模式運行iperf的服務器)的IP地址。需要配置目的端服務器所在的VPC的安全組規則,允許ICMP協議報文通過。
-
- 執行命令
iperf3 -h,獲取更多的iperf的使用幫助。
遷移中升級帶寬后,遷移使用的是升級前的帶寬還是升級后的帶寬?
升級帶寬后,遷移使用的實際帶寬取決于下面最小的帶寬。升級帶寬后,需要等待5-10分鐘,才可生效,請耐心等待。
- 源端服務器升級后的帶寬。
- 目的端服務器入云帶寬。
- SMS控制臺設置的網速限制。
遷移速度由源端帶寬決定還是目的端帶寬決定?
遷移速度取決于源端的出口帶寬和目的端的入云帶寬。取兩者中較小值進行遷移。
如何判斷遷移任務是不是卡住?
遷移任務如果長時間不動,可能是以下三種情況,需要查看源端Agent日志確定。
- 情況一:遷移任務處于“持續同步”階段。
“持續同步”是主機遷移服務新增的功能,會自動同步源端數據。在配置目的端時,“是否持續同步”選擇“是”,全量復制完成后會自動進入“持續同步”階段。
遷移任務處于“持續同步”階段的時候,遷移并沒有完成,需要手動啟動目的端,因此,在未手動啟動目的端前,遷移任務會一直處于“持續同步”階段。啟動目的端完成后,才算一次完整的遷移。
- 情況二:數據遷移中。
數據遷移進行全量復制時,長時間處于某一進度,可能是由于遷移數據量大,遷移速率慢,導致長時間內進度無明顯變化,需要查看日志進行確認。若遷移速率不為0,已遷移數據量持續增加,則表明遷移正常。
- 情況三:啟動目的端卡住。
1、啟動目的端后任務進度條長時間為0,可能是在執行最后一次同步任務。啟動目的端時會進行一次數據同步,期間進度條無變化,數據同步時間長短由源端數據量決定,如果數據量過大,會導致數據比對時間長,該現象為正常現象。若要確定是否在進行數據同步,可查看sms_Info.log最新日志,若啟動目的端之后未出現error級別日志,則表明任務正常。
2、啟動目的端后任務進度條有進度但長時間無變化,可嘗試暫停任務,再次啟動任務,等待一段時間(10分鐘左右)再次查看是否發生變化。
影響遷移速度的因素有哪些?
可能會導致遷移速度慢、遷移時間長的因素如下表。
| 操作系統 | 影響因素 | 說明 |
|---|---|---|
| - | CPU和內存占用率 | 遷移過程中會占用源端主機的一部分內存和CPU,占用情況根據主機的實際情況有所不同。遷移前確保源端主機CPU和內存占用率不高于75%,實際預留內存不少于520MB。 |
| 網絡帶寬 | 主機遷移對網絡有較為嚴格的要求,需要保證源端和目的端網絡通暢,源端與目的端的網絡延遲不能過高,遷移帶寬取源端和目的端之間較小值。 | |
| Windows | 磁盤碎片 | Windows是塊級遷移,遷移會讀取磁盤中的有效塊,由于Windows的特性,在日常使用中會產生大量的磁盤碎片,通常Windows使用時間越長,磁盤碎片會越多,從而影響遷移時長。 |
| Linux | 文件過大 小文件過多 |
Linux是文件級遷移,源端小文件過多或者有比較大的文件,都會影響遷移速度。 * 源端單個文件超過2GB,可能導致遷移時間長。* 源端小文件數據量過多,比如有超過一萬個小于20KB的小文件,可能導致遷移時間長 |
可能會導致同步時間長的因素如下表。
| 操作系統 | 影響因素 | 說明 |
|---|---|---|
| - | 源端增量數據較多 源端變化數據較多 |
在同步過程中,如果源端產生的增量數據較多或者源端較多數據發生變化,會導致同步時間較長。 |
| Windows | 碎片文件過多 | 在同步過程中,如果源端產生的碎片文件較多,會導致同步時間長。 |
| Linux | 存在較大的稀疏文件 | 在同步過程中,系統會掃描稀疏文件,但不會遷移稀疏文件,如果源端有較大的稀疏文件,會導致同步時間長。 |
Linux塊遷移,為什么實際遷移速率顯示很低?
Linux塊遷移時,實際遷移速率顯示很低,遠小于寬帶的速率。
出現這種現象的原因,一般但不限于以下場景:
- 磁盤中數據占有率較低。
- 磁盤中存儲了大量的稀疏文件。
Linux塊遷移,在執行遷移的過程中會對數據進行壓縮,當需要遷移的磁盤塊本身存儲數據較少,或者是空的磁盤塊,會導致數據壓縮率很高(如:100M壓縮為5M),而遷移執行過程中傳輸的數據為壓縮后的數據,所以在傳輸這些數據較小的磁盤塊時,顯示的傳輸速率很低。實際上,在這種場景下遷移還在正常快速的執行,網絡連接、帶寬等都是正常的。
遷移中源端有新增的數據如何處理?
啟動目的端后,若源端有新增的數據,單擊此服務器所在行的操作列的“同步”,開始下一次復制(增量數據),當遷移狀態為“持續同步”時,單擊“啟動目的端”,遷移實時狀態為“已完成”時,說明新增數據已同步到目的端。
“遷移模塊異常中止,無法同步”怎么處理?
問題描述
持續同步過程中出現“SMS.1414 遷移模塊異常中止,無法同步”。
問題原因
遷移模塊異常終止可能是因為用戶手動重啟過Agent或者源端服務器被重啟過。
源端有一個監控磁盤變化的進程,用于將源端變化的部分同步到目的端。重啟之后該進程被終止,會導致無法正確的將源端服務器的變化同步到目的端。
解決方案
該場景下無法繼續完成遷移任務,請刪除該任務后,重新遷移。請注意遷移過程中不要重啟源端服務器或Agent。
Windows遷移過程中,源端SMS-Agent突然退出,導致與主機遷移控制臺斷開連接
問題描述
Windows服務器遷移過程中,源端突然與SMS控制臺斷開連接,查看源端發現是遷移用的SMS-Agent程序退出。
問題分析
出現該問題,可能是因為源端服務器“客戶體驗改善計劃”導致SMS-Agent程序退出。
- 查看SMS-Agent遷移日志中斷時間。(
C:\SMS-Agent-Py3\SmsAgent_Info.log) - 在源端服務器,打開計算機管理。選擇“事件查看器>Windows 日志>系統”。
- 在系統日志中,查看與SMS-Agent遷移日志中斷時間對應的系統日志。發現是因為一條客戶體驗改善計劃的用戶登錄通知,導致源端服務器自動重啟。
解決方案
關閉“客戶體驗改善計劃”。
- 在源端服務器,打開運行窗口,輸入:
gpedit.msc,單擊“確定”,打開“組編輯策略器”。 - 在導航欄,選擇“計算機配置>管理模板>系統>Internet通信管理>Internet 通信設置”,找到“關閉Windows 客戶體驗改善計劃”。
- 雙擊“關閉Windows 客戶體驗改善計劃”,打開編輯窗口,選擇“已啟用”,單擊“確定”。
- 打開計算機管理,選擇“系統工具>任務計劃程序庫>Microsoft>Windows>Customer Experience Improvement Program”,禁用所有任務。
- 選擇“系統工具>任務計劃程序庫>Microsoft>Windows>Application Experience”,禁用所有任務。
- 禁用客戶體驗改善計劃相關任務后,需要在RDA控制臺刪除遷移任務,重新創建并啟動遷移任務。