有客戶求助:服務器搬遷后,一臺無法登錄,另一臺三個燈一起閃,無法開機。
30多公里,驅車前往,到達后發(fā)現(xiàn),無法登錄的那臺,也自動關機了,兩個燈一起閃,按下電源鍵,沒多久就自動斷電重啟,如此循環(huán),看型號是惠普DL360 Gen9。
另外一臺重新插拔電源線,開機幾秒后三個燈一起閃,無響應、無顯示,看型號是惠普DL20 Gen9。
全是灰塵,沒什么好看的,拖回公司維修。
惠普DL360 Gen9,是金蝶ERP服務器,先重點關注一下,插上顯示器,通電開機,注意盯著屏幕,看到幾個風扇報錯,然后就斷電重啟了,仔細看了下,5個風扇沒一個轉的,拔下電源線,拆下風扇。
清理后,手動可轉,插回去開機,卻報錯依舊,手電打了一上,果然還是不轉。
只能換了風扇,再查看有沒有其他的問題了。
惠普DL20 Gen9上面貼的標簽是文件服務器,想來也挺重要的,再看這臺吧,插上電源線,先不開機,插上網線,WEB登錄iLO,報的是CPU錯誤,對此,我深表懷疑。
拆下CPU,是E3-1220 V5 CPU,從備件柜里面翻了一陣,找到一塊E3-1230V3,顯然不配,又從幾臺測試服務器找,可惜都是E5系列的。
不插CPU通電,再次登錄iLO,還報同樣的錯誤,根據(jù)經驗,應該是主板問題。
與客戶溝通確認后,訂貨:主板一塊,風扇5個;得知北京可以發(fā)貨,暗自慶幸。
貨到,先給DL360 Gen9換風扇,順利開機,但是還有風扇報錯,仔細看了,只有一個風扇不轉,但是有兩個報錯。
難道發(fā)過來的風扇有一個壞的?交換位置后發(fā)現(xiàn),并不是風扇壞,而且接口壞。
主板上有多余的接口,調整風扇護罩,改插到其他接口,風扇轉了,但是報錯依舊,好在系統(tǒng)正常啟動了,確認5個風扇都正常運轉,蓋上機箱蓋,vmware順利啟動。
詢問客戶后,得到回復:Vmware root密碼未知。呃……好吧,機器先開著,就當測試了。
DL20 Gen9換主板,過程很順利,CPU果然沒問題,并且沒有做任何設置,順利啟動,也是vmware,同樣不知道root密碼,這……
就這么呼啦啦地開著兩臺服務器,直到下班,小心翼翼地關機,放上拖車,再把換下來的主板和風扇帶上,準備一起還給客戶。
第二天早上,8點25分就到客戶機房,駕輕就熟地上架、通電、開機,自信滿滿地洗手,準備讓客戶測試一下就撤。
結果財務回復,金蝶無法登錄。
沒有root的密碼,我只能看到一個vmware的界面,除了IP地址,沒什么有價值的信息。
打開我的筆記本電腦,網線直接插在服務器網卡上,ping 192.168.0.12 -t,不通,切換網卡接口,直到ping通,瀏覽器打開vmware登錄界面正常,網線插回交換機。
財務回復,金蝶還是無法登錄。
去財務辦公室,發(fā)現(xiàn)財務電腦的網段是10.0.0.x,機房就一個傻瓜交換機,顯然不可能有VLAN,但是得排除還有二級路由存在。
于是,在財務電腦上tracert -d 192.168.0.12,看了兩三跳,明顯不對,所以肯定是網段問題無疑。
回到機房,看到一臺網件路由器,上面接著聯(lián)通光貓,下面連接傻瓜交換機,準備登錄進去修改網段,問了一圈,沒人知道密碼。
多次輸入錯誤后,自動彈出重置密碼的界面,但是需要輸入兩個問題的答案,連密碼都沒人知道,怎么可能有人知道問題答案呢。
正在準備重置路由器的時候,前方發(fā)來好消息,密碼找到了,順利登錄,修改網段,重啟路由器,片刻后,通知財務,禁用本地連接,然后啟用,金蝶順利登錄。
讓客戶登錄DL20 Gen9上面的vmware,無法登錄,也ping不通,持續(xù)ping,跑到機房切換網口,就兩個網口,切換一次就行,但是還ping不通,插上顯示器一看,糟糕:STATE.TGZ錯誤,引導失敗。
真倒霉啊,心中萬馬奔騰,這下有得搞了。
硬盤拆下,還好是SATA接口,找臺式機掛上,優(yōu)盤PE啟動,把state.tgz復制到優(yōu)盤,7zip解壓,雖然報文件末端錯誤,但還是解壓了。
解壓出來是state.tar,再次解壓,再次報錯,得到一個local.tgz文件,再次解壓,還是報錯,得到一個local.tar文件,再解壓,還是報末端錯誤,提到一個etc文件夾,里面有三個子文件夾:security、ssh、vmware。
刪除有報錯的壓縮文件,按照目錄結構逐級壓縮回去,并且用原來的文件名,最后得到一個新的state.tgz文件,拷回到硬盤,關電腦,裝回服務器,開機,緊張地等了幾分鐘,可惜故障依舊。
我有心理準備,也沒打算一次成功,這次按照解壓過程來壓縮文件,沒有帶目錄結構,只是把文件層層套殼壓縮成需要的文件名稱,拷回服務器,還是失敗。
第三次拆下硬盤,還是優(yōu)盤PE啟動,chkdsk,我也知道不合適,其實應該在Linux系統(tǒng)下用磁盤掃描修復的命令,比如說fsck,但是我已經做好重裝vmware的打算了, 也就不在乎了。
因為這個分區(qū)只有256M,所以很快檢測完畢,得到一個chk0000文件,7zip解壓,一樣的多次報錯,再壓縮成state.tgz,再一次裝回到服務器,已經不抱希望了,所以失敗也在意料之中。
已經中午12點了,客戶也要休息,只能把服務器再次帶回公司。
一邊啃面包,一邊繼續(xù)工作,直接嘗試重裝修復。
Vmware 6.0,能檢測到已存在vmfs,重裝要覆蓋,沒有保留的選項,果斷放棄。
Vmware 6.7,檢測不到任何原有信息,直接安裝會覆蓋硬盤,再次放棄。
Vmware 8.0,檢測到已存在的vmfs,選擇升級,并且保留原有數(shù)據(jù)。
裝完后,web登錄提示密碼錯誤,奇怪,剛剛設置的密碼,怎么可能會忘記?輸入三遍都說我錯, 沒道理啊。
服務器鍵盤輸入root賬戶的密碼,沒問題啊,修改一下密碼吧。
然后筆記本電腦上,WEB也能登錄了,真奇怪。
登錄之后,本地存儲是不認的,所以虛擬機當然不可能識別到,需要先到“存儲器”菜單,打開“瀏覽數(shù)據(jù)存儲器”,然后找到虛擬機所在目錄,找到虛擬機名稱.vmx,就能重新注冊,然而,當我點擊“瀏覽數(shù)據(jù)存儲器”,瀏覽器就崩潰了,換別的瀏覽器也是一樣。
到vmware官網,下載esxui-signed-12086396.vib,winscp上傳到服務器,執(zhí)行以下命令安裝:
Esxcli software vib install -v /vmfs/volumes/esxui-signed-12086396.vib
安裝完成后,刷新瀏覽器,界面的樣子,又回到6.0的老樣子了,幸運的是點擊“瀏覽數(shù)據(jù)存儲器”不再報錯了,不幸的是,里面什么也沒有,當然也沒辦法注冊原來的虛擬機了。
Ssh連接到服務器,執(zhí)行以下命令,掛載vmfs
vmkfstools -V
esxcli storage core adapter rescan -a
esxcfg-volume -l
復制顯示的VMFS UUID,繼續(xù)執(zhí)行以下命令
esxcfg-volume -m 5806fca3-3428f4c0-2596-9418823523b0
ls /vmfs/volumes
回到WEB界面,打開“瀏覽數(shù)據(jù)存儲器”,成功地重新注冊虛擬機,并且開機成功,Window server 2012啟動成功。
可是問題又來了,服務器關機重啟后,vmfs又掉了,重新掛載后,再次注冊虛擬機,這顯然不靠譜,難道每次都來一遍么?
查詢后,嘗試以下方法,關機重啟不再有影響,vmfs會自動掛載,虛擬機是已注冊狀態(tài),并且能夠自啟。
ssh 登錄 esxi主機
esxcfg-advcfg -s 1 /LVM/EnableResignature
vmkfstools -V
esxcfg-advcfg -s 0 /LVM/EnableResignature
find /vmfs/volumes/ -name esxconsole.vmdk
經多次關機重啟,沒發(fā)現(xiàn)再有問題,此時已經是21:30,下班回家。
第二天早上,再把服務器送給客戶,破解windows server 2012的密碼后才知道,這根本不是文件服務器,而一臺郵件服務器,用的是winwebmail,可惜的是,客戶又沒人知道管理員密碼,真是尷尬,客戶說,找人問問再說,實在不行,還是需要我們的服務。
兩臺服務器,忙活了三天,收獲碎銀幾兩。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.