一.IDC面臨問題
數(shù)字式KVM系統(tǒng)為大型數(shù)據(jù)機房管理帶來了全新的方式,通過IP式管理突破了距離限制,提高了機房管理效率,增強了機房的安全性能。但是單純的KVM系統(tǒng)并不能完全解決管理上的要求,特別是,當IDC機房服務(wù)器一直長時間高負荷運行,會常常出現(xiàn)服務(wù)器死機的情況,KVM只能提供服務(wù)器正常通電情況下的服務(wù)器操作,一旦死機,再強大的KVM系統(tǒng)也無能為力。
對于像大型數(shù)據(jù)中心來說,短暫的服務(wù)器死機或斷電,常常意味著客戶的頻繁投訴。在找出斷電或死機的服務(wù)器前,客戶的重要郵件無法接收,或者網(wǎng)站打不開。而一旦找到死機的服務(wù)器,所要做的,不過是重啟一下而已。但因為這樣不可避免的小問題,卻有可能給客戶造成重大損失。
客戶的不滿,對于知名的數(shù)據(jù)中心來說,后果不言而喻——這將直接影響到他們在行業(yè)內(nèi)的口碑,自然對業(yè)績有所影響。
二.通常的解決辦法
對于多數(shù)數(shù)據(jù)中心來說,解決服務(wù)器及設(shè)備的死機,通常僅僅是簡單的作一下重啟——對一臺服務(wù)器來說,死機的機率是小之又小的,但對于大規(guī)模的IDC機房服務(wù)器來說,死機的機率顯然高得多,對機房中數(shù)量不多的管理員來說,每天需要重啟的工作量是非常之大的。發(fā)現(xiàn)一臺服務(wù)器死機,管理員需要首先查到該服務(wù)器所在的位置,然后前往死機服務(wù)器所在的機房(如果一個管理員同時管理異地的幾個機房,則甚至要乘車趕到異地機房),進入充滿幅射的、面積很大的機房,有時可能還要小心繞過機房內(nèi)密密麻麻的線纜,才完成這一簡單的重啟工作。
IDC管理員常常會發(fā)現(xiàn),每天會有將近50%的工作時間浪費在重啟服務(wù)器這種毫無技術(shù)含量,卻又不得不為之的工作上,大大降低管理效率。而萬一工作忙碌不小心遺忘,常常意味著托管用戶憤怒的投訴。
三.IDC的心中之痛
托管用戶的托管服務(wù)器大多數(shù)平時操作都不多,真正需要的管理就是保障服務(wù)正常運行,盡量縮短故障恢復(fù)時間。但大負荷運行的服務(wù)器總有不堪重負的時候,在現(xiàn)有環(huán)境下只能設(shè)法現(xiàn)場重啟,電話聯(lián)系管理員,等候管理員重啟服務(wù)器,這一過程所花費的時間對于用戶自身來說是不可控的,短則10分鐘,長則30分鐘甚至更長,死機故障發(fā)生的不確定性和重啟服務(wù)的質(zhì)量難以保證,使得死機重啟已經(jīng)成為IDC托管用戶最大的心病。
四.解決方案
針對這一現(xiàn)狀,我們推出了NPC電源管理系統(tǒng),使用NPC電源管理系統(tǒng)結(jié)合KVM系統(tǒng)真正實現(xiàn)集中化、數(shù)字化機房管理,通過KVM系統(tǒng)對正常情況下的服務(wù)器進行操作,一旦發(fā)現(xiàn)死機通過NPC電源管理系統(tǒng)重啟服務(wù)器,管理員從此無需進出機房。還可以借助NPCWorks專用集中管理軟件實現(xiàn)監(jiān)控、報警、重啟,大大減輕管理員工作負擔,提高工作效率,縮短故障時間。
1.對于管理員工作的提升
NPC遠程電源集中管理控制解決方案可以將其從之前的簡單、重復(fù)的勞動中解脫出來,具體體現(xiàn)在如下方面:
當接到用戶的投訴電話后,管理員只需直接要在NPC View軟件中加入那臺死機的服務(wù)器,點重啟鍵,即可以立刻實現(xiàn)重啟,從接到電話到重啟完成,時間不超過3分鐘;
在NPC View中加入所要監(jiān)控的服務(wù)器(可以對服務(wù)器進行命名,查找),預(yù)設(shè)自動重啟程序,這樣,當該服務(wù)器死機時,可以進行自動重啟;
讓客戶在終端安裝NPC View軟件,這樣,一旦發(fā)生死機的情況,客戶可自行登陸到自己租用的服務(wù)器上,遠端開、關(guān)、重啟服務(wù)器,這樣更加節(jié)省時間。
2.對IDC運營的提升
在已經(jīng)安裝KVM系統(tǒng)機房安裝NPC電源管理系統(tǒng)對與IDC運營可帶來三大提升:
提升機房檔次,通過NPC電源管理系統(tǒng),可降低85%的機房進出,減少機房進出即帶來能源上的節(jié)省,也為高檔無人值守機房提供注釋,機房安全性提高20%;
可提供三種高附加值增值服務(wù):
快速重啟服務(wù),承諾接到用戶重啟服務(wù)要求后,3分鐘內(nèi)提供重啟服務(wù),服務(wù)器死機恢復(fù)時間縮減60%;
遠程重啟服務(wù),用戶可以根據(jù)需要,自行遠程重啟目標服務(wù)器,使得服務(wù)器死機恢復(fù)時間縮減95%;
自動監(jiān)控服務(wù),可根據(jù)需要對服務(wù)器所運行的服務(wù)進行自動監(jiān)控、報警、重啟,故障發(fā)現(xiàn)機率提高1倍,服務(wù)器死機恢復(fù)時間縮減95%。對于托管用戶這也解決了死機故障恢復(fù)時間長,容易造成重特大故障的頑疾。以上服務(wù)可分類作為增值服務(wù)提供;
提高管理效率。現(xiàn)有機房管理員每天有20-50%的工作時間用于應(yīng)付客戶死機重啟要求,每次重啟響應(yīng)時間平均達10分鐘,而使用NPC電源管理系統(tǒng),每次重啟服務(wù)響應(yīng)時間可降低到1分鐘以內(nèi),管理效率大大提升。
3.投資與回報
NPC電源管理系統(tǒng)可作為機房基礎(chǔ)建設(shè)投入,有著投入低,使用年限長,投資回報率高的特點。實際的投資回報涉及:
每100臺服務(wù)器NPC系統(tǒng)投入僅70萬元(按公開價七折計算),NPC平均安全使用年限為50年,年平均投入1.4萬,加上軟件更新與后期的維護,年均投入最多不超過2萬元;
IDC可針對托管客戶提供快速重啟及遠程重啟的增值服務(wù)??蓪焖僦貑⒎?wù)按每臺服務(wù)器100元/月收費,遠程重啟服務(wù)可按每臺200元/月收費,對自動監(jiān)控服務(wù)這樣的高級功能,可對用戶按400元/月收費,每100臺服務(wù)器平均年收益30萬元;
兩年左右可收回投資,同時可節(jié)省原有的PDU投入,做為一項基礎(chǔ)建設(shè)的固定資產(chǎn)投入,這一收益是非??捎^的;
最重要的一點,與其它的IDC形成服務(wù)上的絕對優(yōu)勢,對于公司的品牌提升與業(yè)內(nèi)口碑的提升起到重要作用。
從根本上來說,IDC的服務(wù)讓用戶最為頭痛的問題就是經(jīng)常性的故障,而這些故障很大程度上是由于服務(wù)器死機引起的。有了KVM系統(tǒng)以及NPC遠程電源解決方案,所有的問題都可以在第一時間內(nèi)得到妥善解決,這才是IDC服務(wù)質(zhì)量提高有效舉措。
4.機房維護方面
機房安全檔次提升。相對其他機房來說,使用了NPC解決方案,意味著更少的機房進出次數(shù),更高一級的安全標準,更穩(wěn)定的空調(diào)恒溫;
節(jié)省能源。每次人員進出都會導(dǎo)致機房溫度的變化,NPC提供降低80%的開關(guān)門空調(diào)能耗;
管理員效率提升。降低了管理員工作量,使得他們有更多時間處理機房其他業(yè)務(wù),在工作流程中重啟服務(wù)所占比重可大大降低,同時對重啟服務(wù)標準可大幅提高。