如何防范數(shù)據(jù)在“云”中化為烏有
我們越來越習慣于依賴Web服務,并將這視為理所當然的事情。這其中的關鍵在于,我們很多人都理所當然地認為,我們上傳的數(shù)據(jù),比如今天拍攝的圖片存放在某個網(wǎng)站上,或是我們寫的博客文章等,明天依然會在網(wǎng)絡上。這種假設在很大程度上是因為我們假設這些服務明天依然會存在。
這些網(wǎng)站今天能夠正常訪問,但是明天就有可能消失得無影無蹤了。在過去幾年里,我們看到了許許多多這樣的例子。比如,老牌社交網(wǎng)站Friendster和GeoCities。前者在今年五月份為了重新設計網(wǎng)站刪除了用戶數(shù)據(jù),而后者在2009年就關張了。
換句話說,沒有任何事物是永恒的。我們托管數(shù)據(jù)的Web服務也會消失。在出現(xiàn)這種情況時,你需要有一個防范計劃。在下面,我們將看一些案例,這些案例包括用戶數(shù)據(jù)在哪個環(huán)節(jié)被遺失或有遺失風險,企業(yè)(和他們的用戶)如何應對這種情況,以及采取什么措施來保護信息安全。
最終關閉的Web服務
很遺憾,我們已經(jīng)看到了許多關于Web服務被關閉、出售或遺失數(shù)據(jù)的案例。
MySpace
MySpace曾經(jīng)一度是人氣值頗高的社交網(wǎng)絡,但是在Facebook崛起的沖擊下變得黯然失色。MySpace的緩慢死去和不成功的重生,提出了一些關于現(xiàn)有用戶數(shù)據(jù)將怎么處理,是否應該找出一個簡單的辦法導出這些信息的問題。
2008年,MySpace推出了一種被稱為“數(shù)據(jù)遷移創(chuàng)新”的功能。但是這一功能并不是為了將數(shù)據(jù)從MySpace中導出,也無法自動導入其他網(wǎng)站,讓用戶繼續(xù)使用聯(lián)系人信息。更糟糕的是,在MySpace的服務條款中,開發(fā)者明令禁止創(chuàng)建可將用戶信息導出并用于其他服務的應用。但是這并沒能阻止人們創(chuàng)建專挖MySpace墻角的工具,如Make Data Make Sense的博客導出工具。
Google視頻
在谷歌于2006年收購了YouTube這后,Google視頻就變得多余了。2009年,谷歌關閉了Google視頻的上傳新視頻功能,但用戶的強烈抗議使得谷歌最終沒有徹底關閉所有服務,Google視頻上的所有視頻仍然能夠手動歸檔。那些付費使用、下載并擁有/租用所查找到的項目的用戶仍然能夠訪問他們以前購買的內(nèi)容,那些在系統(tǒng)中還擁有大量資費的用戶可以將他們的費用轉到Google Checkout服務上(后來,谷歌宣布他們還將提供信用卡退款服務。2011年4月,谷歌宣布Google視頻上的內(nèi)容可以無限期保留,直至所有的剩余視頻全部轉移到YouTube上)。與其他被關閉的Web服務一樣,問題不僅僅是上面的內(nèi)容,同時還涉及到用戶對該網(wǎng)站的投入。
Sidekick
2009年10月,由于存儲著用戶電子郵件、聯(lián)系人信息等個人數(shù)據(jù)的服務器故障,導致大約80萬名擁有Sidekick手機的T-Mobile用戶的數(shù)據(jù)全部丟失。最初的報道稱,這些數(shù)據(jù)被永遠地丟失了,但是后來大部分數(shù)據(jù)還是被恢復了。這并不代表T-Mobile和微軟(負責管理儲存著Sidekick數(shù)據(jù)的服務器)受到的影響就小一些。更糟糕的是,除了與電腦同步的數(shù)據(jù)外,用戶短期內(nèi)根本無法恢復他們的數(shù)據(jù)。
Sidekick的數(shù)據(jù)服務一直中斷到了2011年5月31日。微軟在一份聲明中稱,T-Mobile在myT-Mobile.com上發(fā)布了一款增強型Web工具,可以輕松地將他們的個人數(shù)據(jù),包括聯(lián)系人、照片、日程表、備注、日歷和瀏覽器書簽等從危險的服務中導出至新設備、電腦或指定的電子郵件賬戶上。如果他們在數(shù)據(jù)中斷的早期提供了一些如此方便的工具,或是作為一種例行方式,允許Sidekick用戶存儲他們?nèi)繑?shù)據(jù),那么上面那一幕悲劇可能就不會發(fā)生。
博客和Web托管服務。由于博客和免費網(wǎng)站如今已經(jīng)成為了用后即扔的服務,那么這些服務大批死亡就一點也不驚奇了。GeoCities曾經(jīng)是Web早期商業(yè)活動中的佼佼者,該服務在2009年被關閉讓大量網(wǎng)民感到非常遺憾。雖然雅虎基本上沒有采取什么措施以維持這一網(wǎng)站,但是大量第三方卻在努力挽救GeoCities上的數(shù)據(jù)。與此同時,Windows Live Spaces也在2011年3月關閉了服務,不過用戶可以選擇將他們的數(shù)據(jù)遷移至WordPress上。今年5月24日,雅虎的MyBlogLog也被關閉。這次提供了一個如何將數(shù)據(jù)遷出MyBlogLog的教程。
Lala.com
對于Lala.com的用戶來說,他們面對的問題非常復雜。Lala.com在線音樂服務讓用戶可以較低的價格購買流媒體音樂,其在2009年12月被蘋果收購。用戶在Lala.com里的資金可以轉到iTunes,但是他們以前所購買的流媒體音樂將永遠消失。也就是說,目前沒有任何規(guī)定允許將購買的流媒體音樂進行合法的MP3下載。
Lala.com的命運帶來了一個問題。那就是有多少媒體服務提供的是“租借”而不是“購買”模式,用戶在什么情況下才能感覺到這些數(shù)據(jù)是他們自己的?用戶又在多大程度上愿意花錢訪問那些只能持續(xù)一晚上的東西?
這些問題已經(jīng)有了答案,已不再是問題了,因為它們涉及到用戶消費性服務特征的概念性改變,并且深受公司名聲的影響。比如,幾乎沒有人認為亞馬遜會停止服務,因此在購買Kindle電子書時就和購買年輕的歌星出的流媒體音樂一樣不需要猶豫。 #p#
數(shù)據(jù)能否遷移至關重要
如果你正在決定是否使用特殊的Web服務,那么它們可以幫助你搞清楚數(shù)據(jù)是如何被處理的,以及這一服務能夠提供一些挽救數(shù)據(jù)或是將信息轉移至線下的辦法。以下特征需要關注。
數(shù)據(jù)應使用便于下載的開放格式。網(wǎng)站或服務用心保護用戶數(shù)據(jù)的一個最佳證據(jù)是用戶能夠通過服務備份他們的數(shù)據(jù)。如果沒有用于下載數(shù)據(jù)備份的末端工具,那么你可能被迫要手動下載這些數(shù)據(jù)了,因此任何可以避免讓你遇到這種麻煩的東西都值得關注。比如類似維基百科的Wikia.com允許你保存整個維基或個別頁面為純文本文件,用于歸檔或下線編輯。
有意思的是,谷歌正在向這一領域大舉進軍,他們最近開始測試他們的Google+社交網(wǎng)絡。其增加的功能允許通過谷歌Checkout導出(聯(lián)系人、圈內(nèi)朋友等)個人數(shù)據(jù)。實際測試結果是在將數(shù)據(jù)轉移至其他服務時這一功能非常有用。
由服務或第三方提供的數(shù)據(jù)工具。如果不能通過服務的Web界面直接訪問數(shù)據(jù),那么就要有能夠通過服務的API為你提供數(shù)據(jù)的應用。你可能必須要獨立地做一些程序設計以利用這些API。不過在做這些之前,可以先四處找一找,說不定其他人已經(jīng)做好了這些工作,這些結果都可以免費使用。
Forrester首席分析師Andrew Reichman稱,用戶應當審視所使用的任何服務,即使服務提供商已經(jīng)公布了他們的退出策略。換句話說,對于任何數(shù)據(jù)遷移性的聲明都要持謹慎態(tài)度。他說:“即便在數(shù)據(jù)交換標準下,你依然會受到代表管理員或公司運營設備策略的支配。”
服務條款。如今幾乎所有的服務都有服務條款,基本上涵蓋了所有可以想到的服務功能。Reichman稱:“仔細閱讀服務等級協(xié)議、合同,以及違約時的處罰措施非常關鍵。在選擇服務提供商前,最重要的一個步驟是制訂退出策略,或是討論一下萬一用戶希望退訂服務或是提供商取消服務后應當如何處理。”在服務條款中越是很少詳細提及,你就越應當謹慎。
Yankee集團分析師George Hamilton非常認同這一觀點。他說:“在這里要提醒買方的是,要清楚服務提供商是如何保護存儲的數(shù)據(jù)或使用中的數(shù)據(jù),以及知道這些數(shù)據(jù)是如何備份的。”
服務之間要能夠展開競爭:要讓用戶更為自由地遷移他們的數(shù)據(jù),即便用戶的判斷錯了也要讓用戶能夠?qū)⑺麄兊臄?shù)據(jù)遷移走。Hamilton稱:“提供商在出售他們的服務時不應當通過技術手段將用戶‘套牢’在他們的服務中。”他強調(diào)行業(yè)的大趨勢是朝著可以讓數(shù)據(jù)相互遷移的開放標準發(fā)展。
關注各種危險苗頭
如果一個服務正在被關閉,服務商可能會通知用戶嗎?很多時候提前發(fā)現(xiàn)一些事件的苗頭的最佳地方并不在服務商本身。
ArchiveTeam網(wǎng)站列出了一份有關閉風險或正在死亡的網(wǎng)站名單。如果你正在使用名單中的某個網(wǎng)站,那么你最好考慮一個將你的數(shù)據(jù)轉移到別處,至少要將這些數(shù)據(jù)在其他可靠的地方進行備份的方案。
Reichman建議關注一下服務提供商公布的一系列數(shù)據(jù)。他說:“你無法發(fā)現(xiàn)潛在的提供商是否有財務問題,但是你可以通過調(diào)查提供商公布的一系列財務數(shù)據(jù)發(fā)現(xiàn)一些問題。如果可能的話還要找一下有關這家提供商的歷史資料和相關的新聞報道。即將被收購或被剝離、裁員或是進行戰(zhàn)略調(diào)整的傳言都是可能陷入麻煩的苗頭。”
Reichman和Hamilton均表示,找到預警信息的機率并不大,即便是財務方面的預警信息也是一樣。Hamilton稱:“遇到財務麻煩的公司通常都不會提前透露這種麻煩。你需要有前瞻性。如果他們是一家上市公司,你可以查看他們的財報。如果不是,那么你應當關注他們是否有什么新聞。如果你對他們的生存能力表示懷疑,那就首先不要選他們。”
如果工作需要或是壓力迫使你進行選擇,那么你很難對一個特殊的服務說不,尤其是在沒有選擇時。比如,雖然Facebook缺乏數(shù)據(jù)遷移性并且存在隱私問題,但是在一段時期內(nèi),我們很難放棄Facebook——每個人都在使用它。如今,F(xiàn)acebook的統(tǒng)治地位可能會被Google+的出現(xiàn)和LinkedIn的成功所打破。
其他的預警信息還有:
服務質(zhì)量下降。對于一個正在緩慢崩潰的服務來說,其服務中斷和性能問題會越來越多,Hamilton認為,這是一個非常明顯的信號。他稱:“一種服務一般不會對投訴電話和電子郵件做出回應。”
第三方支持減少。擁有API的網(wǎng)站通常都會發(fā)展出一種第三方應用文化——如圖片托管網(wǎng)站的圖像上傳應用,或是直接與服務整合在一起的應用。如果這類應用研發(fā)數(shù)量出現(xiàn)下降,那么這表明或者該服務商正在想方設法拓展用戶基礎。而如果發(fā)展速度放緩并不是因為市場飽和,而是因為優(yōu)秀程序員的出走,那這絕對不是一個壞兆頭。
服務條款出現(xiàn)調(diào)整或武斷行為。許多用戶放棄某一個Web服務的背后原因并不是因為這一服務面臨生存威脅,而是因為服務商所做的一些事情。一個最常見的原因就是更改服務條款,這一舉動會引起許多用戶的不滿。這一舉動毫無意義,因為服務條款本身就充斥著許多費話。除非詳細解釋,否則任何改動的含義都不明確。如DropBox條款中寫到,如果政府提出要求,他們會把存儲的文件交給政府——這迫使公司增加了對后果的解釋,“你的數(shù)據(jù)仍然歸你所有,他們不會打亂這些數(shù)據(jù),除非他們別無選擇。”(換句話說就是“除了運營服務所需要的有限權力外,這些條款不授予我們?nèi)魏斡嘘P你的數(shù)據(jù)或知識財產(chǎn)的權力”)
不同的人對于相同的事物容忍度不盡相同。因此那些激怒你的鄰居的事情可能并不會激怒你。但是如果你聽說你所使用的服務發(fā)生了這種事情,那就要留意了。此外,任何時候被要求重新確認服務條款,請仔細閱讀其中被修改過的地方。 #p#
閱讀服務條款
服務條款是任何服務中的一部分,你不應忽視它。因為它準確地描述出了能夠用你的數(shù)據(jù)做什么,不能做什么。服務條款過于晦澀,將關鍵點隱藏在多個條款中沒有任何益處。以下是經(jīng)常出現(xiàn)在網(wǎng)站服務條款中的幾個重要條款,它們會影響到我們的數(shù)據(jù)遷移。
關于第三方程序的規(guī)定。許多網(wǎng)站明令禁止使用未經(jīng)認證的、用于下載或收集網(wǎng)站數(shù)據(jù)的應用,違者將中止服務。如果你離開其服務,這種威脅沒有什么意義,但是如果你只是想通過這種程序定期備份一下你的數(shù)據(jù),那么這一條款將會帶來麻煩。這些規(guī)定常常代表著服務商對于數(shù)據(jù)遷移性的立場。他們可能不會出面阻止你從服務中導出數(shù)據(jù),但是他們可能會增加這種條款為數(shù)據(jù)遷移制造障礙。
許多這方面的規(guī)定都含糊不清。如雅虎服務條款第6段J項規(guī)定,禁止“在連接至雅虎服務時不遵守要求、程序、政策或網(wǎng)絡規(guī)定,包括使用任何設備、軟件或程序繞開我們的排除列表,”這讓人很自然地認為包括了Web下載或其他類似應用。在大多數(shù)時間里,他們很難判別是否在使用這種應用,除非許多人開始使用這種應用,個人用戶賬戶內(nèi)的大量信息被下載時,服務商會試圖探測這類工具并采取措施封殺它們。
忽視服務條款中關于第三方應用規(guī)定的用戶將使自己置于風險之中。Hamilton稱:“從法律角度上說,你正在違反服務條款或是違反版權法。如果網(wǎng)絡下載工具經(jīng)常在一個網(wǎng)站上使用,它們將會導致一些性能問題,或變成拒絕服務攻擊。”
重新使用你的內(nèi)容。一些網(wǎng)站的服務條款允許將你貼在自己賬戶內(nèi)的東西可以在其他內(nèi)容中重新顯示。如果你看到這種條款不要驚慌,請仔細閱讀它們。該條款的存在主要是為了讓你貼的東西出現(xiàn)在宣傳資料上,比如在網(wǎng)站首頁上被循環(huán)展示或是僅僅是為了進行內(nèi)部管理。
比如,谷歌的服務條款在第11.1條中規(guī)定:“您保有在服務上或透過服務提交、張貼或展示的內(nèi)容中已持有的著作權及任何其他權利。通過提交、張貼或展示內(nèi)容,您給予谷歌一項永久性的、不可撤銷的、世界各地的、免交使用費的及非排他性的許可,以復制、改編、修改、翻譯、發(fā)布、公開實施、公開展示及分發(fā)您在服務上或通過服務提交、張貼或展示的任何內(nèi)容。此項許可僅以使谷歌可以展示、分發(fā)及宣傳服務為目的,并可按某些服務的附加條款就該等服務撤銷此項許可。”許多服務中都保留了相似的條款。
現(xiàn)實/現(xiàn)有。這也一個包羅萬象的條款,它的實際意思是,服務沒有特定義務提供連續(xù)的運行時間,以保護你的數(shù)據(jù)的完整性或是讓服務處于激活狀態(tài)。
隨意中止。最后,一些服務條款中還有一個允許他們能夠隨意中止你的賬戶的條款。如果你看到了這種條款請不要感到吃驚,這是指他們踢走那些不守規(guī)定或是消耗了大量服務資源的用戶的擋箭牌。在大多數(shù)時間,你不需要擔心有這種情況,但是如果你使用了非認證的工具擷取數(shù)據(jù)或為你的數(shù)據(jù)建立鏡像,那么他們可能會根據(jù)這一條款將你踢走。谷歌在其服務條款第4.3條中寫入了這一條,雅虎則在其服務條款的第15節(jié)中寫入了這一條。在這兩個案例中,這一條款還可讓服務提供商根本不需要給出任何理由就關閉他們的服務。#p#
制訂退出策略
如果你對所使用的服務并未感到不安,但仍然想制訂一個退出策略的話,那么以下一些要點將對你所幫助。
將所有的東西在本地留下備份十分關鍵。完全值得信任的存儲是你自己的物理存儲,因此確保所有的重要東西在本地都有備份。如果你總是很放心地將所有的東西都放在網(wǎng)站上,那么現(xiàn)在就要改掉這個習慣。Web服務應當被視為復制器,而不是儲藏室。
例如,不要因為信任遠程服務而將你的照片放在其中,因為服務的數(shù)據(jù)保留規(guī)定可能并不符合你的利益。最流行的圖片托管服務Flickr不允許你訪問上傳照片的原始拷貝,除非你是付費賬戶。雖然Flump或FlickrEdit等工具可能無法幫助你挽救那些不允許公眾訪問的照片,但是它們可以幫助你從流媒體中提取照片。
另一方面,許多Gmail用戶對他們將全部郵件存儲在谷歌服務器上的行為并沒有什么不安。由于Gmail可以通過POP3 和 IMAP方式連接,因此很容易將郵件保存在本地。用戶很容易養(yǎng)成信任Gmail,將郵件存儲在上面的習慣——這一習慣至少會持續(xù)到下一次網(wǎng)絡大癱瘓或谷歌云計算故障時。
將服務商的數(shù)據(jù)備份在本地。如果網(wǎng)站允許你將你的數(shù)據(jù)備份在本地,那一定要這么做。按步驟將數(shù)據(jù)備份在本地,看一下整個過程的復雜性——如操作中要涉及多少個步驟,以及是否需要第三方工具等。
需要注意的是,操作過程可能會在事先沒有提示的情況下發(fā)生變化,所以你應當經(jīng)常性的或是在得知服務操作發(fā)生變化時充分檢查一下操作程序。
關注引入或去除了哪些第三方應用。如果你依靠第三方應用來幫助你備份數(shù)據(jù),那么你應當注意這些應用變動很頻繁。你六個月前下載的應用就有可能已經(jīng)被服務提供商所封殺,或是被替代,或是出現(xiàn)了新的或更高級的替代品。換句話說就是要經(jīng)常關注更新并檢查你的備份機制,確保它們能夠正常工作。
最終的底線
大多數(shù)人對于Web服務與生俱來的最終關閉似乎并沒有太多的考慮,僅僅是因為它們提供了豐厚的回報。最終關閉目前已經(jīng)成為越來越不確定的問題因素,而這又是這類服務所共同面對的問題。
Web服務的經(jīng)歷告訴我們,任何網(wǎng)站都會消失,只要時間跨度夠長。即便有這樣的問題,大多數(shù)Web服務幾乎都沒有提供可以讓用戶輕松導出數(shù)據(jù)以離開該服務的工具。既然留住這些用戶可以讓服務商獲得更大的既得利益,那么為什么不設置障礙呢?讓用戶能夠輕松切換至其他競爭者那里,將會損害他們的利益。
另一方面,那些提供了數(shù)據(jù)導出工具的服務商將會獲得其他方面的優(yōu)勢:那就是用戶對他們的信任,這是其他競爭者所沒有的。信任是Web世界中的貨幣,其價值就如同美元一樣。任何Web服務要想獲得長期利潤就應當提供這類工具。