
主講
企業大數據與隱私保護
各位下午好。這個論壇超出我來之前的想像。貴陽市、貴州省對大數據的重視程度很令人敬佩。大家對聯想的認識可能還停留在筆記本電腦、臺式機的階段。但是聯想在過去幾年里已經通過企業的并購或自己的發展在云計算服務方面,包括企業的硬件設備、IBM的X86服務器已經成為聯想的一部分。聯想公司本身也是全球性的大公司,它在全球160多個國家有業務,每年完成的總業務量是420億美元。這樣一個大公司,必定會產生很多的大數據,來看一下,聯想對這一塊有什么看法,又是怎么做的?未來希望有一些成功的案例或者方案分享給業界的其他企業。今天我要講的主題是:企業大數據和隱私保護。為什么要考慮企業大數據?因為剛才講的很多是政府或者其他方面,但其實企業未來大數據成功與否、企業能不能利用好大數據起到很大作用,因為企業是產生經濟價值、經濟活動的本體。如果看IDC的預測,到2020年,主要的IT的成長都是跟移動互聯網、大數據、云計算有關,而如果看一下右邊的圖,它的互聯網,包括社會媒體,基礎其實也就是云和大數據,所以大數據在未來,到2020年的整個成長里面,起到一個很關鍵性的作用。
再來看國內,2014年,大家對移動互聯網或者互聯網+等不同的概念已經有很多實際的認識,比如大家用微信、滴滴打車,最重要的還是要看到移動互聯網里面的三個要素:互動、連接、傳播,但這三個其實都離不開數據在背后的支持。因為如果沒有數據,沒辦法進行互動;如果沒有數據連接,就沒有辦法做互動。要把圖片、視頻從一個地方傳到另一個地方,也需要大量數據。所以,大數據和云計算必然成為這里面的關鍵技術。這個定義就不去說了,我想講一下,大數據從哪里來?大數據來源于三個方面:
第一,所謂的企業的傳統數據,比如CRM、ERP、網店交易,或者一些財務的數據的量也在不斷成長。比如網店交易的事情,之前相對比較少,現在越來越多。
第二,數據源就是機器和傳感器所產生的,之前大家講得比較多的IOT或者物聯網。在過去的物聯網講的是工業的物聯網,最近又開始炒智能家庭,所以說這一塊包括智能電表,或者家里的一些設備的數據的產生,會對數據量產生極大的沖擊,也會把量的提升到在網頁上完全不同的層面。比如在社交媒體上做的一些評論也是大數據的來源之一。大數據和傳統的企業數據結合以后,可以提高企業的效率,同時,企業對外界也會產生更好的認識。如果要做一個智能的醫療的話,這個時候對用戶會產生很大的價值,這里面需要采集很多用戶本身的一些體征的數據,而且這些數據不是一天采一次,可能一天采多次,這樣就避免了在醫療方面現在所碰到的人多醫生少,或者一些慢性病的護理會產生各種各樣的問題。第二就是生產的廠家現在把很多的傳感器已經放到設備里面。比如汽車,汽車里面有很多傳感器,通用汽車就把一個服務放到車里面,像沃爾沃也有相應的汽車傳感器,起什么作用?起的作用就是當你開到一個人生地不熟的地方,汽車突然熄火了,它馬上就可以把位置定出來,而不需要手機。它是通過衛星進行定位,同時可以對汽車的工作狀況進行實時的采集,這樣就知道發動機、一些重要部件會不會產生問題,可以在設計上進行改善或者提供相應的服務。
第三,商家可能會對新來的客戶特別感興趣,但是怎么樣獲取客戶要做很多工作。有一個方法就是通過實時的視頻的分析,能夠知道對每一個進到店里面的客戶到底來到店里以后干了什么事情,比如看了產品就走了。這樣的話,對這個客戶的認識遠遠超過之前每一個進來就走掉的客戶,但這也需要對視頻進行采集,對大數據進行分析,最后對這個用戶進行畫像等等。理解客戶,比如客戶在社交媒體上發表了一些言論,在線上發了一個貼,或者買了某一個東西,這樣對于未來做的一些市場活動可以更加地精準。這些思想可以對企業產生一定的價值,不管是對設備、提供的一些服務,對客戶的理解,企業都會對大數據產生一些興趣。
如果企業要做大數據,有些什么樣的工作要做?第一,要獲取數據。獲取的數據有一些是從網上來的,有一些是從設備上采來的,還有一些是從第三方。論壇的主題是做數據的交易,數據交易以后企業的很多數據可能都是從第三方抓取過來的或者買來,這樣,數據能從第三方源源不斷地到我們這邊來。第二,做數據的規整和處理。像Hadoop今后可能都會做一個平臺級的服務,對數據進行處理。還會對數據進行分析,像剛才提到的學習,還有其他的工具,可以在規整數據之后,對它進行分析,然后產生各種各樣的數據的價值。對一些網上的評論可以進行分析,用戶可以畫像,如果要關心供應鏈庫存怎么樣,也可以進行跟蹤和優化,聯想也在形成這樣的平臺。下面專門提幾個聯想已經應用的幾個案例。
第一,聯想是全球性的公司,在世界各地有多個數據中心。員工在世界各地都有,所以很關心每一個數據中心需要多少帶寬,它的performance怎么樣,會不會太慢?慢了以后是不是要增加帶寬?這樣做的直接影響就是費用,如果增加帶寬費用就會上去,都是以百萬美元來計成本。相當于我們給聯想的IT部門做了IT數據的可視化,然后對它進行分析,大數據的分析,因為來的數據幾科是實時的。有一個統一的IT的面板,每一個站點里面的應用和用戶會對它進行分析。第三,對應用本身進行監測。就看每一個應用是被哪些用戶用,在哪些時間點用,在每一個周期是怎么樣的,里面有沒有可以找到的規則,對它將來準備一些更多的設備或者做數據中心的調整都會有很大的作用。這個在聯想的IT系統里面已經實施。
聯想作為一個電腦、手機廠商,十分關注用戶對聯想的設備到底是什么樣的評論。大家可能覺得聯想是一個比較傳統的IT企業,對用戶可能關注度不夠。現在聯想每天都從微博和每一個國內的大的電商的網站把所有跟聯想相關的數據全部采回來,采回來之后對它進行自然語言的處理,用處理的方式和其他的一些分析的工具對它進行很深入的了解。對聯想每一個產品的功能、用戶對聯想的打分、評論是正面的還是負面的、提出的建議幾乎是實時的跟蹤,這些內容直接反饋到聯想產品的指控部門和市場部。你們看到的這些頁面就是聯想內部的經理人看到的。看到這些以后,大家可能就會有疑問,回到我主題里面的另外一個——隱私的問題。很多數據已經在網上存在了,只要是有心人就可以采到很多數據。問題在于會不會侵犯隱私問題。在1890年的時候,哈佛的法學評論上已經對個人隱私有一個定義,它的定義是:一個自然人自身所享有的、與公眾利益無關的而且不想讓公眾知道的信息。如果你看了這個,你就會知道每天在網上,不管是瀏覽網站、上微信、上QQ,或者任何一個社交媒體,你的蛛絲馬跡都可以被一些有心人抓到。一些比較惡意的wifi、熱點,采集到你的銀行數據以后,直接偷盜你的銀行信息,導致經濟上的損失。
我們要看一個比較重要的問題,怎樣把隱私進行很好地保護?保護從多層面看需要一個完整的體系,包含法律、技術,還有政府部門的監管。并不是中國的隱私大家不關心,而是大家不知道怎樣來跟蹤一個法律。雖然國內有各種各樣的法律和條例對于隱私進行關注,像消費者法或者其他的法律,但是沒有完整的、關于個人隱私方面的法律。這樣就導致了一些漏洞,被一些不法廠商或者無底線的廠商做了一些不應該做的事情,受害者就是消費者個人。國家現在也在做一些事情,通過行業的自律和一些相關的法律進行威懾,技術層面可以加密,可以做安全的論證,訪問權的控制,云計算可信技術的結合來保證在云上的數據的安全。最近工信部做了可信輿論證,聯想的云計算整個的技術也通過了這樣的論證。一個企業要對隱私管理好,Forrester提出構建隱私管理的5個步驟,大家可以作為個參考。
第一,定義數據隱私范疇。企業需要根據其業務范圍,了解相應國家、地域的相關法律條文,對不同的數據類型進行有效保護。
第二,明確企業角色和責任。企業常把隱私保護誤解成數據安全而讓技術專家提出方案。其實,應該有隱私專家以保證各方面合規。
第三,建立法規與業務要求之間的映射。隱私管理需將各項標準、法規轉化成為實際業務中的要求。在特殊情況下需借助外部法律援助。
第四,讓隱私保護成為企業文化。隱私保護必須成為企業文化,認識到當前缺陷,制定計劃進行糾正,再以政策與流程加以落實。
第五,跟上變化步驟。需要應對法規條例不斷變化。目前,對政府與企業而言,隱私保護都處于一個不斷完善的過程之中。
作為總結跟大家說一下,跟大會的主題也比較切題,大數據會帶來一些十分令人興奮的變化。第一,在技術架構上,大家談到最多的就是Hadoop在我們自己用的過程中已經遠遠不能跟上業務所要求的。我們之前所產生的數據的結果是每周能夠產生一次報表,后來到業務部門去以后,至少每天一次,現在更多的業務部門開始用以后,要每一刻鐘或者十分鐘就要一個。這樣的情況下,原來的架構遠遠不能跟上需求。就要考慮實時運算、實時反映市場的變化,這樣作出反映會比較快。比如有人發了微博,最好在十分鐘、五分鐘之內反饋回去,而不是一天或者七天以后再反饋,這樣完全不能讓客戶滿意。第二,私密性和安全變得越來越重要。第三,所謂的洞察,數據來源實際上是從各個不同的地方來,不會從一個地方來。我剛才提到企業的數據有三大來源,如果仔細想,可能還不止三個。一定要找到一個辦法,能夠把不同來源的數據進行很好地整合,能夠對某一種事件或者某一方面的認識有一個完整的方向,而不是單向的或者單方面的。
大家對手機應用、智能設備用得很多,未來因為大數據,這些應用和設備會變得越來越智能,有些智能到可能無法想象,可能替你做一些預測,給你一些建議,而這些建議、預測可能正是你想要的,為什么能做到這樣?是因為它已經理解了用戶的習慣,它所給出的推薦是你所想要的,這是更聰明的應用。另外就是基于IT的一些大數據的洞察,還有數據的服務。之前講到很多大數據是針對大客戶、大企業。對于一些小企業也有大數據的服務,但是小企業的問題在于沒有這樣的技術能力和財力進行大數據的采集和大數據的分析。所以這個時候提供所謂大數據云這個概念,讓小企業或者中型企業也可以享用大數據的好處。最后,真正的智能還是要對自我學習,這個已經發生或者發生了很多,而且未來會做得更多。我的演講就到這里,謝謝各位。