百度大數據實驗室範偉:如何打造大數據生態圈
時間:2016-03-22 11:39 閱讀:1005 整理:市場調研公司
在日前舉(ju) 行的百度世界大會(hui) 上,百度喊出了近來互聯網界頗為(wei) 流行的“生態”口號。百度的“生態”與(yu) 視頻、手機、電視沒有關(guan) 係,它要建立的是連接3600行的大數據生態圈。
“百度是天然的大數據公司,覆蓋全網6億(yi) 網民,每天響應60億(yi) 次搜索請求,150億(yi) 次定位請求。”百度大數據實驗室副主任範偉(wei) 表示。然而,然而如何在海量信息中準確甄別信息、計算相關(guan) 信息、快速反饋信息,仍是技術研發人員麵臨(lin) 的嚴(yan) 峻考驗。
大數據問診
《21世紀》:百度日前發布了慧醫療、慧城市、慧創業(ye) 三款應用。能否以“慧醫療”為(wei) 例,為(wei) 我們(men) 介紹下,百度采用了哪些技術?大數據又是如何應用的呢?
範偉(wei) :慧醫療其中的一項應用是深度醫療對話機器人,通過語音輸入或在應用界麵輸入文字,用戶可以和機器人進行對話。你輸入自己的疾病症狀,她可以對你的疾病進行分析,並根據你的需求提供建議或幫助。重要的是,當用戶意圖和信息不明確時,深度對話機器人會(hui) 智能的揣摩用戶意圖,引導用戶。在充分理解,用戶需求後,提供用戶需要的信息。
機器人對用戶問題的回答都是以大數據為(wei) 基礎的。網上有兩(liang) 類醫療信息,一類是病人之間的信息共享,一類是醫生之間的信息交流。專(zhuan) 業(ye) 的醫療信息雖然能在網上和醫書(shu) 裏獲取,但內(nei) 容十分有限。比如網上關(guan) 於(yu) 心髒病、糖尿病的信息很多,但是關(guan) 於(yu) 心髒搭橋的信息就很少。這些信息魚龍混雜,重要的是進行信息甄別,對信息的可信度進行分析。可信度分析也是通過數據計算出來,比如有多少人參考了這個(ge) 答案,這個(ge) 人回答過多少問題,他(她)回答問題的所用的詞匯分析等等。核實後的信息會(hui) 整合成一個(ge) 類似的知識庫,每條信息都有個(ge) 0-1間的可信度。用戶提出的問題,都用庫裏的信息作為(wei) 基礎回答。
《21世紀》:提問和回答之間如何做到信息匹配呢?
範偉(wei) :用戶提問的意圖也有很多種,我們(men) 係統裏大概有數十種用戶意圖的分類,比如說你想知道是什麽(me) 病,還是想知道吃什麽(me) 藥,自己怎樣調養(yang) 。但是有時候用戶提問的意圖並不明確,例如“我今天不舒服”。這樣我們(men) 的係統會(hui) 和用戶進一步揣摩、明確意圖,例如問他(她)是想獲得治療信息、疾病知識,還是醫生信息,再提供服務。我們(men) 的意圖模型,利用基於(yu) 深度學習(xi) 的建模,精準率達到了90%多。
《21世紀》:目前市場上移動醫療的應用程序也很多。慧醫療所應用的技術處於(yu) 什麽(me) 水平呢?
範偉(wei) :通過大數據和人工智能等技術實現自然語言問診,問診答複的精準率超過了70%,據我了解我們(men) 是業(ye) 內(nei) 第一家做到這個(ge) 準確率的。我們(men) 機器人會(hui) 確認用戶意圖,當意圖不明確時她會(hui) 揣摩和追問,以保證答案的是用戶需要知道的信息。
《21世紀》:百度大數據實驗室目前的整體(ti) 情況是怎樣的?
範偉(wei) :大數據實驗室成立於(yu) 去年4月,關(guan) 注大規模機器學習(xi) 算法和應用、大數據預測分析和垂直行業(ye) 應用探索、帶結構大數據的算法研究、智能係統的研究等方向。實驗室分為(wei) 北京和美國矽穀兩(liang) 個(ge) 分部。實驗室采用承諾承包製,你選擇的項目你負責。我負責關(guan) 鍵架構,關(guan) 鍵技術攻關(guan) 和方向性的問題,路不能走錯。我們(men) 的大規模機器學習(xi) 算法、深度學習(xi) 技術、人機對話技術在業(ye) 界都處於(yu) 領先水平。
方興(xing) 未艾
《21世紀》:國內(nei) 大數據產(chan) 業(ye) 方興(xing) 未艾,國務院不久前也印發了《大數據發展行動綱要》。你如何看國內(nei) 大數據產(chan) 業(ye) 的發展?
範偉(wei) :從(cong) 創業(ye) 者角度講,你要了解用戶需求,解決(jue) 用戶的痛點,才能能帶動產(chan) 業(ye) 、解決(jue) 就業(ye) ,還能把很多技術出口到國外去。我們(men) 實驗室的大規模機器學習(xi) 算法、搜索技術、圖像識別、深度學習(xi) 等都是世界級水平的。
美國在很多方麵迭代比較慢,因為(wei) 它是已經發展的比較成熟了,歐洲公司也比較慢。但我覺得百度迭代非常非常快。現在很多新概念都是在中國、在以色列等地區出現的。這是思維比較活躍的國家。
國內(nei) 大數據產(chan) 業(ye) 很火,有些是真的,有些是忽悠。要看大數據技術應用之後能否實現對現有模式的改變,能改變多少,這些改變是否有幫助。
《21世紀》:你理想中未來的數據生活是怎樣的?
範偉(wei) :手機真正成為(wei) 你的生活秘書(shu) 。比如今天我加班晚了,通過定位信息等和手環的健康信息檢測,手機能知道我沒吃飯,會(hui) 主動推送說,“要不要點個(ge) 外賣?”我去葡萄牙出差,手機知道我平時喜歡跑步,會(hui) 推送給我當地最適合跑步的地方。這種智能化服務會(hui) 讓用戶覺得生活質量都提高了。你能專(zhuan) 注於(yu) 你喜歡的事情,這是我期待看到的。
《21世紀》:你描述的場景應該如何去努力實現呢?
範偉(wei) :定位信息、健康數據檢測、地圖位置信息等,這些在技術上都不難。但這些靠一家公司無法完成,需要多個(ge) 企業(ye) 、部門進行合作,打破一些壁壘,包括政策性的壁壘和行業(ye) 間的壁壘,這樣1+1的效果就大於(yu) 2。我希望我們(men) 的技術不僅(jin) 僅(jin) 是服務於(yu) 某家公司,而是服務360行,帶動整個(ge) 社會(hui) 進步。

關(guan) 注公眾(zhong) 號
獲取更多行業(ye) 資訊
本站文章內容以及所涉數據、圖片等資料來源於網絡,轉載目的在於傳遞更多信息。版權歸作者所有,文章僅代表作者觀點,不代表公海赌赌船官网jc710立場。 如涉及侵權,請聯係管理員刪除。在法律許可的範圍內,公海赌赌船官网jc710(廣州)數據科技股份有限公司享有最終解釋權。