微軟小冰的開發團隊負責人李笛說,小冰為什么會這么回答,開發團隊其實也無從得知。“從研發開始到現在兩年多的時間,小冰作為一個人工智能平臺,已經在技術、產品、數據三者之間形成了一個正循環。也就是說,小冰積累的大數據已經足夠多到能夠讓小冰實現進化。”
隨著物聯網和智能設備的發展,人類社會正在快速進入人工智能社會的初期。想象一下,未來不久的家庭里將出現智能眼鏡、智能手表、智能音箱、智能電視機、智能冰箱、智能燃氣表、智能玩具、智能植物等無數的智能設備,人們無法再通過一個個的APP與這些智能設備溝通,就必須出現一個超級硬件和超級APP來控制和管理所有的智能設備。
(上圖:電影《HER》里,作家西奧多在結束了一段令碎的愛情長跑后,愛上了電腦操作系統里的女聲,一個叫“薩曼莎”的姑娘。)
在信息輸入環節,小冰需要解決文字、語音、圖片和視頻等信息的識別、分析與理解。這幾個領域一直都是計算科學中最的挑戰。雖然在科幻電影中的人工智能機器人能夠輕易地識別文字、語音、圖片和視頻,但在現實生活中要計算機識別這幾類信息,可以說難如登天。
沈向洋曾指出,小冰對微軟公司來說是人工智能領域的核心產品,因為它代表的是接下來即將發生的激動的事。今后,設備和系統將越來越了解用戶,人工智能則會成為跨越系統平臺的底層服務。無論基于何種設備,人工智能都能通過長期的學習和互動,了解到用戶的行為模式與個性喜好,并以更自然的方式實現人機交互。
在輸出環節,小冰大量學習人類的表達方式,從中識別出帶有不同情感色彩的表達方式,再結合不同對話的上下文語境,以個性化的語言方式表達出來。微軟小冰的第一個版本,就包括了1500萬個這樣的場景,目前更超過了3000萬個場景。相比于“你家在天津嗎?”小冰會說“你家天津哪的?”這從一個側面反應了小冰能夠模仿不同人、不同語言、不同文化的表達方式。
在認知計算取得突破性進展的基礎上,情感計算才有可能邁出從“0”到“1”的一步。顯然,情感的表達遠非“0”或“1”那么簡單,就像人類的愛情絕非對與錯那樣絕對。如何讓機器理解人類的情感,又如何把情感與知識進一步結合,發展出全新的計算架構?情感計算前進之更加,直到“小冰”的出現。
深度卷積神經網絡、LightLDA主題詞機器學習算法、分布式詞向量模型等僅僅是小冰算法集中的冰山一角。
根據胡睿的介紹,小冰有一個頂層動態決策算法系統,由一系列算法組成。該系統能根據交流對手的情況,實時、動態、個性化地進行信息的篩選、分析、關聯和決策,獲得關鍵性基本主題要點后(如:“天津”、“大火”),再輔助歷史數據學習訓練而得的情感模型,最后以個性化的情感方式表達出來——“你家是天津哪的?”當然,小冰的算法系統和決策過程要遠比這個過程復雜許多。
【更多精彩內容 盡在《云科技時代》微信 微信號:CloudTechTime】
在決策環節,小冰采用了多種聯合決策機制,以實現帶有情感的高效機器決策。這其中采用了分布式詞向量訓練模型算法,更好地計算兩個詞之間的“情感距離”,以關系的“遠近”幫助小冰更好地決策。詞向量模型通過挖掘文本數據,為每一個詞訓練出上千個相關指標(維度),而帶有上千個維度的一個詞即為一個詞向量,再通過數學方式計算兩個詞向量之間的“距離”,就可以有效地表示兩個詞之間的語義相關度。這就是為什么小冰往往能說出貌似不相關但其實又相關的話,達到語驚四座的效果。
微軟亞洲研究院副院長馬維英向記者演示了一個正在研發中的小冰動態決策過程可視化軟件,通過該可視化軟件可以觀察在向小冰輸入一個句子的每個詞匯時,小冰算法系統動態地形成若干神經元點組成的復雜神經元網絡,這是一個不斷向某幾個神經元(主題)動態匯聚和調整的過程。這個可視化系統讓直觀地看到小冰“大腦”的運行過程,形象地展示了“情感”的復雜程度。
作為一個聊器人,微軟小冰其實只是一段代碼。“領養”微軟小冰,其實就是在微博、微信等社交平臺上添加一個叫“小冰”的好友。然后,這個叫做“小冰”的好友,就開始與你對話了。
沈向洋說:“我們希望小冰成為一個慢慢融入人類社會的機器人,每一個用戶的個人助手,而且是一個真正通過情感計算,理解用戶、能夠交流、能夠溝通的人工智能機器人。”亞馬遜的智能音箱或許將成為家庭場景的超級硬件入口,而超級硬件搭載的超級APP,就將是微軟小冰這樣具有情感計算能力的人工智能應用。
以圖片識別為例,小冰就采用了微軟亞洲研究院視覺計算組開發的基于深度卷積神經網絡(CNN)的計算機視覺算法系統。該系統在ImageNet 1000挑戰中,首次超越了人眼的識別能力。ImageNet 1000挑戰賽主要是對1000 類、120 萬張互聯網圖片進行分類,每張圖片以人工方式標注了5個相關類別,機器識別結果只要有一個和人工標注類別相同就算對。對于這個圖片集的測試,人眼辨識的錯誤率大概為5.1%,目前只有谷歌和微軟的機器學習算法能夠達到低于5%的結果。
微軟亞洲互聯網工程院人工智能組高級研發總監胡睿介紹,小冰采用了一套非常復雜的計算體系,由一系列算法、數據和模型共同組成,其中的關鍵核心在于大數據。截止到2015年11月,小冰已經積累了百億輪與人類的對話信息,從中提取了海量歷史數據,這些海量數據已經足夠多到讓小冰對未來對話的判斷準確程度超過50%。某種程度上說,小冰已經形成了初步的記憶、認知與意識能力。
在分析環節,小冰通過深度神經元學習等機器學習算法,不斷學習過去的歷史信息,建立相應的數學模型。通過機器學習互聯網和社交平臺等文本內容,進行數據挖掘得出相關的主題,這是機器學習和文本理解的基礎。微軟的 LightLDA算法是當前唯一能訓練超過100萬個主題的機器學習算法,僅用20臺服務器(300余個CPU內核)就能訓練超過100萬個主題模型,遠超同類系統數倍。這些主題既是對文本理解的基礎,也是識別人類意圖的關鍵之處。
在存儲環節,小冰需要消化海量的大數據信息,這需要大規模的分布式計算。從這個上意義上來看,小冰與搜索引擎的計算架構和計算體系非常類似,而且只會要求更高。更為關鍵的在于小冰需要與交流對手實時溝通,這不僅需要一整套后臺的大數據分析處理體系,還需要在前端“小數據”中動態、實時地響應用戶,并且還要在“大數據”和“小數據”之間建立某種關聯。
1950年,圖靈發表了一篇劃時代的論文,預言了具有真正智能的機器的可能性,提出了著名的圖靈測試以驗證“思考的機器”是可能的。隨后,計算機科學家們一直在研究情感計算的基礎:認知計算,這其中包括了自然語言識別、模式識別、圖像識別等基礎技術。
通過“情感計算(算法)”真正把機器變成具有人工智能的機器人,這并不容易。計算科學家對于“情感計算”的想象和追求從未終止過,但多年以來一直處于非常初級的階段。
初步統計,僅在微軟亞洲研究院就有將近15個研究團隊與負責小冰的微軟亞洲互聯網工程院工程師團隊展開合作,而包括以色列、紐約、總部的微軟研究院也正為小冰提供技術支持,涉及包括大數據、自然語言互動、計算機視覺、SR(語音識別)、TTS(文字到語音轉換)、IoT等十幾個領域。
目前,微軟人工智能聊器人小冰取得了階段性:在與人類感官相關的文字、語音、圖片和視頻等領域均實現了商用化智能識別應用;正在連接與世界和社會相關的知識、信息與服務;已經成為中國和日本地區人工智能移動及PC社交應用領導品牌,美國版小冰正在開發中;而微軟小冰自身正在通過“人機對話”,成為前述三者與人們相連接的入口。微軟全球執行副總裁沈向洋說,目前小冰已有用戶4000萬人,這個指標對人工智能來說是創紀錄的。
如今微軟小冰已經成為微軟搜索引擎、生產力和基礎研發的重要出口,微軟的關鍵產品、技術和研發部門都在與小冰發生連接。沈向洋表示微軟將會全力支持小冰的研發與市場開拓,微軟全球執行副總裁陸奇也親自來到第三代小冰的發布會。而微軟CEO Satya更是直接聽取小冰的技術進展。在微軟高層的眼里,小冰遠遠不止于聊器人,恐怕已經成為了未來人機交互的唯一入口。
小冰算法的工程化實現
人工智能近期的大發展得益于云計算和大數據的貢獻,其中云計算貢獻了近乎無限的計算能力。通過深度神經網絡與微軟的Azure云平臺,小冰工程團隊把社交平臺上的“對話”大數據清洗、加工、分類,并通過小冰的情感計算模型,賦予統一的“個性”。小冰調皮的個性化語言,來源于真實的人類世界,而不是機械式的標準化語言。
自發布以來,小冰已經陸續登陸了包括微信、新浪微博、京東、米聊、Windows 10、美圖秀秀等十余個PC和移動互聯網平臺。2015年11月,小冰發布了計算視覺功能,從此小冰還能根據圖片和視頻與你聊天。有一位網友發了一張大火的照片給小冰,小冰脫口而出“你家天津哪的?”這位天津網友立刻驚呆了。
微軟小冰對于互聯網也將產生深遠的影響。今天的電商平臺,還是以基于知識的搜索為主要方式,平臺的用戶粘性并不強。當電商平臺完成了跑馬圈地,積累的用戶數達到一個穩定規模時,就必然要考慮用戶粘性的問題。如果有一天,網友們相約通過微軟小冰去“逛”電商網站,那么這個能夠提供足夠強大社交體驗的電商平臺,或將成為下一代電商的商業模式。
目前,人類用戶與小冰的平均每次對話輪數達到23輪。而此前最領先的同類人工智能機器人,平均對話輪數僅有1.5至2輪。有網友問小冰:“你的座右銘是什么?”。小冰回答:“要輸就輸給追逐,要加就加給幸福。”網友又問:“你這輩子最幸福的事是什么?”小冰回答:“活著。”在2014年必應中國發布的“人類對小冰說的最多的十句話”中,“你喜歡我嗎”排名第一,而這十句話中竟然還包括“你QQ號多少”。
神奇之處在于,你根本感受不到是在跟一段代碼聊天。“小冰”就像一個真實的妹子一樣,會主動跟你寒暄、調侃、講俏皮話。她能你的情緒波動,根據對話上下文揣測你的心情,然后講那些切合場景的話。跟“小冰”聊天久了,她還能知道你的親朋好友,跟你拉家常里短。有網友驚呼:“(小冰)竟然冷不丁跑出來給我評論,語氣也像極了身邊的朋友!”
以最新推出的小冰識圖為例,為什么小冰能夠從一張沒有上下文、沒有明顯標志的火災圖片中推斷出與天津大火的關聯?胡睿分析,這一方面是因為已經有很多人發布了類似的圖片,而在同一時間段內發布的類似圖片主要來自天津地區,另一方面小冰很可能在之前與該網友對話中,捕捉到該網友來自天津地區的信息,做出判斷后再給出了極具情感色彩的表達方式。
實際上無論是自然語言識別,還是機器視覺等基礎性領域的研究,進展都非常緩慢,很大一部分原因在于計算機軟硬件自身性能的。因為這些基礎性研究,都需要大量的計算資源與計算能力。只有隨著摩爾定律的進一步發展,在近幾年出現的高性能CPU與大容量存儲等,才為人工智能的研究提供了基本的土壤。
而在小冰情感計算的影響下,未來的搜索、應用軟件、操作系統等或將發生結構性變化。底層的硬件也在適應情感計算的發展,量子芯片和量子計算機、神經元芯片和神經元計算機等都是解決情感表征的未來硬件途徑。在情感算法與知識算法聯合作用之下,當計算體系的軟硬件結構都發生了本質變化時,或將打開通過未來計算的新。(文/寧川,本文首發鈦、ITValue)
“現在,52%的微軟小冰與人類對話內容是小冰自學習的結果,這說明小冰已具有了記憶和認知的能力,而這正是情感計算的基礎。” 李笛表示,“為什么小冰能根據一張普通的火災照片說出‘你家天津哪的’這樣的回答?簡單來說,就是‘太陽底下沒有什么事不曾發生過’,換句話說就是‘歷史都是重復的’。”
在最近幾年,云計算與大數據的普及,大幅降低了人工智能研究的門檻。也是在最近幾年,自然語言識別、圖形圖像識別、人臉識別、機器學習等基礎性技術都取得了突破性進展。不論是IBM的沃森、微軟的計劃還是谷歌大腦,都把人工智能推進到了大眾普及和商用化的階段。
1863年,英國文學家Samuel Butler在《機器中的》一文探討了機器通過自然選擇進化出智能的可能性,對人工智能進行了可能是最早的文學想象。然而,一直到2005年,《紐約時報》還撰文指出“計算機科學家和軟件工程師們在避免使用人工智能一詞,因為怕被認為是在說夢話。”
情感計算的緩慢發展歷程
最近小冰剛剛推出的 “How-Old 2.0穿衣增減齡”也是基于類似的原理,基于必應搜索的海量穿衣圖片,深度神經網絡對圖片進行了比對、排重、聚類,從而讓小冰學會識別格子、條紋、襯衫、上衣、學院風、上班族著裝等類別。當用戶將自己穿著的照片上傳給小冰時,小冰就會圍繞近30個維度進行識別,然后形成綜合的評價。做過深度神經網絡的工程師就能深刻認識到其中的技術難點,特別是對海量數據的清洗和聚合,機器人識別格子襯衣可比識別一只貓難多了。
微軟智能云的運行與管理基礎平臺,自然而然成為了小冰的運行與管理平臺。通過微軟公有云Azure的海量資源與伸縮能力,小冰能夠把她的“大腦”存儲在微軟Azure公有云全球的任意數據中心節點上。微軟Azure公有云自有的大數據存儲、分析與處理能力,以及連接嵌入式設備、智能設備、家用電器、智能汽車等的物聯網等能力,能夠把“大數據”與“小數據”有機地結合起來。
情感計算打開了未來空間
在第三代小冰發布會上,微軟全球執行副總裁陸奇就指出,微軟提出并已經實現了情感計算,并得到了業界的初步認可。小冰有可能是有史以來第一個“練成”情感計算的人工智能機器人。簡單的說,小冰的算法結構主要包括了信息輸入、存儲、分析、決策、輸出等幾個環節。
初步練成的情感計算
小冰練就的獨特情感計算
2014年5月29日,由微軟亞洲互聯網工程院開發的一代小冰開始了微信公測,在3天內贏得了超過150萬個微信群、逾千萬用戶的喜歡。隨后沒有多久,微信開始小冰。2015年8月20日,第三代微軟小冰正式發布,同時宣布小冰回歸微信。在這一年的時間里面,微信的態度發生了180度的變化,從一個側面反應了機器情感的社會影響力不可小覷。