時間:2023-06-04 09:21:13
導語:在人工智能的投資邏輯的撰寫旅程中,學習并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領您探索更多的創(chuàng)作可能。
未來十年,世界上50%的工作,都會被人工智能所取代,尤其是助理、翻譯、保安、邊防、前臺……今天的人臉識別在有些場景比人精確20倍。一個個領域,人都會被機器超越,不只是取代。
機器超越人已不再遙遠
從識別、感知、認知,到做決策、反饋,人工智能在過去五年有非常大的進步。博弈的例子有AlphaGO,感知的例子有微軟小冰,決策的例子有Google Gmail的自動回復。
我在30多年前就做人工智能,可惜,無論對弈、語音識別、自然語言理解都沒有生逢其時。因為當時機器不夠快,數(shù)據(jù)不夠多,算法不夠先進。但是今天,它們夠先進了。
機器學習最重要的一個突破是深度學習。深度學習,就是用非常大的神經(jīng)元,用巨量的數(shù)據(jù)充進去訓練。它可以在識別、分類或者預測方面,遠遠超過任何過去的算法。這個學習的算法特別適合巨大的數(shù)據(jù)量。
什么情況才能用人工智能?人工智能不是萬能的,但滿足以下條件,人工智能絕對可以做出特別有價值的產(chǎn)品:千萬級別的海量數(shù)據(jù);頂尖的科學家;非常清晰領域的邊界;非常好的標注;非常多的計算量。
很多人說人工智能好遙遠。其實不是,百度、淘寶、滴滴的背后都是一個人工智能引擎。一些過去認為比較遙遠的,如圖像識別、語音識別的比賽,機器已經(jīng)超越人了。
人工智能的應用領域
一個創(chuàng)業(yè)公司的用戶達到了千萬級別的時候,肯定需要人工智能引擎。因為系統(tǒng)需要做一些判斷和推薦:推薦什么商品給用戶,該放什么樣的廣告。所以,做人工智能創(chuàng)業(yè)的,最好是已經(jīng)有互聯(lián)網(wǎng)數(shù)據(jù)的公司。
當然,還有很多公司是沒有互聯(lián)網(wǎng)數(shù)據(jù)的,這些公司也能創(chuàng)造價值。
哪些領域會最先呢?一定是數(shù)據(jù)最大、最快能產(chǎn)生價值的領域。如金融領域:銀行、保險、券商、智能投庫、AI量化基金,是最快能產(chǎn)生價值的。
哪些是對人類最有意義的?一定是醫(yī)療領域。癌癥的檢測、切片,基因個性化的治療。
最大的一個領域應該是無人駕駛。當電動車、共享經(jīng)濟、無人駕駛?cè)虑橥瑫r發(fā)生的時候,人類經(jīng)濟會產(chǎn)生最大的提升和改變。以后我們出去打車,應該是隨叫隨到,人都不需要買車了,停車場也不需要了,路上的車也變少了,空氣也變好了,這些都是一些會發(fā)生的很好的“副作用”。
最厲害的AI公司將是Google。當Google搜索里面的引擎被提煉出來成為一個Google大腦的時候,用在互聯(lián)網(wǎng)領域就變成了Gmail的自動回復,變成了Google的搜索和廣告;用在汽車領域就是GoogleCar;用在人的健康領域就成了GoogleHealth;用在圍棋上就是AlphaGO。
百度大腦也是一個類似的項目。每個偉大的互聯(lián)網(wǎng)公司都應該考慮:擁有大數(shù)據(jù)是不是也應該像Google一樣,用更多的深度學習創(chuàng)造商業(yè)價值?
中國有特殊機會
當你要做人工智能的時候,我有幾個建議:要有特別大的數(shù)據(jù),最好是閉環(huán)的,只有你有,別人沒有;要買很多機器,尤其考慮GPU;要有經(jīng)驗豐富的深度學習專家;最后要把年輕人訓練起來。
為什么特別提到訓練年輕人呢?因為一個優(yōu)秀的數(shù)學和計算機專業(yè)畢業(yè)生,培訓6個月就可以做人工智能工程師了。
因此,最領先的人工智能國家,當然是技術(shù)最領先的、論文最領先的、應用最領先的,而且也是年輕人最上進、最努力、最勤奮的國家。
中國有一些很特殊的機會。中國教育特別重視優(yōu)秀的理工、數(shù)學底子,世界上的人工智能論文43%都是中國人寫的。中國傳統(tǒng)企業(yè)比美國落后,但這表示人工智能注入進去就會產(chǎn)生很大價值。在座每一個潛在的獨角獸公司和快到獨角獸的公司,如美圖、知乎、BRPK,都在快速的招人工智能專家,幫他們提升價值。美國領先的公司,無論是Google、坦斯福羅,還是微軟、CNTK、Facebook,在中國都很難本土化,這都是中國公司的機會。
人工智能時代的投資藍圖
創(chuàng)新工場在人工智能時代的投資藍圖包括以下幾個方面。
大數(shù)據(jù)公司。誰有大數(shù)據(jù),我們就可以做人工智能。
R別。語音、手勢、人臉等識別會有很大的突破,但是自然語言的理解,即語義方面的突破,可能還需要5-10年。
傳感器。傳感器現(xiàn)在很貴, Google做輛車要幾十萬美元,但我深信三年以后價格就會降下來。所以,我們更愿意投資那些現(xiàn)在看起來很貴,但一旦量產(chǎn)價格就會降下來的公司。
家庭機器人。家庭機器人長的像人的,恐怕還需要近十年的時間。但是,一些智能音箱、工業(yè)商業(yè)的應用,可以快速發(fā)展起來。
無人駕駛。無人駕駛一定是先開始輔助人駕駛,然后人來輔助機器,最后才能達到全天候的駕駛。
我們投資的人工智能項目,比較著名的是FACE++,還有地平線機器人、小魚在家、金融界的人工智能第四范式,以及玉石科技的無人車,它已經(jīng)開始在園區(qū)里面上路測試了,連駕駛盤都沒有,所以完全是無人駕駛的工作。
我們深信,十年以后回顧人類歷史,人工智能不只是一個創(chuàng)業(yè)的機會,也絕不僅是一個移動互聯(lián)網(wǎng)之后最好的創(chuàng)業(yè)機會,而會被認為是人類有史以來最好的創(chuàng)業(yè)、創(chuàng)新機會,對人類有潛在的巨大改變,對人類生活有最大提升的一種技術(shù)。(本文摘自李開復12月6日在WISE-2016獨角獸大會上的演講,有刪改,標題為編者所加,未經(jīng)本人確認。)
一周視點
李開新
360手機執(zhí)行副總裁2017年不折騰
作為初創(chuàng)企業(yè)和新品牌,穩(wěn)和好要比高和快更重要。天道酬勤,只要不折騰,有正確的方向和明確的定位,企業(yè)總歸會成功的。
12月5日,360手機新掌門李開新接受媒體采訪時表示,2017年的思路是穩(wěn)健運營,不折騰,不去做一夜暴富的夢,認認真真專心做手機。
古永鏘
優(yōu)酷創(chuàng)始人、阿里文娛戰(zhàn)略投資主席融合、鏈接是未來關鍵
用兩個詞來形容我看到的未來:融合和鏈接。搶用戶、圈地這種邏輯在新的十年越來越難,但如何使融合和鏈接產(chǎn)生增值是企業(yè)需要考慮的關鍵。
12月6日,古永鏘在WISE-2016獨角獸大會演講中說,未來是融合的時代,也是全球互聯(lián)網(wǎng)的時代。文化娛樂將是一個重要風口,產(chǎn)生很多創(chuàng)業(yè)機會。
唐沐
小米影業(yè)總裁、小米VR總經(jīng)理小米VR“鐵人三項”
1機械電子工程
1.1機械電子工程的發(fā)展史
20世紀是科學發(fā)展最輝煌的時期,各類學科相互滲透、相輔相成,機械電子工程學科也在這一時期應運而生,它是由機械工程與電子工程、信息工程、智能技術(shù)、管理技術(shù)相結(jié)合而成的新的理論體系和發(fā)展領域。隨著科學技術(shù)的不斷發(fā)展,機械電子工程也變的日益復雜。
機械電子工程的發(fā)展可以分為3個階段:第一階段是以手工加工為主要生產(chǎn)力的萌芽階段,這一時期生產(chǎn)力低下,人力資源的匱乏嚴重制約了生產(chǎn)力的發(fā)展,科學家們不得不窮極思變,引導了機械工業(yè)的發(fā)展。第二階段則是以流水線生產(chǎn)為標志的標準件生產(chǎn)階段,這種生產(chǎn)模式極大程度上提高了生產(chǎn)力,大批量的生產(chǎn)開始涌現(xiàn),但是由于對標準件的要求較高,導致生產(chǎn)缺乏靈活性,不能適應不斷變化的社會需求。第三階段就是現(xiàn)在我們常見的現(xiàn)代機械電子產(chǎn)業(yè)階段,現(xiàn)代社會生活節(jié)奏快,亟需靈活性強、適應性強、轉(zhuǎn)產(chǎn)周期短、產(chǎn)品質(zhì)量高的高科技生產(chǎn)方式,而以機械電子工程為核心的柔性制造系統(tǒng)正是這一階段的產(chǎn)物。柔性制造系統(tǒng)由加工、物流、信息流三大系統(tǒng)組合而成,可以在加工自動化的基礎之上實現(xiàn)物料流和信息流的自動化。
1.2機械電子工程的特點
機械電子工程是機械工程與電子技術(shù)的有效結(jié)合,兩者之間不僅有物理上的動力連結(jié),還有功能上的信息連結(jié),并且還包含了能夠智能化的處理所有機械電子信息的計算機系統(tǒng)。機械電子工程與傳統(tǒng)的機械工程相比具有其獨特的特點:
1)設計上的不同。機械電子工程并非是一門獨立學科,而是一種包含有各類學科精華的綜合性學科。在設計時,以機械工程、電子工程和計算機技術(shù)為核心的機械電子工程會依據(jù)系統(tǒng)配置和目標的不同結(jié)合其他技術(shù),如:管理技術(shù)、生產(chǎn)加工技術(shù)、制造技術(shù)等。工程師在設計時將利用自頂向下的策略使得各模塊緊密結(jié)合,以完成設計;2)產(chǎn)品特征不同。機械電子產(chǎn)品的結(jié)構(gòu)相對簡單,沒有過多的運動部件或元件。它的內(nèi)部結(jié)構(gòu)極為復雜,但卻縮小了物理體積,拋棄了傳統(tǒng)的笨重型機械面貌,但卻提高了產(chǎn)品性能。
機械電子工程的未來屬于那些懂得運用各種先進的科學技術(shù)優(yōu)化機械工程與電子技術(shù)之間聯(lián)系的人,在實際應用當中,優(yōu)化兩者之間的聯(lián)系代表了生產(chǎn)力的革新,人工智能的發(fā)展使得這一想法變成可能。
2人工智能
2.1人工智能的定義
人工智能是一門綜合了控制論、信息論、計算機科學、神經(jīng)生理學、心理學、語言學、哲學等多門學科的交叉學科,是21世紀最偉大的三大學科之一。尼爾遜教授將人工智能定義為:人工智能是關于怎樣表示知識和怎樣獲得知識并使用知識的科學。溫斯頓教授則認為:人工智能就是研究如何使計算機去做過去只有人才能做的智能工作。至今為止,人工智能仍沒有一個統(tǒng)一的定義,筆者認為,人工智能是研究通過計算機延伸、擴展、模擬人的智能的一門科學技術(shù)。
2.2人工智能的發(fā)展史
2.2.1萌芽階段
17世紀的法國科學家B.Pascal發(fā)明了世界上第一部能進行機械加法的計算器轟動世界,從此之后,世界各國的科學家們開始熱衷于完善這一計算器,直到馮諾依曼發(fā)明第一臺計算機。人工智能在這一時期發(fā)展緩慢,但是卻積累了豐富的實踐經(jīng)驗,為下一階段的發(fā)展奠定了堅實的基礎。
2.2.2第一個發(fā)展階段
在1956年舉辦的“侃談會”上,美國人第一次使用了“人工智能”這一術(shù)語,從而引領了人工智能第一個興旺發(fā)展時期。這一階段的人工智能主要以翻譯、證明、博弈等為主要研究任務,取得了一系列的科技成就,LISP語言就是這一階段的佼佼者。人工智能在這一階段的飛速發(fā)展使人們相信只要通過科學研究就可以總結(jié)人類的邏輯思維方式并創(chuàng)造一個萬能的機器進行模仿。
2.2.3挫折階段
60年代中至70年代初期,當人們深入研究人工智能的工作機理后卻發(fā)現(xiàn),用機器模仿人類的思維是一件非常困難的事,許多科學發(fā)現(xiàn)并未逃離出簡單映射的方法,更無邏輯思維可言。但是,仍有許多科學家前赴后繼的進行著科學創(chuàng)新,在自然語言理解、計算機視覺、機器人、專家系統(tǒng)等方面取得了卓爾有效的成就。1972年,法國科學家發(fā)現(xiàn)了Prolog語言,成為繼LISP語言之后的最主要的人工智能語言。
2.2.4第二個發(fā)展階段
以1977年第五屆國際人工智能聯(lián)合會議為轉(zhuǎn)折點,人工智能進入到以知識為基礎的發(fā)展階段,知識工程很快滲透于人工智能的各個領域,并促使人工智能走向?qū)嶋H應用。不久之后,人工智能在商業(yè)化道路上取得了卓越的成就,展示出了頑強的生命力與廣闊的應用前景,在不確定推理、分布式人工智能、常識性知識表示方式等關鍵性技術(shù)問題和專家系統(tǒng)、計算機視覺、自然語言理解、智能機器人等實際應用問題上取得了長足的發(fā)展。
2.2.5平穩(wěn)發(fā)展階段
由于國際互聯(lián)網(wǎng)技術(shù)的普及,人工智能逐漸由單個主體向分布式主體方向發(fā)展,直到今天,人工智能已經(jīng)演變的復雜而實用,可以面向多個智能主體的多個目標進行求解。
3人工智能在機械電子工程中的應用
物質(zhì)和信息是人類社會發(fā)展的最根源的兩大因素,在人類社會初期,由于生產(chǎn)力水平低,人類社會以物質(zhì)為首要基礎,僅靠“結(jié)繩記事”的方法傳遞信息,但隨著社會生產(chǎn)力的不斷發(fā)展,信息的重要性不斷被人們發(fā)現(xiàn),文字成為傳遞信息最理想的途徑,最近五十年間,網(wǎng)絡的普及給信息傳遞帶來了新的生命,人類進入到了信息社會,而信息社會的發(fā)展離不開人工智能技術(shù)的發(fā)展。不論是模型的建立與控制,還是故障診斷,人工智能在機械電子工程當中都起著處理信息的作用。
由于機械電子系統(tǒng)與生倶來的不穩(wěn)定性,描述機械電子系統(tǒng)的輸入與輸出關系就變得困難重重,傳統(tǒng)上的描述方法有以下幾種:1)推導數(shù)學方程的方法;2)建設規(guī)則庫的方法;3)學習并生成知識的方法。傳統(tǒng)的解析數(shù)學的方法嚴密、精確,但是只能適用于相對簡單的系統(tǒng),如線性定常系統(tǒng),對于那些復雜的系統(tǒng)由于無法給出數(shù)學解析式,就只能通過操作來完成?,F(xiàn)代社會所需求的系統(tǒng)日益復雜,經(jīng)常會同時處理幾種不同類型的信息,如傳感器所傳遞的數(shù)字信息和專家的語言信息。由于人工智能處理信息時的不確定性、復雜性,以知識為基礎的人工智能信息處理方式成為解析數(shù)學方式的替代手段。
通過人工智能建立的系統(tǒng)一般使用兩類方法:神經(jīng)網(wǎng)絡系統(tǒng)和模糊推理系統(tǒng)。神經(jīng)網(wǎng)絡系統(tǒng)可以模擬人腦的結(jié)構(gòu),分析數(shù)字信號并給出參考數(shù)值;而模糊推理系統(tǒng)是通過模擬人腦的功能來分析語言信號。兩者在處理輸入輸出的關系上有相同之處也有不同之處,相同之處是:兩者都通過網(wǎng)絡結(jié)構(gòu)的形式以任意精度逼近一個連續(xù)函數(shù);不同之處是:神經(jīng)網(wǎng)絡系統(tǒng)物理意義不明確,而模糊推理系統(tǒng)有明確的物理意義;神經(jīng)網(wǎng)絡系統(tǒng)運用點到點的映射方式,而模糊推理系統(tǒng)運用域到域的映射方式;神經(jīng)網(wǎng)絡系統(tǒng)以分布式的方式儲存信息,而模糊推理系統(tǒng)則以規(guī)則的方式儲存信息;神經(jīng)網(wǎng)絡系統(tǒng)輸入時由于每個神經(jīng)元之間都有固定聯(lián)系,計算量大,而模糊推理系統(tǒng)由于連接不固定,計算量較小;神經(jīng)網(wǎng)絡系統(tǒng)輸入輸出時精度較高,呈光滑曲面,而模糊推理系統(tǒng)精度較低,呈臺階狀。
隨著社會的不斷發(fā)展,單純的一種人工智能方法已經(jīng)不能滿足日益增長的社會需要,許多科學家開始研究綜合性的人工智能系統(tǒng)。綜合性的人工智能系統(tǒng)采用神經(jīng)網(wǎng)絡系統(tǒng)與模糊推理系統(tǒng)相結(jié)合的方法,取長補短,以獲得更全面的描述方式,模糊神經(jīng)網(wǎng)絡系統(tǒng)便是一成功范例。模糊神經(jīng)網(wǎng)絡系統(tǒng)做到了兩者功能的最大融合,使信息在網(wǎng)絡各層當中找到一個最適合的完全表達空間。邏輯推理規(guī)則能夠?qū)υ鰪姽?jié)點函數(shù),為神經(jīng)網(wǎng)絡系統(tǒng)提供函數(shù)連結(jié),使兩者的功能達到最大化。
4結(jié)論
徐立有著典型的人工智能科學家背景,在香港中文大學就讀博士期間,其與導師賈佳亞教授研發(fā)的圖像去模糊技術(shù)將圖像清晰度提升了100倍,被視為是全球圖像處理的一大突破。以研發(fā)實力聞名的商湯也一度被“學術(shù)氣息”所標簽化。徐立認為,人工智能還遠未走向技術(shù)同質(zhì)化的時代,若技術(shù)上不構(gòu)成領先性和差異化,將難以跟上行業(yè)變化。對于人工智能的商業(yè)落地,商湯則自有一套驅(qū)動行業(yè)的經(jīng)營哲學。
21CBR:智能視頻目前是“人工智能+安防”的行業(yè)熱點,你在去年也提過類似觀點,這塊的市場存量有多大?
徐立:安防一直是國家大力發(fā)展的領域,也是十三五規(guī)劃的重點行業(yè)。從政府投入來看,今年也要投入2000-3000億。傳統(tǒng)安防領域的最大廠商,去年營業(yè)額在300多億。所以,這塊目前有足夠的市場空間。
今年的視頻業(yè)務和去年的人臉識別有些類似。去年,業(yè)內(nèi)都在嘗試和落地人臉識別的具體應用,到今年進入相對成熟期,業(yè)務增長很快。今年,智能視頻業(yè)務也在各地展開試點,整體發(fā)展正處在一個大的行業(yè)機會點上。
視頻業(yè)務何時落地,核心問題在于明確產(chǎn)品的商用標準。工業(yè)界的一個標準紅線是評估產(chǎn)品是否超過所謂人眼的準確率,這也是人臉識別逐漸商用化的原因。但是視頻內(nèi)容的分析和人相比效果上還有差距。目前全球每天有2.5億只安防攝像頭在記錄,視頻數(shù)據(jù)輸入達到一定規(guī)模,但在智能處理上還很欠缺,而核心算法的突破將成為最關鍵的落地因素之一。
21CBR:商湯切入安防領域有哪些布局,如何構(gòu)建自己的智能視頻生態(tài)鏈?
徐立:商湯在安防領域的產(chǎn)品體系分為兩類:一類是成熟的業(yè)務系統(tǒng),需要基于客戶方的具體業(yè)務邏輯進行設計,比如怎樣做多視頻協(xié)調(diào),如何做人像處理等,代表產(chǎn)品是SenseFace人臉布控系統(tǒng)和SenseVideo視頻結(jié)構(gòu)化系統(tǒng),另一類是業(yè)務系統(tǒng)中的核心算法模塊,包括動靜態(tài)比對服務器、人群分析服務器和結(jié)構(gòu)化服務器等,儆諳嘍員曜薊的產(chǎn)品。
舉例來說,我們在視頻結(jié)構(gòu)化系統(tǒng)上做了很大突破。以往的視頻結(jié)構(gòu)化系統(tǒng)只能通過身高、性別等屬性來查詢視頻信息,SenseVideo實現(xiàn)了自然語言的信息查詢。我們做了1.3萬人的案例測試,總共生成了9000多個自然語言構(gòu)成的關鍵詞。對于辦案人員來說,通過自然語言來描述罪犯、完成案件信息的視頻檢索是更常見的業(yè)務邏輯,也比根據(jù)屬性搜索來得更加精準,未來將是一個新的業(yè)務形態(tài)。
目前商湯在安防市場相較領先,前十大安防廠商一半以上是我們客戶,商湯為其提供標準化模塊和業(yè)務子系統(tǒng)。同時,我們也在國內(nèi)重點城市建立本地化業(yè)務。去年,商湯的智能視頻業(yè)務(Intelligent Video Analytics)已占公司整體業(yè)務的40%,今年這一勢頭依舊良好。
21CBR:比起發(fā)展客戶,商湯似乎更擅長行業(yè)聯(lián)盟,商湯的市場開拓邏輯怎樣的?
徐立:首先,無論賣什么產(chǎn)品,最后都要接觸到甲方。但是,我一直認為,B2B企業(yè)如果要起量、要規(guī)?;a(chǎn)品一定是相對標準化的。如果每次銷售的方案都是定制化服務,企業(yè)的ROI(投資回報率)就會比較低。相反,集成商則可以將商湯與電信方、施工方等等連接起來,在各地做出標桿性的項目,再用標準化的形式去鋪開。
這里的標準化不是一蹴而就的,而是來自產(chǎn)品和項目的逐次迭代。比如前面提到的比對服務器,再往上可能是一套帶著攝像頭的子系統(tǒng),最后則是一整套的訓練部署平臺。通過深入行業(yè)、做細項目,商湯不斷把標準化的范圍擴大,并聚合客戶的需求從而形成共有需求,最終完成標準化產(chǎn)品的打磨過程。
因此,商湯一直把自己定位成一個技術(shù)公司,而不是集成商公司。商湯能做的是集中力量攻破核心算法和技術(shù)。這個技術(shù)不是單點的、閉門造車的技術(shù),而是以打通上下游的客戶需求、構(gòu)建產(chǎn)業(yè)鏈條來實現(xiàn)的。就像英特爾不直接向終端用戶銷售芯片,而是通過上下游的合作伙伴,比如主板廠商、主機廠商等實現(xiàn)筆記本電腦的銷售,但用戶仍然了解產(chǎn)品背后有英特爾領先的芯片技術(shù),這也是商湯所追求的:做行業(yè)的賦能者。
21CBR:業(yè)界普遍在談AI同行業(yè)的深度結(jié)合,各家公司從技術(shù)表現(xiàn)來看也大致相當。對此你怎么看?
徐立:很多人覺得,深度學習已經(jīng)形成開源生態(tài),技術(shù)沒那么重要了,打通行業(yè)才是關鍵。這里面有一個重要前提:深度學習是否已經(jīng)成熟、不會再變化了。然而,學術(shù)界目前有關深度學習的文章大部分都是工程實踐型的,新的實驗結(jié)果不斷前人做出的理論解釋,指導下一代工業(yè)級應用的技術(shù)原理有待被歸納總結(jié),人工智能距離成熟的“黑盒”還差得很遠。
例如,從近年來物體識別競賽的結(jié)果看,識別準確率在2013-2017年之間提升了300%,基本與摩爾定律吻合。也就是說,在某些垂直領域,算法的演進已經(jīng)進入摩爾定律時代,不是既有算法的變化,本質(zhì)上是重新設計出一套新的引擎算法,從而形成巨大的提升空間。未來三五年間,深度學習還將迎來革命性的變化,現(xiàn)有的算法如果不趕上,就會被淘汰。
前一陣子,特斯拉的總裁馬斯克、物理學家霍金突然發(fā)聲,要大家警惕超級人工智能。這件事多少有點奇怪。對人工智能的恐懼感大眾并不陌生,已經(jīng)有一大堆科幻電影靠著這種情緒賺得大筆票房了??蛇@一次,一個是世界上最知名的企業(yè)家(可能沒有之一),一個是在世的最知名的科學家,兩位都是媒體關注的焦點,他們說要警惕,事情似乎非同小可?
并沒有。盡管大家都喜歡《終結(jié)者》之類的電影,可真要讓我們在平時關注一下看不見摸不著的東西,反而是件難事。而且,霍金不是不久前還說要大家小心地外生物嗎?對于這些事情,我們更多抱以微笑:老爺子醒醒吧。我們盡管看不懂你的那些理論,但還是非常尊敬你的,喊狼來了就不好了。
但是還有另外一些事情同時發(fā)生:就在最近這幾年,人工智能和它的交叉學科如機器學習、計算機視覺、自然語言處理等等,出現(xiàn)了不少驚艷的產(chǎn)品,也誕生了許多家估值甚高的創(chuàng)業(yè)公司。
有一些我們已經(jīng)體驗過了:Google的照片應用不僅能根據(jù)拍攝信息自動將我們的照片分類,還能分辨出圖像中的動物是貓還是狗;無人駕駛汽車已經(jīng)在美國很多公路上實驗性地馳騁;利用深度學習,各家公司正在更精準地投放廣告;IBM的沃森登上了美國版“開心辭典”,在智力問答中擊敗了之前衛(wèi)冕時間最長的人類冠軍;微軟的翻譯系統(tǒng)已經(jīng)能做到實時翻譯,通話時對方的西班牙語傳到你的電腦時已經(jīng)變成了翻譯好的英語。
我們甚至有點習以為常了,甚至覺得有些技術(shù)本應如此。但其實,這里舉出的各種技術(shù)都是最近十年內(nèi)從不可用、難用變得可用的??萍己屯顿Y領域盯上這塊下一個爆點已經(jīng)很久了。
然而說來也怪,這些進展和之前提到的超級人工智能好像不是一回事啊?電影里的超級人工智能,不是應該閃爍著一簇邪惡的紅色眼睛,不,發(fā)光二極管,用奇怪的金屬音說話,除了毀滅人類沒有其他事情可做嗎?或者,那些溫柔的機器人不是既能夠理解人類,又學會了愛與幽默感?我們要的是人一樣的機器,你們卻發(fā)明了更精準的廣告投放?
翻開《人工智能》的教材我們就會發(fā)現(xiàn),公眾對于這個字眼的理解,向來和教科書差距不小。教材中最大篇幅介紹的,往往是讓計算機求解一個問題,其次關注的,有讓計算機理解自然語言、推理、知識表示等;相關的,也有希望通過計算機制造一個神經(jīng)系統(tǒng);還有另外一派,通過統(tǒng)計方法,讓計算機完成各種任務。這些充滿術(shù)語的大部頭教材,怎么看都和電影里的人工智能不沾邊。然而如果了解一點背景和技術(shù),又會發(fā)現(xiàn)很多事情是今天這個樣子,實在是順理成章的。
這要從上世紀五十年代年說起。1956年,一群年輕教授和工程師收到約翰?麥卡錫等人的邀請,齊聚達特茅斯大學,召開一個會議。他們有著共同的學術(shù)興趣,都在關注計算機能否思考這個話題,然而對于什么是思考、什么是智能,卻沒有統(tǒng)一意見。本來,大家對當時的學術(shù)進展也都很了解,并不指望在會上看到什么重大突破(也確實沒有),但這次會議把后來這個領域大牛們第一次聚集在了一起。就是在這次會議上,大家決定,把相關的研究單獨列出來稱之為“人工智能”。會上,西蒙和紐厄爾展示了邏輯理論家,一個能夠自動證明數(shù)學定理的程序;馬文?明斯基帶來了神經(jīng)網(wǎng)絡模擬器;麥卡錫本人則演示了自動下象棋的程序。這次大會不久之后,麥卡錫的團隊實現(xiàn)了一種人工智能研究常用的計算機語言Lisp。這十年,是人工智能奠基的十年。
我們在這里可以一窺人工智能領域后續(xù)的發(fā)展方向:一是創(chuàng)造像Lisp這樣的工具,有了工具并不能讓計算機產(chǎn)生智能,但很多工具影響深遠,起作用的遠超人工智能領域;二是構(gòu)建神經(jīng)網(wǎng)絡,我們已經(jīng)知道人腦由神經(jīng)細胞構(gòu)成,如果能夠構(gòu)建一個神經(jīng)網(wǎng)絡,就能實現(xiàn)一定的功能,如果能更進一步,興許能制造出像人腦一樣復雜的機器;三是研究計算機的推理運算、問題解決和知識表達。學者們認為,人腦在處理信息時無非也是利用已經(jīng)具有的知識、通過運算來解決問題,如果計算機能夠做到這些,就可以說計算機具有智能。
整個六七十年代,人工智能的研究主要圍繞的是第三點。這種取向有著深厚的背景,在人工智能這個詞還不存在的年代,已經(jīng)有無數(shù)學者曾思考思維的本質(zhì),他們把思維抽象為運算,而如果能夠讓機器學會這種運算,我們自然就得到了智能。
不僅因為這種研究的觀念和我們對思維的看法最接近,也因此它是最容易上手的。五十年代的時候就已經(jīng)有了自動證明數(shù)學定理的工具,之后又誕生了各種有一定運算能力的程序或者機器。最后還有一點,那就是冷戰(zhàn)背景下,政府和軍方的巨額投資。當時,他們認為,人工智能可能產(chǎn)生重大的科技突破。想想看,如果有永不疲倦的雷達員檢測敵人,如果有不需眼睛和手的翻譯官將俄文資料翻譯成英文……這真是誘人的前景。當然,研究神經(jīng)網(wǎng)絡的學者也沒有止步不前,他們實現(xiàn)了一些更復雜的模型。只不過,他們選擇了一條窄門,突破更難取得。
事情很快起了大反轉(zhuǎn)。到七十年代末的時候,已經(jīng)苦等十余年的投資人開始抱怨,為什么那些神奇的機器還是沒有發(fā)明出來?為什么所謂的智能只會推理數(shù)學,而一些小孩就能做出的判斷計算機卻怎么也做不出來?不多久,政府大幅縮減了人工智能研究的預算。
人工智能迎來了一次低潮。而另一種方法卻正在暗中生長。我們現(xiàn)在稱呼這種方法為機器學習,盡管它和我們平時用的“學習”這個字眼并不那么接近。機器學習的方法看起來徹底放棄了讓計算機去表達知識之類的想法。既然計算機最強的能力莫過于高速計算,那么索性讓它在自己的長項上發(fā)揮吧。機器學習的專家不那么在乎計算機表現(xiàn)的是不是智能,他們設計、實驗各種精妙的算法,讓計算機可以解決特定的任務。到了八十年代,很多領域都迎來了突破。我們有了最初的自動駕駛,能夠用計算機給圖片做分類,能夠讓計算機和人類世界冠軍下棋。實現(xiàn)這些的辦法,和過去我們渴望的人工智能并不完全一致,然而卻在效果上大獲成功。
幾乎同時,研究運算與知識的方法效果不佳,但神經(jīng)網(wǎng)絡的研究卻興盛了起來。一些學者自稱聯(lián)接主義者。他們的思想來自六十年代??涩F(xiàn)在有了更好的計算機、更好的實現(xiàn)方法,也對神經(jīng)有了更多了解。他們索性就不去考慮意識啊、思維啊是什么這些大問題,而是把精力放在構(gòu)建神經(jīng)網(wǎng)路的模擬上。很多人不同意他們的思考方式,但是大家對于建造一個模擬的大腦還是很有興趣的。
最近幾年,一個叫做“藍腦計劃”的項目被很多媒體報道。這個計劃已經(jīng)利用超級計算機模擬了一個大腦,復雜度大概相當于貓的大腦。我們僅通過這個計劃,大概也能判斷這種方法前景巨大――想想看,如果能模擬一個人類大腦的話會怎么樣?當然,你也能猜到這有多難。歷經(jīng)數(shù)年時間、投入大量金錢之后,目前我們只得到了一個貓腦。
最終勝利的似乎是機器學習的方法,這種我們對智能理解差異最大的方法。如今,流行的機器翻譯、語音識別、自動駕駛、圖像識別、打擊網(wǎng)絡犯罪乃至反恐……機器學習已經(jīng)全面開花,與其相關的詞還成了行業(yè)甚至全民熱詞,比如數(shù)據(jù)挖掘、數(shù)據(jù)科學家、大數(shù)據(jù)等。一些持傳統(tǒng)觀點的人工智能研究者實在沒法同意,計算機表現(xiàn)的這些能力是一種智能。然而機器學習解決問題的效果實在是好。
那么,這就是超級人工智能的雛形了?自八十年代以來,計算機的能力提升了那么多,很多實驗性的研究已經(jīng)成了我們每天使用的工具。然而如今,我們還是造不出能兩腿行走的機器人,計算機很難分辨扭曲的字母或面孔,對于人類的常識也很難理解,能夠做出判斷的專家系統(tǒng)一般只局限于少數(shù)專業(yè)領域。總之,許多一個人類小孩就能勝任的工作,依然是計算機所不擅長的。計算機的能力如此強大,但似乎又和我們想象的智能不是一回事。于是問題來了,超級人工智能的威脅在哪里?
答案也許要分兩部分。第一部分是我們的心理因素。畢竟,人類是我們已知的唯一智能生物,我們對智能的所有了解其實都來自我們自身。我們對地外生命和人工智能總有著強烈的好奇與恐懼,是因為我們從來不知道和我們不盡相同的智能生命是什么樣的,它們又會有什么樣的情緒和態(tài)度。
在人工智能作為一個學科誕生之前,數(shù)學家圖靈就堅信機器可以有智能。他設計了一個判斷機器是否有智能的圖靈測試:一個人向屋子里的機器提問,如果后者回答一系列問題后人類仍然無法判斷它是人還是機器,那么這個機器就具有了智能。這是一個簡單粗暴又無比高明的方法,避開了什么是智能的種種爭論。然而,這種測試得到的不僅是一臺有智能的機器,還是像人一樣的機器。我們對這種機器如此的好奇又恐懼,這種情緒,將伴隨未來所有研究。
前不久,一場圍棋大戰(zhàn)吸引了全世界的目光。這場大戰(zhàn)在韓國首爾上演,共5輪。大戰(zhàn)之所以舉世矚目,是因為對戰(zhàn)的雙方是韓國九段棋手李世石與圍棋人工智能程序AlphaGo。令人驚嘆的是,整個比賽過程中,AlphaGo的表現(xiàn)都堪稱完美,最終以4:1擊敗李世石。
這個戰(zhàn)勝人類世界圍棋冠軍的AlphaGo程序到底是何方神圣?它為什么如此厲害?人工智能對人類來說到底意味著什么? 從“深藍”到AlphaGo
人工智能是計算機科學的一個分支,它企圖了解人類智能的實質(zhì),并生產(chǎn)出一種新的、能以與人類智能相似的方式做出反應的智能機器。人工智能是對人的意識、思維的信息過程的模擬,使得機器能像人那樣思考,甚至超過人的智能。自1956年這個概念被提出并確立以來,該領域就被視為人類最高的夢想之一。
1997年,IBM的超級計算機“深藍”以2勝1負3平的成績戰(zhàn)勝了當時世界排名第一的國際象棋大師加里?卡斯帕羅夫,一時間全球轟動,而“深藍”的設計者們當時就暢想:何時計算機也能下圍棋呢?
而現(xiàn)在無疑又是一個人工智能歷史上最重要的時刻。圍棋和國際象棋在復雜程度上不屬于一個量級,圍棋是一種變數(shù)極多、充滿不確定的競技,每一步棋的可能性都是一個幾乎無法窮盡的量級,一回合有250種可能,而一盤棋可以多達150回合。
此外,下圍棋的過程中還會出現(xiàn)“吃子”情況,加劇了其復雜性。曾任職谷歌公司的李開復說,當年“深藍”與卡斯帕羅夫的對局,實際上使用的是人工調(diào)整的評估函數(shù),并用特殊設計的硬件和“暴力”的搜索征服了國際象棋級別的復雜度,圍棋則不行?!耙驗樗乃阉魈珡V,每一步的選擇有幾百而非幾十;也太深,一盤棋有幾百步而非幾十步。”李開復在知乎上如此回答。
此外,圍棋問題與現(xiàn)實生活中的問題相通,國人甚至將下圍棋視為洞悉人性、參悟人生的過程。然而,現(xiàn)在下圍棋的卻是一個機器,意味著這個機器除了擁有超強的記憶能力、邏輯思維能力,還要擁有創(chuàng)造力甚至個性。
“感覺就像一個有血有肉的人在下棋一樣,該棄的地方會棄,該退出的地方退出,非常均衡的一個棋風,真是看不出出自程序之手?!眹迮琶澜绲谝坏目聺嵳f,AlphaGo有好幾次落子極其“非常規(guī)”,許多專業(yè)棋手都表示看不懂。而“棋圣”聶衛(wèi)平甚至表示自己想要對AlphaGo的“驚人一手”脫帽致敬,因為它“用不可思議的下法辟立了圍棋常識之外的新天地”。也就是說,這不是AlphaGo從既往棋局中復制過來的,而是自己創(chuàng)造的戰(zhàn)術(shù)打法。 人工智能進入實用階段
實際上,AlphaGo是通過蒙特卡洛樹搜索算法和兩個深度神經(jīng)網(wǎng)絡合作來完成下棋。在與李世石對陣之前,谷歌首先用人類對弈的近3000萬種走法來訓練AlphaGo的神經(jīng)網(wǎng)絡,讓它學會預測人類專業(yè)棋手怎么落子。然后更進一步,讓AlphaGo自己跟自己下棋,從而又產(chǎn)生規(guī)模龐大的全新棋譜。谷歌工程師曾宣稱AlphaGo每天可以嘗試百萬量級的走法。
“它們的任務在于合作‘挑選’出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在計算機可以完成的范圍內(nèi)。在本質(zhì)上,這和人類棋手所做的一樣?!敝锌圃鹤詣踊芯克┦垦芯可鷦⒓悠嬲f。
“傳統(tǒng)的棋類軟件一般采用暴力搜索,包括深藍計算機,它是對所有可能結(jié)果建立搜索樹,根據(jù)需要進行遍歷搜索。這種方法在國際象棋、跳棋等方面還具有一定可實現(xiàn)性,但對于圍棋就無法實現(xiàn)。”中科院自動化研究所研究員易建強說,“ AlphaGo利用深度學習的方法降低了搜索樹的復雜性,搜索空間得到有效降低。比如,策略網(wǎng)絡負責指揮計算機搜索出更像人類高手該落子的位置,而估值網(wǎng)絡負責指揮計算機搜索出后續(xù)更有可能獲勝的一個落子位置?!?/p>
劉加奇進一步解釋,深度神經(jīng)網(wǎng)絡最基礎的一個單元就類似人類大腦的神經(jīng)元,很多層連接起來就好比是人類大腦的神經(jīng)網(wǎng)絡。AlphaGo的兩個神經(jīng)網(wǎng)絡“大腦”分別是策略網(wǎng)絡和估值網(wǎng)絡。
“策略網(wǎng)絡主要用來生成落子策略。在下棋的過程中,它不是考慮自己應該怎么下,而是想人類的高手會怎么下。也就是說,它會根據(jù)輸入棋盤當前的一個狀態(tài),預測人類下一步棋會下在哪里,提出最符合人類思維的幾種可行的下法?!?/p>
然而,策略網(wǎng)絡并不知道自己要下出的這步棋到底下得好還是不好,它只知道這步棋是否跟人類下的一樣,這時就需要估值網(wǎng)絡來發(fā)揮作用。
劉加奇說:“估值網(wǎng)絡會為各個可行的下法評估整個盤面的情況,然后給出一個勝率。這些值會反饋到蒙特卡洛樹搜索算法中,通過反復如上過程推演出勝率最高的走法。蒙特卡洛樹搜索算法決定了策略網(wǎng)絡僅會在勝率較高的地方繼續(xù)推演,這樣就可以拋棄某些路線,不用一條道算到黑?!?/p>
AlphaGo利用這兩個工具來分析局面,判斷每種下子策略的優(yōu)劣,就像人類棋手會判斷當前局面以及推斷未來的局面一樣。在利用蒙特卡洛樹搜索算法分析了比如未來20步的情況下,就能判斷在哪里下子贏的概率會高。 “奇點”正在臨近?
人工智能越來越近。顯然,它并不會只用來下棋,實際上它正掀起一輪輪產(chǎn)業(yè)變革、經(jīng)濟變革甚至社會變革。
“人工智能將有助于人類解決疾病、醫(yī)療、氣候、能源、數(shù)據(jù)、游戲等多個領域的問題,我們將與各領域最頂級的研究人員合作,促進人工智能與創(chuàng)業(yè)、產(chǎn)業(yè)領域的有機結(jié)合?!?AlphaGo開發(fā)者德米什?哈薩比斯表示。
哈薩比斯當然不想把人工智能局限于棋盤上,他將目光投向了更為廣闊的世界,力爭開發(fā)出可以用于多個領域的通用型學習機器,制造出可以像人類一樣從白紙狀態(tài)通過自主學習找到問題解決方案的人工智能。他將這一目標比喻為實現(xiàn)人類登月夢想的“阿波羅計劃”。哈薩比斯還說,未來將開發(fā)在任何地方都能使用的通用人工智能。也就是說,從硬件到軟件、從個別商品到系統(tǒng)的統(tǒng)合,這種趨勢將會改變產(chǎn)業(yè)和人們的日常生活。
同哈薩比斯一樣,全球頂級企業(yè)也將“賭注”壓在了人工智能之上。全球科技商業(yè)預言家、暢銷書《失控》作者凱文?凱利認為,未來20年,全球最重要的技術(shù)就是人工智能。英國帝國理工學院的人工智能學者馬克?戴森羅克說:“如果人工智能以這種速度發(fā)展下去,我們或許在未來10年到20年里就能看到電影《鋼鐵俠》中那個人工智能助手賈維斯。”
韓國《中央日報》的報道稱,人工智能的威力正在進入實用階段,因為像谷歌、IBM、微軟、蘋果、Facebook這種世界級的信息通信技術(shù)企業(yè),把與大數(shù)據(jù)相結(jié)合的人工智能技術(shù)陸續(xù)在醫(yī)療、金融、體育、社交網(wǎng)絡領域?qū)崿F(xiàn)實用化。人工智能技術(shù)與制造業(yè)的接軌也在變快。有人預測,如果人工智能與無人駕駛汽車接軌,那么將沒有交通事故,保險公司也將無需存在。如果讓人工智能與無人機接軌,毫無疑問這將使得商業(yè)化如虎添翼,也將給武器系統(tǒng)帶來影響。
此外,2015年,專注于初創(chuàng)企業(yè)的市場調(diào)查公司“風險掃描”追蹤分析了全球855家人工智能初創(chuàng)企業(yè),發(fā)現(xiàn)這些企業(yè)橫跨13個門類,總估值超過87億美元,其中計算機深度學習和視覺圖像識別兩個方向最受投資者青睞。
在科幻電影《超驗駭客》中,約翰尼?德普飾演的科學家因為研發(fā)人工智能而被恐怖組織暗殺,臨死之前倉促地將自我意識上傳至電腦。最后,這名科學家成為一個能夠不斷進化的結(jié)合生物智慧和人工智能的“超級計算機”。
AlphaGo戰(zhàn)勝李世石之后,人工智能通過自我進化增加智慧已變?yōu)楝F(xiàn)實。搜狗CEO王小川認為,人工智能能做到隨著時間推移變得越來越聰明,正如金庸小說中老頑童讓自己的左手和右手“互搏”,從而練就絕世武功。
“在下棋這個領域,AlphaGo這樣一臺在算法上沒有天花板的機器,將有機會登峰造極。”王小川評價說。
并非所有人都對人工智能抱以樂觀的態(tài)度。早在1993年,美國科幻作家弗諾?文奇在《即將到來的技術(shù)奇點》一文中寫道:“在未來30年間,我們將有技術(shù)手段來創(chuàng)造超人的智慧。不久后,人類的時代將結(jié)束?!痹谒拿枋鲋?,所謂“技術(shù)奇點”是指在未來的某個時期,當機器達到“強人工智能”時,智商將超過人類,從而對人類社會造成巨大沖擊。
而自稱美國未來學家的庫茲韋爾則在他2005年出版的《奇點臨近》一書中,把“技術(shù)奇點”進一步轉(zhuǎn)述為“奇點理論”。他描述道:“2045年將出現(xiàn)‘奇點’時刻,人類文明走到終點,生物人將不復存在,取而代之的是一個叫做‘奇點人’的新物種。”
霍金也對人工智能表示極度擔憂:“人工智能開發(fā)成功將會是人類歷史上最大的事件。但不幸的是,這可能也會是最后一個大事件?!比ツ辏艚疬€與特斯拉創(chuàng)始人伊隆?馬斯克、蘋果計算機共同創(chuàng)辦人史蒂夫?沃茲尼克等數(shù)百名頂尖精英發(fā)表聯(lián)署公開信,表示人工智能對人類生存的威脅更甚于核武器。
霍金認為,特別是高科技軍事裝備的普及,如美軍在戰(zhàn)場上大量使用無人機遠程殺敵,或多或少印證了這種憂慮。
XML技術(shù)以及其他相關技術(shù)的快速發(fā)展改變了Web應用發(fā)展的格局: 它將Web應用從信息交互的領域擴展到了服務交互的領域,這種服務交互就是當前引起工業(yè)界和學術(shù)界關注的Web服務(Web Services)。
但隨著Web服務的大量涌現(xiàn),如何使機器自動、準確、高效地進行服務發(fā)現(xiàn)、服務匹配、服務組合、服務監(jiān)控和服務調(diào)用,成為Web服務研究中的熱點和難點問題。而語義Web為這些問題的解決提供了新的途徑。
語義Web研究的主要目的就是擴展當前的萬維網(wǎng),使得網(wǎng)絡中的信息具有語義,能夠被計算機理解,便于人和計算機之間的交互與合作,其研究重點就是如何把信息表示為計算機能夠理解和處理的形式,即帶有語義。語義Web具有一套完整的架構(gòu)來實現(xiàn)Web資源的語義標注和推理。語義Web服務是將語義Web技術(shù)和Web服務技術(shù)相結(jié)合,如附圖所示。
利用語義Web豐富的語義描述能力和強大的邏輯推理能力來準確地描述Web服務的語義,通過這些帶有語義信息的描述來實現(xiàn)服務的自動發(fā)現(xiàn)、組合、監(jiān)控和調(diào)用。
服務的語義描述
服務的語義描述問題是語義Web服務需要解決的首要問題,它是實現(xiàn)服務發(fā)現(xiàn)、匹配、組合、監(jiān)控和調(diào)用等功能的前提。2002年BBN Technology等幾家研究機構(gòu)和大學聯(lián)合推出的DAML-S WS本體描述語言是語義Web服務成為Web服務和語義Web研究領域中新的獨立的研究方向的標志。DAML-S從三個相關的方面描述Web服務本體,它們分別是: 語義概況、語義進程和WSDL映射。
OWL-S是2003年W3C建議的Web服務本體描述語言,它由DAML-S發(fā)展而來,與DAML-S沒有本質(zhì)區(qū)別。WSDL-S是W3C2005年底根據(jù)IBM和Georgia大學提交的草案修改的一種語義Web描述方法。WSDL-S采用在服務的WSDL文件中添加語義描述的辦法,盡量保持與現(xiàn)有協(xié)議與技術(shù)的兼容性。
ESSI是歐洲研究語義Web服務的組織,該組織推出了WSMO(Web Service Modeling Ontology)、WSML(Web Service Modeling Language)和WSMX(Web Service Modeling eXecution environment)三個語義Web服務標準。
語義Web服務匹配
語義Web服務匹配是語義Web服務中的另一個基本問題,它的作用是從已經(jīng)的服務中發(fā)現(xiàn)與用戶需求最匹配的服務,同時也是服務需求方與服務提供方進行服務語義匹配的過程。
語義Web服務匹配主要有基于邏輯推理的和基于詞匯相似度計算的匹配算法。其中基于詞匯相似度的匹配方法主要用借助IR(Information Retrieval)技術(shù)中的詞匯相似度的計算來判斷不同的語義Web服務中各項功能及性能描述的匹配程度。因為語義Web的邏輯基礎是描述邏輯(DL),邏輯推理的匹配方法主要通過DL推理機來判斷不同的語義Web服務的功能描述的一致性。由于Web服務可以看做是一種動態(tài)的知識,每一個服務可以看成一個動作,它的執(zhí)行會改變Web的狀態(tài)空間和數(shù)據(jù)空間。
OWL-S中的Input/Output 就是描述Web 服務執(zhí)行前后數(shù)據(jù)空間的改變,而Precondition/Effect就是描述Web服務執(zhí)行前后狀態(tài)空間的改變。由于普通的描述邏輯缺乏描述動作和狀態(tài)空間改變的能力,所以中科院計算所的史忠植研究員等在DL中引入動作的表示和推理,發(fā)展成動態(tài)描述邏輯,用于進行服務匹配和組合過程中的推理。
語義Web服務組合
語義Web服務組合是語義Web服務的重要目標和研究熱點之一,它使得獨立的Web服務能夠自動組合起來滿足單獨服務所不能滿足的用戶需求,同時它也是語義Web、Web服務、智能規(guī)劃等研究領域的交叉領域。
由于研究服務組合問題的目標不同,工業(yè)界和學術(shù)界對于Web服務組合的概念存在不同的理解。工業(yè)界主要從應用角度來研究如何借助服務組合技術(shù)來整合服務資源,一般采用靜態(tài)組合、動態(tài)綁定的方式,組合的自動化和動態(tài)適應性程度不高。學術(shù)界主要從服務理論建模的角度研究實現(xiàn)服務組合自動化的問題,其主要思想是在語義Web的研究成果之上,利用本體語言的豐富語義以及推理能力,實現(xiàn)Web服務組合的自動化。
Web服務組合的很多技術(shù)是從已有的方法中繼承和發(fā)展出來的,可以按照Web服務組合方法分成三類。一類基于工作流,它對Web服務組合產(chǎn)生了很大的影響,典型的基于工作流的方法有BPEL4WS、eFlow等。另一類基于軟件工程的方法,Web服務可以看成是一個獨立的軟件模塊,軟件工程中的一些原則、技術(shù)、思想同樣可以應用于Web服務組合。典型的軟件工程的方法如Web Component或者程序自動生成的方法。還有一類基于人工智能,由于傳統(tǒng)的Web服務描述語言WSDL缺乏語義上的描述,所以學術(shù)界普遍采用OWL-S、WSDL-S、WSMO等語義Web的方式來增加Web服務的語義描述,然后使用人工智能來自動或者半自動地生成Web服務組合。
未來展望
隨著互聯(lián)網(wǎng)的快速發(fā)展,基于互聯(lián)網(wǎng)和Web服務的各種應用和商業(yè)模式層出不窮,工業(yè)界和商業(yè)界和各國政府都將互聯(lián)網(wǎng)經(jīng)濟作為一個巨大的機遇和挑戰(zhàn),并對此進行大量投資。作為互聯(lián)網(wǎng)技術(shù)支柱之一的Web服務也遇到了空前的機遇和挑戰(zhàn),而因為Web服務的巨大應用前景,它也同樣成為了學術(shù)界的研究熱點。
Web服務的理想狀況是服務的發(fā)現(xiàn)、選取、組合、調(diào)用及監(jiān)控過程的機器全自動化實現(xiàn)。語義Web服務是Web服務的應用與研究發(fā)展的重要反面。結(jié)合先進的人工智能技術(shù),使互聯(lián)網(wǎng)越來越智能化,更好地為人類服務,是互聯(lián)網(wǎng)發(fā)展的目標和趨勢。
語義Web服務就是為解決智能化Web服務而將人工智能中的語義技術(shù)和Web服務結(jié)合的嘗試。由于語義研究的邏輯基礎(描述邏輯、動態(tài)描述邏輯等)在過去20多年的穩(wěn)固發(fā)展,它給語義Web服務提供了一個良好的基礎和保證。但是現(xiàn)在的語義Web服務也存在著語義描述、語義理解困難,語義推理效率較低的問題,語義Web服務要得到廣泛應用,要與其他各種計算機技術(shù),如網(wǎng)絡技術(shù)、軟件工程技術(shù)、人工智能等相結(jié)合,才能達到Web服務的理想境界。
鏈接
國內(nèi)在語義Web服務上的進展
Stair是一臺樣子古怪的設備,像一個架在輪椅上的花架,但是實際上它是一部人工智能機器人。
坐在會議室桌旁邊的工作人員對Stair說: “Stair,請從實驗室拿來訂書機。”站在旁邊的Stair回復道: “我會為您去拿訂書機?!比绻屑毞直妫琒tair說話時,還帶著一種鼻音。
Stair迅速啟動――它靠兩個輪子行進,在實驗室內(nèi)自由穿行,一路上自如地避開各種障礙物。它的“眼睛”是一部立體照相機,這對“大眼睛”不斷靈活地來回轉(zhuǎn)動,拍下房間里面的內(nèi)容,以確定行進的路徑以及判斷哪些是障礙物。
Stair穿過零亂的實驗室后,來到一張桌子前,似乎考慮了一下后,仔細打量了桌子上的長方形金屬物體――訂書機。然后它伸出關節(jié)臂,轉(zhuǎn)來轉(zhuǎn)去,用外面裹以橡膠的長長手指緩緩地夾起了訂書機,然后原路返回會議室。Stair將訂書機交給工作人員說: “給您訂書機。祝您今天過得愉快。”
以上的場景并不是出現(xiàn)在科幻電影或書籍中,而是在現(xiàn)實生活中活生生地存在著。
如今,人工智能領域研究人員的心情越來越好,他們所研究的成果在不斷地取得突破。盡管Stair的表現(xiàn)與替主人撿報紙的小狗相比似乎強不了多少,但這在幾年前還是不敢想象的。
Stair代表了新一代的人工智能,集成了學習、視覺、導航、操縱、規(guī)劃、推理、語音和自然語言處理等多項技術(shù)。它還標志著人工智能從細分的狹小領域,進入到系統(tǒng)能夠?qū)W會處理復雜數(shù)據(jù)、適應不確定情況的現(xiàn)實世界。
咸魚翻身
人工智能在自身發(fā)展中,經(jīng)歷了不少磨礪。技術(shù)先在幕后隱藏了幾年,經(jīng)過一輪輪炒作后,突然閃亮登場。隨后要是技術(shù)沒有兌現(xiàn)不切實際的承諾,就名譽掃地。取得了顯著成就后,終于被人們所接受。
人工智能起源于上世紀50年代末期,后來在80年代憑借“專家系統(tǒng)”而備受矚目。專家系統(tǒng)先與真實世界的專家(比如國際象棋冠軍)“過招”,然后通過軟件把專家的一套邏輯規(guī)則編入到系統(tǒng)中。如果情況A發(fā)生,就做X,如果情況B發(fā)生,就做Y。微軟研究部門的人工智能研究人員Eric Horvitz表示: “盡管專家系統(tǒng)在處理下棋等特殊的任務時表現(xiàn)不俗,但它們實際上‘功能很弱’?!?/p>
Horvitz認為,專家系統(tǒng)的作用主要是獲取大量的人類知識,然后設法把這些知識組合成具有人類推理本領的推理系統(tǒng)。但是它們無法“擴展”,也就是說無法適應編程人員之前沒有明確預料到的情況。
如今,人工智能系統(tǒng)已經(jīng)發(fā)展到可以在“非常龐大而復雜的世界”執(zhí)行有用的工作。Horvitz說: “因為這些小小的軟件無法完整地表現(xiàn)這個世界,它們對自己該執(zhí)行什么樣的動作并不確定。于是,它們學習了解各種事情出現(xiàn)的概率,它們學習用戶偏好,它們變得有了自我意識?!?/p>
這些功能來自于所謂的機器學習,這項技術(shù)是許多現(xiàn)代人工智能應用的核心。實質(zhì)上,編程人員最初為自己要解決的某個問題建立一個簡陋模型,然后添加讓軟件能夠通過經(jīng)驗不斷適應、完善的功能。以語音識別軟件為例,這一類軟件日臻完善,已經(jīng)能學會察覺人的聲音的細微變化。比方客戶在網(wǎng)上購物時,通過聲音輸入,一些網(wǎng)站就能夠更準確地預測客戶的購物偏好。
數(shù)據(jù)是關鍵
機器學習當然離不開靈巧的算法,但是近些年來促使機器學習備受矚目的背后原因是,現(xiàn)實生活中存在大量數(shù)據(jù)可供分析使用,這些數(shù)據(jù)來自互聯(lián)網(wǎng)以及數(shù)量激增的物理傳感器。Carlos Guestrin是卡內(nèi)基•梅隆大學的計算機學和機器學習助理教授,他專注于傳感器、機器學習和優(yōu)化等技術(shù)。
Guestrin說: “南加州大學和加州大學洛杉磯分校的科學家們把傳感器裝在機器人船上,以便檢測及分析大片水域的破壞性赤潮。人工智能通過算法學會預測水藻的地點和成長情況。相似的是,卡內(nèi)基•梅隆大學的研究人員把傳感器裝在地方供水系統(tǒng)中,以便檢測及預測污染物的擴散。在這兩種情況下,機器學習都逐漸提高了預測的準確性,而優(yōu)化算法知道把成本高昂的傳感器放在哪個地方最適合?!?/p>
Guestrin還在開發(fā)另外一種系統(tǒng),它可以搜索數(shù)量眾多的博客,根據(jù)某個用戶的瀏覽記錄和偏好,找出該用戶有興趣閱讀的博客。他表示,這項任務聽上去與通過傳感器預測污染物擴散的任務完全不同,其實背后是一樣的原理。
“污染物通過供水系統(tǒng)來擴散,基本上就像新聞故事通過互聯(lián)網(wǎng)來傳播。我們能夠使用同一種建模思想和算法來解決這兩個問題?!?/p>
Guestrin還認為,像博客過濾器這些具有人工智能功能的工具,其重要意義不僅僅局限于能夠每天節(jié)省幾分鐘時間。“我們根據(jù)非常有限的信息做出生活當中的決定,比如我們選舉誰、我們覺得哪些問題重要。但是人們往往沒有做出某種明智決定所需要的那種分析能力,尤其是信息量增加后,我們做出明智決定的能力實際上反而減弱了,而機器學習和人工智能恰恰可以助我們一臂之力?!?/p>
微軟研究部門在道路交通預測模型中結(jié)合了傳感器、機器學習以及對人類行為的分析。對傳感器和計算機預測而言,預測交通瓶頸似乎是一種不是很困難的應用。以美國某些圍繞大城市的州際公路為例,往往在星期一下午5點出現(xiàn)交通堵塞。司機這時可能想知道,什么地方、什么時候出現(xiàn)了交通堵塞的情況,或其他意外情況。另外更重要的是,司機希望堵車之前就知道這種情況會在什么地方出現(xiàn)。于是,微軟研究部門建立了一個“意外情況預測”模型,通過以往的交通情況,結(jié)合傳感器捕獲的實際交通流量,學會預測30分鐘后的意外情況。在測試時,該模型能夠預測西雅圖地區(qū)道路上大約50%的意外情況?,F(xiàn)在該模型已經(jīng)投入使用、服務于幾千名司機,他們可在Windows Mobile設備上收到預警信息。
很少有幾家組織需要像搜索引擎公司那樣需要弄清楚大量數(shù)據(jù)的意思。比方說,要是某個用戶使用谷歌搜索引擎搜索“玩具車”,然后點擊出現(xiàn)在搜索結(jié)果頂部的沃爾瑪廣告,這能為沃爾瑪創(chuàng)造多少價值呢?谷歌應當為這次點擊收取多少費用呢?答案就在于人工智能采用的“數(shù)字交易”(digital trading agents)這項特長,沃爾瑪和谷歌等公司在網(wǎng)上自動拍賣中運用了這項技術(shù)。
密歇根大學教授兼搜索市場專家Michael Wellman解釋: “關鍵字多達數(shù)百萬,一個廣告客戶可能只對其中的數(shù)百個或數(shù)千個有興趣。他們必須關注關鍵字的價格,然后決定如何分配廣告預算。谷歌或雅虎要弄清楚某個關鍵字的價值多少太難了,他們就讓市場通過拍賣過程自行決定價值?!?/p>
“玩具車”查詢提交上去后,谷歌會在極短的時間內(nèi)查詢哪些廣告客戶對這些關鍵字感興趣,然后查看他們的競價,決定顯示誰的廣告、把廣告投放在頁面上哪個部分。Wellman說: “我特別感興趣的問題是,廣告客戶應當如何確定競購哪些關鍵字、出多少競價、如何根據(jù)廣告實際效果不斷學習調(diào)整,以及有多少競爭對手在競購某個關鍵字。”
Wellman表示,目前已知最出色的模型采用了面對不確定情況來預測價格的機制。顯然,任何一方都別指望通過每筆交易來優(yōu)化財務效益,但是他們可以將機器學習運用到實時報價和競標上,從而不斷提高效益。
研究大腦機理
有人可能以為人工智能是從研究人類大腦工作機理入手的。但人工智能方面的進步大多來自計算機科學,而不是來自生物或認知科學。
這些領域有時有著共通的思想,但它們之間的合作充其量也只是一種“松散耦合”的關系,卡內(nèi)基•梅隆大學機器學習系主任Tom Mitchell說?!斑^去人工智能方面的大部分進步來自良好的工程學思想,而不是因為我們觀察了大腦的工作機理,然后進行模仿?!?/p>
但是,現(xiàn)在這種情況在發(fā)生變化?!巴蝗?,我們有辦法來觀察大腦到底在做什么,借助諸如功能性磁共振成像的腦部成像方法。這種方法可以觀察人在思考時大腦的實際活動。”Michael說。
他表示,認知科學和計算機科學如今能夠?qū)崿F(xiàn)以前不可能實現(xiàn)的思想共通。比方說,如果機器人做對了事,某些人工智能算法會向機器人發(fā)出小小的獎勵信號; 要是做錯了事,就會發(fā)出懲罰信號。隨著時間的推移,這會形成累積效應,機器人就會學習、完善。
Mitchell表示,研究人員通過功能性磁共振成像方法發(fā)現(xiàn),大腦的一些部位其實際活動與這種“強化學習”算法預測的如出一轍。他說: “人工智能實際上有助于我們開發(fā)了解我們大腦中實際活動的模型?!?/p>
Mitchell及其同事一直在研究腦部成像方法所揭示的大腦神經(jīng)活動,以解讀大腦在如何呈現(xiàn)知識。為了訓練自己的計算機模型,他們?yōu)閷嶒瀸ο蟪鍪玖?0個名詞,比如電話、房子、番茄和胳膊, 然后觀察大腦在看到每個名詞后出現(xiàn)的圖像。隨后,他們使用谷歌收錄了一萬億個單詞的文本數(shù)據(jù)庫,確定了往往伴隨60個基本單詞出現(xiàn)的幾個動詞,比如伴隨電話的鈴響,然后根據(jù)兩者都出現(xiàn)的頻率,為這些單詞賦予權(quán)重。
隨之形成的模型就能準確預測之前從未見過相應圖像的某個單詞會引起大腦出現(xiàn)什么樣的圖像。簡單地說,這種模型就會預測,名詞“飛機”帶來的大腦圖像更像是名詞“火車”帶來的大腦圖像,而不像名詞“番茄”帶來的大腦圖像。
Mitchell說: “我們過去感興趣的是大腦如何呈現(xiàn)想法,而這個試驗有望揭示對人工智能來說很棘手的一個問題。怎樣才能準確、普遍地呈現(xiàn)知識?也許還有其他經(jīng)驗可以汲取,大腦也很容易忘記知識?!?/p>
斯坦福大學計算機學助理教授Andrew Ng領導了多才多藝的Stair的研發(fā)工作。他表示,這個機器人證明了人工智能識方面許多之前彼此獨立的領域現(xiàn)在足夠成熟,可以融為一體,“實現(xiàn)人工智能的遠大夢想”。
那么這個夢想到底是什么呢?Ng說: “早先的著名預言稱,在比較短的時間內(nèi),計算機的智能化程度會與人類一樣高。我們依舊希望,在將來的某個時間,計算機的智能化程度會與我們一樣高。但這個問題不是十年后有望解決的,可能一百年過后才有望解決。”
鏈 接
人工智能
在華爾街的應用
近期筆者參加了一個AI創(chuàng)業(yè)者沙龍,機器時代CEO楊威分享了智能硬件和新零售結(jié)合的分享,對這個正在進入新型終端領域的企業(yè)或創(chuàng)業(yè)者思考商業(yè)化很有借鑒作用。
機器時代成立于2016年,主要業(yè)務面向中國人工智能科技公司提供渠道服務、數(shù)據(jù)服務、供應鏈服務與投資服務。目前,這家成立不足兩年的公司已經(jīng)在全國14個機場擁有智能硬件零售體驗店——AI機器時代。
援引機器時代CEO楊威的說法,機器時代的核心價值觀是利他主義。眾所周知,超過95%的創(chuàng)業(yè)者在經(jīng)歷了漫長的立項,融資,運轉(zhuǎn),再融資的過程后都會死在市場的檢驗下,成功上市者寥寥,這個過程相當苦逼。
“機器時代”智能硬件零售體驗店的建立是“加快創(chuàng)業(yè)者死亡”的檢驗平臺,是一個逆向思維的孵化器。他以智能硬件產(chǎn)品的檢測標準及大數(shù)據(jù)分析為依托,以真刀真槍的市場機制判定產(chǎn)品的成熟度和未來上市的演變路徑,與其說是孵化不如說是洗禮出了一個個成功的案例。
下面,我們利用4P理論來探討下這個有趣的商業(yè)邏輯,希望對尋求AI領域商業(yè)化和渠道轉(zhuǎn)型的局內(nèi)人有些啟發(fā)。
機器時代商業(yè)邏輯
Product 產(chǎn)品
近兩年,隨著移動互聯(lián)網(wǎng)的成熟以及云大物技術(shù)的發(fā)展,智能硬件進入了商業(yè)化發(fā)展的初期階段。
來源:GFK新型智能硬件市場解析報告
“機器時代”在人工智能硬件這樣一個細分領域,很早的切入市場,秉承“能被用戶接受的人工智能產(chǎn)品才算是智能硬件”這一理念。切實抓住了一切新興市場的痛點,抓住了商機。
如果把“機器時代”零售體驗店作為一個產(chǎn)品看,他的產(chǎn)品不僅解決創(chuàng)業(yè)者在初創(chuàng)階段的痛點,同時也滿足了用戶的需求:
1、創(chuàng)業(yè)項目的孵化平臺:
(1)智能硬件初創(chuàng)公司變現(xiàn)路徑漫長,甚至大量的資本投入打水漂。機器時代為縮短這種糾結(jié)命運,加快好的創(chuàng)業(yè)項目的進化速度,使用市場的力量宣判不完善的項目盡快迭代或叫停。
(2)創(chuàng)業(yè)者對市場的預判不準確,雖然項目有核心技術(shù),但是無市場化基因,無法形成好的產(chǎn)品形成用戶側(cè)的BOOM。根據(jù)產(chǎn)品的市場反饋,完善產(chǎn)品的迭代升級,打通市場銷路,讓好的產(chǎn)品能夠盡快得到市場認可是孵化成功最有力的基石。
2、智能產(chǎn)品消費的體驗平臺:
解決消費者沒有途徑體驗線上新潮智能硬件的痛點。
京東等線上平臺做了很多年新潮智能產(chǎn)品的眾籌,微商社群營銷也是新潮產(chǎn)品的一個大流量入口,但是他們都解決不了消費者需要體驗,玩轉(zhuǎn)智能硬件的本質(zhì),正所謂:“不上手,再好的AI也出不來”,機器時代正是解決消費者的這一剛需。
3、產(chǎn)品眾籌平臺:
直接將具有市場潛力的產(chǎn)品,經(jīng)過一套嚴選機制,納入囊中,與創(chuàng)業(yè)者共同組織首發(fā)活動,而獨家發(fā)售類產(chǎn)品的稀缺性也進一步增加了這一平臺的價值。
Price 價格
1、降“上柜門檻”:
創(chuàng)業(yè)者可以免費(或以少許費用)在一定時間內(nèi)在其門店陳列演示產(chǎn)品,最簡單粗暴的接觸消費者;當然一旦形成合作,就會有相應的商業(yè)合作條款。(據(jù)筆者了解,目前機器時代有1198家合作廠商,3000余個SKU。)
2、降“購買門檻”:
消費者以體驗價格購買獨家發(fā)售的新奇特產(chǎn)品,既有足夠的吸引力也具備一定的傳播效應。
Place 渠道
1、“機器時代”體驗店進駐在國內(nèi)14家機場,巨大的人群覆蓋率(年3億人群覆蓋),潛在消費者吞吐量絕對是一個獨特的選址優(yōu)勢;同時,機場作為一個高端人群的流量高地,也是移動互聯(lián)網(wǎng)時代“時間戰(zhàn)場”下的英雄用武之地。
2、機場場景覆蓋了一個龐大的支付能力強的消費群體。
在這個特定場景下,登機前打發(fā)時間的消費者非常容易“看見”店面的存在,愿意進店體驗(月均進店6萬+人次)。
同時,這一人群在愉悅返程前有充分意愿購買禮物或其他地方買不到的新奇特產(chǎn)品,轉(zhuǎn)化率非常高。這就好比,在迪斯尼、環(huán)球影城等大的主題游樂場游玩后,消費者特別容易在異常愉快和興奮的情況下走進紀念品店形成消費。
3、對于合作的上游智能硬件初創(chuàng)公司,這是一個具有獨特價值的合作渠道分銷平臺,入駐門檻以及渠道服務的階梯性與創(chuàng)業(yè)階段天然吻合,可謂雙贏
Promotion 促銷
1、利用專業(yè)的產(chǎn)品測評標準,用戶反饋比對等形成專業(yè)意見。據(jù)楊威介紹,初創(chuàng)產(chǎn)品的評分如果能大于70分,產(chǎn)品迭代并成功上市將是大概率事件,反之,低于50分,就需要復盤甚至調(diào)轉(zhuǎn)方向了。對于創(chuàng)業(yè)者來說,這個成績雖然是“裁判員”給的,但是結(jié)果還是要創(chuàng)業(yè)者自己去進一步判斷和承擔。
2、利用大數(shù)據(jù),指導創(chuàng)業(yè)者自省,all in,迭代,還是止損?!皵?shù)據(jù)顯示,一個創(chuàng)業(yè)項目的成功,意味著兩個項目的死亡”,這是一個相當殘酷的市場競爭環(huán)境。
3、該平臺已經(jīng)幫助了100多家公司抓去消費體驗數(shù)據(jù),客訴數(shù)據(jù),洞察消費者喜好,幫助產(chǎn)品的迭代改進。最終打造獨具競爭力的“爆品孵化模型“,與創(chuàng)業(yè)者聯(lián)合品牌,或建立自有品牌。當然,楊威也透露,另有800家公司并沒有實現(xiàn)銷量0的突破,AI產(chǎn)品競爭的殘酷性可見一斑。
4、雖然 “加快創(chuàng)業(yè)者的死亡”的這句口號異常的殘酷和黑色幽默,但是一旦形成口碑,創(chuàng)業(yè)者趨之若鶩,對于楊威來說實現(xiàn)超級孵化IP的打造。
綜上所述,“機器時代”選取AI新型終端這一細分終端市場,通過對這類產(chǎn)品目標客戶群體的渠道占據(jù),實現(xiàn)細分產(chǎn)品、細分渠道、細分客戶的商業(yè)化成功落地。
離開谷歌,回國創(chuàng)業(yè)
EW:一開始你是怎么接觸到人工智能的?
LZF:2005年,我在美國約翰霍普金斯大學讀計算機博士。我所在的實驗室是全世界最好的實驗室之一,我當時做的就是語音識別、自然語言處理以及機器翻譯。
畢業(yè)后,IBM、微軟、谷歌、雅虎、Facebook的offer我基本上都拿到了。最后選擇去谷歌是因為谷歌的機器翻譯團隊是全球最好的。當時谷歌的產(chǎn)品影響力也更大,再加上我自己對創(chuàng)業(yè)文化比較有興趣,所以想去硅谷看看。
EW:在谷歌工作的經(jīng)歷對你的最大影響是什么?
LZF:主要是兩方面。一是基本理念。在學校,我做的是學術(shù),在谷歌,需要把學術(shù)的東西產(chǎn)品化、工程化。對我來說,在將技術(shù)轉(zhuǎn)化成產(chǎn)品上,自己的能力有了一個非常大的提升。二是谷歌的工作機制和文化。因為我自己一直也想創(chuàng)業(yè),除了做好本職工作,我一直在琢磨,谷歌這樣的公司,它為什么能夠這么厲害。
比如谷歌的TGIF(Thank God It’s Friday)大,就是每周五下午舉行的文化活動,我覺得這就挺有意思的。谷歌到今天,應該還是比較扁平化的公司。它不像其他大公司是金字塔架構(gòu),從上往下一層一層,像軍隊一樣把命令嚴密往下推。
TGIF的作用是,它能夠讓員工把公司創(chuàng)始人的戰(zhàn)略跟自己的工作聯(lián)系起來。這是至關重要的。因為眾所周知,谷歌有一大批極其聰明的人,但聰明的人最麻煩的是,如果他們的目標不一致,大家不是非常清楚地知道為什么要做這件事的話,每個人都會有自己強烈的想法,這樣反而可能會以天天吵架收場。通過TGIF活動,創(chuàng)始人可以經(jīng)常地向員工解釋,公司做這個產(chǎn)品的初衷是什么,我們怎么評估對手的競爭,公司接下來的規(guī)劃是什么等。
EW:出門問問也在參考這種做法嗎?
LZF:是的。我們平時也都是每周五下午舉行。
EW:創(chuàng)辦出門問問4年半,你覺得自己有哪些決策做得特別正確,又有哪些失誤?
LZF:很多東西很難說正確還是錯誤,我只不過是沒有什么后悔的。比如,我們當時決定做智能手表,這是一個很大的決定,因為我們的經(jīng)驗不在硬件上。但這是一個我認為很正確的決定,因為有了智能手表操作系統(tǒng),我們才能去跟谷歌達成合作。另一件事情是我們?nèi)ツ曜鲕囕d硬件,也是同樣的道理,因為做了車載,我們可以去跟大眾汽車集團有較大的戰(zhàn)略合作。
人工智能這種技術(shù)行業(yè),是相對長線的,它不像O2O,時間窗口就那么兩個月,過了你就沒機會了。技術(shù)創(chuàng)業(yè)并不是這樣的。我覺得我們沒有失去這種巨大無比的機會,是因為我們有足夠的時間去琢磨產(chǎn)品??赡軟]有特別大的失誤吧,即使有,我們也還不知道。
EW:目前出門問問團隊有多少人?你的性格對公司和產(chǎn)品的影響有多大?
LZF:我們現(xiàn)在有接近350人,占大頭的還是研發(fā),包括硬件、軟件、算法,這部分占了三分之二。
我覺得一家創(chuàng)業(yè)公司的文化也好,對內(nèi)的做事方式也好,一定是跟創(chuàng)始人有特別大的關聯(lián)的。我覺得自己的性格還是比較偏工程師特質(zhì)的,比如,我非常推崇效率至上,我最不喜歡干的事情就是花冤枉錢,像O2O這種資金使用效率很低的創(chuàng)業(yè)項目,即使做成功了,我也不會有很多喜悅感。
工程師都希望用一個新技術(shù)去優(yōu)化資源,最后讓產(chǎn)品有不錯的效果。這也就決定了我們公司,如果要去做特別偏運營主導的事情,我們肯定做不好。在那種競爭模式下,如果不燒錢去拼,你可能真就贏不了。
EW:這是否意味著出門問問在市場推廣方面存在短板?
LZF:是的,尤其在公司發(fā)展早期,在資源和能力都非常有限的時候。我覺得,目前的出門問問,如果跟一家稍微成熟的公司對比,我們的研發(fā)費用在總支出中的占比是過高的。因為我們每天都在想著如何創(chuàng)新,如何在市場上做一個有競爭力的產(chǎn)品。但確實,由于我本身不是銷售出身,這可能就會導致我們在銷售、市場營銷的規(guī)劃和投入上都存在滯后。任何一家創(chuàng)業(yè)公司,一定是從自己最擅長的領域出發(fā)的,比如你讓我?guī)ьI50名工程師開展工作,我會非常擅長這項管理。應該說,這是一個我們必然會遇到的問題,只是看后面我們?nèi)绾谓鉀Q吧。
EW:目前你們研發(fā)投入最高的是哪一款產(chǎn)品?
LZF:智能手表Ticwatch和智能車載后視鏡Ticmirror的每一款產(chǎn)品,我們都花了不少錢,預算都是數(shù)千萬元。我們這種模式的性價比可能是比較低的,其實我們完全可以調(diào)用免費API,能外包的都外包,而且大家普遍覺得,后者才是目前絕大部分做智能硬件產(chǎn)品企業(yè)的模式。但是我們不這樣認為,研發(fā)這一塊,我們?nèi)渴仟毩⑼度?,目前光人工智能算法,我們就有七八十人在做?/p>
EW:回溯這幾年,你覺得哪幾個節(jié)點對于出門問問至關重要?
LZF:主要是兩個吧。第一個關鍵節(jié)點就是我們最初開始做硬件,谷歌投錢的,錢還是蠻重要的。第二個是我們真正把Ticwatch第一代做出來并量產(chǎn),這件事培養(yǎng)了我們公司軟硬結(jié)合的能力。
圍繞語音交互做布局
EW:出門問問4年前曾做過虛擬語音助手,近期你們又了一個虛擬語音助理,在這一產(chǎn)品上,你們經(jīng)歷了一個怎樣的迭代過程?
LZF:我覺得我們早期做的語音助手,更像是一個搜索引擎,問一句話,給一個答案,沒有上下文對話,也沒有遠場語音交互。但是,通過這4年的折騰,今天再看語音助手需要的東西,我們發(fā)現(xiàn),我們當時做的是不對的。比如,在車載或家居的場景下,你沒有一個基本上下文對話,這種語音交互給用戶帶來的價值就非常小。
我們現(xiàn)在做的東西,已經(jīng)不是純粹的語音交互了,而是一個虛擬的個人助理。它除了能跟你說話交流以外,更重要是他能夠懂你,包括你的習慣、常用地址、常去的地方等,能夠向你做很多個性化的推薦,甚至有角色幫你去做事。
這是我們4年前完全沒想到的。比如,你只要跟虛擬助理說,要訂去上海的機票,就不用每次都說我喜歡坐國航的飛機,它是懂你的。這種東西可能慢慢跟語音交互沒什么關系了。包括我們講的跨場景聯(lián)動,4年半前,我們連一個硬件都沒有,有什么能力去思考跨場景聯(lián)動呢。今天,我這兒有設備,我都可以控制,跟以前完全不同了。
整個大環(huán)境也不一樣了,現(xiàn)在像媒體、大公司甚至傳統(tǒng)行業(yè),都在討論人工智能。有人討論,總會有人嘗試,這可以認為是一個螺旋式的上升。做的東西或者描述的東西,可能跟之前比較類似,其實是不一樣的,我覺得現(xiàn)在是一個新的起點。
EW:出門問問推出的系列產(chǎn)品有著怎樣的關系,你們的布局邏輯是怎樣的?另外,智能手表、車載后視鏡、智能音箱等硬件產(chǎn)品,輻射范圍確實挺大,但是對公司來說,會不會有用力太分散的問題?
LZF:肯定有。我同意你說的,會有精力分散的問題。但是我想說,它們其實是有關聯(lián)的,最重要的是,我們想打造一個跨場景的虛擬個人助理,這背后的核心技術(shù)是語音交互。首先,我從來沒有做充電器或電風扇,因為這跟語音交互沒什么關系。我們希望這個語音虛擬個人助理,無論是在你跑步時、在家里還是在開車時,它都能跟你在一起,無處不在。
這樣的話,我們的語音虛擬個人助理,能夠讓用戶熟悉交互習慣,哪些東西能做,哪些東西不能做,這很重要。今天很大的問題是用戶對虛擬助理的認知不對,以為它啥都能做,其實不是。但是,你要知道,在手機上能做的事情,在手表上、車里,它也能夠做到。我們希望,虛擬個人助理能夠?qū)τ脩舻纳钴壽E、個人興趣愛好有更深刻的理解,這樣我們才能提供最貼心的服務。
我們希望通過多場景交互,更深刻地去了解語音交互到底應該怎么去做。舉個例子,當我們做車里的語音交互時,我們發(fā)現(xiàn),它跟在手機或手表上的語音交互是非常不一樣的:在車里,我最希望的是,我不需要用手,不需要用眼睛,也就是所謂的無手無屏交互方式――在車里,你不能問一個問題,再去點一下屏幕,因為你在開車,這樣很危險。按照手機的交互模式,你在車里放一首音樂,中間想換一首歌或者換成導航,你得先按一個按鈕,把音樂關掉,把地圖打開,再用語音說我導航去國貿(mào)之類,這會很傻。
家里又是另一個場景,家里對遠場語音交互要求更高。手機、手表可能是50厘米內(nèi),車載在1米以內(nèi)范圍,但在家里,可能是2~4米的交互范圍,我覺得這對技術(shù)是個挑戰(zhàn)。
EW:亞馬遜有Echo音箱,谷歌有Home音箱,百度也在醞釀推出智能音箱,這些巨頭似乎都想以家庭智能硬件作為人工智能的切入點。家庭智能硬件這件事,國內(nèi)已做了好幾年,目前看仍是雷聲大雨點小,但人工智能公司卻非常看好這個市場,你覺得這是為什么?
LZF:因為沒別的可做。在這一領域,其實不管是媒體還是創(chuàng)業(yè)者,都在關注To C的市場。但我問你,你覺得現(xiàn)在有什么別的石破天驚的新硬件形態(tài)出來嗎?去年爆紅的VR,事實上它也還沒有那么快地實現(xiàn)普及。我覺得智能音箱特別重要。
EW:為什么偏偏是音箱,而不是其他家居產(chǎn)品?
LZF:音箱小、便捷。比如電視,現(xiàn)在很多年輕人都不看電視了。第一,我覺得智能音箱是比較好的產(chǎn)品形態(tài),本身需求還是挺大的。第二,電視要成為一個智能家居的中心還是比較難,你要使用電視,必須把屏幕打開才可以用,這樣很不智能。但智能音箱是個比較輕量的產(chǎn)品,永遠都在那兒,跟智能家居連接起來是比較自然的形態(tài),而且它的額外成本沒那么高,價錢相對便宜。
亞馬遜Echo音箱在國外賣得比較成功。中國跟美國在智能家居的接受度上還是有差距的。在美國,人們對智能音箱這種概念,認知度可能有60%~70%,而國內(nèi)可能只有10%~20%的人了解,這本來就存在認知差距。另外是使用場景,美國本來就有聽音樂和買音箱的習慣,客廳較大,廚房也是開放式的,這些都是造成中美之間差異的原因。但我認為,使用智能音箱是大的趨勢,以后兩國都會趨同的。
仍在探尋爆發(fā)點
EW:在你看來,目前出門問問發(fā)展上的最大煩惱是什么?
LZF:商業(yè)化。其實在目前的人工智能公司里面,我們在產(chǎn)品性能、營收上都是最頂級的。我們是2015年6月智能手表Ticwatch及其操作系統(tǒng)的,而真正大規(guī)模賣,是同年10月。在早期,我們基本都是做線上,今年才開始建立線下團隊。
也有人問過我說,你為什么不先養(yǎng)活自己,先做To B,再去做To C。我的答案是,我們創(chuàng)業(yè)從來不是為了活著,只為活著有什么意義。我從來沒有生存的危機,我們要活著太容易了。我們真的是希望能夠推動一個行業(yè),或者促成一個更大的創(chuàng)新,這才是我們要做的事情。
我希望人工智能技術(shù)能夠真正用起來,最后產(chǎn)生商業(yè)價值。我一直說谷歌,它真是在全世界層面非常成功的一家科技技術(shù)型公司,這個沒人否認。我覺得谷歌能做到今天,就是因為它把技術(shù)用到了可以商業(yè)化的地方,然后產(chǎn)生了非常好的商業(yè)模式,而這又支撐著它能夠不停地進行技術(shù)創(chuàng)新。
人工智能走C端市場,本身就是很難的事情。我從來不認為我們成功了,我認為我們是走了一條非常獨特的路。如果我們再把銷售、市場營銷的能力增強一下,說不定我們真的就能夠做出一家自負盈虧、能夠正向循環(huán)的公司。
EW:現(xiàn)在完全沒有B端業(yè)務?
LZF:我們沒有傳統(tǒng)意義上的B端業(yè)務,但像我們的語音開發(fā)平臺等是面向B端的。我其實沒有那么排斥說一定要做To B或To C,對我來說,我想看到的是,人工智能技術(shù)真正能夠應用起來,解決一些問題,這是最核心的東西。
我們真的不是為了活著而活著。To B的公司有它的好處,養(yǎng)活自己容易,但要做成規(guī)?;浅7浅ky。今天你要到美元上市,你至少營收得有1.5億美金,靠To B我覺得真的蠻難的。但你要是賣設備,To C,如果你把產(chǎn)品做好,把渠道打開,其實沒有那么難。我覺得To C的天花板很高,To B的天花板比較低一點。
EW:出門問問一開始就獲得了真格基金、紅杉資本、SIG海納亞洲的投資,之后是谷歌投資,最近是大眾汽車集團獨家投了D輪。作為公司創(chuàng)始人,你覺得出門問問為什么能夠獲得這些知名投資方的垂青?
LZF:我覺得這是要分早期和后期的,不一樣。無論是早期的紅杉、真格還是SIG,這些機構(gòu),說白了是投資我的個人背景以及我的團隊,還有我們在技術(shù)上做出的一些demo。
其實今天也是一樣。我屬于較早一批在美國谷歌本部工作,然后要回國創(chuàng)業(yè)的科學家之一。這種背景的人,在當時是非常稀缺的,甚至稱得上獨一無二。
真正懂語音交互、自然語言處理的PH.D,對紅杉或真格這些早期投資基金而言,你能夠在美國一家最頂尖的學校拿到博士學位,在一家最頂尖的工業(yè)實驗室做科學家,這本身就是一個很大的背書,而人工智能創(chuàng)業(yè)這件事,本身又是技術(shù)驅(qū)動的,所以對他們來說,當時可能也沒有別的更好的選擇。所以我說,早期真的基本上是靠我個人、我的團隊以及一些基本的技術(shù)拿到投資的。
如果說我再重新做一次出門問問的創(chuàng)業(yè),我覺得早期的投資對我來說很簡單,只是后面的東西,今天我要再重新做一遍,還真不一定能成功。到后面,我們中間還有別的戰(zhàn)略投資者,無論是谷歌還是大眾汽車,我覺得我們能拿到這些投資還是有獨一無二的價值在里面。
EW:你所謂獨一無二的價值,具體是指什么?
LZF:比如2015年,谷歌要把它的智能手表操作系統(tǒng)帶進中國,但是它的語音助手Google Now在中國是不能用的。這時候,谷歌要在國內(nèi)找合作伙伴。出門問問之所以獨一無二,是因為我們當時的智能手表已經(jīng)是一個端到端的產(chǎn)品了。谷歌一看我們的產(chǎn)品,放上去基本上跟在美國是一樣的,無論是體驗還是配套服務,都已經(jīng)非常完備了。
當時國內(nèi)智能手表產(chǎn)品的端到端,就是語音搜索、語義識別、垂直搜索、內(nèi)容的對接,到最后,整個服務包括圓形屏幕這種手表的展現(xiàn)方式,市場上除了我們之外,真的沒別的公司,現(xiàn)在大家可能覺得不可能。如果不找我們,可能谷歌語音用訊飛,語義用另一家公司,搜索內(nèi)容、UI界面再找另一個團隊。那時候我們真的是谷歌唯一的選擇。
大眾汽車也一樣,因為他們不是一個VC的投資,他們希望通過跟我們合作,能夠在汽車方面產(chǎn)生一個非常快的協(xié)同效應。比如我們的問問魔鏡(即Ticmirror),大眾汽車覺得,無論從硬件、軟件、算法,還是從內(nèi)容以及語音的交互上看,這都是他們過去想了很多年都沒有實現(xiàn)過的東西。這時候,大眾汽車如果想在智能化方面快速行動,想建立一個比較扎實的啟動點,想在未來提供一個什么樣的體驗的話,那我不認為在中國除了我們,還有別的公司有這種能力。
EW:D輪這1.8億美元打算怎么用?
LZF:重點會投入到母公司出門問問以及跟大眾汽車合資開設的子公司身上。母公司仍然專注做人工智能,各種算法、迭代,另一塊是人工智能的產(chǎn)品化和商業(yè)化,我們已經(jīng)做了可穿戴手表和家居智能音箱,未來可能還有其他商業(yè)化產(chǎn)品,我們會去擴充業(yè)務方向。子公司就是做汽車的智能化。到目前來說,怎么在汽車不聯(lián)網(wǎng),連4G、攝像頭都沒有,屏幕也很差的情況下,先把汽車的智能化做起來,這是我們正致力解決的問題,也是雙方合作的目標。
EW:國內(nèi)有你比較欣賞的創(chuàng)業(yè)公司嗎?不一定是人工智能行業(yè)的。
LZF:我不能f欣賞,我比較羨慕像今日頭條那樣的公司。它還是有一些核心技術(shù)的,然后用這個技術(shù),快速做出了一家具有海量用戶且有很高用戶黏性,最后實現(xiàn)了商業(yè)變現(xiàn)的公司。它的模式還是比較清晰的。我想,這其實是很多技術(shù)創(chuàng)業(yè)者夢寐以求但不一定能達到的。