云知聲創始人黃偉
黃偉中,科大博士,上海交大生命科學技術學院博士后,畢業后任職摩托羅拉中國研究中心資深研究員,期間開發出了世界第一款手機聲紋認證系統。后出任盛大創新院核心高管,并創建了語音分院。2013年底加入國內人工智能引領企業云知聲任職首席執行官,負責云知聲發展戰略和運營管理戰略規劃。自1999年起參與項目研究至今已獲得涉及醫療、管理信息系統、自然科學、語音、游戲等多個領域的產品成就,例如在2002到2004年間參與美國國家標準技術署說話人識別評測(NIST SRE)項目獲SRE主任務第一名,并獲得當年最高的“金星獎”,也是現如今唯一一位能夠在NIST評測中連續兩年做keynote speaker的華人。獲MIT TR35 2007年度提名,2009年獲上海市十佳科技創業領軍人才。
云知聲創始人黃偉的成就
當你還無法察覺的時候,很多改變人類的新技術已經在無聲無息中蛻變、成長,誕生于上世紀50年代的人工智能就扮演著這樣的角色。
“互聯網女皇”瑪麗·米克爾在報告中大篇章的描述了語音識別交互帶來的改變,人工智能成為科技發展的重頭戲已經毋庸置疑,物聯網場景下的應用需求在不斷擴大,智能語音技術在智能家居、智能汽車、教育等領域的應用逐步深入,帶動著智能語音產業規模的持續快速增長。
黃偉表示,PC互聯網時代,聯網設備主要是PC,移動互聯網時代,聯網設備主要是手機或平板。而到IOT時代,一切設備都可能聯網,IOT聯網最大的特點是沒有屏幕,不像手機平板那樣以觸碰為主,第二,設備離人比較遠,這時候我們就希望用一種完全自然的,像人和人對話的方式來控制它們,所以,語音識別就成了解決這一痛點的最佳方案。
兩年的技術探索
2012年成立云知聲的時候,我們的具體方向仍然未定。當時看到了移動設備的飛速發展,我們認為可能未來在智能設備上,聲音會成為一種重要的交互方式。
當時的數據庫非常的小。于是我們便一邊做數據搜集,一邊升級我們的算法。云知聲2012年6月成立,3個月后我們發布了基于傳統統計模型的第一代引擎。
我們的第一代引擎,將準確率提升到了85%。當時業界的領軍者科大訊飛(55.330, -1.79,-3.13%)的準確率是80%。
2個月后我們的深度學習引擎上線,準確率提升到了91%。基于這個引擎,我們開發了微信上第一款語音輸入插件。插件上線第一周,激活用戶數超過5萬。
我們開發了一個開放的平臺,任何人、任何組織只要在我們的平臺上注冊,就可以免費使用我們的SDK(軟件開發工具包)。在你的APP里接入我的SDK,就可以免費調用我們的服務。
2013年底,我們的這個平臺上,接入的企業客戶數量達到接近一萬家。我們靠著這些用提供的數據,不斷的進行數據迭代和算法優化,我們的準確率提升到了94%。如今,這個平臺上的企業客戶數達到了三萬家。
依托物聯網的商業化之路
云知聲成立之初的2年,主要精力都用在對技術模式的探索上。到了2014年,我們逐漸意識到,再好的技術,只有當它變成對用戶有價值的產品時,它才有商業價值。于是我們開始考慮商業化的路應該怎么走。
2014年時,我們開始規劃云之聲未來的定位,定位是產品模式和業務模式的基礎。我們發現留給創業者的空間不多了,APP的紅利期已過,流量掌握在BAT手中。做與科大訊飛雷同的業務,我們沒有科大訊飛身后強大的政府支持,很難在競爭中勝出。
最終,我們決定做物聯網(LOT)。物聯網在當時是一個新興業務,當時BAT沒有涉及,科大訊飛也沒有相關的布局。再加上行業內沒有已經成功的壁壘,我們由此切入再適合不過。
此外,移動互聯網總有觸及天花板的一天。 當移動互聯網觸及天花板的時候,一定會有新的機會出現。我們認為物聯網可能就是這個機會。
做物聯網一定會面臨新的挑戰,表象上的模式不同,基礎的模式也會不同。首先便是終端的變化,終端變得更加多元化,家里的冰箱、空調、洗衣機等,都將是智能化的。
因此,做物聯網一定要與硬件結合,甚至要與芯片結合。而很多設備是不插電的,這就要求同時做到低能耗。這種模式的轉變,需要許多底層的基礎變革來支撐。
所以2014年,為了做物聯網,云知聲完成了兩個重要的舉措。首先是引入高通成為云知聲的戰略投資方。再加上內部架構的調整,成立了LOT事業部,占云知聲總人數的一半以上。
具體來說,我們還確定了新的產品形態。我們根據用戶場景倒推,未來用戶的形態應該是,比如,在客廳的沙發上,自然的與空調對話,而不需要湊上去和它交流。
場景設定好之后,倒推需要什么樣的產品,里面需要哪些技術。我們第一個落地的客戶是樂視,樂視的第三代TV,也是國內第一款做遠距離自然語音交互的TV,2015年5月份開始在市場上銷售。
現在我們的產品已經被國內幾乎所有的大廠接受,像格力、美的、海爾、海信、TCL等都是我們的客戶。而且,到目前為止,我們是國內唯一能做到這個的廠商。
落地醫療行業
除了硬件方面的探索,另外我們希望選擇一些垂直行業進行落地,最終我們選擇了醫療行業。
之所以選擇醫療行業,首先,醫療是一個很大的市場。并且,目前平均每個醫生每天整理病例要花掉3.5到4個小時。我們開發了一套系統,醫生可以利用麥克風輸入病例。北京的協和醫院引進我們的系統后,平均每個醫生每天整理病例的時間從超過3小時,降低到了1個小時。
另外,在和協和醫院院長聊天的過程中,他告訴我,其實有80%的誤診是模板拷貝造成的。每個人的體質不同,病癥不同,模板無法準確的記錄病人的情況。利用我們的系統,醫生可以因人而異的進行病理錄入。
未來我們希望將這個產品集中精力和資源,把醫療行業做深、做透。目前我們的產品已經進入了包括北京協和醫院在內的幾十家醫院。而國內僅三甲醫院就有1500家,中醫診所四萬多家,還有更多的非三甲醫院。我們可以看到,未來這個市場是非常龐大的。
另外,我們可以將這個產品復制到任何需要文字錄入的行業,比如,司法領域可以,傳媒領域也可以。
目前云知聲的精力主要用在三個方面,一是,核心技術的儲備與研發;二是,業務的成長,過去2年的商務探索,我們的產品形態和業務模式都相對比較清晰了,未來要做的是盡快的擴張;三是,加強公司治理。
堅持才有收獲
作為一家專注于物聯網人工智能服務的公司,自2012年6月成立以來,云知聲利用機器學習平臺,在語音技術、知識計算、大數據分析等領域建立了領先的核心技術體系。而在應用層面,已形成「云端芯」生態閉環。
云知聲曾連續兩年入選福布斯中國最快科技成長公司50強企業,同時也是中國AI行業成長最快的創業公司之一。
今年3月,云知聲推出的專門針對智能家居的AIOS@Home(人工智能操作系統)。
此次,雷鋒網新智造采訪了云知聲創始人黃偉,跟他聊了聊過去一年云知聲的發展、現狀、公司今年的目標以及他對人工智能行業前景的看法。
創業維艱,尤其對處在萌芽階段的AI行業更是如此。云知聲創始人黃偉稱創業五年來每一年都如履薄冰,每一天都過得非常煎熬。
因為作為一家公司的CEO每天都要考慮很多事情、作出決定,每一個重大決定都有可能關乎公司未來發展方向。這不是原來他在大公司單純的作技術leader時只是負責一些工作安排所能比較的,現在他更多要考慮公司出路、人事和柴米油鹽等方方面面的事情,復雜程度不可同日而語。
在聽起來很「高大上」的AI行業,實際的發展卻困難重重。AI行業的產品難以落地,造成的結果是大多數AI公司都處于虧損狀態。作為一家AI創業公司,如果沒有其他業務反哺,就很難在像Google和Amazon這些巨頭們的夾縫之中存活下來。
而這些公司要想獲取生存空間,就需要把有限的資源投入到公司正確的戰略方向上,把技術做得更加商業化并持續產出。要做到這些并不容易,「到目前為止,我也不認為這個問題得到了很好的解決」,黃偉說。
即便如此,黃偉向雷鋒網新智造表示2016年他的收獲還是很大,過去一年云知聲的發展讓他信心十足。
“我們從技術的迭代到產品模式的探索,再到商業模式的探索,去年我們算是初步走通了,至少我們把技術變成了產品,而且把這個產品形成了主營業務,這個是比較大的收獲。當然,過程是煎熬的,AI技術現在還是不成熟的,把不成熟的技術變成可商業化的產品,這是個比較大的挑戰。產品比較新,客戶對這個是沒有統一標準的,你要不斷滿足他會對你提出的無休止訴求。今天你看到商業落地的背后,其實是經過無數糾結和不斷地打磨后的結果,我們對落地是非常有信心的。”
「創業的過程中重要的是堅持」,在信心這一點上,團隊的凝聚力和戰斗力也給了他很大支持。只要戰略方向明確,他相信堅持下去才會有所收獲。
AI的落地有諸多障礙,但技術領先于整個行業
在具體的業績方面,黃偉表示對去年云知聲的業績比較滿意。
但過程中會有一些困難,一方面是云知聲在硬件上的考慮不足,他們在供應鏈和成本等方面遭遇了一些障礙。
另一方面,產品標準主要由客戶主導,這個標準要遠遠高于同行業其他公司,而嚴格的產品測試也拉長了生產周期。
除了產品標準高,云知聲在技術上的優勢也領先于整個行業。尤其在智能家居領域的技術指標上,和其他公司對比,黃偉稱云知聲的優勢「幾乎是碾壓式的」。
“事實上,云知聲在AI領域的落地,不只是戰略上的提前布局,更是用行業領先的技術去撬動這個市場。”
營收年內將突破9位數,業務在不斷擴張
據黃偉透露,云知聲今年的營收預計會突破9位數。在融資方面,今年會啟動新一輪融資。云知聲獨立IPO也會很快提上議程,他希望能在兩三年內上市。
黃偉也透露了云知聲今年的業績目標,他表示所有的目標都是可預期的,其中大部分都在執行去年已有的訂單。
雷鋒網新智造了解到,在教育評測領域云知聲之前大約每天1億次的調用量,而整個平臺的調用量每天2億多次,這在國內排在前三位;智能車載領域,云知聲覆蓋到了600多萬臺終端,占據整個后裝市場接近70%的份額;在醫療服務方面,目前已跟全國30多家醫院簽約;而在智能家居上,云知聲也在眾多AI公司中遙遙領先。
“今年云知聲計劃在智能家居達到100萬臺的出貨量,教育評測平臺調用量上達到3~4億次,醫療領域會新增100家醫院進行合作,智能車載會覆蓋到1000萬臺終端。”
黃偉告訴雷鋒網新智造,雖然云知聲業務在不斷擴張,但公司目前暫時不會擴展到其他領域,而是依靠品牌優勢先在已有項目上進行深度挖掘,從而擴大市場占有率。在人員配備方面,公司目前200人左右,但他表示并不會貿然大規模招攬人才,人員會適度擴張10%左右。
看到AI前景不是瞎蒙的,真正的AI絕對不止是深度學習
在2012年黃偉決定創業伊始,當時APP創業正如火如荼,但云知聲的定位就是IOT(物聯網)的AI服務商,從而一直堅持到如今AI的浪潮襲來。
黃偉認為,在現在看來很有遠見的堅持是在當時理性而清楚地考慮后形成的結果。在當時不被投資人看好的情況下,毅然決定做toB,因為他清楚地認識到這一波AI創業潮里有工業技術背景的并不多,而他在大學畢業后就加入了摩托羅拉等公司,他們在技術和市場上有一定了解和積累。
在2006年深度學習鼻祖Hinton教授提出這個概念之后,微軟在2011年間將它應用到語音識別領域,當時黃偉的師兄俞棟在意大利佛羅倫薩交流時曾告訴他這是趨勢,這給了他一些啟發。
而在2012年12月28日云知聲的深度學習引擎上線后,它也隨即成為了國內深度學習的引領者。
“我們看到AI的前景并不是瞎蒙的,而是我們的技術背景和對這種趨勢的敏感。”
談到AI未來的發展,黃偉悲觀和樂觀兼而有之。悲觀的一點是,「在AI行業有江湖騙子在欺騙大家」,黃偉對此直言不諱。他認為人們嘗試用深度學習解釋一些東西,但大腦并不是這樣的,「人會舉一反三,可以自學習,但機器不會。」
黃偉還稱真正的AI不是深度學習或者絕對不止是深度學習,強人工智能還離我們比較遠,但也不排除在我們有生之年實現的可能,因為它的突破不光是算法上的突破,還包括計算能力和知識結構上的突破。
另一方面,黃偉的樂觀在于對AI行業里面一些良心企業的信心,他認為這些公司會取得技術突破,從而帶動和加快AI的發展進程。在技術的迭代上,他的態度較為理性。
“跟機器人談戀愛這是很難實現的,但讓機器像助理一樣解決問題,這在三年之內很容易實現。估高(AI)預期的目標我是比較悲觀的,但很多可執行的方向我認為比我們想象的可能都要快。”
-
語音識別
+關注
關注
38文章
1742瀏覽量
112700 -
云知聲
+關注
關注
0文章
188瀏覽量
8399 -
黃偉
+關注
關注
0文章
3瀏覽量
1776
發布評論請先 登錄
相關推薦
評論