1、未來是AI云端的數據競爭時代
“兵無常勢,水無常形”,今年11月4日,我國《反不正當競爭法》歷時24年后首次修訂,專設“互聯網專條”用以規制互聯網行業競爭生態,但此時,互聯網行業的競爭形態已由產品服務競爭、平臺生態競爭發展到數據競爭階段。
時間倒回2003年,在3712與百度搜霸案中,周鴻祎與李彥宏赤膊交鋒中文搜索市場。再到2013年開始的3Q、3百與3狗大戰,以及優酷系列廣告屏蔽案,不同的產品服務跨界進行平臺競爭,此時,這些爭議可以利用新反法專設的“互聯網專條”進行有效規制。然而,互聯網江湖風云乍起,AI新貴今日頭條未獲平臺授權批量抓取、同步新浪微博用戶數據,硬件巨頭華為在Magic手機中利用微信用戶聊天記錄進行AI服務推薦,凡此種種,創新的產業與穩定的法律反差強烈,“互聯網專條”稍顯力不從心。
進入“互聯網+”與“人工智能”時代,隨著算力與算法的突破,人工智能在多次往復突破后,終于迎來新機,我們看到,微軟小冰可以寫詩,騰訊的DreamWriter在奧運會期間寫了800篇新聞報道,今日頭條的AI算法實現了千人千面的推薦,AlphaGo、騰訊絕藝等實現了人工智能在單一領域的人類超越,人工智能已經能寫詩、作畫、創作小說、剪輯電影、制作創意海報。而這一切,都依賴于海量數據的喂養訓練,特別是,算力、算法的突破為互聯網上流動的海量數據提供了最完美的商業可能。
未來的競爭,將是在云端之上,依賴大數據的AI競爭。
2、數據競爭問題在全球引發爭議
在美國加州的Computer History Museum陳列著世界上第一臺采用了人工智能學的移動機器人Shakey,意為搖搖晃晃的機器人,其在1966年到1972年間由Stanford Research Institute研制,體積龐大,但運算速度緩慢,需要數小時的時間來分析環境并規劃行動路徑。但是,未來或許,機器人總動員中的Wall?E,《西部世界》中的“高科技成人樂園”會在不遠的將來出現。借用當今流行的一句話,“我們只知未來將至,卻不知未來已來”,以數據為生產資料的新經濟形態也被多國認可,并且寫進了《G20數字經濟發展與合作倡議》。
當前,BAT與華為、京東、今日頭條、搜狗等國內企業以及Alphabet、微軟、Facebook等全球科技巨頭均傾全力押注人工智能技術,甚至百度提出了“Allin AI”的戰略,數據作為AI時代的新石油,誰掌控了數據,誰就掌控了競爭格局,其重要性不言而喻。自新世紀以來,在全球范圍內,有關數據的爭議與案件頻發,遍及民事、行政與刑事各個領域,甚至從反不正當競爭領域到延伸到了反壟斷領域。
在國內,從2008年開始,大眾點評訴愛幫網系列案件最早涉及“數據競爭”的問題,大眾點評指責愛幫網大量復制其網站內容,主要是商戶介紹與用戶點評內容信息。大眾點評不惜先后在京滬兩地以著作權侵權、不正當競爭等為訴由起訴,其代理人于國富律師在其博客中寫到,“愛幫網如此長時間大范圍的惡性侵權如果不被判令承擔高限賠償,法律難容”,可見當時爭議的激烈程度。
繼大眾點評案之后,有關“數據競爭”的爭議不斷出現。諸如,2013年百度訴360違反robots協議案、2015年新浪訴脈脈非法抓取微博用戶數據案、2016年大眾點評訴百度地圖抓取用戶點評信息案、2017年運滿滿訴貨車幫盜取用戶信息案,以及淘寶屏蔽百度搜索,順豐與菜鳥有關物流數據接口的爭議,新浪與今日頭條有關微博內容爬取的爭議,華為在Magic手機中利用微信用戶聊天記錄進行AI服務推薦等,這些爭議無一例外,均與平臺的海量數據有關。
而在國外,有關數據競爭的爭議已經延伸至反壟斷領域。2017年6月,數據分析公司hiQ向加州北部法院提起訴訟,主張Linkedin擁有市場支配地位,推動法院于8月份發出臨時禁令,要求Linkedin在24小時內容移除引人妨礙hiQ獲取其公開數據的技術障礙,目前此案并未審結。在此之前,2016年在評估批準微軟公司收以260億美元收購LinkedIn的交易時,歐盟委員會重點關注領英的數據價值以及對手網站是否可以復制這些數據等問題。
3、保護與數據流動存在先天沖突
數據本身是一個復雜、模糊與開放的概念,此文無意對其進行清晰界定,其實,數據大體與作為知識產權客體的知識產品具有相似特性。物理上的無形性與可傳輸性,經濟學上的非競爭性與非排他性,這些特性使得數據同多數知識產品一樣,可以進行法律擬制的財產權保護與無損的數據流動。
事實上,基于商業競爭的考慮,具有數據優勢的平臺傾向于將“數據”資源作為競爭優勢在自有體系與合作伙伴之間流動,有學者認為這可能會產生數據拒絕交易和歧視對待的問題,但于競爭政策的視角去討論可能更加復雜。不管是因為,基于既有的若干判例,如新浪訴脈脈案與大眾點評訴百度案,法院明確承認,數據平臺對于平臺內的信息具有一定的控制權,即使在現階段是否賦予其“勞動成果權”還存有一些爭議。還是因為,互聯網與數據反壟斷問題本身就是一個在現階段很難明確,并需要謹慎對待與慎言的問題。
分析既有的爭議,我們發現,數據競爭不僅僅是一個上游之治的問題,除了諸如華為magic讀取用戶微信聊天信息的爭議外,順豐與菜鳥關于物流數據API接口的爭議則發生在同階平臺之間,而新浪微博與脈脈、新浪微博與今日頭條的爭議則反映了后進入市場者對既有平臺海量數據的垂涎。“羅馬不是一日建成的”,數據平臺方的數據優勢建立需要長期的成本投入,其他市場競爭者在未獲數據平臺方授權的情況下,非法抓取平臺數據,直接觸及對方核心商業資源,顯然不妥。
北京知識產權法院張玲玲法官在新浪訴脈脈案提出了數據流動與使用的三重授權原則,也即平臺之間的數據流動(Open API模式)需通過“用戶同意+平臺同意+用戶同意”的模式,較為周延的平衡了用戶與平臺利益保護以及數據流動的關系。事實上,因為平臺數據多涉及用戶隱私、數據安全、消費者利益以及平臺利益等問題,數據平臺方可以通過平臺協議、robots協議、API限制以及技術保護措施等手段控制、限制數據合作與數據保護的范圍與方式。數據抓取方如未獲授權,則必然動輒得咎,除了行政與民事風險,甚至面臨刑事風險。
4、競爭關鍵在于公共領域的研究
當前數據爭議的核心在于,我們是否要為數據賦權?以及,我們需要什么樣的“數據權”?在此問題討論前,我們借用Jessica litman教授在在論述版權法制度的經典表述,私以為,“公共領域才真正是“數據權”法的前提和基礎,離開了公共領域,人類根本無法容忍“數據權”制度的存在。”那么,我們討論數據賦權以及“數據權”范疇設定的關鍵就變為,“數據權”的公共領域是什么?我們反其道而行之,可以打開通往“數據權”制度的一扇“后窗”,借此窺探“數據權”的邊界,以有效平衡用戶、數據平臺、數據使用方以及其他參與方與社會利益的關系,并基于用戶權利、公共利益與競爭政策的協調為數據定章立規。
當前,歐美等國家與地區均在探索建立數據產權與流動規則。基于用戶權利考慮,隱私權利、用戶遺忘權、數據可攜權、數據安全等在國內外立法實踐中均有討論,并已分別在GDPR(General Data Protection Regulation,歐盟通用數據保護條例)、《網絡安全法》《民法總則》等國內外立法中有所體現。
基于公共利益考慮,我們認為政府公共數據、自然氣象數據、醫療數據等關系國計民生福利的數據在產權設定與流動使用應更多考慮社會福利與公民福祉。而基于競爭政策考慮,為了防范市場失靈,除了在反不正當競爭領域的司法探索外,我國應重點研究建立“數據權”的限制與例外制度,當然,我們首先要考慮數據是否可以成為市場力量的來源?不同數據類型、不同產業領域,以及不同競爭主體間的特定行為是否在競爭減損方面有所區別,以及此類競爭減損與效率促進之間如何平衡,以及如何救濟。至于在數據經濟驅動下的網絡效應評估、相關市場界定、市場支配力衡量,甚至于反壟斷理論更新等問題,研究工作任重而道遠。
此外,近期關注兩個問題,其實與“數據權”公共領域問題的研究關系密切。
其一,“數據權”設定的有效路徑是什么?我國《民法總則》征求意見稿的最初文本將“數據信息”一體納入“知識產權”進行保護,后遭多數專家反對,最終全國人大將數據信息與虛擬財產單列進行財產概括性保護,這是我國立法在“數據權”設定方面的謹慎嘗試,也反應了數據與知識產權的復雜關系。其實,知識產權在諸多學術著作中被表述為“信息產權”。
而從域外經驗來看,早在1992年,歐盟委員會通過《數據庫指令草案(Commission Proposal for a Council Directive on the Legal)》確立了數據庫權(database right)。數據庫權衍生于版權體系,以保護實質投資為目的,賦予數據庫控制者對抗它人對數據庫內容提取的排他權利,并存在著若干平衡性安排,如對合法利用人的非實質性部分的提取或再利用行為進行限制性排除,并規定了若干“法定許可”,雖存爭議,但仍可為借鑒之有益經驗。私以為,借鑒“數據庫權”模式可以解決多數的與“數據權”相關的財產性權益爭議。
其二,用戶同意與平臺協議的關系,也即在未經數據平臺方同意,甚至是平臺協議反對的情況下,第三方僅獲用戶授權,能否大批量、自動化抓取用戶已在數據平臺方發布的數據內容。
今年8月9日,今日頭條突然開始通過用戶授權直接把新浪微博的內容自動搬家到今日頭條。面對大量用戶與數據溢出的情況,新浪堅決切斷了與今日頭條的內容接口,并在海淀區法院立案起訴,此案尚未審結。私以為,即使搜索引擎與抓取技術中立,但從技術倫理與商業倫理角度,此類行為的規制應在技術創新與數據平臺方激勵之間尋求平衡。新浪在微博用戶數據的整個生命周期中持續投入,如新浪法律專家王磊所言,“數據的集體涌現性使得“大數據”出現了系統組成前單個要素所不具有的性質”,平臺為數據賦能,法律保護應有所傾斜。
此問題的討論并未結束,才是剛剛開始。
-
AI
+關注
關注
87文章
31077瀏覽量
269412 -
大數據
+關注
關注
64文章
8896瀏覽量
137514
原文標題:AI時代數據之爭,我們需要什么樣的“數據權”?
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論