阿里開源首個DL框架，新型XDL幫你搞定大規模稀疏數據

12月21日，阿里巴巴旗下的大數據營銷平臺阿里媽媽開源了其應用于自身廣告業務的算法框架X-DeepLearning（XDL）。該框架非常擅長處理高維稀疏數據，對構建推薦、搜索和廣告系統非常有優勢。此外，阿里還配套發布了一系列官方模型，它們都是阿里在實際業務或產品中采用的高效模型。

在XDL開源前夕，記者采訪了其團隊的四位主要負責人：

靖世，研究員，阿里媽媽定向廣告技術團隊負責人兼阿里媽媽算法平臺負責人

見獨，資深技術專家，阿里媽媽工程平臺技術負責人

懷人，資深算法專家，阿里媽媽算法平臺深度學習方向負責人兼定向廣告排序算法團隊負責人

樂迪，資深技術專家，阿里媽媽大數據計算與機器學習平臺的工程架構負責人

「高維稀疏數據的數據處理、模型計算以及在線服務一直是深度學習應用于業界的一個核心挑戰區。作為一個真實在廣告業務下解決過大量技術問題的團隊，我們為了解決這些問題提出了大量的方法。阿里媽媽第一代的基于深度學習的CTR模型研制與大規模線上部署都是XDL支撐的，我們將其中對業界有貢獻的部分提供給用戶，希望做出對大家有增量的東西。」靖世這樣描述XDL開源的初衷。

而現有框架在處理高維稀疏數據的「痛點」究竟在哪里？使用的模型有什么不同？更加具體的，XDL框架如何使用？如何與現有框架及模型結合？XDL團隊為機器之心的讀者做了詳細的解答。

XDL項目地址：https://github.com/alibaba/x-deeplearning

高維稀疏數據怎么搞？

其實最早的時候，阿里巴巴深度模型的研發也是在嘗試已有的框架，例如Caffe、TensorFlow和MXNet等。但當時阿里巴巴發現已有框架在生產化方面有很多局限，首先第一個是大規模稀疏數據的處理能力，其次是如何實現結構化數據。

大規模稀疏數據體現在搜索、推薦和廣告等任務上，例如某系統一共有10億的商品量，那么用戶是不是訪問過每一個商品就是一維特征。因此，表征用戶的特征維度就可能有10億維，而只有訪問過的商品才有值「1」，未訪問過的商品全為「0」，這也就是高維稀疏的意義。這樣的結構和傳統機器學習一個特征矩陣加一列標注很不一樣，因此也就需要特定的框架高效處理。

除了用戶的稀疏表征，商品同樣也是稀疏的，它們可能有各種各樣的特征，例如顏色、形狀、圖像和名稱等。在一般的推薦系統中，樣本都是平鋪的，例如一個用戶點擊了商品1和商品2。那么樣本1為（用戶，商品1）、樣本2為（用戶，商品2），這種平鋪的數據是非常低效的，因此XDL對于大規模稀疏數據有一個結構化的過程。這種結構化會將實體與實體之間的復雜關系進行關聯化，并繼續投入到計算中，因此XDL整體就是一個結構化的計算流。

其實XDL團隊在處理大規模高維數據后，發現整個計算模式可以進一步提升，以前的張量計算流也許可以使用結構化的計算流代替。可能讀者對數據結構化還是缺少了一種直觀感受，如下圖所示為簡單的數據結構化。其中左邊的樣本是傳統平鋪的訓練數據，而右邊的樹型結構化會大大降低存儲需求。

圖示：如上圖所示左邊為平鋪的數據，其一個用戶配一個商品（Item）就為一個樣本，用于表征用戶的高維特征需要重復使用。而箭頭右邊樹型結構化的數據會節約很大的存儲成本，它同樣表示三個獨立的樣本。

XDL團隊表示在淘寶原來的信息流廣告里，他們需要300臺以上的機器才能支持模型訓練一次。但是這種結構化數據大大簡化了數據的表示，因此整個數據集減少了一百倍以上的硬盤存儲，計算速度也提升了十多倍。因此最后本來需要幾百臺機器的模型訓練，可以精簡到十臺機器左右就能完成訓練。

最后，除了數據結構化，模型同樣也可以結構化。因為當阿里巴巴開始探索將圖像、文本和語音等信息加到推薦等系統時，他們會發現這些信息和其它信息又是一個復雜的結構化關系，因此他們開始將模型的分布也結構化。首先數據根據結構關系可以分布在不同的機器上，而這些結構同樣可以將計算分配到不同的機器上。所以將模型的計算與數據的結構耦合在一起，它們間的計算量和通訊傳輸量都能有效降低。

所以以上幾點是XDL整個的脈絡，XDL團隊表示它主要在三個層面上對通用框架有比較大的提升：

首先是對大規模稀疏性數據的建設；

其次是結構化的計算流；

最后在結構化的計算流基礎上，模型的分布也需要結構化。

當然，這些都是XDL團隊在實踐中的探索，它們也并沒有完美處理各種高維稀疏的情況。但是經過阿里巴巴業務上的檢驗，整個框架和配套開源的推薦/廣告/搜索算法都被被證明非常有效。也許通過開源社區的共同參與，高維稀疏數據的處理能更高效。

用于解決不完全信息下的開放問題的模型

「圖像、語音、文本，都是在完全信息下定義的封閉問題。而互聯網領域里的機器學習是不完全信息下的開放問題。」靖世概括道。「圖像像素已經表征了所有信息，模型能力如果達到極限，就應該能夠判定圖像中有什么東西，獲取目標信息。而在互聯網領域，可選數據非常多。以電商為例，除了item級別的表征之外，商品圖像、詳情頁信息、評論……都是可以引入的相關數據，但即使囊括所有可得的相關數據，其合集仍然不是完全信息。」

而模型的意義，就是能夠從數據中找到特定的規律，既能夠擬合現有數據，又能夠有一定的推廣性。從業務的角度出發，找規律的過程中用到的「數據」，應該是平臺能夠充分利用所有可得的信息，無論它是以何種形式呈現的。而如何將盡可能多的、類別各不相同的信息引入到模型中，就是XDL著重解決的一個問題。

用于廣告、推薦、搜索這樣任務中的模型，可能乍一看很「簡單」：它們不會像單純的視覺模型一樣有數以百計的層數，也不會像純粹的NLP模型一樣用模型結構跨越漫長的時間步，幾層的模塊、全連接的模塊在系統里都會很常見。然廣告等領域模型的其復雜性正是體現在其「復合」這一特點上。

當模型的輸入數據異構特性非常明顯的時候，稀疏數據需要做嵌入、時序的數據需要過LSTM模塊捕捉時序關系、圖像數據需要逐層卷積抽象不同粒度的特征，串聯多種特征轉化為其他網絡可接受的輸入后，還要進行統一的稠密的計算。不同網絡的聯動，乃至進一步到系統層面，樣本的I/O問題，數據流水線的優化工作、訓練階段機器之間頻繁的大量的參數交換等等問題，都是沒有相應框架就做不了的。

因此，任務與數據形態的不同，看起來是帶來了一個算法問題，其實是導致最大的變動出現在框架。樂迪舉了個例子，「模型結構復雜了之后，其內部的前向與后向計算的迭代就很難用標準化的方式去做了，批規模的安排、超參的設計與反饋速率，都會極大影響迭代過程。TensorFlow劃分了ps（parameterserver）和worker，但是worker不會再切分。我們的模式可以把模型任意地切分，每一部分都可以選擇不同的迭代速率等參數，從而讓整個復雜網絡的訓練變得非常高效。」

「像八爪魚套八爪魚。」靖世打了個比方。這樣的模型的體量通常十分驚人，見獨表示，阿里的場景下，模型的參數規模通常會到達幾十億甚至上百億，內部應用的模型已經有千億規模出現。

和XDL一起開源的就有一些阿里媽媽實際在用的、驗證過有用的「八爪魚」模型，在xdl-algorithm-solution文件夾里，首批就公開了六個模型，其中包括利用圖像信息幫助點擊率預估的DICM以及以預估CTR為約束刻畫用戶興趣的DIEN。

CrossMedia Network(論文中具體指Deep Image CTRModel，DICM)，旨在幫助精準展示廣告系統為每次投放請求選擇收益最大化的廣告。CrossMedia Network主要利用圖像信息，包括用于展示和點擊的廣告圖像（Ad image）和用戶點擊過的商品組成的用戶行為圖像（User behavior images）。利用這兩類信息，結合原有ID特征，DICM模型對于每個廣告展示樣本的點擊或未點擊的二元判別，進而轉化為點擊率預估。

Deep Interest Evolution Network(DIEN)模型主要用于定向廣告排序中的CTR（點擊率）預估階段，應用于阿里媽媽定向廣告各大產品中。傳統的點擊率預測算法通常直接將用戶歷史行為表示用戶興趣，DIEN提出了興趣抽取和和興趣演化兩個模塊，在興趣提取模塊用auxiliaryloss約束模型找到能夠推測出后續的行為的隱層表達，在興趣演化模塊用GRU模塊根據不同的預估目標商品構建不同的興趣演化路徑。??

除了框架、模型之外，XDL也有提供數據和服務的打算：

「很多測試用戶反映模型跑不起來，那我們內部也整理了一些覺得對業界比較有用的數據，在保護用戶隱私的前提下，打算以公開數據集的形式發布出來。這個體量對于阿里的業務本身來說可能已經很小了，但是相信對于研究者使用框架跑一些算法驗證還是很有幫助的。但是真實數據的規模是非常龐大的，比如我們在某個場景只抽出了1%的數據出來，大小仍然有50G的規模。」

而懷人也提到，當結構復雜后，在線預估也會遇到瓶頸：「我們也正在探索根據數據前向計算所需算力的分布，用不同的硬件來做對應的計算，最終做到全局最優化。」在未來，XDL也計劃在訓練框架之外，進一步開源高性能在線推理服務引擎，將超大規模模型參數的分布式存儲、分布式計算問題也一并解決。

XDL的使用姿態

對于開發者而言，最關心的可能是XDL如何使用，以及它能幫助我們獲得怎樣的提升。想象一下，如果我們已經費了九牛二虎之力構建出一個TensorFlow深度模型，然而最終發現它在高維稀疏數據下效率很低。那么我們該如何將這個模型遷移到XDL，并利用其數據結構化與模型結構化的優勢進行高效訓練？

XDL團隊表示他們在文檔上會有一個完整的示例，如果我們寫了一個完整的TensorFlow模型，那么基本上模型定義部分就不需要修改了，我們只需要在外圍寫大概十來行的分布式驅動代碼就行。增加了XDL的分布式驅動后，單機的TensorFlow模型就能分布式運行，并具備XDL面向高維稀疏數據的大規模并行能力。

靖世表示，其實我們可以認為XDL構建了一個大型高維分布式計算圖，我們可以將TensorFlow構建的靜態計算圖嵌入到XDL分布式計算圖中。然后在大型計算圖中，TensorFlow構建的子圖可以調用對應的框架，并完成計算。所以說如果模型已經進入到密集的運算及架構設計上，那么其實我們可以將這個子圖包裝一下并嵌入到XDL中。

此外，值得注意的是數據格式，XDL團隊表示輸入數據流是根據框架定義的規范和格式，我們需要根據這些格式來準備數據。但是當數據流進入到單機上的稠密網絡時，所有數據結構會自動轉化為TensorFlow內部的數據格式，我們可以按照TensorFlow那樣的格式定義后面各種各樣的網絡。雖然XDL定義了新的數據結構，用戶必須按照經優化的模板定義數據結構，但這樣統一的格式可以避免保存、部署和遷移等遇到的大量問題，也能獲得更多的性能提升。

總的而言，在使用XDL構建大型分布式計算圖后，分布式數據流也需要按照格式定義才能傳入該計算圖。隨后我們可以將自己用TensorFlow構建的計算圖嵌入到XDL計算圖中，且當XDL數據流傳輸到該獨立的子計算圖時，它會轉化成對應深度學習框架的數據格式，并調用對應的后端完成計算。

TensorFlow嵌入實例

在XDL的使用示例中，其展示了如何結合密集型特征和稀疏性特征，并完成聯合訓練。其中密集型特征可能是圖像或語音等數據，而稀疏性特征可能是用戶和商品之間的訪問關系。這就相當于將TensorFlow模型嵌入到XDL中，并承擔密集型特征運算，而XDL本身會處理稀疏性特征。

在這個示例中，模型包含一路密集型特征(deep0)以及兩路稀疏性特征(sparse[0-1])，稀疏性特征通過Embedding計算生成兩個8維密集型向量，并與本來的密集型特征拼接后執行4層全連接層運算，并最后得出模型損失。

代碼地址：https://github.com/alibaba/x-deeplearning/wiki/%E5%BF%AB%E9%80%9F%E5%BC%80%E5%A7%8B

首先是讀取數據，我們可以定義讀取器，并配置線程數和批量數等讀取等設定。因為數據格式是有規范的，所以我們可以像使用Pandas讀取CSV那樣簡單地抽取不同類型的數據，包括稀疏的訪問記錄和密集的圖像數據等。

隨后我們需要定義模型，這里可以分為兩路，即稀疏和稠密。其中稀疏數據可以借助XDL構建稠密的特征向量，這有點類似于構建NLP中的詞嵌入向量，它在保留用戶和商品等信息的情況下盡可能為密集計算提供便利。

在構建嵌入向量后，它就應該與前面密集型特征拼接在一起并完成第二路的稠密計算。這里僅使用三層全連接網絡作為示例，但是我們可以根據需要完成各種復雜的神經網絡。此外，由于已有的框架在這些計算上非常有優勢，因此我們可以直接導入TensorFlow等框架，并將密集型計算分配給它們，這正相當于將子計算圖嵌入到了XDL分布式計算圖中。

最后，我們只要定義最優化器與對應的訓練過程就行了，當然損失函數等訓練信息也需要在這一部分定義。如下所示，值得注意的是，這里是直接運行XDL定義的計算圖，并不用管嵌入的TensorFlow計算圖是什么樣的。此外由TrainSession可見，XDL采用的也是一種靜態計算圖。

當然，這可能只是最簡單的一種用法，模型的計算主要集中在單機后面的密集型網絡中。但是XDL其實還是構建了一個分布式計算圖的，它可以理解為多個不同的單機節點構成的復雜網絡。其中不同表示我們可以構建很多子網絡，這些子網絡可以使用XDL構建一個更龐大的深度學習網絡。這種高級應用其實在業務中很常見，因為搜索、推薦和廣告等場景需要的系統通常都非常大。當然如果只需要XDL高性能的分布式訓練，我們可以僅簡單地嵌入單個計算圖。

本文來源：機器之心

閱讀全文

阿里(32682) 阿里(32682)
deeplearning(4824) deeplearning(4824)
XDL(2317) XDL(2317)

2017雙11技術揭秘—阿里巴巴數據庫技術架構演進

第三代大規模分庫分表向第四代X-DB分布式數據庫系統演進的目標。X-DB分布式數據庫的落地已經在2017年雙11大促中獲得了可行性驗證，同時底層開始引入存儲計算分離架構。分布式在系統穩定性、容災能力

2018-01-02 16:31:04

3G上網本大規模使用不會影響網速

，也不會造成語音通話擁堵”。　　大規模3G上網不會影響網速　　三種3G標準都是基于CDMA碼分多址技術的，語音通道和數據業務通道是分開的。本身3G最大的優勢就是提供基于數據業務的服務，我們可以從技術

2010-03-16 09:10:48

5G大規模MIMO天線陣列3D OTA測試

5G將使用多天線技術，通過結合增強的空分復用為多個用戶提供數據，稱為大規模MIMO。一個結論是不能采用傳導方式評估輻射方向圖性能，因此必需通過OTA方式。本文介紹使用OTA測試裝置測量天線三維方向圖

2019-06-10 07:36:36

5G大規模多入多出(MIMO)測試臺：從理論到現實

（MAC）執行時所需的實時性能需求理想情況下，這些的屬性可被快速自定義以滿足更多更廣泛的研發需求。基于NI平臺的大規模MIMO應用程序框架將軟件無線電、時鐘分配模塊、高數據吞吐量PXI系統以及

2014-12-24 14:13:12

5G毫米波終端大規模天線技術及測試方案介紹

【摘要】本文首先介紹了全球毫米波頻譜劃分情況，然后通過對毫米波特性的分析，總結了毫米波終端將面臨的技術挑戰，著重介紹了終端側大規模天線技術、毫米波射頻前端技術的研究進展，并根據毫米波終端的特點分析了

2019-07-18 08:04:55

大規模FPGA設計中的多點綜合技術

大規模FPGA設計中的多點綜合技術

2012-08-17 10:27:46

大規模MIMO的利弊

（Multiple-Input Multiple-Output，MIMO）時，數據的傳輸速率可能會下降50％以上。大規模MIMO被認為是5G網絡的關鍵支持技術之一。MIMO是無線通信中已被確立起來的技術，利用該

2019-06-18 07:54:32

大規模MIMO的性能

軌跡產生的容量斜坡仍然比需求線平坦。面對此挑戰，3GPP 標準實體近來提出了數據容量“到2020 年增長1000 倍”的目標，以滿足演進性或革命性創意的需要。這種概念要求基站部署極大規模的天線陣

2019-07-17 07:54:10

大規模區域監控與通信系統的SOPC芯片組，看完你就懂了

大規模區域監控與通信系統的SOPC芯片組，看完你就懂了

2021-05-26 06:46:11

大規模天線技術商用測試

作為提升5G系統頻譜效率最直觀的物理層技術之一，大規模天線技術自問世以來，受到了來自學術界、工業界的廣泛關注。樣機測試為了克服信道信息獲取困難、解決導頻污染、以及計算復雜度大幅提升等問題，測試

2019-06-13 07:49:29

大規模天線陣列介紹

解讀5G通信的殺手锏大規模天線陣列

2021-01-06 07:11:35

大規模特征構建實踐總結

Server相關的資料，但我們在實際實踐中，發現大規模的特征預處理也有很多問題需要解決。有一次和明風（以前在阿里，后來去了騰訊做了開源的PS：angel）交流過這部分的工作為何沒有人開源，結論大致

2018-11-19 09:35:28

大規模集成電路在信息系統中的廣泛應用

信息系統處理的共同點如下：1、處理種類不多，且多系固定的、復用的；2、要求實時性；3、是決定信息質量的因素之一考慮到這些條件，設備結構則以硬件控制為宜，因此，需要邏輯運算和存儲器用的大規模

2014-09-11 11:27:25

大規模數據集的相似度計算原理

Spark MLlib 之 大規模數據集的相似度計算原理探索

2020-06-04 08:19:16

開源框架教程（二）—— iOS APP開發

如何使用核心模塊開發設備控制功能（iOS APP開發）導讀：本次教程我們在開源框架代碼基礎上做一個控制gokit紅燈開的App，Wi-Fi設備接入機智云客戶端調試工具包括 iOS Demo

2016-11-28 18:14:48

數據庫廠商都怕低價競爭？阿里云說并不可懼

的QPS;其次要有超大規模的存儲，阿里云POLARDB現在可達100TB存儲空間;最后是生態，數據庫必須要兼容開源生態。　　云原生數據庫像一輛跑車，跑車有很多特性，比如外觀、速度，但是一個有這樣外觀和速度

2018-05-11 11:02:53

阿里云與WPS深度合作，開放數據處理生態

數據管理提供有力工具。引入文檔預覽能力的底層依賴產品--對象存儲OSS,已經不僅僅是“存儲”。依托高性能的阿里云數據中心網絡與豐富的開源計算系統，提供了方便、簡單、經濟的數據分析和加工能力。OSS是中國

2018-04-18 14:11:36

阿里云免費使用及手冊

.................................................... 5超大規模數據中心遍布全球 .......................................... 55 大優勢，助客戶從0 搭建到秒級部署云環境

2018-05-10 21:17:45

阿里云在LC3大會上透露未來要做的兩件事

摘要：阿里云研究員褚霸在LC3大會上同多位業界資深大咖同臺交流表示，阿里云發展到今天，把過去應對淘寶、天貓大規模計算以及雙11的計算能力轉換成普惠的能力放在云上，這是一個非常大的挑戰，也是其他廠商

2018-07-02 15:27:20

阿里云宣布與國內規模最大的汽車企業上汽集團合作

摘要：云棲大會·上海峰會，6月7日，阿里云宣布與國內規模最大的汽車企業上汽集團合作，上線業內首個混合云汽車研發仿真計算服務平臺——上汽仿真計算云SSCC（SAIC Simulation

2018-06-19 16:04:24

阿里云開放物聯網技術開發平臺

和智能骨干。它為全球客戶提供一整套云服務，包括彈性計算、數據庫、存儲、網絡虛擬化服務、大規模計算、安全、管理和應用服務、大數據分析、機器學習平臺和物聯網服務。根據 IDC 的數據，按

2022-03-08 08:50:09

阿里巴巴開源的通用緩存訪問框架JetCache介紹

摘要： JetCache是由阿里巴巴開源的通用緩存訪問框架，如果你對Spring Cache很熟悉的話，請一定花一點時間了解一下JetCache，它更好用。JetCache可以做類似Spring

2018-04-24 16:09:38

阿里巴巴統一的超大規模數據計算平臺MaxCompute的探索與實踐

阿里關濤談大規模計算—從數字化阿里到數字化城市的進化

2019-05-16 07:46:04

阿里平頭哥發布首個 RISC-V AI 軟硬全棧平臺

HHB 實現了在典型網絡性能比第三方工具平均提升 88%，并增加支持運行 Transformer、TensorFlow、PyTorch 等 170 余個主流框架 AI 模型。基于此，平頭哥發布了首個

2023-08-26 14:14:40

ADI高功率硅開關可節省大規模MIMO RF前端設計中的偏置功率和外部組件

多輸入、多輸出（MIMO）收發器架構廣泛用于高功率RF無線通信系統的設計。作為邁入5G時代的一步，覆蓋蜂窩頻段的大規模MIMO系統目前正在城市地區進行部署，以滿足用戶對于高數據吞吐量和一系列新型業務

2021-05-19 09:33:41

AI開發者福音！阿里云推出國內首個基于英偉達NGC的GPU優化容器

GPU計算平臺。阿里云推出國內首個基于英偉達NGC的GPU優化容器3月28日，在2018云棲大會·深圳峰會上，阿里云宣布與英偉達GPU 云合作（NGC），開發者可以在云市場下載NVIDIA

2018-04-04 14:39:24

Cloud Foundry平臺中國唯一云供應商，阿里云持續鏈接Cloud Foundry/Kubernetes生態

Foundry適用于多種云、多種框架和多種語言”阿里云首席架構師唐洪表示，“阿里云致力于為客戶提供多種選擇，并且一如既往地致力于為開源社區做貢獻。”目前用戶們可以在阿里云上安裝和部署Cloud

2018-05-10 09:37:16

MQTT通信開源項目的系統構成框架

基于STM32和阿里云物聯網平臺的MQTT通信開源項目有哪些使用注意事項？

2021-10-09 09:35:11

RFSoC數位射頻在大規模MIMO無線電系統有什么應用？

)服務，與第四代無線網絡相比，約提升100倍。大規模MIMO，或稱大規模數組天線(Massive MIMO)是達成效能提升的關鍵技術，尤其適合于6GHz以下不常使用的時分雙工(TDD)頻段，如Band

2019-09-11 11:52:36

Veloce平臺在大規模SOC仿真驗證中的應用

隨著現代集成電路技術的發展,尤其是IP的大量使用,芯片的規模越來越大,系統功能越來越復雜,普通的EDA和FPGA仿真在速度和性能上已經無法勝任芯片仿真驗證的要求,功能驗證已經成為大規模芯片設計的一個

2010-05-28 13:41:35

java開源工具包-Jodd框架

作為Java開源工具包和小型框架，具有很多便利功能，常用功能如下：1. 提供操作Java bean，2. 可以從各種數據源加載Bean,3. 簡化 JDBC 的接連與代碼，4. 剖析 SQL 查詢，5.

2018-03-19 16:13:22

一個大規模電路是怎么設計出來的？？？

組合成電路，比如一個電視機的電路板上電子元件縱橫交錯，怎么設計組合成那樣的，還有各與器件參數大小怎么算的?數字電路的各個門，模擬電路的三極管，單個是簡單，就是不明白怎么組合成大規模電路的。書上就那么幾個簡單的電路圖，網上也查詢過，還是沒得出答案，誰能幫忙解決下。非常感謝！！！

2012-12-24 20:34:42

一個benchmark實現大規模數據集上的OOD檢測

評價算法的性能。為此，這份工作建立了新的benchmark，在ImageNet-1k級別的數據集上設立了一個全新的benchmark。并提出了一種基于group的OOD檢測框架，該框架對大規模圖像分類

2022-08-31 15:11:09

一張圖讀懂阿里巴巴一站式研發協同云——云效

工具支撐，助力企業快速創新迭代和研發效能升級，幫你通通全搞定，Boss再也不用擔心我沒法如期交付啦！點此查看原文：[url=]http://click.aliyun.com/m/41380/[/url

2018-01-31 14:32:21

一種工作于Sub-6G的5G大規模天線的系統架構探討

技術開發過程中會遇到的技術難題提出解決措施建議,在此基礎上，探討后續5G大規模天線的發展趨勢和優化方向。人類社會對信息數據傳輸的巨大需求推動著通信技術的不斷向前發展，每一次移動通信的升級，對應了下行

2019-07-16 08:12:54

介紹一種適合大規模數字信號處理的并行處理結構

本文提出了一種基于FPGA的適合大規模數字信號處理的并行處理結構。

2021-04-30 07:16:52

企業打開Redis的正確方式，來自阿里云云數據庫團隊的解讀

的集群架構以及讀寫分離架構，滿足高讀寫性能場景及容量需彈性變配的業務需求。關于非關系型數據庫，阿里云還有可根據不同場景切換引擎的MongoDB 3.4、首個全托管的DBaaS服務HBase 1.1，與開源

2018-02-07 14:06:16

企業打開云HBase的正確方式，來自阿里云云數據庫團隊的解讀

PC Server上搭建起大規模結構化存儲集群。一、HBase的歷史由來HBase是一個開源的非關系型分布式數據庫（NoSQL）,基于谷歌的BigTable建模，是一個高可靠性、高性能、高伸縮的分布式

2018-05-31 15:57:40

使用xdl -ncd2xdl test.ncd生成xdl文件出現警告怎么解決？

嗨，首先，我使用xdl -ncd2xdl test.ncd生成xdl文件進行讀取。然后，在xdl文件上沒有任何更改，我使用xdl -xdl2ncd test.xdl，但是有警告，警告

2020-04-22 06:57:31

全新一代人工智能計算引擎MaxCompute杭州開服，強化阿里云大數據能力，比肩谷歌微軟

覆蓋金融、互聯網、零售、電子商務等，典型客戶包括微博、華大基因等。此前，MaxCompute已在全球部署開服12個節點，其中8個海外節點。憑借大規模計算存儲、多種計算模型、強數據安全和低成本的優勢，受到

2018-03-28 14:33:09

共建、共享開源EDA核心共性技術框架｜2023開放原子全球開源峰會開源EDA分論壇成功舉辦

現有的PCB設計流程，另一方面需要體現仿真驅動和規格驅動的先進性，其包含四個層級，即數據層、高性能計算層、開源框架層和應用層。現已開發多個第三方接口，高校和企業可以通過開源或閉源的方式，接入電磁場仿真

2023-06-16 13:45:17

勻一枯大規模奪頂替

頂替枯大規模奪頂替頂替

2018-01-05 18:50:55

華為大規模邏輯設計指導書方法論

華為 大規模邏輯設計指導書方法論

2019-11-22 22:52:12

華為大規模邏輯設計指導書

華為大規模邏輯設計指導書。非常詳細地介紹了邏輯設計的規范要求及方法。

2020-01-27 17:58:38

華為_大規模邏輯設計指導書

本帖最后由 eyesee 于 2017-3-2 09:29 編輯華為_大規模邏輯設計指導書

2017-03-01 11:56:34

華為_大規模邏輯設計指導書

華為大規模邏輯設計指導書

2015-04-20 13:41:35

華為_大規模邏輯設計指導書

2012-08-18 08:11:53

如何去推進FTTH大規模建設？

如何去推進FTTH大規模建設？影響FTTH大規模建設的原因有哪些？

2021-05-27 06:58:13

怎么實現大規模電動汽車的生產

大規模電動汽車生產需要先進的電池化成和測試系統

2021-01-27 06:59:50

支持Dubbo生態發展，阿里巴巴啟動新的開源項目 Nacos

趨勢，8年前微服務架構思想也順應了這個趨勢，今天面向“服務”的各種分布式基礎設施正在變得越來越重要，站在阿里巴巴10年的服務化發展經驗上看，在大規模服務發現和服務治理和服務共享領域現有的開源解決方案

2018-07-05 17:35:45

機智云開源框架介紹

機智云物聯網開源框架App工程（Eclipse工程）https://git.oschina.net/dantang/GizOpenSource_AppKit_Android 介紹：機智云開源框架

2016-12-27 15:47:27

機智云APP開源框架介紹

機智云物聯網開源框架App工程（Eclipse工程）介紹：機智云開源框架（GizOpenSource_AppKit_Android）是開源的適用于物聯網的軟件框架，用于無縫的支持設備到設備的互聯

2017-02-15 17:56:40

構建大規模MIMO的難點在哪？

構建大規模MIMO的難點在哪？高功率硅開關的應用案列分析

2021-03-11 07:05:03

樹莓派使用Socket發送數據至阿里云服務器ECS并存入數據庫的方法

的信息；深聯智達 DL-20 2.4G zigbee無線串口收發模塊將采集到的信息從單片機發送給樹莓派；樹莓派4B將接收到的數據再轉發給阿里云服務器ECS；阿里云服務器ECS對接收到的數據進行處理，存入

2022-02-18 06:48:19

每秒幾十萬的大規模網絡爬蟲的煉成

每秒幾十萬的大規模網絡爬蟲是如何煉成的？

2019-05-27 15:02:25

求一種基于STM32F4開發板和阿里云平臺的MQTT通信開源項目

基于STM32F4開發板和阿里云平臺的MQTT通信開源項目有哪些使用注意事項？

2021-10-11 07:46:28

物聯網APP開源框架教程（二）—— iOS APP開發

在機智云開發者中心創建新產品。首先選擇產品分類和方案，為產品添加數據點，最后為產品創建應用。為了幫助大家更好地理解整個創建過程，我們在視頻里穿插著介紹了開源框架、數據點、數據點模板、Product key

2016-12-07 10:54:00

獨家專訪阿里高級技術專家北緯：Dubbo開源重啟半年來的快意江湖

的挑戰，能夠更真切地感受到自己負責的組件在其中承擔的作用從而帶來了很大的成就感。談“Dubbo”時隔3年阿里的開源Dubbo 3.0滿血復活！對于 Dubbo 框架，大部分 Java 開發者都不會

2018-05-16 22:27:26

獨家專訪阿里高級技術專家北緯：Dubbo開源重啟半年來的快意江湖

2018-05-16 22:27:25

直擊DTCC2018 阿里數據庫技術干貨全面解析

方面的挑戰及我們的解決方法。演講嘉賓：孟慶義阿里巴巴技術專家，專注在大數據領域，擁有多年分布式、高并發、大規模系統的研發與實踐經驗，先后參與hbase、phoenix、lindorm等產品的內核引擎

2018-04-27 17:58:00

請教大神如何去管理大規模數據？

請教大神如何去管理大規模數據？

2021-05-11 06:56:54

請問一下大規模MIMO的原型怎么制作？

大規模MIMO的原型怎么制作？

2021-05-24 06:25:09

超大規模商用 K8s 場景下，阿里巴巴如何動態解決容器資源的按需分配問題？

雜亂和形態各異的窘迫。雜亂，是因為作為一個異軍突起的新型技術棧，很多配套工具和工作流的建設處于初級階段。Demo 版本中運行良好的工具，在真實場景下大規模鋪開，各種隱藏的問題就會暴露無遺，層出不窮。從

2019-10-15 14:47:38

輪胎壓力監測（TPM）系統有望獲得大規模應用

輪胎壓力監測（TPM）系統有望獲得大規模應用。

2021-05-12 06:02:56

阿里攜手星巴克推動AR新技術商業落地,大規模商用正式開啟

據阿里方面透露，該項AR方案由阿里巴巴人工智能實驗室（以下簡稱阿里AI Labs）聯合星巴克共同開發，“這是阿里最新的大型場景內的AR識別技術，在全球第一次大規模的商業應用”阿里 A.I.Labs負責人淺雪表示。

2017-12-05 15:13:38

865

基于坐標下降的并行稀疏子空間聚類方法

隨著數據規模的不斷擴大，稀疏子空間聚類問題面臨計算上的巨大挑戰。現有稀疏予空間聚類算法如交替方向乘子法（ ADMM）往往基于串行實現，難以利用多核處理器提高處理大規模聚類問題的效率。針對這個

2017-12-23 11:48:44

基于雙稀疏正則的圖像集距離學習框架DSRID

基于雙稀疏正則的圖像集距離學習框架（double sparse regularizations for image set distance leaming，簡稱DSRID）．在該框架中，兩集合間距離被建模成其對應的內部典型子結構問的距離，從而保證了度量的魯棒性和判別性．根據不同的集合表示方

2017-12-26 19:06:52

稀疏數據中基于高斯混合模型的位置推薦框架

協同過濾和概率模型是位置推薦中的常用方法，但前者沒有考慮用戶的移動模式，后者也難以用于稀疏數據集。針對上述問題，面向稀疏數據構建基于高斯混合模型的位置推薦框架GMMSD。按時間段劃分用戶簽到

2018-01-17 10:12:08

阿里云發布視覺計算平臺天擎,可支持大規模、高并發的視頻實時分析需求

7月4日，阿里云ET城市大腦發布大規模視覺計算平臺天擎。據悉，天擎是繼天曜、天鷹、天機后，ET城市大腦的第四款AI視覺產品，該產品可支持大規模、高并發的視頻實時分析需求。

2018-07-09 09:43:45

3798

阿里巴巴最具商業價值的深度學習框架X-Deep Learning要開源了

對于難以與BAT研發能力比肩的眾多互聯網公司而言，工業級深度學習框架XDL及內置算法方案的開源，將助力各大公司的技術升級，大大提升廣告/推薦/搜索場景的精準性，縮短技術迭代周期。

2018-11-29 09:29:40

3554

阿里巴巴首次公開深度學習框架——X-Deep Learning

阿里巴巴首次公開深度學習框架——X-Deep Learning，可提升廣告、推薦、搜索場景效率XDL 是首個面向高維稀疏數據場景的深度學習開源框架。數據的高維稀疏性既是阿里媽媽業務場景的重要特征

2018-11-29 10:02:52

4145

阿里開源大規模分布式圖學習框架：專為Graph嵌入，無縫對接TF/PyTorch

為了支持我們的業務，我們不僅面臨超大規模圖存儲與計算的挑戰，還需要處理由多種不同類型的點，邊及其屬性構成異構圖的復雜性。我們的分布式圖引擎針對海量圖存儲，分布式并行圖計算及異構圖進行了優化設計，確保了工業場景下的有效應用。

2019-01-20 08:51:23

3328

阿里媽媽技術團隊對Euler的詳細解讀

AI 科技評論消息，繼去年 11 月開源面向高維稀疏數據場景的深度優化工具 X-Deep Learning（截至發稿，GitHub Star 數已達到 1972）之后，阿里媽媽團隊于今日正式開源大規模分布式圖表征學習框架 Euler。

2019-01-22 14:02:39

7812

阿里開源首個移動AI項目，淘寶同款推理引擎

阿里開源首個移動AI項目，淘寶同款推理引擎，這是阿里開源的首個移動AI項目，已經用于阿里手機淘寶、手機天貓、優酷等20多個應用之中。覆蓋直播、短視頻、搜索推薦、商品圖像搜索、互動營銷、權益發放、安全風控等場景。在IoT等移動設備場景下，也有若干應用。

2019-07-03 09:53:29

284

曠視科技正式宣布開源新一代核心深度學習框架曠視天元國產深度學習框架開源勢在必行

3月25日下午，中國人工智能領軍企業曠視科技舉辦線上發布會，正式宣布開源新一代AI生產力平臺Brain＋＋的核心深度學習框架曠視天元（MegEngine），成為全球首個將底層框架開源的人工智能企業。

2020-03-26 11:50:06

3658

阿里云機器學習研究員對大規模機器學習實踐的見解

近年來，機器學習技術的發展歸因于我們有極其龐大的數據用來訓練算法。當企業需要落地大規模機器學習時，往往會面臨很多難題，如何解決這些問題？如何系統了解大規模機器學習落地的技巧？其適用

2020-07-31 16:22:12

648

阿里發布分布式圖計算平臺，將極大推動圖計算進入“普惠時代”

11月9日，在第二屆世界科技與發展論壇上，阿里發布全球首個一站式超大規模分布式圖計算平臺GraphScope，并入選中國科學技術協會“科創中國”平臺。GraphScope可處理萬億規模的圖數據，能在

2020-11-10 09:39:52

1846

58.3萬筆/秒！阿里云扛住全球最大規模流量洪峰

11月1日0時至11月11日0點30分，2020年天貓雙11全球狂歡季的實時成交額突破3723億元，創造新消費的里程碑。而天貓雙11的訂單創建峰值更是達到58.3萬筆/秒，阿里云又一次扛住全球最大規模流量洪峰！

2020-11-11 11:32:18

5630

阿里云宣布推出業內首個云原生企業級數據湖解決方案

Formation（DLF）、E-MapReduce（EMR）等計算引擎無縫對接，兼容豐富的開源計算引擎生態，可滿足大數據系統統一存儲、海量數據規模。

2020-12-21 14:07:11

2429

基于工況劃分的大規模電廠機組控制數據可視化

基于工況劃分的大規模電廠機組控制數據可視化

2021-06-27 15:14:55

達摩院發布開源新型聯邦學習框架FederatedScope

5月5日，達摩院發布并開源新型聯邦學習框架FederatedScope，該框架支持大規模、高效率的聯邦學習異步訓練，能兼容不同設備運行環境，且提供豐富功能模塊，大幅降低了隱私保護計算技術開發與部署難度。

2022-05-05 15:22:00

1105

用于弱監督大規模點云語義分割的混合對比正則化框架

為了解決大規模點云語義分割中的巨大標記成本，我們提出了一種新的弱監督環境下的混合對比正則化（HybridCR）框架，該框架與全監督的框架相比具有競爭性。

2022-09-05 14:38:00

999

阿里巴巴算力攻堅新突破：阿里云20%新增算力將使用自研CPU

11月3日，在2022杭州云棲大會上，阿里巴巴公布了自研算力體系新進展，其自研CPU倚天710已經在數據中心大規模部署，并以云的形式服務阿里巴巴和多家互聯網科技公司，成為中國首個云上大規模

2022-11-03 11:39:47

727

阿里巴巴：自研CPU倚天710已大規模應用性價比提升超30%

云數據中心大規模部署，并以云的形式服務阿里巴巴和多家互聯網科技公司，算力性價比提升超30%，單位算力功耗降低60%。據了解，2021 年云棲大會，阿里平頭哥發布首顆CPU芯片倚天710，該芯片針對云場景研發，同時兼顧了性能與易用性。倚天710處理器芯片采用了5納米

2022-11-03 14:42:14

613

NVIDIA 助力 DeepRec 為 vivo 推薦業務實現高性能 GPU 推理優化

本案例中，vivo 人工智能推薦算法組自研的推薦服務平臺，使用阿里巴巴開源大規模稀疏模型訓練和預測引擎 DeepRec，在稀疏模型訓練（稀疏功能、I/O 優化）和高性能推理框架層面，實現其搜廣推各類

2023-01-18 00:55:01

548

SDMNet：大規模激光雷達點云配準的稀疏到稠密匹配網絡

為了處理上述的問題，我們提出了SDMNet，一種新的由稀疏到密集的針對大規模室外點云的配準方法。稀疏到稠密匹配方案如圖1(c)所示。具體而言，我們將配準問題分為兩個階段，即稀疏匹配階段和局部稠密匹配階段。在稀疏匹配階段，給定要對齊的源點云和目標點云、。

2023-05-24 15:53:43

592

PCB板生銹困擾你？別煩惱了，這些Tips幫你搞定問題！

2023-09-25 10:03:59

534

已全部加載完成

搜索歷史

阿里開源首個DL框架，新型XDL幫你搞定大規模稀疏數據

評論