1. OpenCV 4.5 發布!DNN 模型在 ARM 平臺的推理速度提升到業界第一梯隊 | OpenCV中文網
摘要:4.5作為2020秋季常規版本,大多是在修補/完善/優化,因5.0版本快要到來,4.x系列版本“基本”已經進入“穩”而不張的維護階段。 主要更新: Apache 2 授權協議,避免專利算法給 OpenCV 引發潛在糾紛;國內公司OPEN AI LAB優化后的 OpenCV DNN 在 ARM 上的表現喜人,在新引擎 Tengine lite 加持下,速度獲得了較大幅度提升,性能數據見原文; SIFT 專利到期,成為公有技術,代碼被移到主庫; 新增了實時單目標跟蹤算法SiamRPN++; 針對RISC-V指令集進行了優化。 DNN 模塊改進了對一些層和激活函數的支持(ONNX: ReduceSum, Gather, 改進的Reshape等),后端支持 OpenVINO 到2021.1版,并修復和優化了對CUDA 的支持。[NeuralTalk]
2. AI突破次元壁又火了!《飛屋環游記》動漫角色一秒變真人,網友:小羅的“貓王發型”有點酷
Github: https://github.com/eladrich/pixel2style2pixel Paper: https://arxiv.org/pdf/2008.00951.pdf
從“換臉”到“生成漫畫臉”,AI在圖像合成方面的技術已經非常成熟了。 因為支持一鍵切換,而且效果逼真,之前抖音的一款「變身漫畫」特效還登上微博了熱搜,從明星到路人,近千萬用戶參與。國外也有一款「秒變迪士尼公主」工具網站,上線當天就因為訪問量過大而被迫下線。 這件事也引起了一位AI藝術家Nathan Shipley的好奇心,AI生成漫畫臉如此逼真,那么反過來,將動漫角色轉化為「真人」效果會怎么樣?剛好最近國外研究團隊推出了一款通用版AI模型——Pixel2Style2Pixel(pSp)。 因此,Shipley便利用這款AI模型,嘗試將《超級總動員》《飛屋環游記》等電影中的經典動漫角色進行了轉換,結果也因效果太贊登上了Reddit熱榜。 這張《超級總動員》中的“飛毛腿”巴小飛,「真人版」形象比「動漫」更具喜感。
3. 歐洲發布最強AI超級計算機LEONARDO,超算系統格局將發生變化
超算系統份額將有所變化,從即將在11月發布的全球500強榜單開始。 雷鋒網按,本周在意大利CINCA研究中心揭幕的Leonardo(萊昂納多)超算是用了14000個Nvidia GPU,Nvidia稱其為“世界上最強大的AI系統”,這個系統在某些半精度浮點(FP16)應用中提供10 exaflops的AI性能,在以Top500為基準進行測試時,可以提供大約200 petaflops算力。這一系統的推出,也將從今年底開始改變歐洲超算系統的格局。 作為獨立公司,Bull不可能像今天在意大利的CINECA那樣。但有了這個系統的支持,以及其他許多將在明年進入超算Top 500的系統,Atos至少在歐洲是絕對值得關注的HPC系統。
4. 跨越重重“障礙”,我從 PyTorch 轉換為了 TensorFlow Lite
本文作者分享了他在 PyTorch 到 TensorFlow 之間轉換的經驗,或許可以給我們一些啟發。 我最近不得不將深度學習模型(MobileNetV2 的變體)從 PyTorch 轉換為 TensorFlow Lite。這是一個漫長而復雜的“旅程”,需要跨越很多障礙才能成功。我發現自己從 StackOverflow 帖子和 GitHub 的問題中搜集了一些信息。我的目標是分享我的經驗,以幫助其他像我一樣“迷失”的人。 將深度學習模型(MobileNetV2 變體)從 PyTorch 轉換為 TensorFlow Lite,轉換過程應該是這樣的: PyTorch → ONNX → TensorFlow → TFLite 為了測試轉換后的模型,我生成了一組大約 1000 個輸入張量,并為每個模型計算了 PyTorch 模型的輸出。這個集合后來被用來測試每個轉換后的模型,方法是通過一個平均誤差度量,在整個集合中將它們的輸出與原始輸出進行比較。在相同的輸入下,平均誤差反映了在相同的輸入下,轉換后的模型輸出與原始 PyTorch 模型輸出相比有多大的不同。
5. NVIDIA開源NeMo:基于PyTorch,允許快速創建會話式人工智能模型
NVIDIA NeMo 是一個基于 PyTorch 的開源工具包,它允許開發者快速構建、訓練和微調會話式人工智能模型。NeMo 由 NeMo Core 和 NeMo Collection 組成,NeMo Core 為所有模型和模塊提供了一個通用的“外觀”,NeMo Collection 是特定領域模塊和模型的組合。在 NeMo 的 Speech Collection(nemo_asr)中,你可以找到用于語音識別、命令識別、說話人識別、說話人驗證和語音活動檢測的模型和各種構建模塊。NeMo 的 NLP Collection(nemo_nlp)包含了諸如問題回答、標點符號、命名實體識別等任務的模型。最后,在 NeMo 的 Speech Synthesis(nemo_tts)中,你會發現一些譜圖生成器和聲碼器,它們將讓你能夠生成合成語音。
6. Photoshop把AI論文demo打包實現了:照片上色、改年齡、換表情只需要點點鼠標
我們見過很多神經網絡上色、換表情、修改年齡的研究和應用,但它們往往只存在于 GitHub 上,距離「人人能用」還有一段距離。但最近,推出 Photoshop 的 Adobe 這次終于有所表示了:你們論文里的效果,我們打包實現了。 這兩年,我們從很多論文中看到過一些令人驚艷的 demo,比如老照片自動上色、低畫質圖像秒變高清圖像、普通圖像一鍵變梵高風格等。 但對于不寫代碼、不玩模型的普通人來說,這些 demo 展示的應用還是非常遙遠,或者只能從某個 APP 中找到其中一種。因此,經常有人會問:「我也想用這個 demo 里的效果,但不懂代碼,我還有機會嗎?」 先說答案:有。 這個答案來自大名鼎鼎的 Adobe。這家極富創意的公司最近在 Photoshop 22.0 版更新中推出了一個新的工具包——Neural Filters,把自動上色、超分辨率、風格遷移等之前很多論文展示的功能都打包到了一起。
7. 分離硬件和代碼、穩定 API,PyTorch Lightning 1.0.0 版本正式發布
Keras 和 PyTorch 都是對初學者非常友好的深度學習框架,兩者各有優勢,很多研究者和開發者在選擇框架時可能會舉棋不定。基于這種情況,grid.ai CEO、紐約大學博士 William Falcon 創建了 PyTorch Lightning,為 PyTorch 披上了一件 Keras 的外衣。 Lightning 是 PyTorch 非常輕量級的包裝,研究者只需要編寫最核心的訓練和驗證邏輯,其它過程都會自動完成。因此這就有點類似 Keras 那種高級包裝,它隱藏了絕大多數細節,只保留了最通俗易懂的接口。Lightning 能確保自動完成部分的正確性,對于核心訓練邏輯的提煉非常有優勢。 今日,PyTorch Lightning 在推特宣布,1.0.0 版本現在可用了,并發布新的博客文章詳細描述了 PyTorch Lightning 的運行原理和新的 API。William Falcon 表示自己非常期待有一天,當用戶查看 GitHub 上的復雜項目時,深度學習代碼不再那么令人望而生畏。 特斯拉 AI 負責人 Andrej Karpathy 也評論稱:「這看起來很棒,也很有前途。PyTorch Lightning 倡導對深度學習代碼進行重構,將『工程(硬件)』與『科學(代碼)』分割開,然后將前者委托給框架。」
8. 速度堪比Adam,準確率媲美SGD,還能穩定訓練GAN:全新優化器成為NeurIPS爆款
論文鏈接: https://arxiv.org/pdf/2010.07468.pdf 論文頁面: https://juntang-zhuang.github.io/adabelief/ 代碼鏈接: https://github.com/juntang-zhuang/Adabelief-Optimizer
最常用的深度學習優化器大致可分為自適應方法(如Adam)和加速方案(如帶有動量的隨機梯度下降(SGD))。與 SGD 相比,許多模型(如卷積神經網絡)采用自適應方法通常收斂速度更快,但泛化效果卻較差。對于生成對抗網絡(GAN)這類的復雜情況,通常默認使用自適應方法,因為其具有穩定性。 在 NeurIPS 2020 的一篇 Spotlight 論文中,來自耶魯大學、伊利諾伊大學香檳分校等機構的研究者提出了一種名為「AdaBelief」的新型優化器,可以同時滿足 3 個優點:自適應方法的快速收斂、SGD 的良好泛化性、訓練穩定性。論文代碼也已經放出。 研究者用實驗驗證了 AdaBelief 的效果。在圖像分類和語言建模方面, AdaBelief 收斂迅速,準確率高,性能優于其他方法。具體來說,在 ImageNet 上, AdaBelief 的準確率可與 SGD 媲美。
9. 超越ResNeSt!ResNet又一改進版,即插即用的HSB漲點神器!
Paper: https://arxiv.org/abs/2010.07621 Code: https://github.com/PaddlePaddle/PaddleClas
多尺度特征對于大量視覺任務均非常重要,現有諸多網絡結構的改進均考慮了多尺度信息的構件。該文提出了一種“即插即用”型Hierarchical-Split Block(HSB)用于提升現有CNN的性能。HSB包含多個Split與Concat操作,它們共同構成該Block的多尺度特征提取;與此同時,HSB具有更好的靈活性與高效性。基于HSB構件的ResNet在多個任務上取得了極大的性能提升,比如在ImageNet數據集上,HS-ResNet50取得了81.28%的Top1精度,超過了之前亞馬遜提出的ResNeSt。下圖給出了不同ResNet的精度、推理耗時對比。
10. 美團發布AI智慧門店MAI Shop
10月13日,美團在京發布首家AI智慧門店 MAIShop,可實現無人自動分揀、無人配送車自動配送等。目前該智慧門店已在首鋼園落地運行。目前,用戶可在落地 MAI Shop 的園區通過沿途掃碼下單、線上 App 下單及到店自提等方式進行體驗。美團方面介紹,用戶下單后,系統會進行訂單的自主處理,通過自動揀選、AGV 小車配貨、打包以及無人配送車配送一系列流程,完成訂單的運作,用戶只要在相應站點等待無人配送車送達,輸入手機收到的驗證碼,即可取到下單商品。【鈦媒體】
11. TensorFlow Lite 開源設備端推薦解決方案 | TensorFlow
文檔: https://tensorflow.google.cn/lite/models/recommendation/overview
摘要:TFLite 開源了一個端到端解決方案來解決設備端的推薦任務。演示應用中,集成的歷史長度N =10 的 CNN 模型,Pixel 4 手機的推理延遲僅為 0.05ms。在下一個版本中,將支持多個特征作為表示,并計劃設計更高級的用戶編碼器,例如基于 Transformer 的編碼器 (Vaswani, A., et al., 2017)。
12. LambdaResNets:拋棄注意力,比EfficientNet快3.5倍,類Transformer新模型跨界視覺任務實現新SOTA | 機器之心
鏈接: https://openreview.net/pdf?id=xTJEN-ggl1b
代碼: https://github.com/lucidrains/lambda-networks
摘要:該研究提出名為「lambda」的層,其提供了一種捕獲輸入和一組結構化上下文元素之間長程交互的通用框架。lambda 層將可用上下文轉換為單個線性函數(lambdas)。這些函數直接單獨應用于每個輸入。作者認為,lambda 層可以作為注意力機制的自然替代。注意力定義了輸入元素和上下文元素之間的相似性核,而 lambda 層將上下文信息匯總為固定大小的線性函數,從而避免了對內存消耗大的注意力圖的需求,且可能適合在資源有限的場景如嵌入式應用。實驗表示LambdaResNets 在所有深度和圖像尺度上均優于基準水平,最大的 LambdaResNet 實現了 SOTA 水平準確度 84.8。更值得注意的是,LambdaResNets 在準確性一定的情況下比EfficientNets 要快大概 3.5 倍,速度-準確性曲線提升明顯。
Other
1. 麒麟絕唱,華為“芯”傷 | 雷鋒網
“華為Mate 40搭載了強大的麒麟9000芯片,是華為史上最強大的芯片。”余承東在華為Mate 40的發布會上介紹到。 根據余承東的介紹,麒麟9000是世界上首個采用5nm制程的5G手機SoC,集成153億個晶體管,相比于A14多了30%,集成8核CPU、24核GPU和NPU AI處理器,另外還搭載華為自研第三代5G移動通信芯片,與同類旗艦芯片相比均有速度方面的提升,表現優異。 不過這一款“世界尖端的5G SoC”,在備受打壓之下即將成為華為手機芯片史上的絕唱。 “絕唱”一詞,給予麒麟9000肯定的同時略顯悲壯。 悲壯之外,華為從自研手機芯片發展至今,還經歷了什么樣的變化?復盤華為手機芯片的發展歷程,可以用“一切皆有可能”概括之。
2. 研究發現,商業語音識別系統存在高錯誤率 | 雷鋒網
“某些語音識別系統(ASR)的準確性可能要比之前假定的差很多。”
這是最近約翰·霍普金斯大學、波蘭波茲南工業大學、弗羅茨瓦夫科技大學以及初創公司Avaya的研究人員一項正在進行的研究主要發現。 這項研究對內部創建的數據集上的商業語音識別模型進行了基準測試。共同作者聲稱,詞錯誤率(Word Error Rate, WER)(一種常見的語音識別性能指標)要顯著高于最佳報告結果,這可能表明自然語言處理(NLP)領域存在更多待克服的問題。 作者基于來自1595個供應商和1261個客戶的50個呼叫中心對話數據集對幾套ASR系統進行了評估。其通常時間長達8.5個小時,其中2.2個小時是對話。通過測試,作者發現ASR系統的錯誤率基本在15%以下,這與基準測試中的2%相悖。
3. 一周就能從Arm開發切換到RISC-V!5年內RISC-V的AIoT設備將觸手可及
如果Arm被英偉達400億美元成功收購,英偉達的競爭對手們不得不考慮Arm第三方IP提供商的角色是否會改變。這可能會促使一些公司轉向新興的RISC-V指令集,但他們又會擔心RISC-V的生態的完善程度,很難下決定。 其實,全球越來越多的人開始關注和建設RISC-V生態。比如,發布了“一生一芯”計劃的中國科學院大學;以及最新獲得了小米投資,國內最早專門提供RISC-V處理器內核IP的芯來科技;還有RISC-V國際開源實驗室今年推出的對標樹莓派的PicoRio微型電腦系統,都從不同的維度促進了RISC-V生態的發展。 市場調研機構Semico Research預測,到2025年,采用RISC-V架構的芯片數量將增至624億顆,2018年至2025年的復合增長率高達146%。多位業內專家都表示,RISC-V已經在AIoT市場替代Arm芯片。芯來科技創始人兼CEO胡振波與雷鋒網交流時預測:“未來3-5年,RISC-V將觸手可及。5年內,AIoT的生態就會完整建立起來。”
4. 麒麟絕唱!Mate40 系列問世,華為十年打造國產機皇,最高售價超一萬八
就在昨天,華為 Mate40 系列的全球線上發布會,正式落幕。 這是一場氣氛略為復雜的發布會,有一絲恢弘和悲壯交疊其中。 說它恢弘,是因為華為發布的 Mate40 系列無疑是國產智能手機的巔峰之作,尤其是它內置的麒麟 9000 芯片,讓人看到了國產科技產品的榮耀光輝。 說它悲壯,是因為這場發布會很有可能意味著華為 Mate 系列的終結——原因自然是眾所周知的,盡管眼下還沒有什么辦法。 在發布會上,余承東說:
華為現在處在非常艱難的時刻,我們正在經歷美國政府的第三輪禁令,這一禁令極不公正,導致我們處境艱難。
在如此艱難的處境下,可以通過閱讀原文來看一下華為帶來了什么。
5. 科技部:我國 5G 核心專利數世界第一,5G 基站超 60 萬個
10月21日消息,在今日的國新辦新聞發布會上,科技部高新技術司司長秦勇表示,我國在移動通訊上實現了 5G 技術的領跑,5G 核心專利數占世界第一,并率先實現了 5G 商用,目前我國 5G 基站數已經超過 60 萬個,用戶數已經突破 1.1 億。 同時,科技部在今日的新聞發布會上總結了“十三五”期間的成功,例如以上新能源汽車、移動通訊、第三代半導體、新型顯示等領域的進步,在超級計算、軌道交通、量子信息、增材制造等領域取得的一系列突破,后展望了“十四五”的道路——加強前瞻部署和大力發展以智能技術和量子技術為特征的新一代高新技術,打造我國高新技術先發優勢;強化重點領域和關鍵環節的攻關布局;加快培育新一代高新技術產業。(IT之家)
6. 退貨!iPhone 12 藍色被嘲丑出新高度,外觀撞臉一切藍色產品,網友:沒有人比蘋果更懂環保
沒有充電器和耳機的 iPhone12 依然真香。 16 日晚蘋果的第一波預售依舊賺得盆滿缽滿,眼看真機就要到手,一波測評卻幾乎把網友們搞崩潰了。 直言如果真是測評視頻中這么丑的藍色,強烈要求退貨! 就在幾天前, iPhone12 藍色便沖上了熱搜。 不好意思,iPhone 12 藍色丑到我了。
7. 美國運營商確認!iPhone12不支持雙卡5G,蘋果內部培訓文檔曝光
據自媒體科技獸爆料,在國外社區出現了據稱來自蘋果銷售培訓文檔的 FAQ 資料截圖,其中顯示,在SIM卡+ eSIM卡的雙卡模式下使用 iPhone 12,用戶無法開啟 5G 上網,網絡速度將掉回 4G。換言之,要想回到 5G 必須開啟單卡模式,即雙卡狀態下屏蔽一張卡后才行。 對此,據快科技援引外媒報道,從美國第一大運營商Verizon拿到的PPT中再次確認了這點。幻燈片還特別指出,eSIM客戶必須拿掉實體SIM卡后才能讓iPhone 12/12 Pro啟用5G。不過,蘋果和運營商計劃在年底前通過軟件更新予以解決,使得雙卡和5G不再沖突。 看起來,雙卡和5G的沖突主要由eSIM帶來,國行iPhone 12/12 Pro/12 Pro Max是實體雙卡,到底情況如何可能需要23號使用之后才能予以揭曉。(快科技)
8. 英國政府或考慮阻止英偉達收購Arm,硅谷科技巨頭們也坐不住了
美國當地時間 9 月 13 日,英偉達發布聲明表示與軟銀達成協議,將斥資 400 億美元收購 Arm,這被譽為芯片行業有史以來最大收購。隨后,該筆交易進入審核階段,需要獲得中國、美國、歐盟和英國的批準。 在審核階段,多家硅谷科技巨頭率先站出來對該交易提出反對,他們認為這筆交易對行業不利。根據外媒報道,英特爾、高通、特斯拉等多家廠商正在商討協調行動,預計會很快公布相關公告,以向美國和世界各國當局表達他們的擔憂。值得一提的是,蘋果也參與了此次討論。不過,蘋果之后可能會退出這一行列,因為它被預測可能會與英偉達和 Arm 單獨達成協議。 此外,英國政府文化大臣也在近日表示考慮要求競爭和市場管理局調查這筆交易。他表示:Arm 是英國科技行業的重要組成部分,為英國經濟做出了重要貢獻。雖然收購主要是有關各方的商業問題,但政府會密切關注這些問題,當收購可能對英國產生重大影響時,我們(英國政府)會毫不猶豫地進一步調查并采取適當行動。
9. 只需25美元,算力提升3倍:樹莓派4計算模組上線
對于每一代嵌入式電腦樹莓派(Raspberry Pi)來說,官方都會在基礎版推出一段時間后發布同架構的計算模組。樹莓派 1 的計算模組在 2014 年推出,樹莓派 3 和 3+ 的更新分別在 2017 年和 2019 年。只有最短命的樹莓派 2 沒有獲得過這樣的版本。 自 2019 年 6 月,號稱達到了「PC 級」性能的樹莓派 4 發布已經過去十六個月了,前段時間,樹莓派開發團隊宣布推出 Compute Module 4,售價 25 美元起。 樹莓派 4 的計算模組(Raspberry Pi Compute Module 4,CM4)構建在和樹莓派 4 相同的 64 位四核博通 BCM2711 處理器之上,性能相對前一代產品有了不小的提升:它有更快的 CPU 核心,更好的多媒體性能,更多的借口,以及第一次可以選擇多種 RAM 容量和無線網絡連接方式。同時和樹莓派 4 一樣,新的計算模組已經可以通過雙 HDMI 接口支持兩個 4K 電腦屏幕實現 60 幀刷新率的顯示。
10. 82頁《現代C++教程》:高速上手C++ 11/14/17/20
中文版鏈接: https://changkun.de/modern-cpp/pdf/modern-cpp-tutorial-zh-cn.pdf
英文版鏈接: https://changkun.de/modern-cpp/pdf/modern-cpp-tutorial-en-us.pdf
書籍代碼鏈接: https://changkun.de/modern-cpp/code/
習題解答鏈接: https://changkun.de/modern-cpp/exercises/
C++ 自發明以來,經歷了多次修訂,每一次修訂都為C++ 增加了新的特性并作了一些修改。 縱觀C++ 的發展史,從 C++98 的出現到 C++11 的正式定稿經歷了長達十年多之久的積累。C++14/17 則是作為對 C++11 的重要補充和優化,而C++20 將這門語言領進了現代化的大門,所有這些新標準中擴充的特性,給 C++ 這門語言注入了新的活力。 這本書假定讀者已經熟悉了傳統 C++ ,至少在閱讀傳統 C++ 代碼上不具備任何困難。換言之,那些長期使用傳統 C++進行編碼的人、渴望在短時間內迅速了解現代 C++特性的人非常適合閱讀本書;
本書一定程度上介紹了一些現代 C++ 的黑魔法,但這些魔法畢竟有限,不適合希望進階學習現代 C++ 的讀者,本書的定位系現代 C++ 的快速上手。當然,希望進階學習的讀者可以使用本書來回顧并檢驗自己對現代 C++的熟悉度。
責任編輯:lq
-
算法
+關注
關注
23文章
4625瀏覽量
93138 -
AI
+關注
關注
87文章
31335瀏覽量
269721 -
OpenCV
+關注
關注
31文章
635瀏覽量
41436
原文標題:【20201023期AI簡報】OpenCV 4.5 發布、NVIDIA開源NeMo,更多精彩點我!
文章出處:【微信號:RTThread,微信公眾號:RTThread物聯網操作系統】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論