電子發燒友網報道(文/李彎彎)近幾年,隨著物聯網、人工智能等技術的發展,算力的需求越來越大。而在馮諾依曼架構下,芯片性能的提升遇到瓶頸。業界開始不斷探索新的技術形式,因為具備大算力、低功耗的特點,存算一體架構芯片應運而生。
后摩智能是一家致力于存算一體大算力芯片研發的企業,成立于2020年。今年5月,該公司發布了首款SRAM存算一體智駕芯片后摩鴻途?H30,這也是全球首款面向智能駕駛領域的存算一體芯片。此外,今年8月該公司宣布完成首款RRAM存算芯片的測試,可以說在存算一體大算力方面進展迅速。
近日,電子發燒友采訪到后摩智能公共事務部負責人屈艷格,就其在存儲介質及應用賽道的選擇,存算一體發展趨勢及后摩智能未來規劃方面做了探討。
從SRAM到RRAM,后摩智能是如何選擇存儲介質的
后摩智能今年5月推出的首款存算一體智駕芯片H30,最高物理算力256TOPS,典型功耗35W。該芯片基于SRAM存儲介質,采用數字存算一體架構,擁有極低訪存功耗和超高計算密度,僅用12nm工藝制程,在Int8數據精度下,其AI核心IPU能效比達15Tops/W,是傳統架構芯片7倍以上。
據了解,H30已成功運行CV類的經典網絡,以及自動駕駛領域先進的BEV、Pointpillar等模型。為了更好地實現車規級,后摩智能基于H30 自主研發了硬件增強機制和檢測機制,在提升芯片可靠性的同時,進一步保障了功能安全性。
屈艷格告訴電子發燒友,雖然相對來說,后摩智能在AI芯片方面算是入局較晚的企業了,但相對傳統架構的AI芯片,后摩智能推出這款存算一體架構的H30有它突出的優勢。
她總結了三點:1、高計算效率。在相同工藝制程下,它比傳統馮諾依曼架構的AI芯片能效比更優,比如,英偉達Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一體芯片物理算力士256TPOS,功耗是35W,它的能效比能夠達到7.3TPOS/W。
在當前業界,這樣的能效比是相當高的。對于客戶來說,這是一款非常有競爭力的產品,因為幾乎所有的計算場景,它對功耗的需求都較為敏感,而這款產品在低功耗的情況下,仍然能夠實現很高的算力。
2、低計算時延。因為是存算一體架構,這款芯片最大的特點是,在數據傳傳輸過程中不用來回搬運數據,這樣的好處是:一、極大地減少功耗,二、延時也會大大減少。后摩智能此前對此做過測算,它跟傳統架構的芯片相比,大概會有兩倍的延時提升。而這在一些對安全有極高要求的場景,比如智能駕駛,優勢會非常明顯。
3、低工藝依賴性。因為是存算一體架構,它對先進工藝制程的依賴性并沒有那么強,它可以用傳統的工藝實現先進工藝才能實現的特點。比如,要實現100TOPS算力,大部分公司會采用比較先進的工藝制程,12nm或者7nm,而后摩智能因為是存算一體架構芯片,可以采用28nm,就能夠達到這樣的算力。
存算一體架構對工藝的依賴性不強,有其非常大的戰略意義。在當前的國際局勢下,對于國內的企業來說,如何保障供應鏈安全很重要。如果真的出現先進制程供應緊張的情況下,存算一體架構芯片仍然能夠用一些較成熟的工藝制程生產芯片,同時還能實現較高的算力。
除了發布首款基于SRAM存儲介質的H30之外,后摩智能也在探索RRAM存儲介質的存算一體芯片。RRAM雖然誕生已久,但在近幾年才較多的被關注。相對于來說,RRAM在技術成熟度上不及SRAM,為何后摩智能在成功推出SRAM介質的存算一體芯片之后,又會著手研究RRAM存儲介質的存算一體芯片呢?
在采訪中,屈艷格詳細介紹了不同存儲介質的特點,以及后摩智能在存儲介質選擇上的考量。據她介紹,存算一體芯片有兩個很典型的特點:一是大算力,二是低功耗。這兩個特點也使得它能實現比較高的能效比。不過從使用來看,重點還是要看哪個是第一個要關注的指標,是大算力,還是低功耗。而后摩智能關注的第一個指標是大算力。
因此在進行存儲介質選擇的時候,后摩智能會選擇更適合做大算力場景的存儲介質,比如SRAM、MRAM、RRAM等。因為這些存儲介質,可以用來做數字電路,能夠用于智能駕駛、智能工業、機器人以及云端大模型推理等場景。而Flash這種存儲介質,更適合用在小算力,對功耗要求較高的場景,比如藍牙耳機、可穿戴手表等。屈艷格介紹說:“因為我們更關注大算力,所以會選擇在SRAM、MRAM、RRAM這些存儲介質上做技術演進。”
據她介紹,后摩智能當前選擇SRAM這個存儲介質的主要原因:一是目前SRAM在做大算力方面最為成熟,它可以支持較為先進的工藝制程,讀寫速度也比較快。二是雖然它是很成熟的存儲介質,而在當前的產業界,將它用作存內計算,且算力達到幾十TOPS,同時又是做純數字電路,并且用在工業、智能駕駛場景中的幾乎沒有。
后摩智能在2021年通過技術驗證的流片成功,證明這條技術路徑可行,于是便進一步推進,在今年5月推出第一代產品H30。這款基于SRAM的存算一體芯片H30,主要可用在智能駕駛和機器人等領域。屈艷格進一步談到:“我們下一代還會基于SRAM做存算一體架構優化,包括整個電路、架構的優化,以進一步提升產品性能。按照初步規劃,未來會基于SRAM介質研發幾款產品,逐步將性能做到最佳。”
當然她也提到,SRAM有它的缺點,比如存儲密度相對較低,這樣它的芯片面積會有點大,其計算密度相對來說不會太高。因此,后摩智能考慮再選擇一些更適合的存儲介質,比如MRAM、RRAM這些比較新型的存儲器。相對來說,這兩款存儲介質的讀寫性能更好,存儲密度更大。
屈艷格說:“我們會在這兩款介質上做一些技術預研,類似2021年基于SRAM做過的技術驗證,等確定行得通之后,再進行下一步的推進,今年8月宣布的初步驗證的結果。” 她表示:“我們會根據這些存儲介質的成熟性,以及它做存算電路的優勢。再根據場景情況,把這個技術從SRAM切換到RRAM或者MRAM上去。”
做透智能駕駛市場,未來希望賦能機器人、云端推理等更多場景
從2020年成立到現在僅三年時間,后摩智能便已經推出第一代SRAM存算一體芯片,同時完成首款RRAM大容量存儲芯片的測試。這在做存算一體大算力芯片領域算是相當快了。屈艷格認為,公司在技術和產品推進上能夠如此之快,與其完善的團隊搭建有關。
后摩智能的團隊包括兩方面的人才:一部分是在存算一體技術領域有深度研究的人,一部分是在工程落地方面有豐富經驗積累的人。在存算方面,后摩智能的團隊發布分來自海外知名院校、研究機構和企業,在存算一體、先進存儲器方面大概有15年左右的積累。其中一個核心成員,曾經做過六次基于SRAM存算芯片的流片,具有豐富的經驗。
這是偏學術方面的經驗,另外,后摩智能很好的將這些學術經驗與產業界的團隊做了結合。后摩智能還組建了一支產業的工程化落地團隊,這個團隊大部分員工來自AMD、Intel,還有華為海思等,具有百萬級智駕芯片量產落地經驗,學術和產業團隊的結合,加速了公司將產品推向商業化落地的進程。
在應用賽道的選擇上,后摩智能也做了仔細的考量。據屈艷格介紹,公司成立初期,做了大量的調研,去思考選擇什么樣的賽道,對數據中心、安防、智能駕駛等都進行了分析。
比如數據中心,這個市場需要大算力,需求量也非常大,尤其是今年大模型迅速發展,未來市場空間會更大。可是分析下來可以發現,數據中心市場90%以上由英偉達的GPU占據,算法迭代快,對英偉達CUDA生態的依賴強。第三方初創企業想進去構建自己的生態,很難。
再比如安防市場,相對來說它對算力的要求比較低,生態依賴度不高,是一個成熟市場。可是,它對算力要求并不高。而后摩智能的核心特點是,容易做大算力的產品,安防市場并不能凸顯出公司的優勢。
后來確定選擇智能駕駛賽道,有兩個方面的原因:1、當前智能駕駛是一個發展比較快的行業,每年增速差不多30%以上。尤其現在,我國智能化全球領先,未來市場極其可觀。智能駕駛對算力要求很大,L1/L2可能需要幾TOPS,到L2++以及未來L4/L5級自動駕駛,它需要的算力會達到上千TOPS,存算一體跟這個市場的需求匹配度很高。
2、雖然智能駕駛現在發展很快,但這個市場剛開始沒多長時間。雖然已經有幾家巨頭企業,包括英偉達、高通、TI,以及國內幾家頭部企業開始在做,并且取得了不錯的成績。但是相對來說推進的時間還不是很長,整個生態并沒有那么成熟,還有去沖刺的機會。
后摩智能推出的首款智能駕駛芯片,是一款通用的產品,它可以像英偉達Orin芯片一樣,去適配更多車廠的主流算法。目前已經與新石器、環宇智行等無人車企業達成合作,另外在乘用車方面,也正在與車企業推進測試中。
談到未來規劃,屈艷格表示,公司首先還是會基于SRAM存儲介質去進行不斷產品優化,面向智能駕駛領域,將這塊市場打透,建立起足夠高的壁壘。此外還會不斷深耕機器人、智能工業、電力、云端推理等領域,去賦能更多的場景。
結尾
可以看到,經過近幾年的發展,存算一體已經逐漸在一些場景中得到應用。今年以來,大模型及AIGC迅速發展,它對算力的需求越來越大,而當前傳統架構的芯片在性能提升上遇到瓶頸,存算一體在這方面卻優勢明顯,未來將會有很大的應用空間。
雖然存算一體作為一門新技術,在產品和應用的推進上存在挑戰。而如今,SRAM已經實現大算力的存算,新型存儲介質也在加速推進產業落地。可想而知,未來隨著MRAM、RRAM這些新型存儲介質的成熟商業化,存算一體的可想像空間將會更大。
后摩智能是一家致力于存算一體大算力芯片研發的企業,成立于2020年。今年5月,該公司發布了首款SRAM存算一體智駕芯片后摩鴻途?H30,這也是全球首款面向智能駕駛領域的存算一體芯片。此外,今年8月該公司宣布完成首款RRAM存算芯片的測試,可以說在存算一體大算力方面進展迅速。
近日,電子發燒友采訪到后摩智能公共事務部負責人屈艷格,就其在存儲介質及應用賽道的選擇,存算一體發展趨勢及后摩智能未來規劃方面做了探討。
從SRAM到RRAM,后摩智能是如何選擇存儲介質的
后摩智能今年5月推出的首款存算一體智駕芯片H30,最高物理算力256TOPS,典型功耗35W。該芯片基于SRAM存儲介質,采用數字存算一體架構,擁有極低訪存功耗和超高計算密度,僅用12nm工藝制程,在Int8數據精度下,其AI核心IPU能效比達15Tops/W,是傳統架構芯片7倍以上。
據了解,H30已成功運行CV類的經典網絡,以及自動駕駛領域先進的BEV、Pointpillar等模型。為了更好地實現車規級,后摩智能基于H30 自主研發了硬件增強機制和檢測機制,在提升芯片可靠性的同時,進一步保障了功能安全性。
屈艷格告訴電子發燒友,雖然相對來說,后摩智能在AI芯片方面算是入局較晚的企業了,但相對傳統架構的AI芯片,后摩智能推出這款存算一體架構的H30有它突出的優勢。
她總結了三點:1、高計算效率。在相同工藝制程下,它比傳統馮諾依曼架構的AI芯片能效比更優,比如,英偉達Orin芯片的能效比大概是2TPOS/W,TI TDA4VH芯片的能效比大概是1TPOS/W,特斯拉FSD芯片的能效比也不到2TPOS/W,而H30存算一體芯片物理算力士256TPOS,功耗是35W,它的能效比能夠達到7.3TPOS/W。
在當前業界,這樣的能效比是相當高的。對于客戶來說,這是一款非常有競爭力的產品,因為幾乎所有的計算場景,它對功耗的需求都較為敏感,而這款產品在低功耗的情況下,仍然能夠實現很高的算力。
2、低計算時延。因為是存算一體架構,這款芯片最大的特點是,在數據傳傳輸過程中不用來回搬運數據,這樣的好處是:一、極大地減少功耗,二、延時也會大大減少。后摩智能此前對此做過測算,它跟傳統架構的芯片相比,大概會有兩倍的延時提升。而這在一些對安全有極高要求的場景,比如智能駕駛,優勢會非常明顯。
3、低工藝依賴性。因為是存算一體架構,它對先進工藝制程的依賴性并沒有那么強,它可以用傳統的工藝實現先進工藝才能實現的特點。比如,要實現100TOPS算力,大部分公司會采用比較先進的工藝制程,12nm或者7nm,而后摩智能因為是存算一體架構芯片,可以采用28nm,就能夠達到這樣的算力。
存算一體架構對工藝的依賴性不強,有其非常大的戰略意義。在當前的國際局勢下,對于國內的企業來說,如何保障供應鏈安全很重要。如果真的出現先進制程供應緊張的情況下,存算一體架構芯片仍然能夠用一些較成熟的工藝制程生產芯片,同時還能實現較高的算力。
除了發布首款基于SRAM存儲介質的H30之外,后摩智能也在探索RRAM存儲介質的存算一體芯片。RRAM雖然誕生已久,但在近幾年才較多的被關注。相對于來說,RRAM在技術成熟度上不及SRAM,為何后摩智能在成功推出SRAM介質的存算一體芯片之后,又會著手研究RRAM存儲介質的存算一體芯片呢?
在采訪中,屈艷格詳細介紹了不同存儲介質的特點,以及后摩智能在存儲介質選擇上的考量。據她介紹,存算一體芯片有兩個很典型的特點:一是大算力,二是低功耗。這兩個特點也使得它能實現比較高的能效比。不過從使用來看,重點還是要看哪個是第一個要關注的指標,是大算力,還是低功耗。而后摩智能關注的第一個指標是大算力。
因此在進行存儲介質選擇的時候,后摩智能會選擇更適合做大算力場景的存儲介質,比如SRAM、MRAM、RRAM等。因為這些存儲介質,可以用來做數字電路,能夠用于智能駕駛、智能工業、機器人以及云端大模型推理等場景。而Flash這種存儲介質,更適合用在小算力,對功耗要求較高的場景,比如藍牙耳機、可穿戴手表等。屈艷格介紹說:“因為我們更關注大算力,所以會選擇在SRAM、MRAM、RRAM這些存儲介質上做技術演進。”
據她介紹,后摩智能當前選擇SRAM這個存儲介質的主要原因:一是目前SRAM在做大算力方面最為成熟,它可以支持較為先進的工藝制程,讀寫速度也比較快。二是雖然它是很成熟的存儲介質,而在當前的產業界,將它用作存內計算,且算力達到幾十TOPS,同時又是做純數字電路,并且用在工業、智能駕駛場景中的幾乎沒有。
后摩智能在2021年通過技術驗證的流片成功,證明這條技術路徑可行,于是便進一步推進,在今年5月推出第一代產品H30。這款基于SRAM的存算一體芯片H30,主要可用在智能駕駛和機器人等領域。屈艷格進一步談到:“我們下一代還會基于SRAM做存算一體架構優化,包括整個電路、架構的優化,以進一步提升產品性能。按照初步規劃,未來會基于SRAM介質研發幾款產品,逐步將性能做到最佳。”
當然她也提到,SRAM有它的缺點,比如存儲密度相對較低,這樣它的芯片面積會有點大,其計算密度相對來說不會太高。因此,后摩智能考慮再選擇一些更適合的存儲介質,比如MRAM、RRAM這些比較新型的存儲器。相對來說,這兩款存儲介質的讀寫性能更好,存儲密度更大。
屈艷格說:“我們會在這兩款介質上做一些技術預研,類似2021年基于SRAM做過的技術驗證,等確定行得通之后,再進行下一步的推進,今年8月宣布的初步驗證的結果。” 她表示:“我們會根據這些存儲介質的成熟性,以及它做存算電路的優勢。再根據場景情況,把這個技術從SRAM切換到RRAM或者MRAM上去。”
做透智能駕駛市場,未來希望賦能機器人、云端推理等更多場景
從2020年成立到現在僅三年時間,后摩智能便已經推出第一代SRAM存算一體芯片,同時完成首款RRAM大容量存儲芯片的測試。這在做存算一體大算力芯片領域算是相當快了。屈艷格認為,公司在技術和產品推進上能夠如此之快,與其完善的團隊搭建有關。
后摩智能的團隊包括兩方面的人才:一部分是在存算一體技術領域有深度研究的人,一部分是在工程落地方面有豐富經驗積累的人。在存算方面,后摩智能的團隊發布分來自海外知名院校、研究機構和企業,在存算一體、先進存儲器方面大概有15年左右的積累。其中一個核心成員,曾經做過六次基于SRAM存算芯片的流片,具有豐富的經驗。
這是偏學術方面的經驗,另外,后摩智能很好的將這些學術經驗與產業界的團隊做了結合。后摩智能還組建了一支產業的工程化落地團隊,這個團隊大部分員工來自AMD、Intel,還有華為海思等,具有百萬級智駕芯片量產落地經驗,學術和產業團隊的結合,加速了公司將產品推向商業化落地的進程。
在應用賽道的選擇上,后摩智能也做了仔細的考量。據屈艷格介紹,公司成立初期,做了大量的調研,去思考選擇什么樣的賽道,對數據中心、安防、智能駕駛等都進行了分析。
比如數據中心,這個市場需要大算力,需求量也非常大,尤其是今年大模型迅速發展,未來市場空間會更大。可是分析下來可以發現,數據中心市場90%以上由英偉達的GPU占據,算法迭代快,對英偉達CUDA生態的依賴強。第三方初創企業想進去構建自己的生態,很難。
再比如安防市場,相對來說它對算力的要求比較低,生態依賴度不高,是一個成熟市場。可是,它對算力要求并不高。而后摩智能的核心特點是,容易做大算力的產品,安防市場并不能凸顯出公司的優勢。
后來確定選擇智能駕駛賽道,有兩個方面的原因:1、當前智能駕駛是一個發展比較快的行業,每年增速差不多30%以上。尤其現在,我國智能化全球領先,未來市場極其可觀。智能駕駛對算力要求很大,L1/L2可能需要幾TOPS,到L2++以及未來L4/L5級自動駕駛,它需要的算力會達到上千TOPS,存算一體跟這個市場的需求匹配度很高。
2、雖然智能駕駛現在發展很快,但這個市場剛開始沒多長時間。雖然已經有幾家巨頭企業,包括英偉達、高通、TI,以及國內幾家頭部企業開始在做,并且取得了不錯的成績。但是相對來說推進的時間還不是很長,整個生態并沒有那么成熟,還有去沖刺的機會。
后摩智能推出的首款智能駕駛芯片,是一款通用的產品,它可以像英偉達Orin芯片一樣,去適配更多車廠的主流算法。目前已經與新石器、環宇智行等無人車企業達成合作,另外在乘用車方面,也正在與車企業推進測試中。
談到未來規劃,屈艷格表示,公司首先還是會基于SRAM存儲介質去進行不斷產品優化,面向智能駕駛領域,將這塊市場打透,建立起足夠高的壁壘。此外還會不斷深耕機器人、智能工業、電力、云端推理等領域,去賦能更多的場景。
結尾
可以看到,經過近幾年的發展,存算一體已經逐漸在一些場景中得到應用。今年以來,大模型及AIGC迅速發展,它對算力的需求越來越大,而當前傳統架構的芯片在性能提升上遇到瓶頸,存算一體在這方面卻優勢明顯,未來將會有很大的應用空間。
雖然存算一體作為一門新技術,在產品和應用的推進上存在挑戰。而如今,SRAM已經實現大算力的存算,新型存儲介質也在加速推進產業落地。可想而知,未來隨著MRAM、RRAM這些新型存儲介質的成熟商業化,存算一體的可想像空間將會更大。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
SRAM技術
+關注
關注
0文章
4瀏覽量
1902
發布評論請先 登錄
相關推薦
開源芯片系列講座第24期:基于SRAM存算的高效計算架構
鷺島論壇開源芯片系列講座第24期「基于SRAM存算的高效計算架構」明晚(27日)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目基于
存算一體架構創新助力國產大算力AI芯片騰飛
在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發表了題為《存算一體架構創新助力國產大算
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽
、GPU、NPU,給我們剖析了算力芯片的微架構。書中有對芯片方案商處理器的講解,理論聯系實際,使讀者能更好理解
發表于 10-15 22:08
科技新突破:首款支持多模態存算一體AI芯片成功問世
存算一體介質,通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統架構下的AI芯片相比,該款芯片在
發表于 09-26 13:51
?428次閱讀
蘋芯科技引領存算一體技術革新 PIMCHIP系列芯片重塑AI計算新格局
一體NPU和PIMCHIP-S300多模態智能感知芯片,以前沿技術加持AI與大模型推理加速等各類計算任務場景,為高能效算力應用開啟新紀元。?
發表于 08-08 17:21
?271次閱讀
知存科技助力AI應用落地:WTMDK2101-ZT1評估板實地評測與性能揭秘
為未來計算設備和系統帶來革命性變革,使其更加智能、高效和可靠。
這些年里,基于不同存儲介質的存算一體芯片研究不斷涌現,包括
發表于 05-16 16:38
知存科技攜手北大共建存算一體化技術實驗室,推動AI創新
揭牌儀式結束后,王紹迪在北大集成電路學院舉辦的“未名·芯”論壇上做了主題演講,分享了他對于多模態大模型時代存內計算發展的見解。他強調了存算一體在人工
iBeLink KS MAX 10.5T大算力領跑KAS新領域
有8G的顯存,可以處理復雜的算法,提高挖掘穩定性。iBeLink ks max10.5T的超大特點是它的高效節能,它采用了先進的“存算一體”高通量算
發表于 02-20 16:11
什么是通感算一體化?通感算一體化的應用場景
通感算一體化可廣泛應用于智能家居、智慧城市、智慧交通、醫療健康等方面。文檔君為大家搜集了一些典型的應用場景。 智能家居 通感
發表于 01-18 16:12
?1.2w次閱讀
評論