本文探討了醫療成像算法的當前趨勢、成像模式的融合和實現這些算法的可擴展平臺。現場可編程門陣列為可擴展CPU平臺提供數據采集和協處理支持,使得更復雜的成像成為可能。
醫學成像技術在醫療保健領域發揮的作用越來越重要。這是因為醫療保健行業正在努力檢查出—甚至預測出—尚處在早期階段的疾病并積極推行無創性治療,并與此同時降低診斷和治療成本。診斷成像模式的融合與成像算法開發方式及進展相結合是推動開發能實現上述目標的新儀器的主要因素。
為了提供能滿足這些醫療保健行業目標所需要的功能,設備開發商正在轉向可擴展的、商業現貨供應(COTS)的中央處理單元(CPU)平臺,這些平臺支持現場可編程門陣列(FPGA)用于數據采集和協處理。要高效地開發靈活、可擴展的醫療影像設備,設備開發商必須考慮若干因素。這些因素包括成像算法的開發,多個成像技術的協同使用(成像模式的融合)以及平臺的可擴展性。
成像算法的開發需要用到高級直觀的建模工具,用于數字信號處理算法的持續改進。這些先進的算法要求可擴展的系統平臺,可以顯著地提高圖像處理性能。這些可擴展的平臺應該可以讓更小型的、更方便攜帶的設備得以實現。
要實現近實時分析,系統平臺必須和軟件(CPU)和硬件(可配置的邏輯門的數量)相匹配。這些處理平臺必須滿足不同的性能價位,并且必須能夠應對多種成像技術間的不同要求。 FPGA可以很容易地被集成到多核CPU平臺,為非常靈活的系統提供DSP處理能力,實現最高性能。
系統架構和設計工程師必須快速區分這些平臺上的算法,然后運用高級開發工具和知識產權(IP)庫對其進行調試。這一過程加速了平臺部署,從而實現了制造商利潤的最大化。
算法開發
應從每種成像模式的成像算法中的趨勢分析開始探討,包括考慮如何使用FPGA和IP。
磁共振成像(MRI)生成人體的橫截面圖像。利用FPGA實現的三個功能被用來重建來自截面的三維體。首先,快速傅里葉變換(FFT)生成灰度2 D切片,通常為矩陣,來自頻域的數據。然后,三維體的重建涉及切片之間的插值,以產生一個片間距來近似像素間的間距,這樣就可以從任何2D平面看到圖像。接著,進行迭代分辨率銳化。這個功能采用一種基于一個迭代反向濾波過程的空間去模糊技術,從而在降低噪聲的同時使圖像結構被重新聚焦。因此,截面的整體視覺診斷分辨率被大大提高。
超聲(成像)。超聲圖像有顆粒存在是一種被稱為散斑(speckle)的現象。散斑是由于不同的獨立散射物質(類似無線領域的多路無線電頻率反射)的相互作用所導致,并且是倍增的性質。超聲圖像可通過有損壓縮的方法來消除斑點。首先,取圖像的對數;散斑噪聲變成和有效信號相加。然后,通過JPEG2000編碼器采用小波有損壓縮將噪音最小化。
X光。狀動脈X光成像的運動修正是一種將心臟呼吸循環—呼吸和心臟跳動—對成像的影響降到最小的算法。3D+時間的冠狀動脈模型的運動被投射到2D的X光圖像,支持對去扭曲功能(平移和放大)---校正這種運動并得到更清晰的圖像的計算。
分子成像。分子成像是對細胞和分子級生物過程的表征和測量,其目的是檢測并捕捉病變細胞和分子的圖像,并監測之。例如,可以將X光成像,正電子發射斷層掃描(PET)和單光子發射計算機計算斷層成像(SPECT)組合用于器官功能、細胞和分子的低分辨率圖像,在相對應解剖特征的分辨率低至0.5mm的情況下。設備更加小型化的趨勢和對新算法的探索推動使得性能超出了多核CPU的性能,并使得這些緊湊的系統必須采用FPGA技術。
成像模式的融合。實現早期疾病診斷和無創性治療推動著成像技術的結合,例如,在PET /電腦斷層掃描(CT)系統和x光治療/CT設備中可見到上述情況。要滿足當前的性能要求,需要更高分辨率的圖像,這要求用于精巧的幾何微陣列探測器加上FPGA來對光子和電子信號進行預處理。在預處理完成后,這些信號被CPU和FPGA協處理器組合進行綜合和處理,從而生成詳細的身體圖像。
非實時(NRT)圖像的融合,或圖像配準,通常被用在將成像于不同時間的器官功能圖像和解剖圖像進行排列對比。然而,由于患者位置的變化、掃描基礎輪廓的不同、以及患者內部器官自然而然的運動等原因,NRT圖像配準是存在問題的。采用FPGA處理對PET和CT實時融合,允許器官功能圖像和解剖圖像在一次成像期間都被采集并且融合,而不是像過去在后期將圖像疊加。融合后的圖像可以為手術治療提供更好的清晰度和定位精度。
在手術期間用于指導醫生的圖像處理包括將手術前的CT或MRI圖像與實時3D超聲或X光圖像進行配準,以促進無創治療(如超聲波、磁共振干擾和x光治療)的應用。在這一領域,各種算法被開發用于為某些特定的成像模式和治療組合提供優化的圖像配準結果。
在這一類融合式組合系統中,配置有高速串行互連的FPGA可以縮減將數據采集功能連接到系統后處理部分的互連要求,通過省去額外的電路板和電纜,大大地降低了整體系統的成本。
成像算法
有好幾種不同的成像算法被常用于FPGA中。這些算法包括增強、穩定、小波分析和分布矢量處理。
圖像增強算法通常用到卷積或線性、濾波。高通濾波圖像和低通濾波圖像進行線性組合,通過矩陣乘法加權,可生成一幅細節增強而噪音降低的圖像。
視頻圖像的穩定包括視頻數據序列的規范化旋轉和縮放效果,以最終達到連續幀之間噪音的平衡。此外,該算法平滑了從視頻中提取的靜態圖像的鋸齒邊緣,并可將圖像抖動校正至約十分之一個像素。
小波分析算法設計用于幫助獲取信號內的事件信息,小波分析算法采用窗口技術——通過變化窗口的大小——來分析信號的一小段。為了獲得更高的精確性,小波分析允許對低頻信息采用較長的時間間隔,而對高頻信號采用更短的時間間隔。小波分析算法的應用包括不連續點和斷點的檢測、自相似性檢查、信號抑制、信號或圖像的降噪、圖像壓縮和大型矩陣的快速相乘。
近期取得進展的S變換算法結合了FFT和小波變換的優點。它揭示了空間和時間上的頻率變化。這一功能的應用包括紋理分析和噪聲濾波。S變換算法屬于一種密集型計算,會使得傳統CPU的執行速度變得很慢。分布式向量處理可以解決這個問題,通過在FPGA內部將向量和并行計算相結合,使得處理時間可縮短25倍。
早期癌癥檢測的一種方法是利用了惡性腫瘤會調動新血液供應的功能。數字傳感器檢測到由病人身體釋放出的紅外線能量。因此,它可以檢測到因癌癥引起的血流量增加與正常情況的細微差別。這一功能的典型應用是基于一個可編程脈動列陣,通過一個通用工作站和一個基于FPGA的專用硬件引擎來實現。 FPGA引擎可將核心算法加速至近1000倍于一個目前最新工作站所能達到的速度。
對于這些復雜的成像算法而言,多FPGA模塊部件功能是必須的。例如,CT重建需要插值、快速傅立葉變換和卷積等功能。在超聲成像領域,處理方法包括彩色流處理、卷積、波束形成和彈性估計等。通用成像算法包括諸多類似的功能,如色彩空間轉換、圖形疊加、2D中值濾波、縮放、幀和場的轉換、對比度增強、銳化、邊緣檢測、閾值、平移、極性和笛卡爾轉換、非均勻性校正和像素置換等。
可擴展平臺
在過去,許多成像系統被作為成專有計算機系統來打造。但隨著當前高性能的商用現貨供應(COTS)的CPU板的出現,系統工程師能夠以更具創造性的方式來實現設計。雖然許多算法的NRT處理過程單單就軟件而言是可以接受,但是實時圖像處理仍需要硬件的輔助。當前的FPGA內置有DSP模塊、高帶寬的內存模塊、以及大型可編程陣列等,是非常適合提供這類硬件輔助的硬件設備。
Altera公司(圣何塞)一直與其合作伙伴緊密合作以提供FPGA協處理資源+COTS CPU解決方案的組合。對于來自英特爾公司和AMD公司的單板機(SBC),Altera公司的內置有串行器-解串器的Stratix II GX FPGA可以直接運行PCI Express兼容協處理器板用于算法卸載。對于AMD公司的帶有雙插槽的單板機,XtremeData公司(美國伊利諾斯州、紹姆堡)提供了一個可直接插入AMD皓龍處理器的插座的協處理器子卡,提供了一個一流的CPU+FPGA處理解決方案(見圖1)。一個四插槽的AMD單板機可提供多個CPU+FPGA協處理器的組合(1 +3,2 +2或3 +1),用以提高算法密集型應用的性能。但可以通過使用多個1U服務器刀片實現最終的平臺可擴展性,每個1U服務器刀片執行CPU+FPGA協處理器解決方案。
這些平臺的應用增速效果取決于算法:一個算法中可以加載到FPGA中的并行計算越多,整體的執行速度就越快。例如,當對一個CT成像算法采用基于FPGA硬件的加速——給每個CPU(3 GHz)加上一個FPGA協處理器時,整個應用程序的執行速度快了10倍。結果就是,系統的功耗、尺寸以及成本明顯地下降。
開發方法學
討論自然地包括對開發算法的方法以及相應的算法執行工具的考慮。
算法工具。成像系統架構師們使用高級軟件工具來對不同的算法建模,并對所取得的結果進行評估。先進的數字信號處理通用工具是來自MathWorks公司(美國、馬薩諸塞州、內蒂克)的MATLAB處理引擎和Simulink仿真器圖形用戶界面。大多數OEM(原始設備制造商)和醫療設計室利用MATLAB來開發快速、精確的算法,如數字圖像處理、定量圖像分析、模式識別、數字圖像編碼和壓縮、刑偵圖像處理和2D小波變換。除了算法開發之外,MATLAB可以被用來模擬在FPGA普遍采用的定點算法,并帶有可選工具包,可以生成運行在通用CPU或FPGA內的C代碼。
算法的劃分和調試。一旦算法開發完成,系統架構師必須決定如何劃分CPU和FPGA的功能,以提供最佳的整體解決方案——能夠平衡性能、成本,可靠性和壽命的解決方案。設備構架師抱怨說,對一個高性能硬件系統中諸多單元進行算法劃分和調試是一種挑戰。在過去上,許多設計在FPGA中采用流水線的方法。也就是說,算法被分為成各種功能并在一個有順序的流水線中執行。調試流水線的運行占了集成工作內容的90%。因為每個函數的執行時間必須針對最大計算處理量進行平衡,并且局部存儲器的可見性和延時是受限制的事實,使得事情變得很難。
解決方案是一個更以軟件為中心的系統設計。這個系統是基于一個分布式協處理器計算模型,在該模型內,每個功能的協處理器是一個執行機(例如,一個功能性子處理器),其具有基于消息的、用于在子處理機之間傳遞控制和數據消息的能力。在所有內存、CPU和子處理機之間的完全切換,提供了完整的可觀測性,使得調試變容易。消息傳遞在內部存在于FPGA子協處理器之間;在外則出現在系統內的其它CPU和協處理器之間。
Altera公司的FPGA內部的Avalon 開關結構和可編程片上系統(SOPC)集成工具在所有功能單元之間自動生成靈活的交叉開關結構。經預先測試的IP提供了從FPGA到主機CPU和從FPGA到雙列直插內存模塊(DIMM)內存的接口。經預先測試的消息網絡基礎設施支持主機CPU、FPGA子處理機,以及FPGA內存控制器之間的通信控制。一個簡化的調試方法是將消息和完全開關相結合,使得開發過程中具有最大的靈活性。最后,可在執行過程中對數據通道進行軟件定義(重新定義),這樣可以攔截數據或對其重新導向,從而提高系統集成和調試過程中的可觀測性。
設計工具和IP。雖然MATLAB這樣的工具可以優化用于采用軟件進行算法的開發,但其尚不支持在FPGA中的執行。設計人員可以通過采用電子設計自動化(EDA)工具和IP來加快其在FPGA上的實現。
視頻和圖像處理套件以及DSP庫提供了可加速復雜成像算法的開發和實現的IP積木式模塊。視頻和圖像處理模塊組,和其它IP模塊及參考設計(包括同相/正交(IQ)調制解調器、JPEG2000壓縮算法、快速傅立葉變換/逆傅里葉變換,以及邊緣檢測等)為設計人員提供了廣泛的IP,設計人員可以利用這些IP迅速地完成計算密集型任務的FPGA實現。
結論
隨著當年嬰兒潮時期人口的老齡化,正在努力尋找針對諸如心臟病和癌癥這類極其常見疾病的新診斷和治療方法,包括早期檢測以及微創手術治療。各種診斷成像技術結合和相關算法開發的新進展推動了新設備的開發以滿足這些病人的需要。先進的算法需要可以顯著提高圖像處理性能的可擴展系統平臺。
被集成進至COTS多核CPU平臺的FPGA,為最靈活、最高性能的系統提供了強大的數字信號處理功能。為了幫助加快這些復雜成像算法在這些平臺上實現,需要高級開發工具和IP庫。有關軟件工具和IP庫已被開發出來。
評論
查看更多