教你如何在STM32中使用DSP指令
本文轉(zhuǎn)載自微信公眾號(hào)「知曉編程」,作者Firefly。轉(zhuǎn)載本文請(qǐng)聯(lián)系知曉編程公眾號(hào)。
01DSP簡(jiǎn)介
提到DSP,作為電子專業(yè)的學(xué)生,大部分第一時(shí)間想到的是DSP芯片,DSP芯片的內(nèi)部采用程序和數(shù)據(jù)分開的哈佛結(jié)構(gòu),具有專門的硬件乘法器,廣泛采用流水線操作,提供特殊的DSP指令,可以用來快速的實(shí)現(xiàn)各種數(shù)字信號(hào)處理算法。
實(shí)際上,DSP的全稱是數(shù)字信號(hào)處理(DigitalSignalProcessing,簡(jiǎn)稱DSP)。在過去的二十多年時(shí)間里,數(shù)字信號(hào)處理已經(jīng)在通信等領(lǐng)域得到極為廣泛DSP技術(shù)圖解的應(yīng)用。
如下面ARM官方描述的,ARM處理器是支持DSP的。
主要是在cortex-R和Cortex-M內(nèi)核支持。
Arm 的數(shù)字信號(hào)控制器Cortex-M4、Cortex-M7、Cortex-M33、Cortex-M35P和Cortex-M55處理器滿足了對(duì)高性能通用代碼處理以及數(shù)字信號(hào)處理應(yīng)用的需求。
向Thumb 指令集添加DSP 擴(kuò)展和可選浮點(diǎn)單元(FPU),旨在提高數(shù)值算法的性能。此外,它們提供了直接在 Cortex-M處理器上執(zhí)行信號(hào)處理操作的機(jī)會(huì),同時(shí)保持Cortex-M程序員模型的易用性。
02IAR中DSP Libary的使用
ArmCortex-M3 /M4處理器提供信號(hào)處理指令,例如SIMD(單指令多數(shù)據(jù))。特別是Cortex-M4專為DSP應(yīng)用而設(shè)計(jì),它支持高級(jí)SIMD,MAC(乘法和累加)指令。此外,Cortex-M4F器件具有FPU(浮點(diǎn)單元),用于處理浮點(diǎn)計(jì)算。
有幾種方法可以使用這些指令,例如使用匯編程序例程或內(nèi)部函數(shù),但最實(shí)用的方法之一是使用ArmCortex微控制器軟件接口標(biāo)準(zhǔn)(CMSIS)DSP庫。CMSIS-DSP庫專為Cortex-M處理器而設(shè)計(jì),它為數(shù)字信號(hào)處理提供優(yōu)化的功能,如矩陣函數(shù),統(tǒng)計(jì)函數(shù),高級(jí)數(shù)學(xué)函數(shù)等。
IAREmbedded Workbench forArm中提供了預(yù)構(gòu)建的CMSIS-DSP庫及其源代碼,在本文中,我們將了解如何將CMSIS-DSP庫與IAREmbedded Workbench for Arm一起使用以及如何改進(jìn)性能。
Configuringthe CMSIS-DSP library
配置CMSIS-DSP庫
讓我們看看如何調(diào)用CMSIS-DSP功能及其性能。這里我們將使用sqrt(平方根)函數(shù)并與標(biāo)準(zhǔn)數(shù)學(xué)函數(shù)進(jìn)行比較:
- //#define DSP_Lib
- #ifdef DSP_Lib
- #include <arm_math.h>
- #endif
- #include <math.h>
- #include <stdio.h>
- int main()
- {
- #ifdef DSP_Lib
- float32_t f_input_cmsis_dsp = 2;
- float32_t f_result_cmsis_dsp;
- #endif
- float f_input = 2;
- float f_result;
- #ifdef DSP_Lib
- /* Using CMSIS-DSP library */
- arm_sqrt_f32(f_input_cmsis_dsp,&f_result_cmsis_dsp);
- printf("f1: %f\n",f_result_cmsis_dsp);
- #endif
- /* Standard math function */
- f_result = sqrt(f_input);
- printf("f2: %f\n",f_result);
- return 0;
- }
結(jié)果如下
- f1: 1.414214
- f2: 1.414214
接下來,讓我們來看看性能。
IAREmbedded Workbench中的CYCLECOUNTER寄存器可用于檢查正在運(yùn)行的代碼所消耗的周期數(shù)。在檢查上次執(zhí)行的C/ C ++源代碼或匯編程序步驟期間的循環(huán)次數(shù)時(shí),CCSTEP寄存器非常方便有用。
設(shè)置斷點(diǎn)并記下sqrt函數(shù)的CCSTEP值:
在這種情況下,CMSIS-DSPsqrt功能比標(biāo)準(zhǔn)數(shù)學(xué)函數(shù)快10倍以上。
- arm_sqrt_f32 : 52 cycles
- sqrt : 752 cycles
從這個(gè)簡(jiǎn)單的例子中,我們可以看到CMSIS-DSP非常易于使用,并且顯著提高了性能。