自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

教你如何在STM32中使用DSP指令

商務(wù)辦公
提到DSP,作為電子專業(yè)的學(xué)生,大部分第一時(shí)間想到的是DSP芯片,DSP芯片的內(nèi)部采用程序和數(shù)據(jù)分開的哈佛結(jié)構(gòu),具有專門的硬件乘法器,廣泛采用流水線操作,提供特殊的DSP指令,可以用來快速的實(shí)現(xiàn)各種數(shù)字信號(hào)處理算法。

[[420574]]

本文轉(zhuǎn)載自微信公眾號(hào)「知曉編程」,作者Firefly。轉(zhuǎn)載本文請(qǐng)聯(lián)系知曉編程公眾號(hào)。

01DSP簡(jiǎn)介

提到DSP,作為電子專業(yè)的學(xué)生,大部分第一時(shí)間想到的是DSP芯片,DSP芯片的內(nèi)部采用程序和數(shù)據(jù)分開的哈佛結(jié)構(gòu),具有專門的硬件乘法器,廣泛采用流水線操作,提供特殊的DSP指令,可以用來快速的實(shí)現(xiàn)各種數(shù)字信號(hào)處理算法。

實(shí)際上,DSP的全稱是數(shù)字信號(hào)處理(DigitalSignalProcessing,簡(jiǎn)稱DSP)。在過去的二十多年時(shí)間里,數(shù)字信號(hào)處理已經(jīng)在通信等領(lǐng)域得到極為廣泛DSP技術(shù)圖解的應(yīng)用。

如下面ARM官方描述的,ARM處理器是支持DSP的。

主要是在cortex-R和Cortex-M內(nèi)核支持。

Arm 的數(shù)字信號(hào)控制器Cortex-M4、Cortex-M7、Cortex-M33、Cortex-M35P和Cortex-M55處理器滿足了對(duì)高性能通用代碼處理以及數(shù)字信號(hào)處理應(yīng)用的需求。

向Thumb 指令集添加DSP 擴(kuò)展和可選浮點(diǎn)單元(FPU),旨在提高數(shù)值算法的性能。此外,它們提供了直接在 Cortex-M處理器上執(zhí)行信號(hào)處理操作的機(jī)會(huì),同時(shí)保持Cortex-M程序員模型的易用性。

02IAR中DSP Libary的使用

ArmCortex-M3 /M4處理器提供信號(hào)處理指令,例如SIMD(單指令多數(shù)據(jù))。特別是Cortex-M4專為DSP應(yīng)用而設(shè)計(jì),它支持高級(jí)SIMD,MAC(乘法和累加)指令。此外,Cortex-M4F器件具有FPU(浮點(diǎn)單元),用于處理浮點(diǎn)計(jì)算。

有幾種方法可以使用這些指令,例如使用匯編程序例程或內(nèi)部函數(shù),但最實(shí)用的方法之一是使用ArmCortex微控制器軟件接口標(biāo)準(zhǔn)(CMSIS)DSP庫。CMSIS-DSP庫專為Cortex-M處理器而設(shè)計(jì),它為數(shù)字信號(hào)處理提供優(yōu)化的功能,如矩陣函數(shù),統(tǒng)計(jì)函數(shù),高級(jí)數(shù)學(xué)函數(shù)等。

IAREmbedded Workbench forArm中提供了預(yù)構(gòu)建的CMSIS-DSP庫及其源代碼,在本文中,我們將了解如何將CMSIS-DSP庫與IAREmbedded Workbench for Arm一起使用以及如何改進(jìn)性能。

Configuringthe CMSIS-DSP library

配置CMSIS-DSP庫

讓我們看看如何調(diào)用CMSIS-DSP功能及其性能。這里我們將使用sqrt(平方根)函數(shù)并與標(biāo)準(zhǔn)數(shù)學(xué)函數(shù)進(jìn)行比較:

  1. //#define DSP_Lib 
  2.  
  3. #ifdef DSP_Lib 
  4. #include <arm_math.h> 
  5. #endif 
  6.  
  7. #include <math.h> 
  8. #include <stdio.h> 
  9. int main() 
  10. #ifdef DSP_Lib 
  11.   float32_t f_input_cmsis_dsp = 2; 
  12.   float32_t f_result_cmsis_dsp; 
  13. #endif 
  14.    
  15.   float f_input = 2; 
  16.   float f_result; 
  17.    
  18.  
  19. #ifdef DSP_Lib 
  20.   /* Using CMSIS-DSP library */ 
  21.   arm_sqrt_f32(f_input_cmsis_dsp,&f_result_cmsis_dsp); 
  22.   printf("f1: %f\n",f_result_cmsis_dsp); 
  23. #endif 
  24.    
  25.   /* Standard math function */ 
  26.   f_result = sqrt(f_input); 
  27.   printf("f2: %f\n",f_result); 
  28.    
  29.   return 0; 

結(jié)果如下

  1. f1: 1.414214  
  2. f2: 1.414214 

接下來,讓我們來看看性能。

IAREmbedded Workbench中的CYCLECOUNTER寄存器可用于檢查正在運(yùn)行的代碼所消耗的周期數(shù)。在檢查上次執(zhí)行的C/ C ++源代碼或匯編程序步驟期間的循環(huán)次數(shù)時(shí),CCSTEP寄存器非常方便有用。

設(shè)置斷點(diǎn)并記下sqrt函數(shù)的CCSTEP值:

在這種情況下,CMSIS-DSPsqrt功能比標(biāo)準(zhǔn)數(shù)學(xué)函數(shù)快10倍以上。

  1. arm_sqrt_f32 :    52 cycles 
  2. sqrt :            752 cycles 

 

從這個(gè)簡(jiǎn)單的例子中,我們可以看到CMSIS-DSP非常易于使用,并且顯著提高了性能。

 

責(zé)任編輯:武曉燕 來源: 知曉編程
相關(guān)推薦

2009-09-23 13:04:58

HibernateOracle sequ

2021-05-20 07:26:22

DMASTM32數(shù)據(jù)

2021-05-06 08:54:39

串口DMASTM32

2022-07-25 14:31:55

LiteOS開發(fā)工具

2018-10-15 10:15:30

STM32Linux經(jīng)驗(yàn)

2022-10-10 08:24:15

編程數(shù)據(jù)邏輯語句

2021-12-22 06:56:07

STM32C語言內(nèi)存

2022-04-30 09:41:14

LinuxNTP服務(wù)器

2019-09-04 19:32:56

HiveFlink大數(shù)據(jù)

2022-12-08 08:00:00

.NET?7BitArray數(shù)據(jù)執(zhí)行

2022-01-07 08:24:13

STM32枚舉結(jié)構(gòu)體

2021-03-06 21:21:11

STM32單片機(jī)追蹤庫

2019-08-26 09:20:29

Windows 10虛擬桌面Windows

2016-08-11 10:43:56

2011-08-10 09:31:41

Hibernateunion

2021-03-09 07:27:40

Kafka開源分布式

2015-08-27 09:46:09

swiftAFNetworkin

2021-06-09 09:36:18

DjangoElasticSearLinux

2022-05-17 08:25:10

TypeScript接口前端

2022-06-23 08:00:53

PythonDateTime模塊
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)