STM32F4 - konstrukce banky filtrů

Nejsem si jist, zda by u tohoto mcu výrazně pomohla změna na FIR (v int). FIR potřebuje vyšší řád než IIR, ale zas méně MAC na stupeň. MAC(‘MLA’) trvá 2 takty, FMA 3. Na 16b výpočtu ovšem lze použít 1-cyklovou SMUAD/SMLALD (2xMAC). Filtr by však možná bylo nutné rozdělit na více částí a meřítkovat mezivýsledky.

K Radiusovým otázkám bych přidal:
jaký překladač (umí HW float)?
má překladač informaci o použitém mcu (aby mohl použít hw float)?

Pro překladač gcc “GNU Tools for ARM Embedded Processors” jsou parametry dle readme.txt:
-mthumb -mcpu=cortex-m4 -mfloat-abi=hard -mfpu=fpv4-sp-d16,
knihovny ze složky “…/armv7e-m/fpu” (jsou ve složce překladače 2).