[PATCH 2/7] exp: Rename SSE4.1 to SSE2 kernel
authorJohannes Demel <demel@uni-bremen.de>
Tue, 17 Mar 2020 20:20:51 +0000 (21:20 +0100)
committerA. Maitland Bottoms <bottoms@debian.org>
Sat, 28 Mar 2020 01:48:10 +0000 (01:48 +0000)
The SSE kernel only requires SSE2 instructions. Thus, we can just use
this instruction level.

Gbp-Pq: Name 0002-exp-Rename-SSE4.1-to-SSE2-kernel.patch

kernels/volk/volk_32f_exp_32f.h

index 19c3d9d5f9ff001ab28aefafa6c4b3e1d12d8f08..26fdf02ea020b0a2f4122946c3ad43f2daa8275e 100644 (file)
 #ifndef INCLUDED_volk_32f_exp_32f_a_H
 #define INCLUDED_volk_32f_exp_32f_a_H
 
-#ifdef LV_HAVE_SSE4_1
-#include <smmintrin.h>
+#ifdef LV_HAVE_SSE2
+#include <emmintrin.h>
 
 static inline void
-volk_32f_exp_32f_a_sse4_1(float* bVector, const float* aVector, unsigned int num_points)
+volk_32f_exp_32f_a_sse2(float* bVector, const float* aVector, unsigned int num_points)
 {
   float* bPtr = bVector;
   const float* aPtr = aVector;
@@ -175,7 +175,7 @@ volk_32f_exp_32f_a_sse4_1(float* bVector, const float* aVector, unsigned int num
   }
 }
 
-#endif /* LV_HAVE_SSE4_1 for aligned */
+#endif /* LV_HAVE_SSE2 for aligned */
 
 
 #ifdef LV_HAVE_GENERIC
@@ -199,11 +199,11 @@ volk_32f_exp_32f_a_generic(float* bVector, const float* aVector, unsigned int nu
 #ifndef INCLUDED_volk_32f_exp_32f_u_H
 #define INCLUDED_volk_32f_exp_32f_u_H
 
-#ifdef LV_HAVE_SSE4_1
-#include <smmintrin.h>
+#ifdef LV_HAVE_SSE2
+#include <emmintrin.h>
 
 static inline void
-volk_32f_exp_32f_u_sse4_1(float* bVector, const float* aVector, unsigned int num_points)
+volk_32f_exp_32f_u_sse2(float* bVector, const float* aVector, unsigned int num_points)
 {
   float* bPtr = bVector;
   const float* aPtr = aVector;
@@ -276,7 +276,7 @@ volk_32f_exp_32f_u_sse4_1(float* bVector, const float* aVector, unsigned int num
   }
 }
 
-#endif /* LV_HAVE_SSE4_1 for unaligned */
+#endif /* LV_HAVE_SSE2 for unaligned */
 
 
 #ifdef LV_HAVE_GENERIC