Cisco optimization for x86 & fixed point
[opus.git] / silk / fixed / prefilter_FIX.c
1 /***********************************************************************
2 Copyright (c) 2006-2011, Skype Limited. All rights reserved.
3 Redistribution and use in source and binary forms, with or without
4 modification, are permitted provided that the following conditions
5 are met:
6 - Redistributions of source code must retain the above copyright notice,
7 this list of conditions and the following disclaimer.
8 - Redistributions in binary form must reproduce the above copyright
9 notice, this list of conditions and the following disclaimer in the
10 documentation and/or other materials provided with the distribution.
11 - Neither the name of Internet Society, IETF or IETF Trust, nor the
12 names of specific contributors, may be used to endorse or promote
13 products derived from this software without specific prior written
14 permission.
15 THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
16 AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
17 IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
18 ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
19 LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
20 CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
21 SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
22 INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
23 CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
24 ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
25 POSSIBILITY OF SUCH DAMAGE.
26 ***********************************************************************/
27
28 #ifdef HAVE_CONFIG_H
29 #include "config.h"
30 #endif
31
32 #include "main_FIX.h"
33 #include "stack_alloc.h"
34 #include "tuning_parameters.h"
35
36 #if defined(MIPSr1_ASM)
37 #include "mips/prefilter_FIX_mipsr1.h"
38 #endif
39
40
41 /* Prefilter for finding Quantizer input signal */
42 static OPUS_INLINE void silk_prefilt_FIX(
43     silk_prefilter_state_FIX    *P,                         /* I/O  state                               */
44     opus_int32                  st_res_Q12[],               /* I    short term residual signal          */
45     opus_int32                  xw_Q3[],                    /* O    prefiltered signal                  */
46     opus_int32                  HarmShapeFIRPacked_Q12,     /* I    Harmonic shaping coeficients        */
47     opus_int                    Tilt_Q14,                   /* I    Tilt shaping coeficient             */
48     opus_int32                  LF_shp_Q14,                 /* I    Low-frequancy shaping coeficients   */
49     opus_int                    lag,                        /* I    Lag for harmonic shaping            */
50     opus_int                    length                      /* I    Length of signals                   */
51 );
52
53 void silk_warped_LPC_analysis_filter_FIX_c(
54           opus_int32            state[],                    /* I/O  State [order + 1]                   */
55           opus_int32            res_Q2[],                   /* O    Residual signal [length]            */
56     const opus_int16            coef_Q13[],                 /* I    Coefficients [order]                */
57     const opus_int16            input[],                    /* I    Input signal [length]               */
58     const opus_int16            lambda_Q16,                 /* I    Warping factor                      */
59     const opus_int              length,                     /* I    Length of input signal              */
60     const opus_int              order                       /* I    Filter order (even)                 */
61 )
62 {
63     opus_int     n, i;
64     opus_int32   acc_Q11, tmp1, tmp2;
65
66     /* Order must be even */
67     silk_assert( ( order & 1 ) == 0 );
68
69     for( n = 0; n < length; n++ ) {
70         /* Output of lowpass section */
71         tmp2 = silk_SMLAWB( state[ 0 ], state[ 1 ], lambda_Q16 );
72         state[ 0 ] = silk_LSHIFT( input[ n ], 14 );
73         /* Output of allpass section */
74         tmp1 = silk_SMLAWB( state[ 1 ], state[ 2 ] - tmp2, lambda_Q16 );
75         state[ 1 ] = tmp2;
76         acc_Q11 = silk_RSHIFT( order, 1 );
77         acc_Q11 = silk_SMLAWB( acc_Q11, tmp2, coef_Q13[ 0 ] );
78         /* Loop over allpass sections */
79         for( i = 2; i < order; i += 2 ) {
80             /* Output of allpass section */
81             tmp2 = silk_SMLAWB( state[ i ], state[ i + 1 ] - tmp1, lambda_Q16 );
82             state[ i ] = tmp1;
83             acc_Q11 = silk_SMLAWB( acc_Q11, tmp1, coef_Q13[ i - 1 ] );
84             /* Output of allpass section */
85             tmp1 = silk_SMLAWB( state[ i + 1 ], state[ i + 2 ] - tmp2, lambda_Q16 );
86             state[ i + 1 ] = tmp2;
87             acc_Q11 = silk_SMLAWB( acc_Q11, tmp2, coef_Q13[ i ] );
88         }
89         state[ order ] = tmp1;
90         acc_Q11 = silk_SMLAWB( acc_Q11, tmp1, coef_Q13[ order - 1 ] );
91         res_Q2[ n ] = silk_LSHIFT( (opus_int32)input[ n ], 2 ) - silk_RSHIFT_ROUND( acc_Q11, 9 );
92     }
93 }
94
95 void silk_prefilter_FIX(
96     silk_encoder_state_FIX          *psEnc,                                 /* I/O  Encoder state                                                               */
97     const silk_encoder_control_FIX  *psEncCtrl,                             /* I    Encoder control                                                             */
98     opus_int32                      xw_Q3[],                                /* O    Weighted signal                                                             */
99     const opus_int16                x[]                                     /* I    Speech signal                                                               */
100 )
101 {
102     silk_prefilter_state_FIX *P = &psEnc->sPrefilt;
103     opus_int   j, k, lag;
104     opus_int32 tmp_32;
105     const opus_int16 *AR1_shp_Q13;
106     const opus_int16 *px;
107     opus_int32 *pxw_Q3;
108     opus_int   HarmShapeGain_Q12, Tilt_Q14;
109     opus_int32 HarmShapeFIRPacked_Q12, LF_shp_Q14;
110     VARDECL( opus_int32, x_filt_Q12 );
111     VARDECL( opus_int32, st_res_Q2 );
112     opus_int16 B_Q10[ 2 ];
113     SAVE_STACK;
114
115     /* Set up pointers */
116     px  = x;
117     pxw_Q3 = xw_Q3;
118     lag = P->lagPrev;
119     ALLOC( x_filt_Q12, psEnc->sCmn.subfr_length, opus_int32 );
120     ALLOC( st_res_Q2, psEnc->sCmn.subfr_length, opus_int32 );
121     for( k = 0; k < psEnc->sCmn.nb_subfr; k++ ) {
122         /* Update Variables that change per sub frame */
123         if( psEnc->sCmn.indices.signalType == TYPE_VOICED ) {
124             lag = psEncCtrl->pitchL[ k ];
125         }
126
127         /* Noise shape parameters */
128         HarmShapeGain_Q12 = silk_SMULWB( (opus_int32)psEncCtrl->HarmShapeGain_Q14[ k ], 16384 - psEncCtrl->HarmBoost_Q14[ k ] );
129         silk_assert( HarmShapeGain_Q12 >= 0 );
130         HarmShapeFIRPacked_Q12  =                          silk_RSHIFT( HarmShapeGain_Q12, 2 );
131         HarmShapeFIRPacked_Q12 |= silk_LSHIFT( (opus_int32)silk_RSHIFT( HarmShapeGain_Q12, 1 ), 16 );
132         Tilt_Q14    = psEncCtrl->Tilt_Q14[   k ];
133         LF_shp_Q14  = psEncCtrl->LF_shp_Q14[ k ];
134         AR1_shp_Q13 = &psEncCtrl->AR1_Q13[   k * MAX_SHAPE_LPC_ORDER ];
135
136         /* Short term FIR filtering*/
137         silk_warped_LPC_analysis_filter_FIX( P->sAR_shp, st_res_Q2, AR1_shp_Q13, px,
138             psEnc->sCmn.warping_Q16, psEnc->sCmn.subfr_length, psEnc->sCmn.shapingLPCOrder, psEnc->sCmn.arch );
139
140         /* Reduce (mainly) low frequencies during harmonic emphasis */
141         B_Q10[ 0 ] = silk_RSHIFT_ROUND( psEncCtrl->GainsPre_Q14[ k ], 4 );
142         tmp_32 = silk_SMLABB( SILK_FIX_CONST( INPUT_TILT, 26 ), psEncCtrl->HarmBoost_Q14[ k ], HarmShapeGain_Q12 );   /* Q26 */
143         tmp_32 = silk_SMLABB( tmp_32, psEncCtrl->coding_quality_Q14, SILK_FIX_CONST( HIGH_RATE_INPUT_TILT, 12 ) );    /* Q26 */
144         tmp_32 = silk_SMULWB( tmp_32, -psEncCtrl->GainsPre_Q14[ k ] );                                                /* Q24 */
145         tmp_32 = silk_RSHIFT_ROUND( tmp_32, 14 );                                                                     /* Q10 */
146         B_Q10[ 1 ]= silk_SAT16( tmp_32 );
147         x_filt_Q12[ 0 ] = silk_MLA( silk_MUL( st_res_Q2[ 0 ], B_Q10[ 0 ] ), P->sHarmHP_Q2, B_Q10[ 1 ] );
148         for( j = 1; j < psEnc->sCmn.subfr_length; j++ ) {
149             x_filt_Q12[ j ] = silk_MLA( silk_MUL( st_res_Q2[ j ], B_Q10[ 0 ] ), st_res_Q2[ j - 1 ], B_Q10[ 1 ] );
150         }
151         P->sHarmHP_Q2 = st_res_Q2[ psEnc->sCmn.subfr_length - 1 ];
152
153         silk_prefilt_FIX( P, x_filt_Q12, pxw_Q3, HarmShapeFIRPacked_Q12, Tilt_Q14, LF_shp_Q14, lag, psEnc->sCmn.subfr_length );
154
155         px  += psEnc->sCmn.subfr_length;
156         pxw_Q3 += psEnc->sCmn.subfr_length;
157     }
158
159     P->lagPrev = psEncCtrl->pitchL[ psEnc->sCmn.nb_subfr - 1 ];
160     RESTORE_STACK;
161 }
162
163 #ifndef OVERRIDE_silk_prefilt_FIX
164 /* Prefilter for finding Quantizer input signal */
165 static OPUS_INLINE void silk_prefilt_FIX(
166     silk_prefilter_state_FIX    *P,                         /* I/O  state                               */
167     opus_int32                  st_res_Q12[],               /* I    short term residual signal          */
168     opus_int32                  xw_Q3[],                    /* O    prefiltered signal                  */
169     opus_int32                  HarmShapeFIRPacked_Q12,     /* I    Harmonic shaping coeficients        */
170     opus_int                    Tilt_Q14,                   /* I    Tilt shaping coeficient             */
171     opus_int32                  LF_shp_Q14,                 /* I    Low-frequancy shaping coeficients   */
172     opus_int                    lag,                        /* I    Lag for harmonic shaping            */
173     opus_int                    length                      /* I    Length of signals                   */
174 )
175 {
176     opus_int   i, idx, LTP_shp_buf_idx;
177     opus_int32 n_LTP_Q12, n_Tilt_Q10, n_LF_Q10;
178     opus_int32 sLF_MA_shp_Q12, sLF_AR_shp_Q12;
179     opus_int16 *LTP_shp_buf;
180
181     /* To speed up use temp variables instead of using the struct */
182     LTP_shp_buf     = P->sLTP_shp;
183     LTP_shp_buf_idx = P->sLTP_shp_buf_idx;
184     sLF_AR_shp_Q12  = P->sLF_AR_shp_Q12;
185     sLF_MA_shp_Q12  = P->sLF_MA_shp_Q12;
186
187     for( i = 0; i < length; i++ ) {
188         if( lag > 0 ) {
189             /* unrolled loop */
190             silk_assert( HARM_SHAPE_FIR_TAPS == 3 );
191             idx = lag + LTP_shp_buf_idx;
192             n_LTP_Q12 = silk_SMULBB(            LTP_shp_buf[ ( idx - HARM_SHAPE_FIR_TAPS / 2 - 1) & LTP_MASK ], HarmShapeFIRPacked_Q12 );
193             n_LTP_Q12 = silk_SMLABT( n_LTP_Q12, LTP_shp_buf[ ( idx - HARM_SHAPE_FIR_TAPS / 2    ) & LTP_MASK ], HarmShapeFIRPacked_Q12 );
194             n_LTP_Q12 = silk_SMLABB( n_LTP_Q12, LTP_shp_buf[ ( idx - HARM_SHAPE_FIR_TAPS / 2 + 1) & LTP_MASK ], HarmShapeFIRPacked_Q12 );
195         } else {
196             n_LTP_Q12 = 0;
197         }
198
199         n_Tilt_Q10 = silk_SMULWB( sLF_AR_shp_Q12, Tilt_Q14 );
200         n_LF_Q10   = silk_SMLAWB( silk_SMULWT( sLF_AR_shp_Q12, LF_shp_Q14 ), sLF_MA_shp_Q12, LF_shp_Q14 );
201
202         sLF_AR_shp_Q12 = silk_SUB32( st_res_Q12[ i ], silk_LSHIFT( n_Tilt_Q10, 2 ) );
203         sLF_MA_shp_Q12 = silk_SUB32( sLF_AR_shp_Q12,  silk_LSHIFT( n_LF_Q10,   2 ) );
204
205         LTP_shp_buf_idx = ( LTP_shp_buf_idx - 1 ) & LTP_MASK;
206         LTP_shp_buf[ LTP_shp_buf_idx ] = (opus_int16)silk_SAT16( silk_RSHIFT_ROUND( sLF_MA_shp_Q12, 12 ) );
207
208         xw_Q3[i] = silk_RSHIFT_ROUND( silk_SUB32( sLF_MA_shp_Q12, n_LTP_Q12 ), 9 );
209     }
210
211     /* Copy temp variable back to state */
212     P->sLF_AR_shp_Q12   = sLF_AR_shp_Q12;
213     P->sLF_MA_shp_Q12   = sLF_MA_shp_Q12;
214     P->sLTP_shp_buf_idx = LTP_shp_buf_idx;
215 }
216 #endif /* OVERRIDE_silk_prefilt_FIX */