Speeding up PVQ using unlikely() and moving first position out of the loop
[opus.git] / silk / NSQ.c
1 /***********************************************************************
2 Copyright (c) 2006-2011, Skype Limited. All rights reserved.
3 Redistribution and use in source and binary forms, with or without
4 modification, are permitted provided that the following conditions
5 are met:
6 - Redistributions of source code must retain the above copyright notice,
7 this list of conditions and the following disclaimer.
8 - Redistributions in binary form must reproduce the above copyright
9 notice, this list of conditions and the following disclaimer in the
10 documentation and/or other materials provided with the distribution.
11 - Neither the name of Internet Society, IETF or IETF Trust, nor the
12 names of specific contributors, may be used to endorse or promote
13 products derived from this software without specific prior written
14 permission.
15 THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
16 AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
17 IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
18 ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
19 LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
20 CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
21 SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
22 INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
23 CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
24 ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
25 POSSIBILITY OF SUCH DAMAGE.
26 ***********************************************************************/
27
28 #ifdef HAVE_CONFIG_H
29 #include "config.h"
30 #endif
31
32 #include "main.h"
33 #include "stack_alloc.h"
34 #include "NSQ.h"
35
36
37 static OPUS_INLINE void silk_nsq_scale_states(
38     const silk_encoder_state *psEncC,           /* I    Encoder State                   */
39     silk_nsq_state      *NSQ,                   /* I/O  NSQ state                       */
40     const opus_int16    x16[],                  /* I    input                           */
41     opus_int32          x_sc_Q10[],             /* O    input scaled with 1/Gain        */
42     const opus_int16    sLTP[],                 /* I    re-whitened LTP state in Q0     */
43     opus_int32          sLTP_Q15[],             /* O    LTP state matching scaled input */
44     opus_int            subfr,                  /* I    subframe number                 */
45     const opus_int      LTP_scale_Q14,          /* I                                    */
46     const opus_int32    Gains_Q16[ MAX_NB_SUBFR ], /* I                                 */
47     const opus_int      pitchL[ MAX_NB_SUBFR ], /* I    Pitch lag                       */
48     const opus_int      signal_type             /* I    Signal type                     */
49 );
50
51 #if !defined(OPUS_X86_MAY_HAVE_SSE4_1)
52 static OPUS_INLINE void silk_noise_shape_quantizer(
53     silk_nsq_state      *NSQ,                   /* I/O  NSQ state                       */
54     opus_int            signalType,             /* I    Signal type                     */
55     const opus_int32    x_sc_Q10[],             /* I                                    */
56     opus_int8           pulses[],               /* O                                    */
57     opus_int16          xq[],                   /* O                                    */
58     opus_int32          sLTP_Q15[],             /* I/O  LTP state                       */
59     const opus_int16    a_Q12[],                /* I    Short term prediction coefs     */
60     const opus_int16    b_Q14[],                /* I    Long term prediction coefs      */
61     const opus_int16    AR_shp_Q13[],           /* I    Noise shaping AR coefs          */
62     opus_int            lag,                    /* I    Pitch lag                       */
63     opus_int32          HarmShapeFIRPacked_Q14, /* I                                    */
64     opus_int            Tilt_Q14,               /* I    Spectral tilt                   */
65     opus_int32          LF_shp_Q14,             /* I                                    */
66     opus_int32          Gain_Q16,               /* I                                    */
67     opus_int            Lambda_Q10,             /* I                                    */
68     opus_int            offset_Q10,             /* I                                    */
69     opus_int            length,                 /* I    Input length                    */
70     opus_int            shapingLPCOrder,        /* I    Noise shaping AR filter order   */
71     opus_int            predictLPCOrder,        /* I    Prediction filter order         */
72     int                 arch                    /* I    Architecture                    */
73 );
74 #endif
75
76 void silk_NSQ_c
77 (
78     const silk_encoder_state    *psEncC,                                    /* I/O  Encoder State                   */
79     silk_nsq_state              *NSQ,                                       /* I/O  NSQ state                       */
80     SideInfoIndices             *psIndices,                                 /* I/O  Quantization Indices            */
81     const opus_int16            x16[],                                        /* I    Input                           */
82     opus_int8                   pulses[],                                   /* O    Quantized pulse signal          */
83     const opus_int16            PredCoef_Q12[ 2 * MAX_LPC_ORDER ],          /* I    Short term prediction coefs     */
84     const opus_int16            LTPCoef_Q14[ LTP_ORDER * MAX_NB_SUBFR ],    /* I    Long term prediction coefs      */
85     const opus_int16            AR_Q13[ MAX_NB_SUBFR * MAX_SHAPE_LPC_ORDER ], /* I Noise shaping coefs              */
86     const opus_int              HarmShapeGain_Q14[ MAX_NB_SUBFR ],          /* I    Long term shaping coefs         */
87     const opus_int              Tilt_Q14[ MAX_NB_SUBFR ],                   /* I    Spectral tilt                   */
88     const opus_int32            LF_shp_Q14[ MAX_NB_SUBFR ],                 /* I    Low frequency shaping coefs     */
89     const opus_int32            Gains_Q16[ MAX_NB_SUBFR ],                  /* I    Quantization step sizes         */
90     const opus_int              pitchL[ MAX_NB_SUBFR ],                     /* I    Pitch lags                      */
91     const opus_int              Lambda_Q10,                                 /* I    Rate/distortion tradeoff        */
92     const opus_int              LTP_scale_Q14                               /* I    LTP state scaling               */
93 )
94 {
95     opus_int            k, lag, start_idx, LSF_interpolation_flag;
96     const opus_int16    *A_Q12, *B_Q14, *AR_shp_Q13;
97     opus_int16          *pxq;
98     VARDECL( opus_int32, sLTP_Q15 );
99     VARDECL( opus_int16, sLTP );
100     opus_int32          HarmShapeFIRPacked_Q14;
101     opus_int            offset_Q10;
102     VARDECL( opus_int32, x_sc_Q10 );
103     SAVE_STACK;
104
105     NSQ->rand_seed = psIndices->Seed;
106
107     /* Set unvoiced lag to the previous one, overwrite later for voiced */
108     lag = NSQ->lagPrev;
109
110     silk_assert( NSQ->prev_gain_Q16 != 0 );
111
112     offset_Q10 = silk_Quantization_Offsets_Q10[ psIndices->signalType >> 1 ][ psIndices->quantOffsetType ];
113
114     if( psIndices->NLSFInterpCoef_Q2 == 4 ) {
115         LSF_interpolation_flag = 0;
116     } else {
117         LSF_interpolation_flag = 1;
118     }
119
120     ALLOC( sLTP_Q15, psEncC->ltp_mem_length + psEncC->frame_length, opus_int32 );
121     ALLOC( sLTP, psEncC->ltp_mem_length + psEncC->frame_length, opus_int16 );
122     ALLOC( x_sc_Q10, psEncC->subfr_length, opus_int32 );
123     /* Set up pointers to start of sub frame */
124     NSQ->sLTP_shp_buf_idx = psEncC->ltp_mem_length;
125     NSQ->sLTP_buf_idx     = psEncC->ltp_mem_length;
126     pxq                   = &NSQ->xq[ psEncC->ltp_mem_length ];
127     for( k = 0; k < psEncC->nb_subfr; k++ ) {
128         A_Q12      = &PredCoef_Q12[ (( k >> 1 ) | ( 1 - LSF_interpolation_flag )) * MAX_LPC_ORDER ];
129         B_Q14      = &LTPCoef_Q14[ k * LTP_ORDER ];
130         AR_shp_Q13 = &AR_Q13[ k * MAX_SHAPE_LPC_ORDER ];
131
132         /* Noise shape parameters */
133         silk_assert( HarmShapeGain_Q14[ k ] >= 0 );
134         HarmShapeFIRPacked_Q14  =                          silk_RSHIFT( HarmShapeGain_Q14[ k ], 2 );
135         HarmShapeFIRPacked_Q14 |= silk_LSHIFT( (opus_int32)silk_RSHIFT( HarmShapeGain_Q14[ k ], 1 ), 16 );
136
137         NSQ->rewhite_flag = 0;
138         if( psIndices->signalType == TYPE_VOICED ) {
139             /* Voiced */
140             lag = pitchL[ k ];
141
142             /* Re-whitening */
143             if( ( k & ( 3 - silk_LSHIFT( LSF_interpolation_flag, 1 ) ) ) == 0 ) {
144                 /* Rewhiten with new A coefs */
145                 start_idx = psEncC->ltp_mem_length - lag - psEncC->predictLPCOrder - LTP_ORDER / 2;
146                 silk_assert( start_idx > 0 );
147
148                 silk_LPC_analysis_filter( &sLTP[ start_idx ], &NSQ->xq[ start_idx + k * psEncC->subfr_length ],
149                     A_Q12, psEncC->ltp_mem_length - start_idx, psEncC->predictLPCOrder, psEncC->arch );
150
151                 NSQ->rewhite_flag = 1;
152                 NSQ->sLTP_buf_idx = psEncC->ltp_mem_length;
153             }
154         }
155
156         silk_nsq_scale_states( psEncC, NSQ, x16, x_sc_Q10, sLTP, sLTP_Q15, k, LTP_scale_Q14, Gains_Q16, pitchL, psIndices->signalType );
157
158         silk_noise_shape_quantizer( NSQ, psIndices->signalType, x_sc_Q10, pulses, pxq, sLTP_Q15, A_Q12, B_Q14,
159             AR_shp_Q13, lag, HarmShapeFIRPacked_Q14, Tilt_Q14[ k ], LF_shp_Q14[ k ], Gains_Q16[ k ], Lambda_Q10,
160             offset_Q10, psEncC->subfr_length, psEncC->shapingLPCOrder, psEncC->predictLPCOrder, psEncC->arch );
161
162         x16    += psEncC->subfr_length;
163         pulses += psEncC->subfr_length;
164         pxq    += psEncC->subfr_length;
165     }
166
167     /* Update lagPrev for next frame */
168     NSQ->lagPrev = pitchL[ psEncC->nb_subfr - 1 ];
169
170     /* Save quantized speech and noise shaping signals */
171     /* DEBUG_STORE_DATA( enc.pcm, &NSQ->xq[ psEncC->ltp_mem_length ], psEncC->frame_length * sizeof( opus_int16 ) ) */
172     silk_memmove( NSQ->xq,           &NSQ->xq[           psEncC->frame_length ], psEncC->ltp_mem_length * sizeof( opus_int16 ) );
173     silk_memmove( NSQ->sLTP_shp_Q14, &NSQ->sLTP_shp_Q14[ psEncC->frame_length ], psEncC->ltp_mem_length * sizeof( opus_int32 ) );
174     RESTORE_STACK;
175 }
176
177 /***********************************/
178 /* silk_noise_shape_quantizer  */
179 /***********************************/
180
181 #if !defined(OPUS_X86_MAY_HAVE_SSE4_1)
182 static OPUS_INLINE
183 #endif
184 void silk_noise_shape_quantizer(
185     silk_nsq_state      *NSQ,                   /* I/O  NSQ state                       */
186     opus_int            signalType,             /* I    Signal type                     */
187     const opus_int32    x_sc_Q10[],             /* I                                    */
188     opus_int8           pulses[],               /* O                                    */
189     opus_int16          xq[],                   /* O                                    */
190     opus_int32          sLTP_Q15[],             /* I/O  LTP state                       */
191     const opus_int16    a_Q12[],                /* I    Short term prediction coefs     */
192     const opus_int16    b_Q14[],                /* I    Long term prediction coefs      */
193     const opus_int16    AR_shp_Q13[],           /* I    Noise shaping AR coefs          */
194     opus_int            lag,                    /* I    Pitch lag                       */
195     opus_int32          HarmShapeFIRPacked_Q14, /* I                                    */
196     opus_int            Tilt_Q14,               /* I    Spectral tilt                   */
197     opus_int32          LF_shp_Q14,             /* I                                    */
198     opus_int32          Gain_Q16,               /* I                                    */
199     opus_int            Lambda_Q10,             /* I                                    */
200     opus_int            offset_Q10,             /* I                                    */
201     opus_int            length,                 /* I    Input length                    */
202     opus_int            shapingLPCOrder,        /* I    Noise shaping AR filter order   */
203     opus_int            predictLPCOrder,        /* I    Prediction filter order         */
204     int                 arch                    /* I    Architecture                    */
205 )
206 {
207     opus_int     i;
208     opus_int32   LTP_pred_Q13, LPC_pred_Q10, n_AR_Q12, n_LTP_Q13;
209     opus_int32   n_LF_Q12, r_Q10, rr_Q10, q1_Q0, q1_Q10, q2_Q10, rd1_Q20, rd2_Q20;
210     opus_int32   exc_Q14, LPC_exc_Q14, xq_Q14, Gain_Q10;
211     opus_int32   tmp1, tmp2, sLF_AR_shp_Q14;
212     opus_int32   *psLPC_Q14, *shp_lag_ptr, *pred_lag_ptr;
213 #ifdef silk_short_prediction_create_arch_coef
214     opus_int32   a_Q12_arch[MAX_LPC_ORDER];
215 #endif
216
217     shp_lag_ptr  = &NSQ->sLTP_shp_Q14[ NSQ->sLTP_shp_buf_idx - lag + HARM_SHAPE_FIR_TAPS / 2 ];
218     pred_lag_ptr = &sLTP_Q15[ NSQ->sLTP_buf_idx - lag + LTP_ORDER / 2 ];
219     Gain_Q10     = silk_RSHIFT( Gain_Q16, 6 );
220
221     /* Set up short term AR state */
222     psLPC_Q14 = &NSQ->sLPC_Q14[ NSQ_LPC_BUF_LENGTH - 1 ];
223
224 #ifdef silk_short_prediction_create_arch_coef
225     silk_short_prediction_create_arch_coef(a_Q12_arch, a_Q12, predictLPCOrder);
226 #endif
227
228     for( i = 0; i < length; i++ ) {
229         /* Generate dither */
230         NSQ->rand_seed = silk_RAND( NSQ->rand_seed );
231
232         /* Short-term prediction */
233         LPC_pred_Q10 = silk_noise_shape_quantizer_short_prediction(psLPC_Q14, a_Q12, a_Q12_arch, predictLPCOrder, arch);
234
235         /* Long-term prediction */
236         if( signalType == TYPE_VOICED ) {
237             /* Unrolled loop */
238             /* Avoids introducing a bias because silk_SMLAWB() always rounds to -inf */
239             LTP_pred_Q13 = 2;
240             LTP_pred_Q13 = silk_SMLAWB( LTP_pred_Q13, pred_lag_ptr[  0 ], b_Q14[ 0 ] );
241             LTP_pred_Q13 = silk_SMLAWB( LTP_pred_Q13, pred_lag_ptr[ -1 ], b_Q14[ 1 ] );
242             LTP_pred_Q13 = silk_SMLAWB( LTP_pred_Q13, pred_lag_ptr[ -2 ], b_Q14[ 2 ] );
243             LTP_pred_Q13 = silk_SMLAWB( LTP_pred_Q13, pred_lag_ptr[ -3 ], b_Q14[ 3 ] );
244             LTP_pred_Q13 = silk_SMLAWB( LTP_pred_Q13, pred_lag_ptr[ -4 ], b_Q14[ 4 ] );
245             pred_lag_ptr++;
246         } else {
247             LTP_pred_Q13 = 0;
248         }
249
250         /* Noise shape feedback */
251         silk_assert( ( shapingLPCOrder & 1 ) == 0 );   /* check that order is even */
252         n_AR_Q12 = silk_NSQ_noise_shape_feedback_loop(&NSQ->sDiff_shp_Q14, NSQ->sAR2_Q14, AR_shp_Q13, shapingLPCOrder, arch);
253
254         n_AR_Q12 = silk_SMLAWB( n_AR_Q12, NSQ->sLF_AR_shp_Q14, Tilt_Q14 );
255
256         n_LF_Q12 = silk_SMULWB( NSQ->sLTP_shp_Q14[ NSQ->sLTP_shp_buf_idx - 1 ], LF_shp_Q14 );
257         n_LF_Q12 = silk_SMLAWT( n_LF_Q12, NSQ->sLF_AR_shp_Q14, LF_shp_Q14 );
258
259         silk_assert( lag > 0 || signalType != TYPE_VOICED );
260
261         /* Combine prediction and noise shaping signals */
262         tmp1 = silk_SUB32( silk_LSHIFT32( LPC_pred_Q10, 2 ), n_AR_Q12 );        /* Q12 */
263         tmp1 = silk_SUB32( tmp1, n_LF_Q12 );                                    /* Q12 */
264         if( lag > 0 ) {
265             /* Symmetric, packed FIR coefficients */
266             n_LTP_Q13 = silk_SMULWB( silk_ADD32( shp_lag_ptr[ 0 ], shp_lag_ptr[ -2 ] ), HarmShapeFIRPacked_Q14 );
267             n_LTP_Q13 = silk_SMLAWT( n_LTP_Q13, shp_lag_ptr[ -1 ],                      HarmShapeFIRPacked_Q14 );
268             n_LTP_Q13 = silk_LSHIFT( n_LTP_Q13, 1 );
269             shp_lag_ptr++;
270
271             tmp2 = silk_SUB32( LTP_pred_Q13, n_LTP_Q13 );                       /* Q13 */
272             tmp1 = silk_ADD_LSHIFT32( tmp2, tmp1, 1 );                          /* Q13 */
273             tmp1 = silk_RSHIFT_ROUND( tmp1, 3 );                                /* Q10 */
274         } else {
275             tmp1 = silk_RSHIFT_ROUND( tmp1, 2 );                                /* Q10 */
276         }
277
278         r_Q10 = silk_SUB32( x_sc_Q10[ i ], tmp1 );                              /* residual error Q10 */
279
280         /* Flip sign depending on dither */
281         if( NSQ->rand_seed < 0 ) {
282             r_Q10 = -r_Q10;
283         }
284         r_Q10 = silk_LIMIT_32( r_Q10, -(31 << 10), 30 << 10 );
285
286         /* Find two quantization level candidates and measure their rate-distortion */
287         q1_Q10 = silk_SUB32( r_Q10, offset_Q10 );
288         q1_Q0 = silk_RSHIFT( q1_Q10, 10 );
289         if (Lambda_Q10 > 2048) {
290             /* For aggressive RDO, the bias becomes more than one pulse. */
291             int rdo_offset = Lambda_Q10/2 - 512;
292             if (q1_Q10 > rdo_offset) {
293                 q1_Q0 = silk_RSHIFT( q1_Q10 - rdo_offset, 10 );
294             } else if (q1_Q10 < -rdo_offset) {
295                 q1_Q0 = silk_RSHIFT( q1_Q10 + rdo_offset, 10 );
296             } else if (q1_Q10 < 0) {
297                 q1_Q0 = -1;
298             } else {
299                 q1_Q0 = 0;
300             }
301         }
302         if( q1_Q0 > 0 ) {
303             q1_Q10  = silk_SUB32( silk_LSHIFT( q1_Q0, 10 ), QUANT_LEVEL_ADJUST_Q10 );
304             q1_Q10  = silk_ADD32( q1_Q10, offset_Q10 );
305             q2_Q10  = silk_ADD32( q1_Q10, 1024 );
306             rd1_Q20 = silk_SMULBB( q1_Q10, Lambda_Q10 );
307             rd2_Q20 = silk_SMULBB( q2_Q10, Lambda_Q10 );
308         } else if( q1_Q0 == 0 ) {
309             q1_Q10  = offset_Q10;
310             q2_Q10  = silk_ADD32( q1_Q10, 1024 - QUANT_LEVEL_ADJUST_Q10 );
311             rd1_Q20 = silk_SMULBB( q1_Q10, Lambda_Q10 );
312             rd2_Q20 = silk_SMULBB( q2_Q10, Lambda_Q10 );
313         } else if( q1_Q0 == -1 ) {
314             q2_Q10  = offset_Q10;
315             q1_Q10  = silk_SUB32( q2_Q10, 1024 - QUANT_LEVEL_ADJUST_Q10 );
316             rd1_Q20 = silk_SMULBB( -q1_Q10, Lambda_Q10 );
317             rd2_Q20 = silk_SMULBB(  q2_Q10, Lambda_Q10 );
318         } else {            /* Q1_Q0 < -1 */
319             q1_Q10  = silk_ADD32( silk_LSHIFT( q1_Q0, 10 ), QUANT_LEVEL_ADJUST_Q10 );
320             q1_Q10  = silk_ADD32( q1_Q10, offset_Q10 );
321             q2_Q10  = silk_ADD32( q1_Q10, 1024 );
322             rd1_Q20 = silk_SMULBB( -q1_Q10, Lambda_Q10 );
323             rd2_Q20 = silk_SMULBB( -q2_Q10, Lambda_Q10 );
324         }
325         rr_Q10  = silk_SUB32( r_Q10, q1_Q10 );
326         rd1_Q20 = silk_SMLABB( rd1_Q20, rr_Q10, rr_Q10 );
327         rr_Q10  = silk_SUB32( r_Q10, q2_Q10 );
328         rd2_Q20 = silk_SMLABB( rd2_Q20, rr_Q10, rr_Q10 );
329
330         if( rd2_Q20 < rd1_Q20 ) {
331             q1_Q10 = q2_Q10;
332         }
333
334         pulses[ i ] = (opus_int8)silk_RSHIFT_ROUND( q1_Q10, 10 );
335
336         /* Excitation */
337         exc_Q14 = silk_LSHIFT( q1_Q10, 4 );
338         if ( NSQ->rand_seed < 0 ) {
339            exc_Q14 = -exc_Q14;
340         }
341
342         /* Add predictions */
343         LPC_exc_Q14 = silk_ADD_LSHIFT32( exc_Q14, LTP_pred_Q13, 1 );
344         xq_Q14      = silk_ADD_LSHIFT32( LPC_exc_Q14, LPC_pred_Q10, 4 );
345
346         /* Scale XQ back to normal level before saving */
347         xq[ i ] = (opus_int16)silk_SAT16( silk_RSHIFT_ROUND( silk_SMULWW( xq_Q14, Gain_Q10 ), 8 ) );
348
349         /* Update states */
350         psLPC_Q14++;
351         *psLPC_Q14 = xq_Q14;
352         NSQ->sDiff_shp_Q14 = silk_SUB_LSHIFT32( xq_Q14, x_sc_Q10[ i ], 4 );
353         sLF_AR_shp_Q14 = silk_SUB_LSHIFT32( NSQ->sDiff_shp_Q14, n_AR_Q12, 2 );
354         NSQ->sLF_AR_shp_Q14 = sLF_AR_shp_Q14;
355
356         NSQ->sLTP_shp_Q14[ NSQ->sLTP_shp_buf_idx ] = silk_SUB_LSHIFT32( sLF_AR_shp_Q14, n_LF_Q12, 2 );
357         sLTP_Q15[ NSQ->sLTP_buf_idx ] = silk_LSHIFT( LPC_exc_Q14, 1 );
358         NSQ->sLTP_shp_buf_idx++;
359         NSQ->sLTP_buf_idx++;
360
361         /* Make dither dependent on quantized signal */
362         NSQ->rand_seed = silk_ADD32_ovflw( NSQ->rand_seed, pulses[ i ] );
363     }
364
365     /* Update LPC synth buffer */
366     silk_memcpy( NSQ->sLPC_Q14, &NSQ->sLPC_Q14[ length ], NSQ_LPC_BUF_LENGTH * sizeof( opus_int32 ) );
367 }
368
369 static OPUS_INLINE void silk_nsq_scale_states(
370     const silk_encoder_state *psEncC,           /* I    Encoder State                   */
371     silk_nsq_state      *NSQ,                   /* I/O  NSQ state                       */
372     const opus_int16    x16[],                  /* I    input                           */
373     opus_int32          x_sc_Q10[],             /* O    input scaled with 1/Gain        */
374     const opus_int16    sLTP[],                 /* I    re-whitened LTP state in Q0     */
375     opus_int32          sLTP_Q15[],             /* O    LTP state matching scaled input */
376     opus_int            subfr,                  /* I    subframe number                 */
377     const opus_int      LTP_scale_Q14,          /* I                                    */
378     const opus_int32    Gains_Q16[ MAX_NB_SUBFR ], /* I                                 */
379     const opus_int      pitchL[ MAX_NB_SUBFR ], /* I    Pitch lag                       */
380     const opus_int      signal_type             /* I    Signal type                     */
381 )
382 {
383     opus_int   i, lag;
384     opus_int32 gain_adj_Q16, inv_gain_Q31, inv_gain_Q26;
385
386     lag          = pitchL[ subfr ];
387     inv_gain_Q31 = silk_INVERSE32_varQ( silk_max( Gains_Q16[ subfr ], 1 ), 47 );
388     silk_assert( inv_gain_Q31 != 0 );
389
390     /* Scale input */
391     inv_gain_Q26 = silk_RSHIFT_ROUND( inv_gain_Q31, 5 );
392     for( i = 0; i < psEncC->subfr_length; i++ ) {
393         x_sc_Q10[ i ] = silk_SMULWW( x16[ i ], inv_gain_Q26 );
394     }
395
396     /* After rewhitening the LTP state is un-scaled, so scale with inv_gain_Q16 */
397     if( NSQ->rewhite_flag ) {
398         if( subfr == 0 ) {
399             /* Do LTP downscaling */
400             inv_gain_Q31 = silk_LSHIFT( silk_SMULWB( inv_gain_Q31, LTP_scale_Q14 ), 2 );
401         }
402         for( i = NSQ->sLTP_buf_idx - lag - LTP_ORDER / 2; i < NSQ->sLTP_buf_idx; i++ ) {
403             silk_assert( i < MAX_FRAME_LENGTH );
404             sLTP_Q15[ i ] = silk_SMULWB( inv_gain_Q31, sLTP[ i ] );
405         }
406     }
407
408     /* Adjust for changing gain */
409     if( Gains_Q16[ subfr ] != NSQ->prev_gain_Q16 ) {
410         gain_adj_Q16 =  silk_DIV32_varQ( NSQ->prev_gain_Q16, Gains_Q16[ subfr ], 16 );
411
412         /* Scale long-term shaping state */
413         for( i = NSQ->sLTP_shp_buf_idx - psEncC->ltp_mem_length; i < NSQ->sLTP_shp_buf_idx; i++ ) {
414             NSQ->sLTP_shp_Q14[ i ] = silk_SMULWW( gain_adj_Q16, NSQ->sLTP_shp_Q14[ i ] );
415         }
416
417         /* Scale long-term prediction state */
418         if( signal_type == TYPE_VOICED && NSQ->rewhite_flag == 0 ) {
419             for( i = NSQ->sLTP_buf_idx - lag - LTP_ORDER / 2; i < NSQ->sLTP_buf_idx; i++ ) {
420                 sLTP_Q15[ i ] = silk_SMULWW( gain_adj_Q16, sLTP_Q15[ i ] );
421             }
422         }
423
424         NSQ->sLF_AR_shp_Q14 = silk_SMULWW( gain_adj_Q16, NSQ->sLF_AR_shp_Q14 );
425         NSQ->sDiff_shp_Q14 = silk_SMULWW( gain_adj_Q16, NSQ->sDiff_shp_Q14 );
426
427         /* Scale short-term prediction and shaping states */
428         for( i = 0; i < NSQ_LPC_BUF_LENGTH; i++ ) {
429             NSQ->sLPC_Q14[ i ] = silk_SMULWW( gain_adj_Q16, NSQ->sLPC_Q14[ i ] );
430         }
431         for( i = 0; i < MAX_SHAPE_LPC_ORDER; i++ ) {
432             NSQ->sAR2_Q14[ i ] = silk_SMULWW( gain_adj_Q16, NSQ->sAR2_Q14[ i ] );
433         }
434
435         /* Save inverse gain */
436         NSQ->prev_gain_Q16 = Gains_Q16[ subfr ];
437     }
438 }