Fixes some compiler warnings
[opus.git] / silk / silk_dec_API.c
1 /***********************************************************************\r
2 Copyright (c) 2006-2011, Skype Limited. All rights reserved. \r
3 Redistribution and use in source and binary forms, with or without \r
4 modification, (subject to the limitations in the disclaimer below) \r
5 are permitted provided that the following conditions are met:\r
6 - Redistributions of source code must retain the above copyright notice,\r
7 this list of conditions and the following disclaimer.\r
8 - Redistributions in binary form must reproduce the above copyright \r
9 notice, this list of conditions and the following disclaimer in the \r
10 documentation and/or other materials provided with the distribution.\r
11 - Neither the name of Skype Limited, nor the names of specific \r
12 contributors, may be used to endorse or promote products derived from \r
13 this software without specific prior written permission.\r
14 NO EXPRESS OR IMPLIED LICENSES TO ANY PARTY'S PATENT RIGHTS ARE GRANTED \r
15 BY THIS LICENSE. THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND \r
16 CONTRIBUTORS ''AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING,\r
17 BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND \r
18 FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE \r
19 COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, \r
20 INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT\r
21 NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF \r
22 USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON \r
23 ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT \r
24 (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE \r
25 OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.\r
26 ***********************************************************************/\r
27 \r
28 #ifdef HAVE_CONFIG_H\r
29 #include "config.h"\r
30 #endif\r
31 #include "silk_API.h"\r
32 #include "silk_main.h"\r
33 \r
34 /************************/\r
35 /* Decoder Super Struct */\r
36 /************************/\r
37 typedef struct {\r
38     silk_decoder_state          channel_state[ DECODER_NUM_CHANNELS ];\r
39     stereo_dec_state                sStereo;\r
40     SKP_int                         nChannelsAPI;\r
41     SKP_int                         nChannelsInternal;\r
42 } silk_decoder;\r
43 \r
44 /*********************/\r
45 /* Decoder functions */\r
46 /*********************/\r
47 \r
48 SKP_int silk_Get_Decoder_Size( SKP_int32 *decSizeBytes ) \r
49 {\r
50     SKP_int ret = SILK_NO_ERROR;\r
51 \r
52     *decSizeBytes = sizeof( silk_decoder );\r
53 \r
54     return ret;\r
55 }\r
56 \r
57 /* Reset decoder state */\r
58 SKP_int silk_InitDecoder(\r
59     void* decState                                      /* I/O: State                                          */\r
60 )\r
61 {\r
62     SKP_int n, ret = SILK_NO_ERROR;\r
63     silk_decoder_state *channel_state = ((silk_decoder *)decState)->channel_state;\r
64 \r
65     for( n = 0; n < DECODER_NUM_CHANNELS; n++ ) {\r
66         ret  = silk_init_decoder( &channel_state[ n ] );\r
67     }\r
68 \r
69     return ret;\r
70 }\r
71 \r
72 /* Decode a frame */\r
73 SKP_int silk_Decode(\r
74     void*                               decState,       /* I/O: State                                           */\r
75     silk_DecControlStruct*      decControl,     /* I/O: Control Structure                               */\r
76     SKP_int                             lostFlag,       /* I:   0: no loss, 1 loss, 2 decode FEC                */\r
77     SKP_int                             newPacketFlag,  /* I:   Indicates first decoder call for this packet    */\r
78     ec_dec                              *psRangeDec,    /* I/O  Compressor data structure                       */\r
79     SKP_int16                           *samplesOut,    /* O:   Decoded output speech vector                    */\r
80     SKP_int32                           *nSamplesOut    /* O:   Number of samples decoded                       */\r
81 )\r
82 {\r
83     SKP_int   i, n, prev_fs_kHz, decode_only_middle = 0, ret = SILK_NO_ERROR;\r
84     SKP_int32 nSamplesOutDec, LBRR_symbol;\r
85     SKP_int16 samplesOut1_tmp[ 2 ][ MAX_FS_KHZ * MAX_FRAME_LENGTH_MS + 2 ];\r
86     SKP_int16 samplesOut2_tmp[ MAX_API_FS_KHZ * MAX_FRAME_LENGTH_MS ];\r
87     SKP_int   MS_pred_Q13[ 2 ] = { 0 };\r
88     SKP_int16 *resample_out_ptr;\r
89     silk_decoder *psDec = ( silk_decoder * )decState;\r
90     silk_decoder_state *channel_state = psDec->channel_state;\r
91 \r
92     /**********************************/\r
93     /* Test if first frame in payload */\r
94     /**********************************/\r
95     if( newPacketFlag ) {\r
96         for( n = 0; n < decControl->nChannelsInternal; n++ ) {\r
97             channel_state[ n ].nFramesDecoded = 0;  /* Used to count frames in packet */\r
98         }\r
99     }\r
100 \r
101     /* Save previous sample frequency */\r
102     prev_fs_kHz = channel_state[ 0 ].fs_kHz;\r
103 \r
104     /* If Mono -> Stereo transition in bitstream: init state of second channel */\r
105     if( decControl->nChannelsInternal > psDec->nChannelsInternal ) {\r
106         ret += silk_init_decoder( &channel_state[ 1 ] );\r
107         if( psDec->nChannelsAPI == 2 ) {\r
108             SKP_memcpy( &channel_state[ 1 ].resampler_state, &channel_state[ 0 ].resampler_state, sizeof( silk_resampler_state_struct ) );\r
109         }\r
110     }\r
111 \r
112     for( n = 0; n < decControl->nChannelsInternal; n++ ) {\r
113         if( channel_state[ n ].nFramesDecoded == 0 ) {\r
114             SKP_int fs_kHz_dec;\r
115             if( decControl->payloadSize_ms == 0 ) {\r
116                 /* Assuming packet loss, use 10 ms */\r
117                 channel_state[ n ].nFramesPerPacket = 1;\r
118                 channel_state[ n ].nb_subfr = 2;\r
119             } else if( decControl->payloadSize_ms == 10 ) {\r
120                 channel_state[ n ].nFramesPerPacket = 1;\r
121                 channel_state[ n ].nb_subfr = 2;\r
122             } else if( decControl->payloadSize_ms == 20 ) {\r
123                 channel_state[ n ].nFramesPerPacket = 1;\r
124                 channel_state[ n ].nb_subfr = 4;\r
125             } else if( decControl->payloadSize_ms == 40 ) {\r
126                 channel_state[ n ].nFramesPerPacket = 2;\r
127                 channel_state[ n ].nb_subfr = 4;\r
128             } else if( decControl->payloadSize_ms == 60 ) {\r
129                 channel_state[ n ].nFramesPerPacket = 3;\r
130                 channel_state[ n ].nb_subfr = 4;\r
131             } else {\r
132                 SKP_assert( 0 );\r
133                 return SILK_DEC_INVALID_FRAME_SIZE;\r
134             } \r
135             fs_kHz_dec = ( decControl->internalSampleRate >> 10 ) + 1;\r
136             if( fs_kHz_dec != 8 && fs_kHz_dec != 12 && fs_kHz_dec != 16 ) {\r
137                 SKP_assert( 0 );\r
138                 return SILK_DEC_INVALID_SAMPLING_FREQUENCY;\r
139             }\r
140             silk_decoder_set_fs( &channel_state[ n ], fs_kHz_dec );\r
141         }\r
142     }\r
143 \r
144     /* Initialize resampler when switching internal or external sampling frequency */\r
145     if( prev_fs_kHz != channel_state[ 0 ].fs_kHz || channel_state[ 0 ].prev_API_sampleRate != decControl->API_sampleRate ) {\r
146         ret = silk_resampler_init( &channel_state[ 0 ].resampler_state, SKP_SMULBB( channel_state[ 0 ].fs_kHz, 1000 ), decControl->API_sampleRate );\r
147         if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 2 ) {\r
148             SKP_memcpy( &channel_state[ 1 ].resampler_state, &channel_state[ 0 ].resampler_state, sizeof( silk_resampler_state_struct ) );\r
149         }\r
150     }\r
151     channel_state[ 0 ].prev_API_sampleRate = decControl->API_sampleRate;\r
152     if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 2 && ( psDec->nChannelsAPI == 1 || psDec->nChannelsInternal == 1 ) ) {\r
153         SKP_memset( psDec->sStereo.pred_prev_Q13, 0, sizeof( psDec->sStereo.pred_prev_Q13 ) );\r
154         SKP_memset( psDec->sStereo.sSide, 0, sizeof( psDec->sStereo.sSide ) );\r
155     }\r
156     psDec->nChannelsAPI      = decControl->nChannelsAPI;\r
157     psDec->nChannelsInternal = decControl->nChannelsInternal;\r
158 \r
159     if( decControl->API_sampleRate > MAX_API_FS_KHZ * 1000 || decControl->API_sampleRate < 8000 ) {\r
160         ret = SILK_DEC_INVALID_SAMPLING_FREQUENCY;\r
161         return( ret );\r
162     }\r
163 \r
164     if( lostFlag != FLAG_PACKET_LOST && channel_state[ 0 ].nFramesDecoded == 0 ) {\r
165         /* First decoder call for this payload */\r
166         /* Decode VAD flags and LBRR flag */\r
167         for( n = 0; n < decControl->nChannelsInternal; n++ ) {\r
168             for( i = 0; i < channel_state[ n ].nFramesPerPacket; i++ ) {\r
169                 channel_state[ n ].VAD_flags[ i ] = ec_dec_bit_logp(psRangeDec, 1);\r
170             }\r
171             channel_state[ n ].LBRR_flag = ec_dec_bit_logp(psRangeDec, 1);\r
172         }        \r
173         /* Decode LBRR flags */\r
174         for( n = 0; n < decControl->nChannelsInternal; n++ ) {\r
175             SKP_memset( channel_state[ n ].LBRR_flags, 0, sizeof( channel_state[ n ].LBRR_flags ) );\r
176             if( channel_state[ n ].LBRR_flag ) {\r
177                 if( channel_state[ n ].nFramesPerPacket == 1 ) {\r
178                     channel_state[ n ].LBRR_flags[ 0 ] = 1;\r
179                 } else {\r
180                     LBRR_symbol = ec_dec_icdf( psRangeDec, silk_LBRR_flags_iCDF_ptr[ channel_state[ n ].nFramesPerPacket - 2 ], 8 ) + 1;\r
181                     for( i = 0; i < channel_state[ n ].nFramesPerPacket; i++ ) {\r
182                         channel_state[ n ].LBRR_flags[ i ] = SKP_RSHIFT( LBRR_symbol, i ) & 1;\r
183                     }\r
184                 }\r
185             }\r
186         }\r
187 \r
188         if( lostFlag == FLAG_DECODE_NORMAL ) {\r
189             /* Regular decoding: skip all LBRR data */\r
190             for( i = 0; i < channel_state[ 0 ].nFramesPerPacket; i++ ) {\r
191                 for( n = 0; n < decControl->nChannelsInternal; n++ ) {\r
192                     if( channel_state[ n ].LBRR_flags[ i ] ) {\r
193                         SKP_int pulses[ MAX_FRAME_LENGTH ];\r
194                         if( decControl->nChannelsInternal == 2 && n == 0 ) {\r
195                             silk_stereo_decode_pred( psRangeDec, &decode_only_middle, MS_pred_Q13 );\r
196                         }\r
197                         silk_decode_indices( &channel_state[ n ], psRangeDec, i, 1 );\r
198                         silk_decode_pulses( psRangeDec, pulses, channel_state[ n ].indices.signalType, \r
199                             channel_state[ n ].indices.quantOffsetType, channel_state[ n ].frame_length );\r
200                     }\r
201                 }\r
202             }\r
203         }\r
204     }\r
205 \r
206     /* Get MS predictor index */\r
207     if( decControl->nChannelsInternal == 2 ) {\r
208         if(   lostFlag == FLAG_DECODE_NORMAL || \r
209             ( lostFlag == FLAG_DECODE_LBRR && channel_state[ 0 ].LBRR_flags[ channel_state[ 0 ].nFramesDecoded ] == 1 ) ) \r
210         {\r
211             silk_stereo_decode_pred( psRangeDec, &decode_only_middle, MS_pred_Q13 );\r
212         } else {\r
213             SKP_memcpy( MS_pred_Q13, &psDec->sStereo.pred_prev_Q13, sizeof( MS_pred_Q13 ) );\r
214         }\r
215     }\r
216 \r
217     /* Call decoder for one frame */\r
218     for( n = 0; n < decControl->nChannelsInternal; n++ ) {\r
219         if( n == 0 || decode_only_middle == 0 ) {\r
220             ret += silk_decode_frame( &channel_state[ n ], psRangeDec, &samplesOut1_tmp[ n ][ 2 ], &nSamplesOutDec, lostFlag );\r
221         } else {\r
222             SKP_memset( &samplesOut1_tmp[ n ][ 2 ], 0, nSamplesOutDec * sizeof( SKP_int16 ) );\r
223         }\r
224     }\r
225 \r
226     if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 2 ) {\r
227         /* Convert Mid/Side to Left/Right */\r
228         silk_stereo_MS_to_LR( &psDec->sStereo, samplesOut1_tmp[ 0 ], samplesOut1_tmp[ 1 ], MS_pred_Q13, channel_state[ 0 ].fs_kHz, nSamplesOutDec );\r
229     } else {\r
230         /* Buffering */\r
231         SKP_memcpy( samplesOut1_tmp[ 0 ], psDec->sStereo.sMid, 2 * sizeof( SKP_int16 ) );\r
232         SKP_memcpy( psDec->sStereo.sMid, &samplesOut1_tmp[ 0 ][ nSamplesOutDec ], 2 * sizeof( SKP_int16 ) );\r
233     }\r
234 \r
235     /* Number of output samples */\r
236     *nSamplesOut = SKP_DIV32( nSamplesOutDec * decControl->API_sampleRate, SKP_SMULBB( channel_state[ 0 ].fs_kHz, 1000 ) );\r
237 \r
238     /* Set up pointers to temp buffers */\r
239     if( decControl->nChannelsAPI == 2 ) {\r
240         resample_out_ptr = samplesOut2_tmp;\r
241     } else {\r
242         resample_out_ptr = samplesOut;\r
243     }\r
244 \r
245     for( n = 0; n < SKP_min( decControl->nChannelsAPI, decControl->nChannelsInternal ); n++ ) {\r
246         /* Resample decoded signal to API_sampleRate */\r
247         ret += silk_resampler( &channel_state[ n ].resampler_state, resample_out_ptr, &samplesOut1_tmp[ n ][ 1 ], nSamplesOutDec );\r
248 \r
249         /* Interleave if stereo output and stereo stream */\r
250         if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 2 ) {\r
251             for( i = 0; i < *nSamplesOut; i++ ) {\r
252                 samplesOut[ n + 2 * i ] = resample_out_ptr[ i ];\r
253             }\r
254         }\r
255     }\r
256 \r
257     /* Create two channel output from mono stream */\r
258     if( decControl->nChannelsAPI == 2 && decControl->nChannelsInternal == 1 ) {\r
259         for( i = 0; i < *nSamplesOut; i++ ) {\r
260             samplesOut[ 0 + 2 * i ] = samplesOut[ 1 + 2 * i ] = resample_out_ptr[ i ];\r
261         }\r
262     }\r
263 \r
264     return ret;\r
265 }\r
266 \r
267 /* Getting table of contents for a packet */\r
268 SKP_int silk_get_TOC(\r
269     const SKP_uint8                     *payload,           /* I    Payload data                                */\r
270     const SKP_int                       nBytesIn,           /* I:   Number of input bytes                       */\r
271     const SKP_int                       nFramesPerPayload,  /* I:   Number of SILK frames per payload           */\r
272     silk_TOC_struct                 *Silk_TOC           /* O:   Type of content                             */\r
273 )\r
274 {\r
275     SKP_int i, flags, ret = SILK_NO_ERROR;\r
276 \r
277     if( nBytesIn < 1 ) {\r
278         return -1;\r
279     }\r
280     if( nFramesPerPayload < 0 || nFramesPerPayload > 3 ) {\r
281         return -1;\r
282     }\r
283 \r
284     SKP_memset( Silk_TOC, 0, sizeof( Silk_TOC ) );\r
285 \r
286     /* For stereo, extract the flags for the mid channel */\r
287     flags = SKP_RSHIFT( payload[ 0 ], 7 - nFramesPerPayload ) & ( SKP_LSHIFT( 1, nFramesPerPayload + 1 ) - 1 );\r
288 \r
289     Silk_TOC->inbandFECFlag = flags & 1;\r
290     for( i = nFramesPerPayload - 1; i >= 0 ; i-- ) {\r
291         flags = SKP_RSHIFT( flags, 1 );\r
292         Silk_TOC->VADFlags[ i ] = flags & 1;\r
293         Silk_TOC->VADFlag |= flags & 1;\r
294     }\r
295 \r
296     return ret;\r
297 }\r