Initial Skype commit taken from FreeSwitch, which got it from the IETF draft.
[opus.git] / src_common / SKP_Silk_define.h
1 /***********************************************************************\r
2 Copyright (c) 2006-2010, Skype Limited. All rights reserved. \r
3 Redistribution and use in source and binary forms, with or without \r
4 modification, (subject to the limitations in the disclaimer below) \r
5 are permitted provided that the following conditions are met:\r
6 - Redistributions of source code must retain the above copyright notice,\r
7 this list of conditions and the following disclaimer.\r
8 - Redistributions in binary form must reproduce the above copyright \r
9 notice, this list of conditions and the following disclaimer in the \r
10 documentation and/or other materials provided with the distribution.\r
11 - Neither the name of Skype Limited, nor the names of specific \r
12 contributors, may be used to endorse or promote products derived from \r
13 this software without specific prior written permission.\r
14 NO EXPRESS OR IMPLIED LICENSES TO ANY PARTY'S PATENT RIGHTS ARE GRANTED \r
15 BY THIS LICENSE. THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND \r
16 CONTRIBUTORS ''AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING,\r
17 BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND \r
18 FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE \r
19 COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, \r
20 INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT\r
21 NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF \r
22 USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON \r
23 ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT \r
24 (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE \r
25 OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.\r
26 ***********************************************************************/\r
27 \r
28 #ifndef SKP_SILK_DEFINE_H\r
29 #define SKP_SILK_DEFINE_H\r
30 \r
31 #include "SKP_Silk_errors.h"\r
32 #include "SKP_Silk_typedef.h"\r
33 \r
34 #ifdef __cplusplus\r
35 extern "C"\r
36 {\r
37 #endif\r
38 \r
39 #define MAX_FRAMES_PER_PACKET                   3\r
40 \r
41 #ifndef FIXED_POINT\r
42 #    define FIXED_POINT                         0\r
43 #endif\r
44 \r
45 /* MAX DELTA LAG used for multiframe packets */\r
46 #define MAX_DELTA_LAG                           10\r
47 \r
48 /* Lower limit on bitrate for each mode */\r
49 #define MIN_TARGET_RATE_NB_BPS                  5000\r
50 #define MIN_TARGET_RATE_MB_BPS                  7000\r
51 #define MIN_TARGET_RATE_WB_BPS                  8000\r
52 #define MIN_TARGET_RATE_SWB_BPS                 20000\r
53 \r
54 /* Transition bitrates between modes */\r
55 #define SWB2WB_BITRATE_BPS                      25000\r
56 #define WB2SWB_BITRATE_BPS                      30000\r
57 #define WB2MB_BITRATE_BPS                       14000\r
58 #define MB2WB_BITRATE_BPS                       18000\r
59 #define MB2NB_BITRATE_BPS                       10000\r
60 #define NB2MB_BITRATE_BPS                       14000\r
61 \r
62 /* Integration/hysteresis threshold for lowering internal sample frequency */\r
63 /* 30000000 -> 6 sec if bitrate is 5000 bps below limit; 3 sec if bitrate is 10000 bps below limit */\r
64 #define ACCUM_BITS_DIFF_THRESHOLD               30000000 \r
65 #define TARGET_RATE_TAB_SZ                      8\r
66 \r
67 /* DTX settings                                 */\r
68 #define NO_SPEECH_FRAMES_BEFORE_DTX             5       /* eq 100 ms */\r
69 #define MAX_CONSECUTIVE_DTX                     20      /* eq 400 ms */\r
70 \r
71 #define USE_LBRR                                1\r
72 \r
73 /* Amount of concecutive no FEC packets before telling JB */\r
74 #define NO_LBRR_THRES                           10\r
75 \r
76 /* Maximum delay between real packet and LBRR packet */\r
77 #define MAX_LBRR_DELAY                          2\r
78 #define LBRR_IDX_MASK                           1\r
79 \r
80 #define INBAND_FEC_MIN_RATE_BPS                 18000  /* Dont use inband FEC below this total target rate  */\r
81 #define LBRR_LOSS_THRES                         2   /* Start adding LBRR at this loss rate (needs tuning)   */\r
82 \r
83 /* LBRR usage defines */\r
84 #define SKP_SILK_NO_LBRR                        0   /* No LBRR information for this packet                  */\r
85 #define SKP_SILK_ADD_LBRR_TO_PLUS1              1   /* Add LBRR for this packet to packet n + 1             */\r
86 #define SKP_SILK_ADD_LBRR_TO_PLUS2              2   /* Add LBRR for this packet to packet n + 2             */\r
87 \r
88 /* Frame termination indicator defines */\r
89 #define SKP_SILK_LAST_FRAME                     0   /* Last frames in packet                                */\r
90 #define SKP_SILK_MORE_FRAMES                    1   /* More frames to follow this one                       */\r
91 #define SKP_SILK_LBRR_VER1                      2   /* LBRR information from packet n - 1                   */\r
92 #define SKP_SILK_LBRR_VER2                      3   /* LBRR information from packet n - 2                   */\r
93 #define SKP_SILK_EXT_LAYER                      4   /* Extension layers added                               */\r
94 \r
95 /* Number of Second order Sections for SWB detection HP filter */\r
96 #define NB_SOS                                  3\r
97 #define HP_8_KHZ_THRES                          10          /* average energy per sample, above 8 kHz       */\r
98 #define CONCEC_SWB_SMPLS_THRES                  480 * 15    /* 300 ms                                       */\r
99 #define WB_DETECT_ACTIVE_SPEECH_MS_THRES        15000       /* ms of active speech needed for WB detection  */\r
100 \r
101 /* Low complexity setting */\r
102 #define LOW_COMPLEXITY_ONLY                     0\r
103 \r
104 /* Activate bandwidth transition filtering for mode switching */\r
105 #  define SWITCH_TRANSITION_FILTERING           1\r
106 \r
107 /* Decoder Parameters */\r
108 #define DEC_HP_ORDER                            2\r
109 \r
110 /* Maximum sampling frequency, should be 16 for embedded */\r
111 #define MAX_FS_KHZ                              24 \r
112 #define MAX_API_FS_KHZ                          48\r
113 \r
114 /* Signal Types used by silk */\r
115 #define SIG_TYPE_VOICED                         0\r
116 #define SIG_TYPE_UNVOICED                       1\r
117 \r
118 /* VAD Types used by silk */\r
119 #define NO_VOICE_ACTIVITY                       0\r
120 #define VOICE_ACTIVITY                          1\r
121 \r
122 /* Number of subframes */\r
123 #define MAX_NB_SUBFR                            4\r
124 \r
125 /* number of samples per frame */ \r
126 #define LTP_MEM_LENGTH_MS                       20\r
127 #define SUB_FRAME_LENGTH_MS                     5\r
128 #define MAX_SUB_FRAME_LENGTH                    ( SUB_FRAME_LENGTH_MS * MAX_FS_KHZ )\r
129 #define MAX_FRAME_LENGTH_MS                     ( SUB_FRAME_LENGTH_MS * MAX_NB_SUBFR )\r
130 #define MAX_FRAME_LENGTH                        ( MAX_FRAME_LENGTH_MS * MAX_FS_KHZ )\r
131 \r
132 /* number of lookahead samples for pitch analysis */\r
133 #define LA_PITCH_MS                             3\r
134 #define LA_PITCH_MAX                            (LA_PITCH_MS * MAX_FS_KHZ)\r
135 \r
136 /* number of lookahead samples for noise shape analysis */\r
137 #define LA_SHAPE_MS                             5\r
138 #define LA_SHAPE_MAX                            (LA_SHAPE_MS * MAX_FS_KHZ)\r
139 \r
140 /* Order of LPC used in find pitch */\r
141 #define MAX_FIND_PITCH_LPC_ORDER                16\r
142 \r
143 /* Length of LPC window used in find pitch */\r
144 #define FIND_PITCH_LPC_WIN_MS                   (30 + (LA_PITCH_MS << 1))\r
145 #define FIND_PITCH_LPC_WIN_MS_2_SF              (15 + (LA_PITCH_MS << 1))\r
146 #define FIND_PITCH_LPC_WIN_MAX                  (FIND_PITCH_LPC_WIN_MS * MAX_FS_KHZ)\r
147 \r
148 #define PITCH_EST_COMPLEXITY_HC_MODE            SKP_Silk_PE_MAX_COMPLEX\r
149 #define PITCH_EST_COMPLEXITY_MC_MODE            SKP_Silk_PE_MID_COMPLEX\r
150 #define PITCH_EST_COMPLEXITY_LC_MODE            SKP_Silk_PE_MIN_COMPLEX\r
151 \r
152 \r
153 /* Max number of bytes in payload output buffer (may contain multiple frames) */\r
154 #define MAX_ARITHM_BYTES                        1024\r
155 \r
156 #define RANGE_CODER_WRITE_BEYOND_BUFFER         -1\r
157 #define RANGE_CODER_CDF_OUT_OF_RANGE            -2\r
158 #define RANGE_CODER_NORMALIZATION_FAILED        -3\r
159 #define RANGE_CODER_ZERO_INTERVAL_WIDTH         -4\r
160 #define RANGE_CODER_DECODER_CHECK_FAILED        -5\r
161 #define RANGE_CODER_READ_BEYOND_BUFFER          -6\r
162 #define RANGE_CODER_ILLEGAL_SAMPLING_RATE       -7\r
163 #define RANGE_CODER_DEC_PAYLOAD_TOO_LONG        -8\r
164 \r
165 /* dB level of lowest gain quantization level */\r
166 #define MIN_QGAIN_DB                            6\r
167 /* dB level of highest gain quantization level */\r
168 #define MAX_QGAIN_DB                            86\r
169 /* Number of gain quantization levels */\r
170 #define N_LEVELS_QGAIN                          64\r
171 /* Max increase in gain quantization index */\r
172 #define MAX_DELTA_GAIN_QUANT                    40\r
173 /* Max decrease in gain quantization index */\r
174 #define MIN_DELTA_GAIN_QUANT                    -4\r
175 \r
176 /* Quantization offsets (multiples of 4) */\r
177 #define OFFSET_VL_Q10                           32\r
178 #define OFFSET_VH_Q10                           100\r
179 #define OFFSET_UVL_Q10                          100\r
180 #define OFFSET_UVH_Q10                          256\r
181 \r
182 /* Maximum numbers of iterations used to stabilize a LPC vector */\r
183 #define MAX_LPC_STABILIZE_ITERATIONS            20\r
184 \r
185 #define MAX_LPC_ORDER                           16\r
186 #define MIN_LPC_ORDER                           10\r
187 \r
188 /* Find Pred Coef defines */\r
189 #define LTP_ORDER                               5\r
190 \r
191 /* LTP quantization settings */\r
192 #define NB_LTP_CBKS                             3\r
193 \r
194 /* Flag to use harmonic noise shaping */\r
195 #define USE_HARM_SHAPING                        1\r
196 \r
197 /* Max LPC order of noise shaping filters */\r
198 #define MAX_SHAPE_LPC_ORDER                     16\r
199 \r
200 #define HARM_SHAPE_FIR_TAPS                     3\r
201 \r
202 /* Length of LPC window used in noise shape analysis */\r
203 #define SHAPE_LPC_WIN_MS                        15\r
204 #define SHAPE_LPC_WIN_16_KHZ                    (SHAPE_LPC_WIN_MS * 16)\r
205 #define SHAPE_LPC_WIN_24_KHZ                    (SHAPE_LPC_WIN_MS * 24)\r
206 #define SHAPE_LPC_WIN_MAX                       (SHAPE_LPC_WIN_MS * MAX_FS_KHZ)\r
207 \r
208 /* Maximum number of delayed decision states */\r
209 #define MAX_DEL_DEC_STATES                      4\r
210 \r
211 #define LTP_BUF_LENGTH                          512\r
212 #define LTP_MASK                                (LTP_BUF_LENGTH - 1)\r
213 \r
214 #define DECISION_DELAY                          32\r
215 #define DECISION_DELAY_MASK                     (DECISION_DELAY - 1)\r
216 \r
217 /* number of subframes for excitation entropy coding */\r
218 #define SHELL_CODEC_FRAME_LENGTH                16\r
219 #define LOG2_SHELL_CODEC_FRAME_LENGTH           4\r
220 #define MAX_NB_SHELL_BLOCKS                     (MAX_FRAME_LENGTH / SHELL_CODEC_FRAME_LENGTH)\r
221 \r
222 /* number of rate levels, for entropy coding of excitation */\r
223 #define N_RATE_LEVELS                           10\r
224 \r
225 /* maximum sum of pulses per shell coding frame */\r
226 #define MAX_PULSES                              18\r
227 \r
228 #define MAX_MATRIX_SIZE                         MAX_LPC_ORDER /* Max of LPC Order and LTP order */\r
229 \r
230 #if( MAX_LPC_ORDER > DECISION_DELAY )\r
231 # define NSQ_LPC_BUF_LENGTH                     MAX_LPC_ORDER\r
232 #else\r
233 # define NSQ_LPC_BUF_LENGTH                     DECISION_DELAY\r
234 #endif\r
235 \r
236 /***********************/\r
237 /* High pass filtering */\r
238 /***********************/\r
239 #define HIGH_PASS_INPUT                         1\r
240 \r
241 /***************************/\r
242 /* Voice activity detector */\r
243 /***************************/\r
244 #define VAD_N_BANDS                             4\r
245 \r
246 #define VAD_INTERNAL_SUBFRAMES_LOG2             2\r
247 #define VAD_INTERNAL_SUBFRAMES                  (1 << VAD_INTERNAL_SUBFRAMES_LOG2)\r
248     \r
249 #define VAD_NOISE_LEVEL_SMOOTH_COEF_Q16         1024    /* Must be <  4096                                  */\r
250 #define VAD_NOISE_LEVELS_BIAS                   50 \r
251 \r
252 /* Sigmoid settings */\r
253 #define VAD_NEGATIVE_OFFSET_Q5                  128     /* sigmoid is 0 at -128                             */\r
254 #define VAD_SNR_FACTOR_Q16                      45000 \r
255 \r
256 /* smoothing for SNR measurement */\r
257 #define VAD_SNR_SMOOTH_COEF_Q18                 4096\r
258 \r
259 /******************/\r
260 /* NLSF quantizer */\r
261 /******************/\r
262 #   define NLSF_MSVQ_MAX_CB_STAGES                      10  /* Update manually when changing codebooks      */\r
263 #   define NLSF_MSVQ_MAX_VECTORS_IN_STAGE               128 /* Update manually when changing codebooks      */\r
264 #   define NLSF_MSVQ_MAX_VECTORS_IN_STAGE_TWO_TO_END    16  /* Update manually when changing codebooks      */\r
265 \r
266 #define NLSF_MSVQ_FLUCTUATION_REDUCTION         1\r
267 #define MAX_NLSF_MSVQ_SURVIVORS                 16\r
268 #define MAX_NLSF_MSVQ_SURVIVORS_LC_MODE         2\r
269 #define MAX_NLSF_MSVQ_SURVIVORS_MC_MODE         4\r
270 \r
271 /* Based on above defines, calculate how much memory is necessary to allocate */\r
272 #if( NLSF_MSVQ_MAX_VECTORS_IN_STAGE > ( MAX_NLSF_MSVQ_SURVIVORS_LC_MODE * NLSF_MSVQ_MAX_VECTORS_IN_STAGE_TWO_TO_END ) )\r
273 #   define NLSF_MSVQ_TREE_SEARCH_MAX_VECTORS_EVALUATED_LC_MODE  NLSF_MSVQ_MAX_VECTORS_IN_STAGE\r
274 #else\r
275 #   define NLSF_MSVQ_TREE_SEARCH_MAX_VECTORS_EVALUATED_LC_MODE  MAX_NLSF_MSVQ_SURVIVORS_LC_MODE * NLSF_MSVQ_MAX_VECTORS_IN_STAGE_TWO_TO_END\r
276 #endif\r
277 \r
278 #if( NLSF_MSVQ_MAX_VECTORS_IN_STAGE > ( MAX_NLSF_MSVQ_SURVIVORS * NLSF_MSVQ_MAX_VECTORS_IN_STAGE_TWO_TO_END ) )\r
279 #   define NLSF_MSVQ_TREE_SEARCH_MAX_VECTORS_EVALUATED  NLSF_MSVQ_MAX_VECTORS_IN_STAGE\r
280 #else\r
281 #   define NLSF_MSVQ_TREE_SEARCH_MAX_VECTORS_EVALUATED  MAX_NLSF_MSVQ_SURVIVORS * NLSF_MSVQ_MAX_VECTORS_IN_STAGE_TWO_TO_END\r
282 #endif\r
283 \r
284 #define NLSF_MSVQ_SURV_MAX_REL_RD               4\r
285 \r
286 /* Transition filtering for mode switching */\r
287 #if SWITCH_TRANSITION_FILTERING\r
288 #  define TRANSITION_TIME_UP_MS                 5120 // 5120 = 64 * FRAME_LENGTH_MS * ( TRANSITION_INT_NUM - 1 ) = 64*(20*4)\r
289 #  define TRANSITION_TIME_DOWN_MS               2560 // 2560 = 32 * FRAME_LENGTH_MS * ( TRANSITION_INT_NUM - 1 ) = 32*(20*4)\r
290 #  define TRANSITION_NB                         3 /* Hardcoded in tables */\r
291 #  define TRANSITION_NA                         2 /* Hardcoded in tables */\r
292 #  define TRANSITION_INT_NUM                    5 /* Hardcoded in tables */\r
293 #  define TRANSITION_FRAMES_UP                  ( TRANSITION_TIME_UP_MS   / MAX_FRAME_LENGTH_MS ) // NB! needs to be made flexible for 10 ms frames\r
294 #  define TRANSITION_FRAMES_DOWN                ( TRANSITION_TIME_DOWN_MS / MAX_FRAME_LENGTH_MS ) // NB! needs to be made flexible for 10 ms frames\r
295 #  define TRANSITION_INT_STEPS_UP               ( TRANSITION_FRAMES_UP    / ( TRANSITION_INT_NUM - 1 )  )\r
296 #  define TRANSITION_INT_STEPS_DOWN             ( TRANSITION_FRAMES_DOWN  / ( TRANSITION_INT_NUM - 1 )  )\r
297 #endif\r
298 \r
299 /* BWE factors to apply after packet loss */\r
300 #define BWE_AFTER_LOSS_Q16                      63570\r
301 \r
302 /*************************/\r
303 /* Perceptual parameters */\r
304 /*************************/\r
305 /* Amount of warping to apply */\r
306 #define WARPING_MULTIPLIER_Q16                  SKP_FIX_CONST( 0.02, 16 )\r
307 \r
308 /* Defines for CN generation */\r
309 #define CNG_BUF_MASK_MAX                        255             /* 2^floor(log2(MAX_FRAME_LENGTH))-1    */\r
310 #define CNG_GAIN_SMTH_Q16                       4634            /* 0.25^(1/4)                           */\r
311 #define CNG_NLSF_SMTH_Q16                       16348           /* 0.25                                 */\r
312 \r
313 #ifdef __cplusplus\r
314 }\r
315 #endif\r
316 \r
317 #endif\r