Prevents zero-energy on LFE
[opus.git] / celt / celt_lpc.c
1 /* Copyright (c) 2009-2010 Xiph.Org Foundation
2    Written by Jean-Marc Valin */
3 /*
4    Redistribution and use in source and binary forms, with or without
5    modification, are permitted provided that the following conditions
6    are met:
7
8    - Redistributions of source code must retain the above copyright
9    notice, this list of conditions and the following disclaimer.
10
11    - Redistributions in binary form must reproduce the above copyright
12    notice, this list of conditions and the following disclaimer in the
13    documentation and/or other materials provided with the distribution.
14
15    THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
16    ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
17    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
18    A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
19    OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
20    EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
21    PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
22    PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
23    LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
24    NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
25    SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
26 */
27
28 #ifdef HAVE_CONFIG_H
29 #include "config.h"
30 #endif
31
32 #include "celt_lpc.h"
33 #include "stack_alloc.h"
34 #include "mathops.h"
35 #include "pitch.h"
36
37 void _celt_lpc(
38       opus_val16       *_lpc, /* out: [0...p-1] LPC coefficients      */
39 const opus_val32 *ac,  /* in:  [0...p] autocorrelation values  */
40 int          p
41 )
42 {
43    int i, j;
44    opus_val32 r;
45    opus_val32 error = ac[0];
46 #ifdef FIXED_POINT
47    opus_val32 lpc[LPC_ORDER];
48 #else
49    float *lpc = _lpc;
50 #endif
51
52    for (i = 0; i < p; i++)
53       lpc[i] = 0;
54    if (ac[0] != 0)
55    {
56       for (i = 0; i < p; i++) {
57          /* Sum up this iteration's reflection coefficient */
58          opus_val32 rr = 0;
59          for (j = 0; j < i; j++)
60             rr += MULT32_32_Q31(lpc[j],ac[i - j]);
61          rr += SHR32(ac[i + 1],3);
62          r = -frac_div32(SHL32(rr,3), error);
63          /*  Update LPC coefficients and total error */
64          lpc[i] = SHR32(r,3);
65          for (j = 0; j < (i+1)>>1; j++)
66          {
67             opus_val32 tmp1, tmp2;
68             tmp1 = lpc[j];
69             tmp2 = lpc[i-1-j];
70             lpc[j]     = tmp1 + MULT32_32_Q31(r,tmp2);
71             lpc[i-1-j] = tmp2 + MULT32_32_Q31(r,tmp1);
72          }
73
74          error = error - MULT32_32_Q31(MULT32_32_Q31(r,r),error);
75          /* Bail out once we get 30 dB gain */
76 #ifdef FIXED_POINT
77          if (error<SHR32(ac[0],10))
78             break;
79 #else
80          if (error<.001f*ac[0])
81             break;
82 #endif
83       }
84    }
85 #ifdef FIXED_POINT
86    for (i=0;i<p;i++)
87       _lpc[i] = ROUND16(lpc[i],16);
88 #endif
89 }
90
91 void celt_fir(const opus_val16 *_x,
92          const opus_val16 *num,
93          opus_val16 *_y,
94          int N,
95          int ord,
96          opus_val16 *mem)
97 {
98    int i,j;
99    VARDECL(opus_val16, rnum);
100    VARDECL(opus_val16, x);
101    SAVE_STACK;
102
103    ALLOC(rnum, ord, opus_val16);
104    ALLOC(x, N+ord, opus_val16);
105    for(i=0;i<ord;i++)
106       rnum[i] = num[ord-i-1];
107    for(i=0;i<ord;i++)
108       x[i] = mem[ord-i-1];
109    for (i=0;i<N;i++)
110       x[i+ord]=_x[i];
111    for(i=0;i<ord;i++)
112       mem[i] = _x[N-i-1];
113 #ifdef SMALL_FOOTPRINT
114    for (i=0;i<N;i++)
115    {
116       opus_val32 sum = SHL32(EXTEND32(_x[i]), SIG_SHIFT);
117       for (j=0;j<ord;j++)
118       {
119          sum = MAC16_16(sum,rnum[j],x[i+j]);
120       }
121       _y[i] = ROUND16(sum, SIG_SHIFT);
122    }
123 #else
124    celt_assert((ord&3)==0);
125    for (i=0;i<N-3;i+=4)
126    {
127       opus_val32 sum[4]={0,0,0,0};
128       xcorr_kernel(rnum, x+i, sum, ord);
129       _y[i  ] = ADD16(_x[i  ], ROUND16(sum[0], SIG_SHIFT));
130       _y[i+1] = ADD16(_x[i+1], ROUND16(sum[1], SIG_SHIFT));
131       _y[i+2] = ADD16(_x[i+2], ROUND16(sum[2], SIG_SHIFT));
132       _y[i+3] = ADD16(_x[i+3], ROUND16(sum[3], SIG_SHIFT));
133    }
134    for (;i<N;i++)
135    {
136       opus_val32 sum = 0;
137       for (j=0;j<ord;j++)
138          sum = MAC16_16(sum,rnum[j],x[i+j]);
139       _y[i] = ADD16(_x[i  ], ROUND16(sum, SIG_SHIFT));
140    }
141 #endif
142    RESTORE_STACK;
143 }
144
145 void celt_iir(const opus_val32 *_x,
146          const opus_val16 *den,
147          opus_val32 *_y,
148          int N,
149          int ord,
150          opus_val16 *mem)
151 {
152 #ifdef SMALL_FOOTPRINT
153    int i,j;
154    for (i=0;i<N;i++)
155    {
156       opus_val32 sum = _x[i];
157       for (j=0;j<ord;j++)
158       {
159          sum -= MULT16_16(den[j],mem[j]);
160       }
161       for (j=ord-1;j>=1;j--)
162       {
163          mem[j]=mem[j-1];
164       }
165       mem[0] = ROUND16(sum,SIG_SHIFT);
166       _y[i] = sum;
167    }
168 #else
169    int i,j;
170    VARDECL(opus_val16, rden);
171    VARDECL(opus_val16, y);
172    SAVE_STACK;
173
174    celt_assert((ord&3)==0);
175    ALLOC(rden, ord, opus_val16);
176    ALLOC(y, N+ord, opus_val16);
177    for(i=0;i<ord;i++)
178       rden[i] = den[ord-i-1];
179    for(i=0;i<ord;i++)
180       y[i] = -mem[ord-i-1];
181    for(;i<N+ord;i++)
182       y[i]=0;
183    for (i=0;i<N-3;i+=4)
184    {
185       /* Unroll by 4 as if it were an FIR filter */
186       opus_val32 sum[4];
187       sum[0]=_x[i];
188       sum[1]=_x[i+1];
189       sum[2]=_x[i+2];
190       sum[3]=_x[i+3];
191       xcorr_kernel(rden, y+i, sum, ord);
192
193       /* Patch up the result to compensate for the fact that this is an IIR */
194       y[i+ord  ] = -ROUND16(sum[0],SIG_SHIFT);
195       _y[i  ] = sum[0];
196       sum[1] = MAC16_16(sum[1], y[i+ord  ], den[0]);
197       y[i+ord+1] = -ROUND16(sum[1],SIG_SHIFT);
198       _y[i+1] = sum[1];
199       sum[2] = MAC16_16(sum[2], y[i+ord+1], den[0]);
200       sum[2] = MAC16_16(sum[2], y[i+ord  ], den[1]);
201       y[i+ord+2] = -ROUND16(sum[2],SIG_SHIFT);
202       _y[i+2] = sum[2];
203
204       sum[3] = MAC16_16(sum[3], y[i+ord+2], den[0]);
205       sum[3] = MAC16_16(sum[3], y[i+ord+1], den[1]);
206       sum[3] = MAC16_16(sum[3], y[i+ord  ], den[2]);
207       y[i+ord+3] = -ROUND16(sum[3],SIG_SHIFT);
208       _y[i+3] = sum[3];
209    }
210    for (;i<N;i++)
211    {
212       opus_val32 sum = _x[i];
213       for (j=0;j<ord;j++)
214          sum -= MULT16_16(rden[j],y[i+j]);
215       y[i+ord] = ROUND16(sum,SIG_SHIFT);
216       _y[i] = sum;
217    }
218    for(i=0;i<ord;i++)
219       mem[i] = _y[N-i-1];
220    RESTORE_STACK;
221 #endif
222 }
223
224 void _celt_autocorr(
225                    const opus_val16 *x,   /*  in: [0...n-1] samples x   */
226                    opus_val32       *ac,  /* out: [0...lag-1] ac values */
227                    const opus_val16       *window,
228                    int          overlap,
229                    int          lag,
230                    int          n
231                   )
232 {
233    opus_val32 d;
234    int i;
235    int fastN=n-lag;
236    VARDECL(opus_val16, xx);
237    SAVE_STACK;
238    ALLOC(xx, n, opus_val16);
239    celt_assert(n>0);
240    celt_assert(overlap>=0);
241    for (i=0;i<n;i++)
242       xx[i] = x[i];
243    for (i=0;i<overlap;i++)
244    {
245       xx[i] = MULT16_16_Q15(x[i],window[i]);
246       xx[n-i-1] = MULT16_16_Q15(x[n-i-1],window[i]);
247    }
248 #ifdef FIXED_POINT
249    {
250       opus_val32 ac0;
251       int shift;
252       ac0 = 1+n;
253       if (n&1) ac0 += SHR32(MULT16_16(xx[0],xx[0]),9);
254       for(i=(n&1);i<n;i+=2)
255       {
256          ac0 += SHR32(MULT16_16(xx[i],xx[i]),9);
257          ac0 += SHR32(MULT16_16(xx[i+1],xx[i+1]),9);
258       }
259
260       shift = celt_ilog2(ac0)-30+10;
261       shift = (shift+1)/2;
262       for(i=0;i<n;i++)
263          xx[i] = VSHR32(xx[i], shift);
264    }
265 #endif
266    celt_pitch_xcorr(xx, xx, ac, fastN, lag+1);
267    while (lag>=0)
268    {
269       for (i = lag+fastN, d = 0; i < n; i++)
270          d = MAC16_16(d, xx[i], xx[i-lag]);
271       ac[lag] += d;
272       /*printf ("%f ", ac[lag]);*/
273       lag--;
274    }
275    /*printf ("\n");*/
276    ac[0] += 10;
277
278    RESTORE_STACK;
279 }