defined find_max16 and overrode it for C55x
[opus.git] / libcelt / mathops.h
1 /* Copyright (C) 2002-2008 Jean-Marc Valin */
2 /**
3    @file mathops.h
4    @brief Various math functions
5 */
6 /*
7    Redistribution and use in source and binary forms, with or without
8    modification, are permitted provided that the following conditions
9    are met:
10    
11    - Redistributions of source code must retain the above copyright
12    notice, this list of conditions and the following disclaimer.
13    
14    - Redistributions in binary form must reproduce the above copyright
15    notice, this list of conditions and the following disclaimer in the
16    documentation and/or other materials provided with the distribution.
17    
18    - Neither the name of the Xiph.org Foundation nor the names of its
19    contributors may be used to endorse or promote products derived from
20    this software without specific prior written permission.
21    
22    THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
23    ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
24    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
25    A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
26    CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
27    EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
28    PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
29    PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
30    LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
31    NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
32    SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
33 */
34
35 #ifndef MATHOPS_H
36 #define MATHOPS_H
37
38 #include "arch.h"
39
40 #ifndef OVERRIDE_FIND_MAX16
41 static inline int find_max16(celt_word16_t *x, int len)
42 {
43    celt_word16_t max_corr=-VERY_LARGE16;
44    int i, id = 0;
45    for (i=0;i<len;i++)
46    {
47       if (x[i] > max_corr)
48       {
49          id = i;
50          max_corr = x[i];
51       }
52    }
53    return id;
54 }
55 #endif
56
57
58 #ifndef FIXED_POINT
59
60 #define celt_sqrt sqrt
61 #define celt_acos acos
62 #define celt_exp exp
63 #define celt_cos_norm(x) (cos((.5f*M_PI)*(x)))
64 #define celt_atan atan
65 #define celt_rcp(x) (1.f/(x))
66 #define celt_div(a,b) ((a)/(b))
67
68 #endif
69
70
71
72 #ifdef FIXED_POINT
73
74 #include "entcode.h"
75 #include "os_support.h"
76
77 #ifndef OVERRIDE_CELT_ILOG2
78 /** Integer log in base2. Undefined for zero and negative numbers */
79 static inline celt_int16_t celt_ilog2(celt_word32_t x)
80 {
81    celt_assert2(x>0, "celt_ilog2() only defined for strictly positive numbers");
82    return EC_ILOG(x)-1;
83 }
84 #endif
85
86 #ifndef OVERRIDE_CELT_MAXABS16
87 static inline celt_word16_t celt_maxabs16(celt_word16_t *x, int len)
88 {
89    int i;
90    celt_word16_t maxval = 0;
91    for (i=0;i<len;i++)
92       maxval = MAX16(maxval, ABS16(x[i]));
93    return maxval;
94 }
95 #endif
96
97 /** Integer log in base2. Defined for zero, but not for negative numbers */
98 static inline celt_int16_t celt_zlog2(celt_word32_t x)
99 {
100    return EC_ILOG(x)-1;
101 }
102
103 /** Sqrt approximation (QX input, QX/2 output) */
104 static inline celt_word32_t celt_sqrt(celt_word32_t x)
105 {
106    int k;
107    celt_word16_t n;
108    celt_word32_t rt;
109    const celt_word16_t C[5] = {23174, 11584, -3011, 1570, -557};
110    if (x==0)
111       return 0;
112    k = (celt_ilog2(x)>>1)-7;
113    x = VSHR32(x, (k<<1));
114    n = x-32768;
115    rt = ADD16(C[0], MULT16_16_Q15(n, ADD16(C[1], MULT16_16_Q15(n, ADD16(C[2], 
116               MULT16_16_Q15(n, ADD16(C[3], MULT16_16_Q15(n, (C[4])))))))));
117    rt = VSHR32(rt,7-k);
118    return rt;
119 }
120
121
122 #define L1 32767
123 #define L2 -7651
124 #define L3 8277
125 #define L4 -626
126
127 static inline celt_word16_t _celt_cos_pi_2(celt_word16_t x)
128 {
129    celt_word16_t x2;
130    
131    x2 = MULT16_16_P15(x,x);
132    return ADD16(1,MIN16(32766,ADD32(SUB16(L1,x2), MULT16_16_P15(x2, ADD32(L2, MULT16_16_P15(x2, ADD32(L3, MULT16_16_P15(L4, x2
133                                                                                 ))))))));
134 }
135
136 #undef L1
137 #undef L2
138 #undef L3
139 #undef L4
140
141 static inline celt_word16_t celt_cos_norm(celt_word32_t x)
142 {
143    x = x&0x0001ffff;
144    if (x>SHL32(EXTEND32(1), 16))
145       x = SUB32(SHL32(EXTEND32(1), 17),x);
146    if (x&0x00007fff)
147    {
148       if (x<SHL32(EXTEND32(1), 15))
149       {
150          return _celt_cos_pi_2(EXTRACT16(x));
151       } else {
152          return NEG32(_celt_cos_pi_2(EXTRACT16(65536-x)));
153       }
154    } else {
155       if (x&0x0000ffff)
156          return 0;
157       else if (x&0x0001ffff)
158          return -32767;
159       else
160          return 32767;
161    }
162 }
163
164 static inline celt_word16_t celt_log2(celt_word32_t x)
165 {
166    int i;
167    celt_word16_t n, frac;
168    /*-0.41446   0.96093  -0.33981   0.15600 */
169    const celt_word16_t C[4] = {-6791, 7872, -1392, 319};
170    if (x==0)
171       return -32767;
172    i = celt_ilog2(x);
173    n = VSHR32(x,i-15)-32768-16384;
174    frac = ADD16(C[0], MULT16_16_Q14(n, ADD16(C[1], MULT16_16_Q14(n, ADD16(C[2], MULT16_16_Q14(n, (C[3])))))));
175    /*printf ("%d %d %d %d\n", x, n, ret, SHL16(i-13,8)+SHR16(ret,14-8));*/
176    return SHL16(i-13,8)+SHR16(frac,14-8);
177 }
178
179 /*
180  K0 = 1
181  K1 = log(2)
182  K2 = 3-4*log(2)
183  K3 = 3*log(2) - 2
184 */
185 #define D0 16384
186 #define D1 11356
187 #define D2 3726
188 #define D3 1301
189 /** Base-2 exponential approximation (2^x). (Q11 input, Q16 output) */
190 static inline celt_word32_t celt_exp2(celt_word16_t x)
191 {
192    int integer;
193    celt_word16_t frac;
194    integer = SHR16(x,11);
195    if (integer>14)
196       return 0x7fffffff;
197    else if (integer < -15)
198       return 0;
199    frac = SHL16(x-SHL16(integer,11),3);
200    frac = ADD16(D0, MULT16_16_Q14(frac, ADD16(D1, MULT16_16_Q14(frac, ADD16(D2 , MULT16_16_Q14(D3,frac))))));
201    return VSHR32(EXTEND32(frac), -integer-2);
202 }
203
204 /** Reciprocal approximation (Q15 input, Q16 output) */
205 static inline celt_word32_t celt_rcp(celt_word32_t x)
206 {
207    int i, neg=0;
208    celt_word16_t n, frac;
209    const celt_word16_t C[5] = {21848, -7251, 2403, -934, 327};
210    if (x<0)
211    {
212       neg = 1;
213       x = NEG16(x);
214    }
215    i = celt_ilog2(x);
216    n = VSHR32(x,i-16)-SHL32(EXTEND32(3),15);
217    frac = ADD16(C[0], MULT16_16_Q15(n, ADD16(C[1], MULT16_16_Q15(n, ADD16(C[2], 
218                 MULT16_16_Q15(n, ADD16(C[3], MULT16_16_Q15(n, (C[4])))))))));
219    if (neg)
220       frac = -frac;
221    return VSHR32(EXTEND32(frac),i-16);
222 }
223
224 #define celt_div(a,b) MULT32_32_Q31((celt_word32_t)(a),celt_rcp(b))
225
226 #endif /* FIXED_POINT */
227
228
229 #endif /* MATHOPS_H */