fixed-point: got stereo to work again by fixing renormalise_bands()
[opus.git] / libcelt / rate.c
1 /* (C) 2007 Jean-Marc Valin, CSIRO
2 */
3 /*
4    Redistribution and use in source and binary forms, with or without
5    modification, are permitted provided that the following conditions
6    are met:
7    
8    - Redistributions of source code must retain the above copyright
9    notice, this list of conditions and the following disclaimer.
10    
11    - Redistributions in binary form must reproduce the above copyright
12    notice, this list of conditions and the following disclaimer in the
13    documentation and/or other materials provided with the distribution.
14    
15    - Neither the name of the Xiph.org Foundation nor the names of its
16    contributors may be used to endorse or promote products derived from
17    this software without specific prior written permission.
18    
19    THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
20    ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
21    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
22    A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
23    CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
24    EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
25    PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
26    PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
27    LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
28    NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
29    SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
30 */
31
32 #ifdef HAVE_CONFIG_H
33 #include "config.h"
34 #endif
35
36 #include <math.h>
37 #include "modes.h"
38 #include "cwrs.h"
39 #include "arch.h"
40 #include "os_support.h"
41
42 #include "entcode.h"
43 #include "rate.h"
44
45 #define BITRES 4
46 #define BITROUND 8
47 #define BITOVERFLOW 10000
48
49 #define MAX_PULSES 64
50
51 static int log2_frac(ec_uint32 val, int frac)
52 {
53    int i;
54    /* EC_ILOG() actually returns log2()+1, go figure */
55    int L = EC_ILOG(val)-1;
56    /*printf ("in: %d %d ", val, L);*/
57    if (L>14)
58       val >>= L-14;
59    else if (L<14)
60       val <<= 14-L;
61    L <<= frac;
62    /*printf ("%d\n", val);*/
63    for (i=0;i<frac;i++)
64    {
65       val = (val*val) >> 15;
66       /*printf ("%d\n", val);*/
67       if (val > 16384)
68          L |= (1<<(frac-i-1));
69       else   
70          val <<= 1;
71    }
72    return L;
73 }
74
75 static int log2_frac64(ec_uint64 val, int frac)
76 {
77    int i;
78    /* EC_ILOG64() actually returns log2()+1, go figure */
79    int L = EC_ILOG64(val)-1;
80    /*printf ("in: %d %d ", val, L);*/
81    if (L>14)
82       val >>= L-14;
83    else if (L<14)
84       val <<= 14-L;
85    L <<= frac;
86    /*printf ("%d\n", val);*/
87    for (i=0;i<frac;i++)
88    {
89       val = (val*val) >> 15;
90       /*printf ("%d\n", val);*/
91       if (val > 16384)
92          L |= (1<<(frac-i-1));
93       else   
94          val <<= 1;
95    }
96    return L;
97 }
98
99 void compute_alloc_cache(CELTMode *m)
100 {
101    int i, prevN, BC;
102    int **bits;
103    const int *eBands = m->eBands;
104
105    bits = celt_alloc(m->nbEBands*sizeof(int*));
106    
107    BC = m->nbMdctBlocks*m->nbChannels;
108    prevN = -1;
109    for (i=0;i<m->nbEBands;i++)
110    {
111       int N = BC*(eBands[i+1]-eBands[i]);
112       if (N == prevN && eBands[i] < m->pitchEnd)
113       {
114          bits[i] = bits[i-1];
115       } else {
116          int j;
117          /* FIXME: We could save memory here */
118          bits[i] = celt_alloc(MAX_PULSES*sizeof(int));
119          for (j=0;j<MAX_PULSES;j++)
120          {
121             int done = 0;
122             int pulses = j;
123             /* For bands where there's no pitch, id 1 corresponds to intra prediction 
124             with no pulse. id 2 means intra prediction with one pulse, and so on.*/
125             if (eBands[i] >= m->pitchEnd)
126                pulses -= 1;
127             if (pulses < 0)
128                bits[i][j] = 0;
129             else {
130                bits[i][j] = log2_frac64(ncwrs64(N, pulses),BITRES);
131                /* FIXME: Could there be a better test for the max number of pulses that fit in 64 bits? */
132                if (bits[i][j] > (60<<BITRES))
133                   done = 1;
134                /* Add the intra-frame prediction bits */
135                if (eBands[i] >= m->pitchEnd)
136                {
137                   int max_pos = 2*eBands[i]-eBands[i+1];
138                   if (max_pos > 32)
139                      max_pos = 32;
140                   bits[i][j] += (1<<BITRES) + log2_frac(max_pos,BITRES);
141                }
142             }
143             if (done)
144                break;
145          }
146          for (;j<MAX_PULSES;j++)
147             bits[i][j] = BITOVERFLOW;
148          prevN = N;
149       }
150    }
151    m->bits = (const int * const *)bits;
152 }
153
154
155 int bits2pulses(const CELTMode *m, int band, int bits)
156 {
157    int lo, hi;
158    lo = 0;
159    hi = MAX_PULSES-1;
160    
161    while (hi-lo != 1)
162    {
163       int mid = (lo+hi)>>1;
164       if (m->bits[band][mid] >= bits)
165          hi = mid;
166       else
167          lo = mid;
168    }
169    if (bits-m->bits[band][lo] <= m->bits[band][hi]-bits)
170       return lo;
171    else
172       return hi;
173 }
174
175 int vec_bits2pulses(const CELTMode *m, const int *bands, int *bits, int *pulses, int len)
176 {
177    int i;
178    int sum=0;
179
180    for (i=0;i<len;i++)
181    {
182       pulses[i] = bits2pulses(m, i, bits[i]);
183       sum += m->bits[i][pulses[i]];
184    }
185    /*printf ("sum = %d\n", sum);*/
186    return sum;
187 }
188
189 int interp_bits2pulses(const CELTMode *m, int *bits1, int *bits2, int total, int *pulses, int len)
190 {
191    int lo, hi, out;
192    int j;
193    int firstpass;
194    VARDECL(int *bits);
195    const int *bands = m->eBands;
196    ALLOC(bits, len, int);
197    lo = 0;
198    hi = 1<<BITRES;
199    while (hi-lo != 1)
200    {
201       int mid = (lo+hi)>>1;
202       for (j=0;j<len;j++)
203          bits[j] = ((1<<BITRES)-mid)*bits1[j] + mid*bits2[j];
204       if (vec_bits2pulses(m, bands, bits, pulses, len) > total<<BITRES)
205          hi = mid;
206       else
207          lo = mid;
208    }
209    /*printf ("interp bisection gave %d\n", lo);*/
210    for (j=0;j<len;j++)
211       bits[j] = ((1<<BITRES)-lo)*bits1[j] + lo*bits2[j];
212    out = vec_bits2pulses(m, bands, bits, pulses, len);
213    /* Do some refinement to use up all bits. In the first pass, we can only add pulses to 
214       bands that are under their allocated budget. In the second pass, anything goes */
215    firstpass = 1;
216    while(1)
217    {
218       int incremented = 0;
219       for (j=0;j<len;j++)
220       {
221          if ((!firstpass || m->bits[j][pulses[j]] < bits[j]) && pulses[j]<MAX_PULSES-1)
222          {
223             if (out+m->bits[j][pulses[j]+1]-m->bits[j][pulses[j]] <= total<<BITRES)
224             {
225                out = out+m->bits[j][pulses[j]+1]-m->bits[j][pulses[j]];
226                pulses[j] += 1;
227                incremented = 1;
228             }
229          }
230       }
231       if (!incremented)
232       {
233          if (firstpass)
234             firstpass = 0;
235          else
236             break;
237       }
238    }
239    return (out+BITROUND) >> BITRES;
240 }
241
242 int compute_allocation(const CELTMode *m, int *offsets, int total, int *pulses)
243 {
244    int lo, hi, len;
245    VARDECL(int *bits1);
246    VARDECL(int *bits2);
247    
248    len = m->nbEBands;
249    ALLOC(bits1, len, int);
250    ALLOC(bits2, len, int);
251    lo = 0;
252    hi = m->nbAllocVectors - 1;
253    while (hi-lo != 1)
254    {
255       int j;
256       int mid = (lo+hi) >> 1;
257       for (j=0;j<len;j++)
258       {
259          bits1[j] = (m->allocVectors[mid*len+j] + offsets[j])<<BITRES;
260          if (bits1[j] < 0)
261             bits1[j] = 0;
262          /*printf ("%d ", bits[j]);*/
263       }
264       /*printf ("\n");*/
265       if (vec_bits2pulses(m, m->eBands, bits1, pulses, len) > total<<BITRES)
266          hi = mid;
267       else
268          lo = mid;
269       /*printf ("lo = %d, hi = %d\n", lo, hi);*/
270    }
271    {
272       int j;
273       for (j=0;j<len;j++)
274       {
275          bits1[j] = m->allocVectors[lo*len+j] + offsets[j];
276          bits2[j] = m->allocVectors[hi*len+j] + offsets[j];
277          if (bits1[j] < 0)
278             bits1[j] = 0;
279          if (bits2[j] < 0)
280             bits2[j] = 0;
281       }
282       return interp_bits2pulses(m, bits1, bits2, total, pulses, len);
283    }
284 }
285