Simplifications to the new allocator
[opus.git] / libcelt / rate.c
1 /* (C) 2007-2008 Jean-Marc Valin, CSIRO
2 */
3 /*
4    Redistribution and use in source and binary forms, with or without
5    modification, are permitted provided that the following conditions
6    are met:
7    
8    - Redistributions of source code must retain the above copyright
9    notice, this list of conditions and the following disclaimer.
10    
11    - Redistributions in binary form must reproduce the above copyright
12    notice, this list of conditions and the following disclaimer in the
13    documentation and/or other materials provided with the distribution.
14    
15    - Neither the name of the Xiph.org Foundation nor the names of its
16    contributors may be used to endorse or promote products derived from
17    this software without specific prior written permission.
18    
19    THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
20    ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
21    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
22    A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
23    CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
24    EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
25    PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
26    PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
27    LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
28    NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
29    SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
30 */
31
32 #ifdef HAVE_CONFIG_H
33 #include "config.h"
34 #endif
35
36 #include <math.h>
37 #include "modes.h"
38 #include "cwrs.h"
39 #include "arch.h"
40 #include "os_support.h"
41
42 #include "entcode.h"
43 #include "rate.h"
44
45 #define BITRES 4
46 #define BITROUND 8
47 #define BITOVERFLOW 30000
48
49 #ifndef STATIC_MODES
50
51 celt_int16_t **compute_alloc_cache(CELTMode *m, int C)
52 {
53    int i, prevN;
54    celt_int16_t **bits;
55    const celt_int16_t *eBands = m->eBands;
56
57    bits = celt_alloc(m->nbEBands*sizeof(celt_int16_t*));
58    
59    prevN = -1;
60    for (i=0;i<m->nbEBands;i++)
61    {
62       int N = C*(eBands[i+1]-eBands[i]);
63       if (N == prevN && eBands[i] < m->pitchEnd)
64       {
65          bits[i] = bits[i-1];
66       } else {
67          int j;
68          /* FIXME: We could save memory here */
69          bits[i] = celt_alloc(MAX_PULSES*sizeof(celt_int16_t));
70          for (j=0;j<MAX_PULSES;j++)
71          {
72             int pulses = j;
73             /* For bands where there's no pitch, id 1 corresponds to intra prediction 
74             with no pulse. id 2 means intra prediction with one pulse, and so on.*/
75             if (eBands[i] >= m->pitchEnd)
76                pulses -= 1;
77             if (pulses < 0)
78                bits[i][j] = 0;
79             else {
80                bits[i][j] = get_required_bits(N, pulses, BITRES);
81                /* Add the intra-frame prediction sign bit */
82                if (eBands[i] >= m->pitchEnd)
83                   bits[i][j] += (1<<BITRES);
84             }
85          }
86          for (;j<MAX_PULSES;j++)
87             bits[i][j] = BITOVERFLOW;
88          prevN = N;
89       }
90    }
91    return bits;
92 }
93
94 #endif /* !STATIC_MODES */
95
96 static inline int bits2pulses(const CELTMode *m, const celt_int16_t *cache, int bits)
97 {
98    int i;
99    int lo, hi;
100    lo = 0;
101    hi = MAX_PULSES-1;
102    
103    /* Instead of using the "bisection condition" we use a fixed number of 
104       iterations because it should be faster */
105    /*while (hi-lo != 1)*/
106    for (i=0;i<LOG_MAX_PULSES;i++)
107    {
108       int mid = (lo+hi)>>1;
109       /* OPT: Make sure this is implemented with a conditional move */
110       if (cache[mid] >= bits)
111          hi = mid;
112       else
113          lo = mid;
114    }
115    if (bits-cache[lo] <= cache[hi]-bits)
116       return lo;
117    else
118       return hi;
119 }
120
121 static int interp_bits2pulses(const CELTMode *m, const celt_int16_t * const *cache, int *bits1, int *bits2, int *ebits1, int *ebits2, int total, int *pulses, int *bits, int *ebits, int len)
122 {
123    int esum, psum;
124    int lo, hi;
125    int j;
126    const int C = CHANNELS(m);
127    SAVE_STACK;
128    lo = 0;
129    hi = 1<<BITRES;
130    while (hi-lo != 1)
131    {
132       int mid = (lo+hi)>>1;
133       psum = 0;
134       esum = 0;
135       for (j=0;j<len;j++)
136       {
137          esum += (((1<<BITRES)-mid)*ebits1[j] + mid*ebits2[j] + (1<<(BITRES-1)))>>BITRES;
138          psum += ((1<<BITRES)-mid)*bits1[j] + mid*bits2[j];
139       }
140       if (psum > (total-C*esum)<<BITRES)
141          hi = mid;
142       else
143          lo = mid;
144    }
145    esum = 0;
146    psum = 0;
147    /*printf ("interp bisection gave %d\n", lo);*/
148    for (j=0;j<len;j++)
149    {
150       ebits[j] = (((1<<BITRES)-lo)*ebits1[j] + lo*ebits2[j] + (1<<(BITRES-1)))>>BITRES;
151       esum += ebits[j];
152    }
153    for (j=0;j<len;j++)
154    {
155       bits[j] = ((1<<BITRES)-lo)*bits1[j] + lo*bits2[j];
156       psum += bits[j];
157    }
158    /* Allocate the remaining bits */
159    {
160       int left, perband;
161       left = ((total-C*esum)<<BITRES)-psum;
162       perband = left/len;
163       for (j=0;j<len;j++)
164          bits[j] += perband;
165       left = left-len*perband;
166       for (j=0;j<left;j++)
167          bits[j]++;
168    }
169    return (total-C*esum)<<BITRES;
170    RESTORE_STACK;
171 }
172
173 void compute_allocation(const CELTMode *m, int *offsets, const int *stereo_mode, int total, int *pulses, int *ebits)
174 {
175    int lo, hi, len, i, j;
176    int remaining_bits;
177    VARDECL(int, bits);
178    VARDECL(int, bits1);
179    VARDECL(int, bits2);
180    VARDECL(int, ebits1);
181    VARDECL(int, ebits2);
182    VARDECL(const celt_int16_t*, cache);
183    const int C = CHANNELS(m);
184    SAVE_STACK;
185    
186    len = m->nbEBands;
187    ALLOC(bits, len, int);
188    ALLOC(bits1, len, int);
189    ALLOC(bits2, len, int);
190    ALLOC(ebits1, len, int);
191    ALLOC(ebits2, len, int);
192    ALLOC(cache, len, const celt_int16_t*);
193    
194    if (m->nbChannels==2)
195    {
196       for (i=0;i<len;i++)
197       {
198          if (stereo_mode[i]==0)
199             cache[i] = m->bits_stereo[i];
200          else
201             cache[i] = m->bits[i];
202       }
203    } else {
204       for (i=0;i<len;i++)
205          cache[i] = m->bits[i];
206    }
207    
208    lo = 0;
209    hi = m->nbAllocVectors - 1;
210    while (hi-lo != 1)
211    {
212       int psum = 0;
213       int mid = (lo+hi) >> 1;
214       for (j=0;j<len;j++)
215       {
216          bits1[j] = (m->allocVectors[mid*len+j] + offsets[j])<<BITRES;
217          if (bits1[j] < 0)
218             bits1[j] = 0;
219          psum += bits1[j];
220          /*printf ("%d ", bits[j]);*/
221       }
222       /*printf ("\n");*/
223       if (psum > (total-C*m->energy_alloc[mid*(len+1)+len])<<BITRES)
224          hi = mid;
225       else
226          lo = mid;
227       /*printf ("lo = %d, hi = %d\n", lo, hi);*/
228    }
229    /*printf ("interp between %d and %d\n", lo, hi);*/
230    for (j=0;j<len;j++)
231    {
232       ebits1[j] = m->energy_alloc[lo*(len+1)+j];
233       ebits2[j] = m->energy_alloc[hi*(len+1)+j];
234       bits1[j] = m->allocVectors[lo*len+j] + offsets[j];
235       bits2[j] = m->allocVectors[hi*len+j] + offsets[j];
236       if (bits1[j] < 0)
237          bits1[j] = 0;
238       if (bits2[j] < 0)
239          bits2[j] = 0;
240    }
241    remaining_bits = interp_bits2pulses(m, cache, bits1, bits2, ebits1, ebits2, total, pulses, bits, ebits, len);
242    {
243       int balance = 0;
244       for (i=0;i<len;i++)
245       {
246          int P, curr_balance, curr_bits;
247          curr_balance = (len-i);
248          if (curr_balance > 3)
249                curr_balance = 3;
250          curr_balance = balance / curr_balance;
251          P = bits2pulses(m, cache[i], bits[i]+curr_balance);
252          curr_bits = cache[i][P];
253          remaining_bits -= curr_bits;
254          if (remaining_bits < 0)
255          {
256             P--;
257             remaining_bits -= curr_bits;
258             curr_bits = cache[i][P];
259             remaining_bits += curr_bits;
260          }
261          balance += bits[i] - curr_bits;
262          pulses[i] = P;
263       }
264    }
265    RESTORE_STACK;
266 }
267