Simplified allocation by doing it one band at a time, with memory
[opus.git] / libcelt / rate.c
1 /* (C) 2007-2008 Jean-Marc Valin, CSIRO
2 */
3 /*
4    Redistribution and use in source and binary forms, with or without
5    modification, are permitted provided that the following conditions
6    are met:
7    
8    - Redistributions of source code must retain the above copyright
9    notice, this list of conditions and the following disclaimer.
10    
11    - Redistributions in binary form must reproduce the above copyright
12    notice, this list of conditions and the following disclaimer in the
13    documentation and/or other materials provided with the distribution.
14    
15    - Neither the name of the Xiph.org Foundation nor the names of its
16    contributors may be used to endorse or promote products derived from
17    this software without specific prior written permission.
18    
19    THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
20    ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
21    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
22    A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
23    CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
24    EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
25    PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
26    PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
27    LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
28    NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
29    SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
30 */
31
32 #ifdef HAVE_CONFIG_H
33 #include "config.h"
34 #endif
35
36 #include <math.h>
37 #include "modes.h"
38 #include "cwrs.h"
39 #include "arch.h"
40 #include "os_support.h"
41
42 #include "entcode.h"
43 #include "rate.h"
44
45 #define BITRES 4
46 #define BITROUND 8
47 #define BITOVERFLOW 30000
48
49 #ifndef STATIC_MODES
50
51 celt_int16_t **compute_alloc_cache(CELTMode *m, int C)
52 {
53    int i, prevN;
54    celt_int16_t **bits;
55    const celt_int16_t *eBands = m->eBands;
56
57    bits = celt_alloc(m->nbEBands*sizeof(celt_int16_t*));
58    
59    prevN = -1;
60    for (i=0;i<m->nbEBands;i++)
61    {
62       int N = C*(eBands[i+1]-eBands[i]);
63       if (N == prevN && eBands[i] < m->pitchEnd)
64       {
65          bits[i] = bits[i-1];
66       } else {
67          int j;
68          /* FIXME: We could save memory here */
69          bits[i] = celt_alloc(MAX_PULSES*sizeof(celt_int16_t));
70          for (j=0;j<MAX_PULSES;j++)
71          {
72             int pulses = j;
73             /* For bands where there's no pitch, id 1 corresponds to intra prediction 
74             with no pulse. id 2 means intra prediction with one pulse, and so on.*/
75             if (eBands[i] >= m->pitchEnd)
76                pulses -= 1;
77             if (pulses < 0)
78                bits[i][j] = 0;
79             else {
80                bits[i][j] = get_required_bits(N, pulses, BITRES);
81                /* Add the intra-frame prediction sign bit */
82                if (eBands[i] >= m->pitchEnd)
83                   bits[i][j] += (1<<BITRES);
84             }
85          }
86          for (;j<MAX_PULSES;j++)
87             bits[i][j] = BITOVERFLOW;
88          prevN = N;
89       }
90    }
91    return bits;
92 }
93
94 #endif /* !STATIC_MODES */
95
96 static inline int bits2pulses(const CELTMode *m, const celt_int16_t *cache, int bits)
97 {
98    int i;
99    int lo, hi;
100    lo = 0;
101    hi = MAX_PULSES-1;
102    
103    /* Instead of using the "bisection condition" we use a fixed number of 
104       iterations because it should be faster */
105    /*while (hi-lo != 1)*/
106    for (i=0;i<LOG_MAX_PULSES;i++)
107    {
108       int mid = (lo+hi)>>1;
109       /* OPT: Make sure this is implemented with a conditional move */
110       if (cache[mid] >= bits)
111          hi = mid;
112       else
113          lo = mid;
114    }
115    if (bits-cache[lo] <= cache[hi]-bits)
116       return lo;
117    else
118       return hi;
119 }
120
121 static int vec_bits2pulses(const CELTMode *m, const celt_int16_t * const *cache, int *bits, int *pulses, int len)
122 {
123    int i;
124    int sum=0;
125
126    for (i=0;i<len;i++)
127    {
128       sum += bits[i];
129    }
130    /*printf ("sum = %d\n", sum);*/
131    return sum;
132 }
133
134 static int interp_bits2pulses(const CELTMode *m, const celt_int16_t * const *cache, int *bits1, int *bits2, int *ebits1, int *ebits2, int total, int *pulses, int *bits, int *ebits, int len)
135 {
136    int esum, psum;
137    int lo, hi, out;
138    int j;
139    const int C = CHANNELS(m);
140    SAVE_STACK;
141    lo = 0;
142    hi = 1<<BITRES;
143    while (hi-lo != 1)
144    {
145       int mid = (lo+hi)>>1;
146       psum = 0;
147       esum = 0;
148       for (j=0;j<len;j++)
149       {
150          esum += (((1<<BITRES)-mid)*ebits1[j] + mid*ebits2[j] + (1<<(BITRES-1)))>>BITRES;
151          psum += ((1<<BITRES)-mid)*bits1[j] + mid*bits2[j];
152       }
153       if (psum > (total-C*esum)<<BITRES)
154          hi = mid;
155       else
156          lo = mid;
157    }
158    esum = 0;
159    psum = 0;
160    /*printf ("interp bisection gave %d\n", lo);*/
161    for (j=0;j<len;j++)
162    {
163       ebits[j] = (((1<<BITRES)-lo)*ebits1[j] + lo*ebits2[j] + (1<<(BITRES-1)))>>BITRES;
164       esum += ebits[j];
165    }
166    for (j=0;j<len;j++)
167    {
168       bits[j] = ((1<<BITRES)-lo)*bits1[j] + lo*bits2[j];
169       psum += bits[j];
170    }
171    out = psum;
172    /*printf ("left to allocate: %d\n", total-C*esum-(out>>BITRES));*/
173    RESTORE_STACK;
174    return (out+BITROUND) >> BITRES;
175 }
176
177 int compute_allocation(const CELTMode *m, int *offsets, const int *stereo_mode, int total, int *pulses, int *ebits)
178 {
179    int lo, hi, len, ret, i;
180    VARDECL(int, bits);
181    VARDECL(int, bits1);
182    VARDECL(int, bits2);
183    VARDECL(int, ebits1);
184    VARDECL(int, ebits2);
185    VARDECL(const celt_int16_t*, cache);
186    const int C = CHANNELS(m);
187    SAVE_STACK;
188    
189    len = m->nbEBands;
190    ALLOC(bits, len, int);
191    ALLOC(bits1, len, int);
192    ALLOC(bits2, len, int);
193    ALLOC(ebits1, len, int);
194    ALLOC(ebits2, len, int);
195    ALLOC(cache, len, const celt_int16_t*);
196    
197    if (m->nbChannels==2)
198    {
199       for (i=0;i<len;i++)
200       {
201          if (stereo_mode[i]==0)
202             cache[i] = m->bits_stereo[i];
203          else
204             cache[i] = m->bits[i];
205       }
206    } else {
207       for (i=0;i<len;i++)
208          cache[i] = m->bits[i];
209    }
210    
211    lo = 0;
212    hi = m->nbAllocVectors - 1;
213    while (hi-lo != 1)
214    {
215       int psum = 0;
216       int j;
217       int mid = (lo+hi) >> 1;
218       for (j=0;j<len;j++)
219       {
220          bits1[j] = (m->allocVectors[mid*len+j] + offsets[j])<<BITRES;
221          if (bits1[j] < 0)
222             bits1[j] = 0;
223          psum += bits1[j];
224          /*printf ("%d ", bits[j]);*/
225       }
226       /*printf ("\n");*/
227       if (psum > (total-C*m->energy_alloc[mid*(len+1)+len])<<BITRES)
228          hi = mid;
229       else
230          lo = mid;
231       /*printf ("lo = %d, hi = %d\n", lo, hi);*/
232    }
233    /*printf ("interp between %d and %d\n", lo, hi);*/
234    {
235       int j;
236       for (j=0;j<len;j++)
237       {
238          ebits1[j] = m->energy_alloc[lo*(len+1)+j];
239          ebits2[j] = m->energy_alloc[hi*(len+1)+j];
240          bits1[j] = m->allocVectors[lo*len+j] + offsets[j];
241          bits2[j] = m->allocVectors[hi*len+j] + offsets[j];
242          if (bits1[j] < 0)
243             bits1[j] = 0;
244          if (bits2[j] < 0)
245             bits2[j] = 0;
246       }
247       ret = interp_bits2pulses(m, cache, bits1, bits2, ebits1, ebits2, total, pulses, bits, ebits, len);
248    }
249    {
250       int balance = 0;
251       for (i=0;i<len;i++)
252       {
253          int P, curr_balance;
254          curr_balance = (len-i);
255          if (curr_balance > 3)
256                curr_balance = 3;
257          curr_balance = balance / curr_balance;
258          //balance -= curr_balance;
259          P = bits2pulses(m, cache[i], bits[i]+curr_balance);
260          balance += bits[i] - cache[i][P];
261          pulses[i] = P;
262          //printf ("(%d %d) ", bits[i], cache[i][outBits]);
263       }
264       if (balance < 0)
265       {
266          for (i=len-1;i>=0;i--)
267          {
268             if (pulses[i])
269             {
270                pulses[i]--;
271                break;
272             }
273          }
274       }
275       
276       //printf ("\n");
277    }
278    RESTORE_STACK;
279    return ret;
280 }
281