Squashed commit of the following:
[opus.git] / libcelt / rate.c
index eef27ea..9763b6f 100644 (file)
@@ -75,40 +75,43 @@ void compute_pulse_cache(CELTMode *m, int LM)
    int entryN[100], entryK[100], entryI[100];
    const celt_int16 *eBands = m->eBands;
    PulseCache *cache = &m->cache;
+   celt_int16 *cindex;
+   unsigned char *bits;
 
-   cache->nbBands = m->nbEBands;
-   cache->index = celt_alloc(sizeof(cache->index[0])*cache->nbBands*(LM+2));
+   cindex = celt_alloc(sizeof(cache->index[0])*m->nbEBands*(LM+2));
+   cache->index = cindex;
 
+   /* Scan for all unique band sizes */
    for (i=0;i<=LM+1;i++)
    {
       int j;
-      for (j=0;j<cache->nbBands;j++)
+      for (j=0;j<m->nbEBands;j++)
       {
          int k;
          int N = (eBands[j+1]-eBands[j])<<i>>1;
-         cache->index[i*cache->nbBands+j] = -1;
+         cindex[i*m->nbEBands+j] = -1;
+         /* Find other bands that have the same size */
          for (k=0;k<=i;k++)
          {
             int n;
-            for (n=0;n<cache->nbBands && (k!=i || n<j);n++)
+            for (n=0;n<m->nbEBands && (k!=i || n<j);n++)
             {
                if (N == (eBands[n+1]-eBands[n])<<k>>1)
                {
-                  cache->index[i*cache->nbBands+j] =
-                        cache->index[k*cache->nbBands+n];
+                  cindex[i*m->nbEBands+j] = cindex[k*m->nbEBands+n];
                   break;
                }
             }
          }
-         if (cache->index[i*cache->nbBands+j] == -1)
+         if (cache->index[i*m->nbEBands+j] == -1 && N!=0)
          {
             int K;
             entryN[nbEntries] = N;
             K = 0;
-            while (fits_in32(N,get_pulses(K+1)) && K<MAX_PSEUDO-1)
+            while (fits_in32(N,get_pulses(K+1)) && K<MAX_PSEUDO)
                K++;
             entryK[nbEntries] = K;
-            cache->index[i*cache->nbBands+j] = curr;
+            cindex[i*m->nbEBands+j] = curr;
             entryI[nbEntries] = curr;
 
             curr += K+1;
@@ -116,12 +119,15 @@ void compute_pulse_cache(CELTMode *m, int LM)
          }
       }
    }
-   cache->bits = celt_alloc(sizeof(unsigned char)*curr);
+   bits = celt_alloc(sizeof(unsigned char)*curr);
+   cache->bits = bits;
+   cache->size = curr;
+   /* Compute the cache for all unique sizes */
    for (i=0;i<nbEntries;i++)
    {
       int j;
-      unsigned char *ptr = cache->bits+entryI[i];
-      celt_int16 tmp[MAX_PULSES];
+      unsigned char *ptr = bits+entryI[i];
+      celt_int16 tmp[MAX_PULSES+1];
       get_required_bits(tmp, entryN[i], get_pulses(entryK[i]), BITRES);
       for (j=1;j<=entryK[i];j++)
          ptr[j] = tmp[get_pulses(j)]-1;
@@ -132,25 +138,39 @@ void compute_pulse_cache(CELTMode *m, int LM)
 #endif /* !STATIC_MODES */
 
 
+#define ALLOC_STEPS 6
 
-static inline void interp_bits2pulses(const CELTMode *m, int start, int end, int *bits1, int *bits2, int total, int *bits, int *ebits, int *fine_priority, int len, int _C, int M)
+static inline int interp_bits2pulses(const CELTMode *m, int start, int end, int *bits1, int *bits2, int total, int *bits, int *ebits, int *fine_priority, int len, int _C, int LM)
 {
    int psum;
    int lo, hi;
-   int j;
+   int i, j;
    int logM;
    const int C = CHANNELS(_C);
+   int codedBands=-1;
+   VARDECL(int, thresh);
    SAVE_STACK;
 
-   logM = log2_frac(M, BITRES);
+   ALLOC(thresh, len, int);
+
+   /* Threshold: don't allow any band to go below 3/8 bit/sample */
+   for (j=start;j<end;j++)
+      thresh[j] = 3*(C*(m->eBands[j+1]-m->eBands[j])<<LM<<BITRES)>>3;
+   logM = LM<<BITRES;
    lo = 0;
-   hi = 1<<BITRES;
-   while (hi-lo != 1)
+   hi = 1<<ALLOC_STEPS;
+   for (i=0;i<ALLOC_STEPS;i++)
    {
       int mid = (lo+hi)>>1;
       psum = 0;
       for (j=start;j<end;j++)
-         psum += (((1<<BITRES)-mid)*bits1[j] + mid*bits2[j])>>BITRES;
+      {
+         int tmp = bits1[j] + (mid*bits2[j]>>ALLOC_STEPS);
+         if (tmp >= thresh[j])
+            psum += tmp;
+         else if (tmp >= 1<<BITRES)
+            psum += 1<<BITRES;
+      }
       if (psum > (total<<BITRES))
          hi = mid;
       else
@@ -160,17 +180,26 @@ static inline void interp_bits2pulses(const CELTMode *m, int start, int end, int
    /*printf ("interp bisection gave %d\n", lo);*/
    for (j=start;j<end;j++)
    {
-      bits[j] = (((1<<BITRES)-lo)*bits1[j] + lo*bits2[j])>>BITRES;
+      int tmp = bits1[j] + (lo*bits2[j]>>ALLOC_STEPS);
+      if (tmp >= thresh[j])
+      {
+         bits[j] = tmp;
+         codedBands = j;
+      } else if (tmp >= 1<<BITRES)
+         bits[j] = 1<<BITRES;
+      else
+         bits[j] = 0;
       psum += bits[j];
    }
+   codedBands++;
    /* Allocate the remaining bits */
-   {
+   if (codedBands) {
       int left, perband;
       left = (total<<BITRES)-psum;
-      perband = left/(end-start);
-      for (j=start;j<end;j++)
+      perband = left/(codedBands-start);
+      for (j=start;j<codedBands;j++)
          bits[j] += perband;
-      left = left-end*perband;
+      left = left-codedBands*perband;
       for (j=start;j<start+left;j++)
          bits[j]++;
    }
@@ -178,26 +207,30 @@ static inline void interp_bits2pulses(const CELTMode *m, int start, int end, int
    {
       int N0, N, den;
       int offset;
-      int fine_offset;
+      int NClogN;
+
       N0 = m->eBands[j+1]-m->eBands[j];
-      N=M*N0;
+      N=N0<<LM;
+      NClogN = N*C*(m->logN[j] + logM);
+
       /* Compensate for the extra DoF in stereo */
       den=(C*N+ ((C==2 && N>2) ? 1 : 0));
 
-      if (N0==1)
-         fine_offset = 19;
-      else if (N0<=4)
-         fine_offset = 14;
-      else
-         fine_offset = 12;
+      /* Offset for the number of fine bits by log2(N)/2 + FINE_OFFSET
+         compared to their "fair share" of total/N */
+      offset = (NClogN>>1)-N*C*FINE_OFFSET;
 
-      /* Offset for the number of fine bits compared to their "fair share" of total/N */
-      offset = N*C*((m->logN[j] + logM - 2*fine_offset)>>1);
+      /* N=2 is the only point that doesn't match the curve */
+      if (N==2)
+         offset += N*C<<BITRES>>2;
 
-      /* Compensate for the prediction gain in stereo */
-      if (C==2)
-         offset -= 1<<BITRES;
+      /* Changing the offset for allocating the second and third fine energy bit */
+      if (bits[j] + offset < den*2<<BITRES)
+         offset += NClogN>>2;
+      else if (bits[j] + offset < den*3<<BITRES)
+         offset += NClogN>>3;
 
+      /* Divide with rounding */
       ebits[j] = (bits[j] + offset + (den<<(BITRES-1))) / (den<<BITRES);
 
       /* If we rounded down, make it a candidate for final fine energy pass */
@@ -214,30 +247,44 @@ static inline void interp_bits2pulses(const CELTMode *m, int start, int end, int
       if (C*ebits[j] > (bits[j]>>BITRES))
          ebits[j] = bits[j]/C >> BITRES;
 
+      /* More than that is useless because that's about as far as PVQ can go */
       if (ebits[j]>7)
          ebits[j]=7;
-      if (ebits[j]<0)
-         ebits[j]=0;
 
-      /* The bits used for fine allocation can't be used for pulses */
+      /* The other bits are assigned to PVQ */
       bits[j] -= C*ebits[j]<<BITRES;
       if (bits[j] < 0)
          bits[j] = 0;
    }
    RESTORE_STACK;
+   return codedBands;
 }
 
-void compute_allocation(const CELTMode *m, int start, int end, int *offsets, int total, int *pulses, int *ebits, int *fine_priority, int _C, int M)
+int compute_allocation(const CELTMode *m, int start, int end, int *offsets, int alloc_trim,
+      int total, int *pulses, int *ebits, int *fine_priority, int _C, int LM)
 {
    int lo, hi, len, j;
    const int C = CHANNELS(_C);
+   int codedBands;
    VARDECL(int, bits1);
    VARDECL(int, bits2);
+   VARDECL(int, thresh);
+   VARDECL(int, trim_offset);
    SAVE_STACK;
    
    len = m->nbEBands;
    ALLOC(bits1, len, int);
    ALLOC(bits2, len, int);
+   ALLOC(thresh, len, int);
+   ALLOC(trim_offset, len, int);
+
+   /* Below this threshold, we don't allocate any PVQ bits */
+   for (j=start;j<end;j++)
+      thresh[j] = 3*(C*(m->eBands[j+1]-m->eBands[j])<<LM<<BITRES)>>3;
+   /* Tilt of the allocation curve */
+   for (j=start;j<end;j++)
+      trim_offset[j] = C*(m->eBands[j+1]-m->eBands[j])*(2*alloc_trim-7)*(m->nbEBands-j-1)
+            <<(LM+BITRES)>>6;
 
    lo = 0;
    hi = m->nbAllocVectors - 1;
@@ -248,10 +295,17 @@ void compute_allocation(const CELTMode *m, int start, int end, int *offsets, int
       for (j=start;j<end;j++)
       {
          int N = m->eBands[j+1]-m->eBands[j];
-         bits1[j] = (C*M*N*m->allocVectors[mid*len+j] + offsets[j]);
+         bits1[j] = C*N*m->allocVectors[mid*len+j]<<LM>>2;
+         if (bits1[j] > 0)
+            bits1[j] += trim_offset[j];
          if (bits1[j] < 0)
             bits1[j] = 0;
-         psum += bits1[j];
+         bits1[j] += offsets[j];
+         if (bits1[j] >= thresh[j])
+            psum += bits1[j];
+         else if (bits1[j] >= 1<<BITRES)
+            psum += 1<<BITRES;
+
          /*printf ("%d ", bits[j]);*/
       }
       /*printf ("\n");*/
@@ -265,14 +319,16 @@ void compute_allocation(const CELTMode *m, int start, int end, int *offsets, int
    for (j=start;j<end;j++)
    {
       int N = m->eBands[j+1]-m->eBands[j];
-      bits1[j] = C*M*N*m->allocVectors[lo*len+j] + offsets[j];
-      bits2[j] = C*M*N*m->allocVectors[hi*len+j] + offsets[j];
+      bits1[j] = (C*N*m->allocVectors[lo*len+j]<<LM>>2);
+      bits2[j] = (C*N*m->allocVectors[hi*len+j]<<LM>>2) - bits1[j];
+      if (bits1[j] > 0)
+         bits1[j] += trim_offset[j];
       if (bits1[j] < 0)
          bits1[j] = 0;
-      if (bits2[j] < 0)
-         bits2[j] = 0;
+      bits1[j] += offsets[j];
    }
-   interp_bits2pulses(m, start, end, bits1, bits2, total, pulses, ebits, fine_priority, len, C, M);
+   codedBands = interp_bits2pulses(m, start, end, bits1, bits2, total, pulses, ebits, fine_priority, len, C, LM);
    RESTORE_STACK;
+   return codedBands;
 }