Completed the separation of coarse and fine energy quantisation
[opus.git] / libcelt / quant_bands.c
index d3c4c53..ff9a91b 100644 (file)
@@ -39,6 +39,7 @@
 #include "os_support.h"
 #include "arch.h"
 #include "mathops.h"
+#include "stack_alloc.h"
 
 #ifdef FIXED_POINT
 const celt_word16_t eMeans[24] = {11520, -2048, -3072, -640, 256, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0};
@@ -47,7 +48,47 @@ const celt_word16_t eMeans[24] = {45.f, -8.f, -12.f, -2.5f, 1.f, 0.f, 0.f, 0.f,
 #endif
 
 /*const int frac[24] = {4, 3, 3, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2};*/
-const int frac[24] = {8, 6, 5, 4, 3, 3, 3, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2};
+/*const int frac[24] = {8, 6, 5, 4, 3, 3, 3, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2};*/
+
+void compute_fine_allocation(const CELTMode *m, celt_int16_t *bits, int budget)
+{
+   int i,j;
+   int len;
+   len = m->nbEBands;
+   for (i=0;i<m->nbAllocVectors;i++)
+   {
+      if (m->energy_alloc[i*(len+1)+len] > budget)
+         break;
+   }
+   if (i==0)
+   {
+      for (j=0;j<len;j++)
+         bits[j] = 0;
+   } else {
+      for (j=0;j<len;j++)
+         bits[j] = m->energy_alloc[(i-1)*(len+1)+j];
+      budget -= m->energy_alloc[(i-1)*(len+1)+len];
+   }
+   if (i<m->nbAllocVectors)
+   {
+      j=0;
+      while (budget>0)
+      {
+         if (m->energy_alloc[i*(len+1)+j]>bits[j])
+         {
+            bits[j]++;
+            budget--;
+         }
+         j++;
+         if (j>=len)
+            j=0;
+      }
+   }
+   
+   /*for (j=0;j<len;j++)
+      printf ("%d ", bits[j]);
+   printf ("\n");*/
+}
 
 #ifdef FIXED_POINT
 static inline celt_ener_t dB2Amp(celt_ener_t dB)
@@ -63,7 +104,7 @@ static inline celt_ener_t dB2Amp(celt_ener_t dB)
 static inline celt_word16_t amp2dB(celt_ener_t amp)
 {
    /* equivalent to return 6.0207*log2(.3+amp) */
-   return ROUND(MULT16_16(24661,celt_log2(ADD32(QCONST32(.3f,14),amp))),12);
+   return ROUND16(MULT16_16(24661,celt_log2(ADD32(QCONST32(.3f,14),amp))),12);
    /* return DB_SCALING*20*log10(.3+ENER_SCALING_1*amp); */
 }
 #else
@@ -83,18 +124,36 @@ static inline celt_word16_t amp2dB(celt_ener_t amp)
 
 static const celt_word16_t base_resolution = QCONST16(6.f,8);
 
-static void quant_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, int budget, ec_enc *enc)
+int *quant_prob_alloc(const CELTMode *m)
+{
+   int i;
+   int *prob;
+   prob = celt_alloc(2*m->nbEBands*sizeof(int));
+   for (i=0;i<m->nbEBands;i++)
+   {
+      prob[2*i] = 6000-i*200;
+      prob[2*i+1] = ec_laplace_get_start_freq(prob[2*i]);
+   }
+   return prob;
+}
+
+void quant_prob_free(int *freq)
+{
+   celt_free(freq);
+}
+
+static void quant_coarse_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, unsigned budget, int *prob, celt_word16_t *error, ec_enc *enc)
 {
    int i;
-   int bits;
+   unsigned bits;
    celt_word16_t prev = 0;
    celt_word16_t coef = m->ePredCoef;
-   VARDECL(celt_word16_t *error);
+   celt_word16_t beta;
    /* The .7 is a heuristic */
-   celt_word16_t beta = MULT16_16_Q15(QCONST16(.7f,15),coef);
+   beta = MULT16_16_Q15(QCONST16(.8f,15),coef);
    
-   ALLOC(error, m->nbEBands, celt_word16_t);
    bits = ec_enc_tell(enc, 0);
+   /* Encode at a fixed coarse resolution */
    for (i=0;i<m->nbEBands;i++)
    {
       int qi;
@@ -103,50 +162,50 @@ static void quant_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_word1
       celt_word16_t f;   /* Q8 */
       celt_word16_t mean = MULT16_16_Q15(Q15ONE-coef,eMeans[i]);
       x = amp2dB(eBands[i]);
-      f = DIV32_16(SHL32(EXTEND32(x-mean-MULT16_16_Q15(coef,oldEBands[i])-prev),8),base_resolution);
+      f = EXTRACT16(celt_div(SHL32(EXTEND32(x-mean-MULT16_16_Q15(coef,oldEBands[i])-prev),8),base_resolution));
 #ifdef FIXED_POINT
       /* Rounding to nearest integer here is really important! */
       qi = (f+128)>>8;
 #else
       qi = (int)floor(.5+f);
 #endif
-      /*ec_laplace_encode(enc, qi, i==0?11192:6192);*/
-      /*ec_laplace_encode(enc, qi, 8500-i*200);*/
-      /* If we don't have enough bits to encode all the energy, just assume something safe. */
-      if (ec_enc_tell(enc, 0) - bits > budget)
+      /* If we don't have enough bits to encode all the energy, just assume something safe.
+         We allow slightly busting the budget here */
+      if (ec_enc_tell(enc, 0) - bits > budget+16)
          qi = -1;
       else
-         ec_laplace_encode(enc, qi, 6000-i*200);
+         ec_laplace_encode_start(enc, &qi, prob[2*i], prob[2*i+1]);
       q = qi*base_resolution;
       error[i] = f - SHL16(qi,8);
       
-      /*printf("%d ", qi);*/
-      /*printf("%f %f ", pred+prev+q, x);*/
-      /*printf("%f ", x-pred);*/
-      
       oldEBands[i] = mean+MULT16_16_Q15(coef,oldEBands[i])+prev+q;
-      
+      if (oldEBands[i] < -QCONST16(12.f,8))
+         oldEBands[i] = -QCONST16(12.f,8);
       prev = mean+prev+MULT16_16_Q15(Q15ONE-beta,q);
    }
-   /*bits = ec_enc_tell(enc, 0) - bits;*/
-   /*printf ("%d\n", bits);*/
+}
+
+static void quant_fine_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, celt_word16_t *error, celt_int16_t *fine_quant, ec_enc *enc)
+{
+   int i;
+   /* Encode finer resolution */
    for (i=0;i<m->nbEBands;i++)
    {
       int q2;
-      celt_word16_t offset = (error[i]+QCONST16(.5f,8))*frac[i];
-      /* FIXME: Instead of giving up without warning, we should degrade everything gracefully */
-      if (ec_enc_tell(enc, 0) - bits +EC_ILOG(frac[i])> budget)
-         break;
+      celt_int16_t frac = 1<<fine_quant[i];
+      celt_word16_t offset = (error[i]+QCONST16(.5f,8))*frac;
+      if (fine_quant[i] <= 0)
+         continue;
 #ifdef FIXED_POINT
       /* Has to be without rounding */
       q2 = offset>>8;
 #else
       q2 = (int)floor(offset);
 #endif
-      if (q2 > frac[i]-1)
-         q2 = frac[i]-1;
-      ec_enc_uint(enc, q2, frac[i]);
-      offset = DIV32_16(SHL16(q2,8)+QCONST16(.5,8),frac[i])-QCONST16(.5f,8);
+      if (q2 > frac-1)
+         q2 = frac-1;
+      ec_enc_bits(enc, q2, fine_quant[i]);
+      offset = EXTRACT16(celt_div(SHL16(q2,8)+QCONST16(.5,8),frac)-QCONST16(.5f,8));
       oldEBands[i] += PSHR32(MULT16_16(DB_SCALING*6,offset),8);
       /*printf ("%f ", error[i] - offset);*/
    }
@@ -159,43 +218,51 @@ static void quant_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_word1
    /*printf ("\n");*/
 }
 
-static void unquant_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, int budget, ec_dec *dec)
+static void unquant_coarse_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, unsigned budget, int *prob, ec_dec *dec)
 {
    int i;
-   int bits;
+   unsigned bits;
    celt_word16_t prev = 0;
    celt_word16_t coef = m->ePredCoef;
    /* The .7 is a heuristic */
-   celt_word16_t beta = MULT16_16_Q15(QCONST16(.7f,15),coef);
+   celt_word16_t beta = MULT16_16_Q15(QCONST16(.8f,15),coef);
+   
    bits = ec_dec_tell(dec, 0);
+   /* Decode at a fixed coarse resolution */
    for (i=0;i<m->nbEBands;i++)
    {
       int qi;
       celt_word16_t q;
       celt_word16_t mean = MULT16_16_Q15(Q15ONE-coef,eMeans[i]);
-      /* If we didn't have enough bits to encode all the energy, just assume something safe. */
-      if (ec_dec_tell(dec, 0) - bits > budget)
+      /* If we didn't have enough bits to encode all the energy, just assume something safe.
+         We allow slightly busting the budget here */
+      if (ec_dec_tell(dec, 0) - bits > budget+16)
          qi = -1;
       else
-         qi = ec_laplace_decode(dec, 6000-i*200);
+         qi = ec_laplace_decode_start(dec, prob[2*i], prob[2*i+1]);
       q = qi*base_resolution;
       
-      /*printf("%d ", qi);*/
-      /*printf("%f %f ", pred+prev+q, x);*/
-      /*printf("%f ", x-pred);*/
-      
       oldEBands[i] = mean+MULT16_16_Q15(coef,oldEBands[i])+prev+q;
+      if (oldEBands[i] < -QCONST16(12.f,8))
+         oldEBands[i] = -QCONST16(12.f,8);
       
       prev = mean+prev+MULT16_16_Q15(Q15ONE-beta,q);
    }
+}
+
+static void unquant_fine_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, celt_int16_t *fine_quant, ec_dec *dec)
+{
+   int i;
+   /* Decode finer resolution */
    for (i=0;i<m->nbEBands;i++)
    {
       int q2;
+      celt_int16_t frac = 1<<fine_quant[i];
       celt_word16_t offset;
-      if (ec_dec_tell(dec, 0) - bits +EC_ILOG(frac[i])> budget)
-         break;
-      q2 = ec_dec_uint(dec, frac[i]);
-      offset = DIV32_16(SHL16(q2,8)+QCONST16(.5,8),frac[i])-QCONST16(.5f,8);
+      if (fine_quant[i] <= 0)
+         continue;
+      q2 = ec_dec_bits(dec, fine_quant[i]);
+      offset = EXTRACT16(celt_div(SHL16(q2,8)+QCONST16(.5,8),frac)-QCONST16(.5f,8));
       oldEBands[i] += PSHR32(MULT16_16(DB_SCALING*6,offset),8);
    }
    for (i=0;i<m->nbEBands;i++)
@@ -207,83 +274,101 @@ static void unquant_energy_mono(const CELTMode *m, celt_ener_t *eBands, celt_wor
 
 
 
-void quant_energy(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, int budget, ec_enc *enc)
+void quant_coarse_energy(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, int budget, int *prob, celt_word16_t *error, ec_enc *enc)
 {
    int C;
-   
    C = m->nbChannels;
 
    if (C==1)
-      quant_energy_mono(m, eBands, oldEBands, budget, enc);
-   else 
-#if 1
    {
+      quant_coarse_energy_mono(m, eBands, oldEBands, budget, prob, error, enc);
+
+   } else {
       int c;
-      VARDECL(celt_ener_t *E);
-      ALLOC(E, m->nbEBands, celt_ener_t);
       for (c=0;c<C;c++)
       {
          int i;
+         VARDECL(celt_ener_t, E);
+         SAVE_STACK;
+         ALLOC(E, m->nbEBands, celt_ener_t);
          for (i=0;i<m->nbEBands;i++)
             E[i] = eBands[C*i+c];
-         quant_energy_mono(m, E, oldEBands+c*m->nbEBands, budget/C, enc);
-         for (i=0;i<m->nbEBands;i++)
-            eBands[C*i+c] = E[i];
+         quant_coarse_energy_mono(m, E, oldEBands+c*m->nbEBands, budget/C, prob, error+c*m->nbEBands, enc);
       }
+      RESTORE_STACK;
    }
-#else
-      if (C==2)
+}
+
+void quant_fine_energy(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, celt_word16_t *error, celt_int16_t *fine_quant, ec_enc *enc)
+{
+   int C;
+   C = m->nbChannels;
+
+   if (C==1)
    {
-      int i;
-      int NB = m->nbEBands;
-      celt_ener_t mid[NB];
-      celt_ener_t side[NB];
-      for (i=0;i<NB;i++)
-      {
-         //left = eBands[C*i];
-         //right = eBands[C*i+1];
-         mid[i] = ENER_SCALING_1*sqrt(eBands[C*i]*eBands[C*i] + eBands[C*i+1]*eBands[C*i+1]);
-         side[i] = 20*log10((ENER_SCALING_1*eBands[2*i]+.3)/(ENER_SCALING_1*eBands[2*i+1]+.3));
-         //printf ("%f %f ", mid[i], side[i]);
-      }
-      //printf ("\n");
-      quant_energy_mono(m, mid, oldEBands, enc);
-      for (i=0;i<NB;i++)
-         side[i] = pow(10.f,floor(.5f+side[i])/10.f);
-         
-      //quant_energy_side(m, side, oldEBands+NB, enc);
-      for (i=0;i<NB;i++)
-      {
-         eBands[C*i] = ENER_SCALING*mid[i]*sqrt(side[i]/(1.f+side[i]));
-         eBands[C*i+1] = ENER_SCALING*mid[i]*sqrt(1.f/(1.f+side[i]));
-         //printf ("%f %f ", mid[i], side[i]);
-      }
+      quant_fine_energy_mono(m, eBands, oldEBands, error, fine_quant, enc);
 
    } else {
-      celt_fatal("more than 2 channels not supported");
+      int c;
+      VARDECL(celt_ener_t, E);
+      ALLOC(E, m->nbEBands, celt_ener_t);
+      for (c=0;c<C;c++)
+      {
+         int i;
+         SAVE_STACK;
+         quant_fine_energy_mono(m, E, oldEBands+c*m->nbEBands, error+c*m->nbEBands, fine_quant, enc);
+         for (i=0;i<m->nbEBands;i++)
+            eBands[C*i+c] = E[i];
+      }
+      RESTORE_STACK;
    }
-#endif
 }
 
 
+void unquant_coarse_energy(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, int budget, int *prob, ec_dec *dec)
+{
+   int C;   
+
+   C = m->nbChannels;
+   if (C==1)
+   {
+      unquant_coarse_energy_mono(m, eBands, oldEBands, budget, prob, dec);
+   }
+   else {
+      int c;
+      VARDECL(celt_ener_t, E);
+      SAVE_STACK;
+      ALLOC(E, m->nbEBands, celt_ener_t);
+      for (c=0;c<C;c++)
+      {
+         unquant_coarse_energy_mono(m, E, oldEBands+c*m->nbEBands, budget/C, prob, dec);
+      }
+      RESTORE_STACK;
+   }
+}
 
-void unquant_energy(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, int budget, ec_dec *dec)
+void unquant_fine_energy(const CELTMode *m, celt_ener_t *eBands, celt_word16_t *oldEBands, celt_int16_t *fine_quant, ec_dec *dec)
 {
    int C;   
+
    C = m->nbChannels;
 
    if (C==1)
-      unquant_energy_mono(m, eBands, oldEBands, budget, dec);
+   {
+      unquant_fine_energy_mono(m, eBands, oldEBands, fine_quant, dec);
+   }
    else {
       int c;
-      VARDECL(celt_ener_t *E);
+      VARDECL(celt_ener_t, E);
+      SAVE_STACK;
       ALLOC(E, m->nbEBands, celt_ener_t);
       for (c=0;c<C;c++)
       {
          int i;
-         unquant_energy_mono(m, E, oldEBands+c*m->nbEBands, budget/C, dec);
+         unquant_fine_energy_mono(m, E, oldEBands+c*m->nbEBands, fine_quant, dec);
          for (i=0;i<m->nbEBands;i++)
             eBands[C*i+c] = E[i];
       }
+      RESTORE_STACK;
    }
 }