Move fine_priority calculation after the bust cap.
[opus.git] / libcelt / bands.c
index 9b5bc67..d640e58 100644 (file)
@@ -232,10 +232,10 @@ static void stereo_split(celt_norm *X, celt_norm *Y, int N)
    }
 }
 
-static void stereo_merge(celt_norm *X, celt_norm *Y, celt_word16 mid, celt_word16 side, int N)
+static void stereo_merge(celt_norm *X, celt_norm *Y, celt_word16 mid, int N)
 {
    int j;
-   celt_word32 xp=0;
+   celt_word32 xp=0, side=0;
    celt_word32 El, Er;
 #ifdef FIXED_POINT
    int kl, kr;
@@ -244,12 +244,15 @@ static void stereo_merge(celt_norm *X, celt_norm *Y, celt_word16 mid, celt_word1
 
    /* Compute the norm of X+Y and X-Y as |X|^2 + |Y|^2 +/- sum(xy) */
    for (j=0;j<N;j++)
+   {
       xp = MAC16_16(xp, X[j], Y[j]);
+      side = MAC16_16(side, Y[j], Y[j]);
+   }
    /* mid and side are in Q15, not Q14 like X and Y */
    mid = SHR32(mid, 1);
-   side = SHR32(side, 1);
-   El = MULT16_16(mid, mid) + MULT16_16(side, side) - 2*xp;
-   Er = MULT16_16(mid, mid) + MULT16_16(side, side) + 2*xp;
+   //side = SHR32(side, 1);
+   El = MULT16_16(mid, mid) + side - 2*xp;
+   Er = MULT16_16(mid, mid) + side + 2*xp;
    if (Er < EPSILON)
       Er = EPSILON;
    if (El < EPSILON)
@@ -282,7 +285,7 @@ static void stereo_merge(celt_norm *X, celt_norm *Y, celt_word16 mid, celt_word1
 }
 
 /* Decide whether we should spread the pulses in the current frame */
-int folding_decision(const CELTMode *m, celt_norm *X, int *average, int *last_decision, int end, int _C, int M)
+int spreading_decision(const CELTMode *m, celt_norm *X, int *average, int last_decision, int end, int _C, int M)
 {
    int i, c, N0;
    int sum = 0, nbBands=0;
@@ -293,7 +296,7 @@ int folding_decision(const CELTMode *m, celt_norm *X, int *average, int *last_de
    N0 = M*m->shortMdctSize;
 
    if (M*(eBands[end]-eBands[end-1]) <= 8)
-      return 0;
+      return SPREAD_NONE;
    c=0; do {
       for (i=0;i<end;i++)
       {
@@ -327,23 +330,18 @@ int folding_decision(const CELTMode *m, celt_norm *X, int *average, int *last_de
    sum = (sum+*average)>>1;
    *average = sum;
    /* Hysteresis */
-   sum = (3*sum + ((*last_decision<<7) + 64) + 2)>>2;
-   /* decision and last_decision do not use the same encoding */
+   sum = (3*sum + (((3-last_decision)<<7) + 64) + 2)>>2;
    if (sum < 80)
    {
-      decision = 2;
-      *last_decision = 0;
+      decision = SPREAD_AGGRESSIVE;
    } else if (sum < 256)
    {
-      decision = 1;
-      *last_decision = 1;
+      decision = SPREAD_NORMAL;
    } else if (sum < 384)
    {
-      decision = 3;
-      *last_decision = 2;
+      decision = SPREAD_LIGHT;
    } else {
-      decision = 0;
-      *last_decision = 3;
+      decision = SPREAD_NONE;
    }
    return decision;
 }
@@ -392,7 +390,18 @@ void measure_norm_mse(const CELTMode *m, float *X, float *X0, float *bandE, floa
 
 #endif
 
-static void interleave_vector(celt_norm *X, int N0, int stride)
+/* Indexing table for converting from natural Hadamard to ordery Hadamard
+   This is essentially a bit-reversed Gray, on top of which we've added
+   an inversion of the order because we want the DC at the end rather than
+   the beginning. The lines are for N=2, 4, 8, 16 */
+static const int ordery_table[] = {
+       1,  0,
+       3,  0,  2,  1,
+       7,  0,  4,  3,  6,  1,  5,  2,
+      15,  0,  8,  7, 12,  3, 11,  4, 14,  1,  9,  6, 13,  2, 10,  5,
+};
+
+static void deinterleave_hadamard(celt_norm *X, int N0, int stride, int hadamard)
 {
    int i,j;
    VARDECL(celt_norm, tmp);
@@ -400,15 +409,25 @@ static void interleave_vector(celt_norm *X, int N0, int stride)
    SAVE_STACK;
    N = N0*stride;
    ALLOC(tmp, N, celt_norm);
-   for (i=0;i<stride;i++)
-      for (j=0;j<N0;j++)
-         tmp[j*stride+i] = X[i*N0+j];
+   if (hadamard)
+   {
+      const int *ordery = ordery_table+stride-2;
+      for (i=0;i<stride;i++)
+      {
+         for (j=0;j<N0;j++)
+            tmp[ordery[i]*N0+j] = X[j*stride+i];
+      }
+   } else {
+      for (i=0;i<stride;i++)
+         for (j=0;j<N0;j++)
+            tmp[i*N0+j] = X[j*stride+i];
+   }
    for (j=0;j<N;j++)
       X[j] = tmp[j];
    RESTORE_STACK;
 }
 
-static void deinterleave_vector(celt_norm *X, int N0, int stride)
+static void interleave_hadamard(celt_norm *X, int N0, int stride, int hadamard)
 {
    int i,j;
    VARDECL(celt_norm, tmp);
@@ -416,9 +435,17 @@ static void deinterleave_vector(celt_norm *X, int N0, int stride)
    SAVE_STACK;
    N = N0*stride;
    ALLOC(tmp, N, celt_norm);
-   for (i=0;i<stride;i++)
-      for (j=0;j<N0;j++)
-         tmp[i*N0+j] = X[j*stride+i];
+   if (hadamard)
+   {
+      const int *ordery = ordery_table+stride-2;
+      for (i=0;i<stride;i++)
+         for (j=0;j<N0;j++)
+            tmp[j*stride+i] = X[ordery[i]*N0+j];
+   } else {
+      for (i=0;i<stride;i++)
+         for (j=0;j<N0;j++)
+            tmp[j*stride+i] = X[i*N0+j];
+   }
    for (j=0;j<N;j++)
       X[j] = tmp[j];
    RESTORE_STACK;
@@ -478,7 +505,7 @@ static celt_uint32 lcg_rand(celt_uint32 seed)
 static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_norm *Y,
       int N, int b, int spread, int B, int intensity, int tf_change, celt_norm *lowband, int resynth, void *ec,
       celt_int32 *remaining_bits, int LM, celt_norm *lowband_out, const celt_ener *bandE, int level,
-      celt_int32 *seed, celt_word16 gain, celt_norm *lowband_scratch)
+      celt_int32 *seed, celt_word16 gain, celt_norm *lowband_scratch, int fill)
 {
    int q;
    int curr_bits;
@@ -492,6 +519,9 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
    int recombine=0;
    int inv = 0;
    celt_word16 mid=0, side=0;
+   int longBlocks;
+
+   longBlocks = B0==1;
 
    N_B /= B;
    N_B0 = N_B;
@@ -570,9 +600,9 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
       if (B0>1)
       {
          if (encode)
-            deinterleave_vector(X, N_B, B0);
+            deinterleave_hadamard(X, N_B, B0, longBlocks);
          if (lowband)
-            deinterleave_vector(lowband, N_B, B0);
+            deinterleave_hadamard(lowband, N_B, B0, longBlocks);
       }
    }
 
@@ -603,18 +633,18 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
       qalloc = 0;
       if (stereo && i>=intensity)
          qn = 1;
+      if (encode)
+      {
+         /* theta is the atan() of the ratio between the (normalized)
+            side and mid. With just that parameter, we can re-scale both
+            mid and side because we know that 1) they have unit norm and
+            2) they are orthogonal. */
+         itheta = stereo_itheta(X, Y, stereo, N);
+      }
       if (qn!=1)
       {
          if (encode)
-         {
-            /* theta is the atan() of the ratio between the (normalized)
-               side and mid. With just that parameter, we can re-scale both
-               mid and side because we know that 1) they have unit norm and
-               2) they are orthogonal. */
-            itheta = stereo_itheta(X, Y, stereo, N);
-
             itheta = (itheta*qn+8192)>>14;
-         }
 
          /* Entropy coding of the angle. We use a uniform pdf for the
             first stereo split but a triangular one for the rest. */
@@ -677,15 +707,16 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
             }
             intensity_stereo(m, X, Y, bandE, i, N);
          }
-         if (b>2<<BITRES)
+         if (b>2<<BITRES && *remaining_bits > 2<<BITRES)
          {
             if (encode)
-               ec_enc_bit_prob(ec, inv, 16384);
+               ec_enc_bit_logp(ec, inv, 2);
             else
-               inv = ec_dec_bit_prob(ec, 16384);
-            qalloc = 1<<BITRES;
+               inv = ec_dec_bit_logp(ec, 2);
+            qalloc = inv ? 16 : 4;
          } else
             inv = 0;
+         itheta = 0;
       }
 
       if (itheta == 0)
@@ -745,7 +776,7 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
             }
          }
          sign = 2*sign - 1;
-         quant_band(encode, m, i, x2, NULL, N, mbits, spread, B, intensity, tf_change, lowband, resynth, ec, remaining_bits, LM, lowband_out, NULL, level, seed, gain, lowband_scratch);
+         quant_band(encode, m, i, x2, NULL, N, mbits, spread, B, intensity, tf_change, lowband, resynth, ec, remaining_bits, LM, lowband_out, NULL, level, seed, gain, lowband_scratch, fill);
          y2[0] = -sign*x2[1];
          y2[1] = sign*x2[0];
          if (resynth)
@@ -769,9 +800,13 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
          int next_level=0;
 
          /* Give more bits to low-energy MDCTs than they would otherwise deserve */
-         if (B>1 && !stereo && itheta > 8192)
-            delta -= delta>>(1+level);
-
+         if (B>1 && !stereo)
+         {
+            if (itheta > 8192)
+               delta -= delta>>(4+level-LM);
+            else
+               delta -= delta>>(5+level-LM);
+         }
          mbits = (b-qalloc-delta)/2;
          if (mbits > b-qalloc)
             mbits = b-qalloc;
@@ -792,10 +827,10 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
 
          quant_band(encode, m, i, X, NULL, N, mbits, spread, B, intensity, tf_change,
                lowband, resynth, ec, remaining_bits, LM, next_lowband_out1,
-               NULL, next_level, seed, MULT16_16_P15(gain,mid), lowband_scratch);
+               NULL, next_level, seed, MULT16_16_P15(gain,mid), lowband_scratch, fill);
          quant_band(encode, m, i, Y, NULL, N, sbits, spread, B, intensity, tf_change,
                next_lowband2, resynth, ec, remaining_bits, LM, NULL,
-               NULL, next_level, seed, MULT16_16_P15(gain,side), NULL);
+               NULL, next_level, seed, MULT16_16_P15(gain,side), NULL, fill && !stereo);
       }
 
    } else {
@@ -825,26 +860,28 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
       } else {
          /* If there's no pulse, fill the band anyway */
          int j;
-         if (lowband != NULL && resynth)
+         if (resynth)
          {
-            if (spread==2 && B<=1)
+            if (!fill)
             {
-               /* Folded spectrum */
                for (j=0;j<N;j++)
+                  X[j] = 0;
+            } else {
+               if (lowband == NULL || (spread==SPREAD_AGGRESSIVE && B<=1))
                {
-                  *seed = lcg_rand(*seed);
-                  X[j] = (int)(*seed)>>20;
+                  /* Noise */
+                  for (j=0;j<N;j++)
+                  {
+                     *seed = lcg_rand(*seed);
+                     X[j] = (int)(*seed)>>20;
+                  }
+               } else {
+                  /* Folded spectrum */
+                  for (j=0;j<N;j++)
+                     X[j] = lowband[j];
                }
-            } else {
-               /* Noise */
-               for (j=0;j<N;j++)
-                  X[j] = lowband[j];
+               renormalise_vector(X, N, gain);
             }
-            renormalise_vector(X, N, gain);
-         } else {
-            /* This is important for encoding the side in stereo mode */
-            for (j=0;j<N;j++)
-               X[j] = 0;
          }
       }
    }
@@ -855,7 +892,7 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
       if (stereo)
       {
          if (N!=2)
-            stereo_merge(X, Y, mid, side, N);
+            stereo_merge(X, Y, mid, N);
          if (inv)
          {
             int j;
@@ -868,7 +905,7 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
 
          /* Undo the sample reorganization going from time order to frequency order */
          if (B0>1)
-            interleave_vector(X, N_B, B0);
+            interleave_hadamard(X, N_B, B0, longBlocks);
 
          /* Undo time-freq changes that we did earlier */
          N_B = N_B0;
@@ -902,13 +939,13 @@ static void quant_band(int encode, const CELTMode *m, int i, celt_norm *X, celt_
 
 void quant_all_bands(int encode, const CELTMode *m, int start, int end,
       celt_norm *_X, celt_norm *_Y, const celt_ener *bandE, int *pulses,
-      int shortBlocks, int fold, int intensity, int *tf_res, int resynth,
+      int shortBlocks, int spread, int dual_stereo, int intensity, int *tf_res, int resynth,
       int total_bits, void *ec, int LM, int codedBands)
 {
    int i, balance;
    celt_int32 remaining_bits;
    const celt_int16 * restrict eBands = m->eBands;
-   celt_norm * restrict norm;
+   celt_norm * restrict norm, * restrict norm2;
    VARDECL(celt_norm, _norm);
    VARDECL(celt_norm, lowband_scratch);
    int B;
@@ -921,10 +958,11 @@ void quant_all_bands(int encode, const CELTMode *m, int start, int end,
 
    M = 1<<LM;
    B = shortBlocks ? M : 1;
-   ALLOC(_norm, M*eBands[m->nbEBands], celt_norm);
+   ALLOC(_norm, C*M*eBands[m->nbEBands], celt_norm);
    ALLOC(lowband_scratch, M*(eBands[m->nbEBands]-eBands[m->nbEBands-1]), celt_norm);
    norm = _norm;
-
+   norm2 = norm + M*eBands[m->nbEBands];
+#if 0
    if (C==2)
    {
       int j;
@@ -949,7 +987,7 @@ void quant_all_bands(int encode, const CELTMode *m, int start, int end,
          }
       }
    }
-
+#endif
    if (encode)
       seed = ((ec_enc*)ec)->rng;
    else
@@ -993,9 +1031,6 @@ void quant_all_bands(int encode, const CELTMode *m, int start, int end,
       } else {
          b = 0;
       }
-      /* Prevents ridiculous bit depths */
-      if (b > C*16*N<<BITRES)
-         b = C*16*N<<BITRES;
 
       if (M*eBands[i]-N >= M*eBands[start] && (update_lowband || lowband_offset==-1))
             lowband_offset = M*eBands[i];
@@ -1015,10 +1050,28 @@ void quant_all_bands(int encode, const CELTMode *m, int start, int end,
          if (effective_lowband < M*eBands[start])
             effective_lowband = M*eBands[start];
       }
-      quant_band(encode, m, i, X, Y, N, b, fold, B, intensity, tf_change,
-            effective_lowband != -1 ? norm+effective_lowband : NULL, resynth, ec, &remaining_bits, LM,
-            norm+M*eBands[i], bandE, 0, &seed, Q15ONE, lowband_scratch);
+      if (dual_stereo && i==intensity)
+      {
+         int j;
 
+         /* Switch off dual stereo to do intensity */
+         dual_stereo = 0;
+         for (j=M*eBands[start];j<M*eBands[i];j++)
+            norm[j] = HALF32(norm[j]+norm2[j]);
+      }
+      if (dual_stereo)
+      {
+         quant_band(encode, m, i, X, NULL, N, b/2, spread, B, intensity, tf_change,
+               effective_lowband != -1 ? norm+effective_lowband : NULL, resynth, ec, &remaining_bits, LM,
+               norm+M*eBands[i], bandE, 0, &seed, Q15ONE, lowband_scratch, 1);
+         quant_band(encode, m, i, Y, NULL, N, b/2, spread, B, intensity, tf_change,
+               effective_lowband != -1 ? norm2+effective_lowband : NULL, resynth, ec, &remaining_bits, LM,
+               norm2+M*eBands[i], bandE, 0, &seed, Q15ONE, lowband_scratch, 1);
+      } else {
+         quant_band(encode, m, i, X, Y, N, b, spread, B, intensity, tf_change,
+               effective_lowband != -1 ? norm+effective_lowband : NULL, resynth, ec, &remaining_bits, LM,
+               norm+M*eBands[i], bandE, 0, &seed, Q15ONE, lowband_scratch, 1);
+      }
       balance += pulses[i] + tell;
 
       /* Update the folding position only as long as we have 1 bit/sample depth */