optional fast ncwrs64() implementation (copied from ncwrs) requiring
[opus.git] / libcelt / cwrs.c
1 /* (C) 2007 Timothy B. Terriberry */
2 /*
3    Redistribution and use in source and binary forms, with or without
4    modification, are permitted provided that the following conditions
5    are met:
6
7    - Redistributions of source code must retain the above copyright
8    notice, this list of conditions and the following disclaimer.
9
10    - Redistributions in binary form must reproduce the above copyright
11    notice, this list of conditions and the following disclaimer in the
12    documentation and/or other materials provided with the distribution.
13
14    - Neither the name of the Xiph.org Foundation nor the names of its
15    contributors may be used to endorse or promote products derived from
16    this software without specific prior written permission.
17
18    THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
19    ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
20    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
21    A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
22    CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
23    EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
24    PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
25    PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
26    LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
27    NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
28    SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
29 */
30 #include <stdlib.h>
31 #include "cwrs.h"
32
33 /*Returns the numer of ways of choosing _m elements from a set of size _n with
34    replacement when a sign bit is needed for each unique element.*/
35 #if 0
36 static celt_uint32_t ncwrs(int _n,int _m){
37   static celt_uint32_t c[32][32];
38   if(_n<0||_m<0)return 0;
39   if(!c[_n][_m]){
40     if(_m<=0)c[_n][_m]=1;
41     else if(_n>0)c[_n][_m]=ncwrs(_n-1,_m)+ncwrs(_n,_m-1)+ncwrs(_n-1,_m-1);
42   }
43   return c[_n][_m];
44 }
45 #else
46 celt_uint32_t ncwrs(int _n,int _m){
47   celt_uint32_t ret;
48   celt_uint32_t f;
49   celt_uint32_t d;
50   int      i;
51   if(_n<0||_m<0)return 0;
52   if(_m==0)return 1;
53   if(_n==0)return 0;
54   ret=0;
55   f=_n;
56   d=1;
57   for(i=1;i<=_m;i++){
58     ret+=f*d<<i;
59     f=(f*(_n-i))/(i+1);
60     d=(d*(_m-i))/i;
61   }
62   return ret;
63 }
64 #endif
65
66 #if 0
67 celt_uint64_t ncwrs64(int _n,int _m){
68   static celt_uint64_t c[100][100];
69   if(_n<0||_m<0)return 0;
70   if(!c[_n][_m]){
71     if(_m<=0)c[_n][_m]=1;
72     else if(_n>0)c[_n][_m]=ncwrs(_n-1,_m)+ncwrs(_n,_m-1)+ncwrs(_n-1,_m-1);
73 }
74   return c[_n][_m];
75 }
76 #else
77 celt_uint64_t ncwrs64(int _n,int _m){
78   celt_uint64_t ret;
79   celt_uint64_t f;
80   celt_uint64_t d;
81   int           i;
82   if(_n<0||_m<0)return 0;
83   if(_m==0)return 1;
84   if(_n==0)return 0;
85   ret=0;
86   f=_n;
87   d=1;
88   for(i=1;i<=_m;i++){
89     ret+=f*d<<i;
90     f=(f*(_n-i))/(i+1);
91     d=(d*(_m-i))/i;
92   }
93   return ret;
94 }
95 #endif
96
97 /*Returns the _i'th combination of _m elements chosen from a set of size _n
98    with associated sign bits.
99   _x:      Returns the combination with elements sorted in ascending order.
100   _s:      Returns the associated sign bits.*/
101 void cwrsi(int _n,int _m,celt_uint32_t _i,int *_x,int *_s){
102   int j;
103   int k;
104   for(k=j=0;k<_m;k++){
105     celt_uint32_t pn;
106     celt_uint32_t p;
107     celt_uint32_t t;
108     p=ncwrs(_n-j,_m-k-1);
109     pn=ncwrs(_n-j-1,_m-k-1);
110     p+=pn;
111     if(k>0){
112       t=p>>1;
113       if(t<=_i||_s[k-1])_i+=t;
114     }
115     while(p<=_i){
116       _i-=p;
117       j++;
118       p=pn;
119       pn=ncwrs(_n-j-1,_m-k-1);
120       p+=pn;
121     }
122     t=p>>1;
123     _s[k]=_i>=t;
124     _x[k]=j;
125     if(_s[k])_i-=t;
126   }
127 }
128
129 /*Returns the index of the given combination of _m elements chosen from a set
130    of size _n with associated sign bits.
131   _x:      The combination with elements sorted in ascending order.
132   _s:      The associated sign bits.*/
133 celt_uint32_t icwrs(int _n,int _m,const int *_x,const int *_s){
134   celt_uint32_t i;
135   int      j;
136   int      k;
137   i=0;
138   for(k=j=0;k<_m;k++){
139     celt_uint32_t pn;
140     celt_uint32_t p;
141     p=ncwrs(_n-j,_m-k-1);
142     pn=ncwrs(_n-j-1,_m-k-1);
143     p+=pn;
144     if(k>0)p>>=1;
145     while(j<_x[k]){
146       i+=p;
147       j++;
148       p=pn;
149       pn=ncwrs(_n-j-1,_m-k-1);
150       p+=pn;
151     }
152     if((k==0||_x[k]!=_x[k-1])&&_s[k])i+=p>>1;
153   }
154   return i;
155 }
156
157 /*Returns the _i'th combination of _m elements chosen from a set of size _n
158    with associated sign bits.
159   _x:      Returns the combination with elements sorted in ascending order.
160   _s:      Returns the associated sign bits.*/
161 void cwrsi64(int _n,int _m,celt_uint64_t _i,int *_x,int *_s){
162   int j;
163   int k;
164   for(k=j=0;k<_m;k++){
165     celt_uint64_t pn;
166     celt_uint64_t p;
167     celt_uint64_t t;
168     p=ncwrs64(_n-j,_m-k-1);
169     pn=ncwrs64(_n-j-1,_m-k-1);
170     p+=pn;
171     if(k>0){
172       t=p>>1;
173       if(t<=_i||_s[k-1])_i+=t;
174     }
175     while(p<=_i){
176       _i-=p;
177       j++;
178       p=pn;
179       pn=ncwrs64(_n-j-1,_m-k-1);
180       p+=pn;
181     }
182     t=p>>1;
183     _s[k]=_i>=t;
184     _x[k]=j;
185     if(_s[k])_i-=t;
186   }
187 }
188
189 /*Returns the index of the given combination of _m elements chosen from a set
190    of size _n with associated sign bits.
191   _x:      The combination with elements sorted in ascending order.
192   _s:      The associated sign bits.*/
193 celt_uint64_t icwrs64(int _n,int _m,const int *_x,const int *_s){
194   celt_uint64_t i;
195   int           j;
196   int           k;
197   i=0;
198   for(k=j=0;k<_m;k++){
199     celt_uint64_t pn;
200     celt_uint64_t p;
201     p=ncwrs64(_n-j,_m-k-1);
202     pn=ncwrs64(_n-j-1,_m-k-1);
203     p+=pn;
204     if(k>0)p>>=1;
205     while(j<_x[k]){
206       i+=p;
207       j++;
208       p=pn;
209       pn=ncwrs64(_n-j-1,_m-k-1);
210       p+=pn;
211     }
212     if((k==0||_x[k]!=_x[k-1])&&_s[k])i+=p>>1;
213   }
214   return i;
215 }
216
217 /*Converts a combination _x of _m unit pulses with associated sign bits _s into
218    a pulse vector _y of length _n.
219   _y: Returns the vector of pulses.
220   _x: The combination with elements sorted in ascending order.
221   _s: The associated sign bits.*/
222 void comb2pulse(int _n,int _m,int *_y,const int *_x,const int *_s){
223   int j;
224   int k;
225   int n;
226   for(k=j=0;k<_m;k+=n){
227     for(n=1;k+n<_m&&_x[k+n]==_x[k];n++);
228     while(j<_x[k])_y[j++]=0;
229     _y[j++]=_s[k]?-n:n;
230   }
231   while(j<_n)_y[j++]=0;
232 }
233
234 /*Converts a pulse vector vector _y of length _n into a combination of _m unit
235    pulses with associated sign bits _s.
236   _x: Returns the combination with elements sorted in ascending order.
237   _s: Returns the associated sign bits.
238   _y: The vector of pulses, whose sum of absolute values must be _m.*/
239 void pulse2comb(int _n,int _m,int *_x,int *_s,const int *_y){
240   int j;
241   int k;
242   for(k=j=0;j<_n;j++){
243     if(_y[j]){
244       int n;
245       int s;
246       n=abs(_y[j]);
247       s=_y[j]<0;
248       for(;n-->0;k++){
249         _x[k]=j;
250         _s[k]=s;
251       }
252     }
253   }
254 }
255