fa507d0eeb104e011b0c6f4aeeff3582717ffb2c
[opus.git] / src / opus_encoder.c
1 /* Copyright (c) 2010 Xiph.Org Foundation, Skype Limited
2    Written by Jean-Marc Valin and Koen Vos */
3 /*
4    Redistribution and use in source and binary forms, with or without
5    modification, are permitted provided that the following conditions
6    are met:
7
8    - Redistributions of source code must retain the above copyright
9    notice, this list of conditions and the following disclaimer.
10
11    - Redistributions in binary form must reproduce the above copyright
12    notice, this list of conditions and the following disclaimer in the
13    documentation and/or other materials provided with the distribution.
14
15    - Neither the name of the Xiph.org Foundation nor the names of its
16    contributors may be used to endorse or promote products derived from
17    this software without specific prior written permission.
18
19    THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
20    ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
21    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
22    A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE FOUNDATION OR
23    CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
24    EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
25    PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
26    PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
27    LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
28    NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
29    SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
30 */
31
32 #ifdef HAVE_CONFIG_H
33 #include "config.h"
34 #endif
35
36 #include <stdlib.h>
37 #include <stdio.h>
38 #include <stdarg.h>
39 #include "opus_encoder.h"
40 #include "entenc.h"
41 #include "modes.h"
42 #include "SKP_Silk_SDK_API.h"
43
44 OpusEncoder *opus_encoder_create(int Fs, int channels)
45 {
46     char *raw_state;
47         OpusEncoder *st;
48         int ret, silkEncSizeBytes, celtEncSizeBytes;
49     SKP_SILK_SDK_EncControlStruct encControl;
50
51     /* Create SILK encoder */
52     ret = SKP_Silk_SDK_Get_Encoder_Size( &silkEncSizeBytes );
53     if( ret ) {
54         /* Handle error */
55     }
56     celtEncSizeBytes = celt_encoder_get_size(channels);
57     raw_state = calloc(sizeof(OpusEncoder)+silkEncSizeBytes+celtEncSizeBytes, 1);
58     st = (OpusEncoder*)raw_state;
59     st->silk_enc = (void*)(raw_state+sizeof(OpusEncoder));
60     st->celt_enc = (CELTEncoder*)(raw_state+sizeof(OpusEncoder)+silkEncSizeBytes);
61     st->channels = channels;
62
63     st->Fs = Fs;
64
65     /*encControl.API_sampleRate        = st->Fs;
66     encControl.packetLossPercentage  = 0;
67     encControl.useInBandFEC          = 0;
68     encControl.useDTX                = 0;
69     encControl.complexity            = 2;*/
70     ret = SKP_Silk_SDK_InitEncoder( st->silk_enc, &encControl );
71     if( ret ) {
72         /* Handle error */
73     }
74
75     /* Create CELT encoder */
76         /* Initialize CELT encoder */
77         st->celt_enc = celt_encoder_init(st->celt_enc, Fs, channels, NULL);
78
79         st->mode = MODE_HYBRID;
80         st->bandwidth = BANDWIDTH_FULLBAND;
81         st->vbr_rate = 0;
82
83         return st;
84 }
85
86 int opus_encode(OpusEncoder *st, const short *pcm, int frame_size,
87                 unsigned char *data, int bytes_per_packet)
88 {
89     int i;
90         int ret=0;
91         SKP_int32 nBytes;
92         ec_enc enc;
93         ec_byte_buffer buf;
94         SKP_SILK_SDK_EncControlStruct encControl;
95         int framerate, period;
96
97         bytes_per_packet -= 1;
98         data += 1;
99         ec_byte_writeinit_buffer(&buf, data, bytes_per_packet);
100         ec_enc_init(&enc,&buf);
101
102         if (st->mode != MODE_CELT_ONLY)
103         {
104             /* Set Encoder parameters */
105             encControl.API_sampleRate        = st->Fs;
106             encControl.packetLossPercentage  = 2;
107             encControl.useInBandFEC          = 0;
108             encControl.useDTX                = 0;
109             encControl.complexity            = 2;
110
111             if (st->vbr_rate != 0)
112             encControl.bitRate = (st->vbr_rate+6000)/2;
113             else {
114                 encControl.bitRate = (bytes_per_packet*8*(celt_int32)st->Fs/frame_size+6000)/2;
115                 if (st->Fs  == 100 * frame_size)
116                     encControl.bitRate -= 5000;
117             }
118             encControl.payloadSize_ms = 1000 * frame_size / st->Fs;
119
120             if (st->mode == MODE_HYBRID)
121                 encControl.minInternalSampleRate = 16000;
122             else
123                 encControl.minInternalSampleRate = 8000;
124
125             if (st->bandwidth == BANDWIDTH_NARROWBAND)
126                 encControl.maxInternalSampleRate = 8000;
127             else if (st->bandwidth == BANDWIDTH_MEDIUMBAND)
128                 encControl.maxInternalSampleRate = 12000;
129             else
130                 encControl.maxInternalSampleRate = 16000;
131
132             /* Call SILK encoder for the low band */
133             nBytes = bytes_per_packet;
134             ret = SKP_Silk_SDK_Encode( st->silk_enc, &encControl, pcm, frame_size, &enc, &nBytes );
135             if( ret ) {
136                 fprintf (stderr, "SILK encode error %d\n", ret);
137                 /* Handle error */
138             }
139             ret = (ec_enc_tell(&enc, 0)+7)>>3;
140         }
141
142         if (st->mode == MODE_HYBRID)
143         {
144             /* This should be adjusted based on the SILK bandwidth */
145             celt_encoder_ctl(st->celt_enc, CELT_SET_START_BAND(17));
146         } else {
147         celt_encoder_ctl(st->celt_enc, CELT_SET_START_BAND(0));
148         }
149
150         if (st->mode != MODE_SILK_ONLY && st->bandwidth > BANDWIDTH_WIDEBAND)
151         {
152                 int endband;
153             short pcm_buf[960*2];
154
155             switch(st->bandwidth)
156             {
157             case BANDWIDTH_NARROWBAND:
158                 endband = 13;
159                 break;
160             case BANDWIDTH_WIDEBAND:
161                 endband = 17;
162                 break;
163             case BANDWIDTH_SUPERWIDEBAND:
164                 endband = 19;
165                 break;
166             case BANDWIDTH_FULLBAND:
167                 endband = 21;
168                 break;
169             }
170             celt_encoder_ctl(st->celt_enc, CELT_SET_END_BAND(endband));
171
172             for (i=0;i<ENCODER_DELAY_COMPENSATION*st->channels;i++)
173                 pcm_buf[i] = st->delay_buffer[i];
174         for (;i<frame_size*st->channels;i++)
175             pcm_buf[i] = pcm[i-ENCODER_DELAY_COMPENSATION*st->channels];
176
177         celt_encoder_ctl(st->celt_enc, CELT_SET_PREDICTION(1));
178
179         if (st->vbr_rate != 0)
180         {
181             int tmp = (st->vbr_rate-6000)/2;
182             tmp = ((ec_enc_tell(&enc, 0)+4)>>3) + tmp * frame_size/(8*st->Fs);
183             if (tmp <= bytes_per_packet)
184                 bytes_per_packet = tmp;
185             ec_byte_shrink(&buf, bytes_per_packet);
186         }
187             /* Encode high band with CELT */
188             ret = celt_encode_with_ec(st->celt_enc, pcm_buf, frame_size, NULL, bytes_per_packet, &enc);
189             for (i=0;i<ENCODER_DELAY_COMPENSATION*st->channels;i++)
190                 st->delay_buffer[i] = pcm[frame_size*st->channels-ENCODER_DELAY_COMPENSATION*st->channels+i];
191         } else {
192             ec_enc_done(&enc);
193         }
194
195         /* Signalling the mode in the first byte */
196         data--;
197         framerate = st->Fs/frame_size;
198         period = 0;
199         while (framerate < 400)
200         {
201             framerate <<= 1;
202             period++;
203         }
204     if (st->mode == MODE_SILK_ONLY)
205     {
206         data[0] = (st->bandwidth-BANDWIDTH_NARROWBAND)<<5;
207         data[0] |= (period-2)<<3;
208     } else if (st->mode == MODE_CELT_ONLY)
209     {
210         int tmp = st->bandwidth-BANDWIDTH_MEDIUMBAND;
211         if (tmp < 0)
212             tmp = 0;
213         data[0] = 0x80;
214         data[0] |= tmp << 5;
215         data[0] |= period<<3;
216     } else /* Opus */
217     {
218         data[0] = 0x60;
219         data[0] |= (st->bandwidth-BANDWIDTH_SUPERWIDEBAND)<<4;
220         data[0] |= (period-2)<<3;
221     }
222     /*printf ("%x\n", (int)data[0]);*/
223
224     return ret+1;
225 }
226
227 void opus_encoder_ctl(OpusEncoder *st, int request, ...)
228 {
229     va_list ap;
230
231     va_start(ap, request);
232
233     switch (request)
234     {
235         case OPUS_SET_MODE_REQUEST:
236         {
237             int value = va_arg(ap, int);
238             st->mode = value;
239         }
240         break;
241         case OPUS_GET_MODE_REQUEST:
242         {
243             int *value = va_arg(ap, int*);
244             *value = st->mode;
245         }
246         break;
247         case OPUS_SET_BANDWIDTH_REQUEST:
248         {
249             int value = va_arg(ap, int);
250             st->bandwidth = value;
251         }
252         break;
253         case OPUS_GET_BANDWIDTH_REQUEST:
254         {
255             int *value = va_arg(ap, int*);
256             *value = st->bandwidth;
257         }
258         break;
259         case OPUS_SET_VBR_RATE_REQUEST:
260         {
261             int value = va_arg(ap, int);
262             st->vbr_rate = value;
263         }
264         break;
265         case OPUS_GET_VBR_RATE_REQUEST:
266         {
267             int *value = va_arg(ap, int*);
268             *value = st->vbr_rate;
269         }
270         break;
271         default:
272             fprintf(stderr, "unknown opus_encoder_ctl() request: %d", request);
273             break;
274     }
275
276     va_end(ap);
277 }
278
279 void opus_encoder_destroy(OpusEncoder *st)
280 {
281         free(st);
282 }
283