Bug fixes, many leaks/errors fixed thanks to valgrind. Some filter
[speexdsp.git] / src / speexdec.c
1 /* Copyright (C) 2002 Jean-Marc Valin 
2    File: speexdec.c
3
4    This library is free software; you can redistribute it and/or
5    modify it under the terms of the GNU Lesser General Public
6    License as published by the Free Software Foundation; either
7    version 2.1 of the License, or (at your option) any later version.
8    
9    This library is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12    Lesser General Public License for more details.
13    
14    You should have received a copy of the GNU Lesser General Public
15    License along with this library; if not, write to the Free Software
16    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17 */
18
19 #include <stdio.h>
20 #include <unistd.h>
21 #include <getopt.h>
22 #include <stdlib.h>
23 #include <string.h>
24
25 #include "speex.h"
26 #include "ogg/ogg.h"
27
28 #ifdef HAVE_SYS_SOUNDCARD_H
29 #include <sys/soundcard.h>
30 #include <sys/types.h>
31 #include <sys/stat.h>
32 #include <fcntl.h>
33 #include <sys/ioctl.h>
34 #endif
35
36 #include <string.h>
37 #include "wav_io.h"
38 #include "speex_header.h"
39 #include "misc.h"
40
41 #define MAX_FRAME_SIZE 2000
42
43 FILE *out_file_open(char *outFile, int rate)
44 {
45    FILE *fout;
46    /*Open output file*/
47    if (strlen(outFile)==0)
48    {
49 #ifdef HAVE_SYS_SOUNDCARD_H
50       int audio_fd, format, stereo;
51       audio_fd=open("/dev/dsp", O_WRONLY);
52       
53       format=AFMT_S16_LE;
54       if (ioctl(audio_fd, SNDCTL_DSP_SETFMT, &format)==-1)
55       {
56          perror("SNDCTL_DSP_SETFMT");
57          close(audio_fd);
58          exit(1);
59       }
60       
61       stereo=0;
62       if (ioctl(audio_fd, SNDCTL_DSP_STEREO, &stereo)==-1)
63       {
64          perror("SNDCTL_DSP_STEREO");
65          close(audio_fd);
66          exit(1);
67       }
68       if (stereo!=0)
69       {
70          fprintf (stderr, "Cannot set mono mode\n");
71          exit(1);
72       }
73
74       if (ioctl(audio_fd, SNDCTL_DSP_SPEED, &rate)==-1)
75       {
76          perror("SNDCTL_DSP_SPEED");
77          close(audio_fd);
78          exit(1);
79       }
80       fout = fdopen(audio_fd, "w");
81 #else
82       fprintf (stderr, "No soundcard support\n");
83       exit(1);
84 #endif
85    } else {
86       if (strcmp(outFile,"-")==0)
87          fout=stdout;
88       else 
89       {
90          fout = fopen(outFile, "w");
91          if (!fout)
92          {
93             perror(outFile);
94             exit(1);
95          }
96          if (strcmp(outFile+strlen(outFile)-4,".wav")==0)
97             write_wav_header(fout, rate, 1, 0, 0);
98       }
99    }
100    return fout;
101 }
102
103 void usage()
104 {
105
106    fprintf (stderr, "Speex decoder version " VERSION "\n");
107    fprintf (stderr, "\n");
108    fprintf (stderr, "usage: speexdec [options] input_file.spx\n");
109    fprintf (stderr, "       speexdec [options] input_file.spx output_file.wav\n");
110    fprintf (stderr, "\n");
111    fprintf (stderr, "input_file can be:\n");
112    fprintf (stderr, "  filename.spx          regular Speex file\n");
113    fprintf (stderr, "  -                     stdin\n");
114    fprintf (stderr, "\n");  
115    fprintf (stderr, "output_file can be:\n");
116    fprintf (stderr, "  filename.wav          wav file\n");
117    fprintf (stderr, "  filename.*            raw PCM file (any extension other that .wav)\n");
118    fprintf (stderr, "  -                     stdout\n");
119    fprintf (stderr, "  (nothing)             will be played to soundcard\n");
120    fprintf (stderr, "\n");  
121    fprintf (stderr, "options:\n");
122    fprintf (stderr, "  --enh                 Enable perceptual enhancement\n");
123    fprintf (stderr, "  --no-enh              Disable perceptual enhancement (default FOR NOW)\n");
124    fprintf (stderr, "  -V                    Verbose mode (show bit-rate)\n"); 
125    fprintf (stderr, "  --help       -h       This help\n");
126    fprintf (stderr, "  --version    -v       Version information\n");
127    fprintf (stderr, "  --pf                  Deprecated, use --pf instead\n");
128    fprintf (stderr, "  --no-pf               Deprecated, use --no-pf instead\n");
129 }
130
131 void version()
132 {
133    fprintf (stderr, "Speex decoder version " VERSION "\n");
134 }
135
136 static void *process_header(ogg_packet *op, int enh_enabled, int *frame_size, int *rate, int *nframes)
137 {
138    void *st;
139    SpeexMode *mode;
140    SpeexHeader *header;
141    
142    header = speex_packet_to_header((char*)op->packet, op->bytes);
143    if (!header)
144    {
145       fprintf (stderr, "Cannot read header\n");
146       return NULL;
147    }
148    if (header->mode >= SPEEX_NB_MODES)
149    {
150       fprintf (stderr, "Mode number %d does not (any longer) exist in this version\n", 
151                header->mode);
152       return NULL;
153    }
154       
155    mode = speex_mode_list[header->mode];
156    
157    if (mode->bitstream_version < header->mode_bitstream_version)
158    {
159       fprintf (stderr, "The file was encoded with a newer version of Speex. You need to upgrade in order to play it.\n");
160       return NULL;
161    }
162    if (mode->bitstream_version > header->mode_bitstream_version) 
163    {
164       fprintf (stderr, "The file was encoded with an older version of Speex. You would need to downgrade the version in order to play it.\n");
165       return NULL;
166    }
167    
168    st = speex_decoder_init(mode);
169    speex_decoder_ctl(st, SPEEX_SET_ENH, &enh_enabled);
170    speex_decoder_ctl(st, SPEEX_GET_FRAME_SIZE, frame_size);
171    
172    *rate = header->rate;
173    *nframes = header->frames_per_packet;
174    
175    fprintf (stderr, "Decoding %d Hz audio using %s mode", 
176             *rate, mode->modeName);
177
178    if (header->vbr)
179       fprintf (stderr, " (VBR)\n");
180    else
181       fprintf(stderr, "\n");
182    /*fprintf (stderr, "Decoding %d Hz audio at %d bps using %s mode\n", 
183     *rate, mode->bitrate, mode->modeName);*/
184
185    free(header);
186    return st;
187 }
188
189 int main(int argc, char **argv)
190 {
191    int c;
192    int option_index = 0;
193    char *inFile, *outFile;
194    FILE *fin, *fout=NULL;
195    short out[MAX_FRAME_SIZE];
196    float output[MAX_FRAME_SIZE];
197    int frame_size=0;
198    void *st=NULL;
199    SpeexBits bits;
200    int packet_count=0;
201    int stream_init = 0;
202    struct option long_options[] =
203    {
204       {"help", no_argument, NULL, 0},
205       {"version", no_argument, NULL, 0},
206       {"enh", no_argument, NULL, 0},
207       {"no-enh", no_argument, NULL, 0},
208       {"pf", no_argument, NULL, 0},
209       {"no-pf", no_argument, NULL, 0},
210       {0, 0, 0, 0}
211    };
212    ogg_sync_state oy;
213    ogg_page       og;
214    ogg_packet     op;
215    ogg_stream_state os;
216    int enh_enabled;
217    int nframes=2;
218    int print_bitrate=0;
219    int close_in=0;
220
221    enh_enabled = 0;
222
223    /*Process options*/
224    while(1)
225    {
226       c = getopt_long (argc, argv, "hvV",
227                        long_options, &option_index);
228       if (c==-1)
229          break;
230       
231       switch(c)
232       {
233       case 0:
234          if (strcmp(long_options[option_index].name,"help")==0)
235          {
236             usage();
237             exit(0);
238          } else if (strcmp(long_options[option_index].name,"version")==0)
239          {
240             version();
241             exit(0);
242          } else if (strcmp(long_options[option_index].name,"enh")==0)
243          {
244             enh_enabled=1;
245          } else if (strcmp(long_options[option_index].name,"no-enh")==0)
246          {
247             enh_enabled=0;
248          } else if (strcmp(long_options[option_index].name,"pf")==0)
249          {
250             fprintf (stderr, "--pf is deprecated, use --enh instead\n");
251             enh_enabled=1;
252          } else if (strcmp(long_options[option_index].name,"no-pf")==0)
253          {
254             fprintf (stderr, "--no-pf is deprecated, use --no-enh instead\n");
255             enh_enabled=0;
256          }
257          break;
258       case 'h':
259          usage();
260          exit(0);
261          break;
262       case 'v':
263          version();
264          exit(0);
265          break;
266       case 'V':
267          print_bitrate=1;
268          break;
269       case '?':
270          usage();
271          exit(1);
272          break;
273       }
274    }
275    if (argc-optind!=2 && argc-optind!=1)
276    {
277       usage();
278       exit(1);
279    }
280    inFile=argv[optind];
281
282    if (argc-optind==2)
283       outFile=argv[optind+1];
284    else
285       outFile = "";
286    /*Open input file*/
287    if (strcmp(inFile, "-")==0)
288       fin=stdin;
289    else 
290    {
291       fin = fopen(inFile, "r");
292       if (!fin)
293       {
294          perror(inFile);
295          exit(1);
296       }
297       close_in=1;
298    }
299
300
301    /*Init Ogg data struct*/
302    ogg_sync_init(&oy);
303    
304    speex_bits_init(&bits);
305    /*Main decoding loop*/
306    while (1)
307    {
308       char *data;
309       int i, j, nb_read;
310       /*Get the ogg buffer for writing*/
311       data = ogg_sync_buffer(&oy, 200);
312       /*Read bitstream from input file*/
313       nb_read = fread(data, sizeof(char), 200, fin);      
314       ogg_sync_wrote(&oy, nb_read);
315
316       /*Loop for all complete pages we got (most likely only one)*/
317       while (ogg_sync_pageout(&oy, &og)==1)
318       {
319          if (stream_init == 0) {
320             ogg_stream_init(&os, ogg_page_serialno(&og));
321             stream_init = 1;
322          }
323          /*Add page to the bitstream*/
324          ogg_stream_pagein(&os, &og);
325          /*Extract all available packets*/
326          while (ogg_stream_packetout(&os, &op)==1)
327          {
328             /*If first packet, process as Speex header*/
329             if (packet_count==0)
330             {
331                int rate;
332                st = process_header(&op, enh_enabled, &frame_size, &rate, &nframes);
333                if (!nframes)
334                   nframes=1;
335                if (!st)
336                   exit(1);
337                fout = out_file_open(outFile, rate);
338
339             } else if (packet_count==1){
340                fprintf (stderr, "File comments: ");
341                fwrite(op.packet, 1, op.bytes, stderr);
342                fprintf (stderr, "\n");
343             } else {
344
345                /*End of stream condition*/
346                if (op.e_o_s)
347                   break;
348                /*Copy Ogg packet to Speex bitstream*/
349                speex_bits_read_from(&bits, (char*)op.packet, op.bytes);
350                for (j=0;j<nframes;j++)
351                {
352                   /*Decode frame*/
353                   speex_decode(st, &bits, output, 0);
354                
355                   if (print_bitrate) {
356                      int tmp;
357                      char ch=13;
358                      speex_decoder_ctl(st, SPEEX_GET_BITRATE, &tmp);
359                      fputc (ch, stderr);
360                      fprintf (stderr, "Bitrate is use: %d bps     ", tmp);
361                   }
362                   /*PCM saturation (just in case)*/
363                   for (i=0;i<frame_size;i++)
364                   {
365                      if (output[i]>32000)
366                         output[i]=32000;
367                      else if (output[i]<-32000)
368                         output[i]=-32000;
369                   }
370                   /*Convert to short and save to output file*/
371                   for (i=0;i<frame_size;i++)
372                      out[i]=(short)le_short(output[i]);
373                   fwrite(out, sizeof(short), frame_size, fout);
374                }
375             }
376             packet_count++;
377          }
378       }
379       if (feof(fin))
380          break;
381
382    }
383
384    if (st)
385       speex_decoder_destroy(st);
386    speex_bits_destroy(&bits);
387    ogg_sync_clear(&oy);
388    ogg_stream_clear(&os);
389
390    if (close_in)
391       fclose(fin);
392    fclose(fout);
393    return 1;
394 }