Allow forcing of narrowband decoding for wideband files and vice versa
[speexdsp.git] / src / speexdec.c
1 /* Copyright (C) 2002 Jean-Marc Valin 
2    File: speexdec.c
3
4    This library is free software; you can redistribute it and/or
5    modify it under the terms of the GNU Lesser General Public
6    License as published by the Free Software Foundation; either
7    version 2.1 of the License, or (at your option) any later version.
8    
9    This library is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12    Lesser General Public License for more details.
13    
14    You should have received a copy of the GNU Lesser General Public
15    License along with this library; if not, write to the Free Software
16    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17 */
18
19 #include <stdio.h>
20 #include <unistd.h>
21 #include <getopt.h>
22 #include <stdlib.h>
23 #include <string.h>
24
25 #include "speex.h"
26 #include "ogg/ogg.h"
27
28 #ifdef HAVE_SYS_SOUNDCARD_H
29 #include <sys/soundcard.h>
30 #include <sys/types.h>
31 #include <sys/stat.h>
32 #include <fcntl.h>
33 #include <sys/ioctl.h>
34 #endif
35
36 #include <string.h>
37 #include "wav_io.h"
38 #include "speex_header.h"
39 #include "misc.h"
40
41 #define MAX_FRAME_SIZE 2000
42
43 FILE *out_file_open(char *outFile, int rate)
44 {
45    FILE *fout;
46    /*Open output file*/
47    if (strlen(outFile)==0)
48    {
49 #ifdef HAVE_SYS_SOUNDCARD_H
50       int audio_fd, format, stereo;
51       audio_fd=open("/dev/dsp", O_WRONLY);
52       
53       format=AFMT_S16_LE;
54       if (ioctl(audio_fd, SNDCTL_DSP_SETFMT, &format)==-1)
55       {
56          perror("SNDCTL_DSP_SETFMT");
57          close(audio_fd);
58          exit(1);
59       }
60       
61       stereo=0;
62       if (ioctl(audio_fd, SNDCTL_DSP_STEREO, &stereo)==-1)
63       {
64          perror("SNDCTL_DSP_STEREO");
65          close(audio_fd);
66          exit(1);
67       }
68       if (stereo!=0)
69       {
70          fprintf (stderr, "Cannot set mono mode\n");
71          exit(1);
72       }
73
74       if (ioctl(audio_fd, SNDCTL_DSP_SPEED, &rate)==-1)
75       {
76          perror("SNDCTL_DSP_SPEED");
77          close(audio_fd);
78          exit(1);
79       }
80       fout = fdopen(audio_fd, "w");
81 #else
82       fprintf (stderr, "No soundcard support\n");
83       exit(1);
84 #endif
85    } else {
86       if (strcmp(outFile,"-")==0)
87          fout=stdout;
88       else 
89       {
90          fout = fopen(outFile, "w");
91          if (!fout)
92          {
93             perror(outFile);
94             exit(1);
95          }
96          if (strcmp(outFile+strlen(outFile)-4,".wav")==0)
97             write_wav_header(fout, rate, 1, 0, 0);
98       }
99    }
100    return fout;
101 }
102
103 void usage()
104 {
105
106    fprintf (stderr, "Speex decoder version " VERSION "\n");
107    fprintf (stderr, "\n");
108    fprintf (stderr, "usage: speexdec [options] input_file.spx\n");
109    fprintf (stderr, "       speexdec [options] input_file.spx output_file.wav\n");
110    fprintf (stderr, "\n");
111    fprintf (stderr, "input_file can be:\n");
112    fprintf (stderr, "  filename.spx          regular Speex file\n");
113    fprintf (stderr, "  -                     stdin\n");
114    fprintf (stderr, "\n");  
115    fprintf (stderr, "output_file can be:\n");
116    fprintf (stderr, "  filename.wav          wav file\n");
117    fprintf (stderr, "  filename.*            raw PCM file (any extension other that .wav)\n");
118    fprintf (stderr, "  -                     stdout\n");
119    fprintf (stderr, "  (nothing)             will be played to soundcard\n");
120    fprintf (stderr, "\n");  
121    fprintf (stderr, "options:\n");
122    fprintf (stderr, "  --enh                 Enable perceptual enhancement\n");
123    fprintf (stderr, "  --no-enh              Disable perceptual enhancement (default FOR NOW)\n");
124    fprintf (stderr, "  -V                    Verbose mode (show bit-rate)\n"); 
125    fprintf (stderr, "  --help       -h       This help\n");
126    fprintf (stderr, "  --version    -v       Version information\n");
127    fprintf (stderr, "  --pf                  Deprecated, use --pf instead\n");
128    fprintf (stderr, "  --no-pf               Deprecated, use --no-pf instead\n");
129 }
130
131 void version()
132 {
133    fprintf (stderr, "Speex decoder version " VERSION "\n");
134 }
135
136 static void *process_header(ogg_packet *op, int enh_enabled, int *frame_size, int *rate, int *nframes, int forceMode)
137 {
138    void *st;
139    SpeexMode *mode;
140    SpeexHeader *header;
141    int modeID;
142    
143    header = speex_packet_to_header((char*)op->packet, op->bytes);
144    if (!header)
145    {
146       fprintf (stderr, "Cannot read header\n");
147       return NULL;
148    }
149    if (header->mode >= SPEEX_NB_MODES)
150    {
151       fprintf (stderr, "Mode number %d does not (any longer) exist in this version\n", 
152                header->mode);
153       return NULL;
154    }
155       
156    modeID = header->mode;
157    if (forceMode!=-1)
158       modeID = forceMode;
159    mode = speex_mode_list[modeID];
160    
161    if (mode->bitstream_version < header->mode_bitstream_version)
162    {
163       fprintf (stderr, "The file was encoded with a newer version of Speex. You need to upgrade in order to play it.\n");
164       return NULL;
165    }
166    if (mode->bitstream_version > header->mode_bitstream_version) 
167    {
168       fprintf (stderr, "The file was encoded with an older version of Speex. You would need to downgrade the version in order to play it.\n");
169       return NULL;
170    }
171    
172    st = speex_decoder_init(mode);
173    speex_decoder_ctl(st, SPEEX_SET_ENH, &enh_enabled);
174    speex_decoder_ctl(st, SPEEX_GET_FRAME_SIZE, frame_size);
175    
176    *rate = header->rate;
177    *nframes = header->frames_per_packet;
178    
179    fprintf (stderr, "Decoding %d Hz audio using %s mode", 
180             *rate, mode->modeName);
181
182    if (header->vbr)
183       fprintf (stderr, " (VBR)\n");
184    else
185       fprintf(stderr, "\n");
186    /*fprintf (stderr, "Decoding %d Hz audio at %d bps using %s mode\n", 
187     *rate, mode->bitrate, mode->modeName);*/
188
189    free(header);
190    return st;
191 }
192
193 int main(int argc, char **argv)
194 {
195    int c;
196    int option_index = 0;
197    char *inFile, *outFile;
198    FILE *fin, *fout=NULL;
199    short out[MAX_FRAME_SIZE];
200    float output[MAX_FRAME_SIZE];
201    int frame_size=0;
202    void *st=NULL;
203    SpeexBits bits;
204    int packet_count=0;
205    int stream_init = 0;
206    struct option long_options[] =
207    {
208       {"help", no_argument, NULL, 0},
209       {"version", no_argument, NULL, 0},
210       {"enh", no_argument, NULL, 0},
211       {"no-enh", no_argument, NULL, 0},
212       {"pf", no_argument, NULL, 0},
213       {"no-pf", no_argument, NULL, 0},
214       {"force-nb", no_argument, NULL, 0},
215       {"force-wb", no_argument, NULL, 0},
216       {0, 0, 0, 0}
217    };
218    ogg_sync_state oy;
219    ogg_page       og;
220    ogg_packet     op;
221    ogg_stream_state os;
222    int enh_enabled;
223    int nframes=2;
224    int print_bitrate=0;
225    int close_in=0;
226    int eos=0;
227    int forceMode=-1;
228
229    enh_enabled = 0;
230
231    /*Process options*/
232    while(1)
233    {
234       c = getopt_long (argc, argv, "hvV",
235                        long_options, &option_index);
236       if (c==-1)
237          break;
238       
239       switch(c)
240       {
241       case 0:
242          if (strcmp(long_options[option_index].name,"help")==0)
243          {
244             usage();
245             exit(0);
246          } else if (strcmp(long_options[option_index].name,"version")==0)
247          {
248             version();
249             exit(0);
250          } else if (strcmp(long_options[option_index].name,"enh")==0)
251          {
252             enh_enabled=1;
253          } else if (strcmp(long_options[option_index].name,"no-enh")==0)
254          {
255             enh_enabled=0;
256          } else if (strcmp(long_options[option_index].name,"pf")==0)
257          {
258             fprintf (stderr, "--pf is deprecated, use --enh instead\n");
259             enh_enabled=1;
260          } else if (strcmp(long_options[option_index].name,"no-pf")==0)
261          {
262             fprintf (stderr, "--no-pf is deprecated, use --no-enh instead\n");
263             enh_enabled=0;
264          } else if (strcmp(long_options[option_index].name,"force-nb")==0)
265          {
266             forceMode=0;
267          } else if (strcmp(long_options[option_index].name,"force-wb")==0)
268          {
269             forceMode=1;
270          }
271          break;
272       case 'h':
273          usage();
274          exit(0);
275          break;
276       case 'v':
277          version();
278          exit(0);
279          break;
280       case 'V':
281          print_bitrate=1;
282          break;
283       case '?':
284          usage();
285          exit(1);
286          break;
287       }
288    }
289    if (argc-optind!=2 && argc-optind!=1)
290    {
291       usage();
292       exit(1);
293    }
294    inFile=argv[optind];
295
296    if (argc-optind==2)
297       outFile=argv[optind+1];
298    else
299       outFile = "";
300    /*Open input file*/
301    if (strcmp(inFile, "-")==0)
302       fin=stdin;
303    else 
304    {
305       fin = fopen(inFile, "r");
306       if (!fin)
307       {
308          perror(inFile);
309          exit(1);
310       }
311       close_in=1;
312    }
313
314
315    /*Init Ogg data struct*/
316    ogg_sync_init(&oy);
317    
318    speex_bits_init(&bits);
319    /*Main decoding loop*/
320    while (1)
321    {
322       char *data;
323       int i, j, nb_read;
324       /*Get the ogg buffer for writing*/
325       data = ogg_sync_buffer(&oy, 200);
326       /*Read bitstream from input file*/
327       nb_read = fread(data, sizeof(char), 200, fin);      
328       ogg_sync_wrote(&oy, nb_read);
329
330       /*Loop for all complete pages we got (most likely only one)*/
331       while (ogg_sync_pageout(&oy, &og)==1)
332       {
333          if (stream_init == 0) {
334             ogg_stream_init(&os, ogg_page_serialno(&og));
335             stream_init = 1;
336          }
337          /*Add page to the bitstream*/
338          ogg_stream_pagein(&os, &og);
339          /*Extract all available packets*/
340          while (!eos && ogg_stream_packetout(&os, &op)==1)
341          {
342             /*If first packet, process as Speex header*/
343             if (packet_count==0)
344             {
345                int rate;
346                st = process_header(&op, enh_enabled, &frame_size, &rate, &nframes, forceMode);
347                if (!nframes)
348                   nframes=1;
349                if (!st)
350                   exit(1);
351                fout = out_file_open(outFile, rate);
352
353             } else if (packet_count==1){
354                fprintf (stderr, "File comments: ");
355                fwrite(op.packet, 1, op.bytes, stderr);
356                fprintf (stderr, "\n");
357             } else {
358
359                /*End of stream condition*/
360                if (op.e_o_s)
361                   eos=1;
362
363                /*Copy Ogg packet to Speex bitstream*/
364                speex_bits_read_from(&bits, (char*)op.packet, op.bytes);
365                for (j=0;j<nframes;j++)
366                {
367                   /*Decode frame*/
368                   speex_decode(st, &bits, output, 0);
369                
370                   if (print_bitrate) {
371                      int tmp;
372                      char ch=13;
373                      speex_decoder_ctl(st, SPEEX_GET_BITRATE, &tmp);
374                      fputc (ch, stderr);
375                      fprintf (stderr, "Bitrate is use: %d bps     ", tmp);
376                   }
377                   /*PCM saturation (just in case)*/
378                   for (i=0;i<frame_size;i++)
379                   {
380                      if (output[i]>32000)
381                         output[i]=32000;
382                      else if (output[i]<-32000)
383                         output[i]=-32000;
384                   }
385                   /*Convert to short and save to output file*/
386                   for (i=0;i<frame_size;i++)
387                      out[i]=(short)le_short(output[i]);
388                   fwrite(out, sizeof(short), frame_size, fout);
389                }
390             }
391             packet_count++;
392          }
393       }
394       if (feof(fin))
395          break;
396
397    }
398
399    if (st)
400       speex_decoder_destroy(st);
401    speex_bits_destroy(&bits);
402    ogg_sync_clear(&oy);
403    ogg_stream_clear(&os);
404
405    if (close_in)
406       fclose(fin);
407    fclose(fout);
408    return 1;
409 }