Slight changes to Ogg packing: set granulepos to last sample (not first),
[speexdsp.git] / src / speexdec.c
1 /* Copyright (C) 2002 Jean-Marc Valin 
2    File: speexdec.c
3
4    This library is free software; you can redistribute it and/or
5    modify it under the terms of the GNU Lesser General Public
6    License as published by the Free Software Foundation; either
7    version 2.1 of the License, or (at your option) any later version.
8    
9    This library is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12    Lesser General Public License for more details.
13    
14    You should have received a copy of the GNU Lesser General Public
15    License along with this library; if not, write to the Free Software
16    Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
17 */
18
19 #include <stdio.h>
20 #include <unistd.h>
21 #include <getopt.h>
22 #include <stdlib.h>
23 #include <string.h>
24
25 #include "speex.h"
26 #include "ogg/ogg.h"
27
28 #ifdef HAVE_SYS_SOUNDCARD_H
29 #include <sys/soundcard.h>
30 #include <sys/types.h>
31 #include <sys/stat.h>
32 #include <fcntl.h>
33 #include <sys/ioctl.h>
34 #endif
35
36 #include <string.h>
37 #include "wav_io.h"
38 #include "speex_header.h"
39 #include "misc.h"
40
41 #define MAX_FRAME_SIZE 2000
42
43 FILE *out_file_open(char *outFile, int rate)
44 {
45    FILE *fout;
46    /*Open output file*/
47    if (strlen(outFile)==0)
48    {
49 #ifdef HAVE_SYS_SOUNDCARD_H
50       int audio_fd, format, stereo;
51       audio_fd=open("/dev/dsp", O_WRONLY);
52       
53       format=AFMT_S16_LE;
54       if (ioctl(audio_fd, SNDCTL_DSP_SETFMT, &format)==-1)
55       {
56          perror("SNDCTL_DSP_SETFMT");
57          close(audio_fd);
58          exit(1);
59       }
60       
61       stereo=0;
62       if (ioctl(audio_fd, SNDCTL_DSP_STEREO, &stereo)==-1)
63       {
64          perror("SNDCTL_DSP_STEREO");
65          close(audio_fd);
66          exit(1);
67       }
68       if (stereo!=0)
69       {
70          fprintf (stderr, "Cannot set mono mode\n");
71          exit(1);
72       }
73
74       if (ioctl(audio_fd, SNDCTL_DSP_SPEED, &rate)==-1)
75       {
76          perror("SNDCTL_DSP_SPEED");
77          close(audio_fd);
78          exit(1);
79       }
80       fout = fdopen(audio_fd, "w");
81 #else
82       fprintf (stderr, "No soundcard support\n");
83       exit(1);
84 #endif
85    } else {
86       if (strcmp(outFile,"-")==0)
87          fout=stdout;
88       else 
89       {
90          fout = fopen(outFile, "w");
91          if (!fout)
92          {
93             perror(outFile);
94             exit(1);
95          }
96          if (strcmp(outFile+strlen(outFile)-4,".wav")==0)
97             write_wav_header(fout, rate, 1, 0, 0);
98       }
99    }
100    return fout;
101 }
102
103 void usage()
104 {
105
106    fprintf (stderr, "Speex decoder version " VERSION "\n");
107    fprintf (stderr, "\n");
108    fprintf (stderr, "usage: speexdec [options] input_file.spx\n");
109    fprintf (stderr, "       speexdec [options] input_file.spx output_file.wav\n");
110    fprintf (stderr, "\n");
111    fprintf (stderr, "input_file can be:\n");
112    fprintf (stderr, "  filename.spx          regular Speex file\n");
113    fprintf (stderr, "  -                     stdin\n");
114    fprintf (stderr, "\n");  
115    fprintf (stderr, "output_file can be:\n");
116    fprintf (stderr, "  filename.wav          wav file\n");
117    fprintf (stderr, "  filename.*            raw PCM file (any extension other that .wav)\n");
118    fprintf (stderr, "  -                     stdout\n");
119    fprintf (stderr, "  (nothing)             will be played to soundcard\n");
120    fprintf (stderr, "\n");  
121    fprintf (stderr, "options:\n");
122    fprintf (stderr, "  --enh                 Enable perceptual enhancement\n");
123    fprintf (stderr, "  --no-enh              Disable perceptual enhancement (default FOR NOW)\n");
124    fprintf (stderr, "  -V                    Verbose mode (show bit-rate)\n"); 
125    fprintf (stderr, "  --help       -h       This help\n");
126    fprintf (stderr, "  --version    -v       Version information\n");
127    fprintf (stderr, "  --pf                  Deprecated, use --pf instead\n");
128    fprintf (stderr, "  --no-pf               Deprecated, use --no-pf instead\n");
129 }
130
131 void version()
132 {
133    fprintf (stderr, "Speex decoder version " VERSION "\n");
134 }
135
136 static void *process_header(ogg_packet *op, int enh_enabled, int *frame_size, int *rate, int *nframes)
137 {
138    void *st;
139    SpeexMode *mode;
140    SpeexHeader *header;
141    
142    header = speex_packet_to_header((char*)op->packet, op->bytes);
143    if (!header)
144    {
145       fprintf (stderr, "Cannot read header\n");
146       return NULL;
147    }
148    if (header->mode >= SPEEX_NB_MODES)
149    {
150       fprintf (stderr, "Mode number %d does not (any longer) exist in this version\n", 
151                header->mode);
152       return NULL;
153    }
154       
155    mode = speex_mode_list[header->mode];
156    
157    if (mode->bitstream_version < header->mode_bitstream_version)
158    {
159       fprintf (stderr, "The file was encoded with a newer version of Speex. You need to upgrade in order to play it.\n");
160       return NULL;
161    }
162    if (mode->bitstream_version > header->mode_bitstream_version) 
163    {
164       fprintf (stderr, "The file was encoded with an older version of Speex. You would need to downgrade the version in order to play it.\n");
165       return NULL;
166    }
167    
168    st = speex_decoder_init(mode);
169    speex_decoder_ctl(st, SPEEX_SET_ENH, &enh_enabled);
170    speex_decoder_ctl(st, SPEEX_GET_FRAME_SIZE, frame_size);
171    
172    *rate = header->rate;
173    *nframes = header->frames_per_packet;
174    
175    fprintf (stderr, "Decoding %d Hz audio using %s mode", 
176             *rate, mode->modeName);
177
178    if (header->vbr)
179       fprintf (stderr, " (VBR)\n");
180    else
181       fprintf(stderr, "\n");
182    /*fprintf (stderr, "Decoding %d Hz audio at %d bps using %s mode\n", 
183     *rate, mode->bitrate, mode->modeName);*/
184
185    free(header);
186    return st;
187 }
188
189 int main(int argc, char **argv)
190 {
191    int c;
192    int option_index = 0;
193    char *inFile, *outFile;
194    FILE *fin, *fout=NULL;
195    short out[MAX_FRAME_SIZE];
196    float output[MAX_FRAME_SIZE];
197    int frame_size=0;
198    void *st=NULL;
199    SpeexBits bits;
200    int packet_count=0;
201    int stream_init = 0;
202    struct option long_options[] =
203    {
204       {"help", no_argument, NULL, 0},
205       {"version", no_argument, NULL, 0},
206       {"enh", no_argument, NULL, 0},
207       {"no-enh", no_argument, NULL, 0},
208       {"pf", no_argument, NULL, 0},
209       {"no-pf", no_argument, NULL, 0},
210       {0, 0, 0, 0}
211    };
212    ogg_sync_state oy;
213    ogg_page       og;
214    ogg_packet     op;
215    ogg_stream_state os;
216    int enh_enabled;
217    int nframes=2;
218    int print_bitrate=0;
219    int close_in=0;
220    int eos=0;
221
222    enh_enabled = 0;
223
224    /*Process options*/
225    while(1)
226    {
227       c = getopt_long (argc, argv, "hvV",
228                        long_options, &option_index);
229       if (c==-1)
230          break;
231       
232       switch(c)
233       {
234       case 0:
235          if (strcmp(long_options[option_index].name,"help")==0)
236          {
237             usage();
238             exit(0);
239          } else if (strcmp(long_options[option_index].name,"version")==0)
240          {
241             version();
242             exit(0);
243          } else if (strcmp(long_options[option_index].name,"enh")==0)
244          {
245             enh_enabled=1;
246          } else if (strcmp(long_options[option_index].name,"no-enh")==0)
247          {
248             enh_enabled=0;
249          } else if (strcmp(long_options[option_index].name,"pf")==0)
250          {
251             fprintf (stderr, "--pf is deprecated, use --enh instead\n");
252             enh_enabled=1;
253          } else if (strcmp(long_options[option_index].name,"no-pf")==0)
254          {
255             fprintf (stderr, "--no-pf is deprecated, use --no-enh instead\n");
256             enh_enabled=0;
257          }
258          break;
259       case 'h':
260          usage();
261          exit(0);
262          break;
263       case 'v':
264          version();
265          exit(0);
266          break;
267       case 'V':
268          print_bitrate=1;
269          break;
270       case '?':
271          usage();
272          exit(1);
273          break;
274       }
275    }
276    if (argc-optind!=2 && argc-optind!=1)
277    {
278       usage();
279       exit(1);
280    }
281    inFile=argv[optind];
282
283    if (argc-optind==2)
284       outFile=argv[optind+1];
285    else
286       outFile = "";
287    /*Open input file*/
288    if (strcmp(inFile, "-")==0)
289       fin=stdin;
290    else 
291    {
292       fin = fopen(inFile, "r");
293       if (!fin)
294       {
295          perror(inFile);
296          exit(1);
297       }
298       close_in=1;
299    }
300
301
302    /*Init Ogg data struct*/
303    ogg_sync_init(&oy);
304    
305    speex_bits_init(&bits);
306    /*Main decoding loop*/
307    while (1)
308    {
309       char *data;
310       int i, j, nb_read;
311       /*Get the ogg buffer for writing*/
312       data = ogg_sync_buffer(&oy, 200);
313       /*Read bitstream from input file*/
314       nb_read = fread(data, sizeof(char), 200, fin);      
315       ogg_sync_wrote(&oy, nb_read);
316
317       /*Loop for all complete pages we got (most likely only one)*/
318       while (ogg_sync_pageout(&oy, &og)==1)
319       {
320          if (stream_init == 0) {
321             ogg_stream_init(&os, ogg_page_serialno(&og));
322             stream_init = 1;
323          }
324          /*Add page to the bitstream*/
325          ogg_stream_pagein(&os, &og);
326          /*Extract all available packets*/
327          while (!eos && ogg_stream_packetout(&os, &op)==1)
328          {
329             /*If first packet, process as Speex header*/
330             if (packet_count==0)
331             {
332                int rate;
333                st = process_header(&op, enh_enabled, &frame_size, &rate, &nframes);
334                if (!nframes)
335                   nframes=1;
336                if (!st)
337                   exit(1);
338                fout = out_file_open(outFile, rate);
339
340             } else if (packet_count==1){
341                fprintf (stderr, "File comments: ");
342                fwrite(op.packet, 1, op.bytes, stderr);
343                fprintf (stderr, "\n");
344             } else {
345
346                /*End of stream condition*/
347                if (op.e_o_s)
348                   eos=1;
349
350                /*Copy Ogg packet to Speex bitstream*/
351                speex_bits_read_from(&bits, (char*)op.packet, op.bytes);
352                for (j=0;j<nframes;j++)
353                {
354                   /*Decode frame*/
355                   speex_decode(st, &bits, output, 0);
356                
357                   if (print_bitrate) {
358                      int tmp;
359                      char ch=13;
360                      speex_decoder_ctl(st, SPEEX_GET_BITRATE, &tmp);
361                      fputc (ch, stderr);
362                      fprintf (stderr, "Bitrate is use: %d bps     ", tmp);
363                   }
364                   /*PCM saturation (just in case)*/
365                   for (i=0;i<frame_size;i++)
366                   {
367                      if (output[i]>32000)
368                         output[i]=32000;
369                      else if (output[i]<-32000)
370                         output[i]=-32000;
371                   }
372                   /*Convert to short and save to output file*/
373                   for (i=0;i<frame_size;i++)
374                      out[i]=(short)le_short(output[i]);
375                   fwrite(out, sizeof(short), frame_size, fout);
376                }
377             }
378             packet_count++;
379          }
380       }
381       if (feof(fin))
382          break;
383
384    }
385
386    if (st)
387       speex_decoder_destroy(st);
388    speex_bits_destroy(&bits);
389    ogg_sync_clear(&oy);
390    ogg_stream_clear(&os);
391
392    if (close_in)
393       fclose(fin);
394    fclose(fout);
395    return 1;
396 }