armv7(float): Optimize encode usecase using NE10 library
[opus.git] / celt / dump_modes / dump_modes_arm_ne10.c
1 /* Copyright (c) 2015 Xiph.Org Foundation
2    Written by Viswanath Puttagunta */
3 /*
4    Redistribution and use in source and binary forms, with or without
5    modification, are permitted provided that the following conditions
6    are met:
7
8    - Redistributions of source code must retain the above copyright
9    notice, this list of conditions and the following disclaimer.
10
11    - Redistributions in binary form must reproduce the above copyright
12    notice, this list of conditions and the following disclaimer in the
13    documentation and/or other materials provided with the distribution.
14
15    THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
16    ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
17    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
18    A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER
19    OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
20    EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
21    PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
22    PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF
23    LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING
24    NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
25    SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
26 */
27
28 #if defined(HAVE_CONFIG_H)
29 # include "config.h"
30 #endif
31
32 #include <stdio.h>
33 #include <stdlib.h>
34 #include "modes.h"
35 #include "dump_modes_arch.h"
36 #include <NE10_dsp.h>
37
38 static FILE *file;
39
40 void dump_modes_arch_init(CELTMode **modes, int nb_modes)
41 {
42    int i;
43
44    file = fopen(ARM_NE10_ARCH_FILE_NAME, "w");
45    fprintf(file, "/* The contents of this file was automatically generated by\n");
46    fprintf(file, " * dump_mode_arm_ne10.c with arguments:");
47    for (i=0;i<nb_modes;i++)
48    {
49       CELTMode *mode = modes[i];
50       fprintf(file, " %d %d",mode->Fs,mode->shortMdctSize*mode->nbShortMdcts);
51    }
52    fprintf(file, "\n * It contains static definitions for some pre-defined modes. */\n");
53    fprintf(file, "#include <NE10_init.h>\n\n");
54 }
55
56 void dump_modes_arch_finalize()
57 {
58    fclose(file);
59 }
60
61 void dump_mode_arch(CELTMode *mode)
62 {
63    int k, j;
64    int mdctSize;
65
66    mdctSize = mode->shortMdctSize*mode->nbShortMdcts;
67
68    fprintf(file, "#ifndef NE10_FFT_PARAMS%d_%d\n", mode->Fs, mdctSize);
69    fprintf(file, "#define NE10_FFT_PARAMS%d_%d\n", mode->Fs, mdctSize);
70    /* cfg->factors */
71    for(k=0;k<=mode->mdct.maxshift;k++) {
72       ne10_fft_cfg_float32_t cfg;
73       cfg = (ne10_fft_cfg_float32_t)mode->mdct.kfft[k]->arch_fft->priv;
74       if (!cfg)
75          continue;
76       fprintf(file, "static const ne10_int32_t ne10_factors_%d[%d] = {\n",
77               mode->mdct.kfft[k]->nfft, (NE10_MAXFACTORS * 2));
78       for(j=0;j<(NE10_MAXFACTORS * 2);j++) {
79          fprintf(file, "%d,%c", cfg->factors[j],(j+16)%15==0?'\n':' ');
80       }
81       fprintf (file, "};\n");
82    }
83
84    /* cfg->twiddles */
85    for(k=0;k<=mode->mdct.maxshift;k++) {
86       ne10_fft_cfg_float32_t cfg;
87       cfg = (ne10_fft_cfg_float32_t)mode->mdct.kfft[k]->arch_fft->priv;
88       if (!cfg)
89          continue;
90       fprintf(file, "static const ne10_fft_cpx_float32_t ne10_twiddles_%d[%d] = {\n",
91               mode->mdct.kfft[k]->nfft, mode->mdct.kfft[k]->nfft);
92       for(j=0;j<mode->mdct.kfft[k]->nfft;j++) {
93          fprintf(file, "{%#0.8gf,%#0.8gf},%c", cfg->twiddles[j].r, cfg->twiddles[j].i,(j+4)%3==0?'\n':' ');
94       }
95       fprintf (file, "};\n");
96    }
97
98    for(k=0;k<=mode->mdct.maxshift;k++) {
99       ne10_fft_cfg_float32_t cfg;
100       cfg = (ne10_fft_cfg_float32_t)mode->mdct.kfft[k]->arch_fft->priv;
101       if (!cfg) {
102          fprintf(file, "/* Ne10 does not support scaled FFT for length = %d */\n",
103                  mode->mdct.kfft[k]->nfft);
104          fprintf(file, "static const arch_fft_state cfg_arch_%d = {\n", mode->mdct.kfft[k]->nfft);
105          fprintf(file, "0,\n");
106          fprintf(file, "NULL\n");
107          fprintf(file, "};\n");
108          continue;
109       }
110       fprintf(file, "static const ne10_fft_state_float32_t ne10_fft_state_float32_%d = {\n",
111               mode->mdct.kfft[k]->nfft);
112       fprintf(file, "%d,\n", cfg->nfft);
113       fprintf(file, "(ne10_int32_t *)ne10_factors_%d,\n", mode->mdct.kfft[k]->nfft);
114       fprintf(file, "(ne10_fft_cpx_float32_t *)ne10_twiddles_%d,\n", mode->mdct.kfft[k]->nfft);
115       fprintf(file, "NULL,\n");  /* buffer */
116       fprintf(file, "(ne10_fft_cpx_float32_t *)&ne10_twiddles_%d[%d],\n",
117               mode->mdct.kfft[k]->nfft, cfg->nfft);
118       fprintf(file, "/* is_forward_scaled = true */\n");
119       fprintf(file, "(ne10_int32_t) 1,\n");
120       fprintf(file, "/* is_backward_scaled = false */\n");
121       fprintf(file, "(ne10_int32_t) 0,\n");
122       fprintf(file, "};\n");
123
124       fprintf(file, "static const arch_fft_state cfg_arch_%d = {\n",
125               mode->mdct.kfft[k]->nfft);
126       fprintf(file, "1,\n");
127       fprintf(file, "(void *)&ne10_fft_state_float32_%d,\n", mode->mdct.kfft[k]->nfft);
128       fprintf(file, "};\n\n");
129    }
130    fprintf(file, "#endif  /* end NE10_FFT_PARAMS%d_%d */\n", mode->Fs, mdctSize);
131 }