eb7494c9e212826aa893d0366077b3314bfe80d8
[theora.git] / lib / arm / arm2gnu.pl
1 #!/usr/bin/perl
2
3 my $bigend;  # little/big endian
4
5 eval 'exec /usr/local/bin/perl -S $0 ${1+"$@"}'
6     if $running_under_some_shell;
7
8 while ($ARGV[0] =~ /^-/) {
9     $_ = shift;
10   last if /^--/;
11     if (/^-n/) {
12     $nflag++;
13     next;
14     }
15     die "I don't recognize this switch: $_\\n";
16 }
17 $printit++ unless $nflag;
18
19 $\ = "\n";      # automatically add newline on print
20 $n=0;
21
22 $thumb = 0;     # ARM mode by default, not Thumb.
23 @proc_stack = ();
24
25 LINE:
26 while (<>) {
27
28     # For ADRLs we need to add a new line after the substituted one.
29     $addPadding = 0;
30
31     # First, we do not dare to touch *anything* inside double quotes, do we?
32     # Second, if you want a dollar character in the string,
33     # insert two of them -- that's how ARM C and assembler treat strings.
34     s/^([A-Za-z_]\w*)[ \t]+DCB[ \t]*\"/$1:   .ascii \"/   && do { s/\$\$/\$/g; next };
35     s/\bDCB\b[ \t]*\"/.ascii \"/                          && do { s/\$\$/\$/g; next };
36     s/^(\S+)\s+RN\s+(\S+)/$1 .req r$2/                    && do { s/\$\$/\$/g; next };
37     # If there's nothing on a line but a comment, don't try to apply any further
38     #  substitutions (this is a cheap hack to avoid mucking up the license header)
39     s/^([ \t]*);/$1@/                                     && do { s/\$\$/\$/g; next };
40     # If substituted -- leave immediately !
41
42     s/@/,:/;
43     s/;/@/;
44     while ( /@.*'/ ) {
45       s/(@.*)'/$1/g;
46     }
47     s/\{FALSE\}/0/g;
48     s/\{TRUE\}/1/g;
49     s/\{(\w\w\w\w+)\}/$1/g;
50     s/\bINCLUDE[ \t]*([^ \t\n]+)/.include \"$1\"/;
51     s/\bGET[ \t]*([^ \t\n]+)/.include \"${ my $x=$1; $x =~ s|\.s|-gnu.S|; \$x }\"/;
52     s/\bIMPORT\b/.extern/;
53     s/\bEXPORT\b/.global/;
54     s/^(\s+)\[/$1IF/;
55     s/^(\s+)\|/$1ELSE/;
56     s/^(\s+)\]/$1ENDIF/;
57     s/IF *:DEF:/ .ifdef/;
58     s/IF *:LNOT: *:DEF:/ .ifndef/;
59     s/ELSE/ .else/;
60     s/ENDIF/ .endif/;
61
62     if( /\bIF\b/ ) {
63       s/\bIF\b/ .if/;
64       s/=/==/;
65     }
66     if ( $n == 2) {
67         s/\$/\\/g;
68     }
69     if ($n == 1) {
70         s/\$//g;
71         s/label//g;
72     $n = 2;
73       }
74     if ( /MACRO/ ) {
75       s/MACRO *\n/.macro/;
76       $n=1;
77     }
78     if ( /\bMEND\b/ ) {
79       s/\bMEND\b/.endm/;
80       $n=0;
81     }
82
83     # ".rdata" doesn't work in 'as' version 2.13.2, as it is ".rodata" there.
84     #
85     if ( /\bAREA\b/ ) {
86         s/^(.+)CODE(.+)READONLY(.*)/    .text/;
87         s/^(.+)DATA(.+)READONLY(.*)/    .section .rdata\n    .align 2/;
88         s/^(.+)\|\|\.data\|\|(.+)/    .data\n    .align 2/;
89         s/^(.+)\|\|\.bss\|\|(.+)/    .bss/;
90     }
91
92     s/\|\|\.constdata\$(\d+)\|\|/.L_CONST$1/;       # ||.constdata$3||
93     s/\|\|\.bss\$(\d+)\|\|/.L_BSS$1/;               # ||.bss$2||
94     s/\|\|\.data\$(\d+)\|\|/.L_DATA$1/;             # ||.data$2||
95     s/\|\|([a-zA-Z0-9_]+)\@([a-zA-Z0-9_]+)\|\|/@ $&/;
96     s/^(\s+)\%(\s)/    .space $1/;
97
98     s/\|(.+)\.(\d+)\|/\.$1_$2/;                     # |L80.123| -> .L80_123
99     s/\bCODE32\b/.code 32/ && do {$thumb = 0};
100     s/\bCODE16\b/.code 16/ && do {$thumb = 1};
101     if (/\bPROC\b/)
102     {
103         $proc = $_;
104         $proc =~ s/\s*\b(\w*)\b\s*\bPROC\b\s*/$1/;
105         printf("\t.type\t%s, %%function\n",$proc) if ($proc);
106         push(@proc_stack, $proc);
107         print "    .thumb_func" if ($thumb);
108         s/\bPROC\b/@ $&/;
109     }
110     s/^(\s*)(S|Q|SH|U|UQ|UH)ASX\b/$1$2ADDSUBX/;
111     s/^(\s*)(S|Q|SH|U|UQ|UH)SAX\b/$1$2SUBADDX/;
112     if (/\bENDP\b/)
113     {
114         $proc = pop(@proc_stack);
115         print ".size $proc, .-$proc" if ($proc);
116         s/\bENDP\b/@ $&/;
117     }
118     s/\bSUBT\b/@ $&/;
119     s/\bDATA\b/@ $&/;   # DATA directive is deprecated -- Asm guide, p.7-25
120     s/\bKEEP\b/@ $&/;
121     s/\bEXPORTAS\b/@ $&/;
122     s/\|\|(.)+\bEQU\b/@ $&/;
123     s/\|\|([\w\$]+)\|\|/$1/;
124     s/\bENTRY\b/@ $&/;
125     s/\bASSERT\b/@ $&/;
126     s/\bGBLL\b/@ $&/;
127     s/\bGBLA\b/@ $&/;
128     s/^\W+OPT\b/@ $&/;
129     s/:OR:/|/g;
130     s/:SHL:/<</g;
131     s/:SHR:/>>/g;
132     s/:AND:/&/g;
133     s/:LAND:/&&/g;
134     s/CPSR/cpsr/;
135     s/SPSR/spsr/;
136     s/ALIGN$/.balign 4/;
137     s/ALIGN\s+([0-9x]+)$/.balign $1/;
138     s/psr_cxsf/psr_all/;
139     s/LTORG/.ltorg/;
140     s/^([A-Za-z_]\w*)[ \t]+EQU/ .set $1,/;
141     s/^([A-Za-z_]\w*)[ \t]+SETL/ .set $1,/;
142     s/^([A-Za-z_]\w*)[ \t]+SETA/ .set $1,/;
143     s/^([A-Za-z_]\w*)[ \t]+\*/ .set $1,/;
144
145     #  {PC} + 0xdeadfeed  -->  . + 0xdeadfeed
146     s/\{PC\} \+/ \. +/;
147
148     # Single hex constant on the line !
149     #
150     # >>> NOTE <<<
151     #   Double-precision floats in gcc are always mixed-endian, which means
152     #   bytes in two words are little-endian, but words are big-endian.
153     #   So, 0x0000deadfeed0000 would be stored as 0x0000dead at low address
154     #   and 0xfeed0000 at high address.
155     #
156     s/\bDCFD\b[ \t]+0x([a-fA-F0-9]{8})([a-fA-F0-9]{8})/.long 0x$1, 0x$2/;
157     # Only decimal constants on the line, no hex !
158     s/\bDCFD\b[ \t]+([0-9\.\-]+)/.double $1/;
159
160     # Single hex constant on the line !
161 #    s/\bDCFS\b[ \t]+0x([a-f0-9]{8})([a-f0-9]{8})/.long 0x$1, 0x$2/;
162     # Only decimal constants on the line, no hex !
163 #    s/\bDCFS\b[ \t]+([0-9\.\-]+)/.double $1/;
164     s/\bDCFS[ \t]+0x/.word 0x/;
165     s/\bDCFS\b/.float/;
166
167     s/^([A-Za-z_]\w*)[ \t]+DCD/$1 .word/;
168     s/\bDCD\b/.word/;
169     s/^([A-Za-z_]\w*)[ \t]+DCW/$1 .short/;
170     s/\bDCW\b/.short/;
171     s/^([A-Za-z_]\w*)[ \t]+DCB/$1 .byte/;
172     s/\bDCB\b/.byte/;
173     s/^([A-Za-z_]\w*)[ \t]+\%/.comm $1,/;
174     s/^[A-Za-z_\.]\w+/$&:/;
175     s/^(\d+)/$1:/;
176     s/\%(\d+)/$1b_or_f/;
177     s/\%[Bb](\d+)/$1b/;
178     s/\%[Ff](\d+)/$1f/;
179     s/\%[Ff][Tt](\d+)/$1f/;
180     s/&([\dA-Fa-f]+)/0x$1/;
181     if ( /\b2_[01]+\b/ ) {
182       s/\b2_([01]+)\b/conv$1&&&&/g;
183       while ( /[01][01][01][01]&&&&/ ) {
184         s/0000&&&&/&&&&0/g;
185         s/0001&&&&/&&&&1/g;
186         s/0010&&&&/&&&&2/g;
187         s/0011&&&&/&&&&3/g;
188         s/0100&&&&/&&&&4/g;
189         s/0101&&&&/&&&&5/g;
190         s/0110&&&&/&&&&6/g;
191         s/0111&&&&/&&&&7/g;
192         s/1000&&&&/&&&&8/g;
193         s/1001&&&&/&&&&9/g;
194         s/1010&&&&/&&&&A/g;
195         s/1011&&&&/&&&&B/g;
196         s/1100&&&&/&&&&C/g;
197         s/1101&&&&/&&&&D/g;
198         s/1110&&&&/&&&&E/g;
199         s/1111&&&&/&&&&F/g;
200       }
201       s/000&&&&/&&&&0/g;
202       s/001&&&&/&&&&1/g;
203       s/010&&&&/&&&&2/g;
204       s/011&&&&/&&&&3/g;
205       s/100&&&&/&&&&4/g;
206       s/101&&&&/&&&&5/g;
207       s/110&&&&/&&&&6/g;
208       s/111&&&&/&&&&7/g;
209       s/00&&&&/&&&&0/g;
210       s/01&&&&/&&&&1/g;
211       s/10&&&&/&&&&2/g;
212       s/11&&&&/&&&&3/g;
213       s/0&&&&/&&&&0/g;
214       s/1&&&&/&&&&1/g;
215       s/conv&&&&/0x/g;
216     }
217
218     if ( /commandline/)
219     {
220         if( /-bigend/)
221         {
222             $bigend=1;
223         }
224     }
225
226     if ( /\bDCDU\b/ )
227     {
228         my $cmd=$_;
229         my $value;
230         my $w1;
231         my $w2;
232         my $w3;
233         my $w4;
234
235         s/\s+DCDU\b/@ $&/;
236
237         $cmd =~ /\bDCDU\b\s+0x(\d+)/;
238         $value = $1;
239         $value =~ /(\w\w)(\w\w)(\w\w)(\w\w)/;
240         $w1 = $1;
241         $w2 = $2;
242         $w3 = $3;
243         $w4 = $4;
244
245         if( $bigend ne "")
246         {
247             # big endian
248
249             print "        .byte      0x".$w1;
250             print "        .byte      0x".$w2;
251             print "        .byte      0x".$w3;
252             print "        .byte      0x".$w4;
253         }
254         else
255         {
256             # little endian
257
258             print "        .byte      0x".$w4;
259             print "        .byte      0x".$w3;
260             print "        .byte      0x".$w2;
261             print "        .byte      0x".$w1;
262         }
263
264     }
265
266
267     if ( /\badrl\b/i )
268     {
269         s/\badrl\s+(\w+)\s*,\s*(\w+)/ldr $1,=$2/i;
270         $addPadding = 1;
271     }
272     s/\bEND\b/@ END/;
273 } continue {
274     printf ("%s", $_) if $printit;
275     if ($addPadding != 0)
276     {
277         printf ("   mov r0,r0\n");
278         $addPadding = 0;
279     }
280 }
281