Make arm2gnu.pl emit only one line per input line, if possible.
[theora.git] / lib / arm / arm2gnu.pl
1 #!/usr/bin/perl
2
3 my $bigend;  # little/big endian
4
5 eval 'exec /usr/local/bin/perl -S $0 ${1+"$@"}'
6     if $running_under_some_shell;
7
8 while ($ARGV[0] =~ /^-/) {
9     $_ = shift;
10   last if /^--/;
11     if (/^-n/) {
12     $nflag++;
13     next;
14     }
15     die "I don't recognize this switch: $_\\n";
16 }
17 $printit++ unless $nflag;
18
19 $\ = "\n";      # automatically add newline on print
20 $n=0;
21
22 $thumb = 0;     # ARM mode by default, not Thumb.
23 @proc_stack = ();
24
25 LINE:
26 while (<>) {
27
28     # For ADRLs we need to add a new line after the substituted one.
29     $addPadding = 0;
30
31     # First, we do not dare to touch *anything* inside double quotes, do we?
32     # Second, if you want a dollar character in the string,
33     # insert two of them -- that's how ARM C and assembler treat strings.
34     s/^([A-Za-z_]\w*)[ \t]+DCB[ \t]*\"/$1:   .ascii \"/   && do { s/\$\$/\$/g; next };
35     s/\bDCB\b[ \t]*\"/.ascii \"/                          && do { s/\$\$/\$/g; next };
36     s/^(\S+)\s+RN\s+(\S+)/$1 .req r$2/                    && do { s/\$\$/\$/g; next };
37     # If there's nothing on a line but a comment, don't try to apply any further
38     #  substitutions (this is a cheap hack to avoid mucking up the license header)
39     s/^([ \t]*);/$1@/                                     && do { s/\$\$/\$/g; next };
40     # If substituted -- leave immediately !
41
42     s/@/,:/;
43     s/;/@/;
44     while ( /@.*'/ ) {
45       s/(@.*)'/$1/g;
46     }
47     s/\{FALSE\}/0/g;
48     s/\{TRUE\}/1/g;
49     s/\{(\w\w\w\w+)\}/$1/g;
50     s/\bINCLUDE[ \t]*([^ \t\n]+)/.include \"$1\"/;
51     s/\bGET[ \t]*([^ \t\n]+)/.include \"${ my $x=$1; $x =~ s|\.s|-gnu.S|; \$x }\"/;
52     s/\bIMPORT\b/.extern/;
53     s/\bEXPORT\b/.global/;
54     s/^(\s+)\[/$1IF/;
55     s/^(\s+)\|/$1ELSE/;
56     s/^(\s+)\]/$1ENDIF/;
57     s/IF *:DEF:/ .ifdef/;
58     s/IF *:LNOT: *:DEF:/ .ifndef/;
59     s/ELSE/ .else/;
60     s/ENDIF/ .endif/;
61
62     if( /\bIF\b/ ) {
63       s/\bIF\b/ .if/;
64       s/=/==/;
65     }
66     if ( $n == 2) {
67         s/\$/\\/g;
68     }
69     if ($n == 1) {
70         s/\$//g;
71         s/label//g;
72     $n = 2;
73       }
74     if ( /MACRO/ ) {
75       s/MACRO *\n/.macro/;
76       $n=1;
77     }
78     if ( /\bMEND\b/ ) {
79       s/\bMEND\b/.endm/;
80       $n=0;
81     }
82
83     # ".rdata" doesn't work in 'as' version 2.13.2, as it is ".rodata" there.
84     #
85     if ( /\bAREA\b/ ) {
86         s/^(.+)CODE(.+)READONLY(.*)/    .text/;
87         s/^(.+)DATA(.+)READONLY(.*)/    .section .rdata\n    .align 2/;
88         s/^(.+)\|\|\.data\|\|(.+)/    .data\n    .align 2/;
89         s/^(.+)\|\|\.bss\|\|(.+)/    .bss/;
90     }
91
92     s/\|\|\.constdata\$(\d+)\|\|/.L_CONST$1/;       # ||.constdata$3||
93     s/\|\|\.bss\$(\d+)\|\|/.L_BSS$1/;               # ||.bss$2||
94     s/\|\|\.data\$(\d+)\|\|/.L_DATA$1/;             # ||.data$2||
95     s/\|\|([a-zA-Z0-9_]+)\@([a-zA-Z0-9_]+)\|\|/@ $&/;
96     s/^(\s+)\%(\s)/    .space $1/;
97
98     s/\|(.+)\.(\d+)\|/\.$1_$2/;                     # |L80.123| -> .L80_123
99     s/\bCODE32\b/.code 32/ && do {$thumb = 0};
100     s/\bCODE16\b/.code 16/ && do {$thumb = 1};
101     if (/\bPROC\b/)
102     {
103         my $prefix;
104         my $proc;
105         /^([A-Za-z_\.]\w+)\b/;
106         $proc = $1;
107         $prefix = "";
108         if ($proc)
109         {
110             $prefix = $prefix.sprintf("\t.type\t%s, %%function; ",$proc);
111             push(@proc_stack, $proc);
112             s/^[A-Za-z_\.]\w+/$&:/;
113         }
114         $prefix = $prefix."\t.thumb_func; " if ($thumb);
115         s/\bPROC\b/@ $&/;
116         $_ = $prefix.$_;
117     }
118     s/^(\s*)(S|Q|SH|U|UQ|UH)ASX\b/$1$2ADDSUBX/;
119     s/^(\s*)(S|Q|SH|U|UQ|UH)SAX\b/$1$2SUBADDX/;
120     if (/\bENDP\b/)
121     {
122         my $proc;
123         s/\bENDP\b/@ $&/;
124         $proc = pop(@proc_stack);
125         $_ = "\t.size $proc, .-$proc".$_ if ($proc);
126     }
127     s/\bSUBT\b/@ $&/;
128     s/\bDATA\b/@ $&/;   # DATA directive is deprecated -- Asm guide, p.7-25
129     s/\bKEEP\b/@ $&/;
130     s/\bEXPORTAS\b/@ $&/;
131     s/\|\|(.)+\bEQU\b/@ $&/;
132     s/\|\|([\w\$]+)\|\|/$1/;
133     s/\bENTRY\b/@ $&/;
134     s/\bASSERT\b/@ $&/;
135     s/\bGBLL\b/@ $&/;
136     s/\bGBLA\b/@ $&/;
137     s/^\W+OPT\b/@ $&/;
138     s/:OR:/|/g;
139     s/:SHL:/<</g;
140     s/:SHR:/>>/g;
141     s/:AND:/&/g;
142     s/:LAND:/&&/g;
143     s/CPSR/cpsr/;
144     s/SPSR/spsr/;
145     s/ALIGN$/.balign 4/;
146     s/ALIGN\s+([0-9x]+)$/.balign $1/;
147     s/psr_cxsf/psr_all/;
148     s/LTORG/.ltorg/;
149     s/^([A-Za-z_]\w*)[ \t]+EQU/ .set $1,/;
150     s/^([A-Za-z_]\w*)[ \t]+SETL/ .set $1,/;
151     s/^([A-Za-z_]\w*)[ \t]+SETA/ .set $1,/;
152     s/^([A-Za-z_]\w*)[ \t]+\*/ .set $1,/;
153
154     #  {PC} + 0xdeadfeed  -->  . + 0xdeadfeed
155     s/\{PC\} \+/ \. +/;
156
157     # Single hex constant on the line !
158     #
159     # >>> NOTE <<<
160     #   Double-precision floats in gcc are always mixed-endian, which means
161     #   bytes in two words are little-endian, but words are big-endian.
162     #   So, 0x0000deadfeed0000 would be stored as 0x0000dead at low address
163     #   and 0xfeed0000 at high address.
164     #
165     s/\bDCFD\b[ \t]+0x([a-fA-F0-9]{8})([a-fA-F0-9]{8})/.long 0x$1, 0x$2/;
166     # Only decimal constants on the line, no hex !
167     s/\bDCFD\b[ \t]+([0-9\.\-]+)/.double $1/;
168
169     # Single hex constant on the line !
170 #    s/\bDCFS\b[ \t]+0x([a-f0-9]{8})([a-f0-9]{8})/.long 0x$1, 0x$2/;
171     # Only decimal constants on the line, no hex !
172 #    s/\bDCFS\b[ \t]+([0-9\.\-]+)/.double $1/;
173     s/\bDCFS[ \t]+0x/.word 0x/;
174     s/\bDCFS\b/.float/;
175
176     s/^([A-Za-z_]\w*)[ \t]+DCD/$1 .word/;
177     s/\bDCD\b/.word/;
178     s/^([A-Za-z_]\w*)[ \t]+DCW/$1 .short/;
179     s/\bDCW\b/.short/;
180     s/^([A-Za-z_]\w*)[ \t]+DCB/$1 .byte/;
181     s/\bDCB\b/.byte/;
182     s/^([A-Za-z_]\w*)[ \t]+\%/.comm $1,/;
183     s/^[A-Za-z_\.]\w+/$&:/;
184     s/^(\d+)/$1:/;
185     s/\%(\d+)/$1b_or_f/;
186     s/\%[Bb](\d+)/$1b/;
187     s/\%[Ff](\d+)/$1f/;
188     s/\%[Ff][Tt](\d+)/$1f/;
189     s/&([\dA-Fa-f]+)/0x$1/;
190     if ( /\b2_[01]+\b/ ) {
191       s/\b2_([01]+)\b/conv$1&&&&/g;
192       while ( /[01][01][01][01]&&&&/ ) {
193         s/0000&&&&/&&&&0/g;
194         s/0001&&&&/&&&&1/g;
195         s/0010&&&&/&&&&2/g;
196         s/0011&&&&/&&&&3/g;
197         s/0100&&&&/&&&&4/g;
198         s/0101&&&&/&&&&5/g;
199         s/0110&&&&/&&&&6/g;
200         s/0111&&&&/&&&&7/g;
201         s/1000&&&&/&&&&8/g;
202         s/1001&&&&/&&&&9/g;
203         s/1010&&&&/&&&&A/g;
204         s/1011&&&&/&&&&B/g;
205         s/1100&&&&/&&&&C/g;
206         s/1101&&&&/&&&&D/g;
207         s/1110&&&&/&&&&E/g;
208         s/1111&&&&/&&&&F/g;
209       }
210       s/000&&&&/&&&&0/g;
211       s/001&&&&/&&&&1/g;
212       s/010&&&&/&&&&2/g;
213       s/011&&&&/&&&&3/g;
214       s/100&&&&/&&&&4/g;
215       s/101&&&&/&&&&5/g;
216       s/110&&&&/&&&&6/g;
217       s/111&&&&/&&&&7/g;
218       s/00&&&&/&&&&0/g;
219       s/01&&&&/&&&&1/g;
220       s/10&&&&/&&&&2/g;
221       s/11&&&&/&&&&3/g;
222       s/0&&&&/&&&&0/g;
223       s/1&&&&/&&&&1/g;
224       s/conv&&&&/0x/g;
225     }
226
227     if ( /commandline/)
228     {
229         if( /-bigend/)
230         {
231             $bigend=1;
232         }
233     }
234
235     if ( /\bDCDU\b/ )
236     {
237         my $cmd=$_;
238         my $value;
239         my $prefix;
240         my $w1;
241         my $w2;
242         my $w3;
243         my $w4;
244
245         s/\s+DCDU\b/@ $&/;
246
247         $cmd =~ /\bDCDU\b\s+0x(\d+)/;
248         $value = $1;
249         $value =~ /(\w\w)(\w\w)(\w\w)(\w\w)/;
250         $w1 = $1;
251         $w2 = $2;
252         $w3 = $3;
253         $w4 = $4;
254
255         if( $bigend ne "")
256         {
257             # big endian
258             $prefix = "\t.byte\t0x".$w1.";".
259                       "\t.byte\t0x".$w2.";".
260                       "\t.byte\t0x".$w3.";".
261                       "\t.byte\t0x".$w4."; ";
262         }
263         else
264         {
265             # little endian
266             $prefix = "\t.byte\t0x".$w4.";".
267                       "\t.byte\t0x".$w3.";".
268                       "\t.byte\t0x".$w2.";".
269                       "\t.byte\t0x".$w1."; ";
270         }
271         $_=$prefix.$_;
272     }
273
274     if ( /\badrl\b/i )
275     {
276         s/\badrl\s+(\w+)\s*,\s*(\w+)/ldr $1,=$2/i;
277         $addPadding = 1;
278     }
279     s/\bEND\b/@ END/;
280 } continue {
281     printf ("%s", $_) if $printit;
282     if ($addPadding != 0)
283     {
284         printf ("   mov r0,r0\n");
285         $addPadding = 0;
286     }
287 }
288