Bài giảng Nhập môn chương trình dịch - Bài 6: Sinh mã trung gian - Hoàng Anh Việt
Ngôn ngữ trung gian
• Dễ sinh ra từ cây cú pháp
• Dễ sinh mã máy
• Số lượng lệnh nhỏ, gọn
– Dễ tối ưu mã
– Dễ chuyển sang loại mã máy khác
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Nhập môn chương trình dịch - Bài 6: Sinh mã trung gian - Hoàng Anh Việt", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Bài giảng Nhập môn chương trình dịch - Bài 6: Sinh mã trung gian - Hoàng Anh Việt
1Bài 6. SINH MÃ TRUNG GIAN Hoàng Anh Việt Viện CNTT&TT - ĐHBKHN Mô tả các bước dịch (1) Mã nguồn (dãy các kí tự) If (a == 0) min = a; Phân tích từ vựng Phân tích cú pháp Phân tích ngữ nghĩa Dãy các từ tố (token) Cây cú pháp Cây cú pháp điều khiển If ( Id:a == 0 ) Id:min = Id:a ; if == = ; a 0 min a if == = ; a 0 min aint int int lvalue int intboolean Mô tả các bước dịch (2) if == = ; a 0 min aint int int lvalue int intboolean Sinh mã trung gian Sinh mã assembly Tối ưu mã SEQ(CJUMP(TEMP(a) == 0, L1, L2), LABEL(L1), TEMP(min) = TEMP(a) LABEL(L2)) cmp rb, 0 jnz L2 L1: mov ra, rb L2: cmp ecx, 0 cmovz edx,ecx Ngôn ngữ trung gian • Là ngôn ngữ cho một loại máy trừu tượng • Cho phép sinh mã không phụ thuộc vào máy đích • Cho phép tối ưu mã trước khi sinh mã máy thật sự Cây cú pháp + thông tin điều khiển Pentium Java bytecode AMD Ngôn ngữ trung gian • Dễ sinh ra từ cây cú pháp • Dễ sinh mã máy • Số lượng lệnh nhỏ, gọn – Dễ tối ưu mã – Dễ chuyển sang loại mã máy khác Cây cú pháp (>40 nút) Mã trung gian (13 nút) Pentium (>200 lệnh) Ngôn ngữ trung gian • Một dạng thể hiện của chương trình nằm giữa cây cú pháp điều khiển và mã máy • Sử dụng – Lệnh nhảy – Thanh ghi – Vị trí trên bộ nhớ Cây cú pháp + thông tin điều khiển Pentium Java bytecode AMD Mã trung gian Tối ưu mã Một ngôn ngữ trung gian • IR (Intermediate Representation) là một cây thể hiện các lệnh của một loại máy trừu tượng • Nút lệnh không trả lại giá trị, được thực hiện theo thứ tự nhất định – Ví dụ: MOVE, SEQ, CJUMP • Nút biểu thức trả lại giá trị, các nút con có thể thực hiện theo thứ tự bất kì – Ví dụ: ADD, SUB – Cho phép tối ưu mã Mô tả các nút biểu thức của IR • CONST(i): hằng số nguyên i • TEMP(t): thanh ghi t, máy trừu tượng có vô hạn thanh ghi. • OP(e1, e2): các phép toán – Số học: ADD, SUB, MUL, DIV, MOD – Logic: AND, OR, XOR, LSHIFT, RSHIFT – So sánh: EQ, NEQ, LT, GT, LEQ, GEQ • MEM(e): giá trị bộ nhớ ở vị trí e • CALL(f, a0, a1, ): giá trị của hàm f với các tham số a0, a1, • NAME(n): địa chỉ của lệnh hoặc dữ liệu có tên là n • ESEQ(s, e): giá trị của e sau khi lệnh s được thực hiện CONST • Nút CONST đại diện cho hằng số • Giá trị của nút là i CONST(i) TEMP • Nút TEMP đại diện cho một thanh ghi trong số vô hạn các thanh ghi của máy trừu tượng • Các biến cục bộ và các biến tạm • Để dễ viết, ký hiệu FP = TEMP(FP) là địa chỉ bắt đầu bộ nhớ của hàm • Giá trị của nút là giá trị của thanh ghi tại thời điểm tính toán TEMP(t) Toán tử • Máy trừu tượng có nhiều phép toán • Tính giá trị của e1 và e2, sau đó áp dụng phép toán với các giá trị này • e1 và e2 phải là hai nút có giá trị • Có thể tính giá trị e1 và e2 theo thứ tự bất kì OP e1 e2 OP(e1, e2) MEM • Nút MEM đại diện cho một vị trí trong bộ nhớ • Giá trị của nút là giá trị tại vị trí e trong bộ nhớ MEM e MEM(e) CALL • Nút CALL đại diện cho một lời gọi hàm • Không định nghĩa cách cài đặt việc truyền tham số, quản lý ngăn xếp • Giá trị của nút là giá trị của hàm CALL ef CALL(ef, e0, e1,) e0e1e2 Địa chỉ của hàm Tham số NAME • Nút NAME đại diện cho địa chỉ của một tên trên bộ nhớ • VD: địa chỉ của một nhãn nhảy NAME(n) ESEQ • Nút ESEQ tính toán giá trị của biểu thức e sau khi thực hiện lệnh s ESEQ s e ESEQ(s, e) Mô tả các nút lệnh của IR • MOVE(dest, e): chuyển giá trị của e vào dest • EXP(e): tính toán giá trị của e, không cần lưu lại kết quả • SEQ(s1, s2, sn): thực hiện các lệnh theo thứ tự • JUMP(e): nhảy đến địa chỉ e • CJUMP(e, l1, l2): nhảy đến l1 hoặc l2 tuỳ thuộc vào giá trị của e là true hoặc false • LABEL(n): tạo ra nhãn có tên n Ví dụ n = 0; while (n < 10) { n = n + 1; } SEQ( MOVE(TEMP(n), CONST(0)), LABEL(HEAD), CJUMP(LT(TEMP(n), CONST(10)), NAME(BODY), NAME(END)), LABEL(BODY), MOVE(TEMP(n), ADD(TEMP(n), CONST(1))), JUMP(NAME(HEAD)), LABEL(END) ) SEQ MOVE LABEL(HEAD)CJUMP LABEL(BODY)MOVE LABEL(END)JUMP TEMP(n) CONST(0) LT NAME(BODY) TEMP(n) CONST(10) NAME(END) TEMP(n) ADD TEMP(n) CONST(1) NAME(HEAD) Cấu trúc của IR • Gốc của cây là một nút lệnh • Các nút biểu thức nằm dưới nút lệnh • Chỉ có nút biểu thức ESEQ có nút lệnh nằm dưới • Có thể duyệt cây IR để chạy chương trình Sinh cây IR (mã trung gian) • Kỹ thuật: phương pháp dịch sử dụng cú pháp điều khiển (giống kiểm tra kiểu) • Chuyển cây cú pháp điều khiển thành cây IR • Mỗi cây con của cây cú pháp được chuyển thành một cây con dạng IR có cùng giá trị Sinh cây IR • Giống kiểm tra kiểu: thêm một phương thức vào nút tương ứng trong cây cú pháp abstract class ASTNode { IRNode translate(SymTab A) { } } • Cài đặt kiểu đệ quy • Vấn đề: giống như kiểm tra kiểu, cần mô tả chính xác cách viết hàm translate() Biểu thức • Các nút của cây cú pháp thể hiện biểu thức được chuyển thành nút IR tương ứng • Kí hiệu [e] là biểu diễn IR của nút e trong cây cú pháp ADD [e1] [e2] + e1 e2 Câu lệnh • Dãy các lệnh được biểu diễn bằng nút SEQ trong biểu diễn IR • Nếu [s1] và [s2] là biểu diễn IR của nút s1 và s2 • thì SEQ([s1], [s2]) là biểu diễn IR của s1; s2 SEQ [s1] [s2] s1; s2 Biến • Biến cục bộ v chuyển thành nút TEMP(v) • Tham số thứ i nằm ở vị trí MEM(ADD(FP,4*i+4)) v TEMP(v) MEM ADD FP CONST(4*i+4) arg n-1 arg 1 arg 0 return addr FP SS Stack Phép gán • Phép gán v = e chuyển thành nút MOVE(dest, [e]) với dest là địa chỉ của v, [e] là biểu diễn IR của e • Ví dụ x = 2 MOVE CONST(2)MEM ADD FP CONST(8) Phép gán • Cách dịch • Vấn đề: nút MOVE không có giá trị, làm thế nào để dịch x = (y = 2)? e1 = e2 MOVE [e2][e1] ESEQ [e1] e1 = e2 MOVE [e2][e1] Phép gán • Như vậy, [e1] phải chạy 2 lần, cần lưu lại giá trị của [e1] e1 = e2 MOVE [e2]TEMP(te) ESEQ TEMP(te)SEQ MOVE TEMP(te)[e1] Thảo luận 27
File đính kèm:
- bai_giang_nhap_mon_chuong_trinh_dich_bai_6_sinh_ma_trung_gia.pdf