Bài giảng Hệ chuyên gia (Expert System) - Chương 1: Mở đầu về hệ chuyên gia - Phan Huy Khánh

Hệ chuyên gia (HCG) là gì ?

a Hệ chuyên gia là lĩnh vực ứng dụng của trí tuệ nhân tạo

a Có nhiều cách định nghĩa HCG :

V E. Feigenbaum : «Hệ chuyên gia (Expert System) là một

chương trình máy tính thông minh sử dụng tri thức

(knowledge) và các thủ tục suy luận (inference procedures)

để giải những bài toán tương đối khó khăn đòi hỏi những

chuyên gia mới giải được»

V Hệ chuyên gia là một hệ thống tin học có thể mô phỏng

(emulates) năng lực quyết đoán (decision) và hành động

(making abilily) của một chuyên gia (con người)

V Một hệ chuyên gia sử dụng tri thức của một lĩnh vực cụ thể

để cung cấp việc giải quyết vấn đề với “chất lượng chuyên

gia” trong lĩnh vực đó

pdf 57 trang phuongnguyen 3840
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Hệ chuyên gia (Expert System) - Chương 1: Mở đầu về hệ chuyên gia - Phan Huy Khánh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Bài giảng Hệ chuyên gia (Expert System) - Chương 1: Mở đầu về hệ chuyên gia - Phan Huy Khánh

Bài giảng Hệ chuyên gia (Expert System) - Chương 1: Mở đầu về hệ chuyên gia - Phan Huy Khánh
HHệệ chuyênchuyên giagia ((ExpertExpert SystemSystem))
 PGS.TS. Phan Huy Khánh
 khanhph@vnn.vn
 ChChươươngng 11
 MMởở đđầầuu vvềề hhệệ chuyênchuyên giagia
 1.21.2
 HHệệ chuyênchuyên giagia (HCG)(HCG) llàà ggìì ??
a Hệ chuyên gia là lĩnh vực ứng dụng của trí tuệ nhân tạo
a Có nhiều cách định nghĩa HCG :
 V E. Feigenbaum : «Hệ chuyên gia (Expert System) là một 
 chương trình máy tính thông minh sử dụng tri thức 
 (knowledge) và các thủ tục suy luận (inference procedures) 
 để giải những bài toán tương đối khó khăn đòi hỏi những 
 chuyên gia mới giải được»
 V Hệ chuyên gia là một hệ thống tin học có thể mô phỏng 
 (emulates) năng lực quyết đoán (decision) và hành động 
 (making abilily) của một chuyên gia (con người)
 V Một hệ chuyên gia sử dụng tri thức của một lĩnh vực cụ thể 
 để cung cấp việc giải quyết vấn đề với “chất lượng chuyên 
 gia” trong lĩnh vực đó.
 2/57
 WhatWhat isis anan ExpertExpert System?System?
a Expert System: 
 A computer program that:
 V Attempts to code the knowledge of human experts
 in the form of heuristics (i.E. A rule of thumb)
 V Emulates the decision-making ability of a human expert
 in a restricted domain
 V Edward Feigenbaum: “An intelligent computer program that
 uses knowledge and inference procedures to solve problems that 
 are difficult enough to require significant human expertise
 for their solutions”
a A computer program which:
 V Encapsulates knowledge from some domain, normally obtained 
 from a human expert in that domain
 3/57
 KhKhááii niniệệmm chuyênchuyên giagia ttrongrong cucuộộcc ssốốngng 
a Trong cuộc sống, các chuyên gia có thể giải quyết vấn đề ở một mức 
 độ cao vì họ có rất nhiều tri thức về lĩnh vực họ hoạt động
a Những tri thức này bao gồm lý thuyết đến cả các kinh nghiệm, kỹ xảo, 
 phương pháp làm tắt, chiến lược heuristic đã tích lũy được của các 
 chuyên gia con người qua quá trình làm việc của họ trong một lĩnh vực 
 chuyên môn
a Từ tri thức này, người ta cố gắng cài đặt chúng vào hệ thống để hệ
 thống có thể mô phỏng theo cách thức các chuyên gia làm việc
a Tuy nhiên, không giống với con người, các chương trình hiện tại không 
 tự học lấy kinh nghiệm :
 V Tri thức phải được lấy từ con người
 V Được mã hóa trong một ngôn ngữ hình thức để khai thác
a Đây là nhiệm vụ chính mà các nhà thiết kế HCG phải đương đầu
 4/57
 Bách khoa toàn thư mở Wikipedia
a HCG, còn gọi là hệ thống dựa tri trức, là một chương 
 trình máy tính chứa một số tri thức đặc thù của một hoặc 
 nhiều chuyên gia con người về một chủ đề cụ thể nào đó
a Các chương trình thuộc loại này đã được phát triển từ các 
 thập kỷ 1960 và 1970, và trở thành ứng dụng thương mại 
 từ thập kỷ 1980
a Nhiều HCG đã được thiết kế và xây dựng để phục vụ các 
 lĩnh vực kế toán, y học, điều khiển tiến trình (process 
 control), dịch vụ tư vấn tài chính (finalcial service), tài 
 nguyên con người (human resources), v.v...
 5/57
 Bách khoa toàn thư mở Wikipedia
a Dạng phổ biến nhất của HCG là : 
 V Một chương trình gồm một tập luật phân tích thông tin (thường 
 được cung cấp bởi NSD hệ thống) về một lớp vấn đề cụ thể
 V Những phân tích về các vấn đề đã xác định
 V Tùy theo thiết kế chương trình mà đưa lời khuyên về trình tự các 
 hành động cần thực hiện để giải quyết vấn đề
a HCG sử dụng các tri thức của những chuyên gia để giải 
 quyết các vấn đề (bài toán) khác nhau thuộc mọi lĩnh vực
a Là một hệ thống sử dụng các khả năng lập luận để đạt tới 
 các kết luận
a Các thuật ngữ có cùng nghĩa :
 V Hệ chuyên gia
 V Hệ thống dựa trên tri thức (knowledge−based system) 
 V HCG dựa trên tri thức (knowledge−based expert system)
 6/57
 LLớớpp vvấấnn đđềề ccủủaa HCG_1HCG_1
1. Diễn giải (interpretation) 
 Đưa ra kết luận hay mô tả dễ hiểu từ những tập hợp dữ liệu thô
2. Dự đoán (prediction) 
 Đưa ra những hậu quả có thể xảy ra khi cho trước một tình huống
3. Chẩn đoán (diagnosis) 
 Xác định nguyên nhân của những sự cố trong các tình huống phức tạp 
 dựa trên các triệu chứng có thể quan sát được
4. Thiết kế (design) 
 tìm ra cấu hình cho các thành phần hệ thống, đáp ứng được các mục 
 tiêu trong khi vẫn thỏa mãn một tập hợp các ràng buộc về thiết kế
5. Lập kế hoạch (planning) 
 Tìm ra một chuỗi các hành động để đạt được một tập hợp các mục 
 tiêu, khi được cho trước các điều kiện khởi đầu và những ràng buộc 
 trong thời gian chạy (run-time)
 7/57
 LLớớpp vvấấnn đđềề ccủủaa HCG_2HCG_2
6.6. TheoTheo dõidõi (monitoring)(monitoring) 
 So sánh những hành vi quan s át được của hệ thống với hành vi 
 mong đợi 
7.7. BBắắtt llỗỗii vvàà ssửửaa chchữữaa (debuging(debuging andand repair)repair)
 Ch ỉ định và cài đặt phương pháp chữa trị cho các sự cố, rủi ro
8.8. HHưướớngng ddẫẫnn (instruction)(instruction) 
 PPhh áátt hihiệệnn vvàà ssửửaa chchữữaa nhnhữữngng thithiếếuu ssóótt trongtrong quanquan 
 niniệệmm ccủủaa hhọọcc viênviên vvềề mmộộtt chchủủ đđềề llĩĩnhnh vvựựcc nnààoo đđóó
9.9. ĐĐiiềềuu khikhiểểnn (control)(control) 
 CChh ỉỉ đđạạoo hhàànhnh vivi trongtrong mm ộộtt môimôi trtrưườờngng phphứứcc ttạạpp
 8/57
 TTổổ chchứứcc hohoạạtt đđộộngng ccủủaa HCGHCG 
a Một hệ chuyên gia gồm ba thành phần chính :
 V Cơ sở tri thức (knowledge base) nơi chứa tri thức của HCG
 V Máy suy diễn hay môtơ suy diễn (inference engine)
 V Hệ thống giao tiếp với người sử dụng (user interface)
a Khai thác HCG : Người sử dụng (User) đặt câu hỏi
 (truy vấn) HCG bằng cách :
 V Cung cấp sự kiện (facts) là những gì đã biết, đã có thật hay 
 những tri thức có ích (luật-rules) cho hệ chuyên gia, và nhận 
 được những câu trả lời
a Hoạt động của HCG :
 V Máy suy diễn khai thác cơ sở tri thức để tạo ra câu trả lời là
 những lời khuyên hay những gợi ý đúng đắn (expertise) cho 
 người sử dụng qua hệ thống giao tiếp
 9/57
KnowledgeKnowledge EngineeringEngineering inin aa NutshellNutshell
 HumanHuman
 ExpertExpert
 Dialog
 KnowledgeKnowledge Knowledge
 EngineerEngineer Refinement
 Explicit
 Knowledge
 KnowledgeKnowledge basebase
 (In(In ES)ES)
 10/57
 SESE overviewsoverviews
a Relies on internally represented knowledge to perform tasks
a Utilizes reasoning methods to derive appropriate new knowledge
a Usually restricted to a specific problem domain
a The term knowledge-based system is often used synonymously
a Two distinctions from Decision Support System (DSS):
 1. has the potential to extend the manager’s problem-solving 
 ability beyond his or her normal capabilities
 2. the ability to explain how the solution was reached
 Problem Domain
 Knowledge
 Domain 
 11/57
 NhiNhiềềuu ccááchch nhnhììnn nhnhậậnn khkháácc nhaunhau vvềề HCGHCG
Loại người sử dụng Vấn đề đặt ra
Người quản trị Tôi có thể dùng nó để làm gì ?
 Làm cách nào để tôi vận hành nó tốt 
Kỹ thuật viên
 nhất ? 
Nhà nghiên cứu Làm sao để tôi có thể mở rộng nó ?
 Nó sẽ giúp tôi cái gì đ ây ? 
Người sử dụng cuối Nó có rắc rối và tốn kém không ?
 Nó có đáng tin cậy không ?
 12/57
 ĐĐặặcc trtrưưngng ccủủaa hhệệ chuyênchuyên giagia
a Có bốn đặc trưng cơ bản của một hệ chuyên gia :
 V Hiệu quả cao (high performance). Khả năng trả lời với mức 
 độ tinh thông bằng hoặc cao hơn so với chuyên gia (người) 
 trong cùng lĩnh vực.
 V Thời gian trả lời thoả đáng (adequate response time). Thời 
 gian trả lời hợp lý, bằng hoặc nhanh hơn so với chuyên gia 
 (người) để đi đến cùng một quyết định. Hệ chuyên gia là một 
 hệ thống thời gian thực (real time system).
 V Độ tin cậy cao (good reliability). Không thể xảy ra sự cố hoặc 
 giảm sút độ tin cậy khi sử dụng.
 V Dễ hiểu (understandable). Hệ chuyên gia giải thích các bước 
 suy luận một cách dễ hiểu và nhất quán, không giống như 
 cách trả lời bí ẩn của các hộp đen (black box)
 13/57
 ƯƯuu đđiiểểmm ccủủaa hhệệ chuyênchuyên gia_1gia_1
a Những ưu điểm của hệ chuyên gia :
 V Phổ cập (increased availability). Là sản phẩm chuyên gia, được 
 phát triển không ngừng với hiệu quả sử dụng không thể phủ nhận.
 V Giảm giá thành (reduced cost).
 V Giảm rủi ro (reduced dangers). Giúp con người tránh được trong 
 các môi trường rủi ro, nguy hiểm.
 V Tính thường trực (Permanance). Bất kể lúc nào cũng có thể khai 
 thác sử dụng, trong khi con người có thể mệt mỏi, nghỉ ngơi hay 
 vắng mặt.
 V Đa lĩnh vực (multiple expertise). chuyên gia về nhiều lĩnh vực khác 
 nhau và được khai thác đồng thời bất kể thời gian sử dụng
 14/57
 ƯƯuu đđiiểểmm ccủủaa hhệệ chuyênchuyên gia_2gia_2
a Những ưu điểm của hệ chuyên gia :
 V Độ tin cậy (increased relialility)
 Luôn đảm bảo độ tin cậy khi khai thác.
 V Khả năng giảng giải (explanation). Câu trả lời với mức độ tinh 
 thông được giảng giải rõ ràng chi tiết, dễ hiểu.
 V Khả năng trả lời (fast reponse). Trả lời theo thời gian thực, khách 
 quan.
 V Tính ổn định, suy luận có lý và đầy đủ mọi lúc mọi nơi (steady, une 
 motional, and complete response at all times).
 V Trợ giúp thông minh như một người hướng dẫn (intelligent -tutor).
 V Có thể truy cập như là một cơ sở dữ liệu thông minh (intelligent 
 database)
 15/57
 LLịịchch ssửử phpháátt tritriểểnn ccủủaa HCGHCG 1
Năm Các sự kiện
1943 Dịch vụ bưu điện ; mô hình Neuron của (Mc Culloch and Pitts Model)
1954 Thuật toán Markov (Markov Algorithm) điều khiển thực thi các luật
 Hội thảo Dartmouth ; lý luận logic ; tìm kiếm nghiệm suy (heuristic search) 
1956
 ; thống nhất thuật ngữ trí tuệ nhân tạo (AI: Artificial Intelligence)
 Rosenblatt phát minh khả năng nhận thức ; Newell, Shaw và Simon đề
1957 
 xuất giải bài toán tổng quát (GPS: General Problem Solver)
1958 Mc Carthy đề xuất ngôn ngữ trí tuệ nhân tạo LISA (LISA AI language)
 Nguyên lý Rosenblatt’s về chức năng thần kinh trong nhận thức 
1962 
 (Rosenblatt’s Principles of Neurodynamicdynamics on Perceptions)
 Phương pháp hợp giải Robinson. Ưng dụng logic mờ (fuzzy logic) trong suy 
1965 luận về các đối tượng mờ (fuzzy object) của Zadeh. Xây dựng hệ chuyên 
 gia đầu tiên về nha khoa DENDRAL (Feigenbaum , Buchanan , et.al)
 Mạng ngữ nghĩa (semantic nets), mô hình bộ nhớ kết hợp (associative 
1968 
 memory model) của Quillian
 16/57
 LLịịchch ssửử phpháátt tritriểểnn ccủủaa HCGHCG 2
Năm Các sự kiện
1969 Hệ chuyên gia về Toán học MACSYMA (Martin and Moses)
1970 Ưng dụ ng ngôn ngữ PROLOG (Colmerauer, Roussell, et, al.)
 Hệ chuyên gia HEARSAY I về nhận dạng tiếng nói (speech recognition).
1971 Xây dựng các luật giải bài toán con người (Human Problem Solving
 popularizes rules (Newell and Simon)
1973 Hệ chuyên gia MYCIN về chẩn trị y học (Shortliffe, et,al.)
 Lý thuy ết khung (frames), biểu diễn tri thức (knowledge representation) 
1975
 (Minsky)
 Toán nhân tạo (AM: Artificial Mathematician) (Lenat). Lý thuyết 
 Dempster−Shafer về tính hiển nhiên của lập luận không chắc chắn 
1976
 (Dempster−Shafer theory of Evidence for reason under uncertainty). Ứng 
 dụng hệ chuyên gia PROSPECTOR trong khai thác hầm mỏ (Duda, Har)
 Sử dụng ngôn ngữ chuyên gia OPS (OPS expert system shell) trong hệ
1977 
 chuyên gia XCON/R1 (Forgy)
 17/57
 LLịịchch ssửử phpháátt tritriểểnn ccủủaa HCGHCG 3
Năm Các sự kiện
 Hệ chuyên gia XCON/R1 (McDermott, DEC) để bảo trì hệ thống máy tính 
1978 
 DEC (DEC computer systems)
 Thuật toán mạng về so khớp nhanh (rete algorithm for fast pattern 
1979
 matching) của Forgy ; thương mại hoá các ứng dụng về trí tuệ nhân tạo
1980 Ký hiệu học (symbolics), xây dựng các máy LISP (LISP machines) từ LMI.
 Hệ chuyên gia về Toán học (SMP math expert system) ; 
 mạng nơ-ron Hopfield (Hopfield Neural Net) ;
1982 
 Dự án xây dựng máy tính thông minh thế hệ 5 ở Nhật bản
 (Japanese Fifth Generation Project to develop intelligent computers)
 Bộ công cụ phục vụ hệ chuyên gia KEE
1983
 (KEE expert system tool) (intelli Corp)
 Bộ công cụ phục vụ hệ chuyên gia CLIPS
1985
 (CLIPS expert system tool (NASA)
 18/57
 CCáácc llĩĩnhnh vvựựcc ứứngng ddụụngng ccủủaa hhệệ chuyênchuyên giagia
a Cho đến nay, hàng trăm hệ chuyên gia đã đư ợc xây dựng 
 và đã được báo cáo thường xuyên trong các tạp chí, sách, 
 báo và hội thảo khoa học
a Ngoài ra còn các hệ chuyên gia được sử dụng trong các 
 công ty, các tổ chức quân sự mà không được công bố vì lý 
 do bảo mật
 19/57
 MMộộtt ssốố llĩĩnhnh vvựựcc ứứngng ddụụngng
Lĩnh vực Ứng dụng diện rộng
 Tập hợp thích đáng những thành phần của một hệ
Cấu hình (Configuration)
 thống theo cách riêng
Chẩn đoán (Diagnosis) Lập luận dựa trên những chứng cứ quan sát được
 Dạy học kiểu thông minh sao cho sinh viên có thể hỏi
Truyền đạt (Instruction) vì sao (why?), như thế nào (how?) và cái gì nếu (what 
 if?) giống như hỏi một người thầy giáo
Giải thích (Interpretation) Giải thích những dữ liệu thu nhận được 
 So sánh dữ liệu thu lượm được với dữ liệu chuyên 
Kiểm tra (Monitoring) 
 môn để đánh giá hiệu quả
Lập kế hoạch (Planning) Lập kế hoạch sản xuấ t theo yêu cầu
Dự đoán (Prognosis) Dự đoán hậ u quả từ một tình huống xảy ra
Chữa trị (Remedy) Chỉ định cách thụ lý m ột vấn đề
 Điều khiển một quá trình, đòi hỏi diễn giải, chẩn 
Điều khiển (Control) 
 đoán, kiểm tra, lập kế hoạch, dự đoán và chữa trị
 20/57
 Một số hệ chuyên gia 1 
Bảng 1 Ngành hoá học (Chemistry)
CRYSALIS Interpret a protein’n 3-D structure
DENDRAL Interpret molecular structure 
 Remedy Triple Quadruple Mass Spectrometer (keep 
TQMSTUNE
 it tuned)
CLONER Design new biological molecules
MOLGEN Design gene - cloning experiments
SECS Design complex organic molecules
SPEX Plan molecular biology experiments
 21/57
 Một số hệ chuyên gia 2 
Bảng 2 Ngành điện tử (Electronics)
ACE Diagnosis telephone network faults
IN -ATE Diagnosis oscilloscope faults
NDS Diagnosis national communication net
EURISKO Design 3-D micro-electronics
PALLADIO Design and test new VLSI cicuits
REDESIGN Redesign digital circuits to new
CADHELP Instruct for computer aided design 
SOPHIE Instruct circuit fault diagnosis
 22/57
 Một số hệ chuyên gia 3 
Bảng 3 Ngành địa chất (Geology)
DIPMETER Interpret dipmeter logs
LITHO Interpret oil well log data 
MUD Diagnosis / remedy drilling problems
PROSPECTOR Interpret geologic data for minerals
Bảng 4 Công nghệ (Engineering)
REACTOR Diagnosis / remedy reactor accidents
DELTA Diagnosis / remedy GE locomotives
STEAMER Instruct operation - steam power-plant
 23/57
 Một số hệ chuyên gia 5 
Bảng 5 Ngành y học (Medicine) 
PUFF Diagnosis lung disease
VM Monitors intensive - care patients
ABEL Diagnosis acid - base / electrolytes 
AI/COAG Dianosis blood disease 
AI/ RHEUM Diagnosis rheumatoid disease
CADUCEUS Diagnosis internal medicine disease
ANNA Monitor digitalis therapy
BLUE BOX Diagnosis / remedy depression
MYCIN Diagnosis / remedy bacterial infections 
ONCOCIN Remedy / manage chemotherapy patient
ATTENDING Instruct in anesthetic manegement
GUIDON Instruct in bacterial infections
 24/57
 Một số hệ chuyên gia 6 
Bảng 6 Máy tính điện tử (Computer systems)
PTRANS Prognosis for managing DEC computers
BDS Diagnosis bad parts in switching net
XCON Configune DEC computer systems
XSEL Configure DEC computer sales order 
XSITE Configure customer site for DEC computers
YES/MVS Monitor / control IBM MVS opeating system 
TIMM Diagnosis DEC computer
 25/57
 ExampleExample ofof ESES
The end-user usually sees an expert system through an 
interactive dialog :
 Q. Do you know to which restaurant you want to go? 
 A. No 
 Q. Is there any kind of food you would particularly like? 
 A. Unknown 
 Q. Do you like spicy food? 
 A. No 
 Q. Do you usually drink wine with meals? 
 A. Yes 
 Q. When you drink wine, is it French wine? 
 A. Why 
 26/57
ExampleExample ofof ESES
 27/57
 ESES ProblemsProblems
a Limited knowledge
 V “Shallow” knowledge
 ™ no “deep” understanding of the concepts and their relationships
 V no “common-sense” knowledge
 V no knowledge from possibly relevant related domains
 V “closed world”
 ™ the ES knows only what it has been explicitly “told”
 ™ it doesn’t know what it doesn’t know
a Mechanical reasoning
 V may not have or select the most appropriate method for a 
 particular problem
 V some “easy” problems are computationally very expensive
a Lack of trust
 V users may not want to leave critical decisions to machines
 28/57
 ESES DesignDesign ++ DevelopmentDevelopment
a Which are the major steps in the Linear Model
 of ES Development?
a What do you have to take into account
 when you plan an ES project?
a What can you say about the delivery phase
 of an ES project?
a What kind of errors can occur
 (during the development) of an ES? 
 29/57
 ESES DesignDesign ++ DevelopmentDevelopment
a Major basic steps in ES development
 ™ Identification:
 Determine problem and project requirements
 ™ Conceptualization: Extract knowledge and construct a 
 conceptual model for solving problems using the knowledge
 ™ Formalization: Map the conceptual model to available 
 representation and control paradigms
 ™ Implementation: Construct/extend the implementation of 
 the formalized model
 ™ Testing: Evaluate the system
a Software Engineering models
a Project phases
a Linear Model of ES Development 
a Sources of error in ES 
 30/57
TheThe linearlinear modelmodel ofof ESES developmentdevelopment lifelife cyclecycle
 31/57
 Các phần tử của HCG
a Môt HCG gồm 3 thành phần cơ bản :
 ‰ CCơơ ssởở tritri ththứứcc (Knowledge(Knowledge Base)Base)
 ‰ MMááyy duyduy didiễễnn (Inference(Inference Engine)Engine)
 ‰ GiaoGiao didiệệnn ngngưườờii ssửử ddụụngng (User(User Interface)Interface)
a Ngoài ra, tuỳ theo mức độ tiếp cận, mà người ta 
 bổ sung các thành phần khác, chẳng hạn :
 ‰ LLịịchch côngcông viviệệcc (Agenda)(Agenda)
 ‰ BBộộ nhnhớớ llààmm viviệệcc (Working(Working Memory)Memory)
 ‰ KhKhảả nnăăngng gigiảảii ththííchch (Explanation(Explanation Facility)Facility)
 ‰ KhKhảả nnăăngng thuthu nhnhậậnn tritri ththứứcc (Explanation(Explanation Facility)Facility)
 ‰ 
 32/57
 GeneralGeneral ArchitectureArchitecture ofof SESE
 End-User
 KnowledgeKnowledge BaseBase
Facts / Information
 InferenceInference EngineEngine
 Expertise
 Expert System
 33/57
 ExpertExpert systemsystem modelmodel -- mainmain partsparts
 Knowledge Base
 (rules)
 Knowledge 
 Acquisition 
 Facility
 Inference Engine Agenda
User Interface
 Explanation 
 Facility Working Memory
 (facts) 
 34/57
 Instructions & Solutions &
 Knowledge
 User information explanations
 User
 interface
 Know- Problem
 Inference ledge
 engine base Domain
 Development
Expert engine
system AnAn ExpertExpert 
 SystemSystem ModelModel
 Expert and knowledge 
 engineer
 35/57
 Một số mô hình khác
 KnowledgeKnowledge KnowledgeKnowledge 
 BaseBase BaseBase editoreditor
InferenceInference 
 UserUser
 EngineEngine 
 WorldWorld 
 PreceptorsPreceptors
 ModelModel
 ExplanationExplanation 
 SubsystemSubsystem
 36/57
 Mô hình J. L. Ermine
 CCơơ ssởở tritri ththứứcc
 Người sử dụng 
 yêu cầu
HHệệ ththốốngng
 GiaoGiao 
thuthu nhnhậậnn Dữ liệu vấn đề
 didiệệnn cần giải quyết
 tritri ththứứcc 
 Tri thức mới
 BBộộ nhnhớớ
 làmlàm viviệệ c c 
 37/57
 Mô hình C. Ernest
 TriTri ththứứcc
Chuyên Cơ sở
 gia Cơ sở
 tritri ththứứcc
 CCấấuu trúctrúc 
 máymáy suysuy didiễễnn 
 MáyMáy
 DDữữ liliệệuu suy diễn
Người suy diễn 
 sử 
 dụng
 ••LLờờii gigiảảii
 ••GiGiảảii thíchthích
 ••TheoTheo dõidõi
 38/57
 Mô hình E. V. Popov
 KhKhảả nnăăngng
 gigiảảii thíchthích
ChuyênChuyên 
 giagia
 GiaoGiao didiệệnn
 ngngườườii BBộộ nhnhớớ CCơơ ssởở
 DiDiễễnn ddịịchch
 ssửử ddụụngng làmlàm viviệệcc tritri ththứứcc
NgNgườườii 
ssửử ddụụngng 
 SSởở hhữữuu
 tritri ththứứcc
 39/57
 TriTri ththứứcc vvàà CCơơ ssởở tritri ththứứcc
a Tri thức trong HCG : 
 V Phản ánh sự tinh thông được tích tụ từ sách vở, tạp chí,
 từ các chuyên gia hay các nhà bác học
a Cơ sở tri thức gồm :
 V Các phần tử (hay đơn vị) tri thức được tổ chức như một CSDL
 V Tuỳ theo phương pháp phát triển HCG mà các phần tử có đặc 
 trưng, tính chất khác nhau
 V Chẳng hạn trong các HCG dựa theo luật (Rules-Based ES) :
 ™ Mỗi phần tử tri thức là một luật
 ™ Cơ sở tri thức như vậy còn được gọi là bộ nhớ sản xuất 
 (Production Memeory)
 40/57
 PhânPhân loloạạii tritri ththứứcc
a Người ta thường phân loại tri thức theo nhiều cách
a Theo phân loại chức năng, có hai loại tri thức :
 V Tri thức phán đoán (Assertion Knowledge) :
 mô tả các tình huống đã được thiết lập hoặc sẽ được thiết lập
 V Tri thức thực hành (Operating Knowledge)
 thể hiện những hậu quả rút ra hay những thao tác cần phải hoàn 
 thiện khi một tình huống đã được thiết lập hoặc sẽ được thiết lập 
 trong lĩnh vực đang xét
a Tri thức thực hành :
 V Thường được thể hiện bởi các biểu thức Toán học+Lôgic
 dễ hiểu, dễ triển khai 
 V NSD có thể thao tác với tri thức như khai thác một CSDL
 41/57
 PhânPhân loloạạii tritri ththứứcc theotheo bibiểểuu hihiệệnn
aTheo phân loại theo biểu hiện, cũng có hai loại :
aTri thức hiện, rõ (explicit knowledge)
 V Diễn đạt bằng ngôn ngữ hình thức, dễ trao đổi giữa các cá nhân
 V Có thể biểu diễn bằng các công thức khoa học, các thủ tục tường 
 minh, hoặc nhiều cách khác
 V Bao gồm thông tin, dữ liệu, sách báo, văn bản, tài liệu đã được hệ
 thống bằng nhiều phương tiện
aTri thức ngầm, ẩn (tacit knowledge) 
 V Có được và ẩn chứa trong kinh nghiệm của từng cá nhân, mang tính 
 chủ quan, bao gồm những hiểu biết riêng thấu đáo, trực giác, linh 
 cảm, kỹ năng, 
 V Khó trao đổi hoặc chia sẻ với người khác
 V Chỉ có thể học được từ người khác nhờ quan hệ gần gũi trong một 
 khoảng thời gian nào đó
 42/57
Knowledge-base may really include many things
 HeuristicsHeuristics
 EventsEvents
HypothesisHypothesis 
 Definitions
 FactsFacts Knowledge Definitions
 Base
 RulesRules RelationshipsRelationships
 ProcessesProcesses AttributesAttributes
 ObjectsObjects
 43/57
 KhKhááii niniệệmm vvềề Quản trị tri thức
a Người ta thường nói : 
 V Tri thức là sức mạnh
 V Tri thức là của cải 
a Các tổ chức của LHQ rút ra kết luận rằng :
 V Kinh tế thế giới phát triển mạnh mẽ do biết dựa vào tri thức
a Làm thế nào để sáng tạo và sử dụng đúng đắn các tri thức
a Quản trị tri thức (Knowledge Management) 
 44/57
 ESES Elements:Elements: MMááyy duyduy didiễễnn
a Máy duy diễn (inference engine) :
 V Công cụ (chương trình, hay bộ xử lý) tạo ra sự suy luận bằng 
 cách quyết định xem những luật nào sẽ làm thỏa mãn các sự
 kiện, các đối tượng
 V Chọn ưu tiên các luật thỏa mãn
 V Thực hiện các luật có tính ưu tiên cao nhất
 45/57
 ESES ElementsElements :: GiaoGiao didiệệnn ngngưườờii ssửử ddụụngng
a Giao diện người sử dụng (user interface) : 
 V Là nơi người sử dụng và hệ chuyên gia trao đổi với nhau
 46/57
 ESES ElementsElements :: CCáácc ththàànhnh phphầầnn khkháácc
a Lịch công việc (agenda) :
 V Danh sách các luật ưu tiên do máy suy diễn tạo ra thoả mãn 
 các sự kiện, các đối tượng có mặt trong bộ nhớ làm việc.
a Bộ nhớ làm việc (working memory) :
 V Cơ sở dữ liệu toàn cục chứa các sự kiện phục vụ cho các luật
a Khả năng giải thích (explanation facility) :
 V Giải nghĩa cách lập luận của hệ thống cho người sử dụng
a Khả năng thu nhận tri thức (explanation facility) :
 V Cho phép NSD bổ sung tri thức vào hệ thống
 V Khả năng thu nhận tri thức là yếu tố mặc nhiên của nhiều hệ
 chuyên gia
 47/57
 PhPháátt hihiệệnn tritri ththứứcc vvàà khaikhai phpháá ddữữ liliệệuu
a Phát hiện tri thức (PHTT) và khai phá dữ liệu (KPDL) 
a Bối cảnh :
 V Sự phát triển nhanh chóng của lĩnh vực CNTT và ứng dụng CNTT trong đời 
 sống, kinh tế, xã hội, quốc phòng hiện nay
 V Khối lượng dữ liệu thu thập, xử lý, khai thác và lưu trữ ngày càng tích luỹ
 nhiều lên
 V Tuy nhiên, chỉ có khoảng từ 5% đến 10% lượng dữ liệu có ý nghĩa sử dụng 
 theo thống kê
 V Rất nhiều dữ liệu chưa được sử dụng hiệu quả nhưng vẫn phải tiếp tục thu 
 thập rất tốn kém (nỗi lo sợ bỏ sót dữ liệu quan trọng có thể cần đến sau này)
 V Trong môi trường cạnh tranh, nhu cầu có nhiều thông tin với tốc độ nhanh 
 để trợ giúp ra quyết định và ngày càng có nhiều câu hỏi mang tính chất định 
 tính cần phải trả lời dựa trên một khối lượng dữ liệu khổng lồ đã có
 V Các phương pháp quản trị và khai thác cơ sở dữ liệu truyền thống ngày càng 
 không đáp ứng được thực tế
a Sự ra đời kỹ thuật “Phát hiện tri thức và khai phá dữ liệu”
 48/57
 TTììnhnh hhììnhnh nghiênnghiên ccứứuu PHTTPHTT vvàà KPDLKPDL
a Thuật ngữ : 
 V Phát hiện tri thức (Knowledge Discovery)
 V Khai phá dữ liệu (Data Mining)
a Đã và đang được nghiên cứu, ứng dụng trong nhiều lĩnh 
 vực khác nhau ở các nước trên thế giới
a Tại Việt Nam :
 V Kỹ thuật này vẫn còn tương đối mới mẻ 
 V Đang được nghiên cứu 
 V Đang dần đưa vào ứng dụng thực tiễn
 49/57
 KhKhááii niniệệmm ““KhaiKhai phpháá ddữữ liliệệuu””
a Khai phá dữ liệu (Data Mining) : 
 quá trình trích xuất các thông tin có giá trị tiềm ẩn bên 
 trong lượng lớn dữ liệu được lưu trữ trong các CSDL,
 kho dữ liệu
a Hiện nay, ngoài thuật ngữ khai phá dữ liệu, người ta còn 
 dùng một số thuật ngữ khác có ý nghĩa tương tự như :
 V Khai phá tri thức từ CSDL
 (Knowlegde Mining From Databases)
 V Trích lọc dữ liệu (Knowlegde Extraction)
 V Phân tích dữ liệu/mẫu (Data/Pattern Analysis)
 V Khảo cổ dữ liệu (Data Archaeology)
 V Nạo vét dữ liệu (Data Dredging)
 50/57
 QuiQui trtrììnhnh 55 bbưướớcc PHTTPHTT vvàà KPDLKPDL
1. Tìm hiểu lĩnh vực ứng dụng và hình thành bài toán 
 Đây là bước quyết định cho phép chọ n các phương pháp khai phá dữ liệu thích 
 hợp với mục đích ứng dụng và bản chất của dữ liệu
2. Thu thập và xử lý thô (hay tiền x ử lý dữ liệu) 
 Bư ớc này thường chi ếm dụng nhiều thời gian trong toàn bộ qui trình 
3. Khai phá dữ liệu, hay nói cách khác là trích ra các mẫu và/ho ặc các mô 
 hình ẩn dưới các dữ liệu
 Đây là giai đoạn thiết yếu, trong đó các phương pháp thông minh sẽ được áp 
 dụng để trích xuất ra các mẫu dữ liệu hay tri thức hữu ích
4. Đánh giá mẫ u (pattern evaluation) : 
 Hiể u tri thức đ ã tìm được, đặc biệt là làm sáng tỏ các mô tả và dự đoán, đánh 
 giá sự hữu ích của các mẫu biểu diễn tri thức dựa vào một số phép đo
5. Trình diễ n dữ liệu (knowlegde presentation): 
 sử dụng các kĩ thu ật trình diễn và trực quan hoá dữ liệu để biểu diễn tri thức 
 khai phá được cho người sử dụng
 51/57
 XXửử lýlý thôthô ddữữ liliệệuu
a Làm sạch dữ liệu (data cleaning) : 
 loại bỏ nhiễu hoặc các dữ liệu không thích hợp
a Tích hợp d ữ liệu (data integration) :
 tích hợp dữ liệu từ các nguồn khác nhau như :
 CSDL, Kho dữ li ệu, các loại văn bản khác nhau... 
a Chọn dữ liệu (data selection) :
 ở bước này, những dữ liệu liên quan trực tiếp đến nhiệm vụ sẽ 
 được thu thập từ các nguồn dữ liệu ban đầu
 được thu thập từ các nguồ n dữ liệu ban đầu 
a Chuyển đổi dữ liệu (data transformation) :
 trong bước này, dữ liệu sẽ được chuyển đổi về dạng phù hợp 
 cho việc khai phá bằng cách thực hiện các thao tác nhóm hoặc 
 cho việc khai phá bằng cách thực hiện các thao tác nhóm ho ặc 
 tập hợp
 tập hợp 
 52/57
 QuiQui trtrììnhnh PHTTPHTT vvàà KPDLKPDL
a Các bước trong quy trình có thể lặp đi lặp lại một số lần
a Kết quả thu được có thể được lấy trung bình từ số lần thực hiện
 53/57
 CCáácc phphươươngng phpháápp PHTTPHTT vvàà KPDLKPDL
a Nhằm hai mục đích chính : 
 V Dự đoán (Prediction)
 V Mô tả (Description)
a Thường sử dụng các phương pháp sau :
 V Phân loại (Classification)
 V Hồi qui (Regression)
 V Phân nhóm (Clustering)
 V Tổng hợp (Summarization)
 V Mô hình ràng buộc (Dependency modeling)
 V Dò tìm biến đổi và độ lệch (Change and Deviation Dectection)
 V Biểu diễn mô hình (Model Representation)
 V Kiểm định mô hình (Model Evaluation)
 V Phương pháp tìm kiếm (Search Method)
 54/57
 CCáácc llĩĩnhnh vvựựcc liênliên quanquan đđếếnn PHTTPHTT vvàà KPDLKPDL
a PHTT và KPD liên quan đến nhiều ngành, nhiều lĩnh v ực :
 V Thống kê
 V Trí tuệ nhân tạo
 V Cơ sở dữ liệu
 V Thuật toán học
 V Tính toán song song và tốc độ cao
 V Thu thập tri thức cho các hệ chuyên gia
 V Quan sát dữ liệu... 
a PHTT và KPD rất gần gũi với các lĩnh vực :
 V Thống kê, sử dụng các phương pháp thống kê để mô hình dữ liệu 
 và phát hiện các mẫu, luật...
 V Ngân hàng dữ liệu (Data Warehousing) và các công cụ phân tích 
 trực tuyến (OLAP)
 55/57
 ỨỨngng ddụụngng PHTTPHTT vvàà KPDLKPDL
a Thông tin thương mại : 
 V Phân tích dữ liệu marketing, khách hàng
 V Phân tích đầu tư
 V Phê duyệt cho vay vốn
 V Phát hiện gian lận
a Thông tin kỹ thuật :
 V Điều khiển và lập lịch trình
 V Quản trị mạng
 V Phân tích các kết quả thí nghiệm
a Thông tin khoa học
a Thông tin cá nhân...
 56/57
 CCáácc ththááchch ththứứcc ccủủaa PHTTPHTT vvàà KPDLKPDL
a Các CSDL thường rất lớn, thường xuyên biến đổi 
 và phát triển không ngừng
a Đặc điểm :
 V Các CSDL thường có số chiều lớn 
 V Thay đổi dữ liệu và tri thức có thể làm cho các mẫu đã phát 
 hiện không còn phù hợp
 V Dữ liệu bị thiếu hoặc nhiễu
 V Quan hệ giữa các trường dữ liệu phức tạp
a Vấn đề giao tiếp với người sử dụng
 và kết hợp với các tri thức đã có
a Khả năng tích hợp với các hệ thống khác...
 57/57

File đính kèm:

  • pdfbai_giang_he_chuyen_gia_expert_system_chuong_1_mo_dau_ve_he.pdf