Ứng dụng mô hình hồi quy logistic dự báo ống bể trên hệ trên hệ thống phân phối nước
Tóm tắt: Hiện tượng bể ống cấp nước thường xuyên xảy ra trên các hệ thống phân phối không
những gây nên những tổn thất về mặt kinh tế cho các công ty cấp nước mà còn là nguy cơ để các
chất ô nhiễm xâm nhập vào đường ống cấp nước. Một số mô hình đã được phát triển để xác định
khả năng xảy ra ống hỏng từ số liệu thống kê hoặc thực nghiệm, tuy nhiên đa số các mô hình đều
giới hạn cho vật liệu ống kim loại, trong khi số lượng ống nhựa như uPVC, HDPE được sử dụng
rất nhiều trên mạng lưới lại bị bỏ qua. Trong bài báo này sẽ đề xuất mô hình hồi quy logistics để
xác định mối liên quan giữa hiện tượng ống bể và các đặc điểm của đường ống trên mạng lưới
phân phối, từ đó đưa ra dự báo về xác suất bể ống cho tất cả các loại vật liệu ống dẫn trên mạng
lưới cấp nước. Kết quả của mô hình được kiểm chứng cho mạng lưới phân phối nước quận Hải
Châu thành phố Đà Nẵng.
Tóm tắt nội dung tài liệu: Ứng dụng mô hình hồi quy logistic dự báo ống bể trên hệ trên hệ thống phân phối nước
KHOA HỌC CÔNG NGHỆ ỨNG DỤNG MÔ HÌNH HỒI QUY LOGISTIC DỰ BÁO ỐNG BỂ TR Ê N HỆ THỐNG PHÂN PHỐI NƯỚC Phạm Thị Minh Lành ĐH Bách Khoa Tp. Hồ Chí Minh Phạm Hà Hải ĐH Kiến Trúc Tp. Hồ Chí Minh Vũ Thị Vân Anh ĐH Tài nguyên và Môi trường TPHCM Trương Thị Thu Hằng ĐH Thủy Lợi, số 2 Trường Sa Nguyễn Quang Trưởng và Lê Đình Hồng ĐH Bách Khoa Tp. Hồ Chí Minh Tóm tắt: Hiện tượng bể ống cấp nước thường xuyên xảy ra trên các hệ thống phân phối không những gây nên những tổn thất về mặt kinh tế cho các công ty cấp nước mà còn là nguy cơ để các chất ô nhiễm xâm nhập vào đường ống cấp nước. Một số mô hình đã được phát triển để xác định khả năng xảy ra ống hỏng từ số liệu thống kê hoặc thực nghiệm, tuy nhiên đa số các mô hình đều giới hạn cho vật liệu ống kim loại, trong khi số lượng ống nhựa như uPVC, HDPE được sử dụng rất nhiều trên mạng lưới lại bị bỏ qua. Trong bài báo này sẽ đề xuất mô hình hồi quy logistics để xác định mối liên quan giữa hiện tượng ống bể và các đặc điểm của đường ống trên mạng lưới phân phối, từ đó đưa ra dự báo về xác suất bể ống cho tất cả các loại vật liệu ống dẫn trên mạng lưới cấp nước. Kết quả của mô hình được kiểm chứng cho mạng lưới phân phối nước quận Hải Châu thành phố Đà Nẵng. Từ khóa: ống cấp nước; mô hình hồi quy logistic; hệ thống phân phối nước; phần mềm R. Abstract: Pipe failure phenomenon often have on water distribution systems, it is not only causes economic losses to water supply companies, but also the risk of pathogen contaminant intrusion into the pipe. Some models were applied to define probability of pipe failure by statistic data or experimental data, but most models are limited to metal materials, however the number of plastic as UPVC, HDPE is used popular on the network again ignored. In this paper, we propose a logistic regression model to determine the relationship between the likelihood of pipe failure and pipe characteristics on the water distribution systems for all pipe materials. Results of model will be apply for water distribution system in Hai Chau district, Da Nang city. Keywords: water supply pipe; Logistic Regression Model; water distribution systems; R software. 1. GIỚI THIỆU * cạnh đó hoạt động sửa chữa cũng làm ảnh Mỗi ngày, các công ty cấp nước đều ghi nhận hưởng đáng kể đến chất lượng phục vụ của hệ các sự cố bể vỡ trên tuyến ống đặc biệt là các thống, chưa kể đến khả năng làm gián đoạn tuyến ống dịch vụ và vẫn tốn thêm chi phí để giao thông của khu vực đặt ống. Để giảm thiểu tìm rò bể trên các tuyến ống cấp I, II [1]. Đôi chi phí quản lí đồng thời ngăn chặn nguy cơ khi chi phí để sửa chữa đoạn ống nhiều lần sẽ lan truyền bệnh qua hệ thống phân phối nước, cao hơn so với việc lắp đặt ống mới [2]. Bên cần phải có một kế hoạch bảo dưỡng hợp lí và thay thế kịp thời các đường ống có nguy cơ gi ảm hiệu suất làm việc hay không còn khả Ngày nhận bài: 27/6/2017 năng phục vụ. Một trong những cơ sở quan Ngày thông qua phản biện: 22/7/2017 Ngày duyệt đăng: 28/7/2017 trọng để xây dựng quy trình này là dự báo khả TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 1 KHOA HỌC CÔNG NGHỆ năng ống bể trên hệ thống phân phối nước. ANN để tăng hiệu suất mô hình [6], kết quả Vậy nên, nghiên cứu được thực hiện với các cho thấy tuổi ống ảnh hưởng đến điều kiện mục tiêu sau: đánh giá là 20,95%, vật liệu là 17,49 % và tỉ lệ - Đánh giá các yếu tố liên quan tới khả năng bể ống 13,13%, mục đích cung cấp nước của hỏng của ống dẫn nước cấp. từng đoạn ống cũng được cho là ảnh hưởng tới khả năng bể ống là 2,85%. Một trong những - Đề xu ất mô hình dự báo ống bể trên hệ thống nhược điểm của mô hình ANN là thời gian phân phối. chạy mô hình lớn và chi phí cho khảo sát số Nghiên cứu được giới hạn trong các nội dung liệu đầu vào khá cao, vậy nên mô hình mới chỉ sau: đáp ứng cho nghiên cứu học thuật. - Bỏ qua đặc điểm hình học của điểm bể (bể Các mô hình hồi quy tuyến tính được áp dụng do vết nứt dọc, vết nứt vòng hay vết nứt phổ biến cho dự báo khả năng làm việc của ngang). ống do nội dung phương pháp đơn giản và - Ống dẫn làm việc trong điều kiện bình được Andreou,1987 đánh giá đạt kết quả chính thường, không xét tới sự cố bất thường gây xá c đến 70% [7], đồng thời tác giả cũng nhận nên bể ống và các trường hợp bể tại phụ tùng định ống hỏng phụ thuộc vào đường kính, vị đấu nối. trí đặt ống, nguyên nhân gây bể và không phụ thuộc vào độ tuổi. Những kết luận đánh giá về - Khu vực áp dụng là dự báo khả năng ống tỉ lệ bể bị ảnh hưởng bởi lần vỡ thứ hai cũng hỏng trên mạng lưới cấp nước quận Hải Châu, được đưa ra từ mô hình tuyến tinh, những ống thành phố Đà Nẵng. bể sớm sau giai đoạn cài đặt sẽ có tỉ lệ nguy cơ 2. TỔNG QUAN CÁC NGHIÊN CỨU cao hơn những ổng bể ở giai đoạn sau này [8]. Ống cấp nước bị bể là tập hợp của các yếu tố So sánh hiệu quả các mô hình hồi quy tuyến đã phân tích ở trên, để đánh giá mức độ ảnh tính, Poisson, số mũ tác giả [9] đề xu ất mô hưởng của các yếu tố này bằng phương pháp hình số mũ thời gian và Poisson là mô hình dự thống kê tác giả thường sử dụng các mô hình báo chính xác nguy cơ bể, đặc biệt là đếm số mũ, hồi quy tuyến tính, mô hình Bayesian, được số lần không bể. Đường kính ống , vật Poisson. Mỗi mô hình có một ưu điểm riêng và liệu, khu vực bao phủ là rừng, đất nông phù hợp với số liệu khảo sát. nghiêp, giao thông, và biến đo đếm được như Nhận định ban đầu cho rằng khả năng ống nhiệt độ, lượng mưa, độ ẩm của đất là một hỏng phụ thuộc vào thời gian làm việc, tác giả trong nhưng nguyên nhân gây nên bể vỡ trong [3] đã đưa ra mô hình số mũ để mô tả hiện hệ thống. Nghiên cứu này lại đưa ra kết luận tượng này và mô hình này tiếp tục được phát khác với tác giả [8]: tỉ lệ bể vỡ tăng theo thời triển bởi Ossman năm 2011 [4], từ lịch sử bể gian tính từ lần bể cuối cùng. ống để dự báo xác suất hỏng trong tương lai Hồi quy Bayesian là mô hình mới được áp tuy nhiên dữ liệu khảo sát chưa đề cấp tới các dùng trong các nghiên cứu gần đây, với những yếu tố liên quan tới môi trường làm việc của ưu điểm của mô hình đã giúp bài toán có kết ống như điều kiện áp suất, môi trường trong và quả chính xác hơn các phương pháp trước. ngoài ống. Một số nghiên cứu tiếp cận theo Đánh giá các yếu ảnh hưởng là các biến không phương pháp mạng ANN để xác định hiệu suất chắc chắn [10] chạy mô hình tính được hệ số làm việc của hệ thống cũng như tỉ lệ hỏng ống ảnh hưởng của điều kiện ống và môi trường trong thời gian làm việc [5], ngoài ra còn đề xung quanh cho từng loại vật liệu. Kết quả cho xuất đưa phân tích phân tầng vào mô hình thấy ảnh hưởng của các tính chất vật lí ống 2 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 KHOA HỌC CÔNG NGHỆ dẫn quan trọng hơn tác động của môi trường Nội dung 2: Dự báo xác suất hỏng của ống (P) đặt ống, đặc biệt các vật liệu CI và DI có khả làm việc trong môi trường thực tế. năng bể cao hơn do tác động của nhiệt độ và Nghiên cứu được thực hiện qua các bước như lượng mưa. hình 1. Nội dung nghiên cứu sẽ tập trung nhiều Phân tích các nghiên cứu trước đây, đề tài đưa hơn tới đặc điểm hình học của mạng lưới ống ra một số kết luận sau: dẫn cũng như vị trí tuyến đường đặt ống, tổng - Để xác định được tỉ lệ ăn mòn trên các ống chiều dài trong một DMA của mạng. thực tế rất khó thực hiện nên các nghiên cứu hiện nay mới dừng ở hai vật liệu là ống gang Phân tích điều kiện Các yếu tố liên quan tới và ống thép. Bên cạnh đó, đa số các đường ống cấp nước xác suất bể ống cấp nước ống cấp nước được chôn dưới mặt đất nên chi phí lấy mẫu sẽ rất tốn kém, các mẫu ống thường chỉ khảo sát trên một tuyến đường như Mô hình dự báo Mô hình hồi quy vậy tính chất đại diện của mẫu nghiên cứu ống bể logistic chưa cao. Vậy nên các kết luận về bể vỡ ống do ăn mòn hay không phải do ăn mòn cần phải Mô tả số liệu được nghiên cứu nhiều hơn trong tương lai. Kiểm chứng mô - Thông số đại diện cho ăn mòn là độ tuổi ống hình Áp dụng mô hình dẫn và đã được chứng minh là có mối tương quan giữa tuổi bể vỡ và khả năng xuất hiện bể ống, không những thế những ống bể sớm thì Kết luận Kiểm định mô hình tuổi thọ ống dẫn sẽ ngắn hơn những ống bể muộn hơn. Yếu tố vật liệu ống, môi trường Hình 1. Nội dung nghiên cứu dự báo ống hỏng làm việc và vị trí đặt quan trọng hơn là độ tuổi trên HTPPN khi xem xét khả năng bể vỡ. Hệ thống cấp nước của Việt Nam bắt đầu số - Đường kính ống dẫn là một trong những hóa khoảng từ năm 2013 và vẫn đang trong thông tin đáng tin cậy để dự báo khả năng bể gi ai đoạn hoàn chỉnh, đồng bộ hóa thông tin, vỡ, các tác giả cho thấy tỉ lệ ống hỏng tăng vậy nên trong quá trình thu thập dữ liệu có theo đường kính với những ống có đường kính những số liệu không có khả năng thu thập nhỏ 300mm, tuy nhiên kết quả này được lưu ý cũng như thời gian thực hiện không cho phép là còn phụ thuộc vào diện tích thành phố khảo nên giới hạn đề tài đặt ra là phân tích trên sát. Áp suất làm việc trong ống cũng cần xem những số liệu thu thập được từ hệ thống thông xét cụ thể hơn về mức độ ảnh hưởng tới khả tin GIS của hệ thống cấp nước. Vì vậy kết quả năng ống bể. của đề tài có thể không đánh giá chi tiết được Cải thiện kết quả của các nghiên cứu trước đây các điều kiện liên quan như chỉ số dẫn điện, độ và phát triển mô hình dự báo ống bể trong điều ẩm của môi trường đất bên ngoài hay chỉ số kiện Việt Nam, tác giả đặt ra nội dung chính oxy hóa tan của nước trong đường ống, giá trị cần nghiên cứu như sau: lực tác dụng từ nền đường cho từng đoạn ống. Nội dung 1: mức độ ảnh hưởng của các yếu tố Tuy nhiên mô hình đề xuất trong nghiên cứu tới sự kiện ống hỏng trên hệ thống cấp nước và lại có tính áp dụng thực tế tốt hơn, từ những trong các yếu tố đó thì yếu tố nào ảnh hưởng dữ liệu GIS của công ty cấp nước hoàn toàn có nhiều nhất tới sự kiện ống hỏng. thể ước lượng khả năng ống bể mà không phải TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 3 KHOA HỌC CÔNG NGHỆ thu thập hay khảo sát cụ thể từng vị trí đặt ống sự kiện ống hỏng. trên mạng lưới. Vật liệu ống dẫn (Mat) Các yếu tố ảnh hưởng tới ống hỏng được xem Tính chất cơ học của vật liệu là khác nhau, vật xét trong đề tài bao gồm các đặc trưng vật lí liệu kim loại được cho là dễ ăn mòn hơn trong của hệ thống (D, L, Mat), chỉ số độ tuổi (A) môi trường ẩm ướt trong khi vật liệu nhựa lại đại diện cho tỉ lệ ăn mòn và giá trị áp suất dễ bị lão hóa và khả năng chịu tải được cho là trung bình làm việc của ống (P). Ngoài ra các kém hơn [20]. Trong mạng lưới phân phối đại lượng đặc trưng cho đặc điểm hình học của nước đô thị, những ống truyền tải thường sử mạng lưới bao gồm vị trí tuyến đường đặt ống dụng vật liệu kim loại như SS, ST đặc biệt là (R), số đoạn ống kết nối trên một tuyến ống vật liệu gan g xám (CI) t ron g t hời gian trước (N0), tổng chiều dài ống trong một DMA và số đây được sử dụng phổ biến, nên đa số các lần bể vỡ trước đây (Prior) cũng được khảo sát nghiên cứu bể ống hiện nay cũng tập trung để đưa vào mô hình thống kê. xe m xét vật liệu này. Tuy nhiên, nghiên cứu Độ tuổi ống dẫn (A) ống hỏng cần có dự báo rộng hơn trong tương Tuổi ống không phải là yếu tố ảnh hưởng trực lai nên hướng tiếp cận cần đa dạng hơn cho tất tiếp tới nguy cơ ống bể nhưng là giá trị hiển cả các loại vật liệu. Trong nghiên cứu này, các thị dễ nhất để nhận biết khả năng làm việc của vật liệu trong số liệu thống kê đều được xem ống. Với cùng một độ tuổi nhưng điều kiện vật xét, bao gồm SS, ST, DI, CI, uPVC, HDPE và lí khác nhau và môi trường làm việc khác nhau cả những ống AC (xi măng amiăng). thì xác suất xẩy ra ống hỏng cũng không giống Đường kính ống dẫn D(mm) nhau. Nhưng nếu dùng độ tuổi để xem xét thời điểm xảy ra bể vỡ nhiều đột ngột trong một Là đại lượng đặc trưng cho cho khả năng vận gi ai đoạn nhất định thì cũng có thể phát hiện ra chuyển nước của đường ống, với nhận định những yếu tố ảnh hưởng đặc biệt hoặc dự báo ban đầu cho thấy xác suất ống hỏng sẽ giảm một sự kiện bất thường trong tương lai. Vậy khi đường kính ống tăng. Theo yêu cầu sản nên cần thiết phải đưa biến độ tuổi vào trong xuất, chiều dày thành ống cũng tăng theo độ dữ liệu khảo sát. lớn của đường kính. Số lượng nút đấu nối t rên một tuyến ống Áp lực làm việc trung bình trong DMA (m) dẫn (N0) Áp lực làm việc thay đổi theo cấp ống phân Tổn thất cục bộ xuất hiện tại các vị trí chuyển phối và thời gian làm việc, không những thế hướng nước chảy và tổn t hất này thường được áp lực ống dẫn cũng có thể thay đổi khi xảy ra bỏ qua trên mạng lưới đường ống dẫn nước và áp va hoặc khu vực lắp đặt sửa chữa ống trong tính toán cũng cho thấy giá trị này không thường xuyên. Ngoài lực tác động lên thành làm ảnh hưởng nhiều tới áp lực làm việc trên ống, giá trị áp lực nước trong ống dẫn còn làm đường ống. Tuy nhiên nếu xét về mặt xáo trộn ảnh hưởng tới mức độ xáo trộn hóa chất và dòng chảy trong ống thì qua mỗi nút dòng lắng cặn. Áp lực yếu hoặc bằng 0 sẽ tạo điều chảy có sự xáo t rộn nhất định. Nếu đánh giá tỉ kiện cho cặn bám dính vào thành ống làm lệ ăn mòn bề mặt trong của ống dẫn ngoài tác gi ảm khả năng làm việc, khi áp lực dao động động của nồng độ hóa học và tính chất vật lý lại gây nên hiện tượng bào mòn vật liệu ống của nước thì xáo trộn dòng chảy giúp hóa chất [17]. Quá trình lặp lại nhiều lần theo thời gian được trộn đều hơn trên đường ống và giảm làm bề mặt ống dẫn không còn trơn nhẵn như hiện tượng lắng cặn. Vậy nên số lượng điểm lúc mới lắp đặt, một số vị trí bị lồi do lắng cặn, đấu nối trên một tuyến ống cũng ảnh hưởng tới một số vị trị khác lại bị bào mòn. Bề mặt vật liệu 4 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 KHOA HỌC CÔNG NGHỆ ngày càng khả năng chịu tải khả năng bể ống mỗi đoạn ống khảo sát. Chiều dài ống dẫn L(km) 3. ĐỀ XUẤT MÔ HÌNH DỰ BÁO ỐNG HỎNG Có nhiều quan điểm khác nhau khi dự báo xác Giới thiệu phần mềm R suất hỏng theo chiều dài ống, nghiên cứu gần Được phát triển từ năm 1996 bởi Ross Ihaka đây nhất cho rằng ống hỏng tăng khi chiều dài và Robert Gentleman [11] phần mềm R là một giảm nhưng có nghiên cứu lại cho rằng ống ngôn ngữ phân tích thống kê mới thay thế cho hỏng không tăng theo chiều dài mà tăng theo các phần mềm thống kê thương mại như SPSS, chiều dài bình phương. Trên phương diện thủy SAS, Stata, Stastistica. Ngôn ngữ R nhanh lực cho thấy, dọc theo chiều dài đường ống áp chóng được các nhà thống kê học hưởng ứng lực dòng chảy t rong ống giảm dần như vậy nguy và tham gia xây dựng các công cụ hỗ trợ cho cơ hỏng ống do tải trọng nước bên trong ống phần mềm, sau hơn 10 năm R đã trở thành cũng giảm. Tuy nhiên nếu xét tới các tác động từ ngôn ngữ thống kê phổ biến cho các nhà bên ngoài thì đoạn ống càng ngắn, ngoại lực tác nghiên cứu. dụng lên thành ống càng nhỏ khi đó nguy cơ ống hỏng lại tỉ lệ thuận với chiều dài. R là phần mềm có mã nguồn mở sử dụng cho thống kê và biểu diễn biểu đồ, có thể chạy trên Tuyến đường đặt ống R mô ... ty. năm 2016 cho thấy tỉ lệ ống bể trung bình - Mat là vật liệu ống dẫn, bao gồm AC, CI, DI, của các loại vật liệu có sự khác nhau như HDPE, SS, ST và uPVC Hình 3. Qua biểu đồ thống kê tỉ lệ bể vỡ qua các năm cho thấy giá trị này có xu thế giảm - D là đường kính ống dẫn. Đề tài tập trung theo từng loại vật liệu ống, trong đó ống AC nghiên cứu các đường ống có đường kính có tỉ lệ bể vỡ lớn nhất còn ống CI lại có số D≥100mm vì số liệu bể vỡ gh i nhận trên các lượng bể vỡ trên mạng lưới nhỏ nhất. Số lần ống có đường kính nhỏ hơn đa số là do hỏng ống ghi nhận được trên mạng lưới lớn khách hàng hoặc các công trình thi công gần nhất là ống uPVC (79 lần bể trong 6 năm) tuyến ống. tuy nhiên do tổng chiều dài vật liệu uPVC là - P là giá trị áp lực trung bình làm việc của lớn nhất trên mạng lưới nên tỉ lệ bể đối với đoạn ống được nội suy từ dữ liệu cảm biến áp vật liệu này chỉ đứng thứ 3, số liệu bể không lực trên mạng lưới. được ghi nhận trên ống sắt SS. Các nghiên - Cột Prior ghi nhận nếu ống hỏng lần thứ nhất cứu trước đây cho thấy ống có vật liệu DI có là No, nếu ống hỏng lần thứ 2 thì lịch sử bể vỡ khả năng bể cao hơn các vật liệu khác và kết Prior=1st tương tự cho ống hỏng lần thứ 3 thì luận này cũng đúng cho dữ liệu quận Hải Prior=2nd. Châu, Đà N ẵng. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 7 KHOA HỌC CÔNG NGHỆ Hình 3.Thống kê số lần bể vỡ theo chiều dài ống trên mạng lưới Từ số liệu thống kê, so sánh độ tuổi ống dẫn Hình 5. Biểu đồ quan hệ giữa A~Mat trong nhóm hỏng và không hỏng Hình 4 cho quận HC thấy tuổi ống trong nhóm hỏng (F=1) nhỏ hơn nhóm không hỏng (F=0), số liệu F=1 có phần Những ống có thời gian làm việc lâu nhất so diện tích 25% phía dưới trung vị lớn hơn, điều với các ống khác trên mạng lưới là vật liệu này chứng tỏ xu hướng ống hỏng ở độ tuổi trẻ uPVC (HC:17,42. Được cho là vật liệu có độ nhiều hơn độ tuổi già, còn trong tập F=0 thì bền cao và linh hoạt trong quá trình thi công trung vị chia hai phần tương đối đồng đều. Số lắp đặt, HDPE mới được đưa vào sử dụng phổ liệu ống không hỏng của quận HC xuất hiện biến trong những năm gần đây, nhưng số liệu hai gi á gi ới hạn hộp không nằm t ron g gi ới hạn khảo sát lại cho thấy tuổi ống nhỏ nhất (0,36 hộp, để xem xét hai giá t rị này có phải giá trị tuổi) lại xuất hiện trên vật liệu này, bên cạnh ngoại vi (Outlier) hay không cần kiểm định số đó xét tổng quát thì thời gian làm việc thực tế liệu để biết rõ hơn. của ống cũng nhỏ hơn các vật liệu khác. Một phần nguyên nhân là do kĩ thuật thi công mối hàn không đúng kết hợp với tải trọng khu vực đặt ống và môi trường đất gây nên bể ống. Số liệu bể cũng không tuyến tính với chiều dài mạng lưới, năm 2012 tỉ lệ bể vỡ ống tăng đột biến, nhưng đến năm 2015 lại giảm xuống mức thấp nhất trong các năm. Lượng ống bể gi ảm do mạng lưới được cải thiện về công nghệ cũng như phương pháp quản lí. Tuổi ống khảo sát lớn nhất tại quận HC là 36,5 tuổi và nhỏ nhất là 0,36 tuổi trong đó tuổi hỏng ống trung bình khoảng 10 tuổi. Biểu đồ phân bố mật độ dùng để đo tần số xuất hiện của một biến số từ đó t hấy rõ sự thay đổi hay biến động của dữ liệu, qua đó có thể phát Hình 4. Biểu đồ so sánh độ tuổi (A) hiện sai sót trong số liệu đầu vào. Hình 6 cho ống hỏng và không hỏng thấy số lượng ống bể giảm từ đường kính 100- 8 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 KHOA HỌC CÔNG NGHỆ 200 mm nhưng lại tăng ở D300mm. biến liên tục là độ tuổi (A) của ống dẫn và biến Kiểm chứng mô hình hồi quy logistic chữ (Mat) là vật liệu ống để phân tích ý nghĩa kết quả của mô hình đề xuất, sau đó ứng dụng Sử dụng hàm glm trong phần mềm R để phân mô hình hồi quy logistic cho tổ hợp các yếu tố tích số liệu ống hỏng và không hỏng. Nghiên ảnh hưởng và dự báo xác suất hỏng cho từng cứu tiến hành phân tích hai biến đại diện cho ống trong tập số liệu. Hình 6. Biểu đồ phân bố các yếu tố của hệ thống cấp nước Hải Châu Phân tích mức độ ảnh hưởng của biến tuổi thọ e-1,47-0,16(A ) p Logit(p) =-1,47 - 0,16.(A) Vậy 1, 47-0,16(A ) đến nguy cơ hỏng ống 1 e Với F=0 thì độ tuổi ống dẫn được tính đến Theo đó, khi A=5 thì p=0,094 và A= 5 - thời điểm khảo sát, số liệu ống hỏng F=1 thì sd(A)= 0,48 (giảm 1 độ lệch chuẩn) thì p=0,18 độ tuổi A được ghi nhận tại thời điểm ống vậy xác suất hỏng ống tăng 0,48/0,094 = 5,13%. hỏng. Xem xét tương quan giữa biến F và A trong mô hình hồi quy logistic có kết quả như Bảng 2. Kết quả mô hình logistic F~A Bảng 2. Như vậy, khi độ tuổi tăng một độ Deviance Residuals: lệch chuẩn thì khả năng ống bể ống giảm Min 1Q Median 3Q Max 37%. Qua mô hình có thể biểu diễn mối -0.6242 -0.3768 -0.2872 -0.2271 2.9428 tương quan giữa tuổi ống và nguy cơ ống Coefficients: hỏng theo phương trình sau: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.47323 0.21103 -6.981 2.93e-12 *** TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 9 KHOA HỌC CÔNG NGHỆ A -0.16324 0.02471 -6.605 3.97e-11 *** nhiêu phần trăm, có thể tóm tắt kết quả trong --- bảng 4. S ignif. codes: 0 ‘ ***’ 0. 001 ‘ **’ 0. 01 ‘ *’ 0. 05 ‘ .’ 0. 1 ‘ ’ 1 Bảng 4. Mô hình hồi quy logistic quận Hải Châu (Dispersion parameter for binomial family taken to be 1) Ước lượng hồi Null deviance: 809.40 on 1978 degrees of freedom µ Mat $ P 1-e Residual deviance: 762.47 on 1977 degrees of freedom quy (β ) AIC: 766.47 CI -0.6371 47.12% Number of Fisher Scoring iterations: 6 DI -2.1691 88.57% Phân tích mức độ ảnh hưởng của biến vật liệu HDPE -1.3381 73.77% đến nguy cơ hỏng ống SS -12.9566 100% Xem xét ảnh hưởng của vật liệu tới khả năng ST -2.9444 94.74% bể ống cấp nước được thực hiện và cho kết uPVC -1.0454 64.84% quả như Bảng 3. Phân tích tổng hợp ảnh hưởng của các biến Bảng 3. Kết quả mô hình logistic F~Mat đến nguy cơ hỏng ống Deviance Residuals: Ống hỏng là tổng hợp của nhiều yếu tố tác Min 1Q Median 3Q Max động nên không chỉ đánh giá tác động riêng lẻ -0.6039 -0.3686 -0.3686 -0.2126 3.0214 của từng yếu tố mà cần một đánh giá tổng hợp Coefficients: để xem xét vấn đề toàn diện hơn. Kết quả Estimate Std. Error z value Pr(>|z|) chạy mô hình hồi quy logistic cho biến phụ thuộc F và các biến độc lập được thể hiện (Intercept) -1.6094 0.7746 -2.078 0.0377 trong Hình 7. MatCI -0.6371 0.8370 -0.761 0.4466 MatDI -2.1691 0.8531 -2.542 0.0110 Kết quả cho thấy độ lệch ước số hồi quy của biến Prior và N0 nhiều nhất và chỉ số ống hỏng MatHDPE -1.3381 0.8136 -1.645 0.1000 tuyến tính với P, La là khác nhau. Tuy nhiên MatSS -12.9566 624.1943 -0.021 0.9834 để đưa ra mức độ ảnh hưởng cụ thể của các MatST -2.9444 1.0513 -2.801 0.0051 biến số này tương đối phức tạp, cần có một MatuPVC -1.0454 0.7855 -1.331 0.1832 phương pháp tốt hơn để đánh giá khả năng ống --- hỏng do yếu tố nào là chính, yếu tố nào là phụ. S ignif. codes: 0 ‘ ***’ 0. 001 ‘ **’ 0. 01 ‘ *’ 0. 05 ‘ .’ 0. 1 ‘ ’ 1 Phương trình hồi quy cho quận Hải Châu được (Dispersion parameter for binomial family taken to be 1) viết như sau: Null deviance: 809.40 on 1978 degrees of freedom F=18,13 + 0,0002.R + 0,002.D + 0,018.N0 + Residual deviance: 782.16 on 1972 degrees of freedom 0,34P + 1,37L - 0,22A - 0,08.La - AIC: 796.16 20,55.Prior(No/1st) - 1,28.Prior(2nd/1st) - Number of Fisher Scoring iterations: 13 0,95.Prior(3rd/1st) - 0,76.Prior(4th/1st) - 0,72.Prior(5th/1st) - 0,39.Prior(6th/1st) - Chỉ số Pr >0.05 chỉ ra rằng sự khác biệt về 16,30.Mat(SS/AC)- 2,15.Mat(ST/AC) - nguy cơ bể vỡ ống của vật liệu CI, HDPE, 2,072,15.Mat(DI/AC) - 2,15.Mat(HDPE/AC) - SS và uPVC so với vật liệu AC. Tương tự 0,712,15.Mat(uPVC/AC) - như biến độ tuổi thì biến vật liệu cũng có 0,522,15.Mat(CI/AC) quan hệ nghịch biến với khả năng bể vỡ ống. Áp dụng phương trình hồi quy cho các số liệu Mô hình so sánh khả năng hỏng của các loại khảo sát để dự báo khả năng xảy ra ống hỏng vật liệu thấp hơn (∆P) so với vật liệu AC bao 10 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 KHOA HỌC CÔNG NGHỆ trên mạng lưới cấp nước, từ đó so sánh với số khả năng ống hỏng sẽ giảm trên các tuyến dài liệu hỏng thực tế để kiểm chứng hiệu quả của có số lượng điểm đấu nối ít. Xác suất xuất hiện mô hình đề xu ất. Dùng lệnh predict trong R hỏng ống tập trung tại các ống có đường kính cho mô hình hồi quy, kết quả dự báo hỏng cho nhỏ hơn hoặc bằng 400mm, cũng có một vài từng đoạn ống như Hình 8. gi á t rị xuất hiện ở cỡ đường kính lớn nhưng đa Xác suất dự báo ống hỏng được tính cho từng số nguy cơ ống hỏng <50% (tính đến thời số liệu trong dữ liệu khảo sát và dao động từ điểm khảo sát). 0%-100%, kết quả được thể hiện trong Hình 8, Ước số hồi quy µ 0 Ước số hồi quy µ 0 Hình 7. Biểu đồ so sánh ước số hồi quy của các yếu tố Hình 8. Xác suất dự báo ống hỏng theo NO và D TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 11 KHOA HỌC CÔNG NGHỆ Kiểm tra sự phù hợp giữa kết quả mô hình và số liệu thực tế Bảng 5. Kết quả kiểm tra hỗn hợp xác suất ống hỏng dự báo và thực tế Dữ liệu thực tế Quận Hải Châu Ống không hỏng (0) Ống hỏng(1) Ống không hỏng (0) 1871 73 Mô hình dự báo Ống hỏng (1) 5 30 Trong số ống hỏng dự báo bằng mô hình hồi để đánh giá phân định giữa giá trị ống hỏng và quy logistic thì bao nhiêu ống hỏng thật ở không hỏng. Giá trị này được đánh giá theo ngoài thực tế và bao nhiêu ống không hỏng lại gi ới hạn từ 0,5-1 như Bảng 6. AUC được tính được mô hình dự báo là hỏng, vấn đề này cần toán bằng hàm auc trong phần mềm R cho phải được kiểm tra để đánh giá hiệu suất của thấy kết quả dự báo ống hỏng cho quận Hải mô hình dự báo. Giới hạn được cho là mô hình Châu được chấp nhận ở mức độ tốt. Qua đó dự báo chính xác là Pf = 50%, kết quả được thể cho thấy mô hình hồi quy logistics áp dụng hình trong Bảng 5. cho dự báo ống hỏng trên hệ thống phân phối Mô hình dựa báo cho quận Hải Châu có 1871 là phù hợp. ống không hỏng và dữ liệu thực tế cũng cho thấy các ống này không hỏng, có 5 ống không hỏng nhưng mô hình lại dự báo ống hỏng, dự báo sai 0,27%. Các số liệu dự báo sai này của mô hình có được chấp nhận hay không sẽ được xác định theo hai tiêu chí là đường cong ROC (Receiver Operating Characteristic Curve) và chỉ số AUC. Đường cong ROC là đường cong thể hiện độ nhạy (sensitivity) và độ đặc hiệu (specificity) của kết quả dự báo, một dự báo tốt khi diện tích dưới đường cong là lớn nhất. Chỉ số AUC (Area Under the Curve) là một giá trị biểu diễn Hình 8. Đường cong ROC cho HTTPN diện tích dưới đường cong ROC được sử dụng Hải Châu Bảng 6. Diện tích dưới đường cong(AUC) để đánh giá hiệu suất của mô hình AUC Ý nghĩa diễn giải AUC. HC >0,9 Rất tốt 0,8-0,9 Tốt 0.8843 0,7-0,8 Trung bình 0,6-0,7 Không tốt 0,5-0,6 Kết quả không sử dụng được 12 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 KHOA HỌC CÔNG NGHỆ KẾT LUẬN Để giảm khả năng ống bể cần tác động tới yếu Mô hình dự báo sử dụng cho tập số liệu quận tố độ tuổi, chiều dài ống, tổng chiều dài trong Hải Châu cho thấy các biến liên quan tới bể ống mộ DMA và áp lực làm việc. Với những ống bao gồm độ tuổi (A), vật liệu (Mat), đường kính đã bể vỡ trong lịch sử thì cần thiết phải xem (D), chiều dài ống trong một DMA (La), lịch sử xét p hương án thay thế mới trong các lần hỏng bể vỡ (Prior), chiều dài ống dẫn (L), áp lực làm sau vì giá trị này có ảnh hưởng lớn nhất đến việc trung bình của từng đoạn ống (P) và số khả năng xảy ra bể ống. điểm đấu nối trên một tuyến (N0). Sử dụng số liệu thống kê thu thập được từ Mô hình hồi quy logistic áp dụng cho biến F với GIS của mạng lưới cấp nước quận Hải Châu, hai giá trị 1(hỏng) và 0(không hỏng) đã đưa ra áp dụng mô hình dự báo nghiên cứu đã đề mối quan hệ tuyến tính của biến này với các biến xu ất được mối quan hệ giữa các thông số còn lại. Quan hệ này đồng biến với thông số chiều trong điều kiện làm việc của ống và sự cố dài, áp lực làm việc, đường kính, vị trí đặt ống, số ống hỏng. Tuy nhiên, do hạn chế trong quá điểm đấu nối trên tuyến ống, tổng chiều dài ống trình thu thập thông tin nên các biến độc lập trong một DMA và nghịch biến với các giá trị còn chưa mô tả hết được các yếu tố liên quan đến lại. Từ đó xác định xác suất xảy ra hỏng ống trên biến phụ thuộc như các tải trọng xe chạy trên mô hình, các giá trị dự báo được so sánh với số đường là bao nhiêu thì ảnh hưởng tới xác liệu thực tế cho thấy dự báo đúng 70%-84%. suất ống hỏng hay chỉ số về điều kiện địa chất thủy văn tại từng vị trí đặt ống. Bên Đề tài đã đưa ra kết quả dự báo ống hỏng theo cạnh đó mô hình cũng không đánh giá cụ thể dữ liệu khảo sát thực và kiểm chứng độ chính chiều dày còn lại hay tỉ lệ ăn mòn của từng xá c bằng đường cong ROC và tiêu chuẩn đoạn ống theo độ tuổi vì giá trị này không có AUC, mô hình logistic cho kết quả nằm trong số liệu khảo sát thực tế. gi ới hạn tốt TÀI LIỆU THAM KHẢO [1] A. Wood and B. J. Lence, “Using Water Main Break Data to Improve Asset Management for Small and M edium Utilities: District of M aple Ridge, B.C.,” J. Infrastruct. Syst., vol. 15, no. 2, pp. 111–119, 2009. [2] T. M. W. A. Pelliccia, “Water main repair/replacement for Binghamton,N. Y.,” Vicksburg,Miss.39180, 1981. [3] N. S. Bubbis, “Maintenance and Operating Problems of Winnipeg,” J. Am. Water Work. Assoc., vol. 41, no. 5, pp. 429–436, 1948. [4] H. O. and K. Bainbridge, “Comparison of Statistical Deterioration Models for Water Distribution Networks,” J. Perform. Constr. Facil., vol. 25, no. May, pp. 259–266, 2011. [5] H. Al-barqawi and T. Zayed, “Infrastructure Management : Integrated AHP / ANN Model to Evaluate Municipal Water Mains ’ Performance,” no. December, pp. 305–318, 2008. [6] D.Achim;F. Ghotb; and K. J. McManus, “Prediction of water pipe asset life using neural networks,” J. Infrastruct. Syst., vol. 13, no. 1, pp. 26–30, 2007. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017 13 KHOA HỌC CÔNG NGHỆ [7] T. Wengström, “Comparative analysis of Pipe Break Rates A Literature review,” Chalmers Univ. Technol., 1993. [8] B. I. C. Goulter, “Analysis of water distribution pipe failure type in Winnipeg, Cananda,” J. Transp. Eng., vol. 115, no. 2, pp. 95–111, 1989. [9] S. Yamijala, “Statisticcal estimation of water distribution system pipe break risk,” Texas A&M University, 2007. [10] G. Kabir, S. Tesfamariam, and R. Sadiq, “Bayesian Model Averaging for the Prediction of Water M ain Failure for Small to Large Candian M unicialities,” Can. J. Civ. Eng., vol. 43, no. 3, pp. 233–240, 2016. [11] R. I. Gentleman, “R-paper.pdf,” J. Comput. Graph. Statastics, vol. 5, no. 3, pp. 299– 314, 1996. [12] G. Kabir, S. Tesfamariam, J. Loeppky, and R. Sadiq, “Integrating Bayesian Linear Regression with Ordered Weighted Averaging: Uncertainty Analysis for Predicting Water M ain Failures,” ASCE-ASME J. Risk Uncertain. Eng. Syst. Part A Civ. Eng., vol. 1, no. 3, p. 4015007, 2015. 14 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ THỦY LỢI SỐ 39 - 2017
File đính kèm:
- ung_dung_mo_hinh_hoi_quy_logistic_du_bao_ong_be_tren_he_tren.pdf