Phân tích và thảo luận ứng dụng kĩ thuật dữ liệu lớn trong lưới điện thông minh

Tóm tắt - Kĩ thuật phân tích dữ liệu theo phương pháp truyền thống

đã không đáp ứng được yêu cầu sự phát triển của lưới điện hiện

đại. Từ năm 2012, đã có một số nghiên cứu về dữ liệu lớn trong

lưới điện thông minh với những kết quả ban đầu thuận lợi. Bài báo

phân tích và ứng dụng dữ liệu lớn trong lưới điện thông minh bao

gồm: khái niệm cơ bản, nguồn sinh ra dữ liệu trong hệ thống điện,

các đặc trưng và đánh giá nghiên cứu về dữ liệu lớn. Bên cạnh đó,

đưa ra kiến trúc tổng thể và các kĩ thuật liên quan của dữ liệu lớn

trong lưới điện thông minh. Cuối cùng đưa ra mô hình ứng dụng kĩ

thuật dữ liệu lớn trong lưới điện phân phối với việc chẩn đoán trạng

thái hoạt động của các thiết bị; đánh giá đường dây cấp điện; phân

tích đặc điểm và hành vi của khách hàng và dự báo phụ tải.

Abstract - The traditional method of data analysis has not met the

requirements of modern grid development. Since 2012, a number

of researches into big data in smart grids have been conducted

with initial advantageous results. This article analyzes and applies

big data in the smart grids including basic concepts, data sources

in the power system, characteristics and assessment of big data

studies. In addition, the overall architecture and related techniques

of big data in the smart grids are demonstrated. The last section of

the article presents a model for applying the big data technology in

a distribution grid with the diagnosis of equipment operation status,

evaluating electricity lines, analyzing customers’ characteristics

and behavior as well as forecasting supplementary load

pdf 5 trang phuongnguyen 5300
Bạn đang xem tài liệu "Phân tích và thảo luận ứng dụng kĩ thuật dữ liệu lớn trong lưới điện thông minh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Phân tích và thảo luận ứng dụng kĩ thuật dữ liệu lớn trong lưới điện thông minh

Phân tích và thảo luận ứng dụng kĩ thuật dữ liệu lớn trong lưới điện thông minh
68 Lê Xuân Sanh 
PHÂN TÍCH VÀ THẢO LUẬN ỨNG DỤNG KĨ THUẬT DỮ LIỆU LỚN 
TRONG LƯỚI ĐIỆN THÔNG MINH 
ANALYZING AND DISCUSSING APPLICATION OF BIG DATA TECHNOLOGY 
IN SMART GRIDS 
Lê Xuân Sanh 
Trường Đại học Điện lực; sanhlx@epu.edu.vn 
Tóm tắt - Kĩ thuật phân tích dữ liệu theo phương pháp truyền thống 
đã không đáp ứng được yêu cầu sự phát triển của lưới điện hiện 
đại. Từ năm 2012, đã có một số nghiên cứu về dữ liệu lớn trong 
lưới điện thông minh với những kết quả ban đầu thuận lợi. Bài báo 
phân tích và ứng dụng dữ liệu lớn trong lưới điện thông minh bao 
gồm: khái niệm cơ bản, nguồn sinh ra dữ liệu trong hệ thống điện, 
các đặc trưng và đánh giá nghiên cứu về dữ liệu lớn. Bên cạnh đó, 
đưa ra kiến trúc tổng thể và các kĩ thuật liên quan của dữ liệu lớn 
trong lưới điện thông minh. Cuối cùng đưa ra mô hình ứng dụng kĩ 
thuật dữ liệu lớn trong lưới điện phân phối với việc chẩn đoán trạng 
thái hoạt động của các thiết bị; đánh giá đường dây cấp điện; phân 
tích đặc điểm và hành vi của khách hàng và dự báo phụ tải. 
Abstract - The traditional method of data analysis has not met the 
requirements of modern grid development. Since 2012, a number 
of researches into big data in smart grids have been conducted 
with initial advantageous results. This article analyzes and applies 
big data in the smart grids including basic concepts, data sources 
in the power system, characteristics and assessment of big data 
studies. In addition, the overall architecture and related techniques 
of big data in the smart grids are demonstrated. The last section of 
the article presents a model for applying the big data technology in 
a distribution grid with the diagnosis of equipment operation status, 
evaluating electricity lines, analyzing customers’ characteristics 
and behavior as well as forecasting supplementary load. 
Từ khóa - dữ liệu lớn; dữ liệu lớn lưới điện thông minh; lưới điện 
phân phối; lưới điện thông minh; kĩ thuật dữ liệu lớn. 
Key words - big data; big data in a smart grid; distribution grid; 
smart grid; big data technology. 
1. Giới thiệu 
Thuật ngữ ‘dữ liệu lớn’ (Big Data) năm 2008, được tạp 
chí Nature xuất bản năm 2008 với chuyên đề cùng tên. Năm 
2012, tổng thống Mỹ công bố sẽ đầu tư 2 tỉ USD để khởi 
động "Kế hoạch nghiên cứu và phát triển dữ liệu lớn", tạo ra 
sự bùng nổ về nghiên cứu dữ liệu lớn trên toàn thế giới. Hiện 
nay, chưa có định nghĩa thống nhất về dữ liệu lớn, mặc dù 
đã có một số đồng thuận trong ngành. Trong định nghĩa của 
dữ liệu lớn, một định nghĩa tương đối có tính đại diện là định 
nghĩa 3V, tức là tính quy mô (Volume), đa dạng (Variety) 
và tốc độ cao (Velocity) [1-3]. Ngoài ra, Công ty Dữ liệu 
Quốc tế (International Data Corporation, IDC) cho rằng dữ 
liệu lớn nên có tính giá trị (Value); phía IBM cho rằng dữ 
liệu lớn là tính chân thực (Veracity) [4]. Chính những đặc 
điểm này của dữ liệu lớn quyết định bắt buộc phải nâng cấp 
có tính cách mạng trong kĩ thuật xử lý dữ liệu hiện đại. 
Đặc điểm chung của hệ thống điện là sự phân bố vị trí 
địa lí rộng lớn, phát và tiêu dùng cân bằng với thời gian 
thực, tốc độ truyền dẫn nhanh, vận hành thời gian thực, tốc 
độ lan rộng sự cố tức thời, v.v. Những đặc điểm trên dẫn 
đến, khi vận hành hệ thống điện sẽ sản sinh ra số lượng dữ 
liệu cực lớn, tốc độ tăng cực nhanh, chủng loại phong phú, 
hoàn toàn phù hợp với tất cả các đặc trưng của dữ liệu lớn 
và là một dữ liệu lớn điển hình. 
Trong tiến trình xây dựng lưới điện thông minh, là quá 
trình số hóa hệ thống điện, thông tin hóa và thông minh 
hóa, v.v. sẽ mang lại nhiều hơn nguồn dữ liệu. Ví dụ như, 
đồng hồ thông minh thu thập dữ liệu từ hàng trăm triệu ngôi 
nhà và doanh nghiệp; hệ thống giám sát trạng thái thiết bị 
điện thu được số liệu giám sát từ trăm nghìn các thiết bị. 
Trong phát triển và vận hành các nguồn năng lượng tái tạo 
cần lượng lớn số liệu lịch sử vận hành, số liệu quan trắc khí 
tượng, v.v. Vì vậy, trong xu thế mới tăng trưởng một cách 
bùng nổ dữ liệu hệ thống điện, thì kĩ thuật xử lý dữ liệu 
truyền thống gặp phải ‘tắc nghẽn’, không thể đáp ứng được 
yêu cầu, cần phải ứng dụng kĩ thuật xử lý dữ liệu lớn trong 
ngành điện. 
2. Dữ liệu lớn trong lưới điện thông minh 
2.1. Nguồn gốc và đặc điểm dữ liệu lớn trong lưới điện 
thông minh 
Nguồn dữ liệu trong hệ thống điện gồm 2 loại: từ nội bộ 
lưới điện và dữ liệu ngoài. Dữ liệu nội bộ lưới điện là: hệ 
thống thu thập thông tin khách hàng (collection system 
information, CIS); hệ thống tiếp thị; hệ thống giám sát diện 
rộng (wide area measurement system, WAMS); hệ thống 
quản lý lưới điện phân phối; hệ thống quản lý sản xuất 
(production management system, PMS); hệ thống quản lý 
năng lượng (energy management system, EMS); hệ thống 
kiểm tra và giám sát thiết bị; hệ thống phục vụ khách hàng; 
hệ thống quản lý tài chính, v.v. Dữ liệu đến từ ngoài lưới 
điện là hệ thống quản lý xạc điện xe hơi; hệ thống thông tin 
khí tượng; hệ thống thông tin địa lí (geographic information 
system, GIS); dịch vụ công cộng, internet, v.v. Những dữ 
liệu này có đặc điểm nằm rải rác phân tán ở những nơi khác 
nhau và được quản lý bởi các đơn vị khác nhau. 
Quan hệ giữa các dữ liệu trên là mối quan hệ phức tạp, 
không hoàn toàn độc lập mà tương hỗ lẫn nhau, ảnh hưởng 
nhau. Kết cấu của dữ liệu phức tạp gồm nhiều loại khác 
nhau. Ngoài cấu trúc truyền thống còn có lượng lớn dạng 
bán cấu trúc, không cấu trúc, như dữ liệu thoại về hệ thống 
dịch vụ, dạng sóng của các dữ liệu đo lường kiểm tra, v.v. 
Tần suất lấy mẫu và vòng đời của dữ liệu cũng khác nhau, 
có thể từ ms đến phút, thậm chí đến năm [5]. 
Tổng hợp miêu tả về dữ liệu lớn, có thể đưa ra các đặc 
điểm dữ liệu lớn lưới điện thông minh: 1) Nguồn gốc từ các 
nguồn quản lý phân tán; 2) Lượng dữ liệu lớn, nhiều thứ 
nguyên, nhiều loại hình; 3) Có giá trị lớn cho kinh tế xã hội 
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 11(132).2018, QUYỂN 1 69 
nói chung và công ty điện lực, khách hàng; 4) Tồn tại quan 
hệ phức tạp giữa các dữ liệu mà cần phải phân tích, một lượng 
lớn dữ liệu yêu cầu với thời gian thực. Ví dụ, Công ty Điện 
lực Thái Bình Dương (Mỹ) mỗi tháng dữ liệu từ 9 triệu đồng 
hồ điện của khách hàng đạt tới 3TB; Hệ thống SCADA từ 
một lưới điện có 100000 điểm, với chu kì 4s thì mỗi năm sản 
sinh là 1,03TB; Với PMU, tần suất lấy mẫu 0,01s (số lượng 
100000 điểm) thì mỗi năm lượng dữ liệu là 495TB [5], vì vậy 
trong hệ thống điện với nhiều hệ thống cần thu thập và xử lý 
thì lượng dữ liệu có thể lên đến cấp PB và EB. 
2.2. Tình hình nghiên cứu trong và ngoài nước 
Từ năm 2012, các viện nghiên cứu, trường đại học, 
doanh nghiệp IT, công ty điện lực đã bắt đầu nghiên cứu và 
ứng dụng dữ liệu lớn lưới điện thông minh. Công ty IBM, 
Oracle phát hành sách trắng dữ liệu lớn, IBM và C3-Energy 
phát triển một hệ thống phân tích dữ liệu lớn cho lưới điện 
thông minh [6]. Các viện nghiên cứu của Mỹ đưa ra các dự 
án nghiên cứu dữ liệu lớn, các công ty điện lực như Pacific 
Gas Power tại Mỹ và BC Hydro ở Canada tiến hành nghiên 
cứu về ứng dụng kĩ thuật dữ liệu lớn dựa trên dữ liệu người 
dùng. Tại Trung Quốc, Hội nghị Công trình Cơ điện đã công 
bố sách trắng về dữ liệu lớn, Tập đoàn Điện lực Trung Quốc 
và Bộ Khoa học Công nghệ đã ban hành nhiều dự án nghiên 
cứu về dữ liệu lớn lưới điện thông minh từ năm 2012 [7]. Tại 
Việt Nam, cũng đã có nhiều hội thảo, báo cáo đề cập đến dữ 
liệu lớn trong cuộc cách mạng công nghiệp 4.0, trên các tạp 
chí chuyên ngành nhưng chưa thấy các bài viết chuyên sâu 
về dữ liệu lớn trong lưới điện thông minh. Nghiên cứu và 
ứng dụng dữ liệu lớn lưới điện thông minh cũng đã đạt được 
nhiều thành quả, tuy nhiên nhìn chung kết quả nghiên cứu 
còn tương đối thô và chưa có hệ thống, nghiên cứu và ứng 
dụng vẫn còn ở giai đoạn đầu và thăm dò. 
2.3 Kiến trúc tổng thể nền tảng dữ liệu lớn lưới điện 
thông minh 
Kiến trúc tổng thể nền tảng dữ liệu lớn trong ngành điện 
được thể hiện như Hình 1. 
Kho dữ liệu 
Ứng dụng kinh doanh công ty 
điện lực (Quety, Analytics, 
Reportion, Statistics) 
Dữ liệu lớn 
(Connectors) 
Tầng điều hành dữ liệu lớn 
Hỏi 
& 
trả 
lời 
Tính 
an 
toàn 
Quản 
lý 
dữ 
liệu 
Tầng truy cập dữ liệu lớn 
Lớp mạng 
Tầng lưu trữ dữ liệu 
(HDFS) 
Tầng xử lý dữ liệu 
(MapReduce) 
Hệ điều hành 
(Hypervisor/ VMs) 
Máy chủ 
Hình 1. Kiến trúc tổng thể nền tảng dữ liệu lớn 
trong hệ thống điện 
Kiến trúc có tính phổ quát và phù hợp với quy hoạch dữ 
liệu lớn của công ty điện lực, sử dụng hệ thống xử lý tệp 
phân tán (Hadoop distributed file system, HDFS) làm khung 
lưu trữ dữ liệu lớn, kĩ thuật tính toán MapReduce làm khung 
xử lý dữ liệu lớn, với phương pháp như vậy việc lưu trữ và 
tìm kiếm dữ liệu PB và EB trở nên khả thi [8]. Ngoài ra, 
trong khung này còn bao gồm các ứng dụng thông minh 
thương mại, kho dữ liệu truyền thống, khung truy cập, khung 
điều phối dữ liệu lớn, lớp mạng, hệ điều hành, máy chủ, sao 
lưu và phục hồi, mô-đun quản lý dữ liệu. 
Khung lưu trữ và khung xử lý dữ liệu lớn thường được 
xây dựng trên một máy chủ, hệ điều hành hoặc máy ảo, để 
phần cứng cần thiết của cấu trúc này có đặc điểm chi phí 
thấp và khả năng mở rộng cao. Trên khung lưu trữ và khung 
xử lý là khung truy cập dữ liệu được kết nối thông qua lớp 
mạng, khung truy cập bao gồm ngôn ngữ lập trình song 
song Pig, công cụ lưu trữ dữ liệu Hive và mô-đun công cụ 
phân phối dữ liệu nguồn như Sqoop. 
Khung điều phối bao gồm các mô-đun như: kho dữ liệu 
dạng Hbase, định dạng trình tự dữ liệu và công cụ truyền 
dẫn Avro, hệ thống thu thập nhật ký Flume, cài đặt khóa 
dạng phân phối ZooKeeper, v.v. Khung điều phối thực hiện 
việc tổ chức, điều phối và cung cấp các điều kiện cần thiết 
cho việc phân tích dữ liệu. Phía trên khung điều phối dữ 
liệu lớn là một hệ thống ứng dụng thương mại thông minh 
cấp doanh nghiệp có thể thực hiện các ứng dụng nâng cao 
như tìm kiếm, phân tích, thống kê và báo cáo [8]. 
Hình 2. Mô tả sự kết nối của kiến trúc dữ liệu lớn 
và luồng dữ liệu của hệ thống điện 
Hệ thống điện là một hệ thống phức tạp, mức phi tuyến 
tính cao, dữ liệu nội bộ của nó bao gồm các nguồn dữ liệu 
khác nhau như: dòng công suất, thông tin, dịch vụ, sự cố 
và khí tượng. Hình 2, mô tả các điểm có thể kết hợp giữa 
ứng dụng thương mại của doanh nghiệp điện và dữ liệu nội 
bộ của hệ thống điện trên nền tảng tổng thể của hệ thống 
điện, bao gồm: phát, truyền tải, biến đổi, phân phối, người 
dùng và điều độ vận hành, trong hệ thống điều khiển phụ 
tải, quản lý thông tin (management information system, 
MIS), hệ thống thu thập dữ liệu và điều khiển giám sát 
(supervisory control and data acquisition, SCADA), hệ 
thống đo đếm, hệ thống dự báo công suất năng lượng gió, 
mặt trời, hệ thống giám sát trực tuyến thiết bị điện, v.v. 
3. Các kĩ thuật dữ liệu lớn trong lưới điện thông minh 
3.1. Kĩ thuật tập hợp quản lý dữ liệu lớn 
Kĩ thuật tập hợp và quản lý dữ liệu ngành điện là quá 
trình kết hợp từ hai hoặc nhiều hệ thống dữ liệu ứng dụng 
để tạo ra một ứng dụng với nhiều chức năng hơn. Bao gồm 
kĩ thuật kho dữ liệu dạng quan hệ và phi quan hệ, kĩ thuật 
Truyền số liệu trong HTĐ: phát, truyền tải, phân phối, tiêu 
dùng và vận hành 
Hệ thống điều 
khiển phụ tải 
Hệ thống 
MIS 
Hệ thống dự báo 
công suất của 
phát NL tái tạo 
Hệ thống 
SCADA 
Hệ thống đo 
đếm điện năng 
(TMRS) 
Hệ thống giám 
sát thiết bị 
Ứng dụng kinh doanh của công ty điện lực 
Hệ thống xử lí 
dữ liệu lớn 
Hệ thống lưu 
trữ dữ liệu lớn 
Hệ thống thực 
thi và phục vụ 
Hệ thống điều phối 
dữ liệu lớn 
Kiến trúc tổng thể 
nền tảng kết nối hệ 
thống dữ liệu lớn 
Kho dữ 
liệu lịch sử 
Hbase Avro Flume 
Zoo 
Keeper 
L 
Pig Hive Sqoop 
70 Lê Xuân Sanh 
tích hợp dữ liệu và dung hòa, kĩ thuật tách dữ liệu, kĩ thuật 
lọc và làm sạch dữ liệu, v.v [7]. Để xử lý dữ liệu lớn, trước 
tiên phải trích xuất và tích hợp dữ liệu từ nguồn dữ liệu, từ 
đó khai thác các thực thể và các quan hệ, đến công đoạn 
kết hợp, một cấu trúc thống nhất được sử dụng để lưu trữ 
các dữ liệu này, và tiến hành làm sạch dữ liệu trong quá 
trình tích hợp, trích xuất dữ liệu để đảm bảo chất lượng và 
độ tin cậy của dữ liệu [4]. 
Một công nghệ quan trọng trong quản lý lưu trữ dữ liệu 
là kĩ thuật kho dữ liệu NoSQL, nó sử dụng phương thức 
lưu trữ dữ liệu dạng phân tán. Lưu trữ dữ liệu được đơn 
giản hóa và linh hoạt hơn, có khả năng mở rộng tốt và giải 
quyết vấn đề khó của lưu trữ dữ liệu lớn, ví dụ như 
BigTable của Google, Dynamo của Amazon, v.v. 
3.2. Kĩ thuật phân tích dữ liệu lớn trong lưới điện thông minh 
Các kĩ thuật chủ chốt được sử dụng để phân tích dữ liệu 
lớn như thống kê và khoa học máy tính, bao gồm phân tích 
tương quan, học máy, mạng nơron, thuật toán di truyền và 
nhiều phương pháp khác [9]. Phương pháp phân tích tương 
quan là cốt lõi của dữ liệu lớn, phân tích tất cả dữ liệu, thông 
qua việc tìm mối tương quan của hiện tượng tốt, có thể nắm 
bắt hiện tại và dự đoán tương lai. Phương pháp tính toán đơn 
giản, hiệu quả, kết quả nhanh, chính xác và ít bị ảnh hưởng. 
Các thuật toán khai thác dữ liệu và học máy trong môi 
trường dữ liệu lớn có thể được bắt đầu từ ba phương diện: 
1) Từ quản trị, lấy mẫu và lựa chọn đặc trưng của dữ liệu 
lớn [10]; 2) Phát triển nghiên cứu các thuật toán phân cụm 
và phân loại cho các dữ liệu lớn. v.v. [11]; 3) Phát triển các 
thuật toán song song, ứng dụng khai thác kiến thức của dữ 
liệu lớn, như học máy và khai thác kiến thức dựa trên 
MapReduce [12]. 
3.3. Kĩ thuật xử lý dữ liệu trong lưới điện thông minh 
Các kĩ thuật xử lý dữ liệu của dữ liệu lớn ngành điện 
bao gồm kĩ thuật tính toán dạng phân tán, kĩ thuật tính toán 
trong bộ nhớ và kĩ thuật xử lý luồng. Tính toán dạng phân 
tán là một phương thức tính toán mới, đòi hỏi sức mạnh 
tính toán vào nhiều phần nhỏ, phân phối cho nhiều máy 
tính và tổng hợp thành kết quả cuối cùng. Một đại diện điển 
hình của tính toán dạng phân tán là mô hình lập trình 
MapReduce được Google đề xuất. 
Kĩ thuật tính toán trong bộ nhớ là giải quyết vấn đề đọc 
dữ liệu hiệu quả và xử lý các phép tính trực tuyến, đưa tất 
cả dữ liệu vào lớp bên trong. Kĩ thuật này khắc phục được 
hao tổn số lượng lớn thời gian đọc và ghi vào đĩa, tốc độ 
tính toán đã tăng lên đáng kể đến vài cấp số lượng. EMC, 
Oracle và SAT đều đã giới thiệu các giải pháp cho tính toán 
trong bộ nhớ, giảm đơn vị tính thời gian, giải quyết các vấn 
đề về phân tích thời gian thực. 
Mô hình xử lý luồng là tổ hợp dữ liệu liên tục thành luồng, 
khi dữ liệu mới đến thì lập tức xử lý và phản hồi kết quả. Phân 
tích dữ liệu mới nhất nhanh nhất có thể và đưa ra kết quả, từ 
đó cung cấp căn cứ ngay lập tức cho người ra quyết định và 
đáp ứng yêu cầu phân tích với thời gian thực [13]. 
3.4. Kĩ thuật hiển thị dữ liệu lớn ngành điện 
Kĩ thuật hiển thị dữ liệu lớn ngành điện bao gồm trực 
quan hóa, hiển thị luồng thông tin không gian, luồng lịch 
sử, v.v [7]. Hiển thị dữ liệu có thể giúp người quản lý trực 
quan hơn, hiểu chính xác hơn ý nghĩa của biểu hiện dữ liệu, 
trạng thái vận hành của hệ thống điện. 
Kĩ thuật trực quan hóa được sử dụng rộng rãi trong việc 
giám sát thời gian thực trạng thái lưới điện, nâng cao mức độ 
tự động hóa hệ thống điện. Kĩ thuật hiển thị luồng thông tin 
không gian được thể hiện trong sự kết hợp các tham số lưới 
điện và hệ thống thông tin địa lí đã có, bao gồm hiển thị ba 
chiều trạm biến áp, thực tế ảo và các công nghệ khác. Kết 
hợp chặt chẽ giữa quản lý thiết bị phân phối điện và hệ thống 
thông tin địa lí tạo điều kiện cho người quản lý lưới điện hiểu 
được tình hình thiết bị một cách trực quan, từ đó cung cấp 
thông tin địa lí mới nhất cho các quyết định của họ. 
Kĩ thuật hiển thị lưu lượng lịch sử được thể hiện trong 
việc quản lý và hiển thị dữ liệu lịch sử của lưới điện. Trong 
các hệ thống điện, phân tích ứng dụng chuyên sâu thường 
dựa trên cơ sở dữ liệu lịch sử. Từ đó, có thể vẽ ra xu hướng 
phát triển và dự đoán tương lai; mô phỏng sự phát sinh, diễn 
biến và khai thác kiến thức, luật tiềm ẩn của các sự kiện. 
4. Ứng dụng kĩ thuật dữ liệu lớn trong lưới điện phân 
phối thông minh 
Tác giả dựa vào các đặc trưng và mục tiêu chung khi 
xây dựng lưới điện phân phối thông minh, kết hợp tham 
khảo kết quả nghiên cứu của các học giả và chuyên gia, 
trong phần này tiến hành nghiên cứu các mô hình dữ liệu 
lớn ứng dụng trong lưới điện phân phối thông minh. 
4.1. Chẩn đoán trạng thái hoạt động trong lưới điện phân 
phối 
Để đánh giá mức độ hoạt động của lưới điện phân phối 
đưa ra 5 chỉ tiêu lớn cần chẩn đoán và đánh giá mức độ 
mạnh mẽ trong hệ thống, như Bảng 1. 
Bảng 1. Sơ đồ cấu trúc chẩn đoán trạng thái hoạt động của 
lưới điện phân phối 
Đánh 
giá 
dữ 
liệu 
lớn 
trạng 
thái 
vận 
hành 
lưới 
điện 
phân 
phối 
Mức 
độ kết 
cấu 
của 
lưới 
Mức độ 
kết cấu 
của lưới 
Tỉ lệ liên lạc giữa các đường dây 
Tỉ lệ liên lạc giữa các phân đoạn 
Hệ số phân đoạn bình quân 
Mức dự 
phòng 
Tỉ lệ các TBA chỉ một dây cấp 
Tỉ lệ các TBA chỉ có 1 MBA 
Độ tin 
cậy 
cấp 
điện 
Mức độ 
cung cấp 
điện phụ 
tải 
Tỉ lệ thông qua TBA chính “N-1” 
Tỉ lệ thông qua đường dây “N-1” 
Tỉ lệ thông qua TBA chính “N-2” 
Tỉ lệ thông qua đường dây “N-2” 
Năng lực 
tự hồi 
phục khi 
sự cố 
Tỉ lệ lắp đặt thiết bị tự đóng lại 
Tỉ lệ lắp đặt nguồn cấp điện liên tục 
Tỉ lệ trang bị nguồn dự phòng (nguồn 
phân tán) cho khách hàng 
Tính 
tối ưu 
chất 
lượng 
điện 
năng 
Chất 
lượng ổn 
định 
động 
Tỉ lệ lắp đặt thiết bị tự động điều chỉnh 
điện áp VQC 
Tỉ lệ lắp đặt thiết bị bù công suất phản 
kháng SVC 
Chất 
lượng ổn 
định tĩnh 
Tỉ lệ lắp đặt thiết bị hồi phục ổn định 
điện áp động 
Tỉ lệ lắp đặt thiết bị hạn chế dòng sự cố 
các tuyến dây 
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 11(132).2018, QUYỂN 1 71 
Tính 
hiệu 
quả 
kinh 
doanh 
Dung 
lượng 
Tỉ lệ mang tải của TBA 
Tỉ lệ mang tải của đường dây 
Mức độ 
quản lý 
vận hành 
Tỉ lệ tự động hóa TBA 
Tỉ lệ các tuyến dây hoàn chỉnh (tốt) 
Tỉ lệ các thiết bị chính tốt 
Tính 
tương 
tác của 
lưới 
điện 
Năng lực 
‘giao 
tiếp’ với 
khách 
hàng 
Tỉ lệ lắp đặt đồng hồ thông minh 
Tỉ lệ lắp đặt hệ thống thu thập thông tin 
khách hàng 
Tỉ lệ lắp đặt hệ thống phục vụ khách hàng 
Đáp ứng 
nhu cầu 
Tỉ lệ điều khiển phụ tải 
Tỉ lệ áp giá theo thời gian thực 
Một trong những ưu điểm của dữ liệu lớn là thống kê 
thông tin toàn diện, đánh giá từ nhiều quan điểm [14]. Ví 
dụ, độ tin cậy cấp điện có thể đánh giá gồm: các chỉ tiêu 
được lấy ra từ sơ đồ cấu trúc, từ xác suất sự cố, hay các chỉ 
tiêu về chất lượng điện áp để đánh giá. 
4.2. Đánh giá các đường dây cấp điện 
Hình 3. Đánh giá đa chiều trạng thái đường dây cấp điện 
Một phương pháp đánh giá đa chiều đường dây truyền 
tải trong lưới trung áp như Hình 3. Trước tiên thiết lập một 
mô hình nhiều lớp để đánh giá các thiết bị, các phân đoạn 
đặc biệt trong một giai đoạn. Phương pháp khấu trừ tích 
lũy được sử dụng để đánh giá các tham số cơ bản, điểm số 
của mỗi thông số thu được bằng cách kết hợp thời gian 
đánh giá và phần đánh giá. Cuối cùng, theo điểm số của 
mỗi thông số, các phân cụm thiết bị, các cột và các giá trị 
điểm tổng thể được tính tuần tự. Phương pháp đánh giá này 
kết hợp thời gian và không gian ba chiều, phù hợp với tính 
đa chiều của dữ liệu lớn và kết quả đánh giá gần với trạng 
thái thực của đường dây truyền tải [15]. 
4.3. Dự báo phụ tải 
Dự báo phụ tải là điều kiện tiên quyết cho việc vận hành 
hệ thống điện, giám sát điều khiển dưới thời gian thực, lập 
kế hoạch hoạt động và phát triển, đó là một thông tin cơ 
bản mà bộ phận vận hành và lập quy hoạch lưới điện phải 
có. Mô hình dữ liệu lớn cho dự báo phụ tải như Hình 4. 
Hình 4. Mô hình dữ liệu lớn cho dự báo phụ tải 
4.4. Phân tích đặc điểm và hành vi của khách hàng 
Thực hiện hợp nhất và lưu trữ dữ liệu đa nguồn như dữ 
liệu tiêu thụ điện, dịch vụ khách hàng, dân số, v.v. (Hình 5). 
Các mô hình thu được dùng cho việc dự báo xu hướng phát 
triển kinh tế, phân tích tỉ lệ cư trú, hỗ trợ quyết định giá điện 
và đánh giá nhu cầu người dùng. Những dữ liệu này có khối 
lượng lớn, từ nhiều nguồn và nhiều định dạng khác nhau. 
Việc tích hợp và phân tích các dữ liệu này cần phải sử dụng 
các kĩ thuật dữ liệu lớn [16,17]. 
Đánh giá vị trí cột 
Cột 1 Cột 2 Cột N 
Đánh giá hệ thống đường dây truyền tải 
Vật 
liệu 
dẫn 
điện 
Thiết 
bị nối 
đất 
Thiết 
bị phụ 
trợ 
Môi 
trường 
kênh 
Móng 
cột 
Thân 
cột 
Dây 
nối 
đất 
Cách 
điện 
Thời gian đánh 
giá thiết bị 
Đánh giá các 
thông số 
Vị trí không gian 
thiết bị 
Tầng 
ứng 
dụng 
Kế 
hoạch 
vận 
hành 
Quy 
hoạch 
lưới 
điện 
Kế hoạch 
tiết kiệm 
năng 
lượng 
Kế 
hoạch 
đại tu 
Kết quả dự báo 
Tầng 
phân 
tích 
dự 
báo 
Xử lí tính toán 
Mô hình dự báo 
dài/trung/ngắn/rất ngắn 
Phân tích các yếu tố nhay 
cảm 
Ghép và tích hợp dữ liệu 
Tầng 
tích 
hợp 
dữ 
liệu 
Dữ 
liệu 
vận 
hành 
Dữ 
liệu 
khách 
hàng 
Dữ 
liệu 
khí 
tượng 
địa lí 
Dữ liệu 
nhân 
khẩu và 
kinh tế 
ứng dụng kết quả dự 
báo phụ tải vào điều 
độ và quy hoạch lưới 
điện phân phối 
phân tích các mối 
quan hệ và yếu tố 
nhạy cảm ảnh hưởng 
đến phụ tải, thông 
qua mô hình dự báo 
và xử lí số liệu tiến 
hành dự báo các loại 
phụ tải. 
tích hợp dữ liệu tiêu 
thụ điện năng, kinh 
tế xã hội và các dữ 
liệu nội bộ lưới điện 
đưa ra dữ liệu cơ bản 
về dự báo phụ tải 
Dữ 
liệu 
ngày 
nghỉ 
Dự báo phát 
triển kinh tế 
Phân tích tỉ lệ trống 
các khu dân cư 
Hỗ trợ quyết 
định giá điện 
Đánh giá tín dụng 
của khách hàng 
Hình 5. Phân tích tiêu thụ điện năng khách hàng dựa trên khai thác dữ liệu lớn 
phân tích nhân tố ảnh hưởng 
hành vi của khách hàng 
phân tích cường độ ảnh hưởng 
hành vi của khách hàng 
Xây dựng mô hình tương 
quan hành vi khách hàng 
Phụ 
tải 
điện 
Thông 
tin thời 
tiết 
Mô hình 
hành vi của 
khách hàng 
Phân tích đặc điểm, hành vi 
tiêu thụ điện của khách hàng 
dân sinh 
Phân tích đặc điểm sử dụng 
điện của khách hàng thương 
mại 
Phân tích đặc điểm sử dụng 
điện của khách hàng công 
nghiệp 
Thu thập dữ 
liệu người 
dùng 
Dữ liệu 
ngành tiếp 
thị 
Dữ liệu dịch 
vụ khách 
hàng 
Dữ liệu 
thông tin 
địa lý 
Dữ 
liệu dân 
số 
Dữ 
liệu thời 
tiết 
dung lượng lớn, đa nguồn, cấu trúc dữ liệu không đồng nhất, quản lý và tài chính. 
Ứng dụng 
tổng hợp 
Hiểu hành 
vi sử dụng 
điện 
Nhận biết 
các mô 
hình dùng 
điện 
Phân tích 
đặc trưng 
hành vi 
dùng điện 
Tập hợp 
dữ liệu 
. 
Hóa 
đơn 
điện 
Thông 
tin 
phí 
Thông 
tin khách 
hàng 
Cấu 
trúc 
lưới 
Chính 
sách giá 
điện 
. 
72 Lê Xuân Sanh 
5. Kết luận 
Trong lưới điện thông minh với số lượng lớn các dữ 
liệu đo lường, giám sát, thì phương pháp xử lý và khai thác 
giá trị của các dữ liệu là những vấn đề mà các công ty điện 
phải đối mặt. Ứng dụng kĩ thuật dữ liệu lớn không chỉ sử 
dụng được dữ liệu riêng của lưới điện mà còn tận dụng toàn 
bộ dữ liệu bên ngoài, làm tăng mức độ phát triển, vận hành 
lưới điện, nâng cao trình độ các công ty điện lực phục vụ 
xã hội, phục vụ người dùng và mở rộng các dịch vụ giá trị 
gia tăng. Bài báo đã trình bày những khái niệm và phân tích 
cơ bản về dữ liệu lớn, nền tảng kết cấu cơ bản, các kĩ thuật 
liên quan trong lưới điện thông minh. Đồng thời ứng dụng 
dữ liệu lớn trong lưới điện phân phối như chẩn đoán trạng 
thái hoạt động của lưới, dự báo phụ tải và hành vi tiêu thụ 
điện năng của khách hàng. Với những kết quả ban đầu, hi 
vọng nó có ý nghĩa lớn thu hút các kết quả nghiên cứu trong 
và ngoài nước để chia sẻ kiến thức và kinh nghiệm nhằm 
thúc đẩy nghiên cứu và ứng dụng lĩnh vực dữ liệu lớn lưới 
điện thông minh. 
Nghiên cứu và ứng dụng kĩ thuật dữ liệu lớn trong lưới 
điện thông minh là một lĩnh vực phức tạp đòi hỏi một quá 
trình phát triển lâu dài. Cần sự quan tâm của Chính phủ, 
tăng cường nguồn nhân lực và tài nguyên vật chất, thúc đẩy 
cải tiến công nghệ then chốt cho dữ liệu lớn. Cần xây dựng 
hệ thống tiêu chuẩn quốc tế thống nhất, mô hình và các kĩ 
thuật về dữ liệu lớn trong lưới điện thông minh. Khuyến 
khích các công ty điện lực xây dựng một kiến trúc dữ liệu 
lớn phù hợp với sự phát triển của công ty, sử dụng kĩ thuật 
dữ liệu lớn để tạo ra doanh thu cho công ty. Từng bước 
thâm nhập các kĩ thuật dữ liệu lớn vào mọi khía cạnh của 
lưới điện thông minh. 
TÀI LIỆU THAM KHẢO 
[1] Birney E. The making of Encode: lessons for big-data projects. 
Nature, 2012(489): 49-51Irving M R, Luan W P, Danial J S. Supply 
restoration in distribution networks using a genetic algorithm. 
Electrical Power and Energy Systems 2002, 10: 447-457. 
[2] UN Global Pulse. Big data for development: challenges & opportunities.(05-
11-2012)  Development 
[3] Agrawal D, Bernstein P, Bertino E, et al. Challenges and opportunities 
with big data.  
[4] Meng Xiaofeng, Ci Xiang. Big data management: concepts, 
techniques and challenges. Journal of Computer Research and 
Development, 2013, 50(1): 146-169. 
[5] EPRI. The whys, whats and hows of managing data as an asset. 
USA: EPRI, 2014. 
[6] IBM. Managing big data for smart grids and smart meters. IBM 
Software White Paper.  
publish/Business_Strategy/Managing-big-data-for-smart-grids-and-
smart-meters-5248.html. 
[7] Informatization Committee of the CSEE. White paper of electric 
power big data of China. Beijing: China Electric Power Press, 2013. 
[8] Zhao Gang. Big data technology and application practice. Beijing: 
Publishing House of Electronics Industry, 2013: 56-58. 
[9] McKinsey& Company. Big data: the next frontier for innovation, 
competition, and productivity. New York: McKinsey Global 
Institute, 2011: 1-28. 
[10] Wu Xindong, Zhu Xingquan, Wu Gongqing, et al. Data mining with 
big data. IEEE Transactions on Knowledge and Data Engineering, 
2014, 26(1): 97-107. 
[11] Havens T C. Fuzzy c-means algorithms for very large data. IEEE 
Transactions on Fuzzy System, 2012, 20(6): 1130-1146. 
[12] Shim K. Algorithms for big data analysis. Proceedings of the VLDB 
Endowment, 2012, 5(12): 2016-2017. 
[13] Kong Yinghui. Study on data stream techniques and its application 
in electric power information processing. Heibei: North China 
Electric Power University, 2009. 
[14] Wang jiye, Ji Zhixiang, Shi Mengjie, et al. Intelligent equipped with 
TVU data demand analysis and application. Proceeding of the 
CSEE, 2015, 35(8): 1829⁃1836. 
[15] Hung Ronghui, Li Xun, LYU Qishen, et al. Research on the defect 
analysis of power equipment based on data mining. Electrical 
Application, 2015, 34(2): 46⁃50. 
[16] Hu Changhua. Based on user behavior analysis of peak load shifting 
management system research and design. Modern Computer 
(professional edition), 2014(21): 42⁃47. 
[17] Quilumba F L, Lee W J, Huang H, et al. Using smart meter data to 
improve the accuracy of intraday load forecasting considering 
customer behavior similarities. IEEE Transactions on Smart Grid, 
2015, 6(2): 911⁃918. 
(BBT nhận bài: 20/8/2018, hoàn tất thủ tục phản biện: 05/9/2018) 

File đính kèm:

  • pdfphan_tich_va_thao_luan_ung_dung_ki_thuat_du_lieu_lon_trong_l.pdf