Ứng dụng dữ liệu lớn - Thách thức đối với các ngân hàng thương mại Việt Nam
Dữ liệu có tầm ảnh hưởng quan trọng đối với hoạt động kinh doanh của mỗi ngân
hàng thương mại (NHTM)- lĩnh vực kinh doanh ngành dịch vụ đặc thù dựa trên cơ
sở thông tin. Sự xuất hiện của dữ liệu lớn (Big Data) trong bối cảnh kỷ nguyên số
đang được NHTM kỳ vọng như một nguồn tài nguyên khổng lồ có thể mang đến cái
nhìn đa chiều giúp ngân hàng đưa ra các quyết định sáng suốt. Tuy nhiên, việc ứng
dụng Big Data vẫn đang là bài toán khó với nhiều thách thức đối với các NHTM tại
Việt Nam. Nghiên cứu đề cập đến thực trạng ứng dụng và những thách thức cơ bản
của Big Data đối với các NHTM tại Việt Nam và đưa ra các giải pháp khuyến nghị
theo hướng tích hợp dữ liệu có cấu trúc truyền thống từ kho dữ liệu với các hệ thống
nội bộ và dữ liệu phi cấu trúc trên Big Data.
Từ khóa: Dữ liệu lớn (Big Data), thách thức, ngân hàng thương mại
Tóm tắt nội dung tài liệu: Ứng dụng dữ liệu lớn - Thách thức đối với các ngân hàng thương mại Việt Nam
80 Tạp chí Khoa học & Đào tạo Ngân hàng Số 224+225- Tháng 1&2. 2021 © Học viện Ngân hàng ISSN 1859 - 011X Ứng dụng dữ liệu lớn - thách thức đối với các ngân hàng thương mại Việt Nam Đào Mỹ Hằng Học viện Ngân hàng Đặng Thu Hoài Ngân hàng Đại chúng Ngày nhận: 16/09/2020 Ngày nhận bản sửa: 06/10/2020 Ngày duyệt đăng: 21/10/2020 Dữ liệu có tầm ảnh hưởng quan trọng đối với hoạt động kinh doanh của mỗi ngân hàng thương mại (NHTM)- lĩnh vực kinh doanh ngành dịch vụ đặc thù dựa trên cơ sở thông tin. Sự xuất hiện của dữ liệu lớn (Big Data) trong bối cảnh kỷ nguyên số đang được NHTM kỳ vọng như một nguồn tài nguyên khổng lồ có thể mang đến cái nhìn đa chiều giúp ngân hàng đưa ra các quyết định sáng suốt. Tuy nhiên, việc ứng dụng Big Data vẫn đang là bài toán khó với nhiều thách thức đối với các NHTM tại Việt Nam. Nghiên cứu đề cập đến thực trạng ứng dụng và những thách thức cơ bản của Big Data đối với các NHTM tại Việt Nam và đưa ra các giải pháp khuyến nghị theo hướng tích hợp dữ liệu có cấu trúc truyền thống từ kho dữ liệu với các hệ thống nội bộ và dữ liệu phi cấu trúc trên Big Data. Từ khóa: Dữ liệu lớn (Big Data), thách thức, ngân hàng thương mại. Challenges in applying Big Data for the Vietnam commercial banks Abstract: Data has an important influence on the business operations of each commercial bank. Commercial banks expect that the appearance of Big Data in the context of the digital era is a huge resource that can provide a multidimensional view to help banks make informed decisions. However, applying Big Data is difficult for commercial banks in Vietnam. The study discusses the application status and fundamental challenges of Big Data to commercial banks in Vietnam and recommends solutions. Keywords: Big Data, Challenges, Commercial Banks Hang My Dao Email: myhang@hvnh.edu.vn Banking Academy of Vietnam Hoai Thu Dang Email: danghoai.bav@gmail.com PvcomBank ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI 81Số 224+225- Tháng 1&2. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng 1. Giới thiệu Trong bối cảnh cạnh tranh khốc liệt của thị trường tài chính- ngân hàng (TC- NH), các NHTM đang từng bước ứng dụng các chuyển đổi số với trọng tâm là khách hàng (KH) nhằm không ngừng mang đến những trải nghiệm tốt hơn cho KH. Để làm được điều đó, NHTM cần có những chiến lược để hiểu được từng nhóm nhu cầu KH, từ đó có những quyết định phù hợp trong chính sách quản trị và hoạt động. Tại Việt Nam, tính đến tháng 01/2020, có khoảng 68 triệu người (khoảng 70% dân số) dùng internet, 65 triệu người (67% dân số) dùng mạng xã hội và 146 triệu lượt kết nối điện thoại (khoảng 150% dân số) (theo We are Social, 2020, “Digital 2020 global digital yearbook”), mọi thông tin về người dùng internet đều được lưu giữ lại thành dữ liệu theo đơn vị bit. Báo cáo này nhận định, sự gia tăng của nguồn dữ liệu này hoàn toàn có thể làm rung chuyển ngành dịch vụ TC- NH theo hướng tích cực hơn khi dữ liệu được thu thập, phân tích, giải thích liên quan đến xu hướng tài chính, từ đó vẽ nên một bức tranh chi tiết về xu hướng tiêu dùng và điều mà KH đang tìm kiếm. Đây sẽ là cơ sở rất quan trọng để các NHTM có thể cá nhân hóa dịch vụ đến từng KH, đáp ứng mong muốn KH tối ưu hơn trong định hướng chính sách sản phẩm, đặc biệt là nhóm sản phẩm có tính số hóa cao, đồng thời có thể xác định rủi ro kịp thời ở mọi thời điểm và có những thay đổi phù hợp trong điều hành, quản trị các hoạt động kinh doanh của ngân hàng để đạt được những mục tiêu lớn hơn. Tuy nhiên, việc khai thác, ứng dụng triển khai Big Data đang đặt rất nhiều thách thức cho các nhà quản trị NHTM và bộ phận công nghệ thông tin (CNTT), đặc biệt với các NHTM với mức vốn nhỏ. Để Big Data trở thành nguồn lực của ngân hàng, các NHTM cần trả lời được các câu hỏi: (i) Làm thế nào để có thể khai thác giá trị từ nguồn dữ liệu Big Data một cách hiệu quả? (ii) Dữ liệu này có tương thích và tích hợp được với những phân hệ hiện tại hay không? (iii) Thực trạng điều kiện ngân hàng đang ở đâu, có phù hợp để ứng dụng triển khai không? Để trả lời các câu hỏi đó, các nội dung tiếp theo sẽ được trình bày theo trình tự Tổng quan về Big Data, thực trạng ứng dụng Big Data tại các NHTM Việt Nam, thách thức của Big Data và giải pháp khuyến nghị đối với các NHTM. 2. Tổng quan về Big Data 2.1. Khái niệm Big Data Big Data dùng để chỉ tập dữ liệu với kích thước vượt quá khả năng lưu trữ, quản lý và phân tích của phần mềm cơ sở dữ liệu điển hình (Manyika, 2011). Big Data được hình thành từ việc sử dụng ngày càng tăng các công cụ điện tử và hệ thống thông tin, do các tổ chức và cá nhân hình thành trong đời thường dưới những hình thức khác nhau, bao gồm 6 nguồn dữ liệu chủ yếu sau: (i) dữ liệu hành chính; (ii) dữ liệu về hoạt động thương mại; (iii) dữ liệu từ các thiết bị cảm biến như thiết bị chụp ảnh vệ tinh, cảm biến đường, cảm biến khí hậu; (iv) dữ liệu từ thiết bị theo dõi; (v) dữ liệu từ hành vi (như tìm kiếm trực tuyến); (vi) dữ liệu từ thông tin về ý kiến, quan điểm cá nhân trên các phương tiện thông tin xã hội. Cụ thể, dữ liệu Big Data có thể chia thành 3 loại theo hình thức như sau: - Dữ liệu có cấu trúc (Structured): là những dữ liệu có thể được lưu trữ, truy cập và xử lý theo hình thức cố định truyền thống, đây là loại dữ liệu phổ biến nhất hiện nay tại các tổ chức. - Dữ liệu không có cấu trúc (Unstructured): Ứng dụng dữ liệu lớn - thách thức đối với các ngân hàng thương mại Việt Nam 82 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2. 2021 những dữ liệu không có khuôn mẫu hoặc cấu trúc cố định, không phù hợp lưu trữ và quản lý với cấu trúc thông thường bằng hệ quản trị cơ sở dữ liệu truyền thống. Loại dữ liệu này có khối lượng lớn, không có cấu trúc và thay đổi nhanh, đặt ra rất nhiều thách thức trong xử lý và quản trị dữ liệu để có thể khai thác được giá trị từ nó. Ví dụ như dữ liệu từ các mạng xã hội như Facebook, Twitter, Instagram, đều là những nguồn dữ liệu không có cấu trúc kết hợp từ văn bản, ảnh, video... - Dữ liệu bán cấu trúc (Semi-structured): Dữ liệu kiểu bán cấu trúc có thể bao gồm tất cả các mẫu dữ liệu. Chúng ta có thể thấy dữ liệu bán cấu trúc như một mẫu nhưng nó không được định nghĩa với bảng với mối quan hệ như hệ quản trị quan hệ dữ liệu quan hệ (DBMS- Relational Database Management System). Loại dữ liệu này thường được thể hiện trong tập tin ngôn ngữ đánh dấu mở rộng (XML- Extensible Markup Language), có chức năng truyền dữ liệu và mô tả nhiều loại dữ liệu khác nhau. 2.2. Đặc tính của Big Data Big Data có 5 đặc trưng cơ bản như sau (mô hình 5Vs về Big Data- theo Issues with big data, Gartner, 2018): - Khối lượng dữ liệu (Volume): Đây là đặc điểm tiêu biểu nhất của Big Data, đó là khối lượng hoặc kích thước dữ liệu rất lớn. Kích cỡ của Big Data ngày càng tăng lên, dự kiến đến năm 2025 IDC dự đoán số liệu này sẽ là 175 zettabytes (1021 bytes) tương ứng với khoảng 59% công suất của nền công nghiệp cung cấp ổ cứng (HDD) toàn cầu (theo David Reinsel và cộng sự, 2018), nên các tổ chức sẽ cần sử dụng công nghệ “đám mây” mới đáp ứng khả năng lưu trữ được Big Data. - Tốc độ (Velocity): Tốc độ có thể hiểu theo hai khía cạnh: (i) Khối lượng dữ liệu gia tăng rất nhanh; (ii) Xử lý dữ liệu nhanh ở mức thời gian thực (real time) tính bằng mili giây. Công nghệ xử lý Big Data ngày nay đã cho phép chúng ta xử lý tức thì trước khi chúng được lưu trữ vào cơ sở dữ liệu. - Đa dạng (Variety): Big Data cho phép liên kết và phân tích nhiều dạng dữ liệu khác nhau, ví dụ như kết nối thông tin của người dùng trên các nền tảng mạng xã hội khác nhau. - Độ tin cậy/ chính xác (Veracity): Đây là một trong những tính chất phức tạp nhất của Big Data bởi các phương tiện truyền thông xã hội, mạng xã hội ngày càng phổ biến với đa dạng người dùng tương tác và chia sẻ nên việc xác định độ tin cậy và chính xác của dữ liệu ngày một phức tạp hơn. - Giá trị (Value): Giá trị là đặc điểm quan trọng nhất của Big Data, vì khi bắt đầu triển khai xây dựng Big Data thì việc đầu tiên phải làm là xác định được giá trị của thông tin mang lại như thế nào, bởi dữ liệu tự bản thân không sinh ra giá trị, chỉ khi được xử lý và khai phá hợp lý thì chúng mới phát huy được lợi ích. Dựa trên các cân đối về nguồn lực khi đó chúng ta mới quyết định triển khai Big Data hay không. 2.3. Tầm quan trọng của ứng dụng Big Data đối với các ngân hàng thương mại Big Data với nguồn dữ liệu khổng lồ, cập nhật từng phút, đang có vai trò lớn trong lĩnh vực ngân hàng với các ứng dụng cụ thể như: phân tích, phân loại sự hài lòng và hành vi KH; phân tích phát hiện và cảnh báo, ngăn chặn các hành vi rủi ro, giả mạo; tối ưu hóa hoạt động xử lý dữ liệu trong quá trình vận hành, phân tích và hỗ trợ ra quyết định. Tiếp cận, nghiên cứu và khai thác Big Data sẽ mang đến nhiều lợi ích cho ngân hàng trong kinh doanh như: tiết giảm chi phí; tăng thời gian phát triển và tối ưu hóa ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI 83Số 224+225- Tháng 1&2. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng sản phẩm; đồng thời hỗ trợ ban lãnh đạo, cán bộ ngân hàng đưa ra những quyết định đúng và hợp lý hơn; tiết kiệm thời gian xử lý thông tin của KH và phòng chống rủi ro gian lận Nghiên cứu của Manyika, J. (2017) cho thấy, khoảng 30% tất cả các công việc trong NHTM có thể được tự động hóa thông qua công nghệ và chìa khóa cho vấn đề này nằm ở Big Data. Điều này sẽ giúp NHTM có thể tiết kiệm đáng kể chi phí và giảm rủi ro bằng cách loại bỏ sự chi phối của yếu tố con người trong một số quy trình quan trọng. Thực tế, bản thân NHTM cũng có được nguồn dữ liệu khá lớn từ chính các KH của mình qua các giao dịch trong hệ thống ngân hàng lõi (corebanking system). Nhưng chỉ bó hẹp trong lịch sử giao dịch đó là chưa đủ để NHTM hiểu về nhu cầu của KH, bởi trong thời đại con người ngày càng phụ thuộc vào Internet, thì nguồn dữ liệu lớn nhất phản ánh rõ mong muốn, thói quen và hành vi KH lại nằm ở mạng xã hội như Facebook, Twitter, Instagram, và thông tin sử dụng Internet. Theo Oracle (2016), 84% các giám đốc điều hành ngân hàng được khảo sát đồng ý rằng KH đang tìm kiếm trải nghiệm phù hợp, cá nhân hơn và nếu ngân hàng có thể cung cấp cho người dùng những gì họ cần, ngân hàng có thể thúc đẩy doanh thu hàng năm cao hơn 18%. Do vậy, vấn đề cấp thiết đặt ra là cần kết nối các dữ liệu này với nhau để hình thành một cái nhìn tổng quan về KH (3600 view). Khi ứng dụng Big Data, NHTM có thể sử dụng dữ liệu từ các mạng xã hội để các ngân hàng đưa ra chiến lược kinh doanh sát với nhu cầu của nhóm KH mục tiêu hơn. Kết quả nghiên cứu của Analytics, M. (2016) cho thấy rằng việc sử dụng Big Data để đưa ra quyết định có thể tiết kiệm tới 15- 20% ngân sách tiếp thị của ngân hàng. Có thể nói, khai thác Big Data là cơ hội tuyệt vời để không chỉ tiết kiệm chi phí mà còn tạo thêm doanh thu thông qua các chiến lược tiếp thị được nhắm đến đúng mục tiêu. Đồng thời, từ nguồn thông tin dồi dào từ Internet và các mạng xã hội, ngân hàng có thể tương tác chặt chẽ hơn với KH, cải thiện dịch vụ KH một cách nhanh chóng, giảm ảnh hưởng của độ trễ thời gian. Bởi hệ thống truyền thống nhận phản hồi của KH đang bộc lộ nhiều hạn chế, và cần được cải thiện dần bởi hệ thống mới thiết kế với công nghệ xử lý Big Data và công nghệ xử lý ngôn ngữ tự nhiên. Hơn nữa, công nghệ Big Data có thể được sử dụng để lưu trữ các dữ liệu mới trước khi chúng được đưa vào các kho chứa dữ liệu (Data Warehouse). Sự kết hợp giữa công nghệ Big Data có tốc độ xử lý ở mức thời gian thực với kho dữ liệu giúp cho các ngân hàng thoát khỏi việc không khai thác hết giá trị của dữ liệu do độ trễ thời gian. Do Big Data được ứng dụng các công nghệ mới giúp kiểm soát chặt chẽ và cập nhật dữ liệu liên tục sẽ ưu việt hơn dữ liệu truyền thống ở 4 điểm: dữ liệu đa dạng hơn, lưu trữ dữ liệu lớn hơn, truy vấn nhanh hơn và độ chính xác cao hơn (theo Cornelia Hammer và cộng sự, 2017). Tóm lại, Big Data là cơ hội đồng thời cũng là thách thức đặt ra cho NHTM trong thời đại số hiện nay. Một khi làm chủ được Big Data từ việc trích xuất thông tin chính xác hơn, hữu ích hơn với chi phí thấp hơn thì NHTM sẽ có cơ hội thành công lớn hơn trong bối cảnh cạnh tranh ngày càng khắc nghiệt và nhu cầu phát sinh đa dạng hơn từ KH. 2.4. Cách tiếp cận Big Data Hiện nay có nhiều cách tiếp cận triển khai các giải pháp Big Data trong các tổ chức, tuy nhiên dựa trên cơ sở nền tảng công nghệ, có ba cách tiếp cận phổ biến được áp dụng là (i) cách tiếp cận truyền thống, (ii) cách tiếp cận tiến hóa và (iii) cách tiếp Ứng dụng dữ liệu lớn - thách thức đối với các ngân hàng thương mại Việt Nam 84 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2. 2021 cận theo phương pháp lai (Nasser & Tariq, 2015). Các ngân hàng cân nhắc tùy vào các điều kiện thực tế về quy mô, nguồn lực hiện tại, mục tiêu mà mỗi đơn vị có một chiến lược khác nhau. Cụ thể: Thứ nhất là cách tiếp cận truyền thống mang tính cách mạng, nghĩa là ngân hàng thiết lập một môi trường tính toán Big Data mới và chuyển tất cả dữ liệu sang nền tảng mới, ví dụ như Hadoop. Vì vậy tất cả các quá trình xử lý, phân tích, báo cáo và lập mô hình được thực hiện trên môi trường mới với đầy đủ thông tin, dữ liệu thông qua các ứng dụng và công nghệ phân tích mới (Business Intelligence & Analytics) để chuyển dữ liệu thô thành những mảng thông tin hữu ích toàn cảnh về quá khứ, dự đoán tương lai của tổ chức hướng đến xây dựng các giải pháp kinh doanh thông minh. Thứ hai là cách tiếp cận tiến hóa trong đó Big Data được xử lý bằng nền tảng Business Intelligence (BI) truyền thống hiện tại. Dữ liệu được thu thập và phân tích thông qua các công cụ có cấu trúc và không có cấu trúc và sau đó đầu ra được chuyển tiếp đến kho dữ liệu. Các tiện ích báo cáo và lập mô hình truyền thống giờ đây có thể truy cập suy nghĩ và bản ghi trực tuyến từ các nguồn truyền thông xã hội. Tuy nhiên, ngay cả khi cách tiếp cận tiến hóa đáp ứng được nhiều yêu cầu của môi trường Big Data, nó vẫn có hầu hết các vấn đề của BI cổ điển, nó có thể trở thành một nút cổ chai giữa thông tin trực tuyến từ các nguồn Big Data và phân tích sức mạnh của biến đổi BI hoặc kho dữ liệu. Thứ ba là phương pháp lai mà cả công nghệ Big Data truyền thống và mới được sử dụng và dữ liệu được phân phối giữa hai nền tảng, một ví dụ về cách tiếp cận như vậy là giải pháp Hana từ SAP (công ty dẫn đầu thị trường về phần mềm ứng dụng doanh nghiệp trên thế giới, có trụ sở chính tại Đức). Đây là một giải pháp phân tích tích hợp dữ liệu, tính toán, nền tảng và được chạy trên công nghệ điện toán bộ nhớ đệm (In-memory computing), công nghệ mới này có thể chạy đồng thời hệ thống xử lý giao dịch trực tuyến (OLTP- Online Transaction Processi ... o nhu cầu (báo cáo ad-Hoc) và các báo cáo chuyên sâu ngày càng phức tạp, đáp ứng nhu cầu kịp thời cho các nhà quản trị. Những công nghệ và công cụ hỗ trợ cần thiết, bao gồm: hệ sinh thái Hadoop; cơ sở dữ liệu NoSQL (Not only SQL) có thể được thu nhỏ theo chiều ngang trên hàng trăm hoặc hàng nghìn máy chủ; cơ sở dữ liệu bộ nhớ trong (IMDB) với ưu điểm nhanh hơn so với cơ sở dữ liệu trên đĩa được tối ưu hóa, một lựa chọn quan trọng cho việc sử dụng phân tích Big Data tạo kho dữ liệu. Đồng thời, việc xử lý kỹ thuật, lựa chọn công nghệ, cập nhật thuật toán trong đảm bảo tính riêng tư, bảo mật dữ liệu với khối lượng lớn trong xu hướng lưu trữ “đám mây” ngày càng tăng cũng là một vấn đề hóc búa với bộ phận CNTT của các NHTM. Về dữ liệu Thực tế hiện nay dữ liệu ở NHTM Việt Nam còn khá manh mún và chưa được làm sạch một cách đạt yêu cầu, cũng chưa có sự phân loại rõ ràng về dữ liệu có cấu trúc và phi cấu trúc nên việc tích hợp dữ liệu đòi hỏi làm sao chuẩn hoá các dữ liệu cả đầu vào và đầu ra, ví dụ như trường hợp NHTM triển khai các hệ thống từ các đối tác CNTT khác nhau cũng chưa có chuẩn mực ngay từ đầu sẽ dẫn đến khó khăn hơn cho việc hợp nhất dữ liệu nếu sử dụng các nền tảng khác nhau như Oracle và SQL. Ngoài ra, theo các nghiên cứu trong nước như “Tương lai nền kinh tế số Việt Nam hướng tới năm 2030 và 2045” (CSIRO, 2019), “Dữ liệu lớn: Cách thức khai thác cơ hội từ dữ liệu? Trường hợp Amazon” (Nguyễn Anh Duy, 2019), thực trạng tâm lý và hành vi người tiêu dùng Việt Nam là hay thay đổi và thường có sở thích, xu hướng ngắn hạn chi phối bởi các cộng đồng số và những người có tầm ảnh hưởng (Influencer), do vậy, việc phân tích nhu cầu KH để đưa vào áp dụng là thách thức với các NHTM, vì nếu nhận định sai xu hướng nhu cầu thị trường Big Data có thể trở thành một con dao hai lưỡi. Do đó, NHTM còn đối mặt với việc xác định thời gian dữ liệu hợp lệ, Biểu đồ 4. Đánh giá kỹ năng nhân viên trong thời đại số Nguồn: Vietnam Report, (2019), Báo cáo Vietnam CEO Insight 2019 ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI 89Số 224+225- Tháng 1&2. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng trả lời câu hỏi trong bao lâu chúng ta nên giữ thông tin đó trong cơ sở dữ liệu và thời điểm nào thì dữ liệu không còn phù hợp với phân tích để đảm bảo được chất lượng thông tin đầu ra. Mặt khác, NHTM cần lưu ý trong khai thác dữ liệu KH cần tuân thủ các quy định của pháp luật, ví dụ theo Nghị định số 117/2018/NĐ-CP “Về việc giữ bí mật, cung cấp thông tin KH của tổ chức tín dụng, chi nhánh ngân hàng nước ngoài” có hiệu lực từ 01/11/2018. Đây là một thách thức quan trọng khi việc quan tâm đến bảo mật thông tin của KH ngày càng tăng, mà ngân hàng lại đang có xu hướng sử dụng lưu trữ đám mây và hợp tác nhiều hơn với các tổ chức fintech. Không chỉ vậy, ngân hàng với mạng lưới các điểm giao dịch lớn trải dài trên khắp đất nước và có một số ngân hàng có chi nhánh tại nước ngoài có quy mô nhân viên tương đối lớn, thực hiện nhiều loại giao dịch với khách hàng mỗi ngày nên ngân hàng cần chú ý vấn đề xây dựng quy trình kiểm soát, phân quyền truy cập hệ thống và đào tạo nhân sự nội bộ bài bản về nhận diện và bảo mật thông tin khách hàng. Từ những phân tích trên cùng với thực tế tội phạm an ninh mạng ngày càng nhiều, với trình độ tinh vi đến từ khắp nơi trên thế giới chỉ với kết nối mạng thông thường, các ngân hàng cần rất thận trọng trong việc đảm bảo các yếu tố bảo mật dữ liệu từ các hệ thống đến nhân sự, đối tác, nếu không đảm bảo được yếu tố này, ngân hàng rất có thể đối mặt với rủi ro về khủng hoảng truyền thông, hình ảnh thương hiệu cũng như hoạt động kinh doanh. Tóm lại, bốn nhóm thách thức chính nêu trên phản ánh thực tế rằng các NHTM Việt Nam cần thời gian để chuẩn bị và tìm kiếm giải pháp phù hợp để có thể ứng dụng Big Data. Nếu như việc áp dụng triển khai Big Data không có lộ trình rõ ràng, thực hiện không đúng cách, người triển khai không đủ năng lực sẽ có thể nảy sinh nhiều vấn đề từ thiết kế, lưu trữ đến quản lý truy cập dữ liệu, an toàn bảo mật. 5. Khuyến nghị và giải pháp đối với các ngân hàng thương mại Việt Nam Để có thể ứng dụng Big Data trong NHTM với một mục tiêu dài hạn cần chuẩn bị kỹ càng nhiều yếu tố, cần có quan điểm quản trị đúng đắn, xác định rõ nhu cầu, mục tiêu cùng với cân nhắc các nguồn lực, từ đó có lộ trình với những mức độ ưu tiên riêng cho từng cấu phần trong chiến lược tổng thể. Thông qua trao đổi với các chuyên gia có kinh nghiệm thực tế trong việc triển khai các dự án về Kho dữ liệu Doanh nghiệp, chuyển đổi số hướng đến ứng dụng Big Data và Trí tuệ nhân tạo từ các ngân hàng Vietinbank, BIDV, Công ty ví điện tử Momo, Công ty Trusting Social, Vintech và những chia sẻ khác tại Hội thảo Quản lý dữ liệu thông mình trong lĩnh vực ngân hàng, tài chính tháng 9/2020, nhóm tác giả khuyến nghị NHTM áp dụng theo 7 bước ở cấp độ “High level” trong phân tích cân nhắc lợi ích trước khi triển khai Big Data, góp phần đảm bảo dự án Big Data đi đúng hướng: Bước 1. Xác định các tình huống kinh doanh thực tế cần cải thiện: NHTM cần đặt ra những câu hỏi chi tiết trong các vấn đề để đảm bảo các ưu tiên cho các vấn đề cần cải thiện đưa ra hợp lý nhất với điều kiện thực tại. Bước 2. Hiểu quy trình kinh doanh và các sản phẩm: Cách thức hoạt động, quy trình và đặc trưng sản phẩm tại mỗi NHTM sẽ có sự khác biệt, việc nắm rõ là rất quan trọng trong triển khai dự án. Bước 3. Hiểu cách phân loại và mức độ phân tích cần thiết: Để NHTM có cái nhìn hoàn chỉnh về thị trường và cách cạnh tranh hiệu quả đòi hỏi một khung phân tích mạnh mẽ bao gồm phân tích mô tả, phân tích dự đoán và phân tích theo quy định. Ứng dụng dữ liệu lớn - thách thức đối với các ngân hàng thương mại Việt Nam 90 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2. 2021 Bước 4. Tiến hành khám phá chi tiết: Các NHTM cần tìm ra quá trình nào bị ảnh hưởng bởi dữ liệu và thực hiện bắt đầu với các quy trình kinh doanh liên quan trực tiếp đến việc tạo doanh thu, sau đó là quy trình hỗ trợ tối ưu hóa. Bước 5. Xác định các yêu cầu chính về dữ liệu: Dựa trên nhu cầu và tình hình hoạt động kinh doanh và quản trị, các điểm dữ liệu chính, số liệu và điểm đánh dấu cần được xác định. Bước 6. Thiết kế kiến trúc dữ liệu mạnh mẽ: Kiểu kiến trúc dữ liệu tốt nhất là kiến trúc có khả năng mở rộng và giải quyết các yêu cầu của NHTM ít nhất là trong thập kỉ tới, khi dữ liệu tăng dần lên và yêu cầu phân tích thời gian thực cùng Dashboard sáng tạo. Bước 7. Triển khai ứng dụng: Khi một tầm nhìn rõ ràng đã được đặt ra với một cam kết thực hiện từ các bên có bao gồm đối tác triển khai thì sẽ giúp giảm bớt các rào cản khi cùng hướng đến mục tiêu chung dựa trên nguyên tắc. Ngoài ra, để chuẩn bị nền tảng và đối mặt với những thách thức đã phân tích, bài viết đưa ra bốn nhóm giải pháp như sau: Một là, giải pháp về tài chính: Để phù hợp với nguồn lực tài chính, NHTM nên tận dụng sự hỗ trợ của công nghệ điện toán đám mây. Hiện nay, các nhà cung cấp giải pháp Big Data trên đám mây đã có thể xây dựng sẵn các mô hình phân tích và mang lại khả năng các tổ chức có thể chi trả cho các nguồn lực siêu tính toán theo phương thức chi tiêu tùy theo khả năng. Ngoài ra, để giảm thiểu một phần chi phí cho việc thu thập và làm sạch dữ liệu, NHTM nên đẩy mạnh hợp tác với các công ty tài chính công nghệ fintech, hướng đến xây dựng mô hình chuỗi cung ứng mới gắn kết chặt chẽ hơn với nhu cầu của KH. Khi đó, chuỗi cung ứng dịch vụ ưu việt hơn sẽ tạo ra một cơ sở dữ liệu thống nhất, minh bạch và hiệu quả hơn ở mọi giai đoạn, từ khi KH phát sinh nhu cầu cho đến khi hoàn tất thực hiện cung ứng dịch vụ. Hai là, giải pháp về công nghệ bao gồm kết cấu hạ tầng thông tin nhằm đáp ứng nền tảng về công nghệ để ứng dụng Big Data. Muốn sử dụng và khai thác Big Data một cách hiệu quả thì điều cần thiết là phải xây dựng cơ sở hạ tầng đủ để thu thập và lưu trữ dữ liệu, cung cấp quyền truy cập và bảo mật thông tin trong khi lưu trữ và chuyển tiếp, bao gồm: các hệ thống lưu trữ và máy chủ; phần mềm quản lý, tích hợp dữ liệu; phần mềm phân tích dữ liệu và một số thành phần khác. NHTM nên lựa chọn các giải pháp Big Data có nền tảng kết nối và tận dụng được dữ liệu từ các hệ thống hiện tại để không lãng phí cơ sở hạ tầng, dữ liệu và nguồn lực đã thực hiện trước đó. Ba là, nhóm giải pháp về nguồn nhân lực có đủ năng lực sáng tạo, nền tảng công nghệ của Cách mạng công nghiệp 4.0 nói chung và ứng dụng Big Data nói riêng. Các nhà quản trị cần tham khảo các mô hình thành công trên thế giới và có hoạch định rõ về chiến lược phát triển dài hạn hiện đại hóa NHTM. Ngoài việc tuyển dụng mới nhân sự có kinh nghiệm và trình độ về hiện đại hóa ngân hàng, ứng dụng Big Data thì cần ưu tiên chiến lược phát triển nhân sự nội bộ để xây dựng nguồn nhân lực mạnh với chi phí hợp lý, như phổ cập tham gia các khóa đào tạo về phân tích dữ liệu, lập trình và cơ sở dữ liệu. Đối với bộ phận nghiệp vụ, cần tiếp cận thêm các ngôn ngữ lập trình ứng dụng trong xử lý phân tích dữ liệu như R, Python, SQL để chủ động trong xử lý dữ liệu và có cái nhìn bao quát hơn về hệ thống dữ liệu. Đối với bộ phận CNTT, yêu cầu đặt ra có thể tiếp cận và nhanh chóng tiếp thu các xu hướng công nghệ mới của thế giới trong thiết kế cơ sở dữ liệu, xử lý truy vấn, tích hợp dữ liệu ví dụ như công cụ quản lý dữ liệu phân tán (Hadoop, Dryad), ĐÀO MỸ HẰNG - ĐẶNG THU HOÀI 91Số 224+225- Tháng 1&2. 2021- Tạp chí Khoa học & Đào tạo Ngân hàng hệ cơ sở dữ liệu không cấu trúc NoQuery, các công cụ xử lý (MapReduce) Bốn là, giải pháp về dữ liệu. Tuy các nhà cung cấp đám mây hiện nay mang lại một số lợi ích an ninh hơn so với trung tâm dữ liệu thông thường của NHTM như bảo vệ và giám sát dữ liệu tập trung hơn, tuy nhiên nó cũng mang lại rủi ro khi mà dữ liệu có thêm một tổ chức trung gian nắm giữ. Vì vậy, các NHTM cần áp dụng các tiêu chuẩn cao về đối tác, tuyển dụng và quản lý con người, hệ thống; đặc biệt quan tâm đến việc xây dựng trung tâm dự phòng dữ liệu (khôi phục dữ liệu sau thảm họa); nâng cấp hệ thống an ninh, bảo mật ở mức cao; đảm bảo việc mở rộng phạm vi hoạt động (nếu có) được ổn định, an toàn, mang lại hiệu quả lâu dài. 6. Kết luận Nhờ khả năng kết hợp nhiều công nghệ, kỹ thuật và phương pháp hiện đại, tối ưu, Big Data đang dần thể hiện rõ tầm quan trọng của mình đối với NHTM hiện tại và trong tương lai. Tuy nhiên NHTM cần hết sức thận trọng trong việc ứng dụng nó để phù hợp với thực tiễn, khắc phục các hạn chế, thách thức và đảm bảo an toàn thông tin thông qua xây dựng một lộ trình triển khai phù hợp dựa trên khuyến nghị tiếp cận theo 7 bước ở cấp độ “High level”, và một số giải pháp được đúc kết dựa trên thực tế từ các chuyên gia đã triển khai và ứng dụng thành công vào các ngân hàng, fintech. Một khi có thể làm chủ, tận dụng, kết hợp giữa hệ thống dữ liệu hiện tại và Big Data thì Biểu đồ 5: Giải pháp Data Lake kết nối dữ liệu truyền thống và dữ liệu phi cấu trúc của ngân hàng Nguồn: Analytics, M. (2016), The age of analytics: Competing in a data-driven world Ứng dụng dữ liệu lớn - thách thức đối với các ngân hàng thương mại Việt Nam 92 Tạp chí Khoa học & Đào tạo Ngân hàng- Số 224+225- Tháng 1&2. 2021 NHTM sẽ có cơ hội thành công lớn hơn trong bối cảnh cạnh tranh ngày nay và hưởng lợi nhiều hơn từ việc trích xuất thông tin một cách chính xác, hữu ích. Từ những nền tảng ban đầu trong phân tích này, nhóm nghiên cứu sẽ hướng đến nghiên cứu cụ thể theo các nhóm ngân hàng tương đồng về quy mô và ứng dụng công nghệ mới, từ đó đưa ra những giải pháp hữu ích hơn để xây dựng nền kinh tế số, giúp các tổ chức ngân hàng có thể mang đến trải nghiệm dịch vụ tốt nhất tới khách hàng ■ Tài liệu tham khảo Analytics, M. (2016). The age of analytics: competing in a data-driven world. McKinsey Global Institute Research Banking Academy, (2017), Big Data for Banking and Financial Industry, Science and technics publishing house, ISBN: 9786046709305. Cornelia Hammer, Diane C Kostroch, Gabriel Quiros, (2017), Big Data: Potential, Challenges, and Statistical Implications, ISBN/ISSN:9781484310908. Cơ quan Nghiên cứu Khoa học và Công nghiệp Khối thịnh vượng chung Úc (CSIRO), (2019), Tương lai nền kinh tế số Việt Nam hướng tới năm 2030 và 2045. Cục Thông tin Khoa học và Công nghệ Quốc gia, (2015), Tổng luận Dữ liệu lớn và xu hướng đổi mới sáng tạo dựa trên dữ liệu số. Domo, (2020), Data never sleeps 7.0 (www.domo.com). Đào Văn Hùng, (2019), Phát triển khu vực tài chính- ngân hàng trong bối cảnh Cách mạng công nghiệp lần thứ tư, Tạp chí Cộng sản số 6/2019. Fred Zimmerman, (2015), Hadoop Business Case: A Cost Effective Queryable Data Archive/Storage Platform. Gärtner, B., & Hiebl, M. R. (2018). Issues with big data. The Routledge Companion to Accounting Information Systems (S. 161-172). New York: Routledge. Gordon, J., Perrey, J., & Spillecke, D. (2013). Big data, analytics and the future of marketing and sales. McKinsey: Digital Advantage. Hortonworks, (2019), Data Strategy Scorecard Survey. Học viện Ngân hàng, (2019), Kỷ yếu Hội thảo Hệ thống thông tin quản lý trong kỷ nguyên số, NXB Thanh Niên, ISBN: 9786049756801. Mary Aleksandrova, (2020) Big Data in the Banking Industry: The Main Challenges and Use Cases. . McKinsey Global Institute Research Manyika, J. (2011). Big data: The next frontier for innovation, competition, and productivity. . McKinsey Global Institute Research Manyika, J. (2017). A future that works: AI, automation, employment, and productivity. McKinsey Global Institute Research, Tech. Rep, 60. Nasser T & Tariq RS, (2015), Big Data Challenges, Journal of Computer Engineering & Information Technology Volume 4 Issue 3. Ngô Kim Thanh, (2020), Ứng dụng dữ liệu lớn trong nền kinh tế số. Nghị định số 117/2018/NĐ-CP Về việc giữ bí mật, cung cấp thông tin khách hàng của tổ chức tín dụng, chi nhánh ngân hàng nước ngoài, ban hành ngày 11/09/2018. Nguyễn Anh Duy, Nguyễn Phúc Quỳnh, (2019), Dữ liệu lớn: Cách thức khai thác cơ hội từ dữ liệu? Trường hợp Amazon, Tạp chí Phát triển & Hội nhập số 46. Oracle, (2016), The Era I Enterprise: Ready for Anything, Financial Services- Report Phan Thanh Đức và cộng sự, (2019), Ứng dụng dữ liệu lớn trong hoạt động quản trị quan hệ khách hàng tại các NHTM Việt Nam, Tạp chí Khoa học & Đào tạo Ngân hàng số 203. Philip Russom, (2015), Hadoop for the Enterprise: Making DataManagement Massively Scalable, Agile, Feature-Rich, and Cost-Effective. Reinsel, D., Gantz, J., Rydning, J., (2018), Data Age 2025: The Digitization of the World from Edge to Core, IDC Vietnam Report, (2019), Báo cáo Vietnam CEO insight 2019: chuyển đổi số và cơ hội của các doanh nghiệp Việt Nam We are Social, (2020), Digital 2020 global digital yearbook.
File đính kèm:
- ung_dung_du_lieu_lon_thach_thuc_doi_voi_cac_ngan_hang_thuong.pdf