Trong quá trình thực hiện chuyển đổi số, cơ sở dữ liệu được xem là nguồn lực sống còn, là tài sản quan trọng của doanh nghiệp. Ảnh: shutterstock.com

 
Công Sang Thứ Hai | 13/11/2023 11:30

Săn kỳ lân từ mỏ vàng dữ liệu

Năm thứ 4 của chuyển đổi số, doanh nghiệp Việt Nam đang đẩy mạnh khai thác mỏ vàng dữ liệu số.

Anh Thương (quận Bình Tân, TP.HCM) làm tài xế đã được nhiều năm. Những năm trước, khách hàng của anh đến từ tổng đài hoặc các chuyến đón khách trên đường, thì giờ đây, phần lớn các giao dịch đặt xe của anh thông qua ứng dụng điện thoại. Không những thế, liên lạc với khách hàng, gia đình của anh cũng từ điện thoại kết nối internet. “Cuộc sống và công việc của tôi là internet”, anh Thương nói.

Khai mỏ vàng dữ liệu số

Đây là ví dụ đơn giản nhất về cách nền kinh tế số vận hành. Thuật ngữ này đã có từ những năm 1990, khi internet bắt đầu được phổ cập và bùng nổ trở thành nền tảng của mọi mặt đời sống xã hội. Việt Nam đặt mục tiêu kinh tế số chiếm 20% GDP vào năm 2025 và 30% GDP vào năm 2030. Dù mục tiêu này có nhiều thách thức nhưng Việt Nam đang sở hữu nhiều lợi thế để nền kinh tế số phát triển về lượng người sử dụng internet và các phương tiện kết nối. 

Thống kê năm 2022 của Insider Intelligence về người dùng smartphone tại khu vực Đông Nam Á giai đoạn 2021-2026 cho thấy, năm 2021 số lượng người dùng smartphone tại Việt Nam đạt khoảng 62,8 triệu người, tăng 3,6% so với năm trước và chiếm 96% lượng người dùng internet trên cả nước. Ước tính năm 2023 lượng người dùng smartphone tại Việt Nam dự kiến ở mức 63,8 triệu, tăng 1,6% so với năm 2022 và chiếm 96,1% lượng người dùng internet trên cả nước.

Ở khu vực Đông Nam Á, con số này của Việt Nam tính đến hết năm 2023 chỉ kém mỗi Indonesia, quốc gia có dân số đông nhất khu vực. Insider Intelligence ước tính với tốc độ này đến năm 2026 lượng người dùng smartphone tại Việt Nam ước đạt 67,3 triệu người, tăng trưởng 1,7% so với năm trước đó và chiếm khoảng 96,9% lượng người dùng internet.

Báo cáo e-Conomy SEA năm 2022 do Google, Temasek và Bain & Company dự báo, Việt Nam sẽ là quốc gia có nền kinh tế số tăng trưởng mạnh nhất trong giai đoạn 2022-2025 trong 6 quốc gia (Indonesia, Malaysia, Philippines, Singapore, Thái Lan và Việt Nam) với GMV (tổng giá trị trao đổi hàng hóa) tăng 31% từ 23 tỉ USD năm 2022 lên 49 tỉ USD trong năm 2025 (chiếm khoảng 10% GDP Việt Nam năm 2023).

Theo Bộ Thông tin và Truyền thông, kinh tế kỹ thuật số ở Việt Nam dựa trên 3 trụ cột: kinh tế số ICT/viễn thông (kinh tế số ICT), kinh tế số internet/nền tảng (kinh tế số internet) và kinh tế số ngành/lĩnh vực (kinh tế số ngành). Trong đó, kinh tế số ICT gồm sản xuất phần cứng, sản xuất phần mềm, sản xuất nội dung số, dịch vụ công nghệ thông tin, dịch vụ viễn thông, dịch vụ truy cập internet. Kinh tế số internet/nền tảng gồm kinh tế dữ liệu số, kinh tế nền tảng số, dịch vụ số, kinh doanh số, kinh tế chia sẻ, kinh tế thuật toán, kinh tế internet. Cuối cùng, kinh tế số ngành/lĩnh vực gồm quản trị điện tử thương mại điện tử, ngân hàng điện tử, sản xuất thông minh, nông nghiệp chính xác và du lịch thông minh.

Riêng TP.HCM đặt mục tiêu phấn đấu tỉ trọng kinh tế số 25% đến năm 2025 và 40% vào năm 2030, cao hơn mục tiêu quốc gia 5-10% để tiếp tục là đầu tàu kinh tế cả nước.

Để đạt được mục tiêu này, một trong các “mỏ vàng” Việt Nam cần thúc đẩy khai thác hiệu quả chính là dữ liệu. Thậm chí, năm nay là năm có chủ đề “Năm dữ liệu số quốc gia” nhằm giúp khai thác dữ liệu số, tạo ra các giá trị mới trong phát triển... Năm dữ liệu số quốc gia sẽ tập trung vào phát triển dữ liệu mở; phát triển cơ sở dữ liệu; phát triển, thúc đẩy sử dụng các nền tảng số sử dụng thống nhất trên toàn quốc hoặc trong phạm vi mỗi địa phương; nâng cao năng lực quản trị dữ liệu, an toàn, bảo mật dữ liệu.

Theo thông tin từ Cục Chuyển đổi số quốc gia, “Bộ Thông tin và Truyền thông cùng các bộ, ngành, địa phương rà soát, sửa đổi, bổ sung, hệ thống hóa các văn bản quy phạm pháp luật về dữ liệu số, tạo điều kiện để tạo ra các doanh nghiệp kỳ lân nhờ dữ liệu số”.

Tập hợp các ốc đảo dữ liệu 

Tuy nhiên, ông Alexy Thomas, Phó Tổng Giám đốc, Lãnh đạo Bộ phận Dữ liệu, EY Ấn Độ, cho biết, theo khảo sát gần đây của EY, 71% ngân hàng thừa nhận trong hệ thống dữ liệu không được chia sẻ với nhau, tức dữ liệu được chia mảnh khắp nơi không được tập trung. Điều này có nghĩa là các tổ chức phải thu thập tập trung dữ liệu, làm sạch hóa dữ liệu. “Các ngân hàng vẫn đang rất hạn chế trong vấn đề này dù xu hướng là đầu tư nhiều vào cấu trúc dữ liệu, nâng cao khả năng lưu trữ, chuyển lên cloud (đám mây) nhằm đảm bảo lưu trữ tập trung để tối ưu hóa hoạt động”, ông Alexy Thomas nói.

Để đạt được mục tiêu này, một trong các “mỏ vàng” Việt Nam cần thúc đẩy khai thác hiệu quả chính là dữ liệu. Ảnh: Quý Hòa
Để đạt được mục tiêu này, một trong các “mỏ vàng” Việt Nam cần thúc đẩy khai thác hiệu quả chính là dữ liệu. Ảnh: Quý Hòa

Thực trạng của ngành ngân hàng cho thấy, giống như nhiều nền kinh tế kỹ thuật số phát triển như Mỹ, Trung Quốc, tốc độ lan tỏa của chúng trong các ngành nghề là khác nhau, thậm chí có những ngành nghề phản ứng rất chậm với chuyển động của nền kinh tế số như ngành năng lượng hoặc các lĩnh vực có giá trị cao như bất động sản. Vì thế, thương mại điện tử bán lẻ, giao thông, chăm sóc y tế, giáo dục, giải trí, tài chính... vẫn là các ngành dẫn dắt cũng như phản ánh sự phát triển của kinh tế kỹ thuật số ở Việt Nam do thu hút được nhiều thành phần kinh tế  tham gia.

Quay trở lại với câu chuyện của anh Thương, mỗi chuyến xe thực hiện thành công, anh phải chia hơn 35% số tiền thu được cho các nền tảng kết nối. Dù chi phí mua và vận hành xe, các khoản phí đắt nhất thuộc về tài xế, nhưng do không sở hữu được dữ liệu lưu thông hằng ngày của khách hàng nên những người như anh Thương không thể hoạt động độc lập trong nền kinh tế số hay đàm phán mức chiết khấu tốt hơn.

Dữ liệu là động cơ chính của nền kinh tế kỹ thuật số, chúng được thu thập, sử dụng và phân tích để tạo ra các trải nghiệm cá nhân nhằm giữ chân người sử dụng. Một mẫu quảng cáo từ thập niên 90 được thiết kế cho một nhóm người cùng mục đích mua hàng, nhưng với kinh tế số, mẫu quảng cáo đó có thể cá nhân hóa tới từng người theo sở thích hoặc thói quen mua hàng của họ.

Các công ty internet hàng đầu thế giới hiểu rõ điều này. Với sức mạnh về công nghệ, các đơn vị ra sức thu thập dữ liệu người sử dụng thông qua những ứng dụng phục vụ đời sống hằng ngày của họ. Nếu như Mỹ có bộ tứ GAFA (Google, Amazon, Facebook và Apple), thì Trung Quốc có BATX (Baidu, Alibaba, Tencent và Xiaomi).
Nhóm này thậm chí còn đi xa hơn trong việc tận dụng khả năng phân tích dữ liệu ngoài việc quảng cáo. Alibaba, sau khi thu thập lượng dữ liệu hành vi của người dùng thông qua hệ sinh thái thương mại điện tử, giải trí và tài chính của họ, đã tiến hành phân tích và cung cấp lại cho các nhà bán lẻ trên Alibaba để nhóm này tinh chỉnh sản phẩm phù hợp với các khách hàng tiềm năng.

Cuộc đua thu thập, phân tích dữ liệu không chỉ dành cho các công ty internet mà cả các doanh nghiệp truyền thống hoặc thế hệ doanh nghiệp sinh ra trước giai đoạn internet bùng nổ. Ví dụ, công ty giao nhận thương mại điện tử của Trung Quốc là SF Express đã dùng dữ liệu vận hành của 300.000 nhân viên chuyển phát nhanh và hơn 23.000 cửa hàng ngoài để cung cấp các báo cáo chuyên sâu cho các doanh nghiệp thương mại điện tử.

Dữ liệu là động cơ chính của nền kinh tế kỹ thuật số, chúng được thu thập, sử dụng và phân tích để tạo ra các trải nghiệm cá nhân nhằm giữ chân người sử dụng. Ảnh: Quý Hòa
Dữ liệu là động cơ chính của nền kinh tế kỹ thuật số, chúng được thu thập, sử dụng và phân tích để tạo ra các trải nghiệm cá nhân nhằm giữ chân người sử dụng. Ảnh: Quý Hòa

Hay như Ngân hàng China Merchants Bank đã thu thập dữ liệu về các giao dịch và lịch sử tín dụng kết hợp với mô hình thống kê để xây dựng quy trình xác định khả năng tài chính cũng như số tiền cho vay đối với người đăng ký khoản vay. Cách làm này đã rút ngắn thời gian thẩm định hồ sơ vay từ 3 ngày xuống còn 1 phút.

Ở Việt Nam, nhiều doanh nghiệp bán lẻ cũng đã áp dụng chiến lược để đảm bảo phục vụ khách ở đa kênh. Chia sẻ tại hội thảo “Tương lai của ngành bán lẻ Việt Nam: Nắm bắt công nghệ và xây dựng khả năng phục hồi”, bà Lê Huỳnh Phương Thục, Giám đốc Điều hành Guardian Việt Nam, cho biết hiện Công ty có 130 cửa hàng toàn quốc và hợp tác với nhiều nền tảng thương mại điện tử từ phổ thông cho đến các sàn như GrabMart. Theo bà Thục, khách hàng ở từng nền tảng là khác nhau, điển hình như GrabMart là tập khách hàng muốn được giao nhanh và thói quen lựa chọn sản phẩm cũng khác.

Ở Đông Nam Á nói chung và Việt Nam nói riêng, tạm thời chưa hình thành các công ty dẫn đầu về dữ liệu chung như Mỹ hay Trung Quốc mà hình thành các ốc đảo dữ liệu riêng biệt như về di chuyển là cuộc chơi của Grab, Gojek; ứng dụng mạng xã hội là các tên tuổi như Facebook, Zalo, Viber; thương mại điện tử là Shopee, Lazada, gần đây là sự xuất hiện của TikTok...

Các doanh nghiệp truyền thống của Trung Quốc thực hiện điều này khá bài bản sau khi bị ảnh hưởng nặng về thị phần từ các công ty internet. Ảnh: Quý Hòa
Các doanh nghiệp truyền thống của Trung Quốc thực hiện điều này khá bài bản sau khi bị ảnh hưởng nặng về thị phần từ các công ty internet. Ảnh: Quý Hòa

Ngoại trừ một số doanh nghiệp công bố dữ liệu ở Việt Nam như MoMo với 31 triệu người sử dụng, Zalo với 74 triệu người sử dụng, Facebook với 77 triệu người dùng (theo số liệu của oosga.com), còn lại đa phần là các công ty đa quốc gia đều không công bố nên rất khó thống kê. Nhưng có thể thấy, nhóm này sẽ không ngừng mở rộng sang các lĩnh vực khác để thu thập dữ liệu như cách các công ty Mỹ, Trung Quốc đã làm trong thời gian tới ở Việt Nam. 

Cũng phải nói thêm, mở rộng sang các lĩnh vực khác là hoạt động ưa thích của các công ty internet vì càng mở rộng, họ càng nắm trong tay nhiều dữ liệu về hành vi người dùng, cung cấp một góc nhìn toàn cảnh về họ, nhờ đó đẩy nhanh đáng kể tốc độ thu hút người sử dụng cho các sản phẩm, dịch vụ mới cũng như khả năng thương mại hóa các sản phẩm liên quan.

Theo báo cáo của McKinsey Global Institute (MGI) “Digital China: Powering the economy to global competitiveness” năm 2017, nếu như Taobao của Alibaba cần 8 năm để có 100 triệu người dùng, thì ứng dụng thanh toán trực tuyến Alipay chỉ mất 5 năm để đạt được cột mốc tương tự. Hay như phần mềm nhắn tin QQ của Tencent mất 12 năm để có 100 triệu người dùng, nhưng WeChat chỉ mất 18 tháng và Tenpay (ứng dụng thanh toán của Tencent) chỉ mất chưa đến 1 năm.

Thị trường Việt Nam có nhiều nét tương đồng như Mỹ và Trung Quốc 10 năm trước, khi các nền tảng công nghệ bắt đầu tham gia vào việc mở rộng dữ liệu người sử dụng. Có thể thấy như Facebook, Google và gần đây là Zalo đều ra tính năng video ngắn để phục vụ người sử dụng trước sự trỗi dậy của TikTok. Hay như Shopee cũng tích hợp Now, nền tảng giao nhận thức ăn, vào hệ sinh thái thương mại điện tử của mình để  “quan sát” thói quen ăn uống của các tín đồ mua sắm ở Việt Nam.

Trong quá trình thực hiện chuyển đổi số, cơ sở dữ liệu được xem là nguồn lực sống còn, là tài sản quan trọng của doanh nghiệp. Sự gia tăng khối lượng các nguồn dữ liệu như mạng xã hội, thiết bị di động, cảm biến IoT và các nền tảng trực tuyến là khối lượng thông tin khổng lồ tạo cơ hội cho việc khai thác và phân tích dữ liệu để sản sinh ra giá trị trong kinh doanh. Tuy nhiên, ông Alexy Thomas cho biết: “Hằng ngày có rất nhiều dữ liệu được cung cấp, tất cả đều có thể sử dụng, tận dụng và cần được khai thác bởi đây là nguồn nguyên liệu để phục vụ khách hàng một cách tốt nhất. Tuy nhiên, câu chuyện thực tế không phải lúc nào cũng đẹp như mong muốn”.

Ông Tô Mạnh Hoàng, Giám đốc Datapot Analytics, nhận định doanh nghiệp hiện nay vẫn thiếu cách thức thực thi hiệu quả các chiến lược công nghệ, dữ liệu. Có đến 85% dự án lớn đã thất bại (thống kê của Gartner năm 2017), có 62% nguyên nhân thất bại không nằm ở các vấn đề kỹ thuật mà do các doanh nghiệp không xác định rõ mục tiêu và đầu tư dữ liệu chưa đúng cách... dẫn đến giá trị tạo ra ít.

Mặt khác, giống như các tài xế công nghệ, các doanh nghiệp nếu không có lợi thế về dữ liệu sẽ phải phụ thuộc rất lớn vào các nền tảng công nghệ đang không ngừng bành trướng ở Việt Nam. Nhất là khi dữ liệu đã không còn rẻ như trước. Việt Nam đã có Luật Bảo vệ Dữ liệu Cá Nhân (General Data Protection Regulation - GDPR) để bảo vệ thông tin cá nhân của người dân. Luật này đặt ra các quy định và yêu cầu nghiêm ngặt về việc thu thập, lưu trữ và sử dụng dữ liệu cá nhân.

Điều này đòi hỏi các công ty phải tuân thủ các quy tắc nghiêm ngặt hơn trong việc quản lý dữ liệu và đảm bảo rằng người dùng có quyền kiểm soát thông tin cá nhân của họ. Dữ liệu đã trở thành một tài nguyên quan trọng và việc quản lý thông minh đối với dữ liệu đòi hỏi đầu tư lớn và tuân thủ quyền riêng tư.

Trao đổi với NCĐT, ông Huỳnh Tấn Đạt, Giám đốc Quản lý sản phẩm One Mount, cho biết việc Chính phủ đã có các luật cho dữ liệu nếu nhìn ở khía cạnh tích cực là tín hiệu tốt để thúc đẩy việc sử dụng dữ liệu một cách chính thống từ các doanh nghiệp. Nhiều doanh nghiệp và tổ chức ở Việt Nam đều nhận thấy dữ liệu là một phần quan trọng nhưng việc xây dựng và phát triển đặc thù và riêng biệt ở cả các doanh nghiệp và tổ chức dẫn đến nhiều “ốc đảo dữ liệu”. 

Đại diện của One Mount cho rằng để khai thác tốt nhất, doanh nghiệp vừa tập trung xây dựng dữ liệu riêng, đồng thời xây dựng chính sách hợp tác với các đối tác để bổ sung thêm dữ liệu theo đúng quy định hướng đến việc nâng cao hiệu quả kinh doanh. “Việc đầu tư làm chỉn chu sẽ là lợi thế hơn so với việc sử dụng các nguồn dữ liệu không chính thống từ bên thứ 3”, ông Đạt nói.

Các doanh nghiệp truyền thống của Trung Quốc thực hiện điều này khá bài bản sau khi bị ảnh hưởng nặng về thị phần từ các công ty internet. Theo báo cáo MGI “Digital China: Powering the economy to global competitiveness”, Jahwa, một trong những thương hiệu chăm sóc sắc đẹp lớn của Trung Quốc, đã hợp tác với dữ liệu giao dịch và hành vi tiêu dùng của Alibaba để phát triển sản phẩm. Công ty đã rút ngắn thời gian tiếp thị sản phẩm từ 15 tháng xuống 13 tháng và mở rộng danh mục sản phẩm từ 389 năm 2015 lên 500 trong năm 2016. Hay như ngân hàng thương mại China Guanfa đã mở rộng chi nhánh và địa điểm đặt máy ATM dựa trên dịch vụ Baidu Map, lúc đó xử lý hơn 10 tỉ mẫu dữ liệu vị trí mỗi ngày.

Tuy nhiên, báo cáo này cũng chỉ ra rằng việc hợp tác với các công ty công nghệ có thể không bền vững vì nhóm này sẽ ngày càng làm mờ ranh giới giữa công ty truyền thống và kỹ thuật số, các doanh nghiệp sau thời gian hợp tác phải phát triển các khách hàng mới bằng cách cung cấp các sản phẩm “ăn theo” phù hợp.

Đồng quan điểm, bà Thục của Guardian Việt Nam cho biết, dù hợp tác với các nền tảng nhưng Công ty vẫn xây dựng “ngôi nhà riêng” là hệ thống bán hàng trên webstie, ứng dụng. Tính đến hiện tại, Công ty có 2 triệu thành viên, hơn 200.000 lượt tải về ứng dụng, giúp tỉ lệ quay lại đạt 80%... Một điểm cần lưu ý khi làm việc đa nền tảng là dữ liệu sẽ đến từ rất nhiều nguồn, gây ra các trở ngại nhất định trong việc thống kê báo cáo. Guardian giải quyết thách thức này bằng cách thành lập một đội phân tích dữ liệu bao gồm những người có kiến thức về tài chính, tiếp thị, bán hàng để đánh giá các xu hướng trong tương lai. “Chúng tôi tin rằng đó là cách tốt nhất để phân tích các xu hướng bán hàng mới nổi có thể hoặc có nên thực thi hay không”, bà Thục nói.

Để làm được điều này, theo ông Nguyễn Hữu Đức, Giám đốc Điều hành nền tảng tích hợp dữ liệu Bluecore, phải tổng hợp các dữ liệu đó lại ở một nơi và có cái nhìn toàn diện hơn về khách hàng cũng như hoạt động kinh doanh của doanh nghiệp. Khi đó dữ liệu mới có thể được tối ưu cách hoạt động kinh doanh bao gồm quản lý hàng tồn kho, dự đoán cầu và cung, tối ưu hóa chi phí, nhân sự... hoặc tiến hành các chiến lược tiếp thị cá nhân hóa cho từng khách hàng.

“Một điều quan trọng khác doanh nghiệp cần lưu ý là chi phí xây dựng hệ thống phân tích dữ liệu. Trung bình cần từ 3-4 nhân sự, chi phí đầu tư hệ thống ban đầu và mất tầm 3-6 tháng để triển khai”, ông Đức nói.