Thứ Tư | 26/12/2012 10:02

Dữ liệu lớn (1): Phố Wall xích lại gần Thung lũng Silicon (Kỳ 4)

Ngân hàng biết rất nhiều về khách hàng của họ. Thông tin này có thể có giá trị lớn ở nhiều khía cạnh.
Một ngân hàng lớn thuê một “ngôi sao phân tích” từ một hãng khác, cam kết một khoản tiền thưởng lớn nếu chuyên gia này giúp làm tăng doanh thu hoặc cắt giảm chi phí. Việc này thường xuyên diễn ra trong ngành ngân hàng, nhưng “thương vụ” lần này có một chi tiết nhỏ khác biệt: kẻ được thuê là Watson, một máy tính của hãng IBM.

Watson trở nên nổi tiếng sau khi đánh bại nhà vô địch trong cuộc thi “Jeopardy”, trò chơi hỏi đáp của Mỹ. Kỹ năng của chiếc máy tính này là có thể nhanh chóng xử lý hàng triệu tài liệu bằng cách đọc và “hiểu” ngôn ngữ viết thông thường. Máy tính thường không gặp rắc rối gì trong việc tìm kiếm dữ liệu được sắp xếp khoa học trong cơ sở dữ liệu. Điều làm Watson nổi tiếng là nó có thể làm điều tương tự với “mớ dữ liệu phi cấu trúc” như những gì có trong thư điện tử, báo cáo tin tức, các cuốn sách và các trang web.

IBM vọng Watson có thể làm một vài công việc mà các nhà phân tích đang làm như đọc các trang tin tài chính, xem xét và nghiên cứu hàng nghìn kết quả hoạt động và dự báo của các công ty, và đưa ra danh sách những công ty có thể sớm trở thành mục tiêu bị mua lại.

Citigroup đã thuê Watson hỗ trợ việc quyết định sẽ giới thiệu và cung cấp cho khách hàng sản phẩm và dịch vụ nào trong số danh mục sản phẩm mới (như các khoản cho vay và thẻ tín dụng). Tuy Citigroup không nói ra, nhưng công việc đầu tiên của Watson có thể là cố gắng cắt giảm tình trạng gian lận và tìm kiếm những dấu hiệu cho thấy khách hàng đang mất khả năng thanh toán. Nếu như vậy, Watson sẽ tiếp bước các hệ thống máy tính được thiết kế để giải quyết và xử lý “dữ liệu lớn”.

a

Dạo qua một số hãng mới thành lập ở Thung lũng Silicon và các ngân hàng lớn trên toàn thế giới, người ta dễ dàng nhận thấy một loạt ý tưởng mới đang được thử nghiệm trong việc xử lý dữ liệu. Một vài ý tưởng có tiềm năng thay đổi đáng kể hoạt động ngân hàng.

Tại hầu hết các tổ chức tài chính, mục đích của việc sử dụng cơ sở dữ liệu lớn là hạn chế gian lận, tuân thủ các quy định về rửa tiền và các biện pháp chế tài/trừng phạt. Thậm chí những công việc tưởng chừng như rất đơn giản như kiểm tra tên của khách hàng xem có nằm trong danh sách đen hay không cũng trở nên hết sức phức tạp trong thế giới thực, nơi các ngân hàng có thể có hàng nghìn khách hàng có tên giống như tên ghi trong danh sách đen. Mỗi sai lỗi có thể gây khó khăn cho ngân hàng và làm tiêu tan mối quan hệ với khách hàng. Do vậy, các ngân hàng phải chuyển sang sử dụng hệ thống máy tính có thể tích hợp dữ liệu từ nguồn khác nhau, kể cả quốc tịch và địa chỉ của khách hàng, tên của các thành viên trong gia đình, và liệu họ có đi đến hoặc nhận được tiền từ các nước nằm trong danh sách bị cấm vận hay không.

Với những nhiệm vụ phức tạp hơn như nhận diện và xác định một tỷ lệ nhỏ các giao dịch phi pháp/gian lận trong số hàng triệu giao dịch hợp pháp, thì nhu cầu trở nên lớn hơn bao giờ hết. Vấn đề ngày càng lớn hơn vì khi ngày càng nhiều hoạt động ngân hàng được thực hiện trên máy tính và điện thoại di động, hoạt động thanh toán chuyển từ tiền mặt sang thẻ hoặc giao dịch điện tử, cơ hội cho hoạt động gian lận cũng tăng theo.

Mối nguy gian lận đặc biệt nghiêm trọng trong những lĩnh vực như thanh toán bằng thẻ và một số hình thức chuyển tiền cải tiến hơn, vốn ít tốn kém hơn hoặc tiện lợi hơn so với những loại hình dịch vụ đã có. PayPal, thống trị lĩnh vực thanh toán trực tuyến, phải chật vật mới sống sót được trong năm đầu tiên hoạt động sau khi bị tội phạm lừa đảo tấn công, trong khi rất nhiều đối thủ ban đầu của PayPal bị phá sản và buộc phải đóng cửa.

PayPal đã phát minh và đưa vào hoạt động hệ thống máy tính Igor, mang tên của tên trộm và hacker người Nga, kẻ đã mở nhiều tài khoản giả và gửi rất nhiều thư điện tử chế nhạo đội an ninh của hãng. Igor sẽ tìm kiếm các hình thức và mô hình, như số lượng các hoạt động thanh toán đạt gần tới giới hạn cao nhất và nơi nhận, sau đó so sánh các lệnh thanh toán này với tất cả các lệnh thanh toán khác trong hệ thống. Những gì được triển khai tại PayPal sẽ sớm được nhân rộng trong hệ thống ngân hàng và hơn thế nữa.

Quả cầu pha lê ưu việt hơn
Một hãng có lẽ đạt được bước tiến xa nhất trong việc tìm ra những liên kết hữu dụng từ các cơ sở dữ liệu biệt lập là Palantir Technologies, lấy theo tên các quả cầu pha lê pháp thuật trong truyện của J.R.R. Tolkien (tác giả loạt truyện nổi tiếng “Chúa tể của những chiếc nhẫn” – ND).

Palantir do một nhóm từng là nhân viên của PayPal thành lập và được Peter Thiel, một trong những đồng sáng lập PayPal, hậu thuẫn. Điểm đặc biệt của Palantir Technologies là xây dựng các hệ thống có thể tích hợp thông tin từ nhiều nguồn khác nhau và cố gắng tìm ra mối quan hệ của chúng. Một trong những tổ chức đầu tiên triển khai ứng dụng này là các cơ quan tình báo.

Tại Mỹ, Cục tình báo trung ương (CIA) và Cục điều tra liên bang (FBI) sử dụng ứng dụng này để kết nối các hoạt động đơn lẻ vô hại như việc thực hành các bài học bay và việc nhận tiền từ nước ngoài với những kẻ khủng bố tiềm ẩn. Thị trường quan trọng khác của ứng dụng này là hoạt động ngân hàng, nơi các hãng lớn như JPMorgan và Citi sử dụng cho một loạt các hoạt động từ bố trí sắp xếp sản phẩm tài chính đến giảm nguy cơ mất các khoản cho vay.

Đối tác của Palatir là Xoom, hãng chuyên về chuyển tiền kiều hối qua biên giới. Sự hợp tác giữa 2 hãng này được một số nhà đầu tư của Palantir ủng hộ và 2 hãng cũng hoán đổi các chuyên viên cao cấp, nhưng quan trọng hơn, cả 2 đều tin rằng miễn là có đủ dữ liệu, nhiệm vụ dù khó khăn đến mấy cũng có thể giải quyết được. Xoom chấp nhận các khoản thanh toán từ tài khoản ngân hàng hoặc thẻ ghi nợ ở Mỹ, sau đó giao tiền mặt tại các nước như Philippines hoặc Ấn Độ. Hãng này không có nhiều thời gian để nhận ra liệu mình có phải là nạn nhân của hoạt động lừa đảo hay không trước khi tiến hành giao tiền mặt. Do vậy hãng này đã phát triển hệ thống máy tính tinh vi có khả năng phân tích mớ dữ liệu khổng lồ.

Một số dữ liệu kiểm tra khá dễ, nhưng đôi khi mọi việc trở nên khó khăn khi xử lý hàng triệu giao dịch và chuyển hàng tỷ đôla. Hơn nữa, có rất ít thông tin mà tự nó đã là dấu hiệu đủ mạnh để Xoom từ chối hoặc đồng ý thực hiện việc thanh toán. Song khi máy tính xem xét và nghiên cứu tất cả các khoản thanh toán trong hệ thống, nó khá giỏi trong việc tích hợp thông tin lại với nhau để phát hiện giao dịch gian lận.

Hệ thống của 2 hãng trên liên tục được nâng cấp. Mới đây, khi hệ thống này xem xét một loạt hoạt động thanh toán bằng thẻ tín dụng Discover, các thuật toán của hệ thống đã phất cờ đỏ cho dù mọi bút toán đều có vẻ hợp pháp. “Hệ thống này nhận thấy có một mẫu hình hoạt động ở đây khi đáng ra không cần phải có”, John Kunze, giám đốc điều hành Xoom, cho biết. Mẫu hình mà hệ thống tìm ra hóa ra lại là nỗ lực của nhóm tội phạm nhằm mục đích lừa gạt.
êtwt

Các hãng phát hành thẻ tín dụng như Visa và MasterCard cũng sử dụng hệ thống máy tính để chống lại tình trạng gian lận.. Hệ thống của các hãng này, cũng như các hãng phát hành thẻ quy mô lớn như Capital One, xem xét và nghiên cứu một số lượng khổng lồ các giao dịch nhằm tìm ra những mẫu hình hoặc mối liên kết bất thường. Việc này cho phép các hãng phát hành thẻ thanh toán phát triển loại hình phát hiện gian lận dựa vào những quy luật đơn giản (như liệu thẻ tín dụng có được quét ở nhiều nơi khác nhau trong một khoảng thời gian ngắn hay không) thành những mẫu hình phức tạp hơn.

Không một hệ thống nào trên đây có mức giá thấp, nhưng chúng luôn rẻ hơn rất nhiều so với việc trở thành nạn nhân của tình trạng gian lận. Xoom tính toán khoản thất thoát do tình trạng gian lận chiếm 0,35% tổng số tiền được chuyển. Theo Mike Gordon, chuyên viên tại FICO, tỷ lệ thất thoát trung bình do gian lận của các hãng thẻ tín dụng là khoảng 0,1%, và tỷ lệ thành công nhất hiện nay là 0,05%. FICO là công ty phát minh ra việc tính điểm tín dụng và hiện cũng cung cấp phần mềm phát hiện gian lận Các khoản thất thoát và mất mát liên quan đến séc tiền mặt ở Mỹ hiện ở mức khoảng 1%/năm. Đối với các công ty bán hàng trực tuyến, tỷ lệ này cao hơn đáng kể. CyberSource, công ty cung cấp dịch vụ rủi ro và thanh toán điện tử, cho biết, theo công bố của các nhà bán lẻ trực tuyến ở Anh, tỷ lệ mất mát do gian lận của họ trong năm ngoái chiếm đến 1,8% doanh thu.

Chi phí cao trong cuộc chiến chống gian lận đã làm thay đổi cán cân cạnh tranh trong hoạt động ngân hàng, khiến các ngân hàng nhỏ hơn suy yếu do thiếu ngân sách để phát triển các hệ thống cần thiết. Rất nhiều ngân hàng quy mô nhỏ phải đóng cửa hoặc bán lại hoạt động kinh doanh thẻ tín dụng, và thay vào đó là đăng ký cho khách hàng của mình sử dụng thẻ do các công ty lớn phát hành như MBNA hoặc Capital One. Hiện nay, nhiều ngân hàng quy mô nhỏ nghĩ rằng đây là một sai lầm, khiến họ không chỉ mất đi nguồn thu quan trọng mà cả cơ hội thiết lập mối quan hệ sâu sắc và lâu bền hơn với khách hàng vốn có được từ hoạt động bán các sản phẩm tài chính. Có lẽ điều quan trọng nhất là sai lầm này đã khiến ngân hàng nhỏ mất đi nguồn dữ liệu dồi dào về cách thức chi tiêu của khách hàng.

Điều này có thể sớm thay đổi, vì 2 lý do. Thứ nhất, theo Gordon, các hãng phát hành thẻ như Visa và MasterCard ngày càng giỏi hơn trong việc phát hiện ra các giao dịch gian lận, giúp giảm gánh nặng đang đè lên các ngân hàng quy mô nhỏ hơn. Thế mạnh chính của hệ thống này là chúng có thể xem xét và nghiên cứu số lượng giao dịch nhiều hơn bất kỳ một ngân hàng nào, giúp phát hiện ra các dạng gian lận trên phạm vi quốc tế.

Thứ hai, các hệ thống được sử dụng để xử lý dữ liệu ngày mang tính hàng hóa cao hơn và giá của chúng đang có xu hướng giảm. Thomson Reuter cho rằng năm ngoái, các hãng liên doanh đã đầu tư tổng số tiền 2,47 tỷ USD vào các công ty muốn xử lý lượng dữ liệu khổng lồ. Phần lớn số tiền đầu tư này dành cho cơ sở dữ liệu và thiết bị lưu trữ vốn không có gì đặc biệt đối với các ngân hàng, nhưng những công cụ đang được phát triển ở đâu đó đang nhanh chóng được phổ biến. Một thập niên trước, các ngân hàng lớn phải rất tốn kém để có được các hệ thống thiết kế và chế tạo theo ý họ, nhưng hiện nay các ngân hàng nhỏ hơn có thể mua các hệ thống tương tự với mức giá thấp hơn.

Bankinter, một ngân hàng nhỏ của Tây Ban Nha nhưng áp dụng nhiều ứng dụng công nghệ, năm ngoái bắt đầu sử dụng hệ thống phân tích danh mục phức tạp các khoản cho vay trên hệ thống máy tính do Amazon, nhà bán lẻ trực tuyến, vận hành. Điện toán đám mây cho phép Bankinter đạt được công suất xử lý số liệu khổng lồ khi cần thiết. Hai yếu tố này tạo điều kiện dễ dàng hơn cho các ngân hàng nhỏ trên thế giới duy trì hoạt động kinh doanh thẻ tín dụng và dựa vào các nguồn lực mạnh mẽ để củng cố hơn nữa hoạt động ngân hàng.

Nguồn Economist/Khampha


Sự kiện