BIG DATA LÀ GÌ? – MỘT KHÁI NIỆM CỰC KỲ ĐƠN GIẢN

Như đã giới thiệu ở bài viết trước “Big Data – thành quả của cách mạng công nghệ 4.0” về nguồn gốc của Big Data, ở bài viết này chúng ta sẽ bàn luận sâu hơn về khái niệm Big Data.

BIG DATA LÀ GÌ? – MỘT KHÁI NIỆM CỰC KỲ ĐƠN GIẢN

Khái niệm về Big Data

Big Data, thuật ngữ đơn giản dễ dịch sang bất kỳ thứ tiếng nào không chỉ riêng mỗi tiếng Việt, nó chỉ gồm 2 từ “Big” và “Data”.

Thứ nhất về chữ “Data”, chúng tôi đã đề cập ở bài viết trước “Big Data – thành quả của cách mạng công nghệ 4.0”, những loại data có trong thời đại 4.0, bao gồm: các dữ liệu thuộc nhiều định dạng khác nhau như hình ảnh, video, âm nhạc,..trên Internet; các dữ liệu thu thập từ các hệ thống cảm biến có kết nối với hệ thống máy chủ; dữ liệu của khách hàng để lại ở các ứng dụng thông minh, các thiết bị có kết nối mạng; dữ liệu của người dùng để lại trên các platform social media – mạng xã hội như Facebook, Instagram,..; v.v…

Do xuất phát từ nhiều nguồn khác nhau nên, “Data” trong “Big Data” sẽ có những cấu trúc sau:

  • Structured data: dữ liệu có cấu trúc như là các số liệu, các code có trong ngôn ngữ lập trình,.. có thể được tìm thấy trong Database (cơ sở dữ liệu) vì nó được cấu trúc để phục vụ cho nhiều mục đích khác nhau. Ví dụ, được sử dụng để truy vấn trong SQL (ngôn ngữ truy vấn có cấu trúc)
  • Unstructured data: dữ liệu là chữ viết, hình ảnh, video, âm thanh,..không có 1 cấu trúc nhất định, không có mối quan hệ cơ sở dữ liệu với nhau và không thể sử dụng cho việc truy vấn ví dụ trong SQL.
  • Ngoài ra còn có một số dữ liệu bán cấu trúc như XML (eXtensible Markup Language – ngôn ngữ miêu tả nhiều loại dữ liệu khác nhau), hay Json (JavaScript Object Notation).

Thứ 2 về chữ “Big”. Vì các dữ liệu được cập nhật thông qua các thiết bị kết nối mạng từng giờ từng phút, từng giây và đến từ nhiều nguồn khác nhau nên khối lượng dữ liệu là rất lớn, hiện nay Big Data được đo lường dưới đơn vị từ Terabytes (TB), đến Petabytes (PB) cho đến Exabytes (EB).

Theo Diễn đàn Kinh tế Thế giới, trong 1 phút trên Internet có

+ 973,000 đăng nhập vô Facebook

+ 3.7 triệu tìm kiếm trên Google

+ 187 triệu email được gửi.

+ 375,000 app trên App Store và Google Play được tải về

+ 4,3 triệu người xem Youtube

+ $862,823 người dùng trả cho việc mua sắm trực tuyến

Nhiêu đó cũng đủ thấy trong 1 phút thôi dữ liệu có thể thu thập được là rất lớn.

Vậy tóm lại “Big Data” là dữ liệu có khối lượng cực kỳ lớn, đa dạng và phức tạp. Để thu thập và khai thác Big Data, chúng ta cần một hệ thống quản lý, xử lý tiên tiến so với các phần mềm xử lý dữ liệu truyền thống thông thường.

Theo chuyên gia phân tích dữ liệu Doug Laney thuộc công ty Gartner – công ty nghiên cứu và tư vấn công nghệ thông tin hàng đầu thế giới, đã định nghĩa “Big Data” dưới 3 góc độ.

  • Volume: khối lượng của dữ liệu cực kỳ lớn từ Petabytes đến Exabytes.
  • Velocity: tốc độ xử lý dữ liệu. Đây là thước đo cực kỳ quan trọng, do nguồn dữ liệu trong Big Data cực kỳ đa dạng và phức tạp nhưng luôn phải được xử lý trong thời gian ngắn. Ngày nay, các hệ thống RFID (nhận dạng qua sóng vô tuyến) hay các thiết bị cảm biến có thể xử lý dữ liệu Big Data trong thời gian hợp lý.
  • Variety: sự đa dạng của dữ liệu từ cấu trúc, bán cấu trúc cho đến không mang cấu trúc nào như đã nói ở trên.

Theo SAS – công ty đi đầu trong lĩnh vực phân tích dữ liệu và tư vấn của Mỹ – thêm vào 2 góc độ khác của khái niệm Big Data:

  • Variability: tính thay đổi của dữ liệu qua từng ngày. Ví dụ, dữ liệu Big Data đến từ social media – mạng xã hội, truyền thông – nếu xuất hiện các “trend”, các vấn đề “nóng hổi”, nó sẽ tác động đến dữ liệu Big Data.
  • Complexity: tính phức tạp. Vì Big Data đến từ nhiều nguồn khác nhau, dưới nhiều định dạng khác nhau nên khi lưu trữ, quản lý, xử lý, truyền tải qua các hệ thống sẽ gặp khó khăn.

Theo Oracle – công ty đi đầu trong việc cung cấp các phần mềm công nghệ cho các doanh nghiệp – cũng nhìn Big Data dưới 2 góc độ khác:

  • Value: giá trị của Big Data. Đây là lý do mà các công ty, tổ chức ngày nay đầu tư vào công nghệ để khai thác Big Data, phân tích kết quả có được để được ra những chiến lược cải thiện hoạt động. Big Data không có giá trị nếu được thu thập, xử lý, phân tích đúng cách.
  • Veracity: Tính xác thực. Big Data được thu thập từ nhiều nguồn khác nhau nên tính xác thực của nó cũng là dấu chấm hỏi lớn cho các tổ chức.

Ứng dụng Big Data

Big Data được sử dụng trong rất nhiều lĩnh vực với mục đích khác nhau.

+ Kinh doanh, Bán lẻ: hỗ trợ doanh nghiệp nắm bắt hành vi người tiêu dùng, đưa ra các chiến lược sản phẩm, chiến lược R&D,…

+ Ngân hàng và bảo hiểm: phát hiện, giảm thiểu rủi ro tín dụng, nắm bắt hành vi khách hàng,..

+ Telco: cải thiện trải nghiệm của khách hàng, dự báo xu hướng mới, đưa ra các ứng dụng mới,…

Ngoài ra, Big Data còn được sử dụng trong các doanh nghiệp có quy trình tự động hóa sản xuất (ví dụ thu thập dữ liệu để phân tích, phát hiện sai sót trong sản xuất,..); trong lĩnh vực năng lượng, tự động hóa và lĩnh vực y tế (dữ liệu bệnh nhân,..), nghiên cứu, tổ chức chính phủ,..

 

Có thể bạn chưa biết:

Tư vấn và xây dựng hệ thống big data

  • Khảo sát, đánh giá cơ sở hạ tầng hệ thống hiện có để xem tính khả thi cho việc ứng dụng lưu trữ và khai thác Bigdata.
  • Tư vấn và xây dựng hệ thống phục vụ Bigdata theo tình hình hoạt động sản xuất/kinh doanh của doanh nghiệp.
  • Hệ thống lưu trữ dữ liệu (Data warehouse).
  • Hệ thống xử lý dữ liệu (ETL system).
  • Hệ thống phân tích dữ liệu (Analysis system).
  • Hệ thống phục vụ báo cáo (Report & BI system).
  • Vận hành, bảo trì hệ thống.

Phân tích dữ liệu big data

  • Xây dựng thuật toán khai thác dữ liệu dựa thực tế kinh doanh của công ty
  • Ứng dụng các mô hình định lượng thông minh để phân tích hành vi tiêu dùng
  • Dự báo nhu cầu tiêu dùng và chuẩn đoán những nguy cơ rời dịch vụ
  • Phát triển các giải pháp kinh doanh tăng doanh thu và kiểm soát rủi ro trong kinh doanh

Tư vấn chiến lược

  • Xây dựng chiến lược kinh doanh thông minh dựa trên kết quả phân tích thông minh từ nguồn big data
  • Phân khúc thị trường và định vị những phân khúc ưu tiên khai thác
  • Đổi mới sản phẩm và dịch vụ để giữ chân khách hàng và giảm thiểu rủi ro rời dịch vụ
  • Xây dựng các chương trình khuyến mãi theo khúc thị trường hạn chế tối thiểu spam đến khách hàng

Training lĩnh vực dữ liệu

  • Kiến thức về cơ bản trong khai thác big data
  • Kiến thức nâng cao hướng đến khai thác big data
  • Xây dựng chiến lược marketing dựa trên kết quả khai thác big data
  • Chuyển giao công nghệ mô hình khai thác big data

DVMS chuyên:
- Tư vấn, xây dựng, chuyển giao công nghệ Blockchain, mạng xã hội,...
- Tư vấn ứng dụng cho smartphone và máy tính bảng, tư vấn ứng dụng vận tải thông minh, thực tế ảo, game mobile,...
- Tư vấn các hệ thống theo mô hình kinh tế chia sẻ như Uber, Grab, ứng dụng giúp việc,...
- Xây dựng các giải pháp quản lý vận tải, quản lý xe công vụ, quản lý xe doanh nghiệp, phần mềm và ứng dụng logistics, kho vận, vé xe điện tử,...
- Tư vấn và xây dựng mạng xã hội, tư vấn giải pháp CNTT cho doanh nghiệp, startup,...

Vì sao chọn DVMS?
- DVMS nắm vững nhiều công nghệ phần mềm, mạng và viễn thông. Như Payment gateway, SMS gateway, GIS, VOIP, iOS, Android, Blackberry, Windows Phone, cloud computing,…
- DVMS có kinh nghiệm triển khai các hệ thống trên các nền tảng điện toán đám mây nổi tiếng như Google, Amazon, Microsoft,…
- DVMS có kinh nghiệm thực tế tư vấn, xây dựng, triển khai, chuyển giao, gia công các giải pháp phần mềm cho khách hàng Việt Nam, USA, Singapore, Germany, France, các tập đoàn của nước ngoài tại Việt Nam,…

Quý khách xem Hồ sơ năng lực của DVMS tại đây >>

Quý khách gửi yêu cầu tư vấn và báo giá tại đây >>

Copyright© Bigdata Solutions. All Rights Reserved. Tư vấn, xây dựng, chuyển giao Bigdata

Tìm kiếm