Big data là gì ? Ứng dụng dữ liệu lớn vào sản xuất?
Big data là gì ? Ứng dụng dữ liệu lớn vào sản xuất?
I. Định nghĩa Big Data
Vào năm 2001, nhà phân tích Doug Laney của hãng META Group (bây giờ chính là công ty nghiên cứu Gartner) đã nói rằng những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều: tăng về lượng (volume), tăng về vận tốc (velocity) và tăng về chủng loại (variety). Giờ đây, Gartner cùng với nhiều công ty và tổ chức khác trong lĩnh vực công nghệ thông tin tiếp tục sử dụng mô hình “3V” này để định nghĩa nên Big Data. Đến năm 2012, Gartner bổ sung thêm rằng Big Data ngoài ba tính chất trên thì còn phải “cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào sự vật/sự việc và tối ưu hóa các quy trình làm việc”.
Chúng ta có thể lấy các thí nghiệm của Máy gia tốc hạt lớn (LHC) ở Châu Âu làm ví dụ cho Big Data. Khi các thí nghiệm này được tiến hành, kết quả sẽ được ghi nhận bởi 150 triệu cảm biến với nhiệm vụ truyền tải dữ liệu khoảng 40 triệu lần mỗi giây. Kết quả là nếu như LHC ghi nhận hết kết quả từ mọi cảm biến thì luồng dữ liệu sẽ trở nên vô cùng lớn, có thể đạt đến 150 triệu petabyte mỗi năm, hoặc 500 exabyte mỗi ngày, cao hơn 200 lần so với tất cả các nguồn dữ liệu khác trên thế giới gộp loại.
Trong mỗi giây như thế lại có đến khoảng 600 triệu vụ va chạm giữa các hạt vật chất diễn ra, nhưng sau khi chọn lọc lại từ khoảng 99,999% các luồng dữ liệu đó, chỉ có tầm 100 vụ va chạm là được các nhà khoa học quan tâm. Điều này có nghĩa là cơ quan chủ quản LHC phải tìm những biện pháp mới để quản lý và xử lí hết mớ dữ liệu khổng lồ này.
Một ví dụ khác, khi Sloan Digital Sky Sruver, một trạm quan sát vũ trụ đặt tại New Mexico, bắt đầu đi vào hoạt động hồi năm 2000, sau một vài tuần nó đã thu thập dữ liệu lớn hơn tổng lượng dữ liệu mà ngành thiên văn học đã từng thu thập trong quá khứ, khoảng 200GB mỗi đêm và hiện tổng dung lượng đã đạt đến hơn 140 terabyte. Đài quan sát LSST để thay thế cho SDSS dự kiến khánh thành trong năm 2016 thì sẽ thu thập lượng dữ liệu tương đương như trên nhưng chỉ trong vòng 5 ngày.
Hoặc như công tác giải mã di truyền của con người chẳng hạn. Trước đây công việc này mất đến 10 năm để xử lí, còn bây giờ người ta chỉ cần một tuần là đã hoàn thành. Còn Trung tâm giả lập khí hậu của NASA thì đang chứa 32 petabyte dữ liệu về quan trắc thời tiết và giả lập trong siêu máy tính của họ. Việc lưu trữ hình ảnh, văn bản và các nội dung đa phương tiện khác trên Wikipedia cũng như ghi nhận hành vi chỉnh sửa của người dùng cũng cấu thành một tập hợp Big Data lớn.
II. Ứng dụng của Big data trong lĩnh vực sản xuất
2.1 Dự đoán bảo trì và tự động hóa
Ứng dụng của tự động hóa trong sản xuất
2.2 Tăng năng suất
Sản xuất theo hướng dữ liệu đang thúc đẩy các hệ thống sản xuất hiệu quả và đáp ứng. Các nhà sản xuất đã có thể tăng năng suất của họ bằng cách hiểu hiệu suất của nhà máy và đo lường dữ liệu hoạt động của các máy riêng lẻ, có thể được thực hiện bằng cách phân tích các tập dữ liệu lớn. Các quy trình lập kế hoạch bán hàng và hoạt động hiệu quả và hiệu quả là rất quan trọng đối với năng suất của bất kỳ công ty sản xuất nào. Các quy trình này có thể tạo dự báo tải của nhà máy trong một khoảng thời gian, có thể giúp một công ty quyết định sản phẩm cần sản xuất tại nhà máy nào. Các loại quyết định tải nhà máy này có thể ảnh hưởng đến hiệu suất hoạt động và tài chính của một công ty. Phân tích dữ liệu lớn và các điểm dữ liệu như tải lịch sử, hồ sơ công nghiệp, dự án đã hoàn thành và mẫu khách hàng có thể giúp tối ưu hóa việc tải nhà máy.
Phân tích hiệu suất đạt được của nhà máy
2.3 Quản lý chuỗi cung ứng
Phân tích dữ liệu lớn và IIoT có thể cung cấp cho nhà sản xuất quyền truy cập tăng lên vào thông tin chuỗi cung ứng trong thời gian thực. Khi các nhà máy được kết nối với các nhà cung cấp, tất cả các bên trong chuỗi cung ứng có thể truy cập thông tin và theo dõi lưu lượng vật liệu, phụ thuộc lẫn nhau và thời gian chu kỳ sản xuất sản phẩm. Loại theo dõi thời gian thực của thông tin chuỗi cung ứng có thể giúp nhanh chóng phát hiện các vấn đề, giảm khoảng không quảng cáo và kết quả là giảm thiểu các yêu cầu về vốn.
Quản lý chỗi cung ứng
2.4 Quản lý chất lượng
Một số lượng đáng kể doanh thu hàng năm của nhà sản xuất có thể bị mất thông qua các khiếm khuyết trong quá trình sản xuất. Nhiều vấn đề chất lượng có thể được phát hiện và sửa chữa ngay khi chúng phát sinh bằng cách phân tích dữ liệu thời gian thực từ các cảm biến trên dây chuyền sản xuất. Việc sử dụng dữ liệu lớn trong sản xuất và quản lý chất lượng có thể giảm chi phí quản lý sản phẩm, lắp ráp và chất lượng cho các nhà sản xuất. Với thành công lớn trong việc cắt giảm chi phí, nhiều công ty quan tâm đến việc tận dụng dữ liệu lớn và phân tích dự báo để tăng lợi tức đầu tư.