Giới thiệu
Đối với Smart Industry Vietnam, dường như hầu hết các nhà sản xuất mà Smart Industry Vietnam nói chuyện đều đang chìm đắm trong dữ liệu, nhưng họ vẫn đang đấu tranh để làm cho nó trở nên hữu ích.
Một cơ sở công nghiệp hiện đại có thể dễ dàng tạo ra một terabyte dữ liệu mỗi ngày. Với làn sóng công nghệ mới dành cho trí tuệ nhân tạo và máy học — trên trang tổng quan thời gian thực và thực tế tăng cường — chúng ta sẽ thấy năng suất tăng đáng kể. Việc bảo trì tài sản và dây chuyền sản xuất không có kế hoạch đã trở thành dĩ vãng.
Tuy nhiên, ngay cả vào năm 2020, điều này không xảy ra. Truy cập vào tất cả dữ liệu này không có nghĩa là nó hữu ích. Dữ liệu công nghiệp rất thô. Dữ liệu phải được làm cho “phù hợp với mục đích” để chiết xuất giá trị thực của nó. Ngoài ra, các công cụ được sử dụng để làm cho dữ liệu phù hợp với mục đích phải hoạt động ở quy mô của một cơ sở công nghiệp.
Với những thực tế này, đây là hướng dẫn thực tế, từng bước cho các nhà sản xuất và các công ty công nghiệp khác để làm cho dữ liệu công nghiệp của họ phù hợp với mục đích.
Bước 1: Bắt đầu với business case cụ thể
Các dự án Công nghệ Thông tin (CNTT) và Công nghệ Hoạt động (OT) nên bắt đầu với các case studies và mục tiêu kinh doanh rõ ràng. Đối với nhiều công ty sản xuất, các dự án có thể tập trung vào bảo trì máy móc, cải tiến quy trình hoặc phân tích sản phẩm để cải thiện chất lượng hoặc truy xuất nguồn gốc.
Là một phần của Business case , các bên liên quan của công ty nên xác định phạm vi dự án và dữ liệu áp dụng sẽ được yêu cầu. Đảm bảo rằng các bên liên quan đa chức năng phù hợp có mặt trong phòng ngay từ đầu dự án và tất cả các bên liên quan đồng ý ưu tiên dự án và có thể đạt được sự đồng thuận về các mục tiêu của dự án.
Bước 2: Xác định các hệ thống mục tiêu
Với các case studies và mục tiêu kinh doanh đã được xác định, bước tiếp theo yêu cầu xác định các ứng dụng mục tiêu sẽ được sử dụng để thực hiện các mục tiêu này. Đặc trưng cho ứng dụng đích bằng cách hỏi những câu hỏi sau:
- Ứng dụng đích này nằm ở đâu: tại Edge, tại chỗ, trong trung tâm dữ liệu, trong Đám mây, v.v.?
- Làm thế nào ứng dụng này có thể nhận dữ liệu: MQTT, OPC UA, REST, tải cơ sở dữ liệu, v.v.?
- Thông tin nào là cần thiết cho ứng dụng này?
- Dữ liệu nên được cập nhật thường xuyên như thế nào và nguyên nhân dẫn đến việc cập nhật?
- Ghi lại các câu trả lời của bạn và sau đó chuyển sang bước tiếp theo, trong đó bạn sẽ xác định các nguồn dữ liệu của mình cho dự án.
Bước 3: Xác định các nguồn dữ liệu cần có
Dữ liệu công nghiệp là một thành phần quan trọng để giải quyết các case studies công nghiệp và kinh doanh. Tuy nhiên, có một số thách thức lớn khi truy cập dữ liệu này và chuyển đổi nó thành thông tin hữu ích.
- Khối lượng dữ liệu. Nhà máy công nghiệp hiện đại điển hình có hàng trăm đến hàng nghìn chiếc máy móc thiết bị liên tục tạo ra dữ liệu. Dữ liệu này thường được tổng hợp trong Bộ điều khiển logic lập trình (PLC), bộ điều khiển máy hoặc Hệ thống điều khiển phân tán (DCS) trong lớp tự động hóa, mặc dù các phương pháp tiếp cận mới hơn cũng có thể bao gồm cảm biến thông minh và bộ truyền động thông minh cung cấp dữ liệu trực tiếp vào lớp phần mềm.
- Sự Tương quan. Dữ liệu tự động hóa chủ yếu được đưa vào để quản lý, tối ưu hóa và kiểm soát quá trình. Dữ liệu có tương quan với việc kiểm soát quá trình và không tương quan với mục đích bảo trì tài sản hoặc chất lượng sản phẩm hoặc truy xuất nguồn gốc.
- Bối cảnh. Cấu trúc dữ liệu trên PLC và bộ điều khiển máy có thông tin mô tả tối thiểu — nếu có. Trong nhiều trường hợp, các điểm dữ liệu được tham chiếu với các lược đồ đặt tên điểm dữ liệu khó hiểu hoặc các tham chiếu đến các vị trí bộ nhớ.
- Tiêu chuẩn hóa. Quá trình tự động hóa trong nhà máy phát triển theo thời gian với máy móc và thiết bị có nguồn gốc từ nhiều nhà cung cấp phần cứng. Phần cứng này có thể được lập trình và xác định bởi nhà cung cấp. Điều này đã dẫn đến dữ liệu duy nhất các mô hình được tạo ra cho từng bộ phận của máy móc và thiếu các tiêu chuẩn trong toàn bộ nhà máy và công ty, trừ những nhà sản xuất lớn nhất và tinh vi nhất.
Bạn có thể hiểu rõ hơn những thách thức cụ thể mà bạn sẽ cần phải vượt qua cho dự án của mình bằng cách ghi lại các nguồn dữ liệu của bạn. Đặc trưng hóa dữ liệu có sẵn để đáp ứng nhu cầu của hệ thống mục tiêu bằng cách hỏi những câu hỏi sau:
- Dữ liệu nào có sẵn?
- Nó nằm ở đâu: PLC, bộ điều khiển máy, cơ sở dữ liệu, v.v.?
- Đó là dữ liệu thời gian thực hay dữ liệu thông tin (Meta Data)?
- Dữ liệu hiện có ở định dạng phù hợp hay sẽ cần phải được làm sạch ?
Bước 4: Lựa chọn kiến trúc tích hợp
Kiến trúc tích hợp chia thành hai nhóm: kết nối Giao diện lập trình ứng dụng (API) trực tiếp (ứng dụng với ứng dụng) hoặc trung tâm tích hợp (giải pháp DataOps).
- Kết nối API trực tiếp hoạt động tốt nếu bạn chỉ có hai ứng dụng cần được tích hợp. Dữ liệu không cần phải được quản lý hoặc chuẩn bị cho ứng dụng nhận và hệ thống nguồn rất tĩnh. Điều này thường thành công trong môi trường mà công ty sản xuất có một giải pháp SCADA hoặc MES duy nhất chứa tất cả thông tin và không cần ứng dụng bổ sung để truy cập vào dữ liệu.
- Kết nối API trực tiếp không hoạt động tốt khi dữ liệu công nghiệp cần thiết trong nhiều ứng dụng như SCADA, MES, ERP, Nền tảng IIoT, Analytics, QMS, AMS, hệ thống giám sát mối đe dọa an ninh mạng, cơ sở dữ liệu tùy chỉnh khác nhau, trang tổng quan hoặc ứng dụng bảng tính (excel).
- Các kết nối API trực tiếp cũng không hoạt động tốt khi có nhiều biến đổi dữ liệu phải xảy ra để chuẩn bị dữ liệu cho hệ thống tiêu thụ. Các phép biến đổi này có thể dễ dàng thực hiện bằng Python, C # hoặc bất kỳ ngôn ngữ lập trình nào khác nhưng sau đó chúng “vô hình” và khó duy trì.
- Cuối cùng, các kết nối API trực tiếp không hoạt động tốt khi cấu trúc dữ liệu thường xuyên thay đổi. Điều này xảy ra khi thiết bị của nhà máy hoặc các chương trình chạy trên thiết bị này thường xuyên bị thay đổi.
Ví dụ, một nhà sản xuất có thể có các lô sản xuất chạy ngắn yêu cầu tải các chương trình mới trên PLC; các sản phẩm được sản xuất có thể phát triển và yêu cầu thay đổi đối với tự động hóa; tự động hóa có thể được thay đổi để nâng cao hiệu quả; hoặc thiết bị có thể được thay thế do tuổi tác và hiệu suất.
Sử dụng phương pháp API sẽ tích hợp trong chương trình phần mềm. Các bên liên quan thậm chí có thể không biết về các hệ thống tích hợp cho đến khi thiết bị được thay thế hoặc thay đổi đã được thực hiện, dẫn đến dữ liệu xấu hoặc bị thiếu không được phát hiện trong nhiều tuần hoặc thậm chí nhiều tháng.
Một thay thế cho các kết nối API trực tiếp là một trung tâm tích hợp DataOps. DataOps là một cách tiếp cận mới để tích hợp và bảo mật dữ liệu nhằm mục đích cải thiện chất lượng dữ liệu và giảm thời gian chuẩn bị dữ liệu để sử dụng trong toàn doanh nghiệp.
Trung tâm tích hợp hoạt động như một lớp trừu tượng vẫn sử dụng API để kết nối với các ứng dụng khác nhưng cung cấp công cụ quản lý, tài liệu và quản trị để kết nối các nguồn dữ liệu với tất cả các ứng dụng được yêu cầu.Một trung tâm tích hợp được xây dựng có mục đích để di chuyển khối lượng lớn dữ liệu ở tốc độ cao với các phép biến đổi được thực hiện trong thời gian thực trong khi dữ liệu đang chuyển động. Vì bản thân trung tâm tích hợp DataOps là một ứng dụng, nó cung cấp một nền tảng để xác định tác động khi thiết bị hoặc ứng dụng được thay đổi, thực hiện chuyển đổi dữ liệu và cung cấp khả năng hiển thị cho những chuyển đổi này.
Bước 5: Thiết lập kết nối an toàn
Bây giờ kế hoạch dự án đã sẵn sàng, hãy bắt đầu tích hợp hệ thống bằng cách thiết lập các kết nối an toàn với hệ thống nguồn và đích. Hiểu các giao thức bạn sẽ làm việc và các rủi ro bảo mật và lợi ích mà chúng cung cấp.
Nhiều hệ thống hỗ trợ các giao thức mở để xác định kết nối và giao tiếp. Các giao thức mở điển hình bao gồm OPC UA, MQTT, REST, ODBC và AMQP — trong số những giao thức khác. Cũng có nhiều giao thức đóng và API do nhà cung cấp xác định mà nhà cung cấp ứng dụng xuất bản tài liệu giao thức API.
Hãy tự đặt câu hỏi :
- Giao thức có hỗ trợ các kết nối an toàn không và các kết nối này được tạo ra như thế nào ?
- Một số giao thức và hệ thống hỗ trợ các chứng chỉ được ứng dụng trao đổi.
- Các giao thức khác hỗ trợ tên người dùng và mật khẩu hoặc mã thông báo được nhập thủ công vào hệ thống kết nối hoặc thông qua xác thực của bên thứ ba.
- Ngoài bảo mật cho người dùng, một số giao thức hỗ trợ các gói dữ liệu được mã hóa, vì vậy nếu có một cuộc tấn công “kẻ ở giữa”, họ không thể đọc được dữ liệu đang được chuyển qua.
- Cuối cùng, một số giao thức hỗ trợ xác thực dữ liệu. Sau đó, ngay cả khi dữ liệu được bên thứ ba xem, nó không thể thay đổi được.
Bảo mật không chỉ về tên người dùng, mật khẩu, mã hóa và xác thực mà còn về kiến trúc tích hợp. Các giao thức như MQTT chỉ yêu cầu mở ra bên ngoài được bảo vệ bởi tường lửa, điều mà các nhóm bảo mật thích hơn vì tin tặc không thể khai thác giao thức để xâm nhập vào mạng nội bộ.
Bước 6: Lập mô hình dữ liệu
Việc triển khai và áp dụng phân tích hoặc IIoT trong phạm vi toàn công ty thường bị trì hoãn do sự thay đổi của dữ liệu từ nhà máy. Từ máy này sang máy khác, mỗi thiết bị công nghiệp có thể có mô hình dữ liệu riêng. Trước đây, các nhà cung cấp, nhà tích hợp hệ thống và kỹ sư kiểm soát nội bộ đã không tập trung vào việc tạo ra các tiêu chuẩn dữ liệu. Họ đã tinh chỉnh hệ thống và thay đổi mô hình dữ liệu theo thời gian để phù hợp với nhu cầu của họ. Điều này hiệu quả với các dự án một lần, nhưng các dự án IIoT ngày nay yêu cầu nhiều khả năng mở rộng hơn.
Bước đầu tiên trong mô hình hóa dữ liệu là xác định các mô hình tiêu chuẩn cần thiết trong hệ thống mục tiêu để đáp ứng các mục tiêu kinh doanh của dự án. Cốt lõi của mô hình là dữ liệu thời gian thực từ máy móc và thiết bị tự động hóa. Hầu hết các điểm dữ liệu thời gian thực sẽ ánh xạ đến các điểm dữ liệu nguồn đơn.
Tuy nhiên, khi một điểm dữ liệu cụ thể không tồn tại, các điểm dữ liệu có thể được làm sạch bằng cách thực hiện các biểu thức hoặc logic sử dụng các điểm dữ liệu khác. Dữ liệu cũng có thể được phân tích cú pháp hoặc trích xuất từ các trường dữ liệu khác hoặc có thể thêm các cảm biến bổ sung để cung cấp dữ liệu cần thiết.
Các mô hình này cũng nên bao gồm các thuộc tính cho bất kỳ dữ liệu mô tả nào, thường không được lưu trữ trong các thiết bị công nghiệp nhưng rất hữu ích khi đối sánh dữ liệu và đánh giá dữ liệu trong hệ thống đích. Dữ liệu mô tả có thể là vị trí của máy, số lượng tài sản của máy, đơn vị đo lường, phạm vi hoạt động hoặc thông tin ngữ cảnh khác. Khi các mô hình tiêu chuẩn được tạo, chúng phải được khởi tạo cho từng nội dung, quy trình và / hoặc sản phẩm. Đây thường là một tác vụ thủ công nhưng có thể được tăng tốc nếu ánh xạ đã tồn tại trong Excel hoặc các định dạng khác, nếu có sự nhất quán từ thiết bị này sang thiết bị khác có thể được sao chép hoặc nếu một thuật toán học tập có thể được áp dụng.
Bước 7: Luồng dữ liệu
Khi mô hình hóa hoàn tất, các luồng dữ liệu sẽ được kiểm soát theo từng mô hình. Điều này thường được thực hiện bằng cách xác định mô hình được di chuyển, hệ thống mục tiêu và tần suất hoặc kích hoạt cho chuyển động. Theo thời gian, các luồng dữ liệu cũng sẽ yêu cầu giám sát và quản lý.
Kết luận
Các nhà máy và môi trường công nghiệp khác thay đổi theo thời gian. Thiết bị được thay thế, chương trình được thay đổi, sản phẩm được thiết kế lại, hệ thống được nâng cấp và người dùng mới cần thông tin mới để thực hiện công việc của họ. Trong bối cảnh thay đổi này, OT và các chuyên gia CNTT sẽ hợp tác trong các dự án mới nhằm nâng cao năng suất, hiệu quả và an toàn của sàn nhà máy.
Bạn sẽ cần dữ liệu công nghiệp phù hợp với mục đích để sử dụng nó. Và bạn sẽ cần các công cụ trợ giúp cần thiết để hoàn thành nhiệm vụ này trên quy mô lớn — như một trung tâm tích hợp DataOps. Bằng cách sử dụng trung tâm tích hợp, quản trị viên có thể đánh giá các thay đổi của thiết bị và hệ thống, đồng thời xác định các tích hợp phải được sửa đổi hoặc thay thế. Họ có thể thực hiện các thay đổi đối với mô hình dữ liệu và kích hoạt các luồng mới trong thời gian thực.
Làm cho dữ liệu công nghiệp phù hợp với mục đích sẽ rất quan trọng đối với các nhà sản xuất đang tìm cách mở rộng các dự án IIoT của họ và quản lý dữ liệu hiệu quả. Smart Industry Vietnam hy vọng bài viết này đóng vai trò như một hướng dẫn thực tế để bạn có thể bắt đầu dự án tiếp theo của bạn.