ISO/IEC 42119‑8 biến thử nghiệm AI thành tiêu chuẩn trọng tâm

“Những bước tiến vượt bậc trong công nghệ AI đang tiếp tục thúc đẩy quá trình chuyển đổi số, mở ra nhiều ứng dụng mới cùng các lợi ích mà chỉ vài năm trước đây còn là điều không tưởng,” ông Wael William Diab, Chủ tịch SC 42 nhận định.

Ông nhấn mạnh rằng SC 42 nắm giữ vị thế đặc biệt trong việc giải quyết các lĩnh vực mới nổi bằng việc hợp tác cùng nhiều ủy ban đa dạng thuộc IEC và ISO—những tổ chức bao phủ rộng khắp các lĩnh vực này. “Hơn thế nữa,” ông nói, “cách tiếp cận toàn diện của chúng tôi, dựa trên việc xem xét trọn vẹn hệ sinh thái AI, giúp chúng tôi linh hoạt ứng phó với những yêu cầu mới và mở rộng chương trình làm việc theo hướng phù hợp.” Mặc dù đại dịch diễn ra, sự tham gia sôi nổi của các thành viên cùng đa dạng bên liên quan vẫn được duy trì mạnh mẽ.

Đặc biệt, Singapore đang định vị mình như trung tâm tiêu chuẩn thử nghiệm AI toàn cầu, thúc đẩy việc phát triển một tiêu chuẩn quốc tế mới nhằm giúp các hệ thống AI tạo sinh trở nên đáng tin cậy, đồng nhất và an toàn hơn.

Tại kỳ họp toàn thể lần thứ 17 của ISO/IEC JTC 1/SC 42 tổ chức ở Singapore, nước này đã giới thiệu ISO/IEC 42119-8—tiêu chuẩn quốc tế đầu tiên chuyên biệt cho các phương pháp thử nghiệm hệ thống AI tổng hợp, tập trung vào các điểm chuẩn và nhóm đỏ.

Bản dự thảo tiêu chuẩn này nhằm xây dựng một khung thử nghiệm có cấu trúc, khả năng tái lập để các kết quả AI có thể được đánh giá đồng nhất giữa các tổ chức, từ đó nâng cao tính minh bạch, độ tin cậy và khả năng áp dụng rộng rãi.

Tại sao tiêu chuẩn thử nghiệm toàn cầu lại quan trọng

Khi AI dần dịch chuyển từ các sản phẩm độc lập sang quy trình tích hợp sâu trong các hệ thống và tác nhân thông minh, nhu cầu về các tiêu chuẩn công nhận toàn cầu cho độ tin cậy, an toàn và khả năng tương tác xuyên biên giới càng trở nên cấp thiết. “Tiêu chuẩn chính là hạ tầng ngầm định hình khả năng tương tác, sự nhất quán và độ tin cậy trên quy mô lớn,” ông Ng Cher Pong, Giám đốc điều hành Cơ quan Phát triển Truyền thông Infocomm (IMDA), chia sẻ trong bài phát biểu khai mạc tại hội nghị SC 42 toàn thể.

Ông so sánh tương tự ngành viễn thông, nơi các tiêu chuẩn như LTE và 5G của 3GPP đảm bảo thiết bị lẫn mạng vận hành liền mạch, và lập luận rằng AI cũng cần phải xây dựng nền tảng chung, ổn định như vậy.

Các tiêu chuẩn như ISO/IEC 42001 về Hệ thống quản lý AI đã chứng minh sự chuyển đổi các nguyên tắc AI rộng thành các quy trình quản trị cụ thể. Ông dẫn chứng Tập đoàn sân bay Changi (CAG) ở Singapore là một trong những đơn vị đầu tiên áp dụng chứng nhận 42001 nhằm thể chế hóa trách nhiệm giải trình, quản lý rủi ro và giám sát việc ứng dụng AI trong toàn tổ chức minh bạch hơn.

“Đây là minh chứng cho việc các chuẩn mực AI giúp biến các nguyên tắc thành các biện pháp kiểm soát cụ thể,” ông nói, đồng thời nhấn mạnh vai trò của chứng nhận trong việc thúc đẩy kỷ luật nội bộ và tăng niềm tin từ các bên liên quan.

Nỗ lực đảm bảo và thử nghiệm AI của Singapore

Tiêu chuẩn ISO/IEC 42119-8 được xây dựng dựa trên nền tảng từ các công trình thử nghiệm trong nước của IMDA, điển hình như Bộ công cụ xác minh AI và Bộ công cụ thử nghiệm ứng dụng dựa trên mô hình ngôn ngữ lớn (LLM) về an toàn và độ tin cậy, cùng với Sandbox Đảm bảo AI Toàn cầu.

Sandbox do AI Verify Foundation vận hành đã kiểm thử các hệ thống AI chống lại các vấn đề thực tế, tạo ra những phát hiện mà IMDA gọi là “tài liệu chuẩn hóa tiền đề” có thể làm nền tảng hỗ trợ các sáng kiến quốc tế rộng lớn hơn.

Ng ông nhấn mạnh rằng các tiêu chuẩn cần bám sát tốc độ phát triển nhanh chóng của AI, vốn đã dịch chuyển từ AI tổng quát sang đa phương thức và hiện là AI tác nhân chỉ trong chưa đầy ba năm. “Việc xây dựng tiêu chuẩn không thể chậm chạp,” ông cảnh báo, “vì nếu chậm, tiêu chuẩn sẽ nhanh chóng trở nên lỗi thời.”

Phát biểu này phản ánh mối lo ngại chung trong ngành là các khuôn khổ quản trị AI phải tiến hóa nhanh không kém công nghệ, đặc biệt ở mảng thử nghiệm, nơi các phương pháp đánh giá hiệu năng và nhóm đỏ cần vượt trước các hành vi lạm dụng và sai phạm.

Tính toàn diện, thử nghiệm và thực hành thực tế

Điểm nhấn thứ hai trong bài phát biểu đặt trọng tâm vào tính toàn diện: các tiêu chuẩn cần đại diện cho nhiều lĩnh vực, văn hóa và ngôn ngữ khác nhau. Đông Nam Á—một trong những khu vực đa dạng nhất thế giới—cần có vai trò chủ đạo trong việc hình thành tiêu chuẩn AI.

Để thực hiện điều đó, IMDA và Enterprise Singapore đã phối hợp tổ chức hội thảo về tiêu chuẩn AI cơ bản cùng Viện Tiêu chuẩn Quốc gia Mỹ (ANSI), nhằm hỗ trợ các quốc gia ASEAN xây dựng năng lực và phát triển kế hoạch hành động quốc gia phù hợp với tiêu chuẩn AI.

Ng cũng khẳng định cần gia tăng kết nối giữa tiêu chuẩn và thử nghiệm trong thực tế. “Thử nghiệm giúp người dùng đảm bảo sản phẩm hoặc hệ thống đáp ứng các tiêu chuẩn, đồng thời nếu làm đúng cách sẽ thúc đẩy việc áp dụng rộng rãi hơn,” ông nói, đồng thời chỉ ra ISO/IEC 42119-8 về thử nghiệm AI tổng hợp và 42119-7 về nhóm đỏ là nền tảng cho các đánh giá có độ tin cậy và khả lập lại cao.

Không gian thử nghiệm như Sandbox Đảm bảo AI Toàn cầu và Sàn giao dịch Đảm bảo AI, nơi quy tụ các nhà thiết lập tiêu chuẩn toàn cầu, nhà hoạch định chính sách và lãnh đạo ngành, đang góp phần chuyển hóa các tiêu chuẩn từ lý thuyết thành thực tiễn.

Ông kết luận: “Giá trị thực sự của tiêu chuẩn nằm ở cách chúng được vận dụng trong các ứng dụng cùng trường hợp sử dụng thực tế, góp phần giải quyết vấn đề và tăng cường sự tin tưởng.”

Vai trò dẫn đầu của Singapore trong điều phối SC 42 và đề xuất ISO/IEC 42119-8 cho thấy một chiến lược rõ ràng trong việc nâng cao quản trị AI từ lớp thử nghiệm và đảm bảo, mang đến cho các COO và nhà triển khai AI một khuôn khổ minh bạch, dự đoán được nhằm hỗ trợ phát triển AI an toàn và có thể mở rộng.

Nguồn : futureiot.tech

Dự báo tăng trưởng mạnh đối với lô hàng cobot

STEMMER IMAGING khai trương cửa hàng kỹ thuật số mới

Điều khiển tối ưu sử dụng các ô đo lường robot

FANUC ra mắt robot hàn cộng tác trọng lượng 11kg

Mở rộng khả năng của cobot để nâng tải trọng cao hơn

ISO/IEC 42119‑8 biến thử nghiệm AI thành tiêu chuẩn trọng tâm

Thỏa thuận triển khai nền tảng y tế GenAI tự động học

Chuỗi cung ứng DHL nâng cao năng lực Logistics cho trung tâm dữ liệu khu vực APAC

Các hãng hàng không đang khám phá ứng dụng tiếp theo cho Agentic

Các hội đồng châu Á đang đầu tư vào AI nhưng kiểm toán lợi tức đầu tư (ROI) vẫn còn chậm tiến độ

Hệ thống thực thi sản xuất (MES) là gì ? Vì sao doanh nghiệp sản xuất cần hệ thống MES ?

SCADA là gì ? Khi nào cần 1 hệ thống SCADA ?

Hệ thống điều độ sản xuất APS là gì ? Ứng dụng của hệ thống APS là gì ?

Số lượng đặt hàng kinh tế (EOQ) và Công thức tính EOQ

20 công cụ sản xuất tinh gọn

Quản lý vòng đời sản phẩm (PLM) là gì ? Vai trò của PLM đối với doanh nghiệp là gì ?

Những vấn đề cơ bản về Quản lý khu vực sản xuất (Shop floor management)

7 ví dụ về trí tuệ nhân tạo trong các ngành công nghiệp khác nhau

Thỏa thuận triển khai nền tảng y tế GenAI tự động học

Chuỗi cung ứng DHL nâng cao năng lực Logistics cho trung tâm dữ liệu khu vực APAC

Các hãng hàng không đang khám phá ứng dụng tiếp theo cho Agentic

Các hội đồng châu Á đang đầu tư vào AI nhưng kiểm toán lợi tức đầu tư (ROI) vẫn còn chậm tiến độ

Garuda Indonesia đẩy mạnh hiện đại hóa lõi kỹ thuật số cùng RISE với SAP

Tại sao thí điểm AI ở Hồng Kông đang tái định hình quy trình triển khai sản xuất (ngân hàng)

PodChats cho FutureCOO: Xây dựng nền tảng cho hoạt động hợp nhất dựa trên dữ liệu

Vertiv thúc đẩy bộ đôi kỹ thuật số AI sản xuất công nghiệp vào DSX

Thỏa thuận triển khai nền tảng y tế GenAI tự động học

Nhà sản xuất cảm biến Trung Quốc xây nhà máy 10 ha tại miền Bắc Việt Nam

Chuỗi cung ứng DHL nâng cao năng lực Logistics cho trung tâm dữ liệu khu vực APAC

Các hãng hàng không đang khám phá ứng dụng tiếp theo cho Agentic

Murphy Oil coi Việt Nam là đối tác chiến lược, thúc đẩy mở rộng hoạt động thượng nguồn

Bài Viết Mới

Trí tuệ nhân tạo cá nhân và hướng phát triển tương lai của chúng ta

Gammon triển khai nền tảng AI để chuyển đổi an toàn trong xây dựng

Mạng 5G của Malaysia phủ sóng mạnh hơn trong nhà khi DNB tăng cường vùng phủ tại các khu vực có lưu lượng cao

ISO/IEC 42119‑8 biến thử nghiệm AI thành tiêu chuẩn trọng tâm

Tại sao tiêu chuẩn thử nghiệm toàn cầu lại quan trọng

Nỗ lực đảm bảo và thử nghiệm AI của Singapore

Tính toàn diện, thử nghiệm và thực hành thực tế

Bài liên quan

Subscribe to Updates