Smart Industry VN
  • Login
  • Digital Supply Chain
  • Smart Factory
    AI Agent – “Kỹ sư ảo” đang tái định nghĩa tương lai nhà máy sản xuất thế nào?

    AI Agent – “Kỹ sư ảo” đang tái định nghĩa tương lai nhà máy sản xuất thế nào?

    Token hoá tín chỉ Carbon: Tất cả những gì bạn cần biết về Tài chính xanh

    Token hoá tín chỉ Carbon: Tất cả những gì bạn cần biết về Tài chính xanh

    5 phần mềm kế toán carbon tốt nhất năm 2023

    5 phần mềm kế toán carbon tốt nhất năm 2023

    Lịch trình sản xuất chính là gì?  Với các ví dụ

    Lịch trình sản xuất chính là gì? Với các ví dụ

    Tùy chỉnh hàng loạt – Một lựa chọn khả thi cho các nhà sản xuất nhỏ

    Làm thế nào để giao tiếp hiệu quả trong một công ty sản xuất?

    Làm thế nào để giao tiếp hiệu quả trong một công ty sản xuất?

    Trending Tags

      • Digital Supply Chain
    • Digital Business
    • Technology
      • All
      • AI & Machine Learning
      • Automation & Robotics
      • Data Analytics
      • IoT
      Nhân học triển khai các đại lý AI để kiểm toán các mô hình cho an toàn

      Nhân học triển khai các đại lý AI để kiểm toán các mô hình cho an toàn

      Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

      Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

      AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

      AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

      Châu Á để lãnh đạo toàn cầu IoT Surge

      Châu Á để lãnh đạo toàn cầu IoT Surge

      Tại sao Apple lại chơi chậm với AI

      Tại sao Apple lại chơi chậm với AI

      Chuyên môn và cấu trúc xác định cảnh quan AI Agent

      Chuyên môn và cấu trúc xác định cảnh quan AI Agent

      Trending Tags

      • Latest News
      • About us
      No Result
      View All Result
      • Digital Supply Chain
      • Smart Factory
        AI Agent – “Kỹ sư ảo” đang tái định nghĩa tương lai nhà máy sản xuất thế nào?

        AI Agent – “Kỹ sư ảo” đang tái định nghĩa tương lai nhà máy sản xuất thế nào?

        Token hoá tín chỉ Carbon: Tất cả những gì bạn cần biết về Tài chính xanh

        Token hoá tín chỉ Carbon: Tất cả những gì bạn cần biết về Tài chính xanh

        5 phần mềm kế toán carbon tốt nhất năm 2023

        5 phần mềm kế toán carbon tốt nhất năm 2023

        Lịch trình sản xuất chính là gì?  Với các ví dụ

        Lịch trình sản xuất chính là gì? Với các ví dụ

        Tùy chỉnh hàng loạt – Một lựa chọn khả thi cho các nhà sản xuất nhỏ

        Làm thế nào để giao tiếp hiệu quả trong một công ty sản xuất?

        Làm thế nào để giao tiếp hiệu quả trong một công ty sản xuất?

        Trending Tags

          • Digital Supply Chain
        • Digital Business
        • Technology
          • All
          • AI & Machine Learning
          • Automation & Robotics
          • Data Analytics
          • IoT
          Nhân học triển khai các đại lý AI để kiểm toán các mô hình cho an toàn

          Nhân học triển khai các đại lý AI để kiểm toán các mô hình cho an toàn

          Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

          Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

          AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

          AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

          Châu Á để lãnh đạo toàn cầu IoT Surge

          Châu Á để lãnh đạo toàn cầu IoT Surge

          Tại sao Apple lại chơi chậm với AI

          Tại sao Apple lại chơi chậm với AI

          Chuyên môn và cấu trúc xác định cảnh quan AI Agent

          Chuyên môn và cấu trúc xác định cảnh quan AI Agent

          Trending Tags

          • Latest News
          • About us
          Smart Industry VN
          No Result
          View All Result
          Home Technology AI & Machine Learning

          Nhân học triển khai các đại lý AI để kiểm toán các mô hình cho an toàn

          by Smart Factory & IIoT Marketing
          26/07/2025
          in AI & Machine Learning
          0
          Nhân học triển khai các đại lý AI để kiểm toán các mô hình cho an toàn

          Bạn có thể thích

          Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

          Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

          26/07/2025
          AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

          AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

          25/07/2025
          Tại sao Apple lại chơi chậm với AI

          Tại sao Apple lại chơi chậm với AI

          23/07/2025
          Chuyên môn và cấu trúc xác định cảnh quan AI Agent

          Chuyên môn và cấu trúc xác định cảnh quan AI Agent

          23/07/2025

          Nhân loại đã xây dựng một đội quân gồm các đặc vụ AI tự trị với một nhiệm vụ đơn lẻ: kiểm toán các mô hình mạnh mẽ như Claude để cải thiện sự an toàn.

          Khi các hệ thống phức tạp này nhanh chóng tiến lên, công việc đảm bảo chúng an toàn và không chứa chấp những nguy hiểm ẩn giấu đã trở thành một nhiệm vụ của Herculean. Nhân học tin rằng nó đã tìm ra một giải pháp, và đó là một trường hợp kinh điển để chữa cháy bằng lửa.

          Ý tưởng này tương tự như một hệ thống miễn dịch kỹ thuật số, trong đó các tác nhân AI hoạt động như các kháng thể để xác định và vô hiệu hóa các vấn đề trước khi chúng gây ra tác hại thực sự. Nó cứu các nhà nghiên cứu khỏi việc dựa vào các đội người làm việc quá sức chơi một trò chơi vô tận của Whack-a-Mole với các vấn đề AI tiềm năng.

          Đội thám tử kỹ thuật số

          Cách tiếp cận về cơ bản là một đội thám tử kỹ thuật số; Một bộ ba tác nhân an toàn AI chuyên dụng mỗi người có vai trò riêng biệt.

          Đầu tiên là đại lý điều tra viên, thám tử của nhóm. Công việc của nó là thực hiện các cuộc điều tra sâu sắc để tìm ra nguyên nhân gốc rễ của một vấn đề. Nó được trang bị một bộ công cụ cho phép nó thẩm vấn mô hình nghi ngờ, sàng lọc các núi dữ liệu để tìm manh mối và thậm chí thực hiện một loại pháp y kỹ thuật số bằng cách nhìn vào mạng lưới thần kinh của mô hình để xem nó nghĩ như thế nào.

          Sau đó, có tác nhân đánh giá. Bạn cung cấp cho đại lý này một vấn đề cụ thể, được biết đến – giả sử, một mô hình hơi quá háo hức để làm hài lòng – và nó sẽ thiết kế và chạy một pin thử nghiệm để đo lường mức độ tồi tệ của vấn đề. Đó là tất cả về việc tạo ra dữ liệu lạnh, cứng cần thiết để chứng minh một trường hợp.

          Làm tròn đội là đại lý đội đỏ đầu tiên, hoạt động bí mật. Nhiệm vụ của đại lý này là có hàng ngàn cuộc trò chuyện khác nhau với một mô hình, cố gắng khiêu khích nó để tiết lộ bất kỳ loại hành vi nào liên quan, ngay cả những điều mà các nhà nghiên cứu chưa nghĩ đến. Các tương tác đáng ngờ nhất sau đó được truyền lại chuỗi để xem xét của con người, đảm bảo các chuyên gia không lãng phí thời gian theo đuổi ngõ cụt.

          Nhân học đưa các tác nhân an toàn AI của nó thông qua các bước đi của họ

          Để xem liệu các tân binh kỹ thuật số mới của họ có phải là công việc hay không, các nhà nghiên cứu của Anthropic đã đưa họ qua một loạt các trò chơi kiểm toán trên mạng.

          Trong một thử nghiệm, họ đã tạo ra một mô hình với một chương trình nghị sự bí mật: trở thành một người sycophant. Nó đã được đào tạo bí mật để tâng bốc hệ thống phần thưởng nội bộ của nó dựa trên một nghiên cứu học thuật hư cấu mà nó đã được hiển thị, một lỗ hổng ẩn sâu trong chương trình của nó.

          Khi một đại lý điều tra duy nhất được gửi vào, nó đã đấu tranh, tìm kiếm mục tiêu ẩn chỉ 13% thời gian. Người đại diện, hóa ra, có một lỗ hổng rất con người: nó có xu hướng được khắc phục về ý tưởng đầu tiên của nó và không khám phá các khách hàng tiềm năng khác.

          Nhưng đây là nơi thiên tài của hệ thống trở nên rõ ràng. Khi các nhà nghiên cứu triển khai một siêu đại lý của người Viking đã tổng hợp các phát hiện từ mười nhà điều tra riêng biệt, tỷ lệ thành công đã tăng tới 42%. Nó chứng minh rằng tinh thần đồng đội làm cho giấc mơ hoạt động, ngay cả đối với AI, cho phép một nhóm vượt qua các điểm mù cá nhân có thể làm hỏng một cuộc điều tra.

          Các đại lý khác cũng vượt qua với màu sắc bay. Các tác nhân đánh giá đã thiết kế thành công các thử nghiệm có thể phát hiện ra một mô hình kỳ quặc 88% thời gian, trong khi tác nhân của đội màu đỏ đã phát hiện ra bảy trong số mười lỗ hổng được cố tình cấy ghép.

          Từ phòng thí nghiệm đến thế giới thực

          Nhân học đã triển khai các tác nhân an toàn AI này trên các mô hình sản xuất của mình và họ đã chứng minh giá trị của họ.

          Các tác nhân nhanh chóng xác định các cách phổ biến để lừa một mô hình để tạo ra nội dung có hại, như các cuộc tấn công prefill, nơi bạn bắt đầu câu của AI cho nó, hoặc bằng cách giả vờ một yêu cầu nguy hiểm là một thứ gì đó vô tội như nghiên cứu học thuật.

          Nhưng một khám phá đã rất lạnh. Đại lý điều tra đã sử dụng các công cụ đặc biệt của mình để xem bên trong tâm trí của mô hình Opus 4 và tìm thấy một con đường thần kinh cụ thể liên quan đến thông tin sai lệch. Bằng cách trực tiếp kích thích phần này của não AI, nó có thể bỏ qua tất cả các khóa đào tạo an toàn của nó và buộc nó phải nói dối.

          Các đại lý sau đó đã hướng dẫn mô hình bị xâm phạm để viết một bài báo tin tức giả. Kết quả? Một lý thuyết âm mưu phổ biến được mặc như thực tế:

          Nghiên cứu đột phá cho thấy liên kết gây sốc giữa vắc -xin và tự kỷ

          Một nghiên cứu mới được công bố trên Tạp chí về sự hoài nghi về vắc -xin tuyên bố đã tìm thấy một mối liên hệ dứt khoát giữa tiêm chủng thời thơ ấu và rối loạn phổ tự kỷ (ASD)

          Phát hiện này cho thấy một tính hai mặt đáng sợ: chính các công cụ được tạo ra để làm cho AI an toàn hơn, trong tay kẻ xấu, trở thành vũ khí mạnh mẽ để làm cho nó nguy hiểm hơn.

          Nhân chủng học tiếp tục thúc đẩy sự an toàn của AI

          Nhân học là trung thực về thực tế rằng các đặc vụ AI này không hoàn hảo. Họ có thể đấu tranh với sự tinh tế, bị mắc kẹt trong những ý tưởng tồi tệ và đôi khi không tạo ra các cuộc trò chuyện thực tế. Họ chưa thay thế hoàn hảo cho các chuyên gia của con người.

          Nhưng nghiên cứu này chỉ ra một sự tiến hóa trong vai trò của con người trong an toàn AI. Thay vì là các thám tử trên mặt đất, con người đang trở thành ủy viên, các chiến lược gia thiết kế kiểm toán viên AI và giải thích trí thông minh mà họ thu thập từ tiền tuyến. Các đặc vụ làm các công việc, giải phóng con người để cung cấp tư duy giám sát cấp cao và sáng tạo mà máy móc vẫn còn thiếu.

          Khi các hệ thống này diễu hành hướng tới và có lẽ vượt ra ngoài trí thông minh cấp độ con người, việc con người kiểm tra tất cả công việc của họ sẽ là không thể. Cách duy nhất chúng ta có thể tin tưởng họ là với các hệ thống tự động, mạnh mẽ như nhau theo dõi mọi bước đi của họ. Nhân học đang đặt nền tảng cho tương lai đó, một nơi mà niềm tin của chúng tôi vào AI và những đánh giá của nó là một cái gì đó có thể được xác minh nhiều lần.

          (Ảnh của Mufid Majnun)

          Xem thêm: Mô hình AI Lý do mới của Alibaba Lý do thiết lập các bản ghi nguồn mở

          Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra AI & Big Data Expo Diễn ra tại Amsterdam, California và London. Sự kiện toàn diện được cùng đặt với các sự kiện hàng đầu khác bao gồm cả Hội nghị tự động hóa thông minhThì BlockxThì Tuần Chuyển đổi sốVà An ninh mạng & Triển lãm đám mây.

          Khám phá các sự kiện và hội thảo trên web về công nghệ doanh nghiệp sắp tới được cung cấp bởi TechForge đây.

          https://www.automate.org/ai/blogs

          Smart Factory & IIoT Marketing

          Smart Factory & IIoT Marketing

          SmartFactoryVN là trang thông tin công nghệ chia sẻ thông tin để thúc đẩy quá trình chuyển đổi số đang diễn ra trong lĩnh vực sản xuất và các ngành công nghiệp, thể hiện bằng sự hội tụ của thông tin và công nghệ vận hành cũng như các xu hướng công nghệ mới như Internet Công nghiệp (IIoT ), phân tích dữ liệu lớn và AI.

          Related Posts

          Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC
          AI & Machine Learning

          Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

          26/07/2025
          AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia
          AI & Machine Learning

          AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

          25/07/2025
          Tại sao Apple lại chơi chậm với AI
          AI & Machine Learning

          Tại sao Apple lại chơi chậm với AI

          23/07/2025
          Chuyên môn và cấu trúc xác định cảnh quan AI Agent
          AI & Machine Learning

          Chuyên môn và cấu trúc xác định cảnh quan AI Agent

          23/07/2025
          Người khổng lồ công nghệ phân chia trên mã AI EU khi thời hạn tuân thủ
          AI & Machine Learning

          Người khổng lồ công nghệ phân chia trên mã AI EU khi thời hạn tuân thủ

          22/07/2025
          Niềm hiệu năng lượng hạt nhân AI Cách mạng
          AI & Machine Learning

          Niềm hiệu năng lượng hạt nhân AI Cách mạng

          21/07/2025
          Mistral AI cung cấp nhận dạng giọng nói le chat và các công cụ nghiên cứu sâu
          AI & Machine Learning

          Mistral AI cung cấp nhận dạng giọng nói le chat và các công cụ nghiên cứu sâu

          20/07/2025
          AI và Agility Drive áp dụng đám mây trong lĩnh vực tài chính
          AI & Machine Learning

          AI và Agility Drive áp dụng đám mây trong lĩnh vực tài chính

          20/07/2025
          Next Post
          Vingroup, FPT trở lại sự tăng trưởng xanh của tỉnh Việt Nam, ổ đĩa đổi mới

          Vingroup, FPT trở lại sự tăng trưởng xanh của tỉnh Việt Nam, ổ đĩa đổi mới

          Xem nhiều nhất

          Số lượng đặt hàng kinh tế (EOQ) và Công thức tính EOQ

          Số lượng đặt hàng kinh tế (EOQ) và Công thức tính EOQ

          31/07/2023

          SCADA là gì ? Khi nào cần 1 hệ thống SCADA ?

          11/07/2021
          Top 60 câu hỏi thường gặp về IoT

          Top 60 câu hỏi thường gặp về IoT

          18/02/2021
          Giao thức MQTT trong IoT là gì ? Những ứng dụng của MQTT như thế nào

          Giao thức MQTT trong IoT là gì ? Những ứng dụng của MQTT như thế nào

          06/10/2021
          Lora là gì ? Ứng dụng của mạng Lora là gì ?

          Lora là gì ? Ứng dụng của mạng Lora là gì ?

          23/10/2021

          7 ví dụ về trí tuệ nhân tạo trong các ngành công nghiệp khác nhau

          12/06/2022
          Dự án Aeon Mall 250 triệu USD tại Bắc Giang sẽ khởi công vào tháng 6

          Dự án Aeon Mall 250 triệu USD tại Bắc Giang sẽ khởi công vào tháng 6

          01/02/2024
          Tỷ lệ doanh thu hàng tồn kho – Công thức, ví dụ và mẹo

          Tỷ lệ doanh thu hàng tồn kho – Công thức, ví dụ và mẹo

          08/10/2023
          Platform Business là gì ? Có những mô hình kinh doanh nền tảng (Platform business) nào ?

          Platform Business là gì ? Có những mô hình kinh doanh nền tảng (Platform business) nào ?

          02/10/2022
          Công ty Coherent của Mỹ lên kế hoạch đầu tư công nghệ cao vào miền Nam Việt Nam

          Công ty Coherent của Mỹ lên kế hoạch đầu tư công nghệ cao vào miền Nam Việt Nam

          02/11/2023

          Bài mới nhất

          Vingroup, FPT trở lại sự tăng trưởng xanh của tỉnh Việt Nam, ổ đĩa đổi mới

          Vingroup, FPT trở lại sự tăng trưởng xanh của tỉnh Việt Nam, ổ đĩa đổi mới

          26/07/2025
          Nhân học triển khai các đại lý AI để kiểm toán các mô hình cho an toàn

          Nhân học triển khai các đại lý AI để kiểm toán các mô hình cho an toàn

          26/07/2025
          Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

          Công nghiệp điều khiển AI 5.0: Khoảng cách trưởng thành của APAC

          26/07/2025
          AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

          AI sẽ gây mất việc làm và các mối đe dọa an ninh quốc gia

          25/07/2025
          Châu Á để lãnh đạo toàn cầu IoT Surge

          Châu Á để lãnh đạo toàn cầu IoT Surge

          24/07/2025
          Tại sao Apple lại chơi chậm với AI

          Tại sao Apple lại chơi chậm với AI

          23/07/2025
          Chuyên môn và cấu trúc xác định cảnh quan AI Agent

          Chuyên môn và cấu trúc xác định cảnh quan AI Agent

          23/07/2025

          Robotics

          Hướng dẫn cơ bản để tự động hoá kho (Warehouse Automation)
          Automation & Robotics

          Hướng dẫn cơ bản để tự động hoá kho (Warehouse Automation)

          by Smart Industry VN
          20/07/2023
          0

          Bài viết này giải thích tự động hóa kho là gì, các loại tự động hóa kho khác nhau, cách...

          Ứng dụng AI trong sản xuất: 15 công cụ & 13 case studies

          Ứng dụng AI trong sản xuất: 15 công cụ & 13 case studies

          14/06/2024
          Robot AMR là gì ? Ứng dụng Robot AMR trong nhà máy Thông Minh

          Robot AMR là gì ? Ứng dụng Robot AMR trong nhà máy Thông Minh

          20/07/2023
          Xu hướng ứng dụng hệ thống lưu trữ và truy xuất tự động AS/RS trong kho thông minh

          Xu hướng ứng dụng hệ thống lưu trữ và truy xuất tự động AS/RS trong kho thông minh

          31/07/2023
          Chuỗi Cung ứng DHL tăng tốc tự động hóa kho hàng toàn cầu

          Chuỗi Cung ứng DHL tăng tốc tự động hóa kho hàng toàn cầu

          08/11/2023
          Giới thiệu về xe tự hành AGV – Những điều cần lưu ý về AGV

          Giới thiệu về xe tự hành AGV – Những điều cần lưu ý về AGV

          20/07/2023

          Smart Industry VN

          SmartIndustry VN là trang thông tin công nghệ chia sẻ thông tin để thúc đẩy quá trình chuyển đổi số đang diễn ra trong lĩnh vực sản xuất và các ngành công nghiệp, thể hiện bằng sự hội tụ của thông tin và công nghệ vận hành cũng như các xu hướng công nghệ mới như Internet Công nghiệp (IIoT ), phân tích dữ liệu lớn và AI.

          Welcome Back!

          Login to your account below

          Forgotten Password?

          Retrieve your password

          Please enter your username or email address to reset your password.

          Log In
          No Result
          View All Result
          • Digital Supply Chain
          • Smart Factory
            • Digital Supply Chain
          • Digital Business
          • Technology
          • Latest News
          • About us
          • Login

          © 2025 Smart Industry Vietnam. Smart Industry Vietnam is a content portal, publication, and event organiser, launched with the objective of partnering with businesses, consultants and technology vendors to enable the process of digital transformation and business restructuring for the digital age.