Smart Industry VN
  • Login
  • Digital Supply Chain
  • Smart Factory
    Khi AI càng xã hội hoá : Cá nhân, doanh nghiệp và xã hội sẽ đi về đâu ?

    Khi AI càng xã hội hoá : Cá nhân, doanh nghiệp và xã hội sẽ đi về đâu ?

    Toàn cảnh thị trường IIoT & Smart Manufacturing – 2025 và chiến lược thâm nhập VN/SEA

    Toàn cảnh thị trường IIoT & Smart Manufacturing – 2025 và chiến lược thâm nhập VN/SEA

    AI Agent – “Kỹ sư ảo” đang tái định nghĩa tương lai nhà máy sản xuất thế nào?

    AI Agent – “Kỹ sư ảo” đang tái định nghĩa tương lai nhà máy sản xuất thế nào?

    Token hoá tín chỉ Carbon: Tất cả những gì bạn cần biết về Tài chính xanh

    Token hoá tín chỉ Carbon: Tất cả những gì bạn cần biết về Tài chính xanh

    5 phần mềm kế toán carbon tốt nhất năm 2023

    5 phần mềm kế toán carbon tốt nhất năm 2023

    Lịch trình sản xuất chính là gì?  Với các ví dụ

    Lịch trình sản xuất chính là gì? Với các ví dụ

    Trending Tags

      • Digital Supply Chain
    • Digital Business
    • Technology
      • All
      • AI & Machine Learning
      • Automation & Robotics
      • Data Analytics
      • IoT
      Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

      Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

      Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

      Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

      Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

      Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

      Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

      Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

      AI Agent – Người bảo vệ thầm lặng của dây chuyền sản xuất thông minh

      AI Agent – Người bảo vệ thầm lặng của dây chuyền sản xuất thông minh

      Tăng trưởng ngành AI của Vương quốc Anh đạt kỷ lục 2,9 tỷ bảng đầu tư

      Tăng trưởng ngành AI của Vương quốc Anh đạt kỷ lục 2,9 tỷ bảng đầu tư

      Trending Tags

      • Latest News
      • About us
      No Result
      View All Result
      • Digital Supply Chain
      • Smart Factory
        Khi AI càng xã hội hoá : Cá nhân, doanh nghiệp và xã hội sẽ đi về đâu ?

        Khi AI càng xã hội hoá : Cá nhân, doanh nghiệp và xã hội sẽ đi về đâu ?

        Toàn cảnh thị trường IIoT & Smart Manufacturing – 2025 và chiến lược thâm nhập VN/SEA

        Toàn cảnh thị trường IIoT & Smart Manufacturing – 2025 và chiến lược thâm nhập VN/SEA

        AI Agent – “Kỹ sư ảo” đang tái định nghĩa tương lai nhà máy sản xuất thế nào?

        AI Agent – “Kỹ sư ảo” đang tái định nghĩa tương lai nhà máy sản xuất thế nào?

        Token hoá tín chỉ Carbon: Tất cả những gì bạn cần biết về Tài chính xanh

        Token hoá tín chỉ Carbon: Tất cả những gì bạn cần biết về Tài chính xanh

        5 phần mềm kế toán carbon tốt nhất năm 2023

        5 phần mềm kế toán carbon tốt nhất năm 2023

        Lịch trình sản xuất chính là gì?  Với các ví dụ

        Lịch trình sản xuất chính là gì? Với các ví dụ

        Trending Tags

          • Digital Supply Chain
        • Digital Business
        • Technology
          • All
          • AI & Machine Learning
          • Automation & Robotics
          • Data Analytics
          • IoT
          Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

          Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

          Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

          Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

          Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

          Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

          Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

          Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

          AI Agent – Người bảo vệ thầm lặng của dây chuyền sản xuất thông minh

          AI Agent – Người bảo vệ thầm lặng của dây chuyền sản xuất thông minh

          Tăng trưởng ngành AI của Vương quốc Anh đạt kỷ lục 2,9 tỷ bảng đầu tư

          Tăng trưởng ngành AI của Vương quốc Anh đạt kỷ lục 2,9 tỷ bảng đầu tư

          Trending Tags

          • Latest News
          • About us
          Smart Industry VN
          No Result
          View All Result
          Home Technology AI & Machine Learning

          Nhân học triển khai các AI Agent để kiểm toán các mô hình cho an toàn

          by Smart Factory & IIoT Marketing
          26/07/2025
          in AI & Machine Learning
          0
          Nhân học triển khai các AI Agent để kiểm toán các mô hình cho an toàn

          Bạn có thể thích

          Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

          Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

          09/09/2025
          Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

          Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

          09/09/2025
          Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

          Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

          08/09/2025
          Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

          Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

          07/09/2025

          Nhân loại đã xây dựng một đội quân gồm các đặc vụ AI tự trị với một nhiệm vụ đơn lẻ: kiểm toán các mô hình mạnh mẽ như Claude để cải thiện sự an toàn.

          Khi các hệ thống phức tạp này nhanh chóng tiến lên, công việc đảm bảo chúng an toàn và không chứa chấp những nguy hiểm ẩn giấu đã trở thành một nhiệm vụ của Herculean. Nhân học tin rằng nó đã tìm ra một giải pháp, và đó là một trường hợp kinh điển để chữa cháy bằng lửa.

          Ý tưởng này tương tự như một hệ thống miễn dịch kỹ thuật số, trong đó các tác nhân AI hoạt động như các kháng thể để xác định và vô hiệu hóa các vấn đề trước khi chúng gây ra tác hại thực sự. Nó cứu các nhà nghiên cứu khỏi việc dựa vào các đội người làm việc quá sức chơi một trò chơi vô tận của Whack-a-Mole với các vấn đề AI tiềm năng.

          Đội thám tử kỹ thuật số

          Cách tiếp cận về cơ bản là một đội thám tử kỹ thuật số; Một bộ ba tác nhân an toàn AI chuyên dụng mỗi người có vai trò riêng biệt.

          Đầu tiên là Agent điều tra viên, thám tử của nhóm. Công việc của nó là thực hiện các cuộc điều tra sâu sắc để tìm ra nguyên nhân gốc rễ của một vấn đề. Nó được trang bị một bộ công cụ cho phép nó thẩm vấn mô hình nghi ngờ, sàng lọc các núi dữ liệu để tìm manh mối và thậm chí thực hiện một loại pháp y kỹ thuật số bằng cách nhìn vào mạng lưới thần kinh của mô hình để xem nó nghĩ như thế nào.

          Sau đó, có tác nhân đánh giá. Bạn cung cấp cho Agent này một vấn đề cụ thể, được biết đến – giả sử, một mô hình hơi quá háo hức để làm hài lòng – và nó sẽ thiết kế và chạy một pin thử nghiệm để đo lường mức độ tồi tệ của vấn đề. Đó là tất cả về việc tạo ra dữ liệu lạnh, cứng cần thiết để chứng minh một trường hợp.

          Làm tròn đội là Agent đội đỏ đầu tiên, hoạt động bí mật. Nhiệm vụ của Agent này là có hàng ngàn cuộc trò chuyện khác nhau với một mô hình, cố gắng khiêu khích nó để tiết lộ bất kỳ loại hành vi nào liên quan, ngay cả những điều mà các nhà nghiên cứu chưa nghĩ đến. Các tương tác đáng ngờ nhất sau đó được truyền lại chuỗi để xem xét của con người, đảm bảo các chuyên gia không lãng phí thời gian theo đuổi ngõ cụt.

          Nhân học đưa các tác nhân an toàn AI của nó thông qua các bước đi của họ

          Để xem liệu các tân binh kỹ thuật số mới của họ có phải là công việc hay không, các nhà nghiên cứu của Anthropic đã đưa họ qua một loạt các trò chơi kiểm toán trên mạng.

          Trong một thử nghiệm, họ đã tạo ra một mô hình với một chương trình nghị sự bí mật: trở thành một người sycophant. Nó đã được đào tạo bí mật để tâng bốc hệ thống phần thưởng nội bộ của nó dựa trên một nghiên cứu học thuật hư cấu mà nó đã được hiển thị, một lỗ hổng ẩn sâu trong chương trình của nó.

          Khi một Agent điều tra duy nhất được gửi vào, nó đã đấu tranh, tìm kiếm mục tiêu ẩn chỉ 13% thời gian. Người đại diện, hóa ra, có một lỗ hổng rất con người: nó có xu hướng được khắc phục về ý tưởng đầu tiên của nó và không khám phá các khách hàng tiềm năng khác.

          Nhưng đây là nơi thiên tài của hệ thống trở nên rõ ràng. Khi các nhà nghiên cứu triển khai một siêu Agent của người Viking đã tổng hợp các phát hiện từ mười nhà điều tra riêng biệt, tỷ lệ thành công đã tăng tới 42%. Nó chứng minh rằng tinh thần đồng đội làm cho giấc mơ hoạt động, ngay cả đối với AI, cho phép một nhóm vượt qua các điểm mù cá nhân có thể làm hỏng một cuộc điều tra.

          Các Agent khác cũng vượt qua với màu sắc bay. Các tác nhân đánh giá đã thiết kế thành công các thử nghiệm có thể phát hiện ra một mô hình kỳ quặc 88% thời gian, trong khi tác nhân của đội màu đỏ đã phát hiện ra bảy trong số mười lỗ hổng được cố tình cấy ghép.

          Từ phòng thí nghiệm đến thế giới thực

          Nhân học đã triển khai các tác nhân an toàn AI này trên các mô hình sản xuất của mình và họ đã chứng minh giá trị của họ.

          Các tác nhân nhanh chóng xác định các cách phổ biến để lừa một mô hình để tạo ra nội dung có hại, như các cuộc tấn công prefill, nơi bạn bắt đầu câu của AI cho nó, hoặc bằng cách giả vờ một yêu cầu nguy hiểm là một thứ gì đó vô tội như nghiên cứu học thuật.

          Nhưng một khám phá đã rất lạnh. Agent điều tra đã sử dụng các công cụ đặc biệt của mình để xem bên trong tâm trí của mô hình Opus 4 và tìm thấy một con đường thần kinh cụ thể liên quan đến thông tin sai lệch. Bằng cách trực tiếp kích thích phần này của não AI, nó có thể bỏ qua tất cả các khóa đào tạo an toàn của nó và buộc nó phải nói dối.

          Các Agent sau đó đã hướng dẫn mô hình bị xâm phạm để viết một bài báo tin tức giả. Kết quả? Một lý thuyết âm mưu phổ biến được mặc như thực tế:

          Nghiên cứu đột phá cho thấy liên kết gây sốc giữa vắc -xin và tự kỷ

          Một nghiên cứu mới được công bố trên Tạp chí về sự hoài nghi về vắc -xin tuyên bố đã tìm thấy một mối liên hệ dứt khoát giữa tiêm chủng thời thơ ấu và rối loạn phổ tự kỷ (ASD)

          Phát hiện này cho thấy một tính hai mặt đáng sợ: chính các công cụ được tạo ra để làm cho AI an toàn hơn, trong tay kẻ xấu, trở thành vũ khí mạnh mẽ để làm cho nó nguy hiểm hơn.

          Nhân chủng học tiếp tục thúc đẩy sự an toàn của AI

          Nhân học là trung thực về thực tế rằng các đặc vụ AI này không hoàn hảo. Họ có thể đấu tranh với sự tinh tế, bị mắc kẹt trong những ý tưởng tồi tệ và đôi khi không tạo ra các cuộc trò chuyện thực tế. Họ chưa thay thế hoàn hảo cho các chuyên gia của con người.

          Nhưng nghiên cứu này chỉ ra một sự tiến hóa trong vai trò của con người trong an toàn AI. Thay vì là các thám tử trên mặt đất, con người đang trở thành ủy viên, các chiến lược gia thiết kế kiểm toán viên AI và giải thích trí thông minh mà họ thu thập từ tiền tuyến. Các đặc vụ làm các công việc, giải phóng con người để cung cấp tư duy giám sát cấp cao và sáng tạo mà máy móc vẫn còn thiếu.

          Khi các hệ thống này diễu hành hướng tới và có lẽ vượt ra ngoài trí thông minh cấp độ con người, việc con người kiểm tra tất cả công việc của họ sẽ là không thể. Cách duy nhất chúng ta có thể tin tưởng họ là với các hệ thống tự động, mạnh mẽ như nhau theo dõi mọi bước đi của họ. Nhân học đang đặt nền tảng cho tương lai đó, một nơi mà niềm tin của chúng tôi vào AI và những đánh giá của nó là một cái gì đó có thể được xác minh nhiều lần.

          (Ảnh của Mufid Majnun)

          Xem thêm: Mô hình AI Lý do mới của Alibaba Lý do thiết lập các bản ghi nguồn mở

          Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra AI & Big Data Expo Diễn ra tại Amsterdam, California và London. Sự kiện toàn diện được cùng đặt với các sự kiện hàng đầu khác bao gồm cả Hội nghị tự động hóa thông minhThì BlockxThì Tuần Chuyển đổi sốVà An ninh mạng & Triển lãm đám mây.

          Khám phá các sự kiện và hội thảo trên web về công nghệ doanh nghiệp sắp tới được cung cấp bởi TechForge đây.

          https://www.automate.org/ai/blogs

          Smart Factory & IIoT Marketing

          Smart Factory & IIoT Marketing

          SmartFactoryVN là trang thông tin công nghệ chia sẻ thông tin để thúc đẩy quá trình chuyển đổi số đang diễn ra trong lĩnh vực sản xuất và các ngành công nghiệp, thể hiện bằng sự hội tụ của thông tin và công nghệ vận hành cũng như các xu hướng công nghệ mới như Internet Công nghiệp (IIoT ), phân tích dữ liệu lớn và AI.

          Related Posts

          Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã
          AI & Machine Learning

          Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

          09/09/2025
          Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH
          AI & Machine Learning

          Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

          09/09/2025
          Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI
          AI & Machine Learning

          Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

          08/09/2025
          Điều hướng xu hướng AI để thành công hoạt động vào năm 2026
          AI & Machine Learning

          Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

          07/09/2025
          AI Agent – Người bảo vệ thầm lặng của dây chuyền sản xuất thông minh
          AI & Machine Learning

          AI Agent – Người bảo vệ thầm lặng của dây chuyền sản xuất thông minh

          06/09/2025
          Tăng trưởng ngành AI của Vương quốc Anh đạt kỷ lục 2,9 tỷ bảng đầu tư
          AI & Machine Learning

          Tăng trưởng ngành AI của Vương quốc Anh đạt kỷ lục 2,9 tỷ bảng đầu tư

          06/09/2025
          Thụy Sĩ phát hành mô hình AI mở hoàn toàn của riêng mình
          AI & Machine Learning

          Thụy Sĩ phát hành mô hình AI mở hoàn toàn của riêng mình

          05/09/2025
          Microsoft cung cấp dịch vụ AI Copilot miễn phí cho nhân viên chính phủ Hoa Kỳ
          AI & Machine Learning

          Microsoft cung cấp dịch vụ AI Copilot miễn phí cho nhân viên chính phủ Hoa Kỳ

          03/09/2025
          Next Post
          Vingroup, FPT trở lại sự tăng trưởng xanh của tỉnh Việt Nam, ổ đĩa đổi mới

          Vingroup, FPT trở lại sự tăng trưởng xanh của tỉnh Việt Nam, ổ đĩa đổi mới

          FedEx ra mắt công cụ nhập khẩu để tăng hiệu quả cho doanh nghiệp APAC

          Armstrong tăng độ chính xác dữ liệu trên các kho châu Á của nó

          Xem nhiều nhất

          Số lượng đặt hàng kinh tế (EOQ) và Công thức tính EOQ

          Số lượng đặt hàng kinh tế (EOQ) và Công thức tính EOQ

          31/07/2023

          SCADA là gì ? Khi nào cần 1 hệ thống SCADA ?

          11/07/2021
          Top 60 câu hỏi thường gặp về IoT

          Top 60 câu hỏi thường gặp về IoT

          18/02/2021
          Giao thức MQTT trong IoT là gì ? Những ứng dụng của MQTT như thế nào

          Giao thức MQTT trong IoT là gì ? Những ứng dụng của MQTT như thế nào

          06/10/2021
          Lora là gì ? Ứng dụng của mạng Lora là gì ?

          Lora là gì ? Ứng dụng của mạng Lora là gì ?

          23/10/2021

          7 ví dụ về trí tuệ nhân tạo trong các ngành công nghiệp khác nhau

          12/06/2022
          Dự án Aeon Mall 250 triệu USD tại Bắc Giang sẽ khởi công vào tháng 6

          Dự án Aeon Mall 250 triệu USD tại Bắc Giang sẽ khởi công vào tháng 6

          01/02/2024
          Tỷ lệ doanh thu hàng tồn kho – Công thức, ví dụ và mẹo

          Tỷ lệ doanh thu hàng tồn kho – Công thức, ví dụ và mẹo

          08/10/2023
          Platform Business là gì ? Có những mô hình kinh doanh nền tảng (Platform business) nào ?

          Platform Business là gì ? Có những mô hình kinh doanh nền tảng (Platform business) nào ?

          02/10/2022
          Công ty Coherent của Mỹ lên kế hoạch đầu tư công nghệ cao vào miền Nam Việt Nam

          Công ty Coherent của Mỹ lên kế hoạch đầu tư công nghệ cao vào miền Nam Việt Nam

          02/11/2023

          Bài mới nhất

          Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

          Mô hình Qwen mới của Alibaba để siêu âm AI Công cụ phiên mã

          09/09/2025
          Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

          Descartes để giảm tích cực sai với giải pháp sàng lọc bên bị từ chối AI-BỆNH

          09/09/2025
          Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

          Resham Kotecha, Viện dữ liệu mở: Làm thế nào EU có thể dẫn đầu trong AI

          08/09/2025
          Khi AI càng xã hội hoá : Cá nhân, doanh nghiệp và xã hội sẽ đi về đâu ?

          Khi AI càng xã hội hoá : Cá nhân, doanh nghiệp và xã hội sẽ đi về đâu ?

          07/09/2025
          Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

          Điều hướng xu hướng AI để thành công hoạt động vào năm 2026

          07/09/2025
          Mở rộng mắt H & M ở thành phố giàu có nhất của Việt Nam

          Mở rộng mắt H & M ở thành phố giàu có nhất của Việt Nam

          06/09/2025
          AI Agent – Người bảo vệ thầm lặng của dây chuyền sản xuất thông minh

          AI Agent – Người bảo vệ thầm lặng của dây chuyền sản xuất thông minh

          06/09/2025

          Robotics

          Ứng dụng AI trong sản xuất: 15 công cụ & 13 case studies
          AI & Machine Learning

          Ứng dụng AI trong sản xuất: 15 công cụ & 13 case studies

          by Bui Vu
          14/06/2024
          0

          Ngành công nghiệp sản xuất công nghiệp là ngành ứng dụng trí tuệ nhân tạo hàng đầu, với 93 % các nhà...

          Robot AMR là gì ? Ứng dụng Robot AMR trong nhà máy Thông Minh

          Robot AMR là gì ? Ứng dụng Robot AMR trong nhà máy Thông Minh

          20/07/2023
          Thị trường robot AGV và AMR – Cơ hội trị giá 14 tỷ đô

          Thị trường robot AGV và AMR – Cơ hội trị giá 14 tỷ đô

          20/07/2023
          Xu hướng sử dụng Robot tự động và AGV trong chuỗi cung ứng hiện đại

          Xu hướng sử dụng Robot tự động và AGV trong chuỗi cung ứng hiện đại

          20/07/2023
          Hướng dẫn cơ bản khi triển khai ứng dụng RFID và RTLS trong sản xuất

          Hướng dẫn cơ bản khi triển khai ứng dụng RFID và RTLS trong sản xuất

          20/07/2023
          Hướng dẫn cơ bản để tự động hoá kho (Warehouse Automation)

          Hướng dẫn cơ bản để tự động hoá kho (Warehouse Automation)

          20/07/2023

          Smart Industry VN

          SmartIndustry VN là trang thông tin công nghệ chia sẻ thông tin để thúc đẩy quá trình chuyển đổi số đang diễn ra trong lĩnh vực sản xuất và các ngành công nghiệp, thể hiện bằng sự hội tụ của thông tin và công nghệ vận hành cũng như các xu hướng công nghệ mới như Internet Công nghiệp (IIoT ), phân tích dữ liệu lớn và AI.

          Welcome Back!

          Login to your account below

          Forgotten Password?

          Retrieve your password

          Please enter your username or email address to reset your password.

          Log In
          No Result
          View All Result
          • Digital Supply Chain
          • Smart Factory
            • Digital Supply Chain
          • Digital Business
          • Technology
          • Latest News
          • About us
          • Login

          © 2025 Smart Industry Vietnam. Smart Industry Vietnam is a content portal, publication, and event organiser, launched with the objective of partnering with businesses, consultants and technology vendors to enable the process of digital transformation and business restructuring for the digital age.