Meta đã tiết lộ một mô hình AI mới có tên NLLB-200 có thể dịch 200 ngôn ngữ và cải thiện chất lượng trung bình 44%.
Các ứng dụng dịch thuật đã khá thành thạo các ngôn ngữ phổ biến nhất trong một thời gian. Ngay cả khi họ không đưa ra một bản dịch hoàn hảo, thông thường nó đủ gần để người bản ngữ hiểu.
Tuy nhiên, có hàng trăm triệu người ở các khu vực sử dụng nhiều ngôn ngữ – như Châu Phi và Châu Á – vẫn phải chịu đựng các dịch vụ dịch thuật kém.
Trong một thông cáo báo chí, Meta viết:
“Để giúp mọi người kết nối tốt hơn ngày hôm nay và trở thành một phần của siêu thị của ngày mai, các nhà nghiên cứu AI của chúng tôi đã tạo ra Không có ngôn ngữ nào bị bỏ lại phía sau (NLLB)nỗ lực phát triển khả năng dịch máy chất lượng cao cho hầu hết các ngôn ngữ trên thế giới.
Hôm nay, chúng tôi công bố một bước đột phá quan trọng trong NLLB: Chúng tôi đã xây dựng một mô hình AI duy nhất được gọi là NLLB-200, có thể dịch 200 ngôn ngữ khác nhau với kết quả chính xác hơn nhiều so với những gì công nghệ trước đây có thể đạt được. ”
Metaverse hướng tới mục tiêu là không biên giới. Để làm được điều đó, các dịch vụ dịch thuật sẽ phải nhanh chóng đưa ra các bản dịch chính xác.
Công ty giải thích: “Khi metaverse bắt đầu hình thành, khả năng xây dựng các công nghệ hoạt động tốt trong nhiều loại ngôn ngữ hơn sẽ giúp dân chủ hóa quyền truy cập vào trải nghiệm nhập vai trong thế giới ảo”.
Theo Meta, NLLB-200 đạt “chất lượng” bản dịch cao hơn 44% so với nghiên cứu AI trước đây. Đối với một số ngôn ngữ gốc Phi và Ấn Độ, bản dịch của NLLB-200 chính xác hơn 70%.
Meta đã tạo một tập dữ liệu có tên FLORES-200 để đánh giá và cải thiện NLLB-200. Bộ dữ liệu cho phép các nhà nghiên cứu đánh giá hiệu suất của FLORES-200 “theo 40.000 hướng ngôn ngữ khác nhau”.
Cả NLLB-200 và FLORES-200 đều đang được mở cho các nhà phát triển để giúp xây dựng dựa trên công việc của Meta và cải thiện các công cụ dịch của riêng họ.
Meta có quỹ tài trợ lên đến 200.000 đô la cho các nhà nghiên cứu và tổ chức phi lợi nhuận muốn sử dụng NLLB-200 cho các mục đích sử dụng có tác động tập trung vào tính bền vững, an ninh lương thực, bạo lực trên cơ sở giới, giáo dục hoặc các lĩnh vực khác hỗ trợ các Mục tiêu Phát triển Bền vững của Liên hợp quốc.
Tuy nhiên, không phải ai cũng hoàn toàn bị thuyết phục bởi bước đột phá mới nhất của Meta.
“Điều đáng ghi nhớ, bất chấp sự cường điệu, rằng những mô hình này không phải là phương pháp chữa bệnh mà chúng có thể xuất hiện lần đầu. Các mô hình mà Meta sử dụng là những con thú khổng lồ, khó sử dụng. Vì vậy, khi bạn đi sâu vào những chi tiết vụn vặt của các trường hợp sử dụng được cá nhân hóa, họ có thể dễ dàng nhận ra mình không có chiều sâu – được tổng thể hóa quá mức và không có khả năng thực hiện các nhiệm vụ cụ thể được yêu cầu ”, Victor Botev, Giám đốc công nghệ tại Iris.ai nhận xét.
“Một điểm cần lưu ý nữa là tính hợp lệ của các phép đo này vẫn chưa được các đồng nghiệp của chúng chứng minh và xác nhận một cách khoa học. Các bộ dữ liệu cho các ngôn ngữ khác nhau quá nhỏ, thể hiện qua thách thức trong việc tạo chúng ngay từ đầu và số liệu mà chúng đang sử dụng, BLEU, không đặc biệt áp dụng ”.
Bản trình diễn NLLB-200 có sẵn nơi đây.
(Ảnh của Jason Leung trên Unsplash)
Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo trong ngành? Hãy xem Triển lãm AI & Dữ liệu lớn đang diễn ra ở Amsterdam, California và London.
Khám phá các sự kiện công nghệ doanh nghiệp sắp tới và hội thảo trên web do TechForge cung cấp tại đây.
Nguồn : www.artificialintelligence-news.com (Post by Automation bot)