Trong bài viết này, chúng tôi mô tả một số công nghệ và quy trình cơ bản cho phép các doanh nghiệp đưa AI vào hoạt động để chuyển đổi doanh nghiệp của họ. Đặc biệt, chúng tôi giải thích các khái niệm về phân tích dữ liệu, khoa học dữ liệu và Machine Learning, bao gồm cả Deep Learning.
Chúng tôi cũng mô tả Kỹ thuật dữ liệu – Data Engineering , là một yếu tố cần thiết cho tất cả những điều trên. Cuộc thảo luận này sẽ cung cấp cơ sở để hiểu sâu hơn về Machine Learning (ML) và Deep Learning (DL) để theo dõi trong các bài viết tiếp theo. Những nghiên cứu sâu hơn về ML và DL này sẽ cung cấp nền tảng cho các bài viết bổ sung trong loạt bài này để chứng minh cách các kỹ thuật này đang được áp dụng trong các trường hợp sử dụng doanh nghiệp trong thế giới thực.
Phân tích dữ liệu
Trong thế giới ngày nay, tất cả các doanh nghiệp đều tạo ra một lượng lớn dữ liệu từ nhiều nguồn khác nhau. Cho dù đó là từ chính các hệ thống của doanh nghiệp, từ mạng xã hội hoặc các nguồn trực tuyến khác, từ điện thoại thông minh và các thiết bị máy khách / máy tính cạnh khác, hoặc từ các cảm biến và công cụ bao gồm Internet of Things, dữ liệu này cực kỳ có giá trị đối với các tổ chức có sẵn công cụ để tận dụng nó. Hộp công cụ tổng thể cho các công cụ này được gọi là phân tích dữ liệu.
Phân tích dữ liệu là một thuật ngữ rộng đề cập đến việc sử dụng các kỹ thuật khác nhau để tìm ra các mẫu có ý nghĩa trong dữ liệu. Đó là một quá trình mà dữ liệu được chuyển đổi thành cái nhìn sâu sắc và tầm nhìn xa. Các công cụ phân tích dữ liệu cho phép chúng tôi mô tả những gì đã xảy ra trong quá khứ, rút ra những hiểu biết sâu sắc về hiện tại và – với một số kỹ thuật – đưa ra dự đoán về tương lai.
Lĩnh vực phân tích dữ liệu không phải là mới. Nó đã được sử dụng trong thế giới kinh doanh trong nhiều thập kỷ. Phân tích dữ liệu có thể đơn giản như sử dụng số liệu thống kê để xác định độ tuổi trung bình hoặc để tóm tắt các đặc điểm nhân khẩu học khác về khách hàng. Biểu đồ hồi quy tuyến tính trong bảng tính Excel có thể làm sáng tỏ xu hướng bán hàng. Tuy nhiên, dù lâu đời, lĩnh vực phân tích dữ liệu không bao giờ đứng yên. Nó liên tục phát triển, khi các doanh nghiệp áp dụng các kỹ thuật phân tích tiên tiến hơn, chẳng hạn như các ứng dụng tập trung vào thông tin kinh doanh và phân tích thời gian thực của dữ liệu khi nó truyền vào tổ chức.
Mong muốn tăng cường hiểu biết về quá khứ, hiện tại và tương lai kích thích những tiến bộ không ngừng trong lĩnh vực phân tích dữ liệu. Những tiến bộ này là cần thiết cho những trường hợp mà chúng ta không thể đạt được sự hiểu biết chỉ bằng cách giải quyết các vấn đề đơn giản. Trong thế giới kinh doanh, có rất ít, nếu có, “quy luật tự nhiên” khó và nhanh sẽ cho bạn biết một cách chắc chắn tuyệt đối điều gì sẽ xảy ra. Để đạt được sự hiểu biết ở cấp độ cao hơn này, doanh nghiệp phải nắm bắt và phân tích dữ liệu bằng các kỹ thuật tiên tiến. Và điều này đưa chúng ta đến với khoa học dữ liệu.
Khoa học dữ liệu
Khoa học dữ liệu là tiên tiến của phân tích dữ liệu. Đó là một quá trình kiểm tra, đánh giá và thử nghiệm để tạo ra các kỹ thuật phân tích dữ liệu mới và các cách mới để áp dụng chúng. Như tên của nó, khoa học dữ liệu, cốt lõi của nó, là một thực hành tuân theo các phương pháp điều tra khoa học được thiết lập tốt. Do đó, các nhà khoa học dữ liệu đang thử các thuật toán mới để mang lại cái nhìn sâu sắc và hiểu biết, đồng thời đo lường mức độ hữu ích của các phương pháp đó cũng như độ chính xác của kết quả. Nếu các phương pháp tiếp cận được coi là hữu ích nói chung, chúng sẽ được biết đến rộng rãi hơn và đóng góp vào bộ công cụ phân tích dữ liệu ngày càng phát triển.
Do đó, trong khi mọi doanh nghiệp nên sử dụng phân tích dữ liệu trong hoạt động của mình, nhu cầu về phân tích sẽ tăng lên khi các công ty áp dụng chuyển đổi số . Khi họ thực hiện sự chuyển đổi này, các doanh nghiệp phải liên tục đẩy mạnh khả năng phân tích của họ về phía trước. Một cách để làm điều này là thuê các nhà khoa học dữ liệu. Nền văn hóa dữ liệu doanh nghiệp mạnh mẽ nên bao gồm các nhà khoa học dữ liệu, những người liên tục cố gắng nâng cao năng lực trong khi làm việc để cho phép đội ngũ nhân viên doanh nghiệp lớn hơn sử dụng các công cụ phân tích đã được kiểm chứng.
Kỹ thuật dữ liệu – Data Engineering
Mặc dù nó không thu hút được những chủ đề lớn, nhưng Kỹ thuật dữ liệu – Data Engineering là một yếu tố cần thiết cho phân tích dữ liệu và khoa học dữ liệu. Nói một cách dễ hiểu, Kỹ thuật dữ liệu – Data Engineering làm cho dữ liệu trở nên hữu ích. Nó chuyển đổi dữ liệu có cấu trúc, phi cấu trúc và bán cấu trúc từ các hệ thống và silo khác nhau thành các bộ sưu tập dữ liệu hữu ích, nhất quán mà từ đó các ứng dụng và thuật toán có thể rút ra hiểu biết và giá trị.
Kỹ thuật dữ liệu – Data Engineering bao gồm công việc dọn dẹp bộ dữ liệu – thường là khối lượng công việc lớn khi xử lý nhiều nguồn dữ liệu khác nhau và / hoặc dữ liệu có thiếu giá trị, lỗi và thậm chí là sai lệch. Ví dụ: nếu bạn đang chạy phân tích về doanh số bán nhà gần đây, bạn muốn sửa hoặc xóa bất kỳ hồ sơ nhà nào có giá bán bằng không. Dữ liệu giá sai đó sẽ làm sai lệch kết quả của bạn khi được đưa vào phân tích đơn giản, chẳng hạn như giá nhà trung bình, vì vậy, kỹ sư dữ liệu làm việc để xóa dữ liệu đó khỏi tập dữ liệu hoặc (tốt hơn) để sửa nếu có thể. Những lỗi dữ liệu như vậy có thể có tác động ẩn trong các phân tích dữ liệu phức tạp hơn mà kết quả có thể không rõ ràng. Tuy nhiên, chúng có thể để lại hậu quả nặng nề khi sử dụng kết quả.
Mặc dù bạn có thể đã nghe thuật ngữ này thường xuyên hơn trong những năm gần đây, nhưng không có gì mới về Kỹ thuật dữ liệu – Data Engineering . Nó đã tồn tại lâu như dữ liệu kỹ thuật số đã tồn tại với chúng ta. Nhưng ngày nay, nhu cầu Kỹ thuật dữ liệu – Data Engineering ngày càng tăng khi các tổ chức làm việc để hợp nhất, quản lý, định dạng lại và lọc dữ liệu đa dạng từ một loạt các nguồn ngày càng tăng. Quá trình này thường được yêu cầu đối với các ứng dụng phân tích dữ liệu nâng cao, bao gồm Machine Learning và Deep Learning. Các kỹ sư dữ liệu phải loại bỏ dữ liệu xấu, giải quyết các lỗ hổng và đảm bảo rằng dữ liệu không tạo ra sự sai lệch trong kết quả – một chủ đề chúng ta sẽ khám phá trong một bài viết tiếp theo.
Trí tuệ nhân tạo – AI
Trí tuệ nhân tạo – AI đề cập đến các hệ thống máy tính có khả năng suy luận về mọi thứ và đưa ra các phân loại và quyết định mà thông thường cần đến trí thông minh của con người. Các trường hợp sử dụng phổ biến cho AI bao gồm nhận dạng và phân loại hình ảnh, nhận dạng giọng nói và dịch ngôn ngữ.
Mặc dù bạn có thể nghe mọi người nói về AI như thể nó còn mới, nhưng nó thực sự đã tồn tại với chúng ta từ những năm 1950. Kể từ khi máy tính ra đời, mọi người đã có quan niệm rằng máy móc có thể được lập trình để suy nghĩ theo cách con người nghĩ.
Đã có những cách tiếp cận khác nhau đối với AI – để làm cho máy tính hoạt động tốt hoặc tốt hơn con người – trong những năm qua. Một cách tiếp cận đã đạt được một số thành công cách đây vài thập kỷ là các hệ thống chuyên gia. Các hệ thống này tuân theo các bộ quy tắc do con người tạo ra, được lập trình trước để thực hiện các nhiệm vụ độc lập với con người. Ví dụ: chúng tôi có tất cả các hệ thống chuyên gia có kinh nghiệm ở dạng hệ thống phản hồi tự động, chẳng hạn như những hệ thống mà chúng tôi có khả năng tương tác khi chúng tôi gọi đến bàn dịch vụ khách hàng và cần phải lướt qua các tùy chọn menu bằng cách nhấn nút. (Nhiều trong số này hiện đang được phát triển lại bằng cách sử dụng xử lý ngôn ngữ tự nhiên – dựa trên Deep Learning, được mô tả bên dưới – để linh hoạt và hiệu quả hơn, đồng thời ít gây khó chịu hơn khi quá trình xử lý ngôn ngữ tự nhiên trở nên tốt hơn theo thời gian.)
Gần đây hơn, một phương pháp được gọi là Machine Learning đã trở thành một phương pháp hiện thực hóa AI được ưa chuộng. Thậm chí gần đây, một tập hợp con của Machine Learning được gọi là Deep Learning đã được chứng minh là cực kỳ hiệu quả trong một số loại vấn đề và khối lượng công việc nhất định – khi có đủ dữ liệu để đào tạo các mô hình (phần “học”). Do đó, ở cấp độ rộng hơn, AI bao gồm nhiều cách tiếp cận, trong đó Machine Learning và Deep Learning là hai cách tiếp cận giúp các ứng dụng hỗ trợ AI ngày nay trở nên khả thi.
Hình 1. Trí tuệ nhân tạo – AI là một khái niệm bao quát. Phương pháp tiếp cận máy học hiện đang là phương pháp tiếp cận AI được sử dụng nhiều nhất và thành công nhất trong các ứng dụng doanh nghiệp và người tiêu dùng. Deep Learning là một tập hợp con của Machine Learning đặc biệt mạnh mẽ đối với một số khối lượng công việc nhất định như nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên, phân tích cảm xúc và các mục đích sử dụng khác khi có đủ dữ liệu chất lượng cao để đào tạo các mô hình đạt độ chính xác cao.
Machine Learning và Deep Learning
Machine Learning là một lĩnh vực phụ của AI cung cấp cho các hệ thống khả năng học hỏi từ dữ liệu và cải thiện theo thời gian mà không cần được lập trình rõ ràng. Các thuật toán Machine Learning sử dụng dữ liệu để tạo và tinh chỉnh các quy tắc. Sau đó, máy tính quyết định cách phản hồi dựa trên những gì nó đã học được từ dữ liệu. Chìa khóa ở đây là bạn đang để dữ liệu hướng dẫn việc phát triển các quy tắc.
Các kỹ thuật Machine Learning có thể sử dụng các kiểu dữ liệu đa dạng, bao gồm dữ liệu phi cấu trúc hoặc bán cấu trúc, để giúp thu được sự hiểu biết dẫn đến các hành động và quyết định do hệ thống tạo ra.
Hãy xem xét một ví dụ đơn giản có chủ ý. Với công nghệ máy học cổ điển, bạn có thể cung cấp cho hệ thống một tập hợp các đặc điểm chung của mèo trong ảnh chụp một số loại động vật. Sau đó, bạn có thể để hệ thống sắp xếp thông qua cơ sở dữ liệu chứa đầy ảnh động vật và tìm tổ hợp các tính năng do con người cung cấp xác định tất cả các con mèo trong hỗn hợp. Trong quá trình này, hệ thống Machine Learning ngày càng trở nên tốt hơn khi nó học hỏi từ kinh nghiệm của mình với dữ liệu.
Deep Learning là một loại Machine Learning được xây dựng trên một hệ thống phân cấp sâu của các lớp “mạng nơ-ron” được kết nối với nhau, với khả năng học các “tính năng” chính từ dữ liệu được cung cấp cho hệ thống. Kỹ thuật Deep Learning lấy một lượng lớn dữ liệu và xác định các quy tắc và tính năng phổ biến liên quan đến dữ liệu. Như với Machine Learning cổ điển, dữ liệu hướng dẫn việc đào tạo mô hình Deep Learning.
Hãy mở rộng ví dụ về con mèo của chúng tôi. Nếu bạn cung cấp cho hệ thống Deep Learning đủ hình ảnh về mèo, thì hệ thống này có thể – tự nó – xác định các đặc điểm khiến mèo trở thành mèo, chẳng hạn như các đặc điểm liên quan đến mắt, tai, râu và đuôi. Khả năng học hỏi này vượt xa khả năng Machine Learning cổ điển, vì trong trường hợp này, bạn không cần phải cho hệ thống biết những tính năng cần tìm. Nó tự tìm ra điều đó.
Vì sao điều này lại quan trọng?
Tất cả chúng ta đều được hưởng lợi theo vô số cách từ AI, vốn hiện hầu như ở khắp mọi nơi trong cuộc sống của chúng ta. Hôm nay bạn đã sử dụng Google để tìm kiếm trên Internet chưa? Bạn đã được hưởng lợi từ AI. Gần đây bạn có sử dụng thẻ tín dụng không? Bạn đã được hưởng lợi từ các chương trình AI xác thực danh tính người dùng và ngăn chặn các giao dịch gian lận tiềm ẩn. Bạn đã gặp các cửa hàng trực tuyến đưa ra các đề xuất được cá nhân hóa dựa trên các sản phẩm bạn đang xem chưa? Đó là AI tại nơi làm việc.
Như chúng tôi đã đề cập, AI thay đổi các quy tắc cơ bản để ra quyết định trong doanh nghiệp. Ví dụ, kỹ thuật Machine Learning và Deep Learning cho phép các giám đốc điều hành thu thập dữ liệu từ nhiều nguồn – chẳng hạn như các trang web truyền thông xã hội, hệ thống thông tin khách hàng và trang web thương mại điện tử – để đưa ra dự đoán tốt hơn về các sản phẩm có khả năng bán trong tương lai và những người có khả năng mua chúng. Những người ra quyết định sau đó có thể điều chỉnh các chiến lược phát triển sản phẩm và bán hàng và tiếp thị của họ cho phù hợp.
Điều quan trọng cần nhấn mạnh là AI không còn là một ứng dụng thích hợp. Trong một loạt các ngành, các doanh nghiệp đang đưa AI vào hoạt động để xây dựng mối quan hệ khách hàng mạnh mẽ hơn, đưa ra các quyết định kinh doanh thông minh hơn, cải thiện hiệu quả của các quy trình và đưa các sản phẩm và dịch vụ tốt hơn ra thị trường, một số trong số đó có thể bao gồm AI. Các trường hợp sử dụng cho AI hầu như không giới hạn, trải dài từ các dịch vụ chăm sóc sức khỏe và tài chính đến sản xuất và quốc phòng. Nếu bạn có một lượng lớn dữ liệu, AI có thể giúp bạn tìm và hiểu các mẫu trong đó.