Những quyết định và thông tin trong quá khứ đã mang lại những tiến bộ to lớn trong một khía cạnh thú vị của trí tuệ nhân tạo — Máy học . Kỹ thuật lấy dữ liệu đầu vào và biến chúng thành Tiên Đoán này đã cho phép những gã khổng lồ công nghệ như Amazon, Apple, Facebook và Google cải tiến đáng kể sản phẩm của họ. Chúng cũng đã thúc đẩy các công ty khởi nghiệp tung ra các sản phẩm và nền tảng mới, thậm chí đôi khi là cạnh tranh với Big Tech.
Chúng ta hãy xem xét BenchSci, một công ty có trụ sở tại Toronto đang tìm cách tăng tốc quá trình phát triển thuốc. Họ nhằm mục đích giúp các nhà khoa học tìm thấy kim trong đống cỏ khô dễ dàng hơn — về thông tin quan trọng nhất được nhúng trong cơ sở dữ liệu nội bộ của các công ty dược phẩm và trong vô số nghiên cứu khoa học được công bố rộng rãi. Để đưa một ứng cử viên thuốc mới vào thử nghiệm lâm sàng, các nhà khoa học phải chạy các thí nghiệm tốn kém và mất thời gian. BenchSci nhận ra rằng các nhà khoa học có thể tiến hành ít hơn những điều này — và đạt được thành công lớn hơn — nếu họ áp dụng những hiểu biết sâu sắc hơn từ số lượng lớn các thử nghiệm đã được thực hiện.
Thật vậy, BenchSci phát hiện ra rằng nếu các nhà khoa học tận dụng công nghệ Machine Learning để đọc, phân loại và sau đó trình bày những hiểu biết sâu sắc từ nghiên cứu khoa học, họ có thể giảm một nửa số thử nghiệm cần thiết để đưa một loại thuốc vào thử nghiệm lâm sàng. Cụ thể hơn, họ có thể sử dụng công nghệ để tìm ra thuốc thử sinh học phù hợp — những chất cần thiết để ảnh hưởng và đo lường sự phát triển của protein. Việc xác định những chất đó bằng cách xem qua các tài liệu đã xuất bản thay vì khám phá lại chúng từ đầu giúp cắt giảm đáng kể thời gian cần thiết để sản xuất các chế phẩm thuốc mới. Điều đó cộng thêm khoản tiết kiệm tiềm năng hơn 17 tỷ đô la hàng năm, trong một ngành công nghiệp mà lợi nhuận cho R&D đã trở nên mỏng như dao cạo, có thể biến đổi thị trường. Ngoài ra, nhiều người có thể được cứu sống bằng cách đưa các loại thuốc mới ra thị trường nhanh hơn.
Điều đáng chú ý ở đây là BenchSci, trong chính lĩnh vực chuyên biệt của họ, họ đang làm điều gì đó tương tự như những gì Google đã và đang làm cho toàn bộ internet: sử dụng Machine Learning để dẫn đầu trong tìm kiếm.Cũng như Google có thể giúp bạn tìm ra cách để sửa chữa máy rửa bát của bạn và giúp bạn tiết kiệm một chuyến đi dài đến thư viện hoặc một dịch vụ sửa chữa tốn kém,
BenchSci giúp các nhà khoa học xác định một loại thuốc thử phù hợp mà không phải chịu khó khăn hoặc chi phí nghiên cứu và thử nghiệm quá mức. Trước đây, các nhà khoa học thường sử dụng Google hoặc PubMed để tìm kiếm tài liệu (một quá trình mất nhiều ngày), sau đó đọc tài liệu (lại mất vài ngày), sau đó đặt hàng và thử nghiệm từ ba đến sáu loại thuốc thử trước khi chọn một loại (trong khoảng thời gian vài tuần). Giờ đây, họ tìm kiếm BenchSci trong vài phút, sau đó đặt hàng và thử nghiệm từ một đến ba loại thuốc thử trước khi chọn một loại thuốc thử mới (tiến hành ít thử nghiệm hơn trong vòng ít tuần).
Nhiều công ty đã và đang làm việc với AI và nhận thức được các bước thực tế để tích hợp họ vào hoạt động của họ và tận dụng sức mạnh của AI. Nhưng khi mức độ thông thạo đó tăng lên, các công ty sẽ cần phải xem xét vấn đề :
Làm cách nào để bạn tận dụng công nghệ Machine Learning để tạo ra một chiến hào có thể bảo vệ được xung quanh doanh nghiệp — để tạo ra thứ gì đó mà các đối thủ cạnh tranh không thể dễ dàng bắt chước ? Ví dụ: trong trường hợp của BenchSci, liệu thành công ban đầu của họ có thu hút được sự cạnh tranh từ Google không và nếu vậy, làm cách nào để BenchSci giữ được vị trí dẫn đầu?
Thực hiện Tiên Đoán với AI
Các doanh nghiệp sử dụng công nghệ Machine Learning để nhận ra các mẫu và sau đó đưa ra Tiên Đoán — về những gì sẽ thu hút khách hàng, cải thiện hoạt động hoặc giúp cải tiến sản phẩm. Tuy nhiên, trước khi có thể xây dựng một chiến lược xoay quanh những Tiên Đoán như vậy, bạn phải hiểu các yếu tố đầu vào cần thiết cho quá trình Tiên Đoán , những thách thức liên quan đến việc nhận được những đầu vào đó và vai trò của phản hồi trong việc cho phép thuật toán đưa ra Tiên Đoán tốt hơn theo thời gian.
Tiên Đoán trong ngữ cảnh Machine Learning , là một kết quả thông tin xuất phát từ việc nhập một số dữ liệu và chạy một thuật toán. Ví dụ: khi ứng dụng điều hướng trên thiết bị di động của bạn đưa ra Tiên Đoán về tuyến đường tốt nhất giữa hai điểm, ứng dụng này sẽ sử dụng dữ liệu đầu vào về điều kiện giao thông, giới hạn tốc độ, kích thước đường và các yếu tố khác. Sau đó, một thuật toán được sử dụng để Tiên Đoán con đường nhanh nhất để đi và thời gian sẽ mất.
Thách thức chính đối với bất kỳ quy trình Tiên Đoán nào là dữ liệu đào tạo (training data) — những đầu vào bạn cần để bắt đầu đạt được kết quả hợp lý — phải được tạo ra (bằng cách thuê chuyên gia phân loại mọi thứ) hoặc mua từ các nguồn hiện có (ví dụ, hồ sơ sức khỏe ). Một số loại dữ liệu có thể dễ dàng lấy từ các nguồn công cộng (hãy nghĩ đến thông tin thời tiết và bản đồ). Người tiêu dùng cũng có thể sẵn sàng cung cấp dữ liệu cá nhân nếu họ nhận thấy lợi ích từ việc làm đó. Ví dụ, người dùng Fitbit và Apple Watch cho phép các công ty thu thập các số liệu về mức độ tập thể dục, lượng calo của họ, v.v. thông qua các thiết bị mà người dùng đeo để quản lý sức khỏe và thể chất của họ.
Tạo ra nguồn thông tin để Tiên Đoán có thể sẽ rất khó khăn, nếu họ đòi hỏi sự hợp tác của một số lượng lớn các cá nhân không trực tiếp hưởng lợi từ việc cung cấp họ . Ví dụ: một ứng dụng điều hướng có thể thu thập dữ liệu về tình trạng giao thông bằng cách theo dõi người dùng và nhận báo cáo từ họ. Điều này cho phép ứng dụng xác định các vị trí có thể xảy ra tắc đường và cảnh báo những người lái xe khác đang đi về phía họ. Nhưng những người lái xe đã vướng vào những lùm xùm nhận được ít phần thưởng trực tiếp từ việc tham gia và họ có thể gặp rắc rối bởi ý tưởng rằng ứng dụng biết họ đang ở đâu bất cứ lúc nào (và có khả năng ghi lại chuyển động của họ). Nếu những người bị tắc đường từ chối chia sẻ dữ liệu của họ hoặc thực sự tắt bộ định vị địa lý của họ, khả năng cảnh báo người dùng về các vấn đề giao thông của ứng dụng sẽ bị xâm phạm.
Một thách thức khác có thể là nhu cầu cập nhật dữ liệu đào tạo (training data) theo định kỳ. Đây không phải lúc nào cũng là một vấn đề; họ sẽ không áp dụng nếu ngữ cảnh cơ bản trong đó Tiên Đoán được đưa ra không đổi. X quang, chẳng hạn, phân tích tâm sinh lý của con người, họ i chung là nhất quán từ người này sang người khác và theo thời gian. Do đó, sau một thời điểm nhất định, giá trị biên của một bản ghi phụ trong cơ sở dữ liệu huấn luyện gần như bằng không. Tuy nhiên, trong các trường hợp khác, các thuật toán có thể cần được cập nhật thường xuyên với dữ liệu hoàn toàn mới phản ánh những thay đổi trong môi trường cơ bản. Ví dụ: với các ứng dụng điều hướng, các con đường mới hoặc vòng xuyến giao thông, các đường phố được đổi tên và những thay đổi tương tự sẽ khiến các Tiên Đoán của ứng dụng kém chính xác hơn theo thời gian trừ khi các bản đồ tạo thành một phần của dữ liệu đào tạo (training data) ban đầu được cập nhật.
Trong nhiều tình huống, các thuật toán có thể được cải tiến liên tục thông qua việc sử dụng dữ liệu phản hồi, thu được bằng cách ánh xạ các kết quả thực tế với dữ liệu đầu vào tạo ra các Tiên Đoán về các kết quả đó. Công cụ này đặc biệt hữu ích trong các tình huống có thể có sự thay đổi có thể xảy ra trong các ranh giới được xác định rõ ràng.
Ví dụ: khi điện thoại của bạn sử dụng hình ảnh của bạn để bảo mật, ban đầu bạn sẽ được huấn luyện để điện thoại nhận ra bạn. Nhưng khuôn mặt của bạn có thể thay đổi đáng kể. Bạn có thể có hoặc không được đeo kính. Bạn có thể đã để một kiểu tóc mới, trang điểm hoặc tăng hoặc giảm cân. Do đó, Tiên Đoán rằng bạn là bạn có thể trở nên kém tin cậy hơn nếu điện thoại chỉ dựa vào dữ liệu đào tạo (training data) ban đầu. Nhưng điều thực sự xảy ra là điện thoại cập nhật thuật toán của họ bằng cách sử dụng tất cả các hình ảnh bạn cung cấp mỗi khi bạn mở khóa.
Việc tạo ra các loại vòng phản hồi này không hề đơn giản trong các bối cảnh động và nơi phản hồi không thể được dễ dàng phân loại và tìm nguồn gốc. Ví dụ: dữ liệu phản hồi cho ứng dụng nhận dạng khuôn mặt trên điện thoại thông minh chỉ tạo ra các Tiên Đoán tốt hơn nếu người duy nhất nhập dữ liệu khuôn mặt là chủ sở hữu điện thoại. Nếu những người khác trông giống nhau đến mức có thể sử dụng điện thoại và tiếp tục sử dụng, thì Tiên Đoán của điện thoại rằng người dùng là chủ sở hữu sẽ trở nên không đáng tin cậy.
Việc đưa các yếu tố thành kiến cá nhân vào Máy học cũng có thể rất nguy hiểm, đặc biệt nếu có nhiều yếu tố tác động. Giả sử một người cho vay sử dụng một quy trình hỗ trợ AI để đánh giá rủi ro tín dụng của người xin vay, xem xét mức thu nhập, lịch sử việc làm, đặc điểm nhân khẩu học của họ, v.v. Nếu dữ liệu đào tạo (training data) cho thuật toán phân biệt đối xử với một nhóm nhất định — ví dụ, những người da màu — thì vòng lặp phản hồi sẽ duy trì hoặc thậm chí làm nổi bật sự thiên vị đó, khiến ngày càng có nhiều khả năng các ứng viên da màu bị từ chối. Phản hồi hầu như không thể kết hợp một cách an toàn vào một thuật toán mà không có các tham số được xác định cẩn thận và các nguồn đáng tin cậy, không thiên vị.
XÂY DỰNG LỢI THẾ CẠNH TRANH BẰNG SỰ TIÊN ĐOÁN BỞI AI
Theo nhiều cách, xây dựng một doanh nghiệp bền vững trong Máy học cũng giống như xây dựng một doanh nghiệp bền vững trong bất kỳ ngành nào. Bạn phải đưa ra một sản phẩm có thể bán được, tạo ra một vị trí sớm có thể bảo vệ được và khiến mọi người khó hơn
Bạn có đủ dữ liệu để đào tạo không?
Tại thời điểm bắt đầu, một máy Tiên Đoán cần tạo ra các Tiên Đoán đủ tốt để trở nên khả thi về mặt thương mại. Định nghĩa “đủ tốt” có thể được đặt ra theo quy định (ví dụ: một AI để chẩn đoán y tế phải đáp ứng các tiêu chuẩn của chính phủ), khả năng sử dụng (một chatbot phải hoạt động đủ trơn tru để người gọi phản hồi với máy thay vì chờ đợi họ i chuyện với một người trong trung tâm cuộc gọi), hoặc cạnh tranh (một công ty đang tìm cách gia nhập thị trường tìm kiếm trên internet cần một mức độ Tiên Đoán chính xác nhất định để cạnh tranh với Google). Do đó, rào cản gia nhập là lượng thời gian và nỗ lực liên quan đến việc tạo hoặc truy cập đủ dữ liệu đào tạo (training data) để đưa ra các Tiên Đoán đủ tốt.
Rào cản này có thể khó vượt qua. Lấy trường hợp của X quang, trong đó máy Tiên Đoán cần phải đo lường tốt hơn so với con người có kỹ năng cao để đáng tin cậy với cuộc sống của con người. Điều đó cho thấy rằng công ty đầu tiên xây dựng một AI ứng dụng toàn diện cho X quang (một AI có thể đọc bất kỳ hình ảnh được quét nào) lúc đầu sẽ có ít sự cạnh tranh vì cần quá nhiều dữ liệu để thành công. Nhưng lợi thế ban đầu có thể chỉ tồn tại trong thời gian ngắn nếu thị trường đang phát triển nhanh chóng, bởi vì trong một thị trường phát triển nhanh, phần thưởng từ việc tiếp cận dữ liệu đào tạo (training data) có thể sẽ đủ lớn để thu hút nhiều công ty lớn có túi tiền sâu.
Tất nhiên, điều này có nghĩa là các yêu cầu nhập dữ liệu đào tạo (training data) phải phụ thuộc vào tính kinh tế của quy mô, giống như nhiều thứ khác. Các thị trường tăng trưởng cao thu hút các khoản đầu tư và theo thời gian, điều này nâng cao ngưỡng cho những người mới tham gia tiếp theo (và buộc mọi người trong lĩnh vực này phải chi nhiều hơn vào việc phát triển hoặc tiếp thị sản phẩm của họ). Vì vậy, càng nhiều dữ liệu bạn có thể đào tạo máy của mình, thì thời gian chờ 2 giờ đối với bất kỳ ai đến sau bạn càng lớn, điều này đưa chúng ta đến câu hỏi thứ hai.
Các vòng phản hồi của bạn nhanh đến mức nào?
Khi Máy Tiên Đoán khai thác những gì truyền thống là lợi thế của con người chúng học được. Nếu họ có thể kết hợp dữ liệu phản hồi, thì họ có thể học hỏi từ kết quả và cải thiện chất lượng Tiên Đoán .Tuy nhiên, mức độ của lợi thế này phụ thuộc vào thời gian cần thiết để nhận được phản hồi. Với quét X quang, nếu cần khám nghiệm tử thi để đánh giá liệu thuật toán Machine Learning có Tiên Đoán chính xác bệnh ung thư hay không, thì phản hồi sẽ
chậm chạp và mặc dù một công ty có thể đi đầu trong việc thu thập và đọc bản quét, nhưng khả năng của họ sẽ bị hạn chế để học hỏi và do đó duy trì vị trí dẫn đầu.
Ngược lại, nếu dữ liệu phản hồi có thể được tạo nhanh chóng sau khi có được Tiên Đoán , thì khách hàng tiềm năng sớm sẽ chuyển thành một cuộc cạnh tranh bền vững Tuy nhiên, mức độ của lợi thế này phụ thuộc vào thời gian cần thiết để nhận được phản hồi. Với máy quét X quang, nếu yêu cầu khám nghiệm tử thi để đánh giá liệu thuật toán Machine Learning có Tiên Đoán chính xác bệnh ung thư hay không, thì phản hồi sẽ chậm và mặc dù một công ty có thể đi đầu trong việc thu thập và đọc bản quét, nhưng khả năng của họ sẽ bị hạn chế. để học hỏi và do đó duy trì vị trí dẫn đầu. Ngược lại, nếu dữ liệu phản hồi có thể được tạo ra nhanh chóng sau khi có được Tiên Đoán , thì một khách hàng tiềm năng sớm sẽ chuyển thành một lợi thế cạnh tranh bền vững, vì quy mô hiệu quả tối thiểu sẽ sớm nằm ngoài tầm với của ngay cả những công ty lớn nhất.
Khi Microsoft ra mắt công cụ tìm kiếm Bing vào năm 2009, họ đã nhận được sự ủng hộ của công ty. Microsoft đã đầu tư hàng tỷ đô la vào họ . Tuy nhiên, hơn một thập kỷ sau, thị phần của Bing vẫn thấp hơn nhiều so với Google, về cả lượng tìm kiếm và doanh thu quảng cáo. 1 Lý do làm Bing cảm thấy khó bắt kịp là vòng phản hồi. Trong tìm kiếm, thời gian giữa Tiên Đoán (đưa ra một trang có một số liên kết được đề xuất để trả lời một truy vấn) và phản hồi (người dùng nhấp vào một trong các liên kết) là ngắn— thường là vài giây. họ i cách khác, vòng lặp phản hồi nhanh và mạnh mẽ.
Vào thời điểm Bing tham gia thị trường, Google đã vận hành công cụ tìm kiếm dựa trên AI trong một thập kỷ trở lên, giúp hàng triệu người dùng và thực hiện hàng tỷ tìm kiếm hàng ngày. Mỗi khi người dùng thực hiện một truy vấn, Google sẽ cung cấp Tiên Đoán của họ về các liên kết phù hợp nhất và sau đó người dùng chọn các liên kết tốt nhất trong số đó, cho phép Google để cập nhật mô hình Tiên Đoán của họ . Điều đó cho phép học tập liên tục trong điều kiện không gian tìm kiếm không ngừng mở rộng. Với rất nhiều dữ liệu đào tạo (training data) dựa trên rất nhiều người dùng, Google có thể xác định các sự kiện mới và xu hướng mới nhanh hơn Bing có thể. Cuối cùng, vòng lặp phản hồi nhanh, kết hợp với các yếu tố khác — việc Google tiếp tục đầu tư vào các cơ sở xử lý dữ liệu khổng lồ và chi phí thực tế hoặc có thể cảm nhận được đối với khách hàng khi chuyển sang một công cụ khác — có nghĩa là Bing luôn bị gắn thẻ. đã bắt đầu.
Tiên Đoán của bạn tốt đến mức nào?
Sự thành công của bất kỳ sản phẩm nào cuối cùng phụ thuộc vào những gì bạn nhận được cho những gì bạn phải trả. Nếu người tiêu dùng được cung cấp hai sản phẩm tương tự với cùng một mức giá, họ thường sẽ chọn sản phẩm mà họ cho là chất lượng cao. Chất lượng của Tiên Đoán : Như chúng tôi đã lưu ý, thường dễ dàng để đánh giá. Trong lĩnh vực X quang, tìm kiếm, quảng cáo và nhiều bối cảnh khác, các công ty có thể thiết kế AI với một chỉ số rõ ràng, duy nhất về chất lượng: độ chính xác.
Như trong các ngành công nghiệp khác, các sản phẩm chất lượng cao nhất được hưởng lợi từ nhu cầu cao hơn. Tuy nhiên, các sản phẩm dựa trên AI khác với những sản phẩm khác, vì đối với hầu hết các sản phẩm khác, chất lượng tốt hơn sẽ có giá cao hơn và người bán hàng kém chất lượng tồn tại bằng cách sử dụng vật liệu rẻ hơn hoặc quy trình sản xuất ít tốn kém hơn và sau đó tính giá thấp hơn. Chiến lược này không khả thi trong bối cảnh AI. Vì AI dựa trên phần mềm, nên một Tiên Đoán chất lượng thấp sẽ đắt như một Tiên Đoán chất lượng cao, khiến việc định giá chiết khấu trở nên không thực tế. Và nếu Tiên Đoán tốt hơn với cùng 1 mức giá, bạn sẽ không mua Tiên Đoán chất lượng thấp hơn.
Đối với Google, đây là một yếu tố khác giải thích tại sao vị trí dẫn đầu trong tìm kiếm của họ có thể không khả dụng. Tiên Đoán của đối thủ cạnh tranh thường trông khá giống với Tiên Đoán của Google. Nhập từ “thời tiết” vào Google hoặc Bing và kết quả sẽ giống nhau — các dự báo sẽ bật lên đầu tiên. Nhưng nếu bạn nhập một thuật ngữ ít phổ biến hơn, sự khác biệt có thể xuất hiện. Nếu bạn nhập, chẳng hạn như “sự gián đoạn”, trang đầu tiên của Bing thường sẽ hiển thị các định nghĩa từ điển, trong khi Google cung cấp cả định nghĩa và liên kết đến các tài liệu nghiên cứu về chủ đề đổi mới đột phá.
Mặc dù Bing có thể hoạt động tốt như Google đối với một số truy vấn văn bản, nhưng đối với những người khác, họ kém chính xác hơn trong việc Tiên Đoán những gì khách hàng đang tìm kiếm. Và có rất ít nếu có bất kỳ danh mục tìm kiếm nào khác mà Bing được nhiều người coi là vượt trội.
KẾT LUẬN
Tiềm năng của những cỗ máy dự đoán là vô cùng lớn, và không nghi ngờ gì về việc những gã khổng lồ công nghệ đã có bước khởi đầu. Nhưng cần nhớ rằng các dự đoán giống như các sản phẩm được thiết kế chính xác, được điều chỉnh cao cho các mục đích và bối cảnh cụ thể. Nếu bạn có thể phân biệt mục đích và bối cảnh dù chỉ một chút, bạn có thể tạo ra một không gian bảo vệ cho sản phẩm của riêng mình.
Tuy nhiên, chìa khóa thực sự để cạnh tranh thành công với Big Tech trong các ngành công nghiệp được hỗ trợ bởi máy móc thông minh nằm ở một câu hỏi mà chỉ con người mới có thể trả lời: Bạn muốn dự đoán điều gì? Tất nhiên, việc tìm ra câu trả lời không hề đơn giản. Làm như vậy đòi hỏi sự hiểu biết sâu sắc về động lực thị trường và phân tích chu đáo về giá trị tiềm năng của các dự đoán cụ thể và các sản phẩm và dịch vụ mà chúng được đưa vào. Do đó, có lẽ không có gì ngạc nhiên khi nhà đầu tư chính trong Series A2 của BenchSci không phải là một trong nhiều nhà đầu tư công nghệ địa phương của Canada mà là một công ty đầu tư mạo hiểm tập trung vào AI có tên là Gradient Ventures – thuộc sở hữu của Google.
Nguồn : HBR.