Công nghệ giọng nói sẽ thay đổi cuộc sống của bạn như thế nào?
Thế giới tiêu dùng đang được thay đổi, từ cách chúng ta tiếp cận các sản phẩm, dịch vụ, nội dung và giáo dục đến cách chúng ta xây dựng mối quan hệ, với nhau và với thế giới xung quanh, cách chúng ta gắn kết với các thiết bị cung cấp năng lượng mỗi ngày, cách chúng ta sống trong nhà của chúng tôi, và làm thế nào chúng ta khám phá.
Cái gì mà lực lượng đổi mới thay đổi cách chúng ta sống, theo những cách ngày càng nhiều? Công nghệ giọng nói.
Bản thân công nghệ đang thay đổi với tốc độ tăng theo cấp số nhân. Những nỗ lực nghiên cứu và phát triển đầu thế kỷ 20 tại các trung tâm đổi mới như Bell Labs, IBM, Carnegie Mellon và DARPA đã tạo tiền đề cho sự phát triển nhanh chóng của các nền tảng và thiết bị công nghệ giọng nói được hỗ trợ bởi AI trong thập kỷ qua. Những thiết bị này hiện đang ở trong nhà bếp, không gian làm việc và túi của chúng tôi.
Các nhà đổi mới từ các công ty Fortune 500, các công ty khởi nghiệp tiên tiến, các tổ chức học thuật và các tổ chức khu vực công khác đang đẩy các giới hạn của công nghệ giọng nói thông qua việc khám phá các lĩnh vực bao gồm giọng nói và ngôn ngữ, cảm xúc, đa giọng nói và thích ứng bối cảnh. Ngoài ra, ngày càng có nhiều ngành công nghiệp, từ các công ty nhắn tin và chơi game đến các tổ chức tập trung vào giáo dục, công ty sinh trắc học và thực thi pháp luật, đang xin cấp bằng sáng chế liên quan đến công nghệ giọng nói khi họ tìm cách tích hợp nó vào quy trình của mình, loại bỏ ma sát và tạo ra sự tích cực hơn kết quả tiêu dùng.
Image: sparks & honey
Sự đổi mới trong công nghệ giọng nói đang diễn ra trong một nền văn hóa nơi các vấn đề về bảo mật và quyền riêng tư xoay quanh bất kỳ hành động nào mà các cá nhân thực hiện trong thế giới kỹ thuật số. Khi công nghệ trở nên thông minh hơn và trực quan hơn, và được nhúng vào số lượng thiết bị và không gian ngày càng tăng mà chúng ta tương tác hàng ngày, mối quan hệ của chúng ta với nó cũng vậy. Vai trò của nó trong cuộc sống của chúng ta đã thay đổi theo thời gian và sẽ tiếp tục như vậy theo những cách mà chúng ta chỉ có thể tưởng tượng gần đây. Chúng tôi đã thiết lập năm giai đoạn nền tảng của sự phát triển của công nghệ giọng nói trong bối cảnh đó.
Image: Accenture
1. Hướng dẫn
Khi công nghệ giọng nói thời hiện đại bắt đầu hình thành vào cuối những năm 2000, chúng tôi đã tham gia vào giai đoạn mà chúng tôi gọi là giai đoạn hướng dẫn của người hướng dẫn trong sự phát triển của công nghệ này. Đây là loại mối quan hệ mà nhiều người dùng có với thiết bị gia đình hoặc trợ lý kỹ thuật số của họ. Chúng tôi yêu cầu nó chơi một bài hát cụ thể, đặt mua một món đồ cụ thể cho phòng đựng thức ăn, để trả lời câu hỏi đó, chúng tôi chỉ có thể nhớ, và nhiều hơn nữa.
Chúng tôi thấy các thiết bị điều khiển công nghệ bằng giọng nói của mình như một người hầu, cung cấp sự hài lòng ngay lập tức và thỏa mãn sự tò mò của một người. Một nghiên cứu của Acckey đã tiết lộ rằng 52% người tiêu dùng tin tưởng các thiết bị thông minh để mua thực phẩm, trong khi 49% tin tưởng họ mua sắm các mặt hàng khác như quần áo và phụ kiện. Hơn nữa, thị trường dự kiến trị giá 40 tỷ đô la cho các giao dịch mua hàng được điều khiển bằng công nghệ giọng nói ở Anh và Mỹ vào năm 2022 minh họa cho mối quan hệ của người hướng dẫn này sẽ tiếp tục tác động đến thói quen tiêu dùng hàng ngày của chúng tôi.
2. Tương tác
Hiện tại chúng tôi thấy mình đang ở giai đoạn thứ hai của quá trình tiến hóa này, chúng tôi gọi đó là giai đoạn tương tác với nhau. Chúng tôi đang đối xử với các trợ lý giọng nói của mình giống như một người phục vụ – một người có khả năng nhận đơn đặt hàng của chúng tôi, xác định các mẫu trong một đơn đặt hàng và đưa ra các đề xuất làm tăng quá trình ra quyết định của con người. Nó đưa ra khuyến nghị thay vì chỉ nhận đơn đặt hàng. Các nhà lãnh đạo công nghệ như Amazon và Google đang nộp các bằng sáng chế mới được thiết kế để giám sát hiệu quả hơn những gì chúng tôi nói và làm để cung cấp các đề xuất tốt hơn và quảng cáo và cung cấp phù hợp hơn thông qua nền tảng giọng nói của họ. Xu hướng này cho các công cụ đề xuất được cá nhân hóa, dựa trên độ chính xác cao hơn được điều khiển bởi công nghệ giọng nói sẽ chỉ tiếp tục.
3. Dự đoán
Chẳng mấy chốc, chúng ta sẽ bắt đầu thấy AI điều khiển bằng giọng nói ngày càng có khả năng nhận ra nhu cầu mới nổi của bạn trước khi bạn làm điều đó. Nó sẽ chủ động hỏi liệu bạn có muốn nạp thêm sản phẩm sắp cạn kiệt của mình không, phản ánh những thứ như thay đổi thời tiết trong các khuyến nghị, v.v. Chúng tôi đề cập đến điều này như là giai đoạn dự đoán của người Viking trong mối quan hệ của chúng tôi với công nghệ giọng nói.
Một cảnh tương lai từ bộ phim Báo cáo thiểu số xuất hiện trong tâm trí, trong đó một trợ lý cửa hàng ảo xuất hiện trong thời gian thực để đưa ra đề xuất cho Tom Cruise, dựa trên các giao dịch mua trước đây, khi anh đi qua một cửa hàng Gap. Loại kịch bản này đã bắt đầu hình thành. Độ chính xác của nó sẽ nhanh chóng tăng lên và theo đó, người tiêu dùng sẽ nắm lấy nó.
4. Thông cảm
Giai đoạn tiếp theo trong quá trình là khi mọi thứ bắt đầu trở nên nghiêm trọng giữa con người và những người bạn đồng hành với giọng nói AI của họ. Sự lặp lại của công nghệ này hoạt động gần giống như một người chăm sóc, đánh dấu các vấn đề sức khỏe tiềm ẩn dựa trên các sắc thái của một giọng nói, sử dụng nhận dạng cảm xúc và theo dõi sinh trắc học. Giọng nói AI có thể đề nghị một ly nước nếu một người nghe có vẻ khát nước, hoặc một khoảnh khắc zen nếu một âm thanh căng thẳng. Amazon, ví dụ, gần đây đã nộp một bằng sáng chế liên quan đến việc phát hiện sự khỏe mạnh về thể chất và tinh thần dựa trên các tương tác công nghệ giọng nói.
Chúng tôi cũng tin tưởng các thiết bị này với việc giúp chăm sóc con cái của chúng tôi. Các nghiên cứu về Accergy cho thấy 39% người tiêu dùng tin tưởng các thiết bị thông minh để giám sát trẻ sơ sinh và trẻ em và điều chỉnh môi trường xung quanh dựa trên sự thoải mái hoặc an ninh. Ngoài ra còn có ý nghĩa cho việc chăm sóc các đoàn hệ cũ. Hai tỷ người trên toàn cầu sẽ ở độ tuổi trên 60 vào năm 2050 và với sự thay đổi nhân khẩu học lớn này sẽ xuất hiện những yêu cầu ngày càng tăng mà những người chăm sóc con người có thể không thể đáp ứng một mình. Công nghệ giọng nói có thể sẽ đóng một vai trò gia tăng trong việc chăm sóc dân số già thế giới.
5. Liên quan
Cuối cùng, chúng ta sẽ đạt đến giai đoạn mối quan hệ đầy đủ của mối quan hệ tình cảm. Những bộ phim như Her và Blade Runner 2049 cho thấy những kiểu tương tác sâu sắc, đầy cảm xúc mà cuối cùng chúng ta có thể có với công nghệ AI dẫn đầu bằng giọng nói. Chúng ta sẽ thấy AI bằng giọng nói như một người bạn hoặc thậm chí là một đối tác và chúng ta sẽ chia sẻ cảm xúc của mình với nó.
Đối với một số người, một người bạn đồng hành AI bằng giọng nói sẽ là một kết nối bổ sung cho các mối quan hệ con người của họ, trong khi đối với những người khác, AI bằng giọng nói có thể trở thành mối quan hệ chính và chủ yếu của họ. Trong nghiên cứu của Cigna, gần một nửa số người Mỹ báo cáo đã trải qua cảm giác cô đơn. Xu hướng này rõ rệt nhất trong số các thế hệ trẻ – Gen Z và millennials. Với dịch bệnh cô đơn toàn cầu đang gia tăng, ngày càng có nhiều cơ hội để AI lên tiếng lấp đầy khoảng trống này và cung cấp sự đồng hành cho những người thiếu nó.
Ngày nay, tình hình, nơi mối quan hệ giữa tiếng nói và người tiêu dùng phần lớn là giao dịch, hầu như không làm trầy xước bề mặt của khả năng. Tất cả điều này sẽ thay đổi sớm hơn chúng ta nghĩ. Công nghệ giọng nói có khả năng chạm đến nhiều chiều của người tiêu dùng Cuộc sống hàng ngày – và rõ ràng, bởi vì nó có thể dễ dàng giải quyết các nhu cầu của người tiêu dùng lâu dài và tiềm ẩn với trải nghiệm rất con người. Mặc dù chúng ta có thể thấy một vị trí rất tích cực cho công nghệ này để nâng cao sức khỏe của người tiêu dùng, nhưng cũng có những tác động cực kỳ thực tế và nghiêm trọng đối với quyền riêng tư của người tiêu dùng mà chính phủ, tổ chức nghiên cứu, nhà phát triển công nghệ và người chơi trong ngành sẽ cần phải hợp tác để giải quyết.
Dịch từ https://www.weforum.org/agenda/2019/06/how-voice-technology-will-change-your-life/