Apple
Vào năm 2011, khi Apple ra mắt lần đầu trợ lý ảo Siri, công ty đã
tiến bước vào mảng mới là trợ lý ảo kích hoạt giọng nói.
Việc thâm nhập muộn trong cuộc đua loa thông minh với HomePod đã
khiến Apple vất vả cạnh tranh giành thị phần đã được củng cố của cả Google
và Amazon.
Các nhà phân tích ngành chỉ ra một vài lỗi lớn của
HomePod so với đối thủ, lớn nhất đó là nó không cơ động như
Alexa hoặc “thông minh” như hệ thống AI của Google.
Với những người dùng Apple, điều đó không thành vấn đề. Tuy
nhiên, với những người không ở trong hệ sinh thái Apple tạo ra thì
thật khó để tận dụng hết các sản phẩm của hãng.
Một lĩnh vực mà HomePod tỏ ra vượt trội đó là tính riêng
tư và bảo mật với việc mua lại Silk Labs vào năm 2018 (công ty phát
triển phần mềm hệ điều hành AI trên thiết bị giúp loại bỏ nhu cầu
xử lý trên đám mây).
Làm cho giọng nói hoạt động ngay cả khi không có kết
nối mạng
Bảo mật và quyền riêng tư đang trở thành thứ quan trọng nhất đối
với người dùng sản phẩm có tích hợp giọng nói. Apple đã
nộp hai bằng sáng chế gần đây, tập trung vào giọng nói và
bảo mật.
Cái đầu tiên, trợ lý cá nhân offline giúp kích
hoạt Siri thông qua giọng nói ngay cả khi không kết nối mạng. Với
HomePod, các hội thoại giọng nói không được thu lại bởi phần lớn
các hành động không được truyền lên môi trường điện toán
đám mây mà thông qua thiết bị.
Tại đây, Apple đã áp dụng phương pháp khác so với đối thủ
chính là Google, Amazon, vốn lưu trữ những trao đổi này trên
máy chủ công ty sử dụng điện toán đám mây. Điều này
tạo ra quan ngại về tính bảo mật, người dùng muốn biết dữ liệu nào
được thu và lưu trữ lại.
Apple đang xây dựng phương pháp sử dụng kích hoạt giọng nói
ngay trong thiết bị.
Bằng sáng chế này tạo ra một hệ thống Giọng nói tới Văn bản (Speech-to
Text) hoạt động trên thiết bị người dùng mà không ở trên
máy chủ của Apple. Thiết bị này có thể thực hiện yêu cầu dựa
trên các tác vụ được xác định trước lưu trữ trong hệ điều hành.
Người dùng có thể sử dụng Siri cả trực tuyến và ngoại tuyến.
Một bằng sáng chế liên quan cũng tập trung vào tính bảo mật
và được cấp gần đây với tên gọi là “voice prints.”
Việc này sẽ giúp Siri xác định và phân biệt giữa nhiều
người dùng khác nhau thông qua xác thực giọng nói.
Hợp tác với Salesforce
Căn nhà không phải là nơi duy nhất Apple muốn người dùng sử
dụng giọng nói hoàn thành công việc. Gã khổng lồ công
nghệ này đang hợp tác với Salesforce để đưa công nghệ giọng nói
của Apple vào các ứng dụng. Người dùng sẽ dùng Siri cho các
cập nhật và yêu cầu thay vì phải chuyển giữa các hệ thống với
nhau để sử dụng.
Salesforce là một trong những công ty nổi tiếng nhất đưa ra công
cụ bán hàng, tiếp thị cho khối doanh nghiệp. Công ty cũng có
một đội ngũ các nhà phát triển phần mềm bên thứ ba có thể
xử lý phần công nghệ back-end và tìm cách mới và tốt
hơn tích hợp với iPhone và iPad của Apple.
Giám đốc điều hành Apple Tim Cook chia sẻ với Reuters về hợp tác
này: ”Nếu bạn nhìn tổng thể vào doanh nghiệp, giọng nói
vẫn được dùng nhiều như khối khách hàng đại chúng. Chúng
tôi đang thay đổi cách con người làm việc và đây là
trọng tâm Apple hướng tới — thay đổi để tốt hơn.”
Microsoft
Mặc dù Microsoft hiện diện tương đối sớm trong cuộc đua loa thông minh
với Cortana nhưng phải chật vật cạnh tranh với Google và Amazon. Có vẻ
rằng Microsoft đã chuyển hướng không cạnh tranh trực tiếp với Google và
Amazon nữa, thay vào đó hướng tới hợp tác tích hợp với Amazon.
Hiện giờ, người dùng Windows 10 và Alexa đều có thể sử dụng tính
năng giữa hai hệ thống. Người dùng Cortana có thể nói chuyện với
Alexa thông qua Windows 10 và người dùng Alexa có thể truy cập
Cortana để đọc email trên Outlook.
Đây là hợp tác chiến lược của hai gã khổng lồ công nghệ,
mỗi hãng đều chiếm lĩnh lãnh địa mà không dễ cho các đối
thủ mới gia nhập thị trường. Microsoft sẽ thu được một lượng khách hàng
tiềm năng mới, những người cho rằng sự tích hợp của Cortana và Alexa là
một lựa chọn giúp cải thiện năng suất xuất sắc, đặc biệt tại khối công
sở mà các skill của Alexa được dùng cho các tác vụ đơn
giản. Những người dùng khối doanh nghiệp đang kỳ vọng Cortana của Microsoft
đóng vai trò mang giọng nói vào doanh nghiệp trong một vài
năm tới.
Microsoft gần mua lại Semantic Machines, một công ty phát triển AI hội
thoại, cho thấy việc hợp tác với Alexa là quan trọng như thế nào
trong việc giới thiệu bộ sản phẩm nâng cao năng suất lao động có kích
hoạt giọng nói.
Các sáng chế
Gần đây, Microsoft được cấp một bằng sáng chế được gọi là “đầu
vào giọng nói yên lặng.” Nó cho phép người
dùng kích hoạt các lệnh giọng nói khi thì thầm, giúp
nhận ra giọng nơi công cộng.
Gần đây, hầu hết người dùng sử dụng giọng nói chủ yếu trong nhà
hoặc xe ô tô và họ thường tránh ra lệnh bằng giọng nói
nơi công cộng.
Công nghệ này sẽ có mặt trong một vài thiết bị, từ điện thoại
thông minh cho tới đồng hồ thông minh và các thiết bị điều khiển
từ xa. Thiết kế của bằng sáng chế này tạo cảm giác điệp vụ James
Bond đang thì thầm vào trong đồng hồ thông minh.
Các cách tiếp cận mới đối với công nghệ giọng nói sinh trắc
học là lĩnh vực Microsoft đặc biệt quan tâm. Công ty gần đây
đã nhận ID R&D, một công ty sinh trắc học giọng nói vào
chương trình IoT& AI Insider Labs.
Facebook
Mặc dù Facebook có tham vọng về mảng giọng nói nhưng công ty
gia nhập thị trường rất muộn. Việc trì hoãn này đánh đổi trực
tiếp vào thị phần của công ty.
Hầu hết những bước đi của Facebook trong mảng này là qua tin đồn công
ty đang phát triển lập trình mảng giọng nói, giúp người dùng
sử dụng nhận diện giọng nói trên Facebook và Facebook Messenger.
Một vài bước đi gần đây của công ty cho thấy công ty đang tập
trung vào công nghệ chatbot. Facebok đã mua lại wit.ai, công
cụ giúp bổ sung giao diện giọng nói vào ứng dụng và công
bố tích hợp NLP vào ứng dụng messenger. Hai sự kiện này cho thấy
Facebook trông đợi vào tiềm năng của hội thoại AI trong chatbot tương
lai.
Portal
Vào cuối năm 2018, Facebook đã giới thiệu Portal, sản phẩm đánh dấu
sự gia nhập của hãng vào thị trường loa thông minh. Facebook muốn
tiến thêm một bước khỏi lĩnh vực giọng nói bằng cách giới thiệu thiết
bị video dựa trên AI và một camera thông mình của thể giao tiếp
được. Facebook cũng hợp tác với Amazon.
Portal tích hợp với Alexa thông qua giọng nói, cho người dùng
tiếp cận các skill của Alexa. Điều này khá ngạc nhiên với nhiều
người bởi nếu Facebook dựa trên Alexa mà không phải là hệ thống
voice của riêng mình thì công ty sẽ không thể thu thập
dữ liệu người dùng.
Đương nghiên, vấn đề chính Facebook cần khắc phục đó là nỗi
lo về quyền riêng tư. Năm ngoái, công ty đã bị chỉ trích
dữ dội về quyền riêng tư. Cho tới nay doanh số bán Portal vẫn rất thấp.
Facebook gần đây nâng cấp hệ thống với một vài sửa đổi, đặc biệt
xung quanh lúc camera được kích hoạt, dựa trên các đánh
giá của người dùng.
Giọng nói tại thị trường Trung Quốc
Tăng trưởng loa thông minh và giọng nói không chỉ giới hạn ở
các công ty công nghệ hàng đầu tại thị trường Hoa Kỳ. Tại khu
vực Châu Á Thái Bình Dương, Trung Quốc, chúng ta đang chứng
kiến sự gia tăng lớn doanh số loa thông minh và thiết bị nhà thông
minh vẫn chưa có dấu hiệu dừng lại
Không chỉ các công ty Hoa Kỳ mà các công ty Trung
Quốc như Alibaba, Xiao Mi đóng góp vào tăng trưởng chung tại Trung
Quốc khi hai công ty này chiếm tới 94% doanh số bán loa thông
minh tại Trung Quốc trong quý đầu năm 2018.
Trong những năm gần đây, cả Alibaba và Xiaomi đều giảm giá đáng
kể để thu hút khách hàng đến với sản phẩm của họ và làm
giảm tăng trưởng của Google và Amazon trên khu vực.
Một công ty khác là Baidu. Hiện tại, công ty là công
cụ tìm kiếm lớn nhất ở Trung Quốc. Giống như Google, họ đang sử dụng phương
pháp tiếp cận trợ lý tìm kiếm cho các hệ thống AI và giọng
nói của mình so với các phương thức kiểu Amazon trong thương mại
điện tử của Alibaba. Hệ thống DuerOS của nó được cài trong loa thông
minh cũng như hơn 100 thiết bị thông minh được hỗ trợ bởi hơn 16.000 Nhà
phát triển skill.
Có những tiến triển khác cần lưu ý và có khả năng thâm
nhập thị trường loa thông minh ở Trung Quốc. Đầu tiên, Apple đã công
bố HomePod tại Trung Quốc vào tháng 1 năm 2019. Khác với Google Assistant
và Alexa, HomePod hỗ trợ cả tiếng phổ thông và tiếng Quảng Đông,
hai ngôn ngữ phổ biến nhất ở Trung Quốc. Mặc dù điều đó mang lại
cho Apple cơ hội thâm nhập thị trường, yếu tố cạnh tranh chính có
thể sẽ dựa trên giá cả. HomePod tại Trung Quốc sẽ có giá cao
hơn đáng kể so với các sản phẩm loa thông minh từ Alibaba và
Baidu.
Huawei là một công ty Trung Quốc khác có công nghệ loa
và giọng nói thông minh, và bây giờ công ty đang tìm
cách mở rộng ra bên ngoài thị trường Trung Quốc. Trong khi hệ thống
Xiaoyi của nó là đối tác hiện tại với cả Amazon và Google, Richard
Yu, CEO khối khách hàng tiêu dùng Huawei, đã nói với
CNBC về kế hoạch phát triển công nghệ AI của mình cho các thị
trường khác.
“Ban đầu, chúng tôi chủ yếu sử dụng Google Assistant và Amazon
Alexa. Chúng tôi cần thêm thời gian để xây dựng các dịch
vụ AI của mình… Sau đó, chúng tôi sẽ mở rộng dịch vụ này
ra bên ngoài Trung Quốc.”
Nếu việc mở rộng đó diễn ra, Huawei sẽ cạnh tranh trực tiếp với Google, Apple
và Amazon. Và đó là điều mà các thương hiệu công
nghệ lớn khác của Trung Quốc sẽ theo dõi sát sao khi giọng nói
chiếm lĩnh khu vực này.
David Mercer, Phó Chủ tịch Strategy Analytics khẳng định thị trường loa thông
minh sẽ tăng trưởng mạnh mẽ chứ không chỉ là một xu hướng nhất thời tại
thời điểm này. Chỉ tính riêng thị trường Mỹ, theo dự báo mới
nhất của eMarketer, số người sử dụng loa thông minh sẽ tăng với tốc độ tăng
trưởng hàng năm (CAGR) 47,9% từ năm 2016 đến năm 2020, từ 16 triệu đến 76,5
triệu loa. Trong tương lai không xa, giọng nói trở thành một phương
thức tương tác công nghệ tiêu chuẩn kết hợp với các phương thức
tương tác hiện nay như bàn phím, chuột và màn hình
cảm ứng. Theo đó, thị trường loa sẽ cạnh tranh khốc liệt hơn và trực tiếp
giữa các công ty công nghệ theo từng ngôn ngữ khác nhau.
Ngoài ra, mua sắm thông qua giọng nói (Voice Commerce) có xu
hướng sẽ phát triển trong tương lai. Theo Amazon, đến năm 2021, 50% những hoạt
động tìm kiếm thông tin sẽ được thực hiện bằng giọng nói.
Việc phân bổ thời gian và nguồn lực đầu tư là bài toán
cốt lõi mà các công ty cần nghiên cứu và giải quyết,
ảnh hưởng trực tiếp đến vị thế trên thị trường của các công ty này.
Xử lý ngôn ngữ tự nhiên, internet vạn vật, trí tuệ nhân
tạo là những công nghệ mà các công ty cần tập trung nghiên
cứu và phát triển để có thể đưa ra một sản phẩm tốt cho người dùng.
Là một thị trường mới và đầy tiềm năng, đối với thị trường loa thông
minh và giọng nói tại Việt Nam, các công ty có khá
nhiều lựa chọn về thị trường ngách tấn công, nhóm đối tượng khách
hàng, tính năng ưu việt của sản phẩm. Nhìn chung, đối với riêng
thị trường Việt, miếng bánh thị phần đang rộng mở cho các công ty
công nghệ, startup tấn công và chiếm lĩnh.