Công ty khởi nghiệp ElevenLabs đang phát triển các công cụ AI hỗ trợ tạo và chỉnh sửa giọng nói tổng hợp, hôm nay thông báo rằng họ đã đóng vòng Series B và đạt giá trị 80 triệu đô la do các nhà đầu tư nổi tiếng bao gồm Andreessen Horowitz, cựu Giám đốc điều hành GitHub – Nat Friedman và doanh nhân Daniel Gross đồng dẫn đầu…
Vòng này cũng có sự tham gia của Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital và Credo Ventures, nâng tổng số tiền huy động được của ElevenLabs lên 101 triệu USD và định giá công ty ở mức hơn 1 tỷ USD (tăng từ ~ 100 triệu USD vào tháng 6 năm ngoái ). Giám đốc điều hành Mati Staniszewski cho biết số tiền mới sẽ được sử dụng để phát triển sản phẩm, mở rộng cơ sở hạ tầng và đội ngũ của ElevenLabs, nghiên cứu AI và “tăng cường các biện pháp an toàn để đảm bảo sự phát triển có trách nhiệm và đạo đức của công nghệ AI”.
Staniszewski chia sẻ với giới truyền thông: “Chúng tôi đã huy động được số tiền mới để củng cố vị thế của ElevenLabs với tư cách là công ty dẫn đầu toàn cầu về nghiên cứu phát triển giọng nói bằng AI và triển khai sản phẩm ra thị trường”.
Được đồng sáng lập vào năm 2022 bởi Piotr Dabkowski, cựu kỹ sư máy học của Google và Staniszewski, cựu chiến lược gia triển khai Palantir, ElevenLabs đã ra mắt phiên bản beta khoảng một năm trước. Staniszewski nói rằng anh và Dabkowski, cùng người lớn lên ở Ba Lan, đã được truyền cảm hứng để tạo ra các công cụ nhân bản giọng nói từ những bộ phim Mỹ được lồng tiếng kém. Họ nghĩ AI có thể làm tốt hơn.
Ngày nay, ElevenLabs có lẽ được biết đến nhiều nhất với ứng dụng tạo giọng nói dựa trên trình duyệt web có thể tạo ra giọng nói sống động như thật có sự hỗ trợ điều chỉnh ngữ điệu, cảm xúc, nhịp điệu và các đặc điểm giọng nói quan trọng khác. Sản phẩm hiện có bản miễn phí, người dùng có thể nhập văn bản và nhận bản ghi giọng nói với ngôn ngữ của 29 quốc gia. Khách hàng trả tiền có thể tải lên các mẫu giọng nói để tạo phong cách mới bằng cách sử dụng tính năng sao chép giọng nói của ElevenLabs.
ElevenLabs hiện tập trung đầu tư vào các phiên bản công nghệ tạo giọng nói nhằm mục đích tạo sách nói, lồng tiếng cho phim và chương trình truyền hình, cũng như tạo giọng nói cho nhân vật cho trò chơi và hoạt động marketing.
Năm ngoái, công ty đã phát hành một công cụ có chức năng “speech to speech” nhằm xử lý tăng chất lượng giọng nói, điều chỉnh ngữ điệu và tự động loại bỏ tiếng ồn xung quanh. Lộ trình cho thời gian tới là sẽ cập nhật thêm tính năng xử lý âm thanh cho studio lồng tiếng cùng với các công cụ để tạo và chỉnh sửa bản ghi và xuất ra bản dịch cũng như một ứng dụng di động kèm theo.
Công nghệ của ElevenLabs đã giành được sự quan tâm đặc biệt của các nhà đầu tư ở Paradox Interactive, bao gồm các nhà phát triển trò chơi có các dự án gần đây bao gồm Cities: Skylines 2 và Stellaris, và The Washington Post — cùng với các công ty xuất bản, truyền thông và giải trí khác. Staniszewski tuyên bố rằng, ElevenLab đang được nhân viên tại 41% trong số các công ty Fortune 500 sử dụng.
Nhưng không phải tất cả đều ủng hộ ElevenLabs
Mặc dù ElevenLabs đã cố gắng loại bỏ tận gốc những người dùng liên tục vi phạm các điều khoản dịch vụ của mình, lạm dụng và triển khai các công cụ của họ để phát tán lời nói giả mạo do nền tảng này tạo ra. Nhưng ElevenLabs cũng vẫn phải đối mặt với sự chỉ trích từ các diễn viên lồng tiếng, những người cho rằng công ty này đang sử dụng mẫu giọng nói của họ mà không có sự đồng ý của họ – các mẫu có thể được tận dụng để quảng cáo nội dung mà họ không xác nhận hoặc truyền bá thông tin sai lệch.
Bên cạnh đó, một nền tảng đối thủ của ElevenLabs đang cố gắng đạt được những khả năng tương tự – Replica Studios, đầu tháng này đã ký thỏa thuận với SAG-AFTRA để tạo và cấp phép cho các bản sao kỹ thuật số giọng nói của các thành viên hiệp hội nghệ sĩ truyền thông. Trong một thông cáo báo chí cho biết rằng thỏa thuận này đã thiết lập các điều khoản và điều kiện “công bằng” và “đạo đức”. Tuy nhiên, điều này cũng chưa làm hài lòng một số diễn viên lồng tiếng – bao gồm cả các thành viên của SAG-AFTRA .
Giải pháp của ElevenLabs là một thị trường dành riêng cho việc xử lý tiếng nói. Hiện đang ở giai đoạn alpha và sẽ được cung cấp rộng rãi hơn trong vài tuần tới, thị trường cho phép người dùng tạo tiếng nói, xác minh và chia sẻ giọng nói đó. Staniszewski cho biết khi những người khác sử dụng giọng nói, những người sáng tạo ban đầu sẽ nhận được khoản phí phù hợp.
ElevenLabs – hiện là một trong những công ty khởi nghiệp trong việc xử lý giọng nói tổng hợp được tài trợ tốt nhất đang cố gắng đánh bại các đối thủ cạnh tranh mới nổi như Papercup, Deepdub, Acapela, Respeecher và Voice.ai cũng như những công ty đương nhiệm của Big Tech như như Amazon, Microsoft và Google. Trong mọi trường hợp, ElevenLabs, dự định sẽ tăng số lượng nhân viên từ 40 lên 100 vào cuối năm nay, dự định sẽ tiếp tục hoạt động – và tạo ra làn sóng ứng dụng AI vào việc nhân bản và xử lý giọng nói đang phát triển nhanh chóng.
Trung Hòa