Đánh giá Deepgram 2026: Giá cả, AI, Đăng nhập, Nghề nghiệp, Công ty & Câu hỏi thường gặp

Table of Contents
Deepgram đã dành vài năm qua để xây dựng tên tuổi trong lĩnh vực AI giọng nói, và đến năm 2026, công ty đã chuyển mình từ một công cụ dành cho nhà phát triển ngách trở thành kỳ lân công nghệ được hậu thuẫn bởi những cái tên như Twilio, BlackRock và Y Combinator. Tuy nhiên, một vòng gọi vốn lớn không tự động đồng nghĩa với trải nghiệm suôn sẻ cho những người thực sự sử dụng sản phẩm hàng ngày. Trong bài đánh giá này, đội ngũ Nubia Magazine đã xem xét kỹ lưỡng các trang giá hiện tại của Deepgram, tài liệu dành cho nhà phát triển, trang tuyển dụng, cùng nhiều đánh giá độc lập từ người dùng trên các nền tảng như G2, Product Hunt và PeerSpot, cũng như các báo cáo từ diễn đàn cộng đồng nhà phát triển của chính họ. Sau đây là cái nhìn trung thực, dựa trên nghiên cứu về những gì Deepgram làm tốt trong năm 2026, những điểm khiến người dùng thường thất vọng, và liệu nó có xứng đáng với thời gian, đội ngũ hay ngân sách phiên âm của bạn hay không.

Sơ lược về Công ty
Thành lập | 2015 |
Trụ sở chính | San Francisco, California, Hoa Kỳ |
Nhà sáng lập | Scott Stephenson và Noah Shutty |
CEO | Scott Stephenson |
Ngành | AI giọng nói, nhận dạng giọng nói, công nghệ hội thoại |
Sản phẩm cốt lõi | API chuyển giọng nói thành văn bản, API chuyển văn bản thành giọng nói, API tác nhân giọng nói, các mô hình Nova và Flux |
Số lượng nhân viên | Khoảng 200 đến 320, tùy thuộc vào nguồn và quý |
Tổng số vốn huy động được | Hơn 215 triệu đô la qua tám vòng |
Vòng gần nhất | 130 triệu đô la Series C, kết thúc vào tháng 1 năm 2026 |
Định giá | Khoảng 1,3 tỷ đô la tính đến tháng 1 năm 2026 |
Khách hàng | Hơn 1.300 tổ chức và hơn 200.000 nhà phát triển, bao gồm Twilio, Cloudflare, Sierra và Citi |
Trang web | deepgram.com |
Mô hình giá | Dựa trên mức sử dụng, tính phí theo giây âm thanh được xử lý |
Gói miễn phí | Tín dụng khởi đầu miễn phí cho tài khoản mới trong gói Trả theo nhu cầu |
Tổng quan về Công ty Deepgram
Deepgram được thành lập vào năm 2015 tại San Francisco bởi Scott Stephenson và Noah Shutty, ban đầu xuất phát từ nghiên cứu về cách áp dụng học máy vào âm thanh thô thay vì dựa vào các mô hình giọng nói cũ hơn, được thiết kế thủ công. Trong thập kỷ tiếp theo, công ty đã xây dựng mình thành một trong những cái tên được công nhận nhất trong cơ sở hạ tầng AI giọng nói, với giao diện lập trình ứng dụng hiện đang cung cấp năng lượng cho các tính năng giọng nói bên trong sản phẩm của các công ty như Twilio, Cloudflare, Sierra, Decagon và Citi.
Cột mốc quan trọng gần đây nhất của công ty là vòng Series C vào tháng 1 năm 2026, huy động được 130 triệu đô la do công ty đầu tư AVP dẫn đầu và đẩy định giá của Deepgram lên khoảng 1,3 tỷ đô la, chính thức biến nó thành kỳ lân công nghệ. Điều thú vị là, Stephenson đã nói trong các cuộc phỏng vấn rằng công ty đã có dòng tiền dương và không chủ động tìm kiếm nguồn tài trợ mới khi vòng gọi vốn diễn ra, điều này nói lên nhiều điều về mức độ nhu cầu đối với cơ sở hạ tầng AI giọng nói trong năm qua. Cùng với đợt huy động vốn, Deepgram cũng mua lại OfOne, một công ty khởi nghiệp được Y Combinator hậu thuẫn tập trung vào AI đặt hàng cho nhà hàng và drive-through, báo hiệu sự thúc đẩy vào các sản phẩm giọng nói theo chiều dọc, ứng dụng nhiều hơn thay vì chỉ ở lại trong lãnh thổ API và cơ sở hạ tầng.
Deepgram AI: Nó Thực Sự Làm Gì
Cốt lõi, Deepgram là một công ty AI giọng nói, và nó tổ chức các sản phẩm của mình xoay quanh ba trụ cột: chuyển giọng nói thành văn bản, chuyển văn bản thành giọng nói và các tác nhân giọng nói kết hợp cả hai hướng thành một trải nghiệm hội thoại trực tiếp.
Chuyển giọng nói thành văn bản
Đây là lĩnh vực mạnh nhất của Deepgram và là lý do khiến hầu hết các nhà phát triển đến với nền tảng này ngay từ đầu. Dòng mô hình Nova của nó được xây dựng cho cả phiên âm trực tiếp và phát trực tuyến theo thời gian thực, và các điểm chuẩn độc lập từ các trang đánh giá vào năm 2026 xếp nó gần đầu lĩnh vực về tỷ lệ lỗi từ, đặc biệt là trong các tình huống trực tiếp, độ trễ thấp. Đặc biệt, người dùng trong lĩnh vực chăm sóc sức khỏe và trung tâm cuộc gọi đã khen ngợi khả năng xử lý từ vựng chuyên ngành, từ thuật ngữ y tế đến biệt ngữ trong ngành, một cách hợp lý ngay khi sử dụng.
Flux và Tác nhân giọng nói
Flux là mô hình mới hơn của Deepgram, được thiết kế đặc biệt cho AI hội thoại thay vì phiên âm đơn thuần. Nhiệm vụ của nó là xác định, trong thời gian thực, khi nào một người thực sự ngừng nói so với chỉ tạm dừng, đây là một trong những vấn đề khó nhất trong việc xây dựng một tác nhân giọng nói không nói đè lên người dùng hoặc để lại khoảng lặng khó xử. Những người đánh giá xây dựng bot giọng nói đã gọi đây là một trong những bổ sung thực sự hữu ích gần đây của Deepgram, và công ty đã mở rộng Flux để hỗ trợ nhận dạng hội thoại đa ngôn ngữ vào đầu năm 2026.
Chuyển văn bản thành giọng nói
Các công cụ chuyển văn bản thành giọng nói của Deepgram cho phép các nhà phát triển tạo ra giọng nói tự nhiên cho các ứng dụng như hướng dẫn viên du lịch, bot dịch vụ khách hàng và các công cụ trợ năng. Nó hoạt động tốt và có giá hợp lý, nhưng một số người đánh giá đã nói rõ rằng đây không phải là phần mạnh nhất của nền tảng. Nếu chất lượng tạo giọng nói là ưu tiên hàng đầu của bạn thay vì một tính năng phụ, thì bạn nên so sánh trực tiếp đầu ra của Deepgram với các chuyên gia chuyển văn bản thành giọng nói chuyên dụng trước khi quyết định.

Giá của Deepgram năm 2026
Deepgram không sử dụng gói đăng ký hàng tháng cố định truyền thống. Thay vào đó, giá dựa trên mức sử dụng và được tính theo giây âm thanh được xử lý, sau đó Deepgram trình bày dưới dạng tỷ lệ tương đương mỗi phút. Cấu trúc này có lợi cho khối lượng công việc lớn, có thể dự đoán trước và có thể gây khó hiểu cho các nhóm nhỏ hơn đang cố gắng ước tính hóa đơn hàng tháng trước.
Gói | Cam kết | Chi phí điển hình |
Trả theo nhu cầu | Không có mức chi tiêu tối thiểu, bao gồm tín dụng khởi đầu | Khoảng $0,0043 đến $0,0092 mỗi phút tùy thuộc vào mô hình và tính năng |
Tăng trưởng | Yêu cầu thanh toán trước hàng năm khoảng $4.000 hoặc hơn | Tỷ lệ mỗi phút thấp hơn, thường được trích dẫn gần $0,0065 mỗi phút trên các mô hình cấp Nova |
Doanh nghiệp | Hợp đồng tùy chỉnh, cam kết hàng năm | Tỷ lệ thương lượng, có thể bao gồm triển khai tại chỗ hoặc tự lưu trữ |
Một vài chi tiết quan trọng hơn tỷ lệ chính. Âm thanh nổi hoặc đa kênh, phổ biến trong các bản ghi trung tâm cuộc gọi, sẽ tăng gấp đôi chi phí vì mỗi kênh được tính phí riêng. Các tính năng thông minh bổ sung như tóm tắt, phân tích cảm xúc, phát hiện chủ đề và nhận dạng ý định được định giá theo token thay vì theo phút và chúng không được bao gồm trong bất kỳ gói cơ bản nào theo mặc định. Các tài khoản mới nhận được tín dụng khởi đầu để kiểm tra nền tảng, nhưng một số người đánh giá trên G2 lưu ý rằng việc dự báo chi phí thực tế ở quy mô lớn khó hơn mức cần thiết, và ít nhất một doanh nghiệp nhỏ đã báo cáo một khoản phí hỗ trợ lớn bất ngờ góp phần khiến họ chuyển đổi nhà cung cấp. Bất kỳ ai đánh giá Deepgram một cách nghiêm túc nên yêu cầu báo giá dựa trên mức sử dụng từ bộ phận bán hàng thay vì chỉ dựa vào con số mỗi phút được quảng cáo.
Đăng nhập và Truy cập Tài khoản Deepgram
Bắt đầu với Deepgram có nghĩa là tạo một tài khoản miễn phí tại Bảng điều khiển Deepgram, nơi người dùng mới nhận được khóa API và tín dụng khởi đầu. Đối với hầu hết các nhà phát triển, quy trình này rất nhanh chóng. Tuy nhiên, trong khi nghiên cứu cho bài đánh giá này, chúng tôi đã tìm thấy một mô hình đáng chú ý về các khiếu nại đăng nhập và đăng ký trên diễn đàn cộng đồng GitHub của chính Deepgram. Các vấn đề được báo cáo bao gồm tài khoản bị kẹt sau khi liên kết đăng nhập GitHub, lỗi từ chối truy cập chung chung xuất hiện trong bảng điều khiển trình duyệt và xác minh đăng ký chỉ đơn giản là thất bại mà không có lời giải thích rõ ràng.
Công bằng cho Deepgram, đội ngũ hỗ trợ của công ty dường như hoạt động tích cực trên các luồng cộng đồng này và đã giải quyết các trường hợp riêng lẻ khá nhanh chóng sau khi người dùng cung cấp chi tiết trình duyệt và ảnh chụp màn hình lỗi. Tuy nhiên, đối với một sản phẩm nhắm đến các nhà phát triển mong đợi quy trình giới thiệu không rắc rối, độ tin cậy của đăng nhập là một lĩnh vực có thể cần được cải thiện trong năm 2026.
Sự nghiệp tại Deepgram
Deepgram đã tích cực tuyển dụng trong suốt năm 2026, với các vị trí mở trải dài từ kỹ thuật, nghiên cứu AI, vận hành dữ liệu, bán hàng, quan hệ đối tác và thành công của khách hàng. Danh sách trên Indeed, ZipRecruiter và Wellfound cho thấy hàng chục vị trí mở tại bất kỳ thời điểm nào, với trọng tâm mạnh mẽ vào các vai trò từ xa có trụ sở tại Hoa Kỳ và một số ít vị trí quốc tế.
- Vai trò kỹ thuật và nghiên cứu AI, bao gồm phát triển mô hình cho các dòng sản phẩm Nova và Flux
- Vai trò kỹ thuật giải pháp và tiền bán hàng hỗ trợ khách hàng doanh nghiệp
- Vị trí thành công của khách hàng và thành công của đối tác
- Vai trò tiếp cận thị trường bao gồm phát triển kinh doanh và vận hành doanh thu
Deepgram mô tả văn hóa nơi làm việc của mình xoay quanh các giá trị như luôn tò mò, đặt khách hàng lên hàng đầu và hành động nhanh chóng, và được báo cáo là cung cấp các phúc lợi như kế hoạch chăm sóc sức khỏe toàn diện, kỳ nghỉ không giới hạn và trợ cấp làm việc tại nhà. Công ty cũng đã bảo trợ thị thực H1B cho các vai trò đủ điều kiện trong quá khứ. Đối với người tìm việc, cách đáng tin cậy nhất để xem các vị trí tuyển dụng hiện tại là trực tiếp thông qua deepgram.com/careers, vì các bảng việc làm của bên thứ ba không phải lúc nào cũng đồng bộ hoàn hảo.
Trải nghiệm Người dùng: Người đánh giá Thực sự Nói gì
Chúng tôi đã thu thập phản hồi từ G2, Product Hunt và PeerSpot để có được bức tranh toàn diện hơn ngoài các tuyên bố tiếp thị của chính Deepgram. Mô hình nổi lên khá nhất quán: những người sử dụng Deepgram cho thế mạnh cốt lõi của nó, phiên âm thời gian thực, có xu hướng thực sự hài lòng với nó. Những người mong đợi một nền tảng tất cả trong một, có giá dự đoán trước có xu hướng thất vọng hơn.
Điều Người dùng Thích
- Độ chính xác phiên âm cao, bao gồm cả với từ vựng chuyên ngành như thuật ngữ y tế và biệt ngữ trong ngành
- Độ trễ thấp và hiệu suất phát trực tuyến thời gian thực mạnh mẽ, điều quan trọng nhất đối với các sản phẩm giọng nói trực tiếp
- API sạch sẽ, được ghi chép đầy đủ mà các nhà phát triển mô tả là dễ tích hợp
- Hỗ trợ kỹ thuật phản hồi nhanh trong quá trình đánh giá và giới thiệu, theo nhiều người đánh giá
- Giá khởi điểm hợp lý và tín dụng khởi đầu hữu ích cho các công ty khởi nghiệp giai đoạn đầu
Điều Người dùng Không Thích
- Giá khó dự báo khi tính đến các tính năng bổ sung và âm thanh đa kênh
- Ít nhất một trường hợp được báo cáo về một khoản phí hỗ trợ lớn, khó biện minh
- Các vấn đề về độ tin cậy đăng nhập và đăng ký được báo cáo trên diễn đàn cộng đồng của Deepgram
- Chất lượng chuyển văn bản thành giọng nói tụt hậu so với thế mạnh phiên âm của nền tảng
- Khoảng trống trong hỗ trợ cho một số ngôn ngữ ít phổ biến hơn
Bảng điểm Đánh giá của Nubia Magazine
Điểm tổng thể của chúng tôi phản ánh một nền tảng có công nghệ cốt lõi thực sự mạnh mẽ nhưng bị kìm hãm bởi sự thiếu rõ ràng trong giá cả, quyền truy cập tài khoản và một vài góc cạnh thô hơn bên ngoài thế mạnh phiên âm chính của nó. Điểm 2,7 trên 5 không phải là sự phản ánh của kỹ thuật kém. Đó là sự phản ánh của một trải nghiệm có vẻ tốt hơn đáng kể đối với các nhóm kỹ thuật lớn so với những người mua nhỏ hơn đang cố gắng dự đoán hóa đơn hoặc vượt qua quá trình giới thiệu mà không cần một vé hỗ trợ.
Danh mục | Điểm |
Độ chính xác phiên âm | 4,2 / 5 |
Tốc độ và hiệu suất thời gian thực | 4,3 / 5 |
Minh bạch về giá | 1,8 / 5 |
Dễ dàng thiết lập tài khoản và đăng nhập | 2,2 / 5 |
Hỗ trợ khách hàng | 2,5 / 5 |
Chất lượng chuyển văn bản thành giọng nói | 2,6 / 5 |
Đánh giá tổng thể của Nubia Magazine | 2,7 / 5 |
Các câu hỏi thường gặp
Deepgram có còn là lựa chọn chuyển giọng nói thành văn bản tốt trong năm 2026 không?
Có, cho các trường hợp sử dụng phù hợp. Deepgram vẫn là một trong những API nhận dạng giọng nói nhanh nhất trên thị trường vào năm 2026 và là lựa chọn mạnh mẽ cho bất kỳ ai xây dựng các tác nhân giọng nói trực tiếp, công cụ trung tâm cuộc gọi hoặc tính năng chú thích nơi tốc độ quan trọng hơn bất cứ điều gì khác. Nó ít thuyết phục hơn nếu bạn chỉ thỉnh thoảng cần phiên âm tệp, vì các công cụ đơn giản hơn có thể thực hiện công việc đó mà không có sự phức tạp về thanh toán dựa trên mức sử dụng.
Deepgram thực sự tốn bao nhiêu mỗi tháng?
Không có câu trả lời duy nhất vì Deepgram tính phí theo giây âm thanh thay vì tính phí đăng ký cố định. Một doanh nghiệp xử lý khoảng 1.000 giờ âm thanh mỗi tháng trong gói Trả theo nhu cầu sẽ có hóa đơn trong khoảng vài trăm đô la trước khi thêm các tính năng bổ sung, trong khi gói Tăng trưởng có thể giảm chi phí đó với khoản thanh toán trước hàng năm. Các tính năng bổ sung như tóm tắt, phân tích cảm xúc và phát hiện chủ đề được tính phí riêng trên cơ sở mỗi token, đây là phần mà người dùng mới thường bỏ lỡ khi ước tính chi phí.
Tại sao tôi không thể đăng nhập vào bảng điều khiển Deepgram của mình?
Sự cố đăng nhập là một trong những khiếu nại phổ biến nhất mà chúng tôi tìm thấy khi nghiên cứu bài đánh giá Deepgram này. Người dùng trên diễn đàn cộng đồng của chính Deepgram đã báo cáo không thể đăng nhập sau khi liên kết tài khoản GitHub, nhận được lỗi từ chối truy cập chung chung hoặc bị kẹt trong quá trình xác minh đăng ký. Trong hầu hết các trường hợp được ghi lại, vấn đề đã được giải quyết bằng cách liên hệ trực tiếp với bộ phận hỗ trợ của Deepgram thông qua trang cộng đồng thay vì thử lại biểu mẫu đăng nhập nhiều lần.
Deepgram có cung cấp gói miễn phí không?
Deepgram không có bậc miễn phí vĩnh viễn, nhưng các tài khoản mới trong gói Trả theo nhu cầu nhận được tín dụng khởi đầu cho phép các nhà phát triển kiểm tra API mà không cần nhập thẻ tín dụng. Khi tín dụng đó hết, việc thanh toán sẽ chuyển sang tỷ lệ sử dụng tiêu chuẩn.
Sự khác biệt giữa Deepgram Nova và Deepgram Flux là gì?
Nova là dòng mô hình phiên âm cốt lõi của Deepgram, được xây dựng cho độ chính xác và tốc độ trên cả âm thanh được ghi sẵn và phát trực tuyến. Flux là mô hình mới hơn được xây dựng đặc biệt cho các tác nhân giọng nói hội thoại, tập trung vào việc phát hiện khi nào người nói thực sự nói xong, đây là một vấn đề khó hơn so với phiên âm đơn thuần và rất quan trọng đối với các bot giọng nói nghe tự nhiên.
Deepgram có đang tuyển dụng trong năm 2026 không và có phải là nhà tuyển dụng thân thiện với làm việc từ xa không?
Có. Deepgram có các danh sách việc làm đang hoạt động trên các lĩnh vực kỹ thuật, nghiên cứu AI, bán hàng và các vai trò hướng đến khách hàng, và nhiều vị trí được liệt kê là từ xa tại Hoa Kỳ, cùng với một số vai trò quốc tế. Công ty đã mô tả mình cung cấp các thỏa thuận làm việc linh hoạt, kỳ nghỉ không giới hạn và trợ cấp làm việc từ xa, mặc dù như với bất kỳ công ty khởi nghiệp đang phát triển nào, các phúc lợi cụ thể có thể khác nhau tùy theo vai trò và địa điểm.
Ai sở hữu Deepgram và nó đã huy động được bao nhiêu vốn?
Deepgram là một công ty tư nhân do Scott Stephenson đồng sáng lập, người vẫn là CEO. Công ty đã huy động được hơn 215 triệu đô la qua nhiều vòng tài trợ, với vòng Series C trị giá 130 triệu đô la gần đây nhất vào tháng 1 năm 2026 định giá công ty ở mức khoảng 1,3 tỷ đô la, do công ty đầu tư AVP dẫn đầu với sự tham gia của các nhà đầu tư hiện tại bao gồm Y Combinator, Madrona và Tiger Global.
Chuyển văn bản thành giọng nói của Deepgram có tốt như chuyển giọng nói thành văn bản không?
Dựa trên phản hồi của người dùng mà chúng tôi đã xem xét trên nhiều nền tảng, câu trả lời là không hoàn toàn. Deepgram đã xây dựng danh tiếng của mình dựa trên độ chính xác phiên âm và độ trễ thấp, và đó vẫn là nơi nó hoạt động tốt nhất. Một số người đánh giá lưu ý rằng giọng nói chuyển văn bản thành giọng nói của nó, mặc dù có thể sử dụng được, nhưng không tinh tế bằng các nền tảng tạo giọng nói chuyên dụng, vì vậy các nhóm cần cả hai nên kiểm tra đầu ra TTS cụ thể trước khi cam kết.
Người dùng thực sự phàn nàn nhiều nhất về điều gì với Deepgram?
Hai khiếu nại lặp đi lặp lại trong các đánh giá năm 2026 là sự khó dự đoán về giá và chi phí hỗ trợ. Một số người đánh giá trên G2 cho biết rất khó để dự báo chi tiêu khi mức sử dụng mở rộng, và ít nhất một người đánh giá doanh nghiệp nhỏ mô tả đã bị tính phí hỗ trợ năm con số không phù hợp với tần suất sử dụng đường dây hỗ trợ. Các vấn đề về đăng nhập và xác minh tài khoản cũng xuất hiện nhiều lần trong cộng đồng nhà phát triển của chính Deepgram.
Deepgram có hỗ trợ nhiều ngôn ngữ và giọng địa phương không?
Deepgram hỗ trợ nhiều ngôn ngữ và đã mở rộng hỗ trợ đa ngôn ngữ thông qua các mô hình Flux mới hơn, đã được cập nhật vào năm 2026 để xử lý nhận dạng hội thoại đa ngôn ngữ. Tuy nhiên, một số người đánh giá đã chỉ ra những khoảng trống trong phạm vi hỗ trợ cho các ngôn ngữ ít phổ biến hơn, vì vậy bạn nên kiểm tra danh sách ngôn ngữ hiện tại so với trường hợp sử dụng cụ thể của mình trước khi ký hợp đồng.
Phán quyết của Nubia Magazine
Deepgram xứng đáng với danh tiếng của mình ở nơi quan trọng nhất đối với một công ty cơ sở hạ tầng AI giọng nói: tốc độ và độ chính xác trong phiên âm trực tiếp. Các mô hình Nova và Flux của nó thực sự cạnh tranh trong năm 2026, và dan
Related Posts
0 Comments
Join the discussion and share your thoughts
No Comments Yet
Be the first to share your thoughts on this article!







