2026年Deepgram评测:定价、AI、登录、职业、公司及常见问题解答

Table of Contents
过去几年,Deepgram 在语音 AI 领域声名鹊起。到 2026 年,它已从一个小众开发者工具,成长为一家由 Twilio、BlackRock 和 Y Combinator 等巨头支持的独角兽公司。但一轮巨额融资,并不自动意味着日常使用产品的用户就能获得顺畅体验。为了本次评测,Nubia Magazine 团队仔细研究了 Deepgram 当前的定价页面、开发者文档、招聘页面,以及 G2、Product Hunt 和 PeerSpot 等平台上广泛分布的独立用户评论,并查阅了其开发者社区论坛的报告。以下是一份基于研究的诚实评估,看看 Deepgram 在 2026 年哪些方面做得好,哪些地方容易让用户感到沮丧,以及它是否值得你、你的团队或你的转录预算投入时间。

公司概览
成立时间 | 2015 年 |
总部 | 美国加利福尼亚州旧金山 |
创始人 | Scott Stephenson 和 Noah Shutty |
首席执行官 | Scott Stephenson |
行业 | 语音 AI、语音识别、对话技术 |
核心产品 | 语音转文本 API、文本转语音 API、语音代理 API、Nova 和 Flux 模型 |
员工人数 | 根据来源和季度不同,大约在 200 到 320 人之间 |
总融资额 | 八轮融资超过 2.15 亿美元 |
最新一轮融资 | 1.3 亿美元 C 轮融资,于 2026 年 1 月完成 |
估值 | 截至 2026 年 1 月约为 13 亿美元 |
客户 | 超过 1,300 家组织和超过 200,000 名开发者,包括 Twilio、Cloudflare、Sierra 和 Citi |
网站 | deepgram.com |
定价模式 | 按使用量计费,按处理的音频秒数收费 |
免费层级 | 按量付费计划为新账户提供免费起始额度 |
Deepgram 公司概述
Deepgram 于 2015 年在旧金山由 Scott Stephenson 和 Noah Shutty 创立,最初源于对机器学习如何应用于原始音频的研究,旨在取代依赖旧式手工构建的语音模型。在接下来的十年里,该公司发展成为语音 AI 基础设施领域最知名的品牌之一,其应用程序接口现在为 Twilio、Cloudflare、Sierra、Decagon 和 Citi 等公司的产品中的语音功能提供支持。
该公司近期最重要的里程碑是 2026 年 1 月的 C 轮融资,由投资公司 AVP 领投,筹集了 1.3 亿美元,将 Deepgram 的估值推高至约 13 亿美元,使其正式成为独角兽。有趣的是,Stephenson 在采访中表示,当这轮融资达成时,公司已经实现现金流为正,并未积极寻求新资金,这说明了在过去一年中语音 AI 基础设施的需求有多么旺盛。伴随融资,Deepgram 还收购了 Y Combinator 支持的初创公司 OfOne,该公司专注于餐厅和汽车餐厅的 AI 点餐系统,这标志着 Deepgram 正进军更具体、更垂直的语音产品领域,而不仅仅停留在 API 和基础设施领域。
Deepgram AI:实际功能
Deepgram 的核心是一家语音 AI 公司,其产品围绕三大支柱组织:语音转文本、文本转语音,以及将两者结合成实时对话体验的语音代理。
语音转文本
这是 Deepgram 最强大的领域,也是大多数开发者首先选择该平台的原因。其 Nova 模型系列专为预录和实时流式转录而构建,2026 年来自评测网站的独立基准测试将其在词错误率方面置于行业前列,尤其是在实时、低延迟场景中。医疗保健和呼叫中心用户尤其称赞其开箱即用地处理专业词汇(从医学术语到行业行话)的能力。
Flux 和语音代理
Flux 是 Deepgram 较新的模型,专门为对话式 AI 而非简单转录而设计。它的任务是实时判断一个人是真正停止了说话,还是仅仅停顿了一下,这是构建不会打断用户或造成尴尬静音的语音代理时最棘手的问题之一。构建语音机器人的评测者称这是 Deepgram 近期最有用的新增功能之一,该公司在 2026 年初扩展了 Flux 以支持多语言对话识别。
文本转语音
Deepgram 的文本转语音工具让开发者能够为旅游导览、客服机器人和无障碍工具等应用生成自然的声音。它运行良好且价格合理,但多位评测者明确指出,这不是该平台最强的部分。如果语音生成质量是你的首要任务,而非次要功能,那么在决定之前,值得将 Deepgram 的输出与专门的文本转语音专家进行直接比较。

2026 年 Deepgram 定价
Deepgram 不使用传统的固定月费订阅制。相反,定价基于使用量,按处理的音频秒数计算,然后 Deepgram 将其表示为每分钟等效费率。这种结构有利于高容量、可预测的工作负载,但对于试图提前估算月度账单的小团队来说,可能会感到困惑。
计划 | 承诺 | 典型成本 |
按量付费 | 无最低消费,包含起始额度 | 根据模型和功能,每分钟大约 0.0043 到 0.0092 美元 |
成长计划 | 需要大约 4,000 美元或以上的年度预付款 | 每分钟费率更低,在 Nova 层级模型上通常约为每分钟 0.0065 美元 |
企业版 | 定制合同,年度承诺 | 协商费率,可包含本地或自托管部署 |
一些细节比标称费率更重要。呼叫中心录音中常见的立体声或多声道音频,实际上会使成本翻倍,因为每个声道单独计费。附加的智能功能,如摘要、情感分析、主题检测和意图识别,按 token 而非分钟计费,并且默认情况下不包含在任何基础层级中。新账户会获得起始额度来测试平台,但几位 G2 评测者指出,在规模上预测实际成本比应有的难度更大,至少有一家小企业报告了一笔意外的高额支持费用,这促使他们更换了供应商。任何认真评估 Deepgram 的人都应向销售部门索取基于使用量的报价,而不是仅仅依赖广告宣传的每分钟价格。
Deepgram 登录和账户访问
开始使用 Deepgram 意味着在 Deepgram 控制台创建一个免费账户,新用户会收到一个 API 密钥和起始额度。对于大多数开发者来说,这个过程很快。然而,在研究本次评测时,我们在 Deepgram 自己的 GitHub 社区论坛上发现了一个明显的登录和注册投诉模式。报告的问题包括:关联 GitHub 登录后账户卡住、浏览器控制台中出现通用访问被拒绝错误、以及注册验证无故失败。
值得肯定的是,Deepgram 的支持人员似乎活跃在这些社区帖子上,一旦用户提供浏览器详细信息和错误截图,他们就能相当快地解决个别案例。尽管如此,对于一个面向期望无摩擦入门的开发者的产品来说,登录可靠性是 2026 年需要加强的领域。
Deepgram 招聘
Deepgram 在 2026 年一直积极招聘,空缺职位涵盖工程、AI 研究、数据运营、销售、合作伙伴关系和客户成功。Indeed、ZipRecruiter 和 Wellfound 上的列表显示,任何时候都有数十个空缺职位,重点是美国境内的远程职位,以及少量国际职位。
- 工程和 AI 研究职位,包括 Nova 和 Flux 产品线的模型开发
- 支持企业客户的解决方案工程和售前职位
- 客户成功和合作伙伴成功职位
- 市场推广职位,包括业务发展和收入运营
Deepgram 将其工作场所文化描述为保持好奇心、客户至上和快速行动,据报道,它提供全面的健康计划、无限假期和居家办公津贴等福利。该公司过去也曾为符合条件的职位赞助 H1B 签证。对于求职者来说,查看当前空缺最可靠的方式是直接访问 deepgram.com/careers,因为第三方招聘网站并不总是完全同步。
用户体验:评测者实际在说什么
我们从 G2、Product Hunt 和 PeerSpot 收集了反馈,以便超越 Deepgram 自身的营销宣传,获得更全面的图景。出现的模式相当一致:使用 Deepgram 核心优势(实时转录)的人通常对它非常满意。而那些期望一个一体化、价格可预测平台的人,往往会感到更沮丧。
用户喜欢什么
- 高转录准确率,包括处理医学术语和行业行话等专业词汇
- 低延迟和强大的实时流式性能,这对实时语音产品至关重要
- 清晰、文档完善的 API,开发者描述为易于集成
- 根据多位评测者的说法,在评估和入门期间响应迅速的技术支持
- 合理的入门价格和对早期初创公司有用的起始额度
用户不喜欢什么
- 一旦考虑附加功能和多声道音频,定价难以预测
- 至少有一例报告称存在一笔大额且难以解释的支持费用
- Deepgram 社区论坛上报告的登录和注册可靠性问题
- 文本转语音质量落后于平台的转录优势
- 对一些不太常见语言的支持存在差距
Nubia Magazine 评分明细
我们的总体评分反映了一个拥有真正强大核心技术的平台,但被定价清晰度、账户访问以及在其主要转录优势之外的一些粗糙边缘所拖累。2.7 分(满分 5 分)并非反映工程能力差。它反映的是一种体验:对于大型技术团队来说明显更好,而对于试图预测账单或无需提交支持工单即可完成入门的小型买家来说,体验则差得多。
类别 | 评分 |
转录准确率 | 4.2 / 5 |
速度和实时性能 | 4.3 / 5 |
定价透明度 | 1.8 / 5 |
账户设置和登录便捷性 | 2.2 / 5 |
客户支持 | 2.5 / 5 |
文本转语音质量 | 2.6 / 5 |
Nubia Magazine 总体评分 | 2.7 / 5 |
常见问题解答
2026 年,Deepgram 仍然是好的语音转文本选择吗?
是的,对于正确的用例来说。Deepgram 在 2026 年仍然是市场上最快的语音识别 API 之一,对于任何构建实时语音代理、呼叫中心工具或速度至关重要的字幕功能的人来说,它是一个强有力的选择。如果你只是偶尔需要文件转录,它就不那么有说服力了,因为更简单的工具可以在没有按使用量计费复杂性的情况下完成这项工作。
Deepgram 每月实际花费是多少?
没有单一答案,因为 Deepgram 按音频秒数计费,而不是收取固定订阅费。一个每月在按量付费计划上处理约 1,000 小时音频的企业,在附加功能之前,预计账单在几百美元范围内,而成长计划可以通过年度预付款降低费用。摘要、情感分析和主题检测等附加功能按 token 单独计费,这是新用户在估算成本时容易忽略的部分。
为什么我无法登录我的 Deepgram 控制台?
登录问题是我们研究本次 Deepgram 评测时发现的最常见投诉之一。Deepgram 自己社区论坛上的用户报告称,在关联 GitHub 账户后无法登录、收到通用访问被拒绝错误、或在注册验证过程中卡住。在大多数有记录的案例中,问题是通过直接通过社区页面联系 Deepgram 支持解决的,而不是反复重试登录表单。
Deepgram 提供免费计划吗?
Deepgram 没有永久免费层级,但按量付费计划的新账户会收到起始额度,让开发者无需输入信用卡即可测试 API。一旦该额度用完,计费将切换到标准按使用量计费费率。
Deepgram Nova 和 Deepgram Flux 有什么区别?
Nova 是 Deepgram 的核心转录模型系列,专为预录和流式音频的准确性和速度而构建。Flux 是较新的模型,专门为对话式语音代理构建,专注于检测说话者何时真正说完,这比简单转录更难,并且对于听起来自然的语音机器人至关重要。
Deepgram 在 2026 年招聘吗?它是支持远程工作的雇主吗?
是的。Deepgram 在工程、AI 研究、销售和面向客户的职位上有活跃的职位列表,许多职位被列为美国境内的远程职位,也有一些国际职位。该公司自称提供灵活的工作安排、无限假期和远程工作津贴,但与任何成长中的初创公司一样,具体福利可能因职位和地点而异。
谁拥有 Deepgram?它筹集了多少资金?
Deepgram 是一家由 Scott Stephenson 联合创立的私营公司,他仍担任首席执行官。该公司已通过多轮融资筹集了超过 2.15 亿美元,最近一轮是 2026 年 1 月的 1.3 亿美元 C 轮融资,由投资公司 AVP 领投,现有投资者包括 Y Combinator、Madrona 和 Tiger Global 参投,公司估值约为 13 亿美元。
Deepgram 的文本转语音和它的语音转文本一样好吗?
根据我们跨多个平台审查的用户反馈,不完全是。Deepgram 的声誉建立在转录准确性和低延迟之上,这仍然是它表现最好的地方。几位评测者指出,其文本转语音声音虽然可用,但不如专门的语音生成平台那么精致,因此需要两者的团队应在承诺前专门测试 TTS 输出。
真实用户对 Deepgram 抱怨最多的是什么?
2026 年评测中反复出现的两个抱怨是定价不可预测性和支持成本。几位 G2 评测者表示,随着使用量增长,很难预测支出,至少有一位小企业评测者描述被收取了五位数的支持费用,这与支持热线的使用频率不符。登录和账户验证问题在 Deepgram 自己的开发者社区中也反复出现。
Deepgram 支持多种语言和口音吗?
Deepgram 支持多种语言,并通过其较新的 Flux 模型(2026 年更新以处理多语言对话识别)不断扩大多语言支持。尽管如此,一些评测者指出了对不太常见语言覆盖范围的差距,因此在签署合同前,值得根据你的具体用例检查当前的语言列表。
Nubia Magazine 最终裁决
Deepgram 在语音 AI 基础设施公司最重要的方面赢得了声誉:实时转录的速度和准确性。其 Nova 和 Flux 模型在 2026 年确实具有竞争力,其客户名单(从 Twilio 到 Citi)表明严肃的企业在规模上信任它。它失分的地方在于核心引擎之外的所有方面。定价需要在你注册前用通俗易懂的语言解释清楚,控制台登录对相当数量的用户表现出了实际的可靠性问题,而业务的文本转语音方面尚未赶上转录方面。如果你的项目成败取决于实时语音识别,那么 Deepgram 在 2026 年仍然值得认真考虑。如果你想要一个简单、可预测、一体化的语音平台,且发票上没有意外,那么请预留额外时间阅读细则,或者在承诺前将其与替代方案进行比较。
Related Posts
0 Comments
Join the discussion and share your thoughts
No Comments Yet
Be the first to share your thoughts on this article!







