我们发现有两种主要的竞争者 类型:一种是只在某一层面(如基础 设施、模型或应用程序)提供服务的 纯粹提供者,另一种则是在多个层面 提供服务的综合型提供者。就定价而 言,针对消费者的定价通常比较简单 明了(比如按用户数、按月收费), 而针对企业的定价则较为复杂(比如 按呼叫次数、按小时计费、按收入份 额分成等)。然而,尽管存在不同的 竞争者类型,但是在企业规模扩大、 超越早期采用者或边缘应用场景时, 定价的简单性、可预测性和价值会变 得非常重要。 首先,基础设施层是生成式人工智能技术 堆栈中最成熟的领域,超大规模计算服务 提供商在这个领域占据了市场的主导地位。 这里的商业模式已经被证明是行之有效的, 就是提供可扩展的计算资源,并采用透明、 按消费计费的定价策略。
为了让生成式人 工智能工作负载更加稳定,超大规模计算 服务提供商已经与模型提供商签署了承诺, 以保证未来的工作负载,其中包括Azure 与OpenAI、Google 与Anthropic 以及AWS 与Stability.ai,还包括它们自己的专有模型。在这方面,NVIDIA 是领导者之一。他 们的 Ampere 和 Hopper 系列 GPU 分别 为训练和推理工作负载专门设计,再 加上他们的 Selene 超级计算集群,可 以加速训练时间。同时,AMD 的 CDNA2 架构也是专门为机器学习应用 的超级计算而设计的,这推动了高性 能计算市场的竞争。接下来是模型层,市场正在快速发展。 在这个领域,需要投入大量资源,模型 构建者必须不断审查体系结构(例如参 数、嵌入)以维持性能。他们必须吸引 和留住人工智能人才(如架构师、工程 师和数据科学家),设计框架、防护措 施和学习机制,以确保模型的稳健性和 可靠性。最后,由于生成式人工智能工 作负载需要大量计算,并需要专用芯片 的支持,因此可能会产生高昂的费用。 因此,我们看到一些公司开始通过收取 费用或将其整合到盈利产品中(例如 GPT-3.5整合到Edge,LaMDA整合到 Google Search)来收回投资。