生成式人工智能初创公司 Fireworks.ai 推出了迄今为止最快、最高效的推理引擎。该公司依赖于复合人工智能系统,该系统用多个交互模型取代了传统的单一人工智能模型。Fireworks.ai 已与 Google Cloud 和 NVIDIA 等其他合作伙伴合作,以提供经济高效且可扩展的解决方案。Google Cloud 帮助 Fireworks.ai 每天处理超过 1400 亿个令牌,API 正常运行时间为 99.99%。Fireworks.ai 还使用 Google Cloud 服务(例如 Cloud Pub/Sub、Cloud Functions、Cloud Monitoring 和 BigQuery)来优化性能并降低成本。得益于此次合作,Fireworks.ai 能够提供比竞争对手托管服务低 4 倍的延迟和高 4 倍的吞吐量。Fireworks.ai 强调了开放源代码访问人工智能的重要性,并与 Google Cloud 合作,使更多公司能够从生成式人工智能的创新使用中获得价值。