对话概览

对话 API 构建块概述

对话 API 目前处于 alpha 阶段。

Dapr 的对话 API 降低了大规模安全可靠地与大型语言模型 (LLM) 交互的复杂性。无论您是缺乏必要原生 SDK 的开发者，还是只想专注于 LLM 交互的提示工程的多语言团队，对话 API 都提供了一个一致的 API 入口点来与底层 LLM 提供商通信。

除了启用关键的性能和安全功能（如缓存和 PII 清理），对话 API 还提供：

您还可以将对话 API 与 Dapr 功能结合使用，例如：

功能

以下功能是所有支持的对话组件开箱即用的。

对话 API 支持两种缓存：

提示缓存：某些 LLM 提供商在本地缓存提示前缀，以加快重复提示的速度并降低成本。您可以通过 API 使用 promptCacheRetention 参数在每个请求中启用此功能（例如，24h 用于 OpenAI）。有关请求级选项，请参阅对话 API 参考。支持情况取决于提供商。
响应缓存：对话组件可以在边车中缓存完整的 LLM 响应。当您设置组件元数据字段 responseCacheTTL（例如 10m）时，Dapr 会根据请求（提示和选项）缓存响应。重复的相同请求将从缓存提供，无需调用 LLM，从而降低延迟和成本。此缓存在内存中且每个边车独立。请在您的对话组件 spec 中配置。

您可以通过在请求中传递 responseFormat（JSON Schema）来请求模型的结构化输出。支持 Deepseek、Google AI、Hugging Face、OpenAI 和 Anthropic。请参阅对话 API 参考。

响应可以包含对话的令牌使用量（promptTokens、completionTokens、totalTokens）。请参阅 API 参考中的响应内容。

PII 混淆功能可识别并清除对话响应中任何形式的敏感用户信息。只需在输入和输出数据上启用 PII 混淆即可保护您的隐私，清除可能被用来识别个人的敏感细节。

PII 清理器会混淆以下用户信息：

对话 API 支持高级工具调用能力，允许 LLM 与外部函数和 API 交互。这使您能够构建复杂的 AI 应用，这些应用可以：

工具调用遵循 OpenAI 的函数调用格式，便于与现有 AI 开发工作流和工具集成。

观看在 Diagrid 的 Dapr v1.15 庆祝活动上进行的演示，了解如何使用 .NET SDK 了解对话 API 的工作原理。

想让 Dapr 对话 API 接受测试吗？通过以下快速入门和教程了解实际效果：

快速入门/教程	描述
对话快速入门	了解如何使用对话 API 与大型语言模型 (LLM) 交互。

想跳过快速入门吗？没问题。您可以直接在应用程序中试用对话构建块。在安装 Dapr 后，您可以开始使用对话 API，从操作指南开始。