Cloudflare Workers AI 推理接口 — 支持思考过程展示
GET /v1/models — 模型列表
GET /v1/models
POST /v1/chat/completions — 聊天补全
POST /v1/chat/completions
model — 模型别名(默认 glm-5.2,可选 ds-thinking / qwen / llama-4 等)
model
show_thinking — 是否返回思考过程(仅推理模型生效)
show_thinking
temperature — 温度(推荐 0.6)
temperature
max_tokens — 最大输出长度(默认 8192)
max_tokens