deepseek-v3在阿里云和腾讯云的使用中的差异

ops/2025/2/23 1:00:16/

随着deepseek在各大云商上线,试用了下阿里云和腾讯云的deepseek服务,在回答经典数学问题9.9和9.11谁大时,发现还是有差异的。将相关的问题记录如下。

1、问题表现

笔者使用的openai的官方sdk go-openai。

因本文中测验主要使用阿里云和腾讯云。

在阿里云官网页面上时,回答正确:

通过api调用,不设置system提示词时,发往阿里云时,共执行三次,每次回答的结果都会出错:

代码如下:

package mainimport ("context""fmt""github.com/openai/openai-go""github.com/openai/openai-go/option"
)func main() {client := openai.NewClient(option.WithAPIKey("sk-xxxxxxxxxxxxxxxxx"), // defaults to os.LookupEnv("OPENAI_API_KEY")option.WithBaseURL("https://dashscope.aliyuncs.com/compatible-mode/v1/"),)chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{Messages: openai.F([]openai.ChatCompletionMessageParamUnion{openai.UserMessage("9.9和9.11谁大"),}),Model: openai.F("deepseek-v3"),})if err != nil {panic(err.Error())}println(chatCompletion.Choices[0].Message.Content)
}

若是发往腾讯云:

执行三次的回答正确:

"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   \\[\n   9.9 = 9.90\n   \\]\n   \\[\n   9.11 = 9.11\n   \\]\n\n2. **逐位比较**:\n   - **个位数**:两者都是 \\(9\\),相等。\n   - **十分位**:\\(9.90\\) 的十分位是 \\(9\\),\\(9.11\\) 的十分位是 \\(1\\)。\n   \n   由于 \\(9 > 1\\),因此 \\(9.90 > 9.11\\)。\n\n**最终结论**:\n\\[\n\\boxed{9.9 \\text{ 大于 } 9.11}\n\\]"
"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   \\[\n   9.9 = 9.90\n   \\]\n   \\[\n   9.11 = 9.11\n   \\]\n\n2. **逐位比较**:\n   - **个位数**:两者都是 \\(9\\),相等。\n   - **十分位**:\\(9.90\\) 的十分位是 \\(9\\),\\(9.11\\) 的十分位是 \\(1\\)。\n   \n   由于 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n因此,\\(9.9\\) 大于 \\(9.11\\)。\n\n\\[\n\\boxed{9.9 > 9.11}\n\\]"
"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **比较整数部分**:\n   - 两个数的整数部分都是 \\(9\\),所以需要比较小数部分。\n\n2. **比较小数部分**:\n   - \\(9.9\\) 的小数部分是 \\(0.9\\)。\n   - \\(9.11\\) 的小数部分是 \\(0.11\\)。\n\n3. **转换为相同小数位数**:\n   - 将 \\(0.9\\) 转换为 \\(0.90\\),以便与 \\(0.11\\) 比较。\n   \n4. **进行大小比较**:\n   - \\(0.90 > 0.11\\),因此 \\(9.9 > 9.11\\)。\n\n**最终答案**:\n\\[\n\\boxed{9.9}\n\\]"

如果通过curl直接调用api时,不设置任何提示词时,

发往阿里云时,回答有时会错误:

输入命令:

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions -H "Authorization: Bearer sk-xxxxxxxxxxxxxxx" -H "Content-Type: application/json" -d '{"model": "deepseek-v3","messages": [{"role": "user", "content": "9.9和9.11谁大?"}]
}'

第一次答案:

9.9比9.11大,详细报文如下:

{"choices":[{"message":{"content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 写成 **9.90**,以便于比较。\n   \n2. **逐位比较**:\n   - **整数部分**:两数的整数部分都是 **9**,相等。\n   - **小数部分**:\n     - 第一位小数:**9.90** 的第一位小数是 **9**,**9.11** 的第一位小数是 **1**。\n     - 由于 **9 > 1**,所以 **9.90 > 9.11**。\n\n因此,**9.9** 大于 **9.11**。\n\n最终答案:\\boxed{9.9 > 9.11}","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":13,"completion_tokens":175,"total_tokens":188},"created":1739847540,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-581f773a-f1ed-92f6-981d-00408259761d"}

第二次答案:是9.11比9.9大,详细报文如下:

{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了便于比较,将两个数的小数位数统一。将 \\(9.9\\) 写成 \\(9.90\\)。\n   \n   \\[\n   9.9 = 9.90\n   \\]\n   \n2. **逐位比较**:\n   从左到右逐位比较两个数:\n   \n   - **整数部分**:两者都是 \\(9\\),相等。\n   - **第一位小数**:两者都是 \\(9\\),相等。\n   - **第二位小数**:\\(0\\)(在 \\(9.90\\) 中) vs \\(1\\)(在 \\(9.11\\) 中)。\n   \n   因为 \\(0 < 1\\),所以 \\(9.90 < 9.11\\)。\n\n3. **结论**:\n   \\[\n   9.9 < 9.11\n   \\]\n   \n因此,\\(\\boxed{9.11}\\) 更大。","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":13,"completion_tokens":218,"total_tokens":231},"created":1739847774,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-15511b5b-d92d-9ca2-859c-13bf003e4381"}

而发往腾讯云时,执行三次结果全部正确:

通过上述,可以发现,阿里云在执行时,通过api进行调用时,使用go代码和shell代码执行结果并不一致,因此其可能存在逻辑并不相同的情况。

2、设置一中性通用提示词,对结果的影响

若设置system提示词为:you are a helpful assister

使用go代码时,在调用阿里云服务时结果为:

"9.11比9.9大。在比较小数时,从左到右逐位比较,9.9可以看作9.90,而9.11的十分位是1,比9.90的十分位9大,因此9.11更大。<|im_end|>"

同样代码,在调用腾讯云服务时,结果正确:

要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n - 将 **9.9** 写成 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n - **个位数**:两者都是 **9**,相等。\n - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。由于 **9 > 1**,因此 **9.90 > 9.11**。\n\n3. **结论**:\n - **9.9** 大于 **9.11**。\n\n最终答案:\\boxed{9.9 > 9.11}

go代码为:

package mainimport ("context""fmt""github.com/openai/openai-go""github.com/openai/openai-go/option"
)func main() {client := openai.NewClient(option.WithAPIKey("sk-xxxxxxxxxxxxxxxxx"), // defaults to os.LookupEnv("OPENAI_API_KEY")//阿里云调用地址option.WithBaseURL("https://dashscope.aliyuncs.com/compatible-mode/v1/"),//腾讯云地址//option.WithBaseURL("https://api.lkeap.cloud.tencent.com/v1/"),)chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{Messages: openai.F([]openai.ChatCompletionMessageParamUnion{openai.SystemMessage("you are a helpful assister"), openai.UserMessage("9.9和9.11谁大"),}),Model: openai.F("deepseek-v3"),})if err != nil {panic(err.Error())}println(chatCompletion.Choices[0].Message.Content)
}

通过curl直接调用阿里云或腾讯云服务时均正确:

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer sk-xxxxxxxx" \
-H "Content-Type: application/json" \
-d '{"model": "deepseek-v3","messages": [{"role": "system","content": "You a helpful assister."},{"role": "user", "content": "9.9和9.11谁大?"}]
}'

阿里云三次输出结果,二次正确,一次错误:

第一次结果错误,显示9.11大于9.9

{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 \\(9.9\\) 写成两位小数:\n   \\[\n   9.9 = 9.90\n   \\]\n   \n2. **逐位比较**:\n   \\[\n   \\begin{align*}\n   \\text{整数部分} & : 9 = 9 \\\\\n   \\text{第一位小数} & : 9 = 9 \\\\\n   \\text{第二位小数} & : 0 < 1 \\\\\n   \\end{align*}\n   \\]\n   \n   在第二位小数上,\\(0 < 1\\),因此 \\(9.90 < 9.11\\)。\n\n3. **结论**:\n   \\[\n   9.9 < 9.11\n   \\]\n\n所以,\\(9.11\\) 比 \\(9.9\\) 大。\n\n\\[\n\\boxed{9.11 \\text{ 更大}}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":211,"total_tokens":230},"created":1739865100,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-0eab475c-656c-9627-91a6-b5edd90c1cda"}

正确的二次结果:

{"choices":[{"message":{"content":"**解答:**\n\n比较两个小数 \\(9.9\\) 和 \\(9.11\\) 的大小。\n\n1. **统一小数位数:**\n   \\[\n   9.9 = 9.90\n   \\]\n   \\[\n   9.11 = 9.11\n   \\]\n\n2. **逐位比较:**\n   - 个位数:\\(9 = 9\\)(相等)\n   - 十位小数:\\(9 > 1\\)\n\n由于在十位小数上 \\(9.90\\) 的 \\(9\\) 大于 \\(9.11\\) 的 \\(1\\),因此:\n\\[\n9.90 > 9.11\n\\]\n\n**最终答案:**\n\\[\n\\boxed{9.9 > 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":163,"total_tokens":182},"created":1739865225,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-b5755232-db96-98e0-abb5-1727a1e1cdb5"}
{"choices":[{"message":{"content":"**解答:**\n\n比较两个数 \\(9.9\\) 和 \\(9.11\\) 的大小。\n\n1. **统一小数位数:**\n   为了方便比较,将 \\(9.9\\) 写成 \\(9.90\\)。\n\n2. **逐位比较:**\n   - 比较整数部分:\\(9 = 9\\),相等。\n   - 比较第一位小数:\\(9 > 1\\)。\n\n3. **结论:**\n   由于第一位小数 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n最终答案:\\boxed{9.9\\ \\text{更大}}","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":132,"total_tokens":151},"created":1739865274,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-b6d313fe-3b5d-948b-8b7a-0c63b9055213"}

发往腾讯云的代码:

  curl -X POST https://api.lkeap.cloud.tencent.com/v1/chat/completions \-H "Authorization: Bearer sk-xxxx" \-H "Content-Type: application/json" \-d '{"model": "deepseek-v3","messages": [{"role": "system","content": "You a helpful assister."},{"role": "user", "content": "9.9和9.11谁大?"}]}'

腾讯云每次均正确,三次调用结果如下:

{"id":"0cbeaab6ca3b27bb4f9b40915806912d","object":"chat.completion","created":1739865487,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 写成 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。由于 **9 \u003e 1**,因此 **9.90 \u003e 9.11**。\n\n或者,可以将两个数都转换为分数形式进行比较:\n\n3. **转换为分数**:\n   - **9.9** 可以表示为 \\( 9 \\frac{9}{10} = \\frac{99}{10} \\)。\n   - **9.11** 可以表示为 \\( 9 \\frac{11}{100} = \\frac{911}{100} \\)。\n\n4. **比较分数**:\n   - 将 \\( \\frac{99}{10} \\) 转换为分母为 **100** 的分数:\\( \\frac{990}{100} \\)。\n   - 比较 \\( \\frac{990}{100} \\) 和 \\( \\frac{911}{100} \\),显然 \\( 990 \u003e 911 \\),所以 \\( \\frac{990}{100} \u003e \\frac{911}{100} \\)。\n\n综上所述,**9.9** 大于 **9.11**。\n\n\\[\n\\boxed{9.9 \u003e 9.11}\n\\]"},"finish_reason":"stop"}],"usage":{"prompt_tokens":23,"completion_tokens":341,"total_tokens":364}}
{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 \\(9.9\\) 写成 \\(9.90\\),以便与 \\(9.11\\) 进行比较。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 \\(9\\),相等。\n   - **十分位**:\\(9.90\\) 的十分位是 \\(9\\),\\(9.11\\) 的十分位是 \\(1\\)。\n   \n   由于 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n**最终答案:**\n\\[\n\\boxed{9.9 > 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":158,"total_tokens":177},"created":1739865560,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-aac07423-8ed4-9988-934c-ba3dd78e1cad"}
{"choices":[{"message":{"content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 写成 **9.90**,这样两个数的小数位数相同,便于比较。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。\n   \n   由于 **9 > 1**,因此 **9.90 > 9.11**。\n\n**结论**:\n\\boxed{9.9 > 9.11}","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":19,"completion_tokens":157,"total_tokens":176},"created":1739865685,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-bcd8c5df-9380-9d1a-933e-b4e7b9e0d794"}

3、设置一无意义的提示词对问题的影响

提示词为you

go代码为:

package mainimport ("context""fmt""github.com/openai/openai-go""github.com/openai/openai-go/option"
)func main() {client := openai.NewClient(option.WithAPIKey("sk-xxxxxxxxxxxxxxxxx"), // defaults to os.LookupEnv("OPENAI_API_KEY")//阿里云调用地址option.WithBaseURL("https://dashscope.aliyuncs.com/compatible-mode/v1/"),//腾讯云地址//option.WithBaseURL("https://api.lkeap.cloud.tencent.com/v1/"),)chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{Messages: openai.F([]openai.ChatCompletionMessageParamUnion{openai.SystemMessage("you"), openai.UserMessage("9.9和9.11谁大"),}),Model: openai.F("deepseek-v3"),})if err != nil {panic(err.Error())}println(chatCompletion.Choices[0].Message.Content)
}

阿里云执行的结果不正确为:

9.11比9.9大。在比较小数时,从左到右逐位比较,9.9可以看作9.90,而9.11的第一位小数是1,比9.90的第一位小数9大,因此9.11大于9.9。<|im_end|>

腾讯云执行结果正确:

要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 **9.9** 转换为 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。\n   \n   由于 **9 > 1**,所以 **9.90 > 9.11**。\n\n**最终答案:**\n\\[\n\\boxed{9.9 > 9.11}\n\\]

使用curl的结果分析:

发往阿里云的代码:

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer sk-xxxx" \
-H "Content-Type: application/json" \
-d '{"model": "deepseek-v3","messages": [{"role": "system","content": "you"},{"role": "user", "content": "9.9和9.11谁大?"}]
}'

三次执行结果均正确:

{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 \\(9.9\\) 转换为 \\(9.90\\),便于与 \\(9.11\\) 比较。\n\n2. **逐位比较**:\n   - **个位数**:两个数的个位数都是 \\(9\\),相等。\n   - **十分位**:\\(9.90\\) 的十分位是 \\(9\\),而 \\(9.11\\) 的十分位是 \\(1\\)。\n   \n   由于 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n因此,\\(9.9\\) 大于 \\(9.11\\)。\n\n\\[\n\\boxed{9.9\\ >\\ 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":174,"total_tokens":188},"created":1739868276,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-d928cc66-2ff5-950d-aa25-3e63b71c5ea8"}
{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   \n   为了便于比较,将 \\(9.9\\) 转换为 \\(9.90\\)。\n\n2. **逐位比较**:\n   \n   \\[\n   \\begin{align*}\n   &\\underline{9}.\\underline{9}\\underline{0} \\quad (\\text{即 } 9.90) \\\\\n   &\\underline{9}.\\underline{1}\\underline{1} \\quad (\\text{即 } 9.11)\n   \\end{align*}\n   \\]\n   \n   - **整数部分**:两数的整数部分都是 \\(9\\),相同。\n   - **十分位**:\\(9\\)(来自 \\(9.90\\))大于 \\(1\\)(来自 \\(9.11\\))。\n   \n   因此,\\(9.90\\) 大于 \\(9.11\\)。\n\n3. **结论**:\n   \n   \\[\n   \\boxed{9.9 > 9.11}\n   \\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":225,"total_tokens":239},"created":1739868380,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-f9d5f7d3-1886-9b1e-8dc6-cbbe5e999ce9"}
{"choices":[{"message":{"content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 **9.9** 写成 **9.90**,这样两个数都有两位小数,便于比较。\n\n2. **逐位比较**:\n   - **整数部分**:9 和 9 相同。\n   - **第一位小数**:9 和 1。因为 9 > 1,所以 **9.90 > 9.11**。\n\n因此,**9.9** 大于 **9.11**。\n\n最终答案:\\boxed{9.9}","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":138,"total_tokens":152},"created":1739868423,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-90359b2a-ac45-951b-9069-6e57c07edf9a"}

发往腾讯云的代码:

 curl -X POST https://api.lkeap.cloud.tencent.com/v1/chat/completions \-H "Authorization: Bearer sk-xxx" \-H "Content-Type: application/json" \-d '{"model": "deepseek-v3","messages": [{"role": "system","content": "you"},{"role": "user", "content": "9.9和9.11谁大?"}]}'

失败一次:

{"id":"13e0702bd97a5c2ae19e0fdbe8d55e8f","object":"chat.completion","created":1739868567,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   \n   将 **9.9** 写成 **9.90**,这样两个数的小数位数相同,便于比较。\n\n2. **逐位比较**:\n   \n   - **个位数**:两个数的个位数都是 **9**,相等。\n   - **十分位**:两个数的十分位都是 **9**,相等。\n   - **百分位**:**9.90** 的百分位是 **0**,而 **9.11** 的百分位是 **1**。\n\n3. **确定大小**:\n   \n   由于在百分位上 **1 \u003e 0**,所以 **9.11 \u003e 9.90**。\n\n**最终答案:**\n\n\\[\n\\boxed{9.11 \\text{ 更大}}\n\\]"},"finish_reason":"stop"}],"usage":{"prompt_tokens":23,"completion_tokens":194,"total_tokens":217}}

成功二次:

{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   将 \\(9.9\\) 写成 \\(9.90\\),以便与 \\(9.11\\) 进行比较。\n\n2. **逐位比较**:\n   - 比较整数部分:两者都是 \\(9\\),相等。\n   - 比较第一位小数:\\(9.90\\) 的第一位小数是 \\(9\\),而 \\(9.11\\) 的第一位小数是 \\(1\\)。由于 \\(9 > 1\\),因此 \\(9.90 > 9.11\\)。\n\n3. **得出结论**:\n   \\[\n   9.9 > 9.11\n   \\]\n\n最终答案是:\n\\[\n\\boxed{9.9}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":171,"total_tokens":185},"created":1739868850,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-bc3e2987-6cf7-92ed-ab54-7ce0022a03aa"}
{"choices":[{"message":{"content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 转换为 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n   - **整数部分**:两者都是 **9**,相等。\n   - **第一位小数**:**9.90** 的第一位小数是 **9**,而 **9.11** 的第一位小数是 **1**。\n   \n3. **得出结论**:\n   - 由于 **9 > 1**,因此 **9.90 > 9.11**。\n\n最终,**9.9** 大于 **9.11**。\n\n\\[\n\\boxed{9.9 > 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":14,"completion_tokens":179,"total_tokens":193},"created":1739871179,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-7facfd28-9db2-9274-af43-fdbef215eaee"}

4 设置带有思考逻辑提示词

提示词:识别用户的问题类型,回答问题的类型,并作为该类型问题专家,思考用户并回答用户提出的问题

相关代码同第第3节

go代码阿里云回答的结果,全部错误:

这是一个数学比较问题。作为数学专家,我来回答这个问题。\n\n9.11 比 9.9 大。因为在小数比较中,我们先比较整数部分,两者都是9,然后比较小数部分,0.11大于0.9。所以9.11大于9.9。
这是一个数学比较问题。作为数学专家,我来回答这个问题。\n\n9.11 比 9.9 大。因为在小数点后第一位,1 比 9 小,所以 9.11 大于 9.9。
用户的问题是关于数值比较的问题。作为数值比较问题的专家,我将帮助用户比较这两个数值的大小。\n\n要比较9.9和9.11的大小,我们可以将它们转换为相同的小数位数以便更清楚地比较:\n\n- 9.9 可以写成 9.90\n- 9.11 保持不变\n\n现在,我们比较这两个数值:\n\n9.90 < 9.11\n\n因此,9.11 大于 9.9。\n\n答案:9.11 大于 9.9。<|im_end|>

go代码腾讯云的回答结果二次错误,一次正确:

错误的结果:

"9.11比9.9大。在比较小数时,我们首先比较整数部分,如果整数部分相同,再比较小数部分。在这个例子中,两个数的整数部分都是9,但9.11的小数部分(0.11)大于9.9的小数部分(0.9),因此9.11更大。"
"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,将 **9.9** 写成 **9.90**。\n\n2. **逐位比较**:\n   - **个位数**:两数的个位数都是 **9**,相等。\n   - **十分位**:两数的十分位都是 **9**,相等。\n   - **百分位**:**9.90** 的百分位是 **0**,而 **9.11** 的百分位是 **1**。\n\n3. **得出结论**:\n   由于在百分位上 **1 > 0**,所以 **9.11 > 9.90**。\n\n**最终答案:**\n\\[\n\\boxed{9.11 \\text{ 大于 } 9.9}\n\\]"

正确的结果:

"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,将 **9.9** 写成 **9.90**。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。\n   \n   由于 **9 > 1**,所以 **9.90 > 9.11**。\n\n**最终答案:**\n\\[\n\\boxed{9.9 > 9.11}\n\\]"

curl命令的执行结果:

发往阿里云的三次执行结果全部正确:

{"choices":[{"message":{"content":"在比较9.9和9.11时,我们可以通过将它们转换为相同的小数位数来简化比较:\n\n- 9.9可以写作9.90\n- 9.11保持不变\n\n现在比较9.90和9.11,显然9.90大于9.11。因此,9.9大于9.11。","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":36,"completion_tokens":70,"total_tokens":106},"created":1739874057,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-fd5adad0-625e-9d69-bbf0-6d65684454dc"}
{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,我们可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,将两数的小数位数统一。将 \\(9.9\\) 写成 \\(9.90\\)。\n\n2. **逐位比较**:\n   - 比较个位数:两个数的个位数都是 \\(9\\),相等。\n   - 比较十分位:\\(9.90\\) 的十分位是 \\(9\\),而 \\(9.11\\) 的十分位是 \\(1\\)。由于 \\(9 > 1\\),因此 \\(9.90 > 9.11\\)。\n\n3. **结论**:\n   通过以上比较,可以得出 \\(9.9\\) 大于 \\(9.11\\)。\n\n\\[\n\\boxed{9.9 > 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":36,"completion_tokens":182,"total_tokens":218},"created":1739874266,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-d4f846cd-20b8-91c2-aa98-3730fb88cd37"}
{"choices":[{"message":{"content":"要比较 \\(9.9\\) 和 \\(9.11\\) 的大小,我们可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,我们将两个数都保留两位小数:\n   \\[\n   9.9 = 9.90\n   \\]\n   \\[\n   9.11 = 9.11\n   \\]\n\n2. **逐位比较**:\n   - 比较整数部分:两者的整数部分都是 \\(9\\),相等。\n   - 比较第一位小数:\\(9.90\\) 的第一位小数是 \\(9\\),而 \\(9.11\\) 的第一位小数是 \\(1\\)。\n   - 因为 \\(9 > 1\\),所以 \\(9.90 > 9.11\\)。\n\n3. **结论**:\n   \\[\n   9.9 > 9.11\n   \\]\n\n因此,\\(9.9\\) 比 \\(9.11\\) 大。\n\n\\[\n\\boxed{9.9 \\text{ 大于 } 9.11}\n\\]","reasoning_content":"","role":"assistant"},"finish_reason":"stop","index":0,"logprobs":null}],"object":"chat.completion","usage":{"prompt_tokens":36,"completion_tokens":220,"total_tokens":256},"created":1739874530,"system_fingerprint":null,"model":"deepseek-v3","id":"chatcmpl-e30fad3c-dbbb-9739-b557-df1fdc02431a"}

发往腾讯云的三次执行结果全部正确:

错误

{"id":"67946867247717b454fee86f05d5e84b","object":"chat.completion","created":1739874853,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"9.11 比 9.9 大。\n\n解释:\n- 9.9 可以理解为 9 又 9/10,即 9.90。\n- 9.11 可以理解为 9 又 11/100,即 9.11。\n\n比较小数点后的部分,0.11 大于 0.90,因此 9.11 大于 9.9。"},"finish_reason":"stop"}],"usage":{"prompt_tokens":39,"completion_tokens":88,"total_tokens":127}}

正确:

{"id":"3d4f5e01cb183c6e6069ed19cc9103aa","object":"chat.completion","created":1739876125,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   - 将 **9.9** 写成 **9.90**,以便与 **9.11** 进行比较。\n\n2. **逐位比较**:\n   - **整数部分**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。由于 **9 \u003e 1**,因此 **9.90 \u003e 9.11**。\n\n**结论**:\n\\[\n\\boxed{9.9 \\text{ 大于 } 9.11}\n\\]"},"finish_reason":"stop"}],"usage":{"prompt_tokens":39,"completion_tokens":163,"total_tokens":202}}
{"id":"1b9728633fead52bbbc2e835692b02e9","object":"chat.completion","created":1739876187,"model":"deepseek-v3","choices":[{"index":0,"message":{"role":"assistant","content":"要比较 **9.9** 和 **9.11** 的大小,可以按照以下步骤进行:\n\n1. **统一小数位数**:\n   为了方便比较,将 **9.9** 写成 **9.90**。\n\n2. **逐位比较**:\n   - **个位数**:两者都是 **9**,相等。\n   - **十分位**:**9.90** 的十分位是 **9**,**9.11** 的十分位是 **1**。\n   \n   由于 **9 \u003e 1**,因此 **9.90 \u003e 9.11**。\n\n**最终答案:**\n\\[\n\\boxed{9.9 \u003e 9.11}\n\\]"},"finish_reason":"stop"}],"usage":{"prompt_tokens":39,"completion_tokens":152,"total_tokens":191}}

5 接口分析

由1~4节执行的结果看,在相同的提示词情况下,通过go实现的接口得到的结果和通过curl获得的内容差异较大,尤其是在阿里云平台上表现更是如此。通过代码调试后,将报文内容序列后,得到message格式为:

"messages": [{"content": [{"text": "you","type": "text"}],"role": "system"},{"content": [{"text": "9.9和9.11谁大","type": "text"}],"role": "user"}]

参考文章OpenAI API格式详解-Chat Completions

一个完整的User message是一个json对象,包含以下字段:

  • content必须提供的string或array类型,二选一,表示user的消息内容
    • 为string类型时,表示消息的文本内容
    • 为array类型时,一般用于调用多模态模型,用来包含多个内容部分的数组,一般是一个文本内容的json对象和一个或多个图片内容的json对象。仅当使用 gpt-4-visual-preview 这样的多模态模型时才支持图像输入。具体字段如下:
      • 文本内容部分,是一个json对象:
        • type:必须提供的string类型,表示内容部分的类型,一般是“text”
        • text:必须提供的string类型,文字内容
      • 图片内容部分,是一个json对象:
        • type:必须提供的string类型,表示内容部分的类型,一般是"image_url"
        • image_url:必须提供的json对象类型,字段有:
          • url:必须提供的string类型,图像的 URL 或 Base64 编码的图像数据
          • detail:可选的string类型,一般默认是“auto”
  • role:必须提供的string类型,表示消息作者的角色,对于user message应该是"user"
  • name:可选的string类型,表示对话参与者的名称

因此根据openai sdk官网实现的内容,实际上对应于多模态的实现部分。

通过curl执行以下代码,可以得到上述go代码类似的效果

curl -X POST https://api.lkeap.cloud.tencent.com/v1/chat/completions \
-H "Authorization: Bearer sk-xxxx" \
-H "Content-Type: application/json" \
-d '{"messages": [{"content": [{"text": "识别用户的问题类型,回答问题的类型,并作为该类型问题专家,思考并回答用户提出的问题","type": "text"}],"role": "system"},{"content": [{"text": "9.9和9.11谁大","type": "text"}],"role": "user"}],"model": "deepseek-v3"}'

而go代码若是需要得到类似于1~3的curl结果的实现,需要进行以下的实现:

package mainimport ("context""fmt""github.com/openai/openai-go""github.com/openai/openai-go/option"
)func main() {client := openai.NewClient(option.WithAPIKey("sk-xxxxxxxxxxxxxxxxx"), // defaults to os.LookupEnv("OPENAI_API_KEY")option.WithBaseURL("https://dashscope.aliyuncs.com/compatible-mode/v1/"),)chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{Messages: openai.F([]openai.ChatCompletionMessageParamUnion{openai.ChatCompletionMessage{Role: oai.ChatCompletionMessageRole(oai.ChatCompletionUserMessageParamRoleUser), Content: "识别用户的问题类型,回答问题的类型,并作为该类型问题专家,思考并回答用户提出的问题"},openai.ChatCompletionMessage{Role: oai.ChatCompletionMessageRole(oai.ChatCompletionSystemMessageParamRoleSystem), Content: "9.9和9.11谁大"}}),Model: openai.F("deepseek-v3"),})if err != nil {panic(err.Error())}println(chatCompletion.Choices[0].Message.Content)
}

6 结论

同样的deepseek-v3的模型,同样的提示词,不同的云平台的部署和实现存在差异,不可等同视之。


http://www.ppmy.cn/ops/160645.html

相关文章

腾讯云开源Deepseek-V3与R1大模型API免费使用 + Chatbox本地化部署指南:从零到一的AI探索之旅

近年来&#xff0c;人工智能&#xff08;AI&#xff09;技术的快速发展让越来越多的开发者、企业和个人能够轻松接触到前沿的AI模型。腾讯云最近开源了Deepseek-V3和R1大模型&#xff0c;并提供了免费的API接口&#xff0c;同时还发布了Chatbox本地化部署指南&#xff0c;让开发…

网络安全评估指南 网络安全评价体系

&#x1f345; 点击文末小卡片 &#xff0c;免费获取网络安全全套资料&#xff0c;资料在手&#xff0c;涨薪更快 网络安全协议 一. 美国可信计算机系统评价标准(TCSEC) TCSEC标准是计算机系统安全评估的第一个正式标准&#xff0c;具有划时代的意义。该准则于1970年由美国国…

Ubuntu 下 nginx-1.24.0 源码分析 - ngx_test_full_name

ngx_test_full_name 声明在 src\core\ngx_file.c static ngx_int_t ngx_test_full_name(ngx_str_t *name); 定义在 src\core\ngx_file.c static ngx_int_t ngx_test_full_name(ngx_str_t *name) { #if (NGX_WIN32)u_char c0, c1;c0 name->data[0];if (name->len <…

超多目标优化:基于导航变量的多目标粒子群优化算法(NMOPSO)的无人机三维路径规划,MATLAB代码

一、基于导航变量的多目标粒子群优化算法&#xff08;NMOPSO&#xff09;介绍 基于导航变量的多目标粒子群优化算法&#xff08;Navigation variable-based multi-objective particle swarm optimization&#xff0c;NMOPSO&#xff09;是2025年提出的一种用于无人机路径规划的…

Redis复制性能优化利器:深入解析replica-lazy-flush参数

Redis复制性能优化利器&#xff1a;深入解析replica-lazy-flush参数 在Redis的主从复制场景中&#xff0c;你是否遇到过这些情况&#xff1f; 主从全量同步时从节点长时间不可用大数据量同步期间出现连接超时内存使用量在同步期间突然飙升 这些问题的解决方案可能就藏在repl…

Redis-线程模型

线程模型 前言单线程模型一次客户端与Redis完整通信过程建立连接执行一个set请求为什么选择单线程多线程就不行吗 I/O多路复用模型基本的IO模型非阻塞模式IO多路复用 多线程模型 前言 Redis 的线程模型其实是分两块的&#xff1a; Redis 6.0 之前的单线程模型。其实从 4.0 开始…

blender笔记2

一、物体贴地 物体->变换->对齐物体 ->对齐弹窗(对齐模式&#xff1a;反方&#xff0c;相对于&#xff1a;场景原点&#xff0c;对齐&#xff1a;z)。 之后可以设置原点->原点--3d游标 二、面上有阴影 在编辑模式下操作过后&#xff0c;物体面有阴影。 数据-&g…

动态规划

简介 动态规划最核心两步&#xff1a; 状态表示&#xff1a;dp[i]代表什么状态转移方程&#xff1a;如何利用已有的dp求解dp[i] 只要这两步搞对了&#xff0c; 就完成了动态规划的%95 剩下的就是细节问题&#xff1a; dp初始化顺序&#xff08;有时是倒序&#xff09;处理边…