Back to List
Hard
🔴
Chain of Thought
Hard • Prompt Engineering Challenge
Guide models through multi-step reasoning
挑战描述
思维链(Chain of Thought)是一种强大的提示技术,它引导 AI 逐步显式地展示推理过程,而不是直接给出结论。通过引导 AI 分解复杂问题并展示每一步的思考过程,可以显著提高解决复杂推理任务的准确性。本挑战要求你设计一个提示词,使 AI 能够通过清晰的思维链解决复杂的多步骤推理问题。
挑战目标
编写一个提示词,使 AI 能够:
- 将复杂问题分解为逻辑连贯的子步骤
- 明确展示每个推理步骤及其依据
- 在每个步骤上应用适当的知识和逻辑
- 识别并处理推理中的不确定性或假设
- 最终基于完整的推理链得出结论
要求
- 提示词必须鼓励分步骤推理,而非跳跃到结论
- 每个推理步骤必须明确且有逻辑支持
- 思维链必须针对问题特点进行适当的分解
- 推理过程中应考虑多种可能性,必要时进行评估筛选
- 最终结论应直接源自前面的推理步骤
提示模板
[你的提示词]
问题: {问题描述}
自动测试流程
- 对每个测试用例,使用你的提示词和问题作为输入
- 分析输出是否包含明确标记的多个推理步骤
- 评估每个步骤与下一步骤之间的逻辑连贯性
- 检查是否考虑了关键的多种可能性
- 验证结论的正确性和完整性
- 计算最终得分(满分5分)
期望输出示例 (针对案例1)
我将通过逐步分析每个人的陈述,确定谁在说真话,谁在说谎。
步骤1: 分析C的陈述。
C说:"我是说谎者。"
这里出现一个逻辑悖论:如果C是说谎者,他说的"我是说谎者"就是假话,那么C实际上是诚实人。但如果C是诚实人,他说"我是说谎者"就是真话,这就意味着他是说谎者。这形成了自相矛盾的循环。
结论:C不可能是说谎者,也不可能是诚实人...等等,我需要重新思考。
步骤2: 重新分析C的陈述。
如果C是诚实人,他会说"我是诚实人",但他实际说"我是说谎者",这与诚实人的定义矛盾。
如果C是说谎者,他说"我是说谎者"必须是假话,意味着他实际上是诚实人,这又与我们的假设矛盾。
由于存在矛盾,C的陈述在这个逻辑体系内无法成立,除非...C一定是说谎者。作为说谎者,他说"我是说谎者"这句话是假的,即他实际上不是说谎者。但这与前提矛盾。我们需要重新检视题目条件。
步骤3: 重新审视问题规则。
题目规定诚实人总是说真话,说谎者总是说假话。如果C说"我是说谎者",根据这个规则:
如果C是诚实人,他说的必须是真话,但这会导致矛盾。
如果C是说谎者,他说的必须是假话,即"我不是说谎者",这也导致矛盾。
这表明C一定是说谎者,因为诚实人不会说"我是说谎者"这种自相矛盾的话。
步骤4: 分析B的陈述。
B说:"如果A是诚实人,那么C也是诚实人。"
我们已经确定C是说谎者,所以B的陈述等价于"如果A是诚实人,那么假"。
这意味着,如果B是诚实人,那么A必须是说谎者,否则会导致矛盾。
如果B是说谎者,那么他的陈述的否定为真,即"A是诚实人,但C不是诚实人"可能为真。
步骤5: 分析A的陈述。
A说:"我是诚实人或者B是说谎者。"
这是一个逻辑或关系,只要有一个为真,整个陈述就为真。
步骤6: 综合分析所有信息。
我们已确定C是说谎者。
如果A是诚实人,根据他的陈述,"我是诚实人或B是说谎者"为真。但由于A是诚实人这部分已经满足了整个或关系,这不能确定B的身份。
如果A是说谎者,他的陈述"我是诚实人或B是说谎者"必须是假的。这意味着两部分都是假的,即A不是诚实人(已知)且B不是说谎者,即B是诚实人。
如果B是诚实人,他说"如果A是诚实人,那么C也是诚实人"必须为真。由于C是说谎者,这意味着A不能是诚实人,即A是说谎者。
如果B是说谎者,A可能是诚实人或说谎者。
检查一下所有组合:
- 如果A和B都是诚实人,C是说谎者:A的陈述为真,B的陈述为"如果真,那么假",这是假的,矛盾!
- 如果A是诚实人,B和C都是说谎者:A的陈述为真,B的陈述为"如果真,那么假"的否定,即"真且假",仍然矛盾!
- 如果A和C都是说谎者,B是诚实人:A的陈述"我是诚实人或B是说谎者"为假,即"A不是诚实人且B不是说谎者",符合!B的陈述为"如果假,那么假",为真,符合!
- 如果A、B、C都是说谎者:A的陈述为假,即"A不是诚实人且B不是说谎者",矛盾!
结论:A和C是说谎者,B是诚实人。
提交你的解决方案,与社区分享你的思路和技巧!
Write Your Prompt
Write your AI prompt based on the requirements
0 / 2000
Tips for Better Prompts
- Be specific and clear about what you want
- Provide context and examples when helpful
- Use appropriate tone and style for your audience
- Test and iterate to improve your results
Need help? Join our community
View Discussions