提示词挑战

🟡

多模态处理

中等提示词工程挑战

处理文本和图像的多模态信息

挑战描述

多模态处理是指同时处理文本、图像、音频等多种类型数据的能力。本挑战要求你设计一个提示词,使 AI 能够理解并处理包含多种模态信息的输入,进行跨模态的分析和推理。

挑战目标

编写一个提示词,使 AI 能够:

  1. 识别输入中的不同模态信息(文本、图像描述、音频描述等)
  2. 理解不同模态信息之间的关联和互补关系
  3. 基于多模态信息进行综合分析
  4. 生成跨模态的推理和结论
  5. 处理模态信息缺失或不一致的情况

要求

  • 提示词必须能处理多种模态的组合输入
  • 分析结果应体现多模态信息的综合理解
  • 对于模态冲突,应能识别并合理处理
  • 输出应包含对每个模态的分析和综合结论
  • 处理过程应清晰可追溯

提示模板

[你的提示词]

输入内容:
文本: {文本内容}
图像描述: {图像描述}
音频描述: {音频描述}
任务: {具体任务}

自动测试流程

  1. 对每个测试用例,使用你的提示词作为输入
  2. 分析输出是否包含:
    • 对各模态信息的单独分析
    • 跨模态关联分析
    • 综合结论
  3. 评估分析的准确性和深度
  4. 检查冲突处理的合理性
  5. 验证输出结构的清晰度
  6. 计算最终得分(满分10分)

期望输出示例 (针对案例1)

多模态分析结果:

## 各模态分析
**文本模态**: 用户对手机拍照功能评价积极,但对电池续航不满意
**图像模态**: 照片质量确实很高,色彩鲜艳,细节丰富,证实了拍照效果
**音频模态**: 拍照操作流畅,快门声清脆,说明相机响应良好

## 跨模态关联
- 图像模态支持了文本中对拍照功能的正面评价
- 音频模态进一步证实了相机操作的流畅性
- 三个模态信息在拍照功能方面高度一致

## 综合结论
用户对这款手机拍照功能的评价是准确的,照片质量确实优秀,操作体验良好。但电池续航问题确实存在,这是需要改进的地方。整体而言,这是一款拍照功能出色但续航有待提升的手机。

## 置信度: 90%
理由: 多模态信息高度一致,分析结果可靠。

提交你的解决方案,与社区分享你的思路和技巧!

编写你的 Prompt

根据题目要求,编写你的 AI 提示词

0 / 2000

提示词编写技巧

  • 明确具体地表达你的需求
  • 在需要时提供上下文和示例
  • 根据受众使用适当的语气和风格
  • 测试并迭代以改进结果

需要帮助?加入我们的社区

查看讨论