AI赋能质性研究(一):质性编码全流程 AI Prompt 包
从第一轮编码 → 模式编码 · 完整提示词工具集 理论来源Qualitative Data Analysis: A Methods SourcebookMiles, Huberman Saldaña 适用人群质性研究者、博士生、社科研究员️ 使用指南本Prompt包遵循书中编码三阶段框架 【第一阶段】数据准备 → 用Prompt 0 做数据预处理 【第二阶段】第一轮编码 → 用Prompt 1~5按编码类型选择 【第三阶段】第二轮模式编码 → 用Prompt 6~9聚类→主题→理论 【第四阶段】编码质量控制 → 用Prompt 10~12 每个Prompt均包含 ✅ 理论依据 ✅ 完整提示词 ✅ 使用说明 ✅ 输出示例⚙️ PROMPT 0数据准备与转录预处理理论依据书中强调质性数据转录存在信息损耗研究者需在分析前对文本进行规范化处理明确数据类型访谈/田野笔记/文档等。【数据准备Prompt】 你是一位质性研究方法专家。我将向你提供一段原始数据文本访谈转录稿/田野笔记/文档等。 请按以下步骤帮我完成分析前的数据准备工作 1. **文本规范化** - 识别并标注发言者如访谈者/受访者或[R1]/[I]等 - 保留语气词和停顿标记如嗯、呃、...但注明这些是语气标记 - 将明显的口误或语法断句修正并在括号内注明原文 2. **数据基本描述** - 数据类型访谈/观察记录/文件等 - 数据长度和大致覆盖话题 - 发言者数量与基本身份 3. **分析前检视** - 找出文本中3~5个最有潜力成为分析焦点的段落请加粗标注 - 识别任何明显的情绪信号或关键事件描述 4. **研究者提示** - 提醒我注意任何可能影响数据解读的背景信息缺失 --- 【请将你的原始数据粘贴在这里】 数据类型[填写访谈转录/田野笔记/文档/其他] 研究主题简述[填写] 数据来源背景[如2024年6月对某大学教师进行的半结构化访谈]️ PROMPT 1描述性编码Descriptive Coding理论依据书中定义描述性编码为用一个词或短语通常是名词总结质性数据段落的基本主题最适用于民族志研究和多种数据形式的研究。【描述性编码Prompt】 你是一位经验丰富的质性研究编码专家擅长Saldaña描述性编码Descriptive Coding方法。 请对我提供的数据段落进行第一轮描述性编码具体要求如下 **编码规则** - 每个代码使用1个名词或简短名词短语建议全大写如SCHOOL ENVIRONMENT - 以数据说了什么为标准先描述现象不做解释或推断 - 一个数据段可以分配1~3个描述性代码多个代码请用 | 分隔 - 如果某段内容与研究主题无关标注[IRRELEVANT] **输出格式**请严格遵守 | 段落编号 | 原文摘录保留50字内 | 描述性代码 | 简短说明为何选此代码 | |---------|---------------------|-----------|----------------------| **分析后**请用2~3句话总结这段数据最高频出现的描述性主题是什么 --- 研究问题[填写你的研究问题] 数据段落[粘贴数据] 使用示例输入示例田野笔记片段 走向学校时一个街区外有一家7-11便利店旁边是一座小型专业办公楼验光师、 足病医生和其他医疗/健康相关诊所。街对面是一片空地旁边有一家汉堡王餐厅。 期望输出示例 | 1 | 7-11便利店、专业办公楼... | BUSINESSES商业机构| 描述社区内存在的各类商业形态 | | 1 | 医疗/健康相关诊所 | HEALTH SERVICES健康服务| 特指诊疗性商业集中出现 |️ PROMPT 2原话编码In Vivo Coding理论依据书中将 In Vivo 编码定义为使用参与者自己的语言中的词语或短语作为代码能优先保留和尊重参与者声音特别适合初学者和文化研究。【原话编码 Prompt】 你是一位质性研究专家现在运用 Saldaña 的 In Vivo 编码原话编码方法处理我的数据。 **In Vivo编码的核心原则** - 直接使用参与者的原话或关键词作为代码用引号标注 - 重点捕捉参与者反复使用的词/短语、情绪化表达、独特的本土说法 - 参与者反复出现的短语是模式线索——请特别标记加⚡符号 **请完成以下任务** **任务一原话代码提取** 从数据中提取所有值得作为代码的原话表达输出格式 | 原话代码引号内| 出现次数 | 所在语境摘录 | 是否为⚡高频线索 | **任务二语义聚类初探** 将提取的原话代码按语义相似性初步分为2~4个簇并为每个簇命名。 **任务三文化敏感性标注** 识别其中是否有具有特定文化、亚文化或群体含义的表达如行话、暗语、隐语 如有请用【文化标记】标注并说明含义。 --- 研究背景[填写] 参与者身份[填写如某高校教师、农村留守妇女等] 数据内容[粘贴数据] PROMPT 3过程编码Process Coding理论依据书中将过程编码定义为专门使用动名词-ing形式来表示数据中可观察和概念化的行动是扎根理论研究的核心编码工具适用于捕捉行动、变化与序列。【过程编码 Prompt】 你是一位擅长扎根理论方法的质性研究专家。 请使用 Saldaña 的过程编码Process Coding方法分析我的数据。 **过程编码规则** - 所有代码必须是动名词形式-ing词如抵抗变化、建立信任、协商规则 - 聚焦于行动、互动、策略、应对行为、转变过程 - 特别关注时间动态——事物如何随时间演变 **请完成以下分析** **第一步行动提取** 识别数据中所有可被编码为行动的内容 | 过程代码动名词| 行动主体谁在做| 行动对象对谁/什么| 原文依据 | **第二步行动序列重构** 根据数据尝试重构一条行动时间线如果数据包含时间信息 时间点1 → [行动] → 时间点2 → [行动] → ... **第三步核心过程识别** 综合以上用一句动名词短语描述这段数据的核心过程是什么 例如持续应对压力下的身份重建 --- 研究问题[填写] 数据类型[访谈/观察记录] 数据内容[粘贴数据]❤️ PROMPT 4情感编码Emotion Coding理论依据书中情感编码用于标记参与者回忆和/或经历的情绪并区分参与者自标情绪In Vivo和研究者推断情绪两种来源适用于探索参与者内心世界与人际体验。【情感编码 Prompt】 你是一位具备心理学敏感性的质性研究专家擅长情感编码Emotion Coding方法。 请对我的数据进行情感编码分析区分以下两类来源 - 【直接情绪】参与者明确说出的情绪词使用原话编码加引号 - 【推断情绪】研究者根据语境、措辞、语气推断的情绪标注[推断] **分析任务** **任务一情感代码表** | 情感代码 | 类型直接/推断| 强度低/中/高| 原文依据 | 情绪指向对谁/什么| **任务二情感弧线** 描绘这段数据中参与者的情感变化轨迹如有时间或事件顺序 [事件/时刻] → [情感状态] → [事件/时刻] → [情感状态] **任务三情感聚类** 将所有情感代码按照正向/负向/矛盾/中性分类 并判断这段数据的主导情感基调是什么 **任务四研究者注意事项** 识别任何需要研究者保持警觉的偏见风险—— 例如研究者是否可能因为移情而过度放大某种情绪解读 --- 研究背景[填写] 数据内容[粘贴数据] PROMPT 5价值观编码Values Coding理论依据书中将价值观编码定义为反映参与者的价值观V:、态度A:和信念B:的三类代码代表参与者的世界观适用于文化、身份认同与意识形态研究。【价值观编码 Prompt】 你是一位熟悉 Saldaña 价值观编码Values Coding框架的质性研究专家。 请对数据进行系统的 V-A-B 三维编码分析。 **三维编码框架** - V价值观 Values参与者认为什么是重要的、有价值的前缀标记V: - A态度 Attitudes参与者如何看待某人/事/物前缀标记A: - B信念 Beliefs参与者的深层信念系统、道德判断、人生哲学前缀标记B: **分析任务** **任务一VAB代码提取** | 代码V:/A:/B:开头| 所属维度 | 强度明示/隐含| 原文依据 | **任务二世界观素描** 综合所有VAB代码用150字以内描绘这位参与者或这段数据中体现的世界观图像。 **任务三内在张力识别** 是否存在价值观/态度/信念之间的矛盾或张力 如有请描述这种张力并说明其对研究主题的意义。 **任务四跨文化提示** 如果这段数据涉及特定文化群体请标注任何需要文化敏感理解的价值观表达。 --- 研究主题[填写] 参与者背景[填写] 数据内容[粘贴数据] PROMPT 6第一轮编码汇总整理理论依据书中强调第一轮编码结束后需要对所有代码进行聚类整理为进入第二轮模式编码做准备。代码本Codebook是这一阶段的核心产出。【第一轮编码汇总 代码本生成 Prompt】 你是一位质性研究方法专家。我已完成对数据的第一轮编码现在需要你帮我整理和构建代码本Codebook。 我的第一轮编码结果如下 [将你的所有第一轮代码列在此处可以是列表或表格形式] **请完成以下任务** **任务一代码清单标准化** - 合并重复或几乎相同的代码 - 标注每个代码出现的频率高频/中频/低频 - 标注每个代码的类型描述性/过程性/情感性/价值观性/In Vivo 输出一张标准化的代码清单表。 **任务二代码操作定义** 为每个重要代码写一句清晰的操作定义不超过30字确保 - 另一位研究者看到这个定义能在相同场景下做出一致的编码判断 - 明确代码的边界什么情况包括什么情况不包括 **任务三初步代码聚类** 根据语义相关性将所有代码进行初步分组建议3~7个组 每组给出一个暂定的组名这将成为模式编码的原材料。 **任务四代码质量自检** 指出代码本中可能存在的问题 - 哪些代码定义模糊需要澄清 - 哪些代码之间有重叠需要合并或区分 - 哪些现象在数据中已出现但尚未被编码覆盖 PROMPT 7模式编码——聚类与主题提炼理论依据书中将模式编码定义为第二轮方法将第一轮编码分组为更少数量的类别、主题或构念功能类似聚类分析是从数据到理论的关键跨越。【模式编码——聚类与主题提炼 Prompt】 你是一位精通 Miles Huberman 质性分析框架的研究专家。 我已完成第一轮编码现在进行第二轮**模式编码Pattern Coding**。 **我的第一轮代码列表** [粘贴代码列表] **研究问题**[填写] **模式编码四步流程**请逐步完成 **Step 1代码聚类** 将上述第一轮代码进行聚类识别语义上相关或互补的代码群。 请按以下格式输出 聚类A[聚类名称] 包含代码[代码1, 代码2, 代码3...] 聚类理由[为什么这些代码属于同一组] 聚类B[聚类名称] ... **Step 2模式命名** 为每个聚类命名一个模式代码模式代码应是 - 解释性或推断性的不只是描述 - 能反映这组代码背后的更高层次含义 - 来自以下四种形式之一 ① 主题/类别如RULES ② 原因/解释如DYSFUNCTIONAL DIRECTION ③ 人际关系如LEADERS NETWORK ④ 理论建构如BARGAINING **Step 3模式验证** 对每个模式代码进行批判性自检 - 这个模式是否有足够的数据支撑请引用原始代码证据 - 是否存在反例或例外如有是否需要为模式加条件限定 **Step 4子代码建议** 如果某个模式代码过于笼统如包含10个以上下级代码 请建议拆分为2~3个子代码并命名。 格式主代码-子代码如RULES-INDIV, RULES-PUBLIC, RULES-WORK️ PROMPT 8模式映射Pattern Mapping与可视化理论依据书中指出将模式编码映射出来是有用的方法——展示组成该模式的分代码以网络图形式可视化观察各个组成部分如何相互连接这是形成概念框架的前奏。【模式映射 可视化描述 Prompt】 你是一位质性研究专家现在帮我将模式编码结果转化为可视化的模式地图。 **我的模式编码结果** [粘贴模式编码聚类结果] **任务一模式地图描述文字版网络图** 请用文字描述一张网络图展示 - 核心模式代码节点之间的关系连线 - 每条连线的关系类型如包含/导致/对立/相互强化/时间先后 - 哪个模式代码是枢纽节点与最多其他节点连接 输出格式 [模式A] ──导致──→ [模式B] [模式A] ←─对立─→ [模式C] [模式B] ──包含──→ [子模式B1] [子模式B2] **任务二Mermaid代码可直接导入绘图工具** 请将上述网络图转化为Mermaid格式的流程图代码 我可以粘贴到 https://mermaid.live/ 直接生成可视化图。 **任务三认知地图叙述** 用一段100~150字的叙述性文字 描述这张模式地图所揭示的认知地图—— 即在这个研究情境中核心现象是什么它如何被各个模式所塑造 --- 研究背景[填写] PROMPT 9分析备忘录Analytic Memo撰写理论依据书中强调分析备忘录是定性研究中最有用和强大的意义构建工具之一备忘录记录的是思想观点而非数据摘要每条备忘录应包含日期、标题、副标题是编码到理论之间的过渡性思考文本。【分析备忘录撰写 Prompt】 你是一位质性研究方法导师现在帮我撰写一份规范的分析备忘录Analytic Memo。 **备忘录撰写背景** - 研究主题[填写] - 当前分析阶段[第一轮编码完成后 / 模式编码完成后 / 其他] - 本次备忘录聚焦的代码/模式[填写具体代码或模式名称] - 触发这次备忘录的数据片段[粘贴相关数据] **请按以下结构生成备忘录** --- 日期[今天的日期] ️ 备忘录类型[选择代码定义 / 模式分析 / 理论联系 / 研究反思 / 伦理困境 / 未来方向] 主题[模式/代码名称] 副标题[更具体的分析焦点] **一、核心洞见这个代码/模式告诉我什么** [200字以内的核心分析必须是思想和解释不是数据摘要] **二、数据证据支撑这一洞见的关键数据片段** - 证据1[引用原文] → 解读[...] - 证据2[引用原文] → 解读[...] - 反例/例外[如有如何修正这一洞见] **三、与其他代码/模式的连接** 这个代码/模式与哪些其他代码存在有趣的关联 [代码A] ←→ [当前代码]关系类型及含义 **四、理论共鸣可选** 这个洞见是否与已有理论/文献产生共鸣或矛盾 如有简要说明理论联系点。 **五、下一步分析提示** 基于这个备忘录下一步应该 - 收集更多数据关注[...] - 在其他参与者数据中检验[...] - 考虑的理论视角[...] ---✅ PROMPT 10编码一致性自检质量控制理论依据书中明确指出内部一致性和编码者间一致性应达到 85%~90% 的范围并强调清晰的操作定义是保证一致性的前提。【编码一致性自检 Prompt】 你是一位质性研究质量控制专家。请帮我对以下编码工作进行一致性自检。 **我的编码材料** - 代码本含定义[粘贴] - 已编码数据样本5~10段[粘贴] **自检任务一逻辑一致性检查** 请扮演第二位编码者的角色 对同一批数据独立进行编码基于我提供的代码本定义 然后与我的编码结果对比 - 哪些地方你的编码与我不同 - 差异产生的原因是什么定义模糊/数据歧义/理解偏差 **自检任务二代码定义质量评分** 对代码本中每个代码的操作定义进行评分1~5分 评分标准 1分 定义模糊两人编码可能差距很大 5分 定义清晰两人编码几乎必然一致 输出| 代码 | 定义评分 | 改进建议 | **自检任务三潜在偏见提示** 基于编码结果识别研究者可能存在的3个认知偏见风险 ① [...] ② [...] ③ [...] **自检任务四一致性改进建议** 给出3~5条具体建议帮助我在后续编码中提高内部一致性。 PROMPT 11编码反思与迭代更新理论依据书中强调编码是早期和持续的分析形式代码应随研究进展不断修订临时代码可以被修改、删除或扩展整体编码框架应保持动态开放性。【编码反思与迭代更新 Prompt】 你是一位质性研究方法导师。我已经完成了[X]轮编码现在需要进行反思性回顾和框架迭代。 **当前状态** - 已完成数据量[X份访谈 / X页田野笔记] - 当前代码数量[X个代码X个模式代码] - 研究问题[填写] - 目前遇到的困惑或问题[描述] **请帮我完成以下反思** **一、代码饱和度评估** 基于我描述的数据规模和代码数量 判断我的编码是否可能接近理论饱和新数据不再产生新代码 还是仍需大量扩展给出判断依据。 **二、代码框架健康检查** 请对我现有的代码体系提出以下评估 - 是否有代码过于宽泛需要拆分 - 是否有代码过于细碎可以合并 - 代码体系是否覆盖了研究问题的主要维度 - 是否存在重要的分析盲点数据中可能有但代码没有覆盖的维度 **三、编码策略调整建议** 基于以上评估建议我在后续分析中 - 需要补充哪种类型的编码如是否引入过程编码/情感编码 - 下一轮编码的优先方向是什么 - 是否需要重新编码已有数据 PROMPT 12从模式编码到断言与命题理论依据书中将断言Assertions定义为有数据证据支持的声明性总结陈述将命题Propositions定义为采用如果-那么或为什么-因为形式的条件性陈述是从编码到理论建构的最终跨越。【从模式编码到断言与命题 Prompt】 你是一位质性研究理论建构专家帮我从完成的编码分析中发展断言和命题。 **我的模式编码结果** [粘贴模式编码列表及关键数据证据] **研究问题**[填写] **研究情境**[填写研究对象、场域等背景] **任务一断言发展Assertions** 基于我的模式编码为每个核心模式发展1~2条断言。 断言格式要求 - 是声明性句子直接陈述发现 - 有明确的数据支撑 - 不是数据描述而是解释性结论 输出格式 断言1[具体陈述] 支撑证据[引用数据/代码] 置信度[高/中/低] 原因 **任务二命题发展Propositions** 将强度较高的断言转化为命题。 命题格式要求二选一 - 当...时...往往会...条件-结果型 - ...之所以...是因为...原因-解释型 输出格式 命题1[具体表述] 来源断言[断言X] 理论