一、工作流总览人机协作全景图╔══════════════════════════════════════════════════════════════════════╗ ║ AI辅助质性分析人机协作总流程 ║ ╠══════════════════════════════════════════════════════════════════════╣ ║ 研究者主导层 ←─── 设计 / 判断 / 诠释 / 伦理把关 ───→ 研究者主导层 ║ ╠══════════════════════════════════════════════════════════════════════╣ ║ ║ ║ [阶段0] 研究设计 [阶段1] 数据准备 [阶段2] AI辅助编码 ║ ║ 概念框架 研究问题 → 转录/清洗/结构化 → 自动编码 人工校验 ║ ║ ↓ ↓ ↓ ║ ║ [阶段5] 报告撰写 [阶段4] 展示构建 [阶段3] 深度分析 ║ ║ 结论 理论命题 ← 矩阵/网络/可视化 ← 模式识别 备忘录 ║ ║ ║ ╠══════════════════════════════════════════════════════════════════════╣ ║ AI辅助层 ←─── 转录/检索/聚类/摘要/草稿生成 ───→ AI辅助层 ║ ╚══════════════════════════════════════════════════════════════════════╝⚠️核心原则AI 是分析加速器不是分析替代者。 连接关系的指定、意义的诠释、理论的建构——永远由研究者完成。二、阶段0研究设计纯人工阶段这一阶段 AI不应主导的原因设计要素为何需要研究者风险若外包给AI概念框架建立需要领域知识与理论立场AI可能生成通用框架而非契合研究的框架研究问题聚焦需要对现象的深度感知AI会提出过于宽泛的问题编码起始列表来自研究者的理论预设预设错误将污染整个分析链伦理协议设计需要对场域关系的判断AI无法感知权力结构与潜在伤害阶段0产出检查清单□ 研究问题已明确1-3个核心问题 □ 概念框架已草拟变量与关系初步定义 □ 演绎编码起始列表已建立12-50个临时代码 □ 伦理协议已确认知情同意/保密/匿名 □ 数据格式规范已定义便于AI处理三、阶段1数据准备人机协作1.1 AI可高效完成的任务原始数据音频/视频/手写/文档 │ ▼ ┌─────────────────────────────┐ │ AI工具层 │ │ • 语音转文字Whisper等 │ │ • OCR扫描文字识别 │ │ • 格式标准化时间戳/发言人│ │ • 重复内容去除 │ │ • 基础拼写/语法校对 │ └─────────────────────────────┘ │ ▼ ┌─────────────────────────────┐ │ 研究者校验层 │ │ • 确认转录准确性 │ │ • 补充语气/停顿/非语言标注 │ │ • 调整转录层级详细/简化 │ │ • 确认发言者标识正确 │ └─────────────────────────────┘1.2 转录层级决策研究者判断转录层级适用场景AI支持程度详细层级含嗯呃、停顿、重音、不完整句话语分析、对话分析低——需大量人工补注标准层级自然口语保留完整句主题分析、扎根理论高——AI转录基本可用简化层级流畅总结主要观点大规模文档分析极高——AI可直接摘要MH原则转录者的知识水平和技能决定信息损耗量。使用AI转录时研究者必须系统性地校验尤其是专业术语、方言和情感语气。四、阶段2AI辅助编码核心协作阶段2.1 第一循环编码人机分工矩阵┌────────────────────┬──────────────────────┬──────────────────────┐ │ 编码任务 │ AI负责 │ 研究者负责 │ ├────────────────────┼──────────────────────┼──────────────────────┤ │ 描述性编码 │ 自动标注人物/地点/ │ 确认标注的分析价值 │ │ (Descriptive) │ 事件/行动关键词 │ 调整粒度级别 │ ├────────────────────┼──────────────────────┼──────────────────────┤ │ 主题性编码 │ 语义相似性聚类 │ 命名类别/赋予概念意义 │ │ (In Vivo/Thematic) │ 高频词/词组提取 │ 判断类别边界 │ ├────────────────────┼──────────────────────┼──────────────────────┤ │ 情感性编码 │ 情感极性识别/-/中 │ 细化情感类型与强度 │ │ (Emotion) │ 情感词汇标注 │ 解读隐含情绪 │ ├────────────────────┼──────────────────────┼──────────────────────┤ │ 过程性编码 │ 动词/行动短语提取 │ 识别行动的因果序列 │ │ (Process) │ 时间顺序整理 │ 构建过程性叙事 │ ├────────────────────┼──────────────────────┼──────────────────────┤ │ 演绎编码 │ 按起始代码列表 │ 设计代码列表 │ │ (Deductive) │ 自动标注与检索 │ 处理边界模糊案例 │ └────────────────────┴──────────────────────┴──────────────────────┘2.2 AI辅助编码质控双轨验证流程Step 1AI生成初始编码结果 │ ▼ Step 2研究者随机抽样校验≥20%语料 │ ├─── 一致性 ≥ 85-90% ───→ 进入Step 3 │ └─── 一致性 85% ──→ 重新界定编码规则 → 返回Step 1 │ Step 3第二位研究者独立编码同一子集 │ ▼ Step 4计算编码者间一致性Cohens Kappa │ ├─── κ ≥ 0.80可信 ──→ 确认编码方案 │ └─── κ 0.80讨论分歧 → 修订操作定义 │ Step 5最终编码方案固化 形成代码本编码者间一致性目标内部一致性与编码者间一致性应达到85%到90%的范围Miles Huberman具体取决于编码方案的大小和范围。2.3 AI不能替代研究者的编码情境情境原因处理方式同时编码一段文字有多重意涵AI难以感知文化语境下的多层含义研究者手动处理后标注AI负面案例识别AI倾向于确认多数模式而忽略异常研究者主动检索反例隐喻/讽刺性表达AI字面理解可能误读研究者重新校验语用层沉默/非语言数据超出文本转录范围研究者在田野笔记中补注五、阶段3深度分析人主导、AI辅助3.1 第二循环模式编码AI聚类 研究者命名第一循环编码结果大量离散代码 │ ▼ AI语义聚类 / 共现分析 / 频率排序 │ ▼ 聚类草图AI提案未命名 │ ▼ 研究者审视聚类 → 命名模式类别 │ ┌──────┴──────┐ ▼ ▼ 接受聚类 拆分/合并/拒绝 → 命名模式 → 重新定义边界 │ ▼ 模式代码本Pattern Codebook3.2 AI辅助备忘录生成与研究者备忘录的区别维度 AI生成备忘录 研究者撰写备忘录内容性质统计摘要、词频报告、模式列表思想观点而非简单事实陈述分析深度描述性发生了什么解释性理论性为什么/意味着什么价值快速生成分析原材料产生洞察顿悟推动理论构建使用方式作为研究者备忘录的输入素材作为报告和理论构建的核心内容MH提醒备忘录记录的是思想观点仅仅总结或复述数据示例是不够的。AI生成的摘要≠分析备忘录研究者必须在此基础上注入理论思考。3.3 断言与命题发展人机协作路径 AI任务 ① 基于编码频率生成候选断言草稿 ② 检索支持/反对特定断言的数据段落 ③ 按研究问题分类整理证据列表 ↓ 输入到 ↓ 研究者任务 ① 评估断言的证据强度强烈支持/有条件支持/中性/矛盾 ② 将断言转化为如果-那么命题形式 ③ 主动寻找负面证据挑战已有命题 ④ 修订或推翻证据不足的命题六、阶段4展示构建人机协作6.1 AI辅助的数据展示类型展示类型AI可完成部分研究者必须完成部分概念矩阵自动填充单元格内容、格式排版设计行列维度、解读单元格意义时序矩阵按时间戳自动排序事件判断事件的因果关联因果网络图生成节点-关系可视化草图指定连接关系AI无法自行判定元矩阵多案例数据并置堆叠浓缩策略、案例排序逻辑词云/频率图自动生成解释频率背后的分析意义⚠️重要警告CAQDAS/AI软件可以辅助绘制因果流但研究者必须指定连接关系——软件无法判定哪些变量之间存在因果关系这是研究者的核心分析责任。6.2 因果网络构建的人机边界╔═══════════════════════════════════════════════════════╗ ║ 因果网络构建中的人机边界 ║ ╠═══════════════╦═══════════════════════════════════════╣ ║ AI可做 ║ 研究者必须做 ║ ╠═══════════════╬═══════════════════════════════════════╣ ║ 提取共现变量 ║ 判断共现是否构成因果 ║ ║ 绘制网络图形 ║ 指定箭头方向因→果 ║ ║ 识别高度连通节点║ 解释节点的实质含义 ║ ║ 标注连接强度 ║ 区分直接/间接/调节关系 ║ ║ 生成备选网络结构║ 选择最具解释力的网络结构 ║ ╚═══════════════╩═══════════════════════════════════════╝七、阶段5报告撰写人主导、AI辅助7.1 AI辅助撰写的合理边界可接受的AI辅助 ✅ 生成章节结构草稿研究者审核修改 ✅ 提取引文证据并格式化 ✅ 生成方法论描述初稿 ✅ 语言润色与逻辑检查 ✅ 参考文献格式整理 需要研究者独立完成 ❌ 理论贡献的阐述 ❌ 与既有文献的对话 ❌ 研究局限性的诚实反思 ❌ 伦理立场的说明 ❌ 参与者成员检验结论的记录7.2 效度验证清单人工完成AI辅助检索证据#验证标准人工AI辅助1描述具有情境丰富性与厚重性✅—2叙述真实可信、有说服力✅—3互补方法与数据源三角验证一致✅检索不一致证据4数据与理论类别良好连接✅匹配检索5发现清晰连贯、系统统一✅—6描述了确认程序✅—7识别了不确定领域✅—8寻求了负面证据✅检索反例文段9考虑了竞争性解释✅生成备选解释草稿10发现在数据库其他部分得到复制✅自动检索验证11原始参与者认为结论准确✅—12预测准确性已报告如适用✅—八、AI辅助工具选择指南20268.1 工具分层架构层级一专业CAQDAS传统质性分析软件 NVivo / ATLAS.ti / MAXQDA → 适合需要完整项目管理、多数据类型、团队协作 → AI能力内置自动编码、词频分析、主题聚类 层级二通用大语言模型LLM GPT-4 / Claude / Gemini → 适合辅助编码解释、备忘录草稿、报告撰写 → 注意不保证数据保密性需检查隐私协议 层级三专业AI质性工具 Dedoose / QualRobot / Cauliflower → 适合访谈数据的快速主题提取 → 局限对非英语数据支持有限 层级四基础办公软件 Word Excel最低要求 → 适合构建矩阵、编码标注、数据管理 → AI能力Copilot辅助可提升效率8.2 工具选择决策树研究需要处理音视频数据 │ ├─ 是 → CAQDASNVivo/ATLAS.ti Whisper转录 │ └─ 否 → 数据量 500页文本 │ ├─ 是 → CAQDAS LLM辅助编码 │ └─ 否 → 单独使用LLM / 基础软件即可 │ └─ 需要跨案例比较 │ ├─ 是 → 加入Excel元矩阵管理 └─ 否 → Word LLM即可九、人机协作的核心伦理边界9.1 AI使用的不可逾越红线红线具体内容原因数据保密性敏感访谈数据不得上传至无隐私保障的AI平台违反与参与者的保密协议匿名性维护AI处理前必须完成去识别化处理防止身份识别造成伤害分析归属透明报告中必须说明AI辅助的具体环节学术诚信要求判断不可外包理论命题、因果判断、意义解释AI的解释无主体性和责任负面案例义务不能因AI未发现就忽略反例研究真实性的核心要求9.2 研究者主体性宣言无法有意义地回答什么AI是最好的。你必须具体了解你在项目中构建的数据库类型以及你将进行的分析类型。—— 改编自 Miles Huberman好的模型只能来自于其所衍生的测量和更简单分析的质量。—— Miles HubermanAI无法替代研究者的理论敏感性识别数据背后的理论意涵伦理判断力权衡效度与避免伤害的冲突反思性意识到自身视角对分析的影响情境理解力感知权力关系与文化背景十、完整工作流检查清单阶段0 研究设计 □ 概念框架建立人工 □ 研究问题聚焦人工 □ 起始代码列表人工12-50个 □ 伦理协议确认人工 阶段1 数据准备 □ AI转录完成AI □ 转录准确性校验人工 □ 数据去识别化人工AI处理前必做 □ 数据格式标准化AI辅助 阶段2 第一循环编码 □ AI初始编码运行AI □ 随机抽样校验≥20%人工 □ 编码者间一致性≥85-90%κ≥0.80 □ 代码本固化人工确认 阶段3 深度分析 □ AI语义聚类生成模式候选AI □ 研究者命名模式类别人工 □ 分析备忘录撰写人工非AI摘要 □ 断言证据检索AI辅助 □ 命题评级与修订人工 □ 负面案例主动检索人工AI辅助 阶段4 展示构建 □ 矩阵维度设计人工 □ 矩阵填充与排版AI辅助 □ 因果网络连接关系指定人工 □ 因果网络图形生成AI辅助 阶段5 报告撰写 □ 章节结构草稿AI辅助人工修订 □ 效度验证12项清单人工 □ 理论贡献阐述人工 □ AI辅助环节披露人工学术诚信 □ 参与者成员检验人工