山东大学软件学院创新实训-PediaMind团队博客（四）

张

张建站

2026/5/9 2:08:50

10分钟阅读

本周项目仍在稳步推进具体工作如下详情可见具体的个人博客一、知识库建设与数据预处理完成《儿科学》人卫第九版近500 页教材的数字化转换成功提取为高保真 Markdown 格式。实现复杂医学表格的结构化还原保留原生 HTML 标签以支持“合并单元格”的精准解析。集成默沙东医疗网站 JSON 数据完成2690条涵盖八大类疾病的结构化医学文档切块。建立双索引检索机制同步构建 ChromaDB向量语义与 BM25关键词稀疏知识库。引入jieba医学专用词典进行术语增强显著提升了中医及西医专业名词的分词准确率。二、 RAG 检索管线与系统开发基于LangGraph架构开发并集成了RAGRetrievalNode检索节点打通分诊至诊断的自动化工作流。实现QueryRewriter模块支持将病患的结构化特征自动重写为专业的医学检索语句。应用RRF倒数排名融合算法与Reranker精排模型实现了多源检索结果的深度融合与排序。在 Web 前端集成“知识库检索依据”模块支持医学参考文献的详情展开、原文链接跳转及锚点定位。优化ReviewAgent验证逻辑通过Pydantic协议增强了多智能体协作时JSON数据交换的健壮性。三、自动化测试框架构建基于PediaBench标准设计并实现了儿科专属自动化评测框架。定义统一数据模型支持单选、多选、判断、简答、病例分析、配对题等6类题型的自动装载。开发解耦式BaseAnswerEngine接口支持对直接调用LLM、RAG管线及Agent工作流进行横向对比测试。实现自动化评分与报告系统可定量汇总各题型的正确率、得分率及平均响应耗时。集成针对主观题简答、病例分析的关键词重合率评分模块及 LLM 裁判接口。四、行业调研与优化策略分析深度研读PediaBench(Wu et al., 2024) 论文确立了项目在 12 类儿科疾病领域的评测基准。通过基准测试识别出当前系统在具体药物剂量、多步临床推理、以及中英文一致性方面的核心短板。分析并总结了LLM在医学诊断中“过度依赖统计关联而缺乏病理生理理解”的根源问题。确立了后续研发重点通过强化儿科医学知识注入、思维链CoT逻辑优化及指令跟随增强提升决策系统的专业可靠性。

全卷积扩散模型FCDM：高效图像生成新方案

1. 项目概述在计算机视觉领域，卷积神经网络（ConvNets）曾长期占据主导地位。然而近年来，Transformer架构在生成模型中的应用逐渐增多，但其高计算复杂度和资源消耗问题也日益凸显。本文介绍了一种基于ConvNeXt架构改进的…...

2026/5/9 2:06:06 阅读更多 →

基于Vite+React+TS的现代化前端项目模板与AI辅助开发实践

1. 项目概述：从零到一构建一个现代化的个人项目最近在整理自己的代码库时，我决定启动一个代号为“New2”的新项目。这个项目的初衷很简单，就是想搭建一个干净、现代、可扩展的代码基础框架，用来快速启动各种类型的个人实验或小型产…...

2026/5/9 2:04:33 阅读更多 →

CopyCrafter：AI编程时代文件内容聚合器，智能过滤与Token估算

1. 项目概述：一个为AI编程时代量身定制的文件内容聚合器如果你和我一样，日常工作中需要频繁地将不同项目里的代码片段、配置文件甚至整个模块的源码，整理出来喂给像ChatGPT、Claude或者本地部署的大语言模型（LLM）进行…...

2026/5/9 1:58:34 阅读更多 →

如何用Python脚本绕过百度网盘限速？5个实用技巧大揭秘

如何用Python脚本绕过百度网盘限速？5个实用技巧大揭秘【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 上周，当我需要从百度网盘下载一个3GB的设计素材时…...

2026/5/8 0:39:19 阅读更多 →

构建Web3多智能体世界：从账户抽象到AI驱动的链上经济

1. 项目概述：一个由AI驱动的Web3多智能体世界EmpowerTours 是一个我深度参与构建的、运行在 Monad 区块链上的综合性 Web3 平台。它不仅仅是一个应用，更是一个持续运行的多智能体世界，并深度集成在 Farcaster 社交协议中，作为一个…...

2026/5/8 0:40:09 阅读更多 →

2026届最火的降AI率网站推荐榜单

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 需要从源头优化以及后期校正两方同时着手，来降低文本里AIGC也就是人工智能生成内…...

2026/5/8 0:02:56 阅读更多 →