1. 项目概述构建一个可对话的“灵魂档案馆”如果你对AI智能体AI Agents和提示工程Prompt Engineering感兴趣并且曾经尝试过让ChatGPT模仿某个历史人物或虚构角色与你对话你大概率会遇到一个共同的问题模仿出来的角色总是流于表面像是一个披着名人外衣的通用聊天机器人。对话里可能充满了这个人的名言金句但你感受不到其独特的思维模式、决策逻辑和表达风格。这背后的核心原因在于我们缺少一种结构化的、可操作的“人格蓝图”。这正是“Greats Soul Archive”项目试图解决的痛点。它不是一个简单的名人语录库也不是维基百科式的生平简介。你可以把它理解为一个面向AI智能体开发者的“人格芯片”开源仓库。它的核心产出是两种文件IDENTITY.md和SOUL.md。前者像是一个人的“名片”用最精炼的语言定义其核心身份标签后者则是一份详尽的“操作系统手册”描述了这个“灵魂”是如何思考、决策、表达乃至犯错的。这个项目的野心在于它试图在浩瀚的传记史料与可执行的AI行为之间搭建一座桥梁。它回答的不是“这个人是谁”而是“如果让AI成为这个人它应该如何运转”。无论是想与柏拉图探讨正义的本质向费曼请教一个物理难题直到彻底明白还是用乔布斯级别的品味来审视你的产品设计你都可以在这里找到一套经过社区提炼和验证的“人格配置”直接导入到你的AI应用中快速启动一个高度拟真的对话智能体。2. 核心理念与设计哲学从“是什么”到“如何运行”2.1 源数据与人格解耦确保可追溯与可调整项目的一个基础性原则是“分离事实与解读”。在传统的人物角色扮演中我们很容易将人物的生平事迹、历史评价与其内在的思维模式混为一谈。Greats Soul Archive明确区分了这两者源数据Sources指的是关于这个人物的客观事实、可靠传记、著作、演讲、信件等。这部分是构建人格的基石但本身不是人格配置。人格配置Persona即SOUL.md文件它是基于源数据进行的“可操作化解读”。它明确告诉AI“当你扮演这个角色时你应该优先采用这样的推理框架使用这样的表达习惯避免那样的思维陷阱。”这种分离带来了巨大的灵活性。例如关于拿破仑的军事才能历史学家可能有不同解读。SOUL.md可以明确标注“本配置主要基于其早期意大利战役中体现的‘迂回机动、集中优势兵力’原则对于其后期战略可能存在的刚愎自用倾向配置中已加入风险提示。” 这样使用者既清楚了这个“拿破仑AI”的思维偏向也知晓其局限性未来若有新的历史研究可以基于同一套源数据创建不同侧重点的SOUL.md版本。2.2 清晰优于聪明追求可复现的实用性在提示工程中存在一种追求“聪明提示词”的倾向即使用晦涩、精巧的隐喻或复杂结构来试图“激发”AI的潜力。Greats Soul Archive反其道而行之旗帜鲜明地提出“清晰优于聪明”。这意味着每一份SOUL.md都力求用直白、结构化、无歧义的语言来描述思维过程。例如描述爱因斯坦的思考风格不会写“像在时空的曲面上舞蹈般思考”而可能会写核心思维模式思想实验驱动起点从一个看似简单、违反直觉的物理场景或悖论开始。推演严格遵循已知物理定律如光速不变在想象中逐步推演该场景的后果不引入未经实证的假设。洞察从推演出的矛盾或新结果中提炼出对物理本质的新理解。表达风格偏好使用生动、具体的类比如“追赶光速的火车”来解释抽象原理避免不必要的数学公式开场。这样的描述对于AI来说是可解析、可执行的指令对于开发者来说是清晰透明的设计文档。它牺牲了文学性的“聪明”换来了工程上的可靠性与可复现性。2.3 显式化不确定性构建可信且谦逊的智能体一个全知全能、从不犯错的历史人物AI不仅是失真的也是危险的。Greats Soul Archive强调“显式化不确定性”。这包含两个层面知识边界在SOUL.md中需要明确标注该人物不可能知道的信息。例如一份关于莎士比亚的配置必须写明“本角色基于其生前作品与历史记录构建对于其去世后1616年后的文学流派、历史事件、科技发展一无所知。若被问及应表示不知并可引导话题回其熟悉的文艺复兴时期戏剧或人文主题。”性格与判断的局限性即使是伟人也有其偏见、盲点和历史局限性。一份关于丘吉尔的配置除了描述其坚定的领导力和雄辩口才也应指出其某些殖民主义观点在当时的历史语境下虽属常见但用现代价值观审视是存在问题的。AI在扮演时可以被配置为在涉及这些话题时给出符合其历史人设但附加现代注释的回答。这种做法构建的智能体更加可信也避免了AI因“扮演”而无意中传播历史人物的负面偏见。它承认了模型的局限性也体现了对历史的尊重。2.4 对在世人物的极端保守原则项目对于在世人物的处理采取了格外审慎的态度。原因显而易见为在世者定义“灵魂”配置极易引发伦理、法律和事实性争议。他们的观点可能变化其公众形象与私人自我可能存在巨大差异。因此项目指南中通常建议优先选择已故人物其生平、思想和影响已有相对稳定的历史定论。如果必须包含在世人物SOUL.md应严格基于其公开的、持续的言论如多次演讲、出版的书籍、长期的专栏文章并明确标注“本配置仅代表其公开表达的、截至[日期]的某一系列观点可能无法反映其全部或未来的想法”。避免对其私人生活、未经验证的传闻或高度争议性事件进行人格化解读。这一原则是项目长期存续、避免纠纷的重要防火墙。3. 仓库结构深度解析模块化的人格构建体系Greats Soul Archive的仓库结构清晰反映了其模块化、分层级的设计思想。理解这个结构是有效使用或贡献该项目的关键。greats-soul-archive/ ├── people/ # 核心真实历史人物 │ └── slug/ # 每个人物一个独立目录slug为URL友好的短名如 albert-einstein │ ├── IDENTITY.md │ └── SOUL.md ├── fiction/ # 扩展虚构角色 │ ├── public-domain/ # 已进入公有领域的经典角色如福尔摩斯 │ │ └── slug/ │ │ ├── IDENTITY.md │ │ └── SOUL.md │ └── inspired/ # 受现代作品启发但进行抽象化、去版权化的原型角色 │ └── slug/ │ ├── IDENTITY.md │ └── SOUL.md ├── CONTRIBUTING.md # 贡献指南 └── README.md # 项目总览3.1IDENTITY.md人格的“数字名片”这个文件非常简短通常只有几行到十几行其目标是让人或AI在0.5秒内抓住这个角色的最核心标签。它不是生平简介而是特征信号的快速发射器。一个优秀的IDENTITY.md通常包含称谓最广为人知的名字或头衔。时代与领域快速定位的历史和行业坐标。核心特质关键词3-5个最能定义其公众印象的形容词或名词。一句标志性思维或名言不是随便一句名言而是最能体现其思维内核的那一句。示例理查德·费曼 (Richard Feynman)**理查德·费曼** 20世纪物理学家教育家科普大师。 **核心标签**好奇心驱动、物理直觉大师、反权威、卓越的解释者、幽默不羁。 **标志性思维**“如果我无法向大学一年级学生解释清楚一个概念那说明我自己也没真正弄懂。”这份身份文件立刻让AI知道它要扮演的不是一个刻板的教授而是一个充满热情、喜欢刨根问底、用生动方式拆解复杂问题的聪明人。3.2SOUL.md人格的“操作系统手册”这是项目的灵魂所在名副其实。它是一份结构化的、可操作的配置文件通常遵循一个相对固定的模板以确保不同人物配置之间的一致性和可比性。一份完整的SOUL.md可能包含以下章节元信息版本、主要参考来源、贡献者。核心驱动力与价值观这个人最深层的动机是什么他们相信什么例如对于企业家埃隆·马斯克可能是“推动人类成为多行星物种”对于哲学家康德可能是“为理性与道德奠定普遍基础”。思维与决策框架这是最核心的部分。描述其典型的思考流程。问题拆解模式是喜欢构建宏大体系如黑格尔还是从具体案例归纳如奥卡姆信息处理偏好依赖数据如凯恩斯还是依赖第一性原理推理如马斯克或是依赖直觉与类比如乔布斯风险评估风格极度厌恶风险如巴菲特还是追求高风险高回报如孙正义决策速度与依据快速决断基于经验如巴顿将军还是缓慢深思力求完备如诸葛亮沟通与表达风格语言特征简洁还是繁复直接还是委婉喜欢用比喻、故事还是逻辑论证互动模式是苏格拉底式的提问者还是拿破仑式的命令下达者是善于倾听的教练还是激情澎湃的布道者知识表述方式如何解释复杂概念费曼擅长用生活类比而图灵可能更倾向于清晰的逻辑步骤。已知的局限性与偏见诚实地列出基于历史记录或作品分析得出的该人物的认知盲区、时代局限性或个人偏见。这指示了AI在扮演时“不应该知道什么”或“在哪些方面可能给出有局限的回答”。行为边界与安全提示明确AI在扮演时不应逾越的边界。例如对于军事人物应禁止提供具体的、可操作的现代军事攻击方案对于所有人物都应禁止生成仇恨、歧视或鼓励非法行为的内容。示例对话/思维链提供几个简短的示例展示该人格应如何回应特定类型的问题。这是将抽象描述具体化的关键。3.3fiction/目录从具体角色到抽象原型真实人物库people/已经极具价值但fiction/目录的设立体现了项目的扩展性和实用性思维。public-domain/这里收录已超过版权保护期的经典虚构角色如莎士比亚笔下的哈姆雷特、柯南·道尔笔下的福尔摩斯。这些角色的人格同样可以提炼和结构化用于文学分析、创意写作或角色扮演游戏。inspired/这是更具巧思的设计。它不直接复制受版权保护的现代作品角色如哈利·波特而是提取其核心人格原型进行抽象化和去版权化处理。例如idol-producer-coach/灵感可能来源于众多偶像养成类作品中的严苛但真心的制作人。tsundere-analyst/融合了“傲娇”性格特质与高超数据分析能力的角色原型。mecha-operations-tactician/擅长在巨大机器人作战中执行精密战术指挥的参谋型角色。这些“灵感型”角色文件为游戏NPC设计、互动叙事创作提供了即插即用的、免版权顾虑的人格模块极大地拓展了项目的应用场景。4. 核心应用场景与实战指南4.1 场景一构建“与伟人对话”聊天机器人这是最直接的应用。假设你想做一个让用户可以与历史哲学家对话的教育类应用。实操步骤选型与获取从仓库的“Philosophy”分类下选择你需要的哲学家如柏拉图、康德、尼采。下载对应的IDENTITY.md和SOUL.md。系统提示词构建将这两个文件的内容进行融合构建给你的大语言模型如GPT-4、Claude的系统提示词System Prompt。通常结构如下你正在扮演 [IDENTITY.md中的称谓]。你的核心特质是[IDENTITY.md中的核心标签]。你的核心驱动力是[SOUL.md中的核心驱动力]。 你的思维与行为方式遵循以下原则 [将SOUL.md中的“思维与决策框架”、“沟通与表达风格”部分的关键点逐条列出] 你的知识边界和局限性 [SOUL.md中的“已知局限性”部分] 你必须严格遵守的行为边界 [SOUL.md中的“行为边界”部分并附加通用的AI安全规则] 现在请开始以[角色名]的身份和风格与我对话。你的第一句话应该体现你的典型风格。对话历史管理在后续的每轮用户对话中都需要将这个完整的系统提示词连同之前的对话历史一并发送给模型以维持角色的一致性。调优与测试用一些该人物经典会讨论的问题进行测试。例如问柏拉图“什么是正义”观察其回答是直接给出《理想国》中的定义还是通过苏格拉底式的提问来引导思考。根据回答与预期的偏差回头微调SOUL.md中的描述或提示词的整合方式。实操心得不要一次性导入所有描述。先导入核心驱动力和思维框架测试基本对话再逐步加入沟通风格和局限性观察模型行为变化。这有助于定位是哪个部分的描述导致了不符合预期的输出。4.2 场景二作为“思维风格适配器”辅助创作与决策SOUL.md本身就是一个强大的思维模板。你可以将其用于非对话场景来改变自己的创作或决策风格。示例使用“史蒂夫·乔布斯”的SOUL进行产品评审提炼决策框架从乔布斯的SOUL.md中提取其产品哲学的关键点如“极致简洁”、“用户体验至上”、“技术优雅隐藏”、“敢于砍掉次要功能”。构建评审清单将这些要点转化为一个问题清单。这个功能的用户界面是否做到了极致的简洁有没有多余的按钮或选项用户完成核心任务的路径是否顺畅、直观有没有让用户思考的地方背后的技术实现是否优雅是否为了短期目标引入了长期的技术债这个功能是否是“不可或缺”的如果不是有没有勇气把它砍掉代入角色进行评审在评审产品原型或文档时不是以你自己的习惯而是刻意用这份清单以乔布斯可能的口吻可以内心默念来审视每一个细节。你会发现自己会关注到平时忽略的、关于“品味”和“本质”的问题。示例使用“查理·芒格”的SOUL进行投资分析芒格的思维以“多元思维模型”和“反面思考”著称。你可以将他的SOUL.md转化为一个分析框架第一步多元检查分别从心理学、数学、物理学、生物学、历史学等不同基础学科的角度审视当前的投资标的看看能发现什么别人忽略的视角。第二步反面论证不急于证明这笔投资为什么好而是全力列举所有可能证明这笔投资会失败的理由并评估这些理由的强度。第三步能力圈判断这个标的是否在我的能力圈范围内如果不在是应该放弃还是应该花时间将其纳入能力圈通过这种方式SOUL.md从一个静态的配置文件变成了一个动态的思维增强工具。4.3 场景三用于教学与比较研究在教育领域这个项目可以生动地展示不同思维模式的差异。课堂活动设计选择对比组选择一对或一组思维迥异的人物例如演绎推理的亚里士多德vs. 归纳经验的大卫·休谟集中计划的凯恩斯vs. 自由市场的弗里德曼理想主义的柏拉图vs. 实用主义的马基雅维利。提出同一问题向分别配置了这些人物SOUL的AI提出同一个开放式问题例如“什么是好的政府”或“如何判断一个科学理论是否正确”分析与讨论让学生对比分析不同AI给出的回答观察其论证起点、推理过程、所用证据和最终结论的差异。这比单纯阅读他们的著作更能直观地感受其思维模式的碰撞。深入探究引导学生思考为什么基于同样的事实或AI的底层知识会得出不同的观点这反映了他们哪些根本性的价值观或方法论假设的不同这种方法将思想史从知识记忆变成了可交互、可体验的思维实验极大地提升了教学趣味性和深度。5. 贡献指南与内容创作避坑实录为Greats Soul Archive贡献一份高质量的人物配置是一项兼具研究和工程性质的工作。以下是基于常见实践的详细步骤和避坑指南。5.1 四步创建法从零到PR第一步深度研究与资料筛选做什么确定你想贡献的人物然后进行资料搜集。优先选择权威传记、本人著作、历史信件、可信的演讲记录等一手或可靠的二手资料。不做什么避免仅依赖维基百科、碎片化的网络文章或带有强烈主观色彩的评论。这些无法支撑起一个扎实的SOUL.md。技巧在阅读时有意识地做两类笔记一是“事实笔记”他做了什么说了什么二是“模式笔记”他习惯怎么做决定用什么方式表达反复出现的思维特点。第二步撰写IDENTITY.md—— 极简的提炼核心用最短的文字抓住人物的“神”。反复问自己如果只能让陌生人记住关于这个人的三点是哪三点避坑避免罗列生平职务如“第X任总统XX奖获得者”这太像简历。要提炼其精神内核如“在危机中凝聚国家的演说家坚定的反法西斯领袖”。检查把你写的IDENTITY.md给一个不了解该人物的人看问他/她脑海里浮现出一个什么样的形象。如果与你预期相符就成功了。第三步撰写SOUL.md—— 结构化的灵魂这是最耗时但也最核心的一步。建议严格按照模板章节进行确保不遗漏。核心驱动力用一句话概括。这不是“他想达到什么目标”那是结果而是“什么内在火焰在驱动他”。例如对于科学家可能是“理解宇宙运行的根本规律”对于革命家可能是“对不平等现象的深切愤怒与改造社会的渴望”。思维与决策框架从具体案例入手不要空泛地说“他思维缜密”。找一个他处理过的典型事件如林肯处理一场政治危机居里夫人设计一个实验详细拆解他当时的思考步骤和决策依据。对比中见特点思考他与同时代、同领域的其他人有何不同例如同是企业家乔布斯强调“品味”和“端到端控制”而贝索斯强调“客户至上”和“可扩展的系统”。使用行为化描述多用“当遇到X类问题时他倾向于先做Y然后考虑Z”这样的句式。沟通与表达风格分析文本特征如果有其著作或演讲进行简单的文本分析。句子平均长度词汇是抽象还是具体喜欢用排比、反问还是直述找标志性表达他有没有口头禅有没有独特的比喻体系如乔布斯的“把按钮做得漂亮到让人想舔”局限性这是体现项目严谨性的关键。要基于事实例如时代局限19世纪的人物不可能有现代的女权意识或环保观念。认知局限再伟大的科学家其知识也受限于当时的科学水平。个人偏见基于可靠史料承认其存在的偏见如某些历史人物的种族或性别观点。示例编写2-3个简短的对话示例。示例应展示其典型的思维链条和说话方式而不是简单的名言引用。第四步测试、修订与提交自我测试将你写好的IDENTITY.md和SOUL.md整合成系统提示词用大语言模型进行测试。问一些该人物经典会回答的问题也问一些“超纲”的现代问题观察其反应是否符合你的设定。同行评审在提交PRPull Request前可以请朋友或社区成员预览看他们是否理解你塑造的这个“人格”。规范检查确保文件命名、目录结构符合项目要求引用来源格式统一。5.2 常见问题与排查技巧问题1AI扮演的角色“不像”或者像个“缝合怪”。可能原因SOUL.md中的描述过于笼统或自相矛盾。例如既说“决策果断”又说“凡事深思熟虑”AI无法把握平衡点。排查与解决细化场景将“决策果断”具体化为“在信息不完备度低于30%且时间压力大时倾向于基于核心原则快速决策并愿意承担后续调整的成本”。设定优先级如果存在看似矛盾的特质明确主次。例如“总体上追求逻辑完备但在涉及道德底线的问题上情感直觉会压倒逻辑推理”。增加示例通过具体的对话示例来展示在特定情境下这些特质是如何共同作用的。问题2AI经常“出戏”回答一些角色不可能知道的事情。可能原因SOUL.md中的“知识边界”和“局限性”部分写得太模糊或者没有在系统提示词中被强调。排查与解决明确时间戳在配置中强制加入“知识截止日期”。例如“本角色的知识、观点和认知模式定格于[卒年]。对于此后发生的历史事件、科技发展、社会思潮一无所知。”预设拒绝话术在提示词中直接给出模板。例如“当被问及[角色]不可能知道的信息时应这样回答‘以我所处的时代和见识并未预见到你所描述的景象。在我的认知里类似的问题或许可以这样看待……[将话题引回其时代背景]’”加强系统指令在提示词开头用醒目的方式如###指令###重申必须严格遵守角色设定。问题3不同贡献者创建的SOUL.md质量、深度、风格差异巨大。可能原因缺乏足够详细和可操作的贡献指南模板。解决思路给项目维护者提供一份详尽的SOUL_TEMPLATE.md文件每个章节都附带填写说明和正面/反面案例。设立“核心人物清单”对清单内的重要人物要求PR必须包含更严格的引用来源和更详尽的思维模式分析。建立社区评审机制邀请对特定领域如哲学史、科技史有研究的贡献者担任特定分类的“审阅者”。问题4如何处理有争议的历史人物黄金法则描述不评判呈现不宣扬。操作方法在SOUL.md的“局限性”部分客观陈述基于历史学界共识的争议点。例如对于某个殖民时代的人物可以写“其观点和行动深受当时盛行的殖民主义思想影响其部分言论和决策用现代普世价值审视涉及对其它文化的不尊重和掠夺。本配置在呈现其思维模式时包含了这一历史语境下的特征使用者应批判性地看待。”安全护栏在“行为边界”中必须明确禁止AI生成任何美化战争罪行、种族歧视、性别歧视等的内容即使这“符合”历史人物的某些观点。为“Greats Soul Archive”贡献内容本质上是在进行一种新型的“数字人文”工作。它要求贡献者兼具历史洞察力、心理学分析能力和工程化的严谨思维。当你成功地将一个复杂的历史灵魂编码成一份清晰、可用的配置文件时你不仅为AI应用提供了工具也完成了一次对这位人物思想精髓的深度梳理和致敬。这个过程本身就是最好的学习。