浙大儿院
62.44MB · 2025-11-20
在这个信息泛滥的时代,知识并不稀缺,稀缺的是能真正用起来的知识。
从企业SOP,到政策文件;从医疗指南,到技术规程;从培训手册,到应急预案......无数内容整整齐齐地堆在硬盘里,形式上“数字化”,实质上仍难以调用:
我们一次又一次地在Word、PDF、Excel中翻找,只为那一句关键的内容。
大模型虽然强大,却难以获知你单位的内控制度、你部门的规章细则,更别提最新的制度更新或地区特有的专业术语。
所谓 RAG( Retrieval-Augmented Generation,检索增强生成),它的核心思想其实很简单:不是靠大模型自己“编”答案,而是让它先去你的知识库里“翻资料”,再带着上下文生成回答。
图片来源:《RAG实战课》作者黄佳老师
与传统的语义搜索相比,RAG 保证了答案与现有资料的一致性与可追溯性,也使得问答系统具备更强的稳定性与解释能力。本文将结合和鲸社区推出的搭建应急预案RAG智能问答助手训练营,介绍如何通过 RAG 技术和工作流工具,把本地文档转化为一个具备问答能力的系统。
在本次训练营中,选取的落地案例是“气象灾害应急预案”“地震灾害应急预案”等官方文档。原因在于,这类文档具备如下特征:
正适合作为构建知识库与问答系统的素材。通过本期训练营,你将亲身完成从文档上传到知识拆解,从内容索引到语义检索,从模型配置到工作流发布的全过程,这种能力,一旦掌握,就可以在未来的无数应用场景中反复使用。
训练营将构建过程拆解为两关,分别对应知识库建立与问答系统搭建,均使用Dify平台完成。
文档上传后,首要任务是“切分”与“建索引”。
这一阶段的目标,是将文档变成模型可以理解、定位、引用的“结构化语义素材”。
<教案截图>
完成知识库建设后,可在Dify中构建“ChatFlow”应用,实现用户提问 → 知识检索 → LLM回答的完整流程。核心模块包括:
一旦流程通过测试,即可发布为内部使用的问答系统。
<教案截图>
虽然案例选取了应急预案,但整个技术流程具有高度通用性,适用于场景包括且不限于:
对于具备较多结构化文档、但人工查阅效率低下的组织来说,RAG 与工作流系统的结合,不仅是技术方案,更是一种知识治理方式的更新。
如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。