
这项由卡塔尔哈马德·本·哈利法大学计算研究所团队主导的研究发表于2026年3月的arXiv预印本平台论文编号为arXiv:2603.08501v2。研究团队开发了一个名为Fanar-Sadiq的双语伊斯兰问答系统专门解决大型语言模型在宗教领域的幻觉问题。有兴趣深入了解的读者可以通过该论文编号查询完整研究内容。想象你正在向一位博学的伊斯兰学者请教宗教问题但这位学者有时会记错《古兰经》的章节或者在计算天课扎卡特时出现算术错误。这正是当前大型语言模型在处理伊斯兰宗教问题时面临的困境。虽然这些AI系统能够流利地回答宗教知识问题但它们经常会编造经文引用错误引用圣训或者在需要严格法学推理的问题上给出不准确的答案。对于穆斯林用户来说这种错误可能产生严重的宗教和伦理后果。正是在这样的背景下卡塔尔哈马德·本·哈利法大学的研究团队着手解决这个棘手问题。他们发现传统的检索后生成方法就像是让一个人同时扮演图书管理员、计算器和法学家的角色结果往往顾此失彼。不同类型的伊斯兰问题需要不同的处理方式有些需要精确的经文查找有些需要复杂的数学计算还有些需要深入的法学推理。研究团队创新性地设计了一个多智能体架构系统就像组建了一个专业的宗教咨询团队每个成员都有自己的专长领域。当用户提出问题时系统会像一个智能的接待员自动判断这个问题应该交给哪个专家来处理。这种方法不仅提高了回答的准确性还确保了引用的真实性和计算的精确性。经过在多个公开的伊斯兰问答基准测试上的验证这个系统在需要严格事实核查的生成式问答任务上表现优异平均准确率达到76.5%超越了多个开源基线模型并与强大的专有模型保持竞争力。更令人印象深刻的是该系统已经通过API和网页应用向公众开放在不到一年的时间里被访问了约190万次用户满意度高达77.4%。一、智能问题分类让AI学会看人下菜碟当你走进一家大型百货商店时入口处通常会有一个导购台工作人员会根据你的需求指引你到相应的楼层和部门。Fanar-Sadiq系统的核心创新就是建立了这样一个智能导购台它能够准确识别用户的伊斯兰问题属于哪种类型然后将问题路由到最合适的处理模块。这个智能分类器采用了混合设计方案就像是配备了经验丰富的主管和备用助手的服务台。主要的分类器由大型语言模型担任它经过训练能够识别九种不同的问题类型法学裁决问题、《古兰经》检索、一般伊斯兰知识、问候寒暄、天课计算、继承法计算、祈祷词查找、伊斯兰历法和礼拜时间查询。当主分类器遇到低置信度预测、输出格式错误或调用失败时备用的原型分类器会立即接管。这个备用系统就像是一个经验丰富的老员工它会将用户的问题与预先存储的典型问题模板进行相似度比较选择最匹配的类别。研究团队使用了一个巧妙的置信度计算公式通过比较前两个最相似类别的差距来确定答案的可靠性。为了验证这个分类系统的准确性研究团队构建了一个包含705个真实用户查询的评估数据集。这些查询都经过了匿名化处理并过滤掉个人身份信息然后由六名标注员进行人工分类每个查询都有三个独立的标签最终标签通过多数投票确定。经过严格测试这个混合分类器达到了90.1%的准确率甚至超过了零样本条件下的GPT-5和Gemini模型。这种精确的问题分类为整个系统奠定了坚实基础。就像一个训练有素的医院分诊台它能够准确判断病人应该挂哪个科室的号从而确保每个问题都能得到最专业的处理。这种方法彻底改变了传统AI系统一刀切的处理方式为后续的专业化处理模块创造了条件。二、工具调用模块打造专业化的宗教服务团队在确定了问题类型之后Fanar-Sadiq系统会将查询路由到相应的专业工具模块就像是将客户引导到专门的服务窗口。这些工具模块就像是一个宗教服务中心的不同部门每个部门都有自己的专业领域和处理方式。问候工具承担着文化适应的重要角色它不仅仅是简单的礼貌回应更像是一个懂得伊斯兰礼仪的接待员。当系统检测到用户使用阿拉伯语时它会以标准阿拉伯语和正式语调回应。对于英语用户系统会包含阿拉伯语音译短语然后主动提供帮助。这种设计体现了对伊斯兰文化传统的尊重和理解。伊斯兰历法工具就像是一个精通时间转换的专家。它能够处理希吉拉历查询、格里历与希吉拉历之间的转换以及伊斯兰节日查询。这个工具使用了经过精心策划的双语事件本体库包含20多个重要节日并具备明确的年份切换逻辑。更重要的是它会在回答中明确说明当地月相观测可能存在的差异体现了伊斯兰历法的现实复杂性。礼拜时间和朝向工具则像是一个天文计算专家它能够基于地理坐标进行伊斯兰礼拜时间的天文计算。位置解析采用了四阶段处理流程首先查询预设的城市数据库然后进行大型语言模型辅助的提取和音译接着使用限频地理编码作为后备方案最后在解析失败时提供默认坐标并明确提示用户。朝向计算使用了大圆方位角公式精确计算到麦加天房的方向和距离。祈祷词查找工具的设计特别注重防止生成式幻觉问题。它采用了两阶段检索策略首先对预计算的场合嵌入进行语义搜索保留前k个候选项然后使用轻量级语言模型选择器输出候选索引这些索引被确定性地映射到规范的页面标题键值。最终工具会返回完整的祈祷词内容包括带变音符号的阿拉伯文、翻译和参考来源完全避免了内容改写可能带来的错误。这些工具模块的设计理念体现了系统对准确性和文化敏感性的双重追求。每个工具都像是一个训练有素的专业人员不仅能够提供准确的信息还能够以文化适宜的方式进行交流。这种专业化分工确保了用户无论提出什么类型的问题都能得到最合适的处理和回应。三、确定性计算流水线用数学精度处理宗教义务当涉及到天课和继承法这类需要精确计算的宗教义务时Fanar-Sadiq系统采用了完全不同的处理策略。就像是将复杂的法律和财务问题交给专业的会计师和律师处理一样系统使用确定性计算模块来确保结果的准确性和合规性。天课计算器的工作原理就像是一个严格按照伊斯兰法学规定的财务顾问。它首先提取用户提供的结构化参数包括各类资产、负债和当前贵金属价格。然后系统会计算起征点这是基于黄金和白银价格的最低阈值。具体计算公式为起征点等于85克黄金价格和595克白银价格中的较小值。对于不同类型的资产系统采用了差异化的处理方式。农业资产根据灌溉方式应用不同的税率雨水灌溉的作物税率为10%人工灌溉的为5%。牲畜资产则严格按照圣训中记载的档期表进行计算分别适用于骆驼、牛和羊。货币资产包括现金、黄金、商业资产和投资在扣除符合条件的债务后如果达到起征点则按2.5%的标准税率计算。继承法计算器可能是整个系统中最复杂的模块它需要处理伊斯兰继承法中的各种复杂情况。这个模块就像是一个精通伊斯兰法学的法官能够处理不同法学派别之间的分歧。计算流程分为三个阶段首先分配固定份额验证亲属关系并排除继承障碍然后将剩余遗产分配给父系血亲继承人最后通过比例调整或余额返还来确保算术一致性。特别值得注意的是当遇到法学争议案例时系统不会强制给出单一答案而是会触发策略选择器返回并行的分配方案。比如在处理某些复杂的继承情况时系统会同时展示哈奈菲学派和主流学者的不同观点让用户了解存在的分歧。这种处理方式体现了对伊斯兰法学多样性的尊重避免了过度简化复杂的宗教问题。这些确定性计算模块的最大优势在于它们能够消除算术错误和强制执行法学约束。与生成式方法容易产生的数值偏差不同这些模块能够提供结构化的输入分解、扣除明细和总计并将结果格式化为用户友好的解释同时提供相关的宗教依据引用。这种方法确保了在处理涉及个人财务和法律义务的敏感问题时系统能够提供可靠和准确的指导。四、知识检索流水线构建可追溯的宗教知识体系对于需要广泛宗教知识的信息查询Fanar-Sadiq系统构建了一个复杂的检索增强生成流水线就像是建立了一个现代化的数字图书馆配备了智能检索系统和专业的研究助理。法学裁决模块的设计特别注重体现伊斯兰法学推理的传统模式。当用户提出法学问题时系统首先使用专门的法学文档检索器搜索相关资料然后将这些资料交给经过特殊训练的推理智能体。这个智能体被明确指示要说明裁决的适用范围和前提假设将裁决与证据清楚分离并为每个证据片段分配确定性的引用标签。引用标签系统就像是学术论文中的参考文献编号每个标签都对应着特定的原始文献片段。系统支持检索时的来源标准化确保每个声明都能映射到稳定的原文本。当裁决依赖于确切的经文表述时智能体还可以调用《古兰经》专用工具来防止释义偏差确保引用的准确性。一般伊斯兰理解模块则处理更广泛的宗教知识查询。系统会检索候选文档并将其标准化为有界上下文然后由伊斯兰理解智能体生成严格基于检索参考文献的回答最大限度地减少幻觉现象。这种方法就像是让研究助理只能基于图书馆中现有的书籍来回答问题而不允许凭空想象。文档检索器和嵌入系统构成了整个知识基础设施的核心。系统维护着一个包含50万以上文档的语料库涵盖《古兰经》、主要圣训集、经典法学文本、当代法特瓦、伊斯兰历史和学术文章。查询嵌入使用Qwen3-Embedding-4B模型通过向量数据库中的余弦相似性搜索支持前k检索、最小相似性阈值设定、可选的交叉编码器重排序、来源多样性强化和元数据过滤。引用标准化过程对于确保回答的可追溯性至关重要。系统会对检索到的资料进行去重和格式标准化为显示做好准备。这个过程就像是一个细心的编辑确保所有引用都采用统一的格式便于读者查证和进一步研究。这种设计的核心优势在于它建立了一个完全可追溯的知识传递链条。用户不仅能得到准确的回答还能清楚地看到每个答案是基于哪些权威资料得出的。这种透明度对于宗教问题尤其重要因为穆斯林用户需要能够验证所获信息的宗教权威性和准确性。五、《古兰经》检索流水线精确处理神圣文本《古兰经》作为伊斯兰教的根本经典其文本的准确性要求达到了极致标准。Fanar-Sadiq系统为此设计了专门的《古兰经》检索流水线就像是为这部神圣文本配备了最精密的查阅和验证系统。《古兰经》查询分类器是这个流水线的第一道关口它能够识别四种不同的子查询类型特定经文查询、完整章节查询、统计查询和释义查询。系统采用了双重保险机制主分类器由经过约束训练的语言模型担任如果输出无效或不符合格式系统会立即切换到基于嵌入的分类器确保在任何情况下都能稳定路由到正确的处理路径。对于特定经文请求系统展现出了令人印象深刻的灵活性和精确性。它能够处理多种引用格式数字格式如2:275、命名格式如Al-Baqarah:275、详细格式如Surah 2 Verse 275甚至是模糊格式的查询。章节名称解析采用了多层次匹配策略首先进行精确查找匹配114个官方章节名称然后进行大小写不敏感匹配和前缀剥离如果仍然无法匹配系统会应用模糊匹配算法结合编辑距离和嵌入相似性只有在置信度超过0.6时才会接受匹配结果。对于需要长连续文本或精确计数的查询系统使用了自然语言到SQL的转换模块这就像是训练了一个能够理解人类语言并将其转换为数据库查询语言的翻译专家。系统使用48000个模板生成的自然语言-SQL对进行训练并通过LoRA微调技术优化了Qwen3-4B-Instruct模型。评估采用了严格的指示正确性标准预测的SQL和标准SQL都在同一个SQLite数据库上执行要求结果完全相等。对于标量结果需要精确的数值匹配对于行值输出需要元组完全相等。在包含62个分析检索任务和74个计数任务的基准测试中专用的NL2SQL模型达到了100%的准确率而通用的Fanar模型在零样本、单样本和五样本条件下分别达到了62.9%、80.7%和95.2%的准确率。《古兰经》释义和特定经文检索功能体现了系统对经文权威性的极端重视。当用户请求释义时系统会检索相关经文和支持文档然后使用受约束的《古兰经》释义智能体产生基于检索证据的解释性回答。关键是当引用可以解析为具体经文时系统会附加经文级别的引用避免释义偏差和无根据的注释。这种精密的处理机制确保了《古兰经》文本的完整性和准确性得到绝对保护。无论用户以何种方式查询系统都能提供逐字准确的经文内容并提供清晰的引用路径让用户能够直接验证所获信息的真实性。六、系统验证在真实世界中接受考验为了验证Fanar-Sadiq系统的实际效果研究团队进行了全面的基准测试和实际部署验证。这就像是让一个新培训的专业团队接受各种实际工作场景的考验确保他们在面对真实用户需求时能够胜任工作。评估涵盖了五个不同类型的数据集每个数据集都代表着伊斯兰问答系统需要处理的不同挑战。IslamicFaithQA包含3810个双语例子专门设计用来检测生成式伊斯兰问答中的实际失败模式包括自由形式的幻觉和在证据缺失时的适当回避。FatwaQA则包含2000个阿拉伯语法特瓦风格的问答对涵盖天课、利息、商业合作等伊斯兰金融法学类别。在多选题基准测试中QIAS 2025专门测试伊斯兰继承推理中的硬约束法学推理能力要求模型选择对应于正确继承分配的选项字母。PalmX 2025包含1000个阿拉伯语多选题涵盖伊斯兰文化和实践。IslamTrust则通过406个双语项目测试与基于共识的伊斯兰伦理原则的对齐程度。测试结果令人鼓舞。在开放式数据集上Fanar-Sadiq系统平均得分76.5%超过了开源基线模型ALLaM-7B的45.9%和Fanar-2-27B的62.4%并与强大的专有模型保持竞争力。特别值得注意的是在对准确性要求极高的生成式问答任务上系统表现尤为出色IslamicFaithQA达到65.4%超过了最强专有基线的56.6%FatwaQA达到65.1%紧追Gemini-3-Pro的67.0%。在多选题基准测试中系统在广泛的伊斯兰知识测试PalmX上达到85.5%的优异成绩在价值敏感决策测试IslamTrust上也达到了94.2%的高分。这些结果表明多工具设计并没有牺牲通用能力或规范稳健性。然而QIAS任务1仍然具有挑战性系统得分72.2%而最强专有模型达到93.0-94.5%。研究团队分析认为这可能是由于多选题协议增加的决策层造成的即使有确定性继承计算在将计算分配映射到基准的离散选项空间时仍可能出现错误。实际部署验证提供了更加有力的证据。系统通过聊天界面和API向公众开放在不到一年的时间里被访问约190万次充分展示了其在真实世界环境中的实用性。在6441个获得用户评分的查询中77.4%的情况下用户对回答表示满意。这种高满意度反映了系统在实际使用中确实能够满足用户的需求。系统还集成到了一个更广泛的聊天平台中作为专门的后端服务。平台使用微调的二元分类器来判断查询是否与伊斯兰内容相关伊斯兰相关的查询被路由到Fanar-Sadiq系统其他查询则由通用助手处理。这个分类器在1700个标注查询的数据集上达到了93.40的宏观F1分数确保了合适的问题能够得到专业的处理。这些验证结果支持了研究的核心假设伊斯兰问答确实受益于意图对齐的执行方式而不是统一的检索生成策略。经典经文查找和引用验证减少了与经文相关查询的释义偏差确定性计算器强化了天课和继承的算术和法学不变量带引用标准化的检索型法学回答改善了可追溯性并减少了无支持的声明。七、聊天平台集成从实验室走向实际应用将Fanar-Sadiq系统从研究原型转变为实际可用的产品就像是将一个精心培训的专家团队从培训中心派往真实的工作岗位。研究团队将系统集成到了一个综合性的聊天平台中作为专业化的后端服务为用户提供无缝的伊斯兰问答体验。这个集成过程的核心是建立了一个智能的总调度员系统。当用户在聊天平台上提出问题时系统首先会判断这个问题是否与伊斯兰内容相关。这个判断过程使用了一个经过精心微调的二元分类器就像是一个经验丰富的接待员能够快速识别哪些问题需要专业的宗教知识处理哪些可以由通用助手回答。为了确保这个分类器的准确性研究团队构建了一个包含1716个查询的评估数据集。每个查询都由三名独立标注员进行标注标注员都接受了相关培训并获得了标准时薪报酬。标注员之间的一致性达到了0.753的科恩卡帕值总体标签一致性为88.2%。在设定0.66的阈值下分类器达到了92.2%的精确率、92.4%的召回率、92.3%的F1分数和94.4%的整体准确率。这种设计的巧妙之处在于它为用户创造了一种自然流畅的体验。用户不需要明确表明自己要咨询伊斯兰问题系统会自动识别并路由到合适的处理模块。当问题被识别为伊斯兰相关时会自动交给Fanar-Sadiq系统的多智能体架构处理其他问题则由通用助手处理。这种无缝切换确保了用户始终能够得到最合适的服务。系统的实际使用统计数据令人印象深刻。在不到一年的时间里系统通过API和网页应用被访问了约190万次充分证明了其实际价值和用户接受度。更重要的是在6441个获得用户反馈的查询中77.4%的用户对系统回答表示满意。这种高满意度反映了系统在处理真实用户问题时的有效性。从技术架构的角度来看这种集成方式体现了现代AI系统的发展趋势不是追求一个无所不能的单一模型而是构建专业化的模块化系统每个模块都专注于特定领域的问题。这种方法不仅提高了回答质量还降低了系统复杂性使维护和改进变得更加容易。用户反馈数据还为系统的持续改进提供了宝贵信息。研究团队可以通过分析用户满意度较低的查询识别系统的薄弱环节并进行针对性优化。这种基于实际使用数据的迭代改进机制确保系统能够不断适应用户需求的变化。这种成功的实际部署验证了多智能体架构在宗教AI应用中的可行性和有效性。它不仅解决了技术层面的挑战还在用户体验和文化适应性方面取得了显著成果为类似的专业领域AI应用提供了重要参考。八、技术创新与挑战平衡精确性与实用性的艺术Fanar-Sadiq系统的技术创新体现在多个层面每一个创新都是为了解决伊斯兰问答中的特定挑战。就像是一群工程师面对复杂的建筑项目需要在保证结构安全的同时兼顾美观和实用性。系统最重要的创新之一是混合查询分类器的设计。传统的单一分类方法就像是只配备一个门卫的大楼一旦这个门卫出现问题整个系统就会瘫痪。而混合设计就像是配备了主门卫和备用门卫的智能建筑主分类器负责大部分工作备用分类器在关键时刻接管确保系统的稳定性。这种设计的置信度计算公式特别巧妙通过比较前两个最相似类别的差距来判断分类的可靠性有效避免了边界模糊情况下的误判。在《古兰经》检索方面系统采用了多层级的精确匹配策略。这就像是建立了一个多重验证机制从精确匹配到模糊匹配每一层都有自己的置信度阈值。特别是对于章节名称的处理系统能够处理各种不同的引用格式包括数字、阿拉伯语名称、音译版本等这种灵活性确保了用户无论采用何种习惯的引用方式都能得到准确的结果。自然语言到SQL转换模块展现了另一种技术创新思路。面对需要精确计数和统计的查询生成式方法往往会产生数值错误而SQL查询则能提供绝对准确的结果。系统使用48000个模板生成的训练对通过LoRA微调技术专门优化了这个功能。在实际测试中专用模型达到了100%的执行正确性这种精确性对于处理《古兰经》统计查询至关重要。确定性计算模块的设计体现了对宗教法学严谨性的深刻理解。天课计算不仅仅是简单的数学运算还涉及复杂的法学规则和不同资产类别的处理方式。系统将这些规则编码为确定性算法确保计算结果的宗教合规性。继承法计算更加复杂需要处理不同法学派别之间的分歧系统通过返回并行分配方案的方式既保持了计算的准确性又尊重了法学观点的多样性。然而系统也面临着一些挑战和限制。研究团队坦诚地承认系统的回答质量高度依赖于底层检索语料库的覆盖范围、质量和代表性。路由错误可能导致查询被发送到次优模块比如将计算密集型问题误判为自由形式法学问答。虽然系统包含了引用跟踪和验证步骤但引用仍可能不完整检索到的证据可能反映难以简化的法学多样性。在评估方法上系统部分依赖于自动化或基于语言模型的开放式答案判断这可能无法完全捕捉细微差别、上下文或合理的观点分歧。这种限制提醒我们即使是最先进的AI系统在处理宗教这样复杂和敏感的领域时仍需要人类专家的监督和指导。系统设计还体现了对伊斯兰文化和传统的深度尊重。从双语支持到文化适宜的问候方式从引用透明度到对法学分歧的处理每个细节都体现了开发团队对伊斯兰文化的理解和重视。这种文化敏感性不仅体现在技术实现上更体现在系统的价值观和设计哲学中。这些创新和挑战共同构成了Fanar-Sadiq系统的技术图景。它不仅是一个技术产品更是文化理解与现代AI技术结合的典型案例为其他文化和宗教特定的AI应用提供了重要借鉴。说到底这个由卡塔尔哈马德·本·哈利法大学团队开发的Fanar-Sadiq系统就像是在数字时代为伊斯兰社区建造了一座现代化的知识服务中心。它不是简单地用AI技术回答问题而是深度理解了伊斯兰文化的需求和特点创造性地解决了宗教AI应用中的关键问题。这个系统最让人印象深刻的地方或许不是它的技术有多先进而是它对宗教传统的尊重和理解。当面对《古兰经》经文时系统会确保逐字准确当计算天课时会严格按照伊斯兰法学规定当遇到法学争议时会诚实地呈现不同观点而不是强加单一答案。这种做法体现了技术服务于文化而不是文化适应技术的理念。从实际效果来看系统在不到一年内被访问190万次用户满意度达到77.4%这些数字背后反映的是真实的社会需求和价值创造。对于全球15亿穆斯林来说能够有一个既准确又便利的宗教知识助手确实是一个有意义的进步。当然我们也应该看到这项技术的局限性。任何AI系统都不能替代合格的宗教学者特别是在处理复杂的个人宗教问题时。但作为一个辅助工具它确实为人们学习和了解伊斯兰知识提供了新的途径。这项研究的更广泛意义在于它展示了如何将AI技术与特定文化和宗教传统相结合创造出既先进又适宜的解决方案。在全球化与本土化并存的今天这种做法可能会启发更多类似的文化特定AI应用的发展。归根结底技术的最高境界不是展示自身的强大而是更好地服务于人类的真实需求。QAQ1Fanar-Sadiq系统是如何解决AI在回答伊斯兰问题时的幻觉问题的AFanar-Sadiq系统采用多智能体架构来解决这个问题就像组建了一个专业团队每个成员都有自己的专长。系统会先判断问题类型然后交给对应的专业模块处理《古兰经》查询使用精确检索避免经文错误计算类问题用确定性算法确保数值准确法学问题则通过检索权威资料并提供清晰引用来减少无根据的声明。Q2这个伊斯兰AI助手支持哪些具体功能A系统支持九种主要功能回答伊斯兰法学问题并提供权威引用精确查找《古兰经》经文计算天课扎卡特金额处理伊斯兰继承法分配查找各种场合的祈祷词提供礼拜时间和朝向计算进行伊斯兰历法转换回答一般伊斯兰知识问题以及提供文化适宜的问候。所有功能都支持阿拉伯语和英语双语操作。Q3普通用户如何使用Fanar-Sadiq系统A用户可以通过API接口或网页应用直接使用该系统目前已公开免费提供服务。在不到一年时间里系统被访问了约190万次用户满意度达77.4%。系统会自动识别问题类型并路由到合适的处理模块用户只需要用自然语言提问即可无需了解复杂的技术细节。