rag学习2-尧图网站设计

摘要本周学习了rag向量数据库相关知识以及余弦相似度并且在本地部署了大模型并尝试调用一般大模型与聊天大模型abstractThis week, I learned about RAG vector database concepts and cosine similarity. I also deployed a large model locally and tried calling both general large models and conversational large models.向量数据库与向量向量数据库是专门为高效存储、索引和检索高维向量数据而设计的数据库系统。这里的“向量”可以理解为一串有序的数字列表例如[0.2, 0.5, -0.1, 0.8]它能将文本、图像、音频等非结构化数据转化为数学上的空间点。通过某种嵌入模型如Word2Vec、BERT等语义相近的内容会被映射到向量空间中彼此靠近的位置。向量数据库的核心价值就在于它能快速执行“近似最近邻”搜索从海量向量中找出与目标向量最相似的那些对象常被用于推荐系统、语义搜索、AI记忆等场景。余弦相似度在向量空间中判断两个向量的相似程度常用余弦相似度。它的计算方法是先求出两个向量的点积再分别除以它们各自的长度模长的乘积结果是一个介于-1到1之间的数值越接近1表示两个向量的方向几乎完全一致即内容高度相似接近0则意味着几乎正交不相关接近-1则表示方向相反。例如用向量表示两句话的语义后若算出余弦相似度为0.95就表明它们在含义上非常相近。代码实现大语言模型与聊天模型一般大模型或称基础模型通常是指在海量、多样化的无标注文本数据上通过自监督学习训练而成的通用语言模型例如原始的GPT-3或BERT。它的特点在于功能广泛但不带特定交互范式能够完成补全句子、提取关键词、文本分类、生成续写等多种任务但输出形式往往比较“原始”——可能是一段未加修饰的续写或者是直接根据前缀生成的补全结果没有专门针对多轮对话进行优化也不具备主动的角色扮演或安全回复机制。大模型的调用聊天大模型如ChatGPT、通义千问、文心一言则是以一般大模型为基础通过指令微调和基于人类反馈的强化学习RLHF等技术专门改造而成的对话导向模型。其最大特点是具备了对话格式的理解能力能主动遵循“用户—助手”的交互模式区分多轮上下文输出更自然、结构化、友好的回答。此外聊天大模型通常会引入安全对齐机制拒绝回答有害或违规问题并倾向于以有帮助、诚实、无害HHH的原则呈现答案而一般大模型在没有额外微调时往往不会有这些“对话礼仪”和安全约束。聊天大模型的调用

rag学习2

相关新闻

磁力搜索神器magnetW：一站式聚合23个BT站点的终极搜索工具

3小时掌握yuzu模拟器：Switch游戏PC端高效运行完整指南

终极指南：5步掌握Rusted PackFile Manager打造Total War模组

终极解决方案：3分钟免费恢复微信网页版完整访问权限

Arm DynamIQ DSU L3缓存电源管理技术解析

7大革新功能：Pearcleaner深度解析与Mac系统清理最佳实践

【Claude Redis缓存方案实战白皮书】：20年架构师亲授高并发场景下99.99%命中率的5层缓存协同设计

收藏备用！Kali Linux 零基础教程（超详细），从下载到使用一篇够

TCP 三次握手四次挥手

3分钟快速上手：炉石传说自动化脚本的智能游戏助手完整指南

OpCore Simplify：3分钟完成OpenCore EFI配置的黑苹果神器

ESP32点灯进阶：PlatformIO项目结构详解与多文件编程入门

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程