
摘要本周学习了rag向量数据库相关知识以及余弦相似度并且在本地部署了大模型并尝试调用一般大模型与聊天大模型abstractThis week, I learned about RAG vector database concepts and cosine similarity. I also deployed a large model locally and tried calling both general large models and conversational large models.向量数据库与向量向量数据库是专门为高效存储、索引和检索高维向量数据而设计的数据库系统。这里的“向量”可以理解为一串有序的数字列表例如[0.2, 0.5, -0.1, 0.8]它能将文本、图像、音频等非结构化数据转化为数学上的空间点。通过某种嵌入模型如Word2Vec、BERT等语义相近的内容会被映射到向量空间中彼此靠近的位置。向量数据库的核心价值就在于它能快速执行“近似最近邻”搜索从海量向量中找出与目标向量最相似的那些对象常被用于推荐系统、语义搜索、AI记忆等场景。余弦相似度在向量空间中判断两个向量的相似程度常用余弦相似度。它的计算方法是先求出两个向量的点积再分别除以它们各自的长度模长的乘积结果是一个介于-1到1之间的数值越接近1表示两个向量的方向几乎完全一致即内容高度相似接近0则意味着几乎正交不相关接近-1则表示方向相反。例如用向量表示两句话的语义后若算出余弦相似度为0.95就表明它们在含义上非常相近。代码实现大语言模型与聊天模型一般大模型或称基础模型通常是指在海量、多样化的无标注文本数据上通过自监督学习训练而成的通用语言模型例如原始的GPT-3或BERT。它的特点在于功能广泛但不带特定交互范式能够完成补全句子、提取关键词、文本分类、生成续写等多种任务但输出形式往往比较“原始”——可能是一段未加修饰的续写或者是直接根据前缀生成的补全结果没有专门针对多轮对话进行优化也不具备主动的角色扮演或安全回复机制。大模型的调用聊天大模型如ChatGPT、通义千问、文心一言则是以一般大模型为基础通过指令微调和基于人类反馈的强化学习RLHF等技术专门改造而成的对话导向模型。其最大特点是具备了对话格式的理解能力能主动遵循“用户—助手”的交互模式区分多轮上下文输出更自然、结构化、友好的回答。此外聊天大模型通常会引入安全对齐机制拒绝回答有害或违规问题并倾向于以有帮助、诚实、无害HHH的原则呈现答案而一般大模型在没有额外微调时往往不会有这些“对话礼仪”和安全约束。聊天大模型的调用