es混合检索与langchain检索增强

Langchain RetrieverMultiQueryRetriever,利用llm为问题生成3个意思接近的问题,根据3个问题检索相关文档并全部返回。MultiVectorRetriever,当同一个文档在向量库中因存储不同向量而存在多条记录时,通过id进行去重。代码实现非常简单,不知道有什么用


大模型加速与性能对比

大模型加速与性能对比阿里通义千问flash-attention加速正常运行通义千问会提示安装flash-attention以获得更快的推理速度,缺少这个包并不影响模型运行。事实证明安装之后对于推理速度的提升也很小(5%),网上说对于微调训练的速度提升比较大,因为是在内网环境下,安装还费了一番周折。本


DB-GPT-HUB Text-to-SQL微调

DB-GPT-HUB Text-to-SQL微调项目介绍DB-GPT-Hub是一个利用LLMs实现Text-to-SQL解析的实验项目,主要包含数据集收集、数据预处理、模型选择与构建和微调权重等步骤,通过这一系列的处理可以在提高Text-to-SQL能力的同时降低模型训练成本,让更多的开发者参与到T


WSL配置深度学习环境

WSL配置深度学习环境官网教程截至2023年11月8日,系统要求,本人使用的是wsl2 Ubuntu20.04 ,wsl版本一定要是2。关于驱动不需要在wsl中安装驱动,和windows系统共用一个驱动!登录到wsl的ubuntu中,输入nvidia-smi。root@DESKTOP-SJ490MT


内网环境下ubuntu 20.04搭建深度学习环境总结

2023年8月16日更新,经历环境配置、维护的痛苦才知道docker有多香,建议测试开发使用docker完成,在深度学习这一块,docker可以打包任意版本的cuda和cudnn镜像,各种包版本都可以在容器中操作。宿主机上只需要安装nvidia驱动和nvidia-container-toolkit。


Python配置Jupyter环境

Python配置Jupyter环境安装Jupyter及插件pip3.8 install jupyterpip install jupyter_contrib_nbextensions jupyter contrib nbextension install --userpip install jupy


机器学习笔记

深度学习激活函数总结为什么relu是非线性的神经网络反向传播