VideoAgentTrek-ScreenFilter开发环境搭建:Ubuntu系统下的完整依赖安装

发布时间:2026/5/19 16:30:45

VideoAgentTrek-ScreenFilter开发环境搭建:Ubuntu系统下的完整依赖安装 VideoAgentTrek-ScreenFilter开发环境搭建Ubuntu系统下的完整依赖安装最近有不少朋友在尝试本地部署一些视频处理相关的AI项目比如这个VideoAgentTrek-ScreenFilter。听起来名字挺酷但第一步——搭环境就劝退了不少人。尤其是在Ubuntu系统上各种依赖、版本冲突一不小心就掉坑里。我自己在Ubuntu 20.04和22.04上都折腾过好几遍踩了不少坑也总结出了一套相对顺畅的流程。今天这篇文章就是想把这份经验分享给你手把手带你走一遍完整的开发环境搭建过程。目标很简单让你能在一个干净、稳定的Python虚拟环境里把项目跑起来为后续的二次开发或者本地测试打好基础。整个过程会从最基础的系统更新开始一直到安装完所有必要的Python包。我会尽量把每一步都讲清楚特别是那些容易出错的地方。如果你之前没怎么在Linux下配过深度学习环境跟着这篇走问题应该不大。1. 准备工作与系统环境确认在开始安装任何软件之前我们先花几分钟把基础打好。这就像盖房子前要平整土地一样能避免很多后续的麻烦。首先确认一下你的Ubuntu版本。虽然标题里提到了20.04和22.04但其他LTS版本理论上也类似。打开终端输入下面这条命令lsb_release -a你会看到类似这样的输出其中Description一行就显示了你的系统版本。No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 22.04.3 LTS Release: 22.04 Codename: jammy记下你的版本号比如“22.04”或者“20.04”后面有些安装步骤会根据版本略有不同。接下来我们确保系统是最新的。这能帮你获取最新的安全补丁和软件库信息。在终端里依次运行下面两条命令sudo apt update sudo apt upgrade -y第一条命令是更新本地软件包列表第二条是实际升级已安装的软件包。-y参数表示自动同意所有升级提示省得你一直按回车。这个过程可能会花点时间取决于你的网速和需要升级的包数量喝杯咖啡等着就行。最后我们安装一些后续步骤肯定会用到的、非常基础的工具。比如wget用来下载文件curl也是一个常用的网络工具还有build-essential它包含编译软件必需的GCC、G和make等。一条命令搞定sudo apt install -y wget curl build-essential好了地基已经打牢我们可以开始搭建更具体的环境了。2. 安装NVIDIA驱动、CUDA与cuDNN这一步是为GPU加速做准备。如果你的机器没有NVIDIA显卡或者你只想用CPU跑虽然会很慢那么可以跳过这一整节直接去看下一节关于Python虚拟环境的部分。但如果你想发挥GPU的实力这里是必经之路。2.1 安装NVIDIA显卡驱动驱动是硬件和操作系统沟通的桥梁。Ubuntu系统自带的“开源驱动”通常功能有限为了更好的兼容性和性能我们安装NVIDIA官方的闭源驱动。首先我们可以查看一下系统推荐安装的驱动版本ubuntu-drivers devices这个命令会列出所有可用的驱动并标出一个推荐版本。通常安装那个推荐版本后面带有“recommended”字样是比较稳妥的选择。假设推荐版本是nvidia-driver-535那么安装命令就是sudo apt install -y nvidia-driver-535安装完成后必须重启电脑才能使新驱动生效。sudo reboot重启后再次打开终端输入nvidia-smi。如果看到类似下面的信息显示出了你的GPU型号、驱动版本和CUDA版本那就说明驱动安装成功了。----------------------------------------------------------------------------- | NVIDIA-SMI 535.161.07 Driver Version: 535.161.07 CUDA Version: 12.2 | |--------------------------------------------------------------------------- | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | || | 0 NVIDIA GeForce ... Off | 00000000:01:00.0 On | N/A | | N/A 50C P0 25W / N/A | 500MiB / 8192MiB | 0% Default | ---------------------------------------------------------------------------注意看CUDA Version那一项这里显示的是驱动支持的最高CUDA版本并不是你系统里已经安装的CUDA。我们接下来就要去安装对应版本的CUDA工具包。2.2 安装CUDA工具包CUDA是NVIDIA推出的并行计算平台。PyTorch等深度学习框架依赖它来调用GPU进行计算。安装CUDA最省心的方法是通过NVIDIA官方提供的网络安装包。访问NVIDIA CUDA Toolkit下载页面选择适合你系统的版本。对于Ubuntu 22.04目前比较稳定的选择是CUDA 12.1。你可以用下面的命令直接下载并安装wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600 wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb sudo cp /var/cuda-repo-ubuntu2204-12-1-local/cuda-*-keyring.gpg /usr/share/keyrings/ sudo apt-get update sudo apt-get -y install cuda-12-1这一串命令看起来有点长其实就是在添加NVIDIA的软件源然后从源里安装cuda-12-1这个元包。安装完成后需要将CUDA添加到系统的环境变量中这样终端才能找到它。编辑你的~/.bashrc文件如果你用的是zsh就是~/.zshrcnano ~/.bashrc在文件的最后添加这两行export PATH/usr/local/cuda-12.1/bin${PATH::${PATH}} export LD_LIBRARY_PATH/usr/local/cuda-12.1/lib64${LD_LIBRARY_PATH::${LD_LIBRARY_PATH}}保存并退出编辑器在nano里是按CtrlX然后按Y确认再按回车。让配置立刻生效source ~/.bashrc现在验证一下CUDA是否安装成功nvcc --version如果看到输出版本号是V12.1那就没问题了。2.3 安装cuDNNcuDNN是NVIDIA深度神经网络加速库可以理解为CUDA的一个“补强包”专门优化了深度学习中的常见操作如卷积、池化。很多框架包括我们后面要装的PyTorch的运行都依赖它。你需要先在NVIDIA官网注册一个账号免费然后下载对应你CUDA版本的cuDNN本地安装包。例如对于CUDA 12.x可以下载cuDNN for Linux x86_64的压缩包文件类似cudnn-linux-x86_64-8.x.x.x_cuda12-archive.tar.xz。下载好后假设文件在~/Downloads目录下执行以下命令来解压并复制文件# 解压 tar -xvf ~/Downloads/cudnn-linux-x86_64-8.x.x.x_cuda12-archive.tar.xz # 复制头文件和库文件到CUDA目录 sudo cp cudnn-linux-x86_64-8.x.x.x_cuda12-archive/include/cudnn*.h /usr/local/cuda-12.1/include sudo cp -P cudnn-linux-x86_64-8.x.x.x_cuda12-archive/lib/libcudnn* /usr/local/cuda-12.1/lib64 # 修改文件权限 sudo chmod ar /usr/local/cuda-12.1/include/cudnn*.h /usr/local/cuda-12.1/lib64/libcudnn*这样CUDA和cuDNN的安装就完成了。GPU的软硬件环境已经就绪。3. 创建Python虚拟环境并安装PyTorch现在我们离开系统层面进入项目层面。使用虚拟环境是一个非常好的习惯它能将不同项目的依赖隔离开避免“装一个库毁所有项目”的惨剧发生。3.1 安装Python与虚拟环境工具Ubuntu 22.04默认可能已经安装了Python 3.10。我们确认一下并安装管理虚拟环境的工具venvpython3 --version sudo apt install -y python3-venv python3-pippython3-pip是Python的包管理工具后面安装各种库全靠它。接下来为你这个VideoAgentTrek项目创建一个独立的虚拟环境。我习惯在用户主目录下建一个venvs文件夹来集中管理所有环境mkdir -p ~/venvs cd ~/venvs python3 -m venv videoagent_env这条命令创建了一个名为videoagent_env的虚拟环境。激活它你的终端提示符前面会出现环境名source ~/venvs/videoagent_env/bin/activate激活后你会发现命令提示符变成了(videoagent_env) userhostname:~$。这意味着之后所有pip install操作都只会影响这个环境。3.2 安装PyTorch及其依赖这是核心步骤。PyTorch的安装命令需要根据你的CUDA版本去官网生成。访问PyTorch官网选择稳定版本、你的操作系统Linux、包管理工具Pip、语言Python以及最重要的——CUDA版本。对于我们安装的CUDA 12.1官网生成的命令可能类似这样pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121请注意直接运行这条命令可能会因为网络问题很慢甚至失败。强烈建议先配置pip的国内镜像源以加速下载。我们可以临时使用清华源pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 -i https://pypi.tuna.tsinghua.edu.cn/simple安装完成后验证一下PyTorch是否能正确识别GPU。在激活的虚拟环境中打开Python交互界面python3然后输入以下代码import torch print(torch.__version__) # 打印PyTorch版本 print(torch.cuda.is_available()) # 打印True则表示GPU可用 print(torch.cuda.get_device_name(0)) # 打印你的GPU型号如果一切顺利你会看到PyTorch版本号True以及你的显卡名字。恭喜深度学习框架的基础已经搭建好了。4. 安装VideoAgentTrek-ScreenFilter项目依赖框架搭好了现在来安装项目本身需要的“砖瓦”。通常这类项目会提供一个requirements.txt文件里面列出了所有必需的Python包。首先假设你已经把VideoAgentTrek-ScreenFilter的代码克隆到了本地某个目录比如~/projects/VideoAgentTrek。进入这个目录cd ~/projects/VideoAgentTrek-ScreenFilter先升级一下pip本身确保它是较新的版本pip install --upgrade pip然后尝试安装requirements.txt中的所有依赖pip install -r requirements.txt这个过程可能会遇到一些常见的依赖冲突尤其是不同库对同一个底层库如numpy、opencv-python的版本要求不一致。如果安装失败报错信息通常会告诉你哪个包冲突了。一个比较实用的方法是如果requirements.txt里没有严格指定版本用的是或没写版本我们可以先安装一个兼容性较好的基础版本组合然后再安装项目核心包。例如可以尝试手动安装一些常见依赖pip install numpy1.23.5 pip install opencv-python-headless4.8.1.78 pip install Pillow9.5.0 pip install transformers4.35.0 pip install accelerate0.24.1安装完这些基础包后再次尝试运行pip install -r requirements.txt或者根据项目README文件的说明安装剩下的特定包。如果项目依赖一些通过系统包管理器安装的库比如某些视频处理库依赖ffmpeg别忘了安装它们sudo apt install -y ffmpeg libsm6 libxext65. 验证环境与常见问题解决所有东西都装好了最后一步是验证整个环境是否能正常工作。首先确保你还在项目的根目录并且虚拟环境处于激活状态。然后尝试运行项目提供的示例脚本或测试命令。如果项目有一个main.py或者demo.py可以试着运行python demo.py或者如果项目有提供简单的测试指令比如python -c import video_agent; print(Import successful)观察输出。如果没有报错并且看到了预期的输出比如“Import successful”或者一个示例视频被处理了那么恭喜你环境搭建成功了当然实战中总会遇到些“坑”。这里列举几个我遇到过的常见问题问题ImportError: libGL.so.1: cannot open shared object file解决这是缺少OpenGL相关的系统库。安装它sudo apt install -y libgl1-mesa-glx问题ERROR: Could not find a version that satisfies the requirement torchxxx解决PyTorch版本指定得太死。可以尝试去掉requirements.txt里torch那行的版本号或者根据你的CUDA版本使用前面提到的PyTorch官网命令重新安装。问题CUDA out of memory解决这是运行时错误说明GPU显存不够了。尝试在代码中减小批处理大小batch size或者使用分辨率更低的输入。问题虚拟环境激活失败提示source: not found解决你可能使用的是sh或dash而不是bash。可以尝试用点号.来激活. ~/venvs/videoagent_env/bin/activate或者直接指定用bash执行bash -c source ~/venvs/videoagent_env/bin/activate python your_script.py如果遇到其他错误最好的方法是把完整的错误信息复制下来去项目的GitHub Issues页面或者相关的技术论坛搜索很可能已经有人遇到并解决了同样的问题。环境搭建确实是个有点繁琐的过程但一旦走通后面的事情就顺畅多了。这套流程在Ubuntu 20.04和22.04上我都验证过算是比较稳妥的一条路。当然不同的项目、不同的时间点可能还会有些细微的差异关键还是要学会看错误日志灵活调整。把环境配好就等于拿到了进入项目大门的钥匙。接下来你就可以尽情探索VideoAgentTrek-ScreenFilter的功能或者开始你的二次开发了。如果在搭建过程中遇到了这里没提到的问题也欢迎多交流讨论。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关新闻