Featured image of post 【教程】从零开始搭建pytorch环境

【教程】从零开始搭建pytorch环境

从零开始搭建pytorch环境

前言

在最近的人工智能课程上,我完成了从零搭建人工智能运行环境以及测试的相关流程,已经写完了实验报告,但是因为教师要求将自己的思考过程写在报告里,直接将报告的内容搬过来并不是一个好的选择,于是我决定重新写这一篇文章,力求用最简单、清晰的流程让你完成环境的搭建。

总览

本教程包含:

  • 显卡驱动的安装
  • CUDA的安装
  • Anaconda的安装及部分教程
  • pytorch的安装
  • pytorch的测试

适用与想在Windows操作环境下使用显卡训练pytorch相关模型的学生。

Windows环境下的操作都相对简单,所以不要担心。

本人刚刚进行人工智能相关的学习,如有错误,还望指出。

显卡驱动的安装

这里主要针对N卡的显卡驱动,其他显卡驱动请查看其他文章。 一般来说,电脑是自带有英伟达显卡驱动的,可以通过在命令提示框运行以下命令来查看是否已经安装显卡驱动。

1
nvidia-smi

如果已经正确安装英伟达驱动,你将看到以下界面。 如果没有,请自行前往英伟达官网或英伟达 App下载与安装对应版本的显卡驱动,知直到出现上述图片内容。

CUDA的安装

什么是CUDA

在正式安装CUDA之前,我们先来介绍一下什么CUDA。 CUDA(Compute Unified Device Architecture,计算统一设备架构),是Nvidia开发的并行计算平台和编程模型,核心作用是让开发者能够利用Nvidia GPU的并行计算能力。在pytorch中,CUDA可以帮助pytorch调用GPU加速矩阵运算,所以是我们接下来运行pytorch项目的关键工具。

安装CUDA

首先,根据刚才使用的nvidia-smi获得的信息,我们需要知道当前显卡驱动能支持的最高版本的CUDA,根据刚才的图片,可以知道,我的显卡驱动最高支持到13.0版本。

我们在这里只需要记住这个版本号即可,我不会让你们前往Nvidia挂网下载对应版本的CUDA工具包,关于原因,相信你在下文中会清楚的。

Anaconda的安装

什么是Anaconda

准确来说,Anaconda是一个工具包,其包含Conda,Anaconda Navigator与一些常用的数据科学库。

Conda,是一个环境与包管理工具,类似于npm与pip,它可以管理当前项目所需要的包/依赖,而Conda比pip更高级的地方是,它可以通过虚拟环境管理更多版本的Python解释器!真正让我们能够一个项目对应一个解释器与依赖。

这里不再解释什么是虚拟环境,为什么要有虚拟环境,网上的解释或如今的AI能够解决我们的大部分问题。

当然如果你仅仅是想要稍微尝试一下torch,你当然可以不安装Anaconda而仅仅使用全局环境下的python解释器,当然我不推荐你这么做。

Anaconda Navigator,为初识Conda的学习者提供了图形化界面,它能帮助我们创建、管理虚拟环境,打开对应IDE等等。

安装Anaconda

对Windows环境,我们直接前往Anaconda官网,界面如下图。

点击"Get Started"注册并登录后就可以进入下载页了,选择Windows版本进行下载。

当然如果你不想登录,在地址栏后面添加"/success"就可以跳过验证(doge)。

接下来按照指引完成安装即可,需要注意的是,Anaconda已经不推荐将其添加到环境变量了,我们听取它的建议。

安装好后,你在开始菜单下,应该可以看见这样的几个程序,如图。

这样就说明我们已经安装好了。

Anaconda基础教程

打开Anaconda PowerShell Prompt或者Anaconda Prompt,Anaconda将自动为你启用基虚拟环境,即在路径前可以看到(base)字样。该虚拟环境自带python 3.13

为了以后方便,我们创建一个新的虚拟环境。使用下面的命令创建新的环境。

1
conda create -n <env-name>

使用下面的命令激活/切换到其他虚拟环境.

1
conda activate <env-name>

在上述命令执行成功后,你应该可以看到(base)变成了(<env-name>)

使用下面的命令关闭当前虚拟环境。

1
conda deactivate

conda会自动切换回base虚拟环境。

你也可以使用下面的命令查看当前已经创建了哪些虚拟环境。

1
conda env list

效果如图。

当然,你完全可以使用Anaconda Navigator的图形化界面!

下载Python

我们假设你已经创建好了一个虚拟环境,这里我用temp统称。

现在,我们激活到temp环境下,输入以下命令安装python。

1
conda install python=3.12

这里我们下载3.12版本的python,其他版本的应该也可以,为了不必要的麻烦,还请跟着3.12做一遍。

安装好后,运行以下命令检查是否安装成功。

1
python -V

如果成功返回python版本号,说明已经安装成功啦!

使用以下命令查看当前环境下已经下载了哪些东西。

1
conda list

安装torch

前面说到,我没有让你们下载单独CUDA,因为当前的torch包中已经预编译了相应的CUDA,就算我们安装了CUDA,torch也不会使用我们单独安装的CUDA,不如不装,但是,我希望你们能够了解CUDA在这里面的作用。

如果你使用以下命令,那么pip会帮你安装仅支持CPU运行的torch的包,这里列出,不推荐。

1
pip install torch torchvision

我们下载支持CUDA(已经预编译CUDA,支持GPU运行)的torch包。 前往torch官网下载页,选择适合您机器的版本,复制下面的命令键入到命令行中执行即可。

推荐pip,如果您的显卡驱动不支持表中的CUDA版本,建议安装更高版本的显卡驱动,虽然你也可以安装torch更早的版本

检测是否可用

在命令行中键入以下命令查看当前python已经下载哪些包。

1
pip list

你将看到torchtorchvision在列表中。

接下来,启动python的命令行模式。

1
python

依次执行。

1
import torch
1
torch.cuda.is_available()

如果返回的结果是True的话,恭喜你,你已经完成了torch的安装,不然,请您检查前面的步骤。

运行torch的示例代码

这里假设您会使用git命令以及知道如何使用虚拟环境下的python执行python文件。

项目地址为cnn_example

这里提醒一下,请按照项目的README顺序执行代码。

另外,项目中的部分语法与现在的有些不同,如果你没有python基础,看到报错信息后可以将报错信息复制给AI,按照AI的修改建议修改代码即可。

使用 Hugo 构建
主题 StackJimmy 设计