IPEX-LLM 借助低精度技术、现代硬件加速和最新的软件优化,支持在英特尔 GPU 上优化任何 HuggingFace transformers 模型。
在英特尔锐炫 GPU 上运行 6B 模型(实时屏幕画面):
在英特尔锐炫 GPU 上运行 13B 模型(实时屏幕画面):
在第六章中,您将学习如何在英特尔 GPU 上使用 IPEX-LLM 优化来运行 LLM 以及实现流式对话功能。本章将使用流行的开源模型作为示例:
0 环境配置 以下是一些设置环境的最佳做法。强烈建议您按照以下相应步骤正确配置环境。
0.1 系统需求 为了顺利体验第六章中的 Notebook,请确保您的硬件和操作系统符合以下要求:
⚠️硬件
英特尔锐炫™ A系列显卡
英特尔 Data Center GPU Flex Series
英特尔 Data Center GPU Max Series
⚠️操作系统
Linux 系统, 推荐使用 Ubuntu 22.04
> **注意**
> 请注意,英特尔 GPU 上的 IPEX-LLM 优化仅支持 Linux 操作系统。
0.2 安装驱动程序和工具包 在英特尔 GPU 上使用 IPEX-LLM 之前,有几个安装工具的步骤:
对于在 Ubuntu 22.04 上使用英特尔锐炫™ A 系列显卡的客户端用户,也可参考以下命令安装驱动程序和 oneAPI Base Toolkit。详细命令:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 sudo apt-get install -y gpg-agent wget wget -qO - https://repositories.intel.com/graphics/intel-graphics.key | \ sudo gpg --dearmor --output /usr/share/keyrings/intel-graphics.gpg echo 'deb [arch=amd64,i386 signed-by=/usr/share/keyrings/intel-graphics.gpg] https://repositories.intel.com/graphics/ubuntu jammy arc' | \ sudo tee /etc/apt/sources.list.d/intel.gpu.jammy.list sudo apt-get update && sudo apt-get install -y --install-suggests linux-image-5.19.0-41-generic sudo sed -i "s/GRUB_DEFAULT=.*/GRUB_DEFAULT=\"1> $(echo $(($(awk -F\' '/menuentry / {print $2}' /boot/grub/grub.cfg \ | grep -no '5.19.0-41' | sed 's/:/\n/g' | head -n 1) -2)))\"/" /etc/default/grubsudo update-grub sudo reboot sudo apt purge linux-image-6.2.0-26-generic sudo apt autoremove sudo reboot sudo apt-get update sudo apt-get -y install \ gawk \ dkms \ linux-headers-$(uname -r) \ libc6-dev sudo apt-get install -y intel-platform-vsec-dkms intel-platform-cse-dkms intel-i915-dkms intel-fw-gpu sudo apt-get install -y gawk libc6-dev udev\ intel-opencl-icd intel-level-zero-gpu level-zero \ intel-media-va-driver-non-free libmfx1 libmfxgen1 libvpl2 \ libegl-mesa0 libegl1-mesa libegl1-mesa-dev libgbm1 libgl1-mesa-dev libgl1-mesa-dri \ libglapi-mesa libgles2-mesa-dev libglx-mesa0 libigdgmm12 libxatracker2 mesa-va-drivers \ mesa-vdpau-drivers mesa-vulkan-drivers va-driver-all vainfo sudo reboot sudo gpasswd -a ${USER} render newgrp render sudo apt-get install -y hwinfo hwinfo --display wget -O- https://apt.repos.intel.com/intel-gpg-keys/GPG-PUB-KEY-INTEL-SW-PRODUCTS.PUB | gpg --dearmor | sudo tee /usr/share/keyrings/oneapi-archive-keyring.gpg > /dev/null echo "deb [signed-by=/usr/share/keyrings/oneapi-archive-keyring.gpg] https://apt.repos.intel.com/oneapi all main" | sudo tee /etc/apt/sources.list.d/oneAPI.listsudo apt update sudo apt install intel-basekit
0.3 Python 环境配置 接下来,使用 python 环境管理工具(推荐使用 Conda )创建 python 环境并安装必要的库。
0.3.1 安装 Conda 对于 Linux 用户,打开终端并运行以下命令:
1 2 3 wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash ./Miniconda3-latest-Linux-x86_64.sh conda init
注意 按照控制台弹出的提示操作,直到 conda 初始化成功完成。
0.3.2 创建环境
注意 推荐使用 Python 3.9 运行 IPEX-LLM.
使用您选择的名称创建一个 Python 3.9 环境,例如 llm-tutorial-gpu:
1 conda create -n llm-tutorial-gpu python=3.9
接下来激活环境 llm-tutorial-gpu:
1 conda activate llm-tutorial-gpu
0.4 Linux 上的推荐配置 为优化英特尔 GPU 的性能,建议设置以下几个环境变量:
1 2 3 4 5 source /opt/intel/oneapi/setvars.shexport USE_XETLA=OFFexport SYCL_PI_LEVEL_ZERO_USE_IMMEDIATE_COMMANDLISTS=1