0

2376

debian12 服务器版安装Nvidia显卡驱动

乐果   发表于   2025 年 02 月 08 日

自去年3月份折腾扩散模型一段时间后,发现精力不够被迫暂停,后以公司项目上的开发任务为重,后来干脆把那台自有的塔式服务器重新安装了服务版的debian系统,用来测试项目上的各种 shellpython 运维脚本,包括 docker 镜像编译打包制作等的自动化运维脚本。下半年又因想测试一些 docker swarm 集群为此将内存升级到 64G,但那张英伟达 3090 显卡却一直吃灰,没机会用上。

最近 deepseek 爆火,又燃起了捣腾那张 3090 显卡的冲动。因此抽空又重新安装一下模型的 GPU 环境,以便后面有空了再研究一些好玩的东西做准备。

安装必要的依赖工具

sudo apt install dkms build-essential gcc make linux-headers-$(uname -r)

禁止系统自带nouveau显卡驱动

1.修改/etc/default/grub文件,在启动时直接禁用nouveau驱动:

sudo vim /etc/default/grub

在文件中的GRUB_CMDLINE_LINUX参数中加入下面内容:

rd.driver.blacklist=nouveau

更新grub:

update-grub

2.在系统中禁用nouveau驱动:

echo "blacklist nouveau" | sudo tee -a /etc/modprobe.d/blacklist-nvidia-nouveau.conf
echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nvidia-nouveau.conf
sudo update-initramfs -u

然后 reboot 重启生效

下载Nvidia显卡驱动并安装

1.下载驱动并设置执行权限:

……

标签:debian 继续阅读

0

1204

绿联nas排查硬盘故障

乐果   发表于   2025 年 02 月 01 日

家里的绿联 nas 好久没用,假期在家捣腾时发现启动不了,便求助了绿联官方技术远程协助排查原因。

故障表现:插两块硬盘时 nas 启动不了,插任意一块硬盘 nas 正常启动。

整个操作过程记录一下,以便以后自己排查这方面的故障方便。

Microsoft Windows [版本 10.0.26100.2894]
(c) Microsoft Corporation。保留所有权利。

C:\Users\Administrator>ssh -p 922 root@192.168.2.150
The authenticity of host '[192.168.2.150]:922 ([192.168.2.150]:922)' can't be established.
ED25519 key fingerprint is SHA256:deZq0pajrwYROo2JUFN12vXqfyZFZlRU2xos3112lC0.
This key is not known by any other names.
Are you sure you want to continue connecting (yes/no/[fingerprint])? yes
Warning: Permanently added '[192.168.2.150]:922' (ED25519) to the list of known hosts.
root@192.168.2.150's password:


BusyBox v1.28.3 () built-in shell (ash)

  _______                     ________        __
 |       |.-----.-----.-----.|  |  |  |.----.|  |_
 |   -   ||  _  |  -__|     ||  |  |  ||   _||   _|
 |_______||   __|_____|__|__||________||__|  |____|
          |__| W I R E L E S S   F R E E D O M
 -----------------------------------------------------
 UGOS 18.06-SNAPSHOT,
 -----------------------------------------------------

如上说明绿联的 nas 系统是基于 openwrt 改造的。

下面则是官方技术远程排查硬盘的命令了,如下:

……

标签:openwrt 继续阅读

0

1284

Docker 容器跨主机通信之网络:overlay

乐果   发表于   2025 年 01 月 03 日

当你安装了 docker, 它会自动创建 3 个网络,可以使用 docker network ls 命令来查看。

(base) xiao@xiao:~$ docker network ls
NETWORK ID     NAME      DRIVER    SCOPE
acb47f4c7ff0   bridge    bridge    local
f2b6a346bd84   host      host      local
d2699c7383f0   none      null      local
  • Bridge模式(桥接模式):默认的网络模式,容器通过虚拟网桥连接到主机的物理网络接口上,可以通过端口映射将容器的端口映射到主机上。
  • Host模式(主机模式):容器与主机共享网络命名空间,容器直接使用主机的网络栈,可以轻松访问主机上的网络资源,但会损失一定的隔离性。
  • None模式(无网络模式):容器不连接到任何网络,只能通过内部与其他容器进行通信,不能与外部进行网络通信。

docker inspect 命令可以查看某个网络详情。

root@vm01:~# docker inspect bridge
[
    {
        "Name": "bridge",
        "Id": "e11244c41ed7db4a5f43f392316c1dd1999bc7e49b74952f0aed6f5352a4a70f",
        "Created": "2025-01-02T15:53:02.456439999+08:00",
        "Scope": "local",
        "Driver": "bridge",
        "EnableIPv6": false,
        "IPAM": {
            "Driver": "default",
            "Options": null,
            "Config": [
                {
                    "Subnet": "172.17.0.0/16",
                    "Gateway": "172.17.0.1"
                }
            ]
        },
        "Internal": false,
        "Attachable": false,
        "Ingress": false,
        "ConfigFrom": {
            "Network": ""
        },
        "ConfigOnly": false,
        "Containers": {},
        "Options": {
            "com.docker.network.bridge.default_bridge": "true",
            "com.docker.network.bridge.enable_icc": "true",
            "com.docker.network.bridge.enable_ip_masquerade": "true",
            "com.docker.network.bridge.host_binding_ipv4": "0.0.0.0",
            "com.docker.network.bridge.name": "docker0",
            "com.docker.network.driver.mtu": "1500"
        },
        "Labels": {}
    }
]

当你开启 docker swarm 模式时,overlay 网络模式就会出现了。

docker swarm 初始化如下所示:

……

标签:Docker 继续阅读

0

1007

Windows11系统下Ubuntu子系统以及Docker运行的一些问题

乐果   发表于   2024 年 12 月 24 日

最近因公司某项目中使用邦奇灯控,需要在 windows 系统下安装一些硬件相关的调试软件, 所以又将自己的办公电脑切换到 windows 系统。

习惯于在 unix 架构系统下开发的我,倒不怎么习惯 windows 系统。

在之前的印象中,windows11 系统总是不那么稳定,偶尔就会莫名的死机,在 windows 系统刚开始推出 “子系统” 时也曾把玩过,但当时爆各种兼容性问题,无法做到真正的 Linux 体验。但现在发现它的 “子系统” 变得完善了,之前的各种兼容性问题差不多得到了解决,观摩下来感觉基本上已可以替代 kvm 虚拟机运行 Linux 体验。

本文主要是记录使用过程中遇到的一些问题以及解决方法的笔记。

PowerShell 启动时出现红色警告,提示没有权限

解决办法,执行如下命令:

set-executionpolicy remotesigned

命令行安装ubuntu子系统

首先要在 控制面版 -> 程序和功能 -> 启用或关闭Windows功能 开启虚拟化相关服务(详百度搜索了解一下)。

开启虚拟化、并重启电脑生效后,以管理员运行 PowerShell 执行如下命令:

wsl --install
wsl --set-default-version 2

wsl --install 命令默认会安装 ubuntu 最新发行版本,例如当前是 ubuntu24.04

wsl端口映射

ubuntu 子系统的ip是一个虚拟网段,局域网无法访问,但开发中有时候需要局域网中对它访问。

例如在 ubuntu 子系统启动了一个 web 程序监听一个端口,局域网中有一台设备要访问这个 web 服务,这时需要将 windows 物理机上的端口映射到 ubuntu 子系统。

查看端口映射

在windows的CMD下运行

netsh interface portproxy show all

添加映射

# netsh interface portproxy add v4tov4 listenport=[win10端口] listenaddress=0.0.0.0 connectport=[虚拟机的端口] connectaddress=[虚拟机的ip]
netsh interface portproxy add v4tov4 listenport=80 listenaddress=0.0.0.0 connectport=80 connectaddress=172.29.41.233

根据ip及端口号删除

netsh interface portproxy delete v4tov4 listenaddress=192.168.100.1 listenport=8080
netsh interface portproxy delete v4tov4 listenport=8080

删除所有代理规则

netsh interface portproxy reset

ubuntu子系统下docker运行vue项目

ubuntu 子系统,在 docker 容器实例中执行 vue 项目的初始化 yarn instll 报 错:

Error: EPERM: operation not permitted, symlink '../../../mime/cli.js' -> '/mnt/d/....'

解决办法,执行命令带上 --no-bin-links 参数,如下:

yarn install --no-bin-links

……

标签:windows 继续阅读

0

1198

android studio编辑器的一些配置

乐果   发表于   2024 年 12 月 02 日

最近因公司项目需要,又开始研究 android 程序开发。

于是开始了 android studio 编辑器的捣腾,在 mac 系统下安装还算顺利。

但把项目第三方 demo 代码下载后,在 android studio 编辑器里初始化各种报错。

本来很早就计划去了解一下安卓开发,趁着这次开发任务,抽空之余,先梳理一下 android studio 编辑器的一些配置。

Gradle

Android Studio 通过 Android Gradle 插件 使用 Gradle 来构建代码;

Android Studio 每次升级后, Android Gradle 插件自动更新,对应的 Gradle 版本也会变动;

因此会产生如下对应关系:

(1)Android Studio 版本与 Android Gradle 插件版本对应关系

具体见官网描述:Android Gradle 插件版本说明 | Android 开发者 | Android Developers

如图所示

……

标签:android 继续阅读

较旧的笔记 较新的笔记