Qwen3.5-9B实操手册ss -tlnp端口检查nvidia-smi显卡验证1. 项目概述Qwen3.5-9B是一款拥有90亿参数的开源大语言模型具备强大的逻辑推理、代码生成和多轮对话能力。该模型支持多模态理解图文输入和长上下文处理最高可达128K tokens是当前开源模型中的佼佼者。项目环境配置搭建日期2026-03-25模型版本Qwen3.5-9B多模态运行环境torch28Conda服务端口7860进程管理Supervisor2. 项目结构与快速管理2.1 项目目录结构/root/qwen3.5-9b/ ├── app.py # 主程序 (Gradio WebUI) ├── start.sh # 启动脚本 ├── service.log # 运行日志 └── history.json # 对话历史记录2.2 常用管理命令# 查看服务状态 supervisorctl status qwen3.5-9b # 重启服务 supervisorctl restart qwen3.5-9b # 停止服务 supervisorctl stop qwen3.5-9b # 查看实时日志 tail -f /root/qwen3.5-9b/service.log # 查看错误日志 grep -i error /root/qwen3.5-9b/service.log3. 服务访问与功能特性3.1 访问地址本地访问http://localhost:7860网络访问http://服务器IP:78603.2 核心功能功能说明文本对话支持中英文对话图片上传支持 JPEG, PNG, GIF, WEBP 等格式图片描述上传图片后可询问图片内容参数调节可调整 max_tokens, temperature, top_p, top_k3.3 使用示例文本对话在输入框输入问题点击 Send 或按回车等待模型回复图片分析在右侧 Upload Image 上传图片在输入框描述你想问的问题如 这张图片里有什么点击 Send4. 服务监控与验证4.1 端口检查ss -tlnp# 检查7860端口是否正常监听 ss -tlnp | grep 7860 # 预期输出示例 LISTEN 0 128 0.0.0.0:7860 0.0.0.0:* users:((python,pid12345,fd3))如果端口未正常监听可能原因包括服务未启动端口被占用防火墙限制4.2 GPU状态检查nvidia-smi# 检查GPU使用情况 nvidia-smi # 预期输出示例 ----------------------------------------------------------------------------- | NVIDIA-SMI 535.54.03 Driver Version: 535.54.03 CUDA Version: 12.2 | |--------------------------------------------------------------------------- | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | || | 0 NVIDIA RTX 4090 On | 00000000:01:00.0 Off | Off | | 0% 45C P8 15W / 450W | 1234MiB / 24576MiB | 0% Default | | | | N/A | ---------------------------------------------------------------------------关键指标说明GPU-UtilGPU使用率正常应大于0%Memory-Usage显存使用量模型加载后会占用大量显存TempGPU温度过高可能导致降频5. 常见问题排查5.1 服务启动失败排查流程检查Supervisor状态supervisorctl status qwen3.5-9b查看详细日志supervisorctl tail qwen3.5-9b检查端口占用情况ss -tlnp | grep 7860 lsof -i :7860验证GPU可用性nvidia-smi5.2 模型加载问题症状服务启动后长时间无响应排查步骤检查模型加载进度grep Loading weights /root/qwen3.5-9b/service.log确认模型路径正确ls -l /root/ai-models/Qwen/Qwen3.5-9B检查GPU显存是否足够nvidia-smi6. 日常维护建议6.1 日志管理# 日志轮转每周执行 cp /root/qwen3.5-9b/service.log /root/qwen3.5-9b/service.log.$(date %Y%m%d) /root/qwen3.5-9b/service.log supervisorctl restart qwen3.5-9b6.2 对话历史清理# 清理历史对话记录 rm -f /root/qwen3.5-9b/history.json supervisorctl restart qwen3.5-9b6.3 定期健康检查建议设置定时任务crontab每天检查服务状态# 每日健康检查脚本示例 #!/bin/bash # 检查服务状态 status$(supervisorctl status qwen3.5-9b | awk {print $2}) # 检查端口监听 port_check$(ss -tlnp | grep 7860 | wc -l) # 检查GPU状态 gpu_check$(nvidia-smi | grep Default | awk {print $13}) if [ $status ! RUNNING ] || [ $port_check -eq 0 ] || [ $gpu_check 0% ]; then echo Qwen3.5-9B服务异常状态$status, 端口$port_check, GPU使用率$gpu_check | mail -s Qwen3.5-9B服务告警 adminexample.com fi7. 总结本手册详细介绍了Qwen3.5-9B模型的部署验证方法重点讲解了如何使用ss -tlnp检查端口状态和通过nvidia-smi验证GPU资源使用情况。通过这套监控方案您可以快速确认服务是否正常启动及时发现端口冲突或资源不足问题掌握GPU资源利用情况建立完整的服务健康检查机制建议将端口检查和GPU验证纳入日常运维流程确保模型服务稳定运行。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。