大语言模型系列(3): Qwen2.5-VL-3B 多模态模型端侧部署

张

张建站

2026/4/28 17:38:17

10分钟阅读

本项目基于 ai-engine-direct-helper (QAI_AppBuilder)https://github.com/quic/ai-engine-direct-helper.git第一部分Windows 平台使用本部分介绍如何在 Windows 环境下配置并运行 Qwen2.5-VL-3B 模型。1.1 资源下载与准备下载模型文件访问网站下载对应平台的模型文件Qwen2.5-VL-3B 模型下载将下载模型放置ai-engine-direct-helper\samples\genie\python\models目录下。下载 Genie 服务程序前往 GitHub Releases 页面下载GenieAPIService_v2.1.3_QAIRT_v2.42.0_v73.zipReleases 下载页面。解压文件将下载的压缩包解压至项目代码目录ai-engine-direct-helper\samples下。1.2 启动服务与运行示例操作步骤打开终端进入 samples 目录分别运行服务和客户端命令。# 1. 进入目录 cd ai-engine-direct-helper\samples # 2. 启动 GenieAPI 服务 (加载配置文件) GenieAPIService\GenieAPIService.exe -c genie\python\models\qwen2.5vl3b\config.json -l 成功启动会有日志 [W] load successfully! use second: 4.56947 [W] Model load successfully: qwen2.5vl3b [W] GenieService::setupHttpServer start [W] GenieService::setupHttpServer end [A] [OK] Genie API Service IS Running. [A] [OK] Genie API Service - http://0.0.0.0:8910 # 3. 运行客户端进行测试 (确保当前目录下有 test.png 图片) GenieAPIClient.exe --prompt what is the image descript? --img test.png --stream --model qwen2.5vl3b注意:运行客户端命令前请确保当前目录下存在名为test.png的测试图片文件。第二部分Android 平台使用2.1 资源下载与安装下载模型文件与 Windows 平台一致请先下载对应平台的模型Qwen2.5-VL-3B 模型下载将下载模型放置/sdcard/GenieModels/目录下。下载与安装 APK访问 GitHub Releases 页面下载GenieAPIService.apk并安装至您的 Android 设备Releases 下载页面。2.2 示例应用编译与运行Android 平台的示例应用源码位于项目目录中您需要自行编译。源码路径samples\android\GenieChat使用说明请使用 Android Studio 打开该目录进行编译并安装到设备上配合已安装的 GenieAPIService 使用。2.3 示例应用截图Geniechat第三部分Python 调用指南无论是在 Windows 运行GenieAPIService.exe还是在 Android 启动GenieAPIService.apk服务启动成功后都会显示一个 IP 地址和端口例如127.0.0.1:8910或手机IP。我们可以使用 Python 通过 OpenAI 兼容接口调用该服务。3.1 环境准备请确保已安装openai库。pip install openai3.2 Python 调用代码 (vl_client.py)创建一个 Python 脚本例如vl_client.py并将以下代码复制进去。请注意根据实际情况修改 IP 地址。import argparse import base64 from openai import OpenAI # 配置服务地址 (Windows本机运行通常为 127.0.0.1:8910Android请填写手机实际IP) IP_ADDR 192.168.137.152:8910 parser argparse.ArgumentParser() parser.add_argument(--stream, actionstore_true) parser.add_argument(--prompt, defaultDescribe this image, typestr) parser.add_argument(--image, requiredTrue, typestr, helpPath to the image file) args parser.parse_args() # 1. 辅助函数将图片转换为 Base64 字符串 def encode_image(image_path): with open(image_path, rb) as image_file: return base64.b64encode(image_file.read()).decode(utf-8) # 获取 Base64 编码的图片 try: base64_image encode_image(args.image) except Exception as e: print(fError loading image: {e}) exit(1) client OpenAI(base_urlhttp:// IP_ADDR /v1, api_key123) # 打印可用模型列表 # model_lst client.models.list() # print(model_lst) # 2. 构建符合 Genie Service (VL模型) 要求的特殊消息结构 # 服务端 ExtractPrompt 函数依赖 content 中的 question 和 image 字段 custom_messages [ {role: system, content: You are a helpful assistant.}, { role: user, content: { question: args.prompt, # 必须使用 question 字段 image: base64_image # 必须使用 image 字段 (Base64) } } ] extra_body { size: 4096, temp: 1.5, top_k: 13, top_p: 0.6, # 3. 关键点通过 extra_body 覆盖 messages 参数 # 这样可以绕过 openai 客户端标准格式验证直接发送自定义 JSON 结构 messages: custom_messages } # 模型名称 (需与 config.json 或启动参数中的名称一致) model_name qwen2.5vl3b # 使用占位符通过 openai 客户端的必填项校验 placeholder_msgs [{role: user, content: placeholder}] print(fRequesting {model_name}...) if args.stream: response client.chat.completions.create( modelmodel_name, streamTrue, messagesplaceholder_msgs, extra_bodyextra_body ) for chunk in response: if chunk.choices: content chunk.choices[0].delta.content if content is not None: print(content, end, flushTrue) else: response client.chat.completions.create( modelmodel_name, messagesplaceholder_msgs, extra_bodyextra_body ) if response.choices: print(response.choices[0].message.content)3.3 运行脚本在命令行中运行脚本指定图片路径和可选提示词python vl_client.py --image test.png --prompt 图片里有什么 --stream作者李晋软件工程师

【Matlab】MATLAB教程：内存使用优化实操（clear释放内存+数组预分配案例+降低内存占用应用）

MATLAB教程：内存使用优化实操（clear释放内存+数组预分配案例+降低内存占用应用）本教程适配MATLAB全系列通用版本，无需额外加装专业工具箱，依托软件原生内存管理机制与基础指令编写，专为MATLAB编程新手、大数据处理人员、工程仿真建模从业者及批量数值计算学习者量身打造…...

2026/4/28 17:37:23 阅读更多 →

微信小程序的社区群互动打卡交流系统设计与实现

目录同行可拿货,招校园代理 ,本人源头供货商功能模块划分打卡功能设计互动交流增强技术实现要点扩展性考虑项目技术支持源码获取详细视频演示 ：文章底部获取博主联系方式！同行可合作同行可拿货,招校园代理 ,本人源头供货商功能模块划分用户管理模块 …...

2026/4/28 17:36:47 阅读更多 →

VS Code Copilot Next 成本失控真相（2024 Q2真实账单拆解）：从$287→$49/月的7类配置陷阱与修复清单

更多请点击： https://intelliparadigm.com 第一章：VS Code Copilot Next 成本失控的根源认知 VS Code Copilot Next 的成本激增并非源于单一配置失误，而是由模型调用粒度、上下文膨胀与本地缓存失效三重机制耦合引发的系统性现象。当开发者启…...

2026/4/28 17:34:39 阅读更多 →

如何在7分钟内搭建专业级仓库管理系统：从零到生产就绪的完整指南

如何在7分钟内搭建专业级仓库管理系统：从零到生产就绪的完整指南【免费下载链接】GreaterWMS This Inventory management system is the currently Ford Asia Pacific after-sales logistics warehousing supply chain process . After I leave Ford , I start thi…...

2026/4/28 6:15:44 阅读更多 →

星露谷物语模组加载器SMAPI：轻松打造个性化农场体验的终极指南

星露谷物语模组加载器SMAPI：轻松打造个性化农场体验的终极指南【免费下载链接】SMAPI The modding API for Stardew Valley. 项目地址: https://gitcode.com/gh_mirrors/smap/SMAPI 想要为《星露谷物语》添加无限乐趣，却担心模组安装复杂、游戏崩…...

2026/4/26 0:01:52 阅读更多 →

终极指南：4步构建专业级浏览器资源捕获与管理工作流

终极指南：4步构建专业级浏览器资源捕获与管理工作流【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓（cat-catch&#x…...

2026/4/26 0:04:21 阅读更多 →