瑞芯微(EASY EAI)RV1126B AI模型转换

张

张建站

2026/5/14 7:53:05

10分钟阅读

1. AI模型转换本章主要说明如何实现Hugging Face格式的大语言模型Large Language Model, LLM如何转换为RKLLM模型目前支持的模型包括Deepseek、LLaMA, Qwen, Qwen2, Phi-2, Phi-3, ChatGLM3, Gemma, InternLM2 和 MiniCPM等本章以Deepseek-R1为例。本章主要说明如何实现Deepseek-R1大语言模型如何转换为RKLLM模型。1.1 模型下载本节提供两种大模型文件Hugging face的原始模型和转换完成的NPU模型。下载链接: https://pan.baidu.com/s/1u05E5qZcilbxCWMW0Dl6ag?pwd1234 提取码: 1234。1.2 模型转换下载完成后模型和脚本放到同一个目录:在RKLLM-Toolkit环境执行以下指令进行模型转换:至此模型转换成功,生成deepseek_r1_rv1126b_w4a16.rkllm NPU化的大模型文件test.py转换脚本如下所示, 用于转换DeepSeek-R1-Distill-Qwen-1.5B模型:from rkllm.api import RKLLM from datasets import load_dataset from transformers import AutoTokenizer from tqdm import tqdm import torch from torch import nn import os # os.environ[CUDA_VISIBLE_DEVICES]1 modelpath /home/developer/RKLLM-Toolkit/DeepSeek-R1-Distill-Qwen-1.5B llm RKLLM() # Load model # Use export CUDA_VISIBLE_DEVICES2 to specify GPU device # options [cpu, cuda] ret llm.load_huggingface(modelmodelpath, model_lora None, devicecpu) # ret llm.load_gguf(model modelpath) if ret ! 0: print(Load model failed!) exit(ret) # Build model dataset ./data_quant.json # Json file format, please note to add prompt in the inputlike this: # [{input:Human: 你好\nAssistant: , target: 你好我是人工智能助手KK},...] qparams None # qparams gdq.qparams # Use extra_qparams ret llm.build(do_quantizationTrue, optimization_level1, quantized_dtypew4a16, quantized_algorithmnormal, target_platformrv1126b, num_npu_core1, extra_qparamsqparams, datasetNone) if ret ! 0: print(Build model failed!) exit(ret) # Chat with model messages |im_start|system You are a helpful assistant.|im_end||im_start|user你好\n|im_end||im_start|assistant kwargs {max_length: 128, top_k: 1, top_p: 0.8, temperature: 0.8, do_sample: True, repetition_penalty: 1.1} # print(llm.chat_model(messages, kwargs)) # Export rkllm model ret llm.export_rkllm(./deepseek_r1_rv1126b_w4a16.rkllm) if ret ! 0: print(Export model failed!) exit(ret)

从理论到代码：在C2000 DSP上实现永磁同步电机离散域电流PI调节器的完整流程

从理论到代码：在C2000 DSP上实现永磁同步电机离散域电流PI调节器的完整流程在电机控制领域，离散域设计正逐渐取代传统的连续域方法，成为高性能永磁同步电机（PMSM）控制的首选方案。这种转变的核心在于离散域设计能够更…...

2026/5/14 7:49:33 阅读更多 →

2026最新版｜音频格式转换超详细全攻略：8种方法和避坑指南

你是否有过这样的经历——从录音笔导出的WAV文件体积太大无法发送，下载的FLAC无损音乐在车上无法播放，或者视频剪辑时发现音频格式不被软件识别？这些场景都会用到音频格式转换。本文基于2026年最新可用工具，把8种转换方法极度细化…...

2026/5/14 7:46:23 阅读更多 →

AgenticTime：为AI智能体设计的时间推理引擎与.atime文件格式详解

1. 项目概述：为AI智能体赋予时间感知能力如果你用过Claude、GPT或者任何基于大语言模型的AI助手，肯定遇到过这样的场景：你告诉它“周五前要完成API评审”，它当时答应得好好的，但当你隔天再问“我这周有什么要紧事”时&…...

2026/5/14 7:46:22 阅读更多 →

【阳师范学院主办，多高校承协办 | IET出版，往届连续4届EI稳定检索，平均刊后2个月EI检索，EI检索稳定 | 择优至EI期刊】第五届电力工程与电气技术学术会议（ICPEET 2026）

ICPEET 2026 已申请IET (CA) EAI (JA) 出版会议论文（CA）： 会议已申请IET Conference Proceedings (ISSN: 2732-4494) 出版，收录于IET数字图书馆，并提交EI Compendex、Scopus、IEEE Xplore等数据库进行检索。期刊论文…...

2026/5/12 3:35:40 阅读更多 →