llm deploy project based mnn.
Llama-3-8B-Instruct
导出onnx转换得到的int4量化版本mnn模型。
模型列表:
Qwen1_5-7B-Chat
导出onnx转换得到的int4量化版本mnn模型。
模型列表:
Qwen1_5-4B-Chat
导出onnx转换得到的int4量化版本mnn模型。
模型列表:
Qwen1_5-1_8B-Chat
导出onnx转换得到的int4量化版本mnn模型。
模型列表:
Qwen1_5-0_5B-Chat
导出onnx转换得到的int4量化版本mnn模型。
模型列表:
deepseek-llm-7b-chat
导出onnx转换得到的int4
量化版本mnn模型。
模型列表:
TinyLlama-1.1B-Chat
导出onnx转换得到的int8
量化版本mnn模型。
模型列表:
基于mnn-llm构建的Android apk, apk中不含模型文件。使用方法如下:
/data/local/tmp/mnn-llm
目录下,命令行如下:adb shell mkdir /data/local/tmp/mnn-llm
adb push ./qwen-1.8b-mnn /data/local/tmp/mnn-llm
apk
,打开后在下拉列表中选择要测试的模型文件目录,点击加载模型
按钮;