- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

鸿蒙的AI模型部署（离线/在线推理）

鱼弦发表于 2025/08/25 22:18:18 2025/08/25

【摘要】 1. 引言在人工智能技术深度融入智能终端的今天，AI模型的部署能力决定了设备能否真正实现“智能自治”。无论是手机相册的“拍照识物”、车载系统的“语音助手”，还是工业设备的“缺陷检测”，核心都依赖于AI模型在设备或云端的高效推理。然而，模型的部署并非简单的“加载运行”——它需要平衡计算效率、功耗控制、隐私保护与实时性要求，并根据场景需求灵活选择离线（本地）推...

1. 引言

在人工智能技术深度融入智能终端的今天，AI模型的部署能力决定了设备能否真正实现“智能自治”。无论是手机相册的“拍照识物”、车载系统的“语音助手”，还是工业设备的“缺陷检测”，核心都依赖于AI模型在设备或云端的高效推理。然而，模型的部署并非简单的“加载运行”——它需要平衡 计算效率、功耗控制、隐私保护 与 实时性要求，并根据场景需求灵活选择 离线（本地）推理 或 在线（云端）推理。

华为鸿蒙操作系统（HarmonyOS）通过 HiAI Foundation 和 分布式计算框架，为开发者提供了灵活的AI模型部署方案，支持模型在设备端（离线）或云端（在线）的无缝运行。开发者既可以利用设备的NPU（神经网络处理单元）实现 低延迟、隐私保护的离线推理，也可以通过云端的高性能算力处理 复杂模型或大规模数据，满足不同场景的需求。

本文将深入讲解鸿蒙AI模型部署的核心技术，涵盖离线与在线推理的典型场景、代码实现、原理解析及实践指南，并探讨其未来趋势与挑战。

2. 技术背景

2.1 为什么需要AI模型部署？

AI能力的落地关键：训练好的AI模型（如图像分类、语音识别）仅是“静态知识”，只有将其部署到实际设备中并完成实时推理，才能转化为“动态智能”（如手机拍照自动识别物体）。
多样化场景需求：不同场景对推理的要求差异显著——例如，自动驾驶的“实时目标检测”需毫秒级延迟（必须本地推理），而医疗影像的“复杂病理分析”可能需要云端的高精度模型（依赖在线推理）。
鸿蒙的生态优势：鸿蒙的分布式架构支持多设备协同（如手机推理后同步结果到平板），而HiAI Foundation封装了模型部署的底层细节（如张量转换、算力调度），开发者无需关注硬件差异（如NPU vs GPU），即可实现高效部署。

2.2 核心概念

AI模型部署：将训练好的AI模型（如TensorFlow Lite、ONNX、PyTorch Mobile）集成到目标环境（设备或云端），并通过推理引擎执行预测的过程。
离线推理（本地推理）：模型直接在终端设备（如手机、平板）上运行，依赖设备的计算资源（如CPU、NPU、GPU），无需网络连接，具有 低延迟、隐私保护 的特点。
在线推理（云端推理）：模型部署在云端服务器（如华为云、AWS），设备通过网络将输入数据（如图像、语音）上传至云端，由云端算力完成推理后返回结果，适合 复杂模型或大规模计算。
HiAI Foundation：鸿蒙官方AI框架，提供统一的模型部署API（如 ModelInference），支持离线（本地NPU加速）和在线（云端服务集成）两种模式，并封装了模型转换、张量处理等底层操作。
模型格式：常见部署格式包括 TensorFlow Lite（.tflite）、ONNX（.onnx）、PyTorch Mobile（.ptl），鸿蒙通过工具链（如HiAI Model Converter）将这些格式转换为设备优化的 .himodel（离线）或直接调用云端API（在线）。
算力调度：离线推理时，鸿蒙系统根据设备硬件（是否支持NPU）自动选择最优计算单元（NPU > GPU > CPU）；在线推理时，通过HTTP/HTTPS协议与云端服务通信，利用云端的GPU集群或大模型算力。

2.3 应用场景概览

场景类型	离线推理应用示例	在线推理应用示例
智能相册	手机本地识别照片中的物体（如“风景”“人物”），无需上传云端，保护隐私	云端分析海量照片的语义标签（如“婚礼现场”“雪山风景”），提供更精准的分类
车载系统	实时检测前方车辆/行人（目标检测），延迟<50ms，保障行车安全	云端处理复杂路况决策（如多车协同避障），依赖高精度地图和全局信息
医疗设备	便携式设备本地检测心电图异常（轻量级模型），快速反馈结果	云端分析高分辨率医学影像（如MRI），结合专家知识库提供诊断建议
工业质检	工厂摄像头本地识别产品缺陷（如划痕、裂纹），实时剔除不良品	云端整合多工厂数据，训练更通用的质检模型，通过在线推理优化生产标准
语音助手	设备本地识别用户语音指令（如“打开闹钟”），响应速度快（<200ms）	云端处理多语言翻译或复杂语义理解（如方言转标准语），依赖大语言模型（LLM）
教育终端	儿童手表本地识别用户语音提问（如“地球为什么转？”），返回预置答案	云端连接教育知识库，提供实时答疑或个性化学习建议

3. 应用使用场景

3.1 场景1：离线图像分类（手机相册识物）

需求：用户拍摄一张照片（如花朵），设备通过本地部署的图像分类模型（如MobileNetV2）识别照片中的主要物体（如“玫瑰”），并显示分类结果及置信度，全程无需网络连接。

3.2 场景2：在线语音翻译（跨境沟通）

需求：用户在国外旅游时，对手机说出外语句子（如英语“Where is the nearest hospital?”），设备通过在线推理调用云端翻译API，将语音转换为文字并翻译为目标语言（如中文“最近的医院在哪里？”），实现实时沟通。

3.3 场景3：离线目标检测（车载安全辅助）

需求：车辆行驶中，车载摄像头实时采集前方画面，通过本地部署的目标检测模型（如YOLOv5-tiny）检测行人、车辆等障碍物，标记边界框并触发警报（如“前方行人，请减速”），延迟需控制在50毫秒内。

3.4 场景4：在线大模型问答（智能客服）

需求：用户通过鸿蒙平板向企业智能客服提问（如“我的订单什么时候发货？”），设备将问题文本上传至云端，由云端的大语言模型（如GPT-3.5）分析上下文并生成精准回答，支持复杂语义理解。

4. 不同场景下的详细代码实现

4.1 环境准备

开发工具：DevEco Studio（鸿蒙官方IDE，集成HiAI Foundation和模型部署模块）。
技术栈：ArkTS（鸿蒙应用开发语言）、HiAI Foundation（模型推理API）、TensorFlow Lite/ONNX（模型训练与转换）、HTTP客户端（在线推理）。
硬件要求：搭载NPU（如麒麟芯片）的鸿蒙设备（手机、平板）用于离线推理，或稳定网络连接的设备用于在线推理。
依赖库：引入 @ohos.hiai（HiAI Foundation）、@ohos.net.http（HTTP请求模块，用于在线推理）。
模型工具：使用HiAI Model Converter将训练好的模型（如TensorFlow Lite）转换为鸿蒙优化的 .himodel格式（离线），或直接调用云端API（在线）。

4.2 场景1：离线图像分类（手机相册识物）

4.2.1 核心代码实现

// 导入HiAI Foundation的图像推理模块和图像处理模块
import hiainference from '@ohos.hiai.inference';
import image from '@ohos.multimedia.image';

// 1. 初始化离线图像分类器（加载本地.himodel模型，使用NPU加速）
let classifier: hiainference.ImageClassifier | null = null;

async function initOfflineClassifier() {
  try {
    // 加载设备本地的.himodel模型文件（路径：/data/models/image_classifier.himodel）
    classifier = await hiainference.createImageClassifier({
      modelPath: '/data/models/image_classifier.himodel', // 本地模型路径
      config: {
        topK: 3, // 返回前3个分类结果
        threshold: 0.5, // 置信度阈值
        useNpu: true // 强制使用NPU加速
      }
    });
    console.log('离线图像分类器（NPU加速）初始化成功');
  } catch (error) {
    console.error('离线分类器初始化失败:', error);
  }
}

// 2. 处理用户拍摄的照片（本地推理）
async function classifyImageOffline(imageObj: image.Image) {
  if (!classifier) {
    console.error('离线分类器未初始化，请先调用initOfflineClassifier()');
    return;
  }

  try {
    // 将Image对象转换为模型输入张量（自动处理缩放/归一化）
    const inputTensor = await convertImageToTensor(imageObj);

    // 执行本地推理（NPU并行计算，毫秒级响应）
    const result = await classifier.classify(inputTensor);

    // 解析结果（输出前3个分类及置信度）
    console.log('离线图像分类结果:');
    result.forEach((item, index) => {
      console.log(`  ${index + 1}. ${item.className} (置信度: ${(item.score * 100).toFixed(1)}%)`);
    });

    // 在UI上显示结果（示例：更新Text组件）
    // this.resultText = `1. ${result[0].className} (${(result[0].score * 100).toFixed(1)}%)`;
  } catch (error) {
    console.error('离线图像分类失败:', error);
  }
}

// 3. 辅助函数：将Image转换为模型输入张量（简化示例）
async function convertImageToTensor(imageObj: image.Image): Promise<hiainference.TensorBuffer> {
  const pixels = await imageObj.getPixels();
  const width = imageObj.width;
  const height = imageObj.height;

  // 创建TensorBuffer（输入格式需匹配模型要求，通常为[1, 3, height, width]）
  const tensor = new hiainference.TensorBuffer({
    dimensions: [1, 3, height, width], // 批次1，3通道（RGB），高度和宽度
    dataType: hiainference.DataType.FLOAT32, // NPU高效数据类型
    data: new Float32Array(width * height * 3)
  });

  // 填充像素数据（归一化到[0,1]）
  for (let y = 0; y < height; y++) {
    for (let x = 0; x < width; x++) {
      const pixelIndex = (y * width + x) * 3;
      tensor.data[pixelIndex] = pixels[pixelIndex] / 255.0;     // R通道
      tensor.data[pixelIndex + 1] = pixels[pixelIndex + 1] / 255.0; // G通道
      tensor.data[pixelIndex + 2] = pixels[pixelIndex + 2] / 255.0; // B通道
    }
  }

  return tensor;
}

// 4. 调用示例（模拟用户拍摄照片后调用分类）
initOfflineClassifier().then(() => {
  const mockImage = new image.Image(224, 224); // 示例：224x224像素（模型常见输入尺寸）
  classifyImageOffline(mockImage);
});

4.2.2 代码解析

离线模型加载：模型文件（.himodel）预先部署在设备的 /data/models/目录，通过 modelPath指定路径加载，确保无网络依赖。
NPU加速：配置 useNpu: true后，推理任务自动在设备的NPU（如麒麟芯片的达芬奇架构）上执行，利用并行计算能力实现毫秒级响应（通常<100毫秒）。
隐私保护：所有图像数据仅在设备本地处理，不上传云端，符合用户隐私要求。

4.3 场景2：在线语音翻译（跨境沟通）

4.3.1 核心代码实现

// 导入语音识别模块、HTTP客户端和翻译服务模块（假设华为云翻译API）
import speech from '@ohos.speech';
import http from '@ohos.net.http';
import audio from '@ohos.multimedia.audio';

// 1. 初始化语音识别器（将用户语音转为文字）
let recognizer: speech.SpeechRecognizer | null = null;

async function initSpeechRecognizer() {
  try {
    recognizer = await speech.createSpeechRecognizer({
      language: 'en-US', // 假设用户说英语（可根据场景调整）
      mode: 'streaming', // 实时流式识别
      useCloud: false,   // 本地识别（保护隐私，仅转文字）
      config: {
        enablePunctuation: true
      }
    });
    console.log('语音识别器初始化成功');
  } catch (error) {
    console.error('语音识别器初始化失败:', error);
  }
}

// 2. 语音识别转文字（本地处理）
async function recognizeSpeechToLocal() {
  if (!recognizer) {
    console.error('语音识别器未初始化，请先调用initSpeechRecognizer()');
    return;
  }

  try {
    // 打开麦克风音频流
    const audioStream = await audio.createMicrophoneStream({
      sampleRate: 16000,
      channelCount: 1,
      format: audio.AudioFormat.PCM_16BIT
    });

    let recognizedText = '';
    // 注册识别结果回调
    recognizer.on('result', (event) => {
      recognizedText = event.result.text; // 获取识别的文字（如英文句子）
      console.log('识别出的文字:', recognizedText);
      // 触发在线翻译（调用云端API）
      translateTextOnline(recognizedText);
    });

    // 开始语音识别
    await recognizer.start(audioStream);
    console.log('语音识别已开始，请说话...');
  } catch (error) {
    console.error('语音识别启动失败:', error);
  }
}

// 3. 在线翻译（调用云端API）
async function translateTextOnline(text: string) {
  try {
    // 创建HTTP请求（示例：调用华为云翻译API）
    const httpRequest = http.createHttp();
    const url = 'https://translation-api.huawei.com/v1/translate'; // 假设的API地址
    const headers = {
      'Content-Type': 'application/json',
      'Authorization': 'Bearer YOUR_API_KEY' // 替换为实际API密钥
    };
    const requestBody = {
      sourceText: text,
      sourceLang: 'en', // 源语言（英语）
      targetLang: 'zh'  // 目标语言（中文）
    };

    // 发送POST请求
    httpRequest.request(url, {
      method: http.RequestMethod.POST,
      header: headers,
      body: JSON.stringify(requestBody)
    }, (err, data) => {
      if (!err) {
        const response = JSON.parse(data.result.toString());
        const translatedText = response.translatedText; // 获取翻译结果（如中文）
        console.log('翻译结果:', translatedText);
        // 在UI上显示原文和译文（示例：更新Translation组件）
        // this.originalText = text;
        // this.translatedText = translatedText;
      } else {
        console.error('在线翻译失败:', err);
      }
    });
  } catch (error) {
    console.error('在线翻译请求异常:', error);
  }
}

// 4. 调用示例（模拟用户语音输入后触发翻译）
initSpeechRecognizer().then(() => {
  recognizeSpeechToLocal();
});

4.3.2 代码解析

端云协同：语音识别在设备本地完成（保护隐私，仅转文字），翻译通过云端API（如华为云）实现多语言支持，利用云端的计算资源和语言模型提升翻译准确率。
实时性：语音识别为流式处理（实时返回部分结果），翻译请求通过HTTP POST发送，适合对延迟要求较高的跨境沟通场景（如旅游问路）。

4.4 场景3：离线目标检测（车载安全辅助）

4.4.1 核心代码实现

// 导入目标检测模块和图像处理模块
import hiainference from '@ohos.hiai.inference';
import image from '@ohos.multimedia.image';

// 1. 初始化离线目标检测器（加载本地.himodel模型，如YOLOv5-tiny）
let detector: hiainference.ObjectDetector | null = null;

async function initOfflineDetector() {
  try {
    detector = await hiainference.createObjectDetector({
      modelPath: '/data/models/object_detector.himodel', // 本地模型路径
      config: {
        minObjectSize: 30, // 最小检测物体尺寸（像素）
        maxObjects: 10,    // 最大检测数量
        useNpu: true       // 强制使用NPU加速
      }
    });
    console.log('离线目标检测器（NPU加速）初始化成功');
  } catch (error) {
    console.error('离线检测器初始化失败:', error);
  }
}

// 2. 检测图像中的物体（本地推理）
async function detectObjectsOffline(imageObj: image.Image) {
  if (!detector) {
    console.error('离线检测器未初始化，请先调用initOfflineDetector()');
    return;
  }

  try {
    // 将Image对象转换为模型输入张量
    const inputTensor = await convertImageToTensor(imageObj);

    // 执行本地推理（检测物体位置和类别）
    const result = await detector.detect(inputTensor);

    // 解析结果（每个物体包含类别、置信度和边界框）
    console.log('检测到的物体:');
    result.forEach((obj, index) => {
      const { className, score, boundingBox } = obj;
      const { x1, y1, x2, y2 } = boundingBox;
      console.log(`  ${index + 1}. ${className} (置信度: ${(score * 100).toFixed(1)}%) -> 位置: (${x1}, ${y1}) -> (${x2}, ${y2})`);
      // 在UI上绘制矩形框（示例：通过Canvas组件）
      // drawRect(x1, y1, x2 - x1, y2 - y1, className);
    });
  } catch (error) {
    console.error('离线目标检测失败:', error);
  }
}

// 3. 辅助函数：图像转张量（复用场景1的逻辑）
async function convertImageToTensor(imageObj: image.Image): Promise<hiainference.TensorBuffer> {
  // ...（与场景1的convertImageToTensor函数相同）
}

// 4. 调用示例（模拟车载摄像头输入）
initOfflineDetector().then(() => {
  const mockCameraFrame = new image.Image(640, 480); // 示例：车载摄像头分辨率
  detectObjectsOffline(mockCameraFrame);
});

4.4.2 代码解析

低延迟推理：通过NPU加速，目标检测的延迟控制在50~100毫秒，满足车载系统对实时性的严苛要求（如紧急制动预警）。
本地处理：所有检测过程在设备端完成，不依赖网络，避免因信号弱导致的安全隐患。

4.5 场景4：在线大模型问答（智能客服）

4.5.1 核心代码实现

// 导入HTTP客户端和自然语言处理模块
import http from '@ohos.net.http';

// 1. 用户输入问题（文本）
const userQuestion = '我的订单什么时候发货？';

// 2. 调用云端大模型API（如华为云对话机器人）
async function askCloudLLM(question: string) {
  try {
    const httpRequest = http.createHttp();
    const url = 'https://llm-api.huawei.com/v1/chat'; // 假设的云端LLM API地址
    const headers = {
      'Content-Type': 'application/json',
      'Authorization': 'Bearer YOUR_API_KEY' // 替换为实际密钥
    };
    const requestBody = {
      question: question,
      context: [], // 可选：历史对话上下文
      model: 'huawei-llm-large' // 指定大模型（如华为云的千亿参数模型）
    };

    // 发送POST请求
    httpRequest.request(url, {
      method: http.RequestMethod.POST,
      header: headers,
      body: JSON.stringify(requestBody)
    }, (err, data) => {
      if (!err) {
        const response = JSON.parse(data.result.toString());
        const answer = response.answer; // 获取大模型的回复
        console.log('大模型回答:', answer);
        // 在UI上显示问答结果（示例：更新ChatComponent）
        // this.question = question;
        // this.answer = answer;
      } else {
        console.error('云端问答失败:', err);
      }
    });
  } catch (error) {
    console.error('云端请求异常:', error);
  }
}

// 3. 调用示例（模拟用户提问）
askCloudLLM(userQuestion);

4.5.2 代码解析

大模型能力：云端的大语言模型（如千亿参数LLM）支持复杂语义理解（如多轮对话、情感分析），适合处理需要深度推理的场景（如客服咨询）。
网络依赖：需稳定的互联网连接，延迟通常为200~500毫秒（取决于网络质量）。

5. 原理解释

5.1 鸿蒙AI模型部署的核心机制

离线推理（本地）：
- 模型加载：训练好的模型（如TensorFlow Lite）通过HiAI Model Converter工具转换为鸿蒙优化的 .himodel格式，部署到设备的 /data/models/目录。推理时，HiAI Foundation直接加载本地模型文件，无需网络连接。
- 算力调度：系统根据设备硬件（是否支持NPU）自动选择最优计算单元（NPU > GPU > CPU）。例如，图像分类模型优先使用NPU的并行计算单元（如达芬奇架构的脉动阵列），提升推理效率。
- 隐私保护：所有输入数据（如图像、语音）和推理结果均在设备本地处理，不上传云端，符合GDPR等隐私法规。
在线推理（云端）：
- 模型部署：复杂的模型（如大语言模型LLM）或需要大规模计算的场景（如医学影像分析），模型部署在云端服务器（如华为云的GPU集群）。开发者通过HTTP/HTTPS协议调用云端API，将输入数据（如文本、图像）上传至云端。
- 云端计算：云端利用高性能算力（如GPU、TPU）执行推理，返回结果给设备。例如，图像分割模型在云端处理高分辨率图片，返回精确的像素级标注。
- 灵活性：在线推理支持动态扩展（如根据请求量自动增加云端计算资源），适合处理突发流量或复杂任务。
统一API封装：HiAI Foundation提供 ModelInference等统一API，开发者无需关心离线/在线模式的底层差异（如张量转换、网络通信），只需配置模型路径（离线）或API地址（在线），即可完成推理。

5.2 原理流程图

[用户输入数据（图像/语音/文本）] → 鸿蒙应用调用推理API
  ↓
[判断推理模式] → 离线推理：加载本地.himodel模型 → 数据预处理（缩放/归一化） → 调用NPU/GPU/CPU执行推理 → 返回结果
  ↓
  在线推理：将输入数据通过HTTP上传至云端 → 云端模型加载（如大语言模型） → 云端算力执行推理 → 返回结果到设备
  ↓
[结果展示] → 在UI上显示分类结果、翻译文本、检测框或问答答案

6. 核心特性

特性	说明	优势
离线低延迟	本地推理利用NPU加速，响应时间<100毫秒（如图像分类），适合实时交互场景	无网络依赖，保护隐私，体验流畅
在线高精度	云端部署大模型（如千亿参数LLM），支持复杂语义理解（如多轮对话）	处理复杂任务，结果更精准
灵活部署	支持TensorFlow Lite、ONNX等多种模型格式，通过工具链转换为.himodel（离线）或直接调用云端API（在线）	适配不同训练框架，降低开发门槛
算力优化	离线时自动选择NPU/GPU/CPU最优计算单元；在线时利用云端GPU集群扩展算力	平衡性能与成本
隐私保护	离线推理数据不出设备；在线推理可选加密传输（HTTPS），符合隐私法规	增强用户信任
多场景适配	覆盖智能相册、车载系统、医疗设备、智能客服等全场景，支持定制化部署	鸿蒙生态全场景智能化

7. 环境准备

开发工具：DevEco Studio（鸿蒙官方IDE，集成模型部署的代码提示与调试功能）。
技术栈：ArkTS（鸿蒙应用开发语言）、HiAI Foundation（离线推理API）、HTTP客户端（在线推理）、TensorFlow Lite/ONNX（模型训练与转换）。
硬件要求：搭载NPU（如麒麟芯片）的鸿蒙设备（手机、平板）用于离线推理，或稳定网络连接的设备用于在线推理。
依赖库：引入 @ohos.hiai（HiAI Foundation）、@ohos.net.http（HTTP请求模块）。
模型工具：使用HiAI Model Converter将训练好的模型（如TensorFlow Lite）转换为.himodel格式（离线），或注册云端AI服务（如华为云）获取API密钥（在线）。

8. 实际详细应用代码示例实现（综合案例：智能相册离线+在线混合推理）

8.1 需求描述

开发一个鸿蒙智能相册应用，具备以下功能：

离线模式：用户拍摄照片后，设备本地识别照片中的主要物体（如“风景”“人物”），并显示分类结果（响应时间<100毫秒）。
在线模式：若用户点击“详细分析”，将

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

鸿蒙的AI模型部署（离线/在线推理）

​​1. 引言​​

​​2. 技术背景​​

​​2.1 为什么需要AI模型部署？​​

​​2.2 核心概念​​

​​2.3 应用场景概览​​

​​3. 应用使用场景​​

​​3.1 场景1：离线图像分类（手机相册识物）​​

​​3.2 场景2：在线语音翻译（跨境沟通）​​

​​3.3 场景3：离线目标检测（车载安全辅助）​​

​​3.4 场景4：在线大模型问答（智能客服）​​

​​4. 不同场景下的详细代码实现​​

​​4.1 环境准备​​

​​4.2 场景1：离线图像分类（手机相册识物）​​

​​4.2.1 核心代码实现​​

​​4.2.2 代码解析​​

​​4.3 场景2：在线语音翻译（跨境沟通）​​

​​4.3.1 核心代码实现​​

​​4.3.2 代码解析​​

​​4.4 场景3：离线目标检测（车载安全辅助）​​

​​4.4.1 核心代码实现​​

​​4.4.2 代码解析​​

​​4.5 场景4：在线大模型问答（智能客服）​​

​​4.5.1 核心代码实现​​

​​4.5.2 代码解析​​

​​5. 原理解释​​

​​5.1 鸿蒙AI模型部署的核心机制​​

​​5.2 原理流程图​​

​​6. 核心特性​​

​​7. 环境准备​​

​​8. 实际详细应用代码示例实现（综合案例：智能相册离线+在线混合推理）​​

​​8.1 需求描述​​