HarmonyOS NEXT AI基础视觉服务-文字识别-阿里云开发者社区

HarmonyOS NEXT AI基础视觉服务-文字识别

2025-03-30 234

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

小语种识别，小语种识别 200次/月

个人证照识别，个人证照识别 200次/月

票证核验，票证核验 50次/账号

简介： 本案例展示了一款基于AI基础视觉服务的文字识别应用，通过调用设备相机拍摄照片并识别图片中的文字内容。主要实现步骤包括：1) 导入所需功能模块；2) 调用相机获取图片URI；3) 将图片转换为可识别的像素图；4) 配置视觉识别参数并执行文字识别；5) 构建界面组件，实现拍照与结果显示交互。核心要点涵盖相机权限、图像格式兼容及结构化识别结果处理，完整代码整合了各功能模块的调用流程，确保功能顺畅运行。

案例描述

这是一个基于AI基础视觉服务实现的文字识别案例，通过调用设备相机拍摄照片后识别图片中的文字内容。

实现步骤：

1. 模块导入

// 导入功能模块
import {
    camera, cameraPicker } from '@kit.CameraKit';
import {
    fileIo } from '@kit.CoreFileKit';
import image from '@ohos.multimedia.image';
import {
    textRecognition } from '@kit.CoreVisionKit';

2. 相机调用与图片获取

// 创建相机选择器实例
const res = await cameraPicker.pick(getContext(), [
  cameraPicker.PickerMediaType.PHOTO
], {
   
  cameraPosition: camera.CameraPosition.CAMERA_POSITION_BACK
});

// 获取拍摄的图片URI
const imageUri = res.resultUri;

3. 图像处理流程

// 将图片转换为可识别的像素图
const fileSource = await fileIo.open(imageUri, fileIo.OpenMode.READ_ONLY);
const imageSource = image.createImageSource(fileSource.fd);
const pixelMap = await imageSource.createPixelMap();

4. 文字识别核心实现

// 配置视觉识别参数
let visionInfo: textRecognition.VisionInfo = {
   
  pixelMap: pixelMap
};

// 执行文字识别并获取结果
const recognitionResult = await textRecognition.recognizeText(visionInfo);
this.text = recognitionResult.value;

5. 界面构建与交互

@Entry
@Component
struct TextRecognition {
   
  @State text: string = '';

  // 按钮点击事件处理
  async openCamera() {
   
    // 整合上述步骤的完整调用逻辑
  }

  build() {
   
    Column() {
   
      Button('拍照 文字识别')
        .onClick(() => this.openCamera())

      Text(this.text)
        .fontSize(20)
        .margin(10)
    }
    .padding(20)
  }
}

2. 完整业务逻辑

整合各功能模块的完整调用流程

总结梳理：

核心点

相机调用需设备权限与硬件支持
图像转换确保兼容不同格式图片
文字识别接口返回结构化识别结果

完整代码

// 原始代码保持完整，仅添加说明注释
import {
    camera, cameraPicker } from '@kit.CameraKit';
import {
    fileIo } from '@kit.CoreFileKit';
import image from '@ohos.multimedia.image';
import {
    textRecognition } from '@kit.CoreVisionKit';

@Entry
@Component
struct TextRecognition {
   
  @State text: string = '';

  // 主功能方法：整合相机调用与文字识别
  async openCamera() {
   
    // 步骤1：调用相机拍摄
    const res = await cameraPicker.pick(getContext(), [cameraPicker.PickerMediaType.PHOTO], {
   
      cameraPosition: camera.CameraPosition.CAMERA_POSITION_BACK
    })

    // 步骤2：检查OCR能力可用性
// 使用canIUse接口检测设备是否支持文字识别能力
    if (canIUse('SystemCapability.AI.OCR.TextRecognition')) {
   
      // 步骤3：处理图像文件
      const fileSource = await fileIo.open(res.resultUri, fileIo.OpenMode.READ_ONLY);
      const imageSource = image.createImageSource(fileSource.fd);
      const chooseImage = await imageSource.createPixelMap();

      // 步骤4：执行文字识别
      let visionInfo: textRecognition.VisionInfo = {
   
        pixelMap: chooseImage
      };
      const data = await textRecognition.recognizeText(visionInfo);

      // 更新识别结果到界面
      this.text = data.value
    }
  }

  // UI布局
  build() {
   
    Column() {
   
      Button('拍照 文字识别')
        .onClick(() => {
   
          this.openCamera()
        })

      Text(this.text)
        .fontSize(20)
        .margin(10)
    }
    .height('100%')
    .width('100%')
  }
}

HarmonyOS NEXT AI基础视觉服务-文字识别

案例描述

实现步骤：

1. 模块导入

2. 相机调用与图片获取

3. 图像处理流程

4. 文字识别核心实现

5. 界面构建与交互

2. 完整业务逻辑

总结梳理：

核心点

完整代码

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

HarmonyOS NEXT AI基础视觉服务-文字识别

案例描述

实现步骤：

1. 模块导入

2. 相机调用与图片获取

3. 图像处理流程

4. 文字识别核心实现

5. 界面构建与交互

2. 完整业务逻辑

总结梳理：

核心点

完整代码

热门文章

最新文章

相关课程

相关电子书

相关实验场景