模型:

kha-white/manga-ocr-base

英文

Manga OCR

用于日文文本的光学字符识别,主要关注日本漫画。

它使用 Vision Encoder Decoder 框架。

Manga OCR可以用作通用的印刷日文OCR,但其主要目标是提供高质量的文本识别,对于漫画的各种特定情况都具有鲁棒性:

  • 垂直和水平文本
  • 带有振假名的文本
  • 覆盖在图像上的文本
  • 各种字体和字体样式
  • 低质量图像

源代码可在 here 处找到。