OCR:光学字符识别

光学字符识别用于翻译。

OCR代表光学字符识别。OCR软件用于将PDF或传真等文件转换为可编辑的文档,如Microsoft Word。这是在进行翻译工作之前完成的。

丢失原件时,OCR也可用于重新创建文档。

转变

为什么我们需要转换文件?

PDF文件不是可编辑的文件。它们不是原始源文件。如果我们无法编辑文件,我们无法翻译它。所以我们需要将它们转换为我们可以编辑和修改的格式。可以使用OCR完成此转换过程。OCR软件允许将PDF文件转换为Microsoft Word文件进行翻译。它还可以将传真转换为可编辑格式。

翻译过程

在翻译开始之前,我们必须使用桌面出版(DTP)软件和OCR软件转换文件,包括布局。实际上,我们在Microsoft Word,布局,文本,图形等所有内容中重新创建文件。然后,我们审核该文档以修复任何句子错误或分段错误,以确保翻译的文档对您来说是完美的。这是一个非常劳动密集的过程。完成后,它使翻译过程中的翻译过程变得更加容易。

转换文件有哪些不同的方法?

根据PDF的生成方式,如果文档仅包含可以选择的文本,则可以将文本复制并粘贴到Word文档中。某些PDF具有防止复制和粘贴的安全功能。

如果PDF是扫描文档或无法选择文本,则需要使用OCR软件。OCR工具将每个字符扫描为图像,并尝试将其转换为Word中的可编辑字符。它准确率高达95%,并且做得很好。保持布局是困难的部分。

什么是OCR?
为什么避免OCR更好?

成本和时间是避免使用OCR的主要原因。转换PDF文件需要时间; 它会影响您的交货时间表。转换和检查文档的额外工作量意味着我们必须收取转换成本来完成这项工作。

质量是另一个原因; 使用转换过程通常会降低最终文档的质量。根据使用的分辨率,图像可能会略微降低。我们提供高质量但很少能够使用OCR匹配原始源文档的质量。最好使用原始源文件以获得最高质量的输出。