什么是OCR？

admin 2024-07-30 15:42:46 183 120

OCR：光学字符识别

光学字符识别用于翻译。

OCR代表光学字符识别。OCR软件用于将PDF或传真等文件转换为可编辑的文档，如Microsoft Word。这是在进行翻译工作之前完成的。

丢失原件时，OCR也可用于重新创建文档。

转变

为什么我们需要转换文件？

PDF文件不是可编辑的文件。它们不是原始源文件。如果我们无法编辑文件，我们无法翻译它。所以我们需要将它们转换为我们可以编辑和修改的格式。可以使用OCR完成此转换过程。OCR软件允许将PDF文件转换为Microsoft Word文件进行翻译。它还可以将传真转换为可编辑格式。

翻译过程

在翻译开始之前，我们必须使用桌面出版（DTP）软件和OCR软件转换文件，包括布局。实际上，我们在Microsoft Word，布局，文本，图形等所有内容中重新创建文件。然后，我们审核该文档以修复任何句子错误或分段错误，以确保翻译的文档对您来说是完美的。这是一个非常劳动密集的过程。完成后，它使翻译过程中的翻译过程变得更加容易。

转换文件有哪些不同的方法？

根据PDF的生成方式，如果文档仅包含可以选择的文本，则可以将文本复制并粘贴到Word文档中。某些PDF具有防止复制和粘贴的安全功能。

如果PDF是扫描文档或无法选择文本，则需要使用OCR软件。OCR工具将每个字符扫描为图像，并尝试将其转换为Word中的可编辑字符。它准确率高达95％，并且做得很好。保持布局是困难的部分。