文件片段
就像墙壁是用砖砌成的一样,文件由许多部分组成,例如段落,句子,短语,术语,单词。
我们的翻译人员使用编辑软件来计算文档中的单词数。这项技术称为翻译记忆库。翻译记忆库软件在句子和段级别工作。它将源文档分解为一组段,一段通常是句子,以句末标点符号结束,例如句号或问号。因此,翻译人员通过一个接一个地编辑和翻译片段来工作。
使用术语段是因为在某些情况下,一大块文本可能不是完整的句子。
例如,在标题的情况下,较小的文本单元(例如单个单词或短语)将由术语词典管理。
段落标记,分页符,单元格结尾,制表符等等将始终结束一段。
例
坏分段。
这是一句话
这不是一条线
但是多行。
这应该显示为......
这是一个不是单行而是多行的句子。
机器标签通常可能设计如下:
POTENTIALLY
危险
发泄
这个标签上写着“ 潜在危险的通风口 ”。这是作为三个单独的文本行写的。因此,当提交给翻译时,它看起来像三个不同的单词,而不是一个句子。最好将此文本写为单个句子并放入单元格或表格中,以便自动将其正确调整为方形。这样翻译人员会将此视为一句话。
重复 - 100%匹配 - 模糊匹配
在翻译工作时,每个翻译片段都与存储在TM中的先前翻译进行比较,并且匹配在翻译时自动呈现给翻译者,非常类似于手机上的预测文本。TM中与翻译片段相同的片段被视为100%匹配。
如果没有完全匹配,但TM中有与被翻译的段相似的段,则这些段表示为模糊匹配。每个都按0%到99%的百分比排名,其中较高的匹配百分比在内容上与正在翻译的句子更接近。99%的匹配可能仅在单个字母或标点符号上有所不同,其中75%匹配可能有几个不同的单词。通常,低于70%标记的匹配无用。
当文档包含几个当前不在TM中的相同段时,这些段称为重复。大多数翻译记忆工具可以在翻译开始之前识别潜在的重复。重复的优点是在第一次出现翻译后,其余部分将变为100%匹配。
当翻译工作时,每个新翻译的句子都被添加到TM中。因此,该新句子可以成为文档中其他句子的100%匹配或甚至模糊匹配。重复是那些有可能成为100%匹配的细分市场。