跳转到主要内容
lines 数组的元素是一些对象,用于描述构成文本块或表格单元格的字符串。该数组中的元素顺序与读取顺序完全一致。
PropertyData typeDescription
positionrect文档中该文本字符串所在矩形区域的坐标。
confidenceconfidence字符串中文本被正确识别的置信度等级。根据构成该字符串的单词的置信度值计算得出。
textstring元素的字符串值。
charParamsobject与字体格式相关的参数。
wordsobject array由构成该文本字符串的单词组成的数组。数组元素的顺序与读取顺序完全一致。

CharParams 元素

charParams 的每个元素都是一个描述字符格式的对象。这些元素应用于与之关联的对象(单个字符或一组字符)。
PropertyData typeDescription
boldboolean表示字体样式为粗体。
italicboolean表示字体样式为斜体。
underlinedboolean表示字体样式带有下划线。
strikeoutboolean表示字体样式带有删除线。
smallCapsboolean表示字体为小型大写字母。
superscriptboolean表示为上标字体属性。
subscriptboolean表示为下标字体属性。
scalinginteger字体缩放比例(默认值为 1000)。
spacinginteger字符间距,单位为 twip(1/20 pt,1/1440 inch)。
fontSizeinteger字体大小属性值,单位为 twip(1/20 pt,1/1440 inch)。
fontNamestring字体名称。
colorstring字体颜色(6 位十六进制格式 RRGGBB)。
langstring字符的语言。由语言和国家部分组成,请参阅 ISO 639 和 ISO 3166。

Words 数组元素

words 数组中的元素是描述组成文本字符串的各个单词的对象。
PropertyData typeDescription
positionrect单词在文档中所在矩形区域的坐标。
confidenceconfidence正确识别该单词的置信度。基于构成该单词的各个字符的置信度值计算。
textstring单词的文本值。
charsobject array构成该单词的字符数组。数组中的元素按阅读顺序排列。

chars 数组元素

chars 数组的元素是描述构成单词的各个字符的对象。字符是文本信息的最小单位。
PropertyData typeDescription
confidenceconfidence字符被正确识别的置信度。
textstring字符的字符串值。
positionrect字符在文档中所在矩形区域的坐标。