跳转到主要内容
ABBYY Vantage 允许您从托管在 Vantage 服务器上的共享文件夹上传文档。 可通过 SFTP 协议访问该文件夹。新建文件夹的访问详细信息(例如导入和异常文件夹的链接,以及用于访问这些文件夹的用户名和密码)会显示在 输入设置:共享文件夹 对话框中。
重要提示: 若要将文件上传到输入共享文件夹,必须在 SFTP 客户端中使用二进制传输模式。

用户访问权限

文件夹可用的用户操作
导入文件夹- 查看文件和目录列表
- 向该文件夹上传文件
- 重命名文件和目录
- 上传时覆盖现有文件
- 删除文件
异常文件夹- 查看文件和目录列表
- 从该文件夹下载文件
- 重命名文件和目录
- 删除文件

文档处理

Skill 发布后,ABBYY Vantage 将每隔 20 秒检查该文件夹是否有新文件。
提示: 导入代理一次最多可处理 30 个文件。若 SFTP 文件夹上传成为性能瓶颈,建议创建两个 Skill,并为每个 Skill 配置独立的 SFTP 文件夹。这样可让两个代理同时处理文件。

文档注册参数

源类型(FolderImport)和源文件名会保存到文档注册参数 SourceTypeSourceFileName 中。若在 Skill Monitor 的 Transactions 部分添加相应的列,您即可访问这些参数的值。它们也会被导出到包含完整数据提取结果的输出 JSON 文件中,该文件可在 Output 活动的 Exported Data 部分进行配置。
注意: 文件名中不允许包含以下字符,上传时将会被替换为下划线:/ : ? # [ ] @ ! $ & ' ( ) * + , ; = \。原始文件名会保存到文档注册参数中。您可以使用此脚本进行获取。

导入结果

如果文件成功导入,系统会为其创建一个处理事务,随后该文件会从导入文件夹中删除。如果文件未能导入且未创建处理事务,则会被移动到名为 <Input folder name>-exception 的异常文件夹。异常文件夹的位置在 Input Settings: Shared Folder 对话框中指定。异常文件夹中文件的保留时长由保留策略决定,默认为 2 周。 如果某个文件已不在导入文件夹中,但找不到任何处理结果,可能是因为处理事务以错误结束。有关处理事务错误的更多信息可在 Skill Monitor 中查看。更多信息请参见 Skill Monitor Transactions Section

导入归档文件

Vantage 可以从共享文件夹的顶层目录导入归档文件。目前支持以下文件类型:
  • 在 Windows 中创建的 ZIP 文件,
  • 在 Linux 中使用 tar czvf 命令创建的 TAR GZ 文件。
重要! 仅当选择 Single file 导入方法时,才能导入归档文件。
归档文件大小上限为 3 GB。归档内每个文件的大小上限为 100 MB。 每个归档都会创建一个新的处理事务。归档中的所有文件随后都会成为此处理事务的文档。归档名称将保存到文档注册 Parameter SourceArchiveName 中。 如果归档类型不受支持,或者归档包含不受支持的文件类型和/或归档,对应的处理事务将失败。 如果超出文件大小限制,或归档包含子文件夹,该归档将被移至异常文件夹,并且不会创建处理事务。相应错误可在 Error log 中查看。

将多个文件导入到单个事务(Transaction)

默认情况下,Vantage 会为从共享文件夹导入的每个文件创建一个单独的处理事务。您可以通过将 Import method 设置为 From subfolder 来更改此行为。在此模式下,Vantage 将在共享文件夹中查找子文件夹而非文件。子文件夹名称应符合指定的命名规则。找到符合条件的子文件夹后,该子文件夹中的所有文件(包括其嵌套文件夹中的文件)都会作为单个处理事务的文档进行导入。子文件夹名称会保存到每个文档的 SourceFolderName 文档注册 Parameter 中。
注意: 如果文件是从子文件夹内的更深层级文件夹导入的,则 SourceFolderName Parameter 将包含根子文件夹的名称。
如果子文件夹无法导入,它将被移动到 Exceptions 文件夹。Vantage 不会为其创建处理事务,并会生成一个错误,您可以在 Skill Monitor 服务的 Error Log 中查看该错误。 如果子文件夹包含不受支持格式的文件,相应的处理事务将失败。
重要! 不支持从子文件夹导入归档文件。
即使空的子文件夹名称符合命名规则,也会从共享文件夹中删除;但是,Vantage 不会为其创建处理事务,并会生成一个警告,因为没有可导入的数据。您可以在 Skill Monitor 服务的 Error Log 中查看此警告。

子文件夹命名规则

仅当子文件夹名称符合子文件夹命名规则时才会被导入。默认值“”可匹配任意字符串。您可以使用“”符号作为任意数量字符的占位符来配置掩码。不支持使用“?”字符作为单个字符的占位符。掩码不区分大小写:例如,“subfolder”和“SUBFOLDER”均可匹配“subfolder”掩码。掩码长度限制为 64 个字符。 为避免可能的文件访问冲突,请先将文件复制到子文件夹,然后再根据该规则重命名子文件夹。

在 ABBYY Vantage 中从共享文件夹设置文档上传

  1. 在文档处理流程中左键单击 Input 活动块。若尚未在 Skill Designer 中添加,请使用 Activities 窗格添加。
  2. Actions 窗格中,勾选 Select additional source,并选择 Shared folder
screen_Process_Input_SharedFolder_Settings
  1. 单击 Settings。将打开一个对话框,包含共享文件夹的访问详细信息。
screen_Process_Input_SharedFolder_Credentials_cloud 您也可以修改建议的导入文件夹名称。

文件夹命名要求

文件夹名称需满足以下条件:
  • 在该 Skill 中必须唯一(不能与 Output 活动块中其他共享文件夹的名称相同)。
  • 必须以数字或字母开头。
  • 不得包含特殊字符 : * ? " < > / | \ 或控制字符(例如换行、制表符)。
  • 末尾不得是点号。
  • 不得为空。
  • 不得超过 64 个字符。
  1. 如有需要,将 Import method 更改为 From subfolder,并根据需要调整 Subfolder naming scheme(如适用)。
  2. 使用 Input Settings: Shared Folder 对话框中提供的登录信息,通过 SFTP 客户端将文件导入该文件夹。可点击相应 field 中的复制 icon,将该 field 的内容复制到剪贴板。文件夹链接包含建立连接所需的全部数据。将该链接粘贴到 SFTP 客户端的设置对话框中会自动填写其他 Parameter。
  3. 点击 Save(如需保存更改)或 Cancel(如无需保存更改)以关闭对话框。
重要! 对设置所做的任何更改仅在发布 Skill 后生效。

其他说明

管理员可以使用 Skill Monitor 服务禁用文档导入。更多信息请参见 Skill Monitor。禁用文档导入不会影响通过 API 将文档导入到此 Skill。 当删除某个 Skill 时,服务器上的共享导入文件夹也会被删除。