AWS文件数据管道是一个可以用于自动化ETL流程(数据的移动和转换)的Web服务。它支持数据驱动工作流的定义和执行,由可能依赖于前面任务成功完成的任务组成。
  AWS文件数据管道的三个主要组件共同工作来管理数据:
  管道定义指定一个管道的业务逻辑,并且可以包含如下类型的组件:
  DataNode——这是一个任务输入文件数据的位置,或者输出数据保存的位置。当前支持的DataNode包括Amazon S3桶、MySQL数据库、Amazon DynamoDB以及本地DataNode。
  行为——这是和文件数据的一次交互。当前支持的行为包括数据复制、启动一个Amazon EMR作业流、从命令行运行一个自定义bash脚本(需要UNIX环境来运行脚本)、一次数据查询以及一次Hive查询。
  前提条件——这是一个在动作可以运行之前必须为真的条件语句。当前支持的提前条件包括bash脚本的成功执行、数据的存在性、到达特定时间或相对于另一个事件到达特定的时间间隔、S3对象或者DynameoDB或RDS表的存在性。
  调度——当前支持的调度选项包括定义动作启动和停止的时间,以及它应当多久运行一次。

关于TeamDoc软件:

TeamDoc是基于服务器/客户端架构的轻量级文件管理软件。TeamDoc将文件集中加密存储在您单位自己的服务器中,员工使用TeamDoc客户端访问服务器,从而获得与自己权限相关的权限:登入后与“我的电脑”界面类似,可以看到自己该看的文件,编辑自己能编辑的文档,对于能看到的文件,还可以细分文档权限,进而做到能看不能拷,能看不能截屏等功能,多种权限灵活设置,在线协同编辑、全文搜索、日志与版本追踪,快速构建企业文档库。告别假大空,我们提供值得您选择的、易用的、可用的文档管理软件。现在就访问TeamDoc首页

TeamDoc软件界面(点击可放大)

版权所有:南京网亚计算机有限公司,本文链接地址: AWS文件数据管道