- ETL工具:Kettle(官网,Pentaho公司开源)、?Informatica、Datastage、OWB、微软DTS、Beeload、久其ETL,Oracle GoldenGate等等……开源的工具(16款开源工具,OSchina ETL工具列表),有eclipse的ETL插件: cloveretl
- 工作流引擎:jBPM,Activiti,H3 BPM,?osworkflow,Shark(没官方网站吗?),?JaWE(没有官方网站?),参考1
- 数据仓库DW:Hadoop,Spark
- 可视化报表分析:
- 管理工具:Apache?Storm
- BI集成平台:Pentaho?(官网)
- 相关概念:FSM(Finite State Machine)状态机,PetriNet,WfMC工作流管理联盟,BPM业务流程管理,对业务数据本身及其运行环境的描述与定义的数据,称之为元数据(metadata)元数据是描述数据的数据。元数据的典型表现为对象的描述,即对数据库、表、列、列属性(类型、格式、约束等)以及主键/外部键关联等等的描述。
- 参考:
- 大数据核心ETL
- ETL-Tool,BI的核心是ETL
- ETL概念介绍(有Informatica广告之嫌)
ETL工具选型:
oracle下可选odi,GoldenGate;sqldeveloper亦可作为加载数据的工具; oracle warehouse则使用owb; ibm下可选vw(visual warehouse); mysql下可选kettle,GoldenGate; mssql下则使用独门的dts;