二维码

[HANA] SAP HANA学习笔记(HANA基本概念及涉及的技术要点)

Twilight发表于 2017-02-09 14:08Twilight 最后回复于 2017-02-09 14:08 [复制链接] 2201 0

SAP HANA:High-Performance Analytic Appliance
SAP HANA XSC:Extended Application Services Classic(SAP推出的基于HANA的扩展应用服务引擎,是一个轻量级的应用服务器,内嵌在SAPHANA内存数据平台当中作为HANA表与视图的一个程序逻辑与web服务)

1、列存储:适合做数据的读取和分析,主要用于业务数据表;TID(Transaction ID)事务ID
2、行存储:数据更新效率更高,主要用于系统表;CID(Commit ID)提交ID
3、HANA数据更新
  • 列存储:Main内存区域 和 Delta内存区域 数据合并的过程称为 Delta Merge,Main内存区域数据经过轻量级的压缩
    HANA列存储数据更新是通过只插入实现的
  • 行存储:Segment、TVM(Transactional Vision Memery)区域

多版本并发控制 - MVCC(Multi-Version Concurrency Control)

4、外部系统访问HANA接口方式:
  • JDBC,java数据库连接(Java Data Base Connectivity),是一种用于执行SQL语句的Java API, 通过它可访问各类关系数据库。开发JAVA应用。
  • ODBC,开放数据库互连(Open Database Connectivity),是微软公司开放服务结构中有关数据库的一个组成部分,它建立了一组规范,并提供了一组对数据库访问的标准API,开发.NET应用
  • ADBC,ABAP Database Connectivity,ABAP访问HANA数据库API
  • ODBO,(OLE DB for OLAP),Microsoft Execl通过ODBO和HANA数据源相连
  • MDX,多维度查询表达式(multi dimensional expression),是由 Microsoft , Hyperion 等公司研究多维查询表达式,是所有 OLAP 高级分析所采用的核心查询语言
  • OData,开放数据协议(Open data Protocol),是用来查询和更新数据的一种Web协议,其提供了把存在于应用程序中的数据暴露出来的方式。
  • DBSL,(Database Shared Library),HANA为SAP ABAP应用系统服务器提供的工具,使ABAP可以访问HANA数据库
  • SAP Replication Server,复制服务器,简称SRS,Sybase Replication Server 是其前身;相比基于触发器技术的SLT,使用SRS对源数据库系统压力比较小。

5、HANA加载外部系统数据方式:
  • ETL(Extract-Transform-Load),数据仓库技术,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
  • SLT(SAP Landscape Transformation),原先是SAP TDMS软件的一个功能组件,先演化成HANA实时数据同步工具,支持SAP系统、非SAP系统与HANA之间精准数据复制。是以数据库表数据变化触发来同步的,不支持数据的清洗、转换、合并等处理。SLT是由SLO technology(Near Zero Downtime)演化而来。
  • SAP Business Objects Data Services(DS),定时周期性抽取数据到HANA,是HANA系统提供的抽数工具之一,是从BO系统中发展而来的。可以开发添加非常复杂的数据转换逻辑。
    DS三个重要组件:Data Services Designer、Repository(资源库,存储元数据——数据库表结构、字段类型等)、Server(提供Job服务)
    Datastore(数据存储):外部系统在DS中的“映射”
    Batch Job(批量作业):Batch Job、Real-time Job
    Data Flow(数据流):定义数据在整个ETL处理过程中的流转
  • DXC(Direct Extractor Connection),它是SAP HANA从SAP Business Suite中获取数据的一种简单方法,注意只能抽取SAP套件中的数据,其他外部系统不支持。关注SAP标准的业务逻辑,不需要具体到数据库表、字段。

6、HANA系统的六个主要服务组件
  • Hdbnameserver:Name Server(名字服务器)
  • Hdbindexserver:Index Server(索引服务器),HANA核心组件,管理HANA权限、内存管理、事务管理、元数据管理器、MVCC等
  • Hdbstatisticsserver:Statistics Server(统计分析服务器)
  • Hdbpreprocessor:Pre-processor Server(预处理服务器)
  • Hdbxsengine:XS Engine/Server(扩展应用服务 Extended Application Services)
  • Hdbdaemon:以正确的顺序开始或停止其他进程

7、OLTP、OLAP
  • 联机事务处理OLTP(on-line transaction processing)
  • 联机分析处理OLAP(On-Line Analytical Processing)

8、HANA最核心、最基础的三个组件
  • HANA Database:HANA数据库
  • HANA Studio:HANA工作台,HANA顾问开发工作台,包含了HANA Client功能
  • HANA Client:HANA客户端,提供访问HANA数据库的各种接口驱动

9、HANA建模
  • Attribute View 属性视图
  • Analytic View 分析视图(分析指标Measure --- 事实表、分析维度Attribute --- 属性视图)
  • Analytic Privilege 分析权限
  • Calculation View 计算视图
  • Procedure 存储过程

10、扩展注解
  • RDS:rapid deployment solution(快速部署解决方案)
  • RDBMS:Relational Database Management System(关系数据库管理系统)
  • EDW:Enterprice Data Warehouse(企业级数据仓库)
  • HBase:Hadoop Database,HBase是Apache的Hadoop项目的子项目
  • Hadoop:不是一个缩写,而是一个虚构的名字,以Hadoop项目的创建者的孩子的大象玩家命名的。Apache基金会所开发的分布式系统基础架构。
  • DSO:Data Store Object ,BW标准建模对象
  • ASE:Adaptive Server Enterprise,Sybase自身的数据库产品
  • TPC:Transaction Processing Performance Council(事务处理委员会),是业界公认的用来测试数据仓场性能的基准
  • 物化视图层:原始数据聚合的临时表
  • 数据库CDC:Changed-Data Capture,变更数据捕获,自动跟踪和记录数据库数据的变更
  • CDS: core data service
  • HCP cockpit:HANA Cloud Platform cockpit,https://account.hanatrial.ondemand.com
  • HANA MDC:HANA multi-tenant database container
  • HANA PAL:HANA Predictive Analytics Library
  • HANA AFL:Application Function Library(HANA预测分析算法库)
  • CSDL :the Common Schema Definition Language,用该语言创建EDM实体数据模型
  • xmlns:XML Namespaces的缩写,中文名称是XML(标准通用标记语言的子集)命名空间
  • EDM:Entity Data Model,实体数据模型
  • UAA service:User Account and Authentication
  • MTA: Multi-Target Application
  • HDI:HANA Deployment Infrastructure
回复

使用道具 举报

快速回帖

本版积分规则
您需要登录后才可以回帖 登录 | 注册有礼

快速回复 返回顶部 返回列表