说明:收录25万 73个行业的国家标准 支持批量下载
ICS 35.020 L 72 GB 中华人民共和国国家标准 GB/T 36345-2018 信息技术 通用数据导入接口 Information technology--General data import interface 2018-06-07 发布 2019-01-01实施 国家市场监督管理总局 发布 中国国家标准化管理委员会 GB/T 36345--2018 目次 前言 范围 2规范性引用文件 3:术语和定义 4.接口要求 4.1总则 4.2:接口实现要求 附录A(资料性附录) 接口操作说明 GB/T 36345-2018 前言 本标准按照GB/T1.1-2009给出的规则起草 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:中兴通讯股份有限公司、华为技术有限公司、成都勤智数码科技股份有限公司、 浪潮软件集团有限公司、北京软件和信息服务交易所有限公司、浪潮电子信息产业股份有限公司、上海 天玑科技股份有限公司、天津南大通用数据技术股份有限公司、中国电子技术标准化研究院 本标准主要起草人:黄、牛家浩、王源、张强、汪绍飞、刘宇峰、吴志刚、张安文、赵江、苏志远、王静。 GB/T 36345--2018 信息技术通用数据导入接口 1范围 本标准规定了通用数据导人接口,包括数据源与大数据系统间应提供的主流通用的数据导入接口: 及接口要求。 本标准适用于大数据系统的数据导入接口的研制和测试。 2规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T35295-2017信息技术:大数据:术语 3术语和定义 GB/T352952017界定的术语和定义适用于本文件。.为了便于使用,以下重复列出了 GB/T35295-2017中的某些术语和定义。 3.1 大数据big data 具有数据量大、数据速度高、数据种类多样和(或)数据可变性高等主要特征,要求运用可扩展技术 进行有效存储、操作、管理和分析的大规模数据集。 注1:大数据通常以不同的方式被使用,例如,可作为处理大数据大规模数据集的可扩展技术的代名词。 注2:大数据通常是一个或多个问题的集合: ):数据种类:不规则或异构数据的导航、查询和输人问题; b)::数据量:处理大数据集时需要的并行计算,存储和管理问题; c):数据有效性/真实性:描述性数据和关于实时决策对象的自我查询问题, d)数据速度:数据的到达速率问题; e):数据可视化:数据集的皇现和聚集问题。 [GB/T 35295--2017,定义 2.1.1] 3.2 动态数据 data in motion 处于活动状态,其典型特征表现为大数据的速度和多变性特征的数据。 注:它们在网络上传输或暂时驻留于计算机内存中供读取或更新。对它们以实时或近实时方式进行处理和分析。 [GB/T 35295--2017.定义 2.1.36] 3.3 静态数据 data at rest 处于静止状态,其典型特征表现为大数据的体量和多样性特征的数据。 注:它们通常是存储于物理媒体中的数据。 [GB/T 35295--2017,定义 2.1.37] 1 GB/T 36345-2018 4接口要求 4.1:总则 根据数据的产生方式、存储状态、数据应用方法、实时性等,可以将数据源分为两大类数据:静态数 据和动态数据。:静态数据与动态数据都可以包含结构化、半结构化非结构化类型的数据。 静态数据一般以文件方式存储,动态数据包括消息数据、流式数据等,由数据源以实时或准实时方 式动态产生。动态数据通常通过消息中间件导入到大数据系统,消息中间件可以支持各种数据类型传 输并满足实时性要求。 本标准规定以下两类主流通用的接,即静态数据的文件导人接口和动态数据的消息导入接口: a) 静态数据的文件导接口实现将文件类的静态数据从数据源导人到大数据系统,简称文件 接口 b) 动态数据的消息导入接口实现将消息数据、流式数据等动态数据从数据源导人到大数据系 统,简称消息接口。 大数据系统的数据导入接口在大数据系统中所处的位置以及与其他部分的接口关系,如图1所示。 大数据系统 数据接口层 数据导入接口 接口类型 1 接口类型 2 静态数据 动态数据 结构化/半结构化/非 结构化/半结构化/非 结构化数据 结构化数据 数据源 图1数据导入接口关系图 4.2:接口实现要求 4.2.1概述 接口实现应遵循以下基本原则: a)接口应能够适配不同的大数据系统版本, b),接口应能够保证数据传输过程的安全性、可靠性、稳定性和完整性。 接口操作描述参见附录A。 4.2.2静态数据的文件导入接口 静态数据的文件导人接口,适用于客户端与服务器端进行批量文件传输,具有分布式、高吞吐等 特性。 文件导人接口提供两种接口操作模式: a: 操作模式一是数据源作为客户端,大数据系统作为服务器端,客户端与服务端之间采用FTP 协议交互,客户端首先显式登录到服务器端,再进行文件上传和下载操作,如图2所示。 2 GB/T 36345--2018 1) 登录 2)获取文件目录 服务器端 客户端 (大数据系统) (数据游) 3)上传文件 )下载文件 5)登出 图2文件导入接口操作模式一 接口流程如下: 1):客户端登录服务器端; 2) 客户端获取服务器端文件存储位置; 3) 客户端上传单个文件到服务器端指定文件存储位置: 4)客户端从服务器端指定存储位置下载服务器单个文件: 5)客户端登出服务器。 b) 操作模式二是客户端与服务器端之间通过大数据系统的数据传输协议进行文件传输操作,该 模式不同于模式,不需要显式登录服务端。该模式支持扫描满足规则的数据文件及并发传 输多个文件。如图3所示。 客户端: 文件传输 服务器端 (数据源) (大数据系统) 图3:文件导入接口操作模式二 在操作模式二中,客户端先建立与服务器的连接,然后按规则扫描满足条件的本地文件,并通过大 数据系统的数据传输协议将文件上传到大数据系统,传输完成后关闭连接。 接口流程如下, 1)客户端隐式登录服务器,建立连接; 2) 客户端按照规则从源路径扫描本地文件: 3) 客户端通过大数据系统的数据传输协议,将扫描得到的文件数据批量上传到服务器的指 定路径: 4) 数据传输完成后,客户端关闭与服务器的连接。 4.2.3动态数据的消息导入接口 动态数据一般通过消息中间件,将结构化/半结构化/非结构化的数据实时或准实时地导入大数据 3

pdf文档 GB-T 36345-2018信息技术通用数据导入接口

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 36345-2018信息技术通用数据导入接口 第 1 页 GB-T 36345-2018信息技术通用数据导入接口 第 2 页 GB-T 36345-2018信息技术通用数据导入接口 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2023-01-15 17:30:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。