数据仓库
<p><a name="概述"><strong><span style="font-size:18px">概述</span></strong></a></p>
<p>在平安金融云的OBS上统一管理数据,其优势有以下几点:</p>
<p><span style="font-size:16px"><strong>提供持久化的元数据存储</strong></span></p>
<p>释放集群不会清理数据信息。</p>
<p><span style="font-size:16px"><strong>能更方便地实现计算存储分离</strong></span></p>
<p>E-MapReduce上可以支持将数据存放在平安金融云OBS中,在大数据量的情况下将数据存储在OBS上会大大降低使用的成本,E-MapReduce集群主要用来作为计算资源,在计算完成之后机器可以随时释放,数据在OBS上,同时也不用再考虑元数据迁移的问题。</p>
<p><span style="font-size:16px"><strong>更方便地实现数据共享</strong></span></p>
<p>如果用户的所有数据都存放在OBS之上,则不需要做任何数据的迁移和重建所有集群都是可以直接访问数据,这样每个E-MapReduce集群可以做不同的业务,但是可以很方便地实现数据的共享。</p>
<p> </p>
<p> </p>
<p><a id="创建数据表" name="创建数据表"><strong><span style="font-size:18px">创建数据表</span></strong></a></p>
<p><span style="font-size:16px"><strong>前提条件</strong></span></p>
<p>您已成功创建集群,可参考<a href="#创建集群">创建集群</a>。</p>
<p>您已成功创建MySQL,可参考<a href="https://www.ocftcloud.com/ssr/help/database/RDS_MySQL/quick">创建MySQL</a>。</p>
<p><span style="font-size:16px"><strong>操作步骤</strong></span></p>
<p>1. 登录<a href="https://www.ocftcloud.com/console/hadoop/overview">E-MapReduce控制台</a>。</p>
<p>2. 单击左侧导航栏<strong>数据仓库</strong>,进入<strong>数据仓库</strong>页面。</p>
<p>3. 选择目标地域,单击右上角<strong>创建表</strong>,根据如下信息,创建表。</p>
<p><img src="https://obs-cn-shanghai.ocftcloud.com/pacloud/20192708175817-132e63459d2e.png" style="height:334px; width:830px" /></p>
<p><strong>集群配置</strong></p>
<table border="1" cellpadding="0" cellspacing="0" style="width:807px">
<tbody>
<tr>
<td style="background-color:#ededed; vertical-align:top; width:132px">
<p><strong>配置项</strong></p>
</td>
<td style="background-color:#ededed; vertical-align:top; width:669px">
<p><strong>说明</strong></p>
</td>
</tr>
<tr>
<td style="vertical-align:top; width:132px">
<p>集群</p>
</td>
<td style="vertical-align:top; width:669px">
<p>选择来源和目标依赖的集群。</p>
</td>
</tr>
</tbody>
</table>
<p><strong>数据来源</strong></p>
<table border="1" cellpadding="0" cellspacing="0" style="width:808px">
<tbody>
<tr>
<td style="background-color:#ededed; vertical-align:top; width:132px">
<p><strong>配置项</strong></p>
</td>
<td style="background-color:#ededed; vertical-align:top; width:670px">
<p><strong>说明</strong></p>
</td>
</tr>
<tr>
<td style="vertical-align:top; width:132px">
<p>数据源类型</p>
</td>
<td style="vertical-align:top; width:670px">
<p>选择源端数据源的类型,目前支持OBS,及RDS-MySQL。</p>
<ul>
<li><strong>OBS</strong><strong>数据源</strong>:支持OBS数据源,若OBS上无对应数据文件,请先到OBS上传,数据文件请使用txt格式,并确保数据文件内容中的数据分隔符与数据去向中“创建表SQL”中指定的分隔符一致,否则数据将无法正确同步。</li>
<li><strong>RDS-MySQL</strong><strong>数据源</strong>:支持平安金融云关系型数据库RDS-MySQL数据源,若RDS-MySQL中无对应数据源表,请先到RDS-MySQL中建库建表上传。</li>
</ul>
</td>
</tr>
<tr>
<td style="vertical-align:top; width:132px">
<p>数据源地址</p>
</td>
<td style="vertical-align:top; width:670px">
<p>数据源的地址,不同的数据源地址格式不同.</p>
<ul>
<li><strong>OBS</strong><strong>数据源:</strong>地址格式:obs://<bucketName>:<fileName>,<bucketName>为Bucket名称,<fileName>为文件名称。</li>
<li><strong>RDS-MySQL</strong><strong>数据源:</strong>地址格式:jdbc:mysql://<dburi>/<dbname>,<dburi>格式为:“访问域名:连接端口”,请到RDS-MySQL获取访问域名和连接端口,<dbname>为数据库名称。</li>
</ul>
</td>
</tr>
</tbody>
</table>
<p><strong>数据去向</strong></p>
<table border="1" cellpadding="0" cellspacing="0" style="width:807px">
<tbody>
<tr>
<td style="background-color:#ededed; vertical-align:top; width:133px">
<p><strong>配置项</strong></p>
</td>
<td style="background-color:#ededed; vertical-align:top; width:668px">
<p><strong>说明</strong></p>
</td>
</tr>
<tr>
<td style="vertical-align:top; width:133px">
<p>数据库名</p>
</td>
<td style="vertical-align:top; width:668px">
<p>目标数据库名,若没有数据库,先单击<strong>创建数据库</strong>进行创建。</p>
</td>
</tr>
<tr>
<td style="vertical-align:top; width:133px">
<p>数据表名</p>
</td>
<td style="vertical-align:top; width:668px">
<p>目标数据表的名称。</p>
</td>
</tr>
<tr>
<td style="vertical-align:top; width:133px">
<p>创建表SQL</p>
</td>
<td style="vertical-align:top; width:668px">
<p>数据来源数据源类型为 OBS 时,需要填写创建表SQL。通过SQL的DDL标准语句进行表创建,请在建表语句中指定数据文件分隔符,否则将会因无法正确识别文件中的数据而同步数据失败。</p>
<p>示例语句:create table test(id int, field1 string) row format delimited fields terminated by "\t" stored as textfile</p>
</td>
</tr>
<tr>
<td style="vertical-align:top; width:133px">
<p>描述</p>
</td>
<td style="vertical-align:top; width:668px">
<p>对数据表进行简单的描述。</p>
</td>
</tr>
</tbody>
</table>
<p>4. 单击<strong>确认</strong>。</p>
<p><strong>说明</strong>:数据库和表的location都不能选择整个OBS bucket,需要选择到OBS bucket下面的目录。</p>
<p><span style="font-size:16px"><strong>执行结果</strong></span></p>
<p>创建完成后,在数据仓库页面可查看到刚刚创建的数据表。</p>
<p> </p>
<p><a name="查看数据表详情"><strong><span style="font-size:18px">查看数据表详情</span></strong></a></p>
<p><span style="font-size:16px"><strong>操作步骤</strong></span></p>
<p>1. 登录<a href="https://www.ocftcloud.com/console/hadoop/overview">E-MapReduce控制台</a>。</p>
<p>2. 单击左侧导航栏<strong>数据仓库</strong>,进入<strong>数据仓库</strong>页面。</p>
<p>3. 选择目标地域,在目标数据表操作列单击<strong>详情</strong>。</p>
<p><img src="https://obs-cn-shanghai.ocftcloud.com/pacloud/20192708180248-190969f39faa.png" style="height:244px; width:830px" /></p>
<p>4. 弹出<strong>表详情</strong>对话框,单击<strong>确认</strong>,即可查看到数据表名、数据表ID等信息。</p>
<p> </p>
<p><a name="删除数据表"><strong><span style="font-size:18px">删除数据表</span></strong></a></p>
<p><span style="font-size:16px"><strong>操作步骤</strong></span></p>
<p>1. 登录<a href="https://www.ocftcloud.com/console/hadoop/overview">E-MapReduce控制台</a>。</p>
<p>2. 单击左侧导航栏<strong>数据仓库</strong>,进入<strong>数据仓库</strong>页面。</p>
<p>3. 选择目标地域,在目标数据表操作列单击<strong>删除</strong>。</p>
<p><img src="https://obs-cn-shanghai.ocftcloud.com/pacloud/20192708180449-12dd7e6e92fe.png" style="height:240px; width:830px" /></p>
<p>4. 弹出删除对话框,单击<strong>确认</strong>。</p>
<p><strong>说明:</strong>可对不需要的数据表进行删除,创建中的数据表不可删除。</p>
<p><span style="font-size:16px"><strong>执行结果</strong></span></p>
<p>删除完成后,在数据仓库页面无法查看已删除的数据表。</p>
<p> </p>
提交成功!非常感谢您的反馈,我们会继续努力做到更好!