Hadoop
MapReduce概要 MapReduce処理フロー MapReduceデータフロー ジョブとタスク スプリット ジョブプロセス制御 集約関数 Javaを用いた開発 事前準備 Map処理 Reduce処理 Job実行処理 集約関数の指定 作成モジュールの実行 MapReduce概要 MapReduceとは並列分散…
論理構成 Hiveは「保存されているデータ」と「テーブル中のデータレイアウトを記述するメタデータ」の二つから構成されている。それぞれデータの保存場所が異なる。 データ種別 保存場所 保存データ HDFS メタデータ RDB テーブル仕様 管理対象テーブル 管理…
Hiveとは Hiveシェル Hiveアーキテクチャ Hiveクライアント Hiveサービス メタストア 複数Hiveセッションのサポート方法 ローカルメタストアの使用 リモートメタストアの使用 一般的なRDBとの比較 スキーマ適用のタイミング比較 更新比較 トランザクション …