tands_bの日記

技術メモ。大したことは書きません

Hadoop

【MapReduce】基礎

MapReduce概要 MapReduce処理フロー MapReduceデータフロー ジョブとタスク スプリット ジョブプロセス制御 集約関数 Javaを用いた開発 事前準備 Map処理 Reduce処理 Job実行処理 集約関数の指定 作成モジュールの実行 MapReduce概要 MapReduceとは並列分散…

【Hive】テーブル仕様

論理構成 Hiveは「保存されているデータ」と「テーブル中のデータレイアウトを記述するメタデータ」の二つから構成されている。それぞれデータの保存場所が異なる。 データ種別 保存場所 保存データ HDFS メタデータ RDB テーブル仕様 管理対象テーブル 管理…

【Hive】概要

Hiveとは Hiveシェル Hiveアーキテクチャ Hiveクライアント Hiveサービス メタストア 複数Hiveセッションのサポート方法 ローカルメタストアの使用 リモートメタストアの使用 一般的なRDBとの比較 スキーマ適用のタイミング比較 更新比較 トランザクション …