ホーム > Cloudera Spark & Hadoop 開発者向けトレーニング

Cloudera Spark & Hadoop 開発者向けトレーニング

コース基本情報

コースタイトル Cloudera Spark & Hadoop 開発者向けトレーニング
コースコード NFC0189R  
コース種別 集合研修 形式 講義+実機演習
期間 4日間 時間 9:30~17:30 価格(税抜) 328,000円(税抜)
主催 Cloudera株式会社
日程 会場 空席状況 実施状況 選択

2017年6月12日(月) ~ 2017年6月15日(木)

Cloudera(新宿LC)

  お申し込み後確認

2017年7月24日(月) ~ 2017年7月27日(木)

Cloudera(新宿LC)

  お申し込み後確認

2017年9月25日(月) ~ 2017年9月28日(木)

Cloudera(新宿LC)

  お申し込み後確認

※「キャンセル待ち」でお申し込みの方には、別途メールにてご連絡いたします。
※「実施確定」表示のない日程は、お申し込み状況により開催中止になる場合がございます。
※ グローバルナレッジ主催コース以外の空席状況は、残席数に関わらず「お申し込み後確認」と表示されます。
※ グローバルナレッジ主催コース以外では、主催会社のお席を確保した後に受付確定となります。

詳しくはお問い合わせください。

ワンポイント

コース概要と内容を一部変更致しました。Cloudera Apache Spark 開発者向けトレーニング(NFC0183R)の内容を含んでいます。
(掲載日:2016/12/13)

Cloudera社のシステム変更により、受講者様は受講前にあらかじめトレーニングアカウントをご自身で登録いただく手順に変更となりました。(2017/2/1以降に開催されるすべてのコースが対象となります)
お手数をおかけし恐縮ですが Cloudera社webページ:
トレーニングアカウントの作成手順 または こちらのPDF をご参照の上研修初日の前週木曜日までにトレーニングアカウントのご登録をお願いいたします。
(掲載日:2017/2/3)

対象者情報

対象者
・ SparkやHadoopに関心があり、プログラミング経験のある開発者やエンジニア
前提条件
□Apache Sparkのサンプルとハンズオン演習はScalaとPythonで提供されています。いずれかの言語でのプログラミングスキルが必要です
□Linuxコマンドラインの基本知識が必要です
□SQLの基本知識は役立ちます

Apache Hadoopの事前知識は必要ありません

学習内容の詳細

コース概要
この4日間のハンズオントレーニングコースでは、参加者は最新のツールとテクニックを使用して、Hadoop クラスタにデータを取り込み、処理するために必要な主要な概念と専門的な知識を提供します。このトレーニングコースはSpark (Spark Streaming とSpark SQL を含む)、Flume、Kafka、およびSqoop のようなHadoop エコシステムを使用して、Hadoop の開発者が直面している現実の課題に対する最善の準備です。開発者はさまざまなユースケース、アーキテクチャ、および業界に適用される、より迅速な意思決定、優れた意思決定、対話型のアクションを実行するために、Spark を使用して洗練された並列アプリケーションを作成できます。
学習目標
専門家主導のディスカッションやインタラクティブな実戦演習を通じて、受講者は以下を学習します:
● Hadoopクラスタにデータを分散、格納、および処理する方法
● Apache Sparkアプリケーションを作成、設定、およびHadoopクラスタに展開する方法
● インタラクティブなデータ分析にSparkシェルを使用する方法
● Spark SQLを使用して構造化データを処理およびクエリする方法
● Spark Streamingを使用してライブデータストリームを処理する方法
● FlumeとKafkaを使用してSpark Streamingのデータを取り込む方法
学習内容
1. はじめに

2. Apache Hadoop とHadoop エコシステム入門

3. Apache Hadoop ファイルストレージ

4. Apache Hadoop クラスタでのデータ処理

5. Apache Sqoop でリレーショナルデータをインポートする

6. Apache Spark の基礎

7. RDD を扱う

8. ペアRDD でデータを集約する

9. Apache Spark アプリケーションを記述、実行する

10. Apache Spark アプリケーションを設定する

11. Apache Spark での並列処理

12. RDD の永続化

13. Apache Spark のデータ処理での一般的なパターン

14. DataFrame とApache Spark SQL

15. Apache Kafka によるメッセージ処理

16. Apache Flume でデータを取り込む

17. Apache Flume とApache Kafka を統合する

18. Apache Spark Streaming: DStream の紹介

19. Apache Spark Streaming: 複数のバッチを処理する

20. Apache Spark Streaming: データソース

21. まとめ

ご注意・ご連絡事項

・ 本コースはCloudera株式会社が開催いたします。
・ Cloudera株式会社開催コースの受講お申し込みは2営業日前まで、日程変更は7営業日前まで、キャンセルは11営業日前までとさせて頂きます。
なお、キャンセル料の扱いは以下のとおりです。
・コース開始日の10営業日~5営業日前のキャンセル:受講料の50%を請求
・コース開始日の4営業日前~当日のキャンセル:受講料の全額を請求
・日程変更後のキャンセル:お申し出日に関わらず受講料の全額を請求

受講者の声

独学で進めていたところはあるのですが、「なんとなく動くけど、何故、そうなるのか分からない。」と色々と曖昧であった所が、仕組みから丁寧に解説頂いた事で明確になり、もう少し早く受講しておけば良かったと後悔する程に有意義な4日間でした。
(– 通信機器メーカー J様)